發(fā)明領(lǐng)域
本發(fā)明涉及分子生物學(xué)領(lǐng)域。具體地,本發(fā)明涉及規(guī)律間隔的短回文重復(fù)的簇(crispr)技術(shù)。
發(fā)明背景
天然的原核crispr-cas系統(tǒng)包含具有固定長度的介入可變序列的短重復(fù)陣列(即規(guī)律間隔的短回文重復(fù)的簇,或“crispr”),和crispr-相關(guān)(“cas”)蛋白。cas蛋白的亞組將轉(zhuǎn)錄的crispr陣列的rna加工成小指導(dǎo)rna,其通常具有如下文所述的兩個(gè)組分。至少存在三種不同的系統(tǒng):i型、ii型和iii型。把rna加工成成熟的crrna的過程中涉及的酶在3種系統(tǒng)中是不同的。在天然原核系統(tǒng)中,指導(dǎo)rna(“grna”)包含兩個(gè)短非編碼rna種類,稱為crisprrna(“crrna”)和反式作用rna(“tracrrna”)。在一個(gè)例示性的系統(tǒng)中,grna與cas核酸酶形成復(fù)合體。grna:cas核酸酶復(fù)合體結(jié)合靶多核苷酸序列,所述靶多核苷酸序列具有前間區(qū)序列鄰近基序(protospaceradjacentmotif)(“pam”)和前間區(qū)序列(protospacer),其是與部分grna互補(bǔ)的序列。grna:cas核酸酶復(fù)合體對(duì)靶多核苷酸的識(shí)別與結(jié)合誘導(dǎo)對(duì)靶多核苷酸的切割。天然crispr-cas系統(tǒng)作為原核生物中的免疫系統(tǒng)而發(fā)揮功能,而grna:cas核酸酶復(fù)合體以類似真核生物中的rnai的方式識(shí)別并沉默外源遺傳元件,由此產(chǎn)生對(duì)外源遺傳元件(如質(zhì)粒和噬菌體)的抗性。
已證明單一指導(dǎo)rna(“sgrna”)能替代天然存在的crrna與tracrrna之間形成的復(fù)合體。
關(guān)于開發(fā)grna(包括sgrna)的考慮包括特異性、穩(wěn)定性和功能性。特異性是指具體的grna:cas核酸酶復(fù)合體結(jié)合和/或切割目的靶序列的能力,而來自目的靶標(biāo)的序列和/或位置中不同的多核苷酸很少發(fā)生或不發(fā)生結(jié)合和/或切割。因此,特異性是指將grna:cas核酸酶復(fù)合體的脫靶效應(yīng)最小化。穩(wěn)定性是指grna抵抗酶(如核酸酶)的降解及細(xì)胞內(nèi)或細(xì)胞外環(huán)境中存在的其他物質(zhì)的降解的能力。因此,需要提供對(duì)核酸降解具有增加的抗性、針對(duì)靶多核苷酸的結(jié)合親和力、和/或降低的脫靶效應(yīng)但仍然具有g(shù)rna功能性的grna(包括sgrna)。關(guān)于開發(fā)grna的進(jìn)一步考慮包括轉(zhuǎn)染能力和免疫刺激特性。因此,需要提供在轉(zhuǎn)染的細(xì)胞中具有有效和可滴定的轉(zhuǎn)染入細(xì)胞的能力(尤其是進(jìn)入真核細(xì)胞的核),且具有最小的或不具有免疫刺激特性的grna(包括sgrna)。對(duì)于grna的另一重要考慮是提供將其遞送入并維持其在意向細(xì)胞、組織、體液或生物體內(nèi)的有效手段,其維持時(shí)間足以允許目的grna發(fā)揮功能性。
附圖簡述
圖1是示出例示性crispr-cas系統(tǒng)的示意性模型的一組圖。這里示出的例示性系統(tǒng)是具有cas核酸酶的ii型系統(tǒng)。在這個(gè)具體實(shí)例中,cas核酸酶是cas9核酸酶。cas9核酸酶識(shí)別pam序列(在此,pam序列是ngg的3-nt序列,其中n是a,g,c或t,但已知存在其他pam序列)。sgrna包括指導(dǎo)序列,crrna序列或區(qū)段,以及tracrrna序列或區(qū)段。sgrna的指導(dǎo)序列與pam序列直接上游的dna靶標(biāo)雜交。在此所示的實(shí)例中,cas9介導(dǎo)pam序列上游的雙鏈斷裂(箭頭)。
圖2a是顯示例示性的crispr-cas9介導(dǎo)的切割測(cè)定的圖。
圖2b是顯示用于生成圖4中的數(shù)據(jù)的生物化學(xué)切割測(cè)定的組分及其濃度的表。
圖2c是顯示用于生物化學(xué)切割測(cè)定的釀膿鏈球菌(streptococcuspyogenes)cas9核酸酶的滴定的圖。
圖2d是顯示用于生物化學(xué)切割測(cè)定的例示性sgrna的滴定的圖。在該實(shí)例中,命名為kanc1的sgrna靶向于卡那霉素抗性基因中的互補(bǔ)序列。
圖3顯示了體外使用純化組分的生物化學(xué)切割測(cè)定的例示性條件和程序。
圖4是顯示在切割測(cè)定中使用例示性修飾的指導(dǎo)rna獲得的數(shù)據(jù)的表。
圖5a顯示了本申請(qǐng)中公開的例示性指導(dǎo)rna。
圖5b顯示了本申請(qǐng)中公開的例示性單一指導(dǎo)rna(sgrna)。
圖6是顯示具有至少兩個(gè)化學(xué)修飾(例如第一修飾和第二修飾)的例示性指導(dǎo)rna的表。每個(gè)數(shù)字代表所指示的修飾,每個(gè)“x”表示指導(dǎo)rna中的修飾的組合。在一些實(shí)施方案中,第一和第二修飾存在于單個(gè)核苷酸上。在一些實(shí)施方案中,第一和第二修飾存在于分離的核苷酸上。
圖7顯示了具有至少三個(gè)化學(xué)修飾的指導(dǎo)rna的例示性類型。圖7的下部分列出了幾種類型的修飾。圖7的上部分中的表示出了雙重修飾(“雙mod”,兩種類型的修飾的組合)能與單個(gè)修飾(“單mod”,一種類型的修飾)組合。“x”表示在指導(dǎo)rna中存在相應(yīng)的雙mod和單mod。
圖8a和8b顯示了用于體外測(cè)試的熒光團(tuán)修飾的clta1sgrna。在圖8a中,示出了clta1的sgrna的rna序列,其包括這樣的位置,在所述位置中熒光染料或標(biāo)記可附接至sgrna。圖8b顯示了由nishimasu等,cell(2014)156,1-15報(bào)道的cas9:sgrna復(fù)合體的x射線晶體學(xué)確定的結(jié)構(gòu)。
圖9a顯示了在某些位置(位置3,9和11)用2-硫尿苷修飾的ctla1sgrna,以改進(jìn)針對(duì)ctla1靶標(biāo)的特異性。圖9b顯示,當(dāng)脫靶位點(diǎn)涉及u-g搖擺配對(duì)時(shí),用2-硫代u修飾的grna能增加grna的靶特異性。具體地,ctla1_2-硫代u+11具有低得多的脫靶序列clta1off3的切割,其具有在5’鏈中第11位處的t到c突變。
圖10顯示了指導(dǎo)rna骨架二級(jí)結(jié)構(gòu),其表現(xiàn)出與cas9的氨基酸的非共價(jià)結(jié)合相互作用,如jiang等,science(2015)348:6242,1477-81中所報(bào)道的。
圖11a和11b圖示了實(shí)驗(yàn)結(jié)果,其顯示使用本文公開的合成和化學(xué)修飾的sgrna能實(shí)現(xiàn)人細(xì)胞系中具有高頻插入和缺失(indels)和同源重組(hr)的基因破壞,如hendel等,nat.biotechnol.(2015)33:9,985-9中所報(bào)道的。
圖12a,12b,12c和12d圖示了實(shí)驗(yàn)結(jié)果,其顯示本文所述的化學(xué)修飾的sgrna能用于在受刺激的原代人t細(xì)胞以及cd34+造血干細(xì)胞和祖細(xì)胞(hspc)中實(shí)現(xiàn)高頻率的基因破壞或靶向的基因組編輯,如hendel等,nat.biotechnol.(2015)33:9,985-9中所報(bào)道的。
發(fā)明詳述
本發(fā)明至少部分地基于一個(gè)意想不到的發(fā)現(xiàn),即對(duì)grna的某些化學(xué)修飾是crispr-cas系統(tǒng)所容許的。具體地,據(jù)信增加grna的穩(wěn)定性,改變grna雜交相互作用的熱穩(wěn)定性,和/或降低cas:grna復(fù)合的脫靶效應(yīng)的一些化學(xué)修飾基本上不損害cas:grna結(jié)合,切口和/或切割靶多核苷酸的功效。此外,一些化學(xué)修飾被認(rèn)為提供了這樣的grna,所述grna具有有效且可滴定的對(duì)細(xì)胞的轉(zhuǎn)染,尤其是轉(zhuǎn)染入真核細(xì)胞的核中,和/或在轉(zhuǎn)染的細(xì)胞中具有最小的或沒有免疫刺激特性。據(jù)信一些化學(xué)修飾可提供這樣的grna(包括sgrna),所述grna能被有效地遞送到和保持在意向細(xì)胞、組織、體液或生物體內(nèi)足夠的時(shí)間以允許所需的grna功能性。
i.定義
如本文所用,術(shù)語“指導(dǎo)rna”通常是指能結(jié)合cas蛋白并有助于將cas蛋白靶向靶多核苷酸(例如dna)內(nèi)的特定位置的rna分子(或一組rna分子全部)。指導(dǎo)rna可包含crrna區(qū)段和tracrrna區(qū)段。如本文所用,術(shù)語“crrna”或“crrna區(qū)段”是指rna分子或其部分,其包括靶向多核苷酸的指導(dǎo)序列,莖序列和任選的5’-突出端序列。如本文所用,術(shù)語“tracrrna”或“tracrrna區(qū)段”是指這樣的rna分子或其部分,其包括蛋白結(jié)合區(qū)段(例如蛋白結(jié)合區(qū)段能夠與crispr相關(guān)蛋白(例如cas9)相互作用)。術(shù)語“指導(dǎo)rna”涵蓋單一指導(dǎo)rna(sgrna),其中crrna區(qū)段和tracrrna區(qū)段位于相同的rna分子中。術(shù)語“指導(dǎo)rna”還總地涵蓋兩個(gè)或更多rna分子的組,其中crrna區(qū)段和tracrrna區(qū)段位于分離的rna分子中。
術(shù)語“骨架”是指指導(dǎo)rna分子的一部分,其包含在天然生物物種之間基本相同或高度保守的序列。骨架包括tracrrna區(qū)段和crrna區(qū)段除了在crrna區(qū)段的5’端處或附近的靶向多核苷酸的指導(dǎo)序列以外的部分,不包括包含在天然crrna和tracrrna中不保守的序列的任何非天然部分。
術(shù)語“核酸”、“多核苷酸”或“寡核苷酸”是指dna分子、rna分子或其類似物。如本文所用,術(shù)語“核酸”、“多核苷酸”和“寡核苷酸”包括但不限于dna分子,如cdna、基因組dna或合成dna,和rna分子,如指導(dǎo)rna、信使rna或合成rna。此外,如本文所用,術(shù)語“核酸”和“多核苷酸”包括單鏈和雙鏈形式。
上下文中的術(shù)語寡核苷酸或多核苷酸的“修飾”包括但不限于(a)末端修飾,例如5’端修飾或3’端修飾,(b)核堿基(或“堿基”)修飾,包括替換或去除堿基,(c)糖修飾,包括2’、3’和/或4’位置處的修飾,和(d)主鏈修飾,包括修飾或替換磷酸二酯鍵。術(shù)語“修飾的核苷酸”通常是指具有對(duì)堿基、糖和磷酸二酯鍵或主鏈部分的一個(gè)或多個(gè)的化學(xué)結(jié)構(gòu)的修飾的核苷酸,包括核苷酸磷酸酯。
術(shù)語“z”和“p”是指由stevenbenner及其同事開發(fā)的核苷酸、核堿基或核堿基類似物,例如“artificiallyexpandedgeneticinformationsystem:anewbasepairwithanalternativehydrogenbondingpattern”yang,z.,hutter,d.,sheng,p.,sismour,a.m.和benner,s.a.(2006)nucleicacidsres.,34,6095–101中所述的,其內(nèi)容通過提述以其整體并入本文。
術(shù)語“xa”,“xg”,“xc”,“xt”或“x(a,g,c,t)”和“ya”,“yg”,“yc”,“yt”或“y(a,g,c,t)”是指核苷酸,核堿基或核堿基類似物,如krueger等在“synthesisandpropertiesofsize-expandeddnas:towarddesigned,functionalgeneticsystems”;andrewt.krueger,haigelu,alexh.f.lee和erict.kool(2007)acc.chem.res.,40,141-50中描述的,其內(nèi)容通過提述以其整體并入本文。
術(shù)語“非結(jié)構(gòu)核酸”或“una”是指如us7371580中所述的核苷酸,核堿基或核堿基類似物,其內(nèi)容通過提述以其整體并入本文。非結(jié)構(gòu)化核酸(或una)修飾也稱為“假互補(bǔ)”核苷酸,核堿基或核堿基類似物(參見例如lahoud等(1991)nucl.acidsres.,36:10,3409-19))。
術(shù)語“pace”和“硫代pace”是指分別含有膦?;宜狨セ蛄虼Ⅴ;宜狨?phosphonoacetate)基團(tuán)的核苷酸間磷酸二酯鍵類似物。這些修飾屬于廣泛類別的化合物,其包含膦?;人猁}模塊,膦?;人狨ツK,硫代膦?;人猁}模塊和硫代膦酰基羧酸酯模塊。這些連接可分別由通式p(cr1r2)ncoor和(s)-p(cr1r2)ncoor來描述,其中n是0至6的整數(shù),并且r1和r2各自獨(dú)立地選自h、烷基和取代的烷基。這些修飾中的一些由yamada等描述于“synthesisandbiochemicalevaluationofphosphonoformateoligodeoxyribonucleotides”christinam.yamada,douglasj.dellinger和marvinh.caruthers(2006)j.am.chem.soc.128:15,5251-61中,其全部內(nèi)容通過引用并入本文。
如本文所用,“修飾”是指與未修飾的核糖核苷酸,即腺苷,鳥苷,胞苷和尿苷核糖核苷酸中發(fā)現(xiàn)的不同的化學(xué)模塊或化學(xué)結(jié)構(gòu)的部分。術(shù)語“修飾”可指修飾的類型。例如,“相同修飾”是指相同類型的修飾,且“修飾的核苷酸是相同的”是指修飾的核苷酸具有相同類型的修飾,而堿基(a,g,c,u等)可以是不同的。類似地,具有“兩個(gè)修飾”的指導(dǎo)rna是具有兩個(gè)類型修飾的指導(dǎo)rna,其可以是或可以不是相同的核苷酸,并且每個(gè)類型可出現(xiàn)在指導(dǎo)rna中的多個(gè)核苷酸中。類似地,具有“三個(gè)修飾”的指導(dǎo)rna是具有三個(gè)類型修飾的指導(dǎo)rna,其可以或可以不在相同的核苷酸中,并且每個(gè)類型可出現(xiàn)在多個(gè)核苷酸中。
如本文所用,術(shù)語“靶多核苷酸”或“靶標(biāo)”是指含有靶核酸序列的多核苷酸。靶多核苷酸可以是單鏈或雙鏈的,并且在一些實(shí)施方案中是雙鏈dna。在一些實(shí)施方案中,靶多核苷酸是單鏈rna。本文所用的“靶核酸序列”或“靶序列”是指希望使用crispr系統(tǒng)結(jié)合、切口或切割的特異性序列或其互補(bǔ)序列。
術(shù)語“雜交(hybridization)”或“雜交(hybridizing)”是指完全或部分互補(bǔ)的多核苷酸鏈在合適的雜交條件下在一起以形成雙鏈結(jié)構(gòu)或區(qū)域的過程,其中兩個(gè)結(jié)構(gòu)鏈通過氫鍵連接。如本文所用,術(shù)語“部分雜交”包括其中雙鏈結(jié)構(gòu)或區(qū)域含有一個(gè)或多個(gè)凸起或錯(cuò)配。雖然氫鍵通常在腺嘌呤和胸腺嘧啶或腺嘌呤和尿嘧啶(a和t或a和u)或胞嘧啶和鳥嘌呤(c和g)之間形成,可形成其他非經(jīng)典堿基對(duì)(參見例如adams等,“thebiochemistryofthenucleicacids,”第11版,1992)。預(yù)期修飾的核苷酸可形成允許或促進(jìn)雜交的氫鍵。
術(shù)語“切割(cleavage)”或“切割(cleaving)”是指在多核苷酸的核糖基磷酸二酯主鏈中破壞共價(jià)磷酸二酯鍵。術(shù)語“裂解”或“裂解”涵蓋單鏈斷裂和雙鏈斷裂。雙鏈切割可由于兩個(gè)不同的單鏈切割事件而發(fā)生。切割可導(dǎo)致平頭或交錯(cuò)末端的產(chǎn)生。
術(shù)語“crispr相關(guān)蛋白”或“cas蛋白”是指野生型cas蛋白,其片段或其突變體或變體。術(shù)語“cas突變體”或“cas變體”是指野生型cas蛋白的蛋白或多肽衍生物,例如具有一個(gè)或多個(gè)點(diǎn)突變,插入,缺失,截短,融合蛋白或其組合的蛋白。在一些實(shí)施方案中,“cas突變體”或“cas變體”基本上保留了cas蛋白的核酸酶活性。在一些實(shí)施方案中,“cas突變體”或“cas變體”是突變的,從而使得一個(gè)或兩個(gè)核酸酶域是失活的。在一些實(shí)施方案中,“cas突變體”或“cas變體”具有核酸酶活性。在一些實(shí)施方案中,“cas突變體”或“cas變體”缺少其野生型對(duì)應(yīng)物的一些或全部核酸酶活性。
cas蛋白的術(shù)語“核酸酶域”是指具有dna切割的催化活性的蛋白內(nèi)的多肽序列或域。核酸酶域可包含在單個(gè)多肽鏈中,或者切割活性可由兩個(gè)(或更多個(gè))多肽的締合而引起。單個(gè)核酸酶域可由給定多肽內(nèi)的多于一個(gè)分離的氨基酸段(stretch)組成。這些域的實(shí)例包括ruvc樣基序(seqidno:1中的氨基酸7-22、759-766和982-989)和hnh基序(氨基酸837-863)。參見gasiunas等(2012)proc.natl.acad.sci.usa,109:39,e2579–e2586和wo2013176772。
具有“grna功能性”的合成的指導(dǎo)rna是具有天然存在的指導(dǎo)rna的一個(gè)或多個(gè)功能的合成的指導(dǎo)rna,例如與cas蛋白締合的功能,或由與cas蛋白締合的指導(dǎo)rna執(zhí)行的功能。在一些實(shí)施方案中,功能性包括結(jié)合靶多核苷酸。在一些實(shí)施方案中,功能性包括將cas蛋白或grna:cas蛋白復(fù)合體靶向靶多核苷酸。在一些實(shí)施方案中,功能性包括切口靶多核苷酸。在一些實(shí)施方案中,功能性包括切割靶多核苷酸。在一些實(shí)施方案中,功能性包括與cas蛋白的締合或結(jié)合。在一些實(shí)施方案中,功能性是具有cas蛋白的crispr-cas系統(tǒng)中的指導(dǎo)rna的任何其他已知功能,包括具有工程化的cas蛋白的人工crispr-cas系統(tǒng)。在一些實(shí)施方案中,功能性是天然的指導(dǎo)rna的任何其他功能。合成的指導(dǎo)rna可具有比天然存在的指導(dǎo)rna更大或更小程度的grna功能。在一些實(shí)施方案中,與相似的天然存在的指導(dǎo)rna相比,合成的指導(dǎo)rna可具有關(guān)于一種特性更大的功能性和對(duì)另一種特性更低的功能性。
“具有單鏈切口活性的cas蛋白”是指與野生型cas蛋白相比,具有降低的切割dsdna的兩條鏈之一的能力的cas蛋白,包括cas突變體或cas變體。例如,在一些實(shí)施方案中,具有單鏈切口活性的cas蛋白具有降低ruvc域(或hnh域)的功能的突變(例如氨基酸取代),結(jié)果降低了切割靶dna的一條鏈的能力。此類變體的實(shí)例包括釀膿鏈球菌cas9中的d10a、h839a/h840a、和/或n863a取代,并且還包括在其他物種的cas9酶中的等同位點(diǎn)處的相同或相似的取代。
如本文所用,術(shù)語序列的“部分”或“片段”是指小于完整序列的序列的任何部分(例如核苷酸亞序列或氨基酸亞序列)。多核苷酸的部分可為任何長度,例如長度至少5、10、15、20、25、30、40、50、75、100、150、200、300或500個(gè)或更多個(gè)核苷酸。指導(dǎo)序列的一部分可為指導(dǎo)序列的約50%,40%,30%,20%,10%,例如指導(dǎo)序列的三分之一或更短,例如長度為7、6、5、4、3或2個(gè)核苷酸。
在分子的語境中的術(shù)語“衍生自\來源于(derivedfrom)”是指使用親本分子或來自該親本分子的信息分離或制備的分子。例如,cas9單一突變體切口酶(nickase)和cas9雙突變體無效核酸酶衍生自野生型cas9蛋白。
在兩個(gè)或更多個(gè)多核苷酸(或兩個(gè)或更多個(gè)多肽)的語境下,術(shù)語“基本上相同”是指當(dāng)使用序列比較算法或通過目測(cè)比較或比對(duì)最大對(duì)應(yīng)時(shí),具有至少約60%,至少約70%,至少約80%,至少約90%,約90-95%,至少約95%,至少約98%,至少約99%或更多個(gè)核苷酸(或氨基酸)序列同一性的序列或亞序列。優(yōu)選地,多核苷酸之間的“基本同一性”存在于覆蓋多核苷酸的區(qū)域長度至少約50個(gè)核苷酸,長度至少約100個(gè)核苷酸,長度至少約200個(gè)核苷酸,長度至少約300個(gè)核苷酸,長度約500個(gè)核苷酸,或覆蓋多核苷酸的全長。優(yōu)選地,多肽之間的“基本同一性”存在于覆蓋多肽的區(qū)域長度至少約50個(gè)氨基酸殘基,長度至少約100個(gè)氨基酸殘基,或覆蓋多肽的整個(gè)長度。
如本文所公開的,提供了許多值的范圍。應(yīng)當(dāng)理解,也具體涵蓋到該范圍的上限和下限之間的每個(gè)中間值,至下限單位的十分之一。包含在規(guī)定范圍內(nèi)的每個(gè)較小范圍或中間值也是具體涵蓋的。術(shù)語“約”通常是指所示數(shù)字的加或減10%。例如,“約10%”可以表示9%至11%的范圍,“20”可以意指從18-22?!凹s”的其他含義可從上下文中顯而易見,例如四舍五入,因此,例如“約1”也可意指0.5至1.4。
ii.crispr介導(dǎo)的序列特異性結(jié)合和/或切割
圖1中所示的是dna的crispr-cas9介導(dǎo)的序列特異性切割的圖。指導(dǎo)rna描述為sgrna,其具有例示性的5’域內(nèi)的20個(gè)核苷酸(20-nt)指導(dǎo)序列(其他指導(dǎo)序列可為例如約15至約30nt的長度)、內(nèi)部定位地堿基配對(duì)的莖和3’域。指導(dǎo)序列與dna靶標(biāo)中的例示性20-nt靶序列互補(bǔ)。莖對(duì)應(yīng)于crrna中的重復(fù)序列,并與tracrrna中的序列互補(bǔ)。指導(dǎo)rna的3’域?qū)?yīng)于結(jié)合cas9核酸酶的tracrrna的3’域。cas9:指導(dǎo)rna復(fù)合體結(jié)合并切割由cas9識(shí)別的pam序列直接上游的靶dna序列或前間區(qū)序列。在圖1中,例示了3-ntpam序列;然而其他pam序列,包括4-nt和5-ntpam序列是已知的。在圖1中例示的系統(tǒng)中,dna中的靶序列的兩條鏈都在箭頭所示的位置處被cas9切割。
iii.指導(dǎo)rna
在至少一個(gè)方面,本發(fā)明包括具有指導(dǎo)rna功能性的化學(xué)修飾的指導(dǎo)rna。包括除四種經(jīng)典核糖核苷酸(即a,c,g和u)以外的任何核苷酸的指導(dǎo)rna,無論是非天然的還是天然的(如假尿苷,肌苷或脫氧核苷酸),都是化學(xué)修飾的指導(dǎo)rna。同樣地,包含除天然磷酸二酯核苷酸間鍵之外的任何主鏈或核苷酸間連接的指導(dǎo)rna具有化學(xué)修飾,因此是化學(xué)修飾的指導(dǎo)rna。在一些實(shí)施方案中,保留的功能性包括結(jié)合cas蛋白。在一些實(shí)施方案中,保留的功能性包括結(jié)合靶多核苷酸。在一些實(shí)施方案中,保留的功能性包括將cas蛋白或grna:cas蛋白復(fù)合體靶向多核苷酸。在一些實(shí)施方案中,保留的功能性包括由grna:cas蛋白復(fù)合體切口靶多核苷酸。在一些實(shí)施方案中,保留的功能性包括由grna:cas蛋白復(fù)合體切割靶多核苷酸。在一些實(shí)施方案中,保留的功能性是具有cas蛋白的crispr-cas系統(tǒng)(包括具有工程化的cas蛋白的人工crispr-cas系統(tǒng))中的指導(dǎo)rna的任何其他已知功能。在一些實(shí)施方案中,保留的功能性是天然指導(dǎo)rna的任何其他功能。
a.例示性修飾
在一些實(shí)施方案中,整合入指導(dǎo)rna的核苷酸糖修飾選自下組:2’-o-c1-4烷基如2’-o-甲基(2’-ome)、2’-脫氧基(2’-h)、2’-o-c1-3烷基-o-c1-3烷基如2’-甲氧乙基(“2’-moe”)、2’-氟(“2’-f”)、2’-氨基(“2’-nh2”)、2’-阿拉伯糖(“2’-arabino”)核苷酸、2’-f-阿拉伯糖(“2’-f-arabino”)核苷酸、2’-鎖核酸(“l(fā)na”)核苷酸、2’-非鎖核酸(“ulna”)核苷酸、l型的糖(“l(fā)-糖”)、和4’-硫代核糖基核苷酸。在一些實(shí)施方案中,整合至指導(dǎo)rna中的核苷酸間連接修飾選自下組:硫代磷酸酯“p(s)”(p(s))、膦?;人狨?p(ch2)ncoor)如膦酰基乙酸酯“pace”(p(ch2coo-))、硫代膦?;人狨?(s)p(ch2)ncoor)如硫代膦?;宜狨ァ傲虼鷓ace”((s)p(ch2coo-))、烷基膦酸酯(p(c1-3烷基)如甲基膦酸酯-p(ch3)、硼烷膦酸酯(p(bh3))、和二硫代磷酸酯(p(s)2)。
在一些實(shí)施方案中,整合入指導(dǎo)rna的核堿基(“堿基”)修飾選自下組:2-硫尿嘧啶(“2-硫代u”),2-硫胞嘧啶(“2-硫代c”),4-硫尿嘧啶(“4-硫代u”),6-硫鳥嘌呤(“6-硫代g”),2-氨基腺嘌呤(“2-氨基a”),2-氨基嘌呤,假尿嘧啶,次黃嘌呤,7-脫氮鳥嘌呤,7-脫氮-8-氮雜鳥嘌呤,7-脫氮腺嘌呤,7-脫氮-8-氮雜腺嘌呤,5-甲基胞嘧啶(“5-甲基c”),5-甲基尿嘧啶(“5-甲基u”),5-羥甲基胞嘧啶,5-羥甲基尿嘧啶,5,6-脫氫尿嘧啶,5-丙炔基胞嘧啶,5-丙炔基尿嘧啶,5-乙炔基胞嘧啶,5-乙炔基尿嘧啶,5-烯丙基尿嘧啶(“5-烯丙基u”),5-烯丙基胞嘧啶(“5-烯丙基c”),5-氨基烯丙基尿嘧啶(“5-氨基烯丙基u”),5-氨基烯丙基-胞嘧啶(“5-氨基烯丙基c”),無堿基核苷酸,z堿基,p堿基,非結(jié)構(gòu)核酸(“una”),異鳥嘌呤(“isog”),異胞嘧啶(“isoc”)[如““enzymaticincorporationofanewbasepairintodnaandrnaextendsthegeneticalphabet.”piccirilli,j.a.;krauch,t.;moroney,s.e.;benner,s.a.(1990)nature,343,33中所述],5-甲基-2-嘧啶[如rappaport,h.p.(1993)biochemistry,32,3047中所述],x(a,g,c,t)和y(a,g,c,t)。
在一些實(shí)施方案中,在核苷酸糖,核堿基,磷酸二酯鍵和/或核苷酸磷酸酯上引入一個(gè)或多個(gè)同位素修飾。此類修飾包括這樣的核苷酸,所述核苷酸包含一個(gè)或多個(gè)15n,13c,14c,氘,3h,32p,125i,131i原子或用作示蹤劑的其它原子或元素。
在一些實(shí)施方案中,整合至指導(dǎo)rna中的“末端”修飾選自下組:peg(聚乙二醇),烴接頭(包括:雜原子(o,s,n)取代的烴間隔基;鹵素取代的烴間隔基;含(酮基-,羧基-,酰氨基-,亞硫酰基-,氨基甲?;?,硫羰氨基甲?;?thionocarbamaoyl)的烴間隔基),精胺接頭,染料,包括附接于接頭的熒光染料(例如熒光素,羅丹明,花菁),例如6-熒光素-己基,猝滅劑(例如dabcyl,bhq)和其他標(biāo)記(例如生物素,地高辛(digoxigenin),吖啶,鏈霉親和素,親和素(avidin),肽和/或蛋白質(zhì))。在一些實(shí)施方案中,“末端”修飾包括將指導(dǎo)rna與包含寡核苷酸(包括脫氧核糖核苷酸和/或核糖核苷酸)肽,蛋白質(zhì),糖,寡糖,類固醇,脂質(zhì),葉酸,維生素和/或其他分子的另一分子的綴合(或連接)。在一些實(shí)施方案中,整合至指導(dǎo)rna中的“末端”修飾經(jīng)接頭(例如2-(4-丁基酰氨基熒光素)丙烷-1,3-二醇雙(磷酸二酯)接頭(如下描繪))定位于指導(dǎo)rna序列內(nèi)部,其以磷酸二酯鍵并入并且能并入至指導(dǎo)rna中的兩個(gè)核苷酸之間的任何地方。
2-(4-丁基酰氨基熒光素)丙烷-1,3-二醇雙(磷酸二酯)接頭
其他接頭包括例如以實(shí)例說明但不限于:
2-(3-(染料-酰氨基)丙酰氨基)丙烷-1,3-二醇雙(磷酸二酯)接頭
在一些實(shí)施方案中,末端修飾包括末端官能團(tuán)如胺,硫醇(或巰基),羥基,羧基,羰基,亞硫?;虼驶?,氨基甲?;?,硫氨基甲?;柞;?,烯烴,炔基,鹵素或官能團(tuán)封端的接頭,其中之一可隨后與所需的模塊綴合,例如熒光染料或非熒光標(biāo)記或標(biāo)簽或任何其它分子,如寡核苷酸(包括脫氧核糖核苷酸和/或核糖核苷酸,包括適配體),氨基酸,肽,蛋白質(zhì),糖,寡糖,類固醇,脂質(zhì),葉酸,維生素。綴合采用本領(lǐng)域熟知的標(biāo)準(zhǔn)化學(xué)方法進(jìn)行,包括但不限于通過n-羥基琥珀酰亞胺,異硫氰酸酯,dcc(或dci)和/或“bioconjugatetechniques”bygregt.hermanson,publishereslsevierscience,第三版(2013)中所述的任何其它標(biāo)準(zhǔn)方法,其內(nèi)容通過提述以其整體并入本文。
在一些實(shí)施方案中,標(biāo)記或染料附接或綴合至grna中的修飾的核苷酸。熒光染料或其它模塊例如非熒光標(biāo)記或標(biāo)簽(例如生物素,親和素,鏈霉親和素或含有同位素標(biāo)記如15n,13c,14c,氘,3h,32p,125i的部分和(包括脫氧核糖核苷酸和/或核糖核苷酸,包括適配體),氨基酸,肽,蛋白質(zhì),糖,寡糖,類固醇,脂質(zhì),葉酸,維生素或可使用所謂的“點(diǎn)擊(click)”化學(xué)或所謂的“方酸(squarate)”綴合化學(xué)法來實(shí)現(xiàn)的其他分子?!包c(diǎn)擊”化學(xué)是指具有疊氮化物部分的炔烴模塊的[3+2]環(huán)加成,得到兩部分之間的三唑連接,如以下示意圖所示:
如el-sagheer,a.h和brown,t.“clickchemistrywithdna”,chem.soc.rev.,2010,39,1388-1405和mojibul,h.m和xiaohua,p.,dna-associatedclickchemistry,sci.chinachem.,2014,57:2,215-31中所述的實(shí)例,其內(nèi)容通過提述以其整體并入本文。
在一些實(shí)施方案中,綴合可通過替代的環(huán)加成來實(shí)現(xiàn),例如π-綴合的二烯模塊與烯烴模塊的diels-alder[4+2]環(huán)加成。
“方酸”綴合化學(xué)方法通過方酸衍生物連接兩個(gè)各自具有胺的模塊,以產(chǎn)生含有方酸標(biāo)記模塊的方酸綴合物(參見例如tietze等(1991)chem.ber.,124,1215-21,其內(nèi)容通過提述以其整體并入本文)。例如,含有接頭胺的熒光素通過方酸接頭與含有胺的寡核糖核苷酸綴合,如下文方案中所述。方酸接頭的一個(gè)實(shí)施例描述如下:
在一些實(shí)施方案中,整合入rna中的化學(xué)修飾選自下組:2’-o-c1-4烷基,2’-h,2’-o-c1-3烷基-o-c1-3烷基,2’-f、2’-nh2,2’-阿拉伯糖,2’-f-阿拉伯糖,4’-硫代核糖基,2-硫代u,2-硫代c,4-硫代u,6-硫代g,2-氨基a,2-氨基嘌呤,假尿嘧啶,次黃嘌呤,7-脫氮鳥嘌呤,7-脫氮-8-氮雜鳥嘌呤,7-脫氮腺嘌呤,7-脫氮-8-氮雜腺嘌呤,5-甲基c,5-甲基u,5-羥甲基胞嘧啶,5-羥甲基尿嘧啶,5,6-脫氫尿嘧啶,5-丙炔基胞嘧啶,5-丙炔基尿嘧啶,5-乙炔基胞嘧啶,5-乙炔基尿嘧啶,5-烯丙基u,5-烯丙基c,5-氨基烯丙基-尿嘧啶,5-氨基烯丙基-胞嘧啶,無堿基核苷酸(“abn”),z,p,una,isoc,isog,5-甲基-嘧啶,x(a,g,c,t)和y(a,g,c,t),硫代磷酸酯核苷酸間連接,膦?;宜狨ズ塑账衢g連接,硫代膦酰基乙酸核苷酸連接,甲基膦酸酯核苷酸間連接,硼烷膦酸酯核苷酸間連接,二硫代磷酸酯核苷酸間連接,4’-硫代核糖基核苷酸,鎖核酸(“l(fā)na”)核苷酸,非鎖核酸(“ulna”)核苷酸,烷基間隔基,雜烷基(n,o,s)間隔基,5’-和/或3’-烷基封端的核苷酸,unicap,自然界已知的5’端帽,xrna堿基(類似于“xdna”堿基),yrna堿基(類似于“ydna”堿基),peg取代基,或與染料或非熒光標(biāo)記(或標(biāo)簽)綴合的接頭或如上所述的其它模塊。例示性修飾的核苷酸還描述于表2中。
表2.合成的指導(dǎo)序列中含有的例示性的修飾的核苷酸
如本文所述,一些非天然堿基對(duì)(例如isog和isoc,z堿基和p堿基;參見zhang等(2015)j.am.chem.soc.)可能有利于影響指導(dǎo)rna二級(jí)結(jié)構(gòu)的熱穩(wěn)定性。這些修飾可用于防止指導(dǎo)rna骨架與指導(dǎo)rna序列的其他域的錯(cuò)誤折疊。
最近的指導(dǎo)rna:cas9蛋白結(jié)構(gòu)信息(圖10,如jiang等,2015,science報(bào)道的),以及體內(nèi)/體外功能突變研究(參見例如briner等,2014,mol.cell,56,333-9)表明指導(dǎo)rna骨架主要在結(jié)構(gòu)上是保守的。這加強(qiáng)了指導(dǎo)rna的保守域的正確折疊對(duì)于與cas9發(fā)揮功能的重要性。圖10顯示了指導(dǎo)rna骨架二級(jí)結(jié)構(gòu),顯示與cas9的氨基酸的相互作用。大多數(shù)指導(dǎo)rna含氮堿基不涉及與cas9蛋白的結(jié)合相互作用。
sgrna骨架的側(cè)翼序列增加錯(cuò)誤折疊的可能性,從而增加誤差。20nt指導(dǎo)靶序列,骨架區(qū)的5’,是用戶指定針對(duì)各靶標(biāo)的,從而錯(cuò)配的可能性是可變的或靶標(biāo)特異性的。此外,許多新興的crispr-cas應(yīng)用附加了骨架的功能序列3’,例如crispr顯示(schechner等,nat.methods2015)和crispr-i/-a(chen等,cell2013),其是核糖開關(guān)或適配體,其也需要正確和獨(dú)立地折疊才能正常工作。為了確保給定sgrna的每個(gè)功能域(即靶向指導(dǎo),骨架,適配體)以模塊化、獨(dú)立的方式折疊,結(jié)構(gòu)上保守的骨架堿基對(duì)可被非天然的正交堿基對(duì)(例如isog和isoc;z堿基和p堿基)取代,并且在一些實(shí)施方案中,僅被非天然正交堿基對(duì)取代。這確保了sgrna骨架序列將不會(huì)在二級(jí)結(jié)構(gòu)中穩(wěn)定地與靶標(biāo)配對(duì)的指導(dǎo)序列的元件或并入指導(dǎo)rna中的其他非天然域(如任何適配體序列或指導(dǎo)rna上的任何非天然的5’或3’凸出)相互作用?;蛘撸鲜龇翘烊徽粔A基對(duì)可被并入可能存在的任何非天然凸出或適配體中,從而防止涉及骨架序列錯(cuò)折疊的二級(jí)結(jié)構(gòu)。
b.具有至少一個(gè)修飾的指導(dǎo)rna
在一個(gè)方面,本技術(shù)提供具有至少一個(gè)修飾的指導(dǎo)rna,構(gòu)成修飾的grna。
在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的核苷酸。在其他實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的核苷酸。在一些實(shí)施方案中,所有核苷酸都是修飾的。在一些實(shí)施方案中,所有修飾都是相同的。在一些實(shí)施方案中,所有修飾的核苷酸具有相同類型的修飾。在一些實(shí)施方案中,修飾的grna包含不同修飾的核苷酸的組合。在一些實(shí)施方案中,修飾的grna包含兩個(gè)或更多個(gè)修飾的核苷酸。在一些實(shí)施方案中,修飾的grna包含三個(gè)或更多個(gè)修飾的核苷酸。在一些實(shí)施方案中,修飾的核苷酸是連續(xù)排列的。在一些實(shí)施方案中,修飾的grna包含至少一個(gè)連續(xù)的修飾的核苷酸段。在一些實(shí)施方案中,修飾的grna包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的核苷酸的連續(xù)段。各個(gè)修飾的核苷酸可獨(dú)立地包含一個(gè)或多個(gè)類型的修飾。在一些實(shí)施方案中,在修飾的grna的序列中,修飾的核苷酸都不是連續(xù)的,或者一部分連續(xù)但非全部連續(xù)。
在一些實(shí)施方案中,修飾在指導(dǎo)rna的5’部分內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的5’部分的前5個(gè)(5)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的5’部分的前3個(gè)(3)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的3’部分的最后5個(gè)(5)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的3’部分的最后3個(gè)(3)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的內(nèi)部區(qū)域(即5’端至3’端之間)內(nèi)。
在一些實(shí)施方案中,修飾整合于指導(dǎo)rna的5’部分或3’部分中,尤其是在5’部分的前5或10個(gè)核苷酸內(nèi)或在3’部分的最后5或10個(gè)核苷酸內(nèi),以例如保護(hù)rna不被核酸酶降解或出于其他目的。在一些其他實(shí)施方案中,修飾在指導(dǎo)rna的5’部分和3’部分二者中,尤其是在5’部分的前5或10個(gè)核苷酸內(nèi)或在3’部分的最后5或10個(gè)核苷酸內(nèi),以例如保護(hù)rna不被核酸酶降解或出于其他目的。在一些實(shí)施方案中,指導(dǎo)rna的5’部分和3’部分二者均存在中超過一個(gè)類型的修飾。在一些實(shí)施方案中,修飾定位在指導(dǎo)rna的5’端處、3’端處及內(nèi)部序列中。在一些實(shí)施方案中,指導(dǎo)rna在指導(dǎo)rna的5’部分和3’部分中包含40個(gè)或更少、或20個(gè)或更少、或15個(gè)或更少、或10個(gè)或更少、或5個(gè)或更少、或3或更少個(gè)脫氧核糖核苷酸殘基。
在一些實(shí)施方案中,修飾在指導(dǎo)rna的crrna區(qū)段內(nèi)。在一些實(shí)施方案中,修飾在crrna的指導(dǎo)序列內(nèi)。在一些實(shí)施方案中,修飾在crrna區(qū)段的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在crrna區(qū)段的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在crrna區(qū)段上的5’-凸出內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的tracrrna區(qū)段內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的tracrrna區(qū)段的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,修飾在指導(dǎo)rna的tracrrna區(qū)段的最后三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,當(dāng)指導(dǎo)rna是單一指導(dǎo)rna時(shí),修飾位于指導(dǎo)rna的環(huán)內(nèi)。在一些實(shí)施方案中,一個(gè)或多個(gè)修飾在環(huán)l區(qū)內(nèi)。在一些實(shí)施方案中,修飾包括染料,非熒光標(biāo)記或標(biāo)簽,其綴合至整合于如上所述的兩個(gè)核苷酸之間的接頭,例如通過綴合至2-(3-(染料/標(biāo)記/標(biāo)簽)酰胺基)丙酰胺基)丙烷-1,3-二醇雙(磷酸二酯)接頭或綴合至環(huán)或l區(qū)中的核苷酸的修飾堿基。
在一些實(shí)施方案中,修飾包括末端修飾如5’端修飾或3’端修飾。末端修飾的實(shí)例包括但不限于磷酸化(作為天然磷酸酯或多磷酸酯或作為修飾的磷酸酯基團(tuán),例如烷基膦酸酯,膦酰基羧酸酯,膦?;宜狨ィ鹜殪⑺狨?,硫代磷酸酯,二硫代磷酸酯等),生物素化,綴合或綴合的分子,接頭,染料,標(biāo)記,標(biāo)簽,官能團(tuán)(例如但不限于5’-氨基,5’-硫代,5’-酰氨基,5’-羧基等),反式連接,或烴模塊,其可包含醚,聚乙二醇(peg),酯,羥基,芳基,鹵素,磷酸二酯,雙環(huán),雜環(huán)或其它有機(jī)官能團(tuán)。在一些實(shí)施方案中,末端修飾包括二甲氧基三苯甲基。
在一些實(shí)施方案中,修飾包括修飾的堿基。如本文所用,“未修飾的”堿基包括嘌呤堿基腺嘌呤(a)和鳥嘌呤(g),和嘧啶堿基胸腺嘧啶(t),胞嘧啶(c)及尿嘧啶(u)。修飾的堿基的實(shí)例包括但不限于合成的和天然的堿基,例如2-硫代u,2-硫代c,4-硫代u,6-硫代g,2-氨基a,2-氨基p,假尿嘧啶,次黃嘌呤,7-脫氮鳥嘌呤,7-脫氮-8-氮雜鳥嘌呤,7-脫氮腺嘌呤,7-脫氮-8-氮雜腺嘌呤,5-甲基c,5-甲基u,5-羥甲基胞嘧啶,5-羥甲基尿嘧啶,5,6-脫氫尿嘧啶,5-丙炔基胞嘧啶,5-丙炔基尿嘧啶,5-乙炔基胞嘧啶,5-乙炔基尿嘧啶,5-烯丙基u,5-烯丙基c,5-氨基烯丙基-尿嘧啶和5-氨基烯丙基-胞嘧啶。在一些實(shí)施方案中,修飾包括無堿基核苷酸。在一些實(shí)施方案中,修飾包括非標(biāo)準(zhǔn)嘌呤或嘧啶結(jié)構(gòu),例如z或p,isoc或isog,una,5-甲基吡喃,x(a,g,c,t)或y(a,g,c,t)。在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的堿基。在其他實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的堿基。在一些實(shí)施方案中,grna中所有堿基都是修飾的。
在一些實(shí)施方案中,修飾包括修飾的糖。修飾的糖的實(shí)例包括但不限于具有2’位置處修飾或4’位置處修飾的糖。例如,在一些實(shí)施方案中,糖包括2’-o-c1-4烷基,例如2’-o-甲基(2’-ome)。在一些實(shí)施方案中,糖包括2’-o-c1-3烷基-o-c1-3烷基,例如2’-甲氧基乙氧基(2’-o-ch2ch2och3),也稱為2’-o-(2-甲氧基乙基)或2’-moe。在一些實(shí)施方案中,糖包含2’-鹵素,如2’-f,2’-br,2’-cl或2’-i。在一些實(shí)施方案中,糖包含2’-nh2。在一些實(shí)施方案中,糖包含2’-h(例如脫氧核糖核苷酸)。在一些實(shí)施方案中,糖包含2’-阿拉伯糖或2’-f-阿拉伯糖。在一些實(shí)施方案中,糖包含2’-lna或2’-ulna。在一些實(shí)施方案中,糖包含4’-硫代核糖基。在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的糖。在其他實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的糖。在一些實(shí)施方案中,grna中的所有糖都是修飾的。
在一些實(shí)施方案中,修飾包括修飾的主鏈(即天然磷酸二酯以外的核苷酸間連接)。修飾的核苷酸間鍵連接的實(shí)例包括但不限于硫代磷酸酯核苷酸間連接,手性硫代磷酸酯核苷酸間連接,二硫代磷酸酯核苷酸間連接,硼烷膦酸酯核苷酸間連接,c1-4烷基膦酸酯核苷酸間連接,例如甲基膦酸酯核苷酸間臨街,硼烷膦酸酯核苷酸間連接,膦酰基羧酸酯核苷酸間連接,如膦?;宜狨ズ塑账衢g連接,膦?;人狨ズ塑账衢g連接如膦?;宜狨ズ塑账衢g連接,硫代膦?;人岷塑账衢g連接,如硫代膦?;宜狨ズ塑账衢g連接,硫代膦?;人狨ズ塑账衢g連接如硫代膦?;宜狨ズ塑账衢g連接。還包括各種鹽,混合鹽和游離酸形式。在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的核苷酸間連接。在一些實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的核苷酸間連接。在一些實(shí)施方案中,grna中的所有核苷酸間連接都是修飾的。
在一些實(shí)施方案中,修飾是2’-o-c1-4烷基,2’-h,2’-o-c1-3烷基-o-c1-3烷基,2’-f,2’-nh2,2’-阿拉伯糖,2’-f-阿拉伯糖,2’-lna,2’-ulna,4’-硫代核糖基,2-硫代u,2-硫代c,4-硫代u,6-硫代g,2-氨基a,2-氨基p,假尿嘧啶,次黃嘌呤,7-脫氮鳥嘌呤,7-脫氮-8-氮雜鳥嘌呤,7-脫氮腺嘌呤,7-脫氮-8-氮雜腺嘌呤,5-mec,5-meu,5-羥甲基胞嘧啶,5-羥甲基尿嘧啶,5,6-脫氫尿嘧啶,5-丙炔基胞嘧啶,5-丙炔基尿嘧啶,5-乙炔基胞嘧啶,5-乙炔基尿嘧啶,5-烯丙基u,5-烯丙基c,5-氨基烯丙基-尿嘧啶,5-氨基烯丙基-胞嘧啶,無堿基核苷酸,z,p,una,isoc,isog,5-甲基-嘧啶,x(a,g,c,t),y(a,g,c,t),3’-硫代磷酸酯基團(tuán),3’-膦?;宜狨セ鶊F(tuán),3’-膦酰基乙酸酯基團(tuán),3’-硫代膦?;宜狨セ鶊F(tuán),3’-硫代膦?;宜狨セ鶊F(tuán),3’-甲基膦酸酯基團(tuán),3’-硼烷膦酸酯基團(tuán),3’-二硫代磷酸酯基或其組合。
在一些實(shí)施方案中,修飾的核苷酸包含2’-o-甲基-3’-硫代磷酸酯。在一些實(shí)施方案中,修飾的核苷酸包含2’-o-甲基-3’-膦?;宜狨?。在一些實(shí)施方案中,修飾的核苷酸包含2’-o-甲基-3’-硫代膦?;宜狨?。在一些實(shí)施方案中,修飾的核苷酸包含z堿基。在一些實(shí)施方案中,修飾的核苷酸包含2’-鹵-3’-硫代磷酸酯。在一些實(shí)施方案中,修飾的核苷酸包含2’-鹵-3’-膦?;宜狨ァT谝恍?shí)施方案中,修飾的核苷酸包含2’-鹵-3’-硫代膦酰基乙酸酯。在一些實(shí)施方案中,修飾的核苷酸包含2’-氟-3’-硫代磷酸酯。在一些實(shí)施方案中,修飾的核苷酸包含2’-氟-3’-膦?;宜狨?。在一些實(shí)施方案中,修飾的核苷酸包含2’-氟-3’-硫代膦?;宜狨ァ?/p>
在一些實(shí)施方案中,指導(dǎo)rna包含式(i)所示的寡核苷酸:
w-y或y-w(i)
其中w代表包含至少一個(gè)修飾的寡核苷酸的核苷酸或核苷酸段,而y代表寡核苷酸未修飾的部分。
在一些實(shí)施方案中,w在指導(dǎo)rna的5’部分內(nèi)。在一些實(shí)施方案中,w至少部分在指導(dǎo)rna的5’部分的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,w至少部分在指導(dǎo)rna的5’部分的前三(3)個(gè)核苷酸中。在一些實(shí)施方案中,w在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,w至少部分在指導(dǎo)rna的3’部分的最后五(5)個(gè)核苷酸中。在一些實(shí)施方案中,w至少部分在指導(dǎo)rna的3’部分的最后三(3)個(gè)核苷酸中。在一些實(shí)施方案中,w在指導(dǎo)rna的內(nèi)部區(qū)域(即5’端和3’端之間)內(nèi)。
在一些實(shí)施方案中,w包含如上所述的末端修飾,例如5’端修飾或3’端修飾。在一些實(shí)施方案中,末端修飾包括二甲氧基三苯甲基。
在一些實(shí)施方案中,w包含如上所述的修飾堿基。在一些實(shí)施方案中,w包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾堿基。在其他實(shí)施方案中,w包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾堿基。在一些實(shí)施方案中,grna中的所有堿基都是修飾的。
在一些實(shí)施方案中,w包含上所述的修飾的糖。在一些實(shí)施方案中,w包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的糖。在其他實(shí)施方案中,w包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的糖。在一些實(shí)施方案中,grna中的所有的糖都是修飾的。
在一些實(shí)施方案中,w包含上所述的修飾的主鏈(即磷酸二酯以外的核苷酸間連接)。在一些實(shí)施方案中,w包含多于1個(gè),如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個(gè)修飾的核苷酸間連接。在其他實(shí)施方案中,w包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的核苷酸間連接。在一些實(shí)施方案中,grna中的所有的核苷酸間連接都是修飾的。
在一些實(shí)施方案中,w包含2’-o-c1-4烷基,2’-h,2’-o-c1-3烷基-o-c1-3烷基,2’-f,2’-nh2,2’-阿拉伯糖,2’-f-阿拉伯糖,2’-lna,2’-ulna,4’-硫代核糖基,2-硫代u,2-硫代c,4-硫代u,6-硫代g,2-氨基a,2-氨基p,假尿嘧啶,次黃嘌呤,7-脫氮鳥嘌呤,7-脫氮-8-氮雜鳥嘌呤,7-脫氮腺嘌呤,7-脫氮-8-氮雜腺嘌呤,5-mec,5-meu,5-羥甲基胞嘧啶,5-羥甲基尿嘧啶,5,6-脫氫尿嘧啶,5-丙炔基胞嘧啶,5-丙炔基尿嘧啶,5-乙炔基胞嘧啶,5-乙炔基尿嘧啶,5-烯丙基u,5-烯丙基c,5-氨基烯丙基-尿嘧啶,5-氨基烯丙基-胞嘧啶,無堿基核苷酸,z,p,una,isoc,isog,5-甲基-嘧啶,x(a,g,c,t),y(a,g,c,t),硫代磷酸酯核苷酸間連接,膦?;宜狨ズ塑账衢g連接,膦?;宜狨ズ塑账衢g連接,硫代膦?;宜狨ズ塑账衢g連接,硫代膦酰乙酸酯核苷酸間連接,甲基膦酸酯核苷酸間連接,硼烷膦酸酯核苷酸間連接接,二硫代磷酸酯核苷酸間連接,或其組合。
在一些實(shí)施方案中,w包含相同核苷酸上的2’-o-甲基和3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,w包含相同核苷酸上的2’-o-甲基和3’-膦?;宜狨セ鶊F(tuán)。一些實(shí)施方案中,w包含相同核苷酸上的2’-o-甲基和3’-硫代膦酰基乙酸酯基團(tuán)。在一些實(shí)施方案中,w包含相同核苷酸上的2’-f和3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,w包含相同核苷酸上的2’-f和3’-膦?;宜狨セ鶊F(tuán)。在一些實(shí)施方案中,w包含相同核苷酸上的2’-f和3’-硫代膦?;宜狨セ鶊F(tuán)。
在一些實(shí)施方案中,w包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)修飾的核苷酸。在一些實(shí)施方案中,每個(gè)修飾的核苷酸都包含相同的修飾。在一些實(shí)施方案中,w包含多種修飾的核苷酸的組合。在一些實(shí)施方案中,w包含兩個(gè)或更多個(gè)修飾的核苷酸。在一些實(shí)施方案中,w包含三個(gè)或更多個(gè)修飾的核苷酸。在一些實(shí)施方案中,由于一個(gè)或多個(gè)未修飾的核苷酸可能會(huì)介于中間(intercede),所述修飾的核苷酸在序列中不連續(xù)排列或者至少不完全連續(xù)排列。在一些實(shí)施方案中,修飾的核苷酸連續(xù)排列。在一些實(shí)施方案中,w包含至少一個(gè)修飾核苷酸的連續(xù)段。在一些實(shí)施方案中,w包含至少三(3)個(gè)修飾核苷酸的連續(xù)段。在一些實(shí)施方案中,w包含至少四(4)個(gè)修飾核苷酸的連續(xù)段。在一些實(shí)施方案中,w包含至少五(5)個(gè)修飾核苷酸的連續(xù)段。
在一些實(shí)施方案中,指導(dǎo)rna包含式(ii)所示的寡核苷酸:
mmnn(ii)
其中各個(gè)n獨(dú)立地表示未修飾的核糖核苷酸;
其中各個(gè)m表示修飾的核苷酸,并且獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,3’-p(s)核糖核苷酸,3’-pace核糖核苷酸,3’-硫代pace核糖核苷酸,2’-o-甲基-3’-p(s)-核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸,z核苷酸和2’-脫氧核苷酸;
其中各個(gè)m處于指導(dǎo)rna的序列的任何位置;
其中任何給定的m與任何其它m相同或不同,并且任何給定的n與任何其它n相同或不同;和
其中m和n各自獨(dú)立地選自0至219的整數(shù),條件是50<m+n≤220,且m不為0。
在一些實(shí)施方案中,m+n<150。
在一些實(shí)施方案中,每個(gè)m由一個(gè)或多個(gè)獨(dú)立地選自下組的模塊修飾:2’-f,2-硫尿嘧啶,4-硫尿嘧啶,2-氨基腺嘌呤,次黃嘌呤,5-甲基胞嘧啶,5-甲基尿嘧啶,5-烯丙基氨基尿嘧啶,方酸連接,三唑連接和2-(4-丁基酰胺熒光素)丙烷-1,3-二醇雙(磷酸二酯)連接。在一些實(shí)施方案中,m包含通過接頭連接的染料。
在一些實(shí)施方案中,每個(gè)m獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m獨(dú)立地選自下組:2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。
在一些實(shí)施方案中,當(dāng)m>1,任何給定的m與任何其他m相同或不同。在一些實(shí)施方案中,當(dāng)m>1,每個(gè)m具有相同的修飾。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-pace核糖核苷酸,m選自1至10的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-pace核糖核苷酸,m選自1至5的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,并且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-pace核糖核苷酸,m選自2至5的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,并且n選自1至148的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,m是1。在一些實(shí)施方案中,m是2。在一些實(shí)施方案中,m是3。在一些實(shí)施方案中,m是4。在一些實(shí)施方案中,m是5。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-硫代pace核糖核苷酸,m選自1至10的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,并且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-硫代pace核糖核苷酸,m選自1至5的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,并且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-硫代pace核糖核苷酸,m選自2至5的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,并且n選自1至148的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,m是1。在一些實(shí)施方案中,m是2。在一些實(shí)施方案中,m是3。在一些實(shí)施方案中,m是4。在一些實(shí)施方案中,m是5。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基核糖核苷酸,m選自1至40的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基核糖核苷酸,m選自1至25的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基核糖核苷酸,m選自1至20的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,m是1。在一些實(shí)施方案中,m是2。在一些實(shí)施方案中,m是3。在一些實(shí)施方案中,m是4。在一些實(shí)施方案中,m是5。在一些實(shí)施方案中,m是10。在一些實(shí)施方案中,m是15。在一些實(shí)施方案中,m為20。在一些實(shí)施方案中,m是30。在一些實(shí)施方案中,m是40。
在一些實(shí)施方案中,每個(gè)m是2’-脫氧核苷酸,m選自1至30的整數(shù),每個(gè)n獨(dú)立地選a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-脫氧核苷酸,m選自1至20的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,m是5。在一些實(shí)施方案中,m是10。在一些實(shí)施方案中,m是15。在一些實(shí)施方案中,m是20。在一些實(shí)施方案中,m是30。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-p(s)核糖核苷酸,m選自1至10的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-p(s)核糖核苷酸,m選自1至5的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,m是1。在一些實(shí)施方案中,m是2。在一些實(shí)施方案中,m是3。在一些實(shí)施方案中,m是4。在一些實(shí)施方案中,m是5。
在一些實(shí)施方案中,每個(gè)m是z核苷酸,m選自1至10的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,每個(gè)m是z核苷酸,m選自1至5的整數(shù),每個(gè)n獨(dú)立地選自a、u、c和g,且n選自1至149的整數(shù),條件是50<m+n≤150。在一些實(shí)施方案中,m是1。在一些實(shí)施方案中,m是2。在一些實(shí)施方案中,m是3。在一些實(shí)施方案中,m是4。在一些實(shí)施方案中,m是5。
在一些實(shí)施方案中,修飾是改變穩(wěn)定性的修飾。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾提高指導(dǎo)rna的核酸酶抗性,從而增強(qiáng)指導(dǎo)rna的穩(wěn)定性。在一些實(shí)施方案中,改變穩(wěn)定性的修飾是增強(qiáng)穩(wěn)定性的修飾。例如,在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括2’-o-甲基或2’-o-c1-4烷基核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括2’-鹵素核苷酸,如2’-f,2’-br,2’-cl或2’-i。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括2’moe或2’-o-c1-3烷基-o-c1-3烷基。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括2’-nh2核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括2’-h(或2’-脫氧)核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括2’-阿拉伯糖或2-f-阿拉伯糖。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括4’-硫代核糖基糖模塊。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括3’-膦酰基乙酸酯基團(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括含有3’-硫代膦?;宜狨セ鶊F(tuán)的核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括含有3’-甲基膦酸酯基團(tuán)的核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括含有3’-硼烷磷酸酯基團(tuán)的核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包含含有3’-二硫代磷酸酯基團(tuán)的核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括鎖核酸(“l(fā)na”)核苷酸。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括非鎖核酸(“ulna”)核苷酸。
在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括相同核苷酸上的2’-o-甲基和3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括相同核苷酸上的2’-o-甲基和3’-膦酰基乙酸酯基團(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括相同核苷酸上的2’-o-甲基和3’-硫代膦酰基乙酸酯基團(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括相同核苷酸上的2’-氟和3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括相同核苷酸上的2’-氟和3’-膦?;宜狨セ鶊F(tuán)。在一些實(shí)施方案中,增強(qiáng)穩(wěn)定性的修飾包括相同核苷酸上的2’-氟和3’-硫代膦?;宜狨セ鶊F(tuán)。
在一些實(shí)施方案中,修飾是改變特異性的修飾。在一些實(shí)施方案中,可通過增強(qiáng)中靶結(jié)合和/或切割,或減少脫靶結(jié)合和/或切割或二者的組合來實(shí)現(xiàn)特異性增強(qiáng)。在一些其它實(shí)施方案中,可例如通過減少中靶結(jié)合和/或切割,或增加脫靶結(jié)合和/或切割或二者的組合來實(shí)現(xiàn)特異性降低。
在一些實(shí)施方案中,改變特異性的修飾包括2’-o-甲基。在一些實(shí)施方案中,改變特異性的修飾包括2’-鹵素,例如2’-氟。
在一些實(shí)施方案中,改變特異性的修飾包括2-硫尿嘧啶堿基(2-硫代u)。在一些實(shí)施方案中,改變特異性的修飾包括2-硫代c。在一些實(shí)施方案中,改變特異性的修飾包括4-硫代u。在一些實(shí)施方案中,改變特異性的修飾包括6-硫代g。在一些實(shí)施方案中,改變特異性的修飾包括2-氨基a。在一些實(shí)施方案中,改變特異性的修飾包括2-氨基嘌呤。在一些實(shí)施方案中,改變特異性的修飾包括假尿嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括次黃嘌呤。在一些實(shí)施方案中,改變特異性的修飾包括7-脫氮鳥嘌呤。在一些實(shí)施方案中,改變特異性的修飾包括7-脫氮-8-氮雜鳥嘌呤。在一些實(shí)施方案中,改變特異性的修飾包括7-脫氮腺嘌呤。在一些實(shí)施方案中,改變特異性的修飾包括7-脫氮-8-氮雜腺嘌呤。在一些實(shí)施方案中,改變特異性的修飾包括5-甲基c。在一些實(shí)施方案中,改變特異性的修飾包括5-甲基u。在一些實(shí)施方案中,改變特異性的修飾包括5-羥甲基胞嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5-羥甲基尿嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5,6-脫氫尿嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5-丙炔基胞嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5-丙炔尿嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5-乙炔基胞嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5-乙炔尿嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括5-烯丙基u。在一些實(shí)施方案中,改變特異性的修飾包括5-烯丙基c。在一些實(shí)施方案中,改變特異性的修飾包括5-氨基烯丙基u。在一些實(shí)施方案中,改變特異性的修飾包括5-氨基烯丙基c。在一些實(shí)施方案中,改變特異性的修飾包括無堿基核苷酸。在一些實(shí)施方案中,改變特異性的修飾包括z堿基。在一些實(shí)施方案中,改變特異性的修飾包括p堿基。在一些實(shí)施方案中,改變特異性的修飾包括una堿基。在一些實(shí)施方案中,改變特異性的修飾包括isoc。在一些實(shí)施方案中,改變特異性的修飾包括isog。在一些實(shí)施方案中,改變特異性的修飾包括5-甲基-嘧啶。在一些實(shí)施方案中,改變特異性的修飾包括x(a,g,c,t)。在一些實(shí)施方案中,改變特異性的修飾包括y(a,g,c,t)。
在一些實(shí)施方案中,改變特異性的修飾包括硫代磷酸酯核苷酸間連接。在一些實(shí)施方案中,改變特異性的修飾包括膦?;宜狨ズ塑账衢g連接。在一些實(shí)施方案中,改變特異性的修飾包括硫代膦?;宜岷塑账衢g連接。在一些實(shí)施方案中,改變特異性的修飾包括甲基膦酸酯核苷酸間連接。在一些實(shí)施方案中,改變特異性的修飾包括硼烷磷酸酯核苷酸間連接。在一些實(shí)施方案中,改變特異性的修飾包含二硫代磷酸核苷酸間連接。在一些實(shí)施方案中,改變特異性的修飾包括ulna。在一些實(shí)施方案中,改變特異性的修飾包括lna。
在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾通過例如改變指導(dǎo)rna的解鏈溫度(tm)來改變r(jià)na堿基配對(duì)。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾降低指導(dǎo)rna的tm。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修改提高指導(dǎo)rna的tm。
在一些實(shí)施方案中,改變特異性的修飾降低堿基配對(duì)相互作用的tm。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是2’-脫氧基,因?yàn)楸绢I(lǐng)域眾所周知的是,dna/dna堿基對(duì)具有比其相應(yīng)的rna/dna雙鏈體更低的tm。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是2-硫尿嘧啶,其輕微降低g-u搖擺配對(duì)的tm。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是硫代磷酸酯核苷酸間連接或二硫代磷酸酯核苷酸間連接,其每個(gè)修飾使tm降低~0.5℃。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是硼烷膦酸酯核苷酸間連接,其每個(gè)修飾使tm降低~0.5-0.8℃。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是膦?;宜狨ズ塑账衢g連接,其每個(gè)修飾將tm降低~1.3℃。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是非鎖核酸(“ulna”),其每個(gè)修飾將tm降低~5-8℃。在一些實(shí)施方案中,降低堿基配對(duì)相互作用的tm的修飾是2’-o-甲基-3’-甲基膦酸酯。
在一些實(shí)施方案中,改變特異性的修飾提高堿基配對(duì)相互作用的tm。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是2’-o-甲基,其每個(gè)修飾將tm提高~0.5-0.7℃。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是2’-f,其每個(gè)修飾使tm提高~1℃。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是2-硫尿嘧啶,其提高a-u配對(duì)的tm(并且如上所述,略微降低g-u搖擺配對(duì)的tm)。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是4-硫尿嘧啶,其提高g-u搖擺對(duì)的tm并輕微提高a-u對(duì)的tm。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是2-氨基-腺嘌呤,其每個(gè)修飾將其與u配對(duì)的堿基的tm提高~1℃。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是5-甲基-尿嘧啶(5-甲基u)(參見例如wang&kool(1995)biochemistry,34,4125-32)。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是5-甲基-胞嘧啶(5-甲基c)。在一些實(shí)施方案中,提高堿基配對(duì)相互作用的tm的修飾是鎖核酸(“l(fā)na”),其每個(gè)修飾將tm提高2-10℃。
在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾改變指導(dǎo)rna的轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾提高指導(dǎo)rna的轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾降低指導(dǎo)的轉(zhuǎn)染效率。在一些實(shí)施方案中,修飾中和磷酸鹽上的陰離子電荷,允許被動(dòng)擴(kuò)散進(jìn)入細(xì)胞。在一些實(shí)施方案中,中和電荷的修飾包括膦酰基乙酸酯烷基酯核苷酸間連接,如膦酰基乙酸甲酯核苷酸間連接。
在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾改變指導(dǎo)rna的免疫刺激作用。最初發(fā)現(xiàn)非甲基化的細(xì)菌dna及其合成類似物是tlr9的配體(參見hemmi等(2000)nature,408,740-5)??稍诙塑账峄蛑袦p輕tlr9的刺激,例如通過修飾c和g殘基。使用5-甲基胞嘧啶,2-氨基胞嘧啶,2-硫代胞嘧啶,5-甲基異胞嘧啶,p-核堿基(6-(β-d-2’-脫氧呋喃核糖基)-3,4-二氫-8h-嘧啶并[4,5-c][1,2]噁嗪-7-酮)和2’-o-甲基胞嘧啶均導(dǎo)致tlr9刺激的損失或減少。在一些實(shí)施方案中,使用6-硫鳥嘌呤,2,6-二氨基嘌呤,2-氨基嘌呤,黃嘌呤,肌苷,7-脫氮黃嘌呤,異鳥嘌呤,8-氧基鳥嘌呤,水粉蕈素(nebularine),8-溴鳥嘌呤,k-核堿基(2-氨基-n-甲氧基腺苷)和/或2’-o-甲基鳥嘌呤可導(dǎo)致tlr9刺激的損失或減少。在一些實(shí)施方案中,使用磷酸二酯修飾可降低或消除tlr9應(yīng)答。通常,合成并入的硫代磷酸酯可以有限的程度降低tlr9響應(yīng),這被認(rèn)為是由合成rna中每個(gè)硫代磷酸酯的兩個(gè)立體異構(gòu)體的存在而導(dǎo)致的。然而,已顯示缺乏cpg基序的硫代磷酸酯修飾的dna刺激tlr9至相當(dāng)小的程度。磷上的負(fù)電荷是通過tlr9識(shí)別的重要元素,因此使用烷基膦酸酯去除負(fù)電荷可導(dǎo)致tlr9刺激的損失或減少。在5’和3’末端序列中的脫氧核苷之間使用膦?;宜狨?pace)核苷酸間連接可顯著增加tlr9響應(yīng);然而,在5’和3’末端序列中的脫氧核苷之間使用硫代膦?;宜狨?硫代pace)核苷酸間連接可以導(dǎo)致tlr9刺激的損失或減少。在一些實(shí)施方案中,使用有利于c3’-endo構(gòu)象的糖修飾(如2’-o-甲基修飾)可在5’和3’末端摻入以降低tlr9響應(yīng)。tlr7和tlr8可由含有7-脫氮鳥嘌呤和單鏈rna的分子刺激(參見例如heil等(2004)science,303,1526-9)。tlr3涉及病毒來源的雙鏈rna的細(xì)胞免疫反應(yīng)。在一些實(shí)施方案中,例如可通過使用2’-o-甲基修飾,含硫的修飾的磷酸二酯鍵或降低核苷酸負(fù)電荷的修飾(如甲基膦酸酯和/或膦?;宜狨ズ塑账衢g連接)來減輕tlr響應(yīng)。
在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾增強(qiáng)指導(dǎo)rna的穩(wěn)定性和特異性。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾增強(qiáng)指導(dǎo)rna的穩(wěn)定性和轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾增強(qiáng)指導(dǎo)rna的特異性和轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,修飾增強(qiáng)指導(dǎo)rna的整體功效。
c.具有修飾組合的指導(dǎo)rna
一方面,本技術(shù)提供具有兩個(gè)或更多個(gè)修飾的組合的指導(dǎo)rna。
在一些實(shí)施方案中,兩個(gè)修飾是相同的核苷酸(例如一個(gè)核苷酸包含2’-o-甲基和3’-硫代膦酰基乙酸酯模塊)。在其它實(shí)施方案中,兩個(gè)修飾在兩個(gè)不同的核苷酸上(例如一個(gè)核苷酸具有2-硫代u堿基,另一個(gè)核苷酸具有2’-o-甲基基團(tuán))。
在一些實(shí)施方案中,指導(dǎo)rna的每個(gè)修飾是相同的。在一些實(shí)施方案中,指導(dǎo)rna中的至少一個(gè)修飾與指導(dǎo)rna中的至少一個(gè)其他修飾不同。在一些實(shí)施方案中,指導(dǎo)rna中的單個(gè)核苷酸具有兩個(gè)或更多個(gè)修飾。
在一些實(shí)施方案中,指導(dǎo)rna包含不同類型修飾的組合,且組合中至少有一個(gè)類型存在于指導(dǎo)rna的多個(gè)位置。在一些實(shí)施方案中,組合中的至少一種類型在指導(dǎo)rna中出現(xiàn)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次。
在一些實(shí)施方案中,組合中的至少一種類型的修飾出現(xiàn)在兩個(gè)或更多個(gè)修飾的核苷酸中。在一些實(shí)施方案中,組合中的至少一種類型的修飾出現(xiàn)在三個(gè)或更多個(gè)修飾的核苷酸中。在一些實(shí)施方案中,由于一個(gè)或多個(gè)未修飾的核苷酸可能介于其間,所述修飾的核苷酸在序列中是不連續(xù)排列的或者至少不完全連續(xù)排列的。在一些實(shí)施方案中,修飾的核苷酸連續(xù)排列。在一些實(shí)施方案中,指導(dǎo)rna包含相同類型的連續(xù)的修飾的核苷酸段。在一些實(shí)施方案中,所述段具有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40個(gè)修飾的核苷酸。
在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的5’部分內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的5’部分的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的5’部分的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的3’部分的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的3’部分的最后三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中的至少一種類型的修飾在指導(dǎo)rna的內(nèi)部區(qū)域(即5’端和3’端之間)內(nèi)。
在一些實(shí)施方案中,組合中的至少一種類型的修飾整合入指導(dǎo)rna的5’或3’部分,特別是在5’部分的前5個(gè)或10個(gè)核苷酸內(nèi),或在3’部分的最后5個(gè)或10個(gè)核苷酸內(nèi),以例如保護(hù)rna免受核酸酶降解或用于其它目的。在一些實(shí)施方案中,組合中的至少一種類型的修飾在5’部分內(nèi)且組合中的至少一種類型的修飾在指導(dǎo)rna的3’部分內(nèi),尤其是在5’部分的前5個(gè)或10個(gè)核苷酸內(nèi)和在3’部分的最后5個(gè)或10個(gè)核苷酸內(nèi),以例如保護(hù)rna不被核酸酶降解或用于其他目的。在一些實(shí)施方案中,指導(dǎo)rna在指導(dǎo)rna的5’部分中包含20個(gè)或更少,或15個(gè)或更少,或15個(gè)或更少,或10個(gè)或更少,或5個(gè)或更少,或3個(gè)或更少的脫氧核糖核苷酸殘基。
在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的crrna區(qū)段內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在crrna的指導(dǎo)序列中。在一些實(shí)施方案中,組合中至少一種類型的修飾在crrna區(qū)段的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在crrna區(qū)段的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的tracrrna區(qū)段內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的tracrrna區(qū)段的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,組合中至少一種類型的修飾在指導(dǎo)rna的tracrrna區(qū)段的最后三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型的修飾在指導(dǎo)rna的5’部分內(nèi),組合中的第二種修飾類型在指導(dǎo)rna的內(nèi)部區(qū)域內(nèi)(即5’端和3’端之間)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)rna的5’部分的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)rna的5’部分的前三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型的修飾類型在指導(dǎo)rna的內(nèi)部區(qū)域內(nèi)(即5’端和3’端之間),組合中的第二種類型的修飾類型在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,第二種類型的修飾在指導(dǎo)rna的3’部分的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第二種類型的修飾在指導(dǎo)rna的3’部分的最后三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型的修飾類型在指導(dǎo)rna的5’部分內(nèi),組合中的第二種類型的修飾在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)rna的5’部分的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)rna的5’部分的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第二種類型的修飾在指導(dǎo)rna的3’部分的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第二種類型的修飾在指導(dǎo)rna的3’部分的最后三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型的修飾在指導(dǎo)rna的5’部分內(nèi),組合中的第二種類型的修飾在內(nèi)部區(qū)域內(nèi)(即在5’端和3’端之間),并且組合中的第三種類型的修飾在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)rna的5’部分的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)rna的5’部分的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第三種類型的修飾在指導(dǎo)rna的3’部分的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第三種類型的修飾在指導(dǎo)rna的3’部分的最后三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型的修飾在指導(dǎo)rna的crrna區(qū)段內(nèi),組合中的第二種類型的修飾在tracr區(qū)段內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna的指導(dǎo)序列內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna區(qū)段的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna區(qū)段的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第二種類型的修飾在指導(dǎo)rna的tracrrna區(qū)段的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第二種修飾在指導(dǎo)rna的tracrrna區(qū)段的最后三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型和第二種類型的修飾在指導(dǎo)rna的crrna區(qū)段內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在指導(dǎo)序列的crrna內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna區(qū)段的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna區(qū)段的前三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的第一種類型和第二種類型的修飾在指導(dǎo)rna的crrna區(qū)段內(nèi),組合中的第三種類型的修飾類型在tracr區(qū)段內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna的指導(dǎo)序列內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna區(qū)段的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第一種類型的修飾在crrna區(qū)段的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第三種類型的修飾在指導(dǎo)rna的tracrrna區(qū)段的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,第三種類型的修飾在指導(dǎo)rna的tracrrna區(qū)段的最后三(3)個(gè)核苷酸內(nèi)。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾包括如上所述的末端修飾(如5’端修飾或3’端修飾)。在一些實(shí)施方案中,末端修飾包括二甲氧基三苯甲基。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾包括修飾的堿基。在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40個(gè)修飾的堿基。在其他實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的堿基。在一些實(shí)施方案中,grna中所有的堿基都是修飾的。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾包括修飾的糖。在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40個(gè)修飾的糖。在其他實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的糖。在一些實(shí)施方案中,grna中所有的糖都是修飾的。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾包括修飾的主鏈(即天然磷酸二酯以外的核苷酸間連接)。在一些實(shí)施方案中,修飾的grna包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40個(gè)修飾的核苷酸間連接。在其他實(shí)施方案中,修飾的grna包含至少55、60、65、70、75、80、85、90、95、100、110、120、130或140個(gè)修飾的核苷酸間連接。在一些實(shí)施方案中,grna中所有的核苷酸間連接都是修飾的。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-o-甲基,2’-氟,2’-氨基,2’-脫氧基,2’-阿拉伯糖,2-f-阿拉伯糖,2-硫尿嘧啶,2-氨基腺嘌呤,5-甲基胞嘧啶,5-氨基烯丙基尿嘧啶,z堿基,3’-硫代磷酸酯,3’-膦酰基乙酸酯,3’-膦酰基乙酸酯,3’-硫代膦?;宜狨?,3’-硫代膦?;宜狨ィ?’-甲基膦酸酯,3’-硼烷膦酸酯,3’-二硫代磷酸酯或其組合。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-o-甲基,2’-脫氧基,z堿基,硫代磷酸酯核苷酸間連接,膦酰基乙酸酯核苷酸連接,硫代膦?;宜岷塑账徇B接,或其組合。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-f,2-硫代u,4-硫代u,2-氨基a,5-甲基c,5-甲基u,5-氨基烯丙基u或其組合。在一些實(shí)施方案中,組合中的至少一個(gè)修飾是“末端”修飾,例如末端磷酸酯,peg,末端胺,末端接頭如烴接頭,取代的烴接頭,方酸接頭,三唑接頭,內(nèi)部接頭如2-(4-丁基氨基熒光素)丙烷-1,3-二醇雙(磷酸二酯)接頭,與染料綴合的接頭,與非熒光標(biāo)記綴合的接頭,與標(biāo)簽綴合的接頭或與固體支持物(例如珠?;蛭㈥嚵?綴合的接頭。在一些實(shí)施方案中,組合中的至少兩個(gè)修飾包含2’-o-甲基核苷酸和硫代磷酸酯核苷酸間連接,2’-o-甲基核苷酸和膦?;宜狨ズ塑账衢g連接,或2’-o-甲基核苷酸和硫代膦?;宜狨ズ塑账衢g連接。在一些實(shí)施方案中,組合中的至少兩個(gè)修飾包含2’-o-甲基核苷酸和膦?;人狨ズ塑账衢g連接,2’-o-甲基核苷酸和膦酰基羧酸酯核苷酸間連接,2’-o-甲基核苷酸和硫代膦?;人狨ズ塑账衢g連接,2’-o-甲基核苷酸和硫代膦?;人狨ズ塑账衢g連接,或其組合。在其它實(shí)施方案中,組合中的修飾還包括2-硫尿嘧啶,2-硫代胞嘧啶,4-硫尿嘧啶,6-硫鳥嘌呤,2-氨基腺嘌呤,2-氨基嘌呤,假尿嘧啶,肌苷,7-脫氮鳥嘌呤,7-脫氮-8-氮雜鳥嘌呤,7-脫氮腺嘌呤,7-脫氮-8-氮雜腺嘌呤,5-甲基胞嘧啶,5-甲基尿嘧啶,5-羥甲基胞嘧啶,5-羥甲基尿嘧啶,5,6-脫氫尿嘧啶,5-丙炔基胞嘧啶,5-丙炔基尿嘧啶,5-乙炔基胞嘧啶,5-乙炔基尿嘧啶,5-烯丙基尿嘧啶,5-烯丙基胞嘧啶,5-氨基烯丙基-尿嘧啶,5-氨基烯丙基-胞嘧啶或無堿基核苷酸。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-o-甲基-3’-硫代磷酸酯。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-o-甲基-3’-膦?;宜狨?。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-o-甲基-3’-硫代膦?;宜狨ァT谝恍?shí)施方案中,組合中的至少一個(gè)修飾包括2’-鹵-3’-硫代磷酸酯。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包括2’-鹵-3’-膦酰基乙酸酯。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-鹵-3’-硫代膦?;宜狨?。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-氟-3’-硫代磷酸酯。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-氟-3’-膦?;宜狨?。在一些實(shí)施方案中,組合中的至少一個(gè)修飾包含2’-氟-3’-硫代膦酰基乙酸酯。至少兩個(gè)或三個(gè)修飾的可能組合分別示于圖6和圖7中,并通過提述并入本文。
在一些實(shí)施方案中,指導(dǎo)rna包含如式(iii)或式(iv)所示的寡核苷酸:
w-y-q(iii);或
y-w-x-q(iv)
其中q和w各自獨(dú)立地表示包含至少一個(gè)修飾的寡核苷酸的核苷酸或核苷酸段,且y和x各自獨(dú)立地表示寡核苷酸的未修飾部分。
在一些實(shí)施方案中,w在指導(dǎo)rna的5’部分內(nèi)。在一些實(shí)施方案中,w至少部分在指導(dǎo)rna的5’部分的前五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,w至少部分在指導(dǎo)rna的5’部分的前三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,w在指導(dǎo)rna的內(nèi)部區(qū)域(即5’端和3’端之間)內(nèi)。
在一些實(shí)施方案中,q在指導(dǎo)rna的3’部分內(nèi)。在一些實(shí)施方案中,q至少部分在指導(dǎo)rna的3’部分的最后五(5)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,q至少部分在指導(dǎo)rna的3’部分的最后三(3)個(gè)核苷酸內(nèi)。在一些實(shí)施方案中,q在指導(dǎo)rna的內(nèi)部區(qū)域(即5’端和3’端之間)內(nèi)。
在一些實(shí)施方案中,w包含如上所述的末端修飾,如5’端或3端修飾。在一些實(shí)施方案中,末端修飾包括二甲氧基三苯甲基。
在一些實(shí)施方案中,w或q的至少一個(gè)包含如上所述的修飾的堿基。在一些實(shí)施方案中,w或q中至少一個(gè)包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50個(gè)修飾的堿基。在一些實(shí)施方案中,w或q中至少一個(gè)包含多余一個(gè)修飾的堿基,如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)修飾的堿基。
在一些實(shí)施方案中,w或q的至少一個(gè)包含如上所述的修飾的糖。在一些實(shí)施方案中,w或q中至少一個(gè)包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50個(gè)修飾的糖。在一些實(shí)施方案中,w或q中至少一個(gè)包含多于一個(gè)修飾的糖,如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)修飾的糖。
在一些實(shí)施方案中,w或q的至少一個(gè)包含如上所述的修飾的主鏈(即磷酸二酯以外的核苷酸間連接)。在一些實(shí)施方案中,w或q中至少一個(gè)包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50個(gè)修飾的核苷酸間連接。在一些實(shí)施方案中,w或q中至少一個(gè)包含多于一個(gè),如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)修飾的糖。
在一些實(shí)施方案中,w或q的至少一個(gè)包含2’-o-甲基核苷酸,2’-f核苷酸,2’-氨基核苷酸,2’-脫氧核苷酸,2-硫尿苷核苷酸,2-氨基腺苷核苷酸,6-硫鳥苷核苷酸,5-甲基胞苷核苷酸,5-氨基烯丙基尿苷核苷酸,z核苷酸,3’-硫代磷酸酯核苷酸間連接,3’-硫代磷酸酯核苷酸間連接,3’-膦?;宜狨ズ塑账衢g連接,3’-膦?;宜狨ズ塑账衢g連接,3’-硫代膦酰基乙酸酯核苷酸間連接,3’-硫代膦?;宜狨ズ塑账衢g連接,3’-甲基膦酸酯核苷酸間連接,3’-硼烷膦酸酯核苷酸間連接,3’-二硫代磷酸酯核苷酸間連接或其組合。
在一些實(shí)施方案中,w或q的至少一個(gè)包含相同核苷酸上的2’-o-甲基和3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,w或q的至少一個(gè)包含相同核苷酸上的2’-o-甲基和3’-膦?;宜狨セ鶊F(tuán)連接。在一些實(shí)施方案中,w或q的至少一個(gè)包含相同核苷酸上的2’-o-甲基和3’-硫代膦?;宜狨セ鶊F(tuán)。在一些實(shí)施方案中,w或q的至少一個(gè)包含相同核苷酸上的2’-f和3’-硫代磷酸酯基團(tuán)。在一些實(shí)施方案中,w或q的至少一個(gè)包含相同核苷酸上的2’-f和3’-膦酰基乙酸酯基團(tuán)連接。在一些實(shí)施方案中,w或q的至少一個(gè)包含相同核苷酸上的2’-f和3’-硫代膦?;宜狨セ鶊F(tuán)。
在一些實(shí)施方案中,w或q中至少有一個(gè)包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)修飾的核苷酸。在一些實(shí)施方案中,w或q中的至少一個(gè)中的每個(gè)修飾的核苷酸都包含相同的一個(gè)或多個(gè)修飾。在一些實(shí)施方案中,w包含與q中的修飾的核苷酸不同的修飾核苷酸。在一些實(shí)施方案中,w或q的至少一個(gè)包含兩個(gè)或更多個(gè)修飾的核苷酸。在一些實(shí)施方案中,w或q的至少一個(gè)包含三個(gè)或更多個(gè)修飾的核苷酸。在一些實(shí)施方案中,由于一個(gè)或多個(gè)未修飾的核苷酸可能介于其間,所述修飾的核苷酸在序列上是不連續(xù)或者至少不完全連續(xù)排列的。在一些實(shí)施方案中,修飾的核苷酸連續(xù)排列。在一些實(shí)施方案中,w或q的至少一個(gè)包含至少一個(gè)修飾核苷酸的連續(xù)段。在一些實(shí)施方案中,w或q中的至少一個(gè)包含至少三(3)個(gè)修飾的核苷酸的連續(xù)段。在一些實(shí)施方案中,w或q中的至少一個(gè)包含至少四(4)個(gè)修飾的核苷酸的連續(xù)段。在一些實(shí)施方案中,w或q中的至少一個(gè)包含至少五(5)個(gè)修飾的核苷酸的連續(xù)段。
在一些實(shí)施方案中,指導(dǎo)rna包含如式(v)或式(vi)所示的核苷酸序列:
mmnnm’m’n’n’(式v);或
mmnnm’m’n’n’m”m”(式vi)
其中每個(gè)m獨(dú)立地表示修飾的核糖核苷酸;
其中每個(gè)n獨(dú)立地表示未修飾的核糖核苷酸;
其中每個(gè)m’獨(dú)立地表示修飾的核糖核苷酸;
其中每個(gè)n’獨(dú)立地表示未修飾的核糖核苷酸;
其中每個(gè)m”獨(dú)立地表示修飾的核糖核苷酸;
其中m為0至40的整數(shù),n為0至130的整數(shù),m’為0至10的整數(shù),n’為0至130的整數(shù),m”為0至10的整數(shù),條件是m+m’+m”大于或等于1且50<m+n+m’+n’+m”≤150。
在一些實(shí)施方案中,每個(gè)m獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸和2’-脫氧核苷酸。在一些實(shí)施方案中,每個(gè)m獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m獨(dú)立地選自下組:2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,當(dāng)m>1,任何給定的m與任何其他m是相同或不同的。在一些實(shí)施方案中,當(dāng)m>1,每個(gè)m包含相同的一個(gè)或多個(gè)修飾。
在一些實(shí)施方案中,每個(gè)m’獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸和2’-脫氧核苷酸。在一些實(shí)施方案中,每個(gè)m’獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’獨(dú)立地選自下組:2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,當(dāng)m’>1,任何給定的m’與任何其他m’是相同或不同的。在一些實(shí)施方案中,當(dāng)m’>1,每個(gè)m’包含相同的一個(gè)或多個(gè)修飾。
在一些實(shí)施方案中,每個(gè)m”獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸和2’-脫氧核苷酸。在一些實(shí)施方案中,每個(gè)m”獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m”獨(dú)立地選自下組:2’-o-甲基-3’-pace核糖核苷酸和2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,當(dāng)m”>1,任何給定的m”與任何其他m”是相同或不同的。在一些實(shí)施方案中,當(dāng)m’>1,每個(gè)m”包含相同的一個(gè)或多個(gè)修飾。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-pace核糖核苷酸;m選自1至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;n選自10至130的整數(shù);每個(gè)m’獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸,2’-脫氧核苷酸和z核苷酸;m’選自1至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;并且n’選自0至130的整數(shù)。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-p(s)核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是z核苷酸。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-硫代pace核糖核苷酸;m選自1至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;n選自10至130的整數(shù);每個(gè)m’獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸,2’-脫氧核苷酸和z核苷酸;m’選自1至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;并且n’選自0至130的整數(shù)。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-p(s)核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是z核苷酸。
在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-p(s)核糖核苷酸;m選自1至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;n選自10至130的整數(shù);每個(gè)m’獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸,2’-脫氧核苷酸和z核苷酸;m’選自1至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;且n’選自0至130的整數(shù)。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是2’-o-甲基-3’-p(s)核糖核苷酸。在一些實(shí)施方案中,每個(gè)m’是z核苷酸。
在一些實(shí)施方案中,每個(gè)m獨(dú)立地選自下組:2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸,2’-脫氧核苷酸和z核苷酸;m選自0至10的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;n選自10至15的整數(shù);每個(gè)m’是2’-o-甲基核糖核苷酸;m’選自1至5的整數(shù);每個(gè)n獨(dú)立地選自a、u、c和g;并且n’選自0至130的整數(shù)。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-硫代pace核糖核苷酸。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基核糖核苷酸。在一些實(shí)施方案中,每個(gè)m是2’-o-甲基-3’-p(s)核糖核苷酸。在一些實(shí)施方案中,m為0;n選自10至15的整數(shù),m’選自1至5的整數(shù);并且n’選自0至130的整數(shù)。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾是改變穩(wěn)定性的修飾。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾增加指導(dǎo)rna的核酸酶抗性,因此增強(qiáng)指導(dǎo)rna的穩(wěn)定性。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾是如上所述的增強(qiáng)穩(wěn)定性的修飾。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾是如上所述的改變特異性的修飾。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾改變r(jià)na堿基配對(duì)。在一些實(shí)施方案中,組合中的至少一個(gè)修飾降低如上所述的堿基配對(duì)相互作用的tm。在一些實(shí)施方案中,組合中的至少一個(gè)修飾提高如上所述的堿基配對(duì)相互作用的tm。
在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾改變指導(dǎo)rna的轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾提高指導(dǎo)rna的轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾降低指導(dǎo)rna的轉(zhuǎn)染效率。在一些實(shí)施方案中,組合中至少一種增加轉(zhuǎn)染的修飾包括膦?;宜狨ネ榛ズ塑账衢g連接,例如膦?;宜狨ゼ柞ズ塑账衢g連接。
在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾增強(qiáng)指導(dǎo)rna的穩(wěn)定性和特異性。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾增強(qiáng)指導(dǎo)rna的穩(wěn)定性和轉(zhuǎn)染效率。在一些實(shí)施方案中,相對(duì)于無修飾的指導(dǎo)rna,組合中的至少一個(gè)修飾增強(qiáng)指導(dǎo)rna的特異性和轉(zhuǎn)染效率。
在一些實(shí)施方案中,組合中的至少一個(gè)修飾改變指導(dǎo)rna的二級(jí)結(jié)構(gòu)。該修飾改變指導(dǎo)rna中任何rna/rna內(nèi)部雙鏈體的堿基配對(duì)。這些修飾中的一些增加rna/rna結(jié)構(gòu)的堿基配對(duì),或者增加rna/rna雙鏈體的tm,而其它修飾降低rna/rna雙鏈體或多個(gè)雙鏈體的堿基配對(duì)(或tm)。這些修飾包括堿基修飾的核苷酸,特別是una核苷酸,如2-硫尿苷和2-氨基腺苷對(duì),z/p核苷酸對(duì),isoc/isog對(duì),6-硫代g//5-甲基嘧啶對(duì),和如前所述的在糖或核苷酸間連接上具有修飾的核苷酸。
在一些實(shí)施方案中,組合包括至少一種修飾或一組修飾,其通過增加特異性(即減少脫靶效應(yīng))的至少一種修飾或一組修飾來增加核酸酶抗性(即穩(wěn)定性)。在一些實(shí)施方案中,組合包括至少一種修飾或一組修飾,其通過提高指導(dǎo)rna中一些堿基配對(duì)的tm的至少一種修飾或一組修飾來增加核酸抗性(即穩(wěn)定性)。在一些實(shí)施方案中,組合包括至少一種修飾或一組修飾,其通過降低指導(dǎo)rna的一些堿基配對(duì)的tm的至少一種修飾或一組修飾來增加核酸抗性(即穩(wěn)定性)。在一些實(shí)施方案中,組合包括增加核酸酶抗性(即穩(wěn)定性)的至少一種修飾或一組修飾,增加指導(dǎo)rna中的一些堿基配對(duì)的tm的至少一種修飾或一組修飾,以及降低指導(dǎo)rna中其他地方的一些堿基配對(duì)的tm的至少一種修飾或一組修飾。在一些實(shí)施方案中,組合包括增加核酸酶抗性(即穩(wěn)定性)的至少一種修飾或一組修飾以及增加指導(dǎo)rna與cas蛋白結(jié)合的至少一種修飾或一組修飾。在一些實(shí)施方案中,組合包括增加核酸酶抗性(即穩(wěn)定性)的至少一種修飾或一組修飾以及減少指導(dǎo)rna與cas蛋白結(jié)合的至少一種修飾或一組修飾。在一些實(shí)施方案中,指導(dǎo)rna包括不同類型的修飾的組合。
d.指導(dǎo)rna結(jié)構(gòu)
在一些實(shí)施方案中,指導(dǎo)rna能夠與crispr相關(guān)蛋白形成復(fù)合體。在一些實(shí)施方案中,crispr相關(guān)蛋白由crispr-casii型系統(tǒng)提供或衍生自crispr-casii型系統(tǒng),該系統(tǒng)具有rna引導(dǎo)的多核苷酸結(jié)合和/或核酸酶活性。在一些實(shí)施方案中,crispr相關(guān)蛋白是cas9,cas9突變體或cas9變體。在一些實(shí)施方案中,crispr相關(guān)蛋白是來自釀膿鏈球菌(streptococcuspyogenes)的cas9核酸酶。在一些實(shí)施方案中,crispr相關(guān)蛋白是來自嗜熱鏈球菌(streptococcusthermophilus)的cas9核酸酶。在一些實(shí)施方案中,crispr相關(guān)蛋白是來自金黃色葡萄球菌(staphylococcusaureus)的cas9核酸酶。在一些實(shí)施方案中,合成的指導(dǎo)rna或合成的指導(dǎo)rna:crispr相關(guān)蛋白復(fù)合體維持天然指導(dǎo)rna或不具有修飾的核苷酸的復(fù)合體的功能性。在一些實(shí)施方案中,功能性包括結(jié)合靶多核苷酸。在一些實(shí)施方案中,功能性包括切口靶多核苷酸。在一些實(shí)施方案中,功能性包括切割靶多核苷酸。在一些實(shí)施方案中,靶多核苷酸在體外核酸內(nèi)。在一些實(shí)施方案中,靶多核苷酸在體內(nèi)或體外的細(xì)胞的基因組內(nèi)(例如在培養(yǎng)的細(xì)胞或從生物體分離的細(xì)胞中)。在一些實(shí)施方案中,靶多核苷酸是dna中的前間區(qū)序列。
在一些實(shí)施方案中,crrna區(qū)段包含25至80個(gè)核苷酸。在一些實(shí)施方案中,crrna區(qū)段包含能夠與靶序列雜交的指導(dǎo)序列。在一些實(shí)施方案中,指導(dǎo)序列與靶序列或其一部分互補(bǔ)。在一些實(shí)施方案中,指導(dǎo)序列包含15至30個(gè)核苷酸。在一些實(shí)施方案中,crrna區(qū)段包含莖序列。在一些實(shí)施方案中,莖序列包含10至50個(gè)核苷酸。在一些實(shí)施方案中,crrna區(qū)段包含5’凸出序列。在一些實(shí)施方案中,5’凸出序列包含1至10個(gè)核苷酸,或者1至5個(gè)核苷酸,或者1、2或3個(gè)核苷酸。在一些實(shí)施方案中,crrna包含(i)能夠與靶序列雜交的指導(dǎo)序列和(ii)莖序列。在一些實(shí)施方案中,crrna包含(i)5’-凸出序列,(ii)能夠與靶序列雜交的指導(dǎo)序列,和(iii)莖序列。在其中所述crrna區(qū)段包含莖序列的某些實(shí)施方案中,tracrrna區(qū)段包含與所述crrna區(qū)段的莖序列部分或完全互補(bǔ)的核苷酸序列。在一些實(shí)施方案中,tracrrna區(qū)段還包含至少一個(gè)的雙鏈結(jié)構(gòu)。
在一些實(shí)施方案中,指導(dǎo)rna是單一指導(dǎo)rna。在一些實(shí)施方案中,指導(dǎo)rna是單一指導(dǎo)rna,其中crrna區(qū)段和tracrrna區(qū)段通過環(huán)l相連。在一些實(shí)施方案中,環(huán)l包含1、2、3、4、5、6、7、8、9、或10個(gè)核苷酸。在一些實(shí)施方案中,環(huán)l包含gnra的核苷酸序列,其中n表示a,c,g或u,r表示a或g。在一些實(shí)施方案中,環(huán)l包含gaaa的核苷酸序列。在一些實(shí)施方案中,指導(dǎo)rna包含多于一個(gè)環(huán)。
指導(dǎo)rna包含5’部分(即5’那一半)和3’部分(即3’那一半)。在一些實(shí)施方案中,crrna區(qū)段是tracrrna區(qū)段的5’(即上游)。在一些實(shí)施方案中,tracrrna區(qū)段相對(duì)于crrna區(qū)段為5’。
在一些實(shí)施方案中,指導(dǎo)rna包含至少兩個(gè)單獨(dú)的rna鏈,例如crrna鏈和分開的tracrrna鏈。參見例如圖5a。在一些實(shí)施方案中,每條鏈?zhǔn)前粋€(gè)或多個(gè)修飾的合成鏈。在一些實(shí)施方案中,所述鏈的至少一個(gè)是包含一個(gè)或多個(gè)修飾的合成鏈。在一些實(shí)施方案中,所述鏈共同作用來指導(dǎo)cas蛋白(如cas9)對(duì)靶多核苷酸的結(jié)合、切口或切割。在一些實(shí)施方案中,crrna序列和tracrrna序列位于分開的鏈上,并通過兩個(gè)互補(bǔ)序列相互雜交形成莖或雙鏈體。
在一些實(shí)施方案中,指導(dǎo)rna是包含crrna序列和tracrrna序列的單一指導(dǎo)rna。參見例如圖5b。在一些實(shí)施方案中,crrna序列和tracrrna序列通過環(huán)序列或“環(huán)”連接。在一些實(shí)施方案中,單一指導(dǎo)rna包含5’部分和3’部分,其中crrna序列在tracrrna序列的上游。
在一些實(shí)施方案中,兩個(gè)rna片段的總長度可為約50-220(例如約55-200、60-190、60-180、60-170、60-160、60-150、60-140、60-130和60-120)個(gè)核苷酸,例如長度為約60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、或220個(gè)核苷酸。類似地,單一指導(dǎo)rna(例如圖5b)長度可為約50-220(例如約55-200、60-190、60-180、60-170、60-160、60-150、60-140、60-130和60-120)個(gè)核苷酸,例如長度為約60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、或220個(gè)核苷酸。
如圖5a和5b所示,合成的指導(dǎo)rna包含(i)crrna序列,其包含(a)能夠與核酸中的靶序列雜交的指導(dǎo)序列(例如g1-gn區(qū)段,其中每個(gè)g表示指導(dǎo)序列中的核苷酸),(b)能夠部分或完全與第二莖序列雜交的第一莖序列(例如x1-xn區(qū)段,其中每個(gè)x表示第一莖序列中的核苷酸),和任選地(c)5’凸出序列(例如o1-on區(qū)段,其中每個(gè)o表示凸出序列中的核苷酸),和(ii)包含第二莖序列的tracrrna序列(例如y1-yn區(qū)段,其中每個(gè)y表示第二莖序列中的核苷酸)。tracrrna序列還包含t1-tn區(qū)段,其中每個(gè)t表示tracrrna序列中的核苷酸。圖5a中顯示的合成的指導(dǎo)rna包括一個(gè)或多個(gè)修飾。同樣,圖5b中所示的合成的指導(dǎo)rna包括一個(gè)或多個(gè)修飾。在一些實(shí)施方案中,修飾位于沿crrna,tracrrna或包含crrna區(qū)段、tracrrna區(qū)段和任選的環(huán)的單一指導(dǎo)rna的長度上的任何點(diǎn)。在一些實(shí)施方案中,在圖5a和5b中所示的合成的指導(dǎo)rna中由o,g,x,y或t表示的任何核苷酸可為修飾的核苷酸。圖5b中所示的指導(dǎo)rna表示這樣的單一指導(dǎo)rna(sgrna),其中crrna區(qū)段和tracrrna區(qū)段通過具有序列g(shù)nra的環(huán)連接,其中n表示a,c,g或u,且r表示a或g。
在一些實(shí)施方案中,指導(dǎo)rna的crrna區(qū)段長度為25-70(例如30-60,35-50或40-45)個(gè)核苷酸。在一些實(shí)施方案中,指導(dǎo)序列長度為12-30(例如16-25,17-20或15-18)個(gè)核苷酸。在一些實(shí)施方案中,crrna的5’部分不與靶序列雜交或僅部分雜交。例如,crrna區(qū)段上可有一個(gè)5’凸出。
在一些實(shí)施方案中,單一指導(dǎo)rna包含核心部分(centralportion),其包括crrna區(qū)段的莖序列,tracrrna區(qū)段的莖序列,以及任選的將crrna區(qū)段共價(jià)連接至tracrrna區(qū)段的環(huán)。在一些實(shí)施方案中,單一指導(dǎo)rna的核心區(qū)段長度為8-60(例如10-55,10-50或20-40)個(gè)核苷酸。
在一些實(shí)施方案中,指導(dǎo)rna的tracrrna區(qū)段長度為10-130(例如10-125,10-100,10-75,10-50或10-25)個(gè)核苷酸。在一些實(shí)施方案中,除了中心區(qū)段中的任何發(fā)夾或雙鏈結(jié)構(gòu)之外,tracrrna區(qū)段還包括一個(gè)或多個(gè)發(fā)夾或雙鏈結(jié)構(gòu)。
在一些實(shí)施方案中,與參考tracrrna,如天然存在的成熟tracrrna相比,tracrrna是截短的。已顯示出一系列長度在分離型(圖5a)和嵌合sgrna型(圖5b)二者中都起作用。例如,在一些實(shí)施方案中,tracrrna可從其3’端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40個(gè)核苷酸。在一些實(shí)施方案中,tracrrna分子可從其5’端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75或80個(gè)核苷酸。在一些實(shí)施方案中,tracrrna分子可從其5’端和3’端二者截短,例如從其5’端截短至少1、2、3、4、5、6、7、8、9、10、15或20個(gè)核苷酸且從其3’端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40個(gè)核苷酸。參見例如jinek等(2012)science,337,816-21;mali等(2013)science,339:6121,823-6;cong等(2013)science,339:6121,819-23;和hwang等(2013)nat.biotechnol.31:3,227-9;jinek等(2013)elife,2,e00471。在一些實(shí)施方案中,tracrrna是未截短的。
在一些實(shí)施方案中,本發(fā)明的修飾在crrna區(qū)段或tracrrna區(qū)段或二者中。在一些實(shí)施方案中,本發(fā)明的修飾在crrna區(qū)段的指導(dǎo)序列中。在一些實(shí)施方案中,本發(fā)明的修飾在crrna區(qū)段的莖序列中。在一些實(shí)施方案中,本發(fā)明的修飾在crrna區(qū)段的5’-凸出序列中。在一些實(shí)施方案中,本發(fā)明的修飾在tracrrna區(qū)段的莖序列中。在一些實(shí)施方案中,本發(fā)明的修飾在指導(dǎo)rna的環(huán)序列中。在一些實(shí)施方案中,本發(fā)明的修飾在指導(dǎo)rna的5’部分中。在一些實(shí)施方案中,本發(fā)明的修飾在指導(dǎo)rna的3’部分中。在一些實(shí)施方案中,本發(fā)明的修飾在指導(dǎo)rna的5’部分和指導(dǎo)rna的3’部分中。
e.指導(dǎo)rna的合成
在一些實(shí)施方案中,通過使用合成有機(jī)化學(xué)領(lǐng)域的化學(xué)合成生產(chǎn)包括單一指導(dǎo)rna(sgrna;參見圖1和5b)的指導(dǎo)rna。包含除四種主要核糖核苷酸(即a,c,g和u)以外的任何核苷酸(無論是非天然的還是天然的,如假尿苷,肌苷或脫氧核苷酸)的指導(dǎo)rna在與rna中四種主要核苷酸中的任何一個(gè)化學(xué)/結(jié)構(gòu)上不同的核苷酸處具有化學(xué)修飾或取代。
本文所述的合成的指導(dǎo)rna可化學(xué)合成。例如,合成的指導(dǎo)rna可使用tc化學(xué)通過dellinger等(2011)j.am.chem.soc.,133,11540,133,11540,美國專利8,202,983,以及美國專利申請(qǐng)2010/0076183a1,其內(nèi)容通過提述以其整體并入本文。“tc化學(xué)”是指通過硫羰氨基甲酸酯保護(hù)基團(tuán)使用2’-羥基模塊上保護(hù)的rna單體核苷酸前體的組合物和方法,以合成未修飾的rna或包含一個(gè)或多個(gè)修飾的核苷酸的修飾的rna。使用tc-rna化學(xué)法化學(xué)合成相對(duì)長的rna(長達(dá)200多個(gè)或更長)的能力使得能夠產(chǎn)生具有能夠超過由四種主要核糖核苷酸(a,c,g和u)所實(shí)現(xiàn)的特殊特征的指導(dǎo)rna。本文描述的一些合成的指導(dǎo)rna也可使用本領(lǐng)域已知的方法包括體外轉(zhuǎn)錄和基于細(xì)胞的表達(dá)來制備。例如,可將2’-氟ntp并入通過基于細(xì)胞的表達(dá)產(chǎn)生的合成的指導(dǎo)rna。
指導(dǎo)rna的合成也可通過rna序列的化學(xué)或酶促合成來實(shí)現(xiàn),其隨后通過酶連接在一起,或通過化學(xué)連接來進(jìn)行化學(xué)連接,包括但不限于溴化氰化學(xué)法,如r.kumar等(2007)j.am.chem.soc.,129,6859-64發(fā)表的“點(diǎn)擊”化學(xué),或如k.hill在標(biāo)題為“compositionsandmethodsforconjugatingoligonucleotides”的wo2013176844中所述的方酸綴合化學(xué)。
如下文進(jìn)一步描述的,本文公開的指導(dǎo)rna(包括那些包含修飾的核苷酸和/或修飾的核苷酸間連接的指導(dǎo)rna)可用于在體外或體內(nèi)執(zhí)行各種crispr介導(dǎo)的功能(包括但不限于編輯基因,調(diào)節(jié)基因表達(dá),切割靶序列,和結(jié)合靶序列),例如在無細(xì)胞測(cè)定中,在完整細(xì)胞中或在整個(gè)生物體中。對(duì)于體外或體內(nèi)應(yīng)用,rna可用本領(lǐng)域已知的任何方式遞送到細(xì)胞或整個(gè)生物體中。
文庫及陣列
一方面,本發(fā)明提供多個(gè)指導(dǎo)rna的組或文庫。在一些實(shí)施方案中,所述文庫包含兩種或更多種本文公開的指導(dǎo)rna。文庫可含有約10至約107個(gè)個(gè)體成員,例如約10至約102,約102至約103,約103至約105,約105至約107個(gè)成員。至少在指導(dǎo)序列中,文庫的個(gè)體成員與文庫的其他成員不同,即grna的dna靶向區(qū)段。另一方面,在一些實(shí)施方案中,文庫的每個(gè)個(gè)體成員可含有與文庫所有其他成員相同或基本相同的tracrrna區(qū)段的核苷酸序列。以這種方式,文庫可包含靶向一個(gè)或多個(gè)多核苷酸中的不同多核苷酸或不同序列的成員。
在一些實(shí)施方案中,文庫至少包含102個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫至少有103個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫至少包含104個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫至少包含105個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫至少包含106個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫至少包含107個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫至少針對(duì)10個(gè)不同的多核苷酸。在一些實(shí)施方案中,文庫靶向至少102種不同的多核苷酸。在一些實(shí)施方案中,文庫靶向至少103種不同的多核苷酸。在一些實(shí)施方案中,文庫靶向至少104種不同的多核苷酸。在一些實(shí)施方案中,文庫靶向至少105種不同的多核苷酸。在一些實(shí)施方案中,文庫靶向至少106種不同的多核苷酸。在一些實(shí)施方案中,文庫靶向至少107種不同的多核苷酸。
在一些實(shí)施方案中,文庫包含指導(dǎo)rna的集合,所述指導(dǎo)rna具有相同的序列并且在逐漸移動(dòng)跨越文庫成員序列的窗口中具有相同的修飾。在一些實(shí)施方案中,窗口總共覆蓋rna的全長。
在一些實(shí)施方案中,文庫允許進(jìn)行高通量、多靶標(biāo)基因組操作和分析。在一些實(shí)施方案中,僅有指導(dǎo)rna的dna靶向區(qū)段是變化的,而cas蛋白結(jié)合區(qū)段是相同的。在一些實(shí)施方案中,文庫的第一部分包含具有識(shí)別、結(jié)合和指導(dǎo)特定cas蛋白的cas結(jié)合區(qū)段的指導(dǎo)rna,而文庫的第二部分包含識(shí)別、結(jié)合和指導(dǎo)不同的cas蛋白(例如來自不同物種的cas蛋白)的不同的cas結(jié)合區(qū)段,由此允許文庫與兩種或更多種正交的cas蛋白共同起作用。在一些實(shí)施方案中,第一正交cas蛋白的誘導(dǎo)表達(dá)利用與第一正交cas蛋白相互作用的文庫部分。在一些實(shí)施方案中,第一和第二正交cas蛋白的誘導(dǎo)表達(dá)分別利用與第一和第二正交cas蛋白相互作用的文庫部分。在一些實(shí)施方案中,第一和第二正交cas蛋白的誘導(dǎo)表達(dá)在不同時(shí)間發(fā)生。因此,可通過專門操作或修飾文庫中指定的多個(gè)靶標(biāo)來進(jìn)行大規(guī)模的基因編輯或基因調(diào)控。
在一些實(shí)施方案中,文庫是“陣列排列”的文庫,即可尋址的排列中不同特征或特征庫的集合。例如,陣列的特征可被選擇性切割并轉(zhuǎn)移到微量滴定板,使得板中的每個(gè)孔含有已知特征或已知的特征庫。在一些其它實(shí)施方案中,文庫以48列或96列微量滴定板格式或384列板合成。
在一些實(shí)施方案中,本發(fā)明的指導(dǎo)rna的合成可在固體支持物上進(jìn)行,所述固體支持物具有化學(xué)實(shí)體可結(jié)合的表面。在一些實(shí)施方案中,正在合成的指導(dǎo)rna直接或間接附接至相同的固體支持物上并且可形成陣列的一部分?!瓣嚵小笔且阎獑误w序列的單獨(dú)分子的集合,每個(gè)分子以空間定義和物理尋址的方式排列,使得每個(gè)序列的定位是已知的。在本文中可互換使用的“陣列”或“微陣列”包括具有特定化學(xué)模塊或多個(gè)模塊(如配體,例如與該區(qū)域相關(guān)聯(lián)的生物聚合物,如多核苷酸或寡核苷酸序列(核酸),多肽(例如蛋白質(zhì)),糖類,脂質(zhì)等)的可尋址區(qū)的任何一維、二維或基本二維(以及三維)排列。當(dāng)陣列具有不同模塊的多個(gè)區(qū)域(例如不同的多核苷酸序列)時(shí),陣列是“可尋址的”,使得在陣列上特定預(yù)定位置(即“地址”)處的區(qū)(即陣列的“特征”)檢測(cè)特定的靶標(biāo)或一類靶標(biāo)(雖然特征可能附帶地檢測(cè)到該特征的非目標(biāo))。陣列特征通常是(但不一定要)通過間隔空間分隔的??砂陉嚵猩系奶卣鞯臄?shù)量主要由基底的表面積、特征的尺寸和特征之間的間隔決定。陣列可具有多達(dá)每cm2數(shù)十萬或更多的特征,例如2500至200,000特征/cm2的密度。這些特征可以或可以不共價(jià)地鍵合至基底。
合適的固體支持物可具有各種形式和組合物,并且衍生自天然存在的材料,已被合成修飾的天然存在的材料或合成材料。合適的支持材料的實(shí)例包括但不限于二氧化硅、硅和氧化硅、聚四氟乙烯、玻璃、多糖如瓊脂糖(例如來自pharmacia的
要在基底表面上合成的指導(dǎo)rna的初始單體可以結(jié)合至接頭,接頭又結(jié)合至表面親水基團(tuán),例如二氧化硅基底上存在的表面羥基模塊。在一些實(shí)施方案中,使用通用接頭。在一些其它實(shí)施方案中,初始單體直接與例如表面羥基模塊反應(yīng)?;蛘?,可以首先根據(jù)本發(fā)明合成指導(dǎo)rna,并在合成后通過本領(lǐng)域已知的任何方法附接至固體基底。因此,本發(fā)明可以用于制備指導(dǎo)rna的陣列,其中寡核苷酸在陣列上合成,或在合成后附接至陣列基底。隨后,指導(dǎo)rna或庫或多個(gè)指導(dǎo)rna庫可任選地和選擇性地從陣列基底切割并用作文庫或多個(gè)文庫。
iv.cas蛋白
如上所述,功能性crispr-cas系統(tǒng)還需要提供所需活性(例如靶結(jié)合或靶切口/切割)的蛋白組分(例如cas蛋白,其可為cas核酸酶)。在一些實(shí)施方案中,所需的活性是靶結(jié)合。在一些實(shí)施方案中,所需的活性是靶切口或靶切割。在一些實(shí)施方案中,所需的活性還包括如本文公開的與cas蛋白共價(jià)融合的多肽提供的功能。在一些實(shí)施方案中,所需的活性還包括如本文公開的與核酸酶缺陷型cas蛋白共價(jià)融合的多肽提供的功能。這種所需活性的實(shí)例包括如下所述的轉(zhuǎn)錄調(diào)節(jié)活性(激活或抑制),表觀遺傳修飾活性或靶標(biāo)可視化/鑒定活性。cas蛋白可作為純化或非純化的(i)cas蛋白或(ii)編碼用于表達(dá)cas蛋白的mrna或(iii)編碼用于表達(dá)所述蛋白的線性或環(huán)狀dna,而引入體外或體內(nèi)系統(tǒng)。提供cas蛋白的這三種方法中的任一種在本領(lǐng)域中是公知的,并且在本文中提及cas蛋白或cas蛋白的用途時(shí)可以互換地表示。在一些實(shí)施方案中,cas蛋白從mrna或dna組成型表達(dá)。在一些實(shí)施方案中,cas蛋白從mrna或dna的表達(dá)是可誘導(dǎo)或誘導(dǎo)型的。
在一些實(shí)施方案中,cas蛋白是化學(xué)合成的(參見例如creighton,“proteins:structuresandmolecularprinciples”,w.h.freeman&co.,ny,1983),或通過本文所述的重組dna技術(shù)產(chǎn)生。對(duì)于其他的指導(dǎo),技術(shù)人員可查詢frederickm.ausubel等,“currentprotocolsinmolecularbiology,”johnwiley&sons,2003;和sambrook等,“molecularcloning,alaboratorymanual,”coldspringharborpress,coldspringharbor,ny,2001)。
在一些實(shí)施方案中,cas蛋白以純化或分離的形式提供。在一些實(shí)施方案中,cas蛋白以約80%,約90%,約95%或約99%的純度提供。在一些實(shí)施方案中,cas蛋白作為組合物的一部分提供。在一些實(shí)施方案中,cas蛋白以適于用作或包含于rna指導(dǎo)核酸酶反應(yīng)的組合物的水性組合物提供。本領(lǐng)域技術(shù)人員清楚地知道可包括在此類核酸酶反應(yīng)組合物中的各種物質(zhì)。
在一些實(shí)施方案中,提供了一種cas蛋白作為重組多肽。在一些實(shí)例中,制備重組多肽作為融合蛋白。例如在一些實(shí)施方案中,編碼cas蛋白的核酸連接至編碼融合配偶體(例如谷胱甘肽-s-轉(zhuǎn)移酶(gst),6x-his表位標(biāo)簽或m13基因3蛋白)的另一核酸。合適的宿主細(xì)胞可用于表達(dá)融合蛋白。在一些實(shí)施方案中,通過本領(lǐng)域已知的方法分離融合蛋白。在一些實(shí)施方案中,可以通過例如酶促消化來進(jìn)一步處理融合蛋白,以除去融合配偶體并獲得cas蛋白?;蛘?,cas蛋白:指導(dǎo)rna復(fù)合體可使用本領(lǐng)域已知的宿主細(xì)胞系統(tǒng)或體外翻譯-轉(zhuǎn)錄系統(tǒng)以重組技術(shù)制備。此類系統(tǒng)和技術(shù)的細(xì)節(jié)可以見于例如wo2014144761,wo2014144592,wo2013176772,us20140273226和us20140273233中,其內(nèi)容通過提述以其整體并入本文。
野生型cas蛋白
在一些實(shí)施方案中,cas蛋白包含衍生自具有rna指導(dǎo)的多核苷酸結(jié)合和/或核酸酶活性的crispr-casi型,ii型或iii型系統(tǒng)的蛋白質(zhì)。合適的cas蛋白的非限制性實(shí)例包括cas3、cas4、cas5、cas5e(或casd)、cas6、cas6e、cas6f、cas7、cas8a1、cas8a2、cas8b、cas8c、cas9、cas10、cas10d、casf、casg、cash、csy1、csy2、csy3、cse1(或casa)、cse2(或casb)、cse3(或case)、cse4(或casc)、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csz1、csx15、csf1、csf2、csf3、csf4和cu1966。參見例如wo2014144761,wo2014144592,wo2013176772,us20140273226和us20140273233,其內(nèi)容通過提述以其整體并入本文。
在一些實(shí)施方案中,cas蛋白衍生自ii型crispr-cas系統(tǒng)。在一些實(shí)施方案中,cas蛋白是或衍生自cas9蛋白。在一些實(shí)施方案中,cas蛋白是或衍生自細(xì)菌cas9蛋白,包括wo2014144761中鑒定的那些。在一些實(shí)施方案中,cas蛋白是或衍生自鏈球菌屬菌種(streptococcussp.)或葡萄球菌屬菌種(staphylococcussp.)cas9蛋白。在一些實(shí)施方案中,cas蛋白是或衍生自嗜熱鏈球菌cas9蛋白。在一些實(shí)施方案中,cas蛋白是或衍生自釀膿鏈球菌cas9蛋白。在一些實(shí)施方案中,cas蛋白是或衍生自金黃色葡萄球菌cas9蛋白。在一些實(shí)施方案中,cas蛋白是或衍生自嗜熱鏈球菌cas9蛋白。
在一些實(shí)施方案中,野生型cas蛋白是cas9蛋白。在一些實(shí)施方案中,野生型cas9蛋白是來自釀膿鏈球菌(s.pyogenes)的cas9蛋白(seqidno:1)。在一些實(shí)施方案中,所述蛋白或多肽可包含seqidno:1的片段,或由seqidno:1的片段組成或基本上由其組成。
通常,cas蛋白包括與指導(dǎo)rna相互作用的至少一個(gè)rna結(jié)合域。在一些實(shí)施方案中,修飾cas蛋白以增加核酸結(jié)合親和力和/或特異性、改變酶活性和/或改變蛋白質(zhì)的其他特性。例如可修飾、突變、缺失或失活cas蛋白的核酸酶(即dna酶,rna酶)域。或者,可截短cas蛋白以除去對(duì)于蛋白功能非必需的域。在一些實(shí)施方案中,cas蛋白是截短或修飾的以優(yōu)化效應(yīng)物域的活性。在一些實(shí)施方案中,cas蛋白包括核定位序列(nls),其將帶nls標(biāo)簽的cas蛋白引入活細(xì)胞的核中。在一些實(shí)施方案中,cas蛋白包括兩個(gè)或更多個(gè)修飾。
突變體cas蛋白
在一些實(shí)施方案中,cas蛋白可為野生型cas蛋白(例如cas9)的突變體或其片段。在其它實(shí)施方案中,cas蛋白可衍生自突變體cas蛋白。例如,可修飾cas9蛋白的氨基酸序列以改變蛋白的一種或多種特性(例如核酸酶活性、結(jié)合親和力、對(duì)蛋白酶的穩(wěn)定性等)。或者,可從蛋白中消除不參與rna指導(dǎo)的切割的cas9蛋白的域,使得修飾的cas9蛋白小于野生型cas9蛋白。例如,減小cas9編碼序列的大小可使其適合轉(zhuǎn)染本不能容納野生型序列的載體,如aav載體及其他。在一些實(shí)施方案中,本發(fā)明的系統(tǒng)利用來自釀膿鏈球菌的cas9蛋白,如在細(xì)菌中編碼的或經(jīng)密碼子優(yōu)化用于在真核細(xì)胞中表達(dá)。下面顯示的是野生型釀膿鏈球菌cas9蛋白序列(seqidno.1,可獲取自www.uniprot.org/uniprot/q99zw2)的氨基酸序列。
mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd
cas9蛋白通常具有至少兩個(gè)核酸酶(例如dna酶)域。例如,cas9蛋白可具有ruvc樣核酸酶域和hnh樣核酸酶域。ruvc和hnh域一起運(yùn)作,在靶位點(diǎn)切斷雙鏈,使靶多核苷酸發(fā)生雙鏈斷裂。(jinek等,science,337:816-821)。在一些實(shí)施方案中,修飾突變體cas9蛋白以僅含有一個(gè)功能性核酸酶域(ruvc樣或hnh樣核酸酶域)。例如,在一些實(shí)施方案中,修飾突變體cas9蛋白,使得所述核酸酶域之一被缺失或突變,使得其不再起作用(即核酸酶活性不存在)。在其中一個(gè)核酸酶域是無活性的一些實(shí)施方案中,突變體能夠?qū)⑶锌谝腚p鏈多核苷酸(這種蛋白稱為“切口酶”),但不能切割雙鏈多核苷酸。例如,ruvc樣域中的天冬氨酸至丙氨酸(d10a)轉(zhuǎn)化將cas9衍生的蛋白轉(zhuǎn)化成切口酶。同樣地,在hnh域中的組氨酸至丙氨酸(h840a)的轉(zhuǎn)化將cas9衍生的蛋白轉(zhuǎn)化成切口酶。同樣地,在hnh域中的天冬酰胺至丙氨酸(n863a)的轉(zhuǎn)化將cas9衍生的蛋白轉(zhuǎn)化成切口酶。
在一些實(shí)施方案中,ruvc樣核酸酶域和hnh樣核酸酶域是修飾的或消除的,使得突變體cas9蛋白不能切口或切割靶多核苷酸。在一些實(shí)施方案中,cas9衍生蛋白的所有核酸酶域是修飾的或消除的,使得cas9衍生蛋白缺乏所有的核酸酶活性。在一些實(shí)施方案中,相對(duì)于野生型對(duì)應(yīng)物缺乏部分或全部核酸酶活性的cas9蛋白卻在更大或更小程度上維持靶標(biāo)識(shí)別活性。
在任何上述實(shí)施方案中,任何或全部核酸酶域可使用公知的方法(如定點(diǎn)誘變,pcr介導(dǎo)的誘變和總基因合成,以及本領(lǐng)域已知的其它方法)通過一個(gè)或多個(gè)缺失突變、插入突變和/或取代突變來失活。
在一些實(shí)施方案中,“cas突變體”或“cas變體”與seqidno:1至少為50%(例如50%至100%的任何數(shù)字,包括例如50%、60%、70%、80%、90%、95%、98%和99%)相同。在一些實(shí)施方案中,“cas突變體”或“cas變體”與rna分子(例如sgrna)結(jié)合。在一些實(shí)施方案中,“cas突變體”或“cas變體”通過rna分子靶向特定的多核苷酸序列。
融合蛋白
在一些實(shí)施方案中,cas蛋白融合至與cas蛋白異源的另一蛋白或多肽以產(chǎn)生融合蛋白。在一些實(shí)施方案中,異源序列包括一個(gè)或多個(gè)效應(yīng)物域,例如切割域、轉(zhuǎn)錄激活域,轉(zhuǎn)錄阻遏子域或表觀遺傳修飾域。效應(yīng)物域的其他實(shí)例包括核定位信號(hào)、細(xì)胞穿透或轉(zhuǎn)位域或標(biāo)記域。在一些實(shí)施方案中,效應(yīng)物域位于融合蛋白的n末端、c末端或內(nèi)部位置。在一些實(shí)施方案中,融合蛋白的cas蛋白是或衍生自cas9蛋白。在一些實(shí)施方案中,融合蛋白的cas蛋白是衍生自其中所有核酸酶域已被滅活或缺失的修飾的或突變的cas蛋白。在一些實(shí)施方案中,融合蛋白的cas蛋白是或衍生自缺乏核酸酶活性的修飾的或突變的cas蛋白。在一些實(shí)施方案中,cas蛋白的ruvc和/或hnh域是修飾或突變的,使得它們不再具有核酸酶活性。
切割域
在一些實(shí)施方案中,融合蛋白的效應(yīng)物域是切割域。如本文所用,“切割域”是指切割dna的域。切割域可從任何核酸內(nèi)切酶或核酸外切酶獲得??裳苌銮懈钣虻暮怂醿?nèi)切酶的非限制性實(shí)例包括限制性核酸內(nèi)切酶和歸巢核酸內(nèi)切酶(homingendonuclease)。參見例如newenglandbiolabscatalog或belfort等(1997)nucleicacidsres.25,3379-88。切割dna的其他酶是已知的(例如51核酸酶;綠豆核酸酶;胰腺dna酶i;微球菌核酸酶;酵母ho核酸內(nèi)切酶)。還參見linn等(編)“nucleases,”coldspringharborlaboratorypress,1993。這些酶中的一種或多種(或其功能性片段)可用作切割域的來源。
在一些實(shí)施方案中,切割域可衍生自ii-s型核酸內(nèi)切酶。ii-s型核酸內(nèi)切酶在通常距離核酸內(nèi)切酶的dna識(shí)別位點(diǎn)幾個(gè)堿基對(duì)的位點(diǎn)處特異性切割dna,因此具有可分離的識(shí)別和切割域。這些酶通常是瞬時(shí)締合形成二聚體以在交錯(cuò)位置切割dna的每條鏈的單體。合適的ii-s型核酸內(nèi)切酶的非限制性實(shí)例包括bfii、bpmi、bsai、bsgi、bsmbi、bsmi、bspmi、foki、mboli和sapi。在一些實(shí)施方案中,融合蛋白的切割域是foki切割域或其片段或衍生物。參見miller等(2007)nat.biotechnol.25,778-85;szczpek等(2007)nat.biotechnol.25,786-93;doyon等(2011)nat.methods,8,74-81。
轉(zhuǎn)錄激活域
在一些實(shí)施方案中,融合蛋白的效應(yīng)物域是轉(zhuǎn)錄激活域。通常,轉(zhuǎn)錄激活域與轉(zhuǎn)錄控制元件和/或轉(zhuǎn)錄調(diào)節(jié)蛋白(即轉(zhuǎn)錄因子,rna聚合酶等)相互作用以增加和/或激活基因的轉(zhuǎn)錄。在一些實(shí)施方案中,轉(zhuǎn)錄激活域是單純皰疹病毒vp16激活域,vp64(其是vp16的四聚體衍生物),nfκbp65激活域,p53激活域1和2,creb(camp響應(yīng)元件結(jié)合蛋白)激活域,e2a激活域或nfat(激活的t細(xì)胞的核因子)激活域。在一些實(shí)施方案中,轉(zhuǎn)錄激活域是gal4、gcn4、mll、rtg3、gln3、oaf1、pip2、pdr1、pdr3、pho4或leu3。轉(zhuǎn)錄激活域可為野生型,或者其可為原始轉(zhuǎn)錄激活域的修飾或截短的版本。
轉(zhuǎn)錄阻遏子域
在一些實(shí)施方案中,融合蛋白的效應(yīng)物域是轉(zhuǎn)錄阻遏子域。通常,轉(zhuǎn)錄阻遏子域與轉(zhuǎn)錄控制元件和/或轉(zhuǎn)錄調(diào)節(jié)蛋白(即轉(zhuǎn)錄因子,rna聚合酶等)相互作用以降低和/或阻止基因的轉(zhuǎn)錄。在一些實(shí)施方案中,轉(zhuǎn)錄阻遏子域是可誘導(dǎo)的camp早期阻遏因子(icer)域,kruppel相關(guān)盒a(krab-a)阻遏子域,yy1富含甘氨酸的阻遏子域,sp1樣阻遏子,e(spi)阻遏子,iκb阻遏子或mecp2。
表觀遺傳學(xué)修飾域
在一些實(shí)施方案中,融合蛋白的效應(yīng)物域是表觀遺傳修飾域。通常,表觀遺傳修飾域通過修飾組蛋白結(jié)構(gòu)和/或染色體結(jié)構(gòu)來改變基因表達(dá)。在一些實(shí)施方案中,表觀遺傳修飾域是組蛋白乙酰轉(zhuǎn)移酶域,組蛋白脫乙酰酶域,組蛋白甲基轉(zhuǎn)移酶域,組蛋白脫甲基酶域,dna甲基轉(zhuǎn)移酶域或脫甲基酶域。
其他域
在一些實(shí)施方案中,融合蛋白還包含至少一個(gè)其他域。合適的其他域的非限制性實(shí)例包括核定位信號(hào)(nls)、細(xì)胞穿透或轉(zhuǎn)位域和標(biāo)記域。nls通常包含一段堿性氨基酸。參見例如lange等(2007)j.biol.chem.,282,5101-5。例如,在一些實(shí)施方案中,nls是單一的序列,例如pkkkrkv(seqidno:2)或pkkkrrv(seqidno:3)。在一些實(shí)施方案中,nls是二分的序列。在一些實(shí)施方案中,nls是krpaatkkagqakkkk(seqidno:4)。
在一些實(shí)施方案中,融合蛋白包含至少一個(gè)細(xì)胞穿透域。在一些實(shí)施方案中,細(xì)胞穿透域是衍生自hiv-1tat蛋白的細(xì)胞穿透肽序列。例如,tat細(xì)胞穿透序列可為grkkrrqrrrppqpkkkrkv(seqidno:5)。在一些實(shí)施方案中,細(xì)胞穿透域是tlm(plssifsrigdppkkkrkv;seqidno:6),其是來源于人乙型肝炎病毒的細(xì)胞穿透肽序列。在一些實(shí)施方案中,細(xì)胞穿透域是mpg(galflgwlgaagstmgapkkkrkv;seqidno:7或galflgflgaagstmgawsqpkkkrkv;seqidno:8)。在一些實(shí)施方案中,細(xì)胞穿透域是pep-1(ketwwetwwtewsqpkkkrkv;seqidno:9),vp22,其是來自單純皰疹病毒的細(xì)胞穿透肽或聚精氨酸肽序列。
在一些實(shí)施方案中,融合蛋白包含至少一個(gè)標(biāo)記域。標(biāo)記域的非限制性實(shí)例包括熒光蛋白、純化標(biāo)簽和表位標(biāo)簽。在一些實(shí)施方案中,標(biāo)記域是熒光蛋白。合適的熒光蛋白的非限制性實(shí)例包括綠色熒光蛋白(例如gfp,gfp-2,taggfp,turbogfp,egfp,祖母綠(emerald),azamigreen,單體azamigreen,copgfp,acegfp,zsgreen1),黃色熒光蛋白(例如yfp,eyfp,citrine,venus,ypet,phiyfp,zsyellow1),藍(lán)色熒光蛋白(例如ebfp,ebfp2,azurite,mkalama1,gfpuv,sapphire,t-sapphire),青色熒光蛋白(例如ecfp,cerulean,cypet,amcyan1,midoriishi-cyan),紅色熒光蛋白(mkate,mkate2,mplum,dsred單體,mcherry,mrfp1,dsred-express,dsred2,dsred-單體,hcred-串聯(lián),hcred1,asred2,eqfp611,mrasberry,mstrawberry,jred),橙色熒光蛋白(morange,mko,kusabira-orange,單體kusabira-orange,mtangerine,tdtomato)和任何其它合適的熒光蛋白。在一些實(shí)施方案中,標(biāo)記域是純化標(biāo)簽和/或表位標(biāo)簽。例示性的標(biāo)簽包括但不限于谷胱甘肽-s-轉(zhuǎn)移酶(gst),殼多糖結(jié)合蛋白(cbp),麥芽糖結(jié)合蛋白,硫氧還蛋白(trx),聚(nanp),串聯(lián)親和純化(tap)標(biāo)簽,myc,acv5,au1,au5,e,ecs,e2,flag,ha,nus,softag1,softag3,strep,sbp,glu-glu,hsv,kt3,s,s1,t7,v5,vsv-g,6xhis,生物素羧基載體蛋白(bccp),和鈣調(diào)蛋白。
v.用途和方法
一方面,本發(fā)明提供用cas蛋白切割靶多核苷酸的方法。該方法包括使靶多核苷酸與如下接觸:(i)本文所述的指導(dǎo)rna或一組指導(dǎo)rna分子,和(ii)cas蛋白。在一些實(shí)施方案中,該方法導(dǎo)致靶多核苷酸中的雙鏈斷裂。在一些實(shí)施方案中,cas蛋白是具有單鏈切口活性的cas蛋白。在一些實(shí)施方案中,該方法導(dǎo)致靶多核苷酸中的單鏈斷裂。在一些實(shí)施方案中,將包含具有單鏈切口活性的指導(dǎo)rna和cas蛋白的復(fù)合體用于靶向序列的單鏈dna切割,即切口。
一方面,本發(fā)明提供了用cas蛋白切割兩種或更多種靶多核苷酸的方法。該方法包括使靶多核苷酸與如下接觸:(i)本文所述的一組指導(dǎo)rna分子,和(ii)cas蛋白。在一些實(shí)施方案中,該方法導(dǎo)致靶多核苷酸中的雙鏈斷裂。在一些實(shí)施方案中,cas蛋白是具有單鏈切口活性的cas蛋白。在一些實(shí)施方案中,該方法導(dǎo)致靶多核苷酸中的單鏈斷裂。在一些實(shí)施方案中,將包含具有單鏈切口活性的指導(dǎo)rna和cas蛋白質(zhì)的復(fù)合體用于靶向序列的單鏈dna切割,即切口。
一方面,本發(fā)明提供了將靶多核苷酸與cas蛋白結(jié)合的方法。該方法包括使靶多核苷酸與如下接觸:(i)本文所述的指導(dǎo)rna或一組指導(dǎo)rna分子和(ii)cas蛋白,以導(dǎo)致靶多核苷酸與cas蛋白的結(jié)合。在一些實(shí)施方案中,cas蛋白是cas變體。在一些實(shí)施方案中,cas變體相對(duì)于對(duì)應(yīng)的野生型cas蛋白缺乏部分或全部核酸酶活性。
一方面,本發(fā)明提供了將兩種或更多種靶多核苷酸與cas蛋白結(jié)合的方法。該方法包括使靶多核苷酸與如下接觸:(i)本文所述的一組rna分子和(ii)cas蛋白,以導(dǎo)致靶多核苷酸與cas蛋白的結(jié)合。在一些實(shí)施方案中,cas蛋白是cas變體。在一些實(shí)施方案中,cas變體相對(duì)于對(duì)應(yīng)的野生型cas蛋白缺乏部分或全部核酸酶活性。
一方面,本發(fā)明提供了將cas蛋白靶向靶多核苷酸的方法。該方法包括使cas蛋白與本文所述的指導(dǎo)rna或一組指導(dǎo)rna分子接觸。在一些實(shí)施方案中,該方法導(dǎo)致指導(dǎo)rna:cas蛋白復(fù)合體的形成。在一些實(shí)施方案中,cas蛋白是野生型cas9蛋白。在一些實(shí)施方案中,cas蛋白是cas9蛋白的突變體或變體。在一些實(shí)施方案中,cas蛋白是具有單鏈切口活性的cas蛋白。在一些實(shí)施方案中,cas蛋白是缺乏核酸酶活性的cas蛋白(例如cas蛋白的核酸酶缺陷型突變體)。在一些實(shí)施方案中,cas蛋白是融合蛋白(例如包含(i)cas蛋白和(ii)異源多肽的融合蛋白)的一部分。
一方面,本發(fā)明提供了將cas蛋白靶向兩種或更多種靶多核苷酸的方法。該方法包括使cas蛋白與本文所述的一組指導(dǎo)rna分子接觸。在一些實(shí)施方案中,該方法導(dǎo)致指導(dǎo)rna:cas蛋白復(fù)合體的形成。在一些實(shí)施方案中,cas蛋白是野生型cas9蛋白。在一些實(shí)施方案中,cas蛋白是cas9蛋白的突變體或變體。在一些實(shí)施方案中,cas蛋白是具有單鏈切口活性的cas蛋白。在一些實(shí)施方案中,cas蛋白是缺乏核酸酶活性的cas蛋白(例如cas蛋白的核酸酶缺陷型突變體)。在一些實(shí)施方案中,cas蛋白是融合蛋白(例如包含(i)cas蛋白或(ii)異源多肽的融合蛋白)的一部分。
在一些實(shí)施方案中,通過轉(zhuǎn)染將指導(dǎo)rna引入細(xì)胞。用于rna轉(zhuǎn)染的技術(shù)是本領(lǐng)域已知的,包括電穿孔和脂質(zhì)體轉(zhuǎn)染。rna轉(zhuǎn)染的有效技術(shù)主要取決于細(xì)胞類型。參見例如lujambio等(西班牙國家癌癥中心)cancerres.2007年2月,其描述了轉(zhuǎn)染htc-116結(jié)腸癌細(xì)胞,以及使用用于轉(zhuǎn)染可商業(yè)獲得的、修飾的mirna或前體mirna的oligofectamine(invitrogen)。還參見cho等(seoulnationaluniv.)nat.biotechnol.,2013年3月,其描述了k562細(xì)胞的轉(zhuǎn)染,并使用用于轉(zhuǎn)染轉(zhuǎn)錄的sgrna(約60個(gè)核苷酸長)的4dnucleofectiontm(lonza)電穿孔。用于轉(zhuǎn)染rna的技術(shù)也是本領(lǐng)域已知的。例如,治療性rna已被遞送入用invasin蛋白包覆的非病原性大腸桿菌(e.coli)中(以促進(jìn)攝取入表達(dá)β-1整聯(lián)蛋白的細(xì)胞),并且大腸桿菌被編碼以表達(dá)裂解溶血素(lysteriolysin)o成孔蛋白以允許shrna從大腸桿菌轉(zhuǎn)入細(xì)胞質(zhì)。還參見cho等(seoulnationaluniv.)nat.biotechnol.2013年3月。
在一些實(shí)施方案中,將指導(dǎo)rna引入或遞送到細(xì)胞中??捎糜谶f送指導(dǎo)rna的技術(shù)包括利用通過可生物降解的聚合物、脂質(zhì)體或納米顆粒進(jìn)行包封的那些。此類聚合物,脂質(zhì)體和納米顆??伸o脈內(nèi)遞送。在一些實(shí)施方案中,對(duì)于體內(nèi)遞送,可將指導(dǎo)rna注射到組織部位內(nèi)或全身給藥。體內(nèi)遞送也可通過β-葡聚糖遞送系統(tǒng)來實(shí)現(xiàn),如美國專利no.5,032,401和5,607,677以及美國公開no.2005/0281781中所述的那些,其內(nèi)容通過提述以其整體并入本文。在一些實(shí)施方案中,指導(dǎo)rna或含有指導(dǎo)rna的遞送介質(zhì)被靶向特定的組織或身體區(qū)室。例如,在一些實(shí)施方案中,為了將外源rna靶向其他組織,合成的載體用細(xì)胞特異性配體或適配體進(jìn)行裝飾,用于受體攝取,例如包裹在涂覆有peg的環(huán)糊精納米顆粒中的rna,并用人轉(zhuǎn)鐵蛋白功能化以通過在腫瘤細(xì)胞中高度表達(dá)的轉(zhuǎn)鐵蛋白受體進(jìn)行攝取。其它方法描述于下文或是本領(lǐng)域已知的。
本發(fā)明已經(jīng)在人細(xì)胞中進(jìn)行了測(cè)試,如hendel等,nat.biotechnol.(2015)33:9,985-9(其以其整體并入本申請(qǐng))。在引用的工作中,將修飾的指導(dǎo)rna引入k562細(xì)胞,人原代t細(xì)胞和cd34+造血干細(xì)胞和祖細(xì)胞(hspc)中。與未修飾的指導(dǎo)rna相比,修飾的指導(dǎo)rna顯著增強(qiáng)人細(xì)胞(包括人原代t細(xì)胞和cd34+hspc)中的基因組編輯效率。
圖11a和11b示出了實(shí)驗(yàn)結(jié)果,其顯示使用本文公開的合成和化學(xué)修飾的sgrna可通過高頻率的插入缺失或通過切割刺激的同源重組來實(shí)現(xiàn)人細(xì)胞系中的基因破壞。通過pcr擴(kuò)增子的深度測(cè)序(圖12a)或通過由cas9與合成sgrna組合誘導(dǎo)的k562細(xì)胞中的三個(gè)基因座il2rg、hbb和ccr5的hr的基因添加(圖12b)來測(cè)量誘變型nhej的基因破壞。合成的sgrna以每1百萬個(gè)細(xì)胞1μg(淺色陰影)或20μg(深色陰影)遞送。從質(zhì)粒(2μg)表達(dá)cas9,并對(duì)于hr實(shí)驗(yàn),包括5μg的編碼gfp的供體質(zhì)粒。作為陽性對(duì)照,使用2μg的編碼sgrna和cas9蛋白的sgrna質(zhì)粒(灰色條)。條表示平均值+s.e.m.,n=3。
圖12a、12b、12c和12d示出了實(shí)驗(yàn)結(jié)果,其顯示本文所述的化學(xué)修飾的sgrna可用于實(shí)現(xiàn)刺激的原代人t細(xì)胞和cd34+造血干細(xì)胞和祖細(xì)胞(hspc)中的基因破壞或靶向基因組編輯的高頻率。
圖12a示出了用10μg合成的ccr5sgrna和15μgcas9mrna或1μgcas9編碼質(zhì)粒核轉(zhuǎn)染的原代人t細(xì)胞的結(jié)果。納入了編碼sgrna和cas9蛋白的1μgsgrna質(zhì)粒用于比較。這些條代表三個(gè)不同供體的平均插入缺失頻率+s.e.m.,n=6,如通過跨越sgrna靶位點(diǎn)的pcr擴(kuò)增子的tide(通過分解的插入缺失追蹤)分析并使用模擬物處理的樣品作為對(duì)照參考來測(cè)量的。用未修飾或m修飾的sgrna和編碼sgrna和cas9二者的質(zhì)粒的核轉(zhuǎn)染遞送cas9mrna并沒有產(chǎn)生高于背景的等位基因修飾頻率。用cas9的dna表達(dá)質(zhì)粒共轉(zhuǎn)染msp修飾的sgrna,產(chǎn)生9.3%的插入缺失頻率。具有ms-或msp-修飾的sgrna的cas9mrna分別產(chǎn)生48.7%和47.9%的插入缺失頻率。
圖12b示出了刺激的t細(xì)胞的結(jié)果。細(xì)胞如上所述接受核轉(zhuǎn)染,但是用15μgcas9蛋白(其與2.5摩爾過量的所示合成的ccr5sgrnas復(fù)合)進(jìn)行的。插入缺失頻率通過tide分析加以測(cè)量。條表示三個(gè)不同供體的平均插入缺失頻率+s.e.m.,n=6。對(duì)于化學(xué)修飾的sgrna,當(dāng)與cas9蛋白復(fù)合遞送時(shí),觀察到ms修飾的sgrna相對(duì)于未修飾的sgrna的插入缺失頻率的2.4倍的改進(jìn)(30.7%對(duì)12.8%)。這些結(jié)果表明,當(dāng)與cas9蛋白復(fù)合遞送時(shí),化學(xué)修飾的sgrna可用于被刺激的t細(xì)胞的基因組編輯。
圖12c示出了人外周血cd34+hspc的結(jié)果。用10μg的靶向il2rg或hbb的指定合成sgrna和15μgcas9mrna或1μgcas9質(zhì)粒對(duì)50萬個(gè)動(dòng)員的(mobilized)細(xì)胞進(jìn)行核轉(zhuǎn)染。納入1μg編碼sgrna和cas9蛋白二者的sgrna質(zhì)粒用于比較。條表示平均插入缺失頻率+s.e.m.,n=3,如通過t7核酸內(nèi)切酶切割測(cè)定所測(cè)得的。當(dāng)用cas9mrna共轉(zhuǎn)染時(shí),使用未修飾的或m修飾的sgrna在任一位點(diǎn)處均未檢測(cè)到插入缺失。然而,il2rgms-和msp-修飾的sgrna分別顯示17.5%和17.7%的插入缺失頻率,而hbbms-和msp-修飾的sgrna則分別為23.4%和22.0%。
圖12d示出了受刺激的t細(xì)胞或感受態(tài)的人外周血cd34+hspc的結(jié)果。將100萬個(gè)細(xì)胞用15μgcas9mrna和10μg指定的合成的ccr5sgrna進(jìn)行核轉(zhuǎn)染。近期研究顯示,同時(shí)使用兩種sgrna能改進(jìn)人原代t細(xì)胞和cd34+hspc中的基因破壞。參見例如mandal等(2014)cellstemcell,15,643-52。ms-和msp-修飾的ccr5sgrna用mandal研究中報(bào)道的序列(稱為“d”和“q”)進(jìn)行化學(xué)合成,其切掉了205個(gè)堿基對(duì)。當(dāng)組合使用時(shí),每種sgrna的量為5μg。通過如上所述的tide分析測(cè)量具有單個(gè)sgrna的樣品的插入缺失頻率,并通過對(duì)克隆的pcr產(chǎn)物的測(cè)序來測(cè)量具有兩個(gè)sgrna的樣品的等位基因破壞頻率。條表示平均插入缺失頻率+s.e.m.,n=3。在t細(xì)胞中,單獨(dú)的‘d’sgrna分別對(duì)于ms-和msp-修飾的sgrna分別產(chǎn)生56.0%和56.3%的插入缺失,而‘q’sgrna則分別為62.6%和69.6%。當(dāng)組合使用時(shí),等位基因修飾的頻率增加,因?yàn)槲覀冇^察到ms-和msp-修飾的sgrna的插入缺失分別為73.9%和93.1%,其中大多數(shù)修飾事件是兩個(gè)sgrna靶位點(diǎn)之間的缺失。在cd34+hspc中,觀察結(jié)果是相似的,但總體頻率較低。對(duì)于‘d’sgrna,ms-和msp-修飾的sgrna的等位基因修飾頻率分別為9.8%和11.2%,而‘q’sgrna則分別為17.8%和19.2%。當(dāng)組合使用時(shí),ms-和msp-修飾的sgrna的頻率分別增加到37.8%和43.0%。這顯示使用兩種化學(xué)修飾的sgrna是促進(jìn)原代人t細(xì)胞和cd34+hspc中基因破壞的有效方法。
其他用途的實(shí)例包括如下所述的基因組編輯和基因表達(dá)調(diào)控。
基因組編輯
在一個(gè)方面,本發(fā)明提供用于在體內(nèi)或體外修飾dna序列的基因組編輯方法(“體外”包括但不限于無細(xì)胞系統(tǒng),細(xì)胞裂解物,細(xì)胞的分離組分,和活體外的細(xì)胞)。dna序列可包含染色體序列,附加體序列,質(zhì)粒,線粒體dna序列或功能性基因間序列,例如增強(qiáng)子序列或用于非編碼rna的dna序列。該方法包括使dna序列與如下接觸:(i)本文所述的指導(dǎo)rna或一組指導(dǎo)rna分子,和(ii)cas蛋白。在一些實(shí)施方案中,dna序列在細(xì)胞外接觸。在一些實(shí)施方案中,dna序列位于細(xì)胞內(nèi)的基因組中,并在體外或體內(nèi)接觸。在一些實(shí)施方案中,細(xì)胞在生物體或組織內(nèi)。在一些實(shí)施方案中,細(xì)胞是人細(xì)胞,非人哺乳動(dòng)物細(xì)胞,干細(xì)胞,非哺乳動(dòng)物脊椎動(dòng)物細(xì)胞,無脊椎動(dòng)物細(xì)胞,植物細(xì)胞,單細(xì)胞生物體或胚胎。在一些實(shí)施方案中,指導(dǎo)rna有助于將cas蛋白靶向dna序列中的靶位點(diǎn)。在一些實(shí)施方案中,cas蛋白在靶位點(diǎn)處切割dna序列的至少一條鏈。在一些實(shí)施方案中,cas蛋白在靶位點(diǎn)處切割dna序列的兩條鏈。
在一些實(shí)施方案中,該方法還包括將cas蛋白引入細(xì)胞或另一系統(tǒng)。在一些實(shí)施方案中,將cas蛋白引入純化或非純化的蛋白。在一些實(shí)施方案中,通過編碼cas蛋白的mrna引入cas蛋白。在一些實(shí)施方案中,通過編碼cas蛋白的線性或環(huán)狀dna引入cas蛋白。在一些實(shí)施方案中,細(xì)胞或系統(tǒng)包含cas蛋白或編碼cas蛋白的核酸。
在一些實(shí)施方案中,可通過易錯(cuò)的非同源末端連接(“nhej”)修復(fù)過程修復(fù)雙鏈斷裂。在一些實(shí)施方案中,雙鏈斷裂可通過同源性定向修復(fù)(hdr)過程進(jìn)行修復(fù),使得供體多核苷酸中的供體序列可整合至靶向的dna序列中或與靶向的dna序列交換。
在一些實(shí)施方案中,該方法還包括將至少一種供體多核苷酸引入細(xì)胞或系統(tǒng)。在一些實(shí)施方案中,供體多核苷酸包含與dna序列中靶位點(diǎn)任一側(cè)的序列具有基本序列同一性的至少一個(gè)同源序列。在一些實(shí)施方案中,供體多核苷酸包含可通過同源性定向修復(fù)(例如同源重組)整合至dna序列中或與dna序列交換的供體序列。
在一些實(shí)施方案中,供體多核苷酸包括上游同源序列和下游同源序列,其各自與分別定位于dna序列中靶位點(diǎn)的上游和下游的序列具有基本序列同一性。這些序列相似性允許例如供體多核苷酸和靶向的dna序列之間的同源重組,使得供體序列可整合入靶向的dna序列(或與其交換)。
在一些實(shí)施方案中,dna序列中的靶位點(diǎn)跨越或與突變相鄰,例如可能導(dǎo)致病癥或與病癥相關(guān)的點(diǎn)突變、轉(zhuǎn)位或倒置。在一些實(shí)施方案中,該方法包括通過向細(xì)胞或系統(tǒng)引入至少一種供體多核苷酸來校正突變,所述供體多核苷酸包含(i)突變的野生型對(duì)應(yīng)物和(ii)至少一個(gè)同源序列,其與dna序列中靶向位點(diǎn)的一側(cè)上的序列具有基本的序列同一性。在一些實(shí)施方案中,供體多核苷酸包含同源序列,其與dna序列中靶向位點(diǎn)的兩側(cè)上的序列具有基本的序列同一性。
在一些實(shí)施方案中,供體多核苷酸包含外源序列,其可通過同源性定向修復(fù)過程(如同源重組)整合至靶向的dna序列中或與靶向的dna序列交換。在一些實(shí)施方案中,外源序列包含蛋白編碼基因,其可操作性連接至外源啟動(dòng)子控制序列。因此,在一些實(shí)施方案中,在外源序列整合時(shí),細(xì)胞能表達(dá)由整合的基因編碼的蛋白。在一些實(shí)施方案中,將外源序列整合至靶向的dna序列中,使其在受體細(xì)胞或系統(tǒng)中的表達(dá)受外源啟動(dòng)子控制序列調(diào)控。將外源基因整合入靶向的dna序列稱為“敲入”。在其它實(shí)施方案中,外源序列可為轉(zhuǎn)錄控制序列,另一種表達(dá)控制序列,rna編碼序列等。
在一些實(shí)施方案中,供體多核苷酸包含與靶位點(diǎn)處或附近的dna序列的一部分基本相同但包含至少一個(gè)核苷酸變化的序列。例如,在一些實(shí)施方案中,供體序列包含在靶位點(diǎn)處或附近的dna序列的修飾或突變版本,使得在整合至靶向位點(diǎn)中或與靶向位點(diǎn)交換時(shí),靶向位點(diǎn)處的所得序列包含至少一個(gè)核苷酸變化。在一些實(shí)施方案中,至少一個(gè)核苷酸變化是一個(gè)或多個(gè)核苷酸的插入,一個(gè)或多個(gè)核苷酸的缺失,一個(gè)或多個(gè)核苷酸的取代,或其組合。作為修飾序列的整合的結(jié)果,細(xì)胞可從靶向的dna序列產(chǎn)生修飾的基因產(chǎn)物。
在一些實(shí)施方案中,這些方法適用于多重復(fù)合應(yīng)用。在一些實(shí)施方案中,該方法包括將指導(dǎo)rna文庫引入細(xì)胞或系統(tǒng)。在一些實(shí)施方案中,文庫包括至少100個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫包括至少1,000個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫包括至少10,000個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫包括至少100,000個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫包括至少1,000,000個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫靶向至少10個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)的至少10個(gè)不同的序列。在一些實(shí)施方案中,該文庫靶向至少100個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)至少100個(gè)不同的序列。在一些實(shí)施方案中,文庫靶向至少1,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)的至少1,000個(gè)不同的序列。在一些實(shí)施方案中,文庫靶向至少10,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)至少10,000個(gè)不同的序列。在一些實(shí)施方案中,文庫靶向至少100,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)至少100,000個(gè)不同的序列。在一些實(shí)施方案中,文庫靶向至少1,000,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)至少1,000,000個(gè)不同的序列。
人和哺乳動(dòng)物細(xì)胞中的基因編輯
本發(fā)明的實(shí)施方案可用于在哺乳動(dòng)物細(xì)胞中的基因組編輯以修飾靶多核苷酸(例如dna序列)方法。
在一些實(shí)施方案中,dna序列是染色體序列。在一些實(shí)施方案中,dna序列是蛋白編碼序列。在一些實(shí)施方案中,dna序列是功能性的基因間序列,如增強(qiáng)子序列或非編碼序列。在一些實(shí)施方案中,dna是人基因的一部分。在一些此類實(shí)施方案中,人基因是網(wǎng)格蛋白輕鏈(clta1)基因,人白細(xì)胞介素2受體γ(il2rg)基因,人細(xì)胞毒性t淋巴細(xì)胞相關(guān)蛋白4(clta4)基因,人原鈣粘附蛋白α4(pcdha4)基因,人鋸齒形同源異型盒1(en1)基因),人血紅蛋白β(hbb)基因,其可攜帶引起鐮狀細(xì)胞性貧血和地中海貧血的突變,或人趨化因子(c-c基序)受體5(ccr5)基因,其編碼hiv的共同受體。
在一些實(shí)施方案中,哺乳動(dòng)物細(xì)胞是人細(xì)胞。在一些此類實(shí)施方案中,人細(xì)胞是原代人細(xì)胞。在另外的實(shí)施方案中,原代人細(xì)胞是人原代t細(xì)胞。人原代t細(xì)胞可為受刺激或未刺激的。在一些實(shí)施方案中,人細(xì)胞是干/祖細(xì)胞,如cd34+造血干細(xì)胞和祖細(xì)胞(hspc)。在一些實(shí)施方案中,人細(xì)胞來自培養(yǎng)的細(xì)胞系,例如可商購獲得。例示的細(xì)胞系包括k562細(xì)胞,人骨髓性白血病系。
在一些實(shí)施方案中,細(xì)胞在活體內(nèi)。在一些其他實(shí)施方案中,細(xì)胞在活體外。
該方法包括使dna序列與如下接觸:(i)本文所述的指導(dǎo)rna或一組指導(dǎo)rna分子,和(ii)cas蛋白。
在一些實(shí)施方案中,該方法還包括將指導(dǎo)rna引入或遞送至細(xì)胞中。在一些此類實(shí)施方案中,通過轉(zhuǎn)染將指導(dǎo)rna引入細(xì)胞。用于rna轉(zhuǎn)染的技術(shù)是本領(lǐng)域已知的,包括電穿孔和脂質(zhì)轉(zhuǎn)染。在其它實(shí)施方案中,通過核轉(zhuǎn)染將指導(dǎo)rna引入細(xì)胞(并且更具體而言為細(xì)胞核)中。用于核轉(zhuǎn)染的技術(shù)是本領(lǐng)域已知的,并且可利用核轉(zhuǎn)染裝置,例如lonzanucleofector2b或lonza4d-nucleofector及相關(guān)試劑。
在一些實(shí)施方案中,該方法還包括將cas蛋白引入或遞送至細(xì)胞中。在一些此類實(shí)施方案中,將cas蛋白作為純化的或非純化的蛋白質(zhì)而引入。在其它實(shí)施方案中,通過編碼cas蛋白的mrna引入cas蛋白。在一些這樣的實(shí)施方案中,通過轉(zhuǎn)染將編碼cas蛋白的mrna引入細(xì)胞。在其它實(shí)施方案中,通過核轉(zhuǎn)染將編碼cas蛋白的mrna引入細(xì)胞(并且更具體而言為細(xì)胞核)中。
在一些實(shí)施方案中,該方法采用基于核糖核蛋白(rnp)的遞送方式,使cas蛋白以與指導(dǎo)rna的復(fù)合體形式引入細(xì)胞中。例如,cas9蛋白可與指導(dǎo)rna復(fù)合于cas9:grna復(fù)合體中,這允許共同遞送grna和cas蛋白。例如,可將cas:grna復(fù)合體核轉(zhuǎn)染入細(xì)胞中。
在一些實(shí)施方案中,該方法采用全rna遞送平臺(tái)。例如,在一些此類實(shí)施方案中,將指導(dǎo)rna和編碼cas蛋白的mrna同時(shí)或基本上同時(shí)(例如通過共轉(zhuǎn)染或共核轉(zhuǎn)染)引入細(xì)胞。在一些實(shí)施方案中,與casmrna和未修飾的grna的共同遞送相比,casmrna和修飾的grna的共同遞送導(dǎo)致更高的編輯頻率。具體地,與未修飾的grna相比,具有整合于3個(gè)末端核苷酸的5’和3’端二者的2’-o-甲基-3’-硫代磷酸酯(ms)或2’-o-甲基-3’-硫代pace(msp)的grna提供更高的編輯頻率。
在一些實(shí)施方案中,將指導(dǎo)rna和編碼cas蛋白的mrna序貫地引入細(xì)胞;也就是說,指導(dǎo)rna和編碼cas蛋白的mrna在不同時(shí)間引入細(xì)胞。每個(gè)試劑的引入之間的時(shí)間可在幾分鐘(或更少)至幾小時(shí)或幾天的范圍內(nèi)。例如,在一些此類實(shí)施方案中,首先遞送grna,然后在4、8、12或24小時(shí)后遞送casmrna。在其它此類實(shí)施方案中,首先遞送casmrna,然后在4、8、12或24小時(shí)后遞送grna。在一些具體實(shí)施方案中,首先遞送修飾的grna,隨后遞送casmrna,導(dǎo)致與遞送未修飾的grna的隨后遞送casmrn相比更高的編輯頻率。
在一些實(shí)施方案中,將grna與編碼cas蛋白的dna質(zhì)粒一起引入細(xì)胞。在一些此類實(shí)施方案中,通過核轉(zhuǎn)染將grna和編碼cas蛋白的dna質(zhì)粒引入細(xì)胞。在一些具體實(shí)施方案中,基于rnp的遞送平臺(tái)或全rna遞送平臺(tái)在原代細(xì)胞中提供比基于dna質(zhì)粒的遞送系統(tǒng)更低的細(xì)胞毒性。
在一些實(shí)施方案中,該方法顯著增強(qiáng)人細(xì)胞(包括人原代t細(xì)胞和cd34+hspc)中的基因組編輯效率。
在一些實(shí)施方案中,相對(duì)于未修飾的grna,修飾的grna增加插入缺失(indel)的頻率,這可指示誘變的nhej和基因破壞。具體地,相對(duì)于未修飾的grna,具有整合于3個(gè)末端核苷酸的5’和3’端二者處的2’-o-甲基-3’-硫代磷酸酯(ms)或2’-o-甲基-3’-硫代pace(msp)的修飾的grna增加了插入缺失的頻率。
在一些實(shí)施方案中,與未修飾的grna和casmrna的共同遞送相比,將修飾的grna和casmrna共同遞送至人原代t細(xì)胞中增加了插入缺失的頻率。具體地,相對(duì)于未修飾的grna,具有整合于3個(gè)末端核苷酸的5’和3’端二者處的2’-o-甲基-3’-硫代磷酸酯(ms)或2’-o-甲基-3’-硫代pace(msp)的修飾的grna增加了人類原代t細(xì)胞中插入缺失的頻率。
在一些實(shí)施方案中,修飾的grna相對(duì)于未修飾的grna改進(jìn)grna的穩(wěn)定性。作為一個(gè)實(shí)例,具有整合于3個(gè)末端核苷酸的5’和3’端二者處的2’-o-甲基(m)的grna適度地改進(jìn)針對(duì)核酸酶的穩(wěn)定性,并且相對(duì)于未修飾的grna還改進(jìn)堿基配對(duì)熱穩(wěn)定性。作為另一個(gè)實(shí)例,相對(duì)于未修飾的grna,具有整合于3個(gè)末端核苷酸的5’和3’端二者處的2’-o-甲基-3’-硫代磷酸酯(ms)或2’-o-甲基-3’-硫代pace(msp)的grna顯著提高了針對(duì)核酸酶的穩(wěn)定性。預(yù)期grna末端修飾增強(qiáng)針對(duì)外切核酸酶的細(xì)胞內(nèi)穩(wěn)定性,這使得當(dāng)casmrna和grna共同遞送或序貫遞送到人細(xì)胞中時(shí),能夠增加基因組編輯的功效。
在一些實(shí)施方案中,修飾的grna刺激基因打靶,其又通過例如同源重組或nhej進(jìn)行基因編輯。具體地,具有整合于3個(gè)末端核苷酸的5’和3’端二者處的2’-o-甲基-3’-硫代磷酸酯(ms)或2’-o-甲基-3’-硫代pace(msp)的grna,刺激比未修飾的grna更高水平的同源重組。
在一些實(shí)施方案中,修飾的grna保留高度特異性。在一些實(shí)施方案中,與未修飾的grna相比,修飾的grna的中靶對(duì)脫靶的插入缺失頻率之比是改進(jìn)的。在一些實(shí)施方案中,與基于dna質(zhì)粒的遞送系統(tǒng)相比,在具有cas蛋白的rnp復(fù)合體中遞送的修飾的grna提供了顯著更佳的中靶:脫靶比率。
基因表達(dá)調(diào)控
在一些實(shí)施方案中,本文所述的指導(dǎo)rna用于調(diào)節(jié)目的基因的轉(zhuǎn)錄或表達(dá)。例如,在一些實(shí)施方案中,使用包含cas蛋白(例如核酸酶缺陷型cas9)和轉(zhuǎn)錄激活因子多肽的融合蛋白來增加基因的轉(zhuǎn)錄。類似地,在一些實(shí)施方案中,使用包含cas蛋白(例如核酸酶缺陷型cas9)和阻遏因子多肽的融合蛋白通過干擾基因的轉(zhuǎn)錄來敲低基因表達(dá)。
在至少一個(gè)方面,本發(fā)明提供在體內(nèi)或體外調(diào)控目的基因表達(dá)的方法。該方法包括將細(xì)胞或另一系統(tǒng)引入(i)本文所述的合成的指導(dǎo)rna,和(ii)融合蛋白。在一些實(shí)施方案中,融合蛋白包含cas蛋白和效應(yīng)物域,如轉(zhuǎn)錄激活域,轉(zhuǎn)錄阻遏子域或表觀遺傳修飾域。在一些實(shí)施方案中,融合蛋白包含突變的cas蛋白,例如作為無效核酸酶的cas9蛋白。在一些實(shí)施方案中,cas蛋白含有一個(gè)或多個(gè)突變,如d10a、h840a和/或n863a。
在一些實(shí)施方案中,將融合蛋白作為純化或非純化的蛋白引入細(xì)胞或系統(tǒng)。在一些實(shí)施方案中,通過編碼融合蛋白的mrna將融合蛋白引入細(xì)胞或系統(tǒng)。在一些實(shí)施方案中,通過編碼融合蛋白的線性或環(huán)狀dna將融合蛋白引入細(xì)胞或系統(tǒng)。
在一些實(shí)施方案中,指導(dǎo)rna有助于將融合蛋白導(dǎo)向包含染色體序列,附加體序列,質(zhì)粒,線粒體dna序列或功能性基因間序列的特異性靶多核苷酸,例如增強(qiáng)子或非編碼rna的dna序列。在一些實(shí)施方案中,效應(yīng)物域調(diào)控靶多核苷酸序列的表達(dá)??梢栽O(shè)計(jì)用于調(diào)節(jié)基因表達(dá)的指導(dǎo)rna以靶向任何所需的內(nèi)源基因或編碼功能性rna的序列。可以在內(nèi)源基因的轉(zhuǎn)錄起始位點(diǎn)附近選擇基因組靶序列,或者在內(nèi)源基因的翻譯起始位點(diǎn)附近選擇基因組靶序列。在一些實(shí)施方案中,靶序列位于傳統(tǒng)上稱為基因的“啟動(dòng)子近端”區(qū)的dna區(qū)中。在一些實(shí)施方案中,靶序列位于轉(zhuǎn)錄起始位點(diǎn)上游大約1000個(gè)堿基對(duì)至轉(zhuǎn)錄起始位點(diǎn)下游約1000個(gè)堿基對(duì)的區(qū)中。在一些實(shí)施方案中,靶序列遠(yuǎn)離用于基因轉(zhuǎn)錄的起始位點(diǎn)(例如在另一個(gè)染色體上)。
在一些實(shí)施方案中,這些方法適用于多重復(fù)合應(yīng)用。在一些實(shí)施方案中,該方法包括將指導(dǎo)rna文庫引入細(xì)胞或系統(tǒng)。在一些實(shí)施方案中,文庫包含至少100個(gè),至少1,000個(gè),至少10,000個(gè),至少100,000個(gè),或至少1,000,000個(gè)唯一的指導(dǎo)序列。在一些實(shí)施方案中,文庫靶向至少10個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)至少10個(gè)不同的序列。在一些實(shí)施方案中,文庫針對(duì)至少100個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)至少100個(gè)不同的序列。在一些實(shí)施方案中,文庫針對(duì)至少1,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)的至少1,000個(gè)不同的序列。在一些實(shí)施方案中,文庫靶向至少10,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)的至少10,000個(gè)不同序列。在一些實(shí)施方案中,文庫靶向至少100,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)的至少100,000個(gè)不同的序列。在一些實(shí)施方案中,文庫針對(duì)至少1,000,000個(gè)不同的多核苷酸或一個(gè)或多個(gè)多核苷酸內(nèi)的至少1,000,000個(gè)不同的序列。
試劑盒
一方面,本發(fā)明提供含有用于執(zhí)行上述方法的試劑的試劑盒,包括產(chǎn)生grna:cas蛋白復(fù)合體和/或支持其對(duì)于結(jié)合、切口或切割靶多核苷酸的活性。在一些實(shí)施方案中,本文公開的方法中的一種或多種反應(yīng)組分,例如一種或多種指導(dǎo)rna和cas蛋白可以試劑盒的形式提供使用。在一些實(shí)施方案中,試劑盒包含cas蛋白或編碼cas蛋白的核酸,以及本文所述的一種或多種指導(dǎo)rna或指導(dǎo)rna的集合或文庫。在一些實(shí)施方案中,試劑盒包括一個(gè)或多個(gè)其他反應(yīng)組分。在一些實(shí)施方案中,在一個(gè)或多個(gè)容器中提供適量的一種或多種反應(yīng)組分或保持在基底上。
試劑盒的其它組分的實(shí)例包括但不限于一種或多種不同的聚合酶,一種或多種宿主細(xì)胞,用于將外來核酸引入宿主細(xì)胞的一種或多種試劑,用于檢測(cè)指導(dǎo)rna和/或casmrna或蛋白的表達(dá)或用于驗(yàn)證靶核酸的狀態(tài)的一種或多種試劑(例如探針或pcr引物),以及用于反應(yīng)的緩沖液、轉(zhuǎn)染試劑或培養(yǎng)基(以1倍或更多濃縮形式)。在一些實(shí)施方案中,試劑盒包括一個(gè)或多個(gè)以下組分:生化和物理支持物;終止、修飾和/或消化試劑;滲透劑(osmolyte);和用于反應(yīng)、轉(zhuǎn)染和/或檢測(cè)的裝置。
所使用的反應(yīng)組分可以各種形式提供。例如,組分(例如酶,rna,探針和/或引物)可懸浮在水溶液中或與珠粒結(jié)合或作為冷凍干燥的或凍干的粉末或沉淀物。在后一種情況下,組分在重建時(shí)形成組分的完全混合物用于測(cè)定。本發(fā)明的試劑盒可以任何合適的溫度提供。例如,為了將含有蛋白質(zhì)組分或其復(fù)合體的試劑盒儲(chǔ)存在液體中,優(yōu)選將它們提供并保持在低于0℃,優(yōu)選為約-20℃,可能在含有甘油或其它合適的防凍劑的抗凍溶液中。
試劑盒或系統(tǒng)可以含有足以用于至少一個(gè)測(cè)定的量的、任何組合的本文所述組分。在一些應(yīng)用中,一個(gè)或多個(gè)反應(yīng)組分可以預(yù)先測(cè)量的單次使用量在單獨(dú)的、通常為一次性的管或相當(dāng)?shù)娜萜髦刑峁?。通過這樣的布置,可通過將靶核酸或含有靶核酸的樣品或細(xì)胞直接添加到各個(gè)管中來進(jìn)行rna指導(dǎo)的核酸酶反應(yīng)。試劑盒中提供的組分的量可為任何適當(dāng)?shù)牧浚⒖扇Q于產(chǎn)品所針對(duì)的市場。其中供應(yīng)組分的容器可為能夠保持供應(yīng)形式的任何常規(guī)容器,例如微量離心管、微量滴定板,安瓿,瓶、或整體測(cè)試裝置,例如流體裝置,筒,橫向流或其他類似裝置。
試劑盒還可包括用于容納容器或容器組合的包裝材料。用于此類試劑盒和系統(tǒng)的典型包裝材料包括將反應(yīng)組分或檢測(cè)探針保持在各種配置(例如在小瓶,微量滴定板孔,微陣列等中)中的固體基質(zhì)(例如玻璃,塑料,紙,箔,微粒等)。試劑盒還可包括以有形形式記錄的用于使用組分的說明。
實(shí)施例
實(shí)施例1
為了評(píng)估化學(xué)合成的指導(dǎo)rna靶向和切割dna靶序列的能力,開發(fā)了體外切割測(cè)定。簡而言之,如圖3所示,通過制備型pcr擴(kuò)增質(zhì)粒攜帶的人序列(這里是來自人網(wǎng)格蛋白輕鏈clta基因的序列)制備~4-kb的pam可尋址dna靶標(biāo)。以20μl的反應(yīng)體積,在50nmsgrna、39nm重組純化的cas9蛋白(釀膿鏈球菌;agilent)和10mmmgcl2(ph7.6)的存在下,將50f摩爾的線性化dna靶標(biāo)在37℃溫育30分鐘。完成后,加入0.5μl的rnaceit(agilent),并在37℃繼續(xù)溫育5分鐘,然后在70℃溫育15分鐘。隨后加入0.5μl蛋白酶k(mol.bio.grade,neb),并在37℃溫育15分鐘。將等分試樣加載到dna7500labchip中,并在bioanalyzer2200上進(jìn)行分析。檢查(workup)步驟用于從與靶dna的結(jié)合釋放cas9,分析其用于切割。
化學(xué)合成了如圖4所示的一系列指導(dǎo)性rna。簡言之,合成單個(gè)rna鏈,并進(jìn)行hplc純化。所有寡核苷酸均通過hplc分析和全長鏈純度通過質(zhì)譜分析基于化學(xué)純度批準(zhǔn)進(jìn)行質(zhì)量控制。將這些指導(dǎo)rna中的每一個(gè)設(shè)計(jì)為靶向人clta基因。
結(jié)果示于圖4。如圖4的表1所示,除化學(xué)合成的指導(dǎo)rna的一個(gè)之外,所有化學(xué)合成的指導(dǎo)rna以顯著的切割速率靶向和切割clta編碼的dna靶序列。所述一個(gè)例外是“clta_37_脫氧”指導(dǎo)rna,其在其5’端具有37個(gè)脫氧核糖核苷酸的連續(xù)序列。
如本文所公開的,在指導(dǎo)rna的序列中的特定位置處測(cè)試了各種化學(xué)修飾。令人驚訝的是,指導(dǎo)rna(亦稱指導(dǎo)rna中的間隔序列)的指導(dǎo)序列中的測(cè)試位置容許測(cè)試的大多數(shù)修飾,包括指導(dǎo)rna中單個(gè)核苷酸內(nèi)的多個(gè)修飾的組合,即使是當(dāng)靶結(jié)合序列中的修飾實(shí)體化(instantiated)時(shí)。
結(jié)果表明,在特定位置含有修飾的指導(dǎo)rna是被活性cas蛋白和grna:cas蛋白復(fù)合體容許的,因?yàn)樾揎棽荒芊乐拱卸嗪塑账岬陌刑禺愋郧懈?。在圖4的表1中列出的所有指導(dǎo)rna序列中,5’端的前20個(gè)核苷酸與靶dna中的靶序列互補(bǔ)。經(jīng)測(cè)試并發(fā)現(xiàn)在特定位置可容許的修飾包括2’-o-甲基核糖核苷酸(=2’ome),2’-脫氧核糖核苷酸,外消旋硫代磷酸酯核苷酸間連接(=p(s)),3’-膦酰基乙酸酯(=pace),3’-硫代膦?;宜狨?=硫代pace),z核苷酸及其組合。
預(yù)期本文公開和測(cè)試的化學(xué)修飾,特別是在測(cè)試位置(如圖4的表1中所列)處的化學(xué)修飾會(huì)在多種指導(dǎo)rna中的等同位置處是容許的。在一些實(shí)施方案中,本文公開和測(cè)試的化學(xué)修飾在指導(dǎo)rna中的任何位置處都是容許的。
如本文所公開的,將化學(xué)修飾的核苷酸整合入指導(dǎo)rna中以圖改善一些特性。這些特性包括改進(jìn)的指導(dǎo)rna的核酸酶抗性,降低的grna:cas蛋白復(fù)合體的脫靶效應(yīng)(也稱為改進(jìn)的特異性),切割、切口或結(jié)合靶多核苷酸時(shí)改進(jìn)的grna:cas蛋白復(fù)合體的功效,改進(jìn)的轉(zhuǎn)染效率,和/或改進(jìn)的細(xì)胞器定位如核定位。
雖然已知使用修飾的rna(例如在某些應(yīng)用中阻止核酸分解降解),但眾所周知,不能簡單地在rna序列中的任何或所有位置整合入修飾,并期望其起作用,特別是當(dāng)rna序列需要與蛋白或酶復(fù)合以發(fā)揮某些功能時(shí)。因此,這些指導(dǎo)rna是否能容許各種核苷酸位置處的化學(xué)修飾同時(shí)在crispr-cas系統(tǒng)中執(zhí)行充分或改進(jìn)的功能,是不可預(yù)測(cè)的。實(shí)際上,指導(dǎo)rna能容忍實(shí)體化和測(cè)試的程度的具體修飾,特別是在測(cè)試的幾個(gè)位置處,這是預(yù)料不到的。
實(shí)施例2
為了評(píng)估化學(xué)合成的指導(dǎo)rna靶向和切割dna靶序列的能力,使用與實(shí)施例1中所述類似的體外切割測(cè)定。靶dna構(gòu)建體用于人dna靶標(biāo)(來自人網(wǎng)格蛋白輕鏈(clta1)基因,人白細(xì)胞介素2受體γ(il2rg)基因,人細(xì)胞毒性t淋巴細(xì)胞相關(guān)蛋白4(clta4)基因,人原癌黏附蛋白α4(pcdha4)基因,和人鋸齒形同源異型盒1(en1)基因),連同與靶dna有一個(gè)或多個(gè)核苷酸不同的脫靶dna構(gòu)建體。
表3示出了指導(dǎo)rna構(gòu)建體及其序列,以及用于評(píng)估那些指導(dǎo)rna構(gòu)建體靶向和切割的能力的dna構(gòu)建體。在表3中列出的所有指導(dǎo)rna序列中,5’端的前20個(gè)核苷酸與靶dna中的靶序列互補(bǔ)。中靶構(gòu)建體包含20個(gè)核苷酸靶序列。脫靶構(gòu)建體包含與靶dna相同的20個(gè)核苷酸的大多數(shù),其有1、2或3個(gè)核苷酸差異。因此,指導(dǎo)rna基本上但不完全與脫靶構(gòu)建體的序列互補(bǔ)。脫靶構(gòu)建體基于已知出現(xiàn)在人基因組中的基因序列。
表3中的dna靶標(biāo)構(gòu)建體具有如下序列:
在20μl的反應(yīng)體積中,在50nmsgrna,39nm重組純化的cas9蛋白(釀膿鏈球菌;agilent)和10mm或0.8mmmgcl2(ph7.6)的存在下,將50f摩爾線性化dna靶標(biāo)在37℃溫育30分鐘。完成后,加入0.5μl的rnaceit(agilent),并在37℃繼續(xù)溫育5分鐘,然后在70℃溫育15分鐘。隨后加入0.5μl蛋白酶k(mol.bio.級(jí),neb),并在37℃溫育15分鐘。將等分試樣加載到dna1000或dna7500labchip中,并在bioanalyzer2200上進(jìn)行分析,或者將其加載到genomicdnascreentape中,并在tapestation上進(jìn)行分析。檢查步驟用于從與靶dna的結(jié)合釋放cas9,測(cè)定其用于切割。切割產(chǎn)量/得率通過以下公式計(jì)算:a/(a+b)×100,其中a是兩個(gè)裂解產(chǎn)物的條帶強(qiáng)度的總和,而b是剩余的未切割的dna(如果存在的話)。100%的切割百分比意味著所有靶dna構(gòu)建體都被切割。
化學(xué)合成了一系列指導(dǎo)rna。根據(jù)dellinger等(2011)j.am.chem.soc.,133,11540-56中描述的程序,使用2’-o-硫羰氨基甲酸酯(2’-o-thionocarbamate)保護(hù)的核苷亞磷酰胺,在abi394合成儀(lifetechnologies,carlsbad,ca,usa)上合成指導(dǎo)rna寡聚物。在與2’-o-硫羰氨基甲酸酯保護(hù)的亞磷酰胺相同的條件下將2’-o-甲基亞磷酰胺摻入rna寡聚物中。用于合成硫代膦?;宜狨?硫代pace)修飾的rna的2’-o-甲基-3’-o-(二異丙基氨基)膦基乙酸-1,1-二甲基氰乙基酯-5’-o-二甲氧基三苯甲基核苷基本上根據(jù)發(fā)表的方法來合成。參見dellinger等(2003)j.am.chem.soc.,125,940–50;和threlfall等(2012)org.biomol.chem.,10,746-54。對(duì)于含硫代磷酸酯的寡聚物,偶聯(lián)反應(yīng)后的碘氧化步驟用硫化步驟代替,其使用3-((n,n-二甲基氨基亞甲基)氨基)-3h-1,2,4-二噻唑-5-硫酮在吡啶-乙腈(3:2)混合物中的0.05m溶液進(jìn)行6分鐘。
使用反相高效液相色譜(hplc)純化所有寡核苷酸,并通過使用agilent1290infinity系列l(wèi)c系統(tǒng)與agilent6520q-tof(渡越時(shí)間(time-of-flight))質(zhì)譜儀(agilenttechnologies,santaclara,ca,usa)聯(lián)用進(jìn)行液相色譜-質(zhì)譜(lc-ms)來分析。使用從lc-ms衍生的總離子色譜圖獲得的質(zhì)譜的去卷積來估計(jì)sgrna的合成和純化的產(chǎn)率。100-聚體sgrna的化學(xué)合成通常從標(biāo)稱的1微摩爾級(jí)合成產(chǎn)生25-35%全長產(chǎn)物。使用離子配對(duì)緩沖條件的反相hplc純化通常從粗制品中給出20%的產(chǎn)率,最終sgrna的估計(jì)純度在90%至95%的范圍內(nèi)。
結(jié)果示于表4中?!埃グ星懈睢北硎颈磺懈畹陌衐na構(gòu)建體的百分比。實(shí)驗(yàn)用或不用添加摩爾過量的與靶dna潛在競爭的無靶標(biāo)競爭物dna(tcdna)進(jìn)行,因此可看出添加的非特異性dna對(duì)測(cè)定的潛在影響。
表4
結(jié)果表明,在特定位置含有修飾的指導(dǎo)rna可被活性cas蛋白和grna:cas蛋白復(fù)合體容許,因?yàn)樵撔揎棽荒芊乐怪邪卸嗪塑账岬陌刑禺愋郧懈?。測(cè)試并發(fā)現(xiàn)在特定位置被容許的修飾包括2’-o-甲基核糖核苷酸(=2’ome),2’-脫氧核糖核苷酸,外消旋硫代磷酸酯核苷酸間連接,3’-膦?;宜狨?=pace),3’-硫代膦?;宜狨?=硫代pace),z核苷酸,2-硫尿嘧啶,2-氨基腺嘌呤,5-甲基尿嘧啶,與cy5熒光團(tuán)偶聯(lián)的5-氨基烯丙基尿嘧啶,2-(4-丁基酰胺熒光素)丙烷-1,3-二醇雙(磷酸二酯)接頭,及其組合。
預(yù)期本文公開和測(cè)試的化學(xué)修飾,特別是在測(cè)試位置(如表3和4所列的)處的化學(xué)修飾,會(huì)在多種指導(dǎo)rna中的等同位置處被容許。
如本文所公開的,將化學(xué)修飾的核苷酸整合入指導(dǎo)rna中以圖改進(jìn)某些特性。這些特性包括改進(jìn)的指導(dǎo)rna的核酸酶抗性(也稱為改進(jìn)的穩(wěn)定性),減少的grna:cas蛋白復(fù)合體的脫靶效應(yīng)(也稱為改進(jìn)的特異性),改進(jìn)的grna:cas蛋白復(fù)合體在切割、切口或結(jié)合靶多核苷酸時(shí)的功效,改進(jìn)的轉(zhuǎn)染效率和/或改進(jìn)的細(xì)胞器定位。
表3和表4中的測(cè)定結(jié)果表明:(1)在指導(dǎo)rna中,許多位置可容許多種化學(xué)修飾;(2)指導(dǎo)rna的5’和3’端可容許多種末端保護(hù)修飾,這些修飾可用于抑制核酸外切rna降解;(3)2-硫代u可用于抑制涉及g-u搖擺配對(duì)的脫靶相互作用,從而通過抑制脫靶雜交相互作用增加指導(dǎo)配對(duì)的特異性;(4)5’鹽酸通常是容許良好的;(5)指導(dǎo)rna的表面暴露區(qū)(從公開的晶體結(jié)構(gòu)推斷)容許廣泛的從u至5-甲基u的修飾,這潛在地使修飾的rna更可能排除免疫響應(yīng)如被未修飾的rna刺激;和(6)對(duì)于rna折疊,g-c對(duì)比a-u對(duì)更強(qiáng)且更穩(wěn)定。至少有一個(gè)指導(dǎo)rna能夠容許用比未修飾的a-u對(duì)更熱力學(xué)穩(wěn)定的2’-o-甲基a-2’-o-甲基u對(duì)來代替一些g-c對(duì)。
更具體地,本實(shí)施例顯示在雙指導(dǎo)rna(如表3和4中的條目12所示)和單指導(dǎo)rna(條目143-146、169-170)的5’和3’端容許2’-o-甲基修飾,從而允許末端保護(hù)來穩(wěn)定grna以抵抗核酸外切酶。2’-o-甲基修飾在大多數(shù)但非全部內(nèi)部位置處被容許,從而允許針對(duì)包括核酸內(nèi)切酶(條目146,153-168,174-179)在內(nèi)的各種核酸酶的穩(wěn)定化。然而,本實(shí)施例還表明,并不是指導(dǎo)rna中的每個(gè)位置都容許2’-o-甲基(如條目151-152和171-173所示),表明5’末端處太多連續(xù)的2’-o-甲基修飾(例如26個(gè)以上連續(xù)的2’-o-甲基修飾的核苷酸)或5’末端20聚體指導(dǎo)序列下游(3’)的c和u核苷酸的過多2’-o-甲基修飾是不太容許的(例如在條目154-156中測(cè)試的位置所揭示的,在條目171-173中的序列位置+56和+69處的2’-o-甲基尿嘧啶的一個(gè)或兩個(gè)的抑制作用)。
本實(shí)施例顯示,在體外在含有10mmmg2+的緩沖液中使用期間(條目146),整個(gè)20聚體指導(dǎo)序列中的2’-o-甲基修飾是可容許的,但是在存在于細(xì)胞中時(shí),在生理?xiàng)l件下這樣廣泛的修飾是不太容許的(條目147-150)。因此,在一些實(shí)施方案中,整個(gè)20聚體指導(dǎo)序列中包含15個(gè)或更多個(gè),或者17個(gè)或更多個(gè),或者18個(gè)或更多個(gè),或者20個(gè)2’-o-甲基修飾的grna用于本文所述的體外方法,例如基因組編輯以體外修飾dna序列,調(diào)節(jié)目的基因的體外表達(dá),體外切割dna靶序列等用途。
本實(shí)施例顯示2’-脫氧基修飾的廣泛并入是不太容許的并且可基本上完全抑制(條目180-182)。然而,2’-脫氧基修飾在一些位置可良好地被容許(條目183),因此這種修飾可用于抑制核酸酶。
本實(shí)施例還顯示,在crispr-cas9指導(dǎo)rna中的三個(gè)已知莖環(huán)的每個(gè)環(huán)中,熒光團(tuán)或染料標(biāo)記是容許的(條目116)。這些標(biāo)記在指導(dǎo)序列上的5’凸出中也是容許的(條目114),在sgrna中的其他位置是容許的(條目114),并且在雙指導(dǎo)應(yīng)用中使用的tracrrna的環(huán)中是容許的(條目11)。在本實(shí)施例中,測(cè)試了兩種不同類型的熒光團(tuán):基本上代替核苷酸的磷酸二酯連接的熒光團(tuán)(無核糖環(huán))(條目114和116),和共價(jià)偶聯(lián)至指導(dǎo)rna中并入的5-氨基烯丙基u的染料標(biāo)記(cy5)(條目11)。
本實(shí)施例還顯示z堿基在合成的指導(dǎo)rna中是容許的,特別是作為對(duì)其中一些c被z堿基替代的合成的指導(dǎo)rna的修飾(條目290-291)。本實(shí)施例還表明,如表3和4所示,一些其它堿基在多個(gè)位置處是容許的。
本實(shí)施例進(jìn)一步顯示指導(dǎo)rna的5’和3’端可容許多個(gè)末端保護(hù)修飾。這樣的修飾可用于抑制外切核酸分解性rna降解。對(duì)這種修飾的容忍性的支持可見于hendel等,nat.biotechnol.(2015)33:9,985-9中。表3和4中的條目143-144、185-223、241-257、258-266和272-279提供了對(duì)指導(dǎo)rna的5’和3’端的修飾的額外的支持。在一些實(shí)施方案中,指導(dǎo)rna在5’端或3’端或5’和3’端包含7個(gè)或更少的修飾的核苷酸,或者是6個(gè)或更少,或者5個(gè)或更少,或者4個(gè)或更少,或者3個(gè)或更少,或者2個(gè)或更少,或者1個(gè)??深愃频乇Wo(hù)雙指導(dǎo)rna(條目12-15)。
本實(shí)施例進(jìn)一步表明,2-硫代u可用于阻止涉及g-u搖擺配對(duì)的脫靶相互作用,從而通過抑制脫靶雜交相互作用增加指導(dǎo)序列配對(duì)的特異性(條目16-39)。參與指導(dǎo)rna與clta1脫靶3(也稱為“clta1off3-靶標(biāo)”或“clta1off3”)之間的雜交的堿基對(duì)之一是g-u搖擺對(duì)。用2-硫代u替代指導(dǎo)rna中的對(duì)應(yīng)的u將切割從100%(條目8)降低到59%(條目39)。用2-硫代u替換其他u(例如在序列位置+3或+9處,條目23和31)不具有相同的效果,推測(cè)是因?yàn)檫@些u與測(cè)試的脫靶位點(diǎn)的每一個(gè)完全雜交時(shí)不參與g-u搖擺配對(duì)。因此,當(dāng)脫靶位點(diǎn)參與g-u搖擺配對(duì)時(shí),2-硫代u能增加指導(dǎo)rna的靶特異性。
本實(shí)施例還顯示附接于指導(dǎo)序列的5’-凸出序列通常是良好地被容許的(參見條目83-95、114和206-223)。例如,在5’端的大體積二甲氧基三苯甲基(dmt)基團(tuán)是良好地被容許的(條目95)。dmt的色譜特性可用于促進(jìn)從合成過程中通常產(chǎn)生的不完全加長的副產(chǎn)物純化出全長合成rna。因此,在一些實(shí)施方案中,合成的指導(dǎo)rna包含5’凸出序列,例如,包含與指導(dǎo)序列互補(bǔ)的15個(gè)或更少核苷酸的短多核苷酸序列,并且通過聚合物接頭(如多核苷酸或類似的基于磷酸二酯的接頭)在其3’端共價(jià)連接至指導(dǎo)序列的5’端,其中接頭可為5個(gè)或更多個(gè)(或者6或7個(gè))連續(xù)的尿苷核苷酸。
本實(shí)施例還顯示指導(dǎo)rna的表面暴露區(qū)(從他人發(fā)表的晶體結(jié)構(gòu)推斷)容許廣泛修飾尿嘧啶核苷酸為5-甲基尿嘧啶(5-甲基u)(條目288),其可使修飾的rna更有可能排除免疫反應(yīng),如被未經(jīng)修飾的rna刺激。具體地,合成的指導(dǎo)rna的5’和3’端是潛在的免疫刺激性的,并且本實(shí)施例顯示5’和3’端容許5-甲基u修飾(條目288)。
本實(shí)施例還顯示,合成的指導(dǎo)rna可容許用2’-o-甲基a-2’-o-甲基u對(duì)替代一些g-c對(duì),前者比未修飾的a-u對(duì)在熱力學(xué)上更穩(wěn)定(參見條目292-293中的非末端-2’-o-甲基u和互補(bǔ)-2’-o-甲基a修飾)。這是有利的,因?yàn)橐阎獙?duì)于折疊的rna,g-c對(duì)比a-u對(duì)更強(qiáng)且更穩(wěn)定。在合成的指導(dǎo)rna中用這種熱穩(wěn)定的a-u對(duì)替代g-c對(duì)允許通過防止涉及非所欲的g-c對(duì)的錯(cuò)誤折疊結(jié)構(gòu)來改進(jìn)活性結(jié)構(gòu)的折疊,如可通過常用的rna折疊算法預(yù)測(cè)的。
例示性實(shí)施方案
根據(jù)本公開主題提供的例示性實(shí)施例包括但不限于權(quán)利要求和如下實(shí)施方案:
a1.一種合成的指導(dǎo)rna,其包含:
crrna區(qū)段,其包含(i)能夠與靶序列雜交的指導(dǎo)序列,(ii)莖序列;和
tracrrna區(qū)段,其包含與所述莖序列部分或完全互補(bǔ)的核苷酸序列,
其中所述合成的指導(dǎo)rna包含至少一個(gè)修飾的核苷酸,且其中所述合成的指導(dǎo)rna具有g(shù)rna功能性。
a2.實(shí)施方案a1的合成的指導(dǎo)rna,其包含2’-脫氧基模塊。
a3.實(shí)施方案a1或a2的合成的指導(dǎo)rna,其包含選自下組的2’-鹵素模塊:2’-氟,2’-氯,2’-溴和2’-碘。
a4.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含硫代磷酸酯基團(tuán)。
a5.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含pace基團(tuán)。
a6.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含硫代pace基團(tuán)。
a7.實(shí)施方案a2-a6任一項(xiàng)合成的指導(dǎo)rna,其包含2’-o-甲基模塊。
a8.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含2-硫尿嘧啶。
a9.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含4-硫尿嘧啶。
a10.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含2-氨基腺嘌呤。
a11.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含次黃嘌呤。
a12.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含5-甲基胞嘧啶。
a13.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含5-甲基尿嘧啶。
a14.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含5-氨基烯丙基-尿嘧啶。
a15.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含z核糖核苷酸。
a16.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含z脫氧核糖核苷酸。
a17.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含方酸綴合物。
a18.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含染料接頭。
a19.實(shí)施方案18的合成的指導(dǎo)rna,其中所述染料接頭是2-(4-丁基酰胺熒光素)丙烷-1,3-二醇雙(磷酸二酯)接頭。
a20.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含具有2’-o-甲基和3’-硫代磷酸酯的核苷酸。
a21.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含具有2’-o-甲基和3’-pace的核苷酸。
a22.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含具有2’-o-甲基和3’-硫代pace的核苷酸。
a23.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含具有2’-脫氧基和3’-pace的核苷酸。
a24.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含5-甲基胞苷。
a25.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含甲基膦酸酯。
a26.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含pace的酯,其中所述酯任選為甲酯。
a27.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含單一rna鏈,所述單一rna鏈包含crrna區(qū)段和tracrrna區(qū)段二者。
a28.實(shí)施方案a1-a26任一項(xiàng)的合成的指導(dǎo)rna,其包含兩條rna鏈,且crrna區(qū)段和tracrrna區(qū)段在不同的rna鏈中。
a29.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在各rna鏈的5’端、3’端、或5’端和3’端二者處包含修飾的核苷酸。
a30.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在指導(dǎo)序列中包含修飾的核苷酸。
a31.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在指導(dǎo)序列的5’包含修飾的核苷酸。
a32.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在莖序列中包含修飾的核苷酸。
a33.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在骨架區(qū)中包含修飾的核苷酸。
a34.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在骨架區(qū)中包含至少一個(gè)非天然、正交堿基對(duì),其中所述堿基對(duì)獨(dú)立地選自isog–isoc和z堿基–p堿基。
a35.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含2’-氨基基團(tuán)。
a36.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含二硫代磷酸酯連接基團(tuán)。
a37.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含硼烷膦酸酯連接基團(tuán)。
a38.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含非鎖核酸修飾(ulna)。
a39.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含鎖核酸修飾(lna)。
a40.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含非結(jié)構(gòu)化的核酸修飾(una)。
a41.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含假u。
a42.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含2’-moe。
a43.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含2’-阿拉伯糖。
a44.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含4’-硫代核糖。
a45.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含方酸連接。
a46.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含三唑連接。
a47.一種用于切割或切口靶多核苷酸的方法,包括使靶多核苷酸與crispr相關(guān)蛋白和前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna接觸,并切割或切口所述靶多核苷酸。
a48.實(shí)施方案a47的方法,其中所述切割或切口在體外進(jìn)行。
a49.實(shí)施方案a47的方法,其中所述切割或切口在細(xì)胞中進(jìn)行。
a50.實(shí)施方案a47的方法,其中所述切割或切口在體內(nèi)進(jìn)行。
a51.實(shí)施方案a47-a50任一項(xiàng)的方法,其中所述crispr相關(guān)蛋白是cas9。
a52.實(shí)施方案a47-a51任一項(xiàng)的方法,其中所述切割或切口導(dǎo)致基因編輯。
a53.實(shí)施方案a47-a52任一項(xiàng)的方法,其中所述切割或切口導(dǎo)致基因表達(dá)的改變。
a54.一種用于結(jié)合靶多核苷酸的方法,包括使所述靶多核苷酸與crispr相關(guān)蛋白和前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna接觸。
a55.實(shí)施方案a54的方法,其中所述crispr相關(guān)蛋白包括不具有切割或切口活性的突變體。
a56.實(shí)施方案a54或a55的方法,其中所述crispr相關(guān)蛋白是融合蛋白,所述融合蛋白包含非天然存在于crispr系統(tǒng)中的蛋白組分。
a57.實(shí)施方案a54至a56任一項(xiàng)的方法,其導(dǎo)致靶多核苷酸的表達(dá)的變化。
a58.實(shí)施方案a54至a57任一項(xiàng)的方法,其用于標(biāo)記所述靶多核苷酸。
進(jìn)一步的例示性實(shí)施方案
b1.一種合成的指導(dǎo)rna,其包含:
(a)crrna區(qū)段,其包含(i)能夠與多核苷酸中的靶序列雜交的指導(dǎo)序列,(ii)莖序列;和
(b)tracrrna區(qū)段,其包含與所述莖序列部分或完全互補(bǔ)的核苷酸序列,
其中所述合成的指導(dǎo)rna包含一個(gè)或多個(gè)修飾,且其中所述合成的指導(dǎo)rna具有g(shù)rna功能性。
b2.實(shí)施方案1的合成的指導(dǎo)rna,其包含2’-o-甲基模塊、2’-脫氧基模塊、z堿基、硫代磷酸酯核苷酸間連接、膦酰基乙酸酯核苷酸間連接、硫代膦酰基乙酸酯核苷酸間連接,或其組合。
b3.實(shí)施方案1或2的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)選自下組的修飾:具有3’-硫代磷酸酯基團(tuán)的2’-o-甲基核苷酸、具有3’-膦?;人狨セ鶊F(tuán)的2’-o-甲基核苷酸、具有3’-膦?;宜狨セ鶊F(tuán)的2’-o-甲基核苷酸、具有3’-硫代膦?;人狨セ鶊F(tuán)的2’-o-甲基核苷酸、具有3’-硫代膦?;宜狨セ鶊F(tuán)的2’-o-甲基核苷酸、具有3’-膦?;宜狨セ鶊F(tuán)的2’-脫氧核苷酸、具有3’-硫代膦酰基乙酸酯基團(tuán)的2’-脫氧核苷酸、和z堿基。
b4.實(shí)施方案1、2或3的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)選自下組的修飾:2’-氟代核糖基、2-硫尿嘧啶堿基、4-硫尿嘧啶堿基、2-氨基腺嘌呤堿基、次黃嘌呤堿基、5-甲基胞嘧啶堿基、5-甲基尿嘧啶堿基、甲基膦酸酯核苷酸間連接、5-氨基烯丙基尿嘧啶堿基、方酸連接、三唑連接、綴合至核苷酸的染料,及其組合。
b5.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含選自下組的修飾:2’-moe、2’-氨基、2’-f-阿拉伯糖、2’-lna、2’-ulna、3’-甲基膦酸酯、3’-硼烷膦酸酯、3’-二硫代磷酸酯、2’-ome-3’-p(s)2、2’-ome-3’-p(ch3)、2’-ome-3’-p(bh3)、4’-硫代核糖基、l-糖、2-硫代胞嘧啶、6-硫代鳥嘌呤、2-氨基嘌呤、假尿嘧啶、7-脫氮鳥嘌呤、7-脫氮-8-氮雜鳥嘌呤、7-脫氮腺嘌呤、7-脫氮-8-氮雜腺嘌呤、5-羥甲基胞嘧啶、5-羥甲基尿嘧啶、5,6-脫氫尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、5-乙炔基胞嘧啶、5-乙炔基尿嘧啶、5-烯丙基尿嘧啶、5-烯丙基胞嘧啶、5-烯丙基氨基胞嘧啶、p核堿基、異胞嘧啶(isoc)、異鳥嘌呤(isog)、una、x(a,g,c,t)、y(a,g,c,t)、無堿基核苷酸、peg、烴接頭、鹵素取代的烴接頭、雜原子(o,n,s)烴接頭、含有(酮、羧基、酰胺、亞硫?;?、氨基甲酰基、或硫羰氨基甲?;?的烴接頭、精胺接頭,及其組合。
b6.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含增強(qiáng)穩(wěn)定性的修飾。
b7.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含至少兩種修飾;其中第一種修飾是增強(qiáng)穩(wěn)定性的修飾且第二種修飾是改變特異性的修飾。
b8.實(shí)施方案6或7的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾位于指導(dǎo)序列中。
b9.實(shí)施方案6或7的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾位于指導(dǎo)序列的上游。
b10.實(shí)施方案6或7的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾位于crrna區(qū)段的前5和/或最后5個(gè)核苷酸內(nèi)。
b11.實(shí)施方案6或7的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾位于tracrrna區(qū)段中。
b12.實(shí)施方案6或7的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾位于tracrrna區(qū)段的前五個(gè)和/或最后5個(gè)核苷酸內(nèi)。
b13.實(shí)施方案6-12任一項(xiàng)的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾包含2’-o-甲基模塊、2’-氟模塊、或2’-脫氧基模塊。
b14.實(shí)施方案6-13任一項(xiàng)的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾包含硫代磷酸酯核苷酸間連接、膦?;宜狨ズ塑账衢g連接、硫代膦?;宜狨ズ塑账衢g連接、甲基膦酸酯核苷酸間連接、硼烷膦酸酯核苷酸間連接或二硫代磷酸酯核苷酸間連接。
b15.實(shí)施方案6-14任一項(xiàng)的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾包含3’-膦?;宜狨セ?’-硫代膦?;宜狨?。
b16.實(shí)施方案6-15任一項(xiàng)的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾包含2’-o-甲基-3’-硫代磷酸酯核苷酸、2’-o-甲基-3’-膦?;宜狨ズ塑账?、或2’-o-甲基-3’-硫代膦?;宜狨ズ塑账?。
b17.實(shí)施方案6-16任一項(xiàng)的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾包含2’-氟-3’-硫代磷酸酯核苷酸、2’-氟-3’-膦酰基乙酸酯核苷酸、或2’-氟-3’-硫代膦?;宜狨ズ塑账?。
b18.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含改變特異性的修飾。
b19.實(shí)施方案18的合成的指導(dǎo)rna,其中所述改變特異性的修飾位于指導(dǎo)序列中。
b20.實(shí)施方案18或19任一項(xiàng)的合成的指導(dǎo)rna,其中所述改變特異性的修飾包括2-硫尿嘧啶、4-硫尿嘧啶或2-氨基腺嘌呤。
b21.實(shí)施方案18-20任一項(xiàng)的合成的指導(dǎo)rna,其中所述改變特異性的修飾包含硫代磷酸酯核苷酸間連接、膦?;宜狨ズ塑账衢g連接、硫代膦?;宜狨ズ塑账衢g連接、甲基膦酸酯核苷酸間連接、硼烷磷酸酯核苷酸間連接、或二硫代磷酸酯核苷酸間連接。
b22.實(shí)施方案18-21任一項(xiàng)的合成的指導(dǎo)rna,其中所述改變特異性的修飾包含3’-膦?;宜狨セ?’-硫代膦?;宜狨?。
b23.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含熒光染料或標(biāo)記。
b24.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)同位素標(biāo)記。
b25.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述指導(dǎo)rna綴合至寡核苷酸、適配體、氨基酸、肽、蛋白質(zhì)、類固醇、脂質(zhì)、葉酸、維生素、糖、或寡糖。
b26.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述合成的指導(dǎo)rna是單一指導(dǎo)rna,其中所述crrna區(qū)段和tracrrna區(qū)段經(jīng)環(huán)l連接。
b27.實(shí)施方案26的合成的指導(dǎo)rna,其中所述環(huán)l包含1、2、3、4、5、6、7、8、9、或10個(gè)核苷酸。
b28.實(shí)施方案26或27的合成的指導(dǎo)rna,其中所述環(huán)l包含gnra的核苷酸序列,其中n表示a,c,g或u且r表示a或g。
b29.實(shí)施方案26、27或28合成的指導(dǎo)rna,其中所述環(huán)l包含gaaa的核苷酸序列。
b30.實(shí)施方案26-29的合成的指導(dǎo)rna,其中所述環(huán)l包含一個(gè)或多個(gè)修飾的核苷酸。
b31.實(shí)施方案30的合成的指導(dǎo)rna,其中所述環(huán)l包含熒光染料。
b32.實(shí)施方案31的合成的指導(dǎo)rna,其中所述染料綴合至2-(4-丁基酰胺-染料)丙烷-1,3-二醇雙(磷酸二酯)接頭。
b33.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述crrna區(qū)段在指導(dǎo)rna的5’端。
b34.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述tracrrna區(qū)段在指導(dǎo)rna的3’端。
b35.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述crrna區(qū)段包含25-70個(gè)核苷酸。
b36.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述指導(dǎo)序列包含15-30個(gè)核苷酸。
b37.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述莖序列包含10-50個(gè)核苷酸。
b38.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)三唑連接。
b39.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)方酸連接。
b40.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述指導(dǎo)rna包含如下的核苷酸組合物:
mmnn
其中每個(gè)n獨(dú)立地表示未修飾的核苷酸,并且每個(gè)m選自2’-o-甲基核糖核苷酸,2’-o-甲基-3’-p(s)核糖核苷酸,2’-o-甲基-3’-pace核糖核苷酸,2’-o-甲基-3’-硫代pace核糖核苷酸和2’-脫氧核苷酸;
其中每個(gè)m在指導(dǎo)rna的序列中的任何位置處;且
其中m是1至220的整數(shù),n是0至219的整數(shù),且50<m+n≤220。
b41.實(shí)施方案38的合成的指導(dǎo)rna,其中m+n<150,且m和n的每一個(gè)獨(dú)立地選自0至150的整數(shù),條件是m不為0。
b42.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述指導(dǎo)rna包含如下的核苷酸序列:
mmnnm’m’n’n’m”m”
其中每個(gè)m,m’和m”獨(dú)立地表示修飾的核苷酸,并且每個(gè)n和n’獨(dú)立地表示未修飾的核糖核苷酸;
其中任何給定的m與任何其它m相同或不同,任何給定的n與任何其它n相同或不同,任何給定的m’與任何其它m’相同或不同,任何給定的n’與任何其他n’相同或不同,任何給定的m”與任何其他m”相同或不同;且
其中m為0至40的整數(shù),n為20至130的整數(shù),m’為0至10的整數(shù),n’為0至50的整數(shù),m”為0至10的整數(shù),條件是m+m’+m”大于或等于1。
b43.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述crrna區(qū)段包含如下的核苷酸序列:
mmnnm’m’n’n’
其中m和m’各自表示修飾的核苷酸,n和n’各自表示未修飾的核糖核苷酸;
其中任何給定的m與任何其它m相同或不同,任何給定的n與任何其它n相同或不同,任何給定的m’與任何其它m’相同或不同,任何給定的n’與任何其他n’相同或不同;且
其中n和n’各自獨(dú)立地選自0至50的整數(shù)
其中m和m’各自獨(dú)立地選自0和25的整數(shù),條件是m+m’大于或等于1。
b44.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述指導(dǎo)序列包含如下的核苷酸序列:
mmnnm’m’n’n’
其中m和m’各自表示修飾的核苷酸,n和n’各自表示未修飾的核糖核苷酸;
其中任何給定的m與任何其它m相同或不同,任何給定的n與任何其它n相同或不同,任何給定的m’與任何其它m’相同或不同,任何給定的n’與任何其他n’相同或不同;且
其中m,n,m’和n’各獨(dú)立地選自0至40的整數(shù),條件是m+m’大于或等于1。
b45.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述tracrrna區(qū)段包含如下的核苷酸序列:
nnmmn’n’m’m’
其中m和m’各自表示修飾的核苷酸,且n和n’各自表示未修飾的核糖核苷酸;
其中任何給定的m與任何其它m相同或不同,任何給定的n與任何其它n相同或不同,任何給定的m’與任何其它m’相同或不同,任何給定的n’與任何其他n’相同或不同;且
其中n是0至130的整數(shù),m是0至40的整數(shù),n’是0至130的整數(shù),m’是0至40的整數(shù),條件是m+m’大于或等于1。
b46.實(shí)施方案40-43任一項(xiàng)的合成的指導(dǎo)rna,其中m、m’、m+m’或m+m’+m”是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
b47.實(shí)施方案40-43任一項(xiàng)的合成的指導(dǎo)rna,其中m、m’、m+m’或m+m’+m”是1、2、3、4、5、或6。
b48.實(shí)施方案40-45任一項(xiàng)的合成的指導(dǎo)rna,其中n是16、17、18或19。
b49.實(shí)施方案40-45任一項(xiàng)的合成的指導(dǎo)rna,其中n、n’或n+n’是75至115的整數(shù)。
b50.實(shí)施方案40-47任一項(xiàng)的合成的指導(dǎo)rna,其中每個(gè)m獨(dú)立地選自下組:2’修飾的核苷酸、3’修飾的核苷酸,及其組合。
b51.實(shí)施方案48的合成的指導(dǎo)rna,其中所述2’-修飾的核苷酸選自下組:2’-脫氧核苷酸、2’-o-甲基核苷酸、2’-氟代核苷酸和2’-o-c1-3烷基-o-c1-3烷基核苷酸。
b52.實(shí)施方案48的合成的指導(dǎo)rna,其中所述3’-修飾的核苷酸選自下組:3’-膦?;宜狨ズ塑账岷?’-硫代膦酰基乙酸酯核苷酸。
b53.實(shí)施方案48的合成的指導(dǎo)rna,其中所述2’-修飾的核苷酸和3’-修飾的核苷酸的組合包含2’-o-甲基-3’-硫代磷酸酯核苷酸、2’-o-甲基-3’-膦?;宜狨ズ塑账峄?’-o-甲基-3’-硫代膦?;宜狨ズ塑账?。
b54.一種用于切割靶多核苷酸的方法,包括使所述靶多核苷酸與crispr相關(guān)蛋白和前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna接觸以及切割所述靶多核苷酸。
b55.實(shí)施方案52的方法,其還包括使所述靶多核苷酸與外源crispr相關(guān)蛋白接觸。
b56.實(shí)施方案53的方法,其中所述crispr相關(guān)蛋白是cas9。
b57.實(shí)施方案52-54任一項(xiàng)的方法,其中所述切割導(dǎo)致靶基因的功能敲除。
b58.實(shí)施方案52-55任一項(xiàng)的方法,其還包括通過用外源或內(nèi)源模板多核苷酸進(jìn)行同源性定向修復(fù)來修復(fù)切割的靶多核苷酸。
b59.實(shí)施方案56的方法,其中所述的外源或內(nèi)源模板多核苷酸包含與切割位點(diǎn)任一側(cè)的序列具有基本序列同一性的至少一個(gè)序列。
b60.實(shí)施方案52-57任一項(xiàng)的方法,其還包括通過非同源末端連接來修復(fù)切割的靶多核苷酸。
b61.實(shí)施方案56-58任一項(xiàng)的方法,其中所述修復(fù)步驟產(chǎn)生所述靶多核苷酸的一個(gè)或多個(gè)插入、缺失或取代。
b62.實(shí)施方案59的方法,其中所述插入、缺失、或取代導(dǎo)致從包含所述靶多核苷酸的基因表達(dá)的蛋白中一個(gè)或多個(gè)氨基酸變化。
b63.實(shí)施方案52-60任一項(xiàng)的方法,其中使所述靶多核苷酸與crispr相關(guān)蛋白和合成的指導(dǎo)rna在體外接觸。
b64.實(shí)施方案52-61任一項(xiàng)的方法,其中使所述靶多核苷酸與crispr相關(guān)蛋白和合成的指導(dǎo)rna在體外或體內(nèi)的細(xì)胞的基因組內(nèi)接觸。
b65.實(shí)施方案62的方法,其中所述細(xì)胞在將所述靶多核苷酸與crispr相關(guān)蛋白和合成的指導(dǎo)rna接觸之前分離自多細(xì)胞來源。
b66.實(shí)施方案63的方法,其中所述來源是植物、多細(xì)胞原生生物、或真菌。
b67.實(shí)施方案62-64任一項(xiàng)的方法,其中所述細(xì)胞,或來源于其的細(xì)胞,在將所述靶多核苷酸與crispr相關(guān)蛋白和合成的指導(dǎo)rna接觸之后回到所述來源。
b68.一種在細(xì)胞中修飾靶多核苷酸的方法,包括將實(shí)施方案1-51任一項(xiàng)的合成的指導(dǎo)rna引入所述細(xì)胞以及將crispr相關(guān)蛋白或在細(xì)胞中表達(dá)crispr相關(guān)蛋白的核酸引入所述細(xì)胞。
b69.實(shí)施方案66的方法,其中所述crispr相關(guān)蛋白是cas9。
b70.一種改變細(xì)胞中至少一個(gè)基因產(chǎn)物的表達(dá)的方法,包括將實(shí)施方案1-51任一項(xiàng)的合成的指導(dǎo)rna引入所述細(xì)胞以及進(jìn)一步將crispr相關(guān)蛋白或在細(xì)胞中表達(dá)crispr相關(guān)蛋白的核酸引入所述細(xì)胞,其中所述細(xì)胞含有且表達(dá)具有靶序列且編碼所述基因產(chǎn)物的dna分子。
b71.實(shí)施方案68的方法,其中所述crispr相關(guān)蛋白是cas9。
b72.實(shí)施方案69的方法,其中所述crispr相關(guān)蛋白切割所述dna分子。
b73.一種rna分子的集合或文庫,其包含兩種或更多種實(shí)施方案1-51任一項(xiàng)的合成的指導(dǎo)rna。
b74.一種試劑盒,其包含實(shí)施方案1-51任一項(xiàng)的合成的指導(dǎo)rna或?qū)嵤┓桨?1的rna分子的集合或文庫。
b75.實(shí)施方案72的試劑盒,其還包含crispr相關(guān)蛋白或編碼所述crispr相關(guān)蛋白的核酸。
b76.實(shí)施方案73的試劑盒,其中所述crispr相關(guān)蛋白是cas9。
b77.前述實(shí)施方案的任一項(xiàng)的合成的指導(dǎo)rna、方法或試劑盒,其中所述合成的指導(dǎo)rna包含末端修飾。
b78.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其具有單一rna鏈或兩條分離的互補(bǔ)rna鏈,其中所述指導(dǎo)rna在各rna鏈的兩端包含至少一個(gè)增強(qiáng)穩(wěn)定性的修飾。
c1.一種合成的指導(dǎo)rna,其包含:
(a)crrna區(qū)段,其包含(i)能夠與多核苷酸中的靶序列雜交的指導(dǎo)序列,(ii)莖序列;和
(b)tracrrna區(qū)段,其包含與所述莖序列部分或完全互補(bǔ)的核苷酸序列,
其中所述合成的指導(dǎo)rna包含一個(gè)或多個(gè)修飾,且其中所述合成的指導(dǎo)rna具有g(shù)rna功能性。
c2.實(shí)施方案c1的合成的指導(dǎo)rna,其中所述修飾的一個(gè)或多個(gè)包含增強(qiáng)穩(wěn)定性的修飾。
c3.實(shí)施方案c2的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾的一個(gè)或多個(gè)位于指導(dǎo)序列中。
c4.實(shí)施方案c2的合成的指導(dǎo)rna,其中所述增強(qiáng)穩(wěn)定性的修飾包含2’-o-甲基模塊、z堿基、2’-脫氧核苷酸、硫代磷酸酯核苷酸間連接、膦?;宜狨?pace)核苷酸間連接、或硫代膦?;宜狨?硫代pace)核苷酸間連接,或其組合。
c5.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在指導(dǎo)rna的5’端包含少于26個(gè)連續(xù)的2’-o-甲基修飾的核苷酸。
c6.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含z堿基,所述z堿基在合成的指導(dǎo)rna中替代胞嘧啶。
c7.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在與尿苷對(duì)應(yīng)的位置處包含至少一個(gè)2-硫尿嘧啶,所述尿苷能參與與潛在脫靶序列的u-g搖擺配對(duì)。
c8.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)選自下組的修飾:具有3’-硫代磷酸酯基團(tuán)的2’-o-甲基核苷酸、具有3’-膦酰基乙酸酯基團(tuán)的2’-o-甲基核苷酸、具有3’-硫代膦?;宜狨セ鶊F(tuán)的2’-o-甲基核苷酸、和具有3’-膦?;宜狨セ鶊F(tuán)的2’-脫氧核苷酸。
c9.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含至少兩個(gè)修飾。
c10.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含多至50個(gè)修飾。
c11.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含單一rna鏈或兩條分離的rna鏈,以及各條rna鏈的5’端、各條rna鏈的3’端、或各條rna鏈的5’端和3’端二者處的一個(gè)或多個(gè)修飾。
c12.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在5’端或3’端或5’端和3’端二者包含7個(gè)或更少的連續(xù)的修飾的核苷酸。
c13.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其在5’端、3’端或莖-環(huán)的一項(xiàng)或多項(xiàng)處包含一個(gè)或多個(gè)5-甲基尿苷核苷酸。
c14.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述修飾的一個(gè)或多個(gè)改變堿基配對(duì)熱穩(wěn)定性。
c15.實(shí)施方案c14的合成的指導(dǎo)rna,其中所述一個(gè)或多個(gè)修飾增強(qiáng)堿基配對(duì)熱穩(wěn)定性。
c16.實(shí)施方案c15的合成的指導(dǎo)rna,其中所述一個(gè)或多個(gè)修飾獨(dú)立地選自2-硫尿嘧啶(2-硫代u)、4-硫尿嘧啶(4-硫代u)、2-氨基腺嘌呤、2’-o-甲基、2’-氟、5-甲基尿苷、5-甲基胞苷和鎖核酸修飾(lna)。
c17.實(shí)施方案c15的合成的指導(dǎo)rna,其中所述一個(gè)或多個(gè)修飾降低堿基配對(duì)熱穩(wěn)定性。
c18.實(shí)施方案c17的合成的指導(dǎo)rna,其中所述一個(gè)或多個(gè)修飾獨(dú)立地選自2-硫尿嘧啶、2’-脫氧基、硫代磷酸酯連接、二硫代磷酸酯連接、硼烷膦酸酯連接、膦?;宜狨ミB接、硫代膦酰基乙酸酯連接和非鎖核酸修飾(ulna)。
c19.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含一個(gè)或多個(gè)2’-o-甲基a-2’-o-甲基u堿基對(duì)。
c20.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述修飾的一個(gè)或多個(gè)是改變特異性的修飾。
c21.實(shí)施方案c20的合成的指導(dǎo)rna,其中所述改變特異性的修飾位于指導(dǎo)序列中。
c22.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其中所述改變特異性的修飾包含2-硫尿嘧啶、4-硫尿嘧啶、2-氨基腺嘌呤、2’-o-甲基、2’-氟、lna、硫代磷酸酯連接、二硫代磷酸酯連接、硼烷膦酸酯連接、膦?;宜狨ミB接、硫代膦酰基乙酸酯連接、ulna、2’-脫氧基、5-甲基尿苷、5-甲基胞苷,或其組合。
c23.前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna,其包含熒光染料或標(biāo)記。
c24.實(shí)施方案c23的合成的指導(dǎo)rna,其中所述熒光染料或標(biāo)記結(jié)合至合成的指導(dǎo)rna的莖-環(huán)。
c25.一種用于基因組編輯以修飾dna序列、或調(diào)控目的基因表達(dá)、或切割靶多核苷酸的方法,包括:使所述dna序列、目的基因、或靶多核苷酸與crispr相關(guān)蛋白和前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna接觸,并編輯、調(diào)控或切割所述dna序列、目的基因或靶多核苷酸。
c26.實(shí)施方案c25的方法,其中所述方法在體外進(jìn)行,且所述合成的指導(dǎo)rna在整個(gè)指導(dǎo)序列中包含15或更多個(gè)2’-o-甲基修飾。
c27.一種rna分子的集合或文庫,其包含兩種或更多種前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna。
c28.一種試劑盒,其包含前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna。
c29.一種rna分子的陣列,其包含兩種或更多種前述實(shí)施方案任一項(xiàng)的合成的指導(dǎo)rna。
前述對(duì)例示性或優(yōu)選的實(shí)施方案的描述應(yīng)當(dāng)被認(rèn)為是說明而非限制本發(fā)明,其由權(quán)利要求所限定。如容易理解的,在不脫離如權(quán)利要求所述的本發(fā)明的情況下,上述特征的許多變化和組合是可以利用的。這些變化不被認(rèn)為是偏離本發(fā)明的范圍,并且所有這些變化都意圖包括在所附權(quán)利要求的范圍內(nèi)。本文引用的所有參考文獻(xiàn)通過提述以其整體并入。