本發(fā)明涉及基因編輯領域,特別是規(guī)律成簇的間隔短回文重復(crispr)。具體而言,本發(fā)明涉及一種新型的cas效應蛋白,包含此類蛋白的融合蛋白,以及編碼它們的核酸分子。本發(fā)明還涉及用于核酸編輯(例如,基因或基因組編輯)的復合物和組合物,其包含本發(fā)明的cas蛋白或融合蛋白,或編碼它們的核酸分子。
背景技術:
::1、crispr/cas技術是一種被廣泛使用的基因編輯技術,它通過rna引導對基因組上的靶序列進行特異性結合并切割dna產生雙鏈斷裂,利用生物非同源末端連接或同源重組進行定點基因編輯。2、crispr/cas9系統(tǒng)是最常用的ii型crispr系統(tǒng),它識別3’-ngg的pam基序,對靶標序列進行平末端切割。crispr/cas?type?v系統(tǒng)是一類新發(fā)現(xiàn)的crispr系統(tǒng),它具有5’-ttn的基序,對靶標序列進行粘性末端切割,例如cpf1,c2c1,casx,casy。然而目前存在的不同的crispr/cas各有不同的優(yōu)點和缺陷。例如cas9,c2c1和casx均需要兩條rna進行指導rna,而cpf1只需要一條指導rna而且可以用來進行多重基因編輯。casx具有980個氨基酸的大小,而常見的cas9,c2c1,casy和cpf1通常大小在1300個氨基酸左右。此外,cas9,cpf1,casx,casy的pam序列都比較復雜多樣,而c2c1識別嚴謹?shù)?’-ttn,因此它的靶標位點比其他系統(tǒng)容易被預測從而降低了潛在的脫靶效應。3、總之,鑒于目前可獲得的crispr/cas系統(tǒng)都受限于一些缺陷,開發(fā)一種更穩(wěn)健的、具有多方面良好性能的新型crispr/cas系統(tǒng)對生物技術的發(fā)展具有重要意義。技術實現(xiàn)思路1、本技術的發(fā)明人經過大量實驗和反復摸索,出人意料地發(fā)現(xiàn)了一類新型的核酸內切酶(cas酶)。所述cas酶包括cas-sf1、cas-sf3、cas-sf4、cas-sf6、cas-sf8、cas-sf9、cas-sf10中的一種或任意幾種,基于這一發(fā)現(xiàn),本發(fā)明人開發(fā)了新的crispr/cas系統(tǒng)以及基于該系統(tǒng)的基因編輯方法和核酸檢測方法。2、cas效應蛋白3、一方面,本發(fā)明提供了一種cas蛋白(或者,稱之為cas酶),所述cas蛋白是crispr/cas系統(tǒng)中的效應蛋白,所述效應蛋白選自cas-sf4、cas-sf1、cas-sf3、cas-sf6、cas-sf8、cas-sf9、cas-sf10中的一種或任意幾種。4、其中,cas-sf4、cas-sf1、cas-sf3、cas-sf6、cas-sf8、cas-sf9、cas-sf10的氨基酸序列分別如seq?id?no.1-7所示。5、在一個實施方式中,所述cas蛋白氨基酸序列與seq?id?no.1-7任意一條序列相比,具有至少80%、至少85%、至少90%、至少91%、至少92%、至少3%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性,并且基本保留了其源自序列的生物學功能。6、在一個實施方式中,所述cas蛋白氨基酸序列與seq?id?no.1-7任意一條序列相比,具有一個或多個氨基酸的置換、缺失或添加的序列,并且基本保留了其源自序列的生物學功能;所述一個或多個氨基酸包括1個,2個,3個,4個,5個,6個,7個,8個,9個或10個氨基酸的置換、缺失或添加。7、本領域技術人員清楚,可以改變蛋白質的結構而不對其活性和功能性產生不利影響,例如可以在蛋白質氨基酸序列中引入一個或多個保守性氨基酸取代,而不會對蛋白質分子的活性和/或三維結構產生不利影響。本領域技術人員清楚保守性氨基酸取代的實例以及實施方式。具體的說,可以用與待取代位點屬于相同組的另一氨基酸殘基取代該氨基酸殘基,即用非極性氨基酸殘基取代另一非極性氨基酸殘基,用極性不帶電荷的氨基酸殘基取代另一極性不帶電荷的氨基酸殘基,用堿性氨基酸殘基取代另一堿性氨基酸殘基,和用酸性氨基酸殘基取代另一酸性氨基酸殘基。這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的。只要取代不導致蛋白質生物活性的失活,則一種氨基酸被屬于同組的其他氨基酸替換的保守取代落在本發(fā)明的范圍內。因此,本發(fā)明的蛋白可以在氨基酸序列中包含一個或多個保守性取代,這些保守性取代最好根據(jù)表1進行替換而產生。另外,本發(fā)明也涵蓋還包含一個或多個其他非保守取代的蛋白,只要該非保守取代不顯著影響本發(fā)明的蛋白質的所需功能和生物活性即可。8、保守氨基酸置換可以在一個或多個預測的非必需氨基酸殘基處進行。“非必需”氨基酸殘基是可以發(fā)生改變(缺失、取代或置換)而不改變生物活性的氨基酸殘基,而“必需”氨基酸殘基是生物活性所需的。“保守氨基酸置換”是其中氨基酸殘基被具有類似側鏈的氨基酸殘基替代的置換。氨基酸置換可以在cas酶的非保守區(qū)域中進行。一般而言,此類置換不對保守的氨基酸殘基,或者不對位于保守基序內的氨基酸殘基進行,其中此類殘基是蛋白質活性所需的。然而,本領域技術人員應當理解,功能變體可以具有較少的在保守區(qū)域中的保守或非保守改變。9、表110、11、12、本領域熟知,可以從蛋白質的n和/或c末端改變(置換、刪除、截短或插入)一或多個氨基酸殘基而仍保留其功能活性。因此,從本發(fā)明的cas蛋白的n和/或c末端改變了一或多個氨基酸殘基、同時保留了其所需功能活性的蛋白,也在本發(fā)明的范圍內。這些改變可以包括通過現(xiàn)代分子方法例如pcr而引入的改變,所述方法包括借助于在pcr擴增中使用的寡核苷酸之中包含氨基酸編碼序列而改變或延長蛋白質編碼序列的pcr擴增。13、應認識到,蛋白質可以以各種方式進行改變,包括氨基酸置換、刪除、截短和插入,用于此類操作的方法是本領域通常已知的。例如,可以通過對dna的突變來制備cas蛋白的氨基酸序列變體。還可以通過其他誘變形式和/或通過定向進化來完成,例如,使用已知的誘變、重組和/或改組(shuffling)方法,結合相關的篩選方法,來進行單個或多個氨基酸取代、缺失和/或插入。14、本領域技術人員能夠理解,本發(fā)明cas蛋白中的這些微小氨基酸變化可以出現(xiàn)(例如天然存在的突變)或者產生(例如使用r-dna技術)而不損失蛋白質功能或活性。如果這些突變出現(xiàn)在蛋白的催化結構域、活性位點或其它功能結構域中,則多肽的性質可改變,但多肽可保持其活性。如果存在的突變不接近催化結構域、活性位點或其它功能結構域中,則可預期較小影響。15、本領域技術人員可以根據(jù)本領域已知的方法,例如定位誘變或蛋白進化或生物信息系的分析,來鑒定cas蛋白的必需氨基酸。蛋白的催化結構域、活性位點或其它功能結構域也能夠通過結構的物理分析而確定,如通過以下這些技術:如核磁共振、晶體學、電子衍射或光親和標記,結合推定的關鍵位點氨基酸的突變來確定。16、在一個實施方式中,所述cas蛋白包含seq?id?no.1-7任一所示的氨基酸序列。17、在一個實施方式中,所述cas蛋白為seq?id?no.1-7任一所示的氨基酸序列。18、在一個實施方式中,所述cas蛋白是與具有seq?id?no.1-7任一所示的序列的蛋白質相同生物學功能的衍生化蛋白。19、所述生物學功能包括但不限于,與指導rna結合的活性、核酸內切酶活性、在指導rna引導下與靶序列特定位點結合并切割的活性,包括但不限于cis切割活性和trans切割活性。20、本發(fā)明還提供了一種融合蛋白,所述融合蛋白包括選自cas-sf1、cas-sf3、cas-sf4、cas-sf6、cas-sf8、cas-sf9、cas-sf10中的任意一種cas蛋白和其他的修飾部分。21、在一個實施方式中,所述修飾部分選自另外的蛋白或多肽、可檢測的標記或其任意組合。22、在一個實施方式中,所述修飾部分選自表位標簽、報告基因序列、核定位信號(nls)序列、靶向部分、轉錄激活結構域(例如,vp64)、轉錄抑制結構域(例如,krab結構域或sid結構域)、核酸酶結構域(例如,fok1),以及具有選自下列的活性的結構域:核苷酸脫氨酶,甲基化酶活性,去甲基化酶,轉錄激活活性,轉錄抑制活性,轉錄釋放因子活性,組蛋白修飾活性,核酸酶活性,單鏈rna切割活性,雙鏈rna切割活性,單鏈dna切割活性,雙鏈dna切割活性和核酸結合活性;以及其任意組合。所述nls序列是本領域技術人員熟知的,其實例包括但不限于所述,sv40大t抗原,egl-13,c-myc以及tus蛋白。23、在一個實施方式中,所述nls序列位于、靠近或接近本發(fā)明的cas蛋白的末端(例如,n端、c端或兩端)。24、所述表位標簽(epitope?tag)是本領域技術人員熟知的,包括但不限于his、v5、flag、ha、myc、vsv-g、trx等,并且本領域技術人員可以選擇其他合適的表位標簽(例如,純化、檢測或示蹤)。25、所述報告基因序列是本領域技術人員熟知的,其實例包括但不限于gst、hrp、cat、gfp、hcred、dsred、cfp、yfp、bfp等。26、在一個實施方式中,本發(fā)明的融合蛋白包含能夠與dna分子或細胞內分子結合的結構域,例如麥芽糖結合蛋白(mbp)、lex?a的dna結合結構域(dbd)、gal4的dbd等。27、在一個實施方式中,本發(fā)明的融合蛋白包含可檢測的標記,例如熒光染料,例如fitc或dapi。28、在一個實施方式中,本發(fā)明的cas蛋白任選地通過接頭與所述修飾部分偶聯(lián)、綴合或融合。29、在一個實施方式中,所述修飾部分直接連接至本發(fā)明的cas蛋白的n端或c端。30、在一個實施方式中,所述修飾部分通過接頭連接至本發(fā)明的cas蛋白的n端或c端。這類接頭是本領域熟知的,其實例包括但不限于包含一個或多個(例如,1個,2個,3個,4個或5個)氨基酸(如,glu或ser)或氨基酸衍生物(如,ahx、β-ala、gaba或ava)的接頭,或peg等。31、本發(fā)明的cas蛋白、蛋白衍生物或融合蛋白不受其產生方式的限定,例如,其可以通過基因工程方法(重組技術)產生,也可以通過化學合成方法產生。32、cas蛋白的核酸33、另一方面,本發(fā)明提供了一種分離的多核苷酸,其包含:編碼本發(fā)明的cas蛋白或融合蛋白的多核苷酸序列。34、在一個實施方式中,所述的多核苷酸序列經密碼子優(yōu)化用于在原核細胞中進行表達。在一個實施方式中,所述的多核苷酸序列經密碼子優(yōu)化用于在真核細胞中進行表達。35、在一個實施方式中,所述的多核苷酸優(yōu)選是單鏈的或雙鏈的。36、同向重復(direct?repeat)序列37、另一方面,本發(fā)明提供了一種與選自上述cas-sf1、cas-sf3、cas-sf4、cas-sf6、cas-sf8、cas-sf9、cas-sf10中的任意一種cas蛋白形成復合物的工程化同向重復序列。38、所述同向重復序列與能夠和靶序列雜交的引導序列連接后構成指導rna(guiderna或grna)。39、所述靶序列與grna的雜交,代表靶序列和grna的核酸序列至少70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的同一性,從而可以雜交形成復合物;或者代表靶序列和grna的核酸序列至少有12個,15個,16個,17個,18個,19個,20個,21個,22個,或更多個堿基可以互補配對,形成復合物。40、在一些實施例中,該同向重復序列與seq?id?no.8-14任意一條序列具有至少90%的序列同一性,例如,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的同一性。在一些實施例中,該同向重復序列與seq?id?no.8-14任意一條所示的序列相比具有一個或多個堿基的置換、缺失或添加(例如1個,2個,3個,4個,5個,6個,7個,8個,9個或10個堿基的置換、缺失或添加)的序列。41、在一些實施例中,同向重復序列如seq?id?no.8-14任意一條序列所示,或者如seqid?no.16-22任意一條序列所示。42、本發(fā)明中,seq?id?no.8-14分別對應cas-sf4、cas-sf1、cas-sf3、cas-sf6、cas-sf8、cas-sf9和cas-sf10的原型同向重復序列;seq?id?no.16-22分別對應cas-sf4、cas-sf1、cas-sf3、cas-sf6、cas-sf8、cas-sf9和cas-sf10的成熟同向重復序列。43、指導rna(grna)44、另一方面,本發(fā)明提供了一種grna,所述grna包括第一區(qū)段和第二區(qū)段;所述第一區(qū)段又稱為“骨架區(qū)”、“蛋白質結合區(qū)段”、“蛋白質結合序列”、或者“同向重復(directrepeat)序列”;所述第二區(qū)段又稱為“靶向核酸的靶向序列”或者“靶向核酸的靶向區(qū)段”,或者“靶向靶序列的引導序列”。45、所述grna的第一區(qū)段能夠與本發(fā)明的cas蛋白相互作用,從而使cas蛋白和grna形成復合物。46、本發(fā)明靶向核酸的靶向序列或靶向核酸的靶向區(qū)段包含與靶核酸中的序列互補的核苷酸序列。換言之,本發(fā)明靶向核酸的靶向序列或靶向核酸的靶向區(qū)段經過雜交(即,堿基配對)以序列特異性方式與靶核酸相互作用。因此,靶向核酸的靶向序列或靶向核酸的靶向區(qū)段可改變,或可被修飾以雜交靶核酸內的任何希望的序列。所述核酸選自dna或rna。47、靶向核酸的靶向序列或靶向核酸的靶向區(qū)段與靶核酸的靶序列之間的互補百分比可為至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。48、本發(fā)明grna的“骨架區(qū)”、“蛋白質結合區(qū)段”、“蛋白質結合序列”、或者“同向重復序列”可以與crispr蛋白(或者,cas蛋白)相互作用。本發(fā)明grna經過靶向核酸的靶向序列的作用將其相互作用的cas蛋白引導至靶核酸內的特異性核苷酸序列。49、優(yōu)選的,所述指導rna從5’至3’方向包含第一區(qū)段和第二區(qū)段。50、本發(fā)明中,所述第二區(qū)段還可以理解為與靶序列雜交的引導序列。51、本發(fā)明的grna能夠與所述cas蛋白形成復合物。52、載體53、本發(fā)明還提供了一種載體,其包含如上述的cas蛋白、分離的核酸分子或多核苷酸;優(yōu)選的,其還包括與之可操作連接的調控元件。54、在一個實施方式中,所述的調控元件選自下組中的一種或多種:增強子、轉座子、啟動子、終止子、前導序列、多腺苷酸序列、標記基因。55、在一個實施方式中,所述的載體包括克隆載體、表達載體、穿梭載體、整合載體。56、在一些實施方案中,所述系統(tǒng)中包括的載體是病毒載體(例如逆轉錄病毒載體,慢病毒載體,腺病毒載體,腺相關載體和單純皰疹載體),還可以是質粒、病毒、粘粒、噬菌體等類型,它們是本領域技術人員所熟知的。57、載體系統(tǒng)58、本發(fā)明提供了一種工程化的非天然存在的載體系統(tǒng),或者是crispr-cas系統(tǒng),該系統(tǒng)包括cas蛋白或編碼所述cas蛋白的核酸序列以及編碼一種或多種指導rna的核酸。59、在一種實施方式中,所述編碼所述cas蛋白的核酸序列和編碼一種或多種指導rna的核酸是人工合成的。60、在一種實施方式中,所述編碼所述cas蛋白的核酸序列和編碼一種或多種指導rna的核酸并不共同天然存在。61、該一種或多種指導rna在細胞中靶向一個或多個靶序列。所述一個或多個靶序列與編碼一種或多種基因產物的dna分子的基因組座位雜交,并且引導該cas蛋白到達所述一種或多種基因產物的dna分子的基因組座位部位,cas蛋白到達靶序列位置后對靶序列進行修飾、編輯或切割,由此該一種或多種基因產物的表達被改變或修飾。62、本發(fā)明的細胞包括動物、植物或微生物中的一種或多種。63、在一些實施例中,該cas蛋白是密碼子優(yōu)化的,用于在細胞中進行表達。64、在一些實施例中,該cas蛋白指導切割在該靶序列位置處的一條或兩條鏈。65、本發(fā)明還提供了一種工程化的非天然存在的載體系統(tǒng),該載體系統(tǒng)可以包括一種或多種載體,該一種或多種載體包括:66、a)第一調控元件,該第一調控元件可操作地與grna連接,67、b)第二調控元件,該第二調控元件可操作地與所述cas蛋白連接;68、其中組分(a)和(b)位于該系統(tǒng)的相同或不同載體上。69、所述第一和第二調控元件包括啟動子(例如,組成型啟動子或誘導型啟動子)、增強子(例如35s?promoter或35s?enhanced?promoter)、內部核糖體進入位點(ires)、和其他表達控制元件(例如轉錄終止信號,如,多聚腺苷酸化信號和多聚u序列)。70、在一些實施方案中,所述系統(tǒng)中的載體是病毒載體(例如逆轉錄病毒載體,慢病毒載體,腺病毒載體,腺相關載體和單純皰疹載體),還可以是質粒、病毒、粘粒、噬菌體等類型,它們是本領域技術人員所熟知的。71、在一些實施例中,本文提供的系統(tǒng)處于遞送系統(tǒng)中。在一些實施方案中,遞送系統(tǒng)是納米顆粒,脂質體,外體,微泡和基因槍。72、在一個實施方式中,當所述靶序列為dna時,所述靶序列位于原間隔序列臨近基序(pam)的3’端,并且所述pam具有ttn所示的序列,其中,n選自a、g、t、c。73、在一個實施方式中,所述靶序列是來自原核細胞或真核細胞的dna或rna序列。在一個實施方式中,所述靶序列是非天然存在的dna或rna序列。74、在一個實施方式中,所述靶序列存在于細胞內。在一個實施方式中,所述靶序列存在于細胞核內或細胞質(例如,細胞器)內。在一個實施方式中,所述細胞是真核細胞。在其他實施方式中,所述細胞是原核細胞。75、在一個實施方式中,所述cas蛋白連接有一個或多個nls序列。在一個實施方式中,所述融合蛋白包含一個或多個nls序列。在一個實施方式中,所述nls序列連接至所述蛋白的n端或c端。在一個實施方式中,所述nls序列融合至所述蛋白的n端或c端。76、另一方面,本發(fā)明涉及一種工程化的crispr系統(tǒng),所述系統(tǒng)包含上述cas蛋白以及一種或多種指導rna,其中,所述指導rna包括同向重復序列和能夠與靶核酸雜交的間隔序列,所述cas蛋白能夠結合所述指導rna并靶向與間隔序列互補的靶核酸序列。77、蛋白-核酸復合物/組合物78、另一方面,本發(fā)明提供了一種復合物或者組合物,其包含:79、(i)蛋白組分,其選自:上述cas蛋白、衍生化蛋白或融合蛋白,及其任意組合;和80、(ii)核酸組分,其包含(a)能夠與靶序列雜交的引導序列;以及(b)能夠與本發(fā)明的cas蛋白結合的同向重復序列。81、所述蛋白組分與核酸組分相互結合形成復合物。82、在一個實施方式中,所述核酸組分是crispr-cas系統(tǒng)中的指導rna。83、在一個實施方式中,所述復合物或組合物是非天然存在的或經修飾的。在一個實施方式中,所述復合物或組合物中的至少一個組分是非天然存在的或經修飾的。在一個實施方式中,所述第一組分是非天然存在的或經修飾的;和/或,所述第二組分是非天然存在的或經修飾的。84、活化的crispr復合物85、另一方面,本發(fā)明還提供了一種活化的crispr復合物,所述活化的crispr復合物包含:(1)蛋白組分,其選自:本發(fā)明的cas蛋白、衍生化蛋白或融合蛋白,及其任意組合;(2)grna,其包含(a)能夠與靶序列雜交的引導序列;以及(b)能夠與本發(fā)明的cas蛋白結合的同向重復序列;以及(3)結合在grna上的靶序列。優(yōu)選的,所述結合為通過grna上的靶向核酸的靶向序列與靶核酸進行的結合。86、本文所用術語“活化的crispr復合物”,“活化復合物”或“三元復合物”是指crispr系統(tǒng)中cas蛋白、grna與靶核酸結合或修飾后的復合物。87、本發(fā)明的cas蛋白和grna可以形成二元復合物,該二元復合物在與核酸底物結合時被活化,形成活化的crispr復合物。該核酸底物與grna中的間隔序列(或者稱之為,與靶核酸雜交的引導序列)互補。在一些實施方案中,grna的間隔序列與靶底物完全匹配。在其它實施方案中,grna的間隔序列與靶底物的部分(連續(xù)或不連續(xù))匹配。88、在優(yōu)選的實施方式中,所述活化的crispr復合物可以表現(xiàn)出側枝核酸酶切活性,所述側枝核酸酶切活性是指活化的crispr復合物表現(xiàn)的對單鏈核酸的非特異切割活性或亂切活性,在本領域又稱之為trans切割活性。89、遞送及遞送組合物90、本發(fā)明的cas蛋白、grna、融合蛋白、核酸分子、載體、系統(tǒng)、復合物和組合物,可以通過本領域已知的任何方法進行遞送。此類方法包括但不限于,電穿孔、脂轉染、核轉染、顯微注射、聲孔效應、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀轉染、熱激轉染、核轉染、磁轉染、脂轉染、穿刺轉染、光學轉染、試劑增強性核酸攝取、以及經由脂質體、免疫脂質體、病毒顆粒、人工病毒體等的遞送。91、因此,在另一個方面,本發(fā)明提供了一種遞送組合物,其包含遞送載體,以及選自下列的一種或任意幾種:本發(fā)明的cas蛋白、融合蛋白、核酸分子、載體、系統(tǒng)、復合物和組合物。92、在一個實施方式中,所述遞送載體是粒子。93、在一個實施方式中,所述遞送載體選自脂質顆粒、糖顆粒、金屬顆粒、蛋白顆粒、脂質體、外泌體、微泡、基因槍或病毒載體(例如,復制缺陷型逆轉錄病毒、慢病毒、腺病毒或腺相關病毒)。94、宿主細胞95、本發(fā)明還涉及一種體外的、離體的或體內的細胞或細胞系或它們的子代,所述細胞或細胞系或它們的子代包含:本發(fā)明所述的cas蛋白、融合蛋白、核酸分子、蛋白-核酸復合物、活化的crispr復合物、載體、本發(fā)明遞送組合物。96、在某些實施方案中,所述細胞是原核細胞。97、在某些實施方案中,所述細胞是真核細胞。在某些實施方案中,所述細胞是哺乳動物細胞。在某些實施方案中,所述細胞是人類細胞。某些實施方案中,所述細胞是非人哺乳動物細胞,例如非人靈長類動物、牛、羊、豬、犬、猴、兔、嚙齒類(如大鼠或小鼠)的細胞。在某些實施方案中,所述細胞是非哺乳動物真核細胞,例如家禽鳥類(如雞)、魚類或甲殼動物(如蛤蜊、蝦)的細胞。在某些實施方案中,所述細胞是植物細胞,例如單子葉植物或雙子葉植物具有的細胞或栽培植物或糧食作物如木薯、玉米、高粱、大豆、小麥、燕麥或水稻具有的細胞,例如藻類、樹或生產植物、果實或蔬菜(例如,樹類如柑橘樹、堅果樹;茄屬植物、棉花、煙草、番茄、葡萄、咖啡、可可等)。98、在某些實施方案中,所述細胞是干細胞或干細胞系。99、在某些情況下,本發(fā)明的宿主細胞包含基因或基因組的修飾,該修飾是在其野生型中不存在的修飾。100、基因編輯方法和應用101、本發(fā)明的cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物或者上述宿主細胞可用于以下任一或任意幾個用途:靶向和/或編輯靶核酸;切割雙鏈dna、單鏈dna或單鏈rna;非特異性切割和/或降解側枝核酸;非特異性切割單鏈核酸;核酸檢測;檢測目標樣品中的核酸;特異性地編輯雙鏈核酸;堿基編輯雙鏈核酸;堿基編輯單鏈核酸。在其他的實施方式中,還可以用于制備用于上述任一或任意幾個用途的試劑或試劑盒。102、本發(fā)明還提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物在基因編輯、基因靶向或基因切割中的應用;或者,在制備用于基因編輯、基因靶向或基因切割的試劑或試劑盒中的用途。103、在一個實施方式中,所述基因編輯、基因靶向或基因切割為在細胞內和/或細胞外進行基因編輯、基因靶向或基因切割。104、本發(fā)明還提供了一種編輯靶核酸、靶向靶核酸或切割靶核酸的方法,所述方法包括將靶核酸與上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物進行接觸。在一個實施方式中,所述方法為在細胞內和/或細胞外編輯靶核酸、靶向靶核酸或切割靶核酸。105、所述基因編輯或編輯靶核酸包括修飾基因、敲除基因、改變基因產物的表達、修復突變、和/或插入多核苷酸、基因突變。106、所述編輯可以在原核細胞和/或真核細胞中進行編輯。107、另一方面,本發(fā)明還提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物在核酸檢測中的應用,或在制備用于核酸檢測的試劑或試劑盒中的用途。108、另一方面,本發(fā)明還提供了一種切割單鏈核酸的方法,所述方法包括,使核酸群體與上述cas蛋白和grna接觸,其中所述核酸群體包含靶核酸和多個非靶單鏈核酸,所述cas蛋白切割所述多個非靶單鏈核酸。109、所述grna能夠結合所述cas蛋白。110、所述grna能夠靶向所述靶核酸。111、所述接觸可以是在體外、離體或體內的細胞內部。112、優(yōu)選的,所述切割單鏈核酸為非特異性的切割。113、另一方面,本發(fā)明還提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物在非特異性的切割單鏈核酸中的應用,或在制備用于非特異性的切割單鏈核酸的試劑或試劑盒中的用途。114、另一方面,本發(fā)明還提供了一種用于基因編輯、基因靶向或基因切割的試劑盒,所述試劑盒包括上述cas蛋白、grna、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物、上述活化的crispr復合物或上述宿主細胞。115、另一方面,本發(fā)明還提供了一種用于檢測樣品中的靶核酸的試劑盒,所述試劑盒包含:(a)cas蛋白,或編碼所述cas蛋白的核酸;(b)指導rna,或編碼所述指導rna的核酸,或包含所述指導rna的前體rna,或編碼所述前體rna的核酸;和(c)為單鏈的且不與所述指導rna雜交的單鏈核酸檢測器。116、本領域知曉,前體rna可被切割或加工成為上述成熟的指導rna。117、另一方面,發(fā)明提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物、上述活化的crispr復合物或上述宿主細胞在制備制劑或試劑盒中的用途,所述制劑或試劑盒用于:118、(i)基因或基因組編輯;119、(ii)靶核酸檢測和/或診斷;120、(iii)編輯靶基因座中的靶序列來修飾生物;121、(iv)疾病的治療;122、(v)靶向靶基因;123、(vi)切割目的基因。124、優(yōu)選的,上述基因或基因組編輯為在細胞內或細胞外進行基因或基因組編輯。125、優(yōu)選的,所述靶核酸檢測和/或診斷為在體外進行靶核酸檢測和/或診斷。126、優(yōu)選的,所述疾病的治療為治療由靶基因座中的靶序列的缺陷引起的病癥。127、另一個方面,本發(fā)明提供了一種檢測樣品中靶核酸的方法,所述方法包括將樣品與所述cas蛋白、grna(指導rna)和單鏈核酸檢測器接觸,所述grna包括與所述cas蛋白結合的區(qū)域和與靶核酸雜交的指導序列;檢測由所述cas蛋白切割單鏈核酸檢測器產生的可檢測信號,從而檢測靶核酸;所述單鏈核酸檢測器不與所述grna雜交。128、特異性修飾靶核酸的方法129、另一方面,本發(fā)明還提供了一種特異性修飾靶核酸的方法,方法包括:使靶核酸與上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物接觸。130、該特異性修飾可以發(fā)生在體內或者體外。131、該特異性修飾可以發(fā)生在細胞內或者細胞外。132、在一些情況下,細胞選自原核細胞或真核細胞,例如,動物細胞、植物細胞或微生物細胞。133、在一個實施方式中,所述修飾是指所述靶序列的斷裂,如,dna的單鏈/雙鏈斷裂,或者rna的單鏈斷裂。134、在一些情況下,所述方法還包括使靶核酸與供體多核苷酸接觸,其中將供體多核苷酸、供體多核苷酸的部分、供體多核苷酸的拷貝或供體多核苷酸的拷貝的部分整合到靶核酸中。135、在一個實施方式中,所述修飾還包括將編輯模板(例如外源核酸)插入所述斷裂中。136、在一個實施方式中,所述方法還包括:將編輯模板與所述靶核酸接觸,或者遞送至包含所述靶核酸的細胞中。在此實施方式中,所述方法通過與外源模板多核苷酸同源重組修復所述斷裂的靶基因;在一些實施方式中,所述修復導致一種突變,包括所述靶基因的一個或多個核苷酸的插入、缺失、或取代,在其他的實施方式中,所述突變導致在從包含該靶序列的基因表達的蛋白質中的一個或多個氨基酸改變。137、檢測(非特異切割)138、另一方面,本發(fā)明提供了一種檢測樣品中靶核酸的方法,所述方法包括將樣品與上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復合物和單鏈核酸檢測器接觸;檢測由所述cas蛋白切割單鏈核酸檢測器產生的可檢測信號,從而檢測靶核酸。139、本發(fā)明中,所述靶核酸包括核糖核苷酸或脫氧核糖核苷酸;包括單鏈核酸、雙鏈核酸,例如單鏈dna、雙鏈dna、單鏈rna、雙鏈rna。140、在一個實施方式中,所述靶核酸來源于病毒、細菌、微生物、土壤、水源、人體、動物、植物等樣品。優(yōu)選的,所述靶核酸為pcr、nasba、rpa、sda、lamp、had、near、mda、rca、lcr、ram等方法富集或擴增的產物。141、在一個實施方式中,所述靶核酸為病毒核酸、細菌核酸、與疾病相關的特異核酸,如特定的突變位點或snp位點或與對照有差異的核酸;優(yōu)選地,所述病毒為植物病毒或動物病毒,例如,乳頭瘤病毒,肝dna病毒,皰疹病毒,腺病毒,痘病毒,細小病毒,冠狀病毒;優(yōu)選地,所述病毒為冠狀病毒,優(yōu)選地,sars、sars-cov2(covid-19)、hcov-229e、hcov-oc43、hcov-nl63、hcov-hku1、mers-cov。142、在一些實施方式中,所述靶核酸來源于細胞,例如,來源于細胞裂解液。143、在一個實施方式中,所述的靶核酸包括dna、rna,優(yōu)選為單鏈核酸或雙鏈核酸或核酸修飾物。144、本發(fā)明中,所述grna與靶核酸上的靶序列至少有50%的匹配度,優(yōu)選至少60%,優(yōu)選至少70%,優(yōu)選至少80%,優(yōu)選至少90%。145、在一個實施方式中,當所述的靶序列含有一個或多個特征位點(如特定的突變位點或snp)時,所述的特征位點與grna完全匹配。146、在一個實施方式中,所述檢測方法中可以包含一種或多種導向序列互不相同的grna,其靶向不同的靶序列。147、本發(fā)明中,所述單鏈核酸檢測器包括但不限于單鏈dna、單鏈rna、dna-rna雜交體、核酸類似物、堿基修飾物、以及含有無堿基間隔物的單鏈核酸檢測器等;“核酸類似物”包括但不限于:鎖核酸、橋核酸、嗎啉核酸、乙二醇核酸、己糖醇核酸、蘇糖核酸、阿拉伯糖核酸、2’氧甲基rna、2’甲氧基乙?;鵵na、2’氟rna、2’氨基rna、4’硫rna及其組合,包括任選的核糖核苷酸或脫氧核糖核苷酸殘基。148、本發(fā)明中,所述可檢測信號通過以下方式實現(xiàn):基于視覺的檢測,基于傳感器的檢測,顏色檢測,基于熒光信號的檢測,基于金納米顆粒的檢測,熒光偏振,熒光檢測,膠體相變/分散,電化學檢測和基于半導體的檢測。149、本發(fā)明中,優(yōu)選的,所述單鏈核酸檢測器的兩端分別設置熒光基團和淬滅基團,當所述單鏈核酸檢測器被切割后,可以表現(xiàn)出可檢測的熒光信號。所述熒光基團選自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas?red或lc?red460中的一種或任意幾種;所述淬滅基團選自bhq1、bhq2、bhq3、dabcy1或tamra中的一種或任意幾種。150、在其他的實施方式中,所述單鏈核酸檢測器的5’端和3’端分別設置不同的標記分子,通過膠體金檢測的方式,檢測所述單鏈核酸檢測器被cas蛋白切割前和被cas蛋白切割后的膠體金測試結果;所述單鏈核酸檢測器被cas蛋白切割前和被cas蛋白切割后在膠體金的檢測線和質控線上將表現(xiàn)出不同的顯色結果。151、在一些實施方案中,檢測靶核酸的方法還可以包括將可檢測信號的電平與參考信號電平進行比較,以及基于可檢測信號的電平確定樣品中靶核酸的量。152、在一些實施方案中,檢測靶核酸的方法還可以包括在不同的通道上使用rna報告核酸和dna報告核酸(例如,熒光顏色),并通過測量rna和dna報告分子的信號電平,以及通過測量rna和dna報告分子中靶核酸的量來確定可檢測信號的電平,基于組合(例如,使用最小或乘積)可檢測信號的電平來采樣。153、在一個實施方式中,所述靶核酸存在于細胞內。154、在一個實施方式中,所述細胞是原核細胞。155、在一個實施方式中,所述細胞是真核細胞。156、在一個實施方式中,所述細胞是動物細胞。157、在一個實施方式中,所述細胞是人類細胞。158、在一個實施方式中,所述細胞是植物細胞,例如栽培植物(如木薯、玉米、高粱、小麥或水稻)、藻類、樹或蔬菜具有的細胞。159、在一個實施方式中,所述靶基因存在于體外的核酸分子(例如,質粒)中。160、在一個實施方式中,所述靶基因存在于質粒中。161、術語定義162、在本發(fā)明中,除非另有說明,否則本文中使用的科學和技術名詞具有本領域技術人員所通常理解的含義。并且,本文中所用的分子遺傳學、核酸化學、化學、分子生物學、生物化學、細胞培養(yǎng)、微生物學、細胞生物學、基因組學和重組dna等操作步驟均為相應領域內廣泛使用的常規(guī)步驟。同時,為了更好地理解本發(fā)明,下面提供相關術語的定義和解釋。163、cas蛋白164、在本發(fā)明中,cas蛋白、cas酶、cas效應蛋白可以互換使用;本發(fā)明人首次發(fā)現(xiàn)并鑒定了一種cas效應蛋白,其具有選自下列的氨基酸序列:165、(i)seq?id?no.1-7任一所示的序列;166、(ii)與seq?id?no.1-7任一所示的序列相比具有一個或多個氨基酸的置換、缺失或添加(例如1個,2個,3個,4個,5個,6個,7個,8個,9個或10個氨基酸的置換、缺失或添加)的序列;或167、(iii)與seq?id?no.1-7任一所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。168、本文中的核酸切割或切割核酸包括:由本文所述cas酶產生的靶核酸中的dna或rna斷裂(cis切割)、dna或rna在側枝核酸底物(單鏈核酸底物)中的斷裂(即非特異性或非靶向性,trans切割)。在一些實施方式中,所述切割是雙鏈dna斷裂。在一些實施方案中,切割是單鏈dna斷裂或單鏈rna斷裂。169、crispr系統(tǒng)170、如本文中所使用的,術語“規(guī)律成簇的間隔短回文重復(crispr)-crispr-相關(cas)(crispr-cas)系統(tǒng)”或“crispr系統(tǒng)”可互換地使用并且具有本領域技術人員通常理解的含義,其通常包含與crispr相關(“cas”)基因的表達有關的轉錄產物或其他元件,或者能夠指導所述cas基因活性的轉錄產物或其他元件。171、crispr/cas復合物172、如本文中所使用的,術語“crispr/cas復合物”是指,指導rna(guide?rna)或成熟crrna與cas蛋白結合所形成的復合體,其包含雜交到靶序列的引導序列上并且與cas蛋白結合的同向重復序列,該復合體能夠識別并切割能與該指導rna或成熟crrna雜交的多核苷酸。173、指導rna(guide?rna,grna)174、如本文中所使用的,術語“指導rna(guide?rna,grna)”、“成熟crrna”、“指導序列”可互換地使用并且具有本領域技術人員通常理解的含義。一般而言,指導rna可以包含同向重復序列(direct?repeat)和引導序列,或者基本上由或由同向重復序列和引導序列組成。175、在某些情況下,指導序列是與靶序列具有足夠互補性從而與所述靶序列雜交并引導crispr/cas復合物與所述靶序列的特異性結合的任何多核苷酸序列。在一個實施方式中,當最佳比對時,指導序列與其相應靶序列之間的互補程度為至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。確定最佳比對在本領域的普通技術人員的能力范圍內。例如,存在公開和可商購的比對算法和程序,諸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。176、靶序列177、“靶序列”是指被grna中的引導序列所靶向的多核苷酸,例如與該引導序列具有互補性的序列,其中靶序列與引導序列之間的雜交將促進crispr/cas復合物(包括cas蛋白和grna)的形成。完全互補性不是必需的,只要存在足夠互補性以引起雜交并且促進一種crispr/cas復合物的形成即可。178、靶序列可以包含任何多核苷酸,如dna或rna。在某些情況下,所述靶序列位于細胞內或細胞外。在某些情況下,所述靶序列位于細胞的細胞核或細胞質中。在某些情況下,該靶序列可位于真核細胞的一個細胞器例如線粒體或葉綠體內??杀挥糜谥亟M到包含該靶序列的靶基因座中的序列或模板被稱為“編輯模板”或“編輯多核苷酸”或“編輯序列”。在一個實施方式中,所述編輯模板為外源核酸。在一個實施方式中,該重組是同源重組。179、在本發(fā)明中,“靶序列”或“靶多核苷酸”或“靶核酸”可以是對細胞(例如,真核細胞)而言任何內源或外源的多核苷酸。例如,該靶多核苷酸可以是一種存在于真核細胞的細胞核中的多核苷酸。該靶多核苷酸可以是一個編碼基因產物(例如,蛋白質)的序列或一個非編碼序列(例如,調節(jié)多核苷酸或無用dna)。在某些情況下,該靶序列應該與原間隔序列臨近基序(pam)相關。180、單鏈核酸檢測器181、本發(fā)明所述的單鏈核酸檢測器是指含有2-200個核苷酸的序列,優(yōu)選,具有2-150個核苷酸,優(yōu)選,3-100個核苷酸,優(yōu)選,3-30個核苷酸,優(yōu)選,4-20個核苷酸,更優(yōu)選,5-15個核苷酸。優(yōu)選為單鏈dna分子、單鏈rna分子或單鏈dna-rna雜交體。182、所述的單鏈核酸檢測器兩端包括不同的報告基團或標記分子,當其處于初始狀態(tài)(即未被切割狀態(tài)時)不呈現(xiàn)報告信號,當該單鏈核酸檢測器被切割后,呈現(xiàn)出可檢測的信號,即切割后與切割前表現(xiàn)出可檢測的區(qū)別。183、在一個實施方式中,所述的報告基團或標記分子包括熒光基團和淬滅基團,所述熒光基團選自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas?red或lc?red460中的一種或任意幾種;所述淬滅基團選自bhq1、bhq2、bhq3、dabcy1或tamra中的一種或任意幾種。184、在一個實施方式中,所述的單鏈核酸檢測器具有連接至5’端第一分子(如fam或fitc)和連接至3’端的第二分子(如生物素)。所述的含有單鏈核酸檢測器的反應體系與流動條配合用以檢測靶核酸(優(yōu)選,膠體金檢測方式)。所述的流動條被設計為具有兩條捕獲線,在樣品接觸端(膠體金)設有結合第一分子的抗體(即第一分子抗體),在第一線(control?line)處含有結合第一分子抗體的抗體,在第二線(test?line)處含有與第二分子結合的第二分子的抗體(即第二分子抗體,如親和素)。當反應沿著條帶流動時,第一分子抗體與第一分子結合攜帶切割或未切割的寡核苷酸至捕獲線,切割的報告子將在第一個捕獲線處結合第一分子抗體的抗體,而未切割的報告子將在第二捕獲線處結合第二分子抗體。報告基團在各條線的結合將導致強讀出/信號(例如顏色)。隨著更多的報告子被切割,更多的信號將在第一捕獲線處累積,并且在第二線處將出現(xiàn)更少的信號。在某些方面,本發(fā)明涉及如本文所述的流動條用于檢測核酸的用途。在某些方面,本發(fā)明涉及用本文定義的流動條檢測核酸的方法,例如(側)流測試或(側)流免疫色譜測定。在某些方面,所述單鏈核酸檢測器中的分子可相互替換,或改變分子的位置,只要其報告原理與本發(fā)明相同或相近,所改進的方式也均包含在本發(fā)明中。185、本發(fā)明所述的檢測方法,可用于待檢測靶核酸的定量檢測。所述的定量檢測指標可以根據(jù)報告基團的信號強弱進行定量,如根據(jù)熒光基團的發(fā)光強度,或根據(jù)顯色條帶的寬度等。186、野生型187、如本文中所使用的,術語“野生型”具有本領域技術人員通常理解的含義,其表示生物、菌株、基因的典型形式或者當它在自然界存在時區(qū)別于突變體或變體形式的特征,其可從自然中的來源分離并且沒有被人為有意地修飾。188、衍生化189、如本文中所使用的,術語“衍生化”是指,對氨基酸、多肽或蛋白的化學修飾,其中一個或多個取代基已與所述氨基酸、多肽或蛋白共價連接。取代基也可稱為側鏈。190、衍生化的蛋白是該蛋白的衍生物,通常,蛋白的衍生化不會不利影響該蛋白的期望活性(例如,與指導rna結合的活性、核酸內切酶活性、在指導rna引導下與靶序列特定位點結合并切割的活性),也就是說蛋白的衍生物與蛋白有相同的活性。191、衍生化蛋白192、又稱“蛋白衍生物”,是指蛋白的經修飾形式,例如其中所述蛋白的一個或多個氨基酸可以被缺失、插入、修飾和/或取代。193、非天然存在的194、如本文中所使用的,術語“非天然存在的”或“工程化的”可互換地使用并且表示人工的參與。當這些術語用于描述核酸分子或多肽時,其表示該核酸分子或多肽至少基本上從它們在自然界中或如發(fā)現(xiàn)于自然界中的與其結合的至少另一種組分游離出來。195、直系同源物(orthologue,ortholog)196、如本文中所使用的,術語“直系同源物(orthologue,ortholog)”具有本領域技術人員通常理解的含義。作為進一步指導,如本文中所述的蛋白質的“直系同源物”是指屬于不同物種的蛋白質,該蛋白質執(zhí)行與作為其直系同源物的蛋白相同或相似的功能。197、同一性198、如本文中所使用的,術語“同一性”用于指兩個多肽之間或兩個核酸之間序列的匹配情況。當兩個進行比較的序列中的某個位置都被相同的堿基或氨基酸單體亞單元占據(jù)時(例如,兩個dna分子的每一個中的某個位置都被腺嘌呤占據(jù),或兩個多肽的每一個中的某個位置都被賴氨酸占據(jù)),那么各分子在該位置上是同一的。兩個序列之間的“百分數(shù)同一性”是由這兩個序列共有的匹配位置數(shù)目除以進行比較的位置數(shù)目×100的函數(shù)。例如,如果兩個序列的10個位置中有6個匹配,那么這兩個序列具有60%的同一性。例如,dna序列ctgact和caggtt共有50%的同一性(總共6個位置中有3個位置匹配)。通常,在將兩個序列比對以產生最大同一性時進行比較。這樣的比對可通過使用,例如,可通過計算機程序例如align程序(dnastar,inc.)方便地進行的needleman等人(1970)j.mol.biol.48:443-453的方法來實現(xiàn)。還可使用已整合入align程序(版本2.0)的e.meyers和w.miller(comput.applbiosci.,4:11-17(1988))的算法,使用pam120權重殘基表(weight?residue?table)、12的缺口長度罰分和4的缺口罰分來測定兩個氨基酸序列之間的百分數(shù)同一性。此外,可使用已整合入gcg軟件包(可在www.gcg.com上獲得)的gap程序中的needleman和wunsch(j?moibiol.48:444-453(1970))算法,使用blossum?62矩陣或pam250矩陣以及16、14、12、10、8、6或4的缺口權重(gap?weight)和1、2、3、4、5或6的長度權重來測定兩個氨基酸序列之間的百分數(shù)同一性。199、載體200、術語“載體”是指一種核酸分子,它能夠運送與其連接的另一種核酸分子。載體包括但不限于,單鏈、雙鏈、或部分雙鏈的核酸分子;包括一個或多個自由端、無自由端(例如環(huán)狀的)的核酸分子;包括dna、rna、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。載體可以通過轉化,轉導或者轉染導入宿主細胞,使其攜帶的遺傳物質元件在宿主細胞中獲得表達。一種載體可以被引入到宿主細胞中而由此產生轉錄物、蛋白質、或肽,包括由如本文所述的蛋白、融合蛋白、分離的核酸分子等(例如,crispr轉錄物,如核酸轉錄物、蛋白質、或酶)。一種載體可以含有多種控制表達的元件,包括但不限于,啟動子序列、轉錄起始序列、增強子序列、選擇元件及報告基因。另外,載體還可含有復制起始位點。201、一種類型的載體是“質?!?,其是指其中可以例如通過標準分子克隆技術插入另外的dna片段的環(huán)狀雙鏈dna環(huán)。202、另一種類型的載體是病毒載體,其中病毒衍生的dna或rna序列存在于用于包裝病毒(例如,逆轉錄病毒、復制缺陷型逆轉錄病毒、腺病毒、復制缺陷型腺病毒、以及腺相關病毒)的載體中。病毒載體還包含由用于轉染到一種宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌復制起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主復制。203、其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞后整合到該宿主細胞的基因組中,并且由此與該宿主基因組一起復制。而且,某些載體能夠指導它們可操作連接的基因的表達。這樣的載體在此被稱為“表達載體”。204、宿主細胞205、如本文中所使用的,術語“宿主細胞”是指,可用于導入載體的細胞,其包括但不限于,如大腸桿菌或枯草菌等的原核細胞,如微生物細胞、真菌細胞、動物細胞和植物細胞的真核細胞。206、本領域技術人員將理解,表達載體的設計可取決于諸如待轉化的宿主細胞的選擇、所希望的表達水平等因素。207、調控元件208、如本文中所使用的,術語“調控元件”旨在包括啟動子、增強子、內部核糖體進入位點(ires)、和其他表達控制元件(例如轉錄終止信號,如多聚腺苷酸化信號和多聚u序列),其詳細描述可參考戈德爾(goeddel),《基因表達技術:酶學方法》(gene?expressiontechnology:methods?in?enzymology)185,學術出版社(academic?press),圣地亞哥(sandiego),加利福尼亞州(1990)。在某些情況下,調控元件包括指導一個核苷酸序列在許多類型的宿主細胞中的組成型表達的那些序列以及指導該核苷酸序列只在某些宿主細胞中表達的那些序列(例如,組織特異型調節(jié)序列)。組織特異型啟動子可主要指導在感興趣的期望組織中的表達,所述組織例如肌肉、神經元、骨、皮膚、血液、特定的器官(例如肝臟、胰腺)、或特殊的細胞類型(例如淋巴細胞)。在某些情況下,調控元件還可以時序依賴性方式(如以細胞周期依賴性或發(fā)育階段依賴性方式)指導表達,該方式可以是或者可以不是組織或細胞類型特異性的。在某些情況下,術語“調控元件”涵蓋的是增強子元件,如wpre;cmv增強子;在htlv-i的ltr中的r-u5’片段((mol.cell.biol.,第8(1)卷,第466-472頁,1988);sv40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(proc.natl.acad.sci.usa.,第78(3)卷,第1527-31頁,1981)。209、啟動子210、如本文中所使用的,術語“啟動子”具有本領域技術人員公知的含義,其是指一段位于基因的上游能啟動下游基因表達的非編碼核苷酸序列。組成型(constitutive)啟動子是這樣的核苷酸序列:當其與編碼或者限定基因產物的多核苷酸可操作地相連時,在細胞的大多數(shù)或者所有生理條件下,其導致細胞中基因產物的產生。誘導型啟動子是這樣的核苷酸序列,當可操作地與編碼或者限定基因產物的多核苷酸相連時,基本上只有當對應于所述啟動子的誘導物在細胞中存在時,其導致所述基因產物在細胞內產生。組織特異性啟動子是這樣的核苷酸序列:當可操作地與編碼或者限定基因產物的多核苷酸相連時,基本上只有當細胞是該啟動子對應的組織類型的細胞時,其才導致在細胞中產生基因產物。211、nls212、“核定位信號”或“核定位序列”(nls)是對蛋白質“加標簽”以通過核轉運導入細胞核的氨基酸序列,即,具有nls的蛋白質被轉運至細胞核。典型地,nls包含暴露在蛋白質表面的帶正電荷的lys或arg殘基。示例性核定位序列包括但不限于來自以下的nls:sv40大t抗原,egl-13,c-myc以及tus蛋白。在一些實施例中,該nls包含pkkkrkv序列。在一些實施例中,該nls包含avkrpaatkkagqakkkkld序列。在一些實施例中,該nls包含paakrvkld序列。在一些實施例中,該nls包含msrrrkanptklsenakklakeven序列。在一些實施例中,該nls包含klkikrpvk序列。其他核定位序列包括但不限于hnrnp?a1的酸性m9結構域、酵母轉錄抑制子matα2中的序列kipik和py-nls。213、可操作地連接214、如本文中所使用的,術語“可操作地連接”旨在表示感興趣的核苷酸序列以一種允許該核苷酸序列的表達的方式被連接至該一種或多種調控元件(例如,處于一種體外轉錄/翻譯系統(tǒng)中或當該載體被引入到宿主細胞中時,處于該宿主細胞中)。215、互補性216、如本文中所使用的,術語“互補性”是指核酸與另一個核酸序列借助于傳統(tǒng)的沃森-克里克或其他非傳統(tǒng)類型形成一個或多個氫鍵的能力。互補百分比表示一個核酸分子中可與一個第二核酸序列形成氫鍵(例如,沃森-克里克堿基配對)的殘基的百分比(例如,10個之中有5、6、7、8、9、10個即為50%、60%、70%、80%、90%、和100%互補)?!巴耆パa”表示一個核酸序列的所有連續(xù)殘基與一個第二核酸序列中的相同數(shù)目的連續(xù)殘基形成氫鍵。如本文使用的“基本上互補”是指在一個具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個或更多個核苷酸的區(qū)域上至少為60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補程度,或者是指在嚴格條件下雜交的兩個核酸。217、嚴格條件218、如本文中所使用的,對于雜交的“嚴格條件”是指與靶序列具有互補性的一個核酸主要地與該靶序列雜交并且基本上不雜交到非靶序列上的條件。嚴格條件通常是序列依賴性的,并且取決于許多因素而變化。一般而言,該序列越長,則該序列特異性地雜交到其靶序列上的溫度就越高。219、雜交220、術語“雜交”或“互補的”或“基本上互補的”是指核酸(例如rna、dna)包含使其能夠非共價結合的核苷酸序列,即以序列特異性,反平行的方式(即核酸特異性結合互補核酸)與另一核酸形成堿基對和/或g/u堿基對,“退火”或“雜交”。221、雜交需要兩個核酸含有互補序列,盡管堿基之間可能存在錯配。兩個核酸之間雜交的合適條件取決于核酸的長度和互補程度,這是本領域公知的變量。典型地,可雜交核酸的長度為8個核苷酸或更多(例如,10個核苷酸或更多,12個核苷酸或更多,15個核苷酸或更多,20個核苷酸或更多,22個核苷酸或更多,25個核苷酸或更多,或30個核苷酸或更多)。222、應當理解,多核苷酸的序列不需要與其靶核酸的序列100%互補以特異性雜交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或與其雜交的靶核酸序列中的靶區(qū)域的序列互補性為100%。223、靶序列與grna的雜交代表靶序列和grna的核酸序列至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的可以雜交,形成復合物;或者代表靶序列和grna的核酸序列至少有12個、15個、16個、17個、18個、19個、20個、21個、22個或更多個堿基可以互補配對,雜交形成復合物。224、表達225、如本文中所使用的,術語“表達”是指,藉此從dna模板轉錄成多核苷酸(如轉錄成mrna或其他rna轉錄物)的過程和/或轉錄的mrna隨后藉此翻譯成肽、多肽或蛋白質的過程。轉錄物和編碼的多肽可以總稱為“基因產物”。如果多核苷酸來源于基因組dna,表達可以包括真核細胞中mrna的剪接。226、接頭227、如本文中所使用的,術語“接頭”是指,由多個氨基酸殘基通過肽鍵連接形成的線性多肽。本發(fā)明的接頭可以為人工合成的氨基酸序列,或天然存在的多肽序列,例如具有鉸鏈區(qū)功能的多肽。此類接頭多肽是本領域眾所周知的(參見例如,holliger,p.等人(1993)proc.natl.acad.sci.usa?90:6444-6448;poljak,r.j.等人(1994)structure?2:1121-1123)。228、治療229、如本文中所使用的,術語“治療”是指,治療或治愈病癥,延緩病癥的癥狀的發(fā)作,和/或延緩病癥的發(fā)展。230、受試者231、如本文中所使用的,術語“受試者”包括但不限于各種動物、植物和微生物。232、動物233、例如哺乳動物,例如??苿游?、馬科動物、羊科動物、豬科動物、犬科動物、貓科動物、兔科動物、嚙齒類動物(例如,小鼠或大鼠)、非人靈長類動物(例如,獼猴或食蟹猴)或人。在某些實施方式中,所述受試者(例如人)患有病癥(例如,疾病相關基因缺陷所導致的病癥)。234、植物235、術語“植物”應理解為能夠進行光合作用的任何分化的多細胞生物,在包括處于任何成熟或發(fā)育階段的作物植物,特別是單子葉或雙子葉植物,蔬菜作物,包括洋薊、球莖甘藍、芝麻菜、韭蔥、蘆筍、萵苣(例如,結球萵苣、葉萵苣、長葉萵苣)、小白菜(bok?choy)、黃肉芋、瓜類(例如,甜瓜、西瓜、克倫肖瓜(crenshaw)、白蘭瓜、羅馬甜瓜)、油菜作物(例如,球芽甘藍、卷心菜、花椰菜、西蘭花、羽衣甘藍、無頭甘藍、大白菜、小白菜)、刺菜薊、胡蘿卜、洋白菜(napa)、秋葵、洋蔥、芹菜、歐芹、鷹嘴豆、歐洲防風草、菊苣、胡椒、馬鈴薯、葫蘆(例如,西葫蘆、黃瓜、小西葫蘆、倭瓜、南瓜)、蘿卜、干球洋蔥、蕪菁甘藍、紫茄子(也稱為茄子)、婆羅門參、苣菜、青蔥、苦苣、大蒜、菠菜、綠洋蔥、倭瓜、綠葉菜類(greens)、甜菜(糖甜菜和飼料甜菜)、甘薯、唐萵苣、山葵、西紅柿、蕪菁、以及香辛料;水果和/或蔓生作物,如蘋果、杏、櫻桃、油桃、桃、梨、李子、西梅、櫻桃、榅桲、杏仁、栗子、榛子、山核桃、開心果、胡桃、柑橘、藍莓、博伊增莓(boysenberry)、小紅莓、穗醋栗、羅甘莓、樹莓、草莓、黑莓、葡萄、鱷梨、香蕉、獼猴桃、柿子、石榴、菠蘿、熱帶水果、梨果、瓜、芒果、木瓜、以及荔枝;大田作物,如三葉草、苜蓿、月見草、白芒花、玉米/玉蜀黍(飼料玉米、甜玉米、爆米花)、啤酒花、荷荷芭、花生、稻、紅花、小粒谷類作物(大麥、燕麥、黑麥、小麥等)、高粱、煙草、木棉、豆科植物(豆類、小扁豆、豌豆、大豆)、含油植物(油菜、芥菜、橄欖、向日葵、椰子、蓖麻油植物、可可豆、落花生)、擬南芥屬、纖維植物(棉花、亞麻、黃麻)、樟科(肉桂、莰酮)、或一種植物如咖啡、甘蔗、茶、以及天然橡膠植物;和/或花壇植物,如開花植物、仙人掌、肉質植物和/或觀賞植物,以及樹如森林(闊葉樹和常綠樹,如針葉樹)、果樹、觀賞樹、以及結堅果的樹(nut-bearing?tree)、以及灌木和其他苗木。236、發(fā)明的有益效果237、本發(fā)明發(fā)現(xiàn)了一類新型的cas酶,其可以在體內和體外表現(xiàn)出核酸酶的活性,具有廣泛的應用前景。238、下面將結合附圖和實施例對本發(fā)明的實施方案進行詳細描述,但是本領域技術人員將理解,下列附圖和實施例僅用于說明本發(fā)明,而不是對本發(fā)明的范圍的限定。根據(jù)附圖和優(yōu)選實施方案的下列詳細描述,本發(fā)明的各種目的和有利方面對于本領域技術人員來說將變得顯然。當前第1頁12當前第1頁12