本發(fā)明屬于變異或遺傳工程領(lǐng)域,具體涉及一種用于植物c到k的堿基編輯器。
背景技術(shù):
1、堿基編輯器實(shí)現(xiàn)了高精度、高效率的單堿基編輯,為生命科學(xué)和醫(yī)藥等領(lǐng)域提供了強(qiáng)有力的工具,大大推動(dòng)了植物功能基因組學(xué)的研究和作物改良。目前為止,已經(jīng)開發(fā)了兩大類的堿基編輯器:基于脫氨酶的堿基編輯器(dbe)和基于糖基化酶的堿基編輯器(gbe)。所有的dbe堿基轉(zhuǎn)換都需要腺嘌呤(a)或者胞嘧啶(c)的脫氨作為第一步的關(guān)鍵步驟。近年來,也有研究人員基于進(jìn)化的人源n-甲基嘌呤dna糖基化酶(mpg)開發(fā)了一種可以直接對鳥嘌呤(g)進(jìn)行編輯的堿基編輯器。在植物中,不斷發(fā)展的dna堿基編輯器實(shí)現(xiàn)了對腺嘌呤(a)、胞嘧啶(c)和鳥嘌呤(g)的直接編輯,然而,尚未開發(fā)出實(shí)現(xiàn)高效無脫氨酶的胞嘧啶(c)到鳥嘌呤和胸腺嘧啶(k)的堿基編輯器。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是如何實(shí)現(xiàn)植物,尤其是水稻中的c到k(k為g或t)的堿基編輯。
2、為解決上述技術(shù)問題,本發(fā)明首先提供了一種蛋白質(zhì),所述蛋白質(zhì)為用于植物c到k的堿基編輯器(其名稱為ckbe),其含有cas蛋白和尿嘧啶dna糖基化酶,所述尿嘧啶dna糖基化酶如seq?id?no.2的第20-244位所示。
3、其中,所述cas蛋白是指包含cas9蛋白或其片段的rna引導(dǎo)的核酸酶(例如,包含cas9的活性、無活性或部分活性的dna切割結(jié)構(gòu)域,和/或cas9的grna結(jié)合結(jié)構(gòu)域的蛋白質(zhì)),其可為ncas9蛋白,如ncas9(d10a)。所述ncas9蛋白可如seq?id?no.2的第277-1643位所示。
4、上述堿基編輯器可以是由所述尿嘧啶dna糖基化酶、所述cas蛋白和核定位信號(hào)連接而成的蛋白質(zhì)。
5、所述核定位信號(hào)可為雙分型核定位序列(bpnls),如seq?id?no.2的第1-19位與第1648-1664位所示的雙分型核定位序列。
6、所述尿嘧啶dna糖基化酶、所述cas蛋白和核定位信號(hào)的連接可直接連接,也可通過常見的連接肽連接,只要不影響所述堿基編輯器的功能即可。在本發(fā)明的實(shí)施例中,所述連接肽為seq?id?no.2的第245-276位、第1644-1647位。
7、具體的,所述堿基編輯器可以是a1)seq?id?no.2所示的蛋白質(zhì),也可以是a2)將序列表中seq?id?no.2所示的氨基酸序列經(jīng)過一個(gè)或幾個(gè)氨基酸殘基的取代和/或缺失和/或添加且具有相同功能的蛋白質(zhì),還可以是a3)在a1)或a2)的n端或/和c端連接標(biāo)簽得到的融合蛋白質(zhì)。
8、上述a2)中的蛋白質(zhì),為與seq?id?no.2所示蛋白質(zhì)的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白質(zhì)。同一性是指氨基酸序列的同一性。可使用國際互聯(lián)網(wǎng)上的同源性檢索站點(diǎn)測定氨基酸序列的同一性,如ncbi主頁網(wǎng)站的blast網(wǎng)頁。例如,可在高級blast2.1中,通過使用blastp作為程序,將expect值設(shè)置為10,將所有filter設(shè)置為off,使用blosum62作為matrix,將gap?existence?cost,per?residue?gap?cost和lambdaratio分別設(shè)置為11,1和0.85(缺省值)并進(jìn)行檢索一對氨基酸序列的同一性進(jìn)行計(jì)算,然后即可獲得同一性的值(%)。所述具有75%或75%以上同一性可為具有75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上的同一性。
9、上述a2)中的蛋白質(zhì)可人工合成,也可先合成其編碼基因,再進(jìn)行生物表達(dá)得到。
10、上述a2)中的蛋白質(zhì)的編碼基因可通過將seq?id?no.1所示的dna序列中缺失一個(gè)或幾個(gè)氨基酸殘基的密碼子,和/或進(jìn)行一個(gè)或幾個(gè)堿基對的錯(cuò)義突變,和/或在其5′端和/或3′端連上標(biāo)簽的編碼序列得到。其中,seq?id?no.1所示的dna分子編碼seq?id?no.2所示的ckbe蛋白質(zhì)。
11、a3)中所述標(biāo)簽可為利用dna體外重組技術(shù),與目的蛋白一起融合表達(dá)的一種多肽或者蛋白,以便于目的蛋白的表達(dá)、檢測、示蹤和/或純化。所述標(biāo)簽可為poly-arg、poly-his、flag、strep-tag?ii、c-myc、mbp標(biāo)簽、ha標(biāo)簽、gst標(biāo)簽和/或sumo標(biāo)簽等。
12、上文中,所述連接是指蛋白質(zhì)或多肽間通過一個(gè)蛋白質(zhì)或多肽的c端的氨基酸殘基與另一個(gè)蛋白質(zhì)或多肽的n端的氨基酸殘基形成的肽鍵相連。
13、本發(fā)明還提供了與所述堿基編輯器相關(guān)的生物材料,所述生物材料為下述b1)-b7)中的至少一種:
14、b1)編碼所述堿基編輯器的核酸分子;
15、b2)含有b1)所述核酸分子的表達(dá)盒;
16、b3)含有b1)所述核酸分子的重組載體或含有b2)所述表達(dá)盒的重組載體;
17、b4)含有b1)所述核酸分子的重組微生物、含有b2)所述表達(dá)盒的重組微生物或含有b3)所述重組載體的重組微生物;
18、b5)含有b1)所述核酸分子的轉(zhuǎn)基因植物細(xì)胞系、含有b2)所述表達(dá)盒的轉(zhuǎn)基因植物細(xì)胞系或含有b3)所述重組載體的轉(zhuǎn)基因植物細(xì)胞系;
19、b6)含有b1)所述核酸分子的轉(zhuǎn)基因植物組織、含有b2)所述表達(dá)盒的轉(zhuǎn)基因植物組織或含有b3)所述重組載體的轉(zhuǎn)基因植物組織;
20、b7)含有b1)所述核酸分子的轉(zhuǎn)基因植物器官、含有b2)所述表達(dá)盒的轉(zhuǎn)基因植物器官或含有b3)所述重組載體的轉(zhuǎn)基因植物器官。
21、上述生物材料中,b1)所述核酸分子可為如下b11)或b12):
22、b11)編碼序列(cds)是核苷酸序列為序列表中seq?id?no.1的dna分子;
23、b12)與b11)限定的核苷酸序列具有75%或75%以上同一性,且編碼所述堿基編輯器的dna分子。
24、b11)所述dna分子具體可為編碼鏈的核苷酸序列是序列表中seq?id?no.1的dna分子。
25、本領(lǐng)域普通技術(shù)人員可以很容易地采用已知的方法,例如定向進(jìn)化和點(diǎn)突變的方法,對本發(fā)明的編碼ckbe的核苷酸序列進(jìn)行突變。那些經(jīng)過人工修飾的,具有與本發(fā)明的ckbe的核苷酸序列75%或者更高同一性的核苷酸,只要編碼ckbe且具有ckbe功能,均是衍生于本發(fā)明的核苷酸序列并且等同于本發(fā)明的序列。
26、這里使用的術(shù)語“同一性”指與天然核酸序列的序列相似性。“同一性”包括與本發(fā)明的編碼seq?id?no.2所示的氨基酸序列組成的蛋白質(zhì)的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或計(jì)算機(jī)軟件進(jìn)行評價(jià)。使用計(jì)算機(jī)軟件,兩個(gè)或多個(gè)序列之間的同一性可以用百分比(%)表示,其可以用來評價(jià)相關(guān)序列之間的同一性。
27、具體的,上述75%或75%以上同一性,可為75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上的同一性。
28、上述生物材料中,所述表達(dá)盒,是指能夠在宿主細(xì)胞(如植物細(xì)胞)中表達(dá)ckbe的dna,該dna不但可包括啟動(dòng)ckbe基因轉(zhuǎn)錄的啟動(dòng)子,還可包括終止ckbe基因轉(zhuǎn)錄的終止子。進(jìn)一步,所述表達(dá)盒還可包括增強(qiáng)子序列??捎糜诒景l(fā)明的啟動(dòng)子包括但不限于:組成型啟動(dòng)子,組織、器官和發(fā)育特異的啟動(dòng)子,和誘導(dǎo)型啟動(dòng)子。啟動(dòng)子的例子包括但不限于:玉米的ubiquitin啟動(dòng)子、花椰菜花葉病毒的組成型啟動(dòng)子?35s;?來自西紅柿的創(chuàng)傷誘導(dǎo)型啟動(dòng)子,亮氨酸氨基肽酶?("lap");來自煙草的化學(xué)誘導(dǎo)型啟動(dòng)子,病程相關(guān)蛋白?1?(pr1)(由水楊酸和?bth?(苯并噻二唑?-7-硫代羥酸?s-甲酯)誘導(dǎo));西紅柿蛋白酶抑制劑?ii啟動(dòng)子?(pin2)或?lap啟動(dòng)子?(均可用茉莉酮酸甲酯誘導(dǎo));?熱休克啟動(dòng)子?(美國專利?5,187,267);四環(huán)素誘導(dǎo)型啟動(dòng)子?(美國專利?5,057,422);種子特異性啟動(dòng)子,如谷子種子特異性啟動(dòng)子pf128(cn101063139b(中國專利2007?1?0099169.7)),種子貯存蛋白質(zhì)特異的啟動(dòng)子?(例如,菜豆球蛋白、napin,?oleosin和?大豆?beta?conglycin?的啟動(dòng)子)。它們可單獨(dú)使用或與其它的植物啟動(dòng)子結(jié)合使用。此處引用的所有參考文獻(xiàn)均全文引用。合適的轉(zhuǎn)錄終止子包括但不限于:農(nóng)桿菌胭脂堿合成酶終止子(nos終止子)、花椰菜花葉病毒camv?35s終止子、tml終止子、?豌豆rbcs?e9終止子和胭脂氨酸和章魚氨酸合酶終止子。
29、在本發(fā)明的一個(gè)實(shí)施例中,ckbe基因的表達(dá)由zmubi啟動(dòng)子驅(qū)動(dòng)。
30、上述生物材料中,所述載體可為質(zhì)粒、黏粒、噬菌體或病毒載體。
31、b3)所述重組載體具體可為pckbe。pckbe是將rabe8e載體的kpni與spei識(shí)別序列間的dna片段(含有bpnls、tada8e?v106w、32aa?linker以及ncas9的編碼基因)替換為seqid?no.1所示的ckbe基因得到的重組載體。pckbe含有sgrna的dna分子與ckbe基因,sgrna的轉(zhuǎn)錄由osu6啟動(dòng)子驅(qū)動(dòng),ckbe基因的表達(dá)由zmubi啟動(dòng)子驅(qū)動(dòng)。
32、上述生物材料中,所述微生物可為酵母、細(xì)菌、藻或真菌。其中,細(xì)菌可為農(nóng)桿菌,如農(nóng)桿菌eha105。
33、上述生物材料中,所述轉(zhuǎn)基因植物細(xì)胞系、轉(zhuǎn)基因植物組織和轉(zhuǎn)基因植物器官均可包括繁殖材料,也可不包括繁殖材料。
34、本發(fā)明還提供了植物c到k的堿基編輯方法,所述方法包括:將所述堿基編輯器的編碼基因(或其表達(dá)盒)以及sgrna的dna分子(或其表達(dá)盒)導(dǎo)入目的植物中,并使所述堿基編輯器與sgrna得到表達(dá)/轉(zhuǎn)錄,篩選目的序列中c到k編輯植物或組織,實(shí)現(xiàn)植物c到k的堿基編輯。
35、所述堿基編輯器的編碼基因(或其表達(dá)盒)以及靶向靶序列的sgrna的dna分子(或其表達(dá)盒)可通過同一個(gè)載體導(dǎo)入所述目的植物中,也可通過不同的載體導(dǎo)入所述目的植物中。
36、在本發(fā)明的實(shí)施例中,所述堿基編輯器的表達(dá)盒以及靶向靶序列的sgrna的表達(dá)盒通過pckbe導(dǎo)入所述目的植物中。
37、所述sgrna的靶標(biāo)序列是5′-n19-20pam-3′,所述n19-20為19-20個(gè)n,所述pam(protospacer?adjacent?motif)為ngg;所述n為a、g、c或t。
38、本發(fā)明還提供了所述堿基編輯器或所述生物材料在堿基編輯或在制備堿基編輯產(chǎn)品(試劑或試劑盒)中的應(yīng)用,所述堿基編輯為在植物中進(jìn)行c到k(或插入或缺失)的編輯。
39、本發(fā)明中,所述c到k的堿基編輯可為靶序列中位置2-7、9-11、13、15和16中任一位置的c的編輯。
40、靶序列中的位置依據(jù)與pam序列確定,遠(yuǎn)離pam序列的靶序列的第一位記為位置1,位置2、3……逐漸靠向pam序列。
41、本發(fā)明中,所述c到k的堿基編輯為pam序列為ngg的靶序列中的堿基編輯。
42、本發(fā)明中,所述植物可為m1)或m2)或m3):
43、m1)單子葉植物或雙子葉植物;
44、m2)禾本科植物;
45、m3)水稻。
46、實(shí)驗(yàn)證明,本發(fā)明的堿基編輯器在愈傷組織中的堿基編輯效率高達(dá)46.06%,t0代水稻植株在8個(gè)內(nèi)源靶點(diǎn)的分析顯示,ckbe實(shí)現(xiàn)了堿基編輯效率高達(dá)66.66%的有針對性的c到k的編輯,拓寬了堿基編輯器的范圍。通過精確解決影響植物性狀的單核苷酸變異,堿基編輯器為優(yōu)化作物性狀(如抗病性、抗旱性和產(chǎn)量)開辟了道路。
47、下面結(jié)合具體實(shí)施方式對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述,給出的實(shí)施例僅為了闡明本發(fā)明,而不是為了限制本發(fā)明的范圍。以下提供的實(shí)施例可作為本技術(shù)領(lǐng)域普通技術(shù)人員進(jìn)行進(jìn)一步改進(jìn)的指南,并不以任何方式構(gòu)成對本發(fā)明的限制。
48、術(shù)語“堿基編輯器(be)”或“核堿基編輯器(nbe)”是指包含能夠?qū)怂?例如,dna或rna)內(nèi)的堿基(例如,a、t、c、g或u)進(jìn)行修飾的多肽的試劑。
49、術(shù)語“核定位序列”或“nls”是指促進(jìn)蛋白質(zhì)輸入細(xì)胞核(例如通過核轉(zhuǎn)運(yùn))的氨基酸序列。
50、術(shù)語“啟動(dòng)子”是指核酸序列的控制區(qū)域,在該區(qū)域控制核酸序列的其余部分的起始和轉(zhuǎn)錄速率。啟動(dòng)子還可以含有調(diào)節(jié)蛋白和分子(如rna聚合酶和其他轉(zhuǎn)錄因子)可以結(jié)合的子區(qū)域。
51、術(shù)語“核酸”和“核酸分子”是指包含核堿基和酸性部分(例如核苷、核苷酸或核苷酸的聚合物)的化合物。通常,聚合核酸,例如包含三個(gè)或更多個(gè)核苷酸的核酸分子是線性分子,其中相鄰的核苷酸經(jīng)由磷酸二酯連接彼此連接。
52、術(shù)語“蛋白質(zhì)”、“肽”和“多肽”在本文中可互換使用,并且是指通過肽(酰胺)鍵連接在一起的氨基酸殘基的聚合物。該術(shù)語是指具有任何大小、結(jié)構(gòu)或功能的蛋白質(zhì)、肽或多肽。通常,蛋白質(zhì)、肽或多肽將是至少三個(gè)氨基酸長。蛋白質(zhì)、肽或多肽可以指個(gè)別的蛋白質(zhì)或蛋白質(zhì)的集合。蛋白質(zhì)、肽或多肽中的一個(gè)或多個(gè)氨基酸可以被修飾,例如通過添加化學(xué)實(shí)體如碳水化合物基團(tuán)、羥基、磷酸基團(tuán)、法呢基、異法呢基、脂肪酸基團(tuán),用于綴合、官能化或其他修飾的接頭等。蛋白質(zhì)、肽或多肽也可以是單個(gè)分子或者可以是多分子復(fù)合物。蛋白質(zhì)、肽或多肽可以僅僅是天然存在的蛋白質(zhì)或肽的片段。蛋白質(zhì)、肽或多肽可以是天然存在的、重組的或合成的,或其任何組合。如本文所用的術(shù)語“融合蛋白”是指包含來自至少兩種不同蛋白質(zhì)的蛋白質(zhì)結(jié)構(gòu)域的雜合多肽。一種蛋白質(zhì)可以位于融合蛋白的氨基端(n端)部分或羧基端(c端)蛋白質(zhì),從而分別形成“氨基端融合蛋白”或“羧基端融合蛋白”。蛋白質(zhì)可以包含不同的結(jié)構(gòu)域,例如核酸結(jié)合結(jié)構(gòu)域(例如指導(dǎo)蛋白質(zhì)與靶位點(diǎn)結(jié)合的cas9的grna結(jié)合結(jié)構(gòu)域)和核酸編輯蛋白的核酸切割結(jié)構(gòu)域或催化結(jié)構(gòu)域。
53、術(shù)語“rna引導(dǎo)的核酸酶”是指與一個(gè)或多個(gè)不是切割靶標(biāo)的rna形成復(fù)合物(例如,結(jié)合或締合)的核酸酶。通常,結(jié)合的rna稱為引導(dǎo)rna(grna)。grna可以作為兩個(gè)或更多個(gè)rna的復(fù)合物或者作為單個(gè)rna分子存在。作為單個(gè)rna分子存在的grna可以稱為單引導(dǎo)rna(sgrna)。
54、rna引導(dǎo)的核酸酶(例如cas9)使用rna:dna雜交來靶向dna切割位點(diǎn),所以這些蛋白質(zhì)原則上能夠被靶向到由引導(dǎo)rna規(guī)定的任何序列。
55、術(shù)語“靶位點(diǎn)”是指植物基因組中,在sgrna的引導(dǎo)下堿基編輯器的結(jié)合位置。
56、術(shù)語“重組”是指自然界中不存在,但是作為人工程化的產(chǎn)物的蛋白質(zhì)或核酸。