本發(fā)明屬于生物技術(shù)領(lǐng)域,具體涉及一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用。
背景技術(shù):
轉(zhuǎn)座子(transposon)是指在基因組上能從一個位點轉(zhuǎn)移到另一個位點的一段DNA序列。自20世紀40年代美國遺傳學家McClintock首先在玉米中發(fā)現(xiàn)轉(zhuǎn)座子(Ac/Ds)以來,科學家們發(fā)現(xiàn)了多種類型的轉(zhuǎn)座子,它們廣泛存在于細菌、酵母和高等動植物中。隨著人們在分子水平上對轉(zhuǎn)座子結(jié)構(gòu)和功能認識的不斷深化,一些轉(zhuǎn)座子已被改造為基因標簽應用于基因分析,并逐漸成為大規(guī)模分離基因的重要手段之一。
Mariner-Like轉(zhuǎn)座子(Mariner-Like Elements,MLE)是轉(zhuǎn)座子中一個重要家族,最早是在研究毛里塔尼亞果蠅(Drosophila mauristiana)白眼基因的一個不穩(wěn)定突變時發(fā)現(xiàn)的。此后在其他動物以及植物基因組中也發(fā)現(xiàn)了大量MLE轉(zhuǎn)座子的存在。與其它轉(zhuǎn)座子相比較,MLE轉(zhuǎn)座子具有結(jié)構(gòu)簡單、異源轉(zhuǎn)座率高、在基因組插入位點接近隨機等特點,在開發(fā)基因標簽,分離基因,研究基因功能上,遠遠優(yōu)于其他轉(zhuǎn)座子。
MLE轉(zhuǎn)座子由兩端反向重復序列(Terminal Inverted Repeats,TIRs)和編碼轉(zhuǎn)座酶的基因組成,轉(zhuǎn)座酶負責催化轉(zhuǎn)座子轉(zhuǎn)座,因此轉(zhuǎn)座酶的活性是影響轉(zhuǎn)座子的轉(zhuǎn)座頻率的主要因素。然而自然界分離的MLE轉(zhuǎn)座酶由于在進化過程中“垂直失活”效應積累了或多或少的突變,部分或全部喪失了催化轉(zhuǎn)座能力,成為低活性或非活性的轉(zhuǎn)座酶,嚴重影響了MLE轉(zhuǎn)座子的應用,因此人工構(gòu)建高活性的轉(zhuǎn)座酶就顯得十分重要。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用,解決了現(xiàn)有自然界分離的MLE轉(zhuǎn)座酶催化活性較低或者不具備催化活性的問題。
本發(fā)明提供了一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體,所述的Ppmar1轉(zhuǎn)座酶C296I突變體的氨基酸序列如SEQ ID NO.1所示。
本發(fā)明還提供了一種編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因,編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因的核苷酸序列如SEQ ID NO.2所示。
本發(fā)明還提供了一種重組質(zhì)粒,所述重組質(zhì)粒攜帶有編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因。
本發(fā)明還提供了一種工程菌株,所述工程菌株攜帶有上述重組質(zhì)粒。
本發(fā)明還提供了一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體在構(gòu)建酵母突變體中的應用。
與現(xiàn)有技術(shù)相比,本發(fā)明提供的一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體,具有以下有益效果:
本發(fā)明從毛竹中克隆到的活性轉(zhuǎn)座酶,對其進行人工改造之后獲得較高活性的MLE轉(zhuǎn)座酶突變體(Ppmar1轉(zhuǎn)座酶C296I突變體),Ppmar1轉(zhuǎn)座酶C296I突變體催化轉(zhuǎn)座子轉(zhuǎn)座的活性是野生型轉(zhuǎn)座酶的活性的2.67倍,為利用MLE轉(zhuǎn)座子開發(fā)基因標簽奠定了基礎(chǔ),為后基因組時代大規(guī)模分離和標記基因,研究基因的功能提供了新工具。
具體實施方式
下面結(jié)合具體實施方式對本發(fā)明進行詳細說明,但應當理解本發(fā)明的保護范圍并不受具體實施方式的限制。下列實施例中未注明具體條件的試驗方法,通常按照常規(guī)條件操作,如Sambrook等主編的《分子克隆實驗指南》中所述條件,或按照試劑盒陳述的步驟進行操作,由于不涉及發(fā)明點,故不對其步驟進行詳細描述。
當實施例給出數(shù)值范圍時,應理解,除非本發(fā)明另有說明,每個數(shù)值范圍的兩個端點以及兩個端點之間任何一個數(shù)值均可選用。除非另外定義,本發(fā)明中使用的所有技術(shù)和科學術(shù)語與本技術(shù)領(lǐng)域技術(shù)人員通常理解的意義相同。除實施例中使用的具體方法、設(shè)備、材料外,根據(jù)本技術(shù)領(lǐng)域的技術(shù)人員對現(xiàn)有技術(shù)的掌握及本發(fā)明的記載,還可以使用與本發(fā)明實施例中所述的方法、設(shè)備、材料相似或等同的現(xiàn)有技術(shù)的任何方法、設(shè)備和材料來實現(xiàn)本發(fā)明。
一、野生型MLE轉(zhuǎn)座酶和去除轉(zhuǎn)座酶的非自主性轉(zhuǎn)座子的獲得
步驟1.1,采集新鮮的毛竹葉片(Phyllostachyspubescens,采集于浙江農(nóng)林大學植物園,北緯N30°15′14.67″東經(jīng)E119°43′33.47″),利用CTAB法提取毛竹基因組DNA,根據(jù)MLE轉(zhuǎn)座子TIR保守序列設(shè)計引物Ppmar1-5-3(Ppmar1-5-3的序列信息見表1),進行PCR擴增,得到MLE轉(zhuǎn)座子擴增產(chǎn)物。
PCR擴增的體系為20μl,包括0.2μl rTaq Polymerase(5U/μl),1μl Ppmar1-5-3(10μmol/L),2μl 10×rTaq Buffer(Mg2+plus),1.6μl dNTP mix(2.5mmol/L),100ng毛竹基因組DNA,加無菌水補齊20μl。
PCR擴增的反應條件為:預變性94℃5min;變性94℃30s,60℃30s,延伸72℃40s,35個循環(huán);72℃2min,4℃10min。
步驟1.2,擴增出序列后,采用TaKaRa公司pMDTM 18-T Vector Cloning Kit試劑盒的方法將步驟1.1的MLE轉(zhuǎn)座子擴增產(chǎn)物連接到pMD18-T載體,測序確認后,命名為Ppmar1轉(zhuǎn)座子,Ppmar1轉(zhuǎn)座子全長序列如SEQ ID NO.3所示。
步驟1.3,采用QIAGEN公司的RNeasy Mini Kit試劑盒提取毛竹葉片RNA,通過Invitrogen公司的SuperScriptTM VILOTM cDNA Synthesis Kit試劑盒將RNA反轉(zhuǎn)錄為cDNA,根據(jù)Ppmar1轉(zhuǎn)座酶序列設(shè)計一對引物PpTpase1-5和PpTpase1-3(PpTpase1-5和PpTpase1-3的序列信息見表1),進行PCR擴增,回收得到Ppmar1轉(zhuǎn)座酶擴增產(chǎn)物,即為Ppmar1轉(zhuǎn)座酶核苷酸序列。
PCR擴增的體系為20μl,包括0.2μl rTaq Polymerase(5U/μl),0.5μl PpTpase1-5(10μmol/L),0.5μl PpTpase1-3(10μmol/L),2μl 10×rTaq Buffer(Mg2+plus),1.6μl dNTP mix(2.5mmol/L),10ng毛竹葉片cDNA,加無菌水補齊20μl。
PCR擴增的反應條件為:預變性94℃5min;變性94℃30s,55℃30s,延伸72℃40s,35個循環(huán);72℃2min,4℃10min。
步驟1.4,采用TaKaRa公司pMDTM 18-T Vector Cloning Kit試劑盒的方法將步驟1.3的Ppmar1轉(zhuǎn)座酶核苷酸序列連接到pMD18-T載體克隆,測序確認,Ppmar1轉(zhuǎn)座酶核苷酸序列和相應的氨基酸序列分別如SEQ ID NO.4和SEQ ID NO.5所示。
將含有Ppmar1轉(zhuǎn)座子全長序列的pMD18-T載體用BseR I切除Ppmar1中間轉(zhuǎn)座酶的大部分序列。
酶切體系為50μl,包括5μl 10×buffer,1μl BseR I(1U/μl),1μg質(zhì)粒(含有Ppmar1全長序列的pMD18-T載體),加無菌水補齊50μl,37℃溫浴6小時?;厥召|(zhì)粒大片段,用T4DNA Ligase將質(zhì)粒大片段自連接,得到Ppmar1的非自主性轉(zhuǎn)座子pMD18-T-Ppmar1-Tn(Tn表示非自主性轉(zhuǎn)座子)。
其中,自連接的體系為10μl,包括1μl 10×T4DNA Ligase buffer,1μl T4DNA Ligase(10U/μl),50ng質(zhì)粒大片段,加無菌水補齊10μl,16℃溫浴8小時。
Ppmar1的非自主性轉(zhuǎn)座子的序列如SEQ ID NO.6所示。
二、酵母轉(zhuǎn)座表達載體的構(gòu)建
步驟2.1,Ppmar1轉(zhuǎn)座酶表達載體的構(gòu)建
將步驟1.3的Ppmar1轉(zhuǎn)座酶核苷酸序列經(jīng)Not I和EcoR V雙酶切,回收Ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段;將pAG413-gal-ccdB載體經(jīng)Not I和EcoR V雙酶切,回收pAG413-gal-ccdB載體酶切產(chǎn)物的大片段;且Ppmar1轉(zhuǎn)座酶核苷酸序列的雙酶切體系、雙酶切條件與pAG413-gal-ccdB載體的雙酶切體系、雙酶切條件均相同;
其中雙酶切體系為50μl,包括5μl 10×buffer,1μl Not I(1U/μl),1μl EcoR(1U/μl),1μg質(zhì)粒(Ppmar1轉(zhuǎn)座酶核苷酸序列或者pAG413-gal-ccdB載體),加無菌水補齊50μl,雙酶切條件為:37℃溫浴6小時。
將Ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段和pAG413-gal-ccdB載體酶切產(chǎn)物的大片段相連接;
連接體系為10μl,包括1μl 10×T4DNA Ligase buffer,1μl T4DNA Ligase(10U/μl),50ng pAG413-gal-ccdB載體酶切產(chǎn)物的大片段,20ng Ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段,加無菌水補齊10μl,16℃溫浴8小時。
此時完成了用Ppmar1轉(zhuǎn)座酶核苷酸序列替換pAG413-gal-ccdB質(zhì)粒中的ccdB核苷酸序列,得到重組質(zhì)粒pAG413-gal-Tpase(Tpase表示轉(zhuǎn)座酶);
該重組質(zhì)粒pAG413-gal-Tpase即為Ppmar1轉(zhuǎn)座酶表達載體,其攜帶有編碼所述Ppmar1轉(zhuǎn)座酶的基因。該表達載體具有His(組氨酸)篩選標記,使導入pAG413-gal-Tpase載體的宿主能夠缺乏His的缺失培養(yǎng)基上生長。
步驟2.2,Ppmar1非自主轉(zhuǎn)座子供體載體的構(gòu)建
以步驟1.4的Ppmar1的非自主性轉(zhuǎn)座子pMD18-T-Ppmar1-Tn為模板,利用Ppmar1-5-3引物擴增Ppmar1的非自主性轉(zhuǎn)座子,進行PCR擴增,得到Ppmar1的非自主性轉(zhuǎn)座子擴增產(chǎn)物。
PCR擴增的體系為20μl,包括0.2μl rTaq Polymerase(5U/μl),1μl Ppmar1-5-3(10μmol/L),2μl 10×rTaq Buffer(Mg2+plus),1.6μl dNTP mix(2.5mmol/L),10ng pMD18-T-Ppmar1-Tn,加無菌水補齊20μl。
PCR擴增的反應條件為:預變性94℃5min;變性94℃30s,60℃30s,延伸72℃40s,35個循環(huán);72℃2min,4℃10min。
同時,將載體pWL89a用Xho Ⅰ酶切(酶切位點位于ADE2基因內(nèi)),回收載體pWL89a骨架。酶切體系為50μl,包括5μl 10×buffer,1μl Xho Ⅰ(1U/μl),1μg載體pWL89a,加無菌水補齊50μl,37℃溫浴6小時。
然后用In-Fusion Advantage PCR Cloning Kit(TaKaRa公司,日本)將Ppmar1的非自主性轉(zhuǎn)座子擴增產(chǎn)物插入到載體pWL89a骨架的ADE2基因中,導致報告基因ADE2插入失活,得到pWL89a-Tn重組質(zhì)粒,即為Ppmar1非自主轉(zhuǎn)座子供體載體。若轉(zhuǎn)座子發(fā)生轉(zhuǎn)座從ADE2基因上離開,那么ADE2基因閱讀框得到回復。該載體具有URA3篩選標記,使導入pWL89a-Tn的宿主能夠在缺乏Ura(尿素)的缺失培養(yǎng)基上生長。
三、Ppmar1轉(zhuǎn)座酶C296I突變體的獲得
將Ppmar1轉(zhuǎn)座酶核苷酸序列與其他植物MLE轉(zhuǎn)座酶的核苷酸序列進行同源性比對,選取Ppmar1轉(zhuǎn)座酶核苷酸序列296位置上的半胱氨酸開展突變,計劃將其突變?yōu)楫惲涟彼?C296I)。
步驟3.1,根據(jù)QuikChangeTM Site-Directed Mutagenesis Kit(Stratagene公司,美國)試劑盒說明書,設(shè)計定點突變引物C296I-F和C296I-R(C296I-F和C296I-R的序列信息見表1),按照QuikChangeTM Site-Directed Mutagenesis Kit試劑盒方法,以步驟2.1的重組質(zhì)粒pAG413-gal-Tpase為模板,利用PfuTurboTM DNA polymerase重新合成含有Ppmar1轉(zhuǎn)座酶C296I突變體的質(zhì)粒DNA;
步驟3.2,然后在合成的質(zhì)粒DNA中加入2μL的Dpn I限制性內(nèi)切酶,于37℃條件下反應5min,將原始模板序列徹底降解。將新合成的質(zhì)粒DNA測序確認后得到Ppmar1轉(zhuǎn)座酶C296I突變體;
Ppmar1轉(zhuǎn)座酶C296I突變體的氨基酸序列如SEQ ID NO.1所示,編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因的核苷酸序列如SEQ ID NO.2所示。
四、轉(zhuǎn)座酶活性的檢測
實驗組是將步驟3.1的含有Ppmar1轉(zhuǎn)座酶C296I突變體的質(zhì)粒DNA和步驟2.2的pWL89a-Tn重組質(zhì)粒,用PEG/LiAc法共同轉(zhuǎn)化到酵母中,用His/Ura雙缺固體培養(yǎng)基上進行選擇培養(yǎng)。用半乳糖誘導轉(zhuǎn)座酶表達,促使非自主轉(zhuǎn)座子發(fā)生轉(zhuǎn)座。
以野生型Ppmar1轉(zhuǎn)座酶為對照組,步驟2.1的帶有野生型的Ppmar1轉(zhuǎn)座酶的重組質(zhì)粒pAG413-gal-Tpase和步驟2.2的pWL89a-Tn重組質(zhì)粒,用PEG/LiAc法共同轉(zhuǎn)化到酵母中,用His/Ura雙缺固體培養(yǎng)基上進行選擇培養(yǎng)。用半乳糖誘導轉(zhuǎn)座酶表達,促使非自主轉(zhuǎn)座子發(fā)生轉(zhuǎn)座。
實驗組和對照組的經(jīng)誘導培養(yǎng)的酵母用缺失His/Ura/Ade固體培養(yǎng)基上進行選擇培養(yǎng),計算培養(yǎng)基上長出的酵母菌斑。如果轉(zhuǎn)座發(fā)生,pWL89a-Tn重組質(zhì)粒上的ADE2基因就能表達,因此陽性酵母株能夠在缺乏腺嘌呤的培養(yǎng)基上生長。
以野生型Ppmar1轉(zhuǎn)座酶為對照,比較轉(zhuǎn)化有Ppmar1轉(zhuǎn)座酶C296I突變體的酵母菌落數(shù)目,篩選出較高活性的轉(zhuǎn)座酶突變株,結(jié)果如表2所示。
由表2可知,野生型Ppmar1轉(zhuǎn)座酶的陽性酵母菌落數(shù)量明顯小于Ppmar1轉(zhuǎn)座酶C296I突變體,且Ppmar1轉(zhuǎn)座酶C296I突變體催化轉(zhuǎn)座能力提高到原來的267%。這個高活性人工改造的Ppmar1轉(zhuǎn)座酶C296I突變體將為利用Ppmar1轉(zhuǎn)座子開發(fā)基因標簽奠定了重要基礎(chǔ)。
表1本發(fā)明應用的引物序列
表2不同轉(zhuǎn)座酶誘導的陽性酵母菌落數(shù)量和催化活性
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
序列表
<110> 浙江農(nóng)林大學
<120> 一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用
<160> 6
<170> PatentIn version 3.3
<210> 1
<211> 499
<212> PRT
<213> 人工序列
<400> 1
Met Ala Asp Pro Ile Asp Ser Gly Phe Asp Leu Asn Val Arg Leu Glu
1 5 10 15
Glu Asp Asp Asp Gly Asn Leu Pro Phe Asp Leu Asn Glu Pro Ile Leu
20 25 30
Glu Asp His Asn Asn Gly Ile Asp Leu Asn Leu Pro Leu Asp Glu Phe
35 40 45
Gly Ala Val Asp Phe Asp Tyr Val Gln Asn Leu Ala Glu Gln Asp Val
50 55 60
Glu Ala Pro Val Gln Val His Pro Pro Lys His Asp Tyr Pro Glu His
65 70 75 80
Val Arg Lys Leu Val Tyr Gln Ala Leu Leu Met Arg Ser Lys Asn Gly
85 90 95
Lys Leu Gly Asn His Asp Thr Thr Ile Val Ser Ser Gln Phe Gly Val
100 105 110
Lys Ile Arg Ser Val Gln Arg Ile Trp Lys Gln Gly Lys Asn Gln Leu
115 120 125
Ala Gln Asn Ile Pro Val Val Val Ala Asn Leu Lys Lys Gly Arg Ser
130 135 140
Gly Arg Lys Ala Thr Pro Leu Asp Leu Glu Gln Leu Arg Asn Ile Pro
145 150 155 160
Leu Lys Gln Arg Met Thr Ile Glu Asp Val Ser Ser Arg Leu Gly Ile
165 170 175
Ser Lys Ser Arg Ile Gln Arg Tyr Leu Lys Lys Gly Leu Leu Arg Arg
180 185 190
His Ser Ser Ser Ile Lys Pro Tyr Leu Thr Asp Ala Asn Lys Lys Thr
195 200 205
Arg Leu Lys Trp Cys Ile Asp Met Ile Glu Gln Gly Leu Val Asp Asp
210 215 220
Pro Lys Phe Arg Asp Leu Phe Asp Phe Val Phe Ile Asp Glu Lys Trp
225 230 235 240
Phe Asn Leu Ser Gln Lys Ser Glu Arg Tyr Tyr Leu Leu Pro Asp Glu
245 250 255
Asp Glu Pro His Arg Thr Cys Lys Asn Lys Asn Tyr Ile Pro Arg Ile
260 265 270
Met Phe Leu Cys Val Cys Ala Arg Pro Arg Phe Arg Asn Gly Glu Cys
275 280 285
Val Phe Asp Gly Lys Ile Gly Ile Phe Pro Leu Val Thr Phe Glu Gln
290 295 300
Ala Ile Arg Gly Ser Gln Asn Arg Leu Arg Gly Glu Gln Val Ile Lys
305 310 315 320
Pro Ile Gln Ser Ile Asn Arg Glu Val Ile Arg Asp Phe Met Ile Asn
325 330 335
Arg Val Leu Pro Ala Ile Arg Ala Lys Trp Pro Arg Glu Asp Val His
340 345 350
Lys Pro Ile Phe Ile Gln Gln Asp Asn Val Pro Ser His Leu Lys Val
355 360 365
Asp Asp Pro Gln Phe Arg Glu Val Ala Lys Gln Asp Gly Phe Asp Ile
370 375 380
Arg Leu Ile Cys Gln Pro Pro Asn Ser Pro Asp Phe Asn Ile Leu Asp
385 390 395 400
Leu Gly Phe Phe Arg Ala Ile Gln Ala Ile Gln Tyr Lys Lys Asp Ala
405 410 415
Lys Thr Leu Lys Asp Leu Ile Pro Ala Val Gln Gln Ala Phe Leu Glu
420 425 430
Tyr Ser Pro Trp Lys Ala Asn Arg Ile Phe Val Thr Leu Gln Thr Val
435 440 445
Leu Lys Glu Ala Met Lys Ile Lys Gly Cys Asn Lys Ile Lys Ile Pro
450 455 460
His Ile Gln Lys Gln Arg Leu Glu Arg Glu Asp Arg Leu Pro Leu Gln
465 470 475 480
Ile Pro Cys Glu Ala Ser Leu Leu Ala Glu Ala Leu Ala Ser Leu Pro
485 490 495
Ala Ala Asn
<210> 2
<211> 1500
<212> DNA
<213> 人工序列
<400> 2
atggctgacc caatagattc tggcttcgat ctgaacgttc ggttagaaga agatgatgac 60
ggcaatcttc cctttgatct caacgagcca atattggaag atcacaacaa tggaattgat 120
ttgaacttgc cattagatga gtttggtgcc gtcgacttcg actatgtaca aaacctcgct 180
gaacaagatg ttgaggctcc cgttcaagta caccctccga agcatgacta tcctgaacat 240
gttagaaaac tagtgtacca agcattgttg atgagaagca agaatgggaa actaggcaat 300
catgatacaa caattgtttc cagtcaattt ggagtaaaga ttcgatcagt tcagcgcata 360
tggaagcaag gtaaaaacca acttgctcaa aacattccgg tcgtggttgc taatctaaag 420
aaaggtagaa gtggccgtaa agcaacccct cttgatttgg aacaattgcg caacattcct 480
ctcaagcaaa gaatgaccat agaagatgtg tctagtagac ttggtattag caaatctagg 540
atacaaaggt atttgaaaaa gggtttgctt aggcgccact ctagtagcat aaaaccttac 600
ctcaccgatg ctaacaagaa gactaggttg aagtggtgca ttgacatgat tgagcaaggt 660
ttggttgatg atccaaagtt cagggatttg tttgactttg tgtttattga tgagaagtgg 720
ttctacctct ctcaaaaatc cgagagatac tacttgctac ccgacgaaga tgaaccacat 780
cgcacttgca agaacaagaa ttacatccct aggatcatgt ttttgtgtgt ttgtgctcgg 840
ccaagattta gaaatggaga atgtgtgttt gatggcaaaa taggtatttt tccactagtc 900
acttttgaac aagctattag aggaagccaa aaccgtcttc gtggagaaca agtaatcaag 960
ccaattcaat caattaatag ggaagtgata agagatttca tgataaatag agtgttgcct 1020
gcaattagag caaagtggcc aagagaagat gtacacaagc caattttcat acaacaagat 1080
aatgttccat ctcatttaaa ggtggatgat cctcagtttc gtgaggttgc taagcaagat 1140
gggtttgaca ttaggctcat atgtcaacca cccaattctc cagattttaa cattctagat 1200
ttgggttttt ttcgagctat tcaagcaatt caatacaaga aagatgctaa gacattgaaa 1260
gatctaattc cagcagtcca acaggcattt ttggagtact ctccatggaa agcaaatagg 1320
atatttgtga cactacaaac tgttttgaag gaagcaatga agataaaagg ttgcaacaaa 1380
atcaaaattc ctcacatcca gaaacaaaga cttgagagag aagataggct gccattgcaa 1440
atcccttgtg aagcttcctt gctagccgaa gcacttgcaa gccttcctgc agctaattag 1500
<210> 3
<211> 3435
<212> DNA
<213> 毛竹基因組
<400> 3
tactccctcc atacccgaaa ttcctgacgt ttaggacatg attgtggtaa ccaaggagtg 60
attaattagg ggttagtttt ccatctttgc ccctaataaa tatggttacg ggtgctcttt 120
gtacgagaaa gtaaaccagc tcgactggct agcgcgcgga ggcctcagtc ctgtggtgcg 180
cgttcgatac ctcgcggacg caggtttttt tcttgttgct gtttattcat ttttgcatgg 240
cactgtttag gcaacgcacg tcgcgcgcgc ttagccgctg cgggcgttag ttttcgagtg 300
gatttgggcc tggcgcacgg aggaggttgc atggctgccc gaaaatttcg ttgcatgcac 360
tggattttca aaattttgtc ctcgcgctgt ggaggctcgt ttgaggccgc gttttttttc 420
atctggcgcg ctggaaggcc gacgtttgga gtgctcgttg cttgttctat ttaaacgcct 480
ggaaccttcc ttgttgtctt cctatgccgg actcctgtac tatggctgac ccaatagatt 540
ctggcttcga tctgaacgtt cggttagaag aagatgatga cggcaatctt ccctttgatc 600
tcaacgagcc aatattggaa gatcacaaca atggtaagca aaaacgtcaa attagtttct 660
cagtttctcg tttccttttt tctttactga gcttgtcgtt tcctttttcg ataggaattg 720
atttgaactt gccattagat gagtttggtg ctgtcgactt cgactatgta caaaacctcg 780
ctggtaagca tggctagtat tatgaattcg cttgtttttt tatttccttt tgctggaaca 840
tgccgtgaat aatagtatta tgaactcgct tgttttttat ttccttttac tagaacatgt 900
gcttgtttta ttcctatagc tagatcatga cgtcaatact ttttacgatg aatatgctcg 960
ttacagtata gctagaacat gccgtgacta catagtagta tgaatatgct tgttttattt 1020
ctataactat aacatgccgt gagtatattt agatcatgcc gtgagtacta agtactatta 1080
aaatgcttgt tttttatttc cttttgctag aacaagatgt tgaggctccc gttcaagtac 1140
accctccgaa gcatgactat cctgaacatg ttagaaaact agtgtaccaa gcattgttga 1200
tgagaagcaa gaatgggaaa ctaggcaatc atgatacaac aattgtttcc agtcaatttg 1260
gagtaaagat tcgatcagtt cagcgcatat ggaagcaagg taaaaaccaa cttgctcaaa 1320
acattccggt cgtggttgct aatctaaaga aaggtagaag tggccgtaaa gcaacccctc 1380
ttgatttgga acaattgcgc aacattcctc tcaagcaaag aatgaccata gaagatgtgt 1440
ctagtagact tggtattagc aaatctagga tacaaaggta tttgaaaaag ggtttgctta 1500
ggcgccactc tagtagcata aaaccttacc tcaccgatgc taacaagaag actaggttga 1560
agtggtgcat tgacatgatt gagcaaggtt tggttgatga tccaaagttc agggatttgt 1620
ttgactttgt gtttattgat gagaagtggt tctacctctc tcaaaaatcc gagagatact 1680
acttgctacc cgacgaagat gaaccacatc gcacttgcaa gaacaagaat tacatcccta 1740
ggatcatgtt tttgtgtgtt tgtgctcggc caagatttag aaatggagaa tgtgtgtttg 1800
atggcaaaat aggttgtttt ccactagtca cttttgaaca agctattaga ggaagccaaa 1860
accgtcttcg tggagaacaa gtaatcaagc caattcaatc aatcaatagg gaagtgataa 1920
gagatttcat gataaataga gtgttgcctg caattagagc aaagtggcca agagaagatg 1980
tacacaagcc aattttcata caacaagata atgctccatc tcatttaaag gtggatgatc 2040
ctcagttttg tgaggttgct aagcaagatg ggtttgacat taggctcata tgtcaaccac 2100
ccaattctcc agattttaac attctagatt tgggtttttt tcgagctatt caagcaattc 2160
aatacaagaa agatgctaag acattgaaag atctaattcc agcagtccaa caggtaaatg 2220
atcatccatt acagtgttta aattgatctt gaacaaataa tataatcact gatcttgaac 2280
atgttttgta ggcatttttg gagtactctc catggaaagc aaataggata tttgtgacac 2340
tacaaactgt tttgaaggaa gcaatgaaga taaaaggttg caacaaaatc aaaattcctc 2400
acatccagaa acaaagactt gagagagaag ataggctgcc attgcaaatc ccttgtgaag 2460
cttccttgct agccgaagca cttgcaagcc ttcctgcggc taattagaag atgcaagcat 2520
gttactcttt tgcagcagca agcatgtaag aagacgcgag catgttagta gcaaactatg 2580
aacaaactag tttatgcatg tagtagtatg ttagcttgtg caccttagtc atctcgtccc 2640
aaccgcttga taacatgctc aggaagaagt attgtgtcac catccatttc aagtttctcc 2700
acatcaggaa tgtagacctc acaatcaaac ttttccatgt catcgagcca cttcgctgtc 2760
atgtcgtagt cttcatgtaa aaggccacaa cgggcacaca tgcgagcttc gcggcgagct 2820
tggtagcagg cttctccgaa gacgccgccg gcgtggaacg taacacagcg aggacacaga 2880
gactcgacgg agtcgggatc gacggtgtcg ggcaccatct cgagggagtc tgcaaccatg 2940
tcgacggagt ccggcagctc ctcgacggag tccggcacca tgtcgacggt gtccggcagc 3000
tcctcgacgg agtctggcac ctcctgcggc gccatgtcca cggtgtccag cgacgctatg 3060
gagcccgacg agatgtcctg cacggcgacg tccagcgccg caacggactc cgtcgtttcc 3120
atctgatccg acgaggcatc gacgtcctgc gacgagcgtg gcggcgagag cacggcgagc 3180
gggcaggcga gcgggcaggc gagcgagcca ttcgcgcgag cgatgaatgc gagctgctgt 3240
accaggcgca cacacgcgca atcaatgcgg gcgagtaacg atgcgagcat gcgcggcgga 3300
agcgcaacag acgggcagca gcgcatggcc aggggcaaac gcgtgaaaag aagaccacgc 3360
gaggccacaa cgtcagcttt tgcgcaaacg ggcacttcgc ctagaacgtc aggaatttcg 3420
ggtatggagg gagta 3435
<210> 4
<211> 1500
<212> DNA
<213> 人工序列
<400> 4
atggctgacc caatagattc tggcttcgat ctgaacgttc ggttagaaga agatgatgac 60
ggcaatcttc cctttgatct caacgagcca atattggaag atcacaacaa tggaattgat 120
ttgaacttgc cattagatga gtttggtgcc gtcgacttcg actatgtaca aaacctcgct 180
gaacaagatg ttgaggctcc cgttcaagta caccctccga agcatgacta tcctgaacat 240
gttagaaaac tagtgtacca agcattgttg atgagaagca agaatgggaa actaggcaat 300
catgatacaa caattgtttc cagtcaattt ggagtaaaga ttcgatcagt tcagcgcata 360
tggaagcaag gtaaaaacca acttgctcaa aacattccgg tcgtggttgc taatctaaag 420
aaaggtagaa gtggccgtaa agcaacccct cttgatttgg aacaattgcg caacattcct 480
ctcaagcaaa gaatgaccat agaagatgtg tctagtagac ttggtattag caaatctagg 540
atacaaaggt atttgaaaaa gggtttgctt aggcgccact ctagtagcat aaaaccttac 600
ctcaccgatg ctaacaagaa gactaggttg aagtggtgca ttgacatgat tgagcaaggt 660
ttggttgatg atccaaagtt cagggatttg tttgactttg tgtttattga tgagaagtgg 720
ttctacctct ctcaaaaatc cgagagatac tacttgctac ccgacgaaga tgaaccacat 780
cgcacttgca agaacaagaa ttacatccct aggatcatgt ttttgtgtgt ttgtgctcgg 840
ccaagattta gaaatggaga atgtgtgttt gatggcaaaa taggttgttt tccactagtc 900
acttttgaac aagctattag aggaagccaa aaccgtcttc gtggagaaca agtaatcaag 960
ccaattcaat caattaatag ggaagtgata agagatttca tgataaatag agtgttgcct 1020
gcaattagag caaagtggcc aagagaagat gtacacaagc caattttcat acaacaagat 1080
aatgttccat ctcatttaaa ggtggatgat cctcagtttc gtgaggttgc taagcaagat 1140
gggtttgaca ttaggctcat atgtcaacca cccaattctc cagattttaa cattctagat 1200
ttgggttttt ttcgagctat tcaagcaatt caatacaaga aagatgctaa gacattgaaa 1260
gatctaattc cagcagtcca acaggcattt ttggagtact ctccatggaa agcaaatagg 1320
atatttgtga cactacaaac tgttttgaag gaagcaatga agataaaagg ttgcaacaaa 1380
atcaaaattc ctcacatcca gaaacaaaga cttgagagag aagataggct gccattgcaa 1440
atcccttgtg aagcttcctt gctagccgaa gcacttgcaa gccttcctgc agctaattag 1500
<210> 5
<211> 499
<212> PRT
<213> 人工序列
<400> 5
Met Ala Asp Pro Ile Asp Ser Gly Phe Asp Leu Asn Val Arg Leu Glu
1 5 10 15
Glu Asp Asp Asp Gly Asn Leu Pro Phe Asp Leu Asn Glu Pro Ile Leu
20 25 30
Glu Asp His Asn Asn Gly Ile Asp Leu Asn Leu Pro Leu Asp Glu Phe
35 40 45
Gly Ala Val Asp Phe Asp Tyr Val Gln Asn Leu Ala Glu Gln Asp Val
50 55 60
Glu Ala Pro Val Gln Val His Pro Pro Lys His Asp Tyr Pro Glu His
65 70 75 80
Val Arg Lys Leu Val Tyr Gln Ala Leu Leu Met Arg Ser Lys Asn Gly
85 90 95
Lys Leu Gly Asn His Asp Thr Thr Ile Val Ser Ser Gln Phe Gly Val
100 105 110
Lys Ile Arg Ser Val Gln Arg Ile Trp Lys Gln Gly Lys Asn Gln Leu
115 120 125
Ala Gln Asn Ile Pro Val Val Val Ala Asn Leu Lys Lys Gly Arg Ser
130 135 140
Gly Arg Lys Ala Thr Pro Leu Asp Leu Glu Gln Leu Arg Asn Ile Pro
145 150 155 160
Leu Lys Gln Arg Met Thr Ile Glu Asp Val Ser Ser Arg Leu Gly Ile
165 170 175
Ser Lys Ser Arg Ile Gln Arg Tyr Leu Lys Lys Gly Leu Leu Arg Arg
180 185 190
His Ser Ser Ser Ile Lys Pro Tyr Leu Thr Asp Ala Asn Lys Lys Thr
195 200 205
Arg Leu Lys Trp Cys Ile Asp Met Ile Glu Gln Gly Leu Val Asp Asp
210 215 220
Pro Lys Phe Arg Asp Leu Phe Asp Phe Val Phe Ile Asp Glu Lys Trp
225 230 235 240
Phe Tyr Leu Ser Gln Lys Ser Glu Arg Tyr Tyr Leu Leu Pro Asp Glu
245 250 255
Asp Glu Pro His Arg Thr Cys Lys Asn Lys Asn Tyr Ile Pro Arg Ile
260 265 270
Met Phe Leu Cys Val Cys Ala Arg Pro Arg Phe Arg Asn Gly Glu Cys
275 280 285
Val Phe Asp Gly Lys Ile Gly Cys Phe Pro Leu Val Thr Phe Glu Gln
290 295 300
Ala Ile Arg Gly Ser Gln Asn Arg Leu Arg Gly Glu Gln Val Ile Lys
305 310 315 320
Pro Ile Gln Ser Ile Asn Arg Glu Val Ile Arg Asp Phe Met Ile Asn
325 330 335
Arg Val Leu Pro Ala Ile Arg Ala Lys Trp Pro Arg Glu Asp Val His
340 345 350
Lys Pro Ile Phe Ile Gln Gln Asp Asn Val Pro Ser His Leu Lys Val
355 360 365
Asp Asp Pro Gln Phe Arg Glu Val Ala Lys Gln Asp Gly Phe Asp Ile
370 375 380
Arg Leu Ile Cys Gln Pro Pro Asn Ser Pro Asp Phe Asn Ile Leu Asp
385 390 395 400
Leu Gly Phe Phe Arg Ala Ile Gln Ala Ile Gln Tyr Lys Lys Asp Ala
405 410 415
Lys Thr Leu Lys Asp Leu Ile Pro Ala Val Gln Gln Ala Phe Leu Glu
420 425 430
Tyr Ser Pro Trp Lys Ala Asn Arg Ile Phe Val Thr Leu Gln Thr Val
435 440 445
Leu Lys Glu Ala Met Lys Ile Lys Gly Cys Asn Lys Ile Lys Ile Pro
450 455 460
His Ile Gln Lys Gln Arg Leu Glu Arg Glu Asp Arg Leu Pro Leu Gln
465 470 475 480
Ile Pro Cys Glu Ala Ser Leu Leu Ala Glu Ala Leu Ala Ser Leu Pro
485 490 495
Ala Ala Asn
<210> 6
<211> 779
<212> DNA
<213> 人工序列
<400> 6
tactccctcc atacccgaaa ttcctgacgt ttaggacatg attgtggtaa ccaaggagtg 60
attaattagg ggttagtttt ccatctttgc ccctaataaa tatggttacg ggtgctcttt 120
gtacgagaaa gtaaaccagc tcgactggct agcgcgcgga ggcctcagtc ctgtggtgcg 180
cgttcgatac ctcgcggacg caggtttttt tcttgttgct gtttattcat ttttgcatgg 240
cactgtttag gcaacgcacg tcgcgcgcgc ttagccgctg cgggcgttag ttttcgagtg 300
gatttgggcc tggcgcacgg aggaggttgc atggctccgg cagctcctcg acggagtctg 360
gcacctcctg cggcgccatg tccacggtgt ccagcgacgc tatggagccc gacgagatgt 420
cctgcacggc gacgtccagc gccgcaacgg actccgtcgt ttccatctga tccgacgagg 480
catcgacgtc ctgcgacgag cgtggcggcg agagcacggc gagcgggcag gcgagcgggc 540
aggcgagcga gccattcgcg cgagcgatga atgcgagctg ctgtaccagg cgcacacacg 600
cgcaatcaat gcgggcgagt aacgatgcga gcatgcgcgg cggaagcgca acagacgggc 660
agcagcgcat ggccaggggc aaacgcgtga aaagaagacc acgcgaggcc acaacgtcag 720
cttttgcgca aacgggcact tcgcctagaa cgtcaggaat ttcgggtatg gagggagta 779