一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用的制作方法

文檔序號：12411660閱讀：294來源：國知局

本發(fā)明屬于生物技術(shù)領(lǐng)域，具體涉及一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用。

背景技術(shù)：

轉(zhuǎn)座子(transposon)是指在基因組上能從一個位點轉(zhuǎn)移到另一個位點的一段DNA序列。自20世紀40年代美國遺傳學家McClintock首先在玉米中發(fā)現(xiàn)轉(zhuǎn)座子(Ac/Ds)以來，科學家們發(fā)現(xiàn)了多種類型的轉(zhuǎn)座子，它們廣泛存在于細菌、酵母和高等動植物中。隨著人們在分子水平上對轉(zhuǎn)座子結(jié)構(gòu)和功能認識的不斷深化，一些轉(zhuǎn)座子已被改造為基因標簽應用于基因分析，并逐漸成為大規(guī)模分離基因的重要手段之一。

Mariner-Like轉(zhuǎn)座子(Mariner-Like Elements，MLE)是轉(zhuǎn)座子中一個重要家族，最早是在研究毛里塔尼亞果蠅(Drosophila mauristiana)白眼基因的一個不穩(wěn)定突變時發(fā)現(xiàn)的。此后在其他動物以及植物基因組中也發(fā)現(xiàn)了大量MLE轉(zhuǎn)座子的存在。與其它轉(zhuǎn)座子相比較，MLE轉(zhuǎn)座子具有結(jié)構(gòu)簡單、異源轉(zhuǎn)座率高、在基因組插入位點接近隨機等特點，在開發(fā)基因標簽，分離基因，研究基因功能上，遠遠優(yōu)于其他轉(zhuǎn)座子。

MLE轉(zhuǎn)座子由兩端反向重復序列(Terminal Inverted Repeats，TIRs)和編碼轉(zhuǎn)座酶的基因組成，轉(zhuǎn)座酶負責催化轉(zhuǎn)座子轉(zhuǎn)座，因此轉(zhuǎn)座酶的活性是影響轉(zhuǎn)座子的轉(zhuǎn)座頻率的主要因素。然而自然界分離的MLE轉(zhuǎn)座酶由于在進化過程中“垂直失活”效應積累了或多或少的突變，部分或全部喪失了催化轉(zhuǎn)座能力，成為低活性或非活性的轉(zhuǎn)座酶，嚴重影響了MLE轉(zhuǎn)座子的應用，因此人工構(gòu)建高活性的轉(zhuǎn)座酶就顯得十分重要。

技術(shù)實現(xiàn)要素：

本發(fā)明的目的是提供一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用，解決了現(xiàn)有自然界分離的MLE轉(zhuǎn)座酶催化活性較低或者不具備催化活性的問題。

本發(fā)明提供了一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體，所述的Ppmar1轉(zhuǎn)座酶C296I突變體的氨基酸序列如SEQ ID NO.1所示。

本發(fā)明還提供了一種編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因，編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因的核苷酸序列如SEQ ID NO.2所示。

本發(fā)明還提供了一種重組質(zhì)粒，所述重組質(zhì)粒攜帶有編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因。

本發(fā)明還提供了一種工程菌株，所述工程菌株攜帶有上述重組質(zhì)粒。

本發(fā)明還提供了一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體在構(gòu)建酵母突變體中的應用。

與現(xiàn)有技術(shù)相比，本發(fā)明提供的一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體，具有以下有益效果：

本發(fā)明從毛竹中克隆到的活性轉(zhuǎn)座酶，對其進行人工改造之后獲得較高活性的MLE轉(zhuǎn)座酶突變體(Ppmar1轉(zhuǎn)座酶C296I突變體)，Ppmar1轉(zhuǎn)座酶C296I突變體催化轉(zhuǎn)座子轉(zhuǎn)座的活性是野生型轉(zhuǎn)座酶的活性的2.67倍，為利用MLE轉(zhuǎn)座子開發(fā)基因標簽奠定了基礎(chǔ)，為后基因組時代大規(guī)模分離和標記基因，研究基因的功能提供了新工具。

具體實施方式

下面結(jié)合具體實施方式對本發(fā)明進行詳細說明，但應當理解本發(fā)明的保護范圍并不受具體實施方式的限制。下列實施例中未注明具體條件的試驗方法，通常按照常規(guī)條件操作，如Sambrook等主編的《分子克隆實驗指南》中所述條件，或按照試劑盒陳述的步驟進行操作，由于不涉及發(fā)明點，故不對其步驟進行詳細描述。

當實施例給出數(shù)值范圍時，應理解，除非本發(fā)明另有說明，每個數(shù)值范圍的兩個端點以及兩個端點之間任何一個數(shù)值均可選用。除非另外定義，本發(fā)明中使用的所有技術(shù)和科學術(shù)語與本技術(shù)領(lǐng)域技術(shù)人員通常理解的意義相同。除實施例中使用的具體方法、設(shè)備、材料外，根據(jù)本技術(shù)領(lǐng)域的技術(shù)人員對現(xiàn)有技術(shù)的掌握及本發(fā)明的記載，還可以使用與本發(fā)明實施例中所述的方法、設(shè)備、材料相似或等同的現(xiàn)有技術(shù)的任何方法、設(shè)備和材料來實現(xiàn)本發(fā)明。

一、野生型MLE轉(zhuǎn)座酶和去除轉(zhuǎn)座酶的非自主性轉(zhuǎn)座子的獲得

步驟1.1，采集新鮮的毛竹葉片(Phyllostachyspubescens，采集于浙江農(nóng)林大學植物園，北緯N30°15′14.67″東經(jīng)E119°43′33.47″)，利用CTAB法提取毛竹基因組DNA，根據(jù)MLE轉(zhuǎn)座子TIR保守序列設(shè)計引物Ppmar1-5-3(Ppmar1-5-3的序列信息見表1)，進行PCR擴增，得到MLE轉(zhuǎn)座子擴增產(chǎn)物。

PCR擴增的體系為20μl，包括0.2μl rTaq Polymerase(5U/μl)，1μl Ppmar1-5-3(10μmol/L)，2μl 10×rTaq Buffer(Mg²⁺plus)，1.6μl dNTP mix(2.5mmol/L)，100ng毛竹基因組DNA，加無菌水補齊20μl。

PCR擴增的反應條件為：預變性94℃5min；變性94℃30s，60℃30s，延伸72℃40s，35個循環(huán)；72℃2min，4℃10min。

步驟1.2，擴增出序列后，采用TaKaRa公司pMD^TM 18-T Vector Cloning Kit試劑盒的方法將步驟1.1的MLE轉(zhuǎn)座子擴增產(chǎn)物連接到pMD18-T載體，測序確認后，命名為Ppmar1轉(zhuǎn)座子，Ppmar1轉(zhuǎn)座子全長序列如SEQ ID NO.3所示。

步驟1.3，采用QIAGEN公司的RNeasy Mini Kit試劑盒提取毛竹葉片RNA，通過Invitrogen公司的SuperScript^TM VILO^TM cDNA Synthesis Kit試劑盒將RNA反轉(zhuǎn)錄為cDNA，根據(jù)Ppmar1轉(zhuǎn)座酶序列設(shè)計一對引物PpTpase1-5和PpTpase1-3(PpTpase1-5和PpTpase1-3的序列信息見表1)，進行PCR擴增，回收得到Ppmar1轉(zhuǎn)座酶擴增產(chǎn)物，即為Ppmar1轉(zhuǎn)座酶核苷酸序列。

PCR擴增的體系為20μl，包括0.2μl rTaq Polymerase(5U/μl)，0.5μl PpTpase1-5(10μmol/L)，0.5μl PpTpase1-3(10μmol/L)，2μl 10×rTaq Buffer(Mg²⁺plus)，1.6μl dNTP mix(2.5mmol/L)，10ng毛竹葉片cDNA，加無菌水補齊20μl。

PCR擴增的反應條件為：預變性94℃5min；變性94℃30s，55℃30s，延伸72℃40s，35個循環(huán)；72℃2min，4℃10min。

步驟1.4，采用TaKaRa公司pMD^TM 18-T Vector Cloning Kit試劑盒的方法將步驟1.3的Ppmar1轉(zhuǎn)座酶核苷酸序列連接到pMD18-T載體克隆，測序確認，Ppmar1轉(zhuǎn)座酶核苷酸序列和相應的氨基酸序列分別如SEQ ID NO.4和SEQ ID NO.5所示。

將含有Ppmar1轉(zhuǎn)座子全長序列的pMD18-T載體用BseR I切除Ppmar1中間轉(zhuǎn)座酶的大部分序列。

酶切體系為50μl，包括5μl 10×buffer，1μl BseR I(1U/μl)，1μg質(zhì)粒(含有Ppmar1全長序列的pMD18-T載體)，加無菌水補齊50μl，37℃溫浴6小時?；厥召|(zhì)粒大片段，用T₄DNA Ligase將質(zhì)粒大片段自連接，得到Ppmar1的非自主性轉(zhuǎn)座子pMD18-T-Ppmar1-Tn(Tn表示非自主性轉(zhuǎn)座子)。

其中，自連接的體系為10μl，包括1μl 10×T₄DNA Ligase buffer，1μl T4DNA Ligase(10U/μl),50ng質(zhì)粒大片段，加無菌水補齊10μl，16℃溫浴8小時。

Ppmar1的非自主性轉(zhuǎn)座子的序列如SEQ ID NO.6所示。

二、酵母轉(zhuǎn)座表達載體的構(gòu)建

步驟2.1，Ppmar1轉(zhuǎn)座酶表達載體的構(gòu)建

將步驟1.3的Ppmar1轉(zhuǎn)座酶核苷酸序列經(jīng)Not I和EcoR V雙酶切，回收Ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段；將pAG413-gal-ccdB載體經(jīng)Not I和EcoR V雙酶切，回收pAG413-gal-ccdB載體酶切產(chǎn)物的大片段；且Ppmar1轉(zhuǎn)座酶核苷酸序列的雙酶切體系、雙酶切條件與pAG413-gal-ccdB載體的雙酶切體系、雙酶切條件均相同；

其中雙酶切體系為50μl，包括5μl 10×buffer，1μl Not I(1U/μl),1μl EcoR(1U/μl)，1μg質(zhì)粒(Ppmar1轉(zhuǎn)座酶核苷酸序列或者pAG413-gal-ccdB載體)，加無菌水補齊50μl，雙酶切條件為：37℃溫浴6小時。

將Ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段和pAG413-gal-ccdB載體酶切產(chǎn)物的大片段相連接；

連接體系為10μl，包括1μl 10×T4DNA Ligase buffer，1μl T4DNA Ligase(10U/μl),50ng pAG413-gal-ccdB載體酶切產(chǎn)物的大片段，20ng Ppmar1轉(zhuǎn)座酶酶切產(chǎn)物的大片段，加無菌水補齊10μl，16℃溫浴8小時。

此時完成了用Ppmar1轉(zhuǎn)座酶核苷酸序列替換pAG413-gal-ccdB質(zhì)粒中的ccdB核苷酸序列，得到重組質(zhì)粒pAG413-gal-Tpase(Tpase表示轉(zhuǎn)座酶)；

該重組質(zhì)粒pAG413-gal-Tpase即為Ppmar1轉(zhuǎn)座酶表達載體，其攜帶有編碼所述Ppmar1轉(zhuǎn)座酶的基因。該表達載體具有His(組氨酸)篩選標記，使導入pAG413-gal-Tpase載體的宿主能夠缺乏His的缺失培養(yǎng)基上生長。

步驟2.2，Ppmar1非自主轉(zhuǎn)座子供體載體的構(gòu)建

以步驟1.4的Ppmar1的非自主性轉(zhuǎn)座子pMD18-T-Ppmar1-Tn為模板，利用Ppmar1-5-3引物擴增Ppmar1的非自主性轉(zhuǎn)座子，進行PCR擴增，得到Ppmar1的非自主性轉(zhuǎn)座子擴增產(chǎn)物。

PCR擴增的體系為20μl，包括0.2μl rTaq Polymerase(5U/μl)，1μl Ppmar1-5-3(10μmol/L)，2μl 10×rTaq Buffer(Mg²⁺plus)，1.6μl dNTP mix(2.5mmol/L)，10ng pMD18-T-Ppmar1-Tn，加無菌水補齊20μl。

PCR擴增的反應條件為:預變性94℃5min；變性94℃30s，60℃30s，延伸72℃40s，35個循環(huán)；72℃2min，4℃10min。

同時，將載體pWL89a用Xho Ⅰ酶切(酶切位點位于ADE2基因內(nèi))，回收載體pWL89a骨架。酶切體系為50μl，包括5μl 10×buffer，1μl Xho Ⅰ(1U/μl),1μg載體pWL89a，加無菌水補齊50μl，37℃溫浴6小時。

然后用In-Fusion Advantage PCR Cloning Kit(TaKaRa公司，日本)將Ppmar1的非自主性轉(zhuǎn)座子擴增產(chǎn)物插入到載體pWL89a骨架的ADE2基因中，導致報告基因ADE2插入失活，得到pWL89a-Tn重組質(zhì)粒，即為Ppmar1非自主轉(zhuǎn)座子供體載體。若轉(zhuǎn)座子發(fā)生轉(zhuǎn)座從ADE2基因上離開，那么ADE2基因閱讀框得到回復。該載體具有URA3篩選標記，使導入pWL89a-Tn的宿主能夠在缺乏Ura(尿素)的缺失培養(yǎng)基上生長。

三、Ppmar1轉(zhuǎn)座酶C296I突變體的獲得

將Ppmar1轉(zhuǎn)座酶核苷酸序列與其他植物MLE轉(zhuǎn)座酶的核苷酸序列進行同源性比對，選取Ppmar1轉(zhuǎn)座酶核苷酸序列296位置上的半胱氨酸開展突變，計劃將其突變?yōu)楫惲涟彼?C296I)。

步驟3.1，根據(jù)QuikChange^TM Site-Directed Mutagenesis Kit(Stratagene公司，美國)試劑盒說明書，設(shè)計定點突變引物C296I-F和C296I-R(C296I-F和C296I-R的序列信息見表1)，按照QuikChange^TM Site-Directed Mutagenesis Kit試劑盒方法，以步驟2.1的重組質(zhì)粒pAG413-gal-Tpase為模板，利用PfuTurbo^TM DNA polymerase重新合成含有Ppmar1轉(zhuǎn)座酶C296I突變體的質(zhì)粒DNA；

步驟3.2，然后在合成的質(zhì)粒DNA中加入2μL的Dpn I限制性內(nèi)切酶，于37℃條件下反應5min，將原始模板序列徹底降解。將新合成的質(zhì)粒DNA測序確認后得到Ppmar1轉(zhuǎn)座酶C296I突變體；

Ppmar1轉(zhuǎn)座酶C296I突變體的氨基酸序列如SEQ ID NO.1所示，編碼所述Ppmar1轉(zhuǎn)座酶C296I突變體的基因的核苷酸序列如SEQ ID NO.2所示。

四、轉(zhuǎn)座酶活性的檢測

實驗組是將步驟3.1的含有Ppmar1轉(zhuǎn)座酶C296I突變體的質(zhì)粒DNA和步驟2.2的pWL89a-Tn重組質(zhì)粒，用PEG/LiAc法共同轉(zhuǎn)化到酵母中，用His/Ura雙缺固體培養(yǎng)基上進行選擇培養(yǎng)。用半乳糖誘導轉(zhuǎn)座酶表達，促使非自主轉(zhuǎn)座子發(fā)生轉(zhuǎn)座。

以野生型Ppmar1轉(zhuǎn)座酶為對照組，步驟2.1的帶有野生型的Ppmar1轉(zhuǎn)座酶的重組質(zhì)粒pAG413-gal-Tpase和步驟2.2的pWL89a-Tn重組質(zhì)粒，用PEG/LiAc法共同轉(zhuǎn)化到酵母中，用His/Ura雙缺固體培養(yǎng)基上進行選擇培養(yǎng)。用半乳糖誘導轉(zhuǎn)座酶表達，促使非自主轉(zhuǎn)座子發(fā)生轉(zhuǎn)座。

實驗組和對照組的經(jīng)誘導培養(yǎng)的酵母用缺失His/Ura/Ade固體培養(yǎng)基上進行選擇培養(yǎng)，計算培養(yǎng)基上長出的酵母菌斑。如果轉(zhuǎn)座發(fā)生，pWL89a-Tn重組質(zhì)粒上的ADE2基因就能表達，因此陽性酵母株能夠在缺乏腺嘌呤的培養(yǎng)基上生長。

以野生型Ppmar1轉(zhuǎn)座酶為對照，比較轉(zhuǎn)化有Ppmar1轉(zhuǎn)座酶C296I突變體的酵母菌落數(shù)目，篩選出較高活性的轉(zhuǎn)座酶突變株，結(jié)果如表2所示。

由表2可知，野生型Ppmar1轉(zhuǎn)座酶的陽性酵母菌落數(shù)量明顯小于Ppmar1轉(zhuǎn)座酶C296I突變體，且Ppmar1轉(zhuǎn)座酶C296I突變體催化轉(zhuǎn)座能力提高到原來的267％。這個高活性人工改造的Ppmar1轉(zhuǎn)座酶C296I突變體將為利用Ppmar1轉(zhuǎn)座子開發(fā)基因標簽奠定了重要基礎(chǔ)。

表1本發(fā)明應用的引物序列

表2不同轉(zhuǎn)座酶誘導的陽性酵母菌落數(shù)量和催化活性

盡管已描述了本發(fā)明的優(yōu)選實施例，但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念，則可對這些實施例作出另外的變更和修改。所以，所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。

顯然，本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

序列表

<110> 浙江農(nóng)林大學

<120> 一種具有高催化活性的Ppmar1轉(zhuǎn)座酶C296I突變體及其應用

<160> 6

<170> PatentIn version 3.3

<210> 1

<211> 499

<212> PRT

<213> 人工序列

<400> 1

Met Ala Asp Pro Ile Asp Ser Gly Phe Asp Leu Asn Val Arg Leu Glu

1 5 10 15

Glu Asp Asp Asp Gly Asn Leu Pro Phe Asp Leu Asn Glu Pro Ile Leu

20 25 30

Glu Asp His Asn Asn Gly Ile Asp Leu Asn Leu Pro Leu Asp Glu Phe

35 40 45

Gly Ala Val Asp Phe Asp Tyr Val Gln Asn Leu Ala Glu Gln Asp Val

50 55 60

Glu Ala Pro Val Gln Val His Pro Pro Lys His Asp Tyr Pro Glu His

65 70 75 80

Val Arg Lys Leu Val Tyr Gln Ala Leu Leu Met Arg Ser Lys Asn Gly

85 90 95

Lys Leu Gly Asn His Asp Thr Thr Ile Val Ser Ser Gln Phe Gly Val

100 105 110

Lys Ile Arg Ser Val Gln Arg Ile Trp Lys Gln Gly Lys Asn Gln Leu

115 120 125

Ala Gln Asn Ile Pro Val Val Val Ala Asn Leu Lys Lys Gly Arg Ser

130 135 140

Gly Arg Lys Ala Thr Pro Leu Asp Leu Glu Gln Leu Arg Asn Ile Pro

145 150 155 160

Leu Lys Gln Arg Met Thr Ile Glu Asp Val Ser Ser Arg Leu Gly Ile

165 170 175

Ser Lys Ser Arg Ile Gln Arg Tyr Leu Lys Lys Gly Leu Leu Arg Arg

180 185 190

His Ser Ser Ser Ile Lys Pro Tyr Leu Thr Asp Ala Asn Lys Lys Thr

195 200 205

Arg Leu Lys Trp Cys Ile Asp Met Ile Glu Gln Gly Leu Val Asp Asp

210 215 220

Pro Lys Phe Arg Asp Leu Phe Asp Phe Val Phe Ile Asp Glu Lys Trp

225 230 235 240

Phe Asn Leu Ser Gln Lys Ser Glu Arg Tyr Tyr Leu Leu Pro Asp Glu

245 250 255

Asp Glu Pro His Arg Thr Cys Lys Asn Lys Asn Tyr Ile Pro Arg Ile

260 265 270

Met Phe Leu Cys Val Cys Ala Arg Pro Arg Phe Arg Asn Gly Glu Cys

275 280 285

Val Phe Asp Gly Lys Ile Gly Ile Phe Pro Leu Val Thr Phe Glu Gln

290 295 300

Ala Ile Arg Gly Ser Gln Asn Arg Leu Arg Gly Glu Gln Val Ile Lys

305 310 315 320

Pro Ile Gln Ser Ile Asn Arg Glu Val Ile Arg Asp Phe Met Ile Asn

325 330 335

Arg Val Leu Pro Ala Ile Arg Ala Lys Trp Pro Arg Glu Asp Val His

340 345 350

Lys Pro Ile Phe Ile Gln Gln Asp Asn Val Pro Ser His Leu Lys Val

355 360 365

Asp Asp Pro Gln Phe Arg Glu Val Ala Lys Gln Asp Gly Phe Asp Ile

370 375 380

Arg Leu Ile Cys Gln Pro Pro Asn Ser Pro Asp Phe Asn Ile Leu Asp

385 390 395 400

Leu Gly Phe Phe Arg Ala Ile Gln Ala Ile Gln Tyr Lys Lys Asp Ala

405 410 415

Lys Thr Leu Lys Asp Leu Ile Pro Ala Val Gln Gln Ala Phe Leu Glu

420 425 430

Tyr Ser Pro Trp Lys Ala Asn Arg Ile Phe Val Thr Leu Gln Thr Val

435 440 445

Leu Lys Glu Ala Met Lys Ile Lys Gly Cys Asn Lys Ile Lys Ile Pro

450 455 460

His Ile Gln Lys Gln Arg Leu Glu Arg Glu Asp Arg Leu Pro Leu Gln

465 470 475 480

Ile Pro Cys Glu Ala Ser Leu Leu Ala Glu Ala Leu Ala Ser Leu Pro

485 490 495

Ala Ala Asn

<210> 2

<211> 1500

<212> DNA

<213> 人工序列

<400> 2

atggctgacc caatagattc tggcttcgat ctgaacgttc ggttagaaga agatgatgac 60

ggcaatcttc cctttgatct caacgagcca atattggaag atcacaacaa tggaattgat 120

ttgaacttgc cattagatga gtttggtgcc gtcgacttcg actatgtaca aaacctcgct 180

gaacaagatg ttgaggctcc cgttcaagta caccctccga agcatgacta tcctgaacat 240

gttagaaaac tagtgtacca agcattgttg atgagaagca agaatgggaa actaggcaat 300

catgatacaa caattgtttc cagtcaattt ggagtaaaga ttcgatcagt tcagcgcata 360

tggaagcaag gtaaaaacca acttgctcaa aacattccgg tcgtggttgc taatctaaag 420

aaaggtagaa gtggccgtaa agcaacccct cttgatttgg aacaattgcg caacattcct 480

ctcaagcaaa gaatgaccat agaagatgtg tctagtagac ttggtattag caaatctagg 540

atacaaaggt atttgaaaaa gggtttgctt aggcgccact ctagtagcat aaaaccttac 600

ctcaccgatg ctaacaagaa gactaggttg aagtggtgca ttgacatgat tgagcaaggt 660

ttggttgatg atccaaagtt cagggatttg tttgactttg tgtttattga tgagaagtgg 720

ttctacctct ctcaaaaatc cgagagatac tacttgctac ccgacgaaga tgaaccacat 780

cgcacttgca agaacaagaa ttacatccct aggatcatgt ttttgtgtgt ttgtgctcgg 840

ccaagattta gaaatggaga atgtgtgttt gatggcaaaa taggtatttt tccactagtc 900

acttttgaac aagctattag aggaagccaa aaccgtcttc gtggagaaca agtaatcaag 960

ccaattcaat caattaatag ggaagtgata agagatttca tgataaatag agtgttgcct 1020

gcaattagag caaagtggcc aagagaagat gtacacaagc caattttcat acaacaagat 1080

aatgttccat ctcatttaaa ggtggatgat cctcagtttc gtgaggttgc taagcaagat 1140

gggtttgaca ttaggctcat atgtcaacca cccaattctc cagattttaa cattctagat 1200

ttgggttttt ttcgagctat tcaagcaatt caatacaaga aagatgctaa gacattgaaa 1260

gatctaattc cagcagtcca acaggcattt ttggagtact ctccatggaa agcaaatagg 1320

atatttgtga cactacaaac tgttttgaag gaagcaatga agataaaagg ttgcaacaaa 1380

atcaaaattc ctcacatcca gaaacaaaga cttgagagag aagataggct gccattgcaa 1440

atcccttgtg aagcttcctt gctagccgaa gcacttgcaa gccttcctgc agctaattag 1500

<210> 3

<211> 3435

<212> DNA

<213> 毛竹基因組

<400> 3

tactccctcc atacccgaaa ttcctgacgt ttaggacatg attgtggtaa ccaaggagtg 60

attaattagg ggttagtttt ccatctttgc ccctaataaa tatggttacg ggtgctcttt 120

gtacgagaaa gtaaaccagc tcgactggct agcgcgcgga ggcctcagtc ctgtggtgcg 180

cgttcgatac ctcgcggacg caggtttttt tcttgttgct gtttattcat ttttgcatgg 240

cactgtttag gcaacgcacg tcgcgcgcgc ttagccgctg cgggcgttag ttttcgagtg 300

gatttgggcc tggcgcacgg aggaggttgc atggctgccc gaaaatttcg ttgcatgcac 360

tggattttca aaattttgtc ctcgcgctgt ggaggctcgt ttgaggccgc gttttttttc 420

atctggcgcg ctggaaggcc gacgtttgga gtgctcgttg cttgttctat ttaaacgcct 480

ggaaccttcc ttgttgtctt cctatgccgg actcctgtac tatggctgac ccaatagatt 540

ctggcttcga tctgaacgtt cggttagaag aagatgatga cggcaatctt ccctttgatc 600

tcaacgagcc aatattggaa gatcacaaca atggtaagca aaaacgtcaa attagtttct 660

cagtttctcg tttccttttt tctttactga gcttgtcgtt tcctttttcg ataggaattg 720

atttgaactt gccattagat gagtttggtg ctgtcgactt cgactatgta caaaacctcg 780

ctggtaagca tggctagtat tatgaattcg cttgtttttt tatttccttt tgctggaaca 840

tgccgtgaat aatagtatta tgaactcgct tgttttttat ttccttttac tagaacatgt 900

gcttgtttta ttcctatagc tagatcatga cgtcaatact ttttacgatg aatatgctcg 960

ttacagtata gctagaacat gccgtgacta catagtagta tgaatatgct tgttttattt 1020

ctataactat aacatgccgt gagtatattt agatcatgcc gtgagtacta agtactatta 1080

aaatgcttgt tttttatttc cttttgctag aacaagatgt tgaggctccc gttcaagtac 1140

accctccgaa gcatgactat cctgaacatg ttagaaaact agtgtaccaa gcattgttga 1200

tgagaagcaa gaatgggaaa ctaggcaatc atgatacaac aattgtttcc agtcaatttg 1260

gagtaaagat tcgatcagtt cagcgcatat ggaagcaagg taaaaaccaa cttgctcaaa 1320

acattccggt cgtggttgct aatctaaaga aaggtagaag tggccgtaaa gcaacccctc 1380

ttgatttgga acaattgcgc aacattcctc tcaagcaaag aatgaccata gaagatgtgt 1440

ctagtagact tggtattagc aaatctagga tacaaaggta tttgaaaaag ggtttgctta 1500

ggcgccactc tagtagcata aaaccttacc tcaccgatgc taacaagaag actaggttga 1560

agtggtgcat tgacatgatt gagcaaggtt tggttgatga tccaaagttc agggatttgt 1620

ttgactttgt gtttattgat gagaagtggt tctacctctc tcaaaaatcc gagagatact 1680

acttgctacc cgacgaagat gaaccacatc gcacttgcaa gaacaagaat tacatcccta 1740

ggatcatgtt tttgtgtgtt tgtgctcggc caagatttag aaatggagaa tgtgtgtttg 1800

atggcaaaat aggttgtttt ccactagtca cttttgaaca agctattaga ggaagccaaa 1860

accgtcttcg tggagaacaa gtaatcaagc caattcaatc aatcaatagg gaagtgataa 1920

gagatttcat gataaataga gtgttgcctg caattagagc aaagtggcca agagaagatg 1980

tacacaagcc aattttcata caacaagata atgctccatc tcatttaaag gtggatgatc 2040

ctcagttttg tgaggttgct aagcaagatg ggtttgacat taggctcata tgtcaaccac 2100

ccaattctcc agattttaac attctagatt tgggtttttt tcgagctatt caagcaattc 2160

aatacaagaa agatgctaag acattgaaag atctaattcc agcagtccaa caggtaaatg 2220

atcatccatt acagtgttta aattgatctt gaacaaataa tataatcact gatcttgaac 2280

atgttttgta ggcatttttg gagtactctc catggaaagc aaataggata tttgtgacac 2340

tacaaactgt tttgaaggaa gcaatgaaga taaaaggttg caacaaaatc aaaattcctc 2400

acatccagaa acaaagactt gagagagaag ataggctgcc attgcaaatc ccttgtgaag 2460

cttccttgct agccgaagca cttgcaagcc ttcctgcggc taattagaag atgcaagcat 2520

gttactcttt tgcagcagca agcatgtaag aagacgcgag catgttagta gcaaactatg 2580

aacaaactag tttatgcatg tagtagtatg ttagcttgtg caccttagtc atctcgtccc 2640

aaccgcttga taacatgctc aggaagaagt attgtgtcac catccatttc aagtttctcc 2700

acatcaggaa tgtagacctc acaatcaaac ttttccatgt catcgagcca cttcgctgtc 2760

atgtcgtagt cttcatgtaa aaggccacaa cgggcacaca tgcgagcttc gcggcgagct 2820

tggtagcagg cttctccgaa gacgccgccg gcgtggaacg taacacagcg aggacacaga 2880

gactcgacgg agtcgggatc gacggtgtcg ggcaccatct cgagggagtc tgcaaccatg 2940

tcgacggagt ccggcagctc ctcgacggag tccggcacca tgtcgacggt gtccggcagc 3000

tcctcgacgg agtctggcac ctcctgcggc gccatgtcca cggtgtccag cgacgctatg 3060

gagcccgacg agatgtcctg cacggcgacg tccagcgccg caacggactc cgtcgtttcc 3120

atctgatccg acgaggcatc gacgtcctgc gacgagcgtg gcggcgagag cacggcgagc 3180

gggcaggcga gcgggcaggc gagcgagcca ttcgcgcgag cgatgaatgc gagctgctgt 3240

accaggcgca cacacgcgca atcaatgcgg gcgagtaacg atgcgagcat gcgcggcgga 3300

agcgcaacag acgggcagca gcgcatggcc aggggcaaac gcgtgaaaag aagaccacgc 3360

gaggccacaa cgtcagcttt tgcgcaaacg ggcacttcgc ctagaacgtc aggaatttcg 3420

ggtatggagg gagta 3435

<210> 4

<211> 1500

<212> DNA

<213> 人工序列

<400> 4