本發(fā)明屬于生物制藥技術(shù)領域,涉及一種利用大腸桿菌異源表達絞股藍糖基轉(zhuǎn)移酶在體外合成稀有人參皂苷的方法,同時還涉及該絞股藍糖基轉(zhuǎn)移酶在合成稀有人參皂苷CK中的應用。
背景技術(shù):
絞股藍為葫蘆科絞股藍屬多年生草質(zhì)藤本植物,絞股藍中含有多種藥用成分,其中最主要的藥效成分為絞股藍皂苷。絞股藍皂苷結(jié)構(gòu)為四環(huán)三萜達瑪烷型,與人參皂苷的結(jié)構(gòu)相同。絞股藍皂苷由兩部分組成,是由苷基與配糖基相結(jié)合形成的生物大分子。至今已發(fā)現(xiàn)有八種絞股藍皂苷在結(jié)構(gòu)上與原人參二醇型人參皂苷是完全相同的,且這八種皂苷的總量達到總皂苷的25%左右,而且其中有六種成分其含量高于人參中所對應的相同成分,因此具有廣泛的藥理作用。絞股藍皂苷具有多種特殊的藥理作用,具有降低血脂、抗腫瘤、降血糖、抗衰老等藥理作用,且無抗藥性、無副作用。絞股藍在保健食品和新型藥品研發(fā)上都有巨大的應用前景,是一種新的藥食兩用植物資源。研究絞股藍皂苷的代謝通路,進行皂苷的異源生物合成,從而提高絞股藍皂苷的產(chǎn)率具有重要意義。目前關于絞股藍皂苷的研究主要集中在總皂苷水平,對單一皂苷的研究相對較少,通過對底物進行糖基化修飾得到的皂苷具有單一性的特點,且還可得到稀有絞股藍皂苷。因此,獲得大量高純度的絞股藍皂苷是當前研究的熱點。
目前,生產(chǎn)人參皂苷的方法主要是從栽培人參中提取。而人參的生長周期長,且提取人參皂苷的工藝流程復雜、產(chǎn)率低、容易造成環(huán)境污染。而糖苷酶法則具備立體選擇性、得率高、副產(chǎn)物少且可以得到稀有人參皂苷等優(yōu)點。被認為是生產(chǎn)稀有人參皂苷最有潛力的方法。
隨著測序等技術(shù)的不斷發(fā)展,基因庫資源不斷豐富,本發(fā)明人努力查明了具有從絞股藍向人參皂苷轉(zhuǎn)移糖活性的絞股藍糖基轉(zhuǎn)移酶。且確認所述絞股藍糖基轉(zhuǎn)移酶UGTGp5對通過糖苷鍵而與PPD的第20位的葡萄糖具有糖轉(zhuǎn)移活性,從而完成了本發(fā)明。
技術(shù)實現(xiàn)要素:
本發(fā)明的一個目的在于開發(fā)一種糖基轉(zhuǎn)移酶,該糖基轉(zhuǎn)移酶通過糖苷鍵而與原人參二醇PPD的第20位的葡萄糖具有糖轉(zhuǎn)移活性,從而生成稀有人參皂苷CK。
本發(fā)明人借助于特征序列法,PSPG盒是植物次生代謝產(chǎn)物糖基轉(zhuǎn)移酶的一個標志性的重要特性,可通過PSPG序列來篩選糖基轉(zhuǎn)移酶基因。并結(jié)合NCBI等數(shù)據(jù)庫資源,篩選出了可能催化原人參二醇20位羥基糖基化反應的糖基轉(zhuǎn)移酶基因。將初步篩選到的基因在大腸桿菌表達系統(tǒng)中進行表達,純化得到粗酶液。經(jīng)實驗證明該基因能夠催化原人參二醇20位羥基糖基化反應,生成大量、單一的稀有人參皂苷CK。
另一方面,本發(fā)明提供了一種糖基化合成稀有人參皂苷CK的糖基轉(zhuǎn)移酶及其編碼的基因。所述糖基轉(zhuǎn)移酶的基因序列為SEQ ID NO.4。
第三方面,本發(fā)明提供了一種絞股藍糖基轉(zhuǎn)移酶蛋白質(zhì),其對通過糖苷鍵而連接在所述PPD類人參皂苷的第20位的葡萄糖具有糖轉(zhuǎn)移酶活性。
第四方面,本發(fā)明進一步提供了一種使用絞股藍糖基轉(zhuǎn)移酶體外合成人參皂苷CK的方法。該方法以原人參二醇和糖基供體UDP-葡萄糖為原料,在絞股藍糖基轉(zhuǎn)移酶的催化下,原人參二醇的第20位羥基發(fā)生糖基化,生成稀有人參皂苷CK。實驗結(jié)果顯示:采用本發(fā)明的合成方法所生成的人參皂苷CK,經(jīng)處理后純度可以達到98% 。
最后,本發(fā)明還提供了包含編碼該絞股藍糖基轉(zhuǎn)移酶的重組載體,以及該重組載體的轉(zhuǎn)化體。該重組載體為現(xiàn)代技術(shù)中的任意的基因的重組載體,例如本實驗中用到的pET-28a質(zhì)粒。該載體融合有六聚組氨酸標簽,可利用Ni-NTA His-結(jié)合樹脂柱而容易的回收所需的靶蛋白。
所述重組載體的轉(zhuǎn)化體,即指的是重組載體的宿主細胞。例如本實驗中用到的大腸桿菌E.coliBL21(DE3)(NEB公司)。但是不僅限于此。
為實現(xiàn)上述目的本發(fā)明公開了如下的技術(shù)內(nèi)容:
一種表達絞股藍糖基轉(zhuǎn)移酶UGTGp5的大腸桿菌基因工程菌,其特征在于可以異源表達絞股藍糖基轉(zhuǎn)移酶,基因工程菌名稱為H2495。
本發(fā)明所述表達絞股藍糖基轉(zhuǎn)移酶UGTGp5的大腸桿菌基因工程菌的構(gòu)建方法,其特征在于按照如下步驟進行:
1)運用生物信息學方法,通過與已知人參皂苷功能相關糖基轉(zhuǎn)移酶序列進行BLAST對比,預測了能夠形成絞股藍皂苷的糖基轉(zhuǎn)移酶基因,命名為comp22398。
2)提取絞股藍總RNA,通過反轉(zhuǎn)錄得到絞股藍cDNA文庫;
3)設計特異引物,然后從絞股藍cDNA 文庫中擴增得到絞股藍皂苷糖基轉(zhuǎn)移酶基因comp20426;
4)制備含有絞股藍皂苷糖基轉(zhuǎn)移酶基因comp22398的重組質(zhì)粒,獲得構(gòu)建代謝途徑的質(zhì)粒;
5)將宿主菌大腸桿菌E.coliBL21(DE3)(NEB公司)進行溶源化處理,將步驟4)所獲得的重組質(zhì)粒轉(zhuǎn)化到溶源菌中,獲得能夠表達絞股藍糖基轉(zhuǎn)移酶UGTGp5的大腸桿菌基因工程菌。其中所述構(gòu)建絞股藍糖基轉(zhuǎn)移酶UGTGp5的克隆引物的核苷酸序列如SEQ ID NO.1-SEQ ID NO.2 所示。
本發(fā)明進一步公開了一種絞股藍糖基轉(zhuǎn)移酶UGTGp5蛋白質(zhì),其特征在于具有將糖苷鍵連接在第20位碳上的葡萄糖的PPD的具有糖轉(zhuǎn)移酶活性的絞股藍糖基轉(zhuǎn)移酶蛋白質(zhì),為SEQ ID NO. 3所示的氨基酸序列。
本發(fā)明更進一步公開了絞股藍糖基轉(zhuǎn)移酶糖基化體外合成CK的方法,其特征在于,以原人參二醇PPD和糖基供體UDP-葡萄糖為底物,在絞股藍糖基轉(zhuǎn)移酶的催化下,原人參二醇的C20位發(fā)生糖基化反應,生成稀有人參皂苷CK。
本發(fā)明公開的SEQ ID NO1-4的序列如下:
CGGGATCCATGGGGAGTGAAGGCAATC (SEQ ID NO.1)
ATAAGAATCTCGAGTCAAAAGGCCAAAGTTTTC(SEQ ID NO.2)
MGSEGNQLHIFLFPFMAHGHMIPMVDMAKLFTSRGVKITIVTTPVNAVFISKSIEKTKNLSSDQLIELLILKFPTAEVGLPDGCENPDSIPSLDLMPNFLKAASLLQDPLEKALMETHPHCLVADMFFPWANDVASKFGIPRLSFNGTSFFSLCAMEFIRLHQPYNQVSSDSEPFIIPHLPGEIVITKMQLPEFIRDHVSNEFSKFLDKVKVSESECYGVVMNSFYELEGDYADCYRNVLGRKAWHIGPLLLTSNDVGDDVENDVENVQIRGKESAIDEHECLKWLNSKEPNSVVYVCFGSMAQFNSDQLKEIANGLEASGRQFIWVVRKGKKEENEEDWLPQGFEERMEGKGLIIRGWAPQVLILDHEAIGGFVTHCGWNSTLEGVTAGVPMITWPIAAEQFYNEKLVTQALKIGVPVGVQKWVRTVGDFITREAIEKAITRIMVGEEAEEIRNRAREFAKMAREAVEENGSSYSDLNSLIKELKTLAF(SEQ ID NO.3)
ATGGGGAGTGAAGGCAATCAACTTCATATTTTCTTGTTCCCATTCATGGCTCATGGCCAC
ATGATTCCAATGGTAGACATGGCCAAGCTTTTTACATCTCGAGGCGTAAAAATCACCATC
GTTACAACTCCGGTTAATGCCGTTTTCATATCGAAATCAATCGAGAAAACAAAAAATCTT
TCTTCAGATCAATTAATTGAACTATTGATCCTCAAATTCCCCACTGCTGAAGTTGGTTTG
CCAGATGGTTGTGAAAATCCTGATTCAATTCCAAGCCTAGATTTGATGCCTAATTTCTTG
AAGGCTGCAAGTTTGCTTCAAGACCCACTTGAGAAGGCTTTGATGGAAACTCATCCTCATTGTCTTGTGGCTGATATGTTCTTTCCTTGGGCTAATGATGTTGCTTCTAAATTTGGAATT
CCAAGGTTGAGTTTTAATGGAACAAGCTTTTTCTCTCTATGTGCTATGGAATTCATTAGA
TTGCATCAGCCTTACAATCAAGTTTCATCTGATTCTGAGCCTTTTATCATTCCTCACCTT
CCTGGAGAGATTGTGATTACTAAAATGCAATTGCCCGAGTTTATTCGAGATCATGTTTCG
AATGAGTTTAGTAAATTCTTGGACAAGGTTAAGGTGTCAGAATCAGAGTGTTATGGGGTT
GTGATGAACAGTTTTTATGAGTTGGAGGGGGATTATGCTGATTGTTATAGGAATGTTTTG
GGAAGAAAAGCATGGCATATCGGCCCGCTTTTATTAACCAGCAACGATGTCGGAGACGACGTTGAAAACGATGTCGAAAACGTGCAGATTAGAGGGAAAGAATCTGCTATTGATGAGCATGAATGCTTGAAATGGCTCAACTCTAAGGAACCCAATTCAGTTGTTTATGTATGTTTTGGAAGTATGGCTCAATTCAATTCTGATCAGTTGAAGGAGATTGCAAACGGTCTTGAGGCTTCGGGACGACAGTTTATATGGGTTGTGAGGAAAGGAAAAAAGGAAGAGAATGAAGAAGATTGGTTACCACAAGGATTTGAGGAGAGAATGGAAGGGAAAGGATTGATTATAAGAGGATGGGCACCACAAGTTTTGATTCTTGATCATGAAGCAATAGGTGGATTTGTGACACACTGTGGGTGGAATTCAACTCTTGAAGGAGTCACGGCCGGGGTTCCGATGATAACGTGGCCGATCGCGGCCGAGCAATTTTACAACGAGAAACTGGTGACACAAGCGTTGAAAATTGGAGTCCCGGTTGGAGTACAGAAATGGGTTAGAACTGTGGGAGATTTCATAACAAGGGAAGCTATTGAAAAGGCAATCACAAGGATTATGGTTGGGGAAGAAGCAGAGGAAATTAGAAACAGAGCTAGAGAATTTGCTAAGATGGCAAGGGAAGCTGTTGAAGAAAATGGATCATCATATTCTGATTTGAATAGTTTGATTAAGGAATTGAAAACTTTGGCCTTTTGA(SEQ ID NO.4)
通過以上技術(shù)方案的實施,本發(fā)明公開的絞股藍糖基轉(zhuǎn)移酶的工程菌及其構(gòu)建方法與應用所具有的積極效果在于:
1)本發(fā)明所述的糖基轉(zhuǎn)移酶能成功的在體外合成稀有人參皂苷CK。是一種新的生產(chǎn)方法,流程簡單,產(chǎn)量較高,消耗低。
2)本發(fā)明所述的絞股藍糖基轉(zhuǎn)移酶基因豐富了目前的糖基轉(zhuǎn)移酶數(shù)據(jù)庫。
附圖說明
圖1是質(zhì)粒pET-28a(+)-comp22398的圖譜,用于表達絞股藍糖基轉(zhuǎn)移酶UGTGp5;
圖2是原人參二醇糖基化產(chǎn)物的質(zhì)譜(MS)譜圖;
圖3是原人參二醇及其糖基化產(chǎn)物的HPLC譜圖。
具體實施方式
下面通過具體的實施方案敘述本發(fā)明。除非特別說明,本發(fā)明中所用的技術(shù)手段均為本領域技術(shù)人員所公知的方法。另外,實施方案應理解為說明性的,而非限制本發(fā)明的范圍,本發(fā)明的實質(zhì)和范圍僅由權(quán)利要求書所限定。對于本領域技術(shù)人員而言,在不背離本發(fā)明實質(zhì)和范圍的前提下,對這些實施方案中的物料成分和用量進行的各種改變或改動也屬于本發(fā)明的保護范圍。
本發(fā)明以下實施例中所用的材料、試劑、儀器和方法未經(jīng)特殊說明均為本領域中的常規(guī)材料、試劑、儀器和方法,均可通過商業(yè)渠道獲得;例如Tryptone(胰蛋白胨),Yeast Extract(酵母提取物),Agar(瓊脂);卡那霉素,E.coliDH5α等等。
本發(fā)明中質(zhì)粒提取采用生工生物工程(上海)有限公司的SanPrep柱式質(zhì)粒DNA小量抽提試劑盒(Catalog NO.:B518191),切膠回收是采用生工生物工程(上海)有限公司的SanPrep柱式膠回收試劑盒(Catalog NO.:B518131),DNA片段的連接是使用fermentas公司的T4 DNA Ligase(Catalog NO.:EL0014),DNA片段的擴增使用fermentas公司的pfu DNA polymerase(Catalog NO.:EP0571),PCR質(zhì)粒模板的消化使用fermentas公司的Fast DigestXhoI(Catalog NO.:FD0694),BamHI(Catalog NO.:FD0054) E.coli電擊轉(zhuǎn)化實驗使用Bio-Rad的電轉(zhuǎn)儀(Catalog NO.:165-2100)。
實施例1
源自絞股藍的糖基轉(zhuǎn)移酶UGTGp5的克隆
借助于基于化合物、化學反應的檢索工具,結(jié)合NCBI等數(shù)據(jù)庫的資源,以及植物的PSPG盒等原則,篩選了可能催化原人參二醇糖基化的糖基轉(zhuǎn)移酶基因。利用引物SEQ ID NO.1-SEQ ID NO.2,并利用聚合酶通過PCR從絞股藍cDNA文庫擴增基因。擴增后的片段進行切膠純化,并用XhoI和BamHI進行雙酶切,酶切后的片段與同樣經(jīng)過XhoI和BamHI雙酶切的質(zhì)粒pET-28a(+)質(zhì)粒進行連接,將載體:目的片段按摩爾比為1:3的比例混合,加入T4 DNA Ligase后在22℃下酶連5h,連接產(chǎn)物轉(zhuǎn)化E.coliDH5α,并在卡納板上進行篩選陽性克隆,測序驗證。獲得重組質(zhì)粒pET-28a(+)-comp22398。
實施例2
大腸桿菌表達菌株的建立以及絞股藍糖基轉(zhuǎn)移酶UGTGp4的純化
將重組表達質(zhì)粒轉(zhuǎn)化到宿主菌E.coli BL21(DE3)(NEB公司)感受態(tài)細胞,得到絞股藍糖基轉(zhuǎn)移酶的重組表達菌株。培養(yǎng)重組菌至OD為0.6~0.8時,添加0.1mM IPTG,在低溫16℃誘導表達20h。4℃,5500rpm離心收集細胞,將細胞進行超聲破碎。對其利用Ni-NTA His-結(jié)合樹脂純化。
實施例3
in vitro酶實驗
按照所述配制體外的反應體系,進行糖基轉(zhuǎn)移酶的實驗。
在30℃下,對反應混合物進行3h的培養(yǎng)反應后,加入相同體積正丁醇使其終止反應。
實施例4
產(chǎn)物的檢測
對反應體系用正丁醇抽提,萃取的有機相真空干燥后加甲醇回溶。進行電噴霧電離質(zhì)譜(ESI)檢測,結(jié)果如圖2所示,結(jié)果顯示(m/z)644.60為glc-O-原人參二醇的加鈉峰,結(jié)果與預期產(chǎn)物glc-O-原人參二醇(Na+)(645)的分子量相符。
儀器:Finnigan LCQ Advantage
MAX ion trap mass spectrometer
(Thermo Electron,CA)
離子化模式:電噴霧負離子模式;
電噴霧范圍:400-500 m/z;
干燥器溫度:250 ℃;
噴霧壓力:45 psi;
毛細管電壓:4500 V;
進樣量:0.2 mL/min;
產(chǎn)物的質(zhì)譜圖如圖2所示,根據(jù)分子量判斷,該化合物為原人參二醇的單糖基化產(chǎn)物Glc-O-原人參二醇(m/z)645。
對反應體系用正丁醇抽提,萃取的有機相真空干燥后加甲醇回溶。進行HPLC檢測分析與定量結(jié)果如圖3所示。
使用Shimadzu LC-20A prominence system (Shimadzu, Kyoto, Japan ),使用Shodex C18-120-5 4E column (5μm 4.6mm×250mm),按照每分鐘800 μl的流速,0 min,35%乙腈,50 min,90%乙腈,55 min,90%乙腈,55-65 min,35%乙腈。檢測波長203 nm。
圖3結(jié)果表明:
(1)標準品CK在35 min左右出峰;
(2)負對照未添加酶液在35 min沒有產(chǎn)物出現(xiàn);
(3)添加酶液反應后在35 min有產(chǎn)物峰出現(xiàn),且峰值較高。
實施例5
以原人參二醇PPD和糖基供體UDP-葡萄糖為底物,在絞股藍糖基轉(zhuǎn)移酶的催化下,原人參二醇的C20位發(fā)生糖基化反應,生成稀有人參皂苷CK。按實施例3中的比例配制100mL 的反應液。在30 ℃條件下,反應48 小時。加入相同體積正丁醇終止反應。取上層有機相旋轉(zhuǎn)蒸發(fā)干燥,用硅膠柱純化,洗脫劑為氯仿:甲醇(85:15),每5 mL 等份收集,收集的樣品進行ESI和HPLC 分析(條件同前所述) ,獲得原人參二醇糖基化產(chǎn)物部分,純度<90%。
進一步利用Sep-Pak tC18 柱(Waters) 對上述收集部分進行純化,水(A) 和乙腈(B) 作為洗脫劑,采用梯度洗脫(20% B 、40% B 、50% B 、60% B 、65% B 、70% B 、75% B 、80%B 、85%B 、90%B 、100%B),在70% 及75% 乙腈洗脫時,獲得原人參二醇糖基化產(chǎn)物部分,純度達到98% 。于40 ℃旋轉(zhuǎn)蒸發(fā)或冷凍干燥得白色粉末。
以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其進行限制,盡管參照上述實施例對本發(fā)明進行了詳細的說明,對于本領域的普通技術(shù)人員來說,依然可以對前述實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換。而這些修改或替換,并不使相應技術(shù)方案的本質(zhì)脫離本發(fā)明所要求保護的技術(shù)方案的范圍和精神。
SEQUENCE LISTING
<110> 南開大學
<120> 絞股藍糖基轉(zhuǎn)移酶在合成稀有人參皂苷中的應用
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 27
<212> DNA
<213> 人工序列
<400> 1
cgggatccat ggggagtgaa ggcaatc 27
<210> 2
<211> 33
<212> DNA
<213> 人工序列
<400> 2
ataagaatct cgagtcaaaa ggccaaagtt ttc 33
<210> 3
<211> 490
<212> PRT
<213> 絞股藍糖基轉(zhuǎn)移酶UGTGp5蛋白質(zhì)
<400> 3
Met Gly Ser Glu Gly Asn Gln Leu His Ile Phe Leu Phe Pro Phe Met
1 5 10 15
Ala His Gly His Met Ile Pro Met Val Asp Met Ala Lys Leu Phe Thr
20 25 30
Ser Arg Gly Val Lys Ile Thr Ile Val Thr Thr Pro Val Asn Ala Val
35 40 45
Phe Ile Ser Lys Ser Ile Glu Lys Thr Lys Asn Leu Ser Ser Asp Gln
50 55 60
Leu Ile Glu Leu Leu Ile Leu Lys Phe Pro Thr Ala Glu Val Gly Leu
65 70 75 80
Pro Asp Gly Cys Glu Asn Pro Asp Ser Ile Pro Ser Leu Asp Leu Met
85 90 95
Pro Asn Phe Leu Lys Ala Ala Ser Leu Leu Gln Asp Pro Leu Glu Lys
100 105 110
Ala Leu Met Glu Thr His Pro His Cys Leu Val Ala Asp Met Phe Phe
115 120 125
Pro Trp Ala Asn Asp Val Ala Ser Lys Phe Gly Ile Pro Arg Leu Ser
130 135 140
Phe Asn Gly Thr Ser Phe Phe Ser Leu Cys Ala Met Glu Phe Ile Arg
145 150 155 160
Leu His Gln Pro Tyr Asn Gln Val Ser Ser Asp Ser Glu Pro Phe Ile
165 170 175
Ile Pro His Leu Pro Gly Glu Ile Val Ile Thr Lys Met Gln Leu Pro
180 185 190
Glu Phe Ile Arg Asp His Val Ser Asn Glu Phe Ser Lys Phe Leu Asp
195 200 205
Lys Val Lys Val Ser Glu Ser Glu Cys Tyr Gly Val Val Met Asn Ser
210 215 220
Phe Tyr Glu Leu Glu Gly Asp Tyr Ala Asp Cys Tyr Arg Asn Val Leu
225 230 235 240
Gly Arg Lys Ala Trp His Ile Gly Pro Leu Leu Leu Thr Ser Asn Asp
245 250 255
Val Gly Asp Asp Val Glu Asn Asp Val Glu Asn Val Gln Ile Arg Gly
260 265 270
Lys Glu Ser Ala Ile Asp Glu His Glu Cys Leu Lys Trp Leu Asn Ser
275 280 285
Lys Glu Pro Asn Ser Val Val Tyr Val Cys Phe Gly Ser Met Ala Gln
290 295 300
Phe Asn Ser Asp Gln Leu Lys Glu Ile Ala Asn Gly Leu Glu Ala Ser
305 310 315 320
Gly Arg Gln Phe Ile Trp Val Val Arg Lys Gly Lys Lys Glu Glu Asn
325 330 335
Glu Glu Asp Trp Leu Pro Gln Gly Phe Glu Glu Arg Met Glu Gly Lys
340 345 350
Gly Leu Ile Ile Arg Gly Trp Ala Pro Gln Val Leu Ile Leu Asp His
355 360 365
Glu Ala Ile Gly Gly Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu
370 375 380
Glu Gly Val Thr Ala Gly Val Pro Met Ile Thr Trp Pro Ile Ala Ala
385 390 395 400
Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr Gln Ala Leu Lys Ile Gly
405 410 415
Val Pro Val Gly Val Gln Lys Trp Val Arg Thr Val Gly Asp Phe Ile
420 425 430
Thr Arg Glu Ala Ile Glu Lys Ala Ile Thr Arg Ile Met Val Gly Glu
435 440 445
Glu Ala Glu Glu Ile Arg Asn Arg Ala Arg Glu Phe Ala Lys Met Ala
450 455 460
Arg Glu Ala Val Glu Glu Asn Gly Ser Ser Tyr Ser Asp Leu Asn Ser
465 470 475 480
Leu Ile Lys Glu Leu Lys Thr Leu Ala Phe
485 490
<210> 4
<211> 1473
<212> DNA
<213> 人工序列
<400> 4
atggggagtg aaggcaatca acttcatatt ttcttgttcc cattcatggc tcatggccac 60
atgattccaa tggtagacat ggccaagctt tttacatctc gaggcgtaaa aatcaccatc 120
gttacaactc cggttaatgc cgttttcata tcgaaatcaa tcgagaaaac aaaaaatctt 180
tcttcagatc aattaattga actattgatc ctcaaattcc ccactgctga agttggtttg 240
ccagatggtt gtgaaaatcc tgattcaatt ccaagcctag atttgatgcc taatttcttg 300
aaggctgcaa gtttgcttca agacccactt gagaaggctt tgatggaaac tcatcctcat 360
tgtcttgtgg ctgatatgtt ctttccttgg gctaatgatg ttgcttctaa atttggaatt 420
ccaaggttga gttttaatgg aacaagcttt ttctctctat gtgctatgga attcattaga 480
ttgcatcagc cttacaatca agtttcatct gattctgagc cttttatcat tcctcacctt 540
cctggagaga ttgtgattac taaaatgcaa ttgcccgagt ttattcgaga tcatgtttcg 600
aatgagttta gtaaattctt ggacaaggtt aaggtgtcag aatcagagtg ttatggggtt 660
gtgatgaaca gtttttatga gttggagggg gattatgctg attgttatag gaatgttttg 720
ggaagaaaag catggcatat cggcccgctt ttattaacca gcaacgatgt cggagacgac 780
gttgaaaacg atgtcgaaaa cgtgcagatt agagggaaag aatctgctat tgatgagcat 840
gaatgcttga aatggctcaa ctctaaggaa cccaattcag ttgtttatgt atgttttgga 900
agtatggctc aattcaattc tgatcagttg aaggagattg caaacggtct tgaggcttcg 960
ggacgacagt ttatatgggt tgtgaggaaa ggaaaaaagg aagagaatga agaagattgg 1020
ttaccacaag gatttgagga gagaatggaa gggaaaggat tgattataag aggatgggca 1080
ccacaagttt tgattcttga tcatgaagca ataggtggat ttgtgacaca ctgtgggtgg 1140
aattcaactc ttgaaggagt cacggccggg gttccgatga taacgtggcc gatcgcggcc 1200
gagcaatttt acaacgagaa actggtgaca caagcgttga aaattggagt cccggttgga 1260
gtacagaaat gggttagaac tgtgggagat ttcataacaa gggaagctat tgaaaaggca 1320
atcacaagga ttatggttgg ggaagaagca gaggaaatta gaaacagagc tagagaattt 1380
gctaagatgg caagggaagc tgttgaagaa aatggatcat catattctga tttgaatagt 1440
ttgattaagg aattgaaaac tttggccttt tga 1473