專利名稱:具有堿性支鏈淀粉酶和堿性α-淀粉酶兩種活性的酶的基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及了一種編碼顯示出了堿性支鏈淀粉酶活性和堿性α-淀粉酶活性(堿性淀粉支鏈淀粉酶)兩種活性的酶的基因,本發(fā)明也涉及可從編碼完整的堿性淀粉支鏈淀粉酶的基因片段的表達(dá)中獲得的堿性α-淀粉酶和堿性支鏈淀粉酶,本發(fā)明也涉及編碼這些酶促活性的基因和其片段,本發(fā)明還涉及攜帶這些基因和其片段的重組DNA和轉(zhuǎn)化體。
背景技術(shù):
α-淀粉酶長期用于各種領(lǐng)域。例如,它已用于在發(fā)酵工業(yè)中糖化谷物和土豆,在紡織的工業(yè)中作為淀粉糊狀物清除劑,在制藥工業(yè)上中作為消化劑,在食品工業(yè)中制造濃的麥芽糖糖漿。α-淀粉酶是這樣一種酶,它作用于直鏈淀粉或支鏈淀粉之類的與淀粉相關(guān)的多糖類,可單獨(dú)切割多糖分子的α-1,4-葡糖苷鍵。從包括細(xì)菌、真菌、植物種子和動物消化腺在內(nèi)的大量不同來源中,已獲得α-淀粉酶的晶體樣品或電泳上均一樣品。支鏈淀粉酶是這樣一種酶,它可單獨(dú)水解存在于淀粉、糖原、支鏈淀粉和茁芽多糖中的α-1,6-葡糖苷鍵。在一特定的產(chǎn)氣氣桿菌菌株中首先發(fā)現(xiàn)支鏈淀粉酶(Bender,H.和Wallenfels,K.,生物化學(xué)雜志,334,79(1961)),此后,也在包括芽孢桿菌屬、鏈球菌屬和梭狀芽胞桿菌屬在內(nèi)的許多其它微生物中發(fā)現(xiàn)該酶。由于支鏈淀粉酶在與外型淀粉酶和內(nèi)型淀粉酶一起使用時,能夠從淀粉產(chǎn)生麥芽寡糖(如葡萄糖,麥芽糖,麥芽三糖,麥芽戊糖和麥芽己糖),在淀粉制造業(yè)中人們已產(chǎn)生了對支鏈淀粉酶的興趣。
為了簡化如上所述的使用兩種或多種酶的糖類的制造過程,非常需要也作用于α-1,4-葡糖苷鍵的支鏈淀粉酶,即顯示出α-淀粉酶活性的支鏈淀粉酶。已知枯草芽孢桿菌TU菌株產(chǎn)生支鏈淀粉酶-淀粉酶復(fù)合酶(Takasaki,Y.,農(nóng)業(yè)生物化學(xué),51,9(1987),日本專利出版物(kokoku) No.1-18717)。此外,已報道上述顯示出兩種不同的酶促活性的酶或所謂的淀粉支鏈淀粉酶(amylopul lulanase)由許多細(xì)菌產(chǎn)生,這些細(xì)菌包括環(huán)狀芽胞桿菌(日本專利申請公開(kokai)No.64-60376)、Bacillus sp.(Saha,B.C.,等,酶微生物技術(shù),11,760(1989))、布氏熱厭氧細(xì)菌(Co1eman,R.D.,等.細(xì)菌學(xué)雜志,169,4302(1987))、Thermoanaerobium sp.(Plant,A.R.,等,應(yīng)用微生物生物技術(shù),26,427(1987))、Clostidiumthermohydrosulfuricum(Saha,B.C.,等,生物化學(xué)雜志,252,343(1988))、熱產(chǎn)硫梭菌(Spreinat,A.等,應(yīng)用微生物生物技術(shù),33,511(1990))、水生棲熱菌(Plant,A.R.,等,酶微生物技術(shù),8,668(1986))、Thermus sp.(Nakamura,N.等,淀粉/Starke,41,112(1989))、Thermoanaerobacteriu Msaccharolyticum(Saha,B.C.,等,應(yīng)用環(huán)境微生物,56,881(1990))以及激烈熱球菌和Thermococcuslitoralis(Brown,S.H.和Kelley,R.M.,應(yīng)用環(huán)境微生物,59,2614(1993))。
發(fā)明人最近發(fā)現(xiàn),當(dāng)α-淀粉酶和支鏈淀粉酶摻入去垢劑中時,洗碟去垢劑和洗衣去垢劑的功效能夠大大地得到提高(日本專利申請放置-打開(kokai)No.2-132-193),特別是對淀粉污垢而言。然而,大多數(shù)以前在自然界中發(fā)現(xiàn)的α-淀粉酶和支鏈淀粉酶,在中性到堿性的pH值范圍內(nèi)顯示出了最大的和穩(wěn)定的酶促活性,而在pH值9-10的堿性溶液中的幾乎不起作用。在堿性的pH值范圍內(nèi)存在很少的可顯示出最大活性的酶(堿性支鏈淀粉酶),僅有兩份報告報到過這樣的酶(Nakamura,N.和Horikoshi,K.,生物化學(xué)和生物物理學(xué)報,397,188(1975),日本專利出版物(kokoku)No.53-27786和Ara等,日本專利出版物(kokoku)No.6-32613)。此外,直到本發(fā)明發(fā)明人發(fā)現(xiàn)在堿性范圍內(nèi)具有其最佳生長pH值的嗜堿Bacillussp.KSM-AP1378(FERM BP-3048,1989年7月24日保藏在的工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的發(fā)酵研究所,1-3 Higashi 1-chome,Tsukuba-shi,Ibaraki,305日本)產(chǎn)生一種新的具有堿性支鏈淀粉酶和堿性α-淀粉酶兩種活性的堿性淀粉支鏈淀粉酶(正式命名為支鏈淀粉酶Y)之前,具有堿性α-淀粉酶和堿性支鏈淀粉酶兩種活性的酶還未見報道。本發(fā)明發(fā)明人指出這種酶可用作為自動洗碗機(jī)的去垢組合物和衣服的去垢組合物中的添加劑(日本專利中請公開(kakai)No.3-290498)。這種酶雖然由單一的酶分子構(gòu)成,但是它顯示出堿性α-淀粉酶活性和堿性支鏈淀粉酶活性。這種酶的開發(fā)已證明與這兩種酶分別由不同的細(xì)菌獨(dú)立地產(chǎn)生的現(xiàn)狀相比,這種酶的開發(fā)在細(xì)菌培養(yǎng)及酶的純化中具有極大的優(yōu)點(diǎn)。
本發(fā)明發(fā)明人曾試圖通過培養(yǎng)方法的優(yōu)化來提高堿性淀粉支鏈淀粉酶(正式命名為支鏈淀粉酶Y)產(chǎn)生細(xì)菌Bacillus sp.KSM-AP1378的生產(chǎn)力。然而,這仍然需要進(jìn)一步提高細(xì)菌的酶生產(chǎn)力,以便在工業(yè)規(guī)模上有利地生產(chǎn)堿性淀粉支鏈淀粉。值得注意的是,通過基因工程,酶的生產(chǎn)力可以進(jìn)一步提高;同時,通過利用蛋白質(zhì)工程方法改變編碼酶的基因,酶本身的活性可以得到提高。這些方法的應(yīng)用均需要有編碼堿性淀粉支鏈淀粉的基因。
因此,本發(fā)明的目的是提供編碼堿性淀粉支鏈淀粉酶的基因、包含該基因的重組DNA以及包含該重組DNA的轉(zhuǎn)化體。
還可以用編碼堿性淀粉支鏈淀粉酶的基因的DNA來產(chǎn)生探針,該探針用于把其它同源堿性淀粉支鏈淀粉酶基因從其它微生物中分離出來。因而,本發(fā)明的另一個目的是提供一種篩選和分離其它堿性淀粉支鏈淀粉酶的方法。
發(fā)明的說明本發(fā)明發(fā)明人利用鳥槍法克隆和聚合酶鏈?zhǔn)椒磻?yīng)從嗜堿Bacillus菌株的染色體DNA分離出了一種編碼堿性淀粉支鏈淀粉酶的DNA片段。當(dāng)他們用連接到適當(dāng)載體上的這一DNA片段轉(zhuǎn)移微生物時,證實(shí)了所形成的重組微生物產(chǎn)生堿性淀粉支鏈淀粉酶。此外,還發(fā)現(xiàn),由該DNA片段編碼的堿性淀粉支鏈淀粉酶的氨基酸序列完全有別于以前已知的淀粉酶和支鏈淀粉酶的氨基酸序列,而且,這種酶有一個特征,即酶分子的氨基末端部分是堿性α-淀粉酶,酶分子的羧基末端部分是堿性支鏈淀粉酶。本發(fā)明是基于這個發(fā)現(xiàn)完成的。
因此,本發(fā)明提供了一種編碼堿性淀粉支鏈淀粉酶的DNA片段。
本發(fā)明也提供了具有下文的3號序列所描述的氨基酸序列的堿性α-淀粉酶以及編碼該堿性α-淀粉酶的DNA片段。
本發(fā)明也提供了具有下文的4號序列所描述的氨基酸序列的堿性支鏈淀粉酶以及編碼該堿性支鏈淀粉酶的DNA片段。
本發(fā)明也提供了包含一種DNA片段的重組DNA,所述DNA片段編碼上述堿性淀粉支鏈淀粉酶,堿性α-淀粉酶或堿性支鏈淀粉酶。
本發(fā)明也提供了一包含重組DNA的轉(zhuǎn)移微生物,該重組體包含一個編碼上述的堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或堿性支鏈淀粉酶的DNA片段。
本發(fā)明還提供了一種產(chǎn)生堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或堿性支鏈淀粉酶的方法。該方法的特征是培養(yǎng)上述轉(zhuǎn)化過的微生物并收集任何一種所表達(dá)的酶。
附圖簡要描述
圖1顯示得自Bacillus sp.KSM-AP1378的堿性淀粉支鏈淀粉酶基因的限制酶圖和引物的位置。
圖2顯示得自Bacillus sp.KSM-AP1378的堿性淀粉支鏈淀粉酶基因的亞克隆方案。
圖3是顯示堿性淀粉支鏈淀粉酶的α-淀粉酶和支鏈淀粉酶活性的pH值關(guān)系圖。
圖4顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的PstI消化產(chǎn)物的Southern雜交分析結(jié)果(用片段A為探針)。在Southern濾膜的左側(cè),同時經(jīng)歷電泳的λDNA-HindIII消化產(chǎn)物(Boehringer Mannheim)的大小標(biāo)記的位置與各自的DNA片段的大小一道標(biāo)明。
圖5顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的XbaI消化產(chǎn)物的Southern雜交分析結(jié)果(用片段C為探針)。在Southern濾膜的左側(cè),同時經(jīng)歷電泳的λDNA-HindIII消化產(chǎn)物(Boehringer Mannheim)的大小標(biāo)記的位置與各自的DNA片段的大小一道標(biāo)明。
圖6顯示用于聚合酶鏈?zhǔn)椒磻?yīng)的引物的核苷酸序列。引物1、3、5和B用作互補(bǔ)序列。
圖7顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的EcoRI消化產(chǎn)物的Southern雜交分析結(jié)果(用片段D為探針)。在Southern濾膜的左側(cè),同時經(jīng)歷電泳的λDNA-HindIII消化產(chǎn)物(Boehringer Mannheim)的大小標(biāo)記的位置與各自的DNA片段的大小一道標(biāo)明。
圖8顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的XbaI消化產(chǎn)物的Southern雜交分析結(jié)果(用片段E為探針)。在Southern濾膜的左側(cè),同時經(jīng)歷電泳的λDNA-HindIII消化產(chǎn)物(Boehringer Mannheim)的大小標(biāo)記的位置與各自的DNA片段的大小一道標(biāo)明。
優(yōu)選實(shí)施方案的詳盡描述在本發(fā)明中,一種用作堿性淀粉支鏈淀粉酶基因供體的有用微生物,可以是如Bacillus sp.KSM-AP1378,其是嗜堿芽孢桿菌。該菌株由本發(fā)明發(fā)明人從位于日本Tochigi Prefeture的Tochigi市附近的土壤中分離出來,并且鑒定為可產(chǎn)生大量的堿性淀粉支鏈淀粉酶的菌株。該菌株已以保藏號BP-3048保藏在發(fā)酵研究所。
為了從微生物供體中獲得染色體DNA,可以使用由Marmur,J.(分子生物學(xué)雜志,3,208(1961))及Saito,H.和Miura,K.(Biochim.Biophys.Acta.,72,619(1963))提出的方法。也可以使用其它類似的方法。
使用限制酶切割這樣獲得的染色體DNA,制備包含堿性淀粉支鏈淀粉酶基因的DNA片段。對所使用的限制酶沒有特別的限制,只要它們不破壞所述基因。也可由聚合酶鏈?zhǔn)椒磻?yīng)獲得堿性淀粉支鏈淀粉酶基因。例如,可以通過合成引物(具有與位于必需區(qū)5-末端的上游側(cè)和3′-末端的下游側(cè)的序列相對應(yīng)的序列,所述必需區(qū)基于在2號序列中所描述的核苷酸序列)、用產(chǎn)生堿性淀粉支鏈淀粉酶的微生物的染色體DNA作為模板進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng)獲得所述基因。另外,可以用以下兩種方法中的任何一種方法獲得一個完整的基因首先用任一方法從產(chǎn)生堿性淀粉支鏈淀粉酶的微生物中獲得堿性支鏈淀粉酶基因片段,而后經(jīng)聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增一個存在于前一片段上游側(cè)的堿性α-淀粉酶基因片段;或者反過來,首先獲得堿性α-淀粉酶基因,其后經(jīng)聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增存在于該基因下游側(cè)的堿性支鏈淀粉酶基因片段。
克隆這樣制備的片段。可利用的受體/載體系統(tǒng)沒有特別的限制,只要受體細(xì)菌菌株能表達(dá)本發(fā)明的堿性淀粉支鏈淀粉酶基因;重組DNA能夠在受體細(xì)菌中復(fù)制;并且重組DNA能夠穩(wěn)定地攜帶整合的基因。例如,可以使用其中受體是E.coli k-12的EK系統(tǒng)的成員和其中受體是枯草芽胞桿菌Marburg的BS系統(tǒng)的成員。EK系統(tǒng)包括許多種載體且在遺傳學(xué)上進(jìn)行了廣泛的研究,使用該系統(tǒng)可以提供良好的結(jié)果,因而是優(yōu)選的。受體細(xì)菌的特定的例子包括EK系統(tǒng)的HB101、C600和JM109菌株以及BS系統(tǒng)的BD170、MI11和ISW1214菌株。載體的特定的例子包括EK系統(tǒng)的pBR322和pUC18以及BS系統(tǒng)的pUB110和pHY300PLK。用限制酶切割載體,隨后與以上提到的染色體DNA或聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增的DNA片段連接來獲得重組質(zhì)粒DNA。可以通過使用例如DNA連接酶完成該連接。
對用重組DNA轉(zhuǎn)化受體細(xì)菌菌株的方法沒有特別的限制。例如,在EK系統(tǒng)的受體的情況下可以使用氯化鈣方法(Mandel,M.,和Higa,A.,分子生物學(xué)雜志,53,159(1970)),而在BS系統(tǒng)的受體的情況下可以使用原生質(zhì)體方法(Chang,C.和Cohen,S.N.,分子基因遺傳學(xué)(Mol.Gen.Genet.),168,111(1978))。
重組微生物的選擇按如下步驟進(jìn)行。第一,使用作為指示的載體DNA編碼的抗生素抗性(其不被外源染色體DNA片段和聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增的DNA片段的插入滅活)之類的特征,選擇已由包含載體來源的DNA片段的DNA轉(zhuǎn)化過的微生物。例如在其中EK系統(tǒng)的pBR322用作載體并且將染色體DNA的BamHI片段插入到pBR322的BamHI切割位點(diǎn)的特定的情況下,四環(huán)素抗性基因被滅活,因此,可以利用在基因中不具有BamHI切割位點(diǎn)的氨芐青霉素抗性作為指示進(jìn)行初步選擇。其次,使用例如復(fù)制方法,把所選擇的微生物轉(zhuǎn)移到包含直鏈淀粉或者支鏈淀粉的瓊脂平板上,然后培養(yǎng)該微生物形成菌落。檢測分解淀粉、在包含直鏈淀粉的瓊脂平板上形成暈圈,也在包含支鏈淀粉的瓊脂平板上形成暈圈的菌落。
可以用制備質(zhì)粒或噬菌體DNA的標(biāo)準(zhǔn)步驟(Maniatis,T.等,分子克隆,冷泉港實(shí)驗(yàn)室,紐約(1982))提取如此獲得的重組微生物所攜帶的重組DNA。利用各種限制酶切割所提取的重組DNA,并分析電泳裂解模式,這兩個步驟證實(shí)重組DNA是載體DNA和包含堿性淀粉支鏈淀粉酶基因的DNA片段的連接產(chǎn)物。
編碼堿性支鏈淀粉酶活性,本發(fā)明的堿性淀粉支鏈淀粉酶部分的片段包含在一個約9.4kb的DNA片段中(如圖1的限制酶圖所示)并存在于約6.2kb的區(qū)段上(如斜劃線條所示)。
包含堿性淀粉支鏈淀粉酶基因的大小約6.2kb的片段具有如2號序列所示的核苷酸序列。在這個序列中,5末端和3末端分別對應(yīng)于約6.2kb的片段的左側(cè)和右側(cè)。在這個序列中觀察到一個開放讀框,該開放讀框在第145個ATG上開始翻譯,并編碼由1號序列所描述的1938個氨基酸殘基形成的序列。在該開放讀框上游的15個堿基(15b)中,存在序列GAAAGGGG,該序列高度互補(bǔ)于枯草芽胞桿菌的16s核糖體RNA的3末端序列(McLaughlin,J.R.等,生物化學(xué)雜志,256,11283(1981))。在從35位核苷酸中延伸的較遠(yuǎn)上游側(cè)上,存在一個序列TTTACA......20B......TAAATT,該序列與σA型啟動子的共有序列具有高度同源性(Gitt,M.A.等,生物化學(xué)雜志,260,7178(1985))。在5959位核苷酸的翻譯終止密碼子TAA的下游側(cè)上,存在一個反向重復(fù)序列(核苷酸編號5961-6015),該序列大概是一個轉(zhuǎn)錄終止子。此外,通過純化Bacillus sp.KSM-AP1378的培養(yǎng)物,獲得堿性淀粉支鏈淀粉酶中的氨基末端側(cè)上的14個殘基的氨基酸序列,該序列與由本發(fā)明的DNA片段的核苷酸序列推定的從第一個氨基酸延伸的序列(2號序列中1-14位氨基酸)相符合。
通過將本發(fā)明的基因的核苷酸序列和推定的氨基酸序列同迄今為止已知的α-淀粉酶和支鏈淀粉酶的核苷酸序列和氨基酸序列進(jìn)行比較,證實(shí)本發(fā)明的基因是一種具有獨(dú)特的核苷酸序列的新基因,該基因編碼的氨基酸序列不同于α-淀粉酶或支鏈淀粉酶的氨基酸序列。
此外,本發(fā)明的基因的特征在于該基因編碼具有兩個活性中心的酶,一個活性中心是堿性α-淀粉酶的,另一個是堿性支鏈淀粉酶的,兩個活性中心都在蛋白質(zhì)的一個單一肽鏈中。存在從淀粉酶(430-613位氨基酸)和支鏈淀粉酶(1364-1549位氨基酸)的活性中心唯一觀察到的四種序列中的每一種(區(qū)域I-IV;Nakajima,R.等,應(yīng)用微生物生物技術(shù),23,355(1986))。具體地說,在2號序列的氨基酸序列中,I區(qū)的堿性α-淀粉酶=430-435,II區(qū)的堿性α-淀粉酶=514-522,III區(qū)的堿性α-淀粉酶=547-550,IV區(qū)的=608-613,I區(qū)的堿性支鏈淀粉酶=1364-1369,II區(qū)的堿性支鏈淀粉酶=1428-1436,III區(qū)的堿性支鏈淀粉酶=1461-1464,IV區(qū)的堿性支鏈淀粉酶=1544-1549。此外,在可能是分別編碼α-淀粉酶和堿性支鏈淀粉酶的結(jié)構(gòu)基因之間,一種由33個氨基形成的間插序列出現(xiàn)了兩次(在2號序列的氨基酸中,802-834和912-944)。因此,利用這個典型特征,以一種獨(dú)立方式表達(dá)堿性α-淀粉酶部分和堿性支鏈淀粉酶部分也是可能的。例如,如果將編碼從起始密碼子開始延伸到間插序列之前的氨基酸骨架的基因插入到質(zhì)粒載體DNA中,并把該氨基酸引入到一種合適的受體細(xì)菌中,那么就可能單獨(dú)產(chǎn)生堿性α-淀粉酶(3號序列)。同樣地,如果編碼從間插序列之后延伸到1906位氨基酸的氨基酸骨架的基因插入到質(zhì)粒載體DNA中,并把該氨基酸引入到一種合適的受體細(xì)菌中,那么就可能單獨(dú)產(chǎn)生堿性支鏈淀粉酶(4號序列)。
一種包含堿性淀粉支鏈淀粉酶基因的整個區(qū)的優(yōu)選的重組DNA的實(shí)例是質(zhì)粒pAP101(圖2)。該質(zhì)粒大小為13.4kb,具有包含6.2kb的堿性淀粉支鏈淀粉酶基因及pHY300PLK和pUC18的部分片段。一種包含重組DNA的優(yōu)選的重組微生物的實(shí)例是大腸桿菌HB101(pAP101)菌株。該菌株是利用標(biāo)準(zhǔn)轉(zhuǎn)化方法用重組質(zhì)粒pAP101轉(zhuǎn)化大腸桿菌HB101菌株獲得的一種產(chǎn)物。當(dāng)利用日常用于培養(yǎng)大腸桿菌的培養(yǎng)基培養(yǎng)該菌株時,該菌株產(chǎn)生堿性淀粉支鏈淀粉酶。這樣產(chǎn)生的酶的最佳反應(yīng)pH,對α-淀粉酶活性而言是pH值8-9,對支鏈淀粉酶活性而言是pH值9-10。這與為堿性淀粉支鏈淀粉酶(由基因供體細(xì)菌Bacillus Sp.KSM-AP1378產(chǎn)生)測定的酶活性-pH值關(guān)系輪廓(圖3)吻合得很好。
本發(fā)明的DNA片段不必僅限于那些編碼以下序列表中所顯示的氨基酸的DNA片段,只要這些片段能編碼一種具有人們感興趣的酶促活性的蛋白質(zhì),并且它們包含編碼其中一個或多個氨基酸被取代、添加、缺失、反向、或插入的氨基酸序列的DNA片段。一種這樣的DNA的例子是編碼等同于1號序列所描述的氨基酸序列(從中N-末端側(cè)上32個氨基酸被缺失)的DNA。因此本發(fā)明包括1號序列所示的堿性淀粉支鏈淀粉酶,其中1至32位之間的氨基酸已從氨基末端缺失。
用已知方法培養(yǎng)這樣獲得的轉(zhuǎn)化體時,可產(chǎn)生堿性α-淀粉酶,堿性支鏈淀粉酶或堿性淀粉支鏈淀粉酶。那就是說,如果利用一種包含僅能編碼堿性α-淀粉酶的結(jié)構(gòu)域的轉(zhuǎn)化體,將獲得堿性α-淀粉酶;如果利用一種包含僅能編碼堿性支鏈淀粉酶的結(jié)構(gòu)域的轉(zhuǎn)化體,將獲得堿性支鏈淀粉酶;如果利用一種包含編碼整個堿性淀粉支鏈淀粉酶的結(jié)構(gòu)域的轉(zhuǎn)化體,將獲得堿性淀粉支鏈淀粉酶。
本發(fā)明的DNA片段還可用作探針,從其它有機(jī)體分離同源堿性淀粉支鏈淀粉酶基因。
實(shí)施例下一步將通過實(shí)施例更詳細(xì)地描述本發(fā)明,但不應(yīng)該理解為是對本發(fā)明的限制。在實(shí)施例中的濃度都是依據(jù)重量%的。實(shí)施例1-染色體DNA的分離把產(chǎn)生堿性淀粉支鏈淀粉酶的Bacillus sp.KSM-AP1378接種到5毫升培養(yǎng)基A(表1)中,并使之在30℃下經(jīng)歷24小時的震蕩培養(yǎng)。把1毫升培養(yǎng)物接種在100毫升相同的培養(yǎng)基中,隨后在30℃下再震蕩培養(yǎng)12小時。其后,離心收集細(xì)胞,按照Saito和Miura提出的方法(Saito,H.和Miura K.,生物化學(xué)生物物理學(xué)報,72,619(1963)),獲得約1毫克染色體DNA。
表1培養(yǎng)基A的組成支鏈淀粉 1.0%胰化蛋白胨 0.2%酵母提取物 0.1%KH2PO40.03%(NH4)2SO40.1%MgSO4·7H2O 0.02%CaCl2·2H2O 0.02%FeSO4·7H2O 0.001%MnCL2·4H2O 0.0001%Na2CO30.5%(已單獨(dú)地滅菌)PH值10實(shí)施例2-編碼堿性支鏈淀粉酶的DNA片段的分離利用限制酶PstI切割由實(shí)施例1所獲得的染色體DNA(10微克),而后,添加同樣被限制酶PstI切割的載體質(zhì)粒pBR322(1微克,BoehringerMannheim),并且利用T4 DNA連接酶進(jìn)行連接反應(yīng),進(jìn)而產(chǎn)生重組質(zhì)粒的混合物。經(jīng)重組質(zhì)?;旌衔锏霓D(zhuǎn)化產(chǎn)生大腸桿菌的懸液,把該懸液擴(kuò)散到包含15微克/毫升四環(huán)素的LB瓊脂平板培養(yǎng)基(1.0%胰胨(Difco)、0.5%酵母抽提物(Difco)、1.0%NaCl及1.5%瓊脂(Wako化學(xué)純化的))上,并在37℃下培養(yǎng)12小時。在出現(xiàn)的轉(zhuǎn)化細(xì)胞菌落中,覆蓋包含0.2%支鏈淀粉的0.8%瓊脂、0.8%紅色支鏈淀粉(red pullulan)(Kanno,M.和Tomiura,E.,農(nóng)業(yè)生物化學(xué),49,1529(1985))、1毫克/毫升的溶菌酶和甘氨酸-NaCl-NaOH緩沖液(pH值9.0);并在37℃下進(jìn)行反應(yīng)5小時。結(jié)果獲得一種單一菌株,由于紅色支鏈淀粉的分解,該菌株在其菌落周圍形成一個透明暈圈。分離該菌株作為能夠產(chǎn)生堿性支鏈淀粉酶的重組微生物。實(shí)施例3-具有堿性支鏈淀粉酶的DNA質(zhì)粒的限制圖把實(shí)施例2所獲得的重組微生物接種到包含15微克/毫升四環(huán)素的5毫升LB培養(yǎng)基(1.0%胰胨(Difco)、0.5%酵母抽提物(Difco)、1.0%NaCl)中,并在37℃下培養(yǎng)一夜。此后,把培養(yǎng)物轉(zhuǎn)移到500毫升LB培養(yǎng)基中,然后震蕩培養(yǎng)24小時。從培養(yǎng)物中分離收集細(xì)胞,利用標(biāo)準(zhǔn)方法(Maniatis,T.等,分子克隆,冷泉港實(shí)驗(yàn)室(1982)),獲得約500毫克重組質(zhì)粒。如圖1所示,從所形成的重組質(zhì)粒的限制酶圖譜中可以看出該質(zhì)粒包含約6.3kb的PstI片段。該質(zhì)粒命名為pPU100。而利用質(zhì)粒pPU100所轉(zhuǎn)化的大腸桿菌HB101菌株則命名為HB101(pPU100)。實(shí)施例4-堿性支鏈淀粉酶活性的測量
將菌株HB101(pPU100)在5毫升LB培養(yǎng)基(包含四環(huán)素)培養(yǎng)一整夜,獲得該菌株的的培養(yǎng)物,把1毫升培養(yǎng)物接種到100毫升LB培養(yǎng)基(包含四環(huán)素)中,而后在37℃下震蕩培養(yǎng)24小時。其后,把通過離心分離的細(xì)胞懸浮在Tris-HCl緩沖液(pH值8.0)中,并超聲處理破裂這些細(xì)胞。通過離心分離除去細(xì)胞碎片,上清液則用作無細(xì)胞提取物。同樣地,利用菌株HB101(pBR322)制備對照的無細(xì)胞提取物。測量這些提取物的支鏈淀粉酶活性。測量支鏈淀粉酶活性的步驟是首先進(jìn)行一個反應(yīng),該反應(yīng)在包含40mM甘氨酸-NaCl-NaOH緩沖液(pH值10)和支鏈淀粉(最后的濃度=0.25%)的反應(yīng)混合物中進(jìn)行;同時,利用3,5-二硝基水楊酸(DNS)方法(Miller,G.L.等,Anal.Biochem.,2,127(1960))定量測定所產(chǎn)生的還原糖。把每分鐘產(chǎn)生數(shù)量相當(dāng)于1μmol葡萄糖的還原糖時的酶量作為一個單位。結(jié)果檢測到在菌株HB101(pPU100)的無細(xì)胞提取物中存在支鏈淀粉酶活性。另外,測量產(chǎn)生支鏈淀粉酶的最佳作用pH值時發(fā)現(xiàn)支鏈淀粉酶實(shí)際上是一種具有最佳作用pH值為9.5的堿性支鏈淀粉酶。為了測量酶促活性,需要利用下列緩沖液(各40mM)pH值3.5-5.5醋酸緩沖液pH值5.5-8.5Tris-順丁烯二酸緩沖液pH值8.5-10.5甘氨酸-NaCl-NaOH緩沖液pH值10.5-11.0Na2CO3-NaHCO3緩沖液實(shí)施例5-堿性淀粉支鏈淀粉酶基因與用PstI消化的Bacillus sp.KSM-AP1378染色體DNA的Southern雜交用限制酶PstI切割約5微克的pPU100,并使之在瓊脂糖凝膠上電泳。利用Geneclean試劑盒(Biolol公司),從該凝膠中分離出約0.5微克的大小約6.3kb的PstI片段。用DNA標(biāo)記檢測試劑盒(Boehringer Mannheim)標(biāo)記PstI片段制備DNA探針。獨(dú)立地,用PstI切割來源于Bacillus sp.KSM-AP1378的染色體DNA(各3μg),在瓊脂糖凝膠上電泳;并利用由Southern提出的方法(Southern,E.M.,分子生物學(xué)雜志,98,503(1975)),把DNA帶轉(zhuǎn)移至尼龍膜(Amersham)上。利用DNA標(biāo)記和檢測試劑盒研究用DNA探針雜交的情況。結(jié)果表明如圖4所示,KSM-AP1378菌株的染色體DNA的PstI裂解產(chǎn)物中,檢測到一種大小約6.3kb的與DNA探針雜交的DNA片段的存在。這樣可以證實(shí)包含在質(zhì)粒pPU100中的大小約6.3kb的PstI片段是來源于Bacillus sp.KSM-AP1378染色體DNA的片段。實(shí)施例6-包含編碼堿性支鏈淀粉酶的DNA片段之質(zhì)粒的構(gòu)建在質(zhì)粒pHY300PLK的PstI位點(diǎn)和BamHl位點(diǎn)之間,通過插入約3.5kb大小的片段(片段B,圖1)產(chǎn)生重組質(zhì)粒pHYPUL,所述3.5kb片段通過用BamHI切割包含在質(zhì)粒pPU100中的大小約6.3kb的PstI片段獲得。用這樣產(chǎn)生的重組質(zhì)粒轉(zhuǎn)移大腸桿菌,同時,通過類似于實(shí)施例4的方法測量支鏈淀粉酶活性。結(jié)果觀察到支鏈淀粉酶活性,該活性在pH值9-10范圍內(nèi)具有最佳作用pH。這說明堿性支鏈淀粉酶的必需結(jié)構(gòu)域是從PstI位點(diǎn)到BamHI位點(diǎn)的大小約3.5kb的一段。實(shí)施例7-編碼堿性支鏈淀粉酶的DNA片段的測序用實(shí)施例6中獲得的片段B、市售的缺失試劑盒(千序列缺失試劑盒,Takara Shuzo)和兩種合適的限制酶,產(chǎn)生包含所產(chǎn)生的已被還原的片段的重組質(zhì)粒DNA,并測定所插入的片段的核苷酸序列。依據(jù)使用熒光標(biāo)記引物的方法(Smith L.M.等,自然,321,674(1986)),利用DNA測序儀序列(370A型,應(yīng)用生物系統(tǒng))和Taq-Dydeoxy循環(huán)測序試劑盒(應(yīng)用生物系統(tǒng)測定核苷酸序列。從各自的DNA樣品中重疊具有約300-450個bp大小的核苷酸序列,從而測定在片段B的Pst1位點(diǎn)側(cè)面上的3038bp序列。結(jié)果發(fā)現(xiàn)堿性支鏈淀粉酶基因的開放讀框(開放讀框)延續(xù)到PstI位點(diǎn)的上游側(cè),其是所獲得的約6.3kb大小的片段的末端。堿性淀粉支鏈淀粉酶基因的限制性作圖實(shí)施例8使用如圖1所示的約6.3kb大小的片段,產(chǎn)生約1.5kb大小的PstI-XbaI片段(片段C),同時以類似于實(shí)施例5所描述的的方式標(biāo)記該片段,從而制備DNA探針(探針1)。單獨(dú)地,使已用XbaI(各3微克)切割的Bacillus sp.KSM-AP1378的染色體DNA在瓊脂糖凝膠上電泳;同時,用類似于實(shí)施例5所描述的方式把所產(chǎn)生的DNA帶轉(zhuǎn)移至尼龍膜(Amersham)上,其后以探針雜交該DNA帶。結(jié)果發(fā)現(xiàn)探針1同具有約2.3kb大小的Xba1片段雜交,且從這推論出,在約6.3kb大小的片段PstI-PstI的上游約0.8 kb存在XbaI位點(diǎn),片段PstI-PstI位于KSM-AP1378菌株的染色體DNA上(圖1)。按照反向聚合酶鏈?zhǔn)椒磻?yīng)方法(Triglia,T.等,核酸研究,16,81(1988);一個循環(huán)=94℃×1分鐘+55℃×1分鐘+72℃×3分鐘,30個循環(huán)),用聚合酶鏈?zhǔn)椒磻?yīng)試劑盒(應(yīng)用生物系統(tǒng)),以環(huán)狀DNA(通過分子內(nèi)連接用XbaI切割的KSM-AP1378的染色體DNA獲得)作為模板,用引物1和引物2(各引物都具有24個核苷酸并基于實(shí)施例7所測定的核苷酸序列合成)(圖1和圖6)擴(kuò)增從PstI位點(diǎn)到XbaI位點(diǎn)的一段大小約0.8kb片段。以類似于實(shí)施例7所描述的方式,測定經(jīng)過上述擴(kuò)增的0.8kb片段(片段D)的序列。結(jié)果發(fā)現(xiàn)堿性支鏈淀粉酶的開放讀框從片段C延伸至片段D的上游(圖1)。實(shí)施例9以類似于實(shí)施例5所描述的方法,標(biāo)記實(shí)施例8所獲得的從XbaI伸展至PstI的大小約0.8kb的片段,從而制備DNA探針(探針2)。單獨(dú)地,使已由EcoRI(各3微克)切割的Bacillus sp.KSM-AP1378的染色體DNA在瓊脂糖凝膠上進(jìn)行電泳;并以類似于實(shí)施例5所描述的方式,把所產(chǎn)生的DNA帶轉(zhuǎn)移到尼龍膜(Amersham)上,其后以探針2雜交該染色體。從雜交后的EcoRI片段的大小(3.6kb,圖7),可以推論出在實(shí)施例8所獲得的片段D上游1.2kb存在EcoRI位點(diǎn)。按照類似實(shí)施例8所描述的反向聚合酶鏈?zhǔn)椒磻?yīng)方法,以環(huán)狀DNA(通過分子內(nèi)連接用EcoRI切割的KSM-AP1378的染色體DNA獲得)作為模板,用引物3和引物4(各引物都具有24個核苷酸并基于實(shí)施例8所測定的核苷酸序列合成)(圖1和圖6)擴(kuò)增從XbaI位點(diǎn)到這一位點(diǎn)上游1.2kb的一段(片段E)。以類似于實(shí)施例7所描述的方式,測定經(jīng)過上述擴(kuò)增的1.2kb片段的序列。結(jié)果發(fā)現(xiàn)堿性支鏈淀粉酶的開放讀框從片段D延伸至片段E的上游。實(shí)施例10以類似于實(shí)施例5中所描述的方式,標(biāo)記實(shí)施例9所獲得的片段E,從而制備DNA探針(探針3)。以類似于實(shí)施例8和9的方式,在菌株KSM-AP1378的染色體DNA的XbaI裂解產(chǎn)物上進(jìn)行雜交分析(圖8)。從圖1顯示的結(jié)果可推論出在片段D的EcoRI位點(diǎn)的上游1.1kb存在XbaI位點(diǎn),片段D位于菌株KSM-AP1378的染色體DNA中。按照類似實(shí)施例8所描述的反向聚合酶鏈?zhǔn)椒磻?yīng)方法,以環(huán)狀DNA(通過分子內(nèi)連接用XbaI切割的KSM-AP1378的染色體DNA獲得)作為模板,用引物5和引物6(各引物都具有24個核苷酸并基于實(shí)施例9所測定的核苷酸序列合成)(圖1和圖6)擴(kuò)增從EcoRI位點(diǎn)到這一位點(diǎn)上游1.1kb的一段。以類似于實(shí)施例7所描述的方式,測定經(jīng)過上述擴(kuò)增的1.1kb片段(片段E)的序列。結(jié)果證實(shí)堿性支鏈淀粉酶基因開放讀框的5區(qū)從存在于這一片段中的片段E延伸。2號序列描述了本發(fā)明基因的完整的核苷酸序列和推定的氨基酸序列。推定的1號序列14個氨基酸與用堿性淀粉支鏈淀粉酶在Bacillus sp.KSM-AP1378上實(shí)際測定的氨基末端序列相符合,基于這個事實(shí),可以假定本發(fā)明基因編碼堿性淀粉支鏈淀粉酶。實(shí)施例11按照聚合酶鏈?zhǔn)椒磻?yīng)方法(循環(huán)=94℃×1分鐘+55℃×1分鐘+72℃×3分鐘,30個循環(huán)),用聚合酶鏈?zhǔn)椒磻?yīng)試劑盒(應(yīng)用生物系統(tǒng)),以菌株KSM-AP1378的染色體DNA為模板,使用各具有25個核苷酸的引物A和B(基于實(shí)施例7和10所測定的核苷酸序列合成)(圖1和6)擴(kuò)增包含堿性淀粉支鏈淀粉酶基因的α-淀粉酶域的3.5kb片段。把所產(chǎn)生的DNA片段插入到pUC18質(zhì)粒載體的SmaI位點(diǎn)中,然后利用市售的大腸桿菌HB101感受態(tài)細(xì)胞進(jìn)行轉(zhuǎn)化。把獲得的轉(zhuǎn)化體復(fù)制到包含0.4%藍(lán)色淀粉(天青淀粉,σ)和50微克/毫升氨芐青霉素的LB培養(yǎng)基上,其后在37℃下培養(yǎng)12個小時。分離分解藍(lán)色淀粉從而在它的菌落周圍形成暈圈的單一菌株。按類似于實(shí)施例3所描述的方式,從該菌株中制備質(zhì)粒(pAMY100)。實(shí)施例12-堿性淀粉支鏈淀粉酶的重組產(chǎn)生經(jīng)采用T4連接酶、7.7kb片段(通過切割包含堿性淀粉支鏈淀粉酶的堿性支鏈淀粉酶域的質(zhì)粒pHYPUL獲得(實(shí)施例3))以及pAMY100(包含相同基因的堿性α-淀粉酶域(實(shí)施例11))連接制備重組質(zhì)粒混合物。用該重組質(zhì)?;旌衔镛D(zhuǎn)化大腸桿菌HB101;把出現(xiàn)的各轉(zhuǎn)化體分別復(fù)制到兩種LB培養(yǎng)基上,一種LB培養(yǎng)基包含0.4%藍(lán)色淀粉和50微克/毫升的氨芐青霉素,另一種LB培養(yǎng)基包含0.8%紅色支鏈淀粉(Kanno,M.和Tomiura,E.,農(nóng)業(yè)生物化學(xué),49,1529(1985))和50微克/毫升的氨芐青霉素;隨后在37℃下生長培養(yǎng)12小時。一種菌株在兩個平板上的其菌落周圍形成暈圈,分離該菌株作為能夠產(chǎn)生堿性淀粉支鏈淀粉酶的重組大腸桿菌。實(shí)施例13利用實(shí)施例12所獲得的重組大腸桿菌,以類似于實(shí)施例3所描述的方式制備約500微克的重組質(zhì)粒。從所產(chǎn)生的重組質(zhì)粒的限制性圖譜中可以發(fā)現(xiàn)如圖1中所示,該質(zhì)粒包含約7.0kb的DNA片段(片段H)。這一質(zhì)粒命名為pAP101(圖2),用質(zhì)粒pAP101轉(zhuǎn)化的大腸桿菌HB101命名為HB101(pAP101)。實(shí)施例14以類似于在實(shí)施例4所描述的方式,使用大腸桿菌HB101(pAP101)制備無細(xì)胞提取物。同時,利用HB101(pBR322)菌株制備對照無細(xì)胞提取物。測定這些提取物的α-淀粉酶和支鏈淀粉酶活性。測定α-淀粉酶的活性的方法是在包含50mM甘氨酸-NaCl-NaOH緩沖液(pH值10)和可溶淀粉的反應(yīng)混合物中,在50℃下進(jìn)行反應(yīng)15分鐘;同時,用DNS方法定量測定所產(chǎn)生的還原糖。以類似于在實(shí)施例4中所描述的方式測量支鏈淀粉酶活性。在這兩種情況下,把每分鐘產(chǎn)生數(shù)量相當(dāng)于1μmol葡萄糖的還原糖時的酶量作為一個單位。結(jié)果檢測到在菌株HB101(pAP101)的無細(xì)胞提取物中存在α-淀粉酶和支鏈淀粉酶活性。當(dāng)用如實(shí)施例4所描述的方法測量α-淀粉酶和支鏈淀粉酶的最佳作用pH值時,發(fā)現(xiàn)在pH值8-9和9-10的范圍內(nèi),分別觀測到最大的α-淀粉酶活性和最大的支鏈淀粉酶活性。實(shí)施例15-堿性淀粉支鏈淀粉酶的特征確定從Bacillus sp.KSM-AP1378的培養(yǎng)物中,純化50毫克堿性淀粉支鏈淀粉酶(210kDa;日本專利出版物(kokoku)No.6-32613),將0.1毫克木瓜蛋白酶(σ,5U/微克)添加到該堿性淀粉支鏈淀粉酶中,同時讓其在30℃下水解2分鐘。其后,向其中添加10微克的抗蛋白酶(Furuka),停止該反應(yīng)。利用DEAE 5PW層析柱(7.5mm×7.5cm;Tsoh)分級分離所形成的分解產(chǎn)物,從而獲得具有114kDa和102kDa的蛋白質(zhì)片段。這兩種蛋白質(zhì)片段的酶促活性測定表明102kDa蛋白質(zhì)片段僅具有堿性支鏈淀粉酶活性,114kDa蛋白質(zhì)片段僅具有堿性α-淀粉酶活性。在僅具有支鏈淀粉酶活性的102kDa蛋白質(zhì)片段的氨基酸序列N-末端測定中,測出有序列蘇氨酸-纈氨酸-脯氨酸-亮氨酸-丙氨酸-亮氨酸-纈氨酸-絲氨酸-甘氨酸-谷氨酸-纈氨酸-亮氨酸-絲氨酸-天冬氨酸-賴氨酸-亮氨酸,這完全同從2號序列所描述的核苷酸序列中推論出的第1014至第1029位氨基酸的序列一致。同樣地,在僅具有α-淀粉酶活性的114kDa蛋白質(zhì)片段的氨基酸序列N-末端的測定中,測出有序列谷氨酸-蘇氨酸-甘氨酸-天冬氨酸-賴氨酸-精氨酸-異亮氨酸-谷氨酸-苯丙氨酸-絲氨酸-酪氨酸-谷氨酸-精氨酸-脯氨酸的測定,該序列完全同從2號序列所描述的核苷酸序列中推論出的第1至第14位氨基酸的序列一致。這些結(jié)果也證明本發(fā)明基因編碼堿性淀粉支鏈淀粉酶蛋白質(zhì),該蛋白質(zhì)具有不同的活性中心,具體地說,即支鏈淀粉酶活性的活性中心和α-淀粉酶活性的活性。實(shí)施例16把重組質(zhì)粒pAP101引入枯草芽孢桿菌ISW1214中,同時通過振蕩,在31℃下使轉(zhuǎn)化細(xì)胞在包含15微克/毫升四甘氨酸的LB培養(yǎng)基中生長60小時。根據(jù)堿性支鏈淀粉酶活性,發(fā)現(xiàn)堿性淀粉支鏈淀粉酶以每升60個單位的水平分泌。所表達(dá)的酶具有一定的最佳pH值范圍直鏈淀粉酶活性最佳pH值約為8-9,支鏈淀粉酶活性最佳pH值約為9.5,其值接近于各自的Bacillus sp.KSM-AP1378的堿性淀粉支鏈淀粉酶的酶促活性的最佳pH值。通過十二烷磺酸鈉凝膠電泳測定,所表達(dá)的淀粉支鏈淀粉酶蛋白質(zhì)的分子質(zhì)量大約是200-210kDa,其值接近于菌株KSM-AP1378的酶的質(zhì)量。參考實(shí)施例1
把產(chǎn)生堿性淀粉支鏈淀粉酶的Bacillus sp.KSM-AP1378菌株接種到10ml的A培養(yǎng)基(表1)中,并使之在30℃下經(jīng)歷2天的震蕩培養(yǎng)。把10ml培養(yǎng)物接種到1升的相同培養(yǎng)基中,接著在30℃下再震蕩培養(yǎng)3天。其后,離心處理細(xì)胞,獲得一種包含堿性淀粉支鏈淀粉酶的粗酶液。通過包括在DEAE纖維素上吸附、在瓊脂糖凝膠-α-環(huán)(化)糊精的層析柱上親和層析和在聚丙烯酰氨葡萄糖s-200的層析柱上凝膠過濾等在內(nèi)的各種處理,純化該粗酶液,獲得一種該酶的電泳上均一的樣品。利用蛋白質(zhì)測序儀476A(應(yīng)用生物系統(tǒng))測定這種酶的氨基酸序列的N-末端,測定表明該N-末端具有序列谷氨酸-蘇氨酸-甘氨酸-天冬氨酸-賴氨酸-精氨酸-異亮氨酸-谷氨酸-苯丙氨酸-絲氨酸-酪氨酸-谷氨酸-精氨酸-脯氨酸。參考實(shí)施例2利用實(shí)施例4和14所描述的方法,測定參考實(shí)施例1所獲得的堿性淀粉支鏈淀粉酶的α-淀粉酶活性和支鏈淀粉酶活性的最佳pH。結(jié)果觀測到α-淀粉酶活性的最佳pH值在8.5附近,支鏈淀粉酶活性的最佳pH值在9.5附近。
工業(yè)適用性按照本發(fā)明,獲得一種編碼在堿性pH值范圍內(nèi)顯示出最大活性的堿性淀粉支鏈淀粉酶基因以及一種包含該基因的微生物是可能的。本發(fā)明的應(yīng)用有利于堿性淀粉支鏈淀粉酶的大量生產(chǎn)。堿性淀粉支鏈淀粉酶的特點(diǎn)是在該酶中有不同的活性中心,一個是支鏈淀粉酶的,一個是α-淀粉酶的,二者都存在于該酶的單一蛋白質(zhì)中。
序列表1號序列的信息(i)序列特征(A)長度1938個氨基酸(B)型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(xi)序列描述1號序列Met Lys Lys Arg Phe Gln Arg Gly Met Ala Gly Leu Leu Ser Ile Leu-30 -25 -20Leu I1e Val Ser Met Phe Ala Gly Tyr Leu Pro Ala Arg Ala Ala Ala-15 -10 -5Glu Thr Gly Asp Lys Arg Ile Glu Phe Ser Tyr Glu Arg Pro Asp Gly1 5 10 15Asn Tyr Glu Gly Trp Asn Leu Trp Val Trp Gly Thr Gly Val Lys Asp20 25 30Asp Gln Ile Asp Phe Thr Glu Phe Lys Glu Gly Lys Ala Tyr Ala Asp35 40 45Ile Ala Val Ser Asp Asn Ala Asp Lys Val Gly Phe Ile Ile Arg Lys50 55 60Gly Asp Trp Glu Glu Lys Asp Phe Asp Gly Asp Arg Ser Ile Thr Ile65 70 75 80Asn Lys Ile Asp Asn Ile Thr Lys Val His Val Thr Ser Gln Gln Glu85 90 95Lys Phe Gly Gln Ile Pro Asp Gly Ser Pro Pro Val Val Ala Asp Gly100 105 110Asn Ala Asp Phe Phe Phe Arg Asp Lys Glu Leu Tyr Ala Ala Gly Glu115 120 125Met Asp Lys Val Glu Lys Val Glu Leu Ser Ile Leu Gly Glu Lys Tyr130 135 140Glu Met Asn Gly Glu Pro Glu Lys Glu Arg Phe Thr Tyr Thr Leu Ser145 150 155 160Asp Leu Pro Thr Gly Glu His Glu Tyr Thr Tyr Leu Val Thr Val Asp165 170 175Gly Gln Thr Glu Glu Val Thr Asp Pro Tyr Asn Thr Val Asp Gly Arg180 185 190Ser Val Val Glu Tyr Val Thr Ser Asp Val Gln Val Ser Ala Ser Phe195 200 205Ile Pro Ala Lys Val Asp Tyr Asn Gln Asn Ala Val Val Lys Val Asp210 215 220Ile Glu Ser Glu Thr Glu Thr Lys Ile Arg Glu Met Ser Ile Asn Leu225 230 235 240Ser Glu Ile Gly Gly Lys Glu Lys Ala Thr Ile Asp Pro Ala Leu Asn245 250 255Glu Leu Thr Val Ala Val Lys Gln Gly Val Thr Ala Gly Val Lys Asn260 265 270Leu Pro Ile Thr Ala Ile Asp Glu Phe Gly Asn Arg His Glu Gly Ser275 280 285Ala Thr Leu Glu Val Gln Ala Arg Thr Ile Thr Gly Glu Lys Ala Asp290 295 300Phe Asp Trp Asp Gln Ser Val Val Tyr Phe Met Leu Thr Asp Arg Phe305 310 315 320Phe Asp Gly Asp Ser Ser Asn Asn Asp Pro His Gly Ile Gly Tyr Asp325 330 335Thr Ser Lys Ser Gly Thr Tyr Gln Gly Gly Asp Phe Lys Gly Ile Thr340 345 350Gln Arg Leu Asp Tyr Leu Asp Glu Leu Gly Ile Asn Thr Ile Trp Ile355 360 365Ser Pro Val Val Asp Asn Ile Lys Phe Asp Val Arg His Ser Glu Gly
370 375 380Pro Asp Thr Pro Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Asp Asn Phe385 390 395 400Gly Glu Leu Asn Pro His Phe Gly Ser Met Ala Asp Phe His Glu Met405 410 415Ile Asp Ala Ala His Glu Arg Gly Ile Lys Ile Met Val Asp Val Val420 425 430Leu Asn His Thr Gly Tyr Gly Leu Lys Pro Gly Asp Ser Ser Ser Val435 440 445Ala Asn Phe Pro Thr Asp Glu Asp Arg Ala Arg Phe Asp Gly Met Leu450 455 460Arg Asp Gly Gly Ser Gly Glu Val Arg Gly Glu Leu Ala Gly Leu Pro465 470 475 480Asp Phe Leu Thr Glu Asn Pro Asp Val Arg Glu Gln Val Val Gln Trp485 490 495Gln Thr Asp Trp Ile Glu Lys Ser Arg Thr Ala Lys Gly Asn Thr Ile500 505 510Asp Tyr Phe Arg Val Asp Thr Val Lys His Val Glu Asp Thr Thr Trp515 520 525Met Ala Phe Lys Asn Ala Leu Thr Lys Ala Met Pro Glu His Lys Leu530 535 540Ile Gly Glu Ala Trp Gly Ala Asn Val Asn Asp Asp Leu Gly Tyr Leu545 550 555 560Asn Ser Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Asn Tyr565 570 575Ala Arg Asp Phe Ala Asn Gly Gln Leu Asp Ala Val Gln Gln Lys Leu580 585 590Glu Ala Arg Asn Ser Lys Leu Asn Asn Thr Ala Thr Leu Gly Gln Phe595 600 605Leu Gly Ser His Asp Glu Asp Arg Phe Tyr Glu Val Val Glu Gly Asp610 615 620Leu Gly Lys Tyr Gln Val Ala Ala Ser Leu Gln Leu Thr Ala Lys Gly625 630 635 640Gln Pro Val Ile Tyr Tyr Gly Glu Glu Leu Gly Leu Pro Gly Lys Asn645 650 655Asp Tyr Pro Tyr Tyr Thr Asn Arg Gln Asn Met Pro Trp Asp Asp Val660 665 670Asp Gly Asn Glu Ile Leu Glu His Tyr Gln Lys Leu Leu Ala Phe Arg675 680 685Asn Asp Asn Pro Asn Thr Phe Ala Lys Gly Asp Arg Lys Lys Val Ala690 695 700Gly Ser Asp Ser Glu Gly Tyr Leu Leu Phe Ser Arg Thr Tyr Gly Glu705 710 715 720Asn Ser Val Tyr Val Gly Leu Asn Thr Glu Ala Ala Ala Lys Asp Val725 730 735Thr Leu Asn Phe Gly Ser Ser Glu Ala Val Val Thr Asp Arg Tyr Ser740 745 750Gly Gln Glu Tyr Gln Ala Asn Glu Glu Gly Gln Val Thr Phe Ser lle755 760 765Pro Ala Met Glu Asp Gly Gly Thr Val Leu Leu Glu Val Glu Asn Gly770 775 780Ala Val Pro Pro Val Glu Glu Glu Pro Thr Glu Pro Gly Glu Ile Glu785 790 795800Glu Asn Thr Leu Arg Ile His Tyr Gln Arg Thr Asp Asn Ser Tyr Glu805 810 815Asn Leu Gly Leu Trp Leu Trp Gly Asp Val Ala Ala Pro Ser Glu Asn820 825 830Trp Pro Ser Gly Gly Thr Pro Phe Gln Ala Gly Asn Val Thr Asp Tyr
835 840 845Gly Ala Tyr Val Asp Val Glu Leu Ala Glu Asp Ala Gln Asn Ile Gly850 855 860Phe Leu Val Leu Asn Thr Thr Asn Gly Asp Lys Asp Gly Gly Asp Lys865 870 875 880Ala Val Glu Leu Phe Ser Pro Asp Leu Asn Glu Ile Trp Ile Lys Gln885 890 895Gly Ser Asp Glu Val Phe Leu Tyr Glu Pro Val Asp Leu Pro Ala Asn900 905 910Thr Val Arg Ile His Tyr Glu Arg Thr Asn Ala Asp Tyr Glu Gly Trp915 920 925Gly Leu Trp Asn Trp Glu Asp Val Glu Ser Pro Ser Asp Gly Trp Pro930 935 940Asn Gly Ala Ala Asp Ala Ala Gly Ile Gly Lys Tyr Gly Ala Tyr Tyr945 950 955 960Asp Ile Lys Leu Lys Glu Asp Ala Asn Lys Ile Gly Phe Leu Phe Val965 970 975Asn Lys Gln Ser Gly Gly Gln Thr Gly Asp Met Thr Phe Asp Met Leu980 985 990Lys Gln Tyr Asn Gln Leu Phe Val Lys Glu Gly Glu Asp Lys Val Tyr9951000 1005Thr Asn Pro Tyr Gly Thr Val Pro Leu Ala Leu Val Ser Gly Glu Val101010151020Leu Ser Asp Lys Leu Ile Ser Leu Thr Phe Thr Arg Thr Glu Gly Leu1025 1030 1035 1040Asp Leu Glu Glu Leu Lys Glu Gln Leu Glu lle Lys Asp Val Asp Gly104510501055Asn Asp Val Ser Phe Thr Asp Val Thr lle Glu Gly Glu Lys Thr Val106010651070His Va1 His Gly Glu Phe Asp Leu Glu Lys Ile Pro Phe Ser Val Thr107510801085Tyr Leu Asp Arg Thr Ile Ser Val Lys Ser Gly Trp Lys Leu Ile Asp109010951100Glu Met Tyr Ala Tyr Asp Gly Lys Leu Gly Ala Glu Leu His Glu Asp11051l1011151120Gly Thr Ala Thr Leu Lys Val Trp Ser Pro Lys Ala Asp Asn Val Ser112511301135Val Val Leu Tyr Asp Lys Val Asp Gln Asn Glu Val Val Asp Thr Ile114011451150Glu Met Val Lys Gly Asp Arg Gly Val Trp Ser Val Lys Leu Thr Lys115511601165Asp Asn Thr Gly Leu Asp Ser Leu Lys Gly Tyr Tyr Tyr His Tyr Glu117011751180Ile Thr His Gly Asp Val Thr Asn Leu Ala Leu Asp Pro Tyr Ala Lys11851190 1195 1200Ser Met Ala Ala Trp Asn Asn Glu Ala Gly Asp Lys Val Gly Lys Ala120512101215Ala Ile Val Asp Ile Gly Ser Ile Gly Pro Glu Leu Asp Tyr Ala Asp122012251230Ile Pro Gly Phe Glu Lys Arg Glu Asp Thr Ile lle Tyr Glu Val His123512401245Val Arg Asp Phe Thr Ser Asp Pro Asn Ile Gly Glu Asp Leu Lys Ala125012551260Gln Phe Gly Thr Phe Ala Ser Phe Val Glu Lys Leu Asp Tyr Ile Gln1265127012751280Glu Leu Gly Val Thr His Ile Gln Leu Leu Pro Val Met Ser Tyr Tyr128512901295Phe Ser Asn Glu Phe Glu Ser Gly Glu Arg Met Leu Glu Tyr Ala Ser
130013051310Thr Gly Thr Asn Tyr Asn Trp Gly Tyr Asp Pro His Asn Tyr Phe Ser131513201325Leu Ser Gly Met Tyr Ser Glu Asn Pro Glu Asp Pro Glu Leu Arg Ile133013351340Lys Glu Phe Lys Asn Leu Ile Asn Glu Ile His Lys Arg Asp Met Gly1345135013551360Val Val Leu Asp Val Val Phe Asn His Thr Ala Gln Val His Ile Phe136513701375Glu Asp Leu Val Pro Asn Tyr Tyr His Phe Met Asp Ala Asp Gly Thr138013851390Pro Arg Thr Ser Phe Gly Gly Gly Arg Leu Gly Thr Thr His Glu Met139514001405Ser Arg Arg Val Leu Val Asp Ser Ile Lys His Trp Val Asp Glu Tyr141014151420Lys Val Asp Gly Phe Arg Phe Asp Met Met Gly Asp His Asp Ala Glu1425143014351440Ser Ile Gln Ile Ala Phe Asp Glu Ala Lys Lys Leu Asn Pro Asn Ile144514501455Val Met Ile Gly Glu Gly Trp Val Thr Phe Ala Gly Asp Glu Gly Glu146014651470Pro Val Gln Ala Ala Asp Gln Gln Trp Met Gln Tyr Thr Glu Ala Val147514801485Gly Ser Phe Ser Asp Glu Phe Arg Asn Glu Leu Lys Ser Gly Phe Gly149014951500Ser Glu Gly Gln Pro Arg Phe Ile Thr Gly Gly Ala Val Asn Val Gln1505151015151520Gln Ile Phe Asp Asn Ile Lys Ala Gln Pro His Asn Phe Met Ala Asp152515301535Gln Pro Gly Asp Val Val Gln Tyr lle Glu Ala His Asp Asn Leu Thr154015451550Leu Tyr Asp Val Ile Ala Gln Ser Ile Lys Lys Asp Pro Glu Ile Ala155515601565Glu Asn Asp Leu Glu Ile His Lys Arg Ile Arg Val Gly Asn Ala Met157015751580Val Leu Thr Ser Gln Gly Thr Ala Phe Leu His Ala Gly Gln Glu Phe1585159015951600Gly Arg Thr Lys Gln Trp Arg Ala Pro Ala Thr Glu Ala Pro Tyr Lys160516101615Ser Thr Tyr Met Thr Asp Ala Asp Gly Asn Pro Phe Val Tyr Pro Tyr162016251630Phe lle His Asp Ser Tyr Asp Ser Ser Asp lle Ile Asn Arg Phe Asp163516401645Trp Glu Lys Ala Thr Asp Ala Glu Lys Tyr Pro Val Asn Asn Val Thr165016551660Arg Asp Tyr Thr Ala Gly Leu lle Glu Leu Arg Arg Ser Ser Asp Ala1665167016751680Phe Arg Leu Gly Ser Arg Glu Leu Val Asp Ser Asn Val Thr Met Val168516901695Asp Ala Pro Glu Ile Lys Glu Gln Asp Leu Val Val Ala Tyr Arg Ser170017051710Val Ser Thr Ala Gly Val Glu Tyr Tyr Thr Phe Val Asn Ala Asp Thr171517201725Ser Ser Arg Thr Leu Thr Leu Gly Gln Asp Leu Thr Glu Gly Val Val173017351740Val Val Asp Ala Glu Glu Ala Asn Val Ala Gly Val Ala Glu Pro Ala1745175017551760Gly Phe Glu Leu Thr Ala Glu Gly Ile Thr Leu Glu Pro Leu Thr Thr
176517701775Val Val Val Arg Val Gly Glu Gln Glu Gly Thr Asp Pro Gly Asp Gly178017851790Asp Gly Asp Gly Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly179518001805Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro181018151820Pro Gly Asn Gly Asn Gly Asn Asn Pro Gly Thr Pro Pro Gly Lys Gly1825183018351840Gly Glu Asn Pro Gly Lys Gly Lys Asn Asp Lys Thr Pro Pro Gly Lys184518501855Gly Gly Asp Asn Pro Gly Lys Gly Asn Lys Leu Pro Leu Thr Ala Thr186018651870Gly Thr Leu Asn Tyr Ile Leu Phs Gly Ala Ile Met Leu Val Leu Gly187518801885Thr Leu Leu Tyr Leu Gly Val Arg Arg Lys Ala Gly Leu Lys Glu Lys189018951900Thr Leu19052號序列的信息(i)序列特征(A)長度6142個堿基對(B)型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(vi)來源(A)生物體Bacillus sp.
(B)菌株KSM-AP1378(xi)序列描述2號序列
TCTA GATGTGCAAT TTTGCGCAAA 24CGATTTCACA TTTACATAAA CAATCTTGGC ATCAATTAAA TTATTTATTG TGCAACTTTG 84TGCAAACGCT TCCACATTTT AGCAAGAAAT GCAAATCATT GTATGGAAAG GGGCAGGGAT 144ATG AAG AAA AGG TTT CAA AGG GGT ATG GCT GGT TTA CTT TCT ATT TTA 192Met Lys Lys Arg Phe Gln Arg Gly Met Ala Gly Leu Leu Ser Ile Leu-30 -25 -20CTT ATT GTT TCC ATG TTT GCA GGC TAT CTA CCG GCA AGA GCA GCG GCC 240Leu Ile Val Ser Met Phe Ala Gly Tyr Leu Pro Ala Arg Ala Ala Ala-15 -10 -5GAA ACG GGA GAC AAG CGG ATA GAA TTC AGT TAT GAA CGG CCA GAT GGA 288Glu Thr Gly Asp Lys Arg Ile Glu Phe Ser Tyr Glu Arg Pro Asp Gly1 5 10 15AAT TAT GAA GGC TGG AAT TTA TGG GTC TGG GGA ACT GGT GTG AAG GAT 336Asn Tyr Glu Gly Trp Ash Leu Trp Val Trp Gly Thr Gly Val Lys Asp20 25 30GAC CAG ATA GAC TTT ACA GAA TTC AAG GAA GGC AAG GCA TAT GCC GAC 384Asp Gln Ile Asp Phe Thr Glu Phe Lys Glu Gly Lys Ala Tyr Ala Asp35 40 45ATA GCA GTA AGC GAT AAT GCG GAT AAA GTC GGT TTC ATT ATC CGT AAA 432Ile Ala Val Ser Asp Asn Ala Asp Lys Val Gly Phe Ile Ile Arg Lys50 55 60GGG GAT TGG GAA GAA AAG GAC TTT GAT GGG GAC AGG TCG ATT ACG ATC 480Gly Asp Trp Glu Glu Lys Asp Phe Asp Gly Asp Arg Ser Ile Thr Ile65 70 75 80AAT AAG ATC GAT AAC ATC ACC AAA GTG CAT GTA ACA AGC CAG CAG GAA 528Asn Lys Ile Asp Asn Ile Thr Lys Val His Val Thr Ser Gln Gln Glu85 90 95AAA TTC GGG CAA ATT CCT GAC GGC AGC CCA CCT GTT GTT GCG GAC GGG 576Lys Phe Gly Gln Ile Pro Asp Gly Ser Pro Pro Val Val Ala Asp Gly100 105 110AAT GCT GAC TTC TTT TTC CGT GAT AAA GAA CTG TAC GCA GCA GGA GAA 624Asn Ala Asp Phe Phe Phe Arg Asp Lys Glu Leu Tyr Ala Ala Gly Glu115 l20 125ATG GAT AAG GTT GAG AAA GTC GAA CTG TCC ATT TTA GGC GAA AAA TAC 672Met Asp Lys Val Glu Lys Val Glu Leu Ser Ile Leu Gly Glu Lys Tyr130 l35 140GAG ATG AAT GGT GAG CCG GAA AAG GAG CGT TTT ACA TAT ACA TTA AGC 720Glu Met Asn Gly Glu Pro Glu Lys Glu Arg Phe Thr Tyr Thr Leu Ser145 150 155 160GAT CTT CCT ACA GGC GAG CAT GAA TAT ACT TAT TTG GTG ACA GTG GAT 768Asp Leu Pro Thr Gly Glu His Glu Tyr Thr Tyr Leu Val Thr Val Asp165 170 175GGA CAG ACA GAG GAA GTT ACC GAT CCA TAT AAC ACG GTG GAT GGA AGG 816Gly Gln Thr Glu Glu Val Thr Asp Pro Tyr Asn Thr Val Asp Gly Arg180 185 190TCT GTT GTG GAG TAT GTG ACA TCC GAT GTG CAA GTA TCG GCT TCA TTT 864Ser Val Val Glu Tyr Val Thr Ser Asp Val Gln Val Ser Ala Ser Phe195 200 205ATA CCC GCA AAG GTT GAT TAT AAC CAG AAC GCT GTG GTG AAG GTA GAC 912Ile Pro Ala Lys Val Asp Tyr Asn Gln Asn Ala Val Val Lys Val Asp210 215 220ATC GAA TCA GAA ACG GAG ACA AAA ATC CGT GAG ATG TCT ATC AAT CTT 960Ile Glu Ser Glu Thr Glu Thr Lys Ile Arg Glu Met Ser Ile Asn Leu225 230 235 240TCA GAA ATC GGC GGC AAA GAG AAA GCA ACC ATT GAT CCT GCG CTG AAT 1008Ser Glu Ile Gly Gly Lys Glu Lys Ala Thr Ile Asp Pro Ala Leu Asn245 250 255GAA TTG ACA GTT GCG GTC AAG CAA GGT GTG ACG GCA GGT GTG AAA AAC 1056Glu Leu Thr Val Ala Val Lys Gln Gly Val Thr Ala Gly Val Lys Asn260 265 270TTG CCT ATC ACT GCG ATT GAT GAA TTC GGA AAT CGC CAT GAG GGA TCT 1104Leu Pro Ile Thr Ala Ile Asp Glu Phe Gly Asn Arg His Glu Gly Ser275 280 285GCT ACC TTA GAA GTT CAG GCG CGT ACT ATT ACA GGT GAA AAA GCA GAT 1152Ala Thr Leu Glu Val Gln Ala Arg Thr Ile Thr Gly Glu Lys Ala Asp290 295 300TTC GAC TGG GAT CAG TCT GTG GTT TAT TTT ATG CTG ACA GAT CGA TTC 1200Phe Asp Trp Asp Gln Ser Val Val Tyr Phe Met Leu Thr Asp Arg Phe305 310 315 320TTT GAT GGG GAT TCA TCG AAC AAT GAC CCT CAT GGT ATT GGC TAT GAC 1248Phe Asp Gly Asp Ser Ser Asn Asn Asp Pro His Gly Ile Gly Tyr Asp325 330 335ACA AGC AAG TCT GGT ACA TAC CAA GGC GGA GAT TTT AAG GGG ATC ACG 1296Thr Ser Lys Ser Gly Thr Tyr Gln Gly Gly Asp Phe Lys Gly Ile Thr340 345 350CAA AGG CTT GAT TAC TTG GAC GAG CTT GGA ATC AAT ACG ATC TGG ATC 1344Gln Arg Leu Asp Tyr Leu Asp Glu Leu Gly Ile Asn Thr Ile Trp Ile355 3G0 365AGT CCG GTT GTC GAT AAT ATC AAA TTT GAT GTT CGA CAC AGT GAA GGA 1392Ser Pro Val Val Asp Asn Ile Lys Phe Asp Val Arg His Ser Glu Gly370 375 380CCT GAT ACA CCA TAT TAT GCT TAC CAC GGC TAT TGG GCG GAT AAT TTC 1440Pro Asp Thr Pro Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Asp Asn Phe385 390 395 400GGG GAA TTG AAC CCG CAT TTC GGT TCC ATG GCG GAT TTC CAT GAA ATG 1488Gly Glu Leu Asn Pro His Phe Gly Ser Met Ala Asp Phe His Glu Met
405 410 415ATT GAT GCG GCA CAT GAA CGC GGC ATT AAA ATC ATG GTT GAT GTG GTG 1536Ila Asp Ala Ala His Glu Arg Gly Ile Lys Ile Met Val Asp Val Val420 425 430TTG AAT CAC ACT GGT TAT GGA TTG AAA CCA GGT GAC AGC AGC AGT GTG 1584Leu Asn His Thr Gly Tyr Gly Leu Lys Pro Gly Asp Ser Ser Ser Val435 440 445GCG AAC TTC CCG ACA GAT GAG GAC CGA GCT CGC TTT GAC GGA ATG CTT 1632Ala Asn Phe Pro Thr Asp Glu Asp Arg Ala Arg Phe Asp Gly Met Leu450 455 460CGT GAT GGC GGA TCT GGT GAA GTT CGA GGC GAG CTT GCT GGC CTT CCA 1680Arg Asp Gly Gly Ser Gly Glu Val Arg Gly Glu Leu Ala Gly Leu Pro465 470 475 480GAT TTT CTG ACG GAA AAC CCG GAT GTC CGT GAA CAG GTG GTG CAA TGG 1728Asp Phe Leu Thr Glu Asn Pro Asp Val Arg Glu Gln Val Val Gln Trp485 490 495CAG ACG GAC TGG ATC GAA AAG TCC AGG ACG GCA AAG GGC AAC ACC ATC 1776Gln Thr Asp Trp Ile Glu Lys Ser Arg Thr Ala Lys Gly Asn Thr Ile500 505 510GAT TAT TTC CGT GTC GAC ACC GTC AAG CAT GTG GAA GAC ACC ACT TGG 1824Asp Tyr Phe Arg Val Asp Thr Val Lys His Val Glu Asp Thr Thr Trp515 520 525ATG GCG TTT AAA AAT GCT TTG ACA AAA GCG ATG CCG GAA CAC AAG CTG 1872Met Ala Phe Lys Asn Ala Leu Thr Lys Ala Met Pro Glu His Lys Leu530 535 540ATT GGG GAA GCA TGG GGA GCA AAT GTC AAT GAC GAC CTA GGT TAT CTG 1920Ile Gly Glu Ala Trp Gly Ala Asn Val Asn Asp Asp Leu Gly Tyr Leu545 550 555 560AAC AGC GGA ATG ATG GAT TCT TTA CTG GAT TTT GAT TTC AAA AAT TAT 1968Asn Ser Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Asn Tyr565 570 575GCC CGT GAC TTT GCA AAC GGA CAG CTG GAT GCG GTT CAG CAA AAA CTT 2016Ala Arg Asp Phe Ala Asn Gly Gln Leu Asp Ala Val Gln Gln Lys Leu580 585 590GAG GCG CGT AAC AGC AAG TTG AAC AAT ACT GCA ACA CTT GGT CAA TTT 2064Glu Ala Arg Asn Ser Lys Leu Asn Asn Thr Ala Thr Leu Gly Gln Phe595 600 605TTA GGA AGC CAT GAC GAA GAC CGC TTC TAT GAG GTG GTG GAA GGA GAC 2112Leu Gly Ser His Asp Glu Asp Arg Phe Tyr Glu Val Val Glu Gly Asp610 615 620CTT GGC AAG TAT CAA GTT GCT GCA TCC CTT CAA CTG ACG GCA AAG GGT 2160Leu Gly Lys Tyr Gln Val Ala Ala Ser Leu Gln Leu Thr Ala Lys Gly625 630 635 640CAG CCT GTT ATC TAT TAC GGA GAA GAG CTG GGC TTG CCT GGT AAG AAC 2208Gln Pro Val Ile Tyr Tyr Gly Glu Gln Leu Gly Leu Pro Gly Lys Asn645 650 655GAT TAT CCG TAT TAT ACG AAC CGC CAG AAC ATG CCT TGG GAT GAT GTG 2256Asp Tyr Pro Tyr Tyr Thr Asn Arg Gln Asn Met Pro Trp Asp Asp Val660 665 670GAT GGT AAT GAA ATT CTA GAG CAT TAT CAA AAA TTA CTG GCA TTC CGT 2304Asp Gly Asn Glu Ile Leu Glu His Tyr Gln Lys Leu Leu Ala Phe Arg675 680 685AAT GAT AAT CCG AAC ACA TTT GCT AAA GGA GAC CGC AAA AAG GTA GCG 2352Asn Asp Asn Pro Asn Thr Phe Ala Lys Gly Asp Arg Lys Lys Val Ala690 695 700GGA TCT GAC AGT GAA GGA TAT CTT TTA TTT TCA CGG ACG TAC GGG GAA 2400Gly Ser Asp Ser Glu Gly Tyr Leu Leu Phe Ser Arg Thr Tyr Gly Glu705 710 715 720AAT TCC GTT TAT GTA GGT TTG AAT ACG GAA GCT GCT GCG AAA GAC GTA 2448Asn Ser Val Tyr Val Gly Leu Asn Thr Glu Ala Ala Ala Lys Asp Val725 730 735ACC TTG AAC TTC GGT TCT TCA GAA GCA GTG GTG ACG GAC CGC TAT TCC 2496Thr Leu Asn Phe Gly Ser Ser Glu Ala Val Val Thr Asp Arg Tyr Ser740 745 750GGT CAG GAG TAC CAA GCA AAT GAA GAA GGC CAA GTG ACG TTC TCT ATT 2544Gly Gln Glu Tyr Gln Ala Asn Glu Glu Gly Gln Val Thr Phe Ser Ile755 760 765CCG GCG ATG GAA GAC GGG GGA ACG GTC CTG CTT GAA GTG GAA AAT GGA 2592Pro Ala Met Glu Asp Gly Gly Thr Val Leu Leu Glu Val Glu Asn Gly770 775 780GCA GTG CCA CCT GTG GAG GAA GAA CCA ACT GAG CCA GGT GAA ATC GAA 2640Ala Val Pro Pro Val Glu Glu Glu Pro Thr Glu Pro Gly Glu Ile Glu785 790 795 800GAA AAC ACG CTT CGG ATT CAC TAC CAG CGC ACA GAC AAC AGC TAC GAA 2688Glu Asn Thr Leu Arg Ile His Tyr Gln Arg Thr Asp Asn Ser Tyr Glu805 810 815AAC CTT GGT CTA TGG TTA TGG GGA GAC GTC GCG GCA CCA TCT GAA AAC 2736Asn Leu Gly Leu Trp Leu Trp Gly Asp Val Ala Ala Pro Ser Glu Asn820 825 830TGG CCA TCA GGC GGC ACA CCG TTC CAA GCA GGT AAT GTA ACA GAC TAT 2784Trp Pro Ser Gly Gly Thr Pro Phe Gln Ala Gly Asn Val Thr Asp Tyr835 840 845GGT GCA TAT GTC GAT GTG GAA TTG GCA GAA GAT GCT CAA AAT ATT GGA 2832Gly Ala Tyr Val Asp Val Glu Leu Ala Glu Asp Ala Gln Asn Ile Gly850 855 860TTC CTT GTT TTG AAC ACC ACA AAC GGT GAC AAG GAC GGC GGC GAC AAA 2880Phe Leu Val Leu Asn Thr Thr Asn Gly Asp Lys Asp Gly Gly Asp Lys865 870 875 880GCA GTA GAA TTG TTC AGT CCG GAT TTA AAT GAG ATT TGG ATC AAA CAA 2928Ala Val Glu Leu Phe Ser Pro Asp Leu Asn Glu Ile Trp Ile Lys Gln885 890 895GGC TCT GAT GAA GTA TTT TTA TAT GAA CCG GTG GAC CTT CCG GCA AAT 2976Gly Ser Asp Glu Val Phe Leu Tyr Glu Pro Val Asp Leu Pro Ala Asn900 905 910ACG GTC CGC ATT CAT TAT GAA AGA ACC AAT GCC GAC TAT GAA GGC TGG 3024Thr Val Arg Ile His Tyr Glu Arg Thr Asn Ala Asp Tyr Glu Gly Trp915 920 925GGG TTA TGG AAC TGG GAG GAT GTC GAG TCC CCA TCT GAC GGG TGG CCG 3072Gly Leu Trp Asn Trp Glu Asp Val Glu Ser Pro Ser Asp Gly Trp Pro930 935 940AAC GGT GCC GCA GAT GCT GCA GGT ATC GGT AAA TAC GGT GCT TAC TAC 3120Asn Gly Ala Ala Asp Ala Ala Gly Ile Gly Lys Tyr Gly Ala Tyr Tyr945 950 955 960GAC ATC AAG CTG AAA GAA GAT GCT AAT AAA ATT GGT TTC CTT TTT GTG 3168Asp Ile Lys Leu Lys Glu Asp Ala Asn Lys Ile Gly Phe Leu Phe Val965 970 975AAC AAA CAA TCT GGT GGC CAA ACG GGA GAT ATG ACG TTT GAT ATG CTG 3216Asn Lys Gln Ser Gly Gly Gln Thr Gly Asp Met Thr Phe Asp Met Leu980 985 990AAA CAA TAC AAC CAA CTT TTT GTA AAA GAG GGC GAG GAC AAG GTC TAC 3264Lys Gln Tyr Asn Gln Leu Phe Val Lys Glu Gly Glu Asp Lys Val Tyr99510001005ACC AAT CCT TAC GGG ACC GTG CCA TTG GCG CTT GTG TCT GGA GAG GTA 2312Thr Asn Pro Tyr Gly Thr Val Pro Leu Ala Leu Val Ser Gly Glu Val101010151020TTG TCA GAC AAG TTG ATC AGT CTT ACT TTT ACC AGG ACA GAA GGA TTG 3360Leu Ser Asp Lys Leu Ile Ser Leu Thr Phe Thr Arg Thr Glu Gly Leu1025103010351040GAT TTG GAG GAA TTG AAA GAA CAG CTA GAA ATC AAG GAT GTG GAC GGG 3408Asp Leu Glu Glu Leu Lys Glu Gln Leu Glu Ile Lys Asp Val Asp Gly104510501055AAC GAT GTT TCG TTT ACA GAT GTG ACA ATT GAA GGC GAG AAA ACG GTC 3456Asn Asp Val Ser Phe Thr Asp Val Thr Ile Glu Gly Glu Lys Thr Val106010651070CAT GTC CAC GGC GAG TTT GAC TTG GAG AAA ATC CCG TTC TCT GTG ACC 3504His Val His Gly Glu Phe Asp Leu Glu Lys Ile Pro Phe Ser Val Thr107510801085TAT CTG GAC CGC ACC ATT TCT GTA AAA TCA GGC TGG AAA CTG ATC GAC 3552Tyr Leu Asp Arg Thr Ile Ser Val Lys Ser Gly Trp Lys Leu Ile Asp109010951100GAA ATG TAT GCC TAT GAT GGA AAG CTT GGG GCA GAA TTG CAT GAA GAC 3600Glu Met Tyr Ala Tyr Asp Gly Lys Leu Gly Ala Glu Leu His Glu Asp1105111011151120GGG ACG GCT ACT TTG AAA GTA TGG TCG CCA AAA GCG GAC AAT GTG TCT 3648Gly Thr Ala Thr Leu Lys Val Trp Ser Pro Lys Ala Asp Asn Val Ser112511301135GTT GTA CTT TAT GAC AAA GTT GAC CAG AAC GAG GTT GTA GAC ACC ATT 3696Val Val Leu Tyr Asp Lys Val Asp Gln Asn Glu Val Val Asp Thr Ile114011451150GAA ATG GTA AAA GGG GAC CGC GGT GTC TGG TCT GTA AAG CTA ACT AAG 3744Glu Met Val Lys Gly Asp Arg Gly Val Trp Ser Val Lys Leu Thr Lys115511601165GAT AAT ACA GGC CTT GAT AGT TTG AAA GGT TAC TAT TAC CAC TAT GAA 3792Asp Asn Thr Gly Leu Asp Ser Leu Lys Gly Tyr Tyr Tyr His Tyr Glu117011751180ATC ACG CAT GGT GAC GTA ACG AAT CTT GCT CTA GAT CCG TAT GCC AAA 3840Ile Thr His Gly Asp Val Thr Asn Leu Ala Leu Asp Pro Tyr Ala Lys1185119011951200TCA ATG GCG GCG TGG AAT AAC GAA GCG GGG GAC AAG GTA GGA AAA GCG 3888Ser Met Ala Ala Trp Asn Asn Glu Ala Gly Asp Lys Val Gly Lys Ala120512101215GCG ATC GTG GAC ATC GGC TCC ATT GGG CCT GAG CTT GAT TAT GCC GAC 3936Ala Ile Val Asp Ile Gly Ser Ile Gly Pro Glu Leu Asp Tyr Ala Asp122012251230ATC CCT GGC TTT GAA AAG CGC GAA GAC ACC ATC ATC TAC GAG GTG CAT 3984Ile Pro Gly Phe Glu Lys Arg Glu Asp Thr Ile IIe Tyr Glu Val His123512401245GTA CGT GAC TTC ACT TCC GAC CCG AAT ATC GGT GAG GAC CTG AAG GCA 4032Val Arg Asp Phe Thr Ser Asp Pro Asn Ile Gly Glu Asp Leu Lys Ala125012551260CAG TTC GGT ACA TTT GCT TCT TTC GTG GAA AAG CTG GAT TAC ATT CAA 4080Gln Phe Gly Thr Phe Ala Ser Phe Val Glu Lys Leu Asp Tyr Ile Gln1265127012751280GAG TTA GGT GTC ACT CAC ATT CAA TTG TTG CCT GTG ATG AGC TAT TAT 4128Glu Leu Gly Val Thr His Ile Gln Leu Leu Pro Val Met Ser Tyr Tyr128512901295TTC AGC AAT GAA TTT GAG TCT GGG GAG CGC ATG CTG GAG TAT GCT TCA 4176Phe Ser Asn Glu Phe Glu Ser Gly Glu Arg Met Leu Glu Tyr Ala Ser130013051310ACG GGG ACG AAT TAC AAT TGG GGC TAT GAC CCG CAC AAT TAC TTC TCC 4224Thr Gly Thr Asn Tyr Asn Trp Gly Tyr Asp Pro His Asn Tyr Phe Ser131513201325TTA TCC GGC ATG TAC TCC GAA AAC CCT GAG GAC CCG GAA CTG AGA ATC 4272Leu Ser Gly Met Tyr Ser Glu Asn Pro Glu Asp Pro Glu Leu Arg Ile
133013351340AAA GAA TTC AAG AAT CTG ATC AAC GAG ATT CAT AAG CGC GAC ATG GGT 4320Lys Glu Phe Lys Asn Leu Ile Asn Glu Ile His Lys Arg Asp Met Gly1345135013551360GTG GTA CTT GAT GTG GTG TTT AAC CAC ACC GCA CAG GTT CAC ATT TTC 4368Val Val Leu Asp Val Val Phe Asn His Thr Ala Gln Val His Ile Phe136513701375GAG GAC CTT GTA CCA AAC TAC TAT CAC TTC ATG GAT GCG GAC GGA ACC 4416Glu Asp Leu Val Pro Asn Tyr Tyr His Phe Met Asp Ala Asp Gly Thr138013851390CCA AGA ACT AGC TTT GGC GGT GGA CGT CTT GGA ACG ACA CAT GAA ATG 4464Pro Arg Thr Ser Phe Gly Gly Gly Arg Leu Gly Thr Thr His Glu Met139514001405TCC CGC CGT GTG CTC GTA GAT TCC ATC AAG CAT TGG GTG GAT GAA TAT 4512Ser Arg Arg Val Leu Val Asp Ser Ile Lys His Trp Val Asp Glu Tyr141014151420AAG GTG GAC GGA TTC CGT TTT GAC ATG ATG GGT GAC CAT GAT GCA GAG 4560Lys Val Asp Gly Phe Arg Phe Asp Met Met Gly Asp His Asp Ala Glu1425143014351440AGT ATT CAG ATT GCT TTT GAC GAA GCC AAA AAA TTG AAC CCG AAT ATC 4608Ser Ile Gln Ile Ala Phe Asp Glu Ala Lys Lys Leu Asn Pro Asn Ile144514501455GTC ATG ATC GGG GAA GGC TGG GTA ACA TTT GCT GGT GAC GAG GGC GAG 4656Val Met Ile Gly Glu Gly Trp Val Thr Phe Ala Gly Asp Glu Gly Glu146014651470CCG GTC CAG GCG GCC GAT CAA CAA TGG ATG CAA TAT ACC GAA GCA GTG 4704Pro Val Gln Ala Ala Asp Gln Gln Trp Met Gln Tyr Thr Glu Ala Val147514801485GGT AGC TTC TCG GAT GAA TTC CGC AAC GAG CTG AAA TCC GGT TTC GGA 4752Gly Ser Phe Ser Asp Glu Phe Arg Asn Glu Leu Lys Ser Gly Phe Gly149014951500AGC GAA GGA CAG CCA CGT TTC ATC ACA GGT GGC GCG GTC AAT GTG CAA 4800Ser Glu Gly Gln Pro Arg Phe Ile Thr Gly Gly Ala Val Asn Val Gln1505151015151520CAA ATT TTC GAT AAC ATC AAA GCA CAG CCT CAT AAC TTT ATG GCC GAT 4848Gln Ile Phe Asp Asn Ile Lys Ala Gln Pro His Asn Phe Met Ala Asp152515301535CAA CCA GGC GAT GTG GTC CAA TAC ATC GAG GCC CAT GAC AAC CTG ACG 4896Gln Pro Gly Asp Val Val Gln Tyr Ile Glu Ala His Asp Asn Leu Thr154015451550TTA TAC GAT GTC ATC GCA CAA TCT ATC AAA AAA GAT CCG GAA ATC GCG 4944Leu Tyr Asp Val Ile Ala Gln Ser Ile Lys Lys Asp Pro Glu Ile Ala155515601565GAA AAC GAT TTA GAG ATT CAT AAG CGT ATT CGC GTG GGT AAT GCC ATG 4992Glu Asn Asp Leu Glu Ile His Lys Arg Ile Arg Val Gly Asn Ala Met157015751580GTC TTG ACG TCT CAA GGT ACG GCA TTC TTA CAC GCA GGA CAG GAA TTT 5040Val Leu Thr Ser Gln Gly Thr Ala Phe Leu His Ala Gly Gln Glu Phe1585159015951600GGT CGT ACA AAG CAA TGG AGA GCA CCT GCA ACG GAG GCA CCG TAC AAG 5088Gly Arg Thr Lys Gln Trp Arg Ala Pro Ala Thr Glu Ala Pro Tyr Lys160516101615TCT ACG TAT ATG ACA GAT GCT GAT GGC AAT CCG TTC GTG TAT CCA TAT 5136Ser Thr Tyr Met Thr Asp Ala Asp Gly Asn Pro Phe Val Tyr Pro Tyr162016251630TTC ATC CAC GAT TCC TAT GAT TCC TCG GAT ATC ATC AAT CGT TTT GAT 5184Phe Ile His Asp Ser Tyr Asp Ser Ser Asp Ile Ile Asn Arg Phe Asp163516401645TGG GAA AAA GCG ACA GAT GCC GAG AAA TAC CCT GTC AAC AAT GTG ACA 5232Trp G1u Lys Ala Thr Asp Ala Glu Lys Tyr Pro Val Asn Asn Val Thr165016551660CGT GAC TAC ACG GCA GGC TTG ATC GAG CTG CGT CGT TCA TCT GAT GCT 5280Arg Asp Tyr Thr Ala Gly Leu Ile Glu Leu Arg Arg Ser Ser Asp Ala1665167016751680TTC CGT TTA GGT TCT CGT GAA TTG GTC GAT TCC AAT GTG ACA ATG GTT 5328Phe Arg Leu Gly Ser Arg Glu Leu Val Asp Ser Asn Val Thr Met Val168516901695GAT GCC CCG GAA ATC AAG GAG CAG GAT CTC GTT GTT GCC TAC CGC AGT 5376Asp Ala Pro Glu Ile Lys Glu Gln Asp Leu Val Val Ala Tyr Arg Ser170017051710GTT TCG ACT GCC GGT GTG GAG TAT TAC ACA TTC GTG AAT GCG GAC ACT 5424Val Ser Thr Ala Gly Val Glu Tyr Tyr Thr Phe Val Asn Ala Asp Thr171517201725TCC AGT AGA ACA TTG ACC TTA GGG CAG GAT TTG ACA GAG GGC GTA GTG 5472Ser Ser Arg Thr Leu Thr Leu Gly Gln Asp Leu Thr Glu Gly Val Val173017351740GTG GTC GAT GCA GAA GAG GCT AAT GTA GCC GGT GTA GCT GAG CCT GCT 5520Val Val Asp Ala Glu Glu Ala Asn Val Ala Gly Val Ala Glu Pro Ala1745175017551760GGT TTC GAA TTG ACG GCA GAA GGC ATC ACA CTT GAG CCA TTG ACT ACG 5568Gly Phe Glu Leu Thr Ala Glu Gly Ile Thr Leu Glu Pro Leu Thr Thr176517701775GTT GTC GTC CGT GTA GGC GAG CAG GAA GGG ACA GAC CCG GGT GAT GGG 5616Val Val Val Arg Val Gly Glu Gln Glu Gly Thr Asp Pro Gly Asp Gly178017851790GAC GGC GAT GGC AAT ACG CCG CCA CCA GGC GAC GGC GAT GGC GAT GGA 5664Asp Gly Asp Gly Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly
179518001805AAC ACG CCA CCA CCA GGG GAT GGG GAT GGC GAT GGA AAC ACG CCT CCT 5712Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro181018151820CCA GGC AAC GGT AAT GGC AAT AAT CCA GGA ACA CCA CCA GGA AAG GGT 5760Pro Gly Asn Gly Asn Gly Asn Asn Pro Gly Thr Pro Pro Gly Lys Gly1825183018351840GGA GAA AAC CCT GGT AAA GGC AAA AAC GAC AAA ACA CCG CCT GGC AAA 5808Gly Glu Asn Pro Gly Lys Gly Lys Asn Asp Lys Thr Pro Pro Gly Lys184518501855GGT GGG GAC AAT CCA GGT AAG GGG AAC AAG CTA CCA CTT ACC GCA ACC 5856Gly Gly Asp Asn Pro Gly Lys Gly Asn Lys Leu Pro Leu Thr Ala Thr186018651870GGA ACA CTT AAT TAC ATC CTG TTT GGT GCA ATA ATG TTG GTT CTT GGG 5904Gly Thr Leu Asn Tyr Ile Leu Phe Gly Ala Ile Met Leu Val Leu Gly1875l8801885ACG CTG CTG TAT CTA GGG GTC AGA AGA AAA GCA GGA TTG AAA GAA AAA 5952Thr Leu Leu Tyr Leu Gly Val Arg Arg Lys Ala Gly Leu Lys Glu Lys189018951900ACC TTA TAA AAACAACGGA AAAGTGTGGC AGGGGAATAT CCCGCCACAC 6001Thr Leu1905TTTTTCGTTA TTATAAGGCA TTATTTGCTT GTAGATTAAG GATTCGCTAT 6051AGGTTATTTT GTGTAACGTA CATTACTTTT CCGTTGGGCC ATATTTATTT 6101TCCATACCGC TCATTTTTCT TTTCCATTGG GACCACATTT A 61423號序列的信息(i)序列特征(A)長度801個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(xi)序列描述3號序列Met Lys Lys Arg Phe Gln Arg Gly Met Ala Gly Leu Leu Ser Ile Leu-30 -25 -20Leu lle Val Ser Met Phe Ala Gly Tyr Leu Pro Ala Arg Ala Ala Ala-15 -10 -5Glu Thr Gly Asp Lys Arg Ile Glu Phe Ser Tyr Glu Arg Pro Asp Gly1 5 l0 15Asn Tyr Glu Gly Trp Asn Leu Trp Val Trp Gly Thr Gly Val Lys Asp20 25 30Asp Gln Ile Asp Phe Thr Glu Phe Lys Glu Gly Lys Ala Tyr Ala Asp35 40 45Ile Ala Val Ser Asp Asn Ala Asp Lys Val Gly Phe Ile Ile Arg Lys50 55 60Gly Asp Trp Glu Glu Lys Asp Phe Asp Gly Asp Arg Ser Ile Thr Ile65 70 75 80Asn Lys Ile Asp Asn lle Thr Lys Val His Val Thr Ser Gln Gln Glu85 90 95Lys Phe Gly Gln Ile Pro Asp Gly Ser Pro Pro Val Val Ala Asp Gly100 105 110Asn Ala Asp Phe Phe Phe Arg Asp Lys Glu Leu Tyr Ala Ala Gly Glu115 l20 125Met Asp Lys Val Glu Lys Val Glu Leu Ser lle Leu Gly Glu Lys Tyr130 l35 140Glu Met Asn Gly Glu Pro Glu Lys Glu Arg Phe Thr Tyr Thr Leu Ser145 150 155 160Asp Leu Pro Thr Gly Glu His Glu Tyr Thr Tyr Leu Val Thr Val Asp165 170 175Gly Gln Thr Glu Glu Val Thr Asp Pro Tyr Asn Thr Val Asp Gly Arg180 185 190Ser Val Val Glu Tyr Val Thr Ser Asp Val Gln Val Ser Ala Ser Phe195 200 205Ile Pro Ala Lys Val Asp Tyr Asn Gln Asn Ala Val Val Lys Val Asp210 215 220Ile Glu Ser Glu Thr Glu Thr Lys Ile Arg Glu Met Ser Ile Asn Leu225 230 235 240Ser Glu Ile Gly Gly Lys Glu Lys Ala Thr Ile Asp Pro Ala Leu Asn245 250 255Glu Leu Thr Val Ala Val Lys Gln Gly Val Thr Ala Gly Val Lys Asn260 265 270Leu Pro Ile Thr Ala Ile Asp Glu Phe Gly Asn Arg His Glu Gly Ser275 280 285Ala Thr Leu Glu Val Gln Ala Arg Thr Ile Thr Gly Glu Lys Ala Asp290 295 300Phe Asp Trp Asp Gln Ser Val Val Tyr Phe Met Leu Thr Asp Arg Phe30 5310 315 320Phe Asp Gly Asp Ser Ser Asn Asn Asp Pro His Gly Ile Gly Tyr Asp325 330 335Thr Ser Lys Ser Gly Thr Tyr Gln Gly Gly Asp Phe Lys Gly Ile Thr340 345 350Gln Arg Leu Asp Tyr Leu Asp Glu Leu Gly Ile Asn Thr Ile Trp Ile355 360 365Ser Pro Val Val Asp Asn Ile Lys Phe Asp Val Arg His Ser Glu Gly370 375 380Pro Asp Thr Pro Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Asp Asn Phe385 390 395 400Gly Glu Leu Asn Pro His Phe Gly Ser Met Ala Asp Phe His Glu Met
405 410 415Ile Asp Ala Ala His Glu Arg Gly Ile Lys Ile Met Val Asp Val Val420 425 430Leu Asn His Thr Gly Tyr Gly Leu Lys Pro Gly Asp Ser Ser Ser Val435 440 445Ala Asn Phe Pro Thr Asp Glu Asp Arg Ala Arg Phe Asp Gly Met Leu450 455 460Arg Asp Gly Gly Ser Gly Glu Val Arg Gly Glu Leu Ala Gly Leu Pro465 470 475 480Asp Phe Leu Thr Glu Asn Pro Asp Val Arg Glu Gln Val Val Gln Trp485 490 495Gln Thr Asp Trp Ile Glu Lys Ser Arg Thr Ala Lys Gly Asn Thr Ile500 505 510Asp Tyr Phe Arg Val Asp Thr Val Lys His Val Glu Asp Thr Thr Trp515 520 525Met Ala Phe Lys Asn Ala Leu Thr Lys Ala Met Pro Glu His Lys Leu530 535 540Ile Gly Glu Ala Trp Gly Ala Asn Val Asn Asp Asp Leu Gly Tyr Leu545 550 555 560Asn Ser Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Asn Tyr565 570 575Ala Arg Asp Phe Ala Asn Gly Gln Leu Asp Ala Val Gln Gln Lys Leu580 585 590Glu Ala Arg Asn Ser Lys Leu Asn Asn Thr Ala Thr Leu Gly Gln Phe595 600 605Leu Gly Ser His Asp Glu Asp Arg Phe Tyr Glu Val Val Glu Gly Asp610 615620Leu Gly Lys Tyr Gln Val Ala Ala Ser Leu Gln Leu Thr Ala Lys Gly625 630635640Gln Pro Val Ile Tyr Tyr Gly Glu Glu Leu Gly Leu Pro Gly Lys Asn645 650 655Asp Tyr Pro Tyr Tyr Thr Asn Arg Gln Asn Met Pro Trp Asp Asp Val660 665 670Asp Gly Asn Glu Ile Leu Glu His Tyr Gln Lys Leu Leu Ala Phe Arg675 680 685Asn Asp Asn Pro Asn Thr Phe Ala Lys Gly Asp Arg Lys Lys Val Ala690 695 700Gly Ser Asp Ser Glu Gly Tyr Leu Leu Phe Ser Arg Thr Tyr Gly Glu705 710 715 720Asn Ser Val Tyr Val Gly Leu Asn Thr Glu Ala Ala Ala Lys Asp Val725 730 735Thr Leu Asn Phe Gly Ser Ser Glu Ala Val Val Thr Asp Arg Tyr Ser740 745 750Gly Gln Glu Tyr Gln Ala Asn Glu Glu Gly Gln Val Thr Phe Ser Ile755 760 765Pro Ala Met Glu Asp Gly Gly Thr Val Leu Leu Glu Val Glu Asn Gly770 775 780Ala Val Pro Pro Val Glu Glu Glu Pro Thr Glu Pro Gly Glu Ile Glu785 790 795 800Glu4號序列的信息(i)序列特征(A)長度893個堿基對(B)類型核酸(D)拓?fù)浣Y(jié)構(gòu)線性(i i)分子類型肽(xi)序列描述4號序列Thr Val Pro Leu Ala Leu Val Ser Gly Glu Val Leu Ser Asp Lys Leu1 5 10 15Ile Ser Leu Thr Phe Thr Arg Thr Glu Gly Leu Asp Leu Glu Glu Leu20 25 30Lys Glu Gln Leu Glu Ile Lys Asp Val Asp Gly Asn Asp Val Ser Phe35 40 45Thr Asp Val Thr Ile Glu Gly Glu Lys Thr Val His Val His Gly Glu50 55 60Phe Asp Leu Glu Lys Ile Pro Phe Ser ValThr Tyr Leu Asp Arg Thr65 70 75 80Ile Ser Val Lys Ser Gly Trp Lys Leu Ile Asp Glu Met Tyr Ala Tyr85 90 95Asp Gly Lys Leu Gly Ala Glu Leu His Glu Asp Gly Thr Ala Thr Leu100 105 110Lys Val Trp Ser Pro Lys Ala Asp Asn Val Ser Val Val Leu Tyr Asp115 120 125Lys Val Asp Gln Asn Glu Val Val Asp Thr Ile Glu Met Val Lys Gly130 135 140Asp Arg Gly Val Trp Ser Val Lys Leu Thr Lys Asp Asn Thr Gly Leu145150155160Asp Ser Leu Lys Gly Tyr Tyr Tyr His Tyr Glu Ile Thr His Gly Asp165 170 175Val Thr Asn Leu Ala Leu Asp Pro Tyr Ala Lys Ser Met Ala Ala Trp180 185 190Asn Asn Glu Ala Gly Asp Lys Val Gly Lys Ala Ala Ile Val Asp Ile195 200 205Gly Ser IIe Gly Pro Glu Leu Asp Tyr Ala Asp Ile Pro Gly Phe Glu210 215 220Lys Arg Glu Asp Thr Ile Ile Tyr Glu Val His Val Arg Asp Phe Thr225 230 235 240Ser Asp Pro Asn Ile Gly Glu Asp Leu Lys Ala Gln Phe Gly Thr Phe245 250 255Ala Ser Phe Val Glu Lys Leu Asp Tyr Ile Gln Glu Leu Gly Val Thr260 265 270His Ile Gln Leu Leu Pro Val Met Ser Tyr Tyr Phe Ser Asn Glu Phe275 280 285Glu Ser G1y Glu Arg Met Leu Glu Tyr Ala Ser Thr Gly Thr Asn Tyr290 295 300Asn Trp Gly Tyr Asp Pro His Asn Tyr Phe Ser Leu Ser Gly Met Tyr305 310 315 320Ser Glu Asn Pro Glu Asp Pro Glu Leu Arg Ile Lys Glu Phe Lys Asn325 330 335Leu Ile Ash Glu Ile His Lys Arg Asp Met Gly Val Val Leu Asp Val340 345 350Val Phe Asn His Thr Ala Gln Val His Ile Phe Glu Asp Leu Val Pro355 360 365Asn Tyr Tyr His Phe Met Asp Ala Asp Gly Thr Pro Arg Thr Ser Phe370 375 380Gly Gly Gly Arg Leu Gly Thr Thr His Glu Met Ser Arg Arg Val Leu385 390 395 400Val Asp Ser Ile Lys His Trp Val Asp Glu Tyr Lys Val Asp Gly Phe405 410 415Arg Phe Asp Met Met Gly Asp His Asp Ala Glu Ser Ile Gln Ile Ala420 425 430Phe Asp Glu Ala Lys Lys Leu Asn Pro Asn Ile Val Met Ile Gly Glu435 440 445Gly Trp Val Thr Phe Ala Gly Asp Glu Gly Glu Pro Val Gln Ala Ala450 455 460Asp Gln Gln Trp Met Gln Tyr Thr Glu Ala Val Gly Ser Phe 5er Asp465 470 475 480Glu Phe Arg Asn Glu Leu Lys Ser Gly Phe Gly Ser Glu Gly Gln Pro485 490 495Arg Phe Ile Thr Gly Gly Ala Val Asn Val Gln Gln Ile Phe Asp Asn500 505 510Ile Lys Ala Gln Pro His Asn Phe Met Ala Asp Gln Pro Gly Asp Val515 520 525Val Gln Tyr Ile Glu Ala His Asp Asn Leu Thr Leu Tyr Asp Val Ile530 535 540Ala Gln Ser Ile Lys Lys Asp Pro Glu Ile Ala Glu Asn Asp Leu Glu545 550 555 560Ile His Lys Arg Ile Arg Val Gly Asn Ala Met Val Leu Thr Ser Gln565 570 575Gly Thr Ala Phe Leu His Ala Gly Gln Glu Phe Gly Arg Thr Lys Gln580 585 590Trp Arg Ala Pro Ala Thr Glu Ala Pro Tyr Lys Ser Thr Tyr Met Thr595 600 605Asp Ala Asp Gly Asn Pro Phe Val Tyr Pro Tyr Phe Ile His Asp Ser610 615 620Tyr Asp Ser Ser Asp Ile Ile Asn Arg Phe Asp Trp Glu Lys Ala Thr625 630 635 640Asp Ala Glu Lys Tyr Pro Val Asn Asn Val Thr Arg Asp Tyr Thr Ala645 650 655Gly Leu Ile Glu Leu Arg Arg Ser Ser Asp Ala Phe Arg Leu Gly Ser660 665 670Arg Glu Leu Val Asp Ser Asn Val Thr Met Val Asp Ala Pro Glu Ile675 680 685Lys Glu Gln Asp Leu Val Val Ala Tyr Arg Ser Val Ser Thr Ala Gly
690 695 700Val Glu Tyr Tyr Thr Phe Val Asn Ala Asp Thr Ser Ser Arg Thr Leu705 710 715 720Thr Leu Gly Gln Asp Leu Thr Glu Gly Val Val Val Val Asp Ala Glu725 730 735Glu Ala Asn Val Ala Gly Val Ala Glu Pro Ala Gly Phe Glu Leu Thr740 745 750Ala Glu Gly Ile Thr Leu Glu Pro Leu Thr Thr Val Val Val Arg Val755 760 765Gly Glu Gln Glu Gly Thr Asp Pro Gly Asp Gly Asp Gly Asp Gly Asn770 775 780Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro Pro785 790 795 800Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro Pro Gly Asn Gly Asn805 810 815Gly Asn Asn Pro Gly Thr Pro Pro Gly Lys Gly Gly Glu Asn Pro Gly820 825 830Lys Gly Lys Asn Asp Lys Thr Pro Pro Gly Lys Gly Gly Asp Asn Pro835 840 845Gly Lys Gly Asn Lys Leu Pro Leu Thr Ala Thr Gly Thr Leu Asn Tyr850 855 860Ile Leu Phe Gly Ala Ile Met Leu Val Leu Gly Thr Leu Leu Tyr Leu865 870 875 880Gly Val Arg Arg Lys Ala Gly Leu Lys Glu Lys Thr Leu885 890
權(quán)利要求
1.一種DNA片段,該片段編碼一種顯示出堿性支鏈淀粉酶和堿性α-淀粉酶活性的堿性淀粉支鏈淀粉酶。
2.如權(quán)利要求1所限定的DNA片段、該片段編碼1號序列的氨基酸序列。
3.一種DNA片段,該片段編碼顯示出堿性α-淀粉酶活性和堿性支鏈淀粉酶活性并具有修飾過的1號序列所描述的氨基酸序列的蛋白質(zhì),其中所述修飾是以取代、添加、缺失、反向、或者插入一個或多個氨基酸的方式進(jìn)行的。
4.堿性α-淀粉酶,該淀粉酶具有3號序列所描述的氨基酸序列。
5.一種DNA片段,該片段編碼具有3號序列所描述的氨基酸序列的堿性α-淀粉酶。
6.一種DNA片段,該片段編碼顯示出堿性α-淀粉酶活性的并具有修飾過的3號序列所描述的氨基酸序列的蛋白質(zhì),其中所述的修飾該是以取代、添加、缺失、反向、或者插入一個或多個氨基酸的方式進(jìn)行的。
7.一種堿性支鏈淀粉酶,該淀粉酶具有4號序列所描述的氨基酸序列。
8.一種DNA片段,該片段編碼具有4號序列所描述的氨基酸序列的堿性支鏈淀粉酶。
9.一種DNA片段,該片段編碼顯示出堿性支鏈淀粉酶活性的蛋白質(zhì)并且具有修飾過的4號序列所描述的氨基酸序列的蛋白質(zhì),其中所述的修飾該是以取代、添加、缺失、反向、或者插入一個或多個氨基酸的方式進(jìn)行的。
10.一種如權(quán)利要求1、2、3、5、6、8、9或10之任一所限定的DNA片段,該片段還包含能夠調(diào)節(jié)基因表達(dá)的核苷酸序列。
11.一種重組DNA,該DNA包含如權(quán)利要求1、2、3、5、6、8、9或10之任一所描述的DNA片段。
12.一種轉(zhuǎn)化過的微生物,該微生物包含權(quán)利要求11的重組DNA。
13.一種用于產(chǎn)生堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或者堿性支鏈淀粉酶的方法,該方法包括培養(yǎng)權(quán)利要求12的轉(zhuǎn)化過的微生物和分離由該微生物產(chǎn)生的堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或堿性支鏈淀粉酶。
14.一種DNA片段,該片段與互補(bǔ)于2號序列的DNA序列雜交。
15.一種蛋白質(zhì),該蛋白質(zhì)由權(quán)利要求14的DNA片段編碼。
16.一種DNA片段,該片段與互補(bǔ)于2號序列的cDNA序列雜交,其中所說的片段編碼具有堿性支鏈淀粉酶活性和/或者堿性α-淀粉酶活性的蛋白質(zhì)。
17.一種蛋白質(zhì),該蛋白質(zhì)由權(quán)利要求16的DNA片段編碼。
全文摘要
本發(fā)明提供了一種編碼顯示出堿性α-淀粉酶活性的堿性支鏈淀粉酶的DNA片段、具有3號序列所描述的氨基酸序列和編碼該淀粉酶的DNA片段的堿性α-淀粉酶、具有4號序列所描述的氨基酸序列和編碼該支鏈淀粉酶的DNA片段的堿性支鏈淀粉酶、包含所述DNA片段的重組DNA以及包含該重組DNA的轉(zhuǎn)化過的微生物。本發(fā)明的技術(shù)使得可以大量生產(chǎn)顯示出堿性α-淀粉酶活性的堿性支鏈淀粉酶。
文檔編號C12N9/24GK1183808SQ96193821
公開日1998年6月3日 申請日期1996年5月10日 優(yōu)先權(quán)日1995年5月10日
發(fā)明者秦田勇二, 五十嵐一曉, 尾崎克也, 荒勝俊, 川合修次, 伊藤進(jìn) 申請人:花王株式會社