專利名稱:堿性蛋白酶及其產(chǎn)生方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分離的核酸構(gòu)建體以及包含這些構(gòu)建體的重組載體和宿主細胞,所說構(gòu)建體包含得自Bacillus sp.Group I菌株的編碼新堿性蛋白酶的核酸序列。本發(fā)明還涉及獲得所述蛋白酶的方法。本發(fā)明也涉及源于所說的堿性蛋白酶的啟動子和信號序列以及利用所述啟動子與信號序列在細菌中表達編碼異源蛋白質(zhì)的異源核酸序列的方法。
2.發(fā)明背景去垢劑酶在市場銷售已超過20年,現(xiàn)在全世界在粉劑和液態(tài)去垢劑中它完全確立為通常的去垢劑成分。隨著向更低洗滌溫度的趨勢,近年去垢劑酶的消費增加。用于洗滌制劑的酶包括蛋白酶、脂酶、淀粉酶、纖維素酶以及其它酶或其混合物。在商業(yè)中最重要的是蛋白酶。
通過分離實際上發(fā)現(xiàn)的蛋白酶、然后在去垢劑制劑中試驗開發(fā)去垢劑蛋白酶。大多數(shù)去垢劑蛋白酶從芽孢桿菌屬的成員中獲得。目前,新類型的蛋白酶進入市場,提供了在各種特定的條件下產(chǎn)生更好的成本/性能比的可能性。
商業(yè)性蛋白酶產(chǎn)物的例子有ALCALASETM、ESPERASETM和SAVINASETM,全部由丹麥Novo Nordisk A/S供給。其它商業(yè)來源的這些和類似的酶產(chǎn)物在去垢劑溶液中(即在pH值范圍8至11并在螯合劑、表面活性劑和漂白劑(如硼酸鈉)存在時)是活性的。ALCALASETM蛋白酶由物種地衣芽孢桿菌的菌株產(chǎn)生。ESPERASETM和SAVINASETM蛋白酶通過培養(yǎng)嗜堿的芽孢桿菌屬的菌株獲得。
提供具有獨特的底物范圍、pH和/或最佳溫度的新堿性蛋白酶是有利的。以高產(chǎn)量分離新蛋白酶或產(chǎn)生蛋白酶以便蛋白酶可在體外利用也是有利的。為了確定,例如,保守和非保守區(qū)以及活性位點而確定改進酶性能誘變的適當(dāng)位點并能夠利用重組DNA技術(shù)產(chǎn)生蛋白酶,確定這些蛋白酶的氨基酸和/或核酸序列是有利的。
通過確定全部蛋白酶基因的核酸序列,可以確定啟動子和信號序列的位置。這樣的序列可用于異源多肽的表達。
3.發(fā)明概述本發(fā)明涉及一種核酸構(gòu)建體,該核酸構(gòu)建體包含編碼蛋白酶的核酸序列,所說蛋白酶具有通過SDS-PAGE測定的大約34kD的表觀分子量、大約9.3的pI、在大約25℃下最佳pH范圍約為9-11(酪蛋白為底物)、在大約pH9.5時最佳溫度范圍為40-55℃(酪蛋白為底物)并可以從第1組中的Bacillus sp.的菌株獲得。第1組中的Bacillus sp.與枯草芽孢桿菌(B.subtilis)和堅強芽孢桿菌(B.firmus)最類似。在特定的實施方案中,本發(fā)明的蛋白酶可得自或源自PD498菌株或另一種攜帶編碼蛋白酶基因的宿主有機體,該蛋白酶具有和源自Bacillus sp.PD498的蛋白酶的免疫化學(xué)性質(zhì)實質(zhì)上相同或部分相同的免疫化學(xué)性質(zhì)。
在一個實施方案中,核酸構(gòu)建體包含編碼具有在SEQ ID NO1,SEQ IDNO2或SEQ ID NO3中所描述的氨基酸序列的蛋白酶的核酸序列,SEQID NO1顯示了前原(prepro)形式的PD498堿性蛋白酶序列,SEQ ID NO2顯示了原體(pro)形式的堿性蛋白酶,SEQ ID NO3顯示了成熟形式的PD498堿性蛋白酶。在另一個實施方案中,核酸構(gòu)建體包含在SEQ ID NO4,SEQID NO5,SEQ ID NO6或SEQ ID NO7中所描述的核酸序列,SEQ ID NO4顯示了PD498堿性蛋白酶基因的全部核酸序列,該序列包含編碼區(qū)以及5′和3′側(cè)翼區(qū),SEQ ID NO5顯示了編碼前原形式的PD498堿性蛋白酶的核酸序列,SEQ ID NO6顯示了編碼原體形式的PD498基因的核酸序列,SEQID NO7顯示了編碼成熟形式的PD498堿性蛋白酶的DNA序列。
為了促進新蛋白酶的產(chǎn)生,本發(fā)明也提供了載體和包含所要求的核酸構(gòu)建體的重組宿主細胞,該載體、構(gòu)建體和重組宿主細胞可以用于蛋白酶的重組產(chǎn)生。本發(fā)明的蛋白酶的重組產(chǎn)生可以通過在適合蛋白酶表達的條件下培養(yǎng)用本發(fā)明的核酸構(gòu)建體或載體轉(zhuǎn)化或轉(zhuǎn)染的宿主細胞或其后代并從培養(yǎng)物回收蛋白酶達到。
本發(fā)明也涉及源自具有和所說的序列(其中所說的啟動子具有在SEQ IDNO8中顯示的序列)基本上相同的啟動子活性的編碼所說的新蛋白酶或其片段的基因的啟動子序列。該啟動子可以用于構(gòu)建包含所說的啟動子序列和用于把異源DNA序列插入所說的載體的位點的載體。術(shù)語異源有意于包括實質(zhì)上不由宿主細胞表達的DNA序列。進而,該啟動子可以用于產(chǎn)生異源蛋白質(zhì)的方法,該方法包括(a)用所說的載體轉(zhuǎn)化細菌細胞,優(yōu)選地是革蘭氏陽性細菌;(b)培養(yǎng)步驟(a)轉(zhuǎn)化的細胞;(c)從步驟(b)的轉(zhuǎn)化細胞回收所說的異源多肽。
本發(fā)明也涉及源自具有和所說的序列(其中所說的信號序列具有在SEQID NO9中顯示的氨基酸序列)基本上相同的信號活性的編碼所說的新蛋白酶或其片段的基因的信號序列。該信號序列可以由在SEQ ID NO10中所顯示的DNA序列編碼。信號序列可以用于載體的構(gòu)建,該載體包含(a)所說的信號序列;(b)在所說的信號序列上游的啟動子序列和核糖體結(jié)合位點序列,所說的信號序列的轉(zhuǎn)錄在所說的啟動子序列控制下;(c)在所說的信號序列下游的把異源DNA序列插入所說的載體中的位點,所說的位點和所說的信號序列在相同的讀框中。而且,該信號序列可以用于產(chǎn)生異源蛋白質(zhì)的方法,該方法包括(a)用所說的載體轉(zhuǎn)化細菌細胞,優(yōu)選地是革蘭氏陽性細菌;(b)培養(yǎng)步驟(a)轉(zhuǎn)化的細胞;(c)從步驟(b)的轉(zhuǎn)化細胞回收所說的異源多肽。
蛋白酶可以用于洗滌方法,因此可以制成去垢劑添加物和/或組合物。
4.附圖簡要描述本發(fā)明可以通過參考所附的附圖進一步說明,其中
圖1顯示了用2%酪蛋白為底物、在pH9.5時測定的溫度和PD498堿性蛋白酶的解蛋白活性之間的關(guān)系;緩沖液,緩沖液+0.1%STPP(三縮聚磷酸鈉)。
圖2顯示了用1%酪蛋白為底物、在25℃下測定的pH和PD498堿性蛋白酶的解蛋白活性之間的關(guān)系。
圖3A、3B和3C顯示了PD498蛋白酶的全部氨基酸和核苷酸序列以及有關(guān)的上游和下游核苷酸序列。
圖4顯示了PD498蛋白酶的結(jié)構(gòu)。
圖5顯示了啟動子融合物的構(gòu)建。
圖6顯示了質(zhì)粒p118-498proml的圖。
圖7顯示了pHP13amp的圖。
圖8顯示了pLip3的圖。
圖9顯示了p498-8的構(gòu)建。
圖10顯示了pMHan37的圖。
圖11顯示了PD498-脂酶(lipolase)融合物的圖。
5.發(fā)明詳述5.1.蛋白酶的分離5.1.1.微生物從土壤樣品分離能夠產(chǎn)生所說的堿性蛋白酶的微生物。
微生物是屬于芽孢桿菌屬第1組的好氧性的、形成孢子的細菌。在一個優(yōu)選的實施方案中,在形態(tài)學(xué)上它可以描述為直徑為0.7-0.9微米、長2-3微米的可運動的棒狀。孢子為圓形至橢圓形,孢子囊近末端至末端稍膨脹。生長的最佳溫度在25-37℃之內(nèi),生長的最佳pH在7-9之內(nèi)。在pH9.7時不生長,在50℃下也不生長。在營養(yǎng)瓊脂斜面培養(yǎng)基上,微生物形成黃色菌落,圓形,光滑,沒有觀察到色素擴散進瓊脂。在特定的實施方案中,微生物是Bacillus sp.PD498,其按照布達佩斯條約在NCIMB保藏,保藏號為40484。
5.1.2.微生物的培養(yǎng)于好氧條件下在包含可同化的碳和氮以及其它必須的營養(yǎng)物的營養(yǎng)培養(yǎng)基中培養(yǎng)產(chǎn)生所說的堿性蛋白酶的微生物,培養(yǎng)基按照本領(lǐng)域已知的原則組成。
適合的碳源是碳水化合物(如蔗糖、葡萄糖和淀粉)或包含碳水化合物的物質(zhì)(如谷粒、麥芽、稻和高梁)。摻入培養(yǎng)基的碳水化合物濃度可以在很大的范圍內(nèi)變化,例如,可高至大約25%,低至大約1-5%,但通常大約8-10%是適合的,百分比作為葡萄糖的等價物計算。
在營養(yǎng)培養(yǎng)基中的氮源可以屬于無機和/或有機性質(zhì)。適合的無機氮源是硝酸鹽和銨鹽。在有機氮源中,相當(dāng)數(shù)量固定地用于包括細菌培養(yǎng)的發(fā)酵過程。說明性的例子是大豆粉、棉籽粉、花生粉、酪蛋白、玉米、玉米浸液、酵母提取物、尿素和白蛋白。此外,營養(yǎng)培養(yǎng)基也應(yīng)包含通常的痕量物質(zhì)。
微生物是芽孢桿菌屬物種的菌株。芽孢桿菌屬物種是微嗜堿性的。因此,培養(yǎng)優(yōu)選地在微堿性的pH值下進行,這可以通過在生長培養(yǎng)基滅菌后添加適合的緩沖液(如碳酸氫鈉)獲得大約pH9.0。大容量發(fā)酵罐培養(yǎng)必須利用人工通氣。通氣速率類似于用于常規(guī)大容器發(fā)酵的通氣速率。
在發(fā)酵后,可以通過從肉湯中除去粗制物產(chǎn)生液態(tài)蛋白酶濃縮物,如果需要,肉湯的濃縮可通過在低溫下蒸發(fā)或超濾進行。最后,可以把防腐劑添加到濃縮物中。
可以通過用鹽(如Na2SO4)或水-可溶混的溶劑(如乙醇或丙酮)沉淀從純化的和/或濃縮的肉湯制備固體蛋白酶制劑。也可以使用適當(dāng)?shù)母稍锓椒?如噴霧干燥)除去肉湯中的水。
5.1.3.解蛋白活性的測定可以用酪蛋白為底物測定解蛋白的活性。一個酪蛋白蛋白酶單位(CPU)定義為在標準條件下(即在25℃、pH大約9.5時培養(yǎng)大約30分鐘)每分鐘釋放大約1μM的一級氨基基團(通過與絲氨酸標準相比較測定)的蛋白酶的量。
也可以通過測定由所說的蛋白酶特異性水解琥珀酰-Ala-Ala-Pro-Leu-對硝基酰苯胺來測定解蛋白活性。首先把底物溶解在,例如,DMSO中,然后在大約0.035M的硼酸鹽緩沖液(pH大約9.45)中稀釋大約50倍。通過相同的硼酸鹽緩沖液把所有蛋白酶樣品稀釋大約5-10倍。在ELISA讀數(shù)平板的孔中混合相等體積的底物溶液與樣品并于25℃下在大約405nm下讀數(shù)。使所有樣品活性和濃度分別標準化為標準的蛋白酶溶液活性和濃度。
5.2.蛋白酶所說的蛋白酶可通過下列特征描述。
5.2.1.理化性質(zhì)當(dāng)通過SDS-PAGE測定時,本發(fā)明的蛋白酶具有大約34kD的表觀分子量。通過在LKB AmpholinePAG平板上的等電點聚焦測定到大約9.3的pI。通過PMSF(絲氨酸蛋白酶抑制劑)抑制蛋白酶活性。EDTA和大豆蛋白酶抑制劑不影響蛋白酶活性。
溫-活性關(guān)系在圖1中顯示?;钚栽?.1%三縮聚磷酸鈉(STPP,許多商業(yè)去垢劑中的普通成分)存在(白方框)和不存在(黑方框)時于pH大約9.5下用2%酪蛋白為底物測定。使用以前描述的解蛋白活性測定(其改變?yōu)闇赜郎囟仍趶拇蠹s15℃至大約70℃的間隔變化)。從圖中看出從大約15℃至大約70℃蛋白酶具有解蛋白活性,并具有大約40-55℃范圍的最佳溫度。
通過相同的方法使用調(diào)整到預(yù)定的pH值(pH范圍約為6至11)的緩沖液測定活性對pH值的依賴。結(jié)果在圖2中顯示。從圖中看出在非常寬的pH范圍(從低于pH 6至高于pH11,表觀最佳pH在大約9-11的范圍內(nèi))中蛋白酶具有解蛋白活性。
而且,人們發(fā)現(xiàn)當(dāng)在歐洲型和美國型的去垢劑中測定時,本發(fā)明的蛋白酶在洗滌條件下于大約25℃時可穩(wěn)定大約60分鐘。
5.2.2.免疫化學(xué)性質(zhì)所說的蛋白酶具有和源自菌株Bacillus sp.PD498,NCIMB40484號的蛋白酶的免疫化學(xué)性質(zhì)基本上相同的或至少部分相同的免疫化學(xué)性質(zhì)。
通過免疫學(xué)的交叉反應(yīng)鑒定試驗測定免疫化學(xué)性質(zhì)。鑒定試驗可通過眾所周知的Ouchterlony雙免疫擴散方法或按照N.H.Axelsen(凝膠免疫沉淀技術(shù)手冊;Blackwell科學(xué)出版社(1983),第5和第14章)的串聯(lián)交叉免疫電泳進行。術(shù)語“抗原等同性”和“部分抗原等同性”在同一書的第5、19和20章中描述。
按照以上提及的方法通過用本發(fā)明的純化的蛋白酶免疫兔產(chǎn)生單特異性抗血清。把免疫原與弗氏佐劑混合并每兩周皮下注射進兔中。在共8周的免疫時期后獲得抗血清,如N.H.Axelsen(同上)所述從其中制備免疫球蛋白。
Ouchterlony雙免疫擴散試驗顯示在本發(fā)明的蛋白酶和已知的得自芽孢桿菌屬物種的堿性絲氨酸蛋白酶(例如,ALCALASETM、SAVINASETM、ESPERASETM、枯草桿菌蛋白酶Novo(可以從Novo Nordi sk A/S,丹麥得到)和KAZUSASETM(可以從SHOWA DENKO,日本得到))之間沒有交叉反應(yīng)。
5.3.核酸構(gòu)建體本文所使用的術(shù)語“核酸構(gòu)建體”有意于指任何基因組DNA、合成DNA或RNA起源的核酸分子。術(shù)語“構(gòu)建體”有意于指單鏈或雙鏈的并基于編碼蛋白酶的全部或部分的天然產(chǎn)生的核苷酸序列的核酸片段。構(gòu)建體可以可有可無地包含其它核酸片段。
編碼所說的蛋白酶的本發(fā)明的核酸構(gòu)建體可合適地屬于基因組起源,例如,通過按照標準技術(shù)(參見Sambrook等,分子克隆實驗室手冊,冷泉港實驗室,冷泉港,N.Y.,1989)使用合成寡核苷酸探針通過雜交制備基因組文庫并篩選編碼蛋白酶的全部或部分的DNA序列而獲得。為了這種目的,通過5.1部分所述的(同上)從Bacillus sp.的菌株分離染色體DNA并篩選基因組DNA文庫以獲得編碼蛋白酶的DNA序列。
也可以通過已建立的標準方法(例如,由Beaucage和Caruthers,Tetrahedron Letters22(1981),1859-1869描述的亞磷酰胺方法或由Matthes等,EMBO雜志,3(1984)801-805描述的方法)合成制備編碼蛋白酶的本發(fā)明的核酸構(gòu)建體。按照亞磷酰胺方法,例如,在自動DNA合成儀中合成、純化、退火寡核苷酸并連接與克隆進適合的載體中。
而且,核酸構(gòu)建體可以是混合的合成和基因組起源并通過按照標準技術(shù)連接合成或基因組DNA片段(在適當(dāng)?shù)那闆r下)與對應(yīng)于全部核酸構(gòu)建體的不同部分的片段制備。
也可以使用特異性引物通過聚合酶鏈式反應(yīng)(例如,在美國4,683,202或Saiki等,科學(xué)239(1988),487-491中描述的)制備核酸構(gòu)建體。
在一個當(dāng)前優(yōu)選的實施方案中,本發(fā)明的核酸構(gòu)建體包含在SEQ IDNO4中顯示的DNA序列以及編碼在SEQ ID NO1、SEQTD NO2或SEQ ID NO3中顯示的氨基酸序列的核酸序列,例如,分別在SEQ ID NO5、SEQ ID NO6或SEQ ID NO7中描述的DNA序列。本發(fā)明還包含在下列條件下與編碼在SEQ ID NO1、SEQ ID NO2或SEQ ID NO3中顯示的氨基酸序列的核酸分子(基因組或合成的)雜交的核酸序列在5×SSC中預(yù)浸漬,于大約40℃下在20%甲酰胺、50mM磷酸鈉pH 6.8、50μg變性的聲處理的小牛胸腺DNA的溶液中預(yù)雜交1小時,其后為在大約40℃下在相同的溶液中雜交18小時,然后在大約45℃的溫度下在0.4×SSC中洗滌。
在上面限定的種類內(nèi)有用的變體包括,例如,其中DNA編碼變化的變體(其中進行了保守氨基酸的取代,該取代不顯著地影響蛋白質(zhì)的活性)。保守的取代是指相同類別的氨基酸可以由這一類別的任何另一種取代。例如,非極性脂肪族殘基Ala、Val、Leu和Ile可以互換,堿性殘基Lys和Arg或酸性殘基Asp和Glu也是這樣。同樣地,Ser和Thr相互是保守的取代,Asn和Gln也是如此。對技術(shù)人員明顯的是在對分子功能關(guān)鍵性區(qū)的外部可以進行這樣的取代,也可以產(chǎn)生活性蛋白酶。通過利用以上所述的測定方法可以容易地測定所需活性的保留。
核酸構(gòu)建體優(yōu)選地是DNA構(gòu)建體,在下面將專一地使用該術(shù)語。
5.4.重組載體在另一個方面,本發(fā)明涉及包含本發(fā)明的DNA構(gòu)建體的重組載體。本發(fā)明的DNA構(gòu)建體插入的重組載體可以是可方便地進行重組DNA過程的任何載體,載體的選擇常取決于它所要導(dǎo)入的宿主細胞。這樣,載體可以是自主復(fù)制載體,即作為染色體外實體存在的、其復(fù)制獨立于染色體復(fù)制的載體,例如,質(zhì)粒。另外,載體可以是當(dāng)導(dǎo)入宿主細胞時整合進宿主細胞基因組并與它所整合進的染色體一起復(fù)制的載體。
該載體優(yōu)選地是表達載體,其中編碼本發(fā)明的蛋白酶的DNA序列可操作連接到DNA轉(zhuǎn)錄所需的另外的片段上。通常,表達載體源于質(zhì)?;虿《綝NA,或可以包含二者的元件(element)。術(shù)語“可操作地連接”是指排列片段以便它們?yōu)榱颂囟ǖ哪康膮f(xié)同作用,例如,轉(zhuǎn)錄在啟動子中開始并通過編碼本發(fā)明的蛋白酶的DNA序列進行。
啟動子可以是在選擇的宿主細胞中顯示轉(zhuǎn)錄活性的任何DNA序列,并可源于編碼對宿主細胞同源或異源的蛋白質(zhì)的基因。具體來說,在細菌宿主細胞中使用的適合啟動子的例子包括(但不限于)嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)麥芽淀粉酶基因、解淀粉芽孢桿菌(BAN)淀粉酶基因、枯草芽孢桿菌堿性蛋白酶基因、短小芽胞桿菌(Bacilluspumilus)木糖苷酶基因、蘇云金芽孢桿菌(Bacillusthuringiensis)cryIIIA或地衣芽孢桿菌α-淀粉酶基因的啟動子??梢允褂玫钠渌鼏幼影?但不限于)噬菌體λPR或PL啟動子或大腸桿菌lac、trp或tac啟動子。
該啟動子也可以源于編碼所說的蛋白酶或其片段的基因,該基因具有和所說的序列基本上相同的啟動子活性。啟動子序列在SEQ ID NO8中顯示。本發(fā)明還包含在下列條件下與在SEQ ID NO8中顯示的啟動子序列雜交(在5×SSC中預(yù)浸漬,于大約40℃下在20%甲酰胺、50mM磷酸鈉、pH6.8、50μg變性的聲處理的小牛胸腺DNA的溶液中預(yù)雜交1小時,其后為在大約40℃下在相同的溶液中雜交18小時,然后在大約45℃的溫度下在0.4×SSC中洗滌)或與SEQ ID NO8有至少大約90%、優(yōu)選地有大約95%同源性但是和所說的序列具有基本上相同的啟動子活性的核酸序列??梢允褂迷搯幼哟龠M所說的蛋白酶或異源DNA序列(例如,lipolase、1,3-特異性脂酶,下文作為Lipolase)的表達。該酶可以通過在SEQ ID NO11中所顯示的DNA序列編碼并具有在SEQ ID NO12中顯示的氨基酸序列。該酶也可以是Lipolase變體,例如,D96L、E210K、E210L(參見WO92/05249)。
本發(fā)明的重組載體還可以包含使載體能夠在所說的宿主細胞中復(fù)制的DNA序列。當(dāng)宿主細胞是細菌細胞時,使載體能夠復(fù)制的序列是各種ori序列。
載體也可以包含可選擇的標記,例如,其產(chǎn)物賦予對藥物(例如,氨芐青霉素、卡那霉素、四環(huán)素、氯霉素、新霉素、潮霉素、甲氨蝶呤)抗性的基因。
為了指導(dǎo)本發(fā)明的蛋白酶進入宿主細胞的分泌途徑,在重組載體中可以提供分泌信號序列(也已知作為前導(dǎo)序列或前序列)。把分泌信號序列連接到編碼正確的讀框中的原體未成熟蛋白酶的DNA序列上(參見,例如,圖4)。原體序列是在前序列和蛋白酶分泌所必需的成熟蛋白酶之間的氨基酸序列。原體序列的裂解產(chǎn)生成熟的活性蛋白酶。分泌信號序列通常定位5′至編碼蛋白酶的DNA序列上。通常分泌信號序列可以是與蛋白酶相關(guān)的序列或可以得自編碼另一種分泌蛋白質(zhì)的基因。
對于從細菌細胞中的分泌,信號肽可以是天然產(chǎn)生的信號肽或其功能部分,它也可以是合成肽。適合的信號肽包括(但不限于)源自地衣芽孢桿菌α-淀粉酶、遲緩芽孢桿菌(Bacillus lentus)堿性蛋白酶和解淀粉芽孢桿菌淀粉酶的序列。
對于從細菌細胞中的分泌,信號肽也可以是得自本申請中公開的蛋白酶的信號肽。信號序列的氨基酸序列在SEQ ID NO9中顯示。信號序列可以由在SEQ ID NO10中所描述的核酸序列編碼。本發(fā)明還包含在下列條件下與在SEQ ID NO10中顯示的核酸序列雜交(在5×SSC中預(yù)浸漬,于大約40℃下在20%甲酰胺、50mM磷酸鈉、pH6.8、50μg變性的聲處理的小牛胸腺DNA的溶液中預(yù)雜交1小時,其后為在大約40℃下在相同的溶液中雜交18小時,然后在大約45℃的溫度下在0.4×SSC中洗滌)或與SEQ ID NO5有至少大約90%、優(yōu)選地有大約95%同源性但是和所說的序列具有基本上相同的信號活性的核酸序列。可以使用該信號促進所說的蛋白酶或異源DNA序列(例如,lipolase、1,3-特異性脂酶,下文作為Lipolase)的分泌。該酶可以通過在SEQ ID NO11中所顯示的DNA序列編碼并具有在SEQ IDNO12中顯示的氨基酸序列。該酶也可以是Lipolase變體,例如,D96L、E210K、E210L(參見WO 92/05249)。
用于分別連接編碼本發(fā)明的蛋白酶的DNA序列、啟動子和/或分泌信號序列并把他們插入到包含復(fù)制所必需的信息的適合載體中所利用的方法對本領(lǐng)域的技術(shù)人員是熟知的(參見,例如,Sambrook等,op.cit.)。
5.5.宿主細胞導(dǎo)入宿主細胞的編碼本發(fā)明的堿性蛋白酶的DNA序列可以和所說的宿主是同源或異源的。如果和宿主細胞同源,即實質(zhì)上由宿主細胞產(chǎn)生,它可以可操作地連接到另一個啟動子序列或(如果適用)另一個分泌信號序列和/或終止子序列而非其天然環(huán)境中。術(shù)語“同源”有意于包括編碼對所說的宿主有機體天然的蛋白酶的核酸序列;可以把核酸序列以多拷貝形式導(dǎo)入宿主有機體。術(shù)語“異源”有意于包括實質(zhì)上不由宿主細胞表達的DNA序列。這樣,DNA序列可以得自另一種有機體,或它可以是合成序列。
本發(fā)明DNA構(gòu)建體或重組載體導(dǎo)入的宿主細胞可以是能夠產(chǎn)生本發(fā)明的堿性蛋白酶的任何細胞,包括(但不限于)細菌、酵母、真菌和高等真核細胞。
細菌宿主細胞(培養(yǎng)時能夠產(chǎn)生和分泌本發(fā)明的蛋白酶)的例子是革蘭氏陽性細菌(如芽孢桿菌屬的菌株,如枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌(B.brevis)、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌B.alkalophilus)、解淀粉芽孢桿菌、凝結(jié)芽孢桿菌(B.coagulans)、環(huán)狀芽孢桿菌(B.circulans)、燦爛芽孢桿菌(B.lautus)、巨大芽胞桿菌(B.megatherium)或蘇云金芽孢桿菌的菌株)或革蘭氏陰性細菌(如大腸桿菌(Escherichia coli)。細菌的轉(zhuǎn)化可以通過原生質(zhì)體的轉(zhuǎn)化或通過以本來已知的方式利用感受態(tài)細胞(參見Sambrook等,同上)來實現(xiàn)。
當(dāng)在細菌(如大腸桿菌)中表達蛋白酶時,蛋白酶可以典型地作為不溶性粒子(已知為包含體)保留在細胞質(zhì)中,或可以通過細菌分泌序列被引導(dǎo)到周質(zhì)空間。在前一種情況下,溶解細胞,回收粒子并使其變性,其后通過稀釋變性劑使蛋白酶再折疊。在后一種情況下,通過破壞細胞(例如,通過聲處理或滲透壓休克)從周質(zhì)空間回收蛋白酶以釋放周質(zhì)空間的內(nèi)容物并回收蛋白酶。
然后在適合的營養(yǎng)培養(yǎng)基中于使得本發(fā)明的蛋白酶可以表達的條件下培養(yǎng)以上所述的轉(zhuǎn)化的宿主細胞,之后從培養(yǎng)物中回收形成的蛋白酶。培養(yǎng)細胞所利用的培養(yǎng)基可以是任何適合于培養(yǎng)宿主細胞的常規(guī)培養(yǎng)基,如基本或包含適當(dāng)補料的復(fù)合培養(yǎng)基。適合的培養(yǎng)基可以從商業(yè)供應(yīng)廠商得到或按照已公開的配方制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。然后可通過常規(guī)方法從培養(yǎng)基中回收由這些細胞產(chǎn)生的蛋白酶,該方法包括通過離心或過濾從培養(yǎng)基中分離宿主細胞、沉淀上清液中的蛋白質(zhì)組分或通過鹽(例如,硫酸銨)過濾、依賴于所說的蛋白酶的類型通過各種層析方法純化(例如離子交換色譜、凝膠過濾色譜、親和色譜等)。
在下列的實施例中進一步說明本發(fā)明,這在任何方面都無意于限制本發(fā)明所要求的范圍。6.實施例6.1.PD498蛋白酶的分離于25℃下的旋轉(zhuǎn)振蕩臺上(300r.p.m.)在包含100ml下列組成(每升)的培養(yǎng)基的500ml擋板(baffled)錐形瓶中培養(yǎng)Bacillus sp.PD498馬鈴薯淀粉 100g磨過的大麥50g大豆粉20gNa2HPO4×12H2O 9gPluronic54R(BASF)0.1g酪蛋白酸鈉10g用α-淀粉酶液化培養(yǎng)基中的淀粉,通過在120℃下加熱45分鐘對培養(yǎng)基滅菌。
在滅菌之后,通過添加10ml的1M碳酸氫鈉溶液把培養(yǎng)基的pH值調(diào)整至9.0。
在培養(yǎng)4天后,使用以上所述的方法測定培養(yǎng)物中的解蛋白活性。肉湯的蛋白酶活性是5CPU/l。
在分離固體物質(zhì)后,通過常規(guī)的層析方法純化蛋白酶。得自3.51的培養(yǎng)肉湯的產(chǎn)量具有120CPU/l的31ml。通過SDS-PAGE和等電點聚焦把純度調(diào)整到90%以上。
按照本實施例制備的制劑的特征在本說明書的前面曾提到過,在此進行參考。
6.2.PD498蛋白酶的克隆和表達6.2.1.材料和方法6.2.1.1.菌株按照制造廠商的說明(BRL)將大腸桿菌DH5 F-Φ80dlacZΔ M15Δ(lacZYA-argF)U169 deoR recAl endAl hsdR17(rK-,mK+)supE44-thi-1gyrA96 relAl(BRL)用于所有的大腸桿菌的轉(zhuǎn)化。通過Anagnostopolis和Spizizen的方法(細菌學(xué)雜志,81741-746,1961)使枯草芽孢桿菌蛋白酶缺陷菌株成為感受態(tài)。
6.2.1.2.DNA分離和基因文庫構(gòu)建如Pitcher等(應(yīng)用微生物通信,8151-156,1989)所述分離PD498染色體DNA。用EcoR1消化100μg的DNA并在瓊脂糖凝膠上電泳。利用Qiaex系統(tǒng)(Qiagen)分離5-8kb的DNA。把這種DNA連接到EcoR1一切口上,分別以4∶1的比率用CIP(牛小腸磷酸酶)處理pUC19(BRL)。然后把連接混合物轉(zhuǎn)化進大腸桿菌菌株DH5α(BRL)。
6.2.1.3.1 80bp片段的PCR擴增利用兩個基于蛋白酶的部分氨基酸序列的混合引物(組A和組B)進行蛋白酶基因的180bp片段的擴增。字母氨基酸序列是序列AAYQYGPQNT(SEQ ID NO13)和序列BYDFIDYDNNPMD(SEQ ID NO14)。在Ericomp PCR儀器中的95℃/5分鐘、其后為30個循環(huán)的95℃/1分鐘、55℃/1分鐘、72℃/1分鐘的反應(yīng)中使用了該引物與總PD498 DNA。引物組AGCNTAYCARTAYGGNCCNCARAAYAC(SEQ ID NO15)引物組BTCCATNGGRTTRTTRTCRTARTCDATRAARTCRTA(SEQ ID NO16)6.2.1.4.PCR反應(yīng)產(chǎn)物的亞克隆按照制造廠商的說明利用TA克隆載體pCRII(Invitrogen,San Diego,CA)克隆PCR產(chǎn)物以用于測序。插入DNA用DIG(digoxigenin)標記,利用Engler-Blum(1993,生物化學(xué)年評,210235-244)改進的得自Boehringer Mannheim的Genius系統(tǒng)進行Southern雜交和菌落印跡。
6.2.1.5.DNA測序利用具有熒光標記的雙脫氧核苷酸的Taq聚合酶循環(huán)測序測定DNA序列。該測序反應(yīng)在應(yīng)用生物系統(tǒng)自動DNA測序儀(Model 373A 1.2.0版)上進行。
6.2.1.6.包含由amyL啟動子驅(qū)動的PD498蛋白酶的載體的構(gòu)建α-淀粉酶(amyL)啟動子(SEQ ID NO17)是得自地衣芽孢桿菌的“上”突變啟動子,通過利用下列引物從地衣芽孢桿菌DNA進行PCR擴增獲得5′-AAGGCATGCGTCCTTC-3′(SEQ ID NO18)5′-CTTTCAATGTGTAACATA-3′(SEQ ID NO19)把形成的630bp片段克隆進pCRII載體(Invitrogen),該載體使克隆片段能夠作為EcoRI片段容易地分離。
將蛋白酶基因作為1.9kb的EcoRI-EcoRV片段亞克隆進EcoRI、SmaI-切割的pUC19中,然后作為1.9kb的EcoRI-HindIII片段取出并克隆進EcoRI-HindIII-切割的pHP13amp(大腸桿菌-枯草芽孢桿菌穿梭載體)中(圖8)。以EcoRI消化形成的質(zhì)粒p498-4,用牛小腸磷酸酶(CIP)處理,并連接到上述的amyL啟動子片段上,產(chǎn)生質(zhì)粒p498-5(圖5)。通過在與PD498編碼區(qū)有關(guān)的正方向上包含所述啟動子的枯草芽孢桿菌菌落在包含適當(dāng)?shù)目股嘏c1%牛奶的瓊脂平板上形成暈圈(halos)的能力選擇這種菌落。
6.2.1.7.包含由cryIIIA啟動子驅(qū)動的PD498蛋白酶的載體的構(gòu)建利用下列引物通過PCR擴增得自蘇云金芽孢桿菌粉蟲變種(Bacillusthuringiensis var.tenebrionis)的cryIIIA啟動子(SEQ ID NO20)5′-GAGACCCGGGAGCTTTCAGTGAAGTACGTG-3′(SEQ ID NO21)5′-CATAAATCCATTAGACGGTGC-3′(SEQ ID NO22)把形成的1500bp片段再次克隆進pCRII載體(Invitrogen)中,作為EcoRI片段除去,并連接到EcoRI-消化的p498-4質(zhì)粒中以產(chǎn)生質(zhì)粒p498-6(在此質(zhì)粒中PD498蛋白酶的表達由cryIIIA啟動子驅(qū)動)(圖5)。通過在與PD498編碼區(qū)有關(guān)的正方向上包含所述啟動子的枯草芽孢桿菌菌落在包含適當(dāng)?shù)目股嘏c1%牛奶的瓊脂平板上形成暈圈的能力選擇這種菌落。
6.2.1.8.包含由BAN啟動子驅(qū)動的PD498蛋白酶的載體的構(gòu)建利用包含另外的SphI接頭5′-GCATGCAATCGATTGTTTGAGAAAAGAAG-3′(SEQ ID NO24)(在該接頭中,第一組有下劃線的核苷酸序列是所說的SphI位點,第二組有下劃線的核苷酸序列是天然產(chǎn)生的ClaI位點)的上游引物以及下游引物5′-CATTTTCTTATACAAATTATATTTTACATATCAG-3′(SEQ ID NO25)從質(zhì)粒(pSX222)(SEQ ID NO23)PCR-擴增解淀粉芽孢桿菌淀粉酶(BAN)啟動子。
把形成的168bp片段克隆進pCRII載體(Invitrogen)中,作為EcoRI片段除去,并連接到EcoRI-消化的p498-4質(zhì)粒中以產(chǎn)生質(zhì)粒p498-7(在此質(zhì)粒中PD498蛋白酶的表達由BAN啟動子驅(qū)動)(圖5)。通過在與PD498編碼區(qū)有關(guān)的正方向上包含所述啟動子的枯草芽孢桿菌菌落在包含適當(dāng)?shù)目股嘏c1%牛奶的瓊脂平板上形成暈圈的能力選擇這種菌落。
通過在與PD498蛋白酶有關(guān)的相反方向上包含BAN啟動子的枯草芽孢桿菌轉(zhuǎn)化體在包含適當(dāng)?shù)目股嘏c1%牛奶的瓊脂平板上不能形成暈圈選擇這種轉(zhuǎn)化體。
6.2.2.PD498基因序列分析利用基于PD498蛋白酶的部分氨基酸序列的兩組寡核苷酸,通過PCR擴增180bp依正確大小排列的片段并將其克隆進大腸桿菌載體pCRII。180bp插入片段的測序表明克隆的是正確的片段。利用180bp插入片段作為探針,Southern雜交從PD498染色體DNA鑒別出與所述探針雜交的6.5kbEcoR1片段。以EcoR1消化PD498的染色體DNA,選擇大小為5-8kb的片段并連接進用EcoR1切割的pUC19中,然后用CIP處理。在轉(zhuǎn)化進在包含Amp和X-gal的LB平板上選擇的大腸桿菌菌株DH5α后,形成了成千上萬的白色菌落。通過利用標記的180bp片段作為探針的菌落雜交得知篩選的600個菌落中的2個是陽性的。限制性分析表明兩個菌落都包含具有6.5kb的EcoR1插入片段的相同質(zhì)粒。
DNA測序表明5′EcoR1位點恰好在基因核糖體結(jié)合位點的上游(圖3;SEQ ID NO26),其后為蛋白質(zhì)的ATG起始密碼子。前27個氨基酸類似于具有短序列(包含三個帶正電的殘基,其后為具有Ser-Leu-Ala的疏水鏈末端)的典型的芽孢桿菌屬信號肽。在該切割位點后有一個90個氨基酸的前肽,其后為具有29270的預(yù)期分子量的280個氨基酸的成熟蛋白質(zhì),該成熟蛋白質(zhì)與在SDS-PAGE上觀察到的34,000分子量(圖4)十分一致。
6.3.具有啟動子活性的PD498開放讀框上游的DNA序列的分離PD498編碼區(qū)的DNA測序表明Asp718(也被KpnI識別的位點)、PstI、BglII以及其它單一限制位點的存在。以Asp718和各種其它酶消化PD498基因組DNA、把片段Southern轉(zhuǎn)移至尼龍上并以180bpDIG-標記的DNA探針檢測(如6.2.1.3和6.2.1.4部分所述)表明了1.4kb HindIII-Asp718片段的存在。從已知的Asp718限制位點在PD498編碼區(qū)中的位置可知,1.4kbHindIII-Asp718片段應(yīng)包含PD498蛋白酶的ATG翻譯起點上游的大約750-850nts。把1-2kb的HindIII-Asp718片段的依大小選擇的文庫克隆進pUC118(Vieira和Messing,酶學(xué)方法,1533-11,1987)并轉(zhuǎn)化進大腸桿菌XL1-Blue MRF′細胞(Stra tagene,San Diego,CA)中。通過Sambrook等(1989,同上)的菌落雜交技術(shù)使用180bp的DIG-標記的PCR片段篩選菌落。用探針檢測到六個菌落,通過堿性溶胞技術(shù)(Sambrook等,1989,同上)從4個菌落中分離質(zhì)粒DNA。所有四種質(zhì)粒制劑包含1.4kb的HindIII-Asp718片段。在ABI 373A測序儀上用熒光標記的雙脫氧核苷酸通過Taq聚合酶循環(huán)測序測定該片段的序列(SEQ ID NO4)。將包含該片段的質(zhì)粒命名為p118-498proml(參見圖6)。
6.4.具有PD498編碼序列的PD498啟動子的重建以三個步驟用其天然PD498編碼序列重建上游HindIII-Asp718片段(參見圖9)。首先,把得自p118-498proml的HindIII-Asp718片段克隆進pHP13amp。然后,以MscI和BamHI消化質(zhì)粒p498-5以產(chǎn)生包含PD498蛋白酶編碼區(qū)的1.0kb的MscI-BamHI片段。第三,把MscI-BamHI片段連接進用MscI和BamHI切割的第一步的質(zhì)粒中。然后把連接混合物轉(zhuǎn)化進大腸桿菌DH5α細胞中。通過堿性溶胞“小量制備”從轉(zhuǎn)化體中分離所需的構(gòu)建體p498-8(參見圖9)。然后把所述質(zhì)粒轉(zhuǎn)化進枯草芽孢桿菌蛋白酶缺陷菌株并平板接種于包含1%無脂干奶和每毫升10μg氯霉素的TBAB平板上。通過轉(zhuǎn)化的枯草芽孢桿菌菌落周圍澄清區(qū)(暈圈)的形成表明蛋白酶從其天然啟動子的表達。
6.5.PD498在具有用p498-5,6,7,8和“7R”轉(zhuǎn)化的枯草芽孢桿菌蛋白酶缺陷菌株的蔗糖/大豆粉培養(yǎng)基中進行振蕩培養(yǎng)瓶實驗。這些質(zhì)粒構(gòu)建體由pHP13amp載體組成,該載體分別包含amyL、cryIIIA、BAN、498和逆BAN(逆方向的BAN啟動子)并啟動PD498蛋白酶表達。在四天后產(chǎn)生了在cryIIIA、BAN和PD498啟動子控制下的地衣芽孢桿菌α-淀粉酶。
6.6.在枯草芽孢桿菌中表達脂酶在枯草芽孢桿菌蛋白酶缺陷背景下試驗下列構(gòu)建體(啟動子/信號序列/Lipolase)Lipolase活性pHP13amp 0pLip3 5pHP13amp的圖在圖7中顯示,pLip3的圖在圖8中顯示。使用下列方法構(gòu)建pLip3。把攜帶proLipolase編碼序列的pMHan37的MscI-BamHI片段(參見圖10)和得自p118-498proml的PD498的HindIII-MscI片段(包含啟動子與信號肽編碼序列)和HindIII/BamHI切割的pHP13amp連接以產(chǎn)生pLip3。用該構(gòu)建體轉(zhuǎn)化蛋白酶缺陷枯草芽孢桿菌菌株。當(dāng)置于包含5μg氯霉素/ml和1%甘油三丁酸酯的TBAB平板上時,轉(zhuǎn)化體比僅包含pHP13amp的枯草芽孢桿菌蛋白酶缺陷菌株產(chǎn)生了更大的澄清區(qū)。融合物的圖在圖11中顯示。
利用蔗糖-大豆培養(yǎng)基從振蕩培養(yǎng)瓶獲得了這些結(jié)果。數(shù)據(jù)表明可以使用pD498啟動子/信號序列在枯草芽孢桿菌中表達異源蛋白質(zhì)。7.微生物的保藏下列生物材料保藏在農(nóng)業(yè)研究機構(gòu)專利培養(yǎng)物保藏中心(NRRL),北方區(qū)域研究中心,1815大學(xué)街,Peoria,伊利諾斯州,61604,美國。菌株保藏號保藏號包含p498-5的大腸桿菌 NRRLB-21434 1995年4月24日包含p118-498proml的大腸桿菌 NRRLB-21433 1995年4月24日菌株在如下的條件下以及在布達佩斯條約的條件下保藏保證在該專利申請未決期間該培養(yǎng)物對于由所授權(quán)的專利和商標委員會成員按照37C.F.R.§1.14和35 U.S.C.§122確定的人是可以得到的。保藏物代表了每種保藏菌株的生物學(xué)純的培養(yǎng)物。保藏物在外國專利法需要時也可以得到(在這些國家中提出本申請的對應(yīng)物或其子代)。然而,應(yīng)該理解可得到保藏物不構(gòu)成在解除通過政府作用授予的專利權(quán)中實施本發(fā)明的許可。
此處所描述的和所要求的本發(fā)明不限于本文公開的特定實施方案的范圍,因為這些實施方案有意于說明本發(fā)明的幾個方面。任何相當(dāng)?shù)膶嵤┓桨付及ㄔ诒景l(fā)明的范圍之內(nèi)。事實上,除了本文所顯示的和所描述的之外,從以上的描述,本發(fā)明的各種修改對本領(lǐng)域技術(shù)人員是明顯的。這樣的修改也有意于包含在所附的權(quán)利要求的范圍之內(nèi)。
本文引用了各種參考文獻,本說明書一并參考了其全部公開的內(nèi)容。
序列表(1)一般信息(i)申請人(A)Novo Nordisk生物技術(shù)公司(B)街道1445 Drew大街(C)城市Davis(D)州加利福尼亞(E)國家美國(F)郵區(qū)代碼95616-4880(G)電話(916)757 8100(H)傳真(916)758 0317與(i)申請人(A)Novo Nordisk A/S(B)街道Novo Alle(C)城市Bagsvd(D)國家丹麥(E)郵區(qū)代碼DK-2880(F)電話45-4444-8888(G)傳真45-4449-0555(ii)發(fā)明名稱堿性蛋白酶(iii)序列數(shù)27(iv)通訊地址(A)收信人北美Novo Nordisk公司(B)街道405Lexington大街,第64層(C)城市紐約(D)州紐約(E)國家美國(F)郵區(qū)代碼10174-6401
(v)計算機可讀形式(A)介質(zhì)類型軟盤(B)計算機IBM PC兼容機(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Relea se#1.0,#1.30版(vi)目前申請資料(A)申請?zhí)柎?B)申請日1996年4月29日(C)分類號(vi)在先申請資料(A)申請?zhí)?8/434,255(B)申請日1995年5月3日(C)分類號(viii)律師/代理人信息(A)姓名Agris Dr.,Cheryl H.
(B)登記號34,086(C)參考/檔案號4797.204-WO/3764.404-WO(ix)電信信息(A)電話212-867-0123(B)傳真212-878-9655(2)SEQ ID NO1的信息(i)序列特征(A)長度2702個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ix)特征(A)名稱/關(guān)鍵詞CDS(B)定位843..2033(xi)序列描述SEQ ID NO1AAGCTTAATC ATCCCGATGT ATCGCTTCAG CGCTTACCGT AGACGATTTT CTTTATAGTC 60TCGATGGATA AAAAGTACCT ATCTGAAATG GAAGCAATCG ACTCTCCTCC AGTAAAGGCT 120TCAAGGATCG ACGTGTTTCT CCGTTTAAGC GCTTCCCTTC CTCCTGACTT TGAGCCCCAG 180GCATTATACT CTTCTTTTCG CTTTGGGATA TAAATGGTTT GGCCTTGAAC ATAGTTTTGT 240AATTCTCTCA TTAAGTAATC AGGAATTTGA TTTACTGCTT TCAATCGTGT CAGCTCCTTA 300TCATTATTGG ATCAATAAGG GACAAAGCCG ACATATGAAT GGCGATTCAT CTAAAACTAC 360CACCCCATGC AAAGGATCGC CGAATCATAC AGGCTTTGCA TGAGATGCTG CAGATTTCGG 420AAAACGGATT TCCATATGAT CACCTCCTAG TATCAGTATA CTGATACTAG CAGAAAGATT 480TCCATAAGAA TTTCTTATAG TTACCATAAT ATTATTATAT AAACCTACTA TATTTGATTT 540TCAATTTGAG AAAATAAGTG ACCATTCACC TATCCTTAAA GTTGCTCAAC CCCATACAAT 600CATGAAACTT TTCATGCCAA ACGTTCATTA TGCGAAATCT ATCAAAAACT GAGAGTGAAT 660TCATTTTTTG ATAGAAAATT AAAACTATTC AATATTTTGT CACAACCTGC TAGAATCCTA 720GGTAATAAGG GTCCCCTACA TATCTATCAT TCATCACAAT GACCTTTGTT CATCTTGAAT 780TCTGAAGGGA GGATCGACCT GCTAATTTGT CGTAAAAAAA TAGAAAATGG AGGAATGCTT 840TT ATG AAG TTC AAA AAA ATA GCC GCT CTA TCC TTA GCA ACT TCC CTT887Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu1 5 10 15GCT TTA TTC CCT GCC TTC GGA GGT AGT TCA CTG GCC AAG GAA GCA CCG 935Ala Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro20 25 30AAA CCG TTC CAA CCT ATC AAC AAA ACT TTG GAT AAA GGC GCT TTC GAA 983Lys Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu35 40 45TCC GGT GAA GTC ATC GTC AAA TTC AAA GAT GGT GTA TCC AAA AAG GCA 1031Ser Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala50 55 60CAA GGT TCT GCT CTG AAC AAA GCG GAG GCA AAT GAA CAG AAA GCA TCA 1079Gln Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser65 70 75GCA AAA GAT CCA TTT CAG GTA TTG GAA GTA GCG GAC GTC GAT CAA GCT 1127Ala Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala80 85 90 95GTT AAA GCA CTG GAA AAC AAT CCG AAT GTA GAA TAT GCT GAA CCA AAC 1175Val Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn100 105 110TAT ACC TTC CAA GCG ACT TGG TCA CCG AAT GAC CCT TAC TAT TCT GCT 1223Tyr Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala115 120 125TAC CAG TAT GGA CCA CAA AAC ACC TCA ACC CCT GCT GCC TGG GAT GTA 1271Tyr Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val130 135 140ACC CGT GGA AGC AGC ACT CAA ACG GTG GCG GTC CTT GAT TCC GGA GTG 1319Thr Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val145 150 155GAT TAT AAC CAC CCT GAT CTT GCA AGA AAA GTA ATA AAA GGG TAC GAC 1367Asp Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp160 165 170 175TTT ATC GAC AGG GAC AAT AAC CCA ATG GAT CTT AAC GGA CAT GGT ACC1415Phe Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr180 185 190CAT GTT GCC GGT ACT GTT GCT GCT GAT ACG AAC AAT GGA ATT GGC GTA1463His Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val195 200 205GCC GGT ATG GCA CCA GAT ACG AAG ATC CTT GCC GTA CGG GTC CTT GAT1511Ala Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp210 215 220GCC AAT GGA AGT GGC TCA CTT GAC AGC ATT GCC TCA GGT ATC CGC TAT1559Ala Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr225 230 235GCT GCT GAT CAA GGG GCA AAG GTA CTC AAC CTC TCC CTT GGT TGC GAA1607Ala Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu240 245 250 255TGC AAC TCC ACA ACT CTT AAG AGT GCC GTC GAC TAT GCA TGG AAC AAA1655Cys Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys260 265 270GGA GCT GTA GTC GTT GCT GCT GCA GGG AAT GAC AAT GTA TCC CGT ACA1703Gly Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr275 280 285TTC CAA CCA GCT TCT TAC CCT AAT GCC ATT GCA GTA GGT GCC ATT GAC1751Phe Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp290 295 300TCC AAT GAT CGA AAA GCA TCA TTC TCC AAT TAC GGA ACG TGG GTG GAT1799Ser Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp305 310 315GTC ACT GCT CCA GGT GTG AAC ATA GCA TCA ACC GTT CCG AAT AAT GGC1847Val Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly320 325 330 335TAC TCC TAC ATG TCT GGT ACG TCC ATG GCA TCC CCT CAC GTG GCC GGT1895Tyr Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro His Val Ala Gly340 345 350TTG GCT GCT TTG TTG GCA AGT CAA GGT AAG AAT AAC GTA CAA ATC CGC1943Leu Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg355 360 365CAG GCC ATT GAG CAA ACC GCC GAT AAG ATC TCT GGC ACT GGA ACA AAC1991Gln Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn370 375 380TTC AAG TAT GGT AAA ATC AAC TCA AAC AAA GCT GTA AGA TAC2033Phe Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr385 390 395TAATAGATAA AACAAGAGCA CACCGTGAAT GGTGGGCTCT TTCATTATGT TCACTACTGT 2093TTTACGATCT GGCCGTTTTG GTTCAGGTAA ACACTCTGGA TGATGGTTCT ATTAAACGGT 2153TTCCCTTTAT AATCAGACTT AATATCCGTT GTCAGGTTGT AGGTTCCTTC TCCTCCATTG 2213AACACTGTAC CACTCCCCTT GACAGACTGG GACAAAGGTT TCCCCTTAGG GTAGAACTCA 2273AACATTGTGT GCTCGGTGAA CCCACTGACG ATACTTGATT GAACGCTGAC TCCCTTCTCA 2333GTGGTCGTTA CCACCAAGTC ATCATTCAAT GGACTTGTGA AACCAACATT CAGTAAATAT 2393GCCCCAGGTT CTTTTGACAA AGATGACACC TTCCACTCGC CTTCAATAGG GTTTTCAACC 2453GTTCCCACAT GATGAAACGC ACCTTTGAAA TAACTTTCCT GATCCTTTCC AGATGGTTTC 2513AGTGCCGTTA CCTTCCCATC TGGGCTTGTA AGGTAGACAT CTTCCTTCGA GTTCGATGCC 2573AACCAGTCAA TCGAAATCCG TTCTGCCCCA ACCTCTACCC AGAAAGTTTC ATCCGCATGC 2633TCTTTATACT CACCTCCGCG GATGAAGGAT GAAGTATTGG TCTTGAGAGC CGATTCCTTC 2693CTTGATATC 2702(2)SEQ ID NO2的信息(i)序列特征(A)長度397個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala1 5 10 15Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro Lys20 25 30Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu Ser35 40 45Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala Gln50 55 60Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser Ala65 70 75 80Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala Val85 90 95Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn Tyr100 105 110Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr115 120 125Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr130 135 140Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp145 150 155 160Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe165 170 175Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr His180 185 190Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala195 200 205Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala210 215 220Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala225 230 235 240Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys245 250 255Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly260 265 270Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe275 280 285Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser290 295 300Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val305 310 315 320Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr325 330 335Ser Tyr Met Ser Gly Thr Ser Met Ala Sar Pro His Val Ala Gly Leu340 345 350Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln355 360 365Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe370 375 380Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr385 390 395(2)SEQ ID NO3的信息(i)序列特征(A)長度1191個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ix)特征(A)名稱/關(guān)鍵詞CDS(B)定位1..1191(xi)序列描述SEQ ID NO3ATG AAG TTC AAA AAA ATA GCC GCT CTA TCC TTA GCA ACT TCC CTT GCT48Met Lys phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala400 405 410TTA TTC CCT GCC TTC GGA GGT AGT TCA CTG GCC AAG GAA GCA CCG AAA96Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro Lys415 420 425CCG TTC CAA CCT ATC AAC AAA ACT TTG GAT AAA GGC GCT TTC GAA TCC144Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu Ser430 435 440 445GGT GAA GTC ATC GTC AAA TTC AAA GAT GGT GTA TCC AAA AAG GCA CAA192Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala Gln450 455 460GGT TCT GCT CTG AAC AAA GCG GAG GCA AAT GAA CAG AAA GCA TCA GCA240Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser Ala465 470 475AAA GAT CCA TTT CAG GTA TTG GAA GTA GCG GAC GTC GAT CAA GCT GTT288Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala Val480 485 490AAA GCA CTG GAA AAC AAT CCG AAT GTA GAA TAT GCT GAA CCA AAC TAT336Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn Tyr495 500 505ACC TTC CAA GCG ACT TGG TCA CCG AAT GAC CCT TAC TAT TCT GCT TAC384Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr510 515 520 525CAG TAT GGA CCA CAA AAC ACC TCA ACC CCT GCT GCC TGG GAT GTA ACC432Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr530 535 540CGT GGA AGC AGC ACT CAA ACG GTG GCG GTC CTT GAT TCC GGA GTG GAT480Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp545 550 555TAT AAC CAC CCT GAT CTT GCA AGA AAA GTA ATA AAA GGG TAC GAC TTT528Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe560 565 570ATC GAC AGG GAC AAT AAC CCA ATG GAT CTT AAC GGA CAT GGT ACC CAT576Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr His575 580 585GTT GCC GGT ACT GTT GCT GCT GAT ACG AAC AAT GGA ATT GGC GTA GCC624Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala590 595 600 605GGT ATG GCA CCA GAT ACG AAG ATC CTT GCC GTA CGG GTC CTT GAT GCC672Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala610 615 620AAT GGA AGT GGC TCA CTT GAC AGC ATT GCC TCA GGT ATC CGC TAT GCT720Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala625 630 635GCT GAT CAA GGG GCA AAG GTA CTC AAC CTC TCC CTT GGT TGC GAA TGC768Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys640 645 650AAC TCC ACA ACT CTT AAG AGT GCC GTC GAC TAT GCA TGG AAC AAA GGA816Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly655 660 665GCT GTA GTC GTT GCT GCT GCA GGG AAT GAC AAT GTA TCC CGT ACA TTC864Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe670 675 680 685CAA CCA GCT TCT TAC CCT AAT GCC ATT GCA GTA GGT GCC ATT GAC TCC912Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser690 695 700AAT GAT CGA AAA GCA TCA TTC TCC AAT TAC GGA ACG TGG GTG GAT GTC960Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val705 710 715ACT GCT CCA GGT GTG AAC ATA GCA TCA ACC GTT CCG AAT AAT GGC TAC 1008Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr720 725 730TCC TAC ATG TCT GGT ACG TCC ATG GCA TCC CCT CAC GTG GCC GGT TTG 1056Ser Tyr Met Ser Gly Thr Ser Met Ala Sar Pro His Val Ala Gly Leu735 740 745GCT GCT TTG TTG GCA AGT CAA GGT AAG AAT AAC GTA CAA ATC CGC CAG 1104Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln750 755 760 765GCC ATT GAG CAA ACC GCC GAT AAG ATC TCT GGC ACT GGA ACA AAC TTC 1152Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe770 775 780AAG TAT GGT AAA ATC AAC TCA AAC AAA GCT GTA AGA TAC 1191Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr785 790(2)SEQ ID NO4的信息(i)序列特征(A)長度397個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO4Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala1 5 10 15Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala Lys Glu Ala Pro Lys20 25 30Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys Gly Ala Phe Glu Ser35 40 45Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val Ser Lys Lys Ala Gln50 55 60Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu Gln Lys Ala Ser Ala65 70 75 80Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp Val Asp Gln Ala Val85 90 95Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr Ala Glu Pro Asn Tyr100 105 110Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr115 120 125Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr130 135 140Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp145 150 155 160Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe165 170 175Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn Gly His Gly Thr His180 185 190Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala195 200 205Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala210 215 220Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala225 230 235 240Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys245 250 255Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly260 265 270Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe275 280 285Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser290 295 300Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val305 310 315 320Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr325 330 335Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro His Val Ala Gly Leu340 345 350Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln355 360 365Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe370 375 380Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val Arg Tyr385 390 395(2)SEQ ID NO5的信息(i)序列特征(A)長度1110個堿基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ix)特征(A)名稱/關(guān)鍵詞CDS(B)定位1..1110(xi)序列描述SEQ ID NO5AAG GAA GCA CCG AAA CCG TTC CAA CCT ATC AAC AAA ACT TTG GAT AAA48Lys Glu Ala Pro Lys Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys400 405 410GGC GCT TTC GAA TCC GGT GAA GTC ATC GTC AAA TTC AAA GAT GGT GTA96Gly Ala Phe Glu Ser Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val415 420 425TCC AAA AAG GCA CAA GGT TCT GCT CTG AAC AAA GCG GAG GCA AAT GAA 144Ser Lys Lys Ala Gln Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu430 435 440 445CAG AAA GCA TCA GCA AAA GAT CCA TTT CAG GTA TTG GAA GTA GCG GAC 192Gln Lys Ala Ser Ala Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp450 455 460GTC GAT CAA GCT GTT AAA GCA CTG GAA AAC AAT CCG AAT GTA GAA TAT 240Val Asp Gln Ala Val Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr465 470 475GCT GAA CCA AAC TAT ACC TTC CAA GCG ACT TGG TCA CCG AAT GAC CCT 288Ala Glu Pro Asn Tyr Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro480 485 490TAC TAT TCT GCT TAC CAG TAT GGA CCA CAA AAC ACC TCA ACC CCT GCT 336Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala495 500 505GCC TGG GAT GTA ACC CGT GGA AGC AGC ACT CAA ACG GTG GCG GTC CTT 384Ala Trp Asp Val Thr Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu510 515 520 525GAT TCC GGA GTG GAT TAT AAC CAC CCT GAT CTT GCA AGA AAA GTA ATA 432Asp Ser Gly Val Asp Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile530 535 540AAA GGG TAC GAC TTT ATC GAC AGG GAC AAT AAC CCA ATG GAT CTT AAC 480Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn545 550 555GGA CAT GGT ACC CAT GTT GCC GGT ACT GTT GCT GCT GAT ACG AAC AAT 528Gly His Gly Thr His Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn560 565 570GGA ATT GGC GTA GCC GGT ATG GCA CCA GAT ACG AAG ATC CTT GCC GTA 576Gly Ile Gly Val Ala Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val575 580 585CGG GTC CTT GAT GCC AAT GGA AGT GGC TCA CTT GAC AGC ATT GCC TCA 624Arg Val Leu Asp Ala Asn Gly Sar Gly Ser Leu Asp Ser Ile Ala Ser590 595 600 605GGT ATC CGC TAT GCT GCT GAT CAA GGG GCA AAG GTA CTC AAC CTC TCC672Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser610 615 620CTT GGT TGC GAA TGC AAC TCC ACA ACT CTT AAG AGT GCC GTC GAC TAT720Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr625 630 635GCA TGG AAC AAA GGA GCT GTA GTC GTT GCT GCT GCA GGG AAT GAC AAT768Ala Trp Asn Lys Gly Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn640 645 650GTA TCC CGT ACA TTC CAA CCA GCT TCT TAC CCT AAT GCC ATT GCA GTA816Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val655 660 665GGT GCC ATT GAC TCC AAT GAT CGA AAA GCA TCA TTC TCC AAT TAC GGA864Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly670 675 680 685ACG TGG GTG GAT GTC ACT GCT CCA GGT GTG AAC ATA GCA TCA ACC GTT912Thr Trp Val Asp Val Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val690 695 700CCG AAT AAT GGC TAC TCC TAC ATG TCT GGT ACG TCC ATG GCA TCC CCT960Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro705 710 715CAC GTG GCC GGT TTG GCT GCT TTG TTG GCA AGT CAA GGT AAG AAT AAC 1008His Val Ala Gly Leu Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn720 725 730GTA CAA ATC CGC CAG GCC ATT GAG CAA ACC GCC GAT AAG ATC TCT GGC 1056Val Gln Ile Arg Gln Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly735 740 745ACT GGA ACA AAC TTC AAG TAT GGT AAA ATC AAC TCA AAC AAA GCT GTA 1104Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val750 755 760 765AGA TAC 1110Arg Tyr(2)SEQ ID NO6的信息(i)序列特征(A)長度370個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO6Lys Glu Ala Pro Lys Pro Phe Gln Pro Ile Asn Lys Thr Leu Asp Lys1 5 10 15Gly Ala Phe Glu Ser Gly Glu Val Ile Val Lys Phe Lys Asp Gly Val20 25 30Ser Lys Lys Ala Gln Gly Ser Ala Leu Asn Lys Ala Glu Ala Asn Glu35 40 45Gln Lys Ala Ser Ala Lys Asp Pro Phe Gln Val Leu Glu Val Ala Asp50 55 60Val Asp Gln Ala Val Lys Ala Leu Glu Asn Asn Pro Asn Val Glu Tyr65 70 75 80Ala Glu Pro Asn Tyr Thr Phe Gln Ala Thr Trp Ser Pro Asn Asp Pro85 90 95Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Gln Asn Thr Ser Thr Pro Ala100 105 110Ala Trp Asp Val Thr Arg Gly Ser Ser Thr Gln Thr Val Ala Val Leu115 120 125Asp Ser Gly Val Asp Tyr Asn His Pro Asp Leu Ala Arg Lys Val Ile130 135 140Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn Asn Pro Met Asp Leu Asn145 150 155 160Gly His Gly Thr His Val Ala Gly Thr Val Ala Ala Asp Thr Asn Asn165 170 175Gly Ile Gly Val Ala Gly Met Ala Pro Asp Thr Lys Ile Leu Ala Val180 185 190Arg Val Leu Asp Ala Asn Gly Ser Gly Ser Leu Asp Ser Ile Ala Ser195 200 205Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala Lys Val Leu Asn Leu Ser210 215 220Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu Lys Ser Ala Val Asp Tyr225 230 235 240Ala Trp Asn Lys Gly Ala Val Val Val Ala Ala Ala Gly Asn Asp Asn245 250 255Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr Pro Asn Ala Ile Ala Val260 265 270Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala Ser Phe Ser Asn Tyr Gly275 280 285Thr Trp Val Asp Val Thr Ala Pro Gly Val Asn Ile Ala Ser Thr Val290 295 300Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly Thr Ser Met Ala Ser Pro305 310 315 320His Val Ala Gly Leu Ala Ala Leu Leu Ala Ser Gln Gly Lys Asn Asn325 330 335Val Gln Ile Arg Gln Ala Ile Glu Gln Thr Ala Asp Lys Ile Ser Gly340 345 350Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile Asn Ser Asn Lys Ala Val355 360 365Arg Tyr370(2)SEQ ID NO7的信息(i)序列特征(A)長度840個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ix)特征(A)名稱/關(guān)鍵詞CDS(B)定位1..840(xi)序列描述SEQ ID NO7TGG TCA CCG AAT GAC CCT TAC TAT TCT GCT TAC CAG TAT GGA CCA CAA48Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Gln375 380 385AAC ACC TCA ACC CCT GCT GCC TGG GAT GTA ACC CGT GGA AGC AGC ACT96Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr Arg Gly Ser Ser Thr390 395 400CAA ACG GTG GCG GTC CTT GAT TCC GGA GTG GAT TAT AAC CAC CCT GAT 144Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp Tyr Asn His Pro Asp405 410 415CTT GCA AGA AAA GTA ATA AAA GGG TAC GAC TTT ATC GAC AGG GAC AAT 192Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn420 425 430AAC CCA ATG GAT CTT AAC GGA CAT GGT ACC CAT GTT GCC GGT ACT GTT 240Asn Pro Met Asp Leu Asn Gly His Gly Thr His Val Ala Gly Thr Val435 440 445 450GCT GCT GAT ACG AAC AAT GGA ATT GGC GTA GCC GGT ATG GCA CCA GAT 288Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala Gly Met Ala Pro Asp455 460 465ACG AAG ATC CTT GCC GTA CGG GTC CTT GAT GCC AAT GGA AGT GGC TCA336Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala Asn Gly Ser Gly Ser470 475 480CTT GAC AGC ATT GCC TCA GGT ATC CGC TAT GCT GCT GAT CAA GGG GCA384Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala485 490 495AAG GTA CTC AAC CTC TCC CTT GGT TGC GAA TGC AAC TCC ACA ACT CTT432Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu500 505 510AAG AGT GCC GTC GAC TAT GCA TGG AAC AAA GGA GCT GTA GTC GTT GCT480Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly Ala Val Val Val Ala515 520 525 530GCT GCA GGG AAT GAC AAT GTA TCC CGT ACA TTC CAA CCA GCT TCT TAC528Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr535 540 545CCT AAT GCC ATT GCA GTA GGT GCC ATT GAC TCC AAT GAT CGA AAA GCA576Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala550 555 560TCA TTC TCC AAT TAC GGA ACG TGG GTG GAT GTC ACT GCT CCA GGT GTG624Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val Thr Ala Pro Gly Val565 570 575AAC ATA GCA TCA ACC GTT CCG AAT AAT GGC TAC TCC TAC ATG TCT GGT672Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly580 585 590ACG TCC ATG GCA TCC CCT CAC GTG GCC GGT TTG GCT GCT TTG TTG GCA720Thr Ser Met Ala Ser Pro His Val Ala Gly Leu Ala Ala Leu Leu Ala595 600 605 610AGT CAA GGT AAG AAT AAC GTA CAA ATC CGC CAG GCC ATT GAG CAA ACC768Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln Ala Ile Glu Gln Thr615 620 625GCC GAT AAG ATC TCT GGC ACT GGA ACA AAC TTC AAG TAT GGT AAA ATC816Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile630 635 640AAC TCA AAC AAA GCT GTA AGA TAC840Asn Ser Asn Lys Ala Val Arg Tyr645 650(2)SEQ ID NO8的信息(i)序列特征(A)長度280個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO8Trp Ser Pro Asn Asp Pro Tyr Tyr Ser Ala Tyr Gln Tyr Gly Pro Glnl 5 10 15Asn Thr Ser Thr Pro Ala Ala Trp Asp Val Thr Arg Gly Ser Ser Thr20 25 30Gln Thr Val Ala Val Leu Asp Ser Gly Val Asp Tyr Asn His Pro Asp35 40 45Leu Ala Arg Lys Val Ile Lys Gly Tyr Asp Phe Ile Asp Arg Asp Asn50 55 60Asn Pro Met Asp Leu Asn Gly His Gly Thr His Val Ala Gly Thr Val65 70 75 80Ala Ala Asp Thr Asn Asn Gly Ile Gly Val Ala Gly Met Ala Pro Asp85 90 95Thr Lys Ile Leu Ala Val Arg Val Leu Asp Ala Asn Gly Ser Gly Ser100 105 110Leu Asp Ser Ile Ala Ser Gly Ile Arg Tyr Ala Ala Asp Gln Gly Ala115 120 125Lys Val Leu Asn Leu Ser Leu Gly Cys Glu Cys Asn Ser Thr Thr Leu130 135 140Lys Ser Ala Val Asp Tyr Ala Trp Asn Lys Gly Ala Val Val Val Ala145 150 155 160Ala Ala Gly Asn Asp Asn Val Ser Arg Thr Phe Gln Pro Ala Ser Tyr165 170 175Pro Asn Ala Ile Ala Val Gly Ala Ile Asp Ser Asn Asp Arg Lys Ala180 185 190Ser Phe Ser Asn Tyr Gly Thr Trp Val Asp Val Thr Ala Pro Gly Val195 200 205Asn Ile Ala Ser Thr Val Pro Asn Asn Gly Tyr Ser Tyr Met Ser Gly210 215 220Thr Ser Met Ala Ser Pro His Val Ala Gly Leu Ala Ala Leu Leu Ala225 230 235 240Ser Gln Gly Lys Asn Asn Val Gln Ile Arg Gln Ala Ile Glu Gln Thr245 250 255Ala Asp Lys Ile Ser Gly Thr Gly Thr Asn Phe Lys Tyr Gly Lys Ile260 265 270Asn Ser Asn Lys Ala Val Arg Tyr275 280(2)SEQ ID NO9的信息(i)序列特征(A)長度679個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO9AAGCTTAATC ATCCCGATGT ATCGCTTCAG CGCTTACCGT AGACGATTTT CTTTATAGTC 60TCGATGGATA AAAAGTACCT ATCTGAAATG GAAGCAATCG ACTCTCCTCC AGTAAAGGCT 120TCAAGGATCG ACGTGTTTCT CCGTTTAAGC GCTTCCCTTC CTCCTGACTT TGAGCCCCAG 180GCATTATACT CTTCTTTTCG CTTTGGGATA TAAATGGTTT GGCCTTGAAC ATAGTTTTGT 240AATTCTCTCA TTAAGTAATC AGGAATTTGA TTTACTGCTT TCAATCGTGT CAGCTCCTTA 300TCATTATTGG ATCAATAAGG GACAAAGCCG ACATATGAAT GGCGATTCAT CTAAAACTAC 360CACCCCATGC AAAGGATCGC CGAATCATAC AGGCTTTGCA TGAGATGCTG CAGATTTCGG 420AAAACGGATT TCCATATGAT CACCTCCTAG TATCAGTATA CTGATACTAG CAGAAAGATT 480TCCATAAGAA TTTCTTATAG TTACCATAAT ATTATTATAT AAACCTACTA TATTTGATTT 540TCAATTTGAG AAAATAAGTG ACCATTCACC TATCCTTAAA GTTGCTCAAC CCCATACAAT 600CATGAAACTT TTCATGCCAA ACGTTCATTA TGCGAAATCT ATCAAAAACT GAGAGTGAAT 660TCATTTTTTG ATAGAAAAT 679(2)SEQ ID NO10的信息(i)序列特征(A)長度81個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ix)特征(A)名稱/關(guān)鍵詞CDS(B)定位1..81(xi)序列描述SEQ ID NO10ATG AAG TTC AAA AAA ATA GCC GCT CTA TCC TTA GCA ACT TCC CTT GCT48Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala285 290 295TTA TTC CCT GCC TTC GGA GGT AGT TCA CTG GCC81Leu Phe Pro Ala Phe Gly Gly Ser Ser Leu Ala300 305(2)SEQ ID NO11的信息(i)序列特征(A)長度27個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO11Met Lys Phe Lys Lys Ile Ala Ala Leu Ser Leu Ala Thr Ser Leu Ala1 5 10 15Leu Phe Pro Ala Phe Gly Gly 5er Ser Leu Ala20 25(2)SEQ ID NO12的信息(i)序列特征(A)長度873個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ix)特征(A)名稱/關(guān)鍵詞CDS(B)定位1..873(xi)序列描述SEQ ID NO12ATG AGG AGC TCC CTT GTG CTG TTC TTT GTC TCT GCG TGG ACG GCC TTG48Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu30 35 40GCC AGT CCT ATT CGT CGA GAG GTC TCG CAG GAT CTG TTT AAC CAG TTC96Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe45 50 55AAT CTC TTT GCA CAG TAT TCT GCA GCC GCA TAC TGC GGA AAA AAC AAT 144Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn60 65 70 75GAT GCC CCA GCT GGT ACA AAC ATT ACG TGC ACG GGA AAT GCC TGC CCC 192Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro80 85 90GAG GTA GAG AAG GCG GAT GCA ACG TTT CTC TAC TCG TTT GAA GAC TCT 240Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser95 100 105GGA GTG GGC GAT GTC ACC GGC TTC CTT GCT CTC GAC AAC ACG AAC AAA 288Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys110 115 120TTG ATC GTC CTC TCT TTC CGT GGC TCT CGT TCC ATA GAG AAC TGG ATC 336Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile125 130 135GGG AAT CTT AAC TTC GAC TTG AAA GAA ATA AAT GAC ATT TGC TCC GGC 384Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly140 145 150 155TGC AGG GGA CAT GAC GGC TTC ACT TCG TCC TGG AGG TCT GTA GCC GAT 432Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp160 165 170ACG TTA AGG CAG AAG GTG GAG GAT GCT GTG AGG GAG CAT CCC GAC TAT 480Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr175 180 185CGC GTG GTG TTT ACC GGA CAT AGC TTG GGT GGT GCA TTG GCA ACT GTT528Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val190 195 200GCC GGA GCA GAC CTG CGT GGA AAT GGG TAT GAT ATC GAC GTG TTT TCA576Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser205 210 215TAT GGC GCC CCC CGA GTC GGA AAC AGG GCT TTT GCA GAA TTC CTG ACC624Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr220 225 230 235GTA CAG ACC GGC GGA ACA CTC TAC CGC ATT ACC CAC ACC AAT GAT ATT672Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile240245 250GTC CCT AGA CTC CCG CCG CGC GAA TTC GGT TAC AGC CAT TCT AGC CCA720Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro255 260 265GAG TAC TGG ATC AAA TCT GGA ACC CTT GTC CCC GTC ACC CGA AAC GAT768Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp270 275280ATC GTG AAG ATA GAA GGC ATC GAT GCC ACC GGC GGC AAT AAC CAG CCT816Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro285 290 295AAC ATT CCG GAT ATC CCT GCG CAC CTA TGG TAC TTC GGG TTA ATT GGG864Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly300 305 310 315ACA TGT CTT873Thr Cys Leu(2)SEQ ID NO13的信息(i)序列特征(A)長度291個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO13Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu1 5 10 15Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe20 25 30Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn35 40 45Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro50 55 60Glu Val Glu Lys Ala Asp Ala Thr phe Leu Tyr Ser Phe Glu Asp Ser65 70 76 80Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys85 90 95Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile100 105 110Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly115 120 125Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp130 135 140Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr145 150 155 160Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val165 170 175Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser180 185 190Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr195 200 205Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile210 215 220Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro225 230 235 240Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp245 250 255Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro260 265 270Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly275 280 285Thr Cys Leu290(2)SEQ ID NO14的信息(i)序列特征(A)長度9個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO14Ala Tyr Gln Tyr Gly Pro Gln Asn Thr15(2)SEQ ID NO15的信息(i)序列特征(A)長度12個氨基酸(B)類型氨基酸
(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO15Tyr Asp Phe Ile Asp Tyr Asp Asn Asn Pro Met Asp15 10(2)SEQ ID NO16的信息(i)序列特征(A)長度18個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO16GCTACATAGG CCCAAAAC 18(2)SEQ ID NO17的信息(i)序列特征(A)長度25個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO17TCCATGGTTT TTCTATCATA ATCTA 25(2)SEQ ID NO18的信息(i)序列特征(A)長度628個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性
(xi)序列描述SEQ ID NO18GAATTCGGCT TAAGGCATGC GTCCTTCTTT GTGCTTGGAA GCAGAGCCCA ATATTATCCC 60GAAACGATAA AACGGATGCT GAAGGAAGGA AACGAAGTCG GCAACCATTC CTGGGACCAT 120CCGTTATTGA CAAGGCTGTC AAACGAAAAA GCGTATCAGG AGATTAACGA CACGCAAGAA 180ATGATCGAAA AAATCAGCGG ACACCTGCCT GTACACTTGC GTCCTCCATA CGGCGGGATC 240AATGATTCCG TCCGCTCGCT TTCCAATCTG AAGGTTTCAT TGTGGGATGT TGATCCGGAA 300GATTGGAAGT ACAAAAATAA GCAAAAGATT GTCAATCATG TCATGAGCCA TGCGGGAGAC 360GGAAAAATCG TCTTAATGCA CGATATTTAT GCAACGTTCG CAGATGCTGC TGAAGAGATT 420ATTAAAAAGC TGAAAGCAAA AGGCTATCAA TTGGTAACTG TATCTCAGCT TGAAGAAGTG 480AAGAAGCAGA GAGGCTATTG AATAAATGAG TAGAAAGCGC CATATCGGCG CTTTTCTTTT 540GGAAGAAAAT ATAGGGAAAA TGGTACTTGT TAAAAATTCG GAATATTTAT ACAATATCAT 600ATGTTACACA TTGAAAGAAG CCGAATTC628(2)SEQ ID NO19的信息(i)序列特征(A)長度16個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO19AAGGCATGCG TCCTTC16(2)SEQ ID NO20的信息(i)序列特征(A)長度18個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO20CTTTCAATGT GTAACATA 18(2)SEQ ID NO21的信息
(i)序列特征(A)長度1514個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO21GAATTCGGCT TGAGACCCGG GAGCTTTCAG TGAAGTACGT GATTATACGG AGATGAAAAT 60TCGTACACTG TTAACGAGAA GGAAACGCCG ACGAAAGCGT AGCATCGGAT GGCAAAGATG 120GAGTAACGAA TATCTCTACG GTGTACTGGG GCTTTACTGA GACTAGAAAG TCCTTCCCTT 180GAAAAGTGCA GAGAGTTTTC GATAAAAGTG TCAGCCATTT GATAAGTCTC ATTCTCATAA 240CCTATTGATG AAGTTTATAG GGAAGCTGCT TGAGAGGGAA AACCTCACGA ACAGTTCTTA 300TGGGGAGAGA CTGGAAACAG GTCACAATTG ATACCTCGCT AATCTTTTAA CCGACAAAGT 360TTTTTTAAAC CGTGGAAGTC ATAATAACCT GGATATTGTG AATTTATAAA AGTTAACAAA 420TGGTTTATAT TAAGACAGTC ATAAACCAAA GATTTTTCTT CTAAAGCTAC GATAGCAAAA 480ATTTCACTAG AAATTAGTTA TACAAGCATT TTGTAAGAAT TATTAAAAAG ATAAATCCTG 540CTATTACGAG ATTAGTAGGA TGATATTGTG AAAAATTTTT TATCTATTCG ATTTAAAATA 600TTTATGAATT TTACATAAAC CTCATAAGAA AAAATACTAT CTATACTATT TTAAGAAATT 660TATTAGAATA AGCGGATTCA AAATAGCCCT GGCCATAAAA GTACCTCAGC AGTAGAAGTT 720TTGACCAAAA TTAAAAAAAT ACCCAATCAA GAGAATATTC TTAATTACAA TACGTTTTGC 780GAGGAACATA TTGATTGAAA TTTAATAAAT TTAGTCCTAA AATTTAAAGA AATTTAAGTT 840TTTCATATTT TTATGAACTA ACAAGAATAA AAATTGTGTT TATTTATTAT TCTTGTTAAA 900TATTTGATAA AGAGATATAT TTTTGGTCGA AACGTAAGAT GAAACCTTAG ATAAAAGTGC 960TTTTTTTGTT GCAATTGAAG AATTATTAAT GTTAAGCTTA ATTAAAGATA ATATCTTTGA1020ATTGTAACGC CCCTCAAAAG TAAGAACTAC AAAAAAAGAA TACGTTATAT AGAAATATGT1080TTGAACCTTC TTCAGATTAC AAATATATTC GGACGGACTC TACCTCAAAT GCTTATCTAA1140CTATAGAATG ACATACAAGC ACAACCTTGA AAATTTGAAA ATATAACTAC CAATGAACTT1200GTTCATGTGA ATTATCGCTG TATTTAATTT TCTCAATTCA ATATATAATA TGCCAATACA1260TTGTTACAAG TAGAAATTAA GACACCCTTG ATAGCCTTAC TATACCTAAC ATGATGTAGT1320ATTAAATGAA TATGTAAATA TATTTATGAT AAGAAGCGAC TTATTTATAA TCATTACATA1380TTTTTCTATT GGAATGATTA AGATTCCAAT AGAATAGTGT ATAAATTATT TATCTTGAAA1440GGAGGGATGC CTAAAAACGA AGAACATTAA AAACATATAT TTGCACCGTC TAATGGATTT1500ATGAAGCCGA ATTC 1514(2)SEQ ID NO22的信息(i)序列特征
(A)長度30個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO22GAGACCCGGG AGCTTTCAGT GAAGTACGTG 30(2)SEQ ID NO23的信息(i)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO23CATAAATCCA TTAGACGGTG C 21(2)SEQ ID NO24的信息(i)序列特征(A)長度162個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO24ATCGATTGTT TGAGAAAAGA AGAAGACCAT AAAAATACCT TGTCTGTCAT CAGACAGGGT 60ATTTTTTATG CTGTCCAGAC TGTCCGCTGT GTAAAAATAA GGAATAAAGG GGGGTTGTTA120TTATTTTACT GATATGTAAA ATATAATTTG TATAAGAAAA TG 162(2)SEQ ID NO25的信息(i)序列特征(A)長度29個堿基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO25GCATGCAATC GATTGTTTGA GAAAAGAAG29(2)SEQ ID NO26的信息(i)序列特征(A)長度34個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO26CATTTTCTTA TACAAATTAT ATTTTACATA TCAG 34(2)SEQ ID NO27的信息(i)序列特征(A)長度2017個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(xi)序列描述SEQ ID NO27TGCGAAATCT ATCAAAAACT GAGAGTGAAT TCATTTTTTG ATAGAAAATT AAAACTATTC 60AATATTTTGT CACAACCTGC TAGAATCCTA GGTAATAAGG GTCCCCTACA TATCTATCAT 120TCATCACAAT GACCTTTGTT CATCTTGAAT TCTGAAGGGA GGATCGACCT GCTAATTTGT 180CGTAAAAAAA TAGAAAATGG AGGAATGCTT TTATGAAGTT CAAAAAAATA GCCGCTGTAT 240CCTTAGCAAC TTCCCTTGCT TTATTCCCTG CCTTCGGAGG TAGTTCACTG GCCAAGGAAG 300CACCGAAACC GTTCCAACCT ATCAACAAAA CTTTGGATAA AGGCGCTTTC GAATCCGGTG 360AAGTCATCGT CAATTCAAAG ATGGTGTATC CAAAAAGGCA CAAGGTTCTG CTCTGAACAA 420AGCGGAGGCA AATGAACAGA AAGCATCAGC AAAAGATCCA TTTCAGGTAT TGGAAGTAGC 480GGACGTCGAT CAAGCTGTTA AAGCACTGGA AAACAATCCG AATGTAGAAT ATGCTGAACC 540AAACTATACC TTCCAAGCGA CTTGGTCACC GAATGACCCT TACTATTCTG CTTACCAGTA 600TGGACCACAA AACACCTCAA CCCCTGCTGC CTGGGATGTA ACCCGTGGAA GCAGCACTCA 660AACGGTGGCG GTCCTTGATT CCGGAGTGGA TTATAACCAC CCTGATCTTG CAAGAAAAGT 720AATAAAAGGG TACGACTTTA TCGACAGGGA CAATAACCCA ATGGATCTTA ACGGACATGG 780TACCCATGTT GCCGGTACTG TTGCTGCTGA TACGAACAAT GGAATTGGCG TAGCCGGTAT 840GGCACCAGAT ACGAAGATCC TTGCCGTACG GGTCCTTGAT GCCAATGGAA GTGGCTCACT 900TGACAGCATT GCCTCAGGTA TCCGCTATGC TGCTGATCAA GGGGCAAAGG TACTCAACCT 960CTCCCTTGGT TGCGAATGCA ACTCCACAAC TCTTAAGAGT GCCGTCGACT ATGCATGGAA 1020CAAAGGAGCT GTAGTCGTTG CTGCTGCAGG GAATGACAAT GTATCCCGTA CATTCCAACC 1080AGCTTCTTAC CCTAATGCCA TTGCAGTAGG TGCCATTGAC TCCAATGATC GAAAAGCATC 1140ATTCTCCAAT TACGGAACGT GGGTGGATGT CACTGCTCCA GGTGTGAACG AGGTTACTAG 1200CTTTTCGTAG TAAGAGGTTA ATGCCTTGCA CCCACCTACA GTGACGAGGT CCACACTTGA 1260TAGCATCAAC CGTTCCGAAT AATGGCTACT CCTACATGTC TGGTACGTCC ATGGCATCCC 1320CTCACGTGGC CGGTTTGGCT GCTTTGTTGG CAAGTCAAGG TAAGAATAAC GTACAAATCC 1380GCCAGGCCAT TGAGCAAACC GCCGATAAGA TCTCTGGCAC TGGAACAAAC TTCAAGTATG 1440GTAAAATCAA CTCAAACAAA GCTGTAAGAT ACTAATAGAT AAAACAAGAG CACACCGTGA 1500ATGGTGGGCT CTTTCATTAT GTTCACTACT GTTTTACGAT CTGGCCGTTT TGGTTCAGGT 1560AAACACTCTG GATGATGGTT CTATTAAACG GTTTCCCTTT ATAATCAGAC TTAATATCCG 1620TTGTCAGGTT GTAGGTTCCT TCTCCTCCAT TGAACACTGT ACCACTCCCC TTGACAGACA 168CATTATAGGCA ACAGTCCAAC ATCCAAGGAA GAGGAGGTAA CTTGTGACAT GGTGAGGGGA 1740ACTGTCTGTG GGACAAAGGT TTCCCCTTAG GGTAGAACTC AAACTTGTGT GCTCGGTGAA 1800CCCACTGACG ATACTTGACC CTGTTTCCAA AGGGGAATCC CATCTTGAGT TTGTAACACA 1860CGAGCCACTT GGGTGACTGC TATGAACTAA CTTGCGACTG AGGGAAAGAG TCACCAGCGT 1920GGTGGTTCAG TAGTAAGTTA CCTGAACACT TTGGTTCATT CAGTTTTGCC CCCAGGTTCT 1980GGGAAAAAGG ATGAACTTCC ACTTCGGCCC TTTTTTT 201權(quán)利要求
1.一種核酸構(gòu)建體,該核酸構(gòu)建體包含編碼蛋白酶的核酸序列,所說的蛋白酶具有下列性質(zhì)(a)通過SDS-PAGE測定的大約34kD的分子量;(b)大約9.3的pI;(c)在約25℃下以酪蛋白為底物時,pH最佳范圍約為pH9-11;(d)在pH約為9.5而且以酪蛋白為底物時,最佳溫度范圍約為40-55℃;(e)可從Bacillus sp.Group I獲得。
2.權(quán)利要求1的核酸構(gòu)建體,其中所說的蛋白酶可以從Bacillus sp.,PD498獲得。
3.一種核酸構(gòu)建體,該核酸構(gòu)建體包含編碼具有如可以從Bacillussp.,PD498獲得的蛋白酶的基本上所有的免疫化學(xué)性質(zhì)的核酸序列,其中所說的蛋白酶具有下列性質(zhì)(a)通過SDS-PAGE測定的大約34kD的分子量;(b)大約9.3的pI;(c)在約25℃下以酪蛋白為底物時,pH最佳范圍約為pH9-11;(d)在pH約為9.5而且以酪蛋白為底物時,最佳溫度范圍約為40-55℃。
4.一種核酸構(gòu)建體,該核酸構(gòu)建體包含編碼具有SEQ ID NO1中所描述的氨基酸序列的蛋白酶的核酸序列。
5.一種核酸構(gòu)建體,該核酸構(gòu)建體包含編碼具有SEQ ID NO2中所描述的氨基酸序列的蛋白酶的核酸序列。
6.一種核酸構(gòu)建體,該核酸構(gòu)建體包含編碼具有SEQ ID NO3中所描述的氨基酸序列的蛋白酶的核酸序列。
7.一種核酸構(gòu)建體,該核酸構(gòu)建體包含在SEQ ID NO4中所描述的核酸序列。
8.權(quán)利要求4的核酸構(gòu)建體,其中所說的蛋白酶由在SEQ ID NO5中描述的核酸序列編碼。
9.權(quán)利要求5的核酸構(gòu)建體,其中所說的蛋白酶由在SEQ ID NO6中描述的核酸序列編碼。
10.權(quán)利要求5的核酸構(gòu)建體,其中所說的蛋白酶由在SEQ ID NO7中描述的核酸序列編碼。
11.一種重組宿主細胞,該重組宿主細胞包含權(quán)利要求1的核酸構(gòu)建體。
12.包含權(quán)利要求4的核酸構(gòu)建體的所說的重組宿主細胞。
13.包含權(quán)利要求5的核酸構(gòu)建體的所說的重組宿主細胞。
14.包含權(quán)利要求6的核酸構(gòu)建體的所說的重組宿主細胞。
15.包含權(quán)利要求7的核酸構(gòu)建體的所說的重組宿主細胞。
16.一種重組載體,該重組載體包含(a)權(quán)利要求1的核酸構(gòu)建體;(b)一種可操作地連接到(a)的核酸序列上的啟動子序列;(c)一種可選擇的標記。
17.一種重組載體,該重組載體包含(a)權(quán)利要求4的核酸構(gòu)建體;(b)一種可操作地連接到(a)的核酸序列上的啟動子序列;(c)一種可選擇的標記。
18.一種重組載體,該重組載體包含(a)權(quán)利要求5的核酸構(gòu)建體;(b)一種可操作地連接到(a)的核酸序列上的啟動子序列;(c)一種可選擇的標記。
19.一種重組載體,該重組載體包含(a)權(quán)利要求6的核酸構(gòu)建體;(b)一種可操作地連接到(a)的核酸序列上的啟動子序列;(c)一種可選擇的標記。
20.一種重組載體,該重組載體包含(a)權(quán)利要求7的核酸構(gòu)建體;(b)一種可操作地連接到(a)的核酸序列上的啟動子序列;(c)一種可選擇的標記。
21.權(quán)利要求16的重組載體,其中所說的啟動子序列選自由cryIIIA啟動子、地衣芽孢桿菌(Bacillus licheniformis)α-淀粉酶啟動子、解淀粉芽孢桿菌(Bacillus amyloliquifaciens)α-淀粉酶啟動子以及源于具有在SEQ ID NO8中顯示的核酸序列的并編碼芽孢桿菌屬堿性蛋白酶的基因的啟動子序列組成的組。
22.權(quán)利要求16的重組載體,其中所說的載體還包含信號序列。
23.權(quán)利要求22的重組載體,其中所說的信號序列選自由地衣芽孢桿菌α-淀粉酶啟動子、解淀粉芽孢桿菌α-淀粉酶啟動子以及源于具有在SEQID NO4中顯示的核酸序列的并編碼芽孢桿菌屬堿性蛋白酶的基因的信號序列組成的組。
24.一種獲得具有下列性質(zhì)的蛋白酶的方法(i)通過SDS-PAGE測定的大約34kD的分子量;(ii)大約9.3的pI;(iii)在約25℃下以酪蛋白為底物時,pH最佳范圍約為pH9-11;(iv)在pH約為9.5而且以酪蛋白為底物時,最佳溫度范圍約為40-55℃;(v)可以從Bacillus sp.Group I獲得該方法包括在有益于蛋白酶表達的條件下培養(yǎng)權(quán)利要求中的重組宿主細胞并從培養(yǎng)物中回收蛋白酶。
25.一種啟動子序列或其片段,該啟動子序列源于編碼具有下列性質(zhì)的蛋白酶的基因(i)通過SDS-PAGE測定的大約34kD的分子量;(ii)大約9.3的pI;(iii)在約25℃下以酪蛋白為底物時,pH最佳范圍約為pH9-11;(iv)在pH約為9.5而且以酪蛋白為底物時,最佳溫度范圍約為40-55℃;(v)可以從Bacillus sp.Group I獲得,所說片段具有與所說的啟動子序列基本上相同的啟動子活性,其中所說的啟動子具有SEQ IDNO8中所顯示的序列。
26.一種載體,該載體包含權(quán)利要求25的啟動子序列和把異源DNA序列插入所說的載體中的位點。
27.權(quán)利要求26的載體,其中所說的載體還包含編碼異源多肽的DNA序列。
28.一種在細菌細胞中產(chǎn)生異源多肽的方法,該方法包括(a)用權(quán)利要求26的載體轉(zhuǎn)化所說的細胞;(b)培養(yǎng)步驟(a)轉(zhuǎn)化的細胞;(c)從步驟(b)轉(zhuǎn)化的細胞回收所說的異源多肽。
29.一種信號序列或其片段,該信號序列源于編碼具有下列性質(zhì)的蛋白酶的基因(i)通過SDS-PAGE測定的大約34kD的分子量;(ii)大約9.3的pI;(iii)在約25℃下以酪蛋白為底物時,pH最佳范圍約為pH9-11;(iv)在pH約為9.5而且以酪蛋白為底物時,最佳溫度范圍約為40-55℃;(v)可以從Bacillus sp.GroupI獲得,所說片段具有與所說的序列基本上相同的信號活性,其中所說的信號序列具有SEQ ID NO9中所顯示的氨基酸序列。
30.權(quán)利要求29的信號序列,其中所說的信號序列由SEQ ID NO10中所描述的核酸序列編碼。
31.一種載體,該載體包含(a)權(quán)利要求29的信號序列;(b)在所說的信號序列上游的啟動子序列、核糖體結(jié)合位點序列,所說的信號序列的轉(zhuǎn)錄在所說的啟動子序列控制下;(c)在所說的信號序列下游的把異源DNA序列插入所說的載體中的位點,所說的位點和所說的信號序列在相同的讀框中。
32.權(quán)利要求29的載體,其中所說的載體還包含編碼異源多肽的DNA序列。
33.一種在細菌細胞中產(chǎn)生異源多肽的方法,該方法包括(a)用權(quán)利要求31的載體轉(zhuǎn)化所說的細胞;(b)培養(yǎng)步驟(a)轉(zhuǎn)化的細胞;(c)從步驟(b)轉(zhuǎn)化的細胞回收所說的異源多肽。
全文摘要
本發(fā)明涉及分離的核酸構(gòu)建體以及包含這些構(gòu)建體的重組載體和宿主細胞,所說構(gòu)建體包含編碼具有大約34kD分子量的堿性蛋白酶并且可以從Bacillus sp.Group I菌株獲得的核酸序列。本發(fā)明還涉及獲得所述蛋白酶的方法。本發(fā)明也涉及源于所說的堿性蛋白酶的啟動子和信號序列以及利用所述啟動子與信號序列在細菌中表達編碼異源蛋白質(zhì)的異源核酸序列的方法。
文檔編號C12P21/00GK1187218SQ96194496
公開日1998年7月8日 申請日期1996年5月1日 優(yōu)先權(quán)日1996年5月1日
發(fā)明者A·P·司羅馬, H·奧特拉普, C·達姆伯曼, D·A·阿思靈 申請人:諾沃諾爾迪斯克生物技術(shù)有限公司