專利名稱:弱氧化葡糖桿菌山梨糖醇脫氫酶、基因及其使用方法
背景技術(shù):
發(fā)明領(lǐng)域本發(fā)明涉及分子生物學(xué)、細菌學(xué)和工業(yè)發(fā)酵領(lǐng)域。更明確地說,本發(fā)明涉及對弱氧化葡糖桿菌(Gluconobacter suboxydans)中一個新的膜結(jié)合山梨糖醇脫氫酶之亞基的核酸序列和蛋白質(zhì)的鑒定和分離。本發(fā)明進一步涉及從D-山梨糖醇發(fā)酵產(chǎn)生L-山梨糖以及隨后2-酮-L-古洛糖酸的產(chǎn)生。
相關(guān)領(lǐng)域山梨糖醇脫氫酶(SDH)是一種酶,在生產(chǎn)2-酮-L-古洛糖酸(2-KLG)(合成維生素C的一個重要前體)的過程中,其負責(zé)在山梨糖發(fā)酵期間將D-山梨糖醇有效轉(zhuǎn)化為L-山梨糖。葡糖桿菌屬(Gluconobacter)具有數(shù)種SDH,根據(jù)它們對輔因子的需要可分類為(1)NAD-依賴的,(2)NADP-依賴的,以及(3)NAD(P)-不依賴的類型。其中,在工業(yè)的山梨糖發(fā)酵期間,認為NAD(P)-不依賴的酶直接參與山梨糖的有效產(chǎn)生(Cummins,J.T.等人,生物化學(xué)雜志(J.Biol.Chem),224,323;226,301(1957))。
從D-山梨糖醇生產(chǎn)L-山梨糖的方法一般通過發(fā)酵醋酸細菌(如弱氧化葡糖桿菌和木醋桿菌(Acetobacter xylinum))進行。室溫條件下,24小時內(nèi)可進行96-99%的轉(zhuǎn)化(Liebster,J.等人,化學(xué)雜志(Chem.List.),50395(1956))。
通過SDH作用產(chǎn)生的L-山梨糖是產(chǎn)生2-酮-L-古洛糖酸(2-KLG)的一個底物。產(chǎn)生2-KLG的許多方法是公知的。例如,對廣泛品種的細菌通過氧化L-山梨糖經(jīng)過山梨酮(sorbosone)中間產(chǎn)物至2-KLG而發(fā)酵產(chǎn)生2-KLG的方法進行了描述,其中細菌為氧化葡糖桿菌(美國專利Nos.4,935,359;4,960,695;5,312,741;和5,541,108);Pseudogluconobactersaccharoketogenes(美國專利No.4,877,735;歐洲專利No.221 707);Pseudomonas sorbosoxidans(美國專利Nos.4,933,289和4,892,823);上述菌與其它屬(如醋桿菌屬(Acetobacter)、芽胞桿菌屬(Bacillus)、沙雷氏菌屬(Serratia)、分支桿菌屬(Mycobacterium)和鏈霉菌屬(Streptomyces)(美國專利Nos.3,912,592;3,907,639;和3,234,105))的微生物混合物;以及新的菌株(美國專利No.5,834,231)。
文獻中已鑒定了一些參與山梨糖醇、山梨糖和山梨酮發(fā)酵氧化的酶。美國專利Nos.5,88,786;5,861,292;5,834,263和5,753,481公開了編碼L-山梨糖脫氫酶和L-山梨酮脫氫酶的核酸分子和/或者分離的蛋白質(zhì);并且美國專利No.5,747,301公開了一種具山梨糖醇脫氫酶特性的酶。
除了基于對輔因子的需要而區(qū)分葡糖桿菌屬SDH外,在文獻中也可找到其它的物理特性來區(qū)分這些不同的酶。例如在美國專利No.5,747,301中所鑒定的山梨糖醇脫氫酶是基于其亞細胞定位(膜結(jié)合的)和800±50KDa的haloenzyme分子量(79±5KDa的10個同源亞基)而區(qū)分的。由Shinagawa等人分離的膜結(jié)合D-山梨糖醇脫氫酶(E.Shinagawa,K.Matsushita,O.Adachi和M.Ameyama(農(nóng)業(yè)與生物化學(xué)(Agric.Biol.Chem.),46,135-141,1982))由三種亞基組成,其分子量為63,000、51,000和17,000。
在致力于提高產(chǎn)生2-KLG商業(yè)發(fā)酵的產(chǎn)量時,發(fā)明者在一株弱氧化葡糖桿菌中,鑒定了一種新的膜結(jié)合山梨糖醇脫氫酶,其不同于文獻中描述的其它山梨糖醇脫氫酶(Choi,E.C.等人,歐洲微生物學(xué)會聯(lián)合會微生物學(xué)快報(FEMS Microbiol.Lett.),125;45(1995))。
發(fā)明概述本發(fā)明涉及弱氧化葡糖桿菌的一種新的膜結(jié)合山梨糖醇脫氫酶。所分離的山梨糖脫氫酶包含三個亞基75kDa的第一個亞基,其包含作為輔因子的吡咯并喹啉醌(PQQ);50kDa的第二個亞基,其為細胞色素c;以及29kDa的第三個亞基,其在酶的穩(wěn)定性和催化活性方面起著重要作用。
本發(fā)明提供了此處描述的葡糖桿菌屬山梨糖醇脫氫酶的三個蛋白質(zhì)亞基的核酸分子。在第一個具體的實施方案中,本發(fā)明提供了一種分離的核酸分子,其涉及如SEQ ID NO1所示的第一個SDH亞基(75kDa)。在第二個具體的實施方案中,本發(fā)明提供了一種分離的核酸分子,其涉及如SEQ ID NO2所示的第二個SDH亞基(50kDa)。在第三個具體的實施方案中,本發(fā)明提供了一種分離的核酸分子,其涉及如SEQ ID NO3所示的第三個SDH亞基(29kDa)。其它相關(guān)的實施方案涉及載體、其產(chǎn)生方法及攜帶該載體的宿主細胞。
本發(fā)明也提供了分離的核酸分子,其編碼本發(fā)明之SDH的三個亞基。在一個具體的實施方案中,本發(fā)明提供了一個克隆的核酸分子,其編碼75kDa和50kDa亞基。山梨糖醇脫氫酶第一個及第二個亞基的結(jié)構(gòu)基因分別為2,265bp和1,437bp長,它們聚集在該克隆的核酸分子中,其中該克隆的核酸分子為顯示操縱子特性的5.7kb PstI DNA片段。在另一個具體的實施方案中,本發(fā)明提供了一個克隆的核酸分子,其編碼第三個(29kDa)SDH亞基之蛋白質(zhì)。編碼第三個亞基的結(jié)構(gòu)基因為921bp長,且存在于4.5kb ClaI DNA片段中。其它相關(guān)的實施方案涉及載體、其產(chǎn)生方法及攜帶該載體的宿主細胞。
本發(fā)明也涉及此處描述的SDH之三個亞基的分離多肽。
本發(fā)明也提供了產(chǎn)生D-山梨糖的方法,其包括(a)用至少一種分離的核酸序列轉(zhuǎn)化宿主細胞,其中分離的核酸序列選自包含SEQ ID NO1多核苷酸序列的多核苷酸;包含SEQ ID NO2多核苷酸序列的多核苷酸;以及包含SEQ ID NO3多核苷酸序列的多核苷酸;以及(b)選擇并增殖該轉(zhuǎn)化的宿主細胞。
本發(fā)明的另一個方面涉及產(chǎn)生2-KLG的方法,其包括(a)用至少一種分離的核酸序列轉(zhuǎn)化宿主細胞,其中分離的核酸序列選自包含SEQ IDNO1多核苷酸序列的多核苷酸;包含SEQ ID NO2多核苷酸序列的多核苷酸;以及包含SEQ ID NO3多核苷酸序列的多核苷酸;以及(b)選擇并增殖該轉(zhuǎn)化的宿主細胞。
附圖簡述
圖1表示使用pH5.0(A)和PH6.0(B)醋酸鈉緩沖液的DEAE-TSK柱層析。
圖2表示對DEAE-TSK柱層析法分離的峰I級分(A)和峰II級分(B)的SDS-PAGE分析。
圖3表示使用pH6.5磷酸鈉緩沖液的DEAE-TSK柱層析。
圖4表示在pH6.5時用DEAE-TSK柱分離的峰I(列1),峰II(列3)以及峰III(列2)柱級分的SDS-PAGE分析。列M表示分子量標準標記。
圖5表示用胰蛋白酶消化峰II蛋白質(zhì)后的HPLC層析譜,其中峰II蛋白質(zhì)來自pH6.5時的DEAE-TSK柱層析。虛線代表流動相中乙腈的濃度梯度。
圖6表示λGEM5-1的限制性酶切圖譜。用作探針的1.53kb DNA片段(#SDH2-1)用實心條顯示。
圖7表示λGEM5-1中5.7kb PstI片段用不同組的限制性酶切后產(chǎn)生的S1、S2和S3 DNA片段的定位。
圖8表示5.7kb PstI片段中的4,830個堿基的核苷酸序列(SEQ IDNO7)。第一個和第二個亞基推斷的氨基酸序列顯示在核苷酸序列下。通過對純化的山梨糖醇脫氫酶N-末端氨基酸測序而獲得的氨基酸序列用下劃線表示。信號序列切割位點用三角形標記。血紅素結(jié)合序列用虛的下劃線表示。潛在的核糖體結(jié)合序列(SD)封閉在框中。轉(zhuǎn)錄終止莖-環(huán)結(jié)構(gòu)用箭頭表示。第一個亞基基因完整的編碼序列位于665-2,929處(SEQ IDNO1),其中信號序列位于665-766,且編碼SDH第一個亞基成熟蛋白質(zhì)的序列位于767-2,929(SEQ ID NO22)。第二個亞基基因完整的編碼序列位于2,964-4,400處(SEQ ID NO2),其中信號序列位于2,964-3,071,且編碼SDH第二個亞基成熟蛋白質(zhì)的序列位于3,072-4,400(SEQ IDNO23)。
圖9表示ClaI-#69的限制性酶切圖譜。封閉框表示山梨糖醇脫氫酶第三個亞基基因的編碼區(qū)。
圖10表示包括山梨糖醇脫氫酶第三個亞基基因的DNA片段之核苷酸序列(SEQ ID NO8)。推斷的氨基酸序列顯示在核苷酸序列下,信號序列切割位點用三角形標記。潛在的核糖體結(jié)合序列(SD)封閉在框中。第三個亞基基因完整的編碼序列位于1,384-2,304處(SEQ ID NO3),其中信號序列位于1,384-1,461,且編碼SDH第三個亞基成熟蛋白質(zhì)的序列位于1,462-2,304(SEQ ID NO24)。
優(yōu)選的實施方案詳述1、定義克隆載體質(zhì)?;蚴删wDNA或其它DNA序列,其可在宿主細胞中自主復(fù)制,并且其通過一個或少量幾個限制性內(nèi)切酶識別位點表征,在上述識別位點處,DNA序列以可決定的方式被切割但不丟失載體所必需的生物功能,并且可將DNA片段插入其中,引起該DNA片段的復(fù)制和克隆。該克隆載體可進一步包含標記,其適用于對克隆載體所轉(zhuǎn)化之細胞的鑒定。標記例如,可提供四環(huán)素抗性或氨芐青霉素抗性。
表達表達是從結(jié)構(gòu)基因產(chǎn)生多肽的過程。該過程包括將基因轉(zhuǎn)錄為mRNA和將此mRNA翻譯為多肽。
表達載體類似于克隆載體的載體,但其在轉(zhuǎn)化進宿主后可增強克隆于其中的基因的表達。克隆的基因通常置于(即有效連接于)某些控制序列(如啟動子序列)的控制之下。啟動子序列可為組成型的或可誘導(dǎo)型的。
基因一段DNA序列,其包含表達蛋白質(zhì)或多肽所需的信息。
宿主任一原核或真核細胞,其為可復(fù)制的表達載體或克隆載體的接納體。此處所用術(shù)語“宿主”也包括用公知的基因工程技術(shù)設(shè)計的原核或真核細胞,在其染色體或基因組上含有目標基因。此類宿主實例見Sambrook等人,分子克隆實驗室手冊,第二版(Molecular CloningA Laboratory Manual,Second Edition),冷泉港實驗室,冷泉港,紐約(1989)。
同源的/非同源的如果兩個核酸分子的核苷酸序列相似性高于50%,則認為它們是“同源的”,這一點可通過HASH-編碼算法確定(Wilber,W.J.和Lipman,D.J.,美國國家科學(xué)院院報(Proc.Natl.Acad.Sci.),80726-730(1983))。如果兩個核酸分子的核苷酸序列相似性低于50%,則認為它們是“非同源的”。
突變?nèi)绱颂幩茫撔g(shù)語指目標核苷酸序列中單一堿基對的改變、插入、或刪除。
誘變?nèi)绱颂幩?,該術(shù)語指在DNA中產(chǎn)生突變的過程。對于“隨機”誘變,突變的確切位點是不可預(yù)測的,其可發(fā)生在微生物染色體的任一處,并且突變的發(fā)生是由試劑(如放射性)引起的物理損傷或化學(xué)處理的結(jié)果。
操縱子如此處所用,該術(shù)語指細菌基因表達和調(diào)節(jié)的單位,包括DNA中的結(jié)構(gòu)基因和調(diào)節(jié)元件。
親代菌株如此處所用,該術(shù)語指一株微生物菌株,其易于受到一些形式的誘變而產(chǎn)生本發(fā)明的微生物。
表型如此處所用,該術(shù)語指依賴于微生物的遺傳組成的、可觀察到的物理特征。
啟動子一段DNA序列,其通常描述為基因的5’區(qū),位于起始密碼子鄰近處。毗連基因的轉(zhuǎn)錄起始于啟動子區(qū)。如果啟動子是可誘導(dǎo)型啟動子,那么誘導(dǎo)劑可提高轉(zhuǎn)錄速率;相反,如果啟動子是組成型啟動子,轉(zhuǎn)錄速率不受誘導(dǎo)劑調(diào)節(jié)。
重組宿主根據(jù)本發(fā)明,重組宿主可為任一原核或真核細胞,其包含在表達載體或克隆載體上的目標克隆基因。該術(shù)語也包括那些經(jīng)基因工程設(shè)計過的原核或真核細胞,在該有機體的染色體或基因組上包含目標基因。
重組載體任一包含目標克隆基因的克隆載體或表達載體。
2、山梨糖醇脫氫酶的分離和純化使用一系列的柱層析步驟,本發(fā)明從弱氧化葡糖桿菌KCTC2111(韓國典型培養(yǎng)物保藏中心)2111(等同于ATCC 621)的胞漿膜分離和純化SDH。提供了該純化酶的生化特性,并且分離了每一個亞基,用氨基酸序列分析儀(Applied Biosystems,Model 477A)測定了每一個亞基的N-末端氨基酸序列。
不同于已報道的、來自弱氧化葡糖桿菌IFO 3254菌株的、FAD-依賴的SDH(Shinagawa,E等人,農(nóng)業(yè)與生物化學(xué),46135(1982)),新表征的酶含有作為輔因子的吡咯并喹啉醌(PQQ),且包含三個亞基(Choi,E.C.等人,歐洲微生物學(xué)會聯(lián)合會微生物學(xué)快報,125;45(1995))。
本發(fā)明的SDH可用標準的蛋白質(zhì)技術(shù)分離。簡言之,在SYP培養(yǎng)基中(5%D-山梨糖醇、1%Bacto-Peptone、0.5%酵母提取物)培養(yǎng)弱氧化葡糖桿菌KCTC 2111,在10mM醋酸鈉緩沖液(pH5.0)中裂解細胞。12,000g離心去除細胞碎片后,所得上清超離心以回收胞漿膜級分。用1.5%正辛基葡糖苷(Boehringer Mannheim)溶解胞漿膜級分,通過一系列的層析柱(包括CM-TSK 650(S)(Merck)、DEAE-TSK 650(S)(Merck)、Mono-S(Pharmacia)和Superose 12(Pharmacia))完成純化。
所純化的酶對多元醇具有活性,如D-山梨糖醇(100%)、D-甘露醇(68%)和D-核糖醇(70%)。當加入吡咯并喹啉醌(PQQ)時,酶活性增高達9倍,暗示PQQ是酶的輔因子;熒光譜分析確證純化的酶包含吡咯并喹啉醌(PQQ)。純化酶的吸收譜分析闡示該酶包含細胞色素c。當純化的酶在pH4.3下進行聚丙烯酰胺凝膠電泳(PAGE)(Reisfeld,R.A.等人,自然(Nature),195281(1962))時,它在活性染色后的膠上形成一條單一的活性帶。
純化酶的最初SDS-PAGE分析顯示該酶包含三個亞基,為75kDa、50kDa和14kDa,分別將它們命名為第一個亞基、第二個亞基和第三個亞基(Choi,E.C.等人,歐洲微生物學(xué)會聯(lián)合會微生物學(xué)快報,125;45(1995))。然而在對該酶的進一步研究中,發(fā)現(xiàn)29kDa的另一個亞基對SDH的穩(wěn)定性和催化活性起著很重要的作用。就是說在研究一系列pH條件以增加DATE-TSK柱純化過程中蛋白質(zhì)的分離性能時發(fā)現(xiàn),在pH5.0洗脫時部分分離的活性峰在pH6.0洗脫時完全分離為兩個分別的活性峰。先洗脫的活性峰很快失去了酶活性,而后洗脫的活性峰仍然穩(wěn)定。通過SDS-PAGE分析這兩個峰,發(fā)現(xiàn)具穩(wěn)定酶活性的峰除了包含75kDa和50kDa亞基外,還包含一個額外的29kDa亞基,而迅速失去酶活性的峰只包含75kDa和50kDa亞基。這個額外的29kDa亞基重命名為第三個亞基在丙烯酰胺膠上將以前指定的第三個亞基(14kDa亞基)與其它亞基比較相對含量時,不能確定14kDa亞基是否是酶的一個真正亞基。也發(fā)現(xiàn)了將洗脫緩沖液的pH進一步增加至pH6.5會導(dǎo)致三個亞基完全分離為單個的亞基。
通過Ferric-Dupanol測定法(Wood,W.A.等人,酶學(xué)方法(Meth.Enzymol.),5287(1962))測試兩個或三個亞基的不同組合對酶活性的恢復(fù),發(fā)現(xiàn)只有存在29kDa的第三個亞基,酶活性才完全恢復(fù)。因此可得出結(jié)論29kDa的第三個亞基在SDH的穩(wěn)定性和催化活性方面起著重要的作用。
用D-山梨糖醇作為底物時,測定的米-曼氏常數(shù)為Km=120mM,Vmax=3.9×10-5M/分鐘。二氯酚靛酚(DCIP)或高鐵氰化物作為酶的電子受體可有效發(fā)揮作用。當加入吩嗪硫酸甲酯(PMS)作為電子傳遞體時,酶活性增加。加入鈣或鎂離子可顯著增加純化酶的活性,而加入銅離子可嚴重抑制酶的活性。
本發(fā)明之SDH酶的純化和表征的進一步詳述在實施例1中提供。
3、本發(fā)明的核酸分子本發(fā)明提供分離的核酸分子,其編碼此處描述的SDH酶三個亞基中的一個或多個亞基。設(shè)計用于操縱分離的核酸分子的方法和技術(shù)為本領(lǐng)域公知。例如,核酸分子的分離、純化和克隆方法,以及描述真核和原核宿主細胞的使用和其中的核酸及蛋白質(zhì)表達的方法和技術(shù)在Sambrook等人,分子克隆實驗室手冊,第二版。冷泉港,紐約,1989,和分子生物學(xué)最新方法(Current Protocols in Molecular Biology),F(xiàn)rederickM.Ausubel等人Eds.,John Wiley & Sons,Inc.,1987中描述,在此處公開引用作為參考。
更明確地,本發(fā)明提供了一些分離的核酸分子,其編碼本發(fā)明之SDH酶單獨的75kDa、50kDa和29kDa亞基蛋白質(zhì)。另外,本發(fā)明提供了一些分離的核酸分子,其編碼本發(fā)明之SDH酶的一個或多個亞基蛋白質(zhì)。為了清楚起見,描述了本發(fā)明特定的分離核酸分子。然后,更加詳細地描述了這些分離的核酸分子的特性和表征。
除非另外指出,此處通過測定DNA分子序列而得到的所有核苷酸序列是使用自動DNA測序儀(如Applied Biosystems,Inc.的Model 373A)測定的,并且由此處測定之DNA分子所編碼多肽的所有氨基酸序列是通過翻譯上述測定的DNA序列而預(yù)測的。因此,任何用這種自動方法測定的DNA序列、任何此處測定的核苷酸序列可能含有一些錯誤,這一點為本領(lǐng)域公知,自動化測定的核苷酸序列一般至少約90%,更一般至少約95%到至少約99.9%等同于被測序DNA分子的實際核苷酸序列。實際序列可通過其它方法更精確地測定,其中包括本領(lǐng)域公知的手工DNA測序法。與實際的序列相比,在測定的核苷酸序列中單堿基插入或刪除會引起核苷酸序列的翻譯移碼,致使預(yù)測的、由測定的核苷酸序列編碼的氨基酸序列自該插入或刪除處開始完全不同于由被測序DNA分子編碼的實際氨基酸序列,這一點也是本領(lǐng)域公知的。
在一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第一個亞基(75kDa)的分離的核酸分子,其包含的多核苷酸序列選自(a)SEQ IDNO1的多核苷酸;(b)一種多核苷酸片段,其為SEQ ID NO1多核苷酸的至少約20個核苷酸長;(c)一種多核苷酸,其編碼SEQ ID NO4的氨基酸序列;以及(d)一種多核苷酸,其編碼的片段為SEQ ID NO4氨基酸序列的至少約10個氨基酸長。
在另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第一個亞基(75kDa)的分離的核酸分子,其包含的多核苷酸序列至少約95%等同于上述本發(fā)明之SDH酶第一個亞基(75kDa)的分離的核酸序列。
在本發(fā)明的另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第二個亞基(50kDa)的分離的核酸分子,其包含的多核苷酸序列選自(a)SEQID NO2的多核苷酸;(b)一種多核苷酸片段,其為SEQ ID NO2多核苷酸的至少約20個核苷酸長;(c)一種多核苷酸,其編碼SEQ ID NO5的氨基酸序列;以及(d)一種多核苷酸,其編碼的片段為SEQ ID NO5氨基酸序列的至少約10個氨基酸長。
在另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第二個亞基(50kDa)的分離的核酸分子,其包含的多核苷酸序列至少約95%等同于上述本發(fā)明之SDH酶第二個亞基(50kDa)的分離的核酸序列。
在本發(fā)明的另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第三個亞基(29kDa)的分離的核酸分子,其包含的多核苷酸序列選自(a)SEQID NO3的多核苷酸;(b)一種多核苷酸片段,其為SEQ ID NO3多核苷酸的至少約20個核苷酸長;(c)一種多核苷酸,其編碼SEQ ID NO6的氨基酸序列;以及(d)一種多核苷酸,其編碼的片段為SEQ ID NO6氨基酸序列的至少約10個氨基酸長。
在另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第三個亞基(29kDa)的分離的核酸分子,其包含的多核苷酸序列至少約95%等同于上述本發(fā)明之SDH酶第三個亞基(29kDa)的分離的核酸序列。
在本發(fā)明的另一個實施方案中,本發(fā)明提供了編碼本發(fā)明之SDH酶第一個(75kDa)和第二個(50kDa)亞基蛋白質(zhì)的分離的核酸分子,其包含的多核苷酸序列選自(a)SEQ ID NO7的多核苷酸;以及(b)一種多核苷酸片段,其為SEQ ID NO7多核苷酸的至少約20個核苷酸長。
在另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第一個(75kDa)和第二個(50kDa)亞基蛋白質(zhì)的分離的核酸分子,其包含的多核苷酸序列至少約95%等同于本發(fā)明之SDH酶第一個(75kDa)和第二個(50kDa)亞基蛋白質(zhì)的分離的核酸序列。
在本發(fā)明的另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第三個亞基(29kDa)的分離的核酸分子,其包含的多核苷酸序列選自(a)SEQID NO8的多核苷酸;以及(b)一種多核苷酸片段,其為SEQ ID NO8多核苷酸的至少約20個核苷酸長。
在另一個實施方案中,本發(fā)明提供了本發(fā)明之SDH酶第三個亞基(29kDa)的分離的核酸分子,其包含的多核苷酸序列至少約95%等同于上述本發(fā)明之SDH酶第三個亞基(29kDa)的分離的核酸序列。
“分離的”核酸分子是指DNA或RNA核酸分子,其已被從其天然環(huán)境移出。例如,包含在載體中的重組DNA分子被認為是為了本發(fā)明目的而分離的。分離的DNA分子之進一步的實例包括異源宿主細胞內(nèi)存在的重組DNA分子或在溶液中的純化(部分地或基本地)DNA分子。分離的RNA分子包括本發(fā)明之DNA分子的體內(nèi)或體外RNA轉(zhuǎn)錄本。根據(jù)本發(fā)明之分離的核酸分子進一步包括合成產(chǎn)生的此類分子。
RNA載體也可應(yīng)用于本發(fā)明所公開的SDH核酸分子。這些載體是基于正鏈或負鏈RNA病毒的,其在許多真核細胞中自然復(fù)制(Bredenbeek,P.J.和Rice,C.M.,病毒學(xué)(Virology),3297-310(1992))。這些病毒不像逆轉(zhuǎn)錄病毒,它們?nèi)狈χ虚g體DNA的生活周期相,完全以RNA形式存在。例如,用甲病毒作為外源蛋白質(zhì)的表達載體,因為它們可應(yīng)用于大范圍的宿主細胞并且可提供高水平的表達;這類病毒的實例包括辛德比斯病毒(Sindbis virus)和無名森林病毒(Semliki Forest virus)(Schlesinger,S.,生物技術(shù)趨勢(TIBTECH)1118-22(1993);Frolov,I.等人,美國國家科學(xué)院院報9311371-11377(1996))。通過使用Invitrogen的辛德比斯表達系統(tǒng),研究者在實驗室可方便地以DNA形式維持重組分子(pSinrep 5質(zhì)粒),而以RNA形式增殖也是可行的。在用于表達的宿主細胞內(nèi),包含目標基因的載體完全以RNA形式存在,并且如果希望的話可以那種狀態(tài)不斷增殖。
在另一個實施方案中,本發(fā)明進一步提供了變體的核酸分子,其編碼此處描述之分離的核酸分子的一部分、類似物或衍生物。變體包括那些通過核苷酸替換、刪除或添加而產(chǎn)生的變體,其可涉及到一個或多個核苷酸。變體可為編碼區(qū)、非編碼區(qū)或兩者中的改變。編碼區(qū)的改變可產(chǎn)生保守的或不保守的氨基酸替換、刪除或添加。
本發(fā)明之分離的核酸分子的變體可自然發(fā)生,如自然的等位基因變體,“等位基因變體”是指基因的一些交替形式之一,其中所述基因位于有機物染色體上的某個位點?;騃I(Genes II),Lewin,B.,ed.,John Wiley& Sons,紐約(1985)。非自然發(fā)生的變體可使用本領(lǐng)域公知的誘變技術(shù)產(chǎn)生。
本發(fā)明之分離的核酸分子也包括多核苷酸序列,其與此處描述的分離的核苷酸分子相比較95%、96%、97%、98%和99%是相同的。計算機程序如BestFit程序(威斯康星序列分析軟件包(Wisconsin SequenceAnalysis Package),Unix版本10,Genetics Computer Group,UniversityResearch Park,575 Science Drive,Madison,WI 53711)可用于確定任一特定的核酸分子與此處公開的核苷酸序列或此處描述的保藏克隆之核苷酸序列是否至少有95%、96%、97%、98%和99%是相同的。BestFit使用Smith和Waterman的局部同源性算法,應(yīng)用數(shù)學(xué)進展(Advances inApplied Mathematics)2482-489(1981)),以發(fā)現(xiàn)兩序列間的最佳同源片段。
例如,當計算機對比程序(如BestFit)用于確定與參照核苷酸序列具95%的同一性時,它是對參照核苷酸序列之全長來計算同一性百分率,并且允許參照序列之核苷酸總數(shù)中有高達5%的同源性差異。這樣,所分析的每100個堿基對中,95%的同一性表示被測序列中每100個核苷酸中,有多達5個核苷酸與參照核苷酸序列不同。
本發(fā)明也包括此處描述的核苷酸序列片段和分離的核酸分子。在一個優(yōu)選的實施方案中,本發(fā)明提供了至少20個堿基長的片段。此類片段的長度用數(shù)學(xué)易于定義。例如,SEQ ID NO1提供了一種長為2,265個堿基的分離的核酸分子。至少20個堿基長的SEQ ID NO1的片段(F1)可定義為F1=20+X,其中X定義為0或從1至2,245之間的任一全整數(shù)。同樣,此處描述的其它分離的核酸分子片段可如下定義對于長為1,437個堿基的SEQ ID NO2,至少20個堿基長的SEQ ID NO2的片段(F2)可定義為F2=20+X,其中X定義為0或從1至1,417之間的任一全整數(shù)。對于長為921個堿基的SEQ ID NO3,至少20個堿基長的SEQ ID NO3的片段(F3)可定義為F3=20+X,其中X定義為0或從1至901之間的任一全整數(shù)。對于長為4,830個堿基的SEQ ID NO7,至少20個堿基長的SEQ ID NO7的片段(F7)可定義為F7=20+X,其中X定義為0或從1至4,810之間的任一全整數(shù)。對于長為2,700個堿基的SEQ ID NO8,至少20個堿基長的SEQ ID NO8的片段(F8)可定義為F8=20+X,其中X定義為0或從1至2,680之間的任一全整數(shù)。本領(lǐng)域技術(shù)人員將了解本發(fā)明之分離的核酸序列片段可為單鏈或雙鏈分子。
本發(fā)明公開了分離的核酸分子,其編碼本發(fā)明之SDH酶的三個亞基蛋白質(zhì)。計算機分析提供了關(guān)于每一個亞基的開放讀碼框、推定的信號序列及成熟蛋白質(zhì)形式的信息。編碼第一個(75kDa)和第二個(50kDa)的基因完全包含在λGEM5-1克隆的一個5.7kb PstI片段中,在韓國典型培養(yǎng)物保藏中心(Korean Collection for Type Cultures,KCTC),韓國生物科學(xué)與生物技術(shù)研究所(Korea Research Institute of Bioscience andBiotechnology,KRIBB),52,Oun-Dong,Yusong-Ku,Taejon 305-33,韓國,該克隆保藏在細菌中保藏號為KCTC 0593BP,以及作為DNA保藏的保藏號為KCTC 0597BP。第三個(29kDa)亞基基因包含在稱為ClaI-#69中的一個4.5kb長的序列中,在韓國典型培養(yǎng)物保藏中心(KoreanCollection for Type Cultures,KCTC),韓國生物科學(xué)與生物技術(shù)研究所(Korea Research Institute of Bioscience and Biotechnology,KRIBB),52,Oun-Dong,Yusong-Ku,Taejon 305-33,韓國,ClaI-#69保藏在細菌中的保藏號為KCTC 0594BP,以及作為DNA保藏的保藏號為KCTC0598BP。
這樣,本發(fā)明提供了攜帶于新菌株KCTC 0593BP中的分離的核酸分子(KCTC 0597BP),并且本發(fā)明也提供了攜帶于新菌株KCTC 0594BP中的分離的核酸分子(KCTC 0598BP)。
從λGEM5-1的5.7kb PstI片段獲得的序列見圖8,并命名為SEQ IDNO7。第一個亞基基因完整的編碼序列位于665-2,929處(SEQ IDNO1),其中信號序列位于665-766,且編碼SDH第一個亞基成熟蛋白質(zhì)的序列位于767-2,929(SEQ ID NO22)。第二個亞基基因完整的編碼序列位于2,964-4,400處(SEQ ID NO2),其中信號序列位于2,964-3,071,且編碼SDH第二個亞基成熟蛋白質(zhì)的序列位于3,072-4,400(SEQ IDNO23)。
這樣,本發(fā)明的另一個實施方案提供了分離的核酸分子,其衍生于圖8中從λGEM5-1的5.7kb PstI片段獲得的如SEQ ID NO7所示的序列。此類分離的核酸分子包括以下核苷酸(1)如SEQ ID NO28所示的SEQ ID NO7中1-644的核苷酸;(2)如SEQ ID NO29所示的SEQ IDNO7中50-644的核苷酸;(3)如SEQ ID NO30所示的SEQ ID NO7中100-644的核苷酸;(4)如SEQ ID NO31所示的SEQ ID NO7中150-644的核苷酸;(5)如SEQ ID NO32所示的SEQ ID NO7中200-644的核苷酸;(6)如SEQ ID NO33所示的SEQ ID NO7中250-644的核苷酸;(7)如SEQ ID NO34所示的SEQ ID NO7中300-644的核苷酸;(8)如SEQ ID NO35所示的SEQ ID NO7中350-644的核苷酸;(9)如SEQ ID NO36所示的SEQ ID NO7中400-644的核苷酸;(10)如SEQ ID NO37所示的SEQ ID NO7中450-644的核苷酸;(11)如SEQ ID NO38所示的SEQ ID NO7中500-644的核苷酸;(12)如SEQ ID NO39所示的SEQ ID NO7中550-644的核苷酸;(13)如SEQ ID NO40所示的SEQ ID NO7中600-644的核苷酸;(14)如SEQ ID NO1所示的SEQ ID NO7中665-2,929的核苷酸序列,其編碼本發(fā)明的SDH之亞基1蛋白質(zhì)的全長;(15)如SEQ IDNO22所示的SEQ ID NO7中767-2,929的核苷酸序列,其編碼本發(fā)明的SDH之亞基1蛋白質(zhì)的成熟形式;(16)如SEQ ID NO2所示的SEQID NO7中2,964-4,400的核苷酸序列,其編碼本發(fā)明的SDH之亞基2蛋白質(zhì)的全長;(17)如SEQ ID NO23所示的SEQ ID NO7中3,072-4,400的核苷酸序列,其編碼本發(fā)明的SDH之亞基2蛋白質(zhì)的成熟形式;(18)如SEQ ID NO41所示的SEQ ID NO7中2,930-2,963的核苷酸;(19)如SEQ ID NO42所示的SEQ ID NO7中4,401-4,451的核苷酸;(20)如SEQ ID NO43所示的SEQ ID NO7中4,401-4,501的核苷酸;(21)如SEQ ID NO44所示的SEQ ID NO7中4,401-4,551的核苷酸;(22)如SEQ ID NO45所示的SEQ ID NO7中4,401-4,601的核苷酸;(23)如SEQ ID NO46所示的SEQ ID NO7中4,401-4,651的核苷酸;(24)如SEQ ID NO47所示的SEQ ID NO7中4,401-4,701的核苷酸;(25)如SEQ ID NO48所示的SEQ ID NO7中4,401-4,751的核苷酸;(26)如SEQ ID NO49所示的SEQ ID NO7中4,401-4,801的核苷酸;以及(27)如SEQ ID NO50所示的SEQ ID NO7中4,401-4,830的核苷酸。
從ClaI-#69克隆中獲得的序列見圖10,并命名為SEQ ID NO8。第三個亞基基因全部的編碼序列位于1,384-2,304處(SEQ ID NO3),其中信號序列位于1,384-1,461,且編碼SDH第三個亞基成熟蛋白質(zhì)的序列位于1,462-2,304(SEQ ID NO24)。
這樣,本發(fā)明的另一個實施方案提供了分離的核酸分子,其衍生于圖10中從ClaI-#69克隆中獲得的如SEQ ID NO7所示的序列。此類分離的核酸分子包括以下核苷酸(1)如SEQ ID NO51所示的SEQ IDNO8中1-1,383的核苷酸;(2)如SEQ ID NO52所示的SEQ ID NO8中50-1,383的核苷酸;(3)如SEQ ID NO53所示的SEQ ID NO8中100-1,383的核苷酸;(4)如SEQ ID NO54所示的SEQ ID NO8中150-1,383的核苷酸;(5)如SEQ ID NO55所示的SEQ ID NO8中200-1,383的核苷酸;(6)如SEQ ID NO56所示的SEQ ID NO8中250-1,383的核苷酸;(7)如SEQ ID NO57所示的SEQ ID NO8中300-1,383的核苷酸;(8)如SEQ ID NO58所示的SEQ ID NO8中350-1,383的核苷酸;(9)如SEQ ID NO59所示的SEQ ID NO8中400-1,383的核苷酸;(10)如SEQ ID NO60所示的SEQ ID NO8中450-1,383的核苷酸;(11)如SEQ ID NO61所示的SEQ ID NO8中500-1,383的核苷酸;(12)如SEQ ID NO62所示的SEQ ID NO8中550-1,383的核苷酸;(13)如SEQ ID NO63所示的SEQ ID NO8中600-1,383的核苷酸;(14)如SEQ ID NO64所示的SEQ ID NO8中600-1,383的核苷酸;(15)如SEQ ID NO65所示的SEQ ID NO8中650-1,383的核苷酸;(16)如SEQ ID NO66所示的SEQ ID NO8中700-1,383的核苷酸;(17)如SEQ ID NO67所示的SEQ ID NO8中750-1,383的核苷酸;(18)如SEQ ID NO68所示的SEQ ID NO8中800-1,383的核苷酸;(19)如SEQ ID NO69所示的SEQ ID NO8中850-1,383的核苷酸;(20)如SEQ ID NO70所示的SEQ ID NO8中900-1,383的核苷酸;(21)如SEQ ID NO71所示的SEQ ID NO8中950-1,383的核苷酸;(22)如SEQ ID NO72所示的SEQ ID NO8中1,000-1,383的核苷酸;(23)如SEQ ID NO73所示的SEQ ID NO8中1,050-1,383的核苷酸;(24)如SEQ ID NO74所示的SEQ ID NO8中1,100-1,383的核苷酸;(25)如SEQ ID NO75所示的SEQ ID NO8中1,150-1,383的核苷酸;(26)如SEQ ID NO76所示的SEQ ID NO8中1,200-1,383的核苷酸;(27)如SEQ ID NO77所示的SEQ ID NO8中1,250-1,383的核苷酸;(28)如SEQ ID NO78所示的SEQ ID NO8中1,300-1,383的核苷酸;(29)如SEQ ID NO79所示的SEQ ID NO8中1,350-1,383的核苷酸;(30)如SEQ ID NO3所示的SEQ ID NO8中從1,384-1,461的核苷酸序列,其編碼本發(fā)明之SDH亞基3蛋白質(zhì)的全長;(31)如SEQ ID NO24所示的SEQ ID NO8中從1,462-2,304的核苷酸序列,其編碼本發(fā)明之SDH亞基3蛋白質(zhì)的成熟形式;(32)如SEQ ID NO80所示的SEQ ID NO8中2,305-2,355的核苷酸;(33)如SEQ ID NO81所示的SEQ ID NO8中2,305-2,405的核苷酸;(34)如SEQ ID NO82所示的SEQ ID NO8中2,305-2,455的核苷酸;(35)如SEQ ID NO83所示的SEQ ID NO8中2,305-2,505的核苷酸;(32)如SEQ ID NO84所示的SEQ ID NO8中2,305-2,555的核苷酸;(32)如SEQ ID NO85所示的SEQ ID NO8中2,305-2,605的核苷酸;(32)如SEQ ID NO86所示的SEQ ID NO8中2,305-2,655的核苷酸;以及(33)如SEQ ID NO87所示的SEQ ID NO8中2,305-2,700的核苷酸。
本發(fā)明也包括重組構(gòu)建體,其包含上面概述的一個或多個序列。構(gòu)建體包含載體(如質(zhì)?;虿《据d體),其中已正向或反向插入了本發(fā)明的序列。在該實施方案的一個優(yōu)選的方面,構(gòu)建體進一步包含調(diào)節(jié)序列,包括例如,與序列有效連接的啟動子。大量合適的載體和啟動子為本領(lǐng)域技術(shù)人員公知并可通過商業(yè)購買獲得。以實例的方式提供下列載體細菌的-pET(Novagen)、pQE70、pQE60、pQE-9(Qiagen)、pBs、phagescript、psiX174、pBlueScript SK、pBsKS、pNH8a、pNH16a、pNH18a、pNH46a(Stratagene);pTrc99A、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia);以及真核的pWLneo、pSV2cat、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG、pSVL(Pharmacia)。這樣,可使用這些和任一其它質(zhì)粒或載體,只要它們在宿主中可復(fù)制且能生存。
啟動子區(qū)可選自使用具有選擇性標記的CAT(氯霉素轉(zhuǎn)移酶)載體或其它載體的任一目標基因。兩個合適的載體為pKK232-8和pCM7。特定命名的細菌啟動子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。真核的啟動子包括CMV立即早期、HSV胸腺嘧啶激酶、早期和晚期SV40、逆病毒的LTRs和小鼠金屬硫蛋白-I。本領(lǐng)域一般的技術(shù)水平足以選擇合適的載體和啟動子。
在另一個實施方案中,本發(fā)明提供了產(chǎn)生此處描述之載體的方法,其包含(a)將本發(fā)明之分離的核酸分子插入載體;以及(b)在宿主細胞中選擇和增殖該載體。
合適宿主的代表性實例包括,但不限于,細菌細胞,如葡糖桿菌屬、短桿菌屬(Brevibacterium)、棒桿菌屬(Corynebacterium)、大腸桿菌(E.coli)、鏈霉菌屬、鼠傷寒沙門氏菌(Salmonella typhimurium)、醋桿菌屬、假單胞菌屬(Pseudomonas)、假葡糖桿菌屬(Pseudogluconobacter)、芽胞桿菌屬、土壤桿菌屬(Agrobacterium)細胞;真菌和酵母生物,包括酵母屬(Saccharomyces)、克魯維酵母屬(Kluyveromyces)、曲霉屬(Aspergillus)和根霉屬(Rhizopus);昆蟲細胞,例如果蠅屬S2(Drosophila S2)和灰翅夜蛾屬Sf9(Spodoptera Sf9)細胞;動物細胞例如CHO、COS和鮑斯黑色素瘤細胞(Bowes melanomacells);以及植物細胞。上述宿主細胞的合適培養(yǎng)基和條件為本領(lǐng)域公知。
4.本發(fā)明的多肽本發(fā)明提供了本發(fā)明之SDH酶的分離的多肽分子。設(shè)計用于操縱分離的多肽分子的方法和技術(shù)為本領(lǐng)域熟知。例如分離和純化多肽分子的方法在蛋白質(zhì)科學(xué)最新方法(Current Protocols in Protein Science),JohnE.Coligan等人Eds.,John Wiley & Sons,Inc.,1997進行了描述,此處對其公開引用以作參考。
更明確地,本發(fā)明提供了一些分離的多肽分子,其編碼本發(fā)明之SDH酶單獨的75kDa、50kDa和29kDa亞基蛋白質(zhì)。為了清楚起見,描述了本發(fā)明特定的分離的多肽分子。然后,更加詳細地描述了這些分離的多肽分子的特性和表征。
在一個實施方案中,本發(fā)明提供了分離的多肽,其包含的多肽序列選自(a)由SEQ ID NO1的多核苷酸序列編碼的多肽序列;(b)SEQ IDNO4的多肽序列;以及(c)一種多肽,其為SEQ ID NO4多肽序列的至少約10個氨基酸長。
在另一個實施方案中,本發(fā)明提供了分離的多肽,其包含的多肽序列選自(a)由SEQ ID NO2的多核苷酸序列編碼的多肽序列;(b)SEQ IDNO5的多肽序列;以及(c)一種多肽,其為SEQ ID NO5多肽序列的至少約10個氨基酸長。
仍然在另一個實施方案中,本發(fā)明提供了分離的多肽,其包含的多肽序列選自(a)由SEQ ID NO3的多核苷酸序列編碼的多肽序列;(b)SEQID NO6的多肽序列;以及(c)一種多肽,其為SEQ ID NO6多肽序列的至少約10個氨基酸長。
本發(fā)明的其它實施方案包括一種分離的多肽序列,其包含由分離的核酸序列SEQ ID NO7編碼的多肽;一種分離的多肽序列,其包含由分離的核酸序列SEQ ID NO8編碼的多肽;一種分離的多肽序列,其包含由KCTC保藏號No.0593BP中的DNA克隆編碼的多肽;以及一種分離的多肽序列,其包含由KCTC保藏號No.0594BP中的DNA克隆編碼的多肽。
此處所用術(shù)語“分離的多肽”是指從其天然環(huán)境移出的多肽。這樣,產(chǎn)生和/或包含在重組的宿主細胞中的多肽被認為是為了本發(fā)明目的而分離的。從重組的宿主細胞部分地或基本地純化的多肽也稱為“分離的多肽”。
本發(fā)明的多肽包括天然純化的產(chǎn)物、化學(xué)合成過程的產(chǎn)物、以及原核或真核宿主中通過重組技術(shù)產(chǎn)生的產(chǎn)物,其中原核或真核宿主包括例如細菌、酵母、高等植物、昆蟲和哺乳動物細胞。本發(fā)明的多肽可為糖基化的或非糖基化的,這取決于重組體生產(chǎn)過程中所使用的宿主。此外本發(fā)明的多肽也可含有起始的被修飾過的甲硫氨酸殘基,在有些情況下這是宿主介導(dǎo)的加工的結(jié)果。
本發(fā)明的多肽也包括上述多肽的變體。術(shù)語“變體”包括自然的等位基因變異的多肽序列,其存在保守的或不保守的氨基酸替換、刪除或添加。術(shù)語“變體”也包括那些經(jīng)人工(通過公知的誘變技術(shù)或通過化學(xué)合成方法)而產(chǎn)生的分離的多肽序列。此類人為的變體包括存在保守的或不保守的氨基酸替換、刪除或添加的多肽序列。
本領(lǐng)域技術(shù)人員熟知是否某個特定的氨基酸是保守的還是不保守的。保守氨基酸的替換不會顯著影響蛋白質(zhì)的折疊或活性。作為例子,表1列出了保守氨基酸替換的列表。
表1.保守氨基酸的替換
可通過本領(lǐng)域公知的方法鑒定本發(fā)明之蛋白質(zhì)中對功能所必需的氨基酸,如定點誘變或丙氨酸-掃描誘變(Cunningham和Wells,科學(xué)(Science)2441081-1085(1989))。
本發(fā)明之分離的多肽分子也包括這樣的多肽序列,其與此處描述之分離的多肽分子相比較95%、96%、97%、98%和99%是相同的。計算機程序如BestFit程序(威斯康星序列分析軟件包(Wisconsin SequenceAnalysis Package),Unix版本10,Genetics Computer Group,UniversityResearch Park,575 Science Drive,Madison,WI 53711)可用于確定任一特定的多肽分子與此處公開的多肽序列或此處描述的保藏克隆之分離的DNA分子所編碼的多肽序列是否至少有95%、96%、97%、98%和99%是相同的。BestFit使用Smith和Waterman的局部同源性算法,應(yīng)用數(shù)學(xué)進展2482-489(1981)),以發(fā)現(xiàn)兩序列間的最佳同源片段。
例如,當計算機對比程序(如BestFit)用于確定與參照多肽序列具95%的同一性時,它是對參照多肽序列之全長來計算同一性百分率,并且允許參照序列之氨基酸總數(shù)中有高達5%的同源性差異。這樣,所分析的每100個氨基酸中,95%的同一性表示被試序列的每100個氨基酸中,有多達5個氨基酸與參照多肽序列不同。
本發(fā)明也包括此處描述的多肽序列片段和分離的多肽分子。在一個優(yōu)選的實施方案中,本發(fā)明提供了至少10個氨基酸長的片段。此類片段的長度用數(shù)學(xué)易于定義。例如,SEQ ID NO4提供了一種長為754個氨基酸的分離的多肽分子。至少10個氨基酸長的SEQ ID NO4的片段(F4)可定義為F4=10+X,其中X定義為0或從1至744之間的任一全整數(shù)。同樣,此處描述的其它分離的多肽分子片段可如下定義對于長為478個氨基酸的SEQ ID NO5,至少10個氨基酸長的SEQ ID NO5的片段(F5)可定義為F5=10+X,其中X定義為0或從1至468之間的任一全整數(shù)。對于長為306個氨基酸的SEQ ID NO6,至少10個氨基酸長的SEQID NO6的片段(F6)可定義為F6=10+X,其中X定義為0或從1至296之間的任一全整數(shù)。
本發(fā)明特別優(yōu)選的實施方案提供了如下的分離的多肽(1)本發(fā)明之SDH亞基1的全長多肽,其由分離的核酸分子SEQ ID NO1編碼并鑒定為SEQ ID NO4;(2)本發(fā)明之SDH亞基2的全長多肽,其由分離的核酸分子SEQ ID NO2編碼并鑒定為SEQ ID NO5;(3)本發(fā)明之SDH亞基3的全長多肽,其由分離的核酸分子SEQ ID NO3編碼并鑒定為SEQ ID NO6;(4)本發(fā)明之SDH亞基1多肽的成熟形式,其由分離的核酸分子SEQ ID NO22編碼并鑒定為SEQ ID NO25;(5)本發(fā)明之SDH亞基2多肽的成熟形式,其由分離的核酸分子SEQ ID NO24編碼并鑒定為SEQ ID NO26;以及本發(fā)明之SDH亞基3多肽的成熟形式,其由分離的核酸分子SEQ ID NO23編碼并鑒定為SEQ ID NO27。
本發(fā)明也提供了產(chǎn)生多肽的方法,其包括(a)含有SEQ ID NO2的分離的核酸分子或其變體的宿主細胞的生長;(b)表達由該分離的核酸分子編碼的多肽;以及(c)分離該多肽。
在另一個實施方案中,本發(fā)明也提供了產(chǎn)生多肽的方法,其包括(a)含有SEQ ID NO1的分離的核酸分子或其變體的宿主細胞的生長;(b)表達由該分離的核酸分子編碼的多肽;以及(c)分離該多肽。
本發(fā)明提供的另一個過程是為了產(chǎn)生多肽,其包括(a)含有SEQ IDNO3的分離的核酸分子或其變體的宿主細胞的生長;(b)表達由該分離的核酸分子編碼的多肽;以及(c)分離該多肽。
合適宿主的代表性實例包括,但不限于,細菌細胞如葡糖桿菌屬、短桿菌屬、棒桿菌屬、大腸桿菌、鏈霉菌屬、鼠傷寒沙門氏菌、醋桿菌屬、假單胞菌屬、假葡糖桿菌屬、芽胞桿菌屬、土壤桿菌屬細胞;真菌和酵母生物包括酵母屬、克魯維酵母屬、曲霉屬和根霉屬;昆蟲細胞例如果蠅屬S2和灰翅夜蛾屬Sf9細胞;動物細胞例如CHO、COS和鮑斯黑色素瘤細胞;以及植物細胞。上述宿主細胞的合適培養(yǎng)基和條件為本領(lǐng)域公知。
多肽可以修飾形式表達(如融合蛋白質(zhì))并且不僅可包含分泌信號,還可包含額外的異源功能區(qū)。例如,額外的氨基酸區(qū)(特別是帶電荷氨基酸)可加至多肽的N-末端,以提高在純化過程中,或接下來的處理和貯存過程中多肽在宿主細胞中的穩(wěn)定性和持久性。肽部分也可加至多肽上以利于純化。這些區(qū)可在多肽的最后制備前去除。向多肽添加肽部分以引起分泌或排泄、提高穩(wěn)定性以及促進純化等是本領(lǐng)域熟悉的和常規(guī)的技術(shù)。
從重組的細胞培養(yǎng)物中,用熟知的方法可回收并純化本發(fā)明的多肽,包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換層析、磷酸纖維素層析、疏水相互作用層析、親和層析、羥基磷灰石層析和凝集素層析。最優(yōu)選地,使用高效液相色譜法(“HPLC”)純化。
5.L-山梨糖和2-酮-L-古洛糖酸的產(chǎn)生本發(fā)明提供了產(chǎn)生L-山梨糖和2-酮-L-古洛糖酸的方法,它們對維生素C的產(chǎn)生是有用的。
在一個實施方案中,本發(fā)明提供了從D-山梨糖醇產(chǎn)生L-山梨糖的方法,其包含(a)用至少一種分離的核苷酸序列轉(zhuǎn)化宿主細胞,其中分離的核苷酸序列選自(i)一種包含SEQ ID NO1多核苷酸序列的多核苷酸;(ii)一種包含SEQ ID NO2多核苷酸序列的多核苷酸;以及(iii)一種包含SEQ ID NO3多核苷酸序列的多核苷酸;以及(b)選擇并增殖該轉(zhuǎn)化的宿主細胞。
在另一個實施方案中,本發(fā)明提供了2-酮-L-古洛糖酸的產(chǎn)生方法,其包含(a)用至少一種分離的核苷酸序列轉(zhuǎn)化宿主細胞,其中分離的核苷酸序列選自(i)一種包含SEQ ID NO1多核苷酸序列的多核苷酸;(ii)一種包含SEQ ID NO2多核苷酸序列的多核苷酸;以及(iii)一種包含SEQ ID NO3多核苷酸序列的多核苷酸;以及(b)選擇并增殖該轉(zhuǎn)化的宿主細胞。
在此處提供的方法中,為產(chǎn)生L-山梨糖和2-酮-L-古洛糖酸所使用的作為宿主細胞的合適的細菌為本領(lǐng)域技術(shù)人員共知,這些細菌包括,但不限于,大腸桿菌、短桿菌屬、棒桿菌屬、葡糖桿菌屬、醋桿菌屬、假單胞菌屬和假葡糖桿菌屬。
表達本發(fā)明之SDH酶的其它宿主細胞包括在美國專利No.5,834,231中鑒定的菌株;氧化葡糖桿菌DSM 4025(美國專利No.4,960,695);氧化葡糖桿菌TIOO(應(yīng)用與環(huán)境微生物學(xué)(Appl.Environ.Microbiol.)63454-460(1997));Pseudogluconobacter saccharoketogenes IFO 14464(歐洲專利No.221 707);Pseudomonas sorbosoxidans(美國專利No.4,933,289);和液化醋桿菌(Acetobacter liquefaciens)IFO 12258(應(yīng)用與環(huán)境微生物學(xué)61413-420(1995))。
在本發(fā)明的其它實施方案中,本領(lǐng)域公知的許多發(fā)酵技術(shù)可應(yīng)用于本發(fā)明之涉及L-山梨糖和2-酮-L-古洛糖酸的產(chǎn)生的過程中。一般地,L-山梨糖和2-酮-L-古洛糖酸可通過發(fā)酵方法產(chǎn)生,如分批型發(fā)酵或?qū)儆谘a料分批型的發(fā)酵。分批型發(fā)酵時,在發(fā)酵一開始即加入所有的營養(yǎng)物。補料分批或持續(xù)補料分批型發(fā)酵時,不斷向培養(yǎng)物中補充一種或多種營養(yǎng)物,其中營養(yǎng)物從發(fā)酵剛好開始時、或在培養(yǎng)物達到了某個時期后、或當培養(yǎng)液中補加的營養(yǎng)物消耗完了時補充。屬于補料分批型發(fā)酵中的一系列持續(xù)分批發(fā)酵為反復(fù)的補料分批或填充-取出發(fā)酵,其在繼續(xù)供給營養(yǎng)物的同時,于某些時候例如,當發(fā)酵罐滿了時,取走發(fā)酵罐內(nèi)容物的一部分。發(fā)酵以這種方式可持續(xù)較長時間。
另一種發(fā)酵類型(連續(xù)發(fā)酵或恒化培養(yǎng))連續(xù)供給完全培養(yǎng)基,同時連續(xù)或半連續(xù)地取出培養(yǎng)液,以這種方式使發(fā)酵罐中液體培養(yǎng)基之體積維持大體上恒定。連續(xù)發(fā)酵原則上可維持無限長的時間。
分批發(fā)酵時,在培養(yǎng)物中必需營養(yǎng)物之一消耗盡之前,或者在發(fā)酵條件變得不利(例如pH降至某個抑制微生物生長的值)之前,有機體可生長。補料分批發(fā)酵時,通常使用方法來維持有利的生長條件(例如通過使用pH控制),并且通過向培養(yǎng)物中供給一種或多種營養(yǎng)物以防止這些營養(yǎng)物耗盡。微生物將繼續(xù)生長,其生長速率用營養(yǎng)補料的速率表示。通常單一的營養(yǎng)物(經(jīng)常為碳源)會成為對生長的限制。同樣的原理適用于連續(xù)發(fā)酵,通常在培養(yǎng)基補料中一種營養(yǎng)物是限制的,所有其它營養(yǎng)物是過量的。限制的營養(yǎng)物將以很低濃度(往往低得檢測不到)存在于培養(yǎng)液中??墒褂貌煌愋偷臓I養(yǎng)物限制。碳源限制是最常用的。其它實例為通過氮源限制、通過氧限制、通過一種特定的營養(yǎng)物如維生素或氨基酸限制(在微生物對這樣一個化合物是營養(yǎng)缺陷的情況下)、通過硫磺限制和通過含磷物限制。
合適的追加碳源的闡明性實例包括但不限于其它糖類如葡萄糖、果糖、D-甘露醇、淀粉或淀粉水解物、纖維素水解物以及糖蜜;有機酸如乙酸、丙酸、乳酸、蟻酸、蘋果酸、檸檬酸和延胡索酸;以及醇類如丙三醇。
合適的氮源的闡明性實例包括但不限于氨,包括氨氣和氨水;無機酸或有機酸的胺鹽,如氯化銨、硝酸銨、磷酸銨、硫酸銨和醋酸銨;尿素;硝酸鹽或亞硝酸鹽,以及其它含氮物質(zhì),包括純的或粗制備之氨基酸、肉膏、蛋白胨、魚粉、魚水解物、玉米漿、酪蛋白水解物、大豆餅水解物、酵母提取物、干酵母、乙醇-酵母餾出物、大豆粉、棉籽粉等。
合適的無機鹽的闡明性實例包括但不限于鉀鹽、鈣鹽、鈉鹽、鎂鹽、錳鹽、鈷鹽、鋅鹽、銅鹽以及其它超微量元素的鹽和磷酸鹽。
合適的痕量營養(yǎng)物、生長因子等的闡明性實例包括,但不限于輔酶A、泛酸、生物素、硫胺素、核黃素、鹽酸吖啶黃單核苷酸、鹽酸吖啶黃腺嘌呤二核苷酸、其它的維生素、氨基酸(如半胱氨酸)、硫代硫酸鈉、對氨基苯甲酸、煙酰胺等,它們以純的或部分純化的化學(xué)化合物,或者于天然物質(zhì)中存在。本發(fā)明之微生物菌株的培養(yǎng)可使用任一本領(lǐng)域技術(shù)人員公知的浸沒發(fā)酵技術(shù)(如氣升式發(fā)酵)、傳統(tǒng)的噴射攪拌設(shè)計或者振搖培養(yǎng)來進行。
所使用的培養(yǎng)條件(包括溫度、pH、通氣速率、攪拌速率、培養(yǎng)持續(xù)時間等)可通過一個本領(lǐng)域技術(shù)人員靠經(jīng)驗決定,以使L-山梨糖和2-酮-L-古洛糖酸的產(chǎn)量最高。特定培養(yǎng)條件的選擇取決于以下因素,如使用特定發(fā)明的微生物菌株、培養(yǎng)基組成和類型、培養(yǎng)技術(shù)以及類似考慮。
合適的回收2-KLG的方法之闡明性實例在美國專利Nos.5,474,924;5,312,741;4,960,695;4,935,359;4,877,735;4,933,289;4,892,823;3,043,749;3,912,592;3,907,639和3,234,105中描述。
根據(jù)上述方法之一,首先通過公知的方法(如離心或過濾)從培養(yǎng)液中去除微生物,并且將所得的溶液真空濃縮。然后通過過濾獲得結(jié)晶的2-KGL,并且如果希望的話,通過重結(jié)晶純化。同樣地,2-KGL可通過公知的方法獲得,如離子交換樹脂、溶劑提取、沉淀、鹽析等方法。
當2-KGL以游離酸形式獲得時,可使用傳統(tǒng)方法如所希望地將其轉(zhuǎn)換為鹽,與鈉、鉀、鈣、氨或類似陽離子形成的鹽。另外,當2-KGL以鹽的形式回收時,可使用傳統(tǒng)方法將它轉(zhuǎn)換為其游離形式或轉(zhuǎn)換為其它鹽。
此處引用的所有專利和出版物作為參考?,F(xiàn)在已總體上描述了本發(fā)明,通過參考下列以例證方式提供的實施例,本發(fā)明將更易理解,并且除非特別說明,它們不用于限制本發(fā)明。
實施例實施例1從弱氧化葡糖桿菌KCTC 2111分離并表征SDH給出了從弱氧化葡糖桿菌KCTC 2111純化本發(fā)明之吡咯并喹啉醌(PQQ)-依賴的SDH的改良方法。相對于最初的純化方案(Choi,E.S.等人,歐洲微生物學(xué)會聯(lián)合會微生物學(xué)快報,12545(1995)),改進涉及到對亞基的分辨率變大以及酶活性的穩(wěn)定性提高。
步驟1弱氧化葡糖桿菌KCTC 2111的培養(yǎng)將弱氧化葡糖桿菌KCTC 2111接種于5ml SYP培養(yǎng)基(5%D-山梨糖醇、1%Bacto蛋白胨和0.5%酵母提取物)并且于30℃培養(yǎng)20小時。取1毫升(ml)此培養(yǎng)物,轉(zhuǎn)移至500ml燒瓶中的50ml同樣的培養(yǎng)基中,于旋轉(zhuǎn)式搖瓶機上30℃培養(yǎng)20小時(180轉(zhuǎn)/分鐘)。這樣制備的培養(yǎng)物用作5L罐式發(fā)酵器的接種物,其中含有3L同樣的培養(yǎng)基,將這3L培養(yǎng)物生長至早期穩(wěn)定期。
步驟2膜級分的制備于12,000g離心10分鐘收獲細胞,用10mM醋酸鈉緩沖液(pH5.0)洗一次,并且在珠攪拌器(Edmund Buhler,Vi4)中用玻璃珠(直徑為0.1mm)于4℃破碎90秒。如此制備的勻漿物于12,000g離心5分鐘,以去除細胞碎片和玻璃珠。所得到的上清于100,000g離心60分鐘,可獲得沉淀形式的粗膜級分。
步驟3從膜級分中溶解SDH以40mg蛋白質(zhì)/ml 1.5%正辛基葡糖苷重懸并溶解粗膜級分,于4℃攪拌2小時。所得的懸液于12,000g離心10分鐘,給出上清,稱之為溶解的SDH級分。在純化過程中使用的所有溶液包含0.75%正辛基葡糖苷。
步驟4酶活性測定以二氯酚靛酚(DCIP)作為人工電子受體,并以吩嗪硫酸甲酯(PMS)作為電子傳遞體,用分光光度法測定酶活性。反應(yīng)混合物含有50mM醋酸鈉緩沖液(pH5.0)、10mM MgCl2、5mM CaCl2、5mM KCN、0.1mMPMS、0.12mM DCIP、250mM D-山梨糖醇、0.75%n-辛基葡糖苷和酶溶液,總體積為1.0ml。使用pH5.0時DCIP的摩爾消光系數(shù)ε=5,600cm-1M-1。酶活性的一個單位定義為每分鐘酶催化減少1μmol DCIP的量。
也可用Ferric-Dupanol法(Wood,W.A.等人,酶學(xué)方法,5287(1962))測定實施例1步驟6描述的重建亞基的酶活性。單一的或者不同組合的亞基蛋白質(zhì)于25℃預(yù)溫育5分鐘。加入10mM(終濃度)高鐵氰化鉀和250mM(終濃度)D-山梨糖醇開始反應(yīng)。一段合適的時間后,加入硫酸鐵-月桂硫酸鈉溶液(Fe2(SO4)3·nH2O 5g/L、月桂硫酸鈉3g/L和85%的磷酸95ml/L)終止反應(yīng),并且用分光光度計于660nm處測定普魯士色的吸收。
步驟5離子-交換層析法溶解的級分上樣于經(jīng)10mM醋酸鈉(pH5.0)平衡過的CM-TSK 650(S)(Merck)柱(2.5×20cm)。用醋酸鈉線性梯度(從10mM至500mM)洗脫CM-TSK柱。合并活性級分并用膜濾器(Amicon,YM10)超濾濃縮,然后上樣于DEAE-TSK650(S)(Merck)柱(2.5×20cm)。DEAE-TSK柱用pH5.0或pH6.0的10mM醋酸鈉(pH5.0)無梯度洗脫。
如圖1所示,于pH6.0洗脫時(圖1-B),活性峰的分辨率遠高于pH5.0的洗脫(圖1-A),且酶活性峰I和II完全分開。洗脫后立即測量級分的酶活性,以及洗脫后1小時測量級分的酶活性,發(fā)現(xiàn)pH5.0時一同洗脫下來的峰I和II級分的酶活性隨著時間的變化沒有明顯的不同。然而對于pH6.0時分別洗脫下來的峰I和II級分,峰I的酶活性在洗脫后1小時內(nèi)降至小于最初值的十分之一,而峰II的酶活性仍然不變。
SDS-PAGE(Laemmli,U.K.,自然(nature),227,680(1970))分析DEAE-TSK柱于pH6.0時洗脫下來的包含峰I和II的級分(圖2)。圖2-A顯示峰I的級分。列M顯示標準的分子量標記。如列1至4所示,可觀察到75kDa的第一個亞基條帶和50kDa的第二個亞基條帶,但沒有觀察到29kDa的第三個亞基條帶。在這種條件下,洗脫后1小時,酶活性減少十倍多。圖2-B顯示峰II的級分。列M顯示標準的分子量標記。如列5至8所示,可觀察到峰II級分除了包含75kDa和50kDa的亞基外,還包含29kDa的第三個亞基條帶。該觀察表明29kDa的第三個亞基可能在SDH的穩(wěn)定性方面起著重要作用。
步驟6用不同亞基重建SDH因為在DEAE柱層析中,將洗脫緩沖液的pH從5.0增加至6.0可提高層析峰的分辨率,故將洗脫緩沖液的pH進一步增至6.5。如實施例1步驟5所述的、經(jīng)CM-TSK 650(S)柱層析得到的、部分純化SDH上樣于用20mM磷酸鈉緩沖液(pH6.5)預(yù)平衡的DEAE-TSK 650(S)柱(2.5×16.5cm),并且用180ml同一緩沖液無梯度洗脫,然后用20mM和500mM磷酸鈉緩沖液(pH6.5)各160ml進行梯度洗脫。SDS-PAGE分析柱級分。
如圖3所示,在無梯度洗脫過程中,75kDa的第一個亞基最先洗脫(峰I),然后是29kDa的第三個亞基(峰II),并且在梯度洗脫過程中,50kDa的第二個亞基稍后洗脫(峰III)。如圖4所示,這三個峰的SDS-PAGE分析表明這三個亞基基本上是純的,并且相互間完全分開。
由于在非變性條件下,三個亞基可被純化并分離為單一的種類,故進行了重建實驗以確定每個亞基在SDH酶催化活性中的作用。將pH6.5時從DEAE柱洗脫的每個亞基約100pmol,或單獨或以不同組合預(yù)孵育,用實施例1步驟4描述的Ferric-Dupanol法測定酶活性(表2)。單獨的每個亞基顯示極低水平的酶活性。當?shù)谝粋€亞基和第二個亞基重建時,與單獨的第一個亞基相比較,酶活性提高了2倍。向第一個亞基中以及第一個和第二個亞基的混合物中加入第三個亞基時,酶活性分別提高了30倍和20倍,這些結(jié)果表明第三個亞基對SDH的催化活性及該酶的穩(wěn)定性起著重要作用。
表2
實施例2SDH亞基N-末端氨基酸序列的測定對實施例1制備的純化SDH進行SDS-PAGE(12.5%凝膠),并將分離的蛋白質(zhì)電印跡至聚偏二氟乙烯(PVDF)膜(Bollag,D.M.和Edelstein,S.J.,蛋白質(zhì)方法(Protein Methods),Wiley-Liss,Inc.,8(1991))。麗春紅S染色觀察后,將含有每個SDH亞基的膜部分切成片,并且每個亞基的膜片直接用氨基酸序列分析儀(Applied Biosystems,Model 477A)分析N-末端氨基酸序列。
表3顯示了所得到的第一個和第三個亞基的數(shù)據(jù)(SEQ ID Nos9和11)。沒有得到第二個亞基的N-末端氨基酸序列,很可能因為存在封閉的N-末端。封閉的N-末端的類似發(fā)現(xiàn)已有報道,其為另一個醋酸菌Acetobacter pasteurianus(Takemura,H.等人細菌學(xué)雜志(J.Bacteriol.),175,21,6857(1993))的乙醇脫氫酶復(fù)合體之細胞色素c亞基,其中將N-末端的封閉歸因于N-末端谷氨酸殘基被修飾為焦谷氨酸殘基,在對N-末端氨基酸測序時后者抗Edman降解。
因此,為了得到純化的SDH之第二個亞基的N-末端序列,對分離的SDH蛋白質(zhì)首先用焦谷氨酸氨肽酶處理,以釋放出潛在的被封閉N-末端。簡而言之,將實施例1純化的SDH約50pg溶解于消化緩沖液(100mM磷酸鈉緩沖液、10mM EDTA、5mM二硫蘇糖醇和5%(v/v)甘油,pH8.0),并與3.75g焦谷氨酸氨肽酶(Boehringer Mannheim)4℃溫育18小時,然后于25℃額外溫育4小時。溫育后,將反應(yīng)混合物進行SDS-PAGE,電印跡至PDVF膜,并切下膜上的第二個亞基條帶,然后如上所述分析N-末端氨基酸序列。在表3中SEQ ID NO10顯示了N-末端氨基酸序列的10個殘基。
表3
實施例3第三個亞基內(nèi)部氨基酸序列的測定對于第三個亞基,除測定了其N-末端氨基酸序列外,還測定其內(nèi)部氨基酸序列,以促進相應(yīng)基因的克隆。按以前所述方法(Matsudaira,P.T.,實用微測序蛋白質(zhì)和肽純化指導(dǎo)(A Practical Guide to Protein and PeptPurification for Microsequencing),學(xué)術(shù)出版社(Academic Press)p.37(1989)),將如實施例1步驟6所述分離的約7μg第三個亞基用胰蛋白酶(Boehringer Mannheim)消化,。用Brownlee SPHERI-5 RP 18柱(0.2×22cm)通過HPLC分離胰蛋白酶消化物,并將該柱用15-70%乙腈以210微升/分鐘進行60分鐘的線性梯度洗脫。214nm處監(jiān)測洗脫物,并收集分離得好的三個肽峰(圖5中表示為1、5和7)并且如(實施例2)所述分析它們的氨基酸序列。表4中,峰1、5和7的內(nèi)部氨基酸序列顯示如下(分別為SEQ ID NO12、13和14)。
表4
實施例4含有SDH基因之一部分的1.53kb DNA片段的引物設(shè)計和分離根據(jù)第一個亞基的N-末端氨基酸序列(SEQ ID NO9),合成兩條簡并引物,引物1(5’-CCGGAATTCGAA(G)GAT(C)ACIGGIACIGC-3’)(SEQ ID NO15)和引物2(5’-ATT(C,A)ACIAAT(C)GCIGAT(C)CAA(G)CAT(C)CC-3’)(SEQ ID NO16)。
用Takeda和Shimizu法(Takeda和Shimizu,發(fā)酵生物工程雜志,72;1(1991))分離的弱氧化葡糖桿菌KCTC 2111基因組DNA用BamHI部分消化。質(zhì)粒pBluescript SK(Stratagene)用NaeI和BamHI限制性酶切,并將基因組DNA的BamHI部分消化產(chǎn)物連接至質(zhì)粒的BamHI位點。
按照單特異引物PCR(SSP-PCR)法(White,B.,SSP-PCR和基因組步移(SSP-PCR and genome walking),《分子生物學(xué)方法,PCR法》(Method in Mol.Biol.,PCR protocols),Humana Press,15339(1993))進行30個循環(huán)的聚合酶鏈反應(yīng)(PCR),以分離大小為1.53kb的克隆(#SDH2-1)。
如上制備的連接反應(yīng)混合物用基因特異性引物(引物1)和T7引物擴增。雖然屬的T7引物可與所有被連接片段的末端退火,而所得的產(chǎn)物只呈線性增長。但是,將基因特異性引物1和T7引物與特異性產(chǎn)物同時退火會導(dǎo)致特異性一級產(chǎn)物呈指數(shù)擴增。用巢式引物(基因特異性引物2)和T7引物進行二級PCR可產(chǎn)生特異性二級產(chǎn)物,其進一步證實了一級PCR的特異性。
將PCR產(chǎn)物連接至質(zhì)粒pT7 Blue(Novagen),并且用SEM法(Inoue,H.等人,基因,9623(1990))轉(zhuǎn)化大腸桿菌DH5α。于含100μg/ml氨芐青霉素的LB培養(yǎng)基中(1%Bacto-Tryptone、0.5%酵母提取物和1%NaCl)培養(yǎng)轉(zhuǎn)化子。然后,用堿裂解法提取質(zhì)粒(Sambrook,J.等人,分子克隆,CSH Press,p.125(1988))。
以這個質(zhì)粒作為模板,用引物1或者引物2與T7引物進行PCR,產(chǎn)生陽性反應(yīng)。#SDH2-1片段的部分核苷酸測序進一步證實了引物1結(jié)合位點下游推導(dǎo)出的氨基酸序列與實驗測定的N-末端氨基酸序列相匹配。但#SDH2-1只包含第一個亞基基因的一部分。
實施例5以1.53kb DNA片段作為探針,分離包含SDH亞基基因的λGEM5-1克隆用DIG標記和檢測試劑盒Kit(使用DIG系統(tǒng)進行濾膜雜交的用戶指南(The DIG System User’s Guide for Filter Hybridization),p.6-9,Boehringer Mannheim(1993))標記實施例4分離的#SDH2-1。
為了構(gòu)建弱氧化葡糖桿菌KCTC 2111的基因組DNA文庫,將按照實施例4所述方法從弱氧化葡糖桿菌KCTC 2111分離的基因組DNA用Sau3A I部分消化。部分消化的DNA于0.8%的瓊脂糖凝膠電泳,用QLAEXII Gel提取試劑盒(QIAGEN)洗脫大小在15至23kb的DNA。然后,將洗脫的DNA連接至λGEM-11載體(Promega)的BamHI位點。根據(jù)指導(dǎo)手冊,用Packagene體外包裝體系(Promega)將連接混合物包裝入噬菌體λ顆粒。大腸桿菌LE392細胞30℃生長于含0.2%麥芽糖和10mM MgSO4的TB培養(yǎng)基(1%Bacto-Tryptone和0.5%NaCl)中,當OD600達到0.6后存貯在4℃。將包裝混合物加入細胞懸液,并將該混合物于37℃溫育30分鐘,以引起感染。向這個混合物中加入3ml融化的(45℃)TB頂層瓊脂(在含10mM MgSO4的TI3培養(yǎng)基中有0.8%Bacto-Agar),輕輕渦旋并立即倒于LB平板上。平板于37℃倒置溫育過夜。
將λ噬菌斑固定于尼龍膜(Amersham),并用預(yù)雜交液(5×SSC,1%(w/v)封閉試劑、0.1%N-十二烷基肌氨酸、0.02%SDS和50%(v/v)甲酰胺)在雜交爐中(Hybaid)對膜進行預(yù)雜交,42℃,3小時。然后用雜交液(用預(yù)雜交液稀釋的、DIG-標記的#SDH2-1探針)進行膜雜交,42℃,16小時。通過DIG-標記的#SDH2-1探針的噬菌斑雜交(使用DIG系統(tǒng)進行濾膜雜交的用戶指南。Boehringer Mannheim(1993)),在約20,000個λ噬菌體的噬菌斑中有11個噬菌斑給出陽性信號。
從陽性λ克隆分離λDNAs,并用λDNA純化試劑盒(Stratagene)純化。分離的λDNAs用BamHI消化,并進行0.7%瓊脂糖凝膠電泳。將凝膠上分離的DNA片段轉(zhuǎn)移至尼龍膜,并如上述同樣的條件下,用#SDH2-1作為探針,再次進行Southern雜交分析。選擇了一個給出陽性信號的克隆,并用XhoI從克隆中切下15kb的插入DNA,然后將其克隆入pBluescript SK的XhoI位點,得到λGEM5-1。用一些不同的限制性酶消化,繪制λGEM5-1克隆的圖譜。
實施例6λGEM5-1克隆中5.7kb PstI片段核苷酸序列的測定實施例5獲得的陽性克隆,λGEM5-1,用一些不同的限制性酶消化,繪制圖譜,并且如實施例5所述進行Southern雜交分析。一個與#SDH2-1雜交的5.7kb PstI片段被亞克隆,并且測定了其核苷酸序列。為了使DNA測序簡單化,用限制性酶組KpnI-PstI、NotI-SacII和PstII-SacI分別構(gòu)建了三個重疊的亞克隆S1、S2和S3,如圖7所示。用ExoIII-Mungbean缺失試驗盒(Stratagene)對每一個亞克隆制備了一系列的刪除克隆。用染料末端終止循環(huán)測序方便反應(yīng)試劑盒(AppliedBiosystems)進行核苷酸測序反應(yīng),并于自動的DNA測序儀(AppliedBiosystems,Model 373A)測定序列。
圖8顯示了5.7kb PstI片段中4,830bp的核苷酸序列(SEQ IDNO7)。測序的DNA包含兩個開放讀碼框(ORFs),分別具有2,265個核苷酸和1,437個核苷酸。第一個ORF編碼第一個亞基。第一個亞基基因前為SD序列,“AGGA”位于651-654bp。第一個亞基的34個氨基酸信號序列位于SEQ ID NO7的665-766bp。第一個亞基蛋白質(zhì)成熟部分的編碼序列位于SEQ ID NO7的767-2,929bp,其編碼720個氨基酸的多肽,推導(dǎo)出的N-末端氨基酸序列與通過N-末端氨基酸序列分析而得到的15個氨基酸殘基正好一致。
第二個ORF接在第一個ORF后,這兩個ORF被一個短的基因間隔區(qū)隔開。第二個ORF編碼第二個亞基。第二個亞基基因的SD序列(AGGA)位于SEQ ID NO7的2,950-2,953bp,并且結(jié)構(gòu)基因位于SEQID NO7的2,964-4,400bp。第二個亞基基因編碼478個氨基酸的多肽,其中包括36個氨基酸的信號序列。推導(dǎo)出的成熟多肽的氨基酸序列與將樣品用焦谷氨酸氨肽酶處理后通過實驗所獲得的序列完全匹配。第二個亞基基因終止密碼子的下游發(fā)現(xiàn)了反轉(zhuǎn)重復(fù)序列。
第一個和第二個亞基成熟蛋白質(zhì)的計算分子量分別為79kDa和48kDa,其分別與SDS-PAGE測定的實驗值75kDa和50kDa相一致。
此外,也發(fā)現(xiàn)了出現(xiàn)在第一個亞基中的特征PQQ-結(jié)合序列,共有序列表征性地出現(xiàn)在PQQ-依賴的脫氫酶的氨基和羧基末端。表5中,存在于氨基末端部分的特征PQQ-結(jié)合序列顯示為SEQ ID NO17,存在于羧基末端部分的特征序列顯示為SEQ ID NO18(此處,X表示任意氨基酸)。氨基末端特征序列位于812-898bp,羧基末端序列位于1,490-1,555bp。這些數(shù)據(jù)提供了額外證據(jù)證明第一個亞基包含作為輔因子的吡咯并喹啉醌(PQQ)。
表5
此外,也發(fā)現(xiàn)了位于第一個亞基基因的2,612-2,626bp處一個單一的血紅素結(jié)合序列(下表6的SEQ ID NO19),以及位于第二個亞基基因中的三個血紅素結(jié)合序列,位于以下位置3,129-3,143;3,573-3,587和3,981-3,995bp(此處,XA表示任意氨基酸,XB表示任意不同于XA的氨基酸)。
表6
同源序列的數(shù)據(jù)庫檢索確定了第一個亞基基因的DNA序列與許多包含輔因子吡咯并喹啉醌(PQQ)的脫氫酶具很大程度的相似性特別是,Acetobacter polyoxogenes的乙醇脫氫酶(Tamaki,T.等人,生物化學(xué)與生物物理學(xué)報(Biochem.Biophys.Acta),1088,292(1991))和Acetobacteraceti的乙醇脫氫酶(Inoue,T.等人,細菌學(xué)雜志,171,3115(1989))與第一個亞基分別有77%和70%相同。第二個亞基基因的數(shù)據(jù)庫檢索提供了它與弱氧化葡糖桿菌IFO12528(Takeda和Shimizu,發(fā)酵生物工程雜志,72;1(1991))的細胞色素c具最大程度的相似性,匹配的核苷酸序列的同一性為83%,氨基酸序列的同一性為88%。
實施例7320bp DNA片段的引物設(shè)計和PCR克隆,該片段包含第三個亞基基因的一部分實施例6所述的第一個和第二個亞基基因的核苷酸序列分析表明分離的操縱子克隆不包含第三個亞基基因。進一步對5’和3’側(cè)翼區(qū)測序也未能顯示第三個亞基的存在。因此,為了分離編碼第三個亞基的基因,基于氨基酸序列信息合成簡并引物,以通過PCR產(chǎn)生一段用作探針的短DNA片段,其包含第三個亞基基因的一部分。
基于實施例2獲得的第三個亞基成熟蛋白質(zhì)之N-末端氨基酸序列(SEQ ID NO11)以及實施例3獲得的胰蛋白酶消化肽的內(nèi)部氨基酸序列之一(SEQ ID NO13),分別合成兩條簡并引物,引物3(5’-GGGAATTCTTT(C)CAA(G)GAA(G)ATGAAT(C)AA-3’)(SEQ IDNO20)和引物4(5’-GGGAATTCTTGAAA(G)CC NGC A(G)TCA(G)TA-3’)(SEQ ID NO21)。
用Takeda和Shimizu法(Takeda和Shimizu,發(fā)酵生物工程雜志,72;1(1991))制備的弱氧化葡糖桿菌KCTC 2111基因組DNA作為模板,用引物3和4進行PCR反應(yīng)。反應(yīng)產(chǎn)生了一條320bp的DNA片段。將該320bp PCR產(chǎn)物連接至pBluescript SK(Stratagene),并且用SEM法(Inoue,H.等人,基因(Gene),9623(1990))轉(zhuǎn)化大腸桿菌DH5α。于含100μg/ml氨芐青霉素的LB培養(yǎng)基中培養(yǎng)轉(zhuǎn)化子。然后,用堿裂解法提取質(zhì)粒(Sambrook,J.等人,分子克隆,CSH Press,p.125(1988))。以這個質(zhì)粒DNA作為模板,用引物3和引物4進行PCR反應(yīng)確證亞克隆。320bp片段的部分核苷酸測序進一步證實了引物3結(jié)合位點下游推導(dǎo)出的氨基酸序列與實驗測定的N-末端氨基酸序列相匹配。但320bp片段只包含第三個亞基基因的N-末端部分。
實施例8以320bp DNA片段作為探針,分離第三個亞基基因用DIG標記和檢測試劑盒(使用DIG系統(tǒng)進行濾膜雜交的用戶指南,p.6-9,Boehringer Mannheim(1993))標記(實施例7)分離的320bp DNA片段。對Takeda和Shimizu法(Takeda和Shimizu,發(fā)酵生物工程雜志,72;1(1991))分離的弱氧化葡糖桿菌KCTC 2111基因組DNA用BamHI、ClaI、EcoRI、HindIII、PstI或XhoI消化,0.8%的瓊脂糖凝膠電泳,并如所述(Southern,E.M.,分子生物學(xué)雜志(J.Mol.Biol.)98,503(1975))轉(zhuǎn)移至尼龍膜(NYTRAN,Schleicher & Schuell)。用預(yù)雜交液(5×SSC,1%(w/v)封閉試劑、0.1%N-十二烷基肌氨酸、0.2%SDS和50%(v/v)甲酰胺)在雜交爐中(Hybaid)對膜進行預(yù)雜交,42℃,2小時。然后用雜交液(用預(yù)雜交液稀釋的、DIG-標記的探針)進行膜雜交,42℃,12小時。對所用的每一個酶Southern雜交均給出強的分散信號。洗脫對應(yīng)于陽性信號的、位于4.5kb ClaI處的DNA,并克隆于pBlueseript SK,以構(gòu)建一個小文庫。如上所述通過重復(fù)Southern雜交篩選該小文庫,以得到陽性克隆。選擇一個給出了陽性信號的克隆并指定為ClaI-#69。圖9表示ClaI-#69的限制性酶圖譜。
實施例9包含第三個亞基的4.5kb ClaI片段之核苷酸序列分析測定并分析了在4.5kb ClaI-#69克隆的中第三個亞基基因的核苷酸序列。為了使DNA測序簡單化,對一些重疊的限制性片段亞克隆,并測定了每一個克隆的核苷酸序列。用染料末端終止循環(huán)測序方便反應(yīng)試劑盒(Applied Biosystems)進行核苷酸測序反應(yīng),并于自動的DNA測序儀(Applied Biosystems,Model 373A)測定序列。
圖10顯示了4.5kb ClaI片段中2700bp的核苷酸序列(SEQ IDNO8)。所測序的DNA中包含一個具有921個核苷酸的開放讀碼框(ORF),其編碼第三個亞基多肽。第三個亞基基因前為潛在的SD序列(AGG),其位于1,375-1,377bp。第三個亞基多肽的氨基酸信號序列位于1,384-1,461bp。第三個亞基蛋白質(zhì)成熟部分的編碼序列位于1,462-2,304bp,其編碼一個具有280個氨基酸的多肽,所推導(dǎo)出的N-末端氨基酸序列與通過N-末端氨基酸序列分析而得到的25個氨基酸殘基正好一致。第三個亞基成熟蛋白質(zhì)的計算分子量為29,552Da,其與SDS-PAGE測定的實驗值29kDa相一致。
INDICATIONS RELATING TO A DEPOSITED MICROORGANISM(PCT Rule 13bis)
INDICATIONS RELATING TO A DEPOSITED MICROORGANISM(PCT Rule 13bis)
INDICATIONS RELATING TO A DEPOSITED MICROORGANISM(PCT Rule 13bis)
PCT/IB 99/00736
INDICATIONS RELATING TO A DEPOSITED MICROORGANISM(PCT Rule 13bis)
序列表<110>Choi,Eui-SungRhee,Sang-KiLee,Eun-Hae<120>弱氧化葡糖桿菌山梨糖醇脫氫酶基因及其使用方法<130>1533.087CN00<140><141><150>PCT/IB99/00736<151>1999-04-23<160>87<170>PatentIn Ver.2.0<210>1<211>2265<212>DNA<213>弱氧化葡糖桿菌<400>1atggtttctg gtctactgac gccgatcaac gttacgaaga agcgccttct gggttgcgct 60gctgctctgg cattctgcgc cacctctcct gtcgccctgg ctgaggacac aggaacagcc 120attacaaacg ccgaccagca tccgggtgac tggatgagct atggccggac ctattccgag 180cagcgctaca gcccgctgga tcagatcacc aaggacaatg cgagcaatct gaagctggca 240tggcactacg atctggatac caaccgtggt caggaaggta cgccgctgat cgttgatggc 300gtcatgtacg ccaccacaaa ctggagcaag atgaaggctc tggatgcagc tacgggcaag 360ctgctgtggt cttacgatcc aaaggttcca ggcaacatcg ccgaccgcgg ctgctgcgat 420acggtcaacc gtggtgcagc ctactggaac ggcaaagtct atttcggcac cttcgacggt 480cgcctgattg ccctggatgc caagaccggc aagctggtct ggagcgtcta tacggttccc 540aaggaagcgc agctgggtca ccagcgctcc tacacggttg acggtgctcc ccgtatcgcc 600aagggcaagg tcatcatcgg caacggcggt gcagagttcg gcgcccgtgg cttcgtgacg 660gcgtatgacg ctgaaacggg aaagatggac tggcgcttct tcaccgttcc gaaccctgac 720aacaagccgg acggcgcagc gtctgacgac gtgctgatgt ccaaggctta tccgacatgg 780ggcaagggcg gcgcgtggaa gcagcagggc ggtggcggta ccgtctggga ttcgctgatc 840tatgaccctg taacggatct cgtctatctg ggcgtcggta acggctcgcc atggaactac 900aagttccgtt ctgaaggaaa aggcaacaac ctcttcctcg gcagcatcgt ggccatcaat 960cctgacaccg gcaaatacgt ctggcatttc caggaaacgc caatggacca gtgggattat 1020acctcggttc agcagatcat ggccctcgac atgccggtca atggcgaaat gcgccatgtg 1080ctcgtgcatg cgccgaagaa cggcttcttc tatatcattg atgccaagac cggtaagttc 1140atctccggca agccgtacac ctacgagaac tgggccaatg gcctcgatcc ggtaacgggt 1200cgtccgaact acaatccaga tgctctctgg acgctgaacg gcaagccctg gtacggcatc 1260cccggcgatc tgggtggtca taacttcgct gccatggctt acagcccaca gacgaagctg 1320gtttacattc ccgcccagca ggttcccttc gtttacgatc cgcagaaggg tggcttcaag 1380gctcaccacg acagctggaa ccttggcctc gacatgaaca agatcggcct gcttgatgac 1440aacgatccac agcacaaggc tgacaaggcc cagttcctga aggatctgaa gggctggatc 1500gttgcatggg atccgcagaa gcagcaggca gccttcacgg ttgaccacaa gggtccgtgg 1560aatggcggtc ttctggcaac ggctggtggc gttctgttcc agggtctcgc caacggtgag 1620ttccacgcct acgacgcgac gacgggtaag gatctcttca ccttcccagc acagagcgcc 1680atcattgccc cgccagtcac ctacacagcc aacggcaagc agtatgttgc ggttgaagtg 1740ggctggggcg gtatctatcc gttcttcctg ggcggcgtag cccgtacgtc cggctggacc 1800gtcaaccact cccggatcat cgcgttcgct ctggacggca acgacaagct gccagccaag 1860aacgagctcg gcttcgttcc agtgaagccg cctgagaaat gggatgaagc caagatcaag 1920gacggctact tccagttcca gacctattgc gcagcctgcc atggtgacaa cggtatctcc 1980ggcggtgttc tgccagacct gcgctggtcc ggtgcgatcc gtggagagga gaagttctac 2040aagctcgtcg gcaagggtgc tctaacggcc tacggtatgg accgtttcga cacgtccatg 2100tcgccagctg aaatcgaaga catccgcaac ttccttgtga agcgcgccaa cgagtcctac 2160gcagacgaag tcaaggcccg aaagaatgag gcaggcgtcc ctaacggcga attcctcaac 2220gtccctcagg gttcggttgc gcctgcaacg ccggaccatc cgtaa 2265<210>2<211>1437<212>DNA<213>弱氧化葡糖桿菌<400>2atgctcaagg cattaactcg ggacagactg gtatctgaga tgaaacaggg atggaaatac 60gcggccgcag tcggcctcat ggcagtgtct ttcggtgctg cccaagccca ggacgctgat 120gacgccctga ttcagcgcgg tgcctacgtg gcccgcctgt ctgactgcgt tgcctgccat 180accgcactac acggccagcc ttttgctggt ggtctggaga tcaagagccc gatcggcacg 240atctactcca ccaacatcac gcctgacccg aaatacggta tcggcaacta tacactcgaa 300gatttcacga aggcgatccg taagggtatc cgcaaggacg gcgcgacggt ttatccggcc 360atgccgtatc ctgagttcgc tcgcctgtct gatgacgaca tcaaggccat gtatgccttc 420ttcatgcatg gcgtgaagcc ggtcgccctt cagaacaagc agccggacat ctcctggccg 480atgaacatgc gctggccgtt ggccatctgg cgcgcgatgt ttgttccgac tgtcacacca 540ggcctcgaca agagcatctc cgatccggaa gtggcgcgtg gcgaatacct cgtgaatggc 600ccaggccatt gtggcgagtg tcatacgccc cgtggcatgg ccatgcaggt caagggctat 660acggccaagg acggcaacgc ttacctctcc ggtggcgcac cgatcgacaa ctggattgct 720cccagcctgc gtagcaatag cgacacgggt ctgggtcgct ggtctgaaga cgacattgcc 780gagttcctga agagcggccg tatcgaccat tctgccgtct tcggtggcat ggctgacgtg 840gtggcctaca gcacccagca ctggaccgac gacgatctgc acgcaacggc caagtacctg 900aagagcatgc cggccgttcc ggaaggcaaa aacctgggtc aggatgacgg caaggccacg 960gccctgctcg aagccggtgg caagggtgat gcaggcgcag aggtttacct ccacaactgt 1020gccatctgcc atatgaacga tggcactggt gtcaaccgca tgttcccgcc gctggctggc 1080aacccggtcg tcatcacgga caatgcaacc tcaatggcca acatcgtgac attcggcggt 1140attctgcctc cgacgaatac ggcgccatct gctgttgcca tgccgggctt ccgcgatcat 1200ctgtctgacc agcagatcgc cgatgttgtg aacttcatgc gcaagagctg gggcaaccag 1260gctccgggaa ccctgtctgc ctcggatatc cgcaagctcc gcacatcggg tactgcggtt 1320tccacggccg gctggaacgt ctcttccaag ggctggatgg cctacatgcc gcagccttat 1380ggcgaaggct ggaccttctc cccgcagaca cacacgggcg tggatcaggc tcagtaa1437<210>3<211>921<212>DNA<213>弱氧化葡糖桿菌<400>3atgaagacca agacgcttcc gctggccctt ctgtctctcg ctcttggcgg gacggccctg 60tcagacccgg ctgccgcagc tggaaccccg ctgaaaattg gcgtttcctt tcaggaaatg 120aacaatccgt acttcgtcac catgaaggac gcattgcagg aagccgctgg cacgatcggt 180gcgaatgtca tcatcagtga tgcgcatcat gatgtttcca agcaggtgag tgacattgag 240gacatgatcc agcagggcgc gcagatcatc atcatcaacc cgaccgatac agtaggcgtc 300acgtccgtcg taaagagcgt tcatgacaag aacatcccga tcgtctcggt ggatgctcag 360gctggcggtc cgctcgatgc gtttgtgggg tccaagaact atgatgccgg cttcaaggcc 420tgcgagtatc tcgccacgac gatcaagagc ggcaatatcg gaatcatcga cggtatcccg 480gtcgttccca ttcttgagcg tgtcaaaggc tgcaaaaacg ctatcgccaa gcattcagat 540atcaagattg tcagcgttca gaacggcaag caggagcgcg atgaggctct gacggtggct 600gaaaacatgc tccaggccaa cccggatctg aaaggtatct tcagcgtcaa tgacaacgga 660tcgctcggtg tgctgtccgc tatcgaatcc agtggttcag acgtgaagct ggtcagcgtt 720gatggcaacc cggaagccgt gaaggccatc tacaagccag gctctcattt catcgctacg 780gctgcgcagt tcccccggca ggatatccgt ctggcactgg cgctcgccct tgccaggaaa 840tggggcgcag gcgtgccgaa ggtcctgcct gttgatgtcg agctgatcga cgcgacgaaa 900gccaagacgt tcagctggta a 921<210>4<211>754<212>PRT<213>弱氧化葡糖桿菌<400>4Met Val Ser Gly Leu Leu Thr Pro Ile Asn Val Thr Lys Lys Arg Leu1 5 10 15Leu Gly Cys Ala Ala Ala Leu Ala Phe Cys Ala Thr Ser Pro Val Ala20 25 30Leu Ala Glu Asp Thr Gly Thr Ala Ile Thr Asn Ala Asp Gln His Pro35 40 45Gly Asp Trp Met Ser Tyr Gly Arg Thr Tyr Ser Glu Gln Arg Tyr Ser50 55 60Pro Leu Asp Gln Ile Thr Lys Asp Asn Ala Ser Asn Leu Lys Leu Ala65 70 75 80Trp His Tyr Asp Leu Asp Thr Asn Arg Gly Gln Glu Gly Thr Pro Leu85 90 95Ile Val Asp Gly Val Met Tyr Ala Thr Thr Asn Trp Ser Lys Met Lys100 105 110Ala Leu Asp Ala Ala Thr Gly Lys Leu Leu Trp Ser Tyr Asp Pro Lys115 120 125Val Pro Gly Asn Ile Ala Asp Arg Gly Cys Cys Asp Thr Val Asn Arg130 135 140Gly Ala Ala Tyr Trp Asn Gly Lys Val Tyr Phe Gly Thr Phe Asp Gly145 150 155 160Arg Leu Ile Ala Leu Asp Ala Lys Thr Gly Lys Leu Val Trp Ser Val165 170 175Tyr Thr Val Pro Lys Glu Ala Gln Leu Gly His Gln Arg Ser Tyr Thr180 185 190Val Asp Gly Ala Pro Arg Ile Ala Lys Gly Lys Val Ile Ile Gly Asn195 200 205Gly Gly Ala Glu Phe Gly Ala Arg Gly Phe Val Thr Ala Tyr Asp Ala210 215 220Glu Thr Gly Lys Met Asp Trp Arg Phe Phe Thr Val Pro Asn Pro Asp225 230 235 240Asn Lys Pro Asp Gly Ala Ala Ser Asp Asp Val Leu Met Ser Lys Ala245 250 255Tyr Pro Thr Trp Gly Lys Gly Gly Ala Trp Lys Gln Gln Gly Gly Gly260 265 270Gly Thr Val Trp Asp Ser Leu Ile Tyr Asp Pro Val Thr Asp Leu Val275 280 285Tyr Leu Gly Val Gly Asn Gly Ser Pro Trp Asn Tyr Lys Phe Arg Ser290 295 300Glu Gly Lys Gly Asn Asn Leu Phe Leu Gly Ser Ile Val Ala Ile Asn305 310 315 320Pro Asp Thr Gly Lys Tyr Val Trp His Phe Gln Glu Thr Pro Met Asp325 330 335Gln Trp Asp Tyr Thr Ser Val Gln Gln Ile Met Ala Leu Asp Met Pro340 345 350Val Asn Gly Glu Met Arg His Val Leu Val His Ala Pro Lys Asn Gly355 360 365Phe Phe Tyr Ile Ile Asp Ala Lys Thr Gly Lys Phe Ile Ser Gly Lys370 375 380Pro Tyr Thr Tyr Glu Asn Trp Ala Asn Gly Leu Asp Pro Val Thr Gly385 390 395 400Arg Pro Asn Tyr Asn Pro Asp Ala Leu Trp Thr Leu Asn Gly Lys Pro405 410 415Trp Tyr Gly Ile Pro Gly Asp Leu Gly Gly His Asn Phe Ala Ala Met420 425 430Ala Tyr Ser Pro Gln Thr Lys Leu Val Tyr Ile Pro Ala Gln Gln Val435 440 445Pro Phe Val Tyr Asp Pro Gln Lys Gly Gly Phe Lys Ala His His Asp450 455 460Ser Trp Asn Leu Gly Leu Asp Met Asn Lys Ile Gly Leu Leu Asp Asp465 470 475 480Asn Asp Pro Gln His Lys Ala Asp Lys Ala Gln Phe Leu Lys Asp Leu485 490 495Lys Gly Trp Ile Val Ala Trp Asp Pro Gln Lys Gln Gln Ala Ala Phe500 505 510Thr Val Asp His Lys Gly Pro Trp Asn Gly Gly Leu Leu Ala Thr Ala515 520 525Gly Gly Val Leu Phe Gln Gly Leu Ala Asn Gly Glu Phe His Ala Tyr530 535 540Asp Ala Thr Thr Gly Lys Asp Leu Phe Thr Phe Pro Ala Gln Ser Ala545 550 555 560Ile Ile Ala Pro Pro Val Thr Tyr Thr Ala Asn Gly Lys Gln Tyr Val565 570 575Ala Val Glu Val Gly Trp Gly Gly Ile Tyr Pro Phe Phe Leu Gly Gly
580 585 590Val Ala Arg Thr Ser Gly Trp Thr Val Asn His Ser Arg Ile Ile Ala595 600 605Phe Ala Leu Asp Gly Asn Asp Lys Leu Pro Ala Lys Asn Glu Leu Gly610 615 620Phe Val Pro Val Lys Pro Pro Glu Lys Trp Asp Glu Ala Lys Ile Lys625 630 635 640Asp Gly Tyr Phe Gln Phe Gln Thr Tyr Cys Ala Ala Cys His Gly Asp645 650 655Asn Gly Ile Ser Gly Gly Val Leu Pro Asp Leu Arg Trp Ser Gly Ala660 665 670Ile Arg Gly Glu Glu Lys Phe Tyr Lys Leu Val Gly Lys Gly Ala Leu675 680 685Thr Ala Tyr Gly Met Asp Arg Phe Asp Thr Ser Met Ser Pro Ala Glu690 695 700Ile Glu Asp Ile Arg Asn Phe Leu Val Lys Arg Ala Asn Glu Ser Tyr705 710 715 720Ala Asp Glu Val Lys Ala Arg Lys Asn Glu Ala Gly Val Pro Asn Gly725 730 735Glu Phe Leu Asn Val Pro Gln Gly Ser Val Ala Pro Ala Thr Pro Asp740 745 750His Pro<210>5<211>478<212>PRT<213>弱氧化葡糖桿菌<400>5Met Leu Lys Ala Leu Thr Arg Asp Arg Leu Val Ser Glu Met Lys Gln1 5 10 15Gly Trp Lys Tyr Ala Ala Ala Val Gly Leu Met Ala Val Ser Phe Gly20 25 30Ala Ala Gln Ala Gln Asp Ala Asp Asp Ala Leu Ile Gln Arg Gly Ala35 40 45Tyr Val Ala Arg Leu Ser Asp Cys Val Ala Cys His Thr Ala Leu His50 55 60Gly Gln Pro Phe Ala Gly Gly Leu Glu Ile Lys Ser Pro Ile Gly Thr65 70 75 80Ile Tyr Ser Thr Asn Ile Thr Pro Asp Pro Lys Tyr Gly Ile Gly Asn85 90 95Tyr Thr Leu Glu Asp Phe Thr Lys Ala Ile Arg Lys Gly Ile Arg Lys100 105 110Asp Gly Ala Thr Val Tyr Pro Ala Met Pro Tyr Pro Glu Phe Ala Arg115 120 125Leu Ser Asp Asp Asp Ile Lys Ala Met Tyr Ala Phe Phe Met His Gly130 135 140Val Lys Pro Val Ala Leu Gln Asn Lys Gln Pro Asp Ile Ser Trp Pro145 150 155 160Met Asn Met Arg Trp Pro Leu Ala Ile Trp Arg Ala Met Phe Val Pro165 170 175Thr Val Thr Pro Gly Leu Asp Lys Ser Ile Ser Asp Pro Glu Val Ala180 185 190Arg Gly Glu Tyr Leu Val Asn Gly Pro Gly His Cys Gly Glu Cys His195 200 205Thr Pro Arg Gly Met Ala Met Gln Val Lys Gly Tyr Thr Ala Lys Asp210 215 220Gly Asn Ala Tyr Leu Ser Gly Gly Ala Pro Ile Asp Asn Trp Ile Ala225 230 235 240Pro Ser Leu Arg Ser Asn Ser Asp Thr Gly Leu Gly Arg Trp Ser Glu245 250 255Asp Asp Ile Ala Glu Phe Leu Lys Ser Gly Arg Ile Asp His Ser Ala
260 265 270Val Phe Gly Gly Met Ala Asp Val Val Ala Tyr Ser Thr Gln His Trp275 280 285Thr Asp Asp Asp Leu His Ala Thr Ala Lys Tyr Leu Lys Ser Met Pro290 295 300Ala Val Pro Glu Gly Lys Asn Leu Gly Gln Asp Asp Gly Lys Ala Thr305 310 315 320Ala Leu Leu Glu Ala Gly Gly Lys Gly Asp Ala Gly Ala Glu Val Tyr325 330 335Leu His Asn Cys Ala Ile Cys His Met Asn Asp Gly Thr Gly Val Asn340 345 350Arg Met Phe Pro Pro Leu Ala Gly Asn Pro Val Val Ile Thr Asp Asn355 360 365Ala Thr Ser Met Ala Asn Ile Val Thr Phe Gly Gly Ile Leu Pro Pro370 375 380Thr Asn Thr Ala Pro Ser Ala Val Ala Met Pro Gly Phe Arg Asp His385 390 395 400Leu Ser Asp Gln Gln Ile Ala Asp Val Val Asn Phe Met Arg Lys Ser405 410 415Trp Gly Asn Gln Ala Pro Gly Thr Leu Ser Ala Ser Asp Ile Arg Lys420 425 430Leu Arg Thr Ser Gly Thr Ala Val Ser Thr Ala Gly Trp Asn Val Ser435 440 445Ser Lys Gly Trp Met Ala Tyr Met Pro Gln Pro Tyr Gly Glu Gly Trp450 455 460Thr Phe Ser Pro Gln Thr His Thr Gly Val Asp Gln Ala Gln465 470 475<210> 6<211> 306<212>PRT<213>弱氧化葡糖桿菌<400> 6Met Lys Thr Lys Thr Leu Pro Leu Ala Leu Leu Ser Leu Ala Leu Gly1 5 10 15Gly Thr Ala Leu Ser Asp Pro Ala Ala Ala Ala Gly Thr Pro Leu Lys20 25 30Ile Gly Val Ser Phe Gln Glu Met Asn Asn Pro Tyr Phe Val Thr Met35 40 45Lys Asp Ala Leu Gln Glu Ala Ala Gly Thr Ile Gly Ala Asn Val Ile50 55 60Ile Ser Asp Ala His His Asp Val Ser Lys Gln Val Ser Asp Ile Glu65 70 75 80Asp Met Ile Gln Gln Gly Ala Gln Ile Ile Ile Ile Asn Pro Thr Asp85 90 95Thr Val Gly Val Thr Ser Val Val Lys Ser Val His Asp Lys Asn Ile100 105 110Pro Ile Val Ser Val Asp Ala Gln Ala Gly Gly Pro Leu Asp Ala Phe115 120 125Val Gly Ser Lys Asn Tyr Asp Ala Gly Phe Lys Ala Cys Glu Tyr Leu130 135 140Ala Thr Thr Ile Lys Ser Gly Asn Ile Gly Ile Ile Asp Gly Ile Pro145 150 155 160Val Val Pro Ile Leu Glu Arg Val Lys Gly Cys Lys Asn Ala Ile Ala165 170 175Lys His Ser Asp Ile Lys Ile Val Ser Val Gln Asn Gly Lys Gln Glu180 185 190Arg Asp Glu Ala Leu Thr Val Ala Glu Asn Met Leu Gln Ala Asn Pro195 200 205Asp Leu Lys Gly Ile Phe Ser Val Asn Asp Asn Gly Ser Leu Gly Val210 215 220Leu Ser Ala Ile Glu Ser Ser Gly Ser Asp Val Lys Leu Val Ser Val225 230 235 240Asp Gly Asn Pro Glu Ala Val Lys Ala Ile Tyr Lys Pro Gly Ser His245 250 255Phe Ile Ala Thr Ala Ala Gln Phe Pro Arg Gln Asp Ile Arg Leu Ala260 265 270Leu Ala Leu Ala Leu Ala Arg Lys Trp Gly Ala Gly Val Pro Lys Val275 280 285Leu Pro Val Asp Val Glu Leu Ile Asp Ala Thr Lys Ala Lys Thr Phe290 295 300Ser Trp305<210>7<211>4830<212>DNA<213>弱氧化葡糖桿菌<400> 7cgagaacgga agcccgctga aatcgacccg ttccccatca aaatactttt cgagaagatc 60acgaaccttc accaggagcg gcgtctcttc ctgatcgcgc ccccaccccc aatcgagagc 120aacaatacgc ccgtcatctt cactgatggt cagggctccg agatgggaat ggcaggaaag 180ctgtggcata cagatacgct gccccatccc ccggaaagcg tcaatcatgc ttccctaaaa 240gagtccctga gaaaaaaata catgcgtgtc acgcatatgc agggaggccg gtattctcaa 300ataacatatg ggatcatttt tgtatgattt catgaaatat tacgcacttt gttgagaaac 360tgccattttt tgtgtcaaac ctgcgacaga cactaaagct gttttggttg tttggttatt 420aagaataatt ctcatgtaat taagcgagcg attttacgcg gatagtgctc acggagacgt 480cagaagccca cgtttccgac aaacaataaa ataagcgagt agtaagttca cgcgatgcta 540cgttttccag acgacttgga gaaactgagg agcacctagg cacccacaga ggcgcctatc 600aggacttgga ttacgtctga ataccattaa caggaacagt ctttgcaaaa aggacagtcg 660gatcatggtt tctggtctac tgacgccgat caacgttacg aagaagcgcc ttctgggttg 720cgctgctgct ctggcattct gcgccacctc tcctgtcgcc ctggctgagg acacaggaac 780agccattaca aacgccgacc agcatccggg tgactggatg agctatggcc ggacctattc 840cgagcagcgc tacagcccgc tggatcagat caccaaggac aatgcgagca atctgaagct 900ggcatggcac tacgatctgg ataccaaccg tggtcaggaa ggtacgccgc tgatcgttga 960tggcgtcatg tacgccacca caaactggag caagatgaag gctctggatg cagctacggg 1020caagctgctg tggtcttacg atccaaaggt tccaggcaac atcgccgacc gcggctgctg 1080cgatacggtc aaccgtggtg cagcctactg gaacggcaaa gtctatttcg gcaccttcga 1140cggtcgcctg attgccctgg atgccaagac cggcaagctg gtctggagcg tctatacggt 1200tcccaaggaa gcgcagctgg gtcaccagcg ctcctacacg gttgacggtg ctccccgtat 1260cgccaagggc aaggtcatca tcggcaacgg cggtgcagag ttcggcgccc gtggcttcgt 1320gacggcgtat gacgctgaaa cgggaaagat ggactggcgc ttcttcaccg ttccgaaccc 1380tgacaacaag ccggacggcg cagcgtctga cgacgtgctg atgtccaagg cttatccgac 1440atggggcaag ggcggcgcgt ggaagcagca gggcggtggc ggtaccgtct gggattcgct 1500gatctatgac cctgtaacgg atctcgtcta tctgggcgtc ggtaacggct cgccatggaa 1560ctacaagttc cgttctgaag gaaaaggcaa caacctcttc ctcggcagca tcgtggccat 1620caatcctgac accggcaaat acgtctggca tttccaggaa acgccaatgg accagtggga 1680ttatacctcg gttcagcaga tcatggccct cgacatgccg gtcaatggcg aaatgcgcca 1740tgtgctcgtg catgcgccga agaacggctt cttctatatc attgatgcca agaccggtaa 1800gttcatctcc ggcaagccgt acacctacga gaactgggcc aatggcctcg atccggtaac 1860gggtcgtccg aactacaatc cagatgctct ctggacgctg aacggcaagc cctggtacgg 1920catccccggc gatctgggtg gtcataactt cgctgccatg gcttacagcc cacagacgaa 1980gctggtttac attcccgccc agcaggttcc cttcgtttac gatccgcaga agggtggctt 2040caaggctcac cacgacagct ggaaccttgg cctcgacatg aacaagatcg gcctgcttga 2100tgacaacgat ccacagcaca aggctgacaa ggcccagttc ctgaaggatc tgaagggctg 2160gatcgttgca tgggatccgc agaagcagca ggcagccttc acggttgacc acaagggtcc 2220gtggaatggc ggtcttctgg caacggctgg tggcgttctg ttccagggtc tcgccaacgg 2280tgagttccac gcctacgacg cgacgacggg taaggatctc ttcaccttcc cagcacagag 2340cgccatcatt gccccgccag tcacctacac agccaacggc aagcagtatg ttgcggttga 2400agtgggctgg ggcggtatct atccgttctt cctgggcggc gtagcccgta cgtccggctg 2460gaccgtcaac cactcccgga tcatcgcgtt cgctctggac ggcaacgaca agctgccagc 2520caagaacgag ctcggcttcg ttccagtgaa gccgcctgag aaatgggatg aagccaagat 2580caaggacggc tacttccagt tccagaccta ttgcgcagcc tgccatggtg acaacggtat 2640ctccggcggt gttctgccag acctgcgctg gtccggtgcg atccgtggag aggagaagtt 2700ctacaagctc gtcggcaagg gtgctctaac ggcctacggt atggaccgtt tcgacacgtc 2760catgtcgcca gctgaaatcg aagacatccg caacttcctt gtgaagcgcg ccaacgagtc 2820ctacgcagac gaagtcaagg cccgaaagaa tgaggcaggc gtccctaacg gcgaattcct 2880caacgtccct cagggttcgg ttgcgcctgc aacgccggac catccgtaac gggaaaccgt 2940cacgctgaaa ggaatgacgt gacatgctca aggcattaac tcgggacaga ctggtatctg 3000agatgaaaca gggatggaaa tacgcggccg cagtcggcct catggcagtg tctttcggtg 3060ctgcccaagc ccaggacgct gatgacgccc tgattcagcg cggtgcctac gtggcccgcc 3120tgtctgactg cgttgcctgc cataccgcac tacacggcca gccttttgct ggtggtctgg 3180agatcaagag cccgatcggc acgatctact ccaccaacat cacgcctgac ccgaaatacg 3240gtatcggcaa ctatacactc gaagatttca cgaaggcgat ccgtaagggt atccgcaagg 3300acggcgcgac ggtttatccg gccatgccgt atcctgagtt cgctcgcctg tctgatgacg 3360acatcaaggc catgtatgcc ttcttcatgc atggcgtgaa gccggtcgcc cttcagaaca 3420agcagccgga catctcctgg ccgatgaaca tgcgctggcc gttggccatc tggcgcgcga 3480tgtttgttcc gactgtcaca ccaggcctcg acaagagcat ctccgatccg gaagtggcgc 3540gtggcgaata cctcgtgaat ggcccaggcc attgtggcga gtgtcatacg ccccgtggca 3600tggccatgca ggtcaagggc tatacggcca aggacggcaa cgcttacctc tccggtggcg 3660caccgatcga caactggatt gctcccagcc tgcgtagcaa tagcgacacg ggtctgggtc 3720gctggtctga agacgacatt gccgagttcc tgaagagcgg ccgtatcgac cattctgccg 3780tcttcggtgg catggctgac gtggtggcct acagcaccca gcactggacc gacgacgatc 3840tgcacgcaac ggccaagtac ctgaagagca tgccggccgt tccggaaggc aaaaacctgg 3900gtcaggatga cggcaaggcc acggccctgc tcgaagccgg tggcaagggt gatgcaggcg 3960cagaggttta cctccacaac tgtgccatct gccatatgaa cgatggcact ggtgtcaacc 4020gcatgttccc gccgctggct ggcaacccgg tcgtcatcac ggacaatgca acctcaatgg 4080ccaacatcgt gacattcggc ggtattctgc ctccgacgaa tacggcgcca tctgctgttg 4140ccatgccggg cttccgcgat catctgtctg accagcagat cgccgatgtt gtgaacttca 4200tgcgcaagag ctggggcaac caggctccgg gaaccctgtc tgcctcggat atccgcaagc 4260tccgcacatc gggtactgcg gtttccacgg ccggctggaa cgtctcttcc aagggctgga 4320tggcctacat gccgcagcct tatggcgaag gctggacctt ctccccgcag acacacacgg 4380gcgtggatca ggctcagtaa gcctctccag accctgtcag tctgacagaa aagggcggtc 4440cggatacggg ccgccttttt cttttgtatt caggccgttt tcacaggatg gcatcctgca 4500ctacatatga aggcatgact cccttctcgt cttctgctcc gcagtcagtt tttcctttgg 4560caacaggcgc aggccgcgca gcattgccat catgcgcgcc aggacccgga agcgccgagc 4620ttctcaagag cctctgcggt tcccttcctg accctcgacg cgccacctgc gcagctgcgc 4680catcaaggcg aagtgctgga tcatgccgtg gttctctggc ttcctggacc gaaatcctac 4740accggcgaag acgggtgtcg aactccacct tcatgctgga cccgctgtta tcactcgcgt 4800tgcggatgct ctgaccgatc tgggtgcacg 4830<210>8<211>2700<212>DNA<213>弱氧化葡糖桿菌<400> 8cgaagcgatc gggacttttc agggagccgg gaagctggcc gcctgtctgg atcttctcgc 60cacactgacg tctgctccgt tcaggacgct gtccctcaaa ggggagacca aggctctcaa 120cagcccggaa atgcagcgga taagcggtgt catcacatcc ctgatggcca tggacccatc 180cgaaatccgg catgaccatc tggcgcagga tctgggcctc tgcgcatcca ccttctctcg 240ccagttccgt tctgcgacgg gcgacacatt catgtctttc ctgcatcggc tgcgggtgtg 300tcacgcgtgc catctgctgg ccagttccac actctcaatc acggaaatcg gggctgcttc 360cggcttcaac aacctgtcca attttaaccg catcttcctg cgcctgcgtg gctgcacgcc 420acgggaatac cgccgtcatg cccgcgaaat gacagccctt tcgccgacag acgccgcaga 480tttcctgaac tgaccgacaa gggaaaacag atcatgccaa cacttccaca acgtttttcc 540ctcgatggtc gcaaagctct tgtcacgggt gcatcccgcg ggcttggtgt tacgatctgc 600gacgttctga gtgctgcggg ggccgatatt gtcgccgttg cgcgttctga aaccgacatg 660gccgccacat gccggatcgt ggaaggccat ggtcgtcaat gcctcacggt tgttgccgat 720ctcagtgatc cgatggctcc ggacgctgtc gcgcagacag tgaacgcagc gtggggtggg 780gtggatattg tcgtcaacaa tgctggcgtc agtttccctc gccctctggt ggaacagacc 840gtcgaggagt gggacaccgt gcaggccatt aacctgcgtg cgccatggct tctcgcccgt 900gtcttcgctc cgggcatgat tgaacgcaag cgtgggaaaa tcatcaacat cagttcccag 960gccagctctg tcgcgctgat tgaccatggt gcttacgtcg catccaaggc cggtctgaac 1020ggtctcacca aggtcatgac ggcggaatgg gcggctcata acatacaggc caatgccatc 1080tgccccacag tcgtctggac gcccatgggt gaacgcgtct ggagcgttgg gaacaagctg 1140gaaaagctac tggaaaagat ccccgctggc cgtgtcgcaa caccggaaga tgtcgcggat 1200atagttctgt atctcgcctc cgacgcgtcg agcatggtca acgggcagga aatatttgtc 1260gatggcggat acacagccct ttaggccgcc acatcttcaa ataaagacat gtgattttac 1320ggttttaaca aggccatgtg cagggaatgg cctgcgcatt tcatgcagat caacaggtgt 1380aacatgaaga ccaagacgct tccgctggcc cttctgtctc tcgctcttgg cgggacggcc 1440ctgtcagacc cggctgccgc agctggaacc ccgctgaaaa ttggcgtttc ctttcaggaa 1500atgaacaatc cgtacttcgt caccatgaag gacgcattgc aggaagccgc tggcacgatc 1560ggtgcgaatg tcatcatcag tgatgcgcat catgatgttt ccaagcaggt gagtgacatt 1620gaggacatga tccagcaggg cgcgcagatc atcatcatca acccgaccga tacagtaggc 1680gtcacgtccg tcgtaaagag cgttcatgac aagaacatcc cgatcgtctc ggtggatgct 1740caggctggcg gtccgctcga tgcgtttgtg gggtccaaga actatgatgc cggcttcaag 1800gcctgcgagt atctcgccac gacgatcaag agcggcaata tcggaatcat cgacggtatc 1860ccggtcgttc ccattcttga gcgtgtcaaa ggctgcaaaa acgctatcgc caagcattca 1920gatatcaaga ttgtcagcgt tcagaacggc aagcaggagc gcgatgaggc tctgacggtg 1980gctgaaaaca tgctccaggc caacccggat ctgaaaggta tcttcagcgt caatgacaac 2040ggatcgctcg gtgtgctgtc cgctatcgaa tccagtggtt cagacgtgaa gctggtcagc 2100gttgatggca acccggaagc cgtgaaggcc atctacaagc caggctctca tttcatcgct 2160acggctgcgc agttcccccg gcaggatatc cgtctggcac tggcgctcgc ccttgccagg 2220aaatggggcg caggcgtgcc gaaggtcctg cctgttgatg tcgagctgat cgacgcgacg 2280aaagccaaga cgttcagctg gtaaattccg aaggcggccc cgaattccgg agggaacatt 2340atgactgaat ccagtcagac atctccagaa cttcttctgg cgcttgaggg aatctccaag 2400agttttccgg gagtccgggc gttgcggaat gtcagcctca gcctggagcg tggagaaatc 2460catgctctgc tgggggaaaa cggcgctgga aaatccacga tcatcaagat catgggcggt 2520atccagtctc aggatgaagg gcagatcttt ctcaacggaa aggagcgcca cttctccagc 2580tacaaggatg ccatcagcgc aggtatcggg attgtttttc aggaattcag cctgattcct 2640gaactcgatg ccgtggataa tattttcctc ggtcgtgaga tgcggaacgc tcttggcttt 2700<210>9<211>15<212>PRT<213>弱氧化葡糖桿菌<400>9Glu Asp Thr Gly Thr Ala Ile Thr Asn Ala Asp Gln His Pro Gly1 5 10 15<210>10<211>10<212>PRT<213>弱氧化葡糖桿菌<400>10Asp Ala Asp Asp Ala Leu Ile Gln Arg Gly1 5 10<210>11<211>25<212>PRT<213>弱氧化葡糖桿菌<400>11Ala Gly Thr Pro Leu Lys Ile Gly Val Ser Phe Gln Glu Met Asn Asn1 5 10 15Pro Tyr Phe Val Thr Met Lys Asp Ala20 25<210>12<211>5<212>PRT<213>弱氧化葡糖桿菌<400>12His Ser Asp Ile Lys1 5<210>13<211>7<212>PRT<213>弱氧化葡糖桿菌<400>13Asn Tyr Asp Ala Gly Phe Lys1 5<210>14<211>8<212>PRT<213>弱氧化葡糖桿菌<400>14Lys Trp Gly Ala Gly Val Pro Lys1 5<210>15<211>26<212>DNA<213>弱氧化葡糖桿菌<220><221>修飾的堿基<222>(18)<223>i<220><221>修飾的堿基<222>(21)<223>i<220><221>修飾的堿基<222>(24)<223>i<400>15ccggaattcg argayacngg nacngc 26<210>16<211>23<212>DNA<213>弱氧化葡糖桿菌<220><221>修飾的堿基<222>(6)<223>i<220><221>修飾的堿基<222>(12)<223>i<400>16athacnaayg cngaycarca rcc 23<210>17<211>29<212>PRT<213>弱氧化葡糖桿菌<220><221>不定<222>(1)<223>可以是D,E,或N<220><221>不定<222>(3)..(5)<223>可以是任意氨基酸<220><221>不定<222>(7)<223>可以是R或K<220><221>不定<222>(8)..(13)<223>可以是任意氨基酸<220><221>不定<222>(14)<223>可以是F,Y,或W<220><221>不定<222>(16)..(19)<223>可以是任意氨基酸<220><221>不定<222>(20)<223>可以是L,I,V,或M<220><221>不定<222>(21)..(23)<223>可以是任意氨基酸<220><221>不定<222>(25)..(27)<223>可以是任意氨基酸<220><221>不定<222>(29)<223>可以是R或K<400>17Xaa Trp Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Xaa1 5 10 15Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn Xaa Xaa Xaa Leu Xaa20 25<210>18<211>22<212>PRT<213>弱氧化葡糖桿菌<220><221>不定<222>(2)..(5)<223>可以是任意氨基酸<220><221>不定<222>(8)..(10)<223>可以是任意氨基酸<220><221>不定<222>(11)<223>可以是D或N<220><221>不定<222>(12)..(15)<223>可以是L,I,V,M,F(xiàn),或Y<220><221>不定<222>(16)..(17)<223>可以是任意氨基酸<220><221>不定<222>(19)..(20)<223>可以是任意氨基酸<220><221>不定<222>(21)<223>可以是S,T,或A<400>18Trp Xaa Xaa Xaa Xaa Tyr Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10 15Xaa Gly Xaa Xaa Xaa Pro20<210>19<211>5<212>PRT<213>弱氧化葡糖桿菌<220><221>不定<222>(2)<223>可以是任意氨基酸<220><221>不定<222>(3)<223>可以是不同于位置2氨基酸的任意氨基酸<400>19Cys Xaa Xaa Cys His1 5<210>20<211>25<212>DNA<213>弱氧化葡糖桿菌<400>20gggaattctt ycargaratg aayaa25<210>21<211>25<212>DNA<213>弱氧化葡糖桿菌<400>21gggaattctt gaarccngcr tcrta25<210>22<211>2163<212>DNA<213>弱氧化葡糖桿菌<400>22gaggacacag gaacagccat tacaaacgcc gaccagcatc cgggtgactg gatgagctat 60ggccggacct attccgagca gcgctacagc ccgctggatc agatcaccaa ggacaatgcg 120agcaatctga agctggcatg gcactacgat ctggatacca accgtggtca ggaaggtacg 180ccgctgatcg ttgatggcgt catgtacgcc accacaaact ggagcaagat gaaggctctg 240gatgcagcta cgggcaagct gctgtggtct tacgatccaa aggttccagg caacatcgcc 300gaccgcggct gctgcgatac ggtcaaccgt ggtgcagcct actggaacgg caaagtctat 360ttcggcacct tcgacggtcg cctgattgcc ctggatgcca agaccggcaa gctggtctgg 420agcgtctata cggttcccaa ggaagcgcag ctgggtcacc agcgctccta cacggttgac 480ggtgctcccc gtatcgccaa gggcaaggtc atcatcggca acggcggtgc agagttcggc 540gcccgtggct tcgtgacggc gtatgacgct gaaacgggaa agatggactg gcgcttcttc 600accgttccga accctgacaa caagccggac ggcgcagcgt ctgacgacgt gctgatgtcc 660aaggcttatc cgacatgggg caagggcggc gcgtggaagc agcagggcgg tggcggtacc 720gtctgggatt cgctgatcta tgaccctgta acggatctcg tctatctggg cgtcggtaac 780ggctcgccat ggaactacaa gttccgttct gaaggaaaag gcaacaacct cttcctcggc 840agcatcgtgg ccatcaatcc tgacaccggc aaatacgtct ggcatttcca ggaaacgcca 900atggaccagt gggattatac ctcggttcag cagatcatgg ccctcgacat gccggtcaat 960ggcgaaatgc gccatgtgct cgtgcatgcg ccgaagaacg gcttcttcta tatcattgat 1020gccaagaccg gtaagttcat ctccggcaag ccgtacacct acgagaactg ggccaatggc 1080ctcgatccgg taacgggtcg tccgaactac aatccagatg ctctctggac gctgaacggc 1140aagccctggt acggcatccc cggcgatctg ggtggtcata acttcgctgc catggcttac 1200agcccacaga cgaagctggt ttacattccc gcccagcagg ttcccttcgt ttacgatccg 1260cagaagggtg gcttcaaggc tcaccacgac agctggaacc ttggcctcga catgaacaag 1320atcggcctgc ttgatgacaa cgatccacag cacaaggctg acaaggccca gttcctgaag 1380gatctgaagg gctggatcgt tgcatgggat ccgcagaagc agcaggcagc cttcacggtt 1440gaccacaagg gtccgtggaa tggcggtctt ctggcaacgg ctggtggcgt tctgttccag 1500ggtctcgcca acggtgagtt ccacgcctac gacgcgacga cgggtaagga tctcttcacc 1560ttcccagcac agagcgccat cattgccccg ccagtcacct acacagccaa cggcaagcag 1620tatgttgcgg ttgaagtggg ctggggcggt atctatccgt tcttcctggg cggcgtagcc 1680cgtacgtccg gctggaccgt caaccactcc cggatcatcg cgttcgctct ggacggcaac 1740gacaagctgc cagccaagaa cgagctcggc ttcgttccag tgaagccgcc tgagaaatgg 1800gatgaagcca agatcaagga cggctacttc cagttccaga cctattgcgc agcctgccat 1860ggtgacaacg gtatctccgg cggtgttctg ccagacctgc gctggtccgg tgcgatccgt 1920ggagaggaga agttctacaa gctcgtcggc aagggtgctc taacggccta cggtatggac 1980cgtttcgaca cgtccatgtc gccagctgaa atcgaagaca tccgcaactt ccttgtgaag 2040cgcgccaacg agtcctacgc agacgaagtc aaggcccgaa agaatgaggc aggcgtccct 2100aacggcgaat tcctcaacgt ccctcagggt tcggttgcgc ctgcaacgcc ggaccatccg 2160taa 2163<210>23<211>1329<212>DNA<213>弱氧化葡糖桿菌<400> 23caggacgctg atgacgccct gattcagcgc ggtgcctacg tggcccgcct gtctgactgc 60gttgcctgcc ataccgcact acacggccag ccttttgctg gtggtctgga gatcaagagc 120ccgatcggca cgatctactc caccaacatc acgcctgacc cgaaatacgg tatcggcaac 180tatacactcg aagatttcac gaaggcgatc cgtaagggta tccgcaagga cggcgcgacg 240gtttatccgg ccatgccgta tcctgagttc gctcgcctgt ctgatgacga catcaaggcc 300atgtatgcct tcttcatgca tggcgtgaag ccggtcgccc ttcagaacaa gcagccggac 360atctcctggc cgatgaacat gcgctggccg ttggccatct ggcgcgcgat gtttgttccg 420actgtcacac caggcctcga caagagcatc tccgatccgg aagtggcgcg tggcgaatac 480ctcgtgaatg gcccaggcca ttgtggcgag tgtcatacgc cccgtggcat ggccatgcag 540gtcaagggct atacggccaa ggacggcaac gcttacctct ccggtggcgc accgatcgac 600aactggattg ctcccagcct gcgtagcaat agcgacacgg gtctgggtcg ctggtctgaa 660gacgacattg ccgagttcct gaagagcggc cgtatcgacc attctgccgt cttcggtggc 720atggctgacg tggtggccta cagcacccag cactggaccg acgacgatct gcacgcaacg 780gccaagtacc tgaagagcat gccggccgtt ccggaaggca aaaacctggg tcaggatgac 840ggcaaggcca cggccctgct cgaagccggt ggcaagggtg atgcaggcgc agaggtttac 900ctccacaact gtgccatctg ccatatgaac gatggcactg gtgtcaaccg catgttcccg 960ccgctggctg gcaacccggt cgtcatcacg gacaatgcaa cctcaatggc caacatcgtg 1020acattcggcg gtattctgcc tccgacgaat acggcgccat ctgctgttgc catgccgggc 1080ttccgcgatc atctgtctga ccagcagatc gccgatgttg tgaacttcat gcgcaagagc 1140tggggcaacc aggctccggg aaccctgtct gcctcggata tccgcaagct ccgcacatcg 1200ggtactgcgg tttccacggc cggctggaac gtctcttcca agggctggat ggcctacatg 1260ccgcagcctt atggcgaagg ctggaccttc tccccgcaga cacacacggg cgtggatcag 1320gctcagtaal329<210>24<211>843<212>DNA<213>弱氧化葡糖桿菌<400>24gctggaaccc cgctgaaaat tggcgtttcc tttcaggaaa tgaacaatcc gtacttcgtc 60accatgaagg acgcattgca ggaagccgct ggcacgatcg gtgcgaatgt catcatcagt 120gatgcgcatc atgatgtttc caagcaggtg agtgacattg aggacatgat ccagcagggc 180gcgcagatca tcatcatcaa cccgaccgat acagtaggcg tcacgtccgt cgtaaagagc 240gttcatgaca agaacatccc gatcgtctcg gtggatgctc aggctggcgg tccgctcgat 300gcgtttgtgg ggtccaagaa ctatgatgcc ggcttcaagg cctgcgagta tctcgccacg 360acgatcaaga gcggcaatat cggaatcatc gacggtatcc cggtcgttcc cattcttgag 420cgtgtcaaag gctgcaaaaa cgctatcgcc aagcattcag atatcaagat tgtcagcgtt 480cagaacggca agcaggagcg cgatgaggct ctgacggtgg ctgaaaacat gctccaggcc 540aacccggatc tgaaaggtat cttcagcgtc aatgacaacg gatcgctcgg tgtgctgtcc 600gctatcgaat ccagtggttc agacgtgaag ctggtcagcg ttgatggcaa cccggaagcc 660gtgaaggcca tctacaagcc aggctctcat ttcatcgcta cggctgcgca gttcccccgg 720caggatatcc gtctggcact ggcgctcgcc cttgccagga aatggggcgc aggcgtgccg 780aaggtcctgc ctgttgatgt cgagctgatc gacgcgacga aagccaagac gttcagctgg 840taa 843<210>25<211>720<212>PRT<213>弱氧化葡糖桿菌<400>25Glu Asp Thr Gly Thr Ala Ile Thr Asn Ala Asp Gln His Pro Gly Asp1 5 10 15Trp Met Ser Tyr Gly Arg Thr Tyr Ser Glu Gln Arg Tyr Ser Pro Leu20 25 30Asp Gln Ile Thr Lys Asp Asn Ala Ser Asn Leu Lys Leu Ala Trp His35 40 45Tyr Asp Leu Asp Thr Asn Arg Gly Gln Glu Gly Thr Pro Leu Ile Val50 55 60Asp Gly Val Met Tyr Ala Thr Thr Asn Trp Ser Lys Met Lys Ala Leu65 70 75 80Asp Ala Ala Thr Gly Lys Leu Leu Trp Ser Tyr Asp Pro Lys Val Pro85 90 95Gly Asn Ile Ala Asp Arg Gly Cys Cys Asp Thr Val Asn Arg Gly Ala100 105 110Ala Tyr Trp Asn Gly Lys Val Tyr Phe Gly Thr Phe Asp Gly Arg Leu115 120 125Ile Ala Leu Asp Ala Lys Thr Gly Lys Leu Val Trp Ser Val Tyr Thr130 135 140Val Pro Lys Glu Ala Gln Leu Gly His Gln Arg Ser Tyr Thr Val Asp145 150 155 160Gly Ala Pro Arg Ile Ala Lys Gly Lys Val Ile Ile Gly Asn Gly Gly165 170 175Ala Glu Phe Gly Ala Arg Gly Phe Val Thr Ala Tyr Asp Ala Glu Thr180 185 190Gly Lys Met Asp Trp Arg Phe Phe Thr Val Pro Asn Pro Asp Asn Lys195 200 205Pro Asp Gly Ala Ala Ser Asp Asp Val Leu Met Ser Lys Ala Tyr Pro210 215 220Thr Trp Gly Lys Gly Gly Ala Trp Lys Gln Gln Gly Gly Gly Gly Thr225 230 235 240Val Trp Asp Ser Leu Ile Tyr Asp Pro Val Thr Asp Leu Val Tyr Leu245 250 255Gly Val Gly Asn Gly Ser Pro Trp Asn Tyr Lys Phe Arg Ser Glu Gly260 265 270Lys Gly Asn Asn Leu Phe Leu Gly Ser Ile Val Ala Ile Asn Pro Asp275 280 285Thr Gly Lys Tyr Val Trp His Phe Gln Glu Thr Pro Met Asp Gln Trp290 295 300Asp Tyr Thr Ser Val Gln Gln Ile Met Ala Leu Asp Met Pro Val Asn305 310 315 320Gly Glu Met Arg His Val Leu Val His Ala Pro Lys Asn Gly Phe Phe325 330 335Tyr Ile Ile Asp Ala Lys Thr Gly Lys Phe Ile Ser Gly Lys Pro Tyr340 345 350Thr Tyr Glu Asn Trp Ala Asn Gly Leu Asp Pro Val Thr Gly Arg Pro355 360 365Asn Tyr Asn Pro Asp Ala Leu Trp Thr Leu Asn Gly Lys Pro Trp Tyr370 375 380Gly Ile Pro Gly Asp Leu Gly Gly His Asn Phe Ala Ala Met Ala Tyr385 390 395 400Ser Pro Gln Thr Lys Leu Val Tyr Ile Pro Ala Gln Gln Val Pro Phe405 410 415Val Tyr Asp Pro Gln Lys Gly Gly Phe Lys Ala His His Asp Ser Trp420 425 430Asn Leu Gly Leu Asp Met Asn Lys Ile Gly Leu Leu Asp Asp Asn Asp435 440 445Pro Gln His Lys Ala Asp Lys Ala Gln Phe Leu Lys Asp Leu Lys Gly450 455 460Trp Ile Val Ala Trp Asp Pro Gln Lys Gln Gln Ala Ala Phe Thr Val465 470 475 480Asp His Lys Gly Pro Trp Asn Gly Gly Leu Leu Ala Thr Ala Gly Gly
485 490 495Val Leu Phe Gln Gly Leu Ala Asn Gly Glu Phe His Ala Tyr Asp Ala500 505 510Thr Thr Gly Lys Asp Leu Phe Thr Phe Pro Ala Gln Ser Ala Ile Ile515 520 525Ala Pro Pro Val Thr Tyr Thr Ala Asn Gly Lys Gln Tyr Val Ala Val530 535 540Glu Val Gly Trp Gly Gly Ile Tyr Pro Phe Phe Leu Gly Gly Val Ala545 550 555 560Arg Thr Ser Gly Trp Thr Val Asn His Ser Arg Ile Ile Ala Phe Ala565 570 575Leu Asp Gly Asn Asp Lys Leu Pro Ala Lys Asn Glu Leu Gly Phe Val580 585 590Pro Val Lys Pro Pro Glu Lys Trp Asp Glu Ala Lys Ile Lys Asp Gly595 600 605Tyr Phe Gln Phe Gln Thr Tyr Cys Ala Ala Cys His Gly Asp Asn Gly610 615 620Ile Ser Gly Gly Val Leu Pro Asp Leu Arg Trp Ser Gly Ala Ile Arg625 630 635 640Gly Glu Glu Lys Phe Tyr Lys Leu Val Gly Lys Gly Ala Leu Thr Ala645 650 655Tyr Gly Met Asp Arg Phe Asp Thr Ser Met Ser Pro Ala Glu Ile Glu660 665 670Asp Ile Arg Asn Phe Leu Val Lys Arg Ala Asn Glu Ser Tyr Ala Asp675 680 685Glu Val Lys Ala Arg Lys Asn Glu Ala Gly Val Pro Asn Gly Glu Phe690 695 700Leu Asn Val Pro Gln Gly Ser Val Ala Pro Ala Thr Pro Asp His Pro705 710 715 720<210>26<211>442<212>PRT<213>弱氧化葡糖桿菌<400>26Gln Asp Ala Asp Asp Ala Leu Ile Gln Arg Gly Ala Tyr Val Ala Arg1 5 10 15Leu Ser Asp Cys Val Ala Cys His Thr Ala Leu His Gly Gln Pro Phe20 25 30Ala Gly Gly Leu Glu Ile Lys Ser Pro Ile Gly Thr Ile Tyr Ser Thr35 40 45Asn Ile Thr Pro Asp Pro Lys Tyr Gly Ile Gly Asn Tyr Thr Leu Glu50 55 60Asp Phe Thr Lys Ala Ile Arg Lys Gly Ile Arg Lys Asp Gly Ala Thr65 70 75 80Val Tyr Pro Ala Met Pro Tyr Pro Glu Phe Ala Arg Leu Ser Asp Asp85 90 95Asp Ile Lys Ala Met Tyr Ala Phe Phe Met His Gly Val Lys Pro Val100 105 110Ala Leu Gln Asn Lys Gln Pro Asp Ile Ser Trp Pro Met Asn Met Arg115 120 125Trp Pro Leu Ala Ile Trp Arg Ala Met Phe Val Pro Thr Val Thr Pro130 135 140Gly Leu Asp Lys Ser Ile Ser Asp Pro Glu Val Ala Arg Gly Glu Tyr145 150 155 160Leu Val Asn Gly Pro Gly His Cys Gly Glu Cys His Thr Pro Arg Gly165 170 175Met Ala Met Gln Val Lys Gly Tyr Thr Ala Lys Asp Gly Asn Ala Tyr180 185 190Leu Ser Gly Gly Ala Pro Ile Asp Asn Trp Ile Ala Pro Ser Leu Arg195 200 205Ser Asn Ser Asp Thr Gly Leu Gly Arg Trp Ser Glu Asp Asp Ile Ala210 215 220Glu Phe Leu Lys Ser Gly Arg Ile Asp His Ser Ala Val Phe Gly Gly225 230 235 240Met Ala Asp Val Val Ala Tyr Ser Thr Gln His Trp Thr Asp Asp Asp245 250 255Leu His Ala Thr Ala Lys Tyr Leu Lys Ser Met Pro Ala Val Pro Glu260 265 270Gly Lys Asn Leu Gly Gln Asp Asp Gly Lys Ala Thr Ala Leu Leu Glu275 280 285Ala Gly Gly Lys Gly Asp Ala Gly Ala Glu Val Tyr Leu His Asn Cys290 295 300Ala Ile Cys His Met Asn Asp Gly Thr Gly Val Asn Arg Met Phe Pro305 310 315 320Pro Leu Ala Gly Asn Pro Val Val Ile Thr Asp Asn Ala Thr Ser Met325 330 335Ala Asn Ile Val Thr Phe Gly Gly Ile Leu Pro Pro Thr Asn Thr Ala340 345 350Pro Ser Ala Val Ala Met Pro Gly Phe Arg Asp His Leu Ser Asp Gln355 360 365Gln Ile Ala Asp Val Val Asn Phe Met Arg Lys Ser Trp Gly Asn Gln370 375 380Ala Pro Gly Thr Leu Ser Ala Ser Asp Ile Arg Lys Leu Arg Thr Ser385 390 395 400Gly Thr Ala Val Ser Thr Ala Gly Trp Asn Val Ser Ser Lys Gly Trp405 410 415Met Ala Tyr Met Pro Gln Pro Tyr Gly Glu Gly Trp Thr Phe Ser Pro420 425 430Gln Thr His Thr Gly Val Asp Gln Ala Gln435 440<210>27<211>280<212>PRT<213>弱氧化葡糖桿菌<400>27Ala Gly Thr Pro Leu Lys Ile Gly Val Ser Phe Gln Glu Met Asn Asn1 5 10 15Pro Tyr Phe Val Thr Met Lys Asp Ala Leu Gln Glu Ala Ala Gly Thr20 25 30Ile Gly Ala Asn Val Ile Ile Ser Asp Ala His His Asp Val Ser Lys35 40 45Gln Val Ser Asp Ile Glu Asp Met Ile Gln Gln Gly Ala Gln Ile Ile50 55 60Ile Ile Asn Pro Thr Asp Thr Val Gly Val Thr Ser Val Val Lys Ser65 70 75 80Val His Asp Lys Asn Ile Pro Ile Val Ser Val Asp Ala Gln Ala Gly85 90 95Gly Pro Leu Asp Ala Phe Val Gly Ser Lys Asn Tyr Asp Ala Gly Phe100 105 110Lys Ala Cys Glu Tyr Leu Ala Thr Thr Ile Lys Ser Gly Asn Ile Gly115 120 125Ile Ile Asp Gly Ile Pro Val Val Pro Ile Leu Glu Arg Val Lys Gly130 135 140Cys Lys Asn Ala Ile Ala Lys His Ser Asp Ile Lys Ile Val Ser Val145 150 155 160Gln Asn Gly Lys Gln Glu Arg Asp Glu Ala Leu Thr Val Ala Glu Asn165 170 175Met Leu Gln Ala Asn Pro Asp Leu Lys Gly Ile Phe Ser Val Asn Asp180 185 190Asn Gly Ser Leu Gly Val Leu Ser Ala Ile Glu Ser Ser Gly Ser Asp195 200 205Val Lys Leu Val Ser Val Asp Gly Asn Pro Glu Ala Val Lys Ala Ile210 215 220Tyr Lys Pro Gly Ser His Phe Ile Ala Thr Ala Ala Gln Phe Pro Arg225 230 235 240Gln Asp Ile Arg Leu Ala Leu Ala Leu Ala Leu Ala Arg Lys Trp Gly245 250 255Ala Gly Val Pro Lys Val Leu Pro Val Asp Val Glu Leu Ile Asp Ala260 265 270Thr Lys Ala Lys Thr Phe Ser Trp275 280<210>28<211>664<212>DNA<213>弱氧化葡糖桿菌<400>28cgagaacgga agcccgctga aatcgacccg ttccccatca aaatactttt cgagaagatc 60acgaaccttc accaggagcg gcgtctcttc ctgatcgcgc ccccaccccc aatcgagagc 120aacaatacgc ccgtcatctt cactgatggt cagggctccg agatgggaat ggcaggaaag 180ctgtggcata cagatacgct gccccatccc ccggaaagcg tcaatcatgc ttccctaaaa 240gagtccctga gaaaaaaata catgcgtgtc acgcatatgc agggaggccg gtattctcaa 300ataacatatg ggatcatttt tgtatgattt catgaaatat tacgcacttt gttgagaaac 360tgccattttt tgtgtcaaac ctgcgacaga cactaaagct gttttggttg tttggttatt 420aagaataatt ctcatgtaat taagcgagcg attttacgcg gatagtgctc acggagacgt 480cagaagccca cgtttccgac aaacaataaa ataagcgagt agtaagttca cgcgatgcta 540cgttttccag acgacttgga gaaactgagg agcacctagg cacccacaga ggcgcctatc 600aggacttgga ttacgtctga ataccattaa caggaacagt ctttgcaaaa aggacagtcg 660gatc 664<210>29<211>615<212>DNA<213>弱氧化葡糖桿菌<400>29tcgagaagat cacgaacctt caccaggagc ggcgtctctt cctgatcgcg cccccacccc 60caatcgagag caacaatacg cccgtcatct tcactgatgg tcagggctcc gagatgggaa 120tggcaggaaa gctgtggcat acagatacgc tgccccatcc cccggaaagc gtcaatcatg 180cttccctaaa agagtccctg agaaaaaaat acatgcgtgt cacgcatatg cagggaggcc 240ggtattctca aataacatat gggatcattt ttgtatgatt tcatgaaata ttacgcactt 300tgttgagaaa ctgccatttt ttgtgtcaaa cctgcgacag acactaaagc tgttttggtt 360gtttggttat taagaataat tctcatgtaa ttaagcgagc gattttacgc ggatagtgct 420cacggagacg tcagaagccc acgtttccga caaacaataa aataagcgag tagtaagttc 480acgcgatgct acgttttcca gacgacttgg agaaactgag gagcacctag gcacccacag 540aggcgcctat caggacttgg attacgtctg aataccatta acaggaacag tctttgcaaa 600aaggacagtc ggatc 615<210>30<211>565<212>DNA<213>弱氧化葡糖桿菌<400>30cccccacccc caatcgagag caacaatacg cccgtcatct tcactgatgg tcagggctcc 60gagatgggaa tggcaggaaa gctgtggcat acagatacgc tgccccatcc cccggaaagc 120gtcaatcatg cttccctaaa agagtccctg agaaaaaaat acatgcgtgt cacgcatatg 180cagggaggcc ggtattctca aataacatat gggatcattt ttgtatgatt tcatgaaata 240ttacgcactt tgttgagaaa ctgccatttt ttgtgtcaaa cctgcgacag acactaaagc 300tgttttggtt gtttggttat taagaataat tctcatgtaa ttaagcgagc gattttacgc 360ggatagtgct cacggagacg tcagaagccc acgtttccga caaacaataa aataagcgag 420tagtaagttc acgcgatgct acgttttcca gacgacttgg agaaactgag gagcacctag 480gcacccacag aggcgcctat caggacttgg attacgtctg aataccatta acaggaacag 540tctttgcaaa aaggacagtc ggatc 565<210>31<211>515<212>DNA<213>弱氧化葡糖桿菌<400>31tcagggctcc gagatgggaa tggcaggaaa gctgtggcat acagatacgc tgccccatcc 60cccggaaagc gtcaatcatg cttccctaaa agagtccctg agaaaaaaat acatgcgtgt 120cacgcatatg cagggaggcc ggtattctca aataacatat gggatcattt ttgtatgatt 180tcatgaaata ttacgcactt tgttgagaaa ctgccatttt ttgtgtcaaa cctgcgacag 240acactaaagc tgttttggtt gtttggttat taagaataat tctcatgtaa ttaagcgagc 300gattttacgc ggatagtgct cacggagacg tcagaagccc acgtttccga caaacaataa 360aataagcgag tagtaagttc acgcgatgct acgttttcca gacgacttgg agaaactgag 420gagcacctag gcacccacag aggcgcctat caggacttgg attacgtctg aataccatta 480acaggaacag tctttgcaaa aaggacagtc ggatc515<210>32<211>465<212>DNA<213>弱氧化葡糖桿菌<400>32tgccccatcc cccggaaagc gtcaatcatg cttccctaaa agagtccctg agaaaaaaat 60acatgcgtgt cacgcatatg cagggaggcc ggtattctca aataacatat gggatcattt 120ttgtatgatt tcatgaaata ttacgcactt tgttgagaaa ctgccatttt ttgtgtcaaa 180cctgcgacag acactaaagc tgttttggtt gtttggttat taagaataat tctcatgtaa 240ttaagcgagc gattttacgc ggatagtgct cacggagacg tcagaagccc acgtttccga 300caaacaataa aataagcgag tagtaagttc acgcgatgct acgttttcca gacgacttgg 360agaaactgag gagcacctag gcacccacag aggcgcctat caggacttgg attacgtctg 420aataccatta acaggaacag tctttgcaaa aaggacagtc ggatc 465<210>33<211>415<212>DNA<213>弱氧化葡糖桿菌<400>33agaaaaaaat acatgcgtgt cacgcatatg cagggaggcc ggtattctca aataacatat 60gggatcattt ttgtatgatt tcatgaaata ttacgcactt tgttgagaaa ctgccatttt 120ttgtgtcaaa cctgcgacag acactaaagc tgttttggtt gtttggttat taagaataat 180tctcatgtaa ttaagcgagc gattttacgc ggatagtgct cacggagacg tcagaagccc 240acgtttccga caaacaataa aataagcgag tagtaagttc acgcgatgct acgttttcca 300gacgacttgg agaaactgag gagcacctag gcacccacag aggcgcctat caggacttgg 360attacgtctg aataccatta acaggaacag tctttgcaaa aaggacagtc ggatc 415<210>34<211>365<212>DNA<213>弱氧化葡糖桿菌<400>34aataacatat gggatcattt ttgtatgatt tcatgaaata ttacgcactt tgttgagaaa 60ctgccatttt ttgtgtcaaa cctgcgacag acactaaagc tgttttggtt gtttggttat 120taagaataat tctcatgtaa ttaagcgagc gattttacgc ggatagtgct cacggagacg 180tcagaagccc acgtttccga caaacaataa aataagcgag tagtaagttc acgcgatgct 240acgttttcca gacgacttgg agaaactgag gagcacctag gcacccacag aggcgcctat 300caggacttgg attacgtctg aataccatta acaggaacag tctttgcaaa aaggacagtc 360ggatc 365<210>35<211>315<212>DNA<213>弱氧化葡糖桿菌<400>35tgttgagaaa ctgccatttt ttgtgtcaaa cctgcgacag acactaaagc tgttttggtt 60gtttggttat taagaataat tctcatgtaa ttaagcgagc gattttacgc ggatagtgct 120cacggagacg tcagaagccc acgtttccga caaacaataa aataagcgag tagtaagttc 180acgcgatgct acgttttcca gacgacttgg agaaactgag gagcacctag gcacccacag 240aggcgcctat caggacttgg attacgtctg aataccatta acaggaacag tctttgcaaa 300aaggacagtc ggatc 315<210>36<211>265<212>DNA<213>弱氧化葡糖桿菌<400>36tgttttggtt gtttggttat taagaataat tctcatgtaa ttaagcgagc gattttacgc 60ggatagtgct cacggagacg tcagaagccc acgtttccga caaacaataa aataagcgag 120tagtaagttc acgcgatgct acgttttcca gacgacttgg agaaactgag gagcacctag 180gcacccacag aggcgcctat caggacttgg attacgtctg aataccatta acaggaacag 240tctttgcaaa aaggacagtc ggatc 265<210>37<211>215<212>DNA<213>弱氧化葡糖桿菌<400>37gattttacgc ggatagtgct cacggagacg tcagaagccc acgtttccga caaacaataa 60aataagcgag tagtaagttc acgcgatgct acgttttcca gacgacttgg agaaactgag 120gagcacctag gcacccacag aggcgcctat caggacttgg attacgtctg aataccatta 180acaggaacag tctttgcaaa aaggacagtc ggatc215<210>38<211>165<212>DNA<213>弱氧化葡糖桿菌<400>38caaacaataa aataagcgag tagtaagttc acgcgatgct acgttttcca gacgacttgg 60agaaactgag gagcacctag gcacccacag aggcgcctat caggacttgg attacgtctg 120aataccatta acaggaacag tctttgcaaa aaggacagtc ggatc 165<210>39<211>115<212>DNA<213>弱氧化葡糖桿菌<400>39gacgacttgg agaaactgag gagcacctag gcacccacag aggcgcctat caggacttgg 60attacgtctg aataccatta acaggaacag tctttgcaaa aaggacagtc ggatc 115<210>40<211>65<212>DNA<213>弱氧化葡糖桿菌<400>40caggacttgg attacgtctg aataccatta acaggaacag tctttgcaaa aaggacagtc 60ggatc 65<210>41<211>34<212>DNA<213>弱氧化葡糖桿菌<400>41cgggaaaccg tcacgctgaa aggaatgacg tgac 34<210>42<211>51<212>DNA<213>弱氧化葡糖桿菌<400>42gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg c 51<210>43<211>101<212>DNA<213>弱氧化葡糖桿菌<400>43gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca c 101<210>44<211>151<212>DNA<213>弱氧化葡糖桿菌<400>44gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt t151<210>45<211>201<212>DNA<213>弱氧化葡糖桿菌<400>45gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt tttcctttgg caacaggcgc aggccgcgca 180gcattgccat catgcgcgcc a 201<210>46<211>251<212>DNA<213>弱氧化葡糖桿菌<400> 46gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt tttcctttgg caacaggcgc aggccgcgca 180gcattgccat catgcgcgcc aggacccgga agcgccgagc ttctcaagag cctctgcggt 240tcccttcctg a 251<210>47<211>301<212>DNA<213>弱氧化葡糖桿菌<400>47gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt tttcctttgg caacaggcgc aggccgcgca 180gcattgccat catgcgcgcc aggacccgga agcgccgagc ttctcaagag cctctgcggt 240tcccttcctg accctcgacg cgccacctgc gcagctgcgc catcaaggcg aagtgctgga 300t 301<210>48<211>351<212>DNA<213>弱氧化葡糖桿菌<400>48gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt tttcctttgg caacaggcgc aggccgcgca 180gcattgccat catgcgcgcc aggacccgga agcgccgagc ttctcaagag cctctgcggt 240tcccttcctg accctcgacg cgccacctgc gcagctgcgc catcaaggcg aagtgctgga 300tcatgccgtg gttctctggc ttcctggacc gaaatcctac accggcgaag a 351<210>49<211>401<212>DNA<213>弱氧化葡糖桿菌<400>49gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt tttcctttgg caacaggcgc aggccgcgca 180gcattgccat catgcgcgcc aggacccgga agcgccgagc ttctcaagag cctctgcggt 240tcccttcctg accctcgacg cgccacctgc gcagctgcgc catcaaggcg aagtgctgga 300tcatgccgtg gttctctggc ttcctggacc gaaatcctac accggcgaag acgggtgtcg 360aactccacct tcatgctgga cccgctgtta tcactcgcgt t 401<210>50<211>430<212>DNA<213>弱氧化葡糖桿菌<400>50gcctctccag accctgtcag tctgacagaa aagggcggtc cggatacggg ccgccttttt 60cttttgtatt caggccgttt tcacaggatg gcatcctgca ctacatatga aggcatgact 120cccttctcgt cttctgctcc gcagtcagtt tttcctttgg caacaggcgc aggccgcgca 180gcattgccat catgcgcgcc aggacccgga agcgccgagc ttctcaagag cctctgcggt 240tcccttcctg accctcgacg cgccacctgc gcagctgcgc catcaaggcg aagtgctgga 300tcatgccgtg gttctctggc ttcctggacc gaaatcctac accggcgaag acgggtgtcg 360aactccacct tcatgctgga cccgctgtta tcactcgcgt tgcggatgct ctgaccgatc 420tgggtgcacg430<210>51<211>1383<212>DNA<213>弱氧化葡糖桿菌<400>51cgaagcgatc gggacttttc agggagccgg gaagctggcc gcctgtctgg atcttctcgc 60cacactgacg tctgctccgt tcaggacgct gtccctcaaa ggggagacca aggctctcaa 120cagcccggaa atgcagcgga taagcggtgt catcacatcc ctgatggcca tggacccatc 180cgaaatccgg catgaccatc tggcgcagga tctgggcctc tgcgcatcca ccttctctcg 240ccagttccgt tctgcgacgg gcgacacatt catgtctttc ctgcatcggc tgcgggtgtg 300tcacgcgtgc catctgctgg ccagttccac actctcaatc acggaaatcg gggctgcttc 360cggcttcaac aacctgtcca attttaaccg catcttcctg cgcctgcgtg gctgcacgcc 420acgggaatac cgccgtcatg cccgcgaaat gacagccctt tcgccgacag acgccgcaga 480tttcctgaac tgaccgacaa gggaaaacag atcatgccaa cacttccaca acgtttttcc 540ctcgatggtc gcaaagctct tgtcacgggt gcatcccgcg ggcttggtgt tacgatctgc 600gacgttctga gtgctgcggg ggccgatatt gtcgccgttg cgcgttctga aaccgacatg 660gccgccacat gccggatcgt ggaaggccat ggtcgtcaat gcctcacggt tgttgccgat 720ctcagtgatc cgatggctcc ggacgctgtc gcgcagacag tgaacgcagc gtggggtggg 780gtggatattg tcgtcaacaa tgctggcgtc agtttccctc gccctctggt ggaacagacc 840gtcgaggagt gggacaccgt gcaggccatt aacctgcgtg cgccatggct tctcgcccgt 900gtcttcgctc cgggcatgat tgaacgcaag cgtgggaaaa tcatcaacat cagttcccag 960gccagctctg tcgcgctgat tgaccatggt gcttacgtcg catccaaggc cggtctgaac 1020ggtctcacca aggtcatgac ggcggaatgg gcggctcata acatacaggc caatgccatc 1080tgccccacag tcgtctggac gcccatgggt gaacgcgtct ggagcgttgg gaacaagctg 1140gaaaagctac tggaaaagat ccccgctggc cgtgtcgcaa caccggaaga tgtcgcggat 1200atagttctgt atctcgcctc cgacgcgtcg agcatggtca acgggcagga aatatttgtc 1260gatggcggat acacagccct ttaggccgcc acatcttcaa ataaagacat gtgattttac 1320ggttttaaca aggccatgtg cagggaatgg cctgcgcatt tcatgcagat caacaggtgt 1380aac 1383<210>52<211>1334<212>DNA<213>弱氧化葡糖桿菌<400>52gatcttctcg ccacactgac gtctgctccg ttcaggacgc tgtccctcaa aggggagacc 60aaggctctca acagcccgga aatgcagcgg ataagcggtg tcatcacatc cctgatggcc 120atggacccat ccgaaatccg gcatgaccat ctggcgcagg atctgggcct ctgcgcatcc 180accttctctc gccagttccg ttctgcgacg ggcgacacat tcatgtcttt cctgcatcgg 240ctgcgggtgt gtcacgcgtg ccatctgctg gccagttcca cactctcaat cacggaaatc 300ggggctgctt ccggcttcaa caacctgtcc aattttaacc gcatcttcct gcgcctgcgt 360ggctgcacgc cacgggaata ccgccgtcat gcccgcgaaa tgacagccct ttcgccgaca 420gacgccgcag atttcctgaa ctgaccgaca agggaaaaca gatcatgcca acacttccac 480aacgtttttc cctcgatggt cgcaaagctc ttgtcacggg tgcatcccgc gggcttggtg 540ttacgatctg cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg 600aaaccgacat ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg 660ttgttgccga tctcagtgat ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag 720cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt cagtttccct cgccctctgg 780tggaacagac cgtcgaggag tgggacaccg tgcaggccat taacctgcgt gcgccatggc 840ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca 900tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg 960ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg 1020ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg 1080ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag 1140atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg 1200aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca 1260tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga 1320tcaacaggtg taac 1334<210>53<211>1284<212>DNA<213>弱氧化葡糖桿菌<400>53aggggagacc aaggctctca acagcccgga aatgcagcgg ataagcggtg tcatcacatc 60cctgatggcc atggacccat ccgaaatccg gcatgaccat ctggcgcagg atctgggcct 120ctgcgcatcc accttctctc gccagttccg ttctgcgacg ggcgacacat tcatgtcttt 180cctgcatcgg ctgcgggtgt gtcacgcgtg ccatctgctg gccagttcca cactctcaat 240cacggaaatc ggggctgctt ccggcttcaa caacctgtcc aattttaacc gcatcttcct 300gcgcctgcgt ggctgcacgc cacgggaata ccgccgtcat gcccgcgaaa tgacagccct 360ttcgccgaca gacgccgcag atttcctgaa ctgaccgaca agggaaaaca gatcatgcca 420acacttccac aacgtttttc cctcgatggt cgcaaagctc ttgtcacggg tgcatcccgc 480gggcttggtg ttacgatctg cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt 540gcgcgttctg aaaccgacat ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa 600tgcctcacgg ttgttgccga tctcagtgat ccgatggctc cggacgctgt cgcgcagaca 660gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt cagtttccct 720cgccctctgg tggaacagac cgtcgaggag tgggacaccg tgcaggccat taacctgcgt 780gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa 840atcatcaaca tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc 900gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat 960aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc 1020tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca 1080acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc 1140aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca 1200aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat 1260ttcatgcaga tcaacaggtg taac1284<210>54<211>1234<212>DNA<213>弱氧化葡糖桿菌<400>54tcatcacatc cctgatggcc atggacccat ccgaaatccg gcatgaccat ctggcgcagg 60atctgggcct ctgcgcatcc accttctctc gccagttccg ttctgcgacg ggcgacacat 120tcatgtcttt cctgcatcgg ctgcgggtgt gtcacgcgtg ccatctgctg gccagttcca 180cactctcaat cacggaaatc ggggctgctt ccggcttcaa caacctgtcc aattttaacc 240gcatcttcct gcgcctgcgt ggctgcacgc cacgggaata ccgccgtcat gcccgcgaaa 300tgacagccct ttcgccgaca gacgccgcag atttcctgaa ctgaccgaca agggaaaaca 360gatcatgcca acacttccac aacgtttttc cctcgatggt cgcaaagctc ttgtcacggg 420tgcatcccgc gggcttggtg ttacgatctg cgacgttctg agtgctgcgg gggccgatat 480tgtcgccgtt gcgcgttctg aaaccgacat ggccgccaca tgccggatcg tggaaggcca 540tggtcgtcaa tgcctcacgg ttgttgccga tctcagtgat ccgatggctc cggacgctgt 600cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt 660cagtttccct cgccctctgg tggaacagac cgtcgaggag tgggacaccg tgcaggccat 720taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa 780gcgtgggaaa atcatcaaca tcagttccca ggccagctct gtcgcgctga ttgaccatgg 840tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg 900ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg 960tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg 1020ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc 1080gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc 1140cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg 1200gcctgcgcat ttcatgcaga tcaacaggtg taac 1234<210>55<211>1184<212>DNA<213>弱氧化葡糖桿菌<400>55ctggcgcagg atctgggcct ctgcgcatcc accttctctc gccagttccg ttctgcgacg 60ggcgacacat tcatgtcttt cctgcatcgg ctgcgggtgt gtcacgcgtg ccatctgctg 120gccagttcca cactctcaat cacggaaatc ggggctgctt ccggcttcaa caacctgtcc 180aattttaacc gcatcttcct gcgcctgcgt ggctgcacgc cacgggaata ccgccgtcat 240gcccgcgaaa tgacagccct ttcgccgaca gacgccgcag atttcctgaa ctgaccgaca 300agggaaaaca gatcatgcca acacttccac aacgtttttc cctcgatggt cgcaaagctc 360ttgtcacggg tgcatcccgc gggcttggtg ttacgatctg cgacgttctg agtgctgcgg 420gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat ggccgccaca tgccggatcg 480tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga tctcagtgat ccgatggctc 540cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca 600atgctggcgt cagtttccct cgccctctgg tggaacagac cgtcgaggag tgggacaccg 660tgcaggccat taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga 720ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca ggccagctct gtcgcgctga 780ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc aaggtcatga 840cggcggaatg ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga 900cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga 960tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct 1020ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc 1080tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt 1140gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac 1184<210>56<211>1134<212>DNA<213>弱氧化葡糖桿菌<400>56ttctgcgacg ggcgacacat tcatgtcttt cctgcatcgg ctgcgggtgt gtcacgcgtg 60ccatctgctg gccagttcca cactctcaat cacggaaatc ggggctgctt ccggcttcaa 120caacctgtcc aattttaacc gcatcttcct gcgcctgcgt ggctgcacgc cacgggaata 180ccgccgtcat gcccgcgaaa tgacagccct ttcgccgaca gacgccgcag atttcctgaa 240ctgaccgaca agggaaaaca gatcatgcca acacttccac aacgtttttc cctcgatggt 300cgcaaagctc ttgtcacggg tgcatcccgc gggcttggtg ttacgatctg cgacgttctg 360agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat ggccgccaca 420tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga tctcagtgat 480ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt 540gtcgtcaaca atgctggcgt cagtttccct cgccctctgg tggaacagac cgtcgaggag 600tgggacaccg tgcaggccat taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct 660ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca ggccagctct 720gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc 780aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat ctgccccaca 840gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta 900ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg 960tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga 1020tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac 1080aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac 1134<210>57<211>1084<212>DNA<213>弱氧化葡糖桿菌<400> 57gtcacgcgtg ccatctgctg gccagttcca cactctcaat cacggaaatc ggggctgctt 60ccggcttcaa caacctgtcc aattttaacc gcatcttcct gcgcctgcgt ggctgcacgc 120cacgggaata ccgccgtcat gcccgcgaaa tgacagccct ttcgccgaca gacgccgcag 180atttcctgaa ctgaccgaca agggaaaaca gatcatgcca acacttccac aacgtttttc 240cctcgatggt cgcaaagctc ttgtcacggg tgcatcccgc gggcttggtg ttacgatctg 300cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat 360ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga 420tctcagtgat ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg 480ggtggatatt gtcgtcaaca atgctggcgt cagtttccct cgccctctgg tggaacagac 540cgtcgaggag tgggacaccg tgcaggccat taacctgcgt gcgccatggc ttctcgcccg 600tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca 660ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa 720cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat 780ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct 840ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga 900tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt 960cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta 1020cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg 1080taac 1084<210>58<211>1034<212>DNA<213>弱氧化葡糖桿菌<400>58ggggctgctt ccggcttcaa caacctgtcc aattttaacc gcatcttcct gcgcctgcgt 60ggctgcacgc cacgggaata ccgccgtcat gcccgcgaaa tgacagccct ttcgccgaca 120gacgccgcag atttcctgaa ctgaccgaca agggaaaaca gatcatgcca acacttccac 180aacgtttttc cctcgatggt cgcaaagctc ttgtcacggg tgcatcccgc gggcttggtg 240ttacgatctg cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg 300aaaccgacat ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg 360ttgttgccga tctcagtgat ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag 420cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt cagtttccct cgccctctgg 480tggaacagac cgtcgaggag tgggacaccg tgcaggccat taacctgcgt gcgccatggc 540ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca 600tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg 660ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg 720ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg 780ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag 840atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg 900aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca 960tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga 1020tcaacaggtg taac 1034<210>59<211>984<212>DNA<213>弱氧化葡糖桿菌<400>59gcgcctgcgt ggctgcacgc cacgggaata ccgccgtcat gcccgcgaaa tgacagccct 60ttcgccgaca gacgccgcag atttcctgaa ctgaccgaca agggaaaaca gatcatgcca 120acacttccac aacgtttttc cctcgatggt cgcaaagctc ttgtcacggg tgcatcccgc 180gggcttggtg ttacgatctg cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt 240gcgcgttctg aaaccgacat ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa 300tgcctcacgg ttgttgccga tctcagtgat ccgatggctc cggacgctgt cgcgcagaca 360gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt cagtttccct 420cgccctctgg tggaacagac cgtcgaggag tgggacaccg tgcaggccat taacctgcgt 480gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa 540atcatcaaca tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc 600gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat 660aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc 720tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca 780acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc 840aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca 900aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat 960ttcatgcaga tcaacaggtg taac984<210>60<211>934<212>DNA<213>弱氧化葡糖桿菌<400>60tgacagccct ttcgccgaca gacgccgcag atttcctgaa ctgaccgaca agggaaaaca 60gatcatgcca acacttccac aacgtttttc cctcgatggt cgcaaagctc ttgtcacggg 120tgcatcccgc gggcttggtg ttacgatctg cgacgttctg agtgctgcgg gggccgatat 180tgtcgccgtt gcgcgttctg aaaccgacat ggccgccaca tgccggatcg tggaaggcca 240tggtcgtcaa tgcctcacgg ttgttgccga tctcagtgat ccgatggctc cggacgctgt 300cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt 360cagtttccct cgccctctgg tggaacagac cgtcgaggag tgggacaccg tgcaggccat 420taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa 480gcgtgggaaa atcatcaaca tcagttccca ggccagctct gtcgcgctga ttgaccatgg 540tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg 600ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg 660tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaga tccccgctgg 720ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc 780gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc 840cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg 900gcctgcgcat ttcatgcaga tcaacaggtg taac 934<210>61<211>884<212>DNA<213>弱氧化葡糖桿菌<400>61agggaaaaca gatcatgcca acacttccac aacgtttttc cctcgatggt cgcaaagctc 60ttgtcacggg tgcatcccgc gggcttggtg ttacgatctg cgacgttctg agtgctgcgg 120gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat ggccgccaca tgccggatcg 180tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga tctcagtgat ccgatggctc 240cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca 300atgctggcgt cagtttccct cgccctctgg tggaacagac cgtcgaggag tgggacaccg 360tgcaggccat taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga 420ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca ggccagctct gtcgcgctga 480ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc aaggtcatga 540cggcggaatg ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga 600cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga 660tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct 720ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc 780tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt 840gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac 884<210>62<211>834<212>DNA<213>弱氧化葡糖桿菌<400>62cgcaaagctc ttgtcacggg tgcatcccgc gggcttggtg ttacgatctg cgacgttctg 60agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat ggccgccaca 120tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga tctcagtgat 180ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt 240gtcgtcaaca atgctggcgt cagtttccct cgccctctgg tggaacagac cgtcgaggag 300tgggacaccg tgcaggccat taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct 360ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca ggccagctct 420gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc 480aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat ctgccccaca 540gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta 600ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg 660tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga 720tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac 780aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac 834<210>63<211>784<212>DNA<213>弱氧化葡糖桿菌<400>63cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat 60ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga 120tctcagtgat ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg 180ggtggatatt gtcgtcaaca atgctggcgt cagtttccct cgccctctgg tggaacagac 240cgtcgaggag tgggacaccg tgcaggccat taacctgcgt gcgccatggc ttctcgcccg 300tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca 360ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa 420cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat 480ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct 540ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga 600tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt 660cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta 720cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg 780taa 784<210>64<211>784<212>DNA<213>弱氧化葡糖桿菌<400>64cgacgttctg agtgctgcgg gggccgatat tgtcgccgtt gcgcgttctg aaaccgacat 60ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg ttgttgccga 120tctcagtgat ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag cgtggggtgg 180ggtggatatt gtcgtcaaca atgctggcgt cagtttccct cgccctctgg tggaacagac 240cgtcgaggag tgggacaccg tgcaggccat taacctgcgt gcgccatggc ttctcgcccg 300tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca 360ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa 420cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat 480ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct 540ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga 600tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt 660cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta 720cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg 780taac 784<210>65<211>734<212>DNA<213>弱氧化葡糖桿菌<400>65aaaccgacat ggccgccaca tgccggatcg tggaaggcca tggtcgtcaa tgcctcacgg 60ttgttgccga tctcagtgat ccgatggctc cggacgctgt cgcgcagaca gtgaacgcag 120cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt cagtttccct cgccctctgg 180tggaacagac cgtcgaggag tgggacaccg tgcaggccat taacctgcgt gcgccatggc 240ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca 300tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg 360ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg 420ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg 480ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag 540atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg 600aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca 660tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga 720tcaacaggtg taac 734<210>66<211>684<212>DNA<213>弱氧化葡糖桿菌<400>66tgcctcacgg ttgttgccga tctcagtgat ccgatggctc cggacgctgt cgcgcagaca 60gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt cagtttccct 120cgccctctgg tggaacagac cgtcgaggag tgggacaccg tgcaggccat taacctgcgt 180gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa 240atcatcaaca tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc 300gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat 360aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc 420tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca 480acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc 540aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca 600aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat 660ttcatgcaga tcaacaggtg taac684<210>67<211>634<212>DNA<213>弱氧化葡糖桿菌<400>67cgcgcagaca gtgaacgcag cgtggggtgg ggtggatatt gtcgtcaaca atgctggcgt 60cagtttccct cgccctctgg tggaacagac cgtcgaggag tgggacaccg tgcaggccat 120taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga ttgaacgcaa 180gcgtgggaaa atcatcaaca tcagttccca ggccagctct gtcgcgctga ttgaccatgg 240tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg 300ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg 360tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg 420ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc 480gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc 540cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg 600gcctgcgcat ttcatgcaga tcaacaggtg taac634<210>68<211>584<212>DNA<213>弱氧化葡糖桿菌<400> 68atgctggcgt cagtttccct cgccctctgg tggaacagac cgtcgaggag tgggacaccg 60tgcaggccat taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct ccgggcatga 120ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca ggccagctct gtcgcgctga 180ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc aaggtcatga 240cggcggaatg ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga 300cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga 360tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct 420ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc 480tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt 540gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac584<210>69<211>534<212>DNA<213>弱氧化葡糖桿菌<400> 69tgggacaccg tgcaggccat taacctgcgt gcgccatggc ttctcgcccg tgtcttcgct 60ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca ggccagctct 120gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa cggtctcacc 180aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat ctgccccaca 240gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta 300ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg 360tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga 420tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac 480aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac534<210>70<211>484<212>DNA<213>弱氧化葡糖桿菌<400> 70tgtcttcgct ccgggcatga ttgaacgcaa gcgtgggaaa atcatcaaca tcagttccca 60ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg ccggtctgaa 120cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg ccaatgccat 180ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct 240ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga 300tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt 360cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta 420cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg 480taac484<210>71<211>434<212>DNA<213>弱氧化葡糖桿菌<400>71tcagttccca ggccagctct gtcgcgctga ttgaccatgg tgcttacgtc gcatccaagg 60ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat aacatacagg 120ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc tggagcgttg 180ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag 240atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg 300aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca 360tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga 420tcaacaggtg taac434<210>72<211>384<212>DNA<213>弱氧化葡糖桿菌<400>72gcatccaagg ccggtctgaa cggtctcacc aaggtcatga cggcggaatg ggcggctcat 60aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg tgaacgcgtc 120tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg ccgtgtcgca 180acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc gagcatggtc 240aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca 300aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat 360ttcatgcaga tcaacaggtg taac384<210>73<211>334<212>DNA<213>弱氧化葡糖桿菌<400>73ggcggctcat aacatacagg ccaatgccat ctgccccaca gtcgtctgga cgcccatggg 60tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga tccccgctgg 120ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct ccgacgcgtc 180gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc tttaggccgc 240cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg 300gcctgcgcat ttcatgcaga tcaacaggtg taac334<210>74<211>284<212>DNA<213>弱氧化葡糖桿菌<400>74cgcccatggg tgaacgcgtc tggagcgttg ggaacaagct ggaaaagcta ctggaaaaga 60tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg tatctcgcct 120ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga tacacagccc 180tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac aaggccatgt 240gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac284<210>75<211>234<212>DNA<213>弱氧化葡糖桿菌<400>75ctggaaaaga tccccgctgg ccgtgtcgca acaccggaag atgtcgcgga tatagttctg 60tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt cgatggcgga 120tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta cggttttaac 180aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg taac234<210>76<211>184<212>DNA<213>弱氧化葡糖桿菌<400>76tatagttctg tatctcgcct ccgacgcgtc gagcatggtc aacgggcagg aaatatttgt 60cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca tgtgatttta 120cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga tcaacaggtg 180taac184<210>77<211>134<212>DNA<213>弱氧化葡糖桿菌<400>77aaatatttgt cgatggcgga tacacagccc tttaggccgc cacatcttca aataaagaca 60tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat ttcatgcaga 120tcaacaggtg taac 134<210>78<211>84<212>DNA<213>弱氧化葡糖桿菌<400>78aataaagaca tgtgatttta cggttttaac aaggccatgt gcagggaatg gcctgcgcat 60ttcatgcaga tcaacaggtg taac84<210>79<211>34<212>DNA<213>弱氧化葡糖桿菌<400>79gcctgcgcat ttcatgcaga tcaacaggtg taac34<210>80<211>51<212>DNA<213>弱氧化葡糖桿菌<400>80attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag t 51<210>81<211>101<212>DNA<213>弱氧化葡糖桿菌<400>81attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt t 101<210>82<211>151<212>DNA<213>弱氧化葡糖桿菌<400>82attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt ttccgggagt ccgggcgttg 120cggaatgtca gcctcagcct ggagcgtgga g 151<210>83<211>201<212>DNA<213>弱氧化葡糖桿菌<400>83attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt ttccgggagt ccgggcgttg 120cggaatgtca gcctcagcct ggagcgtgga gaaatccatg ctctgctggg ggaaaacggc 180gctggaaaat ccacgatcat c 201<210>84<211>251<212>DNA<213>弱氧化葡糖桿菌<400>84attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt ttccgggagt ccgggcgttg 120cggaatgtca gcctcagcct ggagcgtgga gaaatccatg ctctgctggg ggaaaacggc 180gctggaaaat ccacgatcat caagatcatg ggcggtatcc agtctcagga tgaagggcag 240atctttctca a 251<210>85<211>301<212>DNA<213>弱氧化葡糖桿菌<400>85attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt ttccgggagt ccgggcgttg 120cggaatgtca gcctcagcct ggagcgtgga gaaatccatg ctctgctggg ggaaaacggc 180gctggaaaat ccacgatcat caagatcatg ggcggtatcc agtctcagga tgaagggcag 240atctttctca acggaaagga gcgccacttc tccagctaca aggatgccat cagcgcaggt 300a 301<210>86<211>351<212>DNA<213>弱氧化葡糖桿菌<400>86attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt ttccgggagt ccgggcgttg 120cggaatgtca gcctcagcct ggagcgtgga gaaatccatg ctctgctggg ggaaaacggc 180gctggaaaat ccacgatcat caagatcatg ggcggtatcc agtctcagga tgaagggcag 240atctttctca acggaaagga gcgccacttc tccagctaca aggatgccat cagcgcaggt 300atcgggattg tttttcagga attcagcctg attcctgaac tcgatgccgt g 351<210>87<211>396<212>DNA<213>弱氧化葡糖桿菌<400>87attccgaagg cggccccgaa ttccggaggg aacattatga ctgaatccag tcagacatct 60ccagaacttc ttctggcgct tgagggaatc tccaagagtt ttccgggagt ccgggcgttg 120cggaatgtca gcctcagcct ggagcgtgga gaaatccatg ctctgctggg ggaaaacggc 180gctggaaaat ccacgatcat caagatcatg ggcggtatcc agtctcagga tgaagggcag 240atctttctca acggaaagga gcgccacttc tccagctaca aggatgccat cagcgcaggt 300atcgggattg tttttcagga attcagcctg attcctgaac tcgatgccgt ggataatatt 360ttcctcggtc gtgagatgcg gaacgctctt ggcttt 39權(quán)利要求
1.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)SEQ ID NO1的多核苷酸;(b)一種多核苷酸片段,其為SEQ ID NO1多核苷酸的至少約20個核苷酸長;(c)一種多核苷酸,其編碼SEQ ID NO4的氨基酸序列;以及(d)一種多核苷酸,其編碼為SEQ ID NO4氨基酸序列的至少約10個氨基酸長的片段。
2.一種分離的核酸分子,其所包含的多核苷酸至少約95%與 1中分離的核酸分子相同。
3.一種含有權(quán)利要求1的核酸之載體。
4.一種產(chǎn)生權(quán)利要求3的載體的方法,其包含(a)將權(quán)利要求1的多核苷酸插入載體;以及(b)在宿主細胞中選擇和擴增該載體。
5.一種包含權(quán)利要求3的載體之宿主細胞。
6.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)SEQ ID NO2的多核苷酸,或其片段;(b)一種多核苷酸片段,其為SEQ ID NO2多核苷酸的至少約20個核苷酸長;(c)一種多核苷酸,其編碼SEQ ID NO5的氨基酸序列;以及(d)一種多核苷酸,其編碼為SEQ ID NO5氨基酸序列的至少約10個氨基酸長的片段。
7.一種分離的核酸分子,其所包含的多核苷酸至少約95%與 6中分離的核酸分子相同。
8.一種含有權(quán)利要求6的核酸之載體。
9.一種產(chǎn)生權(quán)利要求8的載體的方法,其包含(a)將權(quán)利要求6的多核苷酸插入載體;以及(b)在宿主細胞中選擇和擴增該載體。
10.一種包含權(quán)利要求8的載體之宿主細胞。
11.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)SEQ ID NO3的多核苷酸;(b)一種多核苷酸片段,其為SEQ ID NO3多核苷酸的至少約20個核苷酸長;(c)一種多核苷酸,其編碼SEQ ID NO6的氨基酸序列;以及(d)一種多核苷酸,其編碼為SEQ ID NO6氨基酸序列的至少約10個氨基酸長的片段。
12.一種分離的核酸分子,其所包含的多核苷酸至少約95%與權(quán)利要求11中分離的核酸分子相同。
13.一種含有權(quán)利要求11的核酸之載體。
14.一種產(chǎn)生權(quán)利要求13的載體的方法,其包含(a)將權(quán)利要求11的多核苷酸插入載體;以及(b)在宿主細胞中選擇和增殖該載體。
15.一種包含權(quán)利要求13的載體之宿主細胞。
16.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)SEQ ID NO7的多核苷酸,以及;(b)一種多核苷酸片段,其為SEQ ID NO7多核苷酸的至少約20個核苷酸長;
17.一種分離的核酸分子,其所包含的多核苷酸至少約95%與 16中分離的核酸分子相同。
18.一種含有權(quán)利要求16的核酸之載體。
19.一種產(chǎn)生權(quán)利要求18的載體的方法,其包含(a)將權(quán)利要求16的多核苷酸插入載體;以及(b)在宿主細胞中選擇和擴增該載體。
20.一種宿主細胞,其包含權(quán)利要求18的載體。
21.權(quán)利要求16的核酸分子,其中該多核苷酸具有KCTC保藏號No.0593BP中包含的DNA克隆之完整核苷酸序列。
22.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)SEQ ID NO8的多核苷酸,以及;(b)一種多核苷酸片段,其為SEQ ID NO8多核苷酸的至少約20個核苷酸長;
23.一種分離的核酸分子,其所包含的多核苷酸至少約95%與 22中分離的核酸分子相同。
24.一種含有權(quán)利要求22的核酸之載體。
25.一種產(chǎn)生權(quán)利要求24的載體的方法,其包含(a)將權(quán)利要求22的多核苷酸插入載體;以及(b)在宿主細胞中選擇和擴增該載體。
26.一種包含權(quán)利要求24的載體之宿主細胞。
27.權(quán)利要求22的核酸分子,其中該多核苷酸具有KCTC保藏號No.0594BP中包含的DNA克隆之完整核苷酸序列。
28.一種從D-山梨糖醇生產(chǎn)L-山梨糖的方法,其包括(a)用至少一種分離的核酸序列轉(zhuǎn)化宿主細胞,其中分離的核酸序列選自(b)一種多核苷酸,其包含SEQ ID NO1的多核苷酸序列;(c)一種多核苷酸,其包含SEQ ID NO2的多核苷酸序列;以及(d)一種多核苷酸,其包含SEQ ID NO3的多核苷酸序列;以及(e)篩選和增殖該轉(zhuǎn)化的宿主細胞。
29.權(quán)利要求28的方法,其中該宿主細胞為葡糖桿菌屬。
30.一種分離的多肽,其包含選自如下的多肽序列(a)由SEQ ID NO3的多核苷酸序列編碼的多肽序列;(b)SEQ ID NO6的多肽序列;以及(c)一種多肽,其為SEQ ID NO6多肽序列的至少約10個氨基酸長。
31.一種產(chǎn)生多肽的方法,其包括(a)生長權(quán)利要求15的宿主細胞。(b)表達權(quán)利要求29的多肽;以及(c)分離該多肽。
32.一種增加2-酮-L-古洛糖酸產(chǎn)量的方法,其包括(a)用至少一種分離的核酸序列轉(zhuǎn)化宿主細胞,其中分離的核酸序列選自(b)一種多核苷酸,其包含SEQ ID NO1的多核苷酸序列;(c)一種多核苷酸,其包含SEQ ID NO2的多核苷酸序列;以及(d)一種多核苷酸,其包含SEQ ID NO3的多核苷酸序列;以及(e)篩選和增殖該轉(zhuǎn)化的宿主細胞。
33.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)如SEQ ID NO28所示的SEQ ID NO7中1-644的核苷酸;(b)如SEQ ID NO29所示的SEQ ID NO7中50-644的核苷酸;(c)如SEQ ID NO30所示的SEQ ID NO7中100-644的核苷酸;(d)如SEQ ID NO31所示的SEQ ID NO7中150-644的核苷酸;(e)如SEQ ID NO32所示的SEQ ID NO7中200-644的核苷酸;(f)如SEQ ID NO33所示的SEQ ID NO7中250-644的核苷酸;(g)如SEQ ID NO34所示的SEQ ID NO7中300-644的核苷酸;(h)如SEQ ID NO35所示的SEQ ID NO7中350-644的核苷酸;(i)如SEQ ID NO36所示的SEQ ID NO7中400-644的核苷酸;(j)如SEQ ID NO37所示的SEQ ID NO7中450-644的核苷酸;(k)如SEQ ID NO38所示的SEQ ID NO7中500-644的核苷酸;(l)如SEQ ID NO39所示的SEQ ID NO7中550-644的核苷酸;(m)如SEQ ID NO40所示的SEQ ID NO7中600-644的核苷酸;(n)如SEQ ID NO1所示的SEQ ID NO7中665-2,929的核苷酸序列,其編碼本發(fā)明的SDH之亞基1蛋白質(zhì)的全長;(o)如SEQ ID NO22所示的SEQ ID NO7中767-2,929的核苷酸序列,其編碼本發(fā)明的SDH之亞基1蛋白質(zhì)的成熟形式;(p)如SEQ ID NO41所示的SEQ ID NO7中2,930-2,963的核苷酸;(q)如SEQ ID NO2所示的SEQ ID NO7中2,964-4,400的核苷酸序列,其編碼本發(fā)明的SDH之亞基2蛋白質(zhì)的全長;(r)如SEQ ID NO23所示的SEQ ID NO7中3,072-4,400的核苷酸序列,其編碼本發(fā)明的SDH之亞基2蛋白質(zhì)的成熟形式;(s)如SEQ ID NO42所示的SEQ ID NO7中4,401-4,451的核苷酸;(t)如SEQ ID NO43所示的SEQ ID NO7中4,401-4,501的核苷酸;(u)如SEQ ID NO44所示的SEQ ID NO7中4,401-4,551的核苷酸;(v)如SEQ ID NO45所示的SEQ ID NO7中4,401-4,601的核苷酸;(w)如SEQ ID NO46所示的SEQ ID NO7中4,401-4,651的核苷酸;(x)如SEQ ID NO47所示的SEQ ID NO7中4,401-4,701的核苷酸;(y)如SEQ ID NO48所示的SEQ ID NO7中4,401-4,751的核苷酸;(z)如SEQ ID NO49所示的SEQ ID NO7中4,401-4,801的核苷酸;以及(aa)如SEQ ID NO50所示的SEQ ID NO7中4,401-4,830的核苷酸。
34.一種分離的核酸分子,其包含選自如下的多核苷酸序列(a)如SEQ ID NO51所示的SEQ ID NO8中1-1,383的核苷酸;(b)如SEQ ID NO52所示的SEQ ID NO8中50-1,383的核苷酸;(c)如SEQ ID NO53所示的SEQ ID NO8中100-1,383的核苷酸;(d)如SEQ ID NO54所示的SEQ ID NO8中150-1,383的核苷酸;(e)如SEQ ID NO55所示的SEQ ID NO8中200-1,383的核苷酸;(f)如SEQ ID NO56所示的SEQ ID NO8中250-1,383的核苷酸;(g)如SEQ ID NO57所示的SEQ ID NO8中300-1,383的核苷酸;(h)如SEQ ID NO58所示的SEQ ID NO8中350-1,383的核苷酸;(i)如SEQ ID NO59所示的SEQ ID NO8中400-1,383的核苷酸;(j)如SEQ ID NO60所示的SEQ ID NO8中450-1,383的核苷酸;(k)如SEQ ID NO61所示的SEQ ID NO8中500-1,383的核苷酸;(l)如SEQ ID NO62所示的SEQ ID NO8中550-1,383的核苷酸;(m)如SEQ ID NO63所示的SEQ ID NO8中600-1,383的核苷酸;(n)如SEQ ID NO64所示的SEQ ID NO8中600-1,383的核苷酸;(o)如SEQ ID NO65所示的SEQ ID NO8中650-1,383的核苷酸;(p)如SEQ ID NO66所示的SEQ ID NO8中700-1,383的核苷酸;(q)如SEQ ID NO67所示的SEQ ID NO8中750-1,383的核苷酸;(r)如SEQ ID NO68所示的SEQ ID NO8中800-1,383的核苷酸;(s)如SEQ ID NO69所示的SEQ ID NO8中850-1,383的核苷酸;(t)如SEQ ID NO70所示的SEQ ID NO8中900-1,383的核苷酸;(u)如SEQ ID NO71所示的SEQ ID NO8中950-1,383的核苷酸;(v)如SEQ ID NO72所示的SEQ ID NO8中1,000-1,383的核苷酸;(w)如SEQ ID NO73所示的SEQ ID NO8中1,050-1,383的核苷酸;(x)如SEQ ID NO74所示的SEQ ID NO8中1,100-1,383的核苷酸;(y)如SEQ ID NO75所示的SEQ ID NO8中1,150-1,383的核苷酸;(z)如SEQ ID NO76所示的SEQ ID NO8中1,200-1,383的核苷酸;(aa)如SEQ ID NO77所示的SEQ ID NO8中1,250-1,383的核苷酸;(bb)如SEQ ID NO78所示的SEQ ID NO8中1,300-1,383的核苷酸;(cc)如SEQ ID NO79所示的SEQ ID NO8中1,350-1,383的核苷酸;(dd)如SEQ ID NO3所示的SEQ ID NO8中從核苷酸1,384-1,461的核苷酸序列,其編碼本發(fā)明之SDH亞基3蛋白質(zhì)的全長;(ee)如SEQ ID NO24所示的SEQ ID NO8中從核苷酸1,462-2,304的核苷酸序列,其編碼本發(fā)明之SDH亞基3蛋白質(zhì)的成熟形式;(ff)如SEQ ID NO80所示的SEQ ID NO8中2,305-2,355的核苷酸;(gg)如SEQ ID NO81所示的SEQ ID NO8中2,305-2,405的核苷酸;(hh)如SEQ ID NO82所示的SEQ ID NO8中2,305-2,455的核苷酸;(ii)如SEQ ID NO82所示的SEQ ID NO8中2,305-2,505的核苷酸;(jj)如SEQ ID NO83所示的SEQ ID NO8中2,305-2,555的核苷酸;(kk)如SEQ ID NO85所示的SEQ ID NO8中2,305-2,605的核苷酸;(ll)如SEQ ID NO86所示的SEQ ID NO8中2,305-2,655的核苷酸;以及(mm)如SEQ ID NO87所示的SEQ ID NO8中2,305-2,700的核苷酸。
全文摘要
本發(fā)明涉及分子生物學(xué)、細菌學(xué)和工業(yè)發(fā)酵領(lǐng)域。更明確地說,本發(fā)明提供了分離的核酸分子以及含有該分離的核酸分子的載體和宿主細胞,其中分離的核酸分子編碼本發(fā)明之新的、膜結(jié)合的、氧化葡糖桿菌(Gluconobacter oxydans)山梨糖醇脫氫酶(SDH)的三個亞基。本發(fā)明進一步提供了本發(fā)明之SDH酶的三個亞基的分離多肽,并且提供了產(chǎn)生L-山梨糖和2-酮-L-古洛糖酸的方法。
文檔編號C12N9/04GK1354794SQ99816659
公開日2002年6月19日 申請日期1999年4月23日 優(yōu)先權(quán)日1999年4月22日
發(fā)明者E-S·車, S-K·任, E-H·李 申請人:韓國生物科學(xué)和生物工藝學(xué)研究院, 科米技術(shù)公司, 阿徹-丹尼爾斯-米德蘭公司