欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有α-葡糖醛酸糖苷酶活性的多肽和編碼該多肽的多核苷酸的制作方法

文檔序號:531069閱讀:309來源:國知局

專利名稱::具有α-葡糖醛酸糖苷酶活性的多肽和編碼該多肽的多核苷酸的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及具有α-葡糖醛酸糖苷酶活性的分離的多肽以及編碼該多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細胞以及制備和使用所述多肽的方法。
背景技術(shù)
:植物細胞壁多糖構(gòu)成植物細胞壁的90%并且可以被分成三組纖維素、半纖維素和果膠。纖維素代表細胞壁多糖的主要成分。半纖維素是植物細胞壁的第二豐富的成分。主要的半纖維素聚合物是木聚糖。植物細胞壁內(nèi)發(fā)現(xiàn)的木聚糖的結(jié)構(gòu)可以根據(jù)其來源而顯著不同,但是它們都含有β-1,4-連接的D-木糖主鏈。這種β-1,4-連接的D-木糖主鏈可以被多種側(cè)基取代,如L-阿拉伯糖(L-arabinose)、D_半乳糖、乙酰基、阿魏?;?feruloyl)、對_香豆?;推咸烟侨┧釟埢?。半纖維素的完全水解需要包括乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃苷糖酶、木糖苷酶和α-葡糖醛酸糖苷酶的酶復(fù)合物的作用。α-葡糖醛酸糖苷酶是負責(zé)水解木糖與D-葡萄糖醛酸或其4-0-甲基醚之間的α-1,2-糖苷鍵的酶。本發(fā)明的目的是提供適合于工業(yè)方法中使用的具有α-葡糖醛酸糖苷酶活性的新的多肽,所述工業(yè)方法例如,包括將纖維素生物質(zhì)(cellulosicbiomass)轉(zhuǎn)變?yōu)橛杏玫漠a(chǎn)物(包括乙醇)的方法。deWet等人已經(jīng)披露了67.3%相同的來自出芽短梗霉菌(Aureobasidiumpullulans)白勺α-罾(EnzymeMicrob.Technol.38649-656,2006)。
發(fā)明內(nèi)容本發(fā)明涉及α-葡糖醛酸糖苷酶,且具體而言涉及具有與源自桔灰青霉(Penicillumaurantiogriseum)并在SEQIDNO:2中公開的α-葡糖醛酸糖苷酶同源的或相同的氨基酸序列的α-葡糖醛酸糖苷酶。本發(fā)明的第一方面提供具有α-葡糖醛酸糖苷酶活性的分離的多肽,其選自下組(a)包含與SEQIDNO:2的成熟多肽具有至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少85%、最優(yōu)選至少90%、和甚至最優(yōu)選至少95%同一性的氨基酸序列的多肽;(b)由在至少高嚴緊性條件下與(i)SEQIDN0:1的成熟多肽編碼序列,(ii)包含SEQIDNO:1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈雜交的多核苷酸編碼的多肽;(c)由包含與SEQIDNO1的成熟多肽編碼序列具有至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少85%、最優(yōu)選至少90%、和甚至最優(yōu)選至少95%同一性的核苷酸序列的多核苷酸編碼的多肽;(d)SEQIDNO:2的成熟多肽包含一個或多個(數(shù)個)氨基酸的取代、缺失和/或插入的變體。在第二方面本發(fā)明提供包含編碼第一方面的多肽的核苷酸序列的分離的多核苷酸。在第三方面本發(fā)明提供包含與一種或多種(數(shù)種)控制序列可操作地連接的第二方面的多核苷酸的核酸構(gòu)建體,所述控制序列在宿主表達中指導(dǎo)所述多肽的產(chǎn)生。在第四方面本發(fā)明提供包含第三方面的核酸構(gòu)建體的重組表達載體。在第五方面本發(fā)明提供包含第三方面的核酸構(gòu)建體的重組宿主細胞。在第六方面本發(fā)明提供產(chǎn)生第一方面的多肽的方法,其包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。在第七方面本發(fā)明提供產(chǎn)生第一方面的多肽的方法,其包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)包含核酸構(gòu)建體的宿主細胞,所述核酸構(gòu)建體包含編碼所述多肽的核苷酸序列;和(b)回收所述多肽。在第八方面本發(fā)明提供產(chǎn)生第一方面的多肽的方法,其包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)包含編碼所述多肽的多核苷酸的轉(zhuǎn)基因植物或植物細胞;和(b)回收所述多肽。在第九方面本發(fā)明提供用編碼第一方面的多肽的多核苷酸轉(zhuǎn)化的轉(zhuǎn)基因植物、植物部分或植物細胞的方法。在第十方面本發(fā)明提供產(chǎn)生蛋白質(zhì)的方法,其包括(a)在有益于產(chǎn)生所述蛋白質(zhì)的條件下培養(yǎng)第五方面的重組宿主細胞;和(b)回收所述蛋白質(zhì)。在第11方面本發(fā)明提供用于降解或轉(zhuǎn)變生物質(zhì)材料的方法,其包括用第一方面的多肽處理所述材料。在第12方面本發(fā)明提供組合物,其包含第一方面的多肽,和選自乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃苷糖酶和木糖苷酶中的一種或多種酶。在第13方面本發(fā)明提供第一方面的多肽或第12方面的組合物在用于生物質(zhì)材料水解的方法中的用途,包括將所述生物質(zhì)與所述多肽或所述組合物接觸。定義a-葡糖醛酸糖苷酶活性術(shù)語“a-葡糖醛酸糖苷酶活性”在此定義為催化a-D-葡糖醛酸苷+H20=醇+D-葡糖醛酸的反應(yīng)的EC3.2.1.139活性。就本發(fā)明而言,a-葡糖醛酸糖苷酶活性是根據(jù)deVries所描述的步驟(J.Bacterid,1998,Vol.180,p.243-249)來測定的。一單位的a_葡糖醛酸糖苷酶活性等于在標題為“測定a-葡糖醛酸糖苷酶活性”的部分中所描述的標準測定條件下每分鐘能夠1微摩爾葡萄糖醛酸或4-0-甲基葡萄糖醛酸的酶的量。本發(fā)明的多肽具有SEQIDNO:2的成熟多肽的a-葡糖醛酸糖苷酶活性的至少20%,優(yōu)選至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,和甚至最優(yōu)選至少100%。分離的多肽本文所用的術(shù)語“分離的多肽”是指從來源分離的多肽。在優(yōu)選的方面,所述多肽如通過SDS-PAGE測定為至少純、優(yōu)選至少5%純、更優(yōu)選至少10%純、更優(yōu)選至少20%純、更優(yōu)選至少40%純、更優(yōu)選至少60%純、甚至更優(yōu)選至少80%純、和最優(yōu)選至少90%純。基本上純的多肽術(shù)語“基本上純的多肽”在本文是指多肽制備物,其含有以重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,和甚至最優(yōu)選至多0.5%的與其天然地或重組地相伴隨的(associated)其它多肽物質(zhì)。因此,優(yōu)選的是,基本上純的多肽以制備物中存在的總多肽物質(zhì)的重量計是至少92%純、優(yōu)選至少94%純、更優(yōu)選至少95%純、更優(yōu)選至少96%純、更優(yōu)選至少96%純、更優(yōu)選至少97%純、更優(yōu)選至少98%純、甚至更優(yōu)選至少99%、最優(yōu)選至少99.5%純、和甚至最優(yōu)選100%純。本發(fā)明的多肽優(yōu)選是基本上純的形式,即,所述多肽制備物實質(zhì)上不含與其天然地或重組地相伴隨的其它多肽物質(zhì)。這可以通過例如用公知的重組方法或通過經(jīng)典的純化方法制備所述多肽來實現(xiàn)。成熟多肽術(shù)語“成熟多肽”在本文中定義為在翻譯和任何翻譯后修飾(如N末端加工、C末端截斷、糖基化、磷酸化等)之后,處于其最終形式的具有a-葡糖醛酸糖苷酶活性的多肽。在優(yōu)選的方面,所述成熟多肽是SEQIDNO:2的氨基酸1至835。成熟多肽編碼序列術(shù)語“成熟多肽編碼序列”在本文中定義為編碼具有a-葡糖醛酸糖苷酶活性的成熟多肽的核苷酸序列。在優(yōu)選的方面,成熟多肽編碼序列是SEQIDNO1的核苷酸1至2508。同一性兩個氨基酸序列之間或者兩個核苷酸序列之間的相關(guān)性用參數(shù)“同一性”來描述。就本發(fā)明而言,兩個氨基酸序列之間的同一性程度是使用如EMBOSS軟件包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276_277)(優(yōu)選3.0.0或更新的版本)中的Needle程序所執(zhí)行的Needleman-ffunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)來測定的。所用的可選參數(shù)為缺口形成罰分(gapopenpenalty)10、缺口延伸罰分(gapextensionpenalty)0.5、和EBL0SUM62(BL0SUM62的EMBOSS版本)取代矩陣。將Needle的標記為"longestidentity”(“最長同一性”)(使用-nobrief(無簡述)選項獲得)的輸出結(jié)果作為百分比同一性使用,且它是如下計算出來的(相同的殘基數(shù)xl00)/(比對長度-比對中的缺口總數(shù))就本發(fā)明而言,兩個脫氧核糖核苷酸序列之間的同一性程度是使用如EMBOSS軟(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice^,2000,同上)(優(yōu)選3.0.0或更新的版本)中的Needle程序所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)來測定的。所用的可選參數(shù)為缺口形成罰分10、缺口延伸罰分0.5、禾口EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩陣。將Needle的標記為"longestidentity"(“最長同一性”)(使用-nobrief選項獲得)的輸出結(jié)果作為百分比同一性使用,且它是如下計算出來的(相同的脫氧核糖核苷酸數(shù)XlOO)/(比對長度-比對中的缺口總數(shù))同源序列術(shù)語“同源序列”在本文中定義為在用SEQIDNO:2的成熟多肽的tfasty(Pearson,W.R.,1999,TBioinformaticsMethodsandProtocols,S.Misener和S.A.Krawetz,185-219頁)得到小于0.001的E值(或稱期望得分)的預(yù)測蛋白質(zhì)?;蛘?,術(shù)語“同源序列”定義為與SEQIDNO2的成熟多肽具有優(yōu)選至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少90%、最優(yōu)選至少95%、和甚至最優(yōu)選至少96%、至少97%、至少98%或至少99%同一性程度的氨基酸序列,所述氨基酸序列具有α-葡糖醛酸糖苷酶活性。多肽片段術(shù)語“多肽片段”在本文中定義為從SEQIDNO2的成熟多肽的氨基末端和/或羧基末端缺失一個或多個(數(shù)個)氨基酸的多肽;或其同源序列;其中所述片段具有α-葡糖醛酸糖苷酶活性。在優(yōu)選的方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少500個氨基酸殘基、更優(yōu)選至少600個氨基酸殘基,且最優(yōu)選至少700個氨基酸殘基,如至少800個氨基酸殘基。亞序列術(shù)語“亞序列”在本文中定義為從SEQIDNO:1的成熟多肽編碼序列的5’端和/或3’端缺失一個或多個(數(shù)個)核苷酸的核苷酸序列;或者其同源序列;其中所述亞序列編碼具有α-葡萄糖醛酸活性的多肽片段。等位變體(allelicvariant)術(shù)語“等位變體”在本文是指基因的占據(jù)同一染色體基因座的兩種或更多種可選形式中的任一種。等位變異通過突變天然產(chǎn)生,并可導(dǎo)致群體中的多態(tài)性?;蛲蛔兛梢允浅聊?編碼的多肽中沒有變化),或者可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體所編碼的多肽。分離的多核苷酸本文中所用的術(shù)語“分離的多核苷酸”是指從來源分離的多核苷酸。在一個優(yōu)選的方面,所述多核苷酸如通過瓊脂糖電泳測定為至少純、優(yōu)選至少5%純、更優(yōu)選至少10%純、更優(yōu)選至少20%純、更優(yōu)選至少40%純、更優(yōu)選至少60%純、甚至更優(yōu)選至少80%純、和最優(yōu)選至少90%純?;旧霞兊亩嗪塑账岜疚闹兴玫男g(shù)語“基本上純的多核苷酸”是指多核苷酸制備物,其不含其它外來的或不需要的核苷酸,并且處于適合在經(jīng)基因工程改造的蛋白質(zhì)的生產(chǎn)系統(tǒng)中使用的形式。因此,基本上純的多核苷酸含有以重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,和甚至最優(yōu)選至多0.5%的與其天然地或重組地相伴隨的其它多核苷酸物質(zhì)。但是,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區(qū),如啟動子和終止子。優(yōu)選的是,所述基本上純的多核苷酸以重量計為至少90%純、優(yōu)選至少92%純、更優(yōu)選至少94%純、更優(yōu)選至少95%純、更優(yōu)選至少96%純、更優(yōu)選至少97%純、甚至更優(yōu)選至少98%純、最優(yōu)選至少99%純、甚至最優(yōu)選至少99.5%純。本發(fā)明的多核苷酸優(yōu)選是基本上純的形式,即所述多核苷酸制備物實質(zhì)上不含與其天然地或重組地相伴隨的其它多核苷酸物質(zhì)。多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任意組合。編碼序列當用于本文時,術(shù)語“編碼序列”是指這樣的核苷酸序列,它直接規(guī)定其蛋白質(zhì)產(chǎn)物的氨基酸序列。編碼序列的邊界一般是由可讀框決定的,后者通常以ATG起始密碼子或其它可選的起始密碼子如GTG及TTG開始,并以終止密碼子如TAA、TAG和TGA結(jié)束。編碼序列可以是DNA、cDNA、合成的、或重組的核苷酸序列。cDNA:術(shù)語“cDNA”在本文中定義為這樣的DNA分子,它能夠從獲自真核細胞的成熟的、經(jīng)剪接的mRNA分子通過逆轉(zhuǎn)錄制備。cDNA缺少在對應(yīng)的基因組DNA中通常存在的內(nèi)含子序列。最初的初級RNA轉(zhuǎn)錄物是mRNA的前體,它經(jīng)歷一系列步驟被加工之后作為成熟的、經(jīng)剪接的mRNA出現(xiàn)。這些步驟包括通過一個稱為剪接的過程去除內(nèi)含子序列。因此,從mRNA衍生而來的cDNA缺少任何內(nèi)含子序列。核酸構(gòu)建體術(shù)語“核酸構(gòu)建體”在用于本文時是指這樣的單鏈或雙鏈核酸分子,其是從天然存在的基因分離的,或者其經(jīng)過修飾而以原本不會存在于自然界中的方式(inamannerthatwouldnototherwiseexistinnature)包含核酸的片段,或者其是合成的。當核酸構(gòu)建體含有本發(fā)明的編碼序列的表達所需的控制序列時,術(shù)語核酸構(gòu)建體與術(shù)語“表達盒”是同義的??刂菩蛄行g(shù)語“控制序列”在本文中定義為包括編碼本發(fā)明多肽的多核苷酸的表達所必需的所有組件。每個控制序列對于編碼所述多肽的核苷酸序列而言可以是天然的或外來的,或者對于彼此而言可以是天然的或外來的。這樣的控制序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽(prop印tide)序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。在最低程度上,控制序列包括啟動子以及轉(zhuǎn)錄和翻譯終止信號??刂菩蛄锌梢蕴峁┯薪宇^,用來引入特異性限制性位點以幫助將控制序列與編碼多肽的核苷酸序列的編碼區(qū)連接??刹僮鞯剡B接術(shù)語“可操作地連接”在本文中是指這樣一種構(gòu)型,其中控制序列相對于多核苷酸序列的編碼序列置于合適的位置上,使得該控制序列指導(dǎo)多肽編碼序列的表達。表達術(shù)語“表達”包括多肽產(chǎn)生中涉及的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術(shù)語“表達載體”在本文中定義為線型或環(huán)狀DNA分子,其包含編碼本發(fā)明多肽的多核苷酸,且可操作地連接于為其表達所提供的其它核苷酸。宿主細胞術(shù)語“宿主細胞”在用于本文時包括任何對于使用包含本發(fā)明的多核苷酸的核酸構(gòu)建體或表達載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等易感的細胞類型。修飾術(shù)語“修飾”在本文中意指對由SEQIDNO2的成熟多肽組成的多肽或其同源序列的任何化學(xué)修飾;以及對編碼這樣的多肽的DNA的遺傳操作。修飾可以是一個或多個(數(shù)個)氨基酸的取代、缺失和/或插入,以及一個或多個(數(shù)個)氨基酸側(cè)鏈的替換。人工變體當在本文中使用時,術(shù)語“人工變體”是指由下述生物體所產(chǎn)生的具有α-葡糖醛酸糖苷酶活性的多肽,所述生物體表達SEQIDNO:1的成熟多肽編碼序列的修飾的多核苷酸序列;或其同源序列。所述修飾的核苷酸序列是通過修飾SEQIDΝ0:1中公開的多核苷酸序列或其同源序列加以人工干預(yù)而獲得的。糖苷水解酶(GH)家族應(yīng)用于本公開的GH家族的編號遵循在URL=http://afmb.cnrs-mrs.fr/cazy/CkTi/index,html的Coutinho,P.Μ.&Henrissat,B.(1999)CAZy-Carbohydrate-ActiveEnzymesserver或者Coutinho,P.Μ.&Henrissat,B.1999;Themodularstructureofcellulasesandothercarbohydrate-activeenzymesanintegrateddatabaseapproach,-f"Genetics,BiochemistryandEcologyofCelluloseDegradation".,編者K.Ohmiya,K.Hayashi,K.Sakka,Y.Kobayashi,S.Karita禾口T.Kimura,UniPublishersCo.,Tokyo,15—23頁禾口Bourne,Y.&Henrissat,B.2001;Glycosidehydrolasesandglycosyltransferases:familiesandfunctionalmodules,CurrentOpinioninStructuralBiology11:593_600中的概念。本發(fā)明中的多肽優(yōu)選為GH家族67。發(fā)明詳述具有a-葡糖醛酸糖苷酶活性的多肽在優(yōu)選的方面,本發(fā)明涉及包含與SEQIDNO:2的成熟多肽具有優(yōu)選至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少90%、最優(yōu)選至少95%、和甚至最優(yōu)選至少96%、至少97%、至少98%或至少99%同一性程度的氨基酸序列的分離的多肽,所述多肽具有a-葡糖醛酸糖苷酶活性(下文中的“同源多肽”)。在優(yōu)選的方面,所述同源多肽具有的氨基酸序列與SEQIDN02的成熟多肽有十個氨基酸、優(yōu)選五個氨基酸、更優(yōu)選四個氨基酸、甚至更優(yōu)選三個氨基酸、最優(yōu)選兩個氨基酸、且甚至最優(yōu)選一個氨基酸的不同。本發(fā)明的多肽優(yōu)選包含SEQIDNO2的氨基酸序列或其等位變體;或它們的具有a-葡糖醛酸糖苷酶活性的片段。在優(yōu)選的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一優(yōu)選的方面,多肽包含SEQIDNO:2的成熟多肽。在另一優(yōu)選的方面,多肽包含SEQIDNO2的氨基酸1至835,或其等位變體;或它們的具有a-葡糖醛酸糖苷酶活性的片段。在另一優(yōu)選的方面,多肽包含SEQIDNO:2的氨基酸序列1至835。在另一優(yōu)選方面,多肽由SEQIDN02的氨基酸序列或其等位變體組成;或由其具有a_葡糖醛酸糖苷酶活性的片段組成。在另一優(yōu)選方面,多肽由SEQIDNO:2的氨基酸序列組成。在另一優(yōu)選方面,多肽由SEQIDNO2的成熟多肽組成。在另一優(yōu)選的方面,多肽由SEQIDNO2的氨基酸1至835或其等位變體組成;或由其具有a_葡糖醛酸糖苷酶活性的片段組成。在另一優(yōu)選的方面,多肽由SEQIDN02的氨基酸1至835組成。在優(yōu)選的方面,本發(fā)明涉及具有a-葡糖醛酸糖苷酶活性的分離的多肽,其是由在優(yōu)選非常低嚴緊性條件、更優(yōu)選低嚴緊性條件、更優(yōu)選中嚴緊性條件、更優(yōu)選中_高嚴緊性條件、甚至更優(yōu)選高嚴緊性條件、且最優(yōu)選非常高嚴緊性條件下與以下雜交的多核苷酸編碼的(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含SEQIDNO1的成熟多肽編碼序列的基因組DNA序列,(iii)⑴或(ii)的亞序列,或(iv)(i)、(ii)或(iii)的全長互補鏈(J.Sambrook,E.F.Fritsch,andT.Maniatis,1989,MolecularCloning,ALaboratoryManual,2dedition,ColdSpringHarbor,NewYork)。SEQIDNO1的成熟多肽編碼序列的亞序列含有至少100個連續(xù)核苷酸或優(yōu)選至少200個連續(xù)核苷酸。而且,所述亞序列可編碼具有a-葡糖醛酸糖苷酶活性的多肽片段。在優(yōu)選的方面,所述互補鏈是SEQIDNO1的成熟多肽編碼序列的全長互補鏈。根據(jù)本領(lǐng)域已知的方法,SEQIDNO1的核酸序列;或其亞序列;以及SEQIDNO2的氨基酸序列;或其片段;可用于設(shè)計核酸探針以從不同屬或種的菌株鑒定和克隆編碼具有a-葡糖醛酸糖苷酶活性的多肽的DNA。具體而言,按照標準Southern印跡步驟,這種探針可用于與感興趣的屬或種的基因組或cDNA的雜交,從而從其中鑒定并分離相應(yīng)的基因。這些探針可以顯著短于全序列,但是其長度應(yīng)為至少14,優(yōu)選至少25,更優(yōu)選至少35,且最優(yōu)選至少70個核苷酸。然而,核酸探針長度優(yōu)選至少100個核苷酸。例如,核酸探針長度可以是至少200個核苷酸,優(yōu)選至少300個核苷酸,更優(yōu)選至少400個核苷酸,或最優(yōu)選至少500個核苷酸。甚至可以用更長的探針,如,長度為優(yōu)選至少600個核苷酸,更優(yōu)選至少700個核苷酸,甚至更優(yōu)選至少800個核苷酸,或最優(yōu)選至少900個核苷酸的核酸探針。也可以使用DNA和RNA探針。通常對所述探針進行標記以檢測對應(yīng)的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin))。將這些探針包含于本發(fā)明中。因此,可從由這些其它菌株制備的基因組DNA或cDNA文庫篩選與上述探針雜交并且編碼具有a-葡糖醛酸糖苷酶活性的多肽的DNA。通過瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術(shù)可以分離來自這些其它菌株的基因組或其它DNA。來自文庫的DNA或分離的DNA可以被轉(zhuǎn)移并固定到硝酸纖維素(nitrocellulose)或其它適宜的載體材料上。為了鑒定與SEQIDNO1同源的克隆或DNA;或其亞序列;優(yōu)選將所述載體材料用在Southern印跡中。就本發(fā)明而言,雜交指在非常低至非常高嚴緊性條件下,核苷酸序列與標記的核酸探針雜交,所述核酸探針對應(yīng)于SEQIDNO1的成熟多肽編碼序列;包含SEQIDNO:1的成熟多肽編碼序列的基因組DNA序列;其全長互補鏈;或其亞序列。可使用例如X射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在優(yōu)選的方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列。在另一優(yōu)選的方面,核酸探針是SEQIDNO:1的核苷酸1至2508。在另一優(yōu)選的方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一優(yōu)選的方面,核酸探針是SEQIDNO1。對于長度至少100個核苷酸的長探針,非常低至非常高的嚴緊性條件定義為在42°C在5XSSPE、0.3%SDS,200ug/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴緊性為25%甲酰胺,對于中和中-高嚴緊性為35%的甲酰胺、或?qū)τ诟吆头浅8邍谰o性為50%的甲酰胺,根據(jù)標準的Southern印跡步驟進行預(yù)雜交和雜交最佳12至24小時。對于長度至少100個核苷酸的長探針,載體材料最終用2XSSC,0.2%SDS洗滌3次每次15分鐘,優(yōu)選在45°C(非常低嚴緊性)、更優(yōu)選在50°C(低嚴緊性)、更優(yōu)選在55°C(中嚴緊性)、更優(yōu)選在60°C(中-高嚴緊性)、甚至更優(yōu)選在65°C(高嚴緊性)、且最優(yōu)選在70°C(非常高嚴緊性)。對于長度約為15至約70個核苷酸的短探針,嚴緊性條件定義為在比使用根據(jù)Bolton禾口McCarthy的計算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)計算得出的Tm低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸鈉(sodiumpyrophosphate),ImM磷酸二氫鈉(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,根據(jù)標準的Southern印跡步驟進行預(yù)雜交、雜交和雜交后洗滌最佳12至24小時。對于長度為約15個核苷酸至約70個核苷酸的短探針,將載體材料在6XSSC加0.1%SDS中洗滌一次15分鐘,并用6XSSC在比計算得出的Tm低5°C至10°C的溫度洗滌兩次,每次15分鐘。在另一方面,本發(fā)明涉及具有a-葡糖醛酸糖苷酶活性的分離的多肽,其由包含如下核苷酸序列或由如下核苷酸序列組成的多核苷酸編碼,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,且甚至最優(yōu)選至少96%、97%、98%或99%的同一性程度,其編碼活性的多肽。參見本文中的多核苷酸部分。在另一方面,本發(fā)明涉及人工變體,所述人工變體包含取代、缺失和/或插入一個或多個(數(shù)個)氨基酸的SEQIDNO2的成熟多肽;或其同源序列。優(yōu)選的,氨基酸改變對性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;通常為1至約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(poly-histidinetract)、抗原表位(antigenicepitope)或結(jié)合域(bindingdomain)。保守取代的實例是在以下組之內(nèi)堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領(lǐng)域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20個基本氨基酸,非基本氨基酸(如4-羥脯氨酸、6-N-甲基賴氨酸、2_氨基異丁酸、異纈氨酸和α-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數(shù)量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。“非天然氨基酸”在蛋白質(zhì)合成后已經(jīng)過修飾,和/或在它們的側(cè)鏈具有不同于基本氨基酸的化學(xué)結(jié)構(gòu)。非天然氨基酸能夠以化學(xué)方法合成,并且優(yōu)選是商業(yè)上能夠獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑燒羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸??晒┻x擇的是,氨基酸改變具有這樣的性質(zhì)以使多肽的物理化學(xué)性質(zhì)改變。例如,氨基酸改變可改進多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。能夠根據(jù)本領(lǐng)域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244:1081_1085)來鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物學(xué)活性(即,α-葡糖醛酸糖苷酶活性)以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271=4699-4708酶的活性部位或其它的生物相互作用也能夠通過結(jié)構(gòu)的物理分析而測定,如通過以下這些技術(shù)如核磁共振、晶體學(xué)、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的同一性也能夠從與多肽的同一性分析來推斷,所述多肽與根據(jù)本發(fā)明的多肽相關(guān)。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關(guān)的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53_57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或W095/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochem.3010832-10837;美國專利5,223,409號;W092/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領(lǐng)域內(nèi)標準方法快速測序。這些方法允許快速測定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應(yīng)用于未知結(jié)構(gòu)的多肽。SEQIDN02的成熟多肽(如SEQIDN02的氨基酸1至835)的氨基酸取代、缺失和/或插入的總數(shù)是10,優(yōu)選9,更優(yōu)選8,更優(yōu)選7,更優(yōu)選至多6,更優(yōu)選5,更優(yōu)選4,甚至更優(yōu)選3,最優(yōu)選2,且甚至最優(yōu)選1。具有a-葡糖醛酸糖苷酶活性的多肽的來源本發(fā)明的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關(guān)的術(shù)語“獲得自”,意思應(yīng)是核苷酸序列編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的核苷酸序列的菌株產(chǎn)生。在優(yōu)選的方面,獲得自給定來源的多肽是胞外分泌的。本發(fā)明的具有a-葡糖醛酸糖苷酶活性的多肽優(yōu)選是真菌多肽,并且更優(yōu)選是酵母多肽例如具有葡糖醛酸糖苷酶活性的念珠菌屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽;或更優(yōu)選是絲狀真菌多肽例如具有a-葡糖醛酸糖苷酶活性的枝頂孢霉屬(Acremonium)、蘑菇屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、葡萄座腔菌屬(Botryospaeria)、擬賭菌屬(Ceriporiopsis)、毛殼菌屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、麥角屬(Claviceps)、方寵抱腔菌屬(Cochliobolus)、Coprinopsis、Coptotermes、棒囊殼屬(Corynascus)、栗疫病菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、網(wǎng)孢菌屬(Filibasidium)、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質(zhì)霉屬(Humicola)、奉巴菌屬(Irpex)>M(Lentinula)、小球腔菌屬(Leptospaeria)、梨孢菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霄屬(Mucor)、毀絲霄屬(Myceliophthora)、新考瑪月旨霄屬(Neocallimastix)、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia>H|ifM(Pseudoplectania)、Pseudotrichonympha>根毛霉屬(Rhizomucor)、裂褶菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、Trichophaea、輪枝抱屬(Verticillium)、小包腳菇屬(Volvariella)、或炭角菌屬(Xylaria)多肽。在優(yōu)選的方面,所述多肽是具有a-葡糖醛酸糖苷酶活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一個優(yōu)選的方面,所述多肽是具有α-葡糖醛酸糖苷酶活性的解纖維枝丁頁?包霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構(gòu)巢曲霉(Aspergillusnidulans)、■ffiβ、^ffiβ(Aspergillusoryzae)、口f_Mt包菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、ChrysosporiumpannicoIaλChrysosporiumqueenslandicum、Chrysosporiumzonatum、桿孢狀鐮孢(Fusariumbactridioides)、禾谷鐮孢(Fusariumcerealis)、庫威鐮孢(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰色腐質(zhì)酶(Humicolagrisea)、特異腐質(zhì)霉(Humicolainsolens)、疏棉狀腐質(zhì)霉(Humicolalmuginosa)、乳白耙菌(Irpexlacteus)、米赫毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糙脈孢菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產(chǎn)紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、無色梭包殼(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼(Thielaviaaustraleinsis)、Thielaviafimeti、小抱子梭抱殼(Thielaviamicrospora)、Thielaviaovispora、Thielaviaperuviana、Thielaviaspededonium、€包冑(Thielaviasetosa)ΛThielaviasubthermophila、zht—冑(Thielaviaterrestris)Λ哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多月太。在另一優(yōu)選方面,多肽是青霉屬多肽,并且優(yōu)選是桔灰青霉多肽??衫斫獾氖菍τ谇笆龅姆N,本發(fā)明包含完全和不完全階段(perfectandimperfectstates)二者,和其它分類學(xué)的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領(lǐng)域熟練技術(shù)人員會容易地識別適合的等同物的身份(identity)。這些種的菌株在許多培養(yǎng)物保藏機構(gòu)對于公眾能夠容易地取得,所述保藏機構(gòu)如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物禾口細胞培養(yǎng)物保藏中心(DeutscheSamlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimelcultures)(CBS)和農(nóng)業(yè)研究機構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物,鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術(shù)是本領(lǐng)域內(nèi)公知的。隨后可通過相似地篩選另一微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就能夠通過使用本領(lǐng)域普通技術(shù)人員熟知的技術(shù)將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,同上文)。多核苷酸本發(fā)明還涉及包含編碼本發(fā)明的具有葡糖醛酸糖苷酶活性的多肽的核苷酸序列或由該核苷酸序列組成的分離的多核苷酸。在優(yōu)選的方面,核苷酸序列包含SEQIDNO1或由SEQIDN0:1組成。在另一優(yōu)選的方面,核苷酸序列包含SEQIDNO1的成熟多肽編碼序列或由SEQIDNO1的成熟多肽編碼序列組成。在另一優(yōu)選的方面,核苷酸序列包含SEQIDNO1的核苷酸1至2508或由SEQIDN0:1的核苷酸1至2508組成。本發(fā)明還包括編碼下述多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽或由SEQIDNO:2的氨基酸序列或其成熟多肽組成,由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽編碼序列。本發(fā)明還涉及編碼具有a-葡糖醛酸糖苷酶活性的SEQIDN0:2的片段的SEQIDNO1的亞序列。本發(fā)明還涉及突變的多核苷酸,其包含或其組成為在SEQIDNO1的成熟多肽編碼序列中的至少一個突變,其中突變的核苷酸序列編碼SEQIDNO:2的成熟多肽。用于分離或克隆編碼多肽的多核苷酸的技術(shù)是本領(lǐng)域內(nèi)已知的,且包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合酶鏈式反應(yīng)(PCR)或表達文庫的抗體篩選來檢測具有共有結(jié)構(gòu)特性的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆本發(fā)明的多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork??梢允褂闷渌怂釘U增方法,如連接酶鏈式反應(yīng)(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)。可以從青霉屬(優(yōu)選桔灰青霉)菌株,或另外的或相關(guān)的生物體克隆所述多核苷酸,并且因此可以是例如所述核苷酸序列的多肽編碼區(qū)的等位基因變體或種變體(speciesvariant)0本發(fā)明也涉及包含如下核苷酸序列或由如下核苷酸序列組成的分離的多核苷酸,所述核苷酸序列與SEQIDNO:1的成熟多肽編碼序列具有至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%、最優(yōu)選至少95%,且甚至最優(yōu)選至少96%、至少97%,至少98%或至少99%同一性程度,所述多核苷酸編碼活性多肽。修飾編碼本發(fā)明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術(shù)語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適PH等方面不同的人工變體??梢栽谧鳛镾EQIDN01的成熟多肽編碼區(qū)存在的核苷酸序列,例如其亞序列的基礎(chǔ)上,和/或通過引入如下核苷酸取代來構(gòu)建變體序列所述取代不產(chǎn)生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關(guān)于核苷酸取代的概述,參見,例如Ford等A1991,ProteinExpressionandPurification2一107。對于本領(lǐng)域技術(shù)人員顯而易見的是,這些取代能夠在對于分子功能重要的區(qū)域之外進行,并且仍然產(chǎn)生活性多肽。對于由本發(fā)明的分離的多核苷酸編碼的多肽活性關(guān)鍵的并且因此優(yōu)選不進行取代的氨基酸殘基,可以根據(jù)本領(lǐng)域公知的方法,如定位誘變或丙氨酸分區(qū)誘變法(參見,例如,Cunningham和Wells,1989,同上文)來鑒定。在后一技術(shù)中,將突變引入到分子中的每個荷正電的殘基處,并且測試所得突變分子的α_葡糖醛酸糖苷酶活性,以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。底物_酶相互作用的位點也能夠通過分析三維結(jié)構(gòu)測定,通過如核磁共振分析、晶體學(xué)或光親和標記這樣的技術(shù)來測定(參見,例如deVos等,1992,同上文;Smith等,1992,同上文;Wlodaver等,1992,同上文)。如在本文中所限定,本發(fā)明還涉及編碼本發(fā)明的多肽的分離的多核苷酸,其在非常低嚴緊性條件、優(yōu)選低嚴緊性條件、更優(yōu)選中嚴緊性條件,更優(yōu)選中_高嚴緊性條件、甚至更優(yōu)選高嚴緊性條件,且最優(yōu)選非常高嚴緊性條件下與(i)SEQIDNO:1的成熟多肽編碼序列,()包含SEQIDNO1的成熟多肽編碼序列的基因組DNA序列,或(iii)⑴或(ii)的全長互補鏈雜交;或其等位變體和亞序列(Sambrook等,1989,同上文)。在優(yōu)選的方面,互補鏈為SEQIDNO1的成熟多肽編碼序列的全長互補鏈。本發(fā)明還涉及通過(a)將DNA群體在非常低、低、中、中-高、高或非常高嚴緊性條件下與(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含SEQIDNO1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈雜交;和(b)分離雜交的多核苷酸,所述多核苷酸編碼具有α-葡糖醛酸糖苷酶活性的多肽而獲得的分離的多核苷酸。在優(yōu)選的方面,互補鏈是SEQIDNO:1的成熟多肽編碼序列的全長互補鏈。核酸構(gòu)建體本發(fā)明還涉及核酸構(gòu)建體,其包含與一種或多種(數(shù)種)控制序列可操作地連接的本發(fā)明的分離的多核苷酸,所述控制序列指導(dǎo)編碼序列在與所述控制序列相容的條件下在合適的宿主細胞中表達??梢杂迷S多方式操作編碼本發(fā)明多肽的分離的多核苷酸以供多肽的表達。依賴于表達載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術(shù)是本領(lǐng)域熟知的。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細胞中轉(zhuǎn)錄的合適啟動子的實例是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、構(gòu)巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quirm(W000/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶IV、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸異構(gòu)酶基因的啟動子的雜合體);和它們的突變的、截斷的和雜合的啟動子。在酵母宿主中,有用的啟動子是從釀酒酵母烯醇化酶(EN0-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1、ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUP1)和釀酒酵母3-磷酸甘油酸激酶的基因獲得的。對酵母宿主細胞有用的其它啟動子由Romanos等,1992,Yeast8:423_488描述。控制序列也可以是合適的轉(zhuǎn)錄終止子序列,其是由宿主細胞識別以終止轉(zhuǎn)錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接??梢詫⒃谒x宿主細胞中有功能的任何終止子用在本發(fā)明中。對于絲狀真菌宿主細胞優(yōu)選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉a-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶??刂菩蛄幸部梢允呛线m的前導(dǎo)序列,其是對于宿主細胞的翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列可操作地連接于編碼多肽的核苷酸序列的5’末端。可以將在所選宿主細胞中有功能的任何前導(dǎo)序列用在本發(fā)明中。優(yōu)選的用于絲狀真菌宿主細胞的前導(dǎo)序列是從米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶的基因獲得的。控制序列還可以是聚腺苷酸化序列,其是與核苷酸序列的3,末端可操作地連接的序列,并且在轉(zhuǎn)錄時,宿主細胞將其識別為向轉(zhuǎn)錄的mRNA添加聚腺苷殘基的信號。可以將在所選宿主細胞中有功能的任何聚腺苷酸化序列在本發(fā)明中使用。優(yōu)選的用于絲狀真菌宿主細胞的聚腺苷酸化序列是從米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉a-葡糖苷酶的基因獲得的??刂菩蛄羞€可以是信號肽編碼序列,其編碼與多肽的氨基末端相連的氨基酸序列,并且指導(dǎo)編碼的多肽進入細胞分泌途徑。核苷酸序列的編碼序列5’端可固有地含有信號肽編碼序列,該信號肽編碼序列與編碼分泌多肽的編碼序列的區(qū)段一起天然地連接在翻譯閱讀框中?;蛘撸幋a序列5’端可含有對于所述編碼序列為外源的信號肽編碼序列。外源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的?;蛘?,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,指導(dǎo)表達的多肽進入所選宿主細胞的分泌途徑的任何信號肽編碼序列可在本發(fā)明中使用。對絲狀真菌宿主細胞有效的信號肽編碼序列是從米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V、和疏棉狀腐質(zhì)霉脂肪酶的基因獲得的信號肽編碼序列。對酵母宿主細胞有用的信號肽是從釀酒酵母a“因子和釀酒酵母轉(zhuǎn)化酶的基因獲得的。其它有用的信號肽編碼序列由Romanos等,1992,同上文描述??刂菩蛄羞€可以是前肽編碼序列,其編碼位于多肽氨基末端的氨基酸序列。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))0前肽通常是無活性的并且能夠通過前肽的催化或自催化切割從前多肽轉(zhuǎn)化為成熟活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母a因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼區(qū)。在信號肽和前肽序列都存在于多肽氨基末端的場合,將前肽序列置于緊接著(nextto)多肽氨基末端,并且將信號肽序列置于緊接著前肽序列的氨基末端。表達載體本發(fā)明還涉及重組表達載體,所述重組表達載體包含本發(fā)明的多核苷酸、啟動子和轉(zhuǎn)錄和翻譯終止信號。本文所述的多種核酸和控制序列可以結(jié)合在一起以產(chǎn)生重組表達載體,所述表達載體可以包括一個或多個(數(shù)個)方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列??晒┻x擇的是,可以通過在適當?shù)挠糜诒磉_的載體中插入包含所述序列的核苷酸序列或核酸構(gòu)建體來表達本發(fā)明的多核苷酸序列。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當?shù)谋磉_用控制序列可操作地連接。重組表達載體可以是任何載體(例如,質(zhì)?;虿《?,其能夠方便地進行重組DNA步驟,并且能夠產(chǎn)生核苷酸序列的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線型或閉合環(huán)狀質(zhì)粒。載體可以是自主復(fù)制載體,即,作為染色體外實體(entity)存在的載體,其復(fù)制獨立于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復(fù)制的手段?;蛘?,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復(fù)制的載體。此外,可以使用單獨的載體或質(zhì)?;蚬餐写胨拗骷毎蚪M的完整DNA(totalDNA)的兩個或更多個載體或質(zhì)粒,或可以使用轉(zhuǎn)座子(transposon)。本發(fā)明的載體優(yōu)選含有一個或多個(數(shù)個)選擇標記,這些標記容許容易地選擇經(jīng)過轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等的細胞。選擇標記是這樣的基因,其產(chǎn)物可提供殺生物劑或病毒抗性、對重金屬的抗性,對營養(yǎng)缺陷型的原養(yǎng)性,等等。用于絲狀真菌宿主細胞的選擇標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉(zhuǎn)移酶)、bar(草銨膦(phosphinothricin)乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清苷-5’-磷酸脫羧酶)、sC(硫酸腺苷轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶),以及它們的等同物。優(yōu)選用于曲霉細胞的是構(gòu)巢曲霉或米曲霉的amdS禾口pyrG基因,以及吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。本發(fā)明的載體優(yōu)選含有容許載體整合到宿主細胞的基因組或者容許載體在細胞中不依賴基因組自主復(fù)制的元件。為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘?,載體可以含有額外的核苷酸序列,用于指導(dǎo)通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,如100至10,000堿基對,優(yōu)選400至10,000堿基對,并且最優(yōu)選800至10,000堿基對,其與相應(yīng)的目標序列具有高度同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。在絲狀真菌細胞中有用的復(fù)制起點的例子有AMA1和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。AMA1基因的分離,以及包含該基因的質(zhì)?;蜉d體的構(gòu)建,可以根據(jù)WO00/24883中公開的方法來實現(xiàn)??梢韵蛩拗骷毎胁迦氡景l(fā)明的多核苷酸的多于一個拷貝以增加基因產(chǎn)物的生產(chǎn)??梢酝ㄟ^下述方法獲得多核苷酸的拷貝數(shù)的增加將至少一個額外拷貝的序列整合入宿主細胞基因組,或?qū)⒖蓴U增的選擇標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細胞來選擇含有選擇性標記基因的擴增拷貝,從而也含有多核苷酸的額外拷貝的細胞。用于連接上述元件來構(gòu)建本發(fā)明的重組表達載體的方法是本領(lǐng)域技術(shù)人員公知的(參見例如Sambrook等,1989,同上文)。宿主細胞本發(fā)明還涉及重組宿主細胞,其包含本發(fā)明的分離的多核苷酸,將所述重組宿主細胞有利地用于多肽的重組產(chǎn)生。將包含本發(fā)明的多核苷酸的載體引入宿主細胞從而將所述載體作為染色體整合體或作為自復(fù)制的染色體外載體保持,如前文所述。術(shù)語“宿主細胞”包含親本細胞的任何子代,其因為在復(fù)制過程中發(fā)生的突變而與該親本細胞不同。宿主細胞的選擇在很大程度上會依賴于編碼多肽的基因及其來源。宿主細胞可以是真核生物,諸如哺乳動物、昆蟲、植物、或真菌細胞。在優(yōu)選的方面,所述宿主細胞是真菌細胞?!罢婢庇迷诒疚陌ㄒ韵麻T子囊菌門(Ascomycota)、擔(dān)子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,同上文,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,同上文)。在更優(yōu)選的方面,真菌宿主細胞是酵母細胞。本文所用的“酵母”包括產(chǎn)子囊酵母(ascosporogenousyeast)(內(nèi)抱霉目(Endomycetales))、產(chǎn)擔(dān)子抱子囊酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在將來可能有所改變,就本發(fā)明而言,酵母將如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.禾口Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述加以定義。在甚至更優(yōu)選的方面,酵母宿主細胞是念珠菌屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細胞。在最優(yōu)選的方面,酵母宿主細胞是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母細胞。在另一個最優(yōu)選的方面,酵母宿主細胞是乳克魯維酵母(Kluyveromyceslactis)細胞。在另一個最優(yōu)選的方面,酵母宿主細胞是解脂西洋蓍霉(Yarrowialipolytica)細胞。在另一個更優(yōu)選的方面,真菌宿主細胞是絲狀真菌細胞?!敖z狀真菌”包括真菌(Eumycota)和卵菌(Oomycota)亞門的所有絲狀形式(如Hawksworth等,1995,同上文定義)。絲狀真菌的一般特征在于由幾丁質(zhì)、纖維素、葡聚糖、殼聚糖、甘露聚糖和其它復(fù)雜多糖組成的菌絲壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵的。在一個甚至更優(yōu)選的方面,絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬蠟菌屬、金孢子屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、網(wǎng)孢菌屬、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂褶菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)、或木霉屬細胞。在一個更優(yōu)選的方面,絲狀真菌宿主細胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉細胞。在另一個更優(yōu)選的方面,絲狀真菌宿主細胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細胞。在另一個最優(yōu)選的方面,絲狀真菌宿主細胞是黑刺煙管菌(Bjerkanderaadusta)、干擬賭菌(Ceriporiopsisaneirina)、干擬賭菌(Ceriporiopsisaneirina)>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa>蟲擬賭菌(Ceriporiopsissubvermispora)、嗜角質(zhì)金抱子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、Chrysosporiumpannicola>Chrysosporiumqueenslandicum^Chrysosporiumzonatum^^cimJ^^(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米赫毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌、輻射射脈菌(Phlebiaradiata)、刺芹側(cè)耳(Pleurotuseryngii)、土生梭孢殼、長絨毛栓菌(Trametesvillosa)、雜色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞??梢詫⒄婢毎ㄟ^涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細胞壁重建的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和W096/00787描述??梢允褂糜扇缦挛墨I描述的方法轉(zhuǎn)化酵母Becker和Guarente,于Abelson,J.N.禾口Simon,M.I.(編者),GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,182-187頁,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o生產(chǎn)方法本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。在優(yōu)選的方面,所述細胞是青霉菌屬的。在更優(yōu)選的方面,所述細胞是桔灰青霉。本發(fā)明還涉及產(chǎn)生本發(fā)明的多肽的方法,包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)如本文所述的重組宿主細胞;和(b)回收所述多肽。本發(fā)明還涉及生產(chǎn)本發(fā)明的多肽的方法,包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)重組宿主細胞,其中所述宿主細胞包含突變核苷酸序列,其在SEQIDN0:1的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼包含SEQIDN0:2的成熟多肽或由SEQIDNO:2的成熟多肽組成的多肽,和(b)回收所述多肽。在本發(fā)明的產(chǎn)生方法中,使用本領(lǐng)域熟知的方法在適合于產(chǎn)生所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細胞。例如,可以通過在合適培養(yǎng)基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養(yǎng),和實驗室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細胞。使用本領(lǐng)域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應(yīng)商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌至培養(yǎng)基中,其能夠從細胞裂解物(lysate)回收??梢允褂帽绢I(lǐng)域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領(lǐng)域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。本發(fā)明的多肽可以通過多種本領(lǐng)域已知的方法純化,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見,例如,ProteinPurification,編者J.-C.Janson禾口LarsRyden,VCHPublishers,NewYork,1989),以獲得基本上純的多肽。植物本發(fā)明還涉及植物,例如轉(zhuǎn)基因植物、植物部分或植物細胞,其包含本發(fā)明的編碼具有a-葡糖醛酸糖苷酶活性的多肽的分離的多核苷酸,從而以可回收的量表達和產(chǎn)生所述多肽。所述多肽可從植物或植物部分回收?;蛘?,也可以將含有該重組多肽的植物或植物部分用于改進食品或飼料的質(zhì)量,例如,改進營養(yǎng)價值、適口性(palatability)和流變性質(zhì)(rheologicalproperties),或用于破壞抗營養(yǎng)因子。轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium),寒地型牧草(temperategrass),如剪股穎屬(Agrostis);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean),和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關(guān)的模式生物體擬南芥(Arabidopsisthaliana)0植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)夕卜體(apoplast)、線粒體(mitochondria)(vacuole)、過氧化物酶體(peroxisome)和細胞質(zhì)(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如為了促進本發(fā)明的應(yīng)用而分離的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)0這些植物、植物部分和植物細胞的子代也包括在本發(fā)明的范圍內(nèi)。表達本發(fā)明的多肽的轉(zhuǎn)基因植物或植物細胞可以依照本領(lǐng)域已知方法構(gòu)建。簡而言之,通過如下方法構(gòu)建所述植物或植物細胞將編碼本發(fā)明多肽的一個或多個(數(shù)個)表達構(gòu)建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉(zhuǎn)基因植物或植物細胞。表達構(gòu)建體便利地是包含編碼本發(fā)明多肽的多核苷酸的核酸構(gòu)建體,所述多核苷酸與在選擇的植物或植物部分中表達該核苷酸序列所需的適當?shù)恼{(diào)節(jié)序列可操作地連接。此外,表達構(gòu)建體可以包含對于鑒定整合了表達構(gòu)建體的宿主細胞有用的選擇標記,和將該構(gòu)建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調(diào)節(jié)序列的選擇,例如啟動子和終止子序列和任選地信號或轉(zhuǎn)運序列的選擇,舉例來說,基于期望何時、何處以及期望如何表達多肽而確定。例如,編碼本發(fā)明多肽的基因的表達可以是組成型的或誘導(dǎo)型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以靶向特定的組織或植物部分例如種子或葉。調(diào)節(jié)序列由例如Tague等,1988,PlantPhysiology86506描述。對于組成型表達,可以使用35S_CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊蓮和果實的啟動子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863_878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantandCellPhysiology39:885_889),來自豆球蛋白(legumin)B4和蠶豆(Viciafaba)的未知種子蛋白基因的蠶豆啟動子(Conrad等,1998,JournalofPlantPhysiologyl52:708_711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935_941),來自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動子,或本
技術(shù)領(lǐng)域
公知的任何其它種子特異性的啟動子,例如,在TO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉(zhuǎn)移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或來自稻的aldP基因啟動子(Kagaya等,1995,MolecularandGeneralGenetics248:668_674),或傷口誘導(dǎo)的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMolecularBiology22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導(dǎo),所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質(zhì)誘導(dǎo),例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現(xiàn)本發(fā)明多肽在植物中的較高表達。例如,啟動子增強子元件可以是內(nèi)含子,其置于啟動子和編碼本發(fā)明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白1基因的第一內(nèi)含子以增強表達。可選擇的標記基因和表達構(gòu)建體的任何其它部分可以從本領(lǐng)域中那些可得的部分中選擇。根據(jù)本領(lǐng)域已知的常規(guī)技術(shù)(包括土壤桿菌(Agrobacterium)-介導(dǎo)的轉(zhuǎn)化、病毒-介導(dǎo)的轉(zhuǎn)化、顯微注射、粒子轟擊、生物彈射轉(zhuǎn)化和電穿孔)將核酸構(gòu)建體并入植物基因組(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導(dǎo)的基因轉(zhuǎn)移(genetransfer),是產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于轉(zhuǎn)化單子葉植物,雖然對于這些植物其它的轉(zhuǎn)化方法是常用的。目前,用于產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)選的方法,是用粒子(用轉(zhuǎn)化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中白勺胚(developingembryos)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10=667-674)。轉(zhuǎn)化單子葉植物的可供選擇的方法是基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。轉(zhuǎn)化之后,根據(jù)本領(lǐng)域熟知的方法選擇并入了表達構(gòu)建體的轉(zhuǎn)化體并且再生成為完整植物。通常設(shè)計轉(zhuǎn)化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因例如,使用帶有兩種單獨的T-DNA構(gòu)建體的共轉(zhuǎn)化或通過特異性重組酶位點特異性地切除選擇基因。本發(fā)明還涉及產(chǎn)生本發(fā)明的多肽的方法,包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)包含本發(fā)明的編碼具有a-葡糖醛酸糖苷酶活性的多肽的多核苷酸的轉(zhuǎn)基因植物或植物細胞;和(b)回收所述多肽。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。所述組合物可以包含本發(fā)明的多肽作為主要酶組分,如單組分組合物?;蛘撸鼋M合物可以包含多種酶活性,如乙酰木聚糖酶、阿拉伯呋喃苷糖酶、氨基肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、阿魏酸酯酶、a-半乳糖苷酶、0-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、0-葡糖苷酶、鹵素過氧化物酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶、木聚糖酶或木糖苷酶。其它的酶可以通過例如屬于以下屬或種的微生物產(chǎn)生曲霉屬,優(yōu)選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質(zhì)霉屬,優(yōu)選特異腐質(zhì)霉或疏棉狀腐質(zhì)霉;或木霉屬,優(yōu)選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉??梢砸勒毡绢I(lǐng)域內(nèi)已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式??梢砸勒毡绢I(lǐng)域內(nèi)已知方法將包括于所述組合物中的多肽穩(wěn)定化。下面給出的是本發(fā)明多肽組合物的優(yōu)選的用途的實例。本發(fā)明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領(lǐng)域內(nèi)已知的方法確定。用途本發(fā)明還涉及使用具有a-葡糖醛酸糖苷酶活性的多肽或其組合物的方法。本發(fā)明的具有a-葡糖醛酸糖苷酶活性的多肽可以用在許多應(yīng)用中通過用有效量的所述多肽處理生物質(zhì)材料來降解或轉(zhuǎn)變所述生物質(zhì)材料(即包含葡萄糖醛酸取代的木聚糖的材料)。在必需降解木聚糖的方法中,本發(fā)明的多肽優(yōu)選與其它木聚糖降解酶(如乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃苷糖酶和木糖苷酶)聯(lián)合使用。具有a-葡糖醛酸糖苷酶活性的多肽在許多應(yīng)用中是有用的修飾含有葡萄糖醛酸取代的木聚糖的動物飼料以改善消化性;在產(chǎn)生例如燃料和/或可飲用酒精的過程中由生物質(zhì)降解或轉(zhuǎn)化為可發(fā)酵的糖產(chǎn)生的一般應(yīng)用;用于漿和紙的去木質(zhì)化作用中的處理助劑;紡織品的酶洗練系統(tǒng)的成分;食品應(yīng)用,如焙烤,其中與其它的酶的功能組合以改善焙烤物的物理性質(zhì);以及與其它的酶功能組合用于洗衣洗滌劑的應(yīng)用。多肽或組合物可以用于產(chǎn)生或修飾營養(yǎng)的/飲食的纖維和/或用于產(chǎn)生木糖、阿拉伯糖和/或直鏈木糖或用于通過發(fā)酵、酶的加工或化學(xué)合成產(chǎn)生木糖的衍生物、阿拉伯糖。優(yōu)選的生物質(zhì)材料,即包含葡糖醛酸取代的木聚糖的材料選自下組,草本和/或木質(zhì)的能源作物、農(nóng)產(chǎn)品和飼料作物、動物飼料產(chǎn)品、塊莖、根、莖、豆類、木薯皮(cassavapeel)、可可豆(cocoapod)、米禾比和/或谷殼(ricehusksand/orhulls)、米糖、種軸(cob)、稈(straw)、殼(hull)、秕(husk)、甜菜渣(sugarbeetpulp)、槐豆?jié){(locustbeanpulp)、蔬菜漁(vegetablepomace)、農(nóng)作物廢料、稈、柄(stalk)、葉、玉米糠(cornbran)、秕、穗軸、外皮(rind)、殼(shell)、豆莢(pod)、木材廢料(woodwaste)、樹皮(bark)、刨花(shaving)、鋸屑(sawdust)、木菜(woodpulp)、菜液(pulpingliquor)、廢紙(wastepaper)、紙板(cardboard)、木材廢料、工業(yè)或市政廢水固體(industrialormunicipalwastewatersolids)、糞肥(manure)、釀造和/或發(fā)酵過程的副產(chǎn)物、濕酒糟(wetdistillersgrain)、干酒糟(drieddistillersgrain)、酒糟(spentgrain)、酒糟(vinasse)禾口甘蔴漁(bagasse)。在一個實施方式中,具有a-葡糖醛酸糖苷酶活性的多肽用于包括纖維素生物質(zhì)水解的方法中,所述方法包括將所述生物質(zhì)與所述多肽接觸,例如從纖維素生物質(zhì)中產(chǎn)生乙醇或提高動物飼料的營養(yǎng)價值的方法。在優(yōu)選的實施方式中,具有a-葡糖醛酸糖苷酶活性的多肽用于降解主要由淀粉組成的底物的纖維素部分,例如在包括產(chǎn)生淀粉水解的過程(例如基于淀粉的發(fā)酵過程,例如乙醇過程)中的磨碎的谷漿。測定a-葡糖醛酸糖苷酶活性就本發(fā)明而言,a-葡糖醛酸糖苷酶活性根據(jù)由deVries(J.Bacterid,1998,Vol.180,243-249頁)描述的步驟來測定。一個a-葡糖醛酸糖苷酶單位是在下述標準測定條件下每分鐘釋放1微摩爾葡糖醛酸或4-0-甲基葡糖醛酸的酶量。a-葡糖醛酸糖苷酶測定法的溫育混合物(總體積0.2ml)含有0.16ml底物(0.05M乙酸鈉緩沖液[pH5.0]中2mg醛糖三醛酸-雙己糖醛酸(aldotriouronicacid-aldobiuronicacid)[8020])和0.04ml待測定的酶溶液。通過加入酶來起始溫育。在40°C下溫育30分鐘以后,通過煮沸樣品4分鐘來終止反應(yīng)。通過離心(10,000Xg)去除沉淀物,其后將上清液轉(zhuǎn)移至新試管中。向每一個試管中加入0.6ml的按Milner和Avigad(Carbohydr.Res.1967.4:359_361)的描述制備的銅試劑,然后將樣品煮沸10分鐘并在冰上冷卻。接著加入0.4ml按Nelson(Biol.Chem.1944,153:375_380)的描述制備的砷鉬酸鹽試劑。輕柔地混合樣品,加入0.8ml水,并且在600nm處針對水測量的吸光率。在40°C下溫育前,通過在零時刻煮沸完整的測定混合物來制備對照。底物對照是通過加水而不是酶溶液來制備的。標準曲線是用D-葡糖醛酸得到的。a-葡糖醛酸糖苷酶的特異性來自桔灰青霉的a-葡糖醛酸糖苷酶的特異性是由1HNMR的手段來研究的。在pH5.5(50mMNaOAc)下將酶(0.7ygEP/mg底物)與寡聚物(10mg/ml)在30°C溫育過夜,然后在95°C下失活20分鐘。將樣品冷凍干燥并溶解在D20(lml)中。在VarianMercury400MHz上在30°C和80°C分別記錄咕NMR譜。收集超過100次掃描的數(shù)據(jù),并將HD0信號用作參考信號(4.67ppm)。未附譜圖。發(fā)現(xiàn)a-葡糖醛酸糖苷酶對由GH10木聚糖酶產(chǎn)生4_0Me-a-葡糖醛酸吡喃糖基取代白勺木—寡聚物(4-OMe-alpha-glucuronopyranosylsubstitutedxylo-oligomer)具有活性。其對由GH11木聚糖酶形成的寡聚物或?qū)δ揪厶蔷酆衔镔|(zhì)未顯示任何活性。這表明所述a“葡糖醛酸糖苷酶僅對4-OMe-GlcA的末端木糖單元有活性,而對“內(nèi)部”的葡糖醛酸苷殘基無活性。權(quán)利要求具有α-葡糖醛酸糖苷酶活性的分離的多肽,其選自下組(a)包含與SEQIDNO2的成熟多肽具有至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少85%、最優(yōu)選至少90%、和甚至最優(yōu)選至少95%同一性的氨基酸序列的多肽;(b)由在至少高嚴緊性條件下與(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含SEQIDNO1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈雜交的多核苷酸編碼的多肽;(c)由包含與SEQIDNO1的成熟多肽編碼序列具有至少75%、更優(yōu)選至少80%、更優(yōu)選至少85%、甚至更優(yōu)選至少85%、最優(yōu)選至少90%、和甚至最優(yōu)選至少95%同一性的核苷酸序列的多核苷酸編碼的多肽;(d)SEQIDNO2的成熟多肽包含一個或多個(數(shù)個)氨基酸的取代、缺失和/或插入的變體。2.權(quán)利要求1的多肽,其包含SEQIDNO:2的氨基酸序列,或其具有a-葡糖醛酸糖苷酶活性的片段;或者由SEQIDNO:2的氨基酸序列,或其具有a-葡糖醛酸糖苷酶活性的片段組成。3.權(quán)利要求1或2任一項的多肽,其包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽組成。4.權(quán)利要求13中任一項的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO1的核苷酸序列,或其編碼具有a-葡糖醛酸糖苷酶活性的片段的亞序列;或者由SEQIDN0:1的核苷酸序列,或其編碼具有a-葡糖醛酸糖苷酶活性的片段的亞序列組成。5.權(quán)利要求14中任一項的多肽,其由包含SEQIDN0:1的成熟多肽編碼序列或由SEQIDN0:1的成熟多肽編碼序列組成的多核苷酸編碼。6.權(quán)利要求15中任一項的多肽,其中所述成熟多肽是SEQIDNO2的氨基酸1至835。7.權(quán)利要求16中任一項的多肽,其中所述成熟多肽編碼序列是SEQIDN01的核苷酸1至2508。8.分離的多核苷酸,其包含編碼權(quán)利要求17中任一項的多肽的核苷酸序列。9.核酸構(gòu)建體,其包含與一種或多種(數(shù)種)控制序列可操作地連接的權(quán)利要求8的多核苷酸,所述控制序列在表達宿主中指導(dǎo)多肽的產(chǎn)生。10.包含權(quán)利要求9的核酸構(gòu)建體的重組表達載體。11.包含權(quán)利要求9的核酸構(gòu)建體的重組宿主細胞。12.產(chǎn)生權(quán)利要求17中任一項的多肽的方法,其包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。13.產(chǎn)生權(quán)利要求17中任一項的多肽的方法,其包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)包含核酸構(gòu)建體的宿主細胞,所述核酸構(gòu)建體包含編碼所述多肽的核苷酸序列;和(b)回收所述多肽。14.產(chǎn)生權(quán)利要求17中任一項的多肽的方法,其包括(a)在有益于產(chǎn)生所述多肽的條件下培養(yǎng)包含編碼所述多肽的多核苷酸的轉(zhuǎn)基因植物或植物細胞;和(b)回收所述多肽。15.用編碼權(quán)利要求17中任一項的多肽的多核苷酸轉(zhuǎn)化的轉(zhuǎn)基因植物、植物部分或植物細胞。16.產(chǎn)生蛋白質(zhì)的方法,其包括(a)在有益于產(chǎn)生所述蛋白質(zhì)的條件下培養(yǎng)權(quán)利要求11的重組宿主細胞;和(b)回收所述蛋白質(zhì)。17.降解或轉(zhuǎn)變生物質(zhì)材料的方法,其包括用權(quán)利要求17中任一項的多肽處理所述材料。18.權(quán)利要求17的方法,其進一步包括用選自下組的酶處理包含阿魏?;纳镔|(zhì)材料木聚糖酶、阿拉伯呋喃糖苷酶、木糖苷酶、葡糖醛酸糖苷酶及其組合。19.權(quán)利要求1618中任一項的方法,其中所述生物質(zhì)材料是動物飼料。20.權(quán)利要求1619中任一項的方法,其中所述生物質(zhì)材料是纖維素生物質(zhì)。21.組合物,其包含權(quán)利要求17中任一項的多肽,和一種或多種選自下組的酶乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃糖苷酶和木糖苷酶。22.權(quán)利要求17中任一項的多肽或權(quán)利要求21的組合物在用于生物質(zhì)材料水解的方法中的用途,包括將所述生物質(zhì)與所述多肽或所述組合物接觸。23.根據(jù)權(quán)利要求22的在產(chǎn)生乙醇的方法中的用途。24.根據(jù)權(quán)利要求22的在產(chǎn)生動物飼料的方法中的用途。全文摘要本發(fā)明涉及具有α-葡糖醛酸糖苷酶活性的分離多肽以及編碼該多肽的分離多核苷酸。本發(fā)明還涉及核酸構(gòu)建體、載體和包含所述多核苷酸的宿主細胞以及制備和使用所述多肽的方法。文檔編號C12N9/24GK101878299SQ200880118022公開日2010年11月3日申請日期2008年11月26日優(yōu)先權(quán)日2007年11月27日發(fā)明者伊娃·H·漢森,多米尼克·A·斯科夫倫德,漢恩·R·索倫森申請人:諾維信公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
长阳| 高雄市| 张家界市| 额尔古纳市| 鹰潭市| 裕民县| 高州市| 林州市| 罗定市| 仁布县| 丰台区| 绥芬河市| 昆明市| 湘乡市| 慈溪市| 九龙城区| 宜州市| 乌海市| 靖安县| 榕江县| 达日县| 尚义县| 阳原县| 托克托县| 浮山县| 西宁市| 长丰县| 郯城县| 黑龙江省| 乡宁县| 拜泉县| 盱眙县| 仁怀市| 新竹市| 昂仁县| 修武县| 阿拉善左旗| 富蕴县| 七台河市| 广州市| 高雄市|