欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有纖維二糖水解酶活性的多肽和編碼該多肽的多核苷酸的制作方法

文檔序號:392498閱讀:1289來源:國知局

專利名稱::具有纖維二糖水解酶活性的多肽和編碼該多肽的多核苷酸的制作方法
技術(shù)領域
:本發(fā)明涉及具有纖維二糖水解酶活性的多肽和編碼所述多肽的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細胞,以及產(chǎn)生和使用所述多肽的方法。相關領域描述纖維素是單糖葡萄糖通過β-1,4_鍵連接的聚合物。許多微生物產(chǎn)生水解β-連接的葡聚糖的酶。這些酶包括內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。內(nèi)切葡聚糖酶在隨機位置消化纖維素聚合物,將其打開(openingit)以受到纖維二糖水解酶攻擊(attack)。纖維二糖水解酶繼而從纖維素聚合物的末端釋放纖維二糖的分子。纖維二糖是水溶性的β-1,4-連接的葡萄糖二聚體。葡糖苷酶將纖維二糖水解成葡萄糖。將含木素纖維素原料(lignocellulosicfeedstock)轉(zhuǎn)化為乙醇具有以下優(yōu)勢大量原料現(xiàn)成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農(nóng)業(yè)殘余物、草本作物和城市固體廢物被認為是用于乙醇生產(chǎn)的原料。這些材料主要由纖維素、半纖維素和木質(zhì)素組成。一旦將纖維素轉(zhuǎn)化成葡萄糖,葡萄糖將容易地由酵母發(fā)酵成乙醇。在本領域中,有通過補充其他酶以增加效力而改善纖維素分解蛋白質(zhì)組合物,和提供劃算的供降解木素纖維素的酶溶液的需要。本發(fā)明提供了具有纖維二糖水解酶活性的多肽和編碼該多肽的多核苷酸。發(fā)明概述本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽,其選自下組(a)多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少90%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在高嚴格條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列具有至少90%序列同一性;(d)SEQIDNO2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一個或多個(幾個)氨基酸的變體;和(e)(a)、(b)、(c)或(d)的多肽具有纖維二糖水解酶活性的片段。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸;包含所述多核苷酸的核酸構(gòu)建體、重組表達載體和重組宿主細胞;和產(chǎn)生所述多肽的方法。本發(fā)明還涉及降解或轉(zhuǎn)化纖維素材料的方法,包括在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物處理纖維素材料。本發(fā)明還涉及產(chǎn)生發(fā)酵產(chǎn)物的方法,包括(a)在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從發(fā)酵回收所述發(fā)酵產(chǎn)物。本發(fā)明還涉及發(fā)酵纖維素材料的方法,包括用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中將所述纖維素材料在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化。本發(fā)明還涉及編碼信號肽的多核苷酸,所述信號肽包含SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至17,或者所述信號肽由SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至17組成,所述信號肽可操作地連接于編碼蛋白的基因;涉及包含所述多核苷酸的核酸構(gòu)建體、表達載體和重組宿主細胞;并涉及產(chǎn)生蛋白的方法。附圖簡述圖1顯示ThielaviahyraniaeNN045097家族6纖維二糖水解酶基因的基因組DNA序列和推定的氨基酸序列(分別為SEQIDNO=I和2)。圖2顯示ThielaviahyraniaeNN045178家族6纖維二糖水解酶基因的基因組DNA序列和推定的氨基酸序列(分別為SEQIDNO3和4)。圖3顯示pCBHII45178的限制圖譜。圖4顯示pGEM-T-CBHII45178的限制圖譜。圖5顯示pCBHII45097的限制圖譜。圖6顯示pGEM-T-CBHII45097的限制圖譜。圖7顯示在50°CThielaviahyraniaeNN045097和NN045178纖維二糖水解酶的PH活性分布(profile)。圖8A和8B顯示在50°CThielaviahyraniaeNN045097和NN045178纖維二糖水解酶的穩(wěn)定性作為PH的函數(shù)。圖9顯示在pH5ThielaviahyraniaeNN045097和NN045178纖維二糖水解酶的溫度活性分布。圖IOA和IOB顯示在pH5ThielaviahyraniaeNN045097和NN045178纖維二糖水解酶的穩(wěn)定性作為溫度的函數(shù)。定義纖維二糖水解酶術(shù)語“纖維二糖水解酶”意指l,4-i3_D-葡聚糖纖維二糖水解酶(l,4-beta-D-glucancellobiohydrolase)(Ε.C.No.3.2.1.91),其催化纖維素、纖維素寡糖,或任何包含β-1,4-連接的葡萄糖的聚合物中的1,4-β-D-糖苷鍵的水解,從鏈的還原或非還原末端釋放纖維二糖(Teeri,1997,Crystallinecellulosedegradation:Newinsightintothefunctionofce1lobiohydrolases,TrendsinBiotechnology15160-167;Teeri等,1998,Trichodermareeseicellobiohydrolases:whysoefficientoncrystallinecellulose?,Biochem.Soc.Trans.26:173-178)。就本發(fā)明而言,根據(jù)Lever等,1972,Anal.Biochem.47:273-279;vanTilbeurgh等,1982,FEBSLetters,149152-156;vanTilbeurgh^PClaeyssens,1985,FEBSLetters,187:283-288;以及iTomme等,1988,Eur.J.Biochem.170:575-581描述的方法確定纖維二糖水解酶活性??刹捎肔ever等的方法來評價玉米秸稈中的纖維素水解,而vanTilbeurgh等和Tomme等的方法可用于確定對熒光二糖衍生物4-甲基傘形基-β-D-乳糖苷G-methylumbelIiferyl-β-D-Iactoside)的纖維二糖水解酶活性。此外,PASC可以用作如本文所述的底物。本發(fā)明的多肽具有SEQIDNO:2或SEQIDNO:4的成熟多肽的至少20%,例如,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%和至少100%的纖維二糖水解酶活性。家族6,GH6或CEL6術(shù)語“家族6”或“GH6,,或“CEL6”在本文中定義為根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino—acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatB.JfIBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族6的多肽。纖維素分解酶或纖維素酶術(shù)語“纖維素分解酶”或“纖維素酶”意指一種或多種(幾種)水解纖維素材料的酶。此類酶包括內(nèi)切葡聚糖酶、纖維二糖水解酶、葡糖苷酶或其組合。測量纖維素分解活性的兩種基本方法包括(1)測量總纖維素分解活性,和O)測量單獨的纖維素分解活性(內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶),如^iang等,OutlookforcellulaseimprovementScreeningandselectionstrategies,2006,BiotechnologyAdvancesM:452-481所綜述的。總纖維素分解活性通常是使用不溶性底物來測定的,所述底物包括WhatmanNo.1濾紙、微晶纖維素、細菌纖維素、藻類纖維素、棉花、經(jīng)預處理的木素纖維素等。最常見的總纖維素分解活性測定法是使用WhatmanNo.1濾紙作為底物的濾紙測定法。該測定法是由hternationalUnionofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureApp1.Chem.59:257-68)確立的。就本發(fā)明而言,纖維素分解酶活性通過測量在下述條件下由纖維素分解酶進行的纖維素材料水解的增加來確定l_20mg的纖維素分解酶蛋白/g的PCS中纖維素在50°C進行3-7日,與未添加纖維素分解酶蛋白的對照水解相比較。典型條件為1ml反應液,經(jīng)洗滌或未洗滌的PCS,5%不溶性固形物,50mM乙酸鈉pH5,ImMMnSO4,50_65°C,72小時,通過AMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)進行糖分析。內(nèi)切葡聚糖酶術(shù)語“內(nèi)切葡聚糖酶”意指內(nèi)切-1,4-(1,3;1,4)-3-0-葡聚糖4-葡聚糖水解酶(endo-l,4-0-D-glucan4-glucanohydrolase)(Ε.C.3.2.1.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)、地衣淀粉(Iichenin)中的l,4-i3-D-糖苷鍵、混合的β_1,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素組分的其它植物材料中的β_1,4鍵的內(nèi)水解(endohydrolysis)。內(nèi)切葡聚糖酶活性可通過測量底物粘度的減少或由還原糖測定法Oiang等,2006,BiotechnologyAdvances24452-481)確定的還原端增加來確定。就本發(fā)明而言,根據(jù)(ihose,1987,PureandApp1.Chem.59:257-268的方法,在pH5,40°C,使用羧甲基纖維素(CMC)作為底物來確定內(nèi)切葡聚糖酶活性。β-葡糖苷酶術(shù)語“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(Ε.C.No.3.2.1.21)活性,其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。纖維二糖酶(cellobiase)與β-葡糖苷酶同義。就本發(fā)明而言,β-葡糖苷酶活性是在25°C使用ImM4-硝基苯基-β-D-葡糖吡喃糖苷作為底物在50mM檸檬酸鈉pH4.8中確定的。一個單位的β-葡糖苷酶活性定義為在25°C,pH4.8每分鐘產(chǎn)生1.0微摩爾對硝基苯酚陰離子。纖維素分解增強活性術(shù)語“纖維素分解增強活性”意指增強具有纖維素分解活性的酶水解纖維素材料的由GH61多肽催化的生物學活性。就本發(fā)明而言,通過測量由纖維素分解酶在下述條件下水解纖維素材料所導致的還原糖增加或纖維二糖與葡萄糖的總量增加來確定纖維素分解增強活性l_50mg總蛋白/gPCS中的纖維素,其中總蛋白包含50-99.5%w/w的纖維素分解酶蛋白,及0.5-50%w/w的具有纖維素分解增強活性的GH61多肽的蛋白質(zhì),在50°C歷時1-7天,與用等量的總蛋白加載量而無纖維素分解增強活性(l-50mg纖維素分解蛋白/gPCS中的纖維素)所進行的對照水解相比。在一個優(yōu)選的方面,使用在總蛋白重量的2-3%的米曲霉(Aspergillusoryzae)β-葡糖苷酶(根據(jù)TO02/095014在米曲霉中重組產(chǎn)生)或者總蛋白重量的3%的煙曲霉(Aspergillusfumigatus)β-葡糖苷酶(如WO2002/095014所述在米曲霉中重組產(chǎn)生)的纖維素酶蛋白加載量存在下的CELLUCLAST1.5L(NovozymesA/S,BagSV^rd,Denmark)的混合物作為纖維素分解活性的來源。具有纖維素分解增強活性的GH61多肽通過降低達到相同水解程度所需的纖維素分解酶的量而增強由具有纖維素分解活性的酶催化的纖維素材料的水解,優(yōu)選降低至少1.01倍,更優(yōu)選至少1.05倍,更優(yōu)選至少1.10倍,更優(yōu)選至少1.25倍,更優(yōu)選至少1.5倍,更優(yōu)選至少2倍,更優(yōu)選至少3倍,更優(yōu)選至少4倍,更優(yōu)選至少5倍,甚至更優(yōu)選至少10倍,并且最優(yōu)選至少20倍。家族61糖苷水解酶術(shù)語“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatB.JfIBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族61的多肽。半纖維素分解酶或半纖維素酶術(shù)語“半纖維素分解酶”或“半纖維素酶”意指一種或多種(幾種)水解半纖維素材料的酶。參見,例如Siallom,D.和Sioham,Y.Microbialhemicellulases.CurrentOpinionInMicrobiology,2003,6(3):219-228)。半纖維素酶是植物生物質(zhì)降解中的關鍵成分。半纖維素酶的實例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。這些酶的底物,半纖維素,是支化和直鏈多糖的混雜集團,這些多糖通過氫鍵鍵合于植物細胞壁中的纖維素微纖維,將其交聯(lián)為魯棒(robust)的網(wǎng)絡。半纖維素亦共價地附于木質(zhì)素,與纖維素一同形成高度復雜的結(jié)構(gòu)。半纖維素的可變的結(jié)構(gòu)和組織形式需要許多酶的協(xié)同作用使其完全降解。半纖維素酶的催化模塊為水解糖苷鍵的糖苷水解酶(GH),或水解乙酸或阿魏酸側(cè)基酯連接的糖酯酶(CE)。這些催化模塊,基于其一級結(jié)構(gòu)的同源性,可指派為以數(shù)字標記的GH和CE家族。一些家族,具有總體上類似的折疊,可進一步歸類為宗族(clan),以字母標記(例如,GH-A)。最具信息性和最新的這些和其他糖活性酶的分類可在Carbohydrate-ActiveEnzymes(CAZy)數(shù)據(jù)庫獲得。半纖維素分解酶活性可根據(jù)(ihose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752測量。木聚糖降解活性或木聚糖分解活性術(shù)語“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物學活性。兩種測定木聚糖分解活性的基礎方法包括(1)測定總木聚糖分解活性,和(測定單獨的木聚糖分解活性(例如,內(nèi)切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronylesterase)).最近在木聚糖分解酶測定法的進展總結(jié)于幾個公開文獻中,包括Biely禾口Puchard,Recentprogressintheassaysofxylanolyticenzymes,2006,JournaloftheScienceofFoodandAgriculture86(11):1636-1647;Spanikova禾口Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyllumcommune,F(xiàn)EBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely禾口Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunctionalbeta-D-xylanxylohydroIase,BiochemicalJournal321:375-381o總木聚糖降解活性可通過確定從多種類型的木聚糖形成的還原糖來測量,所述木聚糖包括例如燕麥小麥(oatspelt)、山毛櫸木(beechwood)和落葉松木(Iarchwood)木聚糖,或者可通過光度法確定從多種共價染色的木聚糖釋放出的染色的木聚糖片段來測量。最常見的總木聚糖分解活性測定法基于從多聚的4-0-甲基葡糖醛酸木聚糖產(chǎn)生還原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingofmethodsforassayofxylanaseactivity,JournalofBiotechnology23(3):257-270中所述。就本發(fā)明而言,木聚糖降解活性是通過測量由木聚糖降解酶在下述典型條件下造成的樺木木聚糖(SigmaChemicalCo.,Inc.,St.Louis,MO,USA)水解的增加來確定的1ml反應,5mg/ml底物(總固形物),5mg木聚糖分解蛋白/g底物,50mM乙酸鈉,pH5,50°C,24小時,如Lever,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem47:273-279所述使用對羥基苯甲酸酰胼(PHBAH)測定法進行糖分析。木聚糖酶術(shù)語“木聚糖酶”意指催化木聚糖中l(wèi),4-i3_D-木糖苷連接的內(nèi)水解的1,4-β-D-木聚糖-木糖水解酶(Ε.C.3.2.1.8)。就本發(fā)明而言,木聚糖酶活性是使用0.2%AZCL-阿拉伯木聚糖作為底物在37°C在0.01%TritonX-100和200mM磷酸鈉緩沖液pH6中進行確定的。一個單位的木聚糖酶活性定義為在37°C,pH6從200mM磷酸鈉pH6緩沖液中的0.2%AZCL-阿拉伯木聚糖作為底物每分鐘產(chǎn)生1.O微摩爾的天青精(azurine)。β-木糖苷酶術(shù)語“β-木糖苷酶”意指β-D木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(Ε.C.3.2.1.37),其催化短β(1—4)木寡糖(xylooligosaccharide)的外水解以從非還原端去除連續(xù)的D-木糖殘基。就本發(fā)明而言,一個單位的木糖苷酶定義為在40°C,pH5從ImM對硝基苯基-β-D-木糖苷作為底物在含有0.01%TWEEN20的IOOmM檸檬酸鈉中每分鐘產(chǎn)生1.0微摩爾對硝基苯酚陰離子。乙酰木聚糖酯酶術(shù)語“乙酰木聚糖酯酶”意指羧基酯酶(EC3.1.1.72),其催化乙?;鶑木酆夏揪厶恰⒁阴;咎恰⒁阴;咸烟恰⒁宜幡?萘酯(alpha-napthylacetate)和乙酸對硝基苯酯(p-nitrophenylacetate)的水解。就本發(fā)明而言,乙酰木聚糖酯酶活性是使用0.5mM乙酸對硝基苯酯作為底物,在含有0.01%TWEEN20的50mM乙酸鈉pH5.0中確定的。一個單位的乙酰木聚糖酯酶定義為能夠在pH5,25°C每分鐘釋放1微摩爾對硝基苯酚陰離子(p-nitrophenolateanion)的酶量。阿魏酸酯酶術(shù)語“阿魏酸酯酶(feruloylesterase),,意指4_羥基_3_甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羥基-3-甲氧基肉桂酰(阿魏酰)基團從酯化的糖(其在“天然”底物中通常為阿拉伯糖)的水解,以產(chǎn)生阿魏酸(4-羥基-3-甲氧基肉桂酸)。阿魏酸酯酶也稱作阿魏酸酯酶(ferulicacidesterase)、羥基肉桂酸酯酶(hydroxycinnamoylesterase)、FAE_III、肉桂酸酉旨水解酶、FAEA、cinnAE、FAE_I或FAE-II。就本發(fā)明而言,阿魏酸酯酶是使用50mM乙酸鈉pH5.0中的0.5mM阿魏酸對硝基苯酯作為底物確定的。一個單位的阿魏酸酯酶活性等于能夠在PH5,25°C每分鐘釋放出1微摩爾對硝基苯酚陰離子的酶量。α-葡糖醛酸糖苷酶術(shù)語“α-葡糖醛酸糖苷酶”意指α_D_葡糖苷酸葡糖醛酸水角軍_(alpha-D-glucosiduronateglucuronohydrolase)(EC3.2.1.139),其催化α-D-葡糖醛酸糖苷水解為D-葡糖醛酸和醇。就本發(fā)明而言,α-葡糖醛酸糖苷酶活性是根據(jù)deVries,1998,J.Bacteriol.180:243-249確定的。一個單位的α-葡糖醛酸糖苷酶等于能夠在pH5,40°C每分鐘釋放出1微摩爾葡糖醛酸或4-0-甲基葡糖醛酸的酶量。α-L-阿拉伯呋喃糖苷酶術(shù)語“α_L_阿拉伯呋喃糖苷酶活性”意指α_L_阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化對α-L-阿拉伯糖苷中的末端非還原性α-L-阿拉伯呋喃糖苷殘基的水解。該酶對α-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_鍵的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本發(fā)明而言,α-L-阿拉伯呋喃糖苷酶活性是使用總體積200μ1中的每ml的IOOmM乙酸鈉pH5中5mg的中等粘性小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,Ireland)在40°C進行30分鐘,接著通過AMINEXHPX-87H柱層析(Bio-fcidLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析來確定的。纖維素材料纖維素材料可以是包含纖維素的任何材料。生物質(zhì)的初生細胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細胞壁(secondarycellwall)在細胞停止生長后產(chǎn)生,其同樣含有多糖并通過共價交聯(lián)至半纖維素的聚合木質(zhì)素而加強。纖維素是脫水纖維二糖的均聚物,并且因此是直鏈β-(1-4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的復雜分支結(jié)構(gòu)。盡管通常是多形的,存在于植物組織中的纖維素主要是平行葡聚糖鏈的不溶晶體基質(zhì)。半纖維素通常與纖維素以及其它半纖維素以氫鍵鍵合,其幫助穩(wěn)定細胞壁基質(zhì)。纖維素通常見于例如植物的莖、葉、殼、皮和穗軸,或樹的葉、枝和木材。纖維素材料可以是,但不限于,草本材料、農(nóng)業(yè)殘余物、林業(yè)殘余物、城市固體廢物、廢紙和紙漿與造紙廠殘余物(參見,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesΕ·Wyman編),PP.105-118,Taylor&Francis,WashingtonD.C.;ffyman,1994,BioresourceTechnology50:3-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25695-719;Mosier等,,1999,RecentProgressinBioconversionofLignocellulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Scheper主編,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中應理解的是,纖維素可以是任何形式的木素纖維素,在混合基質(zhì)中包含木質(zhì)素、纖維素和半纖維素的植物細胞壁材料。在一個優(yōu)選的方面,纖維素材料是木素纖維素,其包含纖維素、半纖維素和木質(zhì)素。在一個方面,纖維素材料是草本材料。在另一個方面,纖維素材料是農(nóng)業(yè)殘余物。在另一個方面,纖維素材料是林業(yè)殘余物。在另一個方面,纖維素材料是城市固體廢物。在另一個方面,纖維素材料是廢紙。在另一個方面,纖維素材料是紙漿和造紙廠殘余物。在另一個方面,纖維素材料是玉米秸稈。在另一個方面,纖維素材料是玉米纖維。在另一個方面,纖維素材料是玉米穗軸。在另一個方面,纖維素材料是橙皮。在另一個方面,纖維素材料是稻桿。在另一個方面,纖維素材料是麥桿。在另一個方面,纖維素材料是柳枝稷(switchgrass)。在另一個方面,纖維素材料是芒草屬(miscanthus)。在另一個方面,纖維素材料是甘蔗渣。在另一個方面,纖維素材料是微晶纖維素。在另一個方面,纖維素材料是細菌纖維素。在另一個方面,纖維素材料是藻類纖維素。在另一個方面,纖維素材料是棉線頭(cottonlinter)。在另一個方面,纖維素材料是無定形的磷酸處理的纖維素。在另一個方面,纖維素材料是濾紙。纖維素材料可以直接使用或進行預處理,使用本領域已知的常規(guī)方法,如本文所述。在一個優(yōu)選的方面,預處理纖維素材料。預處理的玉米秸稈術(shù)語“PCS”或“預處理的玉米秸稈”意指通過用熱和稀硫酸處理的源自玉米秸稈的纖維素材料。分離的或純化的術(shù)語“分離的”和“純化的”意指從與其天然聯(lián)系的至少一種組分移出的多肽或多核苷酸。舉例而言,多肽如通過SDS-PAGE測定的,可為至少純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,或至少95%純,而多核苷酸如通過瓊脂糖電泳測定的,可為至少純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,或至少95%純。成熟多肽術(shù)語“成熟多肽”意指以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個方面,根據(jù)預測SEQIDNO2的氨基酸1至17是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering101-6),成熟多肽是SEQIDNO:2的氨基酸18至493。在另一個方面,根據(jù)預測SEQIDNO4的氨基酸1至17是信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽是SEQIDNO4的氨基酸18至487。本領域中已知宿主細胞可產(chǎn)生兩種或更多種由相同多核苷酸表達的不同成熟多肽(即,具有不同的C端和/或N端氨基酸)的混合物。成熟多肽編碼序列術(shù)語“成熟多肽編碼序列”意指編碼具有纖維二糖水解酶活性的成熟多肽的多核苷酸。在一個方面,根據(jù)預測SEQIDNO1的核苷酸1至51編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:1的核苷酸52至1595。在另一個方面,根據(jù)預測SEQIDNO3的核苷酸1至51編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:3的核苷酸52至1581。在另一個方面,所述成熟多肽編碼序列是包含于SEQIDNO1的核苷酸52至1595中的cDNA序列。在另一個方面,所述成熟多肽編碼序列是包含于SEQIDNO:3的核苷酸52至1581中的cDNA序列。序列同一性參數(shù)“序列同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。就本發(fā)明而言,兩個氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsGenet.16:276-277),優(yōu)選3.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來測定。使用的可選參數(shù)為缺口開放罰分(gapopenpenalty)10,缺口延伸罰分(gapextensionpenalty)0.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性(longestidentity)”的輸出結(jié)果(使用-nobrief選項獲得)作為同一性百分比,并計算如下(同樣的殘基X100)/(比對長度-比對中缺口的總數(shù))就本發(fā)明而言,兩個脫氧核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文),優(yōu)選3.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和mmsch,1970,見上文)來測定。使用的可選參數(shù)為缺口開放罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性”的輸出結(jié)果(使用-nobrief選項獲得)作為同一性百分比,并計算如下(同樣的脫氧核糖核苷酸X100)/(比對長度-比對中缺口的總數(shù))片段術(shù)語“片段”意指從成熟多肽的氨基和/或羧基末端缺失一個或多個(幾個)氨基酸的多肽;其中所述片段具有纖維二糖水解酶活性。在一個方面,片段含有SEQIDNO2的成熟多肽的至少400個氨基酸殘基,更優(yōu)選至少425個氨基酸殘基,且最優(yōu)選至少450個氨基酸殘基。在另一個方面,片段含有SEQIDNO:4的成熟多肽的至少400個氨基酸殘基,更優(yōu)選至少425個氨基酸殘基,且最優(yōu)選至少450個氨基酸殘基。亞序列術(shù)語“亞序列(subsequence)”意指從成熟多肽編碼序列的5’和/或3’端缺失一個或多個(幾個)核苷酸的多核苷酸;其中所述亞序列編碼具有纖維二糖水解酶活性的片段。在一個方面,亞序列含有SEQIDNO:1的成熟多肽編碼序列的至少1200個核苷酸,更優(yōu)選至少1275個核苷酸,且最優(yōu)選至少1350個核苷酸。在另一個方面,亞序列含有SEQIDNO3的成熟多肽編碼序列的至少1200個核苷酸,更優(yōu)選至少1275個核苷酸,且最優(yōu)選至少1350個核苷酸。等位變體(allelicvariant)術(shù)語“等位變體”在本文中表示占據(jù)相同染色體基因座的基因的任何兩種或更多種可選形式。等位變異通過突變天然地發(fā)生,并且可導致種群內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。編碼序列術(shù)語“編碼序列”意指直接指定多肽氨基酸序列的多核苷酸。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或其他起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結(jié)束。編碼序列可以是DNA、cDNA、合成的或重組的多核苷酸。cDNA術(shù)語“cDNA”意指能夠通過反轉(zhuǎn)錄從得自真核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少通常存在于相應基因組DNA中的內(nèi)含子序列。起始的(initial)、初級的RNA轉(zhuǎn)錄物是mRNA的前體,其通過一系列的包括剪接的步驟加工然后作為成熟的已剪接的mRNA出現(xiàn)。核酸構(gòu)建體術(shù)語“核酸構(gòu)建體”意指分離自天然存在的基因的,或受修飾以本來不存在于(nototherwiseexist)自然界中的方式含有核酸的區(qū)段的,或是合成的單鏈或雙鏈的核酸分子。當所述核酸構(gòu)建體含有表達本發(fā)明的編碼序列所需的調(diào)控序列時,術(shù)語核酸構(gòu)建體與術(shù)語“表達盒”同義。調(diào)控序列(controlsequence)術(shù)語“調(diào)控序列”意指對編碼本發(fā)明多肽的多核苷酸表達是必需的所有成分。各個調(diào)控序列對于編碼所述多肽的多核苷酸可以是天然的或外源的,或各個調(diào)控序列對于彼此可以是天然的或外源的。這些調(diào)控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。最少的情況,調(diào)控序列包括啟動子和轉(zhuǎn)錄和翻譯的終止信號。調(diào)控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調(diào)控序列與編碼多肽的多核苷酸編碼區(qū)的連接??刹僮鞯剡B接術(shù)語“可操作地連接”意指這樣的構(gòu)型,其中將調(diào)控序列置于相對于多核苷酸的編碼序列的適當位置,使得調(diào)控序列指導編碼序列的表達。表達術(shù)語“表達”包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術(shù)語“表達載體”意指線性的或環(huán)狀的DNA分子,其包含編碼多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作地連接。宿主細胞“宿主細胞”意指任何細胞類型,所述細胞類型對于使用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導等是易感的(susceptible)。術(shù)語“宿主細胞”涵蓋親本細胞的任何后代,所述后代由于在復制中發(fā)生的突變與親本細胞不完全相同。變體術(shù)語“變體”意指具有纖維二糖水解酶活性的多肽,其包含改變,即在一個或多個(幾個)位置的取代、插入和/或缺失一個或多個(幾個)氨基酸殘基。取代意指用別的氨基酸取代占據(jù)某位置的氨基酸;缺失意指去除占據(jù)某位置的氨基酸;而插入意指鄰接于占據(jù)某位置的氨基酸添加一個或多個(幾個)氨基酸,例如1-5個氨基酸。發(fā)明詳述具有纖維二糖水解酶活性的多肽本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽,所述多肽選自下組(a)多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少90%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在高嚴格條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列的cDNA序列,或(iii)⑴或(ii)的全長互補鏈;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列或它們的cDNA序列具有至少90%序列同一性;(d)SEQIDNO:2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一個或多個(幾個)氨基酸的變體;和(e)(a)、(b)、(c)或(d)的多肽具有纖維二糖水解酶活性的片段。本發(fā)明涉及分離的多肽,所述分離的多肽具有與SEQIDNO2或SEQIDNO4的成熟多肽具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,所述多肽具有纖維二糖水解酶活性。在一個方面,所述多肽與SEQIDNO:2或SEQIDNO:4的成熟多肽相差不超過十個氨基酸,例如相差五個氨基酸,相差四個氨基酸,相差三個氨基酸,相差兩個氨基酸,和相差一個氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO:2的氨基酸序列或其等位變體;或由SEQIDNO2的氨基酸序列或其等位變體組成;或為其具有纖維二糖水解酶活性的片段。在另一個方面,所述多肽包含SEQIDNO:2,或由SEQIDNO:2組成。在另一個方面,所述多肽包含SEQIDNO:2的成熟多肽,或由SEQIDNO:2的成熟多肽組成。在另一個優(yōu)選方面,所述多肽包含SEQIDNO2的氨基酸18至493,或由SEQIDNO2的氨基酸18至493組成。本發(fā)明的多肽還優(yōu)選包含SEQIDNO4的氨基酸序列或其等位變體;或由SEQIDNO4的氨基酸序列或其等位變體組成;或為其具有纖維二糖水解酶活性的片段。在另一個方面,所述多肽包含SEQIDNO:4,或由SEQIDNO:4組成。在另一個方面,所述多肽包含SEQIDNO:4的成熟多肽,或由SEQIDNO:4的成熟多肽組成。在另一個優(yōu)選方面,所述多肽包含SEQIDNO4的氨基酸18至487,或由SEQIDNO4的氨基酸18至487組成。本發(fā)明還涉及具有纖維二糖水解酶活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在高嚴格條件或非常高嚴格條件下,與以下雜交(i)SEQIDN0:1或SEQIDNO:3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列的cDNA序列,或(iii)⑴或(ii)的全長互補鏈(J.Sambrook,E.F.Fritsch,禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1或SEQIDNO:3的多核苷酸或其亞序列,以及SEQIDNO2或SEQIDNO:4的氨基酸序列或其片段,可用于設計核酸探針,以根據(jù)本領域內(nèi)公知的方法從不同屬或種的菌株鑒定和克隆編碼具有纖維二糖水解酶活性的多肽的DNA。具體而言,根據(jù)標準的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應的基因。這些探針可明顯短于完整序列,但長度上應為至少14,例如至少25,至少35,或至少70個核苷酸。優(yōu)選地,所述核酸探針是至少100個核苷酸的長度,例如,至少200個核苷酸,至少300個核苷酸,至少400個核苷酸,至少500個,至少600個核苷酸,至少700個核苷酸,至少800個核苷酸,或至少900個核苷酸的長度。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32p、3H、35S、生物素或抗生物素蛋白(avidin)標記)。這些探針涵蓋于本發(fā)明中??蓮挠蛇@些其它株(strain)制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有纖維二糖水解酶活性的多肽??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術(shù)分離來自這些其它株的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉(zhuǎn)移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或SEQIDNO:3或其亞序列同源的克隆或DNA,將所述載體材料優(yōu)選用在Sounthern印跡中。就本發(fā)明而言,雜交表示多核苷酸在非常低至非常高的嚴格條件下與標記的核酸探針雜交,所述核酸探針對應于SEQIDNO1或SEQIDNO3的成熟多肽編碼序列;包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列的cDNA序列;其全長互補鏈;或它們的亞序列??墒褂美鏧射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在一個方面,核酸探針是SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列。在另一個方面,核酸探針是編碼SEQIDNO:2或SEQIDNO:4的多肽或其片段的多核苷酸。在另一個方面,核酸探針是SEQIDNO:1或SEQIDNO:3或其cDNA序列。在另一個方面,核酸探針是包含在大腸桿菌(E.coli)DSM22598中的質(zhì)粒pGEM-T-CBHII45097中含有的多核苷酸,其中所述多核苷酸序列編碼具有纖維二糖水解酶活性的多肽。在另一個方面,核酸探針是包含在大腸桿菌DSM22598中的質(zhì)粒pGEM-T_CBHII45097中含有的成熟多肽編碼區(qū)。在另一個方面,核酸探針是包含在大腸桿菌DSM22599中的質(zhì)粒PGEM-T-CBHII45178中含有的多核苷酸,其中所述多核苷酸序列編碼具有纖維二糖水解酶活性的多肽。在另一個方面,核酸探針是包含在大腸桿菌DSM22599中的質(zhì)粒PGEM-T-CBHII45178中含有的成熟多肽編碼區(qū)。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴格條件定義為在42°C,在5XSSPE、0.3%SDS,200毫克/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴格性為25%的甲酰胺、對于中和中-高嚴格性為35%的甲酰胺、或?qū)τ诟吆头浅8邍栏裥詾?0%的甲酰胺,根據(jù)標準的Southern印跡法進行預雜交和雜交最佳12至M小時。使用2XSSC、0.2%SDS在45°C(非常低嚴格性),在50°C(低嚴格性),在55°C(中嚴格性),在60°C(中-高嚴格性),在65°C(高嚴格性),和在70°C(非常高嚴格性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴格條件定義為在比使用根據(jù)Bolton和McCarthy計算法(1962,Proc.Natl.Acad.Sci.USA48:1390)計算的Tm低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸鈉(sodiumpyrophosphate),ImM磷酸二氫鈉(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,根據(jù)標準的Southern印跡步驟進行預雜交和雜交最佳12至M小時。將所述載體材料在6XSSC加0.1%SDS中最終洗滌一次15分鐘,并用6XSSC在比計算的Tm低5°C至10°C的溫度洗滌兩次,每次15分鐘。本發(fā)明還涉及由多核苷酸編碼的具有纖維二糖水解酶活性的分離的多肽,所述多核苷酸與SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列或其cDNA序列具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%的序列同一性。本發(fā)明還涉及SEQIDNO:2或SEQIDNO:4的成熟多肽或其同源序列的包含取代、缺失和/或插入一個或多個(幾個)氨基酸的變體。優(yōu)選地,氨基酸改變對性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;通常為1至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenic印itope)或結(jié)合域(bindingdomain)。保守取代的實例是在以下組之內(nèi)堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/^er、Val/Ile、Asp/Glu、Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn.Ala/Val、Ser/Gly,Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly??晒┻x擇的是,氨基酸改變具有這樣的性質(zhì)使多肽的物理化學性質(zhì)改變。例如,氨基酸改變可改進多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。能夠根據(jù)本領域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的纖維二糖水解酶活性以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699-4708.酶的活性部位或其它的生物相互作用也能夠通過結(jié)構(gòu)的物理分析而測定,如通過以下這些技術(shù)如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,F(xiàn)EBSLett.309:59_64。必需氨基酸的身份(identity)也能夠從與多肽的同一性分析來推斷,所述多肽與親本多肽相關。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochemistry30:10832-10837;美國專利No.5,223,409;WO92/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內(nèi)標準方法快速測序。這些方法允許快速測定多肽中單個氨基酸殘基的重要性。SEQIDNO2或SEQIDNO4的成熟多肽的氨基酸取代、缺失和/或插入的總數(shù)不多于10,例如1,2,3,4,5,6,7,8或9。所述多肽可為雜合多肽,其中一種多肽的一部分融合于另一種多肽的一部分的N端或C端。所述多肽可為融合多肽或可切割的融合多肽,其中另一種多肽融合于本發(fā)明多肽的N端或C端。通過將編碼另一個多肽的多核苷酸融合于本發(fā)明的多核苷酸來產(chǎn)生融合的多肽。產(chǎn)生融合多肽的技術(shù)是本領域已知的,并包括連接編碼多肽的編碼序列以使它們在閱讀框中,并且使融合多肽的表達在相同啟動子和終止子的控制下。融合蛋白亦可使用內(nèi)蛋白(intein)技術(shù)構(gòu)建,其中融合物在翻譯后產(chǎn)生(Cooper等,1993,EMBOJ.122575-2583;Dawson等,1994,Science266:776-779)。融合多肽還可以包含在兩個多肽之間的切割位點。一旦分泌了融合多肽,就切割所述位點,釋放所述兩個多肽。切割位點的實例包括,但不限于,公開于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilsonφ,1997,Appl.Environ.Microbiol.63:3488-3493;Wardφ,1995,Biotechnology13:498-503;禾口Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins.Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位點。具有纖維二糖水解酶活性的多肽的來源本發(fā)明的具有纖維二糖水解酶活性的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關的術(shù)語“獲得自”,意思應為多核苷酸編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的多核苷酸的菌株產(chǎn)生。在一個方面,獲得自給定來源的多肽是胞外分泌的。所述多肽可以是細菌多肽。例如,所述多肽可以是具有纖維二糖水解酶活性的革蘭氏陽性細菌多肽例如芽孢桿菌屬(Bacillus)、梭菌屬(Clostridium)、腸球菌屬(Enterococcus)、地芽孢桿菌屬(Geobacillus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、海洋芽孢桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、鏈球菌屬(Str印tococcus)、或鏈霉菌屬(Sti^ptomyces)多肽;或革蘭氏陰性細菌多肽,如彎曲桿菌屬(Campylobacter)、大腸桿菌(E.coli)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、螺桿菌屬(Helicobacter)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)、假單胞菌屬(I^seudomonas)、沙門氏菌屬(Salmonella)或脲原體屬(Ureaplasma)多妝。在一個方面,所述多肽是嗜堿芽孢桿菌(Bacillusalkalophilus)、解淀粉芽孢桿菌(Bacillusamyloliquefaciens)、短芽孢桿菌(Bacillusbrevis)、環(huán)狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillusclausii)、凝結(jié)芽孢桿菌(Bacilluscoagulans)、堅強芽孢桿菌(Bacillus,firmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多月太。在另一個方面,所述多肽是似馬鏈球菌(Streptococcusequisimilis)、釀膿鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個方面,所述多肽是不產(chǎn)色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。所述多肽也可以是真菌多肽。例如,所述多肽可為酵母多肽如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽;或絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬錯菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、鬼傘屬(Coprinopsis)、Coptotermes、棒囊殼屬(Corynascus)、隱叢赤殼菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、漂耳屬(Exidia)、Filibasidium、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質(zhì)毒屬(Humicola)、奉巴齒菌屬(Irpex)、薦燕屬(Lentinula)、Leptospaeria、梨抱菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假漂盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂糟菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavid)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳菇屬(Volvariella)或炭角菌屬(Xylaria)多肽。在另一個方面,所述多肽是卡爾酵母(Saccharomycescarlsbergensis)、釀酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一個優(yōu)選的方面,所述多肽是解纖維枝頂孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillusfoetidus)、煙曲霉(Aspergillusfumigatus)、曰本曲霉(Aspergillusjaponicus)、構(gòu)巢曲霉(Aspergillusnidulans)、漂曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、Chrysosporiuminops、嗜角質(zhì)金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、Chrysosporiummerdarium、租金抱子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威德抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖,廉抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅,廉抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱,廉抱(Fusariumsporotrichioides)、硫色德抱(Fusariumsulphureum)、圓,廉抱(Fusariumtorulosum)、擬絲抱德抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐質(zhì)霉(Humicolagrisea)、特異腐質(zhì)霉(Humicolainsolens)、疏棉狀腐質(zhì)毒(Humicolalanuginosa)、白奉巴齒菌(Irpexlacteus)、米漂毛毒(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糙脈孢菌(Neurosporacrassa)、筆狀青導(Penicilliumfuniculosum)、產(chǎn)紫青導(Pebicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、無色梭抱殼(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱殼(Thielaviamicrospora)、卵抱梭抱殼(Thielaviaovispora)ΛThielaviaperuviana、^;·^冑(Thielaviasetosa)、罾包冑(Thielaviaspededonium)、Thielaviasubthermophila、zh^Mi包殼(Thielaviaterrestris)、哈茨7^霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多肽。在另一個方面,所述多肽是具有纖維二糖水解酶活性的fThielaviahyrcmiae多月太,例如獲得自ThielaviahyrcaniaeNN045097或ThielaviahyrcaniaeNN045178(CGCC0864)的多肽。可理解的是對于前述的種,本發(fā)明包含完全和不完全階段(perfectmdimperfectstates),和其它分類學的等同物(equivalent),例如無性型(mamorph),而無論它們已知的種名。本領域技術(shù)人員將容易地識別適合的等同物的身份。這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)??梢允褂蒙鲜龅奶结槒钠渌鼇碓矗◤淖匀唤?例如,土壤、堆肥、水等)分離的微生物鑒定和獲得所述多肽。用于從天然生境(habitat)分離微生物的技術(shù)是本領域內(nèi)公知的。隨后可通過相似地篩選另一種微生物的基因組或cDNA文庫或混合的DNA樣品來獲得編碼所述多肽的多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸,就能夠使用本領域普通技術(shù)人員熟知的技術(shù)將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。多核苷酸本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸。用于分離或克隆編碼多肽的多核苷酸的技術(shù)是本領域內(nèi)已知的,包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結(jié)構(gòu)特性的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork??梢允褂闷渌怂釘U增方法,如連接酶鏈式反應(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于多核苷酸的擴增(NASBA)。可以從梭孢殼屬菌株,或其它或相關生物體克隆所述多核苷酸,并且因此可為例如所述多核苷酸的多肽編碼區(qū)的等位基因變體或種變體(speciesvariant)。本發(fā)明還涉及包含下述多核苷酸或由下述多核苷酸組成的分離的多核苷酸,所述多核苷酸與SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列或其cDNA序列具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%的序列同一性程度,其編碼具有纖維二糖水解酶活性的多肽。修飾編碼本發(fā)明多肽的多核苷酸對于合成與所述多肽基本上相似的多肽可為必需的。術(shù)語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適PH等方面不同的變體。可以在作為SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列存在的多核苷酸,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構(gòu)建變體所述取代不導致多肽氨基酸序列的改變,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,F(xiàn)ord等,1991,ProteinExpressionandPurification2:95一107。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸,所述分離的多核苷酸在高嚴格條件或非常高嚴格條件下,與以下雜交(i)SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。在一個方面,所述多核苷酸包含SEQIDNO:1,SEQIDNO:1的成熟多肽編碼序列,或大腸桿菌DSM22598中所含的質(zhì)粒pGEM-T_CBHII45097中包含的序列,或編碼SEQIDNO:2具有纖維二糖水解酶活性的片段的SEQIDNO:1亞序列,如SEQIDNO:1核苷酸52至1595的多核苷酸,或者所述多核苷酸由SEQIDNO:1,SEQIDNO1的成熟多肽編碼序列,或大腸桿菌DSM22598中所含的質(zhì)粒pGEM-T_CBHII45097中包含的序列,或編碼SEQIDNO:2具有纖維二糖水解酶活性的片段的SEQIDNO:1亞序列,如SEQIDNO:1核苷酸52至1595的多核苷酸組成。在另一個方面,所述多核苷酸包含SEQIDNO:3,SEQIDNO3的成熟多肽編碼序列,或大腸桿菌DSM22599中所含的質(zhì)粒pGEM-T_CBHII45178中包含的序列,或編碼SEQIDNO:4具有纖維二糖水解酶活性的片段的SEQIDNO:3亞序列,如SEQIDNO3核苷酸52至1581的多核苷酸,或者所述多核苷酸由SEQIDNO:3,SEQIDNO3的成熟多肽編碼序列,或大腸桿菌DSM22599中所含的質(zhì)粒pGEM-T_CBHII45178中包含的序列,或編碼SEQIDNO:4具有纖維二糖水解酶活性的片段的SEQIDNO:3亞序列,如SEQIDNO3核苷酸52至1581的多核苷酸組成。核酸構(gòu)建體本發(fā)明還涉及包含本發(fā)明的多核苷酸的核酸構(gòu)建體,所述多核苷酸與一個或多個(幾個)調(diào)控序列可操作地連接,所述調(diào)控序列在合適的宿主細胞中在與該調(diào)控序列相容的條件下指導編碼序列的表達??梢杂迷S多方式操作所述多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸的技術(shù)是本領域熟知的。調(diào)控序列可為啟動子序列,其是由用于表達編碼本發(fā)明多肽的多核苷酸的宿主細胞所識別的多核苷酸。啟動子序列含有介導多肽的表達的轉(zhuǎn)錄調(diào)控序列。啟動子可以是在所選的宿主細胞中顯示轉(zhuǎn)錄活性的任何多核苷酸,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。用于在細菌宿主細胞中指導本發(fā)明的核酸構(gòu)建體轉(zhuǎn)錄的合適啟動子的實例是從下述獲得的啟動子解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α_淀粉酶基因(amyL)、地衣芽孢桿菌青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、大腸桿菌Iac操縱子、天藍鏈霉菌瓊脂糖酶基因(dagA)和原核內(nèi)酰胺酶基因(ViIla-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac啟動子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另夕卜的啟動子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,見上文中描述。用于指導本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細胞中轉(zhuǎn)錄的合適啟動子的實例是從下列酶的基因獲得的啟動子構(gòu)巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(W000/56900)、鑲片鐮孢Quinn(W000/56900)、曼赫根毛霉(Miizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶IV、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(一種修飾的啟動子,其來自在曲霉屬中編碼中性α-淀粉酶的基因,其中未翻譯的前導序列由在曲霉屬(Aspergilli)中編碼丙糖磷酸異構(gòu)酶的基因的未翻譯的前導序列所替代;非限制性實例包括修飾的啟動子,其來自在黑曲霉中編碼中性α-淀粉酶的基因,其中未翻譯的前導序列由在構(gòu)巢曲霉或米曲霉中編碼丙糖磷酸異構(gòu)酶的基因的未翻譯的前導序列所替代);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992Jeast8:423-488描述。調(diào)控序列也可以是合適的轉(zhuǎn)錄終止子序列,其由宿主細胞識別以終止轉(zhuǎn)錄。所述終止子序列與編碼所述多肽的多核苷酸的3’末端可操作地連接??梢詫⒃谒x宿主細胞中有功能的任何終止子用在本發(fā)明中。對于絲狀真菌宿主細胞優(yōu)選的終止子從如下酶的基因獲得構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優(yōu)選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。調(diào)控序列還可以是合適的前導序列,當被轉(zhuǎn)錄時其為對于宿主細胞的翻譯重要的mRNA非翻譯區(qū)。前導序列可操作地連接于編碼多肽的多核苷酸的5’-末端??墒褂迷谒x宿主細胞中有功能的任何前導序列。對于絲狀真菌宿主細胞優(yōu)選的前導序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調(diào)控序列也可以是聚腺苷酸化序列,其是與多核苷酸的3’末端可操作地連接的序列,并且在轉(zhuǎn)錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉(zhuǎn)錄的mRNA的信號??墒褂迷谒x宿主細胞中有功能的任何聚腺苷酸化序列。對于絲狀真菌宿主細胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sierman,1995,Mol.CellularBiol.15:5983-5990描述。調(diào)控序列還可以是信號肽編碼區(qū),其編碼與多肽的N端相連的信號肽,并且指導所述多肽進入細胞分泌途徑。多核苷酸的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼所述多肽的編碼序列的區(qū)段一起天然地連接在翻譯閱讀框中??晒┻x擇的是,編碼序列5’端可含有對于所述編碼序列異源的信號肽編碼序列。異源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的?;蛘?,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,可使用指導表達的多肽進入所選宿主細胞的分泌途徑的任何信號肽編碼序列。對于細菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V、疏棉狀腐質(zhì)霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉(zhuǎn)化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。調(diào)控序列還可以是前肽編碼序列,其編碼位于多肽N端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉(zhuǎn)化為活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(W095/33836)、曼赫根毛霉天冬氨酸蛋白酶和釀酒酵母α因子的基因獲得前肽編碼序列。當信號肽和前肽序列二者均出現(xiàn)在多肽的N端時,將前肽序列置于緊接著(nextto)多肽N端,并且將信號肽序列置于緊接著前肽序列的N端。同樣理想的是添加調(diào)節(jié)序列,其允許相對于宿主細胞的生長來調(diào)節(jié)多肽的表達。調(diào)節(jié)系統(tǒng)的實例是引起基因表達響應化學或物理刺激物,包括調(diào)節(jié)化合物的存在而開啟或關閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子。調(diào)節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些調(diào)節(jié)序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的多核苷酸將與調(diào)節(jié)序列可操作地連接。表達載體本發(fā)明還涉及重組表達載體,所述重組表達載體包含本發(fā)明的多核苷酸、啟動子和轉(zhuǎn)錄和翻譯終止信號。多種核苷酸和調(diào)控序列可以結(jié)合在一起以產(chǎn)生重組表達載體,所述表達載體可以包括一個或多個(幾個)方便的限制位點以允許在這些位點插入或取代編碼多肽的多核苷酸??晒┻x擇的是,可以通過在適當?shù)挠糜诒磉_的載體中插入包含所述序列的多核苷酸或核酸構(gòu)建體來表達所述多核苷酸。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當?shù)谋磉_調(diào)控序列可操作地連接。重組表達載體可以是任何載體(例如,質(zhì)粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產(chǎn)生多核苷酸的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環(huán)狀質(zhì)粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質(zhì)粒或兩個或更多個載體或質(zhì)粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉(zhuǎn)座子(transposon)。所述載體優(yōu)選地含有一個或多個(幾個)選擇性標記,其允許簡單選擇經(jīng)轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導等的細胞。選擇性標記是基因,其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。細菌選擇性標記的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨芐青霉素、氯霉素、卡那霉素或四環(huán)素抗性。對于酵母宿主細胞合適的標記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶)、bar(草銨膦(phosphinothricin)乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)(orotidine-5,-phosphatedecarboxylase),sC(硫酸腺苷酰轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優(yōu)選用在曲霉屬細胞中的是構(gòu)巢曲霉或米曲霉的amdS和pyrG基因禾口吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。所述載體優(yōu)選含有元件,其允許載體整合入宿主細胞基因組或載體在細胞中獨立于基因組的自主復制。為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的多核苷酸,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應含有足夠數(shù)量的核酸,如100至10,000堿基對,400至10,000堿基對,和800至10,000堿基對,其與相應的目標序列具有高度序列同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此夕卜,整合元件可以是非編碼或編碼的多核苷酸。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以進一步包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質(zhì)粒復制子(r印licator),其在細胞中發(fā)揮功能。術(shù)語“復制起點”或“質(zhì)粒復制子”意指能夠使質(zhì)?;蜉d體體內(nèi)復制的多核苷酸。細菌復制起點的實例是允許在大腸桿菌中復制的質(zhì)粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質(zhì)粒pUBllO、pE194、pTA1060和ρΑΜβ1的復制起點。用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;WO00/24883)。分離AMAl基因和構(gòu)建包含該基因的質(zhì)?;蜉d體能夠根據(jù)公開于WO00/24883中的方法完成??梢詫⒍嘤谝粋€拷貝的本發(fā)明的多核苷酸插入宿主細胞以增加多肽的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或?qū)⒖蓴U增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細胞來選擇含有選擇性標記基因的擴增拷貝,且由此含有多核苷酸的額外拷貝的細胞。用于連接上述元件以構(gòu)建本發(fā)明的重組表達載體的方法是本領域技術(shù)人員熟知的(參見,例如,Sambrook等,1989,見上文)。宿主細胞本發(fā)明還涉及重組宿主細胞,其包含本發(fā)明的多核苷酸可操作地連接于一個或多個(幾個)指導本發(fā)明多肽的產(chǎn)生的調(diào)控序列。將包含多核苷酸的構(gòu)建體或載體導入宿主細胞,使所述構(gòu)建體或載體如前所述作為染色體整體或者作為自復制的染色體外載體維持。術(shù)語“宿主細胞”包括親本細胞的任何后代,其由于復制過程中發(fā)生的突變而不同于親本細胞。宿主細胞的選擇將在很大程度上依賴于編碼多肽的基因及其來源。宿主細胞可以是在本發(fā)明的多肽的重組產(chǎn)生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬、梭菌屬、腸球菌屬、地芽孢桿菌屬、乳桿菌屬、乳球菌屬、海洋芽孢桿菌屬、葡萄球菌屬、鏈球菌屬和鏈霉菌屬。革蘭氏陰性細菌包括但不限于,彎曲桿菌屬、大腸桿菌、黃桿菌屬、梭桿菌屬、螺桿菌屬、泥桿菌屬、奈瑟氏菌屬、假單胞菌屬、沙門氏菌屬和脲原體屬。細菌宿主細胞可以是任何芽孢桿菌屬細胞,包括但不限于嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。細菌宿主細胞還可以是任何鏈球菌屬細胞,包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌(Sti^ptococcusuberis)和馬鏈球菌獸瘟亞種細胞。細菌宿主細胞還可以是任何鏈霉菌屬細胞,包括但不限于,不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細胞。可通過如下方法實現(xiàn)將DNA引入到芽孢桿菌屬細胞例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),使用感受態(tài)細胞(參見,例如,Young禾口Spizizen,1961,J.Bacteriol.81:823-829或Dubnau禾口Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(參見,例如,Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)??赏ㄟ^如下方法實現(xiàn)將DNA引入到大腸桿菌細胞例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通過如下方法實現(xiàn)將DNA引入到鏈霉菌屬細胞例如原生質(zhì)體轉(zhuǎn)化和電穿孔(參見,例如,Gong等,2004,F(xiàn)oliaMicrobiol.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583_;3585),或轉(zhuǎn)導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通過如下方法實現(xiàn)將DNA引入到假單胞菌屬細胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.7151-57)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈球菌屬細胞例如天然感受態(tài)(naturalcompetence)(參見,例如,Perry禾口Kuramitsu,1981,Infect.Immun.32:1295-1297),原生質(zhì)體轉(zhuǎn)化(參見,例如,Catt和Jollick,1991,Microbios.68189-207),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本領域已知的將DNA引入宿主細胞的任何方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。宿主細胞可為真菌細胞?!罢婢庇迷诒疚陌ㄒ韵麻T子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,見上文)。真菌宿主細胞可為酵母細胞。“酵母”用在本文包括產(chǎn)子囊酵母(ascosporogenousyeast)(內(nèi)抱霉目(Endomycetales))、產(chǎn)擔子酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽孢綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.Μ.,禾口Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。酵母宿主細胞可為假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細胞,如乳酸克魯維酵母(Kluyveromyceslactis)、卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowialipolytica)細胞。真菌宿主細胞可為絲狀真菌細胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵的。絲狀真菌宿主細胞可為枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬蠟菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filibasidium、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Wianerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂褶菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。例如,絲狀真菌宿主細胞可為泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkanderaadusta)、干擬賭菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲擬M菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角質(zhì)金抱子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium>IS金包子菌、Chrysosporiumqueenslandicum>熱帶金3子菌、Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌(Wianerochaetechrysosporium)、輻射射脈菌(Phlebiaradiata)、刺芹側(cè)耳(Pleurotuseryngii)、土生梭孢殼、長絨毛栓菌(Trametesvillosa)、變色栓菌CTrametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞??梢詫⒄婢毎ㄟ^涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細胞壁再生的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA811470-1474中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述??梢允褂糜扇缦挛墨I描述的方法轉(zhuǎn)化酵母Becker和Guarente,于Abelson,J.N.和Simon,Μ·I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;禾口Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。產(chǎn)生方法本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括(a)在有助于產(chǎn)生所述多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。在一個優(yōu)選的方面,所述細胞是梭孢殼屬的細胞。在一個更優(yōu)選的方面,所述細胞是Thielaviahyraniae。在一個最優(yōu)選的方面,所述細胞是HiielaviahyraniaeNN045097。在另一個最優(yōu)選的方面,所述細胞是ThielaviahyraniaeNN045178(CGMCC0864)。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,其包括(a)在有助于產(chǎn)生所述多肽的條件下培養(yǎng)本發(fā)明的重組宿主細胞;和(b)回收所述多肽。使用本領域熟知的方法在適合于產(chǎn)生所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細胞。例如,可以通過在合適培養(yǎng)基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養(yǎng),和實驗室或工業(yè)發(fā)酵罐中的小規(guī)模或大規(guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細胞。使用本領域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌,則其能夠從細胞裂解物(Iysate)回收??梢允褂帽绢I域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定多肽的活性。多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(pr印arative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,J.-C.Janson禾口LarsRyden,editors,VCHPublishers,NewYork,1989)。在可選的方面,不回收多肽,而將表達所述多肽的本發(fā)明宿主細胞作為多肽的來源。植物本發(fā)明還涉及分離的植物,例如,轉(zhuǎn)基因植物、植物部分或植物細胞,其包含本發(fā)明的分離的多核苷酸,從而以可回收的量表達和產(chǎn)生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有所述多肽的植物或植物部分用于改進食品或飼料的質(zhì)量,例如,改進營養(yǎng)價值、適口性(palatability)和流變性質(zhì)(rheologicalproperties),或用于破壞抗營養(yǎng)因子。轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的實例是莖(stem)、愈傷組織(calIus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)夕卜體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)禾口細胞質(zhì)(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發(fā)明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細胞的子代。表達多肽的轉(zhuǎn)基因植物或植物細胞可以依照本領域已知方法構(gòu)建。簡而言之,通過如下方法構(gòu)建所述植物或植物細胞將編碼多肽的一個或多個(幾個)表達構(gòu)建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉(zhuǎn)基因植物或植物細胞。表達構(gòu)建體便利地是包含編碼多肽的多核苷酸的核酸構(gòu)建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸所需的適當?shù)恼{(diào)節(jié)序列可操作地連接。此外,表達構(gòu)建體可以包含對于鑒定宿主細胞有用的選擇性標記,在所述宿主細胞中整合了表達構(gòu)建體和將該構(gòu)建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調(diào)節(jié)序列的選擇,例如啟動子和終止子序列和任選地信號或轉(zhuǎn)運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼多肽的基因的表達可以是組成型的或誘導型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以靶向特定的組織或植物部分例如種子或葉。調(diào)節(jié)序列由例如league等,1988,PlantPhysiology86:506所述。對于組成性表達,可以使用35S_CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊蓮和果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子OVu等,1998,PlantCellPhysiol.39:885-889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,J.ofPlantPhysiol.152708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantCellPhysiol.39:935-941),來自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動子,或本
技術(shù)領域
公知的任何其他種子特異性的啟動子,例如,在WO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉(zhuǎn)移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),來自稻的aldP基因啟動子(Kagaya等,1995,Mol.Gen.genet.248:668-674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMol.Biol.22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質(zhì)誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙煉、脫落酸(abscisicacid)禾口赤霄酸(gibberellicacid),禾口重金屬。啟動子增強子元件也可以用于實現(xiàn)多肽在植物中的較高表達。例如,啟動子增強子元件可以是內(nèi)含子,其置于啟動子和編碼多肽的多核苷酸之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白1基因的第一內(nèi)含子以增強表達。選擇性標記基因和表達構(gòu)建體的任何其它部分可以選自本領域內(nèi)可用的那些。將核酸構(gòu)建體根據(jù)本領域已知的常規(guī)技術(shù)并入植物基因組,所述常規(guī)技術(shù)包括土壤桿菌屬(Agrobacterium)介導的轉(zhuǎn)化、病毒介導的轉(zhuǎn)化、顯微注射(microinjection)、粒子轟擊、生物射彈轉(zhuǎn)化和電穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉(zhuǎn)移(genetransfer),是產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)選方法(為了參考,見Hooykas和khilperoort,1992,PlantMol.Biol.1915-38),而且它也可以用于轉(zhuǎn)化單子葉植物,雖然對于這些植物其他的轉(zhuǎn)化方法是常用的。目前,產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)選的方法,是用粒子(用轉(zhuǎn)化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,CurrentOpin.Biotech.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。轉(zhuǎn)化單子葉植物的可供選擇的方法是基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh等,1993,PlantMol.Biol.21:415-4所描述的。其他用于依照本公開使用的轉(zhuǎn)化方法包括那些描述于美國專利6,395,966和7,151,204的那些(兩者均通過全文提述并入本文)。轉(zhuǎn)化之后,根據(jù)本領域熟知的方法選擇具有并入的表達構(gòu)建體的轉(zhuǎn)化體并且再生成為完整植物。通常設計轉(zhuǎn)化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因例如,使用帶有兩個獨立的T-DNA構(gòu)建體的共轉(zhuǎn)化或通過特異性重組酶位點特異性地切除選擇基因。除了用根據(jù)本發(fā)明制備的構(gòu)建體直接轉(zhuǎn)化具體植物基因型之外,還可通過將具有所述構(gòu)建體的植物與缺乏該構(gòu)建體的第二植物雜交來制備轉(zhuǎn)基因植物。舉例而言,可將編碼多肽的構(gòu)建體通過雜交而引入特定植物品種,而根本無需直接轉(zhuǎn)化該給定品種的植物。因此,本發(fā)明不僅涵蓋從依照本發(fā)明經(jīng)轉(zhuǎn)化的細胞直接再生的植物,還包括此類植物的后裔(progeny)。如用于本文,后裔可指依照本發(fā)明制備的親本植物任何世代的后代(offspring)。此種后裔可包含依據(jù)本發(fā)明制備的DNA構(gòu)建體,或依據(jù)本發(fā)明制備的DNA構(gòu)建體的一部分。雜交導致轉(zhuǎn)基因通過將起始種系與供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實例進一步闡述于美國專利7,151,204號。植物可通過回交轉(zhuǎn)化方法生成。舉例而言,植物包括稱作回交轉(zhuǎn)化的基因型、種系、近交體(inbred)或雜交體Qiybrid)的植物??墒褂眠z傳標記以協(xié)助本發(fā)明的一種或多種轉(zhuǎn)基因從一個遺傳背景基因滲入(introgression)至另一個。標記協(xié)助的選擇提供了相對于常規(guī)育種的優(yōu)勢,在于其可用于避免由表型變異導致的錯誤。進一步,遺傳標記可在特定雜交的個體后裔中提供有關良種種質(zhì)相對程度的數(shù)據(jù)。舉例而言,當具有所需性狀但除此之外(otherwise)具有非農(nóng)藝學所需的遺傳背景的植物與良種親本雜交時,可使用遺傳標記來選擇不僅具有該目標性狀,還具有相對較大比例所需種質(zhì)的后裔。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數(shù)得到最小化。本發(fā)明還涉及產(chǎn)生本發(fā)明多肽的方法,包括(a)在有助于產(chǎn)生所述多肽的條件下培養(yǎng)包含編碼所述多肽的多核苷酸的轉(zhuǎn)基因植物或植物細胞;和(b)回收所述多肽。去除或減少纖維二糖水解酶活性本發(fā)明還涉及用于產(chǎn)生親本細胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸或其部分,所述方法導致在相同條件下培養(yǎng)時,與親本細胞相比突變的細胞產(chǎn)生較少的所述多肽??梢允褂帽绢I域熟知的方法(例如,插入、破壞、替代或缺失)通過減少或消除多核苷酸的表達來構(gòu)建突變體細胞。在一個優(yōu)選的方面,所述多核苷酸是失活的。待修飾或失活的多核苷酸可以是,例如,編碼區(qū)或其對活性關鍵的部分,或表達編碼區(qū)所需的調(diào)節(jié)元件。這種調(diào)節(jié)或調(diào)控序列的實例可以是啟動子序列或其功能部分,即,足以影響多核苷酸表達的部分。用于可能的修飾的其它調(diào)控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉(zhuǎn)錄終止子和轉(zhuǎn)錄激活子??梢酝ㄟ^向親本細胞施以誘變,并且選擇其中已將多核苷酸的表達減少或消除的突變體細胞來進行多核苷酸的修飾或失活。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用合適的寡核苷酸進行,或通過將所述DNA序列進行PCR產(chǎn)生的誘變。此外,可以通過使用這些誘變劑的任何組合來進行誘變。適合于本發(fā)明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、0_甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當使用這些試劑時,通常通過如下方法來進行所述誘變在合適條件下存在優(yōu)選的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。通過導入、取代或去除基因中的一個或多個(幾個)核苷酸或其轉(zhuǎn)錄或翻譯所需的調(diào)節(jié)元件可以實現(xiàn)所述多核苷酸的修飾或失活。例如,可以插入或去除核苷酸從而導致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領域已知的方法通過定位誘變或PCR產(chǎn)生的誘變可以實現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進行,艮口,直接在表達待修飾的多核苷酸的細胞上進行,但優(yōu)選如下面所示例的那樣在體外進行所述修飾。消除或減少多核苷酸表達的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術(shù)。例如,在基因破壞方法中,將相應于內(nèi)源多核苷酸的核酸序列在體外進行誘變以產(chǎn)生缺陷性的核酸序列,然后將其轉(zhuǎn)化入親本細胞中以產(chǎn)生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內(nèi)源性多核苷酸。可能理想的是所述缺陷性多核苷酸還編碼標記,其可用于選擇其中多核苷酸被修飾或破壞的轉(zhuǎn)化體。在特別優(yōu)選的方面,用選擇性標記(如本文所述的那些)來破壞所述多核苷酸。本發(fā)明還涉及在細胞中抑制具有纖維二糖水解酶活性的多肽的表達的方法,包括施于細胞或在細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發(fā)明的多核苷酸的亞序列。在一個優(yōu)選的方面,所述dsRNA長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈核苷酸。所述dsRNA優(yōu)選為小干擾RNA(siRNA)或微小RNA(miRNA)。在一個優(yōu)選的方面,所述dsRNA是供抑制轉(zhuǎn)錄的小干擾RNA(siRNA)。在另一個優(yōu)選的方面,所述dsRNA是供抑制翻譯的微小RNA(miRNA)。本發(fā)明還涉及這樣的雙鏈RNA(dsRNA)分子,其包含SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列的一部分,以供在細胞中抑制所述多肽的表達。盡管本發(fā)明并不限于任何具體的作用機制,但dsRNA可進入細胞并導致類似或相同序列的單鏈RNA(ssRNA)包括內(nèi)源mRNA的降解。當細胞暴露于dsRNA時,來自同源基因的mRNA通過稱作RNA干擾(RNAi)的過程受選擇性降解。本發(fā)明的dsRNA可用于基因沉默。在一個方面,本發(fā)明提供了使用本發(fā)明的dsRNAi選擇性降解RNA的方法。該過程可在體外、離體或體內(nèi)實施。在一個方面,所述dsRNA分子可用于在細胞、器官或動物中生成功能缺失(loss-of-function)的突變。用于制備和使用dsRNA分子以選擇性降解RNA的方法在本領域是公知的;參見,例如美國專利6489127,6506559,6511824和6515109號。本發(fā)明進一步涉及親本細胞的突變體細胞,其包含編碼多肽的多核苷酸或其調(diào)控序列的破壞或缺失,或沉默的編碼該多肽的基因,這導致與親本細胞相比突變體細胞產(chǎn)生更少的多肽或不產(chǎn)生多肽。多肽缺陷型突變體細胞作為表達天然和異源多肽的宿主細胞特別有用。所以,本發(fā)明進一步涉及生產(chǎn)天然或異源多肽的方法,其包括(a)在有助于產(chǎn)生所述多肽的條件下培養(yǎng)突變體細胞;和(b)回收所述多肽。術(shù)語“異源多肽”意指對宿主細胞不是天然的多肽,例如天然蛋白質(zhì)的變體。宿主細胞可包含多于一個拷貝的編碼天然或異源多肽的多核苷酸。用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可以通過本領域已知的方法進行。本發(fā)明用于產(chǎn)生基本上無纖維二糖水解酶活性的產(chǎn)物的方法在真核多肽,特別是真菌蛋白質(zhì)例如酶的產(chǎn)生中是特別令人有興趣的。纖維二糖水解酶-缺陷細胞也可以用于表達在制藥上感興趣的異源蛋白質(zhì)例如激素、生長因子、受體等。術(shù)語“真核多肽”不僅包括天然多肽,也包括多肽例如酶,其通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強活性、熱穩(wěn)定性、PH耐受性等。在另外的方面,本發(fā)明涉及通過本發(fā)明方法產(chǎn)生的基本上無纖維二糖水解酶活性的蛋白質(zhì)產(chǎn)物。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物富含這種多肽。術(shù)語“富含”表示所述組合物的纖維二糖水解酶活性,例如,以至少1.1的富集因數(shù)(enrichmentfactor)增力口。所述組合物可以包含本發(fā)明的多肽作為主要酶成分,例如,單成分組合物?;蛘?,所述組合物可以包含多種酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬或種的微生物產(chǎn)生曲霉屬,優(yōu)選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質(zhì)霉屬,優(yōu)選特異腐質(zhì)霉或疏棉狀腐質(zhì)霉;或木霉屬,優(yōu)選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉??梢砸勒毡绢I域內(nèi)已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領域內(nèi)已知方法使納入所述組合物中的多肽穩(wěn)定化。下面給出本發(fā)明的多肽組合物的優(yōu)選用途。本發(fā)明的多肽組合物的劑量和其他使用所述組合物的條件可基于本領域已知方法來確定。用途本發(fā)明還涉及下述使用具有纖維二糖水解酶活性的多肽或其組合物的方法。本發(fā)明還涉及降解或轉(zhuǎn)化纖維素材料的方法,包括在本發(fā)明具有纖維二糖水解酶活性的多肽的存在下用酶組合物處理纖維素材料。在一個優(yōu)選的方面,所述方法還包括回收經(jīng)降解或轉(zhuǎn)化的纖維素材料。本發(fā)明還涉及產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括(a)在存在本發(fā)明的具有纖維二糖水解酶活性的多肽的條件下,用酶組合物糖化纖維素材料;(b)用一種或多種(幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從發(fā)酵回收發(fā)酵產(chǎn)物。本發(fā)明還涉及發(fā)酵纖維素材料的方法,其包括用一種或多種(幾種)發(fā)酵微生物發(fā)酵纖維素材料,其中在存在具有纖維二糖水解酶活性的多肽的條件下,用酶組合物糖化纖維素材料。在一個優(yōu)選的方面,纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。在另一個優(yōu)選的方面,所述方法進一步包括從發(fā)酵回收發(fā)酵產(chǎn)物。本發(fā)明的方法可以用于將纖維素材料糖化成可發(fā)酵糖,并且將可發(fā)酵糖轉(zhuǎn)化成很多有用的物質(zhì),例如燃料、飲用乙醇和/或發(fā)酵產(chǎn)物(例如酸、醇、酮、氣體等)。從纖維素材料產(chǎn)生期望的發(fā)酵產(chǎn)物通常涉及預處理、酶水解(糖化)和發(fā)酵。根據(jù)本發(fā)明的纖維素材料的處理可以使用本領域的常規(guī)過程完成。此外,本發(fā)明的方法能使用經(jīng)配置以依照發(fā)明操作的任何常規(guī)生物質(zhì)處理設備進行。水解(糖化)和發(fā)酵,分別或同時,包括但不限于,分開的水解和發(fā)酵(SHF)、同步糖化和發(fā)酵(SSF)、同步糖化和共發(fā)酵(SSCF)、混合的水解和發(fā)酵(HHF)、分開的水解和共發(fā)酵(SHCF)、混合的水解和共發(fā)酵(HHCF),和直接微生物轉(zhuǎn)化(DMC)。SHF使用分開的處理步驟以首先將纖維素材料酶水解為可發(fā)酵糖,例如,葡萄糖,纖維二糖、纖維三糖和戊糖,然后將可發(fā)酵糖發(fā)酵成為乙醇。在SSF中,纖維素材料的酶水解和糖變?yōu)橐掖嫉陌l(fā)酵組合在一個步驟中(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E編,Taylor&Francis,Washington,DC,179-212)。SSCF包括多種糖的共發(fā)酵(Sheehan,J.,和Himmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15:817-827)。HHF在同步糖化和水解步驟之外,還涉及單獨的水解步驟,所述步驟可以在同一個反應器中進行。HHF過程中的步驟可以在不同的溫度進行,S卩,高溫酶糖化,然后在發(fā)酵菌株能夠耐受的較低溫度進行SSF。DMC在一個或多個(幾個)步驟中組合了所有三個過程(酶產(chǎn)生、水解和發(fā)酵),其中使用相同的生物體產(chǎn)生用于將纖維素材料轉(zhuǎn)化成可發(fā)酵糖并將可發(fā)酵糖轉(zhuǎn)化成終產(chǎn)物的酶(Lynd,L.R.,ffeimer,P.J.,vanZyl,W.H.,禾口Pretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文可以理解的是,本領域中任何已知的方法,包括預處理、酶水解(糖化)、發(fā)酵,或它們的組合,可用于實施本發(fā)明的方法。常規(guī)設備包括補料分批攪拌反應器、分批攪拌反應器、具有超濾的連續(xù)流攪拌反應器和/或連續(xù)活塞流柱式反應器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin禾口IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.,禾口Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反應器(Ryu,S.K.,和Lee,J.Μ.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由電磁場引起的強烈攪拌的反應器(Gusakov,Α.V.,Sinitsyn,Α.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反應器類型包括流化床、升流層(upflowblanket)、固定化和擠出機型反應器以供水解和/或發(fā)酵。預處理。在本發(fā)明的方法的實施中,可以使用本領域已知的任何預處理過程破壞植物細胞壁的纖維素材料組分(Chandra等,2007,Substratepretreatment:Thekeytoeffectiveenzymatichydrolysisoflignocellulosics?Adv.Biochem.Engin./Biotechnol.108:67-93;Galbe禾口Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefficientbioethanolproduction,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks禾口Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,BioresourceTechnol.100:10-18;Mosier等,2005,F(xiàn)eaturesofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,BioresourceTechnol.96:673-686;Taherzadeh禾口Karimi,2008,PretreatmentoflignocellulosicwastestoimproveethanolandbiogasproductionAreview,Int.J.ofMol.Sci.9:1621-1651;Yang禾口Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,BiofuelsBioproductsandBiorefining-Biofpr.2:26-40)。纖維素材料也可以在預處理之前使用本領域中已知的方法進行粒度減小、預浸泡、潤濕、洗滌或調(diào)節(jié)。常規(guī)的預處理包括但不限于,蒸汽預處理(伴隨或不伴隨爆炸)、稀酸預處理、熱水預處理、堿性預處理、石灰預處理、濕氧化、濕爆炸、氨纖維爆炸、有機溶劑預處理和生物預處理。其它預處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界吐0、臭氧和、輻射預處理??梢栽谒夂?或發(fā)酵之前預處理纖維素材料。預處理優(yōu)選在水解前進行?;蛘?,預處理可以與酶水解同時進行以釋放可發(fā)酵糖,如葡萄糖、木糖和/或纖維二糖。在大多數(shù)情況下,預處理步驟本身使一些生物質(zhì)轉(zhuǎn)化成可發(fā)酵糖(甚至在不存在酶的情況下)。蒸汽預處理在蒸汽預處理中,加熱纖維素材料以破壞植物細胞壁成分,包括木質(zhì)素、半纖維素和纖維素,使酶可接觸纖維素和其它部分,例如,半纖維素。使纖維素材料通過或穿過反應容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應時間。蒸汽預處理優(yōu)選在140-230°C,更優(yōu)選160-200°C,并且最優(yōu)選170_190°C進行,其中最優(yōu)的溫度范圍依賴于加入的任何化學催化劑。蒸汽預處理的停留時間優(yōu)選1-15分鐘,更優(yōu)選3-12分鐘,并且最優(yōu)選4-10分鐘,其中最優(yōu)的停留時間依賴于溫度范圍和加入的任何化學催化劑。蒸汽預處理允許相對較高的固體加載量,使纖維素材料在預處理過程中通常僅僅變得潮濕。蒸汽預處理經(jīng)常與預處理后的物質(zhì)的爆炸放料(explosivedischarge)組合,這稱為蒸汽爆炸,即,快速閃變至大氣壓和物質(zhì)的湍流,以通過破碎增力口可接觸的表面積(Duff禾口Murray,1996,BioresourceTechnology8551-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美國專利申請No.20020164730)。在蒸汽預處理過程中,切割半纖維素乙?;鶊F,并且得到的酸自催化半纖維素部分水解成單糖和寡糖。去除木質(zhì)素至有限的程度。經(jīng)常在蒸汽預處理之前加入催化劑如或SO2(通常0.3至3%w/w),其可減少時間,降低溫度,增加回收率,并改進酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga^,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等·,2006,EnzymeMicrob.Technol.39:756-762)?;瘜W預處理術(shù)語“化學處理”指促進纖維素、半纖維素和/或木質(zhì)素分離和/或釋放的任何化學預處理。合適的化學預處理過程的實例包括例如稀酸預處理、石灰預處理、濕氧化、氨纖維/冷凍爆炸(AFEX)、氨滲濾(APR)和有機溶劑預處理。在稀酸預處理中,將纖維素材料與稀酸(通常是吐504)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時間后閃變至大氣壓??梢杂煤芏喾磻髟O計進行稀酸預處理,例如,活塞流式反應器、逆流反應器或連續(xù)逆流收縮床反應器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。還可以使用堿性條件下的幾種預處理方法。這些堿預處理包括,但不限于,石灰預處理、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆炸(AFEX)。用碳酸鈣、氫氧化鈉或氨,在85_150°C的低溫進行石灰預處理,停留時間從1小時到幾天(Wyman等,2005,BioresourceTechnol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)WO2006/11089UW02006/110899,WO2006/110900和WO2006/110901公開了使用氨的預處理方法。濕法氧化是熱預處理,通常在180-200°C進行5_15分鐘,加入氧化劑如過氧化氫或過壓氧(Schmidt禾口Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.1171-17;Varga^,2004,Biotechnol.Bioeng.88567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。預處理以優(yōu)選1-40%干物質(zhì),更優(yōu)選2-30%干物質(zhì),并且最優(yōu)性5-20%干物質(zhì)進行,并且由于加入堿如碳酸鈉,初始PH經(jīng)常會增加。濕法氧化預處理方法的修改方法,稱為濕爆炸(濕氧化和蒸汽爆炸的組合),能夠處理高達30%的干物質(zhì)。在濕爆炸中,在預處理過程中,在一定的停留時間后引入氧化劑。然后通過閃變至大氣壓而結(jié)束預處理(W02006/032282)。氨纖維爆炸(AFEX)涉及在溫和溫度如90-100°C和高壓如17_20bar,用液體或氣體氨將纖維素材料處理5-10分鐘,其中干物質(zhì)含量可以高達60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。AFEX預處理導致纖維素解聚,和半纖維素的部分水解。木質(zhì)素-糖復合物得到切割。有機溶劑預處理通過用含水乙醇00-60%乙醇)在160_200°C提取30-60分鐘而將纖維素材料去木質(zhì)素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。經(jīng)常加入硫酸作為催化劑。在有機溶劑預處理中,去除大部分半纖維素。合適的預處理方法的其他實例如Schell等,2003,Appl.BiochemandBiotechn.Vol.105-108:69-85,和Mosier等,2005,BioresourceTechnology96:673_686,和美國已公開的申請2002/0164730所述。在一個方面,化學預處理優(yōu)選作為酸處理,并且更優(yōu)選作為連續(xù)稀酸和/或弱酸(mildacid)處理進行。酸通常是硫酸,但也可以使用其它酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸處理在優(yōu)選1-5,更優(yōu)選1-4,并且最優(yōu)選1-3的PH范圍內(nèi)進行。在一個方面,酸濃度在優(yōu)選0.01至20wt%酸,更優(yōu)選0.05至IOwt%酸,甚至更優(yōu)選0.1至5wt%酸,并且最優(yōu)選0.2至2.Owt%酸的范圍內(nèi)。酸與纖維素材料接觸,并在優(yōu)選160-220°C,和更優(yōu)選165-195°C范圍內(nèi)的溫度保持數(shù)秒到數(shù)分鐘,例如1秒-60分鐘的時間。在另一個方面,預處理作為氨纖維爆炸步驟(AFEX預處理步驟)進行。在另一個方面,預處理發(fā)生在含水漿料中。在優(yōu)選的方面,在預處理過程中纖維素材料以優(yōu)選10-80wt%,更優(yōu)選20-70wt%,并且最優(yōu)性30-60wt%,如約50wt%的量存在。預處理的纖維素材料可以不洗滌或者使用本領域任何已知的方法洗滌,例如,用水洗滌。機械預處理術(shù)語“機械預處理”指各種類型的磨制(grinding)或粉碎(milling)(例如,干磨、濕磨或振動球磨)。物理預處理術(shù)語“物理預處理”指促進纖維素、半纖維素和/或木質(zhì)素從纖維素材料分離和/或釋放的任何預處理。例如,物理預處理可涉及輻射(例如,微波輻射)、汽蒸/蒸汽爆炸、水熱解(hydrothermolysis)和它們的組合。物理預處理可以涉及高壓和/或高溫(蒸汽爆炸)。在一個方面,高壓指范圍在優(yōu)選約300至約600psi,更優(yōu)選約350至約550psi,并且最優(yōu)選約400至約500psi,如約450psi的壓力。在另一個方面,高溫指范圍在約100至約300°C,優(yōu)選約140至約235°C的溫度。在一個優(yōu)選的方面,機械預處理在使用如上所定義的高溫和高壓的分批過程、蒸汽槍7K解器系統(tǒng),例如來自SundsDefibratorAB,Sweden的SundsHydrolyzer中進行。組合的物理和化學預處理可以對纖維素材料進行物理和化學預處理。例如,預處理步驟可以涉及稀酸或弱酸處理和高的溫度和/或壓力處理。根據(jù)需要,可以順序或同時進行物理和化學預處理。還可以包括機械預處理。因此,在一個優(yōu)選的方面,對纖維素材料進行機械、化學或物理預處理,或者它們的任意組合,以促進纖維素、半纖維素和/或木質(zhì)素的分離和/或釋放。生物預處理術(shù)語“生物預處理”指促進纖維素、半纖維素和/或木質(zhì)素從纖維素材料分離和/或釋放的任何生物預處理。生物預處理技術(shù)可以包括應用溶解木質(zhì)素的微生物(參見,例如,Hsu,Τ·-Α.,1996,Pretreatmentofbiomass,于HandbookonBioethanolProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh禾口Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,Μ.Ε.,Baker,J.0.,禾口Overend,R.P.,編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,禾口Tsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Olsson禾口Hahn—Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331;禾口Vallander禾口Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Btotechnol.42:63-95)。趣化。在水解(也稱作糖化)步驟中,將纖維素材料(例如經(jīng)預處理的)水解以將纖維素或亦將半纖維素分解成可發(fā)酵糖,如葡萄糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶組合物以酶法在本發(fā)明具有纖維二糖水解酶活性的多肽的存在下進行。組合物可進一步包含一種或多種(幾種)半纖維素分解酶或木聚糖降解酶。組合物的酶和蛋白組分可以順序加入。酶水解優(yōu)選在易于由本領域技術(shù)人員確定的條件下,在合適的含水環(huán)境中進行。在一個優(yōu)選的方面,水解在適于酶的活性,即對于酶最優(yōu)的條件下進行。水解可以以補料分批或連續(xù)的過程進行,其中將經(jīng)預處理的纖維素材料(底物)逐漸補入,例如,含酶的水解溶液中。糖化通常在攪拌釜反應器或發(fā)酵罐中,在受控的pH、溫度和混合條件下進行。合適的處理時間、溫度和PH條件可以由本領域技術(shù)人員容易地確定。例如,糖化可以持續(xù)長達200小時,但是通常優(yōu)選進行約12至約96小時,更優(yōu)選約16至約72小時,并且最優(yōu)選約24至約48小時。溫度的范圍優(yōu)選約25°C至約70°C,更優(yōu)選約30°C至約65°C,并且更優(yōu)選約40°C至約60°C,特別是約50°C。pH的范圍優(yōu)選約3至約8,更優(yōu)選約3.5至約7,并且最優(yōu)選約4至約6,特別是約pH5。干燥固體含量優(yōu)選約5至約50wt%,更優(yōu)選約10至約40wt%,并且最優(yōu)選約20至約30wt%。在本發(fā)明的方法中,酶組合物可包含任何可用于降解或轉(zhuǎn)化纖維素材料的蛋白。在一個方面,酶組合物包含一種或多種(幾種)纖維素分解酶/蛋白。在另一個方面,酶組合物包含或進一步包含一種或多種(幾種)半纖維素分解酶。在另一個方面,酶組合物包含一種或多種(幾種)纖維素分解酶和一種或多種(幾種)半纖維素分解酶。在另一個方面,酶組合物包含一種或多種(幾種)選自纖維素分解酶和半纖維素分解酶的酶。在另一個方面,酶組合物包含一種或多種(幾種)選自下組的纖維素分解酶/蛋白內(nèi)切葡聚糖酶,纖維二糖水解酶、葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,酶組合物包含或進一步包含一種或多種(幾種)選自下組的蛋白半纖維素酶,棒曲霉素(expansin),酯酶,木質(zhì)素分解酶(ligninolyticenzyme),果膠酶,過氧化物酶,蛋白酶和swollenin。半纖維素酶優(yōu)選為一種或多種(幾種)選自下組的酶乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。在另一個方面,酶組合物包含內(nèi)切葡聚糖酶。在另一個方面,酶組合物包含纖維二糖水解酶。在另一個方面,酶組合物包含β-葡糖苷酶。在另一個方面,酶組合物包含具有纖維素分解增強活性的多肽。在另一個方面,酶組合物包含乙酰甘露聚糖酯酶。在另一個方面,酶組合物包含乙酰木聚糖酯酶。在另一個方面酶組合物包含阿拉伯聚糖酶(例如α-L-阿拉伯聚糖酶)。在另一個方面,酶組合物包含阿拉伯呋喃糖苷酶(例如α-L-阿拉伯呋喃糖苷酶)。在另一個方面,酶組合物包含香豆酸酯酶。在另一個方面,酶組合物包含阿魏酸酯酶。在另一個方面,酶組合物包含半乳糖苷酶(例如,α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一個方面,酶組合物包含葡糖醛酸糖苷酶(例如,α-D-葡糖醛酸糖苷酶)。在另一個方面,酶組合物包含葡糖醛酸酯酶。在另一個方面,酶組合物包含甘露聚糖酶。在另一個方面,酶組合物包含甘露糖苷酶(例如甘露糖苷酶)。在另一個方面,酶組合物包含木聚糖酶。在一個優(yōu)選的方面,所述木聚糖酶為家族10木聚糖酶。在另一個方面,酶組合物包含木糖苷酶。在另一個方面,酶組合物包含棒曲霉素。在另一個方面,酶組合物包含酯酶。在另一個方面,酶組合物包含木質(zhì)素分解酶。在一個優(yōu)選的方面,所述木質(zhì)素分解酶為漆酶。在另一個優(yōu)選的方面,所述木質(zhì)素分解酶是錳過氧化物酶。在另一個優(yōu)選的方面,所述木質(zhì)素分解酶是木質(zhì)素過氧化物酶。在另一個優(yōu)選的方面,所述木質(zhì)素分解酶是H2O2產(chǎn)生酶。在另一個方面,酶組合物包含果膠酶。在另一個方面,酶組合物包含過氧化物酶。在另一個方面,酶組合物包含蛋白酶。在另一個方面,酶組合物包含swollenin。在本發(fā)明的方法中,酶/蛋白可在發(fā)酵之前或過程中添加,例如在糖化過程中或在發(fā)酵微生物繁殖過程中或之后添加。所述酶組合物的一種或多種(幾種)組分可為野生型蛋白、重組蛋白或野生型蛋白和重組蛋白的組合。舉例而言,一種或多種(幾種)組分可為細胞的天然蛋白,其用作宿主細胞以重組表達一種或多種(幾種)酶組合物的其他組分。酶組合物的一種或多種(幾種)組分可作為單組分產(chǎn)生,然后將其組合以形成酶組合物。所述酶組合物可為多組分和單組分蛋白制備物的組合。用于本發(fā)明方法中的酶可為任何適用于本文中所述工藝的形式,如例如去除或未去除細胞的粗發(fā)酵液,含或不含細胞碎片的細胞裂解物,半純化或純化的酶制備物,或宿主細胞,作為酶的來源。所述酶組合物可為干粉或顆粒,無粉塵的顆粒,液體,穩(wěn)定化液體或穩(wěn)定化受保護的酶。液體酶制備物可根據(jù)確立的工藝,例如通過添加穩(wěn)定劑如糖、糖醇或其他多元醇,和/或乳酸或其他有機酸來穩(wěn)定化。具有纖維二糖水解酶活性的酶和多肽的最適量取決于幾個因素,其包括但不限于,組分纖維素分解酶的混合物、纖維素底物、纖維素底物的濃度、纖維素底物的預處理、溫度、時間、PH和包括發(fā)酵生物體(例如,同步糖化和發(fā)酵的酵母)。在一個優(yōu)選的方面,纖維素分解蛋白對于纖維素材料的有效量是約0.5至約50mg,優(yōu)選約0.5至約40mg,更優(yōu)選約0.5至約25mg,更優(yōu)選約0.75至約20mg,更優(yōu)選約0.75至約15mg,甚至更優(yōu)選約0.5至約10mg,并且最優(yōu)選約2.5至約IOmg每g纖維素材料。在另一個優(yōu)選的方面,具有纖維二糖水解酶活性的多肽對于纖維素材料的有效量是約0.01至約50.Omg,優(yōu)選約0.01至約40mg,更優(yōu)選約0.01至約30mg,更優(yōu)選約0.01至約20mg,更優(yōu)選約0.01至約10mg,更優(yōu)選約0.01至約5mg,更優(yōu)選約0.025至約1.5mg,更優(yōu)選約0.05至約1.25mg,更優(yōu)選約0.075至約1.25mg,更優(yōu)選約0.1至約1.25mg,甚至更優(yōu)選約0.15至約1.25mg,并且最優(yōu)選約0.25至約1.Omg每g纖維素材料。在另一個優(yōu)選的方面,具有纖維二糖水解酶活性的多肽對于纖維素分解蛋白的有效量是約0.005至約1.Og,優(yōu)選約0.01至約1.Og,更優(yōu)選約0.15至約0.75g,更優(yōu)選約0.15至約0.5g,更優(yōu)選約0.1至約0.5g,甚至更優(yōu)選約0.1至約0.25g,并且最優(yōu)選約0.05至約0.2g每g纖維素分解蛋白。酶可源自或獲得自任何合適的來源,包括細菌、真菌、酵母、植物或哺乳動物來源。術(shù)語“獲得”在本文中意指該酶可從天然產(chǎn)生該酶作為天然酶的生物分離。術(shù)語“獲得”在本文中還意指該酶可在宿主生物中使用本文中所述的方法重組產(chǎn)生,其中經(jīng)重組產(chǎn)生的酶對于宿主生物是天然的或異源的,或具有修飾的氨基酸序列,例如,具有一個或多個(幾個)缺失、插入和/或取代的氨基酸,即重組產(chǎn)生的酶,其為天然氨基酸序列的片段和/或突變體或通過本領域已知的氨基酸改組方法產(chǎn)生的酶。天然酶的含義中涵蓋的是天然變體,而外來酶的含義中涵蓋的是重組(如通過定位誘變或重排)獲得的變體。具有酶活性的多肽可以是細菌多肽。例如,所述多肽可以是具有酶活性的革蘭氏陽性細菌多肽如芽孢桿菌屬(Bacillus)、鏈球菌屬(Str印tococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)或海洋芽孢桿菌屬(Oceanobacillus)多肽;或具有酶活性的革蘭氏陰性細菌多肽,如大腸桿菌、假單胞菌屬O^seudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)lifM(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多妝。在一個優(yōu)選的方面,所述多肽是具有酶活性的嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌多肽。在另一個優(yōu)選的方面,所述多肽是具有酶活性的似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌或馬鏈球菌獸瘟亞種多肽。在另一個優(yōu)選的方面,所述多肽是具有酶活性的不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌或淺青紫鏈霉菌多肽。具有酶活性的多肽也可以是真菌多肽,并且更優(yōu)選具有酶活性的酵母多肽如假絲酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬多肽;或更優(yōu)選具有酶活性的絲狀真菌多肽如枝頂孢霉屬、傘菌屬、鏈格孢屬、曲霉屬、短梗霉屬、Botryospaeria、擬賭菌屬、Chaetomidium、金抱子菌屬、Claviceps、Cochliobolus、鬼傘屬、Coptotermes、棒囊殼屬、隱叢赤殼菌屬、隱球菌屬、色二孢屬、黑耳屬、Filibasidium、鐮孢屬、赤霉屬、全鞭毛蟲屬、腐質(zhì)霉屬、耙齒菌屬、蘑菇屬、L印tospaeria、梨孢菌屬、Melanocarpus、多孔菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、瘤胃壺菌屬、Poitrasia、假黑盤菌屬、Pseudotrichonympha、根毛霉屬、裂褶菌屬、柱頂孢屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、木霉屬、長毛盤菌屬、輪枝孢屬、包腳菇屬或炭角菌屬多肽。在一個優(yōu)選的方面,所述多肽是具有酶活性的卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母多肽。在另一個優(yōu)選的方面,所述多肽是具有酶活性的解纖維枝頂孢霉、棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、嗜角質(zhì)金孢子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、IS金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、桿子包狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、灰腐質(zhì)霉、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、白耙齒菌、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、繩狀青霉、產(chǎn)紫青霉、黃孢平革菌、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢殼、Thielaviafimeti、小孢梭孢殼、卵孢梭3冑、ThielaviaThielaviasubthermophila>zh^ii孢殼、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、綠色木霉或iTrichophaeasaccata多肽。還可以使用具有酶活性的多肽經(jīng)化學修飾或蛋白質(zhì)工程改造的突變體。所述酶組合物的一種或多種(幾種)組分可以是重組組分,亦即,通過克隆編碼所述單獨組分的DNA序列并隨后用該DNA序列轉(zhuǎn)化細胞并在宿主中表達(參見,例如,W091/17243和W091/17244)產(chǎn)生。所述宿主優(yōu)選是異源宿主(酶對宿主是異源的),但該宿主在一定條件下也可以是同源宿主(酶對宿主是天然的)。單組分纖維素分解蛋白還可以通過從發(fā)酵液中提純這樣的蛋白質(zhì)來制備。適用于本發(fā)明的商業(yè)的纖維素分解蛋白制備物的實例包括,例如,CELLICCtec(NovozymesA/S),CELLUCLAST(NovozymesA/S)、N0V0ZYM188(NovozymesA/S)、CELLUZYME(NovozymesA/S)、CEREFLO(NovozymesA/S)禾口ULTRAFLO(NovozymesA/S),ACCELERASE(GenencorInt.)、LAMINEX(GenencorInt.)、SPEZYMECP(GenencorInt.),ROHAMENT7069ff(RohmGmbH),F(xiàn)IBREZYMELDI(DyadicInternational,Inc.),FIBREZYMELBR(DyadicInternational,Inc.)或VISCOSTAR150L(DyadicInternational,Inc.)。所述纖維素酶以固體的約0.001到約5.Owt%,更優(yōu)選固體的約0.025到約4.Owt%,且最優(yōu)選固體的約0.005到約2.Owt%的有效量添加。所述纖維素酶以固體的約0.001到約5.Owt%,更優(yōu)選固體的約0.025到約4.Owt%,且最優(yōu)選固體的約0.005到約2.Owt%的有效量添加??梢杂糜诒景l(fā)明的方法的細菌內(nèi)切葡聚糖酶的實例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內(nèi)切葡聚糖酶(W091/05039;WO93/15186;美國專利5,275,944;W096/02551;美國專利5,536,655,WO00/70031,WO05/093050);Thermobifidafusca內(nèi)切葡聚糖酶III(W005/093050)JPThermobifidafusca內(nèi)切葡聚糖酶V(W005/093050)。可以用于本發(fā)明的方法的真菌內(nèi)切葡聚糖酶的實例包括但不僅限于,里氏木霉內(nèi)切葡聚糖酶I(Penttila等,1986,Gene45:253-263;GENBANK登錄號M15665);里氏木霉內(nèi)切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22;GENBANK登錄號M19373);里氏木霉內(nèi)切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANK登錄號AB003694);以及里氏木霉內(nèi)切葡聚糖酶V(&iloheimo等,1994,MolecularMicrobiology13:219-228;GENBANK登錄號Z33381);棘孢曲霉內(nèi)切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)內(nèi)切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內(nèi)切葡聚糖酶(&iarilahti等,1990,Gene90:9-14);尖鐮孢內(nèi)切葡聚糖酶(GENBANK登錄號L29381);灰腐質(zhì)霉thermoidea變種內(nèi)切葡聚糖酶(GENBANK登錄號AB003107);Melanocarpusalbomyces內(nèi)切葡聚糖酶(GENBANK登錄號MAL515703);粗糙脈孢菌內(nèi)切葡聚糖酶(GENBANK登錄號XM324477);特異腐質(zhì)霉內(nèi)切葡聚糖酶V;嗜熱毀絲霉CBS117.65內(nèi)切葡聚糖酶;擔子菌綱(basidiomycete)CBS495.95內(nèi)切葡聚糖酶;擔子菌綱CBS494.95內(nèi)切葡聚糖酶;土生梭孢殼NRRL8126CEL6B內(nèi)切葡聚糖酶;土生梭孢殼NRRL8126CEL6C內(nèi)切葡聚糖酶;土生梭孢殼NRRL8126CEL7C內(nèi)切葡聚糖酶;土生梭孢殼NRRL8126CEL7E內(nèi)切葡聚糖酶;土生梭孢殼NRRL8126CEL7F內(nèi)切葡聚糖酶;CladorrhinumfoecundissimumATCC62373CEL7A內(nèi)切葡聚糖酶;以及里氏木霉菌株VTT-D-80133內(nèi)切葡聚糖酶(GENBANK登錄號M15665)??捎糜诒景l(fā)明的方法的纖維二糖水解酶的示例包括但不僅限于,里氏木霉纖維二糖水解酶I;里氏木霉纖維二糖水解酶II;特異腐質(zhì)霉纖維二糖水解酶I、嗜熱毀絲霉纖維二糖水解酶II、土生梭孢殼纖維二糖水解酶II(CEL6A)、嗜熱毛殼菌(Chaetomiumthermophilum)纖維二糖水解酶I以及嗜熱毛殼菌纖維二糖水解酶II。可用于本發(fā)明的方法的葡糖苷酶的實例包括但不僅限于米曲霉葡糖苷酶;煙曲霉β-葡糖苷酶;巴西青霉(Penicilliumbrasilianum)IBT20888β-葡糖苷酶;黑曲霉β-葡糖苷酶;以及棘孢曲霉β-葡糖苷酶。具有β-葡糖苷酶活性的米曲霉多肽可根據(jù)WO2002/095014獲取。具有β-葡糖苷酶活性的煙曲霉多肽可根據(jù)WO2005/047499獲取。具有β-葡糖苷酶活性的巴西青霉多肽可根據(jù)WO2007/019442獲取。具有β_葡糖苷酶活性的黑曲霉多肽可根據(jù)Dan等,2000,J.Biol.Chem.275:4973-4980獲取。具有β-葡糖苷酶活性的棘孢曲霉多肽可根據(jù)Kawaguchi等,1996,Gene173:287-288獲取。所述β-葡糖苷酶可以是融合蛋白。在一個方面,所述β-葡糖苷酶是根據(jù)WO2008/057637獲得的米曲霉β-葡糖苷酶變體BG融合蛋白或米曲霉β-葡糖苷酶融合蛋白。其它內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶使用根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino—acidsequencesimilarities,Biochem.J.280:309_316禾口HenrissatB.禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696的分類公開于許多糖基水解酶家族中。其它可用于本發(fā)明的纖維素分解酶描述于EP495,257,EP531,315,EP531,372、WO89/09259、WO94/07998、WO95/24471、WO96/11262、WO96/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、WO98/13465、WO98/015619、WO98/015633、WO98/028411,WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、WO2000/009707,WO2002/050245、WO2002/0076792、WO2002/101078、WO2003/027306、WO2003/052054,WO2003/052055,WO2003/052056,WO2003/052057,WO2003/052118、WO2004/016760、WO2004/043980、WO2004/048592、WO2005/001065、WO2005/028636、WO2005/093050,WO2005/093073,WO2006/074005,WO2006/117432、WO2007/071818、WO2007/071820、WO2008/008070,WO2008/008793、美國專利No.4,435,307、美國專利No.5,457,046、美國專利No.5,648,洸3、美國專利No.5,686,593、美國專利No.5,691,178、美國專利No.5,763,254以及美國專利No.5,776,757。在本發(fā)明的方法中,可使用任何具有纖維素分解增強活性的GH61多肽。在一個方面,所述具有纖維素分解增強活性的多肽包含下述基序[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]禾口[Fff]-[TF]-K-[AIV],其中X為任意氨基酸,X0,5)為在4或5個連續(xù)位置的任意氨基酸,而X(4)是在4個連續(xù)位置的任意氨基酸。包含上述所示的基序的多肽可進一步包含H-X(l,2)-G-P-X(3)-[Yff]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或H-X(l,2)-G-P-X(3)-[Yff]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],其中X為任意氨基酸,X(l,2)為在1個位置或2個連續(xù)位置的任意氨基酸,X(3)為3個連續(xù)位置的任意氨基酸,而XQ)為2個連續(xù)位置的任意氨基酸。在上述基序中,采用公認的IUPAC單字母氨基酸縮寫。在一個優(yōu)選的方面,所述具有纖維素分解增強活性的多肽進一步包含H-X(l,2)-G-P-X(3)-[Yff]-[AILMV]。在另一個優(yōu)選的方面,具有纖維素分解增強活性的分離的多肽進一步包含[Εζ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一個優(yōu)選的方面,具有纖維素分解增強活性的多肽進一步包含H-X(1,2)-G-P-X(3)-[Yff]-[AILMV]和[Εζ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在第二個方面,所述具有纖維素分解增強活性的多肽包含下述基序[ILMV]-P-X(4,5)-G—x—Y-[ILMV]—x—R—x—[EQ]-χ(3)~A~[HNQ],其中χ為任意氨基酸,χ(4,5)為在4或5個連續(xù)位置的任意氨基酸,而xC3)為3個連續(xù)位置的任意氨基酸。在上述基序中,采用公認的IUPAC單字母氨基酸縮寫??捎糜诒景l(fā)明方法的具有纖維素分解增強活性的多肽的實例包括但不限于來自土生梭孢殼的具有纖維素分解增強活性的多肽(W02005/074647);來自橙色熱子囊菌(Thermoascusaurantiacus)的具有纖維素分解增強活性的多肽(W02005/074656);來自里氏木霉的具有纖維素分解增強活性的多肽(W02007/089290);和來自嗜熱毀絲霉的具有纖維素分解增強活性的多肽(W02009/085935;WO2009/085859;WO2009/085864;WO2009/085868)。適用于本發(fā)明的商業(yè)性半纖維素分解酶制備物(例如木聚糖降解酶)的實例包括,例如SHEARZYME(NovozymesA/S)、CELLICHtec(NovozymesA/S)、VISCOZYME(NovozymesA/S)>ULTRAFLO(NovozymesA/S)>PULPZYMEHC(NovozymesA/S)、MULTIFECTXylanase(Genencor)、ECOPULPTX-200A(ABEnzymes)、HSP6000Xylanase(DSM)、DEP0L333P(BiocatalystsLimit,Wales,UK),DEP0L740L.(BiocatalystsLimit,Wales,UK)和DEP0L762P(BiocatalystsLimit,Wales,UK)可用于本發(fā)明方法的木聚糖酶的實例包括但不限于棘孢曲霉(Aspergillusaculeatus)木聚糖酶(GeneSeqP:AAR63790;W094/21785)、煙曲霉(Aspergillusfumigatus)木聚糖酶(W02006/078256)和土生梭孢殼(Thielaviaterrestris)NRRL8126木聚糖酶(W02009/079210)。可用于本發(fā)明方法的β-木糖苷酶的實例包括但不限于里氏木霉(Trichodermareesei)β-木糖苷酶(UniProtKB/TrEMBL登錄號Q92458),埃默森踝節(jié)菌(Talaromycesemersonii)(SwissProt登錄號Q8X212)和粗糙脈孢菌(Neurosporacrassa)(SwissProt登錄號Q7S0W4)??捎糜诒景l(fā)明方法的乙酰木聚糖酯酶的實例包括但不限于紅褐肉座菌(Hypocreajecorina)乙酰木聚糖酯酶(W02005/001036)、粗糙脈孢菌乙酰木聚糖酯酶(UniProt登錄號q7s259)、土生梭孢殼NRRL81乙酰木聚糖酯酶(W02009/042846)、球毛殼菌(Chaetomiumglobosum)乙酰木聚糖酯酶(Uniprot登錄號Q2GWX4)、細麗毛殼菌(Chaetomiumgracile)乙酰木聚糖酯酶(GenekqP登錄號AAB821M)、穎枯殼針孢(Phaeosphaerianodorum)乙酰木聚糖酯酶(Uniprot登錄號Q0UHJ1)和特異腐質(zhì)霉(Humicolainsolens)DSM1800乙酰木聚糖酯酶(W02OO9A^37O9)??捎糜诒景l(fā)明方法的阿魏酸酯酶的實例包括但不限于特異腐質(zhì)霉DSM1800阿魏酸酯酶(W02009/076122)、粗糙脈孢菌阿魏酸酯酶(UniProt登錄號Q9HGR3)和費希新薩托菌(Neosartoryaficher)阿魏酸酯酶(UniProt登錄號A1D9T4)。可用于本發(fā)明方法的阿拉伯呋喃糖苷酶的實例包括但不限于特異腐質(zhì)霉(Humicolainsolens)DSM1800阿拉伯呋喃糖苷酶(W02009/073383)和黑曲霉(Aspergillusniger)阿拉伯呋喃糖苷酶(GeneSeqP登錄號AAR94170)??捎糜诒景l(fā)明方法的α-葡糖醛酸糖苷酶的實例包括但不限于棒曲霉(Aspergillusclavatus)α-葡糖醛酸糖苷酶(UniProt登錄號alccl2)、里氏木霉(Trichodermareesei)α-葡糖醛酸糖苷酶(Uniprot登錄號Q99024)、埃默森踝節(jié)菌(Talaromycesemersonii)α-葡糖醛酸糖苷酶(UniProt登錄號Q8X211)、黑曲霉(Aspergillusniger)α-葡糖醛酸糖苷酶(Uniprot登錄號Q96WX9)、土曲霉(Aspergillusterreus)α-葡糖醛酸糖苷酶(SwissProt登錄號Q0CJP9)和煙曲霉(Aspergillusfumigatus)α-葡糖醛酸糖苷酶(SwissProt登錄號Q4WW45)。用于本發(fā)明方法的酶和蛋白可通過使用本領域已知方法(參見,例如Bennett,J.W.禾口LaSure,L.(編),MoreGeneManipulationsinFungi,AcademicPress,CA,1991),在含有合適碳源和氮源和無機鹽的營養(yǎng)培養(yǎng)基上發(fā)酵上述指出的微生物菌株來產(chǎn)生。合適的培養(yǎng)基可從供應商獲得,或可根據(jù)已公開的組成制備(例如美國典型培養(yǎng)物保藏中心的目錄)。適于生長和酶產(chǎn)生的溫度范圍和其他條件在本領域是已知的(參見,例如Bailey,J.Ε.禾口Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。所述發(fā)酵可以是任何其結(jié)果為酶表達或分離的培養(yǎng)細胞的方法。因此,發(fā)酵可以理解為包括在合適的培養(yǎng)基中并在允許所述酶得以表達或分離的條件下進行的搖瓶培養(yǎng),或在實驗室或工業(yè)發(fā)酵罐中的小-或大規(guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)。通過上述方法產(chǎn)生的所得的酶可從發(fā)酵培養(yǎng)基回收并通過常規(guī)方法純化。發(fā)醛。可通過一種或多種(幾種)能將糖直接或間接發(fā)酵成所需發(fā)酵產(chǎn)物的發(fā)酵微生物發(fā)酵自經(jīng)水解的纖維素材料獲得可發(fā)酵糖?!鞍l(fā)酵”或“發(fā)酵方法”指任何發(fā)酵方法或包含發(fā)酵步驟的任何方法。發(fā)酵方法還包括用于消費品醇工業(yè)(例如,啤酒和葡萄酒)、乳品業(yè)(例如,發(fā)酵乳制品)、皮革業(yè)和煙草業(yè)的發(fā)酵方法。發(fā)酵條件依賴于期望的發(fā)酵產(chǎn)物和發(fā)酵生物體,并且能由本領域的技術(shù)人員容易地確定。在發(fā)酵步驟中,作為預處理和酶水解步驟的結(jié)果從纖維素材料釋放的糖,通過發(fā)酵生物體(如酵母)發(fā)酵成為產(chǎn)物,例如,乙醇。如上所述,水解(糖化)和發(fā)酵可以是分開的或同時的。在本發(fā)明的發(fā)酵步驟中可以使用任何合適的經(jīng)水解的纖維素材料。通常根據(jù)所需的發(fā)酵產(chǎn)品(即,要從發(fā)酵獲得的物質(zhì))和使用的方法來選擇所述材料,如本領域中所公知的。術(shù)語“發(fā)酵培養(yǎng)基”在本文中可理解為指加入發(fā)酵微生物之前的培養(yǎng)基,如,由糖化過程產(chǎn)生的培養(yǎng)基,以及同步的糖化和發(fā)酵方法(SSF)中使用的培養(yǎng)基。“發(fā)酵微生物”指適用于理想的發(fā)酵方法產(chǎn)生發(fā)酵產(chǎn)物的任何微生物,包括細菌和真菌生物體。發(fā)酵生物體可以是(;和/或C5發(fā)酵生物體,或它們的組合。C6和C5發(fā)酵生物體均在本領域公知。合適的發(fā)酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖或寡糖)直接或間接地發(fā)酵(即,轉(zhuǎn)化)成所需的發(fā)酵產(chǎn)品。產(chǎn)生乙醇的細菌和真菌發(fā)酵生物體的實例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。能發(fā)酵C6糖的發(fā)酵微生物的實例包括細菌和真菌生物體,如酵母。優(yōu)選的酵母包括酵母屬菌種,優(yōu)選釀酒酵母。能發(fā)酵C5糖的發(fā)酵生物體的實例包括細菌和真菌生物體,如酵母。優(yōu)選的C5發(fā)酵酵母包括畢赤酵母屬,優(yōu)選樹干畢赤酵母(Pichiastipitis)的菌株,如樹干畢赤酵母CBS5773;假絲酵母屬,優(yōu)選博伊丁假絲酵母(Candidaboidinii)、蕓薹假絲酵母(Candidabrassicae)、休哈塔假絲酵母(Candidasheatae)、迪丹斯假絲酵母(Candidadiddensii)、假熱帶假絲酵母(Candidapseudotropicalis)或產(chǎn)朊假絲酵母(Candidautilis)的菌株。其它發(fā)酵生物體包括發(fā)酵單胞菌屬(Zymomonas),如運動發(fā)酵單胞菌(Zymomonasmobilis);漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克魯維酵母屬,如脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);和大腸桿菌的菌株,特別是已經(jīng)經(jīng)過遺傳修飾而改進乙醇產(chǎn)量的大腸桿菌菌株。在一個優(yōu)選的方面,酵母是酵母屬菌種。在一個更優(yōu)選的方面,酵母是釀酒酵母。在另一個更優(yōu)選的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一個更優(yōu)選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一個優(yōu)選的方面,酵母是克魯維酵母屬。在另一個更優(yōu)選的方面,酵母是馬克斯克魯維酵母(Kluyveromycesmarxianus)0在另一個更優(yōu)選的方面,酵母是脆壁克魯維酵母。在另一個優(yōu)選的方面,酵母是假絲酵母屬。在另一個更優(yōu)選的方面,酵母是博伊丁假絲酵母。在另一個更優(yōu)選的方面,酵母是蕓薹假絲酵母。在另一個更優(yōu)選的方面,酵母是迪丹斯假絲酵母。在另一個更優(yōu)選的方面,酵母是假熱帶假絲酵母。在另一個更優(yōu)選的方面,酵母是產(chǎn)朊假絲酵母。在另一個優(yōu)選的方面,酵母是棒孢酵母屬(Clavispora)。在另一個更優(yōu)選的方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一個更優(yōu)選的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一個優(yōu)選的方面,酵母是管囊酵母屬(Pachysolen)。在另一個更優(yōu)選的方面,酵母是嗜鞣管囊酵母(Pachysolentannophilus)0在另一個優(yōu)選的方面,酵母是畢赤酵母屬。在另一個更優(yōu)選的方面,酵母是樹干畢赤酵母。在另一個優(yōu)選的方面,酵母是酒香酵母屬(Bretarmomyces)。在另一個更優(yōu)選的方面,酵母是克勞森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanol.ProductionandUtilization,ffyman,C.E.編,Taylor&Francis,Washington,DC,179-212)。能有效地將己糖和戊糖發(fā)酵成乙醇的細菌包括,例如,運動發(fā)酵單胞菌和熱纖維梭菌(Clostridiumthermocellum)(Philippidis,1996,見上文)。在一個優(yōu)選的方面,細菌是發(fā)酵單胞菌屬。在更優(yōu)選的方面,細菌是運動發(fā)酵單胞菌。在另一個優(yōu)選的方面,細菌是梭菌屬。在另一個更優(yōu)選的方面,細菌是熱纖維梭菌。商業(yè)上可得到的適合乙醇產(chǎn)生的酵母包括,例如ETHANOLRED酵母(可從RedStar/Lesaffre,USA獲得)、FALI(可從Fleischmann,sYeast,USA獲得)、SUPERSTART和THERMOSACC新鮮酵母(可從KhmolTechnology,WI,USA獲得)、BI0FERMAFT和XR(可從NABC-NorthAmericanBioproductsCorporation,GA,USA獲得)、GERTSTRAND(可從GertStrandAB,Sweden獲得)和FERMI0L(可從DSMSpecialties獲得)。在一個優(yōu)選的方面,發(fā)酵微生物已經(jīng)經(jīng)過遺傳修飾,提供發(fā)酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通過將異源基因克隆入多種發(fā)酵微生物已經(jīng)構(gòu)建了能將己糖和戊糖轉(zhuǎn)化成乙醇(共發(fā)酵)的生物體(Chen禾口Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,App1.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,App1.Environ.Microbiol.64:1852-1859;Kotter禾口Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,F(xiàn)EMSYeastResearch4655-664;Beall1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470;WO2003/062430,xyloseisomerase)0在一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是釀酒酵母。在另一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是運動發(fā)酵單胞菌。在另一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是大腸桿菌。在另一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是產(chǎn)酸克雷伯氏菌(Klebsiellaoxytoca)0在另一個優(yōu)選的方面,所述經(jīng)遺傳修飾的發(fā)酵微生物是克魯維酵母菌種。本領域中公知的是,上述生物體還能用于產(chǎn)生其它物質(zhì),如本文所述。通常向降解的木素纖維素或水解物加入發(fā)酵微生物,并進行約8至約96小時,如約M至約60小時發(fā)酵。溫度通常為約至約60°C,特別是約32°C或50°C,并且在約pH3至約pH8,如約pH4-5、6或7。在一個優(yōu)選的方面,對降解的纖維素材料施用酵母和/或另一種微生物,并進行約12至約96小時,如通常為M-60小時發(fā)酵。在一個優(yōu)選的方面,溫度優(yōu)選為約20°C至約60°C,更優(yōu)選約25°C至約50°C,并且最優(yōu)選約32°C至約50°C,特別是約32°C或50°C,并且PH通常為約pH3至約pH7,優(yōu)選約pH4_7。然而,一些發(fā)酵生物體例如細菌,具有更高的最適發(fā)酵溫度。酵母或另一種微生物優(yōu)選以約IO5-IO12,優(yōu)選約IO7-IOiq,特別是約&IO8活細胞計數(shù)每ml發(fā)酵液的量施用。關于使用酵母進行發(fā)酵的進一步指導可以在例如“TheAlcoholTextbook,,(K.Jacques,Τ.P.Lyons禾口D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdom1999)中找到,其通過提述并入本文。對于乙醇生產(chǎn),在發(fā)酵后蒸餾發(fā)酵的漿料以提取乙醇。根據(jù)本發(fā)明的方法獲得的乙醇可以用作,例如燃料乙醇;飲料乙醇,即,中性飲料酒,或工業(yè)乙醇。發(fā)酵刺激劑可以與本文所述的任何方法組合使用,以進一步改進發(fā)酵工藝,而且特定地,改進發(fā)酵微生物的性能,如,速率增加和乙醇得率?!鞍l(fā)酵刺激劑”指用于發(fā)酵微生物(特別是酵母)生長的刺激劑。優(yōu)選的用于生長的發(fā)酵刺激劑包括維生素和礦物質(zhì)。維生素的實例包括多種維生素、生物素、泛酸(鹽)、煙酸、內(nèi)消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、對氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D禾口Ε。參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通過提述并入本文。礦物質(zhì)的實例包括能夠提供營養(yǎng)物的礦物質(zhì)和礦物質(zhì)鹽,所述營養(yǎng)物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。發(fā)酵產(chǎn)物發(fā)酵產(chǎn)物可以是源自發(fā)酵的任何物質(zhì)。發(fā)酵產(chǎn)物可以是,不限于,醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3_丙二醇、山梨醇和木糖醇);有機酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);和氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(C0))。發(fā)酵產(chǎn)物還可以是作為高價值產(chǎn)品的蛋白質(zhì)。在一個優(yōu)選的方面,發(fā)酵產(chǎn)物是醇??衫斫獾氖?,術(shù)語“醇”包括包含一個或多個羥基基團的物質(zhì)。在更優(yōu)選的方面,所述醇是阿拉伯醇。在另一個更優(yōu)選的方面,所述醇是丁醇。在另一個更優(yōu)選的方面,所述醇是乙醇。在另一個更優(yōu)選的方面,所述醇是甘油。在另一個更優(yōu)選的方面,所述醇是甲醇。在另一個更優(yōu)選的方面,所述醇是1,3_丙二醇。在另一個更優(yōu)選的方面,所述醇是山梨醇。在另一個更優(yōu)選的方面,所述醇是木糖醇。參見,例如,Gong,C.S.,Cao,N.J.,Du,J.,禾口Tsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,Μ.M.,禾口Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,禾口Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji,Τ.C.,Qureshi,N.禾口Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是有機酸。在另一個更優(yōu)選的方面,所述有機酸是乙酸。在另一個更優(yōu)選的方面,所述有機酸是醋酮酸。在另一個更優(yōu)選的方面,所述有機酸是己二酸。在另一個更優(yōu)選的方面,所述有機酸是抗壞血酸。在另一個更優(yōu)選的方面,所述有機酸是檸檬酸。在另一個更優(yōu)選的方面,所述有機酸是2,5-二酮-D-葡糖酸。在另一個更優(yōu)選的方面,所述有機酸是甲酸。在另一個更優(yōu)選的方面,所述有機酸是反丁烯二酸。在另一個更優(yōu)選的方面,所述有機酸是葡糖二酸。在另一個更優(yōu)選的方面,所述有機酸是葡糖酸。在另一個更優(yōu)選的方面,所述有機酸是葡糖醛酸。在另一個更優(yōu)選的方面,所述有機酸是戊二酸。在另一個優(yōu)選的方面,所述有機酸是3-羥基丙酸。在另一個更優(yōu)選的方面,所述有機酸是衣康酸。在另一個更優(yōu)選的方面,所述有機酸是乳酸。在另一個更優(yōu)選的方面,所述有機酸是蘋果酸。在另一個更優(yōu)選的方面,所述有機酸是丙二酸。在另一個更優(yōu)選的方面,所述有機酸是草酸。在另一個更優(yōu)選的方面,所述有機酸是丙酸。在另一個更優(yōu)選的方面,所述有機酸是琥珀酸。在另一個更優(yōu)選的方面,所述有機酸是木糖酸。參見,例如,Chen,R.,禾口Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63—65:435_4480在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是酮??衫斫獾氖切g(shù)語“酮”涵蓋含有一個或多個酮基的物質(zhì)。在另一個更優(yōu)選的方面,所述酮是丙酮。參見,例如,Qureshi和Blaschek.2003,見上文。在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是氨基酸。在另一個更優(yōu)選的方面,所述有機酸是天冬氨酸。在另一個更優(yōu)選的方面,所述氨基酸是谷氨酸。在另一個更優(yōu)選的方面,所述氨基酸是甘氨酸。在另一個更優(yōu)選的方面,所述氨基酸是賴氨酸。在另一個更優(yōu)選的方面,所述氨基酸是絲氨酸。在另一個更優(yōu)選的方面,所述氨基酸是蘇氨酸。參見,例如,Richard,Α.,禾口Margaritis,Α.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是氣體。在另一個更優(yōu)選的方面,所述氣體是甲烷。在另一個更優(yōu)選的方面,所述氣體是H2。在另一個更優(yōu)選的方面,所述氣體是C02。在另一個更優(yōu)選的方面,所述氣體是CO。參見,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.于BiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview?;厥???梢允褂帽绢I域已知的任何方法,任選地從發(fā)酵培養(yǎng)基回收發(fā)酵產(chǎn)物,所述方法包括,但不限于,層析、電泳方法、差示溶解度、蒸餾或提取。例如,通過常規(guī)蒸餾方法從發(fā)酵的纖維素材料分離并純化醇。可以獲得純度高達約96ν01%的乙醇,其能用作,例如,燃料乙醇、飲用乙醇,即,中性飲料酒,或工業(yè)乙醇。信號月太本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含SEQIDNO2的氨基酸1到17或SEQIDNO4的氨基酸1至17,或者所述信號肽由SEQIDNO2的氨基酸1到17或SEQIDNO4的氨基酸1至17組成。所述多核苷酸還可包含編碼蛋白質(zhì)的基因,其可操作地連接于所述信號肽。所述蛋白質(zhì)優(yōu)選對于所述信號肽是外源的。本發(fā)明還涉及包含此種多核苷酸的核酸構(gòu)建體、表達載體和重組宿主細胞。本發(fā)明還涉及產(chǎn)生蛋白質(zhì)的方法,包括(a)培養(yǎng)包含此種多核苷酸的重組宿主細胞;和(b)回收所述蛋白質(zhì)。所述蛋白質(zhì)對于宿主細胞可以是天然的或異源的。術(shù)語“蛋白質(zhì)”在本文的意思不是指特定長度的編碼產(chǎn)物,并且因此包含肽、寡肽和多肽。術(shù)語“蛋白質(zhì)”還包含組合以形成編碼產(chǎn)物的兩種或更多種多肽。所述蛋白質(zhì)還包括雜合多肽和融合多肽。優(yōu)選地,所述蛋白質(zhì)是激素或其變體、酶、受體或其部分、抗體或其部分,或報道蛋白(reporter)。例如,所述蛋白質(zhì)可為氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶(lyase)、異構(gòu)酶或連接酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶?;蚩梢詮娜魏卧?、真核或其它來源獲得。通過以下實施例進一步對本發(fā)明進行描述,但不應將其理解為對本發(fā)明范圍的限制。實施例作為緩沖液和底物使用的化學品是至少試劑等級的商業(yè)產(chǎn)品。培養(yǎng)基YG瓊脂平板由5.Og的Difco粉末狀酵母提取物,10.Og的葡萄糖,20.Og的瓊脂和去離子水至1升組成。PDA平板由39克的馬鈴薯右旋糖瓊脂和去離子水至1升組成?;九囵B(yǎng)基平板由6g的NaNO3,0.52g的KCl,1.52g的Iffl2PO4,Iml的COVE微量元素溶液,20g的Noble瓊脂,20ml的50%葡萄糖,2.5mlofMgSO4·7H20,20ml的0·02%生物素溶液,和去離子水至1升組成。COVE微量元素溶液由0.04g的Na2B4O7·IOH20,0.4g的CuSO4·5H20,1.2g的FeSO4·7Η20,0·7g的MnSO4·H20,0.8g的Na2MoO2·2H20,IOg的ZnSO4·7H20,和去離子水至1升組成。YPM培養(yǎng)基包含2%的酵母提取物,2%的蛋白胨和的麥芽糖。實施例1:Thielaviahyrcania菌株NN045178和NN045097的分離Thielaviahyrcania菌株NN045178和NN045097是在1999年3月9日在中國云南收集的土壤樣品中分離出的。所述菌株是通過將土壤懸液施于YG瓊脂平板,然后在45°C溫育3-5日,并進一步純化真菌菌落而分離出的。所述菌株是通過形態(tài)特征和對內(nèi)部轉(zhuǎn)錄間隔物(internaltranscribedspacer,ITS)區(qū)的DNA測序而鑒定的。ThielaviahyrcaniaNN045178保藏于中國微生物菌種保藏管理委員會普通微生物中心,并指定保藏號CGMCC0864。實施例2=ThielaviahyrcaniaNN045178和NN045097基因組DNA的提取將Thielaviahyrcania菌株NN045178和NN045097二者分別在45°C在PDA瓊脂平板上生長3日。分別將菌絲體直接從瓊脂平板收集至經(jīng)滅菌的白(motar),并在液氮下凍結(jié)。通過杵臼將凍結(jié)的菌絲體粉碎為細粉,并使用DNEASYPlantMiniKit(QIAGENInc.,Valencia,CA,USA)分離基因組DNA。實施例3從Thielaviahyrcania菌株NN045178和NN045097分離全長家族6纖維二糖水解酶基因通過使用下示探針的PCR篩選從ThielaviahyrcaniaNN045178鑒定出了家族6纖維二糖水解酶基因的部分序列,所述探針來源于已知的家族6纖維二糖水解酶基因的保守區(qū)。引物CBHIIDF1:t(gt)cc(tc)ga(tc)eg(tc)ga(tc)tg(tc)gc(SEQIDNO5)引物CBHIIDR2:tc(ag)ccacc(gt)ggctt(gt)a(tc)cca(SEQIDNO:6)使用GenomeWalkingKit(TakaraBioInc.,Seta3—4—1,0tsu,Shiga,520—2193,Japan)依照生產(chǎn)商的指示從HiielaviahyrcaniaNN045178分離了全長家族6纖維二糖水解酶基因。簡言之,使用來自iThielaviahyrcaniaNN045178的總基因組DNA作為模板以供PCR擴增該基因的5’端和3’端。將下示的兩個基因特異性引物用于每次克隆,一個用于初級PCR而另一個用于次級PCR。引物是基于來自ThielaviahyrcaniaNN045178的家族6纖維二糖水解酶基因的部分序列而設計的。引物CBHII45178DPH5,-AACTACGACGAGAAGCACTACGTCGAG-3,(SEQIDNO7)引物CBHII45178DPf35,-AGCTCCTGGATGCCTTTGTCTGGA-3,(SEQIDNO8)引物CBHII45178DPasl5,-AGGCGTTGTAGTTGGCGACGTTG-3,(SEQIDNO9)引物CBHII45178DPas35,-CAATCGAGAACTCGCCGTTGGA-3,(SEQIDNO10)初級擴增反應物(amplification)由作為模板的2μ1基因組DNA,各2.5mM的dATP、dTTP、dGTP和dCTP,IOOpmol的AP2(TakaraBioInc.,Seta3-4-1,Otsu,Shiga,520-2193,Japan),和IOpmol的用于5,端克隆的引物CBHII45178DPasl或IOpmol的用于3,端克隆的引物CBHII45178DPfl,5y1的IOXLAPCRBufferII(TakaraBioInc.,Seta3-4-1,Otsu,Shiga,520-2193,Japan),和2.5單位的TakaRaLATaqDNA聚合酶(TakaraBioInc.,Seta3-4-1,Otsu,Shiga,520-2193,Japan)組成,終體積為50μL·擴增使用PeltierThermalCycler(Bio-RadLaboratories,Inc.Hercules,CA,USA)進行,禾呈序如下在94°C預變性1分鐘,并在98°C預變性1分鐘;五個循環(huán),每循環(huán)在94°C變性30秒;在60°C退火1分鐘,和在72°C延伸2分鐘;一個循環(huán),每循環(huán)在94°C變性30秒;在25°C退火3分鐘,和在72°C延伸2分鐘;十五次重復,每次為兩個循環(huán),每循環(huán)在94°C進行30秒;62°C進行1分鐘和在72°C進行2分鐘;接著一個循環(huán),每循環(huán)在94°C進行30秒;44°C進行1分鐘;和72°C進行2分鐘;和72°C最終延伸10分鐘。然后加熱塊進入4°C浸泡循環(huán)。次級擴增反應物由作為模板的2μ1的20Χ稀釋的初級PCR產(chǎn)物,各2.5mM的dATP、dTTP、dGTP和dCTP,IOOpmol的AP2,和IOpmol的用于5,端克隆的引物CBHII45178DPas3或IOpmol的用于3,端克隆的引物CBHII45178DPf3,5y1的IOXLAPCRBufferII,和2.5單位的TakaRaLATaqDNA聚合酶組成,終體積為50μ1。擴增使用PeltierThermalCycler進行,程序如下十五次重復,每次為2個循環(huán),每循環(huán)94°C進行30秒;62°C進行1分鐘,72°C進行2分鐘;接著1個循環(huán),每循環(huán)94°C進行30秒;44°C進行1分鐘;72°C進行2分鐘;和72°C最終延伸10分鐘。然后加熱塊進入4°C浸泡循環(huán)。將反應產(chǎn)物通過使用90mMTris-硼酸和ImMEDTA(TBE)緩沖液的1.0%瓊脂糖凝膠電泳分離,由此從凝膠切出來自3’端克隆反應的600bp產(chǎn)物條帶和來自5’端克隆反應的1.Ikb產(chǎn)物條帶,將其使用illustraGFXPCRDNAandGelBandPurificationKit(GEHealthcare,Buckinghamshire,UK)依照生產(chǎn)商的指示純化,并通過使用3730XLDNAAnalyzer(AppliedBiosystemsInc,F(xiàn)osterCity,CA,USA)的DNA測序來確證。因為ThielaviahyrcaniaNN045097的另一個家族6纖維二糖水解酶基因的部分序列顯示與iThielaviahyrcaniaNN045178纖維二糖水解酶基因具有高同一性(97%),使用與克隆HiielaviahyrcaniaNN045178纖維二糖水解酶相同的引物對克隆了ThielaviahyrcaniaNN045097的家族6纖維二糖水解酶的全長基因。實施例4編碼家族6纖維二糖水解酶的ThielaviahyrcaniaNN045097和NN045178基因組序列的表征全長ThielaviahyrcanieaNN045097家族6纖維二糖水解酶基因的核苷酸序列是1598bp,包含終止密碼子。成熟蛋白的推定的蛋白序列顯示與來自特異腐質(zhì)霉的外切葡聚糖酶GH6A(uniprot:Q9C1S9)的相似性。全長ThielaviahyrcanieaNN045097家族6纖維二糖水解酶基因的核苷酸序列(SEQIDNO1)和推定的氨基酸序列(SEQIDNO2)示于圖1。該基因組片段編碼493個氨基酸的多肽,由兩個各58bp的內(nèi)含子分隔?;蚝统墒炀幋a序列的%G+C含量各為65.7%。使用SignalP軟件程序(Nielsen等,1997,見上),預測了17個殘基的信號肽。預測的成熟蛋白含有476個氨基酸,具有50.OkDa的預測分子量。使用Needleman-Wunsch算法(Needleman和Wunsch,1970,見上)確定了氨基酸序列的比較性逐對全局比對(comparativepairwiseglobalalignment),所述算法在EMBOSS的Needle程序中以缺口開放罰分為10,缺口延伸罰分為0.5和EBL0SUM62矩陣執(zhí)行。比對顯示編碼成熟多肽的ThielaviahyrcanieaNN045097家族6纖維二糖水解酶基因的推定氨基酸序列與兩個木素纖維素酶蛋白的推定氨基酸序列(W02008/095033;GenekqP登錄號分別為ASR94104和ASR94110)具有84.和83.7%同一性(排除缺口)。全長ThielaviahyrcanieaNN045178家族6纖維二糖水解酶基因的核苷酸序列是1584bp,包含終止密碼子。成熟蛋白的推定的蛋白序列顯示與來自特異腐質(zhì)霉的外切葡聚糖酶GH6A(uniprot:Q9C1S9)的相似性。全長ThielaviahyrcanieaNN045178家族6纖維二糖水解酶基因的核苷酸序列(SEQIDNO3)和推定的氨基酸序列(SEQIDNO:4)示于圖2。該基因組片段編碼487個氨基酸的多肽,由兩個為59和61bp的內(nèi)含子分隔?;蚝统墒炀幋a序列的%G+C含量各為65.4%。使用SignalP軟件程序(Nielsen等,1997,見上),預測了17個殘基的信號肽。預測的成熟蛋白含有470個氨基酸,具有49.5kDa的預測分子量。使用Needleman-Wunsch算法(Needleman和Wunsch,1970,見上)確定了氨基酸序列的比較性逐對全局比對(comparativepairwiseglobalalignment),所述算法在EMBOSS的Needle程序中以缺口開放罰分為10,缺口延伸罰分為0.5和EBL0SUM62矩陣執(zhí)行。比對顯示編碼成熟多肽的ThielaviahyrcanieaNN045178家族6纖維二糖水解酶基因的推定氨基酸序列與兩個木素纖維素酶蛋白的推定氨基酸序列(W02008/095033;GenekqP登錄號分別為ASR94104和ASR94110)具有85.3%和83.6%同一性(排除缺口)。實施例5:ThielaviahyrcaniaNN045178家族6纖維二糖水解酶基因的克隆和米曲霉表達載體的構(gòu)建設計了下述兩個合成的寡核苷酸引物以PCR擴增來自實施例2中制備的基因組DNA的ThielaviahyrcaniaNN045178纖維二糖水解酶基因。使用IN-FUMONCFDry-downCloningKit(ClontechLaboratories,Inc.,MountainView,CA,USA)以將該片段直接克隆入表達載體PPFJ0355,無需限制性消化和連接。表達載體pPFJ0355含有米曲霉TAKAα-淀粉酶啟動子和黑曲霉葡糖淀粉酶終止子。此外,PPFJ0355具有用于在大腸桿菌中選擇和繁殖的PUC18來源的序列,以及pyrG基因,其編碼來源于構(gòu)巢曲霉的乳清苷脫羧酶以供選擇PyrG突變體曲霉屬菌株的轉(zhuǎn)化體。H_45178_IFNbam5,-ACACAACTGGGGATCCACCATGGCCAAGAAGCTCCTTCTCACC-3,(SEQIDNO11)H_45178_IFCbgl5,-GTCACCCTCTAGATCTCTAAAAAGGAGGGTTGGCGTTGG-3,(SEQIDNO12)粗體字母代表編碼序列。剩余序列與PPFJ0355的插入位點同源。將上述引物各十皮摩爾用于PCR,其由ThielaviahyrcaniaNN045178基因組DNA,10yl的5XGCBuffer(Finnzymes0y,Espoo,Finland),1·5μ1的DMS0,各2.5mM的dATP、dTTP、dGTP和dCTP,和1單位的PHUSI0NHigh-FidelityDNAPolymerase(FinnzymesOy,Espoo,Finland),會冬#150μ1。曾PeltierThermalCycler進行,程序如下1個循環(huán),每循環(huán)在98°C進行1分鐘;5個循環(huán),每循環(huán)在98°C變性15秒,在63°C退火30秒,每循環(huán)增加1°C,并在72°C延伸80秒;和另外25個循環(huán),每循環(huán)在98°C進行15秒,和在72°C進行80秒;在72°C最終延伸10分鐘。然后加熱塊進入4°C浸泡循環(huán)。將反應產(chǎn)物通過使用TBE緩沖液的1.0%瓊脂糖凝膠電泳進行分離,由此從凝膠切出大約1.81Λ的產(chǎn)物條帶,并將其使用illustraGFXPCRDNAandGelBandPurificationKit依照生產(chǎn)商的指示進行純化。將質(zhì)粒pPFJ0355用BamI和Bgl11消化,通過使用TBE緩沖液的1.0%瓊脂糖凝膠電泳進行分離,并使用illustraGFXPCRDNAandGelBandPurificationKit依照生產(chǎn)商的指示進行純化。使用IN-FUSIONCFDry-downPCRCloningKit將基因片段和經(jīng)消化的載體連接在一起,得到PCBHII45178(圖幻,其中纖維二糖水解酶的轉(zhuǎn)錄處于米曲霉TAKAα-淀粉酶啟動子調(diào)控之下。簡言之,將30ng用BamHI和BglII消化的pPFJ0355,和80ng的ThielaviahyrcaniaNN045178家族6纖維二糖水解酶基因純化PCR產(chǎn)物添加至反應瓶中,并添加去離子水重懸至10μ1的終體積。將反應物在37°C溫育15分鐘然后在50°C溫育15分鐘。使用3μ1反應物以轉(zhuǎn)化大腸桿菌Τ0Ρ10感受態(tài)細胞(TIANGENBiotech(Beijing)Co.Ltd.,Beijing,China)。通過菌落PCR檢測含有pCBHII45178的大腸桿菌轉(zhuǎn)化體,并使用QIAprepSpinMiniprepKit(QIAGENInc.,Valencia,CA,USA)制備質(zhì)粒DNA。通過使用3730XLDNAAnalyzer(AppliedBiosystemsInc,F(xiàn)osterCity,CA,USA)的DNA測序確證在pCBHII45178中的ThielaviahyrcaniaNN045178家族6纖維二糖水解酶基因插入。^MpGEM-TVectorSystem(PromegaCorporation,Madison,WI,USA)才目同的PCR片段克隆入載體pGEM-T(PromegaCorporation,Madison,WI,USA)以生成pGEM-T-CBHII45178(圖4)。如上所述通過DNA測序確證T-CBHII45178中的ThielaviahyrcaniaNN045178家族6纖維二糖水解酶基因插入。將大腸桿菌T-CBHII45178于2009年5月20日保藏于德意志微生物和細胞培養(yǎng)保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH,DSM),并指定登錄號DSM22599。實施例6來自ThielaviahyrcaniaNN045097的家族6纖維二糖水解酶基因的克隆和米曲霉表達載體的構(gòu)建根據(jù)實施例5中所述的相同方法進行來自ThielaviahyrcaniaNN045097的家族6纖維二糖水解酶基因的克隆。使用實施例5中所述的兩個合成寡核苷酸引物(H45178IFNbam和H_45178_IFCbgl)以供PCR擴增來自ThielaviahyrcaniaNN045097的全長家族6纖維二糖水解酶基因。將上述引物各十皮摩爾用于PCR,其由ThielaviahyrcaniaNN045097基因組DNA,10μ1的5ΧGCBuffer,1.5μ1的DMSO,各2.5mM的dATP、dTTP、dGTP和dCTP,和1單位的PHUSI0NHigh-FidelityDNAPolymerase組成,終體積為50μ1。擴增使用PeltierThermalCycler進行,程序如下1個循環(huán),每循環(huán)在98°C進行1分鐘;10個循環(huán),每循環(huán)在98°C變性15秒,在62°C退火30秒,每循環(huán)增加1°C,并在72°C延伸80秒;和另外25個循環(huán),每循環(huán)在98°C進行15秒,和在72°C進行80秒;在72°C最終延伸10分鐘。然后加熱塊進入4°C浸泡循環(huán)。將反應產(chǎn)物通過使用TBE緩沖液的1.0%瓊脂糖凝膠電泳進行分離,由此從凝膠切出大約1.81Λ的產(chǎn)物條帶,并將其使用illustraGFXPCRDNAandGelBandPurificationKit依照生產(chǎn)商的指示進行純化。將質(zhì)粒pPFJ0355用BamI和BglII消化,通過使用TBE緩沖液的1.0%瓊脂糖凝膠電泳進行分離,并使用illustraGFXPCRDNAandGelBandPurificationKit依照生產(chǎn)商的指示進行純化。使用IN-FUSIONCFDry-downPCRCloningKit將基因片段和經(jīng)消化的載體連接在一起,得到pCBHII45097(圖幻,其中纖維二糖水解酶的轉(zhuǎn)錄處于米曲霉TAKAa-淀粉酶啟動子調(diào)控之下。簡言之,將30ng用BamHI和BglII消化的pPFJ0355,和80ng的ThielaviahyrcaniaNN045097家族6纖維二糖水解酶基因純化PCR產(chǎn)物添加至反應瓶中,并添加去離子水重懸至10μ1的終體積。將反應物在37°C溫育15分鐘然后在50°C溫育15分鐘。使用3μ1反應物以轉(zhuǎn)化大腸桿菌T0P10感受態(tài)細胞。通過菌落PCR檢測含有PCBHII45097的大腸桿菌轉(zhuǎn)化體,并使用QIApr印SpinMiniprepKit制備質(zhì)粒DNA。通過使用3730XLDNAAnalyzer的DNA測序確證在pCBHII45178中的ThielaviahyrcaniaNN045097家族6纖維二糖水解酶基因插入。使用pGEM-TVectorSystem將相同的PCR片段克隆入載體pGEM-T以生成pGEM-T-CBHII45097(圖6)。如上所述通過DNA測序確證pGEM-T_CBHII45097中的ThielaviahyrcaniaNN045097家族6纖維二糖水解酶基因插入。將大腸桿菌T-CBHI145097于2009年5月20日保藏于德意志微生物和細胞培養(yǎng)保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH,DSM),并指定登錄號DSM22598。實施例7在米曲霉HowBIOI中表達ThielaviahyrcaniaNN045178和NN45097家族6纖維二糖水解酶基因根據(jù)Christensen等,1988,Bio/Technology6:1419-1422的方法制備米曲霉HowBIOI(W095/35385)原生質(zhì)體。使用3μg的pCBHII45178或pCBHII45097轉(zhuǎn)化米曲霉HOWBIOI原生質(zhì)體。用pCBHII45178或pCBHII45097轉(zhuǎn)化米曲霉HowBIOI生成了各約50個轉(zhuǎn)化體。將來自每種轉(zhuǎn)化的四個轉(zhuǎn)化體分離至單獨的基本培養(yǎng)基平板。將來自每種轉(zhuǎn)化的四個轉(zhuǎn)化體分別接種入M孔板中的3ml的YPM培養(yǎng)基,并以150rpm振蕩在30°C溫育。在3日溫育之后,在NUPAGENOVEX4-12%Bis-TrisGel上用MESanvitrogenCorporation,Carlsbad,CA,USA)依照生產(chǎn)商的指示分析來自每個培養(yǎng)的20μ1上清。用INSTANTBLUE(ExpedeonLtd.,BabrahamCambridge,UK)對所得的凝膠進行染色。培養(yǎng)物的SDS-PAGE分布顯示多數(shù)轉(zhuǎn)化體對于兩個基因均在大約70kDa處產(chǎn)生主要蛋白條帶。將攜帶ThielaviahyrcaniaNN045178家族6纖維二糖水解酶基因和ThielaviahyrcaniaNN045097家族6纖維二糖水解酶基因的表達菌株分別命名為EXP02989和EXP03004。將對于命名為EXP02989的轉(zhuǎn)化體4和EXP03004的轉(zhuǎn)化體16的每個表達菌株的斜面(slant)用IOml的YPM培養(yǎng)基洗滌,并將每個菌株接種入含有400ml的YPM培養(yǎng)基的2升燒瓶以生成培養(yǎng)液以表征每種酶。在第3日收獲培養(yǎng)物,并使用0.45μmDURAPOREMembrane(Millipore,Bedford,MA,USA)iiifiliit。實施例8:ThielaviahyrcaniaeNN045178CEL6A纖維二糖水解酶的表征對PASC的活性測定制備PASC漿料儲液,即用水潤濕5g的AVICEL(JRSPharmaLP,Patterson,NY,USA),接著添加150ml的冰冷85%正磷酸。將懸液在冰浴中緩慢攪拌1小時。然后一邊攪拌一邊添加500ml的冰冷丙酮。使用MIRACLOTH(Calbiochem,LaJolla,CA,USA)過濾漿料,然后用IOOml的冰冷丙酮洗滌三次(在每次洗滌之后盡可能地傾干)。最后,用500ml的水洗滌兩次經(jīng)過濾的漿料,并且在每次洗滌之后盡可能地傾干。將PASC與去離子水混合以IOg/升的濃度至500ml的總體積,混合均勻(使用ULTRA-TURRAXHomogenize!·,Cole-Parmer,VernonHills,IL,USA),并在冷藏箱中儲藏至最長一個月。用50mM乙酸鈉pH5.0緩沖液稀釋PASC儲液至2g/升的濃度,并將其用作底物。向150μ1的PASC儲液,添加20μ1的酶樣品,并將反應混合物以850rpm振蕩溫育60分鐘。在溫育結(jié)束時,添加50μ1的2%NaOH以終止反應。將反應混合物以1,OOOxg離心。測量釋放出的糖,即首先將10μ1的反應混合物與90μ1的0.4%NaOH混合,接著與50μ1的2%NaOH中的1.5%對羥基苯甲酸酰胼(PHBAH,SigmaChemicalCo.,St.Louis,MO,USA)混合。將混合物在100°C煮沸5分鐘,然后將100μ1轉(zhuǎn)移至微滴定板以供在410nm處的吸光度讀數(shù)(SpectraMaxM2,MoleculardevicesSunnyvale,CA,USA)。制備空白,即在水解步驟中略去PASC,并在糖確定步驟中用緩沖液替代水解物。DH分布。在微滴定板中,將20μ1的每種纖維二糖水解酶(ΕΧΡ02989或ΕΧΡ03004)與120μ1的緩沖液(IOOmM琥珀酸,HEPES、CHES或CAPSOjnimMCaCl2,150mMKCl和0.01%TRITONX-100;pH用NaOH和HCl調(diào)整)在pH3、4、5、6、7或8混合,接著添加30μ1的IOg/升PASC。在反應之前將混合物置于冰上。通過將微滴定板轉(zhuǎn)移至設置為50°C的EPPENDORF熱混合器(Eppendorf,Hauppauge,NY,USA)來起始測定,并以850rpm振蕩溫育60分鐘。在溫育結(jié)束時,添加50μ1的2%NaOH以終止反應。將反應混合物以1,OOOxg離心。如上所述測量釋放出的糖。示于圖7的結(jié)果表明纖維二糖水解酶在pH3至11的廣泛pH范圍具有活性。對于每種纖維二糖水解酶的最優(yōu)pH為約pH5至6。DH穩(wěn)定件。將每種纖維二糖水解酶(EXP02989或EXP03004)的40μ1樣品與160μ1的IOOmM緩沖液(pH4,5,6,7或8IOOmM琥珀酸,HEPES,CHES,CAPSO,以及ImMCaCl2,150mMKCl和0.01%TRITONX_100,pH用NaOH和HCl調(diào)整)混合并以850rpm振蕩在50°C溫育。在0、10、30、60和110分鐘去除30μ1的樣品并置于冰上。然后將150μ1的2g/升PASC(在50mM乙酸鈉pH5.0中)添加至每個樣品,并在50°C,以850rpm溫育60分鐘。將30μ1的每種緩沖液作為空白運行。如上所述測量釋放出的糖。示于圖8Α和8Β的結(jié)果表明在50°C溫育110分鐘之后,EXP02989纖維二糖水解酶在pH4、5、6、7和8分別具有90%、96%、96%、90%和39%的剩余活性,而EXP03004纖維二糖水解酶在pH4、5、6、7和8分別具有89%、93%、95%、75%和48%的剩余活性。溫度分布。將在EPPENDORF試管中的150μ1體積的2gPASC每升50mM乙酸鈉pH5.0緩沖液在25、30、40、50、60、70、80、90和100°C預溫育。通過添加各20μ1的每種纖維二糖水解酶(ΕΧΡ02989或ΕΧΡ03004)來起始測定,接著以850rpm振蕩溫育60分鐘。在溫育結(jié)束時,添加50μ1的2%氫氧化鈉以結(jié)束反應,并將反應混合物在1,OOOxg離心。如上所述測量釋放出的糖。示于圖9Α和9Β的結(jié)果表明纖維二糖水解酶在從25至80°C的廣泛溫度范圍具有活性,并在約60°C的溫度表現(xiàn)出具有最優(yōu)活性。溫度穩(wěn)定性。將每種纖維二糖水解酶(EXP02989或EXP03004)(用50mM乙酸鈉pH5緩沖液稀釋)各250μ1樣品在50、60和70°C溫育。在0、10、30、60和110分鐘的時點,移除每種纖維二糖水解酶各20μ1樣品,并置于冰上。然后將150μ1的2g的PASC每升50mM乙酸鈉PH5.0添加至每個樣品,并在50°C溫育60分鐘。在溫育結(jié)束時,添加50μ1的2%NaOH以停止反應。將反應混合物以1,OOOxg離心,如上所述測量釋放出的糖。示于圖IOA和IOB的結(jié)果表明纖維二糖水解酶在50°C是穩(wěn)定的,在60°C較不穩(wěn)定,而在70°C不穩(wěn)定。在60分鐘溫育之后,EXP02989纖維二糖水解酶的剩余活性在50°C為100%,在60°C為53%,而在70°C為40%,而EXP03004纖維二糖水解酶在50°C為100%,在60V為57%,而在70°C為51%。生物材料的保藏下述的生物材料已經(jīng)依據(jù)布達佩斯條約的條款保藏于德意志微生物和細胞培養(yǎng)保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH(DSM)),MascheroderWeg1B,D-38124Braunschweig,Germany,并給予下述的登錄號菌株登錄號保藏日期大腸桿菌T-CBHII45097DSM225982009年5月20日大腸桿菌T-CBHII45178DSM225992009年5月20日所述菌株于下述條件下保藏確保在本專利申請未決期間,依據(jù)該外國專利法律的授權(quán)的人能夠獲得所述培養(yǎng)物。所述保藏物為所保藏菌株的基本上純的培養(yǎng)物。在提交了該申請的副本,或其后續(xù)文本的國家,依據(jù)該外國專利法律可以獲得所述保藏物。然而,應當理解,保藏物的獲得并不構(gòu)成對實施本發(fā)明的許可,實施本發(fā)明是對政府行為所授予的專利權(quán)的侵犯。通過下述編號段落進一步描述本發(fā)明[1]一種具有纖維二糖水解酶活性的分離的多肽,其選自下組(a)多肽,與SEQIDNO:2或SEQIDNO4的成熟多肽具有至少90%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在高嚴格條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)⑴或(ii)的全長互補鏈;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列具有至少90%序列同一性;(d)SEQIDNO2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一個或多個(幾個)氨基酸的變體;和(e)(a)、(b)、(c)或(d)的多肽具有纖維二糖水解酶活性的片段。[2]段1的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少90%序列同一性。[3]段2的多肽,其與SEQIDNO:2或SEQIDNO4的成熟多肽具有至少91%序列同一性。[4]段3的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少92%序列同一性。[5]段4的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少93%序列同一性。[6]段5的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少94%序列同一性。[7]段6的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少95%序列同一性。[8]段7的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少96%序列同一性。[9]段8的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少97%序列同一性。[10]段9的多肽,其與SEQIDNO:2或SEQIDNO:4的成熟多肽具有至少98%序列同一性。[11]段10的多肽,其與SEQIDNO2或SEQIDNO4的成熟多肽具有至少99%序列同一性。[12]段1的多肽,其由多核苷酸編碼,所述多核苷酸在高嚴格條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈。[13]段12的多肽,其由多核苷酸編碼,所述多核苷酸在非常高嚴格條件下與以下雜交(i)SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈。[14]段1的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少90%序列同一性。[15]段14的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少91%序列同一性。[16]段15的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少92%序列同一性。[17]段16的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少93%序列同一性。[18]段17的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少94%序列同一性。[19]段18的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少95%序列同一性。[20]段19的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少96%序列同一性。[21]段20的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少97%序列同一性。[22]段21的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少98%序列同一性。[23]段22的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO1或SEQIDNO3的成熟多肽編碼序列或其cDNA序列具有至少99%序列同一性。[24]段1-23任一項的多肽,包含SEQIDNO:2或SEQIDNO:4,或由SEQIDNO2或SEQIDNO4組成。[25]段1-23任一項的多肽,包含SEQIDNO:2或SEQIDNO:4的成熟多肽,或由SEQIDNO2或SEQIDNO4的成熟多肽組成。[26]段25的多肽,其中所述成熟多肽是SEQIDNO2的氨基酸18至493或SEQIDNO4的氨基酸18至487。[27]段1的多肽,其為SEQIDNO2或SEQIDNO4的片段,其中所述片段具有纖維二糖水解酶活性。[28]段1-27任一項的多肽,其由包含于大腸桿菌DSM22598中的質(zhì)粒pGEM-T-CBHI145097所包含的多核苷酸編碼,或由包含于大腸桿菌DSM22599中的質(zhì)粒PGEM-T-CBHII45178所包含的多核苷酸編碼。[29]一種組合物,包含段1-任一項的多肽。[30]一種分離的多核苷酸,編碼段1-任一項的多肽。[31]一種核酸構(gòu)建體或表達載體,包含段30的多核苷酸,所述多核苷酸可操作地連接于一個或多個(幾個)指導所述多肽在表達宿主中產(chǎn)生的調(diào)控序列。[32]一種重組宿主細胞,包含段30的多核苷酸,所述多核苷酸可操作地連接于一個或多個(幾個)指導所述多肽在表達宿主中產(chǎn)生的調(diào)控序列。[33]一種產(chǎn)生段1-任一項的多肽的方法,包括(a)在有助于所述多肽產(chǎn)生的條件下,培養(yǎng)以其野生型形式產(chǎn)生所述多肽的細胞;和(b)回收所述多肽。[34]一種產(chǎn)生具有纖維二糖水解酶活性的多肽的方法,包括(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)段32的宿主細胞;和(b)回收所述多肽。[35]一種轉(zhuǎn)基因植物、植物部分或植物細胞,其用編碼段1-任一項的多肽的多核苷酸所轉(zhuǎn)化。[36]一種產(chǎn)生具有纖維二糖水解酶活性的多肽的方法,包括(a)在有助于所述多肽的產(chǎn)生的條件下,培養(yǎng)段35的轉(zhuǎn)基因植物或植物細胞;和(b)回收所述多肽。[37]一種產(chǎn)生親本細胞突變體的方法,包括使編碼段1-任一項的多肽的多核苷酸失活,其導致突變體與親本細胞相比產(chǎn)生較少的所述多肽。[38]一種突變體細胞,由段37的方法產(chǎn)生。[39]段38的突變體細胞,進一步包含編碼天然或異源蛋白的基因。[40]一種產(chǎn)生蛋白的方法,包括(a)在有助于產(chǎn)生所述蛋白的條件下培養(yǎng)段39的突變體細胞;和(b)回收所述蛋白。[41]一種雙鏈抑制性RNA(dsRNA)分子,包含段30的多核苷酸的亞序列,其中可選地所述dsRNA是siRNA或miRNA分子。[42]段41的雙鏈抑制性RNA(dsRNA)分子,其長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈核苷酸。[43]一種在細胞中抑制具有纖維二糖水解酶活性的多肽的表達的方法,包括向細胞施用或在細胞中表達段41的雙鏈抑制性RNA(dsRNA)分子。[44]段43的方法,其中所述dsRNA長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈核苷酸。[45]一種細胞,由段43或44的方法產(chǎn)生。W6]段45的細胞,進一步包含編碼天然或異源蛋白的基因。[47]一種產(chǎn)生蛋白的方法,包括(a)在有助于所述蛋白產(chǎn)生的條件下培養(yǎng)段46的細胞;和(b)回收所述蛋白。[48]一種分離的多核苷酸,其編碼信號肽,所述信號肽包含SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至17,或由SEQIDNO2的氨基酸1至17或SEQIDNO:4的氨基酸1至17組成。[49]一種核酸構(gòu)建體或表達載體,其包含編碼蛋白的基因,所述基因可操作地連接于段48的多核苷酸,其中所述基因?qū)τ诰幋a信號肽的多核苷酸是外源的。[50]一種重組宿主細胞,其包含編碼蛋白的基因,所述基因可操作地連接于段48的多核苷酸,其中所述基因?qū)τ诰幋a信號肽的多核苷酸是外源的。[51]一種產(chǎn)生蛋白的方法,包括(a)在有助于產(chǎn)生所述蛋白的條件下培養(yǎng)重組宿主細胞,所述細胞包含編碼蛋白的基因,所述基因可操作地連接于段48的多核苷酸,其中所述基因?qū)τ诰幋a信號肽的多核苷酸是外源的;和(b)回收所述蛋白。[52]一種降解或轉(zhuǎn)化纖維素材料的方法,包括在段118任一項的具有纖維二糖水解酶活性的多肽的存在下用酶組合物處理纖維素材料。[53]段52的方法,其中所述纖維素材料經(jīng)預處理。[54]段52或53的方法,其中所述酶組合物包含一種或多種(幾種)選自下組的纖維素分解酶內(nèi)切葡聚糖酶、纖維二糖水解酶、葡糖苷酶和具有纖維素分解增強活性的多肽。[55]段52-Μ任一項的方法,其中所述酶組合物包含或進一步包含一種或多種(幾種)選自下組的蛋白半纖維素酶、棒曲霉素、酯酶、木質(zhì)素分解酶、果膠酶、過氧化物酶、蛋白酶禾口swollenin。[56]段55的方法,其中所述半纖維素酶是一種或多種(幾種)選自下組的酶乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。[57]段52-56任一項的方法,進一步包括回收經(jīng)降解的纖維素材料。[58]段57的方法,其中所述經(jīng)降解的纖維素材料是糖。[59]段58的方法,其中所述糖選自下組葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。[60]一種產(chǎn)生發(fā)酵產(chǎn)物的方法,包括(a)在段1-任一項的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從發(fā)酵回收所述發(fā)酵產(chǎn)物。[61]段60的方法,其中所述纖維素材料經(jīng)預處理。W2]段60或61的方法,其中所述酶組合物包含一種或多種(幾種)選自下組的纖維素分解酶內(nèi)切葡聚糖酶、纖維二糖水解酶、葡糖苷酶和具有纖維素分解增強活性的多肽。[63]段60-62任一項的方法,其中所述酶組合物包含或進一步包含一種或多種(幾種)選自下組的蛋白半纖維素酶、棒曲霉素、酯酶、木質(zhì)素分解酶、果膠酶、過氧化物酶、蛋白酶禾口swollenin。W4]段63的方法,其中所述半纖維素酶是一種或多種(幾種)選自下組的酶乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。[65]段60-64任一項的方法,其中步驟(a)和(b)在同時糖化和發(fā)酵中同時進行。W6]段60-65任一項的方法,其中所述發(fā)酵產(chǎn)物是醇、有機酸、酮、氨基酸或氣體。[67]一種發(fā)酵纖維素材料的方法,包括用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料在段1-任一項的具有纖維二糖水解酶活性的多肽存在下用酶組合物糖化。[68]段67的方法,其中纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。[69]段68的方法,進一步包括從發(fā)酵回收所述發(fā)酵產(chǎn)物。[70]段67-69任一項的方法,其中所述纖維素材料在糖化之前經(jīng)預處理。[71]段67-70任一項的方法,其中所述酶組合物包含一種或多種(幾種)選自下組的纖維素分解酶內(nèi)切葡聚糖酶、纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。[72]段67-71任一項的方法,其中所述酶組合物包含或進一步包含一種或多種(幾種)選自下組的蛋白半纖維素酶、棒曲霉素、酯酶、木質(zhì)素分解酶、果膠酶、過氧化物酶、蛋白酶禾口swollenin。[73]段72的方法,其中所述半纖維素酶是一種或多種(幾種)選自下組的酶乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。[74]段67-73任一項的方法,其中所述發(fā)酵產(chǎn)物是醇、有機酸、酮、氨基酸或氣體。本文描述和要求保護的本發(fā)明并不局限于本文公開的具體方面的范圍內(nèi),因為這些方面旨在作為本發(fā)明幾個方面的說明。旨在將任何等同的方面包含于本發(fā)明的范圍內(nèi)。實際上,從前面的說明中,除本文所顯示和描述的之外,本發(fā)明的多種修改對于本領域的技術(shù)人員來說是顯而易見的。這些修改也旨在落入所附的權(quán)利要求的范圍內(nèi)。在沖突的情況下,將以包括定義部分的本公開為準。權(quán)利要求1.一種具有纖維二糖水解酶活性的分離的多肽,其選自下組(a)多肽,其與SEQIDNO:2或SEQIDNO:4的成熟多肽具有至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在高嚴格條件下或非常高嚴格條件下與以下雜交(i)SEQIDNO1或SEQIDNO3的成熟多肽編碼序列,(ii)包含于SEQIDNO1或SEQIDN0:3的成熟多肽編碼序列中的cDNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或SEQIDNO:3的成熟多肽編碼序列具有至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性;(d)SEQIDNO:2或SEQIDNO:4的成熟多肽的包含取代、缺失和/或插入一個或多個(幾個)氨基酸的變體;和(e)(a)、(b)、(c)或(d)的多肽具有纖維二糖水解酶活性的片段。2.權(quán)利要求1的多肽,所述多肽由包含于大腸桿菌DSM22598中的質(zhì)粒PGEM-T-CBHII45097所包含的多核苷酸編碼,或由包含于大腸桿菌DSM22599中的質(zhì)粒PGEM-T-CBHII45178所包含的多核苷酸編碼。3.一種組合物,其包含權(quán)利要求1或2的多肽。4.一種分離的多核苷酸,其編碼權(quán)利要求1或2的多肽。5.一種重組宿主細胞,其包含權(quán)利要求4的多核苷酸,所述多核苷酸可操作地連接于一個或多個指導所述多肽的產(chǎn)生的調(diào)控序列。6.一種產(chǎn)生權(quán)利要求1或2的多肽的方法,包括(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)以其野生型形式產(chǎn)生所述多肽的細胞;和(b)回收所述多肽。7.—種產(chǎn)生具有纖維二糖水解酶活性的多肽的方法,包括(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)權(quán)利要求5的宿主細胞;和(b)回收所述多肽。8.—種轉(zhuǎn)基因植物、植物部分或植物細胞,其用編碼段權(quán)利要求1或2的多肽的多核苷酸轉(zhuǎn)化。9.一種產(chǎn)生具有纖維二糖水解酶活性的多肽的方法,包括(a)在有助于所述多肽的產(chǎn)生的條件下培養(yǎng)權(quán)利要求8的轉(zhuǎn)基因植物或植物細胞;和(b)回收所述多肽。10.一種產(chǎn)生親本細胞的突變體的方法,包括使編碼權(quán)利要求1或2的多肽的多核苷酸失活,其導致突變體與親本細胞相比產(chǎn)生較少的所述多肽。11.一種雙鏈抑制性RNA(dsRNA)分子,其包含權(quán)利要求4的多核苷酸的亞序列,其中可選地所述dsRNA是siRNA或miRNA分子。12.—種在細胞中抑制具有纖維二糖水解酶活性的多肽的表達的方法,包括向細胞施用或在細胞中表達權(quán)利要求11的雙鏈抑制性RNA(dsRNA)分子。13.一種分離的多核苷酸,其編碼信號肽,所述信號肽包含SEQIDN0:2的氨基酸1至17或SEQIDNO4的氨基酸1至17,或由SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至17組成。14.一種產(chǎn)生蛋白的方法,包括(a)在有助于產(chǎn)生所述蛋白的條件下培養(yǎng)重組宿主細胞,所述重組宿主細胞包含編碼蛋白的基因,所述基因可操作地連接于權(quán)利要求13的多核苷酸,其中所述基因?qū)τ诰幋a所述信號肽的多核苷酸是外源的;和(b)回收所述蛋白。15.一種降解或轉(zhuǎn)化纖維素材料的方法,包括在權(quán)利要求1或2的具有纖維二糖水解酶活性的多肽的存在下用酶組合物處理所述纖維素材料。16.權(quán)利要求15的方法,進一步包括回收經(jīng)降解的纖維素材料。17.—種產(chǎn)生發(fā)酵產(chǎn)物的方法,包括(a)在權(quán)利要求1或2的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從發(fā)酵回收所述發(fā)酵產(chǎn)物。18.一種發(fā)酵纖維素材料的方法,包括用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中將所述纖維素材料在權(quán)利要求1或2的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化。19.權(quán)利要求18的方法,其中所述纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。20.權(quán)利要求19的方法,進一步包括從發(fā)酵回收所述發(fā)酵產(chǎn)物。全文摘要本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細胞,以及產(chǎn)生和使用所述多肽的方法。文檔編號C12N9/14GK102482652SQ201080034294公開日2012年5月30日申請日期2010年5月27日優(yōu)先權(quán)日2009年6月2日發(fā)明者P.哈里斯,劉曄,吳文平,湯嵐申請人:諾維信公司,諾維信股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
冀州市| 大厂| 大足县| 卓资县| 汤阴县| 五原县| 霍城县| 濉溪县| 木兰县| 宾阳县| 广宗县| 北宁市| 泸西县| 怀仁县| 白河县| 宁强县| 铜梁县| 乡城县| 准格尔旗| 古浪县| 石棉县| 鄂尔多斯市| 盈江县| 嘉义市| 三门峡市| 永福县| 海门市| 奉贤区| 芮城县| 达尔| 株洲县| 安化县| 扎赉特旗| 海门市| 韶关市| 阜新| 马山县| 铁岭市| 绥滨县| 喀什市| 岗巴县|