;以及2008年2月7日提交的美國 專利申請(qǐng)第12/027,885號(hào)中;通過引用將這些參考文獻(xiàn)整體并入本文。
[0109] 如以上所討論的,可在多種應(yīng)用中使用多肽,除了其他以外,諸如:生物燃料的產(chǎn) 生、纖維素分解等等。
[0110] 例如,在一個(gè)實(shí)施方案中,提供了用于處理纖維素的方法。該方法包括培養(yǎng)如本文 所提供的表達(dá)本公開內(nèi)容的嵌合多肽的重組微生物,所述培養(yǎng)在合適的纖維素底物的存在 下且在適于嵌合多肽催化纖維素的條件下進(jìn)行。
[0111] 在又一實(shí)施方案中,在允許嵌合多肽降解纖維素的條件下將本公開內(nèi)容的基本上 純化的嵌合多肽與纖維素底物接觸。在一個(gè)實(shí)施方案中,條件包括從約35至65°C的溫度。
[0112] 如先前所討論的,描述本文中有用的分子生物學(xué)技術(shù),包括載體、啟動(dòng)子及其它相 關(guān)的主題的使用的一般教科書,包括Berger和Kimmel,Guide to Molecular Cloning Techniques ,Methods in Enzymology第152卷,(Academic Press , Inc ., San Diego , Calif. ;Sambrook 等人,Molecular Cloning-A Laboratory Manual,第2版,第1-3 卷,Cold Spring Harbor Laboratory,Cold Spring Harbor,Ν·Υ·,1989;及Current Protocols in Molecular Biology,F.M.Ausubel等人編,Current Protocols,a joint venture between Greene Publishing Associates, Inc.及John Wiley&Sons,Inc. ,(1999增刊)。足以指導(dǎo)技 術(shù)人員通過體外擴(kuò)增方法的方案的實(shí)例包括聚合酶鏈?zhǔn)椒磻?yīng)(PCR)、連接酶鏈?zhǔn)椒磻?yīng) (LCR)、Q-復(fù)制酶擴(kuò)增及其他RNA聚合酶介導(dǎo)的技術(shù)(例如,NASBA),例如,本公開內(nèi)容的同源 核酸的生產(chǎn)發(fā)現(xiàn)于Berger、Sambrook,和Ausubel以及Mull is等人(1987)美國專利第4,683, 202號(hào);Innis等人編(1990)PCR Protocols:A Guide to Methods and Applications (Academic Press Inc.San Diego,Calif·)(〃Innis〃);Arnheim&Levinson(Oct·1,1990)C& EN 36-47;The Journal Of N1H Research( 1991 )3:81-94;Kwoh 等人( 1989) Proc .Natl ·Acad. Sci ·USA 86:1173 ;Guatelli等人(1990)Proc .Nat,1 ·Acad· Sci .USA 87: 1874; Lomell等人(1989) J. Cl in · Chem 35:1826; Landegren等人(1988)Science 241:1077-1080;Van Brunt(1990)Biotechnology 8:291-294;Wu和Wallace(1989)Gene 4:560; Barringer等人(1990)Gene 89 :117 ;以及Sooknanan和Malek( 1995)Biotechnology 13 : 563-564中。Wal lace等人美國專利第5,426,039號(hào)中描述了體外克隆擴(kuò)增核酸的改進(jìn)的方 法。Cheng等人(1994)Nature 369:684-685及其中引用的參考文獻(xiàn)中概述了通過PCR來擴(kuò)增 大核酸的改進(jìn)的方法,其中產(chǎn)生多達(dá)40kb的PCR擴(kuò)增子。技術(shù)人員將理解,基本上任何RNA可 利用逆轉(zhuǎn)錄酶和聚合酶轉(zhuǎn)化成適于限制消化、PCR擴(kuò)增及測序的雙鏈DNA。參見,例如, Ausube 1、Sambrook 和 Berger,全部同上。
[0113] 適當(dāng)?shù)呐囵B(yǎng)條件包括,例如,培養(yǎng)基pH、離子強(qiáng)度、營養(yǎng)含量等;溫度;氧/CO2/氮含 量;濕度;及允許宿主微生物產(chǎn)生化合物(即通過微生物的代謝作用)的其他培養(yǎng)條件。可作 為宿主細(xì)胞的微生物的適當(dāng)?shù)呐囵B(yǎng)條件是公知的。
[0114] 以下實(shí)施例旨在進(jìn)一步解釋但不限制前述公開內(nèi)容或所附權(quán)利要求。實(shí)施例
[0115] 將編碼CBH I酶的親本基因和嵌合基因克隆到酵母表達(dá)載體YEp352/PGK91-l_ass 中并轉(zhuǎn)化進(jìn)入表達(dá)菌株YDR483W。親本CBH I基因以天然的密碼子選擇為特征并且通過DNA 2.0(Menlo Park,CA)來合成。使5mL合成的葡萄糖酪蛋白氨基酸(SDCAA)培養(yǎng)基起始培養(yǎng)物 在30°C且225rpm的搖動(dòng)下生長過夜,擴(kuò)展到40mL的酵母蛋白胨葡萄糖(YTO)培養(yǎng)基中并孵 育48小時(shí)。培養(yǎng)上清液加進(jìn)ImM苯甲基磺酰氟(PMSF)和0.02%NaN3。
[0116]通過以下來確定針對(duì)可溶性底物4 -甲基傘形酮基吡喃乳糖苷(4_ methylumbelliferyl lactopyranoside)(MUL)的總酵母分泌CBH I活性:將125yL的培養(yǎng)上 清液加到溶解于750mM醋酸鈉、pH4.8中的25yL的1.8mM MUL(Sigma),在45°C下孵育30分鐘 并用150yL 1M Na2C03猝滅。通過使用酶標(biāo)儀測量具有365nm激發(fā)和445nm發(fā)射的樣品熒光并 將值與由4-甲基傘形酮(S i gma)制備的標(biāo)準(zhǔn)曲線比較來確定MUL水解速率。
[0117] T5〇值被定義為如下溫度:在該溫度下在不存在底物下孵育10分鐘使得與MUL底物 反應(yīng)后測得的活性相對(duì)于未經(jīng)孵育的100%活性參考樣品損失一半。對(duì)于T5Q測定,利用來自 陰性對(duì)照YH)酵母培養(yǎng)物的不含分泌纖維素酶的上清液稀釋培養(yǎng)上清液以使未經(jīng)熱變性孵 育的樣品獲得1.6* 1 (T5mo 1 /L/s的近似相等的MUL水解速率。將這些稀釋的樣品調(diào)節(jié)至ImM DTT和125mM醋酸鈉,pH 4.8。在水浴中在跨越包括T5Q值的溫度范圍內(nèi)孵育125yL的等份10分 鐘。利用兩個(gè)不同的酒精溫度計(jì)測量水浴溫度并觀察到波動(dòng)在〇.l°C之內(nèi)。冷卻后,將在 50mM醋酸鈉、pH 4.8中的25yL的1.8mM MUL加入被孵育樣品和未加熱樣品中,并在45°C的水 浴中孵育這些樣品90分鐘。如上確定MUL水解,并利用Microsoft Excel通過數(shù)據(jù)的線性內(nèi) 插法來計(jì)算T5Q值。表3中提供了代表性T5Q數(shù)據(jù)集。
[0118]表3:親本1 (嗜熱毛殼菌)單體到親本5 (埃默森籃狀菌)單體的代表性T5Q數(shù)據(jù)。每個(gè) 溫度點(diǎn)的小數(shù)值代表在給定溫度下預(yù)孵育10分鐘之后相對(duì)于未預(yù)孵育所保留的單體活性。 給出了連續(xù)兩天進(jìn)行的實(shí)驗(yàn)的數(shù)據(jù)。利用Microsoft Excel獲得T5Q擬合值。圖3中顯示了親 本1單體的T5Q值?;趦蓚€(gè)以下重復(fù)和六個(gè)額外的T 5Q測量的平均數(shù)計(jì)算埃默森籃狀菌(親 本5)給出的T5Q值。55555515單體分泌太低以致不容許T5Q測量。
[0119]
[0120] 為了確定針對(duì)固體纖維素的總酵母分泌CBH I活性,在4°C下在以1 OOOrpm搖動(dòng)的 熱區(qū)塊中,在50mM醋酸鈉,pH 4.8中用500yL的120mg/mL Lattice NT微晶纖維素(FMC)孵育 500yL的酵母培養(yǎng)上清液1小時(shí)。將樣品以3000rcf離心3分鐘并用lmL的含有l(wèi)mg/mL BSA的 冰冷的50mM醋酸鈉、pH 4.8洗滌。將具有結(jié)合CBH I的固體纖維素再懸浮到lmL的相同的緩 沖液中,在37°C下?lián)u動(dòng)地孵育90分鐘,并通過Nelson-Somogyi測定法確定反應(yīng)上清液中還 原糖的量。
[0121] 進(jìn)行Ni2+親和分離的CBH I樣品的制備,蛋白濃度測量和SDS-PAGE分析。Ni2+分離 后的CBH I收率估計(jì)范圍從弱分泌的嗜熱子囊菌親本CBH I的500yg/L培養(yǎng)物至埃默森籃狀 菌親本CBH I和最高分泌的CBH I嵌合體的5mg/L和10mg/L之間。通過假設(shè)親和分離的CBH I 樣品中的所有蛋白是完全活性的CBH I并且向含有60mg/mL Lattice NT纖維素的270yL的 50mM醋酸鈉,pH 4.8中加入4yg而獲得CBH I固體纖維素的溫度活性曲線。在感興趣的溫度 下在水浴中孵育16小時(shí)之后,通過Nelson-Somogyi測定法確定上清液還原糖。
[0122] 為了埃默森籃狀菌CBH I圓二色性和半衰期t1/2熱穩(wěn)定性比較試驗(yàn),將金屬親和分 離的CBH I樣品處理為100%完全活性的CBH I,并利用酶、底物和緩沖液的條件(參見,例 如,Voutilainen等人,Protein Eng Des Sel.23:69_79,2010)。其中通過加入培養(yǎng)上清液 而供應(yīng)CBH I的半衰期測定樣品接收含有MUL-水解CBH I活性的上清液,所述MUL-水解CBH I活性近似等于加入用親和分離的CBH I進(jìn)行的測定的MUL-水解CBH I活性。以100yg/mL的 CBH I濃度按照制造商的說明書利用PNGaseF(New England Biolabs)進(jìn)行CBH I去糖基化。 除了起始培養(yǎng)物在擴(kuò)展到Y(jié)PD中之前在尿啼啶合成缺陷型培養(yǎng)基(synthetic dropout-Uracil media)中生長過夜以外,如上進(jìn)行超糖基化酵母菌珠的CBH I分泌培養(yǎng)。
[0123] 親本真菌CBH I酶。來自絲狀真菌嗜熱毛殼菌(Chaetomium thermophilum)(親本1 (P1))、嗜熱子囊菌(Thermoascus aurantiacus) (P2)、紅褐肉座菌(Hypocrea jecorina) (P3)和嗜熱支頂孢(Acremonium thermophilum)(P4)的五種CBH I重組親本中的四種是基 于它們已由流行工業(yè)纖維素酶分泌宿主里氏木霉(Trichoderma reesei)(有性型紅褐肉座 菌)過度表達(dá)而選擇的,這對(duì)工業(yè)應(yīng)用是重要的。來自嗜熱真菌埃默森籃狀菌的第五種CBH KP5)憑借其報(bào)道的高的熱穩(wěn)定性而被包括。為了消除重組后產(chǎn)生不配對(duì)的Cys殘基的可能 性,將埃默森籃狀菌CBH I和嗜熱子囊菌CBH I中的殘基G4和A72變?yōu)镃ys(參見SEQ ID N0: 12和15),以便每個(gè)親本CBH I催化結(jié)構(gòu)域含有10個(gè)二硫鍵。五種親本催化結(jié)構(gòu)域的序列比 對(duì)顯示于圖7中,并且催化結(jié)構(gòu)域的逐對(duì)序列同一性如下:
[0124] 序列(11:12)比對(duì)得分:69
[0125] 序列(11:13)比對(duì)得分:61
[0126] 序列(11:14)比對(duì)得分:71
[0127] 序列(11:15)比對(duì)得分:64
[0128] 序列(12:13)比對(duì)得分:66
[0129] 序列(12:14)比對(duì)得分:73
[0130] 序列(12:15)比對(duì)得分:81
[0131] 序列(13:14)比對(duì)得分:63
[0132] 序列(13:15)比對(duì)得分:66
[0133] 序列(14:15)比對(duì)得分:70
[0134] 不含有糖結(jié)合模塊(CBM)的埃默森籃狀菌CBH I和嗜熱子囊菌CBH I附加有C端接 頭和來自紅褐肉座菌CBH I的CBM,模擬先前用于嗜熱子囊菌CBH I的異源表達(dá)的構(gòu)建。嗜熱 毛殼菌、紅褐肉座菌和嗜熱支頂孢親本基因以其各自的野生型接頭和CBM為特征。所有CBH I親本的序列提供于SEQ ID N0:11-15中。
[0135] 如圖8中所示,埃默森籃狀菌CBH I在SDS-PAGE凝膠中顯示出比其它4種親本高得 多的表達(dá)。埃默森籃狀菌酵母分泌的培養(yǎng)上清液還含有為來自嗜熱毛殼菌的第二最高表達(dá) 的親本的上清液的三倍高的針對(duì)熒光的可溶性CBH I底物4-甲基傘形酮基吡喃乳糖苷 (MUL)的活性[(2.3+/-0.3) X 10-4mol/L/s]。10分鐘T5Q值形式的精確的CBH I熱穩(wěn)定性測量 需要2 1.6*l(T5m〇l/L/S的總MUL水解速率。紅褐肉座菌(P3)親本與嗜熱支頂孢(P4)親本均 未達(dá)到該閾值。上清液活性值在該水平以下的CBH I被分類為'不分泌的'。埃默森籃狀菌親 本具有大于嗜熱毛殼菌親本(59.9+/-0.3°C)和嗜熱子囊菌親本(62.2+/-0.4°C)的T 5Q(62.9 +/-0.3°C)。埃默森籃狀菌CBH I的相對(duì)高的穩(wěn)定性和分泌啟發(fā)了將其選擇作為用于篩選其 它酶中的序列區(qū)塊的背景。
[0136] SCHEMA嵌合體家族設(shè)計(jì)。埃默森籃狀菌CBH I的晶體結(jié)構(gòu)(pdblQ9H)被用于制備由 SCHEMA使用的接觸圖以評(píng)價(jià)重組后的破壞(disruption),其是用于選擇使文庫平均破壞〈E >最小化的區(qū)塊邊界的RASPP所需要的。因?yàn)镃BH I接頭與CBM的晶體結(jié)構(gòu)均不可獲得,所以 SCHEMA重組僅被應(yīng)用于CBH I催化結(jié)構(gòu)域。因此,CBH I嵌合體在區(qū)塊8處含有相應(yīng)于代表的 親本的接頭和CBM。由RASPP算法返回的5-親本、8區(qū)塊家族設(shè)計(jì)的分析指引我們選擇描繪于 圖1中的區(qū)塊邊界。該家族中的5 8 = 390,625個(gè)嵌合體具有<E> = 20.3和<m> = 66.0,提供了 高數(shù)目的突變和低數(shù)目的破壞接觸之間期望的平衡。
[0137] 用于穩(wěn)定性分析的樣品嵌合體。真菌CBH I從釀酒酵母(S. cerevisiae)中的分泌 較差。為了使提供有用數(shù)據(jù)的樣品集嵌合體的比例最大化,實(shí)施區(qū)塊篩選策略,其中來自4 個(gè)親本的32個(gè)區(qū)塊每次一個(gè)地被取代進(jìn)入以相對(duì)高水平分泌的CBH I的背景(親本5)。32_ 成員CBH Γ'單體"樣品集具有<E> = 5.9和<m> = 15.6。這些顯著低于家族中390,625個(gè)序列 的平均值,且因此被預(yù)期為具有保留折疊和纖維素酶功能的高可能性。
[0138] 通過總基因合成來制備32個(gè)單體。如圖2中所示,28個(gè)單體(88%)以功能形式從釀 酒酵母中分泌。然而,沒有分泌在區(qū)塊7(最大的區(qū)塊)處含有取代的單體。在區(qū)塊4處的取代 也對(duì)單體的分泌非常不利。另一方面,在區(qū)塊2和區(qū)塊5處有取代的一些單體比埃默森籃狀 菌背景親本更加高度地分泌。雖然先前觀察到在CBH II嵌合體的E和分泌之間的相反關(guān)系, 但是E對(duì)CBH I單體分泌沒有預(yù)測性(圖9)。針對(duì)MUL的CBH I上清液活性作為CBH I分泌的代 表是基于如下觀察:Ni-NTA親和分離的C端His6標(biāo)簽化的CBH I親本和嵌合體具有相似的針 對(duì)MUL的比活性(圖10)。
[0139] 圖3概述了區(qū)塊穩(wěn)定性貢獻(xiàn),并顯示出4種區(qū)塊取代導(dǎo)致具有增加的T5Q值的CBH I 嵌合體;穩(wěn)定化區(qū)塊B1P1、B3P1、B5P2和B8P2使T5〇增加了~0.7°C至~1.6°C。雖然沒有從不 分泌的兩個(gè)親本(P3、P4)中獲得穩(wěn)定化區(qū)塊,但是這些親本提供了五個(gè)中性區(qū)塊,B1P3、 B2P3、B5P3、B1P4和B2P4。假設(shè)區(qū)塊中性不依賴于嵌合體背景,這些區(qū)塊可被用于在不降低 熱穩(wěn)定性的情況下增加嵌合體的序列多樣性。
[0140] CBH I中的10個(gè)二硫鍵中的5個(gè)涉及起源于不同的區(qū)塊的Cys殘基。例如,區(qū)塊4的 Cysl35(親本5編號(hào);參見SEQ ID勵(lì):15)與區(qū)塊8的〇78401形成二硫鍵,且區(qū)塊7的〇78253與 區(qū)塊6的Cys227配對(duì)(圖1)。檢驗(yàn)了形成二硫鍵的Cys對(duì)的重組是否與由區(qū)塊4和區(qū)塊7的取 代造成的對(duì)分泌和/或穩(wěn)定性的有害作用有關(guān)的分析。這通過將來自親本1和親本2的4-8區(qū) 塊對(duì)和6-7區(qū)塊對(duì)取代到親本5中來進(jìn)行測試。以這種方式保留二硫鍵,然而,這導(dǎo)致下降至 含有相應(yīng)的單個(gè)區(qū)塊取代的單體之間的表達(dá)水平或完全沒有分泌(表1)。在區(qū)塊4和區(qū)塊8 處有取代的嵌合體的T 5Q值下降至相應(yīng)的區(qū)塊4單體和區(qū)塊8單體的T5Q值之間。這些結(jié)果表 明,取自不同親本的含有Cys殘基的C135-C401和C227-C253二硫鍵相對(duì)于來自相同親本的 這些區(qū)塊沒有降低分泌或穩(wěn)定性。
[0141] 區(qū)塊7取代的單體分泌的缺乏阻止了對(duì)此位置處區(qū)塊的穩(wěn)定性貢獻(xiàn)分配。僅分泌 其中B7P5被取代到其它四種親本中的一種單體,當(dāng)將區(qū)塊7移動(dòng)到親本2(與親本5具有最高 的同一性(81%))中時(shí),使表達(dá)增加了多于五倍并使親本2的T 5Q增加了 1.5°C。
[0142] 熱穩(wěn)定的CBH I嵌合體設(shè)計(jì)和表征。然后設(shè)計(jì)出還以相對(duì)高的水平分泌的一組多 樣的熱穩(wěn)定的嵌合體。為了達(dá)到高穩(wěn)定性,該組中的全部16個(gè)成員包括兩個(gè)最穩(wěn)定的區(qū)塊, B3P1和B8P5。類似地,因?yàn)橛^察到B5P3和B5P5均具有顯著的且相似的穩(wěn)定化作用,所以全部 設(shè)計(jì)的嵌合體均含有這兩個(gè)區(qū)塊中的一個(gè)。因?yàn)榘l(fā)現(xiàn)來自除埃默森籃狀菌親本5以外的親 本的區(qū)塊4和區(qū)塊7消除分泌或顯著地降低分泌,所以全部16個(gè)設(shè)計(jì)的嵌合體以B4P5和B7P5 為特征。最后,為了獲得高序列多樣性而不犧牲熱穩(wěn)定性和/或分泌水平,我們加入11個(gè)區(qū) 塊的集合,8卟1、81?2、8卟3、81?4、81?5、82?2、82?3、82?4、82?5、86?2和86?5,這些區(qū)塊被預(yù) 期為對(duì)嵌合體穩(wěn)定性和分泌水平是有利或中性的。
[0143] 因此,嵌合體由40個(gè)可獲得的CBH I區(qū)塊中的17個(gè)組成并且相對(duì)于最接近的親本 (441個(gè)總殘基)含有平均37個(gè)突變。它們彼此有平均21個(gè)突變差異并代表全部五個(gè)親本CBH I。如圖4中所示,實(shí)際上這些預(yù)測的穩(wěn)定的CBH I嵌合體的全部16個(gè)均具有比最穩(wěn)定的CBH I親本(來自埃默森籃狀菌)的T5Q值顯著更大的T5Q值。16個(gè)熱穩(wěn)定的嵌合體中的8個(gè)具有超 過埃默森籃狀菌2度或更多度的T 5Q值,其中最熱穩(wěn)定的嵌合體55152552具有高出3.4°C的 T50。如圖4中所示,除了一個(gè)以外的全部16個(gè)穩(wěn)定的嵌合體以等于或大于來自嗜熱毛殼菌的 第二最高分泌的親本的水平分泌;且8個(gè)嵌合體以等于或大于來自埃默森籃狀菌的最高分 泌的親本的水平分泌。
[0144] 因?yàn)閷?duì)于親本2(與親本5最具同一性的親本)來說,將Β7Ρ5取代進(jìn)入4種其它親本 的背景的嘗試是成功的,所以在五種熱穩(wěn)定的嵌合體的背景中將Β7Ρ5取代為Β7Ρ2。如表4中 所示,在全部五種情況下,這種取代顯著地降低分泌或消除分泌,并使分泌的嵌合體的T50值 下降平均2.3+/-0.8°C。
[0145] 表4.B7P5和B72CBH I嵌合體的T5Q值和總酵母分泌活性[(mol MUL/(L · s))X105] 的比較。T5Q值上的誤差棒表示兩個(gè)重復(fù)的極值。總酵母分泌活性是單一培養(yǎng)的單一測量。NS 表示總分泌活性太低以致不容許T5Q測量。
[0146]
[0147]進(jìn)行實(shí)驗(yàn)以確定位于區(qū)塊7內(nèi)的更小段氨基酸或子區(qū)塊是否可以在嵌合CBH I中 交換,以及這些區(qū)塊是否可作出積極的熱穩(wěn)定性貢獻(xiàn)。繼續(xù)進(jìn)行在兩個(gè)最具同一性的序列 親本2和親本5之間的這種交換序列的方式。選定B7P2內(nèi)的6個(gè)子區(qū)塊并在克隆便利性和分 離B7P2和B7P5