的32個(gè)突變的相對等同的分布的基礎(chǔ)上選擇。如圖11所示,6個(gè)子區(qū)塊特征為 2個(gè)至7個(gè)突變。表5顯示,6個(gè)子區(qū)塊中的3個(gè)(C、D和E)被取代到親本5中時(shí)增加分泌或不減 少分泌。發(fā)現(xiàn)含有6個(gè)突變的子區(qū)塊C使埃默森籃狀菌CBH I的T5Q增加大約1.0°C。
[0148] 表5.子區(qū)塊取代的埃默森籃狀菌CBH I變體的T5Q值和總分泌酵母活性。T5Q值上的 誤差棒表示兩個(gè)重復(fù)測量的極值。子區(qū)塊總酵母分泌活性[(mol MUL/(L · s))X105]是單 一培養(yǎng)的單一測量。埃默森籃狀菌的T5Q值和總分泌值為8個(gè)和3個(gè)相應(yīng)重復(fù)的均值和標(biāo)準(zhǔn)偏 差。NS表示對于T5Q測量不充足的總活性。
[0149]
[0150]如表2中所示,其中含有來自親本2的子區(qū)塊C的B7P5由在7位置處的"*5"表示,這 一子區(qū)塊改善了其中取代進(jìn)入的全部五個(gè)嵌合體的熱穩(wěn)定性,且平均T5Q增加1.5+/-0.4°C。 此外,B7P*5嵌合體全部以比相應(yīng)的B7P5嵌合體高的水平分泌。
[0151]利用熱穩(wěn)定的CBH I嵌合體的纖維素水解。還進(jìn)行實(shí)驗(yàn)以確定T5Q的增加是否相應(yīng) 于最大CBH I固體纖維素水解溫度的增加,該T5Q是在不存在底物下進(jìn)行熱變性之后測得的。 為此目的,為3種分泌的CBH I親本和5種熱穩(wěn)定的B7P*5嵌合體構(gòu)建酵母分泌構(gòu)建體,其中 CBH I的N端附加有HiS6標(biāo)簽以允許通過Ni-NTA親和色譜從酵母培養(yǎng)基中的組分中純化。如 圖12中所示,雖然在SDS-PAGE中CBH I條帶出現(xiàn)在預(yù)期的分子量-60kDa處,但是在-20kDa處 還存在未預(yù)料到的條帶。雖然這些樣品的同質(zhì)性不足以容許CBH I比活性測量,但是將背景 蛋白和糖類從培養(yǎng)基中除去允許有效地比較最大的固體纖維素的水解溫度。
[0152] 如圖5中所示,較高的T5Q值指示在高溫下在16小時(shí)間隔期間內(nèi)水解固體纖維素的 較高的能力。而親本酶中沒有一個(gè)在65°C以上是有活性的,全部五種被測試的熱穩(wěn)定的嵌 合體(所述嵌合體含有平均42個(gè)突變并且彼此具有平均16個(gè)突變差異)在70°C下均保留一 定水解活性。然而,這五種被測試的熱穩(wěn)定的嵌合體在50°C下均具有比埃默森籃狀菌親本 低30%至50%的比活性(假定加載到每個(gè)反應(yīng)中的全部蛋白是活性的CBH I)。
[0153] Ni-NTA親和分離的CBH I樣品還可用于評價(jià)在45°C下測量的針對可溶的MUL底物 的CBH I比活性在重組后是否保留。如圖10所示,在親和分離的CBH I樣品是100%純的假定 的基礎(chǔ)上,五種熱穩(wěn)定的Hi S6-標(biāo)簽化的嵌合體的估計(jì)的比活性在平均值2.8 X 1 (T4mo 1 MUL/(L syg CBH I)的4X10-5mol MUL/(L syg CBH I)內(nèi)。這些比活性落入對親本1、2和5測 量的各自的值(4·3+/-0·1)Χ10-4mol MUL/(L syg CBH Ι)、(2·3+/-0·2)Χ10-4mol MUL/(L 8以808!11)和(4.3+/-〇.1)\10-4111〇1]\11]17〇^以8〇8!11)之間。因此,熱穩(wěn)定的嵌合體的穩(wěn) 定性沒有以其針對可溶的MUL底物的比活性為代價(jià)而增加穩(wěn)定性。
[0154] 由酵母分泌的總纖維素酶活性在聯(lián)合生物加工(CBP)應(yīng)用中是有重要意義的,其 中釀酒酵母的重組菌株以單一工藝步驟將纖維素生物質(zhì)轉(zhuǎn)化為可發(fā)酵的單糖并將單糖發(fā) 酵成生物燃料。測量了5種CBH I親本和一組6種穩(wěn)定的嵌合體的總的固體纖維素的水解活 性,所述一組6種穩(wěn)定的嵌合體具有等于或大于埃默森籃狀菌CBH I的針對可溶的MUL底物 的總分泌活性。如圖6所示,全部6種CBH I嵌合體還展示出比親本中任一個(gè)大的總的固體纖 維素的水解活性。
[0155]雖然已經(jīng)闡釋和描述了各種具體實(shí)施方案,但應(yīng)理解可以作出各種改變而不背離 本發(fā)明的精神和范圍。
【主權(quán)項(xiàng)】
1. 一種基本上純化的嵌合多肽,包含來自至少兩個(gè)不同的親本纖維二糖水解酶I(CBH I)多肽的至少兩個(gè)結(jié)構(gòu)域,其中所述結(jié)構(gòu)域從N端到C端包含:(區(qū)段1)-(區(qū)段2)-(區(qū)段3)-(區(qū)段4)_(區(qū)段5)-(區(qū)段6)-(區(qū)段7)-(區(qū)段8); 其中:區(qū)段1包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8( "4")或SEQ ID NO: 10( "5")的氨基酸殘基從大約1或從大約18或19到大約X1至少50-100%相同的序列;區(qū)段2包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6 ("3")、SEQ ID NO:8( "4")或SEQ ID NO:10("5")的氨基酸殘基X1到大約x2至少50-100%相 同的序列;區(qū)段3包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID NO: 8( "4")或SEQ ID NO: 10( "5")的氨基酸殘基x2到大約x3至少50-100%相同的序列;區(qū)段4 包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或 SEQ ID NO: 10( "5")的氨基酸殘基X3到大約X4至少50-100%相同的序列;區(qū)段5包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的氨基酸殘基X4到大約x5至少50-100%相同的序列;區(qū)段6包含與SEQ ID NO: 2( "1")、 SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10("5")的氨基酸 殘基X5到大約X6至少50-100%相同的序列;區(qū)段7包含與SEQ ID NO: 2( "1")、SEQ ID NO: 4 ("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID勵:10("5")的氨基酸殘基叉6到大 約X7至少50-100%相同的序列;及區(qū)段8包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10("5")的氨基酸殘基X7到大約X8至少50-100%相同的序列; 其中XI是SEQIDN0:2、4、6或8的殘基47、48、49、50、51或52,或是SEQIDN0:10的殘基 48、49、50、51、52或53;X2是SEQIDN0:2或10的殘基92、93、94、95、96或97,或是SEQIDN0: 4、6或8的殘基91、92、93、94、95或96;X3是SEQIDN0:2的殘基127、128、129、130、131或132, 或是SEQIDN0:4或6的殘基 125、126、127、128、129或130,或是SEQIDN0:8的殘基126、 127、128、129、130或 131,或是SEQIDNO: 10的殘基 123、124、125、126、127或 128;X4是SEQ IDN0:2的殘基 175、176、177、178、180或181,或是SEQIDN0:4或SEQIDN0:6的殘基173、 174、175、176、177或178,或是SEQIDN0:8的殘基174、175、176、177、178或179,或是SEQID N0:10的殘基171、172、173、174、175或176;X5是SEQIDN0:2的殘基221、222、223、224、225 或226,或是SEQIDN0:4或SEQIDN0:6的殘基219、220、221、222、223或224,或是SEQID N0:8的殘基220、221、222、223、224或225,或是SEQIDN0:10的殘基217、218、219、220、221 或222;X6是SEQIDN0:2的殘基268、269、270、271、272或273,或是SEQIDN0:4或SEQID N0:6的殘基266、267、268、269、270或271,或是SEQIDN0:8的殘基267、268、269、270、271或 272,或是SEQIDN0:10的殘基264、265、266、267、268或269;X7是SEQIDN0:2的殘基384、 385、386、387、388或389,或是SEQIDN0:4的殘基385、386、387、388、389或390,或是SEQID N0:6的殘基378、379、380、381、382或383,或是SEQIDN0:8或10的殘基383、384、385、386、 387或388;并且X8是對應(yīng)于SEQIDN0:2的殘基454、SEQIDN0:4的殘基457、SEQIDN0:6 的殘基458、SEQIDN0:8的殘基453、SEQIDN0:10的殘基455、或者具有序列SEQIDN0:2、 SEQIDN0:4、SEQIDN0:6、SEQIDN0:8或SEQID從):10的多肽的(:端的氨基酸殘基, 其中所述嵌合多肽具有纖維二糖水解酶活性和與包含SEQIDNO: 2、4、6、8或10的CBH I多肽相比改善的熱穩(wěn)定性、pH穩(wěn)定性和/或表達(dá)。2. 如權(quán)利要求1所述的多肽,其中區(qū)段1包含SEQIDN0:2("1")、SEQIDN0:4("2")、 SEQIDN0:6("3")、SEQIDN0:8("4")或SEQID勵:10("5")的氨基酸殘基從大約1或從大 約18或19到大約X1并具有1-10個(gè)保守氨基酸取代;區(qū)段2是SEQIDN0:2("1")、SEQIDNO: 4("2")、SEQIDN0:6("3")、SEQIDN0:8("4")或SEQIDN0:10("5")的從大約氨基酸殘基 xi到大約X2并具有大約1-10個(gè)保守氨基酸取代;區(qū)段3是SEQIDN0:2("1")、SEQIDN0:4 ("2")、SEQIDNO:6( "3")、SEQIDNO:8( "4")或SEQIDNO:10( "5")的從大約氨基酸殘基 X2到大約X3并具有大約1-10個(gè)保守氨基酸取代;區(qū)段4是SEQIDN0:2("1")、SEQIDN0:4 ("2")、SEQIDNO:6( "3")、SEQIDNO:8( "4")或SEQIDNO:10( "5")的從大約氨基酸殘基 X3到大約X4并具有大約1-10個(gè)保守氨基酸取代;區(qū)段5是SEQIDN0:2("1")、SEQIDN0:4 ("2")、SEQIDNO:6( "3")、SEQIDNO:8( "4")或SEQIDNO:10( "5")的從大約氨基酸殘基 X4到大約μ并具有大約1-10個(gè)保守氨基酸取代;區(qū)段6是SEQIDN0:2("1")、SEQIDN0:4 ("2")、SEQIDNO:6( "3")、SEQIDNO:8( "4")或SEQIDNO:10( "5")的從大約氨基酸殘基 X5到大約X6并具有大約1-10個(gè)保守氨基酸取代;區(qū)段7是SEQIDN0:2("1")、SEQIDN0:4 ("2")、SEQIDNO:6( "3")、SEQIDNO:8( "4")或SEQIDNO:10( "5")的從大約氨基酸殘基 X6到大約χ7并具有大約1-10個(gè)保守氨基酸取代;并且區(qū)段8是SEQIDN0:2("1")、SEQID N0:4("2")、SEQIDN0:6("3")、SEQIDN0:8("4")或SEQIDN0:10("5")的從大約氨基酸 殘基X7到大約X8并具有大約1-10個(gè)保守氨基酸取代。3.如權(quán)利要求1所述的多肽,其中所述多肽與選自由SEQIDN0:19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33和34組成的組的序列至少60-100%相同。4. 如權(quán)利要求1、2或3所述的多肽,其中所述多肽包含可操作地連接到N端氨基酸的前 導(dǎo)序列。5.如權(quán)利要求1、2、3或4所述的多肽,還包括包含選自由SEQIDN0:16、17和18組成的 組的序列的C端CBM結(jié)構(gòu)域。6.如權(quán)利要求1、2、3、4或5所述的多肽,其中所述至少兩個(gè)不同的親本纖維二糖水解酶 I(CBHI)多肽包括選自由SEQIDN0:2、4、6、8和10組成的組的序列。7. 如前述權(quán)利要求中任一項(xiàng)所述的多肽,其中所述多肽具有選自由以下組成的組的區(qū) 段結(jié)構(gòu):55153552、12153252、25152252、12152252、55152252、55515555、55555551、 55515551、55525555、55555552、55525552、55555155、55555515、55555115、55555255、 55555525、55555225、34152252(SEQIDN0:19)、55153552(SEQIDN0:20)、32153252(SEQ IDN0:21)、55155552(SEQIDN0:22)、22153252(SEQIDN0:23)、52152552(SEQIDNO: 24)、12153252(SEQIDN0:25)、45153252(SEQIDN0:26)、12153552(SEQIDN0:27)、 25152252(SEQIDN0:28)、13152552(SEQIDN0:29)、12152252(SEQIDN0:30)、55153252 (SEQIDN0:31)、55552252(SEQIDN0:32)、55152552(SEQIDN0:33)和55152252(SEQID NO:34)〇8. -種編碼權(quán)利要求1-7中任一項(xiàng)所述的多肽的多核苷酸。9. 一種包含權(quán)利要求8的多核苷酸的載體。10. -種包含權(quán)利要求9所述的載體的宿主細(xì)胞。11. 如權(quán)利要求10所述的宿主細(xì)胞,其中所述宿主細(xì)胞是植物細(xì)胞或真菌細(xì)胞。12. -種包含權(quán)利要求1-7中任一項(xiàng)的多肽的酶制品。13.如權(quán)利要求12所述的酶制品,還包含熱穩(wěn)定的纖維二糖水解酶II類酶嵌合體。14. 一種處理包含纖維素的生物質(zhì)的方法,所述方法包括使所述生物質(zhì)與權(quán)利要求12 或13的酶制品接觸。15. -種處理包含纖維素的生物質(zhì)的方法,所述方法包括使所述生物質(zhì)與權(quán)利要求10 的宿主細(xì)胞接觸。16. -種用于產(chǎn)生權(quán)利要求1的多肽的方法,所述多肽與一個(gè)親本多肽或一類親本多肽 相比具有改善的活性或穩(wěn)定性,所述方法包括: 識別多個(gè)P進(jìn)化上、結(jié)構(gòu)上或者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽; 在多個(gè)相關(guān)多肽的至少第一多肽和至少第二多肽中選擇一組交叉位置,所述一組交叉 位置包含N個(gè)肽區(qū)段; 從具有穩(wěn)定的功能表達(dá)的所述多個(gè)進(jìn)化上、結(jié)構(gòu)上或者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽中 選擇親本; 產(chǎn)生多個(gè)嵌合體,所述嵌合體包含所述親本的N-1個(gè)肽區(qū)段以及所述多個(gè)進(jìn)化上、結(jié)構(gòu) 上或者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽中另一個(gè)多肽的一個(gè)異源肽區(qū)段; 識別具有增強(qiáng)活性或穩(wěn)定性的改善的嵌合體以及識別所述異源肽區(qū)段作為改善的單 體中的活性/穩(wěn)定性相關(guān)的肽區(qū)段; 產(chǎn)生重新組合的重組蛋白樣品集xP",所述重組蛋白包含所述至少第一多肽和第二多 肽中的每一個(gè)的活性/穩(wěn)定性相關(guān)的肽區(qū)段,其中χ〈1;測量折疊表達(dá)的重新組合的重組蛋 白的樣品集的穩(wěn)定性; 產(chǎn)生包含一個(gè)或多個(gè)活性/穩(wěn)定性相關(guān)的肽區(qū)段的多個(gè)嵌合多肽。17.如權(quán)利要求16所述的方法,其中所述改善的嵌合體通過進(jìn)行回歸分析來識別。18.如權(quán)利要求16所述的方法,其中所述選擇一組交叉位置包括比對所述多個(gè)進(jìn)化上、 結(jié)構(gòu)上或者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽的序列并識別序列同一性區(qū)域。19.如權(quán)利要求18所述的方法,其中所述方法包括序列比對以及選自由以下組成的組 的一種或多種方法:X射線晶體學(xué)、NMR、搜索蛋白結(jié)構(gòu)數(shù)據(jù)庫、同源模建、從頭蛋白折疊及計(jì) 算蛋白結(jié)構(gòu)預(yù)測。20. 如權(quán)利要求16所述的方法,其中所述選擇一組交叉位置包括:識別所述至少第一多 肽中的殘基對之間的偶聯(lián)相互作用; 產(chǎn)生多個(gè)數(shù)據(jù)結(jié)構(gòu),每個(gè)數(shù)據(jù)結(jié)構(gòu)代表包含所述至少第一多肽和第二多肽的重組的交 叉突變體,其中每個(gè)重組具有不同的交叉位置; 對每個(gè)數(shù)據(jù)結(jié)構(gòu)確定與由所述數(shù)據(jù)結(jié)構(gòu)代表的交叉突變體中被破壞的偶聯(lián)相互作用 的數(shù)目相關(guān)的交叉破壞;及 在所述多個(gè)數(shù)據(jù)結(jié)構(gòu)中識別具有低于閾值的交叉破壞的特定數(shù)據(jù)結(jié)構(gòu),其中由所述特 定數(shù)據(jù)結(jié)構(gòu)代表的交叉突變體的交叉位置是被識別的交叉位置。21. 如權(quán)利要求20所述的方法,其中偶聯(lián)相互作用通過確定殘基之間的構(gòu)象能量來識 別。22. 如權(quán)利要求20所述的方法,其中偶聯(lián)相互作用通過確定殘基之間的原子間距離來 識別。23. 如權(quán)利要求20所述的方法,其中所述至少第一多肽和第二多肽的每一個(gè)的構(gòu)象能 量由所述第一多肽和第二多肽中的至少一個(gè)的三維結(jié)構(gòu)來確定。24.如權(quán)利要求22所述的方法,其中原子間距離由多個(gè)多肽中的至少一個(gè)多肽的三維 結(jié)構(gòu)來確定。25.如權(quán)利要求20所述的方法,其中偶聯(lián)相互作用通過高于閾值的殘基之間的構(gòu)象能 量來識別。26.如權(quán)利要求20所述的方法,其中所述閾值是所述多個(gè)數(shù)據(jù)結(jié)構(gòu)的交叉破壞的平均 水平。27.如權(quán)利要求26所述的方法,其中交叉位置的識別包括基于序列同一性區(qū)域來識別 所述多肽中的可能的切割點(diǎn)。28.如權(quán)利要求26或27所述的方法,其中所述序列同一性區(qū)域必須包含至少4個(gè)殘基。29.如權(quán)利要求26所述的方法,其中穩(wěn)定性的測量包括選自由以下組成的組的技術(shù):化 學(xué)穩(wěn)定性測量、功能穩(wěn)定性測量和熱穩(wěn)定性測量。30. 如權(quán)利要求29所述的方法,其中所述化學(xué)穩(wěn)定性測量包括化學(xué)變性測量。31.如權(quán)利要求28所述的方法,其中所述熱穩(wěn)定性測量包括熱變性測量。32. 如權(quán)利要求29所述的方法,其中所述功能穩(wěn)定性測量包括配體或底物結(jié)合技術(shù)。33.如權(quán)利要求16所述的方法,其中所述回歸分析包括確定序列穩(wěn)定性數(shù)據(jù)或折疊蛋 白與未折疊蛋白的多重序列比對(MSA)的共有序列分析。34.如權(quán)利要求33所述的方法,其中所述序列穩(wěn)定性數(shù)據(jù)包括與穩(wěn)定性測量可操作地 關(guān)聯(lián)的序列ig息。35.如權(quán)利要求16所述的方法,還包括創(chuàng)建具有肽區(qū)段的片段的單體。36.如權(quán)利要求16所述的方法,其中所述親本包括與SEQIDNO: 15具有至少80%-100%同一性的序列。
【專利摘要】本發(fā)明涉及穩(wěn)定的功能嵌合纖維二糖水解酶I類酶。具體來說,本公開內(nèi)容涉及CBH?I嵌合體融合的多肽、編碼該多肽的核酸以及用于產(chǎn)生該多肽的宿主細(xì)胞。
【IPC分類】C12N5/10, C12P19/14, C12N9/42, C12N15/56, C12N1/15
【公開號】CN105441414
【申請?zhí)枴緾N201510604587
【發(fā)明人】弗朗西斯·H·阿諾德, 皮特·海因策爾曼
【申請人】加州理工學(xué)院
【公開日】2016年3月30日
【申請日】2011年6月1日
【公告號】CA2796189A1, CN102884086A, CN102884086B, EP2576626A2, EP2576626A4, US8962295, US9284587, US20110319294, US20150159187, WO2011153276A2, WO2011153276A3