穩(wěn)定的功能嵌合纖維二糖水解酶i類酶的制作方法
【專利說明】
[0001 ] 本申請(qǐng)是申請(qǐng)日為2011年06月01日、申請(qǐng)?zhí)枮?01180022906.8、發(fā)明名稱為"穩(wěn)定 的功能嵌合纖維二糖水解酶I類酶"的申請(qǐng)的分案申請(qǐng)。
[0002] 相關(guān)申請(qǐng)的交叉引用
[0003] 本申請(qǐng)根據(jù)美國(guó)法典第35卷第119條要求于2010年6月1日提交的美國(guó)臨時(shí)申請(qǐng)序 列號(hào)61/350,412的優(yōu)先權(quán),該美國(guó)臨時(shí)申請(qǐng)的公開內(nèi)容在此通過引用方式并入。
[0004] 關(guān)于聯(lián)邦資助研究的聲明
[0005] 本發(fā)明在由美國(guó)陸軍研究處(Army Research Office)授予的基金第W911NF-09- D-0001號(hào)下的政府資助下作出。政府具有本發(fā)明中的某些權(quán)益。
技術(shù)領(lǐng)域
[0006] 本公開內(nèi)容涉及生物分子工程和設(shè)計(jì),以及工程化的蛋白和核酸。
【背景技術(shù)】
[0007] 纖維素酶混合物在生物質(zhì)轉(zhuǎn)化過程中的表現(xiàn)除了取決于纖維素底物的物理狀態(tài) 和組成以外,還取決于許多酶特性,包括穩(wěn)定性、產(chǎn)物抑制、不同纖維素酶組分之間的協(xié)作、 生產(chǎn)性結(jié)合(productive binding)相對(duì)非生產(chǎn)性吸附(nonproductive adsorption)、以及 pH依賴性。鑒于纖維素水解的多變量性質(zhì),具有多樣的纖維素酶選擇來優(yōu)化用于不同應(yīng)用 和原料的酶制劑是令人期望的。
【發(fā)明內(nèi)容】
[0008] 本公開內(nèi)容提供了大體純化的嵌合多肽,其包括來自至少兩個(gè)不同的親本纖維二 糖水解酶I(CBH I)多肽的至少兩個(gè)結(jié)構(gòu)域,其中這些結(jié)構(gòu)域從N端到C端包含:(區(qū)段1)_(區(qū) 段2)_(區(qū)段3)-(區(qū)段4)-(區(qū)段5)-(區(qū)段6)-(區(qū)段7)-(區(qū)段8);其中:區(qū)段1包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的氨基酸殘基從大約1或從大約18或19到大約X1至少50-100%相同的序列;區(qū)段2包 含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID NO: 10( "5")的氨基酸殘基X1到大約X2至少50-100%相同的序列;區(qū)段3包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的氨基酸殘基x2到大約x3至少50-100%相同的序列;區(qū)段4包含與SEQ ID NO: 2( "1")、 SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10("5")的氨基酸 殘基X3到大約X4至少50-100%相同的序列;區(qū)段5包含與SEQ ID NO: 2( "1")、SEQ ID NO: 4 ("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID 勵(lì):10("5")的氨基酸殘基叉4到大 約 X5 至少 50-100% 相同的序列;區(qū)段 6 包含與 SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10("5")的氨基酸殘基x5到大約m至少50-100% 相同的序列;區(qū)段 7 包含與 SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6 ("3")、SEQ ID NO:8( "4")或SEQ ID NO:10("5")的氨基酸殘基x6到大約X7至少50-100%相 同的序列;及區(qū)段8包含與SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8( "4")或SEQ ID NO: 10( "5")的氨基酸殘基X7到大約X8至少50-100%相同的序列;且 其中XI是SEQ ID N0:2、4、6或8的殘基47、48、49、50、51或52,或是SEQIDN0:10的殘基48、 49、50、51、52或53 ;X2是SEQIDN0:2或10的殘基92、93、94、95、96或97,或是SEQIDN0:4、6 或8的殘基91、92、93、94、95或96 ;X3是SEQIDN0:2的殘基127、128、129、130、131或132,或 是SEQ ID N0:4或6的殘基 125、126、127、128、129或130,或是SEQIDN0:8的殘基126、127、 128、129、130或 131,或是SEQ ID N0:10的殘基 123、124、125、126、127或128;X4是SEQID N0:2 的殘基 175、176、177、178、180或181,或是SEQIDN0:4或SEQIDN0:6的殘基173、174、 175、176、177或 178,或是SEQ ID N0:8的殘基 174、175、176、177、178或179,或是SEQIDN0: 10的殘基171、172、173、174、175或176 ;X5是SEQIDN0:2的殘基221、222、223、224、225或 226,或是SEQ ID N0:4或SEQ ID N0:6的殘基219、220、221、222、223或224,或是SEQIDN0: 8的殘基220、221、222、223、224或225,或是SEQIDN0:10的殘基217、218、219、220、221或 222;X6是SEQ ID N0:2的殘基268、269、270、271、272或273,或是SEQIDN0:4或SEQIDN0: 6的殘基266、267、268、269、270或271,或是SEQIDN0:8的殘基267、268、269、270、271或 272,或是SEQIDN0:10的殘基264、265、266、267、268或269 ;X7是SEQIDN0:2的殘基384、 385、386、387、388或389,或是SEQIDN0:4的殘基385、386、387、388、389或390,或是SEQID N0:6的殘基378、379、380、381、382或383,或是SEQIDN0:8或10的殘基383、384、385、386、 387或388;并且X8是對(duì)應(yīng)于SEQ ID N0:2的殘基454、SEQ ID N0:4的殘基457、SEQ ID N0:6 的殘基458、SEQIDN0:8的殘基453、SEQIDN0:10的殘基455、或者具有序列SEQIDN0:2、 SEQ ID N0:4、SEQ ID N0:6、SEQ ID N0:8或SEQ ID勵(lì):10的多肽的(:端的氨基酸殘基,且其 中嵌合多肽具有纖維二糖水解酶活性和與包含SEQ ID NO: 2、4、6、8或10的CBH I多肽相比 改善的熱穩(wěn)定性、pH穩(wěn)定性和/或表達(dá)。在前述的另一實(shí)施方案中,區(qū)段1包含SEQ ID NO: 2 ("1")、SEQIDN0:4("2")、SEQIDN0:6("3")、SEQIDN0:8("4")SSEQIDN0:10("5"W9 氨基酸殘基從大約1或從大約18或19到大約 X1并具有1-10個(gè)保守氨基酸取代;區(qū)段2是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基X1到大約x2并具有大約1-10個(gè)保守氨基酸取代;區(qū)段3是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基x2到大約X3并具有大約1-10個(gè)保守氨基酸取代;區(qū)段4是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基X3到大約X4并具有大約1-10個(gè)保守氨基酸取代;區(qū)段5是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基X4到大約x5并具有大約1-10個(gè)保守氨基酸取代;區(qū)段6是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基x5到大約X6并具有大約1-10個(gè)保守氨基酸取代;區(qū)段7是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基X6到大約X7并具有大約1-10個(gè)保守氨基酸取代;并且區(qū)段8是SEQ ID N0:2("1")、SEQ ID N0:4("2")、SEQ ID N0:6("3")、SEQ ID N0:8("4")或SEQ ID N0:10 ("5")的從大約氨基酸殘基X7到大約X8并具有大約1-10個(gè)保守氨基酸取代。在前述中的任一 個(gè)的又一個(gè)實(shí)施方案中,多肽與選自由SEQ ID N0:19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33和34組成的組的序列至少60-100%相同。在前述任一個(gè)的又一個(gè)實(shí)施方案中, 多肽包括可操作地連接到N端氨基酸的前導(dǎo)序列。在前述任一個(gè)的又一個(gè)實(shí)施方案中,多肽 還包括選自由SEQ ID勵(lì):16、17和18組成的組的序列的(:端081結(jié)構(gòu)域。在前述任一個(gè)的又 一個(gè)實(shí)施方案中,至少兩個(gè)不同的親本纖維二糖水解酶I(CBH I)多肽包括選自由SEQ ID NO:2、4、6、8和10組成的組的序列。在前述任一個(gè)的又一個(gè)實(shí)施方案中,多肽具有選自由以 下組成的組的區(qū)段結(jié)構(gòu):55153552、12153252、25152252、12152252、55152252、55515555、 55555551、55515551、55525555、55555552、55525552、55555155、55555515、55555115、 55555255、55555525、55555225、34152252(SEQ ID NO:19)、55153552(SEQ ID N0:20)、 32153252(SEQ ID NO:21)、55155552(SEQ ID NO:22)、22153252(SEQ ID NO:23)、52152552 (SEQ ID NO:24)、12153252(SEQ ID NO:25)、45153252(SEQ ID NO:26)、12153552(SEQ ID NO:27)、25152252(SEQ ID NO:28)、13152552(SEQ ID NO:29)、12152252(SEQ ID N0:30)、 55153252(SEQ ID NO:31)、55552252(SEQ ID NO:32)、55152552(SEQ ID NO:33)和 55152252(SEQ ID NO:34)。
[0009] 本公開內(nèi)容還提供了編碼如前述實(shí)施方案中任一個(gè)中所描述的多肽的多核苷酸, 含有所述多核苷酸的載體,以及包含所述多核苷酸或載體的宿主細(xì)胞(例如植物或真菌細(xì) 胞)。
[0010] 本公開內(nèi)容還提供了包含如以上以及本文中別處所述的多肽的酶制品。在又一實(shí) 施方案中,酶制品還包含熱穩(wěn)定的纖維二糖水解酶II類酶嵌合體。
[0011] 本公開內(nèi)容還提供了處理包含纖維素的生物質(zhì)的方法,該方法包括使生物質(zhì)與本 公開內(nèi)容的酶制品接觸。
[0012] 本公開內(nèi)容還提供了用于產(chǎn)生本發(fā)明的多肽的方法,所述多肽與一個(gè)親本多肽或 一類親本多肽相比具有改善的活性或穩(wěn)定性,該方法包括:識(shí)別多個(gè)(P)進(jìn)化上、結(jié)構(gòu)上或 者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽;在多個(gè)相關(guān)多肽的至少第一多肽和至少第二多肽中選擇包 含N個(gè)肽區(qū)段的一組交叉位置;從具有穩(wěn)定的功能表達(dá)的多個(gè)進(jìn)化上、結(jié)構(gòu)上或者進(jìn)化上和 結(jié)構(gòu)上相關(guān)的多肽中選擇親本;產(chǎn)生多個(gè)嵌合體,所述嵌合體包含親本的N-1個(gè)肽區(qū)段以及 所述多個(gè)進(jìn)化上、結(jié)構(gòu)上或者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽中另一個(gè)多肽的一個(gè)異源肽區(qū) 段;識(shí)別具有增強(qiáng)活性或穩(wěn)定性的改善的嵌合體以及識(shí)別異源肽區(qū)段作為改善的單體中的 活性/穩(wěn)定性相關(guān)的肽區(qū)段;產(chǎn)生重新組合的重組蛋白的樣品集UP"),所述重組蛋白包含 所述至少第一多肽和第二多肽中的每一個(gè)的活性/穩(wěn)定性相關(guān)的肽區(qū)段,其中x〈l;測(cè)量折 疊表達(dá)的重新組合的重組蛋白的樣品集的穩(wěn)定性;產(chǎn)生包含一個(gè)或多個(gè)活性/穩(wěn)定性相關(guān) 的肽區(qū)段的多個(gè)嵌合多肽。
[0013] 在一些實(shí)施方案中,所述改善的嵌合體可通過進(jìn)行回歸分析來識(shí)別。進(jìn)一步地,所 述回歸分析可包括確定序列穩(wěn)定性數(shù)據(jù)或折疊蛋白與未折疊蛋白的多重序列比對(duì)(MSA)的 共有序列分析。更進(jìn)一步地,所述序列穩(wěn)定性數(shù)據(jù)可包括與穩(wěn)定性測(cè)量可操作地關(guān)聯(lián)的序 列信息。
[0014] 在另一些實(shí)施方案中,所述選擇一組交叉位置可包括比對(duì)所述多個(gè)進(jìn)化上、結(jié)構(gòu) 上或者進(jìn)化上和結(jié)構(gòu)上相關(guān)的多肽的序列并識(shí)別序列同一性區(qū)域;進(jìn)一步地,所述方法可 包括序列比對(duì)以及選自由以下組成的組的一種或多種方法:X射線晶體學(xué)、NMR、搜索蛋白結(jié) 構(gòu)數(shù)據(jù)庫(kù)、同源模建、從頭蛋白折疊及計(jì)算蛋白結(jié)構(gòu)預(yù)測(cè)。
[0015] 在一些實(shí)施方案中,所述選擇一組交叉位置可包括:識(shí)別所述至少第一多肽中的 殘基對(duì)之間的偶聯(lián)相互作用;產(chǎn)生多個(gè)數(shù)據(jù)結(jié)構(gòu),每個(gè)數(shù)據(jù)結(jié)構(gòu)代表包含所述至少第一多 肽和第二多肽的重組的交叉突變體,其中每個(gè)重組具有不同的交叉位置;對(duì)每個(gè)數(shù)據(jù)結(jié)構(gòu) 確定與由所述數(shù)據(jù)結(jié)構(gòu)代表的交叉突變體中被破壞的偶聯(lián)相互作用的數(shù)目相關(guān)的交叉破 壞;及在所述多個(gè)數(shù)據(jù)結(jié)構(gòu)中識(shí)別具有低于閾值的交叉破壞的特定數(shù)據(jù)結(jié)構(gòu),其中由所述 特定數(shù)據(jù)結(jié)構(gòu)代表的交叉突變體的交叉位置是被識(shí)別的交叉位置。進(jìn)一步地,偶聯(lián)相互作 用可通過確定殘基之間的構(gòu)象能量或原子間距離來識(shí)別。更進(jìn)一步地,該原子間距離可由 多個(gè)多肽中的至少一個(gè)多肽的三維結(jié)構(gòu)來確定。在一些實(shí)施方案中,所述至少第一多肽和 第二多肽的每一個(gè)的構(gòu)象能量可由所述第一多肽和第二多肽中的至少一個(gè)的三維結(jié)構(gòu)來 確定。在另一些實(shí)施方案中,偶聯(lián)相互作用可通過高于閾值的殘基之間的構(gòu)象能量來識(shí)別。 在某些實(shí)施方案中,所述閾值可是所述多個(gè)數(shù)據(jù)結(jié)構(gòu)的交叉可破壞的平均水平;進(jìn)一步地, 交叉位置的識(shí)別可包括基于序列同一性區(qū)域來識(shí)別所述多肽中的可能的切割點(diǎn)。更進(jìn)一步 地,所述序列同一性區(qū)域可必須包含至少4個(gè)殘基。再更進(jìn)一步地,穩(wěn)定性的測(cè)量可包括選 自由以下組成的組的技術(shù):化學(xué)穩(wěn)定性測(cè)量、功能穩(wěn)定性測(cè)量和熱穩(wěn)定性測(cè)量。具體來說, 所述化學(xué)穩(wěn)定性測(cè)量可包括化學(xué)變性測(cè)量;所述熱穩(wěn)定性測(cè)量可包括熱變性測(cè)量;所述功 能穩(wěn)定性測(cè)量可包括配體或底物結(jié)合技術(shù)。
[0016] 在又一些實(shí)施方案中,本公開的方法還可包括創(chuàng)建具有肽區(qū)段的片段的單體。在 另一些實(shí)施方案中,親本可包括與SEQ ID N0:15具有至少80%-100%同一性的序列。
[0017] 附圖簡(jiǎn)述
[0018]圖1A-B顯示了 CBH I多肽的三維結(jié)構(gòu)以及重組區(qū)塊圖。(A)CBH I催化結(jié)構(gòu)域三維 結(jié)構(gòu)。形成二硫鍵的Cys殘基由通過黑線連接的球體表示。(B)CBH I重組區(qū)塊分割及二級(jí)結(jié) 構(gòu)圖。區(qū)塊間二硫鍵由栗色線表示,區(qū)塊間二硫鍵由淺藍(lán)色線表示,區(qū)塊分割由黑色箭頭表 示。埃默森籃狀菌(T · emersonii)CBH I的殘基編號(hào)。
[0019] 圖2顯示了親本CBH I以及32個(gè)單體的總分泌CBH I MUL-水解活性。單體含有從親 本1-4到親本5(來自埃默森籃狀菌)的單區(qū)塊取代。埃默森籃狀菌的CBH I的總分泌CBH I MUL-水解活性由粉色棒表示。在45°C下將酵母分泌培養(yǎng)上清液用300μ Μ可溶的熒光MUL底 物孵育30分鐘。三個(gè)獨(dú)立的埃默森籃狀菌分泌培養(yǎng)物的單一活性測(cè)量的平均值是2.3 X 10- 4mol MUL/(L · s),標(biāo)準(zhǔn)偏差是3.0X10-5mol MUL/(L · s)。所有其它值代表單一培養(yǎng)物和 測(cè)量。在圖的底部的黑線表示T5Q測(cè)量的1.6Xl(T5m 〇l MUL/(L · s)的活性閾值。
[0020] 圖3顯示了28個(gè)CBH I單體相對(duì)于埃默森籃狀菌(T5Q = 62.9+/-0.3°C)親本的T50值 (°C)的改變。單體含有從親本1-4到親本5 (來自埃默森籃狀菌)中的單區(qū)塊取代。單體的誤 差棒代表兩個(gè)重復(fù)測(cè)量的極值。親本的誤差棒代表3個(gè)重復(fù)到8個(gè)重復(fù)的標(biāo)準(zhǔn)偏差。嗜熱毛 殼菌(C·thermophilum)和嗜熱子囊菌(T·aurantiacus)親本CBH I的Τδ〇值分別是59·9+/-0 · 3°C和62 · 2+/-0 · 4°C。未分泌紅褐肉座菌(H. jecorina)和嗜熱支頂抱(A. thermophilum) 親本CBH I。
[0021] 圖4顯示了親本CBH I的T5Q值、總酵母分泌活性(mol MUL/(L · s)X105)以及區(qū)塊 序列。單體的T5Q誤差棒代表兩個(gè)重復(fù)測(cè)量的極值,親本的誤差棒代表3個(gè)重復(fù)和8個(gè)重復(fù)之 間的標(biāo)準(zhǔn)偏差。除親本5(埃默森籃狀菌,對(duì)于三個(gè)獨(dú)立培養(yǎng)物的單一測(cè)量,其具有(2.3+/_ 0.3) X l(T4m〇l MUL/(L · s)的平均值和標(biāo)準(zhǔn)偏差總酵母分泌活性)以外,總分泌活性值[mol MUL/(L · s)]是單一培養(yǎng)物的單一測(cè)量。親本3(紅褐肉座菌)和親本4(嗜熱支頂孢)的分泌 水平低于T5Q測(cè)量的閾值。
[0022] 圖5顯示了親和分離的CBH I親本和嵌合體的標(biāo)準(zhǔn)化高溫固體纖維素水解活性。所 顯示的值是相對(duì)于在50°C下的活性的在給定的溫度下的活性。在50mM醋酸鈉、pH 4.8中,用 60mg/mL固體纖維素和14.6yg/mL親和分離的CBH I進(jìn)行反應(yīng)16小時(shí)。誤差棒表示三個(gè)重復(fù) 的標(biāo)準(zhǔn)偏差。*5表示具有穩(wěn)定化子區(qū)塊C插入的親本5的區(qū)塊7。
[0023] 圖6顯示了CBH I親本和嵌合體的針對(duì)固體纖維素的總酵母分泌活性。在4°C下,在 50mM醋酸鈉、pH 4.8中用微晶纖維素孵育酵母培養(yǎng)上清液1小時(shí)以結(jié)合CBH I。隨后將纖維 素洗滌并允許在37°C下進(jìn)行水解90分鐘。誤差棒代表三個(gè)重復(fù)的標(biāo)準(zhǔn)偏差。*5表示具有穩(wěn) 定化子區(qū)塊C插入的親本5的區(qū)塊7。
[0024] 圖7顯示了CBH I親本催化結(jié)構(gòu)域(分別是SEQ ID N0:2、4、6、8、10)的ClustalW多 重序列比對(duì),區(qū)塊邊界由黑線表示。
[0025]圖8顯示了CBH I親本YPD酵母培養(yǎng)分泌上清液的SDS-PAGE分析。主要埃默森籃狀 菌CBH I條帶出現(xiàn)在~62kDa處,并且由綠色矩形涵蓋。相對(duì)于~53kDa的氨基酸分子質(zhì)量的 分子質(zhì)量的增加可通過來自N-