酶的自然變異體的獲取方法及超耐熱性纖維二糖水解酶的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種酶的自然變異體的獲取方法,以及通過(guò)該方法獲得的超耐熱性纖 維二糖水解酶(celIobiohydrolase)。
[0002] 本申請(qǐng)要求2014年3月13日在日本提出的特愿2014-050083號(hào)申請(qǐng)的優(yōu)先權(quán), 并將其內(nèi)容引用在本申請(qǐng)中。
【背景技術(shù)】
[0003] 在地球上存在有豐富的木質(zhì)纖維素生物質(zhì),人們期待以將其作為原料的乙醇等生 物燃料來(lái)替代化石燃料成為運(yùn)輸用能源。將木質(zhì)纖維素轉(zhuǎn)變成乙醇,需要纖維素、半纖維素 的糖化。在纖維素糖化中,有硫酸糖化和酶糖化兩種方法。通常,基于統(tǒng)稱(chēng)為纖維素酶的糖 苷水解酶的糖化與硫酸糖化相比,具有不產(chǎn)生硫酸淤渣、能源投入量少以及不會(huì)引起過(guò)分 解、收率高等優(yōu)點(diǎn)。
[0004] 另一方面,構(gòu)成植物細(xì)胞壁的纖維素,其具有相互由堅(jiān)固的氫鍵連接的結(jié)晶結(jié)構(gòu), 因此幾乎不溶于水,基于酶的纖維素水解為固液反應(yīng)。固液反應(yīng)是在固體表面上進(jìn)行結(jié)晶 性纖維素的水解,因此,基于酶的糖化效率非常低。例如,作為主要的纖維素水解酶的纖維 二糖水解酶(CBH)與其它多糖類(lèi)分解酶相比,水解速度要慢一位數(shù)至兩位數(shù)左右,因此,纖 維素生物質(zhì)的糖化需要大量的酶,這形成纖維素類(lèi)生物燃料的主要的成本因素。為了降低 纖維素乙醇的成本,需要格外提高纖維素酶的糖化效率。
[0005] 提尚酶效率的一種方法為提尚酶蛋白質(zhì)的耐熱性。為了提尚酶蛋白質(zhì)的耐熱性, 人們嘗試了隨機(jī)替換氨基酸序列的定向進(jìn)化(directed evolution,DE)法、限定特定部位 進(jìn)行氨基酸取代的定點(diǎn)突變(site-directed mutagenesis,SDM)法、將多個(gè)基因在多處進(jìn) 行切斷并通過(guò)改組制成嵌合序列的方法等導(dǎo)入氨基酸變異的各種酶的改良方法。
[0006] 基于DE法的酶改性在理論上效率極差。其原因在于伴隨點(diǎn)突變的數(shù)量,變異體的 數(shù)量呈天文數(shù)字級(jí)增長(zhǎng),即會(huì)產(chǎn)生"組合爆炸問(wèn)題"。若想得到最適合的氨基酸排列,則需要 針對(duì)全部氨基酸殘基的組合制作突變體庫(kù)并進(jìn)行功能檢驗(yàn),這在原理上是不可能的。此外, 突變的大部分幾乎為喪失功能的功能不全型(loss of function),獲得中立突變或有利的 功能的功能獲得型(gain of function)十分稀有,基于DE法的最優(yōu)選氨基酸序列的探索 效率差。
[0007] 由于必須對(duì)龐大數(shù)量的突變體庫(kù)進(jìn)行篩查才能獲得有效的突變體、沒(méi)有有效的高 通量(high-throughput)篩查法或穩(wěn)定基因表達(dá)系統(tǒng)等原因(例如,參照非專(zhuān)利文獻(xiàn)1。), 該基于DE法的纖維素酶的功能改良無(wú)法充分進(jìn)行。
[0008] 例如,中澤等提出了將木材腐朽菌里氏木霉(Trichoderma reesei)的內(nèi)切葡聚糖 酶EGIII通過(guò)DE法進(jìn)行改良的報(bào)告(參見(jiàn)非專(zhuān)利文獻(xiàn)2)。該EGIII為由218氨基酸殘基 構(gòu)成的具有比較小的分子量的蛋白質(zhì)。但是,即使是這種小的蛋白質(zhì),任意一處發(fā)生氨基酸 取代引起的突變?cè)斐傻淖儺愺w數(shù)量為4, 360種(20X218)、任意兩處突變?cè)斐傻淖儺愺w數(shù) 量為946萬(wàn)種(20 X 20 X 218 X 217 + 2),更進(jìn)一步地,任意三處突變?cè)斐傻淖儺愺w數(shù)量發(fā)生 爆炸性組合,為 136 億 2413 萬(wàn)種(20 X 20 X 20 X (218X217X216 + 6))。
[0009] 只是獲得兩三處變異的變異體,就需要制作數(shù)千萬(wàn)~數(shù)百億個(gè)的突變庫(kù)及其功能 篩查,這并不現(xiàn)實(shí)。中澤等人對(duì)第一代及第二代共11,〇〇〇個(gè)突變體個(gè)體進(jìn)行了功能篩查, 但僅限于將最適溫度作了+5°C的改善,并未實(shí)現(xiàn)耐熱性的大幅提高。若突變體庫(kù)的規(guī)模小, 顯然無(wú)法發(fā)現(xiàn)有效的變異體。此外,在進(jìn)行功能篩查的第一代突變庫(kù)9, 000個(gè)群落中,只獲 得了 46個(gè)具有CMC水解活性的變異體群落。8, 954個(gè)殘余的突變體被認(rèn)為是氨基酸變異導(dǎo) 致的功能喪失或基因的表達(dá)不全,因 DE法的誤差(error) PCR引發(fā)的隨機(jī)突變大部分都導(dǎo) 致了酶蛋白質(zhì)的功能喪失。如此,DE法由于產(chǎn)生大量的功能喪失變異體,因此篩查效率非 常差。
[0010] 基因改組法,迄今為止還無(wú)法獲得在耐熱性上超過(guò)親本基因的嵌合基因。例如, Heinzelman等人提出,在多處切斷多個(gè)纖維二糖水解酶基因,通過(guò)改組制成嵌合基因,以謀 求酶功能的改善的方法(參見(jiàn)非專(zhuān)利文獻(xiàn)3)。根據(jù)該方法,以提高里氏木霉的內(nèi)切葡聚糖 酶CBH II的耐熱性為目的,通過(guò)基因改組將嗜熱絲狀菌特異腐質(zhì)霉(Humicola insolens) 與嗜熱毛殼菌(Chaetomium thermopHilum)的CBH II酶基因進(jìn)行組合,制作嵌合酶,但所 述嵌合酶的耐熱性未超過(guò)作為親本的嗜熱絲狀菌嗜熱毛殼菌的CBH II,無(wú)法獲得有效的基 因改組效果。
[0011] 相對(duì)于靠隨機(jī)突變的氨基酸取代的DE法,SDM法則為根據(jù)酶蛋白質(zhì)的三維立體結(jié) 構(gòu)數(shù)據(jù)而引發(fā)氨基酸取代、缺失或插入等突變的方法。雖然不需要DE法那樣龐大的突變體 篩查,但一般情況下難以預(yù)測(cè)出與提高酶功能相關(guān)的部位的確定,通過(guò)SDM法而使纖維素 酶功能得到顯著改善的例子并不多。
[0012] 例如,纖維二糖水解酶在N末端和C末端上分別有環(huán)狀結(jié)構(gòu),形成覆蓋活性中心的 洞形(tunnel)結(jié)構(gòu)。人們著眼于該結(jié)構(gòu),正在嘗試取代環(huán)內(nèi)的氨基酸的SDM法。在張等 人的報(bào)告中指出,他們嘗試推算出嗜熱放線菌(Thermobifida fusca)的纖維二糖水解酶 TfCe 16B的三維立體結(jié)構(gòu),在形成活性部位的洞狀結(jié)構(gòu)的N末端、C末端的環(huán)上通過(guò)雙重突 變導(dǎo)入二硫鍵,提高耐熱性,但是與期待相反,所得變異體的酶活性的半衰期溫度T 5tl減少 了 l〇°C (參見(jiàn)非專(zhuān)利文獻(xiàn)4)。張等人進(jìn)一步將四處的甘氨酸殘基取代為丙氨酸、絲氨酸、 脯氨酸,但均未獲得因突變而使耐熱性得到提高的纖維二糖水解酶,大部分的突變體的耐 熱性都降低了 5~10°C。
[0013] 此外,沃爾法特等人的報(bào)告中指出,他們?yōu)榱颂岣邔儆诮z狀菌T. reesei的GH6家 族的纖維二糖水解酶TfCe 16A的熱穩(wěn)定性,在N末端環(huán)及C末端環(huán)上和位于其附近的氨基 酸殘基上加入變異,制備變異體,該變異體雖然在PH7.0下熱變性溫度(Tm)上升,但在野生 型TfCe 16A的最適pH,即pH5.0下,Tm值反而變差(參見(jiàn)非專(zhuān)利文獻(xiàn)5)。另一方面,馮?奧 斯托夫斯基(Von ostrowski)等人為了使形成屬于絲狀菌T. reesei的GH7家族的纖維二 糖水解酶TfCe 17A活性中心的洞狀環(huán)的exo-loop結(jié)構(gòu)的穩(wěn)定,在所述環(huán)內(nèi)導(dǎo)入SS (二硫) 鍵而制作變異體,但未確認(rèn)出所述變異體有任何熱穩(wěn)定性的改善(參見(jiàn)非專(zhuān)利文獻(xiàn)6)。如 此,在形成認(rèn)為與纖維二糖水解酶酶功能密切相關(guān)的環(huán)結(jié)構(gòu)的C末端環(huán)上,進(jìn)行了多次導(dǎo) 入氫鍵或SS鍵的嘗試,但迄今為止,耐熱性的提高等、酶功能改善并不成功。
[0014] 若對(duì)相同的基因進(jìn)行生物種間比較,則可知具有充分保存的區(qū)域和頻繁進(jìn)行氨基 酸變異的區(qū)域,該保存區(qū)域?yàn)橘x予特定范疇的蛋白質(zhì)特征的共通的序列,因此被稱(chēng)為"共用 序列"。該共用序列中的氨基酸殘基若變異則為易失去酶功能的部位,因此其能在漫長(zhǎng)進(jìn)化 過(guò)程中得到良好保存。因此,在共用序列發(fā)生氨基酸變異引起突變,功能喪失的可能性高。 在此,人們嘗試了避開(kāi)共用序列而加入突變的SDM法。但是,能適用該方法的僅限于通過(guò)X 射線結(jié)晶結(jié)構(gòu)解析等來(lái)確定蛋白質(zhì)的三維結(jié)構(gòu)的酶,而這種明確了三維結(jié)構(gòu)的酶蛋白質(zhì)很 少。
[0015] 現(xiàn)有技術(shù)文獻(xiàn)
[0016] 非專(zhuān)利文獻(xiàn)
[0017] [非專(zhuān)利文獻(xiàn) 1]Himmel,et al.,Current Opinion in Biotechnology,1999, vol. 10, p. 358 ~364 ;
[0018] [非專(zhuān)利文獻(xiàn) 2]Nakazawa,et al.,Applied Microbiology and Biotechnology, 2009, vol. 83, p. 649 ~657 ;
[0019] [非專(zhuān)利文獻(xiàn) 3] Heinzelman, et al. ?Proceedings of the National Academy of Sciences of the United States of America,2009,vol. 106,p.5610 ~5615;
[0020] [非專(zhuān)利文獻(xiàn) 4] Zhang,et al.,European Journal of Biochemistry,2〇00, vol. 267, p. 3101 ~3115 ;
[0021] [非專(zhuān)利文獻(xiàn) 5] Wohlfahrt,et al.,Biochemistry,2003,vol. 42,ρ· 10095 ~ 10103 ;
[0022] [非專(zhuān)利文獻(xiàn) 6] Von Ossowski,et al.,Journal of Molecular Biology,2003, vol. 333, p. 817 ~829。
【發(fā)明內(nèi)容】
[0023] 本發(fā)明要解決的技術(shù)問(wèn)題
[0024] 本發(fā)明的目的在于,提供一種高效地獲取功能獲得型變異體的方法。
[0025] 更進(jìn)一步地,本發(fā)明的目的在于,提供一種由上述方法獲得的新型超耐熱性纖維 二糖水解酶、編碼所述超耐熱性纖維二糖水解酶的多聚核苷酸、用于表達(dá)所述超耐熱性纖 維二糖水解酶的表達(dá)載體、編入了所述表達(dá)載體的轉(zhuǎn)化體,以及使用所述超耐熱性纖維二 糖水解酶的纖維素分解物的制備方法。
[0026] 解決技術(shù)問(wèn)題的技術(shù)手段
[0027] 本發(fā)明人為了解決上述問(wèn)題,經(jīng)認(rèn)真研宄后發(fā)現(xiàn),通過(guò)使用由高溫土壤中所含的 微生物菌叢的宏基因組DNA中分離出的纖維二糖水解酶的堿基序列設(shè)計(jì)的引物,對(duì)高溫 土壤微生物菌叢的宏基因組DNA,實(shí)施多個(gè),例如300個(gè)以?xún)?nèi)的群落PCR,伴隨多個(gè)氨基 酸的取代,或能夠獲取具有包含靜態(tài)(silent)的單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)的多個(gè)超耐熱性纖維二糖水解酶活性的自然變異體,從而完成了本發(fā) 明。
[0028] 此外,本發(fā)明中的"自然變異體",是指通過(guò)人為手段產(chǎn)生的突變體以外的一切突 變體。
[0029] "超耐熱性"是指酶活性的最適溫度或酶蛋白質(zhì)的熱變性溫度為80°C以上。
[0030] 即,作為本發(fā)明涉及的酶的自然變異體的獲取方法、酶的變異體的制備方法、超耐 熱性纖維二糖水解酶、編碼所述超耐熱性纖維二糖水解酶的多聚核苷酸、用于表達(dá)所述超 耐熱性纖維二糖水解酶的表達(dá)載體、編入所述表達(dá)載體的轉(zhuǎn)化體、超耐熱性纖維二糖水解 酶的制備方法、纖維素酶混合物及纖維素分解物的制備方法,可列舉為如下[1]~[13]。
[0031] [1] 一種選擇性地獲取具有活性的酶的自然變異體的方法,該方法包括以下工 序:
[0032] (1)從由環(huán)境微生物菌叢宏基因組DNA的堿基序列組成的基因組數(shù)據(jù)庫(kù)中,檢測(cè) 具有酶活性的蛋白質(zhì)ORF(以下也稱(chēng)作開(kāi)放閱讀框)序列的工序;
[0033] (2)使用基于該ORF序列而設(shè)計(jì)的引物,對(duì)至少一個(gè)環(huán)境微生物菌叢宏基因組DNA 進(jìn)行PCR克隆,獲得至少一個(gè)由該ORF序列的全長(zhǎng)、該ORF序列的部分序列、或編碼該ORF 序列所編碼的氨基酸序列中至少缺失、取代或添加了一個(gè)氨基酸殘基的氨基酸序列的堿基 序列所組成的PCR克隆的工序;
[0034] (3)對(duì)在所述工序(2)中得到的各PCR克隆,確定堿基序列及該堿基序列所編碼的 氨基酸序列的工序;
[0035] (4)測(cè)定在所述工序(2)中得到的各PCR克隆所編碼的蛋白質(zhì)的酶活性,選擇具有 活性的酶的自然變異體的工序。
[0036] [2] -種具有活性的酶的變異體的制備方法,該方法包括以下工序:
[0037] (1)從由環(huán)境微生物菌叢宏基因組DNA的堿基序列組成的基因組數(shù)據(jù)庫(kù)中,檢測(cè) 具有酶活性的蛋白質(zhì)ORF序列的工序;
[0038] (2)使用基于該ORF序列而設(shè)計(jì)的引物,對(duì)至少一個(gè)環(huán)境微生物菌叢宏基因組DNA 進(jìn)行PCR克隆,獲得至少一個(gè)由該ORF序列的全長(zhǎng)、該ORF序列的部分序列、或編碼該ORF 序列所編碼的氨基酸序列中至少缺失、取代或添加了一個(gè)氨基酸殘基的氨基酸序列的堿基 序列所組成的PCR克隆的工序;
[0039] (3)對(duì)在所述工序(2)中得到的各PCR克隆,確定堿基序列及該堿基序列所編碼的 氨基酸序列的工序;
[0040] (4)測(cè)定在所述工序⑵中得到的各PCR克隆所編碼的蛋白質(zhì)的酶活性的工序;
[0041] (5)在所述工序(3)及所述工序(4)后,考察所述ORF序列編碼的氨基酸序列的差 異與所述酶活性的關(guān)系的工序;
[0042] (6)基于所述工序(5)中得到的氨基酸序列的差異與酶活性的關(guān)系性,通過(guò)使所 述ORF序列編碼的氨基酸序列至少缺失、取代或添加一個(gè)氨基酸殘基,從而制備所述酶活 性得到提高的變異體的工序。
[0043] [3]上述[2]所述的酶的變異體的制備方法,其中,所述環(huán)境微生物菌叢的宏基因 組DNA為來(lái)自高溫土壤的宏基因組DNA,所述酶為至少在70°C以上顯示酶活性的耐熱性酶。
[0044] [4]上述[2]或[3]所述的酶的變異體的制備方法,其中,所述酶為纖維素酶。
[0045] [5] -種具有纖維二糖水解酶催化劑區(qū)域的超耐熱性纖維二糖水解酶,其中,該纖 維二糖水解酶催化劑區(qū)域由下述組成:
[0046] (A)由SEQ ID NO :1所示的氨基酸序列所組成的多肽;
[0047] (B)由SEQ ID NO :1所示的氨基酸序列中,至少缺失、取代或添加了一個(gè)氨基酸殘 基(除了缺失、取代或添加了一個(gè)氨基酸殘基的氨基酸序列中的88位的絲氨酸、230位的苯 丙氨酸、414位的絲氨酸)的氨基酸序列所組成,且至少在80°C、pH5. 5的條件下具有纖維 二糖水解酶活性的多肽;
[0048] (C)由與SEQ ID NO :1所示的氨基酸序列具有80%以上的序列同源性的氨基酸序 列(88位為絲氨酸,230位為苯丙氨酸,414位為絲氨酸)所組成,且至少在80°C、pH5. 5的 條件下具有纖維二糖水解酶活性的多肽。
[0049] [6] -種含有對(duì)纖維二糖水解酶催化劑區(qū)域進(jìn)行編碼的區(qū)域的多聚核苷酸,其中, 所述對(duì)纖維二糖水解酶催化劑區(qū)域進(jìn)行編碼的區(qū)域由下述組成:
[0050] (a)對(duì)由SEQ ID NO :1所示的氨基酸序列所組成的多肽進(jìn)行編碼的堿基序列;
[0051] (b)對(duì)由SEQ ID NO :1所示的氨基酸序列中,至少缺失、取代或添加了一個(gè)氨基酸 殘基(除了缺失、取代或添加了一個(gè)氨基酸殘基的氨基酸序列中的88位的絲氨酸、230位的 苯丙氨酸、414位的絲氨酸)的氨基酸序列所組成且至少在80°C、pH5. 5的條件下具有纖維 二糖水解酶活性的多肽進(jìn)行編碼的堿基序列;
[0052] (c)對(duì)由與SEQ ID NO :1所示的氨基酸序列具有80%以上的序列同源性的氨基酸 序列(88位為絲氨酸,230位為苯丙氨酸,414位為絲氨酸。)所組成且至少在80°C、pH5. 5 的條件下具有纖維二糖水解酶活