專利名稱:通過光合生物產(chǎn)生分子的制作方法
通過光合生物產(chǎn)生分子相關(guān)申請的交叉參考本申請要求美國臨時申請?zhí)?0/971,418(2007年9月11日提交)、 60/971,412 (2007年9月11日提交)和61/130,892 (2008年6月2日提交)的優(yōu)先權(quán)和權(quán) 益,它們在此通過引用被并入。通過引用并入本說明書中提到的所有出版物和專利申請在此通過引用被并入,其程度如同每一 份單獨的出版物或?qū)@暾埍惶囟ㄇ覇为毜刂该魍ㄟ^引用而并入。
背景技術(shù):
燃料產(chǎn)品,如油料、石油化學(xué)產(chǎn)品及對石化產(chǎn)品生產(chǎn)有用的其它物質(zhì),對它們的需 求不斷增長。當(dāng)今大多數(shù)燃料產(chǎn)品是從化石燃料中生產(chǎn)的,所述化石燃料被認為是不可再 生的能量來源,因為它們是有機物質(zhì)在上百萬年的過程中被連續(xù)的沉積層覆蓋的結(jié)果。也 存在增長的減少對進口原油依賴的期望。關(guān)于污染和環(huán)境危害的公共意識也已經(jīng)提高。因 此,對生產(chǎn)燃料產(chǎn)品的替代方法,已經(jīng)存在增長的興趣和需要。所以,對開發(fā)燃料產(chǎn)品的替 代方法存在緊迫的需要,所述燃料產(chǎn)品是可再生的,可持續(xù)的,并且對環(huán)境危害較小。發(fā)明概述本發(fā)明涉及使用光合生物生產(chǎn)產(chǎn)物的組合物及方法,所述產(chǎn)物例如類異戊二烯, 其可以被用于多種用途(如燃料、燃料原料、香料和殺蟲劑)。所述組合物包括包含一個或 多個核苷酸序列的表達載體,所述核苷酸序列起始、提高或影響產(chǎn)物在無維管光合生物中 的生產(chǎn)。在一些情況中,這樣的核苷酸序列編碼甲羥戊酸途徑(MVA途徑)中的一個或多個 多肽。MVA途徑中多肽的實例包括,但不限于,硫解酶、HMG-CoA合成酶、HMG_CoA還原酶、甲 羥戊酸激酶、磷酸甲羥戊酸(phosphemevalonate)激酶或甲羥戊酸_5_焦磷酸脫羧酶。在 另一些實施方式中,所述核苷酸序列編碼非甲羥戊酸途徑(MEP途徑)中的一個多肽。該多 肽可以是D0XP合成酶、D0XP還原酶、4- 二磷酸胞苷-2-C-甲基-D-赤蘚糖醇合成酶(4_di phosphocytidyl-2-C-methyl-D-erythritol synthase)、4_ 二磷酸胞苷 ~2~C~ 甲基 _D_ 赤 蘚糖醇激酶、2-C-甲基-D-赤蘚糖醇2,4-環(huán)二磷酸合成酶(2-C-methyl-D-erythritol 2, 4,-cyclodiphosphatesynthase)、HMB-PP 合成酶、HMB-PP 還原酶和 D0XP 還原異構(gòu)酶。本發(fā)明的一個方面提供了一種載體,所述載體包含編碼生產(chǎn)帶有兩個磷酸根的類 異戊二烯的酶的核酸和被配置來在無維管光合生物(NVP0)的葉綠體中表達核酸的啟動 子,但該載體不包含葉綠體整個基因組。實際上,該載體插入葉綠體基因組中可以不破壞葉 綠體的光合能力。在另一些實施方式中,本發(fā)明所述的載體進一步包含促進與葉綠體基因 組同源重組的核酸序列。在一些實施方式中,通過這里公開的載體中編碼的酶生產(chǎn)的類異 戊二烯為GPP、IPP、FPP、GGPP或DMAPP。在這里公開的一些載體中,編碼第二種酶的第二個 核酸也存在于所述載體中,所述第二種酶修飾有兩個磷酸根的類異戊二烯。可由本發(fā)明所 述載體編碼的第二種酶的具體實例包括,但不限于,葡萄烴(botryococcene)合成酶、苧烯 (limonene)合成酶、桉葉油素(cineole)合成酶、菔烯(pinene)合成酶、莰烯(camphene)
12合成酶、檜萜(sabinene)合成酶、月桂烯(myrcene)合成酶、松香二烯(abietadiene) 合成酶、紫杉二烯(taxadiene)合成酶、FPP合成酶、紅沒藥烯(bisabolene)合成酶、 diapophytoene去飽和酶、diapophytoene合成酶、GPP合成酶、IPP異構(gòu)酶、單萜合成酶、異 松油烯(terpinolene)合成酶、姜烯(zingiberene)合成酶、羅勒烯(ocimene)合成酶、倍 半萜合成酶、姜黃烯(curcumene)合成酶、法尼烯(farnesene)合成酶、忙牛兒基忙牛兒基 還原醇、葉綠素酉旨7K角軍醇(chlorophyllidohydrolase) > β -石竹煉(β -caryophyllene) 合成酶、大根香葉烯Afeermacrene Α)合成酶、8-表雪松醇(8-印icedrol)合成酶、朱欒倍 半萜(valencene)合成酶、(+)_ δ -杜松烯((+)- δ -cadinene)合成酶、大根香葉烯C合成 酶、(Ε)-β-法尼烯合成酶、蓖麻烯(casbene)合成酶、vetispiradiene合成酶、5_表-馬 兜鈴烯(5-印i-aristolochene)合成酶、馬兜鈴烯(aristolchene)合成酶、α-潷草烯 (α-humulene), (Ε, Ε)-α-法尼烯合成酶、(_)_β-菔烯合成酶、Y-松油烯合成酶、苧烯 環(huán)化酶、沉香醇(linalool)合成酶、(+)-冰片二磷酸(bornyl diphosphate)合成酶、左旋 海松二烯(Ievopimaradiene)合成酶、異海松二烯(isopimaradiene)合成酶、(E)-γ-紅 沒藥烯合成酶、柯巴基焦磷酸(copalyl pyrophosphate)合成酶、貝殼衫烯(kaurene)合 成酶、長葉烯(longifolene)合成酶、Y-潷草烯合成酶、δ-蛇床烯(selinene)合成 酶、β-水芹烯(phellandrene)合成酶、異松油烯(terpinolene)合成酶、(+)_3_蒈烯 (carene)合成酶、順-柯巴基二磷酸(syn-copalyl diphosphate)合成酶、α-松油醇 (terpineol)合成酶、順-海松 _7,15-二烯(syn-pimara-7,15-diene)合成酶、反-山 ;豐公二; (sandaaracopimaradiene)sterner-13-eneE-β - ^WjM^
S-沉香醇合成酶、櫳牛兒醇(geraniol)合成酶、γ-松油烯(gamma-terpinene)合成酶、 沉香醇合成酶、E-β-羅勒烯合成酶、表-雪松醇(印i-cedrol)合成酶、α -姜烯合成酶、 愈創(chuàng)木二烯(guaiadiene)合成酶、卡藜二烯(cascarilladiene)合成酶、順-穆羅拉二 烯(muuroladiene)合成酶、阿菲迪柯林_16b_醇(aphidicolan-16b_ol)合成酶、伊麗莎 白三烯(elizabethatriene)合成酶、檀香醇(sandalol)合成酶、廣藿香醇(patchoulol) 合成酶、zinzanol合成酶、雪松醇合成酶、香紫蘇醇(scareol)合成酶、柯巴醇(copalol) 合成酶或淚柏醇(manool)合成酶。所述載體也可包含選擇性標記。本發(fā)明所述的具 體載體能夠在微藻(microalga)中穩(wěn)定轉(zhuǎn)化。在一些實施方式中,所述海藻種為萊茵 衣藻(C.reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻 (S. dimorphus)、綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。對于無維管光合 微生物核酸和/或葉綠體的表達,編碼酶的核酸序列可以是偏倚的(biased)。編碼本發(fā)明 中有用的酶的序列可以是這里具體公開的序列(如表5-8中的序列)或與其有60、65、70、 75、80、85、90、95或更高同一性的序列中的任一序列。本發(fā)明所述的一些載體包含這里具體 公開的序列(如表5-8中的序列)或與其有60、65、70、75、80、85、90、95或更高同一性的序 列中的任一序列。 這里公開的另一載體包含編碼生產(chǎn)帶有兩個磷酸根的類異戊二烯的酶的核酸, 和編碼葉綠體靶向分子的核酸,所述靶向分子用于將所述酶靶向葉綠體。這些載體可進 一步包含選擇性標記一促進與葉綠體或核基因組同源重組的核酸序列,或這些特征的 組合。在一些實施方式中,由所述核酸編碼的酶產(chǎn)生GPP、IPP、FPP、GGPP或DMAPP。這里 公開的這些載體進一步包含編碼第二種酶的核酸,所述第二種酶修飾帶有兩個磷酸根的
13類異戊二烯,和編碼葉綠體靶向分子的核酸,所述靶向分子用于將所述第二種酶靶向到葉 綠體。可由本發(fā)明所述載體編碼的第二種酶的具體實例包括,但不限于,葡萄烴合成酶、 苧烯合成酶、桉葉油素合成酶、菔烯合成酶、莰烯合成酶、檜萜合成酶、月桂烯合成酶、松香 二烯合成酶、紫杉二烯合成酶、FPP合成酶、紅沒藥烯合成酶、diapophytoene去飽和酶、 diapophytoene合成酶、GPP合成酶、IPP異構(gòu)酶、單萜合成酶、異松油烯合成酶、姜烯合成 酶、羅勒烯合成酶、倍半萜合成酶、姜黃烯合成酶、法尼烯合成酶、忙牛兒基忙牛兒基還原 酶、葉綠素酯水解酶、β “石竹烯合成酶、大根香葉烯A合成酶、8-表雪松醇合成酶、朱欒 倍半萜合成酶、(+)_ S-杜松烯合成酶、大根香葉烯C合成酶、(Ε)-β-法尼烯合成酶、蓖 麻烯合成酶、vetispiradiene合成酶、5_表-馬兜鈴烯合成酶、馬兜鈴烯合成酶、α -潷草 烯、(Ε,Ε)-α_法尼烯合成酶、(-)-β-菔烯合成酶、Y-松油烯合成酶、苧烯環(huán)化酶、沉香 醇合成酶、(+)_冰片二磷酸合成酶、左旋海松二烯合成酶、異海松二烯合成酶、(E)-Y-紅 沒藥烯合成酶、柯巴基焦磷酸合成酶、貝殼衫烯合成酶、長葉烯合成酶、Y-潷草烯合成酶、 δ -蛇床烯合成酶、β -水芹烯合成酶、異松油烯合成酶、(+) -3-蒈烯合成酶、順_柯巴基二 磷酸合成酶、α-松油醇合成酶、順-海松-7,15-二烯合成酶、反-山達海松二烯合成酶、 sterner-13-ene合成酶、E- β -羅勒烯、S-沉香醇合成酶、櫳牛兒醇合成酶、Y -松油烯合 成酶、沉香醇合成酶、E- β -羅勒烯合成酶、表-雪松醇合成酶、α -姜烯合成酶、愈創(chuàng)木二烯 合成酶、卡藜二烯合成酶、順_穆羅拉二烯合成酶、阿菲迪柯林_16b-醇合成酶、伊麗莎白三 烯合成酶、檀香醇合成酶、廣藿香醇合成酶、zinzanol合成酶、雪松醇合成酶、香紫蘇醇合成 酶、柯巴醇合成酶或淚柏醇合成酶。對于NVPO的密碼子,編碼用于本發(fā)明的酶的核酸可以 是偏倚的。本發(fā)明所述的具體載體能夠在微藻中穩(wěn)定轉(zhuǎn)化。在一些實施方式中,所述海藻 種為萊茵衣藻(C. reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形 柵藻(S. dimorphus)、綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。編碼本發(fā)明 中有用的酶的序列可以是這里具體公開的序列(如表5-8中的序列)或與其有60、65、70、 75、80、85、90、95或更高同一性的序列中的任一序列。本發(fā)明所述的一些載體包含這里具體 公開的序列(如表5-8中的序列)或與其有60、65、70、75、80、85、90、95或更高同一性的序 列中的任一序列。 本公開也提供了宿主細胞,其包含1)載體,其含有編碼生產(chǎn)帶有兩個磷酸根的 類異戊二烯的酶的核酸,和啟動子,其被配置為在NVPO的葉綠體中表達所述核酸,但該載 體不包含葉綠體整個基因組;或2)載體,其含有編碼生產(chǎn)帶有兩個磷酸根的類異戊二烯的 酶的核酸,和編碼用于靶向酶到葉綠體的葉綠體靶向分子的核酸。所述宿主細胞可與載體 中出現(xiàn)的一種或多種核酸同質(zhì)。這里考慮的宿主細胞的一些實例包括藍藻門、原綠藻門、紅 藻門、綠藻門、不等鞭毛門(heterokontophyta)、tribophyta、灰色藻門(glaucophyta)、絲 足蟲門(chlorarachniophytes)、裸藻門、眼蟲藻(euglenoid)、定鞭藻門(haptophyta)、金 藻Π (chrysophyta)、隱藻門(cryptophyta)、隱滴蟲(cryptomonad)、甲藻門(dinophyta)、 KfiIii^ (dinoflagellata) > ^Ι Ι^ ^ (pyrmnesiophyta) > Π (bacillariophyta) > Hi^ Π (xanthophyta) > H § jg (eustigmatophyte) Ifii^(raphidophyta) > Iii^ Π (phaeophyta)和浮游植物(phytoplankton)。宿主細胞的一些具體實例包括藻類種萊 茵衣藻(C. reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻 (S. dimorphus)、綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。在一些實施方式
14中,葉綠素水平對宿主細胞在轉(zhuǎn)化后能夠光自養(yǎng)是足夠的。在另一些實施方式中,所述宿主 細胞可產(chǎn)生比相同生物的野生型株更高水平的至少一種天然生成的類異戊二烯。在本發(fā)明的另一實施方式中,提供了一種宿主細胞,其包含本文所述的核苷酸 序列(如,表5-8中)或具有與這些序列中任一序列至少70%同一性的核苷酸序列的至 少兩個拷貝。宿主細胞可以是無維管光合生物,特別地是萊茵衣藻(C.reinhardtii)、鹽 生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻(S. dimorphus)、綠色杜氏藻 (D. viridis)或杜氏鹽藻(D. tertiolecta)。在一些實施方式中,所述宿主細胞在核苷酸 序列上是同型的。本公開也提供了含有載體的基因修飾葉綠體,所述載體包含編碼產(chǎn)生帶 有兩個磷酸根的類異戊二烯的酶的核酸,和啟動子,該啟動子被配置為在無維管光合生物 (NVPO)的葉綠體中表達所述核酸。本文也提供了用于生產(chǎn)含類異戊二烯的組合物的方法,其包括用編碼產(chǎn)生帶有兩 個磷酸根的類異戊二烯的酶的核酸轉(zhuǎn)化無維管光合生物的葉綠體,和收集由所述被轉(zhuǎn)化 的NVPO產(chǎn)生的至少一種類異戊二烯的步驟。這樣的方法可進一步包括在水性環(huán)境中生 長所述生物,其中CO2被提供給所述生物。提供的CO2可至少部分從已燃燒的化石燃料中 產(chǎn)生和/或可至少部分從煙道氣(flue gas)中產(chǎn)生。這樣的方法可包括GPP、IPP、FPP、 GGPP或DMAPP的生產(chǎn)。在一些實施方式中,所述收集過程可包括以下的一步或多步收 集轉(zhuǎn)化的NVP0,從細胞培養(yǎng)基中收集類異戊二烯;機械破碎被轉(zhuǎn)化的生物;和化學(xué)破碎生 物。微藻可被用于本發(fā)明的一些方面,并且所述微藻可以是萊茵衣藻(C.reinhardtii)、鹽 生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻(S. dimorphus)、綠色杜氏藻 (D. viridis)或杜氏鹽藻(D. tertiolecta)。用于生產(chǎn)類異戊二烯的另一種方法也被描述,其中所述方法包括步驟轉(zhuǎn)化無維 管光合生物的葉綠體以產(chǎn)生所述類異戊二烯,其中所述生物不是用異戊二烯合成酶或甲 基-丁烯醇合成酶轉(zhuǎn)化;和(b)收集所述類異戊二烯。該方法可進一步包括在水性環(huán)境中 生長所述生物,其中CO2被提供給所述生物。CO2可至少部分由已燃燒的化石燃料和/或 煙道氣產(chǎn)生。這樣的方法可包括GPP、IPP、FPP、GGPP或DMAPP的生產(chǎn)。該方法所述的葉 綠體可用核酸轉(zhuǎn)化,所述核酸編碼葡萄烴合成酶、苧烯合成酶、桉葉油素合成酶、菔烯合成 酶、莰烯合成酶、檜萜合成酶、月桂烯合成酶、松香二烯合成酶、紫杉二烯合成酶、紅沒藥烯 合成酶、diapophytoene去飽和酶、diapophytoene合成酶、單萜合成酶、異松油烯合成酶、 姜烯合成酶、羅勒烯合成酶、倍半萜合成酶、姜黃烯合成酶、法尼烯合成酶、忙牛兒基忙牛 兒基還原酶、葉綠素酯水解酶、β -石竹烯合成酶、大根香葉烯A合成酶、8-表雪松醇合成 酶、朱欒倍半萜合成酶、(+)_ S-杜松烯合成酶、大根香葉烯C合成酶、(Ε)-β-法尼烯合 成酶、蓖麻烯合成酶、vetispiradiene合成酶、5_表-馬兜鈴烯合成酶、馬兜鈴烯合成酶、 α-潷草烯、(Ε,Ε)-α_法尼烯合成酶、(_)_β_菔烯合成酶、松油烯合成酶、苧烯環(huán) 化酶、沉香醇合成酶、(+)_冰片二磷酸合成酶、左旋海松二烯合成酶、異海松二烯合成酶、 (E)-Y-紅沒藥烯合成酶、柯巴基焦磷酸合成酶、貝殼衫烯合成酶、長葉烯合成酶、Y _潷草 烯合成酶、S-蛇床烯合成酶、β-水芹烯合成酶、異松油烯合成酶、(+)-3_蒈烯合成酶、 順_柯巴基二磷酸合成酶、α -松油醇合成酶、順-海松-7,15- 二烯合成酶、反_山達海松 二烯合成酶、sterner-13-ene合成酶、E-β -羅勒烯、S-沉香醇合成酶、櫳牛兒醇合成酶、 Y “松油烯合成酶、沉香醇合成酶、E- β -羅勒烯合成酶、表_雪松醇合成酶、α -姜烯合成酶、愈創(chuàng)木二烯合成酶、卡藜二烯合成酶、順-穆羅拉二烯合成酶、阿菲迪柯林-16b_醇合 成酶、伊麗莎白三烯合成酶、檀香醇合成酶、廣藿香醇合成酶、zinzanol合成酶、雪松醇合 成酶、香紫蘇醇合成酶、柯巴醇合成酶或淚柏醇合成酶。在一些實施方式中,所述收集過程 可包括以下的一步或多步;收集轉(zhuǎn)化的NVP0,從細胞培養(yǎng)基中收集異戊二烯;機械破碎被 轉(zhuǎn)化的生物;和化學(xué)破碎生物。微藻可被用于本發(fā)明的一些方面,并且所述微藻可以是萊 茵衣藻(C.reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻 (S. dimorphus)、綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。本發(fā)明的另一實施方式提供了含有基因修飾葉綠體的生物,其中所述葉綠體包 含編碼類異戊二烯產(chǎn)生酶的核酸,并且其中所述生物能夠在高鹽環(huán)境中生長。這樣的生 物可以是NVP0,特別地是鹽生杜氏藻(D. salina)、綠色杜氏藻(D. viridis)或杜氏鹽 藻(D. tertiolecta)。在這樣的實施方式中,所述高鹽環(huán)境可包含約0. 5-4. O摩爾氯化 鈉。也提供了用于制備類異戊二烯的方法,其包括用核酸轉(zhuǎn)化生物以提高或起始所述類 異戊二烯的生產(chǎn),其中所述生物在高鹽環(huán)境中生長;和收集所述類異戊二烯。這樣的生 物可以是NVP0,特別地是鹽生杜氏藻(D. salina)、綠色杜氏藻(D. viridis)或杜氏鹽藻 (D. tertiolecta) 0在這樣的實施方式中,所述高鹽環(huán)境可包含約0. 5-4.0摩爾氯化鈉。在 一些實施方式中,所述轉(zhuǎn)化步驟是葉綠體轉(zhuǎn)化。在其它實施方式中,所述收集步驟包含以下 步驟的一個或多個(a)收集所述轉(zhuǎn)化的生物;(b)從細胞培養(yǎng)基中收集所述類異戊二烯; (c)機械破碎所述生物;或(d)化學(xué)破碎所述生物。本公開也提供了含有異源核酸的載體,所述異源核酸編碼一種或多種類異戊 二烯產(chǎn)生酶;和被配置為所述核酸在光合細菌中表達的啟動子。在一些實施方式中,所 述光合細菌為藍藻(cyanobacterial)種,且可以是集胞藻屬(Synechocystis)、聚球藻 屬(Synechococcus)和/或節(jié)旋藻屬(Athrospira)中的成員。提供了包含這樣載體 的宿主細胞。宿主細胞可以是藍藻種,且可以是集胞藻屬(Synechocystis)、聚球藻屬 (Synechococcus)禾口 /或節(jié)旋藻屬(Athrospira)中的成員。本公開進一步提供了載體,其包含編碼蛋白的第一核酸,編碼選擇性標記的第 二核酸,其中所述第一和第二核酸包含一個開放讀碼框,和啟動子,其被配置為所述第一 和第二核酸在無維管光合生物中表達。在一些實施方式中,所述蛋白是類異戊二烯產(chǎn)生 酶或生物物質(zhì)降解酶。在其它實施方式中,所述類異戊二烯產(chǎn)生酶是葡萄烴合成酶、苧 烯合成酶、桉葉油素合成酶、菔烯合成酶、莰烯合成酶、檜萜合成酶、月桂烯合成酶、松香 二烯合成酶、紫杉二烯合成酶、FPP合成酶、紅沒藥烯合成酶、diapophytoene去飽和酶、 diapophytoene合成酶、GPP合成酶、IPP異構(gòu)酶、單萜合成酶、異松油烯合成酶、姜烯合成 酶、羅勒烯合成酶、倍半萜合成酶、姜黃烯合成酶、法尼烯合成酶、忙牛兒基忙牛兒基還原 酶、葉綠素酯水解酶、β “石竹烯合成酶、大根香葉烯A合成酶、8-表雪松醇合成酶、朱欒 倍半萜合成酶、(+)_ S-杜松烯合成酶、大根香葉烯C合成酶、(Ε)-β-法尼烯合成酶、蓖 麻烯合成酶、vetispiradiene合成酶、5_表-馬兜鈴烯合成酶、馬兜鈴烯合成酶、α -潷草 烯、(Ε,Ε)-α_法尼烯合成酶、(-)-β-菔烯合成酶、Y-松油烯合成酶、苧烯環(huán)化酶、沉香 醇合成酶、(+)_冰片二磷酸合成酶、左旋海松二烯合成酶、異海松二烯合成酶、(E)-Y-紅 沒藥烯合成酶、柯巴基焦磷酸合成酶、貝殼衫烯合成酶、長葉烯合成酶、Y-潷草烯合成酶、 δ -蛇床烯合成酶、β -水芹烯合成酶、異松油烯合成酶、(+) -3-蒈烯合成酶、順_柯巴基二磷酸合成酶、α “松油醇合成酶、順_海松_7,15- 二烯合成酶、反-山達海松二烯合成酶、 sterner-13-ene合成酶、E- β -羅勒烯、S-沉香醇合成酶、櫳牛兒醇合成酶、Y -松油烯合 成酶、沉香醇合成酶、E-β -羅勒烯合成酶、表_雪松醇合成酶、α -姜烯合成酶、愈創(chuàng)木二 烯合成酶、卡藜二烯合成酶、順_穆羅拉二烯合成酶、阿菲迪柯林_16b-醇合成酶、伊麗莎 白三烯合成酶、檀香醇合成酶、廣藿香醇合成酶、zinzanol合成酶、雪松醇合成酶、香紫蘇 醇合成酶、柯巴醇合成酶或淚柏醇合成酶。在其它實施方式中,所述生物物質(zhì)降解酶是外 切-β -葡聚糖酶、內(nèi)切_ β _葡聚糖酶、β “葡萄糖苷酶、內(nèi)切木聚糖酶(endoxylanase)或 木質(zhì)酶。本文所述的一些載體包括第一或第二核酸,其中存在至少一個密碼子被優(yōu)化為在 無維管光合生物的核中表達。在一些實施方式中,本文所述的載體包含第三核酸,其編碼符合所述第一和第二 核酸讀碼框的剪切部分。所述剪切部分可以是自剪切蛋白酶,并且可具體是來自口蹄疫病 毒A2區(qū)域的功能部分。在其它實施方式中,所述剪切部分能夠被由所述生物天然產(chǎn)生的 蛋白酶剪切。本文也描述了包含調(diào)控元件的載體,所述調(diào)控元件包括HSP70啟動子、HSP70 啟動子的功能部分、rbcS2的5’端上游翻譯區(qū)域(UTR)、rbcS2的5’ UTR的功能部分、或它 們的組合。在一些實施方式中,所述調(diào)控元件由待被轉(zhuǎn)化的生物產(chǎn)生。而其它載體包含第 四核酸,其編碼符合第一、第二和/或第三核酸讀碼框的分泌信號。該載體中有用的分泌 信號為萊茵衣藻碳酸酐酶分泌信號。本發(fā)明的載體可用于多種NVPO中,其包括光合細菌、 藍細菌、藍藻門、原綠藻門、紅藻門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲足蟲門、 裸藻門、眼蟲藻、定鞭藻門、金藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、硅藻門、 黃藻門、黃綠藻、針胞藻類、褐藻門和浮游植物。在一些實施方式中,所述載體能夠被穩(wěn)定 轉(zhuǎn)化在萊茵衣藻(C. reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二 形柵藻(S. dimorphus)、綠色杜氏藻(D. viridis)、杜氏鹽藻(D. tertiolecta)、集胞藻屬 (Synechocystis)的細菌、聚球藻屬(Synechococcus)的細菌或節(jié)旋藻屬(Athrospira)的 細菌中。本文所述的載體可包含本文所述的任意核苷酸序列(如表5-8中),或與這些序 列中任一序列具有至少70%同一性的核酸序列。而其它載體包含符合所述第一、第二、第三 和/或第四核酸讀碼框的第五核酸,其中所述第五核酸編碼一個標記。所述編碼的標記可 以是附加表位或金屬親和標記。本公開也提供了含有載體的宿主細胞,其中所述載體包含編碼蛋白的第一核酸, 編碼選擇性標記的第二核酸,其中所述第一和第二核酸包含一個開放讀碼框,配置為第 一和第二核酸在無維管光合生物中表達的啟動子,和任選地一個或多個額外的核酸,其 編碼剪切部分、分泌信號、標記或其組合,其中所述一個或多個額外的核酸符合所述第一 和第二核酸的讀碼框。所述宿主細胞可以是光合細菌、藍細菌、藍藻門、原綠藻門、紅藻 門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲足蟲門、裸藻門、眼蟲藻、定鞭藻門、金 藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、硅藻門、黃藻門、黃綠藻、針胞藻類、 褐藻門或浮游植物。在一些實施方式中,所述宿主細胞為萊茵衣藻(C. reinhardtii)、鹽 生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻(S. dimorphus)、綠色杜氏藻 (D. viridis)、杜氏鹽藻(D. tertiolecta)、集胞藻屬(Synechocystis)的細菌、聚球藻屬 (Synechococcus)的細菌或節(jié)旋藻屬(Athrospira)的細菌。在其它實施方式中,所述載體 被穩(wěn)定地整合入所述宿主細胞的核基因組。
本文進一步提供了在無維管光合生物中生產(chǎn)蛋白的方法,其包括生長所述生物, 其中所述生物包含具有單一開放讀碼框的外源核酸,其中所述開放讀碼框包含編碼蛋白的 第一核酸和編碼選擇性標記的第二核酸,并且其中所述生物進一步包含啟動子,其被配置 為所述開放讀碼框在所述生物中表達,因此產(chǎn)生所述蛋白。在一些實施方式中,所述蛋白是 類異戊二烯產(chǎn)生酶或生物物質(zhì)降解酶。在其它實施方式中,所述開放讀碼框包含至少一個 密碼子,其被優(yōu)化為在無維管光合生物的核中表達。開放讀碼框可進一步包含第三核酸, 其編碼符合第一和第二核酸讀碼框的剪切部分。所述剪切部分可以是自剪切的蛋白酶,并 且在特定的實施方式中可以特別地是來自口蹄疫病毒A2區(qū)域的功能部分。在其它實施方 式中,剪切部分能夠被所述生物天然產(chǎn)生的蛋白酶剪切。開放讀碼框可進一步包含第四核 酸,其編碼符合所有組成該開放讀碼框的其它核酸的讀碼框的分泌信號。在一種實施方式 中,所述分泌信號是萊茵衣藻碳酸酐酶分泌信號。如本文所公開,用于這樣方法的生物可 以是萊茵衣藻(C.reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二 形柵藻(S. dimorphus)、綠色杜氏藻(D. viridis)、杜氏鹽藻(D. tertiolecta),集胞藻屬 (Synechocystis)、聚球藻屬(Synechococcus)或節(jié)旋藻屬(Athrospira)的細菌。用在該 方法中的開放讀碼框可進一步包含第五核酸,其編碼符合所有組成該開放讀碼框的其它核 酸的讀碼框的標記。所述標記可以是附加表位或金屬親和標記。本文進一步公開的是包含融合蛋白的宿主細胞,其中所述融合蛋白包含編碼 蛋白的第一核酸和編碼選擇性標記的第二核酸,并且所述宿主細胞是無維管光合生物。 所述宿主細胞可以是萊茵衣藻(C.reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球 藻(H. pluvalis),集胞藻屬(Synechocystis)、聚球藻屬(Synechococcus)或節(jié)旋藻屬 (Athrospira)的細菌。在一些實施方式中,所述載體被穩(wěn)定地整合入所述宿主細胞的核基 因組。融合蛋白可進一步包含剪切部分、分泌信號、標記或其組合。剪切部分可以是自剪切 的蛋白酶,如來自口蹄疫病毒A2區(qū)域的功能部分??蛇x地,剪切部分可以能夠被所述生物 天然產(chǎn)生的蛋白酶剪切??墒褂玫囊环N分泌信號為萊茵衣藻碳酸酐酶分泌信號。在含有標 記的融合蛋白中,所述標記可以是附加表位或金屬親和標記。本文提供了一種生產(chǎn)轉(zhuǎn)基因無維管光合生物的方法,所述生物在選擇性條件下表 達目標蛋白,其中所述方法包括以下步驟用含有單一開放讀碼框的核酸轉(zhuǎn)化所述生物,其 中所述開放讀碼框編碼含有所述目標蛋白和選擇性標記的融合蛋白;其中所述生物能夠在 要求選擇性標記表達以維持該生物存活的環(huán)境條件下表達選擇性標記,由此導(dǎo)致所述目標 蛋白的表達。在一些實施方式中,所述蛋白是類異戊二烯產(chǎn)生酶或生物物質(zhì)降解酶。融合 蛋白可進一步包含剪切部分、分泌信號、標記或其組合。剪切部分可以是自剪切的蛋白酶, 如來自口蹄疫病毒A2區(qū)域的功能部分??蛇x地,剪切部分能夠被所述生物天然產(chǎn)生的蛋白 酶剪切。可被使用的一種分泌信號為萊茵衣藻碳酸酐酶分泌信號。在含有標記的融合蛋白 中,所述標記可以是附加表位或金屬親和標記。本公開進一步提供的是在無維管光合生物中提高葉綠醇生產(chǎn)的方法,其包括用這 樣的核酸轉(zhuǎn)化所述生物的步驟,所述核酸引起由該生物產(chǎn)生的葉綠醇提高到高于由不含所 述核酸的生物產(chǎn)生的水平。在一些實施方式中,所述核酸編碼GPP合成酶、FPP合成酶、忙 牛兒基忙牛兒基還原酶、葉綠素酯水解酶或焦磷酸酶。在一些實施方式中,轉(zhuǎn)化步驟可包括 葉綠體轉(zhuǎn)化。而在另一些實施方式中,所述酶是與所述生物內(nèi)源的或與所述生物的內(nèi)源性
18酶同源,或是所述生物外源的。在一些實施方式中,所述酶被過量表達。所述酶的表達可通 過誘導(dǎo)型啟動子調(diào)控。所公開的方法可進一步包含用這樣的核酸轉(zhuǎn)化所述生物,所述核酸 引起二甲基烯丙醇、異戊醇、櫳牛兒醇、法尼醇或櫳牛兒基櫳牛兒醇(geranylgeraniol)的 產(chǎn)生。在一些實施方式中,實施該方法使用的生物為光合細菌、藍細菌、藍藻門、原綠藻門、 紅藻門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲足蟲門、裸藻門、眼蟲藻、定鞭藻門、 金藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、硅藻門、黃藻門、黃綠藻、針胞藻類、 褐藻門和浮游植物。所述生物可以是萊茵衣藻(C. reinhardtii)、鹽生杜氏藻(D. salina)、 雨生紅球藻(H. pluvalis)、二形柵藻(S. dimorphus)、綠色杜氏藻(D. viridis)或杜氏鹽藻 (D.tertiolecta)。本文也提供了含有被引入核酸的宿主細胞,其中所述核酸引起由宿主細胞產(chǎn)生的 葉綠醇提高到高于由不含所述核酸的宿主細胞產(chǎn)生的水平,其中所述宿主細胞是無維管光 合生物。在一些實施方式中,所述宿主細胞可以在高鹽環(huán)境中生長,例如,所述宿主細胞可 以是綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。在一些實施方式中,所述高鹽 環(huán)境包含0. 5-4. 0摩爾氯化鈉。在一些宿主細胞中,所述核酸存在于葉綠體中。而在其它宿 主細胞中,所述核酸編碼選自由GPP合成酶、FPP合成酶、忙牛兒基忙牛兒基還原酶、葉綠素 酯水解酶和焦磷酸酶組成的組的酶。所述宿主細胞可進一步包含這樣的核酸,其引起二甲 基烯丙醇、異戊醇、櫳牛兒醇、法尼醇或櫳牛兒基櫳牛兒醇的產(chǎn)生。所述宿主細胞可以是光 合細菌、藍細菌、藍藻門、原綠藻門、紅藻門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲 足蟲門、裸藻門、眼蟲藻、定鞭藻門、金藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、 硅藻門、黃藻門、黃綠藻、針胞藻類、褐藻門和浮游植物。在一些實施方式中,所述宿主細胞 是萊茵衣藻(C. reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵 藻(S. dimorp hus)、綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。本文公開的另一種方法提供了在無維管光合生物中生成葉綠醇的方法,包括步 驟用這樣的核酸轉(zhuǎn)化所述生物,其中所述核酸引起由該生物產(chǎn)生的葉綠醇提高到高于在 給定環(huán)境條件下產(chǎn)生的水平;和從所述生物中收集葉綠醇。在該方法的一些實施方式中, 所述核酸編碼GPP合成酶、FPP合成酶、忙牛兒基忙牛兒基還原酶、葉綠素酯水解酶或焦磷 酸酶。而在其它實施方式中,所述轉(zhuǎn)化為葉綠體轉(zhuǎn)化。而在另一些實施方式中,所述酶是所 述生物內(nèi)源的或與所述生物的內(nèi)源性酶同源,或是所述生物外源的。在一些實施方式中, 所述酶被過量表達。所述酶的表達可通過誘導(dǎo)型啟動子調(diào)控。所公開的方法可進一步包 含用這樣的核酸轉(zhuǎn)化所述生物,所述核酸引起二甲基烯丙醇、異戊醇、櫳牛兒醇、法尼醇或 櫳牛兒基櫳牛兒醇的產(chǎn)生。在一些實施方式中,實施該方法使用的生物為光合細菌、藍細 菌、藍藻門、原綠藻門、紅藻門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲足蟲門、裸藻 門、眼蟲藻、定鞭藻門、金藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、硅藻門、黃藻 門、黃綠藻、針胞藻類、褐藻門和浮游植物。所述生物可以是萊茵衣藻(C. reinhardtii)、鹽 生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻(S. dimorphus)、綠色杜氏藻 (D. viridis)或杜氏鹽藻(D. tertiolecta)。本文進一步提供的是一種組合物,其包含至少3%的葉綠醇和至少痕量的基因修 飾的無維管光合生物的細胞部分。在一些實施方式中,所述基因修飾的生物是通過內(nèi)源、 異源或外源的GPP合成酶、FPP合成酶、忙牛兒基忙牛兒基還原酶、葉綠素酯水解酶或焦磷酸酶修飾的。在其它實施方式中,所述生物的葉綠體是被基因修飾的。所公開的組合 物可進一步含有二甲基烯丙醇、異戊醇、櫳牛兒醇、法尼醇或櫳牛兒基櫳牛兒醇。在一些 實施方式中,存在于該組合物中的細胞部分來自光合細菌、藍細菌、藍藻門、原綠藻門、紅 藻門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲足蟲門、裸藻門、眼蟲藻、定鞭藻門、 金藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、硅藻門、黃藻門、黃綠藻、針胞藻類、 褐藻門和浮游植物。在其它實施方式中,所述生物可以是萊茵衣藻(C.reinhardtii)、鹽 生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻(S. dimorphus)、綠色杜氏藻 (D. viridis)或杜氏鹽藻(D. tertiolecta)。在一些實施方式中,這樣的核苷酸序列編碼在類異戊二烯合成途徑中發(fā)揮作用的 一種或多種多肽。在類異戊二烯生物合成途徑中的多肽的實例包括合成酶,如C5、C10、C15、 C20、C30和C40合成酶。在類異戊二烯途徑中多肽的更具體實例為苧烯合成酶、1,8_桉樹 腦合成酶、α-菔烯合成酶、莰烯合成酶、(+)_檜萜合成酶、月桂烯合成酶、松香二烯合成 酶、紫杉二烯合成酶、法尼焦磷酸合成酶、紫穗槐二烯(amorphadiene)合成酶、(Ε)-α-紅 沒藥烯合成酶、diapophytoene合成酶或diapophytoene去飽和酶。在其它實施方式中, 所述合成酶是β “石竹烯合成酶、大根香葉烯A合成酶、8-表雪松醇合成酶、朱欒倍半萜 合成酶、(+)_ S-杜松烯合成酶、大根香葉烯C合成酶、(Ε)-β-法尼烯合成酶、蓖麻烯合 成酶、vetispiradiene合成酶、5-表-馬兜鈴烯合成酶、馬兜鈴烯合成酶、α-潷草烯、(Ε, Ε)-α_法尼烯合成酶、(-)-β-菔烯合成酶、Y-松油烯合成酶、苧烯環(huán)化酶、沉香醇合成 酶、(+)_冰片二磷酸合成酶、左旋海松二烯合成酶、異海松二烯合成酶、(E)-Y-紅沒藥烯 合成酶、柯巴基焦磷酸合成酶、貝殼衫烯合成酶、長葉烯合成酶、Y-潷草烯合成酶、S-蛇 床烯(selinene)合成酶、β _水芹烯合成酶、異松油烯合成酶、(+) _3_蒈烯合成酶、順-柯 巴基焦磷酸合成酶、α -松油醇合成酶、順-海松-7,15- 二烯合成酶、反_山達海松二烯合 成酶、sterner-13-ene合成酶、E-β -羅勒烯、S-沉香醇合成酶、櫳牛兒醇合成酶、Y -松油 烯合成酶、沉香醇合成酶、E- β -羅勒烯合成酶、表-雪松醇合成酶、α -姜烯合成酶、愈創(chuàng)木 二烯合成酶、卡藜二烯合成酶、順-穆羅拉二烯合成酶、阿菲迪柯林-16b-醇合成酶、伊麗莎 白三烯合成酶、檀香醇合成酶、廣藿香醇合成酶、zinzanol合成酶、雪松醇合成酶、香紫蘇醇 合成酶、柯巴醇合成酶或淚柏醇合成酶。本文考慮的任意核苷酸序列可以包括一個或多個異源序列和/或一個或多個同 源序列。在一些實施方式中,產(chǎn)生的產(chǎn)物可以由轉(zhuǎn)化的生物自然產(chǎn)生。在其它實施方式中, 產(chǎn)生的產(chǎn)物不是由轉(zhuǎn)化的生物自然產(chǎn)生的。在一些實施方式中,產(chǎn)物(如,燃料、燃料原料、香料、殺蟲劑)是富烴分子,如類異 戊二烯。類異戊二烯(通過異戊二烯單元的數(shù)目分類)可以是半萜、單萜、倍半萜、二萜、三 萜或四萜。在特定的實施方式中,所述類異戊二烯可以是天然生成的類異戊二烯,如類固醇 或類胡蘿卜素。類胡羅卜素的亞類別包括胡羅卜素和葉黃素。一些類異戊二烯是純烴(如 苧烯),而其它的是烴衍生物(如桉樹腦)。本文的任何核苷酸序列可以進一步包含在被轉(zhuǎn)化的生物中對于表達該核苷酸序 列是偏倚的密碼子。在一些實施方式中,核苷酸序列中的密碼子在該密碼子的第三核苷酸 位置上是富A/T的。例如,密碼子中至少50%的第三核苷酸位置可以是A或T。在其它實
20施方式中,密碼子是富G/C的,例如,密碼子的至少50%的第三核苷酸位置可以為G或C。可以使本文的核苷酸序列適合于葉綠體表達。例如,本文的核苷酸序列可以包 含葉綠體特異啟動子或葉綠體特異調(diào)控控制區(qū)域。所述核苷酸序列可以被適合于核表 達。例如,核苷酸序列可以包含核特異性啟動子或核特異性調(diào)控控制區(qū)域。所述核酸序 列可以編碼帶有靶向序列的蛋白,所述靶向序列編碼葉綠體靶向蛋白(如,葉綠體轉(zhuǎn)運肽 (chloroplast transit ρ印tide)),或引導(dǎo)蛋白到內(nèi)膜系統(tǒng)以在內(nèi)質(zhì)網(wǎng)或質(zhì)膜上沉積的信 號肽。燃料產(chǎn)品是通過改變細胞內(nèi)酶的成分,以改善特定燃料分子的生物合成而產(chǎn)生 的。例如,編碼生物合成酶的核苷酸序列可以被引入光合生物的葉綠體。編碼燃料生物合 成酶的核苷酸序列也可以被引入光合生物的核基因組。引入核基因組的核苷酸序列可以指 導(dǎo)生物合成酶在細胞的細胞質(zhì)中積累,或可指導(dǎo)生物合成酶在光合生物的葉綠體中積累。本文的任意核苷酸序列可進一步包含調(diào)控序列。調(diào)控序列可包含以下的一個或多 個啟動子、內(nèi)含子、處理元件(processing element)、3’未翻譯區(qū)、5’未翻譯區(qū)、RNA穩(wěn)定 元件或翻譯增強子。啟動子可以是以下的一個或多個適合在生物中表達的啟動子,藻類啟 動子,葉綠體啟動子和核啟動子,它們中的任何一個可以是原生或合成的啟動子。調(diào)控序列 可以是可誘導(dǎo)的或可自調(diào)控的。調(diào)控序列可以包含自體同源序列和/或異源序列。在一些 情況下,控制序列可以在第一同源序列和第二同源序列的一側(cè)。第一和第二同源序列每一 個長度可以都是至少500個核苷酸。同源序列可以允許同源重組,或可以用于隔離異源序 列以促進基因表達。在一些實施方式中,核苷酸序列可允許產(chǎn)物(如蛋白)從細胞中分泌。在這些例子 中,本文的核苷酸序列可編碼增強、起始或提高產(chǎn)物從生物分泌到外部環(huán)境的速率的蛋白。本發(fā)明也考慮了用本文的一個或多個核苷酸序列或表達載體轉(zhuǎn)化的生物。這樣的 生物優(yōu)選的是進行光合作用的,并且可以是,例如,單細胞或多細胞的。例如,這樣的生物可 以是多細胞或單細胞的藻類或藍細菌。本文考慮的藻類的一些實例包括紅藻門、綠藻門、不 等鞭毛門、tribophyta、灰色藻門、絲足蟲門、眼蟲藻、定鞭藻門、隱藻門、隱滴蟲、腰鞭毛蟲 和浮游植物。本文考慮的任何生物可以用本文所述的一種或多種表達載體暫時或穩(wěn)定地轉(zhuǎn)化。 優(yōu)選地,生物生成的產(chǎn)物不會使該生物不能存活。本發(fā)明也考慮了生產(chǎn)燃料產(chǎn)品的方法。所述方法可以包括用表達載體轉(zhuǎn)化無維管 光合生物,培養(yǎng)該生物;和收集由該生物產(chǎn)生的燃料產(chǎn)品。所述表達載體可以編碼這樣的蛋 白,其改變光合生物的生物合成途徑,以提高燃料分子的生產(chǎn)或積累。所述表達載體可能也 編碼這樣的調(diào)控元件,其改變生物合成途徑中的原生酶,以允許改善燃料生產(chǎn)或累積。所述 載體也可編碼允許分泌或提高燃料分子分泌的蛋白或調(diào)控元件。本發(fā)明也提供了一種商業(yè)方法,包括向培養(yǎng)適合生產(chǎn)燃料產(chǎn)品的基因修飾的無維 管光合生物的一方提供碳信用額(carbon credit)。所述生物可以是本文描述的任何一種。 在一些實施方式中,碳信用額可與以下一項或多項交換相當(dāng)容易變現(xiàn)的金融票據(jù),至少一 個現(xiàn)在和將來的生意機會的承諾,有關(guān)知識產(chǎn)權(quán)的法律許可,政府稅務(wù)補貼,給定市場購買 者準入;或不含培養(yǎng)所述生物的碳排放過程的使用。碳信用額基本上可從制定規(guī)章的機構(gòu) 直接取得??蛇x地,碳信用額基本上可從管理實體直接獲得。碳信用額可通過至少一個實體調(diào)控,所述實體選自包括市、縣、州、省、國家、地區(qū)、多國和國際主權(quán)實體。附圖簡述本發(fā)明的新特征在所附權(quán)利要求中具體描述。通過參考以下描述示例性實施方式 的詳細描述——其中本發(fā)明的原理被使用,和附圖,可獲得對本發(fā)明特征和優(yōu)點的更好理 解,所述附圖中
圖1是萊茵衣藻中天然生成酶途徑的表示。圖2是萊茵衣藻中酶途徑的改進的一個實例的表示。圖3,圖A-D提供了本發(fā)明所述核酸結(jié)構(gòu)的圖示。圖4,圖A-D顯示了用FPP合成酶和紅沒藥烯合成酶轉(zhuǎn)化的萊茵衣藻的PCR和蛋白 質(zhì)印跡分析結(jié)果。圖5顯示了用FPP合成酶和紅沒藥烯合成酶轉(zhuǎn)化的萊茵衣藻的氣相色譜-質(zhì)譜分 析結(jié)果。圖6,圖A-E顯示了用FPP合成酶和角鯊烯合成酶轉(zhuǎn)化的萊茵衣藻的PCR和蛋白質(zhì) 印跡分析結(jié)果。圖7顯示了用FPP合成酶和角鯊烯合成酶轉(zhuǎn)化的萊茵衣藻的氣相色譜-質(zhì)譜分析結(jié)果。圖8顯示了用苧烯合成酶轉(zhuǎn)化的萊茵衣藻的蛋白質(zhì)印跡分析結(jié)果。圖9顯示了用苧烯合成酶轉(zhuǎn)化的萊茵衣藻的氣相色譜-質(zhì)譜分析結(jié)果。圖10,圖A-C顯示了用GPP合成酶轉(zhuǎn)化的萊茵衣藻的PCR和蛋白質(zhì)印跡分析結(jié)果。圖11顯示了用FPP合成酶和姜烯合成酶轉(zhuǎn)化的萊茵衣藻的PCR和蛋白質(zhì)印跡分 析結(jié)果。圖12顯示了用FPP合成酶和倍半萜合成酶轉(zhuǎn)化的萊茵衣藻的蛋白質(zhì)印跡分析結(jié)果ο圖13顯示了用FPP合成酶和倍半萜合成酶轉(zhuǎn)化的萊茵衣藻的氣相色譜_質(zhì)譜分 析結(jié)果。圖14顯示了用FPP合成酶和倍半萜合成酶轉(zhuǎn)化的大腸桿菌(E.coli)的蛋白質(zhì)印 跡分析結(jié)果。圖15顯示了用FPP合成酶和倍半萜合成酶轉(zhuǎn)化的大腸桿菌中FPP和倍半萜生成 的氣相色譜-質(zhì)譜分析結(jié)果。圖16是本發(fā)明的核酸結(jié)構(gòu)的圖示。圖17顯示了由細胞核表達木聚糖酶2的萊茵衣藻的蛋白質(zhì)印跡分析結(jié)果。圖18顯示了萊茵衣藻的核及葉綠體中表達的外源酶的木聚糖酶活性比較。圖19顯示了由細胞核表達內(nèi)切葡聚糖酶的萊茵衣藻的蛋白質(zhì)印跡分析結(jié)果。圖20顯示了由細胞核表達CBHl的萊茵衣藻的蛋白質(zhì)印跡分析結(jié)果。發(fā)明詳述本發(fā)明涉及使用一種或多種光合生物生產(chǎn)產(chǎn)品的組合物及方法。在一些實施方式 中,光合生物是無維管生物(如藍細菌、藻類)。如本文詳述,無維管光合生物(NVPO)可被 外源、異源或自體同源的核酸轉(zhuǎn)化,所述核酸編碼實現(xiàn)本發(fā)明產(chǎn)物生產(chǎn)的一種或多種酶。例 如,NVPO(如萊茵衣藻)可用編碼酶(如紅沒藥烯合成酶、倍半萜合成酶)的一種或多種核酸轉(zhuǎn)化,所述酶實現(xiàn)期望產(chǎn)物(如紅沒藥烯、角鯊烯)的生產(chǎn)。產(chǎn)生的產(chǎn)物可以是由光合生 物天然或非天然產(chǎn)生的。當(dāng)其是天然生成時,生產(chǎn)可通過引入本發(fā)明所述的核酸提高。例 如,用編碼實現(xiàn)期望產(chǎn)物(如姜烯、紅沒藥烯)生產(chǎn)的酶的一種或多種核酸轉(zhuǎn)化NVP0,可引 起另一產(chǎn)物(如葉綠醇)生產(chǎn)的提高。而在其它實施方式中,多種產(chǎn)物可通過轉(zhuǎn)化的NVPO 產(chǎn)生,并且所述多種產(chǎn)物可以是天然生成的、非天然生成的或其組合。本發(fā)明所述的組合物 可包含天然和非天然生成的產(chǎn)物的1 0.1、1 0. 2,1 0. 3,1 0. 4,1 0. 5,1 0.6、 1 0. 7,1 0.8,1 0.9,1 1、1 2、1 3、1 4、1 5、1 6、1 7、1 8、1 9、 1 10、1 20、1 30、1 40、1 50、1 60、1 70、1 80、1 90、1 100 或更高比 例的混合物。通過本發(fā)明所述方法生成的產(chǎn)物包括烴和烴的衍生物。在某些方面,所述烴和/ 或烴的衍生物是類異戊二烯(或類萜)。本發(fā)明考慮的類異戊二烯可包括任何數(shù)量的碳原 子,含有5個到15個碳原子的類異戊二烯是示例。本發(fā)明的類異戊二烯可以是由轉(zhuǎn)化前的 NVPO天然生成的一種(如葉綠醇),或可以是僅在外源核酸插入后生成的(如姜烯)。本發(fā) 明的產(chǎn)物也可包括除一種或多種天然生成的類異戊二烯之外的一種或多種非天然生成的 類異戊二烯。此外,所述產(chǎn)物是在細胞內(nèi)生成的,并且可被保留在該生物內(nèi)。因此,產(chǎn)物的 收集可涉及本發(fā)明所述生物的一個或多個細胞的破碎和/或從該生物的周圍環(huán)境中收集 該產(chǎn)物。本發(fā)明所述產(chǎn)品的收集可涉及收集細胞在其中生長的全部或部分液態(tài)環(huán)境,從液 態(tài)環(huán)境中分離細胞,和在從生長環(huán)境中分離之前或之后破碎細胞,或這些的組合。收集到的產(chǎn)物可在收集后被純化(如精制)。產(chǎn)物可以其被收集的形式使用,或可 在收集前或收集后被改變。例如,在產(chǎn)物為倍半萜(C15)的情況下,倍半萜可被氫化、裂化 或被其他方式改性,產(chǎn)生具有不同碳原子數(shù)的化合物。在一些實施方式中,產(chǎn)物的改變可產(chǎn) 生燃料產(chǎn)品(如辛烷、丁烷)。碰可使用本文所述組合物和方法轉(zhuǎn)化的生物的實例包括維管和無維管生物。所述生 物可以是原核生物或真核生物。所述生物可以是單細胞生物或多細胞生物。無維管光合生物的實例包括苔蘚植物(bryophtyes),如葉苔門 (marchantiophytes)或角苔門(anthocerotophytes)。在一些實施方式中,所述生物是藍 細菌。在一些實施方式中,所述生物是藻類(如大型藻(macroalgae)或微藻)。所述藻類 可以是單細胞或多細胞藻類。在一些實施方式中,所述生物是紅藻門、綠藻門、不等鞭毛門、 tribophyta、灰色藻門、絲足蟲門、眼蟲藻、定鞭藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲或 浮游植物。例如,所述微藻萊茵衣藻(Chlamydomonas reinhardtii)可用編碼苧烯合成酶 的載體或其被線性化的部分轉(zhuǎn)化,以生產(chǎn)苧烯。本發(fā)明所述的方法使用微藻,萊茵衣藻示例。依據(jù)本發(fā)明的方法使用微藻表達多 肽或蛋白復(fù)合體提供了這樣的優(yōu)勢——可以培養(yǎng)大量的微藻,包括商業(yè)地培養(yǎng)(Cyanotech Corp. ;KaiIua-Kona HI),因此允許期望產(chǎn)品的大量生產(chǎn),以及分離——如果希望的話。然 而,在任何植物的葉綠體中表達例如功能哺乳動物多肽包括蛋白復(fù)合體的能力允許這些植 物的作物生產(chǎn),并因此能夠方便地生產(chǎn)大量多肽。因此,本發(fā)明所述的方法可以使用任何具 有葉綠體的植物實施,包括,例如,微藻和大型藻,如海洋藻類和海草,以及在土壤中生長的 植物。
術(shù)語“植物”在本文被寬泛地使用,以指代含有質(zhì)體(plastids),特別是葉綠體的 真核生物,并且其包括在任何發(fā)育階段的任何這樣的生物;或指代植物的部分,包括植物剪 枝(plant cutting)、植物細胞、植物細胞培養(yǎng)物、植物器官、植物種子或胚芽(plantlet)。 植物細胞是植物的結(jié)構(gòu)和生理單位,其包括原生質(zhì)體和細胞壁。植物細胞可以是分離的單 個細胞或培養(yǎng)的細胞的形式,或可以是更高組成單元,如植物組織、植物器官或植物。因 此,植物細胞可以是原生質(zhì)體,生成配子的細胞,或一個細胞,或可以再生為整個植物的細 胞集合。同樣地,種子,其包含多個植物細胞并能夠再生為整個植物,出于本公開的目的, 被認為是植物細胞。植物組織或植物器官可以是種子、原生質(zhì)體、胼胝體,或被歸類進結(jié)構(gòu) 或功能單元的任何其它類別的植物細胞。植物特別有用的部分包括可收獲部分和用于繁 殖后代植物的部分。植物的可收獲部分可以是植物任何有用的部分,例如花朵、花粉、幼苗 (seedling)、塊莖、葉、莖、果實、種子、根等。用于繁殖的植物部分包括,例如,種子、果實、剪 枝(cutting)、幼苗、塊莖、根莖(rootstock)等。本發(fā)明的方法可以產(chǎn)生含有原生質(zhì)體的植物,所述原生質(zhì)體被基因修飾以包含穩(wěn) 定整合的多核苷酸(Hager 和 Bock, Appl. Microbiol. Biotechnol. 54 :302_310,2000)。因 此,本發(fā)明進一步提供了轉(zhuǎn)基因(葉綠體轉(zhuǎn)基因(transplastomic))植物,如萊茵衣藻,其 包括一個或多個含有多核苷酸的原生質(zhì)體,所述多核苷酸編碼一個或多個異源多肽,包括 與形成功能蛋白復(fù)合體特異相關(guān)的多肽。本發(fā)明的光合生物包含至少一個被修飾以生成產(chǎn) 物的宿主細胞。載體、轉(zhuǎn)化及方法這里的生物/宿主細胞可以用表達載體或其線性化部分轉(zhuǎn)化,以改變產(chǎn)物的生產(chǎn) 和/或分泌,例如,提高產(chǎn)物的生產(chǎn)和/或分泌。產(chǎn)物可以是由生物天然地或非天然地產(chǎn)生 的。表達載體或其線性化部分可以編碼一個或多個同源或異源核苷酸序列(由宿主 細胞或由不同的生物產(chǎn)生)和/或一個或多個自體同源的核苷酸序列(由相同的生物產(chǎn) 生)和/或編碼同源或異源多肽的那些??杀晦D(zhuǎn)化進藻類宿主細胞的異源核苷酸序列的實 例包括來自細菌、真菌、植物、光合細菌或其它藻類的基因??杀晦D(zhuǎn)化進藻類宿主細胞的自 體同源核苷酸序列的實例包括生成類異戊二烯的基因,其包括編碼產(chǎn)生帶有兩個磷酸根的 類異戊二烯的蛋白質(zhì)(如GPP合成酶、FPP合成酶)的基因,內(nèi)源啟動子和來自psbA、atpA 或rbcL基因的5’ UTRs。在一些實施方式中,異源序列在兩個自體同源序列或同源序列的 一側(cè)。同源序列包括那些具有與宿主細胞中的序列至少50 %、60 %、70 %、80 %或90 %同源 性的序列。在一些實施方式中,同源序列在兩個自體同源序列的一側(cè)。第一和第二同源序 列使異源序列能夠重組進入宿主生物的基因組。第一和第二同源序列每一個的長度都可以 至少是100、200、300、400或500個核苷酸。表達載體可含有為在被轉(zhuǎn)化生物中表達而改變了密碼子的核苷酸序列。普通技術(shù) 人員在使用核苷酸密碼子來具體指明給定氨基酸中已經(jīng)熟知由特定宿主細胞顯示的“密碼 子偏倚性”。并非被理論限制,但通過使用宿主細胞優(yōu)選的密碼子,翻譯的比率可以更高。因 此,當(dāng)合成用于提高在宿主細胞中表達的基因時,可期望設(shè)計這樣的基因,以便其密碼子使 用的頻率接近宿主細胞優(yōu)選的密碼子使用的頻率。在一些生物中,密碼子偏倚性在核基因 組和細胞器基因組之間不同,因此,密碼子優(yōu)化或偏倚可針對靶基因進行(如核密碼子偏
24倚、葉綠體密碼子偏倚)。本發(fā)明的密碼子一般地富A/T,如,在密碼子第三核苷酸的位置上 富A/T。典型地,富A/T的密碼子偏倚被用于藻類。在一些實施方式中,密碼子的至少50% 的第三核苷酸位置是A或T。在其它實施方式中,密碼子的至少60 %、70 %、80 %、90 %或 99%的第三核苷酸位置是A或T。構(gòu)建藻類的基因改造株(genetically manipulated strain)的一個方法涉及用 編碼目的基因的核酸轉(zhuǎn)化,所述核酸典型地是能夠?qū)⑶绑w轉(zhuǎn)化為燃料產(chǎn)物或燃料產(chǎn)物前體 的酶。在一些實施方式中,轉(zhuǎn)化可將核酸引入宿主藻類細胞的任何質(zhì)體(如葉綠體)。轉(zhuǎn) 化的細胞通常在引入外源核酸后被鋪于選擇性培養(yǎng)基中。該方法也可以包括若干篩選的步 驟。開始,通常進行主轉(zhuǎn)化體(primary transformant)的篩選,以確定哪些克隆帶有合適 的外源核酸插入體。顯示恰當(dāng)插入的克隆可被增殖并重新篩選,以確保遺傳穩(wěn)定性。這樣 的方法保證轉(zhuǎn)化體含有目的基因。在多種實施方式中,這樣的篩選通過聚合酶鏈反應(yīng)(PCR) 進行,但是,本領(lǐng)域已知的任何其它合適的技術(shù)也可被使用。多種不同的PCR方法在本領(lǐng)域 內(nèi)公知(如嵌套PCR、實時PCR)。對于任何給定的篩選,本領(lǐng)域普通技術(shù)人員可認識到PCR 組分可改變以達到最優(yōu)的篩選效果。例如,當(dāng)對向其中加入EDTA(其螯合鎂)以螯合有毒金 屬的破碎藻類細胞進行PCR時,鎂濃度可能需要上調(diào)。在這樣的實施方式中,鎂濃度可能需 要上調(diào)或下調(diào)(與可購買的PCR試劑盒中標準濃度比較)0. 1,0. 2,0. 3,0. 4,0. 5,0. 6,0. 7、 0. 8,0. 9,1. 0,1. 1、1· 2,1. 3,1. 4,1. 5,1. 6,1. 7,1. 8、1. 9 或 2. OmM0 因此,調(diào)整后,PCR 反應(yīng)中 最終的鎂濃度可以是,如 0. 7,0. 8,0. 9,1. 0,1. 1、1. 2,1. 3,1. 4,1. 5,1. 6,1. 7,1. 8,1. 9,2. 0、 2. 1、2· 2、2· 3、2· 4、2· 5、2· 6、2· 7、2· 8、2· 9、3· 0、3· 1、3· 2、3· 3、3· 4、3. 5mM 或更高。雖然在本 文所述的實例中使用了具體的例子;但是,本領(lǐng)域普通技術(shù)人員能認識到其它PCR技術(shù)可 替代所述的具體方法。篩選帶有合適的外源核酸插入體的克隆之后,通??寺”缓Y選存在 的編碼蛋白。蛋白表達篩選通常通過蛋白質(zhì)印跡分析和/或酶活性測試進行。用在本發(fā)明方法中的重組核酸分子可以包含在載體中。而且,在使用第二(或更 多)重組核酸分子進行該方法的情況下,第二重組核酸分子也可以包含在載體內(nèi),其可以, 但不必與含有第一重組核酸分子的載體相同。所述載體可以是用于將多核苷酸引入葉綠 體的任何載體,并且優(yōu)選地,包含足以與葉綠體基因組DNA進行同源重組的葉綠體基因組 DNA的核苷酸序列,例如,含有約400到1500或更多基本上連續(xù)的葉綠體基因組DNA核苷酸 的核苷酸序列。葉綠體載體和選擇葉綠體基因組區(qū)域用作載體的方法已經(jīng)公知(參見,例 如,Bock,J. Mol. Biol. 312 :425_438,2001 ;也參見 Staub 和 Maliga, Plant Cell 4 :39_45, 1992 ;Kavanagh等,Genetics 152 :1111_1122,1999,它們中的每一個都在此通過引用并 入)。在一些實施方式中,這樣的載體包括啟動子。用于本發(fā)明的啟動子可來自任何來 源(如病毒、細菌、真菌、原生生物、動物)。本文考慮的啟動子可以對光合生物、無維管光 合生物和維管光合生物(如藻類、開花植物)是特異性的。在這里所用,術(shù)語“無維管光合 生物”是指任何宏觀或微觀生物,包括但不限于,藻類、藍細菌和光合細菌,其不具有如在 高等植物中發(fā)現(xiàn)的維管系統(tǒng)。在一些實施方式中,上述核酸被插入含有光合生物如藻類的 啟動子的載體中。所述啟動子可以是在葉綠體和/或其它質(zhì)體中表達的啟動子。在一些 實施方式中,所述核酸是基于葉綠體的??紤]用于插入本文所述任何核酸到葉綠體中的啟 動子的實例包括美國申請2004/0014174中公開的那些。所述啟動子可以是組成型啟動子(constitutive promoter)或誘導(dǎo)型啟動子。啟動子通常包括接近轉(zhuǎn)錄起始點的必需核酸 序列(如TATA元件)?!敖M成型”啟動子是在大多數(shù)環(huán)境和發(fā)育條件下活躍的啟動子?!罢T導(dǎo)型”啟動子 是在環(huán)境或發(fā)育調(diào)控下活躍的啟動子。誘導(dǎo)型啟動子/調(diào)控元件的實例包括,例如,硝酸鹽 誘導(dǎo)的啟動子(Bock等,Plant Mol. Biol. 17 :9 (1991)),或光誘導(dǎo)的啟動子(Feinbaum等, MoI Gen. Genet. 226 :449 (1991) ;Lam 和 Chua,Science 248 :471 (1990)),或熱響應(yīng)啟動子 (Muller 等,Gene 111:165-73(1992))。萊茵衣藻的整個葉綠體基因組在互聯(lián)網(wǎng)上通過URL" biology, duke, edu/ chlamy_genome/-chloro. html “對公眾可用(參見"view complete genome as text file”鏈接和“maps of the chloroplast genome”鏈接),它們每一個都在此通過引用被并 入(J.Maul,J. W. Lilly和D. B. Stern,未公開的結(jié)果;2002年1月28日修改;將以GenBank 帳號AF396929公開)。通常,葉綠體基因組DNA的核苷酸序列被這樣選擇,以致其不是基因 的一部分,包括調(diào)控序列或編碼序列,特別是如果由于同源重組事件被打斷,將產(chǎn)生對葉綠 體有害作用的基因,例如,用于葉綠體基因組復(fù)制,或?qū)腥~綠體的植物細胞產(chǎn)生有害作 用的基因。在這一方面,包含萊茵衣藻葉綠體基因組序列的網(wǎng)站也提供了顯示葉綠體基因 組編碼區(qū)和非編碼區(qū)的圖譜,由此幫助用于構(gòu)建本發(fā)明載體的序列的選擇。例如,葉綠體載 體,p322,是從約143. Ikb位置的Eco (Eco RI)位點延伸到約148. 5kb位置的Xho (Xho I) 位點的克隆(參見,互聯(lián)網(wǎng),在 URL" biology, duke. edu/chlamy_genome/chloro. html ", 并點擊"maps of the chloroplast genome"鏈接和〃 140_150kb"鏈接;也可直接通過 互聯(lián)網(wǎng)上 URL" biology, duke. edu/chlam-y/chloro/chlorol40. html “獲取)。在本發(fā)明實施中使用的載體也可以含有一個或多個給予該載體期望性質(zhì)的額外 的核苷酸序列,包括,例如,這樣的序列,諸如輔助載體操控的克隆位點,指導(dǎo)該載體復(fù)制或 其包含的核苷酸序列轉(zhuǎn)錄的調(diào)控元件,編碼選擇性標記的序列等。因此,所述載體可以包 含,例如,一個或多個克隆位點,如多克隆位點,其可以但不必放置為使異源多核苷酸可以 被插入該載體并且可操控地鏈接到期望的元件。所述載體也可以包含原核生物的復(fù)制起點 (ori),例如,大腸桿菌ori或粘粒ori,由此如期望,允許該載體在原核宿主細胞,以及在植 物的葉綠體中傳遞。調(diào)控元件,作為本文所用的術(shù)語,廣義地指調(diào)控多核苷酸轉(zhuǎn)錄或翻譯,或其被可操 控地鏈接到的多肽的定位的核苷酸序列。實例包括,但不限于RBS、啟動子、增強子、轉(zhuǎn)錄終 止子、起始(啟動)密碼子、用于內(nèi)含子剪切和正確讀碼框保持的剪接信號、終止密碼子、琥 珀密碼子或赭石密碼子和IRES。此外,細胞區(qū)室化信號(即,將多肽靶向到細胞液、核、葉綠 體膜或細胞膜的序列)。在本發(fā)明的一些方面,細胞區(qū)室化信號(如葉綠體靶向序列)可 被連接到基因和/或轉(zhuǎn)錄體,以便該基因的翻譯在葉綠體內(nèi)發(fā)生。在其它方面,細胞區(qū)室化 信號可被鏈接到基因,以便該基因翻譯后,蛋白被運送到葉綠體。這樣的信號在本領(lǐng)域內(nèi)公 知并已經(jīng)被廣泛地報告。參見,如,美國專利號5,776,689 ;Quinn等,J. Biol. Chem, 1999 ; 274(20) 14444-54 ;von Hei jne 等,Eur. J. Biochem. 1989 ; 180 (3) :535_45。載體,或其線性化部分,可包括編碼報告多肽或其它選擇性標記的核苷酸序列。術(shù) 語“報告基因(reporter)”或“選擇性標記”指的是給予可檢測表型的多核苷酸(或編碼的 多肽)。報告基因通常編碼可檢測的多肽,例如,綠色熒光蛋白,或一種酶,如熒光素酶,當(dāng)與合適的試劑(分別是特定波長的光或熒光素)接觸時,其產(chǎn)生可被肉眼或使用適當(dāng)?shù)膬x 器檢測到的信號(Giacomin, Plant Sci. 116 :59_72,1996 ;Scikantha, J. Bacteriol. 178 121,1996 ;Gerdes,FEBS Lett. 389 :44_47,1996 ;也參見 Jefferson,EMBO J. 6 :3901_3907, 1997,fl-glucuronidase)。選擇性標記通常是這樣的分子,當(dāng)在細胞中存在或表達時,其為 含有該標記的細胞提供了選擇性優(yōu)勢(或劣勢),例如,在否則會殺死細胞的試劑存在的情 況下生長的能力。選擇性標記可以提供一種獲得表達該標記的原核細胞或植物細胞或兩者的方法, 并因此可以被用作本發(fā)明所述載體的一個部分(參見,例如,Bock,上文,2001)。選擇性標 記的一個類別是原生或修飾的基因,其恢復(fù)宿主細胞的生物或生理功能(如,恢復(fù)光合能 力,恢復(fù)代謝途徑)。選擇性標記的其它實例包括,但不限于,給予抗代謝物抗性的那些,如, 二氫葉酸還原酶,其給予對甲氨喋呤的抗性(Reiss,Plant Physiol. (Life Sci. Adv. ) 13 143-149,1994);新霉素磷酸轉(zhuǎn)移酶,其給予對氨基糖苷新霉素、卡那霉素和嘌呤霉素的抗 性(Herrera-Estrella,EMBO J. 2 :987_995,1983) ;hygro,其給予對潮霉素的抗性(Marsh, Gene 32 =481-485,1984) ;trpB,其允許細胞使用吲哚替代色氨酸;hisD,其允許細胞使用 組氨醇(histinol)替代組氨酸(Hartman,Proc. Natl. Acad. Sci.,USA 85 :8047,1988);甘 露糖-6-磷酸異構(gòu)酶,其允許細胞使用甘露糖(W0 94/20627);鳥氨酸脫羧酶,其給予對鳥 氨酸脫羧酶抑制劑——2-( 二氟甲基)-DL-鳥氨酸的抗性(DFM0;MCConlogue,1987,In: Current Communications in Molecular Biology,Cold SpringHarbor Laboratory ed.); 和來自土曲霉(Aspergillus terreus)的脫氨酶,其給予對殺稻瘟素S的抗性(Tamura, Biosci. Biotechnol. Biochem. 59 :2336_2338,1995)。其它選擇性標記包括給予除草劑抗 性的那些,例如,草胺膦乙酰轉(zhuǎn)移酶基因,其給予對草胺膦的抗性(White等,Nucl. Acids Res. 18 :1062,1990 ;Spencer 等,Theor. Appl. Genet. 79 :625_631,1990);變異 EPSPV 合 成酶,其給予草甘膦抗性(Hinchee等,BioTechnology 91 =915-922,1998);變異的乙酰 乳酸合成酶,其給予咪唑啉酮或磺酰脲抗性(Lee等,EMBO J. 7 1241-1248,1988);變異 的 psbA,其給予對阿特拉津(atrazine)的抗性(Smeda 等,Plant Physiol. 103 :911_917, 1993);或變異的前卟啉原(protoporphyrinogen)氧化酶(參見美國專利號5,767,373); 或給予對除草劑如草丁膦(glufosinate)的抗性的其它標記。選擇性標記包括給予真 核細胞二氫葉酸(DHFR)或新霉素抗性,或給予原核生物,如大腸桿菌四環(huán)素、氨芐青霉素 抗性;和植物中爭光霉素、慶大霉素、草甘膦、潮霉素、卡那霉素、甲氨喋呤、腐草霉素、草 胺膦(phosphinotricin)、壯觀霉素、鏈霉素、磺酰胺和磺酰脲抗性的多核苷酸(參見,例 如,Maliga 等,Methods in Plant Molecular Biology, ColdSpring Harbor Laboratory Press, 1995,第 39 頁)。報告基因已經(jīng)被成功地用在高等植物的葉綠體中,并且已經(jīng)報道了高水平重組蛋 白的表達。此外,報告基因已經(jīng)被用在萊茵衣藻的葉綠體中,但是,在大多數(shù)情況下,產(chǎn)生 非常少量的蛋白。報告基因極大地增強了監(jiān)控多種生物中基因表達的能力。在高等植物 的葉綠體中,β -葡萄糖醛酸酶(uidA,Staub 和 Maliga, EMB0J. 12 =601-606,1993)、新霉 素磷酸轉(zhuǎn)移酶(nptll,Carrer 等,Mol Gen. Genet. 241 =49-56,1993)、腺苷基 _3_ 腺嘌呤轉(zhuǎn) 移醇(adenosyl-3-adenyltransf-erase)(aadA, Svab 禾口 Maliga, Proc. Natl. Acad. Sci., USA 90 :913-917,1993)和維多利亞發(fā)光水母(Aequorea victoria) GFP (Sidorov 等,Plant
27J. 19 :209-216,1999)已經(jīng)被用作報告基因(Heifetz, Biochemie 82 :655_666,2000)。這 些基因中的每一個都具有使它們成為有用的葉綠體基因表達的報告基因的性質(zhì),如易于分 析、靈敏性或原位檢查表達的能力。基于這些研究,其它異源蛋白已經(jīng)在高等植物的葉綠體 中表達,如,蘇云金芽孢桿菌(Bacillus thuringiensisKry毒素,其將抗性給予草食昆蟲 (Kota 等,Proc. Natl. Acad. Sci.,USA 96 1840-1845,1999)或人生長激素(Staub 等,Nat. Biotechnol. 18 :333_338,2000),一種可能的生物藥物。若干報告基因已經(jīng)在真核綠藻萊茵 衣藻的葉綠體中表達,包括 aadA(Goldschmidt-Clermont,Nucl. Acids Res. 19 4083-4089 1991 ;Zerges 和 Rochaix,Mol. Cell Biol. 14 :5268_5277,1994)、uidA(Sakamoto 等,Proc. Natl. Acad. Sci.,USA 90 :477_501,19933,Ishikura 等,J. Biosci. Bioeng. 87 :307_314 1999)、海腎(Renilla)熒光素酶(Minko 等,Mol. Gen. Genet. 262 :421_425,1999)和來 自鮑曼不動桿菌(Acinetobacter baumanii)的氨基糖苷磷酸轉(zhuǎn)移酶(amino glycoside phosphotransferase)aphA6(Bateman 禾口 Purton, Mol.Gen. Genet 263 :404_410,2000)。本文所述的載體可包含修飾的基因和/或開放讀碼框,其含有一個或多個重組產(chǎn) 生的特征。例如,編碼目標蛋白的基因可被有用的分子標記物標記。在一些實施方式中,所 述標記可以是附加表位或標記多肽。通常地,附加表位包含足夠數(shù)量的氨基酸殘基以提供 抗體可根據(jù)其制備的抗原表位,而抗原表位也足夠短,以便其不影響所融合到的多肽的活 性。優(yōu)選地,標記也是相當(dāng)獨特的,以便根據(jù)該標記制備的抗體基本不與其它抗原表位(如 FLAG標記)交叉反應(yīng)。其它合適的標記可被使用,如,親和標記。親和標記被附加到蛋白 上,以便使用親和技術(shù)將蛋白從其天然粗生物來源中提純。這樣的標記的實例包括,但不限 于,幾丁質(zhì)結(jié)合蛋白(CBP)、麥芽糖結(jié)合蛋白(MBP)、谷胱甘肽-S-轉(zhuǎn)移酶(GST)和金屬親和 標記(如pol (His))。將標記置于C-和/或N-末端可基于例如蛋白功能而確定。本領(lǐng)域 普通技術(shù)人員能認識到,適當(dāng)標記的選擇將基于多個因素,包括預(yù)期的用途、目標蛋白、費 用等??蓪幋a本發(fā)明所述蛋白的基因進行的修飾的另一實例是加入可剪切部分。典型 地,所述剪切部分是被蛋白酶靶向的、合適長度的多肽。所述蛋白酶可以是生物中天然生成 的,所述生物被預(yù)期是本發(fā)明所述載體的宿主。例如,在目標宿主是萊茵衣藻的情況下,蛋 白可被工程化以包含可被膜結(jié)合的蛋白酶(參見,例如,Hoober等,Plant Physiol. 1992 July ;99 (3) 932-937)或ClpP蛋白酶(NCBI#3053)識別的氨基酸區(qū)域。在其它實施方式 中,自剪切蛋白酶,如口蹄疫病毒的A2區(qū)域(或其功能化部分)可被使用。Halpin等,Plant J. , 1999 ;17(4),453-459。典型地,可剪切部分將被用于含有融合蛋白的本發(fā)明所述載體。 例如,在一些實施方式中,載體可含有編碼融合蛋白的單一開放讀碼框,可剪切部分可被插 入編碼融合蛋白各部分的序列之間(例如,參見圖14Α)。而可對編碼本發(fā)明所述蛋白的基因進行的另一種修飾是加入分泌信號。蛋白 分泌典型地是通過通常位于多肽N-末端的疏水性分泌信號,其靶向該蛋白到內(nèi)質(zhì)網(wǎng),并 最終到細胞膜。分泌信號允許多種宿主包括NVPOs中重組蛋白的產(chǎn)生和分泌??杀挥?于本發(fā)明的分泌信號的一個實例是來自萊茵衣藻碳酸酐酶蛋白的信號。Toguri等,Eur. J. Biochem. 1986 ;158,443-450。多種這樣的信號在本領(lǐng)域內(nèi)被公知,并且合適的信號的選 擇取決于,例如,宿主細胞和蛋白折疊。在一些實施方式中,本發(fā)明所述的載體含有諸如大腸桿菌或釀酒酵母(S. cerevisiae)復(fù)制起點的元件。這些特征,與適當(dāng)?shù)倪x擇性標記結(jié)合,允許所述載體在目 標宿主細胞和細菌和/或酵母細胞之間“穿梭(shuttled) ”。在第二宿主(secondary host) 中傳遞本發(fā)明的穿梭載體的能力可允許對該載體特征更方便地操控。例如,含有載體和推 定插入的目標多肽的反應(yīng)混合物可以被轉(zhuǎn)化進原核宿主細胞如大腸桿菌,被擴增并用常規(guī) 方法收集,并且被檢驗,以分辨含有目標插入體或構(gòu)建體的載體。如果期望,該載體可以進 一步被操作,例如,通過進行定點突變插入的多核苷酸,隨后再次擴增并選擇具有變異的目 標多核苷酸的載體。穿梭載體隨后可以被引入植物細胞葉綠體,其中目標多肽可以被表達, 并且如果期望,根據(jù)本發(fā)明所述的方法進行分離。本發(fā)明的多核苷酸或重組核酸分子可以使用本領(lǐng)域已知的任何方法被引入植 物葉綠體或核。多核苷酸可以通過多種本領(lǐng)域熟知的方法被引入細胞,并且部分地基于 特定的宿主細胞進行選擇。例如,多核苷酸可以使用直接基因轉(zhuǎn)移的方法被引入植物細 胞,所述方法例如電穿孔或使用粒子槍的微粒介導(dǎo)(基因槍)轉(zhuǎn)化或“玻璃珠法(glass bead method) ”,或通過花粉介導(dǎo)的轉(zhuǎn)化、脂質(zhì)體介導(dǎo)的轉(zhuǎn)化、使用損傷或酶降解的未成熟 胚胎或損傷或酶降解的胚胎胼胝體轉(zhuǎn)化(Potrykus,Ann. Rev. Plant. Physiol. Plant Mol. Biol. 42 -.205-225,1991)。術(shù)語“外源的”以比較的意義用在這里,表示提到的核苷酸序列(或多肽)來自不 同于參照來源的來源,或被連接到通常與其不相關(guān)的第二核苷酸序列(或多肽),或被修飾 以至于其是通常與參照材料不相關(guān)的形式。例如,編碼酶的多肽相對于植物葉綠體的核苷 酸序列是異源的;包含,例如,被可操作地鏈接到第二核苷酸序列的第一核苷酸序列的重組 核酸分子的組成也是這樣;被引入葉綠體的變異多核苷酸也是這樣,所述變異多核苷酸通 常無法在葉綠體中發(fā)現(xiàn)。質(zhì)體轉(zhuǎn)化是用于將多核苷酸引入植物細胞葉綠體的一種方法(參見美國專利號 5,451,513、5,545,817 和 5,545,818 ;WO 95/16783 ;McBride 等,Proc. Natl. Acad. Sci.,USA 91 :7301-7305,1994)。在一些實施方式中,葉綠體轉(zhuǎn)化涉及引入一側(cè)帶有期望核苷酸序列 的葉綠體DNA的區(qū)域,允許外源DNA同源重組進入目標葉綠體基因組。本文的描述假定宿主 細胞可以用載體轉(zhuǎn)化。本領(lǐng)域普通技術(shù)人員能認識到這樣的轉(zhuǎn)化包括用環(huán)狀或線性化的載 體,或載體的線性化部分轉(zhuǎn)化。因此,包含載體的宿主細胞可含有該細胞中的整個載體(環(huán) 狀或線性的形式),或可包含本發(fā)明載體的線性化部分(如,圖3和16中圖示出的構(gòu)建體)。 在一些實施方式中,葉綠體基因組DNA —側(cè)的1到1. 5kb的核苷酸序列可以被使用。使用 這種方法,在葉綠體16S rRNA和給予對奇霉素和鏈霉素的抗性的rpsl2基因中的點突變可 以被用作轉(zhuǎn)化的選擇性標記(Svab 等,Proc. Natl. Acad. Sci.,USA 87 :8526_8530,1990), 并且可以約每100次目標葉片轟擊一個的頻率,產(chǎn)生穩(wěn)定的同型(homoplasmic)轉(zhuǎn)化體。微粒介導(dǎo)的轉(zhuǎn)化也可以被用于將多核苷酸引入植物細胞葉綠體(Klein等, Nature 327:70-73,1987).該方法是用了諸如金或鎢的微粒,其被期望的多核苷酸通過 與氯化鈣、亞精胺或聚乙二醇沉淀而包衣。微粒粒子使用諸如BI0LISTICPD-1000粒子槍 (BioRad ;Hercules Calif.)的設(shè)備被高速加速進入植物組織。使用基因槍方法進行轉(zhuǎn)化 的方法在本領(lǐng)域內(nèi)被公知(參見,例如,Christou, Trends inPlant Science 1 =423-431, 1996)。微粒介導(dǎo)的轉(zhuǎn)化已經(jīng)被使用,例如,用以產(chǎn)生多種轉(zhuǎn)基因植物種類,包括棉花、煙草、 玉米、雜交白楊和木瓜。重要的谷類作物,諸如小麥、燕麥、大麥、高粱和水稻也已經(jīng)使用微
29粒介導(dǎo)輸送被轉(zhuǎn)化(Duan 等,Nature Biotech. 14 :494_498,1996 ;Shimamoto, Curr. Opin. Biotech. 5 :158-162,1994)。大多數(shù)雙子葉植物的轉(zhuǎn)化用上述方法是可能的。單子葉植物 的轉(zhuǎn)化也可以使用,例如,上述基因槍方法、原生質(zhì)體轉(zhuǎn)化、部分滲透細胞的點穿孔、使用玻 璃纖維引入DNA、玻璃珠振蕩(agitation)法等進行轉(zhuǎn)化。轉(zhuǎn)化頻率可通過隱性rRNA或蛋白抗生素抗性基因被顯性選擇性標記替代而提 高,所述顯性選擇性標記包括但不限于細菌aadA基因(Svab和Maliga,Proc. Natl. Acad. Sci. , USA 90:913-917,1993)。轉(zhuǎn)化后通常需要約15到20個細胞分裂周期以達到同質(zhì) (homoplastidic)狀態(tài)。葉綠體可包含其基因組的多個拷貝對本領(lǐng)域普通技術(shù)人員是顯而 易見的,并且因此,術(shù)語“同質(zhì)的(homoplasmic) ”或“同型異源性(homoplasmy) ”指的是這 樣的狀態(tài)——特定目標基因座的所有拷貝都基本相同。質(zhì)體表達,其中基因通過同源重組 插入每個植物細胞中存在的環(huán)狀質(zhì)體基因組的所有幾千個拷貝中,利用了相對于核表達基 因的大量拷貝數(shù)優(yōu)勢,以允許表達水平輕易地超過總可溶植物蛋白的10%。本發(fā)明的方法可以通過向葉綠體中引入重組核酸分子實施,其中所述重組核酸分 子包括第一多核苷酸,其編碼至少一個多肽(即,1個、2個、3個、4個或更多)。在一些實施 方式中,多肽被可操作地鏈接到第二、第三、第四、第五、第六、第七、第八、第九、第十和/或 后續(xù)多肽。例如,在烴生產(chǎn)途徑中的若干酶可以被直接或間接地鏈接,以便由途徑中的一種 酶產(chǎn)生的產(chǎn)物一旦產(chǎn)生,即與該途徑中下一種酶非??拷τ谌~綠體的轉(zhuǎn)化,本發(fā)明的一個主要優(yōu)勢是包含選擇性標記和一個或多個目的 基因的重組核酸構(gòu)建體的使用。典型地,葉綠體的轉(zhuǎn)化通過用以下兩種構(gòu)建體共轉(zhuǎn)化葉綠 體實施一種包含選擇性標記且第二種包含目的基因。這些轉(zhuǎn)化體的篩選由于多種原因是 費力且費時的。首先,培養(yǎng)一些轉(zhuǎn)化的生物需要的時間是漫長的。其次,轉(zhuǎn)化體必須被篩選 出選擇性標記和目的基因兩者都存在。典型地,對目的基因的第二次篩選通過DNA印記法 進行(參見,例如 PCT/US2007/072465)。在葉綠體中,基因表達的調(diào)控一般地在轉(zhuǎn)錄后并且通常在翻譯起始時發(fā) 生。這種調(diào)控取決于葉綠體翻譯裝置,以及核編碼的調(diào)控因子(參見Barkan和 Goldschmidt-Clermont, Biochemie 82 :559_572,2000 ;Zerges, Biochemie 82 :583_601, 2000)。葉綠體翻譯裝置通常與細菌中的類似;葉綠體包含70S核糖體;具有缺少5’加蓋的 mRNA并通常不含有3,多腺苷尾部(Harris等,Microbiol. Rev. 58 :700_754,1994);而且翻 譯在葉綠體和在細菌中被諸如氯霉素的選擇性試劑抑制。本發(fā)明的一些方法利用了核糖體結(jié)合序列(RBS)相對于編碼序列的恰當(dāng)置 放。以前就已經(jīng)注意到RBS這樣的置放引起植物葉綠體中穩(wěn)健的翻譯(參見美國申請 2004/0014174,在此被引入作為參考),以及利用葉綠體中表達多肽的多肽是該多肽不穿過 通常被由核基因表達的多肽穿過的細胞區(qū)室,并因此,不經(jīng)過某些翻譯后修飾,如糖基化。 同樣地,通過本發(fā)明的一些方法產(chǎn)生的多肽和蛋白復(fù)合體可以被預(yù)期在沒有這樣的翻譯后 修飾的情況下產(chǎn)生。術(shù)語“多核苷酸”或“核苷酸序列”或“核酸分子”在本文中被寬泛地使用,表示由 磷酸二酯鍵連接在一起的兩個或多個脫氧核糖核苷酸或核糖核苷酸的序列。因此,該術(shù)語 包括RNA和DNA,其可以是基因或其一部分、CDNA、合成的多脫氧核糖核苷酸序列等,并且可 以是單鏈或多鏈的,以及DNA/RNA雜交體。而且,該術(shù)語,如本文中所用,包括天然生成的核酸分子,其可以從細胞分離,以及合成的多核苷酸,其可以通過例如化學(xué)合成的方法或通過 酶的方法如通過聚合酶鏈反應(yīng)(PCR)制備。應(yīng)該認識到,不同術(shù)語的使用只是出于討論的 方便,以便區(qū)分,例如,組合物的不同成分,除了術(shù)語“合成的多核苷酸”用在這里指的是已 經(jīng)被修飾以反映葉綠體密碼子使用的多核苷酸。通常,包含一個多核苷酸的核苷酸是天然生成的脫氧核糖核苷酸,如連接到 2’ -脫氧核糖的腺嘌呤、胞嘧啶、鳥嘌呤或胸腺嘧啶,或諸如鏈接到核糖的腺嘌呤、胞嘧 啶、鳥嘌呤或尿嘧啶。然而,取決于使用,多核苷酸也可以含有核苷酸類似物,包括非天 然生成的合成的核苷酸或修飾的天然生成的核苷酸。核苷酸類似物在本領(lǐng)域內(nèi)被公知 并可購買到,含有這些核苷酸類似物的多核苷酸也一樣(Lin等,Nucl. Acids Res. 22 5220-5234,1994 Jellinek 等,Biochemistry 34 :11363_11372,1995 ;Pagratis等,Nature Biotechnol. 15 :68_73,1997)。通常,磷酸二酯鍵連接本發(fā)明多核苷酸的核苷酸,但是其它 鍵,包括硫二酯鍵(thiodiester bond)、硫代磷酸酯鍵(phosphorothioate bond)、肽狀鍵 和任何其它本領(lǐng)域內(nèi)已知的鍵可被用于產(chǎn)生合成的多核苷酸(Tam等,Nucl. Acids Res. 22 977-986,1994 ;Ecker 和 Crooke, BioTechnology 13 :351360,1995)。本文所述的任意產(chǎn)物可以通過轉(zhuǎn)化生物,以引起由所述產(chǎn)物的生物的生產(chǎn)和/或 分泌來制備。生物被認為是光合生物,即使轉(zhuǎn)化事件破壞或消除了該轉(zhuǎn)化的生物的光合能 力(如,外源核酸被插入編碼光合作用所需的蛋白的基因)。融合蛋白載體在本發(fā)明的一些實施方式中,宿主NVPO核或質(zhì)體基因組將是用含有融合蛋白的 構(gòu)建體轉(zhuǎn)化的目標。本文所述的任何載體或其線性化的部分可以通過插入合適的信號 (如,宿主細胞的核復(fù)制起點或質(zhì)體的復(fù)制起點)或合適的一側(cè)同源區(qū)域(用于與目標基因 組進行同源重組)被修飾用于核或質(zhì)體轉(zhuǎn)化。本發(fā)明的一些構(gòu)建體在圖14中被示出。圖14A 中所示的構(gòu)建體包含至少一個調(diào)控元件(“啟動子/VUTRln /或“3’UTR”)和一個含有至 少兩個元件(“選擇性標記”和“轉(zhuǎn)基因”)的開放讀碼框(即,融合蛋白)。在一些實施方式 中,一個或多個調(diào)控元件可以是待轉(zhuǎn)化生物內(nèi)源的(如,5’和3’調(diào)控元件是引導(dǎo)構(gòu)建體插 入目標基因組的一側(cè)同源部分)。在該圖中,啟動子被可操作地連接到開放讀碼框,因此驅(qū) 動融合蛋白的表達。使用這種方法的一個潛在優(yōu)點是防止重組事件,降低可能導(dǎo)致刪除的 表達或其它作用,或降低轉(zhuǎn)基因(即,類異戊二烯產(chǎn)生酶)的表達。此外,通過創(chuàng)建包含選擇 性標記和轉(zhuǎn)基因的融合蛋白,插入位點可能被保留以產(chǎn)生多轉(zhuǎn)化株(multiply-tranformed strains)。然而,在一些實施方式中,融合蛋白可含有兩個或多個轉(zhuǎn)基因(如,F(xiàn)PP合成酶 或姜烯合成酶)。圖14A中也顯示了包含一個可選的剪切部分(“CM”),其符合選擇性標記和轉(zhuǎn)基因 的讀碼框。如上文所述,該剪切部分,當(dāng)存在時,可允許目標基因從選擇性標記上剪切。典 型地,對可剪切部分的剪切將產(chǎn)生兩個功能蛋白(如,選擇性標記和轉(zhuǎn)基因)。剪切可導(dǎo)致 該可剪切部分的一部分留在側(cè)翼多肽的一個、兩個上,或都沒有。剪切可在翻譯后或翻譯中 發(fā)生。因此,在一些實施方式中,含有選擇性標記、轉(zhuǎn)基因和介于中間的可剪切部分的融合 蛋白可存在于宿主細胞中。在其它實施方式中,該融合蛋白在全長融合蛋白轉(zhuǎn)錄體被翻譯 之前被剪切??蓪幋a融合蛋白(或本文所述的任何其它蛋白或蛋白的種類)的序列進行其它修飾。一個例子是接頭(linker)多肽。這樣的多肽可為目標蛋白提供空間分隔,允許 融合蛋白的部分恰當(dāng)?shù)卣郫B,和/或起因于融合蛋白的重組構(gòu)建。在另一實例中,分泌信 號可符合該融合蛋白的一個或多個部分(如,轉(zhuǎn)基因、選擇性標記或兩者)的讀碼框而被融 合。典型地,分泌信號被用于靶向在核基因組中表達的融合蛋白。在其它實施方式中,一個 或多個標記可按照該融合蛋白的一個或多個部分的讀碼框被融合。例如,編碼多聚組氨酸 (poly (His))標記的核苷酸序列可按照編碼轉(zhuǎn)基因的序列的讀碼框被連接,并且編碼FLAG 標記的核苷酸序列可按照編碼選擇性標記的序列的讀碼框被連接。而在其它實施方式中, 編碼分泌信號的核酸可按照該融合蛋白的一部分的讀碼框被連接。在一些實施方式中,分 泌信號可被連接到轉(zhuǎn)基因。明顯地,選擇性標記、轉(zhuǎn)基因、可剪切部分、信號序列和/或標記 的多種組合可基于實施者的需要,被結(jié)合成單一的開放讀碼框。因此,圖14中所示的構(gòu)建 體的簡化版本并非意欲限制本發(fā)明構(gòu)建體的范圍。本領(lǐng)域普通技術(shù)人員也能認識到,各部 分的這些組合也可被用在構(gòu)建體中,其可用于轉(zhuǎn)化葉綠體。圖14B顯示了核轉(zhuǎn)化的另一方法,其中轉(zhuǎn)化的構(gòu)建體包含選擇性標記和在不同調(diào) 控元件控制下的轉(zhuǎn)基因。盡管沒有明示,這樣的構(gòu)建體按上文所述,可包含可剪切部分、分 泌信號和/或標記。核酸、蛋白質(zhì)和酶本文公開的載體和其它核酸可以編碼促進本文所述中間體、產(chǎn)物、前體和產(chǎn)物衍 生物生產(chǎn)的多肽。例如,載體可編碼在類異戊二烯途徑中促進中間體、產(chǎn)物、前體和衍生物 生產(chǎn)的多肽。實施本發(fā)明中用到的酶可通過由任意生物包括細菌、植物、真菌和動物衍生的核 苷酸序列編碼。在一些實施方式中,所述酶是類異戊二烯產(chǎn)生酶。用在這里,“類異戊二烯 產(chǎn)生酶”是天然或非天然生成的酶,其產(chǎn)生類異戊二烯或提高類異戊二烯的產(chǎn)量。在一些實 施方式中,類異戊二烯產(chǎn)生酶產(chǎn)生帶有兩個磷酸根的類異戊二烯(如,GPP合成酶、FPP合成 酶、DMAPP合成酶)。在其它實施方式中,類異戊二烯產(chǎn)生酶產(chǎn)生帶有零、一、三或更多磷酸 根的類異戊二烯,或可產(chǎn)生帶有其它功能基團的類異戊二烯。這些酶的非限定性實例和它 們的來源顯示于表1。編碼本發(fā)明中有用的酶和其它蛋白的多核苷酸可通過本領(lǐng)域已知的 任何手段分離和/或合成,包括,但不限于克隆、亞克隆和PCR。表1.本發(fā)明中使用的合成酶的實例 所述合成酶可以是葡萄烴合成酶、石竹烯合成酶、大根香葉烯A合成酶、 8-表雪松醇合成酶、朱欒倍半萜合成酶、(+)_ δ -杜松烯合成酶、大根香葉烯C合成酶、(E) - β -法尼烯合成酶、蓖麻烯合成酶、vetispiradiene合成酶、5_表-馬兜鈴烯合成酶、 馬兜鈴烯合成酶、α-潷草烯、(Ε,E)-α-法尼烯合成酶、(_)_β_菔烯合成酶、Y _松油烯 合成酶、苧烯環(huán)化酶、沉香醇合成酶、(+)_冰片二磷酸合成酶、左旋海松二烯合成酶、異海松 二烯合成酶、(E)-Y-紅沒藥烯合成酶、柯巴基焦磷酸合成酶、貝殼衫烯合成酶、長葉烯合成 酶、Y-潷草烯合成酶、S -蛇床烯合成酶、β _水芹烯合成酶、異松油烯合成酶、(+)-3_蒈烯 合成酶、順-柯巴基焦磷酸合成酶、α -松油醇合成酶、順-海松_7,15- 二烯合成酶、反-山 達海松二烯合成酶、sterner-13-ene合成酶、E- β -羅勒烯、S-沉香醇合成酶、櫳牛兒醇合 成酶、Y “松油烯合成酶、沉香醇合成酶、E- β -羅勒烯合成酶、表_雪松醇合成酶、α -姜烯 合成酶、愈創(chuàng)木二烯合成酶、卡藜二烯合成酶、順-穆羅拉二烯合成酶、阿菲迪柯林-16b-醇 合成酶、伊麗莎白三烯合成酶、檀香醇合成酶、廣藿香醇合成酶、zinzanol合成酶、雪松醇合 成酶、香紫蘇醇合成酶、柯巴醇合成酶或淚柏醇合成酶。本發(fā)明的載體能夠穩(wěn)定地轉(zhuǎn)化多種光合生物,包括,但不限于光合細菌(包括藍 細菌)、藍藻門、原綠藻門、紅藻門、綠藻門、不等鞭毛門、tribophyta、灰色藻門、絲足蟲門、 裸藻門、眼蟲藻、定鞭藻門、金藻門、隱藻門、隱滴蟲、甲藻門、腰鞭毛蟲、定鞭金藻、硅藻門、 黃藻門、黃綠藻、針胞藻類、褐藻門和浮游植物。本發(fā)明所述的其它載體能夠穩(wěn)定地轉(zhuǎn)化萊 茵衣藻(C.reinhardtii)、鹽生杜氏藻(D. salina)、雨生紅球藻(H. pluvalis)、二形柵藻 (s. dimorphus)、綠色杜氏藻(D. viridis)或杜氏鹽藻(D. tertiolecta)。本文的載體可編碼在甲羥戊酸途徑中發(fā)揮作用的多肽,例如,如,硫解酶、HMG-CoA 合成酶、HMG-CoA還原酶、甲羥戊酸激酶、磷酸甲羥戊酸激酶和甲羥戊酸-5-焦磷酸脫羧酶。 在其它實施方式中,所述多肽是非甲羥戊酸途徑中的酶,例如DOXP合成酶、DOXP還原酶、 4- 二磷酸胞苷-2-C-甲基-D-赤蘚糖醇合成酶、4- 二磷酸胞苷-2-C-甲基-D-赤蘚糖醇激 酶、2-C-甲基-D-赤蘚糖醇2,4-環(huán)二磷酸合成酶、HMB-PP合成酶、HMB-PP還原酶或DOXP 還原異構(gòu)酶。在其它實施方式中,載體可含有編碼類異戊二烯途徑中的多肽的核苷酸序列,如, 例如,編碼合成酶的序列。所述合成酶可以是CIO、C15、C20、C30或C40合成酶。在一些 實施方式中,所述合成酶為苧烯合成酶、1,8-桉樹腦合成酶、α -菔烯合成酶、莰烯合成酶、 (+)_檜萜合成酶、月桂烯合成酶、松香二烯合成酶、紫杉二烯合成酶、法尼焦磷酸合成酶、紫 穗槐二烯合成酶、(E) - α -紅沒藥烯合成酶、diapophytoene合成酶或diapophytoene去飽 和酶。合成酶的非限定性實例和它們的氨基酸序列顯示于表2。表2.合成酶的蛋白序列
編碼多核苷酸的一個或多個密碼子可以被偏倚,以反映葉綠體和/或核密碼子的 使用。大多數(shù)氨基酸由兩個或多個不同的(簡并的)密碼子編碼,并且各種生物使用某 些密碼子優(yōu)先于其它密碼子是公知的。這樣優(yōu)選的密碼子使用,其也在葉綠體中使用,在 這里指的是“葉綠體密碼子使用”。萊茵衣藻的密碼子偏倚性已經(jīng)被報道。參見美國申請 2004/0014174。編碼類異戊二烯生物合成酶——其被偏倚用于在萊茵衣藻中表達——的核 酸的實例在表5-8中提供。與原生序列同一性百分比(在該序列被分離的生物中)可以是 約50 %、約60 %、約70 %、約80 %、約90 %或更高。本發(fā)明的一些載體包含表5提供的一種 或多種核酸和/或具有與其約70%同一性的核酸。適合確定核酸或多肽序列之間序列同一性或序列相似性百分比的算法的一個 實例是 BLAST 算法,其在 Altschul 等,J. Mol. Biol. 215 403~410 (1990)中描述。進行BLAST分析的軟件可通過國家生物技術(shù)信息中心(National Center forBiotechnology Information)公開獲得。BLAST算法參數(shù)W、T和X確定比對(alignment)的靈敏性和 速度。BLASTN程序(用于核苷酸序列)使用字長(W) 11、期望值(E)10、截斷值100、M = 5、N = -4和雙鏈的比較作為默認值。對于氨基酸序列,BLASTP程序使用字長(W)3、期望 值(W) 10 和 BL0SUM62 評分矩陣作為默認值(參見 Henikoff&Henikoff (1989)Proc. Natl. Acad. Sci. USA89 :10915)。除了計算序列同一性百分比,BLAST算法也可以進行兩個序 列間相似性的統(tǒng)計分析(參見,例如 Karlin&Altschul,Proc. Nat’ 1. Acad. Sci. USA90 5873-5787(1993))。BLAST算法提供的相似性的一個量度是最小總和概率(smallest sum probability) (P(N)),其提供了兩個核苷酸或氨基酸序列之間發(fā)生偶然匹配的概率的指 示。例如,如果在測試核酸和參考核酸比較中最小總和概率小于約0. 1,更優(yōu)選地小于約 0. 01,并且最優(yōu)選地小于約0. 001,該核酸則被認為與參考序列相似。術(shù)語“偏倚的”當(dāng)用于指密碼子時,表示多核苷酸中密碼子的序列已經(jīng)被改變,以 至于該密碼子在該偏倚(bias)用于的目標中,如藻細胞、葉綠體,是被優(yōu)選地使用的一個。 為葉綠體密碼子使用而偏倚的多核苷酸可以重新合成,或可以使用常規(guī)的重組DNA技術(shù), 例如,通過位點定向誘變法,進行基因修飾,以改變一個或多個密碼子,以便它們針對葉綠 體密碼子使用是偏倚的。葉綠體密碼子偏倚可以在不同植物中多種地變化,包括,例如,在 藻類葉綠體中與在煙草中比較。通常,選擇的葉綠體密碼子偏倚性反映了用本發(fā)明所述核 酸轉(zhuǎn)化的植物的葉綠體密碼子使用。例如,在萊茵衣藻為宿主的情況下,葉綠體密碼子使用 被偏倚,以反映藻類葉綠體密碼子使用(約74. 6%的AT偏倚在第三個密碼子位置)。本發(fā)明的一種方法可以使用編碼第一多肽和至少第二多肽的多核苷酸實施。因 此,該多核苷酸可以編碼,例如,第一多肽和第二多肽;第一多肽、第二多肽和第三多肽等。 而且,任何或所有編碼的多肽可以是相同的或不同的。在微藻萊茵衣藻的葉綠體中表達的 多肽可被組裝,形成功能多肽或蛋白復(fù)合體。因此,本發(fā)明的方法提供了產(chǎn)生功能蛋白復(fù)合 體,包括,例如,二聚體、三聚體和四聚體的方法,其中所述復(fù)合體的亞基可以是相同的或不 同的(如,分別是同源二聚體或異源二聚體)。術(shù)語“重組核酸分子”用在這里是指由人工介入操控的多核苷酸。重組核酸分子 可以含有兩個或多個核苷酸序列,它們以這樣的方式連接——以至于產(chǎn)物無法在自然界的 細胞中找到。特別地,兩個或多個核苷酸序列可以被可操作地連接,而且,例如,可以編碼融 合多肽,或可以含有編碼的核苷酸序列和調(diào)控元件。重組核酸分子也可以基于天然生成的 多核苷酸,但被操控以至于與天然生成的多核苷酸不同(如,為葉綠體密碼子使用而偏倚、 限制性酶切位點的插入、啟動子的插入、復(fù)制起點的插入)。重組核酸分子可進一步包含肽 標記(如His-6標記),其能夠輔助細胞內(nèi)多肽表達的識別。其它標記包括,例如FLAG抗 原表位、c-myc抗原表位;生物素和谷胱甘肽S-轉(zhuǎn)移酶。這些標記可以通過本領(lǐng)域內(nèi)已知 的任何方法檢測(如,抗標記的抗體、鏈霉親和素)。這些標記也可被用于分離可操作連接 的多肽,例如,通過親和層析。包含天然生成的核苷酸和磷酸二酯鍵的多核苷酸可以被化學(xué)合成或可以使用同 組DNA的方法、使用合適的多核苷酸作為模板而生產(chǎn)。相比之下,含有核苷酸類似物或磷酸 二酯鍵以外的共價鍵的多核苷酸通常是化學(xué)合成的,盡管諸如T7聚合酶的酶可以將某些 類型的核苷酸類似物插入多核苷酸,且因此能夠被用于從合適的模板生產(chǎn)重組的多核苷酸
50(Jellinek等,見上文,1995)。用于實施本發(fā)明方法的多核苷酸可從任何生物中分離。本發(fā)明可以利用NVP0中天然生成產(chǎn)物的生產(chǎn)途徑。這樣途徑的一個實例(用于 葉綠醇和胡蘿卜素的生產(chǎn))顯示于圖1。本領(lǐng)域普通技術(shù)人員將認識到,該類異戊二烯 生成途徑只不過是通過實例的方式提供,以進一步闡釋一種實施方式。本發(fā)明的一個方面是修改葉綠醇/日-胡蘿卜素途徑,以生產(chǎn)非天然生成的產(chǎn)物 和/或提高天然生成產(chǎn)物的產(chǎn)量。圖2顯示了用于圖1所示途徑的修改的一個潛在可能。 通過插入外源櫳牛兒基二磷酸合成酶(GPPS)和/或法尼二磷酸合成酶(FPPS),GPP和FPP 的產(chǎn)量可以被提高。例如,宿主生物(如,萊茵衣藻、杜氏鹽藻)可以用表5或7中所列的 任何編碼GPP或FPP合成酶的序列轉(zhuǎn)化(如,SEQ ID NOs. 82、87-94、118和/或180-191)。 而且,如下文實施例中所示例,GPPS或FPPS的引入可由編碼酶(如,苧烯合成酶、姜烯合成 酶、葉綠素酯水解酶)的外源基因的插入伴隨,所述酶引起不是由NVP0天然產(chǎn)生的目的類 異戊二烯(如,單萜、倍半萜和三萜)的生產(chǎn)。可單獨或組合用于轉(zhuǎn)化NVPOs的酶的非限定 性列表在表5-8中提供。編碼本發(fā)明所述酶的基因的插入可導(dǎo)致天然生成的類異戊二烯(如,GPP、FPP、葉 綠醇、八氫番茄紅素、胡蘿卜素)產(chǎn)量的提高。例如,天然生成的類異戊二烯(如,GPP、 FPP、八氫番茄紅素)的產(chǎn)量可通過以下途徑提高1)引入編碼生產(chǎn)類異戊二烯的合成酶的 內(nèi)源或外源基因的額外拷貝;2)引入調(diào)控元件(如,組成型啟動子、誘導(dǎo)型啟動子)以控制 天然生成的合成酶的表達;和/或3)引入外源核酸,其通過間接途徑提高天然生成的類異 戊二烯產(chǎn)量(如,外源GPPS可提高細胞內(nèi)GPP的濃度,為葉綠醇/葉綠素的合成途徑提供 更多底物)。因此,某些天然生成的類異戊二烯的產(chǎn)量可被提高。僅出于闡釋的目的,所述類異 戊二烯,葉綠醇,是通過多種NVPOs,包括萊茵衣藻,天然產(chǎn)生的。一般地,野生型萊茵衣藻株 中葉綠醇的量小于以質(zhì)量計1%。本公開提供了若干可提高葉綠醇產(chǎn)量的機制。在一個實施 例中,驅(qū)動內(nèi)源基因(如GPP合成酶)組成型或誘導(dǎo)型表達的調(diào)控元件可被引入生物的基 因組,以在比天然生成的調(diào)控元件達到的更高水平上表達該基因??蛇x地,一種或多種外源 類異戊二烯合成酶可被引入生物的基因組。這些合成酶可與目標NVP0同源或非同源(如, 來自相關(guān)生物的GPP合成酶、FPP合成酶)??蛇x地,外源的酶(如,磷酸酶、焦磷酸酶)可 被引入目標NVP0。這些酶可對天然生成的底物(如,GGPP、葉綠基二磷酸)起作用,或可對 由引入宿主NVP0的其它外源酶生成的底物作用。在一些實施方式中,外源酶可產(chǎn)生目標類 異戊二烯(如,葉綠醇),或可產(chǎn)生用于酶的前體,其隨后發(fā)揮生產(chǎn)目標類異戊二烯的作用。 而在另一種方法中,酶可被引入或上調(diào),其引起由宿主NVP0產(chǎn)生的產(chǎn)物的降解——天然地 或作為引入基因的結(jié)果——由此產(chǎn)生目的類異戊二醇。例如,葉綠素酯水解酶可被引入宿 主細胞,促進葉綠素降解為葉綠醇。使用這些方法,修飾的NVP0 可包含約 1. 5%、1. 6%、1. 7%、1. 8%、1. 9%、2. 0%、
2.1 %,2. 2 %,2. 3 %,2. 4 %,2. 5 %,2. 6 %,2. 7 %,2. 8 %,2. 9 %,3. 0 %,3. 1 %,3. 2
3.3 %,3. 4 %,3. 5 %,3. 6 %,3. 7 %,3. 8 %,3. 9 %A. 0 %A. 1 %A. 2 %A. 3 %A. 4
4.5 %A. 6 %A. 7 %A. 8 %A. 9 %,5. 0 %,5. 1 %,5. 2 %,5. 3 %,5. 4 %,5. 5 %,5. 6
5.7%,5. 8%,5. 9%,6. 0%,6. 1 %、6. 2%、6. 3%、6. 4%、6. 5%或更多。如果期望,葉綠醇 可以從修飾的NVPOs中被收集并被濃縮到約5%、10%、15%、20%、25%、30%、35%、40%、
5145%、50%、55%、60%、65%、70%、76%、80%、85%、90%、95%或更高。在一些實施方式 中,包含從本發(fā)明的NVP0中收集的葉綠醇的組合物也可包含NVP0細胞的部分(如,細胞壁 物質(zhì)、細胞膜物質(zhì)、蛋白質(zhì)、碳水化合物、核酸等)。本發(fā)明中使用的途徑可以包含細胞液中、質(zhì)體中(如,葉綠體)或兩者中存在的 酶。編碼本發(fā)明實施方式中酶的外源核酸可被引入宿主細胞,以便編碼的酶在細胞液中或 在質(zhì)體中或在兩者中都有活性。在一些實施方式中,在宿主細胞轉(zhuǎn)化后,在一個細胞內(nèi)區(qū)室 (如,在細胞液中)中存在的天然生成的酶可在不同的細胞內(nèi)區(qū)域內(nèi)(如在葉綠體中),或 在天然生成和非天然生成的區(qū)域內(nèi)表達。為了闡釋這一概念,并且只是通過實例的方式,無維管光合微藻可以被基因工程 化,以產(chǎn)生類異戊二烯,如苧烯(一種在特用化學(xué)和石化工業(yè)中有很高價值的分子)。苧烯 是純烴單萜,僅含有氫和碳原子。苧烯不是萊茵衣藻中天然產(chǎn)生的。苧烯在這些微藻中的 產(chǎn)生可以通過工程化該微藻以在葉綠體中表達異源酶苧烯合成酶而完成。苧烯合成酶可以 將萜烯前體櫳牛兒基焦磷酸(geranylpyrophosphate)轉(zhuǎn)化成苧烯。不像苧烯,櫳牛兒基焦 磷酸天然存在于微藻的葉綠體中。苧烯合成酶的表達可以通過插入編碼苧烯合成酶的異源 基因到微藻的葉綠體基因組中完成。隨后使微藻的修飾株成為同質(zhì)的,以確保苧烯基因在 所有后代的葉綠體基因組中穩(wěn)定保持。當(dāng)被插入的基因存在于葉綠體基因組的所有拷貝中 時,微藻對于基因是同質(zhì)的。葉綠體可能包含其基因組的多個拷貝對本領(lǐng)域普通技術(shù)人員 是顯而易見的,并且因此,術(shù)語“同質(zhì)的(homoplasmic)”或“同型異源性(homoplasmy) ”指 的是這樣的狀態(tài)——特定目標基因座的所有拷貝都基本相同。質(zhì)體表達,其中基因通過同 源重組插入每個植物細胞中存在的環(huán)狀質(zhì)體基因組的所有幾千個拷貝中,利用了相對于核 表達基因的大量拷貝數(shù)優(yōu)勢,以允許表達水平輕易地超過總可溶植物蛋白的10%。簡單地說,確定本發(fā)明所述生物的原生質(zhì)狀態(tài)的過程包括在給定的目標基因座 上,篩選有外源核酸存在且沒有野生型核酸的轉(zhuǎn)化體。這樣的方法被用在下文的實施例1 和2中(圖4A-C和6A-C)。本文的任何載體(如,包括上文所述的任何表達載體)可以包含編碼蛋白或多肽 的核苷酸序列,所述蛋白或多肽允許或提高由轉(zhuǎn)化的生物產(chǎn)生產(chǎn)物的分泌。蛋白或多肽分 子影響、提高、上調(diào)或調(diào)節(jié)產(chǎn)物從宿主細胞或生物的分泌。表達載體可包含編碼允許或提高產(chǎn)物分子分泌的蛋白或多肽,和編碼來自類異戊 二烯途徑的合成酶的核苷酸序列。選擇性標記在一些實施方式中,表達載體中的異源序列編碼顯性選擇性標記,用于轉(zhuǎn)化的生 物的選擇。因此,已經(jīng)接受轉(zhuǎn)化的生物可以在一種化合物(如,顯性選擇性標記向其賦予抗 性的化合物)存在的情況下被培養(yǎng),所述化合物允許對轉(zhuǎn)化的宿主細胞進行顯性選擇。當(dāng) 在宿主生物中表達時,選擇性標記向其賦予抗性的化合物的實例包括代謝抑制劑(即,抑 制藻類新陳代謝的化合物),如抗生素、殺真菌劑、滅藻劑、殺菌劑和除草劑。功能上,這些 化合物可對細胞有毒性,或通過作為蛋白或核酸的結(jié)合試劑抑制代謝。例如,這些化合物可 以抑制翻譯、轉(zhuǎn)錄、酶功能、細胞生長、細胞分裂和/或微管形成。適合用于本發(fā)明的顯性選 擇性標記可以選自任何已知的或后續(xù)識別的選擇性標記,包括從真菌和細菌來源衍生的標 記(參見,例如美國專利號5,661,017)。在其它實施方式中,與營養(yǎng)缺陷型變異菌株互補的野生型同源基因也可被用作選擇性標記系統(tǒng),例如,在一些綠藻中(參見,例如Kindle等, J. Cell Biol. ,109 :2589-2601(1989),其討論了帶有編碼硝酸還原酶基因的萊茵衣藻的硝 酸還原酶缺陷型變體的轉(zhuǎn)化)。調(diào)控序列本文所述的任何表達載體可進一步包含調(diào)控序列。調(diào)控序列可包括例如,啟動子、 操縱子、抑制子、增強子、轉(zhuǎn)錄終止序列、調(diào)控翻譯的序列,或與宿主細胞相容的和控制本發(fā) 明的核酸分子表達的其它調(diào)控序列。在一些情況下,調(diào)控序列包括能夠控制、調(diào)節(jié)或影響轉(zhuǎn) 錄起始、延伸和/或終止的轉(zhuǎn)錄控制序列。例如,調(diào)控序列可以提高生物中基因或基因產(chǎn)物 的轉(zhuǎn)錄和翻譯速率和/或效率,其中所述基因或基因產(chǎn)物的表達被上調(diào),(直接或間接地) 引起本文所述的產(chǎn)物的生產(chǎn)、分泌或兩者的提高。調(diào)控序列也可通過提高基因或基因產(chǎn)物 的穩(wěn)定性,導(dǎo)致生產(chǎn)、分泌或兩者的提高。調(diào)控序列可以是自體同源或異源的,并且如果是異源的,可以是同源的。調(diào)控序列 可編碼促進產(chǎn)物表達和生產(chǎn)的酶的一個或多個多肽。例如,異源的調(diào)控序列可由所述生物 相同屬的另一種(如,另一藻類種)產(chǎn)生,并在藻類中編碼合成酶。在另一實施方式中,自 體同源的調(diào)控序列可以由表達載體將在其中表達的生物中產(chǎn)生。取決于應(yīng)用,調(diào)控序列可以被用以影響誘導(dǎo)型或組成型表達。藻類調(diào)控序列可以 被使用,并且可以是核、病毒、染色體外、線粒體或葉綠體源的。合適的調(diào)控序列包括與待表達核苷酸序列天然相關(guān)的那些(例如,藻類啟動子天 然地與藻類衍生的核苷酸序列可操作地連接)。合適的調(diào)控序列包括與待表達的核酸分子 非天然相關(guān)的調(diào)控序列(例如,一個種的藻類啟動子與另一生物或藻類種的核苷酸序列可 操作連接)。后一種調(diào)控序列可以是在相同種內(nèi)控制另一基因表達的序列(即,自體同源), 或可以從不同生物或種中衍生(即,異源的)。為了確定推定的調(diào)控序列是否合適,該推定的調(diào)控序列被連接到核酸分子,其通 常編碼產(chǎn)生容易檢測的信號的蛋白。該構(gòu)建體可隨后通過標準技術(shù)插入藻類或其它生物, 并且其表達被監(jiān)控。例如,如果核酸分子編碼顯性的選擇性標記,待使用的藻類或生物被測 試在所述標記為其提供抗性的化合物存在的環(huán)境中生長的能力。在一些情況下,調(diào)控序列是啟動子,如適合核苷酸序列在無維管光合生物中表達 的啟動子。例如,所述啟動子可以是藻類啟動子,例如美國公開申請?zhí)?006/0234368和 2004/0014174,以及 Hallmann 的 Transgenic Plant J. 1 :81_98 (2007)中所述。該啟動子 可以是葉綠體特異性啟動子或核啟動子。啟動子可以是EFl-a基因啟動子或D啟動子。在 一些實施方式中,所述合成酶被可操作地連接到EF1-a基因啟動子。在一些實施方式中, 所述合成酶被可操作地連接到D啟動子。本文的調(diào)控序列可以在多種位置發(fā)現(xiàn),包括例如,編碼區(qū)域和非編碼區(qū)域、 5'-未翻譯區(qū)域(如,編碼區(qū)域上游的區(qū)域)和3'-未翻譯區(qū)域(如,編碼區(qū)域下游的區(qū) 域)。因此,在一些實施方式中,自體同源或異源的核苷酸序列可以包含一個或多個3'或 5' _未翻譯區(qū)域、一個或多個內(nèi)含子或一個或多個外顯子。例如,在一些實施方式中,調(diào)控序列可以包含隱秘小環(huán)藻(Cyclotella cryptica) 乙酰輔酶A羧化酶5'-未翻譯調(diào)控序列或隱秘小環(huán)藻乙酰輔酶A羧化酶3'-未翻譯調(diào) 控序列(美國專利號5,661,017)。
調(diào)控序列也可編碼嵌合或融合多肽,如蛋白AB或SAA,其促進異源核苷酸序列和 蛋白的表達。其它調(diào)控序列包括自體同源的內(nèi)含子序列,其可促進異源序列的翻譯。在本文的任何表達載體中使用的調(diào)控序列可被誘導(dǎo)。可誘導(dǎo)的調(diào)控序列,如啟動 子,可以通過例如光被誘導(dǎo)。調(diào)控序列也可以是可自體調(diào)控的。可自體調(diào)控的調(diào)控序列的 實例包括通過,例如,內(nèi)源ATP水平或通過由生物產(chǎn)生的產(chǎn)物自體調(diào)控的那些。在一些實施 方式中,所述調(diào)控序列可通過外源試劑被誘導(dǎo)。其它可誘導(dǎo)的元件在本領(lǐng)域內(nèi)被公知,并且 可適合用在本發(fā)明中。本文所述的各種調(diào)控序列的各種組合可通過本發(fā)明實施,并與本發(fā)明的其它特征 組合。在一些情況下,表達載體含有一個或多個調(diào)控控制,其被可操作地連接到編碼多肽的 核苷酸序列。這樣的序列,可以,例如,上調(diào)本文所述的產(chǎn)物的分泌、生產(chǎn)或兩者。在一些情 況下,表達載體包含一個或多個調(diào)控序列,其被可操作地連接到編碼多肽的核苷酸序列上, 所述多肽影響,例如,上調(diào)產(chǎn)物的分泌、生產(chǎn)或兩者。表汰葉綠體是光合生物中生產(chǎn)性的細胞器和大量蛋白合成的位置。本文所述的任何 表達載體可選擇性地適合葉綠體表達。許多來自高等植物的葉綠體啟動子已經(jīng)在Kimg和 Lin, Nucleic Acids Res. 13 :7543_7549 (1985)中描述?;虍a(chǎn)物可在葉綠體中由表達載 體表達。由表達載體編碼的基因產(chǎn)物也可由葉綠體靶向基因被靶向到葉綠體。例如,靶向 表達載體或由表達載體編碼的基因產(chǎn)物到葉綠體可進一步增強由調(diào)控序列和編碼允許或 提高燃料分子分泌的蛋白或多肽的序列提供的效果。本文所述的靶向葉綠體的各種組合可通過本發(fā)明具體體現(xiàn)并與本發(fā)明的其它特 征組合。例如,編碼萜烯合成酶的核苷酸序列可被可操作地連接到編碼葉綠體靶向基因的 核苷酸序列。宿主細胞可用編碼靶向葉綠體的苧烯合成酶的表達載體轉(zhuǎn)化,并且因此,可產(chǎn) 生比用編碼苧烯合成酶但沒有葉綠體靶向基因的表達載體轉(zhuǎn)化的宿主細胞更多的苧烯合 成酶。提高的苧烯合成酶的表達可產(chǎn)生比產(chǎn)生較少的宿主細胞更多的苧烯。表5和7提供 了編碼本發(fā)明中有用的類異戊二烯產(chǎn)生酶的核酸實例。表6和8提供了添加限制性酶切位 點的這些核酸的序列。表5-8中的序列也針對萊茵衣藻的表達進行了密碼子偏倚。這些位 點,顯而易見地,能夠被用于將核酸插入載體。而在另一實施例中,包含編碼產(chǎn)生產(chǎn)物(如,燃料產(chǎn)物、香料產(chǎn)物、殺蟲劑產(chǎn)物)的 酶的核苷酸序列的表達載體被靶向到葉綠體,所述產(chǎn)物不是由生物通過使用由該生物天然 產(chǎn)生的前體作為底物天然產(chǎn)生的。通過靶向該酶到葉綠體,產(chǎn)物的生產(chǎn)與酶在其中被表達 但未被靶向到葉綠體的宿主細胞相比被提高。不被理論限制,這可能是由于更多的前體在 葉綠體中被產(chǎn)出,并且因此,更多的產(chǎn)物可能通過由被引入的核苷酸序列編碼的酶被產(chǎn)出。趙本文考慮的產(chǎn)物的實例包括烴產(chǎn)物和烴衍生物產(chǎn)物。烴產(chǎn)物是僅含有氫分子和碳 分子的產(chǎn)物。烴衍生物產(chǎn)物是帶有一個或多個雜原子的烴產(chǎn)物,其中所述雜原子是非氫或 碳的任何原子。雜原子的實例包括,但不限于,氮、氧、硫和磷。一些產(chǎn)物是富含烴的,其中 以重量量計至少50 %、60 %、70 %、80 %、90 %或95 %的產(chǎn)物是由碳和氫構(gòu)成。可使用本文所述的組合物及方法生產(chǎn)的烴和烴衍生物的實例包括萜烯,及其衍生 物,類萜。萜烯是異戊二烯(C5)單元構(gòu)成的分子,并且不必是純的烴。萜烯典型地是由異戊二烯單元衍生。異戊二烯單元是五碳單元(C5)。萜烯是可以被改性(如氧化、去甲基等) 或其碳骨架被重組以形成萜烯衍生物如類異戊二烯的烴。類異戊二烯(也被稱為類萜)是由異戊二烯亞單元衍生,但是是被改性的,如通過 諸如氧的雜原子的加入、通過碳骨架的重組和通過烷基化。類異戊二烯通常具有若干個碳 原子,其可被5整除,但這不是要求,因為“不規(guī)則(irregular)”類萜是已知的。類胡蘿卜 素,諸如胡蘿卜素和葉黃素,是類異戊二烯作為有用產(chǎn)物的實例。類固醇是類萜的另一實 例。類異戊二烯的實例包括,但不限于,半萜(C5)、單萜(C10)、倍半萜(C15)、二萜(C20)、 三萜(C30)、四萜(C40)和多萜(Cn,其中n等于或大于45)。類異戊二烯的其它實例包括, 但不限于,苧烯、1,8_桉樹腦、a-菔烯、莰烯、(+)_檜萜、月桂烯、松香二烯、紫杉二烯、法尼 焦磷酸、紫穗槐二烯(amorphadiene)、(E) - a -紅沒藥烯、姜烯或diapophytoene,及其衍生 物。類異戊二烯前體被認為通過兩種途徑產(chǎn)生。甲羥戊酸途徑,或HMG-CoA還原酶途 徑,產(chǎn)生二甲基烯丙基焦磷酸(DMAPP)和異戊基焦磷酸(IPP),類異戊二烯常見的C5前體。 非甲羥戊酸途徑是形成DMAPP和IPP的可選途徑。DMAPP和IPP可被縮合以形成櫳牛兒基 二磷酸(GPP)或其它前體,如法尼二磷酸(FPP)、忙牛兒基忙牛兒基二磷酸(GGPP),由它們 形成更高級的類異戊二烯。可以包含本發(fā)明的類異戊二烯的產(chǎn)物的實例包括,但不限于,燃料產(chǎn)物、香料產(chǎn)物 和殺蟲劑產(chǎn)物。在一些實施方式中,產(chǎn)物可被直接使用。在其它實施方式中,產(chǎn)物可被用作 “原料(feedstock)”以生產(chǎn)另一種產(chǎn)物。例如,在產(chǎn)物為類異戊二烯的情況下,所述類異戊 二烯可被氫化并被“裂化(cracked)”以產(chǎn)生較短鏈的烴(如,法尼烯被氫化以產(chǎn)生法尼烷, 其隨后被裂化以產(chǎn)生丙烷、丁烷、辛烷或其它燃料產(chǎn)物)。由本發(fā)明產(chǎn)生的產(chǎn)物可由被轉(zhuǎn)化的宿主細胞和/或生物天然或非天然(如作為轉(zhuǎn) 化的結(jié)果)地產(chǎn)生。產(chǎn)物也可以是自然界中不存在的新分子。例如,藻類中天然產(chǎn)生的產(chǎn) 物可以是萜烯,如類胡蘿卜素(如胡蘿卜素)。不是由藻類天然產(chǎn)生的產(chǎn)物的實例包括 非天然的萜烯,如苧烯。宿主細胞可被基因修飾,例如,通過用序列轉(zhuǎn)化以促進苧烯的分泌。燃料產(chǎn)品燃料產(chǎn)品的實例包括石化產(chǎn)品及其前體,和所有其它可能在石油化學(xué)工業(yè)中有用 的物質(zhì)。燃料產(chǎn)品包括,例如,石油產(chǎn)品、石油的前體,以及它們的石化產(chǎn)品和前體。燃料或 燃料產(chǎn)品可被用在燃燒器中,例如鍋爐、窯爐、烘干機或熔爐。燃燒器的其它實例是諸如汽 車引擎或發(fā)電機的內(nèi)燃機,包括汽油發(fā)動機、柴油發(fā)動機、噴射發(fā)動機和其它。燃料產(chǎn)品也 可被用于生產(chǎn)塑料、樹脂、纖維、彈性體、潤滑劑和凝膠。燃料產(chǎn)品可以包括短鏈烷烴(small alkane)(例如1到約4個碳),如甲烷、乙烷、 丙烷或丁烷,其可被用于加熱(如在烹飪中)或制作塑料。燃料產(chǎn)品也可包括帶有約5個 到約9個碳原子的碳骨架的分子,如石腦油(naptha)或石油醚,或其前體。其它燃料產(chǎn)品 可以是約5到約12個碳原子或用作汽油或發(fā)動機燃料的環(huán)烷烴。約10到約18個碳的分 子和芳香族,如煤油或其前體,也可以是燃料產(chǎn)品。燃料產(chǎn)品也可包括具有多于12個碳的 分子或其前體,如潤滑油中所用的。其它燃料產(chǎn)品包括重瓦斯(heavy gas)或燃料油(fuel oil),或它們的前體,通常包括約20到約70個碳的鏈烷烴、環(huán)烷烴和芳香烴。燃料產(chǎn)品也 包括可以從原油衍生或從原油中發(fā)現(xiàn)的其它殘留物和它們的前體,例如焦炭、浙青、焦油和蠟,它們通常包含具有約70或更多碳的多個環(huán)。多種燃料產(chǎn)品可通過若干過程被進一步精煉為終端用戶的最終產(chǎn)品。精煉可以通 過分級分餾(fractional distillation)進行。例如,燃料產(chǎn)品的混合物,如具有多種不同 鏈長的不同烴類的混合物可通過分級分餾被分離成各種成分。精煉也可包括任意的一個或多個以下步驟裂化、整合(unify)或改變所述燃料 產(chǎn)品。長鏈(Large)燃料產(chǎn)品,如長鏈烴(如> C10),可通過裂化被打斷成較短的片段。裂 化可通過加熱或高壓,例如通過蒸氣處理、減粘裂化或焦化進行。燃料產(chǎn)品也可通過減粘裂 化被精煉,例如降低重油的粘度。精煉也可包括焦化,其中重的、幾乎是純的碳殘余物被產(chǎn) 出。裂化也可通過催化的方法進行,通過使用催化劑,例如,但不限于,沸石、水合硅酸鋁、礬 土或二氧化硅-氧化鋁,提高裂化反應(yīng)的速率。催化可通過流化催化裂化,由此熱的催化 劑,如沸石,被用于催化裂化反應(yīng)。催化也可通過加氫裂化進行,與流化催化裂化相比,通常 使用更低的溫度。加氫裂化通常在升高的氫氣分壓存在的條件下發(fā)生。燃料產(chǎn)品可通過催 化裂化被精煉,以產(chǎn)生柴油、汽油和/或煤油。燃料產(chǎn)品也可通過在整合步驟中將它們結(jié)合而精煉,例如,通過使用諸如鉬或 鉬-錸混合物的催化劑。所述整合過程通常產(chǎn)生氫氣,一種可被用在裂化中的副產(chǎn)物。燃料產(chǎn)品也可通過將烴改變或重組(rearranging)或重構(gòu)(restructuring)為較 小的分子進行精制。在催化重組過程中有許多化學(xué)反應(yīng)發(fā)生,它們被本領(lǐng)域普通技術(shù)人員 公知。一般地,催化重組在催化劑存在和高氫分壓下進行。一個常見的過程是烷基化。例 如,丙烯和丁烯與諸如氫氟酸或硫酸的催化劑混合。燃料產(chǎn)物也可被混合或結(jié)合為混合物,以獲得終產(chǎn)物。例如,燃料產(chǎn)物可被混合以 形成各種等級的汽油,帶有或沒有添加劑的汽油,各種重量和等級的潤滑油,各種等級的煤 油,噴氣式發(fā)動機燃料,加熱用油(heating oil)和用于制備塑料和其它聚合物的化學(xué)品。 本文描述的燃料產(chǎn)品的組合物可與通過其它方式產(chǎn)生的燃料產(chǎn)品結(jié)合或混合。由本發(fā)明所述宿主細胞產(chǎn)生的一些燃料產(chǎn)品,特別是精煉后的,與已經(jīng)存在的石 化產(chǎn)品相同,即相同的結(jié)構(gòu)。一些燃料產(chǎn)品可與已存在的石化產(chǎn)品不同。然而,盡管一種分 子可能不存在于傳統(tǒng)的石化產(chǎn)品中或精煉品中,其仍可能在這些工業(yè)中有用。例如,烴可以 被生產(chǎn)為其在汽油的沸點范圍內(nèi),并且其可以被用作汽油或添加劑,即使它不是通常在汽 油中存在的。^^因此,產(chǎn)物(如,類異戊二烯、燃料產(chǎn)品、香料產(chǎn)品、殺蟲劑產(chǎn)品)可通過以下方法 產(chǎn)生,其包括用表達載體轉(zhuǎn)化宿主生物(如,無維管光合生物),培養(yǎng)該生物;和收集由該 生物產(chǎn)生的產(chǎn)物。在相關(guān)但獨特的方面,本發(fā)明提供了生產(chǎn)產(chǎn)物的方法,其包括用表達載 體轉(zhuǎn)化光合生物,培養(yǎng)該生物;和收集由該生物產(chǎn)生的產(chǎn)物。所述表達載體通常是本文所述 的表達載體的類型,并且特別地被用于向生物增加額外的生物合成能力或改變該生物中已 經(jīng)存在的生物合成途徑,意圖在于提高或允許由該光合生物產(chǎn)生分子。本文的方法包括選擇用于生產(chǎn)產(chǎn)物的基因,產(chǎn)物例如類異戊二烯、燃料、香料和殺 蟲劑,用該基因轉(zhuǎn)化光合生物的細胞,和在允許生產(chǎn)產(chǎn)物的合適條件下培養(yǎng)該生物。本發(fā)明 的生物可以在傳統(tǒng)的發(fā)酵生物反應(yīng)器中培養(yǎng),其包括,但不限于,分批式(batch)、補料分批 式(fed-batch)、細胞再循環(huán)和連續(xù)式發(fā)酵器。而且,它們可在光生物反應(yīng)器中生長(參見,
56例如,美國專利
發(fā)明者B·奧奈爾, C·A·貝恩克, M·門德斯, P·李, S·-C·方, S·梅菲爾德, Y·潘 申請人:藍寶石能源公司;斯克里普斯研究學(xué)院