專利名稱:Pufa聚酮化合物合酶系統(tǒng)及其用途的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及來自微生物,包括諸如Thraustochytrid微生物的真核生物體 的多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)。更具體地說,本發(fā)明 涉及編碼非細(xì)菌PUFA PKS系統(tǒng)的核酸,涉及非細(xì)菌PUFAPKS系統(tǒng),涉及 含有非細(xì)菌PUFA PKS系統(tǒng)的經(jīng)遺傳修飾的生物體,且涉及制備和使用本 文公開的非細(xì)菌PUFA PKS系統(tǒng)的方法。本發(fā)明還涉及經(jīng)遺傳修飾的微生 物和通過操作PUFA聚酮化合物合酶(PKS)系統(tǒng)有效產(chǎn)生各種多不飽和脂肪 酸,具體是二十碳五烯酸(C20 : 5, co-3; EPA)富集型的脂質(zhì)(三?;视?TAG) 以及膜結(jié)合磷酯(PL))的方法。
背景技術(shù):
聚酮化合物合酶(PKS)系統(tǒng)是本領(lǐng)域普遍已知的脂肪酸合酶(FAS)系統(tǒng) 衍生的酶復(fù)合物,但它通常被高度修飾以產(chǎn)生通常與脂肪酸相似性很小的 特異性產(chǎn)物。然而已證明聚酮化合物合酶系統(tǒng)存在于海洋細(xì)菌和某些能從 丙二酸單酰輔酶A合成PUFA的微藻中。US 6,140,486詳細(xì)描述了希瓦氏菌屬 (Shewanella)和另 一種海洋細(xì)菌海產(chǎn)弧菌(Vibrio marinus)中PUFA合成的PKS途 徑。US6,566,583詳細(xì)描述了真核Thraustochytrid , Schizochytrium中PUFA合 成的PKS途徑。最后,2002年12月19日公開的US申請專利20020194641(對應(yīng) 于2002年4月16日提交的US專利申請10/124,800)中詳細(xì)描述了如 Thraustochytriales成員的真核生物中PUFA合成的PKS途徑,包括對 Schizochytrium中PUFA PKS途徑的完全結(jié)構(gòu)描述和對石皮嚢壺菌屬 (Thraustochytrium)中PUFA PKS途徑的鑒別,其中包括關(guān)于這些途徑的用途 的細(xì)節(jié)。
研究人員嘗試了開發(fā)在文獻中描述過的聚酮化合物合酶(PKS)系統(tǒng),它
們屬于一般稱為n型,i型和模塊的三種基本類型之一。n型系統(tǒng)的特征是 可分離的蛋白質(zhì),各蛋白質(zhì)執(zhí)行不同的酶促反應(yīng)。酶協(xié)調(diào)作用以產(chǎn)生最終 產(chǎn)物,且該系統(tǒng)中的每個酶在最終產(chǎn)物的生產(chǎn)中一般參與數(shù)次。這類系統(tǒng)
以類似于在植物和細(xì)菌中發(fā)現(xiàn)的脂肪酸合酶(FAS)系統(tǒng)的方式來進行。I型
PKS系統(tǒng)與n型系統(tǒng)的相似之處在于酶以反復(fù)的方式用于生產(chǎn)最終產(chǎn)物。i 型與n型的區(qū)別在于酶活性發(fā)生在更大蛋白質(zhì)的結(jié)構(gòu)域中,而不是與可分
離的蛋白質(zhì)相關(guān)。該系統(tǒng)類似于在動物和真菌中發(fā)現(xiàn)的I型FAS系統(tǒng)。
與I型和II型系統(tǒng)相反,在模塊PKS系統(tǒng)中,各酶結(jié)構(gòu)域在最終產(chǎn)物
的生產(chǎn)中只使用 一次。該結(jié)構(gòu)域在極大型蛋白質(zhì)中發(fā)現(xiàn)且各反應(yīng)的產(chǎn)物傳
遞到PKS蛋白質(zhì)的另一結(jié)構(gòu)域。另外,在上述所有PKS系統(tǒng)中,如果在最 終產(chǎn)物中引入碳-碳雙鍵,其總為反式抅型。
在上述i型和n型pks系統(tǒng)中,每次循環(huán)進行同一組反應(yīng)直到獲得最
終產(chǎn)物。在生物合成過程中不允許導(dǎo)入特有反應(yīng)。模塊PKS系統(tǒng)需要不能
利用節(jié)能型反復(fù)反應(yīng)的巨大蛋白質(zhì)(即,每次反應(yīng)需要不同的結(jié)構(gòu)域)。另夕卜,
如上所述,在所有以前所述PKS系統(tǒng)中以反式構(gòu)型導(dǎo)入碳-碳雙鍵。
多不飽和脂肪酸(PUFA)是大多數(shù)真核生物中膜脂類的關(guān)鍵成份 (Lauritzen et al., Prog. Lipid Res. 40 1(2001); McConn et al., Plant J. 15, 521(1998》且是某些激素和信號分子的前體(Heller et al., Drugs 55, 487 (1998); Credi碰et al., An皿.Rev. Plant Physiol. Plant Mol Biol. 48,355 (1997))。 PUFA合成的已知途徑包括通過延長和需氧去々包和反應(yīng)加工脂肪酸 合酶(FAS)衍生的飽和16:0或18:0脂肪酸(縮寫X:Y表示含有X個碳原子和 Y個雙鍵(在PUFA中通常是順式)的?;鶊F;PUFA的雙鍵位置相對于具 有雙鍵的系統(tǒng)性亞曱基間斷的脂肪酸鏈的曱基碳( 3或ca6)進行標(biāo) 識)(Sprecher, Curr. Opin. Clin. Nutr. Metab. Care 2, 135 (1999); Parker-Bames etal., Proc.Natl. Acad. Sci. USA97, 8284(2000); Shanklin et al,, Annu. Rev. PlantPhysiol. Plant Nol. Biol. 49,611(1998))。從乙酰-CoA開始,合成二十二 碳六烯酸(DHA)需要約30種不同的酶活性和幾乎70個反應(yīng),包括脂肪酸合 成循環(huán)的4個重復(fù)步驟。聚酮化合物合酶(PKSs)完成一些與FAS相同的反 應(yīng)(Hopwood et al., Annu. Rev. Genet. 24, 37(1990); Bentley et al., Annu. Rev. Microbiol. 53,411(1999)),使用相同的小蛋白(或結(jié)構(gòu)i或),?;d體蛋白 (ACP),作為生長碳鏈的共價連接位點。然而,在這些酶系統(tǒng)中,通常省去 了 FAS中所見的還原、脫水和還原的整個循環(huán),從而產(chǎn)生高度衍生化的碳 鏈, 一般含有許多酮基和羥基以及反式構(gòu)型的碳-碳雙鍵。PKS的線型產(chǎn)物 通常環(huán)化以形成復(fù)雜的生化試劑,包括抗生素和許多其它次級產(chǎn)物
(Hopwood et al., (1990)出處同上;Bentley et al.、 (1999),出處同上;Keating etal., Crnr. Opin. Chem. Biol. 3, 598(1999))。
已經(jīng)報導(dǎo)了來自包括希瓦氏菌屬的 一些海洋細(xì)菌菌種的極長鏈PUFA , 如二十二碳六烯酸(DHA; 22: 6co3)和二十碳五烯酸(EPA; 20: 5co3)(Nichols et al., Curr. Op. Biotechnol. 10, 240(1999); Yazawa, Lipids 31, S(1996); DeLong et al., Appl. Environ. Microbiol. 51, 730(1986))。分析希瓦氏菌屬菌抹 SCRC2738的基因組片段(克隆為質(zhì)粒pEPA)的結(jié)果是鑒定了 5個開放閱讀 框(Orfs),總計20 Kb,它們是大腸桿菌中生產(chǎn)EPA的必要和充分條件 (Yazawa, (1996)出處同上)。 一些預(yù)測的蛋白結(jié)構(gòu)域是FAS酶的同源物,而 其它區(qū)域與已知功能的蛋白質(zhì)無同源性。5個Orf中至少11個區(qū)域可鑒定 為推定的酶結(jié)構(gòu)域(參見Metzetal., Science 293: 290-293(2001))。與基因數(shù) 據(jù)庫中的序列比較時,其中7個與PKS蛋白的相關(guān)性比與FAS蛋白的相關(guān) 性更強。公知該組中包含的結(jié)構(gòu)域編碼丙二酰-CoA: ACP?;D(zhuǎn)移酶 (MAT), p-酮脂酰(ketoacyl)-ACP合酶(KS), P-酮脂酰-ACP還原酶(KR),酰 基轉(zhuǎn)移酶(AT),磷酸泛酰巰基乙胺轉(zhuǎn)移酶,鏈長(或鏈起始)因子(CLF)和非 常罕見的6個ACP結(jié)構(gòu)域簇(即,以前未見才艮導(dǎo)PKS或FAS序列中存在兩 個以上簇集的ACP結(jié)構(gòu)域)。希瓦氏菌屬中鑒定的PUFA合成的PKS途徑 在海洋纟田菌中是普遍的。在Photobacterium profimdum(Allen et al., Appli. Environ. Microbiol. 65: 1710(1999))和Moritella marina(海產(chǎn)弧菌)(Tanaka et al., Biotechnol. Lett. 21: 939(1999))中已經(jīng)鑒定了與希瓦氏菌屬基因蔟高度 同源的基因(參見US 6,140,486,出處同上和Tanaka et al., Biotechnol. Lett. 21: 939(1999))。
認(rèn)為多不飽和脂肪酸(PUFA)可用于營養(yǎng),制藥,工業(yè),和其它目的。 來自天然來源和化學(xué)合成的PUFA的昂責(zé)供應(yīng)不足以滿足商業(yè)需要。目前 PUFA的主要來源是來自海魚;然而,魚類儲備在下降,因此可能不是持久 的資源。此外,污染、重金屬和毒性有機分子是從海魚獲得的油的嚴(yán)重問
然而,經(jīng)濟作物油類中發(fā)現(xiàn)的PUFA—般僅限為亞油酸(在59和512位具有 2個雙鍵的十八碳-18:2 59,12)和亞麻酸(18: 3 59,12,15)。在PUFA合成的 常規(guī)途徑中,通過一系列延長和去飽和反應(yīng)修飾中等鏈長度的飽和脂肪酸 (脂肪酸合酶(FAS)系統(tǒng)的產(chǎn)物)。因為脂肪酸合成需要一些分離的去飽和酶
和延長酶以便從亞油酸和亞麻酸產(chǎn)生更飽和的且鏈更長的PUFA,改造植物 宿主細(xì)胞以表達PUFA如EPA和二十二碳六烯酸(DHA)需要表達一些分離 的酶以實現(xiàn)合成。另外,為了生產(chǎn)有用量的這種PUFA,可能需要進行其它 改造,例如,改造使得竟?fàn)幍孜锏拿傅南抡{(diào),通過諸如誘變或者將酶靶向 到質(zhì)體細(xì)胞器而改造成具有更高的酶活性。因此有利的是從天然產(chǎn)生這些 脂肪酸的物種獲得參與PUFA生物合成的遺傳材料,并在異源系統(tǒng)中單獨 或共同表達分離的物質(zhì),該異源系統(tǒng)可被搡作以生產(chǎn)商品量的PUFA。
在如希瓦氏菌屬和海產(chǎn)弧菌等的海洋細(xì)菌中發(fā)現(xiàn)的PUFA PKS系統(tǒng)(參 見US 6,140,486,出處同上)為商品化PUFA生產(chǎn)的新方法提供了資源。然 而,這些海洋細(xì)菌具有最終限制其在商業(yè)水平上應(yīng)用的局限。首先,盡管 US 6,140,486公開了這些海洋細(xì)菌PUFAPKS系統(tǒng)可用于對植物進行遺傳修 飾,但是海洋細(xì)菌在寒冷的海洋環(huán)境中自然生活和生長,且這些細(xì)菌的酶 系統(tǒng)在22。C以上不能很好地發(fā)揮功能。相反,許多農(nóng)作物植物作為使用 PUFA PKS系統(tǒng)進行遺傳改造的有吸引力靶標(biāo),其正常生長條件是22。C以 上至高于40。C。因此,預(yù)期這些海洋細(xì)菌PUFA PKS系統(tǒng)不容易適應(yīng)正常 生長條件下的植物表達。另外,已知的海洋細(xì)菌PUFA PKS系統(tǒng)不能直接 產(chǎn)生甘油三酯(TAG),而直接產(chǎn)生TAG是所期望的,因為TAG是脂類儲存 產(chǎn)物并因此可在細(xì)胞中以極高水平積累,與一般僅以低水平積累的"結(jié)構(gòu)" 脂類產(chǎn)物(例如磷脂)相反。
具體關(guān)于生產(chǎn)二十碳五烯酸(EPA),研究人員試圖通過在光合和異養(yǎng)培 養(yǎng)中使微生物生長而利用所述微生物生產(chǎn)EPA。他們還使用了經(jīng)典的和定向 遺傳方法試圖提高生物體在培養(yǎng)條件下的生產(chǎn)力。其他研究人員試圖通過 引入編碼各種去飽和酶和延長酶的基因在油籽農(nóng)作物中生產(chǎn)EPA。
研究人員試圖使用紅色微藻(Monodus)、硅藻(例如Phaeodactylum)、其 他微藻和真菌(例如低溫培養(yǎng)的被孢霉屬(Mortierella))的培養(yǎng)物。然而在所有 情況下,與其他長鏈PUFA諸如DHA等的現(xiàn)存商品化微生物生產(chǎn)系統(tǒng)相比 較,生產(chǎn)率很低。在多數(shù)情況下,EPA主要存在于磷脂(PL)中而不是三?;?甘油(TAG)中。因為異養(yǎng)生長條件下微藻的生產(chǎn)率比光營養(yǎng)條件下的生產(chǎn)率 高的多,研究人員嘗試并實現(xiàn)了通過引入編碼特定糖運載體的基因來進行 營養(yǎng)轉(zhuǎn)化。然而,即使具有新獲得的異養(yǎng)能力,油的生產(chǎn)率仍然相對較低。
僅產(chǎn)生其油中PUFA水平非常低的植物。如上面討論的, 一些海洋細(xì)菌生產(chǎn) PUFA(EPA和DHA)。然而,這些細(xì)菌不產(chǎn)生TAG,并且EPA主要存在于PL 膜中。產(chǎn)生的EPA水平以及這些特定海洋細(xì)菌(上面討論的)的生長特性限制 了它們商業(yè)性生產(chǎn)EPA的應(yīng)用。
因此,本領(lǐng)域需要具有更大靈活性的其它PUFA PKS系統(tǒng)用于商業(yè)用 途,以及在商品化生產(chǎn)過程中有效生產(chǎn)大量所需的PUFA諸如EPA等富集 型脂質(zhì)(PL和TAG)的生物系統(tǒng)。
發(fā)明概述
本發(fā)明的一個實施方案涉及分離的核酸分子。所述核酸分子包含選自 如下序列組成的組的核酸序列(a)核酸序列,其編碼選自SEQIDNO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60 , SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68及其生物學(xué)活性片段組成的組的氨基酸序列;(b)核酸序列,其編碼 與選自SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 56和SEQ ID NO: 58組成的組的氨基酸序列至少約60%相同, 更優(yōu)選至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同 的氨基酸序列,其中該氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物 合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;(c)編碼與SEQ ID NO: 54 至少約65%相同,更優(yōu)選至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu) 選至少約卯%相同的氨基酸序列的核酸序列,其中該氨基酸序列具有多不 飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一 個結(jié)構(gòu)域的生物學(xué) 活性;(d)編碼與選自SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 60, SEQ ID NO: 62和SEQ ID NO: 64組成的組的氨基酸序列至少約70 %相同,更優(yōu) 選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列的核酸序列,其 中該氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的 至少一個結(jié)構(gòu)域的生物學(xué)活性;(e)編碼與選自SEQ ID NO: 41, SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸序列至少約80 %相同,更優(yōu)選至少約 90 %相同的氨基酸序列的核酸序列,其中該氨基酸序列具有多不飽和脂肪 酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性;和/
或(f)與(:a), (b), (c), (d)或(e)的核酸序列完全互補的核酸序列。 一方面,所 述核酸序列編碼選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQIDNO: 58, SEQ ID NO: 60, SEQIDNO: 62, SEQ ID NO: 64, SEQIDNO: 66, SEQIDNO: 68及其生物學(xué)活性片段組成的組的氨 基酸序列。另一方面,所述核酸序列選自SEQIDNO: 38, SEQIDNO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQIDNO: 61, SEQIDNO: 63, SEQ ID NO: 65和SEQ ID NO: 67組成的 組。
本發(fā)明的另一實施方案涉及重組核酸分子,其含有與至少一個轉(zhuǎn)錄調(diào) 控序列可操作連接的上述任意核酸分子。
本發(fā)明的另一實施方案涉及用上述任意重組核酸分子轉(zhuǎn)染的重組細(xì)胞。
本發(fā)明的另 一 實施方案涉及經(jīng)遺傳修飾的微生物,其中該微生物表達 含有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一 個生物學(xué) 活性結(jié)構(gòu)域的PKS系統(tǒng),其中PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域包含選自 如下序列組成的組的氨基酸序列(a)氨基酸序列,其選自SEQIDNO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQIDNO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQIDNO: 58, SEQ ID NO: 60 , SEQ ID NO: 62 , SEQ ID NO: 64 , SEQ ID NO: 66, SEQ ID NO: 68及其生物學(xué)活性片段組成的組;(b)與選自SEQ ID NO: 39, SEQ ID NO: 43, SEQIDNO: 50, SEQIDNO: 52, SEQ ID NO: 56和SEQ ID NO: 58 組成的組的氨基酸序列至少約60%相同,更優(yōu)選至少約70%相同,更優(yōu)選 至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中該氨基酸序 列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu) 域的生物學(xué)活性;(c)與SEQ ID NO: 54至少約65 %相同,更優(yōu)選至少約70 %相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列, 其中該氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng) 的至少一個結(jié)構(gòu)域的生物學(xué)活性;(d)與選自SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 60, SEQ ID NO: 62和SEQ ID NO: 64組成的組的氨基酸序
列至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨 基酸序列,其中該氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶 (PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;和/或(e)與選自SEQ ID NO: 41 , SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸序列至少約80 %相同, 更優(yōu)選至少約90%相同的氨基酸序列,其中該氨基酸序列具有多不飽和脂 肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性。微 生物遺傳修飾成影響PKS系統(tǒng)的活性。
一方面,所述微生物用重組核酸分子轉(zhuǎn)染得以遺傳修飾,其中所述重 組核酸分子編碼多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個結(jié)構(gòu);或。例如孩i生物可包4舌Thraustochytrid, i者如Schizochytrium等。 一方面,該微生物進一步被遺傳修飾成重組表達編碼至少一段核酸分子, 其編碼選自細(xì)菌PUFA PKS系統(tǒng),I型PKS系統(tǒng),II型PKS系統(tǒng),模塊PKS 系統(tǒng)和非細(xì)菌PUFA PKS系統(tǒng)組成的組的PKS系統(tǒng)的至少一個生物學(xué)活性 結(jié)構(gòu)域。非細(xì)菌PUFA PKS系統(tǒng)可包括Thraustochytrid的PUFA PKS系統(tǒng), 并且一方面可包括Schizochytrium的PUFA PKS系統(tǒng)。
另 一方面,微生物內(nèi)源性表達含有PUFA PKS系統(tǒng)至少 一個結(jié)構(gòu)域的 PKS系統(tǒng),且其中遺傳修飾存在于編碼PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域 的核酸序列中。另一方面,該微生物進一步被遺傳修飾成重組表達至少一 種下述核酸分子,所述核酸分子編碼選自細(xì)菌PUFAPKS系統(tǒng),I型PKS系 統(tǒng),II型PKS系統(tǒng),模塊PKS系統(tǒng)和非細(xì)菌PUFA PKS系統(tǒng)(例如 Thraustochytrid的PUFA PKS系統(tǒng),如Schizochytrium的PUFA PKS系統(tǒng)) 組成的組的PKS系統(tǒng)的至少一個生物學(xué)活性結(jié)構(gòu)域。
另 一方面,所述微生物內(nèi)源性表達含有PUFA PKS系統(tǒng)的至少 一個生物 學(xué)活性結(jié)構(gòu)域的PUFA PKS系統(tǒng),且其中該遺傳^畛飾包含表達選自如下核 酸分子組成的組的重組核酸分子編碼來自第二種PKS系統(tǒng)的至少一個生 物學(xué)活性結(jié)構(gòu)域的重組核酸分子以及編碼影響內(nèi)源性PUFA PKS系統(tǒng)活性 的蛋白質(zhì)的重組核酸分子。來自第二種PKS系統(tǒng)的生物學(xué)活性結(jié)構(gòu)域包括, 但不限于(a)來自Thraustochytrid微生物的多不飽和脂肪酸(PUFA)聚酮化 合物合酶(PKS)系統(tǒng)的結(jié)構(gòu)域;(b)來自用下述方法鑒別的^t生物的PUFA PKS系統(tǒng)的結(jié)構(gòu)域(i)選擇產(chǎn)生至少一種PUFA的微生物;和(ii)從(i)中鑒 別與發(fā)酵培養(yǎng)基、大于約5%飽和度的溶氧條件下該微生物產(chǎn)生的PUFA相
比,在發(fā)酵培養(yǎng)基中、小于約5%飽和度的溶氧條件下能夠產(chǎn)生增加的PUFA 的微生物:(c)結(jié)構(gòu)域,其包含選自SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32及其生物學(xué)活性片段組成的組的氨基酸序 列;和(d)包含與(c)的氨基酸序列至少約60%相同,更優(yōu)選至少約70%相同, 更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列的結(jié)構(gòu)域, 其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系 統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。 一方面,重組核酸分子編碼磷酸泛酰 巰基乙胺轉(zhuǎn)移酶。 一方面,第二種PKS系統(tǒng)選自細(xì)菌PUFA PKS系統(tǒng),I 型PKS系統(tǒng),II型PKS系統(tǒng),模塊PKS系統(tǒng)和非細(xì)菌PUFA PKS系統(tǒng)(例 如真核PUFAPKS系統(tǒng),如Thraustochytrid的PUFAPKS系統(tǒng),包括4旦不限 于Schizochytrium的PUFAPKS系統(tǒng))組成的組。
本發(fā)明的另 一 實施方案涉及經(jīng)遺傳修飾的植物,其中該植物被遺傳修 飾成重組表達含有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至 少一個生物學(xué)活性結(jié)構(gòu)域的PKS系統(tǒng),其中該結(jié)構(gòu)域包含選自下述序列組 成的組的氨基酸序列(a)氨基酸序列,其選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68及其生物 學(xué)活性片段組成的組;(b)與選自SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 56和SEQ ID NO: 58組成的組的氨基 酸序列至少約60 %相同,更優(yōu)選至少約70 %相同,更優(yōu)選至少約80 %相同, 更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨基酸序列具有多不飽和 脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性; (c)與SEQIDNO: 54至少約65%相同,更優(yōu)選至少約70%相同,更優(yōu)選至 少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨基酸序 列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu) 域的生物學(xué)活性;(d)與選自SEQIDNO: 45, SEQ ID NO: 48, SEQ ID NO: 60, SEQ ID NO: 62和SEQ ID NO: 64組成的組的氨基酸序列至少約70 %相同, 更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述
氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性;和/或(e:)與選自SEQ ID NO: 41, SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸序列至少約80 %相同,更優(yōu)選至少約90 %相同的氨基酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚 酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。 一方面,PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域包含選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43 , SEQ ID NO: 45 , SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68及其生物學(xué)活性 片段組成的組的氨基酸序列。 一方面,所述植物進一步被遺傳修飾成重組 表達編碼至少一種核酸分子,所述核酸分子來自選自細(xì)菌PUFAPKS系統(tǒng), I型PKS系統(tǒng),II型PKS系統(tǒng),模塊PKS系統(tǒng)和非細(xì)菌PUFA PKS系統(tǒng)(例 如Thraustochytrid的PUFAPKS系統(tǒng),如Schizochytrium的PUFAPKS系統(tǒng)) 組成的組的PKS系統(tǒng)的至少一個生物學(xué)活性結(jié)構(gòu)域。
本發(fā)明另一實施方案涉及生產(chǎn)由聚酮化合物合酶系統(tǒng)產(chǎn)生的生物活性 分子的方法,包括在有效生產(chǎn)生物活性分子的條件下培養(yǎng)經(jīng)遺傳修飾的生 物體,該生物體表達含有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng) 的至少 一 個生物活性結(jié)構(gòu)域的PKS系統(tǒng),其中PUFA PKS系統(tǒng)的至少 一 個 結(jié)構(gòu)域包含選自下述序列組成的組的氨基酸序列(a)氨基酸序列,其選自 SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68及其生物學(xué)活性片段組成的組;(b)與選自SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 56 和SEQ ID NO: 58組成的組的氨基酸序列至少約60 %相同,更優(yōu)選至少約 70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列, 其中氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的 至少一個結(jié)構(gòu)域的生物學(xué)活性;(c)與SEQ ID NO: 54至少約65%相同,更 優(yōu)選至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的 氨基酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物 合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;(d)與選自SEQ ID NO: 45,
SEQ ID NO: 48, SEQ ID NO: 60, SEQ ID NO: 62和SEQ ID NO: 64組成的 組的氨基酸序列至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約 90 %相同的氨基酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA) 聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;和/或(e)與選自 SEQ ID NO: 41, SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸序列至 少約80。/。相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨基酸序 列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個結(jié)構(gòu) 域的生物學(xué)活性。
一方面,所述生物體內(nèi)源性表達含有PUFAPKS系統(tǒng)的至少一個結(jié)構(gòu)域 的PKS系統(tǒng),并且其中遺傳》f飾在編碼PUFA PKS系統(tǒng)的至少 一個結(jié)構(gòu)域 的核酸序列中。 一方面,與PUFA PKS系統(tǒng)未經(jīng)遺傳修飾的生物體相比較, 所述遺傳修飾改變內(nèi)源性PKS系統(tǒng)產(chǎn)生的至少 一種產(chǎn)物。
另 一方面,所述生物體內(nèi)源性表達含有PUFA PKS系統(tǒng)的至少 一個生物 活性結(jié)構(gòu)域的PKS系統(tǒng),并且所述遺傳修飾包括用選自下組的重組核酸分 子轉(zhuǎn)染該生物體編碼來自第二種PKS系統(tǒng)的至少一個生物學(xué)活性結(jié)構(gòu)域 的重組核酸分子以及編碼影響PUFA PKS系統(tǒng)活性的蛋白質(zhì)的重組核酸分 子。 一方面,與未經(jīng)遺傳修飾從而影響PUFA產(chǎn)生的生物體相比較,所述 遺傳修飾改變內(nèi)源性PKS系統(tǒng)產(chǎn)生的至少 一種產(chǎn)物。
另一方面,所述生物體用編碼多不飽和脂肪酸(PUFA)聚酮化合物合酶 (PKS)系統(tǒng)的至少 一 個結(jié)構(gòu)域的重組核酸分子轉(zhuǎn)染得以遺傳修飾。
另一方面,所述生物體產(chǎn)生的多不飽和脂肪酸(PUFA)圖譜不同于未經(jīng) 遺傳修飾的天然生物體。
另一方面,所述生物體內(nèi)源性表達非細(xì)菌PUFAPKS系統(tǒng),且其中所述 遺傳修飾包括用來自不同PKS系統(tǒng)的結(jié)構(gòu)域取代編碼非細(xì)菌PUFA PKS系 統(tǒng)的至少 一 個結(jié)構(gòu)域的核酸序列。
另 一方面,生物體內(nèi)源性表達通過用重組核酸分子轉(zhuǎn)染生物體從而被 修飾的非細(xì)菌PUFA PKS系統(tǒng),該重組核酸分子編碼調(diào)節(jié)PUFA PKS系統(tǒng)產(chǎn) 生的脂肪酸鏈長的蛋白質(zhì)。
另一方面,生物活性分子選自抗炎癥配制品,化療劑,活性賦形劑, 骨質(zhì)疏松癥藥物,抗抑郁劑,抗驚厥劑,抗幽門螺桿菌(Heliobactorpylori) 藥物,治療神經(jīng)變性疾病的藥物,治療肝臟變性疾病的藥物,抗生素,和/
或降膽固醇配制品。
一方面,所述生物活性分子是抗生素。另一方面,所
述生物活性分子是多不飽和脂肪酸(PUFA)。另一方面,所述生物活性分子 是包含順式構(gòu)型的碳-碳雙鍵的分子。 一方面,所述生物活性分子是在每個 第三個碳包含雙鍵的分子。 一方面,所述生物體是微生物。另一方面,所 述生物體是植物。
本發(fā)明的另一實施方案涉及產(chǎn)生具有多不不同于天然^:物的飽和脂肪
酸(PUFA)圖譜的植物的方法,包括遺傳修飾植物細(xì)胞以表達含有至少 一種 重組核酸分子的PKS系統(tǒng),該重組核酸分子含有編碼PUFA PKS系統(tǒng)至少 一個生物活性結(jié)構(gòu)域的核酸序列,其中PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域 包含選自下述序列組成的組的氨基酸序列(a)氨基酸序列,其選自SEQID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ IDNO: 68及其生物學(xué)活性片段組成的組;(b)與選自SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 56和SEQ ID NO: 58組成的組的氨基酸序列至少約60%相同,更優(yōu)選至少約70%相同, 更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述 氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性;(c)與SEQ ID NO: 54至少約65 %相同,更優(yōu)選 至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基 酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶 (PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;(d)與選自SEQ ID NO: 45, SEQ IDNO: 48, SEQ ID NO: 60, SEQ ID NO: 62和SEQ ID NO: 64組成的組的 氨基酸序列至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90 %相同的氨基酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚 酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;和/或(e)與選自 SEQ ID NO: 41, SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸序列至 少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨基酸序 列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一 個結(jié)構(gòu) 域的生物學(xué)活性。
本發(fā)明另一實施方案涉及修飾含有至少一種脂肪酸的終產(chǎn)物的方法,
包4舌向終產(chǎn)物中加入重組宿主細(xì)胞產(chǎn)生的油,所述重組細(xì)月包表達至少 一 種
重組核酸分子該重組核酸分子含有編碼PUFA PKS系統(tǒng)的至少一個生物活 性結(jié)構(gòu)域的核酸序列,其中PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域包含選自下 述序列組成的組的氨基酸序列(a)氨基酸序列,其選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68 及其生物學(xué)活性片段組成的組;(b)與選自SEQIDNO:39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 56和SEQ ID NO: 58組成的 組的氨基酸序列至少約60%相同,更優(yōu)選至少約70%相同,更優(yōu)選至少約 80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨基酸序列具 有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一 個結(jié)構(gòu)域的 生物學(xué)活性;(c)與SEQ ID NO: 54至少約65 %相同,更優(yōu)選至少約70 %相 同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中 所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的 至少一個結(jié)構(gòu)域的生物學(xué)活性;(d)與選自SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 60, SEQ ID NO: 62和SEQ ID NO: 64組成的組的氨基酸序列至 少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約卯%相同的氨基酸 序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶 (PKS)系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性;和/或(e)與選自SEQ ID NO: 41, SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸序列至少約80%相同, 更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨基酸序列具有多不飽和 脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。 一方面,所述終產(chǎn)物選自食品添加劑,食品,藥物配制品,人源化動物 乳汁,和嬰兒代乳品。 一方面,所述藥物配制品選自抗炎癥配制品,化療 劑,活性賦形劑,骨質(zhì)疏松癥藥物,抗抑郁劑,抗驚厥劑,抗幽門螺桿菌 藥物,治療神經(jīng)變性疾病的藥物,治療肝臟變性疾病的藥物,抗生素,和 降膽固醇配制品組成的組。 一方面,所述終產(chǎn)物用于治療選自以下疾病組 成的組的疾病i曼性炎癥,急性炎癥,胃腸疾病,癌癥,惡病質(zhì),心臟再 狹窄,神經(jīng)變性疾病,肝臟變性疾病,血脂疾病,骨質(zhì)疏松癥,骨關(guān)節(jié)炎, 自身免疫疾病,先兆子癇,早產(chǎn),年老性黃斑病變,肺病,和過氧化物酶
體疾病。
本發(fā)明另 一 實施方案涉及生產(chǎn)人源化動物乳汁的方法,包括用至少一 個重組核酸分子遺傳修飾產(chǎn)奶動物的產(chǎn)奶細(xì)胞所述重組核酸分子含有編碼
PUFA PKS系統(tǒng)的至少一個生物活性結(jié)構(gòu)域的核酸序列,其中PUFA PKS系 統(tǒng)的至少一個結(jié)構(gòu)域包含選自下述序列組成的組的氨基酸序列(a)氨基酸 序列,其選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68及其生物學(xué)活性片段組成的組;(b)與選自 SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 56和SEQ ID NO: 58組成的組的氨基酸序列至少約60 %相同,更優(yōu)選 至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基 酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶 (PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;(c)與SEQ ID NO: 54至少約65 %相同,更優(yōu)選至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約 90 %相同的氨基酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA) 聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;(d)與選自SEQ ID NO: 45, SEQ ID NO: 48 , SEQ ID NO: 60 , SEQ ID NO: 62和SEQ ID NO: 64組成的組的氨基酸序列至少約70%相同,更優(yōu)選至少約80%相同,更優(yōu) 選至少約卯%相同的氨基酸序列,其中所述氨基酸序列具有多不飽和脂肪 酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性;和(e) 與選自SEQ ID NO: 41, SEQ ID NO: 66, SEQ ID NO: 68組成的組的氨基酸 序列至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列,其中所述氨 基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一 個結(jié)構(gòu)域的生物學(xué)活性。
本發(fā)明另一實施方案涉及經(jīng)遺傳修飾的Thraustochytrid微生物,其中所 述微生物具有內(nèi)源性多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng),并 且與未經(jīng)遺傳修飾的Thraustochytrid孩i生物相比較,其中的內(nèi)源性PUFA PKS系統(tǒng)被遺傳修飾成改變Thraustochytrid微生物的多不飽和脂肪酸(PUFA) 的表達圖譜。
一方面,所述內(nèi)源性PUFA PKS系統(tǒng)通過誘變編碼內(nèi)源性PUFA PKS系統(tǒng)
至少一個結(jié)構(gòu)域的核酸序列得以修飾。 一方面,所述修飾通過靶向的誘變 產(chǎn)生。另一方面,所述修飾通過常規(guī)誘變和篩選產(chǎn)生。
另一方面,如下修飾所述內(nèi)源性PUFA PKS系統(tǒng)缺失編碼內(nèi)源性PUFA PKS系統(tǒng)至少一個結(jié)構(gòu)域的至少一段核酸序列,并因此插入編碼內(nèi)源性結(jié)構(gòu) 域同系物的核酸序列以改變Thraustochytrid微生物的PUFA產(chǎn)生圖譜,其中所 述同系物具有PKS系統(tǒng)至少一個結(jié)構(gòu)域的生物學(xué)活性。 一方面,與內(nèi)源性結(jié) 構(gòu)域相比較,該內(nèi)源性結(jié)構(gòu)域的同系物包含修飾,所述修飾選自引起微生 物PUFA生產(chǎn)圖諳改變的至少一種缺失、插入或取代組成的組。另一方面, 所述同系物的氨基酸序列與內(nèi)源性結(jié)構(gòu)域的氨基酸序列至少約60%相同,更 優(yōu)選約70%相同,更優(yōu)選約80%相同,更優(yōu)選約90%相同。 一方面,所述內(nèi) 源性結(jié)構(gòu)域的同系物是來自另 一種Thraustochytrid微生物PUFA PKS系統(tǒng)的 結(jié)構(gòu)域。
另 一 方面,如下修飾內(nèi)源性PUFA PKS系統(tǒng)缺失編碼內(nèi)源性PUFA PKS 系統(tǒng)至少 一個結(jié)構(gòu)域的至少 一段核酸序列,并因此插入編碼來自不同微生 物的PKS系統(tǒng)的至少一個結(jié)構(gòu)域的核酸序列。 一方面,編碼來自不同^i:生物 的PKS系統(tǒng)的至少 一個結(jié)構(gòu)域的核酸序列是來自細(xì)菌PUFA PKS系統(tǒng)。例如, 不同微生物可以是具有在約25。C或更高溫度天然產(chǎn)生PUFA的PUFA PKS系 統(tǒng)的海洋細(xì)菌。一方面,所述海洋纟田菌選自Shewanella olleyana和Shewanella japonica組成的組。一方面,來自不同微生物的PKS系統(tǒng)結(jié)構(gòu)域是選自I型PKS 系統(tǒng),II型PKS系統(tǒng),模塊PKS系統(tǒng)和來自不同Thraustochytrid微生物的PUFA PKS系統(tǒng)組成的組的PKS系統(tǒng)。
在上述任意方面,內(nèi)源性PUFAPKS系統(tǒng)的結(jié)構(gòu)域可以包括,但不局限 于,具有下述蛋白中至少一種蛋白的生物學(xué)活性的結(jié)構(gòu)域丙二酰-CoA: ACP?;D(zhuǎn)移酶(MAT), (3-酮脂酰-ACP合酶(KS),酮還原酶(KR),?;D(zhuǎn)移 酶(AT), FabA-樣(3-羥酰-ACP脫水酶(DH),磷酸泛酰巰基乙胺轉(zhuǎn)移酶,鏈長 因子(CLF),?;d體蛋白(ACP),烯酰ACP-還原酶(ER),催化反式-2-?;?-ACP合成的酶,催化反式-2-?;?ACP向順式-3-酰基-ACP的可逆異構(gòu)化的 酶,和催化順式-3-?;?ACP延長成順式-5-p-酮脂酰-ACP的酶。在上述任意 方面,內(nèi)源性PUFAPKS系統(tǒng)的結(jié)構(gòu)域可包括選自下述序列組成的組的氨基 酸序列(a)氨基酸序列,其選自SEQIDNO: 2, SEQIDNO:4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID
NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68及其生物學(xué)活性 片段組成的組;和(b)與(a)的氨基酸序列至少約60。/。相同,更優(yōu)選至少約70 %相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約90%相同的氨基酸序列, 其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系 統(tǒng)的至少 一 個結(jié)構(gòu)域的生物學(xué)活性。
一方面,改變PUFA的生產(chǎn)圖i普以引發(fā)、提高或降低微生物的二十碳五 烯酸(EPA)產(chǎn)生。另一方面,改變PUFA的生產(chǎn)圖鐠以引發(fā)、提高或降低微 生物產(chǎn)生二十二碳六烯酸(DHA)。另一方面,改變PUFA的生產(chǎn)圖譜以引發(fā)、 提高或降低微生物產(chǎn)生二十二碳五烯酸(DPA)的一種或兩種異構(gòu)體。另一方 面,改變PUFA的生產(chǎn)圖語以引發(fā)、提高或降低微生物產(chǎn)生花生四烯酸 (ARA)。 另 一方面,Thraustochytrid來自選自Schizochytrium屬,石皮嚢壺菌屬 禾口Japonochytrium屬。另 一方面,Thraustochytrid來自Schizochytrium屬。另 一方面,Thraustochytrid來自選自Schizochytrium aggregatum, Schizochytrium limacinum和Schizochytrium minutum的Schizochytrium種。另 一 方面, Thraustochytrid來自破嚢壺菌屬。
本發(fā)明還有另一實施方案涉及產(chǎn)生二十碳五烯酸(EPA)的經(jīng)遺傳修飾的 Schizochytrium,其中Schizochytrium具有內(nèi)源性多不飽和脂肪酸(PUFA)聚酮 化合物合酶(PKS)系統(tǒng),該系統(tǒng)包含在編碼內(nèi)源性PUFA PKS系統(tǒng)至少 一個結(jié) 構(gòu)域的至少一段核酸序列中的遺傳修飾,該遺傳修飾導(dǎo)致Schizochytrium產(chǎn) 生EPA 。 一方面,Schizochytrium包含在至少 一 段核酸序列中的遺傳修飾, 該核酸序列編碼至少一個具有至少下述蛋白中至少一種蛋白的生物學(xué)活性 的結(jié)構(gòu)域丙二酰-CoA: ACP?;D(zhuǎn)移酶(MAT), j3-酮脂酰-ACP合酶(KS), 酮還原酶(KR),?;D(zhuǎn)移酶(AT), FabA-樣(3-羥酰-ACP脫水酶(DH),磷酸泛 酰巰基乙胺轉(zhuǎn)移酶,鏈長因子(CLF),?;d體蛋白(ACP),烯酰ACP-還原 酶(ER),催化反式-2-?;?ACP合成的酶,催化反式-2-酰基-八0 向順式-3-?;?ACP的可逆異構(gòu)化的酶,和催化順式-3-?;?ACP延長成順式-5-(3-酮脂 酰-ACP的酶。 一方面,Schizochytrium包含在編碼至少一個下述結(jié)構(gòu)域的至
少一段核酸序列中的遺傳修飾,該結(jié)構(gòu)域來自編碼內(nèi)源性PUFA PKS系統(tǒng) SEQ ID NO: 2的開放閱讀框。 一方面,Schizochytrium包含在編碼至少一個 下述結(jié)構(gòu)域的至少一段核酸序列中的遺傳修飾,該結(jié)構(gòu)域來自編碼內(nèi)源性 PUFAPKS系統(tǒng)SEQIDNO: 4的開放閱讀框。 一方面,Schizochytrium包含在 編碼至少 一 個下述結(jié)構(gòu)域的至少 一 段核酸序列中的遺傳修飾,該結(jié)構(gòu)域來 自編碼內(nèi)源性PUFA PKS系統(tǒng)SEQ ID NO: 6的開方丈閱讀才匡。 一 方面, Schizochytrium包含在至少 一段核酸序列中的遺傳修飾,該核酸序列編碼至 少一個具有下述蛋白中至少一種的生物學(xué)活性的結(jié)構(gòu)域(3-酮脂酰-ACP合 酶(KS), FabA-樣p-羥酰-ACP脫水酶(DH),鏈長因子(CLF),催化反式-2-酰 基-ACP合成的酶,催化反式-2-酰基-ACP向順式-3-?;?ACP的可逆異構(gòu)化 的酶,和催化順式-3-?;?ACP延長成順式-5-P-酮脂酰-ACP的酶。 一方面, Schizochytrium包含在至少 一段核酸序列中的遺傳修飾,該核酸序列編碼選 自內(nèi)源性PUFA PKS系統(tǒng)SEQ ID NO: 20 , SEQ ID NO: 22 , SEQ ID NO: 28和 SEQIDNO: 30組成的組的氨基酸序列。 一方面,如下修飾Schizochytrium: 缺失編碼內(nèi)源性PUFA PKS系統(tǒng)至少 一 個結(jié)構(gòu)域的至少 一段核酸序列,并因 此插入編碼來自非Schizochytrium微生物的PKS系統(tǒng)至少 一 個結(jié)構(gòu)域的核酸 序列。 一方面,非Schizochytrium微生物在至少約15。C,更優(yōu)選至少約20。C, 更優(yōu)選至少約25。C,更優(yōu)選至少約30。C,更優(yōu)選約20'C至40'C的溫度生長 并產(chǎn)生PUFA。 一方面,編碼來自非Schizochytrium微生物的PKS系統(tǒng)至少一 個結(jié)構(gòu)域的核酸序列來自細(xì)菌PUFA PKS系統(tǒng)。 一 方面,細(xì)菌PUFA PKS系統(tǒng) 來自選自Shewanella olleyana和Shewanellajaponica組成的組的纟田菌。另 一方 面,編碼PKS系統(tǒng)至少 一 個結(jié)構(gòu)域的核酸序列選自I型PKS系統(tǒng),II型PKS系 統(tǒng),模塊PKS系統(tǒng),和非細(xì)菌PUFA PKS系統(tǒng)(例如真核PUFA PKS系統(tǒng),如 Thraustochytrid的PUFA PKS系統(tǒng))組成的組。
本發(fā)明另 一實施方案涉及經(jīng)遺傳修飾的Schizochytrium,其與非遺傳修 飾的Schizochytrium相比較,產(chǎn)生增加的量的二十二碳六烯酸(DHA),其中 Schizochytrium具有內(nèi)源性多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系 統(tǒng),該系統(tǒng)包含在編碼內(nèi)源性PUFA PKS系統(tǒng)至少 一個結(jié)構(gòu)域的核酸序列中 的遺傳修飾,其使得Schizochytrium產(chǎn)生的DHA增加。 一方面,通過取代來 自破嚢壺菌屬的PUFA PKS系統(tǒng)的至少 一 個結(jié)構(gòu)域從而修飾內(nèi)源性PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域。 一方面,與非遺傳修飾的Schizochytrium相比
較,所述Schizochytrium產(chǎn)生的DHA/DPA比值增加。
本發(fā)明另一實施方案涉及一種生產(chǎn)富集至少一種所選多不飽和脂肪酸 (PUFA)的脂質(zhì)的方法,包括在有效生產(chǎn)所述脂質(zhì)的條件下培養(yǎng)如上所述經(jīng) 遺傳修飾的Thraustochytrid微生物或如上所述經(jīng)遺傳修飾的Schizochytrium。 一方面,所選的PUFA是二十碳五烯酸(EPA)。 '
本發(fā)明還有另一實施方案涉及一種生產(chǎn)富含二十碳五烯酸(EPA)的脂質(zhì) 的方法,包括在有效生產(chǎn)富含EPA的脂質(zhì)的條件下培養(yǎng)遺傳修飾的 Thraustochytrid微生物,其中微生物具有內(nèi)源性多不飽和脂肪酸(PUFA)聚酮 化合物合酶(PKS)系統(tǒng),并且其中內(nèi)源性PUFAPKS系統(tǒng)在至少一個結(jié)構(gòu)域中 被遺傳修飾,使得與未經(jīng)修飾的微生物相比較,引發(fā)或增加了微生物生產(chǎn) 脂質(zhì)中的EPA。
附圖簡述
圖1是Schizochytrium PUFA PKS系統(tǒng)的結(jié)構(gòu)i或結(jié)構(gòu)的示意圖。 圖2顯示了來自Schizochytrium和希瓦氏菌屬的PUFA PKS系統(tǒng)的結(jié)構(gòu) 域的比較。
圖3顯示了來自Schizochytrium的PUFA PKS系統(tǒng)的結(jié)構(gòu)域與來自念珠 藻屬(Nostoc)、其產(chǎn)物是不含任何雙鍵的長鏈脂肪酸的相關(guān)PKS系統(tǒng)的比較。
發(fā)明詳述
本發(fā)明概括地涉及多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng), 涉及含有該PUFA PKS系統(tǒng)的經(jīng)遺傳修飾的生物體,涉及制備和使用該系 統(tǒng)以生產(chǎn)包括生物活性分子具體是PUFA諸如DHA、 DPA和EPA的目的產(chǎn) 物的方法。本文所用的PUFA PKS系統(tǒng)一般具有下列鑒定特征(l)它產(chǎn)生 作為該系統(tǒng)天然產(chǎn)物的PUFA;和(2)它含有組裝進復(fù)合物中的數(shù)種多功能蛋 白質(zhì),該復(fù)合物指導(dǎo)脂肪酸鏈的反復(fù)加工以及非反復(fù)加工,包括在選定循 環(huán)中的反式-順式異構(gòu)化和烯酰還原反應(yīng)(例如參見圖1)。關(guān)于PUFAPKS系 統(tǒng)的參考文獻總體上涉及在復(fù)合物中起作用從而在生物體中產(chǎn)生PUFA的 所有基因及其編碼的產(chǎn)物。因此,PUFA PKS系統(tǒng)特指其天然產(chǎn)物是PUFA 的PKS系統(tǒng)。
更具體地說,首先,構(gòu)成本發(fā)明基礎(chǔ)的PUFAPKS系統(tǒng)產(chǎn)生多不飽和脂 肪酸(pufa)作為產(chǎn)物(即,內(nèi)源性(天然)含有該PKS系統(tǒng)的生物體使用該系 統(tǒng)制備PUFA)。本文提及的PUFA優(yōu)選是多不飽和脂肪酸,其碳鏈長度為 至少16碳,更優(yōu)選至少18碳,更優(yōu)選至少20碳,更優(yōu)選22或更多個碳, 并且具有至少3個或更多個雙鍵,優(yōu)選4個或更多個,更優(yōu)選5個或更多 個,甚至更優(yōu)選6個或更多個雙鍵,其中所有雙鍵是順式構(gòu)型。本發(fā)明的 一個目的是通過遺傳操作或?qū)K產(chǎn)物的操作發(fā)現(xiàn)或創(chuàng)造這樣的pks系統(tǒng), 其產(chǎn)生具有所需鏈長和所需數(shù)目雙鍵的多不飽和脂肪酸。PUFA的例子包 括,但不限于,DHA(二十二碳六烯酸(C22: 6,o>3)), ARA(二十碳四烯酸(C20: 4,n-6)), DPA(二十二碳五烯酸(C22: 5, -6或q-3))和EPA(二十碳五烯酸(C20: 5, -3))。
其次,本文所述的PUFA PKS系統(tǒng)參與反復(fù)反應(yīng)和非反復(fù)反應(yīng),使得該 系統(tǒng)區(qū)別于以前所述的pks系統(tǒng)(例如,i型,1I型或^^莫塊型系統(tǒng))。更具體 地說,本文所述的PUFA PKS系統(tǒng)含有在每次循環(huán)中發(fā)揮功能的結(jié)構(gòu)域以 及僅在某些循環(huán)中發(fā)揮功能的結(jié)構(gòu)域。這種功能性的一個關(guān)鍵方面涉及與 細(xì)菌FabA酶同源的結(jié)構(gòu)域。例如,大腸桿菌的FabA酶具有兩種酶活性。 它具有脫水活性,可從含有羥基的碳鏈減去一個水分子(1120),在該碳鏈中 留下一個反式雙鍵。另外,它具有異構(gòu)酶活性,可將反式雙鍵轉(zhuǎn)變成順式 構(gòu)型。這種異構(gòu)化作用與雙鍵位置遷移到相鄰碳原子共同完成。在pks(和 FAS)系統(tǒng)中,主碳鏈以2個碳的增量延長。因此可預(yù)計產(chǎn)生這些PKS系統(tǒng) 的PUFA產(chǎn)物所需的延長反應(yīng)的次數(shù)。例如,產(chǎn)生DHA(C22:6,均為順式) 需要10次延長反應(yīng)。由于終產(chǎn)物中僅有6個雙鍵,這意味著在一些反應(yīng)循 環(huán)中,雙鍵被保留(作為順式異構(gòu)體),而在其它循環(huán)中,在下一步延長之前 還原雙鍵。
在發(fā)現(xiàn)海洋細(xì)菌的PUFAPKS系統(tǒng)(參見US 6,140,486)之前,還不了解 PKS系統(tǒng)具有這種反復(fù)性酶反應(yīng)和選擇性酶反應(yīng)的組合,且認(rèn)為它們不能 產(chǎn)生順式構(gòu)型的碳-碳雙鍵。然而,本發(fā)明所述PUFA PKS系統(tǒng)具有導(dǎo)入順 式雙鍵的能力和改變循環(huán)中反應(yīng)順序的能力。
本發(fā)明人提出利用PUFAPKS系統(tǒng)的這些特征來生產(chǎn)以前所述的(II型, I型和模塊型)PKS系統(tǒng)不能產(chǎn)生的各種生物活性分子。這些生物活性分子 包括,但不限于,多不飽和脂肪酸(PUFA),抗生素或其它生物活性化合物,
其中許多分子將在下文討論。例如,利用本文所述的PUFA PKS基因結(jié)構(gòu) 的知識,可使用許多方法中的任一種改變PUFA PKS基因,或者將這些基 因的部分與包括其它PKS系統(tǒng)的其它合成系統(tǒng)組合以便產(chǎn)生新產(chǎn)物。這種 特定類型的系統(tǒng)進行反復(fù)性反應(yīng)和選擇性反應(yīng)的固有能力使得該系統(tǒng)能夠 產(chǎn)生將相似方法用于其它類型的PKS系統(tǒng)所不能發(fā)現(xiàn)的產(chǎn)物。
US 6,566,583已經(jīng)詳細(xì)描述了真核Thraustochytrid, Schizochytrium中 PUFA合成的PKS系統(tǒng)的大部分結(jié)構(gòu)。本發(fā)明人提供的Schizochytrium的 cDNA和基因組克隆的完整序列使得可以鑒別每個OrfA、 Orffi和OrfC的全長 基因組序列,并且可以完全地鑒別這些Schizochytrium的Orfs中與希瓦氏屬 同源的特定結(jié)構(gòu)域(參見圖2和US 10/124,800,出處同上)。在US 10/24,800 中,發(fā)明人還鑒別了符合具有PUFAPKS系統(tǒng)這一標(biāo)準(zhǔn)的破嚢壺菌屬的種, 并隨后通過Southern印跡分析證明這個生物體很可能包含與Schizochytrium 的PUFAPKS基因同源的基因。然而,US 10/124,800中沒有描述分離和測定 這種基因結(jié)構(gòu)以及所述基因的結(jié)構(gòu)域構(gòu)成(organization)。在本發(fā)明中,發(fā)明 人克隆并測序了破嚢壺菌屬的這種Thmustochytrid(具體是Thraustochytrium sp. 23B(ATCC 20892))的同源開放閱讀框(Orfs)的全長基因組序列,并且鑒別 了該破嚢壺菌屬中包含PUFAPKS系統(tǒng)的結(jié)構(gòu)域。因此,本發(fā)明解決了上述 問題,提供了具有商業(yè)用途靈活性的其它PUFA PKS系統(tǒng)。破嚢壺菌屬的 PUFA PKS系統(tǒng)在下文詳細(xì)描述。
本發(fā)明還解決了上面提出的問題,通過本發(fā)明人研制的遺傳修飾微生 物和方法生產(chǎn)富含的所需PUFA,如EPA的有商業(yè)價值的脂質(zhì),所述方法通 過^喿縱在真核生物中(包括Thraustochytriales目的成員諸如Schizochytrium和 破嚢壺菌屬)中產(chǎn)生PUFA的聚酮合酶樣系統(tǒng),有效地生產(chǎn)富含PUFA的脂質(zhì) (三酰基甘油(TAG)以及膜結(jié)合磷脂(PL))。具體地,通過舉例的方式,本發(fā) 明人在此描述了 Schizochytrium菌抹,以前將它優(yōu)化為商業(yè)化生產(chǎn)富含 PUFA,主要是二十二碳六烯酸(DHA; C22 :6 n-3 )和二十二碳五烯酸(DPA; C22 :5n-6)的油類,現(xiàn)在對它進行遺傳修飾,使其產(chǎn)生EPA(C20 :5 n-3)(或產(chǎn) 生其他PUFA)以取代產(chǎn)生DHA,而不犧牲該生物體的產(chǎn)油特性。此外,本發(fā) 明人在此描述了對具有破嚢壺菌屬的PUFA PKS基因的Schizochytrium進行 遺傳修飾,從而改進Schizochytrium生物體的DHA產(chǎn)生,具體是通過修飾 PUFA PKS系統(tǒng)改變微生物產(chǎn)生的DHA/DPA比值。這些僅僅是本發(fā)明所包括
技術(shù)的一些例子,因為本發(fā)明的原理可以容易地應(yīng)用于下文詳細(xì)描述的其
他生產(chǎn)生物體和其它所需的PUFA 。
在一個實施方案中,本發(fā)明的PUFAPKS系統(tǒng)包含至少下列生物活'性結(jié) 構(gòu)域(a)至少兩個烯酰ACP-還原酶(ER)結(jié)構(gòu)域;(b)至少六個酰基載體蛋白 (ACP)結(jié)構(gòu)域;(c)至少兩個(3-酮脂酰-ACP合酶(KS)結(jié)構(gòu)域;(d)至少一個酰 基轉(zhuǎn)移酶(AT)結(jié)構(gòu)域;(e)至少一個(3-酮脂酰-ACP還原酶(KR)結(jié)構(gòu)域;(f)至 少兩個FabA-樣p-羥酰-ACP脫水酶(DH)結(jié)構(gòu)域;(g)至少一個鏈長因子(CLF) 結(jié)構(gòu)域;和(h)至少一個丙二酰-CoA:ACP?;D(zhuǎn)移酶(MAT)結(jié)構(gòu)域。這些結(jié) 構(gòu)域的功能分別是本領(lǐng)域公知的且在下文關(guān)于本發(fā)明的PUFA PKS系統(tǒng)中 將進行詳細(xì)描述。
在另一個實施方案中,PUFAPKS系統(tǒng)包含至少下列生物活性結(jié)構(gòu)域 (a)至少一個烯酰ACP-還原酶(ER)結(jié)構(gòu)域;(b)多個酰基載體蛋白(ACP)結(jié)構(gòu) 域(至少1至4個,優(yōu)選至少5個,更優(yōu)選至少6個,甚至更優(yōu)選7, 8, 9, 或9個以上);(c)至少兩個(3-酮脂酰-ACP合酶(KS)結(jié)構(gòu)域;(d)至少一個酰 基轉(zhuǎn)移酶(AT)結(jié)構(gòu)域;(e)至少一個(3-酮脂酰-ACP還原酶(KR)結(jié)構(gòu)域;(f)至 少兩個FabA-樣(3-羥酰-ACP脫水酶(DH)結(jié)構(gòu)域;(g)至少一個鏈長因子(CLF) 結(jié)構(gòu)域;和(h)至少一個丙二酰-CoA : ACP?;D(zhuǎn)移酶(MAT)結(jié)構(gòu)域。優(yōu)選 該PUFAPKS系統(tǒng)是非細(xì)菌PUFA-PKS系統(tǒng)。
在一個實施方案中,本發(fā)明的PUFAPKS系統(tǒng)是非細(xì)菌PUFAPKS系統(tǒng)。 換句話說,在一個實施方案中,本發(fā)明的PUFA PKS系統(tǒng)從不是細(xì)菌的生 物體中分離,或者是來自不是細(xì)菌的生物體,諸如真核生物或古細(xì)菌等的 PUFAPKS系統(tǒng)的同源物或從其衍生得到。真核生物根據(jù)細(xì)胞分化程度與原 核生物區(qū)分開來,真核生物具有分化程度較高的細(xì)胞,原核生物具有分化 程度較低的細(xì)胞。 一般來說,原核生物不具有核膜,細(xì)胞分裂過程中不進 行有絲分裂,僅有一個染色體,其細(xì)胞質(zhì)含有70S核糖體,它們不具有任 何線粒體,內(nèi)質(zhì)網(wǎng),葉綠體,溶酶體,或高爾基體,其鞭毛(如果存在)由單 一原纖維組成。相反,真核生物具有核膜,它們在細(xì)胞分裂過程中進行有 絲分裂,它們具有許多染色體,其細(xì)胞質(zhì)含有80S核糖體,它們具有線粒 體,內(nèi)質(zhì)網(wǎng),葉綠體(在藻類中),溶酶體和高爾基體,且其鞭毛(如果存在) 由許多原纖維組成。 一般來說,細(xì)菌是原核生物,而藻類,真菌,原生生 物,原蟲和高等植物是真核生物。
41
海洋細(xì)菌(例如,希瓦氏屬菌抹SCRC2738和海產(chǎn)弧菌)的PUFAPKS系 統(tǒng)不是本發(fā)明的基礎(chǔ),盡管本發(fā)明確實包含使用來自這些細(xì)菌PUFAPKS 系統(tǒng)的結(jié)構(gòu)域與本發(fā)明的非細(xì)菌PUFA PKS系統(tǒng)結(jié)構(gòu)域的組合。此外,本 發(fā)明確實涉及分離和使用從其它細(xì)菌(例如Shewanella ol ley ana和 Shewanella japonica)分離的PUFA PKS基因組(set)(及其編碼的蛋白和功能 域),其特別適合用作修飾或與本文所述的非細(xì)菌PUFAPKS基因組合的 PUFAPKS基因的來源,從而產(chǎn)生雜合構(gòu)建體以及經(jīng)遺傳修飾的微生物和植 物。例如,根據(jù)本發(fā)明,可產(chǎn)生遺傳修飾的生物體,它合并了非細(xì)菌PUFA PKS功能域和細(xì)菌PUFA PKS功能域,以及來自其它PKS系統(tǒng)(I型,II型, 模塊型)或FAS系統(tǒng)的PKS功能域或蛋白質(zhì)。如下文詳細(xì)描述的,來自希瓦 氏屬兩個菌種,即Shewanella olleyana或Shewanella japonica的PUFA PKS 基因是優(yōu)選用于本發(fā)明的經(jīng)遺傳修飾微生物、植物和方法的示例性細(xì)菌基 因。來自這種海洋纟田菌(例如Shewanella olleyana或Shewanella japonica)的 PUFA PKS系統(tǒng)(基因及其編碼的蛋白和功能域)包括在本發(fā)明中作為新的 PUFA PKS序列。
才艮才居本發(fā)明,術(shù)i吾Mii吾"Thraustochytrid" " Tliraustochytriales樣么生物" "Thraustochytriales目的微生物"可以交換使用,指Thrausto勿triales目的 {壬意成員,包括Thraustochytriaceae牙+和Labyrinthulaceae牙牛。本文所用的 術(shù)語"Labyrinthulid"和"Labyrinthulaceae"特指Labyrinthulaceae科的成員。 為了具體i兌明Thraustochytriaceae科的成員Thraustochytrids,本文寸吏用術(shù)語 了 "Thraustochytriaceae"。 因此,對于本發(fā)明,"i人為Labyrinthulids科的成員 包括在Thraustochytrids中。
研究導(dǎo)致頻繁修定Thraustochytrids的分類。分類學(xué)家通常將 Thraustochytrids放在藻類或藻樣原生生物中。然而,由于分類的不確定, 為本發(fā)明目的最好認(rèn)為本發(fā)明所述的菌抹是Thraustochytrids以包括以下生 物體目Thraustochytriales;評牛Thraustochytriaceae;(屬石皮嚢壺菌屬, Schizoclaytrium , Japonochytrium , Aplanochytrium 或 Elina) 或 Labyrinthulaceae(屬Labyrinthula, Labyrinthuloides, 或Labyrinthomyxa)。有 日寸下歹'J屬也包括在Thraustochytriaceae科或Labyrinthulaceae科中JWwmz'a, Cbn3〃oc/(ay/,/Mm , Z)^/o/ /z;^;^和/y/r/zayoraj, 并且為了本發(fā)明的目的包4舌 在 Thraustochytrid 或 Thraustochytriales 目的成員中。本發(fā)明中
Thraustochytrids的分類學(xué)修定將./^.)'/'/〃r/7w/o/V/"'.屬放在Labyrinthulaceae科 中,并確定將Thraustochytriac.eae和Labyrinthulaceae兩個科力文在Stramenopile i普系。應(yīng)當(dāng)注意的是,有日寸Labyrinthulaceae通常叫做labyrinthulids或 labyrinthula 或 labyrinthuloides ' Thraustochytriaceae 通常 叫 做 thraustochytrids,雖然如上所述,為使本發(fā)明清楚的目的,Thraustochytrids包 括 T'hraustochytriale.s 目的任意成員和/或包括 Thraustochytriaceae. 和 Labyrinthulaceae的成員。最新的分類學(xué)變化在下文中概括。
本文公開的某些單細(xì)胞微生物菌抹是Thi葛to勿triales目的成員。 Thraustochytrids是具有進化的分類史的海洋真核生物。Moss( 1986), Bahnweb和Jackle(1986)以及Chamberlain和Moss(1988)對Thraustochytrids 的分類地位問題進行了綜述。
為了方便'分類學(xué)家首先將Thraustochytrids與其它無色游動孢子真核 生物放在藻狀菌綱(藻樣真菌)中。然而,藻狀菌綱這一名稱最后從分類學(xué)地 位中去掉,Thraustochytrids保留在卵菌綱(Oomycete)(雙鞭毛游動孢子真菌) 中。最初假定卯菌綱與異鞭毛藻類(heterokont algae)有親緣關(guān)系,并且 Barr(Barr, 1981, Biosystems 14:359-370)總結(jié)的,廣泛的超樣t結(jié)構(gòu)和生化石開 究最終支持了這一假定。事實上Leedale(Leedale, 1974, Taxon 23:261-270) 和其他藻類學(xué)家接受卵菌綱作為異鞭毛藻類的一部分。然而,事實上由于 其異養(yǎng)特性的方便性,卵菌綱和Thraustochytrids被真菌學(xué)家(研究真菌的科 學(xué)家)而不是藻類學(xué)家(研究藻類的科學(xué)家)大量研究。
從另一分類學(xué)角度來看,進化生物學(xué)家對于真核生物如何進化形成了 兩個系統(tǒng)學(xué)派。 一個學(xué)說提出通過一系列內(nèi)共生的外生膜結(jié)合細(xì)胞器起源 (Margulis, 1970, Origin of Eukaryotic Cells. Yale University Press, New Haven);例如線粒體起源于細(xì)菌的細(xì)胞內(nèi)共生生物,葉綠體起源于藍藻類 (cyanophyte),鞭毛起源于螺旋體(spirochaete)。另 一 學(xué)說提出膜結(jié)合細(xì)胞器 從原核祖先的無膜結(jié)合系統(tǒng)通過自生過程逐漸進化(Cavalier-Smith, 1975, Nature(Lond.)256:462-468)。 然而兩組進化生物學(xué)家都將卵菌綱和 Thraustochytrids從真菌中去除并將它們與chromophyte藻類 一 起放在 Chromophyta界中(Cavalier-Smith, 1981, BioSystems 14:461-481)(該界最近 擴展到包括其它原生生物且該界的成員,現(xiàn)在稱為Stmmenopiles)或與所有 藻類一起方丈在Protoctista界中(Margulis和Sagen, 1985, Biosystems 18:141-147)。
隨著電子顯微鏡的發(fā)展,對Thraustochytrids的兩個屬,即破嚢壺菌屬 和Schizochytrium的游動孢子超微結(jié)構(gòu)的研究(Perkins, 1976, pp.279-312, "Recent Advances in Aquatic Mycology,,(ed. E.B.G. Jones), John Wiley & Sons, New York; Kazama, 1980, Can. J. Bot. 58: 2434-2446; Barr, 1981, Biosystems 14: 359-370)提供了良好證據(jù)證明Thraustochytriaceae與卵菌綱僅具有較遠(yuǎn) 的親緣關(guān)系。另外,對5S核糖體RNA序列的對應(yīng)分析(多元統(tǒng)計形式)得到 的遺傳數(shù)據(jù)表明Thraustochytriales明顯是一組獨特的真核生物,完全獨立于 真菌,且與紅藻和褐藻以及卵菌綱的成員有最近的親緣關(guān)系(Mannella, et al., 1987, Mol. Evol. 24: 228-235)。大多數(shù)分類學(xué)家同意將Thraustochytrids 從卵菌綱中耳又出(Bartnicki-Garcia, 1987, pp.389-403頁,"Evolutionary Biology of the Fungi"(eds. Rayner, A. D. M., Brasier, C. M. & Moore, D.), Cambridge University Press, Cambridge)。
總之,采用Cavalier-Smith的分類系統(tǒng)(Cavalier-Smith, 1981, BioSystems 14:461-481, 1983; Cavalier-Smith, 1993, Microbiol Rev. 57: 953-994)將 Thraustochytrids與chromophyte》葉類一起分類進Chromophyta(Stramenopiles) 界中。最近Cavalier Smith等使用Heterokonta的18s rRNA標(biāo)記證實 Thraustochytrids是chromists而不是真菌,再次確"i人了這個分類地位 (Cavalier-Smith et al., 1994, Phil. Tran. Roy. Soc. London Series Biosciences 346:387-397)。該分類將它們放在與真菌完全不同的一個界中,而真菌都放 在Eufungi界中。
目前,有71組不同的真核生物體(Patterson 1999),在這些組中鑒定出 四個主要譜系并具有一定可信度(l)Alveolates, (2) Stramenopiles, (3)陸地 才直^7(Land PIant)-,錄y萊(green algae)-Rhodophyte—Glaucophyte("才直凈勿")進^ft 枝(clade)和(4)具后生鞭毛的進化枝(Opisthokont clade)(真菌和動物)。以前這 四個主要譜系用界標(biāo)記,但是一些研究人員認(rèn)為使用"界"的概念不再有 利。
如Armstrong提到的,Stramenopile指三分微管毛狀物,這個語系的多 數(shù)成員具有帶有這種毛狀物的鞭毛。Stramenopiles(單細(xì)胞生物體,精子, 游動孢子)的活動細(xì)胞是不對稱的,有兩個側(cè)向插入的鞭毛, 一個長,帶有 三分微管毛狀物使鞭毛的推力逆轉(zhuǎn), 一個短并且光滑。以前,當(dāng)組不太寬
廣時,Stramenopiies叫做Chromista界或異鞭毛(=不等鞭毛)藻類,因為這 些組由褐藻或Phaeophytes, 以及黃-綠藻(yellow-green Algae),金-褐藻 (Golden-brown. Algae), Eustigmatophytes和Diatoms —起組成。隨后發(fā)現(xiàn)一 些異養(yǎng)的、真菌樣生物體、水藻菌和labyrinthulids(slime net amoebas)具有相 似的活動細(xì)胞,所以以光合色素或藻類對組命名變得不合適了?,F(xiàn)在, Stramenopile語系中的兩個科是Labyrinthulaceae禾口 Thraustochytriaceae。 歷 史上對這些獨特微生物有許多分類策略,并且它們通常分在相同的目中(即 Thraustochytriales)。這些組中成員的關(guān)系仍在發(fā)展。Porter和Leander ^開究 了基于18S小亞基核糖體DNA的數(shù)據(jù),其表明thraustochytrid-labyrinthulid 進化枝。然而,進化枝由兩個分技支持;第一個包含破嚢壺菌屬和Ulkenia profunda的三個種,第二個包含Labyrinthula的三個種,Labyrinthuloides和 Schizochytrium aggregatum的兩個種。
因此本發(fā)明所用的Thraustochytrids的分類地位總結(jié)如下
界Chromophyta (Stramenopiies)
門Heterokonta
目ThraustochytriaIes(Thraustochytrids) 科Thraustochytriaceae或Labyrinthulaceae
屬石皮嚢壺菌屬,Schizochytrium, Japonochytrium, Aplanoclaytriurn, EIina, Labyrinthula, Labyrinthuloides或Labyrinthuloinyxa
一些早期的分類學(xué)家將破嚢壺菌屬的一些原始成員(具有變形蟲狀生活 階段的成員)分入一個稱為Ulkenia的獨立屬中。然而,現(xiàn)在知道大多數(shù)(如 果不是全部的話)Thraustochytrids(包括破嚢壺菌屬和Schizochytrium)表現(xiàn)出 變形蟲狀(amoeboid)階段,因此有人認(rèn)為Ulkenia不是一個正確的屬。本文 使用的破嚢壺菌屬包括Ulkenia。
盡管門和界中更高級分類的分類學(xué)地位不確定,但是Thraustochytrids 保持特有的和特征性的分類,其成員可分類在Thraustochytriales目內(nèi)。
Schizochytrium是Thraustochytrid海洋^鼓生物,其積累大量富含DHA 和二十二碳五烯酸(DPA; 22:5 co-6)的三?;视?,例如占干重的30% DHA + DPA (Barclay et al., J. Appl, Phycol. 6,123(1994))。在通過延長/去飽和途徑合 成20-碳和22-碳PUFA的真核生物中,18-碳,20-碳和22-碳中間體的分子 庫相當(dāng)大,因此使用[14C]-乙酸鹽的體內(nèi)標(biāo)記實驗揭示了預(yù)期中間體的清楚
的前體-產(chǎn)物動力學(xué)(Gellerman et al., Biochim. Biophys. Acta 573: 23(1979))。 另外,外源性供給該生物體的放射標(biāo)記中間體轉(zhuǎn)變成最終的PUFA產(chǎn)物。 本發(fā)明人已證明[l-"C]-乙酸鹽迅速被Schizochytrium細(xì)胞吸收并摻入脂肪 酸,但在最短標(biāo)記時間(l分鐘)時,DHA含有脂肪酸中回收的31%的標(biāo)記, 且該百分?jǐn)?shù)在10-15分鐘的["C]-乙酸鹽摻入和隨后24小時的培養(yǎng)物生長期 間基本上保持不變。類似的,實驗中DPA代表10%的標(biāo)記。沒有證據(jù)表明 在16-碳或18-碳脂肪酸與22-碳多不飽和脂肪酸之間存在前體-產(chǎn)物關(guān)系。 這些結(jié)果與DHA、從包含極小(可能與酶結(jié)合的)中間體庫的["C]-乙酸鹽迅 速合成DHA相一致。來自Schizochytrium培養(yǎng)物的無細(xì)胞勻漿將[l-"C]-丙 二酰-CoA 4參入DHA、 DPA和飽和脂肪酸中。相同的生物合成活性在 100,000xg的上清級分中保留但在膜沉淀中不存在。因此,Schizochytrium 中DHA和DPA合成不像其它真核生物那樣,前者不涉及膜結(jié)合去飽和酶 或月旨肪酸延長酶(Parker-Barnes etal., 2000,出處同上;Shanklin et al., 1998, 出處同上)。這些分級分離數(shù)據(jù)與從希瓦氏菌屬酶獲得的數(shù)據(jù)相反(參見Metz et al., 2001,出處同上),且表明Schizochytrium酶使用不同的(可溶性)酰基 受體分子,例如CoA。預(yù)期破嚢壺菌屬具有相似的生物化學(xué)。
在US專利6,566,583中,從Schizochytrium構(gòu)建了 cDNA文庫且測序 了約8500個隨機克隆(ESTs)。圖2中所示的與希瓦氏菌屬PKS基因的11 個結(jié)構(gòu)域中的8個結(jié)構(gòu)域同源的序列均以0.2-0.5%的頻率被鑒定。在US專 利6,566,583中,測序了與希瓦氏菌屬PKS基因同源的來自Schizochytrium 的幾個cDNA克隆,且各種克隆裝配成代表兩個部分開放閱讀框和一個完 整開放閱讀框的核酸序列。
本發(fā)明人對cDNA和基因組克隆的進一步測序使得可以鑒定 Schizochytrium中每個OrfA, Orffi和OrfC的全長基因組序列,并可以完全 鑒定Schizochytrium中與希瓦氏菌屬同源的結(jié)構(gòu)域(參見圖2)。這些基因的 詳細(xì)描述見US專利申請10/124,800出處同上,在下文中也有詳細(xì)描述。
發(fā)明人目前鑒定、克隆并測序了破嚢壺菌屬的Thraustochytrid(特別是 Thraustochytrium sp. 23B(ATCC 20892))中的同源Orfs的全長基因組序列,并 且鑒別了該破嚢壺菌屬中包含PUFAPKS系統(tǒng)的結(jié)構(gòu)域。
根據(jù)Schizochytrium PUFA PKS系統(tǒng)的結(jié)構(gòu)域與希瓦氏屬PUFA PKS系 統(tǒng)的結(jié)構(gòu)域的比較,顯然Schizochytrium基因組編碼與希瓦氏屬中能夠催化
EPA合成的蛋白高度相似的蛋白。Schizochytrium中的蛋白組成催化DHA 和DPA合成的PUFA PKS系統(tǒng)。簡單修飾希瓦氏屬的反應(yīng)方案可以在 Schizochytrium中合成DHA。原核希瓦氏屬基因和真核Schizochytrium基因 之間的同源性說明PUFA PKS已進行橫向基因轉(zhuǎn)移。
對破嚢壺菌屬可進行相類似的比較。在所有情況中,Thraustochytrium 23B(Th. 23B)PUFA PKS蛋白或結(jié)構(gòu)域與其它已知序列的比較揭示最匹配的 是US專利申請10/124,800(出處同上)所述的一種Schizochytrium PUFA PKS 蛋白(OrfA, B或C,或其結(jié)構(gòu)域)。在所有情況中,次最匹配的是來自海洋 纟田菌(希瓦氏SCRC-2738, Shewanella oneidensis, Photobactef profundum禾口 Moritella marina)或來自固氮藍纟田菌(例詿口 Nostoc punctiforme詳口 Nostoc sp. PCC 7120)中發(fā)現(xiàn)的相關(guān)系統(tǒng)的一種PUFAPKS蛋白。藍細(xì)菌酶系統(tǒng)的產(chǎn)物 沒有雙鍵,并且蛋白缺少與參與順式雙鍵形成的DH結(jié)構(gòu)域相關(guān)的結(jié)構(gòu)域 (即Fab A相關(guān)DH結(jié)構(gòu)域)。
根據(jù)本發(fā)明,短語"開放閱讀框"用縮寫"Orf'表示。應(yīng)當(dāng)注意,開 放閱讀框編碼的蛋白可以用全部大寫的"ORF"表示,開放閱讀框編碼的核 酸序列可以用全部小寫的"orf,表示,但為了統(tǒng)一,拼寫"Orf,在本文中 優(yōu)選用于描述核酸序列或其編碼的蛋白。術(shù)語指蛋白還是核酸序列從上下 文中是很明顯的。
Schizochytrium PUFA PKS
圖1是來自Schizochytrium PUFA PKS系統(tǒng)的三個開放閱讀框的示意 圖,且包括該PUFA PKS系統(tǒng)的結(jié)構(gòu)域結(jié)構(gòu)。如US專利申請10/124,800 詳細(xì)描述的,每個開放閱讀框的結(jié)構(gòu)域結(jié)構(gòu)如下
開放閱讀框A(OrfA):
OrfA完整核香酸序列在本文中表示為SEQ ID NO: 1。 OrfA是一個 8730個核苷酸的序列(不包括終止密碼子),它編碼本文表示為SEQ ID NO: 2 的2910個氨基酸的序列。OrfA內(nèi)有12個結(jié)構(gòu)域(a)—個(3-酮脂酰-ACP 合酶(KS)結(jié)構(gòu)域;(b)—個丙二酰-CoA:ACP?;D(zhuǎn)移酶(MAT)結(jié)構(gòu)域;(c)9 個?;d體蛋白(ACP))構(gòu)域;和(d)—個(3-酮脂酰-ACP還原酶(KR)結(jié)構(gòu)域。 已保藏了 OrfA的核苷酸序列,GenBank登錄號AF378327(氨基酸序列登錄 號AAK728879)。
Schizochytrium OrfA的第一個結(jié)構(gòu)域是(3-酮脂酰-ACP合酶(KS)結(jié)構(gòu)
域,本文也稱為OrfA-KS。該結(jié)構(gòu)域包含在從SEQIDNO: l(OrfA)的大約1 位和40位之間的起始位點到SEQ ID NO: 1的大約1428位和1500位之間的 終止位點的核苷酸序列內(nèi)。含有OrfA-KS結(jié)構(gòu)域編碼序列的核苷酸序列在 本文中表示為SEQ ID NO: 7(SEQ ID NO: 1的l位-1500位)。含有KS結(jié)構(gòu) 域的氨基酸序列是從SEQ ID NO: 2(OrfA)的大約1位和14位之間的起始位 點到SEQ ID NO: 2的大約476位和500位之間的終止位點。含有OrfA-KS 結(jié)構(gòu)域的氨基酸序列本文表示為SEQ ID NO: 8 (SEQ ID NO: 2的1位-500 位)。應(yīng)注意OrfA-KS結(jié)構(gòu)域含有一個活性位點基序DXAC^。?;Y(jié)合位 點C2I5)。
根據(jù)本發(fā)明,具有|3-酮脂酰-ACP合酶(KS)生物學(xué)活性(功能)的結(jié)構(gòu)域 或蛋白質(zhì),其特征是進行FAS(和PKS)延長反應(yīng)循環(huán)起始步驟的酶。術(shù)語"|3-酮脂酰-ACP合酶"與術(shù)語"3-酮?;?ketoacyl)-ACP合酶"、"P-酮?;?ACP 合酶,,和"酮?;鵄CP合酶"以及類似衍生詞可以交換使用。用于延長的 ?;鶊F通過硫酯鍵連接到酶活性位點的半胱氨酸殘基上。在多步反應(yīng)中, ?;概c丙二酰-ACP縮合形成酮脂酰-ACP、 C02和游離酶。KS在延長循 環(huán)中起關(guān)鍵作用且在許多系統(tǒng)中表現(xiàn)出比該反應(yīng)循環(huán)中的其它酶具有更大 的底物特異性。例如,大腸桿菌具有三個不同的KS酶,它們在生物體的生 理學(xué)中分別具有各自特定的作用(Magnuson et al. , Microbiol. Rev. 57,522(1993))。 PUFA-PKS系統(tǒng)的兩個KS結(jié)構(gòu)域在PUFA生物合成反應(yīng)程
序中具有不同的作用。
作為一類酶,已經(jīng)充分表征了 KS的特性。許多證實的KS基因的序列 是已知的,已經(jīng)鑒定了活性位點基序且測定了一些序列的晶體結(jié)構(gòu)??赏?過與已知KS序列的同源性可容易地鑒定蛋白質(zhì)(或蛋白的結(jié)構(gòu)域)屬于KS 酶家族。
OrfA的第二個結(jié)構(gòu)域是丙二酰-CoA: ACP?;D(zhuǎn)移酶(MAT)結(jié)構(gòu)域,本 文也稱為OrfA-MAT。該結(jié)構(gòu)域包含在從SEQ ID NO: l(OrfA)的大約1723 位和1798位之間的起始位點到SEQ ID NO: 1的大約2805位和3000位之間 的終止位點的核苦酸序列內(nèi)。含有OrfA-MAT結(jié)構(gòu)域編碼序列的核苷酸序 列本文表示為SEQ ID NO: 9(SEQ ID NO: 1的1723位-3000位)。含有MAT 結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 2(OrfA)的大約575位和600位之間的 起始位點到SEQ ID NO: 2的大約935位和1000位之間的終止位點。含有OrfA-MAT結(jié)構(gòu)域的氨基酸序列本文表示為SEQ ID NO: IO(SEQ ID NO: 2的 575-1000位)。應(yīng)注意OrfA-MAT結(jié)構(gòu)域含有一個活性位點基序GHS*XG (* ?;Y(jié)合位點S7()6),本文表示為SEQ ID NO: 11。
根據(jù)本發(fā)明,具有丙二酰-CoA: ACP?;D(zhuǎn)移酶(MAT)生物學(xué)活性(功肯巨) 的結(jié)構(gòu)域或蛋白質(zhì),其特征是將丙二酰部分從丙二酰-CoA轉(zhuǎn)移到ACP的結(jié) 構(gòu)域或蛋白質(zhì)。術(shù)語"丙二酰-CoA: ACP?;D(zhuǎn)移酶"與"丙二酰?;D(zhuǎn)移 酶,,以及類似衍生詞可以交換使用。除了活性位點基序(GxSxG),這些酶具 有鑒定它們是MAT酶(與Schizochytri暖Orf B的AT結(jié)構(gòu)域相反)的延長基 序(關(guān)鍵位置中的R和Q氨基酸)。在一些PKS系統(tǒng)(但不是PUFA PKS結(jié)構(gòu) 域)中,MAT結(jié)構(gòu)域優(yōu)先將曱基-丙二?;蛞一?丙二酰裝載到ACP基團上(從 相應(yīng)的CoA酯),從而在線型碳鏈中導(dǎo)入分支。通過其與已知MAT序列的 同源性及其延長基序結(jié)構(gòu)可以識別MAT結(jié)構(gòu)域。
OrfA的3 - 11個結(jié)構(gòu)域是9個串連的?;d體蛋白(ACP)結(jié)構(gòu)域,本文 也稱為OrfA-ACP(序列中第一個結(jié)構(gòu)域是OrfA-ACPl,第二個結(jié)構(gòu)域是 OrfA-ACP2,第三個結(jié)構(gòu)域是OrfA-ACP3,等等)。第一個ACP結(jié)構(gòu)域,即 OrfA-ACPI包含在從SEQ ID NO: l(OrfA)的大約3343位到約3600位的核苷 酸序列內(nèi)。含有OrfA-ACPl結(jié)構(gòu)域的編碼序列的核苷酸序列本文表示為 SEQ ID NO: 12(SEQ ID NO: 1的3343 — 3600位)。含有第一個ACP結(jié)構(gòu)域 的氨基酸序列是從SEQIDNO:2的約1115位到約1200位。含有OrfA-ACP 1結(jié)構(gòu)域的氨基酸序列在本文中表示為SEQ ID NO: 13(SEQ ID NO: 2的 1115-1200位)。應(yīng)注意OrfA-ACPl結(jié)構(gòu)域含有活性位點基序LGIDS^"乏 酰巰基乙胺結(jié)合基序S1!57),本文以SEQ ID NO: 14表示。
所有9個ACP結(jié)構(gòu)域的核苷酸和氨基酸序列高度保守,因此每個結(jié)構(gòu) 域的序列在本文中沒有用單獨的序列標(biāo)識符表示。然而,根據(jù)本文公開的 信息,本領(lǐng)域技術(shù)人員可容易地測定含有其它8個ACP結(jié)構(gòu)域中每個結(jié)構(gòu) 域的序列(參見下面的討論)。
所有9個ACP結(jié)構(gòu)域一起覆蓋從SEQ ID NO: 1的約3283位到約6288 位的OrfA區(qū)域,它對應(yīng)于SEQ ID NO: 2的約1095位到約2096位的氨基酸 位置。含有所有9個結(jié)構(gòu)域的全部ACP區(qū)域的核苷酸序列在本文中表示為 SEQ ID NO: 16。以SEQ ID NO: 16表示的區(qū)域包括各個ACP結(jié)構(gòu)域之間的 接頭片段。9個結(jié)構(gòu)域的重復(fù)間隔是SEQIDNO: 16中大約每330個核苷酸(相鄰活性位點絲氨酸之間測定的實際氨基酸數(shù)目是104個至116個氨基 酸)。9個ACP結(jié)構(gòu)域中每一個都含有一個泛酰巰基乙胺結(jié)合基序 LGIDS^本文中以SEQIDNO: 14表示),其中S *是泛酰巰基乙胺結(jié)合位點 絲氨酸(S)。泛酰巰基乙胺結(jié)合位點絲氨酸(S)位于臨近每個ACP結(jié)構(gòu)域序列 的中心。ACP結(jié)構(gòu)域區(qū)域的每個末端和每個ACP結(jié)構(gòu)域之間是高度富含脯 氨酸(P)和丙氨酸(A)的區(qū)域,相信它是接頭區(qū)域。例如ACP結(jié)構(gòu)域1和2 之間是序列APAPVKAAAPAAPVASAPAPA,本文表示為SEQ ID NO: 15 。 相對于SEQ ID NO: 2的氨基酸序列,9個ACP結(jié)構(gòu)域中每一個的活性位點 絲氨酸殘基(即泛酰巰基乙胺結(jié)合位點)的位置如下ACPI = S1157; ACP2 = S1266; ACP3 = S1377; ACP4 = S簡;ACP5 = S願;ACP6 = S1715; ACP7 = SI819; ACP8 = S193o;和ACP9 =S2()34。由于ACP結(jié)構(gòu)域的平均大小在不包括接頭 的情況下是約85個氨基酸,包括接頭則為約110個氨基酸,活性位點絲氨 酸約位于結(jié)構(gòu)域的中心,因此本領(lǐng)域技術(shù)人員可容易地測定OrfA中9個 ACP結(jié)構(gòu)域的每一個的位置。
根據(jù)本發(fā)明,具有?;d體蛋白(ACP)生物學(xué)活性(功能)的結(jié)構(gòu)域或蛋 白質(zhì),其特征是小多肽(一般長80個至100個氨基酸),其作用是作為載體 通過硫酯鍵連接到與蛋白共價結(jié)合的輔因子來延長脂肪酸鏈。它們作為分 離的單位或者作為更大蛋白質(zhì)內(nèi)的結(jié)構(gòu)域存在。通過將CoA的磷酸泛酰巰 基乙胺基部分轉(zhuǎn)移到高度保守的ACP絲氨酸殘基上,ACPs從失活的apo-形式轉(zhuǎn)變成有功能的holo-形式。通過硫酯鍵連接、在磷酸泛酰巰基乙胺基 部分的游離末端?;鶊F附著到ACP上。通過用放射活性泛酰巰基乙胺標(biāo) 記以及與已知ACPs序列的同源性可鑒定ACPs。存在上述基序(LGIDS"的 變體也是ACP的一個標(biāo)記。
OrfA的結(jié)構(gòu)域12是P-酮脂酰-ACP還原酶(KR)結(jié)構(gòu)域,本文也稱為 OrfA-KR。該結(jié)構(gòu)域包含在從SEQ ID NO: 1的約6598位起始位點到SEQ ID NO: 1的約8730位終止位點的核苷酸序列內(nèi)。含有OrfA-KR結(jié)構(gòu)域的編碼 序列的核苷酸序列本文表示為SEQ ID NO: 17(SEQ ID NO: 1的6598-8730 位)。含有KR結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 2(OrfA)的約2200位起 始位點到SEQ ID NO: 2的約2910位終止位點。含有OrfA-KR結(jié)構(gòu)域的氨 基酸序列本文表示為SEQ ID NO: 18(SEQ ID NO: 2的2200-2910位)。KR結(jié) 構(gòu)域內(nèi)有與短鏈乙醛脫氫酶(KR是該家族的一個成員)同源的核心區(qū)。該核
心區(qū)是從SEQ ID NO: 1的約7198位至約7500位,對應(yīng)于SEQ ID NO: 2的 2400-2500位氨基酸。
根據(jù)本發(fā)明,具有卩-酮脂酰-ACP還原酶(KR)活性(功能)的結(jié)構(gòu)域或蛋 白,其特征是催化ACP的3-酮脂酰形式的吡啶-核苷-依賴型還原的結(jié)構(gòu)域 或蛋白質(zhì)。術(shù)語"p-酮脂酰-ACP還原酶"與術(shù)語"酮還原酶"、"3-酮脂酰 -ACP還原酶""酮?;鵄CP還原酶"以及類似衍生詞可以交換使用。它是 脂肪酸從頭生物合成延長循環(huán)中的第一個還原步驟以及通常在聚酮化合物 生物合成中進行的反應(yīng)。觀察到與烯酰ACP還原酶(ER)的一個家族,另一 種FAS還原酶(但不是PUFAPKS系統(tǒng)中的ER家族),和短鏈乙醇脫氫酶家 族有顯著的序列相似性。對上述PUFAPKS區(qū)域的Pfam分析揭示在核心區(qū) 中與短鏈乙醇脫氫酶家族同源。對相同區(qū)域的Blast分析揭示在核心區(qū)中與 已知的KR酶以及延長區(qū)匹配,所述延長區(qū)與其它已鑒定的PUFAPKS系統(tǒng) 的結(jié)構(gòu)域同源。
開放閱讀框B(Orffi):
Orffi的完整核芬酸序列在本文中表示為SEQ ID NO: 3。 Orffi是一個 6177個核苷酸的序列(不包括終止密碼子),編碼2059個氨基酸的序列,本 文表示為SEQ ID NO: 4。 Orffi內(nèi)有4個結(jié)構(gòu)域(a)—個(3-酮脂酰-ACP合 酶(KS)結(jié)構(gòu)域;(b)—個鏈長因子(CLF)結(jié)構(gòu)域;(c)一個?;D(zhuǎn)移酶(AT)結(jié)構(gòu) 域;和(d)—個烯酰ACP-還原酶(ER)結(jié)構(gòu)域。已保藏了 Orffi的核苷酸序列, GenBank登錄號AF378328(氨基酸序列登錄號AAK7288S0)。
Orffi中的第一個結(jié)構(gòu)域是)3-酮脂酰-ACP合酶(KS)結(jié)構(gòu)域,本文也稱為 Orffi-KS。該結(jié)構(gòu)域包含在從SEQ ID NO: 3(Orffi)的約1位和43位之間的起 始位點到SEQ ID NO: 3的約1332位和1350位之間的終止位點的核芬酸序 列內(nèi)。含有Orffi-KS結(jié)構(gòu)域編碼序列的核苷酸序列本文表示為SEQ ID NO: 19(SEQ ID NO: 3的1-1350位)。含有KS結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 4(OrfB)的約1位和15位之間的起始位點到SEQ ID NO: 4的約444位 和450位之間的終止位點。含有Orffi-KS結(jié)構(gòu)域的氨基酸序列在本文表示 為SEQ ID NO: 20(SEQ ID NO: 4的1-450位)。應(yīng)注意OrfB-KS結(jié)構(gòu)域含有 活性位點基序DXAC^C"?;Y(jié)合位點C196)。 KS的生物學(xué)活性以及鑒定具 有該活性的蛋白質(zhì)或結(jié)構(gòu)域的方法已在上文中描述。
Orffi的第二個結(jié)構(gòu)域是鏈長因子(CLF)結(jié)構(gòu)域,本文也稱為Orffi-CLF。
該結(jié)構(gòu)域包含在從SEQ ID NO: 3(OrfB)的約1378位和1402位之間的起始位 點到SEQ ID NO: 3的約2682位和2700位之間的終止位點的核香酸序列內(nèi)。 含有Orffi-CLF結(jié)構(gòu)域編碼序列的核苷酸序列本文表示為SEQ ID NO: "(SEQ ID NO: 3的1378-2700位)。含有CLF結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 4(Orffi)的約460位和468位之間的起始位點到SEQ ID NO: 4的約 894位和900位之間的終止位點。含有Orffi-CLF結(jié)構(gòu)域的氨基酸序列本文 表示為SEQ ID NO: 22(SEQ ID NO: 4的460-900位)。應(yīng)注意Orffi-CLF結(jié)構(gòu) 域含有不含?;?結(jié)合型半胱氨酸的KS活性位點基序。
根據(jù)本發(fā)明,根據(jù)下述理論將結(jié)構(gòu)域或蛋白質(zhì)稱為鏈長因子(CLF)。 CLF 最初被描述成是II型(分離的酶)PKS系統(tǒng)的特征且假定在確定延長循環(huán)的 次數(shù),從而在確定終產(chǎn)物的鏈長中起作用。CLF的氨基酸序列與KS結(jié)構(gòu)域 同源(且認(rèn)為與KS蛋白質(zhì)形成異二聚體),但是它們沒有活性位點半胱氨酸。 CLF在PKS系統(tǒng)中的作用目前尚有爭議。新證據(jù)(C. Bisang et al., Nature 401,502(1999))表明在引發(fā)PKS系統(tǒng)(提供將被延長的起始酰基基團)中起作 用。在該作用中,認(rèn)為CLF結(jié)構(gòu)域使丙二酸鹽(如丙二酰-ACP)去羧基化, 從而形成可轉(zhuǎn)移到KS活性位點的乙酸(acetate)基團。因此該乙酸鹽作為可 進行起始延長(縮合)反應(yīng)的'引發(fā)分子,。已經(jīng)鑒定了 II型CLF的同源物在 一些模塊型PKS系統(tǒng)中是'裝載,結(jié)構(gòu)域。具有CLF序列特征的結(jié)構(gòu)域在 目前鑒定的所有PUFA PKS系統(tǒng)中均被發(fā)現(xiàn)且在各種情況下均發(fā)現(xiàn)它是多 結(jié)構(gòu)域蛋白的一部分。
Orffi的第三個結(jié)構(gòu)域是AT結(jié)構(gòu)域,本文也稱為Orffi-AT。該結(jié)構(gòu)域包 含在從SEQ ID NO: 3(Orffl)的約2701位和3598位之間的起始位點到SEQ ID NO: 3的約3975位和4200位之間的終止位點的核苷酸序列內(nèi)。含有 Orffi-AT結(jié)構(gòu)域編碼序列的核苷酸序列在本文表示為SEQ ID NO: 23(SEQ ID NO: 3的2701-4200位)。含有AT結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 4(OrfB)的約901位和1200位之間的起始位點到SEQ ID NO: 4的約1325位 和1400位之間的終止位點。含有Orffi-AT結(jié)構(gòu)域的氨基酸序列在本文表示 為SEQ ID NO: 24(SEQ ID NO: 4的901-1400位)。應(yīng)注意Orffi-AT結(jié)構(gòu)域含 有活性位點基序GxS*xG(*?;Y(jié)合位S 4()),它是酰基轉(zhuǎn)移酶(AT)蛋白的特 征。
"酰基轉(zhuǎn)移酶"或"AT"是指能進行許多不同?;D(zhuǎn)移反應(yīng)的一大類
酶。術(shù)語"?;D(zhuǎn)移酶,,與術(shù)語"?;D(zhuǎn)移因子"可以交換使用。Schizochytrium 結(jié)構(gòu)域與目前檢查的所有其它PUFA PKS系統(tǒng)中存在的結(jié)構(gòu)域具有較好的 同源性,與鑒定了其特異性功能的一些?;D(zhuǎn)移酶(例如,與丙二酰-CoA: ACP?;D(zhuǎn)移酶,MAT)的同源性很弱。盡管與MAT的同源性弱,相信該 AT結(jié)構(gòu)域不發(fā)揮MAT的作用,因為它不具有該酶的延長基序結(jié)構(gòu)特征(參 見上文的MAT結(jié)構(gòu)域描述)。為了公開的目的,PUFA PKS系統(tǒng)中的AT結(jié) 構(gòu)域的功能包括,但不限于將脂肪酰基基團從OrfAACP結(jié)構(gòu)域轉(zhuǎn)移到水 中(即硫酯酶-以游離脂肪酸形式釋放脂肪?;?,將脂肪?;鶊F轉(zhuǎn)移到諸 如CoA的受體,在各種ACP結(jié)構(gòu)域之間轉(zhuǎn)移?;鶊F,或者將脂肪?;?團轉(zhuǎn)移到親脂受體分子(例如溶血磷脂酸)。
Orffi中的第四個結(jié)構(gòu)域是ER結(jié)構(gòu)域,本文也稱為OrfB-ER。該結(jié)構(gòu)域 包含在從SEQ ID NO: 3(Orffi)的約4648位的起始位點到SEQ ID NO: 3的約 6177位的終止位點的核苷酸序列內(nèi)。含有Orffi-ER結(jié)構(gòu)域編碼序列的核苷 酸序列在本文表示為SEQ ID NO: 25(SEQ ID NO: 3的4648-6177位)。含有 ER結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 4(Orffi)的約1550位的起始位點到 SEQ ID NO: 4的約2059位的終止位點。含有Orffi-ER結(jié)構(gòu)域的氨基酸序列 在本文表示為SEQ ID NO: 26(SEQ ID NO: 4的1550 - 2059位)。
根據(jù)本發(fā)明,該結(jié)構(gòu)域具有烯酰(enoyl)-ACP還原酶(ER)的生物學(xué)活性。 根據(jù)本發(fā)明,術(shù)語"烯酰(enoyl)-ACP還原酶"與"烯酰還原酶,,"烯酰ACP-還原酶""烯酰?;?enoyl acyl)-ACP還原酶"可以交換使用。ER酶還原脂 肪?;?fatty acyl)-ACP中的反式雙鍵(由DH活性導(dǎo)入),導(dǎo)致這些碳完全飽 和。PUFAPKS中的ER結(jié)構(gòu)域與新鑒定的ER酶家族(Heath et al.,Nature 406, 145(2000))同源。Heath和Rock通過從月申炎鏈3求菌(Streptococcus pneumoniae) 克隆目的基因,純化該基因表達的蛋白,并證明它在體外試驗中具有ER活 性,從而鑒定了這一新類ER酶。Orffi的Schizochytrium ER結(jié)構(gòu)域的序列 與肺炎鏈球菌ER蛋白質(zhì)同源。目前檢查的所有PUFA PKS系統(tǒng)均含有至少 一個與Schizochytrium ER結(jié)構(gòu)域的序歹J同源性極高的結(jié)構(gòu)域。 Schizochytrium PUFA PKS系統(tǒng)含有兩個ER結(jié)構(gòu)域(一個在Orffi上, 一個在 OrfC上)。
開放閱讀框C(OrfC):
OrfC的完整核苷酸序列在本文中表示為SEQ ID NO: 5。 OrfC是4509
個核香酸的序列(不包括終止密碼子),編碼1503個氨基酸的序列,本文表 示為SEQ ID NO: 6。 OrfC中有3個結(jié)構(gòu)域(a)兩個FabA-樣p-羥酰-ACP脫 水酶(DH)結(jié)構(gòu)域;和(b)—個烯酰-ACP還原酶(ER)結(jié)構(gòu)域。已保藏了 OrfC 的核苷酸序歹'j ,GenBank登錄號AF378329(氨基酸序列登錄號AAK7288S1)。 OrfC中的第一個結(jié)構(gòu)域是DH結(jié)構(gòu)域,本文也稱為OrfC-DHl。它是 OrfC中的兩個DH結(jié)構(gòu)域之一,因此命名為DH1 。該結(jié)構(gòu)域包含在從SEQ ID NO: 5(OrfC)的約1位和778位之間的起始位點到SEQ ID NO: 5的約1233 位和1350位之間的終止位點的核苷酸序列內(nèi)。含有OrfC-DHl結(jié)構(gòu)域編碼 序列的核香酸序列本文表示為SEQ ID NO: 27(SEQ ID NO: 5的1-1350位)。 含有DH1結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 6(OrfC)的約1位和260位 之間的起始位點到SEQ ID NO: 6的約411位和450位之間的終止位點。含 有OrfC-DHl結(jié)構(gòu)域的氨基酸序列本文表示為SEQ ID NO: 28(SEQ ID NO: 6 的1-450位)。
根據(jù)本發(fā)明,該結(jié)構(gòu)域具有FabA-樣P-羥酰-ACP脫水酶(DH)的生物活 性。術(shù)語"FabA-樣p-羥酰-ACP脫水酶"與術(shù)語"FabA-樣(3-羥基?;?ACP 脫水酶"、"j3-羥酰-ACP脫水酶"、"脫水酶"以及類似衍生詞可以交換使用。 PUFA PKS系統(tǒng)中兩個DH結(jié)構(gòu)域的特征(DH2見下文)已經(jīng)在前面部分中描 述。這類酶從(3-酮脂酰-ACP去掉HOH并在碳鏈中留下反式雙鍵。PUFA PKS 系統(tǒng)的DH結(jié)構(gòu)域與細(xì)菌FAS系統(tǒng)相關(guān)性DH酶(而不是其它PKS系統(tǒng)的 DH結(jié)構(gòu)域)同源。細(xì)菌DH的一個亞型,即FabA-樣DH,具有順反異構(gòu)酶 活性(Heathetal., J. Biol. Chem., 271, 27795(1996)。它與FabA-樣DH具有 同源性表明 一個或者兩個DH結(jié)構(gòu)域負(fù)責(zé)在PUFA PKS產(chǎn)物中插入順式雙 鍵。
OrfC的第二個結(jié)構(gòu)域是DH結(jié)構(gòu)域,本文也稱為OrfC-DH2。它是OrfC 兩個DH結(jié)構(gòu)域的第二個,因此命名為DH2。該結(jié)構(gòu)域包含在從SEQ ID NO: 5(OrfC)的約1351位和2437位之間的起始位點到SEQ ID NO: 5的約2607 位和2850之間的終止位點的核普酸序列內(nèi)。含有OrfC-DH2結(jié)構(gòu)域編碼序 列的核苷酸序列本文表示為SEQ ID NO: 29(SEQIDNO: 5的1351-2850位)。 含有DH2結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 6(OrfC)的約451位和813 之間的起始位點到SEQ ID NO: 6的約869位和950位之間的終止位點。含 有OrfC-DH2結(jié)構(gòu)域的氨基酸序列本文表示為SEQ ID NO: 30(SEQ ID NO: 6
的451-950位)。DH的生物學(xué)活性已在上文中描迷。
OrfC的第三個結(jié)構(gòu)域是ER結(jié)構(gòu)域,本文也稱為OrfC- ER。該結(jié)構(gòu)域 包含在從SEQ ID NO: 5(OrfC)的約2998位的起始位點到SEQ ID NO: 5的約 4509位的終止位點的核香酸序列內(nèi)。含有OrfC-ER結(jié)構(gòu)域編碼序列的核苦 酸序列本文表示為SEQ ID NO: 31 (SEQ ID NO: 5的2998-4509位)。含有ER 結(jié)構(gòu)域的氨基酸序列是從SEQ ID NO: 6(OrfC)的約1000位的起始位點到 SEQ ID NO: 6的約1502位的終止位點。含有OrfC-ER結(jié)構(gòu)域的氨基酸序列 本文表示為SEQ ID NO: 32(SEQ ID NO: 6的1000-1502位)。ER的生物學(xué)活 性已在上文中描述。
破囊壺菌23B PUFAPKS Th. 23B開放閱讀框A(OrfA):
Th. 23B OrfA的完整核苷酸序列在本文中表示為SEQ ID NO: 38。 SEQ ID NO: 38編碼Th. 23B OrfA中的下列結(jié)構(gòu)域(a)—個卩-酮脂酰-ACP合酶 (KS)結(jié)構(gòu)域;(b)—個丙二酰-CoA:ACP?;D(zhuǎn)移酶(MAT)結(jié)構(gòu)域;(c)8個酰 基載體蛋白(ACP))構(gòu)域;和(d)—個p-酮脂酰-ACP還原酶(KR)結(jié)構(gòu)域。該結(jié) 構(gòu)域的組織與Schizochytrium OrfA(SEQ ID NO:l)中的相同,除了 Th. 23B OrfA有8個毗連的ACP結(jié)構(gòu)域,而Schizochytrium OrfA有9個毗連的ACP 結(jié)構(gòu)域。Th. 23B OrfA是8433個核苷酸的序歹'j(不包括終止密碼子),它編 碼本文表示為SEQ ID NO: 39的2811個氨基酸的序列。Th. 23B OrfA的氨 基酸序列(SEQ ID NO: 39)與已知序列在標(biāo)準(zhǔn)BLAST 4全索中進行比較 (BLAST參數(shù)Blastp, low complexity filter Off, program-BLOSUM62 , Gap cost-Existence: 11, Extension 1; (Altschul, S. F. , Madden, T. L., Schaaffer, A. A., Zhang,丄,Zhang, Z. , Miller, W. & Lipman, D. J.(1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25: 3389-3402所述的BLAST,全文內(nèi)容包含在此作為參考)))。 在氨基酸水平與Th. 23B OrfA同源程度最高的序列是Schizochytrium Orf A(gbAAK72879.1)(SEQ ID NO: 2)。所述比對延伸至全部查詢但斷成2片(由 于ACP重復(fù)的數(shù)量不同)。SEQ ID NO: 39首先在6至1985位(包括8個ACP 結(jié)構(gòu)域)與SEQ ID NO:2比對,并且與SEQ ID NO:2的序列同 一性是2017 個氨基酸中有54。/。相同。SEQIDNO: 39還在980至2811位與SEQ ID NO:2
比對,并且與SEQIDNO:2的序列同一性是1861個氨基酸中有43%相同。 在第二組比對中,Th.23B 8XACPs在保守泛酰巰基乙胺附著位點基序的區(qū) 域內(nèi)的匹配是明顯的,但在SchizochytHum第一個ACP結(jié)構(gòu)域的匹配非常 弱(即Th.23B查詢序列沒有第9個ACP結(jié)構(gòu)域,但Blastp輸出在這些條件 下試圖無論如何比對它們)。SEQ ID NO:39顯示出與來自Shewanella oneidensis(登錄號NP一717214)和Photobacter profundum(登錄號AAL01060) 的序列的次最接近同一性。
Th.23B OrfA的第 一個結(jié)構(gòu)域是KS結(jié)構(gòu)域,本文也稱為Th.23B OrfA-KS。 KS結(jié)構(gòu)域的功能在上文詳細(xì)描述了。該結(jié)構(gòu)域包含在從SEQ ID NO:38的約1位至約1500位的核香酸序列內(nèi),本文表示為SEQIDNO:40。 含有Th.23B KS結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 39中從約1位至約500 位的區(qū)域,本文表示為SEQ ID NO: 41。 SEQ ID NO: 39的這一區(qū)域與SEQ ID NO: 39中從1位至約450位(也是SEQ ID NO: 41的1位至約450位)的 FabB((3-酮脂酰-ACP合酶)具有Pfam匹配。應(yīng)注意Th.23B OrfA-KS結(jié)構(gòu)域 含有活性位點基序DXAC^r?;Y(jié)合位點C2Q7)。 Th.23B KS區(qū)域末端的 特征基序GFGG位于SEQ ID NO: 39的453-456位(也是SEQ ID NO: 41的 453-456位)。跨越SEQ ID NO: 39中1-500位的氨基酸序列與Schizochytrium OrfA(SEQ ID NO: 2)在496個氨基酸中約有79 %相同。跨越SEQ ID NO: 39 中1-450位的氨基酸序列與Schizochytrium OrfA(SEQ ID NO: 2)在446個氨 基酸中約有81%相同。
Th.23B OrfA的第二個結(jié)構(gòu)域是MAT結(jié)構(gòu)域,本文也稱為Th.23B OrfA-MAT。 MAT結(jié)構(gòu)域的功能在上文詳細(xì)描迷了 。該結(jié)構(gòu)域包含在從SEQ ID NO: 38的約1503位至約3000位的核苷酸序列內(nèi),本文表示為SEQ ID NO: 42。含有Th.23B MAT結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 39中從約501位 至約1000位的區(qū)域,本文表示為SEQIDNO: 43。 SEQ ID NO: 39的這一 區(qū) 域與SEQ ID NO: 39中從約580位至約900位(SEQ ID NO: 43的80-400位) 的FabD(丙二酰CoA:ACP?;D(zhuǎn)移酶)具有Pfam匹配。應(yīng)注意Th.23B OrfA-MAT結(jié)構(gòu)域含有活性位點基序01^*乂0(*?;Y(jié)合位點S697),以SEQ ID NO: 39的695-699位表示??缭絊EQ ID NO: 39中501-1000位的氨基酸 序列與Schizochytrium OrfA(SEQ ID NO: 2)在481個氨基酸中約有46%相 同??缭絊EQ ID NO: 39中580-900位的氨基酸序列與Schizochytrium
OrfA(SEQ ID NO: 2)在333個氨基酸中約有50 %相同。
Th.23B OrfA的第3-10個結(jié)構(gòu)域是8個串連的ACP結(jié)構(gòu)域,本文也稱 為Th.23B OrfA-ACP(:該序列中第 一個結(jié)構(gòu)域是OrfA-ACPl.第二個結(jié)構(gòu)域 是OrfA-ACP2,第三個結(jié)構(gòu)域是OrfA-ACP3,等等)。ACP結(jié)構(gòu)域的功能在 上文詳細(xì)描述了。第一個Th.23BACP結(jié)構(gòu)域,Th.23BOrfA-ACPl,包含在 從SEQ ID NO: 38(OrfA)的約3205位至約3555位的核苷酸序列內(nèi),本文表 示為SEQ ID NO: 44。含有第一個Th.23B ACP結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 39中從約1069位至約1185位的區(qū)域,本文表示為SEQ ID NO: 45。 跨越SEQ ID NO: 39中1069-1185位的氨基酸序列與Schizochytrium OrfA(SEQ ID NO: 2)在85個氨基酸中約有65 %相同。Th.23B OrfA-ACPl與 Schizochytrium OrfA中9個ACP結(jié)構(gòu)域的任意一個具有相似的同 一性。
Th. 23B OrfA的8個ACP結(jié)構(gòu)域彼此毗鄰并可通過存在磷酸泛酰巰基 乙胺結(jié)合位點基序LGXDS^(以SEQIDNO:46表示)而鑒別,其中S申是磷酸 泛酰巰基乙胺附著位點。參照SEQ ID NO: 39, 8個SM立點中每一個的氨基 酸位置是1128(ACP1), 1244(ACP2), 1360(ACP3), 1476(ACP4), 1592(ACP5), 1708(ACP6), 1824(ACP7)和1940(ACP8)。所有8個Th.23B ACP結(jié)構(gòu)域的 核苷酸序列和氨基酸序列高度保守,因此每個結(jié)構(gòu)域的序列在本文中沒有 用單獨的序列標(biāo)識符表示。然而,根據(jù)本文公開的信息,本領(lǐng)域技術(shù)人員 可以容易地測定含有SEQ ID NO: 38和SEQ ID NO: 39的其它7個ACP結(jié) 構(gòu)域中每個結(jié)構(gòu)域的序列。
所有8個Th.23B ACP結(jié)構(gòu)域一起覆蓋從SEQ ID NO: 38的約3205位到 約5994位的Th.23B OrfA,它對應(yīng)于SEQ ID NO: 39從約1069位到約1998 位的氨基酸位置。含有所有8個結(jié)構(gòu)域的全部ACP區(qū)域的核苷酸序列在本 文中表示為SEQ ID NO: 47。 SEQ ID NO: 47編碼表示為SEQ ID NO: 48的 氨基酸序列。SEQ ID NO: 48包括各個ACP結(jié)構(gòu)域之間的接頭片段。8個結(jié) 構(gòu)域的重復(fù)間隔是SEQ ID NO: 48的約每116個氨基酸,并認(rèn)為每個結(jié)構(gòu)域 由以活性位點基序(如上所述)為中心的約116個氨基酸組成。應(yīng)注意 Schizochytrium OrfA的9個毗鄰ACP結(jié)構(gòu)域之間的連接區(qū)域富含脯氨酸和 丙氨酸殘基,而破嚢壺菌屬OrfA中的8個毗鄰ACP結(jié)構(gòu)域之間的連接區(qū) 域富含絲氨酸殘基(沒有脯氨酸或丙氨酸殘基)。
Th.23B OrfA的最后一個結(jié)構(gòu)域是KR結(jié)構(gòu)域,本文也稱為Th.23B
OrfA-KR。 KR結(jié)構(gòu)域的功能在上文詳細(xì)描述了。該結(jié)構(gòu)域包含在從SEQ ID NO: 38的約6001位至約8433位的核苷酸序列內(nèi),本文表示為SEQ ID NO: 49。含有Th.23B KR結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 39中從約2001位 至約2811位的區(qū)域,本文表示為SEQIDNO: 50。 SEQ ID NO: 39的這一區(qū) 域與SEQ ID NO: 39中從約2300位至約2550位(SEQ ID NO: 50的300-550 位)的FabG((3-酮脂酰-ACP還原酶)具有Pfam匹配。跨越SEQ ID NO: 39中 2001-2811位的氨基酸序列與SchizochytriumOrfA(SEQ ID NO: 2)在831個氨 基酸中約有40%相同。跨越SEQ ID NO: 39中2300-2550位的氨基酸序列與 Schizochytrium OrfA(SEQ ID NO: 2)在235個氨基酸中約有51 %相同。 Th. 23B開放閱讀框B(Orffl):
Th.23B Orffi的完整核香酸序列在本文中表示為SEQ ID NO: 51。 SEQ ID NO: 51編碼Th.23B Orffi中的下列結(jié)構(gòu)域(a)—個卩-酮脂酰-ACP合酶 (KS)結(jié)構(gòu)域;(b)—個鏈長因子(CLF)結(jié)構(gòu)域;(c)一個酰基轉(zhuǎn)移酶(AT)結(jié)構(gòu)域; 和(d)—個烯酰-ACP還原酶(ER))結(jié)構(gòu)域。該結(jié)構(gòu)域的組織與Schizochytrium Orffi(SEQ ID NO:3)中的相同,只是Schizochytrium蛋白AT和ER結(jié)構(gòu)域之 間的連接區(qū)域比Th.23B的長大約50-60個氨基酸。Schizochytrium的這個連 接區(qū)域具有富含絲氨酸殘基的特定區(qū)域(除了區(qū)域中的其它絲氨酸,它含有 15個毗鄰的絲氨酸殘基),而Th.23B Orffi的相應(yīng)連接區(qū)域不富含絲氨酸殘 基。AT/ER連接區(qū)域中的這種不同很可能是由于Schizochytrium Orffi和 Th.23B Orffi在該區(qū)域起始處的比對中的斷裂。
Th.23B Orffi是5805個核苷酸的序列(不包括終止密碼子),它編碼本文 表示為SEQ ID NO: 52的1935個氨基酸的序列。Th. 23B Orffi的氨基酸序 列(SEQ ID NO: 52)與已知序列在標(biāo)準(zhǔn)BLAST檢索中進行比較(BLAST參 數(shù) Blastp, low complexity filter Off , program-BLOSUM62 , Gap cost陽Existence:ll, Extension 1; (Altschul, S. F. , Madden, T. L., SchS汪ffer, A. A., Zhang, J. , Zhang, Z. , Miller, W. & Lipman, D. J.(1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25: 3389-3402所述的BLAST,全文包含在此作為參考)))。在氨 基酸水平,在大部分Orffi區(qū)域與Th. 23B Orffi同源程度最高的序列是 Schizochytrium OrfB(gb AAK72880.1)(SEQ ID NO: 4),在最后一個區(qū)域與Th. 23B Orffi同源程度最高的序列是Schizochytrium OrfC(gb AAK72881.1)(SEQID NO: 6)(如上所述比對斷成2片)。SEQ ID NO: 52首先在10至約1479位(包 括KS、 CLF和AT結(jié)構(gòu)域)與SEQ ID NO:4比對,并且與SEQ ID NO:4的序 列同一性是1483個氨基酸中有52%相同。SEQ ID NO: 52還在1491至1935 位(包括ER結(jié)構(gòu)域)與SEQ ID NO: 4比對,并且與SEQ ID NO: 4的序列同 一性是448個氨基酸中有64%相同。
Th.23B Orffi的第一個結(jié)構(gòu)域是KS結(jié)構(gòu)域,本文也稱為Th.23B Orffi-KS。 KS結(jié)構(gòu)域的功能在上文詳細(xì)描述了。該結(jié)構(gòu)域包含在從SEQID NO: 51(Th.23B Orffl)的約1位至約1500位的核苷酸序列內(nèi),本文表示為SEQ ID NO: 53。含有Th.23B KS結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 52中從約1 位至約500位的區(qū)域,本文表示為SEQ ID NO: 54。 SEQ ID NO: 52的這一 區(qū)域與FabB((3-酮脂酰-ACP合酶)從1位至約450位(SEQ ID NO: 54的1-450 位)具有Pfam匹配。應(yīng)注意Th.23B Orffi-KS結(jié)構(gòu)域含有一個活性位點基序 DXAC*,其中C^是?;街稽c并且(:*是SEQ ID NO: 52的201位。KS 區(qū)域末端的特征基序GFGG位于SEQ ID NO: 52的434-437位。跨越SEQ ID NO: 52中1-500位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在 500個氨基酸中約有64 %相同。跨越SEQ ID NO: 52中1-450位的氨基酸序 列與Schizochytrium Orffi(SEQ ID NO: 4)在442個氨基酸中約有67 %相同。
Th.23B Orffi的第二個結(jié)構(gòu)域是CLF結(jié)構(gòu)域,本文也稱為Th.23B Orffi-CLF。CLF結(jié)構(gòu)域的功能在上文詳細(xì)描述了 。該結(jié)構(gòu)域包含在從SEQ ID NO: 51(Orffi)的約1501位至約3000位的核苦酸序列內(nèi),本文表示為SEQ ID NO: 55。含有CLF結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 52中從約501位至 約1000位的區(qū)域,本文表示為SEQIDNO: 56。 SEQ ID NO: 52的這一 區(qū)域 與FabB((3-酮脂酰-ACP合酶)從約550位至約910位(SEQ ID NO: 56的50-410 位)具有Pfam匹配。雖然CLF與KS同源,但它缺少KS蛋白中附著?;?團的活性位點半胱氨酸??缭絊EQ ID NO: 52中501-1000位的氨基酸序列 與SchizochytriumOrffi(SEQIDNO:4)在517個氨基酸中約有49。/。相同。5, 越SEQ ID NO: 52中550-910位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在360個氨基酸中約有54 %相同。
TL23B Orffi的第三個結(jié)構(gòu)域是AT結(jié)構(gòu)域,本文也稱為Th.23B Orffi-AT。 AT結(jié)構(gòu)域的功能在上文詳細(xì)描述了 。該結(jié)構(gòu)域包含在從SEQ ID NO: 51(Th.23B Orffi)的約3001位至約4500位的核普酸序列內(nèi),本文表示為
SEQ ID NO: 58。含有Th.23B AT結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 52中 從約1001位至約1500位的區(qū)域,本文表示為SEQ ID NO: 58。 SEQ ID NO: 52的這一區(qū)域與FabD(丙二酰CoA:ACP酰基轉(zhuǎn)移酶)從約1100位至約1375 位(SEQ ID NO: 58的100-375位)具有Pfam匹配。雖然PUFA合酶的這個AT 結(jié)構(gòu)域與MAT蛋白同源,但它缺少MAT的延長的基序(關(guān)鍵精氨酸和谷氨 酰胺殘基),并且認(rèn)為它不參與丙二酰-CoA轉(zhuǎn)移。存在?;D(zhuǎn)移酶的 GXS*XG基序,其中8*是酰基附著位點且位于SEQIDNO: 52的1123位。 跨越SEQ ID NO: 52中1001-1500位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在459個氨基酸中約有44 %相同??缭絊EQ ID NO: 52 中1100-1375位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在283 個氨基酸中約有45%相同。
Th.23B Orffi的第四個結(jié)構(gòu)域是ER結(jié)構(gòu)域,本文也稱為Th.23B Orffi-ER。 ER結(jié)構(gòu)域的功能在上文詳細(xì)描述了 。該結(jié)構(gòu)域包含在從SEQ ID NO: 51(Orffi)的約4501位至約5805位的核香酸序列內(nèi),本文表示為SEQ ID NO: 59。含有Th.23B ER結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 52中從約1501 位至約1935位的區(qū)域,本文表示為SEQ ID NO: 60。 SEQ ID NO: 52的這一 區(qū)域與2-硝基丙烷二氧化酶相關(guān)的二氧化酶家族從約1501位至約1810位 (SEQ ID NO: 60的l-310位)具有Pfam匹配。由于與從肺炎鏈球菌新鑒別的 ER酶同源,可以進一步預(yù)計這個結(jié)構(gòu)域發(fā)揮ER的功能。跨越SEQ ID NO: 52中1501-1935位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在 433個氨基酸中約有66%相同??缭絊EQ ID NO: 52中1501-1810位的氨基 酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在305個氨基酸中約有70 %相 同。
Th.23B開放閱讀框C(OrfC):
Th.23B OrfC的完整核苦酸序列在本文中表示為SEQ ID NO: 6]。 SEQ ID NO: 61編碼Th.23B OrfC中的下列結(jié)構(gòu)域(a)兩個FabA樣-(3-羥酰-ACP 脫水酶(DH)結(jié)構(gòu)域,都與FabA蛋白同源(催化合成反式-2-癸烯酰 (decenoyl)-ACP并催化該產(chǎn)物可逆異構(gòu)化形成順式-3-癸烯酰-ACP的酶);(b) 一個與Schizochytrium Orffi的ER結(jié)構(gòu)域高度同源的烯酰-ACP還原酶(ER) 結(jié)構(gòu)域。該結(jié)構(gòu)域的組織與Schizochytrium OrfC(SEQ ID NO: 5)中的相同。
Th.23B OrfC是4410個核芬酸的序列(不包括終止密碼子),它編碼本文 表示為SEQ ID NO: 62的1470個氨基酸的序列。Th. 23B OrfC的氨基酸序 列(SEQ ID NO: 62)與已知序列在標(biāo)準(zhǔn)BLAST檢索中進行比較(BLAST參 數(shù): Blastp, low complexity filter Off , program-BLOS.UM62 , Gap cost-Existence: :11, Extension :1; (Altschul, S. F. , Madden, T. L.., Sch貼ffer, A. A., Zhang, J. , Zhang, Z. , Miller, W. & Lipn肌D. J.U997) "Gapped BLAST and PS.I-BLAST: a new generation of protein database search programs," .Nucleic. AcidsRes, 25: 3389-3402所述的BLAST,整體結(jié)合與此作為參考))。在氨基 酸水平與Th. 23B OrfC同源程度最高的序列是Schizochytrium OrfC(gb AAK72881.1)(SEQ ID NO: 6)。 SEQ ID NO: 52與Schizochytrium OrfC(SEQ ID NO: 6)有66 %相同。
Th.23B OrfC的第一個結(jié)構(gòu)域是DH結(jié)構(gòu)域,本文也稱為Th.23B OrfC-DHl。DH結(jié)構(gòu)域的功能在上文詳細(xì)描述了 。該結(jié)構(gòu)域包含在從SEQ ID NO: 61(OrfC)的約l位至約500位的核苷酸序列內(nèi),本文表示為SEQ ID NO: 63。含有Th.23BDHl結(jié)構(gòu)域的氨基酸序列是SEQ ID NO: 62的從約1位至 約500位的區(qū)域,本文表示為SEQ ID NO: 64。 SEQ ID NO: 62的這一區(qū)域 與如上所述FabA的275位至約400位(SEQ ID NO: 64的275-400位)具有 Pfam匹配??缭絊EQ ID NO: 62中1-500位的氨基酸序列與Schizochytrium OrfC(SEQ ID NO: 6)在526個氨基酸中約有66 %相同??缭絊EQ ID NO: 62 中275-400位的氨基酸序列與Schizochytrium OrfC(SEQ ID NO: 6)在126個 氨基酸中約有81%相同。
Th.23B OrfC的第二個結(jié)構(gòu)域也是DH結(jié)構(gòu)域,本文也稱為Th.23B OrfC-DH2。它是OrfC中兩個DH結(jié)構(gòu)域中的第二個,因此命名為DH2。該 結(jié)構(gòu)域包含在從SEQ ID NO: 61(OrfC)的約1501位至約3000位的核苷酸序 列內(nèi),本文表示為SEQ ID NO: 65。含有Th.23B DH2結(jié)構(gòu)域的氨基酸序列 是SEQ ID NO: 62中從約501位至約1000位的區(qū)域,本文表示為SEQ ID NO: 66。 SEQ ID NO: 62的這一 區(qū)域與如上所述FabA的約800位至約925位(SEQ ID NO: 66的300-425位)具有Pfam匹配??缭絊EQ ID NO: 62中501-1000 位的氨基酸序列與Schizochytrium OrfC(SEQ ID NO: 6)在518個氨基酸中約 有56%相同??缭絊EQ ID NO: 62中800-925位的氨基酸序列與 Schizochytrium OrfC(SEQ ID NO: 6)在124個氨基酸中約有58 %相同。Th.23B OrfC的第三個結(jié)構(gòu)域是ER結(jié)構(gòu)域,本文也稱為Th.23B OrfC-ER。 ER結(jié)構(gòu)域的功能在上文詳細(xì)描述了 。該結(jié)構(gòu)域包含在從SEQ ID NO: 61(OrfC)的約3001位至約4410位的核芬酸序列內(nèi),本文表示為SEQ ID NO: 67。含有Th.23BER結(jié)構(gòu)域的氨基酸序列是SEQIDNO: 62中從約1001 位至約1470位的區(qū)域,本文表示為SEQ IDNO: 68。 SEQ ID NO: 62的這一 區(qū)域與如上所述的2-硝基丙烷二氧化酶相關(guān)的二氧化酶從約1025位至約 1320位(SEQ ID NO: 68的25-320位)具有Pfam匹配。由于與從肺炎鏈球菌 新鑒別的ER酶同源,可以進一步估計這個結(jié)構(gòu)域發(fā)揮ER酶的功能。跨越 SEQ ID NO: 62中1001-1470位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在474個氨基酸中約有75 °/。相同??缭絊EQ ID NO: 62中1025-1320 位的氨基酸序列與Schizochytrium Orffi(SEQ ID NO: 4)在296個氨基酸中約 有81 %相同。
本發(fā)明一個實施方案涉及來自非細(xì)菌PUFAPKS系統(tǒng)的分離蛋白或結(jié)構(gòu) 域,其同系物和/或其片段。發(fā)明還包括編碼本文所述任意蛋白、結(jié)構(gòu)域或 肽的分離核酸分子(在下文詳細(xì)討論)。根據(jù)本發(fā)明,分離的蛋白或肽,如來 自PUFA PKS系統(tǒng)的蛋白或肽是已經(jīng)從其天然環(huán)境移去的(即對其進行了人 工操作)的蛋白或其片段(包括多肽和肽),并且可以包括例如純化的蛋白、 部分純化的蛋白、重組產(chǎn)生的蛋白和合成產(chǎn)生的蛋白。因而,"分離"不反 映蛋白純化的程度。優(yōu)選本發(fā)明的分離蛋白是重組產(chǎn)生的。分離的肽可以 通過合成產(chǎn)生(例如化學(xué)合成,如通過肽合成)或重組產(chǎn)生。此外并通過舉例 的方式,"破嚢壺菌屬PUFAPKS蛋白"指來自破嚢壺菌屬微生物的PUFA PKS蛋白(通常包括天然PUFAPKS蛋白的同系物),或根據(jù)對來自破嚢壺菌屬 的天然PUFA PKS蛋白的結(jié)構(gòu)(例如序列),也許是對功能的認(rèn)知而產(chǎn)生的 PUFAPKS蛋白。換句話說,通常所指的破嚢壺菌屬PUFAPKS蛋白包括與破 嚢壺菌屬的天然PUFA PKS蛋白的結(jié)構(gòu)和功能基本相似的任何PUFA PKS蛋 白,或者是如本文詳細(xì)描述的來自破嚢壺菌屬的天然PUFA PKS蛋白的生物 學(xué)活性(即具有生物學(xué)活性)同系物。因此,破嚢壺菌屬PUFA PKS蛋白可以 包括純化的、部分純化的、重組的、突變的/修飾的和合成的蛋白。相同描 述可以應(yīng)用于本文所述的其他蛋白或肽,如來自Schizochytrium或來自其他 微生物的PUFA PKS蛋白和結(jié)構(gòu)域。
根據(jù)本發(fā)明,術(shù)語"修飾"和"突變"可以交換使用,特別是關(guān)于本
文所述蛋白或肽(或核酸序列)一級氨基酸序列的修飾/突變。術(shù)語"修飾,, 還可以用來描述蛋白或肽的翻譯后修飾,包括但不限于,曱基化、法呢基
化(famesylation)、羧甲基化、香葉基化、糖基化、磷酸化、乙?;⒍罐Ⅴ?化、異戊烯化、棕櫚酸化和/或酰胺化。修飾還可包括,例如蛋白或肽與另 一化合物的絡(luò)合。例如如果修飾不同于天然、野生型蛋白或肽中發(fā)生的翻 譯后修飾,可以認(rèn)為這種修飾是突變。
本文所用的術(shù)語"同系物"用于指一種蛋白或肽,它由于對天然蛋白 或肽的一種或多種較小的修飾或突變從而不同于天然蛋白或肽(即"原型" 或"野生型"蛋白),但保持天然形式的全部基本蛋白和側(cè)鏈結(jié)構(gòu)(即因為與 野生型蛋白相關(guān),因此同系物是可識別的)。這種變化包括,但不限于一 個或一些氨基酸側(cè)鏈的變化; 一個或一些氨基酸的變化,包括缺失(例如蛋 白或肽的截短形式)、插入和/或取代; 一個或一些原子立體化學(xué)方面的改變; 和/或較小的衍生化作用,包括但不限于曱基化、法呢基化、香葉基化 (geranylgeranylation)、糖基化、羧曱基化、磷酸化、乙?;?、豆蔻酰化、異 戊烯化、棕櫚酸化和/或酰胺化。與天然蛋白或肽相比較,同系物可以具有 增強、降低或基本類似的特性。PUFAPKS蛋白或結(jié)構(gòu)域的優(yōu)選同系物在下 文詳細(xì)描述。應(yīng)注意同系物可以包括合成產(chǎn)生的同系物,給定蛋白或結(jié)構(gòu) 域的天然等位變體,或來自獲得參照序列的生物體之外的生物體的同源序 列。
保守取代一般包括在下列基團的取代甘氨酸和丙氨酸;纈氨酸、異 亮氨酸和亮氨酸;天冬氨酸、谷氨酸、天冬酰胺和谷氨酰胺;絲氨酸和蘇 氨酸;賴氨酸和精氨酸;以及苯丙氨酸和酪氨酸。取代還可根據(jù)保守疏水 性或親水性進行(Kyte和Doolittle, J. Mol. Bio1.(1982)157 : 105-132),或根據(jù) 設(shè)想類似多肽二級結(jié)構(gòu)的能力進行(Chou和Fasman, Adv. Enzymol.( 1978)47: 45-148, 1978)。
同系物可以是天然等位基因變異或天然突變的結(jié)果。編碼蛋白的核酸 的天然等位變體是一種基因,它存在于基因組中與編碼這種蛋白的基因基 本相同的基因座(或位置),但由于例如突變或重組引起的天然變異,它具有 相似的而不是相同的序列。等位變體 一般編碼與和它進行比較的基因編碼 的蛋白活性類似的蛋白。 一種類型的等位變體可以編碼由于遺傳密碼筒并 性具有不同核酸序列的相同的蛋白。等位變體還可以包括基因5'或3'非翻譯
區(qū)(例如在調(diào)節(jié)控制區(qū)域)的改變。等位變體是本領(lǐng)域技術(shù)人員公知的。
同系物可用本領(lǐng)域已知的蛋白生產(chǎn)技術(shù)生產(chǎn),包括但不限于,直接修
飾分離的天然蛋白,直接合成蛋白,或用例如經(jīng)典的或重組DNA技術(shù)影響 隨機突變或定點突變從而修飾編碼蛋白的核酸序列。
與野生型蛋白相比較,蛋白同系物中的修飾或突變提高、降低或基本 不改變同系物與天然(野生型)蛋白相比較的基本生物學(xué)活性。通常,蛋白的 生物學(xué)活性或生物學(xué)作用是指蛋白顯示或執(zhí)行的任意功能,所述功能是在 體內(nèi)(即在蛋白的天然生理環(huán)境)或體外(即在實驗室的條件下)測量或觀察到 的該蛋白天然形式的功能。PUFA PKS系統(tǒng)的生物學(xué)活性和組成PUFA PKS 系統(tǒng)的各個蛋白/結(jié)構(gòu)域在本文其它部分已經(jīng)詳細(xì)描述了。蛋白的修飾,如 同系物或模擬物中的修飾(下文討論),可以產(chǎn)生生物學(xué)活性與天然蛋白相同 的蛋白,或產(chǎn)生與天然蛋白相比較生物學(xué)活性降低或提高的蛋白。引起蛋 白表達降低或蛋白活性降低的修飾可以稱作蛋白失活(完全或部分失活),下 調(diào)或功能(或活性)降低。類似地,引起蛋白表達增加或蛋白活性增加的修飾 可以稱作蛋白擴增、超量產(chǎn)生、激活、增強、上調(diào)或功能(或活性)提高。應(yīng) 注意通常所指的具有野生型蛋白生物學(xué)活性的同系物未必指該同系物與野 生型蛋白的生物學(xué)活性相同,具體是關(guān)于生物學(xué)活性水平方面。相反地, 同系物可以執(zhí)行與野生型蛋白相同的生物學(xué)活性,但是在與野生型蛋白相 比降低或提高的活性水平。PUFA PKS系統(tǒng)的功能域是能夠執(zhí)行生物學(xué)功能 (即具有生物學(xué)活性)的結(jié)構(gòu)域(即結(jié)構(gòu)域可以是蛋白的一部分)。
檢測和測量PUFA PKS蛋白或結(jié)構(gòu)域生物學(xué)活性的方法包括,但不限于, 測量PUFA PKS蛋白或結(jié)構(gòu)域的轉(zhuǎn)錄,測量PUFA PKS蛋白或結(jié)構(gòu)域的翻譯, 測量PUFAPKS蛋白或結(jié)構(gòu)域的翻譯后修飾,測量PUFAPKS蛋白或結(jié)構(gòu)域的 酶活性,和/或測量PUFA PKS系統(tǒng)一種或多種產(chǎn)物的產(chǎn)生(例如PUFA產(chǎn)生)。 應(yīng)注意沒有要求本發(fā)明的分離蛋白(包括同系物)必須具有野生型蛋白的生 物學(xué)活性。例如PUFAPKS蛋白或結(jié)構(gòu)域可以是截短的、突變的或失活的蛋 白。這種蛋白例如用于篩選試驗,或用于其他目的,如產(chǎn)生抗體。在一個 優(yōu)選實施方案中,本發(fā)明的分離蛋白具有與野生型蛋白類似的生物學(xué)活性 (雖然如上所述不必相等)。
測量蛋白表達水平的方法通常包括,但不限于Western印跡,免疫印 跡,酶聯(lián)免疫吸附試驗(ELISA),放射免疫測定(RIA),免疫沉淀,表面細(xì)質(zhì)
團共振(surface plasmon resonance), 化學(xué)發(fā)光,熒光偏振,磷光現(xiàn)象,免疫 組織化學(xué)分析,基質(zhì)-輔助激光解吸/飛行電離時間(MALDI-TOF)質(zhì)譜測定 法,微細(xì)胞計量,微陣列,顯微鏡檢查法,熒光激活細(xì)胞分選(FACS)和流 式細(xì)胞計數(shù),以及根據(jù)蛋白特性的試驗,所述特性包括但不限于酶活性或 與其他蛋白伙伴(partner)的相互作用。結(jié)合試驗是本領(lǐng)域公知的。例如 BIAcore機器可用于測定兩個蛋白的絡(luò)合物的結(jié)合常數(shù)。通過監(jiān)測當(dāng)緩沖液 流過芯片時,折射率相對時間的變化可以測定絡(luò)合物的解離常數(shù) (O'Sha誕ssy et al. Anal.Biochem. 212 :457-468(1993); Schuster et al., Nature 365 :343-347(1993)。測量一種蛋白與另 一種蛋白結(jié)合的其他合適的試驗包 括,例如免疫測定諸如酶聯(lián)免疫吸附試驗(ELISA)和放射免疫測定(RJA);或 通過監(jiān)測蛋白的焚光、UV吸收、循環(huán)二色性(circular dichrosim)或核磁共振 (NMR)的光譜學(xué)或光學(xué)性質(zhì)的變化從而測定結(jié)合。
本發(fā)明的一個實施方案涉及分離的蛋白,含有選自如下的氨基酸序列 (a)選自SEQIDNO:39, SEQIDNO:52, SEQ ID NO: 62組成的組的氨基酸 序列及其生物學(xué)活性片段;(b)選自SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ 66, SEQ ID NO: 68 組成的組的氨基酸序列及其生物學(xué)活性片段;(c)與(a)所述氨基酸序列的至 少500個連續(xù)氨基酸至少約60%相同的氨基酸序列,其中所述氨基酸序列 具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少一個結(jié)構(gòu)域 的生物學(xué)活性;和/或(d)與(b)所述氨基酸序列至少約60%相同的氨基酸序 列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS) 系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。在另一實施方案中,所述氨基酸序 列包括本發(fā)明所包括的數(shù)個PUFA PKS結(jié)構(gòu)域的上述活性位點結(jié)構(gòu)域或其 它功能基序。在一個實施方案中,上述氨基酸序列不包括下列氨基酸序歹寸 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 , SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32。
在本發(fā)明的一個方面,本發(fā)明包含的PUFAPKS蛋白質(zhì)或結(jié)構(gòu)域,包括 本文所述的具體PUFAPKS蛋白質(zhì)或結(jié)構(gòu)域的同系物,含有與選自SEQ ID NO: 39, SEQ ID NO: 52或SEQ ID NO: 62的氨基酸序列的至少500個連續(xù)
氨基酸至少約60 %相同的氨基酸序列;其中所述氨基酸序列具有PUFA PKS 系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。在另一方面,所述蛋白的氨基酸序 列與SEQ ID NO: 39, SEQ ID NO: 52或SEQ ID NO: 62中任一個的至少約 600個連續(xù)氨基酸,更優(yōu)選至少約700個連續(xù)氨基酸,更優(yōu)選至少約800個 連續(xù)氨基酸,更優(yōu)選至少約900個連續(xù)氨基酸,更優(yōu)選至少約1000個連續(xù) 氨基酸,更優(yōu)選至少約1100個連續(xù)氨基酸,更優(yōu)選至少約1200個連續(xù)氨 基酸,更優(yōu)選至少約1300個連續(xù)氨基酸,更優(yōu)選至少約1400個連續(xù)氨基 酸,或與全長SEQ ID NO: 62至少約60%相同。另一方面,所述蛋白的氨 基酸序列與SEQ ID NO: 39或SEQ ID NO: 52中任一個的至少約1500個連 續(xù)氨基酸,更優(yōu)選至少約1600個連續(xù)氨基酸,更優(yōu)選至少約1700個連續(xù) 氨基酸,更優(yōu)選至少約1800個連續(xù)氨基酸,更優(yōu)選至少約l卯0個連續(xù)氨 基酸,或與全長SEQ ID NO: 52至少約60%相同。另一方面,所述蛋白的 氨基酸序列與SEQIDNO:39的至少約2000個連續(xù)氨基酸,更優(yōu)選至少約 2100個連續(xù)氨基酸,更優(yōu)選至少約2200個連續(xù)氨基酸,更優(yōu)選至少約2300 個連續(xù)氨基酸,更優(yōu)選至少約2400個連續(xù)氨基酸,更優(yōu)選至少約2500個 連續(xù)氨基酸,更優(yōu)選至少約2600個連續(xù)氨基酸,更優(yōu)選至少約2700個連 續(xù)氨基酸,更優(yōu)選至少約2800個連續(xù)氨基酸,甚至更優(yōu)選與全長SEQ ID NO: 39至少約60%相同。在一個實施方案中,上述氨基酸序列不包括下列氨基 酸序列SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 , SEQ ID NO: 8 , SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32。
另一方面,本發(fā)明包含的PUFAPKS蛋白質(zhì)或結(jié)構(gòu)域,包括上述同系物, 含有與選自SEQ ID NO: 39, SEQ ID NO: 52或SEQ ID NO: 62的氨基酸序 列在上段所述任一連續(xù)氨基酸長度上至少約65%相同,更優(yōu)選至少約70% 相同,更優(yōu)選至少約75%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約85 %相同,更優(yōu)選至少約90%相同,更優(yōu)選至少約95%相同,更優(yōu)選至少約 96%相同,更優(yōu)選至少約97%相同,更優(yōu)選至少約98%相同,更優(yōu)選至少 約99%相同的氨基酸序列,其中該氨基酸序列具有PUFA PKS系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性。在一個實施方案中,上述氨基酸序列不包括下 列氨基酸序列SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQ ID NO:8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26 , SEQ ID NO: 28 , SEQ ID NO: 30, SEQ ID NO: 32。
本發(fā)明的一個方面,本發(fā)明包含的PUFAPKS蛋白質(zhì)或結(jié)構(gòu)域,包括上 述同系物,含有與選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64 , SEQ 66, SEQ ID NO: 68的氨基酸序列至少約60 %相同的 氨基酸序列,其中所述氨基酸序列具有PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域 的生物學(xué)活性。另一方面,所述蛋白的氨基酸序列與選自SEQIDNO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQIDNO: 58, SEQ ID NO: 60, SEQ ID NO: 62 , SEQ ID NO: 64 , SEQ 66, SEQ ID NO: 68 的氨基酸序列至少約65 %相同性,更優(yōu)選至少約70 %相同,更優(yōu)選至少約 75%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約85%相同,更優(yōu)選至少 約90%相同,更優(yōu)選至少約95%相同,更優(yōu)選至少約96%相同,更優(yōu)選至 少約97%相同,更優(yōu)選至少約98%相同,更優(yōu)選至少約99%相同,其中該 氨基酸序列具有PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。在一個 實施方案中,上述氨基酸序列不包括下列氨基酸序列SEQIDNO:2, SEQ ID NO: 4, SEQIDNO: 6, SEQIDNO: 8, SEQIDNO: 10, SEQIDNO: 13, SEQIDNO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQIDNO: 28, SEQ ID NO: 30, SEQ ID NO: 32。
另一方面,本發(fā)明包含的PUFAPKS蛋白質(zhì)或結(jié)構(gòu)域,包括上述同系物, 含有與選自SEQIDNO: 39, SEQ ID NO: 43, SEQIDNO: 50, SEQIDNO: 52,和SEQ ID NO: 58的氨基酸序列至少約50%相同的氨基酸序列,其中 所述氨基酸序列具有PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。另 一方面,蛋白的氨基酸序列與選自SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52,和SEQ ID NO: 58的氨基酸序列至少約55 %相同, 更優(yōu)選至少約60 %相同,其中所述氨基酸序列具有PUFA PKS系統(tǒng)的至少 一個結(jié)構(gòu)域的生物學(xué)活性。另 一方面,所述蛋白的氨基酸序列與選自SEQ ID NO: 39, SEQIDNO: 43, SEQIDNO: 50, SEQIDNO: 52,和SEQ ID NO: 58
的氨基酸序列至少約65%相同,其中所述氨基酸序列具有PUFA PKS系統(tǒng) 的至少一個結(jié)構(gòu)域的生物學(xué)活性。另一方面,所述蛋白的氨基酸序列與選 自SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64的氨基酸序列至少約70 % 相同,更優(yōu)選至少約75 %相同,其中所述氨基酸序列具有PUFA PKS系統(tǒng) 的至少一個結(jié)構(gòu)域的生物學(xué)活性。另一方面,所述蛋白的氨基酸序列與選 自SEQIDNO:39, SEQIDNO:41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68的氨基酸序列至少約80 %相同,更優(yōu)選至少約85 %相同,更優(yōu)選至少約90%相同,更優(yōu)選至少約95%相同,更優(yōu)選至少約 96 %相同,更優(yōu)選至少約97 %相同,更優(yōu)選至少約98 %相同,更優(yōu)選至少 約99 %相同,其中該氨基酸序列具有PUFA PKS系統(tǒng)的至少 一個結(jié)構(gòu)域的 生物學(xué)活性。在一個實施方案中,上述氨基酸序列不包括下列氨基酸序列 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26 , SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32。
一個優(yōu)選實施方案中,本發(fā)明的分離的蛋白或結(jié)構(gòu)域包含下述氨基酸 序列,基本由下述氨基酸序列組成,或由下述氨基酸序列組成,所述氨基 酸序列選自SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68,或其生物學(xué)活性片段,包括任意具有PUFA P K S系統(tǒng)至少 一 個結(jié)構(gòu)域的生物學(xué)活性的片段。
本發(fā)明的一個方面,下列Schizochytrium蛋白和結(jié)構(gòu)域用于本發(fā)明的一 個或多個實施方案,所有這些蛋白和結(jié)構(gòu)域之前已在US專利申請 10/124,800(出處同上)詳細(xì)描述了。本發(fā)明的一個方面,用于本發(fā)明的PUFA PKS蛋白或結(jié)構(gòu)域包含與選自SEQ ID NO: 2, SEQ ID NO: 4和SEQ ID NO: 6的氨基酸序列的至少500個連續(xù)氨基酸至少約60%相同的氨基酸序列; 其中所述氨基酸序列具有PUFAPKS系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性。
另 一方面,所述蛋白的氨基酸序列與SEQ ID NO: 2, SEQ ID NO: 4和SEQ ID NO: 6中任一個的至少約600個連續(xù)氨基酸,更優(yōu)選至少約700個連續(xù)氨基 酸,更優(yōu)選至少約800個連續(xù)氨基酸,更優(yōu)選至少約900個連續(xù)氨基酸, 更優(yōu)選至少約1000個連續(xù)氨基酸,更優(yōu)選至少約IIOO個連續(xù)氨基酸,更 優(yōu)選至少約1200個連續(xù)氨基酸,更優(yōu)選至少約1300個連續(xù)氨基酸,更優(yōu) 選至少約1400個連續(xù)氨基酸,或與全長SEQ ID NO: 6至少約60%相同。 另 一方面,所述蛋白的氨基酸序列與SEQ ID NO: 2或SEQ ID NO: 4中任一 個的至少約1600個連續(xù)氨基酸,更優(yōu)選至少約1700個連續(xù)氨基酸,更優(yōu) 選至少約1800個連續(xù)氨基酸,更優(yōu)選至少約1900個連續(xù)氨基酸,更優(yōu)選 至少約2000個連續(xù)氨基酸,或與全長SEQ IDNO: 4至少約60%相同。另 一方面,所述蛋白的氨基酸序列與SEQIDNO:2的至少約2100個連續(xù)氨基 酸,更優(yōu)選至少約2200個連續(xù)氨基酸,更優(yōu)選至少約2300個連續(xù)氨基酸, 更優(yōu)選至少約2400個連續(xù)氨基酸,更優(yōu)選至少約2500個連續(xù)氨基酸,更 優(yōu)選至少約2600個連續(xù)氨基酸,更優(yōu)選至少約2700個連續(xù)氨基酸,更優(yōu) 選至少約2800個連續(xù)氨基酸,甚至更優(yōu)選與全長SEQ ID NO: 4至少約60 %相同。
另一方面,用于本發(fā)明一個或多個實施方案的PUFAPKS蛋白或結(jié)構(gòu)域 包含與選自SEQ ID NO: 2, SEQ ID NO: 4或SEQ ID NO: 6的氨基酸序列在 上段所述任一連續(xù)氨基酸長度上至少約65 %相同,更優(yōu)選至少約70 %相同, 更優(yōu)選至少約75%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約85%相同, 更優(yōu)選至少約90 %相同,更優(yōu)選至少約95 %相同,更優(yōu)選至少約96 %相同, 更優(yōu)選至少約97 %相同,更優(yōu)選至少約98 %相同,更優(yōu)選至少約99 %相同 的氨基酸序列,其中該氨基酸序列具有PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域 的生物學(xué)活性。
本發(fā)明的另一方面,用于本發(fā)明一個或多個實施方案的PUFAPKS蛋白 或結(jié)構(gòu)域包含與選自SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ IDNO: 18, SEQ IDNO: 20, SEQ IDNO: 22, SEQ IDNO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30或SEQ ID NO: 32的氨基酸序列至少約60 %相同的氨基酸序列,其中該氨基酸序列具有PUFA PKS系統(tǒng)的至少一個 結(jié)構(gòu)域的生物學(xué)活性。另 一方面,所述蛋白的氨基酸序列與選自SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQIDNO:20, SEQID NO: 22, SEQ ID NO: 24 , SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30
或SEQ ID NO: 32的氨基酸序列至少約65%相同性,更優(yōu)選至少約70%相 同,更優(yōu)選至少約75%相同,更優(yōu)選至少約80%相同,更優(yōu)選至少約85 %相同,更優(yōu)選至少約90%相同,更優(yōu)選至少約95%相同,更優(yōu)選至少約 96%相同,更優(yōu)選至少約97%相同,更優(yōu)選至少約98%相同,更優(yōu)選至少 約99%相同,其中該氨基酸序列具有PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域的 生物學(xué)活性。
本發(fā)明另一方面,用于本發(fā)明一個或多個實施方案的PUFAPKS蛋白或 結(jié)構(gòu)域包含下述氨基酸序列,基本由下述氨基酸序列組成,或由下述氨基 酸序列組成,所述氨基酸序列選自SEQIDNO:2, SEQIDNO:4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32或其生物學(xué)活性片段,包括任意具 有PUFAPKS系統(tǒng)至少一個結(jié)構(gòu)域的生物學(xué)活性的片段。
根據(jù)本發(fā)明,術(shù)語"相鄰的"或"連續(xù)的"對于本文所述核酸或氨基 酸序列是指以不中斷的序列相連。例如,含有第二個序列的30個相鄰(或連 續(xù))氨基酸的第 一個序列,是指第 一個序列包含與第二個序列中30個氨基酸 殘基的不中斷序列100%相同的30個氨基酸殘基的不中斷序列。同樣,與 第二個序列"100%相同"的第一個序列是指第一個序列與第二個序列完全 匹配,核苷酸或氨基酸之間沒有缺口。
如本文所用,除非另有說明,同一性百分?jǐn)?shù)(。/。)是指使用下述方法進行 的同源性評估(l)進行BLAST 2.0 Basic BLAST同源性4全索,使用blastp 進行氨基酸檢索,blastn用于核酸檢索,blastX用于核酸4全索以及檢索所有 6個開放閱讀框中的翻譯的氨基酸,全部使用標(biāo)準(zhǔn)默認(rèn)參數(shù),其中通過默認(rèn) 來濾過查詢序列的低復(fù)雜性區(qū)域(Altschul, S. F., Madden, T. L., Schaaffer, A. A.,Zhang, J., Zhang, Z., Miller, W. & Lipman, D. J.(1997)' "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs" Nucleic Acids Res. 25:3389-3402中描述的,整體引入此處作為參考);(2)BLAST 2 比對(使用下述參數(shù));(3)和/或使用標(biāo)準(zhǔn)默認(rèn)參數(shù)的PSI-BLAST(位置特異性 重復(fù)BLAST)。應(yīng)注意由于BLAST 2.0 Basic BLAST和BLAST 2之間在標(biāo) 準(zhǔn)參數(shù)上有一些區(qū)別,使用BLAST2程序可能認(rèn)為兩個特定序列具有顯著
的同源性,而用BLAST 2. 0 Basic BLAST進行檢索時,以 一個序列作為查 詢序列,可能沒有鑒定出最匹配的第二個序列。另外,PSI-BLAST提供了 自動的、易使用的"圖譜(profile)"檢索版本,它是尋找序列同系物的一個 敏感途徑。該程序首先進行有缺口的BLAST數(shù)據(jù)庫檢索。PSI-BLAST程序 使用來自任何有意義比對的信息,其被返回以構(gòu)建位置特異性評分矩陣, 所述信息可代替查詢序列用于下一輪數(shù)據(jù)庫檢索。因此,應(yīng)明白可使用這 些程序中的任一種測定同 一性百分?jǐn)?shù)。
使用BLAST 2序列可以將兩個具體序列彼此比對,如Tatusova和 Madden, (1999), "Blast 2 sequences-a new tool for comparing protein and nucleotide sequences" , FEMS Microbiol Lett. 174, 247所述的,整體引入jt匕 處作為參考。在blastp或blastn進行BLAST 2序列比對,使用BLAST 2.0 算法在兩個序列之間進行有缺口的(Gapped)BLAST檢索(BLAST2.0),允許 在所得的序列排列中引入間隔(缺失和插入)。為了本文清楚的目的,使用如 下標(biāo)準(zhǔn)默認(rèn)參數(shù)進行BLAST 2序列排列。
對于blastn,使用0 BLOSUM62矩陣
匹配得分=1
錯配罰分二2
開放缺口 (5)和延伸缺口 (2)罰分
缺口 —x下降(dropoff )(50)期望(expect)(10)word size(l 1)篩選(filter)(開
(on))
對于blastp,使用0 BLOSUM62矩陣
開放缺口(ll)和延伸缺口(l)罰分
缺口—x下降(50)期望(10) word size(3)篩選(開(on))
根據(jù)本發(fā)明,具有PUFAPKS系統(tǒng)至少一個結(jié)構(gòu)域的生物學(xué)活性的氨基 酸序列是具有本文詳細(xì)描述的PUFA PKS系統(tǒng)至少一個結(jié)構(gòu)域的生物學(xué)活 性的氨基酸序列,如前面以Schizochytrium PUFA PKS系統(tǒng)作為例證或如以 破嚢壺菌屬PUFA PKS系統(tǒng)作為本文另 一例證所示的。Schizochytrium或破 嚢壺菌屬PUFAPKS系統(tǒng)中各種結(jié)構(gòu)域的生物學(xué)活性在上文中已詳細(xì)描述。 因此,用于本發(fā)明的分離的蛋白可以包括任意PUFA PKS開放閱讀框的翻 譯產(chǎn)物,任意PUFA PKS結(jié)構(gòu)域,及其生物學(xué)活性片段,或具有生物學(xué)活
性的天然PUFAPKS開放閱讀框產(chǎn)物或結(jié)構(gòu)域的任意同系物。
在本發(fā)明的另一實施方案中,具有本發(fā)明PUFAPKS系統(tǒng)至少一個結(jié)構(gòu) 域的生物學(xué)活性的氨基酸序列包括與天然PUFA PKS蛋白質(zhì)或多肽足夠相 似的氨基酸序列,以致于編碼該氨基酸序列的核酸序列在中等,高度,或 極高嚴(yán)格條件(下文描述)下,能夠與編碼天然PUFAPKS蛋白質(zhì)或多肽的核 酸分子雜交(即與編碼天然PUFA PKS蛋白質(zhì)或多肽的核酸鏈的互補鏈雜 交)。優(yōu)選具有本發(fā)明PUFA PKS系統(tǒng)至少一個結(jié)構(gòu)域的生物學(xué)活性的氨基 酸序列由這樣一種核酸序列編碼,該核酸序列在中等,高度或極高嚴(yán)格條 件下與編碼上述任意一種PUFA PKS蛋白或結(jié)構(gòu)域的氨基酸序列的核酸序 列的互補鏈雜交。推定互補序列的方法是本領(lǐng)域技術(shù)人員已知的。應(yīng)注意 由于氨基酸測序和核酸測序技術(shù)不是完全無誤差的,因此本文提供的序列 最多代表本發(fā)明PUFAPKS結(jié)構(gòu)域和蛋白質(zhì)的表觀序列。
本文使用的雜交條件是指標(biāo)準(zhǔn)雜交條件,在該條件下核酸分子用于鑒 定相似的核酸分子。例如Sambrook et al., Molecular Cloning : A Laboratory Manual, Cold Spring Harbor Labs Press, 1989公開了這種標(biāo)準(zhǔn)條件。Sambrook etal.,(出處同上)整體引入此處作為參考(具體參見9.31-9.62頁)。另外,例 如Meinkoth et al., 1984, Anal. Biochem. 138, 267-284; Meinkoth et al.(出處 同上)公開了計算合適的雜交條件和洗滌條件以完成允許各種程度核苦酸錯 配的雜交的公式,整體引入此處作為參考。
更具體地說,本文提及的中等嚴(yán)格的雜交條件和洗滌條件是指可以分 離與在雜交反應(yīng)中作為探針的核酸分子具有至少約70 。/。核酸序列同 一性的 核酸分子的條件(即允許約30%或更少核苷酸錯配的條件)。本文提及的高度 嚴(yán)格的雜交條件和洗滌條件是指可以分離與在雜交反應(yīng)中作為探針的核酸 分子具有至少約80%核酸序列同一性的核酸分子的條件(即允許約20%或 更少核苷酸錯配的條件)。本文提及的極高嚴(yán)格的雜交條件和洗滌條件是指 可以分離與在雜交反應(yīng)中作為探針的核酸分子具有至少約90%核酸序列同 一性的核酸分子的條件(即允許約10%或更少核苷酸錯配的條件)。如上所 述,本領(lǐng)域技術(shù)人員可使用Meinkoth et al.(出處同上)的公式計算合適的雜 交條件和洗滌條件以達到這些特定的核苷酸錯配水平。該條件依賴于形成 的是DNA: RNA雜交體還是DNA: DNA雜交體而變化。計算的DNA: DNA 雜交體的解鏈溫度比DNA:RNA雜交體低10°C。在具體實施方案中,DNA:
DNA雜交體的嚴(yán)格雜交條件包括在6 x SSC(0.9MNa+)的離子強度,約20°C 至約35。C(較低度嚴(yán)格條件),更優(yōu)選約28。C至約4(TC(更嚴(yán)格條件),甚至 更優(yōu)選約35。C至約45。C(甚至更嚴(yán)格條件),合適的洗滌條件下進行雜交。 在具體實施方案中,DNA:RNA雜交體的嚴(yán)格雜交條件包括在6 x SSC(0.9M Na+)的離子強度,約3(TC至約45",更優(yōu)選約38°C至約50°C ,甚至更優(yōu)選 約45。C至約55。C,類似的嚴(yán)格洗滌條件下進行雜交。這些值是基于對大于 約100個核苷酸,0%曱酰胺和約40。/。G+C含量的分子解鏈溫度的計算?;?者,可如Sambrook et al.,出處同上,9.31至9.62頁所述根據(jù)經(jīng)驗計算Tm 值。 一般來說,洗滌條件應(yīng)當(dāng)盡可能嚴(yán)格,且對于選定的雜交條件應(yīng)是合 適的。例如,雜交條件可包括鹽和溫度條件的組合,該溫度比計算的具體 雜交體的Tm低約20-25。C,且洗滌條件一般包括鹽和溫度條件的組合,該 溫度比計算的具體雜交體的Tm低約12-20°C。適用于DNA: DNA雜交體的 雜交條件的一個例子包括在6 x SSC(50。/。曱酰胺)、約42。C雜交2-24小時, 接著進行洗滌步驟,包括在室溫、約2 x SSC中洗滌一次或多次,然后在更 高溫度和更低離子強度的條件下進一步洗滌(例如在約37°C、約0.1X-0.5X SSC中洗滌至少一次,接著在約68°C、約0.1X-0.5XSSC中洗滌至少一次)。 本發(fā)明還包括融合蛋白,包含附著于一個或多個融合片段的任意PUFA PKS蛋白或結(jié)構(gòu)域或其任意同系物或片段。用于本發(fā)明的適合的融合片段 包括,但不限于,能增強蛋白穩(wěn)定性的片段;能提供其它所需生物學(xué)活性 的片段;和/或協(xié)助蛋白純化的片段(例如通過親和層析)。合適的融合片段 可以是具有所需功能(例如給予提高的穩(wěn)定性,溶解性,生物學(xué)活性;和/ 或簡化蛋白純化)的任意大小的結(jié)構(gòu)域。融合蛋白可以與蛋白的氨基末端和/ 或羧基末端連接并且易于斷裂從而可以直接回收所需蛋白。優(yōu)選通過培養(yǎng) 用融合核酸分子轉(zhuǎn)染的重組細(xì)胞從而產(chǎn)生融合蛋白,所述融合核酸分子編 碼包括附著于如上所述本發(fā)明蛋白羧基末端或氨基末端的融合片段的蛋 白。
在本發(fā)明的一個實施方案中,可產(chǎn)生任一上述PUFA PKS的氨基酸序列, 以及該序列的同系物,其在給定氨基酸序列的C-末端和/或N-末端各自側(cè)接 從至少一個至多達約20個附加異源氨基酸。所得的蛋白質(zhì)或多肽可稱為"基 本上由給定的氨基酸序列組成"。根據(jù)本發(fā)明,異源性氨基酸是天然狀況下 不與給定氨基酸序列側(cè)接(即不見于天然狀況、體內(nèi))的氨基酸序列,或在該
基因中存在時如果使用產(chǎn)生該給定氨基酸序列所來源程序的生物體的標(biāo)準(zhǔn) 密碼子用法翻譯天然序列中的該核苷酸時,不由編碼給定氨基酸序列的天 然核酸序列側(cè)翼的核苷酸編碼的氨基酸序列。同樣,短語"基本上由其組成" 在本文中當(dāng)用于指核酸序列時,是指編碼給定氨基酸序列的核酸序列在編
碼給定氨基酸序列的核酸序列5,和/或3,末端各側(cè)帶有從至少一個到多達約 60個添加的異源核苦酸。異源性核苦酸是在天然基因中存在時不是在編碼 給定氨基酸序列的核酸序列側(cè)翼天然發(fā)現(xiàn)(即,體內(nèi)天然狀況下未發(fā)現(xiàn))的。 本發(fā)明蛋白或結(jié)構(gòu)域和/或其同系物或片段的最小尺寸是, 一方面其大 小足以具有必需的生物學(xué)活性的,或其大小足以作為抗原以產(chǎn)生抗體或在 體外試驗中作為靶。在一個實施方案中,本發(fā)明蛋白長至少8個氨基酸(例如 適用于抗體表位或作為試驗中可檢測的肽),或至少約25個氨基酸,或至少 約50個氨基酸,或至少約100個氨基酸,或至少約150個氨基酸,或至少約 200個氨基酸,或至少約250氨基酸,或至少約300個氨基酸,或至少約350 個氨基酸,或至少約400個氨基酸,或至少約450個氨基酸,或至少約500個 氨基酸,或至少約750個氨基酸等等,長度在8個氨基酸直至本發(fā)明蛋白或 結(jié)構(gòu)域全長之間或更長,全部是整數(shù)長度(例如8, 9, 10, ...25, 26, ...500, 501...1234, 1235,...)。除了實際限制,該蛋白的最大尺寸沒有限制,因為 如果需要,蛋白可以包括PUFAPKS蛋白、結(jié)構(gòu)域的一部分,或其生物學(xué)活 性或有用片段,或全長PUFAPKS蛋白或結(jié)構(gòu)域加上附加序歹。(例如融合蛋白 序列)。
本發(fā)明另一實施方案包括分離的核酸分子,包含、基本含有、或含有 核酸序列及與其完全互補的核酸序列,所述核酸序列編碼上述鑒別的任意 蛋白或結(jié)構(gòu)域,包括其同系物或片段。根據(jù)本發(fā)明,分離的核酸分子是從 其天然環(huán)境中取出(即對其進行了人工操作)的核酸分子,其天然環(huán)境是天然 狀態(tài)下發(fā)現(xiàn)該核酸分子的基因組或染色體。因此,"分離"不反映核酸分子 的純化程度,但是表明該分子不包括天然狀況下發(fā)現(xiàn)該核酸分子的完整基 因組或完整染色體。分離的核酸分子可以包括基因。包括基因的分離的核 酸分子不是包括該基因的染色體的一個片段,而是包括編碼區(qū)和伴隨基因 的調(diào)控區(qū),但是沒有在同一染色體中天然發(fā)現(xiàn)的其它基因。分離的核酸分 子也可以包括特定核酸序列,其側(cè)翼(即序列的5,和/或3,端)是天然狀況下 一般不是該特定核酸序列側(cè)翼的其它核酸(即異源序列)。分離的核酸分子可
以包括DNA, RNA(例如mRNA),或DNA或RNA的衍生物(例如cDNA)。 盡管短語"核酸分子,'主要是指物理學(xué)核酸分子且短語"核酸序列"主要 是指核酸分子的核苷酸序列,但是兩個短語可交換使用,特別是對于能編 碼蛋白或蛋白結(jié)構(gòu)域的核酸分子或核酸序列。
優(yōu)選的是,使用重組DNA技術(shù)(例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴增、克隆) 或化學(xué)合成從而產(chǎn)生本發(fā)明的分離的核酸分子。分離的核酸分子包括天然 的核酸分子及其同系物,包括但不限于,天然等位基因變體和修飾的核酸 分子,其中核苷酸以這樣的方式插入、缺失、取代和/或倒置,使修飾對本 文所述PUFAPKS系統(tǒng)的生物學(xué)活性產(chǎn)生了所需的影響。蛋白質(zhì)同系物(例 如由核酸同系物編碼的蛋白質(zhì))在上文中已有詳細(xì)討論。
使用本領(lǐng)域技術(shù)人員已知的許多方法可以產(chǎn)生核酸分子同系物(參見例 如,Sambrook et al., Molecular Cloning : A Laboratory Manual, Cold Spring Harbor Labs Press, 1989)。例如,可使用各種技術(shù)修飾核酸分子,該技術(shù)包 括但不限于,傳統(tǒng)誘變技術(shù)和重組DNA技術(shù),例如定點誘變,化學(xué)處理核 酸分子以誘導(dǎo)突變,限制性酶裂解核酸片段,連接核酸片段,核酸序列選 定區(qū)域的PCR擴增和/或誘變,合成寡核苷酸混合物并連接混合物組以"構(gòu) 建"核酸分子混合體,及其組合。通過篩選核酸編碼的蛋白質(zhì)的功能和/或 通過與野生型基因雜交可從修飾的核酸混合物中選擇核酸分子同系物。
本發(fā)明核酸分子的最小尺寸是大小足以形成探針或寡核苷酸引物,該 探針或寡核苦酸引物與用于本發(fā)明的核酸分子的互補序列能夠形成穩(wěn)定的 雜交體(例如在中等、高度或極高嚴(yán)格條件下),或者其大小足以編碼具有本 發(fā)明PUFA PKS系統(tǒng)至少一個結(jié)構(gòu)域的生物學(xué)活性的氨基酸序列。因此, 編碼該蛋白的核酸分子的大小取決于核酸組成和核酸分子與互補序列之間 的同源性或同 一性百分?jǐn)?shù)以及雜交條件本身(例如溫度、鹽濃度和曱酰胺濃 度)。用作寡核苷酸引物或探針的核酸分子的最小尺寸一般是如果核酸分子 富含GC則為至少約12個至約15個核苷酸,如果富含AT則為至少約15 至約18個堿基。除了實際限制,本發(fā)明核酸分子的最大尺寸沒有限制,因 為核酸分子可以包含序列,該序列足以編碼PUPAPKS系統(tǒng)的結(jié)構(gòu)域的生物 活性片段,PUFAPKS系統(tǒng)的完整結(jié)構(gòu)域,PUFAPKS系統(tǒng)開放閱讀框(Orf) 內(nèi)的幾個結(jié)構(gòu)域,PUFA PKS系統(tǒng)的完整Orf ,或 一 個以上PUFA PKS系統(tǒng) 的Orf。
本發(fā)明一個實施方案中,分離的核酸分子包含,基本含有,或含有編
碼上述任意氨基酸序列,包括本文所述的來自Schizochytrium或破嚢壺菌 屬的任意氨基酸序列或其同系物的核酸序列。 一方面,核酸序列選自SEQID NO:l, SEQID NO: 3, SEQID NO: 5, SEQID NO: 7, SEQID NO: 9, SEQ ID NO: 12, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65 或SEQ ID NO: 67,或同系物(包括與該序列至少約50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%或99%相同的序列), 或其片段,或其任意互補序列。
本發(fā)明另一實施方案包括含有重組載體和核酸序列的重組核酸分子, 所述核酸序列編碼具有本文所述PUFA PKS系統(tǒng)至少一個結(jié)構(gòu)域(或其同系 物或片段)的生物學(xué)活性的蛋白或肽。該核酸序列在上文中有詳細(xì)描述。根 據(jù)本發(fā)明,重組載體是一種改造的(即人工產(chǎn)生的)核酸分子,它用作處理選 定核酸序列并將該核酸序列導(dǎo)入宿主細(xì)胞的工具。因此重組載體適用于克 隆,測序,和/或處理選定的核酸序列,例如通過表達和/或傳遞選定的核酸 序列到宿主細(xì)胞中以形成重組細(xì)胞。該載體一般含有異源核酸序列,即天 然狀況下未發(fā)現(xiàn)與需要克隆的或傳遞的核酸序列相連的核酸序列,盡管載 體也可含有天然狀況下發(fā)現(xiàn)與本發(fā)明的核酸分子相連的或有利于本發(fā)明核 酸分子表達的調(diào)控核酸序列(例如啟動子,非翻譯區(qū))(下面詳細(xì)討論)。載體 可以是RNA或DNA,是原核的或真核的, 一般是質(zhì)粒。載體可作為染色 體外因子(例如質(zhì)粒)維持或可整合進重組生物(例如微生物或植物)的染色體 中。完整載體可以保留在宿主細(xì)胞內(nèi),或者在某些情況下,可以刪除質(zhì)粒 DNA,留下本發(fā)明的核酸分子。整合的核酸分子可在染色體啟動子控制下, 在天然啟動子或質(zhì)粒啟動子控制下,或者在一些啟動子組合的控制下。核
酸分子的單個或多個拷貝可以整合到染色體中。本發(fā)明的重組載體可含有 至少一個選^r標(biāo)記。
在一個實施方案中,用于本發(fā)明重組核酸分子的重組載體是表達載體。 本文所用的短語"表達載體,,用于指適合于產(chǎn)生編碼產(chǎn)物(例如目的蛋白)
的載體。在該實施方案中,將編碼需要產(chǎn)生的產(chǎn)物(例如PUFAPKS結(jié)構(gòu)域) 的核酸序列插入重組載體中以產(chǎn)生重組核酸分子。編碼需要產(chǎn)生的蛋白質(zhì) 的核酸序列以這樣的方式插入載體中,即將核酸序列與載體中的調(diào)控序列 可操作地連接使得核酸序列能夠在重組宿主細(xì)胞內(nèi)轉(zhuǎn)錄和翻譯。
在另一實施方案中,用于本發(fā)明重組核酸分子的重組載體是定向載體。 本文所用的短語"定向載體"用于指這樣一種載體,即它用于將特定核酸 分子傳遞進重組宿主細(xì)胞,其中該核酸分子用于刪除或滅活宿主細(xì)胞或凝: 生物內(nèi)的內(nèi)源性基因(即用于定向基因破壞或敲除技術(shù))。本領(lǐng)域也將該載體 稱為"敲除"載體。在該實施方案的一個方面,載體的一部分,但更典型 的是插入載體的核酸分子(即插入片段)具有與宿主細(xì)胞靶基因(即定向刪除 或失活的基因)的核酸序列同源的核酸序列。載體插入片段的核酸序列設(shè)計 成與靶基因結(jié)合以便靶基因與插入片段進行同源重組,從而刪除,滅活或 減弱內(nèi)源性靶基因(即通過突變或刪除至少一部分內(nèi)源性靶基因)。實施例部 分描述了使用這種類型的重組載體以重組基因取代內(nèi)源性Schizochytrium 基因,并且2003年9月4日以US 20030166207公開的美國專利申請No. 10/124,807詳細(xì)描述了 Thraustochytrids遺傳轉(zhuǎn)化的一般技術(shù)。
一般來說,重組核酸分子包括與一個或多個表達調(diào)控序列可操作連接 的至少一個本發(fā)明核酸分子。本文所用的短語"重組分子"或"重組核酸 分子"主要是指與表達調(diào)控序列可操作連接的核酸分子或核酸序列,但是 當(dāng)該核酸分子是本文討論的重組分子時,上述短語可與短語"核酸分子" 交換使用。根據(jù)本發(fā)明,短語"可操作連接"是指將核酸分子與表達調(diào)控 序列(例如轉(zhuǎn)錄調(diào)控序列和/或翻譯調(diào)控序列)以這樣的方式相連,即當(dāng)轉(zhuǎn)染 (即轉(zhuǎn)化、轉(zhuǎn)導(dǎo)、轉(zhuǎn)染、接合或?qū)?進宿主細(xì)胞時,分子能被表達。轉(zhuǎn)錄調(diào) 控序列是控制轉(zhuǎn)錄開始、延長或終止的序列。特別重要的轉(zhuǎn)錄調(diào)控序列是 控制轉(zhuǎn)錄開始的序列,例如啟動子、增強子、操縱子和阻抑序列。合適的 轉(zhuǎn)錄調(diào)控序列包括在導(dǎo)入重組核酸分子的宿主細(xì)胞或生物體中能起作用的 任何轉(zhuǎn)錄調(diào)控序列。
本發(fā)明的重組核酸分子也可含有其它調(diào)控序列,例如翻譯調(diào)控序列, 復(fù)制起始點,和與重組細(xì)胞相容的其它調(diào)控序列。在一個實施方案中,本 發(fā)明的重組分子,包括整合進宿主細(xì)胞染色體中的重組分子,還含有分泌 信號(即信號片段核酸序列)使得表達的蛋白質(zhì)能夠從產(chǎn)生該蛋白的細(xì)胞中 分泌出來。合適的信號片段包括天然伴隨需表達蛋白的信號片段或能夠指 導(dǎo)本發(fā)明蛋白分泌的任何異源性信號片段。在另一實施方案中,本發(fā)明的 重組分子包含使得表達蛋白能夠傳遞并插入宿主細(xì)胞膜的前導(dǎo)序列。合適 的前導(dǎo)序列包括天然伴隨蛋白的前導(dǎo)序列,或者能夠指導(dǎo)蛋白傳遞并插入 細(xì)胞膜中的任何異源性前導(dǎo)序列。
本發(fā)明人發(fā)現(xiàn)Schizochytrium PUFA PKS Orfs A和B在基因組中緊密相 連并測序了 Orfs之間的區(qū)域。Orfs以相反的方向排列并且4244個堿基對分 隔起始(ATG J密碼子(即它們?nèi)缦屡帕?'OfA5 ,-4244bp-5 ,Orffl3 ,)。檢查4244 bp的基因間區(qū)域沒有揭示出任何明顯的Orfs(在BlastX檢索中沒有發(fā)現(xiàn)明顯 的匹配)。Schizochytrium至少在產(chǎn)油期間高度表達OrfsA和OrfsB,意味著 在該基因間區(qū)域包含活性啟動子元件。相信這些遺傳元件可用作轉(zhuǎn)基因應(yīng) 用中的雙向啟動子序列。例如在優(yōu)選實施方案中,可克隆該區(qū)域,在其各 個末端放置任意目的基因并將該構(gòu)建體導(dǎo)入Schizochytrium(或者啟動子可 發(fā)揮功能的一些其它宿主)中。預(yù)期調(diào)控元件在合適條件下可使兩個導(dǎo)入的 基因同等的高水平表達。含有Schizochytrium PUFA PKS調(diào)控元件(例如啟動 子)的調(diào)控區(qū)的完整核苷酸序列本文表示為SEQIDNO:36。
同樣,Schizochytrium在產(chǎn)油期間高度表達OrfC且預(yù)期調(diào)控元件在其 起始密碼子的上游區(qū)域。已克隆并測序了 OrfC上游的基因組DNA區(qū)域并 在本文中表示為(SEQIDNO: 37)。該序列含有3886nt,緊靠OrfC起始密碼
明顯的匹配)。相信該區(qū)域包含的調(diào)控元件在合適的條件下可使放置在其后 的基因高水平表達。另外,在合適條件下,表達水平與在A-B基因間區(qū)域 (SEQ ID NO: 36)控制下的基因等同。
因此,在一個實施方案中,如本文所述用于本發(fā)明的重組核酸分子可 包括SEQ ID NO: 36和/或SEQ ID NO: 37內(nèi)包含的PUFA PKS調(diào)控區(qū)。該調(diào) 控區(qū)可包括至少具有基本PUFA PKS轉(zhuǎn)錄活性的SEQ ID NO: 36和/或SEQ ID NO: 37的任一部分(片段)。
本發(fā)明一種或多種重組分子可用于產(chǎn)生本發(fā)明的編碼產(chǎn)物(例如PUFA PKS結(jié)構(gòu)域、蛋白質(zhì)或系統(tǒng))。在一個實施方案中,通過在有效產(chǎn)生蛋白質(zhì) 的條件下表達本文所述核酸分子來生產(chǎn)編碼產(chǎn)物。產(chǎn)生編碼蛋白的優(yōu)選方 法是通過用一種或多種重組分子轉(zhuǎn)染宿主細(xì)胞以形成重組細(xì)胞。用于轉(zhuǎn)染
的合適宿主細(xì)胞包括,但不限于,可被轉(zhuǎn)染的任何細(xì)菌細(xì)胞,真菌細(xì)胞(例 如酵母),昆蟲細(xì)胞,植物細(xì)胞或動物細(xì)胞。在本發(fā)明的一個實施方案中,
優(yōu)選的宿主細(xì)胞是Thraustochytrid宿主細(xì)胞(下文詳細(xì)描述的)或植物細(xì)胞。
宿主細(xì)胞可以是未轉(zhuǎn)染的細(xì)胞或者是已被至少一個其它重組核酸分子轉(zhuǎn)染
的細(xì)月包。
根據(jù)本發(fā)明,術(shù)語"轉(zhuǎn)染"用于指可將外源性核酸分子(即重組核酸分 子)插入細(xì)胞中的任一方法。當(dāng)術(shù)語"轉(zhuǎn)化"用于指將核酸分子導(dǎo)入微生物 細(xì)胞,例如藻類、細(xì)菌和酵母,或植物時,可與術(shù)語"轉(zhuǎn)染"交換使用。 在微生物系統(tǒng)中,術(shù)語"轉(zhuǎn)化"用于描述由于微生物或植物獲得外源性核 酸的遺傳改變且與術(shù)語"轉(zhuǎn)染"基本同義。然而,在動物細(xì)胞中,轉(zhuǎn)化被 賦予了第二種含義,例如可指細(xì)胞變成癌細(xì)胞后在培養(yǎng)中生長特性的改變。 因此,為了避免混淆,術(shù)語"轉(zhuǎn)染"優(yōu)選用于指將外源核酸導(dǎo)入動物細(xì)胞, 且術(shù)語"轉(zhuǎn)染"在本文中用于概括包含動物細(xì)胞轉(zhuǎn)染、微生物細(xì)胞和植物 細(xì)胞轉(zhuǎn)化,該術(shù)語適用的范圍是將外源性核酸導(dǎo)入細(xì)胞。因此,轉(zhuǎn)染技術(shù) 包括,但不限于,轉(zhuǎn)化,粒子轟擊,擴散,主動轉(zhuǎn)運,聲波浴,電穿孔, 顯微注射,脂質(zhì)體轉(zhuǎn)染,吸附,感染和原生質(zhì)體融合。
本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解使用重組DNA技術(shù)通過搡縱例如,宿主細(xì)胞 內(nèi)核酸分子的拷貝數(shù),轉(zhuǎn)錄這些核酸分子的效率,翻譯所得轉(zhuǎn)錄子的效率, 和翻譯后修飾的效率可改進轉(zhuǎn)染的核酸分子的表達調(diào)控。另外,可遺傳改 造啟動子序列以便與天然啟動子相比表達水平提高。用于控制核酸分子表 達的重組技術(shù)包括,但不限于,將該核酸分子整合進一個或多個宿主細(xì)胞 染色體中,給質(zhì)粒添加載體穩(wěn)定性序列,取代或修飾轉(zhuǎn)錄控制信號(例如, 啟動子,操縱子,增強子),取代或修飾翻譯控制信號(例如,核糖體結(jié)合位 點,Shine-Dalgarno序列),修飾核酸分子以符合該宿主細(xì)胞的密碼子用法, 和缺失使轉(zhuǎn)錄子不穩(wěn)定的序列。
上文對于重組核酸分子和宿主細(xì)胞轉(zhuǎn)染方面的一i&性討論試圖應(yīng)用于 本文討論的任一重組核酸分子,包括編碼具有PUFA PKS至少一個結(jié)構(gòu)域 的生物學(xué)活性的任一氨基酸序列的核酸分子,編碼其它PKS系統(tǒng)氨基酸序 列的核酸分子,和編碼其它蛋白質(zhì)或結(jié)構(gòu)域的核酸分子。
多不飽和脂肪酸(PUFA)是高等真核生物的基本膜成份和許多脂類衍生 的信號分子的前體。本發(fā)明的PUFA PKS系統(tǒng)使用不需要去飽和并延長飽
和脂肪酸的PUFA合成途徑。該途徑由結(jié)構(gòu)和機制上均不同于以前"i人識的 PKS的PUFA PKS催化。順式雙鍵的產(chǎn)生表明包含位置特異性異構(gòu)酶,相 信這些酶有利于產(chǎn)生新的抗生素家族。
為了產(chǎn)生明顯高產(chǎn)的一種或多種所需的多不飽和脂肪酸或其它生物活 性分子,可對生物體,優(yōu)選微生物或植物,更優(yōu)選Thraustochytrid微生物進 行遺傳修飾以改變微生物或植物中PUFA PKS系統(tǒng)的活性,具體是改變系 統(tǒng)的終產(chǎn)物。
因此,本發(fā)明一個實施方案涉及經(jīng)遺傳修飾的微生物,其中該微生物 表達含有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)至少 一 個生物 學(xué)活性結(jié)構(gòu)域的PKS系統(tǒng)。PUFA PKS系統(tǒng)的結(jié)構(gòu)域可以包括上述PUFA PKS系統(tǒng)(例如Schizochytrium和破嚢壺菌屬)的任意結(jié)構(gòu)域,包括其同系物, 還可以包括來自任意其它非細(xì)菌微生物,包括真核微生物,包括任意 Thraustochytrid微生物的PUFA PKS系統(tǒng)的任意結(jié)構(gòu)域,或用US專利申請 10/124,800(出處同上)描述的篩選方法鑒別的微生物的PUFA PKS系統(tǒng)的任 意結(jié)構(gòu)域。遺傳修飾影響生物體PKS系統(tǒng)的活性。US專利申請10/124,800 描述的篩選方法包括以下步驟(a)選^^產(chǎn)生至少一種PUFA的微生物;和(b) 從(a)中鑒定與在發(fā)酵培養(yǎng)基中、溶氧條件大于約5%飽和度,優(yōu)選約10%, 更優(yōu)選約15% ,更優(yōu)選約20%飽和度的條件下微生物產(chǎn)生的PUFA相比, 在發(fā)酵培養(yǎng)基中、溶氧條件小于約5%飽和度的情況下具有產(chǎn)生增加的 PUFA能力的微生物。
上述遺傳修飾可以是一種上述內(nèi)源性PUFA PKS系統(tǒng)的 一個或多個功能域 的遺傳修飾,由此上述修飾對上述PUFAPKS系統(tǒng)的活性具有一定影響。另
遺傳修飾可以是引入至少一種外源核酸序列(例如, 一種重組核酸分子),其 中上述外源核酸序列編碼來自 一種第二PKS系統(tǒng)的至少一種生物學(xué)活性結(jié) 構(gòu)域或蛋白質(zhì)和/或影響上述PUFA PKS系統(tǒng)活性的蛋白質(zhì)(例如下面討論的 磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPTase))。另一方面,上述生物體并非必需內(nèi)源 性地(天然地)含有PUFA PKS系統(tǒng),^旦是經(jīng)過遺傳修飾,以引入至少 一個編 碼具有PUFA PKS系統(tǒng)的至少 一 個結(jié)構(gòu)域的生物學(xué)活性的氨基酸序列的重 組核酸分子。在此方面,通過引入或增加生物體中PUFA PKS活性而影響PUFA PKS活性。下面將更詳細(xì)地討論與上述方面中每一項有關(guān)的各種實施方案。
應(yīng)該理解,PUFAPKS系統(tǒng)或含有PUFA PKS系統(tǒng)的生物體的遺傳修飾可 以包括修飾PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域(包括結(jié)構(gòu)域的一部分), PUFA PKS系統(tǒng)的多于一個或若干個結(jié)構(gòu)域(包括相鄰結(jié)構(gòu)域,非相鄰結(jié)構(gòu) 域,或PUFA PKS系統(tǒng)中不同蛋白質(zhì)上的結(jié)構(gòu)域),PUFA PKS系統(tǒng)的所有蛋 白質(zhì),和完整的PUFAPKS系統(tǒng)(例如,PUFAPKS基因編碼的所有蛋白)。因 而,修飾可以包括對內(nèi)源性PUFAPKS系統(tǒng)單一結(jié)構(gòu)域的細(xì)微(small)修飾; 置換,缺失或增加給定PUFAPKS系統(tǒng)的一個或多個結(jié)構(gòu)域或蛋白質(zhì);多至 在一種生物體中,用來自不同生物體的PUFAPKS系統(tǒng)取代完整的PUFAPKS 系統(tǒng)。本領(lǐng)域技術(shù)人員將理解對PUFA PKS系統(tǒng)的任意遺傳修飾都包括在本 發(fā)明范圍內(nèi)。
本文所用的遺傳修飾微生物可以包括遺傳修飾的細(xì)菌,原生生物,微 藻類,真菌,或其它微生物,并且特別是此處描述破嚢壺菌屬 (Thraustochytriun力,Japonochytrium, Labyrinthula, Thraustochytriales目(例 如,Thraustochytrid)中任何屬的微生物(例如,Schizochytrium , Labyrinthuloides等)。上述遺傳修飾微生物具有相對其正常形式(即,野生型 或天然存在的)的經(jīng)修飾的基因組(即,突變或改變),由此達到所需的結(jié)果 (即,增加或改變PUFA PKS活性和/或使用PKS系統(tǒng)生產(chǎn)所需的產(chǎn)物)??梢?使用標(biāo)準(zhǔn)菌抹形成和/或分子遺傳技術(shù)對微生物進行遺傳修飾。這些技術(shù)是 本領(lǐng)域已知的,且通常被公開用于微生物,例如Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press。 參 考文獻Sambrook et al.,出處同上,全文并入此處作為參考。經(jīng)遺傳修飾的 微生物可以包括這樣的微生物,其中的核酸分子被插入,缺失或修飾(即, 突變的;例如,通過核苦酸的插入,缺失,置換和/或轉(zhuǎn)換產(chǎn)生的突變),以 使該修飾在微生物中產(chǎn)生所需的效果。
根據(jù)本發(fā)明修飾的優(yōu)選微生物宿主細(xì)胞包括,但不限于,任何細(xì)菌, 原生生物,微藻,真菌,或原生動物。 一方面,優(yōu)選被遺傳修飾的微生物 包才舌, <旦不限于Thraustochytriales目的4壬^r樣i生物,包4舌Thraustochytriaceae 和Labyrinthulaceae科的任何孩i生物。用于本發(fā)明的具體優(yōu)選的宿主細(xì)胞可 以包括,但不限于下列屬的微生物Thraustochytriaceae科中的破嚢壺菌屬,Japonochytrium, Aplanochytrium, Elina和Schizochytrium, Labyrinthulaceae 科中的Labyrinthula, Labyrinthuloides和Labyrinthomyxa。 這些屬中優(yōu)選的 種包括,但不限于Labyrinthula屬中的任何種,包括Labrinthula sp., Labyrinthula algeriensis, Labyrintliula cienkowskii, Labyrinthula chattonii, Labyrinthula. coenocystis, Labyrinthula macrocystis, Labyrinthula. macrocystis atlantica , Labyrinthula macrocystis macrocystis , Labyrinthula magnifica , Labyrinthula minuta, Labyrinthula roscoffensis , Labyrinthula valkanovii , Labyrinthula vitellina, Labyrinthula vitellina pacifica, Labyrinthula vitellina vitellina, Labyrinthula zopfii;任意Labyrinthuloides種,包括Labyrinthuloides sp, , Labyrinthuloides minuta , Labyrinthuloides schizochytrops ; 任意 Labyrinthomyxa種,包括Labyrinthomyxa sp. , Labyrinthomyxa pohila , Labyrinthomyxa sauvageaui;任意Aplanochytrium種,包括Aplanochytrium sp. 和Aplanochytrium kerguelensis;任意Elina種,包括Elina sp. , Elina marisalba, Elina sinorifica ; 任意 Japanochytriurn 種,包括 Japanochytrium sp., Japanochytrium marinum; 任意Schizochytrium種,包括Schizochytrium sp., Schizochytrium aggregatum , Schizochytrium limacinum , Schizoclaytrium minutum, Schizochytrium octospomm; 禾口石皮嚢壺菌屬中的任何種,包括 Thraustochytrium sp. , Thraustochytrium aggregatum , Thraustochytrium arudimentale , Thraustochytrium aureum , Thraustochytrium benthicola , Thraustochytrium globosum , Thraustochytrium kinnei , Thraustochytrium motivum, Thraustochytrium pachydermum, Thraustochytrium prolifemm, Thraustochytrium roseum, Thraustochytrium striatum, Ulkenia sp., Ulkenia minuta, Ulkenia profunda, Ulkenia radiate, Ulkenia sarkariana,禾口 Ulkenia visurgensis。 這些屬內(nèi)特別優(yōu)選的種包括,但不限于任意Schizochytrium 種,包括 Schizochytrium aggregatum , Schizochytrium limacinum , Schizochytrium minutum; 任意石皮嚢壺菌屬種(包括以前的Ulkenia種,如U. Visurgensis, U. Amoeboida, U. Sarkariana, U. Profunda, U. radiata, U. Minuta 和Ulkenia sp. BP-5601),且包括Thraustochytrium stratum, Thraustoch ytrium aureum, Thraustochytrium roseum; 和Y壬意Japonochytrium種。凈爭另'H尤選的 Thraustochytriales菌4朱包括,j旦不限于Schizochytrium sp.(S31) (ATCC 20888); Schizochytrium sp.(S8)(ATCC 20889); Schizochytrium sp.(LC-腹)
(ATCC 18915) ; Schizochytrium sp.(SR21) ; Schizochytrium aggregatum(Goldstein et Belsky)(ATCC 28209); Schizochytrium limacinum (Honda et Yokochi) (IFO 32693); Thraustochytrium sp.(23B) (ATCC 20891); Thraustochytrium striatum (Schneider)(AT.CC 24473); Thraustochytrium aureum (Goldstein) (ATCC 34304); Thraustochytrium roseum (Goldstein) (ATCC 28210);和Japonochytriumsp.(Ll) (ATCC 28207)。用于遺傳修飾的合適宿主 孩么生物的其它例子包括,^旦不限于,酵母,包括釀酒酵母(Saccharomyces cerevisiae), 卡爾斯伯斗唐酵母(Saccharomyces carlsbergensis), 或i者"i口念3朱菌 屬(Candida),克魯維氏酵母屬(Kluyveromyces)的其它酵母,或其它真菌,例 ^口, i者濁口曲霉屬(Aspergillus),寺連孑包霉屬(Neurospora), 青霉屬(Penidllium) 的絲狀真菌等。細(xì)菌細(xì)胞也可以用作宿主。這些包括,但不限于可以用于 發(fā)酵過程的大腸桿菌。另外,只有通過實施例的方法,諸如乳桿菌 (Lactobacillus)或芽孢桿菌(Bacillus)的宿主也可用作宿主。
本發(fā)明的另 一個實施方案涉及經(jīng)遺傳修飾的植物,該植物被遺傳修飾 以重組表達含有多不飽和脂肪酸(PUFA)聚酮化合物合酶(PKS)系統(tǒng)的至少 一個生物學(xué)活性結(jié)構(gòu)域的PKS系統(tǒng)。PUFA PKS系統(tǒng)的結(jié)構(gòu)域可以包括如上 所述的PUFA PKS系統(tǒng)(例如Schizochytrium和/或破嚢壺菌屬的)的任何結(jié)構(gòu) 域,包括其同源物,并也可以包括來源于任何非細(xì)菌微生物(包括任何真核 微生物和任何其它Thraustochytrid微生物)的PUFA PKS系統(tǒng)的任何結(jié)構(gòu)域, 或來源于根據(jù)如上美國專利申請序列號10/124,800描述的篩選法鑒定的微 生物的PUFA PKS系統(tǒng)的任何結(jié)構(gòu)域。植物也可以用來自另一種PKS系統(tǒng)的 至少一個結(jié)構(gòu)域或其生物學(xué)活性片段進一步修飾,包括但不限于,細(xì)菌PUFA PKS或PKS系統(tǒng),I型PKS系統(tǒng),II型PKS系統(tǒng),才莫塊PKS系統(tǒng),和/或任何非 細(xì)菌性PUFA PKS系統(tǒng)(例如,真核生物,Thraustochytrid, Thmustochytriaceae 或Labyrinthulaceae, Schizochytrium, 等等)。
如此處所用,經(jīng)遺傳修飾的植物可以包括任何經(jīng)過遺傳修飾的植物, 包括高等植物且具體是任何可食用(consumable)植物或可用于產(chǎn)生本發(fā)明所 需的生物活性分子的植物。所述經(jīng)遺傳修飾的植物具有對其正常形式(即野 生型或天然存在的)進行了修飾(即突變或改變)的基因組,以便達到所需結(jié) 果(即增加或修飾的PUFA PKS活性和/或使用PKS系統(tǒng)產(chǎn)生所需產(chǎn)物)。使 用標(biāo)準(zhǔn)菌抹形成和/或分子遺傳技術(shù)可對植物進行遺傳修飾。生產(chǎn)轉(zhuǎn)基因植
物的方法是本領(lǐng)域已知的,其中編碼所需氨基酸序列的重組核酸分子被摻 入該植物的基因組。根據(jù)本發(fā)明進行遺傳修飾的優(yōu)選植物是適于被包括人 的動物食用的植物。
根據(jù)本發(fā)明進行遺傳修飾的優(yōu)選植物(即植物宿主細(xì)胞)包括,但不限于
任何高等植物,并且具體是可食用的植物,包括禾谷類作物(crop piant)并且 具體是用于產(chǎn)油的植物。所述植物可以包括,例如canoa,大豆,油菜籽, 亞麻籽,玉米,紅花,向日葵和煙草。其它優(yōu)選的植物包括那些已知用于 生產(chǎn)用作藥物配制品,增味劑,neutraceutical試劑,功能性食品成分或化妝 品活性劑的化合物的植物,或進行了遺傳修飾以使其生產(chǎn)這些化合物/試劑 的植物。
根據(jù)本發(fā)明,經(jīng)遺傳修飾的微生物或植物包括使用重組技術(shù)或通過傳 統(tǒng)誘變和篩選技術(shù)進行修飾的微生物或植物。本文中,導(dǎo)致基因表達,基 因功能,或基因產(chǎn)物(即由該基因編碼的蛋白質(zhì))功能降低的遺傳修飾指基因 的失活(完全或部分),缺失,中斷(interruption),阻斷或下調(diào)。例如,基因 中導(dǎo)致其編碼的蛋白質(zhì)的功能降低的遺傳修飾可由該基因的完全缺失(即該 基因不存在,且因此該蛋白質(zhì)不存在),導(dǎo)致蛋白質(zhì)不完全翻譯或不翻譯(例 如蛋白質(zhì)不表達)的基因中的突變,或降低或消除該蛋白的天然功能(即蛋白 質(zhì)的表達降低或無酶活性或功能)的基因中的突變引起。導(dǎo)致基因表達或功 能增強的遺傳修飾指基因的擴增,超量表達,過度表達,活化,增強,增 加,或上調(diào)。
根據(jù)本發(fā)明的微生物或植物的遺傳修飾優(yōu)選影響微生物或植物表達的 PKS系統(tǒng)的活性,無論該PKS系統(tǒng)是內(nèi)源性并進行了遺傳修飾,內(nèi)源性并 向生物體中導(dǎo)入了重組核酸分子(可選擇修飾所述內(nèi)源性系統(tǒng)或不修飾),還 是完全通過重組技術(shù)提供的系統(tǒng)。改變PUFA PKS系統(tǒng)或表達該系統(tǒng)的生 物體的PUFA生產(chǎn)圖譜包括與無遺傳修飾的情況(即與未修飾的,野生型 微生物或植物,或與至少在PUFA合成方面未修飾(即該生物體可以具有其 它不涉及PUFA合成的修飾)的微生物或植物相比)相比,引起宿主微生物 或植物的一種或多種PUFA產(chǎn)生中的任何可檢測的或可測量的變化。影響 PKS系統(tǒng)的活性包括與無遺傳修飾相比,引起該生物體表達的PKS系統(tǒng)中 任何可檢測的或可測量的改變或修飾的任何遺傳》務(wù)飾。PKS系統(tǒng)中可4全測 的改變或修飾包括,但不限于與無遺傳修飾的內(nèi)源性PUFA PKS系統(tǒng)相
比,修飾的PUFA PKS系統(tǒng)中的一個或多個結(jié)構(gòu)域的表達和/或生物學(xué)活性 的改變或修飾(引入,增加或降低),將PKS系統(tǒng)活性引入生物體中使得該 生物體目前具有可測量的/可檢測的PKS系統(tǒng)活性(即進行遺傳修飾前該生 物體不含有PKS系統(tǒng)),將來自與該生物體內(nèi)源性表達的PKS系統(tǒng)不同的 PKS系統(tǒng)的功能域引入該生物體中使得PKS系統(tǒng)的活性發(fā)生改變(例如將細(xì) 菌PUFA PKS結(jié)構(gòu)域或I型PKS結(jié)構(gòu)域?qū)雰?nèi)源性表達非細(xì)菌PUFA PKS 系統(tǒng)的生物體中),PKS系統(tǒng)產(chǎn)生的生物活性分子(例如PUFA)的量改變(例 如與無遺傳修飾相比,該系統(tǒng)產(chǎn)生更多(增加的量)或更少(減少的量)的給定 產(chǎn)物),PKS系統(tǒng)產(chǎn)生的生物活性分子的類型的改變(例如PUFA類型的改 變)(例如該系統(tǒng)產(chǎn)生其它的的或不同的PUFA, —種新的或不同的產(chǎn)物,或 者PUFA變體或由該系統(tǒng)天然產(chǎn)生的其它產(chǎn)物的變體),和/或PKS系統(tǒng)產(chǎn)生 的多種生物活性分子之間的比例改變(例如與無遺傳修飾相比,該系統(tǒng)產(chǎn)生 的一種PUFA與另一PUFA的比例不同,產(chǎn)生完全不同的脂質(zhì)圖語,或者與 天然構(gòu)型相比將各種PUFA置于三酰甘油的不同位置)。該遺傳修飾包括任 何類型的遺傳修飾且具體包括通過重組技術(shù)和傳統(tǒng)誘變進行的修飾。
應(yīng)該注意,提及PUFAPKS系統(tǒng)中功能域或蛋白質(zhì)的活性增加是指,在 含有該結(jié)構(gòu)域或蛋白質(zhì)(或其中引入了該結(jié)構(gòu)域或蛋白質(zhì))的生物體中導(dǎo)致 該結(jié)構(gòu)域或蛋白質(zhì)系統(tǒng)的功能增強的任何遺傳修飾,且所述功能增強可包 括所述結(jié)構(gòu)域或蛋白質(zhì)的活性更高(例如比活性或體內(nèi)酶活性),對所述結(jié)構(gòu) 域或蛋白質(zhì)系統(tǒng)的抑制或降解降低,和該結(jié)構(gòu)域或蛋白質(zhì)的過度表達。例 如,增加基因拷貝數(shù),通過使用比天然啟動子產(chǎn)生更高表達水平的啟動子
的結(jié)構(gòu)域或蛋白質(zhì)的活性。
同樣,提及PUFAPKS系統(tǒng)中功能域或蛋白質(zhì)的活性降低是指,在含有 該結(jié)構(gòu)域或蛋白質(zhì)(或其中引入了該結(jié)構(gòu)域或蛋白質(zhì))的生物體中導(dǎo)致該結(jié) 構(gòu)域或蛋白質(zhì)功能降低的任何遺傳修飾,且所述功能降低包括該結(jié)構(gòu)域或 蛋白質(zhì)的活性降低,對該結(jié)構(gòu)域或蛋白質(zhì)的抑制或降解增加,以及減少或 消除該結(jié)構(gòu)域或蛋白質(zhì)的表達。例如,通過阻斷或降低該結(jié)構(gòu)域或蛋白質(zhì) 的產(chǎn)生,"敲除"編碼該結(jié)構(gòu)域或蛋白質(zhì)的基因或其部分,降低結(jié)構(gòu)域或蛋 白質(zhì)活性,或抑制該結(jié)構(gòu)域或蛋白質(zhì)的活性,可降低本發(fā)明的結(jié)構(gòu)域或蛋 白質(zhì)的作用。阻斷或降低結(jié)構(gòu)域或蛋白質(zhì)的產(chǎn)生可包括將編碼該結(jié)構(gòu)域或
蛋白質(zhì)的基因置于需要在生長培養(yǎng)基中存在誘導(dǎo)化合物的啟動子的控制 下。通過建立耗盡培養(yǎng)基中的該誘導(dǎo)劑的條件,編碼該結(jié)構(gòu)域或蛋白質(zhì)的 基因表達(及由此的蛋白質(zhì)合成)可被關(guān)閉。本發(fā)明人在實施例部分證明可以
缺失(敲除)Thraustochytrid微生物中的靶基因。阻斷或降低結(jié)構(gòu)域或蛋白質(zhì) 的活性也可包括使用類似于US專利4,743,546所述的切除技術(shù)方法,并入 此處作為參考。為使用該方法,可將編碼目的蛋白的基因克隆到允許從基 因組中特異性性受控切除該基因的特定基因序列之間。例如,通過按US 4,743,546所述轉(zhuǎn)換培養(yǎng)物的培養(yǎng)溫度或者通過其它的物理或營養(yǎng)信號可以 促進切除。
本發(fā)明的在一個實施方案中,遺傳修飾包括修飾編碼具有本文所述非 細(xì)菌PUFA PKS系統(tǒng)的至少一個結(jié)構(gòu)域的生物學(xué)活性的氨基酸序列的核酸 序歹'J(例如,Thraustochytrid宿主內(nèi)源性PUFAPKS系統(tǒng)的一個結(jié)構(gòu)域,多個 結(jié)構(gòu)域, 一種蛋白質(zhì),或完整的PUFAPKS系統(tǒng))。該修飾可針對內(nèi)源性(天 然)表達的非細(xì)菌PUFA PKS系統(tǒng)內(nèi)的氨基酸序列,由此通過,例如,傳統(tǒng) 誘變和篩選技術(shù)和/或分子遺傳技術(shù),包括遺傳工程技術(shù)可對天然含有該系 統(tǒng)的微生物進行遺傳修飾。遺傳工程技術(shù)可包括,例如,使用定向重組載 體缺失內(nèi)源性基因的一部分(如實施例所示),或者用異源序列取代內(nèi)源基因 的一部分(如實施例所示)。可導(dǎo)入宿主基因組的異源性序列的例子包括編 碼來自另一PKS系統(tǒng)的至少一個功能域的序列,所述另一PKS系統(tǒng)諸如不 同的非細(xì)菌PUFA PKS系統(tǒng)(例如,來自真核生物,包括另 一 種 Thraustochytrid),細(xì)菌PUFAPKS系統(tǒng),I型PKS系統(tǒng),II型PKS系統(tǒng),或 模塊PKS系統(tǒng)。異源序列也可以包括用于取代宿主中完整內(nèi)源性PUFAPKS 系統(tǒng)(例如,內(nèi)源性PUFAPKS系統(tǒng)的所有基因)的完整的PUFAPKS系統(tǒng)(例 如,與PUFA PKS系統(tǒng)有關(guān)的所有基因)。異源序列還可以包括編碼宿主 Thraustochytrid PUFA PKS系統(tǒng)天然結(jié)構(gòu)域的修飾的功能域(同源物)的序列 (例如,編碼Schizochytrium中Orffi的修飾的結(jié)構(gòu)域的核酸序列,其中當(dāng)該 修飾的結(jié)構(gòu)域用于取代Schizochytrium表達的天然存在的結(jié)構(gòu)域時,改變 Schizochytrium的PUFA生產(chǎn)圖譜。導(dǎo)入宿主基因組的其它異源性序列包 括編碼非PKS系統(tǒng)結(jié)構(gòu)域,但是將影響內(nèi)源性PKS系統(tǒng)活性的蛋白質(zhì)或 功能域的序列。例如,可將編碼磷酸泛酰巰基乙胺轉(zhuǎn)移酶的核酸分子引入 宿主基因組中(下文討論)。下文中將詳細(xì)討論對內(nèi)源性PUFAPKS系統(tǒng)進行
的特異性修飾。
本發(fā)明該實施方案的另一方面,該遺傳修飾包括(l)向宿主中引入編 碼具有PUFA PKS系統(tǒng)的至少 一 個結(jié)構(gòu)域的生物學(xué)活性的氨基酸序列的重 組核酸分子;和/或(2)向宿主中導(dǎo)入編碼影響PUFA PKS系統(tǒng)活性的蛋白質(zhì)或 功能域的重組核酸分子。所述宿主包括(l)不表達任何PKS系統(tǒng)的宿主細(xì) 胞,其中將PKS系統(tǒng)的所有功能域引入該宿主細(xì)胞中,且其中至少一個功能 域來自非細(xì)菌PUFA PKS系統(tǒng);(2)表達具有非細(xì)菌PUFA PKS系統(tǒng)的至少一 個功能域的PKS系統(tǒng)(內(nèi)源性或重組)的宿主細(xì)胞,其中引入的重組核酸分子 可編碼至少一種其它非細(xì)菌PUFA PKS功能域或者影響宿主PKS系統(tǒng)活性的 其它蛋白質(zhì)或結(jié)構(gòu)域;和(3)表達不必包括來自非細(xì)菌PUFAPKS的功能域的 PKS系統(tǒng)(內(nèi)源性或重組)的宿主細(xì)胞,且其中? 1入的重組核酸分子包括編碼 非細(xì)菌PUFAPKS系統(tǒng)的至少一個功能域的核酸序列。換句話說,本發(fā)明意 欲包括任何遺傳修飾的生物體(例如微生物或植物),其中該生物體含有至少 一個非細(xì)菌PUFA PKS功能域(內(nèi)源性或者通過重組修飾引入),且其中當(dāng)該 生物體含有功能性PKS系統(tǒng)時,該遺傳修飾對非細(xì)菌PUFA PKS功能域或 PKS系統(tǒng)具有可測量的影響。
本發(fā)明包括許多可能的非細(xì)菌和細(xì)菌微生物,作為此處描述的PUFA PKS系統(tǒng)的可能的宿主細(xì)胞,和/或作為編碼用于此處描述的遺傳修飾和方 法的PUFA PKS系統(tǒng)蛋白質(zhì)和結(jié)構(gòu)域的其它遺傳物質(zhì)來源。例如,可以通 過用于鑒定如上美國專利申請
發(fā)明者克雷格·A·韋弗, 威廉·R·巴克利, 詹姆斯·G·梅茨, 詹姆斯·H·弗拉特 申請人:馬泰克生物科學(xué)公司