用于在細胞中表達基因的啟動子的制作方法
【專利摘要】本發(fā)明涉及經(jīng)分離的Rasamsonia啟動子DNA序列,涉及包含與編碼序列可操作相連的這些啟動子的DNA構(gòu)建體、載體和宿主細胞。本發(fā)明也涉及使用經(jīng)分離的新啟動子來表達基因和/或生產(chǎn)生物化合物的方法。本發(fā)明也涉及使用本發(fā)明的新啟動子來改變轉(zhuǎn)錄水平和/或調(diào)節(jié)內(nèi)源基因的方法。
CBS 124902
20090701
【專利說明】用于在細胞中表達基因的啟動子
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及DNA序列,特別是經(jīng)分離的啟動子,以及涉及包含與編碼序列可操作 相連(inoperativeassociation)的這些啟動子的DNA構(gòu)建體、載體和宿主細胞。本發(fā)明 還涉及表達基因和/或生產(chǎn)生物化合物的方法。
【背景技術(shù)】
[0002] 在宿主細胞中生產(chǎn)重組生物化合物通常是通過構(gòu)建表達盒來完成的,其中編碼生 物化合物的DNA可操作地連接適合于宿主細胞的啟動子。可通過質(zhì)?;蛘咻d體介導(dǎo)的轉(zhuǎn)化 將表達盒引入宿主細胞內(nèi)。然后可通過在表達盒中含有的啟動子正常發(fā)揮功能所必需的誘 導(dǎo)條件下培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細胞來完成生物化合物的生產(chǎn)。
[0003] 對于各宿主細胞而言,已通過轉(zhuǎn)化引入宿主內(nèi)的編碼序列的表達和通過該編碼 序列編碼的重組生物化合物的生產(chǎn)需要獲得功能性啟動子。已知大量啟動子在多種宿主 細胞中具備功能性。以下為真菌宿主細胞中跨物種使用的啟動子的例子:Aspergillus nidulans的啟動子(已知A.nidulansgpdA基因在Aspergillusniger(A.niger)中有功能 (JBiotechnol. 1991Jan;17 (1):19-33.Intracellularandextracellularproduction ofproteinsinAspergillusunderthecontrolofexpressionsignalsofthehighly expressedA.nidulansgpdAgene.PuntPJ,ZegersND,BusscherM,PouwelsPH,vanden HondelCA)。另一個例子是用于A.niger和A.nidulans的A.niger0 -木糖苷酶xlnD啟動 子(TranscriptionalregulationofthexylanolyticenzymesystemofAspergillus, vanPeij,NNME,PhD-thesisLandbouwuniversiteitffageningen,theNetherlands,ISBN 90-5808-154-0)以及Escherichiacoli@-葡糖醒酸酶基因在A.niger、A.nidulans 和Cladosporiumfulvum中的表達,如CurrGenet. 1989Mar; 15(3):177-80:Roberts IN,OliverRP,PuntPJ,vandenHondelCA."ExpressionoftheEscherichiacoli beta-glucuronidasegeneinindustrialandphytopathogenicfilamentousfungi"中 所述。
[0004] 迄今為止,沒有Rasamsoniaemersonii啟動子用于形成重組產(chǎn)品,而僅僅使用跨 物種使用的啟動子。
[0005] 仍然需要以下的啟動子:其用于控制經(jīng)引入基因的表達,用于控制內(nèi)源基因的表 達水平,用于控制內(nèi)源基因的表達調(diào)節(jié)或者用于介導(dǎo)內(nèi)源基因的失活,或者用于生產(chǎn)多肽, 或者用于前述應(yīng)用的組合。這些啟動子,優(yōu)選為經(jīng)改進的啟動子,可以例如比之前已知的啟 動子更強。它們也可被特定便利的底物或者化合物誘導(dǎo)。當(dāng)期望在單種宿主中同時過表達 多種基因時,知道若干種功能性啟動子也是有利的。為了防止壓制(squelching)(特定轉(zhuǎn) 錄因子的滴定(titration)),優(yōu)選使用多種不同的啟動子,例如每個待表達的基因使用一 個特定的啟動子。
[0006] 發(fā)明簡沭
[0007] 根據(jù)第一方面,本發(fā)明提供Rasamsonia啟動子DNA序列,優(yōu)選Rasamsonia emersonii啟動子DNA序列,更優(yōu)選地,其連接可被過表達的編碼序列。本發(fā)明的Rasamsonia啟動子DNA優(yōu)選連接可被過表達的編碼序列。有利地,本發(fā)明的Rasamsonia啟 動子對應(yīng)于強啟動子和/或誘導(dǎo)型啟動子。
[0008]根據(jù)另一方面,本發(fā)明提供啟動子DNA序列,例如:
[0009] (a)以下列表中所示的DNA序列:SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQ IDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQ IDNO: 16 或者SEQIDNO: 17 ;
[0010] (b)能夠與(a)中DNA序列的互補體(complement)雜交的DNA序列;或者
[0011] (c)與(a)中DNA序列至少50%同源的DNA序列。
[0012] 另一方面,本發(fā)明提供DNA構(gòu)建體,其包含本發(fā)明的啟動子DNA序列以及與該啟動 子DNA序列可操作相連的編碼序列,從而編碼序列可在啟動子DNA序列的控制下被表達。
[0013] 又一方面,本發(fā)明提供宿主細胞,優(yōu)選為真菌宿主細胞,其包含本發(fā)明的DNA 構(gòu)建體。該宿主細胞優(yōu)選為經(jīng)轉(zhuǎn)化的宿主細胞,例如經(jīng)轉(zhuǎn)化的真菌宿主細胞,并且有 利地使用重組技術(shù)生產(chǎn)。宿主細胞優(yōu)選為來自以下屬的細胞:Acremonium、Agaricus、 Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filobasidium、 Fusarium、Geosmithia、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、 Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、 Rasamsonia、Schizophyllum、Talaromyces、Thermoascus、Thermomyces、Thielavia、 Tolypocladium或者Trichoderma,優(yōu)選來自Rasamsonia、Aspergillus、Penicillium、 Chrysosporium或者Trichoderma屬,優(yōu)選為Rasamsoniaemersonii〇
[0014] 再一方面,本發(fā)明提供在合適的宿主細胞中表達編碼序列的方法,其包括:
[0015] (a)提供本發(fā)明的DNA構(gòu)建體;
[0016] (b)使用所述DNA構(gòu)建體來轉(zhuǎn)化合適的宿主細胞;以及
[0017] (c)在有助于編碼序列表達的培養(yǎng)條件下培養(yǎng)所述合適的宿主細胞。
[0018] 而且,本發(fā)明提供在合適的宿主細胞中生產(chǎn)生物化合物的方法,其包括:
[0019] (a)提供本發(fā)明的DNA構(gòu)建體;
[0020] (b)使用所述DNA構(gòu)建體來轉(zhuǎn)化合適的宿主細胞;以及
[0021] (c)在有助于編碼序列表達的培養(yǎng)條件下培養(yǎng)合適的宿主細胞;以及任選地,
[0022] (d)從培養(yǎng)液中回收生物化合物。
[0023] 有利地,生產(chǎn)的生物化合物為多肽或者代謝產(chǎn)物。
[0024] 在本發(fā)明的方法中,生產(chǎn)的多肽優(yōu)選通過本發(fā)明的DNA構(gòu)建體中存在的編碼序列 來編碼。
[0025] 有利地,在本發(fā)明的方法中,存在于DNA構(gòu)建體中的編碼序列編碼任選地參與代 謝產(chǎn)物生產(chǎn)的酶。
[0026] 而且,本發(fā)明提供編碼葡糖淀粉酶的DNA序列,其包含:
[0027] (a)SEQIDN0:23 所示的DNA序列;
[0028] (b)能夠與(a)中DNA序列的互補體雜交的DNA序列;
[0029] (c)與(a)中DNA序列至少50%、優(yōu)選至少60%、更優(yōu)選至少70%、甚至更優(yōu)選至 少80%、還更優(yōu)選至少90%和最優(yōu)選至少95%同源的DNA序列;或者
[0030] (d)編碼葡糖淀粉酶并且與SEQIDNO:24至少50%、優(yōu)選至少60%、更優(yōu)選至少 70%、甚至更優(yōu)選至少80%、還更優(yōu)選至少90%和最優(yōu)選至少95%同源的DNA序列。
[0031] 本發(fā)明的又一實施方式提供葡糖淀粉酶,其具有與SEQIDN0:24至少50%、優(yōu)選 至少60%、更優(yōu)選至少70%、甚至更優(yōu)選至少80%、還更優(yōu)選至少90%和最優(yōu)選至少95% 同源的DNA序列。
【專利附圖】
【附圖說明】
[0032] 圖 1 顯不質(zhì)粒pENTRY-P6bleTtrpC_Pxeba7flagTgla的不意圖,其為R.emersonii 中啟動子測試構(gòu)建體的基礎(chǔ)。啟動子測試構(gòu)建體包含ble表達盒,該ble表達盒由以下組 成:A.nidulansgpdA啟動子(P6)、ble編碼區(qū)(ble)和A.nidulansTrpC終止子(TtrpC)、 目標(biāo)啟動子(Px)、EBA7-FLAG報告子編碼區(qū)(eba7flag)和A.niger葡糖淀粉酶終止子。
[0033] 圖2顯示如使用FLAG-特異性抗體通過Western印跡法檢測的FLAG標(biāo)記的 R.emersoniiP-葡聚糖酶CEB蛋白(EBA7-FLAG)的表達,其通過在R.emersonii培養(yǎng)物的 上清液中表達的5種不同的R.emersonii啟動子來驅(qū)動。泳道1 :CbhI啟動子,100倍稀 釋的上清液;泳道2 :CbhI啟動子,未經(jīng)稀釋的上清液;泳道3和4 :AXE啟動子;泳道5 :空 菌株;泳道6 :空泳道;泳道7 :A.nidulansgpdA啟動子;泳道8 :BG啟動子;泳道9和10 : Cbhll啟動子;泳道11 :EG啟動子,未經(jīng)稀釋的上清液;泳道12 :EG啟動子,10倍稀釋的上 清液;泳道13 :空菌株。
[0034] 圖3顯示質(zhì)粒Tepep.bbn的示意圖,其為革巴向RePepA基因座(locus)的 R.emersonii中啟動子測試構(gòu)建體的基礎(chǔ)。載體包含靶向ReP印A基因座的ReP印A0RF 1. 5kb上游的1500bp的5'側(cè)翼區(qū)、lox66位點、通過A.nidulansgpdA啟動子驅(qū)動的無功 能的ble編碼區(qū)5'部分(5,ble)、以及ccdB基因。
[0035] 圖4顯不在二分基因革巴向方法(bipartitegene-targetingmethod)中結(jié)合 pEBA528、pEBA529、pEBA530、pEBA531、pEBA532 和pEBA533 載體使用的質(zhì)粒pEBA1006 的示意 圖,其目標(biāo)為在Rasamsoniaemersonii中通過啟動子-報告子子表達盒替換RePepA0RF和 起始ATG密碼子的約1500個核苷酸上游。載體包含ble編碼區(qū)的3'部分、A.nidulanstrpC 終止子、l〇x71 位點、ReP印A0RF的 2500bp3'側(cè)翼區(qū)和pUC19骨架(Invitrogen,fceda,The Netherlands)〇
[0036] 圖5顯示在二分基因靶向方法中結(jié)合pEBA1006載體使用的質(zhì)粒pEBA528的示意 圖,其目標(biāo)為在Rasamsoniaemersonii中通過啟動子-報告子子表達盒替換RePepA0RF 和起始ATG密碼子的約1500個核苷酸上游。載體包含靶向ReP印A基因座的ReP印A0RF 1. 5kb上游的1500bp5'側(cè)翼區(qū);由R.emersonii啟動子1、FLAG標(biāo)記的R.emersonii葡糖 淀粉酶(AG-FLAG)和A.nidulansamdS終止子(TamdS)組成的啟動子-報告子子表達盒; lox66位點;通過A.nidulansgpdA啟動子(5'ble)驅(qū)動的ble編碼區(qū)的無功能5'部分。 在R.emersonii菌株的轉(zhuǎn)化之前,通過使用限制性酶Notl的消化來去除E.coliDNA。
[0037] 圖6顯示質(zhì)粒pEBAlOOl的示意圖。在二分基因靶向方法中結(jié)合pEBA1002載體使 用一部分載體片段,其目標(biāo)為使在Rasamsoniaemersonii中的ReKu800RF缺失。載體包含 2500bp5'上游側(cè)翼區(qū)、lox66位點、通過A.nidulansgpdA啟動子驅(qū)動的ble編碼序列的 5' 部分以及pUC19 的骨架(Invitrogen,Breda,TheNetherlands)。在R.emersonii菌株 的轉(zhuǎn)化之前,通過使用限制性酶Notl的消化來去除E.coliDNA。
[0038] 圖7顯示質(zhì)粒pEBA1002的示意圖。在二分基因靶向方法中結(jié)合pEBAlOOl載體使 用一部分載體片段,其目標(biāo)為使在Rasamsoniaemersonii中的ReKu800RF缺失。載體包含 ble編碼區(qū)的 3' 部分、A.nidulanstrpC終止子、lox71 位點、ReKu800RF的 2500bp3' 下 游側(cè)翼區(qū)以及pUC19 的骨架(Invitrogen,Breda,TheNetherlands)。在R.emersonii菌株 的轉(zhuǎn)化之前,通過使用限制性酶Notl的消化來去除E.coliDNA。
[0039] 圖8顯示用于使R.emersonii的ReKu80基因缺失的策略。用于使ReKu80缺失的 載體包含重疊的無功能的ble選擇標(biāo)記物片段(分開的標(biāo)記物(splitmarker)),其側(cè)翼是 loxP位點以及ReKu80基因的5'和3'同源區(qū)來用于靶向(1)。構(gòu)建體在基因組的ReKu80 基因座處和在重疊的同源非功能性ble選擇標(biāo)記物片段處通過三重同源重組(X)來整合 (2)并替換基因組的ReKu80基因拷貝(3)。隨后,通過導(dǎo)致lox66和lox71位點之間重組 的ere重組酶的瞬時表達來去除選擇標(biāo)記物,從而以在基因組內(nèi)剩下的剩余雙突變lox72 位點缺失ble基因(4)。使用該整體策略將ReKu800RF從基因組中去除。
[0040] 圖9顯示用于在真菌中瞬時表達ere重組酶的質(zhì)粒pEBA513的示意圖。pEBA513 是含有AMA1區(qū)和CAT氯霉素抗性基因的pAMPF21衍生載體。示出了ere重組酶基因(ere) 表達盒,其含有A.nigerglaA啟動子(Pgla)、ere重組酶編碼區(qū)和niaD終止子。此外,示 出了由A.nidulansgpdA啟動子(PgpdA)、hygB編碼區(qū)和P.chrysogenumpenDE終止子 (TpenDE)組成的潮霉素抗性盒。
[0041] 圖10顯示如使用FLAG-特異性抗體通過Western印跡法檢測的FLAG標(biāo)記的 R.emersonii葡糖淀粉酶(AG-FLAG)的表達,該表達通過在R.emersonii培養(yǎng)物的上清液 中表達的6種不同R.emersonii啟動子來驅(qū)動。不同的泳道顯示在表達以下啟動子-報告 子子表達構(gòu)建體的轉(zhuǎn)化體的上清液中AG-FLAG的表達:泳道1 :pEBA540 (攜帶A.nidulans gpdA啟動子);泳道2 :pEBA528 (攜帶R.emersonii啟動子1);泳道3 :pEBA529 (攜帶 R.emersonii啟動子2);泳道4:pEBA530(攜帶R.emersonii啟動子3);泳道5 :pEBA531(攜 帶R.emersonii啟動子 4);泳道 6 :pEBA532 (攜帶R.emersonii啟動子 5);泳道 7 : PEBA533 (攜帶R.emersonii啟動子6);以及泳道8 :空菌株。
[0042] 序列表
[0043] SEQIDNO: 1R.emersonii纖維二糖水解酶-I啟動子
[0044] SEQIDNO:2R.emersonii乙酰木聚糖酯酶啟動子
[0045] SEQIDNO:3R.emersonii內(nèi)切葡聚糖酶啟動子
[0046] SEQIDNO:4R.emersonii纖維二糖水解酶-II啟動子
[0047] SEQIDNO: 5R.emersoniiP-葡糖苷酶啟動子
[0048] SEQIDNO:6A.nidulansgpdA啟動子
[0049] SEQIDNO:7R.emersoniiRePepA(包括側(cè)翼的基因組序列)
[0050] SEQIDNO:8R.emersoniiRePepA(cDNA)
[0051] SEQIDNO:9R.emersoniiRePepA(蛋白質(zhì))
[0052] SEQIDNO: 10A.nidulansgpdA啟動子和ble編碼區(qū)的 5' 部分
[0053] SEQIDNO:llble編碼區(qū)的 3' 部分和A.nidulansTrpC終止子
[0054] SEQIDNO: 12R.emersonii啟動子 1
[0055] SEQIDNO: 13R. emersonii 啟動子 2
[0056] SEQIDNO: 14R. emersonii 啟動子 3
[0057] SEQIDNO: 15R. emersonii 啟動子 4
[0058] SEQIDNO: 16R. emersonii 啟動子 5
[0059] SEQIDNO: 17R. emersonii 啟動子 6
[0060] SEQIDNO: 1SFLAG標(biāo)記的R.emersonii葡糖淀粉酶(蛋白質(zhì))
[0061] SEQIDNO: 19FLAG標(biāo)記的R.emersonii葡糖淀粉酶(DNA,編碼區(qū))和A.nidulans AmdS終止子
[0062] SEQIDN0:20ReKu80基因組序列,具有側(cè)翼的編碼區(qū)
[0063] SEQIDN0:21ReKu80cDNA序列
[0064] SEQIDN0:22ReKu80 蛋白序列
[0065] SEQIDN0:23ReGlacDNA序列
[0066] SEQIDN0:24ReGla蛋白序列
[0067] 發(fā)明詳沭
[0068] 當(dāng)今,基因組學(xué)項目使用功能性基因組學(xué)方法以確定用于工業(yè)和環(huán)境應(yīng)用的新的 真菌酶?;诠男蛄衼碜⑨尰蚪MDNA序列。許多酶在起源微生物進化過程中看起來 高度保守。然而,對于啟動子而言,很難觀察到任何保守,即使在密切相關(guān)的物種中,同一性 也普遍少于5%。因此,必須開發(fā)其他的策略以尋找到新的和有效的啟動子。
[0069] 在本發(fā)明的上下文中,啟動子DNA序列是:當(dāng)該啟動子DNA序列與編碼序列可 操作相連時,能夠控制該編碼序列表達的DNA序列。術(shù)語"可操作相連(inoperative association) "在本文中被定義為下述結(jié)構(gòu),其中啟動子DNA序列被放置于相對編碼序列 來說合適的位置,使得啟動子DNA序列指導(dǎo)被編碼序列編碼的產(chǎn)物的生產(chǎn)。
[0070] 術(shù)語"編碼序列"在本文中被定義為:當(dāng)放置在合適的控制序列的控制下時,被轉(zhuǎn) 錄為mRNA、mRNA被翻譯為多肽的核酸序列。編碼序列的邊界通常通過ATG起始密碼子(其 通常是mRNA5'端的開放閱讀框的開始)和轉(zhuǎn)錄終止子序列(處于緊鄰mRNA3'端開放閱 讀框的下游)界定。編碼序列可以包括但不限于基因組DNA,cDNA,半合成、合成和重組核 酸序列。
[0071] 更具體而言,術(shù)語"啟動子"在本文中被定義為下述DNA序列,其與RNA聚合酶結(jié) 合,并指導(dǎo)聚合酶到編碼多肽的編碼序列的正確下游轉(zhuǎn)錄開始位點以起始轉(zhuǎn)錄。RNA聚合酶 有效地催化與編碼區(qū)的合適DNA鏈互補的信使RNA的組裝。術(shù)語"啟動子"還將被理解為 包括轉(zhuǎn)錄為mRNA之后用于翻譯的5'非編碼區(qū)(介于啟動子和翻譯起始之間)、順式作用轉(zhuǎn) 錄控制元件(例如增強子)以及能與轉(zhuǎn)錄因子相互作用的其它核苷酸序列。
[0072] 術(shù)語"強啟動子"在本文中被定義為:在合適生長條件下,在含有作為碳源的 2. 4%葡萄糖或者2 %纖維素的合適的營養(yǎng)培養(yǎng)基中,與A.nidulansgpdA啟動子相比, 給予報告蛋白更多表達的啟動子。合適的報告蛋白的例子為FLAG標(biāo)記的內(nèi)切葡聚糖酶 (在實施例2中描述)和FLAG標(biāo)記的葡糖淀粉酶(在實施例5中描述)。優(yōu)選地,將啟動 子-報告子構(gòu)建體的一個拷貝整合至特定基因座,從而防止由于拷貝數(shù)或者整合至基因 組的位置造成的表達差異(在實施例5中描述)。用于比較啟動子活性的合適的營養(yǎng)培養(yǎng) 基和生長條件取決于宿主。例如,細胞可在實驗室或者工業(yè)發(fā)酵器中通過搖瓶培養(yǎng)、小規(guī) 模或者大規(guī)模發(fā)酵(包括連續(xù)、分批、分批補料(fed-batch)或者固態(tài)發(fā)酵)來培養(yǎng),其在 合適培養(yǎng)基和使得啟動子-報告子基因被表達的條件下進行。在包含碳源和氮源以及無 機鹽的合適的營養(yǎng)培養(yǎng)基中使用本領(lǐng)域已知的工序進行培養(yǎng)(對于絲狀真菌宿主而言,參 見例如,Bennett,J.W.和LaSure,L.編,MoreGeneManipulationsinFungi,Academic Press,CA,1991)。測定Rasamsonia中啟動子活性的具體條件的例子在實施例2和實施 例5中描述。Trichoderma中合適的營養(yǎng)培養(yǎng)基和生長條件的例子在Zou等人,2012. Constructionofacellulasehyper-expressionsysteminTrichodermareeseiby promoterandenzymeengineering.MicrobCellFact. , 2012Feb8 ;11 (1) : 21 中描述;以 及用于Aspergillus情況下的合適營養(yǎng)培養(yǎng)基和生長條件的例子在EP635574中描述。
[0073] 術(shù)語"誘導(dǎo)型啟動子"定義為:活性通過存在或者不存在生物或者非生物因素(例 如木質(zhì)纖維素的酶促水解衍生的化合物、金屬、溫度或者光)誘導(dǎo)的啟動子。木質(zhì)纖維素的 酶促水解衍生的化合物的例子為槐糖(sophorose)、龍膽二糖、纖維二糖和木糖。
[0074] 編碼序列或者目標(biāo)基因的過表達是指目標(biāo)蛋白的表達和/或分泌與之前情況相 比(例如在連同使能在親本細胞中表達的編碼序列引入啟動子之前)是新的或者增加的。
[0075] 能高水平表達的基因(即高表達的基因)在本文中被定義為:在例如誘導(dǎo)條件下, 其mRNA可占總細胞mRNA的至少0. 5% (w/w)的基因;或者,其基因產(chǎn)物可占總細胞蛋白的 至少1% (w/w)的基因;或者在分泌的基因產(chǎn)物的情況下,可分泌至至少0.lg/1水平的基 因(如EP357127B1 所述)。
[0076] 在一個優(yōu)選的實施方式中,啟動子為任何Rasamsonia啟動子。為轉(zhuǎn)錄基因所挑 選的特定啟動子的選擇取決于培養(yǎng)基條件,其中啟動子應(yīng)當(dāng)為有活性的。此外,啟動子的 強度是啟動子選擇的標(biāo)準(zhǔn)。啟動子的強度取決于宿主菌株和發(fā)酵條件。通過在特定發(fā)酵 條件下生長絲狀宿主和通過使用例如微陣列分析、定量RT-PCR或者RNA測序來定量轉(zhuǎn)錄 物水平可確定優(yōu)選的啟動子。使用本領(lǐng)域技術(shù)人員已知的標(biāo)準(zhǔn)方法能夠進行微陣列分析, 例如通過在Kiryu等人,2005.Extractingrelationsbetweenpromotersequencesand theirstrengthsfrommicroarraydata.Bioinformatics21 (7) : 1062-1068 中描述的方 法。使用本領(lǐng)域技術(shù)人員已知的標(biāo)準(zhǔn)方法能夠進行RNA的測序,例如使用第二代測序技術(shù), 例如IlluminaGA2、Roche454 等,如在Pareek等人,2011Sequencingtechnologiesand genomesequencing,】ApplGenetics52:413 - 435 中所綜述?;蛘撸褂肕ALDI-T0F分 析、LC-MS或者LC/MS-MS,通過蛋白質(zhì)組學(xué)研究能確定感興趣的啟動子,其中根據(jù)表達的蛋 白量能選擇啟動子。
[0077] 通過定量轉(zhuǎn)錄物,可以評估給定條件下的啟動子強度。比較在不同條件下的強度 使得可以確定條件特異性誘導(dǎo)型啟動子?;蛘?,可識別在不同條件下激活和組成型激活的 啟動子。
[0078] 在一個優(yōu)選的實施方式中,本發(fā)明的啟動子DNA序列為以下列表中所示的DNA序 列:SEQIDNO1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:11、 SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQIDN0:16*#SEQIDN0:17。
[0079] 根據(jù)另一優(yōu)選的實施方式,本發(fā)明的啟動子DNA序列是能夠與以下列表所示的 DNA序列雜交且仍然保持啟動子活性的DNA序列:SEQIDNO1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDNO: 11、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、 5£〇10勵:16或者5£〇10勵:17,。
[0080] 在本發(fā)明上下文中,優(yōu)選通過測量編碼序列表達所產(chǎn)生的蛋白質(zhì)的濃度來確定啟 動子活性,該編碼序列與該啟動子可操作相連?;蛘?,通過測量由編碼序列編碼的蛋白質(zhì) 的酶活性來確定啟動子的活性,該編碼序列與該啟動子可操作相連。根據(jù)一個優(yōu)選的實施 方式,通過測量lacZ報告基因編碼序列的表達(在Luo(Genel63 (1995) 127-131)或者通 過測量FLAG標(biāo)記的蛋白例如FLAG標(biāo)記的葡糖淀粉酶(參見實施例)來測定啟動子活性 (及其強度)。根據(jù)另一優(yōu)選的實施方式,通過使用綠色熒光蛋白作為編碼序列來測定啟動 子的活性(在Microbiology. 1999Mar;145(Pt3) :729-34.SanterreHenriksenAL,Even S, MullerC,PuntPJ,vandenHondelCA,NielsenJ.Study)。此外,通過測量在啟動子控 制下產(chǎn)生的轉(zhuǎn)錄物的mRNA水平能夠測定啟動子活性。mRNA水平能例如通過Northern印跡 來測量(J.Sambrook,E.F.Fritsch和T.Maniatus, 1989,MolecularCloning,ALaboratory Manual,第2版,ColdSpringHarbor,N.Y.)。在用于確定啟動子活性的所有所描述的測 定中,可將該啟動子活性與另一啟動子活性相比較,這例如通過將相同的報告基因或者編 碼序列置于不同啟動子控制下并在相同條件下測量啟動子活性來實現(xiàn)。
[0081] 本發(fā)明涵蓋在非常低嚴(yán)格條件,優(yōu)選低嚴(yán)格條件,更優(yōu)選中嚴(yán)格條件,更優(yōu)選 中-高嚴(yán)格條件,甚至更優(yōu)選高嚴(yán)格條件,和最優(yōu)選非常高嚴(yán)格條件下與核酸探針的互補 鏈雜交的(分離的)啟動子DNA序列,所述核酸探針對應(yīng)于:
[0082] a.SEQIDNO: 1或者SEQIDN0:2的第1至1494位核苷酸,優(yōu)選第100至1494,更 優(yōu)選200至1494,甚至更優(yōu)選300至1494,甚至更優(yōu)選350至1494以及最優(yōu)選360至1494 位核苷酸;
[0083] b.SEQIDN0:2的第1至1482位核苷酸,優(yōu)選第100至1482,更優(yōu)選200至1482, 甚至更優(yōu)選300至1482,甚至更優(yōu)選350至1482以及最優(yōu)選360至1482位核苷酸;
[0084] c.SEQIDN0:3或者SEQIDN0:4的第1至1503位核苷酸,優(yōu)選第100至1503,更 優(yōu)選200至1503,甚至更優(yōu)選300至1503,甚至更優(yōu)選350至1503以及最優(yōu)選360至1503 位核苷酸;
[0085] d.SEQIDN0:5的第1至1979位核苷酸,優(yōu)選第100至1979,更優(yōu)選200至1979, 甚至更優(yōu)選300至1979,甚至更優(yōu)選350至1979以及最優(yōu)選360至1979位核苷酸;
[0086] 6.5£〇10勵:12、5£〇10勵:13、5£〇10勵:14、5£〇10勵:16或者5£〇10勵:17 的第1至1501位核苷酸,優(yōu)選第100至1501,更優(yōu)選200至1501,甚至更優(yōu)選300至1501, 甚至更優(yōu)選350至1501以及最優(yōu)選360至1501位核苷酸;或者
[0087] f.SEQIDN0:15的第1至651位核苷酸,優(yōu)選第50至651,更優(yōu)選100至651,甚 至更優(yōu)選150至651,甚至更優(yōu)選200至651以及最優(yōu)選250至651位核苷酸。
[0088] 術(shù)語互補鏈為本領(lǐng)域技術(shù)人員所已知,并在J.Sambrook,E.F.Fritsch和 T. Maniatis, 1989,MolecularCloning,ALaboratoryManual,第 2 版,ColdSpring Harbor,N.Y中描述。
[0089] 如本文所使用,術(shù)語"雜交"旨在描述用于雜交和洗滌的條件,在該條件下,彼此之 間至少約60%、至少約70%、至少約80%、更優(yōu)選至少約85%、甚至更優(yōu)選至少約90%、更 優(yōu)選至少95%、更優(yōu)選至少98%或者更優(yōu)選至少99%同源的核苷酸序列通常保持彼此雜 交。
[0090] 這些雜交條件的一個優(yōu)選、非限制性例子為在約45°C下在6X氯化鈉/檸檬酸鈉 (SSC)中雜交,然后在50°C下,優(yōu)選在55°C下,優(yōu)選在60°C下以及甚至更優(yōu)選在65°C下在 IXSSC,0. 1%SDS中洗滌一次或者更多次。
[0091] 高嚴(yán)格條件包括例如在68°C下在5xSSC/5xDenhardt's溶液/I. 0%SDS中雜交 和在室溫下在0. 2xSSC/0. 1%SDS中洗滌?;蛘?,可在42°C下進行洗滌。
[0092] 技術(shù)人員將知道嚴(yán)格和高嚴(yán)格雜交條件適用何種條件。容易在本領(lǐng)域中獲得關(guān)于 這些條件的另外的指導(dǎo),例如,在Sambrook等人,1989,MolecularCloning,ALaboratory Manual,ColdSpringHarborPress,N.Y.;和Ausubel等人(編輯),1995,Current ProtocolsinMolecularBiology,(Johnffiley&Sons,N.Y.)中。
[0093] 當(dāng)然,僅與多聚腺苷酸序列(例如mRNA的3'末端poly(A)段(tract))或者僅與 T(或者U)殘基的互補性延伸區(qū)段(stretch)雜交的多核苷酸將不被包括在用于與本發(fā)明 核酸的一部分特異性雜交的本發(fā)明多核苷酸中,因為此類多核苷酸將與含有poly(A)延伸 區(qū)段或者其互補物的任何核酸分子雜交(例如,幾乎任何雙鏈cDNA克?。?br>
[0094] SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQID 勵:12、5£〇10勵:13、5£〇10勵:14、5£〇10勵:15、5£〇10勵:16或者5£〇10勵:17的 子序列(subsequence)可以為至少100個核苷酸、優(yōu)選至少200個核苷酸、更優(yōu)選至少300 個核苷酸、甚至更優(yōu)選至少400個核苷酸以及最優(yōu)選至少500個核苷酸。
[0095] SEQIDN0:USEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQID NO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 的 核酸序列或者其子序列可被用于設(shè)計核酸探針,以按照本領(lǐng)域公知的方法來識別和克隆來 自不同屬或者種的菌株的DNA啟動子。尤其,此類探針可被用于按照標(biāo)Southern印跡法工 序與目標(biāo)屬或者種的基因組或者cDNA雜交,以識別和分離其中相應(yīng)的基因。此類探針可比 完整序列短很多,但是長度應(yīng)當(dāng)為至少15個,優(yōu)選至少25個,更優(yōu)選至少35個核苷酸。此 夕卜,此類探針可被用于通過PCR來擴增DNA啟動子。也可以使用更長的探針??梢允褂肈NA、 RNA和肽核酸(PNA)探針。典型地,對探針進行標(biāo)記,用于探測相應(yīng)的基因(例如,用032P、 @33P、@3H、035S、生物素或者親和素或者熒光標(biāo)記物)。此類探針被涵蓋在本發(fā)明中。
[0096] 因此,可對從所述其它生物制得的基因組DNA或者cDNA文庫加以篩選,選出與上 述探針雜交并編碼多肽的DNA??赏ㄟ^瓊脂糖或者聚丙烯酰胺凝膠電泳或者其它分離技術(shù) 來分離來自此類其它生物的基因組或者其它DNA??蓪碜晕膸斓腄NA或者分離的DNA轉(zhuǎn)移 并固定到硝酸纖維素或者其它合適的載體材料上。為識別出與SEQIDN0:1、SEQIDN0:2、 SEQIDNO:3、SEQIDNO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、 SEQIDNO: 15、SEQIDNO: 16或者SEQIDNO: 17或者其子序列同源的克隆或者DNA,可將 運載體材料用于Southern印跡中。
[0097] 就本發(fā)明的目的而言,雜交指:核酸序列與對應(yīng)于SEQIDN0:1、SEQIDN0:2、SEQ IDNO:3、SEQIDNO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQ IDNO: 15、SEQIDNO: 16或者SEQIDNO: 17所示核酸序列的互補鏈的經(jīng)標(biāo)記核酸探針在 非常低至非常高嚴(yán)格條件下雜交。用例如X射線膜來探測在這些條件下與核酸探針雜交 的分子。也可使用其它雜交技術(shù),例如,使用熒光來探測以及玻璃片(glassside)和/或 DNA微陣列作為支持物的技術(shù)。FEMSYeastRes. 2003Dec;4 (3): 259-69 (Daran-Lapujade P,DaranJM,KotterP,PetitT,PiperMD,PronkJT."Comparativegenotypingof theSaccharomycescerevisiaelaboratorystrainsS288CandCEN.PK113-7Dusing oligonucleotidemicroarrays"中給出了DNA微陣列雜交探測的例子。此外,PNA微陣 列用于雜交的用途在NucleicAcidsRes. 20030ctl;31(19):ell9(Brandt0,F(xiàn)eldner J,StephanA,SchroderM,SchnolzerM,ArlinghausHF,HoheiselJD,JacobA.PNA microarraysforhybridisationofunlabelledDNAsamples)中描述。
[0098] 在一個優(yōu)選的實施方式中,核酸探針為SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、 SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、 SEQIDNO: 16或者SEQIDNO: 17的核酸序列。在另一優(yōu)選的實施方式中,核酸探針為具有 以下的序列:
[0099] a.SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQID NO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQIDNO: 17 的第 20 至 1480 位核苷酸,更優(yōu)選SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、 SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQIDNO: 17 的第 500 至 1480 位核苷酸,甚至更優(yōu)選SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQ IDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQIDNO: 17 的第 800 至 1480 位核苷酸,以及最優(yōu)選SEQIDNO: 1、SEQIDNO:2、SEQIDNO:3、SEQID NO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQ IDNO: 17的第900至1480位核苷酸;或者
[0100] b.SEQIDNO: 15 的第 20 至 651 位核苷酸,更優(yōu)選SEQIDNO: 15 的第 100 至 651 位核苷酸,甚至更優(yōu)選SEQIDNO: 15的第200至651位核苷酸,以及最優(yōu)選SEQIDNO: 15 的第300至651位核苷酸;或者
[0101] 另一優(yōu)選探針為緊鄰轉(zhuǎn)錄起始位點之前的DNA序列的部分。
[0102] 對于長度為至少100個核苷酸的長探針而言,非常低至非常高嚴(yán)格條件被定義 為:按照標(biāo)準(zhǔn)Southern印跡法工序,在42攝氏度下在以下中進行預(yù)雜交和雜交:5倍SSPE、 0. 3%SDS、200微克/ml經(jīng)剪切和變性的鮭魚精DNA,以及對于非常低和低嚴(yán)格而言的25% 甲酰胺;對于中等和中-高嚴(yán)格而言的35%甲酰胺;或者對于高嚴(yán)格和非常高嚴(yán)格而言的 50%甲酰胺。
[0103] 對于長度為至少100個核苷酸的長探針而言,載體材料被最終洗滌三次,每次15 分鐘,其中使用2倍SSC、0. 2%SDS,優(yōu)選至少在45攝氏度(非常低嚴(yán)格),更優(yōu)選在至少50 攝氏度(低嚴(yán)格),更優(yōu)選在至少55攝氏度(中嚴(yán)格),更優(yōu)選在至少60攝氏度(中-高 嚴(yán)格),甚至更優(yōu)選在至少65攝氏度(高嚴(yán)格)以及最優(yōu)選在至少70攝氏度(非常高嚴(yán) 格)下進行。
[0104] 對于長度為大約15個核苷酸至大約70個核苷酸的短探針而言,嚴(yán)格條件被定義 為:預(yù)雜交、雜交和雜交后洗漆在比根據(jù)Bolton和McCarthy(1962,Proceedingsofthe NationalAcademyofSciencesUSA48:1390)的算式計算得到的Tm低 5 攝氏度至 10 攝氏度的溫度下,在 0.9MNaCl、0.09MpH7.6 的Tris-HCl、6mM£01八、0.5%咿-40、1倍 Denhardt's溶液、ImM焦憐酸納、ImM憐酸二氧納、0.ImMATP和0. 2mg酵母RNA/ml中,按照 標(biāo)準(zhǔn)Southern印跡法工序來進行。
[0105] 對于長度為大約15個核苷酸至大約70個核苷酸的短探針而言,載體材料如下洗 滌:使用6倍SSC加0. 1 %SDS洗滌一次,15分鐘;用6倍SSC洗兩次,每次15分鐘,在比計 算出的Tm低5攝氏度至10攝氏度下進行。
[0106] 根據(jù)另一優(yōu)選的實施方式,SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、 SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQIDN0:16* 者SEQIDNO: 17首先被用于克隆與之可操作相連的天然基因、編碼序列或者其部分。這可 以用前文定義的SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQ IDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 或者其子序列來開始,用該序列作為探針。將探針與給定宿主(Rasamsoniaemersonii或 者本申請中定義的任何其它宿主)的cDNA或者基因組文庫雜交。一旦天然基因或者其部 分已被克隆,隨后就可以通過如本文所述的雜交實驗,用其自身作為探針去克隆來自其它 真菌的其同源基因。
[0107] 在本發(fā)明的上下文中,同源基因是指與天然基因至少50%同源(相同)的基因。 優(yōu)選地,同源基因與天然基因至少55 %同源,更優(yōu)選至少60 %,更優(yōu)選至少65 %,更優(yōu)選至 少70 %,甚至更優(yōu)選至少75 %,優(yōu)選約80 %,更優(yōu)選約90 %,甚至更優(yōu)選約95 %,甚至更優(yōu) 選約97 %,甚至更優(yōu)選約98 %,甚至更優(yōu)選約99 %,以及最優(yōu)選約99. 5 %同源。
[0108] 同源基因編碼序列上游的序列是本發(fā)明所涵蓋的啟動子?;蛘?,使用例如本文所 述的比對或者BLAST算法,可以用前文定義的SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDNO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、 SEQIDNO: 16或者SEQIDNO: 17或者其子序列去檢索基因組數(shù)據(jù)庫來識別對與本發(fā)明啟 動子可操作相連的天然基因、編碼序列或者其部分的序列。該識別出的序列隨后可被用于 識別本申請所定義的任何其它宿主中的直系同源(orthologue)或者同源基因。識別出的 直系同源或者同源基因的編碼序列上游序列是本發(fā)明所涵蓋的啟動子。
[0109] 根據(jù)另一優(yōu)選的實施方式,本發(fā)明的啟動子DNA序列是(分離的)DNA序列,其與 SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQ IDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 至少 50% 同源 (相同)。優(yōu)選地,DNA序列與SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQ IDNO: 5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者 SEQIDNO: 17至少55%同源,更優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,甚至更 優(yōu)選至少75 %,優(yōu)選約80 %,更優(yōu)選約90 %,甚至更優(yōu)選約95 %,甚至更優(yōu)選約97 %,甚至 更優(yōu)選約98%,甚至更優(yōu)選約99%,以及最優(yōu)選約99. 5 %同源。
[0110] 就本發(fā)明的目的而言,兩條核酸序列之間同源性(同一性)的程度優(yōu)選通過BLAST 程序來確定。用于進行BLAST分析的軟件是公眾可通過國家生物信息中心(National CenterforBiotechnologyInformation)(http://www.ncbi.nlm.nih.gov/)獲得 的。BLAST算法參數(shù)W、T和X確定了比對的靈敏度和速度。BLAST程序使用缺省值,字 長(W)為 11,BL0SUM62 分?jǐn)?shù)矩陣(參見Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比對⑶為50,期望(E)為10,M= 5,N=-4,以及對兩條鏈比較。
[0111] 術(shù)語"同源性"、"同一性"或者"同一性百分比"在本文中可互換使用。就本發(fā)明的 目的而言,在此定義為:為確定兩條氨基酸序列或者兩條核酸序列的同一性百分比,本著最 佳比較的目的(例如,可以在第一條氨基酸序列或者核苷酸序列上引入缺口,以與第二條 氨基酸序列或者核苷酸序列最佳比對)來對序列進行比對。然后對相應(yīng)氨基酸位置或者核 苷酸位置上的氨基酸殘基或者核苷酸進行比較。如果第一條序列上某位置的氨基酸殘基或 者核苷酸與第二條序列上相應(yīng)位置的相同,那么分子在此位置就是相同的。兩條序列間的 同一性百分比是序列共有的相同位置的數(shù)量的函數(shù)(即,同一性%=相同位置的數(shù)量/位 置(即重疊位置)總數(shù)X100)。優(yōu)選地,兩條序列長度相同。
[0112] 在另一優(yōu)選的實施方式中,啟動子是SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、 SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、 SEQIDNO: 16或者SEQIDNO: 17的子序列,該子序列仍然具有啟動子活性。子序列優(yōu)選含 有至少約100個核苷酸,更優(yōu)選至少約200個核苷酸,以及最優(yōu)選至少約300個核苷酸。
[0113] 在另一優(yōu)選的實施方式中,子序列是由已缺失5'和/或3'端的一個或者更多個 核苷酸的SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQID NO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 涵 蓋的核酸序列,該DNA序列仍然具有啟動子活性。
[0114] 在另一優(yōu)選的實施方式中,啟動子序列是"經(jīng)修整的(trimmed)"的子序列,即, 翻譯起始處和/或轉(zhuǎn)錄起始處上游的序列片段。對啟動子進行修整以及功能分析的例子 見Gene. 1994Aug5 ; 145 (2):179-87:theeffectofmultiplecopiesoftheupstream regiononexpressionoftheAspergillusnigerglucoamylase-encodinggene. VerdoesJC,PuntPJ,StouthamerAH,vandenHondelCA)中所述。
[0115] 在本發(fā)明的另一實施方式中,啟動子DNA序列是SEQIDN0:1、SEQIDN0:2、SEQ IDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:11、SEQIDN0:13、SEQIDN0:14、SEQID NO: 15、SEQIDNO: 16 或者SEQIDNO: 17 的變體。
[0116] 術(shù)語"變體"或者"變體啟動子"在本文中被定義為具有下述核苷酸序列的啟動子, 所述核苷酸序列包含親本啟動子一個或者更多個核苷酸的替換、缺失和/或插入,其中變 體啟動子較之相應(yīng)的親本啟動子具有更多或者更少的啟動子活性。這些替換、缺失和/或 插入的長度可不同,例如1-1000個核苷酸,優(yōu)選1-100個核苷酸,更優(yōu)選1-20個核苷酸,甚 至更優(yōu)選1-10個核苷酸,還更優(yōu)選1-6個核苷酸,以及最優(yōu)選1-3個核苷酸,但仍然得到具 有啟動子活性的生物活性多核苷酸。
[0117] 術(shù)語"變體啟動子"涵蓋天然變體和用本領(lǐng)域公知的方法例如經(jīng)典誘變、定點誘變 和DNA改組(shuffling)獲得的體外產(chǎn)生的變體。變體啟動子可以具有一處或者更多處突 變。每處突變是獨立的核苷酸的替換、缺失和/或插入。
[0118] 根據(jù)一個優(yōu)選的實施方式,變體啟動子為:較之最初識別出的啟動子序列(SEQID N0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、 SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17)具有至少一處經(jīng)修飾的 調(diào)控位點的啟動子。此類調(diào)控位點可以被整體去除或者按照上文的解釋進行特異性突變。 此類啟動子變體的調(diào)控被修飾從而例如其不再被葡萄糖所誘導(dǎo)。此類啟動子變體和如何獲 得它們的技術(shù)的例子在EP673429或者W094/04673中描述。
[0119]啟動子變體可以是等位變體。等位變體是指占據(jù)相同染色體基因座的基因的兩種 或者更多種可替換形式中的任意種。等位變化是通過突變天然產(chǎn)生的,其能導(dǎo)致種群內(nèi)的 多態(tài)性??赏ㄟ^下述獲得變體啟動子:(a)在非常低、低、中、中-高、高或者非常高嚴(yán)格條 件下,使DNA與⑴SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、 SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQIDN0:16*#SEQID NO: 17 ; (ii) (i)的子序列;或者(iii) (i)、(ii)的互補鏈雜交,以及(b)從DNA分離變體啟 動子。嚴(yán)格性和洗滌條件如本文所定義。
[0120] 本發(fā)明的啟動子可以是其序列可提供有接頭的啟動子,所述接頭用于如下目的: 引入特定限制位點從而促進啟動子序列與編碼多肽的核酸序列編碼區(qū)之間的連接。
[0121] 本文提供的序列信息不應(yīng)被狹義理解為需要包括被錯誤識別的堿基。本文公開的 特定序列可容易地被用于從優(yōu)選的絲狀真菌(特別是Rasamsonia)分離原始DNA序列,再 對其進行進一步的序列分析,由此識別出測序錯誤。
[0122] 除非另有指明,本文中通過對DNA分子進行測序測定的所有核苷酸序列都是用自 動DNA測序儀測定的。因此,如本領(lǐng)域關(guān)于通過該自動方法測定的任何DNA序列所已知的, 本文測定的任何核苷酸序列可能含有一些錯誤。通過自動方法測定的核苷酸序列典型地與 被測序DNA分子的實際核苷酸序列至少大約90%相同,更典型地,至少約95%相同至至少 大約99. 9%相同??梢酝ㄟ^包括本領(lǐng)域公知的手動DNA測序方法的其它方法對實際序列 進行更為精確的測定。
[0123] 本領(lǐng)域技術(shù)人員能識別出此類被錯誤識別的堿基,并且知道如何更正此類錯誤。
[0124] 本發(fā)明涵蓋啟動子的功能等同物,其典型地含有不改變相關(guān)啟動子生物功能的突 變。術(shù)語"功能等同物"也涵蓋RasamsoniaDNA序列的直系同源物。RasamsoniaDNA序列 的直系同源物是可從其它生物體、其他真菌物種或者菌株中分離并且具有相似或者相同生 物活性的DNA序列。
[0125] 本發(fā)明的啟動子序列可從任何屬的微生物中獲得。就本發(fā)明的目的而言,如本文 所使用的與給定來源相關(guān)的術(shù)語"從……獲得"應(yīng)表示:多肽是該來源產(chǎn)生的或者是被來自 該來源的基因所插入的細胞產(chǎn)生的。
[0126] 啟動子序列可從真菌來源獲得,優(yōu)選Rasamsonia菌株,更優(yōu)選Rasamsonia emersonii〇
[0127] Rasamsonia是包括耐熱和嗜熱的Talaromyces和Geosmithia物種的新 屬(J.Houbraken等人,見上)?;诒硇?、生理和分子數(shù)據(jù),Houbraken等人提議將 T.emersonii、T.byssochlamydoides、T.eburneus、G.argillacea和G.cylindrospora種改 為Rasamsoniagen.nov。Talaromycesemersonii、Penicilliumgeosmithiaemersonii 和Rasamsoniaemersonii在本文中可交換使用。
[0128] 應(yīng)理解,對上述物種而言,本發(fā)明包括完美的和不完美的狀態(tài)以及其它分類學(xué)等 同物,例如,無性型(anamorph),而不管它們是以什么種名被知道的。本領(lǐng)域技術(shù)人員容 易對合適的等同物加以鑒定。這些物種的菌株是公眾容易從大量的培養(yǎng)單位獲得的,例 如,美國典型培養(yǎng)物保藏中心(AmericanTypeCultureCollection(ATCC))、德國微生物 和細胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturen GmbH(DSM))、荷蘭真菌培養(yǎng)物保藏中心(CentraalbureauVoorSchi_elcultures(CBS)) 和農(nóng)業(yè)研究機構(gòu)專利培養(yǎng)物保藏中興北區(qū)研究中心(AgriculturalResearchService PatentCultureCollection,NorthernRegionalResearchCenter(NRRL))〇
[0129] 而且,可使用上文提到的探針,從其它來源(包括從自然界(例如,土壤、肥料、水 等)分離的微生物)鑒定并獲得根據(jù)本發(fā)明的啟動子序列。用于從自然環(huán)境分離微生物的 技術(shù)是本領(lǐng)域公知的。然后可以通過對其它微生物基因組DNA文庫進行類似篩選來獲得核 酸序列。一旦用探針探測出了編碼啟動子的核酸序列,就可以利用本領(lǐng)域普通技術(shù)人員已 知的技術(shù)來分離或者克隆該序列(例如,參見Sambrook等人,1989,見上)。
[0130] 在本發(fā)明中,啟動子DNA序列還可以是雜合啟動子,其包含本發(fā)明的一種或者更 多種啟動子的一部分;本發(fā)明的啟動子的一部分以及另外的已知啟動子的一部分,例如,一 種啟動子的前導(dǎo)序列(leadersequence)和來自其它啟動子的轉(zhuǎn)錄起始位點;或者本發(fā)明 的一種或者更多種啟動子的一部分以及一種或者更多種其它啟動子的一部分。其它啟動子 可以是任何在選用的宿主細胞中顯示出轉(zhuǎn)錄活性的啟動子序列,包括變體的、截短的和雜 合的啟動子,并且其可以從編碼對于宿主細胞來說同源或者異源的、細胞外或者細胞內(nèi)多 肽的基因獲得。其它啟動子序列可以是對編碼多肽的核酸序列來說天然的或者外源的,并 且對細胞來說可以是天然的或者外源的。
[0131] 作為一個優(yōu)選的實施方式,鑒定出的啟動子的重要調(diào)控子序列可以與其它 "基礎(chǔ)"啟動子融合,從而增強它們的啟動子活性(例如,見MolMicrobiol. 1994May; 12 (3):479-90.Regulationofthexylanase-encodingxlnAgeneofAspergillus tubigensis.deGraaffLH,vandenBroeckHC,vanOoijenAJ,VisserJ.中所述)。
[0132] 可用于與本發(fā)明的啟動子一起構(gòu)建雜合啟動子的其它啟動子的其他例子包括:從 A.oryzaeTAKA淀粉酶、Rhizomucormiehei天冬氨酸蛋白酶、A.niger中性a-淀粉酶、 A.niger酸穩(wěn)定性a-淀粉酶、A.niger或者Aspergillusawamori葡糖淀粉酶(glaA)、 A.nigergpdA、A.niger葡萄糖氧化酶goxC、Rhizomucormiehei脂酶、A.oryzae喊性蛋白 酶、A.oryzae憐酸丙糖異構(gòu)酶、A.nidulans乙醜胺酶和Fusariumoxysporum膜蛋白酶樣蛋 白酶(W0 96/00787)的基因獲得的啟動子,以及NA2-tpi啟動子(來自A.niger中性a-淀 粉酶和A.oryzae磷酸丙糖異構(gòu)酶基因的啟動子的雜合體)、Saccharomycescerevisiae烯 醇酶(EN0-1)、Saccharomycescerevisiae半乳糖激酶(GAL1)、Saccharomycescerevisiae 醇脫氧酶/甘油醒_3_憐酸脫氧酶(ADH2/GAP)和Saccharomycescerevisiae3_憐酸甘 油酸激酶的基因獲得的啟動子及其突變的、截短的和雜合的啟動子。酵母宿主細胞的另一 些可使用啟動子通過Romanos等人,1992,Yeast8:423-488描述。
[0133] 在本發(fā)明中,啟動子DNA序列還可以是"串聯(lián)啟動子"。"串聯(lián)啟動子"在本文中被 定義為兩個或者更多個啟動子序列,它們每一個都與編碼序列可操作相連,并介導(dǎo)編碼序 列轉(zhuǎn)錄成mRNA。
[0134] 串聯(lián)啟動子包含:本發(fā)明的兩種或者更多種啟動子,或者本發(fā)明的一種或者更多 種啟動子與一種或者更多種其它已知的啟動子,例如上文例示的用于構(gòu)建雜合啟動子的那 些。串聯(lián)啟動子的兩種或者更多種啟動子序列可以同時促進核酸序列的轉(zhuǎn)錄。或者,串聯(lián) 啟動子的一種或者更多種啟動子序列可以促進核酸序列在細胞不同生長階段或者菌絲體 不同形態(tài)部分的轉(zhuǎn)錄。
[0135] 在本發(fā)明中,啟動子對于編碼生物化合物的編碼序列可以是外源的和/或啟動子 對于宿主細胞來說可以是外源的。本發(fā)明的變體、雜合或者串聯(lián)啟動子應(yīng)當(dāng)被理解為對于 編碼的編碼序列來說是外源的,即使野生型啟動子對編碼序列或者宿主細胞是天然的。
[0136] 本發(fā)明的變體、雜合或者串聯(lián)啟動子的啟動子活性為:具有SEQIDNO: 1、SEQID NO:2,SEQIDNO:3,SEQIDNO:4,SEQIDNO:5,SEQIDNO: 12,SEQIDNO: 13,SEQID NO: 14、SEQIDNO: 15、SEQIDNO: 16或者SEQIDNO: 17的啟動子的啟動子活性的至少約 20%、優(yōu)選至少約40%、更優(yōu)選至少約60%、更優(yōu)選至少約80%、更優(yōu)選至少約90%、更優(yōu) 選至少約100%、甚至更優(yōu)選至少約200%、最優(yōu)選至少約300%、以及甚至最優(yōu)選至少約 400 %。啟動子活性優(yōu)選如說明書中前述部分所述來測定。
[0137] 本發(fā)明還涉及下述DNA構(gòu)建體,該DNA構(gòu)建體包含(至少一個)如上所述的啟動子 DNA序列和與該啟動子DNA序列可操作相連的編碼序列,從而編碼序列可以在啟動子DNA 序列的控制下表達。這可在任何合適的宿主細胞中檢測?;蛘撸@可在合適的體外表達和 /或翻譯體系中檢測。編碼序列可從任何原核的、真核的或者其它來源中獲得?;蛘?,編碼 序列可以是合成的或者部分合成的序列。合成基因的密碼子使用己經(jīng)被最優(yōu)化來匹配宿主 細胞物種的密碼子使用,從而促進所編碼的生物物質(zhì)的表達和/或分泌。優(yōu)化密碼子使用 的例子描述于W097/11086中,其中植物多肽的密碼子使用被優(yōu)化為在絲狀真菌細胞中表 達。優(yōu)選地,編碼序列編碼生物化合物。兩種或者更多種這些DNA構(gòu)建體可連接以形成新 的(串聯(lián))DNA構(gòu)建體。該新的(串聯(lián))構(gòu)建體可包含兩種或者更多種DNA構(gòu)建體,其例如 包含(啟動子-開放閱讀框-終止子)連接至(啟動子-開放閱讀框-終止子),該(啟動 子-開放閱讀框-終止子)可任選連接下一個(啟動子-開放閱讀框-終止子)單元。在 例如有5個線狀排列單元的情況下,DNA構(gòu)建體優(yōu)選包含5種不同的啟動子,從而防止單元 因重組而缺失。優(yōu)選至少一種啟動子為本發(fā)明的啟動子。
[0138] 或者,編碼序列可編碼反義RNA和/或RNAi(RNA干擾)構(gòu)建體的表達。反義RNA 表達的實例顯不于ApplEnvironMicrobiol. 2000Feb;66 (2): 775-82.(Characterization ofafoldase,proteindisulfideisomeraseA,intheproteinsecretorypathway ofAspergillusniger.NgiamC,JeenesDJ,PuntPJ,VanDenHondelCA,ArcherDB) 或者(ZrennerR,ffillmitzerL,SonnewaldU.Analysisoftheexpressionofpotato uridinediphosphate-glucosepyrophosphorylaseanditsinhibitionbyantisense RNA.Planta. (1993) ; 190 (2): 247-52)中?;虮磉_的完全滅活用于例如滅活控制不期望 的代謝途徑分支的基因,例如從而提高特定次級代謝產(chǎn)物例如內(nèi)酰胺)抗生素或者類 胡蘿卜素的產(chǎn)生。完全滅活也用于減少毒素或者非所需化合物的產(chǎn)生(Penicillium中的 黃青霉素;Aspergillus中的黃曲霉毒素:MacDonaldKD等人,heterokaryonstudiesand thegeneticcontrolofpenicillinandchrysogeninproductioninPenicillium chrysogenum.JGenMicrobiol. (1963)33:375-83)。完全滅活還用于改變生物的形態(tài)以改 進發(fā)酵過程和下游加工。
[0139] 本發(fā)明的另一實施方式涉及對宿主細胞的廣泛代謝程序重排或者工程改造。引入 全新的途徑和/或修飾非所需途徑會提供特別適用于產(chǎn)生特定生物化合物(例如蛋白質(zhì)或 者代謝產(chǎn)物)的細胞。
[0140] 在本發(fā)明的方法中,當(dāng)編碼序列編碼多肽時,該多肽還可包括融合的或者雜合的 多肽,其中另一多肽與該多肽或者其片段的N-末端或者C-末端融合。融合的多肽通過將 編碼一個多肽的核酸序列(或者其一部分)與編碼另一多肽的核酸序列(或者其一部分) 融合來產(chǎn)生。用于產(chǎn)生融合多肽的技術(shù)為本領(lǐng)域已知,其包括:連接編碼多肽的編碼序列, 使得其同框并且使得融合多肽的表達位于相同的啟動子和終止子控制下。雜合多肽可包含 由至少兩個不同多肽獲得的部分或者完整多肽序列的組合,其中一個或者更多個所述多肽 可以對真菌細胞而言異源。
[0141] 除啟動子DNA序列外,DNA構(gòu)建體可包含一個或者更多個控制序列,啟動子DNA序 列指導(dǎo)編碼序列在合適宿主細胞中在與控制序列相容的條件下表達。表達應(yīng)理解為包括多 肽生產(chǎn)中涉及的任何步驟,其包括但不僅限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。 一個或者更多個控制序列可以對編碼序列或者宿主是天然的?;蛘?,一個或者更多個控制 序列可以用對核酸序列而言為外源的一個或者更多個控制序列代替,用于改善編碼序列在 宿主細胞中的表達。
[0142] "DNA構(gòu)建體"在本文中被定義為單鏈或者雙鏈的核酸分子,其分離自天然存在的 基因,或者其經(jīng)修飾而含有以自然中不會存在的方式組合和并置的核酸區(qū)段。當(dāng)DNA構(gòu)建 體含有編碼序列和編碼序列表達所需的全部控制序列時,術(shù)語DNA構(gòu)建體與術(shù)語表達盒同 義。
[0143] 術(shù)語"控制序列"在本文中被定義為包括對編碼序列表達必需或者有利的所有 成分,包括本發(fā)明的啟動子。各控制序列可以對編碼多肽的核酸序列是天然的或者外源 的。這類控制序列包括但不僅限于前導(dǎo)序列、翻譯起始序列(如在Kozak,1991,J.Biol. Chem. 266:19867-19870中所述)、翻譯起始編碼序列、聚腺苷酸化序列、前肽序列、信號肽 序列、上游激活序列、本發(fā)明的啟動子(包括源自它的變體、片段和雜合以及串聯(lián)啟動子)、 轉(zhuǎn)錄終止子和翻譯終止子??刂菩蛄凶钌侔ㄞD(zhuǎn)錄和翻譯終止信號和(部分的)本發(fā)明 啟動子??刂菩蛄锌梢耘c用于引入特異限制性位點的接頭一起提供,以便于連接控制序列 與編碼多肽的核酸序列的編碼區(qū)。
[0144] 控制序列可以是合適的轉(zhuǎn)錄終止子序列,即被宿主細胞識別以終止轉(zhuǎn)錄的序列。 終止子序列與編碼多肽的編碼序列3'末端可操作相連。任何在所選宿主細胞中有功能的 終止子可用于本發(fā)明。
[0145] 用于絲狀真菌宿主細胞的優(yōu)選終止子得自A.oryzaeTAKA淀粉酶、A.niger葡 糖淀粉酶、A.nidulans氨基苯甲酸合酶、A.nigera-葡糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶樣蛋白酶的基因。
[0146] 控制序列還可為合適的前導(dǎo)序列,即mRNA的5'非翻譯區(qū),其對宿主細胞翻譯是重 要的。前導(dǎo)序列與編碼多肽的核酸序列的5'末端可操作相連。任何在所選宿主細胞中有 功能的前導(dǎo)序列可用于本發(fā)明。
[0147] 用于絲狀真菌宿主細胞的優(yōu)選前導(dǎo)序列由A.oryzaeTAKA淀粉酶、A.nidulans磷 酸丙糖異構(gòu)酶和A.nigerglaA的基因獲得。
[0148] 控制序列還可以是聚腺苷酸化序列,該序列與核酸序列3'末端可操作相連并且 經(jīng)轉(zhuǎn)錄后被宿主細胞識別為向經(jīng)轉(zhuǎn)錄的mRNA添加聚腺苷酸殘基的信號。在所選宿主細胞 中有功能的任何聚腺苷酸化序列可用于本發(fā)明。
[0149] 用于絲狀真菌宿主細胞的優(yōu)選的聚腺苷酸化序列由A.oryzaeTAKA淀粉酶、 A.niger葡糖淀粉酶、A.nidulans氨基苯甲酸合酶、Fusariumoxysporum膜蛋白酶樣蛋白 酶和A.nigera-葡糖苷酶獲得。
[0150] 控制序列還可以是信號肽編碼區(qū),其編碼與多肽的氨基末端連接并指導(dǎo)被編碼的 多肽進入細胞分泌途徑的氨基酸序列。核酸序列編碼序列的5'端可固有地含有信號肽編 碼區(qū),該信號肽編碼區(qū)與編碼被分泌多肽的編碼區(qū)區(qū)段按翻譯閱讀框天然連接?;蛘?,編碼 序列的5'端可含有對編碼序列是外源的信號肽編碼區(qū)。當(dāng)編碼序列天然不含有信號肽編 碼區(qū)時,可需要外源信號肽編碼區(qū)?;蛘?,外源信號肽編碼區(qū)可簡單地替換天然信號肽編碼 區(qū),從而增強多肽的分泌。然而,指導(dǎo)所表達的多肽進入所選宿主細胞分泌途徑的任何信號 肽編碼區(qū)可用于本發(fā)明。
[0151] 用于絲狀真菌宿主細胞的有效信號肽編碼區(qū)為由A.oryzaeTAKA淀粉酶、A.niger 中性淀粉酶、A.ficuum植酸酶、A.niger葡糖淀粉酶、A.niger內(nèi)切木聚糖酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicolainsolens纖維素酶和Humicolalanuginosa脂酶的基 因獲得的信號肽編碼區(qū)。
[0152] 用于酵母宿主細胞的有用信號肽由Saccharomyces cerevisiaea-因子和 Saccharomyces cerevisiae轉(zhuǎn)化酶的基因獲得。另一些有用的信號肽編碼區(qū)描述于 Romanoset al.,1992,見上。
[0153] 控制序列還可以是前肽編碼區(qū),其編碼位于多肽氨基末端的氨基酸序列。得到的 多肽稱為前酶(proenzyme)或者前多肽(或者一些情況下為酶原(zymogen))。前多肽通 常是無活性的,并可通過將前肽從前多肽上催化或者自身催化切割轉(zhuǎn)化為成熟的活性多 肽。前肽編碼區(qū)可由Bacillussubtilis堿性蛋白酶(aprE)、Bacillussubtilis中性蛋 白酶(nprT)、Saccharomycescerevisiaea-因子、Rhizomucormiehei天冬氨酸蛋白酶、 ]\15^61;[0口111:110四1:1161'1]1〇口11;[13漆酶(冊 95/33836)和六.111861'內(nèi)切木聚糖酶(611(101)的基 因獲得。
[0154] 當(dāng)信號肽和前肽區(qū)均出現(xiàn)在多肽氨基末端時,前肽區(qū)處在與多肽的氨基末端相鄰 的位置,而信號肽區(qū)處在與前肽區(qū)的氨基末端相鄰的位置。
[0155] 還可期望添加調(diào)節(jié)序列,其允許相對于宿主細胞的生長調(diào)節(jié)多肽表達。調(diào)節(jié)體系 的實例為響應(yīng)化學(xué)或者物理刺激(包括調(diào)節(jié)化合物的存在)引起基因的表達被打開或者 關(guān)閉的那些調(diào)節(jié)體系。原核體系中的調(diào)節(jié)體系包括lac和trp操縱子體系。在酵母中,可 使用ADH2體系或者GAL1體系。在絲狀真菌中,可使用TAKAa-淀粉酶啟動子、A.niger葡 萄糖淀粉酶啟動子、A.oryzae葡糖淀粉酶啟動子、A.tubingensis內(nèi)切木聚糖酶(xlnA)啟 動子、A.niger硝酸還原酶(niaD)啟動子、Trichodermareesei纖維二糖水解酶啟動子和 A.nidulans醇和醛脫氫酶(分別為alcA和aldA)啟動子(如US5, 503, 991中所述)作為 調(diào)節(jié)序列。調(diào)節(jié)序列的其它實例為允許基因擴增的那些調(diào)節(jié)序列。在真核體系中,這些包 括二氫葉酸還原酶基因(其在存在氨甲蝶呤時被擴增)和金屬硫蛋白基因(其在有重金屬 時被擴增)。在這些情況下,編碼多肽的核酸序列應(yīng)與調(diào)節(jié)序列可操作相連。
[0156] 去除creA結(jié)合位點(如早先在EP673429中所述的碳分解代謝產(chǎn)物抑制)、改變 pacC和areA(用于pH和氮調(diào)節(jié))可以是重要的。
[0157] 優(yōu)選地,DNA構(gòu)建體包含本發(fā)明的啟動子DNA序列、與該啟動子DNA序列可操作相 連的編碼序列和翻譯控制序列,例如:
[0158] -選自以下序列列表的依照5'到3'方向的一個翻譯終止序列:TAAG、TAGA和 TAAA,優(yōu)選TAAA,和/或
[0159] -選自以下序列列表的依照5'到3'方向的一個翻譯起始編碼序列:GCTACCCCC; GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC和 GCTTCCTTC,優(yōu)選GCTTCCTTC;和 / 或
[0160] -選自以下序列列表的一個轉(zhuǎn)錄起始序列:5'-mwChkyCAAA_3';5'-mwChkyCACA_3' 或者 5'-mwChkyCAAG-3',采用核苷酸的不確定編碼:m(A/C) ;w(A/T) ;y(C/T) ;k(G/T); h(A/C/T),優(yōu)選 5' -CACCGTCAAA-3' 或者 5' -CGCAGTCAAG-3'。
[0161] 在本發(fā)明上下文中,術(shù)語"翻譯起始編碼序列"被定義為DNA編碼序列開放閱讀框 的起始子或者起始密碼子下游緊鄰的九個核苷酸。起始子或者起始密碼子編碼AA甲硫氨 酸。起始密碼子典型為ATG,但是也可以是任何功能性起始密碼子,例如GTG。
[0162] 在本發(fā)明上下文中,術(shù)語"翻譯終止序列"被定義為從開放閱讀框或者核苷酸編碼 序列3'端翻譯終止密碼子開始并依照5'到3'方向的三或者四個核苷酸。
[0163] 在本發(fā)明上下文中,術(shù)語"翻譯起始序列"被定義為編碼多肽的DNA序列開放閱讀 框起始子或者起始密碼子上游緊鄰的十個核苷酸。起始子或者起始密碼子編碼AA甲硫氨 酸。起始密碼子典型為ATG,但是也可以是任何功能性起始密碼子,例如GTG。本領(lǐng)域公知 的是在RNA中,尿嘧啶U替換脫氧核苷酸胸腺嘧啶T。
[0164] 本發(fā)明還涉及包含本發(fā)明啟動子、編碼多肽的編碼序列和轉(zhuǎn)錄和翻譯起始子以及 終止信號的重組表達載體。
[0165] 上述多種編碼和控制序列可以結(jié)合在一起,產(chǎn)生下述重組表達載體,該重組表達 載體可包含一個或者更多個便利的限制位點,以允許在這類位點處插入或者替換啟動子和 /或編碼多肽的編碼序列。或者,可通過例如Gene.l989Apr15;77(l):51-9.HoSN,Hunt HD,HortonRM,PullenJK,PeaseSite-directedmutagenesisbyoverlapextension usingthepolymerasechainreaction")中所述的使用PCR的序列重疊延伸(SOE-PCR) 或者通過使用Gateway?克隆體系(Invitrogen)克隆完成編碼序列和啟動子的融合?;?者,可通過將編碼序列或者包含啟動子和/或編碼序列的DNA構(gòu)建體插入適當(dāng)?shù)谋磉_載體 來表達編碼序列。創(chuàng)建表達載體時,編碼序列以下述方式位于載體中:編碼序列與本發(fā)明啟 動子和一個或者更多個適當(dāng)?shù)谋磉_控制序列可操作相連。
[0166] 重組表達載體可以是下述任何載體(例如,質(zhì)?;蛘卟《荆?,該載體可便利地進行 重組DNA操作并可完成編碼序列的表達。對載體的選擇典型地會取決于載體與所述載體待 被引入的宿主細胞間的相容性。載體可以是線性或者閉環(huán)質(zhì)粒。
[0167] 載體可以是自主復(fù)制的載體,即作為染色體外實體存在的載體,其復(fù)制不依賴于 染色體復(fù)制,例如質(zhì)粒、染色體外元件、微型染色體或者人工染色體。對自主復(fù)制而言,載體 可以包含使載體能夠在所述宿主細胞中自主復(fù)制的復(fù)制起點。用于酵母宿主細胞的復(fù)制起 點實例為2微米復(fù)制起點,ARS1,ARS4,ARS1和CEN3的組合以及ARS4和CEN6的組合。復(fù) 制起點可以是具有下述突變的復(fù)制起點,該突變使宿主細胞中復(fù)制起點的功能對于溫度敏 感(參見例如Ehrlich, 1978,ProceedingsoftheNationalAcademyofSciencesUSA 75:1433)。絲狀真菌中自主維持的克隆載體的實例為包含AMA1-序列的克隆載體。AMA1為 自A.nidulans分離的6. 〇-kb基因組DNA片段,其能夠在Aspergillus中自主維持(參見 例如Aleksenko和Clutterbuck(1997),F(xiàn)ungalGenet.Biol. 21:373-397)。
[0168] 或者,載體可以是引入宿主細胞時被整合至基因組和與將其整合至的染色體一起 復(fù)制的載體。而且,可以使用單個載體或者質(zhì)?;蛘咭黄鸢胨拗骷毎蚪M中的 全部DNA的兩個或者更多個載體或者質(zhì)粒或者轉(zhuǎn)座子。
[0169] 本發(fā)明的載體優(yōu)選含有一個或者更多個可選擇標(biāo)記物,該可選擇標(biāo)記物允許容易 地選擇經(jīng)轉(zhuǎn)化的細胞。宿主可以用至少兩個載體共轉(zhuǎn)化,其中一個包含可選擇標(biāo)記物???選擇標(biāo)記物是下述基因,所述基因的產(chǎn)物提供對抗微生物劑或者病毒的抗性、對重金屬的 抗性、針對營養(yǎng)缺陷型的原營養(yǎng)等。用于酵母宿主細胞的合適標(biāo)記物為ADE2、HIS3、LEU2、 LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細胞的可選擇標(biāo)記物包括但不限于amdS(乙 酰胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶)、bar(膦絲菌素乙酰轉(zhuǎn)移酶)、hygB(潮霉素磷酸 轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清苷-5' -磷酸鹽脫羧酶)、sC(硫酸腺噪呤基轉(zhuǎn)移 酶)、trpC(氨基苯甲酸合酶)及其等效物。也可使用提供針對例如腐草霉素、潮霉素B或 者G418抗性的標(biāo)記物。在Rasamsonia細胞中優(yōu)選使用ble和hygB選擇標(biāo)記物。
[0170] 就整合至宿主細胞基因組而言,載體可依賴于啟動子序列和/或編碼多肽的編碼 序列或者載體的任何其它元件,用于通過同源重組或者非同源重組將載體穩(wěn)定整合至基因 組內(nèi)。或者,載體可含有用于指導(dǎo)通過同源重組整合至宿主細胞基因組的額外的核酸序列。 該額外的核酸序列使得載體能夠在染色體中預(yù)先確定的靶位點整合至宿主細胞基因組。為 了提高在精確位點整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,例如30到1,500 個堿基對,優(yōu)選100到1,500個堿基對,更優(yōu)選400到1,500個堿基對,更優(yōu)選800到1,500 個堿基對并最優(yōu)選至少2kb,其與相應(yīng)的靶序列高度同源以提高同源重組的可能性。整合元 件可以是與宿主細胞基因組中靶序列同源的任何序列。而且,整合元件可以是非編碼或者 編碼核酸序列。為了促進靶向的整合,克隆載體優(yōu)選在轉(zhuǎn)化宿主細胞之前線性化。線性化 優(yōu)選以下述方式進行:克隆載體的至少一端(但是優(yōu)選兩端)側(cè)翼為與靶基因座同源的序 列。
[0171] 優(yōu)選地,克隆載體中與靶基因座同源的整合元件來自高度表達的基因座,即它們 來自能夠在真菌宿主細胞中高水平表達的基因。能夠有高表達水平的基因(即高表達的 基因)在本文中定義為下述基因,所述基因的mRNA可占據(jù)總細胞mRNA的至少0. 5% (w/w) (例如在經(jīng)誘導(dǎo)的條件下),或者,所述基因的基因產(chǎn)物可占據(jù)總細胞蛋白質(zhì)的至少1 % (w/ w),或者在經(jīng)分泌的基因產(chǎn)物情況下,可分泌至少0.lg/1的水平(如在EP357127B1中所 述)。大量優(yōu)選的高表達真菌基因以實例的方式給出:來自Aspergilli或者Trichoderma 的淀粉酶、葡糖淀粉酶、醇脫氫酶、木聚糖酶、甘油醛-磷酸脫氫酶或者纖維二糖水解酶的 基因。
[0172] 另一方面,載體可以通過非同源重組整合至宿主細胞基因組。
[0173] 可將編碼生物化合物的核酸序列的多于一個拷貝插入宿主細胞中,以促進基因產(chǎn) 物的產(chǎn)生。這可優(yōu)選通過將DNA序列的數(shù)個拷貝整合進其基因組中,更優(yōu)選通過將DNA序 列的整合靶向高表達基因座來完成?;蛘?,這可通過在核酸序列中包含可擴增的可選擇標(biāo) 記物基因,使含有經(jīng)擴增拷貝的可選擇標(biāo)記物基因從而含有額外拷貝的核酸序列的細胞可 通過在存在適當(dāng)可選擇劑時培養(yǎng)細胞而被選擇。
[0174] 用于連接上述元件以構(gòu)建本發(fā)明重組表達載體的方法為本領(lǐng)域技術(shù)人員公知 (參見例如Sambrook等人,1989,見上)。
[0175] 本發(fā)明還涉及包含與編碼序列可操作相連的本發(fā)明啟動子DNA序列的重組宿主 細胞,該宿主細胞有利地用于生產(chǎn)生物化合物。將包含與編碼序列可操作相連的本發(fā)明啟 動子的載體引入宿主細胞,使得載體作為染色體整合體或者作為前文所述的自主復(fù)制染色 體外載體而保持。術(shù)語"宿主細胞"涵蓋親本細胞的任何子代,該子代由于復(fù)制中發(fā)生的突 變而與親本細胞不同。宿主細胞的選擇很大程度上取決于編碼序列的來源和本發(fā)明啟動子 的來源。技術(shù)人員知曉如何選擇最合適的宿主細胞。
[0176] 本發(fā)明還涉及重組宿主細胞,該宿主細胞包含多于一個本發(fā)明的啟動子DNA序 列,各啟動子優(yōu)選地與編碼序列可操作相連。這類宿主細胞可有利地用于至少一種生物化 合物的重組生產(chǎn)?;蛘?,本發(fā)明的重組宿主細胞可包含與本領(lǐng)域己知啟動子組合的一個或 者更多個本發(fā)明的啟動子。本領(lǐng)域已知的這類啟動子包括但不限于由下述基因獲得的啟 動子:A.tubigensisxlnA、A.oryzaeTAKA淀粉酶、Rhizomucormiehei天冬氨酸蛋白酶、 A.niger中性a-淀粉酶、A.niger酸穩(wěn)定性a-淀粉酶、A.niger或者A.awamori葡糖淀 粉酶(glaA)、A.niger或者A.awamori內(nèi)切木聚糖酶(xlnA)或者0 -木糖苷酶(xlnD)、 T.reesei纖維二糖水解酶I(CBHI)、R.miehei脂酶、A.oryzae堿性蛋白酶、A.oryzae磷酸丙 糖異構(gòu)酶、A.nidulans乙醜胺酶、TrichodermareeseiP-葡糖苷酶、Trichodermareesei 纖維二糖水解酶I、Trichodermareesei纖維二糖水解酶II、Trichodermareesei內(nèi)切葡 聚糖酶I、Trichodermareesei內(nèi)切葡聚糖酶II、Trichode;rmareesei內(nèi)切葡聚糖酶III、 Trichodermareesei內(nèi)切葡聚糖酶IV、Trichodermareesei內(nèi)切葡聚糖酶V、Trichoderma reesei木聚糖酶I、Trichodermareesei木聚糖酶II、Trichodermareesei0 -木糖苷酶, 以及NA2_tpi啟動子(來自編碼A.niger中性a-淀粉酶和A.oryzae磷酸丙糖異構(gòu)酶的 多核苷酸的啟動子雜合物)及其突變的、截短的和雜合的啟動子。啟動子的其他例子是描 述于W02006/092396和W02005/100573中的啟動子,其通過引用方式并入本文。啟動子 使用的又一其他例子于W02008/098933中描述。誘導(dǎo)型(異源)啟動子的實例為醇誘導(dǎo) 型啟動子alcA、使用四環(huán)素響應(yīng)啟動子的tet系統(tǒng)、雌激素響應(yīng)啟動子(Pachlinger等人 (2005),Appl&EnvironmentalMicrobiol672-678)〇
[0177] 本發(fā)明的宿主細胞和本發(fā)明方法中使用的宿主細胞可以是任何宿主細胞。優(yōu)選 地,本發(fā)明的宿主細胞為真菌細胞。如本文所使用的"真菌"包括子囊菌亞門(Ascomycota)、 擔(dān)子菌亞門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如由 Hawksworth等人,AinsworthandBisby'sDictionaryofTheFungi,第 8 版,1995,CAB International,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如 Hawksworth等人,1995,見上,171頁所述)和所有的有絲分裂孢子真菌(Hawksworth等人, 1995,見上)。
[0178] 在一個優(yōu)選的實施方式中,真菌宿主細胞為絲狀真菌細胞。"絲狀真菌"包括真菌 門(Eumycota)和卵菌門亞門的所有絲狀形式(如Hawksworth等人,1995,見上所定義)。 絲狀真菌表征為由幾丁質(zhì)、纖維素、葡聚糖、殼聚糖、甘露聚糖和其它復(fù)雜多糖構(gòu)成的菌絲 體壁。營養(yǎng)生長通過菌絲伸長,并且碳分解代謝為專性需氧。相反,酵母如Saccharomyces cerevisiae的營養(yǎng)生長通過單細胞菌體出芽實現(xiàn)且碳分解代謝可以是發(fā)酵的。
[0179] 優(yōu)選地,絲狀真菌宿主細胞為以下屬的細胞:Acremonium、Agaricus、 Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filobasidium、 Fusarium、Geosmithia、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、 Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Rasamsonia、Schizophyllum、Talaromyces、Thermoascus、Thermomyces、Thielavia、 Tolypocladium或者Trichoderma。
[0180] 在一個更優(yōu)選的實施方式中,絲狀真菌宿主細胞為Humicolagriseavar. thermoidea、Humicolalanuginosa、Myceliophthorathermophila、Papulaspora thermophilia、Rasamsoniabyssochlamydoides、Rasamsoniaemersonii、Rasamsonia argi1lacea、Rasamsoniaeburnean、Rasamsoniabrevistipitata、Rasamsonia cylindrospora、Rhizomucorpusillus、Rhizomucormiehei、Talaromycesbacillisporus、 Talaromycesleycettanus、Talaromycesthermophilus、Thermomyceslenuginosus、 Thermoascuscrustaceus、ThermoascusthermophilusThermoascusaurantiacus或 者Thielaviaterrestris細胞。在另一更優(yōu)選的實施方式中,絲狀真菌宿主細胞為 Aspergillusawamori、Aspergillusfoetidus、Aspergillusjaponicus、A.nidulans、 A.niger、A.sojae、A.oryzae、Chrysosporiumlucknowense、Fusariumbactridioides、 Fusariumcerealis、Fusariumcrookwellense、Fusariumculmorum、Fusarium graminearum、Fusariumgraminum、Fusariumheterosporum、Fusariumnegundi、Fusarium oxysporum、Fusariumreticulatun、Fusariumroseum、Fusariumsambucinum、Fusarium sarcochroum、Fusariumsporotrichioides、Fusariumsulphureum、Fusariumtorulosum、 Fusariumtrichothecioides或者Fusariumvenenatum細胞。在另一更優(yōu)選的實施方 式中,絲狀真菌宿主細胞為Mucormiehei、Myceliophthorathermophila、Neurospora crassa>PenicilliumpurpurogenunuPenicilliumchrysogenunuTrichodermaharzianum、 Trichodermakoningii、Trichodermalongibrachiatum、Trichodermareesei或者 Trichodermaviride細胞。在一個最優(yōu)選的實施方式中,絲狀真菌宿主細胞為選自以下 的種:Rasamsoniaemersonii、Aspergillusniger、Aspergillusoryzae、Aspergillus sojae^Myceliophthorathermophila、Trichodermareesei或者Penici11ium chrysogenum。一個最優(yōu)選的Rasamsoniaemersonii宿主細胞為CBS393. 64或者其衍生物。
[0181] 公眾可以容易地從多個培養(yǎng)物保藏中心獲得絲狀真菌的幾種菌株,例如美國典型 培養(yǎng)物保藏中心(AmericanTypeCultureCollection(ATCC))、德國微生物和細胞培養(yǎng)物 保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH(DSM))、 荷蘭真菌培養(yǎng)物保藏中心(CentraalbureauVoorSchi_elcultures(CBS))和農(nóng)業(yè)研 究機構(gòu)專利培養(yǎng)物保藏中興北區(qū)研究中心(AgriculturalResearchServicePatent CultureCollection,NorthernRegionalResearchCenter(NRRL)Rasamsonia.emersonii ATCC16479、AspergillusnigerCBS513. 88、AspergillusoryzaeATCC20423、IF0 4177、 ATCC1011、ATCC9576、ATCC14488-14491、ATCC11601、ATCC12892、P.chrysogenumCBS 455. 95、PenicilliumcitrinumATCC38065、PenicilliumchrysogenumP2、Acremonium chrysogenumATCC36225 或者ATCC48272、TrichodermareeseiATCC26921 或者ATCC 56765 或者ATCC26921、AspergillussojaeATCC11906、Chrysosporiumlucknowense ATCC44006。
[0182] 宿主細胞可以是野生型絲狀真菌宿主細胞或者變體、突變體或者經(jīng)遺傳修飾的絲 狀真菌宿主細胞。
[0183] 可以用本身已知的方式,通過下述方法來轉(zhuǎn)化真菌細胞,該方法涉及原生質(zhì)體形 成、原生質(zhì)體轉(zhuǎn)化以及細胞壁再生。合適的用于轉(zhuǎn)化Rasamsonia宿主細胞的工序描述 于TO2011\054899中。合適的用于轉(zhuǎn)化Aspergillus宿主細胞的工序描述于EP 238023 以及Yelton等人,1984, Proceedings of the National Academy of Sciences USA 81:1470-1474中。使用Agrobacterium tumefaciens轉(zhuǎn)化Aspergillus和其他絲狀真 菌宿主細胞的合適工序描述于例如Nat Biotechnol. 1998S印;16(9) :839-42,錯誤刊 載在Nat Biotechno1 1998Nov;16 (11):1074. Agrobacterium tumefaciens-mediated transformation of filamentous fungi.de Groot MJ,Bundock P,Hooykaas PJ, Beijersbergen AG. Unilever Research Laboratory Vlaardingen, The Netherlands. 中。轉(zhuǎn)化?11831';[111]1種的合適的方法通過]\^131(1161'等人,1989,66116 78:147-156和冊 96/00787描述。可以通過Becker和Guarente, Abelson,J.N?和Simon, M. I.編輯,Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194,pp 182-187, Academic Press, Inc.,New York ;Ito等人,1983,Journal of Bacteriology 153:163;以及Hinnen等人,1978, Proceedings of the National Academy of Sciences USA 75:1920描述的工序來轉(zhuǎn)化酵母。
[0184] "生物化合物"可以是任何生物聚合物或者代謝產(chǎn)物。生物化合物可由單個編碼 序列或者組成生物合成或代謝途徑的一系列編碼序列編碼,或者可以是單一編碼序列的產(chǎn) 物或者一系列編碼序列的產(chǎn)物的直接結(jié)果。生物化合物對宿主細胞可以是天然的或者異源 的。
[0185] 術(shù)語"異源生物化合物"在本文中定義為下述生物化合物,其對給定宿主細胞不是 同源的,或者天然生物化合物中進行了結(jié)構(gòu)修飾以改變天然生物化合物。
[0186] 術(shù)語"生物聚合物"在本文定義為相同、相似或者不相似的亞單元(單體)的鏈 (或者聚合物)。生物聚合物可以是任何生物聚合物。生物聚合物可以是例如但不限于核 酸(例如RNA)、多胺、多元醇、多肽(或者聚酰胺)或者多糖。
[0187] 根據(jù)一個優(yōu)選的實施方式,生產(chǎn)的生物化合物為多肽。根據(jù)一個更優(yōu)選的實施方 式,生產(chǎn)的多肽由DNA構(gòu)建體中存在的編碼序列編碼,該DNA構(gòu)建體包含與所述編碼序列可 操作相連的本發(fā)明的啟動子。多肽可以是具有目的生物活性的任何多肽。術(shù)語"多肽"在 本文并非意指特定長度的被編碼的產(chǎn)物,并因此涵蓋肽、寡肽和蛋白質(zhì)。術(shù)語"多肽"還涵 蓋組合以形成所編碼的產(chǎn)物的兩個或者更多個多肽。多肽還包括雜合多肽,其包含得自至 少兩個不同多肽的部分或者全部多肽序列的組合,其中一個或者更多個可對宿主細胞是 異源的。多肽還包括上述多肽和雜合多肽的天然存在的等位和工程化的變異。
[0188] 多肽對給定的宿主細胞可以是天然的或者異源的。術(shù)語"異源多肽"在本文定義 為對給定宿主細胞而言并非天然的多肽?;蛘?,異源多肽為其中進行了修飾以改變天然序 列的天然多肽,或者其表達在數(shù)量上被改變的天然多肽,該改變是通過重組DNA技術(shù)操作 真菌細胞的結(jié)果。例如,可通過以下方式重組生產(chǎn)天然多肽,例如將編碼多肽的序列置于本 發(fā)明啟動子控制下,從而增強多肽表達、通過使用信號序列加速目標(biāo)天然多肽輸出細胞外, 和提高通常由細胞產(chǎn)生的編碼多肽的基因的拷貝數(shù)。
[0189] 多肽可以是膠原或者明膠、或者其變體或者雜合體。多肽可以是抗體或者其部分、 抗原、凝固因子、酶、激素或者激素變體、受體或者其部分、調(diào)節(jié)蛋白質(zhì)、結(jié)構(gòu)蛋白質(zhì)、受體或 者轉(zhuǎn)運蛋白、分泌過程涉及的蛋白質(zhì)、折疊過程涉及的蛋白質(zhì)、伴侶分子(chaperone)、肽氨 基酸轉(zhuǎn)運蛋白、糖基化因子、轉(zhuǎn)錄因子、合成肽或者寡肽、細胞內(nèi)蛋白質(zhì)。細胞內(nèi)蛋白質(zhì)可以 是酶,例如蛋白酶、神經(jīng)酰胺酶、環(huán)氧化物水解酶、氨基肽酶、?;D(zhuǎn)移酶、醛縮酶、羥化酶、 氨基肽酶、脂酶。多肽可以是細胞外分泌的酶。這類酶可以屬于以下的組:氧化還原酶、轉(zhuǎn) 移酶、水解酶、裂合酶、異構(gòu)酶、連接酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、脫氧核糖 核酸酶、葡聚糖酶、酯酶。酶可以是碳水化合物酶,例如纖維素酶例如內(nèi)切葡聚糖酶、3 -葡 聚糖酶、纖維二糖水解酶或者葡糖苷酶、半纖維素酶或者膠質(zhì)水解酶(pectinolytic enzyme)例如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果膠甲基酯酶、果 膠裂合酶、果膠酸裂合酶(pectatelyase)、內(nèi)切多聚半乳糖醒酸酶、外切多聚半乳糖醒酸 酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖酶、阿拉伯木聚糖水解酶、半乳糖醛酸 酶、裂合酶或者淀粉分解酶;水解酶,異構(gòu)酶或者連接酶,磷酸酶如植酸酶,酯酶如脂酶,蛋 白水解酶,氧化還原酶如氧化酶,轉(zhuǎn)移酶或者異構(gòu)酶。酶可以是植酸酶。酶可以是氨基肽 酶、淀粉酶、碳水化合物酶、羧肽酶、內(nèi)切蛋白酶、金屬蛋白酶、絲氨酸蛋白酶過氧化氫酶、殼 多糖酶、角質(zhì)酶、環(huán)糊精葡萄糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、a-半乳糖苷酶、半 乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、葡糖苷酶、鹵素過氧化物酶、蛋白水解酶、轉(zhuǎn)化 酶、漆酶、脂酶、甘露糖苷酶、變構(gòu)水解酶(mutanase)、氧化酶、膠質(zhì)水解酶、過氧化物酶、磷 脂酶、多酚氧化酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或者葡萄糖氧化酶、己糖氧化酶、單加氧酶。
[0190] 或者,與本發(fā)明啟動子可操作連接的編碼序列可編碼細胞內(nèi)蛋白質(zhì),例如伴 侶分子或者轉(zhuǎn)錄因子。其的一個實例描述于ApplMicrobiolBiotechnol. 19980ct; 50 (4) : 447-54 ("AnalysisoftheroleofthegenebipA,encodingthemajor endoplasmicreticulumchaperoneproteininthesecretionofhomologous andheterologousproteinsinblackAspergi11i.PuntPJ,vanGemeren IA,Drint-KuijvenhovenJ,HessingJG,vanMuijlwijk-HarteveldGM,Beijersbergen A,VerripsCT,vandenHondelCA)中。這可用于例如促進宿主細胞作為蛋白質(zhì)生產(chǎn)者或 者作為代謝產(chǎn)物的效力,如果該編碼序列(例如伴侶分子或者轉(zhuǎn)錄因子)已知是蛋白質(zhì)或 者代謝產(chǎn)物產(chǎn)生的限制因子。
[0191] 生物化合物可以是多糖。多糖可以是任何多糖,包括但不限于粘多糖(例如肝素 和透明質(zhì)酸)和含氮多糖(例如幾丁質(zhì))。在一個更優(yōu)選的選擇中,多糖為透明質(zhì)酸。
[0192] 或者,生物化合物可以是代謝產(chǎn)物。術(shù)語"代謝產(chǎn)物"涵蓋初級和次級代謝產(chǎn)物; 代謝產(chǎn)物可以是任何代謝產(chǎn)物。一個優(yōu)選的代謝產(chǎn)物為檸檬酸。
[0193] 根據(jù)另一優(yōu)選的實施方式,產(chǎn)生的生物化合物為代謝產(chǎn)物。根據(jù)一個更優(yōu)選的實 施方式,DNA構(gòu)建體中存在的編碼序列編碼涉及代謝產(chǎn)物產(chǎn)生的酶,該DNA構(gòu)建體包含與該 編碼序列可操作連接的本發(fā)明的啟動子。
[0194] 或者,本發(fā)明的DNA構(gòu)建體中可存在若干編碼序列。各編碼序列可編碼涉及引 起代謝產(chǎn)物產(chǎn)生的代謝或者生物合成途徑的不同的酶。初級代謝產(chǎn)物是細胞的初級或者 一般代謝產(chǎn)物,其涉及能量代謝、生長和結(jié)構(gòu)。次級代謝產(chǎn)物是次級代謝的產(chǎn)物(參見例 如R.B.Herbert,TheBiosynthesisofSecondaryMetabolites,ChapmanandHall,New York, 1981) 〇
[0195] 初級代謝產(chǎn)物可以是但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯或者維 生素。一個優(yōu)選的初級代謝產(chǎn)物為檸檬酸。
[0196] 次級代謝產(chǎn)物可以是但不限于生物堿、香豆素、類黃酮、聚酮化合物、奎寧、類固 醇、肽或者萜。次級代謝產(chǎn)物可以是抗生素、拒食素、引誘素、殺細菌素、殺真菌素、激素、殺 蟲劑或者殺鼠劑。優(yōu)選的抗生素為頭抱菌素和內(nèi)酰胺。
[0197] 生物化合物還可以是可選擇標(biāo)記物。可選擇標(biāo)記物是提供針對抗微生物劑或者 病毒的抗性、對重金屬抗性、對營養(yǎng)缺陷型的原養(yǎng)等的產(chǎn)物??蛇x擇標(biāo)記物包括但不限于 amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉(zhuǎn)移酶)、bar(膦絲菌素乙酰轉(zhuǎn)移酶)、hygB(潮 霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清苷-5' -磷酸鹽脫羧酶)、sC(硫酸腺嘌 呤基轉(zhuǎn)移酶)、trpC(氨基苯甲酸合酶)、ble(腐草霉素抗性蛋白)及其等效物。
[0198] 在本發(fā)明的生產(chǎn)方法中,細胞使用本領(lǐng)域己知方法在適于生產(chǎn)生物化合物的營養(yǎng) 培養(yǎng)基中培養(yǎng),該生物化合物可以是但不限于多肽或者代謝產(chǎn)物。例如,細胞可在實驗室或 者工業(yè)發(fā)酵器中通過搖瓶培養(yǎng)、小規(guī)模或者大規(guī)模發(fā)酵(包括連續(xù)、分批、分批補料或者固 態(tài)發(fā)酵)來培養(yǎng),其在合適培養(yǎng)基和使得編碼序列被表達和/或生物化合物被分離的條件 下進行。在含有碳和氮源和無機鹽的合適的營養(yǎng)培養(yǎng)基中,使用本領(lǐng)域已知工序進行培養(yǎng)。 合適的培養(yǎng)基可來自商業(yè)供貨商或者可通過(例如美國典型培養(yǎng)物保藏中心的產(chǎn)品目錄 中)公開的成分制備。如果生物化合物分泌進營養(yǎng)培養(yǎng)基,則該生物化合物可直接從培養(yǎng) 基中回收。如果生物化合物(其可以是但不限于多肽或者代謝產(chǎn)物)不分泌,那么其可從 細胞裂解物中回收。
[0199] 可通過本領(lǐng)域已知方法回收所得生物化合物,其可以是但不限于多肽或者代謝產(chǎn) 物。例如,可通過常規(guī)工序從營養(yǎng)培養(yǎng)基中回收多肽或者代謝產(chǎn)物,該常規(guī)工序包括但不限 于離心、過濾、提取、噴霧干燥、蒸發(fā)或者沉淀。
[0200] 多肽可通過本領(lǐng)域已知的多種方法純化,所述方法包括但不僅限于色譜法(例如 離子交換、親和、疏水、色譜聚焦和尺寸排阻)、電泳工序(例如制備型等電聚焦)、差異溶 解度(例如硫酸銨沉淀)、SDS-PAGE或者提?。▍⒁娎鏟roteinPurification,J. -C. Janson和LarsRyden編輯,VCHPublishers,NewYork, 1989)。多膚可使用本領(lǐng)域已知的 對于多肽特異的方法檢測。這些檢測方法可包括特異抗體的使用、酶產(chǎn)物的形成或者酶底 物的消失。
[0201] 本發(fā)明還涉及用于改變編碼多肽的編碼序列的表達的DNA構(gòu)建體,該多肽對于真 菌宿主細胞是內(nèi)源的。該構(gòu)建體可含有改變內(nèi)源基因表達所需的最少數(shù)量的成分。
[0202] 在一個實施方式中,核酸構(gòu)建體優(yōu)選含有:(a)祀向序列;(b)本發(fā)明的啟動子DNA 序列,(c)外顯子;以及(d)剪接供體位點。將核酸構(gòu)建體引入細胞時,構(gòu)建體通過同源重 組在內(nèi)源基因位點處整合至細胞基因組內(nèi)。靶向序列指導(dǎo)元件(a)-(d)進入內(nèi)源基因的整 合,使得元件(b)-(d)與內(nèi)源基因可操作相連。
[0203] 在另一實施方式中,核酸構(gòu)建體含有:(a)靶向序列;(b)本發(fā)明的啟動子DNA序 列;(c)外顯子;(d)剪接供體位點;(e)內(nèi)含子;以及(f)剪接受體位點,其中靶向序列指導(dǎo) 元件(a)-(f)的整合,使得元件(b)-(f)與內(nèi)源基因可操作相連。然而,構(gòu)建體可含有額外 的成分,如可選擇標(biāo)記物。可使用的可選擇標(biāo)記物先前已描述。
[0204] 在兩種實施方式中,這些成分的引入引起新轉(zhuǎn)錄單位的產(chǎn)生,其中內(nèi)源基因的表 達被改變。事實上,新的轉(zhuǎn)錄單位是通過靶向構(gòu)建體引入的序列和內(nèi)源基因的融合產(chǎn)物。在 一個內(nèi)源基因被改變的實施方式中,基因被激活。在該實施方式中,使用同源重組替換、破 壞或者失活調(diào)節(jié)區(qū),該調(diào)節(jié)區(qū)通常通過調(diào)節(jié)序列的插入與親本細胞的內(nèi)源基因相關(guān)聯(lián),這 引起與相應(yīng)的親本細胞中的現(xiàn)象相比所述基因以更高水平表達。
[0205] 靶向序列可以在內(nèi)源基因內(nèi)、緊鄰該基因、在上游基因內(nèi)或者在內(nèi)源基因上游和 與內(nèi)源基因有段距離??墒褂靡粋€或者更多個靶向序列。例如環(huán)形質(zhì)?;蛘逥NA片段優(yōu)選 使用單個靶向序列,而線性質(zhì)?;蛘逥NA片段優(yōu)選使用兩個靶向序列。
[0206] 構(gòu)建體還含有內(nèi)源基因的一個或者更多個外顯子。外顯子定義為下述DNA序列, 該DNA序列被拷貝為RNA并存在于成熟的mRNA分子中,使得外顯子序列與內(nèi)源基因的編碼 區(qū)同框。外顯子可任選地包含這樣的DNA,該DNA編碼一個或者更多個氨基酸和/或部分 地編碼氨基酸。或者,外顯子含有對應(yīng)于5'非編碼區(qū)的DNA。當(dāng)一個或者更多個外源外顯 子編碼一個或者更多個氨基酸和/或氨基酸的一部分時,設(shè)計核酸構(gòu)建體使得在轉(zhuǎn)錄和剪 接時,內(nèi)源基因的編碼區(qū)是同框的,從而來自第二個外顯子的mRNA部分的合適讀碼框是不 變的。構(gòu)建體的剪接供體位點指導(dǎo)一個外顯子剪接到另一外顯子。典型地,第一個外顯子 位于第二個外顯子的5',并且與第一個外顯子3'側(cè)重合并位于其側(cè)翼的剪接供體位點識 別位于第二個外顯子5'側(cè)翼的第二個外顯子側(cè)翼的剪接受體位點。剪接受體位點(類似 于剪接供體位點)是指導(dǎo)一個外顯子剪接到另一個外顯子的序列。與剪接供體位點一同作 用的剪接裝置使用剪接受體位點來促成內(nèi)含子的去除。
[0207] 用于改變給定DNA序列表達的一個優(yōu)選策略包括缺失給定DNA序列和/或通過經(jīng) 修飾的啟動子DNA序列(例如本發(fā)明的啟動子)代替給定DNA序列的內(nèi)源啟動子序列。
[0208] 替代地或者與其它提到的技術(shù)相組合,可使用基于在E.coli中粘粒的體內(nèi)重組 的技術(shù),如在Arapidmethodforefficientgenereplacementinthefilamentous fungusA.nidulans(2000)Chaveroche,M-K. ,Ghico,J-M.和d'EnfertC;Nucleicacids Research,vol28,no22中所述。該技術(shù)可應(yīng)用于其它絲狀真菌,例如R.emersonii。
[0209] 本文描述和要求保護的發(fā)明并不限于本文公開的特定實施方式的范圍,因為這些 實施方式旨在說明本發(fā)明的多個方面。任何等效的實施方式旨在包括在本發(fā)明范圍內(nèi)。事 實上,除本文示出和描述的以外,通過前述說明,本發(fā)明的多種變型對本領(lǐng)域技術(shù)人員而言 是明顯的。這類變型也旨在落入所附的權(quán)利要求書范圍內(nèi)。在沖突的情況下,以包括定義 的本公開內(nèi)容為準(zhǔn)。
[0210] 本發(fā)明通過以下實施例進一步描述,這些實施例不應(yīng)當(dāng)解釋為限制本發(fā)明的范 圍。 實施例
[0211] 應(yīng)當(dāng)理解,盡管示出本發(fā)明的優(yōu)選實施方式,但是這些實施例僅通過示例方式給 出。根據(jù)上述討論和這些實施例,本領(lǐng)域技術(shù)人員可確定本發(fā)明的必要特征,并且在沒有違 背本發(fā)明精神和范圍下,本領(lǐng)域技術(shù)人員可得到本發(fā)明的各種變化和修改以使其適應(yīng)各種 用途和條件。因此除本文示出和描述的以外,由前述說明書,本發(fā)明的多種修改對本領(lǐng)域技 術(shù)人員而言是明顯的。這類修改也旨在落入所附權(quán)利要求書的范圍內(nèi)。
[0212] 試駘信息
[0213] 菌株
[0214] 本文所使用的Rasamsoniaemersonii(R.emersonii)菌株來自ATCC16479,將 其用作野生型菌株。ATCC16479之前也稱為Talaromycesemersonii和Penicillium geosmithiaemersonii。在使用名稱Rasamsoniaemersonii時,也表不Talaromyces emersonii。R.emersoniiATCC16479 的其他菌株名稱為CBS393. 64、IF031232 和 IMI116815。
[0215] Rasamsonia(Talaromyces)emersonii菌株TEC-142 于 2009 年 7 月 1 日保藏在荷蘭 真菌培養(yǎng)物保藏中心(CENTRAALBUREAUV00RSCHIMMELCULTURES),荷蘭烏特勒支NL-3508 AD烏普薩蘭 8 號,郵箱 85167(Uppsalalaan8,P.O.Box85167,NL-3508ADUtrecht),其登 錄號為CBS124902。TEC-142S是TEC-142的單一分離菌株。
[0216] 分子牛物摶術(shù)
[0217] 在這些菌株中,使用技術(shù)人員已知的分子生物技術(shù)(參見: Sambrook&Russell,MolecularCloning:ALaboratoryManual,第 3 版,CSHLPress,Cold SpringHarbor,NY,2001),如下所述將若干種基因過表達,并將其他基因下調(diào)。用于基因 過表達的表達載體和用于下調(diào)的破壞載體、轉(zhuǎn)化、標(biāo)記物使用和選擇培養(yǎng)基的一般設(shè)計的 實例可在例如W0199846772、W0199932617、W02001121779、W02005095624、EP635574B和 W02005100573 中找到。
[0218] 培養(yǎng)某和溶液
[0219] 十豆右旋糖掠脂,PDA(Fluka,Cat.No. 70139)
【權(quán)利要求】
1. Rasamsonia 啟動子 DNA 序列,優(yōu)選 Rasamsonia emersonii 啟動子 DNA 序列。
2. 根據(jù)權(quán)利要求1所述的Rasamsonia啟動子DNA序列,其連接至能夠被過表達的編碼 序列。
3. 根據(jù)權(quán)利要求1所述的Rasamsonia啟動子DNA序列,其對應(yīng)于強啟動子和/或誘導(dǎo) 型啟動子。
4. 啟動子DNA序列,例如: (a) 以下列表中所示的 DNA 序列:SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID N0:4、SEQ ID N0:5、SEQ ID N0:12、SEQ ID N0:13、SEQ ID N0:14、SEQ ID N0:15、SEQ ID NO: 16 或者 SEQ ID NO: 17 ; (b) 能夠與(a)中DNA序列的互補體雜交的DNA序列;或者 (c) 與(a)中DNA序列至少50%同源的DNA序列。 5. DNA構(gòu)建體,其包含根據(jù)權(quán)利要求1或2所述的啟動子DNA序列和與所述啟動子DNA 序列可操作相連的編碼序列,從而所述編碼序列能夠在所述啟動子DNA序列的控制下被表 達。
6. 宿主細胞,優(yōu)選真菌宿主細胞,其包含根據(jù)權(quán)利要求3所述的DNA構(gòu)建體。
7. 根據(jù)權(quán)利要求4所述的宿主細胞,其中所述宿主細胞是來自以下屬的細胞: Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、 Cryptococcus、Filobasidium、Fusarium、Geosmithia、Humicola、Magnaporthe、Mucor、 Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、 Panerochaete、Pleurotus、Rasamsonia、Schizophyllum、Talaromyces、Thermoascus、 Thermomyces、Thielavia、Tolypocladium 或者 Trichoderma,優(yōu)選來自 Rasamsonia、 Aspergillus、Penicillium、Chrysosporium 或者 Trichoderma 屬,優(yōu)選為 Rasamsonia emersonii 〇
8. -種在合適的宿主細胞中表達編碼序列的方法,其包括: (a) 提供根據(jù)權(quán)利要求3所述的DNA構(gòu)建體; (b) 使用所述DNA構(gòu)建體轉(zhuǎn)化合適的宿主細胞;以及 (c) 在有助于所述編碼序列表達的培養(yǎng)條件下培養(yǎng)所述合適的宿主細胞。
9. 一種在合適的宿主細胞中生產(chǎn)生物化合物的方法,其包括: (a) 提供權(quán)利要求3所定義的DNA構(gòu)建體; (b) 使用所述DNA構(gòu)建體轉(zhuǎn)化合適的宿主細胞;以及 (c) 在有助于所述編碼序列表達的培養(yǎng)條件下培養(yǎng)所述合適的宿主細胞;以及任選 地, (d) 從培養(yǎng)液回收所述生物化合物。
10. 根據(jù)權(quán)利要求7所述的方法,其中生產(chǎn)的所述生物化合物為多肽或者代謝產(chǎn)物。
11. 根據(jù)權(quán)利要求8所述的方法,其中生產(chǎn)的所述多肽由存在于權(quán)利要求2所定義的 DNA構(gòu)建體中的編碼序列來編碼。
12. 根據(jù)權(quán)利要求10所述的方法,其中存在于權(quán)利要求2所定義的DNA構(gòu)建體中的所 述編碼序列編碼酶,所述酶任選地參與代謝產(chǎn)物的生產(chǎn)。
13. 編碼葡糖淀粉酶的DNA序列,其包含: (a) SEQ ID N0:23 所示的 DNA 序列; (b) 能夠與(a)中DNA序列的互補體雜交的DNA序列; (c) 與(a)中DNA序列至少50%、優(yōu)選至少60%、更優(yōu)選至少70%、甚至更優(yōu)選至少 80%、還更優(yōu)選至少90%和最優(yōu)選至少95%同源的DNA序列;或者 (d) 編碼葡糖淀粉酶且與SEQ ID NO:24至少50%、優(yōu)選至少60%、更優(yōu)選至少70%、 甚至更優(yōu)選至少80%、還更優(yōu)選至少90%和最優(yōu)選至少95%同源的DNA序列。
14.葡糖淀粉酶,其具有與SEQ ID NO: 24至少50%、優(yōu)選至少60%、更優(yōu)選至少70%、 甚至更優(yōu)選至少80%、還更優(yōu)選至少90%和最優(yōu)選至少95%同源的DNA序列。
【文檔編號】C12P1/02GK104508114SQ201380032068
【公開日】2015年4月8日 申請日期:2013年6月17日 優(yōu)先權(quán)日:2012年6月19日
【發(fā)明者】埃里克·皮特·洛斯, 威爾伯特·赫爾曼·馬里·海涅, 赫爾曼·揚·佩爾, 羅波圖斯·安東尼厄斯·戴維爾德, 布倫達·沃恩克 申請人:帝斯曼知識產(chǎn)權(quán)資產(chǎn)管理有限公司