欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于在真菌細(xì)胞中表達(dá)基因的啟動子的制作方法

文檔序號:442403閱讀:472來源:國知局
專利名稱:用于在真菌細(xì)胞中表達(dá)基因的啟動子的制作方法
背景技術(shù)
發(fā)明領(lǐng)域本發(fā)明涉及制備多肽的方法。本發(fā)明還涉及分離的啟動子,以及含有與編碼多肽的核酸序列可操作連接的該啟動子的核酸結(jié)構(gòu)、載體和宿主細(xì)胞。
相關(guān)領(lǐng)域的描述在真菌宿主細(xì)胞,尤其是絲狀真菌細(xì)胞例如曲霉屬(Aspergillus)中重組制備異源蛋白質(zhì)可能為以商業(yè)上有意義的量生產(chǎn)蛋白質(zhì)提供了更為理想的載體(vehicle)。
異源蛋白質(zhì)的重組制備通過構(gòu)建如下表達(dá)盒來實(shí)現(xiàn),在該表達(dá)盒中編碼該蛋白質(zhì)的DNA被置于適用于該宿主細(xì)胞的從被調(diào)節(jié)的基因中切下的啟動子的表達(dá)控制之下。通常通過質(zhì)粒介導(dǎo)的轉(zhuǎn)化,將該表達(dá)盒導(dǎo)入該宿主細(xì)胞中。然后在該表達(dá)盒所含啟動子正常發(fā)揮功能所需的誘導(dǎo)條件下,通過培養(yǎng)該轉(zhuǎn)化宿主細(xì)胞實(shí)現(xiàn)該異源蛋白質(zhì)的產(chǎn)生。
開發(fā)用于蛋白質(zhì)重組制備的新真菌宿主細(xì)胞通常要獲得適于在該宿主細(xì)胞中控制蛋白質(zhì)表達(dá)的啟動子。已經(jīng)顯示,F(xiàn)usarium venenatum可以作為一種新的宿主細(xì)胞用于該類表達(dá)(WO 96/00787,WO 97/26330)。而且,對于在Fusarium venenatum宿主細(xì)胞中表達(dá)異源基因有用的來自尖鐮孢(Fusarium oxysporum)胰蛋白酶樣蛋白酶基因的啟動子,也已有過描述(US 5,837,847)。
然而,在本領(lǐng)域中仍然需要用于控制異源基因表達(dá)的新啟動子。
本發(fā)明的目的是,提供用于在真菌宿主細(xì)胞中制備多肽的改良方法和用于該制備的新啟動子。
發(fā)明概述本發(fā)明涉及制備多肽的方法,包括(a)在有利于產(chǎn)生該多肽的培養(yǎng)基中培養(yǎng)真菌宿主細(xì)胞,其中該真菌宿主細(xì)胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ IDNO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ IDNO.3的第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯(lián)啟動子;和(b)從該培養(yǎng)基分離該多肽。
本發(fā)明還涉及分離的啟動子序列,以及含有與編碼多肽的核酸序列可操作連接的一或多個該啟動子的結(jié)構(gòu)、載體和真菌宿主細(xì)胞。
本發(fā)明還涉及獲得SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸的突變啟動子的方法。
本發(fā)明還涉及分離的核酸序列,其選自(a)編碼具有如下氨基酸序列的多肽的核酸序列,該氨基酸序列與SEQ ID NO.4第22-581位氨基酸有至少65%的一致性、與SEQ ID NO.5第19-200位氨基酸有至少65%的一致性、或與SEQ ID NO.6第1-187位氨基酸有至少65%的一致性;(b)與SEQ ID NO.1第4013-5743位核苷酸有至少65%的同源性、與SEQ ID NO.2第993-1593位核苷酸有至少65%的同源性、或與SEQ IDNO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)在極低、低、中等、中高、高或極高嚴(yán)緊條件下與以下序列雜交的核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100個核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈;(d)編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的變體的核酸序列,其中所述變體包含一或多個氨基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位變體;和(f)(a)、(b)、(c)或(e)的子序列。
本發(fā)明還涉及具有這些核酸序列的結(jié)構(gòu)、載體、和重組宿主細(xì)胞。
附圖簡述

圖1A-F顯示Fusarium venenatum葡糖淀粉酶基因的基因組DNA序列和推導(dǎo)的氨基酸序列(分別是SEQ ID NOs.1和4)。
圖2A-C顯示命名為“Daria”的Fusarium venenatum基因的基因組DNA序列和推導(dǎo)的氨基酸序列(分別是SEQ ID NOs.2和5)。
圖3A-D顯示命名為“Quinn”的Fusarium venenatum基因的基因組DNA序列和推導(dǎo)的氨基酸序列(分別是SEQ ID NOs.3和6)。
圖4顯示pDM181的限制性圖譜。
圖5顯示pSheB1的限制性圖譜。
圖6顯示pDM194的限制性圖譜。
圖7顯示pJRoy35的限制性圖譜。
圖8顯示pDM218的限制性圖譜。
圖9顯示pEJG25A的限制性圖譜。
圖10顯示pMWR60的限制性圖譜。
圖11顯示pRaMB62的限制性圖譜。
圖12顯示pRaMB64的限制性圖譜。
圖13顯示pRaMB66的限制性圖譜。
圖14顯示在Fusarium Venenatum中處于Fusarium venenatum淀粉葡糖苷酶(pAMG)啟動子和尖鐮孢胰蛋白酶(pSP387)啟動子控制下的Humicola lanuginosa脂酶報道基因表達(dá)的比較。
發(fā)明詳述本發(fā)明涉及制備多肽的方法,包括(a)在有利于產(chǎn)生該多肽的培養(yǎng)基中培養(yǎng)真菌宿主細(xì)胞,其中該真菌宿主細(xì)胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ IDNO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯(lián)啟動子;和(b)從該培養(yǎng)基分離該多肽。
在本發(fā)明的制備方法中,采用本領(lǐng)域已知的方法在適于所述多肽產(chǎn)生的營養(yǎng)培養(yǎng)基中培養(yǎng)所述細(xì)胞。例如,可以在適當(dāng)培養(yǎng)基中、在允許該多肽表達(dá)和/或分離的條件下通過搖瓶培養(yǎng)、實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中的小規(guī)模或大規(guī)模發(fā)酵(包括連續(xù)、批式、補(bǔ)料分批或固態(tài)發(fā)酵),來培養(yǎng)該細(xì)胞。該培養(yǎng)在含有碳和氮源以及無機(jī)鹽的適合營養(yǎng)培養(yǎng)基中采用本領(lǐng)域已知的程序進(jìn)行。適合的培養(yǎng)基可從商業(yè)廠家獲得,也可根據(jù)(如美國典型培養(yǎng)物保藏中心目錄中的)公開的組成制備。如果該多肽分泌至營養(yǎng)培養(yǎng)基中,則可以直接從該培養(yǎng)基中回收該多肽。如果該多肽是不分泌的,則可以從細(xì)胞裂解物中進(jìn)行回收。
該多肽可采用特異針對該多肽的本領(lǐng)域已知方法來檢測。這些檢測方法可以包括特異性抗體的使用、酶產(chǎn)物的形成、或酶底物消失。
所獲得的多肽可通過本領(lǐng)域已知的方法回收。例如,可通過傳統(tǒng)方法,包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀,從營養(yǎng)培養(yǎng)基中回收所述多肽。
該多肽可以通過本領(lǐng)域已知的多種方法來純化,這些方法包括但不限于層析(如離子交換、親和、疏水、層析聚焦和大小排阻層析)、電泳方法(如制備型等電聚焦)、差異溶解度(如硫酸銨沉淀)、SDS-PAGE或抽提(見例如,蛋白質(zhì)純化(Protein Purification),J.-C.Janson和Lars Ryden編著,VCH Publishers,紐約,1989)。
啟動子術(shù)語“啟動子”在本文中定義為結(jié)合RNA聚合酶并指導(dǎo)該聚合酶到達(dá)編碼多肽的核酸序列的正確下游轉(zhuǎn)錄起始位點(diǎn)以起始轉(zhuǎn)錄的DNA序列。RNA聚合酶有效地催化與編碼區(qū)適當(dāng)DNA鏈互補(bǔ)的信使RNA的組裝。術(shù)語“啟動子”也應(yīng)理解為包括在轉(zhuǎn)錄成mRNA之后用于翻譯的(啟動子和翻譯起始位點(diǎn)之間的)5’非編碼區(qū)、順式作用轉(zhuǎn)錄控制元件例如增強(qiáng)子、和其它能夠與轉(zhuǎn)錄因子相互作用的核苷酸序列。
術(shù)語“突變啟動子”在本文中定義為具有其中含有一或多個核苷酸替代、缺失和/或插入的親本啟動子核苷酸序列的啟動子,其中該突變啟動子比相應(yīng)的親本啟動子具有較強(qiáng)或較弱的啟動子活性。術(shù)語“突變啟動子”也將包括自然變體,和采用經(jīng)典誘變、定點(diǎn)誘變和DNA改組等本領(lǐng)域熟知的方法獲得的體外制備變體。
術(shù)語“雜合啟動子”在本文中定義為兩個或多個啟動子的部分,它們?nèi)诤显谝黄鹦纬蓛蓚€或更多個啟動子的融合物序列,該序列與編碼序列可操作地連接并介導(dǎo)該編碼序列轉(zhuǎn)錄成mRNA。
術(shù)語“串聯(lián)啟動子”在本文中定義為每一個均與一個編碼序列可操作地連接并介導(dǎo)該編碼序列轉(zhuǎn)錄成mRNA的兩個或多個啟動子序列。
術(shù)語“可操作地連接”在本文中定義為一種如下構(gòu)象,在該構(gòu)象中控制序列例如啟動子序列被適當(dāng)?shù)刂糜谙鄬τ诰幋a序列的一個位置上,以致該控制序列指導(dǎo)該編碼序列所編碼的多肽的產(chǎn)生。
術(shù)語“編碼序列”在本文中定義為當(dāng)被置于適當(dāng)控制序列的控制之下時,可以轉(zhuǎn)錄為能翻譯成多肽的mRNA的核酸序列。編碼序列的邊界一般由mRNA 5’端剛好位于該開放閱讀框上游的ATG起始密碼子,和mRNA 3’端剛好位于該開放閱讀框下游的轉(zhuǎn)錄終止序列來確定。編碼序列可以包括,但不限于基因組DNA、cDNA、半合成的、合成的、和重組的核酸序列。
在一個優(yōu)選的實(shí)施方案中,所述啟動子具有SEQ ID NO.1第1-3949位核苷酸的核酸序列,或其子序列。該子序列優(yōu)選含有至少大約2100個核苷酸,更優(yōu)選至少大約2400個核苷酸,最優(yōu)選至少大約2700個核苷酸。
在另一個優(yōu)選實(shí)施方案中,所述啟動子具有SEQ ID NO.2第1-938位核苷酸的核酸序列,或其子序列。該子序列優(yōu)選含有至少大約840個核苷酸,更優(yōu)選至少大約870個核苷酸,最優(yōu)選至少大約900個核苷酸。
在另一個優(yōu)選實(shí)施方案中,所述啟動子具有SEQ ID NO.3第1-3060位核苷酸的核酸序列,或其子序列。該子序列優(yōu)選含有至少大約2100個核苷酸,更優(yōu)選至少大約2400個核苷酸,最優(yōu)選至少大約2700個核苷酸。
在另一個優(yōu)選實(shí)施方案中,所述啟動子是大腸桿菌(Escherichia coli)NRRL B-30067中的質(zhì)粒pECO3所包含的核酸序列。在另一個優(yōu)選實(shí)施方案中,該啟動子是大腸桿菌NRRL B-30071中的質(zhì)粒pFAMG所包含的核酸序列。在另一個優(yōu)選實(shí)施方案中,該啟動子是大腸桿菌NRRL B-30075中的質(zhì)粒pQUINN所包含的核酸。
在本發(fā)明的方法中,所述啟動子還可以是在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸、或SEQ ID NO.3第1-3060位核苷酸的核酸序列中含有一或多個核苷酸替代、缺失、和/或插入的上述啟動子的突變體。
突變啟動子可以含有一或多個突變。每個突變均是獨(dú)立的核苷酸替代、缺失和/或插入??梢圆捎帽绢I(lǐng)域已知的任何方法,例如經(jīng)典誘變、定點(diǎn)誘變或DNA改組來實(shí)現(xiàn)向所述啟動子中引入核苷酸替代、缺失和/或插入。尤其有用的一種方法是利用帶有目的插入片段的超螺旋雙鏈DNA載體和兩個含有期望突變的合成引物來進(jìn)行的。該寡核苷酸引物每一個均與該載體的相反鏈互補(bǔ),在溫度循環(huán)中通過pfu DNA聚合物的作用延伸。一旦這兩個引物摻入后,就產(chǎn)生含有交錯切口的突變質(zhì)粒。在溫度循環(huán)后,用對于甲基化和半甲基化DNA特異的DpnI處理該產(chǎn)物,以消化親本DNA模板并選出含有突變的合成DNA。也可以采用本領(lǐng)域已知的其它方法。
在一個優(yōu)選實(shí)施方案中,所述啟動子是SEQ ID NO.1第1-3949位核苷酸的突變體。在另一個優(yōu)選實(shí)施方案中,所述啟動子是SEQ ID NO.2第1-938位核苷酸的突變體。在另一個優(yōu)選實(shí)施方案中,所述啟動子是SEQ ID NO.3第1-3060位核苷酸的突變體。
在本發(fā)明的方法中,所述啟動子還可以是雜合啟動子,其含有一或多個本發(fā)明啟動子的部分;一個本發(fā)明啟動子的部分和另一個啟動子的部分,例如一個啟動子的前導(dǎo)序列和來自另一個啟動子的轉(zhuǎn)錄起始位點(diǎn);或一或多個本發(fā)明啟動子的部分和一或多個其它啟動子的部分。所述其它啟動子可以是在所選真菌宿主細(xì)胞中表現(xiàn)出轉(zhuǎn)錄活性的任何啟動子序列,包括突變的、截短的和雜合的啟動子,并且可以從編碼與該宿主細(xì)胞同源或異源的細(xì)胞外或細(xì)胞內(nèi)多肽的基因獲得。該其它啟動子對于編碼所述多肽的核酸序列而言可以是自身的或外來的,并且對于該細(xì)胞而言也可以是自身的或外來的。
用于和本發(fā)明的啟動子一起構(gòu)建雜合啟動子的其它啟動子的例子包括從米曲霉(Aspergillus oryzae)TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、構(gòu)巢曲霉(Aspergillus nidulans)乙酰胺酶和尖鐮孢胰蛋白酶樣蛋白酶(WO 96/00787)的基因獲得的啟動子,以及NA2-tpi啟動子(黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸異構(gòu)酶的基因啟動子的雜合物),和從釀酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)和釀酒酵母3-磷酸甘油酸激酶的基因獲得的啟動子,及這些啟動子的突變的、截短的和雜合的啟動子。用于酵母宿主細(xì)胞的其它有用啟動子描述于Romanos等,1992,酵母(Yeast)8423-488。
所述啟動子還可以是含有兩個或多個本發(fā)明啟動子或者是含有一或多個本發(fā)明啟動子和一或多個諸如以上所例舉的其它啟動子的串聯(lián)啟動子。該串聯(lián)啟動子的兩個或多個啟動子序列可以同時啟動所述核酸序列的轉(zhuǎn)錄?;蛘撸摯?lián)啟動子的一或多個啟動子序列可以在細(xì)胞生長的不同階段啟動所述核酸序列的轉(zhuǎn)錄。
在本發(fā)明的方法中,該啟動子對于編碼目的多肽的核酸序列而言是異源的,但該啟動子或核酸序列對于該真菌宿主細(xì)胞而言可以是天然的。即使野生型啟動子對于編碼多肽的核酸序列而言是自身的,本發(fā)明的突變、雜合、或串聯(lián)啟動子也應(yīng)理解為與該核酸序列異源。
本發(fā)明的突變、雜合或串聯(lián)啟動子具有SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸啟動子的啟動子活性的至少大約20%、優(yōu)選至少大約40%、更優(yōu)選至少大約60%、更優(yōu)選至少大約80%、更優(yōu)選至少大約90%、更優(yōu)選至少大約100%、甚至更優(yōu)選至少大約200%、最優(yōu)選至少大約300%、甚至最優(yōu)選至少大約400%。
編碼多肽的核酸序列由所述核酸序列編碼的多肽對于目的真菌宿主細(xì)胞而言可以是自身的或異源的。
術(shù)語“多肽”在此并非旨在指特定長度的編碼產(chǎn)物,因此包括肽、寡肽和蛋白質(zhì)。術(shù)語“異源多肽”在本文中定義為非該真菌細(xì)胞天然的多肽,已經(jīng)過修飾改變了天然序列的天然多肽,或其表達(dá)由于重組DNA技術(shù)對宿主細(xì)胞的操作而在數(shù)量上改變的天然多肽。例如,天然多肽可以通過例如將編碼該多肽的基因置于本發(fā)明的啟動子控制之下重組產(chǎn)生以增強(qiáng)該多肽的表達(dá)、借助信號序列促進(jìn)目的天然多肽向細(xì)胞外運(yùn)輸,和增加編碼細(xì)胞正常所產(chǎn)生的該多肽的基因的拷貝數(shù)。該真菌細(xì)胞可以含有一或多個拷貝的編碼該多肽的核酸序列。
優(yōu)選地,該多肽是激素或其變體、酶、受體或其部分、抗體或其部分、或報道分子。在一個優(yōu)選的實(shí)施方案中,該多肽是向細(xì)胞外分泌的。在一個更優(yōu)選的實(shí)施方案中,該多肽是氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶、異構(gòu)酶或連接酶。在一個甚至更優(yōu)選的實(shí)施方案中,該多肽是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、轉(zhuǎn)化酶(invertase)、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果膠溶酶、過氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺轉(zhuǎn)移酶(transglutaminase)或木聚糖酶。
編碼目的多肽的核酸序列可以從任何原核、真核或其它來源獲得。為了本發(fā)明的目的,本文中與給定來源相連使用的術(shù)語“獲自”是指該多肽是由該來源或已插入了該來源的基因的細(xì)胞產(chǎn)生的。
用于分離或克隆編碼目的多肽的核酸序列的技術(shù)是本領(lǐng)域已知的,包括從基因組DNA分離,從cDNA制備,或它們的組合。從該基因組DNA克隆該核酸序列可以通過例如采用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)來實(shí)現(xiàn)。見例如,Innis等,1990,PCR操作方法和應(yīng)用指南(PCR ProtocolsAGuide to Methods and Application),Academic Press,紐約。該克隆方法可能包括切割和分離含有編碼該多肽的核酸序列的期望核酸片段,將該片段插入載體分子中,并將該重組載體摻入可以復(fù)制出多個拷貝或克隆的該核酸序列的突變真菌細(xì)胞中。該核酸序列可以是基因組、cDNA、RNA、半合成、合成來源的或它們的任意組合。
在本發(fā)明方法中,所述多肽還可以包括其中在該多肽或其片段的N端或C端融合了另一個多肽的融合或雜合多肽。融合多肽是通過將編碼一個多肽的核酸序列(或其部分)與編碼另一個多肽的核酸序列(或其部分)融合在一起產(chǎn)生的。產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,包括連接編碼這些多肽的編碼序列以使它們符合閱讀框,并且使該融合多肽的表達(dá)處于相同的一個或多個啟動子和相同的終止子的控制之下。所述雜合多肽可以含有從至少兩個不同多肽獲得的部分或完整多肽序列的組合,其中的一或多個多肽對于該突變真菌細(xì)胞可以是異源的。
核酸結(jié)構(gòu)本發(fā)明還涉及含有與本發(fā)明的啟動子和一個或多個控制序列可操作地連接的編碼多肽的核酸序列的核酸結(jié)構(gòu),其中所述控制序列可在適合的宿主細(xì)胞中在與該控制序列相容的條件下指導(dǎo)該編碼序列的表達(dá)。表達(dá)將理解為包括多肽產(chǎn)生所涉及到的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。
“核酸結(jié)構(gòu)”在本文中定義為單鏈或雙鏈核酸分子,該核酸分子可以是從天然存在的基因分離的,或是已被修飾而含有以天然不存在的方式組合和并置在一起的核酸片段。當(dāng)核酸結(jié)構(gòu)含有編碼序列以及表達(dá)該編碼序列所必需的所有控制序列時,術(shù)語核酸結(jié)構(gòu)與術(shù)語表達(dá)盒同義。
可以通過多種方式進(jìn)一步操作編碼多肽的分離核酸序列,以為該多肽的表達(dá)作準(zhǔn)備。依據(jù)表達(dá)載體,在核酸序列插入載體之前對其進(jìn)行操作可能是期望的或是必需的。利用重組DNA方法修飾核酸序列的技術(shù)是本領(lǐng)域熟知的。
在本發(fā)明的方法中,核酸序列可以含有一個或多個天然控制序列,或可以用該核酸序列外源的一或多個控制序列來取代該一個或多個天然控制序列,以改善編碼序列在宿主細(xì)胞中的表達(dá)。
術(shù)語“控制序列”在本文中定義為包括所有對本發(fā)明多肽的表達(dá)而言必需或有利的成分。每個控制序列對于編碼該多肽的核酸序列而言可以是自身的或是外源的。這些控制序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、本發(fā)明的啟動子、信號肽序列和轉(zhuǎn)錄終止子。最少地,控制序列包括本發(fā)明的啟動子,以及轉(zhuǎn)錄和翻譯終止信號。控制序列可與接頭一起提供,以便引入特異的限制性位點(diǎn),便于控制序列與編碼多肽的核酸序列編碼區(qū)連接。
控制序列可以是適合的轉(zhuǎn)錄終止子序列,即被宿主細(xì)胞識別以終止轉(zhuǎn)錄的序列。終止子序列與編碼所述多肽的核酸序列的3’末端可操作地連接。任何在所選宿主細(xì)胞中起作用的終止子都可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選終止子可獲自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶的基因。
用于酵母宿主細(xì)胞的優(yōu)選終止子可獲自釀酒酵母烯醇化酶、釀酒酵母細(xì)胞色素C(CYC1)和釀酒酵母甘油醛-3-磷酸脫氫酶的基因。用于酵母宿主細(xì)胞的其它有用的終止子描述于Romanos等,1992,同上。
控制序列也可以是適當(dāng)?shù)那皩?dǎo)序列,即一種對宿主細(xì)胞翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列與編碼所述多肽的核酸序列的5’端可操作地連接。任何在所選宿主細(xì)胞中有功能的前導(dǎo)序列都可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選前導(dǎo)序列可從米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶的基因獲得。
適用于酵母宿主細(xì)胞的前導(dǎo)序列可從釀酒酵母烯醇化酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因獲得。
控制序列也可以是聚腺苷酸化序列,即一種與所述核酸序列3’末端可操作地連接的、轉(zhuǎn)錄時被宿主細(xì)胞作為向轉(zhuǎn)錄的mRNA添加聚腺苷酸殘基(polyadenosine residues)的信號而識別的序列。任何在所選宿主細(xì)胞中有作用的聚腺苷酸化序列均可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選聚腺苷酸化序列可從米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合成酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶的基因獲得。
用于酵母宿主細(xì)胞的有用聚腺苷酸化序列描述于Guo和Sherman,1995,分子細(xì)胞生物學(xué)(Molecular Cellular Biology)155983-5990。
控制序列還可以是編碼與多肽氨基末端連接的氨基酸序列、并指導(dǎo)該編碼多肽進(jìn)入細(xì)胞分泌途徑的信號肽編碼區(qū)。所述核酸序列編碼區(qū)的5’末端本身可含有在翻譯閱讀框中天然與編碼該分泌多肽的編碼區(qū)片段連接的信號肽編碼區(qū)?;蛘?,編碼序列的5’末端可含有對該編碼序列而言外源的信號肽編碼區(qū)。在編碼序列并不天然含有信號肽編碼區(qū)的時候可能需要外源信號肽編碼區(qū)。或者,為了增強(qiáng)多肽的分泌,可以簡單地用外源信號肽編碼區(qū)替代天然信號肽編碼區(qū)。然而,任何指導(dǎo)表達(dá)多肽進(jìn)入所選宿主細(xì)胞分泌途徑的信號肽編碼區(qū)均可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的有效信號肽編碼區(qū)是從米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicola insolens纖維素酶和Humicola lanuginosa脂肪酶的基因獲得的信號肽編碼區(qū)。
用于酵母宿主細(xì)胞的有用信號肽可從釀酒酵母α-因子和釀酒酵母轉(zhuǎn)化酶(invertase)的基因獲得。其它有用的信號肽編碼區(qū)描述于Romanos等,1992,同上。
控制序列還可以是編碼位于多肽氨基端的氨基酸序列的前肽編碼區(qū)。所獲得的多肽被稱為酶原(proenzyme)和多肽原(有時也叫酶原(zymogen))。多肽原通常是無活性的,但能通過前肽的催化切割或自身催化切割從多肽原轉(zhuǎn)化成成熟活性多肽。前肽編碼區(qū)可從枯草芽孢桿菌(Bacillus subtilis)堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α-因子、Rhizomucor miehei天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO 95/33836)的基因獲得。
當(dāng)多肽的氨基端同時存在信號肽和前肽區(qū)時,前肽區(qū)緊接位于多肽的氨基端,而信號肽區(qū)緊接位于前肽區(qū)的氨基端。
也可以期望加入允許相對于宿主細(xì)胞生長調(diào)節(jié)所述多肽表達(dá)的調(diào)節(jié)序列。調(diào)節(jié)系統(tǒng)的例子是那些使基因表達(dá)響應(yīng)化學(xué)或物理刺激包括調(diào)節(jié)化合物的存在而打開或關(guān)閉的系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac和trp操縱子系統(tǒng)。在酵母中,可以使用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,可以使用TAKA α-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子作為調(diào)節(jié)序列。調(diào)節(jié)序列的其它例子是那些允許基因擴(kuò)增的序列。在真核系統(tǒng)中,這些包括在氨甲蝶呤存在時擴(kuò)增的二氫葉酸還原酶基因和在重金屬存在時擴(kuò)增的金屬硫蛋白基因。在這些情況中,編碼所述多肽的核酸序列將與調(diào)節(jié)序列可操作地連接。
本發(fā)明還涉及用于改變編碼多肽的宿主細(xì)胞內(nèi)源性基因的表達(dá)的核酸結(jié)構(gòu)。這些結(jié)構(gòu)可以含有改變該內(nèi)源基因表達(dá)所必需的最少成分。在一個實(shí)施方案中,這些核酸結(jié)構(gòu)優(yōu)選含有(a)導(dǎo)向序列,(b)本發(fā)明的啟動子,(c)外顯子,和(d)剪接供體位點(diǎn)。一旦該核酸結(jié)構(gòu)導(dǎo)入細(xì)胞后,該結(jié)構(gòu)即通過同源重組在內(nèi)源基因位點(diǎn)插入細(xì)胞的基因組中。導(dǎo)向序列指導(dǎo)元件(a)-(d)整合至內(nèi)源基因中,以使元件(b)-(d)與該內(nèi)源基因可操作地連接。在另一個實(shí)施方案中,這些核酸結(jié)構(gòu)含有(a)導(dǎo)向序列,(b)本發(fā)明的啟動子,(c)外顯子,(d)剪接供體位點(diǎn),(e)內(nèi)含子,和(f)剪接受體位點(diǎn),其中該導(dǎo)向序列指導(dǎo)元件(a)-(f)的整合,以使元件(b)-(f)與內(nèi)源基因可操作地連接。然而,這些結(jié)構(gòu)還可以含有其它成分如選擇標(biāo)記。
在這兩個實(shí)施方案中,這些成分的引入導(dǎo)致產(chǎn)生了改變內(nèi)源基因表達(dá)的新轉(zhuǎn)錄單元。大體上,此新轉(zhuǎn)錄單元是通過這些導(dǎo)向結(jié)構(gòu)引入的序列和內(nèi)源基因的融合產(chǎn)物。在一個改變內(nèi)源基因的實(shí)施方案中,該基因被激活。在該實(shí)施方案中,采用同源重組,通過插入使內(nèi)源基因以比在相應(yīng)的親本細(xì)胞中更高的水平表達(dá)的調(diào)節(jié)序列,替代、破壞或失效正常與親代細(xì)胞的該內(nèi)源基因有關(guān)的調(diào)節(jié)區(qū)。采用本領(lǐng)域熟知的方法(見例如,美國專利5,641,670),通過在該結(jié)構(gòu)中包含可擴(kuò)增的選擇標(biāo)記基因,可以進(jìn)一步擴(kuò)增該激活的基因。在另一個改變內(nèi)源基因的實(shí)施方案中,該基因的表達(dá)被降低。
所述導(dǎo)向序列可位于所述內(nèi)源基因內(nèi),緊鄰該基因,在上游基因內(nèi),或在該內(nèi)源基因的上游并相隔一段距離。可使用一個或多個導(dǎo)向序列。例如,環(huán)狀質(zhì)?;駾NA片段優(yōu)選使用單個導(dǎo)向序列,而線性質(zhì)?;駾NA片段優(yōu)選使用兩個導(dǎo)向序列。
這些結(jié)構(gòu)還含有所述內(nèi)源基因的一個或多個外顯子。外顯子定義為可以被復(fù)制成RNA并在成熟mRNA分子中存在以致該外顯子序列與該內(nèi)源基因的編碼區(qū)在閱讀框上相符合的DNA序列。外顯子可以任選地含有編碼一個或多個氨基酸和/或部分編碼氨基酸的DNA。另一種情況是,外顯子含有相應(yīng)于5’非編碼區(qū)的DNA。當(dāng)一個或多個外源外顯子編碼一個或多個氨基酸和/或部分編碼氨基酸時,設(shè)計該核酸結(jié)構(gòu),使得在轉(zhuǎn)錄和剪接后,該閱讀框與內(nèi)源基因的編碼區(qū)在閱讀框上相符合,以便來自第二外顯子的mRNA部分的適當(dāng)閱讀框不改變。
這些結(jié)構(gòu)的剪接供體位點(diǎn)指導(dǎo)一個外顯子向另一個外顯子的剪接。典型地,第一外顯子位于第二外顯子的5’,而位于第一外顯子3’側(cè)翼并與之重疊的剪接供體位點(diǎn)識別位于第二外顯子5’側(cè)翼的剪接受體位點(diǎn)。象剪接供體位點(diǎn)一樣,剪接受體位點(diǎn)也是指導(dǎo)一個外顯子向另一個外顯子剪接的序列。剪接裝置聯(lián)合剪接供體位點(diǎn)一起作用,使用剪接受體位點(diǎn)實(shí)現(xiàn)內(nèi)含子的去除。
本發(fā)明還涉及制備多肽的方法,包括(a)在有益于產(chǎn)生該多肽的條件下,培養(yǎng)其中已摻入了如下新轉(zhuǎn)錄單元的同源重組細(xì)胞,該新轉(zhuǎn)錄單元含有與編碼該多肽的內(nèi)源核酸序列第二外顯子可操作地連接的本發(fā)明啟動子、外顯子和/或剪接供體位點(diǎn);和(b)回收該多肽。該方法基于基因激活技術(shù)的使用,例如美國專利5,641,670所描述的技術(shù)。
表達(dá)載體本發(fā)明還涉及包含本發(fā)明啟動子、編碼多肽的核酸序列以及轉(zhuǎn)錄和翻譯終止信號的重組表達(dá)載體??蓪⒁陨厦枋龅母鞣N核酸和控制序列連接在一起,產(chǎn)生可包括一個或多個方便的限制性位點(diǎn)以允許該啟動子和編碼多肽的核酸序列在這些位點(diǎn)插入或替代的重組表達(dá)載體。或者,可以通過將該核酸序列或含有該啟動子和/或序列的核酸結(jié)構(gòu)插入適當(dāng)?shù)谋磉_(dá)載體中來表達(dá)該核酸序列。在建立該表達(dá)載體時,將該編碼序列定位于該載體中,使得該編碼序列與本發(fā)明的啟動子和一或多個適當(dāng)?shù)谋磉_(dá)控制序列可操作地連接。
重組表達(dá)載體可以是任何能方便地用于重組DNA程序并能使所述核酸序列表達(dá)的載體(如質(zhì)?;虿《?。典型地,載體的選擇取決于載體和載體將要導(dǎo)入的宿主細(xì)胞之間的相容性。該載體可以是線性或閉合環(huán)狀質(zhì)粒。
該載體可以是自主復(fù)制型載體,即作為染色體外實(shí)體而存在、其復(fù)制獨(dú)立于染色體復(fù)制的載體,如質(zhì)粒、染色體外因子、微型染色體或人工染色體。該載體可以含有任何保證自我復(fù)制的序列?;蛘?,該載體可以是當(dāng)導(dǎo)入宿主細(xì)胞后整合在基因組中并和它所整合的染色體一起復(fù)制的載體。而且,可使用單個載體或質(zhì)粒,或一起含有待導(dǎo)入宿主細(xì)胞基因組的全部DNA的兩個或多個載體或質(zhì)粒,或轉(zhuǎn)座子。
本發(fā)明的載體優(yōu)選含有一個或多個允許方便地選擇轉(zhuǎn)化細(xì)胞的選擇標(biāo)記。選擇標(biāo)記是其產(chǎn)物提供殺生物劑或病毒抗性、重金屬抗性、相對營養(yǎng)缺陷型的原養(yǎng)型等的基因。用于酵母宿主細(xì)胞的適當(dāng)標(biāo)記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細(xì)胞的選擇標(biāo)記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉(zhuǎn)移酶)、bar(膦絲菌素乙?;D(zhuǎn)移酶(phosphinothricin acetyltransferase))、hygB(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5’-磷酸脫羧酶)、sC(硫酸腺苷酰轉(zhuǎn)移酶(sulfate adenyltransferase))、trpC(鄰氨基苯甲酸合成酶),以及它們的等同物。優(yōu)選用于曲霉屬細(xì)胞的是構(gòu)巢曲霉或米曲霉的amdS和pyrG基因以及吸水鏈霉菌(Streptomyces hygroscopicus)的bar基因。
本發(fā)明的載體優(yōu)選包含允許該載體穩(wěn)定整合至宿主細(xì)胞基因組中或允許該載體在該細(xì)胞中獨(dú)立于基因組而自主復(fù)制的一個或多個元件。
為了整合至宿主細(xì)胞基因組中,該載體可以依賴于編碼所述多肽的核酸序列或用于使該載體通過同源或非同源重組穩(wěn)定整合至基因組中的任何其它載體元件。或者,該載體可含有用于通過同源重組指導(dǎo)向宿主細(xì)胞基因組中整合的額外核酸序列。這些額外核酸序列使得該載體可以在一條或多條染色體的一個或多個精確位置整合至宿主細(xì)胞基因組中。為了增加在精確位置整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)目的與相應(yīng)靶序列同源的核酸,如100-1,500個堿基對,優(yōu)選400-1,500個堿基對,最優(yōu)選800-1,500個堿基對,以增強(qiáng)同源重組的可能性。整合元件可以是任何與宿主細(xì)胞基因組中的靶序列同源的序列。而且,該整合元件可以是非編碼或編碼核酸序列。另一方面,該載體可以通過非同源重組整合至宿主細(xì)胞的基因組中。
為了自主復(fù)制,該載體可進(jìn)一步包含使載體能在所述宿主細(xì)胞中自主復(fù)制的復(fù)制起點(diǎn)。用于酵母宿主細(xì)胞中的復(fù)制起點(diǎn)的例子是2μ復(fù)制起點(diǎn)、ARS1、ARS4、ARS1和CEN3的組合以及ARS4和CEN6的組合。復(fù)制起點(diǎn)可以是含有使該復(fù)制起點(diǎn)功能在宿主細(xì)胞中具有溫度敏感性的突變的復(fù)制起點(diǎn)(見例如,Ehrlich,1978,美國國家科學(xué)院院刊(Proceedingsof the National Academy of Sciences USA)751433)。
可在宿主細(xì)胞中插入一個拷貝以上的編碼多肽的核酸序列,以增加基因產(chǎn)物的產(chǎn)量。該核酸序列拷貝數(shù)的增加可通過如下方法獲得在宿主細(xì)胞基因組中至少再整合一個額外拷貝的該序列;或在細(xì)胞中包括帶有該核酸序列的可擴(kuò)增選擇標(biāo)記基因,在適當(dāng)選擇劑存在時培養(yǎng)這些細(xì)胞,能夠選出含有擴(kuò)增拷貝的選擇標(biāo)記基因、因此也含有額外拷貝的該核酸序列的細(xì)胞。
用于連接上述元件以構(gòu)建本發(fā)明的重組表達(dá)載體的程序是本領(lǐng)域技術(shù)人員熟知的(見例如,Sambrook等,1989,同上)。
宿主細(xì)胞本發(fā)明還涉及含有與編碼多肽的核酸序列可操作地連接的本發(fā)明啟動子的重組宿主細(xì)胞,這些細(xì)胞可以有利地用于該多肽的重組制備。將含有與編碼多肽的核酸序列可操作地連接的本發(fā)明啟動子的載體導(dǎo)入宿主細(xì)胞,以使該載體作為前面描述的染色體整合體或自我復(fù)制的染色體外載體而存在。術(shù)語“宿主細(xì)胞”包括任何由于復(fù)制過程中發(fā)生的突變而與親代細(xì)胞不同的親代細(xì)胞后代。宿主細(xì)胞的選擇在很大程度上取決于編碼所述多肽的基因及其來源。
宿主細(xì)胞可以是任何在本發(fā)明方法中有用的真菌細(xì)胞。本文所用“真菌”包括phyla Ascomycota,Basidiomycota,Chytridiomycota和Zygomycota(定義在Hawksworth等,Ainsworth and Bisby’s Dictionaryof The Fungi,第8版,1995,CAB International,University Press,Cabridge,UK中)和以及Oomycota(見Hawksworth等,1995,同上,第171頁)和所有有絲分裂孢子真菌(Hawksworth等,1995,見上)。
在一個優(yōu)選的實(shí)施方案中,該真菌宿主細(xì)胞是酵母細(xì)胞。這里所用“酵母”包括產(chǎn)子囊酵母(內(nèi)孢霉目(Endomycetales))、產(chǎn)擔(dān)孢子(basidiosporogenous)酵母和屬于半知菌類(Fungi Imperfecti)(芽孢綱(Blastomycetes))的酵母。因?yàn)榻湍傅姆诸悓砜赡芨淖儯瑸榱吮景l(fā)明的目的,酵母應(yīng)按《酵母的生物學(xué)和活動》(Biology and Activitiesof Yeast)(Skinner,F(xiàn).A.,Passmore,S.M.,和Davenport,R.R.編著,Soc.App.Bacteriol.Symposium Series No.9,1980)中的描述來定義。
在一個更優(yōu)選的實(shí)施方案中,酵母宿主細(xì)胞是假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或Yarrowia細(xì)胞。
在一個最優(yōu)選的實(shí)施方案中,該酵母宿主細(xì)胞是卡爾酵母(Saccharomyces carlsbergensis)、釀酒酵母、糖化酵母(Saccharomycesdiastaticus)、Saccharomyces douglasii、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomyces norbensis)或Saccharomycesoviformis細(xì)胞。在另一個最優(yōu)選的實(shí)施方案中,該酵母宿主細(xì)胞是乳酸克魯維酵母(Kluyveromyces lactis)細(xì)胞。在另一個最優(yōu)選的實(shí)施方案中,酵母宿主細(xì)胞是Yarrowia lipolytica細(xì)胞。
在另一個優(yōu)選實(shí)施方案中,該真菌宿主細(xì)胞是絲狀真菌細(xì)胞?!敖z狀真菌”包括真菌門(Eumycota)和Oomycota的所有絲狀類型(正如Hawksworth等,1995,見上,所定義的)。絲狀真菌的特征在于由幾丁質(zhì)、纖維素、葡聚糖、脫乙酰殼多糖、甘露聚糖和其它復(fù)合多糖構(gòu)成的菌絲體壁。營養(yǎng)生長是通過菌絲延長來進(jìn)行的,碳代謝為專性需氧的。相反,酵母如釀酒酵母的營養(yǎng)生長是通過單細(xì)胞菌體的出芽來進(jìn)行的,而且碳代謝可以通過發(fā)酵進(jìn)行。
在一個更優(yōu)選的實(shí)施方案中,該絲狀真菌宿主細(xì)胞是但不限于Acremonium、曲霉屬(Aspergillus)、鐮孢霉屬(Fusarium)、腐質(zhì)霉屬(Humicola)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、脈孢菌屬(Neurospora)、青霉屬(Penicillium)、梭孢殼屬(Thielavia)、Tolypocladium或木霉屬(Trichoderma)的種的細(xì)胞。
在一個最優(yōu)選的實(shí)施方案中,該絲狀真菌宿主細(xì)胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、構(gòu)巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae)細(xì)胞。在另一個最優(yōu)選的實(shí)施方案中,該絲狀真菌宿主細(xì)胞是桿孢狀鐮孢(Fusariumbactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀鐮孢(Fusarium culmorum)、禾本科鐮孢(Fusarium graminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖鐮孢、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝孢鐮孢(Fusariumsporotrichioides)、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum細(xì)胞。在另一個最優(yōu)選的實(shí)施方案中,該絲狀真菌宿主細(xì)胞是Humicola insolens、Humicolalanuginosa、米黑毛霉(Mucor miehei)、Myceliophthora thermophila、粗糙脈孢菌(Neurospora crassa)、產(chǎn)紫青霉(Penicilliumpurpurogenum)、Thielavia terrestris、Trichoderma harzianum、康寧木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或綠色木霉(Trichodeerma viride)細(xì)胞。
在一個甚至最優(yōu)選的實(shí)施方案中,F(xiàn)usarium venenatum細(xì)胞是最初作為禾本科鐮孢(Fusarium graminearum)ATCC 20334保藏,最近由Yoder與Christianson(1998,真菌遺傳學(xué)和生物學(xué)(Fungal Genetics andBiology)2362-80)和O’Donnell等(1998,真菌遺傳學(xué)和生物學(xué)2357-67)重新劃分為Fusarium venenatum的Fusarium venenatum A3/5;以及Fusarium venenatum的分類學(xué)等同物,而無論它們目前被稱為何種種名。在另一個優(yōu)選實(shí)施方案中,正如WO 97/26330中所公開的,F(xiàn)usariumvenenatum細(xì)胞是Fusarium venenatum A3/5或Fusarium venenatum ATCC20334的形態(tài)學(xué)突變體。
可以通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁再生的方法以本質(zhì)上已知的方式來轉(zhuǎn)化真菌細(xì)胞。用于轉(zhuǎn)化曲霉屬宿主細(xì)胞的適當(dāng)程序描述于EP 238 023和Yelton等,1984,美國國家科學(xué)院院刊811470-1474。用于轉(zhuǎn)化鐮孢霉屬的種的適當(dāng)方法描述于Malardier等,1989,基因(Gene)78147-156和WO 96/00787。酵母的轉(zhuǎn)化可采用Becker和Guarente,由Abelson,J.N.和Simon,M.I.編,酵母遺傳學(xué)和分子生物學(xué)指南(Guide to Yeast Genetics and Molecular Biology),酶學(xué)方法(Methods in Enzymology),第194卷,第182-187頁,Academic Press,Inc.,紐約;Ito等,1983,細(xì)菌學(xué)雜志(Journal of Bacteriology)153163;和Hinnen等,1978,美國國家科學(xué)院院刊751920中描述方法來進(jìn)行。
獲得突變啟動子的方法本發(fā)明還涉及獲得突變啟動子的方法,包括(a)在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的序列中引入至少一個突變,其中該突變啟動子具有啟動子活性;和(b)分離該突變啟動子。
本發(fā)明還涉及通過以下步驟獲得突變啟動子的方法(a)在極低、低、中等、中高、高或極高的嚴(yán)緊條件下使DNA與(i)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3,(ii)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈雜交;和(b)從該DNA中分離出該突變啟動子。本文中對嚴(yán)緊性和洗滌條件作了定義。
該突變啟動子可以采用本領(lǐng)域已知的方法例如限制性酶消化或PCR擴(kuò)增來分離。
核酸序列本發(fā)明還涉及選自下組的分離核酸序列(a)編碼具有如下氨基酸序列的多肽的核酸序列,該氨基酸序列與SEQID NO.4第22-581位氨基酸有至少65%的一致性、與SEQ ID NO.5第19-200位氨基酸有至少65%的一致性、或與SEQ ID NO.6第1-187位氨基酸有至少65%的一致性;(b)與SEQ ID NO.1第4013-5743位核苷酸有至少65%的同源性、與SEQ ID NO.2第993-1593位核苷酸有至少65%的同源性、或與SEQ IDNO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)與(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100個核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈,在極低、低、中等、中高、高或極高嚴(yán)緊條件下雜交的核酸序列;(d)編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的變體的核酸序列,其中所述變體包含一或多個氨基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位變體;和(f)(a)、(b)、(c)或(e)的子序列。
本文所用術(shù)語“分離的核酸序列”是指基本不含有其它核酸序列的核酸序列,例如通過瓊脂糖電泳確定具有至少約20%的純度,優(yōu)選至少約40%的純度,更優(yōu)選至少約60%的純度,甚至更優(yōu)選至少約80%的純度,最優(yōu)選至少約90%的純度的核酸序列。例如,分離的核酸序列可以通過遺傳工程中使用的標(biāo)準(zhǔn)克隆程序?qū)⒃摵怂嵝蛄袕钠涮烊晃恢弥匦轮糜谄鋵⑦M(jìn)行復(fù)制的不同位置上來獲得。該克隆程序可能涉及切割和分離包含編碼該多肽的核酸序列的期望核酸片段,將此片段插入載體分子中,和將該重組載體摻入可以復(fù)制出多個拷貝或克隆的該核酸序列的宿主細(xì)胞中。該核酸序列可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任意組合。
在第一個實(shí)施方案中,本發(fā)明涉及編碼具有與SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸(即成熟多肽)有至少約65%、優(yōu)選至少約70%、更優(yōu)選至少約80%、甚至更優(yōu)選至少約90%、最優(yōu)選至少約95%,甚至最優(yōu)選至少約97%一致性程度的氨基酸序列的多肽(以下稱為“同源多肽”)的分離核酸序列。在一個優(yōu)選實(shí)施方案中,該同源多肽的氨基酸序列與SEQ IDNO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸有5個氨基酸不同,優(yōu)選有4個氨基酸不同,更優(yōu)選有3個氨基酸不同,甚至更優(yōu)選有2個氨基酸不同,最優(yōu)選有1個氨基酸不同。為了本發(fā)明的目的,兩個氨基酸序列之間的一致性程度采用Clustal法(Higgins,1989,CABIOS 5151-153)和LASERGENETMMEGALIGNTM軟件(DNASTAR公司,Madison,WI)并使用同一性表和下列多序列對比(multiple alignment)參數(shù)來確定空位罰分(gap penalty)為10,空位長度罰分為10。兩兩對比(Pairwise alignment)參數(shù)是Ktuple=1,空位罰分=3,窗口(windows)=5,對角線(diagonals)=5。
優(yōu)選地,本發(fā)明多核苷酸序列編碼含有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的氨基酸序列;或其等位變體;或它們的片段的多肽。在一個更優(yōu)選的實(shí)施方案中,本發(fā)明核酸序列編碼含有SEQ ID NO.4、SEQID NO.5或SEQ ID NO.6的氨基酸序列的多肽。在另一個優(yōu)選實(shí)施方案中,本發(fā)明核酸序列編碼含有SEQ ID NO.4第22-581位氨基酸、SEQ IDNO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸;或其等位變體;或它們的片段的多肽。在另一個優(yōu)選實(shí)施方案中,本發(fā)明核酸序列編碼含有SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸的多肽。在另一個優(yōu)選實(shí)施方案中,本發(fā)明核酸序列編碼由SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的氨基酸序列;或其等位變體;或它們的片段組成的多肽。在另一個優(yōu)選實(shí)施方案中,本發(fā)明核酸序列編碼由SEQ ID NO.4、SEQ ID NO.5或SEQID NO.6的氨基酸序列組成的多肽。在另一個優(yōu)選實(shí)施方案中,本發(fā)明核酸序列編碼由SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸;或其等位變體;或它們的片段組成的多肽。在另一個優(yōu)選實(shí)施方案中,本發(fā)明核酸序列編碼由SEQ IDNO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸組成的多肽。
本發(fā)明還包括編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的氨基酸序列的多肽、但由于遺傳密碼簡并性的原因又分別不同于SEQ IDNO.1、SEQ ID NO.2或SEQ ID NO.3的核酸序列。本發(fā)明還涉及分別編碼SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的片段的SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的子序列。
子序列是SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所包含的、已從5’和/或3’端缺失了一個或多個核苷酸的核酸序列。優(yōu)選地,SEQ ID NO.1的子序列含有至少1410個核苷酸,更優(yōu)選至少1500個核苷酸,最優(yōu)選至少1590個核苷酸。優(yōu)選地,SEQ ID NO.2的子序列含有至少450個核苷酸,更優(yōu)選至少480個核苷酸,最優(yōu)選至少510個核苷酸。優(yōu)選地,SEQID NO.3的子序列含有至少465個核苷酸,更優(yōu)選至少495個核苷酸,最優(yōu)選至少525個核苷酸。SEQ ID NO.4、SEQ ID NO.6或SEQ ID NO.6的片段是從該氨基酸序列的氨基和/或羧基端缺失了一或多個氨基酸的多肽。優(yōu)選地,SEQ ID NO.4的片段含有至少470個氨基酸殘基,更優(yōu)選至少500個氨基酸殘基,最優(yōu)選至少530個氨基酸殘基。優(yōu)選地,SEQ ID NO.5的片段含有至少150個氨基酸殘基,更優(yōu)選至少160個氨基酸殘基,最優(yōu)選至少170個氨基酸殘基。優(yōu)選地,SEQ ID NO.6的片段含有至少155個氨基酸殘基,更優(yōu)選至少165個氨基酸殘基,最優(yōu)選至少175個氨基酸殘基。
等位變體是指占據(jù)相同染色體座位的一個基因的兩種或多種不同形式中的任意一種。等位變異通過突變自然發(fā)生,并可導(dǎo)致種群內(nèi)的多態(tài)現(xiàn)象?;蛲蛔兛梢允浅聊?在編碼的多肽中沒有變化),也可編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。
在第二個實(shí)施方案中,本發(fā)明涉及與SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第4013-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸(即成熟多肽編碼區(qū))有至少約65%、優(yōu)選約70%、優(yōu)選約80%、更優(yōu)選約90%、甚至更優(yōu)選約95%、最優(yōu)選約97%同源性程度的、編碼活性多肽的分離核酸序列;或其等位變體和子序列。為了本發(fā)明的目的,兩個核酸序列之間的同源性程度通過Wilbur-Lipman方法(Wilbur和Lipman,1983,美國國家科學(xué)院院刊(Proceedings of theNational Academy of Science USA)80726-730)采用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)以及同一性表和下列多序列對比參數(shù)進(jìn)行確定空位罰分10,空位長度罰分10。兩兩對比參數(shù)為Ktuple=3,空位罰分=3,窗口=20。
在第三個實(shí)施方案中,本發(fā)明涉及在極低嚴(yán)緊條件、優(yōu)選低嚴(yán)緊條件、更優(yōu)選中等嚴(yán)緊條件、更優(yōu)選中高嚴(yán)緊條件、甚至更優(yōu)選高嚴(yán)緊條件、最優(yōu)選極高嚴(yán)緊條件下,和在相同條件下與下列序列雜交的核酸探針雜交的編碼多肽的分離核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,分子克隆實(shí)驗(yàn)室手冊(Molecular Cloning,A Laboratory Manual),第二版,Cold Spring Harbor,紐約)。SEQ ID NO.1、SEQ ID NO.2或SEQID NO.3的子序列可以是至少100個核苷酸,優(yōu)選至少200個核苷酸。而且,該子序列可以編碼多肽片段。
根據(jù)本領(lǐng)域熟知的方法,可以利用SEQ ID NO.1、SEQ ID NO.2或SEQID NO.3的核酸序列或其子序列,以及SEQ ID NO.4、SEQ ID NO.5或SEQID NO.6的氨基酸序列或其片段,設(shè)計核酸探針以從不同屬或種的株系中鑒定和克隆編碼多肽的DNA。具體地,可以在標(biāo)準(zhǔn)Southern印跡程序之后,采用該探針與感興趣的屬或種的基因組或cDNA雜交,以鑒定和分離其中的相應(yīng)基因。該探針可以比完整序列短得多,但應(yīng)長至少15個,優(yōu)選至少25個,更優(yōu)選至少35個核苷酸。也可使用更長的探針。既可使用DNA探針,也可使用RNA探針。典型地,為了檢測相應(yīng)基因?qū)υ撎结樳M(jìn)行標(biāo)記(例如用32P、3H、35S、生物素或抗生物素蛋白進(jìn)行標(biāo)記)。該探針包括在本發(fā)明的范圍之內(nèi)。
由此,可以篩選從這些其它生物制備的基因組DNA或cDNA文庫,以尋找與上述探針雜交并編碼多肽的DNA。來自這些其它生物的基因組或其它DNA可以通過瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術(shù)分離??梢詫碜赃@些文庫的DNA或該分離的DNA轉(zhuǎn)移并固定在硝酸纖維素或其它適當(dāng)?shù)妮d體材料上。為了鑒定與SEQ ID NO.1或其子序列同源的克隆或DNA,將該載體材料用于Southern印跡。為了本發(fā)明的目的,雜交是指核酸序列與相應(yīng)于SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所示核酸序列、它們的互補(bǔ)序列或其子序列的標(biāo)記核酸探針在極低到極高的嚴(yán)緊條件下雜交。在這些條件下與該核酸探針雜交的分子用X光膠片檢測。
在一個優(yōu)選實(shí)施方案中,該核酸探針是SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的核酸序列。在另一個優(yōu)選實(shí)施方案中,該核酸探針是編碼SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的多肽的核酸序列,或其子序列。在另一個優(yōu)選實(shí)施方案中,該核酸探針是SEQ ID NO.1、SEQ IDNO.2或SEQ ID NO.3。在另一個優(yōu)選實(shí)施方案中,該核酸探針是編碼成熟多肽的SEQ ID NO.1第4013-5743位核苷酸。在另一個優(yōu)選實(shí)施方案中,該核酸探針是編碼成熟多肽的SEQ ID NO.2第993-5743位核苷酸。在另一個優(yōu)選實(shí)施方案中,該核酸探針是編碼成熟多肽的SEQ ID NO.3第3061-3678位核苷酸。在另一個優(yōu)選實(shí)施方案中,該核酸探針是大腸桿菌NRRL B-30067中的質(zhì)粒pECO3所包含的所述核酸序列。在另一個優(yōu)選實(shí)施方案中,該核酸探針是大腸桿菌NRRL B-30071中的質(zhì)粒pFAMG所包含的所述核酸序列。在另一個優(yōu)選實(shí)施方案中,該核酸探針是大腸桿菌NRRL B-30076中的質(zhì)粒pQUINN所包含的所述核酸序列。在另一個優(yōu)選實(shí)施方案中,該核酸探針是大腸桿菌NRRL B-30067中的質(zhì)粒pECO3所包含的所述成熟多肽編碼區(qū)。在另一個優(yōu)選實(shí)施方案中,該核酸探針是大腸桿菌NRRL B-30071中的質(zhì)粒pFAMG所包含的所述成熟多肽編碼區(qū)。在另一個優(yōu)選實(shí)施方案中,該核酸探針是大腸桿菌NRRL B-30076中的質(zhì)粒pQUINN所包含的所述成熟多肽編碼區(qū)。
對于至少100個核苷酸長的長探針,極低到極高嚴(yán)緊條件定義為在標(biāo)準(zhǔn)Southern印跡程序之后,在5×SSPE、0.3% SDS、200μg/ml剪切的變性鮭精DNA和或者25%甲酰胺(對于極低和低嚴(yán)緊條件)或者35%甲酰胺(對于中等和中高嚴(yán)緊條件)或者50%甲酰胺(對于高和極高嚴(yán)緊條件)中于42℃進(jìn)行預(yù)雜交和雜交。
對于至少100個核苷酸長的長探針,最后載體材料用2×SSC、0.2%SDS,優(yōu)選至少在45℃(極低嚴(yán)緊條件),更優(yōu)選至少在50℃(低嚴(yán)緊條件),更優(yōu)選至少在55℃(中等嚴(yán)緊條件),更優(yōu)選至少在60℃(中高嚴(yán)緊條件),甚至更優(yōu)選至少在65℃(高嚴(yán)緊條件),最優(yōu)選至少在70℃(極高嚴(yán)緊條件)洗滌三次,每次15分鐘。
對于長約15個核苷酸到約70個核苷酸的短探針,嚴(yán)緊條件定義為在標(biāo)準(zhǔn)Southern印跡程序之后,在使用Bolton和McCarthy(1962,美國國家科學(xué)院院刊481390)的計算方法計算的Tm值以下5℃-10℃,于0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt’s溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉(sodium monobasic phosphate)、0.1mM ATP和0.2mg酵母RNA/ml中進(jìn)行預(yù)雜交、雜交和雜交后的洗滌。
對于長約15個核苷酸到約70個核苷酸的短探針,載體材料在計算的Tm以下5℃-10℃用6×SCC加0.1%SDS洗滌一次,時間15分鐘,用6×SSC洗滌兩次,每次15分鐘。
本發(fā)明還涉及通過如下步驟制備的分離核酸序列(a)在極低、低、中等、中高、高或極高的嚴(yán)緊條件下使DNA與(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸,(ii)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈雜交;和(b)從該DNA中分離出該核酸序列。該子序列優(yōu)選是具有至少100個核苷酸的序列,例如編碼多肽片段的序列。
在第四個實(shí)施方案中,本發(fā)明涉及編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的變體的分離核酸序列,其中所述變體包含了一或多個氨基酸的替代、缺失和/或插入。
該多肽變體的氨基酸序列與SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6,或其成熟多肽的氨基酸序列的差別可以是一個或多個氨基酸殘基的插入或缺失和/或一個或多個氨基酸殘基被不同的氨基酸殘基替代。優(yōu)選地,氨基酸的改變在性質(zhì)上是較小的,即不顯著影響該蛋白質(zhì)的折疊和/或活性的保守氨基酸替換;小的缺失,典型的是1到約30個氨基酸的缺失;小的氨基或羧基末端突出,如氨基末端的甲硫氨酸殘基;不超過約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能便于純化的小突出,如聚組氨酸片段、抗原表位或結(jié)合域。
保守替代的實(shí)例是以下各組內(nèi)的替代堿性氨基酸組(精氨酸、賴氨酸和組氨酸),酸性氨基酸組(谷氨酸和天冬氨酸),極性氨基酸組(谷氨酰胺和天冬酰胺),疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸),芳香族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性的氨基酸替代是本領(lǐng)域已知的,并描述于例如H.Neurath和R.L.Hill,1979,蛋白質(zhì)(The Proteins),Academic Press,紐約。最常發(fā)生的交換是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,以及它們的相反替代。
本發(fā)明的核酸序列可以獲自任何屬的微生物。為了本發(fā)明的目的,術(shù)語“獲自”按本文中定義的方式使用。在一個優(yōu)選實(shí)施方案中,由本發(fā)明核酸序列編碼的多肽被分泌至細(xì)胞外。
本發(fā)明的核酸序列可以獲自真菌來源,更優(yōu)選獲自酵母菌株,如假絲酵母屬、漢遜酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或Yarrowia菌株;或更優(yōu)選獲自絲狀真菌菌株如Acremonium、曲霉屬、短梗霉屬(Aureobasidium)、隱球酵母屬(Cryptococcus)、Filibasidium、鐮孢霉屬、腐質(zhì)霉屬、Magnaporthe、毛霉屬、毀絲霉屬(Myceliophthora)、Neocallimastix、脈孢菌屬、擬青霉屬(Paecilomyces)、青霉屬、Piromyces、裂褶菌屬(Schizophyllum)、Talaromyces、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬、Tolypocladium或木霉屬(Trichoderma)菌株。
在一個優(yōu)選實(shí)施方案中,該核酸序列獲自卡爾酵母、釀酒酵母、糖化酵母、Saccharomyces douglasii、克魯弗酵母、諾地酵母或Saccharomyces oviformis菌株。
在另一個優(yōu)選實(shí)施方案中,該核酸序列獲自棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、Humicola insolens、Humicola lanuginosa、米黑毛霉、Myceliophthora thermophila、粗糙脈孢菌、產(chǎn)紫青霉、Trichodermaharzianum、康寧木霉、Trichoderma longibrachiatum、Trichodermareesei或綠色木霉菌株。
在另一個優(yōu)選實(shí)施方案中,該核酸序列獲自桿孢狀鐮孢、Fusariumcerealis、Fusarium crookwellense、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、Fusarium sulphureum、Fusariumtorulosum、Fusarium trichothecioides或Fusarium venenatum菌株。
在一個更優(yōu)選的實(shí)施方案中,該核酸序列獲自Fusarium venenatum,最優(yōu)選獲自Fusarium venenatum ATCC 20334,例如SEQ ID NO.1、SEQ IDNO.2或SEQ ID NO.3中所示的核酸序列。在另一個更優(yōu)選的實(shí)施方案中,SEQ ID NO.1的核酸序列是大腸桿菌NRRL B-30067中的質(zhì)粒pECO3所包含的序列。在另一個更優(yōu)選的實(shí)施方案中,SEQ ID NO.2的核酸序列是大腸桿菌NRRL B-30071中的質(zhì)粒pFAMG所包含的序列。在另一個更優(yōu)選的實(shí)施方案中,SEQ ID NO.3的核酸序列是大腸桿菌NRRL B-30076中的質(zhì)粒pQUINN所包含的序列。在另一個優(yōu)選實(shí)施方案中,該核酸序列是編碼成熟多肽的SEQ ID NO.1第4013-5743位核苷酸。在另一個優(yōu)選實(shí)施方案中,該核酸序列是編碼成熟多肽的SEQ ID NO.2第993-1593位核苷酸。在另一個優(yōu)選實(shí)施方案中,該核酸序列是編碼成熟多肽的SEQ ID NO.3第3061-3678位核苷酸。
應(yīng)該理解,對于前面提及的種,本發(fā)明既包括完全和不完全階段,及其它的分類學(xué)等同物,例如無性型,而不論它們被稱為何種種名。本領(lǐng)域技術(shù)人員將容易識別出適合的等同物。
公眾可容易地從許多培養(yǎng)物保藏中心獲得這些種的菌株,這些培養(yǎng)物保藏中心例如美國典型培養(yǎng)物保藏中心(ATCC)、德意志微生物保藏中心(DSM)、真菌菌種保藏中心(CBS)和農(nóng)業(yè)研究機(jī)構(gòu)保藏中心(NRRL)。
而且,采用上述探針可從其它來源鑒定并獲得這類核酸序列,這些來源包括從自然環(huán)境(如土壤、堆肥、水等)分離的微生物。從自然生活環(huán)境中分離微生物的技術(shù)是本領(lǐng)域熟知的。然后可以通過對另一種微生物的基因組或cDNA文庫的相似篩選獲得核酸序列。一旦用探針檢測到編碼多肽的核酸序列,即可利用本領(lǐng)域普通技術(shù)人員已知的技術(shù)(見例如Sambrook等,1989,同上)分離或克隆該序列。
本發(fā)明還涉及在SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的成熟多肽編碼序列中含有至少一個突變的突變核酸序列,其中該突變核酸序列編碼分別由SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸組成的多肽。
用于分離或克隆編碼多肽的核酸序列的技術(shù)在本文中已有過描述。
本發(fā)明還涉及含有上述核苷酸序列的核酸結(jié)構(gòu)、重組載體和宿主細(xì)胞。對于它們的構(gòu)建可以采用前面描述的相同方法來進(jìn)行。
本發(fā)明還涉及由上述核酸序列編碼的多肽,以及采用本文描述的方法產(chǎn)生該多肽的方法。
本發(fā)明通過如下實(shí)施例作進(jìn)一步描述,這些實(shí)施例不應(yīng)理解為是對本發(fā)明范圍的限制。
實(shí)施例用作緩沖液和底物的化學(xué)制品是至少試劑級別的商業(yè)產(chǎn)品。
培養(yǎng)基和溶液COVE痕量金屬溶液每升由0.04g NaB4O7·10H2O、0.4g CuSO4·5H2O、1.2gFeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O組成。
50×COVE鹽溶液每升由26g KCl、26g MgSO4·7H2O、76g KH2PO4和50mlCOVE痕量金屬組成。
COVE培養(yǎng)基每升由342.3g蔗糖、20ml 50×COVE鹽溶液、10ml 1M乙酰胺、10ml 1.5M CsCl2和25g純凈瓊脂組成。
50×Vogels培養(yǎng)基每升由150g檸檬酸鈉、250g KH2PO4、10gMgSO4·7H2O、10g CaCl2·2H2O、2.5ml生物素貯存液和5.0ml AMG痕量金屬溶液組成。
痕量金屬溶液每升由14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5g NiCl2、13.8g FeSO4、8.5g MnSO4和3.0g檸檬酸組成。
COVE頂層瓊脂每升由20ml 50×COVE鹽、0.8M蔗糖、1.5M氯化銫、1.0M乙酰胺和10g低熔點(diǎn)瓊脂糖組成,pH被調(diào)節(jié)至6.0。
BASTA頂層瓊脂由補(bǔ)加了10mg/ml除草劑BastaTM(Hoechst Schering,Rodovre,丹麥)的COVE頂層瓊脂組成。
RA孢子形成培養(yǎng)基每升由50g琥珀酸、12.1g NaNO3、1g蔗糖、20ml50×Vogels和0.5ml 10mg/ml NaMoSO4貯存液組成,pH被調(diào)節(jié)至6.0。
YEPG培養(yǎng)基每升由10g酵母提取物、20g蛋白胨和20g葡萄糖組成。
STC由0.8M山梨糖醇、25mM Tris pH 8、25mM CaCl2組成。
SPTC由40%PEG 4000、0.8M山梨糖醇、25mM Tris pH 8、25mM CaCl2組成。
M400Da培養(yǎng)基每升由50g麥芽糖糊精、2g MgSO4·7H2O、2g KH2PO4、4g檸檬酸、8g酵母提取物、2g尿素和1ml COVE痕量金屬溶液組成。
實(shí)施例1Fusarium venenatum菌絲體組織的生產(chǎn)采用補(bǔ)料分批發(fā)酵方案,使用作為碳源的NUTRIOSETM(RoquetteFreres,S.A.,Beinheim,法國)和酵母提取物,將Fusarium venenatumATCC 20334的形態(tài)學(xué)突變體Fusarium venenatum CC1-3(Wiebe等,1991,Mycol.Research 951284-1288)培養(yǎng)在實(shí)驗(yàn)室規(guī)模的兩升發(fā)酵罐中。pH維持在6-6.5,溫度保持在30℃,并含有活性溶解氧(positivedissolved oxygen)。
在接種后第2、4、6和8天收獲菌絲體樣品,并在液氮中迅速冷凍。在將其破碎用于RNA提取之前,將這些樣品保存在-80℃。
實(shí)施例2cDNA文庫構(gòu)建根據(jù)Timberlake和Barnard的方法(1981,細(xì)胞(Cell)2629-37)從實(shí)施例1中描述的菌絲體樣品中提取總細(xì)胞RNA,從1%甲醛-瓊脂糖凝膠上進(jìn)行印跡之后通過Northern雜交分析該RNA樣品(Davis等,1986,分子生物學(xué)基本方法(Basic Methods in Molecular Biology),ElsevierScience Publishing Co.,Inc.,紐約)。使用mRNA分離試劑盒(mRNASeparator KitTM)(Clontech Laboratories,Inc.,Palo Alto,CA)根據(jù)廠商說明從總RNA分離聚腺苷酸化mRNA部分。除了使用NotI-(dT)18引物(Pharmacia Biotech,Inc.,Piscataway,NJ)起始第一鏈合成之外,根據(jù)Gubler和Hoffman的方法(1983,基因(Gene)25263-269)使用大約5μg poly(A)+mRNA合成雙鏈cDNA。用綠豆核酸酶(BoehringerMannheim Corporation,Indianapolis,IN)處理該cDNA,并用T4 DNA聚合酶(New England Biolabs,Beverly,MA)使末端平端化。
用NotI消化cDNA,通過瓊脂糖凝膠電泳按大小選擇片段(大約0.7-4.5kb),并與用NotI和EcoRV切割并經(jīng)小牛小腸堿性磷酸酶(Boehringer Mannheim Corporation,Indianapolis,IN)去酸化的pZErO-2.1(Invitrogen Corporation,Carlsbad,CA)連接。使用該連接混合物轉(zhuǎn)化大腸桿菌TOP10感受態(tài)細(xì)胞(Invitrogen Corporation,Carlsbad,CA)。在含有50μg/ml終濃度卡那霉素的2YT瓊脂平板上篩選轉(zhuǎn)化體(Miller,1992,細(xì)菌遺傳學(xué)簡短教程。關(guān)于大腸桿菌和相關(guān)細(xì)菌的實(shí)驗(yàn)室指南和手冊(A Short Course in Bacterial Genetics.Alaboratory Manual and Handbook for Escherichia coli and RelatedBacteria),Cold Spring Harbor Press,Cold Spring Harbor,紐約)。
使用質(zhì)??寺≥d體pZErO-2.1構(gòu)建兩個獨(dú)立的定向(directional)cDNA文庫。文庫A使用第4天收獲的菌絲體的mRNA制備,文庫B使用從第6天時間點(diǎn)獲得的mRNA構(gòu)建。為了檢驗(yàn)細(xì)胞中基因表達(dá)譜的代表性“瞬態(tài)圖(snapshot)”,兩個cDNA文庫均沒有擴(kuò)增。相反地,將文庫鋪板,標(biāo)定滴度,并通過DNA測序分析每個文庫的獨(dú)立克隆。
文庫A(第4天的細(xì)胞)由大約7.5×104個獨(dú)立克隆組成,文庫B(第6天的細(xì)胞)由大約1.2×105個克隆組成。從每個文庫中的40個菌落分離小量制備的DNA(Miniprep DNA),并檢查cDNA插入片段的存在和大小。在該分析中,來自文庫A的40個菌落中有39個(97.5%)含有大小在600bp至2200bp之間(平均=1050bp)的插入片段。相似地,來自文庫B的40個菌落中39個(97.5%)含有大小在800bp至3600bp之間(平均=1380bp)的插入片段。
實(shí)施例3模板的制備和核苷酸序列測定從實(shí)施例2中描述的每個cDNA文庫中,直接從轉(zhuǎn)化平板挑取1192個轉(zhuǎn)化體菌落至含有包含50μg/ml卡那霉素的200ul 2YT培養(yǎng)液(Miller,1992,見上)的96孔微量滴定板中。將微量滴定板在37℃不搖動孵育過夜。孵育之后,向每個孔加入100μl無菌的50%甘油。將轉(zhuǎn)化體復(fù)制到第二個深盤型(deep dish)96孔微量培養(yǎng)板(Advanced GeneticTechnologies Corporation,Gaithersburg,MD)中,該微量培養(yǎng)板的每孔中含有1ml補(bǔ)充了50μg/ml卡那霉素的MagnificentBrothTM(MacConnell Research,San Diego,CA)。原始的微量滴定板冷凍儲存在-80℃。第二個深盤型培養(yǎng)板于37℃旋轉(zhuǎn)搖床上劇烈振蕩(300rpm)孵育過夜。為防止濺出和交叉污染,以及允許充分的通氣,用聚丙烯襯墊(Advanced Genetic Technologies Corporation,Gaithersburg,MD)和塑料微量滴定盤蓋覆蓋每個第二培養(yǎng)板。
使用Utterback等所修改的Advanced Genetic Technologies公司(Gaithersburg,MD)96孔小量制備試劑盒程序(1995,基因組科學(xué)技術(shù)(Genome Sci.Technol.)11-8),從每個孔分離DNA。使用Perkin-ElmerApplied Biosystems 377 XL型自動DNA測序儀(Perkin-Elmer AppliedBiosystems公司,F(xiàn)oster City,CA),采用染料終止物化學(xué)法(dye-terminator chemistry)(Giesecks等,1992,病毒學(xué)方法雜志(Journalof Virology Methods)3847-60)以及反向lac測序引物進(jìn)行單側(cè)(single-pass)DNA測序。
實(shí)施例4DNA序列數(shù)據(jù)分析仔細(xì)檢查核苷酸序列數(shù)據(jù)的質(zhì)量,給出少于或等于9.2的不適當(dāng)間隔或超過3%的模糊水平的樣品被丟棄或進(jìn)行重新測序。借助于FACTURATM軟件(Perkin Elmer Applied Biosystems,Inc.,F(xiàn)oster City,CA)修剪載體序列。此外,當(dāng)模糊堿基信號數(shù)目增加時,在每個樣品的末端截短序列。使用TIGR Assembler軟件(Sutton,G.G.等,1995,基因組科學(xué)和技術(shù)(Genome Science and Technology)19019),將所有序列互相比較以構(gòu)建重疊的毗連序列群,從而確定每個文庫中提供的各種cDNA種類的多重性。最后,按三種框架翻譯所有序列,并使用采用修改的Smith-Waterman算法的GeneAssistTM軟件(Perkin Elmer AppliedBiosystems,Inc.,F(xiàn)oster City,CA)對非冗余數(shù)據(jù)庫(NRDB)進(jìn)行搜索,其中所述算法使用閾值為70的BLOSUM 62距陣。NRDB是由Genpept、Swiss-Prot和PIR數(shù)據(jù)庫組合而來。
實(shí)施例5葡糖淀粉酶cDNA克隆的鑒定通過使用Applied Biosystems 377XL型自動DNA測序儀根據(jù)廠商說明進(jìn)行隨機(jī)cDNA克隆的部分測序,并按照實(shí)施例4所述將推導(dǎo)的氨基酸序列與NRDB中的序列進(jìn)行比較,鑒定推測的葡糖淀粉酶克隆。從分析的2000多個cDNA序列中,來自文庫A的2個克隆和來自文庫B的9個克隆表現(xiàn)出與來自其它真菌和酵母的葡糖淀粉酶蛋白質(zhì)具有氨基酸序列同源性。在以此方式發(fā)現(xiàn)的幾個葡糖淀粉酶cDNA克隆中,基于其與粗糙脈孢菌(Geneseq蛋白質(zhì)登錄號R71034)和Humicola grisea(Trembl登錄號Q12623)的葡糖淀粉酶氨基酸序列的比對,以及使用signal-P計算機(jī)程序(Nielsen等,1997,蛋白質(zhì)工程(Protein Engineering)101-6)所檢測到的可能信號肽的存在,推測一個克隆是全長的。選擇含有質(zhì)粒pFA0401、定名為大腸桿菌FA0401的克隆用作探針,以從Fusariumvenenatum克隆相應(yīng)的葡糖淀粉酶基因組DNA序列(見實(shí)施例7)。
實(shí)施例6構(gòu)建Fusarium venenatum的基因組DNA文庫按照在Berka等(1998,Appl.Environ.Microbiol.64,4423-4427)的程序中詳述的方法,在λZipLox中構(gòu)建基因組文庫。簡單地說,用Tsp509I部分消化Fusarium venenatum的總細(xì)胞DNA,并在1%瓊脂糖凝膠上進(jìn)行大小分離。將在3-7kb大小范圍內(nèi)遷移的DNA片段切下,并采用Prep-a-Gene試劑(BioRad,Hercules,CA)將DNA從瓊脂糖凝膠切塊中洗脫出來。將洗脫的DNA片段與EcoRI切割并經(jīng)去磷酸化的λZipLox載體臂(Life Technologies,Gaithersburg,MD)連接,連接混合物采用商業(yè)包裝提取物(Stratagene,La Jolla,CA)進(jìn)行包裝。采用標(biāo)準(zhǔn)方法將該包裝的DNA文庫鋪板,并在大腸桿菌Y1090ZL細(xì)胞上擴(kuò)增,然后儲存于4℃(Davis,R.W.,Botstein,D.,和Roth.J.R.,1980,高級細(xì)菌遺傳學(xué),遺傳工程手冊(Advanced Bacterial Genetics,A Manual for GeneticEngineering),Cold Spring Harbor Press,Cold Spring Harbor,NY)。
實(shí)施例7編碼Fusarium venenatum葡糖淀粉酶的基因組DNA片段的分離,核苷酸測序和特性分析采用含有來自pFA0401(實(shí)施例5)的克隆cDNA插入片段的放射性標(biāo)記探針片段,在高度嚴(yán)緊條件下(即,在50%甲酰胺、5×SSPE、0.3%SDS、200μg/ml剪切的變性鮭精DNA中45℃進(jìn)行雜交;濾膜在含有0.1%SDS的0.2×SSPE中45℃洗滌一次,之后在無SDS的0.2×SSPE中于相同溫度下洗滌兩次),通過雜交(Davis等,1980,同上)篩選來自Fusariumvenenatum基因組DNA文庫(實(shí)施例6)的大約50,000噬菌斑。在大腸桿菌Y1090ZL細(xì)胞上兩次純化給出雜交信號的噬菌斑,隨后從λZipLox載體中切出單個克隆作為pZL1衍生物(D’Alessio等,1992,F(xiàn)ocus1476)。DNA序列分析揭示,其中一個含有命名為pFAMG的質(zhì)粒的克隆包含了完整的葡糖淀粉酶編碼區(qū)以及分別包括了啟動子和終止子區(qū)域的3.9kb 5’側(cè)翼DNA和0.3kb 3’側(cè)翼DNA(見圖1)。
使用染料終止物化學(xué)法在Applied Biosystems 377 XL型自動DNA測序儀上對pFAMG中的克隆插入片段進(jìn)行DNA序列測定。使用轉(zhuǎn)座子插入策略(Primer Island Transposition試劑盒,Perkin-Elmer/AppliedBiosysytems,Inc.,F(xiàn)oster City,CA)產(chǎn)生連續(xù)序列。對來自pFAMG的葡糖淀粉酶基因組克隆進(jìn)行測序,達(dá)到平均冗余4.2。
通過該基因組序列數(shù)據(jù)與葡糖淀粉酶cDNA序列的重疊群的比較,確定編碼Fusarium venenatum葡糖淀粉酶的基因組DNA片段含有一個1743bp的開放閱讀框,該閱讀框被一個51bp的內(nèi)含子中斷并編碼具有581個氨基酸的多肽。該核苷酸序列(SEQ ID NO.1)和推導(dǎo)的氨基酸序列(SEQ IDNO.4)顯示在圖1中。采用SignalP程序(Nielson等,1997,蛋白質(zhì)工程101-6),預(yù)測了一個21個殘基的信號肽,并經(jīng)該葡糖淀粉酶蛋白質(zhì)氨基端測序獲得了證實(shí)(實(shí)施例8)。因此,成熟的葡糖淀粉酶由560個氨基酸組成。
使用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)和Clustal方法(Higgins,1989,CABIOS 5151-153),采用同一性表和如下多序列比對參數(shù)進(jìn)行真菌葡糖淀粉酶蛋白質(zhì)序列的比較性對比空位罰分為10,空位長度罰分為10。兩兩對比參數(shù)是Ktuple=1、空位罰分=3、窗口=5和對角線=5。該對比顯示,F(xiàn)usarium venenatum的葡糖淀粉酶與下列其它真菌的葡糖淀粉酶具有一致性(括弧內(nèi)為一致殘基的百分?jǐn)?shù))粗糙脈孢霉[Swissprot P14804](47%)、黑曲霉[Swissprot P04064](46%)、Humicola grisea[Trembl Q12623](44%)、Hormoconis resinae[Swissprot Q03045](41%)、Corticium rolfsii[Q12596](41%)、Schizosaccharomyces pombe[Trembl 060087](31%)、和Rhizopus oryzae[Swissprot P07683](23%)。
實(shí)施例8Fusarium venenatum葡糖淀粉酶的氨基端序列分析通過8-16%Tris-甘氨酸SDS-PAGE(Novex,San Diego,CA)分離Fusarium venenatum發(fā)酵培養(yǎng)液(實(shí)施例1)樣品中的蛋白質(zhì),然后采用10%甲醇(pH=11.0)中的10mM CAPS(3-[環(huán)己基氨基]-1-丙磺酸)25伏2小時將其電轉(zhuǎn)印至PVDF膜上(Novex,San Diego,CA)。用40%甲醇/1%乙酸中的0.1%考馬斯亮蘭R250染色該P(yáng)VDF膜20秒,并在50%乙醇中脫色以觀察蛋白質(zhì)條帶。
切下遷移在大約65kDa的主要多肽種類,并在帶有即時HPLC和液相三氟乙酸(TFA)遞送的Applied Biosystems 476A蛋白質(zhì)測序儀(PerkinElmer/Applied Biosystems Division,F(xiàn)oster City,CA)上對其進(jìn)行N端測序。測序試劑來自Perkin Elmer/Applied Biosystems Division(Foster City,CA)。采用含有溶于水的3.5%四氫呋喃的A緩沖液以及18ml含有乙酸、乙酸鈉和己磺酸鈉的Premix濃縮物(Perkin Elmer/AppliedBiosystems Division,F(xiàn)oster City,CA)和含有乙腈的緩沖液B,通過即時HPLC檢測乙內(nèi)酰苯硫脲氨基酸。收集數(shù)據(jù),并在Macintosh IIsi上采用Applied Biosystems 610數(shù)據(jù)分析軟件進(jìn)行分析。對著光源觀察色譜以鑒定氨基酸,并由操作員確定。N-端分析產(chǎn)生蛋白質(zhì)序列Ser-Pro-Ser-Lys-Asp-Asn-Ser-Leu-Glu-Arg-Phe-Ile-Asp-Lys-Gln-Ala-Asp-Ile-Ser(SEQ ID NO.4)。
實(shí)施例9鑒定編碼推測的液泡相關(guān)蛋白質(zhì)和未知的分泌基因產(chǎn)物的豐富cDNA克隆基于其在文庫A和B(實(shí)施例2)的克隆中的相對豐度,再選擇兩種cDNA種類。
含有pFA0035的克隆FA0035編碼具有18個氨基酸可能信號肽的200個氨基酸初級翻譯產(chǎn)物,其中該可能信號肽是采用Signal-P計算機(jī)程序(Nielsen等,1997,同上)檢測到的??寺A0035占文庫A中cDNA克隆的大約1.9%,而占文庫B中cDNA克隆的大約0.8%。按實(shí)施例4所述將克隆FA0035的推導(dǎo)氨基酸序列與NRDB中的序列進(jìn)行比較,結(jié)果顯示與任何已知的蛋白質(zhì)序列均沒有顯著的同源性,因此將其劃為未知開放閱讀框(ORF)。該克隆被任意命名為“Daria”。
含有pFA0759的克隆FA0759編碼與粗糙脈孢霉液泡相關(guān)蛋白質(zhì)的推測亞基(Trembl登錄號P87252)有72%氨基酸序列一致性的具有187個氨基酸的多肽。由于采用Signal-P軟件沒有檢測到信號肽,所以該基因產(chǎn)物似乎并不是分泌蛋白??寺A0759占文庫A中cDNA克隆的大約2.0%,而占文庫B中cDNA克隆的大約1.5%。
實(shí)施例10編碼未知基因“Daria”和推測的液泡相關(guān)蛋白質(zhì)的基因組DNA片段的克隆和核苷酸序列分析通過篩選實(shí)施例6和7所述的λZipLox文庫分離編碼未知分泌蛋白質(zhì)“Daria”和推測的液泡相關(guān)蛋白質(zhì)的Fusarium venenatum基因組DNA片段。對來自質(zhì)粒pFA0035和pFA0759的cDNA插入片段進(jìn)行放射性標(biāo)記,將其用作探針篩選文庫。將在實(shí)施例7的相同條件下與任一探針強(qiáng)雜交的噬菌斑在大腸桿菌Y1090ZL細(xì)胞上進(jìn)行兩次純化,隨后從λZipLox載體中切下各個克隆作為pZL1衍生物(D’Alessio等,1992,同上)。
DNA序列分析揭示,其中一個含有命為pECO3的質(zhì)粒的克隆含有完整的“Daria”編碼區(qū)以及分別包括了啟動子和終止子區(qū)域的0.9kb 5’側(cè)翼和0.9kb 3’側(cè)翼DNA。該核苷酸序列(SEQ ID NO.2)和推導(dǎo)的氨基酸序列(SEQID NO.5)顯示于圖2。該編碼區(qū)被一個55bp內(nèi)含子打斷。
相似地,用來源于pFA0579 cDNA插入片段的放射性標(biāo)記探針,通過篩選λZipLox文庫分離基因組DNA克隆。命名為pQUINN的基因組克隆編碼完整的液泡相關(guān)蛋白質(zhì)亞基以及分別包含了啟動子和終止子區(qū)域的3.0kb 5’側(cè)翼和0.3kb 3’側(cè)翼DNA。該核苷酸序列(SEQ ID NO.3)和推導(dǎo)的氨基酸序列(SEQ ID NO.6)顯示于圖3。該基因組克隆和cDNA克隆之間的序列比較揭示,在該推測的液泡相關(guān)蛋白質(zhì)亞基的5’非翻譯區(qū)中存在一個594bp的內(nèi)含子。此外,該編碼還含有一個77bp的內(nèi)含子。
實(shí)施例11pDM181的構(gòu)建采用拼接重疊延伸技術(shù)構(gòu)建質(zhì)粒pDM181,以將1.2kb尖鐮孢胰蛋白酶啟動子與1.1kb尖鐮孢胰蛋白酶終止子融合在一起。作為重疊PCR策略的一部分,將含有SwaI、KpnI和PacI限制性位點(diǎn)的多位點(diǎn)接頭插入該啟動子和終止子之間。在啟動子的5’末端添加一個XhoI位點(diǎn),并保留天然的EcoRI位點(diǎn)。在終止子的3’末端,通過PCR反應(yīng)引入EcoRI、HindIII和NsiI位點(diǎn)。
使用如下引物從質(zhì)粒pJRoy20(Royer等,1995,生物技術(shù)(Biotechnology)131479-1483)產(chǎn)生含有尖鐮孢胰蛋白酶啟動子第-1208至-1位序列和25個堿基對多位點(diǎn)接頭的PCR片段引物1(有義)5’-GAGCTCGAGGAATTCTTACAAACCTTCAAC-3’(SEQ ID NO.7)Xhol EcoRI引物2(反義)5’-TTAATTAAGGTACCTGAATTTAAATGGTGAAGAGATAGATATCCAAG-3’(SEQ ID NO.8PacI KpnI SwaI100μl PCR反應(yīng)物含有10ng pJRoy20,每個引物各50pmol,1×Pwo緩沖液(Boehringer Mannheim,Indianapolis,IN),dATP、dCTP、dGTP和dTTP各200μM,和5單位Pwo DNA聚合酶(Boehringer Mannheim,Indianapolis,IN)。所用的PCR條件是95℃ 3分鐘,之后25個循環(huán),每個循環(huán)包括95℃ 30秒、50℃ 1分鐘和72℃ 1分鐘。最后的延伸循環(huán)是72℃ 5分鐘。
使用相同的PCR條件和如下引物,從質(zhì)粒pJRoy20產(chǎn)生含有尖鐮孢胰蛋白酶啟動子的第-5到-1位堿基對、25個堿基對的多位點(diǎn)接頭和尖鐮孢胰蛋白酶基因3’非翻譯區(qū)的1060個堿基對(終止子區(qū))的第二個PCR片段引物3(有義)5’-TCACCATTTAAATTCAGGTACCTTAATTAAATTCCTTGTTGGAAGCGTCGA-3’(SEQ IDNO.9)SwaI KpnIPacI引物4(反義)5’-TGGTATGCATAAGCTTGAATTCAGGTAAACAAGATATAATTT-3’(SEQ ID NO.10)NsiI HindIII EcoRI使用0.2μl第一次PCR(啟動子)反應(yīng)產(chǎn)物和3μl第二次(終止子)反應(yīng)產(chǎn)物作為模板,以及引物1和4,獲得含有尖鐮孢胰蛋白酶啟動子第-1208到-1位、25個堿基對的多位點(diǎn)接頭和尖鐮孢胰蛋白酶終止子的1060個堿基對的最終2.3kb重疊PCR片段。所用PCR條件是95℃ 3分鐘,之后30個循環(huán),每個循環(huán)包括95℃ 30秒、62℃ 1分鐘和72℃ 3分鐘。最后的延伸循環(huán)是72℃ 5分鐘。該反應(yīng)也使用Pwo DNA聚合酶。
將所獲的含有胰蛋白酶啟動子、多位點(diǎn)接頭和胰蛋白酶終止子的2.3kb片段用EcoRI消化,并連入EcoRI消化的含有bar基因的載體pMT1612(WO 97/26330)中產(chǎn)生pDM181(圖4)。
實(shí)施例12質(zhì)粒pSheB1的構(gòu)建通過修飾pDM181產(chǎn)生Fusarium venenatum表達(dá)載體pSheB1(圖5)。修飾包括(a)去除pDM181序列中的兩個NcoI位點(diǎn),和(b)重新恢復(fù)尖鐮孢胰蛋白酶啟動子的天然翻譯起始(在ATG起始密碼子處重新構(gòu)建一個NcoI位點(diǎn))。
使用QuikChangeTM定點(diǎn)誘變試劑盒(Stratagene Cloning Systems,LaJolla,CA),根據(jù)廠商說明使用如下誘變引物對實(shí)現(xiàn)pDM181序列中兩個NcoI位點(diǎn)的去除5’-dCAGTGAATTGGCCTCGATGGCCGCGGCCGCGAATT-3’(SEQ ID NO.11)和5’-dAATTCGCGGCCGCGGCCATCGAGGCCAATTCACTG-3’(SEQ ID NO.12)5’-dCACGAAGGAAAGACGATGGCTTTCACGGTGTCTG-3’(SEQ ID NO.13)和5’-dCAGACACCGTGAAAGCCATCGTCTTTCCTTCGTG-3’(SEQ ID NO.14)使用QuikChangeTM定點(diǎn)誘變試劑盒以及如下誘變引物對也實(shí)現(xiàn)了尖鐮孢胰蛋白酶啟動子天然翻譯起始的重新恢復(fù)5’-dCTATCTCTTCACCATGGTACCTTAATTAAATACCTTGTTGGAAGCG-3’(SEQ IDNO.11)和5’-dCGCTTCCAACAAGGTATTTAATTAAGGTACCATGGTGAAGAGATAG-3’(SEQ IDNO.12)所有定點(diǎn)改變均通過合適載體區(qū)的DNA序列分析確證。
實(shí)施例13pDM194和pDM218的構(gòu)建用于在Fusarium venenatum中獲得Thermomyces lanuginosus(原稱Humicola lanuginose)脂酶表達(dá)的7.8kb質(zhì)粒pDM194(7.8kb)具有如下基因元件含有尖鐮孢胰蛋白酶基因啟動子(Royer等,1995,同上)的1.2kb DNA片段。
含有Thermomyces lanuginosus脂酶cDNA(EP 305 216)的0.9kb DNA片段。
含有尖鐮孢胰蛋白酶基因終止子(Royer等,1995,同上)的1.1kb DNA片段。
來自pMT1612(WO 98/11203)的含有2.8kb大腸桿菌載體pUC19和一個1.8kb片段的4.7kb DNA片段,其中所述1.8kb片段含有構(gòu)巢曲霉amdS基因啟動子(Hynes等,1988,分子細(xì)胞生物學(xué)(Mol.Cell Biol.)82589-2596)、吸水鏈霉菌膦絲菌素乙酰轉(zhuǎn)移酶(bar)基因(Thompson等,1987,EMBO Journal 62519-2514)、和黑曲霉AMG終止子。
通過PCR產(chǎn)生SwaI/PacI脂酶片段。采用含有Thermomyceslanuginosus脂酶基因(EP 305 216)cDNA的質(zhì)粒pMHan37作為模板。以下顯示的引物5和6用于在該脂酶編碼區(qū)的5’末端引入一個SwaI位點(diǎn)和在3’末端引入一個PacI位點(diǎn)。
引物5(有義)5’-ATTTAAATGATGAGGAGCTCCCTTGTGCTG-3’(SEQ ID NO.17)SwaI引物6(反義)5’-TTAATTAACTAGAGTCGACCCAGCCGCGC-3’(SEQ ID NO.18)PacI100μl PCR反應(yīng)物含有1ong pMHan37,每個引物各50pmol,1×PCR緩沖液(Perkin-Elmer Corp.,Branchburg,NJ),dATP、dCTP、dGTP和dTTP各250uM,和5單位Taq DNA聚合酶(Perkin-Elmer Corp.,Branchburg,NJ)。所用的PCR條件是95℃ 5分鐘一個循環(huán),之后30個循環(huán),每個循環(huán)包括95℃ 1分鐘、55℃ 1分鐘和72℃ 2分鐘。根據(jù)廠家說明將0.9kb PCR產(chǎn)物亞克隆在TA克隆試劑盒(Invitrogen,Carlsbad,CA)的pCRII中。采用Qiagen Maxiprep試劑盒(Qiagen,Santa Clarita,CA)分離質(zhì)粒DNA,用SwaI和PacI消化,之后在1%瓊脂糖凝膠上100伏電泳1小時。切下該0.9kb片段,采用SpinBind試劑盒(FMC,Rockland,ME)純化,并克隆至pBANe6(WO 98/11203)中,產(chǎn)生pBANe8。
用SwaI和PacI消化pBANe8,并將該0.9kb脂酶片段與SwaI/PacI消化的pDM181連接,產(chǎn)生脂酶表達(dá)質(zhì)粒pDM194(圖6)。
從pJRoy35(圖7)構(gòu)建pDM218。通過PCR在尖鐮孢胰蛋白酶啟動子5’末端引入NotI和PmeI限制性位點(diǎn)。采用pDM181作為模板,利用如下引物,制備含有該啟動子5’末端的362bp擴(kuò)增子multi 15’-ATAAGAATGCGGCCGCTAGTTTAAACTTACAAACCTTCAACAGTG-3’(SEQID NO.19)multi 25’-TAGCATCTATCTCCGTCTT-3’(SEQ ID NO.20)100μl PCR反應(yīng)物含有150ng 3kb EcoRI片段、每個引物各50pmol、1×Pwo緩沖液,dATP、dCTP、dGTP和dTTP各200uM,和5單位Pwo DNA聚合酶。所用的PCR條件是95℃ 3分鐘一個循環(huán);之后30個循環(huán),每個循環(huán)包括95℃ 1分鐘、50℃ 1分鐘和72℃ 1.5分鐘;之后72℃延伸5分鐘。將該擴(kuò)增子亞克隆至pCR-Blunt載體(Invitrogen,Carlsbad,CA)中。在1%瓊脂糖凝膠上100伏電泳0.25kb NotI/BcuI片段1小時,將其切下并采用QIAquick凝膠提取試劑盒(Qiagen,Santa Clarita,CA)進(jìn)行純化。
通過PCR在尖鐮孢胰蛋白酶終止子3’末端引入HpaI、SnaBI和PpuMI位點(diǎn)。采用該3kb EcoRI片段作為模板,利用如下引物,制備含有該胰蛋白酶終止子3’末端的714bp擴(kuò)增子multi35’-GTGTGCAGTGACCCAGAAT-3’(SEQ ID NO.21),multi45’-GATTGGGTCCCTACGTAGTTAACACTATAGGCCATCGTTTAC-3’(SEQ IDNO.22)100μl PCR反應(yīng)物含有每個引物各50pmol、150ng 3kb EcoRI片段、1×Pwo緩沖液,dATP、dCTP、dGTP和dTTP各200uM,和5單位Pwo DNA聚合酶。所用的PCR條件與上面列出的條件相同。將該擴(kuò)增子亞克隆至pCR-Blunt載體中。按以上所述分離0.62kb NheI/PpuMI片段。
從pDM194分離含有尖鐮孢胰蛋白酶啟動子3’末端、Humicolalanuginosa脂酶基因(Geneseq核苷酸登錄號N91076)、和尖鐮孢胰蛋白酶終止子5’末端的2.3kb BcuI/NheI片段。
將該0.25kb NotI/BcuI片段、2.3kb BcuI/NheI片段和0.62kbNheI/PpuMI片段一起克隆在用NotI部分消化和用PpuMI完全消化的pDM194中,產(chǎn)生pDM218(圖8)。
實(shí)施例14質(zhì)粒pMWR60的構(gòu)建質(zhì)粒pMWR60來源于pEJG25A表達(dá)載體。pEJG25A是按如下步驟通過在pDM181(實(shí)施例11)中插入一段來自Peniophora lycii的肌醇六磷酸酶編碼序列(WO 98/28408)構(gòu)建的首先,設(shè)計了兩個合成的寡核苷酸引物(顯示于下),從質(zhì)粒pAlphy2(WO 98/28408)模板通過PCR擴(kuò)增Peniophora lyci肌醇六磷酸酶編碼序列。
正向引物5’-ATTTAAATATGGTTTCTTCGGCATTCGC-3’(SEQ ID NO.23)反向引物5’-TTAATTAACTATTCCGACGGAACAAAGC-3’(SEQ ID NO.24)(粗體字母表示編碼序列)每個100μl Pwo聚合酶反應(yīng)含有每個引物各50pmol、1ng模板DNA、2μl 10mM dNTPs,1×Pwo聚合酶緩沖液,和2.5單位Pwo聚合酶。在PerkinElmer 9600型熱循環(huán)儀中按如下程序孵育這些反應(yīng)物94℃ 2分鐘、55℃ 30秒和72℃ 1分鐘,1個循環(huán);94℃ 15秒、55℃ 30秒和72℃ 1分鐘,9個循環(huán);94℃ 15秒、55℃ 30秒和72℃ 1分鐘,15個循環(huán),每個循環(huán)延長20秒;最后一個循環(huán),94℃ 15秒、55℃ 30秒和72℃ 7分鐘;之后為一個4℃保溫循環(huán)。在1%瓊脂糖凝膠上100伏電泳該反應(yīng)產(chǎn)物1小時。切下1.3kb條帶,并采用Qiaex II純化。隨后將該純化的PCR產(chǎn)物克隆在質(zhì)粒pCR2.1(Invitrogen,Carlsbad,CA)中,用于轉(zhuǎn)化大腸桿菌TOP10細(xì)菌(Invitrogen,Carlsbad,CA)。從幾個轉(zhuǎn)化菌落中分離質(zhì)粒DNA,并通過DNA序列測定進(jìn)行分析以確保在PCR期間沒有引入突變。隨后用限制性內(nèi)切酶SwaI和PacI消化一個肌醇六磷酸酶克隆。在1%瓊脂糖凝膠上100伏電泳這些片段1小時,將其切下并采用QiaexII純化。將1.3kb肌醇六磷酸酶基因片段與預(yù)先經(jīng)SwaI和PacI切割的pDM181(實(shí)施例11)連接,產(chǎn)生表達(dá)質(zhì)粒pEJG25A(圖9)。
為了除去5’側(cè)翼DNA中的外源接頭序列,采用Quick-ChangeTM定點(diǎn)誘變試劑盒以及下列寡核苷酸引物誘變pEJG25A,獲得載體pMWR60-Int2引物A5’-CTCTTGGATATCTATCTCTTCACCATGGTTTCTTCGGCATTCGC-3’(SEQ IDNO.25)引物B5’-GCGAATGCCGAAGAAACCATGGTGAAGAGTAGATATCCAAGAG-3’(SEQ IDNO.26)
通過DNA序列分析驗(yàn)證了這些設(shè)計的核苷酸變化。
然后用SfuI和NheI消化pMWR60-Int2,在1%瓊脂糖凝膠上100伏電泳該1.8kb片段1小時,將其切下并采用QiaexII純化。將該分離的片段與pDM218的SfuI-NheI載體片段連接,產(chǎn)生一個新的中間物,稱為pMWR60-Int3。用NotI切割該中間物,按以上所述純化5.35kb片段。將該純化片段與預(yù)先經(jīng)NotI消化過的pSheB1(描述于實(shí)施例12)連接。所獲中間物命名為pMWR60-Int4a。然后用BspLU11I和NheI切割pMWR60-Int4a,并按以上所述純化5.25kb片段。該分離的片段與也經(jīng)BspLU11I和NheI消化、并按上述純化的pSheB1連接。所獲載體產(chǎn)物命名為pMWR60(圖10)。
實(shí)施例15脂酶報道基因的制備為了構(gòu)建稱為LIPOLASETM的Humicola lanuginosa脂酶(Novo NordiskA/S,Bagsvard,丹麥)的變體,根據(jù)廠家說明使用Chameleon雙鏈定點(diǎn)誘變試劑盒。
從pAHL(WO 92/05249)獲得編碼該LIPOLASETM酶的基因。根據(jù)廠家說明,利用引物7258將pAHL氨芐青霉素基因的ScaI位點(diǎn)改變?yōu)镸luI位點(diǎn),由此改變氨芐青霉素抗性基因中ScaI位點(diǎn)并換為MluI切割位點(diǎn)。
引物72585’-GAATGACTTGGTTGACGGGTCACCAGTCAC-3’(SEQ ID NO.27)然后將含有LIPOLASETM基因的pAHL載體作為模板,和寡聚物7258和7770一起用于DNA聚合酶擴(kuò)增,由此改變LIPOLASETM基因中的ScaI位點(diǎn),而又不改變氨基酸序列位置。
引物77705’-TCTAGCCCAGAATACTGGATCAAATC-3’(SEQ ID NO.28)通過加入含有期望突變的適合寡聚物,在LIPOLASETM基因中引入期望突變(例如半胱氨酸的引入)。
使用上述的定點(diǎn)誘變和以下引物構(gòu)建含有編碼LIPOLASETM變體1S,E239C,Q249R的基因的質(zhì)粒以下顯示的引物106659用于引入E99N,N101S。
引物107581
5’-CTTAACTTTGACTTGAAAAACATATCTGACATTTGCTCC-3’(SEQ ID NO.29)以下顯示的引物101782用于引入SPPCGRRP(-E)。
引物1017825’-GGACGGCCTTGGCTAGCCCTCCGTGCGGCCGCCGGCCGGTCTCGCAGGATCTGTTTAAC-3’(SEQ ID NO.30)以下顯示的引物9639用于引入E239C。
引物96395’-ATATCGTGAAGATATGCGGCATTGATGCCACC-3’(SEQ ID NO.31)以下顯示的引物8829用于引入Q249R。
引物88295’-GGCGGCAATAACCGGCCGAACATTCCGGATATCCC-3’(SEQ ID NO.32)通過對該完整基因測序驗(yàn)證了這些突變。所獲質(zhì)粒命名為pEVi1163。
實(shí)施例16pRaMB60的構(gòu)建通過來自pMWR60的6.5kb SfuI-NheI載體片段與來自pSheB1的0.5kbSfuI-NheI片段連接,構(gòu)建質(zhì)粒pRaMB60。通過瓊脂糖凝膠電泳分離所有片段,然后采用BioRad Prep-a-Gene試劑(BioRad Laboratories,Hercules,CA)從凝膠切塊中將其純化出來。
實(shí)施例17含有葡糖淀粉酶啟動子的表達(dá)載體pRaMB62的構(gòu)建采用以下引物和Quick-ChangeTM誘變試劑盒,通過質(zhì)粒pFAMG的定點(diǎn)誘變產(chǎn)生單一BspLU11I位點(diǎn)引物15’-dCACTGCTATACCCAACATGTTTACTCAAGTCC-3’(SEQ ID NO.33)引物25’-dGGACTTGAGTAAACATGTTGGTGATAGCAGTG-3’(SEQ ID NO.34)通過DNA序列測定驗(yàn)證該定點(diǎn)改變,所獲質(zhì)粒衍生物命名為pMWR62-Int1。
接著,采用質(zhì)粒pEVi1163作為模板并利用下列引物,通過PCR擴(kuò)增實(shí)施例15中所述的脂酶報道基因,所述引物在該脂酶編碼區(qū)的起始密碼子附近引入一個BspHI位點(diǎn),在終止密碼子之后引入一個PacI位點(diǎn)
正向引物5’-GACTCATGAGGAGCTCCCTTGTGCTGTTC-3’(SEQ ID NO.35)反向引物5’-TGATTAATTAACCTAAAGACATGTCCCAATTAAC-3’(SEQ IDNO.36)該P(yáng)CR反應(yīng)物由1μl模板DNA(10ng)、1μl正向引物(77pmol)、1μl反向引物(81pmol)、10μl 10×Pwo聚合酶緩沖液、16μl 1.25mM dNTP混合物、和1μl(2.5個單位)Pwo聚合酶組成。采用以下溫度設(shè)置在Perkin-Elmer 480型熱循環(huán)儀中孵育該反應(yīng)物94℃ 5分鐘1個循環(huán);95℃ 1分鐘、47℃ 1分鐘和68℃ 2分鐘,30個循環(huán);以及4℃保溫循環(huán)。
然后用BspHI和PacI消化該擴(kuò)增產(chǎn)物,通過瓊脂糖凝膠電泳純化(實(shí)施例16),之后和pRaMB60的5.8kb PmeI-NcoI片段以及pMWR62-Int1的2.1kb StuI-BspLU11I片段一起用于三部分連接。所獲載體命名為pRaMB62(圖11),含有處于Fusarium venenatum葡糖淀粉酶啟動子控制下的脂酶報道基因。
實(shí)施例18含有“Daria”啟動子的表達(dá)載體pRaMB64質(zhì)粒的構(gòu)建采用PCR和以下設(shè)計分別在啟動子片段的5’和3’末端引入SwaI和BspLU11I位點(diǎn)的引物對,擴(kuò)增稱為“Daria”啟動子的pECO3啟動子區(qū)域(實(shí)施例10)引物15’-GCATTTAAATTACTACTGTGATGTG-3’(SEQ ID NO.37)引物25’-GATTGATTGGAAACACATGTTGATG-3’(SEQ ID NO.38)該P(yáng)CR反應(yīng)物由1μl pECO3(10ng)、1μl正向引物(50pmol)、1μl反向引物(50pmol)、10μl 10×Pwo聚合酶緩沖液、16μl 1.25mM dNTP混合物、和1μl(2.5個單位)Pwo聚合酶組成。采用以下溫度設(shè)置在Perkin-Elmer 480型熱循環(huán)儀中孵育該反應(yīng)物95℃ 5分鐘1個循環(huán);95℃ 1分鐘、47℃ 1分鐘和68℃ 2分鐘,30個循環(huán);以及4℃保溫循環(huán)。
該0.9kb PCR產(chǎn)物在1%瓊脂糖凝膠上100伏電泳1小時,切下并采用Qiaex II純化。
將該擴(kuò)增DNA片段亞克隆至pCR2.1(Invitrogen,Carlsbad,CA)中,然后通過SwaI、BspLU11I、EcoRI和XhoI限制性酶切割進(jìn)行分析以驗(yàn)證其正確性。以此方式產(chǎn)生的質(zhì)粒命名為pECO4,用SwaI和BspLU11I消化之,并按實(shí)施例16所述方法通過凝膠電泳純化該0.9kb啟動子片段。將該純化片段與pRaMB60的5.8kb PmeI-NcoI片段以及編碼該脂酶報道基因的0.9kb BspHI-PacI片段混合進(jìn)行三部分連接。該連接產(chǎn)物pRaMB64(圖12)含有指導(dǎo)該脂酶報道基因表達(dá)的“Daria”啟動子。
實(shí)施例19含有來源于液泡相關(guān)蛋白質(zhì)基因的啟動子的表達(dá)載體pRaMB66質(zhì)粒的構(gòu)建采用下列引物通過PCR擴(kuò)增來自編碼推測的液泡相關(guān)蛋白質(zhì)的pQUINN(實(shí)施例10)的啟動子片段,所述引物在該啟動子的5’和3’末端分別引入SmaI位點(diǎn)和NcoI位點(diǎn)引物15’-dCGACCCGGGAATTAGAGAGGTTAGG-3’(SEQ ID NO.39)引物25’-dCGTATAACCCATGGTGGACTTGTCGGAC-3’(SEQ ID NO.40)該P(yáng)CR反應(yīng)物由1μl pQUINN(10ng)、1μl正向引物(50pmol)、1μl反向引物(50pmol)、10μl 10×Pwo聚合酶緩沖液、16μl 1.25mM dNTP混合物、和1μl(2.5個單位)Pwo聚合酶組成。采用以下溫度設(shè)置在Perkin-Elmer 480型熱循環(huán)儀中孵育該反應(yīng)物95℃ 5分鐘1個循環(huán);95℃ 1分鐘、47℃ 1分鐘和68℃ 2分鐘,30個循環(huán);以及4℃保溫循環(huán)。
該3.1kb擴(kuò)增DNA片段在1%瓊脂糖凝膠上100伏電泳1小時,切下并采用Qiaex II純化。
將該3.1kb擴(kuò)增DNA片段亞克隆至pCR-Script(Stratagene,La Jolla,CA)中,產(chǎn)生中間質(zhì)粒pQUINN-啟動子A。從該質(zhì)粒分離兩個限制性片段一個2.4kb SmaI-NdeI片段,和一個0.7kb NdeI-NcoI片段(這兩個片段一起包括了該完整啟動子區(qū)域)。將該分離片段與pRaMB60的8kbPmeI-NcoI片段和前面實(shí)施例中所述編碼脂酶報道基因的0.9kb BspHI-PacI片段混合進(jìn)行四部分連接。該連接產(chǎn)物pRaMB66(圖13)含有處于推測的液泡相關(guān)蛋白質(zhì)基因啟動子轉(zhuǎn)錄控制之下的脂酶報道基因。
實(shí)施例20在Fusarium venenatum中表達(dá)位于AMG、“Daria”和液泡相關(guān)蛋白質(zhì)的啟動子控制下的脂酶報道基因通過用從添加了2.5%葡萄糖和2.5mM硝酸鈉的1×Vogels培養(yǎng)基平板(2.5%純凈瓊脂)獲得的10個孢塞(plug)接種一個含有500ml RA孢子形成培養(yǎng)基的三角瓶中,28℃、150rpm孵育2-3天,產(chǎn)生Fusariumvenenatum CC1-3(MLY-3)的孢子。通過Miracloth(Calbiochem,San Diego,CA)收獲孢子,并在Sorvall RC-5B離心機(jī)(E.I.DuPont De Nemours andCo.,Wilmington,DE)內(nèi)以7000rpm離心20分鐘。用無菌蒸餾水洗滌沉淀的孢子兩次,重懸在少量水中,然后采用血細(xì)胞計數(shù)器計數(shù)。
通過將4×107個Fusarium venenatum CC1-3孢子接種在100ml YEPG培養(yǎng)基中,于24℃、150rpm孵育16小時,制備原生質(zhì)體。培養(yǎng)物在SorvallRT 6000D(E.I.DuPont De Nemours and Co.,Wilmington,DE)中以3500rpm離心7分鐘。用30ml 1M MgSO4洗滌沉淀兩次,并重懸在15ml含有5mg/mlNOVOZYME 234TM(batch PPM 4356,Novo Nordisk A/S,Bagsvrd,丹麥)的1M MgSO4中。培養(yǎng)物于24℃、150rpm孵育,直到原生質(zhì)體形成。向原生質(zhì)體消化物中加入35ml體積的2M山梨糖醇,該混合物以2500rpm離心10分鐘。重懸沉淀,用STC洗滌兩次,并以2000rpm離心10分鐘沉淀原生質(zhì)體。用血細(xì)胞計數(shù)器計數(shù)原生質(zhì)體,并將其重懸在8∶2∶0.1的STC∶SPTC∶DMSO溶液中至終濃度1.25×107個原生質(zhì)體/ml。在NalgeneCryo 1℃冷凍箱(VWR Scientific,Inc.,San Francisco,CA)中控制速率地進(jìn)行冷凍后,將該原生質(zhì)體保存在-80℃。
在冰上融解冷凍的Fusarium venenatum CC1-3原生質(zhì)體。在各個50ml無菌聚丙烯管中加入5-10μg pRaMB62、pRaMB64和pRaMB64(描述于實(shí)施例17-19中)以及5μl肝素(每ml STC含5mg)。每管加入100μl原生質(zhì)體,輕柔混合,并在冰上孵育30分鐘。加入1ml SPTC并在室溫孵育20分鐘。加入25ml 40℃ COVE頂層瓊脂糖后,將每管中的混合物鋪在空的150mm直徑平板上,并于室溫孵育過夜。大約24小時后,在平板頂部再鋪上含有10mg BASTATM/ml的另外25ml 40℃ COVE頂層瓊脂糖,并在室溫孵育長達(dá)14天。除草劑BASTATM中的活性成分是膦絲菌素。BASTATM從AgrEvo(Hoechst Schering,Rodovre,丹麥)獲得,并在使用前用酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,用氯仿∶異戊醇(24∶1)抽提一次。
從篩選平板(COVE底層,COVE-BASTATM覆蓋層)直接挑取轉(zhuǎn)化體至含有25ml添加了1mM CaCl2和100μg/ml氨芐青霉素(防止細(xì)菌污染)的M400Da培養(yǎng)基的125ml搖瓶中,并于28℃、200rpm在平臺搖床上孵育7天。還包括未轉(zhuǎn)化受體株作為陰性對照。
在第7天從搖瓶取樣。通過離心除去細(xì)胞,然后將每個上清樣品10μl與等體積Tris-甘氨酸樣品緩沖液(Novex Experimental Technology,San Diego,CA)一起加熱至95℃ 5分鐘。在10-20%Tris-甘氨酸梯度凝膠(Novex Experimental Technology,San Diego,CA)上分離變性的上清液蛋白,并用考馬斯蘭染色。SDS-PAGE分析顯示,產(chǎn)生脂酶的轉(zhuǎn)化體分泌一種表觀分子量為大約43kDa的主要多肽。
相似地,采用對硝基苯丁酸作為底物分析來自每個轉(zhuǎn)化體的無細(xì)胞培養(yǎng)液的脂酶活性(Royer等,1995,同上)。
結(jié)果顯示于表1,這些結(jié)果表明,采用存在于pRaMB62、pRaMB64和pRaMB66中的Fusarium venenatum啟動子元件表達(dá)并分泌了活性脂酶。
表1
實(shí)施例21比較處于Fusarium venenatum淀粉葡萄糖苷酶啟動子和尖鐮孢胰蛋白酶啟動子控制之下的Humicola lanuginosa脂酶報道基因的表達(dá)將按實(shí)施例20所述制備的含有pRamB64(實(shí)施例17)或pDM218(實(shí)施例18)的Fusarium venenatum CC1-3轉(zhuǎn)化體,于pH6.25含有適合碳源、氮源和痕量金屬源并補(bǔ)加了尿素或磷酸銨作為飼料的2升發(fā)酵罐中,29℃、1200rpm培養(yǎng)180小時。采用對硝基苯丁酸作為底物(Royer等,1995,同上)在180個小時內(nèi)每隔18-24個小時分析每個發(fā)酵物的無細(xì)胞培養(yǎng)液的脂酶活性。
圖14顯示了在Fusarium venenatum中處于Fusarium venenatum淀粉葡萄糖苷酶(pAMG)啟動子或尖鐮孢胰蛋白酶(pSP387)啟動子控制下的Humicola lanuginosa脂酶報道基因表達(dá)的比較。結(jié)果說明,無論在飼料中采用尿素還是磷酸銨作為氮源,采用Fusarium venenatum淀粉葡萄糖苷酶啟動子比采用尖鐮孢胰蛋白酶啟動子可以獲得更高水平的脂酶活性。而且,當(dāng)在飼料中采用磷酸銨時,觀察到更高的脂酶活性水平。
生物材料的保藏如下生物材料已根據(jù)布達(dá)佩斯條約保藏在農(nóng)業(yè)研究機(jī)構(gòu)保藏中心,1815 University Street,Peoria,Illinois,61640,并給予了如下保藏號保藏物 保藏號 保藏日期大腸桿菌TOP10(pECO3)NRRL B-300671998年10月27日大腸桿菌DH10B(pFAMG)NRRL B-300711998年10月27日大腸桿菌DH10B(pQUINN) NRRL B-300751998年10月27日大腸桿菌TOP10(pFB0346) NRRL B-300731998年10月27日這些菌株在如下條件下保藏,即確保在本專利申請未決期間由專利和商標(biāo)局局長依照37C.F.R.§1.14和35U.S.C.§122授權(quán)的人可獲得該培養(yǎng)物。該保藏物代表該保藏菌株基本上純的培養(yǎng)物。如果在本主題申請的等同申請或其派生申請?zhí)岢龅膰以撏鈬鴮@ㄒ?,可以獲得該保藏物。但是,應(yīng)當(dāng)理解,可獲得保藏物并不構(gòu)成以損失政府法令所授予專利權(quán)利而實(shí)施本主題發(fā)明的許可。
本文描述和要求保護(hù)的本發(fā)明的范圍并不被本文公開的具體實(shí)施方案限制,因?yàn)檫@些實(shí)施方案旨在用作本發(fā)明幾個方面的舉例說明。任何等同的實(shí)施方案都包括在本發(fā)明的范圍中。實(shí)際上,從前面的描述來看,除了本文給出和描述的之外本發(fā)明的各種修改將為本領(lǐng)域技術(shù)人員所明了。這些修改也包括在所附權(quán)利要求的范圍內(nèi)。在沖突的情況下,包括定義在內(nèi)的本公開將優(yōu)先。
本文引用了各種參考文獻(xiàn),它們的公開以參考文獻(xiàn)的方式完整地并入本文。
序列表<110>Berka,RandyRey,MichaelBrown,Kimberly<120>用于在真菌細(xì)胞中表達(dá)基因的啟動子<130>5611.204-WO<140>PCT/US00/07815<141>2000-03-22<150>09/274,449<151>1999-03-22<160>40<170>FastSEQ for Windows Version 4.0<210>1<211>6050<212>DNA<213>鐮孢霉屬<400>1aatttcgtcg atagcgaggg actcctggcc ctcgaattta gttagcgtat cagtgtaaag60tgctgggttc tccaggcgta agtaaattga accagatgtt agctcccaga tttcgccccg120aagccggttg ggcagaccaa cgcggataag tttatggaaa gttggttggc ggatcaatgt180aaagttcctg ccattgtcac gcagatactc ggcccaaaga cgcatctttg ccctatcgcg240caactttttt gggtccccag gatatcggaa gagcattcct aagccagcat ctggtgggag300atcgttcttc ttatcttcgg ttcttaaaag atgttcagag taacactcag cagcaactcg360acgcaacttg gctacgttgc caacgcctgc tctaagaccc ttcttgaggc cgtcacagaa420acgttcgcag gactgtctgg ttccagcgag atggattgtt atgcgttgtt ctcgggggtc480tctcttgtct ttagaggtat cggcaagaag gccattccac gtagtcagag cgagtgcgaa540ctataaccag gcaacgtcag aatttgtacc atgcaagatt tttataccac atacctggaa600gttctggcta ttcaagcgct ctacccttcg tatagcacat aaaggaaatg tgaatccatt660gccactgggt cctcctccgt gtgtctggcc ggtaaaagcg gtcgaggttg aaaggctagc720agattgcaca aagctagtgg gtgttgttga gaagcacatg taatgctctg acaggtgtag780cttgccagca taatgccatc ctcgatcgtg atccttatca ccgtgagtag cgttggaggg840cgggatagta agctcggcgt tgatctcgta gaggggcgcc tgagaggcgg gcaagcgaaa900ttggctctga aatagcgatg actttgaggg attccgatct gaactggata gattgagccc960ctgggtagga tcgataagct gctgggcttt ttgaacgatg ttggtgaagt tcgaaaacat1020gatttcggtc agcggcgcat gacgaggggg gttccggtcc aggagggagg tcgcggctga1080gcttgaagga gatgcaagac acgaagcgaa agacacgaag agagcgcaag agtctgagta1140tgtgcaacca ggctcgaata agtgcaaggc aggcagaagt acggaataga cgatagaatt1200gagtatagaa aggctgaatg gaagatggag acgagttata ggacggtgga gatagagtgg1260agttgaagtt gaacgaagct gcgtcaggtc cagatacggg agactggcca tcaactactg1320gccaggtagc cagggcgcga tgggcgggtg ggcagggtcg cgggggggac ctcagggcat1380tcctttctcc aagggccgct ggggctatgg acggggctgg ctgaactcca gccgtcatgg1440gatagcggtg caagagatca ggtactaagt ctaccatgat aatttagggg gcagagaaaa1500atgatatatt tgtttagtag taagcgggtt tttacagttg aggaaccaac cttcttcatt1560tatttattct ttctttctct gcaattcagt cctttttctt aaatagaata tctaccaatg1620gaacggcgtg gctgaagtgg ctgaagaata tagctcgagc tgtcaaaccg ctcatcctac1680taccctaggt ataaagctgg gaactaagac tcatttctat ccaactcatc atattgggag1740
ttagtgtaga cctgtcggcc tagagaatat gtgtatctgc atactttcaa ataccctacg1800tatacccact atgtttagca caatcattga cctctcaagg cctcacccat ctcaacacct1860gtcgtgtgct cacttgacta cttctttgaa ccagctcgcc atcggactag tcgaacaagc1920ttgtcgcccc catacagatg aatgtatgtt taaagctaca tgatcagcct gaaccgagca1980taactcgagt gccgagactc ctctgatgta tatcgagatg aatgacaaac ctacgggtcc2040gttcttgaga agtggcctga gatttctcac ttggtgagaa aaaggacggg cgagcgggag2100cctgagtcag aagaaatacc tgtctccttg gatctcacat gacggtgttg tggaagagtg2160catctattgt cattgctgga gtgacggcag agtaggggtc taaagaaacc catactgagt2220agagatggag aagacaacaa aagcccaaga cgacagagac gacagaagat taaagctatc2280agagcgagac tatatcacta ttcgaaacct gcgagtaatt taacaagaag tacacatcat2340cattgttatc aattcgacga agacatggtc gaaaattctt gcggtgtata tgtctgttgt2400atatgggcct gggcattgtt atttttcgcc gtctttatgt gtactaacac ttccattgat2460accccagaac aaaagatgaa cgcttaaaca gcaccaaaat caggagaaga atggcgctgc2520tctaggtatg cttctgggat aaaaagcgat gttgatacct ctcagaaaag aagtgatttg2580aagttgaatc aaacaaatag ccgatggagc gatctgaagg ggtggcagac ctgctacgcg2640catttaggca aggcatcaac tcggcagatg attaagaaag gttttgtagg ttcacgtgtt2700gtgttgtgtt ccattataag tttataacct tgctaagatg caacgactct gacctcaggg2760tgttagaaaa attgaccact aggagcataa gtgacgaaat tcggggatca agacaataga2820tagtttcatt ttcatgtgct cctacgtctt ttcacgtaat gtttcttata aaaaaaaaga2880tagcattgtc tctttggtga aaagagaaaa aaagatgtta cgacgtggcc ttgattcgaa2940cagacgcctc cgaagagaat agatttctag tctatcgcgt tagaccactc cgccaccacg3000ccttacgtaa tctgtgattg ttgaaagtta ctctcgtgtt acggtctata cgtgaagaat3060ctacacttga cgagtctcga ggtctggggt cagttagacg gaaatgggag aacaaagaga3120cttggtgaca ttgcaggcaa ccgggtagat gttgaggtca ttgatcggac aagattgttg3180cttcaaaagt aacaggtatt ctttttttta atcaacagaa acgttccatg ttcatttgtt3240aatccaatct atttgtgata gcgtttgatg acaaacaata ataatgatgg tctggcggct3300agtgatcgtt tgtaatgacg tcgtcatata tcctatcact atacagttgc tttgcacacg3360cactcacgtc cttcattcgt tgtcttcact atttgatggt gatttggttc aacaacctac3420agaaataatg acctgtggtg ttctccgaat atggctagac caacacaagc ttgtaccgcg3480gcattcaaat caccatgtga tgcccatcat cagatcatcc accaacccaa aaacagacca3540actactcaca aaaaggcatc tcatcaagaa aaaacggcca actaacgtcc aaaaggcccg3600aaaaacgtcc atcacgccgc agccgagact tcaatagact gcacaagaag gaccgatgag3660atcgaccaga ctaaacccgg gagagtgtca aatatgcggg ggattgggga acttacccca3720gaaaagagaa ggaggataaa ttccatgtct ggggttgacg tctctattgg ttagacacga3780acgcctgctc tcggcgtaat ttataccata gcgccaatga gggcggaaac tcctgttttg3840tcaagtcgtc attgttggtt gggtcatgat atatagccag taggtatccg tcttggtgat3900tgaccagaca tatcgctcat cacagatcaa catcactgct atcaccaaca tgcttactca3960agtcctttat ggcttggtag ccagtgccct ttggcaaggc caagtcgttg catcaccaag4020caaggacaat tcactggagc gcttcattga caaacaagct gatatttcta tcaagggtgt4080ccttgctaat attggcgctg atggaaaaag ggcacagggt gcagcgcctg gtgctgttgt4140ggcaagtcca tcgaaagaag atcctgattg taagccagca tcctaccttg tccttgtccg4200catgctaatg atggtctcag attggtacac ttggactcgt gactctgctt taacgtacaa4260agtgctcgtt gagagattca tccacggcga caaatctctc caacgaaaga tagatgaata4320tgtctccgca caagcgaaac tgcaagggac cacaaatcca tcgggcagcc cagagtcggg4380cggtctcggc gagccaaagt tccatgtgaa tctcactgct ttcactggat cttggggtcg4440gcctcagcgc gacggccctc cgcttcgggc taccgccttg actctgtatg cagaatggct4500catttcccac ggcgaaagat ccaaggcttt gaacaaagtc tggccagtca tcgagaagga4560ccttgcgtat actaccaagt tctggaatcg cactggctat gatctatggg aggaggttaa4620tggatcttct ttctttacac tttcggcttc gcatcgtgct cttgtcgaag gtgccgctct4680ggctaagaaa cttggcaaat cttgtcctga ctgtgtcacc aacgctcctc gcgttctgtg4740cttccttcag actttctgga ctggtggcta cgttgactcc aacattaacg tcaaggatgg4800tcgcaagggt ctcgatgtca actccatcct ctcgtccatt catacattcg atcccaactc4860caagtgcacc gactcgacgt tccagccttg ttcacccaga gctcttgcga accacaaggc4920ggtcgtcgat tctttcaggt caatctatgg tgtcaacaag aatagaggtc aaggcaaggc4980cgcggctgtt ggtcgatata gcgaggacgt gtactatgat ggcaaccctt ggtacctggc5040cactcttgct gctgcagaac aactctacgc tgcggtctac cagtgggata agcttggcgc5100tgttactgtt gacgatgtat ctttgtcttt cttcaaggat atcgttccca aggtctccaa5160
aggcacttat gccaagaaga ccaagacata caaggagatc atcaaagcag ccaagactta5220cgccgacggc tttgtcgctg tcgtgcagac atacactccc aaggacggct cactagctga5280gcaatttgac aagtcaactg gagcccccaa gtccgctgtt cacctcacct ggtcctacgc5340cgcctttgtc gccacaactg aacgtcgcga cggcatcatc tctccctcct ggggcgaaag5400cagcgccaac aaggtccccg ccgtgtgtca agctgcccca gcatgtgaca caaccatcac5460cttcagtgtc aagaacgtgc aagtttcatc cgaccaaaag gtttacgtgg ttggctcagt5520gactgagctt tctaactggt cacctgatga tggcattgcg cttacgccat ctagttccgg5580agtgtggagc gtcaaggtta agattccttc tgatacaagc tttgagtaca agtatatcaa5640gaagactagc agtggggatg ttacgtggtt gagtgatccc aacaaccggg ctattacggg5700tagcaagtgt ggaagtacaa gtactcttga tgatgagtgg aggtagtgga tgacagattt5760atcaagctat gtagttttgt gaatatataa ttatccaaat tatcagggtt cggtaagaat5820ataattcagt tcagcagtct gtacaagcaa gccatgattc acgcttcctt cgtttggaag5880ataagggttc ctcgccaccg tcaagataat tttctcgtgc taatatcacg taatccatct5940gcattaaacc cttgccggga aggtttcttc aacccagcaa ccccagagta actcggagat6000agggaagtct atttgcctta tcctccgtga cgaattccct gaacccaatt 6050<210>2<211>2517<212>DNA<213>鐮孢霉屬<400>2aattactact gtgatgtgat cacacctaac taaataccta actcacccga tggatcgaca60aggaaatctc acgcccttgt cgagtctcct ctttcgtctg tctcctgggc tcgctactgt120ccgattgtaa ctctcgctct ccaacttgtt caactctaat aagtggtggc acaacgtgaa180gatgtattgt tgtgtgaggc ggggggttgc gtggcattac caaagagacc aaaagtcccc240ctatgtcgat ttgatggtgt tgcgttgcca tgatacggga ccccgaatat gttgtatgca300tcatgcgtac agaaagctac tgttcaaaac gaacggcaaa gcggattgat caacccgtga360aagaccatgg gtctctctca gtccacaatc ttctcttcct gatcaaattt atggatccaa420gcggccacaa ttctagcgcc atcatgggtc cctttcctct tttcgctcac cccatgttcc480ctgtcccacc tcattcagtg gacctgatgg atccctatcc cccgatgagc cggggggtgc540agccttggcg ctctcttctt gttagtgtga cctactgttg atttcactca gcagtcctag600agtccattta gttgggcctg gggtgatggg gtctgagact ttgcttcttg cctggtcttg660tctagctcga atctgtgggt tgcctggcct ggcctggcct gacctgacct gaggggggtg720cccctttgct ctgttctgca tatgttgcta ttagctacct actcgagaat tcataaaagg780actgtccagc cccgtctctt actgacttct ttcctttccc tcttcaccct cgttgtcata840tcaaatctgt cactcgttag accagactac cattcccact ttcgctttta aactacttta900ctcaactaat tctaatacca actccaaaaa ccatcaacat gcgtttcaca tcaatcctcg960ctgccggcgc tttcgccacc atggccgctg cccagagcaa gaccgtctcc ctcgaccctg1020ctcagcagtc tcaggccgac tgcctctccg actgtgagcc tggcgatgtc aagtgccagt1080cttactgcat cactgtatgt tacaacaacg attcccctgt catgtgtaga aaactaacaa1140tcccaatagg ttccctctcc tgacgagaag aacatcgagg aaaccaccaa gtgttgtttg1200ccgcctgccc caagggcaag ggctccgaag gccgacactg agaagtacac cgtttgcatg1260aacgagtgta tcgccgacaa ctactggaag tccgttgatg gtaccccccg tggcaccgac1320gtccccgatg tcaagagcaa ggcctccgag gctgcctcct ccgctgctga gaaggccacc1380gccaccggta ctgctgctga gtctgatgct accgccactg gtgcctccgc tactgagtcc1440gagtccggct ccgactccag ctccgaggag accggctctg cctctggcac tgccactggt1500accgctgctg aggtctccga gactggtaac gccgcctctt ccctcgttgg tggtgtctcc1560ttcctcggtc tcgttgccgc tatcttcgct ctgtaaattg ggtttcctgc tttaggataa1620tctgatttgg catgacggag aaggatttaa tgggttttat tacagcggta atgattggag1680tttggatttc aagatgtgac acgttggaca gcatgataag gcctacgggt ctgatcaatt1740tcatggacaa attttgtttt tttgggtaat catttcgcgt tcacatatgg ctcggcatat1800gagcatgaat acaatacctc ttttttgcgc ctcaattcat tccaatttct tgtgatctca1860cagtgattca acttacaagt tgcggcgcga ccactgaggt cgtgtctgat gtgggtcttc1920tgtttgtgat tggctcatga ttcccaatcg ggtgcttcaa acgttagttt gtaaacaagc1980
gaaatgaggg tcttaggatg catgttcaaa gcgcaaaacc caattgaatt caaatgttaa2040agaatcatcg agaagagcga gttactgagg tgaatttgtg ctttcaactg tcaatacctc2100cctcagaaca aatgaattga attattattc acactcaatg cccaatattc taaacatgtt2160cgttgtaaca gagttttaat tccttgacgc cacaatgttc cttggtaatt atcgcgcctg2220tcacatgaac tggctcctga acttaaacgt tggtgaccca gcaactcgtt tatcaggctt2280agggtagctg tcatacaaca aacaaacttg tacaattgat gttattgatg aatcatgtat2340agaagagcac aattgattta aacacagata aactggtcga accgatttta tcaggttgtg2400tgaacatgca ttgccgaatc agaaaccaga gtaagactat ctacagttcc atgaagacaa2460ttcacagact gccagaaagc aaggtactgg aagcacgaga gacaaaatta ttgaatt 2517<210>3<211>4047<212>DNA<213>鐮孢霉屬<400>3aattagagag gttagggatt tcacatggcc accaatggga aggaggcaac catctgcacg60agcccaccaa gtcatctcct caaactgtgc tgcgactaag aatttgattc cggttctggc120ctggcctttg tatcagctag gtcattctcg actaccggag gccaggctga agcagtcagt180cacgcattgt cactttatcg gtcctgtcct catacggata cactaggcgt caatgggctt240caaacggaga tccagagatc tcatgaagag catcgacgat aaagtgagtg gttggggata300ctgtgcggtg ccgaccccag cggcagccag gttccaccct tgattacatg gttgaaaagt360ggcgttactg ggcgagatca aatttggcat gtatgttcgt ccaatgacgc gagctctcca420tgttgctgcg agggtcagga acggaccagc atgggatcag tgaggtgaaa tccaaccgag480ggagagcgag atctttgtgc tcatatccat gctgccatgc tacgtgccga acaggccaga540tggcgttcaa ctcagtcgac caggtccgat gaacgcggag cggtgacgag atcgaagctt600catctatcgc ttacggggtt atgttccact ttccattaac gtttgcgagt tgctgtttga660gagccatgtc gaaagcatgg accgtgtcac atctttcaag gtaaatctgg aggtgggaag720aagaattgcg aggaacagga tgggaggata gcaggctgac gcggaaagct aggtagctac780ctggctgatt actggctaaa gctggagagc aactaggtaa tatcaggcaa agagctccaa840gagctattgg gaggctggct gattgtctct ggctgagacg caggaggaag ggttaaaatg900gccggcaggc caagaagggg ctgcaaaaca cggagtggat ggtggggcct cccacatacg960ggattcgggc tgcggatcta acctcaattt ggcaagaggt aaataggacg acatgcaggc1020cccctgacat gtaaacaaga caagtggtaa acaagccatc aacatcaaca agagcgaaca1080atcgacacac ccatgggggt gagatatggt agtaaggcag agagagatca gggcagcata1140cgtgggaaag ggctgggcaa gaaaggacac aacggatcaa cagaacgcag cgctaccgag1200ggagcaacac aagtacagta accgctcaca gaggcacaac tcgtccaatc ctgcccccgt1260cttcaaaagc ccagtttcgt tctgagtcct gtccggtccc tcttctcctc ctactccctc1320caattatcgc catccacatc gacatcgtca attcacaacc tcacccagac aagaagaaaa1380gaacgactga aggccttcgc tcgccatcac ccgattcttt tccattctct tcgacttttg1440tttcgtagga acaagagcca gagaacttct tgtcatcctt tcgaatttcg gaaggttgta1500tgagaagctt ctctcgcgcc agcaaaagtc gcaaatctgg actttgaggc acgcgtcccc1560gttcccttca gcatcttccc atcgacatat cgggaatccg aatcccacac acagaccgtt1620accgaaacaa agatacacga agaggttgag atcaaacccc aacagcccga agccggacgg1680gaaggtgaaa tatcttctgt ctccgtcacc gccgaacagg tccctcctcc tcgtcaagag1740caagagttta tcgaagaaga ggtccatatt acgcgtgaag aagaacatta ccaccgtccc1800ggtgtccaaa aattcgagca cgaagacttt actatccgtg aagactcccg acggtacgtt1860cgattttaca tttcctttca tctccattta ggtcgcatct ttttcgttac ttttttggtc1920aattacacgg gggatacgat tttcccacgg tcggagaaag ccctgcttgc tctctatgcc1980taggtctgta ttctctcatc cctctgcgct gatctggcca tggagacgtg tgagaacaag2040actacaattc atcacatcat ttttcgctag gcgaaagcaa ttaccgttgt ccccgacctt2100ctcccaacca tcagttttca ctttcccttt tcttggtctg gcttgccttg accattaccc2160accgcgcacg gagcgcttca gtccccagcc atcccattct cacatcactt ctcatatcct2220ctcttcacac gcctcacaca cccaccccct gcatgctacc atgccaaccc acttcagctt2280ggctggatac ccaatttgct ttgcttcctc cccggctcac tagcgcctct aagcctgctg2340gcctgagcaa ggcggtggag ctatctcagg ggccgccgcc tcccgttgcc atatgatacg2400caaacgactt actatagaca tccatcagct aacccagaca aatctagacc tcaacctccc2460
tctcaatacc aaccttccca gtaccaccaa ccttcccact accaaccacc tcccaaattc2520caaacttctc acactcacgt agagatcgac acccaccgtc atccctacta ctccaccccc2580attgatctcg ctgaacgtga ataccgccag cgttaccgcc ctgcccaagc tttttccaca2640gaagaccctt cttcccactc tcatcctcac taccaacctc aagacaactt caaagccaac2700aactacaccg ttgaaggccg acccgctccc caattccatt cctctgagaa gactgaaatc2760aacaagttta ctgttgacga acactcctct cgccctcagt acaaccacac cgagaagacc2820gaattcaaca actacactgt tgacagccga tcttcccgtc ctcaatacaa cacctgtgag2880aagactgaga tcaacaattt cactgttgac gcccgctctt cccagccacg gtaccgcgac2940accaagacaa ctcaagtcaa cagctacgcc gttgacaagc ccgtttctcg tccatcttac3000aagaaggacg tgagatttac tgaacaaacc gtcgaagctt caaagtccga caagtccaag3060atgggttact acgacgacga gggtaagtga aatctgtcac ccagcgagcg ccatcaagct3120ctctattcgt gacgcaattc aagctaaccc agtcaccagg ttctttccgc aacggcggca3180tccacaagct cggtgacaag tcccgcgaca ttgaggttga cattcgcgag acttctcgtc3240ctgccaatga ctgcgctccc aacaccgtca gcatcccctg ccaccacatc cgtctgggtg3300atttcctcat gctccagggc cgcccctgcc aggtcatccg catctccacc tcctctgcca3360ctggccagta ccgctacctt ggtgtcgacc tcttcaccaa gcagcttcat gaggagtctt3420ctttcatctc caaccctgcc cccagcgttg tcgttcagtc catgctcggc cctgtcttca3480agcagtaccg tgtcctcgat atgcaggagg gtcagatcgt tgccatgacc gagactggcg3540acgtcaagca gggtctccct gtcattgacc agtccaacct ctactctcgc ctccacaacg3600ctttcgagtc cggtcgtggc tctgttcgcg tcctcgtcct caacgacggt ggccgtgagc3660ttgccgttga catgaaggtc atccacggct ctcgcctgta agcgtgttca actgttttct3720gaattcgggc agccgcttgc aatgcgactt cttcccaatg tttaattgag tgaagggaca3780gcactaccag tctcacctca actgtgggga gcgggtctgg gctgtctcta atcttacctg3840tacaatgtca agtttcatag gggacctgtt gtgtcaagat ggttcgagtt ttgtttgtgt3900caagattgga taaatgatat tggctagctg gaaatactgg agtcttttgt gtagatggga3960gagttctgta catgaactat agtaattgac aattgattcc gcatctactt agcttttcat4020tggtgctcta tgcccaacat gtgaatt4047<210>4<211>581<212>PRT<213>鐮孢霉屬<400>4Met Leu Thr Gln Val Leu Tyr Gly Leu Val Ala Ser Ala Leu Trp Gln1 5 10 15Gly Gln Val Val Ala Ser Pro Ser Lys Asp Asn Ser Leu Glu Arg Phe20 25 30Ile Asp Lys Gln Ala Asp Ile Ser Ile Lys Gly Val Leu Ala Asn Ile35 40 45Gly Ala Asp Gly Lys Arg Ala Gln Gly Ala Ala Pro Gly Ala Val Val50 55 60Ala Ser Pro Ser Lys Glu Asp Pro Asp Tyr Trp Tyr Thr Trp Thr Arg65 70 75 80Asp Ser Ala Leu Thr Tyr Lys Val Leu Val Glu Arg Phe Ile His Gly85 90 95Asp Lys Ser Leu Gln Arg Lys Ile Asp Glu Tyr Val Ser Ala Gln Ala100 105 110Lys Leu Gln Gly Thr Thr Asn Pro Ser Gly Ser Pro Glu Ser Gly Gly115 120 125Leu Gly Glu Pro Lys Phe His Val Asn Leu Thr Ala Phe Thr Gly Ser130 135 140Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala Thr Ala Leu145 150 155 160Thr Leu Tyr Ala Glu Trp Leu Ile Ser His Gly Glu Arg Ser Lys Ala165 170 175Leu Asn Lys Val Trp Pro Val Ile Glu Lys Asp Leu Ala Tyr Thr Thr
180 185 190Lys Phe Trp Asn Arg Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly195 200 205Ser Ser Phe Phe Thr Leu Ser Ala Ser His Arg Ala Leu Val Glu Gly210 215 220Ala Ala Leu Ala Lys Lys Leu Gly Lys Ser Cys Pro Asp Cys Val Thr225 230 235 240Asn Ala Pro Arg Val Leu Cys Phe Leu Gln Thr Phe Trp Thr Gly Gly245 250 255Tyr Val Asp Ser Asn Ile Asn Val Lys Asp Gly Arg Lys Gly Leu Asp260 265 270Val Asn Ser Ile Leu Ser Ser Ile His Thr Phe Asp Pro Asn Ser Lys275 280 285Cys Thr Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala Asn290 295 300His Lys Ala Val Val Asp Ser Phe Arg Ser Ile Tyr Gly Val Asn Lys305 310 315 320Asn Arg Gly Gln Gly Lys Ala Ala Ala Val Gly Arg Tyr Ser Glu Asp325 330 335Val Tyr Tyr Asp Gly Asn Pro Trp Tyr Leu Ala Thr Leu Ala Ala Ala340 345 350Glu Gln Leu Tyr Ala Ala Val Tyr Gln Trp Asp Lys Leu Gly Ala Val355 360 365Thr Val Asp Asp Val Ser Leu Ser Phe Phe Lys Asp Ile Val Pro Lys370 375 380Val Ser Lys Gly Thr Tyr Ala Lys Lys Thr Lys Thr Tyr Lys Glu Ile385 390 395 400Ile Lys Ala Ala Lys Thr Tyr Ala Asp Gly Phe Val Ala Val Val Gln405 410 415Thr Tyr Thr Pro Lys Asp Gly Ser Leu Ala Glu Gln Phe Asp Lys Ser420 425 430Thr Gly Ala Pro Lys Ser Ala Val His Leu Thr Trp Ser Tyr Ala Ala435 440 445Phe Val Ala Thr Thr Glu Arg Arg Asp Gly Ile Ile Ser Pro Ser Trp450 455 460Gly Glu Ser Ser Ala Asn Lys Val Pro Ala Val Cys Gln Ala Ala Pro465 470 475 480Ala Cys Asp Thr Thr Ile Thr Phe Ser Val Lys Asn Val Gln Val Ser485 490 495Ser Asp Gln Lys Val Tyr Val Val Gly Ser Val Thr Glu Leu Ser Asn500 505 510Trp Ser Pro Asp Asp Gly Ile Ala Leu Thr Pro Ser Ser Ser Gly Val515 520 525Trp Ser Val Lys Val Lys Ile Pro Ser Asp Thr Ser Phe Glu Tyr Lys530 535 540Tyr Ile Lys Lys Thr Ser Ser Gly Asp Val Thr Trp Leu Ser Asp Pro545 550 555 560Asn Asn Arg Ala Ile Thr Gly Ser Lys Cys Gly Ser Thr Ser Thr Leu565 570 575Asp Asp Glu Trp Arg580<210>5<211>200<212>PRT<213>鐮孢霉屬
<400>5Met Arg Phe Thr Ser Ile Leu Ala Ala Gly Ala Phe Ala Thr Met Ala1 5 10 15Ala Ala Gln Ser Lys Thr Val Ser Leu Asp Pro Ala Gln Gln Ser Gln20 25 30Ala Asp Cys Leu Ser Asp Cys Glu Pro Gly Asp Val Lys Cys Gln Ser35 40 45Tyr Cys Ile Thr Val Pro Ser Pro Asp Glu Lys Asn Ile Glu Glu Thr50 55 60Thr Lys Cys Cys Leu Pro Pro Ala Pro Arg Ala Arg Ala Pro Lys Ala65 70 75 80Asp Thr Glu Lys Tyr Thr Val Cys Met Asn Glu Cys Ile Ala Asp Asn85 90 95Tyr Trp Lys Ser Val Asp Gly Thr Pro Arg Gly Thr Asp Val Pro Asp100 105 110Val Lys Ser Lys Ala Ser Glu Ala Ala Ser Ser Ala Ala Glu Lys Ala115 120 125Thr Ala Thr Gly Thr Ala Ala Glu Ser Asp Ala Thr Ala Thr Gly Ala130 135 140Ser Ala Thr Glu Ser Glu Ser Gly Ser Asp Ser Ser Ser Glu Glu Thr145 150 155 160Gly Ser Ala Ser Gly Thr Ala Thr Gly Thr Ala Ala Glu Val Ser Glu165 170 175Thr Gly Asn Ala Ala Ser Ser Leu Val Gly Gly Val Ser Phe Leu Gly180 185 190Leu Val Ala Ala Ile Phe Ala Leu195 200<210>6<211>187<212>PRT<213>鐮孢霉屬<400>6Met Gly Tyr Tyr Asp Asp Glu Gly Ser Phe Arg Asn Gly Gly Ile His1 5 10 15Lys Leu Gly Asp Lys Ser Arg Asp Ile Glu Val Asp Ile Arg Glu Thr20 25 30Ser Arg Pro Ala Asn Asp Cys Ala Pro Asn Thr Val Ser Ile Pro Cys35 40 45His His Ile Arg Leu Gly Asp Phe Leu Met Leu Gln Gly Arg Pro Cys50 55 60Gln Val Ile Arg Ile Ser Thr Ser Ser Ala Thr Gly Gln Tyr Arg Tyr65 70 75 80Leu Gly Val Asp Leu Phe Thr Lys Gln Leu His Glu Glu Ser Ser Phe85 90 95Ile Ser Asn Pro Ala Pro Ser Val Val Val Gln Ser Met Leu Gly Pro100 105 110Val Phe Lys Gln Tyr Arg Val Leu Asp Met Gln Glu Gly Gln Ile Val115 120 125Ala Met Thr Glu Thr Gly Asp Val Lys Gln Gly Leu Pro Val Ile Asp130 135 140Gln Ser Asn Leu Tyr Ser Arg Leu His Asn Ala Phe Glu Ser Gly Arg145 150 155 160Gly Ser Val Arg Val Leu Val Leu Asn Asp Gly Gly Arg Glu Leu Ala165 170 175Val Asp Met Lys Val Ile His Gly Ser Arg Leu
180 185<210>7<211>30<212>DNA<213>鐮孢霉屬<400>7gagctcgagg aattcttaca aaccttcaac 30<210>8<211>47<212>DNA<213>鐮孢霉屬<400>8ttaattaagg tacctgaatt taaatggtga agagatagatatccaag 47<210>9<211>51<212>DNA<213>鐮孢霉屬<400>9tcaccattta aattcaggta ccttaattaa attccttgtt ggaagcgtcg a 51<210>10<211>42<212>DNA<213>鐮孢霉屬<400>10tggtatgcat aagcttgaat tcaggtaaac aagatataat tt 42<210>11<211>35<212>DNA<213>鐮孢霉屬<400>11cagtgaattg gcctcgatgg ccgcggccgc gaatt 35<210>12<211>35<212>DNA<213>鐮孢霉屬<400>12aattcgcggc cgcggccatc gaggccaatt cactg 35<210>13<211>34<212>DNA<213>鐮孢霉屬<400>13cacgaaggaa agaogatggc tttcacggtg tctg 34
<210>14<211>34<212>DNA<213>鐮孢霉屬<400>14cagacaccgt gaaagccatc gtctttcctt cgtg 34<210>15<211>46<212>DNA<213>鐮孢霉屬<400>15ctatctcttc accatggtac cttaattaaa taccttgttg gaagcg 46<210>16<211>46<212>DNA<213>鐮孢霉屬<400>16cgcttccaac aaggtattta attaaggtac catggtgaag agatag 46<210>17<211>30<212>DNA<213>鐮孢霉屬<400>17atttaaatga tgaggagctc ccttgtgctg 30<210>18<211>29<212>DNA<213>鐮孢霉屬<400>18ttaattaact agagtcgacc cagccgcgc29<210>19<211>45<212>DNA<213>鐮孢霉屬<400>19ataagaatgc ggccgctagt ttaaacttac aaaccttcaa cagtg 45<210>20<211>19<212>DNA<213>鐮孢霉屬<400>20tagcatctat ctccgtctt 19
<210>21<211>19<212>DNA<213>鐮孢霉屬<400>21gtgtgcagtg acccagaat 19<210>22<211>42<212>DNA<213>鐮孢霉屬<400>22gattgggtcc ctacgtagtt aacactatag gccatcgttt ac 42<210>23<211>28<212>DNA<213>鐮孢霉屬<400>23atttaaatat ggtttcttcg gcattcgc 28<210>24<211>28<212>DNA<213>鐮孢霉屬<400>24ttaattaact attccgacgg aacaaagc 28<210>25<211>44<212>DNA<213>鐮孢霉屬<400>25ctcttggata tctatctctt caccatggtt tcttcggcat tcgc 44<210>26<211>43<212>DNA<213>鐮孢霉屬<400>26gcgaatgccg aagaaaccat ggtgaagagt agatatccaa gag43<210>27<211>30<212>DNA<213>鐮孢霉屬<400>27gaatgacttg gttgacgcgt caccagtcac 30<210>28
<211>26<212>DNA<213>鐮孢霉屬<400>28tctagcccag aatactggat caaatc 26<210>29<211>39<212>DNA<213>鐮孢霉屬<400>29cttaactttg acttgaaaaa catatctgac atttgctcc 39<210>30<211>59<212>DNA<213>鐮孢霉屬<400>30ggacggcctt ggctagccct ccgtgcggcc gccggccggt ctcgcaggat ctgtttaac 59<210>31<211>32<212>DNA<213>鐮孢霉屬<400>31atatcgtgaa gatatgcggc attgatgcca cc32<210>32<211>35<212>DNA<213>鐮孢霉屬<400>32ggcggcaata accggccgaa cattccggat atccc 35<210>33<211>32<212>DNA<213>鐮孢霉屬<400>33cactgctatc accaacatgt ttactcaagt cc32<210>34<211>32<212>DNA<213>鐮孢霉屬<400>34ggacttgagt aaacatgttg gtgatagcag tg32<210>35<211>29
<212>DNA<213>鐮孢霉屬<400>35gactcatgag gagctccctt gtgctgttc29<210>36<211>34<212>DNA<213>鐮孢霉屬<400>36tgattaatta acctaaagac atgtcccaat taac 34<210>37<211>25<212>DNA<213>鐮孢霉屬<400>37gcatttaaat tactactgtg atgtg25<210>38<211>25<212>DNA<213>鐮孢霉屬<400>38gattgatgtg aaacacatgt tgatg25<210>39<211>25<212>DNA<213>鐮孢霉屬<400>39cgacccggga attagagagg ttagg25<210>40<211>28<212>DNA<213>鐮孢霉屬<400>40cgtataaccc atggtggact tgtcggac 28
權(quán)利要求
1.制備多肽的方法,包括(a)在有利于該多肽產(chǎn)生的培養(yǎng)基中培養(yǎng)真菌宿主細(xì)胞,其中該真菌宿主細(xì)胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ ID NO.1的第1-3949位核苷酸、SEQID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯(lián)啟動子;和(b)從該培養(yǎng)基分離該多肽。
2.權(quán)利要求1的方法,其中該啟動子含有SEQ ID NO.1第1-3949位核苷酸或其突變、雜合或串聯(lián)啟動子的核酸序列。
3.權(quán)利要求2的方法,其中該啟動子含有SEQ ID NO.1第1-3949位核苷酸的核酸序列。
4.權(quán)利要求3的方法,其中該啟動子含有大腸桿菌NRRL B-30067中的質(zhì)粒pECO3所包含的核酸序列。
5.權(quán)利要求1的方法,其中該啟動子含有SEQ ID NO.2第1-938位核苷酸或其突變、雜合或串聯(lián)啟動子的核酸序列。
6.權(quán)利要求5的方法,其中該啟動子含有SEQ ID NO.2第1-938位核苷酸的核酸序列。
7.權(quán)利要求6的方法,其中該啟動子含有大腸桿菌NRRL B-30071中的質(zhì)粒pFAMG所包含的核酸序列。
8.權(quán)利要求1的方法,其中該啟動子含有SEQ ID NO.3第1-3060位核苷酸,其子序列;或其突變、雜合或串聯(lián)啟動子的核酸序列。
9.權(quán)利要求8的方法,其中該啟動子含有SEQ ID NO.3第1-3060位核苷酸的核酸序列。
10.權(quán)利要求9的方法,其中該啟動子含有大腸桿菌NRRL B-30075中的質(zhì)粒pQUINN所包含的核酸序列。
11.權(quán)利要求1、2、5和8之任意一項(xiàng)的方法,其中該突變啟動子由含有一或多個核苷酸替代、缺失和/或插入的選自下組的啟動子組成SEQ IDNO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ IDNO.3的第1-3060位核苷酸,其中該突變啟動子比相應(yīng)的啟動子具有較強(qiáng)或較弱的啟動子活性。
12.權(quán)利要求1、2、5和8之任意一項(xiàng)的方法,其中該雜合啟動子由兩個或更多個啟動子的部分組成。
13.權(quán)利要求12的方法,其中該雜合啟動子含有一或多個選自下組的部分SEQ ID NO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸。
14.權(quán)利要求13的方法,其中該雜合啟動子還含有另一啟動子的部分。
15.權(quán)利要求1的方法,其中該串聯(lián)啟動子由兩個或多個啟動子組成。
16.權(quán)利要求15的方法,其中該串聯(lián)啟動子含有兩個或更多個選自下組的啟動子SEQ ID NO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸。
17.權(quán)利要求16的方法,其中該串聯(lián)啟動子還含有另一啟動子。
18.權(quán)利要求15的方法,其中該串聯(lián)啟動子的兩個或更多個啟動子同時啟動所述核酸序列的轉(zhuǎn)錄。
19.權(quán)利要求15的方法,其中該串聯(lián)啟動子的兩個或更多個啟動子中的一或多個在所述真菌宿主細(xì)胞的不同生長階段啟動所述核酸序列的轉(zhuǎn)錄。
20.權(quán)利要求1-19之任意一項(xiàng)的方法,其中該真菌宿主細(xì)胞含有一或多個拷貝的所述核酸序列。
21.權(quán)利要求1-19之任意一項(xiàng)的方法,其中該真菌宿主細(xì)胞含有一個拷貝的所述核酸序列。
22.權(quán)利要求1-21之任意一項(xiàng)的方法,其中所述核酸序列編碼與該真菌宿主細(xì)胞異源的多肽。
23.權(quán)利要求1-22之任意一項(xiàng)的方法,其中該多肽是激素或激素變體、酶、受體或其部分、抗體或其部分、或報道分子。
24.權(quán)利要求23的方法,其中該酶是氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶、異構(gòu)酶或連接酶。
25.權(quán)利要求23的方法,其中該酶是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果膠溶酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺轉(zhuǎn)移酶或木聚糖酶。
26.權(quán)利要求1-25之任意一項(xiàng)的方法,其中該核酸序列包含在該真菌宿主細(xì)胞的染色體中。
27.權(quán)利要求1-25之任意一項(xiàng)的方法,其中該核酸序列包含在染色體外因子上。
28.權(quán)利要求1-27之任意一項(xiàng)的方法,其中該真菌宿主細(xì)胞是絲狀真菌或酵母細(xì)胞。
29.權(quán)利要求28的方法,其中該絲狀真菌細(xì)胞是Acremonium、曲霉屬、鐮孢霉屬、腐質(zhì)霉屬、毛霉屬、毀絲霉屬、脈孢菌屬、青霉屬、梭孢殼屬、Tolypocladium或木霉屬的細(xì)胞。
30.權(quán)利要求28的方法,其中該酵母細(xì)胞是假絲酵母屬、漢遜酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或Yarrowia的細(xì)胞。
31.權(quán)利要求28的方法,其中該絲狀真菌宿主細(xì)胞是曲霉屬細(xì)胞。
32.權(quán)利要求28的方法,其中該絲狀真菌宿主細(xì)胞是鐮孢霉屬細(xì)胞。
33.分離的啟動子序列,其含有選自下組的核酸序列SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它們的突變、雜合和串聯(lián)啟動子。
34.權(quán)利要求33的啟動子序列,其含有SEQ ID NO.1第1-3949位核苷酸或其子序列;或其突變、雜合或串聯(lián)啟動子的核酸序列。
35.權(quán)利要求34的分離啟動子序列,其含有SEQ ID NO.1第1-3949位核苷酸的核酸序列。
36.權(quán)利要求35的分離啟動子序列,其含有大腸桿菌NRRL B-30067中的質(zhì)粒pECO3所包含的核酸序列。
37.權(quán)利要求33的分離啟動子序列,其含有SEQ ID NO.2第1-938位核苷酸或其子序列;或其突變、雜合或串聯(lián)啟動子序列的核酸序列。
38.權(quán)利要求37的分離啟動子序列,其含有SEQ ID NO.2第1-938位核苷酸的核酸序列。
39.權(quán)利要求38的分離啟動子序列,其含有大腸桿菌NRRL B-30071中的質(zhì)粒pFAMG所包含的核酸序列。
40.權(quán)利要求33的分離啟動子序列,其含有SEQ ID NO.3第1-3060位核苷酸或其子序列;或其突變、雜合或串聯(lián)啟動子序列的核酸序列。
41.權(quán)利要求40的分離啟動子序列,其含有SEQ ID NO.3第1-3060位核苷酸的核酸序列。
42.權(quán)利要求41的分離啟動子序列,其含有大腸桿菌NRRL B-30075中的質(zhì)粒pQUINN所包含的核酸序列。
43.權(quán)利要求33-42之任意一項(xiàng)的分離啟動子序列,其具有SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸之序列的至少20%的啟動子活性。
44.與權(quán)利要求33-43之任意一項(xiàng)的啟動子序列具有相同啟動子活性的分離啟動子序列。
45.分離的啟動子序列,其含有在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的序列中具有至少一個突變的核酸序列或其子序列;其中該突變啟動子具有啟動子活性。
46.核酸結(jié)構(gòu),其含有與權(quán)利要求33-45之任意一項(xiàng)的啟動子可操作地連接的編碼多肽的核酸序列。
47.含有權(quán)利要求46的核酸結(jié)構(gòu)的重組表達(dá)載體。
48.含有權(quán)利要求46的核酸結(jié)構(gòu)的重組宿主細(xì)胞。
49.制備多肽的方法,包括(a)在有利于該多肽產(chǎn)生的條件下,培養(yǎng)其中已摻入了如下新轉(zhuǎn)錄單元的同源重組細(xì)胞,該新轉(zhuǎn)錄單元含有與編碼該多肽的內(nèi)源核酸序列第二外顯子可操作地連接的權(quán)利要求33-45之任意一項(xiàng)的啟動子、外顯子、和/或剪接供體位點(diǎn);和(b)回收該多肽。
50.獲得突變啟動子的方法,包括(a)在低嚴(yán)緊條件下使DNA與含有如下序列的核酸序列雜交(i)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3,(ii)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈;和(b)從該DNA中分離該突變啟動子。
51.獲得突變啟動子的方法,包括(a)將至少一個突變引入SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的啟動子中,其中該突變啟動子具有啟動子活性;和(b)分離該突變啟動子。
52.分離的核酸序列,其選自(a)編碼具有如下氨基酸序列的多肽的核酸序列,該氨基酸序列與SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸有至少65%的一致性;(b)與SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)在極低、低、中等、中高、高或極高嚴(yán)緊條件下與以下序列雜交的核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100個核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈;(d)編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的變體的核酸序列,其中所述變體包含一或多個氨基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位變體;和(f)(a)、(b)、(c)或(e)的子序列。
53.核酸結(jié)構(gòu),其含有與一或多個在適合表達(dá)宿主中指導(dǎo)所述多肽產(chǎn)生的控制序列可操作地連接的權(quán)利要求52的核酸序列。
54.含有權(quán)利要求53的核酸結(jié)構(gòu)、啟動子、和轉(zhuǎn)錄及翻譯終止信號的重組表達(dá)載體。
55.含有權(quán)利要求53的核酸結(jié)構(gòu)的重組宿主細(xì)胞。
56.由權(quán)利要求52的核酸序列編碼的多肽。
全文摘要
本發(fā)明涉及制備多肽的方法,包括(a)在有利于產(chǎn)生該多肽的培養(yǎng)基中培養(yǎng)真菌宿主細(xì)胞,其中該真菌宿主細(xì)胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ IDNO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯(lián)啟動子;和(b)從該培養(yǎng)基分離該多肽。本發(fā)明還涉及該分離的啟動子序列、以及含有與編碼多肽的核酸序列可操作地連接的該啟動子序列的結(jié)構(gòu)、載體和真菌宿主細(xì)胞。
文檔編號C12N15/80GK1940067SQ20061009992
公開日2007年4月4日 申請日期2000年3月22日 優(yōu)先權(quán)日1999年3月22日
發(fā)明者R·M·伯卡, M·W·雷伊, K·布朗, S·H·布朗 申請人:諾沃奇梅茲有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
平顶山市| 威远县| 钟祥市| 恩平市| 会泽县| 东平县| 阳泉市| 蓝田县| 巩留县| 旌德县| 丘北县| 读书| 长治市| 兰考县| 修文县| 洛川县| 宜良县| 犍为县| 翁源县| 枣庄市| 肇州县| 临漳县| 广汉市| 佛冈县| 淮安市| 太仆寺旗| 长乐市| 襄城县| 汉沽区| 富源县| 手游| 炎陵县| 涪陵区| 伊吾县| 阿克苏市| 邢台市| 灵山县| 孙吴县| 临西县| 周口市| 类乌齐县|