欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基因啟動子的制作方法

文檔序號:412387閱讀:815來源:國知局
專利名稱:基因啟動子的制作方法
技術(shù)領域
本發(fā)明涉及獲得用于基因表達的啟動子的方法以及新的基因啟動子,尤其是來自真菌的啟動子。
背景技術(shù)
啟動子區(qū)對驅(qū)動和調(diào)節(jié)基因表達而言是必需的。這些DNA序列的延伸通常發(fā)現(xiàn)在基因開放閱讀框架的上游。啟動子中的關(guān)鍵遺傳元件包含增強子位點、沉默子位點、上游活化子序列、轉(zhuǎn)錄因子結(jié)合位點和RNA聚合酶結(jié)合位點(例如,Lewin,B.,Genes V,牛津大學出版社,1994)。這些元件對指定生物體的外部環(huán)境作出應答從而根據(jù)生長條件調(diào)節(jié)基因表達。
強啟動子對于高效基因表達是必需的。迄今為止所描述的最好的絲狀真菌啟動子包含里氏木霉纖維二糖水解酶1(cbh1)啟動子(llmén,M.等人,1996,Mol.Gen.Genet.251,451-460)和Aspergillus niger var.awamori葡糖淀粉酶A啟動子(Ward,M等人,1990.Bio/Technology8435-440)。然而,這兩種啟動子可由合適的碳源(例如,分別為纖維素和淀粉)誘導并可由葡萄糖(即,由代謝物阻遏調(diào)節(jié))所抑制。迄今為止,還沒有關(guān)于在效力上可與cbh1和glaA相比的天然的構(gòu)成型或者對碳代謝物阻遏不敏感的啟動子的描述。
所描述的啟動子分離策略包含(i)利用啟動子探針載體,其中基因組DNA片段隨機地克隆在一報告基因的前面,所述報告基因只在克隆的片段具有啟動子活性時才表達(例如,Neve等人,1979.Nature277324-325);(ii)從基因文庫利用基于基因特異性探針(例如,Vanhanen,S.等人,1989.Curr.Genet.15181-186)或者從氨基酸順序推導出的核酸序列的雜交分離基因及其啟動子;(iii)用誘導型和非誘導型cDNA探針對基因文庫進行差異雜交(例如,Teeri等人,1983.Bio/Technology 1696-699)。
本發(fā)明運用稱作蛋白質(zhì)組顯示技術(shù)的新策略用于基因啟動子的分離。這不同于諸如上面列舉的基于核酸的策略。蛋白質(zhì)組分析一般涉及在樣品中根據(jù)它們的等電點和分子量分離蛋白(2-向凝膠電泳,2-DE)。然后對凝膠染色觀察蛋白斑點并可印跡到適當?shù)哪ど嫌糜谶M一步的處理。2-DE技術(shù)能夠在復雜混合物中分離數(shù)百種蛋白(O′Farrell,P.H.,等,1975.J.Biol.Chem.2504007-4021)并檢測在給定培養(yǎng)條件下(例如,根據(jù)碳源)生長的生物體內(nèi)高水平表達的蛋白。蛋白質(zhì)組顯示的蛋白斑點強度的不同反映它們的表達水平。因此,檢測到強表達的蛋白顯示啟動編碼具體蛋白基因的強啟動子的存在??梢郧邢聫姳磉_的蛋白斑點并通過質(zhì)譜進行分析(Verrils,N.M.,等,2000.Electrophoresis 213810-3822)。為了從尤其強表達的基因(蛋白)分離啟動子,獲得的氨基酸順序可用來設計染色體步移PCR的寡核苷酸引物(Morris,D.等人,1995.Appl.Environ.Microbiol.612262-2269)。蛋白鑒定包括將獲得的肽和/或氨基酸順序與例如萬維網(wǎng)上(WWW.)的有效數(shù)據(jù)庫進行比較。然而,強表達蛋白的鑒定對于分離啟動其表達的啟動子不是必需的。
hex1基因編碼真菌沃魯寧體的一六邊形(HEX1)蛋白并且對于絲狀真菌而言是特異性的(Tenney,K等人,2000.Fungal.Genet.Biol.31205-217)。通過2-向凝膠電泳,HEX1蛋白被鑒定為從里氏木霉培養(yǎng)物中制備的細胞壁提取物中的一種主要蛋白,所述里氏木霉培養(yǎng)物生長在纖維二糖-乳糖-大豆提取物培養(yǎng)基上或者以葡萄糖作為碳源(Lim等,2001.Proteomics 1899-910)。因此,基于蛋白質(zhì)組顯示的hex1基因啟動子的鑒定和分離提供了利用未必受到碳代謝物阻遏影響的啟動子用于啟動子分離和基因表達的新策略。
本發(fā)明的發(fā)明者目前已經(jīng)設計了獲得或檢測基因新啟動子的方法。
發(fā)明概述在第一方面,本發(fā)明提供了從生物體檢測或獲得基因啟動子的方法,所述方法包括(a)在期望的條件下獲得一種或者多種由生物體產(chǎn)生的蛋白;(b)獲得蛋白的氨基酸序列數(shù)據(jù);(c)基于獲得的蛋白氨基酸序列制備一種或者多種寡核苷酸;(d)用一種或者多種寡核苷酸處理生物體的基因組或染色體DNA以獲得編碼蛋白及其調(diào)節(jié)區(qū)的基因組或染色體DNA;以及(e)對獲得的基因組或染色體DNA測序以檢測或獲得編碼蛋白的基因的啟動子。
優(yōu)選地,生物體為諸如細菌、酵母、真菌或絲狀真菌的微生物。然而應該理解生物體可以為獲得自諸如包含人的動物以及植物的高等生物體的任意細胞類型。
優(yōu)選地通過在期望的條件下分離由生物體產(chǎn)生的蛋白進行步驟(a)從而提供蛋白質(zhì)組顯示。
當從例如微生物獲得啟動子時,需要在可以誘導一種或者多種蛋白表達的條件下培養(yǎng)生物體。這種誘導可以是諸如碳源的養(yǎng)分的供應或諸如加熱、pH、養(yǎng)分不足等的環(huán)境條件。培養(yǎng)后,由微生物產(chǎn)生的蛋白可以通過諸如雙向聚丙烯酰胺凝膠電泳(2-D PAGE)的任意合適的方法進行分離。可以分離目的蛋白并通過已知的測序方法從蛋白的肽片段獲得氨基酸序列數(shù)據(jù)。一旦已經(jīng)確定了肽信息,可以制備可與編碼蛋白的基因的互補DNA序列雜交的寡核苷酸探針。為了獲得編碼基因的DNA及其啟動子(調(diào)節(jié)區(qū)),用寡核苷酸利用例如基因組步移PCR處理來自生物體的基因組或染色體DNA。一旦獲得了編碼基因的DNA,可以進行DNA的測序以提供關(guān)于基因啟動子和終止子區(qū)的信息。
獲得新基因的標準方法就是使用cDNA作為遺傳物質(zhì)的來源。同樣通過本領域目前常用的標準方法使用cDNA,就不能獲得基因啟動子,因為cDNA不包含調(diào)節(jié)信息或序列。相反,如果通過本發(fā)明的方法使用基因組或染色體DNA可以獲得更多信息以及包含啟動子的有用序列。
第二方面,本發(fā)明提供了根據(jù)本發(fā)明的第一個方面的方法獲得的一分離的啟動子。
本發(fā)明的方法已經(jīng)用于獲得可以促進真菌細胞中轉(zhuǎn)錄的一新真菌啟動子(作為稱作hex1的基因的一部分)。因此,本發(fā)明的啟動子可用于表達真菌中的異源基因或其它核酸序列。
因此,本發(fā)明的第三方面提供了來自絲狀真菌的一分離的hex1啟動子。
優(yōu)選地,啟動子源于選自Ophiostoma、木霉、曲霉、青霉、Topylocladium、鐮刀菌、金孢霉菌、Magnaporthe、脈孢菌、麥角菌、小球殼菌、Collectotrichum、黑粉菌、Podospora以及毛霉的真菌種。
在第四方面,本發(fā)明提供了一分離的真菌啟動子,所述啟動子具有基本上如圖2所示的核酸序列(SEQ ID NO1),和/或優(yōu)選地在嚴格條件下與圖2的序列(SEQ ID NO1)雜交的序列。
應該認識到即使HEX1蛋白可能顯示出相當量的同源性,也根本不能保證啟動子區(qū)共有顯著的同源性。因此,HEX1蛋白的比對可用作從其它微生物來源獲得類似的或功能等效啟動子的起點。
在一優(yōu)選的方式中,分離的啟動子包括真菌hex1基因啟動子的DNA序列,其中DNA序列選自圖2(SEQ ID NO1)列出的序列或圖2(SEQ ID NO1)的部分序列,其足以控制目的基因的表達;或具有優(yōu)選地在嚴格條件下將與圖2序列(SEQ ID NO1)雜交并且其能夠控制目的基因表達的序列的核苷酸分子。
在一種方式中,在高度嚴格的雜交條件下核苷酸分子與圖2的序列(SEQ ID NO1)雜交。
優(yōu)選地,真菌啟動子序列可以啟動真菌細胞中異源基因的表達。來自里氏木霉的hex1基因的全序列顯示在圖3(SEQ ID NO2;SEQ IDNO3)中。
本發(fā)明還特征描述了一分離的核酸,所述具有在嚴格條件下與圖2(SEQ ID NO1)雜交或與圖2的序列(SEQ ID NO1)具有至少70%(至少80、90、95或99%)同一性的序列。圖2中顯示的啟動子序列(SEQ ID NO1)當可操作性的連接到開放閱讀框架時能夠啟動真菌細胞中的轉(zhuǎn)錄。圖2的啟動子序列(SEQ ID NO1)為如圖3(SEQ IDNO2;SEQ ID NO3)所示的hex1基因開放閱讀框架上游的啟動子部分。
第五方面,本發(fā)明提供了一載體或轉(zhuǎn)化的細胞,其包括一分離的核酸形成根據(jù)本發(fā)明的方法獲得的啟動子。載體包含核酸載體,諸如表達質(zhì)?;虿《据d體。
本發(fā)明的啟動子序列可以被導入多種表達載體中用于在包含真菌細胞的細胞中表達外源蛋白。這樣的外源蛋白包含水解酶諸如植酸酶、纖維素霉、木聚糖酶、β-葡聚糖酶、淀粉酶、脂肪酶和蛋白酶以及治療/藥用上重要的分子,諸如抗體、人生長因子、組織纖溶酶原激活物或任何其它具有商業(yè)價值的多肽。更具體地說,新啟動子序列和可以與其操作性連接的開放閱讀框架可以整合到基因組中產(chǎn)生表達上述列舉的酶和治療因子的轉(zhuǎn)基因細胞。將核酸轉(zhuǎn)入細胞的方法不管是用于瞬時或穩(wěn)定的表達都是分子生物學領域所公知的。
在第六方面,本發(fā)明提供了一重組DNA構(gòu)建體包括本發(fā)明的第二、第三或第四方面的可操作性連接到目的基因的啟動子。
優(yōu)選地,目的基因選自為了特定特征的合適來源。合適的來源可以為具有某些代謝或功能活性的目的微生物,所述代謝或功能活性可用于商業(yè)或有用的用途。
第七方面,本發(fā)明提供了包括本發(fā)明第六方面的構(gòu)建體的表達系統(tǒng)。
表達系統(tǒng)為本領域所公知并包含諸如微生物的細胞,所述微生物包含能夠在啟動子的控制下表達基因的構(gòu)建體。
第八方面,本發(fā)明提供了根據(jù)本發(fā)明啟動子在控制基因表達中的應用。
在整個說明書中,除非上下文需要否則術(shù)語“包括”,或諸如“包括”或“包括”的分詞或者動名詞形式的改變應該理解為暗示包含一所述的元件,整體或分步或元件組、整體或分步,然而并非排除任意其它元件、整體或分步或元件組、整體或分步。
已經(jīng)包括在本發(fā)明說明書中的文獻、作用、材料、裝置、物品等等只為本發(fā)明提供背景的目的。不能允許的是,任何或者所有這些物質(zhì)形成部分現(xiàn)有技術(shù)的基礎或者是與本發(fā)明有關(guān)領域中的常識,因為它在本申請的每一權(quán)利要求的優(yōu)先權(quán)日以前的澳大利亞存在。
為了更清楚的理解本發(fā)明,將參考下列附圖和實施例描述優(yōu)選的形式。


圖1顯示了采用hex1啟動子的基因表達盒。利用質(zhì)粒pUC19作為在大腸桿菌中復制的載體構(gòu)建盒中的DNA片段。A.具有連接或者融合到信號序列的目的基因的基本表達載體。B.利用熒光dsRed1-E5作為報告基因試驗hex1基因啟動子效力的表達載體。C.具有連接或者融合到轉(zhuǎn)化標記上的基因的表達載體。突出特征包含由P代表的hex1基因啟動子,分泌信號序列,SS,溶解蛋白的Kex2-類切割位點,RQ,選擇性標記基因,M(例如,熒光或抗生素),以及由T表示的hex1基因終止子。限制性內(nèi)切酶位點的位置顯示為X。
圖2顯示了根據(jù)本發(fā)明從里氏木霉分離的hex1啟動子的核苷酸序列。(SEQ ID NO1)圖3顯示了里氏木霉hex1基因序列的“公開”形式(GCG,WisconsinPackage Version 8.1)。粗體和畫線部分強調(diào)的是針對mRNA翻譯的核糖體結(jié)合位點重要的可能Kozak序列(Kozak,M.1987.Nucleic AcidsRes 158125-8148)。較短的內(nèi)含子序列顯示為小寫字體。兩個共有序列(code hop)引物(hex1fwd和hex1rev)的位置用箭頭表示。(SEQID NO2為DNA序列,SEQ ID NO3為氨基酸序列)。
圖4顯示了表示在hex1啟動子控制下異源基因表達的Northern印跡。Northern印跡用DsRed1-E5 DNA進行探測。A,非轉(zhuǎn)化體;T,包含里氏木霉hex1啟動子控制下的DsRed1-E5基因的轉(zhuǎn)化體。培養(yǎng)物在含有纖維二糖、乳糖和大豆水解物的培養(yǎng)基(CLS)中生長54小時。
圖5顯示了在不同培養(yǎng)基中hex1表達的Northern印跡。用hex1探測Northern印跡。A,非轉(zhuǎn)化體。T1和T24,包含在hex1啟動子控制下的DsRed1-E5基因的轉(zhuǎn)化體。在CLS或葡萄糖(GLU)培養(yǎng)基中培養(yǎng)物生長54小時。
實施本發(fā)明的方式定義根據(jù)在高度嚴格條件下能夠雜交或與本發(fā)明使用的核酸分子具有高度同源性的等價序列,“在高度嚴格條件下的雜交”可與本領域公知的術(shù)語“嚴格雜交條件”的含義一樣;例如參見Sambrook的“分子克隆實驗指南”第二版,CSH Press Cold Spring Harbor,1989;“核酸雜交(Nucleic Acid Hybridisation),A Practical Approach”,Hames和Higgins編輯,IRL Press,Oxford,1985;二者都在此處引入作為參考。根據(jù)可用于本發(fā)明應用中的核酸分子和多肽,核酸分子和多肽優(yōu)選與在這里公開或描述的序列和其在這里公開或描述的片段(包含以下描述的子序列)具有至少約84到85%或更大的同源性或同一性,諸如至少約85%或約86%或約87%或約88%或約89%的同源性或同一性,例如至少約90%的同源性或同一性或更大,諸如至少約91%,或約92%,或約93%,或約94%的同一性或同源性,更優(yōu)選地至少約95%到99%的同源或同一性或更大,諸如至少約95%的同源性或同一性或更大,至少約96%,或約97%,或約98%,或約99%,乃至約100%的同一性或同源性,或從約84到約100%或從約90到約99或約100%或從約95到約99或約100%的同一性或同源性。
可利用Myers和Miller的“比對”程序(“Optimal Alignments inLinear Space”CABIOS 4,11-17,1988,此處引入作為參考)確定核苷酸序列的同源性。另外地或其它地,例如根據(jù)核苷酸或氨基酸序列,術(shù)語“同源性”或“同一性”可顯示兩個序列之間同源性的定量測定。百分比序列同源性可計算為(N.sub.ref-N.sub.dif)*100/N.sub.ref,其中N.sub.dif為比對時兩個序列中非相同殘基的總數(shù)并且其中N.sub.ref為在序列之一殘基的數(shù)目。因此,例如DNA序列AGTCAGTC將與序列AATCAATC具有75%的序列相似性(N.sub.ref=8;N.sub.dif=2)。
另外或其它地,序列的“同源性”或“同一性”可指具有相同核苷酸或氨基酸的位置的數(shù)目除以較短的兩個序列中的核苷酸或氨基酸的數(shù)目,其中兩個序列的比對可以根據(jù)Wilbur和Lipman算法(Wilbur和Lipman,1983 PNAS USA 80726,此處引入作為參考)進行確定。例如,利用20個核苷酸的窗口尺寸,4個核苷酸的字碼長度,和4的缺口處罰,以及包含比對的序列數(shù)據(jù)的計算機輔助的分析和說明可利用市售程序(California)方便地進行。當RNA序列被認為是與DNA序列相似或具有一定程度的序列同一性或同源性時,DNA序列中的胸苷(T)被認為是相當于RNA序列中的尿嘧啶(U)。本發(fā)明范圍內(nèi)的RNA序列可來源于DNA序列,DNA序列中的胸苷(T)可以被認為相當于RNA序列中的尿嘧啶(U)。
另外或者其它地,氨基酸序列的相似性或同一性或同源性可以利用BlastP程序(Altschul等,Nucl.Acids Res.25,3389-3402,此處引入作為參考)進行確定。下列參考文獻(每個都在此處引入作為參考)還提供了用于比較兩種蛋白的氨基酸殘基的相對同一性或同源性的算法,另外或者其它地這些參考文獻中的教導可被用于確定百分比同源性或同一性Needleman S B以及Wunsch C D,“適用于尋找兩種蛋白的氨基酸序列中類似性的一般方法”J.Mol.Biol.48444-453(1970);Smith T F和Waterman M S,“生物序列的比較(Comparison of Bio-sequences)Advances in Applied Mathematics 2482-489(1981);Smith T,Waterman M S以及Sadler J R,“核酸序列功能域的統(tǒng)計鑒定,NucleicAcids Res,112205-2220(1983);Feng D F和Dolittle R F,“進化序列比對作為校準系統(tǒng)發(fā)生樹的先決條件(Progressive sequence alignmentas a prerequisite to correct phylogenetic trees)”J.of Mol.Evol.,25351-360(1987);Higgins D G和Sharp P M,″在微機上快速靈敏的多序列比對(Fast and sensitive multiple sequence alignment on a microcomputer,)″CABIOS,5151-153(1989);Thompson J D,Higgins D G和Gibson T J,″ClusterW通過序列權(quán)重、位點特異性缺口罰分以及重量矩陣選擇提高進化多序列比對所靈敏度(ClusterWimproving the sensitivity ofprogressive multiple sequence alignment through sequence weighing,positions-specific gap penalties and weight matrix choice,)Nucleic AcidRes.,224673-480(1994);以及Devereux J,Haeberlie P和Smithies O,“A comprehensive set of sequence analysis program for the VAX,,”Nucl.Acids Res.,12387-395(1984)。
公開的核酸序列或其部分或片段,包括至少約12個核苷酸長度,例如至少約15,約18,約21,約24或約27個核苷酸長度,諸如至少約30,約33,約36,約39或約42個核苷酸長度的子序列,例如,一至少約12個核苷酸長度諸如約12到約30,約12到約50或約12到約60,或約12到約75或約12到約100或者更多氨基酸長度的核酸分子可作為探針或引物用于雜交。本發(fā)明進一步包括微生物,包含和/或表達這種核酸分子的載體或質(zhì)粒。同樣地,一核酸分子可編碼一抗原決定簇或一抗原決定簇區(qū)或多肽,其功能等效于由序列表達的多肽,這種核酸分子可在體外或者體內(nèi)表達,或用于擴增或檢測限定的基因或者其同源物以及這種載體在新組合物中的應用。
當然,用于雜交的核酸可通過結(jié)合或連接放射性的或其它可檢測的標記方便地進行標記。這種標記為本領域技術(shù)人員所公知。所述核酸分子的標記可受傳統(tǒng)方法的影響。在啟動子控制下的啟動子或基因的存在或表達可通過利用特異性雜交于任一相應核酸序列的引物對以及通過根據(jù)標準方法實施聚合酶鏈式反應(PCR)進行監(jiān)控。探針或引物的特異性雜交優(yōu)選地發(fā)生在嚴格雜交條件下。探針或引物可為限定的核酸分子中特異性的至少8個,優(yōu)選地至少10,更優(yōu)選地至少12,13,14,或15,諸如至少20,至少23或25,例如至少27或30個核苷酸的一段序列。至于PCR或雜交引物或探針及其最適長度參考Kajimura等的GATA 7(4)71-79(1990),此處引入作為參考。
而且,在本發(fā)明啟動子控制下的核酸分子的表達可用于產(chǎn)生抗體用來檢測樣品中或樣本中蛋白(或其抗原)的存在或者缺失;或者,表達的多肽可用于檢測樣品或樣本中蛋白的抗體的存在或者缺失。因此,核酸分子及其表達產(chǎn)物具有診斷用途。
“多肽”是指任意鏈長的氨基酸,不管其長度或者翻譯后的修飾(糖基化作用或者磷酸化作用)。
“基本上同一的”是指顯示出與參考氨基酸或者核酸序列具有至少50%,優(yōu)選地85%,更優(yōu)選地90%以及最優(yōu)選地95%同源性的多肽或者核酸。對于多肽而言,比較序列的長度通常為至少16個氨基酸,優(yōu)選地至少20個氨基酸,更優(yōu)選地至少25個氨基酸,最優(yōu)選地35個氨基酸。對于核酸而言,比較序列的長度通常為至少50個核苷酸,優(yōu)選地至少60個核苷酸,更優(yōu)選地至少75個核苷酸以及最優(yōu)選地110個核苷酸。
通常利用序列分析軟件(Sequence Analysis Software Package of theGenetics Computer Group,University of Wisconsin BiotechnologyCenter,1710 University Avenue,Madison,Wis.53705)測定序列同一性。這種軟件通過將同源性的程度分配到各種置換、刪除、取代及其它修改中對比類似序列。保守取代一般包含在下列基團內(nèi)的取代甘氨酸、丙氨酸;纈氨酸、異亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天門冬酰胺、谷氨酰胺;絲氨酸、蘇氨酸;賴氨酸、精氨酸;以及苯丙氨酸、酪氨酸。
“基本上純的多肽”是指已經(jīng)與天然伴生組分分離的任意多肽。一般地,當其按重量計算至少60%不含蛋白以及與其天然連接的天然存在有機分子時,多肽基本上就是純的。優(yōu)選地,制備物按重量計算至少為75%,更優(yōu)選地至少為90%,以及最優(yōu)選地至少為99%?;旧霞兊亩嚯目梢岳缤ㄟ^從天然來源(諸如細胞)提?。煌ㄟ^表達編碼多肽的重組核酸;或者通過化學合成蛋白獲得。純度可以通過任意諸如描述在柱層析、聚丙烯酰胺凝膠電泳或者通過HPLC分析中合適的方法進行測定。
當?shù)鞍追蛛x自天然狀態(tài)伴生的那些雜質(zhì)時蛋白基本上不含天伴生組分。因此,化學合成或者在不同于天然來源細胞的細胞系統(tǒng)中產(chǎn)生的蛋白將基本上不含其天然伴生組分。因此,基本純的多肽包含那些來源于真核生物但在大腸桿菌或者其它原核生物中合成的多肽。
“基本上純的DNA”是指在本發(fā)明的DNA所來源的生物體天然存在基因組中不含側(cè)翼基因的DNA。因此術(shù)語包含例如,整合到載體中;整合到自主復制質(zhì)?;蛘卟《局?;或者整合到原核生物或者真核生物的基因組DNA中;或者作為獨立于其它序列的分離分子(由PCR或者限制性核酸內(nèi)切酶酶切產(chǎn)生的cDNA或者基因組或者cDNA片段)的重組DNA。它還包含作為編碼其它多肽序列的部分雜交基因的重組DNA。
“轉(zhuǎn)化的細胞”是指通過重組DNA技術(shù)向其中(或者向其祖細胞)導入在本發(fā)明的啟動子控制下編碼一給定多肽的DNA分子的細胞。
“表達定位”是指DNA分子定位在一限定啟動子的DNA序列的相鄰位置,所述啟動子指導序列的轉(zhuǎn)錄和翻譯(即,促進多肽,一重組蛋白質(zhì)或者一RNA分子的產(chǎn)生)。
“報告基因”是指其表達可被分析的基因;這種基因包括但不限于β-葡糖醛酸酶(GUS),熒光素酶,氯霉素乙酰轉(zhuǎn)移酶(CAT)以及β-半乳糖苷酶。
“啟動子”是指足以指導轉(zhuǎn)錄的最小序列。本發(fā)明還包括足以提供細胞類型特異性,組織特異性可控制的或者可由外部信號或者因子誘導的啟動子依賴的基因表達的那些啟動子元件;這種元件可能位于天然基因的5′或者3′區(qū)。
“可操作性的連接”是指基因以及調(diào)節(jié)序列以使當合適的分子(轉(zhuǎn)錄激活蛋白)結(jié)合到調(diào)節(jié)序列時基因表達的方式連接。
“植物細胞”是指任意由半透膜限定并且包含質(zhì)粒的自體繁殖細胞。如果期望進一步的繁殖這種細胞還需要細胞壁。如果沒有限制,這里應用的植物細胞包含藻類、藍細菌、種子懸浮培養(yǎng)物、胚、分生組織區(qū)、愈傷組織、葉子、根、枝條、配子體、孢子體、花粉以及小孢子。
“轉(zhuǎn)基因”是指通過操作插入細胞內(nèi)變成生物體基因組一部分的任意DNA的片斷,所述生物體從所述細胞發(fā)育而來。這種轉(zhuǎn)基因可以包含部分或者完全與轉(zhuǎn)基因生物體異源(即,外來)的基因,或者可以表示與生物體的內(nèi)源基因同源的基因。
“轉(zhuǎn)基因的”是指包括通過操作插入細胞內(nèi)變成生物體基因組一部分的DNA序列的任意細胞,所述生物體從所述細胞發(fā)育而來。本發(fā)明使用的轉(zhuǎn)基因生物一般為轉(zhuǎn)基因真菌,并且DNA(轉(zhuǎn)基因)通過操作插入核內(nèi)或者質(zhì)粒基因組內(nèi)。
“保守區(qū)”是指在兩個或多個hex1家族成員之間表現(xiàn)出至少30%、優(yōu)選50%、以及最優(yōu)選70%氨基酸序列同一性的六個或者以上臨近氨基酸的序列。
“可檢測地標記”是指標記以及鑒定分子、寡核苷酸探針或者引物、基因或者其片段或者cDNA分子存在的任意手段。可檢測地標記分子的方法是本領域技術(shù)人員所公知的并且包括但不限于放射性標記(用諸如32P或者35S的同位素)以及非放射性標記(諸如化學發(fā)光標記或者熒光標記)。
“biolistic轉(zhuǎn)化”是指利用速度驅(qū)動的微粒諸如鎢或者金顆粒將外源分子導入細胞的任意方法。這種速度-驅(qū)動的方法來源于壓力脈沖包含但不限于,氦驅(qū)動、氣動以及火藥驅(qū)動技術(shù)。Biolistic轉(zhuǎn)化可應用于多種細胞類型以及完整組織的轉(zhuǎn)化或者轉(zhuǎn)染,所述細胞和組織包含但不限于胞內(nèi)細胞器(葉綠體以及線粒體)、細菌、酵母、真菌、藻類、花粉、動物組織、植物組織(葉子、幼苗、胚胎、表皮、花、分生組織以及根)、花粉以及培養(yǎng)的細胞。
“純化的抗體”是指抗體按重量計算至少60%不含天然與其伴生的蛋白以及天然存在的有機分子。優(yōu)選地,制備物按重量計算至少為75%,更優(yōu)選地至少90%,以及最優(yōu)選地至少99%為抗體。純化的抗體可以通過例如采用重組產(chǎn)生蛋白或者保守基序肽以及標準技術(shù)的親和層析獲得。
“特異性結(jié)合”是指抗體識別并結(jié)合一蛋白但是其基本上不識別并結(jié)合天然包含rps蛋白的樣品中,生物樣品中的其它分子。
材料和方法從里氏木霉分離hex1啟動子通過2-向凝膠電泳(Lim等,2001,Proteomics 1899-910),HEX1蛋白被鑒定為從里氏木霉培養(yǎng)物中制備的細胞壁提取物中的一種強表達蛋白,所述里氏木霉培養(yǎng)物生長在纖維二糖-乳糖-大豆提取物培養(yǎng)基上或者以葡萄糖作為碳源。利用染色體步移PCR法(Morris等,1985.Appl.Environ.Microbiol.612262-2269)從里氏木霉的基因組DNA分離真菌hex1基因啟動子。最初,兩個共有序列(code hop)引物(hex1fwd.pr5′-ACA TCT TCC AAA ATG GGN TAY TAY GA-3’和hex1rev.pr5′-ACG GGG CCG CAC ATN GTY TGN AC-3′)基于翻譯來自HEX1肽序列的比對的保守氨基酸序列的核苷酸進行設計(Lim等人,2001.Proteomics 1899-910;Jedd和Chua,2000.Nature CellBiology 2226-231)。采用下列條件進行PCR擴增[1x] 94℃,10分鐘[5x]94℃,30s;40℃,30s ;72℃,30s[35x]94℃,30s;50℃,30s;72℃,30s。一個單位地熱激活Amplitaq Gold聚合酶(Perkin和Elmer,USA)用于50μl的PCR反應物中,所述PCR反應物包含下列成分的兩種引物各100ng,3mM MgCl2,12.5mM dNTP’s和約10ng的靶真菌基因組DNA。
利用如上所述的兩種共有序列引物獲得約600bp的PCR產(chǎn)物,并利用澳大利亞Macquarie大學的ABI 377測序設備進行測序。根據(jù)600bp的hex1序列設計新的5′-和3′-染色體步移引物并用于PCR反應獲得重疊的hex1基因片段。設計其它引物并用于獲得上游和下游DNA片段直到擴增并測序所有的hex1基因編碼區(qū)以及充分的啟動子和終止子區(qū)的DNA片段。如Morris等,1985 Appl.Appl.Environ.Microbiol.612262-2269所述首先制備里氏木霉的基因組DNA連接體文庫,在利用具有合適接頭引物的正向或者反向染色體步移引物的組合進行基因組步移PCR反應之前進行。采用的PCR條件如下[1X]94℃,10分鐘[40X]94℃,30s;60-65℃,30s;72℃,4-5分鐘。如上所述的PCR成分也用于染色體步移PCR反應中。
HEX1蛋白序列在絲狀真菌中高度保守,能夠用來利用類似于用于木霉描述的方法從其它絲狀真菌(諸如這里列舉的)分離hex1基因啟動子。
從這個操作實施例應該認識到其它基因的啟動子可以利用本發(fā)明的方法進行檢測。利用設計用于獲得里氏木霉hex1基因的引物,本發(fā)明的發(fā)明者已經(jīng)確定來自Ophiostoma floccosum的hex1基因具有約747bp的共有序列DNA區(qū)。獲得了O.floccosum的基因組DNA,就有可能從這種生物體分離Hex1啟動子。
構(gòu)建基因表達和產(chǎn)物分泌的質(zhì)粒可構(gòu)建質(zhì)粒從而在hex1啟動子控制下表達任意所選擇的基因或者核酸。為了在分離的hex1啟動子控制下克隆特定目的基因,應該添加多克隆位點。載體也包含在表達宿主中起作用的適當?shù)倪x擇標記。還包括足夠的hex1側(cè)翼DNA片段,如果合適的話可以促進其整合在同源基因組位點??山Y(jié)合特異性限制性位點以便在分離線性表示DNA片段并轉(zhuǎn)化到真菌宿主之前首先進行pUC19載體部分的切除。還將包含用于蛋白分泌的合適信號。分泌信號可能與目標基因產(chǎn)物同源或者異源。這種信號可以獲得自例如編碼Ophiostoma蛋白酶和脂肪酶以及里氏木霉cbh1或者獲得自任意高水平分泌或者產(chǎn)生真菌蛋白的基因。表達盒可具有通過信號肽酶正確裂解信號肽從而產(chǎn)生分泌在培養(yǎng)基以外的目標蛋白的序列。轉(zhuǎn)化后,篩選產(chǎn)生的轉(zhuǎn)化體分離產(chǎn)生最高產(chǎn)率目標基因產(chǎn)物的轉(zhuǎn)化體并進行詳細分析。應該知道這種篩選是本領域技術(shù)人員公知的例行測試。
在hex1啟動子的控制下表達異源DsRed1-E5蛋白將克隆的hex1啟動子連接到編碼DsRed1-E5(Clontech)的基因上。這就提供了在hex1啟動子控制下表達的異源蛋白的例子,并可應用于例如在不同的生長培養(yǎng)基(例如,葡萄糖、乳糖、纖維素)中進一步試驗hex1啟動子的功能。DsRed1-E5為一紅色熒光蛋白DsRed1的突變體(Terskikh等,2000.Science 2901585-1588),其熒光強度增強并在其成熟后導致蛋白的熒光從綠色變?yōu)榧t色。轉(zhuǎn)化體顯示出的熒光的水平或強度將提供DsRed1-E5蛋白分泌量的良好顯示。在SDS-PAGE凝膠上進一步分析培養(yǎng)物上清液。通過利用DsRed1-E5作為報告蛋白也可以使在不同啟動子之間進行比較成為可能。最終,希望表達在宿主中的目標基因可以如圖1所示表達為與DsRed1-E5的融合蛋白。
圖1顯示了采用hex1啟動子的基因表達盒。利用質(zhì)粒pUC19作為在大腸桿菌中復制的載體構(gòu)建盒中的DNA片段。A.具有連接或者融合到信號順序上的目的基因的基本表達載體。B.利用熒光dsRed1-E5作為報告基因試驗hex1基因啟動子效力的表達載體。C.具有連接或者融合到轉(zhuǎn)化標記上的目的基因的表達載體。強調(diào)的特征包含由P代表的hex1基因啟動子,分泌信號序列,SS,蛋白水解的Kex2-類切割位點,RQ,選擇性標記基因,M(例如,熒光或抗生素),以及由T表示的hex1基因終止子。限制酶位點的位置顯示為X。
hex1基因及其啟動子的特征鑒定利用染色體步移PCR從里氏木霉分離具有5’和3’側(cè)翼區(qū)的hex1基因序列顯示在圖3中。在全部六種可能開放閱讀框架中4376bp核苷酸序列的氨基酸翻譯顯示對應于2479位點的HEX1起始甲硫氨酸(ATG)并終止于3262位點處終止密碼子(TAA)的784bp的開放閱讀框架。一短的內(nèi)含子序列存在于2503和2612位點之間很好的對應于預測的共有拼接序列(例如,Ballance,D.J.,1986.Yeast 2229-236)。啟動子區(qū)的詳細分析顯示ATG的上游沒有明顯的‘TATA’類盒。同樣,沒有檢測到類似原核的核糖體結(jié)合位點序列(5’-AGGAGGACAGCUAUG-3)。然而,緊接著上游并包含起始ATG的可能的核醣體結(jié)合位點符合真核生物起始位點的共有序列,也稱作Kozak序列(5′-A/GCCACCAUGG-3′)。
圖3顯示里氏木霉hex1基因序列的“公開”形式(GCG,WisconsinPackage Version 8.1)。粗體和畫線部分強調(diào)的是對于指導mRNA翻譯的核糖體結(jié)合位點重要的可能Kozak序列(Kozak,M.1987.NucleicAcids Res 158125-8148)。較短的內(nèi)含子序列顯示為小寫字體。兩個共有序列(code hop)引物(hex1fwd和hex1rev)的位置用箭頭表示。
hex1基因終止子區(qū)(3263到4376)的分析顯示幾個通過形成回環(huán)、中止RNA聚合酶II進一步轉(zhuǎn)錄促進轉(zhuǎn)錄終止的理想的反向重復(回文序列)序列(例如,Lewin,B.,Genes V,牛津大學出版社,1994)。一個實例為序列-CCCCATG-(位于3368到3374)具有在3726到3720位點處發(fā)現(xiàn)的-GGGGTAC-的完全回文序列(圖3)。
已經(jīng)進行了來自很多生物體的HEX1肽序列的比對,顯示在它們之間的很多保守的氨基酸。蛋白水平的同源性使通過染色體步移PCR從很多絲狀真菌分離hex1啟動子成為可能。
詳細的肽分析顯示來自里氏木霉的HEX1具有225氨基酸的長度,具有期望的25207分子量以及7.09的等電點。在來自里氏木霉的HEX1和其它提交給基因文庫的其它HEX1之間發(fā)現(xiàn)高水平的氨基酸同源性。
圖2顯示了從里氏木霉分離的HEX1蛋白啟動子的核苷酸序列。
從Ophiostoma floccosum分離hex1基因共有序列DNA片段在PCR擴增反應中利用Hot Star Tag DNA聚合酶(QIAGEN,德國)利用兩個共有序列(code hop)引物(hex1fwd.pr5’-ACA TCT TCCAAA ATG GGN TAY TAY GA-3’以及hex1rev.pr5’-ACG GGG CCGCAC ATN GTY TGN AC-3’)從Ophiostoma floccosum(J3301菌株)擴增747bp長的DNA片段。采用的PCR條件為[1x]95℃,15分鐘[5x]95℃,30s;40℃,30s;72℃,30s[35x]95℃,30s;50℃,30s;72℃,30s。50μl的PCR反應物包含0.25單位的聚合酶以及100ng的每一引物,1.5mM的MgCl2,12.5mM的dNTPs以及約10ng的靶O.floccosum基因組DNA。用凝膠(QIAGEN,Germany)純化747bp的DNA片段并利用澳大利亞Macquarie大學的ABI 377測序設備進行測序。
總RNA的分離以及mRNA的Northern分析Trizol方法(Invitrogen,USA)用來從生長在基本培養(yǎng)基(Gene.61155-164)的培養(yǎng)物取出的菌絲體提取總RNA,所述培養(yǎng)基添加了2%的葡萄糖以及1%的纖維二糖,1%的乳糖以及3%的大豆水解產(chǎn)物作為碳源。用乙二醛以及二甲亞砜使總RNA變性并如Sambrook等,1989.分子克隆實驗指南,第二版Cold Spring Harbor,Laboratories Press,NY描述的進行電泳。電泳后,利用Biorad真空印跡裝置(BioRad,USA)根據(jù)廠商的說明書將RNA轉(zhuǎn)移到Hybond陽電荷膜(Roche,德國)上。
通過利用PCR DIG標記混合物(Roche,德國)的PCR產(chǎn)生DNA雜交探針。擴增240bp DsRed1-E5 DNA探針的引物為dsredprobe.fwdpr5’-CCA CCG AGC GCC TGT ACC-3’以及dsredprobe.revpr5’-CTACAG GAA CAG GTG GTG-3’。用引物hexprobe2.fwdpr5’-CCT CAAGCA CGG CGT CGC C-3’和hexprobe2.revpr5’-CCT TCA TCT CAACAG CGA GC-3’產(chǎn)生615bp的hex1 DNA探針。PCR的條件如下[1x]94℃,10分鐘[35x]94℃,30s;50℃ 30s;72℃ 30s[1x]72℃,5分鐘。1單位熱激活的Amplitaq Gold聚合酶(Perkin和Elmer,USA)用于包含下列組分的50μl PCR反應物中~10ng的靶DNA,100ng的每種引物,3mM的MgCl2,1x DIG標記的dNTP’s。根據(jù)廠商提供的說明書利用核酸的DIG熒光檢測試劑盒(Roche,德國)檢測基因特異性mRNAs。在55℃的溫度下用兩種基因DNA探針進行過夜雜交檢測DsRed1-E5的信使RNA并在60℃檢測hex1。
總結(jié)總體來說,目前缺少可用于表達目標同源以及異源基因產(chǎn)物的高效真菌基因啟動子。用于重組體表達的基因啟動子大致可以分成兩類,誘導型以及組成型的。在最強的誘導型啟動子中,由碳代謝物阻遏調(diào)節(jié)的為Aspergillus niger var.awamori葡糖淀粉酶A啟動子(glaA)(Ward,M.等人,1990.Bio/Technology 8435-440)和里氏木霉纖維二糖水解酶1(cbh1)啟動子(Ilmén,M.等人,1996,Mol.Gen.Genet.251,451-460)。貫穿真菌種采用的組成型啟動子為A.nidulans甘油醛-3-磷酸脫氫酶gpdA(Punt等,1991.J Biotechnol 1719-34)。迄今為止,還沒有關(guān)于在效力上可與cbh1和glaA相比的天然構(gòu)成型或者對碳代謝物阻遏不敏感的啟動子的描述。
本發(fā)明的發(fā)明者已經(jīng)顯示2-D蛋白質(zhì)組顯示可用于鑒定諸如里氏木霉hex1啟動子的啟動子,所述啟動子在諸如調(diào)解代謝物阻遏的葡萄糖培養(yǎng)基上的特定環(huán)境下具有很強的功能。hex1基因啟動子也在促進cbh1(參見顯示在葡萄糖以及CLS上hex1表達的圖4以及圖5)誘導的條件下發(fā)揮功能。正如hex1啟動子在異源基因表達的應用中所述,本發(fā)明的發(fā)明者已經(jīng)證明來自??腄sRed-51基因在hex1啟動子控制下的表達(參見圖5)??傊?,hex1啟動子提供了用于基因表達的多種選擇并且促進了真菌表達系統(tǒng)的適應性。根據(jù)本發(fā)明用于啟動子分離的2-D策略可被用于任意的真菌(或者任何其它生物體)以及適合于產(chǎn)生特定目標基因產(chǎn)物的任意培養(yǎng)條件。
本領域技術(shù)人員應該認識到只要不背離如上廣泛描述的本發(fā)明的精神或者范圍,如具體實施方案所述可以對本發(fā)明進行多種改變和/或修改。因此本發(fā)明的實施方案在各個方面被認為是說明性而非限制性的。
序列表<110>麥考里大學(Macquarie University)<120>基因啟動子(Gene Promoters)<130>SCT042990-47<160>3<170>PatentIn version 3.1<210>1<211>2481<212>DNA<213>里氏木霉(Trichoderma reesei)<400>1gctaagactg catgtgcatc acgaaaagtg ggcgcttgat agtcctcctc cagccggcat 60tggcgaagca ggatagacga tggacaagat gcagcatcag ctcggacgga gccctccctc120cctgatgata agccaaaaca ctcttccggt ggcgccatgc aagtacggcg catgttgctc180gcagagccaa gtgcagtacc agcagagctg gatcattacc ctacgacttg gaagctgctc240gattggcacg gcttgacatg gtcccaaccc ctcaggctgg atgtatttgt gcctcgcacg300ctcatcagcg ccctgtccca atggcaatga gtctagattt ggcagcagcg atgtattatc360gaacggccag gctcactagg ccaggaacca gtcccgccac agactaccga ctgagagcga420gaaatagaga gaggggagaa aggccacagt tgttattacc catggaaatg gctcgtagct480gaccacaaca atgatgagga gactgatgat tacgatgtac agtacatacg tattaccact540gccacgagta catacgcacg gggtattaca gctgctgtac caccaggtac ggtcgtgctc600gacgctcatt accggtttga tactactggc actagctgca gaggagccat gaacatcaat660
cgcccagcct gactggtcaa tcaacggccg attcaggggg gacgcaaggg aagcagggaa 720gcaaggaggc tggggagctc ttggtcgccc tttggggtcc catccgctta ccgctgggtt 780gcagcatcat gtccgaggag tccactggcg actggagacc cgagtacgcc tgagacgcag 840cctcgagaga ccagtggccg agacgcctgc tgaggccgct gagcttgcag gggagttgga 900tgaggttggc tgagtgtggg gacgatggcg gagacgagag gccaggatac gacagcacta 960ggccggttgt gacgagaata aacaacaaca tggcgagtcc cgggggcagg tcgacatgga1020gggccgatag gcttaccctc cttggcgagg caacacagcg agcacgccta ggaccgccag1080cccggccccc gacctcaaaa gcccatcgag cgtcgtctgc ttccgatctg gttttcctct1140cctccagtta tcacagtctc cccgccagaa acaaaggaac aaaagaaaga aaagactctc1200agaggtatcc aatccctctc tcttttctct ctctcttcga cttttgtttc aggaacaaaa1260gcttgaggat ccttcttgtc ttcctttcgt gatcttacgg aaggttgtat gagaagattc1320tctcgcgcca gcgcaagccg tcaacctgga ctttgaagcc cgagttcccg tgccctttag1380tatcttcccg tccacttaca aggacaacga agcagcacgc cctcagaccc aaatcagcgt1440tcacgaggag gttcaactca ccctccctca acacaagcca gccggacggg agggtcaaca1500ctcttctttc ccgcaacacg ccgactcagc tcctcctcgc ggcgaacacc gctttgaaga1560agaggtccgt atcacgcgtg aggaagaacg tcaccgccgt cccggttccc gccagtctga1620acgcttcgtg aaggaagagt tcaagtaagt tgatatttca tttttccctg ctattcatat1680tgtctcctgg ctgtggctcc cgcctctcgt ctcctcgcca gaccgctctc accgagtgag1740ggcagctggg ggaaaagggg ggagaaaggg atggccaaag gggtgaggag agacgggagg1800gagagctggg gaggggtgat gagaacgcac gcagcaatta ccggcgtggc tggcgaaagc1860ggtgctgaaa ttacccttcg tattgccctt cttcccacac agctcttttg ccgcggcttc1920tagaacgcgt caattgatag tggggagggc aagcctgggc acggggaggg cggcggagct1980
cactatgggg agctgacagc cggggtggga gttcagctag gattcccagc catgccaatt 2040tatcccggct cagggggtcc ggggggccca ccaatgttgg cccagagacc aaggaagctc 2100acgcacaggc acaaaaggga atctctccag ctaacctcga gtacttttag atccatccca 2160cctcctcctc gcgactacac tgagactcaa gtccaagtcg acacttctcg ccgctacacc 2220aaccccattg acgctgctga gcgtgagtat cgggaacgta tccgtcctca ccacccagag 2280agctccaccg gcctcgaact agttgttcgc cgtcctcgtc actccgacaa gtctcaccac 2340caccaccacc acaagtcctc cgacttcacc gttgtcgacg agcacacttc tgttgcccgt 2400cccaagttcc gtgaggagat caagatcacc gaggaaatcc gcgagtctac tccgcaagtc 2460cccgaacaat ccgccaagat g2481<210>2<211>4376<212>DNA<213>里氏木霉(Trichoderma reesi)<400>2gctaagactg catgtgcatc acgaaaagtg ggcgcttgat agtcctcctc cagccggcat 60tggcgaagca ggatagacga tggacaagat gcagcatcag ctcggacgga gccctccctc120cctgatgata agccaaaaca ctcttccggt ggcgccatgc aagtacggcg catgttgctc180gcagagccaa gtgcagtacc agcagagctg gatcattacc ctacgacttg gaagctgctc240gattggcacg gcttgacatg gtcccaaccc ctcaggctgg atgtatttgt gcctcgcacg300ctcatcagcg ccctgtccca atggcaatga gtctagattt ggcagcagcg atgtattatc360gaacggccag gctcactagg ccaggaacca gtcccgccac agactaccga ctgagagcga420gaaatagaga gaggggagaa aggccacagt tgttattacc catggaaatg gctcgtagct480
gaccacaaca atgatgagga gactgatgat tacgatgtac agtacatacg tattaccact 540gccacgagta catacgcacg gggtattaca gctgctgtac caccaggtac ggtcgtgctc 600gacgctcatt accggtttga tactactggc actagctgca gaggagccat gaacatcaat 660cgcccagcct gactggtcaa tcaacggccg attcaggggg gacgcaaggg aagcagggaa 720gcaaggaggc tggggagctc ttggtcgccc tttggggtcc catccgctta ccgctgggtt 780gcagcatcat gtccgaggag tccactggcg actggagacc cgagtacgcc tgagacgcag 840cctcgagaga ccagtggccg agacgcctgc tgaggccgct gagcrtgcag gggagttgga 900tgaggttggc tgagtgtggg gacgatggcg gagacgagag gccaggatac gacagcacta 960ggccggttgt gacgagaata aacaacaaca tggcgagtcc cgggggcagg tcgacatgga1020gggccgatag gcttaccctc cttggcgagg caacacagcg agcacgccta ggaccgccag1080cccggccccc gacctcaaaa gcccatcgag cgtcgtctgc ttccgatctg gttttcctct1140cctccagtta tcacagtctc cccgccagaa acaaaggaac aaaagaaaga aaagactctc1200agaggtatcc aatccctctc tcttttctct ctctcttcga cttttgtttc aggaacaaaa1260gcttgaggat ccttcttgtc ttcctttcgt gatcttacgg aaggttgtat gagaagattc1320tctcgcgcca gcgcaagccg tcaacctgga ctttgaagcc cgagttcccg tgccctttag1380tatcttcccg tccacttaca aggacaacga agcagcacgc cctcagaccc aaatcagcgt1440tcacgaggag gttcaactca ccctccctca acacaagcca gccggacggg agggtcaaca1500ctcttctttc ccgcaacacg ccgactcagc tcctcctcgc ggcgaacacc gctttgaaga1560agaggtccgt atcacgcgtg aggaagaacg tcaccgccgt cccggttccc gccagtctga1620acgcttcgtg aaggaagagt tcaagtaagt tgatatttca tttttccctg ctattcatat1680tgtctcctgg ctgtggctcc cgcctctcgt ctcctcgcca gaccgctctc accgagtgag1740ggcagctggg ggaaaagggg ggagaaaggg atggccaaag gggtgaggag agacgggagg1800
gagagctggg gaggggtgat gagaacgcac gcagcaatta ccggcgtggc tggcgaaagc1860ggtgctgaaa ttacccttcg tattgccctt cttcccacac agctcttttg ccgcggcttc1920tagaacgcgt caattgatag tggggagggc aagcctgggc acggggaggg cggcggagct1980cactatgggg agctgacagc cggggtggga gttcagctag gattcccagc catgccaatt2040tatcccggct cagggggtcc ggggggccca ccaatgttgg cccagagacc aaggaagctc2100acgcacaggc acaaaaggga atctctccag ctaacctcga gtacttttag atccatccca2160cctcctcctc gcgactacac tgagactcaa gtccaagtcg acacttctcg ccgctacacc2220aaccccattg acgctgctga gcgtgagtat cgggaacgta tccgtcctca ccacccagag2280agctccaccg gcctcgaact agttgttcgc cgtcctcgtc actccgacaa gtctcaccac2340caccaccacc acaagtcctc cgacttcacc gttgtcgacg agcacacttc tgttgcccgt2400cccaagttcc gtgaggagat caagatcacc gaggaaatcc gcgagtctac tccgcaagtc2460cccgaacaat ccgccaagat gggttactac gacgacgagg gtaagctata ctaacgttct2520tttgtctctc tccctcccgc tcttctcctc cattccctcc ctgtctggcc agacgcgtgc2580aagcatacgc taacgcgtgt cgccggcagg ctcttaccac tccctcaagc acggcgtcgc2640caagacgatc gacaagctgc tccctcatca ccaccaccat caccaccaca gtgatcacca2700ccaccacagt gaccatcatg accataataa cactacgatc acagagcacg ttgaagttga2760tgttgtccgc cacgatgcta atcactcgcg acgcgcagct cccgccactg agtcgcagcc2820tcagactgtg tccatcccct gccaccacat ccgcctgggt gacttcctga tgctccaggg2880ccgaccatgc caggtcatcc gcatctcgac ctcgtccgcc actggccagt accgctacct2940tggtgttgac ctcttcacca agcagctgca cgaggagtcc tccttcatct ccaaccctgc3000ccccagcgtt gttgtccaga ccatgctcgg ccccgtcttc aagcagtacc gcgtcctcga3060catggctgac ggctacgtca ccgccatgac cgagaccggc gacgtcaagc agggcctcaa3120
ggtcattgac cagtccaacc tgtggtctcg tctgcagcag gctttcgagt ccggccgcgg3180cagcgtccgt gtcctggtcc tcaacgacgg cggccatgag ctcgctgttg agatgaaggt3240cgtccacggc tcrcgcctgt aaacaatcct crcgatgaca tctttcgtgt ctaaggggga3300gggtttattg tccatccatc ctatggatat tccaggctcg gatcaagcct gaataatgtg3360aaaaataccc catgggcttg gagtgatacg tggaacggtt tgtcattttt ttggatcggg3420ctgggatgta ttttggtcat gaggcagagt gcccagtaga taggatctac ctatgtgcag3480cactgtaatt taagatggat tttgcataac ttttttcttt gtgccgccct ttgtgacatg3540cagtgatgat gcatcgtgat gcatcgtgtt gtcatggctg taaatcgtcc tccctgcgca3600gatcacaagc agtacacgtt gcctcttgac gcgtcgtcgt gttagactac ctgcctacct3660acccaatgtc tgcgtgttga catcaaggta cccgtcgcca gcgcaccggt catgggatac3720atggggaaac cccacaagat tgcagcagcc acgatattat acgatgcccg acatgtgaga3780gtcgatggtc ctcttttttc ccttgctcca aaccccactt gtcgcatctg taacgagaga3840ctgacgttgt cttgatatga agcaagcatc gattcagaga cgaggaagca accagtactg3900tgctaacatg gcaacaaata cgagaccaag tggtagatat attacagagc acatataggc3960atgtaagcaa tgaggaccgg gcagataggg gaattgctgg agataacatg taggtagcgc4020gacaaaagaa ccggtgggat ctggatatag ccgacgaatg atgtgatact aaacttgaag4080gagggggggg gaggggagag gggggatgag ggcgggggag atgaaaggcc ggataagcag4140aggaccagca gacggtccat gttttgttgc ggtagcaaac aacacaacca cgatgttgat4200gtgctccaac gactggtttt gataaggtga ttgtttgttt gccttgagat acgtcggctc4260ttacagctgt tggcgtgtat atcttgacat catacataag gactcccccc cttgttgaat4320tgcttttcag cgaaaagacg tacgtagtac tagtaggara taacacgtag ctaggg4376<210>3
<211>224<212>PRT<213>里氏木霉(Trichoderma reesi)<400>3Met Gly Tyr Tyr Asp Asp Glu Gly Ser Tyr His Ser Leu Lys His Gly1 5 10 15Val Ala Lys Thr Ile Asp Lys Leu Leu Pro His His His His His His20 25 30His His Ser Asp His His His His Ser Asp His His Asp His Asn Asn35 40 45Thr Thr Ile Thr Glu His Val Glu Val Asp Val Val Arg His Asp Ala50 55 60Agn His Ser Arg Arg Ala Ala Pro Ala Thr Glu Ser Gln Pro Gln Thr65 70 75 80Val Ser Ile Pro Cys His His Ile Arg Leu Gly Asp phe Leu Met Leu85 90 95Gln Gly Arg Pro Cys Gln Val Ile Arg Ile Ser Thr Ser Ser Ala Thr100 105 110Gly Gln Tyr Arg Tyr Leu Gly Val Asp Leu Phe Thr Lys Gln Leu His115 120 125Glu Glu Ser Ser Phe Ile Ser Asn Pro Ala Pro Ser Val Val Val Gln130 135 140Thr Met Leu Gly Pro Val Phe Lys Gln Tyr Arg Val Leu Asp Met Ala145 150 155 160Asp Gly Tyr Val Thr Ala Met Thr Glu Thr Gly Asp Val Lys Gln Gly165 170 175Leu Lys Val Ile Asp Gln Ser Asn Leu Trp Ser Arg Leu Gln Gln Ala180 185 190
Phe Glu Ser Gly Arg Gly Ser Val Arg Val Leu Val Leu Asn Asp Gly195 200 205Gly His Glu Leu Ala Val Glu Met Lys Val Val His Gly Ser Arg Leu210 215 220
權(quán)利要求
1.從生物體檢測或獲得基因啟動子的方法,所述方法包括(a)在期望的條件下獲得一種或者多種由生物體產(chǎn)生的蛋白;(b)獲得蛋白的氨基酸序列數(shù)據(jù);(c)基于獲得的蛋白氨基酸序列制備一種或者多種寡核苷酸;(d)用一種或者多種寡核苷酸處理來自生物體的基因組或染色體DNA以獲得編碼蛋白及其調(diào)節(jié)區(qū)的基因組或染色體DNA;以及(e)對獲得的基因組或染色體DNA測序以檢測或獲得編碼蛋白的基因的啟動子。
2.根據(jù)權(quán)利要求1的方法,其中生物體為微生物、植物或者動物。
3.根據(jù)權(quán)利要求2的方法,其中微生物選自細菌,酵母以及真菌。
4.根據(jù)權(quán)利要求3的方法,其中微生物為絲狀真菌。
5.根據(jù)權(quán)利要求1到4任一項的方法,其中步驟(a)是在期望的條件通過分離由生物體產(chǎn)生的蛋白進行的,所述期望的條件誘導一種或者多種提供蛋白質(zhì)組顯示的蛋白的表達。
6.根據(jù)權(quán)利要求5的方法,其中期望的條件包含提供養(yǎng)分或者基質(zhì)或者環(huán)境條件。
7.根據(jù)權(quán)利要求1到6任一項的方法,其中步驟(c)通過基因組步移PCR進行。
8.根據(jù)權(quán)利要求1到7任一項的方法獲得的分離的啟動子。
9.權(quán)利要求8的啟動子,其是能夠促進基因在真菌細胞中轉(zhuǎn)錄的真菌啟動子。
10.來自絲狀真菌的一分離的hex1啟動子。
11.權(quán)利要求10的hex1啟動子,來源于選自Ophiostoma、木霉、曲霉、青霉、Topylocladium、鐮刀菌、金孢霉菌、Magnaporthe、脈孢菌、麥角菌、小球殼菌、Collectotrichum、黑粉菌、Podospora以及毛霉的真菌種。
12.權(quán)利要求11的hex1啟動子,來源于里氏木霉。
13.權(quán)利要求12的hex1啟動子,具有基本上如圖2所示的核苷酸序列(SEQ ID NO1),在嚴格條件下與圖2所示序列(SEQ ID NO1)雜交的序列,或者圖2所示序列(SEQ ID NO1)的功能部分,當所述部分在一種真菌內(nèi)時能夠控制基因的表達。
14.權(quán)利要求13的hex1啟動子,具有基本上如圖2所示的核苷酸序列(SEQ ID NO1)。
15.權(quán)利要求13的hex1啟動子,為在高度嚴格的雜交條件下與圖2的序列(SEQ ID NO1)雜交的核苷酸分子。
16.一載體或者轉(zhuǎn)化的細胞,包含權(quán)利要求10到15任一項的分離的hex1啟動子。
17.權(quán)利要求16的載體,選自核酸載體、質(zhì)粒以及病毒載體。
18.一重組DNA構(gòu)建體,包含可操作性連接到一基因的權(quán)利要求10到15任一項的分離的hex1啟動子。
19.根據(jù)權(quán)利要求18的DNA構(gòu)建體,其中基因編碼一外源蛋白。
20.根據(jù)權(quán)利要求19的DNA構(gòu)建體,其中外源蛋白選自水解酶以及治療學/藥物上的重要分子。
21.根據(jù)權(quán)利要求20的DNA構(gòu)建體,其中水解酶選自植酸酶、纖維素霉、木聚糖酶、β-葡聚糖酶、淀粉酶、脂肪酶和蛋白酶,
22.根據(jù)權(quán)利要求20的DNA構(gòu)建體,其中治療學/藥物上的重要分子選自蛋白、抗體、生長因子、生長抑制劑和組織激活劑。
23.一表達系統(tǒng),包含權(quán)利要求19到22任一項的DNA構(gòu)建體。
全文摘要
本發(fā)明涉及利用蛋白質(zhì)組方法從生物體獲得啟動子的方法、來自真菌的分離的啟動子以及分離的啟動子的應用。
文檔編號C12N5/10GK1615362SQ02827080
公開日2005年5月11日 申請日期2002年12月13日 優(yōu)先權(quán)日2001年12月13日
發(fā)明者海倫娜·內(nèi)瓦萊寧, 小瓦倫蒂諾·塞托阿·泰奧, 納塔利·庫拉奇, 彼得·萊昂納德·貝里奎斯特 申請人:麥考里大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
诸城市| 湘乡市| 怀来县| 永善县| 梓潼县| 巢湖市| 梧州市| 乳源| 洛宁县| 新建县| 十堰市| 大足县| 柳林县| 临朐县| 潞城市| 伊春市| 宜城市| 思茅市| 星子县| 微博| 珲春市| 富平县| 贵定县| 潞西市| 樟树市| 礼泉县| 万年县| 宜丰县| 大石桥市| 娱乐| 兴和县| 旌德县| 毕节市| 黄陵县| 原阳县| 姜堰市| 茶陵县| 鹤山市| 合川市| 金乡县| 廊坊市|