專利名稱:用于在植物中胚-特異性表達(dá)的表達(dá)盒的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及包含轉(zhuǎn)錄調(diào)控核苷酸序列的表達(dá)盒,該轉(zhuǎn)錄調(diào)控核苷酸序列在可以獲得自玉米的植物中具有整個(gè)種子和/或胚特異性的表達(dá)特性。該調(diào)控核苷酸序列優(yōu)選表現(xiàn)出強(qiáng)表達(dá)活性,尤其是在整個(gè)種子中,特別是在胚乳中。
背景技術(shù):
操縱植物以改變和/或改良表型特征(例如生產(chǎn)力或質(zhì)量)需要在植物組織中表達(dá)異源基因。此類遺傳操縱依賴于驅(qū)動(dòng)和控制所需基因表達(dá)的手段的可用性。例如,遺傳操縱依賴于合適的啟動(dòng)子的可用性和使用,該啟動(dòng)子在植物中是有效的,并調(diào)控基因表達(dá)使得轉(zhuǎn)基因植物產(chǎn)生理想的效應(yīng)。
可育玉米植株包含雄性和雌性生殖組織二者,其通常分別稱為雄花穗和谷穗。雄花穗組織形成每個(gè)顆粒中具有兩個(gè)核的單倍體花粉粒,其在開花期散發(fā)時(shí)接觸雌谷穗的穗絲。谷穗可以在與散發(fā)花粉的植株相同的植株上,或者在不同的植株上?;ǚ奂?xì)胞發(fā)育為稱為花粉管的結(jié)構(gòu),其向下伸長穿過單個(gè)雌穗絲,到達(dá)胚珠。兩個(gè)雄核通過此管到達(dá)穗絲基底處的單倍體雌卵。雄核中的一個(gè)與雌單倍體卵核融合并使其受精形成合子,其在染色體數(shù)目上是二倍體,且將成為谷粒內(nèi)的胚。另一個(gè)雄核與第二雌核融合并使其受精形成初生胚乳核,其在染色體數(shù)目上是三倍體,且將成為玉米植株的谷?;蚍N子的胚乳。未受精的胚珠不產(chǎn)生谷粒,未受精的組織最后退化。谷粒由許多部分組成,一些部分衍生自母體組織,其他部分衍生自受精過程。在母體遺傳上,谷粒遺傳了許多組織,包括保護(hù)性周圍果皮和花梗?;üJ嵌瘫鷺咏M織,其將谷粒附著于穗軸,并提供從母體組織至谷粒的營養(yǎng)物轉(zhuǎn)移。谷粒包含源自受精活動(dòng)的組織,包括新的胚,以及胚乳。胚由將發(fā)育為下一代玉米植株的根和枝條的細(xì)胞組成。它還是谷粒中貯存油和質(zhì)量蛋白質(zhì)的組織。胚乳作為營養(yǎng)組織發(fā)揮作用,并在萌發(fā)和胚的最初生長所需的貯存淀粉和蛋白質(zhì)的形成中提供能量。考慮到高等植物的胚和谷粒發(fā)育過程中發(fā)生的復(fù)雜調(diào)控,且考慮到通常將谷物用作動(dòng)物和人類的主要營養(yǎng)來源,發(fā)展可以用來從營養(yǎng)角度改善這些組織的關(guān)鍵工具很重要。這類工具中的一類可以是轉(zhuǎn)錄啟動(dòng)子,該轉(zhuǎn)錄啟動(dòng)子可以驅(qū)動(dòng)營養(yǎng)增強(qiáng)基因在這些組織中的特異性表達(dá)。不幸的是,僅鑒定出了相對少的特異性指導(dǎo)此表達(dá)模式的啟動(dòng)子。因此,本領(lǐng)域存在對在谷粒發(fā)育過程中,更具體而言,在胚發(fā)育過程中驅(qū)動(dòng)表達(dá)的新的啟動(dòng)子序列的需要。胚特異性的啟動(dòng)子可用于表達(dá)基因,以及用于產(chǎn)生大量的蛋白質(zhì),用于表達(dá)參與油或目標(biāo)蛋白合成的基因,例如抗體、用于增加整個(gè)種子營養(yǎng)價(jià)值的基因、和尤其胚等。有多種不同的啟動(dòng)子供選擇是有利的,使得可以根據(jù)特定的基因、構(gòu)建體、細(xì)胞、組織、植物或環(huán)境選擇最合適的啟動(dòng)子。此外,對用多種植物轉(zhuǎn)錄單元(PTU)共轉(zhuǎn)化植物日益增加的興趣,和與使用用于這類目的的常規(guī)調(diào)控序列相關(guān)的潛在問題值得有多種可利用的啟動(dòng)子序列。
僅克隆和詳細(xì)研究了少數(shù)胚或整個(gè)種子特異性啟動(dòng)子;這些包括種子貯藏蛋白基因的啟動(dòng)子,例如球蛋白啟動(dòng)子(Wu等人,(1998)Plant Cell Physiol 39 (8)885-889)、菜豆蛋白啟動(dòng)子(美國專利號(hào)5,504,200)和油菜籽蛋白啟動(dòng)子(美國專利號(hào)5,608,152)。貯藏蛋白一般大量存在,使其相對易于分離貯藏蛋白質(zhì)基因和基因啟動(dòng)子。即使如此,可利用的種子特異性啟動(dòng)子數(shù)量仍然有限。此外,大部分這類啟動(dòng)子都有若干缺點(diǎn);其只可在種子發(fā)育過程中有限的時(shí)間段驅(qū)動(dòng)表達(dá),并且也可以在其他組織中表達(dá)。例如,貯藏蛋白基因啟動(dòng)子主要在胚發(fā)育階段的中期至后期表達(dá)(Chen等人,Dev. Genet. ,10(2)112-122(1989) ;Keddie 等人,Plant Mol. Biol. , 19(3) :443-53(1992) ;Sjodahl 等人,Planta.,197(2) :264-71(1995) ;Reidt 等人,Plant J. ,21(5) :401-8 (2000)),并且也在其他組織中具有活性,例如花粉、雄蕊和/或花藥(例如,菜豆蛋白啟動(dòng)子,如Ahm,V,等人,Plant Phys 109 :1151-1158 (1995)報(bào)道的;或 zmHyPRP 啟動(dòng)子,如 Gene 356(2005),146-152中所述;或如美國專利5,912,414所述的啟動(dòng)子)。因此,現(xiàn)有技術(shù)對于鑒別可用于在重要經(jīng)濟(jì)植物中表達(dá)選定的轉(zhuǎn)基因的新序列存在巨大的需求。因而,本發(fā)明的目的是提供新的和備選的表達(dá)盒,用于轉(zhuǎn)基因在植物中的胚表達(dá)。本發(fā)明解決了該問題。
發(fā)明概述因此,本發(fā)明的第一個(gè)實(shí)施方案涉及用于調(diào)控目的多核苷酸的種子特異性表達(dá)的表達(dá)盒,該表達(dá)盒包含選自以下序列的轉(zhuǎn)錄調(diào)控核苷酸序列(a) SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、或 18 的核酸序
列,或其變體;(b)與 SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、或 18 中的任
一個(gè)所示的核酸序列至少80%相同的核酸序列;(c)在嚴(yán)緊條件下與SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、
或18的核酸序列雜交的核酸序列,或其變體;(d)與位于 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35
或36的可讀框序列上游的核酸序列雜交的核酸序列,或其變體;(e)與位于下述可讀框序列上游的核酸序列雜交的核酸序列,其中該可讀框序列編碼 SEQ ID NO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53 或 54 的氨基酸序列,或其變體;(f)與位于下述可讀框序列上游的核酸序列雜交的核酸序列,其中該可讀框序列與 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35 或 36 的可讀框序
列至少80%相同,且其中該可讀框編碼種子蛋白質(zhì);(g)與位于下述可讀框上游的核酸序列雜交的核酸序列,其中該可讀框編碼與SEQID NO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53 或 54 的氨基酸序列至少
80 %相同的氨基酸序列,其中該可讀框編碼種子蛋白質(zhì);(h)核酸序列,其可以自 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36所示的可讀框序列的第一外顯子出發(fā),在基因組DNA上,通過5'基因組步行或熱不對稱交錯(cuò)聚合酶鏈?zhǔn)椒磻?yīng)(TAIL-PCR)獲得;以及(i)核酸序列,其可以自下述可讀框序列的第一外顯子出發(fā),在基因組DNA上,通過5'基因組步行或TAIL-PCR獲得,其中該可讀框序列與SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36所示的可讀框序列至少80%相同,且其中該可讀框編碼種子蛋白質(zhì);以及(j)核酸序列,其可以自下述可讀框序列的第一外顯子出發(fā),在基因組DNA上,通過5'基因組步行或TAIL-PCR獲得,其中該可讀框序列編碼與SEQ ID NO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53或54所示的可讀框編碼的任一氨基酸序列至少80 %相同的氨基酸序列,且該可讀框編碼種子蛋白質(zhì)。在優(yōu)選的實(shí)施方案中,表達(dá)盒還包含有效連接到轉(zhuǎn)錄控制核苷酸序列上的至少一個(gè)目的多核苷酸,該目的多核苷酸優(yōu)選與轉(zhuǎn)錄控制核苷酸序列異源。在另一個(gè)方面,本發(fā)明涉及包含本發(fā)明的表達(dá)盒或載體的轉(zhuǎn)基因植物組織、植物器官、植物或種子。優(yōu)選的,該轉(zhuǎn)基因植物是單子葉植物。在另一個(gè)方面,本發(fā)明涉及用于產(chǎn)生轉(zhuǎn)基因植物組織、植物器官、植物或種子的方 法,該方法包括(a)將本發(fā)明的表達(dá)盒或載體引入植物細(xì)胞中;以及(b)再生該植物細(xì)胞來形成植物組織、植物器官、植物或種子。在另一方面,本發(fā)明涉及用于產(chǎn)生轉(zhuǎn)基因植物組織、植物器官、植物或種子的方法,該方法包括(a)將本發(fā)明的表達(dá)盒或載體整合到植物細(xì)胞的基因組中;(b)再生該植物細(xì)胞來形成植物組織、植物器官、植物或種子,和(C)針對本發(fā)明的表達(dá)盒或載體的存在選擇該植物細(xì)胞來形成植物組織、植物器官、植物或種子。本發(fā)明的其他實(shí)施方案涉及包含本發(fā)明的表達(dá)盒的載體,和包含本發(fā)明的表達(dá)盒或載體的轉(zhuǎn)基因宿主細(xì)胞或轉(zhuǎn)基因植物,和產(chǎn)生該轉(zhuǎn)基因宿主細(xì)胞或轉(zhuǎn)基因植物的方法。附圖簡述圖I :KG候選物的q-RT-PCR結(jié)果,顯示整個(gè)種子或胚特異性或優(yōu)選的表達(dá)模式。[根_dv :授粉(DAP)后5、15、30天的根的混合物;葉_如:DAP后5、15、30天的葉的混合物;穗5和10DAP的穗的混合物;全種子15、20、30DAP的全種子的混合物;胚乳15、20、30DAP的胚乳的混合物;胚15、20、30DAP的胚的混合物^_V2+V4 V2和V4階段的根的混合物;枝條/葉_V2+V4 V2枝條和V4葉的混合物;花_GS :花和萌發(fā)種子的混合物]圖2 :二元KG載體的示意圖⑷和⑶。圖3 :具有RHF155的轉(zhuǎn)基因玉米中由p_KG24驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖4 :具有RKF109的轉(zhuǎn)基因玉米中由p_KG37驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖5 :具有RKF106的轉(zhuǎn)基因玉米中由p_KG45驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖6 :具有RKF107的轉(zhuǎn)基因玉米中由p_KG46驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖7 :具有RKF108的轉(zhuǎn)基因玉米中由p_KG49驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖8 :具有RKF125的轉(zhuǎn)基因玉米中由p_KG56驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖9 :具有RHF128的轉(zhuǎn)基因玉米中由P-KG103驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。
圖10 :具有RHF138的轉(zhuǎn)基因玉米中由p_KG119驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖11 :具有RTP1047的轉(zhuǎn)基因玉米中由P-KG129驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖12 MA候選物的q-RT-PCR結(jié)果[根_dy :授粉(DAP)后5、15、30天的根的混合物;葉_如:DAP后5、15、30天的葉的混合物-M 5和10DAP的穗的混合物;全種子15、20、 30DAP的全種子的混合物;胚乳15、20、30DAP的胚乳的混合物;胚15、20、30DAP的胚的混合物;根_V2+V4 V2和V4階段的根的混合物;枝條/葉_V2+V4 V2枝條和V4葉的混合物;花_63 :花和萌發(fā)種子的混合物]圖13 :用于MAWS啟動(dòng)子的載體RCB 1006。圖14 :具有RTP1060的轉(zhuǎn)基因玉米中由p_MAWS23驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖15 :具有RTP1059的轉(zhuǎn)基因玉米中由p_MAWS27驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖16 :具有RTP1053的轉(zhuǎn)基因玉米中由p_MAWS30驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖17 :具有RTP1049的轉(zhuǎn)基因玉米中由p_MAWS57驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖18 :具有RTP1056的轉(zhuǎn)基因玉米中由p_MAWS60驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖19 :具有RTP1048的轉(zhuǎn)基因玉米中由p_MAWS63驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖20 :具有RTP1061的轉(zhuǎn)基因玉米中由p_MAEMl驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖21 :具有RTP1064的轉(zhuǎn)基因玉米中由p_MAEM20驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá)。圖 22 Zm. 8705. I. Sl_at 的 qRT-PCR 結(jié)果。圖23 :在1% w/v的瓊脂糖凝膠上運(yùn)行且用溴化乙錠染色的GenomeWalk(GW)的數(shù)字圖像。泳道(L)代表如下(LI) Ikb加序列梯(Promega, Madison, WI,美國),(L2)沒有DNA(用無菌重蒸水代替GW庫),作為陰性對照;(L3)由試劑盒提供的人類PvuII Gff庫和來自人類組織類型胞漿素原活化體的引物,作為陽性對照,(L4)B73 PvuIIGW庫,(L5)B73EcoRV GW庫,(L6)B73 DraI GW庫,(7)B73 StuI GW庫。L3使用由試劑盒提供的來自人類組織類型胞漿素原活化體(tPA)的引物。L2和L4到L7使用ZmNP28特異性引物。圖24 :最終二元載體RLN 90(A)和RLN 93(B);圖24(C)是RHF160的示意圖,圖24(D)是RHF158的示意圖。圖25 (A)具有RLN90的轉(zhuǎn)基因玉米中由pZmNP28_655驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá);(B)具有RLN93的轉(zhuǎn)基因玉米中由pZmNP28_507驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá);(C)具有RHF158的轉(zhuǎn)基因玉米中由pZmNP28_1706驅(qū)動(dòng)的⑶S在不同發(fā)育階段的不同組織中的表達(dá);(D)具有RHF160的轉(zhuǎn)基因玉米中由pZmNP28_2070驅(qū)動(dòng)的GUS在不同發(fā)育階段的不同組織中的表達(dá)。參照啟動(dòng)子的序列識(shí)別號(hào)說明
啟動(dòng)子 CDS 氣基酸I載體I基因I EST I變體I變休2片段 I
"MAWS6F1 — 19 3755 ~W91 TW!27I MAlMl^ ^2 20|38"J6^ 74^ 92^TH 128............................................................................
ICG 56 3 |2l[39^57 I 75 I 93 Illl I 129 1145 [
KG 129 4_I 22I 40I 58 j 76 I 94 112 130 146
MAEM20 5__23 4159_ 77 95 113 131—
MAWS27 6__24 4260 78_ 96 Hi^ 132
MAWS63 7 25 43 ,79 Wf SB i33
KGT 49 8 26"一 Ti62 80 98 116 134 147
KG—24 927^63 M 99 117 135 148
KG 37 10 28^ 4664 82 118 136 149
KG 45 11_.....29......................."47.....65....................~83^.....101..................119....................137…150.........—
KG 46 12 30^4866 84 TMHO iH BI
KG 103 13 311567 IS 103121 139 152
..........KG^l 19 14"SiSI SI W4^ '122......................麗.....................153....................................
MAWS23 ~I5 33 IT^ If 105123 141
—MAWS30 16 34 5270 Si illIM 142
"MAWS57 Tf 35 5371 SI 107125 143
ZmNP28 18 36|~54|72^|9i—^|lgr^|T26^]144^
_0] 一般定義可以理解,本發(fā)明不限于描述的特定的方法、規(guī)程、細(xì)胞系、植物種或?qū)佟?gòu)建體和試劑。還可以理解,本文使用的術(shù)語僅出于描述特定實(shí)施方案的目的,而并非意在限制本發(fā)明的范圍,所述范圍僅由所附權(quán)利要求限制。必須注意到,除非上下文另外清楚的指出,本文和所附權(quán)利要求中使用的單數(shù)形式“一”、“和”及“該”包括復(fù)數(shù)指代。因此,例如提到“載體”是指代一個(gè)或多個(gè)載體,并包括本領(lǐng)域技術(shù)人員已知的其等價(jià)體等。術(shù)語“約”在本文中意指大致、大約、左右或在一定范圍內(nèi)。當(dāng)術(shù)語“約”與數(shù)值范圍聯(lián)用時(shí),它通過將邊界延伸到所述數(shù)值的上下來修飾所述范圍。一般而言,本文使用的術(shù)語“約”用于修飾高于和低于所述值20%變量,優(yōu)先高或低(大于或小于)所述值10%的變量。本文使用的詞語“或”意指特定列表的任一成員,也包括所述列表的成員的任何組
八
口 o“表達(dá)盒”在本文中意指線性或環(huán)狀的核酸分子。涵蓋了能夠指導(dǎo)特定核苷酸序列在恰當(dāng)宿主細(xì)胞中表達(dá)的DNA和RNA序列。一般而言,包括與目的多核苷酸有效連接的啟動(dòng)子,其任選的是與終止信號(hào)和/或其他調(diào)控元件有效連接的。本發(fā)明的表達(dá)盒的特征是其應(yīng)該包括后文定義的轉(zhuǎn)錄調(diào)控核苷酸序列。表達(dá)盒還可以包括核苷酸序列正確翻譯所需的序列。編碼區(qū)通常編碼目標(biāo)蛋白,但在正義或反義方向也編碼目標(biāo)功能RNA,例如反義RNA或非翻譯的RNA。包含目的多核苷酸序列的表達(dá)盒可以是嵌合的,意指至少一個(gè)其組分與其至少一個(gè)其他組分是異源的。表達(dá)盒還可以是天然存在的,但以用于異源表達(dá)的有效重組形成獲得的。表達(dá)盒可以完全是胞外裝配的(例如,重組克隆技術(shù))。然而,表達(dá)盒還可以部分使用內(nèi)源組分裝配。例如,可以通過在內(nèi)源序列的上游替換(或插入)啟動(dòng)子序列來獲得表達(dá)盒,從而使得該內(nèi)源序列與該啟動(dòng)子功能連接,并受該啟動(dòng)子序列控制。同樣的,待表達(dá)的核酸序列還可以替換(或插入)到內(nèi)源啟動(dòng)子序列的下游,從而形成表達(dá)盒。表達(dá)盒中的核苷酸序列的表達(dá)可處于組成型啟動(dòng)子或誘導(dǎo)型啟動(dòng)子的控制下,后者僅當(dāng)宿主細(xì)胞暴露在一些特定的外部刺激下時(shí)才啟動(dòng)轉(zhuǎn)錄。在多細(xì)胞生物體的情況下,啟動(dòng)子還可以是特定組織、器官或發(fā)育階段(例如,本發(fā)明種子優(yōu)先或胚特異性啟動(dòng)子)特異性的。在優(yōu)選的實(shí)施方案中,此類表達(dá)盒包括與目標(biāo)核苷酸序列連接的本發(fā)明的轉(zhuǎn)錄起始區(qū)。此類表達(dá)盒優(yōu)選提供復(fù)數(shù)的限制性酶切位點(diǎn),供插入目標(biāo)基因在調(diào)控區(qū)的轉(zhuǎn)錄調(diào)控下。表達(dá)盒可額外的含有可選擇的標(biāo)記基因。盒按5’ -3’轉(zhuǎn)錄方向包括在植物中有功能的轉(zhuǎn)錄和翻譯起始區(qū)、目標(biāo)DNA序列,和轉(zhuǎn)錄和翻譯終止區(qū)。終止區(qū)可以是轉(zhuǎn)錄起始區(qū)天然的,可以是目標(biāo)DNA序列天然的,或者可以源自另一種來源。常規(guī)的終止區(qū)可獲得自根癌農(nóng)桿菌(A. tumefaciens)的Ti-質(zhì)粒,例如章魚堿合酶和胭脂堿型合酶終止區(qū),以及下文所描述的 (還參見 Guerineau 1991 ;Proudfoot 1991 ;Sanfacon 1991 ;Mogen 1990 ;Munroe 1990 ;Balias 1989 Joshi 1987)。表達(dá)盒還可以包括多克隆位點(diǎn)。在此情況下,多克隆位點(diǎn)優(yōu)選以這樣的方式排列,該方式允許待導(dǎo)入到多克隆位點(diǎn)中的多核苷酸與轉(zhuǎn)錄調(diào)控序列有效連接。除上述組分外,本發(fā)明的表達(dá)盒優(yōu)選可包括同源重組所需組分,即,來自靶位置的側(cè)翼基因組序列。然而,還考慮基本上由如下文定義的轉(zhuǎn)錄調(diào)控核苷酸序列組成的表達(dá)盒。“啟動(dòng)子”指通常位于其編碼序列上游(5,)的核苷酸序列,通過提供RNA聚合酶和正確轉(zhuǎn)錄所需的其他因子的識(shí)別,來控制編碼序列的表達(dá)。“啟動(dòng)子”包括短DNA序列的基礎(chǔ)啟動(dòng)子,在一些情況下,其包括TATA框和作用是具體說明轉(zhuǎn)錄起始位點(diǎn)的其他序列,該基礎(chǔ)啟動(dòng)子上可添加用于增強(qiáng)表達(dá)的調(diào)控元件?!皢?dòng)子”還指包括基礎(chǔ)啟動(dòng)子和調(diào)控元件的核苷酸序列,其能夠控制編碼序列或功能性RNA的表達(dá)。該類型的啟動(dòng)子序列包括近端和更遠(yuǎn)距離的上游元件,后一類元件通常被稱為增強(qiáng)子。因而,“增強(qiáng)子”是刺激啟動(dòng)子活性的DNA序列,并可以是啟動(dòng)子內(nèi)在的元件或插入的異源元件,以增強(qiáng)啟動(dòng)子的水平或組織特異性。它可以在兩個(gè)方向(正常方向或折返的方向)發(fā)揮作用,即使當(dāng)移動(dòng)到啟動(dòng)子上游或下游時(shí),也能夠發(fā)揮功能。增強(qiáng)子和其他上游啟動(dòng)子元件都結(jié)合介導(dǎo)其效應(yīng)的序列特異性的DNA結(jié)合蛋白。啟動(dòng)子可以整個(gè)源自天然基因,或包括源自天然可見的不同啟動(dòng)子的不同元件,或者甚至包括合成的DNA片段。啟動(dòng)子還可以含有蛋白質(zhì)因子結(jié)合所涉及的DNA序列,其響應(yīng)生理的或發(fā)育的條件,控制轉(zhuǎn)錄起始的效率?!捌鹗嘉稽c(diǎn)”是圍繞第一核苷酸周圍的位置,第一核苷酸是轉(zhuǎn)錄序列的一部分,也定義為位置+1?;虻乃衅渌蛄屑捌淇刂茀^(qū)根據(jù)該位點(diǎn)編號(hào)。下游序列(即,3’方向的其他蛋白質(zhì)編碼序列)命名為正的,而上游序列(5’方向上的大部分控制區(qū))命名為負(fù)的。在缺少上游激活的條件下失活的或啟動(dòng)子活性極大降低的啟動(dòng)子元件,例如TATA元件,被稱為“基礎(chǔ)”或“核心”啟動(dòng)子。在存在合適的轉(zhuǎn)錄因子的條件下,基礎(chǔ)啟動(dòng)子發(fā)揮允許轉(zhuǎn)錄的功能。因而,“基礎(chǔ)”或“核心”啟動(dòng)子僅由轉(zhuǎn)錄起始需要的所有基本元件構(gòu)成,例如TATA框和/或起始物(initiator)?!敖M成型啟動(dòng)子”指能夠在植物的所有的或幾乎所有的發(fā)育階段過程中,在所有的或幾乎所有的植物組織中表達(dá)可讀框的啟動(dòng)子(ORF)。每種轉(zhuǎn)錄激活元件都不表現(xiàn)出絕對的組織特異性,而以達(dá)到轉(zhuǎn)錄活性最高的植物組織中至少I %的水平在大部分植物組織中介導(dǎo)轉(zhuǎn)錄激活。“組成型表達(dá)”指使用組成型啟動(dòng)子的表達(dá)?!笆苷{(diào)控的啟動(dòng)子”指非組成型的,而是以時(shí)間和/或空間上受調(diào)控的方式指導(dǎo)基因表達(dá)的啟動(dòng)子,包括組織特異性啟動(dòng)子和誘導(dǎo)型啟動(dòng)子。包括天然的和合成的序列,以及合成和天然序列的組合。不同的啟動(dòng)子可以指導(dǎo)基因在不同的組織或細(xì)胞類型中表達(dá),或在不同的發(fā)育階段表達(dá),或者響應(yīng)不同的環(huán)境條件表達(dá)。不斷發(fā)現(xiàn)可用于植物細(xì)胞中的各種類型的新啟動(dòng)子,大部分實(shí)例可見于Okamuix)等人,(1989)的編著中??捎糜谥参镏械牡湫偷氖苷{(diào)控的啟動(dòng)子包括但不限于安全劑誘導(dǎo)型啟動(dòng)子、源自四環(huán)素誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源自水楊酸誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源自醇類誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源自糖皮質(zhì)激素誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源自病原體誘導(dǎo)型系統(tǒng)的啟動(dòng)子,和源自蛻皮素誘導(dǎo)型系統(tǒng)的啟動(dòng)子?!皸l件化的”和“受調(diào)控的表達(dá)”指由受調(diào)控的啟動(dòng)子控制的表達(dá)?!罢T導(dǎo)型啟動(dòng)子”指可以通過外部刺激在一種或多種細(xì)胞類型中開啟的受調(diào)控的啟動(dòng)子,例如化學(xué)品、光照、激素、脅迫或病原體。 如本文中使用的,“轉(zhuǎn)錄調(diào)控核苷酸序列”指這樣的核苷酸序列,其影響待轉(zhuǎn)錄的相關(guān)(或功能上關(guān)聯(lián)的)核苷酸序列的轉(zhuǎn)錄、RNA加工或穩(wěn)定性或翻譯。轉(zhuǎn)錄調(diào)控核苷酸序列相對于待轉(zhuǎn)錄的核苷酸序列可具有各種分布。轉(zhuǎn)錄調(diào)控核苷酸序列可位于待轉(zhuǎn)錄核苷酸序列(例如,編碼序列)的上游(5’非編碼序列)、內(nèi)部、或下游(3’非編碼序列)。轉(zhuǎn)錄調(diào)控核苷酸序列可選自增強(qiáng)子、啟動(dòng)子、翻譯前導(dǎo)序列、內(nèi)含子、5’非翻譯序列、3’非翻譯序列和多聚腺苷酸信號(hào)序列。包括天然的和合成的序列,以及合成和天然序列的組合。如上所示,術(shù)語“轉(zhuǎn)錄調(diào)控核苷酸序列”不限于啟動(dòng)子。然而,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選包括至少一個(gè)啟動(dòng)子序列(例如,能夠誘導(dǎo)下游序列轉(zhuǎn)錄的位于基因轉(zhuǎn)錄起點(diǎn)上游的序列)。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列包括相應(yīng)基因的啟動(dòng)子序列,和任選及優(yōu)選的,該基因的天然5’非翻譯區(qū)。此外,還可以使用該基因的3’非翻譯區(qū)和/或多聚腺苷酸區(qū)。本文中使用的術(shù)語“順式調(diào)控元件”或“啟動(dòng)子基序”指這樣的順式作用轉(zhuǎn)錄調(diào)控元件,該元件產(chǎn)生基因表達(dá)整體控制的一方面。順式元件可以發(fā)揮結(jié)合轉(zhuǎn)錄因子的功能,該轉(zhuǎn)錄因子是調(diào)控轉(zhuǎn)錄的反式作用蛋白質(zhì)因子。一些順式元件結(jié)合一種以上的轉(zhuǎn)錄因子,轉(zhuǎn)錄因子可以不同的親和力與一種以上的順式元件相互作用。本發(fā)明的啟動(dòng)子理想的含有可以產(chǎn)生或調(diào)節(jié)基因表達(dá)的順式元件??梢酝ㄟ^多種技術(shù)鑒別順式元件,包括刪除分析,即從啟動(dòng)子的5 ‘末端或中間刪除一個(gè)或多個(gè)核苷酸;使用DNA酶I足跡的DNA結(jié)合蛋白質(zhì)分析;甲基化干擾、電泳移動(dòng)性遷移測定;由連接介導(dǎo)PCR的體內(nèi)基因組足跡,和其他的常規(guī)測定;或通過常規(guī)的DNA序列比較方法,用已知的順式元件進(jìn)行DNA序列相似性分析??梢酝ㄟ^誘變(或取代)一個(gè)或多個(gè)核苷酸,或通過其他常規(guī)方法,進(jìn)一步研究順式元件的精細(xì)結(jié)構(gòu)??梢酝ㄟ^化學(xué)合成,或通過從包括此類元件的啟動(dòng)子中分離,來獲得順式元件,還可以合成含有額外的側(cè)翼核苷酸的順式元件,該側(cè)翼核苷酸含有促進(jìn)序列操作的有效的限制性酶切位點(diǎn)。啟動(dòng)子(有或無增強(qiáng)子)的“表達(dá)模式”是表達(dá)水平的模式,顯示該啟動(dòng)子在植物中的何處和哪個(gè)發(fā)育階段起始轉(zhuǎn)錄。當(dāng)一個(gè)啟動(dòng)子的表達(dá)模式表現(xiàn)出與其他啟動(dòng)子的表達(dá)模式極少重疊時(shí),認(rèn)為該組啟動(dòng)子的表達(dá)模式是互補(bǔ)的。可以通過測量標(biāo)準(zhǔn)轉(zhuǎn)錄的報(bào)告子mRNA的“穩(wěn)態(tài)”濃度,來確定啟動(dòng)子的表達(dá)水平。該測量是間接的,因?yàn)閳?bào)告子mRNA的濃度不僅取決于其合成速率,而且取決于mRNA降解的速率。因此,穩(wěn)態(tài)水平是合成速率和降解速率的產(chǎn)物。然而,當(dāng)轉(zhuǎn)錄序列相同時(shí),可認(rèn)為降解速率以固定的速率進(jìn)行,因而該值可作為合成速率的測量。當(dāng)以該方式比較啟動(dòng)子時(shí),本領(lǐng)域技術(shù)人員可獲得的技術(shù)是雜交Sl-RNA酶分析、Northern印跡和競爭性RT-PCR。該技術(shù)列表并非以任何方式代表所有可獲得的技術(shù),而是描述用于分析轉(zhuǎn)錄活性和mRNA表達(dá)水平的常用程序。實(shí)踐上,所有啟動(dòng)子的轉(zhuǎn)錄起點(diǎn)分析揭示,轉(zhuǎn)錄開始處通常不僅有單個(gè)堿基,而是或多或少成簇的起始位點(diǎn)集合,每種負(fù)責(zé)mRNA的若干起點(diǎn)。由于該分布在啟動(dòng)子與啟動(dòng)子之間不同,故每群的報(bào)告子mRNA序列也彼此不同。由于每種mRNA或多或少傾向于降解,因此預(yù)期不同的報(bào)告子mRNA沒有單一的降解速率。已顯示,對于多種真核啟動(dòng)子序列,圍繞起始位點(diǎn)(“起始物”)的序列在確定由該特定的啟動(dòng)子指導(dǎo)的RNA表達(dá)水平中扮演了重要角色。這還包括部分的轉(zhuǎn)錄序列。因而啟動(dòng)子與報(bào)告子序列的直接融合導(dǎo)致亞優(yōu)化的轉(zhuǎn)錄水平。分析表達(dá)模式和水平的常用程序是通過確定細(xì)胞中蛋白質(zhì)積累的“穩(wěn)態(tài)”水平。本領(lǐng)域技術(shù)人員已知的報(bào)告子基因的常用候選物是P -葡糖醛酸糖苷酶(GUS)、氯霉素乙酰轉(zhuǎn)移酶(CAT)和有熒光特性的蛋 白質(zhì),例如水母(Aequora victoria)的綠色突光蛋白(GFP)。然而,原則上,更多蛋白質(zhì)適合該目的,只要該蛋白質(zhì)不干擾基本的植物功能。多種工具適用于定量和確定分布。檢測系統(tǒng)是可以方便的創(chuàng)造的,或者基于例如免疫化學(xué)、酶學(xué)、熒光檢測和定量是可獲得。使用原位分析蛋白質(zhì)表達(dá),可以確定植物組織提取物或完整組織中的蛋白質(zhì)水平。一般而言,具有一個(gè)嵌合的啟動(dòng)子報(bào)告子構(gòu)建體的單個(gè)轉(zhuǎn)化系可隨其報(bào)告子基因的表達(dá)水平而改變。還經(jīng)常觀察到的是這樣的現(xiàn)象,即此類轉(zhuǎn)化體不表達(dá)任何可檢測的產(chǎn)物(RNA或蛋白質(zhì))。表達(dá)的變化通常歸因于為“位置效應(yīng)”,雖然該失活的分子機(jī)制通常尚不清楚?!敖M織特異性啟動(dòng)子”指這樣的受調(diào)控的啟動(dòng)子,該啟動(dòng)子不是在所有的植物細(xì)胞中表達(dá),而僅在特定器官(例如葉或種子)、特定組織(例如胚或子葉)或特定的細(xì)胞類型(例如葉薄壁組織或種子貯藏細(xì)胞)的一種或多種細(xì)胞類型中表達(dá)。這也包括時(shí)間上受調(diào)控的啟動(dòng)子,例如在早期或晚期胚胎發(fā)生中、在發(fā)育的種子或果實(shí)的果實(shí)成熟的過程中、在完全分化的葉中,或在開始衰老時(shí)。為了本發(fā)明的目的,“組織特異性”優(yōu)選的指“種子特異性”或“種子優(yōu)先”或胚特異性或胚優(yōu)先。本文中使用的“種子”優(yōu)選指整個(gè)種子、胚乳和胚組織,更優(yōu)選的指胚組織。本發(fā)明中“特異性”意指,當(dāng)存在于植物中時(shí),有效連接本文所指的轉(zhuǎn)錄調(diào)控核苷酸序列的目的多核苷酸將優(yōu)勢地在所指定的組織或細(xì)胞中表達(dá)。本文意味的優(yōu)勢地表達(dá)的特征是相對于其他植物組織,在該組織或細(xì)胞中可檢測轉(zhuǎn)錄物的量統(tǒng)計(jì)學(xué)顯著的更高。統(tǒng)計(jì)學(xué)顯著更高的轉(zhuǎn)錄的量優(yōu)選是這樣的量,所述量是在至少一種具有可檢測的轉(zhuǎn)錄的其他組織中發(fā)現(xiàn)的量的至少2倍、3倍、4倍、5倍、10倍、100倍、500倍或1000倍??蛇x的,它是所指定組織或細(xì)胞中這樣的表達(dá),其他組織或細(xì)胞中的轉(zhuǎn)錄量少于(整株植物)表達(dá)總量的1%、2%、3%、4%或最優(yōu)選5%。轉(zhuǎn)錄量與細(xì)胞或組織內(nèi)存在的轉(zhuǎn)錄物(即RNA)或由轉(zhuǎn)錄物編碼的多肽的量直接相關(guān)?;赗NA或多肽的用于測量轉(zhuǎn)錄的合適技術(shù)是本領(lǐng)域普遍已知的。除上述外,組織或細(xì)胞特異性可選的和優(yōu)選的意指該表達(dá)限于或大部分限于所指定的組織或細(xì)胞,即在其它組織中基本沒有可檢測的轉(zhuǎn)錄。本文中的幾乎限于意指在少于10種、少于5種、少于4種、少于3種、少于2或I種其它組織中可檢測到非特異的表達(dá)?!胺N子優(yōu)選的”或“胚優(yōu)選的”在本發(fā)明的上下文中意指轉(zhuǎn)錄調(diào)控元件對核酸序列的轉(zhuǎn)錄方式使該核酸序列在種子中的表達(dá)在植物的任何發(fā)育階段,都占該核酸序列在整個(gè)植物中轉(zhuǎn)錄的RNA總量的超過50 %,優(yōu)選超過70 %,更優(yōu)選超過80 %?!氨磉_(dá)”指內(nèi)源基因、ORF或其部分、或轉(zhuǎn)基因在植物中的轉(zhuǎn)錄和/或翻譯。例如,在反義構(gòu)建體的情況下,表達(dá)可以僅指反義DNA的轉(zhuǎn)錄。此外,表達(dá)指正義(mRNA)或功能性RNA的轉(zhuǎn)錄和穩(wěn)定積累。表達(dá)還指廣生蛋白質(zhì)。種子特異性表達(dá)能夠被確定,例如通過在以下組織和發(fā)育階段中,比較有效連接到表達(dá)控制序列上的目的核酸(例如,葡糖醛酸糖苷酶(CTS)報(bào)告基因)的表達(dá)1)5葉期的根和葉,2) V-7期的莖,3)開花期出現(xiàn)第一個(gè)穗絲的葉、殼(husk)和穗絲(silk),4)授粉時(shí)的小穗(spikelets)/雄花穗(tassel), 5)授粉后5、10、15、20和25天的谷穗(ear)或籽粒(kernel)。優(yōu)選地,目的核酸的表達(dá)可以在授粉后5、10、15、20和25天的穗或籽粒 中在附圖所示的分析試驗(yàn)中測定。目的多核苷酸的表達(dá)可以通過各種熟知的技術(shù)被測定,例如通過Northern印跡或WO 02/102970中所描述的原位雜交技術(shù)測定,優(yōu)選地按附于本發(fā)明的實(shí)施例所述的GUS組化分析方法測定。用于分析種子特異性表達(dá)的轉(zhuǎn)基因植物也能夠通過技術(shù)人員所熟知、并在本說明書其它地方討論的技術(shù)產(chǎn)生。術(shù)語“核酸“指脫氧核糖核苷酸或核糖核苷酸及其單鏈或雙鏈形式的聚合物,包括含有糖、磷酸和堿基的單體(核苷酸),該堿基是嘌呤或嘧啶。除非具體限制,該術(shù)語涵蓋了含有天然核苷酸的已知類似物的核酸,其與參照核酸具有相似的結(jié)合特性,并以與天然存在的核苷酸相似的方式代謝。除非另外指出,特定的核酸序列還暗示性的涵蓋了保守修飾的變體(例如,簡并密碼子取代)和互補(bǔ)的序列,以及明確述及的序列。具體而言,可以通過產(chǎn)生這樣的序列來實(shí)現(xiàn)簡并密碼子取代,該序列中一個(gè)或多個(gè)選定(或所有)密碼子的第3位被混合的堿基和/或脫氧次黃甘殘基取代(Batzer 1991 ;0htsuka 1985 ;Rossolini1994)?!昂怂崞巍笔墙o定核酸分子的部分。在高等植物中,脫氧核糖核酸(DNA)是遺傳材料,而核糖核酸(RNA)參與DNA內(nèi)所含信息向蛋白質(zhì)中轉(zhuǎn)移。術(shù)語“核苷酸序列”指可以是單鏈或雙鏈的DNA或RNA的聚合物,任選的含有能夠整合到DNA或RNA聚合物中的合成的、非天然的或改變的核苷酸堿基。術(shù)語“核酸”或“核酸序列”還可以與基因、cDNA、DNA和基因編碼的RNA互換的使用。本發(fā)明涵蓋了分離的或基本純化的核酸或蛋白質(zhì)組合物。在本發(fā)明的上下文中,“分離的”或“純化的” DNA分子,或“分離的”或“純化的”多肽是籍人力,脫離其天然環(huán)境而存在的DNA分子或多肽,因而不是天然產(chǎn)物。分離的DNA分子或多肽可以以純化的形式存在,或者可以存在于非天然的環(huán)境中,例如轉(zhuǎn)基因宿主細(xì)胞中。例如,“分離的”或“純化的”核酸分子或蛋白質(zhì),或其生物學(xué)活性部分,是基本不含其他細(xì)胞材料,或者當(dāng)通過重組技術(shù)產(chǎn)生時(shí)基本不含培養(yǎng)基,或者當(dāng)合成產(chǎn)生時(shí)基本不含化學(xué)前體或其他化學(xué)品。優(yōu)選的,“分離的”核酸不含核酸所來源的生物體的基因組DNA中天然位于核酸側(cè)翼(S卩,位于核酸的5’或3’端的序列)的序列(優(yōu)選蛋白質(zhì)編碼序列)。例如,在各實(shí)施方案中,分離的核酸分子可以含有少于約5kb、4kb、3kb、2kb、lkb、0. 5kb或0. Ikb的核苷酸序列,該核苷酸序列核酸是在核酸所來源的生物體的基因組DNA中天然位于核酸側(cè)翼的。基本不含細(xì)胞材料的蛋白質(zhì)包括具有少于約30%、20%、10%、5% (按干重計(jì))的污染蛋白的蛋白質(zhì)或多妝制品。當(dāng)本發(fā)明的蛋白質(zhì)或其生物學(xué)活性部分是重組產(chǎn)生的時(shí),優(yōu)選培養(yǎng)基占少于約30%、20%、10%或5% (按干重計(jì))的化學(xué)前體或非目標(biāo)蛋白質(zhì)的化學(xué)品。本發(fā)明的核苷酸序列包括天然存在的序列以及突變(變體)形式。此類變體仍然具有理想的活性,即,啟動(dòng)子活性或由非變體核苷酸序列的可讀框編碼的產(chǎn)物的活性。術(shù)語“變體”涉及序列(例如,多肽或核酸序列一例如,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列)時(shí),意在表示基本相似的序列。對于包含可讀框的核苷酸序列,變體包括這樣的序列,由于遺傳密碼的簡并性,該序列編碼與天然蛋白質(zhì)相同的氨基酸序列。天然存在的等位變體可以使用例如普遍已知的分子生物學(xué)技術(shù)鑒別,如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和雜交技術(shù)。變體核苷酸序列還包括合成來源的核苷酸序列,例如使用定點(diǎn)誘變產(chǎn)生的,和編碼天然蛋白質(zhì)的可讀框,以及編碼相對于天然蛋白質(zhì)具有氨基酸取代的多肽的序列。一般而言,本發(fā)明的核苷酸序列變體與天然的(野生型或內(nèi)源)核苷酸序列,即,例如與SEQ ID N01至 18 或 19 至 36 具有至少 40、50、60 至 70%,例如優(yōu)選 71%、72%、73%、74%、75%、76%、77%、78% 至 79%,一般至少 80%,例如 81% -84%,至少 85%,例如 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%至 98%和 99%核苷酸序列同一性。 可以“優(yōu)化”本發(fā)明的核酸分子用于增強(qiáng)在目標(biāo)植物中的表達(dá)(參見例如WO91/16432 ;Perlak 1991 ;Murray 1989)。以該方式,可以利用植物優(yōu)選的密碼子合成基因或基因片段中的可讀框(參見例如CampbeIl&Gowri, 1990關(guān)于宿主優(yōu)選的密碼子用法的討論)。因而,可以優(yōu)化核苷酸序列用于在任何植物中表達(dá)。認(rèn)識(shí)到可以優(yōu)化或合成所有的或任何部分的基因序列。即,還可以使用合成的或部分優(yōu)化的序列。變體核苷酸序列和蛋白質(zhì)還涵蓋了源自誘變和重組程序的序列和蛋白質(zhì),例如DNA改組。使用此類程序,可以操作一種或多種不同的編碼序列,來產(chǎn)生具有理想特性的新的多肽。以此方式,從相關(guān)多核苷酸序列的群體中產(chǎn)生重組多核苷酸的文庫,該多核苷酸序列包含具有實(shí)質(zhì)的序列同一性的序列區(qū)域,并可以在體外或體內(nèi)同源重組。此種DNA改組的策略是本領(lǐng)域已知的(參見例如Stemmer 1994 ;Stemmer 1994 ;Crameri 1997 ;Moore 1997 ;Zhang 1997 ;Crameri 1998 ;和 US 5,605,794,6,8,10 和 12,837,458)。下列術(shù)語用于描述兩條或多條核酸或多核苷酸之間的序列關(guān)系(a) “參考序列”、(b) “比較窗口”、(c) “序列同一性”、(d) “百分比序列同一性”和(e) “實(shí)質(zhì)相同”。(a)本文中使用的“參考序列”是用作序列比較基礎(chǔ)的確定序列。參考序列可以是具體序列的子集或整體;例如作為全長cDNA或基因序列的一部分,或完整的cDNA或基因序列。(b)本文中使用的“比較窗口”指代連續(xù)的和具體的多核苷酸序列的片段,其中,為了兩條序列的最佳比對,比較窗口中的多核苷酸序列相比參考序列(其不包含添加或缺失)可包括添加或缺失(即,空位)。一般而言,比較窗口的長度至少是20個(gè)連續(xù)的核苷酸,任選可以是30、40、50、100個(gè)或更長。本領(lǐng)域技術(shù)人員理解,為了避免由于多核苷酸序列中包含空位而與參考序列高度相似,通常引入空位罰分,并從匹配數(shù)中減去。用于比較的序列比對方法是本領(lǐng)域普遍已知的。因而,可以使用數(shù)學(xué)算法實(shí)現(xiàn)確定任何兩條序列之間的百分比同一性。優(yōu)選的,此類數(shù)學(xué)算法的非限制性實(shí)例是Myers和Miller, 1988的算法;Smith等人,1981的局部同源性算法;Needleman和Wunsch 1970的同源性比對算法;Pearson和Lipman 1988的查詢相似性方法;Karlin和Altschul, 1990的算法,Karlin和Altschul, 1993中修飾的算法。可以利用計(jì)算機(jī)執(zhí)行這類數(shù)學(xué)算法,用于比較序列,來確定序列同一性。此類執(zhí)行法包括但不限于PC/Gene程序中的CLUSTAL(可獲得自Intelligenetics, MountainView, Calif.) ;ALIGN 程序(2. 0 版)!Wisconsin Genetics 軟件包,第 8 版中的 ALIGN程序(2. 0 版)和 GAP、BESTFIT、BLAST、FASTA 和 TFASTA (可獲得自 Genetics ComputerGroup (GCG), 575Science Drive, Madison, Wis. ,USA)??梢允褂媚J(rèn)參數(shù)實(shí)施利用這些程序的比對。CLUSTAL 程序是詳細(xì)描述的(Higgins 1988,1989 ;Corpet 1988 ;Huang 1992 ;Pearson 1994)。ALIGN程序是基于Myers和Miller,見上文的算法的。Altschul等人,1990的BLAST程序是基于Karlin和Altschul,見上文的算法。優(yōu)選使用Clustal W算法實(shí)施多重比對(即,比對2條以上的序列)(Thompson 1994 ;例如,在軟件VectorNTI ,第9版;Invitrogen Inc.),使用默認(rèn)設(shè)定的評分矩陣BL0SUM62MT2 (空位開發(fā)罰分15/19,空位延伸罰分6. 66/0. 05 ;空位分離罰分范圍8 ;比對延遲的%同一性40 ;使用殘基特異性空位和親水殘基空位)。
進(jìn)行BLAST分析的軟件是通過美國國立生物技術(shù)信息中心(http://www.ncbi.nlm. nih. gov/)公眾可獲得的。該算法涉及首先通過鑒別查詢序列中長度W的短字節(jié),來鑒別高分序列對(HSP),該字節(jié)當(dāng)與數(shù)據(jù)庫序列中相同長度的字節(jié)比對時(shí),是匹配的或滿足某些正值的閾值分?jǐn)?shù)T。T被稱為相鄰字節(jié)分?jǐn)?shù)閾值(Altschul 1990)。以這些初步的相鄰字節(jié)命中為種子,發(fā)動(dòng)查詢,發(fā)現(xiàn)包含它們的更長的HSP。然后,沿著每條序列的兩個(gè)方向延伸該字節(jié)命中,只要可以增加累積的比對分?jǐn)?shù)。對于核苷酸序列,使用參數(shù)M(—對匹配殘基的回報(bào)分?jǐn)?shù);總是> 0)和N(錯(cuò)配殘基的罰分;總是< 0)計(jì)算累積分?jǐn)?shù)。對于氨基酸序列,使用評分矩陣來計(jì)算累積分?jǐn)?shù)。當(dāng)累積的比對分?jǐn)?shù)從其最大達(dá)到的值跌落X的量,或者當(dāng)累積分?jǐn)?shù)由于積累一個(gè)或多個(gè)負(fù)分殘基比對而變成零或低于零,或者當(dāng)達(dá)到任一條序列的末端時(shí),停止兩個(gè)方向的字節(jié)延伸。除計(jì)算百分比序列同一性外,BLAST算法還實(shí)施兩條序列之間的相似性統(tǒng)計(jì)學(xué)分析(參見例如,KarlinMltschul (1993))。BLAST算法提供的一種相似性測量是最小總或然性(P(N)),其提供了對兩條核苷酸或氨基酸序列之間偶然發(fā)生匹配的可能性的提示。例如,如果在測試核酸序列與參照核酸序列的比較中,最小總或然性小于約0. I,更優(yōu)選小于約0. 01,最優(yōu)選小于約0. 001,則認(rèn)為測試核酸序列與參考序列是相似的。為了獲得出于比較目的的空位比對,可以利用Gapped BLAST(在BLAST 2. 0中),如Altschul等人,1997所述??蛇x的,可以使用PSI-BLAST(在BLAST 2. 0中)實(shí)施互作查詢,來檢測分子之間的遠(yuǎn)距離關(guān)系。參見Altschul等人,見上文。當(dāng)利用BLAST、GappedBLAST、PSI-BLAST時(shí),可以使用各程序的默認(rèn)參數(shù)(例如BLASTN用于核苷酸序列,BLASTX用于蛋白質(zhì))。BLASTN程序(用于核苷酸序列)使用字節(jié)長度(W) 11、期望值(E) 10、截留100、M = 5、N = -4,和比較兩條鏈,作為默認(rèn)。對于氨基酸序列,BLASTP程序使用字節(jié)長度(W) 3、期望值(E) 10和BL0SUM62評分矩陣作為默認(rèn)(參見Henikoff&Henikoff,1989)。參見http://www. ncbi. nlm. nih. gov。還可以通過目測手動(dòng)實(shí)施比對。為了本發(fā)明的目的,優(yōu)選使用BlastN程序(I. 4. 7版或更新版)及其默認(rèn)參數(shù)(字節(jié)長度(W) 11、期望值(E) 10、截留100、M = 5、N = -4,和比較兩條鏈)或任何等價(jià)的程序,來進(jìn)行核苷酸序列的比較,確定與具體的核苷酸序列(例如,本文公開的啟動(dòng)子序列)的百分比序列同一性?!暗葍r(jià)的程序”意指任何這樣的序列比較程序,當(dāng)與優(yōu)選程序所產(chǎn)生的相應(yīng)比對比較時(shí),該程序?qū)τ谌魏蝺蓷l探討的序列,產(chǎn)生的比對具有相同的核苷酸或氨基酸殘基匹配,和相同的百分比序列同一性。為了本發(fā)明的目的,優(yōu)選使用BlastP程序(L 4. 7版或更新版)及其默認(rèn)參數(shù)(字節(jié)長度(W)3、期望值(E) 10 和 BL0SUM62 評分矩陣(Henikoff&Henikoff,1989);參見http://www. ncbi. nlm. nih. gov)或任何等價(jià)的程序,來進(jìn)行多肽或氨基酸序列的比較,確定與具體的多肽或氨基酸序列的百分比序列同一性/同源性?!暗葍r(jià)的程序”意指任何這樣的序列比較程序,當(dāng)與優(yōu)選程序所產(chǎn)生的相應(yīng)比對比較時(shí),該程序?qū)τ谌魏蝺蓷l探討的序列,產(chǎn)生的比對具有相同的核苷酸或氨基酸殘基匹配,和相同的百分比序列同一性。(C)本文中使用的“序列同一性”或“同一性”在兩條核酸或多肽序列的上下文中指,當(dāng)比對具體比較窗口的最大對應(yīng)程度時(shí),兩條序列中的殘基是相同的。當(dāng)序列同一性 的百分比用于指蛋白質(zhì)時(shí),應(yīng)認(rèn)識(shí)到不相同的殘基位置通常是由于保守氨基酸取代而不同的,其中氨基酸殘基被具有相似化學(xué)特性(例如,電荷或疏水性)的其他氨基酸殘基取代,因此不改變分子的功能特性。當(dāng)序列以保守取代而不同時(shí),可以上調(diào)百分比序列同一性,校正取代的保守性質(zhì)。由此類保守性取代而不同的序列被稱為具有“序列相似性”或“相似性”。進(jìn)行該調(diào)節(jié)的手段是本領(lǐng)域技術(shù)人員普遍已知的。典型的,這涉及將保守性取代按部分而非完全錯(cuò)配來打分,從而增加了百分比序列同一性。因而,例如,當(dāng)相同的氨基酸得分為1,非保守性取代得分為0時(shí),保守性取代的得分在0和I之間。保守性取代的評分按例如程序 PC/GENE (Intelligenetics, Mountain View, Calif.)中執(zhí)行的計(jì)算。(d)本文中使用的“百分比序列同一性”意指在比較窗口比較兩條最佳比對的序列所確定的值,其中對于兩條序列的最佳比對,相比參考序列(其不包含添加或缺失),比較窗口中的部分多核苷酸序列可包括添加或缺失(即,空位)。百分比如下計(jì)算,通過確定兩條序列中存在相同核酸堿基或氨基酸殘基的位置數(shù),產(chǎn)生匹配位置數(shù),將匹配位置數(shù)除以比較窗口中的位置總數(shù),并將結(jié)果乘以100,得到百分比序列同一性。(e)術(shù)語多核苷酸序列“實(shí)質(zhì)相同”意指多核苷酸包括這樣的序列,使用所述比對程序之一,利用標(biāo)準(zhǔn)參數(shù)與參考序列比較,該序列具有至少38%,例如39%、44%,46%,48%,50%,52%,54%,56%,58%,60%,62%,64%,65%,66%,67%,68%,69%、70%、71%、72%、73%、74%、75%、76%、77%、78%或 79%,優(yōu)選至少 80%、81 %、82%、83%、84%、85%、86%、87%、88% 或 89%,更優(yōu)選至少 90 %、91 %、92 %、93 % 或94%,和最優(yōu)選至少95%、96%、97%、98%或99%序列同一性。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,通過考慮密碼子簡并性、氨基酸相似性、讀碼框位置等,可以恰當(dāng)?shù)恼{(diào)節(jié)這些值,以確定由兩條核苷酸序列編碼的蛋白質(zhì)的相應(yīng)的同一性。出于這些目的,氨基酸序列基本相同通常意指至少38%、50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%、95%,和最優(yōu)選至少98%序列同一性。核苷酸序列基本相同的另一種指針(indication)是如果兩個(gè)分子彼此在嚴(yán)緊條件下(見下文)雜交。一般而言,嚴(yán)緊條件選自在定義的離子強(qiáng)度和PH下,比具體序列的熱融點(diǎn)(Tm)低約5°C。然而,嚴(yán)緊條件涵蓋了約1°C至約20°C的溫度范圍,取決于本文另外限定的理想的嚴(yán)緊程度。如果其編碼的多肽基本相同,則在嚴(yán)緊條件下彼此不雜交的核酸仍然是基本相同的。這可以在使用遺傳密碼允許的最大密碼子簡并性所產(chǎn)生的核酸拷貝中發(fā)生。兩條核酸序列基本相同的一個(gè)指針是當(dāng)?shù)谝缓怂峋幋a的多肽與第二核酸編碼的多肽免疫學(xué)交叉反應(yīng)時(shí)。(ii)在多肽條件下,術(shù)語“基本相同”表示肽包括這樣的序列,該序列在具體的比較窗口中,與參考序列具有至少38%,例如39%,40%,42%,44%,46%,48%,50%,52%,54%,56%,58%,60%,62%,64%,65%,66%,67%,68%,69%,70%,71 %,72%,73%,74%、75%、76%、77%、78% 或 79%,優(yōu)選 80 %、81 %、82 %、83 %、84 %、85 %、86 %、87 %、88% 或 89%,更優(yōu)選至少 90%、91%、92%、93%或94%,和最優(yōu)選95%、96%、97%、98%或99%序列同一性。優(yōu)選的,使用Needleman和Wunsch (1970)的同源性比對算法進(jìn)行最佳比對。兩條肽序列基本相同的指針是一種肽與針對第二種肽的抗體免疫學(xué)交叉反應(yīng)。因而,例如當(dāng)兩種肽僅以保守性取代而不同時(shí),肽與第二種肽是基本相同的。對于序列比較,通常以一條序列作為參考序列,將測試序列與之比較。當(dāng)使用序列比較算法時(shí),測試序列和參考序列都被輸入計(jì)算機(jī),需要時(shí)指定序列坐標(biāo),并指定序列算法 程序參數(shù)。然后,序列比較算法計(jì)算測試序列相對于參考序列的百分比序列同一性,基于所指定的程序參數(shù)。如上所示,兩條核酸序列基本相同的另一個(gè)指針是兩個(gè)分子彼此在嚴(yán)緊條件下雜交。詞組“特異性的雜交于”指當(dāng)序列存在于DNA或RNA的復(fù)雜混合物(例如,總細(xì)胞的)中時(shí),分子在嚴(yán)緊條件下只與特定的核苷酸序列結(jié)合、二聚體化或雜交。“實(shí)質(zhì)上結(jié)合”指在探針核酸和靶核酸之間的互補(bǔ)雜交,包括通過降低雜交基質(zhì)的嚴(yán)緊度可以容忍的微小錯(cuò)配,以實(shí)現(xiàn)理想的檢測靶核酸序列?!皣?yán)緊的雜交條件”和“嚴(yán)緊的雜交洗滌條件”在核酸雜交實(shí)驗(yàn)(例如Southern和Northern雜交)的上下文中,是序列依賴性的,并且在不同的環(huán)境參數(shù)下是不同的。Tm是50%的靶序列與完全匹配的探針雜交的溫度(在定義的離子強(qiáng)度和pH下)。特異性通常是雜交后洗滌的函數(shù),其關(guān)鍵的因子是最終洗滌溶液的離子強(qiáng)度和溫度。對于DNA-DNA雜合體,Tm可以由Meinkoth和Wahl, 1984的等式近似得到Tm = 81. 5°C +16. 6 (Iog10M) +0. 41(% GC)-0. 61(% form) -500/L其中,M是單價(jià)陽離子的摩爾濃度,% GC是鳥苷和胞苷核苷酸在DNA中的百分t匕,% form是甲酰胺在雜交溶液中的百分比,而L是雜合體按堿基對計(jì)的長度。每1%的錯(cuò)配降低Tm約1°C ;因而可以調(diào)節(jié)Tm、雜交和/或洗滌條件,來雜交具有理想同一性的序列。例如,如果查找具有> 90%同一性的序列,則可以減少Tm 10°C。一般而言,選擇的嚴(yán)緊條件比特定序列與其互補(bǔ)體在定義的離子強(qiáng)度和PH下的熱熔點(diǎn)I低約5°C。然而,嚴(yán)格的嚴(yán)緊條件可以使用在比熱熔點(diǎn)I低約1、2、3或4°C下雜交和/或洗滌;中等的嚴(yán)緊條件可以使用在比熱熔點(diǎn)I低約6、7、8、9或10°C下雜交和/或洗滌;低嚴(yán)緊條件可以使用在比熱熔點(diǎn)I低約11、12、13、14、15或20°C下雜交和/或洗滌。使用該等式,雜交和洗滌組成,以及理想的T,本領(lǐng)域技術(shù)人員將理解雜交和/或洗滌溶液的嚴(yán)緊條件中的變化是被內(nèi)在描述的。如果理想的錯(cuò)配程度導(dǎo)致低于45°C (含水溶液)或32°C (甲酰胺溶液)的T,則優(yōu)選的增加SSC濃度,使得可以使用更高的溫度。對核酸雜交的廣泛性指導(dǎo)可見于Tijssen,1993中。一般而言,高嚴(yán)緊的雜交和洗滌條件選擇比特定序列在定義的離子強(qiáng)度和pH下的熱熔點(diǎn)Tm低約5°C。高嚴(yán)緊的洗滌條件的實(shí)例是在72 °C的0. 15M NaCl中約15分鐘。嚴(yán)緊的洗滌條件的實(shí)例是在65°C的0. 2x SSC中洗滌15分鐘(參見,Sambrook,見上文,關(guān)于SSC緩沖液的描述)。通常,在高嚴(yán)緊的洗滌之前進(jìn)行低嚴(yán)緊的洗滌,以去除背景探針信號(hào)。對例如超過100個(gè)核苷酸的二聚體的示例性中等嚴(yán)緊的洗滌是在45°C的Ix SSC中15分鐘。對例如超過100個(gè)核苷酸的二聚體的示例性低嚴(yán)緊的洗滌是在40°C的4至6x SSC中15分鐘。對于短的探針(例如,約10至50個(gè)核苷酸),嚴(yán)緊條件典型的涉及在pH 7.0至8. 3下,少于約
I.5M的鹽濃度,更優(yōu)選約0. 01至I. OM的Na離子(或其他鹽)濃度,溫度典型的是至少約300C,而對于長探針(例如,> 50個(gè)核苷酸)是至少約60°C。還可以用添加破壞穩(wěn)定的試劑(例如甲酰胺)來實(shí)現(xiàn)嚴(yán)緊的條件。一般而言,信號(hào)噪聲比是特定雜交測定中不相關(guān)探針?biāo)^察到的2X(或更高),提示檢測到特異性雜交。如果編碼的蛋白質(zhì)是基本相同的,即使在嚴(yán)緊條件下彼此不雜交的核酸也仍然是基本相同。這發(fā)生在例如當(dāng)使用遺傳密碼允許的最大密碼子簡并性產(chǎn)生核酸拷貝時(shí)。非常嚴(yán)緊的添加選擇是與特定的探針的Tm相等的。對在濾膜上具有超過100個(gè)互補(bǔ)殘基的互補(bǔ)核酸的高嚴(yán)緊雜交條件的實(shí)例是50%甲酰胺,例如在37°C下,在50%甲酰胺、IM NaClU% SDS中雜交,和在60至65°C下在0. Ix SSC中洗滌。示例性低嚴(yán)緊條件包 括在37°C下,用30至35%甲酰胺、IM NaClU% SDS(十二烷基磺酸鈉)的緩沖溶液雜交,在50至55°C下,在Ix至2x SSC(20X SSC = 3. OM NaCl/0. 3M檸檬酸三鈉)中洗滌。示例性中等嚴(yán)緊添加包括在37°C下,在40至45%甲酰胺、I. OMNaClU % SDS中雜交,和在55至60°C下,在0. 5x至Ix SSC中洗滌。以下是可用于克隆核苷酸序列的雜交/洗滌條件組合的實(shí)例,該核苷酸序列與本發(fā)明的參照核苷酸序列是基本相同的;參照核苷酸序列優(yōu)選在50°c的7%十二烷基磺酸鈉(SDS)、0. 5M NaPO4UmM EDTA中與參照核苷酸序列雜交,在50°C的2X SSC, 0. 1% SDS中洗滌(非常低的嚴(yán)緊條件),更理想的是在50°C的7%十二烷基磺酸鈉(SDS)、0. 5M NaPO4UmMEDTA中雜交,用50°C的IX SSC, 0. I % SDS洗滌(低嚴(yán)緊條件),更理想的是在50°C的7%十二烷基磺酸鈉(SDS)、0. 5M NaPO4UmMEDTA 中雜交,用 50。。的 0. 5X SSC,0. 1% SDS 洗滌(中等嚴(yán)緊條件),優(yōu)選在50°C的7%十二烷基磺酸鈉(SDS)、0. 5M NaPO4UmM EDTA中雜交,用50°C的0. IX SSC, 0. 1% SDS洗滌(高嚴(yán)緊條件),更優(yōu)選在50°C的7%十二烷基磺酸鈉(SDS)、0. 5M NaPO4UmM EDTA 中雜交,用 65。。的 0. IX SSC, 0. 1% SDS 洗滌(非常高嚴(yán)緊條件)術(shù)語“可讀框”和“0RF”指由編碼序列的翻譯起始和終止密碼子之間編碼的氨基酸序列。術(shù)語“起始密碼子”和“終止密碼子”指編碼序列中的3個(gè)相鄰核苷酸的單元(“密碼子”),分別說明蛋白質(zhì)合成(mRNA翻譯)的起始和鏈終止?!熬幋a”或“編碼序列”指排除了非編碼序列的、編碼具體氨基酸序列的DNA或RNA序列。它可構(gòu)成“未間斷的編碼序列”,即缺少內(nèi)含子的,例如在cDNA中,或者它可以包括一個(gè)或多個(gè)由恰當(dāng)?shù)募羟羞B接而界定的內(nèi)含子?!皟?nèi)含子”是包含在初級(jí)轉(zhuǎn)錄物中的RNA序列,但通過細(xì)胞內(nèi)的RNA切割和再連接而被去除,產(chǎn)生可翻譯成蛋白質(zhì)的成熟mRNA?!坝行нB接”或“功能性連接”優(yōu)選的指核酸序列與單個(gè)核酸片段的關(guān)聯(lián),使得一個(gè)的功能受另一個(gè)的影響。例如,如果兩條序列的放置使得調(diào)控DNA序列影響編碼DNA序列的表達(dá)(即,編碼序列或功能性RNA處于啟動(dòng)子的轉(zhuǎn)錄控制下),則認(rèn)為調(diào)控DNA序列是與編碼RNA或多肽的DNA序列“有效的連接”或“相關(guān)聯(lián)的”。編碼序列可以在正義或反義方向上與調(diào)控序列有效的連接。如本文中使用的,術(shù)語“異源DNA序列”、“外源DNA片段”或“異源核酸”都指起源自特定宿主細(xì)胞以外的來源的序列,或者,如果來自相同的來源,則根據(jù)其原始形態(tài)得到修飾的。因而,宿主細(xì)胞中的異源基因包括對特定宿主細(xì)胞而言是內(nèi)源的基因,但其已通過例如使用DNA改組而進(jìn)行了修飾。術(shù)語還包括天然存在的DNA序列的非天然存在的多拷貝。因而,該術(shù)語指對細(xì)胞是外來的或異源的DNA片段,或者對細(xì)胞是同源的,但其在宿主細(xì)胞核酸中處于該元件原始不可見的位置。表達(dá)外源DNA片段來產(chǎn)生外源多肽?!巴础盌NA序列是與其導(dǎo)入的宿主細(xì)胞天然相關(guān)的DNA序列。“同源”在核苷酸序列同一性的上下文中指兩個(gè)核酸分子的核苷酸序列之間,或兩個(gè)蛋白質(zhì)分子的氨基酸序列之間的相似性。此類同源性的評估由嚴(yán)緊條件下的DNA-DNA或DNA-RNA雜交來提供,是本領(lǐng)域技術(shù)人員普遍理解的(如Haines和Higgins (編著),Nucleic Acid Hybridization, IRL Press, Oxford, U. K.所述),或由兩個(gè)核酸或蛋白質(zhì)之間的序列相似性比較來提供。 “載體”定義為尤其包括雙鏈或單鏈線狀或環(huán)狀形式的任何質(zhì)粒、粘粒、噬菌體或農(nóng)桿菌二元核酸分子,可以是能或不能自我傳播或固定的,并可以通過整合到細(xì)胞基因組中或以染色體外存在來轉(zhuǎn)化原核或真核宿主(例如,有復(fù)制起點(diǎn)的自主復(fù)制質(zhì)粒)。具體包括了穿梭載體,其意指天然的或按設(shè)計(jì)的,能夠在兩種不同的宿主生物體中復(fù)制的DNA載體,其可以選自放線菌和相關(guān)的物種、細(xì)菌和真核生物(例如,高等植物、哺乳動(dòng)物、酵母或真菌細(xì)胞)。優(yōu)選的,載體中的核酸處于恰當(dāng)?shù)膯?dòng)子或其他調(diào)控元件的控制下,或與其有效的連接,用于在宿主細(xì)胞如微生物(例如細(xì)菌)或植物細(xì)胞中轉(zhuǎn)錄。載體可以是在多個(gè)宿主中發(fā)揮功能的雙功能表達(dá)載體。在基因組DNA的情況下,其可以含有自身的啟動(dòng)子或其他調(diào)控元件,在cDNA的情況下,其可以處于恰當(dāng)?shù)膯?dòng)子或其他調(diào)控元件的控制下,用于在宿主細(xì)胞中表達(dá)。“克隆載體”通常含有一種或少數(shù)的限制性內(nèi)切核酸酶識(shí)別位點(diǎn),該位點(diǎn)中可以以可確定的方式插入外源性DNA序列,而不喪失載體的基本生物學(xué)功能,也含有標(biāo)志物基因,其適合用于鑒別和選擇用該克隆載體轉(zhuǎn)化的細(xì)胞。標(biāo)志物基因典型的包括提供四環(huán)素抗性、潮霉素抗性、卡那霉素抗性、鏈霉素抗性或青霉素抗性的基因?!稗D(zhuǎn)基因”或“轉(zhuǎn)基因的”指已通過轉(zhuǎn)化導(dǎo)入基因組中,并穩(wěn)定或瞬時(shí)維持的。轉(zhuǎn)基因可包括例如對待轉(zhuǎn)化的特定植物的基因是異源或同源的基因。此外,轉(zhuǎn)基因可包括插入到非天然的生物體中的天然基因,或嵌合基因。術(shù)語“內(nèi)源基因”指在生物體的基因組的天然位置上的天然基因。“外源”基因指在宿主生物體并非正??梢姷?,但通過基因轉(zhuǎn)移導(dǎo)入的基因。術(shù)語“轉(zhuǎn)化”指將核酸片段轉(zhuǎn)移到宿主細(xì)胞基因組中。含有轉(zhuǎn)化的核酸片段的宿主細(xì)胞被稱為“轉(zhuǎn)基因”細(xì)胞,包含“轉(zhuǎn)基因”細(xì)胞的生物體被稱為“轉(zhuǎn)基因生物”。轉(zhuǎn)化植物和植物細(xì)胞的方法的實(shí)例包括農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化(De Blaere 1987)和微粒轟擊技術(shù)(US4,945,050)??梢酝ㄟ^本領(lǐng)域技術(shù)人員普遍已知的方法從轉(zhuǎn)基因細(xì)胞再生完整的植物(參見例如 Fromm 1990)。“轉(zhuǎn)化的”、“轉(zhuǎn)基因的”和“重組的”指這樣的宿主生物,例如其中已經(jīng)導(dǎo)入了異源核酸分子的細(xì)菌或植物。核酸分子可以穩(wěn)定的整合到基因組中,這是本領(lǐng)域普遍已知的和已公開的(Sambrook 1989 ;Innis 1995 ;Gelfand 1995 ;Innis&Gelfand 1999)。例如,“轉(zhuǎn)化的”、“轉(zhuǎn)基因的”和“重組的”植物或愈傷組織已經(jīng)歷了轉(zhuǎn)化過程,并含有整合到其基因組中的外源基因。術(shù)語“未轉(zhuǎn)化的”指沒有經(jīng)歷轉(zhuǎn)化過程的正常植物?!八矔r(shí)轉(zhuǎn)化的”指已經(jīng)導(dǎo)入了轉(zhuǎn)基因和外源DNA的細(xì)胞(例如,通過農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化或微粒轟擊的方法),但沒有進(jìn)行穩(wěn)定維持的選擇?!胺€(wěn)定轉(zhuǎn)化的”指在轉(zhuǎn)化后,已經(jīng)在選擇基質(zhì)上進(jìn)行了選擇和再生的細(xì)胞?!叭旧w整合的”指外源基因或DNA構(gòu)建體通過共價(jià)鍵整合到宿主基因組中。當(dāng)基因不是“染色體整合的”時(shí),其可以是“瞬時(shí)表達(dá)的”。基因的瞬時(shí)表達(dá)指這樣的基因的表達(dá),該基因沒有整合到宿主染色體中,但作為自主復(fù)制質(zhì)?;虮磉_(dá)盒的一部分,或例如作為另一個(gè)生物學(xué)系統(tǒng)(例如病毒)的一部分,獨(dú)立的發(fā)揮功能?!斑z傳穩(wěn)定的”和“可遺傳的”指在植物中穩(wěn)定維持的,或在后續(xù)世代中被后代穩(wěn)定繼承的染色體整合型遺傳元件?!稗D(zhuǎn)基因植物”是具有一個(gè)或多個(gè)這樣的植物細(xì)胞的植物,該植物細(xì)胞含有后文在 詳細(xì)描述中定義的表達(dá)載體?!俺醮D(zhuǎn)化體”和“TO世代”指與初始轉(zhuǎn)化的組織遺傳世代相同的轉(zhuǎn)基因植物(即,自轉(zhuǎn)化后,沒有經(jīng)歷減數(shù)分裂和受精過程)?!按未D(zhuǎn)化體”和“Tl、T2、T3等世代”指通過一次或多次減數(shù)分裂和受精循環(huán),源自初代轉(zhuǎn)化體的轉(zhuǎn)基因植物。其可以來源自初代或次代轉(zhuǎn)化體的自體受精,或者初代或次代轉(zhuǎn)化體與其他轉(zhuǎn)化或未轉(zhuǎn)化植物的雜交?!爸参锝M織”包括分化或未分化的組織或植物,包括但不限于根、莖、枝條、葉、花粉、種子、腫瘤組織和各種類型的細(xì)胞和培養(yǎng)物,例如單細(xì)胞、原生質(zhì)體、胚和愈傷組織。植物組織可以在植物中,或在器官、組織或細(xì)胞培養(yǎng)物中。術(shù)語“改變的植物性狀”意指轉(zhuǎn)基因植物相對于野生型或非轉(zhuǎn)基因植物宿主的任何表型的或基因型的改變。詞語“植物”指任何植物,特別是農(nóng)業(yè)上有用的植物(例如,種子植物),“植物細(xì)胞”是植物的結(jié)構(gòu)和生理學(xué)單位,其包括細(xì)胞壁,但也指原生質(zhì)體。植物細(xì)胞可以是分離的單細(xì)胞或培養(yǎng)細(xì)胞的形式,或者作為更高級(jí)組織結(jié)構(gòu)的單元的一部分,例如植物組織或分化成某結(jié)構(gòu)的植物器官,該結(jié)構(gòu)可存在于植物發(fā)育的任何階段。此類結(jié)構(gòu)包括一種或多種的植物器官,包括但不限于果實(shí)、枝條、莖、葉、花瓣等。優(yōu)選的,術(shù)語“植物”包括完整的植物、枝條的營養(yǎng)器官/結(jié)構(gòu)(例如,葉、莖和塊莖)、根、花和花器官/結(jié)構(gòu)(例如,苞片、萼片、花瓣、雄蕊、心皮、花粉囊和胚珠)、種子(包括胚、胚乳和種皮)和果實(shí)(成熟的卵)、植物組織(例如,維管組織、基本組織等)和細(xì)胞(例如,保衛(wèi)細(xì)胞、卵細(xì)胞、毛狀體(trichomes)等),及植物的后代??捎糜诒景l(fā)明方法中的植物的類別一般是可接受轉(zhuǎn)化技術(shù)的所有高等和低等植物的類別,包括被子植物(單子葉和雙子葉植物)、裸子植物、蕨類植物和多細(xì)胞藻類。包括多種倍性水平的植物,包括非整倍體、多倍體、二倍體、單倍體和半合子,本發(fā)明的范圍內(nèi)包括了植物界的高等和低等植物的所有屬和種。進(jìn)一步包括了成熟的植物、種子、枝條和幼苗,以及源自它們的部分、繁殖材料(例如種子和果實(shí))和培養(yǎng)物,例如細(xì)胞培養(yǎng)物。發(fā)明詳述
本發(fā)明因而提供了分離的核酸分子,該核酸分子包含植物核苷酸序列,該序列指導(dǎo)與其有效連接的核酸片段在植物細(xì)胞中的種子優(yōu)先的或種子特異性的轉(zhuǎn)錄。具體而言,本發(fā)明提供了用于調(diào)控目的多核苷酸的種子特異性表達(dá)的表達(dá)盒,該表達(dá)盒包含選自以下的轉(zhuǎn)錄調(diào)控核苷酸序列(a) SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、或 18 的核酸序 列,或其變體;(b)與 SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、或 18 中的任
一個(gè)所示的核酸序列至少80%相同的核酸序列;(c)在嚴(yán)緊條件下與SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、
或18的核酸序列雜交的核酸序列;(d)與位于 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35
或36的可讀框序列上游的核酸序列雜交的核酸序列;(e)與位于可讀框序列上游的核酸序列雜交的核酸序列,其中該可讀框序列編碼SEQ ID NO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53 或 54 的氨基酸序列;(f)與位于可讀框序列上游的核酸序列雜交的核酸序列,其中該可讀框序列與SEQID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35 或 36 的可讀框序列至少
80%相同,且其中該可讀框編碼種子蛋白質(zhì);(g)與位于可讀框上游的核酸序列雜交的核酸序列,其中該可讀框編碼與SEQ IDNO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53 或 54 的氨基酸序列至少
80 %相同的氨基酸序列,其中該可讀框編碼種子蛋白質(zhì);(h)核酸序列,其可以自 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36所示的可讀框序列的第一外顯子出發(fā),在基因組DNA上,通過5'基因組步行或熱不對稱交錯(cuò)聚合酶鏈?zhǔn)椒磻?yīng)(TAIL-PCR)獲得;以及(i)核酸序列,其可以自可讀框序列的第一外顯子出發(fā),在基因組DNA上,通過5'基因組步行或TAIL-PCR獲得,其中該可讀框序列與SEQID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36所示的可讀框序列至少80%相同,且其中該可讀框編碼種子蛋白質(zhì);以及(j)核酸序列,其可以自可讀框序列的第一外顯子出發(fā),在基因組DNA上,通過5'基因組步行或TAIL-PCR獲得,其中該可讀框序列編碼與SEQ ID NO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53或54所示的可讀框編碼的氨基酸序列至少80%相同的氨基酸序列,且該可讀框編碼種子蛋白質(zhì)。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 81的106至1612位的ATG (1610-1612)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1507,125至約1507,250至約1507,400至約1507,600至約1507個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000,或100至500,和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1507,125至約1507,250至約1507,400至約1507,600至約1507個(gè)核苷酸)的約25至3000的連續(xù)片段,與位于SEQ ID NO 81的1610-1612位的ATG上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000,或100至500,和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1507,125至約1507,250至約1507,400至約1507,600至約1507個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表22所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO 9中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 82的825至1735位的ATG (1748-1750)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約910,125至約910,250至約910,400至約910,600至約910個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約910,125至約910,250至約910,400至約 910,600至約910個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 82的825至1735位的ATG(1748-1750)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約910,125至約910,250至約910,400至約910,600至約910個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表23中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :10中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 83的44至1174位的ATG (1185-1160)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1131,125至約1131,250至約1131,400至約1131,600至約1131個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1131,125至約1131,250至約1131,400至約1131,600至約1131個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 83的44至1174位的ATG (1185-1160)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1131,125 至約 1131,250 至約 1131,400 至約 1131,600 至約 1131 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表24中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :11中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 84的52至614位的ATG (624-626)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約563,125至約563,250至約563,400至約563個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。
在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約563,125至約563,250至約563,400至約563個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 84的52至614位的ATG (624-626)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約563,125至約563,250至約563,400至約563個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表25中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :12中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 80的46至1233位的ATG (1234-1236)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1188,125至約1188,250至約1188,400至約1188,600至約1188個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。
在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1188,125至約1188,250至約1188,400至約1188,600至約1188個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 80的46至1233位的ATG (1234-1236)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1188,125 至約 1188,250 至約 1188,400 至約 1188,600 至約 1188 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表26中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :8中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ IDNO 75的435至2379位的ATG(2428-2430)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1945,125至約1945,250至約1945,400至約1945,600至約1945個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1945,125至約1945,250至約1945,400至約1945,600至約1945個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 75的435 至 2379 位的 ATG(2428-2430)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60 至約 1945,125 至約 1945,250 至約 1945,400 至約 1945,600 至約 1945 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表27中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :3中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ IDNO 85的4至994位的ATG (996-998)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約991,125至約991,250至約991,400至約991,600至約991個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約991,125至約991,250至約991,400至約991,600至約991個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 85的4至994位的ATG (996-998)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約991,125至約991,250至約991,400至約991,600至約991個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表28中所 示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO 13中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 86的I至2519位的ATG (2511-2513)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約2519,125至約2519,250至約2519,400至約2519,600至約2519個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約2519,125至約2519,250至約2519,400至約2519,600至約2519個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 86的I至2519位的ATG (2511-2513)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 2519,125 至約 2519,250 至約 2519,400 至約 2519,600 至約 2519 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表29中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID N0:14中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 76的47至558位的ATG (678-680)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,0至約2500,60至約512,125至約512,250至約512,400至約512個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約512,125至約512,250至約512,400至約512個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 76的47至558位的ATG (678-680)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約512,125至約512,250至約512,400至約512,600至約512個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表30中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :4中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ IDN0:87的I至1264位的ATG (1341-1343)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1264,125至約1264,250至約1264,400至約1264,600至約1264個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1264,125至約1264,250至約1264,400至約1264,600至約1264個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 87的I 至1264位的ATG (1341-1343)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1264,125 至約 1264,250 至約 1264,400 至約 1264,600 至約 1264 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表49中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID N0:15中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 78的I至1355位的ATG (1357-1359)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1355,125至約1355,250至約1355,400至約1355,600至約1355個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1355,125至約1355,250至約1355,400至約1355,600至約1355個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO :78的I至1355位的ATG (1357-1359)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1355,125 至約 1355,250 至約 1355,400 至約 1355,600 至約 1355 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表50中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO 6中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 88的I至623位的ATG(695-697)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約623,125至約623,250至約623,400至約623,500至約623個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。
在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約623,125至約623,250至約623,400至約623,500至約623個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 88的I至623位的ATG (695-697)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約623,125至約623,250至約623,400至約623,500至約1355個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表51中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :16中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 89的700至2649位的ATG (2700-2702)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1950,125至約1950,250至約1950,400至約1950,600至約1950個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。 在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1950,125至約1950,250至約1950,400至約1950,600至約1950個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 89的700至2649位的ATG (2700-2702)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1950,125 至約 1950,250 至約 1950,400 至約 1950,600 至約 1950 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表52中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :17中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 73的I至1106位的ATG (1220-1222)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1106,125至約1106,250至約1106,400至約1106,600至約1106個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1106,125至約1106,250至約1106,400至約1106,600至約1106個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO :73的I至1106位的ATG (1220-1222)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1106,125 至約 1106,250 至約 1106,400 至約 1106,600 至約 1355 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表53中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO 1中所示的核酸序列,或其變體。
優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID N0:79的302至2242位的ATG (2303-2305)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約1941,125至約1941,250至約1941,400至約1941,600至約1941個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約1941,125至約1941,250至約1941,400至約1941,600至約1941個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO 79的302至2242位的ATG (2303-2305)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約 2500,60 至約 1941,125 至約 1941,250 至約 1941,400 至約 1941,600 至約 1355 個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表54中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :7中所示的核酸序列,或其變體。
優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 74的I至922位的ATG(923-925)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約922,125至約922,250至約922,400至約922,600至約922個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約922,125至約922,250至約922,400至約922,600至約922個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO :74的I至922位的ATG (923-925)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約922,125至約922,250至約922,400至約922,600至約1355個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表55中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :2中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO 77的I至698位的ATG(699-671)上游約25至3000的連續(xù)片段,包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約698,125至約698,250至約698,400至約698,500至約698個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約698,125至約698,250至約698,400至約698,500至約698個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO :77的I至698位的ATG (699-671)上游約25至3000的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括50至2000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約2500,60至約698,125至約698,250至約698,400至約698,500至約1355個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表56中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :5中所示的核酸序列,或其變體。優(yōu)選地,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子包括位于SEQ ID NO :196的656至658位的ATG上游約25至3500的連續(xù)片段,包括50至3000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約3500,60至約3000,125至約2500,250至約2300,400至約2000,600至約1700個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。在本發(fā)明的特定的實(shí)施方案中,該包括了 50至2000或100至500和至多1000或1500個(gè)連續(xù)核苷酸(例如,40至約2500,60至約922,125至約922,250至約922,400至約922,600至約922個(gè)核苷酸)的約25至3000的連續(xù)片段與位于SEQ ID NO :196的656至658位的ATG上游約25至3500的相應(yīng)的連續(xù)片段具有至少50%或60%,優(yōu)選至少70%或80%,更優(yōu)選至少90%和最優(yōu)選至少95%的核酸序列同一性,其中該相應(yīng)的連續(xù)片段包括 50至3000或100至500和至多1000或1500個(gè)連續(xù)的核苷酸,例如,40至約3500,60至約3000,125至約2500,250至約2300,400至約2000,600至約1700個(gè)核苷酸,其包括了基礎(chǔ)啟動(dòng)子區(qū)。上文定義的連續(xù)的核苷酸片段優(yōu)選包含一個(gè)或多個(gè)啟動(dòng)子基序,如表61中所示,優(yōu)選選自TATA框、GC框、CAAT框和轉(zhuǎn)錄起始位點(diǎn)。本發(fā)明的表達(dá)盒中包含的優(yōu)選的轉(zhuǎn)錄調(diào)控核苷酸序列具有如SEQ ID NO :18中所示的核酸序列,或其變體。在尤其優(yōu)選的實(shí)施方案中,該連續(xù)的核苷酸片段包含SEQ ID N0:18的核苷酸1440至2112,SEQ ID NO : 18的核苷酸1600至2112,甚至更優(yōu)選SEQ ID NO : 18的核苷酸1740至2112,和最優(yōu)選SEQ ID NO :18的核苷酸1740至1999。本發(fā)明還考慮源自如SEQID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18所示轉(zhuǎn)錄調(diào)控核苷酸序列的轉(zhuǎn)錄調(diào)控核苷酸序列。該轉(zhuǎn)錄調(diào)控核苷酸序列能夠(優(yōu)選在嚴(yán)緊條件下)與 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36所示可讀框的上游序列或其變體雜交,即與SEQ ID NO :1、2、3、4、5、6、7、8、9、10、
11、12、13、14、15、16、17或18所示轉(zhuǎn)錄調(diào)控核苷酸序列或其變體雜交。本文中,嚴(yán)緊雜交條件意指,在6x氯化鈉/檸檬酸鈉(SSC)中在約45 °C雜交,之后在 0. 2x SSC,0. 1% SDS 中在 53 至 65°C,優(yōu)選在 55°C、56°C、57°C、58°C、59°C、60°C、61°C、62°C、63°C、64°C或65°C進(jìn)行一個(gè)或多個(gè)洗滌步驟的條件。本領(lǐng)域技術(shù)人員知道這些雜交條件依據(jù)核酸種類以及例如是否存在有機(jī)溶劑,就溫度和緩沖液的濃度而言,可以是不同的?!耙话阈远x”章節(jié)中給出了嚴(yán)緊雜交條件的實(shí)例。此外,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列不僅可見于上述具有如SEQ ID NO :19,20,
21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或 36 所示核酸序列的可讀框的上游。而且,轉(zhuǎn)錄調(diào)控核苷酸序列也能夠在直向同源基因、旁系同源基因或同源基因(即,可讀框)的上游發(fā)現(xiàn)。因此,也優(yōu)選,由本發(fā)明的表達(dá)盒包含的轉(zhuǎn)錄調(diào)控核苷酸序列變體具有與可讀框序列的上游核酸序列雜交的核酸序列,其中該可讀框序列與SEQ ID NO :19、20、21、
22、23、24、25、26、27、28、29、30、31、32、33、34、35或 36 所示的序列至少 70%、更優(yōu)選地至少80%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同。該變體可讀框編碼的多肽具有SEQ ID NO :19、20、21、22、
23、24、25、26、27、28、29、30、31、32、33、34、35或36所示的可讀框所編碼的相應(yīng)多肽的生物活性。在本文中應(yīng)該被提到的是 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35 或 36 所示的可讀框編碼具有 SEQ ID NO :37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53或54所示的氨基酸序列的多肽,優(yōu)選地編碼種子蛋白。還優(yōu)選地,本發(fā)明的變體轉(zhuǎn)錄調(diào)控核苷酸序列是(i)自SEQ ID NO :19,20,21,
22、23、24、25、26、27、28、29、30、31、32、33、34、35 或 36 所示的可讀框序列、由 5'基因組步行或 TAIL-PCR 可獲得的,或(ii)自與 SEQ ID NO :19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36所示的可讀框至少80%相同的可讀框序列、由5'基因組步行或TAIL-PCR可獲得的。表達(dá)控制序列變體可以很容易由基因組步行技術(shù)或熱不對稱交錯(cuò)聚合酶鏈?zhǔn)椒磻?yīng)(TAIL-PCR)獲得,這些技術(shù)可以按Liu和Huang, Plant Molecular BiologyReporter, 1998, Vol. 16,頁 175 到 181,和本文參考文獻(xiàn),或 Liu 等人,The Plant Journal,1995,Vol. 8,頁457-463中所描述的方式、和本文參考文獻(xiàn)、利用例如可商業(yè)獲得的試劑盒來進(jìn)行。
對應(yīng)于本發(fā)明的核苷酸序列的合適的寡核苷酸長度可以是約30個(gè)核苷酸或更少(例如,9、12、15、18、20、21、22、23或24個(gè),或在9至30個(gè)之間的任何數(shù)目),該寡核苷酸在探測反應(yīng)或例如上述PCR擴(kuò)增反應(yīng)中用作引物。一般而言,特定的引物長度達(dá)14個(gè)核苷酸。為了最佳的特異性和成本效率,長度為16至24個(gè)核苷酸的引物是優(yōu)選的。本領(lǐng)域技術(shù)人員精通于設(shè)計(jì)用于例如PCR方法中的引物。需要時(shí),可以用本文公開的基因的限制性酶切片段作為探針,其長度可以是100或者甚至1000個(gè)核苷酸。本說明書中就SEQ ID NO :9所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表22中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :10所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表23中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO 11所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表24中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :12所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表25中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :8所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表26中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :3所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表27中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :13所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表28中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :14所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表29中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :4所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表30中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :15所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表49中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :6所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表50中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :16所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表51中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :17所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表52中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :I所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表53中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :7所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表54中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :2所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表55中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。 本說明書中就SEQ ID NO :5所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表56中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。本說明書中就SEQ ID NO :18所示的轉(zhuǎn)錄調(diào)控核苷酸序列提及的變體轉(zhuǎn)錄調(diào)控核苷酸序列優(yōu)選地包含表61中所列的至少10個(gè)、至少20個(gè)、至少30個(gè)或所有的序列基序。優(yōu)選的變體轉(zhuǎn)錄調(diào)控核苷酸序列的例子如SEQ ID NO :109至126以及127至144中所示。與相應(yīng)的轉(zhuǎn)錄調(diào)控核苷酸序列相比,上述變體(如SEQ ID NO :109至144)不包含起始密碼子(ATG) o 起始密碼子被 BVH(SEQ ID NOs :109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126)取代或被BVH加上位于任何兩個(gè)起始密碼子之間的終止密碼子(SEQ ID NOs :127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144)取代(根據(jù)IUPAC命名法B代表C或G或T,v代表A或C或G,H代表A或C或T)。因此,變體轉(zhuǎn)錄調(diào)控核苷酸序列可以通過如上所描述的對推定的起始密碼子進(jìn)行突變而獲得。本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列中的非必需序列可以被刪除而不顯著破壞所提到的特性。也可以利用例如PLACE程序("Plant Cis-acting Regulatory DNA Elements")(Hi go K 等(1999) Nucleic Acids Res 27 :1,297-300)的計(jì)算機(jī)程序(參見表 5)或BI0BASE 數(shù)據(jù)庫 “Transfac” (Biologische Datenbanken GmbH, Braunschweig),將表達(dá)調(diào)控核苷酸序列界定到特定的必需調(diào)控區(qū)域。利用這樣的方法,上述的轉(zhuǎn)錄調(diào)控核苷酸序列變體可以人為地產(chǎn)生。此外,突變核酸序列的程序?yàn)榧夹g(shù)人員所知,它包括例如使用與需要被突變的區(qū)域相比包含一個(gè)或多個(gè)突變(例如,在框架內(nèi)的位點(diǎn)特異性誘變)的寡核苷酸。典型地是利用具有約15至75或更多個(gè)核苷酸的引物,其中優(yōu)選約10至約25或更多個(gè)核苷酸殘基位于待修飾序列的兩側(cè)。該誘變方法的具體細(xì)節(jié)和操作程序?yàn)榧夹g(shù)人員所熟知(Kunkel 等(1987)Methods Enzymol 154 :367-382 ;Tomic 等(1990)Nucl Acids Res 12:1656 ;Upender 等(1995) Biotechniques 18(1) :29-30 ;U. S. Pat. No. 4,237,224)。誘變也可以通過用例如羥胺等誘變劑處理例如包含本發(fā)明轉(zhuǎn)錄調(diào)控核苷酸序列的載體而實(shí)現(xiàn)。誘變也導(dǎo)致上述的本發(fā)明表達(dá)盒變體的產(chǎn)生。一般而言,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列和啟動(dòng)子可用于在植物中表達(dá)與該啟動(dòng)子有效連接的核酸片段(例如可讀框)或其部分、反義序列、編碼雙鏈RNA序列的序列,或轉(zhuǎn)基因。因此,本發(fā)明的其他實(shí)施方案——本發(fā)明的表達(dá)盒包含有效連接到轉(zhuǎn)錄調(diào)控核苷酸序列和/或至少一個(gè)終止序列或轉(zhuǎn)錄本上的至少一個(gè)目的多核苷酸。因而,本發(fā)明的表達(dá)盒優(yōu)選的包括用于表達(dá)至少一個(gè)目的多核苷酸的轉(zhuǎn)錄調(diào)控核苷酸序列。然而,本發(fā)明還考慮包括轉(zhuǎn)錄調(diào)控核苷酸序列的表達(dá)盒,其中有至少2、3、4或5或者甚至更多個(gè)轉(zhuǎn)錄調(diào)控核苷酸序列用于目的多核苷酸。術(shù)語“目的多核苷酸”指應(yīng)在本發(fā)明所述轉(zhuǎn)錄調(diào)控核苷酸序列的控制下被表達(dá)的核酸。優(yōu)選地,目的多核苷酸編碼多肽,其中該多肽在本發(fā)明所述的細(xì)胞或植物種子中的存在是期望的。此多肽可以是種子貯藏化合物合成所需要的酶,或者可以是種子貯藏蛋白。應(yīng)理解的是,如果目的多核苷酸編碼多肽,可能需要該核酸轉(zhuǎn)錄成RNA以及轉(zhuǎn)錄后的RNA翻譯成多肽。同樣優(yōu)選地,目的多核苷酸包括生物學(xué)活性RNA分子,更優(yōu)選地,反義RNA、核酶、microRNA或siRNA。例如,種子中不期望的酶活性能夠由于種子特異性表達(dá)反義RNA、核酶、microRNA或siRNA而減少。上述生物活性RNA分子所基于的生物學(xué)作用原理為技術(shù)人員所熟知。此外,技術(shù)人員熟知怎樣去獲得編碼這種生物活性RNA分子的核酸。可以理解的是, 生物活性RNA分子可以通過目的多核苷酸的轉(zhuǎn)錄而直接獲得,即不需要翻譯成多肽。優(yōu)選地,至少一個(gè)在本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列的控制下待表達(dá)的目的多核苷酸和該轉(zhuǎn)錄調(diào)控核苷酸序列是異源的,即該核酸非天然地受該轉(zhuǎn)錄調(diào)控核苷酸序列控制,該控制是以非天然地方式(例如通過遺傳工程的方法)而產(chǎn)生的。有效連接包括例如,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列(例如SEQ ID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18描述的序列)——與待表達(dá)的核酸序列——和任選的額外的調(diào)控元件(例如多聚腺苷酸或轉(zhuǎn)錄終止元件、增強(qiáng)子、內(nèi)含子等)的順序連接,連接的方式使轉(zhuǎn)錄調(diào)控核苷酸序列可以完成它在恰當(dāng)條件下目標(biāo)核酸序列表達(dá)過程中的功能。術(shù)語“恰當(dāng)條件”優(yōu)選的意指植物細(xì)胞中存在表達(dá)盒。優(yōu)選的排列是待表達(dá)的目標(biāo)核酸序列置于本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列的下游(即,在3’方向),使兩條序列都共價(jià)的連接。任選的額外序列可插入到兩條序列之間。此類序列可以是例如接頭或多克隆位點(diǎn)。此外,可以插入編碼部分融合蛋白的序列(在意圖表達(dá)目標(biāo)核酸編碼的蛋白質(zhì)的融合蛋白的情況下)。優(yōu)選的,待表達(dá)的目的多核苷酸與本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列之間的距離不超過200bp,優(yōu)選不超過IOObp,更優(yōu)選不超過50bp??梢酝ㄟ^本領(lǐng)域已知的各種方法,包括體外和體內(nèi)方法,實(shí)現(xiàn)與任何或本發(fā)明的表達(dá)盒的有效的連接。因而,可以使用本領(lǐng)域普遍已知的標(biāo)準(zhǔn)重組和克隆技術(shù),實(shí)現(xiàn)本發(fā)明的表達(dá)盒或包含此類表達(dá)盒的載體(參見例如,Maniatis 1989 ;Silhavy 1984 ;Ausubel1987)。還可以通過將本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列(例如SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18描述的序列)插入到植物基因組中,來裝配表達(dá)盒。
此類插入將導(dǎo)致與目標(biāo)核酸序列的有效連接,如同已存在于基因組中一樣。通過插入,目標(biāo)核酸以種子優(yōu)先的或種子特異性的方式表達(dá),原因在于轉(zhuǎn)錄調(diào)控核苷酸序列的轉(zhuǎn)錄調(diào)控特性。插入可以是定向的或偶然的。插入優(yōu)選是定向的,通過例如同源重組來實(shí)現(xiàn)。通過該方法,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列可以與天然啟動(dòng)子交換,從而修飾內(nèi)源基因的表達(dá)特性。轉(zhuǎn)錄調(diào)控核苷酸序列還可以這樣的方式插入,該方式使得表達(dá)內(nèi)源基因的反義mRNA,從而誘導(dǎo)基因沉默。相似的,目的多核苷酸可以插入到植物基因組中來表達(dá),該植物基因組的天然基因組環(huán)境中就包含轉(zhuǎn)錄調(diào)控核苷酸序列(即,與其天然的基因連接),使得插入的序列與轉(zhuǎn)錄調(diào)控核苷酸序列有效連接,從而形成本發(fā)明的表達(dá)盒。表達(dá)盒可用于多種表達(dá)目的,例如表達(dá)蛋白質(zhì),或表達(dá)反義RNA、正義或雙鏈RNA。優(yōu)選的,核酸序列的表達(dá)使植物產(chǎn)生農(nóng)業(yè)上有價(jià)值的性狀。與本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列連接的目的多核苷酸可獲得自昆蟲抗性基因、疾病抗性基因例如細(xì)菌疾病抗性基因、真菌疾病抗性基因、病毒疾病抗性基因、線蟲疾病抗性基因、除草劑抗性基因、修飾谷物組成(composition)或品質(zhì)的基因、營養(yǎng)利用基因、降低真菌毒素的基因、雄性可育基因、選擇標(biāo)志物基因、可篩選的標(biāo)志物基因、負(fù)選擇標(biāo)志物、正選擇標(biāo)志物、影響植物的農(nóng)業(yè)特征的基因(即,產(chǎn)量、抗倒伏性等),或環(huán)境或脅迫抗性基因,即,一種或多種這樣的的基因,該基因產(chǎn)生除草劑抗性或耐受性、昆蟲抗性或耐受性、疾病(病毒、細(xì)菌、真菌、oomycete或線蟲)抗性或耐受性、脅迫抗性或耐受性(例如對干旱、 熱、寒冷、冰凍、濕度過大、鹽脅迫或氧脅迫)、增加產(chǎn)量、食物量和組成、物理外觀、雄性可育、drydown、抗倒伏性、生產(chǎn)力、淀粉數(shù)量和質(zhì)量、油數(shù)量和質(zhì)量、氨基酸或蛋白質(zhì)組成等?!翱剐浴币庵缸鳛槭┯迷噭⒏腥静≡w或暴露在脅迫下的結(jié)果,植物基本不表現(xiàn)出任何表型的改變?!澳褪苄浴币庵钢参镫m然表現(xiàn)出一些表型的改變作為感染的結(jié)果,但具有基本不減少的繁殖能力或基本不改變的代謝。種子特異性的轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子)用于表達(dá)多種基因,包括改變代謝通路、產(chǎn)生疾病抗性、用于蛋白質(zhì)產(chǎn)生(例如,抗體產(chǎn)生)或改良營養(yǎng)攝入等的多種基因。可以修飾種子特異性的轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子),使其可調(diào)控,例如可誘導(dǎo)。本文所述的基因和轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子)可用于鑒別直向同源基因及其轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子),該直向同源基因也可能在特定組織中和/或以特定的發(fā)育方式表達(dá)。此外,直向同源的轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子)可用于表達(dá)相連的可讀框。此外,通過比對這些直向同源物的轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子)可以鑒別新的順式元件,用于產(chǎn)生合成的轉(zhuǎn)錄調(diào)控核苷酸序列(例如,啟動(dòng)子)。本發(fā)明的另一個(gè)目標(biāo)涉及包含本發(fā)明的表達(dá)盒的載體。術(shù)語“載體”,優(yōu)選地包括噬菌體、質(zhì)粒、病毒或逆轉(zhuǎn)錄病毒載體,以及人工染色體,例如細(xì)菌或酵母人工染色體。此外,該術(shù)語也涉及靶向構(gòu)建體,該構(gòu)建體允許靶向構(gòu)建體隨機(jī)或定點(diǎn)整合到基因組DNA中。優(yōu)選地,該靶向構(gòu)建體包含長度足夠用于進(jìn)行如下所詳細(xì)描述的同源或異源重組的DNA。包含本發(fā)明多核苷酸的載體優(yōu)選地進(jìn)一步包含用于在宿主中進(jìn)行擴(kuò)增和/或選擇的選擇標(biāo)記。載體可以用技術(shù)人員熟知的各種技術(shù)導(dǎo)入到宿主細(xì)胞中。如果被導(dǎo)入到宿主細(xì)胞中,載體可以存在于細(xì)胞質(zhì)中或可以整合到基因組中。在后一情況中,可以理解的是,載體可以進(jìn)一步包含允許進(jìn)行同源重組或異源插入的核酸序列。載體可以利用常規(guī)的轉(zhuǎn)化或轉(zhuǎn)染技術(shù)被導(dǎo)入到真核或原核細(xì)胞中。本文中所使用的術(shù)語“轉(zhuǎn)化”與“轉(zhuǎn)染”以及接合與轉(zhuǎn)導(dǎo),旨在包括將外源核酸(例如DNA)導(dǎo)入到宿主細(xì)胞中的多種現(xiàn)有技術(shù),包括磷酸鈣或氯化銣或氯化鈣共沉淀、DEAE-葡聚糖介導(dǎo)的轉(zhuǎn)染、月旨轉(zhuǎn)染、天然感受態(tài)、碳基簇、化學(xué)介導(dǎo)的轉(zhuǎn)移、電穿孔或微粒轟擊(例如“基因槍”)。宿主細(xì)胞(包括植物細(xì)胞)轉(zhuǎn)化或轉(zhuǎn)染的合適方法能夠在Sambrook等(Molecular Cloning A Laboratory Manual,2nd ed., Cold Spring Harbor Laboratory, Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY, 1989)和其它實(shí)驗(yàn)手冊(例如 Methods inMolecular Biology,1995,Vol. 44,Agrobacterium protocols,Ed. GartIand and Davey,Humana Press, Totowa, New Jersey)中找到。可選的,質(zhì)粒載體可以通過熱激或電穿孔技術(shù)導(dǎo)入。當(dāng)載體是病毒時(shí),可以在用于宿主細(xì)胞前,使用恰當(dāng)?shù)陌b細(xì)胞系在體外包裝。逆轉(zhuǎn)錄病毒可以是勝任復(fù)制的或復(fù)制缺陷的。在后一種情況下,病毒增殖一般僅在互補(bǔ)宿主/細(xì)胞中發(fā)生。優(yōu)選地,本發(fā)明所述載體適合作為克隆載體,即在微生物系統(tǒng)中可以復(fù)制。這樣的載體可以確保在細(xì)菌、優(yōu)選地在酵母或真菌中的有效克隆,和使得植物穩(wěn)定轉(zhuǎn)化成為可能。必須提到的載體系統(tǒng)尤其是各種適合于進(jìn)行T-DNA介導(dǎo)的轉(zhuǎn)化的雙元和共整合載體系統(tǒng)。這樣的載體系統(tǒng)通常具有這樣的特征它們至少包含農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化所需要的vir基因、以及界定T-DNA的序列(T-DNA邊界序列)。優(yōu)選地,這些載體系統(tǒng)也進(jìn)一步包含順式調(diào)控區(qū)域(例如啟動(dòng)子、終止子)和/或用于鑒別合適的已轉(zhuǎn)化的宿主細(xì)胞或生物體的選擇標(biāo)記。共整合載體系統(tǒng)具有位于相同載體中的vir基因和T-DNA序列,而雙元系統(tǒng)基于至少兩個(gè)載體,其中一個(gè)載體包含vir基因但沒有T-DNA,而另一載體包含T-DNA但沒有vir基 因。其結(jié)果是,后面述及的載體相對較小、易于操作并能在大腸桿菌和農(nóng)桿菌兩者中復(fù)制。關(guān)于雙兀載體及其使用的綜述見Hellens等,Trends in Plant Science (2000) 5,446-451。此外,通過使用合適的克隆載體,本發(fā)明的表達(dá)盒能夠被導(dǎo)入到宿主細(xì)胞或生物體(例如植物或動(dòng)物)中,從而被用于轉(zhuǎn)化植物,例如在以下文獻(xiàn)中公布和引用的那些PlantMolecular Biology and Biotechnology(CRC Press, Boca Raton, Florida), chapter6/7, pp. 71-119(1993) ;F. F. White, Vectors for Gene Transfer in Higher Plants ;in Transgenic Plants,vol. I,Engineering and Utilization,Ed. Kung and R. Wu,AcademicPress,1993,15-38 ;B. Jenes等,Techniques for Gene Transfer,in Transgenic Plants,vol.I, Engineering and Utilization, Ed. Kung and R. Wu, Academic Press (1993),128-143 ;Potrykus, Annu. Rev.Plant Physiol. Plant Molec.Biol. 42(1991),205225。更優(yōu)選的,本發(fā)明的載體是表達(dá)載體。在此類表達(dá)載體中,表達(dá)盒包括如上說明的轉(zhuǎn)錄調(diào)控核苷酸序列,允許在真核細(xì)胞或其分離的級(jí)分中表達(dá)。除本發(fā)明的表達(dá)盒外,表達(dá)載體還可以包括其他的調(diào)控元件,包括轉(zhuǎn)錄和翻譯增強(qiáng)子。優(yōu)選的,表達(dá)載體還是基因轉(zhuǎn)移或靶向載體。源自病毒(例如,逆轉(zhuǎn)錄病毒、痘病毒、腺相關(guān)病毒、皰疹病毒或牛乳頭瘤病毒)的表達(dá)載體可用于遞送本發(fā)明的表達(dá)盒或載體到靶細(xì)胞群體中。本領(lǐng)域技術(shù)人員普遍已知的方法可用于構(gòu)建重組病毒載體;參見例如Sambrook, Molecular CloningA Laboratory Manual, Cold Spring Harbor Laboratory(1989)N. Y. and Ausubel,Current Protocols in Molecular Biology, Green Publishing Associates and WileyInterscience, N. Y. (1994)中描述的技術(shù)。優(yōu)選的,合適的表達(dá)載體骨架源自本領(lǐng)域已知的表達(dá)載體,例如Okayama-BergcDNA 表達(dá)載體 pcDVl (Pharmacia)、pCDM8、pRc/CMV、pcDNAl、pcDNA3 (Invitrogene)或pSPORTl (GIBC0 BRL)。典型的融合表達(dá)載體的其他實(shí)例是pGEX(Pharmacia BiotechInc ;Smith、D. B.和 Johnson, K. S. (1988)Gene 67 :31-40)、pMAL(New England Biolabs,Beverly,MA)和 pRIT5 (Pharmacia, Piscataway, NJ),其中谷胱;甘妝 S_轉(zhuǎn)移酶(GST)、麥芽糖E-結(jié)合蛋白和蛋白A分別與編碼待表達(dá)的蛋白質(zhì)的目標(biāo)核酸融合。pTrc載體的靶基因表達(dá)是基于宿主RNA聚合酶對雜合的trp-lac融合啟動(dòng)子的轉(zhuǎn)錄的。pET Ild載體的靶基因表達(dá)是基于17-gnlO-lac融合啟動(dòng)子的轉(zhuǎn)錄的,其受共表達(dá)的病毒RNA聚合酶(Hgnl)的介導(dǎo)。該病毒聚合酶是由宿主菌株BL21(DE3)或HMS174(DE3)中駐留的入_原噬菌體提供的,該原噬菌體包括了處于lacUV5啟動(dòng)子轉(zhuǎn)錄控制下的Hgnl基因。用于在釀酒酵母中表達(dá)的載體的實(shí)例包括 pYepSecl (Baldari 等人,(1987) Embo J. 6 229-234) >pMFa (Kurjan andHerskowitz (1982) Cell 30 :933-943)、pJRY88 (Schultz 等人,(1987) Gene 54 :113-123)和 pYES2 (Invitrogen Corporation, San Diego, CA)。適合用于其他真菌(例如,絲狀真菌)中的載體和用于構(gòu)建該載體的方法包括在以下文獻(xiàn)中詳細(xì)描述的van den Hondel,C. A. M. J. J. , &Punt, P. J. (1991) “Gene transfer systems and vector development forfilamentous fungi, in Applied Molecular Genetics of fungi, J. F. Peb erdy 等人編著,第 1-28 頁,Cambridge University Press Cambridge, or in More Gene Manipulationsin Fungi (J. W. Bennett&L. L. Lasure 編著,第 396-428 頁Academic Press : San Diego)。其他的合適的酵母載體是例如pAG-1、YEp6、YEp13或pEMBLYe23。
包含表達(dá)盒的本發(fā)明的載體必須在合適的生物體(即在表達(dá)宿主)中增殖和擴(kuò)+
>曰o因此,本發(fā)明的另一個(gè)實(shí)施方案涉及包含本發(fā)明的表達(dá)盒的轉(zhuǎn)基因宿主細(xì)胞或非人轉(zhuǎn)基因生物。優(yōu)選是原核和真核生物。包括了微生物和高等生物。優(yōu)選的微生物是細(xì)菌、酵母、藻類和真菌。優(yōu)選的細(xì)菌是埃希氏菌屬(Escherichia)、歐文氏菌屬(Erwinia)、農(nóng)桿菌屬(Agrobacterium)、產(chǎn)黃菌屬(Flavobacterium)、產(chǎn)喊菌屬(Alcaligenes)、假單胞菌屬(Pseudomonas)、芽抱桿菌屬(Bacillus)或 Cyanobacterim,例如 BrockBiology ofMicroorganisms 第 8 版(A-8、A_9、A10 和 All 頁)中描述的集胞藍(lán)細(xì)菌屬(Synechocystis)和其他細(xì)菌。更優(yōu)選的包含本發(fā)明的表達(dá)盒的轉(zhuǎn)基因細(xì)胞或非人的轉(zhuǎn)基因生物是植物細(xì)胞或植物(如上文定義的),更優(yōu)選用于產(chǎn)油的植物,例如歐洲油菜(Brassica napus)、芥菜(Brassica juncea)、亞麻(Linum usitatissimum)、大豆、山茶(Camelina)或向日葵。尤其優(yōu)選的是能夠感染植物并將DNA轉(zhuǎn)移到其基因組中的微生物,尤其是農(nóng)桿菌屬的細(xì)菌,優(yōu)選根癌農(nóng)桿菌(Agrobacterium tumefaciens)和發(fā)根農(nóng)桿菌(Agrobacteriumrhizogenes)。優(yōu)選的酵母是假絲酵母屬(Candida)、酵母菌屬(Saccharomyces)、漢遜氏酵母屬(Hansenula)和畢赤酵母屬(Pichia)。優(yōu)選的真菌是曲霉屬(Aspergillus)、木霉屬(Trichoderma)、棉阿舒囊霉屬(Ashbya)、脈孢霉屬(Neurospora)、鐮刀霉屬(Fusarium)和白僵菌屬(Beauveria)。在本發(fā)明的優(yōu)選的實(shí)施方案中,宿主細(xì)胞涉及植物細(xì)胞、植物、植物種子、非人動(dòng)物或多細(xì)胞微生物。因此,本發(fā)明還涉及包含本發(fā)明的表達(dá)盒或載體的轉(zhuǎn)基因植物細(xì)胞、植物組織、植物器官或植物種子。表達(dá)盒或載體可以存在于生物的原生質(zhì)體中,或通過異源或同源重組整合到基因組中??梢詫⑺拗骷?xì)胞,特別是從植物或動(dòng)物獲得的宿主細(xì)胞,導(dǎo)入到發(fā)育的胚中,以獲得包含本發(fā)明的宿主細(xì)胞的鑲嵌的或嵌合的生物體,即轉(zhuǎn)基因生物體,即轉(zhuǎn)基因植物。合適的轉(zhuǎn)基因生物體優(yōu)選是適合重組基因表達(dá)的所有生物。
轉(zhuǎn)基因植物細(xì)胞的本質(zhì)不受限制,例如,植物細(xì)胞可以是單子葉植物細(xì)胞,或雙子葉植物細(xì)胞。優(yōu)選的,轉(zhuǎn)基因植物、轉(zhuǎn)基因植物組織、植物器官、植物或種子是單子葉植物或來自單子葉植物的植物細(xì)胞、植物組織、植物器官、植物種子??捎糜诒景l(fā)明的轉(zhuǎn)基因植物細(xì)胞的實(shí)例包括源自以下屬的細(xì)胞(或完整植物或植物部分)菠蘿屬(Ananas)、色蕉屬(Musa)、葡萄屬(Vitis)、草莓屬(Fragaria)、百脈根屬、苜猜屬(Medicago)、驢食草屬(Onobrychis)、車軸草屬(Trifolium)、胡蘆巴屬(Trigonella)、紅豆屬、柑橘屬、木瓜屬(Carica)、鱷梨屬(Persea)、李屬(Prunus)、Syragrus、可可屬(Theobroma)、咖啡屬、亞麻屬、天竺葵屬、木薯屬、胡蘿卜屬(Daucus)、擬南芥屬、蕓苔屬、蘿卜屬(Raphanus)、白芥屬(Sinapis)、顛煎屬(Atropa)、辣椒屬、曼陀羅屬、天仙子屬、番煎屬(Lycopersicon)、煙草屬、煎屬、碧冬煎屬、洋地黃屬、Majorana、芒果屬(Mangifera)、菊苣屬(Cichorium)、向日葵屬、萬苣屬(Lactuca)、麥雀屬(Bromus)、蘆薈屬(Asparagus)、金魚草屬、萱草屬(Heterocallis)、龍面花屬(Nemesia)、天竺葵屬(Pelargonium)、黍?qū)?Panicum)、狼尾草屬(Pennisetum)、毛茛屬、狗舌草屬(Senecio)、喇口八舌屬(Salpiglossis)、南瓜屬、香瓜屬(Cucumis)、Browaalia、黑麥草屬(Lolium)、 蘋果屬(Malus)、序菜屬(Apium)、棉屬(Gossypium)、野豌豆屬(Vicia)、香豌豆屬(Lathyrus)、羽扇豆屬(Lupinus)、豆薯屬(Pachyrhizus)、紫藤屬、Stizolobium^ 剪股穎屬(Agrostis)、梯牧草屬(Phleum)、鴨茅屬(Dactylis)、高粱屬(Sorghum)、狗尾草屬(Setaria)、玉蜀黍?qū)?Zea)、稻屬(Oryza)、小麥屬(Triticum)、黑麥屬(Secale)、燕麥屬(Avena)、大麥屬(Hordeum)、甘鹿屬(Saccharum)、早熟禾屬(Poa)、羊茅屬(Festuca)、鈍葉草屬(Stenotaphrum)、狗牙根屬(Cynodon)、薏該屬(Coix)、北美箭竹屬(Olyreae)、郝屬(Phareae)、大豆屬(Glycine)、豌豆屬(Pisum)、番石植屬(Psidium)、西番蓮屬(Passiflora)、鷹嘴豆屬(Cicer)、菜豆屬(Phaseolus)、Lens 和落花生屬。優(yōu)選地,用于本發(fā)明的轉(zhuǎn)基因植物細(xì)胞包括禾本科(poaceae)的細(xì)胞,例如大麥屬、黑麥屬、燕麥屬、高粱屬、須芒草屬、絨毛草屬、黍?qū)佟⒌緦?、玉蜀黍?qū)?、小麥屬等屬,例如大?Hordeum vulgare)、芒穎大麥草(Hordeum j ubatum)、Hordeum murinum、Hordeum secalinum、二棱大麥(Hordeum distichon)、Hordeum aegiceras、六棱大麥(Hordeum hexastichon)、六行大麥(Hordeum hexastichum)、不規(guī)則型大麥(Hordeumirregulare)、大麥(Hordeum sativum)、Hordeum secalinum、黑麥(Secale cereale)、燕麥(Avena sativa)、野燕麥(Avena fatua)、比贊燕麥(Avena byzantina)、普通栽培燕麥(Avena fatua var. Sativa)、雜種燕麥(Avena hybrida)、高梁(Sorghum bicolor)、石茅(Sorghum halepense)、舌甘高梁(Sorghum saccharatum)、高梁(Sorghum vulgare)、Andropogon drummondii、Holcus bicolor、Holcus sorghum、Sorghum aethiopicum、Sorghum arundinaceum、卡佛爾高梁(Sorghum caffrorum)、彎頭高梁(Sorghum cernuum)、舌甘高梁(Sorghum dochna)、Sorghum drummondii、硬桿高梁(Sorghum durra)、Sorghumguineense、Sorghum lanceolatum、多脈高梁(Sorghum nervosum)、舌甘高梁(Sorghumsaccharatum)、Sorghum subglabrescens、Sorghum verticil I if Iorum^ Sorghum vulgare、Holcus halepensis、Sorghum miliaceum、稷(Panicum militaceum)、稻(Oryza sativa)、闊葉稻(Oryza latifolia)、玉米(Zea mays)、普通小麥(Triticum aestivum)、硬粒小麥(Triticum durum)、圓柱小麥(Triticum turgidum)、Triticum hybernum、馬卡小麥(Triticum macha)、普通小麥(Triticum sativum)或普通小麥(Triticum vulgare)的屬和種。特別的是,用作根據(jù)本發(fā)明的轉(zhuǎn)基因植物的優(yōu)選植物是包含大量脂類化合物的油料作物,例如花生、油菜、卡諾拉(canola)、向日葵、紅花、I!粟、芥子、大麻、蓖麻油植物、橄欖、芝麻、金盞草、石榴、月見草、毛蕊花、薊、野薔薇、榛、杏、昆士蘭果、鱷梨、月桂、南瓜/美國南瓜、亞麻、大豆、阿月渾子果、琉璃苣、木本(油棕、椰子、核桃)或作物,例如玉米、小麥、黑麥、燕麥、黑小麥、稻、大麥、棉花、木薯、胡椒、萬壽菊、爺科(Solanaceae)植物,例如馬鈴薯、煙草、茄子和西紅柿、野豌豆屬物種、豌豆、苜?;蚬嗄?咖啡、可可、茶)、柳屬物種和多年生草本和飼料作物。根據(jù)本發(fā)明的優(yōu)選的植物是油料作物,例如花生、油菜、卡諾拉、向日葵、紅花、罌粟、芥子、大麻、蓖麻油植物、橄欖、金盞草、石榴、月見草、南瓜/美國南瓜、亞麻、大豆、琉璃苣、木本(油棕、椰子)。在另一個(gè)方面,本發(fā)明涉及用于產(chǎn)生轉(zhuǎn)基因植物組織、植物器官、植物或種子的方法,其包括 (a)將本發(fā)明的表達(dá)盒或載體引入到植物細(xì)胞中;以及(b)再生該植物細(xì)胞來形成植物組織、植物器官、植物或種子??梢砸远喾N本領(lǐng)域已知的方式將表達(dá)盒導(dǎo)入到植物細(xì)胞中。可以通過DNA介導(dǎo)的植物細(xì)胞原生質(zhì)體轉(zhuǎn)化,用本發(fā)明的DNA構(gòu)建體轉(zhuǎn)化植物物種,之后根據(jù)本領(lǐng)域普遍已知的程序從轉(zhuǎn)化的原生質(zhì)體再生植物??梢杂帽景l(fā)明的載體轉(zhuǎn)化任何能夠在之后克隆增殖的植物組織,不論是通過器官發(fā)生還是胚胎發(fā)生。術(shù)語“器官發(fā)生”在本文中意指從分生中心順序發(fā)育出枝條和根的過程;術(shù)語“胚胎發(fā)生”在本文中意指不論是從體細(xì)胞還是從配子,莖和根以一致的方式(非順序的)一起發(fā)育的過程。所選定的特定組織將根據(jù)可獲得的,并最適合轉(zhuǎn)化特定物種的克隆增殖系統(tǒng)而改變。示例性的組織靶包括葉盤、花粉、胚、子葉、下胚軸、雌配子體、愈傷組織、已有的分生組織(例如,頂端分生組織、腋芽和根分生組織)和誘導(dǎo)的分生組織(例如,子葉分生組織和下胚軸(ultilane)分生組織)。本發(fā)明的植物可以采用多種形式。植物可以是轉(zhuǎn)化的細(xì)胞和未轉(zhuǎn)化的細(xì)胞的嵌合體;植物可以是克隆的轉(zhuǎn)化體(例如,所有細(xì)胞都經(jīng)轉(zhuǎn)化含有表達(dá)盒);植物可以包括轉(zhuǎn)化的和未轉(zhuǎn)化的組織的嫁接(例如,柑橘屬物種中,用轉(zhuǎn)化的砧木來嫁接未轉(zhuǎn)化的接穗)??梢酝ㄟ^多種方式繁殖轉(zhuǎn)化的植物,例如通過克隆繁殖或經(jīng)典的育種技術(shù)。例如,第一代(或Tl)轉(zhuǎn)化的植物可以自花授粉,產(chǎn)生純合的第二代(或T2)轉(zhuǎn)化植物,而T2植物進(jìn)一步通過經(jīng)典的育種技術(shù)繁殖。可以將顯性的可選擇標(biāo)志物(例如nptll)與表達(dá)盒相關(guān)聯(lián),來幫助育種。用單個(gè)DNA分子或多個(gè)DNA分子(即,共轉(zhuǎn)化)進(jìn)行植物的轉(zhuǎn)化,兩種技術(shù)都適用于本發(fā)明的表達(dá)盒。可獲得多種轉(zhuǎn)化載體用于植物轉(zhuǎn)化,本發(fā)明的表達(dá)盒可以與任何此類載體聯(lián)合使用。載體的選擇取決于優(yōu)選的轉(zhuǎn)化技術(shù)和用于轉(zhuǎn)化的靶物種。多種用于將構(gòu)建體導(dǎo)入植物細(xì)胞宿主中的技術(shù)是可獲得的且是本領(lǐng)域技術(shù)人員已知的。這些技術(shù)一般包括使用根癌農(nóng)桿菌或發(fā)根農(nóng)桿菌作為轉(zhuǎn)化試劑的DNA轉(zhuǎn)化、月旨質(zhì)體、PEG沉淀、電穿孔、DNA注射、直接DNA攝入、微粒轟擊、顆粒加速等(參見例如,EP295959和EP 138341)(見下文)。然而,可以用本發(fā)明的表達(dá)盒轉(zhuǎn)化植物細(xì)胞以外的細(xì)胞。關(guān)于植物表達(dá)載體和報(bào)告子基因,以及農(nóng)桿菌和農(nóng)桿菌介導(dǎo)的基因轉(zhuǎn)移的一般性描述可見于 Gruber 等人,(1993)中。可以將含有基因組或合成片段的表達(dá)載體導(dǎo)入到原生質(zhì)體中,或完整的組織或分離的細(xì)胞中。將優(yōu)選的表達(dá)載體導(dǎo)入到完整的組織中。例如Maki等人,(1993)和Phillips等人,(1988)中提供了培養(yǎng)植物組織的一般方法。優(yōu)選的,使用直接的基因轉(zhuǎn)移方法將表達(dá)載體導(dǎo)入到玉米或其他植物組織,例如微粒介導(dǎo)的遞送、DNA注射、電穿孔等。更優(yōu)選的,使用基因槍設(shè)備用微粒介導(dǎo)的遞送將表達(dá)載體導(dǎo)入到植物組織中。參見例如,Tomes等人,(1995)。本發(fā)明的載體不僅可用于表達(dá)結(jié)構(gòu)基因,而且還可用于外顯子捕獲克隆,或啟動(dòng)子捕獲程序,來檢測多種組織中的差異基因表達(dá)(Lindsey 1993 ;Auch&Reth 1990)。特別優(yōu)選的是使用農(nóng)桿菌的二元載體Ti和Ri質(zhì)粒。Ti來源的載體轉(zhuǎn)化多種高度植物,包括單子葉和雙子葉植物,例如大豆、棉花、油菜、煙草和稻(Pacciotti 1985 Byrne1987 ;Sukhapinda 1987 ;Lorz 1985 ;Potrykus, 1985;Park 1985 Hiei 1994)。T-DNAffi于轉(zhuǎn)化植物細(xì)胞已受到了廣泛的研究和充分的描述(EP 120516 ;Hoekema, 1985 ;Knauf, 1983 jPAnl985)。為了導(dǎo)入植物中,可以將本發(fā)明的嵌合基因插入到實(shí)施例所述的二元載體中。本領(lǐng)域技術(shù)人員可利用其他轉(zhuǎn)化方法,例如直接攝入外源DNA構(gòu)建體(參見EP 295959)、電穿孔技術(shù)(Fromm 1986)或用包被了核酸構(gòu)建體的金屬顆粒的高速彈轟擊(Kline 1987和US 4,945,050)。一旦被轉(zhuǎn)化,本領(lǐng)域技術(shù)人員可以再生細(xì)胞。特別相關(guān)的是目前描述的用于將外源基因轉(zhuǎn)化到重要經(jīng)濟(jì)作物中的方法,例如油菜(De Block 1989)、向日葵(Everettl987)、大豆(McCabe 1988 ;Hinchee 1988 ;Chee 1989 ;Christou 1989 ;EP 301749)、稻(Hiei 1994)和玉米(Gordon-Kamm 1990 ;Fromm 1990)。本領(lǐng)域技術(shù)人員可以理解,方法的選擇取決于轉(zhuǎn)化針對的植物的類型,S卩,單子葉或雙子葉。轉(zhuǎn)化植物細(xì)胞的合適方法包括但不限于顯微注射(Crossway 1986)、電穿孔(Riggs 1986)、農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化(Hinchee 1988)、直接基因轉(zhuǎn)移(Paszkowski 1984)和使用可獲得自 Agracetus, Inc.,Madison, Wis. And BioRad, Hercules, Calif 的設(shè)備進(jìn)行彈道顆粒加速(參見例如,US 4,945,050和McCabe 1988)。還參見Weissinger 1988 ;Sanford 1987 (洋蔥);Christou 1988(大豆);McCabe 1988(大豆);Datta 1990(稻);Klein 1988(玉米);Klein 1988(玉米);Klein 1988(玉米);Fromm 1990(玉米);和Gordon-Kamm 1990(玉米);Svab 1990(煙草葉綠體);Koziel 1993(玉米);Shimamoto1989 (稻);Christou 1991 (稻);歐洲專利申請EP 0332581 (鴨茅和其他禾本科);Vasil1993(小麥);ffeeks 1993(小麥)。在另一個(gè)實(shí)施方案中,本發(fā)明的核苷酸序列被直接轉(zhuǎn)化到質(zhì)體基因組中。質(zhì)體轉(zhuǎn)化技術(shù)廣泛的描述在US 5,451,513,5, 545, 817 5, 545,818中,在PCT申請?zhí)朩O95/16783中和在McBride等人,1994中。用于葉綠體轉(zhuǎn)化的基礎(chǔ)技術(shù)涉及將兩側(cè)有可選擇標(biāo)志物的克隆質(zhì)體DNA區(qū)域與目標(biāo)基因一起導(dǎo)入到合適的靶組織中,例如使用基因槍或原生質(zhì)體轉(zhuǎn)化(例如,氯化鈣或PEG介導(dǎo)的轉(zhuǎn)化)。被稱為靶向序列的I至I. 5kb側(cè)翼區(qū)有利于與質(zhì)體基因組直向同源重組,因而允許對質(zhì)體基因組的特定區(qū)域的替換或修飾。最初,產(chǎn)生對壯觀霉素和/或鏈霉素的抗性的葉綠體16S rRNA和rpsl2基因中的點(diǎn)突變被用作轉(zhuǎn)化的可選擇標(biāo)志物(Svab 1990 ;Staub 1992)。這導(dǎo)致穩(wěn)定的同型轉(zhuǎn)化,頻率為約每轟擊靶葉片100次發(fā)生I次。在這些標(biāo)志物中存在的克隆位點(diǎn)允許產(chǎn)生用于導(dǎo)入外源基因的質(zhì)體靶向載體(Staub 1993)。通過用顯性可選擇標(biāo)志物一編碼壯觀霉素脫毒酶氨基糖苷-3N-腺苷轉(zhuǎn)移酶的細(xì)菌aadA基因,替換隱性的rRNA或r_蛋白抗生素抗性基因,獲得轉(zhuǎn)化頻率的實(shí)質(zhì)性增加(Svab 1993)。用于質(zhì)體轉(zhuǎn)化有效的其他可選擇標(biāo)志物是本領(lǐng)域已知的,且涵蓋在本發(fā)明的范圍內(nèi)。典型的,需要在轉(zhuǎn)化后約15-20個(gè)細(xì)胞分裂周期,來達(dá)到同型狀態(tài)。質(zhì)體表達(dá)利用了相比核表達(dá)基因更龐大的拷貝數(shù)優(yōu)勢,允許表達(dá)水平可以輕易的超過總可溶性植物蛋白質(zhì)的10%,在質(zhì)體表達(dá)中,基因通過同源重組插入到每個(gè)植物細(xì)胞中都存在的數(shù)千拷貝的環(huán)狀質(zhì)體基因組中。在優(yōu)選的實(shí)施方案中,本發(fā)明的核苷酸序列被插入到質(zhì)體靶向載體中,并轉(zhuǎn)化到理想植物宿主的質(zhì)體基因組中。獲得了對于含有本發(fā)明的核苷酸序列的質(zhì)體基因組同型的植物,優(yōu)選的能夠高表達(dá)核苷酸序列。含有包含本發(fā)明表達(dá)盒的載體的根癌農(nóng)桿菌細(xì)胞可用于制造轉(zhuǎn)化植物的方法,其中該載體包括Ti質(zhì)粒。如上所述,用根癌農(nóng)桿菌感染植物細(xì)胞,產(chǎn)生轉(zhuǎn)化的植物細(xì)胞,然后從轉(zhuǎn)化的植物細(xì)胞再生植物。已知多種可用于攜帶本發(fā)明的農(nóng)桿菌載體系統(tǒng)??梢允褂酶鞣N農(nóng)桿菌菌株,優(yōu)選已卸甲(disarmed)的根癌農(nóng)桿菌 (Agrobacterium tumefaciens)和發(fā)根農(nóng)桿菌(Agrobacterium rhizogenes)菌株。在優(yōu)選的實(shí)施方案中,用于實(shí)踐本發(fā)明的農(nóng)桿菌菌株包括章魚堿型菌株,例如LBA4404,或農(nóng)桿堿型菌株,例如EHAlOl或EHA105。用于DNA轉(zhuǎn)移的根癌農(nóng)桿菌的合適菌株是例如EHAlOl [pEHAlOl] (Hood 1986)、EHA105 [pEHA105] (Li 1992)、LBA4404 [pAL4404] (Hoekema1983)、C58C1 [pMP90] (Koncz&Schell 1986)和 C58C1 [pGV2260] (Deblaere 1985)。其他合適的菌株是根癌農(nóng)桿菌C58,一株胭脂堿型菌株。其他合適的菌株是根癌農(nóng)桿菌C58C1 (VanLarebeke 1974)、A136 (Watson 1975)或 LBA4011 (Klapwi jk 1980)。在另一個(gè)優(yōu)選的實(shí)施方案中,土生的細(xì)菌是發(fā)根農(nóng)桿菌菌株K599(NCPPB 2659)的卸甲變體。優(yōu)選的,這些菌株包括Ti或Ri質(zhì)粒的卸甲型質(zhì)粒變體,提供了將T-DNA轉(zhuǎn)移到植物細(xì)胞中所需的功能(例如,vir基因)。在優(yōu)選的實(shí)施方案中,用植物酚類化合物預(yù)培養(yǎng)用于轉(zhuǎn)化植物組織的農(nóng)桿菌菌株,其含有L,L-琥拍堿型(succinamopine)Ti質(zhì)粒,優(yōu)選卸甲的,例如pEHAlOl。在另一個(gè)優(yōu)選的實(shí)施方案中,用植物酚類化合物預(yù)培養(yǎng)用于轉(zhuǎn)化植物組織的農(nóng)桿菌菌株,其含有章魚堿型Ti質(zhì)粒,優(yōu)選卸甲的,例如pAL4404。一般而言,當(dāng)使用章魚堿型Ti質(zhì)?;蜉o助質(zhì)粒時(shí),優(yōu)選virF基因是刪除的或失活的(Jarschow 1991)。本發(fā)明的方法還可以與特定的農(nóng)桿菌菌株組合使用,進(jìn)一步增加轉(zhuǎn)化效率,例如由于存在變體或嵌合的virA或VirG基因,而改變了 vir基因表達(dá)和/或其誘導(dǎo)的農(nóng)桿菌菌株(例如,Hansen 1994 ;Chen和 Winans 1991 ;Scheeren-Groot, 1994)。優(yōu)選的是根癌農(nóng)桿菌菌株LBA4404 (Hiei 1994)與超毒質(zhì)粒的進(jìn)一步組合。優(yōu)選基于pT0K246的載體(Ishida1996)??梢酝ㄟ^常規(guī)的DNA重組技術(shù)修飾二元載體或任何其他的載體,在E. coli中擴(kuò)增,并通過例如電穿孔或其他轉(zhuǎn)化技術(shù)(Mozo&Hooykaas 1991)導(dǎo)入到農(nóng)桿菌中。以與Ishida(1996)中描述相似的方式生長和使用農(nóng)桿菌。包含載體的農(nóng)桿菌菌株可以例如在補(bǔ)充了恰當(dāng)?shù)目股?例如,50mg/l壯觀霉素)的YP培養(yǎng)基(5g/l酵母提取物、10g/l蛋白胨、5g/l NaCl、15g/l瓊脂、pH6.8)上生長3天。用環(huán)從固體培養(yǎng)基上收集細(xì)菌,并重懸。在本發(fā)明的優(yōu)選的實(shí)施方案中,通過使用在_80°C冷凍的等分試樣開始農(nóng)桿菌培養(yǎng)??梢詢H通過將靶組織與農(nóng)桿菌接觸,進(jìn)行農(nóng)桿菌對靶組織(例如,未成熟的胚)的轉(zhuǎn)化。用于感染和共培養(yǎng)的農(nóng)桿菌濃度可能需要改變。例如制備群體密度為約IO5-IO11,優(yōu)選IO6至101(1,更優(yōu)選約IO8細(xì)胞或cfu/ml的農(nóng)桿菌細(xì)胞懸浮液,并將靶組織浸泡在該懸浮液中約3至10分鐘。然后,在固體培養(yǎng)基上一起培養(yǎng)所獲得的靶組織與農(nóng)桿菌若干天。優(yōu)選的,以IO6至101(lCfu/ml的濃度使用細(xì)菌。在共培養(yǎng)步驟的優(yōu)選的實(shí)施方案中,將共培養(yǎng)基質(zhì)中約I至IOul的土生細(xì)菌(例如,農(nóng)桿菌)懸浮液直接用于各靶組織外植體上,并空氣干燥。這節(jié)省勞動(dòng)力和時(shí)間,并降低由于過度使用農(nóng)桿菌造成的無意的農(nóng)桿菌介導(dǎo)的損傷。對于農(nóng)桿菌處理,將細(xì)菌重懸在植物相容的共培養(yǎng)基質(zhì)中。共培養(yǎng)基質(zhì)補(bǔ)充了抗氧化劑(例如,硝酸銀)、酚吸附性化合物(如聚乙烯吡咯烷酮,Perl 1996)或巰基化合物(例如,二硫蘇糖醇、L-半胱氨酸,Olhoft 2001),可以減少由于植物防御反應(yīng)(如酚氧化)造成的組織壞死,可進(jìn)一步改善農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化的效率。在另一個(gè)優(yōu)選的實(shí)施方案中,共 培養(yǎng)基質(zhì)包括至少一種巰基化合物,優(yōu)選選自硫代硫酸鈉、二硫蘇糖醇(DTT)和半胱氨酸。優(yōu)選的,濃度在約ImM和IOmM的L-半胱氨酸,0. ImM至5mMDTT和/或0. ImM至5mM硫代硫酸鈉之間。優(yōu)選的,在共培養(yǎng)期間使用的基質(zhì)包括從約IuM至約IOyM硝酸銀,和從約50mg/L至約1,000mg/L of L-半胱氨酸。這導(dǎo)致極大降低了靶組織對農(nóng)桿菌介導(dǎo)的損傷(例如,誘導(dǎo)壞死)的易損性,和極大改善了整體的轉(zhuǎn)化效率。各種載體系統(tǒng)可用于與農(nóng)桿菌組合。優(yōu)選的是二元載體系統(tǒng)。常規(guī)的二元載體是基于“廣宿主范圍的”質(zhì)粒,如源自P型質(zhì)粒RK2的pRK252 (Bevan 1984)或pTJS75 (Watson1985)。大部分這類載體是pBIN19(Bevan 1984)的衍生物。各種二元載體是已知的,一些是可商購的,例如 pBIlOl. 2 或 pBIN19 (Clontech Laboratories, Inc. USA)。針對大小和操作改良其他載體(例如,pPZP ;Hajdukiewicz 1994)。WO 02/00900中也描述了改良的載體系統(tǒng)。使用直接基因轉(zhuǎn)移或農(nóng)桿菌介導(dǎo)的轉(zhuǎn)移的方法通常但不必需用可選擇的標(biāo)志物進(jìn)行,該標(biāo)志物可提供對抗生素(例如,卡那霉素、潮霉素或氨甲喋呤)或除草劑(例如草胺磷(phosphinothricin))的抗性。然而,用于植物轉(zhuǎn)化的可選擇標(biāo)志物的選擇對本發(fā)明而目不是關(guān)鍵的。對于某些植物物種,不同的抗生素或除草劑選擇標(biāo)志物是優(yōu)選的。轉(zhuǎn)化中常規(guī)使用的選擇標(biāo)志物包括對卡那霉素和相關(guān)的抗生素產(chǎn)生抗性的nptll基因(Messing&Vierra, 1982 ;Bevan 1983)、對除草劑草胺憐產(chǎn)生抗性的 bar 基因(White 1990,Spencer 1990)、對抗生素潮霉素產(chǎn)生抗性的hph基因(Blochlinger&Diggelmann),產(chǎn)生對氨甲喋呤的抗性的dhfr基因(Bourouis 1983)。用于產(chǎn)生和進(jìn)一步表征穩(wěn)定轉(zhuǎn)化的植物的方法是本領(lǐng)域技術(shù)人員普遍已知的。作為實(shí)例,將轉(zhuǎn)基因植物細(xì)胞置于恰當(dāng)?shù)倪x擇培養(yǎng)基中,用于選擇轉(zhuǎn)基因細(xì)胞,然后生長為愈傷組織。從愈傷組織生長出枝條。通過在生根培養(yǎng)基中生長,從枝條產(chǎn)生試管苗。各種構(gòu)建體一般連接成用于選擇植物細(xì)胞的標(biāo)志物。常規(guī)而言,該標(biāo)志物可以是對殺生劑(特別是抗生素,例如卡那霉素、G418、博來霉素、潮霉素、氯霉素、除草劑等)有抗性的。特定的標(biāo)志物允許比較缺少所導(dǎo)入的DNA的細(xì)胞,來選擇轉(zhuǎn)化的細(xì)胞。可以從序列制備包括本發(fā)明的轉(zhuǎn)錄盒的DNA構(gòu)建體的組分,該序列對宿主是天然的(內(nèi)源)或外來的(外源)?!巴鈦怼币庵感蛄胁豢梢娪趯?dǎo)入構(gòu)建體的野生型宿主中。異源構(gòu)建體可含有至少一個(gè)區(qū)域?qū)τ谵D(zhuǎn)錄起始區(qū)所來源的基因而言不是天然的。為了驗(yàn)證轉(zhuǎn)基因在轉(zhuǎn)基因細(xì)胞和植物中的存在,可以實(shí)施多種測定。此類測定包括例如本領(lǐng)域技術(shù)人員普遍已知的“分子生物學(xué)”測定,例如Southern和Northern印記、原位雜交 和基于核酸的擴(kuò)增方法,如PCR或RT-PCR或Taqman ;“生物化學(xué)”測定,例如通過免疫學(xué)手段(ELISA和Western印跡)或通過酶功能檢測蛋白質(zhì)產(chǎn)物的存在;植物部分測定,例如種子測定;以及通過分析完整再生植物的表型,例如疾病或害蟲抗性??梢酝ㄟ^使用本領(lǐng)域技術(shù)人員普遍已知的技術(shù),從細(xì)胞系或任何植物部分中分離DNA,來確定預(yù)先選定的核酸片段的存在。注意并非總存在完整的序列,可能是由于細(xì)胞內(nèi)序列的重排或缺失。可以通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)確定通過本發(fā)明方法導(dǎo)入的核酸元件的存在。使用這些技術(shù)擴(kuò)增核酸的離散片段,并通過凝膠電泳檢測。該類型的分析允許確定預(yù)先選定的核酸片段是否以穩(wěn)定的轉(zhuǎn)化子的形式存在,但不能驗(yàn)證所導(dǎo)入的預(yù)先選定的核酸片段是否整合到宿主細(xì)胞基因組中。此外,使用PCR技術(shù)不能確定轉(zhuǎn)化子是否具有外源基因?qū)氲交蚪M的不同位點(diǎn)中,即,轉(zhuǎn)化子是否是獨(dú)立來源的。考慮使用PCR技術(shù)將能夠克隆與所導(dǎo)入的預(yù)先選定的DNA片段相鄰的宿主基因組DNA的片段。已知的PCR方法包括但不限于使用成對引物、巢式引物、單特異性引物、簡并引物、基因特異性引物、載體特異性引物、部分錯(cuò)配的引物等的方法??梢允褂肧outhern雜交技術(shù),確定DNA整合到宿主基因組中的肯定性證據(jù),以及轉(zhuǎn)化子的獨(dú)立身份。使用該技術(shù),可以鑒別導(dǎo)入到宿主基因組中的特定DNA序列以及側(cè)翼的宿主DNA序列。因而,給定轉(zhuǎn)化子的Southern雜交模式可發(fā)揮鑒別該轉(zhuǎn)化子的特征的作用。此外,可以通過Southern雜交驗(yàn)證所導(dǎo)入的預(yù)先選定的DNA片段在高分子量DNA中的存在,即,驗(yàn)證所導(dǎo)入的預(yù)先選定的DNA片段已經(jīng)整合到宿主細(xì)胞基因組中。Southern雜交技術(shù)提供了使用PCR獲得的信息,例如,存在預(yù)先選定的DNA片段,但也證實(shí)了與基因組的整合以及表征了各個(gè)單個(gè)的轉(zhuǎn)化子??紤]使用Southern雜交技術(shù)的修飾形式——點(diǎn)或縫印跡雜交技術(shù),可以獲得與源自PCR的相同的信息,例如存在預(yù)先選定的DNA片段。 PCR和Southern雜交技術(shù)都可用于證實(shí)向后代傳遞了預(yù)先選定的DNA片段。在大部分例子中,給定轉(zhuǎn)化子的特征性Southern雜交模式將在后代中分離為一個(gè)或多個(gè)孟德爾遺傳的基因(Spencer 1992) ;Laursen 1994),表不基因的穩(wěn)定繼承。種系傳遞,以及在愈傷組織、RO植物和轉(zhuǎn)化基因分離的Rl后代中,轉(zhuǎn)化DNA的相同的Southern印跡雜交模式和強(qiáng)度,都提示愈傷組織和親代轉(zhuǎn)化子(RO)的非嵌合性質(zhì)。DNA分析技術(shù)可以使用從植物的任何部分分離的DNA來進(jìn)行,而RNA可能只在特定的細(xì)胞或組織類型中表達(dá),因而必需從這些組織制備用于分析的RNA。PCR技術(shù)還可用于檢測和定量從導(dǎo)入的預(yù)先選定的DNA片段產(chǎn)生的RNA。在該P(yáng)CR應(yīng)用中,首先必須將RNA逆轉(zhuǎn)錄成DNA,使用酶例如逆轉(zhuǎn)錄酶,然后通過使用常規(guī)的PCR技術(shù)擴(kuò)增DNA。在大部分例子中,PCR技術(shù)雖然有效,但卻不能證實(shí)RNA產(chǎn)物的完整性。通過Northern印跡可以獲得關(guān)于RNA產(chǎn)物性質(zhì)的其他信息。該技術(shù)將證實(shí)RNA樣本的存在,并給出關(guān)于該RNA完整性的信息。還可以使用點(diǎn)或縫印跡Northern雜交,來確定RNA樣本的存在或缺少。這些技術(shù)是修飾的Northern印跡,且僅證實(shí)RNA樣本的存在或缺少。雖然Southern印跡和PCR可用于檢測所討論的預(yù)先選定的DNA片段,但它們沒有提供關(guān)于預(yù)先選定的DNA片段是否表達(dá)的信息??梢酝ㄟ^特異性鑒別所導(dǎo)入的預(yù)先選定的DNA片段的蛋白質(zhì)產(chǎn)物,或評估由其表達(dá)產(chǎn)生的表型改變,來評估表達(dá)。對特定蛋白質(zhì)的產(chǎn)生和鑒別的測定可利用蛋白質(zhì)的物理化學(xué)、結(jié)構(gòu)學(xué)、功能或其他的特性。獨(dú)特的物理化學(xué)或結(jié)構(gòu)特性允許通過電泳方法分離和鑒別蛋白質(zhì),例如天然的或變性的凝膠電泳或等電聚焦,或者通過色譜技術(shù)例如離子交換或凝膠排阻色譜。單個(gè)蛋白質(zhì)的獨(dú)特結(jié)構(gòu)提供了使用特定抗體以諸如ELISA測定的模式檢測其的存在的機(jī)會(huì)。可以使用具有甚至更高特異性的方法的組合,例如Western印跡,其中抗體用于定位已通過電泳技術(shù)分離的單個(gè)基因產(chǎn)物??梢允褂闷渌夹g(shù)絕對驗(yàn)證目標(biāo)產(chǎn)物的身份,例如通過純化后氨基酸測序來評估。雖然上述是最常使用的,但也可以額外使用其他程序。還可以使用測定程序,通過蛋白質(zhì)功能,尤其是酶催化涉及特定底物和產(chǎn)物的特 定化學(xué)反應(yīng)的能力,來鑒別蛋白質(zhì)的表達(dá)。通過物理或化學(xué)程序供應(yīng)和定量底物的損失或反應(yīng)產(chǎn)物的生成,可以跟蹤這些反應(yīng)。實(shí)例隨分析的酶而改變。經(jīng)常通過評估基因產(chǎn)物表達(dá)的表型結(jié)果,來確定基因產(chǎn)物的表達(dá)。這些測定還可以采用多種形式,包括但不限于分析植物的化學(xué)組成、形態(tài)學(xué)或生理學(xué)特性的改變。形態(tài)學(xué)的改變可包括更高的株高或更粗的莖桿。在被稱為生物測定的更細(xì)致控制的條件下,評估植物或植物部分響應(yīng)所施加的處理的最常見改變。下列章節(jié)提供了特定的目的多核苷酸的實(shí)例,其可以與本發(fā)明的表達(dá)盒有效的連接。I、示例性轉(zhuǎn)基因I. I除草劑抗性編碼草銨膦乙酰轉(zhuǎn)移酶(bar和pat)、草甘膦耐受性EPSP合酶基因、編碼草甘膦氧化還原酶的草甘膦降解酶基因g0X、deh(編碼失活茅草枯的脫鹵素酶)、除草劑抗性(例如,硫酰脲類和咪唑啉酮類)乙酰乳酸合酶和bxn基因(編碼降解溴苯腈的腈水解酶)是用于轉(zhuǎn)化的除草劑抗性基因的好例子。bar和pat基因編碼酶——草銨膦乙酰轉(zhuǎn)移酶(PAT),該酶失活除草劑草銨膦,并阻止該化合物抑制谷氨酸合酶。酶5-烯醇丙酮莽草酸3-磷酸合酶(EPSP合酶)通常受除草劑N-(膦酸甲基)甘氨酸(草甘膦)的抑制。然而,已知編碼草甘膦抗性的EPSP合酶的基因。Deh基因編碼茅草枯脫鹵素酶,產(chǎn)生對除草劑茅草枯的抗性。Bxn基因編碼特定的腈水解酶,將溴苯腈轉(zhuǎn)化為非除草劑的降解產(chǎn)物。I. 2昆蟲抗性本發(fā)明的一個(gè)重要方面涉及將產(chǎn)生昆蟲抗性的基因?qū)氲街参镏?。可以?dǎo)入的潛在的昆蟲抗性基因包括蘇云金芽孢桿菌晶體毒素基因或Bt基因(Watrud 1985)。Bt基因可以提供對鱗翅目或鞘翅目害蟲的抗性,例如歐洲玉米螟(ECB)和玉米食根蟲(CRW)。用于此類實(shí)施方案的優(yōu)選的Bt毒素基因包括CryIA(b)和CryIA(c)基因。這方面也可以使用蘇云金芽孢桿菌的其他物種的影響昆蟲生長或發(fā)育的內(nèi)毒素基因。蛋白酶抑制劑也可以提供昆蟲抗性(Johnson 1989),因而在植物轉(zhuǎn)化中具有實(shí)用性。預(yù)計(jì)使用馬鈴薯或西紅柿的蛋白酶抑制劑II基因——PinII是特別有效的。甚至更有利的是組合使用PinII基因和Bt毒素基因,本發(fā)明人已發(fā)現(xiàn)其組合效應(yīng)產(chǎn)生協(xié)同的殺蟲活性。編碼昆蟲消化系統(tǒng)抑制劑的其他基因,或者編碼有利于抑制劑產(chǎn)生的酶或輔助因子的基因,也是有效的。半胱氨酸蛋白酶抑制劑(Cystatin)和淀粉酶抑制劑,例如小麥和大麥的,可以作為該組別的示例。此外,編碼植物凝聚素的基因可產(chǎn)生額外的或可選的殺蟲特性。植物凝聚素(最初稱為植物血球凝聚素)是多價(jià)的碳水化合物結(jié)合蛋白,能夠使多個(gè)物種的紅血球聚合。最近,植物凝聚素被鑒別為具有抗象鼻蟲、ECB和食根蟲活性的殺蟲劑(Murdock 1990 ;Czapla&Lang, 1990)。植物凝聚素基因被認(rèn)為是有效的,包括例如大麥和小麥胚凝聚素(WGA)和稻凝聚素(Gatehouse 1984),WGA是優(yōu)選的。構(gòu)成本發(fā)明另一方面的是這樣的基因,當(dāng)導(dǎo)入昆蟲害蟲時(shí)該基因控制抗昆蟲的活性大多肽或小多肽的產(chǎn)生,例如溶解肽、肽激素和毒素或毒液。例如,認(rèn)為針對特定昆蟲害蟲的保幼激素酯酶的表達(dá)也可以導(dǎo)致殺蟲活性,或者可能導(dǎo)致變態(tài)的中止(Hammock1990)。表達(dá)這樣的基因的轉(zhuǎn)基因植物也構(gòu)成本發(fā)明另一方面,該基因編碼影響昆蟲表 皮完整性的酶。此類基因包括編碼幾丁質(zhì)酶、蛋白酶、脂肪酶的基因,以及產(chǎn)生尼克霉素(nikkomycin)的基因,尼克霉素是抑制幾丁質(zhì)合成的化合物,導(dǎo)入任何上述基因都被認(rèn)為產(chǎn)生了昆蟲抗性的玉米植物。編碼影響昆蟲蛻皮的活性物質(zhì)的基因也落入本發(fā)明的有效轉(zhuǎn)基因的范圍內(nèi),例如影響蛻皮甾醇Μ)Ρ-糖基轉(zhuǎn)移酶產(chǎn)生的基因。編碼有利于產(chǎn)生這樣的化合物的酶的基因也涵蓋在本發(fā)明內(nèi),該化合物降低宿主植物對昆蟲害蟲的營養(yǎng)質(zhì)量。例如,可以通過改變植物的固醇類組成,使植物產(chǎn)生殺蟲活性。昆蟲通過飲食獲得固醇,用于激素合成和膜穩(wěn)定性。因此,通過表達(dá)新基因改變植物的固醇組成可能對昆蟲生長和/或發(fā)育具有負(fù)面影響,因而賦予植物殺蟲活性,該新基因例如直接促進(jìn)產(chǎn)生不理想的固醇或?qū)⒗硐氲墓檀嫁D(zhuǎn)化為不理想形式的基因。脂肪加氧酶是天然存在的植物酶,顯示表現(xiàn)出對昆蟲的抗?fàn)I養(yǎng)效應(yīng),和降低昆蟲飲食的營養(yǎng)質(zhì)量。因此,本發(fā)明的其他實(shí)施方案涉及具有增強(qiáng)的脂肪加氧酶活性的轉(zhuǎn)基因植物,該活性抵抗昆蟲喂含本發(fā)明還提供了實(shí)現(xiàn)植物次生代謝物的定性或定量改變的方法和組合物。一個(gè)實(shí)例涉及產(chǎn)生DMBOA的轉(zhuǎn)化植物,該植物被認(rèn)為產(chǎn)生對歐洲玉米螟、食根蟲和若干其他玉米害蟲的抗性。特別考慮用于該方面的候選基因包括位于bx基因座的那些基因,已知其涉及合成性DIMBOA通路(Dunn, 1981)。還考慮導(dǎo)入可以調(diào)控玉米可凝性球蛋白(maysin)產(chǎn)生的基因,和參與高粱中蜀黍苷產(chǎn)生的基因,分別促進(jìn)對棉鈴蟲和食根蟲的抗性。鴨茅狀摩擦禾(Tripsacum dactyloides)是一類抗某些昆蟲的雜草,包括玉米食根蟲。預(yù)期將從摩擦禾中分離出編碼對昆蟲有毒的蛋白質(zhì)的基因,或參與對昆蟲有毒的化合物的生物合成的基因,并將這些新基因用于產(chǎn)生對昆蟲的抗性。已知摩擦禾中的昆蟲抗性的基礎(chǔ)是遺傳的,因?yàn)樵摽剐砸呀?jīng)通過有性雜交轉(zhuǎn)移到玉米中(Branson&Guss, 1972)。編碼特征是具有潛在殺蟲活性的蛋白質(zhì)的其他基因也可用作根據(jù)本文的轉(zhuǎn)基因。此類基因包括例如豇豆胰蛋白酶抑制劑(CpTI ;Hilder 1987),其可用作食根蟲威懾劑;編碼除蟲菌素(avermectin)的基因(Campbell 1989 ;Ikeda 1987),其經(jīng)證實(shí)是特別有效的玉米食根蟲威懾劑;核糖體失活蛋白基因;甚至調(diào)控植物結(jié)構(gòu)的基因。還考慮這樣的轉(zhuǎn)基因玉米,該轉(zhuǎn)基因玉米包括抗昆蟲抗體基因,和編碼可以將用于植物外部的無毒殺昆蟲劑(前殺昆蟲劑)在植物內(nèi)部轉(zhuǎn)化為殺昆蟲劑的酶的基因。I. 3環(huán)境或脅迫抗性還可以通過表達(dá)異源基因,或過表達(dá)同源基因,來實(shí)現(xiàn)植物耐受各種環(huán)境脅迫能力的改良,例如但不限于干旱、過高的濕度、寒冷、冰凍、高溫、鹽和氧脅迫??梢匀缦聦?shí)現(xiàn)益處,如通過導(dǎo)入“抗凍”蛋白增加對冰凍溫度的抗性,例如Winter Flounder (Cutler 1989)的“抗凍”蛋白或其合成基因衍生物。還可以通過增加葉綠體中的甘油-3-磷酸乙酰轉(zhuǎn)移酶的表達(dá),來產(chǎn)生改善的寒冷耐受性(Murata 1992 ;ffolter 1992)。通過表達(dá)超氧化物歧化酶可以產(chǎn)生對氧脅迫(通常被例如寒冷溫度與高光強(qiáng)度組合的條件加劇)的抗性(Gupta1993),并可以通過谷胱甘肽還原酶改善(Bowler 1992)。此類對策允許對新出現(xiàn)土地中的冰凍的耐受性,并且使晚熟高產(chǎn)變種拓展到相對早熟區(qū)域。有利影響植物水含量、總水勢、滲透勢和膨壓的新基因的表達(dá)可以增強(qiáng)植物耐受干旱的能力。如本文中使用的,術(shù)語“干旱抗性”和“干旱耐受性”用于指植物增加對于由水利用度相比正常環(huán)境降低而導(dǎo)致的脅迫的抗性或耐受性,以及植物在較低水利用度環(huán)境 中發(fā)揮功能和存活,以及以相對優(yōu)異的方式實(shí)施的能力。在本發(fā)明的這一方面,假設(shè)例如編碼生物合成滲透活性溶質(zhì)的基因的表達(dá)可以產(chǎn)生對抗干旱的保護(hù)作用。在這類基因中包括編碼甘露醇脫氫酶(Lee和Saier,1982)和海藻糖_6_磷酸合酶(Kaasen 1992)的DNA。通過細(xì)胞中的天然磷酸酶的后續(xù)作用或者通過導(dǎo)入和共表達(dá)特定的磷酸酶,這些導(dǎo)入的基因?qū)⒎謩e導(dǎo)致甘露醇或海藻糖的積累,兩者都是普遍記載的能夠減輕脅迫效應(yīng)的保護(hù)性化合物。甘露醇在轉(zhuǎn)基因煙草中的積累已經(jīng)過驗(yàn)證,初步的結(jié)果提示表達(dá)高水平的這一代謝物的植物能夠耐受所施加的滲透脅迫(Tarczynski 1992)。相似的,其他代謝物在保護(hù)酶功能(例如,阿蘭堿(alanopine)或丙酸)或膜完整性(例如,阿蘭堿)中的效果也已記載(Loomis 1989),因此,表達(dá)編碼這些化合物生物合成的基因可以以與甘露醇相似的方式產(chǎn)生干旱抗性。天然存在的滲透活性和/或在干旱和/或脫水過程中提供一些直接保護(hù)效應(yīng)的代謝物的其他實(shí)例包括糖和糖類衍生物,例如果糖、赤蘚醇(Coxson 1992)、山梨醇、衛(wèi)矛醇(Karsten 1992)、甘油葡糖苷(Reed 1984 ;Erdmann 1992)、鹿糖、水蘇糖(Koster&Leopold 1988 ;Blackman 1992)、4_0_ 甲基內(nèi)消旋肌醇和松醇(Vernon&Bohnert 1992),以及棉桿糖(Bernal-Lugo&Leopold 1992)。其他非糖類的滲透活性溶劑包括但不限于脯氨酸和甘氨酸-甜菜堿(Wyn-Jones and Storey,1981)。通過導(dǎo)入和表達(dá)例如上述控制滲透活性化合物和其他此類化合物的基因,可以提高在脅迫時(shí)間過程中的持續(xù)樹冠生長和增加繁殖適合度,如肌醇-ο-甲基轉(zhuǎn)移酶的一個(gè)示例性實(shí)施方案所示。考慮特定蛋白質(zhì)的表達(dá)還可以增加干旱耐受性?;诮Y(jié)構(gòu)相似性已經(jīng)命名了三類胚發(fā)生晚期蛋白(參見Dure 1989)。在成熟的(即,干燥)種子中已經(jīng)證實(shí)了所有這三類蛋白質(zhì)。在這3類蛋白質(zhì)中,11型(脫水蛋白(dehydrin)型)一般涉及植物營養(yǎng)部分中的干旱和 / 或脫水耐受(例如,Mundy 和 Chua, 1988 ;Piatkowski 1990 ;Yamaguchi-Shinozaki1992)。近期,發(fā)現(xiàn)III型LEA(HVA-I)在煙草中的表達(dá)影響植物高度、成熟和干旱耐受性(Fitzpatrick,1993)。因此,所有三組結(jié)構(gòu)基因的表達(dá)都可以產(chǎn)生干旱耐受。在水脅迫過程中誘導(dǎo)的其他類型的蛋白質(zhì)包括巰基蛋白酶、醛縮酶和跨膜轉(zhuǎn)運(yùn)子(Guerrero 1990),可以在干旱脅迫過程中產(chǎn)生各種保護(hù)性和/或修復(fù)類型的功能。影響脂類生物合成,因而影響膜組成的基因的表達(dá)也可以用于在植物中產(chǎn)生干旱抗性。改善干旱抗性的許多基因具有互補(bǔ)的作用模式。因而,這些基因的組合可能對改善玉米的干旱抗性具有附加的和/或協(xié)同的效應(yīng)。許多這類基因還改善冰凍耐受(或抗性);在冰凍和干旱過程中發(fā)生的生理脅迫性質(zhì)上是相似的,并可以以相似的方式減輕??梢酝ㄟ^這些基因的組成型表達(dá)或組織特異性表達(dá)產(chǎn)生益處,但這些新基因的優(yōu)選表達(dá)方式是通過使用膨壓誘導(dǎo)型啟動(dòng)子(例如Guerrero等人,1990和Shagan 1993中描述的膨壓誘導(dǎo)型基因的啟動(dòng)子)。這些基因的空間和時(shí)間表達(dá)模式使玉米能夠更好的抵抗脅迫。涉及特定形態(tài)學(xué)性狀的基因的表達(dá)是有益的,該形態(tài)學(xué)性狀允許增加從干燥土壤中吸取水。例如,改變根特征的基因的導(dǎo)入和表達(dá)可以增強(qiáng)水?dāng)z取。增強(qiáng)脅迫時(shí)間過程中的繁殖適合度的基因的表達(dá)具有重要的價(jià)值。例如,改善花粉散發(fā)的同步性和雌花部分(即,穗絲)感受度的DNA的表達(dá)是有益的。此外,表達(dá)使脅迫時(shí)間過程中籽粒吸收最小化的基因?qū)⒃黾邮斋@籽粒的量,因而是有價(jià)值的。通過導(dǎo)入和表達(dá)具有恰當(dāng)調(diào)控序列的異戊烯基轉(zhuǎn)移酶基因,調(diào)控單子葉植物(例如玉米)中的細(xì)胞分裂素水平,可以改善單子葉植物脅迫抗性和產(chǎn)量(Gan, 1995)。 考慮到水在決定產(chǎn)量中的整體作用,考慮通過導(dǎo)入和表達(dá)新基因,使植物能夠更有效地利用水,將改善整體的性能,即使當(dāng)土壤水分利用度不受限制時(shí)。通過導(dǎo)入改善植物在各種脅迫下相對于水利用度最大化水利用能力的基因,可以實(shí)現(xiàn)產(chǎn)量穩(wěn)定性或產(chǎn)量性能的一致性。還可以通過例如過表達(dá)短角床杜父魚(Myoxocephalus scorpius) (W000/00512)、長角床杜父魚(Myoxocephalus octodecemspinosus)的抗凍多肽、擬南芥轉(zhuǎn)錄激活子CBF1、谷氨酸脫氫酶(W0 97/12983、WO 98/11240)、鈣依賴性蛋白激酶基因(TO98/26045)、鈣調(diào)磷酸酶(W0 99/05902)、酵母的酪蛋白激酶(W0 02/052012)、法尼酰基轉(zhuǎn)移酶(W0 99/06580 ;Pei ZM 等人,(1998) Science 282 :287-290)、鐵蛋白(Deak M 等人,(1999)Nature Biotechnology 17 :192-196)、草酸氧化酶(TO 99/04013 ;DunwellJM(1998) Biotechn Genet Eng Rev 15 :1-32)、DREB1A 因子(“脫水響應(yīng)元件 BlA”;KasugaM等人,(1999)Nature Biotech 17 :276-286)、甘露醇或海藻糖合成的基因例如海藻糖磷酸合酶或海藻糖磷酸鹽磷酸酶(W0 97/42326),或者通過抑制基因例如海藻糖酶(W097/50561),來實(shí)現(xiàn)植物對非生物脅迫因子的改善的保護(hù)作用,例如干旱、熱或寒冷。I. 4疾病抗性假設(shè)可以通過將基因?qū)氲街参镏芷谥校瑢?shí)現(xiàn)對疾病增加的抗性??梢援a(chǎn)生對由病毒、細(xì)菌、真菌、根際病原體、昆蟲和線蟲導(dǎo)致的疾病的抗性。還考慮可以通過表達(dá)導(dǎo)入的基因?qū)崿F(xiàn)控制產(chǎn)生真菌毒素的生物??梢酝ㄟ^表達(dá)新基因來產(chǎn)生對病毒的抗性。例如,已證實(shí)在轉(zhuǎn)基因植物中表達(dá)病毒衣殼蛋白可以對該病毒對植物的感染產(chǎn)生抗性,并且可能對其他密切相關(guān)的病毒產(chǎn)生抗性(Cuozzo 1988,Hemenway 1988,Abel 1986)。考慮表達(dá)祀向關(guān)鍵病毒功能的反義基因可以產(chǎn)生對該病毒的抗性。例如,靶向負(fù)責(zé)病毒核酸復(fù)制的基因的反義基因可以抑制該復(fù)制,并導(dǎo)致對病毒的抗性。認(rèn)為通過使用反義基因干擾其他病毒功能也可以增加對病毒的抗性。此外,假設(shè)可以通過其他方法實(shí)現(xiàn)對病毒的抗性,包括但不限于使用衛(wèi)星病毒。假設(shè)通過導(dǎo)入新基因可以實(shí)現(xiàn)對由細(xì)菌和真菌導(dǎo)致的疾病的抗性??紤]這樣的基因是有效的,該基因編碼所謂的“肽抗生素”、病理發(fā)生相關(guān)(PR)蛋白、毒素抗性和影響宿主病原體相互作用(例如形態(tài)學(xué)特征)的蛋白質(zhì)。肽抗生素是多肽序列,對細(xì)菌和其他微生物的生長是抑制性的。例如,被稱為殺菌肽(cecropin)和爪蟾抗菌肽(magainin)的肽類型抑制許多種類的細(xì)菌和真菌的生長。假設(shè)PR蛋白在植物中的表達(dá)可用于產(chǎn)生對細(xì)菌疾病的抗性。這些基因是在病原體攻擊宿主植物后誘導(dǎo)的,分為至少5類蛋白質(zhì)(Bol,1990)。包括在PR蛋白中的是β -I,3-葡聚糖酶、幾丁質(zhì)酶和滲透蛋白,和其他被認(rèn)為在植物抗疾病生物中發(fā)揮功能的蛋白質(zhì)。已鑒別其他基因具有抗真菌的特性,例如UDA(次蕁麻凝聚素)和橡膠蛋白(Broakgert 1989 ;Barkai-Golan 1978)。已知某些植物疾病是由于植物毒素的產(chǎn)生而導(dǎo)致的??梢酝ㄟ^表達(dá)新基因?qū)崿F(xiàn)對這些疾病的抗性,該新基因編碼能夠降解或者失活該植物毒素的酶。表達(dá)改變宿主植物和病原體之間相互作用的新基因可有效地降低疾病生物侵入宿主植物組織中的能力,例如,增加葉表皮的蠟質(zhì)或其他的形態(tài)學(xué)特征。植物寄生性線蟲是許多植物疾病的原因。假設(shè)可以通過表達(dá)新基因使植物抗這些生物。預(yù)期通過改變線蟲識(shí)別或附著宿主植物的能力,和/或使植物能夠產(chǎn)生殺線蟲化合物,包括但不限于蛋白質(zhì),來實(shí)現(xiàn)對線蟲感染的控制。 此外,可以通過靶向積累某些代謝物或蛋白質(zhì),來實(shí)現(xiàn)對真菌、昆蟲、線蟲和疾病的抗性。此類蛋白質(zhì)包括但不限于芥子油苷(抗食草動(dòng)物的防御)、幾丁質(zhì)酶或葡聚糖酶和其他破壞寄生蟲的細(xì)胞壁的酶、核糖體失活蛋白(RIP),以及當(dāng)植物受傷或受微生物攻擊時(shí),或者化學(xué)上受例如水楊酸、茉莉酸或乙烯或非植物來源的溶菌酶(例如T4溶菌酶或多種哺乳動(dòng)物的溶菌酶)時(shí),所誘導(dǎo)的其他植物抗性和脅迫反應(yīng)的蛋白、殺蟲蛋白質(zhì)例如蘇云金芽孢桿菌內(nèi)毒素、α-淀粉酶抑制劑或蛋白酶抑制劑(豇豆胰蛋白酶抑制劑)、植物凝聚素例如麥胚凝聚素、RNA酶或核酶。其他例子是編碼哈茨木霉(Trichoderma harzianum)chit42內(nèi)切幾丁質(zhì)酶(GenBank檢索號(hào)S78423)或高粱的N-羥基化的多功能細(xì)胞色素P450 (CYP79)蛋白(GenBank檢索號(hào)U32624)或其功能等價(jià)物的核酸。積累芥子油苷作為害蟲防護(hù)(Rask L 等人,(2000)Plant Mol Biol 42 :93-113 ;Menard R 等人,(1999)Phytochemistry 52 :29-35)、表達(dá)蘇云金芽抱桿菌內(nèi)毒素(Vaeck 等人,(1987)Nature328 :33-37)或通過表達(dá)幾丁質(zhì)酶保護(hù)免受真菌的攻擊,例如豆類幾丁質(zhì)酶(Broglie等人,(1991) Science 254 :1194-1197),是有利的??梢酝ㄟ^表達(dá)雪花蓮(Galanthus nivalis)植物凝聚素實(shí)現(xiàn)對害蟲的抗性,例如對水稻植物中的水稻害蟲褐飛虱(Ni Iaparvatalugens) (Rao 等人,(1998)Plant J 15(4) :469-77)。合成的 crylA(b)和 crylA(c)基因的表達(dá)可以在多種植物中產(chǎn)生對昆蟲害蟲的抗性,該基因編碼鱗翅目特異性的蘇云金芽孢桿菌 D-內(nèi)毒素(Goyal RK 等人,(2000) Crop Protection 19(5) :307-312)。適合防御病原體的其他靶基因包括多聚半乳糖醛酸酶-抑制性蛋白(PGIP)、索馬甜(thaumatine)、轉(zhuǎn)化酶和抗微生物肽,例如乳鐵蛋白(Lee TJ等人,(2002) J Amer Soc Horticult Sci127(2) :158-164)。可有利的用于本文中的其他核酸序列包括用于昆蟲控制(美國專利號(hào)6,063,597 ;6,063,756 ;6,093,695 ;5,942,664 和 6,110,464)、真菌疾病抗性(美國專利號(hào) 5,516,671 ;5,773,696 ;6,121,436 ;6,316,407 和 6,506,962)、病毒抗性(美國專利號(hào)5,304,730和6,013,864)、線蟲抗性(美國專利號(hào)6,228,992)和細(xì)菌疾病抗性(美國專利號(hào)5,516,671)的性狀。I. 5降低/消除真菌毒素
由于植物相關(guān)的真菌產(chǎn)生的真菌毒素,包括黃曲霉素和富馬毒素(fumonisin),是致使谷物失效的重要因素。這些真菌生物不導(dǎo)致疾病癥狀和/或干擾植物的生長,但它們產(chǎn)生對動(dòng)物有毒的化學(xué)物質(zhì)(真菌毒素)。抑制這類真菌的生長將降低這類毒性物質(zhì)的合成,因而降低由于真菌毒素污染造成的谷物損失??梢韵蛑参镏袑?dǎo)入抑制真菌毒素合成而不干擾真菌生長的新基因。編碼能夠致使真菌毒素?zé)o毒的酶的新基因的表達(dá)對于實(shí)現(xiàn)降低谷物的真菌毒素污染是有效的。任何上述機(jī)制的結(jié)果都將是谷物上存在的真菌毒素降低。I. 6籽粒(grain)的組成或質(zhì)量可以向植物,特別是重要的經(jīng)濟(jì)谷類(例如玉米、小麥或稻)導(dǎo)入基因,以改善作為生長谷類主要原因的籽粒。根據(jù)籽粒的特定的最終用途,可以設(shè)想以該方式產(chǎn)生的多種新型轉(zhuǎn)基因植物。例如,玉米籽粒的最大用途是用作飼料或食品。導(dǎo)入改變籽粒組成的基因可以極大的提高飼料或食品的價(jià)值。玉米籽粒的主要組分是淀粉、蛋白質(zhì)和油。玉米籽粒的每種這類主要組分都可以通過改變其水平或組成來改善。出于示例性目的,可以提及一些實(shí)例, 但所述實(shí)例不是以任何方式提供的可能性的窮舉列表。許多谷類籽粒的蛋白質(zhì)對于飼料和食品目的而言是亞優(yōu)的,尤其是當(dāng)喂養(yǎng)豬、家禽和人時(shí)。蛋白質(zhì)的若干氨基酸是缺乏的,而該氨基酸是這些物種的飲食中必需的,需要向籽粒中添加補(bǔ)充物。有限的必需氨基酸可包括賴氨酸、甲硫氨酸、色氨酸、蘇氨酸、纈氨酸、精氨酸和組氨酸。一些氨基酸僅當(dāng)籽粒中補(bǔ)充了其他用于飼料配方的添料后才成為有限的。例如,當(dāng)籽粒中補(bǔ)充豆餐以滿足賴氨酸需求時(shí),甲硫氨酸成為有限的。可以提供以下機(jī)制提高種子和籽粒中的這些必需氨基酸的水平,該機(jī)制包括但不限于導(dǎo)入增加氨基酸生物合成、減少氨基酸降解、增加蛋白質(zhì)中的氨基酸貯藏或增加氨基酸向種子或籽粒中運(yùn)輸?shù)幕颉T黾影被嵘锖铣傻囊环N機(jī)制是導(dǎo)入去調(diào)控氨基酸生物合成通路的基因,使植物不再充分的控制產(chǎn)生水平。這可以通過去調(diào)控或繞過在氨基酸生物合成路徑中正常受該路徑的氨基酸終產(chǎn)物水平調(diào)控的步驟來實(shí)現(xiàn)。實(shí)例包括,導(dǎo)入編碼去調(diào)控型的天冬氨酸激酶或二氫吡啶二羧酸(DHDP)合酶的基因來增加賴氨酸和蘇氨酸的產(chǎn)生,以及導(dǎo)入編碼去調(diào)控型的鄰氨基苯甲酸合酶的基因來增加色氨酸產(chǎn)生。降低氨基酸的分解代謝可以通過導(dǎo)入如下DNA序列來實(shí)現(xiàn),該DNA序列能降低或消除催化分解代謝途徑中的步驟的酶(例如賴氨酸-酮戊二酸還原酶)的編碼基因的表達(dá)??梢杂酶鞣N方法改變籽粒的蛋白質(zhì)組成以改善氨基酸的平衡,這些方法包括提升天然蛋白質(zhì)的表達(dá)、降低那些具有不良組成的蛋白質(zhì)的表達(dá)、改變天然蛋白質(zhì)的組成、或?qū)刖幋a具有優(yōu)良組成的全新蛋白質(zhì)的基因??梢詫?dǎo)入能降低儲(chǔ)存蛋白中的玉米醇溶蛋白家族成員的表達(dá)的DNA。該DNA可以編碼核酶或反義序列定向地降低玉米醇溶蛋白的表達(dá)或降低玉米醇溶蛋白表達(dá)的調(diào)控物(例如opaque-2基因產(chǎn)物)的表達(dá)。籽粒的蛋白質(zhì)組成可以通過共抑制現(xiàn)象來改變,即,通過表達(dá)經(jīng)轉(zhuǎn)化導(dǎo)入的、與內(nèi)源基因一樣的結(jié)構(gòu)基因或基因片段來抑制內(nèi)源基因的表達(dá)(Goring 1991)。此外,所導(dǎo)入的DNA可以編碼降解玉米醇溶蛋白的酶。玉米醇溶蛋白表達(dá)的降低可伴隨著具有更期望的氨基酸組成的蛋白質(zhì)的增加或其它主要種子組分例如淀粉的增加?;蛘?,可以導(dǎo)入嵌合基因,該嵌合基因包含編碼具有合適氨基酸組成的天然蛋白質(zhì)(例如一種球蛋白或玉米的IOkD玉米醇溶蛋白)的序列和啟動(dòng)子或設(shè)計(jì)用于增加該蛋白質(zhì)表達(dá)的其它調(diào)控序列。該基因的編碼序列可以包括編碼必需氨基酸的額外密碼子或置換密碼子。此外,可以使用來源于其它物種的編碼序列、或部分或完全合成的序列,其中該序列編碼設(shè)計(jì)用于增強(qiáng)種子的氨基酸組成的完全獨(dú)特的肽序列。導(dǎo)入改變籽粒的油含量的基因,可能是有價(jià)值的。油含量的增加可以導(dǎo)致用于飼料和食品的種子的可代謝能量的含量和密度的增加。所導(dǎo)入的基因可以編碼除去或降低脂肪酸或脂質(zhì)生物合成中的限速或調(diào)節(jié)步驟的酶。這樣的基因包括但不限于編碼乙酰輔酶A羧化酶、ACP-?;D(zhuǎn)移酶、β -酮脂酰-ACP合酶以及其它熟知的脂肪酸生物合成活性的基因。其他的可能性是編碼不具有酶活性的蛋白質(zhì)的基因,例如?;d體蛋白。其他實(shí)例包括2-乙酰轉(zhuǎn)移酶、油質(zhì)蛋白丙酮酸脫氫酶復(fù)合體、乙酰CoA合酶、ATP檸檬酸裂解酶、ADP葡萄糖焦磷酸酶和肉毒堿-CoA-乙酰-CoA穿梭載體的基因。期望與油類生物合成相關(guān)的基因的表達(dá)可靶向質(zhì)體,故使用質(zhì)體轉(zhuǎn)運(yùn)肽序列,和優(yōu)選的在種子胚中表達(dá)??梢詫?dǎo)入改變油中存在的脂肪酸的平衡的基因,提供更健康或更有營養(yǎng)的飼料。導(dǎo)入的DNA還可以編碼這樣的序列,該序列阻斷涉及脂肪酸生物合成的酶的表達(dá),改變籽粒中存在的脂肪酸的比例,例如下文所述??梢詫?dǎo)入基因以增加籽粒中淀粉組分的營養(yǎng)價(jià)值,例如通過增加淀粉的分支度,延緩淀粉的代謝從而改進(jìn)淀粉在母牛中的利用。
除了影響籽粒的主要組分外,可以導(dǎo)入基因,以影響用于飼料或食品的籽粒的多種其他營養(yǎng)物、加工或其他的質(zhì)量方面。例如,可以增加或減少籽粒的色素。在一些動(dòng)物飼料中,黃色色素的增強(qiáng)和穩(wěn)定是理想的,可以通過導(dǎo)入這樣的基因來實(shí)現(xiàn),該基因?qū)е氯~黃素和胡蘿卜素的產(chǎn)生增強(qiáng),消除其產(chǎn)生中的限速步驟。此類基因可編碼改變形式的八氫番茄紅素合酶、八氫番茄紅素去飽和酶或番茄紅素合酶??蛇x的,無色素的白色玉米對于產(chǎn)生許多食物產(chǎn)品是理想的,可以通過導(dǎo)入這樣的DNA來產(chǎn)生,該DNA阻斷或消除色素產(chǎn)生通路中的步驟。飼料和食品所包含的一些籽粒具有不足量的維生素,因而必須加以補(bǔ)充以提供充分的營養(yǎng)價(jià)值??梢钥紤]導(dǎo)入增加種子中維生素的生物合成的基因,包括例如維生素Α、Ε、B12、膽堿等。例如,玉米粒還不具有最佳營養(yǎng)價(jià)值的足量礦物質(zhì)含量。影響含磷、硫、鈣、錳、鋅和鐵等的化合物的積累或利用度的基因?qū)⑹怯袃r(jià)值的。一個(gè)例子是導(dǎo)入降低植酸產(chǎn)生或編碼植酸酶的基因,該酶增強(qiáng)植酸降解。這些基因?qū)⒃黾语嬍持锌衫玫牧姿猁}的水平,降低補(bǔ)充磷酸鹽礦物質(zhì)的需求??擅枋龆喾N改善用于飼料和食品目的的谷類的其他實(shí)例。該改善甚至不必涉及籽粒,而可以例如改善籽粒用于青貯的價(jià)值。導(dǎo)入實(shí)現(xiàn)該目的的DNA包括改變木質(zhì)素產(chǎn)生的序列,例如導(dǎo)致與優(yōu)秀的牛飼料價(jià)值相關(guān)的“棕色中脈”表型的序列。除直接改善飼料或食品價(jià)值外,還可以導(dǎo)入改善籽粒加工或改善加工所獲得的產(chǎn)品價(jià)值的基因。加工某些籽粒(例如玉米)的主要方法是通過濕磨法??梢酝ㄟ^表達(dá)增加效率和降低加工成本(例如,減少浸泡時(shí)間)的新基因,來改善玉米。改善濕磨產(chǎn)品價(jià)值包括改變淀粉、油、玉米麩質(zhì)(corn gluten meal)或玉米麩質(zhì)飼料(corn gluten feed)的組分的數(shù)量或質(zhì)量??梢酝ㄟ^鑒別和消除淀粉生物合成中的限速步驟,或者通過減少籽粒中其他組分的水平,導(dǎo)致淀粉比例增加,來實(shí)現(xiàn)提高淀粉。前者的實(shí)例是導(dǎo)入編碼具有改變的調(diào)控活性或以更高的水平表達(dá)的ADP-葡糖糖焦磷酸化酶的基因。后者的實(shí)例包括在籽粒發(fā)育后期階段過程中表達(dá)的蛋白質(zhì)或油類生物合成的選擇性抑制劑。可以通過改變直鏈淀粉與支鏈淀粉的比率、淀粉分子的大小、或淀粉的分支模式,對淀粉的特性進(jìn)行有利的改變。通過這些改變,許多特性可以被改良,這些特性包括但不限于糊化溫度、糊化熱、膜和糊的透明度、神學(xué)特性(Theological properties)等。為了實(shí)現(xiàn)這些特性改變,可以單獨(dú)或以組合的方式導(dǎo)入編碼顆粒結(jié)合性或可溶性淀粉合酶活性或分支酶活性的基因。也可以用DNA例如反義構(gòu)建體來降低這些酶的內(nèi)源性活性水平。導(dǎo)入的基因或構(gòu)建體可具有調(diào)控序列,控制它們在淀粉生物合成和淀粉粒發(fā)育中以特定的時(shí)間間隔表達(dá)。此外,導(dǎo)入和表達(dá)這樣的基因是可取的,該基因?qū)е碌矸鄯肿拥钠咸烟遣糠衷隗w內(nèi)衍生化或其他修飾作用。可考慮與任何分子共價(jià)連接,僅受催化衍生化作用的酶的存在和淀粉顆粒中恰當(dāng)?shù)孜锏目山咏潭鹊南拗啤V匾难苌饔玫睦影ㄌ砑庸倌軋F(tuán),例如氨基、羧基或磷酸基,為后續(xù)在體外衍生化提供位點(diǎn),或通過導(dǎo)入離子電荷影響淀粉特性。其他修飾作用的實(shí)例包括葡萄糖單位的直接改變,例如丟失羥基,或氧化為醛基或羧基。
油是玉米和其他籽粒的另一種濕磨產(chǎn)物,其價(jià)值受基因的導(dǎo)入和表達(dá)的改善。通過上文關(guān)于飼料和食品所述的方法,可以提高濕磨法提取的油的數(shù)量。還可以改變油的特性,以改善它在生產(chǎn)和在烹飪油、起酥、潤滑劑或其他油類來源產(chǎn)品的應(yīng)用中的性能,或改善它用于食品相關(guān)應(yīng)用時(shí)的健康品質(zhì)。還可以合成新的脂肪酸,其在提取后可作為化學(xué)合成的起始材料??梢酝ㄟ^改變油中存在的脂肪酸的類型、水平或脂類排列,實(shí)現(xiàn)油特性的改變。反過來可以通過添加這樣的基因,或通過增加天然脂肪酸的水平同時(shí)可能降低前體的水平來實(shí)現(xiàn),該基因編碼催化新型脂肪酸合成和具有該新型脂肪酸的脂類合成的酶??蛇x的,可以導(dǎo)入這樣的DNA序列,該序列減慢或阻斷脂肪酸生物合成中的步驟,導(dǎo)致前體脂肪酸中間體的增加??商砑拥幕虬ㄈワ柡兔?、環(huán)氧酶、水合酶、脫水酶和其他催化涉及脂肪酸中間體的反應(yīng)的酶??梢宰钄嗟拇呋襟E的代表性例子包括硬脂酸去飽和為油酸,和油酸去飽和為亞麻酸,分別導(dǎo)致硬脂酸和油酸的積累。還可以通過導(dǎo)入基因獲得新植物,實(shí)現(xiàn)其他主要谷類濕磨產(chǎn)品、麩質(zhì)和麩質(zhì)飼料的改善。代表性的可能性包括但不限于上文所述用于改善食品和飼料價(jià)值的。此外,還可以考慮,使用植物產(chǎn)生或制備在該植物中原先根本不產(chǎn)生或不以相同水平產(chǎn)生的有用生物學(xué)化合物。可以利用轉(zhuǎn)化方法導(dǎo)入并表達(dá)基因來制備產(chǎn)生這些化合物的新型植物。可能性包括但不限于目前由任何生物產(chǎn)生的任何生物學(xué)化合物,例如蛋白質(zhì)、核酸、初級(jí)和中間代謝物、碳水化合物聚合物等?;衔锟梢杂芍参锂a(chǎn)生,在收獲和/或加工后進(jìn)行提取,并用于任何目前公認(rèn)的用途,例如作為藥品、香料、工業(yè)用酶等。用于示例通過在轉(zhuǎn)基因植物中導(dǎo)入基因可能編碼的籽粒性狀或特性的范圍的其他可能性包括出于運(yùn)輸目的具有較低的破損敏感性的籽粒,或通過導(dǎo)入增強(qiáng)Y-玉米醇溶蛋白合成的基因而在干磨法加工時(shí)具有較大的研磨尺寸,通過增加果皮厚度而具有改善的爆裂音、質(zhì)量和擴(kuò)大體積的爆米花,通過導(dǎo)入有效阻斷涉及色素產(chǎn)生通路的酶表達(dá)的基因而具有用于食品用途的白色籽粒的玉米,和通過導(dǎo)入影響甜玉米風(fēng)味的基因(例如shrunken基因(編碼鹿糖合酶))而改善醇類飲料或甜玉米的質(zhì)量。I. 7塊莖或種子的組成或質(zhì)量尤其可以有利的在種子或塊莖中表達(dá)各種性狀,來改善組成或質(zhì)量??梢耘c本發(fā)明的啟動(dòng)子核酸序列組合并提供改善的終產(chǎn)物性狀的有效核酸序列包括但不限于那些編碼種子貯藏蛋白的、脂肪酸通路酶、生育酚生物合酶、氨基酸生物合酶和淀粉分支酶的有效核酸序列。用于修飾植物表型的不例性異源DNA的討論可見于美國專利號(hào)6,194, 636 ;6,207,879 ;6,232,526 ;6,426,446 ;6,429,357 ;6,433,252 ;6,437,217 ;6,515,201 和6,583,338中,以及PCT公開WO 02/057471中,其均通過引用全文整合到本文中。此類性狀包括但不限于-用于食品和飼料領(lǐng)域的代謝酶的表達(dá),例如植酸酶和纖維素酶。尤其優(yōu)選的是這樣的核酸,例如編碼微生物植酸酶(GenBank檢索號(hào)A19451)或其功能等價(jià)物的人工cDNA。-產(chǎn)生精細(xì)化學(xué)品積累的基因的表達(dá),例如生育酚、生育三烯酚(tocotrienol)或類胡蘿卜素??商峒暗囊粋€(gè)實(shí)例是八氫番茄紅素去飽和酶。優(yōu)選的是編碼黃水仙(Narcissus pseudonarcissus)八氧番爺紅素去飽和酶(GenBank檢索號(hào)X78815)或其功能等同物的核酸。優(yōu)選的生育酚生物合酶包括tyrA、slrl736、ATPT2、dxs、dxr、GGPPS,HPPD, GMT, MTU tMT2、AANT1、slrl737,和用于尿黑酸加雙氧酶的反義構(gòu)建體(Kridl等人,Seed Sci. Res. , I :209 :219(1991) ;Keegstra, Cell, 56 (2) :247-53(1989) ;Na wrath等人,Proc. Natl. Acad. Sci. USA, 91 :12760-12764(1994) ;Xia 等人,J. Gen. Microbiol.,138 :1309-1316(1992) ;Lois 等人,Proc. Natl. Acad. Sci. USA, 95 (5) :2105-2110(1998);Takahashi 等人,Proc. Natl. Acad. Sci. USA, 95 (17) :9879-9884(1998) ;Norris 等人,Plant Physiol. ,117 1317-1323(1998) ;Bartley and Scolnik, Plant Physiol. ,104:1469-1470(1994) ;Smith 等人,Plant J.,11 :83-92 (1997) ;W0 00/32757 ;W0 00/10380 ;Saint Guily 等人,Plant Physiol. , 100(2) :1069-1071(1992) ;Sato 等人,J. DNA Res.,7 (I) :31-63 (2000)),其均通過引用整合到本文中。-淀粉產(chǎn)生(美國專利號(hào)5,750,876和6,476,295)、高蛋白質(zhì)產(chǎn)生(美國專利號(hào)6,380,466)、果實(shí)成熟(美國專利號(hào)5,512,466)、增強(qiáng)的動(dòng)物和人的營養(yǎng)(美國專利號(hào)5,985,605和6,171,640)、生物聚合物(美國專利號(hào)5,958,745和美國專利
發(fā)明者H-S·宋, J·A·布朗, K·弗朗西斯, 扶惠華 申請人:巴斯夫植物科學(xué)有限公司