專利名稱::來自咖啡的脫水蛋白基因和啟動子的制作方法來自咖啡的脫水蛋白基因和啟動子發(fā)明領域本發(fā)明涉及農(nóng)業(yè)生物
技術領域:
。特別地,本發(fā)明表征了來自咖啡植物的編碼脫水蛋白的多核苷酸、來自咖啡脫水蛋白基因的啟動子序列,以及使用這些多核苷酸和啟動子基因調(diào)節(jié)和操控咖啡豆的香味、香氣(aroma)和其他特征的方法。發(fā)明背景在說明書全文中引用了多種出版物,包括專利、公開的申請和學術論文。這些出版物中的每一份在此以其全文引用作為參考。說明書中未完全闡明的引用可見于說明書的結(jié)尾處。咖啡的香氣和香味是消費者對咖啡種類和品牌的偏愛的關鍵組成部分。咖啡的特征香氣和香味來源于在豆的烘焙過程中發(fā)生的涉及香味前體的復雜的系列化學反應(美拉反應)。香味前體包括存在于綠咖啡豆中的化合物和生物分子。迄今為止,已鑒定了800多種促成咖啡的香味和香氣的化學物質(zhì)和生物分子。(Montavon等人,J.Agric.FoodChem.,51:2328-34(2003))。因為咖啡消費者變得越來越成熟,為了滿足消費者的偏好希望產(chǎn)生具有改進的香氣和香p未的咖啡??梢酝ㄟ^化學方法人工地將香氣和香味都賦予咖啡產(chǎn)品。參見,例如,美國專利號4,072,761(香氣)和美國專利號3,962,321(香味)。然而,迄今為止,關于天然的咖啡種粒(coffegrain)組分例如多糖、蛋白質(zhì)和脂類對咖啡香氣和香味的影響的數(shù)據(jù)資料非常少。一個方法是從現(xiàn)有種質(zhì)中選擇具有更優(yōu)的香味特征的品種。該方法的不利方面通常是質(zhì)量最高的品種也具有明顯不利的農(nóng)藝性狀,例如低產(chǎn)量和對疾病和環(huán)境脅迫的低抵抗力。也可能從育種試驗中選擇新品種,在所述育種試驗中,將具有不同工業(yè)和農(nóng)業(yè)性狀的品種雜交并就高質(zhì)量和良好的農(nóng)業(yè)表現(xiàn)兩個方面篩選其后代。然而,該后一種方法非常費時,一個雜交實驗和超過3個生長季節(jié)的選擇花費最少7-8年時間。因此,提高咖啡質(zhì)量味和香氣的那些元件,以及添加在咖啡豆中非天然發(fā)生的香氣和香味增強性元件?;蚬こ烫貏e適合用于實現(xiàn)這些目的。例如,可交換來自不同咖啡物種的咖啡蛋白質(zhì)。在可選擇的方法中,可增加編碼天然發(fā)生的對咖啡香味具有正貢獻的咖啡蛋白質(zhì)的基因表達。相反,可抑制編碼天然發(fā)生的對咖啡香味具有負貢獻的咖啡蛋白質(zhì)的基因表達。現(xiàn)代技術的另一個應用是使用關于高質(zhì)量與特定等位基因的相關性的分子信息,通過使用標記輔助育種就這類等位基因的存在或不存在篩選新品種。當以相同的方式烘焙和加工綠種粒樣品時,來自不同品種和來源的咖啡展示了顯著的香味和香氣質(zhì)量變化。質(zhì)量差異是種粒樣品內(nèi)的化學和物理變化的表現(xiàn),所述化學和物理學變化主要由生長和加工條件的差異,也由于母本植物和種粒的遺傳背景的差異引起。在化學組成的水平上,至少部分香味質(zhì)量與小代謝物(例如糖類、酸類、酚類化合物和咖啡因)的水平變化相關,所述小代謝物與來自不同品種的種粒相關。已接受的是存在其他未得到良好表征的香味分子和香味前體分子。此外,可能種粒內(nèi)的結(jié)構(gòu)變異也可能促成咖啡質(zhì)量的差異。發(fā)現(xiàn)咖啡種粒中與咖啡質(zhì)量相關聯(lián)的新成分的一個方法是研究在種粒樣品的成熟期間,在具有不同質(zhì)量特征的不同品種中差異性表達的基因和蛋白質(zhì)。已顯示稱為胚胎發(fā)育后期富集蛋白(LEA)的一類蛋白質(zhì)在棉花種子發(fā)育后期以協(xié)作的方式累積(Dure,L,等人Biochemistry20:4162-4178(1981))。脫水蛋白(DHN)是也已被稱為"LEAD-ll家族"或LEA2型蛋白質(zhì)的LEA蛋白質(zhì)的亞類(Close,T,Physiol.Plant97:795-803(1996);Ingram,J,Annu.Rev.PlantPhysiologyPlantMolBiol47:377-403(1996》。DHN蛋白質(zhì)的表達與保護不同類型的植物細胞免受滲透脅迫相關,所述滲透脅迫例如為千燥、鹽和低溫導致的滲透脅迫(Skriver,K,等人.PlantCell2:503-512(19卯);Allagulova,CR,等人.Biochemistry-Moscow68:945-951(2003))。近年來,直接的實驗證據(jù)已將脫水蛋白增加的表達與免受滲透脅迫的保護作用聯(lián)系起來。例如,發(fā)現(xiàn)當經(jīng)改造而過量表達脫水蛋白融合蛋白的擬南芥植物暴露于低溫時,具有提高的存活率(Puhakainen,T,等人.PlantMolecularBiology54:743-753(2004))。類似地,已顯示柑橘屬脫水蛋白在轉(zhuǎn)基因煙草中的表達產(chǎn)生了對低溫增加的耐受性(Hara,M,等人.Planta217:290-298(2003))。脫水蛋白和對低溫誘導的脅迫的耐受性相關的其他支持證據(jù)是在圖鐠上冷凍耐受性和抗寒性的QTL基因座與脫水蛋白非常接近的觀察(CloseT,1996;Zhu,B,等人.MolecularandGeneralGenetics264:145-153(2000))。DHN基因也在接近成熟末期(該時期為當種子經(jīng)歷水含量隨發(fā)育程序性減少的時期)的種子中強烈表達(Nylander,M,等人.PlantMolecularBiology45:263-279(2001);Choi,DW,等人.TheoreticalandAppliedGenetics100:1274-1278(2000))。據(jù)估計LEA/脫水蛋白包含高達4%的總種子蛋白質(zhì),并且被認為參與保護胚和/或其他種子組織免受與成熟種子的低水含量相關的滲透脅迫(RobertsJ,等人.PlantCell5:769-780(1993);Wise,M,等人TrendsPlantSci.9:13-17(2004))。廣泛地認識到脫水蛋白與其他LEA蛋白質(zhì)一起通過幫助種子組織適應成熟種子中發(fā)現(xiàn)的更低水含量來參與在種子成熟后期中發(fā)生的脫水過程(Close,Tm1996);NylanderM,2001)。此外,相信在種子休眠期間,在種子成熟期間合成的脫水蛋白也繼續(xù)穩(wěn)定相關的細胞結(jié)構(gòu)。關于后一點,最近已提及脫水蛋白也可具有自由基清除能力(Hara,M,2003)和金屬結(jié)合性質(zhì)(Alsheikh,MK,等人.J.Biol,Chem.278:40882-40889(2003)),這都是在長期的種子貯藏期間可能有用的兩個特征。已分離和研究了相當量的脫水蛋白,并且這些蛋白質(zhì)籍以在體內(nèi)發(fā)揮保護細胞免受滲透脅迫的作用的精確生理化學和/或結(jié)構(gòu)機制正在研究中。脫水蛋白是極親水的蛋白質(zhì)并且展示顯著低水平的可識別結(jié)構(gòu)(CloseT,1996;Soulages,JL,等人.PlantPhysiology131:963-975(2003))。據(jù)認為脫水蛋白至關重要的元件為存在一個或多個稱為"K基序"的富含賴氨酸的15個氨基酸的片段,經(jīng)預測該片段形成A類兩親性a-螺旋(Close,T,1996;Close,TJPhysiol.Plant100:291-296(1997))。脫水蛋白也可包含兩個其他基序,N末端"Y區(qū)段,,(共有序列V/TDE/QYGNP)和富含絲氨酸的"S區(qū)段",其中后者可被磷酸化并且被認為參與細胞核定位(CloseTJ,1997;GodoyJA,等人.PlantMol.Biol.1921-1934(1994》。已提出,脫水蛋白多肽的短兩親性K區(qū)段功能性地與經(jīng)歷部分變性的蛋白質(zhì)的暴露于溶劑的疏水小塊相互作用,從而阻斷蛋白質(zhì)聚集體形成(CloseT,1996)。兩親性K螺旋也可參與結(jié)合膜脂,從而可在保護脂蛋白、位于膜中的蛋白質(zhì)和/或膜結(jié)構(gòu)本身中起著更有效的作用(CloseT,1996;Koag,MC,等人PlantPhysiology131:309-316(2003))。關于脫水蛋白至少部分的保護效應的可選建議是這些非常穩(wěn)定的但相對無結(jié)構(gòu)的蛋白質(zhì)緊密結(jié)合和組織水分子的能力(Soulages幾,2003)。后一效應可減少水從細胞的丟失,并且也可提高某些大分子的穩(wěn)定性,這是通過產(chǎn)生在這些分子周圍更緊密結(jié)合的"有序的"水的基于脫水蛋白的區(qū)域。盡管脫水蛋白在植物中參與對滲透脅迫例如千旱和鹽脅迫的抗性,以及脫水蛋白在種粒發(fā)育期間可能起著重要作用,但在咖啡中可獲得的關于這些基因的信息極少。在咖啡中,關于脫水蛋白的數(shù)目、它們的蛋白質(zhì)結(jié)構(gòu)、它們在咖啡才直物的不同組織中和咖啡物種間以及在咖啡種粒和果皮成熟期間的表達水平和分布、以及它們的表達在分子水平上的調(diào)節(jié)都知之甚少。因此,存在對鑒定、分離和表征咖啡脫水蛋白、基因和基因調(diào)節(jié)元件的需要。這類信息將使得咖啡脫水蛋白能夠被遺傳操作,目的在于提高咖啡的香氣和香味,以及賦予與改善的滲透脅迫抗性相關的其他表型優(yōu)勢。因為脫水蛋白在咖啡種粒中組織水分子,和在成熟脫水的種粒中穩(wěn)定大分子和細胞器中所具有的潛在的重要作用,在種粒成熟末期相對高水平表達的脫水蛋白是非常引人注意的。據(jù)^人為至少部分該保護效應是由于脫水蛋白和其他LEA蛋白質(zhì)穩(wěn)定不同的水/蛋白質(zhì)/脂類界面的能力。因為水的水平可影響美4立反應中形成的產(chǎn)物鐠(Turner,J,等人J.Agric.FoodChem50:5400-5404(2002)),所以咖啡種粒中的水分子的可獲得性和組織狀態(tài)可影響在咖啡的烘焙過程中發(fā)生的產(chǎn)生香味的美拉反應。發(fā)明概述本文描述的本發(fā)明表征了來自咖啡植物的編碼脫水蛋白的多核苷酸、它們編碼的多肽、來自咖啡脫水蛋白基因的啟動子序列,以及使用這些多核苷酸、多肽和啟動子調(diào)節(jié)基因和操控咖啡豆的香味、香氣和其他特性的方法。本發(fā)明的一個方面表征了從咖啡屬物種(Coffeaspp.)分離的核酸分子,該核酸分子具有編碼脫水蛋白或胚胎發(fā)育后期富集蛋白(LEA)的編碼序列。在某些實施方案中,編碼的脫水蛋白具有大約17kDa至26kDa的分子量。在某些實施方案中,編碼的脫水蛋白或LEA蛋白質(zhì)具有與SEQIDNO:7-12中的任一個有46%或更高同一性的氨基酸序列。在一些實施方案中,編碼序列與SEQIDNO:1-6中所示的編碼序列中的任一個具有45%或更高的同一性。在某些實施方案中,核酸分子是具有包含編碼序列的可讀框的基因??蛇x地,其可包含通過該基因轉(zhuǎn)錄產(chǎn)生的mRNA分子,或通過該mRNA分子的反轉(zhuǎn)錄產(chǎn)生的cDNA分子。本發(fā)明也表征了長度為8至100個^的寡核苷酸,該寡核苷酸與上述核酸分子的區(qū)段互補。本發(fā)明的另一個方面表征了包含上述編碼脫水蛋白或LEA的核酸分子的栽體。在某些實施方案中,載體是選自質(zhì)粒、噬菌粒、粘粒、桿狀病毒、桿狀病毒穿梭載體、細菌、酵母和病毒載體的表達載體。在某些實施方案中,載體包含有效連接至組成型啟動子的核酸分子的編碼序列。在其他實施方案中,編碼序列有效連接至誘導型啟動子。在其他實施方案中,核酸分子的編碼序列有效地連接至組織特異性啟動子,例如種子特異性啟動子,優(yōu)選咖啡種子特異性啟動子。在特定的實施方案中,種子特異性啟動子是咖啡脫水蛋白基因啟動子,例如SEQIDNO:13中包含的啟動子。本發(fā)明的另一個方面提供了使用上述載體轉(zhuǎn)化的宿主細胞。宿主細胞可以是植物、細菌、真菌、昆蟲或哺乳動物細胞。在某些實施方案中,宿主細胞是選自咖啡、煙草、擬南芥、玉米、小麥、稻、大豆、大麥、黑麥、燕麥、高粱、苜蓿、三葉草、油菜、紅花、向日葵、花生、可可、蕃茄、粘果酸漿(tomatillc))、馬鈴薯、胡椒、茄子、甜菜、胡蘿卜、黃瓜、萵苣、豌豆、紫菀、秋海棠、菊花、飛燕草、百日草和草畔草中的任一種的植物細胞。本發(fā)明也表征了通過再生轉(zhuǎn)化的植物細胞產(chǎn)生的能育轉(zhuǎn)基因植物。在特定的實施方案中,能育轉(zhuǎn)基因植物是咖啡屬物種。本發(fā)明的另一個方面表征了調(diào)節(jié)咖啡豆的香味或香氣的方法。所述方法包括調(diào)節(jié)咖啡種子內(nèi)的一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。在一些實施方案中,所述方法包括例如通過增加咖啡種子內(nèi)的一種或多種編碼內(nèi)源性脫水蛋白或LEA蛋白質(zhì)的基因的表達,或通過將編碼脫水蛋白或LEA蛋白質(zhì)的轉(zhuǎn)基因引入植物來增加一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。在其他實施方案中,所述方法包括例如通過將抑制一種或多種編碼脫水蛋白或LEA蛋白質(zhì)的基因表達的核酸分子引入咖啡,來減少一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。本發(fā)明的另一個方面表征了在植物中增加對滲透脅迫的抗性的方法。該方法包括例如通過將編碼脫水蛋白或LEA蛋白質(zhì)的轉(zhuǎn)基因引入植物,來增加植物中一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。本發(fā)明的另一個方面提供了從編碼脫水蛋白的咖啡植物基因分離的啟動子。在某些實施方案中,編碼脫水蛋白的咖啡基因編碼具有一種或多種上述特征的脫水蛋白。在某些實施方案中,所述啟動子包含選自TATA盒、脫落酸應答元件、用于調(diào)節(jié)leguminin類型蛋白質(zhì)表達的leguminin盒的RY重復(CATGCA(T/a)(A/g)、至少一種脫水應答元件/C重得順式作用序列基序(G/ACCGAC)和至少一個E盒基序(CANNTG)的一個或多個調(diào)節(jié)序列。在特定的實施方案中,所述啟動子包含SEQIDNO:13。本發(fā)明也表征了包含有效連接至一種或多種編碼序列的編碼咖啡脫水蛋白的基因的啟動子的嵌合基因。本發(fā)明也提供了用于轉(zhuǎn)化細胞、包含所述嵌合基因的載體和用該載體轉(zhuǎn)化的細胞以及通過再生用該栽體轉(zhuǎn)化的植物細胞產(chǎn)生的能育轉(zhuǎn)基因植物。根據(jù)下列的附圖、詳細描述和實施例理解本發(fā)明的其他特征和有利方面。附圖概述圖1.中果咖啡(a,#Mc朋印^m)Y3SK2類型脫水蛋白與幾種近緣植物同系物的最佳比對。使用MegAlign軟件(DNASTAR)中的ClustalW程序產(chǎn)生該比對,然后通過手工進行進一步最優(yōu)化。加框標示相同氨基酸。用實體條為Y區(qū)段劃界,單一深色矩形為S區(qū)段劃界,以及虛線矩形為K區(qū)段劃界。黑色圓表示CcDH2a和CcDH2b之間不同的M酸。登錄號番^S(Z^o/^wcwieyc"/^i似附)脫水蛋白TAS14(AAC49618)(SEQIDNO:14);5Wtf""附"w附er^",7脫水蛋白Dhnl(CAA75798)(SEQIDNO:15);擬南芥(爿r"^Vifo/7^s幼fl/,Vwm)脫水蛋白RAB18(NP—201441)(SEQIDNO:16)。圖2.中果咖啡SK3型脫水蛋白與幾種近緣植物同系物的最佳比對。如圖l中所述產(chǎn)生該比對。加框標示相同氨基酸。單一深色矩形為S區(qū)段劃界,以及虛線矩形為K區(qū)段劃界。登錄號煙草(7V,'cWflw"to6CM/w)脫水蛋白(BAD13499)(SEQIDNO:17);馬鈴薯(^/"""附似6mw"附)脫水蛋白同系物CI7(T07779)(SEQIDNO:18);擬南芥脫水蛋白(CAA62449)(SEQIDNO:19)。圖3.中果咖啡胚胎發(fā)育后期富集蛋白CcLEAl與幾種近緣植物同系物的最佳比對。如圖l中所述產(chǎn)生比對。加框標示相同氨基酸。用星號標示保守的半胱氨酸,用圓標示兩個較不保守的半胱氨酸的位置。登錄號擬南芥胚胎發(fā)育后期富集相關蛋白(NP一200248)(SEQIDNO:20)、白云杉(尸z'"flg/""c")胚胎發(fā)育后期富集蛋白EMB7(T09288)(SEQIDNO:21)、玉米(Ze"zmi")根冠蛋白質(zhì)2(BAA75477)(SEQIDNO:22)。圖4.小果咖啡(Coj^fl和中果咖啡的不同器官中咖啡脫水蛋白和CcLEAl轉(zhuǎn)錄物的RT-PCR表達分析。lOObp表示lOObp的分子量標準參照梯;SG、LG、YG、RG分別表示表示種粒和果皮的小綠、大綠、黃綠色和紅色;R、S、L、F表示根、莖、葉和花。圖5.中果咖啡和小果咖啡的不同器官中CcDH2的定量RT-PCR表達分析。GSG、GLG、GYG、GRG分別表示小綠種粒、大綠種粒、黃色種粒和紅色種粒;PSG、PLG、PYG、PRG分別表示小綠果皮、大綠果皮、黃色果皮和紅色果皮;R、S、L、F表示根、莖、葉和花。在各反應的圖表中報導標準偏差。圖6.CcDH2脫水蛋白的Southern印跡分析。放射自顯影圖暴光3天。圖7.來自中果咖啡的CcDH2a啟動子和轉(zhuǎn)錄序列的DNA序列。顯示了pVCl插入片段的核酸序列和對應的氨基^列。用圓標示cDNA中的第一個堿基(C)。用下劃線標示假定的TATA盒。用雙下劃線標示RY重復序列,用框標示ABA應答元件,并用粗線給DRE/CRT序列加框。圖8.所編碼多肽的Kyte-Doolittle親水性圖。CcDHla(173個氨基酸,SEQIDNO:7);CcDHlb(176個氨基酸,SEQIDNO:8);CcDH2a(163個氨基酸,SEQIDNO:9);CcDH2b(163個氨基酸,SEQIDNO:10);CcDH3(228個氨基酸,SEQIDNO:ll);CcLEA1(358個氨基酸,SEQIDNO:12)。圖9.對照和干旱脅迫植物葉中CcDHl表達的實時定量RT-PCR表達分析。植物1-3是定期澆水的對照植物;從實驗開始("0")在整個6周期間不給植物4-6提供水。圖10.對照和干旱脅迫植物葉中CcDH2表達的實時定量RT-PCR表達分析。植物1-3是定期澆水的對照植物;從實驗開始("0")在整個6周中不給植物4-6提供水。例示性實施方案的詳述定義與本發(fā)明的生物分子和其他方面相關的各種術語用于整篇說明書和權(quán)利要求。"分離的"是指通過人工方法從天然狀態(tài)改變。如果組合物或物質(zhì)在自然界中存在,如果已將其從其原始的環(huán)境中改變或移開或兩者都發(fā)生,則其已被"分離"。如術語在本文所使用,例如,天然存在于活植物或動物中的多核苷酸或多肽不是"分離的",但從其天然狀態(tài)的共存材料分離的相同多核苷酸或多肽是"分離的"。"多核苷酸",也稱為"核酸分子",通常指可以是未被修飾的RNA或DNA或修飾的RNA或DNA的任何多核苷酸或多脫氧核糖核苷酸。"多核苷酸"包括但不限于單鏈和雙鏈DNA,為單鏈和雙鏈區(qū)混合的DNA、單鏈和雙鏈RNA以及為單鏈和雙鏈區(qū)的混合物的RNA、包含DNA和RNA的、可以是單鏈或更常見地為雙鏈或單鏈和雙鏈區(qū)混合的雜種分子。此外,"多核苷酸"是指包含RNA或DNA或RNA和DNA的三鏈區(qū)。術語多核苷酸也包括包含一個或多個經(jīng)修飾的堿基的DNA或RNA,和具有為了穩(wěn)定或其他原因而修飾的主鏈的DNA或RNA。"經(jīng)修飾的"堿基包括,例如,三苯甲基化的堿基(tritylatedbase)和稀有堿基例如肌苷。可對DNA和RNA進行許多種修飾;因此,"多核苷酸"包括多核苷酸的化學、酶促或代謝修飾的形式(如通常在自然界中發(fā)現(xiàn)的形式),以及病毒和細胞的DNA和RNA特征的化學形式。"多核苷酸"也包括通常稱為寡核苷酸的相對短的多核苷酸。"多肽"是指包含通過肽鍵或經(jīng)修飾的肽鍵即肽電子等排體(peptideisostere)相互連接的兩個或更多個氨基酸的任何肽或蛋白質(zhì)。"多肽,,是指通常稱作肽、寡肽或寡聚物的短鏈和通常稱作蛋白質(zhì)的更長的鏈。多肽可包含除了20個基因編碼的氨基酸外的氨基酸。"多肽"包含通過天然方法例如翻譯后加工或通過本領域內(nèi)熟知的化學修飾技術修飾的氨基酸序列。這些修飾在基礎教科書中和在更詳細的專題著作以及大量的研究文獻中進行了很好的描述。修飾可發(fā)生在多肽的任何位置,包括肽主鏈、氨基酸側(cè)鏈,以及氨基或羧基末端。要認識到,相同類型的修飾可以以相同或不同的程度存在于給定多肽的幾個位置。同樣,給定的多肽可以包含許多類型的修飾。作為泛素化的結(jié)果,多肽可以是分支的,它們可以是環(huán)狀的,具有或不具有分支。環(huán)狀、分支和分支的環(huán)狀多肽可以是由于天然的翻譯后加工產(chǎn)生的或可以通過合成的方法產(chǎn)生。修飾包括乙酰化、酰化、ADP-核糖基化、酰胺化、黃素的共價附著、血紅素部分的共價附著、核苷酸或核苷酸衍生物的共價附著、脂類或脂類衍生物的共價附著、磷脂酰肌醇的共價附著、交聯(lián)、環(huán)化、二硫鍵形成、脫甲基作用、共價交聯(lián)的形成、胱氨酸的形成、焦谷氨酸鹽的形成、甲?;?、,g化、糖基化、糖基磷脂酰肌醇錨的形成(GPIanchorformation)、羥基化、碘化作用、甲基化、肉豆蔻?;?、氧化、蛋白酶解加工、磷酸化、異戊烯化、外消旋作用、硒?;?、硫酸鹽化作用、轉(zhuǎn)運RNA介導的M酸對蛋白質(zhì)的添加例如精氨?;头核鼗⒁?,例如,Proteins-StructureandMolecularProperties,第2版,T.E.Creighton,W.H.FreemanandCompany,NewYork,1993和Wold,F"PosttranslationalProteinModifications:PerspectivesandProspects,第1-12頁,在PosttranslationalCovalentModificationofProteins中,B.C.Johnson,編著,AcademicPress,NewYork,1983;Seifter等人,"AnalysisforProteinModificationsandNonproteinCofactors",MethEnzymol(1990)182:626-646和Rattan等人,"ProteinSynthesis:PosttranslationalModificationsandAging",AnnNYAcadSci(1992)663:48-62。作為在本文使用的術語"變體",是分別與參照多核苷酸或多肽不同但保持基本性質(zhì)的多核苷酸或多肽。多核苷酸的典型變體在核苷酸序列中與另一種參照多核苷酸不同。變體的核苷酸序列中的變化可以或可以不改變由參照多核苷酸編碼的多肽的氨基酸序列。核苷酸的改變可導致由參照序列編碼的多肽中的氨基酸取代、添加、缺失、融合和截短,如下面所討論的。多肽的典型變體在氨基酸序列上與另一種參照多肽不同。通常,差異是有限的從而參照多肽和變體的序列總體上非常相似,并且在許多區(qū)域是相同的。變體和參照多肽可以通過一個或多個取代、添加或缺失的任何組合在M酸序列上相異。取代或插入的氨基酸殘基可以是或可以不是由遺傳密碼子編碼的氨基酸。多核苷酸或多肽的變體可以是天然發(fā)生的,例如等位基因變體,或其可以是已知非天然發(fā)生的變體??赏ㄟ^誘變技術或通過直接的合成產(chǎn)生多核苷酸和多肽的非天然發(fā)生的變體。關于突變植物,術語"無效突變體"或"功能喪失突變體"用于表示具有突變的生物或基因組DNA序列,所述突變佳」基因產(chǎn)物無功能或大大喪失功能。此類突變可發(fā)生在基因的編碼區(qū)和/或調(diào)節(jié)區(qū),并且可以是單個殘基的改變或核酸區(qū)域的插入或缺失。這些突變也可以發(fā)生在可調(diào)節(jié)或調(diào)控基因和/或所編碼蛋白質(zhì)的其他基因編碼區(qū)和/或調(diào)節(jié)區(qū),從而使蛋白無功能或大大喪失其功能。術語"基本上相同的"是指核酸或M酸序列具有這樣的序列變化,其實質(zhì)上不影響蛋白質(zhì)的性質(zhì)(即蛋白質(zhì)的結(jié)構(gòu)、穩(wěn)定性特征、底物特異性和/或生物活性)。特別地對于核酸序列,術語"基本上相同的"意指編碼區(qū)和控制表達的保守序列,并且主要是指在所編碼多肽中編碼相同氨基酸的簡并密碼子或編碼保守取代氨基酸的備選密碼子。對于氨基酸序列,術語"基本上相同的"通常是指在結(jié)構(gòu)或功能決定中不涉及的多肽區(qū)域中的保守取代和/或變異。本文中術語"同一性百分比"和"相似性百分比"也用在氨基酸和核酸序列間的比較中。當涉及氨基^列時,"同一性"或"同一性百分比,,是指通過序列分析程序,目的氨基酸序列中與被比較M酸序列中相同M酸相匹配的氨基酸的百分比。"相似性百分比"是指與相同或保守氨基酸匹配的目的氨基酸序列中的氨基酸的百分比。保守氨基酸是結(jié)構(gòu)上不同但物理性質(zhì)相似的氨基酸,這樣彼此的交換將基本上不改變所得蛋白質(zhì)的三級結(jié)構(gòu)。在Taylor(1986,J.Theor.Biol.119:205)中定義了保守取代。當指核酸分子時,"同一性百分比"是指通過序列分析程序,目的核酸中與相同核苷酸匹配的核苷酸的百分比。"同一性"和"相似性"可容易地通過已知的方法計算??墒褂糜嬎銠C程序比較核酸序列和氨基酸序列,所述程序比對了核酸或氨基酸的類似序列并且因此確定了差異。在優(yōu)選方法中,使用本文所用的BLAST程序(NCBI)和參數(shù),并且使用DNAstar系統(tǒng)(Madison,WI)比對基因組DNA序列的序列片段。但是,可通過使用任何標準比對軟件獲得等同的比對和相似性/同一性評估。例如,也可4吏用從GeneticsComputerGroupinMadison,Wisconsin獲得的GCGWisconsinPackage版本9.1和該程序使用的默認參數(shù)(空位產(chǎn)生罰分=12,空位延伸罰分=4)比較序列同一性和相似性。"抗體",如本文使用的,包括多克隆抗體和單克隆抗體、嵌合抗體、單鏈和人源化抗體以及抗體片段(例如,F(xiàn)ab、Fab'、F(ab,)2和Fv),包括Fab或其他免疫球蛋白表達文庫的產(chǎn)物。關于抗體,術語"免疫學特異性"或"特異性"是指結(jié)合目的蛋白質(zhì)的一個或多個表位但基本上不識別和結(jié)合樣品中其他分子的抗體,所述樣品包含混合的抗原性生物分子群。確定抗體的結(jié)合特異性的篩選測定法在本領域是熟知的并且得到常規(guī)使用。關于該測定法的全面討論,參見Harlow等人(編著),ANTIBODIESALABORATORYMANUAL;ColdSpringHarborLaboratory;ColdSpringHarbor,NY(1988),第6章。術語"基本上純的"是指包含按重量計算至少50-60%的目的化合物(例如,核酸、寡核苷酸、蛋白質(zhì)等)的制品。更優(yōu)選,制品包含按重量計算至少75%,和最優(yōu)選按重量計算90-99%的目的化合物。通過適合用于目的化合物的方法(例如,色譜方法、瓊脂糖或聚丙烯酰胺凝膠電泳法、HPLC分析法等)測量純度。關于單鏈核酸分子,術語"特異性雜交"是指兩個足夠互補序列的單鏈核酸分子之間的締合,所述足夠互補是允許在預先確定的、本領域中常用的條件下進行雜交(有時稱為"基本上互補")。特別地,所述術語是指將寡核苷酸與單鏈DNA或RNA分子中包含的基本上互補的序列雜交,基本上排除寡核苷酸與非互補序列的單鏈核酸的雜交。"編碼序列"或"編碼區(qū)"是指核酸分子,所述核酸分子具有產(chǎn)生(當序列表達時)基因產(chǎn)物例如氨基酸或多肽所需的序列信息。編碼序列可在翻譯區(qū)內(nèi)包含非翻譯序列(例如,內(nèi)含子或5'或3'非翻譯區(qū)),或可缺少此類間插非翻譯序列(例如,如在cDNA中)。"內(nèi)含子"是指核酸中不編碼與蛋白質(zhì)合成相關的編碼信息的多核苷酸序列。這些序列被轉(zhuǎn)錄成mRNA,但在mRNA翻譯成蛋白質(zhì)之前被除去。術語"有效連接的"或"有效插入的"是指在相對于編碼序列的恰當位置將編碼序列表達所必需的調(diào)節(jié)序列置于核酸分子中,以使編碼序列能夠表達。例如,當啟動子能夠調(diào)控編碼序列的轉(zhuǎn)錄或表達時,啟動子與該編碼序列有效連接??梢砸杂辛x或反義方向?qū)⒕幋a序列有效連接至啟動子或調(diào)節(jié)序列。術語"有效連接"有時用于其他轉(zhuǎn)錄調(diào)節(jié)元件(例如,增強子)在表達載體中的排列。轉(zhuǎn)錄和翻譯調(diào)控序列在宿主細胞中提供編碼序列表達的DNA調(diào)節(jié)序列例如啟動子、增強子、多腺苷酸化信號、終止子等。術語"啟動子,,、"啟動子區(qū)域"或"啟動子序列"通常是指可在編碼區(qū)的5'或3'側(cè),或編碼區(qū)的內(nèi)部或內(nèi)含子的內(nèi)部發(fā)現(xiàn)的基因轉(zhuǎn)錄調(diào)節(jié)區(qū)。通常,啟動子是能夠在細胞中結(jié)合RNA聚合酶并且起始下游(3'方向)編碼序列轉(zhuǎn)錄的DNA調(diào)節(jié)區(qū)。典型的5'啟動子序列在其3'末端連接轉(zhuǎn)錄起始位點和向上游(5'方向)延伸以包含最小數(shù)目的堿基或元件,所述堿基或元件對于以高于背景的可檢測水平起始轉(zhuǎn)錄是必需的。轉(zhuǎn)錄起始位點(通過使用核酸酶Sl作圖方便地確定)和負責RNA聚合酶結(jié)合的蛋白質(zhì)結(jié)合結(jié)構(gòu)域(共有序列)在啟動子序列內(nèi)。"載體"是復制子,例如可有效連接另一種核酸區(qū)段從而引起該區(qū)段復制或表達的質(zhì)粒、噬菌體、粘?;虿《尽Pg語"核苷酸構(gòu)建體"或"DNA構(gòu)建體"有時用于指有效連接至適當調(diào)節(jié)序列并且被插入到用于轉(zhuǎn)化細胞的載體中的編碼序列。這一術語可與術語"轉(zhuǎn)化DNA,,或"轉(zhuǎn)基因"互換使用。這樣的核酸構(gòu)建體可包含目的基因產(chǎn)物的編碼序列和選擇標記基因和/或報道基因。"標記基因"或"選擇標記基因,,是其編碼的基因產(chǎn)物賦予了這樣的特征的基因,所述特征能夠使包含該基因的細胞從不包含該基因的細胞中選擇出來。用于遺傳工程的載體通常包含一種或多種選擇標記基因。選擇標記基因的類型包括(l)抗生素抗性基因,(2)除草劑耐受性或抗性基因,和(3)使轉(zhuǎn)化細胞能夠合成必需成分的帶型或營養(yǎng)缺陷型標記基因,所述必需成分通常為氨基酸,且為細胞本來不能產(chǎn)生的。"報道基因"也是一類標記基因。其通常編碼可通過標準實驗室方法(例如,酶促活性、熒光)測定或檢測的基因產(chǎn)物?;虻?表達"、"表達的"或"表達"術語是指基因產(chǎn)物的生物合成。該過程包括將基因轉(zhuǎn)錄成mRNA,然后將mRNA翻譯成一種或多種多肽,并且包括所有天然發(fā)生的翻譯后修飾。"內(nèi)源性,,是指可在特定的生物中天然發(fā)現(xiàn)的任何要素例如基因或核酸或多肽。核酸構(gòu)建體的"異源"區(qū)域是在更大的分子內(nèi)核酸分子的可鑒定區(qū)段,所述區(qū)段在自然界中未發(fā)現(xiàn)與該更大的分子相關。因此,當異源區(qū)域包含基因時,所述基因通常位于DNA側(cè)翼,所述DNA通常在來源生物基因組中不位于基因組DNA側(cè)翼。在另一個實例中,異源區(qū)域是其中編碼序列本身未在天然中^L^現(xiàn)(例如,其中基因組編碼序列包含內(nèi)含子或具有與天然基因不同的密碼子的合成序列的cDNA)的構(gòu)建體。等位基因變體或天然發(fā)生的突變事件不產(chǎn)生本文定義的DNA的異源區(qū)。術語"DNA構(gòu)建體",如上面所定義的,也用于指異源區(qū),特別是經(jīng)構(gòu)建用于細胞轉(zhuǎn)化的異源區(qū)。當外源性或異源性DNA被引入細胞內(nèi)時,則該細胞被該DNA"轉(zhuǎn)化,,或"轉(zhuǎn)染"。轉(zhuǎn)化DNA可以被或可以不被整合(共價連接)入細胞的基因組。在例如原核細胞、酵母和哺乳動物細胞中,可將轉(zhuǎn)化DNA保持在游離元件例如質(zhì)粒上。關于真核細胞,穩(wěn)定轉(zhuǎn)化的細胞是其中轉(zhuǎn)化DNA已整合入染色體內(nèi)從而使其通過染色體復制由子細胞遺傳的細胞。通過真核細胞建立細胞系或克隆的能力證明該穩(wěn)定性,所述細胞系或克隆由包含轉(zhuǎn)化DNA的子細胞群組成。"克隆,,是通過有絲分裂從單個細胞或共同祖先產(chǎn)生的細胞群。"細胞系"是能夠在體外穩(wěn)定地生長許多代的原代細胞的克隆。"種粒"、"種子"或"豆子"是指開花植物的生殖單位,其能夠發(fā)育成另一此類植物。如本文所用的,特別是對于咖啡植物,所述術語可同義地使用和可互換使用。如本文所用的,術語"植物"包括全植物、植物器官(例如,葉、莖、枝條、根)、種子、花粉、植物細胞、植物細胞的細胞器和其后代。要理解本發(fā)明范圍內(nèi)的轉(zhuǎn)基因植物的部分包括例如來源于轉(zhuǎn)基因植物或其后代的植物細胞、原生質(zhì)體、組織、愈傷組織、胚胎以及花、莖、種子、花粉、果實、葉子或#>。術語"滲透脅迫"是指對植物的任何脅迫,其破壞植物細胞或完整植物中的正常水分、糖或電解質(zhì)濃度。滲透脅迫可以是與環(huán)境相關的,例如長期低水分或干燥、低溫、霜凍、結(jié)水溫度、土壤中的高鹽含量等的條件。滲透脅迫也可天然發(fā)生,例如預計種子發(fā)育和成熟也會發(fā)生。描述本發(fā)明的一個方面表征了來自咖啡的核酸分子,所述核酸分子編碼多種脫水蛋白和一種其他的LEA(胚胎發(fā)育后期富集)蛋白。從來自幾個中果咖啡(羅巴斯;荅咖啡(robusta))cDNA文庫的47,000多個表達序列標簽(EST)的數(shù)據(jù)庫鑒定編碼脫水蛋白和LEA的核酸分子的代表性實例,所述cDNA文庫是用RNA制備的,所述RNA是從嫩葉和從在發(fā)育不同階段收獲的漿果種粒和果皮組織分離的。鑒定重疊的EST并將其"串成"包含完全的編碼序列的單基因(unigene,重疊群)。通過對NCBI(美國國家生物技術信息中心)無冗余蛋白質(zhì)數(shù)據(jù)庫進行各個序列的BLAST搜索來注釋單基因序列。DNA序列分析顯示代表3種不同脫水蛋白基因和一種LEA基因的5個獨特的序列。這些cDNA本文稱為CcDHla(SEQIDNO:l)、CcDHlb(SEQIDNO:2)、CcDH2a(SEQIDNO:3)、CcDH2b(SEQIDNO:4)和CcDH3(SEQIDNO:5)。發(fā)現(xiàn)CcDHla和CcDHlb彼此是等位基因變體,而發(fā)現(xiàn)兩個不同的單基因編碼CcDH2的可讀框。此外,從分離自受精后30周的咖啡種粒的RNA構(gòu)建的cDNA文庫分析顯示了編碼咖啡LEA蛋白質(zhì)的全長cDNA克隆。該cDNA在此稱為CcLEAl(SEQIDNO:6)。推導的CcDHla-CcDH3的氨基酸序列在本文顯示為SEQIDNO:7-11。所述蛋白質(zhì)具有大約17.8kDa(CcDHla,SEQIDNO:7)、18.1kDa(CcDHlbSEQIDNO:8)、17.4kDa(CcDH2a和CcDH2b,SEQIDNO:9和IO)和21.5kDa(CcDH3,SEQIDNO:ll)的分子量。已發(fā)現(xiàn)這些蛋白質(zhì)包含特征脫水蛋白氨基g序,并且根據(jù)這些基序?qū)λ龅鞍走M行了分類。CcDHla、CcDHlb、和CcDH2(a和b)具有結(jié)構(gòu)Y3SK2,并且CcDH3具有結(jié)構(gòu)SK3。CcDHla和CcDHlb在所述三個基序的各基序中和兩個K基序的各基序前的兩個保守區(qū)中顯示絕對的保守。相反地,CcDH2在所有Y、S和K基序(除了一個以外)中顯示點差異(punctualdifference),并且在這些脫水蛋白特異性基序之外顯示更顯著的差異。親水性圖顯示本文鑒定的所有咖啡脫水蛋白各部分都非常親水(參見圖8)。推導的由CcLEAl編碼的氨基酸序列在本文顯示為SEQIDNO:12。該蛋白質(zhì)具有大約39.5kDa的分子量。該蛋白質(zhì)的親水性圖顯示該蛋白質(zhì)親水性比脫水蛋白分子低,并且存在2個小的疏水區(qū),其中一個位于其第一個30個N末端殘基內(nèi)。也發(fā)現(xiàn)CcLEAl的N末端包含顯著的富含脯氨酸的區(qū)段。本發(fā)明的另一個方面表征了調(diào)控脫水蛋白基因在咖啡中表達的啟動子序列和相關元件。如在實施例中更詳細描述的,通過PCR輔助引物步測法鑒定了來自CcDH2a的啟動子序列(包含在SEQIDNO:13中)。顯示CcDH2啟動子包含一些調(diào)節(jié)元件,所述調(diào)節(jié)元件類似于之前在其他種類中表征的在種子發(fā)育期間參與調(diào)節(jié)基因表達的那些調(diào)節(jié)元件。這些CcDH2調(diào)節(jié)元件顯示于圖7中和描述于實施例中。通過使用連接至GUS報道基因的該啟動子,已確定該啟動子對于種子、長角果、子葉、下胚軸和發(fā)育幼苗的第一真葉是特異性的。此外,如實施例中所述,也已顯示CcDHl和CcDH2基因的表達受到干旱脅迫和其他脅迫條件誘導。盡管本文描述和舉例說明了來自中果咖啡的編碼脫水蛋白和LEA蛋白質(zhì)的多核苷酸,本發(fā)明旨在包括來自其他咖啡物種的核酸和所編碼的蛋白質(zhì),所述核酸和編碼的蛋白質(zhì)與中果咖啡的多核苷酸和蛋白質(zhì)充分相似從而可與其互換使用,以用于下文描述的目的。因此,當在本文使用術語"脫水蛋白"或"胚胎發(fā)育后期富集(LEA)蛋白"時,它們意在包括具有本文描述的一般物理、生物化學和功能特性的所有咖啡脫水蛋白或LEA蛋白質(zhì)以及編碼它們的多核苷酸??紤]到其序列方面,本發(fā)明的編碼脫水蛋白和胚胎發(fā)育后期富集蛋白的多核苷酸包括可能在不同中果咖啡品種中發(fā)現(xiàn)的SEQIDNO:1-6的等位基因變體和天然突變體,和可能在不同的咖啡物種中發(fā)現(xiàn)的SEQIDNO:1-6的同系物。因為預期這類變體和同系物在核苷酸和氨基酸序列方面具有某些差異,本發(fā)明提供了分離的編碼脫水蛋白或LEA蛋白質(zhì)的核酸分子,所述核酸分子編碼與SEQIDNO:7-12中的任一個具有至少大約40%、45%、50%或55%,優(yōu)選至少大約60、65或70%,更優(yōu)選至少大約71%、72%、73%、74%、75%、76%、77%.78%、79%或80%,甚至更優(yōu)選81%、82%、83%、84%、85%、86%、87%、88%、89%和進一步更優(yōu)選90%、91%、92%、93%、94%、95%,和最優(yōu)選96%、97%、98%和99%或更高的同一性的各個多肽,并且包含具有與SEQIDNO:1-6中的任一個具有相同范圍同一性的核苷酸序列。因為天然序列變異可能存在于不同咖啡品種和物種的脫水蛋白和LEA蛋白質(zhì)以及編碼它們的基因中,因此本領域技術人員預期發(fā)現(xiàn)該水平的變異,同時仍然保持本發(fā)明的多肽和多核苷酸的獨特性質(zhì)。這樣的預期部分由于遺傳密碼子的簡并性以及由于已知的保守氨基酸序列變異的成功進化而導致的,所述變異基本上不改變編碼的蛋白質(zhì)的性質(zhì)。因此,認為這些變體和同系物基本上彼此相同并且包含在本發(fā)明的范圍內(nèi)。如所提到的,本發(fā)明人已證明某些脫水蛋白或LEA蛋白質(zhì)基因的表達在咖啡中是種子、長角果和幼苗特異性的,并且可由干旱和其他形式的脅迫誘導。因此,與編碼脫水蛋白和LEA蛋白質(zhì)的基因相關的基因調(diào)節(jié)序列具有實際功用并且被認為在本發(fā)明的范圍內(nèi)。本文舉例說明了中果咖啡DH2啟動子。中果咖啡D好2基因組序列的上游區(qū)域在本文顯示為SEQIDNO:13,并且包含部分或全部本發(fā)明的示例性啟動子,盡管如在上文中所示的"啟動子"的定義中所解釋的,可在基因中的其他位置發(fā)現(xiàn)啟動子的其他部分。然而,可通過下面描述的方法獲得來自任何咖啡物種的脫水蛋白和LEA蛋白質(zhì)基因的啟動子和其他基因調(diào)節(jié)序列,并且根據(jù)本發(fā)明使用所述序列。除其他功用以外,可有利地使用控制脫水蛋白和LEA蛋白質(zhì)基因表達的組織特異性和時間特異性的啟動子和調(diào)節(jié)元件,來改變或修*飾多種咖啡物種的滲透脅迫耐受性。下列部分闡明了涉及實踐本發(fā)明的一般方法。對于所提及的具體材料來說,只是為了舉例說明,而不希望限定本發(fā)明。除非另外明確說明,使用一般的生物化學和分子生物學方法,例如Sambrook等人,MolecularCloning,ColdSpringHarborLaboratory(1989)或Ausubel等人(編著),CurrentProtocolsinMolecularBiology,JohnWiley&Sons(2005)中所示的方法。核酸分子、蛋白質(zhì)和抗體可通過兩種常用方法制備本發(fā)明的核酸分子,所述方法是(1)可從適當?shù)暮塑账崛姿岷铣伤鼈?,?2)可從生物來源分離它們。兩種方法都使用本領域內(nèi)熟知的方案。核苷酸序列信息,例如具有SEQIDNO:1-6的cDNA或SEQIDNO:13的調(diào)節(jié)序列的信息,使得能夠通過寡核苷酸合成制備本發(fā)明分離的核酸分子??赏ㄟ^在AppliedBiosystems38ADNA合成儀或類似的設備中使用的亞磷酰胺法制備合成的寡核苷酸。按照本領域內(nèi)已知的方法例如高效液相色譜(HPLC)純化所得的構(gòu)建體。由于目前的寡核苷酸合成方法中固有的大小限制的原因,長雙鏈多核苷酸例如本發(fā)明的DNA分子必須分階段合成。因此,可以以幾個更小的具有合適的互補性的區(qū)段合成長雙鏈分子。可將所產(chǎn)生的互補區(qū)段退火,這樣各個區(qū)段具有用于附著相鄰區(qū)段的適當?shù)恼承阅┒???赏ㄟ^在DNA連接酶存在的情況下將粘性末端退火來連接相鄰的片段,從而構(gòu)建完整的長雙鏈分子。然后可將如此構(gòu)建的合成DNA分子克隆入合適的載體并在該載體中擴增。根據(jù)本發(fā)明,可通過使用適當?shù)膰栏裥缘碾s交和洗涂條件來鑒定核酸,所述核酸與編碼脫水蛋白或LEA蛋白質(zhì)的多核苷酸的部分或所有編碼和/或調(diào)節(jié)區(qū)有適當水平的序列同源性。本領域技術人員將認識到,當用于基因組序列時,上述方法除了使得能夠分離編碼脫水蛋白或LEA蛋白質(zhì)的序列外,也使得能夠分離與脫水蛋白或LEA蛋白質(zhì)基因相關的啟動子和其他基因調(diào)節(jié)序列,即使調(diào)節(jié)序列本身可以不共有足夠的同源性來產(chǎn)生適當?shù)碾s交。此外,至少部分編碼序列的注釋使得本領域技術人員能夠通過上游或下游基因組步測法確定其余編碼序列,以及與目的脫7JC蛋白或LEA蛋白質(zhì)相關的啟動子或其他基因調(diào)節(jié)序列。本領域內(nèi)建立了此類技術。(MishraRN等人,2002;RishiAS等人,2004)。作為典型的舉例說明,可按照Sambrook等人的方法,使用雜交溶液進4亍雜交,所述雜交溶液包含5xSSC、5xDenhardt's試劑、1.0%SDS、100ng/ml變性的、片段化的鮭精DNA、0.05%焦磷酸鈉和多至50%的甲酰胺。在37-42。C下進行雜交至少6小時。雜交后,如下洗滌濾器(1)在室溫下在2xSSC和1%SDS中進行5分鐘;(2)在室溫下在2xSSC和0.1%SDS中進行15分鐘;(3)在37。C下在2xSSC和0.1%SDS中進行30分鐘到1小時;(4)在45-55。C下在2xSSC和0.1%SDS中進行2小時,每30分鐘更換溶液。用于計算實現(xiàn)具有特定的序列同源性的核酸分子之間的雜交所需要的嚴格性條件的一個通式(Sambrook等人,1989):Tm=81.5+16.6Log[Na++0.41(%G+C)誦0.63(%曱酰胺)一600/雙鏈體形式的弁bp作為上式的示例,使用[Na+=:針。然后使用"rediprimeTMIIrandomprimelabelingsystem,,試劑盒(Amersham)用[32P]dCTP標記該PCR產(chǎn)物。實施例5咖啡脫水蛋白cDNA的鑒定和表征從幾個用RNA產(chǎn)生的咖啡文庫產(chǎn)生47,000多個EST序列,所述RNA是從嫩葉和從不同的發(fā)育階段收獲的漿果的種粒和果皮組織分離的RNA。隨后將重疊的EST"串成""單基因"(即,重疊群),然后通過對NCBI無冗余蛋白質(zhì)數(shù)據(jù)庫進行各個序列的BLAST搜索來注釋單基因序列。使用多種方法就脫水蛋白序列篩選單基因,所述方法包括使用關鍵詞"脫水蛋白,,搜索單基因注釋,以及通過在咖啡單基因組的tBlastn搜索中使用多種擬南芥和蕃茄脫水蛋白序列搜索單基因注釋。多種搜索方法產(chǎn)生幾個候選脫水蛋白單基因,并且從文庫分離這些單基因中每個的潛在最長cDNA克隆,然后對其進行完全測序(表2)。表2.編碼脫水蛋白和LEA蛋白質(zhì)的全長中果咖啡cDNA和針對各序列發(fā)現(xiàn)的EST的數(shù)目。在括號中給出了各質(zhì)粒的單基因號和分子量cccl26i7(單基因121870;17.8kDa);cccs30w27m8(單基因121870;18.1kDa);cccs30w8a4(單基因123406;17.4kDa);cccs46w30pl(單基因123405;17.4kDa);cccwc22wlla5(單基因123385;25.1kDa);DavI-59(單基因119994;39.5kDa)。<table>tableseeoriginaldocumentpage41</column></row><table>所選擇的全長cDNA克隆的DNA序列分析顯示了4個代表3種不同的脫水蛋白基因的單一序列。對應的基因稱為CcDHl、CcDH2和CcDH3。通過單基因#121870中的兩個最長cDNA序列的測序來鑒定CcDHl基因的兩個明顯的等位基因序列。cDNA克隆CcDHla和CcDHlb的長度分別為836和896bp。兩個ORP序列顯示出5個單個堿基改變,并且CcDHlb具有9個堿基的插入。這些差異翻譯成6個氨基酸差異。CcDHla和CcDHlb編碼分別具有預測的大約17.8kDa和18.1kD的分子量的172個氨基酸和175個氨基酸的蛋白質(zhì)。發(fā)現(xiàn)兩個不同的單基因,#123406和#123405,其編碼CcDH2的ORF。單基因#123405(CcDH2b)由2個EST組成并且與單基因序列#123406(CcDH2a)的不同在于內(nèi)含子序列的存在。當對DH2b的cDNA(cccs46w30pl)的內(nèi)含子/外顯子邊界進行更細致的檢查時,觀察到3'連接具有序列ttatgg/TCG,而通過基因組步測法(參見下面)獲得的其他基因組序列具有序列ttatag/T(A)CGG??傊?,cDNAcccs46w30pl的內(nèi)含子序列和基因組DNA中的內(nèi)含子序列幾乎相同。因為在可獲得的所有三個基因組內(nèi)含子序列中沒有出現(xiàn)單個堿基改變,所以CcDH2b的3'剪接位點序列的改變似乎可以是該cDNA的異常剪接的原因。756bpcDNApcccs30w8a4(CcDH2a)編碼具有預測為17.4kDa分子量的長為162個氨基酸的蛋白質(zhì)。發(fā)現(xiàn)了CcDH3(#123385)的一個單基因。由CcDH3編碼的蛋白質(zhì)序列表明該833bpcDNA編碼具有預測的大約25.1kDa的分子量的227個氨基酸的蛋白質(zhì)。將咖啡脫氷蛋白的蛋白質(zhì)序列與無冗余蛋白質(zhì)數(shù)據(jù)庫中發(fā)現(xiàn)的最同源的蛋白質(zhì)序列比對,也就脫水蛋白特異性氨基酸基序Y、S和K的存在對其進行分析。圖l和2顯示3個脫水蛋白分成兩類,CcCDHla、CcDHlb和CcDH2a具有結(jié)構(gòu)YsSK2而CcDH3具有結(jié)構(gòu)SK3。在具有Y3SK2結(jié)構(gòu)的那些蛋白質(zhì)序列中,CcDHla和CcDHlb在三個基序的每一個基序中和兩K基序的每一個基序之前的兩個保守區(qū)域中顯示絕對的保守性。該觀察和存在的小序列差異發(fā)生在被比對序列的最少保守區(qū)中的事實與CcDHla和CcDHlb是等位基因的想法一致。相反地,CcDH2a明顯與CcDHl不同。盡管CcDH2a具有結(jié)構(gòu)Y3SK2,但其也在幾乎所有Y、S和K基序中表現(xiàn)出點差異,并且在這些脫水蛋白特異性基序外表現(xiàn)出更明顯的差異。CcDHl和CcDH2編碼具有經(jīng)計算接近中性的pl的蛋白質(zhì),并且它們的親水性圖表明這些蛋白質(zhì)全部都是非常親水的。由CcDH3編碼的蛋白質(zhì)的經(jīng)計算pl為微酸性(5.47),并且如圖8中的Kyte-Doolittle親水性圖所示該蛋白質(zhì)也是非常親水的。實施例6編碼咖啡LEA蛋白質(zhì)的cDNA的特征從來自受精后30周的咖啡種粒制備的RNA構(gòu)建cDNA文庫。從該文庫分離編碼LEA蛋白質(zhì)的全長cDNA克隆(Davl-59)并對其進行測序。將該cDNA克隆重新命名為CcLEAl。此外,就注釋為LEA蛋白質(zhì)的"單基因,,搜尋EST數(shù)據(jù)庫。該搜尋產(chǎn)生9個單基因序列,其中一個(單基因弁119994)對應于前面分離的CcLEAl的序列(表3)。EST分析表明CcLEAl只在種粒發(fā)育的一個時期(開花后30周)強烈而唯一地表達。表3.注釋為LEA蛋白質(zhì)的中果咖啡單基因序列<table>tableseeoriginaldocumentpage43</column></row><table>由CcLEAl編碼的蛋白質(zhì)是358個氨基酸,其具有預測的39.5kDa的分子量。CcLEAl的經(jīng)計算的pl為微堿性(8.17),并且親水性圖顯示盡管該蛋白質(zhì)不具有顯著的疏水區(qū),但其不如三個咖啡脫水蛋白親水。CcLEAl的前30個N末端殘基在此蛋白質(zhì)中形成了的2個小疏水區(qū)之一。圖3顯示CcLEAl與無冗余蛋白質(zhì)數(shù)據(jù)庫中發(fā)現(xiàn)的3個最同源序列的比對。這些比對的序列的總同一性值只在34.7%(對于擬南芥序列)至47.9%(對于云杉(白云杉)序列)的范圍內(nèi)變化。然而,在這些蛋白質(zhì)中存在短的、高度保守的區(qū)域。所有相關蛋白質(zhì)序列具有與CcLEAl相對相似的親水性特征譜,并且一般地,可在N末端的1-25個氨基酸中發(fā)現(xiàn)蛋白質(zhì)最顯著的疏水斑。也發(fā)現(xiàn)CcLEAl在N端區(qū)包含富含脯氨酸的區(qū)段,該區(qū)段在圖3中的其他蛋白質(zhì)中不存在。實施例7在不同的咖啡組織中和咖啡種粒發(fā)育期間CcDHl、CcDH2、CcDH3和CcLEA-l基因的RT-PCR表達因為EST文庫未進行歸一化,并將其進行深度取樣,因此各單基因中發(fā)現(xiàn)的EST數(shù)目給出了各取樣組織中該基因表達水平的粗略估量。表2(上面)顯示了CcDHl和CcDH2在受精后30和46周在種粒中強烈表達,但在果皮文庫中未^皮檢測到,且在受精后22周在整個漿果(發(fā)育的種粒+果皮)中也未被檢測到。CcDHl和CcDH2均在葉中表達,盡管CcDHl可在嫩葉中以高于CcDH2的水平表達。在受精后46周的種粒中,以及在嫩葉中檢測到CcDH3的表達,盡管在22周在整個漿果樣品中也觀察到2個EST。為了擴展表達數(shù)據(jù),對3個咖啡脫水蛋白基因中的每一個基因進行RT-PCR分析。圖4顯示該分析的結(jié)果。CcDHl在小果咖啡種粒的所有檢查階段,以及羅巴斯塔咖啡的最后3個檢查階段中都顯著表達,也可在其他受試組織中檢測到CcDHl的表達,盡管對于小果咖啡在小綠色果皮和黃色果皮樣品,或?qū)τ诹_巴斯塔咖啡根或葉樣品中沒有檢測到信號。在這些具有CcDHl表達的組織中,小果咖啡花樣品似乎具有最高水平的轉(zhuǎn)錄物。在小果咖啡的所有種粒發(fā)育階段和羅巴斯塔咖啡種粒的最后三個階段檢測到相對高水平的CcDH2轉(zhuǎn)錄物(圖4)。與CcDHl相反,通過RT-PCR在其他研究的組織中未檢測到CcDH2轉(zhuǎn)錄物。通過TaqMan定量RT-PCR確認在除了種粒的組織中不存在顯著水平的CcDH2轉(zhuǎn)錄物以及該基因在羅巴斯塔咖啡中的晚期誘導(圖5)。將CcDH2的表達與CcRPL39基因(RPL39編碼核糖體大亞基蛋白質(zhì)#39)的組成型表達轉(zhuǎn)錄物比較。所述比較顯示CcDH2的表達在羅巴斯塔咖啡中逐漸增加,從大綠色階段直至成熟的紅色階段。相反地,小果咖啡的定量RT-PCR數(shù)據(jù)顯示在大綠色階段檢測到最高水平的CcDH2轉(zhuǎn)錄物并且轉(zhuǎn)錄物水平隨著成熟進程發(fā)展有所降低。CcDH3基因表達的RT-PCR分析顯示也在所有小果咖啡種粒樣品中和羅巴斯塔咖啡種粒發(fā)育的最后3個階段檢測到這些轉(zhuǎn)錄物的顯著水平(圖4)。CcDH3轉(zhuǎn)錄物在一些其他組織例如紅色果皮、莖和花中的水平和在種粒中的水平幾乎一樣高。原始數(shù)據(jù)的檢查顯示可在所有其他被檢查的小果咖啡和羅巴斯塔咖啡的組織中檢測到CcDH3轉(zhuǎn)錄物。然而,注意到羅巴斯塔咖啡和小果咖啡的前3個果皮階段的轉(zhuǎn)錄物水平之間有顯著差異。也通過RT-PCR估量CcLEAl的表達。獲得的數(shù)據(jù)驗證了該基因具有非常獨特的表達模式,轉(zhuǎn)錄物只在小果咖啡的小綠色階段和羅巴斯塔咖啡種粒的大綠色階段檢測到(圖4)。在任何其他取樣的小果咖啡或羅巴斯塔咖啡的組織中未檢測到表達。該數(shù)據(jù)與表3中看到的該基因的EST的分布模式一致,這表明該基因在30WAF的羅巴斯塔咖啡種粒中表達,而不在任何其他種粒、漿果或葉的EST文庫中表達。實施例8CcDH2啟動子的序列分析CcDH2是適度表達的種粒特異性基因。進行Southern印跡法以確定表達水平是獲自具有單/低拷貝數(shù)的基因還是獲自多拷貝基因。如圖6中所示,每次消化只產(chǎn)生一個條帶,這表明CcDH2在中果咖啡基因組中可能由單基因編碼。使用引物步測技術分離整合了CcDH2啟動子的基因組片段。使用從cDNAcccs30w8a4的中心設計的CcDH2特異性基因組步測引物(DH2a引物l)和GenomeWalker試劑盒的API引物進行DNA的PCR擴增。產(chǎn)生和克隆位于cccs30w8a4cDNA序歹'J(中果咖啡)上游1.43kb處的2.1kb基因組片段。從包含基因組和cDNA序列的重疊質(zhì)粒獲得的復合序列的序列分析顯示CcDH2基因包含位于ORF區(qū)內(nèi)的單個內(nèi)含子(231bp)(圖7)。該基因啟動子區(qū)域的進一步分析顯示cDNA序列5'末端上游30bp處存在假定的TATA序列。也在CcDH2基因的5'上游區(qū)域中鑒定了幾個前面顯示的在種子發(fā)育期間參與基因表達調(diào)節(jié)的潛在調(diào)節(jié)元件。例如,發(fā)現(xiàn)與擬南芥ABS應答元件RYACGTGGYR(SEQIDNO:42)具有相似性的3個區(qū)域。發(fā)現(xiàn)與"豆球蛋白"盒中的核心區(qū)的RY重復(CATGCA(T/a)(A/g)共有顯著相似性的兩個元件,所述豆球蛋白盒參與調(diào)節(jié)豆球蛋白類型的貯存蛋白質(zhì)的表達。也鑒定了兩個脫水應答元件/C-重復(DRE/CRT)順式作用序列基序(G/ACCGAC)的存在。以前已顯示在擬南芥和稻中,DRE/CRT基序與DREB/CBF轉(zhuǎn)錄因子相互作用以控制所連接基因?qū)γ撍推渌{迫的應答。(DubouzetJG,PlantJ.33:751-763(2003))。此外,在CcDH2的啟動子區(qū)域鑒定了幾個E盒基序(CANNTG),所述基序是貯存蛋白質(zhì)例如2S蛋白質(zhì)啟動子中的良好確定的組件(ChatthaiM,PlantPhysiolBiochem42:417-423(2004))。實施例9擬南芥中咖啡脫水蛋白啟動子CcDH2的功能分析檢查在CcDH2啟動子控制下的編碼p-葡糖醛酸糖苷酶(GUS)的報道基因在擬南芥中的表達。#存和才法在提供商(Stratagene)描述的條件下使用聚合酶Pful和引物TG-ttgaagGttGTGGACATOACGGAAGAOGT(SEQIDNO,:43)和TG-TG743gcagatetaecatggAGGACTCCTGTTATTAGAAAA(SEQIDNO,:44)擴增來自pVCl的脫水蛋白DH2啟動子序列。然后用HindIII和BglII切割這樣獲得的PCR片段,然后將該片段克隆入植物轉(zhuǎn)化載體pCAMBIA1301的flindlll/Bglll位點。這將包含脫水蛋白啟動子序列和完整的脫水蛋白cDNA5'非翻譯區(qū)(大約80bp)的大約1.3kb的片段置于GUS的2bpATG(GUS的第一外顯示子)內(nèi)。通過測序驗證啟動子的正確定位。包含新脫水蛋白CcDH2啟動子的載體稱為pCAMBIA1301UCD2.4。植物轉(zhuǎn)化。然后使用標準方法將轉(zhuǎn)化載體pCAMBIA1301UCD2.4轉(zhuǎn)化入根瘤農(nóng)桿菌(Jgra6"cteW"w似附e/flrc/e")林系EHA105中。由2x35S啟動子驅(qū)動的潮霉素抗性基因是pCAMBIA1301中的植物選擇性標記。使用花器浸蘸法(floral-dipmethod)(Clough和Bent,1998)進行根瘤農(nóng)桿菌介導的擬南芥轉(zhuǎn)化(使用質(zhì)粒pCAMBIAl301UCD2.4)。通過將種子種植在包含lmM硝酸鈉和50ng/ml潮霉素的0.8%瓊脂上來鑒定轉(zhuǎn)化的植物。在種植后7天當植物具有延長的初生根時鑒定轉(zhuǎn)化的幼苗。將幼苗轉(zhuǎn)移至包含0.5xM&S鹽的0.8%瓊脂中。此后當?shù)诙θ~發(fā)育時,將植物轉(zhuǎn)移至土壤中,讓其生長成熟并結(jié)種子(T1)。在一些情況下,萌發(fā)T1種子,然后讓其生長并結(jié)種子(T2)。GUS染色。GUS染色檢測的幼苗和長角果來自T1或T2種子,并且處于不同的發(fā)育階段。通過將5mgX-Gluc溶解在50jil二曱基曱酰胺中,然后將其加入50mMNaP04pH7.0(10ml)中來制備GUS染色溶液。使用精細鑷,將幼苗從萌發(fā)板轉(zhuǎn)移入裝有1.0mlGUS染料的1.5ml微量離心管中。將該管轉(zhuǎn)移至干燥器中并在真空下放置10分鐘,然后在37。C(在黑暗中)下溫育24或48小時。移去染料并用脫色液(70%乙醇)替代。通過將管置于37。C加速清洗。根據(jù)組織中色素的量,需要更換幾次70。/。乙醇。在解剖顯微鏡下觀察染色的幼苗和其他組織,并通過數(shù)字技術記錄圖像。在長角果的情況下,從植物中取出長角果,然后用解剖刀打開以允許染料滲入。改進方法中使用的GUS染料以包含0.5%TritonXIOO。在染色后,通過在乙醇:醋酸(2:1)中溫育,然后在Hoyer,sLight培養(yǎng)基(60ml水中的100g水合氯醛)中溫育來對長角果脫色。在乙醇醋酸溶液中預溫育具有較幼嫩種子的長角果4小時,具有較老種子的長角果8小時。在Hoyer'sLight培養(yǎng)基中清洗長角果24小時至數(shù)天。結(jié)果觀察用pCaml301UCD2-4轉(zhuǎn)化的擬南芥中GUS的表達。發(fā)現(xiàn)GUS表達在子葉中和一周齡的幼苗下胚軸中是豐富的。在兩周齡的幼苗中,GUS染色在前兩片子葉中仍然豐富,在第一片真葉中水平較低。在根中或在第二對發(fā)育的葉中未明顯地檢測到GUS活性。在成熟的葉中沒有檢測到表達。在長角果莢(wall)中和發(fā)育的種子中也檢測到GUS表達。Tl系種子的48小時GUS染色使得一些種子對于GUS活性為陽性而其他種子為陰性??傊?,本實施例中提供的數(shù)據(jù)驗證了咖啡脫水蛋白啟動子CcDH2驅(qū)動所連接基因(在該情況下為GUS)強烈地在種子、長角果和正在萌發(fā)的種子的第一子葉和下胚軸中表達。該結(jié)果證明本文描述的CcDH2啟動子序列包含在植物中驅(qū)動種子特異性基因表達所需的所有功能性元件。獲得的數(shù)據(jù)也表明CcDH2啟動子可用于驅(qū)動基因在未成熟組織例如來源于幼苗的頭兩片子葉的胚中表達。此外,該數(shù)據(jù)表明CcDH2啟動子在其他組織中被激活,所述其他組織注定將經(jīng)歷干燥,例如長角果。最后,假定擬南芥和咖啡之間進化距離相對很大,本文提供的數(shù)據(jù)顯示咖啡CcDH2啟動子在擬南芥中起作用,這暗示著該啟動子應當在相對廣泛的植物中發(fā)揮作用。實施例10編碼咖啡脫水蛋白CcDHl和CcDH2的基因的滲透脅迫誘導的表達已知脫水蛋白基因受到多種滲透脅迫形式的誘導。因此,進行評估以確定咖啡CcDHl和CcDH2基因是否由不同的滲透脅迫誘導。材料和方法使用小克隆繁殖的、生長在溫室中的小果咖啡catimor樹進行脫水實驗。所述樹為大約3年樹齡并且在土壤中生長。在實驗前幾周,將樹全部栽培在溫室(大約25。C的溫度、大約70%的相對濕度)中,使用自動灌溉每天給樹澆水。在實驗開始時,3株樹用作對照,并每天用水澆灌。另外3林不澆水,從而經(jīng)歷漸進脫水。每一周對每一林樹進行2片嫩葉(大小5-8cm,采自植物頂端剛冒出的生長物)取樣,然后直接將樣品冷凍在液氮中。RNA提取和cDNA合成。使用QiagenGmbH(Hilden,德國)的RNEASYPlantmini試劑盒對經(jīng)歷多種脅迫處理和對照的組織樣品進行提取。開始時使用液氮冷凍將組織樣品在研缽和研扦中研磨以獲得粉末。然后按照RNEASYPlantmini試劑盒的方案提取該冷凍粉末中的RNA。簡而言之,將最大100mg的冷凍粉末與細胞裂解緩沖液和p巰基乙醇混合。對于顯示顯著壞死的組織,也加入2fiMPMSF。為了消除低水平的污染性基因組DNA,使用(按照提供商所描述的)利用RNEASYPlantmini試劑盒中包含的不含RNA酶的DNA酶進行處理,即,室溫下在柱子上進行15分鐘處理。結(jié)束時,在50jiL不含RNA酶的水中從柱子中洗脫RNA。通過在260nm處的分光光度計測量確定RNA的量,并且通過計算260nm/280nm的吸光度比值估計RNA的質(zhì)量。也通過在1%的瓊脂糖凝膠上電泳檢驗RNA的質(zhì)量。如下進行這些RNA樣品的反轉(zhuǎn)錄反應將大約1jig總RNA和12.4nM寡聚-dT[2.3nl70jiM寡聚-dT(Proligo)和不含RNA酶的水一起加至13jiL的終體積。在65。C下溫育該混合物5分鐘。然后,加入7jiL5x緩沖液(TRANSCRIPTOR⑧RT反應緩沖液)、20URNA酶抑制劑、lmM的四種dNTP(各250nm)和10U的TRANSCRIPTOR反轉(zhuǎn)錄酶(Roche,Nutley,NJ)的混合物。在55。C下溫育該混合物40分鐘。最后,然后向20pL混合物中加入0.5nLRNA酶H(Invitrogen,Carlsbad,CA),然后將反應物在37。C下進一步溫育30分鐘。按照廠商提供的方案,使用Invitrogen(Carlsbad,CA)的SNAPTM凝膠純化試劑盒純化產(chǎn)生的cDNA。引物和MGB-探針的設計。使用PRIMEREXPRESS軟件(AppliedBiosystems,F(xiàn)osterCity,CA)設計引物和MGB探針組。引物雜交的溫度為大約60°C,而MGB探針的雜交溫度接近70'C。擴增子的大小為大約80bp。通過PROLIGO合成引物,并且按照廠商說明書(AppliedBiosystems,FosterCity,CA)合成MGB探針。上面的表1中已表明了CcDH2和Ccrpl39的引物和探針的序歹(J。CcDHl的引物是5'CACTGGCACTACTGGAGCCTATG3'(SEQIDNO.:45)和5'GCTGGGTGGCGTATGCA3'。CcDHl的MGB探針是5,CTGGAGCACATGGGA3'(SEQIDNO.:46)。實時定量RT-PCR。如上所述制備用于這些實驗的cDNA。按照廠商(AppliedBiosystems,Perkin-Elmer)所推薦的和上面所描述的進4亍TaqMan-PCR。簡而言之,所有反應物為25jiL體積,并且包含5nlcDNA、1xTaqMan緩沖液(AppliedBiosystems)、5mMMgCl2、dATP、dCTP、dGTP和dUTP每種200fiM和0.625個單位的AmpliTaqGoldDNA聚合酶。AppliedBiosystems反應緩沖液包含AmpEraseUNG(尿嘧咬-N-糖苷酶)和Passive參照染料(ROXTM)以及最優(yōu)化緩沖組分。使用800nM的基因特異性引物(正向和反向的)和200nMTaqMan探針以及5pL的100倍稀釋cDNA(其對應于大約0.01jig的總RNA)進行PCR反應。將反應物在50。C下溫育2分鐘,然后在95。C下溫育10分鐘,接著進行40個擴增循環(huán)(95°C下進行15秒/6(TC下進行1分鐘)。進行反應,并且使用GeneAmp7500序列檢測系統(tǒng)(AppliedBiosystems)進行分析。對各樣品進行3次反應,并且計算平均值。使用相對定量的方法進行定量,對于每個樣品,使用核糖體蛋白質(zhì)rpl39組成型表達的mRNA作為內(nèi)參。為了使用相對定量的方法,需要表明使用特別定義的引物和探針組對不同受試基因序列的擴增效率基本上與參照序列(rp139cDNA序列)的擴增效率相當。為了確定這一相對等量,將包含適當cDNA序列的質(zhì)粒DNA稀釋至1/1000、1/10,000、1/100,000和1/1,000,000倍,并且使用上述的Q-PCR條件,計算各質(zhì)粒/引物/TaqMan探針組的曲線Ct=f(LogDNA的量)的斜率。提供斜率接近3.32的曲線(代表100%的效率)的質(zhì)粒/引物/TaqMan探針組被認為是可接受的。使用的質(zhì)粒/引物/TaqMan探針組都給出了Ct=f(LogDNA的量)的可接受的值。通過測量GOS基因的基因組特異性引物/探針組的定量PCR擴增信號相對于GOS基因cDNA探針的信號的水平來確定cDNA制品中不存在任何顯著水平的殘留基因組DNA。絲圖9顯示當停止?jié)菜?干旱條件)時,溫室中生長的小樹的葉中CcDHl基因表達的誘導。兩周后,DH1的表達在一林水脅迫植物中(植物#4)中被顯著誘導。三周后,CcDHl的表達在所有3林水脅迫植物(植物#4-6)中被誘導。誘導是非常顯著的,對于植物糾達到超過50的RQ??紤]對照基因rpl39相對高的表達,50的RQ代表非常高水平的基因表達誘導,并且強烈地暗示CcDHl在咖啡葉的干旱應答中起著重要作用。圖IO顯示相同組的樣品中CcDH2基因表達的誘導。CcDH2的誘導顯示與CcDHl應答的一些差異。第一個差異是CcDH2的明顯誘導晚于CcDHl,顯然最受脅迫的植物(植物#4)在第3周顯示誘導,比CcDHl晚一周。當在第4周時,CcDH2已在所有三株水脅迫植物中被誘導。CcDH2對CcDHl的誘導之間的第二個差異是CcDH2誘導的水平顯著低于對于CcDHl所觀察到的水平。總之,這些結(jié)果表明CcDHl和CcDH2不以完全相同的方式被誘導,盡管信號可能重疊,即CcDHl的誘導所需要的信號是CcDH2所需要的,但CcDH2可能需要只有當水脅迫增加時才出現(xiàn)的額外信號。植物#5和#6中的(CcDH2)表達隨著水脅迫惡化(隨著時間而不澆水)而持續(xù)增加,這支持了接近極端失水的條件誘導CcDH2的論點??蛇x地,CcDH2的表達可能比圖10中顯示的更顯著,但該誘導局限在特定組織中。重要的是,要注意到定期澆水的3林對照植物沒有顯示出CcDHl或CcDH2的誘導(圖9、10;植物#1-3)。上述結(jié)果表明與CcDHl和CcDH2關聯(lián)的啟動子可用于誘導和驅(qū)動基因在受到滲透脅迫的組織中表達。例如,這些啟動子可用于驅(qū)動基因的表達,所述基因能夠在精確的時期(當滲透脅迫發(fā)生時)提供一些保護以免受該滲透脅迫的傷害,但這在正常條件下并不在大多數(shù)組織中發(fā)生。根據(jù)上述工作也很明顯的是,如果目標是在較低的水脅迫下誘導基因,那么可最佳地l吏用CcDHl的啟動子,而對于在更高水脅迫下的基因誘導,當目的是只在相對高的水脅迫條件下誘導重組基因時,使用CcDH2更理想。為進一步檢查不同滲透脅迫條件的影響,我們檢查低溫和提高的NaCl水平對CcDHl和CcDH2表達的影響。我們也已檢測了與滲透脅迫信號轉(zhuǎn)導相關的激素(脫落酸-ABA)的效應。對于這些實驗,我們使用生長在固體培養(yǎng)基(培養(yǎng)皿平板中的固體培養(yǎng)基B0.3)上的體外咖啡微體扦插(microcutting)。對于使用低溫和ABA的實驗,我們在B0.3板上生成羅巴斯塔咖啡品種ThB4的微體扦插(16小時光周期)。當這些微體扦插足夠大時,將它們轉(zhuǎn)移至新的培養(yǎng)基/平板并在24。C下再溫育7天(16小時光周期)。在T-O時,將一組平板轉(zhuǎn)移至5。C下進行7天(16小時的光周期)。將另一組這些微體扦插置于具有ABA的培養(yǎng)基(培養(yǎng)基B0.3+100nMABA)上在24。C下進行7天(16小時的光周期)。將在T=0和T=7天(5。C和ABA)采集的樣品在-8(TC下冷凍,然后提取RNA用于上述QRT-PCR分析。起始材料的T=0樣品獲得的表達結(jié)果表明CcDHl具有RQ=1.17。其他實驗已顯示在微體扦插中,CcDHl的基線水平可從RQ0.05至大約RQ1之間變化。該相對廣泛的分布表明更高水平代表檢測到用于本實驗的起始材料中檢測到的輕微滲透脅迫(可能與材料固定到固體培養(yǎng)基上的好壞和/或影響相對濕度的平板密封的好壞相關,以及與起始材料的準確年齡相關)。然而,保持在5。C下7天的樣品顯示沒有CcDHl的誘導,事實上,CcDHl的水平通常降低至RQ=0.16,這一水平與在無脅迫的微體扦插中更經(jīng)??吹降谋磉_水平更接近。與上面所示的關于CcDHl的數(shù)據(jù)相反,在T=0未檢測到CcDH2的表達。然而,在5。C下7天后,檢測到CcDH2的RQ=0.022。后一觀察顯示冷凍條件可微量誘導CcDH2。要注意到,5°C對咖啡是非常低的溫度,因此下述是可能的,即如果冷脅迫的溫度稍微更高(8-15。C),那么CcDH2的誘導可更顯著。最后,用100fimABA處理7天的孩吏體扦插顯示CcDHl的表達顯著增加(RQ,6.99)。后一結(jié)果表明ABA參與CcDHl誘導的信號轉(zhuǎn)導。相反地,ABA不產(chǎn)生任何可檢測的CcDH2表達,這表明單獨的該激素不足以誘導CcDH2至任何可檢測的程度。為了檢測鹽的影響,我們將250mMNaCl加入固體培養(yǎng)基B0.3。在T=0時,將一組來自羅巴斯塔咖啡FRT35的微體扦插置于B0.3培養(yǎng)基或具有250mMNaCl的B0.3培養(yǎng)基上,并且置于24°C(16小時的光周期)。在T=0和在第4和第7天時,采集樣品并將其在-80。C下冷凍以待之后的上述QRT-PCR分析。獲得的結(jié)果顯示,在對照中,CcDHl的水平在開始時相當^f氐,并在整個實驗中保持低水平(對照-1=0,RQ=0.2;T=4天,RQ=0.07;T=7天,RQ=0.38)。在受試處理中,CcDHl的水平在處理的第4天和第7天顯著上升(250mMNaCl——T=4天,RQ=3.31;T=7天,RQ=4.46)。該實驗顯示提高鹽濃度可誘導DHl表達至顯著的水平,盡管不如在水脅迫下在植物的葉中看到的高。在250mMNaCl存在的情況下在,在T=4或T=7天的樣品中都沒有看到CcDH2表達的顯著誘導。參考文獻AgrawalN,DasaradhiPVN,MohmmedA,MalhotraP,BhatnagarRK,MukherjeeSK:RNAinterference:Biology,mechanism,andapplications.Microbiol.MolBiol.Rev.67:657-685(2003).Allagulova,CR,Gimalov,F(xiàn)R,Shakirova,FM,Vakhitov,VA:Theplantdehydrins:Structureandputativefunctions.Biochemistry-Moscow68:945-951(2003).Alsheikh,MK,Heyen,BJ,Randall,SK:IonbindingpropertiesofthedehydrinERD14aredependentuponphosphorylation.J.Biol.Chem.278:40882-40889(2003).BaumleinH,NIVRIDWU:Cis-analysisofaseedproteingenepromoter:theconservativeRYrepeatCATGCATGwithintheleguminboxisessentialfortissue-specificexpressionofalegumingene.PlantJ.2:233-239(1992).BrummelkampTR,BernardsR,AgamiR:AsystemforstableexpressionofshortinterferingRNAsinmammaliancells.Science296:550-553(2002).Cha他aiM,F(xiàn)BYDSIOLOMMS:2SstorageproteingeneofDouglas-fir:characterizationandactivityofpromoterintransgenictobaccoseeds.PlantPhysiolBiochem42:417-423(2004).Choi,DW,Close,TJ:Anewlyidentifiedbarleygene,Dhnl2encodingaYSK2DHN,islocatedonchromosome6Handhasembryo-specificexpression.TheoreticalandAppliedGenetics100:1274-1278(2000).Close,T:Dehydrins:emergenceofabiochemicalroleofafamilyofplantdehydrationproteins.Physiol.Plant97:795-803(1996).Close,TJ:Dehydrins:acommonalityintheresponseofplantstodehydrationandlowtemperature.Physiol.Plant100:291-296(1997).Clough,SJ和BentAF:Floraldip:asimplifiedmethodfor々/Y>6acteW/M-mediatedtransformationofJrflA/fito/w/s幼fl/Z做a.PlantJournal16;735-743(1998).Crouzillat,D,Lerceteau,E,Petiard,V,Morera,J,Rodriguez,H,Walker,D,Philips,WRR,Schnell,J,Osei,J,Fritz,P:2T^6尸o附aL:ageneticlinkagemapandquantitativetraitlocianalysis.Theor.Appl.Genet.93:205-214(1996).DubouzetJG,SYIYKMDEMSSMSKY-SK:OsDREBgenesinrice,OijzflsaftVflL.,encodetranscriptionactivatorsthatfunctionindrought-,high-salt-andcold-responsivegeneexpression.PlantJ.33:751-763(2003).Dure,L,Greenway,S,Galau,G:Biochemistry20:4162-4178(1981).Dure,L:StructuralmotifsinLEAproteinsofhigherplants.In:Close,T.J.,Bray,E,和A.(編著),ResponseofPlantstoCellularDehydrationDuringEnvironmentalStress,第91-103頁.AmericanSocietyofPlantPhysiologists,Rockville,MD.(1993).ElbashirSM,HarborthJ,WeberK,TuschlT:AnalysisofgenefunctioninsomaticmammaliancellsusingsmallinterferingRNAs.Methods26:199-213(2002).Godoy,JA,Lunar,R,Torres-Schumann,S,Moreno,J,Rodrigo,M,Pintor-Toro,JA:Expression,tissuedistributionandsubcellularlocalizationofdehydrinTAS14insalt-stressedtomatoplants.PlantMol.Biol.1921-1934(1994).Hara,M,Terashima,S,F(xiàn)ukaya,T,Kuboi,T:Enhancementofcoldtoleranceandinhibitionoflipidperoxidationbycitrusdehydrinintransgenictobacco.Planta217:290-298(2003).Hara,M,F(xiàn)ujinaga,M,Kuboi,T:Radicalscavengingactivityandoxidativemodificationofcitrusdehydrin.PlantPhysiologyandBiochemistry42:657-662(2004).Iida,K,Seki,M,Sakurai,T,Satou,M,Akiyama,K,Toyoda,T,Konagaya,A,Sinozaki,K:Genome-wideanalysisofalternativepre-mRNAsplicinginArabidopsisthalianabasedonfull-lengthcDNAsequences.NucleicAcidsResearch32:5096-5103(2004).Ingram,J,Bartels,D:Themolecularbasisofdehydrationtoleranceinplants.Annu.Rev.PlantPhysiologyPlantMolBiol47:377-403(1996).Iwasaki,T,Yamaguchi誦Shinozaki,K,Shinozaki,K:Identificationofacis-regulatoryregionofageneinArabidopsisthalianawhoseintroductionbydehydrationismediatedbyabscisicacidandrequiresproteinsynthesis-MolecularandGeneralGenetics247:391-398(1995).KlahreU,CreteP,LeuenbergerAS,IglesiasVA,MeinsF:HighmolecularweightRNAsandsmallinterferingRNAsinducesystemicpost-transcriptionalgenesilencinginplants.Proc.Natl.Acad.Sci.USA99:11981-11986(2002).Koag,MC,F(xiàn)enton,RD,Wilkens,S,Close,TJ:ThebindingofmaizeDHNltolipidvesicles.Gainofstructureandlipidspecificity.PlantPhysiology131:309-316(2003).MarracciniP"DeshayesA.,P6tiardV.andRogersW.J.1999.Molecularcloningofthecomplete11SseedstorageproteingeneofCoffeaarabicaandpromoteranalysisinthetransgenictobaccoplants.尸A戸'o/.肌oc/re附.37:273-282.MarracciniP,CourjaultC,CailletV,LausanneF,LePageB,RogersW,TessereauS和DeshayesA.2003.RubiscosmallsubunitofCoj5%<iara6/ca:cDNAsequence,genecloningandpromoteranalysisintransgenictobaccoplants.TV"",i^戸》/.5/oc/re附.41:17-25.Matsuyama,T,Yasumura,N,Funakoshi,M,Yamada,Y,Hashimoto,T:Maizegenesspecificallyexpressedintheoutermostcellsoftherootcap.PlantCellPhysiol.40:469-476(1999).MishraRN,Singla畫PareekSL,NairS,SoporySK,ReddyMK:DirectionalgenomewalkingusingPCR.Biotechniques.33:830-834(2002).Moore,R,McClelen,C:UltrastructuralaspectsofcellulardifferentiationintherootcapofZeamays.Can.J.Bot.61:1566-1572(1983).Nylander,M,Svensson,J,Palva,ET,Welin,BV:Stress-inducedaccumulationandtissue-specificlocalizationofdehydrinsinArabidopsisthaliana.PlantMolecularBiology45:263-279(2001).Puhakainen,T,Hess,MW,Makela,P,Svensson,J,Heino,P,Palva,ET:OverexpressionofmultipledehydringenesenhancestolerancetofreezingstressinArabidopsis.PlantMolecularBiology54:743-753(2004).RishiAS,NelsonND,GoyalA:Genomewalkingoflargefragments:animprovedmethod.J.Biotechnol.111:9-15(2004).Roberts,J,DeSimone,N,Lingle,W,Dure,L:Cellularconcentrationsandunifomityofcell-typeaccumulationoftwoLEAproteinsincottonembryos-PlantCell5:769-780(1993).Rogers,WJ.,B6zard,G.,Deshayes,A"Meyer,I"P6tiard,V"Marraccini,P.(1999).BiochemicalandmolecularcharacterisationandexpressionofthellS畫typestorageproteinfromCWj^aaraAZcaendosperm.尸/r戸W.J滅e附.37(4):261-272.ShirsatA,WNCRBD:Sequencesresponsibleforthetissuespecificpromoteractivityofapealegumingeneintobacco.MolecularandGeneralGenetics215:326-331(1989).Skriver,K,Mundy,J:Geneexpressioninresponsetoabscisicacidandosmoticstress.PlantCell2:503-512(1990).Soulages,JL,Kim,K,Arrese,EL,Walters,C,Cushman,JC:Conformationofagroup2lateembryogenesisabundantproteinfromsoybean.Evidenceofpoly(L-proline)-typeIIstructure.PlantPhysiology131:963-975(2003).Spanier,AM,F(xiàn)lores,M,Toldra,F(xiàn),Aristoy,MC,Bett,KL,Bystricky,P,Bland,J:Meatflavor:contributionofproteinsandpeptidestotheflavorofbeef.Adv.Exp.Med.Biol.542:33-49(2004).Turner,J,Linforth,R,Taylor,A:Real-timemonitoringofthermalflavorgenerationinskimmilkpowderusingatmosphericpressurechemicalionizationmassspectrometry.J.Agric.FoodChem50:5400-5404(2002).TuschlT,BorkhardtA:SmallinterferingRNAs:Arevolutionarytoolfortheanalysisofgenefunctionandgenetherapy.Mol.Interventions.2:158-167(2002).Wise,M,Tunnacliffe,A:POPPthequestion:whatdoLEAproeinsdoTrendsPlantSci.9:13-17(2004).Zhu,B,Choi,DW,Fenton,R,Close,TJ:Expressionofthebarleydehydrinmultigenefamilyandthedevelopmentoffreezingtolerance.MolecularandGeneralGenetics264:145-153(2000).所述核酸和多肽的序列CcDHlacDNA(見SEQIDNO:l)和所編碼的蛋白質(zhì)(見SEQIDNO:7)<formula>formulaseeoriginaldocumentpage58</formula>CcDHlbcDNA(見SEQIDNO:2)和所編碼的蛋白質(zhì)(見SEQIDNO:8)非99fg腿3論gtcfctatcggtcte'fcgatccttcaecfcttcgfctastctgtgttctat耽t!60ctacttccgctagtagttgaaattt鵬caattaag逸tggegcaatac效gg汰li3MetAlaGinTyrGlyAla1Sgra改tatggcaaccaaaagageeagtaegatgagtaegga祖acccagtt151GluTyrGly紐nGinLysSerGinTyrAspOluTyrGlyAsftProVal101520cgtcagacagacgaatatggtaa<scctgeceg口catggaggtaec欲tg209ArgGinT&arAsjsGluTyrGlyAsaPfoAlaAr^gHiGlyGlyTte鵬t2S303Sggtgatt改tg.gaaceactggeaatactggagectatggtggcac.aactGlyAspTyxGlyThrThrGlyTteThrGlyAla.TysrGlyGlyThxTte4045SOgggacagetgga:gcacatgggacttatgcaactggaaecaeeggeact305GlyThrMaOlyMaHisGlyTteTyxAlaThrGlyTto:ThrGUyThr5560:6570aecggtaccggtgca.tatgeeacceageetggeactgatgtggggaagThrGlyThrGlyAlaTyrAlaThr8InProGlyIJhrAspValGlyLys7S80&S353gag&T3catHis90GlyGlyMet汰tLeu95catcg'cHisArgtctageSear雜fcGlyage401test紹cSexte9Set105teegag虹uAspg暨t卿110c改aGinGlyGlyIISLys443atgMetsag120S紹liegag.125333Pro卿GlyGly130caeHisgetAla7caa(31n13SccfcProgg改caaGin.t汰t1teg8ergetMa3Ct145getMa枕oGlyTyrggcISO545GluGagGin155Hisg叫GluISOlie&tggatAspa站sitelie165S93gagLati170gggGlyggt.c3cGlyHiscg.cteg絲c175S43703ttfcgtgtc匕tctgag欲tttgagtgtgtgggcgtcttgagttgattegtet:gtgg教ctctg823toggegtettg匕SLcr匕cgggtS83效鵬纖棚汰祖汰aa統(tǒng)giaaLaata汰aa教教教a^a343,SSCcDH2a(見SEQIDNO:3)和所編碼的蛋白質(zhì)(見SEQIDNO:9)Gtaaaattcigtdaadeceaagtctcaggct統(tǒng)cicttaatttGa,gtgecotttttc:t'tt玩tttttttetaataacsggagt。ctggaaaatggetgaettgc;gftgatgaatatgga的etAlaAspLettArgAspGluTyrGlySOa教tcet暨tgc改gttgacegaee.agtatggeaaeccggttcagetcaagA曰nProMet.GinteuThr&sg>GinTyr(SlyAsnPa:oValGinLeuLys10152025162gacgagtatggcs魏cecaatgeagcttageggtgtagetatesigcgeeAspGluTyarGlyAsnProMetGlaL暨uS欲GlyValAlalieThxAla303540210gggt逸eggotagtgetgtccattetactg諷stccsggaecaactgcstgeeGlyThrM_aSearAlaValHisSerTteGlyThrlyfco飾rAlaAla4550552S8setGlyaceThrSOe統(tǒng)gGinc汰aGillC3tHisGillg改gsscatgGillcttG統(tǒng)tHiseggtegtctSear70ageagetea細agetetggetegt.egtgasgatgatggac&逸ggaggaaga汰g汰教agaasSe;eS您rGlySetS您rGluAspAsjpGlyGinly3lyArgArgLysLye75808S354幼3SOGlys站■LysC3lu9Satliea的gagGlu驗s100acgdlygrggrGlyHis10S402站gAspArgAspgat110GingagGluHislieAspUSgatAspGinHisAlaC3CHis120甚gc450AlatctcctProccaiPro125Thar3Ct130gggtctSer■act13S3ca498GlyGin140GillestHisGlusagl在SageMetgtggagGlu1503tt工l6atgMetGlu54Setc;lieuProg界est.HisCMHisgacAspISOArg536tgatcatcgtgtaaaatctcteetgatgeetaggaaatctagattatgttaggca'ttttgSS6tttggtafegtatgtgtgsfctaagaeettgttgtgegcttgaatefetgasegtgcatggg統(tǒng)716tttgcttggtttg.atttgatttggtgaaataajgttgtaetaftasasetaaa.aaasaaaa774CcDH2bcDNA(見SEQIDNO:4)和所編碼的蛋白質(zhì)(見SEQIDNO:10)Gt欲aa改ttcgtcasccccaagtetc魏ggctacctta統(tǒng)tttcagtgccctttttctttatt€0£ttrttet;aataacagg孩gtcctgrgaaaatggetg孩ctfcgcgfcgafcgaatatgga:114MetAlaAspLeArg.AspGiwTyrGiy筏at10cc!.tatgMetGinace15鄉(xiāng)Gintat.20Prog.tt;01netcaag2S162gaegagt恩tggcsaeeeaatgea9c:tt:ageggtgt統(tǒng)get教tcac'cgeeAspCiluTyrGlyftsnProWstGinitsuSerGly"VaiAlalieTin:Ala303540210gggscggetagtgetgteeattctactggaaecggaccaactgefcgee<51ifT&rAlaSesrAlaVailHisSerTbrGly飾rGlyProTtoSlaAla45505S258actggs為cce狡gcastctttcsaggagcagcttcja.teggfcet逸gcageteaThar!3lyThxGinGinLeuGinGluGinleuHisAi:gSe.rSerSer8sr506570agetestggctoggtgag'atacttgceaagttaeaatgtgtgtgtctgfcgtgt:Se:r&er<31ys想r7Sg't教.taatgcgc:estcataatt^ttfcgettgaeagateetgtt筏staaigfaacegtaatttgacgfcaaagtgfcaeaogttlitgttfcttctgg輛cttaestaatat'egaateaggetcctg匕tgaat:ttgaatgttgttagetaaaag汰aaattttggtggGtgagttgttgasttfcggtttat的teggaggafcgafcggacaaggaggaagaagaaagaaaaaagggttgSerG'luAspAapGlyGinGiyGlyArgArgLysG!LyLeu80g汰eAspecuPro12SGinga效Asp110c為testHis呵lays95His3t9liegagGillsagliysga<3AspISOstagHisact貼gMSaccThrgag(5luatelieggc130ageLy曰gatAsp115的CSetCtSL雄gatAspgggGly8590atgMetValeaigGirtgagescHistctSexLysISOAla.3crtlieCSC!His120Ms105agegtcV改lMetg'aa絲ggeeg的G.yBagLysgacag'aSerFroggtcetgGlyGin譜etccctLeuPro1SStagttac比adeacaaeatactgt.gatGatcgtgtsa站t.etetectgatgcst3t賄諷絲tetaga比at沐ta的eattttgtttggfcatgtatgt;gtgattastgacicttfttgtgeg'cttgaatettg誠鄰tgc;atgggatttgettgg'tttgaaiaaaaaaaastasaaaaaaaaaaaaaaaaaaaaaaeiaaa^aaaaiaasaaaasaa30S3S8418.S38S3S732780888細10081020CcDH3cDNA(見SEQIDNO:5)和所編碼的蛋白質(zhì)(見SEQIDNO:11)atfcttttgctgttfceetgttaeattotgetttaogtaeatc:.catGageaaaatggee57Me-1:Alagagtat;gate的agtaacatesaggttg效ggag'ggateagetgttc:gag105GluTyrAspGinSerAsnlieLysValGluOlyS暨KAlaValGlu510ISgeca:cggatogcggatetcttcaetcttg鵬cAlaThrAspArgGlyletiPheAsnLeuQly202Saagsasgagg絲gt:g貼gLyB.LysGluGluVal.LyB301S3eagtgtgatcaaggccaggccatetctgcg碎9fLy瞎CysA息pGirtGlyGinAlaIl經(jīng)SerAlaOlu354045tttgatgagaaagtgPheA印GluLysval50cgfcgtt:tctgaacc汰gscaagg汰ggagggaaagaagcatggtggtcttArgValSearGluproAspLysGluGluGlyLysLysHisGlyGlyLeu5S6065etcgagaagfctecacc'gatctggtagesge]jetiGluLy曰LeuHisArgSerGlySerS珍r7075tecageagrciS培3TSertea的tgagSerSerGlti80243297gaagaagtagaagagggtggfcgagaagraagaagaaaaagaaggaaaagGluGluValGluGluGlyGlyGluLysLysLysLysLysLysGluLys8S3095345aagggtttgaaggacaagateaaggagaagatategggtgataagasgLysGly:LeuLysAspLyslieLysGluIyslieSerGly.AspLyslys100105110393gac:g'a3gaaaaggttgaaaaatgtgaggraagacacgtefcAspGluGluLysVa工GluLysCyssGluGluAspThrSrIIS1201.25ateccagtt工leProVal130441gagaaatatgccgaaecggeecatgcagatgetg'eteatGluiy曰TyrAlaGluProAlaHisMaA鄰JUaAlaHis135140gaacca.gagGluProGlu145489gagaaaaagggrcfctc:ttagataagGluLydLysGlyPheLeuAspLys150ateaaggagsssetalieliys<31uIysLeu1SSccaggrtggtProGly<3lyISO537ggtcagaagaagactgagg汰agtcGlyGinLysLyeTlvrGluGluVal1S5170geagesgeagcjaecgec;t:ectcctAlsAlaMaMaProProProPro175ceggcagagtgrcacegcca'c:tgaaproAlaGluCysI"hrAlaThrGlu揚185ggtgaggeeaaggat幼gaagggaGlyGlu.AlaLysAspLys!LysGly190S33ttcttgsr統(tǒng)c改級gateaaiggagaagPlieAspL昨lieLy3GluLysUS200etcecrfcggctaceatcecaagacitteuProGlyTyrHisProLysThx205210gaagaagagaaggaaaaggagaagGluGluGluLysGluLysGluLys235gMaasg絲astggaggetggatgcGluLysGluLysGluMaGlyCys220225729eattaataaaagagc:aaagcstaa匕tSLatagGagett'tccagtgtgtdat逸attttgHi370Scatttgg教ttaatac.sttfctggagtggcaatgatctttttattttaaa833CcLEAlcDNA(見SEQIDNO:6)和所編碼的蛋白質(zhì)(見SEQIDNO:12)aagoagtggtaaca這egcagagt統(tǒng)cg.cggg祖cga統(tǒng)ceLte欲teggtace教gtttcetatfco60ataaateatcttactsgcaatgatgcastaa教為tgaetcctctg汪9逸仁3catcr112樹珍tLy曰Me匕飾rProIi暨uArgGyslie1510這曰tPh珍3tttttctgl抑Alattt匕gggttProgetgt<3ct七cgcggtgL@uAl玩val25fttfiISOgeeAlas的Ly想Pro30Gt欲Ij柳gttValProt統(tǒng)cct這lieTCO逸幼CC"CProLy曰P2:0ProProccgProCG改ProtegLy每ProsogtaV改lCCC!Pro在tsIl逸cctgtcProVal55LyscccProate工leSOVal柳ArgtgctecseaThrttgtttproetclieu70tgcfctcsatAsnlie30475ttcgttValtgc:80gacAsptgtCysc;tfcLeuA慕打fcgtttagtggacXj冊ValAgptgtCys90352涯:rtgcaagLy曰getAla95tgcEL'grtSertgcs改crA隨100t匕tPheProggcgetGlyAlagtt105tgtCysGingat.Proc鵬11Dttc:gtt節(jié)ggatggcGlyGlyAgpGly115S改GASHThrttttac120ttcPileeatHisggeGly12Sg汰tAspcagGintopttctgactggttPheCysIi靴17a1teggatferAspacccttLeucatt■His痕gtaValaafc抓GlyEi錢跑e戰(zhàn)ttliegg'osg這Glyljy曰ArgLY暨ecstaa.t:ttgogcProtontag肚3g筏eHspiss3L汰喻旭GingecAlalieggastg,ttfccg為egaecac;Pb暨為每pAspHis的atogattclie170etctenV後lgeeMagci這aa教統(tǒng)gg氣la^Ly曰fccg孩ctThrtd曰tggg為cgacaafcgtgTrpAspAsp助nv為l綱gatAsp寧Argetc:LeugotAlaUSgearattgatgg旌lie.H恩pGly躲fc,Pro135為fctlieGtCLeuCCC欲GtProThr2冊ga改ggatcoLy島205頓c船GinlieucjogProAl盈2i0ccgFroS暨xa盈tll抑似Egt經(jīng)tclieMet改gsArg73S3tc335Sear220a&cai逸t欲acAbAsnAsngec誠tgtgAlaAsnVal225gtggttgaagccgtgaaoai欲ttteSt節(jié)ValValOluMaVal.AsnAsaPh暨Arg230參Val240Proaitasc暨getII加rAlat.e改汰ga欲tc欲aasgtteatOliiGluS瞎rIiygV教lHis245250ggttatgac頃tt欲ctgatgaggattgctttacecatttggagcttgggGlyTyrAsplie■EhrAs'pGluAspCysPileTlWHi每L瞎UGlUL暨uGly2S5論窗ttcassttcttcaaeateaccigafcteaa.ctgstggsgttttgggacaaPh經(jīng)LysPhePhA經(jīng)nIl經(jīng)ThrA瞎pSerTterAspGlyV"alLsuGlyIn27S280accfcataggragegattacgtgaacaaaatgaaggtg統(tǒng)atgcggt汰atgThxTyflxgSsrAspTysrValASftLy經(jīng)Met;Ly曰\TalAanAlaValMet285綱295ecagteatgggcggtg&ccgts改gt汰Gttgacttegggsetfefcttag'tproValMetGlyGlyAsp&rgLysTyrLeu"SirSe:rG3LyLuPb暨Set30030S3107848805761024gc;c:gattgtg汰gtttetcgctttggtgggaaggttettgagaaageeAlaAspCysAlaValSerArgPheGlyGlyLysVa.lIeGl,uLy曰Ala31532032S330aattetgettctcctgtgcatgagtatec欲gec:fctgaaetgcaagagtAsnSerMaSei:ProValHi曰GluTyrProAlaLeuASCy曰LysSer33S.34034S10721120gggatggaag四aatggcttggtttgeGlyMetGluGlyAsitGlyLeuValCys350355Lyslays1166sc改gagcatgttgtatgctgaatgatgagctataaataattt的a貼tgasgtgstcstagotttaoatgeaaaaaaaaatgagtttcaga'站ag匕etta1226aaaaasasas汰暨aaaaaa祖gi12863CcDH2a全序列,其包括啟動子(堿基1-1324,見SEQIDNO:13序列(見SEQIDNO:3)和所編碼的蛋白質(zhì)(見SEQIDNO:9),1287),編碼內(nèi)含子I(1642).(1866)g孩改s汰gt玖gt右Octetttggcg1201OT240300gaaasitgttc3S0420ttcttoagat480540閱。aC!tSLgttCtC!tttcattttgtaa仁ttcatg720780gatttgtgftt900taaottgtts960tgtctGtttstt匕cttc匕gtaaatgt改atg1020tg效ttatt為atc:tgrat祖fcat1140tgcc;ttga±g1200gtcfccctgcg1320gc;tacc'fct改統(tǒng)tttcagtgcca匕tttt匕tet^tggetgacttgcgtgatg改atatAlaA包plieuArgAspTyr15ggaaatcctatgcagtfcgac^g改ccagtatggeaacccggttcagetc1482GlyAenProMetGinL逕uThrAspGinTyrGlyA筠ni^oGinLeu101520aaggacgagtatggcaaeCJGaatgcagcttage的tgt逸gotateacc1530LysAspGinTyxGlyAsnProMetGinI^u.SerGlyVaiAlaJleThr25303Sgecgggscggotagt改otgtccattetactggsaceggaec:祖actgetAlaGlyThrAl欲SerTha:ValHisSerTlirGlyThrGlyP:roTteAla405055geeaotggaa.ccoag*c逸aestc:agfgagcagettc這teggtctago為geiS2SMaTbrGlyThrGinGinHisGtaGluGltiLeuHistegSerSerSex1606570teaagetct;ggeteggtgagataetegcca孩gttacaatgtgtgtgt;otgtgtgtSerSer超erGlySergtata這tge袋Gc:改fccstt改attgtfctgcttgaeagatcctgttSL孩t:改atgaaocsgt^ettti:1741gacgta統(tǒng)改gtgtac;孩ogt:tittgtttttctg,gactaax;staafcaLtegastcaggctcctgi8Q:L</column></row><row><column>本發(fā)明不限于以上描述和舉例的實施方案,其變化和修改也包含在所附權(quán)利要求的范圍內(nèi)。權(quán)利要求1.從咖啡(咖啡屬物種)分離的核酸分子,其具有編碼脫水蛋白或胚胎發(fā)育后期富集(LEA)蛋白的編碼序列。2.權(quán)利要求l的核酸分子,其中編碼序列編碼具有大約17kDa到大約26kDa之間的分子量的脫水蛋白。3.權(quán)利要求2的核酸分子,其中脫水蛋白或LEA蛋白質(zhì)具有氨基酸序列,所述氨基酸序列與SEQIDNO:7-12中的任一個有46%或更高的同一性。4.權(quán)利要求3的核酸分子,其中脫水蛋白或LEA蛋白質(zhì)具有SEQIDNO:7-12中任一個的氨基酸序列。5.權(quán)利要求1的核酸分子,其中編碼序列與SEQIDNO:1-6中所示編碼序列中的任一序列具有50%或更高的同一性。6.權(quán)利要求5的核酸分子,其中編碼序列包含SEQIDNO:1-6中的任一個。7.權(quán)利要求l的核酸分子,其是具有包含編碼序列的可讀框的基因。8.由權(quán)利要求7的基因轉(zhuǎn)錄產(chǎn)生的mRNA分子。9.由權(quán)利要求8的mRNA分子反轉(zhuǎn)錄產(chǎn)生的cDNA分子。10.長度在8和100個堿基之間的寡核苷酸,其與權(quán)利要求1的核酸分子的區(qū)段互補。11.包含權(quán)利要求1的核酸分子的載體。12.權(quán)利要求ll的載體,其是選自質(zhì)粒、噬菌粒、粘粒、桿狀病毒、桿狀病毒穿梭載體、細菌、酵母和病毒載體的表達載體。13.權(quán)利要求11的載體,其中核酸分子的編碼序列有效連接至組成型啟動子。14.權(quán)利要求ll的栽體,其中核酸分子的編碼序列有效連接至誘導型啟動子。15.權(quán)利要求ll的載體,其中核酸分子的編碼序列有效連接至組織特異性啟動子。16.權(quán)利要求15的載體,其中組織特異性啟動子是種子特異性啟動子。17.權(quán)利要求16的載體,其中種子特異性啟動子是咖啡種子特異性啟動子。18.權(quán)利要求17的載體,其中咖啡種子特異性啟動子是脫水蛋白基因啟動子。19.權(quán)利要求18的載體,其中脫水蛋白基因啟動子包含SEQIDNO:13。20.用權(quán)利要求11的載體轉(zhuǎn)化的宿主細胞。21.權(quán)利要求20的宿主細胞,其選自植物細胞、細菌細胞、真菌細胞、昆蟲細月包和哺乳動物細月包。22.權(quán)利要求21的宿主細胞,其是選自咖啡、煙草、擬南芥、玉米、小麥、稻、大豆、大麥、黑麥、燕麥、高粱、苜蓿、三葉草、油菜、紅花、向日葵、花生、可可、蕃茄、粘果酸漿、馬鈴薯、胡椒、茄子、甜菜、胡蘿卜、黃瓜、萵苣、豌豆、紫菀、秋海裳、菊花、飛燕草、百日草和草坪草的植物細胞。23.再生權(quán)利要求22的宿主細胞產(chǎn)生的能育轉(zhuǎn)基因植物。24.權(quán)利要求23的能育轉(zhuǎn)基因植物,其是咖啡屬物種。25.調(diào)節(jié)咖啡豆的香味或香氣的方法,其包括調(diào)節(jié)咖啡種子內(nèi)一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。26.權(quán)利要求25的方法,其包括增加一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。27.權(quán)利要求26的方法,其包括增加咖啡種子內(nèi)一種或多種內(nèi)源編碼脫水蛋白或LEA蛋白質(zhì)的基因的表達。28.權(quán)利要求27的方法,其包括將編碼脫水蛋白或LEA蛋白質(zhì)的轉(zhuǎn)基因引入植物。29.權(quán)利要求25的方法,其包括減少一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。30.權(quán)利要求29的方法,其包括將核酸分子引入咖啡,所述核酸分子抑制一種或多種編碼脫水蛋白或LEA蛋白質(zhì)的基因的表達。31.在植物中增加對滲透脅迫的抗性的方法,其包括增加植物中一種或多種脫水蛋白或LEA蛋白質(zhì)的產(chǎn)量。32.權(quán)利要求31的方法,其包括將編碼脫水蛋白或LEA蛋白質(zhì)的轉(zhuǎn)基因引入植物。33.啟動子,其分離自編碼脫水蛋白的咖啡植物基因。34.權(quán)利要求33的啟動子,其中基因編碼具有大約17kDa和大約26kDa之間的分子量的脫水蛋白。35.權(quán)利要求34的啟動子,其中基因編碼具有氨基^列的脫水蛋白,所述氨基酸序列與SEQIDNO:7-11中的任一個有50%或更高的同一性。36.權(quán)利要求35的啟動子,其中基因編碼具有SEQIDNO:7-11中任一個氨基酸序列的脫水蛋白。37.權(quán)利要求33的啟動子,其中基因包含可讀框,所述可讀框與SEQIDNO:1-5中所示序列中的任一序列具有50%或更高的同一性。38.權(quán)利要求37的啟動子,其中基因包含具有SEQIDNO:1-5中任一個的可讀才匡。39.權(quán)利要求33的啟動子,其包含一個或多個選自TATA盒、脫落酸應答元件、用于調(diào)節(jié)leguminin型蛋白質(zhì)表達的leguminin盒的RY重復(CATGCA(T/a)(A/g)、至少一個脫水蛋白應答元件/C重復順式作用序列基序(G/ACCGAC)和至少一個E盒基序(CANNTG)的調(diào)節(jié)序列。40.權(quán)利要求39的啟動子,其包含SEQIDNO:13。41.包含權(quán)利要求33的啟動子的嵌合基因,其有效連接至一個或多個編碼序列。42.用于轉(zhuǎn)化細胞的載體,其包含權(quán)利要求41的嵌合基因。43.用4又利要求42的載體轉(zhuǎn)化的細胞。44.權(quán)利要求43的轉(zhuǎn)化的細胞,其是植物細胞。45.權(quán)利要求44的轉(zhuǎn)化的植物細胞,其是咖啡屬物種的細胞。46.再生權(quán)利要求44的轉(zhuǎn)化的植物細胞產(chǎn)生的能育轉(zhuǎn)基因植物。47.權(quán)利要求46的能育轉(zhuǎn)基因植物,其是咖啡屬物種。全文摘要本發(fā)明公開了來自咖啡植物的編碼脫水蛋白和胚胎發(fā)育后期富集(LEA)蛋白的多核苷酸。本發(fā)明也公開了來自咖啡脫水蛋白基因的啟動子序列,以及使用這些核酸和啟動子序列調(diào)節(jié)基因和操控咖啡豆的香味、香氣、脅迫耐性和其他性質(zhì)的方法。文檔編號C12N15/82GK101218346SQ200680024738公開日2008年7月9日申請日期2006年7月5日優(yōu)先權(quán)日2005年7月6日發(fā)明者J·G·麥卡錫,M·本阿莫爾,S·D·坦克斯雷,V·帕蒂爾,林晨煒申請人:康乃爾研究基金會;雀巢技術公司