專利名稱:一種控制水稻谷粒粒長(zhǎng)和粒重的主效基因gs3的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及植物生物技術(shù)領(lǐng)域。具體涉及到一個(gè)位于水稻第三染色體著絲粒附近控制谷粒粒長(zhǎng)和粒重的主效QTL,GS3的基因克隆。
背景技術(shù):
水稻谷粒的大小是一個(gè)重要的經(jīng)濟(jì)性狀(1)谷粒大小就是粒重的主要決定因素,而粒重是水稻產(chǎn)量的三個(gè)構(gòu)成因子之一。因此,谷粒大小是一個(gè)重要的產(chǎn)量性狀;(2)由于粒重和粒長(zhǎng)、粒寬、粒厚等性狀呈正相關(guān)(Evans,1972,Rice Breeding,Banos Los編著,International Rice Research Institute,Manila,pp.499-511),谷粒大小還是一個(gè)重要的稻米外觀品質(zhì)性狀。在中國(guó)、美國(guó)和一些主要的亞洲國(guó)家中,細(xì)長(zhǎng)粒形的秈稻品種受到大多數(shù)消費(fèi)者的喜愛。在我國(guó)的國(guó)家優(yōu)質(zhì)稻谷標(biāo)準(zhǔn)中還對(duì)稻米粒長(zhǎng)與粒寬的比值作了具體規(guī)定,認(rèn)為優(yōu)質(zhì)的秈稻品種的稻米長(zhǎng)寬比不能低于2.8。因此,闡明谷粒大小的遺傳基礎(chǔ)和分子機(jī)理有利于同時(shí)改良水稻的產(chǎn)量和品質(zhì)。
此外,谷粒大小在作物的進(jìn)化研究中具有重要的意義。一般認(rèn)為野生親緣種具有小而圓的谷粒粒形以適應(yīng)自然的選擇,經(jīng)過人類的長(zhǎng)期馴化和選擇,谷粒粒形已經(jīng)發(fā)生了明顯的改變。因此揭示谷粒大小的遺傳基礎(chǔ)可以為作物的進(jìn)化研究提供線索。
稻谷的大小是典型的數(shù)量性狀,遺傳基礎(chǔ)比較復(fù)雜。利用分子標(biāo)記技術(shù)可以對(duì)控制數(shù)量性狀的QTL(Quantitative Trait Loci)進(jìn)行分解和定位,將復(fù)雜的數(shù)量性狀分解為簡(jiǎn)單的孟德爾因子來進(jìn)行研究。利用這種方法,近年來已經(jīng)發(fā)現(xiàn)了許多控制谷粒大小的QTLs。其中位于第3染色體著絲粒附近的一個(gè)主效QTL(該QTL在本發(fā)明中被命名為GS3)在許多研究中都能檢測(cè)到(Huang等,1997,Mol.Breed.3105-113; 和Mackill,1998,Theor.Appl.Genet.96957-963;Kubo等,2001,Rice Genet.Newsl.1826-28;Thomson等,2003,Theor.Appl.Genet.107479-493;Aluko等,2004,Theor.Appl.Genet.109630-639)。本實(shí)驗(yàn)室利用珍汕97/明恢63衍生的F2∶3和重組自交系群體也多次檢測(cè)到GS3區(qū)域存在一個(gè)QTL同時(shí)控制著谷粒粒長(zhǎng)和粒重,并且可以揭示粒長(zhǎng)總變異的55%以上以及粒重總變異的20%左右(Yu等,1997,Proc.Natl.Acad.Sci.USA949226-9231;Li等,2000,Theor.Appl.Genet.101248-254;Tan等,2000,Theor.Appl.Genet.101823-829;Xing等,2001,Acta.Bot.Sin.43721-726;Xing等,2002,Theor.Appl.Genet.105248-257;Hua等,2002,Genetics 1621885-1895)。這些結(jié)果表明GS3基因可以在不同的遺傳背景以及不同環(huán)境下都能穩(wěn)定表達(dá),因此GS3對(duì)于水稻產(chǎn)量和品種性狀的改良具有巨大的應(yīng)用潛力和前景,對(duì)GS3進(jìn)行精細(xì)定位甚至克隆相應(yīng)的基因,為水稻的產(chǎn)量和品質(zhì)育種提供新的基因資源。
利用一般的群體對(duì)數(shù)量性狀基因進(jìn)行精細(xì)定位存在很大的難度,因?yàn)樵谶@樣的群體材料中很難確定檢測(cè)到的一個(gè)主效QTL到底是一個(gè)還是多個(gè)微效QTL(Yano等,1997,Plant Molecular Biology 35145-153)。其次,在這些群體中由于影響同一性狀的多個(gè)QTL都在分離,QTL間的相互干擾以及環(huán)境因素的影響,QTL定位的準(zhǔn)確性受到很大限制。因此,必須構(gòu)建特殊的群體來精細(xì)定位QTL。通常的做法就是構(gòu)建目標(biāo)QTL的近等基因系(Near Isogenic Lines,NIL),把目標(biāo)QTL位點(diǎn)之外的絕大部分背景差異消除,使該位點(diǎn)表現(xiàn)為典型的孟德爾遺傳。這種方法已經(jīng)在許多QTL的精細(xì)定位和基因克隆研究中發(fā)揮了重要的作用。Li等采用這種方法已經(jīng)將GS3定位到93.8kb的區(qū)域(Li等,2004,Genetics 1682187-2195)。這些結(jié)果為采用圖位克隆的策略分離、克隆GS3的基因提供了依據(jù)。
基于這些考慮,本發(fā)明利用圖位克隆的方法分離克隆一個(gè)控制水稻谷粒粒長(zhǎng)和粒重的主效基因GS3,為水稻的產(chǎn)量和品質(zhì)育種提供新的基因資源,也為作物的進(jìn)化研究提供線索。
發(fā)明內(nèi)容
本發(fā)明的目的是從水稻中分離克隆一個(gè)同時(shí)控制谷粒粒長(zhǎng)和粒重的主效基因完整編碼區(qū)段DNA片段,利用這個(gè)基因改良水稻產(chǎn)量和品質(zhì)的能力。這個(gè)基因被命名為GS3。
本發(fā)明通過構(gòu)建GS3的近等基因系,利用圖位克隆的方法,將GS3精細(xì)定位到7.9kb的染色體區(qū)段內(nèi),然后結(jié)合該區(qū)段內(nèi)的一個(gè)全長(zhǎng)cDNA的序列信息,對(duì)GS3的基因結(jié)構(gòu)和編碼的蛋白質(zhì)產(chǎn)物進(jìn)行預(yù)測(cè)和分析,發(fā)現(xiàn)該基因包含5個(gè)外顯子,共編碼232個(gè)氨基酸。通過生物信息學(xué)技術(shù)預(yù)測(cè)該蛋白質(zhì)具有一些保守結(jié)構(gòu)域,包括PEBP-like結(jié)構(gòu)域,跨膜結(jié)構(gòu)域,TNFR(tumour necrosis factor receptor)/NGFR(nerve growthfactor receptor)蛋白質(zhì)家族富含半胱氨酸結(jié)構(gòu)域和VWFC(von Willebrand factor type C)同源結(jié)構(gòu)域。此外,利用三個(gè)大粒品種明恢63(一個(gè)中國(guó)大面積推廣應(yīng)用的水稻品種)、H94(來自上海市農(nóng)業(yè)生物基因中心)、93-11(一個(gè)完成全基因組測(cè)序的水稻品種),以及三個(gè)小粒品種珍汕97(一個(gè)中國(guó)大面積推廣的水稻品種)、川7(來自上海市農(nóng)業(yè)生物基因中心)和日本晴(英文名稱Niponbare,一個(gè)完成全基因組測(cè)序的水稻品種)進(jìn)行比較測(cè)序,結(jié)果發(fā)現(xiàn)在7.9kb范圍內(nèi)大小粒品種間只存在一個(gè)共同的堿基差異,位于GS3的第二個(gè)外顯子結(jié)尾處,由小粒品種中的半胱氨酸(TGC)突變?yōu)榇罅F贩N中的終止密碼子(TGA)。該突變?cè)斐蒅S3基因在大粒品種的提前終止,并導(dǎo)致了178個(gè)氨基酸(包括部分PEBP-like結(jié)構(gòu)域和其它3個(gè)保守的結(jié)構(gòu)域)的缺失。通過生物信息學(xué)分析發(fā)現(xiàn)VWFC結(jié)構(gòu)域通過與生長(zhǎng)調(diào)節(jié)因子TGF-β家族成員相結(jié)合來調(diào)節(jié)生物體的生長(zhǎng)發(fā)育信號(hào)。在大粒品種中GS3基因由于缺失putative VWFC結(jié)構(gòu)域,因此可能喪失了這種生長(zhǎng)發(fā)育信號(hào)調(diào)節(jié)的能力,最終導(dǎo)致粒長(zhǎng)和千粒重發(fā)生改變。
本發(fā)明的優(yōu)點(diǎn)在于(1)本發(fā)明首次在水稻中克隆了一個(gè)對(duì)粒長(zhǎng)和粒重具有很大效應(yīng)的基因,為水稻的高產(chǎn)優(yōu)質(zhì)育種提供了新的基因資源,也為其它作物中克隆相關(guān)基因提供了技術(shù)借鑒;(2)本發(fā)明中克隆的基因也可以為水稻和其它作物的馴化和分子進(jìn)化研究提供證據(jù)。
序列表SEQ ID NO1是本發(fā)明分離克隆的GS3基因組序列(其中包括GS3基因編碼序列)。
圖1.是本發(fā)明的技術(shù)流程圖。
圖2.用于比較測(cè)序的6個(gè)品種。
圖3.BC3F2隨機(jī)群體中谷粒千粒重、粒長(zhǎng)、粒寬和粒厚的頻率分布。(a)谷粒千粒重的頻率分布;(b)谷粒粒長(zhǎng)的頻率分布;(c)谷粒粒寬的頻率分布;(d)谷粒粒厚的頻率分布。GS3的三種基因型是通過后代測(cè)驗(yàn)得到的。
圖4.GS3在遺傳連鎖圖上的定位。遺傳單位為cM。
圖5.基因區(qū)域的圖示。(a)GS3基因的精細(xì)定位.標(biāo)記間的數(shù)字代表各標(biāo)記與GS3位點(diǎn)間發(fā)生的重組次數(shù)。Genebank登錄號(hào)OSJNBa0030J19是日本晴(Nipponbare)中包含GS3的BAC克??;(b)GS3基因的結(jié)構(gòu)示意圖。黑色的方框代表外顯子,帶斜線的方框代表5’和3’UTR,“ATG”和“TGA”分別是翻譯起始密碼和終止密碼,兩種粒形品種間的一個(gè)堿基的差異位于GS3基因第2個(gè)exon中,由小粒品種中的半胱氨酸(TGC)突變?yōu)榇罅F贩N中的終止密碼子(TGA)。(c)預(yù)測(cè)的GS3基因產(chǎn)物。星號(hào)代表大小粒形品種間的一個(gè)堿基的差異引起氨基酸密碼發(fā)生改變的位點(diǎn),PEBP-like結(jié)構(gòu)域位于虛線區(qū)域,跨膜區(qū)域位于單下劃線區(qū)域,VWFC結(jié)構(gòu)域同源位于方框區(qū)域內(nèi)。
圖6.預(yù)測(cè)的GS3基因蛋白質(zhì)保守結(jié)構(gòu)域。包括PEBP-like結(jié)構(gòu)域,跨膜結(jié)構(gòu)域,TNFR/NGFR蛋白質(zhì)家族富含半胱氨酸結(jié)構(gòu)域和VWFC同源結(jié)構(gòu)域。其中PEBP-like結(jié)構(gòu)域位于細(xì)胞膜內(nèi),TNFR/NGFR蛋白質(zhì)家族富含半胱氨酸結(jié)構(gòu)域和VWFC同源結(jié)構(gòu)域位于細(xì)胞膜外。
具體實(shí)施例方式
以大粒品種‘明恢63’為輪回親本,小粒品種‘川7’為供體親本構(gòu)建了水稻GS3基因的近等基因系。在201個(gè)BC3F2單株所組成的一個(gè)隨機(jī)群體中對(duì)GS3進(jìn)行了定位和效應(yīng)評(píng)價(jià);設(shè)計(jì)CAPS標(biāo)記對(duì)1,384個(gè)具有大粒表型的BC3F2單株進(jìn)一步分析,最終將GS3定位到兩個(gè)CAPS標(biāo)記GS63和SF19(由發(fā)明人自己設(shè)計(jì),參見表2)之間,兩者相距約7.9kb的物理距離;利用該區(qū)間的一個(gè)全長(zhǎng)cDNA序列,預(yù)測(cè)出GS3的基因結(jié)構(gòu),并利用生物學(xué)信息學(xué)技術(shù)預(yù)測(cè)該基因的可能功能;對(duì)7.9kb范圍的比較測(cè)序發(fā)現(xiàn)在所有大粒品種的第二個(gè)exon中存在一個(gè)終止突變,并造成了178個(gè)氨基酸的缺失,這種缺失可能導(dǎo)致基因功能的喪失,從而暗示了谷粒大小發(fā)生變異的根本原因,同時(shí)驗(yàn)證了GS3作為目標(biāo)基因的正確性(圖1)。
以下實(shí)施例進(jìn)一步定義本發(fā)明,并描敘了分離克隆GS3基因以及通過比較測(cè)序驗(yàn)證GS3等位基因之間堿基差異的方法。根據(jù)以下的描述和這些實(shí)施例,本領(lǐng)域技術(shù)人員可以確定本發(fā)明的基本特征,并且在不偏離本發(fā)明精神和范圍的情況下,可以對(duì)本發(fā)明做出各種改變和修改,以使其適用各種用途和條件。
實(shí)施例1構(gòu)建GS3近等基因系1、回交與選擇如附圖2所示,以大粒品種‘明恢63’為輪回親本,小粒品種‘川7’為供體親本進(jìn)行連續(xù)的回交。在F1、BC1F1以及BC2F1代對(duì)GS3只進(jìn)行正向選擇,即選擇目標(biāo)區(qū)段為明恢63/川7雜合基因型的單株用于下一輪的回交。目標(biāo)區(qū)段參照前人的QTL定位結(jié)果確定在兩個(gè)SSR(Simple Sequence Repeat)標(biāo)記RM282和RM16(參見(http://www.gramene.org/)所界定的區(qū)間內(nèi)。在BC3F1代,除進(jìn)行正向選擇外,還對(duì)目標(biāo)區(qū)段以外的遺傳背景進(jìn)行掃描,從中選擇遺傳背景與明恢63最為相近的單株用于后續(xù)的實(shí)驗(yàn)。參照已發(fā)表的水稻遺傳連鎖圖譜(Temnykh等,2000,Theor.Appl.Genet.100697-712;Temnykh等,2001,GenomeRes.111441-1452),從中選擇了125對(duì)在親本間具有多態(tài)性并且均勻分布于水稻12條染色體的SSR標(biāo)記用于遺傳背景的篩選。最終選擇了一個(gè)單株(BC3F1-19),其RM282和RM16標(biāo)記((參見http://www.gramene.org/)基因型為明恢63/川7雜合,而在125對(duì)SSR標(biāo)記中僅20%(25對(duì))為明恢63/川7雜合,其余都是明恢63純合基因型。該單株的后代(BC3F2和BC3F3)用于后續(xù)的實(shí)驗(yàn)。
2.SSR方法PCR標(biāo)準(zhǔn)程序參見參見J.薩姆布魯克等,2002,分子克隆實(shí)驗(yàn)指南,第三版,金冬雁等(譯),科學(xué)出版社介紹的方法。PCR采用20μl的反應(yīng)體系,包含20-50ng DNA模板,10mM Tris-HCl,50mM KCl,0.1%Triton X-100,1.8mM MgCl2,0.1mM dNTP,0.2μM引物(如上所述的RM282和RM16的引物,參見http://www.gramene.org/)和1U Taq DNA polymerase。PCR擴(kuò)增的條件為940C預(yù)變性4min;940C 1min,550C 1min,720C 1min,34個(gè)循環(huán);720C延伸10min。PCR產(chǎn)物在6%的聚丙烯酰胺膠上分離后進(jìn)行銀染(Bassam等,1991,Anal.Biochem.19680-83)。
實(shí)施例2GS3在隨機(jī)群體中的定位和效應(yīng)評(píng)價(jià)1、大小粒的表型測(cè)量谷粒自然干燥后置于室溫下至少放置3個(gè)月以上以保證谷粒的干燥和各株系間含水量的相對(duì)一致。從每單株中隨機(jī)選取飽滿谷粒10粒,按照頭對(duì)頭、尾對(duì)尾,不重疊、不留隙的方式,緊靠擺成一行,用游標(biāo)卡尺讀出長(zhǎng)度,求其平均值即為谷粒長(zhǎng)度。將測(cè)量過長(zhǎng)度的10粒谷粒,按照同一個(gè)方向肩靠肩(即寬度方向)排列,用游標(biāo)卡尺測(cè)量,讀出寬度,求其平均值即為谷粒寬度。然后用游標(biāo)卡尺量取每粒谷粒的厚度,求其平均值即為谷粒厚度。谷粒千粒重根據(jù)隨機(jī)挑選的200粒飽滿谷粒的重量來估算。
從BC3F1-19單株衍生的BC3F2群體中隨機(jī)挑選了201單株構(gòu)成一個(gè)隨機(jī)群體??疾烀骰?3、川7以及隨機(jī)群體中每個(gè)單株的谷粒長(zhǎng)度、寬度、厚度和千粒重等性狀,結(jié)果發(fā)現(xiàn)所有性狀在兩親本間都具有顯著差異(表1)。在隨機(jī)群體中,谷粒長(zhǎng)度和千粒重都表現(xiàn)為不連續(xù)分布。以8.50-9.50mm的谷粒長(zhǎng)度或20.5-21.5g的千粒重為分界線,可分為兩類,即大粒和小粒類型(表1和圖3),并且谷粒長(zhǎng)度和千粒重表現(xiàn)為完全正相關(guān),即長(zhǎng)粒株系的粒重總是大于短粒株系的粒重。而粒寬和粒厚在隨機(jī)群體中表現(xiàn)為一種正態(tài)分布(圖3)。為簡(jiǎn)化敘述,本發(fā)明中將長(zhǎng)而重的谷粒稱之為大粒,另外一種短而輕的谷粒類型稱之為小粒。
表1.隨機(jī)群體中大小粒類型以及兩親本的表型值
2.分子標(biāo)記的發(fā)展本發(fā)明中所用到的SSR標(biāo)記信息全部來自于Gramene網(wǎng)站數(shù)據(jù)庫(kù)(http://www.gramene.org/).此外,還根據(jù)網(wǎng)上公布的粳稻品種Nipponbare的基因組序列(http://rgp.dna.affrc.go.jp)以及秈稻品種93-11的基因組序列(http://rise.genomics.org.cn/)設(shè)計(jì)了11對(duì)在明恢63和川7間具有多態(tài)性的Indel(Insert/Deletion)和CAPS(cleaved amplified polymorphic sequence)標(biāo)記,用于GS3的精細(xì)定位分析。這些標(biāo)記的序列信息見表2.
表2.本發(fā)明中用于GS3基因定位的Indel和CAPS標(biāo)記(引物)
說明GS63和SF19標(biāo)記(引物)由本申請(qǐng)人自己設(shè)計(jì)。
3.GS3的QTL定位和效應(yīng)評(píng)價(jià)用6個(gè)SSR標(biāo)記(MRG5959,MRG0164,MRG5881,MRG2646,RM411,RM16)以及2個(gè)Indel標(biāo)記(GS06和GS09)對(duì)隨機(jī)群體進(jìn)行標(biāo)記基因型分析,用Mapmaker/Exp 3.0軟件(Lincoln等,1992,Whitehead InstituteTechnical Report,Whitehead Institute,Cambridge,Massachusetts,USA)構(gòu)建GS3區(qū)間的局部遺傳連鎖圖,利用區(qū)間作圖法Mapmaker/QTL1.1對(duì)隨機(jī)群體的谷粒長(zhǎng)度、寬度、厚度以及千粒重進(jìn)行QTL定位,以LOD值3.0作為檢測(cè)QTL的域值。從表3結(jié)果可以看出在GS09-MRG5881區(qū)間存在一個(gè)QTL同時(shí)影響谷粒千粒重、長(zhǎng)度、寬度和厚度和等幾個(gè)性狀,并且分別解釋這幾個(gè)性狀83.4%,95.6%,19.8%和12.1%的表型變異。其中明恢63的基因型可以增加谷粒千粒重、長(zhǎng)度和厚度,同時(shí)減少谷粒寬度。此外,該QTL對(duì)不同的性狀表現(xiàn)出的遺傳效應(yīng)也不相同,其中對(duì)千粒重、長(zhǎng)度和厚度表現(xiàn)為部分顯性效應(yīng),而對(duì)粒寬表現(xiàn)為超顯性效應(yīng)。
表3.位于GS09-MRG5881區(qū)間控制粒形和粒重性狀的QTL效應(yīng)
a川7等位基因的加性效應(yīng);b川7等位基因的顯性效應(yīng);cQTL解釋性狀總變異的百分率;dP<0.0001的顯著性水平(t測(cè)驗(yàn));e在P<0.05水平上不顯著.
4.后代測(cè)驗(yàn)隨機(jī)群體每株系種植20個(gè)家系(BC3F3代)進(jìn)行后代測(cè)驗(yàn)。結(jié)果發(fā)現(xiàn)在201個(gè)株系中,有56個(gè)株系的后代都表現(xiàn)為大粒的表型,有61個(gè)株系的后代都表現(xiàn)為小粒的表型,剩下的84個(gè)株系的后代出現(xiàn)了大小粒的分離??ǚ綔y(cè)驗(yàn)表明三種類型符合單個(gè)孟德爾因子的1∶2∶1分離比(x2=5.67,P>0.05),表明在此BC3F2群體中,粒大小是由一個(gè)主效基因控制的,并且小粒等位基因?qū)Υ罅5任换虮憩F(xiàn)為顯性作用。由于后代表現(xiàn)出的這三種粒形類型分別對(duì)應(yīng)各個(gè)BC3F2單株的GS3位點(diǎn)的三種基因型明恢63純合基因型(大粒)、川7純合基因型(小粒)和雜合基因型(大小粒分離),因此可以將GS3作為一個(gè)標(biāo)記直接定位于Indel標(biāo)記GS09和SSR標(biāo)記MRG5881間的1-cM區(qū)間內(nèi)(圖4)。
實(shí)施例3GS3的精細(xì)定位1.CAPS標(biāo)記分析用于精細(xì)定位的9個(gè)CAPS標(biāo)記信息見表2所示。這些標(biāo)記擴(kuò)增約1-kb左右的產(chǎn)物。PCR反應(yīng)體系同前面的SSR反應(yīng)體系,PCR擴(kuò)增的條件為94℃預(yù)變性4min;94℃ 1min,53℃~57℃ 1min,72℃ 1.5min,34個(gè)循環(huán);72℃延伸10min。PCR產(chǎn)物的酶切采用20μl反應(yīng)體系10μl PCR產(chǎn)物,1U限制性內(nèi)切酶(購(gòu)自日本Takara公司),其它成份參照Takara公司提供的試劑說明書進(jìn)行,37℃酶切3~5小時(shí)后取10μl酶切產(chǎn)物在1.5%的瓊脂糖凝膠電泳分離,EB染色后在紫外透射儀下觀測(cè)。
2.重組單株的分析和GS3的精細(xì)定位為進(jìn)一步縮小GS3的定位區(qū)間,從5,740株由BC3F1-19單株衍生的BC3F2中挑選出1,384株具有長(zhǎng)粒表型的單株(粒長(zhǎng)至少為9.7mm),用于重組單株的篩選。
首先用SSR標(biāo)記MRG5881和Indel標(biāo)記GS09進(jìn)行篩選,從1,384個(gè)單株中共找到55個(gè)重組單株,這些單株經(jīng)過后代測(cè)驗(yàn)確認(rèn)是極端大粒的單株。然后,利用發(fā)展的9個(gè)CAPS標(biāo)記分析這55個(gè)重組單株,結(jié)果發(fā)現(xiàn)在GS47和GS3間存在5個(gè)重組單株,在GS52和GS3以及GS56和GS3間各存在4個(gè)重組單株,在GS61和GS3間存在3個(gè)重組單株,在GS65和GS3間存在2個(gè)重組單株(圖5a)。特別是在GS63和GS3間只發(fā)生1次重組,在SF19和GS3間只存在2次重組,而且在GS63和SF19之間還存在GS64和SF18兩個(gè)標(biāo)記與GS3共分離。因此,GS3最終被定位于GS63和SF19間,該區(qū)間對(duì)應(yīng)于Nipponbare和93-11的基因組序列上的約7.9-kb的物理范圍(圖5a)。
實(shí)施例4GS3的基因結(jié)構(gòu)和功能預(yù)測(cè)
(1)GS3基因結(jié)構(gòu)分析在GS63和SF19(由申請(qǐng)人自己設(shè)計(jì),參見表2)所界定的7.9-kb范圍內(nèi)找到一條全長(zhǎng)cDNA,編號(hào)為osigcea013f09t3,來自于廣陸矮4號(hào)的幼芽組織(由中科院上?;蜓芯恐行奶峁?,核苷酸序列特征如SEQ ID NO1所示,本發(fā)明克隆的GS3基因的cDNA序列全長(zhǎng)953bp,與7.9-kb范圍內(nèi)的1.6kb至7.3kb區(qū)段完全匹配。由于GS3基因兩端還存在一些調(diào)控序列,因此該cDNA是GS3的唯一候選基因。
通過比較該全長(zhǎng)cDNA和日本晴(Nipponbare)基因組的序列得到了GS3基因的結(jié)構(gòu)GS3基因從翻譯起始密碼至終止密碼長(zhǎng)5,363bp,包含5個(gè)外顯子(exon)和4個(gè)內(nèi)含子(intron),起始外顯子長(zhǎng)117bp,第二個(gè)外顯子長(zhǎng)53bp,第三個(gè)外顯子長(zhǎng)45bp,第四個(gè)外顯子長(zhǎng)54bp,末端外顯子長(zhǎng)430bp;第一個(gè)內(nèi)含子長(zhǎng)1,472bp,第二個(gè)內(nèi)含子長(zhǎng)1,439bp,第三個(gè)內(nèi)含子長(zhǎng)83bp,第四個(gè)內(nèi)含子長(zhǎng)1,671bp(圖5b)。因此,GS3基因的閱讀框(open reading frame)長(zhǎng)699bp,編碼232個(gè)氨基酸,該基因的序列號(hào)如SEQ ID NO1所示。
(2)GS3功能預(yù)測(cè)根據(jù)InterProScan(http://www.ebi.ac.uk/InterProScan/)對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測(cè),GS3基因編碼的蛋白質(zhì)由232個(gè)氨基酸組成,包含幾個(gè)保守的結(jié)構(gòu)域。其中5’端從第12個(gè)氨基酸至第65個(gè)氨基酸區(qū)域?yàn)镻EBP(phosphatidylethanolamine-binding protein)-like區(qū)域,從第97位氨基酸至第117位氨基酸區(qū)域?yàn)榭缒^(qū)域,從第116個(gè)氨基酸至第1557個(gè)氨基酸區(qū)域是TNFR(tumour necrosis factor receptor)/NGFR(nervegrowth factor receptor)家族富含半胱氨酸的同源區(qū)域,3’末端富含半胱氨酸的區(qū)域(從第178個(gè)氨基酸到231個(gè)氨基酸)具有von Willebrand factor type C(VWFC)結(jié)構(gòu)的保守氨基酸序列特征,即由60-80個(gè)氨基酸組成的結(jié)構(gòu)域中含有10個(gè)保守的半胱氨酸,特別是在中間具有C2XXC3XC4序列以及3’端具有C8C9XXC10序列特征(其中C代表半胱氨酸,數(shù)字代表10個(gè)保守的半胱氨酸的序號(hào),X代表任意氨基酸)(圖5c和圖6)(www.sanger.ac.uk/cgi-bin/Pfam/getacc?PF00093)。
VWFC結(jié)構(gòu)域已經(jīng)發(fā)現(xiàn)在許多位于細(xì)胞外的蛋白質(zhì)中存在,一些研究認(rèn)為它可以與生長(zhǎng)調(diào)節(jié)因子TGF-β的家族成員相結(jié)合,從而對(duì)TGF-β的受體結(jié)合位點(diǎn)產(chǎn)生干擾作用,阻止了TGF-β受體的活化,進(jìn)而起到調(diào)節(jié)生長(zhǎng)因子信號(hào)傳導(dǎo)的目的(Abreu等,2002,Gene 28739-47;O’Leary等,2004,J.Biol.Chem.27953857-53866)。
實(shí)施例5比較測(cè)序確定GS3等位基因間的堿基變異(1)序列測(cè)定兩個(gè)大粒品種(明恢63和H94)和兩個(gè)小粒品種(川7和珍汕97)進(jìn)行目標(biāo)區(qū)段的測(cè)序。利用10對(duì)PCR產(chǎn)物相互部分重疊的引物(表4),采用高保真度的LA-Taq(日本TakaRa公司)從這些品種的基因組中進(jìn)行PCR擴(kuò)增。然后按照pGEM-T Vector System 1kit試劑盒(購(gòu)自美國(guó)Promega公司)的使用說明書,將PCR產(chǎn)物連接到pGEM-T載體上,轉(zhuǎn)化大腸桿菌DH10B(購(gòu)自美國(guó)Invitrogen公司),通過蘭白斑篩選獲得陽(yáng)性克隆后采用T7-R和SP6-F通用引物(購(gòu)自中國(guó)上海生工生物工程公司)、美國(guó)Perkin Elmer公司的測(cè)序試劑盒(Big Dye Kit)、分別從每個(gè)亞克隆的兩端測(cè)序。使用Sequencher 4.1軟件(美國(guó)Gene CodesCorporation)拼接序列。
表4.用于本發(fā)明比較測(cè)序的引物
PCR產(chǎn)物的大小是根據(jù)Nipponbare的序列確定的,不同品種中可能會(huì)有所變化。
2.序列比較目標(biāo)區(qū)段間的序列比較分析在3個(gè)大粒品種(明恢63、H94、93-11)和3個(gè)小粒品種(珍汕97、川7、Nipponbare)間進(jìn)行(圖2),其中Nipponbare和93-11中的GS3區(qū)間序列信息來分別來自于BAC克隆OSJNBa0030J19和contig Ctg009226(http://www.ncbi.nlm.nih.gov/)。序列比較在軟件Vector NTI 9(美國(guó)InforMaxTM公司)上進(jìn)行。
在6個(gè)品種間雖然發(fā)現(xiàn)了許多的堿基差異存在于7.9kb范圍內(nèi),但是只有一個(gè)堿基的差異存在于兩種粒形類型間,因此可以認(rèn)為該堿基變異是引起粒大小發(fā)生改變的根本原因。進(jìn)一步分析發(fā)現(xiàn)該堿基差異存在于GS3基因第2個(gè)exon中,由小粒品種中的半胱氨酸(TGC)突變?yōu)榇罅F贩N中的終止密碼子(TGA)(圖5b)。該終止密碼子的出現(xiàn)導(dǎo)致了大粒品種中3’端178個(gè)氨基酸的缺失,其中包括部分PEBP-like結(jié)構(gòu)域和其它3個(gè)保守的結(jié)構(gòu)域。這個(gè)無義突變與大粒對(duì)小粒表現(xiàn)為隱性的自然特性是一致的,表明大粒表型是由于GS3基因的蛋白質(zhì)功能缺失引起的。
序列表<110>華中農(nóng)業(yè)大學(xué)<120>一種控制水稻谷粒粒長(zhǎng)和粒重的主效基因GS3<130>
<141>2005-12-31<160>3<170>PatentIn version 3.1<210>1<211>7883<212>DNA<213>水稻(Oryza sativa)<220>
<221>gene<222>(1)..(7883)<223>
<220>
<221>3’UTR<222>(7009)..(7222)<223>
<220>
<221>exon<222>(6579)..(7008)<223>
<220>
<221>exon<222>(4854)..(4907)<223>
<220>
<221>exon<222>(4726)..(4770)<223>
<220>
<221>exon<222>(3235)..(3287)<223>
<220>
<221>exon<222>(1646)..(1762)
<223>
<220>
<221>5’UTR<222>(1609).. (1645)<223>
<400>1gccgccatga gctcaccggt gctgccgccg acctcctgcc tacgtgccgc cttctccgct 60gcaagtcgcc gctgctgccc tccccacgac acagctggat ccgggagggg agggcaggga120aggttcgctg tcgccgccgc caccctccct acgacgtagc cagatatggg tggagaggta180agcgccgccg ccgctgcaca acccacgatg ccgccgctgc acaacccgcg atgccgtcgg240ccggatttgg gaggtggagc gtcgccgccc tccgccccgc gccatgtctg aggaaagaga300gcgatgggag cgccgccggc caccaccgtc cccccttccc cctccaacca gatctgggag360gaagggaggg agggagggga gccatcacgt cgttgggagt agatgccgcc accgccctcc420ccctccctgc ggccaccaca ctggggtgca ccgccaccgc taggtagccg cctctggctg480gatccacgcc gaggagagga aggagaggga gagggagagg gaggggaggg gagatgtgga540agttgactta gaaaattttg acgcccggtg gtttttaaga tactttacct ttttgcaggc600ggatttatta aagaggtccg tctgcaaaaa taatgatatt ttcacggtcg gacctcttaa660gatatctaca tgtagaaatc tatatttttt tacttaaatt actgccaggg ctttgcctcg720tagtataatt ttcataaaaa ctcaaaatat ttacaaatta caaaagagga aggaaggaga780aaaacttata aagattacaa tgtttgtaac caatcaaaaa ctatctgctt taaaggatct840ttcattctac acatatgaag aagaacttct tttctaaacg atattcttca tgaaccaaag900gagggaagct cattccgaaa atttttccca tttctctgct cgtaggcgga taactatctc960atctcacggt tgttattttt gtaggtggct atttggcttc cagagaccta ctcgtccggg 1020aaaaagaaat gccagcatct agaaaaatag tttttctagt agagtgttgt gagcgtctgc 1080gatcgtggta aagaaagcaa aaaaggtgaa ggacgagtgg catgatacat atgggaaagc 1140tgtagacttt gacccttgac tactcgttgg aagtgtgcgt ctgcatgcat tattgaacgg 1200ctctgatccc cgcggcgcag cggatcgggg tcatgtccgg atgggcatat cgacgagaag 1260gatccgtccc cgacaatctt tcaaggcccg tgcccccgtc cctcctctcc tctgcgcctt 1320tccatcatca tttacgccca accccaacac atgtacattt cccttggctt gcttccggag 1380aagaaaagag cggccatcca ctccactctc cactctctcc cttccatcat tacttgccca 1440aaaacggcaa tcccctcccc tccatctcca tgtgctcttc cacctagctc cgccattcaa 1500agcaaagcac caagcttttg cctctccctc taccatgcct gccccctata catagctgct 1560gcaccgtctc tcttcataaa tatactagta ggagtagcag agctcatcac ttcgatcatc 1620tccattatcg gaacttcgga gtgac atg gca atg gcg gcg gcg ccc cgg ccc 1672Met Ala Met Ala Ala Ala Pro Arg Pro1 5aag tcg ccg ccg gcg ccg ccc gac cca tgc ggc cgc cac cgc ctc cag 1720Lys Set Pro Pro Ala Pro Pro Asp Pro Cys Gly Arg His Arg Leu Gln10 15 20 25
ctc gcc gtc gac gcg ctc cac cgc gag atc gga ttc ctc gag 1762Leu Ala Val Asp Ala Leu His Arg Glu Ile Gly Phe Leu Glu30 35gtacaatcta tctctatctg tctatatcac taccattcat actccttcga tcttgcttca 1822aaacaaaaaa atatatattt cctacttcat attcatatac acacgtacgg cttgctatct 1882gtcgaattgt ttgcttctgc atgcatgcat cactctcatt gtaagttttt cccagcttaa 1942aaccactcct tttatcttcg ttcttcttcc ttcttgtttt tttttaaaaa aacaacaact 2002catttaatct tcatatagtg tatcatgcat catttgcttc tttgatcagt tccccaaaaa 2062ctgctcctct cttcccagcc aaataattaa acttaagcaa acaagcaagt tgaactgatg 2122atccaataaa acaaaacaaa accgatcgaa taggaagtca atggcatata ccagctgcta 2182tagctgaagc cacgaatgct tagcttagct ctagtcgatc cctgttgact gttcaacaca 2242ctgcactaac acaccagtta atgagctgat taattaaacc attaaatgag cttaacgggc 2302ggctagcttc ttcctctggg cccgtgccga tcgtaccatc ggtttgcgcg tccctccacc 2362taaactctct gccttgttat tccctttgcc tagtactaca tgcatttgca tcatcatccc 2422atcaccaata gtactacgtt tcaactggat tttggtggtg tccaaccata tcatatttgg 2482ttttgttctc tagtttactc ctacattagt ctctagcggt tttgtggagt actaaagaaa 2542acaactaatc agccagggtt taacgtttaa tcggttggtg gttttgttaa ttaatttcat 2602ctactatttt agacttcaca ggtcttcgag ctataagcat cgattgccat gcatcaatcg 2662atgctggtcc acgctagttt ctgagttctg actagctctc ttaattgtgc tttgacctac 2722tttaattaat taaccagtgg ctgcgtcact cattgaccaa cattgtcatg ttacccggac 2782tgattttttt tttctttaaa aaaacaccgg atatattatt agttagtgta tatatatgtc 2842tgctcaagaa gcgcatgcat atagtttctc gtcaaacaaa aaatgtactg tatgctcaaa 2902gcatctgttt tggaattgtc atattcgcct ttataattaa aataattaaa atggtgatgc 2962ccagcttttt ttttcctcca ataatttatt tattggcttg atttcctgtg ctattaggag 3022taaaactact ccgttttaat tagcaccatt tttaaagctt ctaaaattaa cctaagtaaa 3082gtacgacagt acttgctgtc tagctttaaa tgttttgggt gttaaaatat ccctcagaca 3142tcacctgaaa agttgacagg ctaaacacat gcccatctcc ctcgtttact taaattaatt 3202cgaacaaaca actgtatata tatttcttgc ag ggt gaa ata aat tca atc gaa 3255Gly Glu Ile Asn Ser Ile Glu40 45ggg atc cac gct gcc tcc aga tgc tgc aga ga gtaagccagc ctgctgtttc 3307Gly Ile His Ala Ala Ser Arg Cys Cys Arg Glu50 55tttttgtact acttccattt cttctcgtct ttactcttac catgcattca caaaatatac 3367ttacttaccc cagtttttga tcatgaactt tgaccgttat ctttttaagc aacttcaata 3427aaataggttt aaatgcaaat gttatgtaca ccattgatta taaaaccttg gcaaatgaaa 3487gtaaaaaacc agcacattta atttctgaac gttgggagta ttattatttt tatatctttt 3547actatcattt aatcatagta tcgtgcaagc tttttgagtg taattaggtt gcttaaggta 3607aaaaaatgta actaggttac atttagtact aaactgaaca tttaattagt aatgtttcgt 3667
taagtaactg taatttcaat gcatgcatgt cctcccgtaa gagcaagttt aatagtatag 3727ccaactacta gctccaattt atttatagac aatctaatag ctcattcata caataattac 3787atactacact attaatatct gatcccacct gtcatacaca tactgcattt tggagtccgt 3847gctatagctg actacaaatc tatagtccgc tgctcttctc tctctttatt tatctcctta 3907aaatatgttt gcagctggct tatagcctgc tattgtacct gctctgaaaa tagtgcagag 3967actgttcaaa aagtcattgc acaataacta ttcacatgga actgtgaaaa gtatatattg 4027gaacttacta gctagatcct tttgggaaca tgggaaaagc caagtcacgt gtggaatccc 4087tattccctgt gttcttcagc tagaagagtg aaaataatgt actactacta tacggagatg 4147aaattacagc aggagcagaa agcgggaaaa aaactttaaa tcaattaaac aaacctctct 4207ctgcaaaatt caacaccagc aacgaacaac tcatcaagtt cttgtgttat gtaccggccg 4267gtaactaatt gttgtttgca taagcgaaac ggtatatttg caaacaaaaa ataatttatg 4327aataaaactt ttatatacat gttcttaatt atctcaaaac aaaggttgaa aaataaactt 4387cgatgaaaaa atctcaaaat caattccaaa tttatggtga aaattttaaa ttttgtctga 4447taaacataag tataagcaaa aaaaaaagta aagcaatgtc actatgttaa tggtattggt 4507atatatacct ttgagtttct gtctgtactt taggagtaca tgctacgaac atgttttctt 4567ggcttctatt tcgttggaat tacttgcgta ttgtgggcca gacgcctggt gaacttcgtc 4627gattgtgtgg actaattaag ctcacctgaa ataagtggtt gaaaacaagg ctaaagatga 4687ttttaatcat ggattttggc ttggaaattt ttttgtag g gtt gac gaa ttc atc 4741Val Asp Glu Phe Ile60gga aga act cct gat cca ttc ata acg at gtatggattt tcaggtcgag4790Gly Arg Thr Pro Asp Pro Phe Ile Thr Ile65 70aatttgtctt taacttcgca cgactgttat tttttttctt attaattctc tgtttacaag 4850cag t tca tcg gag aag cga agt cat gat cat tct cac cac ttc ttg aag 4899Ser Ser Glu Lys Arg Ser His Asp His Ser His His Phe Leu Lys75 80 85aag ttt cg gtactcactt cattcccgga tcttaatgta tatatgcata 4947Lys Phe Argtctgcactgt gctaattggt gtacacatta tgtgatcatc agtccaagtt aattattact 5007tacaaaactg aactaataaa cactagaaaa tatgtaactt gcaaagtaca tattgaatca 5067gggattcata tatagaactc cacctgcaga tttcttccaa tatatatatg ctgtcaccat 5127gttttcactt gtcacctagt acacctttga ctgggagact ttccttgatg atcgacgtgg 5187tcatattctt cagattgatt taatttcaga tagaaaaaaa tattgtttac ttagtttctc 5247tccttcagta agagagatgt gcaagaccag cgatcaaact atatgaactg ttcgtttcat 5307gataaaaaaa acatgatatg gaataactag gtgattcaac atataatggc tgataatccc 5367tcgtttcagg agataccatc agttttctac ttttctactt ttctccatgt tctctttttc 5427atgtttgagg tggatcggag cttgtattag atgtttgctc agctcaatta ttgctgcaga 5487tttccctata tagcctccac tgtatatata ctccctccga ttccataatt taatgatatt 5547
ttgaacaatg acgctgtctc caaaatatat ctttcacttt gttttcctat tataatatat 5607acaataaaaa aaatacatat ttacttttct tataaatagt ttcaaagaca aatctatata 5667tgttgttata taactctttt aaactaaata tttttaaagt tatagtcaaa gttacaaaag 5727ttggacctca aacatgtata aaacgtcgag aattgtatat ctgatcaacc aataatttgt 5787agtgcattgt cttaaaaaaa ttgcatttct agctatgtat ctagataatt acaagaacca 5847ggtgaaatca cattttattt ttactggacc acgaactcat tgtttaatta cttccagcct 5907tgcactaaat aacaataatt gaacctggca tcacctgcac aattaatttg gacacaaagt 5967aaacatgaat gcaacatact tcgtttcata ttgtttgttg gtgtaggatt taaattttgt 6027gtcaaaatac ttgccgttct tactacattc ttaagcactt tgagaactaa ccttctcttc 6087ctacccttca tcaatacagt catactaact aattggctct tatgccttga aaaactaatt 6147aggatgtatt taatgagggt aaccatgtaa tctgccacca gtgaatgcaa ttttggttca 6207aaatttcggg cccccgccct aaaaagtcat tatctcgata gaattttttt gaatttagtc 6267aaaatttatt caaatttagc caaattgtgt taaatttcaa ataatttcag tctaaaaagt 6327gctgaaaatc ccgaaattta ggttctaccg aaatggccgg aaattttcag cgaaaatcaa 6387acatgaaaac cttgtctgcc acatttgtta gtttgtgtaa agatttgcta gaacgataag 6447taatttgaag cggatgtata ttatatatcc cacaaaacca tcaacttgtt aattacatgt 6507atatttgtgc atgatgcttt caccactttg tggttgttaa cgattaaatc acacgtttta 6567ttttctcaca g c tgt ttg tgc aga gca agt gcg tgc tgc ctc agc tac 6615Cys Leu Cys Arg Ala Ser Ala Cys Cys Leu Ser Tyr95 100ctc tcc tgg atc tgc tgc tgc agc agc gcc gcc ggc ggc tgc tca tcc 6663Leu Ser Trp Ile Cys Cys Cys Ser Ser Ala Ala Gly Gly Cys Ser Ser105 110 115tcc tcc tcc tcc tcc ttc aac ctc aag agg ccg agc tgc tgc tgc aac 6711Ser Ser Ser Ser Ser Phe Asn Leu Lys Arg Pro Ser Cys Cys Cys Asn120 125 130tgc aac tgc aac tgc tgc tcc tcc tcc tcc tcc tca tgt ggg gcg gcg 6759Cys Asn Cys Asn Cys Cys Ser Ser Ser Ser Ser Ser Cys Gly Ala Ala135 140 145 150tta acg aag agt ccg tgt cgc tgc cgc cgc cgc agc tgc tgc tgc cgt 6807Leu Thr Lys Ser Pro Cys Arg Cys Arg Arg Arg Ser Cys Cys Cys Arg155 160 165cgc tgc tgc tgc ggc ggc gtc ggc gtc cgc gcg tgc gcg agc tgc agc 6855Arg Cys Cys Cys Gly Gly Val Gly Val Arg Ala Cys Ala Ser Cys Ser170 175 180tgc tcc ccg ccg tgc gcg tgc tgc gcg ccg ccg tgc gcg gga tgc tcg 6903Cys Ser Pro Pro Cys Ala Cys Cys Ala Pro Pro Cys Ala Gly Cys Ser185 190 195tgc cgc tgc acc tgc ccg tgc ccg tgc ccc ggc ggc tgc tcc tgc gcg 6951
Cys Arg Cys Thr Cys Pro Cys Pro Cys Pro Gly Gly Cys Ser Cys Ala200 205 210tgc cog gcg tgc agg tgc tgc tgc ggc gtc cct cgt tgc tgc ccc ccc 6999Cys Pro Ala Cys Arg Cys Cys Cys Gly Val Pro Arg Cys Cys Pro Pro215 220 225 230tgc ttg tga tcgatcgatc gattgagcga agctgcactg attggttaat 7048Cys Leutaattagttc tcgatgatga tcgatcgagc tgcgcgcgta cttaattagc tagctaggtt 7108ctggtgttaa ttagttcctc atcgatgcat atgttgattg ccttgctctg cttgcggtta 7168tctgtaattt ggctttgctg ccatgatgag tacgtgattg ctgatttatt ttacatatcc 7228tctgctatat atatctagct ggtagtagct agttttgatc tcacttgcaa aactattcat 7288ttcctgattt taacaaggtc aaatgacttg gttgcctttg gttcatactc cttagagcaa 7348gtataaaggt ttatatggag gagagaggta acaaaaaaaa atcaagagta ttggctctca 7408tgcgagagct agcttatcac aagctacaaa tcaaatatat taaatgtata agtaagagat 7468agagagagga ataaaattat agetaacctt ataggtaatg tattatatatgttaatttta7528aaataagcta atagtaaaaa gtgagcttta ttattatcct tgctcttagt aatggcctcg 7588attcctacat tttttttttg agagagtagt acatattttc gcagcgtaat atggacattg 7648gccgacgggc ctaactatta ctgggtctaa gtgcctaact gagctaaaag ccttaaaccc 7708aatactgaaa acgaaaaagt tcactccggg tccctcatct tgtcgacggg ttttaaaatc 7768atcattgaac cggaatacgc attcccaatc tttcaaaacc ggatcacact aggtctaagg 7828cagtattgct cccgattttg gctgatatgg tggttgagtc agcgtgagac acaca7883<210>2<211>699<212>DNA<213>水稻(Oryza sativa)<220>
<221>CDS<222>(1)..(699)<223>
<400>2atg gca atg gcg gcg gcg ccc cgg ccc aag tcg ccg ccg gcg ccg ccc 48Met Ala Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Pro Pro1 5 10 15gac cca tgc ggc cgc cac cgc ctc cag ctc gcc gtc gac gcg ctc cac 96Asp Pro Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His20 25 30cgc gag ate gga ttc ctc gag ggt gaa ata aat tca atc gaa ggg atc 144Arg Glu Ile Gly Phe Leu Glu Gly Glu Ile Asn Ser Ile Glu Gly Ile35 40 45
cac gct gcc tcc aga tgc tgc aga gag gtt gac gaa ttc atc gga aga 192His Ala Ala Ser Arg Cys Cys Arg Glu Val Asp Glu Phe Ile Gly Arg50 55 60act cct gat cca ttc ata acg att tca tcg gag aag cga agt cat gat 240Thr Pro Asp Pro Phe Ile Thr Ile Ser Ser Glu Lys Arg Ser His Asp65 70 75 80cat tct cac cac ttc ttg aag aag ttt cgc tgt ttg tgc aga gca agt 288His Ser His His Phe Leu Lys Lys Phe Arg Cys Leu Cys Arg Ala Ser85 90 95gcg tgc tgc ctc agc tac ctc tcc tgg atc tgc tgc tgc agc agc gcc 336Ala Cys Cys Leu Ser Tyr Leu Ser Trp Ile Cys Cys Cys Ser Ser Ala100 105 110gcc ggc ggc tgc tca tcc tcc tcc tcc tcc tcc ttc aac ctc aag agg 384Ala Gly Gly Cys Ser Ser Ser Ser Ser Ser Ser Phe Asn Leu Lys Arg115 120 125ccg agc tgc tgc tgc aac tgc aac tgc aac tgc tgc tcc tcc tcc tcc 432Pro Ser Cys Cys Cys Asn Cys Asn Cys Asn Cys Cys Ser Ser Ser Ser130 135 140tcc tca tgt ggg gcg gcg tta acg aag agt ccg tgt cgc tgc cgc cgc 480Ser Ser Cys Gly Ala Ala Leu Thr Lys Ser Pro Cys Arg Cys Arg Arg145 150 155 160cgc agc tgc tgc tgc cgt cgc tgc tgc tgc ggc ggc gtc ggc gtc cgc 528Arg Ser Cys Cys Cys Arg Arg Cys Cys Cys Gly Gly Val Gly Val Arg165 170 175gcg tgc gcg agc tgc agc tgc tcc ccg ccg tgc gcg tgc tgc gcg ccg 576Ala Cys Ala Ser Cys Ser Cys Ser Pro Pro Cys Ala Cys Cys Ala Pro180 185 190ccg tgc gcg gga tgc tcg tgc cgc tgc acc tgc ccg tgc ccg tgc ccc 624Pro Cys Ala Gly Cys Ser Cys Arg Cys Thr Cys Pro Cys Pro Cys Pro195 200 205ggc ggc tgc tcc tgc gcg tgc ccg gcg tgc agg tgc tgc tgc ggc gtc 672Gly Gly Cys Ser Cys Ala Cys Pro Ala Cys Arg Cys Cys Cys Gly Val210 215 220cct cgt tgc tgc ccc ccc tgc ttg tga 699Pro Arg Cys Cys Pro Pro Cys Leu225 230<210>3<211>232<212>PRT
<213>水稻(Oryza sativa)<400>3Met Ala Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Pro Pro1 5 10 15Asp Pro Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His20 25 30Arg Glu Ile Gly Phe Leu Glu Gly Glu Ile Asn Ser Ile Glu Gly Ile35 40 45His Ala Ala Ser Arg Cys Cys Arg Glu Val Asp Glu Phe Ile Gly Arg50 55 60Thr Pro Asp Pro Phe Ile Thr Ile Ser Ser Glu Lys Arg Ser His Asp65 70 75 80His Ser His His Phe Leu Lys Lys Phe Arg Cys Leu Cys Arg Ala Ser85 90 95Ala Cys Cys Leu Ser Tyr Leu Ser Trp Ile Cys Cys Cys Ser Ser Ala100 105 110Ala Gly Gly Cys Ser Ser Ser Ser Ser Ser Ser Phe Asn Leu Lys Arg115 120 125Pro Ser Cys Cys Cys Asn Cys Asn Cys Asn Cys Cys Ser Ser Ser Ser130 135 140Ser Ser Cys Gly Ala Ala Leu Thr Lys Ser Pro Cys Arg Cys Arg Arg145 150 155 160Arg Ser Cys Cys Cys Arg Arg Cys Cys Cys Gly Gly Val Gly Val Arg165 170 175Ala Cys Ala Ser Cys Ser Cys Ser Pro Pro Cys Ala Cys Cys Ala Pro180 185 190Pro Cys Ala Gly Cys Ser Cys Arg Cys Thr Cys Pro Cys Pro Cys Pro195 200 205Gly Gly Cys Ser Cys Ala Cys Pro Ala Cys Arg Cys Cys Cys Gly Val210 215 220Pro Arg Cys Cys Pro Pro Cys Leu225 230
權(quán)利要求
1.一種分離克隆的控制水稻谷粒粒長(zhǎng)和粒重性狀的主效基因,它的核苷酸序列如序列表SEQ ID NO1所示。
2.權(quán)利要求1的所述的基因,它的cDNA序列如序列表SEQ ID NO2所示。
3.權(quán)利要求2所述的基因,它編碼的蛋白質(zhì)具有PEBP-like結(jié)構(gòu)域,跨膜結(jié)構(gòu)域,TNFR/NGFR蛋白質(zhì)家族富含半胱氨酸結(jié)構(gòu)域和VWFC同源結(jié)構(gòu)域。
4.權(quán)利要求1-3所述的基因在水稻育種中的應(yīng)用。
5.權(quán)利要求1-3所述的基因在水稻分子進(jìn)化研究中的應(yīng)用。
全文摘要
本發(fā)明公開了一種分離克隆的控制水稻谷粒粒長(zhǎng)和粒重性狀的主效基因GS3,該基因的DNA序列如SEQ ID NO1所示,序列全長(zhǎng)為7883bp,包含5個(gè)外顯子,共編碼232個(gè)氨基酸。通過生物信息學(xué)技術(shù)預(yù)測(cè)該蛋白質(zhì)具有一些保守結(jié)構(gòu)域,包括PEBP-like結(jié)構(gòu)域,跨膜結(jié)構(gòu)域,TNFR/NGFR蛋白質(zhì)家族富含半胱氨酸結(jié)構(gòu)域和VWFC同源結(jié)構(gòu)域。其cDNA序列如SEQ ID NO2所示。利用水稻三個(gè)大粒品種和三個(gè)小粒品種比較測(cè)序,發(fā)現(xiàn)在7.9kb范圍內(nèi)大小粒品種間只存在一個(gè)共同的堿基差異,位于GS3的第二個(gè)外顯子結(jié)尾處,由小粒品種中的半胱氨酸(TGC)突變?yōu)榇罅F贩N中的終止密碼子(TGA)。該突變?cè)斐蒅S3基因在大粒品種的提前終止,并導(dǎo)致了178個(gè)氨基酸(包括部分PEBP-like結(jié)構(gòu)域和其它3個(gè)保守的結(jié)構(gòu)域)的缺失。本發(fā)明還公開了其制備方法。
文檔編號(hào)C07K14/415GK1995347SQ20061001810
公開日2007年7月11日 申請(qǐng)日期2006年1月5日 優(yōu)先權(quán)日2006年1月5日
發(fā)明者張啟發(fā), 范楚川, 邢永忠 申請(qǐng)人:華中農(nóng)業(yè)大學(xué)