本發(fā)明屬于棉花分子育種
技術(shù)領(lǐng)域:
:,具體涉及一種與陸地棉纖維強度相關(guān)的snp分子標(biāo)記及其檢測和應(yīng)用。
背景技術(shù):
::棉花作為一種主要的纖維作物,在世界經(jīng)濟中占有重要的地位。在全世界廣泛栽培的四個棉種中,陸地棉占據(jù)著最重要的地位,其產(chǎn)量占世界棉花總產(chǎn)量的90%以上。隨著人們對中高檔紡織品需求的增長,對纖維品質(zhì)的要求日益提高,但傳統(tǒng)的育種手段主要是通過表型進行選擇,育種效率低,難以滿足品質(zhì)育種的需要。分子標(biāo)記技術(shù)的發(fā)展使直接選擇數(shù)量性狀的基因型成為了可能。通過構(gòu)建棉花遺傳圖譜進行qtl定位可以使育種者直接選擇纖維品質(zhì)等數(shù)量性狀的基因型,通過利用f2和ril等作圖群體進行了纖維品質(zhì)qtl定位研究也取得了豐碩的成果。尤其以第三代標(biāo)記技術(shù)snp標(biāo)記的開發(fā)和應(yīng)用,更可為以后的標(biāo)記輔助育種打下基礎(chǔ)。snp標(biāo)記是目前最具發(fā)展?jié)摿Φ姆肿訕?biāo)記,因在基因組中數(shù)量多,分布廣且在基因分析過程中不需要根據(jù)片段大小將dna分帶,適合于大規(guī)模的自動化和數(shù)量龐大的檢測分析,目前已得到廣泛的應(yīng)用在醫(yī)學(xué)和生物等領(lǐng)域。但在棉花中的研究還較少。snp是生物體最普遍,分布最廣泛的多態(tài)差異。對擬南芥的3個自然品系的基因組測序及重測序,也發(fā)現(xiàn)了超過八十二萬的snp位點,平均約每1.4kb就會有1個snp。snp極大程度的代表了個體之間的遺傳差異,非常有助于進行特異數(shù)量遺傳性狀與個體分子標(biāo)記的關(guān)聯(lián)性分析(ossowskis.,schneebergerk.,clarkr.m.,lanzc.,warthmannn.,andweigeld.,sequencingofnaturalstrainsofarabidopsisthalianawithshortreads,genomeres.,2008,18(12):2024-2033);楚鷹等通過纖維發(fā)育相關(guān)基因的snp研究利用pcr技術(shù)分離了七個不同纖維品質(zhì)的四倍體棉種材料和兩個二倍體祖先棉種的纖維發(fā)育相關(guān)基因片段,共獲得了五個棉纖維發(fā)育相關(guān)基因在九個棉種材料中的序列信息,對陸地棉高強纖維品系間的snps位點進行了統(tǒng)計,發(fā)現(xiàn)有四個csnps位點中存在非同義突變,可能具有表型效應(yīng)(楚鷹,纖維發(fā)育相關(guān)基因的snp研究與棉花蔗糖合酶基因片段的克隆及表達(dá)分析,碩士畢業(yè)論文,南京:南京農(nóng)業(yè)大學(xué),2004);鄭煒佳等通過對新海21和新陸中36進行ssr和snp分子標(biāo)記引物篩選,使用篩選出的引物對兩個f2群體進行pcr擴增,構(gòu)建遺傳連鎖圖譜,在群體中篩選得到的69對ssr引物和11組snp引物對f2群體擴增出來的多態(tài)性標(biāo)記進行遺傳連鎖分析,構(gòu)建了包括90個標(biāo)記位點的遺傳連鎖圖和30個連鎖群,標(biāo)記間的平均距離為55.9cm,全長為3135.84cm,覆蓋棉花基因組的62.71%(鄭煒佳,snp標(biāo)記的開發(fā)及海陸遺傳連鎖圖譜的構(gòu)建,碩士論文,烏魯木齊:新疆農(nóng)業(yè)大學(xué),2013);何林池等為探討親緣關(guān)系較近的耐鹽棉花品種中棉所35與鹽敏感棉花品種中棉所12耐鹽差異性,用不同濃度nacl處理棉花幼苗,調(diào)查這2個棉花品種在鹽脅迫下過氧化氫酶、過氧化物酶、超氧化物歧化酶等抗氧化酶活性的變化,以及對中棉所35和中棉所12的snp/in-del進行初步鑒定,發(fā)現(xiàn)親緣關(guān)系很近而耐鹽水平差異顯著的中棉所35和中棉所12存在點突變和插入/缺失,說明這些snp/indel可能對耐鹽性狀有重要的調(diào)控功能(何林池,王康,魏小云,等,耐鹽差異性不同棉花品種的抗氧化酶活性及snp/indel分析,江蘇農(nóng)業(yè)學(xué)報,2014,30(5):980-985);zhu通過重組自交系群體構(gòu)建了全基因組snp連鎖圖譜,找到2618個多態(tài)性snp標(biāo)記,其中有16個穩(wěn)定的qtls存在兩個環(huán)境中,12個qtl涉及多性狀,這些qtls主要分布在5,9,10,14,19,和20號染色體上(lic,zhusjetal.genome-widesnplinkagemappingandqtlanalysisforfiberqualityandyieldtraitsintheuplandcottonrecombinantinbredlinespopulation.frontiersinplantscience,2016,7:218);匡猛等利用有代表性的材料進行snp位點的全基因組掃描分析與綜合評估,基于kasp技術(shù)開發(fā)1套適用于我國棉花雜交種純度高通量檢測的核心snp組合,從63k的棉花全基因組芯片中篩選獲得具有單拷貝特性的snp標(biāo)記分別為5474個(中棉所tm-1基因組版本)和1850個(南京農(nóng)大tm-1基因組版本),最終從每條染色體上優(yōu)選1個雜交種雜合率高且分型效果理想的核心snp位點,合計26個,采用krakentm軟件將snp位點轉(zhuǎn)化成kasp標(biāo)記,利用snpline平臺進行snp分型檢測,實現(xiàn)了對大量樣品的高通量基因分型,尤其適用于品種純度快速檢測,為snp標(biāo)記技術(shù)在棉花品種鑒定及指紋數(shù)據(jù)庫構(gòu)建等方面的應(yīng)用奠定基礎(chǔ)(匡猛,馬峙英等,基于單拷貝snp標(biāo)記的棉花雜交種純度高通量檢測技術(shù),棉花學(xué)報cottonscience2016,28(3):227―233)。袁有祿等利用一個異常棉高強纖維漸滲系7235和陸地棉遺傳標(biāo)準(zhǔn)系tm-1為親本構(gòu)建了f2、f2:3分離群體,鑒定了一個可以在中國的不同棉區(qū)及美國等多個環(huán)境中均能檢測到主效qtl,可解釋30%以上的表型變異(袁有祿等,棉花高品質(zhì)纖維性狀qtls的分子標(biāo)記篩選及其定位,遺傳學(xué)報,2001,28(12):1151-1161);沈新蓮等利用3個陸地棉高強纖維種質(zhì)系構(gòu)建了3個f2種內(nèi)連鎖圖,利用復(fù)合區(qū)間作圖法檢測到38個與纖維品質(zhì)有關(guān)的qtls,其中15個穩(wěn)定的qtls能同時在f2和f2:3檢測到,至少3個qtls能在兩個群體中表達(dá)(沈新蓮,陸地棉纖維品質(zhì)qtl的篩選、定位及其應(yīng)用,博士畢業(yè)論文,南京農(nóng)業(yè)大學(xué),2004);石玉真等以黃河流域廣泛種植的轉(zhuǎn)基因抗蟲棉品種sgk321和sgk9708(中41)為輪回親本,分別與優(yōu)質(zhì)豐產(chǎn)品種太121和高纖維品質(zhì)漸滲種質(zhì)系7235雜交的f1代材料雜交并回交,配置了雜交回交組合兩套,運用與一個已定位的高強纖維qtl緊密連鎖的2個ssr標(biāo)記,這2個標(biāo)記在不同的遺傳背景,經(jīng)過多代雜交、回交和自交后,能夠穩(wěn)定遺傳而且qtl的效應(yīng)穩(wěn)定,并運用此項技術(shù)結(jié)合其它手段進行優(yōu)質(zhì)、抗蟲等基因的聚合育種研究,快速有效地改良現(xiàn)有的陸地棉推廣品種,創(chuàng)造高產(chǎn)、優(yōu)質(zhì)、抗蟲棉花新材料或新品系(石玉真等.與棉花纖維強度連鎖的主效qtl應(yīng)用于棉花分子標(biāo)記輔助育種.分子植物育種,2007,5(4):521-527);王義青等利用陸地棉魯棉研21作為母本、nm03102為父本構(gòu)建了f2和f2∶3分離群體,對195個f2群體單株分析得到242個標(biāo)記位點,共檢測到20個纖維品質(zhì)性狀qtl,其中1個纖維強度的qtl和1個麥克隆值的qtl在兩世代中穩(wěn)定存在,這為標(biāo)記輔助選擇奠定了基礎(chǔ)(王義青,李俊文,袁有祿等,陸地棉高品質(zhì)品系纖維品質(zhì)性狀qtl的分子標(biāo)記及定位,棉花學(xué)報,2010,22(6):533-538);賈菲等利用以sgk9708為母本,0-153為父本構(gòu)建的196個陸地棉重組自交系(f6:8)構(gòu)建了包含186個標(biāo)記,總長827.84cm,標(biāo)記間平均距離4.45cm,覆蓋棉花基因組18.6%的遺傳連鎖圖譜,并對7個環(huán)境下的鈴重和衣分性狀進行qtl定位和上位性互作分析。定位了多個環(huán)境下穩(wěn)定表達(dá)的5個主效qtls(qbw-1-1,qbw-1-2,qlp-2-1,qlp-2-2和qlp-4-2),檢測到4對鈴重上位性互作qtls和7對衣分上位性互作qtls賈菲等.多環(huán)境下陸地棉(gossypiumhirsutuml.)重組自交系鈴重與衣分性狀的qtl分析.分子植物育種,2011,9(8):318-326);王天抗等利用以2個纖維品質(zhì)優(yōu)異材料0-153和新陸早24與2個大面積推廣品種魯棉研28和冀棉516為親本,配制的雙交f1群體,對3個纖維強度主效qtls連鎖的4個ssr標(biāo)記進行輔助選擇,并對不同qtls的聚合效應(yīng)進行了研究。結(jié)果4個標(biāo)記的選擇都表現(xiàn)出顯著的遺傳效應(yīng)(王天抗等,棉花纖維強度主效qtls分子標(biāo)記輔助選擇及聚合效應(yīng)研究,棉花學(xué)報,2014,26(5):396-403);jamshed利用重組自交系(ril)群體構(gòu)建遺傳圖譜,定位到47個qtl在多個環(huán)境下穩(wěn)定,這些qtl多以聚合群的形式存在,控制兩個或兩個以上的性狀,這些qtl主要集中在4、7、14、25號染色體(jamshedetal.identificationofstablequantitativetraitloc(qtls)forfiberqualitytraitsacrossmultipleenvironmentsingossypiumhirsutumrecombinantinbredlinepopulation.bmcgenomics,2016,17:197);zhang等通過兩個陸地棉品種0–153和sgk9708構(gòu)建的重組自交系群體利用slaf序列構(gòu)建了有5521個單核苷酸多態(tài)性標(biāo)記,覆蓋總距離為3259.37cm的高密度遺傳圖譜(zhangetal.constructionofahigh-densitygeneticmapbyspecificlocusamplifiedfragmentsequencing(slaf-seq)anditsapplicationtoquantitativetraitloci(qtl)analysisforbollweightinuplandcotton(gossypiumhirsutum.).bmcplantbiology,2016,16:79)。總之,snp標(biāo)記是目前最具發(fā)展?jié)摿Φ姆肿訕?biāo)記,目前已得到廣泛的應(yīng)用,但在棉花中的應(yīng)用還較少,前人的研究中多數(shù)是利用分離群體如f2、bc1,遺傳背景復(fù)雜,或只在單個環(huán)境下檢測得到的結(jié)果,因此缺乏可靠性和穩(wěn)定性,多環(huán)境穩(wěn)定的qtl少,且有些研究最初的目的只是為了進行目標(biāo)基因的定位。技術(shù)實現(xiàn)要素:本發(fā)明所要解決的技術(shù)問題是:通過篩選出一種與陸地棉纖維強度基因緊密連鎖且在多個環(huán)境下表現(xiàn)穩(wěn)定的snp分子標(biāo)記,將這些snp分子標(biāo)記應(yīng)用于棉花纖維品質(zhì)的輔助選擇,可以盡快提高我國棉花品種的纖維品質(zhì)水平。本發(fā)明提供的技術(shù)方案是:一種與陸地棉纖維高強度基因連鎖的snp標(biāo)記,定位在與強度相關(guān)的8個qtl中,其中有4個在多環(huán)境下檢測穩(wěn)定,這些qtl都位于25號染色體,有3個能夠篩選得到分型較好的snp標(biāo)記;其中與qfs-chr25-2連鎖的snp標(biāo)記為cri-snp198784、cri-snp198785、cri-snp198786、cri-snp198787、cri-snp198788、cri-snp198789、cri-snp198790、cri-snp198791;與qfs-chr25-3連鎖的snp標(biāo)記為cri-snp198792、cri-snp198793、cri-snp198794、cri-snp198795;與qfs-chr25-5連鎖的snp標(biāo)記為cri-snp198796、cri-snp198797、cri-snp198798、cri-snp198799、cri-snp198800、cri-snp198801、cri-snp198802、cri-snp198803、cri-snp198804、cri-snp198805、cri-snp198806、cri-snp198807,(其中cri:cottonresearchinstitute代表中國農(nóng)業(yè)科學(xué)院棉花研究所;snp代表標(biāo)記類型;數(shù)字代表標(biāo)記開發(fā)順序),所述的snp分子標(biāo)記在染色體上的位置和突變堿基如下表所示:標(biāo)記名稱snp位點突變堿基cri-snp19878411634304g/tcri-snp19878511727497g/tcri-snp19878611727737g/tcri-snp19878711800162g/acri-snp19878811800115g/tcri-snp19878912039916g/acri-snp19879012039883c/tcri-snp19879112364008t/ccri-snp19879213627793c/tcri-snp19879313795574g/tcri-snp19879413627853t/ccri-snp19879513795623c/tcri-snp19879615620852g/acri-snp19879716378403t/ccri-snp19879817002845c/tcri-snp19879916735882g/acri-snp19880016727879c/acri-snp19880116548321g/tcri-snp19880217481142g/ccri-snp19880317882165t/ccri-snp19880418212914g/acri-snp19880518213630a/ccri-snp19880618213276g/acri-snp19880719698812c/g本發(fā)明中,qtl命名參考mccouch等(1997)在水稻中的命名規(guī)則,以q+性狀+連鎖群+qtl個數(shù)的形式表示。(mccouchsr,choyg,yanom,etal.reportonqtlnomenclature,ricegenetnewslett.,1997,14:11-13),例如qfs-chr25-2表示定位到25號染色體與纖維強度相關(guān)的第二個qtl。本發(fā)明所述的snp標(biāo)記可通過snp基因分型實驗有效地區(qū)分不同snp位點與不同基因型,從而可對不同棉花樣品進行篩選,可篩選出纖維強度高的株系,大大縮短育種周期,提高棉花纖維強度的育種效率。同時,本發(fā)明還提供一種與陸地棉纖維強度的三個qtlqfs-chr25-2、qfs-chr25-3、qfs-chr25-5連鎖的snp標(biāo)記的篩選方法,包括如下步驟:(1)利用大田推廣的陸地棉栽培品種中棉所41選系sgk9708和具有亞洲棉高強纖維基因的陸地棉優(yōu)異品系0-153為親本構(gòu)建f2和f2:3群體;(2)f2:3群體家系內(nèi)每世代自交,在f2:6世代進行一次單株選擇,再種植兩代到f6:8,把f6:8及以后的世代作為重組自交系群體進行多年多點實驗;(3)提取重組自交系群體和親本的dna;具體方法參考以下文獻,宋國立,改良ctab法快速提取棉花dna,棉花學(xué)報,1998,10(5):273-275);(4)構(gòu)建連鎖圖譜:對檢測的各樣品基因組dna進行酶切實驗,對得到的酶切片段(slaf標(biāo)簽)進行3’端加a處理,連接dual-index測序接頭,pcr擴增、純化、混樣、切膠選取目的片段,測序,對測序結(jié)果用軟件進行遺傳圖譜的構(gòu)建(zhangj,guowz,zhangtz.molecularlinkagemapofal-lotetraploidcotton(gossypiumhirsutuml.×gossypiumbar-badensel.)withahaploidpopulation.theorapplgenet,2002,105:1166–1174);(5)纖維強度qtl定位:進行多環(huán)境穩(wěn)定的纖維強度主效qtls篩選,可得到上述的3個多環(huán)境穩(wěn)定的纖維強度主效qtls及其連鎖標(biāo)記。本發(fā)明的有益效果如下:本發(fā)明涉及的與多環(huán)境穩(wěn)定的高強纖維主效基因有關(guān)的位點共有3個(qfs-chr25-2、qfs-chr25-3、qfs-chr25-5),通過篩選與棉花高強纖維主效基因緊密連鎖且在多個環(huán)境下表現(xiàn)穩(wěn)定的snp標(biāo)記,將這些snp標(biāo)記應(yīng)用于棉花纖維品質(zhì)的輔助選擇,qtl定位結(jié)果可靠,可以盡快提高我國棉花品種的纖維品質(zhì)水平。qfs-chr25-2能在3個環(huán)境下((2007年安陽、2008年臨清、2010年安陽)檢測到,可解釋的表型變異為4.75-5.57%,加性效應(yīng)值為0.58-0.71cn/tex;qfs-chr25-3能在5個環(huán)境下(2007年安陽、2008年臨清、2009年曲周、2010年安陽、2010年高邑)檢測到,可解釋的表型變異為6.43-11.82%,加性效應(yīng)值為0.65-1.01cn/tex;qfs-chr25-5能在6個環(huán)境下(2008年安陽、2009年安陽、2009年阿克蘇、2010年高邑、2010年鄭州、2013年安陽)檢測到,解釋的表型變異為4.88-14.60%,加性效應(yīng)值為0.56-1.34cn/tex。本發(fā)明利用重組自交系f6:8(ril)篩選出穩(wěn)定的纖維強度qtls及其緊密連鎖的分子標(biāo)記,所述snp分子標(biāo)記是以棉花穩(wěn)定的ril群體為材料,通過基因組重測序的方法得到,利用與這些qtl緊密連鎖的分子標(biāo)記篩選出纖維強度得到提高的株系,進行分子標(biāo)記輔助育種選擇,可大大縮短育種周期,提高棉花纖維強度的育種效率。附圖說明圖1是通過基因組重測序得到的總圖距為5197.17cm的遺傳圖譜。圖2是在25號染色體上與強度連鎖的qtls的位置圖,其中多環(huán)境穩(wěn)定且能篩選到snp標(biāo)記的有3個,分別為qfs-chr25-2、qfs-chr25-3、qfs-chr25-5。具體實施方式下面通過具體實施方式的詳細(xì)描述來進一步闡明本發(fā)明,但并不是對本發(fā)明的限制,僅僅作示例說明。(1)重組自交系f6:8的獲得2007年-2008年的田間種植和dna的提取請見專利申請公開號:cn101613761a,發(fā)明名稱:與棉花纖維強度主效基因連鎖的ssr標(biāo)記的專利申請文件。2009年分別于河南安陽中國農(nóng)業(yè)科學(xué)院棉花研究所試驗站,中國農(nóng)業(yè)大學(xué)曲周試驗站和新疆阿克蘇德佳科技種業(yè)有限公司試驗站種植親本和f6:10群體。安陽和曲周采用單行區(qū),5米行長,行距分別為0.8m和(0.8+0.5)m,每行20株;新疆采用6行區(qū),2米行長,每行15株。2010年分別于河北高邑原種場,河南安陽中國農(nóng)業(yè)科學(xué)院試驗站和河南鄭州種植親本和f6:11群體,安陽和鄭州采用單行區(qū),行長5m,行距0.8m;高邑采用單行區(qū),行長4m,寬窄行(0.8+0.6)m。上述各個試點都采用不完全隨機區(qū)組設(shè)計,種植兩個重復(fù)。9月中下旬進行田間取樣,按家系收花,取12g左右的纖維樣品進行纖維品質(zhì)的測定。(2)提取重組自交系群體和親本的dna。(3)選擇以中國農(nóng)業(yè)科學(xué)院棉花研究所提供的棉花四倍體基因組序列為參考基因組進行電子酶切預(yù)測(lifg,fangy,lucr,xiaogh,zoucs,kohelrj,mazy,shanghh,maxf,wujh,etal.genomesequenceofcultivateduplandcotton(gossypiumhirsutumtm-1)providesinsightsintogenomeevolution.naturebiotechnology,2015,33(5)),最終選擇haeiii+sspi酶,酶切標(biāo)率為98.61%,共得到495.48mreads,酶切片段長度在364-414bp的序列定義為slaf標(biāo)簽。(4)根據(jù)選定的最適酶切方案,對檢測的各樣品基因組dna進行酶切實驗,對得到的酶切片段(slaf標(biāo)簽)進行3’端加a處理,連接dual-index測序街頭,pcr擴增、純化、混樣、切膠選取目的片段,文庫質(zhì)檢合格后用illuminahiseqtm2500進行測序。(5)利用dual-index對測序得到的原始數(shù)據(jù)進行識別,得到各個樣品的reads。通過reads間聚類的方法,在親本和子代中開發(fā)slaf標(biāo)簽。(6)通過生物信息學(xué)分析,共得到321797個slaf標(biāo)簽,其中多態(tài)性的slaf標(biāo)簽共有35300個。(7)對多態(tài)性的slaf標(biāo)簽進行基因型編碼,基因型編碼規(guī)則為遺傳學(xué)通用的2等位編碼規(guī)則,如某標(biāo)記的親本基因型為aa(父本)和bb(母本),子代基因型ab則表示該樣品在這個標(biāo)記的編碼類型為雜合,其中有一個基因型來自于父本,有一個基因型來自于母本。(8)為保證遺傳圖譜質(zhì)量,slaf標(biāo)簽按照父母本測序深度10x以下、完整度低于30%、嚴(yán)重偏分離(p-value<0.05)、親本雜合、同時比對到兩套基因組的條件進行過濾,共篩選出的7958個slaf標(biāo)簽。(9)通過與參考基因組的定位將slaf標(biāo)簽分為26個連鎖群,計算高質(zhì)量分子標(biāo)簽間的lod值,通過lod值進行連鎖分群,對每個連鎖群采用highmap軟件進行遺傳圖譜的構(gòu)建,通過校正,得到總圖距為5197.17cm的遺傳圖譜(如圖1所示)。其中highmap軟件由北京百邁克生物科技公司自主研發(fā)。(10)基于slaf的測序數(shù)據(jù),通過bwa與兩個2倍體棉花的參考基因組比對,得到與親本之間有多態(tài)性的snp有44583個,通過質(zhì)量過濾后,在圖譜上定位得到10440個snp標(biāo)記。(11)采用軟件qtlicimappingv4.0(http://www.isbreeding.net/software/)和軟件winqtlcart2.5,通過11個環(huán)境(2007年安陽、2008年安陽、2008年臨清、2008年曲周、2009年安陽、2009年曲周、2009年阿克蘇、2010年安陽、2010年高邑、2010年鄭州、2013年安陽)纖維強度性狀的表型數(shù)據(jù)和基因型數(shù)據(jù),進行纖維強度性狀的多環(huán)境qtl定位分析,共得到與強度相關(guān)的qtl共5個,其中多環(huán)境穩(wěn)定且能篩選到snp標(biāo)記的有3個(如圖2所示),其中與qfs-chr25-2連鎖的snp標(biāo)記為cri-snp198784、cri-snp198785、cri-snp198786、cri-snp198787、cri-snp198788、cri-snp198789、cri-snp198790、cri-snp198791;與qfs-chr25-3連鎖的snp標(biāo)記為cri-snp198792、cri-snp198793、cri-snp198794、cri-snp198795;與qfs-chr25-5連鎖的snp標(biāo)記為cri-snp198796、cri-snp198797、cri-snp198798、cri-snp198799、cri-snp198800、cri-snp198801、cri-snp198802、cri-snp198803、cri-snp198804、cri-snp198805、cri-snp198806、cri-snp198807。當(dāng)前第1頁12當(dāng)前第1頁12