384個snp位點及其在大豆品種資源鑒定中的應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及生物技術(shù)領(lǐng)域中384個SNP位點及其在大豆品種資源鑒定中的應(yīng)用。
【背景技術(shù)】
[0002] 大豆起源于中國,是人類植物蛋白質(zhì)和脂肪的主要來源。我國保存著世界上最豐 富的大豆種質(zhì)資源,在國家種質(zhì)庫中保存的栽培大豆種質(zhì)超過23000多份,野生大豆種質(zhì)超 過7000份。在庫存的種質(zhì)資源中,有很多僅僅進行了表型性狀的記錄,缺乏在遺傳學(xué)上的深 入鑒定。隨著我國人民生活水平的提高,大豆需求量猛增,育成品種的數(shù)量也在迅速增加, 迄今為止育成品種數(shù)量超過1800個,僅每年參加國家區(qū)域試驗的大豆品種就超過200份。如 此龐大的品種數(shù)量增加了大豆品種管理的難度,在市場上也出現(xiàn)了同名異物或異物同名所 致的品種真實性問題,嚴重干擾大豆種業(yè)的健康發(fā)展。同時由于缺乏大豆種質(zhì)資源間遺傳 關(guān)系的深入分析,育種家只能憑借經(jīng)驗在經(jīng)常使用的一些種質(zhì)資源中選擇親本,品種間的 遺傳差異越來越小,如何有效的管理和鑒別數(shù)量龐大的大豆品種資源已經(jīng)成為品種和種質(zhì) 資源管理的難題。
[0003] 傳統(tǒng)的品種資源鑒定方法通常是通過田間種植,利用形態(tài)指標開展種質(zhì)資源以及 品種真實性的鑒定,但這類鑒定方法的區(qū)分能力有限,受環(huán)境影響較大,同時還存在鑒定工 作量大、周期長、受季節(jié)限制等劣勢。分子生物學(xué)技術(shù)的發(fā)展使得種質(zhì)資源和品種鑒定進入 到分子水平,基于DNA多態(tài)性的分子標記已經(jīng)成為分析生物遺傳多樣性的有力工具。這些分 子標記具有不受環(huán)境影響、供選擇的標記數(shù)量多、可以進行高通量測試分析等優(yōu)勢,已經(jīng)成 為作物親緣關(guān)系分析、種子純度鑒定及品種真?zhèn)涡詸z測的重要手段。在各種DNA分子標記 中,SSR和SNP標記均為共顯性遺傳,它們在染色體上的位置已知、具有高通量自動化的特 點,在DNA指紋鑒定上顯示了獨特的優(yōu)越性。由于SSR標記多態(tài)性豐富、操作簡單、成本低廉 等特點以及在常規(guī)實驗室即可開展的優(yōu)勢,已經(jīng)在水稻、玉米、大豆等作物種質(zhì)資源及品種 鑒定領(lǐng)域應(yīng)用了十多年。但是隨著分子生物學(xué)技術(shù)的發(fā)展和鑒定需求的提高,SSR標記位點 存在著通量難以提高、不同電泳平臺間的數(shù)據(jù)共享困難等局限性。相對于SSR標記,SNP標記 具有更多的優(yōu)點:一是SNP位點數(shù)目更加豐富而且在基因組上分布更加均勻;二是由于SNP 不以DNA長度差異作為檢測手段,從而擺脫了凝膠電泳的瓶頸限制,易于實現(xiàn)分析的高通量 和自動化;三是SNP位點通常只有兩種等位基因,容易實現(xiàn)平臺間數(shù)據(jù)的整合。隨著水稻、玉 米等多種作物基因組信息的完善,大量的SNP位點被開發(fā),各種SNP基因分型平臺出現(xiàn),SNP 標記已經(jīng)成為作物DNA指紋數(shù)據(jù)庫構(gòu)建最有潛力的標記系統(tǒng)。
[0004] 隨著大豆全基因組測序的完成和重測序技術(shù)的開展,SNP位點的開發(fā)在大豆中取 得了重要的進展,通過對野生大豆和栽培大豆的重測序,從大豆基因組中篩選出數(shù)百萬的 SNP位點,在序列分析的基礎(chǔ)上開發(fā)了含有高密度SNP的大豆基因芯片SoySNP50K和 SoySNP6K芯片,這些芯片在全基因組關(guān)聯(lián)分析、遺傳圖譜構(gòu)建和QTL定位中成功應(yīng)用。但是 適用于大豆品種真實性鑒定及指紋數(shù)據(jù)庫構(gòu)建的SNP位點的選擇標準與其他研究領(lǐng)域如關(guān) 聯(lián)分析、遺傳圖譜構(gòu)建等有很大的差別,并不能直接將這些高密度的芯片應(yīng)用于大豆品種 真實性鑒定和數(shù)據(jù)庫構(gòu)建中。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問題是如何鑒定大豆品種資源。
[0006] 為解決上述技術(shù)問題,本發(fā)明首先提供了 384個SNP位點在大豆品種資源鑒定中的 應(yīng)用;
[0007] 所述384個SNP分子標記的物理位置是基于大豆品種Williams82的全基因組序列 比對確定的,所述大豆品種Wi 11 iams82的全基因組序列的版本號為G1 yma . Wm82 . a 1 (Gmaxl. 01);所述384個SNP位點是SMK001-SMK384;所述SMK001-SMK384見實施例 1。
[0008] 為解決上述技術(shù)問題,本發(fā)明還提供了用于大豆品種資源鑒定的方法。所述方法, 包括將待測大豆樣品基因組DNA的384個SNP位點基因型與對照大豆樣品基因組DNA的所述 384個SNP位點基因型進行比較;根據(jù)比較結(jié)果確定所述待測大豆與所述對照大豆是否為同 一品種。
[0009] 具體方法為:將待測大豆樣品基因組DNA的所述384個SNP位點基因型與對照大豆 樣品基因組DNA的所述384個SNP位點基因型進行比較后,根據(jù)公式1計算所述待測大豆樣品 與所述對照大豆樣品的差異位點百分比,若所述待測大豆樣品與所述對照大豆樣品在所述 384個SNP位點的差異位點百分比<5%,則所述待測大豆樣品與所述對照大豆樣品屬于或 候選屬于同一品種;若所述差異位點百分比2 5%,則所述待測大豆樣品與所述對照大豆樣 品不屬于或候選不屬于同一品種;
[0010]所述待測大豆樣品與所述對照大豆樣品的差異位點百分比= 2^/(4+?)(公式 1),公式1中為所述待測大豆樣品與所述對照大豆樣品的所述384個SNP位點中的差異位 點數(shù),Κ為所述待測大豆樣品檢測出的所述384個SNP位點中的位點數(shù),Ν」為所述對照大豆樣 品檢測出的所述384個SNP位點中的位點數(shù)。
[0011] 其中,所述5%可為3.9%。
[0012] 為解決上述技術(shù)問題,本發(fā)明還提供了確定大豆群體中不同品種的遺傳關(guān)系的方 法,該方法包括:對待測大豆群體中每個待測大豆品種的基因組DNA進行所述384個SNP位點 的檢測,獲得每個待測大豆品種的基因型數(shù)據(jù);如所述待測大豆群體中兩個待測大豆樣品 的所述384個SNP位點中差異位點越多,則所述兩個待測大豆樣品的遺傳關(guān)系越遠或候選越 遠;如所述兩個待測大豆樣品的所述384個SNP位點中差異位點越少,則所述兩個待測大豆 樣品的遺傳關(guān)系越近或候選越近;
[0013] 所述差異位點為所述384個SNP位點中基因型不同的位點。
[0014]為解決上述技術(shù)問題,本發(fā)明還提供了用于大豆品種資源鑒定的384個SNP分子標 記,所述384個SNP分子標記為所述384個SNP位點的脫氧核苷酸。
[0015] 為解決上述技術(shù)問題,本發(fā)明還提供了用于檢測384個SNP位點基因型的成套試 劑。所述成套試劑中,所述384個SNP位點用于大豆品種資源鑒定,所述384個SNP位點分別為 所述384個SNP位點;所述成套試劑由序列1-序列768中每條序列的第19-89位所示的768條 單鏈DNA組成。
[0016] 上述成套試劑中,所述成套試劑可由序列1-序列768所示的768條單鏈DNA組成。 [0017]上述成套試劑中,所述成套試劑中各單鏈DNA的摩爾數(shù)可相等,也可以根據(jù)具體的 大?品種進彳丁調(diào)整。
[0018] 為解決上述技術(shù)問題,本發(fā)明還提供了用于檢測384個SNP位點基因型的系統(tǒng)。所 述系統(tǒng)包括所述成套試劑和利用芯片檢測SNP位點基因型所需的試劑、儀器、軟件(如 Genome Studio Genotyping Module軟件)和/或模塊;所述384個SNP位點用于大豆品種資 源鑒定;所述384個SNP位點分別為所述的384個SNP位點。
[0019] 上述系統(tǒng)也可為包括所述成套試劑和利用芯片檢測SNP位點基因型所需的試劑芯 片或試劑盒。
[0020] 為解決上述技術(shù)問題,本發(fā)明還提供了下述XI或X2:
[0021] XI、所述成套試劑或所述系統(tǒng)在大豆品種資源鑒定或大豆分子育種中的應(yīng)用;
[0022] X2、所述用于大豆品種資源鑒定的方法或所述確定大豆群體中不同品種的遺傳關(guān) 系的方法在大豆分子育種中的應(yīng)用。
[0023] 為解決上述技術(shù)問題,本發(fā)明還提供了所述成套試劑的制備方法,該方法包括A1) 或 A2):
[0024] A1)將所述成套試劑中各單鏈DNA單獨包裝;
[0025] A2)將所述成套試劑中各單鏈DNA包裝在一起。
[0026]為解決上述技術(shù)問題,本發(fā)明還提供了所述系統(tǒng)的的制備方法,該方法包括所述 八1)或所述八2)。
[0027]本發(fā)明所提供的基于384個SNP位點新組合基礎(chǔ)上的SNP芯片可應(yīng)用于鑒別大豆品 種資源;這384個SNP位點組合的應(yīng)用將極大提高檢測準確度、縮短檢測時間、提高檢測水 平,為大豆品種推廣、種子市場檢測提供強有力的技術(shù)支撐,維護農(nóng)民權(quán)益,確保農(nóng)業(yè)生產(chǎn) 安全;并為大豆分子育種提供重要的技術(shù)支撐,加快優(yōu)良大豆新品種的選育進程。
【附圖說明】
[0028]圖1為384個SNP位點在大豆基因組上的分布。
[0029]圖2為利用384個SNP位點對192份大豆種質(zhì)資源進行聚類分析的結(jié)果。其中,綠色 方塊代表黃淮海地區(qū)的大豆材料,藍色三角代表東北南片的吉林的大豆材料,紅色圓形代 表東北北片的黑龍江省和內(nèi)蒙古的大豆材料。
[0030] 圖3為192份大豆品種資源間兩兩比對后384個SNP位點差異百分比的分布。
[0031] 圖3中差異百分比為差異位點百分比。
【具體實施方式】
[0032]下面結(jié)合【具體實施方式】對本發(fā)明進行進一步的詳細描述,給出的實施例僅為了闡 明本發(fā)明,而不是為了限制本發(fā)明的范圍。
[0033] 下述實施例中的實驗方法,如無特殊說明,均為常規(guī)方法。
[0034] 下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
[0035] 實施例1、用于大豆品種資源鑒定或大豆分子育種芯片的制備
[0036] 利用SoySNP6K芯片對300份來源于不同生態(tài)區(qū)的大豆品種進行鑒定,獲得5361個 SNP位點的數(shù)據(jù),根據(jù)鑒定結(jié)果、位點的區(qū)分效率以及SNP在染色體上均勻分布的原則篩選 出384個SNP位點,具體篩選過程如下:(1)通過剔除無信號、無多態(tài)性的位點,篩選MAF>0.2 且缺失數(shù)據(jù)+雜合度的比例〈5%的SNP位點,獲得2839個候選SNP; (2)通過連鎖不平衡分析 篩選獲得位于不同的連鎖不平衡區(qū)域的tag SNP1440個;(3)基于無緊密連鎖、在染色體上 均勻分布的原則,確定了 384個核心SNPs。
[0037] 將384個SNP位點及其側(cè)翼序列提交到Illumina公司的評估平臺進行評價,經(jīng)芯片 設(shè)計系統(tǒng)評估,所有384個SNP位點的分值均適合制備芯片,這384個SNP位點命名為SMK001-SMK384,這384個SNP位點的物理位置及其側(cè)翼序列是基于大豆品種Williams82的全基因組 序列(版本號Glyma. Wm82 .al (Gmaxl .01),網(wǎng)址為:http: //www. soybase. org/gb2/gbrowse/ gmaxl.01/)比對確定的,這384個SNP位點在大豆基因組上的分布如圖1所示,SMK001-SMK384具體如下:
[0038] SMK001位于1號染色體上第376871位,其脫氧核苷酸為T或C;
[0039] SMK002位于1號染色體上第1905126位,其脫氧核苷酸為G或A;
[0040] SMK003位于1號染色體上第2009015位,其脫氧核苷酸為G或T;
[0041 ] SMK004位于1號染色體上第3644772位,其脫氧核苷酸為T或C;
[0042] SMK005位于1號染色體上第3766931位,其脫氧核苷酸為C或T;
[0043] SMK006位于1號染色體上第5369218位,其脫氧核苷酸為T或C;
[0044] SMK007位于1號染色體上第34242779位,其脫氧核苷酸為C或T;
[0045] SMK008位于1號染色體上第35331895位,其脫氧核苷酸為C或T;
[0046] SMK009位于1號染色體上第36124186位,其脫氧核苷酸為A或G;
[0047] SMK010位于1號染色體上第37431876位,其脫氧核苷酸為T或C;
[0048] SMK011位于1號染色體上第41367155位,其脫氧核苷酸為C或T;
[0049] SMK012位于1號染色體上第42092477位,其脫氧核苷酸為T或C;
[0050] SMK013位于1號染色體上第44333894位,其脫氧核苷酸為T或C;
[0051 ] SMK014位于1號染色體上第47925857位,其脫氧核苷酸為G或A;
[0052] SMK015位于1號染色體上第48005973位,其脫氧核苷酸為G或A;
[0053] SMK016位于1號染色體上第52885135位,其脫氧核苷酸為T或C;
[0054] SMK017位于2號染色體上第1436429位,其脫氧核苷酸為A或G;
[0055] SMK018位于2號染色體上第2943710位,其脫氧核苷酸為G或A;
[0056] SMK019位于2號染色體上第6954614位,其脫氧核苷酸為G或A;
[0057] SMK020位于2號染色體上第8366792位,其脫氧核苷酸為A或G;
[0058] SMK021位于2號染色體上第8812907位,其脫氧核苷酸為T或C;
[0059] SMK022位于2號染色體上第9390424位,其脫氧核苷酸為A或C;
[0060] SMK023位于2號染色體上第11223101位,其脫氧核苷酸為G或A;
[0061] SMK024位于2號染色體上第13485851位,其脫氧核苷酸為A或G;
[0062] SMK025位于2號染色體上第39892187位,其脫氧核苷酸為G或A;
[0063] SMK026位于2號染色體上第40355756位,其脫氧核苷酸為A或G;
[0064] SMK027位于2號染色體上第40578850位,其脫氧核苷酸為A或C;
[0065] SMK028位于2號染色體上第40740650位,其脫氧核苷酸為G或T;
[0066] SMK029位于2號染色體上第45582001位,其脫氧核苷酸為G或T;
[0067] SMK030位于2號染色體上第45946501位,其脫氧核苷酸為T或C;
[0068] SMK031位于2號染色體上第47747116位,其脫氧核苷酸為G或T;
[0069] SMK032位于2號染色體上第48147900位,其脫氧核苷酸為G或Τ; [0070] SMK033位于2號染色體上第48371970位,其脫氧核苷酸為Α或G; [0071] SMK034位于2號染色體上第49608405位,其脫氧核苷酸為G或T; [0072] SMK035位于3號染色體上第2285179位,其脫氧核苷酸為T或C; [0073] SMK036位于3號染色體上第2567559位,其脫氧核苷酸為A或G; [0074] SMK037位于3號染色體上第2960225位,其脫氧核苷酸為A或C; [0075] SMK038位于3號染色體上第3171837位,其脫氧核苷酸為A或C; [0076] SMK039位于3號染色體上第3739270位,其脫氧核苷酸為G或A; [0077] SMK040位于3號染色體上第3980046位,其脫氧核苷酸為A或G; [0078] SMK041位于3號染色體上第5185602位,其脫氧核苷酸為C或T; [0079] SMK042位于3號染色體上第5393744位,其脫氧核苷酸為G或A; [0080] SMK043位于3號染色體上第5949610位,其脫氧核苷酸為C或A; [0081 ] SMK044位于3號染色體上第6534897位,其脫氧核苷酸為T或C; [0082] SMK045位于3號染色體上第7653508位,其脫氧核苷酸為A或G; [0083] SMK046位于3號染色體上第8003625位,其脫氧核苷酸為C或T; [0084] SMK047位于3號染色體上第8576092位,其脫氧核苷酸為G或A;
[0085] SMK048位于3號染色體上第10372947位,其脫氧核苷酸為G或A;
[0086] SMK049位于3號染色體上第17652662位,其脫氧核苷酸為G或A;
[0087] SMK050位于3號染色體上第33143761位,其脫氧核苷酸為A或C; [0088] SMK051位于3號染色體上第36590761位,其脫氧核苷酸為C或T; [0089] SMK052位于3號染色體上第38359136位,其脫氧核苷酸為G或A; [0090] SMK053位于3號染色體上第40096919位,其脫氧核苷酸為T或G; [0091] SMK054位于3號染色體上第45509392位,其脫氧核苷酸為A或G; [0092] SMK055位于4號染色體上第3484605位,其脫氧核苷酸為C或A;
[0093] SMK056位于4號染色體上第9826375位,其脫氧核苷酸為T或G;
[0094] SMK057位于4號染色體上第11182315位,其脫氧核苷酸為A或G; [0095] SMK058位于4號染色體上第13773098位,其脫氧核苷酸為A或G; [0096] SMK059位于4號染色體上第14152425位,其脫氧核苷酸為A或C; [0097] SMK060位于4號染色體上第14900199位,其脫氧核苷酸為A或G; [0098] SMK061位于4號染色體上第15339676位,其脫氧核苷酸為G或A; [0099] SM