本發(fā)明屬于分子標(biāo)記領(lǐng)域,具體涉及蓮霧est-ssr分子標(biāo)記。
背景技術(shù):
蓮霧[syzygiumsamarangense(blume)merri.etperry]原產(chǎn)于馬來半島及安達(dá)曼群島,是桃金娘科(myrtaceae)蒲桃屬(syzygium)的熱帶常綠果樹,別名洋蒲桃、南洋蒲桃、爪哇蒲桃、甜霧、水石榴等。蓮霧富含多種藥用成分,如黃酮類、查耳酮類、己烷等,具有止瀉、鎮(zhèn)痛、抗菌、抗高血糖、抗膽堿酯酶、抗炎、提高免疫力等功效。蓮霧果實(shí)色澤艷麗,形態(tài)獨(dú)特,清甜爽口,口感佳,富含酚類物質(zhì),是極具保健價(jià)值的水果之一,受國內(nèi)外消費(fèi)者喜愛。在馬來西亞、泰國、印度尼西亞等地均有廣泛種植,是當(dāng)?shù)毓麡I(yè)的重要組成部分,鮮果常銷往歐美國家。我國最早開始商品化種植蓮霧的地區(qū)是臺灣,近年來,隨著傳統(tǒng)熱區(qū)優(yōu)勢果樹如荔枝、龍眼、柑桔等價(jià)格的回落,蓮霧成為新興的熱帶果樹,栽培面積逐步擴(kuò)增,主產(chǎn)區(qū)為臺灣、海南、福建、廣東和廣西等地,據(jù)不完全統(tǒng)計(jì),2014年我國蓮霧種植面積6.87萬畝,產(chǎn)量13.6萬噸,每公斤售價(jià)30~50元,經(jīng)濟(jì)效益高,具發(fā)展?jié)摿Α?/p>
蓮霧有具有豐富的遺傳多樣性,但相關(guān)研究報(bào)道比較少。臺灣根據(jù)果實(shí)顏色將蓮霧分為大(深)紅種、淡紅種、粉紅種、青種和白種等五類(林正忠等,2004)。王家保等(2004)對海南的11份蓮霧資源進(jìn)行同工酶研究,結(jié)果表明11份資源根據(jù)顏色不同聚成紅色果皮、白色果皮、綠色果皮3大類,紅色果皮與白色果皮親緣關(guān)系較綠色果皮近。但何橋等(2006)對12份蓮霧資源和2個(gè)蓮霧近緣種進(jìn)行了issr分析,聚類分析結(jié)果顯示蓮霧并不以果皮顏色相同聚為一類,而以成熟期相近聚為一類,因此他指出成熟期可能在蓮霧親緣關(guān)系和分類地位中有重要作用。蓮霧自從爪哇、馬來西亞等國引入我國后,在長期的適應(yīng)性栽培下產(chǎn)生了許多地方品種及資源,這些地方品種多以果實(shí)顏色命名,如‘大紅蓮霧’、‘粉紅蓮霧’、‘青蓮霧’等,這極有可能造成同名異物和同物異名,不僅給蓮霧種質(zhì)資源收集、保存、鑒定及利用造成難度,也制約了優(yōu)良品種的選育和推廣應(yīng)用。
dna分子標(biāo)記是鑒定種質(zhì)資源遺傳多樣性的重要手段,其中微衛(wèi)星序列(即簡單重復(fù)序列simplesequencerepeat,ssr)分子標(biāo)記因其位點(diǎn)特異、高多態(tài)性、高穩(wěn)定性、重復(fù)性好、呈共顯性等優(yōu)點(diǎn)被廣泛應(yīng)用于遺傳多樣性分析、品種鑒定、遺傳圖譜建立等方面。est-ssr標(biāo)記來源于dna序列的轉(zhuǎn)錄區(qū),比基于基因組序列開發(fā)的ssr標(biāo)記種間通用性更高,也更經(jīng)濟(jì)方便,近年來被廣泛地應(yīng)用于多種植物的ssr分子標(biāo)記開發(fā)上,在刺梨、洋蔥、藍(lán)靛果忍冬、絲瓜等園藝植物上均有報(bào)道。本發(fā)明利用轉(zhuǎn)錄組測序獲得的數(shù)據(jù)進(jìn)行ssr標(biāo)記搜索,分析其分布及組成特征,進(jìn)行初步可用性評價(jià),以期為蓮霧的品種鑒定、種質(zhì)資源多樣性分析、建立核心種質(zhì)和分子標(biāo)記輔助育種奠定基礎(chǔ)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供蓮霧est-ssr分子標(biāo)記,利用蓮霧轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行ssr標(biāo)記開發(fā)能獲得較高頻率的ssr位點(diǎn),且類型豐富,為蓮霧遺傳多樣性分析和遺傳圖譜構(gòu)建提供更加豐富可靠的標(biāo)記選擇。
為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
蓮霧est-ssr分子標(biāo)記編號為wassr3、wassr12-13、wassr37-39、wassr41-42、wassr44、wassr50、wassr55、wassr60、wassr63、wassr70、wassr72、wassr74、wassr80、wassr85、wassr87-88、wassr91-92,各編號所對應(yīng)的蓮霧est-ssr分子標(biāo)記的引物序列如seqidno.1-44所示。
所述的蓮霧est-ssr分子標(biāo)記在蓮霧遺傳多樣性分析和遺傳圖譜構(gòu)建中的應(yīng)用。
本發(fā)明的具體方法是:
(1)采用ctab法提取蓮霧基因組dna;
(2)使用misa程序(http://pgrc.ikp-gatersleben.de/misa)進(jìn)行ssr位點(diǎn)搜索,以二至六核苷酸最少重復(fù)次數(shù)分別為6、5、5、5、和5次為標(biāo)準(zhǔn)進(jìn)行搜索。用primer3.0軟件對ssr重復(fù)單元前后的序列進(jìn)行引物設(shè)計(jì)及評價(jià),每條ssr產(chǎn)生3條引物。引物序列長度18~27bp,gc含量40%~60%,退火溫度57~63℃,上、下游引物的tm值相差≤2℃,預(yù)期擴(kuò)增產(chǎn)物長度100~280bp;且無二級結(jié)構(gòu)和二聚體;
(3)est-ssr引物篩選:pcr反應(yīng)體系為20ul,其中2.5mmol/ldntp4μl,5utaq酶0.3μl,100ngdna1.5μl,10μmol/l的上下游引物各1μl,10×buffer(mg2+)2.5μl,加ddh2o補(bǔ)至20μl。pcr擴(kuò)增程序?yàn)椋?5℃預(yù)變性5min;然后進(jìn)行35個(gè)循環(huán),每個(gè)循環(huán)包括94℃變性30s,56℃退火30s(退火溫度因不同引物而異),72℃延伸1min;最后72℃延伸7min。
本發(fā)明的優(yōu)點(diǎn)在于:
本發(fā)明對來自3個(gè)蓮霧品種果實(shí)的21153條unigene(4.75mb)序列進(jìn)行est-ssr搜索,得到11641個(gè)ssr位點(diǎn),出現(xiàn)頻率為55.03%,高于藍(lán)靛果忍冬(32.51%)、刺梨(20.37%)、荔枝(16.35%)、柑橘(21.74%,5.2kb)、梨(7.1%,7.2%)等木本果樹,也高于蘿卜(23.79%)、絲瓜(14.97%)、辣椒(7.84%)、歐薄荷(9.88%)等草本植物。從前人對植物的研究結(jié)果來看,大多數(shù)植物的est-ssr以二、三核苷酸重復(fù)類型為主,而主導(dǎo)重復(fù)基序因物種而異。本發(fā)明發(fā)現(xiàn)蓮霧以單核苷酸重復(fù)類型(43.44%)為主,其次是二核苷酸重復(fù)類型(30.98%)和三核苷酸重復(fù)類型(24.38%),四、五和六核苷酸重復(fù)類型雖有出現(xiàn),但所占比例很小(1.21%),這與芙蓉李、杜仲和連翹的研究結(jié)果相似,不同于荔枝、枇杷和藍(lán)靛果忍冬。蓮霧的單核苷酸重復(fù)基序中,以a/t最為豐富,這與柑橘和芙蓉李等果樹研究結(jié)果一致;二核苷酸重復(fù)基序中ag/ct最多,與已有報(bào)道的多數(shù)果樹相同,不同于荔枝(ga/tc);三核苷酸重復(fù)基序以ccg/cgg為主,與獼猴桃、柑橘和草莓等以aag/ctt為主不同,也不同于荔枝(gaa/ttc)和梨(acc/ggt)。
本發(fā)明隨機(jī)從25734對引物種中選擇14~25bp的ssr引物100對進(jìn)行合成,其中67對引物能擴(kuò)增出理想pcr產(chǎn)物,有效擴(kuò)增率為67.00%。其中,30對引物中22對ssr引物呈現(xiàn)多態(tài)性,占有效引物的73.33%。這個(gè)比率高于刺梨(52.17%)、芙蓉李(42.5%)、藍(lán)靛果忍冬(62.5%)、荔枝(66.67%)等多種果樹。這說明蓮霧est序列中的ssr位點(diǎn)較多,引物擴(kuò)增效率較高,且其多態(tài)性也相對較高。22對多態(tài)性差異引物對30份蓮霧材料進(jìn)行upgma聚類,被分為2大類,以遺傳距離0.68為閾值,第1類可分為4小類,以果皮顏色或來源地相近聚為一類,第2類可分為2小類,以果皮顏色不同來區(qū)分,比較準(zhǔn)確的反映了30份蓮霧材料之間的差異。本發(fā)明利用蓮霧轉(zhuǎn)錄組數(shù)據(jù)開發(fā)出的ssr標(biāo)記可用性較高,為蓮霧種質(zhì)資源遺傳多樣性研究、遺傳圖譜構(gòu)建、基因定位及克隆及分子標(biāo)記輔助育種等奠定了基礎(chǔ)。
附圖說明
圖1引物63在30個(gè)蓮霧材料中的多態(tài)性。品種編號名稱見表1。
圖2供試蓮霧材料的upgma聚類圖,品種編號名稱見表1。
具體實(shí)施方式
1材料與方法
1.1轉(zhuǎn)錄組數(shù)據(jù)來源
蓮霧轉(zhuǎn)錄組數(shù)據(jù)來源于本課題組2016年對果實(shí)進(jìn)行illumina高通量深度測序的結(jié)果。測序時(shí)采集‘紫紅’、‘黑珍珠’、‘青鉆’3個(gè)蓮霧品種果實(shí),每個(gè)品種均取來自3個(gè)不同單株的蓮霧果實(shí)各20個(gè),液氮速凍,-80℃保存。測序時(shí),每個(gè)單株構(gòu)建1個(gè)文庫。測序委托北京百邁客生物科技有限公司采用illuminahiseqtm2500pe125系統(tǒng)進(jìn)行rna-seq轉(zhuǎn)錄組測序(無參),采用trinity進(jìn)行序列組裝,經(jīng)過濾獲得7.80g的有效數(shù)據(jù)。
1.2材料及其dna提取
用于ssr引物篩選和可用性評價(jià)的材料為福建省農(nóng)業(yè)科學(xué)院果樹研究所蓮霧種質(zhì)資源圃的30份種質(zhì)資源(表1)?;蚪Mdna提取采用ctab法進(jìn)行。
表1蓮霧ssr多態(tài)性分析材料
1.3轉(zhuǎn)錄組ssr位點(diǎn)鑒別及ssr引物設(shè)計(jì)
使用misa程序(http://pgrc.ikp-gatersleben.de/misa)進(jìn)行ssr位點(diǎn)搜索,以二至六核苷酸最少重復(fù)次數(shù)分別為6、5、5、5、和5次為標(biāo)準(zhǔn)進(jìn)行搜索。用primer3.0軟件對ssr重復(fù)單元前后的序列進(jìn)行引物設(shè)計(jì)及評價(jià),每條ssr產(chǎn)生3條引物。引物序列長度18~27bp,gc含量40%~60%,退火溫度57~63℃,上、下游引物的tm值相差≤2℃,預(yù)期擴(kuò)增產(chǎn)物長度100~280bp;且無二級結(jié)構(gòu)和二聚體。
1.4est-ssr引物篩選
pcr反應(yīng)體系為20ul,其中2.5mmol/ldntp4μl,5utaq酶0.3μl,100ngdna1.5μl,10μmol/l的上下游引物各1μl,10×buffer(mg2+)2.5μl,加ddh2o補(bǔ)至20μl。pcr擴(kuò)增程序?yàn)椋?5℃預(yù)變性5min;然后進(jìn)行35個(gè)循環(huán),每個(gè)循環(huán)包括94℃變性30s,56℃退火30s(退火溫度因不同引物而異),72℃延伸1min;最后72℃延伸7min。pcr擴(kuò)增產(chǎn)物用2%瓊脂糖檢測,6%變性聚丙烯酰胺凝膠檢測,160v電壓,3h,銀染顯色后觀察拍照。
1.5數(shù)據(jù)統(tǒng)計(jì)
ssr發(fā)生頻率為ssr的unigene數(shù)量與總unigene數(shù)量之比,ssr的出現(xiàn)頻率為ssr的個(gè)數(shù)與總unigene的數(shù)量比,ssr平均分布距離為1kb以上的unigene的堿基數(shù)與ssr數(shù)量之比。采用人工讀帶的方法,將電泳圖上可重復(fù)的清晰條帶記為“1”,同一位置無帶或不易分辨的弱帶記為“0”,建立原始數(shù)據(jù)矩陣。利用軟件ntsys2.10按系統(tǒng)聚類進(jìn)行聚類繪圖。
2結(jié)果與分析
2.1轉(zhuǎn)錄組中ssr的分布及結(jié)構(gòu)特點(diǎn)
蓮霧轉(zhuǎn)錄組經(jīng)組裝后共獲得87538條unigene(序列總長約75156717bp),用misa軟件對1kb以上的unigene(21153條,序列全長為47491726bp)進(jìn)行搜索,發(fā)現(xiàn)其中8115條unigene序列中含有11641個(gè)ssr位點(diǎn),其中2773條unigene含有兩個(gè)或兩個(gè)以上的est-ssr位點(diǎn)。ssr發(fā)生頻率為38.36%,出現(xiàn)頻率為55.03%,平均4.08kb出現(xiàn)1個(gè)ssr,其中復(fù)合ssr有1432個(gè),占12.3%。ssr重復(fù)類型6種均有,即單核苷酸至六核苷酸重復(fù)。其中單核苷酸、二核苷酸和三核苷酸重復(fù)出現(xiàn)頻率占優(yōu)勢,分別占總ssr的43.44%、30.98%和24.38%;四核苷酸、五核苷酸和六核苷酸重復(fù)類型數(shù)量較少,分別占總數(shù)的0.92%、0.14%和0.15%(表2)。
蓮霧轉(zhuǎn)錄組ssr重復(fù)單元的重復(fù)次數(shù)分布在5~23次之間,其中5~10次的ssr共有8753個(gè),占總數(shù)的75.19%;其次為11~20次的ssr,共有2880個(gè),占總數(shù)的24.74%;20次重復(fù)以上的僅有8個(gè),僅占0.07%。蓮霧轉(zhuǎn)錄組ssr的長度主要集中在10~256bp,其中長度小于12bp的ssr有2873個(gè)(24.68%),長度在12~20bp的ssr達(dá)7094個(gè),占總數(shù)的60.94%,長度在20bp以上的ssr有920個(gè),只占7.90%。
表2蓮霧ssr的類型、數(shù)量及分布頻率
2.2轉(zhuǎn)錄組中ssr基序重復(fù)類型和頻率特征
蓮霧轉(zhuǎn)錄組中11641個(gè)ssr位點(diǎn)共含72種重復(fù)基序,單核苷酸至六核苷酸重復(fù)分別有2、4、10、24、15和17種。從分布頻率來看(表3),以單核苷酸重復(fù)類型a/t出現(xiàn)最多,占總ssr的40.15%,占單核苷酸重復(fù)基序的總數(shù)的92.43%。其次是二核苷酸重復(fù)類型ag/ct,占總ssr的26.99%,占二核苷酸總數(shù)的87.13%。此外,三核苷酸重復(fù)基序中以ccg/cgg、agg/cct和aag/ctt占優(yōu)勢,分別占三核苷酸總數(shù)的33.62%、20.05%和16.98%;四核苷酸、五核苷酸和六核苷酸重復(fù)基序分布較為分散,出現(xiàn)的頻率較低。
表3蓮霧轉(zhuǎn)錄中不同微衛(wèi)星重復(fù)基序(motif)出現(xiàn)的頻率
2.3蓮霧轉(zhuǎn)錄組ssr引物設(shè)計(jì)與篩選
利用primer3.0對含ssr位點(diǎn)的8115條unigene序列進(jìn)行引物設(shè)計(jì),共設(shè)計(jì)出引物25734對。隨機(jī)挑選100對不同重復(fù)單元(二、三、四、五、六核苷酸)的引物對蓮霧‘粉紅種’dna進(jìn)行ssr-pcr擴(kuò)增以驗(yàn)證其有效性。結(jié)果表明76對引物實(shí)現(xiàn)有效擴(kuò)增,占100對ssr引物的76%。在76對有效擴(kuò)增引物中,67對(88.12%)pcr擴(kuò)增產(chǎn)物與預(yù)期大小相符,有9對(13.43%)擴(kuò)增產(chǎn)物長度超過預(yù)期。
2.4多態(tài)性分析
選取30份蓮霧,利用30對有效的est-ssr引物進(jìn)行擴(kuò)增及多態(tài)性評價(jià)。其中22對引物存在多態(tài)性差異(表4),占有效擴(kuò)增引物的73.33%。每對引物產(chǎn)生的多態(tài)性片段數(shù)在2~6之間,23對引物共得到63條條帶,其中多態(tài)性片段52個(gè),每對引物平均產(chǎn)生2.36個(gè)多態(tài)性片段,圖1為引物63的擴(kuò)增情況。
表422對蓮霧ssr引物信息
利用22對多態(tài)性ssr引物對30份蓮霧材料進(jìn)行聚類分析,在遺傳距離0.60處,供試材料被分成2大類(圖2)。第1類包含26份材料,以遺傳距離0.68為閾值,該類被分為4小類,其中以‘印尼大葉’、‘黑鉆石’和‘紫紅’為代表的紅色果皮蓮霧聚為一類,以‘翡翠’、‘泰國青種’和‘pethjinda’為代表的綠色果皮蓮霧聚在一起,‘龍文實(shí)生’和‘印度紅’歸為一類,來源于同一果園的‘長泰青種’、‘青鉆’和‘長泰粉紅種’聚為一類。第2類包含4份材料,其中紅色果皮蓮霧(‘紅寶石’、‘香水’、‘農(nóng)科4號’)歸為一類,‘白蓮霧’果皮為白色,自成一類。
以上所述僅為本發(fā)明的較佳實(shí)施例,凡依本發(fā)明申請專利范圍所做的均等變化與修飾,皆應(yīng)屬本發(fā)明的涵蓋范圍。
sequencelisting
<110>福建省農(nóng)業(yè)科學(xué)院果樹研究所
<120>蓮霧est-ssr分子標(biāo)記
<130>44
<160>44
<170>patentinversion3.3
<210>1
<211>20
<212>dna
<213>人工序列
<400>1
tgtttcaactcgcacgactc20
<210>2
<211>20
<212>dna
<213>人工序列
<400>2
aaacggttttcattgatggc20
<210>3
<211>20
<212>dna
<213>人工序列
<400>3
gtgtcatcgaaaccctccaa20
<210>4
<211>20
<212>dna
<213>人工序列
<400>4
ttgaatcttgcaagcgactg20
<210>5
<211>20
<212>dna
<213>人工序列
<400>5
gtcatgcttgctctgtccaa20
<210>6
<211>20
<212>dna
<213>人工序列
<400>6
ttctggattgcaggaacctt20
<210>7
<211>20
<212>dna
<213>人工序列
<400>7
gatggctggtgactcaggtt20
<210>8
<211>20
<212>dna
<213>人工序列
<400>8
gaccctttccttgagtggaa20
<210>9
<211>23
<212>dna
<213>人工序列
<400>9
ggaaaaggagagaattttcttga23
<210>10
<211>20
<212>dna
<213>人工序列
<400>10
ttttcccccatgagagtgag20
<210>11
<211>20
<212>dna
<213>人工序列
<400>11
gggttttcagccaaaaattg20
<210>12
<211>20
<212>dna
<213>人工序列
<400>12
cgagcgagagagagagatgg20
<210>13
<211>20
<212>dna
<213>人工序列
<400>13
gagcttgtttatcgaaggcg20
<210>14
<211>20
<212>dna
<213>人工序列
<400>14
aaactggcgacaaaaacgag20
<210>15
<211>20
<212>dna
<213>人工序列
<400>15
gtcgcgtcaccattatttca20
<210>16
<211>20
<212>dna
<213>人工序列
<400>16
ggtttagttaagggcggctc20
<210>17
<211>20
<212>dna
<213>人工序列
<400>17
gaggagtcgctgaactgtcc20
<210>18
<211>20
<212>dna
<213>人工序列
<400>18
cgcacccactgttttaggat20
<210>19
<211>20
<212>dna
<213>人工序列
<400>19
aagccgaagatgaagacgaa20
<210>20
<211>20
<212>dna
<213>人工序列
<400>20
ggacatatatccgcggtttg20
<210>21
<211>20
<212>dna
<213>人工序列
<400>21
atatgaatcccgggccttac20
<210>22
<211>20
<212>dna
<213>人工序列
<400>22
ctcccgtctctccacaacat20
<210>23
<211>20
<212>dna
<213>人工序列
<400>23
tggtgtctgtaactgctgcc20
<210>24
<211>20
<212>dna
<213>人工序列
<400>24
agttcttggggaggaatcgt20
<210>25
<211>20
<212>dna
<213>人工序列
<400>25
ttggtaaatcggcatcttcc20
<210>26
<211>20
<212>dna
<213>人工序列
<400>26
accgaaaagggacaaggagt20
<210>27
<211>20
<212>dna
<213>人工序列
<400>27
ggctcacttgtgcaacaaaa20
<210>28
<211>20
<212>dna
<213>人工序列
<400>28
cgactgtccacattggtgtc20
<210>29
<211>20
<212>dna
<213>人工序列
<400>29
accttttcatgcaaattccg20
<210>30
<211>20
<212>dna
<213>人工序列
<400>30
aggatcatgcattcggtttc20
<210>31
<211>20
<212>dna
<213>人工序列
<400>31
gggtttgggtttgagttgtg20
<210>32
<211>20
<212>dna
<213>人工序列
<400>32
aaaagcaaacggggctactt20
<210>33
<211>20
<212>dna
<213>人工序列
<400>33
gtcgagaggaaggagtggaa20
<210>34
<211>20
<212>dna
<213>人工序列
<400>34
tcgttataatcgtccggctt20
<210>35
<211>20
<212>dna
<213>人工序列
<400>35
ctccaccacaaccacaacag20
<210>36
<211>20
<212>dna
<213>人工序列
<400>36
ggttcacgttctctcgaagc20
<210>37
<211>20
<212>dna
<213>人工序列
<400>37
gcttttaaggaaccgggaac20
<210>38
<211>20
<212>dna
<213>人工序列
<400>38
agattcccactgaatgtccg20
<210>39
<211>22
<212>dna
<213>人工序列
<400>39
tttctgagatttgacgaggaaa22
<210>40
<211>20
<212>dna
<213>人工序列
<400>40
actgcttgcaccgttgaact20
<210>41
<211>20
<212>dna
<213>人工序列
<400>41
tgagaaacccacaaagtccc20
<210>42
<211>20
<212>dna
<213>人工序列
<400>42
gcgtcaaatcccaatcactt20
<210>43
<211>20
<212>dna
<213>人工序列
<400>43
tctagatctttgagcgggga20
<210>44
<211>20
<212>dna
<213>人工序列
<400>44
aatgccgtcaatttctcacc20