專利名稱:一種水稻基因組基因標識的新方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物學(xué)的基因組基因標識方法,特別涉及一種水稻基因組基因標識的新方法。
背景技術(shù):
在科學(xué)層面,國際上陸續(xù)發(fā)明了第一代、第二代、第三代分子標記。這些標記用于DNA指紋制作,定位基因,分子標記輔助選擇,鑒定真假雜種,甚至有的還用于標記某些特定基因。在一些生物保護中,還有用一些標識物(如大熊貓糞便)標識動物存在,預(yù)測種群數(shù)量等。在醫(yī)學(xué)領(lǐng)域,有的用標識物(如腸粘膜脫落細胞)標識直腸癌病程特征。在一些癌癥預(yù)后中,還有標識數(shù)·個基因的報道。在技術(shù)層面,小衛(wèi)星DNA指紋、微衛(wèi)星標記、SNP單倍型、基因序列等,都有相關(guān)技術(shù)開發(fā),用以標識品種專利、品種保護權(quán)的先例。對作物品種,通過品種審定、品種保護、專利保護等一系列措施,在一定程度上保護了品種所有權(quán)人的發(fā)明權(quán)和使用權(quán)。但是,以上技術(shù)具有如下問題及不足:(I)專屬技術(shù)界定不足在水稻、玉米、小麥、大豆、棉花等主要作物中,某些核心親本作為公共親本配租,決定了品種特異性、一致性、穩(wěn)定性等方面的“實質(zhì)等同”(沒有根本的區(qū)別或足夠大的區(qū)別)。以水稻品種“豐兩優(yōu)I號”(廣占63/93-11)和“揚兩優(yōu)6號”(廣占63/揚稻6號)兩個品種(組合)沒有很大的差別。因為揚稻6號和9311本來就是一個基本品種的兩個名稱。在玉米品種指紋繪制中,一般也只是幾個微衛(wèi)星標記的標記,在核心親本被用來作為主要配租親本的現(xiàn)有育種體系中,難免以更換名稱、尋找變異系等方式提交品種權(quán)申請,生產(chǎn)姊妹系等方式投入生產(chǎn),專屬技術(shù)界定不足。(2)缺乏足夠的“質(zhì)”、“量”界定以幾個微衛(wèi)星標記指紋圖譜,一個或幾個基因界定品種,無論在“質(zhì)”或“量”上都顯不足。微衛(wèi)星只是基因組中重復(fù)序列的一種,2-6個堿基的重復(fù)一般不能說明重要性狀的實質(zhì)。而一個或少數(shù)幾個基因的界定也同樣不能界定一個品種的本質(zhì)特征。一般而言,品種屬性應(yīng)是更多性狀屬性的總和。以產(chǎn)量、株高、生育期、品質(zhì)等農(nóng)藝性為例,多是由數(shù)量性狀位點(QTL)決定的復(fù)雜性狀,一般不能簡單的由一個基因或少數(shù)幾個基因決定。(3)缺乏“系譜學(xué)”依據(jù)品種多是由系譜決定的特殊基因型或生態(tài)型。以水稻雜交組合“汕優(yōu)63”(珍汕97A/明恢63)為例,父本“明恢63”的親本組合為“IR30/圭630”。汕優(yōu)63是我國推廣面積最大的雜交組合。由明恢63為親本,選育出131個恢復(fù)系,審定249個雜交組合。其中,恢復(fù)系198的系譜是DT713/明恢63,仍然保持了明恢63理想株形、分蘗力強、群體繁茂的特點。現(xiàn)有的標記體系難以體現(xiàn)系譜特征和品種緣源
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題:通過全基因組測序、特定單倍型鑒定、目標基因跟蹤,增加技術(shù)鑒定的性質(zhì)和成分。以幾個微衛(wèi)星標記指紋圖譜,一個或幾個基因界定品種,無論在“質(zhì)”或“量”上都顯不足。微衛(wèi)星只是基因組中重復(fù)序列的一種,2-6個堿基的重復(fù)一般不能說明重要性狀的實質(zhì)。而一個或少數(shù)幾個基因的界定也同樣不能界定一個品種的本質(zhì)特征。一般而言,品種屬性應(yīng)是更多性狀屬性的總和。以產(chǎn)量、株高、生育期、品質(zhì)等農(nóng)藝性為例,多是由數(shù)量性狀位點(QTL)決定的復(fù)雜性狀,一般不能簡單的由一個基因或少數(shù)幾個基因決定。I)增加標記數(shù)量---由現(xiàn)有技術(shù)體系的一個或少數(shù)幾個標記改為全基因組SNP標記。2)建立基因標識體系一由“分子標記”改為“基因標識”。分子標記定義:有A則有B,則B為A的分子標記?;驑俗R定義:與品種特異性、穩(wěn)定性、一致性有關(guān)的形態(tài)特征、酶學(xué)變化、分子標記、多態(tài)基因、特有基因、品種單倍型、品種基因型、品種基因構(gòu)型的總稱。由分子標記改為基因標識后,更直接,更本質(zhì)。(2)缺乏足夠的“質(zhì)”、“量”界定以幾個微衛(wèi)星標記指紋圖譜,一個或幾個基因界定品種,無論在“質(zhì)”或“量”上都顯不足。微衛(wèi)星只是基因組中重復(fù)序列的一種,2-6個堿基的重復(fù)一般不能說明重要性狀的實質(zhì)。而一個或少數(shù)幾個 基因的界定也同樣不能界定一個品種的本質(zhì)特征。一般而言,品種屬性應(yīng)是更多性狀屬性的總和。以產(chǎn)量、株高、生育期、品質(zhì)等農(nóng)藝性為例,多是由數(shù)量性狀位點(QTL)決定的復(fù)雜性狀,一般不能簡單的由一個基因或少數(shù)幾個基因決定。品種標識需要從“質(zhì)”和“量”兩個方面界定。I) “質(zhì)”的界定品種的“質(zhì)”主要表現(xiàn)為,該品種與其他品種顯著不同(特異性)。比如,產(chǎn)量、品質(zhì)、抗性、適應(yīng)性(如生育期、抽穗期、灌漿期、收獲期等),至少,全基因組標識中包括一個重要基因標識(如上描述)。2) “量”的界定品種在“量”的表現(xiàn)為,基因組有顯著的差別。比如,該品種基因組(個體基因組)與其他品種基因組有I%的差別。要解決的技術(shù)問題:在“質(zhì)”和“量”兩個向度做出標識。(3)缺乏“系譜學(xué)”依據(jù)品種多是由系譜決定的特殊基因型或生態(tài)型。以水稻雜交組合“汕優(yōu)63”(珍汕97A/明恢63)為例,父本“明恢63”的親本組合為“IR30/圭630”。汕優(yōu)63是我國推廣面積最大的雜交組合。由明恢63為親本,選育出131個恢復(fù)系,審定249個雜交組合。其中,恢復(fù)系198的系譜是DT713/明恢63,仍然保持了明恢63理想株形、分蘗力強、群體繁茂的特點。現(xiàn)有的標記體系難以體現(xiàn)系譜特征和品種緣源。要解決的技術(shù)問題:一個品種系譜學(xué)依據(jù),主要從以下兩個方面獲取:I)全基因組結(jié)構(gòu)與基因組成從全基因組結(jié)構(gòu)看,能反映品種遺傳結(jié)構(gòu)結(jié)構(gòu)的輪廓(profile)。
2)主要農(nóng)藝性狀基因從主要農(nóng)藝性狀基因看,可以了解基因組成、基因來源和基因交換(如秈粳雜交基因組印記)。根據(jù)“進化非同步理論”,全基因組進化和重要農(nóng)藝性狀基因進化可能存在非同步現(xiàn)象。這為我們解決“全基因組基因標識”提供了理論依據(jù)和技術(shù)依據(jù)。技術(shù)方案:(1)基因組測序與數(shù)據(jù)分析測序采用重測序原理,基因組DNA切割成500bp片段,同時進行兩端測序,讀取雙末端各90bp片段序列。所得序列與參考基因組序列(日本晴基因組序列)進行比對。分析方法如下:I)比對所有測序所得的短序列通過SOAPaligner和參考序列進行比對,在比對時,所有reads都經(jīng)過了如下的處理:如果一個原始的read無法比對上參考序列,其第一個和最后兩個堿基將會被去除,之后再和參考序列進行比對。如果仍然無法匹配,則再去掉最后兩個堿基再比對,迭代進行,直到能夠匹配或reads短于某一固定長度(一般27bp)為止。根據(jù)比對結(jié)果,計算出平均深度和覆蓋度。2) 一致序列組裝和SNP檢測根據(jù)比對結(jié)果,綜合考慮數(shù)據(jù)特征、測序質(zhì)量及實驗方面的影響因素,利用貝葉斯模型,在實際觀察到的數(shù)據(jù)基礎(chǔ)上計算出每個可能的基因型概率。挑選出概率最大的基因型作為該測序個體的特定位點的基因型,并在此基礎(chǔ)上給出一個反映該基因型準確的質(zhì)量值,并且得到一致序列。在一致序列的基礎(chǔ)上,對于參考序列存在著多態(tài)性的位點進行篩選和過濾,例如要求質(zhì)量值Q:Q = -1Olge (e為堿基測序錯位率)大于20,最少2個(這個數(shù)受到測序深度的影響,不同測序深度可能有所不同)reads支持等。并且符合以下三個條件:Q20質(zhì)量截止(質(zhì)量值Q20以下的SNPs過濾掉),Copy number數(shù)小于2 (指覆蓋該位點reads唯一'丨生的平均數(shù)),SNP位點彼此至少相隔5bp。3) Short InDel 檢測在Short InDel檢測中,比對reads必須滿足paired_end要求,并且僅在一個末端包含比對上的gap ο容許1-1Obp Indels的paired-end比對。在Indels檢測過程中,需整合候選的Indels。Gaps至少需要3對非冗余的paired-end reads支持。覆蓋候選Indel的un-gap reads數(shù)低于2才能進行Indel檢測。4) SV (結(jié)構(gòu)變異)檢測根據(jù)雙末端的測序原理,正常情況下,paired-end的兩個reads, —個可以比對上正鏈(forward),另一個比對上負鏈(reverse),兩個reads比對后的距離應(yīng)該與插入片段大小一致。即成對的兩條reads比對到基因組時應(yīng)該有正常的方向和合適的跨度。如果在比對結(jié)果中,成對的兩條reads的方向或跨度與預(yù)期不一致,則該區(qū)域有可能發(fā)生結(jié)構(gòu)變異。通過將異常的paired-end比對結(jié)果進行聚類分析,并與預(yù)先定義的結(jié)構(gòu)性變異類型進行比較??梢該?jù)此進行結(jié)構(gòu)變異檢測,一般至少要有3對異常的paired-end支持。當兩對paired-end能正常讀取時,由于測試品種中間paired-end缺失,根據(jù)該區(qū)域參考基因組序列和待測基因組序列的比較結(jié)果,可以確定該區(qū)域插入或缺失。
(2)品種特異基因標識I)染色體倒位標識檢測到染色體倒位后,確定倒位兩側(cè)位置、兩側(cè)Reads及其序列、兩側(cè)轉(zhuǎn)座子,然后繪制染色體倒位圖譜。染色體倒位區(qū)內(nèi)基因(倒位圈)及兩側(cè)基因(倒位圈附近)進行列表。如果涉及到插入或缺失,則同時對插入、缺失“事件”列表,分析其基因效應(yīng)。進而,繪制染色體倒位基因效應(yīng)圖。2)品種特異基因標識品種特異性是由品種特異基因、特定基因組合或特定表達程式?jīng)Q定的。對特異性基因,通過測序、相關(guān)預(yù)測或相關(guān)技術(shù)處理,做出品種特異基因(或特異基因表達)圖譜。本技術(shù)有益效果:本技術(shù)的工作原理是:基于分子育種,發(fā)展設(shè)計育種,發(fā)展新一代品種?,F(xiàn)代育種者多采用分子育種方法。約有半數(shù)的育種家在發(fā)展“設(shè)計育種計劃”,未來的育種更多地依賴核心種質(zhì)、骨干親本和正推廣品種。因而,本技術(shù)具有持續(xù)降低成本、提高育種效能、發(fā)展系列品種的有益效果。
圖1是水稻品種全基因組標識原理與組成。圖2是具體實施方式
。圖3是染色體倒位圖。
具體實施例方式(I)基因組測序與數(shù)據(jù)分析測序采用重測序原理,基因組DNA切割成500bp片段,同時進行兩端測序,讀取雙末端各90bp片段序列。所得序列與參考基因組序列(日本晴基因組序列)進行比對。分析方法如下:I)比對所有測序所得的短序列通過SOAPaligner和參考序列進行比對,在比對時,所有reads都經(jīng)過了如下的處理:如果一個原始的read無法比對上參考序列,其第一個和最后兩個堿基將會被去除,之后再和參考序列進行比對。如果仍然無法匹配,則再去掉最后兩個堿基再比對,迭代進行,直到能夠匹配或reads短于某一固定長度(一般27bp)為止。根據(jù)比對結(jié)果,計算出平均深度和覆蓋度。2) —致序列組裝和SNP檢測根據(jù)比對結(jié)果,綜合考慮數(shù)據(jù)特征、測序質(zhì)量及實驗方面的影響因素,利用貝葉斯模型,在實際觀察到的數(shù)據(jù)基礎(chǔ)上計算出每個可能的基因型概率。挑選出概率最大的基因型作為該測序個體的特定位點的基因型,并在此基礎(chǔ)上給出一個反映該基因型準確的質(zhì)量值,并且得到一致序列。在一致序列的基礎(chǔ)上,對于參考序列存在著多態(tài)性的位點進行篩選和過濾,例如要求質(zhì)量值Q:Q = -1Olge (e為堿基測序錯位率)大于20,最少2個(這個數(shù)受到測序深度的影響,不同測序深度可能有所不同)reads支持等。并且符合以下三個條件:Q20質(zhì)量截止(質(zhì)量值Q20以下的SNPs過濾掉),Copy number數(shù)小于2 (指覆蓋該位點reads唯一'丨生的平均數(shù)),SNP位點彼此至少相隔5bp。3) Short InDel 檢測在Short InDel檢測中,比對reads必須滿足paired-end要求,并且僅在一個末端包含比對上的gap ο容許1-1Obp Indels的paired-end比對。在Indels檢測過程中,需整合候選的Indels。Gaps至少需要3對非冗余的paired-end reads支持。覆蓋候選Indel的un-gap reads數(shù)低于2才能進行Indel檢測。4) SV (結(jié)構(gòu)變異)檢測根據(jù)雙末端的測序原理,正常情況下,paired-end的兩個reads, —個可以比對上正鏈(forward),另一個比對上負鏈(reverse),兩個reads比對后的距離應(yīng)該與插入片段大小一致。即成對的兩條reads比對到基因組時應(yīng)該有正常的方向和合適的跨度。如果在比對結(jié)果中,成對的兩條reads的方向或跨度與預(yù)期不一致,則該區(qū)域有可能發(fā)生結(jié)構(gòu)變異。通過將異常的paired-end比對結(jié)果進行聚類分析,并與預(yù)先定義的結(jié)構(gòu)性變異類型進行比較??梢該?jù)此進行結(jié)構(gòu)變異檢測,一般至少要有3對異常的paired-end支持。當兩對paired-end能正常讀取時,由于測試品種中間paired-end缺失,根據(jù)該區(qū)域參考基因組序列和待測基因組序列的比較結(jié)果,可以確定該區(qū)域插入或缺失。(2)品種特異基因標識I)染色體倒位標識檢測到染色體倒位后,確定倒位兩側(cè)位置、兩側(cè)Reads及其序列、兩側(cè)轉(zhuǎn)座子,然后繪制染色體倒位圖譜。染色體倒位區(qū)內(nèi)基因(倒位圈)及兩側(cè)基因(倒位圈附近)進行列表。如果涉及到插入或缺失,則同時對插入、缺失“事件”列表,分析其基因效應(yīng)。進而,繪制染色體倒位基因效應(yīng)圖。2)品種特異基因標識品種特異性是由品種特異基因、特定基因組合或特定表達程式?jīng)Q定的。對特異性基因,通過測序、相關(guān)預(yù)測或相關(guān)技術(shù)處理,做出品種特異基因(或特異基因表達)圖譜。
具體實施方式
參見附圖2.
基因組標識(I)分為基因組測序與數(shù)據(jù)分析(2)和品種特異性標識(3)。基因組測序采用重測序方法(見本專利重測序原理)。測序按5X測序(測得2G有效數(shù)據(jù)量)。測序完成后,進行SNP分析(4)、Indel分析(5)、SV分析(6)。方法見本專利“基因組測序與分析”方法。品種特異性標識分染色體倒位標識(7)和品種特異性標識(8)。全部標識的具體信息、特征為品種特異性(9)。測序獲得序列通過SOAPal igner軟件比對。染色體倒位圖仿附圖3繪制。參考資料:lXuehui Huang, Xinghua Wei, Tao Sang, Qiang Zhao, Qi Feng, Yan Zhao,Canyang Li Chuanrang Zhu,Tingting LuiZhiwu ZhangiMeng Li Danlin FaniYunli Guo,Ahong Wang, Lu Wang, Liuwei Deng, Wenjun Li,Yiqi Lu,Qi junWeng, Kunyan Liu, TaoHuang, Taoying Zho u, Yufeng Jing, Wei Li, ZhangLin, Edward S Buckler, Qian Qian,Q1-Fa Zhang,Jiayang Li&,Bin Han,Genome-wide association studies of 14 agronomictraits in rice landraces.Nature Genetics.2010,1038:695-702王鳳格.中國玉米新品種標準DNA指紋庫構(gòu)建研究的幾點思考.植物學(xué)通報,2005,22(1):121-1283生物品種基因組DNA指紋圖譜:中國CNOl131595.4號專利;4水稻稻瘟菌DNA指紋圖 譜帶型編碼程式分類分析方法:中國CN200510040237.3 號專利
權(quán)利要求
1.一種水稻基因組基因標識的新方法,其特征在于:方法和步驟:(1)基因組測序與數(shù)據(jù)分析;1)比對,2)一致序列組裝和SNP檢測,3)Short InDel 檢測,4)SV (結(jié)構(gòu)變異)檢測。(2) 品種特異基因標識。1)染色體倒位標識,2)品種特異基因標識。
全文摘要
一種水稻基因組基因標識的新方法1基因組測序與數(shù)據(jù)分析。2品種特異基因標識。提供全基因組標識,代表品種全基因組特異性。提供基因標識,揭示品種基因結(jié)構(gòu)、基因功能。揭示品種來源、昭示新一代品種基因特征?;诜肿佑N,發(fā)展設(shè)計育種,發(fā)展新一代品種?,F(xiàn)代育種往往采用常規(guī)育種與分子育種方法相結(jié)合。約有半數(shù)的育種家在發(fā)展“設(shè)計育種計劃”,未來的育種更多地依賴核心種質(zhì)、骨干親本和推廣品種。本技術(shù)具有持續(xù)降低成本、提高育種效能、發(fā)展系列品種的有益效果。
文檔編號C12Q1/68GK103184275SQ20111044964
公開日2013年7月3日 申請日期2011年12月29日 優(yōu)先權(quán)日2011年12月29日
發(fā)明者王松文, 張欣, 施利利, 丁得亮, 崔晶, 亓娜, 王慶慶 申請人:天津農(nóng)學(xué)院