欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種Y單倍群檢測方法與流程

文檔序號:11234341閱讀:1650來源:國知局
一種Y單倍群檢測方法與流程
本發(fā)明涉及基因測繪技術(shù),更具體地說,涉及一種y單倍群檢測方法。
背景技術(shù)
:人的基因組由22對常染色體和xy兩條性染色體組成,其中22對常染色體在男性和女性中都有兩條;而性染色體,女性有兩個x染色體,男性則有一條x染色體和一條y染色體。所以,y染色體在人類遺傳中,僅能由男性個體從其父親遺傳得到,而且該染色體不會發(fā)生同源重組的現(xiàn)象,因此可以用其上的snp(單核苷酸多態(tài)性singlenucleotidepolymorphism)標(biāo)記,利用分子生物學(xué)的方法,來反演推算父系祖源,并形成一個有根的y染色體單倍群樹。這個y染色體單倍群樹,將現(xiàn)代人類分為18個大類型,用a到r的十八個字母作為索引。樹上的父節(jié)點對應(yīng)的snp是所有子節(jié)點共有的。這個樹表征了人類從最早的根結(jié)點,在遷徙繁衍過程中的不斷在y染色體上累積突變的過程。目前,有isogg、yfull等機(jī)構(gòu)收錄并升級各個研究的y單倍群樹結(jié)構(gòu)的結(jié)果,包括樹上的分支結(jié)構(gòu),以及各個節(jié)點對應(yīng)的單倍群名字和所包含的snp位點?,F(xiàn)有的y單倍體檢測算法大多是科學(xué)研究工具,如amy-tree算法,使用的方法適用于二代測序結(jié)果,在其算法中會挑選y單倍群樹中,對研究深入的單倍群會有傾向性輸出,而且少量在單倍群樹的葉子節(jié)點的假陽性測序結(jié)果,會很容被輸出為計算結(jié)果,導(dǎo)致計算錯誤。yhap則是利用群體的低深度測序結(jié)果進(jìn)行預(yù)測,不適用直接得到基因型的snp分型數(shù)據(jù)。因此,上述檢測算法存在不能同時適用二代測序結(jié)果和高通量microarray(芯片數(shù)據(jù))的snp分型結(jié)果,使得檢測算法適用性不夠高,且容易出錯的問題。技術(shù)實現(xiàn)要素:本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述檢測算法存在不能同時適用二代測序結(jié)果和高通量microarray的snp分型結(jié)果,使得檢測算法適用性不夠高,且容易出錯的的缺陷,提供一種y單倍群檢測方法。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:構(gòu)造一種y單倍群檢測方法,所述方法包括以下步驟:獲取用于參照的y單倍群樹的參照y單倍群樹信息,其中,所述參照y單倍群樹信息包括所述y單倍群樹中每個參照單倍群的參照單倍群信息,所述參照單倍群信息包括參照單倍群坐標(biāo)信息;將所述每個參照單倍群的參照單倍群信息與每個測試snp的測試snp信息進(jìn)行匹配,得到至少一個滿足預(yù)設(shè)條件的目標(biāo)參照單倍群;根據(jù)所述目標(biāo)參照單倍群的參照單倍群坐標(biāo)信息,獲取與所述目標(biāo)參照單倍群相關(guān)的第一數(shù)值與第二數(shù)值,其中,所述第一數(shù)值為從所述目標(biāo)參照單倍群到與所述目標(biāo)參照單倍群對應(yīng)的根節(jié)點單倍群之間路徑上的其他目標(biāo)參照單倍群數(shù)量,所述第二數(shù)值為所述其他目標(biāo)參照單倍群數(shù)量與在所述路徑上總的有效單倍群數(shù)量的比值;根據(jù)所述第一數(shù)值與第二數(shù)值對每個所述目標(biāo)參照單倍群進(jìn)行評分,輸出評分最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果信息。實施本發(fā)明的y單倍群檢測方法,具有以下有益效果:1、通過將參照單倍群與測試單倍群進(jìn)行比對,利用從根節(jié)點出發(fā)到目標(biāo)單倍群的路徑所獲得的數(shù)據(jù)對該目標(biāo)單倍群的評分,同時適用二代測序結(jié)果和高通量microarray的snp分型結(jié)果,使得檢測適用性更高,提高檢測手段的靈活度及應(yīng)用廣泛度;2、利用高通量的snp位點分型結(jié)果,通過遍歷y單倍群樹的所有可能結(jié)果,基于從根節(jié)點出發(fā)的全路徑評分系統(tǒng),得到準(zhǔn)確的y單倍群分型結(jié)果,具有使y單倍群的檢測過程更加高效、穩(wěn)定的特點;3、該檢測方法具有很強(qiáng)的容錯性,可以根據(jù)實際檢測的y染色體dna數(shù)量和質(zhì)量,靈活調(diào)整參數(shù),即使是質(zhì)量較低的檢測數(shù)據(jù)集也能得到較好的結(jié)果。附圖說明下面將結(jié)合附圖及實施例對本發(fā)明作進(jìn)一步說明,附圖中:圖1是本發(fā)明實施例一種y單倍群檢測方法的實現(xiàn)流程示意圖;圖2是本發(fā)明實施例中刪除不相關(guān)葉子節(jié)點單倍群的實現(xiàn)流程示意圖;圖3是本發(fā)明實施例中測試snp信息與葉子節(jié)點單倍群中參照snp信息的匹配實現(xiàn)流程示意圖;圖4是本發(fā)明實施例中獲得目標(biāo)參照單倍群的實現(xiàn)流程示意圖;圖5是本發(fā)明實施例中參照單倍群的參照snp信息與測試snp信息匹配的實現(xiàn)流程示意圖;圖6是本發(fā)明實施例中對目標(biāo)參照單倍群進(jìn)行標(biāo)記的實現(xiàn)流程示意圖;圖7是本發(fā)明實施例中一種輸出評分最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果信息的實現(xiàn)流程示意圖。具體實施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。人的基因組由22對常染色體和xy兩條性染色體組成,其中22對常染色體在男性和女性中都有兩條;而性染色體,女性有兩個x染色體,男性則有一條x染色體和一條y染色體。所以,y染色體在人類遺傳中,僅能由男性個體從其父親遺傳得到,而且該染色體不會發(fā)生同源重組的現(xiàn)象,因此可以用其上的snp標(biāo)記,利用分子生物學(xué)的方法,來反演推算父系祖源,并形成一個有根的y染色體單倍群樹。這個y染色體單倍群樹,將現(xiàn)代人類分為18個大類型,用a到r的十八個字母作為索引。樹上的父節(jié)點對應(yīng)的snp是所有子節(jié)點共有的。這個樹表征了人類從最早的根結(jié)點,在遷徙繁衍過程中的不斷在y染色體上累積突變的過程。snp是單核苷酸多態(tài)性(singlenucleotidepolymorphism)的簡寫,是指基因組上單個核苷酸變異,即a、t、c、g四種堿基的互相改變,形成基因組上同一位置會有多種堿基存在的多態(tài)性。snp在人群中廣泛存在,多態(tài)性豐富,是很好的遺傳標(biāo)記物。尤其高通量的snp檢測方法出現(xiàn)之后,被廣泛用于生物信息學(xué)的分析。本發(fā)明是基于y染色體上的單核苷酸多態(tài)性(snp)建立的應(yīng)用。本發(fā)明實施例適用于運(yùn)行在python環(huán)境上,并且,python可以運(yùn)行于debian系統(tǒng),也可將其移植并運(yùn)行于linux和windows系統(tǒng),當(dāng)然除了上述環(huán)境或平臺,也可采用其他的環(huán)境或平臺,本發(fā)明實施例對此不作限定。圖1示出了本發(fā)明實施例中一種y單倍群檢測方法的流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。如圖1所示,在本發(fā)明的實施例中,包括以下步驟s:步驟s100,獲取用于參照的y單倍群樹的參照y單倍群樹信息,其中,參照y單倍群樹信息包括y單倍群樹中每個參照單倍群的參照單倍群信息,參照單倍群信息包括參照單倍群坐標(biāo)信息;步驟s200,將每個參照單倍群的參照單倍群信息與測試y單倍群樹中每個測試單倍群的測試單倍群信息進(jìn)行匹配,得到至少一個滿足預(yù)設(shè)條件的目標(biāo)參照單倍群;步驟s300,根據(jù)目標(biāo)參照單倍群的參照單倍群坐標(biāo)信息,獲取與目標(biāo)參照單倍群相關(guān)的第一數(shù)值與第二數(shù)值,其中,第一數(shù)值為從目標(biāo)參照單倍群到與目標(biāo)參照單倍群對應(yīng)的根節(jié)點單倍群之間路徑上的其他目標(biāo)參照單倍群數(shù)量,第二數(shù)值為其他目標(biāo)參照單倍群數(shù)量與在路徑上總的有效單倍群數(shù)量的比值;步驟s400,根據(jù)第一數(shù)值與第二數(shù)值對每個目標(biāo)參照單倍群進(jìn)行評分,輸出評分最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果信息。本發(fā)明實施例中,通過將參照單倍群與測試單倍群進(jìn)行比對,利用從根節(jié)點出發(fā)到目標(biāo)單倍群的路徑所獲得的數(shù)據(jù)對該目標(biāo)單倍群的評分,可同時適用二代測序結(jié)果和高通量microarray的snp分型結(jié)果,使得檢測適用性更好,提高檢測手段的靈活度及應(yīng)用廣泛度;且具有使y單倍群的檢測過程更加高效、穩(wěn)定的有益效果。在本發(fā)明實施例中,用于參照的y單倍群樹的參照y單倍群樹信息,可以是采用isogg公司或者yfull公司的y單倍群樹信息作為參照y單倍群樹信息。以isogg的y單倍群樹舉例子,其中共包含2531個參照單倍群。具體的,在參照y單倍群樹信息中,還包含該參照y單倍群信息中的每個y單倍群對應(yīng)的snp文件每個snp對應(yīng)的坐標(biāo),突變位點的狀態(tài)以及對應(yīng)的參照單倍群名稱。本發(fā)明實施例所采用的isogg發(fā)布的y單倍群樹信息如表1所示:表1a00rootl1122l1104l1106l1107l1284l1102af05a0-trootl1155l1105l1124l1129l1095l1098l1116根據(jù)表1,可以很清楚的看到,圖中每一行代表一個參照y單倍群節(jié)點,其中第一列是該參照單倍群名稱,第二列是該參照單倍群的父節(jié)點的名稱。第三列開始,是該參照單倍群所包含的snp的名字。本發(fā)明實施例所采用的y單倍群樹信息中的每個參照單倍群對應(yīng)的snp文件如表2所示:表2a945702a2b1a1a5b8550434c→aa945802a2b1a1a5b19335462t→c根據(jù)表2,圖中每一行代表一個參照snp,其中第一列是該snp的名字,第二列是其所屬的單倍群,第三列是該snp在y染色體上的坐標(biāo),第四列是該snp的堿基突變類型,如第一行的c->a,代表該snp正常情況下是堿基c,不屬于o2a2b1a1a5b單倍群對應(yīng)的突變,如果突變成了a,則代表這個snp屬于o2a2b1a1a5b單倍群對應(yīng)的突變。本發(fā)明實施例所采用的用戶的測試snp數(shù)據(jù),可以是微整列芯片的snp的結(jié)果,也可以是二代測序的snp結(jié)果。需要給出測試snp的檢測基因型,包括突變和未突變的測試snp位點。數(shù)據(jù)如表3所示:表3chry21152971cchry23541348gchry14263051c根據(jù)表3,圖中每一行代表y染色體上一個snp,每一列分別代表染色體名字,測試snp的坐標(biāo)信息,測試snp的檢測結(jié)果。如圖2所示,圖2示出了本發(fā)明實施例的為了提高相關(guān)檢測的效率及降低檢測出錯率,刪除不相關(guān)葉子節(jié)點單倍群的流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。本發(fā)明實施例提供了一種刪除不相關(guān)葉子節(jié)點單倍群的流程,如圖2所示,該流程包括:步驟s510,根據(jù)參照y單倍群樹信息,獲取在參照y單倍群樹信息中的葉子節(jié)點單倍群的參照單倍群信息;葉子節(jié)點單倍群為沒有子節(jié)點單倍群的參照單倍群,位于y單倍群樹的末端。步驟s520,獲取測試snp信息,將測試snp信息與葉子節(jié)點單倍群的參照單倍群信息中的參照snp信息進(jìn)行坐標(biāo)匹配;步驟s530,根據(jù)匹配結(jié)果,刪除坐標(biāo)不匹配的參照snp信息對應(yīng)的所述葉子節(jié)點單倍群的參照單倍群信息,直至每一葉子節(jié)點單倍群的參照snp信息均有所述測試snp信息與之匹配。如圖3所示,圖3示出了一種測試snp信息與葉子節(jié)點單倍群中參照snp信息的匹配實現(xiàn)流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。在本發(fā)明實施例中,該匹配實現(xiàn)流程包括:步驟s521,獲取測試snp信息,以及參照單倍群信息的參照snp信息;作為本發(fā)明的一種實施例,測試snp信息從檢測人員提供的對用戶檢測所獲得的snp檢測結(jié)果上獲取,具體的,所獲取的測試snp信息具有如表2中所列舉的數(shù)據(jù)格式。步驟s522,將測試snp信息中的測試snp位點信息與參照snp信息中的參照snp位點信息進(jìn)行匹配。例如,若葉子節(jié)點單倍群為o2a2b1a1a5,其包含cts1017,cts7316,cts10738這三個參照snp,將上述cts1017,cts7316,cts10738的參照snp位點信息即其坐標(biāo),與用戶的測試snp位點信息進(jìn)行比對,看該葉子節(jié)點單倍群o2a2b1a1a5中的參照snp位點信息是否在測試snp位點信息中。本發(fā)明實施例對所有經(jīng)獲取的葉子節(jié)點單倍群的參照snp進(jìn)行與測試snp信息的匹配遍歷,查找每個是否有測試snp的坐標(biāo)位點與其參照snp匹配。根據(jù)匹配結(jié)果,刪除坐標(biāo)匹配的參照snp信息的葉子節(jié)點單倍群,直至每一葉子節(jié)點單倍群的參照snp信息均有測試snp信息與之匹配。例如,若葉子節(jié)點單倍群為o2a2b1a1a5,其包含cts1017,cts7316,cts10738這三個參照snp,將上述cts1017,cts7316,cts10738的參照snp位點信息即其坐標(biāo),與用戶的測試snp位點信息進(jìn)行比對,若該葉子節(jié)點單倍群o2a2b1a1a5中的參照snp位點信息均未在該測試snp位點信息中,則可以認(rèn)定該葉子節(jié)點單倍群o2a2b1a1a5為不相關(guān)的葉子節(jié)點單倍群,執(zhí)行將其名稱及參照單倍群信息刪除的指令,以此一一對所有葉子節(jié)點單倍群進(jìn)行匹配測試,以修剪不相關(guān)的葉子節(jié)點單倍群,最后使得參照y單倍群樹信息中的葉子節(jié)點單倍群均包含有與測試snp位點相對的參照單倍群。若該參照y單倍群樹信息中,包含有過多與測試snp不相關(guān)的葉子節(jié)點單倍群,不僅會影響測試snp的檢測效率,而且可能會提高出錯率。本發(fā)明實施例先獲取參照y單倍群樹信息中的葉子節(jié)點單倍群的參照單倍群信息,將不含有測試snp位點的葉子節(jié)點單倍群的信息刪除,當(dāng)對參照snp與測試snp進(jìn)行遍歷匹配的過程中,可以有效降低檢測出錯率,提高檢測效率。如圖4所示,圖4示出了本發(fā)明實施例中獲得目標(biāo)參照單倍群的具體流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。在本發(fā)明實施例中,該流程包括:步驟s210,遍歷所述參照y單倍群樹信息;步驟s220,若所述參照y單倍群樹信息中有參照單倍群的參照snp信息與所述測試snp信息匹配,則將所述參照snp信息對應(yīng)的參照snp定義為目標(biāo)snp;在本發(fā)明實施例中,匹配時,可將上述表2中的參照snp信息與表3中的測試snp信息進(jìn)行對比匹配。優(yōu)選的,如圖5所示,圖5示出了本發(fā)明實施例的參照單倍群的參照snp信息與測試snp信息匹配的具體流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。該流程包括:步驟s221,獲取每個測試snp信息的測試snp位點信息,以及每個所述參照snp信息的參照snp位點信息;步驟s222,若一所述測試snp位點信息與一參照snp位點信息匹配,則將配對后的所述測試snp的測試snp堿基突變類型信息,和與之配對的參照snp的參照snp分型結(jié)果信息進(jìn)行再次匹配;在本發(fā)明實施例中,首先,將測試snp遍歷所有的樹上的節(jié)點,若有一個測試snp位點信息與一個參照y單倍群樹節(jié)點上的單倍群a0a1a所包含的snp名稱為v169的參照snp位點信息一樣,則對該測試snp的分型結(jié)果與該單倍群a0a1a的堿基突變類型進(jìn)行再次匹配。步驟s223,若兩次匹配均成功,則將匹配成功的所述測試snp定義為目標(biāo)snp??梢岳斫獾?,若兩次匹配均成功,該測試snp為大概率與所匹配的參照單倍群一致,兩次匹配可以保證其檢測結(jié)果的準(zhǔn)確性。步驟s230,若有所述參照單倍群滿足至少包含有預(yù)設(shè)比例值的目標(biāo)snp,則將滿足條件的所述參照單倍群定義為目標(biāo)參照單倍群。例如,將含有目標(biāo)snp的數(shù)量與該參照單倍群的總參照snp數(shù)量的比值為0.1設(shè)置為該預(yù)設(shè)比例值的閾值,對于參照y單倍群樹某一節(jié)點的單倍群名稱為o2a2b1a1a5,包含cts1017,cts7316,cts10738,cts1017,m1543,m1694,cts10738,m1726共8個參照snp,如果檢測結(jié)果中檢測了其中7個,并且7個中有cts1017,cts7316兩個測試snp信息符合o2a2b1a1a5中的突變情況,則該節(jié)點滿足上述匹配條件的測試snp比例達(dá)到了0.286(2/7),超過了預(yù)設(shè)的0.1的閾值,將o2a2b1a1a5標(biāo)記為目標(biāo)參照單倍群。優(yōu)選的,圖6示出了本發(fā)明實施例中對目標(biāo)參照單倍群進(jìn)行標(biāo)記的流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。在本發(fā)明實施例中,包括以下判斷方式:若所述參照單倍群為目標(biāo)參照單倍群,則將所述參照單倍群的狀態(tài)信息定義為true;若所述參照單倍群包含有目標(biāo)snp但比例低于預(yù)設(shè)比例值,則將所述參照單倍群的狀態(tài)信息定義為false;若所述參照單倍群不包含與測試snp坐標(biāo)匹配的參照snp,則將所述參照單倍群的狀態(tài)信息定義為none。進(jìn)一步的,有效單倍群是狀態(tài)信息為true或false的參照單倍群。如此標(biāo)記,可以清楚地區(qū)分用戶不同測試snp與參照y單倍群樹中的參照snp之間的匹配程度,將用戶所有的測試snp區(qū)分為true、false、none三種匹配度,在評分過程中,只將定義為true和false兩種狀態(tài)的參照單倍群作為有效單倍群,進(jìn)而將有效單倍群作為評分基礎(chǔ),不僅有利于提高檢測的效率,還可以提高該評分的可靠度與準(zhǔn)確度。在評分的時候為了能更加方便、直觀,目標(biāo)參照單倍群的評分為所述第一數(shù)值與第二數(shù)值的乘積,其中,第一數(shù)值為從目標(biāo)參照單倍群到與目標(biāo)參照單倍群對應(yīng)的根節(jié)點單倍群之間路徑上的其他目標(biāo)參照單倍群數(shù)量,第二數(shù)值為其他目標(biāo)參照單倍群數(shù)量與在路徑上總的有效單倍群數(shù)量的比值。在本發(fā)明實施例中,計算的公式可以為score=p(true)*n(true)。其中p(true)是從y單倍群樹的根節(jié)點單倍群出發(fā),到該目標(biāo)參照單倍群的整個路徑上通過的所有的節(jié)點,其狀態(tài)為true占所有不是none的節(jié)點的比例。舉例來說,如某一目標(biāo)參照單倍群o2a2b1a1a5為true,則找到從root開始到它,經(jīng)過所有的節(jié)點為“a0-t”,“a1”,“a1b”,“bt”,“ct”,“cf”,“f”,“ghijk”,“hijk”,“ijk”,“k”,“k2”,“no”,“o”,“o2”,“o2a”,“o2a2”,“o2a2b”,“o2a2b1”,“o2a2b1a”,“o2a2b1a1”,“o2a2b1a1a”,“o2a2b1a1a5”,共23個,如果其中20個節(jié)點狀態(tài)為true,2個為false,1個為none,則p(true)等于0.91(20/22)。n(true)為路徑上所有狀態(tài)為true的點,在舉例中n(true)等于20。整體的評分所得分?jǐn)?shù)(score)等于p(true)*n(true),即18.2(0.91*20)。對所有的點,都計算出對應(yīng)的分?jǐn)?shù)值??梢岳斫獾模松鲜鰧⒌谝粩?shù)值與第二數(shù)值相乘得出數(shù)值的方式,也可以將第一數(shù)值與第二數(shù)值作為參考值,進(jìn)行任何方式的權(quán)重計算,以得出對檢測結(jié)果的比對有利的評分方式。結(jié)合上述標(biāo)記的方法,對所有狀態(tài)為true的節(jié)點,計算評價分?jǐn)?shù),可以給出一個較為具有參考價值的結(jié)果。圖7示出了本發(fā)明實施例中一種輸出評分最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果信息的流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。作為本發(fā)明的一種實施例,該具體流程包括:步驟s410,若評分最高的目標(biāo)參照單倍群為唯一,則將評分最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果進(jìn)行輸出;例如,當(dāng)有“o2a2a”“a0a2”“a0b”3個目標(biāo)參照單倍群時,若其評分分別是“16.8”“21.3”“19.1”,則將獲得最高分“21.3”的“a0a2”結(jié)果進(jìn)行輸出。步驟s420,若評分最高的目標(biāo)參照單倍群不唯一,則比較各個評分最高的目標(biāo)參照單倍群的目標(biāo)snp所占比例,將其中目標(biāo)snp所占比例最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果信息進(jìn)行輸出。例如,當(dāng)有“o2a2a”,“a0a2”,“a0b”3個目標(biāo)參照單倍群時,若其評分分別是“16.8”“19.1”“19.1”,則“a0a2”,“a0b”同時獲得相同的最高分,然后需對比“a0a2”,“a0b”中目標(biāo)snp所占比例,若“a0a2”,“a0b”的目標(biāo)snp所占比例分別是“0.4”,“0.3”,則將“a0a2”的結(jié)果進(jìn)行輸出。步驟s430,若評分最高的目標(biāo)參照單倍群不唯一,且其中目標(biāo)snp所占比例均相同,則隨機(jī)輸出其中一個評分最高的目標(biāo)參照單倍群所對應(yīng)的結(jié)果信息。例如,當(dāng)有“o2a2a”,“a0a2”,“a0b”3個目標(biāo)參照單倍群時,若其評分分別是“19.1”,“19.1”,“19.1”,則“o2a2a”,“a0a2”,“a0b”同時獲得相同的最高分,且若其目標(biāo)snp所占比例均相同,則直接隨機(jī)輸出一個目標(biāo)參照單倍群的結(jié)果??梢岳斫獾模鲜鼋Y(jié)果輸出方法只是其中一種優(yōu)選方案,也可以根據(jù)實際需要進(jìn)行設(shè)計,例如同時輸出最高的兩個或兩個以上數(shù)據(jù)作為參考,本發(fā)明實施例對此不作限定。在本發(fā)明實施例中,結(jié)果信息包括評分最高的目標(biāo)參照單倍群所對應(yīng)的名稱信息、坐標(biāo)信息、與目標(biāo)參照單倍群對應(yīng)的根節(jié)點單倍群之間的路徑信息的一個或多個。上述信息可以清楚的表示檢測結(jié)果的信息,方便檢測者根據(jù)該信息作出分析及處理。下面將列舉23andme、amytree和本方法(記為“本發(fā)明實施例”)在不同數(shù)據(jù)集中的表現(xiàn)情況,來展示本方法的有益效果。1、使用千人基因組phase3的數(shù)據(jù)比較,得到的y染色體單倍型結(jié)果如表4所示:表4可以看到,三種發(fā)放在大部分人的結(jié)果分析上有一致的結(jié)論(如果不同的單倍群結(jié)果,單倍群名字前面的字母和數(shù)字一樣的話,可以認(rèn)為是大致一致的,只是精度有差別)。在不一致的部分,本發(fā)明實施例與23andme的結(jié)果一致性較好,amytree部分結(jié)果與這兩個有較大差異(三角形標(biāo)記)。2.使用本發(fā)明實施例檢測的部分microarray數(shù)據(jù)比較三種方法,得到的y染色體單倍型結(jié)果如表5所示:表5id23andmeyhaplo本發(fā)明實施例amytree22271602272658ao-tδn1c2b2n1c2b227311602271750ao-tδr1a1a1b2a2ar1a1a1b2a2a33241602272739ao-tδc1a1a1c1a1a237661602274626ao-tδo1b1a1a1a1a2o1b1a1a1a1a237726031800398ao-tδo2b1ao2b1a3839548230069ao-tδr1a1a1b2a2b1br1a1a1b2a2b1b43385432200146ao-tδo2a2b1a2a1a1a1δc2e1b2δ47061602272612ao-tδc2e1a1ac2e1b1a48085262300489ao-tδo2a1a2o2a1a253071602274893ao-tδo1a2o1b1a1a1b57635432200796ao-tδe1a2b1a2δd1b2a2δ61295432200700ao-tδq1a2a1c1δt1a1a3δ67541602272634ao-tδo1a1a1a1a1o1b1a1a1b79941602272898ao-tδo1b2ao1b1a1a1b92551602274266ao-tδq1a1a1q1a1a1可以看到,23andme的方法出現(xiàn)了明顯的問題,所有人的結(jié)果都被認(rèn)為是相同的,a0-t是非常原始的單倍群,幾乎不可能在中國人群總檢測到。而本發(fā)明實施例的結(jié)果更具合理性,得到的結(jié)果都是中國人群可能出現(xiàn)的單倍群類型。3.考察三個方法在缺失數(shù)據(jù)情況下的表現(xiàn)。a.隨機(jī)取千人基因組50%的數(shù)據(jù),得到的y染色體單倍型結(jié)果如表6所示:表6b.隨機(jī)取千人基因組10%的數(shù)據(jù),得到的y染色體單倍型結(jié)果,如表7所示:表7c.隨機(jī)取千人基因組5%的數(shù)據(jù),得到的y染色體單倍型結(jié)果如表8所示:表8通過隨機(jī)挑選一定比例的千人基因組可以看到,23andme和本方法的一致性很好而amytree的算法則很不穩(wěn)定。對比挑選位點之前的結(jié)果,23andme和本發(fā)明實施例的方法也有很穩(wěn)定的輸出,而amytree的結(jié)果則很容易受異常值得影響,導(dǎo)致不同數(shù)據(jù)集之間的結(jié)果波動很大。在本發(fā)明實施例中,結(jié)合上述測試實驗結(jié)果可知本發(fā)明實施例具有以下有益效果:1、通過將參照單倍群與測試單倍群進(jìn)行比對,利用從根節(jié)點出發(fā)到目標(biāo)單倍群的路徑所獲得的數(shù)據(jù)對該目標(biāo)單倍群的評分,可以同時適用二代測序結(jié)果和高通量microarray的snp分型結(jié)果,使得檢測適用性更高,提高檢測手段的靈活度及應(yīng)用廣泛度;2、利用高通量的snp位點分型結(jié)果,通過遍歷y單倍群樹的所有可能結(jié)果,基于從根節(jié)點出發(fā)的全路徑評分系統(tǒng),得到準(zhǔn)確的y單倍群分型結(jié)果,具有使y單倍群的檢測過程更加高效、穩(wěn)定的特點;3、該檢測方法具有很強(qiáng)的容錯性,可以根據(jù)實際檢測的y染色體dna數(shù)量和質(zhì)量,靈活調(diào)整參數(shù),即使是質(zhì)量較低的檢測數(shù)據(jù)集也能得到較好的結(jié)果。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于計算機(jī)、手機(jī)等終端設(shè)備的可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(read-onlymemory,rom)或隨機(jī)存儲記憶體(randomaccessmemory,ram)等??梢岳斫獾模陨蠈嵤├齼H表達(dá)了本發(fā)明的優(yōu)選實施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制;應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,可以對上述技術(shù)特點進(jìn)行自由組合,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍;因此,凡跟本發(fā)明權(quán)利要求范圍所做的等同變換與修飾,均應(yīng)屬于本發(fā)明權(quán)利要求的涵蓋范圍。當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
焦作市| 湖州市| 大同市| 岗巴县| 乌鲁木齐县| 吴江市| 东兴市| 屏山县| 新巴尔虎左旗| 怀柔区| 玉山县| 潼关县| 林芝县| 秭归县| 肥东县| 当雄县| 独山县| 金华市| 沧源| 休宁县| 贵南县| 米脂县| 哈巴河县| 沙洋县| 东阳市| 沭阳县| 图木舒克市| 乌审旗| 揭东县| 清水县| 苗栗市| 华容县| 福清市| 嘉峪关市| 黄大仙区| 咸阳市| 孝感市| 新化县| 鄱阳县| 江川县| 犍为县|