欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

二次dna片段化的基因組單倍型高通量測序方法

文檔序號:493063閱讀:587來源:國知局
二次dna片段化的基因組單倍型高通量測序方法
【專利摘要】本發(fā)明公開了一種二次DNA片段化的基因組單倍型高通量測序方法,分兩次對基因組DNA進行片段化后測序以獲得單倍型信息:第一次DNA片段化將基因組DNA分割成為一系列較長的核酸片段,在較長的核酸片段中構(gòu)建一組片段文庫,對每個片段文庫進行擴增;將擴增后的較長的核酸片段進行第二次DNA片段化,第二次DNA片段化后得到較短的核酸片段,每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序,測序的結(jié)果首先在每個片段文庫內(nèi)部進行序列比對或拼接,獲得較長的核酸序列后進行跨片段文庫的序列比對和拼接,從而實現(xiàn)利用高通量測序獲得基因組單倍型信息。本發(fā)明方法實現(xiàn)了利用高通量測序獲得基因組單倍型信息,且簡單、效率高。
【專利說明】二次DNA片段化的基因組單倍型高通量測序方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于生物【技術(shù)領(lǐng)域】,是一種實現(xiàn)對基因組進行單倍型測定的高通量測序方法,具體涉及一種對基因組DNA的兩次片段化后編碼、解碼及核酸序列組裝的測序方法。

【背景技術(shù)】
[0002]人類基因組計劃和各種生物基因組計劃的開展和完成,使人類步入了后基因組時代,對當代的生命科學研究產(chǎn)生了巨大而深遠的影響,分子生物學等相關(guān)學科獲得迅猛發(fā)展,從基因水平上認識生命的差異,疾病發(fā)生、發(fā)展的規(guī)律,藥物與生命體的相互作用,不同物種之間的遺傳差異以及同一物種內(nèi)部不同個體間的遺傳差異成為可能。就基因序列分析而言,后基因組時代的重點已由全基因組序列測定轉(zhuǎn)移到了對基因組中個體遺傳差異及物種間遺傳差異的比較。
[0003]單倍體基因型,簡稱單倍型,指在同一染色體上進行共同遺傳的多個基因座上等位基因的組合,單倍型有時可指同一條染色體上所有基因組上等位基因組的組合,單倍型是上述遺傳差異的直接體現(xiàn)。由于大量的真核生物的基因組是雙倍體或多倍體,在同一生物個體內(nèi)存在兩條或多條同源染色體,這些同源染色體間核苷酸鏈的長度、堿基的位置和排列順序相近。根據(jù)物種的不同,這些同源染色體間平均數(shù)百至數(shù)千堿基存在一個堿基的差別。由于以上這些特點,盡管存在通量低和價格高的問題,傳統(tǒng)的Sanger DNA測序法依然是進行單倍型研究的有用但并不高效的方法。Sanger DNA測序法進行單倍型研究時,首先需要利用各種克隆載體,比如BAC細菌人工染色體、YAC酵母人工染色體等,將所需研究的基因組分割成一定長度的片段并進行克隆,隨后對逐段逐步地測定其中的核酸序列以獲得較大長度的單倍型信息。第一個人類基因組序列測定即采用的這一方案,花費了大約為10億美元,雖然目前這一費用已經(jīng)有所降低,但單倍型的研究仍然受限于DNA測序技術(shù)。高通量DNA測序技術(shù),具有通量高、速度快、成本低等特點,在近十年得到了飛速的發(fā)展,并成為國際上一個競爭十分激烈的研究領(lǐng)域,多家公司均有成熟的商品化儀器上市,如Roche公司的焦磷酸測序技術(shù),Illumina公司的延伸測序技術(shù),Life Technology公司的連接測序技術(shù)和PH敏感場效應管測序技術(shù)等。然而這些高通量DNA測序技術(shù)均無法高效地進行基因組單倍型的分析,其原因是高通量DNA測序之前需要將基因組DNA打斷成一定長度的核酸片段,對每個片段進行并行測序后再與參考序列比較以確定每個片段在基因組的中位置,受制于高通量測序的測序讀長,每條連續(xù)測序片段的長度一般為幾十到幾百個堿基,這一長度的核酸片段無法在兩條或多條同源染色體之間定位。因此一種方法簡單、效率高的高通量測定基因組單倍型序列信息的方法的開發(fā)很有必要。


【發(fā)明內(nèi)容】

[0004]發(fā)明目的:本發(fā)明所要解決的技術(shù)問題是提供一種對基因組進行兩次片段化以實現(xiàn)高通量測定基因組單倍型序列信息的方法,本發(fā)明的方法不僅有助于高通量測序在基因組單倍型研究中的應用,而且還能夠大幅度降低基因組單倍型分析的成本,其具有方法簡單、效率高的優(yōu)點。
[0005]
【發(fā)明內(nèi)容】
:為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)手段為:
[0006]一種二次DNA片段化的基因組單倍型高通量測序方法,分兩次對基因組DNA進行片段化后測序以獲得單倍型信息:第一次DNA片段化將基因組DNA分割成為一系列較長的核酸片段,在較長的核酸片段中構(gòu)建一組片段文庫,對每個片段文庫進行擴增;將擴增后的較長的核酸片段進行第二次DNA片段化,第二次DNA片段化后得到較短的核酸片段,每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序,測序的結(jié)果首先在每個片段文庫內(nèi)部進行序列比對或拼接,獲得較長的核酸序列后進行跨片段文庫的序列比對和拼接,從而實現(xiàn)利用高通量測序獲得基因組單倍型信息。
[0007]其中,所述高通量測序是指通過核酸鏈的合成反應、核酸的連接反應、核酸的降解反應或核酸鏈通過納米孔道大規(guī)模并行測定核酸序列信息。
[0008]其中,所述DNA片段化是指通過超聲打斷、機械拉斷、剪切力拉斷、核酸酶酶切、自然降解或化學降解方法使DNA由長片段斷裂成為短片段。
[0009]其中,所述基因組DNA是由一個完整基因組構(gòu)成或者一個完整基因組的一部分構(gòu)成,所述基因組DNA的含量是I個拷貝或者是多個拷貝。
[0010]其中,所述單倍型信息是一條完整的染色體或核酸鏈的單倍型信息或者是一段較長的核酸鏈的單倍型信息。
[0011]其中,所述較長的核酸片段的長度在1000堿基到10億堿基之間,所述較短的核酸片段的長度在35堿基到10萬堿基之間。
[0012]其中,所述擴增是指在基因組水平進行的非特異性擴增,所述擴增為采用聚合酶鏈式反應擴增或采用聚合酶等溫擴增。
[0013]其中,每個所述片段文庫中核酸片段的總長度小于單倍體基因組DNA全長,每個所述片段文庫中一半以上的核酸片段彼此之間不包含等位區(qū)域。
[0014]其中,所述每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序是指每個片段文庫獨立構(gòu)建完全獨立的文庫并分別進行測序或者使用條碼技術(shù)基于多個片段文庫構(gòu)建編碼文庫進行高通量測序。
[0015]其中,所述序列比對和拼接是在有參考序列的幫助下進行或者在沒有參考序列的幫助下進行。
[0016]本發(fā)明的技術(shù)原理如下:
[0017]來自多個拷貝的雙倍型或多倍型生物的基因組在第一次片段化后,被打斷成一組長度較長的核酸片段,根據(jù)研究需要和片段化方法的不同,片段的長度從數(shù)千堿基至數(shù)百兆堿基不等,但在同一次反應中所得到的核酸片段長度相當。隨后將這一組含有多個基因組拷貝不同片段的混合片段分為一組片段文庫,每個片段文庫內(nèi)的核酸片段數(shù)量根據(jù)基因組倍型數(shù)量、基因組大小、核酸片段長度、等位基因片段出現(xiàn)概率確定,以保證在同一片段文庫中,多數(shù)片段之間不含有等位基因或等位序列。一個片段文庫中片段數(shù)量與片段平均長度的乘積,即堿基數(shù)目總和,小于或等于該樣本單倍型基因組堿基數(shù)的一半。通過這一分組,將雙倍型或多倍型的基因組人工分隔成為一系列單倍型亞基因組規(guī)模文庫的組合,即片段文庫的組合。隨后每個片段文庫經(jīng)擴增后獨立構(gòu)建測序文庫,片段文庫內(nèi)的核酸片段被二次打斷成幾十至數(shù)百個堿基的小片段,用于構(gòu)建測序文庫,之后通過高通量測序平臺中對各個小片段進行測序。測序完成后,每個片段文庫內(nèi)的小片段的測序結(jié)果與參考基因組序列進行比對。由于每個片段文庫內(nèi)的小片段來源于一系列長核酸片段文庫,因此比對后可以獲得一組長度較長的單倍型片段。將不同的片段文庫內(nèi)比對得出的較長的單倍型片段進行組裝,即可獲得完整的單倍型基因組。
[0018]有益效果:相比于現(xiàn)有技術(shù),本發(fā)明的基因組單倍型高通量測序方法簡單、效率高,大幅度降低了基因組單倍型分析的成本,并且實現(xiàn)了利用高通量測序獲得基因組單倍型信息,即通過兩次片段化的過程,利用較短片段的高通量測序?qū)崿F(xiàn)長片段基因組單倍型信息的判讀;另外,本發(fā)明的方法適用面廣,既適用于雜合度較低的雙倍型人類基因組的單倍型分析,又適用于其他雜合度高或者多倍型的基因組的單倍型分析。

【專利附圖】

【附圖說明】
[0019]圖1是本發(fā)明的總體流程示意圖,完整的基因組或者長的核酸鏈經(jīng)過第一次片段化過程后,形成一組較長的核酸片段,隨后將由一個或多個核酸鏈片段化得到的較長的核酸片段分為多個片段文庫,每個片段文庫內(nèi)的較長的核酸片段經(jīng)過二次片段化形成較短的核酸片段。每個片段文庫內(nèi)較短的核酸片段獨立構(gòu)建測序文庫并分別測序,通過第一次比對和拼接獲得較長的核酸片段,通過第二次比對和拼接獲得單倍型信息;
[0020]圖2是本發(fā)明的詳細過程示意圖:①是本發(fā)明測序的基因組DNA樣本,為3個拷貝的雙倍型基因組,用白色和黑色分別表示一對同源染色體基因組DNA被第一次片段化為長度較長的核酸片段,每條完整的核酸鏈被片段化為10條長度較長的核酸片段,共60條片段;③是將全部60條較長的核酸片段分為10個片段文庫,每個片段文庫包含6條核酸片段;④每個片段文庫中的較長的核酸片段被再次打斷成較短的核酸片段,構(gòu)建高通量測序文庫,每個片段文庫中每個較長的核酸片段被再次打碎成5條較短的核酸片段,隨后每個片段文庫被獨立的測序并進行生物信息分析,最終獲得基因組單倍型信息。

【具體實施方式】
[0021]以下結(jié)合附圖對本發(fā)明進行進一步說明。
[0022]本發(fā)明通過對基因組DNA的兩次片段化實現(xiàn)單倍體基因組的高通量測序,第一次片段化過程,將基因組DNA打斷成一組序列長度較長的核酸片段,分別吸取一定數(shù)量的核酸片段作為片段文庫1、片段文庫2……片段文庫N,每個片段文庫內(nèi)的核酸片段數(shù)量根據(jù)基因組大小、片段長度、等位片段出現(xiàn)概率確定,N個片段文庫總片段數(shù)量滿足高通量測序深度的需要;對每個片段文庫內(nèi)較長的核酸片段進行二次打斷,二次打斷后的片段長度滿足測序平臺的要求,隨后構(gòu)建高通量測序文庫進行獨立測序或編碼混合測序;如采用獨立測序方式,在測序完成后,直接將測序片段與參考序列進行比對;如采用編碼混合測序方式,在測序完成后首先進行條碼的解碼以確定每個測序片段的片段文庫歸屬,再與參考序列比對;根據(jù)本發(fā)明的設(shè)計,在同一片段文庫內(nèi),多數(shù)片段均沒有另外一條或多條含有相同等位基因的片段存在,因此每個獨立混合庫內(nèi)可以比對、拼接出含有多個SNP位點較長的單倍型片段;最后利用這些含有較長SNP位點的單倍型片段進行拼接,獲得長度更長的單倍型乃至單條染色體的完整序列。
[0023]如圖1?2所示,本發(fā)明的二次片段化的基因組單倍型高通量測序方法,步驟1,選取待測序的基因組DNA樣本,基因組DNA可以是雙倍型,也可以是多倍型,基因組DNA的拷貝數(shù)量可以是I個,也可以是多個;步驟2,將基因組DNA第一次片段化分割成為一系列較長的核酸片段;步驟3,在較長的核酸片段中構(gòu)建一組片段文庫(每個片段文庫內(nèi)的核酸片段總長小于一個基因組的大小,步驟2中第一次片段化所得較長的核酸片段可以在步驟3被全部使用,也可以不被全部使用);步驟4,對每個片段文庫進行擴增,擴增后較長的核酸片段被再次片段化為較短的核酸片段,每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序,測序的結(jié)果首先在每個片段文庫內(nèi)部進行序列比對或拼接,獲得較長的核酸序列后進行跨片段文庫的序列比對和拼接,從而實現(xiàn)利用高通量測序獲得基因組單倍型信息。
[0024]實施例1:
[0025]一種二次DNA片段化的基因組單倍型高通量測序方法,分兩次對基因組DNA進行片段化后測序以獲得單倍型信息:第一次DNA片段化將基因組DNA分割成為一系列較長的核酸片段,在較長的核酸片段中構(gòu)建一組片段文庫,對每個片段文庫進行擴增;將擴增后的較長的核酸片段進行第二次DNA片段化,第二次DNA片段化后得到較短的核酸片段,每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序,測序的結(jié)果首先在每個片段文庫內(nèi)部進行序列比對或拼接,獲得較長的核酸序列后進行跨片段文庫的序列比對和拼接,從而實現(xiàn)利用高通量測序獲得基因組單倍型信息。
[0026]其中,所述高通量測序是指通過核酸鏈的合成反應、核酸的連接反應、核酸的降解反應或核酸鏈通過納米孔道大規(guī)模并行測定核酸序列信息。
[0027]其中,所述DNA片段化是指通過超聲打斷、機械拉斷、剪切力拉斷、核酸酶酶切、自然降解或化學降解方法使DNA由長片段斷裂成為短片段。
[0028]其中,所述基因組DNA是由一個完整基因組構(gòu)成或者一個完整基因組的一部分構(gòu)成,所述基因組DNA的含量是I個拷貝或者是多個拷貝。
[0029]其中,所述單倍型信息是一條完整的染色體或核酸鏈的單倍型信息或者是一段較長的核酸鏈的單倍型信息。
[0030]其中,所述較長的核酸片段的長度在1000堿基到10億堿基之間,所述較短的核酸片段的長度在35堿基到10萬堿基之間。
[0031]其中,所述擴增是指在基因組水平進行的非特異性擴增,所述擴增為采用聚合酶鏈式反應擴增或采用聚合酶等溫擴增。
[0032]其中,每個所述片段文庫中核酸片段的總長度小于單倍體基因組DNA全長,每個所述片段文庫中一半以上的核酸片段彼此之間不包含等位區(qū)域。
[0033]其中,所述每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序是指每個片段文庫獨立構(gòu)建完全獨立的文庫并分別進行測序或者使用條碼技術(shù)基于多個片段文庫構(gòu)建編碼文庫進行高通量測序。
[0034]其中,所述序列比對和拼接是在有參考序列的幫助下進行或者在沒有參考序列的幫助下進行。
[0035]實施例2:
[0036]二次片段化的基因組單倍型高通量測序方法進行人類全基因組單倍型分析:
[0037]采用酚氯仿法提取人類全基因組DNA,由于酚氯仿法自身的特性,人類基因組會斷裂成為長度約為30Kbp的較長的核酸片段。
[0038]人類全基因組DNA的總長度約為3Gbp,因此一個拷貝的人類基因組包含約10萬個上述長約為30Kbp的片段。每個堿基對的平均分子量為650,因此通過計算可知3Gbp核酸的絕對質(zhì)量約為3.24皮克(I皮克=10_12克),每I萬個30Kbp的片段的絕對質(zhì)量為0.324皮克。
[0039]利用紫外分光光度計對提取的基因組DNA進行定量,定量進行梯度稀釋,隨后吸取100組核酸片段,每組核酸片段的質(zhì)量為0.324皮克,由上述計算可知每組核酸片段包含I萬個30Kbp的片段,這樣一組核酸片段稱為一個片段文庫。100組核酸片段共構(gòu)建100個片段文庫。利用基于Phi 29DNA聚合酶及隨機引物的多重鏈替換方法對每個片段文庫進行獨立全基因組擴增,以提高每個片段文庫中DNA鏈的數(shù)量及核酸的總質(zhì)量。之后,將每個片段文庫中的擴增產(chǎn)物采用超聲的辦法打斷成為長約200bp的短片段,在短片段兩端連接上測序所需的通用接頭,隨后在高通量DNA測序儀上進行隨機片段文庫測序,每個獨立的片段文庫至少獲得4000萬條長度150bp的核酸序列。
[0040]將這4000萬條長度為150bp的核酸序列與人類基因組的參考序列進行比對,由于這4000萬條150bp的序列來源于I萬條30Kbp的片段,因此比對過程中在基因組的大約I萬個區(qū)域出現(xiàn)密集匹配,平均每個區(qū)域的覆蓋深度為20倍。經(jīng)過這一輪比對,可以獲得大約I萬條30Kbp左右的核酸序列。尤為重要的是,I萬條30Kbp僅能覆蓋人類基因組1/10的區(qū)域,雖然人是雙倍體,在第一次片段化后取得的I萬條片段彼此之間包含等位基因的平均概率小于1/10。因此這I萬條30Kbp左右的核酸序列中的90%的序列彼此之間不重疊,是單倍型片段。
[0041]隨后將全部100個片段文庫中的共1000萬條30Kbp左右的核酸序列在人類參考基因組的幫助下進行單倍型的拼接。人的基因組中平均約600-1000bp就會出現(xiàn)一個SNP,因此雖然一個個體的兩套染色體相似程度很高,但來源于兩套染色體的長度為30Kbp的同源片段之間,也會存在至少30個堿基的差異。因此拼接過程中可以基于兩套染色體進行獨立的單倍型拼接,100個片段文庫中可覆蓋整個單倍型基因組10倍,由此獲得兩套獨立的基因組單倍型。
【權(quán)利要求】
1.二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:分兩次對基因組DNA進行片段化后測序以獲得單倍型信息:第一次DNA片段化將基因組DNA分割成為一系列較長的核酸片段,在較長的核酸片段中構(gòu)建一組片段文庫,對每個片段文庫進行擴增;將擴增后的較長的核酸片段進行第二次DNA片段化,第二次DNA片段化后得到較短的核酸片段,每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序,測序的結(jié)果首先在每個片段文庫內(nèi)部進行序列比對或拼接,獲得較長的核酸序列后進行跨片段文庫的序列比對和拼接,從而實現(xiàn)利用高通量測序獲得基因組單倍型信息。
2.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述高通量測序是指通過核酸鏈的合成反應、核酸的連接反應、核酸的降解反應或核酸鏈通過納米孔道大規(guī)模并行測定核酸序列信息。
3.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述DNA片段化是指通過超聲打斷、機械拉斷、剪切力拉斷、核酸酶酶切、自然降解或化學降解方法使DNA由長片段斷裂成為短片段。
4.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述基因組DNA是由一個完整基因組構(gòu)成或者一個完整基因組的一部分構(gòu)成,所述基因組DNA的含量是I個拷貝或者是多個拷貝。
5.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述單倍型信息是一條完整的染色體或核酸鏈的單倍型信息或者是一段較長的核酸鏈的單倍型信息。
6.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述較長的核酸片段的長度在1000堿基到10億堿基之間,所述較短的核酸片段的長度在35堿基到10萬堿基之間。
7.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述擴增是指在基因組水平進行的非特異性擴增,所述擴增為采用聚合酶鏈式反應擴增或采用聚合酶等溫擴增。
8.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:每個所述片段文庫中核酸片段的總長度小于單倍體基因組DNA全長,每個所述片段文庫中一半以上的核酸片段彼此之間不包含等位區(qū)域。
9.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述每個片段文庫獨立構(gòu)建測序文庫并分別進行高通量測序是指每個片段文庫獨立構(gòu)建完全獨立的文庫并分別進行測序或者使用條碼技術(shù)基于多個片段文庫構(gòu)建編碼文庫進行高通量測序。
10.根據(jù)權(quán)利要求1所述的二次DNA片段化的基因組單倍型高通量測序方法,其特征在于:所述序列比對和拼接是在有參考序列的幫助下進行或者在沒有參考序列的幫助下進行。
【文檔編號】C12Q1/68GK104357563SQ201410606732
【公開日】2015年2月18日 申請日期:2014年10月30日 優(yōu)先權(quán)日:2014年10月30日
【發(fā)明者】涂景, 陸祖宏, 高珅, 郭靖, 段夢沁, 喬祎 申請人:東南大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
灵石县| 彭泽县| 中山市| 宁波市| 连城县| 巴林左旗| 都兰县| 秦安县| 额敏县| 三穗县| 寻乌县| 利津县| 阿勒泰市| 小金县| 灯塔市| 建始县| 唐海县| 历史| 潞城市| 池州市| 贞丰县| 佳木斯市| 灵台县| 博爱县| 山东省| 嘉兴市| 镇宁| 新和县| 杂多县| 内乡县| 洛南县| 高碑店市| 桂平市| 宜丰县| 宜丰县| 丰镇市| 古交市| 池州市| 云安县| 顺义区| 无棣县|