欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法

文檔序號(hào):493030閱讀:450來(lái)源:國(guó)知局
基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法
【專利摘要】本發(fā)明公開了基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔、擴(kuò)增后構(gòu)建一組轉(zhuǎn)化文庫(kù)并測(cè)序獲得基因組單倍型甲基化信息。本發(fā)明最大的優(yōu)點(diǎn)是實(shí)現(xiàn)了高通量分析基因組單倍型甲基化信息,通過轉(zhuǎn)化、稀釋和分隔等步驟,利用較短讀長(zhǎng)的高通量測(cè)序?qū)崿F(xiàn)長(zhǎng)片段基因組單倍型甲基化信息的判讀;本發(fā)明的方法簡(jiǎn)單,操作簡(jiǎn)易,不需要額外增加特殊的儀器設(shè)備,所述過程均可通過成熟技術(shù)實(shí)現(xiàn);本發(fā)明適用面廣,既適用于雜合度較低的雙倍型的人類基因組的單倍型甲基化分析,又適用于其他雜合度高或者多倍型的基因組的單倍型甲基化分析。
【專利說明】基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于生物【技術(shù)領(lǐng)域】,是一種實(shí)現(xiàn)對(duì)基因組甲基化情況進(jìn)行單倍測(cè)定的高通量測(cè)序方法,具體涉及一種對(duì)基因組DNA進(jìn)行亞硫酸氫鹽轉(zhuǎn)化后構(gòu)建亞單倍型文庫(kù)進(jìn)行高通量測(cè)序的獲取基因組DNA單倍型甲基化信息的方法。

【背景技術(shù)】
[0002]1939年,生物學(xué)家Waddington CH正式提出了 “表觀遺傳學(xué)”這一術(shù)語(yǔ);1975年Holliday R對(duì)表觀遺傳學(xué)作了較為明確的定義:表觀遺傳的研究不僅包括發(fā)育過程中,而且還包括成體階段可遺傳基因的表達(dá)改變研究。表觀遺傳信息在細(xì)胞的親代和子代之間傳遞,然而并不伴隨著DNA序列的改變。DNA甲基化是最早發(fā)現(xiàn)且比較常見的表觀遺傳現(xiàn)象之一,是指在DNA甲基轉(zhuǎn)移酶(DNMTs)的作用下,以S-腺苷硫氨酸(SAM)為甲基供體,將甲基添加到DNA分子中的堿基上。常見的DNA甲基化發(fā)生在DNA分子上的胞嘧啶的第5個(gè)碳原子上,胞嘧啶由此被修飾為5甲基胞嘧啶(5mC)。
[0003]研究發(fā)現(xiàn),甲基化在基因表達(dá)過程中起到重要的作用,在對(duì)一些腫瘤的研究中發(fā)現(xiàn),異常DNA甲基化總是出現(xiàn)在一些抑癌基因和癌基因中,以改變它們的表達(dá)水平,而發(fā)生在基因啟動(dòng)子區(qū)域的DNA甲基化通常會(huì)導(dǎo)致基因沉默。一般認(rèn)為,DNA甲基化有兩個(gè)途徑調(diào)控基因的表達(dá),一個(gè)途徑是DNA的甲基化抑制轉(zhuǎn)錄基因因子和增強(qiáng)子封閉元件與DNA的結(jié)合,導(dǎo)致基因的下調(diào)和上調(diào);另一個(gè)途徑認(rèn)為甲基化調(diào)控基因表達(dá)與甲基化結(jié)合域蛋白相關(guān)。已有的研究表明,DNA甲基化與包括癌癥、白血病、糖尿病、阿爾茨海默綜合征和系統(tǒng)性紅斑狼瘡等在內(nèi)的眾多人類疾病有著密切的關(guān)聯(lián),對(duì)DNA甲基化的研究在這些疾病的研究中占有重要的地位。
[0004]單倍體基因型,簡(jiǎn)稱單倍型,指在同一染色體上進(jìn)行共同遺傳的多個(gè)基因座上等位基因的組合,單倍型有時(shí)可指同一條染色體上所有基因組上等位基因組的組合,單倍型是上述遺傳差異的直接體現(xiàn)。由于大量的真核生物的基因組是雙倍體或多倍體,在同一生物個(gè)體內(nèi)存在兩條或多條同源染色體,這些同源染色體間核苷酸鏈的長(zhǎng)度、堿基的位置和排列順序相近。同一個(gè)體的兩條或多條染色體同源區(qū)域的甲基化情況往往并不一致,甚至同一個(gè)體不同組織、器官、細(xì)胞內(nèi)的染色體同源區(qū)域的甲基化情況也不一致。然而,要精細(xì)分析同一個(gè)體同源染色體的單倍型甲基化情況,以及同一個(gè)體不同組織、器官、細(xì)胞內(nèi)的染色體單倍型甲基化情況一直是一個(gè)技術(shù)難題。
[0005]在過去的若干年中,科學(xué)家們陸續(xù)開發(fā)出了多種的DNA甲基化檢測(cè)方法。這些方法主要可以分為三類:第一類是基于亞硫酸氫鹽轉(zhuǎn)化的檢測(cè)方法,亞硫酸氫鹽在一定的條件下可以將核酸鏈上未甲基化的胞嘧啶(C)去氨基變成尿嘧啶(U),而甲基化的胞嘧啶(mC)則由于甲基的存在不能被去氨基而保持不變,這一方法一直以來(lái)被認(rèn)為是最直接、最可靠的甲基化檢測(cè)方法;第二類是基于甲基化敏感性酶切的檢測(cè)方法,甲基化敏感性內(nèi)切酶酶切方法是通過DNA能否被甲基化敏感性內(nèi)切酶進(jìn)行酶切來(lái)判斷酶切位點(diǎn)的甲基化狀態(tài)。如果位點(diǎn)能夠被甲基化敏感性內(nèi)切酶酶切,則該位點(diǎn)并未發(fā)生及計(jì)劃,如果該位點(diǎn)能被對(duì)甲基化不敏感的同工酶酶切,而不能被甲基化敏感性酶酶切,則該位點(diǎn)發(fā)生甲基化;第三類是基于甲基化DNA免疫沉淀的檢測(cè)方法,甲基化免疫沉淀法是通過能夠識(shí)別甲基化DNA的蛋白或識(shí)別甲基化胞嘧啶的抗體,特異性的富集甲基化DNA片段,去除非甲基化的DNA片段,以便于后續(xù)的DNA甲基化的檢測(cè)。以上述的方案為基礎(chǔ),陸續(xù)出現(xiàn)了多種進(jìn)行基因組甲基化檢測(cè)方案,這就包括HPLC技術(shù)、全基因組限制性酶切掃描、高密度基因芯片以及高通量DNA測(cè)序技術(shù)。HPLC是第一個(gè)在全基因組范圍內(nèi)檢測(cè)甲基化的方法,該方法將基因組DNA裂解為堿基,通過色譜柱分離各種堿基后由紫外光測(cè)定各自的吸收峰并定量,從而計(jì)算出甲基化胞嘧啶在所有胞嘧啶中所占的比例。然而,HPLC僅僅只能評(píng)估基因組中甲基化胞嘧啶的含量水平,并不能分析各個(gè)基因位點(diǎn)甲基化的水平。之后出現(xiàn)的全基因組限制性酶切掃描技術(shù),通過甲基化敏感限制性內(nèi)切酶,獲得基因組DNA甲基化敏感性的酶切圖譜,這一方法的檢測(cè)能力較HPLC有所提升,可以在基因組水平構(gòu)建甲基化與酶切片段長(zhǎng)度的關(guān)聯(lián)體系,建立甲基化與基因的模糊關(guān)聯(lián)。高密度基因芯片技術(shù),通過不同的芯片方案設(shè)計(jì),可以分析基因組一些區(qū)域或一些位點(diǎn)的甲基化水平,實(shí)現(xiàn)了甲基化與基因的直接關(guān)聯(lián),盡管芯片的密度越來(lái)越高,依然無(wú)法覆蓋基因組中的所有位點(diǎn)。高通量DNA測(cè)序技術(shù)的出現(xiàn),為全基因組甲基化水平分析提供了更為有力的手段,通過亞硫酸氫鹽轉(zhuǎn)化后的DNA序列和未經(jīng)轉(zhuǎn)化的DNA序列的測(cè)定,可以分析基因組中絕大多數(shù)區(qū)域的甲基化情況。然而,由于目前的高通量測(cè)序技術(shù)的測(cè)序讀長(zhǎng)較短,基因組甲基化測(cè)序僅僅能展示樣本所包含的一系列同源染色體在各個(gè)位點(diǎn)的平均甲基化水平,并不能進(jìn)行長(zhǎng)片段的甲基化連鎖分析,更無(wú)法實(shí)現(xiàn)單倍體甲基化分析的。


【發(fā)明內(nèi)容】

[0006]發(fā)明目的:針對(duì)上述現(xiàn)有技術(shù)存在的問題,本發(fā)明的目的是提供一種對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔和擴(kuò)增操作構(gòu)建亞單倍型的轉(zhuǎn)化基因組,從而實(shí)現(xiàn)單倍體甲基化的高通量測(cè)序的方法。本發(fā)明有助于高通量測(cè)序在基因組甲基化單倍型研究中的應(yīng)用,為單倍體甲基化的研究提供了一個(gè)新的方法,具有方法簡(jiǎn)單、效率高的優(yōu)點(diǎn)。
[0007]本發(fā)明的目的就是通過對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔和擴(kuò)增操作構(gòu)建亞單倍型的轉(zhuǎn)化基因組,從而實(shí)現(xiàn)單倍體甲基化的高通量測(cè)序。本發(fā)明首先對(duì)基因組DNA進(jìn)行亞硫酸氫鹽的轉(zhuǎn)化,實(shí)現(xiàn)對(duì)甲基化的胞嘧啶和非甲基化的胞嘧啶的區(qū)分。隨后對(duì)轉(zhuǎn)化后的基因組進(jìn)行稀釋,取包含亞單倍體DNA質(zhì)量的轉(zhuǎn)化DNA用于構(gòu)建亞單倍型轉(zhuǎn)化文庫(kù),所謂亞單倍體DNA質(zhì)量是指DNA規(guī)模小于等于一個(gè)單倍體DNA總質(zhì)量。構(gòu)建的過程是首先對(duì)所取的DNA進(jìn)行擴(kuò)增以提高核酸的總量,隨后進(jìn)行常規(guī)的測(cè)序文庫(kù)構(gòu)建。分別獨(dú)立構(gòu)建一系列上述亞單倍型轉(zhuǎn)化文庫(kù)。每個(gè)文庫(kù)包含的核酸總質(zhì)量小于等于一個(gè)單倍體基因組,一系列亞單倍型轉(zhuǎn)化文庫(kù)的規(guī)模滿足高通量測(cè)序?qū)y(cè)序深度的要求。對(duì)所構(gòu)建的一系列亞單倍型轉(zhuǎn)化文庫(kù)進(jìn)行獨(dú)立測(cè)序或者編碼測(cè)序。根據(jù)本發(fā)明的設(shè)計(jì),在同一亞單倍型轉(zhuǎn)化文庫(kù)內(nèi),因?yàn)樵嫉腄NA規(guī)模小于等于一個(gè)單倍體基因組,所以多數(shù)轉(zhuǎn)化后的DNA片段沒有另外一條或多條含有相同等位基因的片段存在,因此每個(gè)獨(dú)立文庫(kù)內(nèi)可以比對(duì)、拼接出含有多個(gè)SNP (單堿基多態(tài)性)位點(diǎn)的片段長(zhǎng)度較長(zhǎng)的單倍型轉(zhuǎn)化片段,利用兩條染色體中不同的SNP位點(diǎn)對(duì)單倍型轉(zhuǎn)化片段進(jìn)行拼接,獲得長(zhǎng)度更長(zhǎng)的單倍型轉(zhuǎn)化片段乃至完整的單條染色體轉(zhuǎn)化序列。最后通過與未轉(zhuǎn)化序列的比較,確定全基因組單倍型甲基化情況。
[0008]技術(shù)方案:為實(shí)現(xiàn)上述目的,本發(fā)明通過下述技術(shù)方案實(shí)現(xiàn):基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔、擴(kuò)增后構(gòu)建一組轉(zhuǎn)化文庫(kù)并測(cè)序獲得基因組單倍型甲基化信息,具體步驟為:對(duì)提取的基因組DNA進(jìn)行亞硫酸氫鹽轉(zhuǎn)化后構(gòu)建一組轉(zhuǎn)化片段文庫(kù)并對(duì)每個(gè)文庫(kù)進(jìn)行擴(kuò)增,每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量DNA測(cè)序文庫(kù)并進(jìn)行測(cè)序,測(cè)序結(jié)果首先在每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)進(jìn)行序列比對(duì)或拼接,獲得長(zhǎng)轉(zhuǎn)化核酸序列后進(jìn)行跨轉(zhuǎn)化片段文庫(kù)的序列比對(duì)和拼接獲得轉(zhuǎn)化基因組單倍型信息,通過與未轉(zhuǎn)化的序列信息進(jìn)行比較實(shí)現(xiàn)利用高通量測(cè)序獲得基因組單倍型甲基化信息。
[0009]所述的亞硫酸氫鹽轉(zhuǎn)化是指利用亞硫酸氫鹽將核酸鏈上未甲基化的胞嘧啶去氨基變成尿嘧啶,而不改變甲基化的胞嘧啶。
[0010]所述的基因組DNA是由一個(gè)完整基因組構(gòu)成,或者一個(gè)完整基因組的一部分構(gòu)成,基因組DNA的含量是I個(gè)拷貝或者是多個(gè)拷貝。
[0011]所述的擴(kuò)增是指在基因組水平進(jìn)行的非特異性擴(kuò)增,采用聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增或采用聚合酶等溫?cái)U(kuò)增。
[0012]所述的轉(zhuǎn)化片段文庫(kù),每個(gè)轉(zhuǎn)化片段文庫(kù)中核酸片段的總長(zhǎng)度小于單倍體基因組DNA全長(zhǎng),每個(gè)片段文庫(kù)中一半以上的核酸片段彼此之間不包含等位區(qū)域。
[0013]所述的每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量DNA測(cè)序文庫(kù)并進(jìn)行測(cè)序,是每個(gè)轉(zhuǎn)化片段庫(kù)獨(dú)立構(gòu)建完全獨(dú)立的文庫(kù)并分別進(jìn)行測(cè)序,或者使用條碼技術(shù)基于多個(gè)轉(zhuǎn)化片段庫(kù)構(gòu)建編碼文庫(kù)進(jìn)行高通量測(cè)序。
[0014]所述的高通量測(cè)序是指通過核酸鏈的合成反應(yīng)、核酸的連接反應(yīng)、核酸的降解反應(yīng)或核酸鏈通過納米孔道大規(guī)模并行測(cè)定核酸序列信息。
[0015]所述的單倍型甲基化信息是一條完整的染色體或核酸鏈的單倍型甲基化信息,或者是一段較長(zhǎng)的核酸鏈的單倍型甲基化信息。
[0016]所述的序列比對(duì)和拼接是在有參考序列的幫助下進(jìn)行,或者在沒有參考序列的幫助下進(jìn)行。
[0017]本發(fā)明的一種對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔和擴(kuò)增等操作從而實(shí)現(xiàn)單倍體甲基化的高通量測(cè)序的方法,其技術(shù)原理可以表述如下:
[0018]提取來(lái)自多個(gè)拷貝的雙倍型或多倍型生物的基因組DNA,根據(jù)提取基因組DNA采用的技術(shù)流程的不同,提取的過程會(huì)導(dǎo)致基因組DNA斷成長(zhǎng)度從數(shù)千堿基至數(shù)百兆堿基不等的核酸片段。隨后使用亞硫酸氫鹽對(duì)提取的基因組DNA進(jìn)行操作,亞硫酸氫鹽在適當(dāng)?shù)臈l件下可使核酸鏈上未甲基化的胞嘧啶(C)去氨基變成尿嘧啶(U),而甲基化的胞嘧啶(mC)則由于甲基的存在不能被去氨基而保持不變,從而實(shí)現(xiàn)了對(duì)甲基化的胞嘧啶和非甲基化的胞嘧啶的區(qū)分。隨后將上述含有多個(gè)基因組拷貝的混合轉(zhuǎn)化片段分為一組轉(zhuǎn)化片段文庫(kù),每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)的核酸片段數(shù)量根據(jù)基因組倍型數(shù)量、基因組大小、核酸片段長(zhǎng)度、等位基因片段出現(xiàn)概率確定,以保證在同一轉(zhuǎn)化片段文庫(kù)中,多數(shù)片段之間不含有等位基因或等位序列。每個(gè)轉(zhuǎn)化片段文庫(kù)中全部片段的堿基總和,小于等于該樣本單倍型基因組堿基數(shù)的一半。由于每個(gè)轉(zhuǎn)化片段文庫(kù)中的堿基總數(shù)小于該樣本單倍型堿基數(shù)的一半,即每個(gè)轉(zhuǎn)化片段文庫(kù)中全部核酸片段能夠覆蓋基因組的總區(qū)域小于等于基因組全部區(qū)域的一半,根據(jù)隨機(jī)分布的原理,其中發(fā)生兩個(gè)或多個(gè)片段重疊覆蓋同一區(qū)域的概率較小,多數(shù)區(qū)域僅有唯一片段覆蓋,對(duì)這些區(qū)域的測(cè)序即獲得單倍體甲基化數(shù)據(jù)。這一分組過程將轉(zhuǎn)化后雙倍型或多倍型的基因組人工分隔成為一系列單倍型亞基因組規(guī)模文庫(kù)的組合。上述一系列亞單倍型轉(zhuǎn)化文庫(kù)的規(guī)模滿足高通量測(cè)序?qū)y(cè)序深度的要求。之后對(duì)每一個(gè)轉(zhuǎn)化片段文庫(kù)進(jìn)行擴(kuò)增,提高文庫(kù)中核酸序列總量,但不提高核酸序列覆蓋的總區(qū)域的廣度。對(duì)每一個(gè)擴(kuò)增后的轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量測(cè)序文庫(kù),并進(jìn)行高通量DNA測(cè)序。測(cè)序完成后,首先對(duì)每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)的測(cè)序閱讀(reads)與參考基因組序列進(jìn)行比對(duì)。由于每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)的測(cè)序閱讀(reads)來(lái)源于一系列長(zhǎng)核酸片段,因此比對(duì)后可以獲得一組長(zhǎng)度較長(zhǎng)的轉(zhuǎn)化單倍型片段。將不同的轉(zhuǎn)化片段文庫(kù)內(nèi)比對(duì)得出的較長(zhǎng)的單倍型片段進(jìn)行組裝,即可獲得完整的轉(zhuǎn)化單倍型基因組。最后通過與未轉(zhuǎn)化序列的比較,確定全基因組單倍型甲基化情況。
[0019]有益效果:相比與現(xiàn)有技術(shù),本發(fā)明的優(yōu)點(diǎn)如下:
[0020]1、本發(fā)明最大的優(yōu)點(diǎn)是實(shí)現(xiàn)了高通量分析基因組單倍型甲基化信息,通過轉(zhuǎn)化、稀釋和分隔等步驟,利用較短讀長(zhǎng)的高通量測(cè)序?qū)崿F(xiàn)長(zhǎng)片段基因組單倍型甲基化信息的判讀;
[0021]2、本發(fā)明的方法簡(jiǎn)單,操作簡(jiǎn)易,不需要額外增加特殊的儀器設(shè)備,所述過程均可通過成熟技術(shù)實(shí)現(xiàn);
[0022]3、本發(fā)明適用面廣,既適用于雜合度較低的雙倍型的人類基因組的單倍型甲基化分析,又適用于其他雜合度高或者多倍型的基因組的單倍型甲基化分析。

【專利附圖】

【附圖說明】
[0023]圖1是本發(fā)明的總體流程示意圖:提取獲得的基因組DNA經(jīng)過亞硫酸氫鹽轉(zhuǎn)化,未甲基化的胞嘧啶(C)去氨基變成尿嘧啶(U),甲基化的胞嘧啶保持不變。對(duì)來(lái)源于多個(gè)基因組拷貝的混合轉(zhuǎn)化片段進(jìn)行稀釋和分隔,形成一組轉(zhuǎn)化片段文庫(kù),由基因組倍型數(shù)量、基因組大小、核酸片段長(zhǎng)度、等位基因片段出現(xiàn)概率等因素確定每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)的核酸片段數(shù)量,以保證在同一轉(zhuǎn)化片段文庫(kù)中,多數(shù)片段之間不含有等位基因或等位序列。每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建測(cè)序文庫(kù)并分別測(cè)序,首先在每個(gè)樣本內(nèi)部比對(duì)和拼接以獲得較長(zhǎng)的轉(zhuǎn)化序列,再通過跨樣本的比對(duì)和拼接獲得轉(zhuǎn)化的單倍型信息。最后通過與未轉(zhuǎn)化序列的比較,確定全基因組單倍型甲基化情況;
[0024]圖2是本發(fā)明的詳細(xì)過程示意圖:①本發(fā)明測(cè)序的樣本為基因組DNA,基因組可以是雙倍型,也可以是多倍型,基因組DNA的拷貝數(shù)量可以是I個(gè),也可以是多個(gè),圖2中是3個(gè)拷貝的雙倍型基因組,用白色和黑色分別表示一對(duì)同源染色體,以CG作為示例表示可能存在的甲基化位點(diǎn)基因組DNA在提取的過程中受外力的作用形成一系列長(zhǎng)度較長(zhǎng)的核酸片段,示意圖中每條完整的核酸鏈被折斷為4條長(zhǎng)度較長(zhǎng)的核酸片段,共24條片段;③對(duì)提取獲得的基因組核酸長(zhǎng)片段進(jìn)行亞硫酸氫鹽轉(zhuǎn)化操作,其中未甲基化的胞嘧啶(C)去氨基變成尿嘧啶(U),甲基化的胞嘧啶保持不變,以區(qū)分甲基化的胞嘧啶和未甲基化的胞嘧啶;④對(duì)轉(zhuǎn)化后的基因組核酸長(zhǎng)片段進(jìn)行分組,每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)的核酸片段總長(zhǎng)度小于一個(gè)基因組的大小,步驟3中轉(zhuǎn)化所得的轉(zhuǎn)化核酸片段可以在本步驟被全部使用,也可以不被全部使用,示意圖中將全部24條較長(zhǎng)核酸片段分為12個(gè)轉(zhuǎn)化片段文庫(kù),每個(gè)片段文庫(kù)包含2條核酸片段。之后每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建測(cè)序文庫(kù)并分別測(cè)序,首先在每個(gè)樣本內(nèi)部比對(duì)和拼接以獲得較長(zhǎng)的轉(zhuǎn)化序列,再通過跨樣本的比對(duì)和拼接獲得轉(zhuǎn)化的單倍型信息。最后通過與未轉(zhuǎn)化序列的比較,確定全基因組單倍型甲基化情況。

【具體實(shí)施方式】
[0025]以下結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。
[0026]實(shí)施例1:
[0027]基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔、擴(kuò)增后構(gòu)建一組轉(zhuǎn)化文庫(kù)并測(cè)序獲得基因組單倍型甲基化信息,具體步驟為:對(duì)提取的基因組DNA進(jìn)行亞硫酸氫鹽轉(zhuǎn)化后構(gòu)建一組轉(zhuǎn)化片段文庫(kù)并對(duì)每個(gè)文庫(kù)進(jìn)行擴(kuò)增,每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量DNA測(cè)序文庫(kù)并進(jìn)行測(cè)序,測(cè)序結(jié)果首先在每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)進(jìn)行序列比對(duì)或拼接,獲得長(zhǎng)轉(zhuǎn)化核酸序列后進(jìn)行跨轉(zhuǎn)化片段文庫(kù)的序列比對(duì)和拼接獲得轉(zhuǎn)化基因組單倍型信息,通過與未轉(zhuǎn)化的序列信息進(jìn)行比較實(shí)現(xiàn)利用高通量測(cè)序獲得基因組單倍型甲基化信息。
[0028]所述的亞硫酸氫鹽轉(zhuǎn)化是指利用亞硫酸氫鹽將核酸鏈上未甲基化的胞嘧啶去氨基變成尿嘧啶,而不改變甲基化的胞嘧啶。
[0029]所述的基因組DNA是由一個(gè)完整基因組構(gòu)成,或者一個(gè)完整基因組的一部分構(gòu)成,基因組DNA的含量是I個(gè)拷貝或者是多個(gè)拷貝。
[0030]所述的擴(kuò)增是指在基因組水平進(jìn)行的非特異性擴(kuò)增,采用聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增或采用聚合酶等溫?cái)U(kuò)增。
[0031]所述的轉(zhuǎn)化片段文庫(kù),每個(gè)轉(zhuǎn)化片段文庫(kù)中核酸片段的總長(zhǎng)度小于單倍體基因組DNA全長(zhǎng),每個(gè)片段文庫(kù)中一半以上的核酸片段彼此之間不包含等位區(qū)域。
[0032]所述的每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量DNA測(cè)序文庫(kù)并進(jìn)行測(cè)序,是每個(gè)轉(zhuǎn)化片段庫(kù)獨(dú)立構(gòu)建完全獨(dú)立的文庫(kù)并分別進(jìn)行測(cè)序,或者使用條碼技術(shù)基于多個(gè)轉(zhuǎn)化片段庫(kù)構(gòu)建編碼文庫(kù)進(jìn)行高通量測(cè)序。
[0033]所述的高通量測(cè)序是指通過核酸鏈的合成反應(yīng)、核酸的連接反應(yīng)、核酸的降解反應(yīng)或核酸鏈通過納米孔道大規(guī)模并行測(cè)定核酸序列信息。
[0034]所述的單倍型甲基化信息是一條完整的染色體或核酸鏈的單倍型甲基化信息,或者是一段較長(zhǎng)的核酸鏈的單倍型甲基化信息。
[0035]所述的序列比對(duì)和拼接是在有參考序列的幫助下進(jìn)行,或者在沒有參考序列的幫助下進(jìn)行。
[0036]實(shí)施例2:基于轉(zhuǎn)化、稀釋擴(kuò)增文庫(kù)構(gòu)建方法進(jìn)行人類全基因組單倍型甲基化分析:
[0037]采用酚-氯仿法提取人類全基因組DNA,由于酚-氯仿法自身的特性,人類基因組會(huì)斷裂成為長(zhǎng)度約為30Kbp的核酸片段。隨后對(duì)提取的人類基因組DNA進(jìn)行亞硫酸氫鹽轉(zhuǎn)化,亞硫酸氫鹽可將核酸鏈上未甲基化的胞嘧啶(C)去氨基變成尿嘧啶(U),而甲基化的胞嘧啶(mC)則由于甲基的存在不能被去氨基而保持不變。
[0038]人類全基因組DNA的總長(zhǎng)度約為3Gbp,因此一個(gè)拷貝的人類基因組(即一個(gè)單倍體)包含約10萬(wàn)個(gè)上述長(zhǎng)約為30Kbp的核酸片段。每個(gè)堿基對(duì)的平均分子量為650,通過計(jì)算可知3Gbp核酸的絕對(duì)質(zhì)量約為3.24皮克(I皮克=10_12克),每I萬(wàn)個(gè)30Kbp的片段的絕對(duì)質(zhì)量為0.324皮克。轉(zhuǎn)化之后的片段盡管在GC含量上較普通序列有所差異,依然可以采用上述方法近似計(jì)算。
[0039]利用紫外分光光度計(jì)對(duì)轉(zhuǎn)化后的基因組DNA進(jìn)行定量,定量后對(duì)基因組DNA進(jìn)行梯度稀釋,隨后吸取100組轉(zhuǎn)化核酸片段,每組核酸片段的質(zhì)量為0.324皮克,由上述計(jì)算可知每組轉(zhuǎn)化核酸片段包含I萬(wàn)個(gè)30Kbp的轉(zhuǎn)化片段,這樣一組轉(zhuǎn)化核酸片段稱為一個(gè)轉(zhuǎn)化片段文庫(kù),共構(gòu)建100個(gè)轉(zhuǎn)化片段文庫(kù)。利用基于phi 29DNA聚合酶及隨機(jī)引物的多重鏈替換方法對(duì)每個(gè)片段文庫(kù)進(jìn)行獨(dú)立全基因組擴(kuò)增,以提高每個(gè)片段文庫(kù)中DNA鏈的數(shù)量及核酸的總質(zhì)量。之后,將每個(gè)片段文庫(kù)中的擴(kuò)增產(chǎn)物采用超聲的方法打斷成為長(zhǎng)約500bp的短片段,構(gòu)建配對(duì)末端(pair-end)文庫(kù),每個(gè)獨(dú)立的轉(zhuǎn)化片段文庫(kù)至少獲得4000萬(wàn)條長(zhǎng)度150merX2的核酸序列。
[0040]將這4000萬(wàn)條長(zhǎng)度為150merX2的核酸序列與人類基因組的參考序列進(jìn)行甲基化特異性比對(duì),比對(duì)過程對(duì)參考序列進(jìn)行亞硫酸氫鹽模擬處理,即在CpG位點(diǎn)容忍堿基C和堿基T的錯(cuò)配。由于這4000萬(wàn)條150merX2的序列來(lái)源于I萬(wàn)條30Kbp的轉(zhuǎn)化片段,因此比對(duì)過程中在基因組的大約I萬(wàn)個(gè)區(qū)域出現(xiàn)密集匹配,平均每個(gè)區(qū)域的覆蓋深度為40倍。經(jīng)過這一輪比對(duì),可以獲得大約I萬(wàn)條30Kbp左右的轉(zhuǎn)化核酸序列。尤為重要的是,I萬(wàn)條30Kbp轉(zhuǎn)化序列僅覆蓋人類基因組1/10的區(qū)域,雖然人是雙倍體,建庫(kù)時(shí)獲得的I萬(wàn)條片段彼此之間包含等位基因的平均概率小于1/10。因此這I萬(wàn)條30Kbp左右的轉(zhuǎn)化核酸序列中的90%的序列彼此之間不重疊,是單倍型轉(zhuǎn)化片段。
[0041]隨后將全部100個(gè)轉(zhuǎn)化片段文庫(kù)中的共1000萬(wàn)條30Kbp左右的轉(zhuǎn)化核酸序列在人類參考基因組的幫助下進(jìn)行轉(zhuǎn)化后的單倍型拼接。人的基因組中平均約600-1000bp就會(huì)出現(xiàn)一個(gè)SNP,因此雖然一個(gè)個(gè)體的兩套染色體相似程度很高,但來(lái)源于兩套染色體的長(zhǎng)度為30Kbp的同源片段之間,也會(huì)存在至少30個(gè)堿基的差異,加上兩條染色體之間甲基化水平的不一致帶來(lái)的轉(zhuǎn)化序列差異,30Kbp的同源轉(zhuǎn)化片段之間的差異超過30個(gè)堿基。因此拼接過程中可以基于兩套染色體進(jìn)行獨(dú)立的轉(zhuǎn)化單倍型拼接,100個(gè)片段文庫(kù)中可覆蓋整個(gè)單倍型基因組10倍,由此獲得兩套獨(dú)立的轉(zhuǎn)化基因組單倍型。通過與已知的未轉(zhuǎn)化序列進(jìn)行比較,即可獲得基因組單倍型甲基化信息。
【權(quán)利要求】
1.基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,對(duì)亞硫酸氫鹽轉(zhuǎn)化后的基因組DNA進(jìn)行稀釋、分隔、擴(kuò)增后構(gòu)建一組轉(zhuǎn)化文庫(kù)并測(cè)序獲得基因組單倍型甲基化信息,具體步驟為:對(duì)提取的基因組DNA進(jìn)行亞硫酸氫鹽轉(zhuǎn)化后構(gòu)建一組轉(zhuǎn)化片段文庫(kù)并對(duì)每個(gè)文庫(kù)進(jìn)行擴(kuò)增,每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量DNA測(cè)序文庫(kù)并進(jìn)行測(cè)序,測(cè)序結(jié)果首先在每個(gè)轉(zhuǎn)化片段文庫(kù)內(nèi)進(jìn)行序列比對(duì)或拼接,獲得長(zhǎng)轉(zhuǎn)化核酸序列后進(jìn)行跨轉(zhuǎn)化片段文庫(kù)的序列比對(duì)和拼接獲得轉(zhuǎn)化基因組單倍型信息,通過與未轉(zhuǎn)化的序列信息進(jìn)行比較實(shí)現(xiàn)利用高通量測(cè)序獲得基因組單倍型甲基化信息。
2.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的亞硫酸氫鹽轉(zhuǎn)化是指利用亞硫酸氫鹽將核酸鏈上未甲基化的胞嘧啶去氨基變成尿嘧啶,而不改變甲基化的胞嘧啶。
3.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的基因組DNA是由一個(gè)完整基因組構(gòu)成,或者一個(gè)完整基因組的一部分構(gòu)成,基因組DNA的含量是I個(gè)拷貝或者是多個(gè)拷貝。
4.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的擴(kuò)增是指在基因組水平進(jìn)行的非特異性擴(kuò)增,采用聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增或采用聚合酶等溫?cái)U(kuò)增。
5.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的轉(zhuǎn)化片段文庫(kù),每個(gè)轉(zhuǎn)化片段文庫(kù)中核酸片段的總長(zhǎng)度小于單倍體基因組DNA全長(zhǎng),每個(gè)片段文庫(kù)中一半以上的核酸片段彼此之間不包含等位區(qū)域。
6.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的每個(gè)轉(zhuǎn)化片段文庫(kù)獨(dú)立構(gòu)建高通量DNA測(cè)序文庫(kù)并進(jìn)行測(cè)序,是每個(gè)轉(zhuǎn)化片段庫(kù)獨(dú)立構(gòu)建完全獨(dú)立的文庫(kù)并分別進(jìn)行測(cè)序,或者使用條碼技術(shù)基于多個(gè)轉(zhuǎn)化片段庫(kù)構(gòu)建編碼文庫(kù)進(jìn)行高通量測(cè)序。
7.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的高通量測(cè)序是指通過核酸鏈的合成反應(yīng)、核酸的連接反應(yīng)、核酸的降解反應(yīng)或核酸鏈通過納米孔道大規(guī)模并行測(cè)定核酸序列信息。
8.根據(jù)權(quán)利要求1所述的基于高通量測(cè)序的基因組單倍型甲基化檢測(cè)方法,其特征在于,所述的單倍型甲基化信息是一條完整的染色體或核酸鏈的單倍型甲基化信息,或者是一段較長(zhǎng)的核酸鏈的單倍型甲基化信息。
【文檔編號(hào)】C12Q1/68GK104328183SQ201410606032
【公開日】2015年2月4日 申請(qǐng)日期:2014年10月30日 優(yōu)先權(quán)日:2014年10月30日
【發(fā)明者】涂景, 陸祖宏, 姚貝, 李俊吉, 郭靖, 高珅 申請(qǐng)人:東南大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
孝感市| 菏泽市| 兴化市| 民乐县| 抚宁县| 澄江县| 利辛县| 灵宝市| 馆陶县| 贺兰县| 南丰县| 东平县| 安徽省| 泗水县| 电白县| 通江县| 玉林市| 浮梁县| 清新县| 龙泉市| 濮阳县| 开原市| 黔江区| 济阳县| 清流县| 沙洋县| 宜州市| 滦南县| 西盟| 静乐县| 辽宁省| 吴桥县| 巩留县| 垫江县| 武山县| 绥棱县| 黔江区| 安西县| 秭归县| 丹凤县| 社旗县|