專利名稱:全基因組甲基化高通量測序文庫的構(gòu)建方法及其應用的制作方法
技術(shù)領域:
本發(fā)明涉及生物技術(shù)領域。具體地,涉及全基因組甲基化檢測技術(shù),特別是微量DNA全基因組甲基化檢測技術(shù)領域。更具體地,本發(fā)明提供了一種構(gòu)建全基因組甲基化高通量測序文庫的方法、一種確定基因組DNA樣品的甲基化位點的方法、一種用于確定基因組DNA樣品的甲基化位點的裝置、一組分離的限制性內(nèi)切酶以及一種用于構(gòu)建全基因組甲基化高通量測序文庫的試劑盒。
背景技術(shù):
DNA甲基化是研究最為深入的表觀遺傳學機制,DNA甲基化在維持正常細胞功能、抑制寄生DNA成分對基因組完整性的損害、染色質(zhì)結(jié)構(gòu)修飾、X染色體失活、基因組印跡、胚胎發(fā)育以及人類腫瘤發(fā)生中起著重要作用,是目前新的研究熱點之一。然而,目前對全基因組DNA甲基化的研究仍有待改進。
發(fā)明內(nèi)容
本發(fā)明是基于發(fā)明人的下列發(fā)現(xiàn)完成的:減少的代表性重亞硫酸鹽測序(RRBS)(參見Smith ZD等人,2009.在哺乳動物基因組中高通量重亞硫酸鹽測序(High-throughput bisulfite sequencing in mammaliangenomes)Methods.48:226-232.,通過參照將其全文并入本文),是目前常用的全基因組甲基化檢測方法,其可以檢測人類和 鼠基因組中大部分的CpG島和啟動子區(qū)域。然而,越來越多的研究顯示差異甲基化區(qū)域(DMRs)如組織特異性差異甲基化區(qū)域(T-DMR)和癌癥中的差異甲基化區(qū)域(C-DMR)并非僅僅位于CpG島內(nèi),更多的甲基化差異區(qū)域位于CpG島外,如CpG島外(CGIshores)來調(diào)控基因的表達,而這些區(qū)域是現(xiàn)有RRBS技術(shù)不足以檢測到的。另一方面,現(xiàn)有RRBS技術(shù)對島內(nèi)CG數(shù)量的覆蓋度低。本發(fā)明旨在解決現(xiàn)有技術(shù)問題的至少之一。由此,為了檢測基因組中更多具有代表性區(qū)域的甲基化狀態(tài)并更真實的反應這些區(qū)域的甲基化水平,本發(fā)明提供了全基因組甲基化高通量測序文庫的構(gòu)建方法及其應用。根據(jù)本發(fā)明的一個方面,本發(fā)明提供了一種構(gòu)建全基因組甲基化高通量測序文庫的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切,以便獲得DNA片段,其中,所述第二限制性內(nèi)切酶為選自BstN 1、HpyCH4V、Alu I,Hae II1、HpyCH4 II,Apek I,Ban I1、Taqa1、Sph I,Bgl II,BssS I,BamH I 和 KpnI的至少一種;將所述DNA片段進行末端修復,以便獲得經(jīng)過末端修復的DNA片段;在所述經(jīng)過末端修復的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段;將所述具有粘性末端A的DNA片段與甲基化接頭相連,以便獲得具有甲基化接頭的連接產(chǎn)物;將所述具有甲基化接頭的連接產(chǎn)物進行片段選擇,以便獲得目的片段;將所述目的片段進行重亞硫酸鹽處理,以便將所述目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶,獲得經(jīng)過轉(zhuǎn)換的目的片段;將所述經(jīng)過轉(zhuǎn)換的目的片段進行PCR擴增,以便獲得擴增產(chǎn)物;以及分離純化所述擴增產(chǎn)物,所述擴增產(chǎn)物構(gòu)成全基因組甲基化高通量測序文庫。利用根據(jù)本發(fā)明實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法,能夠有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫,特別是能夠有效地構(gòu)建微量樣本的全基因組甲基化高通量測序文庫,從而能夠有效、充分地應用于高通量測序技術(shù),通過對文庫的測序,然后基于對測序結(jié)果的數(shù)據(jù)分析,就能夠有效地獲得全基因組甲基化位點信息,實現(xiàn)對基因組DNA樣品的全基因組甲基化檢測。根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種確定基因組DNA樣品的甲基化位點的方法。根據(jù)本發(fā)明的實施例,該方法包括下列步驟:根據(jù)前面所述構(gòu)建全基因組甲基化高通量測序文庫的方法,構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫;對該全基因組甲基化高通量測序文庫進行測序,以便得到測序結(jié)果;以及對測序結(jié)果進行數(shù)據(jù)分析,以便確定基因組DNA樣品的甲基化位點。利用根據(jù)本發(fā)明實施例的確定基因組DNA樣品的甲基化位點的方法,能夠準確地確定基因組DNA樣品的甲基化位點,從而實現(xiàn)對基因組DNA樣品的全基因組甲基化檢測,相對于目前的RRBS技術(shù),本發(fā)明的確定基因組DNA樣品的甲基化位點的方法,對全基因組的調(diào)控區(qū)域的覆蓋廣度得到顯著提高,對調(diào)控區(qū)域內(nèi)CpG位點的覆蓋量顯著增加。根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種用于確定基因組DNA樣品的甲基化位點的裝置。根據(jù)本發(fā)明的實施例,該裝置包括:文庫制備單元,所述文庫制備單元用于制備基因組DNA樣品的全基因組甲基化高通量測序文庫,所述文庫制備單元內(nèi)設置有Msp I酶以及第二限制性內(nèi)切酶,其中,所述第二限制性內(nèi)切酶為選自BstN 1、HpyCH4 V、Alu I,Hae
II1、HpyCH4 I1、Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS 1、BamH I 和 Kpn I 的至少一種;測序單元,所述測序單元與所述文庫制備單元相連,并且從所述文庫制備單元接收所述基因組DNA樣品的全基因組甲基化高通量測序文庫,以便用于對所述基因組DNA樣品的全基因組甲基化高通量測 序文庫進行測序,獲得測序結(jié)果;以及數(shù)據(jù)分析單元,所述數(shù)據(jù)分析單元與所述測序單元相連,并且從所述測序單元接收所述測序結(jié)果,以便對所述測序結(jié)果進行數(shù)據(jù)分析,確定所述基因組DNA樣品的甲基化位點。利用根據(jù)本發(fā)明實施例的用于確定基因組DNA樣品的甲基化位點的裝置,能夠方便準確地確定基因組DNA樣品的甲基化位點,可以應用于多種針對全基因組甲基化的研究,例如可以用于對人的腫瘤基因抑制基因的甲基化異常的檢測,以便為人類疾病的早期診斷提供有效的途徑。根據(jù)本發(fā)明的又一方面,本發(fā)明提供了一組分離的限制性內(nèi)切酶。根據(jù)本發(fā)明的實施例,其由Msp I酶以及第二限制性內(nèi)切酶構(gòu)成,其中,所述第二限制性內(nèi)切酶為選自BstN 1、HpyCH4 V、Alu 1、Hae II1、HpyCH4 I1、Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS 1、BamHI和Kpn I的至少一種。根據(jù)本發(fā)明實施例的Msp I酶和第二限制性內(nèi)切酶構(gòu)成的組合,能夠有效地對基因組DNA進行酶切,且酶切獲得的DNA片段非常適用于本發(fā)明的構(gòu)建全基因組甲基化高通量測序文庫的方法。根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種用于構(gòu)建全基因組甲基化高通量測序文庫的試劑盒。根據(jù)本發(fā)明的實施例,該試劑盒包括:Msp I酶,以及第二限制性內(nèi)切酶,其中,所述第二限制性內(nèi)切酶為選自 BstN 1、HpyCH4 V,Alu I,Hae II1、HpyCH4 II,Apek 1、BanI1、Taq a 1、Sph 1、Bgl I1、BssS I>BamH I和Kpn I的至少一種。利用根據(jù)本發(fā)明實施例的用于構(gòu)建全基因組甲基化高通量測序文庫的試劑盒,能夠方便有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫。本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變得明顯和容易理解,其中:圖1:顯示了根據(jù)本發(fā)明一個實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法的流程示意圖;圖2:顯示了根據(jù)本發(fā)明一個實施例的針對不同長度目的片段所構(gòu)建全基因組甲基化高通量測序文庫的安捷倫2100檢測結(jié)果。A:顯示了根據(jù)本發(fā)明一個實施例的目的片段長度為160bp以上,且小于240bp的全基因組甲基化高通量測序文庫的安捷倫2100檢測結(jié)果。B:顯示了根據(jù)本發(fā)明一個實施例的目的片段長度為240bp以上,且小于340bp的全基因組甲基化高通量測序文庫的安捷倫2100檢測結(jié)果。C:顯示了根據(jù)本發(fā)明一個實施例的目的片段長度為340bp以上,且420bp以下的全基因組甲基化高通量測序文庫的安捷倫2100檢測結(jié)果。D:顯示了根據(jù)本發(fā)明一個實施例的目的片段長度為160bp_420bp的全基因組甲基化高通量測序文庫的安捷倫2100檢測結(jié)果。圖3:顯示了根據(jù) 本發(fā)明一個實施例的用于確定基因組DNA樣品的甲基化位點的裝置的示意圖。
具體實施例方式下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。構(gòu)建全基因組甲基化高通量測序文庫的方法根據(jù)本發(fā)明的一個方面,本發(fā)明提供了一種構(gòu)建全基因組甲基化高通量測序文庫的方法。參考圖1,根據(jù)本發(fā)明的實施例,該方法包括以下步驟:用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切,以便獲得DNA片段;將DNA片段進行末端修復,以便獲得經(jīng)過末端修復的DNA片段;在經(jīng)過末端修復的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段;將具有粘性末端A的DNA片段與甲基化接頭相連,以便獲得具有甲基化接頭的連接產(chǎn)物;將具有甲基化接頭的連接產(chǎn)物進行片段選擇,以便獲得目的片段;將目的片段進行重亞硫酸鹽處理,以便將目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶,獲得經(jīng)過轉(zhuǎn)換的目的片段;將經(jīng)過轉(zhuǎn)換的目的片段進行PCR擴增,以便獲得擴增產(chǎn)物;以及分離純化擴增產(chǎn)物,所得到的擴增產(chǎn)物構(gòu)成全基因組甲基化高通量測序文庫。在本發(fā)明中所使用的術(shù)語“DNA”可以是任何包含脫氧核糖核苷酸的聚合物,包括但不限于經(jīng)過修飾的或者未經(jīng)修飾的DNA。本領域的技術(shù)人員可以理解,基因組DNA的來源不受特別限制,可以從任何可能的途徑獲得,可以是通過市售直接獲得,也可以是從其他實驗室直接獲取,還可以是直接從樣本中提取。根據(jù)本發(fā)明的實施例,可以從樣本中提取獲得基因組DNA。根據(jù)本發(fā)明的一個實施例,構(gòu)建全基因組甲基化高通量測序文庫的方法可以進一步包括從樣本中提取基因組DNA的步驟。根據(jù)本發(fā)明的一些具體示例,樣本可以來源于哺乳動物、植物、和微生物的至少一種。根據(jù)本發(fā)明的一些實施例,哺乳動物可以為人和小鼠的至少一種。根據(jù)本發(fā)明的一個實施例,基因組DNA可以為人類全血基因組DNA。發(fā)明人發(fā)現(xiàn),當采用人類全血基因組DNA構(gòu)建全基因組甲基化高通量測序文庫時,從樣本中提取基因組DNA的操作方便易行,且獲得的DNA質(zhì)量好、甲基化信息完整,由其構(gòu)建的文庫能夠方便地應用于高通量測序技術(shù),從而基于對測序結(jié)果的數(shù)據(jù)分析就能方便有效地獲得樣本的全基因組甲基化信息。根據(jù)本發(fā)明的實施例,基因組DNA的量不受特別限制,根據(jù)本發(fā)明的具體示例,優(yōu)選基因組DNA的量為150-200ng,更優(yōu)選為lOOng。發(fā)明人驚奇地發(fā)現(xiàn),當基因組DNA的量為IOOng時,根據(jù)本發(fā)明實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法構(gòu)建的文庫,能夠非常方便地應用于高通量測序技術(shù),如Solexa測序技術(shù),且文庫測序結(jié)果準確,可重復性好,包含甲基化信息完整、CpG位點覆蓋多。另外,需要說明的是,根據(jù)本發(fā)明實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法中用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切的步驟,是本申請的發(fā)明人經(jīng)過艱苦的研究和創(chuàng)造性勞動而意外獲得的。在本文中所使用的術(shù)語“第二限制性內(nèi)切酶”的含義是指與Msp I不同的限制性內(nèi)切酶。根據(jù)本發(fā)明的實施例,可以采用的第二限制性內(nèi)切酶的含義為選自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11, Apek I, Ban II,Taqa I,Sph 1、Bgl I1、BssS 1、BamH I和Kpn I的至少一種。根據(jù)本發(fā)明的具體示例,優(yōu)選采用ApeK I作為第二限制性內(nèi) 切酶。這些限制性內(nèi)切酶均為已知的,并且其最佳酶切條件以及識別位點也都是已知的。例如,限制性內(nèi)切酶Msp I和ApeK I的識別位點分別為CCGG和GCWGC(其中W表示堿基A或T)。發(fā)明人發(fā)現(xiàn),當采用Msp I和上述第二限制性內(nèi)切酶組合對基因組DNA進行酶切時,酶切所得的DNA片段對基因組調(diào)控區(qū)域的覆蓋情況非常好,具體地,Msp I和ApeK I結(jié)合酶切與RRBS技術(shù)中的Msp I單酶切相比,理論上可檢測到CpG島內(nèi)的CpG位點數(shù)由不足50%提高到近70%。發(fā)明人發(fā)現(xiàn),通過Msp I和上述第二限制性內(nèi)切酶對基因組DNA進行酶切,然后進行全基因甲基化高通量測序文庫構(gòu)建以及后續(xù)的全基因組甲基化位點的確定,能夠?qū)崿F(xiàn)對甲基化區(qū)域的有效檢測,尤其是現(xiàn)有RRBS技術(shù)無法檢測到的區(qū)域例如大于70%的組織特異性差異的甲基化區(qū)域(T-DMR)和癌癥中的差異甲基化區(qū)域(C-DMR),由此檢測范圍得到顯著擴大并且可覆蓋更多的CpG位點,具有廣闊的應用前景。根據(jù)本發(fā)明的實施例,使用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切時,限制性內(nèi)切酶對基因組DNA進行處理的先后順序不受特別限制,可以依次進行,也可以同時進行。以Msp I和ApeK I的組合為例,根據(jù)本發(fā)明的具體示例,可以首先使用Msp I進行酶切處理,然后再使用ApeK I進行酶切處理。發(fā)明人驚奇地發(fā)現(xiàn),當采用這種酶切順序進行酶切處理時,能夠有效地對基因組DNA進行酶切處理,并且在完成Msp I對基因組DNA的酶切處理后,不需要純化酶切產(chǎn)物,只需要對限制性內(nèi)切酶進行失活處理,即可以添加ApeKI,進行酶切。根據(jù)本發(fā)明的一個實施例,在使用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切時,可以添加對照樣品,以驗證方法的有效性。根據(jù)本發(fā)明的實施例,對照樣品可以為序列已知且與樣品基因組DNA來源不同的任何DNA。具體地,優(yōu)選采用λ-DNA,因為λ-DNA的序列信息已知,且其核苷酸序列中不存在甲基化位點。由此,能夠更加精確地評估文庫構(gòu)建過程重亞硫酸鹽的轉(zhuǎn)換效率,以便提高檢測樣本的應用范圍和檢測可信度。具體地,根據(jù)以Msp I和Apek I的組合為例,本發(fā)明的一個實施例,發(fā)明人利用Msp I和Apek I酶切l(wèi)ambda基因組DNA( λ-DNA),選取同樣大小范圍的片段(40_300bp)與人類基因組hgl9比對,結(jié)果顯示所有選取范圍內(nèi)的λ-DNA片段均不會比回到人類基因組上。進一步,發(fā)明人使用IOOng的成熟樹突狀細胞(mDC)基因組,同時混入50pg完整的λ -DNA共同酶切建庫,計算證明建庫過程重亞硫酸鹽轉(zhuǎn)換率約為99%,確定了其作為參照評估重亞硫酸鹽轉(zhuǎn)換效率的精確性。目前已知干細胞等相關(guān)細胞中存在大量非CpG位點上的甲基化修飾,因此,不能按照基因組本身單個C堿基(非CG 二核苷酸處的C堿基)的甲基化狀態(tài)來計算重亞硫酸鹽處理的轉(zhuǎn)換率。根據(jù)本發(fā)明的實施例,發(fā)明人通過將未甲基化的λ-DNA引入建庫和測序過程,可更加精確的評估不同實驗樣本的檢測準確性,為實驗數(shù)據(jù)可信性的判定提供了重要依據(jù)。此外,根據(jù)本發(fā)明的實施例,與基因組DNA混合的λ-DNA的量不受特別限制。根據(jù)本發(fā)明的一些具體示例,可以添加極微量的λ-DNA與基因組DNA混合,本領域的技術(shù)人員可以理解,這里所使用的術(shù)語“極微量”是相對而言,是指與基因組DNA的量相比,混合的λ-DNA的量非常少,不會干擾基因組DNA的酶切及其后續(xù)的建庫過程?;蚪MDNA和λ -DNA的添加量可以不是一個數(shù)量級,例如IOOng基因組DNA中,可以混合30_100pg的λ-DNA。發(fā)明人發(fā)現(xiàn),皮克級的未甲基化λ-DNA的混合,就能夠?qū)崿F(xiàn)其參照作用,即能夠精確地評估文庫構(gòu)建過程中重亞硫酸鹽的轉(zhuǎn)換效率。根據(jù)本發(fā)明的具體示例,優(yōu)選地,IOOng基因組DNA中混合50pg的λ -DNA,由此既能精確評估重亞硫酸鹽的轉(zhuǎn)換效率,還能有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫,且該文庫能有效地用于后續(xù)的全基因族甲基化檢測中,檢測到的甲基化區(qū)域廣、CpG為點多。根據(jù)本發(fā)明的一個實施例,在將DNA片段進行末端修復前,可以進一步包括純化DNA片段的步驟,由此,使得后續(xù)的末端修復易于進行。根據(jù)本發(fā)明的實施例,將DNA片段進行末端修復可以利用Klenow片 段、T4DNA聚合酶和T4多核苷酸激酶進行,其中,所述Klenow片段具有5’ 一 3’聚合酶活性和3’ 一 5’聚合酶活性,但缺少5’ 一 3’外切酶活性。由此,能夠方便準確地對DNA片段進行末端修復。根據(jù)本發(fā)明的一個實施例,可以利用Klenow(3’ _5’ exo_),即具有3’ 一 5’外切酶活性的Klenow,在經(jīng)過末端修復的DNA片段的3’末端添加堿基A。由此,能夠方便準確地將堿基A添加到經(jīng)過末端修復的DNA片段的3’末端。本發(fā)明中所使用的術(shù)語“甲基化接頭”是指這樣的一種接頭,在其核苷酸序列中,所有C位點均被甲基化修飾。根據(jù)本發(fā)明的一個實施例,在將具有粘性末端A的DNA片段與甲基化接頭相連前,可以進一步包括對常規(guī)測序所使用的接頭進行甲基化的步驟。由此,能夠避免測序接頭對后續(xù)重亞硫酸鹽處理等操作的干擾。本領域的技術(shù)人員可以理解,對接頭進行甲基化的方法不受特別限制,可以利用本領域已知的任何方法對測序接頭進行甲基化。根據(jù)本發(fā)明的一些實施例,甲基化接頭中還可以進一步包含標簽,由此可以方便地同時構(gòu)建多種基因組DNA樣品的全基因組甲基化高通量測序文庫,并能夠有效地應用于高通量測序平臺,從而在對測序結(jié)果進行數(shù)據(jù)分析后,基于標簽的序列信息,就能夠準確地區(qū)分多種基因組DNA樣品的文庫的序列信息以及全基因組甲基化位點的信息,由此,能夠充分地利用高通量測序平臺,且能夠節(jié)省時間、降低成本。根據(jù)本發(fā)明的一個實施例,將具有粘性末端A的DNA片段與甲基化接頭相連是利用T4 DNA連接酶進行的,由此可以方便地獲得具有甲基化接頭的連接產(chǎn)物。根據(jù)本發(fā)明的實施例,將具有甲基化接頭的連接產(chǎn)物進行片段選擇,是通過2%的瓊脂糖凝膠電泳進行的。根據(jù)本發(fā)明的實施例,通過2 %的瓊脂糖凝膠電泳對具有甲基化接頭的連接產(chǎn)物進行片段選擇后,還可以對獲得的目的片段進行純化回收,以便使后續(xù)的實驗易于進行。根據(jù)本發(fā)明的一些具體示例,將具有甲基化接頭的連接產(chǎn)物進行片段選擇,獲得的目的片段的長度為160-420bp。根據(jù)本發(fā)明的一個實施例,目的片段的長度可以為160以上,且小于240bp。根據(jù)本發(fā)明的另一個實施例,目的片段的長度可以為240以上,且小于340bp。根據(jù)本發(fā)明的又一個實施例,目的片段的長度可以為340以上,且420bp以下。發(fā)明人發(fā)現(xiàn),當目的片段的長度為160-420bp時,構(gòu)建的樣品的全基因組甲基化高通量測序文庫,能夠方便有效地應用于高通量測序平臺如Solexa測序平臺,且可重復性好,測序結(jié)果真實可靠,包含基因組甲基化信息完整、CpG位點覆蓋多。根據(jù)本發(fā)明的一些具體示例,在將目的片段進行重亞硫酸鹽處理之前,可以將目的片段與片段化的λ-DNA混合。發(fā)明人發(fā)現(xiàn),通過添加外源DNAU-DNA),即將目的片段與外源DNA混合,然后進行重亞硫酸鹽高效共處理,對目標DNA片段能夠起到保護作用,最大限度地降低重亞硫酸鹽對微量DNA的破壞,可以進一步提高檢測精度,使得納克級,例如50-150ng基因組整體水平高精度的甲基化檢測成為現(xiàn)實。根據(jù)本發(fā)明的實施例,片段化的λ -DNA的添加量不受特別限制,根據(jù)具體的示例,優(yōu)選片段化的λ -DNA的量為100-500ng,更優(yōu)選為200ng。本領域技術(shù)人員能夠理解,可以通過本領域已知的任意方法制備這些片段化的λ -DNA,例如可以隨同前面的DNA片段化處理一起進行制備。此外,將目的片段進 行重亞硫酸鹽處理,可以通過本領域已知的任何方法進行,根據(jù)本發(fā)明的具體示例,可以采用商品化的試劑盒進行,優(yōu)選地采用EZ DNAMethylation-Gold KitTM(ZYMO)進行。發(fā)明人驚奇地發(fā)現(xiàn),米用 EZ DNA Methylation-GoldKitTM(ZYMO)對目的片段進行重亞硫酸鹽處理時,方便快捷,且處理效果好,目的片段中非甲基化的胞嘧啶能夠高效準確地轉(zhuǎn)換為尿嘧啶,并且利于后續(xù)處理。根據(jù)本發(fā)明的實施例,可以使用熱啟動taq DNA聚合酶對經(jīng)過轉(zhuǎn)換的目的片段進行PCR擴增。根據(jù)本發(fā)明的實施例,熱啟動taq DNA聚合酶的種類不受特別限制,根據(jù)本發(fā)明的具體示例,熱啟動taq DNA聚合酶可以為r-taq聚合酶,由此PCR擴增效率高、用時少。根據(jù)本發(fā)明的實施例,可以基于目的片段的長度,確定PCR擴增的循環(huán)數(shù)。具體地,當目的片段的長度為160bp以上,且小于240bp時,PCR擴增的循環(huán)數(shù)可以為11 ;當目的片段的長度為240bp以上,且小于340bp時,PCR擴增的循環(huán)數(shù)可以為13 ;以及當目的片段的長度為340bp以上,且420bp以下時,PCR擴增的循環(huán)數(shù)可以為15。發(fā)明人驚奇地發(fā)現(xiàn),當采用上述方法確定PCR擴增的循環(huán)數(shù)時,PCR擴增效率高、用時少,擴增效果都非常好。在為對目的片段長度進行細分的情況下,如果目的片段的長度在160-420bp的范圍內(nèi),PCR擴增的循環(huán)數(shù)可以為13,發(fā)明人發(fā)現(xiàn)仍然可以實現(xiàn)較好的擴增效果。根據(jù)本發(fā)明的實施例,分離純化擴增產(chǎn)物的方法不受特別限制,根據(jù)本發(fā)明的具體示例,可以通過選自磁珠純化、純化柱純化和2%的瓊脂糖凝膠電泳的至少一種進行,優(yōu)選通過2%的瓊脂糖凝膠電泳進行。利用根據(jù)本發(fā)明實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法,能夠有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫,特別是能夠有效地構(gòu)建微量樣本的全基因組甲基化高通量測序文庫,從而能夠有效、充分地應用于高通量測序技術(shù),通過對文庫的測序,然后基于對測序結(jié)果的數(shù)據(jù)分析,就能夠有效地獲得全基因組甲基化位點信息,實現(xiàn)對基因組DNA樣品的全基因組甲基化檢測。確定基因組DNA樣品的甲基化位點的方法和裝置根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種確定基因組DNA樣品的甲基化位點的方法。根據(jù)本發(fā)明的實施例,該方法包括下列步驟:根據(jù)本發(fā)明實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫;對該全基因組甲基化高通量測序文庫進行測序,以便得到測序結(jié)果;以及對測序結(jié)果進行數(shù)據(jù)分析,以便確定基因組DNA樣品的甲基化位點。根據(jù)本發(fā)明的一些實施例,測序是利用高通量測序技術(shù)進行的。本領域的技術(shù)人員可以理解,可以通過本領域已知的任何高通量測序技術(shù)進行測序,根據(jù)本發(fā)明的具體示例,優(yōu)選地采用Solexa測序平臺進行測序。發(fā)明人發(fā)現(xiàn),采用Solexa測序平臺對基因組DNA樣品的全基因組甲基化高通量測序文庫進行測序,能夠有效地獲得測序結(jié)果,且測序用時少、效率高、測序結(jié)果準確,可重復性好。利用根據(jù)本發(fā)明實施例的確定基因組DNA樣品的甲基化位點的方法,能夠有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫,并且能夠通過高通量測序技術(shù)如Solexa測序技術(shù)實現(xiàn)對文庫的準確測序,基于對測序結(jié)果的數(shù)據(jù)分析,就能夠準確地確定基因組DNA樣品的甲基化位點,從而實現(xiàn)對基因組DNA樣品的全基因組甲基化檢測,相對于目前的RRBS技術(shù),根據(jù)本發(fā)明實施例的確定基因組DNA樣品的甲基化位點的方法,全基因組的調(diào)控區(qū)域的覆蓋廣度得到顯著提高,使得調(diào)控區(qū)域內(nèi)CpG位點的覆蓋量顯著增加。
根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種用于確定基因組DNA樣品的甲基化位點的裝置1000。參考圖3,根據(jù)本發(fā)明的一個實施例,該裝置包括:文庫制備單元100、測序單元200以及數(shù)據(jù)分析單元300。根據(jù)本發(fā)明的實施例,文庫制備單元100用于制備基因組DNA樣品的全基因組甲基化高通量測序文庫,其中,文庫制備單元100內(nèi)設置有限制性內(nèi)切酶Msp I和第二限制性內(nèi)切酶。根據(jù)本發(fā)明的實施例第二限制性內(nèi)切酶為選自BstN 1、HpyCH4 V、Alu I,Hae II1、HpyCH4II> Apek I> Ban I1、Taqa1、Sph 1、Bgl I1、BssS I > BamH I 和 Kpn I 的至少一種,優(yōu)選所述第二限制性內(nèi)切酶為Apek I。關(guān)于第二限制性內(nèi)切酶,在前面已經(jīng)進行了詳細描述,不再贅述。由此,文庫制備單元100可以適于實施前面所述的全基因組甲基化高通量測序文庫構(gòu)建方法。測序單元200與文庫制備單元100相連,可以從文庫制備單元100接收所制備的全基因組甲基化高通量測序文庫,并對所接收的全基因組甲基化高通量測序文庫進行測序,從而可以獲得測序結(jié)果。數(shù)據(jù)分析單元300與測序單元200相連,可以從測序單元200接收所獲得的測序結(jié)果,并且能夠進一步對測序結(jié)果進行數(shù)據(jù)分析,從而基于分析結(jié)果確定基因組DNA樣品的甲基化位點,最終實現(xiàn)對基因組DNA樣品的全基因組甲基化檢測。本領域技術(shù)人員能夠理解的是,可以采用本領域中已知的任何適于進行上述操作的裝置作為上述各個單元的組成部件。在本文中所使用的術(shù)語“相連”應作廣義理解,可以是直接相連,也可以通過中間媒介間接相連,對于本領域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語的具體含義。利用根據(jù)本發(fā)明實施例的用于確定基因組DNA樣品的甲基化位點的裝置,能夠方便準確地確定基因組DNA樣品的甲基化位點,從而可以應用于多種針對全基因組甲基化的研究,例如可以用于對人的腫瘤基因抑制基因的甲基化異常的檢測,以便為人類疾病的早期診斷提供有效的途徑。試劑盒根據(jù)本發(fā)明的又一方面,本發(fā)明提供了一組分離的限制性內(nèi)切酶。根據(jù)本發(fā)明的實施例,其由Msp I酶以及第二限制性內(nèi)切酶構(gòu)成。根據(jù)本發(fā)明的實施例,第二限制性內(nèi)切酶為選自 BstN 1、HpyCH4 V、Alu 1、Hae II1、HpyCH4 I1、Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS1、BamH I和Kpn I的至少一種,優(yōu)選所述第二限制性內(nèi)切酶為Apek I。關(guān)于第二限制性內(nèi)切酶,在前面已經(jīng)進行了詳細描述,不再贅述。根據(jù)本發(fā)明實施例的Msp I酶和第二限制性內(nèi)切酶酶構(gòu)成的酶切組合,能夠有效地對基因組DNA進行酶切,且酶切獲得的DNA片段非常適用于本發(fā)明的構(gòu)建全基因組甲基化高通量測序文庫的方法。該組分離的限制性內(nèi)切酶的用途及效果,前面已經(jīng)詳細描述,在此不再贅述。根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種用于構(gòu)建全基因組甲基化高通量測序文庫的試劑盒。根據(jù)本發(fā)明的實施例,該試劑盒包括:Msp I酶,以及第二限制性內(nèi)切酶。根據(jù)本發(fā)明的實施例,第二限制性內(nèi)切酶為選自BstN 1、HpyCH4 V、Alu I, Hae II1、HpyCH4
I1、Apek 1、Ban I1、T aqa 1、Sph 1、Bgl I1、BssS 1、BamH I 和 Kpn I 的至少一種,優(yōu)選所述第二限制性內(nèi)切酶為Apek I。關(guān)于第二限制性內(nèi)切酶,在前面已經(jīng)進行了詳細描述,不再贅述。本領域的技術(shù)人員可以理解,試劑盒中還可以進一步包括構(gòu)建全基因組甲基化高通量測序文庫所需的任何其他組分,在此不再贅述。利用根據(jù)本發(fā)明實施例的用于構(gòu)建全基因組甲基化高通量測序文庫的試劑盒,能夠方便有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫。需要說明的是,根據(jù)本發(fā)明實施例的構(gòu)建全基因組甲基化高通量測序文庫的方法及其應用,是本申請的發(fā)明人經(jīng)過艱苦的創(chuàng)造性勞動和優(yōu)化工作完成的。下面將結(jié)合實施例對本發(fā)明的實施方案進行詳細描述,但是本領域技術(shù)人員將會理解,下列實施例僅用于說明本發(fā)明,而不應視為限定本發(fā)明的范圍。實施例中未注明具體技術(shù)或條件的,按照本領域內(nèi)的文獻所描述的技術(shù)或條件(例如參考J.薩姆布魯克等著,黃培堂等譯的《分子克隆實驗指南》,第三版,科學出版社)或者按照產(chǎn)品說明書進行。所用試劑或儀器未注明生產(chǎn)廠商者,均為可以通過市購獲得的常規(guī)產(chǎn)品。實施例1:一、實驗流程1.使用Msp I和ApeK I酶切基因組DNA:1.1Msp I酶切:采用Msp I對IOOng人源mDC細胞系全基因組DNA樣品(mDC,成熟樹突狀細胞)進行酶切:I)在1.5ml的離心管中配制Msp I酶切反應體系:
權(quán)利要求
1.一種構(gòu)建全基因組甲基化高通量測序文庫的方法,其特征在于,包括以下步驟: 用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切,以便獲得DNA片段,其中所述第二限制性內(nèi)切酶為選自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11 ,Apek I, Ban I1、Taq a Sph 1、Bgl I1、BssS I> BamH I和Kpn I的至少一種,優(yōu)選所述第二限制性內(nèi)切酶為 ApekI ; 將所述DNA片段進行末端修復,以便獲得經(jīng)過末端修復的DNA片段; 在所述經(jīng)過末端修復的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段; 將所述具有粘性末端A的DNA片段與甲基化接頭相連,以便獲得具有甲基化接頭的連接產(chǎn)物; 將所述具有甲基化接頭的連接產(chǎn)物進行片段選擇,以便獲得目的片段; 將所述目的片段進行重亞硫酸鹽處理,以便將所述目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶,獲得經(jīng)過轉(zhuǎn)換的目的片段; 將所述經(jīng)過轉(zhuǎn)換的目的片段進行PCR擴增,以便獲得擴增產(chǎn)物;以及 分離純化所述擴增產(chǎn)物,所述擴增產(chǎn)物構(gòu)成全基因組甲基化高通量測序文庫; 其中, 任選地,進一步包括從樣本中提取基因組DNA的步驟,優(yōu)選所述樣本來源于哺乳動物、植物、和微生物的至少一種,更優(yōu)選所述哺乳動物為人和小鼠的至少一種; 任選地,所述基因組DNA為人類全血基因組DNA ; 任選地,所述基因組DNA的量為150-200ng,優(yōu)選IOOng ; 任選地,在將所述DNA片段進行末端修復前,進一步包括純化DNA片段的步驟; 任選地,將所述DNA片段進行末端修復是利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶進行的,其中,所述Klenow片段具有5’ 一 3’聚合酶活性和3’ 一 5’聚合酶活性,但缺少5’ 一 3’外切酶活性; 任選地,將所述經(jīng)過末端修復的DNA片段的3’末端添加堿基A是利用Klenow (3,-5’ exo_)進行的; 任選地,所述甲基化接頭中包含標簽; 任選地,將所述具有粘性末端A的DNA片段與甲基化接頭相連前,進一步包括對接頭進行甲基化的步驟; 任選地,將所述具有粘性末端A的DNA片段與甲基化接頭相連是利用T4 DNA連接酶進行的; 任選地,將所述具有甲基化接頭的連接產(chǎn)物進行片段選擇,是通過2%的瓊脂糖凝膠電泳進行的; 任選地,所述目的片段的長度為160-420bp ; 任選地,在將所述目的片段進行重亞硫酸鹽處理之前,將所述目的片段與片段化的λ -DNA混合,優(yōu)選所述片段化的λ -DNA的量為200ng ; 任選地,將所述目的片段進行重亞硫酸鹽處理是采用EZ DNA Methylation-GoldKit (ZYMO)進行的; 任選地,所述PCR擴增使用熱啟動taq DNA聚合酶;任選地,所述熱啟動taq DNA聚合酶為r_taq聚合酶; 任選地,基于所述目的片段的長度,確定所述PCR擴增的循環(huán)數(shù), 其中, 當所述目的片段的長度為160bp以上,且小于240bp時,所述PCR擴增的循環(huán)數(shù)為11 ; 當所述目的片段的長度為240bp以上,且小于340bp時,所述PCR擴增的循環(huán)數(shù)為13 ;以及 當所述目的片段的長度為340bp以上,且420bp以下時,所述PCR擴增的循環(huán)數(shù)為15 ;任選地,分離純化所述擴增產(chǎn)物是通過選自磁珠純化、純化柱純化和2%的瓊脂糖凝膠電泳的至少一種進行的,優(yōu)選通過2%的瓊脂糖凝膠電泳進行。
2.一種確定基因組DNA樣品的甲基化位點的方法,其特征在于,包括下列步驟: 根據(jù)權(quán)利要求1所述的方法構(gòu)建所述基因組DNA樣品的全基因組甲基化高通量測序文庫; 對所述全基因組甲基化高通量測序文庫進行測序,以便得到測序結(jié)果;以及 對所述測序結(jié)果進行數(shù)據(jù)分析,以便確定所述基因組DNA樣品的甲基化位點。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述測序是利用高通量測序技術(shù)進行的。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述測序是通過Solexa測序平臺進行的。
5.一種用于確定基因組DNA樣品的甲基化位點的裝置,其特征在于,包括: 文庫制備單元,所述文庫制備單元用于制備基因組DNA樣品的全基因組甲基化高通量測序文庫,所述文庫制備單元內(nèi)設置有Msp I酶以及第二限制性內(nèi)切酶,其中,所述第二限制性內(nèi)切酶為選自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11, Apek I, Ban II,Taqa I,Sph 1、Bgl I1、BssS 1、BamH I和Kpn I的至少一種,優(yōu)選所述第二限制性內(nèi)切酶為ApekI ; 測序單元,所述測序單元與所述文庫制備單元相連,并且從所述文庫制備單元接收所述基因組DNA樣品的全基因組甲基化高通量測序文庫,以便用于對所述基因組DNA樣品的全基因組甲基化高通量測序文庫進行測序,獲得測序結(jié)果;以及 數(shù)據(jù)分析單元,所述數(shù)據(jù)分析單元與所述測序單元相連,并且從所述測序單元接收所述測序結(jié)果,以便對所述測序結(jié)果進行數(shù)據(jù)分析,確定所述基因組DNA樣品的甲基化位點。
6.組分離的限制性內(nèi)切酶,其特征在于,由Msp I酶以及ApeK I酶構(gòu)成。
7.一種用于構(gòu)建全基因組甲基化高通量測序文庫的試劑盒, 其特征在于,包括: Msp I酶,以及 第二限制性內(nèi)切酶, 其中, 所述第二限制性內(nèi)切酶為選自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11, Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS 1、BamH I 和 Kpn I 的至少一種,優(yōu)選所述第二限制性內(nèi)切酶為Apek I。
全文摘要
提供了全基因組甲基化高通量測序文庫的構(gòu)建方法及其應用。構(gòu)建全基因組甲基化高通量測序文庫的方法包括用Msp I和第二限制性內(nèi)切酶對基因組DNA進行酶切;將DNA片段進行末端修復;在經(jīng)過末端修復的DNA片段的3’末端添加堿基A;將具有粘性末端A的DNA片段與甲基化接頭相連;將具有甲基化接頭的連接產(chǎn)物進行片段選擇,以便獲得目的片段;將目的片段進行重亞硫酸鹽處理,以便將目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶;將經(jīng)過轉(zhuǎn)換的目的片段進行PCR擴增;分離純化擴增產(chǎn)物,該擴增產(chǎn)物構(gòu)成全基因組甲基化高通量測序文庫。采用本發(fā)明的構(gòu)建全基因組甲基化高通量測序文庫的方法及其應用,能夠方便有效地構(gòu)建基因組DNA樣品的全基因組甲基化高通量測序文庫。
文檔編號C12Q1/68GK103088433SQ20111034235
公開日2013年5月8日 申請日期2011年11月2日 優(yōu)先權(quán)日2011年11月2日
發(fā)明者高飛, 王君文, 夏渝東, 王俊 申請人:深圳華大基因科技有限公司, 深圳華大基因研究院