一種兩核苷酸合成測序分析多模板pcr產(chǎn)物的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生物技術(shù)領(lǐng)域,是一種PCR產(chǎn)物序列分析方法,具體涉及一種兩核苷 酸合成測序分析多模板PCR產(chǎn)物的方法。
【背景技術(shù)】
[0002] 人類基因組計劃和各種模式生物基因組計劃的開展和完成,使人類步入了后基因 時代,對當(dāng)代的生物學(xué)研宄和醫(yī)學(xué)研宄產(chǎn)生了巨大的影響,分子生物學(xué)相關(guān)學(xué)科得到了迅 猛的發(fā)展。從基因水平上認(rèn)識生命的差異,疾病發(fā)生、發(fā)展的規(guī)律,以及藥物與生命體的相 互作用將成為可能。就基因序列分析而言,后基因時代的重點(diǎn)已由全基因組序列測定轉(zhuǎn)移 到了對基因組中個體遺傳差異及物種間遺傳差異的比較。在基礎(chǔ)研宄方面,DNA的序列分析 是進(jìn)一步研宄和改造目的基因的基礎(chǔ),研宄疾病基因的遺傳規(guī)律,克隆致病基因;在應(yīng)用方 面,直接尋找疾病的易感基因突變位點(diǎn),通過對某一特定疾病的基因組樣本中突變基因型 進(jìn)行大規(guī)模鑒定和檢測,可以獲得與該疾病相關(guān)基因型的信息。很多常見疾病的遺傳學(xué)影 響可歸因于有限的等位基因變異。對人類基因組序列分析可以發(fā)現(xiàn),任何兩個無關(guān)個體的 基因組序列相似程度達(dá)到99. 9%,而剩余的差異則導(dǎo)致個體對疾病易感性差異和藥物反應(yīng) 差異。因此,研宄基因組上序列的變異與疾病的關(guān)系成為揭示復(fù)雜疾病遺傳機(jī)制的第一步。 單核苷酸多態(tài)性(SNP)既與單基因遺傳病相關(guān),也可能與多基因遺傳病相關(guān)。目前已經(jīng)確定 4000多種遺傳疾病是由單堿基突變引起的,而一些重大疾病如癌癥、糖尿病、心血管疾病、 抑郁癥、哮喘等,是受眾多基因以及環(huán)境因子共同作用,通過對某一特定疾病的基因組樣本 中大量突變基因型進(jìn)行大規(guī)模鑒定和檢測,可以獲得與該疾病相關(guān)基因型的信息。
[0003] 與為數(shù)有限的蛋白質(zhì)測序和DNA序列分析方法相比,基因突變(包括SNP)分析的 基本方法在數(shù)量上已達(dá)20余種。種類繁多的分析方法,既反映了研宄基因突變(包括SNP) 分析方法在生物學(xué)和醫(yī)學(xué)領(lǐng)域所受到的重視程度,也反映出尚無一種方法能滿足后基因時 代對基因突變(包括SNP)分析的要求。目前對于多DNA模板的PCR產(chǎn)物,或者混合樣本PCR 產(chǎn)物的分析主要依賴于傳統(tǒng)的焦測序法和Sanger測序法。前者適合短片段序列的分析、且 易于定量,但對于多模板DNA序列的分析完全依賴核苷酸加入的順序(由于可能存在不同 步合成的情況,核苷酸的不同加入方法得到的測序結(jié)果會不一樣);而Sanger測序法雖然能 夠適合多模板DNA序列分析,但缺點(diǎn)是無法將其定量。因此,現(xiàn)有分析方法不能完全滿足對 多DNA模板PCR產(chǎn)物序列的分析要求。
[0004] 最近,我們實(shí)驗(yàn)室提出一種基于兩核苷酸實(shí)時合成測序的方法,該方法通過每次 反應(yīng)同時加入兩種dNTPs合成測序,得到兩組編碼,然后解碼這兩組編碼便能確定測序片 段的具體堿基信息(肖鵬峰等,中國發(fā)明專利:ZL 201210128597. 6)。該方法具有大幅提高 測序長度,且測序得到的測序信號強(qiáng)度比傳單核苷酸合成測序的信號強(qiáng)等特點(diǎn)。然而,該發(fā) 明專利只針對一個DNA模板樣本進(jìn)行分析,無法對包含多模板DNA的序列進(jìn)行分析,限制了 序列分析的范圍。
【發(fā)明內(nèi)容】
[0005] 技術(shù)問題:為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種兩核苷酸合成測序 分析多模板PCR產(chǎn)物的方法,為PCR產(chǎn)物的DNA序列提供一種快速、高效、靈敏的分析方法。
[0006] 技術(shù)方案:為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為: 一種兩核苷酸合成測序分析多模板PCR產(chǎn)物的方法,步驟包括:I) DNA提??;2) PCR擴(kuò) 增;3)測序;4)關(guān)聯(lián)分析; 所述步驟3)的測序方法為:同時加入兩種不同的核苷酸,且PCR擴(kuò)增產(chǎn)物均勻 分成至少兩份(最多三份),選擇三組((dATP a S+dGTP) AdCTP+dTTP),(dATP a S+dCTP/ (dGTP+dTTP),(dATPa S+dTTP) AdCTP+dGTP))中可能合成循環(huán)測序的中至少兩組(最多三 組)進(jìn)行測序,得到至少兩組(最多三組)測序編碼測序信息。
[0007] 所述步驟3)的具體方法包括以下步驟: 3-1)制備單鏈DNA模板:將PCR擴(kuò)增產(chǎn)物均勻分成至少兩份(最多三份),分別與鏈霉 親和素包裹的磁珠反應(yīng),生物素修飾的DNA鏈固定到所述磁珠上,在0. 05-0. 2 M NaOH溶液 下變性;將未固定的另一條DNA鏈清除;然后用洗液洗滌,得到固定的單鏈DNA模板; 3-2)測序引物雜交:將測序引物與所述單鏈DNA模板在雜交反應(yīng)體系中,70-80° C下 放置5-10 min,自然冷卻至室溫,完成雜交; 3-3)測序:配備測序反應(yīng)體系,與所述步驟3-2)得到的雜交產(chǎn)物混合,選擇三組 ((dATP a S+dGTP)/(dCTP+dTTP), (dATP a S+dCTP/ (dGTP+dTTP), (dATP a S+dTTP)/(dCTP +dGTP))中可能合成循環(huán)測序的中至少兩組(最多三組)進(jìn)行測序,得到至少兩組(最多三 組)測序編碼測序信息。
[0008] 所述步驟3-2)中,所述測序引物是一段與單鏈DNA模板完全互補(bǔ)的一段序列。
[0009] 所述步驟3)中,每個測序反應(yīng)獲得的測序信息包括兩核苷酸種類信息和測序信號 強(qiáng)度信息,所述測序信號強(qiáng)度與合成核苷酸數(shù)目成正比,即每個測序反應(yīng)的測序信號強(qiáng)度 均可以轉(zhuǎn)化為核苷酸合成的數(shù)目。如果把整個PCR產(chǎn)物模板量定為1單位,則核苷酸合成 的數(shù)目可以是整數(shù)單位,也可以是非整數(shù)單位(如(dATPa S+dGTP) -個合成測序反應(yīng)得到 2. 5個單位核苷酸合成的信息,則編碼記為(AG) 2_5,該編碼可以分解成一階整數(shù)編碼(相當(dāng) 于合成一個核苷酸單位)和小于1的非整數(shù)編碼構(gòu)成,記為(AG) (AG) (AG)°_5,依次類推)。
[0010] 所述步驟4)中,根據(jù)至少兩組不同兩核苷酸合成循環(huán)測序分別得到的至少兩組編 碼信息,按照兩次測序相同位置堿基及其數(shù)目相等的原理,將至少兩組編碼信息分解成最 大一階的整數(shù)編碼和小于1的非整數(shù)編碼,并依次進(jìn)行解碼。根據(jù)對于小于1的非整數(shù)解 碼的信息,構(gòu)建關(guān)聯(lián)方程式,確定PCR產(chǎn)物的不同DNA模板及其含量; 所述關(guān)聯(lián)方程式為:對于包含任意一個SNP位點(diǎn)的PCR產(chǎn)物,可能包含不超過四種不同 的DNA模板(即變化位點(diǎn)堿基為A/G/C/T之一),設(shè)定這四種DNA模板1、…、i的含量分 別為X1、…、Xi,且X 1+…+ Xi=L其中〇 < Xi〈l、l < i < 4 ;在至少兩組不同兩核苷酸合 成循環(huán)測序信息解碼的得到的最大一階編碼信息中,至少包含一個小于1的非整數(shù)測序編 碼信息反映 SNP位點(diǎn)變化。包含SNP位點(diǎn)的單個測序反應(yīng)測序信息反映該兩核苷酸在本次 測序反應(yīng)中合成的核苷酸數(shù)目,從而構(gòu)建出一個方程式。很明顯,在SNP位點(diǎn)的存在A/G/C/ T四種變化的情況下,需要兩個單個測序反應(yīng)方能將該位點(diǎn)的A/G/C/T信息全部測定,從而 可以構(gòu)建兩個獨(dú)立的方程式;基于相同的道理,從另一組循環(huán)測序中同樣可以構(gòu)建兩個獨(dú) 立的方程式。另外,于同一位置堿基信息在兩次測序中信息不變的原理,在兩組測序信息中 包含同樣(堿基及其與含量)信息,因此上述四個方程式是有關(guān)聯(lián)的,這樣通過構(gòu)建方程組, 求出X1、…、X i的具體數(shù)值。
[0011] 所述SNP位點(diǎn)上的測序信息進(jìn)行關(guān)聯(lián)分析是指對包含至少兩組不同兩核苷酸合 成循環(huán)測序信息進(jìn)行解碼后的關(guān)聯(lián),即在解碼出的小于1的非整數(shù)解碼的信息中構(gòu)建關(guān)聯(lián) 方程式,以確定PCR產(chǎn)物的不同DNA模板及其含量; 若PCR產(chǎn)物中包含若干個SNP位點(diǎn)的分析,則將進(jìn)行若干單個SNP位點(diǎn)的關(guān)聯(lián)分析。
[0012] 所述步驟2)中,PCR擴(kuò)增所用的PCR-條引物為5'端被生物素、氨基或者丙烯酰 胺基團(tuán)修飾,與表面修飾鏈霉親合素、羧基的固相載體反應(yīng),或者與丙烯酰胺單體聚合反應(yīng) 制備單鏈DNA模板。
[0013] 進(jìn)一步的,在本發(fā)明中,所述加入兩核苷酸測序釋放的檢測分子是相同的,所述檢 測分子為化學(xué)發(fā)光檢測的焦磷酸鹽、電化學(xué)檢測的氫離子或者光學(xué)檢測的熒光信號。
[0014] 進(jìn)一步的,在本發(fā)明中,所述PCR擴(kuò)增產(chǎn)物的分析指包括單個樣本PCR產(chǎn)物和混合 樣本PCR產(chǎn)物的分析。
[0015] 有益效果:本發(fā)明提供的兩核苷酸合成測序分析多模板PCR產(chǎn)物的方法,應(yīng)用 兩核苷酸同時加入到反應(yīng)中的測序信息,即每個測序反應(yīng)得到包括兩核苷酸種類及其核 苷酸合成數(shù)目的測序編碼信息,對同一 PCR產(chǎn)物均勻分成至少兩份(最多三份),通過三 組((dATP a S+dGTP) AdCTP+dTTP),(dATP a S+dCTP/ (dGTP+dTTP),(dATP a S+dTTP) / (dCTP+dGTP))可能合成循環(huán)測序的中至少兩組(最多三組)進(jìn)行測序,得到至少兩組(最多 三組)測序編碼測序信息,并結(jié)合兩組編碼信息進(jìn)行解碼,最后通過關(guān)聯(lián)分析確定PCR產(chǎn)物 的不同DNA模板及其含量。本發(fā)明與傳統(tǒng)焦測序相比,具有如下有益效果: 1)本發(fā)明適合所有多模板PCR產(chǎn)物序列的分析。相對于傳統(tǒng)的焦測序分析方法,本發(fā) 明對多模板PCR產(chǎn)物的測序在通過SNP位點(diǎn)時,最多需要兩個測序反應(yīng),適合所有樣本的分 析,易于發(fā)現(xiàn)新的突變形式,拓寬了分析范圍;而傳統(tǒng)的焦測序在通過SNP位點(diǎn)時,可能最 多需要四個測序反應(yīng)來實(shí)現(xiàn),因核苷酸加入順序會造成不同步合成,影響該SNP變化信息 的判斷,不易于新突變形式的發(fā)現(xiàn),同時也會給后續(xù)測序信息的判讀造成干擾。
[0016] 2)本發(fā)明能夠?qū)Ω鞣N未知DNA模板進(jìn)行定性、定量分析,相對于傳統(tǒng)的焦測序分 析方法,本發(fā)明提供兩次測序信息相互校正,提高了分析的準(zhǔn)確度和靈敏度。
[0017] 3)本發(fā)明適合多個混合樣本的多模板PCR產(chǎn)物分析,可以直接測定混合樣本中各 個DNA模板的比例,可以用于從大規(guī)模樣本中尋找、篩選核酸標(biāo)志物。
[0018] 4)本發(fā)明直接采用商品化、非標(biāo)記的天然核苷酸進(jìn)行合成測序,它可以在任何基 于實(shí)時合成測序的測序平臺進(jìn)行。
【附圖說明】
[0019] 圖1為本發(fā)明方法對任意擬定的包含一個SNP位點(diǎn)的四種可能DNA模板混合物序 列(5, -GACGTGACGNTC-3',SNP 位點(diǎn) N=A/C/T/G,且 A、C、T、G 含量分別為 Xl、x2、x3、x4)測 序信息關(guān)聯(lián)分析示意;圖中, (dATPaS+dGTPV(dCTP+dTTP):表示(dATPaS+dGTPV(dCTP+dTTP)循環(huán)測序得到的 最大一階編碼測序信息,e、f為小于1的非整數(shù); (dATP a S+dTTP) AdCTP+dGTP):表示(dATP a S+dTTP) AdCTP+dGTP))循環(huán)測序得到的 最大一階編碼測序信息,g、h為小于1的非整數(shù); 解碼:表示由((dATPa S+dGTPV(dCTP+dTTP), (dATPa S+dTTPV(dCTP+dGTP))兩組循 環(huán)測序的一階編碼信息組合解碼得到的互補(bǔ)堿基序列; 關(guān)聯(lián)分析:表示由((dATP a S+dGTP) AdCTP+dTTP), (dATP a S+dTTP) AdCTP+dGTP)) 兩組循環(huán)測序的中小于I的非整數(shù)編碼信息組合解碼得到的互補(bǔ)堿基序列。在 (dATP a S+dGTP) AdCTP+dTTP)測序得到的(CT) %表示dCTP, dTTP兩核苷酸發(fā)生了 e個單 位核苷酸的合成,因此互補(bǔ)的堿基(G+A)的含量為e ;同理,(T+C)=f ;而在(dATPa S+dGTP)/ (dCTP+dTTP)測序得到的(AT) g表示dATP,dTTP兩核苷酸發(fā)生了 g個單位核苷酸的合成, 因此互補(bǔ)的堿基(T+A)的含量為g;同理,(C+G)=h。同時,基于同一位置堿基信息在兩次測