應(yīng)用于高通量測序的核酸分子定量方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及分子生物學(xué),涉及核酸序列測序與分子定量,尤其是利用高通量測序 方法對DNA與RNA直接定量。
【背景技術(shù)】
[000引相對于sanger測序方法,高通量測序可從陜速高效的確定樣本中所含DNA與RNA序列信息,并W特異序列和讀取頻率為基礎(chǔ)分析包含染色體變異、基因突變、RNA表達與剪 切W及甲基化在內(nèi)的分子水平事件,從而對生物研究W及臨床診斷提供可靠的檢測方法。
[0003]目前高通量測序在臨床上的應(yīng)用方興未艾。對癌癥患者血液循環(huán)腫瘤DNA(ctDNA) 測序獲取體突變位點及ctDNA的含量用于伴隨診斷指導(dǎo)用藥與復(fù)發(fā)檢測,也可W用于健康 人群全身的防癌體檢[1-4]。對器官移植患者的血液游離DNA高通量測序可W有效的區(qū)分 自體與供體的單核巧酸多態(tài)(SNP)的堿基差異,通過檢測移植器官DNA在受體患者血液中 的含量變化可W有效的檢測移植排斥反應(yīng)[5, 6]。利用數(shù)W萬計的16S序列信息鑒定環(huán)境 微生物種群及相對豐度極大的加深了我們對腸道微生物的理解,并將微生物生態(tài)與人體健 康關(guān)聯(lián)起來[7,引。同時高通量測序還可W高效的識別侵染生物的病原體,在傳染病檢測 與預(yù)防方面也發(fā)揮重要作用巧-11]。雖然高通量測序廣泛的應(yīng)用于W上研究領(lǐng)域,包括確 定序列信息與序列間的相對豐度,但目前還沒有有效的方法利用高通量測序直接對原始樣 本中每條特異核酸絕對定量,必須額外依靠實時英光PCR定量法(qRT-PCR) [12]或者數(shù)字 PCR法[4](digitalPCR)。本發(fā)明對現(xiàn)有的高通量測序方法進行改進,在樣本處理過程中 加入一系列已知濃度的標(biāo)準(zhǔn)核酸序列標(biāo)準(zhǔn)品,通過后期信息分析構(gòu)建出標(biāo)準(zhǔn)濃度曲線從而 可W對樣本所有的序列進行絕對定量。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供一種標(biāo)準(zhǔn)品,該標(biāo)準(zhǔn)品是由若干種已知濃度的不同序列的核酸分子組 成,該標(biāo)準(zhǔn)品與待測樣本混合后可W用于高通量測序的樣本制備。特別強調(diào)的是該核酸標(biāo) 準(zhǔn)品的分子序列可W用信息學(xué)分析與待測樣本的中的核酸序列區(qū)別。
[0005] 標(biāo)準(zhǔn)品的設(shè)計與采用不同的測序方法相關(guān),目的是使標(biāo)準(zhǔn)品與待測核酸分子無偏 差的共同進行下一步的建庫測序與分析。利用PCR捕獲測序方法時,例如16S的PCR建庫 測序,標(biāo)準(zhǔn)品中的核酸分子應(yīng)該在分子兩端具有PCR所需引物互補序列。實施方式之一,將 16S的PCR引物515F與806R之間插入一段GAPDH序列,并且在GAPDH與引物之間插入經(jīng)過 編碼的4位堿基來區(qū)分不同濃度的分子,該實施例中的標(biāo)準(zhǔn)品中核酸分子的具體序列與對 應(yīng)濃度見表1。對于使用核酸探針捕獲測序,需要將核酸標(biāo)準(zhǔn)品的序列作為捕獲區(qū)域的一部 分進行探針設(shè)計。實施方式之一,標(biāo)準(zhǔn)品中的核酸分子是每隔20bp進行堿基轉(zhuǎn)換編碼的人 源GAPDH序列,不同濃度的標(biāo)準(zhǔn)品分子堿基轉(zhuǎn)換的分子位置不同,W便正常人源GAPDH及不 同標(biāo)準(zhǔn)品核酸分子相互區(qū)分,該實施例中的標(biāo)準(zhǔn)品中核酸分子的具體序列與對應(yīng)濃度見表 3。在使用DNA隨機打斷建庫方法時,標(biāo)準(zhǔn)品種的核酸分子應(yīng)該與打斷后DNA具有相當(dāng)?shù)膲A 基數(shù)量,例如最終打斷DM片度為180-250,則標(biāo)準(zhǔn)品分子的長度也應(yīng)該在送個范圍內(nèi)。測 定基因表達譜實驗中利用polyT與具有polyA尾己的mRNA互補結(jié)合方法中,標(biāo)準(zhǔn)品中不同 濃度的核酸分子也應(yīng)該具有與待測樣本一樣的polyA尾己。W上不同應(yīng)用的實驗與分子序 列設(shè)計方法都是本領(lǐng)域有經(jīng)驗的技術(shù)人員W"使標(biāo)準(zhǔn)品與待測核酸分子無偏差的共同進行 下一步的建庫測序與分析"為目的時所熟悉的。
[0006] 本發(fā)明還提供一種樣本處理與建庫方法,該方法W標(biāo)準(zhǔn)品與待測樣本W(wǎng)-定比例 混合物為原始樣本進行測序前樣本處理與建庫。該比例根據(jù)待測樣本的濃度W及標(biāo)準(zhǔn)品 的濃度可W適當(dāng)調(diào)節(jié),W達到標(biāo)準(zhǔn)品最優(yōu)的濃度覆蓋范圍和測序數(shù)據(jù)量大小。所述的建庫 方法,比如直接打斷建庫,PCR富集目標(biāo)片段建庫與探針雜交捕獲方法是本領(lǐng)域技術(shù)人員所 熟悉,具體方法包括單不局限于實施方式之一中使用IlluminaTruSeq建庫試劑盒建庫, AgilentSureSelect探針進行目標(biāo)區(qū)域捕獲。
[0007] 本發(fā)明還提供一種信息分析方法原理,利用標(biāo)準(zhǔn)品中不同的已知濃度的分子在樣 本數(shù)據(jù)中對應(yīng)的reads數(shù)擬合數(shù)理模型。最后根據(jù)感興趣的分子序列reads數(shù)代入該數(shù)理 模型,從而得到同一樣本中感興趣分子的最終濃度,也可W比較不同樣本間相同或不同序 列的相對濃度。其中,擬合數(shù)理模型中使用的reads數(shù)可W是數(shù)據(jù)質(zhì)控后直接得到Reads 數(shù),例如實施方式之一中的16SPCR產(chǎn)物中標(biāo)準(zhǔn)品的Reads數(shù),也可W是校正后的reads數(shù), 例如實施方式之一中根據(jù)捕獲外顯子大小校正后的單位長度的Reads數(shù)。擬合數(shù)理模型采 用的方法是本領(lǐng)域有經(jīng)驗的技術(shù)人員所熟悉的方法,包括但不限于線性回歸方程。
[0008] 本發(fā)明還提供一種直接利用高通量測序?qū)μ囟ê怂岱肿舆M行相對與絕對定量的 方法,包括標(biāo)準(zhǔn)品的制備,樣本處理和文庫制備方法,高通量核酸測序分子的方法W及對應(yīng) 的信息分析處理方法。
[0009] 實施方式之一中,檢測腸道提取物中厚壁菌口 16S的含量: (1) 從人體糞便中提取固定體積的DNA樣本,作為待測樣本; (2) 將待測樣本與標(biāo)準(zhǔn)品W9:1比例混合,該混合物作為模板利用16S特異引物進 行PCR擴增; (3) 將擴增產(chǎn)物建庫并使用MiSeq測序; (4) 利用生物信息學(xué)工具構(gòu)建標(biāo)準(zhǔn)品濃度與Reads數(shù)(Tags)數(shù)理模型; (5) 將厚壁菌口 16S所包含的化gs數(shù)量代入模型得出待測樣本中的絕對濃度。
[0010] 在另一實施方式中,檢測結(jié)直腸癌患者血漿游離DNA中含有V600EctDNA的濃度: (1) 將患者血漿與標(biāo)準(zhǔn)品99:1進行混合后提取血漿總游離DNA(C巧NA); (2) 提取的cfDNA建庫后使用探針捕獲感興趣的DNA區(qū)域,包括腫瘤相關(guān)的的BRAF 外顯子與標(biāo)準(zhǔn)品對應(yīng)的GAPDH同源分子; (3) 使用高通量測序儀對捕獲文庫測序; (4) 利用生物信息學(xué)工具構(gòu)建標(biāo)準(zhǔn)品濃度與Reads數(shù)數(shù)理模型; (5) 將含有BRAFV600E突變的Reads數(shù)量代入模型得出待測樣本中的絕對濃度。
[0011] 本發(fā)明還提供一種直接利用高通量測序?qū)μ囟ê怂岱肿舆M行相對與絕對定量的 系統(tǒng),包括:定制好的標(biāo)準(zhǔn)品,建庫所需的試劑,測序與分析所需的儀器W及生物信息學(xué)分 析需要的軟件系統(tǒng)??蒞將所述系統(tǒng)包裝為試劑盒的形式,其中包括裝有上述組分的容器 和關(guān)于使用該試劑盒對感興趣核酸分子進行相對和絕對定量的說明。
[0012] 本發(fā)明提供的直接利用高通量測序?qū)μ囟ê怂岱肿舆M行相對與絕對定量的方法, 集成了高通量測序的高分辨率與傳統(tǒng)定量方法準(zhǔn)確的雙重優(yōu)點。Real Time PCR定量與 digital PCR定量方法可W準(zhǔn)確的對特定序列和低頻突變進行準(zhǔn)確定量,但缺點是只能針 對已知的特定位點進行檢測,不能用于對未知或者不確定的序列或突變分子定量,而且檢 測通量很小,一次機器運行最多只能檢測幾十種分子指標(biāo)。高通量測序可W高通量的對所 有感興趣的核酸序列進行無偏差分析,預(yù)先不需要知道樣本中的序列信息,所W可W發(fā)現(xiàn) 未知的序列或突變。但由于實驗方法所限,高通量測序只能得到同一個文庫中序列的相對 濃度,無法比較不同樣本間的相對濃度,更不能對某條序列進行絕對定量。本方法通過引入 可W在不同樣本間橫向比較的標(biāo)準(zhǔn)品實現(xiàn)了樣本間的相對定量,而且利用標(biāo)準(zhǔn)品中具有已 知濃度的不同分子的reads數(shù)構(gòu)建數(shù)理模型實現(xiàn)了對測序結(jié)果中所有序列的絕對定量。
[0013] 本發(fā)明還提供了使用高通量測序?qū)怂岱肿舆M行定量的重要臨床應(yīng)用。循環(huán)腫瘤 DNA與癌癥的發(fā)生發(fā)展具有重要的相關(guān)性。鑒于人體中血漿總游離DNA含量不穩(wěn)定性,受 多種因素影響[13],對含有特定突變的ctDNA絕對定量而非相對比例可W為腫瘤的預(yù)防、 復(fù)發(fā)監(jiān)測及用藥提供確切的指導(dǎo)作用[4],例如本發(fā)明實施例中對結(jié)直腸癌患者進行BRAF V600E突變的定量檢測。在另一實施例中,對某種腸道微生物進行定量檢測可W和人體健 康關(guān)聯(lián)起來。基于高通量測序的定量方法有許多臨床診斷應(yīng)用,包括但不局限于上述方向。 研究表明ICU患者的線粒體rfDNA絕對量與死亡率具有很強的相關(guān)性,可W最為臨床監(jiān)護 中的一個重要預(yù)后指標(biāo)[14]。另外,移植物發(fā)生排斥,自身免疫性疾病及外源病原體感染的 情況下都可W通過檢測血漿游離DNA對疾病進行診斷與監(jiān)控。
[0014]
【附圖說明】: 圖1.原始濃度樣本與稀釋濃度樣本的16S reads與濃度關(guān)系數(shù)理模型構(gòu)建。
[0015] 圖2.Η個ctDNA技術(shù)重復(fù)樣本的reads與濃度關(guān)系數(shù)理模型構(gòu)建。
[0016] 本發(fā)明的實施方式舉