相關(guān)申請(qǐng)案的交叉引用
本申請(qǐng)案要求2015年1月13日提交的lo等人(代理人案號(hào)80015-015800us)的題為“使用血漿dna中大小和數(shù)目失常用于檢測(cè)癌癥(usingsizeandnumberaberrationsinplasmadnafordetectingcancer)”的美國(guó)臨時(shí)專利申請(qǐng)案第62/102,867號(hào);以及2015年2月3日提交的lo等人(代理人案號(hào)80015-016000us)的題為“血漿線粒體dna分析的應(yīng)用(applicationsofplasmamitochondrialdnaanalysis)”的美國(guó)臨時(shí)專利申請(qǐng)案第62/111,524號(hào)的優(yōu)先權(quán),出于所有目的,它們的公開內(nèi)容以全文引用的方式并入本文中。
背景技術(shù):
當(dāng)前存在對(duì)使用血漿和血清中游離dna用于分子診斷的較大興趣。舉例來說,在血漿中已經(jīng)檢測(cè)到線粒體dna(chiu等人《臨床化學(xué)(clinchem)》2003;49:719-726和lo等人《科學(xué)·轉(zhuǎn)化醫(yī)學(xué)(scitranslmed)》2010;2:61-ra91)。已經(jīng)對(duì)癌癥患者的血漿中線粒體dna進(jìn)行了測(cè)量,但是此類測(cè)量不是一致的(yum等人《線粒體dna(mitochondrialdna)》2012;23:329-32;zachariahrr等人《婦產(chǎn)科學(xué)(obstetgynecol)》2008;112:843-50;mehran等人《臨床癌癥研究(clincancerres)》2007;23:421-6;kohler等人《分子癌癥(molcancer)》2009;8:105;以及choudhuri等人《分子與細(xì)胞生物化學(xué)(molcellbiochem)》2014;386:259-269)。此外,線粒體dna的定量化使用已經(jīng)受限。
技術(shù)實(shí)現(xiàn)要素:
各種實(shí)施方式可測(cè)定在生物樣品中相對(duì)于核dna分子的量的線粒體dna分子的量,并出于各種目的使用所述相對(duì)量,例如,篩查、檢測(cè)、預(yù)測(cè)或監(jiān)測(cè)各種生理和病理狀況。舉例來說,實(shí)施方式顯示線粒體dna的量可用于估測(cè)一種組織類型的dna濃度。
根據(jù)一個(gè)實(shí)施方式,可通過測(cè)定線粒體dna的量并且然后將所述量映射到胎兒dna分?jǐn)?shù)來測(cè)量胎兒dna分?jǐn)?shù)。因此,線粒體dna的量可用于估測(cè)來自懷孕女性的樣品中胎兒dna濃度,相對(duì)于其它技術(shù),其可降低此類測(cè)量中的成本。線粒體dna的量還可用于估測(cè)樣品中的腫瘤dna濃度。并且,可測(cè)定來自非造血組織來源的dna的百分比。
根據(jù)另一實(shí)施方式,在生物樣品中相比于核dna分子的量的線粒體dna分子的相對(duì)量可用于精確確定有機(jī)體的癌癥水平。dna分子的隨機(jī)測(cè)序可產(chǎn)生映射到參考核基因組和參考線粒體的序列讀段以便確定dna分子是核dna還是線粒體dna。在一些實(shí)施方案中,僅唯一地映射(比對(duì))到線粒體基因組的序列讀段用于測(cè)定相對(duì)量。此外,線粒體dna分子的相對(duì)量可用于測(cè)定腫瘤的大小。
根據(jù)另一實(shí)施方式,在生物樣品中相比于核dna分子的量的線粒體dna分子的相對(duì)量可用于精確確定有機(jī)體的自身免疫疾病的水平。此外,線粒體dna分子大小分布的統(tǒng)計(jì)值可用于確定有機(jī)體的自身免疫疾病(例如,全身性紅斑狼瘡)的水平。
其它實(shí)施方式涉及與本文所述的方法相關(guān)聯(lián)的系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)。
可參考以下詳細(xì)描述和附圖來更好地理解本發(fā)明的實(shí)施方式的性質(zhì)和優(yōu)點(diǎn)。
附圖說明
圖1是示出組織類型和每個(gè)細(xì)胞對(duì)應(yīng)的線粒體數(shù)量的表100。
圖2示出根據(jù)本發(fā)明的實(shí)施例的胎盤和血細(xì)胞的與線粒體基因組進(jìn)行比對(duì)的dna片段的分?jǐn)?shù)(mtdna%)的繪圖200。
圖3示出根據(jù)本發(fā)明的實(shí)施例的非懷孕樣品和懷孕樣品(第1個(gè)三月期和第3個(gè)三月期)血漿mtdna%的繪圖300。
圖4示出根據(jù)本發(fā)明的實(shí)施例的第1個(gè)三月期懷孕和第3個(gè)三月期懷孕之間的血漿mtdna%差異的繪圖400。
圖5示出根據(jù)本發(fā)明的實(shí)施例的血沉棕黃層(bc)、絨毛取樣(cvs)和胎盤(第3個(gè)三月期)中線粒體dna百分比(mtdna%)的繪圖500。
圖6是示出根據(jù)本發(fā)明的實(shí)施例的血漿樣品中線粒體dna分?jǐn)?shù)和胎兒dna分?jǐn)?shù)之間正相關(guān)的繪圖600。
圖7是示出根據(jù)本發(fā)明的實(shí)施例的在第1個(gè)三月期懷孕中胎兒dna分?jǐn)?shù)和血漿線粒體dna百分比之間相關(guān)性的繪圖700。
圖8示出根據(jù)本發(fā)明的實(shí)施例的測(cè)定血漿中線粒體dna分?jǐn)?shù)和胎兒dna分?jǐn)?shù)之間函數(shù)關(guān)系的訓(xùn)練數(shù)據(jù)的繪圖800。
圖9示出根據(jù)本發(fā)明的實(shí)施例的針對(duì)測(cè)量的胎兒dna分?jǐn)?shù)繪制從線粒體dna分?jǐn)?shù)推導(dǎo)的胎兒dna分?jǐn)?shù)的繪圖900,所述測(cè)量的胎兒dna分?jǐn)?shù)基于與y染色體進(jìn)行比對(duì)的血漿dna片段的分?jǐn)?shù)。
圖10是示出根據(jù)本發(fā)明的實(shí)施例的第1個(gè)三月期樣品的血漿dna大小比率和血漿mtdna%之間相關(guān)性的繪圖1000。
圖11是示出根據(jù)本發(fā)明的實(shí)施例的分析懷有胎兒的女性受試者的生物樣品以估測(cè)生物樣品中胎兒dna濃度的方法1100的流程圖。
圖12示出hcc腫瘤組織、腫瘤周圍非惡性肝組織和血細(xì)胞樣品的平均線粒體dna百分比(mtdna%)的圖示1200。
圖13示出根據(jù)本發(fā)明的實(shí)施例的健康受試者、b型肝炎病毒(hbv)受試者、肝硬化患者和hcc患者的血漿mtdna%的繪圖1300。
圖14是示出根據(jù)本發(fā)明的實(shí)施例的用于區(qū)分hcc患者和健康對(duì)照者的血漿線粒體dna分?jǐn)?shù)的診斷精確性的接受者操作特征(roc)曲線的繪圖1400。
圖15示出根據(jù)本發(fā)明的實(shí)施例的健康受試者和npc(鼻咽癌)患者的血漿mtdna%的繪圖1500。
圖16示出根據(jù)本發(fā)明的實(shí)施例的針對(duì)腫瘤組織中線粒體dna分?jǐn)?shù)濃度與腫瘤大小的乘積繪制的血漿中線粒體dna分?jǐn)?shù)的繪圖1600。
圖17示出根據(jù)本發(fā)明的實(shí)施例的結(jié)腸直腸癌患者和具有肝轉(zhuǎn)移的結(jié)腸直腸癌患者的血漿mtdna%的繪圖1700。
圖18示出健康受試者(黑色)、hbv攜帶者(黃色)、肝硬化患者(藍(lán)色)和hcc患者(紅色)中循環(huán)線粒體dna的大小分布圖。出于比較,示出一個(gè)健康對(duì)照受試者的循環(huán)核dna的大小分布圖(點(diǎn)線)。
圖19是示出根據(jù)本發(fā)明的實(shí)施例的分析有機(jī)體的生物樣品以使用生物樣品中線粒體dna的量確定有機(jī)體癌癥水平的分類的方法1900的流程圖。
圖20是示出根據(jù)本發(fā)明的實(shí)施例的在不同群組中血漿樣品中線粒體dna(mtdna)的序列讀段百分比的圖示2000。
圖21是示出根據(jù)本發(fā)明的實(shí)施例的血漿樣品中mtdna的序列讀段百分比對(duì)sledai的繪圖2100。
圖22是示出根據(jù)本發(fā)明的實(shí)施例的血漿樣品中mtdna的序列讀段百分比對(duì)抗dsdna抗體水平的繪圖2200。
圖23是示出根據(jù)本發(fā)明的實(shí)施例的各種群組的血漿樣品中mtdna的序列讀段百分比的圖示2300。
圖24是示出根據(jù)本發(fā)明的實(shí)施例的分析有機(jī)體生物樣品以使用mtdna的量確定有機(jī)體中水平自身免疫疾病的分類的方法2400的流程圖。
圖25是示出根據(jù)本發(fā)明的實(shí)施例的各種群組的線粒體dna(mtdna)大小分布的繪圖2500。
圖26是示出根據(jù)本發(fā)明的實(shí)施例的分析有機(jī)體生物樣品以使用mtdna的大小確定有機(jī)體中水平自身免疫疾病的分類的方法2600的流程圖。
圖27是示出根據(jù)本發(fā)明的實(shí)施例的分析懷有胎兒的女性受試者的生物樣品以估測(cè)從非造血組織來源得到的生物樣品中dna濃度的方法2700的流程圖。
圖28示出根據(jù)本發(fā)明的實(shí)施例的可與系統(tǒng)和方法一起使用的實(shí)例計(jì)算機(jī)系統(tǒng)10的框圖。
術(shù)語
如本文所使用,術(shù)語“生物樣品”是指從受試者(例如人類,如孕婦)取得并含有所關(guān)注的一個(gè)或多個(gè)核酸分子的任何樣品。實(shí)例包括血漿、唾液、胸膜液、汗液、腹水、膽汁、尿、血清、胰液、糞便、子宮頸灌洗液和子宮頸涂片樣品。
術(shù)語“核酸”或“多核苷酸”是指脫氧核糖核酸(dna)和其呈單鏈或雙鏈形式的聚合物。除非具體限制,否則所述術(shù)語涵蓋含有天然核苷酸的已知類似物的核酸,其具有與參考核酸類似的鍵合特性并且以與天然存在的核苷酸類似的方式代謝。除非另外指示,否則具體核酸序列也暗含地涵蓋其保守修飾變異體(例如簡(jiǎn)并密碼子取代)、等位基因、直系同源物、單核苷酸多態(tài)性(snp)和互補(bǔ)序列以及明確指明的序列。具體來說,簡(jiǎn)并密碼子取代可通過產(chǎn)生其中一個(gè)或多個(gè)選擇的(或所有)密碼子的第三位置被混合的堿基和/或脫氧肌苷殘基取代的序列來實(shí)現(xiàn)(batzerma等人,《核酸研究(nucleicacidres.)》1991;19:5081;ohtsukae等人,《生物化學(xué)雜志(jbiolchem)》1985;260:2605-2608;以及rossolinigm等人,《分子與細(xì)胞探測(cè)(mol.cell.probes)》1994;8:91-98)。
術(shù)語“基因”意指涉及產(chǎn)生多肽鏈的dna區(qū)段。其可包括編碼區(qū)之前和之后的區(qū)域(前導(dǎo)序列和尾部序列)的區(qū)域以及單獨(dú)編碼區(qū)段(外顯子)之間的插入序列(內(nèi)含子)。
如本文所使用,術(shù)語“基因座(locus)”或其復(fù)數(shù)形式“基因座(loci)”是在基因組上具有變化的任何長(zhǎng)度的核苷酸(或堿基對(duì))的位置或位址。
術(shù)語“測(cè)序標(biāo)簽”(也被稱為序列讀段)是指從核酸分子的全部或部分(例如,dna片段)獲得的序列。在一個(gè)實(shí)施例中,僅測(cè)序片段的一個(gè)末端,例如,約30個(gè)堿基。然后可將測(cè)序標(biāo)簽與參考基因組進(jìn)行比對(duì)。替代地,可測(cè)序片段的兩個(gè)末端以產(chǎn)生兩個(gè)測(cè)序標(biāo)簽,這可提供更大的比對(duì)精確性并且還提供片段的長(zhǎng)度。在又一實(shí)施例中,例如,通過接合可環(huán)化線性dna片段,并且可測(cè)序跨越接合位點(diǎn)的部分。
術(shù)語分?jǐn)?shù)胎兒dna濃度與術(shù)語胎兒dna比例和胎兒dna分?jǐn)?shù)互換使用,并且是指從胎兒和/或胎盤得到的母本血漿或血清樣品中存在的dna分子的比例(loymd等人《美國(guó)人類遺傳學(xué)雜志(amjhumgenet)》1998;62:768-775;lunfmf等人《臨床化學(xué)》2008;54:1664-1672)。
術(shù)語“大小分布圖”大體上涉及生物樣品中dna片段的大小。大小分布圖可是提供各種大小dna片段的量的分布的直方圖。各種統(tǒng)計(jì)參數(shù)(也稱為大小參數(shù)或僅稱為參數(shù))可用于區(qū)別一個(gè)大小分布圖與另一個(gè)大小分布圖。一個(gè)參數(shù)是相對(duì)于所有dna片段或相對(duì)于另一大小或范圍的dna片段的具體大小或大小范圍的dna片段的百分比。
如本文所使用,術(shù)語“參數(shù)”意指表征定量數(shù)據(jù)集和/或定量數(shù)據(jù)集之間數(shù)字關(guān)系的數(shù)值。舉例來說,第一核酸序列的第一量和第二核酸序列的第二量之間的比率(或比率的函數(shù))是參數(shù)。
如本文所使用,術(shù)語“分類”是指與樣品的具體特性相關(guān)聯(lián)的一個(gè)或多個(gè)任何數(shù)字或一個(gè)或多個(gè)其它字符(包括詞)。舉例來說,“+”符號(hào)可表示樣品分類為具有缺失或擴(kuò)增(例如復(fù)制)。術(shù)語“截止值”和“閾值”是指操作中所使用的預(yù)定數(shù)字。舉例來說,截止大小可指一種大小,高于所述大小則排除片段。閾值可是一個(gè)值,高于或低于所述值則適用具體分類。這些術(shù)語中的任一個(gè)可在這些背景中的任一背景下使用。
“非造血組織來源”是指除血液系統(tǒng)外的任何器官。實(shí)例包括肝、肺、心臟、大腦、非造血癌癥、胎盤等。
術(shù)語“核dna”是指源自細(xì)胞核的dna。“核基因組”對(duì)應(yīng)于源自細(xì)胞核的核dna。“線粒體基因組”對(duì)應(yīng)于源自細(xì)胞的線粒體的dna。
術(shù)語“癌癥水平”可指癌癥是否存在、癌癥階段、腫瘤大小、涉及染色體區(qū)多少缺失或擴(kuò)增(例如復(fù)制或三倍)和/或癌癥嚴(yán)重程度的其它量度。癌癥水平可是數(shù)字或其它字符。水平可是零。癌癥水平還包括與缺失或擴(kuò)增相關(guān)聯(lián)的惡化前或癌變前病況。
術(shù)語“sle水平”可指患者(或有機(jī)體)是否具有sle、患者呈現(xiàn)的癥狀程度或在患者的具體器官或整體中sle的進(jìn)展程度。sle水平可是定量的(即,由數(shù)字或數(shù)字標(biāo)度的下降表示)或定性的。sle水平可與建立的疾病度量值(例如,具體組織中全身性紅斑狼瘡疾病活動(dòng)指數(shù)(sledai)或抗dna抗體滴度)相關(guān)或由其表示。sledai是評(píng)分的實(shí)例。如下文所論述,sle水平還可對(duì)應(yīng)于患者被歸類或分診的群組(即,休眠、輕微活動(dòng)和中等/高活動(dòng))。
具體實(shí)施方式
實(shí)施例已經(jīng)確認(rèn)血漿dna的關(guān)鍵來源是造血源。因此,血漿dna可被視為造血dna加上其它來源的臨床相關(guān)dna(例如,孕婦血漿中胎兒(胎盤)dna和癌癥患者血漿中腫瘤dna)的組合。以下結(jié)果示出生物樣品中相比于核dna分子的量的線粒體dna分子的量可用于估測(cè)樣品中胎兒dna的分?jǐn)?shù)。此外,可測(cè)定來自非造血組織來源的dna的百分比。
在一些實(shí)施例中,dna分子的隨機(jī)測(cè)序可提供在到參考核基因組和參考線粒體基因組的映射程序中使用的序列讀段??苫谛蛄凶x段映射的位置確定dna分子是線粒體dna還是核dna??蓮慕?jīng)映射的序列讀段測(cè)定樣品中線粒體dna的相對(duì)量。如下文所示,實(shí)施例可使用相對(duì)量精確確定癌癥水平。此外,線粒體dna的相對(duì)量可用于測(cè)定腫瘤大小和每個(gè)腫瘤細(xì)胞內(nèi)線粒體dna的量的乘積。
此外,根據(jù)以下結(jié)果,相比于生物樣品中核dna分子的量的線粒體dna分子的相對(duì)量還可用于精確確定有機(jī)體的水平自身免疫疾病。此外,線粒體dna分子大小分布的統(tǒng)計(jì)值可用于確定有機(jī)體的水平自身免疫疾病(例如,全身性紅斑狼瘡的水平)。
i.細(xì)胞中的線粒體
由于不同細(xì)胞類型可具有不同數(shù)量的線粒體,所以每個(gè)細(xì)胞中線粒體的數(shù)量在不同組織上可大大不同。線粒體產(chǎn)生能量并且不同細(xì)胞需要不同量的能量。線粒體基因組為16kb。
結(jié)果,細(xì)胞中線粒體dna和核dna的相對(duì)豐度在不同組織中是不同的。血漿和血清包括從身體中各種組織的細(xì)胞得到的游離線粒體dna和核dna??纱嬖诟淖儚哪承┘?xì)胞得到的游離dna的量的狀況。舉例來說,懷孕使游離胎盤(胎兒)dna存在于血漿或血清中。作為另一實(shí)例,腫瘤可使來自感染的組織的更多的dna存在于樣品中。
因?yàn)槊總€(gè)細(xì)胞中線粒體數(shù)量的不同,所以來自具體組織的附加游離dna(或在胎盤的情況下新游離dna)可引起樣品中線粒體dna(mtdna)的量的改變。因此,血漿(或血清)中線粒體dna的絕對(duì)和分?jǐn)?shù)濃度的定量分析可用于反映由不同生理或病理的狀況產(chǎn)生的來自組織器官的dna增加或減少的份額。
圖1是示出組織類型和每個(gè)細(xì)胞對(duì)應(yīng)的線粒體數(shù)量的表100。列110列出各種組織。列120列出具有變化的每個(gè)細(xì)胞線粒體的數(shù)量。如可看出,線粒體的數(shù)量大幅變化。大多數(shù)組織類型比血細(xì)胞具有更多的線粒體,但是胃組織具有更少的線粒體。
血漿中線粒體dna分?jǐn)?shù)的定量分析可用于檢測(cè)其它類型的癌癥,其條件是癌癥組織中線粒體dna和核dna的相對(duì)豐度不同于(高于或低于)血細(xì)胞中線粒體dna和核dna的相對(duì)豐度。對(duì)于其中線粒體dna低于血細(xì)胞的組織,可觀測(cè)到血漿中較低的線粒體分?jǐn)?shù)。假設(shè)每個(gè)細(xì)胞含有大約一組核dna,那么線粒體dna和核dna的相對(duì)豐度主要由細(xì)胞中線粒體的數(shù)量決定。
ii.孕婦血漿中胎兒dna的分?jǐn)?shù)濃度的分析
從胎兒得到的dna存在于孕婦的無細(xì)胞血漿中(lo等人《柳葉刀(lancet)》1997;350:485-7)。母本血漿樣品中胎兒dna的分?jǐn)?shù)濃度(也被稱為胎兒dna分?jǐn)?shù)(f%))是基于母本血漿dna的分析決定各種非侵入性產(chǎn)前測(cè)試(例如在染色體非整倍體的非侵入性產(chǎn)前測(cè)試中)的精度的重要參數(shù)(chiu等人《英國(guó)醫(yī)學(xué)雜志(bmj)》2011;342:c7401)。一些實(shí)施例提供通過定量分析母本樣品中線粒體dna測(cè)定母本血漿樣品中胎兒dna的分?jǐn)?shù)濃度的方法。盡管提供用于血漿的實(shí)例結(jié)果,但是實(shí)施例可與包括線粒體dna片段的其它樣品(例如血清或尿)一起使用。
a.不同組織的血漿mtdna%
在健康受試者中,造血系統(tǒng)中的細(xì)胞是血漿中循環(huán)游離dna的主要來源(lui等人《臨床化學(xué)》2002;48:421-427)。在孕婦中,胎盤將dna釋放到母本循環(huán)中。從胎盤得到的dna攜帶胎兒的基因信息并且在非侵入性產(chǎn)前測(cè)試領(lǐng)域中通常被稱為‘胎兒dna’。因此,胎兒dna涵蓋從胎盤得到的dna和從胎兒得到的任何其它dna。執(zhí)行胎盤和血細(xì)胞中線粒體dna和核dna的分析,作為測(cè)量技術(shù)的驗(yàn)證和對(duì)表100中數(shù)據(jù)的對(duì)應(yīng)。
為了測(cè)定胎盤和血細(xì)胞中線粒體dna和核dna的相對(duì)豐度,我們使用illuminahiseq系列測(cè)序儀測(cè)序四位孕婦的胎盤組織和對(duì)應(yīng)的血細(xì)胞樣品。根據(jù)qiaampdspdna血液微型試劑盒(qiaampdspdnabloodminikit)的血液和體液方案從血沉棕黃層樣品提取基因組dna。用qiaampdna微型試劑盒(凱杰(qiagen))從胎盤組織提取dna。用科瓦里斯s220對(duì)焦超聲發(fā)生器(covariss220focused-ultrasonicator)將五微克基因組dna剪切到大約200bp。然后用成對(duì)端樣品制備試劑盒(paired-endsamplepreparationkit)(伊路米那(illumina))構(gòu)建dna樣本的測(cè)序庫。使用illuminahiseq系列測(cè)序儀測(cè)序每個(gè)樣品的測(cè)序庫。從dna片段兩個(gè)末端中的每個(gè)末端測(cè)序七十五個(gè)核苷酸。在成對(duì)端模式中借助于短寡核苷酸比對(duì)程序2(shortoligonucleotidealignmentprogram2,soap2)(li等人《生物信息學(xué)(bioinformatics)》2009;25:1966-7)分析成對(duì)端測(cè)序數(shù)據(jù)。對(duì)于每個(gè)成對(duì)端讀段,將來自每個(gè)末端的75bp與由非重復(fù)掩蔽參考人類核基因組(hg19)和人類線粒體基因組兩者組成的參考序列進(jìn)行比對(duì)。對(duì)于每個(gè)末端的比對(duì),允許至多2個(gè)核苷酸錯(cuò)配。被映射到組合的人類核基因組和線粒體基因組的唯一位置的讀段用于下游分析。對(duì)于每個(gè)樣品,測(cè)定與線粒體基因組進(jìn)行比對(duì)的dna片段的分?jǐn)?shù)(比例)(被表示為mtdna%)。
圖2示出根據(jù)本發(fā)明的實(shí)施例的胎盤和血細(xì)胞的與線粒體基因組進(jìn)行比對(duì)的dna片段的分?jǐn)?shù)(mtdna%)的繪圖200。每個(gè)數(shù)據(jù)點(diǎn)對(duì)應(yīng)于胎盤或紅細(xì)胞的具體組織樣品中為線粒體dna的dna的百分比(mtdna%)。如從表100預(yù)期的,胎盤組織樣品通常具有較高的mtdna%。
因?yàn)樘ケP中較高的線粒體dna分?jǐn)?shù),所以從胎盤得到的胎兒dna的分?jǐn)?shù)濃度將影響孕婦血漿中線粒體dna的濃度(絕對(duì)或分?jǐn)?shù))。預(yù)期較高的胎兒dna分?jǐn)?shù)將與母本血漿中較高的線粒體dna濃度相關(guān)聯(lián)。線粒體dna的絕對(duì)濃度仍然依賴于樣品中dna的已知濃度,并且因此仍然具有分?jǐn)?shù)/百分比方面。舉例來說,已知血漿樣品中dna的量具有特定的dna濃度。因此,假設(shè)新樣品具有已知的濃度,那么可使用線粒體dna的絕對(duì)濃度。
圖3示出根據(jù)本發(fā)明的實(shí)施例的非懷孕樣品和懷孕樣品(第1個(gè)三月期和第3個(gè)三月期)血漿mtdna%的繪圖300。測(cè)序來自四個(gè)非懷孕女性血漿樣品、59個(gè)第1個(gè)三月期懷孕血漿樣品和10個(gè)第3個(gè)三月期懷孕血漿樣品的dna片段。非懷孕女性的平均血漿mtdna%為0.0009%;第1個(gè)三月期為0.0017%;并且第3個(gè)三月期為0.0012%。第1個(gè)三月期樣品明顯地高于來自非懷孕女性的那些樣品(曼惠特尼檢驗(yàn)(mannwhitneytest),p值=0.017)和第3個(gè)三月期樣品(曼惠特尼檢驗(yàn),p值=0.054)。因此,可看出在懷孕情況下血漿樣品中mtdna的比例高于非懷孕女性個(gè)體。
圖4示出根據(jù)本發(fā)明的實(shí)施例的第1個(gè)三月期懷孕和第3個(gè)三月期懷孕之間的血漿mtdna%差異的繪圖400。第1個(gè)三月期懷孕的血漿線粒體dna%比非懷孕樣品(參見圖3)和第3個(gè)三月期懷孕樣品高。第1個(gè)三月期胎盤細(xì)胞中的線粒體dna含量通常比第3個(gè)三月期胎盤細(xì)胞中線粒體dna含量高(參見圖5),從而對(duì)于第1個(gè)三月期樣品,產(chǎn)生較高的測(cè)量值。
圖5示出根據(jù)本發(fā)明的實(shí)施例的血沉棕黃層(bc)、絨毛取樣(cvs)和胎盤(第3個(gè)三月期)中線粒體dna百分比(mtdna%)的繪圖500。在第1個(gè)三月期中取得cvs。測(cè)量并比較血沉棕黃層、cvs和胎盤中的mtdna%。血沉棕黃層、cvs和胎盤的平均mtdna%分別為0.073%、0.189%和0.07%。cvs的mtdna%明顯地高于血沉棕黃層的mtdna%(曼惠特尼檢驗(yàn),=0.001)和胎盤的mtdna%(t-檢驗(yàn),p值=0.008),同時(shí)胎盤與血沉棕黃層沒有顯著差異。針對(duì)第三個(gè)三月期測(cè)量胎盤。因此,可通過組織mtdna%解釋血漿mtdna%的差異。
以上數(shù)據(jù)指示樣品中mtdna的量與胎兒dna濃度相關(guān),尤其在第三個(gè)三月期之前,因?yàn)閷?duì)于已知具有較高胎兒dna濃度的樣品,mtdna較高。以下部分提供示出mtdna%與胎兒dna濃度成比例的更多特定數(shù)據(jù)。
b.與f%成比例的mtdna%
由于胎盤細(xì)胞的每個(gè)細(xì)胞具有較多的線粒體,并且胎盤是母本血漿中胎兒dna的主要貢獻(xiàn)因素,所以當(dāng)血漿樣品中存在胎兒dna時(shí),對(duì)血漿樣品的份額較高。此外,當(dāng)胎兒dna濃度較高時(shí),將存在較高比例的mtdna。以下證明此關(guān)系是正確的。
圖6是示出根據(jù)本發(fā)明的實(shí)施例的血漿樣品中線粒體dna分?jǐn)?shù)和胎兒dna分?jǐn)?shù)之間正相關(guān)的繪圖600。每個(gè)數(shù)據(jù)點(diǎn)對(duì)應(yīng)于不同的血漿樣品。垂直軸線示出血漿樣品中的mtdna%。水平軸線示出胎兒dna分?jǐn)?shù)(濃度)。對(duì)于此數(shù)據(jù),使用來自男性胎兒的y染色體測(cè)定胎兒dna分?jǐn)?shù)。正相關(guān)為具有p<0.001的置信度的r=0.51(皮爾遜相關(guān)(pearsoncorrelation))。因此,可看出mtdna%可用于估測(cè)胎兒dna分?jǐn)?shù)。其它技術(shù)可用于測(cè)定胎兒dna分?jǐn)?shù)。另一實(shí)例是使用父本繼承遺傳標(biāo)記,如單核苷酸多態(tài)性或簡(jiǎn)單串連重復(fù)多態(tài)性或插入-缺失多態(tài)性。另一實(shí)例是使用表觀遺傳標(biāo)記,如胎兒和母本dna之間差異甲基化的區(qū)域(poon等人《臨床化學(xué)》2002;48:35-41;chiu等人《美國(guó)病理學(xué)雜志(amjpathol)》2007;170:941-950;chan等人《臨床化學(xué)》2006:52:2211-2218;美國(guó)專利6,927,028)??墒褂帽绢I(lǐng)域的技術(shù)人員已知的方法(包括聚合酶鏈?zhǔn)椒磻?yīng)(pcr)、數(shù)字pcr、測(cè)序、大規(guī)模平行測(cè)序和靶向大規(guī)模平行測(cè)序)分析以上標(biāo)記。
為了獲得圖6的數(shù)據(jù),使用illuminahiseq2500系統(tǒng)測(cè)序各自懷有男性胎兒的182位孕婦的血漿樣品。對(duì)于每位孕婦,使用truseqdna樣品制備試劑盒(伊路米那公司)將從2.5ml到4ml血漿提取的dna用于構(gòu)建測(cè)序庫。以12重格式執(zhí)行測(cè)序。換句話說,將12個(gè)樣品的條形碼測(cè)序庫加載到用于測(cè)序的illumina流動(dòng)細(xì)胞的一個(gè)泳道上。在測(cè)序之后,通過樣品特定條形碼鑒定每個(gè)樣品的測(cè)序讀段。單端方案用于測(cè)序。對(duì)于每個(gè)測(cè)序dna片段測(cè)序三十六個(gè)核苷酸。使用soap2程序,將測(cè)序數(shù)據(jù)與包含非重復(fù)掩蔽參考人類核基因組(hg19)和人類線粒體基因組兩者的參考序列進(jìn)行比對(duì)。被映射到人類核基因組和線粒體基因組的唯一位置的讀段用于下游分析。為每個(gè)樣品計(jì)算與線粒體基因組進(jìn)行比對(duì)的dna片段的分?jǐn)?shù)(由mtdna%表示)。如先前描述,基于與y染色體進(jìn)行比對(duì)的dna片段的分?jǐn)?shù)測(cè)定胎兒dna分?jǐn)?shù)(chiu等人《英國(guó)醫(yī)學(xué)雜志》2011;342:c7401)。由于線粒體基因組和核基因組之間存在相當(dāng)大的同源性,所以使用更嚴(yán)格要求的映射精確性,進(jìn)一步將被初始地映射到線粒體基因組的所有測(cè)序讀段與組合的核基因組和線粒體基因組進(jìn)行再比對(duì)。
來自圖3的數(shù)據(jù)還示出血漿mtdna%和胎兒dna濃度f%之間的相關(guān)性。在一些實(shí)施例中,可如下執(zhí)行從y染色體序列的比例計(jì)算胎兒dna分?jǐn)?shù)(f%)。對(duì)于懷有男性胎兒的情況,可從與y染色體進(jìn)行比對(duì)的讀段的比例(chry%)推導(dǎo)胎兒dna分?jǐn)?shù)(f%)。來自懷有女性胎兒的孕婦的極小比例的測(cè)序讀段將與y染色體錯(cuò)誤地進(jìn)行比對(duì)(chiu等人,2008)。因此,來自懷有男性胎兒的血漿的chry%由誤比對(duì)讀段和從男性胎兒得到的正確讀段構(gòu)成。為了推導(dǎo)f%,可使用以下等式:
chry%=[chry%男性×f%]-[chry%女性×(1-f%)]
chry%男性是含有100%男性dna的血漿樣品中與y染色體進(jìn)行比對(duì)的讀段的比例,而chry%女性是含有100%女性dna的血漿樣品中與y染色體進(jìn)行比對(duì)的讀段(誤比對(duì)讀段)的比例。可從對(duì)照樣品測(cè)定chry%男性和chry%女性。
圖7是示出根據(jù)本發(fā)明的實(shí)施例的在第1個(gè)三月期懷孕中胎兒dna分?jǐn)?shù)和血漿線粒體dna百分比之間相關(guān)性的繪圖700。從來自圖3的59個(gè)第1個(gè)三月期血漿樣品測(cè)量f%和血漿mtdna%。樣品的血漿mtdna%和f%之間存在正相關(guān)(p值=0.0006;r2=0.189。因此,已經(jīng)示出mtdna%與分?jǐn)?shù)胎兒濃度f%一致相關(guān)。
c.使用mtdna%定量化f%
因?yàn)檠獫{中胎兒dna分?jǐn)?shù)和線粒體dna分?jǐn)?shù)之間的相關(guān)性,所以定量化血漿線粒體dna分?jǐn)?shù)可用于測(cè)量母本血漿樣品中的胎兒dna分?jǐn)?shù)。因此,mtdna%可用于測(cè)定胎兒dna分?jǐn)?shù)。一種益處是可在不必將胎兒dna與母本dna區(qū)分開的情況下計(jì)算mtdna%。并且,可使用如與成對(duì)端測(cè)序相反的單端測(cè)序,如果dna片段的大小用于測(cè)定胎兒dna濃度而將使用的。因此,可通過使用單端測(cè)序降低測(cè)序成本。
為了測(cè)試預(yù)測(cè)胎兒dna濃度的能力,我們將用于圖6的所有182個(gè)血漿樣品隨機(jī)地劃分為兩組,即訓(xùn)練組和驗(yàn)證組。訓(xùn)練組用于確定血漿線粒體dna分?jǐn)?shù)和胎兒dna分?jǐn)?shù)的關(guān)系。然后,在驗(yàn)證組中,基于從訓(xùn)練組確定的公式,線粒體dna分?jǐn)?shù)用于推導(dǎo)胎兒dna分?jǐn)?shù)。
圖8示出根據(jù)本發(fā)明的實(shí)施例的測(cè)定血漿中線粒體dna分?jǐn)?shù)和胎兒dna分?jǐn)?shù)之間函數(shù)關(guān)系的訓(xùn)練數(shù)據(jù)的繪圖800。對(duì)于訓(xùn)練組,線粒體dna分?jǐn)?shù)和胎兒dna分?jǐn)?shù)之間的關(guān)系(校準(zhǔn)函數(shù))被確定為
mtdna%=f%×0.0001226335+0.001141848%
其中mtdna是血漿樣品中線粒體dna分?jǐn)?shù)(以%為單位);并且f是樣品的胎兒dna分?jǐn)?shù)(以%為單位)。對(duì)于驗(yàn)證組,根據(jù)公式,每個(gè)樣品的線粒體dna分?jǐn)?shù)用于推導(dǎo)樣品中的胎兒dna分?jǐn)?shù)。
圖9示出根據(jù)本發(fā)明的實(shí)施例的針對(duì)測(cè)量的胎兒dna分?jǐn)?shù)繪制從線粒體dna分?jǐn)?shù)推導(dǎo)的胎兒dna分?jǐn)?shù)的繪圖900,所述測(cè)量的胎兒dna分?jǐn)?shù)基于與y染色體進(jìn)行比對(duì)的血漿dna片段的分?jǐn)?shù)。推導(dǎo)的和測(cè)量的胎兒dna分?jǐn)?shù)示出良好的相關(guān)性(r=0.61,p<0.001,皮爾遜相關(guān))。推導(dǎo)值與測(cè)量值的中位差為5.1%(四分位差:2.6%到8.2%)。
因此,可確定提供樣品的mtdna濃度和胎兒dna濃度之間的關(guān)系的校準(zhǔn)函數(shù)。當(dāng)從新受試者獲得新樣品時(shí),可測(cè)量mtdna濃度,并且校準(zhǔn)函數(shù)可用于將mtdna濃度轉(zhuǎn)換成為胎兒dna濃度。mtdna濃度可為分?jǐn)?shù)濃度或相對(duì)濃度,但是絕對(duì)濃度將仍然采用基于典型dna濃度的一些分?jǐn)?shù)表示。作為實(shí)例,可將絕對(duì)濃度表達(dá)為每體積(例如假設(shè)每ml總dna的具體濃度)或每ngdna的量,它們都涉及核dna的一些量度。
在各種實(shí)施例中,可通過例如(但不限于)實(shí)時(shí)pcr(chiu等人《臨床化學(xué)》2003;49:719-726)、數(shù)字pcr(lo等人《美國(guó)國(guó)家科學(xué)院院刊(procnatlacadsciusa)》2007;104:13116-13121)和質(zhì)譜(ding等人《美國(guó)國(guó)家科學(xué)院院刊》2004;101:10762-10767)測(cè)量血漿中線粒體dna的濃度。舉例來說,用于mtdna和核(ndna)兩者的引物和探針可用于測(cè)量相應(yīng)的量,并且可獲得比率。作為另一實(shí)例,引物可靶向核基因組和線粒體基因組中的同源區(qū)域,并且探針或質(zhì)譜可用于區(qū)別兩者,以便得到相應(yīng)的量。作為另一個(gè)實(shí)例,僅測(cè)量線粒體dna的引物和探針可用于測(cè)定mtdna的量,其中相對(duì)于添加到反應(yīng)的總dna(大部分是核dna)的量(例如通過分光光度法測(cè)量)或添加到反應(yīng)的樣品體積表達(dá)mtdna的量。通常存在每毫升母本血漿內(nèi)含有的總dna(大部分是核dna)的范圍。因此,dna的總量(例如,每體積或質(zhì)量)可用于獲得mtdna濃度。在其它實(shí)施例中,可單獨(dú)進(jìn)行線粒體dna和核dna的絕對(duì)濃度的測(cè)量,并且然后組合以獲得mtdna比核dna的相對(duì)量。然后可基于兩個(gè)濃度,例如(但不限于)這兩個(gè)值的比率或差異推導(dǎo)胎兒dna濃度。
mtdna%與胎兒dna分?jǐn)?shù)相關(guān)的其它證據(jù)可通過mtdna%與核dna片段的大小相關(guān)看出。核dna片段的大小和胎兒dna分?jǐn)?shù)之間的相關(guān)性已經(jīng)先前在美國(guó)專利公開案2013/023743中示出,所述專利公開案以全文引用的方式并入。
圖10是示出根據(jù)本發(fā)明的實(shí)施例的第1個(gè)三月期樣品的血漿dna大小比率和血漿mtdna%之間相關(guān)性的繪圖1000。使用來自圖3的59個(gè)第1個(gè)三月期血漿樣品。發(fā)現(xiàn)血漿mtdna%明顯地與大小比率相關(guān)(p值<0.0001,r2=0.35)。在此實(shí)例中血漿dna大小分布被確定為:
p(100-150)是長(zhǎng)度100bp和150bp之間的母親和胎兒的核dna片段的比例。p(163-169)是長(zhǎng)度163bp和169bp之間的dna片段的比例。
使用此類大小比率測(cè)定胎兒dna濃度的缺點(diǎn)是必須進(jìn)行成對(duì)端測(cè)序。另一方面,甚至可利用單端測(cè)序獲得mtdna%,而沒有測(cè)序兩個(gè)末端的額外測(cè)序成本。
d.方法
如上所述,實(shí)施例可測(cè)定生物樣品中為線粒體dna的多個(gè)dna分子的量,并且基于所測(cè)定的量估測(cè)樣品中胎兒dna濃度。所述量可是生物樣品中為線粒體dna的多個(gè)dna分子的比例。在其它實(shí)施例中,所述量可是mtdna的濃度,例如,每單位體積,如ml。在一個(gè)實(shí)施例中,實(shí)時(shí)pcr可用于測(cè)定mtdna的絕對(duì)濃度,并且使用如針對(duì)mtdna百分比所示的類似函數(shù)估算測(cè)定胎兒dna濃度。
圖11是示出根據(jù)本發(fā)明的實(shí)施例的分析懷有胎兒的女性受試者的生物樣品以估測(cè)生物樣品中胎兒dna濃度的方法1100的流程圖。在一些實(shí)施例中,生物樣品可為血漿或血清。生物樣品包括來自女性受試者和胎兒的游離dna。生物樣品的游離dna包括線粒體dna和核dna。
在一個(gè)實(shí)施方案中,可在機(jī)器例如測(cè)序機(jī)處接收生物樣品,所述機(jī)器輸出可用于確定dna片段是核dna還是線粒體dna的測(cè)量數(shù)據(jù)(例如序列讀段)。如本文所述的其它方法可以,方法1100可完全或部分地用計(jì)算機(jī)系統(tǒng)執(zhí)行。
在框1110處,在計(jì)算機(jī)系統(tǒng)處接收生物樣品中多個(gè)dna分子的序列信息。作為實(shí)例,對(duì)于其獲得序列信息的dna分子的數(shù)量可為至少500,000個(gè)??蓪?duì)于本文所述的其它方法分析此數(shù)量的dna分子。
可以多種方式獲得序列信息。舉例來說,dna分子的序列可作為對(duì)應(yīng)于具體序列的具體顏色探針的單個(gè)測(cè)量值接收。在其它實(shí)施例中,可從每個(gè)堿基的測(cè)序測(cè)量值(例如,每個(gè)堿基的強(qiáng)度信號(hào))測(cè)定dna分子的序列。在一個(gè)實(shí)施方案中,使用轉(zhuǎn)接器隨機(jī)地測(cè)序dna分子。
在框1120處,對(duì)于生物樣品中多個(gè)dna分子中的每個(gè),確定dna分子是核dna分子還是線粒體dna分子。可使用dna分子的序列信息確定dna分子在參考核基因組或參考線粒體基因組中的位置。如果確定dna分子位于參考核基因組中,那么dna分子被確認(rèn)為核dna。如果確定dna分子位于參考線粒體基因組中,那么dna分子被確認(rèn)為線粒體dna。如果未以足夠的精確性確定dna分子僅位于參考核基因組或參考線粒體基因組中,那么可舍棄所述dna分子,并且因此將不包括在分析的多個(gè)dna分子中。
作為確定dna片段(分子)的位置的一部分,可測(cè)序dna片段以獲得序列讀段,并且可將序列讀段映射(比對(duì))到參考核基因組或參考線粒體基因組。如果有機(jī)體是人類,那么參考基因組是潛在地來自具體亞群的參考人類基因組。作為另一實(shí)例,可用不同探針(例如以下的pcr或其它擴(kuò)增)分析游離dna片段,其中每個(gè)探針對(duì)應(yīng)于不同位置。在一些實(shí)施例中,可通過接收序列讀段或?qū)?yīng)于游離dna片段的其它實(shí)驗(yàn)數(shù)據(jù),并且然后使用計(jì)算機(jī)系統(tǒng)分析實(shí)驗(yàn)數(shù)據(jù)來執(zhí)行游離dna片段的分析。
在框1130處,測(cè)量被確認(rèn)為線粒體dna的多個(gè)dna分子的歸一化量。可以各種方式測(cè)定線粒體dna的量。舉例來說,可計(jì)數(shù)線粒體dna片段的數(shù)量。作為另一實(shí)例,可計(jì)數(shù)線粒體dna片段的堿基的數(shù)量。
量可以多種方式歸一化。舉例來說,總可使用的dna分子(即,已經(jīng)對(duì)其進(jìn)行確認(rèn)的dna分子)可通過除以線粒體dna分子的量用于歸一化。當(dāng)總是使用相同數(shù)量的可使用的dna分子時(shí),出現(xiàn)相同的結(jié)果。另一實(shí)例是線粒體dna分子的量和核dna分子的量的比率。因此,歸一化量可與包括被確認(rèn)為核dna分子的dna分子的多個(gè)dna分子的第二量相關(guān)。作為實(shí)例,第二量可為核和線粒體dna分子的量或僅為核dna分子的量??捎?jì)算第一量和第二量的比率以獲得歸一化量。
在一個(gè)實(shí)施例中,歸一化量為血漿線粒體dna百分比??扇缦聢?zhí)行血漿線粒體dna百分比(血漿mtdna%)計(jì)算。血漿線粒體百分比(血漿mtdna%)可對(duì)應(yīng)于唯一地映射到線粒體dna基因組的讀段的比例。其反映血漿中線粒體dna份額,并且可如下計(jì)算:
因此,在一個(gè)實(shí)施例中,多個(gè)dna分子的歸一化量對(duì)應(yīng)于生物樣品中線粒體dna的比例??蓽y(cè)定為線粒體dna的多個(gè)dna分子的第一量,并且可測(cè)定被確認(rèn)為核dna的dna分子的第二量。作為測(cè)定歸一化的一部分,可計(jì)算第一量和第二量的比率(例如以上示出的百分比),例如,可應(yīng)用倍增因數(shù),如100%縮放。
在其它實(shí)施例中,歸一化量可為mtdna的濃度,例如,每單位體積(如ml)或每質(zhì)量/重量的dna。在其中僅針對(duì)參考線粒體基因組確定多個(gè)dna分子的位置(例如,使用mtdna特定探針)的實(shí)施例中,位置被確定的所有多個(gè)dna分子將為線粒體dna。在此類實(shí)施例中,例如,使用探針,測(cè)量被確認(rèn)為線粒體dna的多個(gè)dna分子的第一量。并且,例如,如上所述,可測(cè)量生物樣品中dna的總量(包括核dna的dna的總量)。歸一化量將使用第一量和總量的比率,以獲得對(duì)多個(gè)dna分子的第二量(例如總量)的mtdna的相對(duì)量,所述多個(gè)dna分子包括被確認(rèn)為核dna分子的dna分子。
在框1140處,獲得指明線粒體dna濃度和胎兒dna濃度之間的關(guān)系的校準(zhǔn)函數(shù)。校準(zhǔn)函數(shù)的實(shí)例是來自以上的函數(shù):mtdna%=f%×0.0001226335+0.001141848%。對(duì)于f%的每個(gè)值,此函數(shù)提供mtdna%的值。對(duì)于mtdna%的每個(gè)值,重新排列此函數(shù)提供f%的值:
可通過從存儲(chǔ)器讀取0.0001226335和0.001141848(系數(shù)的實(shí)例)獲得此類校準(zhǔn)函數(shù)。
以多種方式將校準(zhǔn)函數(shù)定義為例如,指定函數(shù),如線性或非線性函數(shù)的多個(gè)系數(shù)。其它實(shí)施例可存儲(chǔ)多個(gè)校正數(shù)據(jù)點(diǎn)(例如校準(zhǔn)函數(shù)的數(shù)據(jù)點(diǎn)),使得可產(chǎn)生校準(zhǔn)函數(shù)。此外,可在此類校正數(shù)據(jù)點(diǎn)之間執(zhí)行插值以獲得校準(zhǔn)函數(shù)。不管如何定義校準(zhǔn)函數(shù),都可從存儲(chǔ)器檢索值。
如上所述,可從校正樣品測(cè)定校正數(shù)據(jù)點(diǎn)以及因此測(cè)定校準(zhǔn)函數(shù)。此類校正樣品的實(shí)例包括用于圖6和圖7的數(shù)據(jù)。在這些樣品中,胎兒dna分?jǐn)?shù)是已知的,并且因此這些樣品可被認(rèn)為是校正樣品。對(duì)于其胎兒dna分?jǐn)?shù)是已知的這些樣品中的每個(gè),可測(cè)量歸一化量。然后可例如通過使用另一種度量執(zhí)行最小平方線性擬合或線性擬合測(cè)定校準(zhǔn)函數(shù)??墒褂萌魏魏线m的回歸分析。
因此,可使用來自其他孕婦的多個(gè)其它樣品中的每個(gè)的值獲得校準(zhǔn)函數(shù)??稍谄渌鼧悠分袦y(cè)量胎兒dna濃度的第一值,其中胎兒dna濃度的測(cè)量將不使用線粒體dna的確認(rèn)。上文提供此類技術(shù)的實(shí)例??墒褂脧钠渌鼧悠帆@得的其它序列信息,測(cè)量為線粒體dna的多個(gè)dna分子的歸一化量的第二值。對(duì)于每個(gè)樣品,可測(cè)定根據(jù)第一值和第二值的二維數(shù)據(jù)點(diǎn),例如,如在圖6和圖7中??蓤?zhí)行二維數(shù)據(jù)點(diǎn)的回歸分析以獲得校準(zhǔn)函數(shù)。
在框1150處,基于測(cè)量的量,校準(zhǔn)函數(shù)用于估測(cè)生物樣品中的胎兒dna濃度。舉例來說,使用以上實(shí)例校準(zhǔn)函數(shù),歸一化量可為輸出胎兒dna分?jǐn)?shù)的校準(zhǔn)函數(shù)的輸入變量。在其它實(shí)施例中(例如,其中校準(zhǔn)函數(shù)被定義為數(shù)據(jù)點(diǎn)的集合),可在具有接近正被測(cè)試的歸一化量的歸一化量的兩個(gè)校正數(shù)據(jù)點(diǎn)之間使用插值。插值函數(shù)可提供胎兒dna分?jǐn)?shù)。
iii.癌癥檢測(cè)
線粒體dna的測(cè)量還可用于檢測(cè)和監(jiān)測(cè)癌癥。一些實(shí)施例可執(zhí)行樣品中游離dna片段的大規(guī)模平行測(cè)序,以獲得可映射到參考核基因組和參考線粒體基因組的序列讀段。經(jīng)映射的讀段可用于測(cè)量樣品中為線粒體dna的dna片段的比例/百分比(歸一化量的實(shí)例)。如下文所示,當(dāng)以此方式測(cè)定歸一化量時(shí),以下結(jié)果示出歸一化量在測(cè)定癌癥水平方面提供高精確性。此外,結(jié)果與其中存在腫瘤的組織中的線粒體dna含量一致。
大規(guī)模平行測(cè)序可提供以下優(yōu)點(diǎn):(1)可查詢多個(gè)部分或近似整個(gè)線粒體基因組;(2)可使用生物信息學(xué)手段排除與核基因組序列同源的線粒體基因組區(qū)域;(3)可使用基于pcr的分析法分析比通常檢測(cè)的那些序列短的序列;以及(4)可使用相同的分析法測(cè)量核序列和線粒體序列的相對(duì)量。
a.腫瘤組織和血組織的mtdna%
我們分析可存在于血液樣品(包括造血(血)細(xì)胞)中的某些組織的線粒體dna含量。如以上針對(duì)母本樣品所述,血漿樣品中下層組織(或具有游離dna的其它混合物)的線粒體dna含量影響樣品中總體線粒體dna含量。
為了分析線粒體dna含量,我們使用肝細(xì)胞癌hcc。我們測(cè)序12位患有hcc的患者的切除的腫瘤組織和腫瘤周圍的非惡性組織。使用如上所述的illuminahiseq系列測(cè)序儀執(zhí)行測(cè)序。對(duì)于待測(cè)序的每個(gè)dna片段的兩個(gè)末端中的每個(gè),測(cè)序七十五個(gè)核苷酸。使用soap2程序執(zhí)行與由參考人類核和線粒體基因組(hg19)的參考序列的成對(duì)端比對(duì)。
圖12示出hcc腫瘤組織、腫瘤周圍非惡性肝組織和血細(xì)胞樣品的平均線粒體dna百分比(mtdna%)的圖示1200。觸須表示測(cè)量值的標(biāo)準(zhǔn)偏差。與血細(xì)胞相比,hcc腫瘤組織和腫瘤周圍非惡性肝組織具有明顯更高的線粒體dna分?jǐn)?shù)(對(duì)于兩個(gè)群組,studentt-檢驗(yàn),p<0.001)。
圖示1200示出腫瘤肝組織和非惡性肝組織具有相當(dāng)?shù)膍tdna%。由于肝向血漿貢獻(xiàn)線粒體dna(mtdna),所以相對(duì)于當(dāng)不存在腫瘤時(shí),附加腫瘤組織將向血漿添加更多的dna。因?yàn)閔cc腫瘤組織中比血細(xì)胞中更高的線粒體dna分?jǐn)?shù)水平,所以hcc患者的血漿中從腫瘤得到的dna的存在將導(dǎo)致相對(duì)于核dna血漿中線粒體dna的濃度增加。
b.血漿中的mtdna%
我們分析具有各種肝狀況的各種受試者的血漿,以便說明實(shí)施例使用線粒體dna含量從其它肝狀況辨別癌癥的能力。具體來說,我們使用大規(guī)模平行測(cè)序來分析90位hcc患者的血漿。分析來自67位患有慢性hbv感染的受試者、36位患有hbv相關(guān)聯(lián)肝硬化的受試者和32位健康受試者的血漿樣品,作為對(duì)照組。
圖13示出根據(jù)本發(fā)明的實(shí)施例的健康受試者、hbv受試者、肝硬化患者和hcc患者的血漿mtdna%的繪圖1300。與對(duì)照組的所有三個(gè)群組相比較,觀測(cè)到hcc患者中血漿線粒體dna分?jǐn)?shù)升高(p<0.001,studentt-檢驗(yàn))。hcc患者和健康受試者血漿中線粒體dna的中值分?jǐn)?shù)濃度分別為0.0014%和0.00045%(p值<0.0001,曼惠特尼檢驗(yàn))。厚線示出中值。方框的上邊界和下邊界示出四分位差(即,在25%和75%之間)。觸須示出第10和第90百分位數(shù)。其它繪圖使用類似符號(hào)。
繪圖1300示出可精確地從健康受試者和患有其它肝狀況的受試者辨別患有hcc的受試者。因此,通過大規(guī)模平行測(cè)序定量分析血漿線粒體dna可用作hcc的標(biāo)記。如上所論述,可以多種方式測(cè)量相對(duì)于核dna的較高的mtdna含量以為辨別患有癌癥的患者提供歸一化量。使用roc曲線分析進(jìn)一步說明用于區(qū)分hcc患者和健康對(duì)照者的血漿線粒體分?jǐn)?shù)的診斷精確性。
圖14是示出根據(jù)本發(fā)明的實(shí)施例的用于區(qū)分hcc患者和健康對(duì)照者的血漿線粒體dna分?jǐn)?shù)的診斷精確性的接受者操作特征(roc)曲線的繪圖1400。曲線下的面積為0.93。這指示血漿中線粒體dna的分?jǐn)?shù)適用于檢測(cè)hcc。
用如由roc曲線的左上角點(diǎn)測(cè)定的截止值0.00084%,為辨別hcc患者和健康受試者實(shí)現(xiàn)80%的靈敏度和94%的特定性。當(dāng)與健康受試者相比較時(shí),在hbv攜帶者(p值=0.32,曼惠特尼檢驗(yàn))或患有肝硬化的患者(p值=0.49,曼惠特尼檢驗(yàn))之間沒有觀測(cè)到線粒體dna的分?jǐn)?shù)濃度的顯著差異。
圖15示出根據(jù)本發(fā)明的實(shí)施例的健康受試者和npc(鼻咽癌)患者的血漿mtdna%的繪圖1500。npc(鼻咽癌)患者的血漿中線粒體dna的分?jǐn)?shù)濃度是健康受試者的兩倍。此npc數(shù)據(jù)進(jìn)一步示出mtdna%可用于辨別患有癌癥的受試者和沒有癌癥的受試者??苫谙窭L圖1500的繪圖為此類辨別選擇合適的閾值。舉例來說,閾值為0.003可在相對(duì)較少的誤報(bào)的情況下提供高特定性。此類閾值是基于參考樣品(在此情況下的健康受試者)的參考值的實(shí)例。
現(xiàn)在論述在與參考值的比較中使用mtdna的歸一化量的其它實(shí)例。比較可確定量是否與參考值在統(tǒng)計(jì)上不同(例如高于還是低于)。當(dāng)參考值對(duì)應(yīng)于來自參考樣品的值時(shí),可使用差值的閾值,例如,對(duì)應(yīng)于差值的標(biāo)準(zhǔn)偏差為三,如在見于全體中的值的分布中所見。
可通過將與mtdna基因組進(jìn)行比對(duì)的序列讀段的數(shù)量除以可與任一基因組進(jìn)行比對(duì)的序列讀段的總數(shù)計(jì)算mtdna的歸一化量。此歸一化量允許來自一個(gè)樣品的結(jié)果與另一樣品的結(jié)果比較。舉例來說,歸一化量可為序列讀段的比例(例如,百分比或分?jǐn)?shù)),其中參考值是預(yù)期來自健康受試者或患有癌癥的受試者的mtdna基因組的值。但是,如對(duì)本領(lǐng)域技術(shù)人員將顯而易見的,許多其它歸一化是可能的。舉例來說,可通過將mtdna序列讀段的數(shù)量除以核序列讀段的數(shù)量或通過總是使用相同數(shù)量的序列讀段進(jìn)行歸一化。然后可將此歸一化量與閾值比較,所述閾值可從未顯示癌癥的一個(gè)或多個(gè)參考樣品測(cè)定。
在一些實(shí)施例中,閾值可為參考值。在其它實(shí)施例中,比較可包括參考值和閾值。舉例來說,比較可包括歸一化量和參考值之間的分離值(例如比率或差值),并且分離值可與閾值相比較以查看統(tǒng)計(jì)上顯著差異是否存在。
在一個(gè)實(shí)施例中,通過使用以下等式計(jì)算z評(píng)分進(jìn)行比較:z評(píng)分=(案例的歸一化量-平均值)/s.d.,其中“平均值”是參考樣品的平均歸一化量;并且s.d.是參考樣品的歸一化量的標(biāo)準(zhǔn)偏差。因此,z評(píng)分可對(duì)應(yīng)于標(biāo)準(zhǔn)偏差的數(shù)量,其中測(cè)試案例的歸一化量遠(yuǎn)離一個(gè)或多個(gè)參考受試者的平均歸一化量??蓪⒋藌評(píng)分與閾值相比較。
c.腫瘤大小
可通過若干因素測(cè)定歸一化量的量值。一個(gè)因素是生物樣品(例如血漿)中腫瘤組織的mtdna含量和從腫瘤得到的dna的分?jǐn)?shù)濃度。腫瘤組織的較高的mtdna含量增加從腫瘤釋放的游離mtdna的量。如果腫瘤組織的mtdna含量比血細(xì)胞高,那么mtdna對(duì)核dna的相對(duì)量將增加。并且,當(dāng)腫瘤組織的mtdna含量比血細(xì)胞高時(shí),樣品(例如血漿)中從腫瘤得到的dna的分?jǐn)?shù)濃度越高,那么測(cè)試案例的歸一化量越大。
為了分析歸一化量的改變,針對(duì)具有已經(jīng)例如經(jīng)由手術(shù)測(cè)定其大小和組織類型的腫瘤的患者測(cè)量血漿mtdna%。還測(cè)量所述組織類型的腫瘤中mtdna的濃度。
圖16示出根據(jù)本發(fā)明的實(shí)施例的針對(duì)腫瘤組織中線粒體dna分?jǐn)?shù)濃度與腫瘤大小的乘積繪制的血漿中線粒體dna分?jǐn)?shù)的繪圖1600。觀測(cè)到正關(guān)系(r=0.55,皮爾遜相關(guān))。因此,對(duì)于給定的腫瘤組織,mtdna%的增加對(duì)應(yīng)于腫瘤大小的增加。
此關(guān)系可用于監(jiān)測(cè)疾病進(jìn)展,特別是在治療之后。對(duì)于具體患者,腫瘤組織中線粒體dna分?jǐn)?shù)將是相同的。因此,血漿中線粒體dna分?jǐn)?shù)的連續(xù)改變將可用于反映腫瘤大小。因此,實(shí)施例可基于線粒體dna的血漿分?jǐn)?shù)濃度隨時(shí)間追蹤腫瘤的大小。
繪圖1600中的函數(shù)是校準(zhǔn)函數(shù)的另一實(shí)例。在此實(shí)例中,當(dāng)來源組織中mtdna含量是已知的時(shí),校準(zhǔn)函數(shù)可提供腫瘤大小。腫瘤大小是癌癥水平的分類的實(shí)例。對(duì)于校準(zhǔn)函數(shù)的以上論述還應(yīng)用于本實(shí)例和本文所述的其它回歸分析。
另外,由于腫瘤大小與腫瘤dna分?jǐn)?shù)成比例,所以對(duì)于給定的腫瘤,可基于線粒體dna分?jǐn)?shù)確定腫瘤dna分?jǐn)?shù)。舉例來說,可測(cè)量具有各種腫瘤大小的患者的參考樣品的腫瘤dna分?jǐn)?shù)。然后,一旦腫瘤的組織類型是已知的,并且估測(cè)腫瘤的大小,比方說通過像ct掃描的成像方法,血漿中%mtdna就可用于測(cè)定腫瘤dna分?jǐn)?shù)。
除檢測(cè)和監(jiān)測(cè)原發(fā)性癌癥之外,血漿中線粒體dna的分析還可應(yīng)用于檢測(cè)轉(zhuǎn)移性癌癥。轉(zhuǎn)移性癌癥可在轉(zhuǎn)移性器官中引起顯著的組織破壞。舉例來說,轉(zhuǎn)移到肝的結(jié)腸直腸癌可引起肝組織的顯著破壞。由于肝組織的線粒體dna的分?jǐn)?shù)比血細(xì)胞和結(jié)腸直腸組織都高,所以血漿中線粒體dna的升高可用于指示肝中存在轉(zhuǎn)移性疾病。
圖17示出根據(jù)本發(fā)明的實(shí)施例的結(jié)腸直腸癌患者和具有肝轉(zhuǎn)移的結(jié)腸直腸癌患者的血漿mtdna%的繪圖1700。具有肝癌轉(zhuǎn)移的結(jié)腸直腸癌受試者血漿中線粒體dna的分?jǐn)?shù)濃度比無轉(zhuǎn)移的結(jié)腸直腸癌大2.2倍。因此,約0.0025的閾值可用于辨別患有結(jié)腸直腸癌的患者和具有肝轉(zhuǎn)移的患有結(jié)腸直腸癌的患者?;诒竟_,本領(lǐng)域技術(shù)人員將能夠確定用于辨別其它癌癥和轉(zhuǎn)移的其它閾值。
因此,在一些實(shí)施例中,如果患者具有一種類型的癌癥,并且然后歸一化量急劇上升,那么可確認(rèn)癌癥已經(jīng)轉(zhuǎn)移到每個(gè)細(xì)胞具有較高線粒體的組織。舉例來說,在結(jié)腸組織中僅存在約150個(gè)復(fù)本的mtdna。因此,在沒有肝轉(zhuǎn)移的情況下mtdna的增加將不會(huì)太大。然而,肝的涉及將很可能因?yàn)楦沃衜tdna的水平高許多而導(dǎo)致血漿中mtdna的水平高許多。
d.用于癌癥的線粒體dna的大小分布圖
由于線粒體dna也不纏繞組蛋白,所以線粒體dna疑似較短。因此,mtdna將經(jīng)受更大的降解和酶解壓力,并且因此較短。由于對(duì)于任何單個(gè)受試者,經(jīng)測(cè)序的線粒體dna片段的數(shù)量相對(duì)較少,所以我們合并來自相同群組中所有受試者的經(jīng)測(cè)序的線粒體dna片段以獲得合并的大小分布圖。
圖18示出健康受試者(黑色)、hbv攜帶者(黃色)、肝硬化患者(藍(lán)色)和hcc患者(紅色)中循環(huán)線粒體dna的大小分布圖。出于比較,示出一個(gè)健康對(duì)照受試者的循環(huán)核dna的大小分布圖(點(diǎn)線)。
循環(huán)核dna示出在166bp處具有主峰的特征大小樣式。此樣式很可能是由于結(jié)合到核dna的組蛋白的保護(hù)而免受酶降解的結(jié)果。在循環(huán)線粒體dna的大小分布中未觀測(cè)到此樣式。我們還觀測(cè)到血漿中線粒體dna的大小分布短于核dna的大小分布。
可基于細(xì)胞中線粒體的平均數(shù),以及一個(gè)線粒體的線粒體dna的已知長(zhǎng)度(即,16kb)測(cè)定樣品中線粒體dna的預(yù)期量。對(duì)于健康受試者,血漿中線粒體dna的測(cè)量量低于預(yù)期量(即,基于多個(gè)線粒體中線粒體dna的長(zhǎng)度)。對(duì)于癌癥患者,測(cè)量量比預(yù)期量高一個(gè)數(shù)量級(jí)。
健康受試者中血漿線粒體dna的中值分?jǐn)?shù)濃度僅為0.00045%。考慮到線粒體基因組的大小為核基因組的大小的0.00053%以及每個(gè)細(xì)胞存在50到4,000個(gè)線粒體,此分?jǐn)?shù)濃度是相對(duì)低的(kellyrd等人《通過核編碼dna聚合酶γa的dna甲基化以組織特定的方式調(diào)節(jié)線粒體dna復(fù)本數(shù)。(mitochondrialdnacopynumberisregulatedinatissuespecificmannerbydnamethylationofthenuclear-encodeddnapolymerasegammaa.)》《核酸研究(nucleicacidsres)》2012;40(20):10124-10138;以及mengel-fromj等人《外周血細(xì)胞中線粒體dna復(fù)本數(shù)隨著年齡的增長(zhǎng)降低并且在老年人中與一般健康狀況相關(guān)聯(lián)。(mitochondrialdnacopynumberinperipheralbloodcellsdeclineswithageandisassociatedwithgeneralhealthamongelderly.)》《人類遺傳學(xué)(humgenet)》2014;133(9):1149-1159)。
循環(huán)線粒體dna的較小的大小分布和和相對(duì)低的豐度很可能是由于缺乏組蛋白保護(hù)線粒體dna對(duì)降解的較高敏感性。如上所指出,與健康受試者相比較,在hcc患者中血漿中線粒體dna的濃度較高。這可是由于當(dāng)與造血細(xì)胞相比較時(shí),hcc細(xì)胞或肝細(xì)胞中通常較高數(shù)量的線粒體,所述造血細(xì)胞是健康受試者中循環(huán)dna的主要來源(kellyrd等人(2012);mengel-fromj,等人(2014);和luiyyn,等人《在經(jīng)性別錯(cuò)配的骨髓移植之后血漿和血清中游離dna的主要造血源。(predominanthematopoieticoriginofcell-freednainplasmaandserumaftersex-mismatchedbonemarrowtransplantation.)》《臨床化學(xué)》2002;48(3):421-427)。
此外,對(duì)于癌細(xì)胞,存在更多的線粒體dna。對(duì)于癌癥患者,鑒于較高比例的線粒體dna,dna(核和線粒體)的總體大小將較小。因此,對(duì)于癌癥患者,較高比例的線粒體dna將影響總體大小分布圖。但是因?yàn)檠獫{中mtdna的穩(wěn)定性比核dna的穩(wěn)定性低許多,所以來自mtdna的序列讀段的實(shí)際量極其低。因?yàn)槟[瘤dna中縮短的程度更大并且腫瘤dna分?jǐn)?shù)高于mtdna分?jǐn)?shù),所以腫瘤dna分?jǐn)?shù)對(duì)總體大小分布圖的影響更大。
循環(huán)線粒體dna分子的大小分布可影響使用某些技術(shù)檢測(cè)mtdna的精確性。如圖18所示,將循環(huán)線粒體dna分子片段化到低于150bp。pcr的靈敏度取決于靶片段的大小。模板dna越短,固定的pcr引物可跨越整個(gè)dna分子并對(duì)其檢測(cè)的機(jī)率越低。相反地,在大規(guī)模平行測(cè)序中,通常將測(cè)序引物添加到靶分子的末端。因此,分子被測(cè)序的機(jī)率較少地受到dna分子的較短大小分布圖的不利影響,從而提供一致和精確的結(jié)果。
e.方法
圖19是示出根據(jù)本發(fā)明的實(shí)施例的分析有機(jī)體的生物樣品以使用生物樣品中線粒體dna的量確定有機(jī)體癌癥水平的分類的方法1900的流程圖。生物樣品包括源自正常細(xì)胞和潛在地源自與癌癥相關(guān)聯(lián)的細(xì)胞的游離dna分子。生物樣品的游離dna包括線粒體dna和核dna。作為實(shí)例生物樣品可為血漿或血清。
在框1910處,在計(jì)算機(jī)系統(tǒng)處接收來自生物樣品中多個(gè)dna分子的測(cè)序的序列讀段。測(cè)序可為dna分子的隨機(jī)測(cè)序,例如,可使用轉(zhuǎn)接器執(zhí)行測(cè)序。其它實(shí)施例可使用引物的隨機(jī)集(例如,完備集),使得所有序列具有匹配的引物。可使用隨機(jī)六聚體的完全集。
在框1920處,對(duì)于生物樣品中多個(gè)dna分子中的每個(gè),確定dna分子是核dna還是線粒體dna??墒褂胐na分子的序列讀段確定dna分子在參考核基因組或參考線粒體基因組中的位置。在一個(gè)實(shí)施方案中,可嘗試將對(duì)應(yīng)的序列讀段映射到參考核基因組和映射到參考線粒體基因組。在一個(gè)實(shí)例中,僅使用唯一地映射的讀段。
在嘗試將dna分子映射到參考核基因組和映射到參考線粒體基因組中,實(shí)施例可使用用于測(cè)定到參考線粒體基因組的第一比對(duì)的一種或多種第一準(zhǔn)則執(zhí)行第一映射程序。一種或多種第一準(zhǔn)則可指定多個(gè)允許的錯(cuò)配的數(shù)量、允許匹配的位置的數(shù)量和是否所有的參考基因組都用于映射。在一個(gè)實(shí)施例中,映射dna分子使用至少大部分的參考核基因組和參考線粒體基因組。
對(duì)于經(jīng)測(cè)定以基于第一映射程序與參考線粒體基因組進(jìn)行比對(duì)的每個(gè)序列讀段,可使用比一種或多種第一準(zhǔn)則更嚴(yán)格的一種或多種第二準(zhǔn)則執(zhí)行到參考核基因組和到參考線粒體基因組的第二映射程序。在一個(gè)實(shí)施方案中,僅如果序列讀段針對(duì)第一映射程序和第二映射程序映射到線粒體基因組,序列讀段才貢獻(xiàn)于歸一化量。舉例來說,一種或多種第二準(zhǔn)則可包括序列讀段映射到參考線粒體基因組上的唯一位置和/或具有比第一映射程序中允許的更少的錯(cuò)配。然而,第一映射程序可允許更多的錯(cuò)配和/或更多的匹配位置。一種或多種第二準(zhǔn)則還可包括序列讀段在比到參考核基因組的第二比對(duì)更少的錯(cuò)配的情況下,與參考線粒體基因組進(jìn)行比對(duì)。在映射處,起始通過可較快以便確認(rèn)mtdna的潛在的序列讀段,并且然后僅在序列讀段潛在地與mtdna進(jìn)行比對(duì)之后,才花費(fèi)較多的計(jì)算時(shí)間。
在一些實(shí)施例中,當(dāng)?shù)谝挥成涑绦虿淮_認(rèn)到參考線粒體基因組的潛在比對(duì)時(shí),將序列讀段計(jì)數(shù)為對(duì)應(yīng)于核dna。以此方式,僅mtdna必須明確地映射到參考核基因組和參考線粒體基因組兩者。因此,由于線粒體基因組和核基因組之間存在相當(dāng)大的同源性,所以可使用更嚴(yán)格要求的映射精確性,將被初始地映射到線粒體基因組的所有測(cè)序讀段與組合的核基因組和線粒體基因組進(jìn)行再比對(duì)??蓪?duì)于本文所述的任何方法執(zhí)行此類技術(shù)。
在框1930處,測(cè)量被確認(rèn)為線粒體dna的多個(gè)dna分子的歸一化量??梢耘c方法1100的框1130類似的方式執(zhí)行框1930。因此,歸一化量可與包括被確認(rèn)為核dna分子的dna分子的多個(gè)dna分子的第二量相關(guān)。作為實(shí)例,第二量可為核和線粒體dna分子的量或僅為核dna分子的量。
對(duì)于大規(guī)模平行測(cè)序,可從相同數(shù)量的線粒體基因組產(chǎn)生更多的靶。對(duì)于pcr,僅檢測(cè)線粒體基因組上的單個(gè)靶或幾個(gè)靶。假設(shè)將線粒體基因組片段化成150bp的片段,那么一個(gè)線粒體基因組將片段化成106個(gè)片段。此較高數(shù)量的靶分子將轉(zhuǎn)變?yōu)橛糜诙炕母玫撵`敏度和精確度。
在框1940處,將歸一化量與參考值相比較。作為實(shí)例,參考值可為針對(duì)正常樣品測(cè)定的閾值。如上所提及,比較可包括基于歸一化量和參考值測(cè)定z評(píng)分(或其它差值或比率或其函數(shù)),并且將結(jié)果與閾值相比較。在其它實(shí)施例中,例如,如果將z評(píng)分中其它值移動(dòng)到等式的另一側(cè),那么參考值可包括閾值。
在框1950處,基于比較確定有機(jī)體中癌癥水平的分類。作為實(shí)例,分類可包括癌癥陽性、癌癥陰性或不確定。多于一個(gè)參考值可用于確定應(yīng)用哪一個(gè)分類。舉例來說,參考值可為辨別兩種分類中的任一個(gè)而存在。
分類的其它實(shí)例可包括腫瘤大小(圖16)或癌癥階段,例如,癌癥是否轉(zhuǎn)移(圖17)。因此,可從校準(zhǔn)函數(shù)(例如,校正數(shù)據(jù)點(diǎn))測(cè)定參考值以便確定大小的分類。在一個(gè)實(shí)例中,可將測(cè)量的歸一化量的最接近校正值保存為參考值。當(dāng)腫瘤在mtdna含量比血細(xì)胞低的組織中時(shí),當(dāng)歸一化量小于閾值時(shí)可檢測(cè)到癌癥。以此方式,基于歸一化量是高于還是低于閾值,可排除不同組織作為腫瘤的來源。
根據(jù)以上描述,mtdna豐度的閾值可用于區(qū)別hcc患者與正常受試者??蓮慕】嫡J茉囌呷航M建立閾值。在一個(gè)實(shí)例中,基于平均值和標(biāo)準(zhǔn)偏差(sd),十六位健康正常受試者用于測(cè)定正常參考范圍。高于健康對(duì)照組的平均值兩個(gè)sd被認(rèn)為指示血漿中線粒體dna的顯著過量表達(dá)。為了最小化由于同源區(qū)域而可被映射到人類核和線粒體基因組的那些不明確的讀段的影響,我們將線粒體基因組和人類基因組匯集在一起以形成單個(gè)數(shù)據(jù)庫。僅將唯一地與線粒體基因組進(jìn)行比對(duì)的讀段用于下游分析。通過使線粒體基因組和人類基因組可用于并行地比對(duì),從同源區(qū)域得到的dna片段將可與組合的基因組的多于一個(gè)區(qū)域進(jìn)行比對(duì)。當(dāng)僅選擇唯一地與組合的基因組中唯一一個(gè)位置進(jìn)行比對(duì)的dna片段或序列讀段時(shí),舍棄源自同源區(qū)域的那些dna分子。使用此方法,當(dāng)特定性為93%時(shí),實(shí)現(xiàn)80%的靈敏度。另一方面,當(dāng)序列數(shù)據(jù)僅僅與包括同源區(qū)域的線粒體基因組進(jìn)行比對(duì)時(shí),當(dāng)特定性為93%時(shí),靈敏度僅為51%。
iv.使用線粒體dna的自身免疫檢測(cè)
線粒體dna(mtdna)還可用于檢測(cè)自身免疫疾病,如全身性紅斑狼瘡(sle)。鑒于被攻擊的細(xì)胞的mtdna濃度通常將比血細(xì)胞高,對(duì)于自身免疫疾病也看到血漿中mtdna水平的升高。
a.sle
全身性紅斑狼瘡(sle)是由免疫系統(tǒng)對(duì)身體的‘自身攻擊’引起的自身免疫疾病,并且導(dǎo)致發(fā)炎和組織損傷。不同于其它自身免疫疾病(如多發(fā)性硬化癥和1型糖尿病),sle被認(rèn)為是原型全身性自身免疫疾病。其潛在的影響多種器官系統(tǒng),包括皮膚、肌肉、骨骼、肺、腎、心血管和中樞神經(jīng)系統(tǒng)。
sle的特征在于喪失免疫自身耐受性和產(chǎn)生自身抗體。將sle患者的血清抗雙鏈(ds)dna抗體滴度用作血清學(xué)手段以評(píng)估疾病活性。然而,即使在活動(dòng)期期間約30%sle患者對(duì)此測(cè)試是陰性的。
與sle相關(guān)聯(lián)的細(xì)胞死亡的加速和清除死亡細(xì)胞的副產(chǎn)物的障礙可產(chǎn)生胞外dna,并且改變dna在sle患者的循環(huán)中的特征。另外,涉及sle的發(fā)病機(jī)理的其它機(jī)理(如dna酶活性的不足和對(duì)dna的自身抗體的過量生產(chǎn))還可更改循環(huán)dna的完整性。如下文所示,sle的免疫調(diào)節(jié)異??筛淖僺le患者的樣品(例如血漿)中的mtdna%。
b.使用mtdna%確定水平
圖20是示出根據(jù)本發(fā)明的實(shí)施例的在不同群組中血漿樣品中線粒體dna(mtdna)的序列讀段百分比的圖示2000。不同群組的患者包括對(duì)照患者、非活動(dòng)sle患者和活動(dòng)sle患者。存在11位對(duì)照患者、15位非活動(dòng)sle患者和9位活動(dòng)sle患者。非活動(dòng)lse患者的全身性紅斑狼瘡疾病活動(dòng)指數(shù)(sledai)為0到6(bombardier等人,《sledai的導(dǎo)出。狼瘡患者的疾病活動(dòng)指數(shù)。sle預(yù)后研究委員會(huì)。(derivationofthesledai.adiseaseactivityindexforlupuspatients.thecommitteeonprognosisstudiesinsle.)》《關(guān)節(jié)炎與風(fēng)濕病(arthritisrheum)》1992,35:630-640)。活動(dòng)lse患者的sledai大于6。
活動(dòng)sle群組的mtdna的平均百分比比對(duì)照組(p=0.0057)和非活動(dòng)sle(p=0.0148)分別高4.2倍和3倍。因此,如本領(lǐng)域技術(shù)人員將已知的,例如使用0.04的閾值或由接受者操作特征曲線分析或其它合適的技術(shù)確認(rèn)的一個(gè)或多個(gè)其它截止值,可辨別活動(dòng)sle患者與對(duì)照患者和非活動(dòng)患者。還對(duì)于sledai和抗dsdna抗體水平分析相同的數(shù)據(jù)。
圖21是示出根據(jù)本發(fā)明的實(shí)施例的血漿樣品中mtdna的序列讀段百分比對(duì)sledai的繪圖2100。示出11個(gè)對(duì)照樣品的sledai為0。繪圖2100示出血漿中線粒體dna的序列讀段的百分比和sledai之間的相關(guān)性,其中斯皮爾曼(spearman's)r=0.56并且p=0.0048。在測(cè)定相關(guān)值中僅使用sle案例。
基于mtdna%,線性擬合(或其它校準(zhǔn)函數(shù))可用于測(cè)定sledai值??纱鎯?chǔ)并以與本文所述的其它校準(zhǔn)函數(shù)類似的方式測(cè)定校準(zhǔn)函數(shù)。以此方式,mtdna%可用于估測(cè)sle的嚴(yán)重水平。較高的mtdna%將指示較高嚴(yán)重水平的sle。
圖21還示出0.02的閾值可用于辨別健康患者和sle患者。在一些實(shí)施例中,可使用sledai和mtdna%,其中可通過不涉及mtdna%的獨(dú)立方法測(cè)定sledai。舉例來說,為了提高特定性,可將mtdna%和sledai兩者與相應(yīng)的閾值相比較以確定兩者是否都升高。兩者升高的準(zhǔn)則可用于確定自身免疫疾病是否存在或確定嚴(yán)重程度。因此,在一些實(shí)施方案中,當(dāng)任一個(gè)升高時(shí),可確認(rèn)自身免疫疾病的存在,但不被確認(rèn)為嚴(yán)重,除非兩者都升高。mtdna%可用于確認(rèn)自身免疫疾病的存在,并且sledai用于確定嚴(yán)重程度。為了提高靈敏度,實(shí)施例可確認(rèn)患有任一個(gè)升高的自身免疫的存在。符合此準(zhǔn)則(任一個(gè)升高)的閾值可高于兩者都需要升高的閾值。各種閾值可用于mtdna%和sledai以確定各種嚴(yán)重水平。
圖22是示出根據(jù)本發(fā)明的實(shí)施例的血漿樣品中mtdna的序列讀段百分比對(duì)抗dsdna抗體水平的繪圖2200。已經(jīng)示出抗dsdna抗體水平與sle相關(guān)(isenberg等人《全身性紅斑狼瘡患者及其親屬的血清中交叉反應(yīng)抗dna抗體個(gè)體基因型的檢測(cè)。(detectionofcross-reactiveanti-dnaantibodyidiotypesintheserumofsystemiclupuserythematosuspatientsandoftheirrelatives.)》《關(guān)節(jié)炎與風(fēng)濕病》1985;28:999-1007)。繪圖2200示出血漿中線粒體dna的序列讀段百分比和抗dsdna抗體水平之間的相關(guān)性,其中斯皮爾曼r=0.71并且p<0.0001。在測(cè)定相關(guān)值中使用所有的sle案例。如可看出,抗體水平不總是辨別活動(dòng)sle和非活動(dòng)sle。結(jié)合mtdna%使用抗體水平可有助于辨別,例如,在1000抗體水平下的活動(dòng)sle案例具有更高的mtdna%。舉例來說,可使用約0.055的閾值。因此,可選擇不同的mtdna%閾值并用于不同的抗體水平(或水平范圍)以提高精確性。
圖23是示出根據(jù)本發(fā)明的實(shí)施例的各種群組的血漿樣品中mtdna的序列讀段百分比的圖示2300。在圖示2300中,ab對(duì)應(yīng)于抗dsdna抗體水平。各種群組為對(duì)照組(無sle)、ab≤500的群組和ab>500的群組。如可看出,ab>500的樣品的平均mtdna%高于對(duì)照組和ab≤500的群組。因此,mtdna%可以與抗體水平類似的方式辨認(rèn),也如圖22中所示。并且,可使用兩種標(biāo)記的組合。
c.方法
圖24是示出根據(jù)本發(fā)明的實(shí)施例的分析有機(jī)體生物樣品以使用mtdna的量確定有機(jī)體中水平自身免疫疾病的分類的方法2400的流程圖。生物樣品包括游離dna。生物樣品的游離dna包括線粒體dna和核dna。作為實(shí)例,生物樣品可為血漿或血清。
在框2410處,在計(jì)算機(jī)系統(tǒng)處接收生物樣品中多個(gè)dna分子的序列信息。可以與方法1100的框1110類似的方式執(zhí)行框2410。
在框2420處,對(duì)于生物樣品中多個(gè)dna分子中的每個(gè),確定dna分子是核dna還是線粒體dna。例如,可通過執(zhí)行序列讀段到參考核基因組和參考線粒體基因組的映射程序使用dna分子的序列信息,確定dna分子在參考核基因組或參考線粒體基因組中的位置??梢耘c方法1100的框1120類似的方式執(zhí)行框2420。
在框2430處,測(cè)量被確認(rèn)為線粒體dna的多個(gè)dna分子的歸一化量。可以與方法1100的框1130類似的方式執(zhí)行框2430。因此,歸一化量可與包括被確認(rèn)為核dna分子的dna分子的多個(gè)dna分子的第二量相關(guān)。作為實(shí)例,第二量可為核和線粒體dna分子的量或僅為核dna分子的量。
在框2440處,將歸一化量與參考值相比較。作為實(shí)例,參考值可為針對(duì)正常樣品測(cè)定的閾值??梢耘c方法1900的框1940類似的方式執(zhí)行框2440。舉例來說,可從圖20到圖23中所示類型的數(shù)據(jù)測(cè)定參考值。
在框2450處,基于比較,確定有機(jī)體中水平自身免疫疾病的分類??舍槍?duì)特定自身免疫疾病(例如,sle)進(jìn)行測(cè)試。作為實(shí)例,分類可包括自身免疫疾病陽性、自身免疫疾病陰性或不確定。其它實(shí)例可包括自身免疫疾病是活動(dòng)的還是非活動(dòng)的,如圖20和圖22中。
d.大小
圖25是示出根據(jù)本發(fā)明的實(shí)施例的各種群組的線粒體dna(mtdna)大小分布的繪圖2500。各種群組為對(duì)照組、非活動(dòng)sle和活動(dòng)sle。
如可看出,大小分布從對(duì)照到非活動(dòng)sle變小,并且對(duì)于活動(dòng)sle甚至更小?;诖笮》植?,此關(guān)系可用于確認(rèn)患者是否不具有sle、具有非活動(dòng)sle或活動(dòng)sle。舉例來說,相對(duì)于健康患者,非活動(dòng)sle的大小分布的平均數(shù)、中值或眾數(shù)(峰值的位置)的統(tǒng)計(jì)值變小,并且然后對(duì)于活動(dòng)sle患者甚至更小。可使用各種統(tǒng)計(jì)值,如在特定大小(例如70bp)以下的序列讀段的比例、兩種大小的多個(gè)序列讀段的比率(例如,在60bp的數(shù)量除以在90bp的數(shù)量)或兩種其它統(tǒng)計(jì)值的比率。所有此類統(tǒng)計(jì)值將示出對(duì)較小大小的偏移。合適的統(tǒng)計(jì)大小的其它實(shí)例可見于美國(guó)專利第8,620,593號(hào)和美國(guó)專利公開案2013/0237431中,所述兩個(gè)專利案以引用的方式并入。
圖26是示出根據(jù)本發(fā)明的實(shí)施例的分析有機(jī)體生物樣品以使用mtdna的大小確定有機(jī)體中水平自身免疫疾病的分類的方法2600的流程圖。生物樣品包括游離dna。
在框2610處,在計(jì)算機(jī)系統(tǒng)處接收生物樣品中多個(gè)dna分子的序列信息。可以與方法1100的框1110類似的方式執(zhí)行框2610。
在框2620處,對(duì)于生物樣品中多個(gè)dna分子中的每個(gè),使用dna分子的序列信息確定dna分子在參考線粒體基因組中的位置。由于位置可提供dna分子是核dna還是線粒體dna,所以可僅包括線粒體dna作為多個(gè)dna分子的一部分。例如,可通過執(zhí)行序列讀段到參考核基因組和參考線粒體基因組的映射程序使用dna分子的序列信息,確定dna分子在參考核基因組或參考線粒體基因組中的位置。可以與本文所述的其它定位技術(shù)類似的方式執(zhí)行框2620。
在框2630處,使用確定的dna分子的位置測(cè)量dna分子的大小。在lo等人的題為“母本血漿中胎兒dna分?jǐn)?shù)的基于大小的分析(size-basedanalysisoffetaldnafractioninmaternalplasma)”的美國(guó)專利公開案2013/0237431中描述獲得dna分子的大小,出于所有目的所述公開案的內(nèi)容以引用的方式并入本文中。
在框2640處,基于確定的位置,dna分子的群組被確認(rèn)為線粒體dna。一旦已經(jīng)確認(rèn)mtdna分子的群組,就可分析所述群組的大小分布。所述群組可包含位置被確定的多個(gè)dna分子的全部或僅一部分。
在框2650處,計(jì)算線粒體dna分子的群組的大小分布的第一統(tǒng)計(jì)值。如上所提及,可使用各種統(tǒng)計(jì)值。在實(shí)施例中,可通過在指定的大小下計(jì)算在第一曲線下的面積測(cè)定第一統(tǒng)計(jì)值。第一曲線可是在大小范圍上mtdna分子的累積頻率的繪圖。在一個(gè)實(shí)施例中,第一統(tǒng)計(jì)值可為mtdna片段的平均數(shù)、平均值或中值大小。在另一實(shí)施例中,第一統(tǒng)計(jì)值可包括在第一大小以下的片段的長(zhǎng)度的總和,其可為一種類型的截止值。舉例來說,可求和小于70bp的片段中的每個(gè)的長(zhǎng)度??偤涂沙粤硪粋€(gè)數(shù),如所有mtdna片段的長(zhǎng)度的總和或大于第二大小截止值(其可與第一大小相同)的片段的長(zhǎng)度的總和。舉例來說,第一統(tǒng)計(jì)值可為在第一大小截止值以下的片段的總長(zhǎng)度相對(duì)于片段的總長(zhǎng)度的比率,或小片段的總長(zhǎng)度相對(duì)于大片段的總長(zhǎng)度的比率。
在框2660處,將第一統(tǒng)計(jì)值與參考值相比較。在實(shí)施例中,參考值可對(duì)應(yīng)于來自一個(gè)或多個(gè)參考樣品(例如,一位或多位健康對(duì)照者或一位或多位非活動(dòng)sle患者)的大小分布的參考統(tǒng)計(jì)值??赏ㄟ^在指定的大小下計(jì)算在參考曲線下的面積測(cè)定參考值。參考曲線可是在大小范圍上一個(gè)或多個(gè)參考樣品的mtdna分子的累積頻率的繪圖。在各種實(shí)施例中,可使用來自多個(gè)參考樣品的總大小分布,可組合來自不同大小分布的獨(dú)立值以提供單個(gè)參考值。
在框2670處,基于比較,確定有機(jī)體中水平自身免疫疾病的分類。分類的實(shí)例包括無自身免疫疾病、非活動(dòng)自身免疫疾病和活動(dòng)自身免疫疾病??杀容^第一統(tǒng)計(jì)值和參考值以獲得分離值,可將所述分離值與閾值(截止值)相比較以確定分類。在一個(gè)實(shí)施例中,分離值可為第一統(tǒng)計(jì)值和參考值之間的差值被測(cè)定。在另一實(shí)施例中,分離值可為第一統(tǒng)計(jì)值與參考值的比率。
分離值可為使用以下等式在測(cè)試樣品和一個(gè)或多個(gè)參考樣品之間短mtdna片段的比例上的差值:
δf=p(≤150bp)測(cè)試-p(≤150bp)參考
其中p(≤150bp)測(cè)試表示來自大小≤150bp的測(cè)試樣品的測(cè)序的mtdna片段的比例,并且p(≤150bp)參考表示來自大小≤150bp的一個(gè)或多個(gè)參考樣品的測(cè)序的mtdna片段的比例。在其它實(shí)施例中,可使用其它大小閾值,例如(但不限于)100bp、110bp、120bp、130bp、140bp、160bp和166bp。在其它實(shí)施例中,可以堿基或核苷酸為單位或以其它單位表達(dá)大小閾值。
可將分離值與一個(gè)或多個(gè)截止值相比較??蓪⒎蛛x值與兩個(gè)截止值相比較以確定分離值是否具體范圍內(nèi)。所述范圍可包括一個(gè)截止值以確定非正常數(shù)據(jù)點(diǎn)是否出現(xiàn)(例如自身免疫疾病的存在),并且第二截止值可用于確定數(shù)據(jù)點(diǎn)是否用于自身免疫疾病的活動(dòng)狀態(tài)或非活動(dòng)狀態(tài)。
在一些實(shí)施例中,可將第一統(tǒng)計(jì)值與多個(gè)參考值相比較以確定自身免疫疾病水平的分類。舉例來說,當(dāng)?shù)谝唤y(tǒng)計(jì)值大于第一參考值(例如,圖22所提及的0.055)時(shí),可確定自身免疫疾病為活動(dòng)的。當(dāng)?shù)谝唤y(tǒng)計(jì)值小于第一參考值并大于第二參考值(例如參考圖20和圖22的0.18)時(shí),可確定自身免疫疾病為非活動(dòng)的。當(dāng)?shù)谝唤y(tǒng)計(jì)值小于第二參考值時(shí),可確定自身免疫疾病不存在。
v.非造血組織
不同的細(xì)胞類型含有不同數(shù)量的線粒體dna。如果存在每個(gè)細(xì)胞含有的線粒體dna的量比造血細(xì)胞的平均數(shù)高,如果所述血漿樣品含有從所述其它組織釋放的dna,那么看到血漿線粒體dna%的升高。舉例來說,圖5示出絨毛細(xì)胞(第一個(gè)三月期胎盤組織)的線粒體dna含量比血沉棕黃層高,這解釋了圖3中第一個(gè)三月期樣品中較高的血漿mtdna%。此外,較高的mtdna%見于癌癥患者中。因此,樣品中mtdna的歸一化量可用于估測(cè)從非造血組織來源得到的生物樣品中dna的濃度。并且,當(dāng)檢測(cè)到升高的mtdna%時(shí),可確認(rèn)一些非造血組織中的細(xì)胞死亡(例如,表示一些病變)。
圖27是示出根據(jù)本發(fā)明的實(shí)施例的分析懷有胎兒的女性受試者的生物樣品以估測(cè)從非造血組織來源得到的生物樣品中dna濃度的方法2700的流程圖。生物樣品包括游離dna。生物樣品的游離dna包括線粒體dna和核dna。作為實(shí)例,生物樣品可為血漿或血清。
在框2710處,在計(jì)算機(jī)系統(tǒng)處接收生物樣品中多個(gè)dna分子的序列信息??梢耘c方法1100的框1110類似的方式執(zhí)行框2710。
在框2720處,對(duì)于生物樣品中多個(gè)dna分子中的每個(gè),確定dna分子是核dna還是線粒體dna。例如,可通過執(zhí)行序列讀段到參考核基因組和參考線粒體基因組的映射程序使用dna分子的序列信息,確定dna分子在參考核基因組或參考線粒體基因組中的位置??梢耘c方法1100的框1120類似的方式執(zhí)行框2720。
在框2730處,測(cè)量被確認(rèn)為線粒體dna的多個(gè)dna分子的歸一化量??梢耘c方法1100的框1130類似的方式執(zhí)行框2730。因此,歸一化量可與包括被確認(rèn)為核dna分子的dna分子的多個(gè)dna分子的第二量相關(guān)。作為實(shí)例,第二量可為核和線粒體dna分子的量或僅為核dna分子的量。
在框2740處,獲得指定從非造血組織來源得到的生物樣品中線粒體dna濃度和dna的第二濃度之間的關(guān)系的校準(zhǔn)函數(shù)??梢耘c方法1100的框1140類似的方式執(zhí)行框2740。
在框2750處,基于歸一化量,校準(zhǔn)函數(shù)用于估測(cè)生物樣品中第二濃度??梢耘c方法1100的框1150類似的方式執(zhí)行框2750。
在各種實(shí)施例中,非造血組織來源可包括肝、肺、心臟、大腦、非造血癌癥或胎盤。舉例來說,可隨時(shí)間監(jiān)測(cè)dna的第二濃度以追蹤腫瘤的大小,例如,如針對(duì)圖16所論述。因此,可通過測(cè)定腫瘤細(xì)胞中線粒體dna的分?jǐn)?shù)濃度并基于腫瘤細(xì)胞中線粒體dna的分?jǐn)?shù)濃度測(cè)定腫瘤的大小來追蹤腫瘤的大小。
vi.用于胎兒分析的材料和方法
以下是用于胎兒分析中的一些實(shí)例技術(shù)。其它實(shí)施例可使用不同技術(shù)。
對(duì)于制備血漿和血沉棕黃層樣品,將外周血液樣品在4℃下、以1,600g離心10min(離心機(jī)5810r,艾本德(eppendorf))。在此第一輪的離心之后,上部澄清層為血漿部分,將上部澄清層轉(zhuǎn)移到2ml離心管,并且在4℃下、以16,000g再離心10min(離心機(jī)5417r,艾本德)(chiu等人2001)。血沉棕黃層為中間層并且將血沉棕黃層轉(zhuǎn)移到1.5ml離心管,在室溫下以2,500g再離心5min(微升離心機(jī)z233m-2,哈默(hermle))以去除任何殘余血漿。在-80℃下,將游離血漿和血沉棕黃層存儲(chǔ)于微量離心管中。
對(duì)于血漿dna提取,在一些修改的情況下遵循制造商的真空方案用qiaampdspdna血液微型試劑盒(凱杰)提取血漿dna。將每400μl的血漿與40μl的蛋白酶和400μl的緩沖液(buffer)al混合。在56℃下將混合物保溫20min。將400μl冰冷的純乙醇與裂解物充分地混合。使裂解物流動(dòng)通過qiaamp微型旋轉(zhuǎn)柱。在施加不超過2ml的血漿的情況下使用每個(gè)柱。在已經(jīng)使裂解物抽吸通過柱之后,用600μl緩沖液aw1洗滌柱,并且之后用緩沖液aw2洗滌柱。在洗滌步驟之后以16,000g旋轉(zhuǎn)柱3min以去除所有殘余的洗滌緩沖液。將70μl的去離子水添加到每個(gè)柱并在室溫下保溫5min。然后以16,000g將柱離心1min以洗脫dna。在-30℃下存儲(chǔ)提取的dna用于后續(xù)實(shí)驗(yàn)。
對(duì)于從血沉棕黃層提取基因組dna,遵循血液或體液旋轉(zhuǎn)方案使用qiaampdna血液微型試劑盒(凱杰)從血沉棕黃層提取基因組dna。對(duì)于每個(gè)樣品,將400μl的血沉棕黃層與40μl的蛋白酶和400μl的緩沖液al混合。在56℃下將混合物保溫20min。在保溫之后,將400μl冰冷的純乙醇與裂解物充分地混合。然后將600μl的裂解物施加到qiaamp微型旋轉(zhuǎn)柱并在室溫下以6,000g離心1min。重復(fù)此程序直到所有裂解物流動(dòng)通過柱。然后用600μl的緩沖液aw1和aw2洗滌柱。在洗滌之后,以16,000g將柱離心3min以去除所有殘余的洗滌緩沖液。最后,將80μl的去離子水添加到柱并在室溫下保溫5min。通過以16,000g將柱離心1min洗脫基因組dna。
對(duì)于從絨毛取樣(cvs)和胎盤組織提取基因組dna,qiaampdna微型試劑盒(凱杰)用于從cvs和胎盤組織提取基因組dna。在輕微修改的情況下使用根據(jù)組織旋轉(zhuǎn)方案的dna純化。用磷酸鹽緩沖鹽水(pbs)將胎盤和cvs組織洗滌兩次并切成小段。在56℃下保溫,以平緩振蕩將每個(gè)樣品與360μl的緩沖液atl和40μl的蛋白酶k混合5小時(shí)直到整個(gè)組織被消化。添加400μl的緩沖液al并在70℃下保溫15min。之后添加400μl冷的純乙醇,用于dna沉淀。然后使反應(yīng)混合物運(yùn)行通過qiaamp微型旋轉(zhuǎn)柱。相應(yīng)地添加600μl的洗滌緩沖液aw1和aw2。在洗滌步驟之后以16,000g將柱離心3min以去除所有殘余的洗滌緩沖液。在洗滌步驟之后以16,000g將柱離心3min以去除所有殘余的洗滌緩沖液。最后,將來自胎盤和cvs的dna分別在100μl和30μl的去離子水中洗脫。
對(duì)于基因組dna定量化,通過由nanodrop2000分光光度計(jì)(賽默科技(thermoscientific))測(cè)量在260nm和280nm下的吸光度的比率(260/280)來定量化提取的基因組dna。
對(duì)于基因組dna超聲處理,將5μg的基因組dna稀釋到130μl的超純水中,并且在進(jìn)行到庫制備之前,遵循制造商的說明書用s220對(duì)焦超聲發(fā)生器(科瓦里斯)將基因組dna超聲處理到100bp到300bp的大小范圍。
對(duì)于血漿dna庫制備,通過使用用于成對(duì)端方案的kapa庫制備試劑盒(kapabiosystems)制備血漿dna庫。末端修復(fù)反應(yīng)是第一步驟,用85μl的血漿dna、10μl的10×末端修復(fù)緩沖液、5μl的末端修復(fù)酶混合物實(shí)行。最終反應(yīng)混合物體積為100μl。在20℃下保溫30min之后,通過遵循制造商的說明書使用minelute反應(yīng)凈化試劑盒(minelutereactioncleanupkit)(凱杰)純化反應(yīng)混合物并在31μl的eb緩沖液中洗脫。洗脫的產(chǎn)物為30μl的末端修復(fù)dna,將洗脫的產(chǎn)物與5μl的10×a加尾緩沖液(a-tailingbuffer)、3μl的a加尾酶(a-tailingenzyme)和12μl的超純水混合,得到總50μl反應(yīng)混合物。將混合物在30℃下保溫30min并之后是minelute反應(yīng)凈化試劑盒(凱杰)用于純化。用31μl的緩沖液eb洗脫a加尾dna并進(jìn)行到銜接子接合。將30μl的a加尾dna與10μl的5×接合緩沖液、5μl的dna接合酶、1μl的dna銜接子(pe多重,15μm)和4μl的超純水混合以用于50μl反應(yīng)。將反應(yīng)物在20℃下保溫15in并之后是minelute反應(yīng)凈化試劑盒(凱杰)用于純化。在23μl的eb緩沖液中洗脫dna,用于接下來的pcr擴(kuò)增。pcr增濃反應(yīng)混合物包括22μl的銜接子接合的dna、25μl的2×kapahifihotstartreadymix、500nm的pepcr引物inpe1.0、10nm的pepcr引物inpe2.0和500nm的pcr引物index。pcr分布如下:在98℃下dna變性45sec,在98℃下15sec、65℃下30sec和72℃下30sec的14個(gè)周期,在72℃下最終擴(kuò)展1min。將pcr產(chǎn)物保持在4℃下直到進(jìn)行到遵循制造商的說明書通過minelutepcr純化試劑盒(凱杰)進(jìn)行pcr純化。用25μl的緩沖液eb洗脫最終的庫并且準(zhǔn)備dna庫驗(yàn)證。
對(duì)于基因組dna庫制備,通過使用用于成對(duì)端方案的kapa庫制備試劑盒(kapabiosystems)制備基因組dna庫。將1μg的經(jīng)超聲處理的基因組dna稀釋到85μl的超純水中。在末端修復(fù)反應(yīng)中,將85μl的經(jīng)超聲處理的dna、10μl的10×末端修復(fù)緩沖液、5μl的末端修復(fù)酶混合物添加在一起。最終反應(yīng)混合物體積為100μl。在20℃下保溫30min之后,通過遵循制造商的說明書使用minelute反應(yīng)凈化試劑盒(凱杰)純化反應(yīng)混合物并在31μl的eb緩沖液中洗脫。洗脫的產(chǎn)物為30μl的末端修復(fù)dna,將洗脫的產(chǎn)物與5μl的10×a加尾緩沖液、3μl的a加尾酶和12μl的超純水混合,得到總50μl反應(yīng)混合物。將混合物在30℃下保溫30min并之后是minelute反應(yīng)凈化試劑盒(凱杰)用于純化。用31μl的緩沖液eb洗脫a加尾dna并進(jìn)行到銜接子接合。將30μl的a加尾dna與10μl的5×接合緩沖液、5μl的dna接合酶、1μl的dna銜接子(pe多重,15μm)和4μl的超純水混合以用于50μl反應(yīng)。將反應(yīng)物在20℃下保溫15in并之后是minelute反應(yīng)凈化試劑盒(凱杰)用于純化。在23μl的eb緩沖液中洗脫dna,用于接下來的pcr擴(kuò)增。pcr增濃反應(yīng)混合物包括22μl的銜接子接合的dna、25μl的2×kapahifihotstartreadymix、500nm的pepcr引物inpe1.0、10nm的pepcr引物inpe2.0和500nm的pcr引物index。pcr分布如下:在98℃下dna變性45sec,在98℃下15sec、65℃下30sec和72℃下30sec的12個(gè)周期,在72℃下最終擴(kuò)展1min。將pcr產(chǎn)物保持在4℃下直到進(jìn)行到遵循制造商的說明書通過minelutepcr純化試劑盒(凱杰)進(jìn)行pcr純化。用25μl的緩沖液eb洗脫最終的庫并且準(zhǔn)備dna庫驗(yàn)證。
遵循制造商的方案使用具有2100生物分析儀(bioanalyzer)(安捷倫(agilent))的dna1000試劑盒分析庫大小分布。對(duì)于血漿dna庫,典型大小為290bp。
使用7300實(shí)時(shí)pcr系統(tǒng)(應(yīng)用生物系統(tǒng)公司(appliedbiosystems))上的kapa庫定量化試劑盒-illumina/abiprismsybrgreen(kapabiosystems),通過sybrgreen實(shí)時(shí)qpcr分析法定量化dna庫。試劑盒含有可通過側(cè)接illumina銜接子序列而擴(kuò)增dna庫片段的引物。試劑盒的標(biāo)準(zhǔn)曲線由以10倍稀釋的范圍為20pm到0.0002pm的6個(gè)標(biāo)準(zhǔn)物組成。反應(yīng)體積為20μl,由4μl標(biāo)準(zhǔn)物或100,000倍稀釋的dna庫、具有引物預(yù)混合物(primerpremix)的12μlkapasybrfastqpcr主混合物和4μl的pcr遞變水組成。每個(gè)樣品一式兩份并且包括6個(gè)ntc用于污染檢測(cè)。pcr分布為在95℃下10min;在95℃下30s和在60℃下45s的35個(gè)周期??紤]到dna標(biāo)準(zhǔn)物(452bp)和dna庫的平均大小之間的大小差異,根據(jù)此公式計(jì)算庫的濃度:
對(duì)于dna測(cè)序和比對(duì),使用標(biāo)準(zhǔn)成對(duì)端(76bp×2個(gè)周期)方案測(cè)序dna庫。附加的7個(gè)測(cè)序周期用于解碼hiseq2500或hiseq2000測(cè)序儀(伊路米那)上的多重測(cè)序中每個(gè)dna分子的指標(biāo)序列。使用短寡核苷酸比對(duì)程序2(soap2)(soap.genomics.org.cn)將非重復(fù)掩蔽hg19參考人類基因組(genome.ucsc.edu)應(yīng)用于序列讀段比對(duì)。僅使用成對(duì)端讀段,其中兩個(gè)末端與具有正確取向的相同染色體進(jìn)行比對(duì),跨越和插入大?。?lt;600bp。對(duì)于成對(duì)端讀段的每個(gè)成員允許具有不多于兩個(gè)核苷酸錯(cuò)配的讀段。僅映射到唯一基因組位置的讀段用于下游分析。
vii.計(jì)算機(jī)系統(tǒng)
本文提及的任何計(jì)算機(jī)系統(tǒng)都可利用任何合適數(shù)量的子系統(tǒng)。此類子系統(tǒng)的實(shí)例在圖6中以計(jì)算機(jī)設(shè)備10示出。在一些實(shí)施例中,計(jì)算機(jī)系統(tǒng)包括單個(gè)計(jì)算機(jī)設(shè)備,其中子系統(tǒng)可為計(jì)算機(jī)設(shè)備的組件。在其它實(shí)施例中,計(jì)算機(jī)系統(tǒng)可包括具有內(nèi)部組件的多個(gè)計(jì)算機(jī)設(shè)備,其各自是子系統(tǒng)。計(jì)算機(jī)系統(tǒng)可包括桌面計(jì)算機(jī)和膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、移動(dòng)電話和其它移動(dòng)裝置。
圖6所示的子系統(tǒng)經(jīng)由系統(tǒng)總線75互連。示出了附加的子系統(tǒng),如打印機(jī)74、鍵盤78、一個(gè)或多個(gè)存儲(chǔ)裝置79、耦合到顯卡82的監(jiān)測(cè)器76等。耦合到i/o控制器71的外圍裝置和輸入/輸出(i/o)裝置可通過本領(lǐng)域中已知的任何數(shù)量的構(gòu)件(如輸入/輸出(i/o)端口77(例如usb、
計(jì)算機(jī)系統(tǒng)可包括例如通過外部接口81或通過內(nèi)部接口連接在一起的多個(gè)相同組件或子系統(tǒng)。在一些實(shí)施例中,計(jì)算機(jī)系統(tǒng)、子系統(tǒng)或設(shè)備可通過網(wǎng)絡(luò)通信。在此類情形下,一個(gè)計(jì)算機(jī)可被認(rèn)為是客戶端并且另一個(gè)計(jì)算機(jī)可被認(rèn)為是服務(wù)器,其中各自可為同一計(jì)算機(jī)系統(tǒng)的一部分??蛻舳撕头?wù)器可各自包括多個(gè)系統(tǒng)、子系統(tǒng)或組件。
應(yīng)理解,本發(fā)明的任何實(shí)施例可按控制邏輯形式、使用硬件(例如專用集成電路或現(xiàn)場(chǎng)可編程門陣列)和/或使用具有通用可編程處理器的計(jì)算機(jī)軟件、以模塊化或集成方式來實(shí)施。如本文所使用,處理器包括單核處理器、在同一集成芯片上的多核處理器,或在單個(gè)電路板上或網(wǎng)絡(luò)化的多個(gè)處理單元?;诒竟_和本文提供的教示,本領(lǐng)域的技術(shù)人員將知道并且理解使用硬件和硬件與軟件的組合來實(shí)施本發(fā)明的實(shí)施例的其它方式和/或方法。
在本申請(qǐng)中所述的任何軟件組件或功能可作為軟件代碼實(shí)施以通過使用任何合適的計(jì)算機(jī)語言如例如java、c、c++、c#、面向?qū)ο蟮腸語言、swift)或腳本語言(如使用例如常規(guī)或面向?qū)ο蠹夹g(shù)的perl或python)的處理器執(zhí)行。軟件代碼可作為一系列指令或命令存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上用于存儲(chǔ)和/或傳輸,合適的介質(zhì)包括隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、磁性介質(zhì)(如硬盤驅(qū)動(dòng)器或軟盤)或光學(xué)介質(zhì)(如光盤(cd)或dvd(數(shù)字通用光盤))、快閃存儲(chǔ)器等。計(jì)算機(jī)可讀介質(zhì)可為此類存儲(chǔ)或傳輸裝置的任何組合。
還可使用適合于經(jīng)由符合各種協(xié)議的有線、光學(xué)和/或無線網(wǎng)絡(luò)(包括因特網(wǎng))傳輸?shù)妮d波信號(hào)來編碼和傳輸此類程序。因此,可使用以此類程序編碼的數(shù)據(jù)信號(hào)產(chǎn)生根據(jù)本發(fā)明的實(shí)施例的計(jì)算機(jī)可讀介質(zhì)。以程序代碼編碼的計(jì)算機(jī)可讀介質(zhì)可與兼容裝置一起封裝或與其它裝置分開提供(例如經(jīng)由因特網(wǎng)下載)。任何此類計(jì)算機(jī)可讀介質(zhì)可駐存于單個(gè)計(jì)算機(jī)產(chǎn)品(例如硬盤驅(qū)動(dòng)器、cd或整個(gè)計(jì)算機(jī)系統(tǒng))上或內(nèi)部,并且可存在于系統(tǒng)或網(wǎng)絡(luò)內(nèi)的不同計(jì)算機(jī)產(chǎn)品上或內(nèi)部。計(jì)算機(jī)系統(tǒng)可以包括用于向用戶提供本文提及的任何結(jié)果的監(jiān)視器、打印機(jī)或其它合適顯示器。
本文所述的任何方法可完全或部分用計(jì)算機(jī)系統(tǒng)執(zhí)行,所述計(jì)算機(jī)系統(tǒng)包括一或多個(gè)處理器,所述處理器可經(jīng)配置執(zhí)行所述步驟。因此,實(shí)施例可涉及經(jīng)配置執(zhí)行本文所述的任何方法的步驟的計(jì)算機(jī)系統(tǒng),潛在地用不同組件執(zhí)行相應(yīng)的步驟或相應(yīng)的步驟群組。盡管本文方法的步驟以經(jīng)編號(hào)步驟的形式呈現(xiàn),但其可同時(shí)或以不同順序執(zhí)行。另外,這些步驟的部分可與其它方法的其它步驟的部分一起使用。此外,步驟的全部或部分可是任選的。另外,任何方法的任何步驟都可用執(zhí)行這些步驟的模塊、電路或其它構(gòu)件來執(zhí)行。
可在不脫離本發(fā)明的實(shí)施例的精神和范圍的情況下以任何合適方式組合具體實(shí)施例的特定細(xì)節(jié)。然而,本發(fā)明的其它實(shí)施例可以涉及與每個(gè)個(gè)別方面或這些個(gè)別方面的特定組合相關(guān)的特定實(shí)施例。
本發(fā)明的實(shí)例實(shí)施例的以上描述已經(jīng)為了說明和描述的目的而呈現(xiàn)。其并不旨在是窮盡性的或?qū)⒈景l(fā)明限制于所描述的精確形式,并且鑒于以上教示,許多修改和變化是可能的。
除非具體相反地指示,否則“一個(gè)(a/an)”、或“所述”的敘述旨在意指“一個(gè)或多個(gè)”。除非具體相反地指示,否則“或”的使用旨在意指“兼或”,而非“異或”。
本文提及的所有專利、專利申請(qǐng)案、公開案和描述都出于所有目的以全文引用的方式并入。不承認(rèn)任一者是現(xiàn)有技術(shù)。