胎兒性染色體的非侵入性產(chǎn)前基因分型的制作方法
【專利摘要】本發(fā)明提供了用于分析母本樣品,從而確定孕婦的男性胎兒是否繼承了母親的X連鎖突變的方法、儀器和系統(tǒng)。獲得樣品中胎兒DNA的百分率,并確定兩種可能性(胎兒繼承突變的等位基因或正常的等位基因)的截斷值。然后,將X染色體上突變等位基因相對于正常等位基因的比例與截斷值相比較,以作出繼承了哪個等位基因的分類。備選地,可以將由X染色體上的目標(biāo)區(qū)域得到的等位基因的數(shù)量與X染色體上的參照區(qū)域的等位基因的數(shù)量相比較,從而鑒別缺失或擴增??梢酝ㄟ^計數(shù)與胎兒特有的等位基因的反應(yīng),并校正數(shù)量以說明反應(yīng)中的統(tǒng)計學(xué)分布來計算胎兒DNA的百分率。
【專利說明】胎兒性染色體的非侵入性產(chǎn)前基因分型
[0001]相關(guān)申請的交叉引用
[0002]本發(fā)明要求Lo et al.在2011年I月5日提交的題為“Noninvasive Prenatal Genotyping Of Fetal Sex Chromosomes”的美國臨時申請N0.61/430,032 (008300US)、以及 Lo et al.在 2011 年 4 月 14 日提交的題為“Noninvasive Prenatal Genotyping Of Fetal Sex Chromosomes”的美國臨時申請N0.61/475,632 (008301US)的優(yōu)先權(quán),并且為這些申請的非臨時申請,為了所有的目的,這些申請的全部內(nèi)容以引用方式并入本文。
[0003]本申請涉及Lo et al.在2008年7月23日提交的題為“Determining a Nucleic Acid Sequence Imbalance” 的共同擁有的美國專利申請 N0.12/178,116 (005210US),該申請的公開內(nèi)容以引用方式全文并入本文。
【背景技術(shù)】
[0004]血友病是由于在染色體X上的基因中發(fā)生了異源突變所導(dǎo)致的,其中所述的染色體 X 分別編碼了凝血因子 VIII (F8) (Kemball-Cook G, Tuddenham EG, Nucleic Acids Res.,25:128-132(1997))和凝血因子 IX(F9) (Giannelli F,Green PM, Sommer SS, et al.,Nucleic Acids Res.,26:265-268 (1998))。對于懷孕的血友病隱性基因攜帶者而言, 在每次懷孕中,都具有25%的幾率懷有受影響的男性胎兒。對于患有血友病的家族中的婦女而言,產(chǎn)前診斷是生殖選擇的重要方面(Le e CA, Chi C,Pavord SR, et al., Haemophilia.,12:301-336(2006))。此外,在分娩過程中,產(chǎn)前診斷對于適當(dāng)?shù)漠a(chǎn)科管理而言也是有利的, 并且作為滯產(chǎn)的生產(chǎn)、侵入性監(jiān)測技術(shù)以及協(xié)助性生產(chǎn)在受影響的胎兒中應(yīng)該避免從而減少潛在的胎兒和新生兒出血性并發(fā)癥(Lee CA, Chi C,Pavord SR, et al., Haemophilia., I 2:301-336 (2006))。因此,用于血友病的非侵入性產(chǎn)前診斷方法的研發(fā)對于產(chǎn)科醫(yī)生及血友病家族而目都是有利的。
[0005]目前用于性相關(guān)疾病的產(chǎn)前診斷方法通常是侵入性的,并且使胎兒處于風(fēng)險中。 在母親血漿中的無細(xì)胞胎兒DNA的發(fā)現(xiàn)為非侵入性產(chǎn)前診斷提供了新的機會(Lo YMD et al., Lancet., 350:485-487 (1997);Lo YMD, Chiu RffK, Nat Rev Genet.,8:71-77 (2007))。 已經(jīng)根據(jù)對母親血漿中父本遺傳的基因特性的檢測來研發(fā)大量有前途的臨床應(yīng)用。例如,胎兒性別和RHD狀態(tài)的非侵入性監(jiān)測可以用于性相關(guān)畸變和RhD不相容性的臨床管 理(Bustamante-Aragones A et al., Haemophilia., 14:593-598(2008);Finning K et al., BMJ., 336:816-818 (2008) )0對于諸如軟骨發(fā)育不全和P -珠蛋白生成障礙性貧血之類的單基因疾病而言,對母親血漿中父本遺傳的突變的存在或缺乏的檢測允許人們分別診斷胎兒的常染色體顯性疾病,或者排除胎兒的常染色體隱性疾病(Saito H et al., Lancet., 356:1170 (2000);Chiu RffK et al., Lancet., 360:998-1000(2002);Ding C et al.,Proc Natl Acad Sci U S A.,101:10762-10767(2004))。
[0006]盡管所述領(lǐng)域的快速研發(fā),仍難以檢測由突變攜帶者的母親繼承得到的胎兒的等位基因。困難是由于在母親血漿中胎兒和母親DNA共存所導(dǎo)致的,并且母親遺傳的胎兒等位基因與背景母親 DNA 不易區(qū)別(Lo YMD, Chiu RffK, Nat Rev Genet.,8:71-77 (2007))。[0007]因此,理想的是提供用于確定男性胎兒是否繼承了 X連鎖的突變的精確且有效的方法。
[0008]發(fā)明概述
[0009]本發(fā)明提供了用于分析母本樣品,以便確定孕婦的男性胎兒是否繼承了母親的X 連鎖突變的方法、儀器和系統(tǒng)。獲得樣品中胎兒DNA的百分率,并確定兩種可能性(胎兒繼承突變的等位基因或正常的等位基因)的截斷值。然后,將X染色體上突變等位基因相對于正常等位基因的比例與截斷值相比較,以作出繼承了哪個等位基因的分類。備選地,可以將由X染色體上的目標(biāo)區(qū)域得到的等位基因的數(shù)量與X染色體上的參照區(qū)域的等位基因的數(shù)量相比較,從而鑒別缺失或擴增??梢酝ㄟ^計數(shù)與胎兒特有的等位基因的反應(yīng),并校正數(shù)量以說明反應(yīng)中的統(tǒng)計學(xué)分布來計算胎兒DNA的百分率。
[0010]根據(jù)一個實施方案,提供了用于確定孕婦的男性胎兒是否具有X連鎖突變的方法。孕婦在X染色體上的基因座處為突變等位基因和正常等位基因的雜合的。數(shù)據(jù)得自多個反應(yīng),每個反應(yīng)都涉及由生物學(xué)樣品得到的一種或多種核酸分子。生物學(xué)樣品包括由孕婦得到的以及由男性胎兒得到的核酸分子。該數(shù)據(jù)包括第一組定量數(shù)據(jù)和第二組定量數(shù)據(jù),其中第一組定量數(shù)據(jù)表明在基因座處的突變等位基因的第一量,第二組定量數(shù)據(jù)表明在基因座處的正常等位基因的第二量。由第一量和第二量確定參數(shù),其中該參數(shù)表示第一量和第二量之間的相對量。獲得生物學(xué)樣品中胎兒核酸分子的百分率Pf。計算用于確定胎兒在基因座處是否繼承了突變等位基因的第一截斷值,其中第一截斷值至少衍生自k/ (1+k-pf)的第一比例,其中k為孕婦的突變?nèi)旧w上的突變等位基因的數(shù)量,k為等于或大于I的整數(shù)。計算用于確定胎兒在基因座處是否繼承了正常等位基因的第二截斷值,其中第二截斷值至少衍生自[k(1-Pf)]/[l+k-kpf)]的第二比例。將參數(shù)與第一截斷值和第二截斷值中的至少一者相比較,從而確定胎兒是繼承了突變等位基因還是正常等位基因的分類。
[0011]根據(jù)另一個實施方案,提供了用于確定孕婦的男性胎兒是否具有X連鎖突變的方法。孕婦在X染色體上的目標(biāo)區(qū)域處是突變等位基因和正常等位基因雜合的。突變?yōu)槟繕?biāo)區(qū)域的缺失或擴增。收到由多個反應(yīng)得到的數(shù)據(jù)。每個反應(yīng)都涉及由生物學(xué)樣品得到的一種或多種核酸分子。生物學(xué)樣品包括由孕婦得到的以及由男性胎兒得到的核酸分子。數(shù)據(jù)包括第一組定量數(shù)據(jù)和第二組定量數(shù)據(jù),其中第一組定量數(shù)據(jù)表明由目標(biāo)區(qū)域得到的核酸分子的第一量,第二組定量數(shù)據(jù)表明由X染色體上的參照區(qū)域得到的核酸分子的第二量。 由第一量和第二量確定參數(shù),其中該參數(shù)表示第一量和第二量之間的相對量。獲得生物學(xué)樣品中胎兒核酸分子的百分率Pf。計算用于確定胎兒是否繼承了突變的第一截斷值。該第一截斷值取決于百分率Pf。計算用于確定胎兒是否繼承了正常的等位基因的第二截斷值。 該第二截斷值取決于百分率Pf。將參數(shù)與第一截斷值和第二截斷值中的至少一者相比較, 從而確定胎兒是繼承了突變還是正常等位基因的分類。
[0012]根據(jù)另一個實施方案, 提供了在由懷有胎兒的孕婦得到的生物學(xué)樣品中獲得胎兒的核酸分子的百分率Pf的方法。數(shù)據(jù)得自多個反應(yīng)。每個反應(yīng)都涉及由生物學(xué)樣品得到的大量的核酸分子,其包括由孕婦得到的以及由胎兒得到的核酸分子。在反應(yīng)中檢測到第一等位基因。第一等位基因在這樣的基因座處由母未和胎兒所共有,其中在該基因座中,孕婦是純合的,而胎兒是雜合的或半合的。根據(jù)對第一等位基因為陽性反應(yīng)的數(shù)量來計算第一等位基因的校正濃度Px,其中Px是針對第一等位基因在多個反應(yīng)中的預(yù)計統(tǒng)計學(xué)分布來校正的。在反應(yīng)中檢測到第二等位基因,其中第二等位基因是胎兒特有的。根據(jù)對第二等位基因為陽性反應(yīng)的數(shù)量來計算第二等位基因的校正濃度Py。Py是針對第二等位基因在多個反應(yīng)中的預(yù)計統(tǒng)計學(xué)分布來校正的。然后,使用[(2Py)/(Px+Py)]來計算胎兒的百分率Pf。
[0013]其他實施方案涉及與本文所述的方法相關(guān)的系統(tǒng)及計算機可讀介質(zhì)。
[0014]參照以下發(fā)明詳述及附圖可以更好地理解本發(fā)明的性質(zhì)和優(yōu)點。
【專利附圖】
【附圖說明】
[0015]圖1為示出了根據(jù)本發(fā)明的實施方案的方法100的流程圖,方法100用于分析母本的生物學(xué)樣品從而診斷胎兒中X連鎖的紊亂。
[0016]圖2A示出了胎兒繼承了突變等位基因或正常等位基因的兩種可能性。圖2B示出了根據(jù)本發(fā)明的實施方案使用序列概率比檢驗(SPRT)所獲得的用于分類樣品的截斷值圖 250。
[0017]圖3為示出了根據(jù)本發(fā)明的實施方案的方法300的流程圖,方法300用于確定孕婦的男性胎兒是否具有X連鎖的突變。
[0018]圖4示出了根據(jù)本發(fā)明的實施方案的方法400,其用于確定男性胎兒是否繼承了 X 連鎖的突變。
[0019]圖5A示出了表500,其示出了針對染色體X上的突變,突變等位基因與野生型等位基因之間的劑量失衡。圖5B示出了當(dāng)懷孕的受試對象在所關(guān)注的基因座處是雜合的時,用于檢測擴增的第一方案。圖5C示出了當(dāng)懷孕的受試對象在所關(guān)注的基因座處是純合的時, 用于檢測擴增的第二方案。
[0020]圖6為示出了方法600的流程圖,方法600用于確定孕婦的男性胎兒是否具有X 連鎖的突變。
[0021]圖7為表700,其示出了針對染色體X上的缺失和重復(fù)突變,在目標(biāo)和參照基因座之間的劑量失衡。
`[0022]圖8為示出了根據(jù)本發(fā)明的實施方案的方法800的流程圖,方法800用于在由懷有胎兒的女性得到的生物學(xué)樣品中獲得胎兒核酸分子的百分率Pf。
[0023]圖9示出了具有7名懷孕婦女的臨床信息的表900,其中所述的懷孕婦女為血友病突變的攜帶者。
[0024]圖10為示出了針對等位基因判別法的寡核苷酸序列以及實時PCR條件的表1000。
[0025]圖11為示出了通過數(shù)字RMD在母本血漿中針對rs6528633進行胎兒的基因分型的表1100。
[0026]圖12示出了使用人工DNA混合物的數(shù)字RMD檢驗的確認(rèn)。
[0027]圖13為示出了通過數(shù)字RMD來非侵入性地檢驗?zāi)副狙獫{中胎兒血友病突變的表 1300。
[0028]圖14示出了在母本血漿樣品中針對胎兒血友病突變來進行SPRT分析的圖。在圖表的頂部示出箱號。已為包含突變等位基因的陽性孔的比例。
[0029]圖15示出了針對由正常的孕婦得到的母本血漿樣品的數(shù)字RMD結(jié)果。[0030]圖16示出了根據(jù)本發(fā)明的實施方案的系統(tǒng)和方法可用的計算機系統(tǒng)實例1600的框圖。
[0031]定義
[0032]如本文所用,術(shù)語“生物學(xué)樣品”是指取自受試對象(例如人,如懷孕的婦女)并包含一種或多種所關(guān)注的核酸分子的任何樣品。
[0033]術(shù)語“核酸”或“多核苷酸”是指單鏈或雙鏈形式的脫氧核糖核酸(DNA)或核糖核酸(RNA),及其聚合物。除非具體限定,否則該術(shù)語涵蓋了包括天然核苷酸的已知類似物的核酸,該核酸與參照核酸具有相似的結(jié)合性質(zhì),并且以與天然形成的核苷酸相同的方式代謝。除非另作說明,否者特定的核酸序列還含蓄地涵蓋了其保守修飾的變體(例如簡并密碼子取代)、等位基因、直向同源物、SNP、互補序列以及清楚指明的序列。具體而言,簡并密碼子取代可以通過生成這樣的序列來取得,其中在所述的序列中,一個或多個所選的(或所有的)密碼子的第三個位置被混合的堿基和/脫氧肌苷殘基取代(Batzer et al., Nucleic Acid Res.19:5081(1991);Ohtsuka et al., J.Biol.Chem.260:2605-2608 (1985);以及 Rossolini et al., Mo 1.Cell.Probes8:91-98 (1994) )? 術(shù)語核酸與基因、cDNA、mRNA、小分子非編碼RNA、microRNA (miRNA)、Piw1-相互作用RNA以及由基因或基因座編碼的短發(fā)夾 RNA (shRNA)交換使用。
[0034]術(shù)語“基因”是指與生產(chǎn)多肽鏈相關(guān)的DNA的節(jié)段。其可以包括編碼區(qū)域之前及之后的區(qū)域(前導(dǎo)區(qū)及尾隨區(qū)),以及單個編碼節(jié)段(外顯子)之間的間隔序列(內(nèi)含子)。
[0035]如本文所用,術(shù)語“反應(yīng)”是指與化學(xué)、酶或物理作業(yè)有關(guān)的任何過程,該過程表明存在或缺乏所關(guān)注的特定的多核苷酸序列?!胺磻?yīng)”的實例為擴增反應(yīng),例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)?!胺磻?yīng)”的另一個實例為通過合成、連接、雜交或降解的測序反應(yīng)。“信息性反應(yīng)” 是指表明了存在一種或多種所關(guān)注的特定多核苷酸序列的一種反應(yīng),以及其中僅存在一種所關(guān)注的序列的一種情況。如本文所用,術(shù)語“孔”是指在限定的結(jié)構(gòu)中,在預(yù)定位置處的反應(yīng),例如孔形瓶、池、PCR陣列中的室、乳液中的滴、顆粒、納米孔或者表面上的區(qū)域。
[0036]如本文所用,術(shù)語“過度呈現(xiàn)的核酸序列”是指在所關(guān)注的兩條序列(例如臨床相關(guān)的序列以及背景序列)中,比生物學(xué)樣品中的其他序列更富足的核酸序列。
[0037]如本文所用,術(shù)語“基于”是指“至少部分基于”,并且指在確定另一個值的過程中使用的一個值(或結(jié)果),例如在一種方法的輸入與該方法的輸出的關(guān)系中所形成的。此外, 如本文所用,術(shù)語“衍生”是指一種方法的輸入與該方法的輸出的關(guān)系,例如在衍生為公式的計算時所形成的。
[0038]如本文所用,術(shù)語“定量數(shù)據(jù)”是指由一個或多個反應(yīng)獲得的并提供一個或多個數(shù)值的數(shù)據(jù)。例如,對特定的序列顯示出熒光標(biāo)志物的孔數(shù)為定量數(shù)據(jù)。
[0039]如本文所用,術(shù)語“參數(shù)”是指表征定量數(shù)據(jù)組和/或定量數(shù)據(jù)組之間的數(shù)量關(guān)系的數(shù)值。例如,第一核酸序列的第一量與第二核酸序列的第二量之間的比值(或比值的函數(shù))為參數(shù)。
[0040]如本文所用,術(shù)語“基因座”及其復(fù)數(shù)形式為在基因組中具有變化的任何長度的核苷酸(或堿基對)的位置或地址。術(shù)語“等位基因”是指在相同的物理基因組基因座處備選的DNA序列,其可能或不可能得到不同的表現(xiàn)型特征。在任何特定的二倍體有機體中,其各染色體具有兩個拷貝(除了男性人類受試對象中的性染色體),各基因的基因型包括出現(xiàn)在該基因座處的成對的等位基因,其在純合體中是相同的,而在雜合體中是不同的。人群或有機體物種在不同的個體中在各基因座處通常包括多個等位基因。其中在人群中發(fā)現(xiàn)多于一個等位基因的基因組基因座被稱為多態(tài)位點?;蜃幍任换虻淖兓鳛榇嬖诘牡任换虻臄?shù)量(即,多態(tài)性的程度)或者人群中雜合體的比例(即,雜合性的比例)是可測量的。 如本文所用,術(shù)語“多態(tài)性”是指人類基因座中任何個體間的變化,而與其頻率無關(guān)。此類變化的實例包括但不限于單核苷酸多態(tài)性、簡單串聯(lián)重復(fù)多態(tài)性、插入-缺失多態(tài)性、突變 (其可能是疾病的原因)及拷貝數(shù)的變化。
[0041]如本文所用,術(shù)語“截斷值”是指數(shù)值,就生物學(xué)樣品而言,所述的值用于在兩個或多個分類狀態(tài)(例如疾病及非疾病的)之間進行判斷。例如,如果參數(shù)大于截斷值,則進行定量數(shù)據(jù)的第一分類(例如疾病狀態(tài));或者如果參數(shù)小于截斷值,則進行定量數(shù)據(jù)的不同分類(例如非疾病狀態(tài))。
[0042]如本文所用,術(shù)語“失衡”是指由在臨床相關(guān)的核酸序列的定量中至少一個截斷值與參照定量所定義的任何顯著的偏離。例如,參照定量可以為3/5的比例,因此,如果過所測量的比例為1:1,則發(fā)生失衡。
[0043]如本文所用,術(shù)語“測序標(biāo)簽”是指由核酸分子的任何部分或全部測序得到的核苷酸字符串。例如,經(jīng)測序的標(biāo)簽可以為由核酸片段測序得到的核苷酸的短的字符串、在核酸片段的兩個末端處的核苷酸的短的字符串、或者在生物學(xué)樣品中存在的完整核酸片段的測序。核酸片段為較大核酸分子的任何部分。片段(例如基因)可以與較大的核酸分子的其他部分分開存在(即,未連接)。
[0044]發(fā)明詳述
[0045]目前用于性相關(guān)疾病的產(chǎn)前診斷通常是侵入性的,并且使胎兒處于風(fēng)險中。在母本血漿中的無細(xì)胞胎兒DNA分析在所述的懷孕中提供了估測胎兒性別的非侵入性手段。但是,如果不實施突變特異性驗證分析,則男性胎兒的疾病狀態(tài)保持未知。在此,我們研發(fā)出非侵入性的檢驗來診斷胎兒是否由其母親繼承了性相關(guān)疾病的致病突變。一種策略是基于相對突變劑量(RMD)方法,我們之前已經(jīng)建立該方法用于針對常染色體疾病突變來確定胎兒的突變狀態(tài)。RMD方法通過檢測突變等位基因或野生型等位基因的濃度是否在攜帶男性胎兒的雜合型婦女的血漿中過度呈現(xiàn),來用于推斷胎兒在染色體X上是否繼承了性相關(guān)的突變。`
[0046]多個實施方案提供了 RMD方法在產(chǎn)前診斷X連鎖的紊亂(例如血友病)中的應(yīng)用。 針對常染色體疾病和X連鎖疾病的RMD分析之間的差異在于針對常染色體的RMD分析存在 3種可能的胎兒基因型(即,純合的正常型、純合的突變體以及雜合的),而對于X連鎖疾病的RMD分析而言,僅存在2種可能的胎兒基因型。在X連鎖疾病的情況下,男性胎兒僅具有一條染色體X,因此該染色體為突變基因型或野生型基因型。與常染色體疾病的3個結(jié)果相 t匕,對于給定的分析精確度而言,X連鎖疾病的2個結(jié)果可以使RMD方法更穩(wěn)健地用于X連鎖的疾病。此外,多個實施方案還可以用于其他性相關(guān)的疾病,包括但不限于Duchenne型肌營養(yǎng)不良、X連鎖的腎上腺腦白質(zhì)營養(yǎng)不良、Becker型肌營養(yǎng)不良、無脈絡(luò)膜、II型粘多糖儲積癥、Lesch Nyhan綜合癥、Norrie綜合癥以及鳥氨酸氨甲?;D(zhuǎn)移酶缺乏癥。
[0047]我們使用血友病,一種X連鎖的出血紊亂,作為實例來說明概念。在由處于血友病 (一種性相關(guān)疾病)風(fēng)險下的懷孕者(早至懷孕期的第11周開始)獲得的全部12例所研究的母本血漿樣品中,針對血友病突變,我們正確地檢測了胎兒的基因型。對于而言,這種研發(fā)可以為處于風(fēng)險下的家族做出進行較少的創(chuàng)傷和更高的安全性的產(chǎn)前檢驗的決定。
[0048]1.確定性相關(guān)的突變
[0049]圖1為示出了根據(jù)本發(fā)明的實施方案的方法100的流程圖,方法100用于分析母本的生物學(xué)樣品從而診斷胎兒中X連鎖的紊亂。方法100是非侵入性的,并且可以使用在母本的生物學(xué)樣品中循環(huán)的DNA。
[0050]在步驟110中,鑒別出在X染色體上具有已知的突變的懷孕受試對象。突變可以為本文所述的任何類型,例如血友病。突變可以以多種方式確定,例如DNA測序、Southern 印記分析、PCR (包括等位基因特異性的PCR)、熔融曲線分析等。所述的突變使得懷孕受試對象的僅僅一條X染色體具有突變,即,懷孕受試對象在與突變相關(guān)的基因座處是雜合的。 此外,多個實施方案還可以用于非侵入性地產(chǎn)前診斷與點突變或序列缺失、重復(fù)或倒位有關(guān)的其他性相關(guān)紊亂,例如無脈絡(luò)膜或Norrie綜合癥。
[0051]在步驟120中,接收到懷孕受試對象的生物學(xué)樣品。樣品可以為包含胎兒核酸的任何生物學(xué)樣品,例如血漿、尿、血清和唾液。例如,可以由接受產(chǎn)科護理的懷孕攜帶者收集得到的母本血漿樣品。
[0052]在步驟130中,確定胎兒的性別??梢酝ㄟ^檢測X和Y染色體來確定性別。通過檢測母本血漿中染色體Y的DNA序列,從懷孕期的第7周開始,能夠以高于97%的精確性鑒別男性胎兒。對于女性胎兒而言,可以避免不必要的侵入性檢驗,這是因為女性胎兒是不受影響的或者是疾病的攜帶者。
[0053]在步驟140中,胎兒被確定為女性,然后在145中未實施其他的分析。女性胎兒被影響為攜帶者,除非像偏斜的X染色體失活的較少的方案。
[0054]在步驟150中,胎兒被確定為男性,然后再步驟155中,分析X染色體上的DNA片段。在一個實施方案中,通過相對突變(RMD )技術(shù)來實施胎兒的突變檢測,其在下文中更詳細(xì)的描述。在另一個實施方案中,通過將在目標(biāo)區(qū)域(在母親中,該區(qū)域包括突變)處的等位基因的量與在參照區(qū)域(在母親中,該區(qū)域是正常的)處的等位基因的量相比較來檢測缺失或擴增的胎兒突變。
[0055]在步驟157中,可以確定胎兒未繼承母親受試對象的突變的X染色體。在步驟 159中,可以確定胎兒未繼承母親受試對象的突變的X染色體。如果需要,可以通過在懷孕者后期取得的第二母本血漿樣品來證實分類,此時胎兒的DNA百分率較高(Lun FMF et al.,Clin Chem.,54:1664-1672(2008)),從而允許更穩(wěn)健的檢驗。
[0056]I1.正常者與突變體之間的分類
[0057]在方法100的步驟155中進行的分析分析了母本樣品中的DNA片段。由于母本樣品中還包含胎兒DNA,所以可以確定男性胎兒的X染色體的基因型。就染色體X上的任何突變而言,在攜帶男性胎兒的雜合型婦女的血漿中,突變等位基因濃度與野生型等位基因濃度之間總是存在等位基因的失衡。過度呈現(xiàn)的等位基因為胎兒繼承的基因。在一個實施方案中,可以通過RMD技術(shù)來確定胎兒的基因型,其可以包括將母本樣品中突變等位基因的數(shù)量與正常等位基因的數(shù)量相比較。
[0058]圖2A示出了胎兒繼承了突變等位基因或正常等位基因的兩種可能性。針對X染色體上的特定基因座示出母本DNA210?;蜃?15為作為正常N的一個等位基因(野生型)與作為突變M的其他等位基因的雜合的。突變可以為多種類型,例如不同的序列、缺失、插入和倒位。在基因座215處,這些突變的每一個都可以鑒別為不同于正常等位基因的等位基因。
[0059]胎兒DNA220顯示具有2種可能性。由于男性胎兒僅具有I條X染色體,所以母本 DNA210的唯一 I條X染色體將繼承給男性胎兒??赡苄?22顯示男性胎兒繼承了突變等位基因M??赡苄?24顯示男性胎兒繼承了正常的等位基因M。此外,對于每一種可能性而言,還顯示出小于X染色體的Y染色體。
[0060]根據(jù)胎兒是否繼承了突變等位基因或正常等位基因,母本樣品(例如血漿)230具有不同的突變等位基因與正常等位基因的比例。就可能性222而言,由于男性胎兒繼承了突變等位基因M,所以母本樣品將具有更多的突變等位基因M。這是由于在分析了具有統(tǒng)計學(xué)意義的量的DNA時,胎兒DNA僅貢獻了突變等位基因M,而母本DNA貢獻了大致相等部分的突變等位基因M和正常的等位基因N。就可能性224而言,由于男性胎兒繼承了正常的等位基因N,所以母本樣品將具有更多的正常的等位基因N。
[0061]可以以多種方式計數(shù)顯示出正常和突變等位基因的DNA片段的數(shù)量,例如數(shù)字PCR、測序(包括Sanger測序、大規(guī)模平行測序和單一分子測序)、以及允許分析單一 DNA分子或擴增的DNA分子組的其他方法(例如在固體表面上的簇)。一旦計數(shù)N和M等位基因的數(shù)量, 便可以使用多種計數(shù)來進行分類,例如受影響的或未受影響的(例如胎兒是否患有血友病或者為正常的診斷)。例如,可以由N和M等位基因的數(shù)量來確定參數(shù)(例如比例或差異),并可以將參數(shù)與一個或多個截斷值相比較。通過多種統(tǒng)計技術(shù)來獲得截斷值,例如序列概率比檢驗(SPRT) (Zhou ff, Galizia G1Lieto E, et al., Nat Biotechnol., 19:78-81 (2001) ;Zhou ff, Goodman SN, Galizia G, et al., Lancet., 359:219-225(2002))。
[0062]圖2B示出了根據(jù)本發(fā)明的實施方案使用SPRT所獲得的用于分類樣品的截斷值圖 250。Y軸示出了突變的等位基因的比例已(參數(shù)的實例)。X軸示出了對于所計數(shù)的基因座215而言,等位基因的數(shù)量。2條曲線對應(yīng)于用于確定胎兒是否具有突變(例如血友病)、 為正?;蛘邽椴豢煞诸惖慕財嘀?。突變等位基因的比例(PJ高于上邊界且低于下邊界的樣品分別被分類為突變的和野生型的。已在2條曲線之間的樣品是不可分類的,并且需要額外的數(shù)字分析(例如由額外的PCR孔得到的數(shù)據(jù))。
[0063]待使用的特定截斷值取決于所計數(shù)的等位基因的數(shù)量。當(dāng)僅計數(shù)少量的等位基因時,它們可以為較大的統(tǒng)計學(xué)變化,因此截斷值需要極端的已值來確信地將樣品分類為突變的或正常的。如下文中更加詳細(xì)描述的那樣,可以使用數(shù)字PCR(其中Y軸可以為包含突變等位基因的陽性孔的比例,而X軸可以為陽性孔的數(shù)量)。曲線在Y軸上的位置可以根據(jù)如何計算參數(shù)而變化,例如如果參數(shù)為N等位基因的數(shù)量除以M等位基因的數(shù)量,則不可分類的區(qū)域?qū)⒓性?.0。
[0064]在另一個實施方式中,其中突變?yōu)槿笔Щ驍U增,在目標(biāo)區(qū)域(例如基因座215)(其中I條母本X染色體具有缺失/擴增)和參照區(qū)域(不具有擴增或缺失)處的片段的數(shù)量之間的比較可以用于鑒別缺失/擴增。此類實施方式并非取決于雜合的基因座的鑒別,因此懷孕的受試對象在目標(biāo)區(qū)域處可以是純合的。就缺失而言,人們預(yù)計由目標(biāo)區(qū)域得到的片段比由參照區(qū)域得到的片段少。就擴增而言,人們預(yù)計由目標(biāo)區(qū)域得到的片段比由參照區(qū)域的倒的片段多。此外,還可以使用SPRT或相似的技術(shù)來確定截斷值。
[0065]II1.RMD 方法
[0066]圖3為示出了根據(jù)本發(fā)明的實施方案的方法300的流程圖,方法300用于確定孕婦的男性胎兒是否具有X連鎖的突變。孕婦在X染色體的基因座處是突變等位基因與正常等位基因的雜合的。方法300使用了突變等位基因和正常等位基因的相對量以便進行疾病的分類。
[0067]在步驟310中,收到了由多個反應(yīng)得到的數(shù)據(jù)。每個反應(yīng)都涉及由生物學(xué)樣品得到的一種或多種核酸分子,其中所述的生物學(xué)樣品包含由孕婦得到的以及由男性胎兒得到的核酸分子。反應(yīng)可以為多種類型,例如在多個孔中的數(shù)字PCR反應(yīng)。其他實施方案可以使用其他反應(yīng),例如測序反應(yīng)(例如通過大規(guī)模平行測序平臺,包括但不限于Illumina Genome Analyzer、Roche454、Life Technologies SOLiD、Pacific Biosciences 單一分子實時測序或1n Torrent)、引物延伸反應(yīng)、質(zhì)譜、使用納米孔的分析、光學(xué)方法或者與熒光或其他探針雜交。因此,數(shù)據(jù)可以包括由數(shù)字PCR孔得到的熒光信號、由測序孔中DNA分子的至少一部分而獲得的測序標(biāo)簽、或者由此類反應(yīng)得到的其他數(shù)據(jù)。
[0068]由反應(yīng)得到的數(shù)據(jù)包括第一組定量數(shù)據(jù)和第二組定量數(shù)據(jù),其中第一組定量數(shù)據(jù)表明在基因座處的突變等位基因的第一量,第二組定量數(shù)據(jù)表明在基因座處的正常等位基因的第二量。可以以多種方式測量基因座處特定等位基因的量,例如,通過特定等位基因為陽性的孔的總數(shù),計數(shù)包含特定等位基因并與基因座比對(使用參照基因組)的測序標(biāo)簽的數(shù)量,以及測序核苷酸(堿基對)的數(shù)量或者測序核苷酸(堿基對)的累積長度,其中所述的核苷酸包括特定的等位基因并與基因座比對。
[0069]在步驟320中,由第一量和第二量確定參數(shù)。參數(shù)表上第一量和第二量之間的相對量。參數(shù)可以為例如第一量與第二量的簡單的比值,或者第一量與第二量加上第一量的比值。在一個方面中,各個量可以為函數(shù)或分離函數(shù)的自變量,其中比值可以取自這些分離函數(shù)。本領(lǐng)域的技術(shù)人員將理解不同的合適參數(shù)的數(shù)量。例如,參數(shù)可以為血漿樣品中突變等位基因的數(shù)量與突變等位基因和野生型等位基因的總數(shù)的比值,表示為已。
[0070]在步驟330中,獲得生物學(xué)樣品中胎兒核酸分子的百分率Pf。百分率Pf提供了在母本樣品中相對于母本DNA有多少胎兒DNA的量度。如果百分率Pf較高,則繼承的等位基因的過度表達將變得更多。百分率可以表示為0至I之間的分?jǐn)?shù),其中I為100%。`
[0071]在步驟340中,計算用于確定胎兒在基因座處是否繼承了突變等位基因的截斷值。第一截斷值至少衍生自l/(2-Pf)的第一比例。根據(jù)由步驟320得到的參數(shù)的公式化的方式,如果突變等位基因是繼承的,則比例l/(2-Pf)可以等于預(yù)計的第一量與第二量的比值??梢詫㈩A(yù)計值輸入統(tǒng)計學(xué)函數(shù)中,從而確定截斷值??梢允褂迷S多不同類型的方法來確定截斷值,例如SPRT、假陽性率、置信度區(qū)間以及受試者操作特征(ROC)曲線分析。
[0072]在步驟350中,計算用于確定胎兒在基因座處是否繼承了正常的等位基因的第二截斷值。第二截斷值至少衍生自(l-Pf)/(2-Pf)的第二比例。
[0073]在步驟360中,將參數(shù)與第一截斷值和第二截斷值中的至少一者相比較,從而確定胎兒是否繼承了突變等位基因或正常等位基因的分類。如上文所述,分類可以包含受影響的(繼承突變)和未受影響的(繼承正常),并且還可以包含未分類的。此外,分類還可以包含精確性的可能性,例如可以通過多少參數(shù)超過(高于或低于)截斷值來確定精確性。在一個實施方式中,分類可以為得分,該得分將在后期由例如醫(yī)生來解釋。
[0074]顯示等位基因的量的數(shù)據(jù)可以得自相連的等位基因。與突變等位基因或正常等位基因相連的等位基因可以用于替代正常的和突變等位基因。例如,在與突變核酸序列連鎖的多態(tài)位點處的等位基因可以為與突變核酸序列位于相同的母本單倍型上的等位基因,其中多態(tài)位點和突變核酸序列之間的重組概率低于某值,例如1%。因此,多態(tài)位點可以提供相同或相似的定量數(shù)據(jù)作為直接測量突變等位基因。另一個實例,在與正常核酸序列連鎖的多態(tài)位點處的等位基因可以為與正常核酸序列位于相同的母本單倍型上的等位基因,其中多態(tài)位點和突變核酸序列之間的重組概率低于某值,例如1%。
[0075]A.使用了 PCR和血漿的實例
[0076]如上文所提及,數(shù)字PCR可以用作用于鑒別DNA片段的方法,其中所述的DNA片段包含突變的等位基因或正常的等位基因。在數(shù)字PCR中,樣品被分成多個區(qū)間(例如孔和珠)。平均起來,每個區(qū)間包含不到一個等位基因(兩個等位基因的任一者)。因此,陽性孔可以計數(shù)為單一的,而非包含等位基因的片段。
[0077]圖4示出了根據(jù)本發(fā)明的實施方案的方法400,其用于確定男性胎兒是否繼承了 X 連鎖的突變。數(shù)字PCR用于確定突變等位基因的比例和胎兒DNA的百分率。胎兒DNA百分率用于確定突變等位基因的比例待比較的截斷值,因此,提供了男性胎兒是否繼承了突變的分類。由于突變等位基因的比例被確定,所以這些實施方案可以稱為RMD方法。
[0078]如所示,對于各個母本血漿DNA樣品而言,通過數(shù)字PCR確定突變DNA比例(Pj和胎兒DNA百分率Pf,但是可以使用能夠鑒別某些序列的其他反應(yīng)。在左側(cè)(方法401)提供了用于確定P,的步驟,而在右側(cè)(方法402)為用于確定胎兒DNA濃度份數(shù)Pf的步驟。如所示,使用靶向母本攜帶的突變的實時PCR檢驗來確定P,,而對于同源的ZFY和ZFX基因區(qū)域,使用實施PCR檢驗來確定胎兒DNA百分率Pf。
[0079]在步驟410中,制備PCR混合物。如所示,就兩種測量而言,混合物是不同的。對于測量(方法401)而言,混合包含PCR引物,從而在包含待測試的基因座的X染色體上擴增區(qū)域。此外,混合物還包含用于鑒別具有野生型等位基因的DNA片段的存在情況的熒光探針,以及用于鑒別具有突變等位基因的DNA片段的存在情況的熒光探針。對于Pf測量 (方法402)而言,混合物包含用于ZFY和ZFX基因區(qū)域 的引物。此外,混合物還包含用于鑒別DNA片段(包含得自ZFX基因的序列)的存在情況的熒光探針,以及用于鑒別DNA片段(包含得自ZFY基因的序列)的存在情況的熒光探針。
[0080]在步驟420中,將反應(yīng)混合物加載到PCR儀中。在一個實施方案中,在微流體數(shù)字陣列(Fluidigm)中實施數(shù)字PCR,所述的陣列由12個平板構(gòu)成,每個平板進一步分隔成 765個反應(yīng)室。使用6個平板(即,765x6=4590個室)分析各個DNA樣品(即,一個樣品用于 Pr,一個樣品用于Pf)。PCR混合物首先可以人工加入到各個平板的進樣口中。然后,通過 Integrated Microfluidics Circuit Controller (Fluidigm),在各個平板中以自動化的方式將混合物等分至765個室中。各個室均的最終反應(yīng)體積為6nL。母本血漿中的無細(xì)胞DNA 濃度通常極低,使得平均每個室中存在不到I個模板分子。因此,模板分子在室中的分布滿足泊松分布。對其他樣品而言,人們可以必須在分析之前稀釋DNA樣品。此外,對于本領(lǐng)域的技術(shù)人員而言顯而易見的是可以使用本領(lǐng)域的技術(shù)人員所公知的方法來實施數(shù)字PCR, 例如微流體芯片、納升PCR微板系統(tǒng)、乳液PCR (包含RainDance平臺)、polony PCR、滾環(huán)擴增、引物衍生以及質(zhì)譜。
[0081]如已測量所示,包含具有野生型等位基因的DNA片段的孔(室)以藍(lán)色顯示,而包含具有突變等位基因的DNA片段的孔以紅色顯示。不包含模板DNA分子(即,不具有探針?biāo)m用的等位基因)的孔簡單以白色顯示。相似地,對于Pf測量而言,包含ZFX基因的孔以藍(lán)色顯示,而包含ZFY基因的孔以紅色顯示。
[0082]在步驟430中,例如,在BioMark System(Fluidigm)上實施實時PCR。通過擴增 DNA區(qū)域的一系列循環(huán)來處理各個孔,其中在相應(yīng)的混合物中所述的DNA區(qū)域與引物相應(yīng)。 由于大部分的室包含0或I個模板DNA分子,所以由孔得到的擴增產(chǎn)物來源于I個模板DNA 分子。
[0083]在步驟440中,計數(shù)陽性PCR擴增的室的數(shù)量。就方法401而言,可以計數(shù)野生型等位基因為陽性的室的數(shù)量,并且可以計數(shù)突變等位基因為陽性的室的數(shù)量。就方法402 而言,可以計數(shù)ZFX基因為陽性的室的數(shù)量,并且可以計數(shù)ZFY基因為陽性的室的數(shù)量。此外,在各個方法中,還可以鑒別兩種等位基因均為陽性的室的數(shù)量??梢砸远喾N方式進行陽性室的檢測,例如檢測熒光信號(例如每個等位基因?qū)l(fā)出不同的顏色信號)。例如,包含 ZFX基因的室可以發(fā)出藍(lán)色熒光信號,而包含ZFX基因的孔可以發(fā)出紅色熒光信號。
[0084]在步驟450中,使用在步驟440中計數(shù)的相應(yīng)數(shù)量來計算突變DNA比例(P,)和胎兒DNA百分率Pf。例如,突變等位基因的比例可以計算為突變等位基因為陽性的室的數(shù)量除以陽性孔的總數(shù)。另一實例,分母可以為僅對一個等位基因是陽性的室的總數(shù)。不適用于計數(shù)的大致數(shù)量有關(guān)的比值,所述的值可以為它們本身的濃度,從而有效地將分子和分母除以上述任何一個值。相似的值可以用于使用等式[(2Y)/(X+Y)]*100%的來計算胎兒DNA 百分率,其中Y為ZFY基于的測量量(例如陽性室的計數(shù)或陽性室的比例),而X為ZFX基于的測量量。
[0085]由于每個反應(yīng)孔中存在少于I個的模板分子,所以分布到各反應(yīng)室中的模板分子的實際數(shù)量滿足泊松分布。因此,可以使用等式[-1n((N-P)/N)]*N來泊松校正任何等位基因的室的數(shù)量,其中N為所分析的反應(yīng)室的總數(shù)量,P為等位基因陽性的室的數(shù)量,而In為自然對數(shù)。然后,按照與上文所述相似的方式來使用Poission校正的值,從而確定比例P1 和胎兒DNA百分率Pf。
[0086]在步驟460中,突變DNA比例(Pj和胎兒DNA百分率Pf用于實施男性胎兒是否繼承了突變或者未繼承的分類。如方法300所述,可以由胎兒DNA百分率Pf來確定截斷值,例如在步驟340和350中。此外,截斷值還可以衍生自(其包括等于)平均參照模板濃度(nv), 例如對野生型等位基因為陽性的室的經(jīng)驗測量百分率可以用于確定在步驟460中使用的截斷值。該策略可以進一步減少在可以進行可靠的分類之前所需要的測試的量。這與血漿核酸分析是特別相關(guān)的,其中在所述的分析中,模板的量通常是有限的。
[0087]B.SPRT
[0088]SPRT為一種在數(shù)據(jù)累積時允許兩種概率性的假設(shè)被比較。換言之,其為一種統(tǒng)計學(xué)方法,從而將數(shù)字PCR的結(jié)果顯示為對突變等位基因或正常等位基因的相位差來進行分類。該方法具有減少待分析的孔的數(shù)量的優(yōu)點,從而得到給定的統(tǒng)計能力和精確性。
[0089]在示例性的SPRT分析中,試驗結(jié)果對2種備選的假說進行檢驗。當(dāng)突變等位基因過度呈現(xiàn)時,第一備選假說被接收。當(dāng)突變等位基因呈 現(xiàn)不足時,第二備選假說被接收。測量的匕將與2個截斷值中的至少一者相比較,從而接受第一或第二備選假說。如果沒有假說被接受,則樣品被標(biāo)記為未分類的,其意味著所觀察的數(shù)字PCR結(jié)果不足以以所需的統(tǒng)計置信度將樣品分類??梢允占嗟臄?shù)據(jù)來獲得所需的統(tǒng)計置信度。
[0090]一對曲線(其取決于所收集的數(shù)據(jù)的量)可以定義用于接收或拒絕假設(shè)的概率邊界(截斷值)(Zhou ff, Galizia G, Lieto E, et al., Nat Biotechnol.,19:78-81 (2001) ; Zhou ff, Goodman SN, Galizia G, et al.,Lancet.,359:219-225 (2002))。對于用于分類胎兒基因型的給定總數(shù)量的陽性反應(yīng)(X-軸)而言,SPRT曲線描繪了所需的已(y-軸)。如果試驗已落入上邊界以上則接受假設(shè)(i ),或者如果試驗已落入下邊界以下,則接受假設(shè)(i i )。 可以使用水平改變的統(tǒng)計置信度(例如調(diào)節(jié)至閾值概率比為8)來確定用于計算SPRT邊界的等式。在一個方面中,SPRT曲線的截斷值是樣品特異性的。截斷值取決于上文所述的胎兒DNA濃度份數(shù)(胎兒DNA百分率)。此外,對于給定組數(shù)的反應(yīng),截斷值還可以取決于每個 PCR 孔的平均參照模板濃度(mr) (Lo YMD et al., Proc Natl Acad Sci U S A.2007; I 04:13116-13121(2007) ;Lun FMF, Tsui NBY, Chan KCA, et al., Proc Natl Acad Sci U S A.,105:19920-19925(2008))。參照模板可以指在樣品中顯示出較少的陽性擴增計數(shù)的等位基因。
[0091]SPRT可以提供這樣的優(yōu)點,對于給定水平的置信度而言,需要比其他統(tǒng)計學(xué)方法更少量的測試。實際上,一旦所需量的數(shù)據(jù)已經(jīng)被累積,SPRT允許接受或拒絕任一種假設(shè), 因此減少了不必要的額外的分析。這種特征與血漿核酸的分析是特別相關(guān)的,血漿核酸的分析通常以低濃度呈現(xiàn),其中可利用的模板分子的數(shù)量是有限的。除了嚴(yán)格的分類以外,分類還可以包括精確度。例如,通過與極端值相比較而得到的分類可以提供:樣品以某一百分率顯示核酸序列失衡的可能性,或者相當(dāng)?shù)靥峁?所確定的失衡精確至某一百分率或其他值。
[0092]對于使用SPRT的實施方案而言,人們可以使用El Karoui at al的用于計算SPRT曲線的上邊界和下邊界的等式(El Karoui N,Zhou ff, Whittemore AS, Stat Med.25:3124-3133(2006))。此外,可以通過調(diào)節(jié)等式中閾值概率比來改變優(yōu)選用于接受第一或第二假設(shè)的統(tǒng)計置信度水平。閾值概率比為8顯示在癌癥檢測方面提供了區(qū)別具有等位基因失衡和不具有等位基因失衡的令人滿意的性能。因此,在一個實施方案中,用于計算 SPRT曲線的上邊界和下邊界的等式為:
[0093]上邊界=[(ln8)/N-1n 5 ]/ln Y
[0094]下邊界=[(lnl/8)/N-1n 8 ]/ln Y
(I —漢)
[0095]其中
【權(quán)利要求】
1.一種用于確定孕婦的男性胎兒是否具有X連鎖突變的方法,其中所述孕婦在所述X 染色體的基因座處是突變等位基因和正常等位基因雜合的,所述方法包括:接收由多個反應(yīng)得到的數(shù)據(jù),每個反應(yīng)都涉及由生物學(xué)樣品得到的一種或多種核酸分子,所述生物學(xué)樣品包括由所述孕婦得到的以及由所述男性胎兒得到的核酸分子,其中所述數(shù)據(jù)包括:第一組定量數(shù)據(jù),其表明所述基因座處的所述突變等位基因的第一量;以及第二組定量數(shù)據(jù),其表明所述基因座處的所述正常等位基因的第二量;由所述第一量和所述第二量確定參數(shù),其中所述參數(shù)表示所述第一量和所述第二量之間的相對量;獲得所述生物學(xué)樣品中胎兒核酸分子的百分率Pf;計算用于確定所述胎兒在所述基因座處是否繼承了所述突變等位基因的第一截斷值, 其中所述第一截斷值至少衍生自k/(l+k-Pf)的第一比例,其中k為所述孕婦的突變?nèi)旧w上的突變等位基因的數(shù)量,k為等于或大于I的整數(shù);計算用于確定所述胎兒在所述基因座處是否繼承了所述正常等位基因的第二截斷值, 其中所述第二截斷值至少衍生自[k(1-Pf) ]/[l+k-kPf)]的第二比例;以及將所述參數(shù)與所述 第一截斷值和第二截斷值中的至少一者相比較,從而確定所述胎兒是繼承了所述突變等位基因還是所述正常等位基因的分類。
2.如權(quán)利要求1所述的方法,其中將所述參數(shù)與所述第一截斷值和第二截斷值相比較。
3.如權(quán)利要求2所述的方法,其中所述分類包括疾病狀態(tài)、非疾病狀態(tài)和不可分類的。
4.如權(quán)利要求1至3的任意一項所述的方法,其中獲得所述百分率Pf?包括:使用在所述多個反應(yīng)中分子的預(yù)計統(tǒng)計學(xué)分布來校正所述生物學(xué)樣品中胎兒核酸分子的試驗得出的百分率。
5.如權(quán)利要求1至4的任意一項所述的方法,其中獲得所述百分率Pf?包括:在所述反應(yīng)中檢測第一等位基因,其中所述第一等位基因在這樣的基因座處由母親和胎兒所共有,其中在該基因座處,所述孕婦是純合的,而所述胎兒是雜合的或半合的;使用等式[-1n ((N-Pl)/N)] *N來計算泊松校正的濃度Px,其中N為所分析的反應(yīng)的總數(shù)量,Pl為對所述第一等位基因為陽性反應(yīng)的數(shù)量,而In為自然對數(shù);在所述反應(yīng)中檢測第二等位基因,其中所述第二等位基因是所述胎兒特有的;以及使用等式[-1n ((N-P2)/N)] *N來計算泊松校正的濃度Py,其中N為所分析的反應(yīng)的總數(shù)量,而P2為對所述第二等位基因為陽性反應(yīng)的數(shù)量。
6.如權(quán)利要求5所述的方法,其中所述第二等位基因在染色體Y上。
7.如權(quán)利要求5所述的方法,其中所述第一等位基因在染色體X上。
8.如權(quán)利要求5所述的方法,其中所述胎兒特有的等位基因為常染色體上父本遺傳的等位基因。
9.如權(quán)利要求5所述的方法,其中所述胎兒特有的等位基因包括胎兒特有的甲基化標(biāo)志物。
10.如權(quán)利要求5所述的方法,進一步包括:按照[(2Py) / (Px+Py) ] *100% 計算 Pf0
11.如權(quán)利要求1至10的任意一項所述的方法,其中使用序列概率比檢驗(SPRT)來確定所述第一和第二截斷值,從而確定所述胎兒是繼承了所述突變核酸序列還是所述正常核酸序列。
12.如權(quán)利要求1至11的任意一項所述的方法,其中在與所述突變核酸序列連鎖的多態(tài)位點處的等位基因為與所述突變核酸序列位于相同的母本單倍型上的等位基因,并且其中所述多態(tài)位點與所述突變核酸序列之間的重組概率低于1%。
13.如權(quán)利要求1至11的任意一項所述的方法,其中在與所述正常核酸序列連鎖的多態(tài)位點處的等位基因為與所述正常核酸序列位于相同的母本單倍型上的等位基因,并且其中在所述多態(tài)位點與所述突變核酸序列之間的重組概率低于1%。
14.如權(quán)利要求1至13的任意一項所述的方法,其中所述反應(yīng)包括以下反應(yīng)的任意一種或多種:測序反應(yīng)、光學(xué)分析、使用熒光探針的雜交或者納米孔測序。
15.如權(quán)利要求1至13的任意一項所述的方法,其中反應(yīng)為擴增反應(yīng)。
16.如權(quán)利要求15所述的方法,其中所述反應(yīng)包括聚合酶鏈?zhǔn)椒磻?yīng)。
17.如權(quán)利要求17所述的方法,其中所述平均濃度低于每個反應(yīng)I個模板分子,并且其中泊松分布用于確定所述生物學(xué)樣品中胎兒核酸分子的百分率Pf。
18.如權(quán)利要求1至17的任意一項所述的方法,其中所述生物學(xué)樣品為來自孕婦的血衆(zhòng)、血清或者全血。
19.一種用于確定孕婦的男性胎兒是否具有X連鎖突變的方法,所述方法包括:接收由多個反應(yīng)得到的數(shù)據(jù),每個反應(yīng)都涉及由生物學(xué)樣品得到的一種或多種核酸分子,所述生物學(xué)樣品包括由所述孕婦得到的以及由所述男性胎兒得到的核酸分子, 其中所述孕婦對于所述X染色體上的基因座處的等位基因是純合的,在突變X染色體上具有所述等位基因的擴增的突變,以及具有在所述基因座處具有正常拷貝的所述等位基因的正常X染色體,所述突變X染色體具有在所述基因座處正??截惖乃龅任换蛞约耙粋€或多個額外拷貝的等位基因,其中所述數(shù)據(jù)包括:第一組定量數(shù)據(jù),其表明由所述一個或多個額外拷貝的等位基因產(chǎn)生的額外連接的第一量;以及第二組定量數(shù)據(jù),其表明在2條X染色體上由所述正??截惖牡任换虍a(chǎn)生的正常連接的第二量;由所述第一量和所述第二量確定參數(shù),其中所述參數(shù)表示所述第一量和所述第二量之間的相對量;獲得所述生物學(xué)樣品中胎兒核酸分子的百分率Pf ;計算用于確定所述胎兒是否繼承了所述突變X染色體的第一截斷值,其中所述第一截斷值至少衍生自n/(n+l-Pf)的第一比例,其中n為所述等位基因的額外拷貝的數(shù)量,n為等于或大于I的整數(shù);計算用于確定所述胎兒是否繼承了所述正常X染色體的第二截斷值,其中所述第二截斷值至少衍生自[n (1-Pf)/[n+2-Pf(n+l)]的第二比例;以及將所述參數(shù)與所述第一截斷值和第二截斷值中的至少一者相比較,從而確定所述胎兒是繼承了所述突變X染色體還是所述正常X染色體的分類。
20.一種用于確定孕婦的男性胎兒是否具有X連鎖突變的方法,其中所述孕婦在所述X 染色體的目標(biāo)區(qū)域處是突變和正常等位基因雜合的,其中所述突變是所述目標(biāo)區(qū)域的缺失或擴增,所述方法包括:接收由多個反應(yīng)得到的數(shù)據(jù),每個反應(yīng)都涉及由生物學(xué)樣品得到的一種或多種核酸分子,所述生物學(xué)樣品包括由所述孕婦得到的以及由所述男性胎兒得到的核酸分子,其中所述數(shù)據(jù)包括:第一組定量數(shù)據(jù),其表明由所述目標(biāo)區(qū)域得到的核酸分子的第一量;以及第二組定量數(shù)據(jù),其表明由所述X染色體上的參照區(qū)域得到的核酸分子的第二量;由所述第一量和所述第二量確定參數(shù),其中所述參數(shù)表示所述第一量和所述第二量之間的相對量;獲得所述生物學(xué)樣品中胎兒核酸分子的百分率Pf;計算用于確定所述胎兒是否繼承了所述突變的第一截斷值,所述第一截斷值取決于所述百分率Pf;計算用于確定所述胎兒是否繼承了所述正常等位基因的第二截斷值,所述第二截斷值取決于所述百分率Pf;以及將所述參數(shù)與所述第一截斷值和第二截斷值中的至少一者相比較,從而確定所述胎兒是繼承了所述突變還是所述正常等位基因的分類。
21.如權(quán)利要求20所述的方法,其中所述突變?yōu)閿U增,其中所述第一截斷值是基于這樣的假定來確定的,所述假定為當(dāng)與攜帶所述相同擴增突變的未懷孕婦女的所述第一量與所述第二量的比值相比較時,該相應(yīng)的比值升高,并且所述第二截斷值是基于這樣的假定來確定的,所述假定為當(dāng)與攜帶所述相同擴增突變的未懷孕婦女的所述第一量與所述第二量的比值相比較時,該相應(yīng)的比值降低。
22.如權(quán)利要求20所述的方法,其中所述突變?yōu)槿笔?,其中所述第二截斷值是基于這樣的假定來確定的,所述假定為當(dāng)與攜帶所述相同缺失突變的未懷孕婦女的所述第一量與所述第二量的比值相比較時,該相應(yīng)的比值升高,并且所述第一截斷值是基于這樣的假定來確定的,所述假定為當(dāng)與攜帶所述相同缺失突變的未懷孕婦女的所述第一量與所述第二量的比值相比較時,該相應(yīng)的比值降低。
23.如權(quán)利要求20所述的方法,其中所述突變?yōu)槿笔?,其中所述第二截斷值至少衍生自l/(2-Pf)的第一比例,并且其中所述第一截斷值至少衍生自(l-Pf)/(2-Pf)的第二比例。
24.如權(quán)利要求20所述的方法,其中所述突變?yōu)橹貜?fù),其中所述第二截斷值至少衍生自(3-Pf)/(2-Pf)的第一比例,并且其中所述第一截斷值至少衍生自(3-2Pf)/(2-Pf)的第二比例。
25.如權(quán)利要求20至24的任意一項所述的方法,其中獲得所述百分率Pf包括:使用在所述多個反應(yīng)中分子的預(yù)計統(tǒng)計學(xué)分布來校正所述生物學(xué)樣品中胎兒核酸分子的試驗得出的百分率。
26.一種在由懷有胎兒的孕婦得到的生物學(xué)樣品中獲得胎兒核酸分子的百分率的方法,所述方法包括:接收由多個反應(yīng)得到的數(shù)據(jù),每個反應(yīng)都涉及由生物學(xué)樣品得到的大量核酸分子,所述生物學(xué)樣品包括由所述孕婦得到的以及由所述男性胎兒得到的核酸分子;在所述反應(yīng)中檢測第一等位基因,其中所述第一等位基因在這樣的基因座處由母親和胎兒所共有,其中在該基因座處,所述孕婦是純合的,而所述胎兒是雜合的或半合的;基于對所述第一等位基因為陽性反應(yīng)的數(shù)量來計算所述第一等位基因的校正濃度Px, 其中Px是針對所述第一等位基因在所述多個反應(yīng)中的預(yù)計統(tǒng)計學(xué)分布來校正的;在所述反應(yīng)中檢測第二等位基因,其中所述第二等位基因是所述胎兒特有的;基于對所述第二等位基因為陽性反應(yīng)的數(shù)量來計算所述第二等位基因的校正濃度Py, 其中Py是針對所述第二等位基因在所述多個反應(yīng)中的預(yù)計統(tǒng)計學(xué)分布來校正的;以及使用[(2Py) / (Px+Py)]來計算 Pf。
27.如權(quán)利要求26所述的方法,其中Pf等于[(2Py)/(Px+Py)]*100%。
28.如權(quán)利要求26和27的任意一項所述的方法,其中所述統(tǒng)計學(xué)分布為泊松,并且其中所述泊松校正的濃度Px使用等式[-1n ((N-Pl) /N) ] *N,其中N為所分析的反應(yīng)的總數(shù)量, Pl為對所述第一等位基因為陽性的孔的數(shù)量,以及In為自然對數(shù),并且其中所述泊松校正的濃度Py使用等式[_ln((N_P2)/N)]*N,其中N為所分析的反應(yīng)的總數(shù)量,而P2為對所述第二等位基因為陽性的孔的數(shù)量。
29.如權(quán)利要求2 6至28的任意一項所述的方法,其中所述數(shù)據(jù)包括:第一組定量數(shù)據(jù),其表明在與所述突變核酸序列連鎖的多態(tài)位點處所述突變核酸序列或等位基因的第一量;以及第二組定量數(shù)據(jù),其表明在與所述正常核酸序列連鎖的多態(tài)位點處所述正常核酸序列或等位基因的第二量,所述方法進一步包括:由所述兩組數(shù)據(jù)確定參數(shù);確定用于確定所述胎兒是否繼承了突變核酸序列的第一截斷值,其中所述第一截斷值是基于所述百分率Pf 來確定的;確定用于確定所述胎兒是否繼承了正常核酸序列的第二截斷值,其中所述第二截斷值是基于所述百分率Pf來確定的;將所述參數(shù)與所述第一和第二截斷值中的至少一者相比較;以及基于所述比較,確定所述胎兒是繼承了所述突變核酸序列還是所述正常核酸序列的分類。
30.一種包含非瞬時性計算機可讀介質(zhì)的計算機程序產(chǎn)品,其中所述介質(zhì)儲存了大量用于控制處理器來執(zhí)行操作的指令,所述指令包括上述方法的任意一種。
31.一種系統(tǒng),該系統(tǒng)包括:一個或多個處理器,其被配置用于實施上述方法的任意一種。
32.—種包括模塊的系統(tǒng),所述模塊被配置用于實施上述方法的任意一種。
【文檔編號】C12Q1/68GK103459614SQ201280010828
【公開日】2013年12月18日 申請日期:2012年1月5日 優(yōu)先權(quán)日:2011年1月5日
【發(fā)明者】盧煜明, 趙慧君, 陳君賜, 徐寶賢 申請人:香港中文大學(xué)