專利名稱:基于甲基化富集母體樣品中胎兒核酸的非侵入性產(chǎn)前診斷用方法和組合物的制作方法
技術(shù)領(lǐng)域:
在某些實施方式中,提供生物學(xué)標記。在一些實施方式中,提供的生物學(xué)標記可用于非侵入性檢測胎兒的遺傳性狀(genetic traits)。某些胎兒遺傳性狀包括但不限于是否存在胎兒核酸。背景非侵入性產(chǎn)前檢驗正吸引越來越多的關(guān)注。這對于早期檢測包括妊娠期間并發(fā)癥和胎兒遺傳缺陷在內(nèi)的妊娠相關(guān)疾病至關(guān)重要,因為這樣才能進行母親和胎兒安全所需的早期醫(yī)學(xué)干預(yù)。業(yè)已通過例如絨膜絨毛取樣(CVQ或羊膜穿刺等方法,利用從胎兒分離的細胞進行產(chǎn)前診斷。然而,這些常規(guī)方法是侵入性的,對母親和胎兒均有可觀的風險。國家衛(wèi)生局(The National Health Service)最近指出侵入性羊膜穿刺和絨膜絨毛取樣(CVS) 檢查后的流產(chǎn)率為1_2%。自發(fā)現(xiàn)在母體血漿和血清中可檢測到循環(huán)性非細胞胎兒核酸(Lo等.,Lancet 350 =485-487,1997 ;和美國專利6,258,540)后,已經(jīng)開發(fā)了這些侵入性方法的備選方法進行產(chǎn)前篩選,例如檢測胎兒異常。循環(huán)性非細胞胎兒核酸(cfTNA)具有的數(shù)個優(yōu)點使其更適合非侵入性產(chǎn)前檢驗。例如,非細胞核酸的存在水平高于胎兒細胞,其濃度足以進行遺傳分析。分娩后,cffNA在數(shù)小時內(nèi)從母體血流中被清除,可防止先前妊娠的污染。通過檢測母體血漿或血清中胎兒DNA進行產(chǎn)前檢驗的例子,包括恒河猴D (RhD)基因分型(Lo 等.,N. Engl. J. Med. 339 1734-1738,1998)、胎兒性別測定(Costa 等.,N. Engl. J. Med. 346 :1502,2002)和診斷幾種胎兒疾病(Amicucci 等.,Clin. Chem. 46 :301-302, 2000 ;Saito 等.,Lancet 356 :1170,2000 ;和 Chiu 等.,Lancet 360 :998-1000,2002) 此外,有報道說先兆子癇(Lo 等.,Clin. Chem. 45 184-188,1999 和 Zhong 等.,Am. J. Obstet. Gynecol. 184 :414-419,2001)、胎兒三體性 21 (Lo 等·,Clin. Chem. 45 :1747-1751,1999 和 Zhong 等.,Prenat. Diagn. 20 :795-798, 2000)和妊娠劇吐 Gekizawa 等.,Clin. Chem. 47 2164-2165,2001)中母體血漿/血清的胎兒DNA含量異常。概述本發(fā)明提供可用于非侵入性檢查胎兒遺傳性狀,包括但不限于檢測是否存在胎兒核酸、胎兒核酸的絕對或相對含量、胎兒性別和胎兒染色體異常,例如非整倍性。本發(fā)明的人外遺傳學(xué)生物標記代表了在胎兒和母親之間顯示不同CpG甲基化模式的基因組DNA。本發(fā)明的組合物和方法能根據(jù)母體樣品中核酸的甲基化狀態(tài)檢測和定量測定所述樣品中的胎兒核酸。更具體地說,可根據(jù)存在的核酸總量測定母體樣品中胎兒核酸的相對量,從而提供樣品中胎兒核酸的百分數(shù)。此外,可采用序列特異性(或基因座特異性)模式測定胎兒核酸含量,其靈敏度足以進行精確的染色體劑量分析(例如,檢測胎兒非整倍性存在與否)。本發(fā)明一方面根據(jù)胎兒核酸與母體核酸之間甲基化的差異提供富集母體生物學(xué)樣品中胎兒核酸的方法,包括以下步驟(a)使樣品的靶核酸和該樣品的對照核酸結(jié)合于甲基化特異性結(jié)合蛋白;和(b)根據(jù)甲基化狀態(tài)(不同)洗脫結(jié)合的核酸,其中差異甲基化的核酸至少部分洗脫成不同組分。在一個實施方式中,所述核酸序列包括SEQ ID NO 1-89 所示多核苷酸序列中的一個或多個。SEQ ID NO :1-89見表4。本發(fā)明包括SEQ ID NO 1-89 所示序列及其變體。在另一實施方式中,步驟(a)不包括對照核酸。在一相關(guān)實施方式中,提供富集母體樣品中胎兒核酸的方法,包括以下步驟(a) 獲得婦女的生物學(xué)樣品;(b)根據(jù)樣品中含CpG的基因組序列的甲基化狀態(tài)(不同)分離胎兒核酸與母體核酸,其中胎兒的基因組序列與婦女的基因組序列甲基化程度不同,從而可區(qū)分樣品中婦女的基因組序列與胎兒的基因組序列。在另一實施方式中,所述基因組序列至少長15個核苷酸,包含至少一個胞嘧啶,該區(qū)域還具有(1)選自表1的基因座;和(2) 該基因座上游和/或下游不超過101Λ的DNA序列。在諸實施方式中,獲得婦女的生物學(xué)樣品不限制本發(fā)明范圍。這種獲得指實際收集婦女的樣品(例如,抽血)或從它處(例如診所或醫(yī)院)接受樣品并實施該方法的步驟。在另一相關(guān)實施方式中,提供富集母體樣品中胎兒核酸的方法,包括以下步驟 (a)獲得婦女的生物學(xué)樣品;(b)根據(jù)樣品中含CpG的基因組序列的甲基化狀態(tài)(不同)消化或除去母體核酸,其中胎兒的基因組序列與婦女的基因組序列甲基化程度不同,從而富集樣品中胎兒的基因組序列。可利用根據(jù)甲基化狀態(tài)選擇性消化或切割母體核酸的一種或多種甲基化敏感性限制性內(nèi)切酶消化母體核酸。在另一實施方式中,基因組序列至少長15 個核苷酸,包含至少一個胞嘧啶,其中該區(qū)域還由(1)選自表1的基因座;和( 該基因座上游和/或下游不超過101Λ的DNA序列組成。在本發(fā)明另一方面,提供制備含有胎兒核酸的核苷酸序列的核酸的方法,包括以下步驟(a)提供妊娠女性的樣品;(b)根據(jù)胎兒核酸與相應(yīng)母體核酸之間的不同甲基化狀態(tài)分離妊娠女性樣品中的胎兒核酸與母體核酸,其中所述胎兒核酸的核苷酸序列在含有 SEQ ID NO :1-89所示多核苷酸序列之一的基因或基因座的多核苷酸序列中,包含SEQ ID NO :1-89所示一個或多個多核苷酸序列的一個或多個CpG位點;和(c)通過擴增方法制備包含胎兒核酸的核苷酸序列的核酸,其中步驟(b)分離的胎兒核酸用作模板。在另一實施方式中,提供制備含有胎兒核酸的核苷酸序列的核酸的方法,包括以下步驟(a)提供妊娠女性的樣品;(b)根據(jù)胎兒核酸與相應(yīng)母體核酸之間甲基化狀態(tài)的不同消化或除去妊娠女性樣品中的母體核酸,所述胎兒核酸的核苷酸序列在含有SEQ ID NO :89所示多核苷酸序列之一的基因的多核苷酸序列中,包含SEQ ID NO :89所示一個或多個多核苷酸序列的一個或多個CpG位點;和(c)制備包含所述胎兒核酸的核苷酸序列的核酸。步驟(c)的制備過程可以是雜交過程、捕捉過程、或?qū)⒉襟E(b)分離的胎兒核酸用作模板的擴增過程。在消化母體核酸的以上實施方式中,還可利用根據(jù)其甲基化狀態(tài)選擇性消化或切割核酸的一種或多種甲基化敏感的限制性內(nèi)切酶消化母體核酸。在另一實施方式中,SEQ ID NO :1-89所示多核苷酸序列可以在含有SEQ ID NO :1-89所示多核苷酸序列之一的CpG島的多核苷酸序列內(nèi)。本文表1-3進一步表征了 SEQ ID NO :1-89所示多核苷酸序列,包括鑒定與SEQ ID NO: 1-89所示多核苷酸序列重疊的CpG島。在另一實施方式中,步驟(c)制備的是核酸溶液。 在還有另一實施方式中,所述方法還包括定量測定步驟(c)的擴增過程的胎兒核酸。本發(fā)明的另一方面,提供相對于母體核酸富集妊娠女性樣品中胎兒核酸的方法, 包括以下步驟(a)提供妊娠女性的樣品;和(b)根據(jù)胎兒核酸與母體核酸之間不同的甲基化狀態(tài)分離該妊娠女性樣品中的胎兒核酸與母體核酸,或捕捉胎兒核酸,所述胎兒核酸的核苷酸序列在含有SEQ ID NO :1-89所示多核苷酸序列之一的基因的多核苷酸序列中,包含 SEQ ID NO :1-89所示一個或多個多核苷酸序列的一個或多個CpG位點。在另一實施方式中,SEQ ID NO :1-89所示多核苷酸序列可以在含有SEQ ID NO 1_89所示多核苷酸序列之一的CpG島的多核苷酸序列內(nèi)。本文表1表征了 SEQ ID NO :1-89所示多核苷酸序列。在另一實施方式中,步驟(b)分離的是核酸溶液。在還有另一實施方式中,所述方法還包括擴增和/或定量測定步驟(b)分離過程的胎兒核酸。本發(fā)明的另一方面,提供包含分離自妊娠婦女的胎兒核酸的組合物,其中所述核酸的核苷酸序列包含SEQ ID NO :1-89所示多核苷酸序列中的一個或多個。在一個實施方式中,所述核苷酸序列基本上由基因的核苷酸序列或其一部分組成。在另一實施方式中,所述核苷酸序列基本上由CpG島的核苷酸序列或其一部分組成。表1進一步表征了 SEQ ID NO :1-89所示多核苷酸序列。在另一實施方式中,所述核酸為溶液。在另一實施方式中,相對于母體核酸富集胎兒的核酸。在另一實施方式中,所述組合物還包含結(jié)合甲基化核苷酸的物質(zhì)。例如,該物質(zhì)可以是甲基-CpG結(jié)合蛋白(MBD)或其片段。在本發(fā)明的另一方面,提供包含妊娠女性胎兒的分離核酸的組合物,其中所述核酸的核苷酸序列在含有SEQ ID NO :1-89所示多核苷酸序列之一的基因或其一部分的多核苷酸序列中包含SEQ ID NO :1-89所示一個或多個多核苷酸序列的一個或多個CpG位點。 在另一實施方式中,所述核酸的核苷酸序列在含有SEQ ID NO :1-89所示多核苷酸序列之一的CpG島或其一部分的多核苷酸序列中,包含SEQ ID NO :1-89所示一個或多個多核苷酸序列的一個或多個CpG位點。表1進一步顯示了 SEQ ID NO :1-89所示多核苷酸序列的特征。 在另一實施方式中,所述核酸為溶液。在另一實施方式中,胎兒核酸比母體核酸豐富。表1 鑒定了本發(fā)明的高甲基化和低甲基化核酸序列。在另一實施方式中,所述組合物還包含結(jié)合甲基化核苷酸的試劑。例如,該試劑可以是甲基-CpG結(jié)合蛋白(MBD)或其片段。在一些實施方式中,本發(fā)明的核苷酸序列包含三個或多個CpG位點。在另一實施方式中,所述核苷酸序列包含五個或多個CpG位點。在另一實施方式中,所述核苷酸序列來自包含PRC2區(qū)的基因區(qū)域(參見表3)。在另一實施方式中,所述核苷酸序列來自參與發(fā)育的基因區(qū)域。例如,本發(fā)明的一種后成標記S0X14(參見表1),它是參與胚胎發(fā)育調(diào)節(jié)和決定細胞命運的轉(zhuǎn)錄因子SOX (SRY-相關(guān)HMG-盒)家族的成員。在一些實施方式中,婦女的基因組序列為甲基化,而胎兒的基因組序列為未甲基化。在其它實施方式中,婦女的基因組序列為未甲基化,而胎兒的基因組序列為甲基化。在另一實施方式中,胎兒的基因組序列甲基化程度高于母親的基因組序列。已發(fā)現(xiàn)的比母體基因組序列甲基化程度高的胎兒基因組序列見SEQ ID NO :1-59.或者,胎兒的基因組序列比母親的基因組序列甲基化程度低。已發(fā)現(xiàn)的比母體基因組序列甲基化程度低的胎兒基因組序列見SEQ ID NO :60-85。本發(fā)明甲基化敏感的限制性內(nèi)切酶對低度-甲基化核酸敏感, 或?qū)Ω叨?甲基化核酸敏感。在另一實施方式中,所述胎兒核酸是細胞外核酸。細胞外胎兒核酸通常約有500、 400、300、250、200或150(或其中的任何數(shù)值)個核苷酸堿基或更少。在另一實施方式中, 消化的母體核酸少于約90、100、110、120、130、140或150個堿基對。在一相關(guān)實施方式中, 相對于消化的母體核酸,根據(jù)大小,選擇性擴增、捕捉或分離胎兒核酸。例如,可設(shè)計PCR引物來擴增大于約75、80、85、90、95、100、105、110、115或120(或之間的任何數(shù)值)個堿基對的核酸,從而擴增胎兒核酸和未消化的母體核酸。在另一實施方式中,先片段化核酸,再實施本發(fā)明的某些方法。片段化核酸的例子包括但不限于超聲處理和限制性內(nèi)切酶消化。 在一些實施方式中,胎兒核酸衍生自胎盤。在其它實施方式中,胎兒核酸是細胞凋亡的。在一些實施方式中,本發(fā)明提供其中樣品是選自以下的成員的方法母體全血、母體血漿或血清、羊水、絨膜絨毛樣品、胚胎植入前的活檢材料、分離自母體血液的胎兒有核細胞或胎兒細胞殘留物、母體尿液、母體唾液、女性生殖道沖洗液和腹腔穿刺或肺灌洗獲得的樣品。在某些實施方式中,生物學(xué)樣品是母體血液。在一些實施方式中,生物學(xué)樣品是絨膜絨毛樣品。在某些實施方式中,先富集母體樣品中的胎兒核酸,再實施本發(fā)明的某些方法。胎兒(核酸)富集方法的例子見PCT公布號W0/2007140417A2、W02009/032781A2和美國公布號20050164241。在一些實施方式中,先除去樣品中的有核和無核細胞群,再實施本發(fā)明的某些方法(例如,基本上除去所有有核和無核細胞群)。在一些實施方式中,采用本領(lǐng)域普通技術(shù)人員已知的方式收集、儲存或轉(zhuǎn)運樣品,以最大程度減少樣品中胎兒核酸的降解或維持其質(zhì)量。所述樣品可來自任何動物,包括但不限于人、非人、哺乳動物、爬行動物、牛、貓、 狗、山羊、豬、猴、猿、大猩猩、公牛、奶牛、熊、馬、綿羊、家禽、小鼠、大鼠、魚、海豚、鯨和鯊魚, 或患有可檢測的妊娠相關(guān)疾病或染色體異常的任何動物或生物。在一些實施方式中,用差異修飾甲基化和未甲基化DNA的試劑處理樣品。例如,所述試劑可包括亞硫酸氫鹽;或者所述試劑可包括能優(yōu)先切割甲基化DNA的一種或多種酶; 或者所述試劑可包括能優(yōu)先切割未甲基化DNA的一種或多種酶。甲基化敏感的限制性內(nèi)切酶的例子包括但不限于HhaI和HpaII。在一個實施方式中,通過特異性結(jié)合胎兒核酸中的甲基化核苷酸的試劑將胎兒核酸與母體核酸分離。在另一實施方式中,通過能特異性結(jié)合相應(yīng)母體核酸中的甲基化核苷酸的試劑使母體核酸與胎兒核酸分離,或除去胎兒核酸。在一個實施方式中,能結(jié)合甲基化核苷酸的試劑是甲基-CpG結(jié)合蛋白(MBD)或其片段。本發(fā)明的另一方面,提供檢測含有甲基化程度不同的母體與胎兒DNA的母體樣品中胎兒DNA的含量或拷貝數(shù)的方法。通過以下步驟實施該方法a)根據(jù)甲基化狀態(tài)的不同區(qū)分母體與胎兒DNAjPb)定量測定步驟a)的胎兒DNA。在一具體實施方式
中,該方法包括a)用一種或多種甲基化敏感的限制性內(nèi)切酶消化母體樣品中的母體DNA,從而富集胎兒 DNAJPb)測定步驟a)的胎兒DNA含量。利用胎兒DNA的含量可證實胎兒核酸存在與否、 測定胎兒性別、診斷胎兒疾病或與其它胎兒診斷方法聯(lián)用以改善靈敏度或特異性。在一個實施方式中,測定胎兒DNA含量的方法不需要利用多態(tài)性序列(polymorphic sequence)。 例如,在步驟b)中不用等位基因的比例來定量測定胎兒DNA。在另一個實施方式中,測定胎兒DNA含量的方法不需要用亞硫酸氫鹽處理DNA將胞嘧啶殘基轉(zhuǎn)變?yōu)槟蜞奏ぁR阎獊喠蛩釟潲}能降解DNA,從而進一步減少了母體樣品中已經(jīng)有限的胎兒核酸。在一個實施方式中, 通過引入已知濃度的一種或多種競爭物實施步驟b)中對胎兒DNA量的測定。在另一實施方式中,通過RT-PCR、引物延伸、測序或計數(shù)實施步驟b)中對胎兒DNA量的測定。在一相關(guān)的實施方式中,如美國專利公布號US20070065823所述,采用BEAMing技術(shù)測定核酸含量。 在另一實施方式中,測定限制性(內(nèi)切酶)效率(restriction efficiency),采用效率比 (efficiency rate)進一步測定胎兒DNA含量。示范性的甲基化程度不同的核酸見SEQ ID NO 1-89ο本發(fā)明的另一方面提供測定母體樣品中胎兒DNA濃度的方法,其中所述母體樣品包含差異甲基化的母體與胎兒DNA,包括a)測定母體樣品的DNA總量;b)用一種或多種甲基化敏感的限制性內(nèi)切酶選擇性消化母體樣品中的母體DNA,從而富集胎兒DNA ;c)測定步驟b)的胎兒DNA含量;和d)比較步驟c)的胎兒DNA含量與步驟a)的DNA總量,從而測定母體樣品中胎兒DNA的濃度。胎兒DNA濃度可與其它胎兒診斷方法聯(lián)用以改善靈敏度或特異性。在一個實施方式中,測定胎兒DNA含量的方法不需要利用多態(tài)性序列。例如,在步驟b)中不用等位基因比例來定量測定胎兒DNA。在另一實施方式中,測定胎兒DNA含量的方法不需要用亞硫酸氫鹽處理DNA使胞嘧啶殘基轉(zhuǎn)變?yōu)槟蜞奏?。在一個實施方式中,通過引入已知濃度的一種或多種競爭物實施步驟b)對胎兒DNA量的測定。在另一實施方式中, 通過RT-PCR、測序或計數(shù)實施步驟b)測定胎兒DNA含量。在另一實施方式中,測定限制性 (內(nèi)切酶)效率,用以進一步測定DNA總量和胎兒DNA量。示范性的差異甲基化核酸見SEQ ID NO 1-89ο本發(fā)明的另一方面,利用母體樣品中的胎兒DNA,提供測定胎兒非整倍性存在與否的方法,其中所述母體樣品包含差異甲基化的母體與胎兒DNA,該方法包括a)用一種或多種甲基化敏感的限制性內(nèi)切酶選擇性消化母體樣品中的母體DNA,從而富集胎兒DNA ;b)測定靶染色體的胎兒DNA含量;c)測定參比染色體的胎兒DNA含量;和d)比較步驟b)與步驟c)的胎兒DNA含量,其中靶胎兒DNA含量與參比胎兒DNA含量之間有生物學(xué)或統(tǒng)計學(xué)顯著差異表明存在胎兒非整倍性。在一個實施方式中,測定胎兒DNA含量的方法不需要利用多態(tài)性序列。例如,在步驟b)中不用等位基因比例來定量胎兒DNA。在另一實施方式中, 測定胎兒DNA含量的方法不需要用亞硫酸氫鹽處理DNA使胞嘧啶殘基轉(zhuǎn)變?yōu)槟蜞奏ぁT谝粋€實施方式中,通過引入已知濃度的一種或多種競爭物實施步驟b)和c)的胎兒DNA含量測定。在另一實施方式中,通過RT-PCR、測序或計數(shù),實施步驟b)和c)的胎兒DNA含量測定。在另一實施方式中,將步驟b)測定的靶染色體胎兒DNA含量與標準對照,例如整倍體妊娠靶染色體的胎兒DNA含量作比較。在另一實施方式中,測定限制性(內(nèi)切酶)效率,用以進一步測定靶染色體和參比染色體的胎兒DNA含量。示范性的差異甲基化核酸見SEQ ID NO 1-89ο本發(fā)明的另一方面,提供通過分析差異甲基化的核酸樣品中靶核酸與對照核酸的含量或拷貝數(shù)來檢測染色體異常存在與否的方法,包括以下步驟(a)依據(jù)甲基化狀態(tài)富集樣品的靶核酸和該樣品的對照核酸;(b)對至少一部分的富集靶核酸進行拷貝數(shù)分析;(C)對至少一部分的富集對照核酸進行拷貝數(shù)分析;(d)比較步驟(b)的拷貝數(shù)與步驟(C) 的拷貝數(shù);和(e)根據(jù)步驟(d)的比較,測定是否存在染色體異常,其中所述靶核酸和對照核酸具有相同或基本上相同的甲基化狀態(tài)。在一相關(guān)實施方式中,提供通過分析差異甲基化核酸樣品中靶核酸與對照核酸的含量或拷貝數(shù)來檢測是否存在染色體異常的方法,包括以下步驟(a)使樣品的靶核酸和該樣品的對照核酸與結(jié)合劑結(jié)合;(b)根據(jù)甲基化狀態(tài)洗脫結(jié)合的核酸,其中差異甲基化核酸至少部分被洗脫入不同的組分;(C)對至少一部分中的洗脫靶核酸進行拷貝數(shù)分析;(d)對至少一部分中的洗脫對照核酸進行拷貝數(shù)分析;(e) 比較步驟(c)的拷貝數(shù)與步驟(d)的拷貝數(shù);和(f)根據(jù)步驟(e)的比較結(jié)果測定是否存在染色體異常,其中所述靶核酸和對照核酸具有相同或基本上相同的甲基化狀態(tài)。示范性的差異甲基化核酸見SEQ ID NO 1-89ο本發(fā)明的另一方面,提供通過分析差異甲基化核酸樣品中靶核酸和對照核酸的等位基因比例,檢測是否存在染色體異常的方法,包括以下步驟(a)使樣品的靶核酸和該樣品的對照核酸與結(jié)合劑結(jié)合;(b)根據(jù)甲基化狀態(tài)洗脫結(jié)合的核酸,其中差異甲基化核酸至少部分洗脫入不同的組分;(c)對至少一部分中的洗脫靶核酸進行等位基因比例分析; (d)對至少一部分的洗脫對照核酸進行等位基因比例分析;(e)比較步驟(c)的等位基因比例與步驟(d)的等位基因比例;和(f)根據(jù)步驟(e)的比較結(jié)果測定是否存在染色體異常, 其中所述靶核酸和對照核酸具有相同或基本上相同的甲基化狀態(tài)。差異甲基化核酸見SEQ ID NO :1-89,差異甲基化核酸內(nèi)的SNP見表2。這些方法還可用于檢測妊娠相關(guān)疾病。本發(fā)明的另一方面,采用依據(jù)甲基化的本發(fā)明方法測定母體核酸含量。例如,可分離(例如,用甲基化敏感的酶消化)樣品中的胎兒核酸與母體核酸,采用本發(fā)明方法定量測定母體核酸。一旦測定了母體核酸含量,可從樣品的核酸總量中扣除其含量而確定胎兒核酸含量。可利用胎兒核酸含量檢測胎兒性狀,包括本文所述的胎兒非整倍性。對于本文所述本發(fā)明的各方面內(nèi)容和實施方式,所述方法還可用于檢測妊娠相關(guān)疾病。在一些實施方式中,樣品包含胎兒核酸或胎兒核酸和母體核酸。以樣品包含胎兒和母體核酸為例,胎兒核酸與母體核酸可具有不同甲基化狀態(tài)??捎帽绢I(lǐng)域已知的任何方法區(qū)分甲基化狀態(tài)不同的核酸種類。在一個實施方式中,用甲基化敏感的限制性內(nèi)切酶選擇性消化母體核酸來富集胎兒核酸。在另一實施方式中,在同一試驗中用兩種或多種甲基化敏感的限制性內(nèi)切酶選擇性消化母體核酸以富集胎兒核酸。在一個實施方式中,靶核酸和對照核酸均來自胎兒。在另一實施方式中,胎兒核酸的平均大小長約100堿基到約500堿基。 在另一實施方式中,染色體異常是非整倍性,例如胎兒三體性21。在一些實施方式中,靶核酸是染色體(可以是異常染色體)的至少一部分,對照核酸是染色體(極少異常)的至少一部分。例如,當靶核酸來自21號染色體時,對照核酸來自21號靶染色體以外的染色體, 優(yōu)選另一常染色體。在另一實施方式中,結(jié)合試劑是甲基化特異性結(jié)合蛋白,例如MBD-Fc。 也可用本領(lǐng)域已知的任何方法擴增和/或定量測定富集的或洗脫的核酸。在一個實施方式中,采用不需要利用多態(tài)性序列的方法定量測定胎兒DNA。例如,不利用等位基因的比例來定量測定胎兒DNA。在另一實施方式中,定量測定胎兒DNA含量的方法不需要用亞硫酸氫鹽處理胎兒DNA將胞嘧啶殘基轉(zhuǎn)變成尿嘧啶。在一些實施方式中,本發(fā)明方法包括測定樣品中一種或多種Y-染色體特異性序列含量的額外步驟。在一相關(guān)實施方式中,將采用依據(jù)甲基化的本發(fā)明方法測定的樣品胎
10兒核酸含量與Y-染色體核酸存在量作比較。根據(jù)甲基化狀態(tài)區(qū)分核酸的方法包括但不限于甲基化敏感性捕捉,例如用 MBD2-FC片段;亞硫酸氫鹽轉(zhuǎn)變方法,例如MSP (甲基化-敏感性PCR) ,COBRA,甲基化-敏感性單核苷酸引物延伸(Ms-SNUPE)或kquenom MassCLEAVE 技術(shù);和用甲基化敏感的限制性內(nèi)切酶。除了已明確表述的之外,根據(jù)甲基化狀態(tài)區(qū)分核酸的任何方法可與本發(fā)明組合物和方法聯(lián)用。在一些實施方式中,本發(fā)明方法還可包括擴增步驟??赏ㄟ^PCR,例如甲基化特異性PCR實施此擴增步驟。在另一實施方式中,對單一分子進行擴增反應(yīng),例如數(shù)字化PCR, 在通過引用納入本文的美國專利第6,143,496和6,440,706號中對其有進一步描述。在其它實施方式中,所述方法不需要擴增。例如,可用流式細胞讀數(shù)器或不需要擴增的測序方法來計數(shù)胎兒DNA (或與其相連的序列標簽),以測定富集的胎兒DNA含量。在另一實施方式中,通過擴增反應(yīng)測定胎兒DNA含量,該反應(yīng)產(chǎn)生的擴增子大于被消化的母體核酸,從而進一步富集胎兒核酸。對于需要序列分析的實施方式,可采用以下任何一種測序技術(shù)引物延伸方法 (例如,iPLEX ;塞昆納姆股份有限公司(Sequenom, Inc.))、直接DNA測序,限制性片段長度多態(tài)性(RFLP分析)、等位基因特異性寡核苷酸(ASO)分析、甲基化-特異性PCR(MSPCR)、 高溫測序分析、無環(huán)引物分析(acycloprime analysis)、反向斑點印跡(Reverse dot blot)、基因芯片微陣列、動態(tài)等位基因特異性雜交(DASH)、肽核酸(PNA)和閉鎖核酸(LNA) 探針、TaqMan、分子信標(Molecular Beacons)、嵌入染料、FRET引物、熒光標記的dNTP/ ddNTP、AlphaScreen、SNPstream、遺傳位分析(genetic bit analysis) (GBA)、多重迷你測序(Multiplex minisequencing)、SnaPshot、GOOD 試驗、微陣列迷你測序(Microarray miniseq)、陣列引物延伸(arrayed primer extension) (APEX)、微陣列引物延伸、標簽陣列 (Tag arrays)、編碼微球(Coded microspheres)、模板引導(dǎo)的摻入(TDI)、熒光極化、寡核苷酸連接比色試驗(OLA)、序列編碼的0LA、微陣列連接、連接酶鏈式反應(yīng)、掛鎖探針(Padlock probes) Jnvader 試驗、采用至少一種探針的雜交、采用至少一種熒光標記探針的雜交、電泳、克隆和測序,例如在4 平臺(羅氏公司(Roche) (Margulies,M.等.2005Nature 437, 376-380)、Illumina(公司)基因組分析儀(或Solexa平臺)或SOLiD系統(tǒng)(應(yīng)用生物系統(tǒng)公司(Applied Biosystems))或赫氏真正的單分子DNA測序技術(shù)(Helicos True Single Molecule DNA sequencing technology) (Harris T D 等· 2008kience,320,106—109) 進行,太平洋生物科學(xué)公司(Pacific Biosciences)的單分子實時(SMRT. TM.)技術(shù)或納米孑L測序(nanopore-based sequencing) (Soni GV 禾口 Meller Α. 2007 Clin Chem 53: 1996-2001)和它們的組合。納米孔方法可包括,例如根據(jù)大小,利用納米孔給核酸測序或利用納米孔計數(shù)核酸分子,其中序列信息未確定。例如,可采用質(zhì)譜法,采用檢測絕對拷貝數(shù)的競爭性PCR方法的系統(tǒng),測定一種或多種核酸的絕對拷貝數(shù)。參見,例如Ding C, Cantor CIU2003)采用競爭性PCR和基質(zhì)輔助的激光解吸電離飛行時間質(zhì)譜的高通量基因表達分析技術(shù)(A high-throughput gene expression analysis technique using competitive PCR and matrix-assisted laser desorption ionization time-of-flight MS). Proc Natl Acad Sci U S A 100:3059-3064 和美國專利申請?zhí)?0/655762,其美國專利公布號為20040081993,二者通過引用納入本文。在一些實施方式中,將基因組序列的含量與標準對照作比較,高于或低于標準對照,表明存在妊娠相關(guān)疾病或有所發(fā)展。例如,可比較樣品中的胎兒核酸含量與DNA總量。 或者在檢測是否存在胎兒非整倍性時,可比較靶染色體的胎兒核酸含量與參比染色體的胎兒核酸含量。參比染色體優(yōu)選非整倍體比率低的另一常染色體。可將胎兒靶核酸與參比胎兒核酸的比例與正常整倍體妊娠的同一比例作比較。例如,可測定從具有健康胎兒的女性獲得的DNA樣品的對照比率,該胎兒不具有染色體異常。最好利用一組對照樣品。已知某些染色體異常時,也可具有表明特定疾病或病癥的標準品。因此,例如為篩檢妊娠婦女的母體血漿中三種不同染色體非整倍性,最好采用分離自已知懷有,例如染色體13、18或21三體性胎兒的母親和懷有染色體不異常胎兒的母親的一組對照DNA。在一些實施方式中,本發(fā)明提供通過序列變異區(qū)分靶核酸的等位基因與對照核酸的等位基因的方法。所述序列變異可以是單個核苷酸多態(tài)性(SNP)或插入/缺失多態(tài)性。在一個實施方式中,胎兒核酸應(yīng)包含至少一種高頻雜合多態(tài)性(例如,約2^^3^^4^^5%. 6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%或更高頻率),從而得以測定核酸的等位基因比例評估是否存在染色體異常。示范性SNP的列表見表2,然而,這不代表可用作本發(fā)明一部分的多態(tài)性等位基因的全部列表。也考慮符合以下標準的任何SNP (a)雜合頻率高于約2% (優(yōu)選跨越不同人群范圍)的SNP ;(b)SNP是雜合基因座;和(c) (i)所述SNP在本文所述核酸序列內(nèi),或(c) (iii)所述SNP位于本文所述SNP的約5到約2000個堿基對內(nèi)(例如,位于本文所述SNP的約5、10、15、20、25、30、40、 50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1250、1500、1750 或 2000 堿基對內(nèi))。在其它實施方式中,所述序列變異是短串聯(lián)重復(fù)(STR)多態(tài)性。在一些實施方式中,所述序列變異落在限制性位點內(nèi),藉此一個等位基因?qū)υ撓拗菩詢?nèi)切酶消化敏感而一個或多個其它等位基因則不是。在一些實施方式中,所述序列變異是含甲基化位點。在一些實施方式中,進行等位基因比例分析包括獲得妊娠婦女的含核酸生物學(xué)樣品,測定妊娠婦女胎兒靶核酸的等位基因與對照核酸的等位基因之比例,所述生物學(xué)樣品含有胎兒核酸;可根據(jù)甲基化差異部分或完全分離胎兒核酸與母體核酸;區(qū)分靶核酸的等位基因與對照核酸的等位基因;然后測定這些等位基因之比例;和根據(jù)等位基因比例檢測胎兒是否存在染色體異常,其中比例高于或低于正常整倍體比例時,表明患有染色體疾病。 在一個實施方式中,靶核酸來自懷疑的非整倍染色體(例如,染色體21),對照核酸來自同一胎兒的整倍染色體。在一些實施方式中,本發(fā)明與其它胎兒標記聯(lián)用來檢測是否存在多個染色體異常,所述染色體異常選自三體性21、三體性18和三體性13或它們的組合。在一些實施方式中,所述染色體疾病涉及X染色體或Y染色體。在一些實施方式中,本發(fā)明組合物或方法可在一個反應(yīng)中多重應(yīng)用。例如,可測定基因組的多個基因座的胎兒核酸含量。或者當檢測是否存在非整倍體胎兒時,可測定一個或多個靶染色體(例如,染色體13、18或21)和一個或多個參比染色體上多個基因座的胎兒核酸含量。如果采用等位基因比例,可同時檢測和區(qū)分表2的一個或多個等位基因。測定等位基因比例時,此多重實施方式對多態(tài)性基因座的基因型未知時特別重要。在一些例子中,例如當母親和孩子的多態(tài)性基因座是純合時,該試驗可能不提供信息。在一個實施方式中,按照本發(fā)明方法可富集、分離和/或檢測多于1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、25、30、35、40、50、100、200、300 或 500 條和任何中間水平的本發(fā)明多核苷酸序列。當通過分析靶核酸與對照核酸的拷貝數(shù)來檢測染色體異常時,需要分析少于3、4、5、6、7、8、9、10、11、12、13或14條多核苷酸序列,以精確檢測是否存在染色體異常。 在另一實施方式中,可用本發(fā)明組合物或方法檢驗已分成2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、25、30、35、40、50、100或更多份復(fù)制品或分成單一分子等價物的樣品。分析一式多份母體樣品中胎兒核酸的方法,包括單一分子分析,可參見通過引用納入本文的美國申請?zhí)?1/364,四4,其美國專利公布號為US 2007-0207466A1。在另一實施方式中,本發(fā)明提供以下方法,其中如果靶核酸的等位基因比例或絕對拷貝數(shù)比標準對照序列高1個或低1個標準差,比較步驟可顯示胎兒患染色體疾病的風險高。在一些實施方式中,如果靶核酸的等位基因比例或絕對拷貝數(shù)比標準對照序列高2 個或低2個標準差,比較步驟可顯示胎兒患染色體疾病的風險高。在一些實施方式中,如果靶核酸的等位基因比例或絕對拷貝數(shù)比標準對照序列高3個或低3個標準偏差,比較步驟可顯示胎兒患染色體疾病的風險高。在一些實施方式中,如果靶核酸的等位基因比例或絕對拷貝數(shù)比對照的統(tǒng)計學(xué)顯著標準偏差高或低,比較步驟可顯示胎兒患染色體疾病的風險高。在一個實施方式中,標準對照是母體參比品,在另一實施方式中,標準對照是胎兒參比染色體(例如,非三體性常染色體)。在一些實施方式中,本發(fā)明方法可與其它方法聯(lián)用以診斷染色體異常。例如,非侵入性診斷方法可能需要證實是否存在胎兒核酸,例如女性胎兒的性別測試,或證實MiD 陰性母親懷了 MiD陰性女性胎兒。在另一實施方式中,可用本發(fā)明的組合物和方法測定母體樣品中胎兒核酸的百分比,從而能進行需要知道胎兒核酸百分比的另一診斷方法。例如,樣品是否符合某種濃度閾值的要求?當測定母體樣品中的等位基因比例來診斷胎兒非整倍性時,可能需要胎兒核酸含量或濃度以便作出具有給定靈敏度和特異性的診斷。在其它實施方式中,檢測染色體異常的本發(fā)明組合物和方法可與其它已知方法聯(lián)用,從而改善檢測方法的總體靈敏度和特異性。例如,數(shù)學(xué)模型提示,采用母親年齡(MA)、頸部半透明帶(NT)厚度、無血清β _hCG和血清PAPP-A的聯(lián)合早孕檢查方案(first-trimester screening program),可檢測出超過80%的唐氏綜合征胎兒,而侵入性檢驗率是5% (ffald 和Hackshaw,Prenat Diagn 17(9) :921-9 (1997))。然而,常規(guī)聯(lián)用非整倍性檢測方法與本文所述非侵入性胎兒游離核酸方法可提高精確度降低假陽性率。聯(lián)合診斷方法的例子見通過引用納入本文的PCT公布號W02008157264A2 (轉(zhuǎn)讓給申請人)。在一些實施方式中,本發(fā)明方法可與細胞方法聯(lián)用,其中胎兒細胞是侵入性或非侵入性取得。在某些實施方式中,染色體異常的風險升高是根據(jù)本文提供的組合物或方法產(chǎn)生的結(jié)果。這種結(jié)果的一個例子是與整倍體的絕對拷貝數(shù)或等位基因比例有偏差,該偏差表明存在非整倍體染色體。絕對拷貝數(shù)或比例比標準對照高或低,表明胎兒患染色體異常 (例如,21號染色體三體綜合征)的風險高??捎萌魏魏线m的媒介保留、演示、記錄和/或展示涉及本文所述方法的信息,例如三體綜合征或非整倍體的結(jié)局、結(jié)果或風險。例如,可將所述結(jié)果固定在媒介中以保留、儲存、共享、交流或分析該結(jié)果。媒介可以是可觸知的(例如紙)或不可觸知的(例如電子媒介),媒介的例子包括但不限于計算機媒介、數(shù)據(jù)庫、圖表、患者圖表、記錄、患者記錄、圖片和表格以及任何其它表達媒介。信息有時以計算機可讀形式儲存和/或保留,優(yōu)選儲存和組織成數(shù)據(jù)庫。在某些實施方式中,可利用物理媒介(例如紙)或計算機可讀媒介(例如光和/或磁存儲或傳送媒介、軟盤、硬盤、隨機存取存儲器、 計算機處理單元、傳真信號、衛(wèi)星信號、跨因特網(wǎng)傳送或跨萬維網(wǎng)傳送)將信息從一處傳遞至另一處。在一些情況中,CpG島可用作含CpG的基因組序列,而在其它情況中,含CpG的基因組序列可以不是CpG島。在一些實施方式中,本發(fā)明提供實施本發(fā)明方法的試劑盒。試劑盒中的一種組分是甲基化敏感的結(jié)合試劑。附圖簡述
圖1顯示設(shè)計的用于分離甲基化程度不同DNA的重組MBD-Fc蛋白。圖2顯示對其“抗原”具有高親和力和高親合力的甲基-CpG-結(jié)合抗體樣蛋白,所述“抗原”優(yōu)選含甲基化CpG 二核苷酸的DNA。圖3顯示MBD-Fc的甲基結(jié)合功能域能結(jié)合DNA分子,而不管它們的甲基化狀態(tài)如何。該蛋白質(zhì)/DNA相互作用的強度由DNA的甲基化水平?jīng)Q定。結(jié)合基因組DNA后,可用鹽濃度遞增的洗脫液,洗脫成未甲基化與甲基化DNA組分,進行受控制的分離。圖4顯示用重組MBD-Fc蛋白和微陣列實驗,鑒定胎兒與母親的甲基化程度不同的 DNA。圖5顯示用kquen0m EpiTYPERTM方法產(chǎn)生的典型結(jié)果,該結(jié)果用于驗證圖4所示實驗產(chǎn)生的結(jié)果。圖6顯示獲自微陣列分析的比例對數(shù)(χ軸)和獲自表型(EpiTYPER)分析的甲基化差異(y軸)之間的相關(guān)性。各數(shù)據(jù)點代表所有檢測樣品中一個區(qū)域的平均值。微陣列分析本質(zhì)上是比較分析,因為母體DNA的高度甲基化組分與胎盤DNA的高度甲基化組分一起雜交。正值表明胎盤樣品的甲基化較高。在質(zhì)譜法中,各樣品單獨檢測。我們先從胎盤甲基化值中扣除母親甲基化值計算出甲基化差異。將結(jié)果與微陣列數(shù)據(jù)作比較,我們計算出所有母體/胎盤DNA配對的差異平均值。圖8顯示預(yù)計的gDNA分子數(shù)與聯(lián)用競爭性PCR和質(zhì)譜法分析測得的分子數(shù)之間相關(guān)性。在該實驗中,我們采用90 10比例的衍生自全血的DNA(黑色加號)和商品化購得的完全甲基化DNA(紅十字)。我們用MBD-FC融合蛋白分離非甲基化與甲基化的DNA組分。對各組分作競爭性PCR分析與質(zhì)譜讀出。該方法早已見諸描述可用于分析拷貝數(shù)變化,可商品化購得用作基因表達分析。該方法能借助濃度已知的合成寡核苷酸絕對定量測定DNA分子。在該實驗中,我們以MGMT基因座為目標,該基因座在本文所用的全血中未甲基化。利用300個總gDNA拷貝的輸入,我們預(yù)計能見到270個拷貝的未甲基化DNA和30 個拷貝的甲基化DNA。測到的拷貝數(shù)與預(yù)計值非常一致。輸入DNA為600拷貝時的數(shù)據(jù)點表明反應(yīng)有偏向,表明經(jīng)初步證明的此概念性實驗還需要更多的開發(fā)工作然后才能利用該試驗。然而,該初步數(shù)據(jù)表明,存在過量的未甲基化DNA時,捕捉和定量測定幾種甲基化的 DNA具有可行性。圖9A-9C顯示,從微陣列分析(黑柱)和質(zhì)譜分析(淡灰色柱)獲得的關(guān)于它們基因組位置甲基化差異的柱狀圖。提供了通過微陣列鑒定到的甲基化有差異的85個區(qū)域各自的圖譜。各圖的χ軸顯示該區(qū)域的染色體位置。y軸描述log比例(微陣列)和甲基化差異(質(zhì)譜結(jié)果)。對于微陣列,該區(qū)域中的各雜交探針顯示為一條黑色(或暗灰色)棒。 對于質(zhì)譜結(jié)果,各CpG位點顯示為淡灰色棒。顯示大于0數(shù)值的柱表示胎盤樣品的DNA甲基化程度比母體DNA高。某些基因差異小(即RBl或DSCR6),但仍有統(tǒng)計學(xué)顯著性。那些區(qū)域不大適合胎兒DNA富集方案。圖10顯示胎兒定量方法(Fetal Quantifier Method)的一個實施方式。選擇性消化母體核酸,用濃度已知的競爭物定量測定殘留的胎兒核酸。在該模式中,用質(zhì)譜儀分離分析物并定量測定。圖11顯示基于甲基化胎兒診斷方法的一個實施方式。選擇性消化母體核酸,定量測定殘留胎兒核酸的三個不同染色體(13、18和21)。該圖的部分2和3顯示消化前后樣品中核酸的大小分布。擴增反應(yīng)可以是大小特異性的(例如,大于100堿基對的擴增子),它們有利于(獲得)比消化的母體核酸更長的未消化胎兒核酸,從而進一步富集了胎兒核酸。 該圖底部的圖譜顯示胎兒21號染色體核酸含量升高,表明有三體性21。圖12顯示從非妊娠婦女血液分離的四份不同DNA樣品的可擴增基因組拷貝的總數(shù)。稀釋各樣品使每次反應(yīng)含有約2500、1250、625或313份拷貝。通過取兩個總拷貝數(shù)試驗(表X中的ALB和RNAseP)獲得的DNA/競爭物平均比例,獲得各檢測值。如圖12所示, 總拷貝數(shù)在不同樣品之間精確而穩(wěn)定,因此證實了該競爭方法的實用性。圖13A和B 創(chuàng)建了含有恒定數(shù)量母體非甲基化DNA并摻入了不同數(shù)量男性胎盤甲基化DNA的一種模型系統(tǒng)。該樣品摻入的男性胎盤DNA的量約為母體未甲基化DNA的 0-25%。與總拷貝數(shù)試驗相比,利用從甲基化試驗(圖13A)和Y-染色體標記(圖13B)獲得的比例計算出胎盤DNA的百分數(shù)。甲基化和Y-染色體標記見表X。圖14A和B顯示血漿樣品總拷貝數(shù)試驗的結(jié)果。圖14A顯示了各樣品的拷貝數(shù)。 兩份樣品(25和沈號)的總拷貝數(shù)顯著高于所有其它樣品。每毫升血漿獲得平均約1300 個可擴增拷貝(范圍766-2055)。圖14B顯示給定值的箱線圖(box-and-whisker plot), 總結(jié)了結(jié)果°圖15A和B繪制了從懷有男性胎兒妊娠婦女取得的33份不同血漿樣品的胎兒核酸含量(或拷貝數(shù))。采用表X提供的試驗,用甲基化標記和Y-染色體-特異性標記計算出所得拷貝數(shù)。如圖15B所示,給定值的箱線圖表明兩種不同檢測值之間的差異很小,從而證實了該方法的精確度和穩(wěn)定性。圖16顯示用圖15A的甲基化標記和Y-染色體標記所得結(jié)果之間為成對相關(guān) (paired correlation)0圖17顯示采用對照與競爭物的消化比例,比較該值與總拷貝數(shù)試驗平均值,得到限制性內(nèi)切酶的消化效率。除樣品沈外,所有反應(yīng)均表明效率高于約99%。圖18提供用男性胎兒妊娠的Y-染色體-特異性標記和所有妊娠(無論胎兒性別)的甲基化百分數(shù)平均值,計算出樣品中胎兒DNA百分數(shù)(或濃度)的具體方法。圖19提供計算樣品中胎兒DNA百分數(shù)(或濃度)而不需要Y-染色體_特異性標記的具體方法。而僅用甲基化定量試驗測定胎兒DNA的濃度。圖20顯示用本發(fā)明方法對模擬的21號三體染色體進行診斷的功率計算t-檢驗 (power calculation t-test)。該圖顯示χ-軸變異系數(shù)(CV)與采用簡單t_檢驗區(qū)分試驗人群的功率(y_軸)之間的關(guān)系。數(shù)據(jù)表明在99%的所有情況中,可以0.001的顯著性
15水平區(qū)分這兩類人群(整倍性和非整倍性),CV為5%或更低。定義本申請書所用的術(shù)語“妊娠相關(guān)疾病”指影響妊娠婦女、胎兒或二者的任何病癥或疾病。此類病癥或疾病可在有限時期內(nèi),例如妊娠或分娩期間表現(xiàn)出其癥狀,或者可在胎兒出生后持續(xù)終身。妊娠相關(guān)疾病的一些例子包括異位妊娠、先兆子癇、早產(chǎn)、MiD不相容、胎兒染色體異常,例如21三體綜合征和基因遺傳性胎兒疾病,例如囊性纖維化、β -地中海貧血或其它單基因疾病。能夠富集母體樣品中的胎兒核酸證明對于非侵入性產(chǎn)前診斷隱性常染色體疾病特別有用,例如母親和父親共患導(dǎo)致突變的同一種疾病,這種情況曾被認為是基于母體血漿的非三體性產(chǎn)前診斷的難點。本文所用的術(shù)語“染色體異?!被颉胺钦扼w”指對象染色體的結(jié)構(gòu)與正常同源染色體結(jié)構(gòu)之間有偏差。術(shù)語“正?!敝冈谔囟ㄎ锓N的健康個體中發(fā)現(xiàn)的占優(yōu)勢的核型或帶型,例如,整倍體基因組(在人中是46ΧΧ或46ΧΥ)。染色體異??梢允菙?shù)量或結(jié)構(gòu)異常,包括但不限于非整倍體、多倍體、顛倒、三體、單體、復(fù)制、缺失。染色體部分缺失、添加、染色體部分添加、插入、染色體片段、染色體區(qū)域、染色體重排和易位。染色體異常也指染色體狀態(tài)的異常,因為(例如)染色體易位可導(dǎo)致一個或多個染色體不是通常單倍體數(shù)的精確倍數(shù)。 染色體易位(例如,染色體21與14之間的易位(其中第14號染色體的一部分被額外的第 21號染色體替換)可導(dǎo)致部分21三體。染色體異??赡芘c病理學(xué)狀況或發(fā)生疾病的易感性相關(guān)??赏ㄟ^定量分析核酸來檢測染色體異常。本說明書中的術(shù)語“核酸”和“核酸分子”可互換使用。這些術(shù)語指任何組成形式的核酸,例如DNA (如互補DNA (cDNA)、基因組DNA (gDNA)等)、RNA (如信使RNA (mRNA)、短抑制性RNA(siRNA)、核糖體RNA(rRNA)、tRNA、微小RNA、胎兒或胎盤高度表達的RNA等)和/或 DNA或RNA類似物(例如,含有堿基類似物、糖類似物和/或非天然骨架等等)、RNA/DNA雜交體和聚酰胺核酸(PNA),所有這些可以是單鏈或雙鏈形式,除非另有限制,可包括可以與天然產(chǎn)生的核苷酸相似的方式起作用的天然核苷酸的已知類似物。例如,SEQ ID No 1-89 所示的核酸(見表4)可以是用于實施本文方法的任何形式(例如,線形、環(huán)狀、超螺旋、單鏈、雙鏈等)或可包含不會改變它們用途的變異(例如,插入、缺失或取代)作為本發(fā)明的一部分。核酸可以是或可來自質(zhì)粒、噬菌體、自主復(fù)制序列(ARS)、著絲粒、人工染色體、染色體或能在體外或宿主細胞中復(fù)制的其它核酸、細胞、細胞的細胞核或細胞質(zhì)(在某些實施方式中)。在一些實施方式中,模板核酸可以來自一個染色體(例如,核酸樣品可獲自二倍體生物樣品的一個染色體)。除非另有限定,該術(shù)語包括含有天然核苷酸已知類似物的核酸,其具有與參比核酸相似的結(jié)合特性,并且代謝方式類似于天然產(chǎn)生的核苷酸。除非另有指出,特定核酸序列還隱含包括其保守性修飾(例如,簡并密碼子取代)變體、等位基因、 直向同源物、單個核苷酸多態(tài)性(SNP)和互補序列以及專門指出的序列。具體地說,可通過其中一個或多個選擇(或全部)密碼子第三位(殘基)被混合堿基和/或脫氧肌苷殘基取代產(chǎn)生的序列,而實現(xiàn)簡并密碼子取代(Batzer等.,Nucleic Acid Res. 19 :5081(1991); Ohtsuka 等·,J. Biol. Chem. 260 :2605-2608(1985);和 Rossolini 等.,Mol. Cell. Probes 8:91-98(1994))。術(shù)語核酸與基因座、基因、cDNA和基因編碼的mRNA可互換使用。該術(shù)語還可包括從核苷酸類似物合成的RNA或DNA等價物、衍生物和類似物、單鏈(“有義”或“反義”,“正”鏈或“負”鏈,“正向”讀框或“反向”讀框)和雙鏈多核苷酸。脫氧核糖核苷酸包括脫氧腺苷、脫氧胞苷、脫氧鳥苷和脫氧胸苷。對于RNA,堿基胞嘧啶替換為尿嘧啶??衫脧膶ο螳@得的核酸作為模板來制備模板核酸。本文所用的“包含一個或多個CpG位點的核酸”或“含CpG的基因組序列”指個體, 例如人胎兒或妊娠婦女的基因組中指定位置的DNA序列區(qū)段?!昂珻pG的基因組序列”通常至少長15個核苷酸,含有至少一個胞嘧啶。優(yōu)選至少長30、50、80、100、150、200、250或300 個核苷酸,含有至少2、5、10、15、20、25或30個胞嘧啶。對于給定位置,例如以給定遺傳基因座為中心的區(qū)域(參見表1)的任何“含CpG的基因組序列”,個體之間和同一個體的等位基因之間可存在核苷酸序列變異。以給定基因座(例如,CpG島)為中心的此類區(qū)域通常含有該基因座以及上游和/或下游序列。上游或下游序列(分別從基因座的5’或3’邊界計數(shù))各自可長10吐,在其它情況中,可長5吐、2吐、1吐、50(^ 、20(^ 或10(^ 。此外,“含 CpG的基因組序列”可包含產(chǎn)生蛋白質(zhì)所需的轉(zhuǎn)錄或未轉(zhuǎn)錄的核苷酸序列,該核苷酸序列可以是基因間序列、基因內(nèi)序列、蛋白質(zhì)編碼序列、非蛋白質(zhì)編碼序列(例如,轉(zhuǎn)錄啟動子)或它們的組合。本文所用的“甲基化核苷酸”或“甲基化核苷酸堿基”指核苷酸堿基上存在甲基, 公認的典型核苷酸堿基中不存在這種甲基。例如,胞嘧啶的嘧啶環(huán)不含甲基,但5-甲基胞嘧啶的嘧啶環(huán)5位含有甲基。因此,胞嘧啶是未甲基化的核苷酸,而5-甲基胞嘧啶是甲基化核苷酸。在另一實例中,胸腺嘧啶的嘧啶環(huán)5位含有甲基,然而,對于本文的目的,DNA中的胸腺嘧啶不視為甲基化核苷酸,因為胸腺嘧啶是DNA的典型核苷酸堿基。DNA的典型核苷酸堿基有胸腺嘧啶、腺嘌呤、胞嘧啶和鳥嘌呤。RNA的典型堿基有尿嘧啶、腺嘌呤、胞嘧啶和鳥嘌呤。相應(yīng)地,“甲基化位點”是靶基因核酸區(qū)域中甲基化或可能發(fā)生甲基化的位置。例如,含CpG的位置是甲基化位點,其中胞嘧啶可以甲基化或未甲基化。本文所用的“CpG位點”或“甲基化位點”是核酸中因體內(nèi)天然事件易被甲基化,或體外經(jīng)化學(xué)方法易甲基化的核苷酸。本文所用的“甲基化核酸分子”指含有一個或多個被甲基化的甲基化核苷酸的核酸分子。本文所用的“CpG島,,指含有功能或結(jié)構(gòu)上偏向CpG密集的DNA序列區(qū)段。例如 Yamada 等.(Genome Research 14 :247-266,2004)描述的確定 CpG 島的一組標準為必須至少長400個核苷酸,GC含量高于50%,0CF/ECF比例大于0.6。其他人(Takai等·,Proc. Natl. Acad. Sci. U. S. Α. 99 :3740-3745,2002)對CpG島的定義沒那么嚴格序列至少長200 個核苷酸,GC含量高于50%,0CF/ECF比例大于0. 6。本文所用的“外遺傳學(xué)狀態(tài)”或“外遺傳學(xué)狀況”指在分子水平上,核酸(例如,DNA 或RNA)除一級核苷酸序列外的結(jié)構(gòu)特征。例如,基因組DNA的外遺傳學(xué)狀態(tài)可包括受以下因素決定或影響的其二級或三級結(jié)構(gòu)其甲基化模式或其與細胞蛋白質(zhì)的結(jié)合情況。本文所用的術(shù)語“甲基化模式”、“甲基化狀態(tài)”或“甲基化狀況”描述基因組序列的甲基化狀態(tài),指DNA區(qū)段的特定基因組基因座與甲基化相關(guān)的特征。此類特征包括但不限于該DNA序列內(nèi)是否有任何胞嘧啶(C)殘基被甲基化,甲基化C殘基的位置,殘基任何特定延伸段處甲基化C的百分比,和由于(例如)等位基因來源的差異導(dǎo)致的等位基因差異。 術(shù)語“甲基化模式”或“甲基化狀況”也指生物學(xué)樣品中任何特定殘基延伸段的甲基化C或未甲基化C的相對或絕對濃度。例如,如果DNA序列內(nèi)有一個或多個胞嘧啶(C)殘基甲基化,可稱其為“高甲基化”;如果DNA序列內(nèi)一個或多個胞嘧啶(C)殘基未甲基化,可稱其為 “低甲基化”。類似地,如果DNA序列(例如,胎兒核酸)內(nèi)一個或多個胞嘧啶(C)殘基相對于不同來源或不同個體的另一序列(例如,相對于母體核酸)被甲基化,則該序列相對于該另一序列視作高甲基化。或者,如果DNA序列內(nèi)的一個或多個胞嘧啶(C)殘基相對于不同來源或不同個體(例如,母親)的另一序列未被甲基化,則該序列相對于該另一序列視作低甲基化。將這些序列稱為“差異甲基化”,更具體地說,當母親與胎兒之間的甲基化狀態(tài)不同時,這些序列視作“差異甲基化的母體和胎兒核酸”。本文所用的術(shù)語“結(jié)合甲基化核苷酸的試劑”指能結(jié)合甲基化核酸的物質(zhì)。該試劑可以是天然或合成的,可經(jīng)修飾或未修飾。在一個實施方式中,該試劑能根據(jù)核酸各自的甲基化狀況分離不同的核酸種類。結(jié)合甲基化核苷酸的試劑的一個例子描述于通過引用納入本文的PCT專利申請?zhí)朠CT/EP2005/012707,其公布號為W006056480A2。描述的試劑是包含屬于甲基-CpG結(jié)合蛋白(MBD)家族的蛋白質(zhì)的DNA結(jié)合區(qū)和抗體Fc區(qū)的雙功能多肽 (參見圖1)。這種重組的甲基-CpG-結(jié)合抗體樣蛋白能以類似于抗體的模式優(yōu)先結(jié)合CpG 甲基化DNA。這意味著,這種甲基-CpG-結(jié)合抗體樣蛋白對其“抗原,,具有高親和力和高親合力,所述“抗原”優(yōu)選在CpG 二核苷酸處甲基化的DNA。該試劑還可以是多價MBD(參見圖 2)。本文所用的術(shù)語“多態(tài)性”指同一基因組序列不同等位基因的序列變異。含多態(tài)性的序列視作“多態(tài)性序列”。檢測一種或多種多態(tài)性可以區(qū)分一個基因組序列或兩個或多個體之間的不同等位基因。本文所用的術(shù)語“多態(tài)性標記”或“多態(tài)性序列,,指可在個體之間表現(xiàn)出DNA序列的可遺傳變異的基因組DNA區(qū)段。此類標記包括但不限于單個核苷酸多態(tài)性(SNP)、限制性片段長度多態(tài)性(RFLP)、短串聯(lián)重復(fù)序列,例如二-、三-或四個核苷酸重復(fù)序列(STR)等??衫帽景l(fā)明的多態(tài)性標記特別區(qū)分富集的胎兒核酸樣品中母體和父體的等位基因。本文所用的術(shù)語“單個核苷酸多態(tài)性”或“SNP”指同一基因組序列不同等位基因存在一個核苷酸殘基變異的多核苷酸序列。這種變異可發(fā)生在基因組序列的編碼區(qū)或非編碼區(qū)內(nèi)(即,在啟動子或內(nèi)含子區(qū)域),如果該基因組序列在蛋白質(zhì)產(chǎn)生期間轉(zhuǎn)錄的話。檢測一個或多個SNP能區(qū)分一個基因組序列或兩個或多個體之間的不同等位基因。本文所用的術(shù)語“等位基因”是占據(jù)染色體DNA非編碼區(qū)或基因中同一位置的幾種可替代形式之一種。可用術(shù)語等位基因描述任何生物的DNA,包括但不限于細菌、病毒、 真菌、原生動物、霉菌、酵母菌、植物、人、非人、動物和古細菌(archeabacteria)。本文所用的術(shù)語“等位基因比例”或“等位基因比率”指樣品中人群的一種等位基因與其它等位基因的比例。在一些實施方式中,胎兒的某特定基因座可能有三個等位基因。 在此類病例中,術(shù)語“等位基因比例”指人群中任何一種等位基因與其它等位基因之一,或任何一種等位基因與其它兩種等位基因的比例。本文所用的術(shù)語“非多態(tài)性定量檢測方法”指不需要利用多態(tài)性標記或序列的檢測某分析物(例如,總核酸、Y-染色體核酸或胎兒核酸)含量的方法。雖然序列可能存在多態(tài)性,但不需要利用多態(tài)性來定量測定該序列。非多態(tài)性定量檢測方法的例子包括但不限于RT-PCR、數(shù)字PCR、陣列方法、測序方法、納米孔方法、核酸結(jié)合珠計數(shù)方法和競爭方法, 后一方法通過引入濃度已知的一種或多種競爭物來測定一種或多種分析物的含量。在一些
18實施方式中,可能需要積極修改或設(shè)計一些上述示范性方法(例如,測序)而不必查詢一種或多種多態(tài)性。本文所用的術(shù)語“絕對量”或“拷貝數(shù)”指分析物(例如,總核酸或胎兒核酸)的含量或數(shù)量。本發(fā)明提供測定混合母體樣品中胎兒核酸絕對量的組合物和方法。絕對量或拷貝數(shù)代表可檢測到的分子數(shù)量,表示為每單位的等價基因組含量。術(shù)語“濃度”指混合物或溶液中某物質(zhì)的含量或比例(例如,包含母體和胎兒核酸混合物的母體樣品中胎兒核酸的含量)。濃度可表示為百分比,用于表示一種數(shù)量相對于另一數(shù)量有多大/多小,可以百分數(shù)表示。測定分析物(例如,靶核酸)數(shù)量或含量的平臺包括但不限于質(zhì)譜法、數(shù)字PCR、 通過合成平臺測序(例如,高溫測序)、熒光光譜法和流式細胞術(shù)。本文所用的術(shù)語“樣品”指含有核酸的標本。樣品的例子包括但不限于用本領(lǐng)域熟知方法獲得的組織、體液(例如,血液、血清、血漿、唾液、尿液、淚液、腹膜液、腹水、陰道分泌物、乳液、母乳、淋巴液、腦脊液或粘膜分泌物)、臍帶血、絨毛、羊水;胚胎、雙-細胞胚胎、四-細胞胚胎、八-細胞胚胎、十六-細胞胚胎、三十二 -細胞胚胎、六十四-細胞胚胎、 一百二十八-細胞胚胎、二百五十六-細胞胚胎、五百一十二-細胞胚胎、一千零二十四-細胞胚胎;胚胎組織、淋巴液、腦脊液、粘膜分泌物或其它身體滲出液、糞便、單個細胞或含有相同核酸和亞細胞結(jié)構(gòu)(例如線粒體)的此類來源提取物??蓮囊韵聛碓传@得胎兒DNA,包括但不限于母體血液、母體血清、母體血漿、胎兒細胞、臍帶血、絨毛、羊水、尿液、唾液、肺灌洗液、細胞或組織。本文所用的術(shù)語“血液”指妊娠婦女或要檢查是否可能懷孕的婦女的血液樣品或制品。該術(shù)語包括全血或血液的任何組分,例如常規(guī)定義的血清和血漿。本文所用的術(shù)語“亞硫酸氫鹽”包括能將胞嘧啶(C)化學(xué)轉(zhuǎn)變成尿嘧啶(U)而不化學(xué)修飾甲基化胞嘧啶的任何合適類型的亞硫酸氫鹽,例如亞硫酸氫鈉,因此可用于根據(jù)DNA 的甲基化狀況而差異性修飾該DNA序列。本文所用的“差異性修飾”甲基化或未甲基化DNA的試劑包括修飾甲基化和/或未甲基化DNA的任何試劑,通過此過程區(qū)分甲基化與未甲基化DNA產(chǎn)物,從而得以鑒定DNA 的甲基化狀況。此類過程包括但不限于化學(xué)反應(yīng)(例如,通過亞硫酸氫鹽將C轉(zhuǎn)變成U) 和酶處理(例如,通過甲基化依賴性內(nèi)切酶的切割)。因此,優(yōu)先切割或消化甲基化DNA的酶是DNA被甲基化時能以較高效率切割或消化該DNA分子的酶,而優(yōu)先切割或消化未甲基化DNA的酶是DNA未被甲基化時能以較高效率切割或消化該未甲基化DNA分子的酶。本文所用的術(shù)語“非-亞硫酸氫鹽方法”和“非-亞硫酸氫鹽定量方法”指不需要用亞硫酸氫鹽而能定量測定甲基化或非甲基化核酸的任何方法。該術(shù)語也指不需要用亞硫酸氫鹽處理而制備待定量測定的核酸的方法。非亞硫酸氫鹽方法的例子包括但不限于用一種或多種甲基化敏感的酶消化核酸的方法和用根據(jù)甲基化狀況結(jié)合核酸的試劑分離核酸的方法。術(shù)語“甲基-敏感酶”和“甲基化敏感的限制性內(nèi)切酶”是活性依賴于它們的DNA 識別位點的甲基化狀態(tài)的DNA限制性內(nèi)切核酸酶。例如,有的甲基敏感酶僅在它們的DNA 識別序列未甲基化時在該處作切割或消化。因此,未甲基化的DNA樣品切割成小于甲基化 DNA樣品的片段。類似地,不會切割高度甲基化的DNA樣品。相反,也有的甲基敏感酶僅在它們的DNA識別序列甲基化時在該處作切割。本文所用的術(shù)語“切割”、“切斷”和“消化”可互換使用。本文所用的術(shù)語“靶核酸”指采用本文公開的方法檢測的核酸,以確定該核酸是否為妊娠相關(guān)疾病或染色體異常的一部分。例如,可用本發(fā)明方法檢驗染色體21的靶核酸以檢測唐氏綜合征。本文所用的術(shù)語“對照核酸”指用作本文所公開方法的參比核酸以確定該核酸是否為染色體異常的一部分的核酸。例如,除染色體21以外的染色體(本文稱為“參比染色體”)的對照核酸可以作為參比序列以檢測唐氏綜合征。在一些實施方式中,所述對照序列的含量已知或已預(yù)先確定。本文所用的術(shù)語“序列特異性”或“基因座特異性方法”指根據(jù)序列組成查詢(例如,定量測定)基因組中特定位置(或基因座)核酸的方法。序列特異性或基因座特異性方法能定量測定特定區(qū)域或染色體。術(shù)語“基因”表示參與產(chǎn)生多肽鏈的DNA區(qū)段;其包括編碼區(qū)之前和之后,參與轉(zhuǎn)錄/翻譯基因產(chǎn)物和調(diào)節(jié)轉(zhuǎn)錄/翻譯的區(qū)域(前導(dǎo)序列和尾序列),以及各編碼區(qū)段(外顯子)之間的插入序列(內(nèi)含子)。在本申請書中,術(shù)語“多肽”、“肽”和“蛋白質(zhì)”在本文中可互換使用,指氨基酸殘基的聚合物。該術(shù)語適合用于其中一個或多個氨基酸殘基是相應(yīng)天然產(chǎn)生氨基酸的人工化學(xué)模擬物的氨基酸聚合物,以及天然產(chǎn)生的氨基酸聚合物和非天然產(chǎn)生的氨基酸聚合物。本文所用的這種術(shù)語包括任何長度的氨基酸鏈,包括全長蛋白質(zhì)(即抗原),其中氨基酸殘基通過共價肽鍵連接。術(shù)語“氨基酸”指天然產(chǎn)生的和合成的氨基酸,以及功能類似于天然產(chǎn)生氨基酸的氨基酸類似物和氨基酸模擬物。天然產(chǎn)生的氨基酸是遺傳密碼編碼的氨基酸,以及隨后經(jīng)修飾的氨基酸,如羥基脯氨酸、υ -羧基谷氨酸和ο-磷酸絲氨酸。在本文中,氨基酸可用IUPAC-IUB生物化學(xué)命名委員會推薦的通用三字母符或單字母符表示。同樣,核苷酸可用其普遍接受的單字母代碼表示。本文所用的“引物”指可用于擴增方法,例如聚合酶鏈式反應(yīng)(PCR)的寡核苷酸,從而能根據(jù)對應(yīng)于不同甲基化狀況的特定基因組序列,例如位于染色體21的CpG島 CGI137、PDE9A或CGI009內(nèi)的序列的多核苷酸序列來擴增核苷酸序列。擴增多核苷酸序列的PCR引物中至少一種對該序列是序列特異性的。術(shù)語“模板”指在本發(fā)明中可用于擴增的任何核酸分子??蓪⑻烊徊皇请p鏈的RNA 或DNA制成雙鏈DNA以便用作模板DNA。任何雙鏈DNA或含有多個不同雙鏈DNA分子的制品均可用作模板DNA,以擴增模板DNA中所含的一個或多個感興趣基因座。本文所用的術(shù)語“擴增反應(yīng)”指將核酸拷貝一次或多次的過程。在各實施方式中,擴增方法包括但不限于聚合酶鏈式反應(yīng)、自身我維持的序列反應(yīng)(self-sustained sequence reaction)、連接酶鏈式反應(yīng)、cDNA末端的快速擴增、聚合酶鏈式反應(yīng)和連接酶鏈式反應(yīng)、Q-β噬菌體擴增、鏈置換擴增或剪接重疊延伸聚合酶鏈式反應(yīng)。在一些實施方式中,例如可通過數(shù)字PCR擴增單分子的核酸。本文所用的術(shù)語“靈敏度”指真陽性的數(shù)值除以真陽性加上假陰性的數(shù)值,其中靈敏度(sens)可以在0 < sens ( 1的范圍內(nèi)。本發(fā)明方法的各實施方式最好具有等于0或接近等于0的假陰性數(shù)值,從而不會在對象實際上具有至少一種染色體異?;蚱渌z傳疾病時將該對象錯誤鑒定成不具有至少一種染色體異常或其它遺傳疾病。相反,評估常包括預(yù)測算法能否正確分類陰性(對靈敏度的互補檢測)。本文所用的術(shù)語“特異性”指真陰性的數(shù)值除以真陰性加上假陽性的數(shù)值,其中特異性(spec)可以在0 < spec ^ 1的范圍內(nèi)。 本發(fā)明方法的各實施方式最好具有等于0或接近等于0的假陽性數(shù)值,從而不會在對象不具有所評估的染色體異?;蚱渌z傳疾病時將該對象錯誤鑒定成具有至少一種染色體異?;蚱渌z傳疾病。因此,有時選擇靈敏度和特異性等于1或100%的方法??刹捎靡环N或多種預(yù)測算法,測定在不同條件下所收集檢測數(shù)據(jù)的顯著性或給予其意義,可不依賴地或依賴地彼此進行權(quán)衡。本文所用的術(shù)語“變量”指具有某數(shù)值或一組數(shù)值的某算法的因素、數(shù)量或功能。例如,設(shè)計的變量可以是一組擴增核酸的種類,擴增核酸種類的組數(shù)、檢測胎兒遺傳貢獻的百分比、檢測母體遺傳貢獻的百分比、測定染色體異常的類型、測定遺傳疾病的類型、測定性連鎖異常的類型、母親的年齡等。本文所用的術(shù)語“不依賴于”指不受另一因素的影響或控制。本文所用的術(shù)語“依賴于”指受另一因素的影響或控制。例如,活生物體中的特定染色體和該特定染色體產(chǎn)生的三體性事件是彼此依賴的變量。本領(lǐng)域技術(shù)人員可采用任何類型的方法或預(yù)測算法判斷本發(fā)明數(shù)據(jù)的顯著性是否在可接受的靈敏度和/或特異性范圍內(nèi)。例如,可采用的預(yù)測算法有,如κ2檢驗、ζ-檢驗、t-檢驗、ANOVA (方差分析)、回歸分析、神經(jīng)網(wǎng)絡(luò)(neural net)、模糊邏輯、隱藏馬氏模型(Hidden Markov Models)、多模型狀態(tài)估計等??纱_定本發(fā)明含有不同非依賴性和/或依賴性變量的數(shù)據(jù)對分析的一種或多種方法或預(yù)測算法具有顯著性。可確定本發(fā)明含有不同非依賴性和/或依賴性變量的數(shù)據(jù)對分析的一種或多種方法或預(yù)測算法沒有顯著性??筛鶕?jù)一種或多種預(yù)測算法的結(jié)果(例如,所分析組的數(shù)量、各組中核苷酸的類型)設(shè)計或改變本文所述方法不同變量的參數(shù)。例如,用κ 2檢驗檢測的數(shù)據(jù)可能提示,母親年齡的具體范圍與后代患特定染色體異常的可能性較高相關(guān),因此與其它變量相比,母親年齡變量可有不同權(quán)重。在某些實施方式中,可選擇檢驗幾種算法??衫迷紨?shù)據(jù)訓(xùn)練這些算法。對于每種新的原始數(shù)據(jù)樣品,經(jīng)過訓(xùn)練的算法會指定該樣品的類別(即,三體性或正常)。對新的原始數(shù)據(jù)樣品類別,可根據(jù)靈敏度和特異性評估經(jīng)過訓(xùn)練算法的性能。最后鑒定出具有最高靈敏度和/或特異性或它們組合的算法。詳述引言1997年首次報道母體血漿中存在胎兒核酸,從而為簡單地通過分析母體血液樣品進行非侵入性診斷提供了可能性(Lo等.,Lancet 350 :485-487,1997)。迄今為止,已開發(fā)了許多潛在的臨床應(yīng)用。具體地說,發(fā)現(xiàn)母體血漿中胎兒核酸(如DNA)濃度的含量異常與許多妊娠相關(guān)疾病,包括先兆子癇、早產(chǎn)、產(chǎn)前出血、侵襲性胎盤形成(invasive placentation)、胎兒唐氏綜合征和其它胎兒染色體非整倍性有關(guān)。因此,母親血漿中的胎兒核酸分析代表了監(jiān)測婦嬰健康的有力機制。然而,胎兒DNA與背景母體DNA共同存在于母體血漿中。因此,大多數(shù)報道的應(yīng)用依賴于檢測Y-染色體序列,因為這些序列最易與母體DNA區(qū)分。此類方法將現(xiàn)有試驗的應(yīng)用僅僅局限在50%的所有妊娠,即懷有男性胎兒的那些婦女。因此,很需要開發(fā)不依賴性別的組合物和方法以便富集和分析母體樣品中的胎兒核酸。依賴于多態(tài)性標記來定量測定胎兒核酸的方法還對不同種族之間的不同雜合率敏感,從而限制了它們的應(yīng)用(例如,需要增加標記物的數(shù)量)。已證明可通過胎兒與母體DNA甲基化狀況的不同來區(qū)分它們(參見通過引用納入本文的美國專利第6,927,0 號)。甲基化是一種外遺傳學(xué)現(xiàn)像,指改變表型而不涉及DNA 序列改變的過程。通過利用母親與胎兒之間DNA甲基化狀況的不同可成功檢測并分析母體核酸背景中的胎兒核酸。本發(fā)明人提供胎兒的胎兒DNA (例如,來自胎盤)與母親的母體DNA (例如,來自外周血細胞)之間差異甲基化的新型基因組多核苷酸。因此,該發(fā)現(xiàn)為區(qū)分胎兒與母體基因組DNA提供了一種新方法,為精確定量測定胎兒核酸提供了新方法,該方法可用于非侵入性產(chǎn)前診斷。方法為實施本發(fā)明可采用分子生物學(xué)領(lǐng)域的常規(guī)技術(shù)。公開的可用于本發(fā)明的通用方法的基礎(chǔ)教材包括Sambrook和Russell,《分子克隆實驗室手冊》(Molecular Cloning, A Laboratory Manual)(第3版.,2001) ;Kriegler,《基因轉(zhuǎn)移和表達實驗室手冊》(Gene Transfer and Expression :A Laboratory Manual) (1990);禾口《分子生物學(xué)最新方案》 (Current Protocols in Molecular Biology) (Au sub el 等編.,1994))。核酸的大小以千堿基(1Λ)或堿基對(bp)為單位給出。它們是從瓊脂糖或丙烯酰胺凝膠電泳、測序核酸或公開的DNA序列獲得的估計值。蛋白質(zhì)的大小以千道爾頓(kDa) 或氨基酸殘基數(shù)目為單位給出。由凝膠電泳、測序的蛋白質(zhì)、推導(dǎo)的氨基酸序列或公開的蛋白質(zhì)序列估計蛋白質(zhì)大小??苫瘜W(xué)合成不能商品化購得的寡核苷酸,例如按照Beaucage和Caruthers, Tetrahedron Lett. 22 :1859-1862(1981)首先描述的固相亞磷酰胺三酯方法,如Van Devanter 等.,Nucleic Acids Res. 12 :6159-6168(1984)所述用自動合成儀合成??刹捎帽绢I(lǐng)域公知的方法,例如Pearson和Reanier,J. Chrom. 255 :137-149(1983)所述的天然丙烯酰胺凝膠電泳或陰離子交換高效液相色譜(HPLC)純化寡核苷酸。獲得血液樣品和提取DNA本發(fā)明涉及分離、富集和分析母體血液中發(fā)現(xiàn)的胎兒DNA,作為一種非侵入性方法可檢測是否存在妊娠相關(guān)疾病或病癥和/或監(jiān)測其發(fā)展。因此,實施本發(fā)明的第一步驟是獲得妊娠婦女的血液樣品并提取該樣品中的DNA。A.獲得血液樣品獲得適合用本發(fā)明方法檢驗的孕齡妊娠婦女的血液樣品。如下所述,合適的孕齡根據(jù)所檢驗的疾病而不同。按照醫(yī)院或診所通常遵循的標準方法收集婦女的血液。收集適當量的外周血,例如通常是5_50ml,按照標準流程儲存,然后進一步制備??砂凑毡绢I(lǐng)域普通技術(shù)人員已知的方式收集、儲存或轉(zhuǎn)運血液樣品,以最大程度減少樣品中存在核酸的降解或維持其質(zhì)量。B.制備血液樣品可利用,例如全血、血清或血漿來實施本發(fā)明對母體血液中發(fā)現(xiàn)的胎兒DNA的分析。本領(lǐng)域技術(shù)人員熟知制備母體血液的血清或血漿的方法。例如,可將妊娠婦女的血液置于含有EDTA或商品化專用產(chǎn)品,例如Vacutainer SST (新澤西州富蘭克林湖的BD公司 (Becton Dickinson, Franklin Lakes, N.J·))的試管中以防血液凝固,然后離心獲得全血的血漿。另一方面,可在血液凝固后離心或不離心獲得血清。如果采用離心,通常(但不一定)以適當轉(zhuǎn)速,例如1,500-3,OOOg進行。先對血漿或血清進行額外的離心步驟,再轉(zhuǎn)移到新的試管中提取DNA。除了全血的非細胞部分外,也可從富集在血沉棕黃層部分中的細胞組分回收DNA, 其可在婦女的全血樣品離心和除去血漿后獲得。C.提取 DNA有許多已知方法從包括血液在內(nèi)的生物學(xué)樣品中提取DNA??砂凑誅NA制備的通用方法(例如,Sambrook和Russell,《分子克隆實驗室手冊》,第3版.,2001所述的);也可用各種可商品化購得的試劑或試劑盒獲得妊娠婦女血液樣品中的DNA,所述試劑或試劑盒例如有恰根公司的QIAamp循環(huán)性核酸試劑盒Oliagen,s QIAamp Circulating Nucleic Acid Kit)、德國希爾頓恰根公司(Qiagen, Hilden,Germany)的QiaAmp DNA迷你試劑盒 (QiaAmp DNA Mini Kit)或 QiaAmp DNA 血液迷你試劑盒(QiaAmp DNA Blood Mini Kit)、 威斯康星州麥迪遜市普羅邁格公司(Promega,Madison,Wis.)的GenomicPmp 血液DNA分離試劑盒和新澤西州皮斯卡塔韋阿姆仙公司(Amersham,Piscataway, N. J.)的GFX 基因組血液DNA純化試劑盒。還可采用這些方法多個的組合。在一些實施方式中,可先用一種或多種方法富集或相對富集胎兒核酸。例如,然后單用本發(fā)明組合物和方法或與其它區(qū)分因素聯(lián)用來區(qū)分胎兒與母體DNA。這些因素的例子包括但不限于染色體X與Y之間的單個核苷酸差異、染色體Y-特異性序列、位于基因組中它處的多態(tài)性、胎兒與母體DNA之間的大小差異和母體與胎兒組織之間甲基化模式的差
已富集樣品中特定核酸種類的其它方法描述參見通過引用納入本文的2007年5月 30日提交的PCT專利申請?zhí)朠CT/US07/69991 ; 2007年6月15日提交的PCT專利申請?zhí)朠CT/ US2007/071232 ;美國臨時申請?zhí)?0/968, 876和60/968,878 (轉(zhuǎn)讓給本申請人)、(2005年 11月28日提交的PCT專利申請?zhí)朠CT/EP05/012707)。在某些實施方式中,選擇性除去樣品中的母親核酸(部分、基本上、幾乎完全或完全除去)。甲基化特異性分離核酸本文提供的方法是根據(jù)DNA甲基化差異的甲基化特異性分離法,為富集胎兒DNA 提供了一種替代方案。最近發(fā)現(xiàn)參與發(fā)育調(diào)節(jié)的許多基因在胚胎干細胞中通過外遺傳學(xué)途徑調(diào)節(jié)。因此,預(yù)計有多種基因在胎兒來源與母體來源核酸之間顯示有DNA甲基化差異。一旦鑒定到這些區(qū)域,可采用捕捉甲基化DNA的技術(shù)特異性富集胎兒DNA。為鑒定甲基化有差異的區(qū)域,采用了新的方法捕捉甲基化的DNA。該方法采用的蛋白質(zhì)是MBD2的甲基結(jié)合功能域與抗體Fc片段融合的蛋白質(zhì)(MBD-Fc) (Gebhard C,Schwarzfischer L, Pham TH, Schilling Ε, Klug Μ, Andreesen R, Rehli M(2006) "CpG 甲基化的基因組分布模式可鑒定髓細胞性白血病中異常高度甲基化的新靶標”(Genomewide profiling of CpG methylation identifies novel targets of aberrant hypermethylation in myeloid leukemia). Cancer Res 66 :6118-61 )。這種融合蛋白比常規(guī)的甲基化特異性抗體有幾個優(yōu)點。MBD-FC對甲基化DNA的親和力較高,能結(jié)合雙鏈DNA。最重要的是這兩種蛋白質(zhì)結(jié)合DNA的方式不同。甲基化特異性抗體是隨機結(jié)合DNA,這意味著只能獲得二元產(chǎn)物。另一方面MBD-FC的甲基結(jié)合區(qū)結(jié)合DNA分子,而無論它們的甲基化狀況。這種蛋白質(zhì)-DNA 相互作用的強度由DNA甲基化水平?jīng)Q定。結(jié)合基因組DNA后,可采用提高洗脫溶液的鹽濃度來分級非甲基化和甲基化DNA,從而能更受控的分離(GeWiard C,Schwarzfischer L, Pham TH, Andreesen R, Mackensen A, Rehli M(2006) “采用甲基結(jié)合(MB)-PCR 快速靈 1 CpG- ψ^it" (Rapid and sensitive detection of CpG-methylation using methyl-binding (MB)-PCR). Nucleic Acids Res 34 :e82)。因此,該方法(稱為甲基-CpG 免疫沉淀法(MCIP))不僅能根據(jù)甲基化水平富集,而且能分組基因組DNA,當還要研究未甲基化DNA組分時特別有用。甲基化敏感的限制性內(nèi)切酶消化本發(fā)明還提供測定母體樣品中胎兒核酸含量的組合物和方法。本發(fā)明通過選擇性消化母體樣品中的核酸來富集所述母體樣品中的胎兒核酸區(qū)域,即,利用能選擇性和完全或基本上完全消化該母體核酸的酶來富集樣品中至少一種胎兒核酸區(qū)域。消化效率優(yōu)選高于約 75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。富集后,用不需要多態(tài)性序列分析或亞硫酸氫鹽處理的定量方法測定胎兒核酸含量,所得溶液對女性胎兒和不同人種之間同樣有效,并能保存樣品中存在的低拷貝數(shù)胎兒核酸。例如,有的甲基敏感酶能優(yōu)先或基本上完全切割或消化其識別的未甲基化DNA序列。因此,未甲基化的DNA樣品將被切割成比甲基化DNA樣品更小的片段。類似地,不會切割高度甲基化的DNA樣品。相反,也有的甲基敏感酶切割其識別的甲基化DNA序列。適合用于本發(fā)明方法的消化未甲基化DNA的甲基敏感酶包括但不限于HpaII、 HhaI、MaeII、BstUI和AciI??捎玫囊环N酶是只切割未甲基化序列CCGG的HpaII酶??捎玫牧硪环N酶是只切割未甲基化序列GCGC的HhaI酶。這兩種酶可購自New England BioLabs , Inc0也可聯(lián)用兩種或多種只消化未甲基化DNA的甲基-敏感酶。只消化甲基化DNA的合適酶包括但不限于切割識別序列GATC的DpnI酶和屬于AAA+蛋白超家族、切割含修飾胞嘧啶的 DNA 和切割識別位點 5' ... Pu. sup. mC(N. sub. 40-3000)Pu. sup. mC. . . 3‘的 McrBC 酶 (馬薩諸塞州貝弗利新英格蘭生物實驗室有限公司(New England BioLabs, Inc. ,Beverly, Mass. )) 0本領(lǐng)域技術(shù)人員熟知所選限制性內(nèi)切酶在特定位點切割DNA的切割方法和過程。 例如,許多限制性內(nèi)切酶的供應(yīng)商提供了關(guān)于特異性限制性內(nèi)切酶切割DNA序列的條件和類型的信息,包括新英格蘭生物實驗室、普羅邁格公司、B-M公司(Boehringer-Marmheim) 等。Sambrook等(參見Sambrook等.,《分子生物學(xué)實驗室方法》(Molecular Biology A laboratory Approacti),冷泉港(Cold Spring Harbor),紐約.,1989)全面描述了利用限制性內(nèi)切酶和其它酶的方法。在本發(fā)明的方法中,通常在能以約95% -100%效率,優(yōu)選約 98% -100%效率切割母親DNA的條件下使用所述酶。甲基化分析的其它方法本領(lǐng)域已知有多種甲基化分析方法可與本發(fā)明聯(lián)用。這些試驗?zāi)軠y定DNA序列內(nèi)的一個或多個CpG島的甲基化狀態(tài)。此外,可采用這些方法定量測定甲基化的核酸。此類試驗包括亞硫酸氫鹽處理DNA后的DNA測序、PCR (序列特異性擴增)、Sourthern印跡分析和利用甲基化敏感的限制性內(nèi)切酶等其它技術(shù)?;蚪M測序是采用亞硫酸氫鹽處理,分析DNA甲基化模式和5-甲基胞嘧啶分布的已簡化的一種技術(shù)(Frommer 等.,Proc. Natl. Acad. Sci. USA 89 1827-1831,1992)。此夕卜,可采用限制性內(nèi)切酶消化被亞硫酸氫鹽轉(zhuǎn)變的DNA的PCR擴增產(chǎn)物,例如Mdri和 Hornsby (Nuc 1. Acids Res. 24 :5058-5059,1996)所述的方法或 COBRA (聯(lián)合的亞硫酸氫鹽限制性分析(Combined Bisulfite Restriction Analysis)) (Xiong 和 Laird,Nucleic Acids Res. 25 :2532-2534,1997)。COBRA分析是用于測定少量基因組DNA中特定基因座DNA甲基化水平的一種定量測定甲基化的試驗(Xiong和 Laird,Nucleic Acids Res. 25 :2532_2534,1997)。簡言之,采用限制性內(nèi)切酶消化以揭示亞硫酸氫鈉處理DNA的PCR產(chǎn)物中甲基化依賴性序列的差異。 按照 Frommer 等(Proc. Natl. Acad. Sci. USA 89 1827-1831,1992)所述的方法用標準亞硫酸氫鹽處理先將甲基化依賴性序列差異引入基因組DNA中。然后用感興趣CpG島的特異性引物進行亞硫酸氫鹽轉(zhuǎn)變DNA的PCR擴增,再進行限制性核酸內(nèi)切酶消化、凝膠電泳和用特異性標記的雜交探針檢測。原始DNA樣品的甲基化水平在DNA甲基化水平的寬圖譜上表示為線性定量方式的消化和未消化PCR產(chǎn)物的相對含量。此外,該技術(shù)能夠可靠地應(yīng)用于石蠟包埋組織樣品顯微切片獲得的DNA。典型的COBRA分析試劑(例如,典型COBRA試劑盒中用到的)包括但不限于特定基因(或甲基化改變的DNA序列或CpG島)的PCR引物,限制性內(nèi)切酶和適當?shù)木彌_液,基因-雜交寡聚物,對照雜交寡聚物,寡聚物探針的激酶標記試劑盒,和放射性核苷酸。此外,亞硫酸氫鹽轉(zhuǎn)變試劑包括DNA變性緩沖液,磺化緩沖液,DNA 回收試劑或試劑盒(例如,沉淀、超濾、親和柱),脫磺基緩沖液,和DNA回收組分。MethyLight 試驗是采用熒光實時PCR(TaqMan. RTM.)技術(shù)的高通量定量甲基化試驗,在PCR步驟后不需要作進一步操作 ads等.,Cancer Res. 59 :2302_2306,1999)。簡言之,MethyLight. 方法開始時采用基因組DNA的混合樣品,按照標準方法在亞硫酸氫鈉反應(yīng)中將其轉(zhuǎn)變成依賴于甲基化序列差異的混合合并物(亞硫酸氫鹽方法將未甲基化胞嘧啶殘基轉(zhuǎn)變成尿嘧啶)。然后以“無偏向”(用已知的CpG甲基化位點不重疊的引物)PCR 反應(yīng)或“偏向”(用已知的CpG 二核苷酸重疊的PCR引物)PCR反應(yīng)進行熒光PCR。序列鑒別可在擴增過程水平和/或熒光檢測過程水平作出。MethyLight試驗可用作基因組DNA樣品甲基化模式的定量試驗,其中序列鑒別在探針雜交水平作出。在該定量檢測中,當存在與特定的推定甲基化位點重疊的熒光探針時 PCR反應(yīng)提供了無偏向擴增。其中引物或探針均不覆蓋任何CpG 二核苷酸的該反應(yīng)為DNA 輸入量提供了無偏向?qū)φ?。或者,通過用不覆蓋已知甲基化位點的對照寡核苷酸(熒光形式的“MSP”技術(shù)),或用覆蓋潛在甲基化位點的寡核苷酸,探查偏向PCR混合合并物進行基因組甲基化的定量檢測。擴增過程中MethyLight方法可采用“TaqMan”探針。例如,用亞硫酸氫鈉處理雙鏈基因組DNA,用TaqMan. RTM探針進行兩組PCR反應(yīng)之一組,例如用偏向引物和TaqMan. RTM. 探針,或無偏向引物和TaqMan. RTM.探針。設(shè)計TaqMan. RTM.探針用熒光“報道”和“猝滅” 分子作雙重標記,對GC含量較高區(qū)域具有特異性,因此在PCR循環(huán)中它的解鏈溫度比正向或反向引物高約10°C。如此TaqMan. RTM.探針能在PCR退火/延伸步驟期間維持完全雜交。由于Taq聚合酶在PCR期間酶促合成新鏈,其最終到達退火的TaqMan.RTM.探針。隨
25后Taq聚合酶5’ 一 3’核酸內(nèi)切酶活性替換TaqMan. RTM.探針使探針消化釋放出熒光報道分子,以便用實時熒光檢測系統(tǒng)定量檢測其新的未猝滅信號。MethyLight. TM.分析所用的典型試劑(例如,可在典型MethyLight. TM.試劑盒中找到)包括但不限于特定基因(或甲基化改變的DNA序列或CpG島)的PCR引物;TaqMan. RTM.探針;優(yōu)化的PCR緩沖液和脫氧核苷酸;和Taq聚合酶。Ms-SnuPE技術(shù)是根據(jù)亞硫酸氫鹽處理DNA,然后作單個核苷酸引物延伸,用以評估特定CpG位點甲基化差異的定量方法(Gonzalgo和Jones, Nucleic Acids Res. 25 2529-2531,1997)。簡言之,基因組DNA與亞硫酸氫鈉反應(yīng)使未甲基化的胞嘧啶轉(zhuǎn)變成尿嘧啶,而 5-甲基胞嘧啶不變。然后用被亞硫酸氫鹽轉(zhuǎn)變的DNA的特異性PCR引物擴增所需靶序列, 分離得到的產(chǎn)物用作感興趣CpG位點甲基化分析的模板??煞治鑫⒘緿NA(例如,顯微切割的病理學(xué)切片),和避免用限制性內(nèi)切酶來測定 CpG位點的甲基化狀況。Ms-SnuPE分析所用的典型試劑(例如,可在典型Ms-SnuPE試劑盒中找到)包括但不限于特定基因(或甲基化改變的DNA序列或CpG島)的PCR引物;優(yōu)化的PCR緩沖液和脫氧核苷酸;凝膠提取試劑盒;正對照引物;特定基因的Ms-SnuPE引物;反應(yīng)緩沖液(對于 Ms-SnuPE反應(yīng));和放射性核苷酸。此外,亞硫酸氫鹽轉(zhuǎn)變試劑可包括DNA變性緩沖液;磺化緩沖液;DNA回收試劑或試劑盒(例如,沉淀、超濾、親和柱);脫磺基緩沖液;和DNA回收組分。MSP (甲基化-特異性PCR)能評估CpG島內(nèi)基本上任何CpG位點簇(group)的甲基化狀況,而不依賴采用甲基化敏感的限制性內(nèi)切酶(Herman等.Proc. Nat. Acad. Sci. USA 93 :9821-9826,1996 ;美國專利第5,786,146號)。簡言之,通過亞硫酸氫鈉修飾DNA將未甲基化(但不是甲基化的)胞嘧啶轉(zhuǎn)變成尿嘧啶,隨后用甲基化DNA(而不是未甲基化的 DNA)的特異性引物擴增。MSP僅需微量DNA,靈敏度可達到(檢測出)對給定CpG島基因座等位基因0. 甲基化水平,可應(yīng)用于從石蠟包埋樣品提取的DNA。MSP分析所用的典型試劑(例如,可在典型MSP試劑盒中找到)包括但不限于特定基因(或甲基化改變的DNA 序列或CpG島)的甲基化和未甲基化PCR引物;優(yōu)化的PCR緩沖液和脫氧核苷酸;及特異性探針。MCA技術(shù)是可用于篩選甲基化模式改變的基因組DNA和分離與這些改變相關(guān)的特定序列的一種方法(Toyota等·,Cancer Res. 59 =2307-12,1999)。簡言之,先用對它們識別位點中胞嘧啶甲基化敏感性不同的限制性內(nèi)切酶消化原發(fā)性腫瘤、細胞系和正常組織的基因組DNA,再進行任意引發(fā)的PCR擴增。在高分辨聚丙烯酰胺凝膠上分辨PCR產(chǎn)物后,克隆并測序顯示甲基化狀況不同的片段。然后將克隆的片段用作Sourthern分析的探針,以證實這些區(qū)域的甲基化差異。MCA分析所用的典型試劑(例如,可在典型MCA試劑盒中找到)包括但不限于可任意引發(fā)基因組DNA的PCR引物;PCR緩沖液和核苷酸、限制性內(nèi)切酶和適當?shù)木彌_液;基因-雜交寡核苷酸或探針;對照雜交寡核苷酸或探針。分析甲基化位點的另一方法是引物延伸試驗,包括產(chǎn)生擴增靶序列以供隨后用質(zhì)譜法進行引物延伸基因型分析的優(yōu)化PCR擴增反應(yīng)。該試驗也可以多重方式進行。該方法 (特別是其與單核苷酸多態(tài)性基因分型相關(guān))的詳細描述參見PCT公布號W005012578A1和美國公布號US20050079521A1。對于甲基化分析,可用該試驗檢測依賴于C — T序列改變的亞硫酸氫鹽引入的甲基化。這些方法特別可用于在一個孔中進行多重擴增反應(yīng)和多重引物延伸反應(yīng)(例如,多重均相引物質(zhì)量延伸(hME)試驗)而進一步提高每次反應(yīng)引物延伸的通量和降低成本。DNA甲基化分析的四種其它方法包括限制性標記基因組掃描(RLGS, Costel Io等.,2000)、甲基化-敏感的-再現(xiàn)差異分析法(MS-RDA)、甲基化-特異性 AP-PCR (MS-AP-PCR)和用甲基-CpG結(jié)合功能域柱/分離部分解鏈的分子(MBD/SPM)??膳c本發(fā)明聯(lián)用的其它甲基化分析方法的描述參見以下論文Laird,P. W. Nature Reviews Cancer 3,253-266(2003) ;Biotechniques ;Uhlmann, K.等.Electrophoresis 23 :4072-4079 (2002) -PyroMeth ;Colella 等· Biotechniques. 2003年 7 月;35(1) :146-50 ; Dupont JM, Tost J, Jammes H,禾口 Gut IG. Anal Biochem,2004 年 10 月;333(1) :119-27; Tooke N 和 Pettersson M. IVDT. 2004 年 11 月;41。 多核苷酸序列的擴增和測定以甲基化差異模式分離核酸后,可對核酸作序列分析。此外,一旦測定到胎兒來源的一種特定基因組序列相比于母體序列高或低甲基化,即可測定該胎兒基因組序列的含量。然后,可比較該量與標準對照值,作為可能患有某些妊娠相關(guān)疾病的指標。A.擴增核苷酸序列在許多情況中,優(yōu)選用本領(lǐng)域熟知的幾種核酸擴增方法(上文和下文更詳細描述)之一擴增本發(fā)明核酸序列。具體地說,核酸擴增是酶促合成含有與所擴增核酸序列互補序列的核酸擴增子(拷貝)。當樣品中存在的靶序列含量非常低時,核酸擴增尤其有利。 通過擴增靶序列檢測合成的擴增子,試驗的靈敏度大大提高,因為試驗開始時只需要微量靶序列,因而能更好地確保檢測出樣品中屬于感興趣生物或病毒的核酸。研究中頻繁采用熟知的各種多核苷酸擴增方法。例如,本領(lǐng)域熟知用于多核苷酸序列擴增的聚合酶鏈式反應(yīng)(PCR)通用方法,本文不再贅述。PCR方法、方案和設(shè)計引物的原理的綜述可參見,例如hnis等.,《PCR方案方法與應(yīng)用指南》(PCR Protocols =A Guide to Methods and Applications),學(xué)術(shù)出版社有限公司(Academic Press, Inc.),紐約·, 1990。PCR試劑和方法也可購自商業(yè)零售商,例如羅氏分子系統(tǒng)公司(Roche Molecular Systems)。PCR常用熱穩(wěn)定性酶自動進行。在該方法中,反應(yīng)混合物的溫度在通過變性區(qū)、引物退火區(qū)和延伸反應(yīng)區(qū)時自動循環(huán)改變。可商品化購得專門適用于此目的的儀器。雖然通常用PCR擴增多核苷酸序列來實施本發(fā)明,但本領(lǐng)域技術(shù)人員知道可用任何已知方法,例如連接酶鏈式反應(yīng)(LCR)、轉(zhuǎn)錄介導(dǎo)的擴增和自身維持的序列反應(yīng)或核酸序列擴增(NASBA)來擴增母體血液樣品中發(fā)現(xiàn)的基因組序列,各方法均可提供充分的擴增。 可采用近年開發(fā)的分支DNA技術(shù)定量顯示代表特定甲基化模式的本發(fā)明特定基因組序列是否存在,或定量測定母體血液中該特定基因組序列的含量。分支DNA信號擴增直接定量測定臨床樣品核酸序列的綜述參見Nolte,Adv. Clin. Chem. 33 =201-235,1998。當用數(shù)字PCR實施時,本發(fā)明的組合物和方法也特別有用。數(shù)字PCR由Kalinina 與同事(Kalinina 等.,“采用 iTaciMan 檢測的納升規(guī)模 PCR(Nanoliter scale PCR with TaqMan detection) · ” Nucleic Acids Research. 25 ; 1999-2004,(1997))首先開發(fā),由 Vogelstein 和 Kinzler (數(shù)字 PCR(Digital PCR). Proc Natl Acad Sci U S Α. 96 ; 9236-41,(1999))進一步改進。將數(shù)字PCR應(yīng)用于胎兒診斷由Cantor等(PCT專利申請?zhí)?W005023091A2)首先描述,隨后由Quake等(美國專利公布號US 20070202525)描述,二者均通過引用納入本文。數(shù)字PCR的優(yōu)點是可在單分子水平上擴增核酸(DNA、cDNA或RNA), 為定量測定低拷貝數(shù)核酸提供了高靈敏方法。Fluidigm 公司要提供數(shù)字分析核酸的系統(tǒng)。B.測定多核苷酸序列多核苷酸序列測定的技術(shù)也是熟知的并在相關(guān)領(lǐng)域廣泛實施。例如,多核苷酸測序的基礎(chǔ)原理和通用技術(shù)描述于分子生物學(xué)和重組遺傳學(xué)的各種研究報告和論文,例如 Wallace等·,同上;Sambrook和Russell,同上;和Ausubel等·,同上。可采用研究實驗室常規(guī)使用的、手工或自動DNA測序方法實施本發(fā)明。適合檢測多核苷酸序列改變以實施本發(fā)明方法的其它方式包括但不限于質(zhì)譜法、引物延伸、多核苷酸雜交、實時PCR和電泳。引物延伸反應(yīng)也可應(yīng)用于本發(fā)明方法中。例如,引物延伸反應(yīng)的操作是,將脫氧核苷酸和/或二脫氧核苷酸(dideoxynucleotides)摻入與SNP位點毗鄰區(qū)域雜交的引物延伸引物,來區(qū)分SNP等位基因。用聚合酶延伸引物。用質(zhì)譜法或標記物(如生物素)物理檢測引物延伸的SNP。由于用特異性標記物標記互補脫氧核苷酸或二脫氧核苷酸,或產(chǎn)生具有特定質(zhì)量的引物延伸產(chǎn)物,只能延伸SNP位點,因而可區(qū)分并定量測定SNP等位基因。逆轉(zhuǎn)錄和擴增的核酸可以是修飾的核酸。修飾的核酸可包含核苷酸類似物,在某些實施方式中,包含可檢測標記物和/或捕捉劑??蓹z測標記物的例子包括但不限于熒光團、放射性同位素、比色劑、發(fā)光試劑、化學(xué)發(fā)光試劑、光散射試劑、酶等。捕捉劑的例子包括但不限于選自以下的成對結(jié)合試劑抗體/抗原、抗體/抗體、抗體/抗體片段、抗體/抗體受體、抗體/A蛋白或G蛋白、半抗原/抗-半抗原、生物素/親和素、生物素/鏈霉親和素、 葉酸/葉酸結(jié)合蛋白、維生素B12/內(nèi)因子、化學(xué)反應(yīng)基團/互補化學(xué)反應(yīng)基團(例如,巰基 /馬來酰亞胺、巰基/鹵代乙酰基衍生物、胺/異三氰酸鹽或酯(isotriocyanate)、胺/琥珀酰亞胺酯和胺/磺酰鹵)對等。在某些實施方式中,可將含捕捉試劑的修飾核酸固定于固體支持物。質(zhì)譜法是檢測本發(fā)明多核苷酸,例如PCR擴增子、引物延伸產(chǎn)物或從靶核酸切割下的檢測探針的特別有效的方法。通過比較所檢測信號的質(zhì)量與感興趣多核苷酸的預(yù)計質(zhì)量,可驗證多核苷酸序列的存在。特定多核苷酸序列的相對信號強度,例如光譜的質(zhì)量峰,可表明具體等位基因的相對群,從而能從數(shù)據(jù)直接計算出等位基因比例。采用 kquenom 標準iPLEX 試驗和MassARRAY· 技術(shù)的基因分型方法的綜述參見Jurinke,C., Oeth, P.,van den Boom, D.,“MALDI-TOF 質(zhì)譜法高性能 DNA 分析的通用工具(MALDI-T0F mass spectrometry -.a versatile tool for high-performance DNA analysis). "Mol. Biotechnol. 26,147-164 (2004);和 Oeth, P.等·,"iPLEX 試驗通過采用質(zhì)量修飾終止子的單堿基引物延伸提高了 MassARRAY 系統(tǒng)的叢集效率和靈活性(iPLEX Assay Increased Plexing Efficiency and Flexibility for MassARRAYSystem through single base primer extension with mass-modified Terminators. ) "SEQUEN0M Application Note Q005),二者均通過引用納入本文。利用能在擴增過程中切割和用質(zhì)譜法檢測的可切割檢測探針,檢測和定量測定靶核酸的綜述參見2007年12月4日提交的美國專利申請?zhí)?1/950, 395(通過引用納入本文)。測序技術(shù)的通量和成本正得到改進。測序技術(shù)能以高倍增數(shù)量級,平行測定從樣品中分離的許多核酸分子的序列(Dear Brief Funct Genomic Proteomic 2003 ; 1 397-416),所述技術(shù)例如可在妨4平臺(羅氏公司)(Margulies,M.等· 2005 Nature 437, 376-380)、11 Iumina基因組分析儀(或Solexa平臺)或SOLiD系統(tǒng)(應(yīng)用生物系統(tǒng)公司)上完成,或赫氏真實單分子DNA測序技術(shù)(Harris T D等· 2008Science,320,106-109)、太平洋生物科學(xué)公司的單分子、實時(SMRT. TM.)技術(shù)和納米孔測序(Soni GV和Meller A. 2007 Clin Chem 53 :1996-2001)。這些平臺各自能測序克隆擴增的或未擴增的核酸片段單分子。某些平臺包括,例如(i)通過連接染料修飾的探針測序(包括環(huán)狀連接和切割),( )高溫測序和(iii)單分子測序。為通過此類序列分析平臺分析核苷酸序列,可將核苷酸序列種類、擴增的核酸種類和從它們產(chǎn)生的可檢測產(chǎn)物視作“要研究的核酸”。連接測序是依賴于DNA連接酶對堿基對錯配敏感的一種核酸測序方法。DNA連接酶能將堿基配對正確的DNA 二末端連接在一起。聯(lián)合了 DNA連接酶只能將堿基配對正確的 DNA末端連接在一起和熒光標記寡核苷酸或引物的混合合并物通過檢測熒光而測定序列 (這二種功能)。通過納入含有可在標記物鑒定后被切割的可切割連接鍵的引物,可獲得對較長序列的讀取。切斷接頭除去標記物后在連接引物的一端再產(chǎn)生5’磷酸根,從而制備用于另一輪連接的引物。在一些實施方式中,可用一種以上熒光標記物(例如,1種熒光標記物,2、3或4種熒光標記物)標記這些引物。普通技術(shù)人員可用的基于連接測序的系統(tǒng)的一個例子通常包括以下步驟。在含有要研究的核酸(“模板”)、擴增反應(yīng)組分、珠和引物的乳化微量反應(yīng)器中制備克隆珠群。 擴增后,使模板變性,進行珠富集以分離含延伸模板的珠與不想要的珠(例如,含未延伸模板的珠)。所選珠上的模板經(jīng)歷3’修飾而共價結(jié)合于載玻片上,使修飾的珠沉積在載玻片上。沉積室能在珠加載過程中將載玻片區(qū)分成1、4或8個室。引物與銜接序列雜交以供序列分析。使一組四色染料標記的探針競爭與測序引物相連。通過查詢系列連接期間的每個第4和第5位堿基可實現(xiàn)探針連接的特異性。進行5-7輪連接、檢測和切割,記錄每個第五位的顏色以及所用文庫類型確定的循環(huán)輪次。每輪連接后,新的互補引物為另一系列的連接在5’方向補償加入一個堿基。重復(fù)引物復(fù)原和連接輪次(每輪5-7個連接循環(huán))5次, 產(chǎn)生含25-35個堿基對序列的單個標簽。用匹配的成對測序重復(fù)該過程產(chǎn)生第二標簽??捎么祟愊到y(tǒng)指數(shù)擴增本文所述方法產(chǎn)生的擴增產(chǎn)物,例如將異源核酸連接于本文所述方法產(chǎn)生的第一擴增產(chǎn)物,用與原用于產(chǎn)生第一擴增產(chǎn)物相同或不同的固體載體進行乳液擴增 (emulsion amplification).還可通過繞過指數(shù)擴增過程和直接分選載玻片上的固體載體,從而用此類系統(tǒng)分析本文所述方法直接產(chǎn)生的擴增產(chǎn)物。高溫測序是基于合成法測序的一種核酸測序方法,依賴于檢測摻入核苷酸后釋放的焦磷酸。合成法測序通常包括一次合成一個核苷酸,產(chǎn)生與所研究序列的鏈互補的DNA 鏈??蓪⒁芯亢怂峁潭ㄓ诠腆w載體,與測序引物雜交,與DNA聚合酶、ATP硫化酶、螢光素酶、核苷三磷酸二磷酸酶(apyrase)、腺苷5’磷酸和熒光素一起培育。依次加入和除去核苷酸溶液。正確摻入核苷酸釋放的焦磷酸在腺苷5’磷酸存在下與ATP硫化酶相互作用產(chǎn)生 ATP,加入熒光素反應(yīng)產(chǎn)生化學(xué)發(fā)光信號而能測定序列。
普通技術(shù)人員可用的基于高溫測序系統(tǒng)的例子,通常包括以下步驟將銜接核酸連接于要研究的核酸使要研究的核酸與珠雜交;擴增乳液中要研究的核酸的核苷酸序列;采用皮升多孔固體支持物分選珠;和用高溫測序方法測定擴增核苷酸的序列(例如, Nakano 等.,“利用油包水乳液的單分子 PCR(Single-molecule PCR using water-in-oil emulsion) "Journal of Biotechnology 102 :117-124(2003)) 可用此類系統(tǒng)指數(shù)擴增本文所述方法產(chǎn)生的擴增產(chǎn)物,例如將異源核酸連接于本文所述方法產(chǎn)生的第一擴增產(chǎn)物。某些單分子測序?qū)嵤┓绞揭罁?jù)合成法測序的原理,采用一對熒光共振能量轉(zhuǎn)移分子(一對FRET)作為成功摻入核苷酸導(dǎo)致光子發(fā)射的機制。常聯(lián)用增強的或高靈敏度的有色電荷-偶聯(lián)裝置與全內(nèi)反射顯微鏡(TRIM)來檢測發(fā)射的光子。光子僅在加入的反應(yīng)溶液所含的核苷酸正確摻入到測序過程中合成的延伸核酸鏈時才發(fā)射。在基于FRET的單分子測序中,能量通過長程偶極相互作用在兩種熒光染料(有時是含多個次甲基的花青染料Cy3與C0)之間轉(zhuǎn)移。供體受激發(fā)產(chǎn)生其特定波長的激發(fā)光,激發(fā)態(tài)能量非放射性地轉(zhuǎn)移給受體染料,后者進而被激發(fā)。受體染料通過放射性發(fā)射光子最終回歸其基態(tài)。在一對 FRET中,能量轉(zhuǎn)移過程中所用的兩種染料代表了這種“一對”。Cy3常用作供體熒光團,常摻入作為第一標記的核苷酸。Cy5常用作接受體熒光團,用作在摻入第一 Cy3標記的核苷酸后連續(xù)加入核苷酸的標記物。為成功轉(zhuǎn)移能量,各熒光團通常彼此在10納米以內(nèi)??捎玫幕趩畏肿訙y序系統(tǒng)的例子,通常包括使引物與要研究的核酸雜交以產(chǎn)生復(fù)合物,使該復(fù)合物結(jié)合于固相,用熒光分子標記的核苷酸迭代延伸引物,和捕捉每次迭代延伸后熒光共振能量轉(zhuǎn)移信號的圖像(參見,美國專利第7,169,314號;Braslavsky等., PNAS 100(7) :3960-3964(2003)).可利用此類系統(tǒng)直接測序本文所述方法產(chǎn)生的擴增產(chǎn)物。在一些實施方式中,使釋放的線形擴增產(chǎn)物與含有在固體支持物,例如珠或載玻片上的固定捕捉序列的互補序列的引物雜交。使引物-釋放的線形擴增產(chǎn)物的復(fù)合物與固定的捕捉序列雜交,將釋放的線形擴增產(chǎn)物固定于固體支持物以便用合成法進行一對FRET測序。 引物通常為熒光引物,因此可產(chǎn)生含有固定核酸載玻片表面的最初參比圖像。這種最初參比圖像可用于測定發(fā)生真實核苷酸摻入的位置。在“僅有引物”的參比圖像中最初未鑒定到但在陣列位置檢測到的熒光信號作為非特異性熒光棄去。當引物-釋放的線形擴增產(chǎn)物的復(fù)合物固定后,常通過以下迭代步驟平行測定結(jié)合核酸的序列a)在一種熒光標記核苷酸存在下進行聚合酶延伸,b)用合適的顯微鏡,例如TRIM檢測熒光,c)除去熒光核苷酸,和 d)重返用不同熒光標記的核苷酸步驟a。在一些實施方式中,可用固相單個核苷酸測序方法進行核苷酸測序。固相單個核苷酸測序方法包括在單分子的樣品核酸與單分子的固體支持物雜交條件下,使樣品核酸接觸固體支持物。此類條件可包括在“微型反應(yīng)器”中提供固體支持物分子和單分子樣品核酸。此類條件還包括提供混合物,該混合物中樣品核酸分子與固體支持物上的固相核酸雜交??捎糜诒疚乃鰧嵤┓绞街械膯蝹€核苷酸測序方法參見2008年1月17日提交的美國臨時專利申請序列號61/021,871的描述。在某些實施方式中,納米孔測序檢測方法包括(a)使測序核酸(“基礎(chǔ)核酸”,如連接的探針分子)接觸序列特異性檢測序列(detector),在檢測序列特異性雜交基礎(chǔ)核酸的基本互補子序列的條件下進行接觸;(b)檢測該檢測序列的信號和(c)根據(jù)檢測到的信號測定基礎(chǔ)核酸的序列。在某些實施方式中,當檢測序列在基礎(chǔ)核酸通過孔時受納米孔
30結(jié)構(gòu)的干擾,因而與基礎(chǔ)核酸雜交的該檢測序列從基礎(chǔ)核酸上解離(例如,依次解離)下來,從而可檢測到與基礎(chǔ)序列解離的該檢測序列。在一些實施方式中,與基礎(chǔ)核酸解離的檢測核酸發(fā)出可檢測信號,而與基礎(chǔ)核酸雜交的檢測核酸發(fā)出不同的可檢測信號或無可檢測信號。在某些實施方式中,核酸(例如,連接的探針分子)中的核苷酸被對應(yīng)于特定核苷酸(“核苷酸代表”)的特定核苷酸序列取代,從而產(chǎn)生擴展的核酸(參見,美國專利第6,723,513號),檢測序列可與用作基礎(chǔ)核酸的這種擴展核酸中的代表性核苷酸雜交。 在此類實施方式中,可將代表性核苷酸排列成二元或更高元排列(例如,Soni和Meller, Clinical Chemistry 53(11) 1996-2001 (2007))。在一些實施方式中,不擴展核酸、不產(chǎn)生擴展的核酸而直接用作基礎(chǔ)核酸(例如,連接的探針分子用作未擴展的基礎(chǔ)核酸),檢測序列與基礎(chǔ)核酸直接接觸。例如,第一檢測序列可與第一子序列雜交,第二檢測序列與第二子序列雜交,所述第一檢測序列和第二檢測序列各自含有彼此可區(qū)分的可檢測標記,當檢測序列與基礎(chǔ)核酸解離時,可彼此區(qū)分第一檢測序列與第二檢測序列的信號。在某些實施方式中,檢測序列包含能與基礎(chǔ)核酸雜交的區(qū)域(例如,兩個區(qū)域),長度可以是約3-100個核苷酸(例如,長約 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、 55、60、65、70、75、80、85、90或95個核苷酸)。檢測序列還可包含不與基礎(chǔ)核酸雜交的一個或多個核苷酸區(qū)域。在一些實施方式中,檢測序列是分子信標。檢測序列常包含一個或多個獨立選自本文所述的可檢測標記??捎媚軝z測各標記產(chǎn)生的信號(例如,磁、電、化學(xué)、光等信號)的任何方便檢測方法檢測各可檢測標記。例如,可用CD照相機檢測與檢測序列相連的一個或多個可區(qū)分量子點的信號。在某些序列分析實施方式中,可利用讀數(shù)(read)構(gòu)建較大的核苷酸序列,通過鑒定不同讀數(shù)中的重疊序列和利用讀數(shù)鑒定序列有助于此種分析。普通技術(shù)人員知道從讀數(shù)構(gòu)建較大序列的此類序列分析方法和軟件(例如,Venter等.,Science 291 1304-1351(2001))。在某些序列分析實施方式中,可比較樣品核酸中核苷酸序列之間的具體讀數(shù)、部分核苷酸序列構(gòu)建物和全部核苷酸序列構(gòu)建物(即,內(nèi)部比較),或可與參比序列比較(即,參考比較)。有時在樣品核酸是從多份樣品或從含序列變異的單一樣品來源制備的情況下進行內(nèi)部比較。有時在參比核苷酸序列已知和比較的目的是為了測定樣品核酸是否含有與參比核苷酸序列基本上相似或相同或不同的核苷酸序列時進行參考比較。本領(lǐng)域普通技術(shù)人員知道用序列分析設(shè)備和組件有助于序列分析。本文提供的方法能高通量地檢測多種核酸中的核酸物質(zhì)(例如,核苷酸序列物質(zhì)、擴增的核酸物質(zhì)和上述產(chǎn)生的可檢測產(chǎn)物)。多重指同時檢測一種以上的核酸物質(zhì)。已知道聯(lián)合進行多重反應(yīng)與質(zhì)譜法的通用方法(參見,例如美國專利號6,043,031、 5,M7,835和國際PCT申請?zhí)朩O 97/37041)。多重提供的優(yōu)點是,與對每種靶核酸物質(zhì)必須分別進行質(zhì)譜分析相比,可用最少一次的質(zhì)譜鑒定多種核酸物質(zhì)(例如,具有不同序列變異的一些核酸)。在一些實施方式中,本文提供的方法是高速、高精確分析序列變異的高通量、高自動化方法。在一些實施方式中,本文的方法可在一次反應(yīng)中高水平地多重檢測。在某些實施方式中,多重檢測的核酸物質(zhì)數(shù)包括但不限于約1-500種(例如,約
1-3,3--5、5-7、'7-9>9-11,1卜13、13-15、15-17、17-19、19-21、2 卜23、23-25,25--27、,27--29、29-31>31-33、33--35,35-37,37-39,39-41,41-43,43-45,45-47,47--49,49--51、51--53、53-55,55--57、57--59,59-61、61-63、63-65、65-67、67-69、69-71、71--73,73--75、75--77、77-79,79--81、81-83,83--85,85-87>87--89、89-91、,91-(33,93-95、95-97,97--101、,101--103、103--105、105--107、107--109、109-■111>111--113、113--115、115--117、117--119、121--123、123--125、125--127、127--129、129--131,131--133、133--135、135--137、137--139、139--141、141--143、143--145、145--147、147--149,149--151、151--153、153--155、155--157、157--159、159--161、161--163、163--165、165--167,167--169、169--171、171--173、173--175、175--177、177--179、179.-181、181--183、183-.185,185--187、187--189、189--191、191--193、193--195、195--197、197--199、199--201、201-■203,203--205、205--207、207--209、209--211、211--213、213--215、215--217、217--219、219--221,221--223、223--225、225--227、227--229、229--231、231--233、233--235、235--237、237--239,239--241、241--243、243--245、245--247、247--249、249--251、251--253、253--255、255--257,257--259、259--261、261--263、263--265、265--267、267--269、269-271、271--273、273--275,275--277、277.-279、279--281、281--283、283--285、285--287、287--289、289--291、291-■293,293--295、295--297、297--299、299--301、301--303、303--305、305--307、307--309、309-■311,311--313、313--315、315--317、317--319、319--321、321--323、323--325、325--327、327--329,329--331、331--333、333--335、335--337、337--339、339--341、341--343、343--345、345--347,347--349、349--351、351--353、353--355、355--357、357--359、359-361、361--363、363--365,365--367、367.-369、369--371、371--373、373--375、375--377、377.-379、379--381、381-383,383--385、385--387、387--389、389--391、391--393、393--395、395--397、397--401、401-■403,403--405、405--407、407--409、409--411、411--413、413--415、415--417、417--419、419--421,421--423、423--425、425--427、427--429、429--431、431--433、433--435、435--437、437--439,439--441、441--443、443--445、445--447、447--449、449--451、451--453、453--455、455--457,457--459、459--461、461--463、463--465、465--467、467--469、469.-471、471--473、473--475,475--477、477.-479、479--481、481--483、483--485、
485-487、487-489、489-491、491-493、493-495、495-497、497-501)。用多重試驗獲得質(zhì)譜分辨的設(shè)計方法可包括但不限于引物和寡核苷酸的設(shè)計方法及反應(yīng)設(shè)計方法。參見,例如表X和Y中提供的多重方案。對于多重試驗中的引物和寡核苷酸設(shè)計,可將設(shè)計引物的同一通用指南應(yīng)用于單重反應(yīng)(uniplexed reaction),例如避免假的引發(fā)和引物二聚體,單重反應(yīng)僅涉及較多引物。對于質(zhì)譜法應(yīng)用,一次試驗質(zhì)譜圖中的分析物峰足以與該多重試驗中的任何試驗的產(chǎn)物相分辨,包括間歇峰和任何其它副產(chǎn)物峰。分析物峰還任選可落在用戶指定的質(zhì)量窗內(nèi),例如5,000-8,500Da范圍內(nèi)。在一些實施方式中,例如,多重分析適合于用質(zhì)譜法檢測染色體異常。在某些實施方式中,多重分析適合于本文所述的各種單個核苷酸測序或納米孔測序方法。可利用商品化生產(chǎn)的微型反應(yīng)室或裝置或陣列或芯片促進多重分析,它們可商品化購得。檢測胎兒非整倍性對于檢測胎兒非整倍性,一些方法依賴于檢測母體與父體遺傳等位基因之間的比例。然而,母體提供的非細胞核酸損害了定量測定染色體改變的能力,從而需要先去除樣品中的母體DNA再檢測。有希望的方法利用胎兒DNA與母體DNA大小分布的不同,或檢測胎兒專門表達的RNA(參見,例如通過引用納入本文的美國專利申請?zhí)?1/384128,其公布號為US20060252071)。假定胎兒DNA僅占母體血漿中所有非細胞DNA的約5 %,在三體性樣品與健康對照之間該比例的差異從1. 6%降低至僅約1. 2%。因此,可靠地檢測等位基因比
32例的變化需要富集非細胞DNA中的胎兒組分,例如采用本發(fā)明的組合物和方法。 一些方法依賴于檢測母體與父體遺傳等位基因之比例來檢測母體血漿中的胎兒染色體非整倍性。二倍體產(chǎn)生1 1比例,而三體檢測為2 1比例。由于統(tǒng)計學(xué)取樣的血漿樣品中胎兒DNA豐度低、存在過量的母體DNA和檢測技術(shù)的變異,從而損害了對這種差異的檢測。采用高精度檢測方法,例如數(shù)字PCR或質(zhì)譜法解決了后一問題。目前通過尺寸排阻去除母體DNA或關(guān)注胎兒特異性核酸(例如胎兒表達的RNA)實現(xiàn)了富集樣品中非細胞DNA的胎兒組分。胎兒DNA的另一可區(qū)別性特征是其DNA甲基化模式。因此,本文提供的新型組合物和方法可根據(jù)胎兒與母親DNA之間的甲基化差異精確定量測定胎兒核酸。該方法依賴于靈敏的絕對拷貝數(shù)分析來定量測定母體樣品的胎兒核酸部分,從而能產(chǎn)前檢測出胎兒性狀。本發(fā)明方法已鑒定到基因組中母體與胎兒DNA之間甲基化有差異的約3000 個富含CpG的區(qū)域。選出的區(qū)域在所有檢測的樣品中顯示高度保守的甲基化差異。此外, 該組區(qū)域富含發(fā)育中至關(guān)重要的調(diào)控基因,表明這些區(qū)域的外遺傳學(xué)調(diào)控是生物學(xué)相關(guān)的恒定過程(參見表3)?,F(xiàn)在利用我們的MBD-FC蛋白捕捉非細胞DNA(例如,基本上所有的非細胞DNA)來富集胎兒DNA,然后用高鹽濃度洗脫高度甲基化的DNA組分。采用低鹽洗脫組分,MBD-FC也同樣能富集未甲基化的胎兒DNA。本發(fā)明提供了染色體13、18和21上經(jīng)過證實的63個基因組區(qū)域,這些區(qū)域的母體甲基化水平低而胎兒甲基化水平高。捕捉這些區(qū)域后,可用SNP測定上述等位基因的比例。當采用高頻率SNP時,必須檢測約10種標記以高可信度地發(fā)現(xiàn)至少一個SNP,其雙親具有相反的純合基因型,孩子具有雜合基因型。在另一實施方式中,提供檢測染色體異常的方法采用定量測定絕對拷貝數(shù)。二倍體染色體組在所有染色體中顯示相同數(shù)量拷貝的差異甲基化區(qū)域,但是,例如三體性21樣品顯示染色體21上甲基化差異區(qū)域的拷貝數(shù)多1. 5倍。采用未改變的常染色體作參比(本文也提供了-見表1),可將二倍體染色體組的基因組DNA含量歸一(標準)化。與其它方法相當,用一種標記不大可能足以檢測這種差異,因為總拷貝數(shù)低。妊娠10-12周時,Iml母體血漿中通常含有約100-200拷貝的胎兒DNA。然而,本發(fā)明方法提供了能高度可靠地區(qū)分二倍體染色體組與非整倍性染色體組的富余可檢測標記。數(shù)據(jù)處理和鑒定染色體異常存在與否本文所用的術(shù)語“檢測”染色體異常,指通過處理數(shù)據(jù)來鑒定染色體失衡,所述數(shù)據(jù)得自擴增的核酸物質(zhì)、核苷酸序列物質(zhì)或以上產(chǎn)生的可檢測產(chǎn)物(統(tǒng)稱為“可檢測產(chǎn)物”)的檢測組??捎萌魏魏线m的檢測裝置和方法區(qū)分一組或多組本文所述的可檢測產(chǎn)物。 可將是否存在染色體異常的結(jié)果以任何合適形式表示,包括但不限于與對象或樣品存在染色體異常相關(guān)的概率(例如,勝算比、P-值)、可能性、百分比、閾值以上的數(shù)值或危險系數(shù)。在某些實施方式中,可以提供結(jié)果與靈敏度、特異性、標準偏差、變異系數(shù)(cv)和/或置信水平中的一種或多種,或它們的組合??筛鶕?jù)一種或多種計算的變量,包括但不限于靈敏度、特異性、標準偏差、變異系數(shù)(CV)、閾值、置信水平、評分、概率和/或它們的組合鑒定的一組或多組可檢測產(chǎn)物,來檢測染色體異常。在一些實施方式中,部分或完全根據(jù)一種或多種此類計算的變量來確定 (i)用于診斷方法所選的組數(shù),和/或(ii)用于診斷方法所選各組的具體核苷酸序列種類。在某些實施方式中,將靈敏度、特異性和/或置信水平中的一個或多個表示為百分比。在一些實施方式中,各變量獨立的百分比高于約90% (例如,約90、91、92、93、94、95、 96、97、98或99%,或高于99% (例如,約99. 5%或更高、約99. 9%或更高、約99. 95%或更高、約99. 99%或更高))。在一些實施方式中,變異系數(shù)(CV)表示為百分比,有時該百分比約為10%或更低(例如,約10、9、8、7、6、5、4、3、2或1%,或低于1% (例如,約0.5%或更低、約0. 或更低、約0.05%或更低、約0.01%或更低))。在某些實施方式中,概率(例如,某算法測定的并非隨機的具體結(jié)果)表示為P-值,有時P-值約為0. 05或更低(例如, 約0. 05,0. 04,0. 03,0. 02或0. 01,或低于0. 01 (例如,約0. 001或更低、約0. 0001或更低、 約0. 00001或更低、約0. 000001或更低))。 例如,“評分”指計算對象/樣品中特定染色體異常是否實際存在的概率??衫迷u分值測定,例如,對應(yīng)于實際染色體異常的擴增的可檢測核酸產(chǎn)物的變異、差異或比例。 例如,從可檢測產(chǎn)物計算出正值時,可鑒定到與單樣品分析特別相關(guān)的染色體異常。在某些實施方式中,模擬數(shù)據(jù)可能有助于數(shù)據(jù)處理,例如通過訓(xùn)練某算法或檢驗?zāi)乘惴ā@?,模擬數(shù)據(jù)可能涉及血清、血漿等中胎兒和母體核酸濃度不同的各種假定樣品。模擬數(shù)據(jù)可根據(jù)實際人群中可能的預(yù)測到的數(shù)據(jù),或根據(jù)模擬數(shù)據(jù)集被歪斜(skewed) 以檢驗?zāi)乘惴ê?或指定正確的分類。本文也將模擬數(shù)據(jù)稱為“虛擬”數(shù)據(jù)。可將樣品中胎兒/母體貢獻模擬成數(shù)字表格或陣列(例如,對應(yīng)于參比生物分子或擴增核酸序列切割產(chǎn)物質(zhì)量信號的峰列表),質(zhì)譜圖,凝膠上的條帶模式,或檢測質(zhì)量分布任何技術(shù)的代表圖。 大多數(shù)情況中用計算機程序進行模擬。利用模擬數(shù)據(jù)集的一個可能步驟是評估鑒定結(jié)果的置信度,即,所選的陽性/陰性值與樣品如何良好匹配和是否有其它變異。常用的方法是計算概率值(P-值),該值預(yù)測隨機樣品具有優(yōu)于所選樣品的評分的概率。由于某些情形可能禁止計算P-值,可評估經(jīng)驗?zāi)P?,其中假定至少一個樣品匹配參比樣品(具有或不具有分辨的差異)?;蛘?,可采用其它分布,例如泊松分布描述概率分布。在某些實施方式中,算法可給計算出的真陽性、正陰性、假陽性和假陰性值指定置信度值。也可根據(jù)確定的概率模型指定發(fā)生染色體異常的可能性。常采用硅技術(shù)(in silico)方法產(chǎn)生模擬數(shù)據(jù)。本文所用的術(shù)語“硅技術(shù)”指用計算機進行研究和實驗。硅技術(shù)方法包括但不限于分子建模研究、核型研究、遺傳計算、生物分子對接實驗和分子結(jié)構(gòu)和/或過程,例如分子相互作用的虛擬表現(xiàn)。本文所用的“數(shù)據(jù)處理程序”指某一過程,其可體現(xiàn)為軟件,測定所得數(shù)據(jù)(即,試驗的最終結(jié)果)的生物學(xué)顯著性。例如,數(shù)據(jù)處理程序可根據(jù)收集的數(shù)據(jù)測定各核苷酸序列種類的含量。數(shù)據(jù)處理程序還可根據(jù)測定的結(jié)果控制儀器和/或數(shù)據(jù)收集程序。常集成數(shù)據(jù)處理程序和數(shù)據(jù)收集程序,并提供反饋以通過儀器操控數(shù)據(jù)獲取,從而提供了本文的基于試驗的判斷方法。本文所用的軟件指用計算機執(zhí)行時可實施計算機操作的計算機可讀程序指令。提供的軟件通常是含有記錄在計算機可讀介質(zhì)上的程序指令的程序產(chǎn)品,所述介質(zhì)包括但不限于磁性介質(zhì),包括軟盤、硬盤和磁帶;光學(xué)介質(zhì),包括⑶-ROM盤、DVD盤、磁盤和記錄程序指令的其它此類介。預(yù)測異?;蛘5牟煌椒僧a(chǎn)生不同類型的結(jié)果。對于任何給定的預(yù)測,結(jié)果類型可能有四種真陽性、真陰性、假陽性或假陰性。本文所用的術(shù)語“真陽性”指對象正確診斷為染色體異常。本文所用的術(shù)語“假陽性”指對象錯誤鑒定為染色體異常。本文所用的術(shù)語“真陰性”指對象正確鑒定為無染色體異常。本文所用的術(shù)語“假陰性”指對象錯誤鑒定為無染色體異常??筛鶕?jù)以下比例計算出衡量任何給定方法性能的兩種參數(shù)(i)靈敏度值(sensitivity value),正確鑒定為陽性的預(yù)測陽性百分數(shù)(例如,通過水平比較檢測 /測定正確鑒定為表示染色體異常的核苷酸序列組相對于正確或錯誤鑒定的所有核苷酸序列的百分數(shù)),從而反映檢測染色體異常結(jié)果的精確度;和(ii)特異性值(specificity value),正確鑒定為陰性的預(yù)測陰性百分數(shù)(例如,通過水平比較檢測/測定正確鑒定為表示染色體正常的核苷酸序列組相對于正確或錯誤鑒定的所有核苷酸序列的百分數(shù)),從而反映檢測染色體異常結(jié)果的精確度。
實施例
僅通過說明的方式、而非限制的方式提供以下實施例。本領(lǐng)域技術(shù)人員不難了解, 可改變或改進各種非關(guān)鍵參數(shù)而獲得基本相同或相似的結(jié)果。在以下實施例1中,申請人聯(lián)用捕捉甲基化DNA的新型融合蛋白與CpG島陣列,來鑒定胎盤組織與母體血液之間甲基化有差異的基因組區(qū)域。采用嚴格的統(tǒng)計學(xué)方法只能選出樣品之間顯示差異不大的區(qū)域,因而提示可能存在有潛在的生物學(xué)機制。驗證了主要位于染色體13、18和21上的85個甲基化有差異的基因組區(qū)域。此驗證采用定量質(zhì)譜方法查詢覆蓋這些85個區(qū)域的261個PCR擴增子。結(jié)果有非常好的一致性(95%確認),證明該方案可行。隨后申請人提供檢測非整倍性的改進方案,依賴于檢測絕對拷貝數(shù)而非等位基因比例。實施例1在以下實施例中,用10對母體和胎盤DNA樣品來鑒定甲基化差異區(qū)域。采用基于質(zhì)譜法的定量測定甲基化試驗驗證這些結(jié)果。首先提取母體血沉棕黃層和相應(yīng)胎盤組織的基因組DNA。隨后用MBD-FC捕捉各DNA樣品的甲基化組分。參見圖1_3。兩種組織組分用不同熒光染料標記后與Agilent CpG島微陣列雜交。參見圖4。進行該操作以鑒定可用于產(chǎn)前診斷的甲基化差異區(qū)域。因此,采用以下兩個標準來選擇基因組區(qū)域作為潛在的富集標記觀察到的甲基化差異必須存在于所有檢驗的配對樣品中,和該區(qū)域的長度必須超過 200bp。DNA制備和片段化分別用德國希爾頓Qiagen 的QIAamp DNA迷你試劑盒 和QIAamp DNA血液迷你試劑盒 制備母體血沉棕黃層和胎盤組織的基因組DNA (gDNA)。對于MCIp,用NanoDrop ND 1000 分光光度計(Thermo Fisher 沃爾瑟姆,馬薩諸塞州,美國)定量測定gDNA。采用以下設(shè)置,用Branson數(shù)字超聲儀450 (丹伯里,康涅狄格州,美國),在500 μ 1 TE緩沖液中將2. 5μ g DNA超聲處理成平均大小為300-500bp的片段振幅20%、超聲時間110秒、 脈沖開/脈沖關(guān)時間1. 4/0. 6秒。采用凝膠電泳監(jiān)測片段范圍。甲基-CpG的免疫沉淀將每份樣品、56 μ g純化的MBD-Fc蛋白和150 μ 1 A蛋白瓊脂糖4速流珠 (Amersham Biosciences ,皮斯卡塔韋,新澤西州,美國)在15ml TBS中4°C搖動過夜。然后將MBD-Fc珠(150微升/試驗)轉(zhuǎn)移分散在2mlUltrafree-CL離心過濾裝置(Millipore ,比爾里卡,馬薩諸塞州,美國)中,用緩沖液A(20mM Tris-HCl, pH8. 0,2mM MgCl2,0. 5mM EDTA 300mM NaCl,0. 1 % NP-40)離心洗滌三次。將超聲處理的DNA(2 μ g)加入2ml含經(jīng)過洗滌的MBD-Fc珠的緩沖液A中,4°C搖動3小時。離心珠回收未結(jié)合的DNA片段(300mM組分),然后用NaCl濃度遞增(400、500、550、600和IOOOmM)的600 μ 1緩沖液洗滌各兩次。 將各洗滌步驟的流穿液收集在不同試管中,用MinElute PCR純化試劑盒 (Qiagen啦)脫鹽。用MinElute PCR純化試劑盒TM(Qiagen )平行處理200ng經(jīng)過超聲的輸入DNA。微陣列操作和分析為產(chǎn)生熒光標記的DNA以供微陣列雜交,混合每份樣品的600mM和IMNaCl組分 (富集的甲基化DNA),用BioPrime總基因組標記系統(tǒng) (Invitrogen卡爾斯巴德,加利福尼亞州,美國),以 Alexa Fluor555-aha_dCTP (母體)或 Alexa Fluor 647-aha-dCTP (胎盤)標記。按照生產(chǎn)商手冊進行標記反應(yīng)?;旌掀ヅ涞哪阁w/胎盤對的不同標記的基因組 DNA 片段至終體積為 80 微升,添加 50 μ g Cot-I DNA(Invitrogen )、52 μ 1 AgilentlOX 封閉試劑(Agilent Technologies ,圣克拉拉,加利福尼亞州,美國)、78μ 1去離子甲酰胺和260 μ 1 Agilent 2X雜交緩沖液。將樣品加熱至95°C,3分鐘,混合,隨后37°C溫育30分鐘。然后用Agilent SureHyb 室和Agilent雜交烘箱,在Agilent CpG島微陣列試劑盒 上67°C雜交40小時。室溫用洗滌液I (6X SSPE,0. 005% N-月桂酰肌氨酸)洗滌載玻片5 分鐘,37°C用洗滌液II(0.06X SSPE)再洗滌5分鐘。然后將載玻片分別浸在乙腈和Agilent Ozone保護溶液 中各30秒。用Agilent DNA微陣列掃描儀 立即掃描圖像并分析。用特質(zhì)提取軟件9. 5版和標準CGH方案處理微陣列圖像。亞硫酸氫鹽處理用加利福尼亞州橙縣ZR 公司(ZymoResearch,Orange County, CA)的 EZ-96DNA 甲基化試劑盒 進行基因組DNA亞硫酸氫鈉轉(zhuǎn)變。利用1微克基因組DNA,遵循生產(chǎn)商的方案和備選的轉(zhuǎn)變方案(兩種DNA變性溫度)。甲基化定量分析用塞昆納姆股份有限公司(Sequenom)的MassARRAY 系統(tǒng)進行甲基化定量分析。該系統(tǒng)聯(lián)用基質(zhì)輔助激光解吸電離飛行時間(MALDI-T0F)質(zhì)譜法與RNA堿基特異性切割(Sequenom . MaSSCLEAVE )。然后分析甲基化狀況的可檢測模式。用Sequenom . EpiDESIGNER (www. epidesigner. com)設(shè)計PCR引物。經(jīng)驗證總共采用261個擴增子,覆蓋 85個靶區(qū)域(擴增長度中值=367bp,最小=108,最大=500 ;每個擴增子CpG的中值數(shù)= 23,最小=4,最大=65)。對于各反向引物,加入額外的T7啟動子標簽以供體內(nèi)轉(zhuǎn)錄以及在正向引物上加入10聚體標簽以調(diào)節(jié)解鏈溫度差異。如前人所述(Ehrich M等.(2005)“通過堿基特異性切割和質(zhì)譜法進行DNA甲基化模式的定量高通量分析”(Quantitative high-throughput analysis of DNA methylation patterns by base specific cleavage and mass spectrometry). Proc Natl Acad Sci USA 102:15785-15790)進行 MassCLEAVE (tm)生物化學(xué)試驗。用 MassARRAY Compact MALDI-T0F (Sequenom ,圣迭戈) 獲得質(zhì)譜圖,用EpiTYPER 軟件1. 0版(Sequenom. ,圣迭戈)產(chǎn)生甲基化比例。統(tǒng)計學(xué)分析用R統(tǒng)計學(xué)軟件包(www, r-proiect. org)進行所有統(tǒng)計學(xué)計算。首先根據(jù)探針的基因組位置將陣列探針分組。將相距小于IOOObp的子序列探針分成一組。為鑒定甲基化差異區(qū)域,用對照樣品作參比。在對照樣品中,血液衍生對照DNA的甲基化組分可自身雜交。該樣品理想地應(yīng)顯示兩種顏色通道的對數(shù)比例約為O。然而,由于雜交行為的變異,探針顯示平均對數(shù)比例為0. 02,標準偏差為0. 18。然后將我們樣品中觀察到的對數(shù)比例與對照樣品作比較。采用雙向配對t-檢驗,檢驗相同各組的NULL假設(shè)。分析中排除含有少于 4個探針的各組。對于包含4或5個探針的各組,將所有探針用于成對t-檢驗。對于含6 或更多個探針的各組,采用一次含5個探針的滑動窗檢驗(sliding window test),每次增減一個探針移動該窗口。將各測試樣品與對照樣品作比較,記錄P-值。如果10份樣品中有8份顯示ρ值< 0. 01,或者如果10份樣品中有6份顯示ρ值< 0. 001,所選出的基因組區(qū)域是甲基化差異區(qū)域。當該組少于8份樣品顯示ρ值< 0. 01,或者少于6份樣品顯示ρ 值< 0. 001時,將該基因組區(qū)域分類為甲基化無差異區(qū)域。分析中排除不屬于這二種類別的樣品。 對于鑒定為甲基化差異的基因組區(qū)域子集,用定量甲基化分析證實其結(jié)果。Gostat X^r (http//gostat. wehi. edu. au/cgibin/-goStat. pi) Go分析。用費希爾精確檢驗(Fisher’ s exact test)計算P值?;谖㈥嚵袠擞洶l(fā)現(xiàn)的結(jié)果為鑒定甲基化差異的區(qū)域,采用其中可自身雜交的單核細胞的甲基化DNA組分作為標準樣品。該標準品為基因組區(qū)域中的熒光檢測的變異性提供了參比品。然后通過比較 10份胎盤/母體樣品各自的對數(shù)比例與該標準品,可鑒定出甲基化差異區(qū)域。因為本項研究的目的是鑒定能可靠地分離母體與胎兒DNA的標記,分離目標限于在基因組DNA連續(xù)延伸段上顯示有穩(wěn)定一致甲基化差異的基因。如此將分析集中在多個探針表明甲基化有差異的基因組區(qū)域。這種選擇也局限于所有樣品顯示甲基化有差異的目標區(qū)域,排除個體間差異強的那些區(qū)域。微陣列分析中,兩份樣品均顯示對數(shù)比例較低。由于為選擇目標采用了配對檢驗,這不會負面影響結(jié)果。根據(jù)這些選擇標準,鑒定到母體與胎兒DNA之間甲基化有差異的3043個基因組區(qū)域。21778個區(qū)域不顯示甲基化有差異。在甲基化有差異區(qū)域的分布中未觀察到染色體間偏向。甲基化差異區(qū)域位于2159個已知基因之后或其中。大多數(shù)甲基化差異區(qū)位于啟動子區(qū)域(18% )和編碼區(qū)內(nèi)(68% ),而只有少數(shù)甲基化差異區(qū)位于基因的下游(7% )或啟動子轉(zhuǎn)換為編碼區(qū)的區(qū)域中(7%)。啟動子(13%)和下游(5%)位置的甲基化無差異區(qū)域顯示相類似的分布,但位于啟動子轉(zhuǎn)換為編碼區(qū)的區(qū)域百分數(shù)較高(39% ),位于編碼區(qū)內(nèi)的百分數(shù)較低(43%)。業(yè)已證明,胚胎干細胞(ES)富含的polycomb抑制性復(fù)合物2 (PRC2)靶向的基因是調(diào)控發(fā)育的基因(Lee TI等,(2006) “在人胚胎干細胞中Polycomb是控制發(fā)育的調(diào)節(jié)劑” (Control of developmental regulators by Polycomb in human embryonic stem cells. )Cell 125:301-313)。也已證明許多癌癥類型中,PRC2靶向的基因是富含甲基化差異的基因(Ehrich M等,(2008) “癌細胞系的甲基化胞嘧啶的分布模式”(Cytosine methylation profiling of cancer cell lines. )Proc NatlAcad Sci USA 105 4844-48)。在本項研究中,PRC2靶向的基因,也是富含鑒定為甲基化有差異的一組基因 (P-值<0.001,勝算比=3. 6,勝算比的95% CI = 3. 1-4.2)。該組甲基化差異基因的GO 分析顯示,該組顯著富含發(fā)育期間功能至關(guān)重要的基因。10個最富含基因中6個的功能包括調(diào)節(jié)發(fā)育或形態(tài)學(xué)過程[解剖學(xué)結(jié)構(gòu)形態(tài)發(fā)生(G0 =0009653, ρ值=0)、發(fā)育過程(G0 0032502,ρ 值=0)、多細 胞機體發(fā)育(GO =0007275, ρ 值=0)、器官發(fā)育(GO =0048513, ρ 值 =0)、系統(tǒng)發(fā)育(GO =0048731, ρ值=0)和解剖學(xué)結(jié)構(gòu)發(fā)育(GO =0048856, ρ值=0)的基因]。用Sequenom EpiTYPER 驗證為驗證該微陣列的發(fā)現(xiàn),選擇染色體13、18和21的63個區(qū)域和其它常染色體的 26個區(qū)域,用不同技術(shù)驗證。采用Sequenom EpiTYPER 技術(shù)定量檢測母體與胎盤樣品的甲基化 DNA。EpiTYPER 方法的解釋可參見 Ehrich M, Nelson MR, Stanssens P, Zabeau Μ, Liloglou Τ, Xinarianos G, Cantor CR, Field JK, van den Boom D(2005) "ililMS 特異性切割和質(zhì)譜法定量高通量分析DNA甲基化模式”(Quantitative high-throughput analysis of DNA methylation patterns by base specific cleavage and mass spectrometry). Proc Natl Acad Sci U S A 102:15785-15790)。計算出所有母親 DNA 樣品和所有胎盤樣品靶區(qū)域中各CpG位點的甲基化平均值。然后將母親與胎盤甲基化的平均差異與微陣列的結(jié)果作比較。兩種技術(shù)所得結(jié)果非常一致(參見圖7)。85個靶區(qū)域定量測定的結(jié)果確認了微陣列的結(jié)果(95%確認率)。未能確認均位于染色體18上的4個靶區(qū)域的結(jié)果。該偏差的原因尚未知。與微陣列集中關(guān)注鑒定甲基化差異相反,定量檢測DNA甲基化能分析絕對甲基化值。在85個確認甲基化有差異區(qū)域的驗證組中,母體DNA樣品中26區(qū)域的亞組和胎盤樣品中59區(qū)域的亞組甲基化程度較高(參見,表1)。令人感興趣的是,胎盤樣品中低甲基化的基因傾向顯示甲基化差異大于胎盤樣品中高甲基化的基因(低甲基化基因的甲基化差異中值=39%,高甲基化基因=20% )0實施例2實施例2描述了檢測母體樣品中胎兒核酸含量的非侵入性方法(本文稱為“胎兒定量方法”),該方法可用于檢測或確認胎兒性狀(例如,胎兒性別的RhD相容性)或診斷染色體異常,例如三體性21 (本文將二者均稱為“基于甲基化的胎兒診斷方法”)。圖10顯示該胎兒定量方法的一個實施方式,圖11顯示基于甲基化的胎兒診斷方法的一個實施方式。 兩種方法均采用從母體樣品獲得的胎兒DNA。這種樣品包含甲基化差異的母體核酸和胎兒核酸。例如,該樣品可以是母體血漿或血清。胎兒DNA占母體血漿中總DNA的約2-30%。 樣品總核酸中胎兒核酸的實際含量隨妊娠不同而不同,可能根據(jù)許多因素而改變,包括但不限于孕齡、母親的健康狀況和胎兒的健康狀況。如本文所述,分析母體血漿中胎兒DNA的技術(shù)難點在于需要能區(qū)分胎兒DNA與共同存在的背景母體DNA。本發(fā)明方法利用這種差異,例如胎兒與母體DNA之間觀察到的甲基化差異作為富集母親樣品中百分比較低的胎兒DNA的手段。相比于產(chǎn)前診斷的傳統(tǒng)方法,例如羊膜穿刺、長期絨毛取樣和臍穿刺與小但有限的胎兒損失風險相關(guān),該方法的非侵入性特征是主要優(yōu)勢。由于該方法不依賴處于任何特定細胞分裂時相的胎兒細胞,該方法還提供了測定是否存在染色體異常及其性質(zhì)的快速檢測手段。此外,該方法不依賴于性別 (即,不需要存在Y-染色體)和不依賴于多態(tài)性(即,不測定等位基因比例)。因此,本發(fā)明的組合物和方法代表了精確測定母體樣品中胎兒核酸含量的改進的通用、非侵入性方法。試驗設(shè)計和優(yōu)點本領(lǐng)域需要精確檢測和定量測定從母體樣品非侵入性分離的胎兒DNA。本發(fā)明利用了母體血漿或血清中存在的循環(huán)性非細胞性胎兒核酸(ccfDNA)。為了商品化和臨床實施,本發(fā)明方法應(yīng)只消耗一小部分有限可用胎兒DNA。例如,少于樣品的50 %、40 %、30 %、 25%、20%、15%、10%、5%或更少。此外,該方法宜開發(fā)成包括一種或多種(最好全部)以下試驗的多重試驗形式 檢測樣品中存在的基因組等價物總含量的試驗,S卩,識別母體和胎兒DNA種類的試驗;·檢測男性胎兒妊娠分離的胎兒DNA,即染色體Y的特異性序列的試驗;·鑒定胎兒與母親之間DNA甲基化差異區(qū)域的特異性試驗;或·已知在待研究的所有組織中低甲基化區(qū)域的特異性試驗,其可用作限制性(內(nèi)切酶)效率(restriction efficiency)的對照。該試驗的其它特征可包括以下一種或多種·對于各試驗,包括與靶序列相同或基本上相同的靶特異性競爭寡核苷酸,除了該競爭寡核苷酸的可區(qū)分特征外,例如相比于靶序列有一個或多個核苷酸不同。當加入PCR 反應(yīng)時,該寡核苷酸與靶序列共同擴增,獲得這兩個PCR擴增子之間的比例,可表明母體樣品中靶特異性DNA序列(例如,特定基因座的胎兒DNA)的數(shù)目?!U增子長度最好相似,以避免偏向擴增較短的片段。然而,只要擴增效率大致相等,可采用不同長度?!た蓮谋?或已知在母親與胎兒之間甲基化有差異的任何其它靶區(qū)域選擇甲基化差異靶區(qū)域。這些靶區(qū)域在分離自非妊娠婦女的DNA中可以是低甲基化的,而在獲自胎兒樣品中是高甲基化的。這些試驗將用作限制性(內(nèi)切酶)效率的對照?!た衫貌煌囼灚@得的結(jié)果定量測定以下一種或多種。樣品中存在的可擴增基因組總數(shù)(基因組等價物的總量);??蓴U增基因組中的胎兒百分數(shù)(胎兒濃度或百分比);或。胎兒衍生DNA序列之間(例如,胎兒染色體21和參比染色體,如染色體3之間) 的拷貝數(shù)差異。檢驗所用試驗的例子以下是用于實施本發(fā)明方法的反應(yīng)步驟概述,例如圖10提供的。此概述不應(yīng)限制本發(fā)明的范圍。相反它提供了本發(fā)明采用Sequenom . MassARRAY 技術(shù)的一個實施方式。1)從血漿樣品分離DNA。2)用甲基化敏感的限制性內(nèi)切酶(例如,HhaI和HpaII)消化靶DNA序列。將各反應(yīng)獲得的DNA與水混合至終體積25ul。加入10單位HhaIUO單位HpaII和反應(yīng)緩沖液構(gòu)成的IOul反應(yīng)混合物。在限制性內(nèi)切酶的最佳溫度下培育樣品。HhaI和HpaII消化未甲基化的DNA(不消化半甲基化或完全甲基化的DNA)。消化后,用加熱步驟使酶變性。3)加入PCR試劑(緩沖液、dNTP、引物和聚合酶)在50ul的總體積中進行基因組-PCR擴增。示范性的PCR和引物延伸如下所示。此外,加入已知濃度的合成競爭寡核苷酸。4)多份檢測(任選的)-PCR后,將50ul反應(yīng)液分成5ul多份進行平行反應(yīng)(復(fù)制品)以最大程度減小該檢驗后續(xù)PCR步驟期間引入的變異。后PCR步驟包括SAP、弓丨物延伸(MassEXTENDi 技術(shù))、樹脂處理、分配到光譜芯片(spectrochip)和質(zhì)量陣列 (MassARRAY)。 5)定量測定可擴增的基因組_用Sequenom MassARRAY⑥技術(shù)測定各試驗擴增產(chǎn)物的量。PCR后,用單堿基延伸試驗查詢擴增區(qū)域(包括在步驟3中引入競爭寡核苷酸)。 加入設(shè)計的能與毗鄰感興趣位點直接雜交的特定延伸引物。延伸引物如下所示。這些DNA 寡核苷酸稱為iPLEX: MassEXTEND 引物。在延伸反應(yīng)中,iPLEX引物與互補DNA模板雜交,用DNA聚合酶延伸。含有脫氧和二脫氧核苷酸三磷酸連同酶和緩沖液不同組合的專用終止混合物直接抑制了 iPLEX引物的延伸。引物延伸直到摻入互補二脫氧核苷酸。延伸反應(yīng)產(chǎn)生了各具有獨特分子量的不同長度的引物產(chǎn)物。因此,可用 MassARRAY ‘ 分析儀器包進行基質(zhì)輔助的激光解吸/電離飛行時間(MALDI-T0F)質(zhì)譜法同時分離和檢測引物延伸產(chǎn)物。該分離和檢測后,用塞昆納姆股份有限公司的軟件自動分析數(shù)據(jù)。6)計算胎兒核酸含量和濃度-根據(jù)甲基化差異的靶序列計算出樣品中基因組等價物的總量、從男性妊娠胎兒分離的胎兒核酸含量(和濃度)和胎兒核酸含量(和濃度) 的方法見下圖18和19??捎靡陨戏椒ㄟM行一種或多種下述試驗。除了緊接下文提供的序列外,下表X提供了查詢多種(靶序列)的多重方案。1)定量測定樣品中可擴增基因組等價物總數(shù)目的試驗在持家基因中選擇不位于染色體13、18、21、X或Y上的靶序列。這種靶序列應(yīng)位于單拷貝基因中,不含有甲基化敏感的限制性內(nèi)切酶的任何識別位點。下劃線所示序列是PCR引物位點,斜體字是單堿基延伸引物的位點,黑體字母(C) 是在人DNA上延伸的核苷酸。ApoE染色體19 =45409835-45409922 DNA靶序列,查詢的核苷酸C是黑體字。本節(jié)中提供的所有染色體位置來自2009年2月UCSC構(gòu)造的基因組(Genome Build)。GATTGACAGTTTCTCCTTCCCCAGACTGGCCAATCACAG GCAGGA AGATGAAGGTTC TGTGGGCTGCGTTGCTGGTCACATTCCTGGCApoE 正向引物5,-ACGTTGGATG-TTGACAGTTTCTCCTTCCCC (引物含有破折號分開的 5,IObp質(zhì)量標簽)。ApoE 反向引物5,-ACGTTGGATG-GAATGTGACCAGCAACGCAG (弓丨物含有破折號分開的 5,IObp質(zhì)量標簽)ApoE延伸引物5,-GCAGGAAGATGAAGGTT [C/T]引物延伸的C在人DNA靶序列上,T 在合成的DNA靶序列上。ApoE 合成的競爭寡核苷酸5,-GATTGACAGTTTCTCCTTCCCCAGACTGGCCAATCACAGGCA GGAAGATGAAGGTT T TGTGGGCTGCGTTGCTGGTCACATTCCTGGC (57 位黑體字 T 不同于人 DNA)2)定量測定樣品中染色體Y序列總數(shù)目的試驗選擇Y-染色體的特異性靶序列,其包含基因組它處的相似序列或平行進化同源序列。靶序列優(yōu)選位于單拷貝基因中,不含有甲基化敏感的限制性內(nèi)切酶的任何識別位點。下劃線所示序列是PCR引物位點,斜體核苷酸是單堿基延伸引物的位點,黑體字母(C)是在人DNA上延伸的核苷酸。
染色體 Y 上的 SRY :2655628-2655717(反向互補) GAGTTTTGGATAGTAAAATAAGTTTCGAACTCTGGCACC TTTCAA TTTTGTCGCA CTC TCC TTGTTTTTGACAATGCAATCATATGCTTCSRY 正向引物5,-ACG-TGGATAGTAAAATAAGTTTCGAACTCTG (弓丨物含有破折號分開的 5’ 3bp質(zhì)量標簽)SRY 反向引物5,-GAAGCATATGATTGCATTGTCA AAAACSRY延伸引物5,-aTTTCAATTTTGTCGCACT [C/T]引物延伸的C在人DNA靶序列上, T在合成的DNA靶序列上。5’小寫“a”是非互補核苷酸。SRY 合成的競爭寡核苷酸5,-GAGTTTTGGATAGTAAAATAAGTTTCGAACTCTGGCACCTTTC AATTTTGTCGCACT T TCCTTGTTTTTGACAATGCAATCATATGCTTC3)定量測定樣品中胎兒甲基化DNA序列的試驗。在已知的母親與胎兒DNA之間甲基化有差異的區(qū)域中選擇靶序列。選擇的序列含有甲基化敏感酶的幾個限制性位點。本研究采用HhaI (GCGC)和HpaII (CCGG)酶。下劃線所示序列是PCR引物位點,斜體字是單堿基延伸引物的位點,黑體字母(C) 是在人DNA上延伸的核苷酸,小寫字母是甲基化敏感的限制性內(nèi)切酶的識別位點。染色體12 上的 TBX3 115124905-115125001GAACTCCTCTTTGTCTCTGCGTGCccggcgcgcCC CCCTCccggTGGGT GATAAAC CCA CTCTGgcgccggCCATgcgcTGGGTGATTAATTTGCGATBX3 正向引物5,-ACGTTGGATG-TCTTTGTCTCTGCGTGCCC(引物含有破折號分開的 5,IObp質(zhì)量標簽)TBX3 反向引物5,-ACGTTGGATG-TTAATCACCCAGCGCATGGC (弓丨物含有破折號分開的 5,IObp質(zhì)量標簽)TBX3 延伸引物5,-CCCCTCCCGGTGGGTGATAAA [C/T]引物延伸的 C 在人 DNA 靴序列上,T在合成的DNA靶序列上。5’小寫“a”是非互補核苷酸。TBX3 合成競爭寡核苷酸5,-GAACTCCTCTTTGTCTCTGCGTGCCCGGCGCGCCCCCCTCCCGG TGGGTGATAAA T CCACTCTGGCGCCGGCCATGCGCTGGGTGATTAATTTGCGA4)限制性酶效率的對照試驗在已知的任何被研究組織的未甲基化區(qū)域中選擇靶序列。選擇的序列不含所用各限制性酶一個以上的位點。下劃線所示序列是PCR引物位點,斜體核苷酸代表單堿基延伸引物的位點,黑體字母(G)是在人DNA上延伸的反向核苷酸,小寫母是甲基化敏感的限制性內(nèi)切酶的識別位
點οCACNA1G 染色體 17 :48637892_48637977 (反向互補)CCAT TGGCCGT CCGCCGTGGCAGTGCGGGCGGGAgcgcAG GGAGA GAA CCA CA GCTGGAA T CCGATTCCCACCCCAAAACCCAGGAHhaI 正向引物5,-ACGTTGGATG-CCATTGGCCGTCCGCCGTG(引物含有破折號分開的 5,IObp質(zhì)量標簽)HhaI 反向引物5,-ACGTTGGATG-TCCTGGGTTTTGGGGTGGGAA(引物含有破折號分開的5’ IObp質(zhì)量標簽)
HhaI 延伸引物5,-TTCCAGCTGTGGTTCTCTCHhaI 合成的競爭寡核苷酸5,-CCATTGGCCGTCCGCCGTGGCAGTGCGGGCGGGAGCGCA GAGAGAGAACCACAGCTGGAAT、CCGATTCCCACCCCAAAACCCAGGA驗證實驗用模型系統(tǒng)和臨床樣品檢驗本發(fā)明的靈敏度和精確性。對不同樣品進行多重試驗,包括2種定量測定總拷貝數(shù)的試驗、3種定量測定甲基化的試驗、1種染色體Y的特異性試驗和1種消化對照試驗。參見表Xl和X2。另一種多重方案和附加試驗見表Yl和Y2。
權(quán)利要求
1.一種制備胎兒核酸的方法,其包括a)提供妊娠女性的樣品;b)根據(jù)所述妊娠女性樣品中胎兒核酸與母體核酸之間的不同甲基化狀態(tài)分離該胎兒核酸與相應(yīng)母體核酸,其中所述胎兒核酸包含SEQ ID NO :1-89所示一種或多種多核苷酸序列中的一個或多個CpG位點;和c)通過將在步驟(b)中分離的胎兒核酸用作模板的方法,制備含胎兒核酸的核酸。
2.如權(quán)利要求1所述的方法,其特征在于,通過特異性結(jié)合甲基化核苷酸的物質(zhì)分離所述胎兒核酸與所述母體核酸。
3.如權(quán)利要求2所述的方法,其特征在于,結(jié)合甲基化核苷酸的所述物質(zhì)是甲基-CpG 結(jié)合蛋白(MBD)或其片段。
4.如權(quán)利要求2所述的方法,其特征在于,結(jié)合甲基化核苷酸的所述物質(zhì)結(jié)合甲基化的胎兒核酸。
5.如權(quán)利要求2所述的方法,其特征在于,結(jié)合甲基化核苷酸的所述物質(zhì)結(jié)合甲基化的母體核酸。
6.如權(quán)利要求2所述的方法,其特征在于,借助特異性結(jié)合未甲基化核苷酸的物質(zhì)分離所述胎兒核酸與所述母體核酸。
7.如權(quán)利要求1所述的方法,其特征在于,借助特異性消化未甲基化母體核酸的物質(zhì)分離所述胎兒核酸與所述母體核酸。
8.如權(quán)利要求7所述的方法,其特征在于,所述特異性消化未甲基化母體核酸的物質(zhì)是甲基化敏感的限制性內(nèi)切酶。
9.如權(quán)利要求8所述的方法,其特征在于,在同一反應(yīng)中采用兩種或更多種甲基化敏感的限制性內(nèi)切酶。
10.如權(quán)利要求1所述的方法,其特征在于,步驟C)的過程是擴增反應(yīng)。
11.如權(quán)利要求1所述的方法,其特征在于,步驟C)的過程是測定胎兒核酸的絕對含量的方法。
12.如權(quán)利要求1所述的方法,其特征在于,制備SEQID NO :1-89所示多核苷酸序列中的三種或更多種。
13.一種測定母體樣品中胎兒核酸絕對含量的方法,其中所述母體樣品包含差異甲基化的母體和胎兒核酸,所述方法包括a)用一種或多種甲基化敏感的限制性內(nèi)切酶消化母體樣品中的所述母體核酸,從而富集所述胎兒核酸;和b)采用非多態(tài)性和非亞硫酸氫鹽的定量測定方法測定步驟a)的胎兒核酸的絕對含量。
14.如權(quán)利要求13所述的方法,其特征在于,聯(lián)用胎兒核酸的絕對含量或濃度與診斷方法來測定胎兒性狀,其中所述診斷方法需要使給定的胎兒核酸絕對含量或濃度符合某些臨床靈敏度或特異性要求。
15.一種測定母體樣品中胎兒核酸濃度的方法,其中所述母體樣品包含差異甲基化的母體和胎兒核酸,所述方法包括a)測定所述母體樣品中存在的核酸總量;b)用甲基化敏感的限制性內(nèi)切酶消化母體樣品中的所述母體核酸,從而富集所述胎兒核酸;c)采用非多態(tài)性和非亞硫酸氫鹽的定量測定方法測定步驟b)中胎兒核酸的含量;和d)比較步驟c)的胎兒核酸含量與步驟a)的核酸總量,從而測定所述母體樣品中胎兒核酸的濃度。
16.如權(quán)利要求15所述的方法,其特征在于,聯(lián)用胎兒核酸的絕對含量或濃度與診斷方法來測定胎兒性狀,其中所述診斷方法需要使給定的胎兒核酸絕對含量或濃度符合某些臨床靈敏度或特異性要求。
17.一種利用母體樣品中的胎兒核酸測定胎兒非整倍性存在與否的方法,其中所述母體樣品包含差異甲基化的母體和胎兒核酸,所述方法包括a)用甲基化敏感的限制性內(nèi)切酶消化母體樣品中的所述母體核酸,從而富集所述胎兒核酸;b)采用非多態(tài)性和非亞硫酸氫鹽的定量測定方法測定靶染色體的胎兒核酸含量;c)采用非多態(tài)性和非亞硫酸氫鹽的定量測定方法測定參比染色體的胎兒核酸含量;d)比較步驟b)與步驟c)的胎兒核酸含量,胎兒靶核酸與胎兒參比核酸含量之間有統(tǒng)計學(xué)顯著差異表明存在胎兒非整倍性。
18.如權(quán)利要求17所述的方法,其特征在于,測定靶染色體和參比染色體各自3和15 個基因座之間的胎兒核酸含量。
19.如權(quán)利要求13、15或17所述的方法,其特征在于,測定所述甲基化敏感的限制性內(nèi)切酶的消化效率。
20.如權(quán)利要求13、15或17所述的方法,其特征在于,實施所述定量測定的非多態(tài)性和非亞硫酸氫鹽方法是采用基于競爭的方法測定胎兒核酸含量。
21.如權(quán)利要求13、15或17所述的方法,其特征在于,所述方法還包括測定母體樣品中是否存在Y-染色體核酸。
22.如權(quán)利要求21所述的方法,其特征在于,測定母體樣品中存在的男性胎兒的Y-染色體核酸含量。
23.如權(quán)利要求22所述的方法,其特征在于,比較所述胎兒核酸含量與所述Y-染色體核酸含量。
24.如權(quán)利要求13或15所述的方法,其特征在于,測定2、3、4、5、6、7、8、9、10、15、20、 30,40,50個或更多個基因座的胎兒核酸含量。
25.如權(quán)利要求13或17所述的方法,其特征在于,測定母體樣品中存在的核酸總量。
26.如權(quán)利要求13、15或17所述的方法,其特征在于,測定核酸總量和男性胎兒的 Y-染色體核酸含量。
27.如權(quán)利要求13、15或17所述的方法,其特征在于,測定核酸總量、男性胎兒Y-染色體核酸含量和甲基化敏感的限制性內(nèi)切酶的消化效率。
28.如權(quán)利要求27所述的方法,其特征在于,采用兩種或更多種試驗測定核酸總量,采用一種或多種試驗測定男性胎兒Y-染色體核酸含量和采用一種或多種試驗測定甲基化敏感的限制性內(nèi)切酶的消化效率。
29.如權(quán)利要求28所述的方法,其特征在于,測定3個或更多個基因座的胎兒核酸含量。
30.如權(quán)利要求13、15或17所述的方法,其特征在于,通過擴增反應(yīng)測定胎兒核酸含量,所述擴增反應(yīng)產(chǎn)生大于經(jīng)消化的母體核酸的平均長度的擴增子,從而進一步富集所述胎兒核酸。
全文摘要
本發(fā)明提供的組合物和方法,可利用母親與其胎兒之間基因組區(qū)域甲基化的差異而分出、分離或富集母體樣品中的胎兒核酸。本文所述組合物和方法可用于非侵入性產(chǎn)前診斷,包括檢測非整倍性染色體。
文檔編號C12N15/10GK102216456SQ200980145856
公開日2011年10月12日 申請日期2009年9月16日 優(yōu)先權(quán)日2008年9月16日
發(fā)明者A·O·H·尼格倫, M·埃里希 申請人:塞昆納姆分子醫(yī)學(xué)中心, 塞昆納姆股份有限公司