專利名稱::分析卵巢癌病癥的方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于生物學和化學領(lǐng)域,更具體屬于分子生物學和人類遺傳學領(lǐng)域。本發(fā)明涉及鑒定人DNA中的甲基化位點,特別是某些確定的序列中的甲基化位點的領(lǐng)域,所述序列當甲基化時,表明存在卵巢癌。
背景技術(shù):
:卵巢癌是女性中的第五位的癌癥死亡原因,是婦科惡性腫瘤導致的第一位的死亡原因,并且是第二常見的診斷的婦科惡性腫瘤(默克診療手冊第18部分,婦科和產(chǎn)科第241章,婦科腫瘤)。它是特發(fā)的,表示確切原因是未知的。該疾病在工業(yè)化國家中更常見,日本例外。在美國,女性一生中具有1.4%-2.5%(40-60名女性中的1名)的發(fā)生卵巢癌的幾率。卵巢癌一半以上的死亡發(fā)生在55-74歲的女性中,大約四分之一的卵巢癌死亡發(fā)生在35-54歲的女性中。發(fā)生卵巢癌的風險似乎受到一些因素的影響。與使用避孕藥如檸檬酸克羅米酚的關(guān)聯(lián)一直以來是有爭議的。1991年的一項分析提出了使用藥物可能增加卵巢癌的風險的可能性。從那時起進行了一些隊列研究和病例_對照研究,而沒有針對所述關(guān)聯(lián)提供結(jié)論性的證據(jù)。有一些很好的證據(jù)證明遺傳因素是重要的。BRCAl或BRCA2基因的某些突變的攜帶者,更常見在一些人群(如德系猶太女性)中,發(fā)生乳腺癌和卵巢癌的風險更高,通常比一般人群發(fā)病更早。有乳腺癌的個人病史或乳腺癌和/或卵巢癌的家族史的患者,特別是如果年輕,可能具有升高的風險。子宮癌、結(jié)腸癌或其他胃腸癌的強家族史可能表明存在稱作遺傳性非息肉結(jié)腸直腸癌的綜合征(HNPCC,也稱作LynchII綜合征),這賦予更高的發(fā)生卵巢癌的風險。已經(jīng)研究的其他因素,例如滑石粉的使用、石棉暴露、高飲食脂肪含量和兒童期腮腺炎感染,是有爭議的,并且還沒有確定地證實。卵巢癌是根據(jù)腫瘤史分類(ICD-0代碼)。組織學指導了臨床治療、控制和預后的很多方面。卵巢腫瘤也可以根據(jù)它們的推測細胞來源進行分類。主要的類別是表面上皮-間質(zhì)腫瘤、性索-間質(zhì)腫瘤(ICD-08590)、生殖細胞腫瘤(ICD-09060-9090)和繼發(fā)或轉(zhuǎn)移性腫瘤。表面上皮-間質(zhì)腫瘤是最常見的和原型卵巢癌。認為它們來自卵巢表面被覆,并且包括漿液性囊腺癌(8441/3)和粘液性囊腺癌(8470/3)。腹腔被覆了與組成卵巢表面被覆相同的細胞,并且癌可以從那里開始。在這種情況下,稱作原發(fā)性腹膜癌。但是,其治療與卵巢癌的治療基本相同。性索-間質(zhì)腫瘤(8590)包括激素活性病變,例如產(chǎn)生雌激素的粒層細胞腫瘤(8620/3)和男性化Sertoli-Leydig細胞腫瘤或男性細胞瘤。卵巢的生殖細胞腫瘤(9060-9090)來自生殖細胞,并且傾向于在年輕女性和女孩中發(fā)生。這些腫瘤占大約5%的卵巢癌。它們傾向于包封良好,并且很多是良性的,因此與其他卵巢腫瘤相比預后較好。也存在混合的繼發(fā)腫瘤或轉(zhuǎn)移性腫瘤。卵巢癌通常是原發(fā)的,但也可以是繼發(fā)的,S卩,轉(zhuǎn)移的結(jié)果來自身體其他部位的原發(fā)癌,例如,來自乳腺癌或來自胃腸癌,在此情況下卵巢癌是Krukenberg癌。歷史上卵巢癌稱作“沉默殺傷者”,因為直到治愈的機會很小,都不認為出現(xiàn)了癥狀。但是,最近的研究顯示這一術(shù)語是不正確的,并且與普通群體中的女性相比,在患卵巢癌的女性中更容易發(fā)生以下癥狀。這些癥狀包括胃脹氣、盆腔或腹部疼痛、進食困難或很快有飽感、泌尿系統(tǒng)癥狀(尿急或尿頻)。早期診斷與改進的預后相關(guān)?;加新殉舶┑呐猿3蟮酪恍┢渌Y狀。這些癥狀包括疲倦、消化不良、背痛、性交痛、便秘和月經(jīng)不規(guī)律。但是,這些其他癥狀對于鑒定卵巢癌不是很有用,因為它們也以相同的頻率出現(xiàn)在不患有卵巢癌的普通群體中的女性中。卵巢癌在它的早期階段(I/II)難以診斷,直到它播散并且發(fā)展到更晚的階段(III/IV)。這是由于大多數(shù)常見癥狀不特異的事實。卵巢癌具有不良預后。它是不成比例地致死的,因為癥狀是模糊和不特異的,因此診斷晚。超過60%展示該癌癥的患者已經(jīng)具有III期或IV期癌癥,此時已經(jīng)播散超過卵桌。惡性卵巢癌將細胞脫落在腹腔內(nèi)天然存在的流體內(nèi)。這些細胞可以植入在其他腹部(腹膜)結(jié)構(gòu)上,包括子宮、膀胱、腸、腸壁的被覆(網(wǎng)膜),并且甚至可以播散到肺。這些細胞甚至可以在懷疑癌癥之前形成新的腫瘤生長。超過50%的患卵巢癌的女性在疾病的晚期階段診斷,因為不存在經(jīng)濟的卵巢癌篩選測試。所有階段的5年存活率僅僅是35%-38%。但是,如果在疾病早期診斷,5年存活率可以達到90%-98%。因此,獲得分析卵巢癌病癥的方法和檢測受試者中的卵巢癌的方法是有利的。發(fā)明_既述本發(fā)明教導了用于分析卵巢癌病癥的方法,包括確定選自SEQIDNO.1-91的序列中的一個或多個CpG二核苷酸的基因組甲基化狀態(tài)和/或確定特別是SEQIDNO.1_10和/或SEQIDNO.50-SEQIDNO.60的序列中一個或多個CpG二核苷酸的基因組甲基化狀態(tài)。感興趣的區(qū)域在表IA和表IB中指定(“起始”和“終止”)。CpG島是這樣的區(qū)域其中大量胞嘧啶和鳥嘌呤在DNA的主鏈中彼此鄰接(即,通過磷酸二酯鍵連接)。它們位于且臨近大約40%的哺乳動物基因啟動子(約70%在人啟動子中)。CpG符號中的“ρ”是指胞嘧啶和鳥嘌呤之間的磷酸二酯鍵。CpG島的長度典型地是100-3000個堿基對。這些區(qū)域的特征在于CpG二核苷酸含量等于或大于統(tǒng)計學預期的含量(6%),而基因組的其余部分具有低得多的CpG頻率(1%),這是一種稱作CG抑制的現(xiàn)象。不同于基因編碼區(qū)中的CpG位點,在大多數(shù)情況下,如果表達基因,啟動子的CpG島中的CpG位點是未甲基化的。這種觀察結(jié)果導致推測出基因的啟動子中的CpG位點的甲基化可能抑制基因的表達。甲基化對于沿組蛋白修飾進行印跡是重要的。CpG島的通常正式定義是具有至少200bp的區(qū)域,其GC百分比高于50%,并且觀察的/預期的CpG比大于0.6。本文中,CpG二核苷酸是可以在體內(nèi),特別是人體內(nèi)以甲基化和未甲基化的狀態(tài)存在的CpG二核苷酸。本發(fā)明涉及一種方法,其中用本文公開的一個或多個序列的未甲基化模式檢測原發(fā)癌,并且其中用獲得的甲基化模式預測對卵巢癌治療的治療反應。本文中,受試者理解為是所有人、患者、動物,無論它們是否表現(xiàn)病理學改變。在本發(fā)明的含義中,任何采集自細胞、組織、器官、生物等的樣品都可以是要診斷的患者的樣品。在一個優(yōu)選實施方案中,本發(fā)明的患者是人。在本發(fā)明的一個進一步優(yōu)選的實施方案中,患者是懷疑患有選自下組的疾病的人原發(fā)性卵巢癌、繼發(fā)性卵巢癌、表面上皮-間質(zhì)腫瘤、性索_間質(zhì)腫瘤、生殖細胞腫瘤。本方法用于卵巢細胞增殖性病癥的改進的診斷、治療和監(jiān)測,例如,通過使得能夠改進所述病癥的亞類之間和對所述病癥的遺傳傾向的鑒定和區(qū)分。本發(fā)明相對于現(xiàn)有技術(shù)提供了改進,因為它使得能夠?qū)β殉布毎鲋承圆“Y進行高度特異性的分類,從而使得能夠?qū)颊哌M行改進的和知情的治療。本文中,要求保護的序列也包括指定序列的反向互補序列。附圖簡述圖1顯示基因組的差異甲基化區(qū)域的確定方法。這在實施例中更詳細概括。圖2顯示聚類的樣品(列)與甲基化基因座(行)。甲基化標記可以區(qū)分腫瘤(上面的條的左部分)與正常組織(上面的條的右部分)。圖3顯示基于甲基化特征的卵巢樣品的聚類。未監(jiān)督的聚類可以區(qū)分正常和腫瘤樣品。實施方案的詳述發(fā)明人出乎意料地發(fā)現(xiàn),一小部分選擇出的DNA序列可以用于分析卵巢癌病癥。這可以通過確定本文公開的序列或其反向互補序列中一個或多個CpG二核苷酸的基因組甲基化狀態(tài)而進行??偣茶b定出了約900種適于所述分析的序列。發(fā)現(xiàn)91種序列是特別適合的?;谇『?0種序列,例如從表IA或B的前10種(P值0.0001),可以得到94%的分類準確率。這些序列可以存在于下表IA所示的基因中。表IA<table>tableseeoriginaldocumentpage6</column></row><table><table>tableseeoriginaldocumentpage7</column></row><table>所述序列也可存在于下表IB所示的基因間區(qū)域中。表IB<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table>形成本發(fā)明的基礎(chǔ)的基因優(yōu)選用于形成“基因板(genepanel)”,即,包含本發(fā)明的特定基因序列和/或它們各自的提供信息的甲基化位點的集合。基因板的形成使得能夠快速和特異性分析卵巢癌的特定方面。本發(fā)明中描述和使用的基因板可以出乎意料高的效率使用,用于診斷、治療和監(jiān)測卵巢細胞增殖性病癥并且分析發(fā)生卵巢細胞增殖性病癥的傾向,特別是檢測卵巢腫瘤。此外,與單個基因診斷和檢測工具相比,來自多種基因陣列的多個CpG位點的使用,能夠允許相對高度的靈敏度和特異性。本發(fā)明涉及用于分析卵巢癌病癥的方法,包括確定選自SEQIDNO.I-SEQIDNO.10和/或SEQIDNO.50-SEQIDNO.60的序列中一個或多個CpG二核苷酸的基因組甲基化狀態(tài)。在一個實施方案中,優(yōu)選確定SEQIDN0.1_91的序列中的一個或多個序列的甲基化狀態(tài),其中如表IA或IB指出的,所述序列具有小于0.0001的ρ-值。CpG島的甲基化狀態(tài)指示卵巢癌。但是,優(yōu)選地,確定每個CpG的甲基化狀態(tài),并且確定差異甲基化模式,因為并不是所有CpG島都必須甲基化。在本發(fā)明的方法的一個實施方案中,該分析是檢測受試者中的卵巢癌,并且其中進行以下步驟(a)提供來自要分析的受試者的樣品,(b)確定選自SEQIDNO.I-SEQIDNO.10和/或SEQIDNO.50-SEQIDNO.60的序列中一個或多個CpG二核苷酸的甲基化狀態(tài)。任選地,額外地進行以下步驟(a)將來自甲基化狀態(tài)測試的一個或多個結(jié)果輸入獲自診斷多變量模型(DiagnosticMultiVariateModel)的分類器,(b)計算樣品來自正常組織或卵巢癌組織的可能性,和/或,(c)計算預測中的置信度的關(guān)聯(lián)P-值。例如,我們使用支持向量機分類器(supportvectormachineclassifier),基于來自患者的預定組的組織來“學習”腫瘤或正常樣品的重要特征。算法現(xiàn)在輸出分類器(一種公式,其中變量是來自使用的特征組的甲基化比)。然后將來自新的患者樣品的甲基化比輸入此分類器。結(jié)果可以是1或0。與邊緣平面的距離用于提供ρ-值。優(yōu)選的是確定SEQIDNO.I-SEQIDNO.10禾口/或SEQIDNO.50-SEQIDNO.60的序列中的至少4個序列的甲基化狀態(tài)。優(yōu)選的是,額外地,確定SEQIDN0.11-49和/或61_91的序列中的一個或多個序列的甲基化狀態(tài)。在一個實施方案中,確定SEQID.NO.I-SEQIDNO.91的序列中的至少10個序列、20個序列、30個序列、40個序列或超過50個序列的甲基化狀態(tài)。特別優(yōu)選的是確定SEQID.NO.I-SEQIDNO.91的序列中所有序列的甲基化狀態(tài)。在一個實施方案中,確定SEQIDNO.I-SEQIDNO.10和SEQIDNO.50-SEQIDNO.60的序列的甲基化狀態(tài)。原則上,本發(fā)明也涉及確定SEQIDNO.I-SEQIDNO.91的序列中僅一個序列的甲基化狀態(tài)。有許多用于確定DNA分子的甲基化狀態(tài)的方法。優(yōu)選地是,通過選自下組的一種或多種方法確定甲基化狀態(tài)亞硫酸氫鹽測序、焦磷酸測序(pyrosequencing)、甲基化敏感性單鏈構(gòu)象分析(MS-SSCA)、高分辨率解鏈分析(HRM)、甲基化敏感性單核苷酸引物延伸(MS-SnuPE)、堿基特異性切割/MALDI-T0F、甲基化特異性PCR(MSP)、基于微陣列的方法、mspl切割。其他已知的檢測5-甲基胞嘧啶的方法的綜述可以從以下綜述文件收集Rein,Τ.,DePamphilis,Μ.L.,Zorbas,H.,NucleicAcidsRes.1998,26,2255。其他方法公開于US2006/0292564A1中。在一個優(yōu)選實施方案中,甲基化狀態(tài)是通過mspI切割、銜接子的連接、McrBC消化、PCR擴增、標記和隨后的雜交來確定的。在一個優(yōu)選實施方案中,甲基化狀態(tài)如下確定。優(yōu)選的是要分析的樣品來自選自下組的組織類型例如,來自要分析的組織的組織活檢物、陰道組織、舌、胰腺、肝、脾、卵巢、肌肉、關(guān)節(jié)組織、神經(jīng)組織、胃腸組織、腫瘤組織、體液、血液、血清、唾液和尿。在一個優(yōu)選實施方案中,檢測原發(fā)癌。在本發(fā)明的方法的一個實施方案中,將獲得的甲基化模式用于預測對卵巢癌治療的治療反應。本發(fā)明涉及探針,如位于上CpG位點的區(qū)域中的寡核苷酸。本發(fā)明的寡聚物通常用于所謂的“組”中,所述組包含SEQIDNO.I-SEQIDNO.91,或所述序列中的至少10個,優(yōu)選20個,更優(yōu)選30個,最優(yōu)選超過50個序列內(nèi)的每個CpG二核苷酸的至少一個寡核苷酸。本發(fā)明還涉及位于CpG位點的區(qū)域中的寡核苷酸的反向互補序列。用于所述分析的探針是基于以下一個或多個標準定義的(1)探針序列僅僅在人基因組中出現(xiàn)一次;(2)C/G核苷酸的探針密度是30%-70%;(3)雜交的解鏈特征和其他標準是根據(jù)MeiRetal,ProcNatlAcadSciUSΑ.2003S印30;100(20):11237_42。在一個非常優(yōu)選的實施方案中,本發(fā)明涉及一組寡核苷酸,其特異于SEQIDΝ0.1-10和/或SEQIDNO:50_60,或SEQIDN0.50-60的序列。本發(fā)明的寡核苷酸可以特異于體內(nèi)存在形式的序列,或它可以特異于已經(jīng)進行了亞硫酸氫鹽處理的序列。所述探針的長度是10-80個核苷酸,更優(yōu)選的長度是15-40個核苷酸。在本發(fā)明的寡核苷酸組的情況下,優(yōu)選的是至少一個寡核苷酸與固相結(jié)合。進一步優(yōu)選的是一個組的所有寡核苷酸都與固相結(jié)合。本發(fā)明進一步涉及至少10個探針(寡核苷酸和/或PNA-寡聚物)的組,其用于檢測基因組DNA的胞嘧啶甲基化狀態(tài),所述檢測是通過分析所述序列或所述序列的經(jīng)過處理的形式(根據(jù)SEQIDNO.I-SEQIDNO.91及其互補序列)。這些探針使得能夠改進卵巢細胞增殖性病癥的檢測、診斷、治療和監(jiān)測。該組寡核苷酸也可以用于通過分析根據(jù)SEQIDNO.1-SEQIDNO.91之一的所述序列或所述序列的經(jīng)過處理的形式而檢測單核苷酸多態(tài)性(SNPs)。根據(jù)本發(fā)明,優(yōu)選的是通過本發(fā)明可得到的不同寡核苷酸和/或PNA-寡聚物的排列(也稱作“陣列”)是以可能結(jié)合于固相的方式存在的。這種不同寡核苷酸和/或PNA-寡聚物序列的陣列的特征可以在于它是以矩形或六邊形點陣的形式排列在固相上。這種固相表面優(yōu)選由硅、玻璃、聚苯乙烯、鋁、鋼、鐵、銅、鎳、銀或金制成。但是,硝酸纖維素以及塑料,如可以小團形式存在的尼龍或樹脂基質(zhì),是合適的替代物。因此,本發(fā)明的進一步的主題是用于制造固定于載體材料的陣列的方法,所述陣列用于卵巢細胞增殖性病癥的改進的檢測、診斷、治療和監(jiān)測和/或發(fā)生卵巢細胞增殖性病癥的傾向的檢測。在所述方法中,本發(fā)明的至少一種寡核苷酸與固相偶聯(lián)。用于制備所述陣列的方法是已知的,例如參見美國專利號5,744,305,其是通過固相化學和對光不安的保護基團的方式制備的。本發(fā)明的另外的主題涉及用于卵巢細胞增殖性病癥的改進的檢測、診斷、治療和監(jiān)測的DNA芯片。此外,DNA芯片使得能夠檢測發(fā)生卵巢細胞增殖性病癥的傾向。DNA芯片包含至少一種本發(fā)明的核酸和/或寡核苷酸。DNA芯片是已知的,例如,參見美國專利號No.5,837,832。本發(fā)明涉及包含核酸的組合物或陣列,所述核酸的序列與SEQIDNO.1_91的序列中的至少10個序列相同,其中所述組合物或陣列包含不超過100種不同的核酸分子。本發(fā)明涉及包含至少5個序列的組合物或陣列,所述序列的累積ρ值小于0.001,優(yōu)選小于0.0001。此外,本發(fā)明的主題是試劑盒,其可以包含例如含亞硫酸氫鹽的試劑、含有至少兩個寡核苷酸的一組引物寡核苷酸,在每種情況下所述寡核苷酸的序列相應于或互補于SEQIDNO.I-SEQIDNO.91中指出的堿基序列的長度為至少15個堿基的區(qū)段。優(yōu)選的是所述引物是用于SEQIDNO.1-10和/或SEQIDNO.50-SEQIDNO.60。實施例樣品從挪威奧斯陸的NorwegianRadium醫(yī)院獲得患者樣品,并且根據(jù)法律要求,獲得患者知情同意書。CPG島從UCSC基因組瀏覽器獲得有注解的CpG島。用公開的Gardiner-Garden定義(Gardiner-Garden,M.andΜ.Frommer(1987).“CpGislandsinvertebrategenomes."JMolBiol196(2):261-82)預測這些島,其中涉及以下標準長度>=200bp,%GC>=50%,觀察/預期CpG>=0.6?;蚪M中存在約26219個范圍是200bp-2000bp的CpG島。通過MspI限制性斷裂,可以充分覆蓋這些島。按照以下說明,采用390K形式,通過NimblegenSystems制備陣列。用來自人基因組構(gòu)造33(hgl7)的CpG島注解來設(shè)計50聚體疊片式陣列。50聚體在島序列坐標的任一側(cè)移動,以便使島均勻分布。390K形式具有367,658個可獲得的特征,其不能用50聚體疊片滿足所有島。因此,我們基于大小制備了要表示的島的截止值,僅僅測定了大小為200b-2000b的CpG島。設(shè)計了對照探針,用于表示背景信號。以前已經(jīng)描述了樣品制備表不(Lucito,R.,J.Healy,etal.(2003).“Representationaloligonucleotidemicroarrayanalysis:ahigh_resolutionmethodtodetectgenomecopynumbervariation."GenomeRes13(10):2291_305.),具有以下改變。使用的主要限制性內(nèi)切核酸酶是Mspl。消化后,連接以下接頭(MspI24聚體和MSPI12聚體)。12聚體是未磷酸化的,并且不連接。連接后,通過苯酚氯仿清洗材料,沉淀,離心,并且重新懸浮。將材料分成兩份,一半通過內(nèi)切核酸酶McrBC消化,另一半模擬消化。每個樣品對采用少至4個250μ1試管,用于擴增各自具有IOOul反應體積的代表物。循環(huán)條件是95°C下1分鐘,72°C下3分鐘,共15個循環(huán),然后是在72°C下延伸10分鐘。當完成時,合并每對的試管的內(nèi)容物。通過苯酚氯仿萃取來清洗代表物,沉淀,重新懸浮,并且測定濃度。按照描述對DNAitfi^feia(Lucito,R.,J.Healy,etal.(2003).“Representationaloligonucleotidemicroarrayanalysis-.ahigh-resolutionmethodtodetectgenomecopynumbervariation.“GenomeRes13(10):2291_305.),其中僅有微小改變。簡言之,將2ugDNA模板置于(溶解于pH8的TE中)0.2mLPCR管中。加入5μ1隨機單體(SigmaGenosys),用dH20補充到25μL,混合。將試管放置在100°C的Tetrad中5分鐘,然后放置在冰上5分鐘。在其中加入5μ1NEB緩沖液2,5yLdNTPs(0.6nmdCTP,1.2nmdATP,dTTP,dGTP),5μ1來自GEHealthcare的標記(Cy3_dCTP或Cy5_dCTP),2μ1NEBKlenow片段和2μ1dH20。用于雜交和洗滌的程序按照以前的報道(Lucito,R.,J.Healy,etal.(2003).“Representationalο1igonucleotidemicroarrayanalysisahigh-resolutionmethodtodetectgenomecopynumbervariation."GenomeRes13(10):2291-305),例外是用于雜交的烤爐溫度增加到50°C。用AxonGenePix4000B掃描儀設(shè)置,以5μπι的像素大小掃描陣列。用GenePixPro4.0軟件對陣列的強度進行定量。將陣列數(shù)據(jù)輸入S-PLUS中用于進一步的分析。數(shù)據(jù)分析在GenePix4000B掃描儀上掃描微陣列圖像,用Nimblescan軟件(NimblegenSystemsInc)提取數(shù)據(jù)。對于每種探針,計算每個實驗的McrBc和對照處理樣品的比值的幾何平均值(GeoMeanRatio)及其相關(guān)染料交換。然后用分位數(shù)標準化方法(Bolstad,B.M.,R.A.Irizarry,etal.(2003).“Acomparisonofnormalizationmethodsforhighdensityoligonucleotidearraydatabasedonvarianceandbias"Bioinformatics19(2):185-93)對數(shù)據(jù)集內(nèi)所有樣品的GeoMeanRatio進行標準化。然后,集中每個實驗的標準化比值,用中位數(shù)平滑模型(medianpolishmodel)對每個MspI片段中所有探針得到一個值。然后,將集中的數(shù)據(jù)用于進一步的分析。用方差分析鑒定最顯著的島。為了確定腫瘤和正常樣品間甲基化的最一致出現(xiàn)的改變,我們使用了t檢驗方法。在進行了多測試校正后采用0.001的P值截止值(FalseDiscoveryRate,BenjaminiandHotchberg(Benjamini1995)),我們獲得了一系列916個MspI片段,其顯示不同的甲基化。監(jiān)督學習我們使用了監(jiān)督機學習分類器(supervisedmachinelearningclassifier)來鑒定區(qū)分腫瘤樣品與正常樣品所需的特征數(shù)目。采用留下一個的方法(leaveoneoutmethod)(Lin,C.-C.C.a.C.-J.(2001).LIBSVM-.alibraryforsupportvectormachines),使用了公眾可得到的支持向量機(SVM)文庫(LibSVMVer2.8)來獲得分類準確性。首先用單獨的訓練數(shù)據(jù)之間的t檢驗來選擇用于分類的甲基化特征。然后使用徑向基函數(shù)(radialbasisfunction,RBF)核在最前面的10、50和100個特征上訓練SVM。對于N個樣品,對(N-I)個樣品進行t檢驗,以鑒定甲基化比值具有顯著差異的片段。對于卵巢數(shù)據(jù)集,此檢驗對18個卵巢樣品進行了18次,從而在t檢驗計算中每個樣品留下一次。然后用來自(N-I)個樣品的最前面10個片段特征的甲基化比訓練SVM,用來自一個未訓練樣品的比值進行測試。基于正好10個特征,我們能夠?qū)崿F(xiàn)94%的分類準確率。感興趣的是,在該分析中分類為正常的兩個腫瘤樣品在基因表達和ROMA分析中也都是最接近于正常的。甲基化位點的檢測在一個優(yōu)選實施方案中,該方法包括以下步驟在該方法的第一個步驟中,必須從諸如細胞系、組織或血樣的來源分離基因組DNA樣品??梢酝ㄟ^本領(lǐng)域技術(shù)人員標準的方式進行提取,包括使用去污劑裂解、超聲處理和用玻璃珠渦旋。一旦核酸已經(jīng)提取,就可以將基因組雙鏈DNA用于分析中。在一個優(yōu)選實施方案中,可以在該方法的下一個步驟前切割DNA,這可以通過本領(lǐng)域技術(shù)人員的標準方式進行,特別是,但不限于限制性內(nèi)切核酸酶。在該方法的第二個步驟中,用以下方式處理基因組DNA樣品,S卩,使在5’-位置未甲基化的胞嘧啶堿基轉(zhuǎn)化為尿嘧啶、胸腺嘧啶或在雜交行為方面與胞嘧啶不相似的其他堿基。這在下文中理解為“預處理”。上文描述的基因組DNA的處理優(yōu)選用亞硫酸氫鹽(亞硫酸鹽,亞硫酸disulfite)和隨后的堿水解進行,其導致未甲基化的胞嘧啶核堿基轉(zhuǎn)化為尿嘧啶或在堿基vairine行為方面與胞嘧啶不相似的其他堿基。如果將亞硫酸氫鹽溶液用于反應,則添加發(fā)生在未甲基化的胞嘧啶堿基。此外,必須存在變性試劑或溶劑以及自由基攔截物(radicalinterceptor)。然后,隨后的堿水解導致未甲基化的胞嘧啶核堿基轉(zhuǎn)化為尿嘧啶。然后將轉(zhuǎn)化的DNA用于檢測甲基化的胞嘧啶。對片段進行擴增。由于統(tǒng)計學和實踐的考慮,優(yōu)選擴增10個以上具有100-2000個堿基對的長度的不同片段??梢栽谝粋€和相同的反應容器中進行幾個DNA片段的擴增。通常,通過聚合酶鏈反應(PCR)進行擴增。本領(lǐng)域技術(shù)人員了解所述引物的設(shè)計。這些應該包括至少兩個寡核苷酸,其序列各自與附錄中指出的堿基序列(SEQIDNO.I-SEQIDN0.91)的長度為至少15個堿基對的片段反向互補或相同。所述引物寡核苷酸優(yōu)選特征在于它們不含任何CpG二核苷酸。在該方法的一個特別優(yōu)選的實施方案中,設(shè)計所述引物寡核苷酸的序列,以便僅僅選擇性與目的卵巢細胞特異性DNA退火并且擴增所述DNA,從而使背景或不相關(guān)DNA的擴增最少化。在本發(fā)明的上下文中,背景DNA表示以下基因組DNA,其不具有相關(guān)組織特異性甲基化模式,在本申請中,相關(guān)組織是健康的和患病的卵巢細胞。根據(jù)本發(fā)明,優(yōu)選的是至少一個引物寡核苷酸在擴增過程中與固相結(jié)合。不同的寡核苷酸和/或PNA-寡聚物序列可以矩形或六邊形點陣的形式排列在平面固相上,固相表面優(yōu)選由硅、玻璃、聚苯乙烯、鋁、鋼、鐵、銅、鎳、銀或金制成,也可以使用其他材料,如硝酸纖維素或塑料。通過擴增獲得的片段可以攜帶直接或間接可檢測的標記。優(yōu)選的是熒光標記、放射性核素或具有可以在質(zhì)譜儀中檢測的典型質(zhì)量的可分離分子片段形式的標記,優(yōu)選的是產(chǎn)生的片段在質(zhì)譜儀中具有單個陽性或陰性凈電荷,從而具有更好的可檢測性??梢酝ㄟ^基質(zhì)輔助激光解吸電離質(zhì)譜法(MALDI)或使用電噴霧質(zhì)譜法(ESI)進行檢測和顯現(xiàn)。在下一個步驟中,分析核酸擴增子,以便在處理前確定基因組DNA的甲基化狀態(tài)。可以用替代方法進行核酸的處理后分析。經(jīng)過處理的核酸的甲基化狀態(tài)特異性分析的一些方法是已知的,其他替代方法也將是本領(lǐng)域技術(shù)人員明確了解的。采用本領(lǐng)域已知的方法,可以在本發(fā)明的擴增步驟中進行分析。在一個這樣的實施方案中,可以使用甲基化特異性引物寡核苷酸檢測包含SEQIDNO.I-SEQIDNO.91的核酸內(nèi)預先選擇的CpG位置的甲基化狀態(tài)。該技術(shù)描述于美國專利號6,265,171。權(quán)利要求用于分析卵巢癌病癥的方法,包括確定選自SEQIDNO.1-10和/或SEQIDNO.50-SEQIDNO.60的序列中一個或多個CpG二核苷酸的基因組甲基化狀態(tài)。2.權(quán)利要求1的方法,其中所述分析是檢測受試者中的卵巢癌,并且其中進行以下步驟a.提供來自要分析的受試者的樣品b.確定選自SEQIDNO.1-10和/或SEQIDNO.50-SEQIDNO.60的序列中一個或多個CpG二核苷酸的甲基化狀態(tài)。3.權(quán)利要求1或2的方法,其中額外進行以下步驟a.將來自甲基化狀態(tài)測試的一個或多個結(jié)果輸入獲自診斷多變量模型的分類器,b.計算樣品來自正常組織或卵巢癌組織的可能性,和/或,c.計算預測中的置信度的關(guān)聯(lián)P-值。4.權(quán)利要求1-3的方法,其中確定SEQIDNO.1_10和/或SEQIDNO.50-SEQIDNO.60的序列中的至少4個序列的甲基化狀態(tài)。5.權(quán)利要求1-4的方法,其中額外地確定SEQIDNO.11-49和/或61-91的一個或多個序列的甲基化狀態(tài)。6.權(quán)利要求1-5的方法,其中確定SEQID.NO.1-91中至少20個序列的甲基化狀態(tài)。7.權(quán)利要求1-6的方法,其中確定SEQIDNO.I-SEQIDNO.10和SEQIDNO.50-SEQIDNO.60的序列的甲基化狀態(tài)。8.權(quán)利要求1-7的方法,其中通過選自下組的一種或多種方法確定甲基化狀態(tài)a.亞硫酸氫鹽測序b.焦磷酸測序c.甲基化敏感性單鏈構(gòu)象分析(MS-SSCA)d.高分辨率解鏈分析(HRM)e.甲基化敏感性單核苷酸引物延伸(MS-SnuPE)f.堿基特異性切割/MALDI-T0Fg.甲基化特異性PCR(MSP)h.基于微陣列的方法,和i.mspI切割。9.權(quán)利要求1-8的任一項的方法,其中要分析的樣品來自選自下組的組織類型例如,來自要分析的組織的組織活檢物、陰道組織、舌、胰腺、肝、脾、卵巢、肌肉、關(guān)節(jié)組織、神經(jīng)組織、胃腸組織、腫瘤組織、體液、血液、血清、唾液和尿。10.權(quán)利要求2-9的方法,其中檢測原發(fā)癌。11.權(quán)利要求1-10的方法,其中將獲得的甲基化模式用于預測對卵巢癌治療的治療反應。12.包含核酸的組合物或陣列,所述核酸的序列與SEQIDNO.1_91的序列中的至少10個序列相同,其中所述組合物或陣列包含不超過100種不同的核酸分子。13.權(quán)利要求12的組合物或陣列,包含至少5個序列,所述序列的累積ρ值小于0.001,優(yōu)選小于0.0001。全文摘要本發(fā)明涉及用于分析卵巢癌病癥的方法,包括確定選自SEQIDNO.1-SEQIDNO.10和/或SEQIDNO.50-SEQIDNO.60的序列中一個或多個CpG二核苷酸的基因組甲基化狀態(tài)。任選地,額外進行以下步驟將來自甲基化狀態(tài)測試的一個或多個結(jié)果輸入獲自診斷多變量模型的分類器,計算樣品來自正常組織或卵巢癌組織的可能性,和/或,計算預測中的置信度的關(guān)聯(lián)p-值。文檔編號C12Q1/68GK101802226SQ200880107276公開日2010年8月11日申請日期2008年9月16日優(yōu)先權(quán)日2007年9月17日發(fā)明者J·B·??怂?R·盧西托,S·卡馬拉卡蘭申請人:皇家飛利浦電子股份有限公司;冷泉港實驗室