專(zhuān)利名稱(chēng):用于檢測(cè)dna甲基化模式的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于檢測(cè)與病癥的存在或發(fā)生病癥的素因相關(guān)的DNA甲基化標(biāo)簽 (signature )的方法,所述方法包括鑒定一個(gè)或多個(gè)在靶和參考樣品中展示出差異DNA甲基化的候選基因,以及分別測(cè)定在所述差異甲基化的候選基因中核酸位點(diǎn)和DNA結(jié)合因子的識(shí)別位點(diǎn),所述DNA結(jié)合因子各個(gè)識(shí)別這種差異甲基化的核酸位點(diǎn),其中得到的差異甲基化的核酸位點(diǎn)的模式和DNA結(jié)合因子識(shí)別位點(diǎn)的模式一起表示DNA甲基化標(biāo)簽,所述標(biāo)簽指示靶樣品中病癥的存在或發(fā)生病癥的素因。在具體應(yīng)用中,這些DNA甲基化標(biāo)簽允許對(duì)患者樣品分類(lèi),區(qū)分疾病亞型和/或疾病狀態(tài)以及監(jiān)測(cè)對(duì)治療的應(yīng)答性。
背景技術(shù):
DNA甲基化在多種生物(包括原核生物和真核生物)的基因組中被發(fā)現(xiàn)。在原核生物中,DNA甲基化發(fā)生在胞嘧啶和腺嘌呤堿基上并且包含部分宿主限制性系統(tǒng)。然而, 在多細(xì)胞真核生物中,甲基化似乎被限制在胞嘧啶堿基上并與被抑制的染色體狀態(tài)和基因表達(dá)抑制相關(guān)(例如在 Wilson, G.G.和 Murray, N. Ε. (1991) Annu. Rev. Genet. 25, 585 - 627所綜述的)。在哺乳動(dòng)物細(xì)胞中,DNA甲基化主要發(fā)生在CpG 二核苷酸上,其不均衡分布并在基因組中被低估(underr印resented)。通常未甲基化的CpG簇(被稱(chēng)為CpG島)在很多啟動(dòng)子區(qū)域被發(fā)現(xiàn)(例如在Li,E. (2002) Nat. Rev. Genet. 3,662-673中所綜述的)。導(dǎo)致異常的基因沉默的DNA甲基化的變化已在幾種人類(lèi)癌癥中被證明(例如在Robertson,K. D. 和Wolffe, A.P. (2000) Nat. Rev. Genet. 1,11-19中所綜述的)。啟動(dòng)子的過(guò)度甲基化被證明是導(dǎo)致腫瘤抑制基因失活的常見(jiàn)機(jī)制(Bird,A. P. (2002) Genes Dev. 16,6_21)。DNA甲基化可通過(guò)兩種不同機(jī)制的方法導(dǎo)致基因沉默第一種,在CpG 二核苷酸位點(diǎn)的甲基化阻止轉(zhuǎn)錄因子與其相關(guān)(Cognate)DNA識(shí)別序列結(jié)合;第二種,通過(guò)甲基-CpG的結(jié)合蛋白(MBD)家族識(shí)別甲基-CpG 二核苷酸位點(diǎn),因此引起甲基化DNA的抑制潛能。存在多種方法用于實(shí)驗(yàn)上確定單個(gè)基因的差異甲基化(例如在Rein,Τ.等人. (1998) Nucleic Acids Res. 26,2255-2264中所綜述的)。這些技術(shù)尤其包括亞硫酸氫鹽測(cè)序、甲基化特異性PCR (MSP)、Methylight和焦磷酸測(cè)序(pyro-sequencing)。亞硫酸氫鹽修飾將未甲基化的胞嘧啶殘基轉(zhuǎn)變?yōu)槟蜞奏さ谆陌奏埢3植皇苡绊?。亞硫酸氫鹽測(cè)序通常被認(rèn)為表示最合適的方法以便得到特定基因組序列的甲基化狀態(tài)的全貌(overview)。MSP是文獻(xiàn)中最普遍的方法,主要因?yàn)槠淠軌蛟诜浅S邢薜纳锊牧狭恐蟹治鯠NA甲基化狀態(tài)。Methylight和焦磷酸測(cè)序是基于定量PCR的方法。迄今幾種基因組范圍的方法學(xué)途徑也已被建立,包括限制性標(biāo)志性基因組掃描(RLGS)、甲基化間位點(diǎn)擴(kuò)增(AIMS)、差異甲基化雜交(DMH)和甲基化DNA免疫沉淀(甲基-DIP)。然而,所有這些方法結(jié)束在基因序列的具體位點(diǎn)甲基化狀態(tài)的物理分析上,但不提供此甲基化狀態(tài)對(duì)具體基因沉默的功能影響的進(jìn)一步信息。因此,對(duì)功能性地連接候選基因甲基化狀態(tài)和轉(zhuǎn)錄基因調(diào)節(jié)的方法仍有需求。
4
發(fā)明目的和概述
本發(fā)明的目的之一是提供新方法用于檢測(cè)一個(gè)或多個(gè)候選基因/基因座的DNA甲基化模式和用于功能性地將這些模式和所述候選基因的轉(zhuǎn)錄沉默相關(guān)聯(lián)。因此獲得的DNA甲基化標(biāo)簽可在篩查、診斷、預(yù)后和復(fù)發(fā)監(jiān)控的靶向診斷測(cè)試中被用作分子標(biāo)簽。具體地,本發(fā)明的目的之一是提供用于檢測(cè)與病癥的存在或發(fā)生病癥的素因相關(guān)的DNA甲基化標(biāo)簽的方法,所述方法基于鑒定一個(gè)或多個(gè)在靶和參考樣品中展示出差異 DNA甲基化的候選基因/基因座,以及鑒定在所述差異甲基化的候選基因/基因座中各自的核酸位點(diǎn)和DNA結(jié)合因子的識(shí)別位點(diǎn),所述DNA結(jié)合因子各個(gè)識(shí)別這種差異甲基化的核酸位點(diǎn),其中得到的差異甲基化的核酸位點(diǎn)的模式和DNA結(jié)合因子識(shí)別位點(diǎn)的模式一起表示 DNA甲基化標(biāo)簽,所述標(biāo)簽指示靶樣品中病癥的存在或發(fā)生病癥的素因。本發(fā)明的另一個(gè)具體目的是確定在特定的(生物學(xué)的)樣品中存在的過(guò)度甲基化并因此可參與腫瘤抑制基因沉默的候選基因/基因座的子集,和甲基化不足并因此可與癌基因激活相關(guān)的候選基因的子集,以及通過(guò)鑒定在差異甲基化位點(diǎn)識(shí)別候選基因/基因座轉(zhuǎn)的錄因子和/或甲基化蛋白結(jié)合蛋白來(lái)評(píng)估各自的候選基因/基因座對(duì)基因沉默的潛在影響。這些目的以及其它將從隨后的描述中變得明顯的目的通過(guò)獨(dú)立權(quán)利要求的主題來(lái)獲得。一些優(yōu)選的實(shí)施方案通過(guò)從屬權(quán)利要求的主題來(lái)詳細(xì)說(shuō)明。在一個(gè)實(shí)施方案中,本發(fā)明涉及檢測(cè)與病癥的存在或發(fā)生病癥的素因相關(guān)的DNA 甲基化標(biāo)簽的方法,所述方法包括
(a)提供多個(gè)匹配樣品,所述多個(gè)包含至少一個(gè)靶樣品和至少一個(gè)參考樣品;
(b)在至少一個(gè)靶樣品中鑒定一個(gè)或多個(gè)相對(duì)于至少一個(gè)參考樣品展示出差異DNA甲基化的候選基因/基因座;
(c)確定包含在步驟(b)中獲得的一個(gè)或多個(gè)差異甲基化的候選基因/基因座中的核酸位點(diǎn);以及
(d)確定在步驟(b)中獲得的一個(gè)或多個(gè)候選基因/基因座中DNA結(jié)合因子識(shí)別位點(diǎn)的存在,其中所述DNA結(jié)合因子各個(gè)識(shí)別在步驟(c)中確定的核酸位點(diǎn);
其中在步驟(c)中獲得的差異甲基化的核酸位點(diǎn)的模式和在步驟(d)中獲得的DNA結(jié)合因子識(shí)別位點(diǎn)的模式一起表示DNA甲基化標(biāo)簽,所述標(biāo)簽指示在所述至少一個(gè)靶樣品中病癥的存在或發(fā)生病癥的素因。在所述方法優(yōu)選的實(shí)施方案中,包含在一個(gè)或多個(gè)差異甲基化的候選基因/基因座中的核酸位點(diǎn)是CpG 二核苷酸位點(diǎn)。差異DNA甲基化優(yōu)選地通過(guò)選自以下的一個(gè)或多個(gè)方法來(lái)確定亞硫酸氫鹽測(cè)序、焦磷酸測(cè)序、甲基化敏感的單鏈構(gòu)象分析(MS-SSCA)、高分辨熔解分析(HRM)、甲基化敏感的單核苷酸引物延伸(MS-SnuPE)、堿基特異性切割/ MALDI-T0F,甲基化特異性PCR (MSP)、基于微陣列的方法和ife/71切割。在優(yōu)選的實(shí)施方案中,所述方法的步驟(C)進(jìn)一步包括將一個(gè)或多個(gè)差異甲基化的候選基因/基因座分為
-第一子集“m”,其為一個(gè)或多個(gè)包含在至少一個(gè)參考樣品中甲基化和在至少一個(gè)靶樣品中非甲基化的核酸位點(diǎn)的候選基因/基因座;和
-第二子集“Π”,其為一個(gè)或多個(gè)包含在至少一個(gè)參考樣品中非甲基化和在至少一個(gè)靶樣品中甲基化的核酸位點(diǎn)的候選基因/基因座。在另一個(gè)優(yōu)選的實(shí)施方案中,所述方法的步驟(d)進(jìn)一步包括對(duì)于一個(gè)或多個(gè) DNA結(jié)合因子的第一子集“M”確定和選擇識(shí)別位點(diǎn),其中DNA結(jié)合因子的子集“M”的每一個(gè)成員選擇性地識(shí)別子集“m”的一個(gè)或多個(gè)候選基因。在還另一個(gè)優(yōu)選的實(shí)施方案中,所述方法的步驟(d)進(jìn)一步包括對(duì)于一個(gè)或多個(gè) DNA結(jié)合因子的第二子集“N”確定和選擇識(shí)別位點(diǎn),其中DNA結(jié)合因子的子集“N”的每一個(gè)成員選擇性地識(shí)別子集“η”的一個(gè)或多個(gè)候選基因。特別優(yōu)選地,DNA結(jié)合因子的子集“N”表示DNA甲基結(jié)合蛋白。在進(jìn)一步具體的實(shí)施方案中,DNA甲基結(jié)合蛋白選自MBDl、MBD2、MBD3、MBD4、MIZF、Kaiso和MeCP2。在另一個(gè)具體的實(shí)施方案中,本發(fā)明的方法進(jìn)一步包括對(duì)于選擇的DNA結(jié)合因子的子集“M”每一個(gè)成員確定被識(shí)別的包含在子集“m”中的候選基因,和/或?qū)τ谶x擇的DNA 結(jié)合因子的子集“N”每一個(gè)成員確定被識(shí)別的包含在子集“η”中的候選基因。在還另一個(gè)具體的實(shí)施方案中,本發(fā)明的方法進(jìn)一步包括步驟(d)的一個(gè)或多個(gè)重復(fù),其中每一個(gè)重復(fù)包括在一個(gè)或多個(gè)候選基因/基因座中確定一個(gè)或多個(gè)DNA結(jié)合因子的識(shí)別位點(diǎn)的存在,所述DNA結(jié)合因子尚未包括在之前重復(fù)的確定中。優(yōu)選地,鑒定的DNA甲基化標(biāo)簽包含至少10個(gè)候選基因。在另一個(gè)優(yōu)選的實(shí)施方案中,一個(gè)或多個(gè)鑒定的候選基因的DNA甲基化標(biāo)簽指示在至少一個(gè)靶樣品中癌癥的存在或發(fā)生癌癥的素因。特別優(yōu)選地,對(duì)于候選基因的子集“ m” 鑒定的DNA甲基化標(biāo)簽指示一個(gè)或多個(gè)癌基因的激活和/或?qū)τ诤蜻x基因的子集“η”鑒定的DNA甲基化標(biāo)簽指示一個(gè)或多個(gè)腫瘤抑制基因的失活。在進(jìn)一步具體的實(shí)施方案中,所述方法在計(jì)算機(jī)上模擬進(jìn)行(i/7 silica)。在進(jìn)一步具體的實(shí)施方案中,本發(fā)明的方法進(jìn)一步用于預(yù)測(cè)對(duì)在至少一個(gè)靶樣品中存在的病癥或傾向發(fā)生的病癥的處理的治療應(yīng)答。在另一個(gè)實(shí)施方案中,本發(fā)明涉及如本文中所定義的DNA甲基化標(biāo)簽作為用于病癥的篩查、診斷、治療計(jì)劃和/或復(fù)發(fā)監(jiān)控的患者樣品分類(lèi)的生物標(biāo)記的用途。在還另一個(gè)實(shí)施方案中,本發(fā)明涉及所述方法與其它患者數(shù)據(jù)和臨床參數(shù)一起作為基于計(jì)算機(jī)的臨床決定系統(tǒng)的整體部分的用途。
圖1描述了用于確定包含在候選基因中的差異甲基化核酸位點(diǎn)的基于甲基化依賴的限制性分析的示例性方法的示意性說(shuō)明。所述方法的原則在實(shí)驗(yàn)部分更詳細(xì)地描述。圖2顯示了成簇的樣品(列)對(duì)甲基化基因座(行)的示例性分布。獲得的DNA甲基化模式允許區(qū)分腫瘤(頂部條的左邊部分)和正常組織(頂部條的右側(cè)部分)。圖3表示根據(jù)本發(fā)明的方法的通常原則的示意性說(shuō)明。圖4 (A)顯示差異甲基化基因座的列表(使用ifepl切割和MOMA陣列鑒定),其被發(fā)現(xiàn)指示區(qū)別不同的乳腺癌的亞型,即luminal A型對(duì)kisal and Her2型。(B)描述了表格,其包括甲基結(jié)合蛋白(MBP)、JfepI片段(MSP)(其中MBP結(jié)合位點(diǎn)被鑒定),到最近的基因的距離和所述最近的基因的名稱(chēng)。發(fā)明的具體描述
本發(fā)明基于確定DNA甲基化標(biāo)簽?zāi)軌蚩煽繖z測(cè)特定樣品中病癥的存在和發(fā)生病癥的素因的意外發(fā)現(xiàn),所述DNA甲基化標(biāo)簽基于包含在一個(gè)或多個(gè)差異甲基化的候選基因/基因座中的核酸位點(diǎn)的模式和識(shí)別所述差異甲基化的核酸位點(diǎn)的DNA結(jié)合因子識(shí)別位點(diǎn)的模式。在下文中說(shuō)明性地描述的本發(fā)明可適當(dāng)?shù)卦谌魏我鼗蚨鄠€(gè)要素、限制或多個(gè)限制缺乏情況下實(shí)踐,其不是本文中特別公開(kāi)的。本發(fā)明將關(guān)于具體實(shí)施方案和參考某些圖片進(jìn)行描述,但本發(fā)明不限于此而只由權(quán)利要求限制。描述的圖片只是示意性的并將認(rèn)為是非限制性的。在術(shù)語(yǔ)“包含”(comprising)被用于本描述和權(quán)利要求中的情況下,其不排除其它元素和步驟。為了本發(fā)明的目的,術(shù)語(yǔ)“由……組成”(consisting of)被認(rèn)為是術(shù)語(yǔ)“包含”(comprising of)的優(yōu)選實(shí)施方案。如果在下文中一組被定義為包含至少某個(gè)數(shù)量的實(shí)施方案,也可理解為公開(kāi)了優(yōu)選只由這些實(shí)施方案組成的組。在使用不定冠詞和定冠詞的情況下,當(dāng)涉及單數(shù)名詞例如“一”和“其”(“a”或 “an”、“the”)時(shí),這包括了該名詞的復(fù)數(shù),除非另外特別指出。另外,在說(shuō)明書(shū)和權(quán)利要求中術(shù)語(yǔ)第一、第二、第三、(a)、(b)、(c)和類(lèi)似術(shù)語(yǔ)用于區(qū)別相似的元素而對(duì)描述連續(xù)的或時(shí)間順序是非必要的。應(yīng)理解的是如此使用的術(shù)語(yǔ)在適當(dāng)?shù)沫h(huán)境中是可互換的,本文中所描述的本發(fā)明的實(shí)施方案能夠以其它而非本文中描述或舉例的順序進(jìn)行。術(shù)語(yǔ)的進(jìn)一步定義將在術(shù)語(yǔ)應(yīng)用的上下文中給出。以下術(shù)語(yǔ)或定義單獨(dú)提供以幫助理解本發(fā)明并不解釋為具有小于技術(shù)人員所理解的范圍。在第一方面,本發(fā)明涉及檢測(cè)與病癥的存在或發(fā)生病癥的素因相關(guān)的DNA甲基化標(biāo)簽的方法,所述方法包括
(a)提供多個(gè)匹配樣品,所述多個(gè)包含至少一個(gè)靶樣品和至少一個(gè)參考樣品;
(b)在至少一個(gè)靶樣品中鑒定一個(gè)或多個(gè)相對(duì)于至少一個(gè)參考樣品展示出差異DNA甲基化的候選基因/基因座;
(c)確定包含在步驟(b)中獲得的一個(gè)或多個(gè)差異甲基化的候選基因/基因座中的核酸位點(diǎn);以及
(d)確定在步驟(b)中獲得的一個(gè)或多個(gè)候選基因/基因座中DNA結(jié)合因子識(shí)別位點(diǎn)的存在,其中所述DNA結(jié)合因子各個(gè)識(shí)別在步驟(c)中確定的核酸位點(diǎn);
其中在步驟(c)中獲得的差異甲基化的核酸位點(diǎn)的模式和在步驟(d)中獲得的DNA結(jié)合因子識(shí)別位點(diǎn)的模式一起表示DNA甲基化標(biāo)簽,所述標(biāo)簽指示在所述至少一個(gè)靶樣品中病癥的存在或發(fā)生病癥的素因。本發(fā)明中所用的各自的靶樣品和參考樣品可以源自原核生物或真核生物來(lái)源。通常,所用的樣品是哺乳動(dòng)物樣品,其可以是人類(lèi)或非人類(lèi)來(lái)源的,優(yōu)選人類(lèi)樣品。本文中所用的術(shù)語(yǔ)“樣品”應(yīng)理解為不僅包括個(gè)體細(xì)胞還包括組織、器官和生物體。本文中所用的術(shù)語(yǔ)“靶樣品”是指至少假定展示或具有發(fā)生病癥的素因的樣品,而術(shù)語(yǔ)“參考樣品”(也稱(chēng)為“對(duì)照樣品”)通常表示不具有這樣病癥的特征的野生型材料(例
7如健康細(xì)胞)。但是,在一些應(yīng)用中,本發(fā)明的方法可用于分析和比較幾種展示病癥特征的樣品(例如,疾病早期和疾病狀態(tài)),例如為了監(jiān)控疾病發(fā)展。在這樣的情況中,如果不包括野生型(健康)對(duì)照樣品,具有較輕疾病特征的樣品通常作為“參考樣品”。本文中所用的術(shù)語(yǔ)“匹配樣品”表示多個(gè)至少兩個(gè)彼此相關(guān)的樣品。例如,被分析的樣品對(duì)可包括一個(gè)源自患病(例如癌癥)患者的靶樣品和一個(gè)源自健康個(gè)體的參考樣品。 但是本發(fā)明的方法不限于分析樣品對(duì)。例如,也可能對(duì)比一個(gè)參考樣品分析4個(gè)不同的靶樣品,例如源自患相同疾病但受不同程度影響的患者的靶樣品(例如3個(gè)不同的癌癥前期狀態(tài)和一個(gè)癌癥樣品)。因此,本文中所用的術(shù)語(yǔ)“多個(gè)匹配樣品”表示任何偶數(shù)或奇數(shù)的彡2的樣品(例如2、3、4、5、6、7、8、9、10、11、12等等),只要多個(gè)樣品包含至少一個(gè)靶樣品和至少一個(gè)參考樣品。通常本發(fā)明中所用的靶樣品和參考樣品源自從被治療的個(gè)體收集來(lái)的生物材料。 另外,為了確保獲得的數(shù)據(jù),“對(duì)比樣品”也可從具有特定已知疾病狀態(tài)的個(gè)體處收集。生物樣品可包括身體組織(例如活檢或切除)和/或體液,如血液、痰和尿。另外,生物樣品可包含源自對(duì)象的細(xì)胞群的細(xì)胞抽提物或細(xì)胞群。任選地,細(xì)胞或細(xì)胞抽提物可從獲得的身體組織和液體中純化,如果必要然后用作生物樣品。本發(fā)明的方法中所用的樣品應(yīng)通常以臨床可接受的方式收集,優(yōu)選以核酸或蛋白質(zhì)被保存的方式。本文中所用的術(shù)語(yǔ)“病癥”可最廣義地理解。該術(shù)語(yǔ)表示(i)任何類(lèi)型的醫(yī)學(xué)情況,即靶樣品(即細(xì)胞和/或組織)中相對(duì)于未受影響的(野生型)對(duì)照樣品展示功能紊亂和 /或異常細(xì)胞表型特征的任何形態(tài)學(xué)和/或生理學(xué)改變;和/或(ii)在各自的靶樣品和參考樣品之間任何形態(tài)學(xué)、生理學(xué)和/或藥理學(xué)差異。根據(jù)(i)的改變的實(shí)例可尤其涉及細(xì)胞大小和形狀(增大或縮小)、細(xì)胞增殖(細(xì)胞數(shù)量增長(zhǎng))、細(xì)胞分化(生理狀態(tài)改變)、凋亡(程序化細(xì)胞死亡)或細(xì)胞存活。根據(jù)(ii)的差異的實(shí)例包括尤其腫瘤樣品對(duì)比健康對(duì)照(為了診斷或復(fù)發(fā)監(jiān)控的目的)、浸潤(rùn)性對(duì)比非浸潤(rùn)性腫瘤樣品(即不同腫瘤階段和/或腫瘤亞型;為了預(yù)后分析的目的)、相關(guān)于治療方案的情況如對(duì)特定病癥/醫(yī)學(xué)情況特殊治療的應(yīng)答性對(duì)比非應(yīng)答性。因此術(shù)語(yǔ)病癥可解釋為兩個(gè)或多個(gè)樣品之間的基于所述樣品可被區(qū)分和/或分類(lèi)的任何種類(lèi)差異。在優(yōu)選的實(shí)施方案中,病癥是癌癥,即一類(lèi)惡性瘤(也稱(chēng)為癌)包括尤其是結(jié)腸癌、 肺癌、肝癌、乳腺癌、卵巢癌和胰腺癌、黑色素瘤、神經(jīng)細(xì)胞瘤(例如成膠質(zhì)細(xì)胞瘤、星形細(xì)胞瘤、髓母細(xì)胞瘤)及其它。如本文中所用的術(shù)語(yǔ)“具有發(fā)生病癥的素因”表示任何指示病癥前期狀態(tài)的細(xì)胞表型,即正常轉(zhuǎn)化到異常表型的中間狀態(tài)。換言之,該術(shù)語(yǔ)表示發(fā)生病癥的危險(xiǎn)狀態(tài)。本文中所用的術(shù)語(yǔ)“鑒定一個(gè)或多個(gè)候選基因/基因座”應(yīng)以從存在于特定樣品中的經(jīng)歷差異甲基化的基因的組中“選擇”至少一個(gè)候選基因的意義解釋。如本文中所用的術(shù)語(yǔ)“候選基因”(本文也稱(chēng)為“候選基因座”)涉及在其核酸序列中包含一個(gè)或多個(gè)可以甲基化狀態(tài)和非甲基化狀態(tài)存在的核酸位點(diǎn)的任何基因座。在本發(fā)明的上下文中,術(shù)語(yǔ)基因不必要限制為編碼蛋白的序列(開(kāi)放讀碼框)也包括基因間的區(qū)域。選擇(即選擇的候選基因/基因座的數(shù)量和/或種類(lèi))可以改變,例如依賴于待分析的疾病或病癥的治療形式,包括對(duì)分析的樣品取自的治療個(gè)體的疾病的治療干預(yù)、診斷標(biāo)準(zhǔn)如疾病階段和疾病監(jiān)控和監(jiān)督。另外術(shù)語(yǔ)“鑒定”包含了確定在至少一個(gè)靶樣品和至少一個(gè)參考樣品中差異DNA甲基化的程度和比較獲得的結(jié)果。鑒定的一個(gè)或多個(gè)候選基因/基因座可單獨(dú)地進(jìn)行進(jìn)一步分析或其可被聚類(lèi)到一個(gè)或多個(gè)候選基因/基因座標(biāo)簽,其中每個(gè)標(biāo)簽的實(shí)體被整體分析(即一起)。如本文中所用的術(shù)語(yǔ)“候選基因/基因座標(biāo)簽”表示至少兩個(gè)彼此相關(guān)的候選基因/基因座的子集, 例如,編碼功能相等的蛋白或參與相同的信號(hào)通路的蛋白或類(lèi)似情況。本文中所用的術(shù)語(yǔ)“DNA甲基化”表示DNA的化學(xué)修飾類(lèi)型,其包括添加甲基基團(tuán)到DNA上,例如添加到胞嘧啶的嘧啶環(huán)的C5碳原子或添加到腺嘌呤的嘌呤環(huán)的N6氮原子, 其是本文中特別優(yōu)選的第一選擇。此修飾可遺傳并隨后不改變?cè)糄NA序列地被移除。如此,其為表觀遺傳學(xué)編碼的部分及最佳表征的表觀遺傳學(xué)機(jī)制。在胞嘧啶C5處的DNA甲基化已在每種檢查的脊椎動(dòng)物中被發(fā)現(xiàn)。在成年的體組織(somatic tissues)中,DNA甲基化通常發(fā)生在CpG 二核苷酸的情況中(參看下文)。非 CpG甲基化是普遍的,例如在胚胎干細(xì)胞中。DNA甲基化是可逆的DNA甲基轉(zhuǎn)移酶催化甲基基團(tuán)從S-腺苷-L-甲硫氨酸轉(zhuǎn)移到胞嘧啶或腺嘌呤殘基。在復(fù)制中DNA聚合酶不復(fù)制甲基化狀態(tài)(例如在 Robertson, K. D.和 Wolffe, A. P. (2000),如上;Li, Ε. (2002),如上;Bird, A. P. (2002),如上綜述的)。如本文中所用的術(shù)語(yǔ)“差異DNA甲基化”表示具體候選基因(包含在其序列中的一個(gè)或多個(gè)核酸位點(diǎn)上)在至少一個(gè)靶樣品中甲基化但在至少參考樣品中非甲基化的情況, 或者反之亦然,具體候選基因(包含在其序列中的一個(gè)或多個(gè)核酸位點(diǎn)上)在至少一個(gè)參考樣品中非甲基化但在至少靶樣品中甲基化的情況。通常地,一個(gè)或多個(gè)候選基因/基因座的差異DNA甲基化模式的確定可通過(guò)本領(lǐng)域已知的任何方法完成。在優(yōu)選的實(shí)施方案中,差異DNA甲基化通過(guò)一個(gè)或多個(gè)選自以下的方法確定亞硫酸氫鹽測(cè)序、焦磷酸測(cè)序、甲基化敏感的單鏈構(gòu)象分析(MS-SSCA)、 高分辨熔解分析(HRM)、甲基化敏感的單核苷酸引物延伸(MS-SnuPE)、堿基特異性切割/ MALDI-TOF,甲基化特異性PCR (MSP)、基于微陣列的方法和i&pl切割構(gòu)成(例如在Rein, Τ.等人.(1998),如上中綜述的)。進(jìn)一步適合的方法例如在美國(guó)專(zhuān)利申請(qǐng)2006/(^92564 Al中被公開(kāi)。一個(gè)或多個(gè)候選基因/基因座的差異DNA甲基化模式的確定已包括鑒定如根據(jù)本發(fā)明的方法的步驟(c)中定義的包含在一個(gè)或多個(gè)的候選基因中的準(zhǔn)確的核酸位點(diǎn)(即序列原件,遺傳位點(diǎn))。在本方法優(yōu)選的實(shí)施方案中,包含在一個(gè)或多個(gè)差異甲基化的候選基因/基因座中的核酸位點(diǎn)是CpG 二核苷酸位點(diǎn)。如本文中所使用的術(shù)語(yǔ)“CpG 二核苷酸位點(diǎn)”(或者“CpG位點(diǎn)”)是指DNA區(qū)域,其中胞嘧啶核苷酸在線性序列上定位直接與鳥(niǎo)嘌呤核苷酸相鄰?!癈pG”表示通過(guò)磷酸分隔的胞嘧啶和鳥(niǎo)嘌呤(即-C-磷酸-G-)?!癈pG”符號(hào)用于區(qū)分胞嘧啶接著鳥(niǎo)嘌呤和胞嘧啶堿基配對(duì)到鳥(niǎo)嘌呤。存在具有較高濃度的CpG位點(diǎn)的DNA區(qū)域,被稱(chēng)為CpG島。哺乳動(dòng)物基因組中很多基因具有與基因轉(zhuǎn)錄起始位點(diǎn)(包括啟動(dòng)子)相關(guān)的CpG島。基因啟動(dòng)子中的CpG位點(diǎn)過(guò)度甲基化(即升高的甲基化水平)可引起基因的沉默,其為例如在多種人類(lèi)癌癥中發(fā)現(xiàn)的特征(例如癌癥抑制基因的沉默)。相反,CpG位點(diǎn)的甲基化不足(即降低的甲基化水平)已與癌癥細(xì)胞中的癌基因過(guò)表達(dá)相關(guān)(例如在Robertson, K. D.和 Wolffe, A. P. (2000),如上;Li, Ε. (2002),如上;Bird, Α. P. (2002),如上,· Klose, R.J.和 Bird, A. P. (2006) Trends Biochem. Sci. 31,89-97 中綜述的)。在優(yōu)選的實(shí)施方案中,所述方法的步驟(C)進(jìn)一步包括將一個(gè)或多個(gè)差異甲基化的候選基因/基因座分為
-第一子集“m”,其為一個(gè)或多個(gè)包含在至少一個(gè)參考樣品中甲基化和在至少一個(gè)靶樣品中非甲基化的核酸位點(diǎn)的候選基因/基因座;和
-第二子集“n”,其為一個(gè)或多個(gè)包含在至少一個(gè)參考樣品中非甲基化和在至少一個(gè)靶樣品中甲基化的核酸位點(diǎn)的候選基因/基因座。在本發(fā)明的上下文中,候選基因/基因座可包含僅單個(gè)在至少一個(gè)靶樣品和至少一個(gè)參考樣品之間差異甲基化的核酸位點(diǎn)。但是,也可能的是具有多于一個(gè)這樣的核酸位點(diǎn)的特定的候選基因/基因座,所述核酸位點(diǎn)可以是相同類(lèi)型(即其全部屬于如上定義的子集“m”或其全部屬于如上定義的子集“η”)或不同類(lèi)型(即至少其中一個(gè)屬于如上定義的子集“m”并且至少一個(gè)其它的屬于如上定義的子集“η”)。在多于一個(gè)包含在特定的候選基因/基因座中的差異甲基化核酸位點(diǎn)的情況中,隨后的DNA結(jié)合因子識(shí)別位點(diǎn)分析,如根據(jù)本發(fā)明的方法的步驟(d)定義的,可對(duì)每一個(gè)單獨(dú)的核酸位點(diǎn)分別進(jìn)行或?qū)蜻x基因以其整體進(jìn)行。因此,術(shù)語(yǔ)“候選基因/基因座”和“核酸”可在本文中交替使用,依賴進(jìn)行分析的的類(lèi)型。因此,本發(fā)明的方法可包括選擇和分析一個(gè)或多個(gè)候選基因、一個(gè)或多個(gè)核酸位點(diǎn)或者其組合。類(lèi)似地,DNA甲基化狀態(tài)(或水平)可涉及單獨(dú)的核酸位點(diǎn)或包含多于一個(gè)核酸位點(diǎn)的候選基因/基因座的整個(gè)甲基化水平。如果多個(gè)核酸位點(diǎn)是相同類(lèi)型的(參見(jiàn)上文), 后一種情況表現(xiàn)出不加鑒別的(uncritical)。但是,在多個(gè)核酸位點(diǎn)包含不同類(lèi)型的實(shí)體的情況下,如果在至少一個(gè)靶樣品中相對(duì)于至少一個(gè)參考樣品比反之具有更高數(shù)量的非甲基化核酸位點(diǎn)變?yōu)榧谆?,則候選基因/基因座被認(rèn)為是處于“甲基化”狀態(tài)。另一方面, 如果在至少一個(gè)靶樣品中相對(duì)于至少一個(gè)參考樣品比反之具有更高數(shù)量的甲基化核酸位點(diǎn)變?yōu)榉羌谆模瑒t候選基因/基因座被認(rèn)為是處于“非甲基化”狀態(tài)。如本發(fā)明的方法的步驟(d)中定義的,確定在一個(gè)或多個(gè)候選基因/基因座中DNA 結(jié)合因子的識(shí)別位點(diǎn)的存在也可通過(guò)本領(lǐng)域已知的任何方法來(lái)完成。通常,此目標(biāo)通過(guò)將一個(gè)或多個(gè)DNA結(jié)合因子的各自DNA識(shí)別(即結(jié)合)位點(diǎn)的一致序列(從文獻(xiàn)或從數(shù)據(jù)庫(kù)如 TRANSFAC 中獲得;Wingender, E.等.Nucleic Acids Res. 24,21-25)與一個(gè)或多個(gè)待分析的候選基因的核酸序列比對(duì)來(lái)完成。在本發(fā)明中,僅考慮那些與差異甲基化位點(diǎn)相同或重疊的識(shí)別位點(diǎn),以這樣的方式,如本文中定義的DNA結(jié)合因子對(duì)識(shí)別位點(diǎn)的識(shí)別/結(jié)合阻止此位點(diǎn)的甲基化,或反之亦然,位點(diǎn)的甲基化阻止DNA結(jié)合因子識(shí)別/結(jié)合位點(diǎn)。換言之,在包含在候選基因中的特定的核酸位點(diǎn)上存在DNA甲基化和DNA結(jié)合因子識(shí)別的相互排斥性。如本文中所用的術(shù)語(yǔ)“DNA結(jié)合因子”表示結(jié)合靶DNA分子中特定序列元件的任何蛋白質(zhì),因此發(fā)揮關(guān)于所述DNA分子表達(dá)的任何作用,優(yōu)選在轉(zhuǎn)錄水平上,即,激活(或增強(qiáng)) 或者抑制(或沉默)基因表達(dá)。因此,DNA結(jié)合因子通常也稱(chēng)為“轉(zhuǎn)錄因子”。這樣的DNA結(jié)合因子的實(shí)例包括尤其是真核生物通常的參與轉(zhuǎn)錄預(yù)起始復(fù)合物組裝的轉(zhuǎn)錄因子(TFIIA、 TFIIB、TFIID、TFIIE、TFIIF和TFIIH)、上游轉(zhuǎn)錄因子(結(jié)合起始位點(diǎn)上游某處以刺激或抑制轉(zhuǎn)錄)和可誘導(dǎo)的轉(zhuǎn)錄因子(類(lèi)似于上游轉(zhuǎn)錄因子但需要激活或抑制)。后兩類(lèi)的具體實(shí)例包括例如螺旋-環(huán)-螺旋/亮氨酸拉鏈因子、鋅指因子、螺旋-轉(zhuǎn)角-螺旋因子(例如 homeo結(jié)構(gòu)域因子、叉型頭/翼螺旋因子、熱休克因子)、β _支架因子(例如STAT因子,TATA 結(jié)合因子)及甲基化DNA結(jié)合蛋白,后者特別優(yōu)選(參見(jiàn)下文)。如上文概述的,DNA甲基化可通過(guò)兩種不同機(jī)制導(dǎo)致基因沉默第一,CpG 二核苷酸位點(diǎn)的甲基化阻止具有其同類(lèi)DNA識(shí)別序列的轉(zhuǎn)錄因子結(jié)合到這樣的位點(diǎn);以及第二, 甲基-CpG結(jié)合蛋白(MBD)家族識(shí)別甲基-CpG 二核苷酸位點(diǎn),因此引起甲基化的DNA的抑制潛能。在第一個(gè)提到的情況中,識(shí)別序列類(lèi)似候選基因/差異甲基化核酸位點(diǎn)的第一子集“m”,其在至少一個(gè)參考樣品中甲基化并在至少一個(gè)靶樣品中非甲基化。在第二個(gè)情況中,識(shí)別序列類(lèi)似候選基因/差異甲基化核酸位點(diǎn)的第二子集“n”,其在至少一個(gè)參考樣品中非甲基化并在至少一個(gè)靶樣品中甲基化。因此,DNA結(jié)合因子和DNA結(jié)合因子的識(shí)別位點(diǎn)的不同子集可以分別被定義。在優(yōu)選的實(shí)施方案中,所述方法的步驟(d)進(jìn)一步包括為一個(gè)或多個(gè)DNA結(jié)合因子的第一子集“M”確定和選擇識(shí)別位點(diǎn),其中DNA結(jié)合因子的子集“M”的每一個(gè)成員選擇性地識(shí)別子集“m”的一個(gè)或多個(gè)候選基因。在另一個(gè)優(yōu)選的實(shí)施方案中,所述方法的步驟(d)進(jìn)一步包括為一個(gè)或多個(gè)DNA 結(jié)合因子的第二子集“N”確定和選擇識(shí)別位點(diǎn),其中DNA結(jié)合因子的子集“N”的每一個(gè)成員選擇性地識(shí)別子集“η”的一個(gè)或多個(gè)候選基因。在本發(fā)明特別優(yōu)選的實(shí)施方案中,DNA結(jié)合因子的子集“N”表示DNA甲基結(jié)合蛋白。最優(yōu)選的,DNA甲基結(jié)合蛋白選自MBDl、MBD2、MBD3、MBD4、MIZF、Kaiso和MeCP22。如本文中所用的術(shù)語(yǔ)“DNA甲基結(jié)合蛋白”表示DNA結(jié)合因子的特定家族,其特異性識(shí)別甲基化的DNA序列,特別是甲基化的CpG 二核苷酸(mCpG)。DNA甲基結(jié)合蛋白在十幾年前被鑒定(例如在 Bird, Α. P.和 Wolffe,Α. P. (1999) Cell 99,451-454; Wade, P. A. (2001) BioEssaysl ,, 1131-1137 ;Hendrich, B.禾口 Tweedie, S. (2003) Trends Genet. 19,269-277中綜述的)。甲基-CpG-結(jié)合結(jié)構(gòu)域(MBD)——負(fù)責(zé)結(jié)合甲基化的CpG 二核苷酸的蛋白基序——的特征促進(jìn)共享此結(jié)構(gòu)域的蛋白家族的生物信息鑒定。除了 MBD3(包含阻止結(jié)合到甲基-CpG上的氨基酸取代),哺乳動(dòng)物的MBD蛋白(命名為MBD1-MBD4)和正在建立的(founding)成員MeCP2均特異性識(shí)別甲基_CpG。MIZF表示MBD2相互作用的鋅指,其組成MeCPl組蛋白脫乙酰酶(HDAC)復(fù)合物的組分。名為Kaiso的新MBP缺乏MBD, 但通過(guò)鋅指結(jié)構(gòu)域識(shí)別甲基化的DNA。所有MBP可介導(dǎo)基因表達(dá)沉默。這通過(guò)將染色質(zhì)重塑輔阻遏物復(fù)合物靶向到包含DNA甲基化的區(qū)域來(lái)完成。本文中特別提及的所有6個(gè)甲基 DNA結(jié)合蛋白是本領(lǐng)域眾所周知的。它們的核酸序列及其DNA識(shí)別保守基序可從數(shù)據(jù)庫(kù)如 GeneBank中得到。相應(yīng)的6個(gè)人類(lèi)基因的核苷酸序列保存在GenBank中,其具有以下登記號(hào) MBD1 ΝΜ_015846 (異構(gòu)體1 ;總共4個(gè)異構(gòu)體)
MBD2: NM_003927 (異構(gòu)體1 ;總共2個(gè)異構(gòu)體) MBD3: NM 003926MBD4: NM_003925 MIZF NM_015517
MeCP2:NM_004992 (異構(gòu)體1 ;總共2個(gè)異構(gòu)體) Kaiso: NM_006777o根據(jù)本發(fā)明,對(duì)于確定DNA結(jié)合因子的識(shí)別位點(diǎn)的存在的以上分析可對(duì)包含在差異甲基化的候選基因/基因座中的單獨(dú)的核酸位點(diǎn)、對(duì)包含在單獨(dú)的候選基因/基因座中的2個(gè)或更多這樣的位點(diǎn)和對(duì)2個(gè)或更多候選基因/基因座(每一個(gè)基因包含一個(gè)或多個(gè)差異甲基化位點(diǎn))分別地進(jìn)行,其中2個(gè)或多個(gè)位點(diǎn)可伴隨地或順序地分析。另外,任何這些分析可對(duì)于一個(gè)或多個(gè)DNA結(jié)合因子的識(shí)別位點(diǎn)進(jìn)行,其中保守結(jié)合序列存在的評(píng)估可伴隨地或者順序地進(jìn)行。在一些實(shí)施方案中,本發(fā)明的方法進(jìn)一步在步驟(d)中包含一個(gè)或多個(gè)分析循環(huán), 每一個(gè)循環(huán)包含在一個(gè)或多個(gè)鑒定的候選基因中確定DNA結(jié)合因子識(shí)別位點(diǎn)和隨后選擇 DNA結(jié)合因子識(shí)別位點(diǎn)的一個(gè)或多個(gè)子群,其存在于一個(gè)或多個(gè)候選基因/基因座中,或反之亦然,其在一個(gè)或多個(gè)候選基因/基因座中缺乏。隨后僅選擇的一個(gè)或多個(gè)子群(和因此僅包含各自結(jié)合位點(diǎn)的候選基因/基因座)進(jìn)行另一輪分析。因此,本發(fā)明的方法可包括步驟(d)的一個(gè)或多個(gè)重復(fù),其中每一個(gè)重復(fù)包括在一個(gè)或多個(gè)候選基因/基因座中確定一個(gè)或多個(gè)DNA結(jié)合因子的識(shí)別位點(diǎn)的存在,其尚未包括在之前重復(fù)的確定中。例如,在分析的第一輪中,如上文定義的DNA結(jié)合因子的子集N被選擇。因此,只有那些包含對(duì)于DNA結(jié)合因子該子集N的結(jié)合位點(diǎn)的候選基因(即子集“η”的候選基因)將被進(jìn)一步考慮。隨后假定的是DNA結(jié)合因子的子集N包含轉(zhuǎn)錄因子的一個(gè)或多個(gè)(結(jié)構(gòu)上和/或功能上相關(guān)的)家族,命名為子群Ni、Ν2、Ν3、Ν4、Ν5、Ν6等等。在第二輪,只有子群 Nl (例如甲基DNA結(jié)合蛋白)會(huì)被分析。因此,僅包含對(duì)于m識(shí)別位點(diǎn)的候選基因的相應(yīng)子群“nl”將被選擇并進(jìn)行第三輪分析?,F(xiàn)在,假定子群m包含多個(gè)單獨(dú)的DNA結(jié)合因子, 命名為Ni” Nl2, Nl3、Nl4, Nl5, Nl6等等。在第三輪,只有Nl1和Nl2 (例如MBDl和MBD2)會(huì)被分析。因此,在三個(gè)選擇循環(huán)后,只有那些表達(dá)受W1和附2的結(jié)合影響的候選基因保留。也可能的是組合分析陽(yáng)性(存在特異性識(shí)別位點(diǎn))和陰性特征(缺失另一個(gè)特異性識(shí)別位點(diǎn))。因此,通過(guò)使用這種方法,遺傳網(wǎng)絡(luò)可被闡明,例如甲基化依賴表達(dá)的候選基因通過(guò)單個(gè)轉(zhuǎn)錄因子調(diào)節(jié)。因此,在具體實(shí)施方案中,本發(fā)明的方法進(jìn)一步包括對(duì)于選擇的DNA結(jié)合因子的子集“M”每一個(gè)成員確定被識(shí)別的包含在子集“m”中的候選基因,和/或?qū)τ谶x擇的DNA 結(jié)合因子的子集“N”每一個(gè)成員確定被識(shí)別的包含在子集“η”中的候選基因。因此,本發(fā)明的方法導(dǎo)致確定包含在一個(gè)或多個(gè)候選基因/基因座中的差異甲基化核酸位點(diǎn)的模式和對(duì)于特異性結(jié)合差異甲基化核酸位點(diǎn)的DNA結(jié)合因子確定識(shí)別位點(diǎn)的模式。相關(guān)的這些模式加起來(lái)成為獨(dú)特的DNA甲基化標(biāo)簽,其指示在至少一個(gè)靶樣品中病癥的存在或發(fā)生病癥的素因。如本文中所用的術(shù)語(yǔ)“DNA甲基化標(biāo)簽”(也稱(chēng)為“生物標(biāo)簽”)表示一組一個(gè)或多個(gè)候選基因/基因座,其具有特定DNA甲基化相應(yīng)的模式,以及存在于其核酸序列中的DNA 結(jié)合因子識(shí)別位點(diǎn)的相應(yīng)特定模式。此獨(dú)特的組合允許鑒定靶樣品中能夠?qū)袠悠窂膮⒖紭悠分袇^(qū)分出的表型狀態(tài)(例如病癥)。
換言之,根據(jù)本發(fā)明,DNA甲基化標(biāo)簽以其總體(即一個(gè)或多個(gè)差異甲基化候選基因一起)指示病癥的存在而不是僅僅任何像這樣的單獨(dú)的候選基因/基因座的差異甲基化可指示的。在本發(fā)明的上下文中,確定DNA結(jié)合因子的識(shí)別位點(diǎn)的模式也可被認(rèn)為是“過(guò)濾系統(tǒng)”,用于增加DNA甲基化標(biāo)簽/生物標(biāo)簽用于具體應(yīng)用(例如用于診斷特定的腫瘤亞型和將所述亞型從其他可能接近的相關(guān)亞型中區(qū)分出來(lái))的意義。因此,這樣的過(guò)濾器可被用于基于其調(diào)節(jié)潛力(即基于序列的保守值和其中調(diào)節(jié)元件的存在)區(qū)分包含在這樣的生物標(biāo)簽中的候選基因/基因座的優(yōu)先次序。在具體的實(shí)施方案中,DNA甲基化標(biāo)簽包含至少3個(gè)或至少5個(gè)候選基因。優(yōu)選地,DNA甲基化標(biāo)簽包含至少10個(gè)候選基因(例如12、15、20、50、100、200、1000或更多個(gè))。在進(jìn)一步具體的實(shí)施方案中,所述方法在計(jì)算機(jī)中模擬進(jìn)行。如本文中所用的術(shù)語(yǔ)“在計(jì)算機(jī)中模擬”、“inO可理解為“在計(jì)算機(jī)上或通過(guò)計(jì)算機(jī)模擬進(jìn)行”。本發(fā)明的方法可通過(guò)計(jì)算機(jī)模擬完整地進(jìn)行或至少部分地,即通過(guò)組合實(shí)驗(yàn)方法和計(jì)算機(jī)模擬進(jìn)行。這可依賴于具體應(yīng)用、待分析的樣品的類(lèi)型、待檢查或診斷的情況等。用于進(jìn)行這樣的計(jì)算機(jī)模擬的方法和軟件是商業(yè)上可獲得的并且是本領(lǐng)域眾所周知的。在另一個(gè)優(yōu)選的實(shí)施方案中,一個(gè)或多個(gè)鑒定的候選基因/基因座的DNA甲基化標(biāo)簽指示在至少一個(gè)靶樣品中癌癥的存在或發(fā)生癌癥的素因(也參見(jiàn)上文討論的)。特別優(yōu)選地,對(duì)于候選基因/基因座的子集“III”鑒定的DNA甲基化標(biāo)簽指示一個(gè)或多個(gè)癌基因的激活和/或?qū)τ诤蜻x基因/基因座的子集“η”鑒定的DNA甲基化標(biāo)簽指示一個(gè)或多個(gè)腫瘤抑制基因的失活。在進(jìn)一步具體的實(shí)施方案中,本發(fā)明的方法進(jìn)一步用于預(yù)測(cè)對(duì)在至少一個(gè)靶樣品中存在的病癥或傾向發(fā)生的病癥的處理的治療應(yīng)答。在另一方面,本發(fā)明涉及如本文定義的DNA甲基化標(biāo)簽作為用于病癥的篩查、診斷、治療計(jì)劃和/或復(fù)發(fā)監(jiān)控的患者樣品分類(lèi)的生物標(biāo)記的用途。在還另一個(gè)方面,本發(fā)明涉及所述方法與其它患者數(shù)據(jù)和臨床參數(shù)一起用作基于計(jì)算機(jī)的臨床決定系統(tǒng)的整體部分的用途。本發(fā)明進(jìn)一步通過(guò)附圖和以下實(shí)施例描述,其僅用于闡明本發(fā)明的具體實(shí)施方案的目的,并不解釋為以任何方式限制本發(fā)明的范圍。
實(shí)施例1.樣品
患者樣品從挪威奧斯陸挪威Radium醫(yī)院獲得?;颊咄飧鶕?jù)法律規(guī)定獲得。2. CpG 島
注釋的CpG島從UCSC基因組瀏覽器中獲得。這些島用Gardiner-Garden定義預(yù)測(cè) (Gardiner-Garden, Μ·和Frommer, Μ. (1987) J. Mol. Biol. 196,洸1_82),其包括以下標(biāo)準(zhǔn)長(zhǎng)度彡200 bp ;% GC彡50% ;觀測(cè)的/預(yù)期的CpG彡0.6。在基因組中有在200bp 到2000bp的大小范圍內(nèi)的約沈219個(gè)CpG島。這些島用i&pl限制性片段化良好地覆蓋。陣列由 Roche NimbleGen he. (Madison, WI, USA)生產(chǎn),對(duì)下列說(shuō)明使用 390K 格式。來(lái)自人類(lèi)基因組構(gòu)造33(hgl7)的CpG島注釋用于設(shè)計(jì)50mer的疊瓦式陣列(tiling array)。
13
50mer被轉(zhuǎn)移到島序列坐標(biāo)的任意一側(cè)以平均分配在島上。390K格式具有367658 個(gè)可利用的特征,其不適合所有帶有50mer瓦的島。因此基于大小表示的島的截止值僅用被測(cè)定的具有200bp到2000bp大小的CpG島確定。設(shè)計(jì)對(duì)照探針以表示背景信號(hào)。樣品制備基本上如之前描述的進(jìn)行 (Lucito,R.等人Q003) Genome Res. 13,2291-2305), 除了以下修正(i)使用的主要限制性核酸內(nèi)切酶是i&pl。(ii)在消化后,接頭
和ASPIianer被連接。1 ^iier是非磷酸化的并且不會(huì)被連接。(iii)在連接后,材料通過(guò)酚 /氯仿抽提純化、沉淀、離心和重懸。然后材料被分成兩等份,一半用限制性核酸內(nèi)切酶JfcrBC消化,另一半被模擬消化。4個(gè)250 μ 1管被用于每一個(gè)樣品對(duì)的代表的PCR擴(kuò)增,每一個(gè)具有100 μ 體積反應(yīng)。 循環(huán)條件是95°C 1分鐘,72°C 3分鐘,15個(gè)循環(huán),隨后72°C延伸10分鐘。然后每一對(duì)管中的內(nèi)容物被集中起來(lái)。樣品通過(guò)酚/氯仿抽提清潔、沉淀、重懸,DNA濃度被確定。DNA如描述的被標(biāo)記(Lucito,R.等人O003),之前)除了小量改變。簡(jiǎn)要地, 2 μg DNA模板(溶解在TE緩沖液中,pH8.0)置于0.2 ml PCR管。5 μ 1隨機(jī)九聚物 (Sigma-Aldrich Co. , St. Louis, MI, USA)被加入,用 dH20調(diào)節(jié)終體積至 25 μ ,樣品被混勻。管在100°C孵育5分鐘,然后在冰上5分鐘。向每一個(gè)樣品中加入5 μ 1 NEB Buffer 2 (New England Biolabs, Ipswich, MA, USA),5 μ 1 dNTPsCO. 6 nM dCTPU. 2 nM dATP、 dTTP、dGTP 的每一種)、5 μ 1 標(biāo)記物(Cy3_dCTP 或 Cy5_dCTP ;GE Healthcare Bio-Sciences Corp.,Piscataway,NJ,USA)、2 μ 1 NEB Klenow 片段和 2 μ 1 dH20。雜交和洗滌的程序基本上如描述的(Lucito,R.等人0003),之前),除了雜交的烘烤溫度上升至50°C。陣列用 GenePix 4000B 微陣列掃描儀(Molecular Devices, Inc.,Sunnyvale, CA, USA)以 5μπι 的像素大小掃描。GenePix Pro 4. 0軟件用于定量陣列的強(qiáng)度。陣列數(shù)據(jù)被輸入到S-PLUS統(tǒng)計(jì)軟件用于進(jìn)一步分析。3.數(shù)據(jù)分析
微陣列圖片在GenePix 4000B微陣列掃描儀上掃描,數(shù)據(jù)用Nimblescan軟件(Roche NimbleGen Inc.,Madison,WI,USA)提取。對(duì)每一個(gè)探針,對(duì)于每一個(gè)實(shí)驗(yàn)和其相關(guān)的染料互換(dye swap)計(jì)算McrBc和對(duì)照處理樣品的比值的幾何平均值(即GeoMeanRatio)。隨后將數(shù)據(jù)集中所有樣品的各自的幾何平均值用分位數(shù)歸一化方法歸一化 (Bolstad, B. M.等.Q003) Bioinformatics 19,185-193)。每一個(gè)實(shí)驗(yàn)的歸一化的比值隨后組合以用中位數(shù)平滑模型(median polish model)對(duì)于在每一個(gè)i&pl片段的所有探針得到一個(gè)值。因此獲得的數(shù)據(jù)隨后用于進(jìn)一步分析。變異分析用于鑒定最顯著的島。為了確定腫瘤和正常樣品間甲基化最一致發(fā)生的變化,我們使用t檢驗(yàn)方法。在對(duì)多重檢測(cè)校正后使用0.001的P值截止(錯(cuò)誤發(fā)現(xiàn)率; Benjamini, Y.禾口 Hochberg, Y. (1995) J. Roy. Stat. Soc.,Ser. B 57,289—300), 獲得916個(gè)差異甲基化的片段的列表。監(jiān)督式學(xué)習(xí)監(jiān)督式機(jī)器學(xué)習(xí)分類(lèi)器用于鑒定區(qū)別腫瘤樣品和正常所需特征的數(shù)量。公眾可獲得的支持向量機(jī)(SVM)庫(kù)(LibSVM Ver 2. 8)用于使用留一法(leave one out method) (Lin, C.J. (2001) Neural Computation 13,307-317)獲得分類(lèi)精確性。用于分類(lèi)的甲基化特征首先在單獨(dú)的訓(xùn)練數(shù)據(jù)中使用t檢驗(yàn)選擇。SVM然后在前10、50、100個(gè)特征中使用徑向基函數(shù)(RBF)內(nèi)核訓(xùn)練。
對(duì)于N個(gè)樣品,t檢驗(yàn)對(duì)(N-I)個(gè)樣品進(jìn)行以鑒定帶有甲基化比值顯著差異的片段。對(duì)于N個(gè)樣品,此分析進(jìn)行N次,在t檢驗(yàn)計(jì)算中每次省略一個(gè)樣品。來(lái)自(N-I)個(gè)樣品的前10個(gè)片段特征的甲基化比值隨后用于訓(xùn)練SVM。一個(gè)未訓(xùn)練的樣品的比值用作對(duì)照。基于至少10個(gè)特征,完成94%的分類(lèi)精確性。有趣地,兩個(gè)在此分析中被歸類(lèi)為正常的來(lái)自腫瘤樣組織的樣品也是分別在基因表達(dá)和ROMA分析中最接近正常的。4.甲基化位點(diǎn)的檢測(cè)
在一個(gè)實(shí)施方案中,所述方法包括從樣品(如細(xì)胞系、組織或血液樣品)中分離基因組 DNA。DNA提取可通過(guò)本領(lǐng)域普通技術(shù)人員標(biāo)準(zhǔn)方法來(lái)完成,包括使用去垢劑裂解、超聲和玻璃珠渦旋。一旦核酸被提取,基因組雙鏈DNA可用于分析。任選地,DNA可在進(jìn)一步分析前切開(kāi)。然后,處理基因組DNA樣品以使5’位置未甲基化的胞嘧啶堿基被轉(zhuǎn)換為尿嘧啶、胸腺嘧啶或另一個(gè)在雜交行為方面不像胞嘧啶的堿基。這在下文中將理解為‘預(yù)處理,?;蚪MDNA的處理優(yōu)選用亞硫酸氫鹽(bisulfite)(亞硫酸鹽(sulfite)、酸式硫酸鹽 (disulfite))和隨后的堿性水解進(jìn)行,導(dǎo)致未甲基化的胞嘧啶堿基轉(zhuǎn)換為尿嘧啶。如果亞硫酸氫鹽溶液用于反應(yīng),那么親核加成在未甲基化的胞嘧啶上發(fā)生。另外變性試劑或溶劑及基團(tuán)攔截器(radical interc印tor)必須存在。轉(zhuǎn)變的DNA隨后用于檢測(cè)甲基化胞嘧啶殘基(參見(jiàn)圖1)。待分析的各自的DNA片段被擴(kuò)增。因?yàn)榻y(tǒng)計(jì)學(xué)和實(shí)踐的考慮,優(yōu)選多于10個(gè)具有 100bp-2000bp長(zhǎng)度的不同的片段被擴(kuò)增。幾個(gè)DNA片段的擴(kuò)增可以同時(shí)在一個(gè)和相同的反應(yīng)容器中進(jìn)行。通常,擴(kuò)增通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的方法進(jìn)行。PCR中所用的寡核苷酸引物的設(shè)計(jì)對(duì)本領(lǐng)域普通技術(shù)人員是顯而易見(jiàn)的。優(yōu)選地, 引物不包含任何CpG 二核苷酸。設(shè)計(jì)所述引物寡核苷酸序列以選擇性地退火到并擴(kuò)增僅特異性的感興趣的DNA片段,因此最小化背景或非相關(guān)DNA的擴(kuò)增。在具體的實(shí)施方案中,在擴(kuò)增中至少一個(gè)引物寡核苷酸結(jié)合到固相上。不同的寡核苷酸序列可以矩形或六邊形格子的形式排列在平面的固相上,固相表面尤其由硅、玻璃、 聚苯乙烯、鋁、鋼、鐵、銅、鎳、銀、或金、硝酸纖維素或塑料組成。獲得的片段可攜帶可直接或間接檢測(cè)的標(biāo)記物。優(yōu)選地,所用標(biāo)記物是熒光標(biāo)記物、放射性標(biāo)記物或具有可被質(zhì)譜儀檢測(cè)的典型質(zhì)量的可分開(kāi)的分子片段。隨后,分析核酸擴(kuò)增子以確定處理前的基因組DNA的甲基化狀態(tài)。幾種處理過(guò)的核酸的甲基化狀態(tài)特異性分析的方法是已知的,其它可選方法對(duì)本領(lǐng)域普通技術(shù)人員將是顯而易見(jiàn)的。例如,分析可在擴(kuò)增步驟中進(jìn)行。在這樣的情況中,在核酸中預(yù)先選擇的CpG位置的甲基化狀態(tài)可使用甲基化特異性引物寡核苷酸來(lái)檢測(cè)(參見(jiàn)例如美國(guó)專(zhuān)利 6,265, 171)。圖2顯示成簇的樣品(列)對(duì)于甲基化基因座(行)的示例性分布。獲得的DNA甲基化模式允許區(qū)別腫瘤(頂部的條的左邊部分)和正常組織(頂部的條的右邊部分)。5. DNA甲基化模式的預(yù)測(cè)
首先,差異甲基化基因(或其他基因座)的數(shù)據(jù)集必須用低通量測(cè)定(如甲基化特異性 PCR(MSP))或高通量測(cè)定(例如MOMA、HELP測(cè)定、甲基DIP或Illumina’ s甲基化珠陣列技術(shù))產(chǎn)生。在根據(jù)本發(fā)明的方法下的原理的示意性表示在圖3中描述。用于區(qū)分乳腺癌的不同亞型的示例性DNA甲基化標(biāo)簽/生物標(biāo)簽在圖4中顯示。如果低通量測(cè)定如甲基化特異性PCR被使用,需要關(guān)于靶序列的進(jìn)一步信息。通常,當(dāng)用BLST基因組數(shù)據(jù)庫(kù)(UCSC基因組生物信息組,SantaCruz, CA, USA)將測(cè)定中所用的相對(duì)應(yīng)引物的DNA片段與人類(lèi)基因組序列比對(duì)時(shí),沒(méi)有直接擊中(direct hits)。因此, 引物序列需要和從人類(lèi)基因組中獲得的相應(yīng)基因的基因組序列相比對(duì)。隨意地,代替“濕生物學(xué)實(shí)驗(yàn)”計(jì)算機(jī)模擬PCR可在比對(duì)MSP引物和人類(lèi)基因組之后用獲得的引物進(jìn)行。高通量方法如產(chǎn)生原始數(shù)據(jù)用于差異DNA甲基化分析。在一些具體的實(shí)施方案中,兩個(gè)或多個(gè)雜交匹配的樣品可以是浸潤(rùn)性相對(duì)于非浸潤(rùn)性癌癥,或?qū)χ委煈?yīng)答的患者相對(duì)于對(duì)治療不應(yīng)答的患者(如化療、免疫治療或組合治療)。差異甲基化基因標(biāo)簽的自動(dòng)選擇此目標(biāo)可通過(guò)使用傳統(tǒng)統(tǒng)計(jì)學(xué)(例如斯氏t檢驗(yàn))或機(jī)器學(xué)習(xí)方法(例如SVM)完成。此步驟產(chǎn)生一個(gè)或多個(gè)候選基因(或一個(gè)或多個(gè)候選標(biāo)簽,每一個(gè)由一組基因組成)。進(jìn)一步方法步驟目的在于提供方法用于整合關(guān)于通過(guò)甲基結(jié)合蛋白(和/或通過(guò)其它DNA結(jié)合因子如轉(zhuǎn)錄因子)的基因沉默的表觀遺傳學(xué)機(jī)制的生物學(xué)知識(shí)。一個(gè)或多個(gè)候選基因(在每一個(gè)標(biāo)簽中任選地)分成兩組
(a)包含從非甲基化到甲基化狀態(tài)改變的那些;在診斷/監(jiān)控癌癥狀態(tài)的情況下,這樣的“過(guò)度甲基化”指示腫瘤抑制基因失活(下文中,這些基因因此稱(chēng)為“T組”);及
(b)包含從甲基化到非甲基化狀態(tài)改變的那些;在診斷/監(jiān)控癌癥狀態(tài)的情況下,這樣的“甲基化不足”指示癌基因激活(下文中,這些基因因此稱(chēng)為“0組”)。對(duì)于甲基化水平和DNA結(jié)合因子識(shí)別位點(diǎn)(轉(zhuǎn)錄因子結(jié)合位點(diǎn))的存在的后續(xù)相關(guān)性,以下步驟是需要的
(1)為尋找轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBk),T組中差異甲基化候選基因序列用作前景組及0組的那些作為背景組。如果候選位置具有(即差異甲基化位點(diǎn))TFBS,那么其被包含在分析的下一個(gè)階段中。如果基因座將發(fā)揮涉及腫瘤抑制基因的表觀遺傳學(xué)作用,那么轉(zhuǎn)錄因子(TF)因?yàn)榧谆荒芙Y(jié)合這個(gè)基因座,所以部分信號(hào)網(wǎng)絡(luò)被破壞。(2)為尋找TFBS,0組中差異甲基化候選基因序列用作前景組及T組的那些作為背景組。如果候選基因座具有TFBS,那么其被包含在分析的下一個(gè)階段中。還必須證實(shí)的是各自的TF也未甲基化以便基因座是功能上重要的有更高的機(jī)會(huì)。在這樣的情況下,未甲基化的基因座和未甲基化的TF被包含在最后的標(biāo)簽中。(3)對(duì)于T組中的每一個(gè)基因/基因座,進(jìn)一步確定的是DNA甲基結(jié)合蛋白(如 MBD1、MBD2、MBD3和MBD4、Kaiso和MeCP2,即一類(lèi)特定類(lèi)型的TF)的保守結(jié)合序列是否存在。然后由單甲基結(jié)合蛋白調(diào)控的基因網(wǎng)絡(luò)被得到。具有甲基蛋白結(jié)合位點(diǎn)的候選基因座包含在分析的下一個(gè)階段中。下一步,基于以上提到的三個(gè)步驟,差異甲基化候選基因被評(píng)估成為甲基化標(biāo)簽的部分。基因/基因座需要參與至少一個(gè)分別的網(wǎng)絡(luò)/子集。通路信息從通路數(shù)據(jù)庫(kù)中的一個(gè)被包含(例如KEGG通路數(shù)據(jù)庫(kù))。剩余的基因座被放棄。如果如M得分(M_kore )公式中表示的,差異甲基化(M水平(M_Leve 1))、甲基結(jié)合蛋白位點(diǎn)(No_MBS)的存在和轉(zhuǎn)錄因子結(jié)合位點(diǎn)(No_TFBS)的存在的組合值高于某閾值, 候選基因在最后的組中M_Score = wl* M_Level + w2* No_MBS + w3*No_TFBS
此評(píng)估可確認(rèn)在基因網(wǎng)絡(luò)中現(xiàn)有的和新的從屬(cbpendenc i es )和基因級(jí)聯(lián)(gene cascades).這也將進(jìn)一步闡明級(jí)聯(lián)下的生物標(biāo)記,其可用作DNA甲基化評(píng)估替代。對(duì)于所有這些基因/基因座,特異性基因座將在最終組里的更高置信度是需要的。以這種方式,具有更高潛能起表觀遺傳學(xué)作用的基因座被包括。當(dāng)然為證實(shí)甲基化位點(diǎn)的功能性作用,應(yīng)該進(jìn)行功能性測(cè)定例如,細(xì)胞可用去甲基化試劑如5-氮雜胞苷處理, 然后通過(guò)基因表達(dá)方法測(cè)定以證實(shí)基因座的去甲基化與各自基因的調(diào)節(jié)相關(guān)。本發(fā)明可用于候選生物標(biāo)記/生物標(biāo)簽的評(píng)估和選擇。從此方法中獲得的適當(dāng)?shù)纳飿?biāo)簽可用于患者分類(lèi)、篩查、診斷、預(yù)后、治療計(jì)劃和評(píng)估疾病(例如癌癥)的復(fù)發(fā)。另外,此方法可用作計(jì)算機(jī)模擬分析途徑的部分以在任何生物體中進(jìn)行假設(shè)用于表觀遺傳學(xué)研究。除了此方法用于研究目的的用途,本發(fā)明的方法也可與其它患者數(shù)據(jù)和臨床參數(shù)一起用在基于計(jì)算機(jī)的臨床決定系統(tǒng)中。本文中示意性描述的本發(fā)明可適當(dāng)?shù)卦谌魏我鼗蚨鄠€(gè)要素、限制或多個(gè)限制缺乏情況下實(shí)踐,其不是本文中特別公開(kāi)的。因此,例如術(shù)語(yǔ)“包含”、“包括”、“含有”等將被擴(kuò)展地理解并且是非限制性的。另外,本文中所用的術(shù)語(yǔ)和表達(dá)已用作描述的術(shù)語(yǔ)并且是非限制性的,沒(méi)有意圖使用這樣的術(shù)語(yǔ)和表達(dá)排除任何顯示和描述的特征的等同物或其部分,但是公認(rèn)的是在本發(fā)明權(quán)利要求的范圍內(nèi)各種修改是可能的。因此,應(yīng)理解的是盡管本發(fā)明已通過(guò)實(shí)施方案和任選的特征具體公過(guò),但是在其中體現(xiàn)的本發(fā)明的修改和變化可被本領(lǐng)域技術(shù)人員采用,并且這樣的修改和變化被認(rèn)為在本發(fā)明的范圍中。本發(fā)明已在本文中被廣泛地和一般地描述。每一個(gè)落入一般性公開(kāi)中的更窄的種類(lèi)和亞類(lèi)分組也形成本發(fā)明的部分。這包括本發(fā)明的一般性描述,帶有限制性或否定的限制以從該種類(lèi)中排除任何主題,與排除的材料在本文中是否明確引用無(wú)關(guān)。其它實(shí)施方案在以下的權(quán)利要求中。另外,在本發(fā)明的特征或方面按照馬庫(kù)什組被描述的情況下,本領(lǐng)域的普通技術(shù)人員將認(rèn)為本發(fā)明也因此以馬庫(kù)什組的任何單獨(dú)成員或成員的子群被描述。
權(quán)利要求
1.用于檢測(cè)與病癥的存在或發(fā)生病癥的素因相關(guān)的DNA甲基化標(biāo)簽的方法,所述方法包括(a)提供多個(gè)匹配樣品,所述多個(gè)包含至少一個(gè)靶樣品和至少一個(gè)參考樣品;(b)在所述至少一個(gè)靶樣品中鑒定一個(gè)或多個(gè)相對(duì)于所述至少一個(gè)參考樣品展示出差異DNA甲基化的候選基因/基因座;(c)確定包含在步驟(b)中獲得的所述一個(gè)或多個(gè)差異甲基化的候選基因/基因座中的核酸位點(diǎn);以及(d)確定在步驟(b)中獲得的所述一個(gè)或多個(gè)候選基因/基因座中DNA結(jié)合因子識(shí)別位點(diǎn)的存在,其中所述DNA結(jié)合因子各個(gè)識(shí)別在步驟(c)中確定的核酸位點(diǎn);其中在步驟(c)中獲得的差異甲基化的核酸位點(diǎn)的模式和在步驟(d)中獲得的DNA結(jié)合因子識(shí)別位點(diǎn)的模式一起表示DNA甲基化標(biāo)簽,所述標(biāo)簽指示在所述至少一個(gè)靶樣品中病癥的存在或發(fā)生病癥的素因。
2.權(quán)利要求1的方法,其中包含在一個(gè)或多個(gè)的差異甲基化的候選基因/基因座中核酸位點(diǎn)是CpG 二核苷酸位點(diǎn)。
3.權(quán)利要求1或2的方法,其中差異DNA甲基化通過(guò)選自以下的一個(gè)或多個(gè)方法來(lái)確定亞硫酸氫鹽測(cè)序、焦磷酸測(cè)序、甲基化敏感的單鏈構(gòu)象分析(MS-SSCA)、高分辨熔解分析(HRM)、甲基化敏感的單核苷酸引物延伸(MS-SnuPE)、堿基特異性切割/ MALDI-TOF,甲基化特異性PCR (#5P)、基于微陣列的方法和ife/71切割。
4.權(quán)利要求1到3中任意一項(xiàng)的方法,其中步驟(c)進(jìn)一步包括將一個(gè)或多個(gè)差異甲基化的候選基因/基因座分為-第一子集“m”,其為一個(gè)或多個(gè)包含在至少一個(gè)參考樣品中甲基化和在至少一個(gè)靶樣品中非甲基化的核酸位點(diǎn)的候選基因/基因座;和-第二子集“n”,其為一個(gè)或多個(gè)包含在至少一個(gè)參考樣品中非甲基化和在至少一個(gè)靶樣品中甲基化的核酸位點(diǎn)的候選基因/基因座。
5.權(quán)利要求4的方法,其中步驟(d)進(jìn)一步包括對(duì)于一個(gè)或多個(gè)DNA結(jié)合因子的第一子集“M”確定和選擇識(shí)別位點(diǎn),其中DNA結(jié)合因子的子集“M”的每一個(gè)成員選擇性地識(shí)別子集“m”的一個(gè)或多個(gè)候選基因。
6.權(quán)利要求4或5的方法,其中步驟(d)進(jìn)一步包括對(duì)于一個(gè)或多個(gè)DNA結(jié)合因子的第二子集“N”確定和選擇識(shí)別位點(diǎn),其中DNA結(jié)合因子的子集“N”的每一個(gè)成員選擇性地識(shí)別子集“η”的一個(gè)或多個(gè)候選基因。
7.權(quán)利要求6的方法,其中所述DNA結(jié)合因子的子集“N”表示DNA甲基結(jié)合蛋白。
8.權(quán)利要求7的方法,其中所述DNA甲基結(jié)合蛋白選自MBD1、MBD2、MBD3、MBD4、MIZF、 Kaiso 和 MeCP2。
9.權(quán)利要求5到8中任意一項(xiàng)的方法,其進(jìn)一步包括對(duì)于選擇的DNA結(jié)合因子的子集 “M”每一個(gè)成員確定被識(shí)別的包含在子集“m”中的候選基因,和/或?qū)τ谶x擇的DNA結(jié)合因子的子集“N”每一個(gè)成員確定被識(shí)別的包含在子集“η”中的候選基因。
10.權(quán)利要求1到9中任意一項(xiàng)的方法,其進(jìn)一步包括步驟(d)的一個(gè)或多個(gè)重復(fù),其中每一個(gè)重復(fù)包括在一個(gè)或多個(gè)候選基因/基因座中確定一個(gè)或多個(gè)DNA結(jié)合因子的識(shí)別位點(diǎn)的存在,所述DNA結(jié)合因子尚未包括在之前重復(fù)的確定中。
11.權(quán)利要求1到10中任意一項(xiàng)的方法,其中鑒定的DNA甲基化標(biāo)簽包含至少10個(gè)候選基因/基因座。
12.權(quán)利要求4到11中任意一項(xiàng)的方法,其中一個(gè)或多個(gè)鑒定的候選基因/基因座的 DNA甲基化標(biāo)簽指示在至少一個(gè)靶樣品中癌癥的存在或發(fā)生癌癥的素因。
13.權(quán)利要求12的方法,其中對(duì)于候選基因/基因座的子集“m”鑒定的DNA甲基化標(biāo)簽指示一個(gè)或多個(gè)癌基因的激活。
14.權(quán)利要求12或13的方法,其中對(duì)于候選基因/基因座的子集“η”鑒定的DNA甲基化標(biāo)簽指示一個(gè)或多個(gè)腫瘤抑制基因的失活。
15.權(quán)利要求1到14中任意一項(xiàng)的方法,其進(jìn)一步用于預(yù)測(cè)對(duì)在至少一個(gè)靶樣品中存在的病癥或傾向發(fā)生的病癥的處理的治療應(yīng)答。
16.權(quán)利要求1到15中任意一項(xiàng)的方法,其中所述方法在計(jì)算機(jī)中模擬進(jìn)行。
17.權(quán)利要求1到16中任意一項(xiàng)中定義的DNA甲基化標(biāo)簽作為用于病癥的篩查、診斷、 治療計(jì)劃和/或復(fù)發(fā)監(jiān)控的患者樣品分類(lèi)的生物標(biāo)記的用途。
18.權(quán)利要求1到16中任意一項(xiàng)的方法與其它患者數(shù)據(jù)和臨床參數(shù)一起作為基于計(jì)算機(jī)的臨床決定系統(tǒng)的整體部分的用途。
全文摘要
本發(fā)明涉及用于檢測(cè)與病癥的存在或發(fā)生病癥的素因相關(guān)的DNA甲基化標(biāo)簽的方法,所述方法包括鑒定一個(gè)或多個(gè)在靶和參考樣品中展示出差異DNA甲基化的候選基因,以及分別測(cè)定在所述差異甲基化的候選基因中的核酸位點(diǎn)和DNA結(jié)合因子的識(shí)別位點(diǎn),所述DNA結(jié)合因子各個(gè)識(shí)別這種差異甲基化的核酸位點(diǎn),其中得到的差異甲基化的核酸位點(diǎn)的模式和DNA結(jié)合因子識(shí)別位點(diǎn)的模式一起表示DNA甲基化標(biāo)簽,所述標(biāo)簽指示靶樣品中病癥的存在或發(fā)生病癥的素因。
文檔編號(hào)C12Q1/68GK102257161SQ200980151020
公開(kāi)日2011年11月23日 申請(qǐng)日期2009年12月14日 優(yōu)先權(quán)日2008年12月18日
發(fā)明者C.米塔爾, N.迪米特羅瓦, S.卡馬拉卡蘭 申請(qǐng)人:皇家飛利浦電子股份有限公司