專利名稱:Dna甲基化水平的測定的制作方法
技術領域:
本發(fā)明涉及表觀遺傳學領域,尤其涉及DNA甲基化。本發(fā)明提供了一種用于測定特別是與臨床診斷相關的表觀遺傳變化的擴增方法。另外,還提供了用于這種擴增方法的特異性引物。
背景技術:
表觀遺傳機制導致基因表達中的改變,其并不伴隨所述基因編碼序列的變化,但卻能夠被遺傳,例如通過有絲分裂。DNA甲基化模式以與復制關聯(lián)的方式從母細胞傳遞到子細胞。這樣,就確保了表觀遺傳信息的遺傳。在較高級的真核生物中,DNA甲基化是除 RNA相關沉默作用和組蛋白修飾之外被研究得最多的表觀遺傳機制German et al.,Coll Anthropol. 2006 ;30(3) :665-71)。在完全分化的健康細胞中,人類基因組含有特異的而且基本上不變的DNA甲基化模式,其精確地共同決定基因的表達。在很多情況下,對轉錄具有調節(jié)功能的基因區(qū)域不被甲基化,而對轉錄不具活性的基因片段卻被甲基化。DNA的甲基化發(fā)生在核酸的胞嘧啶殘基,尤其是在具有胞嘧啶-鳥嘌呤序列(CpG) 的二核苷酸。在真核生物中最重要的堿基修飾是在胞嘧啶的5'位點的甲基化。以包括增加的增殖速率、變異的基因表達和染色體異常為特征的腫瘤細胞中,基因組的甲基化模式是異常的(Schulz,DNA Methylation in Urological Malignancies. Int J Oncol. 1998 ; 151-67)。在本技術領域的相關評述中所表達的共識為這些表觀遺傳的改變對于診斷和預測來說具有相當?shù)臐撛趦r值,因而,對其的研究和掌握可能形成在癌癥的早期檢測、癌癥預測和追蹤處理方面的新方法。但是,由于在腫瘤組織中發(fā)生了染色體異常,也就是說,腫瘤組織與健康組織相比具有不同的基因組環(huán)境,因此,基本的問題是不但要定性而且要定量地和以標準的方式測定這種異常的DNA甲基化。只有通過這樣的測定方法才能在其中之一可能帶有染色體異常的兩個樣本之間進行直接的對比。
發(fā)明內容
根據(jù)本發(fā)明,上述目的是通過根據(jù)實施方案El的方法及與其相應的優(yōu)選具體實施方式
,以及與從屬的實施方案相應的具體實施方式
來實現(xiàn)的。為了解決上述的技術問題, 本發(fā)明提供了測定標準DNA甲基化水平的方法以及在至少兩個樣本之間確定相對DNA甲基化水平的方法。一方面,本發(fā)明提供了測定標準化DNA甲基化水平的方法,包括以下步驟a)定量地測定在DNA中存在的轉位子或其片段;b)定量地測定在相同轉位子或其片段中CpG 二核苷酸的至少一個差異性甲基化的C ;c)由步驟a)和b)中所得到的值確定標準DNA甲基化水平。本發(fā)明巧妙地利用了令人驚訝的結果,即在整個基因組隨機分布的轉位子的甲基
3化水平可以被認為代表了整個基因組的甲基化水平。本發(fā)明的主旨在于,在第一步驟中,定量地測定,例如從一個樣本中,存在于DNA中的轉位子(或者其片段),在另一步驟中,定量地測定在相同DNA中相同轉位子(或者其片段)中CpG 二核苷酸的至少一個差異性甲基化的胞嘧啶。然后,由所得到的值確定代表整個基因組中標準DNA甲基化水平。DNA的甲基化是一種復制后表觀遺傳機制,其對真核生物中的基因調控具有重要的意義。在真核生物中,在胞嘧啶的嘧啶基的5位碳原子上加上甲基而形成5-甲基胞嘧啶 (5mC)起著主要的作用。這種甲基的添加是通過DNA甲基化酶(DNMTs)體內催化將S-腺苷甲硫氨酸(甲基供體)的甲基轉移到胞嘧啶(甲基受體),而且優(yōu)選地發(fā)生在處于鳥嘌呤 (CpG)的5'位點的胞嘧啶上。在脊椎動物的基因組中產C僅僅發(fā)生于CpG 二核苷酸(Bestor. The DNA Methyltransferases of Mammals. Hum Mol Genet 2000 ;2395_2402),而在人類基因組中, 回文結構的CpG 二核苷酸的胞嘧啶通常均被甲基化。由于進化機制以及甲基胞嘧啶自發(fā)脫氨基的傾向,CpG 二核苷酸在哺乳動物的基因組中顯著地未被充分體現(xiàn)而只有0. 8%的頻率(人類基因組中的GC平均含量為約 40 %,據(jù)此算得的CpG 二核苷酸的頻率應為4 % ),而且通常較多地只出現(xiàn)在“CpG島”,其通常位于基因的 5'-或者 3' -NTR 位點(Gardiner-Garden & Frommer. CpG Islands in Vertebrate Genomes. J Mol Biol 1987 ;261-282) 對非編碼區(qū)的這種限制作用可推斷而歸因于5mC的脫氨基作用對胸腺嘧啶的點突變的風險性增加(Laird & Jaenisch. The Role of DNA Methylation in Cancer Genetic and Epigenetics. Annu Rev Genet 1996 ; 441-464)。CpG島的大小為大約500bp至41Λ,而增加的GC含量大于55%。它們大概具有二核苷酸5' -CpG-3'的10到20倍的增加頻率。人類基因的四分之三以上(大約25,000) 在其起始區(qū)域含有CpG島,一般來說,具有高轉錄活性的基因是位于非甲基化的基因組區(qū)域。相反,在甲基化的區(qū)域中的基因具有非常低的或者幾乎不具有轉錄活性。DNA甲基化和染色質凝集具有相關性,這是因為基因在密集的異染色質中通常是不具活性的。染色質這樣的密集狀況是由組蛋白H3和H4的去乙?;图谆饔盟T導,從而導致核小體與DNA更強的結合,因此對于轉錄機制來說也使得更為難于接近DNA(Jenuwein. Re-SET-ting Heterochromatin by Histone Methyltransferases. Trends Cell Biol 2001 ;266-273)。MeCP2 蛋白,其結合于 CpG甲基化的DNA,能夠利用脫乙酰酶組蛋白并且引發(fā)染色質的凝集(Razin & Razin. CpG Methylation,Chromatin Structure and Gene Silencing-a Three-Way Connection. EMBO J. 1998 ;4905-4908)。然而,甲基化酶組蛋白也能將轉甲基酶DNA引導到異染色區(qū)域,從而在此區(qū)域弓丨起DNA 甲基化(Tamaru & Selker. A histone H3 methyltransferase controls DNA methylation in Neurospora crassa. Nature 2001 ;277_沘3)。另夕卜,組蛋白乙酰化也可能導致所涉及的基因片段的活性去甲基化作用(Cervoni & Szyf. Demethylase activity is directed by histone acetylation. L Biol. Chem. 2001 ;40778-40787)。如前所述,錯誤的DNA甲基化大多會穩(wěn)定地遺傳給子細胞而且常??赡苁窃谝鹕矬w發(fā)生疾病的原因。尤其是,例如,腫瘤細胞常常呈現(xiàn)出與健康組織顯著不同的甲基化模式。因此,甲基化水平的分析經常被用于例如診斷的用途。另外,對甲基化狀態(tài)的定向修飾/改變也可考慮用作基因調控之目的。為了分析核酸的甲基化狀態(tài),尤其是具體CpG區(qū)位的甲基化狀態(tài),已經開發(fā)出亞硫酸氫鹽化(bisulfitation)然后進行比如擴增/測序的處理方法,并由Frommer等人首次闡述(Proc Natl Acad Sci USA. 1992 ;89 (5) :1827-31) 通過亞硫酸氫鹽作用,核酸的非甲基化的胞嘧啶堿基被轉換成尿嘧啶堿基,而甲基化的胞嘧啶堿基保持不變。有關核酸甲基化狀態(tài)分析的各種技術尤其是亞硫酸氫鹽作用的綜述可參閱Fraga et al., Biotechniques 2002 ;33 (3) :632,634,636-49, \)XR Laird, Nat Rev Cancer. 2003 ;3 (4) 253-66。因此,取決于起始核酸的甲基化狀態(tài),亞硫酸氫鹽反應會導致核酸擁有不同的序列,而在通過包括PCR或排序等序列分析之后,起始核酸的甲基化狀態(tài)便可確定。這種對于試樣,例如組織或活體取樣,甲基化程度的分析,采用常規(guī)方法時很快就會遇到限制,即使已經將本試樣與另一試樣做了比較并且這兩個試樣具有不同的基因組設置。也就是說,如前所述,腫瘤細胞在很多情況下含有失衡的染色體異常。這些包括整個染色體、個體染色體臂以及短的DNA序列片段的得失。許多研究證明腫瘤細胞這些基因組的不穩(wěn)定性是由于DNA甲基化水平較低引起的。DNA低甲基化的程度是與基因組不穩(wěn)定性和腫瘤的侵襲性成比例的。本發(fā)明利用了這個出人意料的結果,即隨機分布在整個基因組中轉位子的DNA甲基化水平可以視為能代表整個基因組的甲基化水平。因此,如果定量地測定在基因組中轉位子本身的存在并且定量地測定該轉位子中存在至少一種差異性甲基化水平,就可能標準化地確定基因組的甲基化水平。在本文中,術語“轉位子(transposon)”是指基因中一定長度的DNA片段。轉位子包含一個或者多個基因,并且能夠在基因組中轉換其位置(轉位)。轉位子可以是可變中間體由RNA組成的元件(逆元件,I型轉位子),也可以是中間體為DNA的元件(DNA轉位子, II型轉位子)?!稗D位子”在本文中的涵義總是包括轉位子片段。這些轉位子片段是在基因進化過程中產生的,由于發(fā)生了 “跳躍”的轉位子不受控于任何選擇壓力,因此,原始的序列能通過基因組中的突變而被改變。因此,在基因組中被發(fā)現(xiàn)的通常不是完整的轉位子而只是轉位子的部分區(qū)域,例如,其產生是通過轉位子的其他插入或去除,在很多實例中位于5' 位點?!稗D位子片段”優(yōu)選地是指核酸的連續(xù)區(qū)域,其長度彡40bp,^ 80bp,^ lOObp,優(yōu)選彡150bp,更優(yōu)選> 200bp,并具有相對于該轉位子的核酸區(qū)域的同源性為75%,80%, 85%,90%,95%,97%,98%,優(yōu)選為 98. 5%,99%,99. 5%,更優(yōu)選為 99. 7%,99. 9%或更高。這種同源性可通過例如FASTA運算法來確定。術語“轉位子”和“可轉位元件”可以互換。自主DNA轉位子(autonomous DNA transposons)由為轉位酶的DNA序列編碼組成。轉錄酶能夠從基因組“切出”轉位子,并將其轉送到基因組中的新位點并插入到該基因組。這種過程叫做“保守性轉位(Conservative transposition)”。DNA轉位子的例子包括Ac (Activator)可轉位元件(自主轉位子)或者Ds (Dissociator)可轉位元件(沒有自身轉錄酶的非自主轉位子)。逆轉位子(retrotransposons)代表了大多數(shù)真核生物的可轉位元件并且具有更為復雜的結構。它們在基因組中被宿主細胞識別為“正常”的DNA序列并且被宿主細胞的轉錄機制讀取并轉錄為RNA。但是,逆轉錄轉位子編碼于逆轉錄酶,其能使該RNA轉變?yōu)镈NA。 這種轉錄酶還能將所產生的DNA插入到宿主細胞的基因組中。這種過程被稱為為“復制性轉位(implicative transposition) ”。因此,只要逆轉位子保持其功能活性,在基因組中就能產生一些復制件。在生物體的基因組中活性轉位子的數(shù)量因物種而存在很大的差別。例如,在人類基因組中,只有很小部分的轉位子是有活性的。人們認為只有大約50個LINE轉位子(見后文)并且基本上沒有DNA轉位子是有活性的,因此,在人的一生中轉位子的數(shù)量可視為是恒定不變的。有兩種主要類型的逆轉位子病毒性的和非病毒性的逆轉位子。病毒性逆轉位子(viral retrotransposons)寬泛地講具有與逆病毒非常相似的特性。病毒性逆轉位子的例子包括Ty可轉位元件(Ty transposable elements)和果蠅 Μγ( !| ^T^711^ (Drosophila copia transposable elements)。非病毒性逆轉位子(non-viral retrotransposons)代表了哺乳動物中的所有轉位子的大多數(shù)。例如,其中一些在前文中已經提到LINES(l0ng inter-spersed(transposable)elements,長分散(可轉位)兀件)、SINES(short inter-spersed (transposable) elements,短分散(可轉位)兀件)禾口 Alu 兀件。在人類基因組中,有大約850,OOOLINEs and 1,500,OOOSINEs。所述SINEs包含 Alu元件,其代表了一組常常出現(xiàn)在人類基因組并且占其基因組大約5%的可轉位元件。病毒性逆轉位子還包括HERVs (human endogenous retroviruses,人類內源性逆病毒)。它們根據(jù)特征性氨基酸的位置而分為亞群(例如,HERV-K,HERV-W)。它們包括估計8%的人類基因組。它們來源于微生物系的逆病毒的感染,這種情況在人的進化過程中反復地發(fā)生。但是,這些基因元件的大部分會通過突變或者去除已經變得不具有轉錄活性。只有少量具有全長結構的病毒基因gag,pol和env。在這種情況下,這些基因的側翼有LTR(long terminal r印eat,長末端重復)序列,其包含調控序列模塊。實際上,具有潛在活性的HERVs通過DNA甲基化被靜默以免它們干擾健康細胞基因表達的完整性。相反, 在不同的腫瘤實體中,已經發(fā)現(xiàn)增加的HERV轉錄以及蛋白質的生物合成。在此,術語“甲基化水平”被用來描述DNA的去甲基化或者甲基化作用。相關DNA 可以在其至少一個位點被甲基化、非甲基化或者去甲基化。由于這種狀態(tài)是二元的,因此在特定位點的去甲基化和甲基化是直接相互關聯(lián)的,甲基化的水平可以由在相應的至少一個位點的甲基化和/或去甲基化而決定。因此,標準化的DNA甲基化水平以及相對的甲基化水平可以通過DNA的甲基化和/或去甲基化來確定。在此,術語“引物”和“低聚核苷酸”被互換地使用。引物被視為對一定的序列具有特異性,是指其與相關對應物序列的同源性> 75%,^80%,^85%,^ 90%,優(yōu)選地 ^ 95%,^ 97%,更優(yōu)選地彡99或者彡99. 5%。在一個優(yōu)選的實施方式中,引物具有與相關序列或其對應物100%的同源性。在另一優(yōu)選的實施方式中,引物是被認為特異于一定的序列,是指引物在高鹽條件下會與該序列(或其對應物)雜交的情形。后文中,術語“高鹽條件”是用來表示介質中使用高鹽緩沖劑,優(yōu)選含有離液鹽的高鹽緩沖劑。高鹽,優(yōu)選地含有離液高鹽,降低核酸在水中的溶解度。其原因在于氫鍵的破裂從而導致核酸的二級和三級結構在水中的穩(wěn)定性的降低。這樣,如果提供作為氫鍵供體
6的極性表面,核酸就會與該表面接合,因為它們在該表面處的穩(wěn)定性比在水中的穩(wěn)定性要高。如果鹽的濃度降低,水又會成為比極性表面更好的氫鍵供體,因而核酸能夠從該表面分
1 O特別地,但不是限制性地,術語“高鹽緩沖劑”被理解為是一種具有高鹽濃度的緩沖劑(優(yōu)選為離液物質),其高鹽濃度優(yōu)選為> IOOmM,更優(yōu)選為> 500mM,以及尤其更優(yōu)選為彡IM0特別地,但不是限制性地,術語“離液物質”或者“離液鹽”所表示的物質能夠改變蛋白質和/或核酸的二級、三級和/或四級結構而不改變一級結構的物質,降低極性物質在水中的溶解度,和/或增強疏水性相互作用。優(yōu)選的離液物質包括胍鹽酸鹽、胍(異)硫氰酸鹽、碘化鈉、過氯酸鈉、碘化鉀、(異)硫氰酸鈉和/或尿素。術語“擴增”或“擴增反應”是指能夠使相關核酸序列的濃度增加為至少兩倍的過程。等溫的和熱循環(huán)的擴增反應有如下的差別。在前者,在整個過程中溫度總是保持不變的,而在后者,溫度循環(huán)是用來控制反應和擴增的手段。優(yōu)選地,恒溫擴增反應包括,例如·Jf-^fliUiriI (LAMP, loop mediated isothermal amplification),參基于核酸序列的擴增(NASBA,nucleic acid sequence based amplification), 滾環(huán)鏈反應(RCCR,rolling circle chain reaction),或者滾環(huán)擴增(RCA, rolling circle amplification),禾口 / 或 轉錄介導擴±曾(TMA, transcription mediated amplification)。優(yōu)選地,熱循環(huán)擴增反應包括,例如 連接酶鏈反應(LCR, ligase chain reaction),和 / 或 聚合酶鏈反應(PCR, polymerase chain reaction)。術語“聚合酶鏈反應”(PCR)是用來表示用于核酸的體外擴增的方法,如Bartlett & Stirling(2003)中所述。術語“連接酶鏈反應”(LCR)是用來表示檢測微量核酸的方法,所述核酸在功能上與聚合酶鏈反應的相類似但使用的是不同的酶(連接酶而不是聚合酶)。每個DNA鏈的兩個探針被結合在一個探針上。所產生的循環(huán)的擴增物,其長度往往只有30-50bp,以作為后續(xù)循環(huán)中補充引物的起點。術語“環(huán)介導恒溫擴增”(LAMP)是指用于恒溫核酸擴增的方法,其中采用6個不同的引物,其識別并結合于目標序列的特定區(qū)域。LAMP利用具有鏈置換活性的DNA聚合酶并且在大約65°C的恒定溫度下進行。擴增和目標序列的檢測發(fā)生在同一步驟。術語“基于核酸序列的擴增”(NASBA)是指用于RNA擴增的方法(Compton 1991)。 在這種方法中,RNA模板被加入到反應混合物中,而第一引物在所述模板3'端區(qū)域結合于互補序列。接著,與該模板互補的DNA鏈通過逆轉錄酶而聚合。然后,RNA模板通過RNase H(RNase H只消化RNA-DNA雜合體中的RNA,而不消化單鏈RNA)而被消化。接著,第二引物結合到DNA鏈的5 ‘端。其通過T7RNA聚合酶被當作起點以合成互補于DNA鏈的RNA分子, 其可以被用來作為起始模板。NASBA是在通常為41°C的恒定溫度下進行,而且在一定條件下能夠獲得與PCR相比更快和更好的結果。
術語“轉錄介導擴增“(TMA)是指由美國公司Gen-Probe開發(fā)的恒溫擴增方法,其類似于NASBA法且其中采用了 RNA聚合酶和逆轉錄酶(Hill,2001)。術語“滾環(huán)鏈反應”(RCCR)或者“滾環(huán)擴增”(RCA)是指是根據(jù)滾環(huán)原理模擬一般核酸復制的擴增方法,有關描述可見US 5,854,033等文獻。術語“實時PCR”,也稱為定量PCR或者qPCR(不應被混淆為逆轉錄PCR),是指根據(jù)已知的聚合酶鏈反應(PCR)的原理并且能夠進一步使擴增的DNA量化的一種方法。量化操作是通過在PCR循環(huán)過程中(因此稱為“實時”)的熒光測量而進行的。所述熒光隨PCR產物的量成比例增加。在運行(其包括多個循環(huán))的結尾,量化操作是在PCR的指數(shù)階段借助所獲得的熒光信號來進行的。只有在PCR的指數(shù)階段(其需用一個運行中的幾個循環(huán)) 才可能獲得正確的量化,因為在這個階段能夠實現(xiàn)最佳的反應條件。因此,這種方法有別于其它的定量PCR方法,后者只有在PCR (例如競爭性PCR),其大多包含PCR片段的凝膠電泳分離,完成之后才能進行第一次評估。為了檢測,可以使用染料例如溴化乙錠、STOR Green I以及FRET探針或者所謂的雙染色低聚糖(也稱為iTaqMan探針)。術語“Ct值”(閾值循環(huán))是指PCR循環(huán),其中擴增物能夠第一次被檢測;通常,熒光是可測量的,當熒光第一次增加到顯著地高于背景熒光時所在的循環(huán)就被稱為Ct。在PCR反應的初始階段,模板(亦即,將要被擴增的DNA)的量仍然是有限的,而在擴增的最后階段,產物的量增加到這樣的程度以致于產物形成對其生成量的抑制作用,產物片段越來越多地相互交合,而游離物慢慢地被消耗。只在中間階段,在擴增循環(huán)的數(shù)目和擴增物的量之間才具有指數(shù)關系(“指數(shù)階段”)。為了確定指數(shù)階段的起始時間,就使用了前面提到的Ct值。另外,Ct值較低意味著較低數(shù)目的PCR循環(huán)就足以使得熒光值第一次顯著增加到超過背景噪音值(即存在相對較多的模板),而Ct值較高則意味著需要較多的PCR循環(huán)才能導致上述結果(即存在相對少量的模板)。在第一方面,本發(fā)明涉及用于確定標準DNA甲基化水平的方法,其包括如下步驟 a)定量測定在DNA中轉位子或其片段的存在;b)定量測定在同一轉位子和其片段中CpG二核苷酸的至少一個差異性甲基化的C ;以及c)通過在步驟a)和b)中測得的值確定標準DNA 甲基化水平。因此,根據(jù)本發(fā)明,在第一步驟中定量測出在特定的DNA(例如,從活體組織分離的)中所存在的轉位子。通過該步驟得出提供在所檢測的DNA中轉位子的密度/頻率(與所采用的DNA相關)或數(shù)量信息的數(shù)值,也就是,例如,在所檢測的DNA中轉位子的復制的數(shù)量。在一個優(yōu)選的實施方式中,這樣的測定是采用預先經過亞硫酸氫鹽化的DNA來進行的。接著,在第二步驟中,定量測定在第一步驟中所檢測的轉位子中所存在的CpG 二核苷酸的至少一個差異性甲基化胞嘧啶。在一個優(yōu)選的實施方式中,采用了與第一步驟中相同的DNA。例如,從一個樣本所分離出的DNA可被分為兩部分,優(yōu)選地在其中的各部分中含有同樣數(shù)量的DNA。在另一個優(yōu)選的實施方式中,在第二步驟中的上述確定過程是對于亞硫酸氫鹽化DNA進行的(對此更為詳細的描述見后)。這樣,所獲得的數(shù)值提供了在相關基因組中甲基化的或非甲基化的胞嘧啶在許多不同的、隨機分布的位置的信息。因此,該第二步驟提供了關于在第一步驟中確定的在轉位子中差異性甲基化的胞嘧啶的數(shù)目/數(shù)量的信息。相應地,也確定了在所檢測的轉位子中胞嘧啶差異性甲基化的程度。由于所述轉位子是隨機地分散于基因組中,標準化過程可以借助于已經獲得的兩個值在下一步驟中得到實現(xiàn),其中,將在第一和第二步驟中所測定的數(shù)值放在一起互相比照。由于基因組中轉位子的數(shù)目較大,便采用了較大的樣本。因此,所獲得的標準DNA甲基化的值反映了差異性甲基化的值,其可以被當作針對相關基因組各自的標準化的值。在另外的實施方式中,第一步驟和第二步驟的順序可以對調,或者兩者可以同時進行,例如,借助于實時PCR。在此,術語“定量測定”是用于表示檢測所存在的轉位子或者差異性甲基化。這種檢測不僅僅是定性的,即回答轉位子或差異甲基化是否存在于被檢測的DNA中的問題,而且這種存在也是被量化的(例如,通過描述數(shù)量、復制的數(shù)目等)。本領域技術人員知曉進行這種定量測定的不同方法。在一個優(yōu)選實施方式中,這樣的定量測定是通過擴增作用隨后檢測擴增物的數(shù)量來進行的。在一個更優(yōu)選的實施方式中,所述擴增是PCR過程。在一個尤其更優(yōu)選的實施方式中,所述定量測定是通過實時PCR 以測定Ct值來進行的。在另外的實施方式中,所述定量測定是通過標記的探針(例如核酸探針)的雜交隨后通過標識來確定所產生(直接或間接)的峰值而進行的。在另外的實施方式中,進行了在原位雜交(例如FISH),接著通過標識來確定所產生(直接或間接)的峰值。用于這樣定量測定的其它的方法包括采用5-甲基胞嘧啶特異性抗體的檢測或者使用特異性抗體來間接檢測結合到甲基化DNA的因子。這些因子包括,例如,核抑制劑MeCP2,其結合于基因組的對稱地甲基化的CpG位置,以及MBDl,MBD2, MBD4。在另一實施方式中,DNA來源于生物體、組織、細胞、活體取樣或者試樣。優(yōu)選地, 所述DNA是分離的DNA。在一個實施方式中,所述分離的DNA是基因組的DNA和/或真核的DNA。優(yōu)選地,該DNA是脊椎動物的DNA,更優(yōu)選地是人的DNA。在進一步優(yōu)選的實施方式中,DNA的提供過程不包括樣本采集本身,而是基于已經獲得的樣本材料。在另一優(yōu)選的實施方式中,從中獲取DNA的組織、細胞、活體取樣或者試樣是來源于健康的受試體或患病的受試體或患者。在另外的實施方式中,所述樣本是選自由血液樣本、組織樣本、唾液樣本、尿液樣本、涂抹和糞便樣本構成的組群。在一個優(yōu)選的實施方式中,所述樣本是尿液樣本。這對于尤其是膀胱癌和/或前列腺癌的檢測來說是較方便的。在本發(fā)明的進一步的實施方式中,所述轉位子是選自于LINE元件、Alu元件(Alu 一致序列;Kariya et al. Gene. 1987 ;53(1) 1_10),HERV元件或者它們的片段所組成的組群。在一個具體的實施方式中,所述轉位子是LINE-I元件(GenBank Accession M80343) 或其片段。更為優(yōu)選地,所述轉位子的片段是轉位子的啟動子區(qū)域。這樣,由于CpG出現(xiàn)的頻率較高,也就便于測定甲基化水平。在最為優(yōu)選的實施方式中,所述轉位子的片段是 LINE-I元件的啟動子區(qū)域。本文中,“差異性甲基化”是用來描述相關DNA存在可能出現(xiàn)不同的甲基化狀態(tài)。 比如“胞嘧啶差異性甲基化”(C)表示相關胞嘧啶的甲基化狀態(tài)。以二元替代方式,既可以是甲基化的,即胞嘧啶是anC的形式,也可以是非甲基化的(或去甲基化的),即相關的胞嘧啶沒有5'甲基。
9
用于檢測差異性甲基化(或胞嘧啶差異性甲基化)之存在的優(yōu)選方法是基于DNA 的亞硫酸氫鹽作用隨后分析所生成的亞硫酸氫鹽化的DNA。為了從分離的DNA獲得亞硫酸氫鹽轉化的DNA,所述分離的DNA是通過本領域技術人員熟知的亞硫酸氫鹽反應轉化得到的。在此反應中,DNA的非甲基化的胞嘧啶通過亞硫酸氫鹽轉化為尿嘧啶。作為這種轉化的結果,取決于這種核酸的非甲基化胞嘧啶的數(shù)量可能存在已轉化的核酸的不同變異體。例如,包括2個胞嘧啶的核酸在亞硫酸氫鹽作用后取決于這些胞嘧啶的甲基化狀態(tài)可以導致4種不同的變異體,因為可能的情形包括所述胞嘧啶中兩者均不、或者其中之第一、第二或者兩者均被非甲基化并被轉化為尿嘧啶。在一個優(yōu)選的實施方式中,這些不同的變異體可以通過特異性引物或者配套的引物來檢測。在一個實施方式中,所述轉化過程可以跟隨有另一個亞硫酸氫鹽化DNA的純化步驟。在另一個實施方式中,本發(fā)明的方法還包括DNA亞硫酸氫鹽作用的另一步驟,優(yōu)選地作為第一步驟,或者在CpG 二核苷酸的差異性甲基化胞嘧啶之存在的定量測定步驟之前。在另外的優(yōu)選實施方式中,步驟a)包括采用特異于轉位子或其片段的至少一個引物對的非亞硫酸氫鹽化DNA的擴增過程,或者可選擇地,采用特異于亞硫酸氫鹽化轉位子或其片段的至少一個引物對的亞硫酸氫鹽化DNA的擴增,其中所述引物不包括轉位子的差異性甲基化位置,亦即不包括CpG 二核苷酸的C或者轉化的U/T ;另外,步驟b)包括采用特異于轉位子或其片段(其已在步驟a)中確定)的至少一個引物對的亞硫酸氫鹽化DNA擴增過程,而且所述引物對包括含有轉位子的至少一個差異性甲基化位置的至少一個引物, 即能夠區(qū)分甲基化的CpG的至少一個C和亞硫酸氫鹽化的非甲基化的CpG的至少一個U/T ; 再者,步驟c)包括通過在步驟a)和b)中所形成的擴增物的比率來確定標準DNA甲基化水平。換言之,所述DNA可以是非亞硫酸氫鹽化(即比如直接在從樣本分離之后)或者在步驟a)中已經亞硫酸氫鹽化。在第一種情形,任何特異于轉位子的引物都可以用于擴增;在后一種情形,必須注意所采用的引物不包括差異性甲基化的位點(即沒有CpG二核苷酸的胞嘧啶)。在一個優(yōu)選的實施方式中,在步驟a)和b)中采用了相等體積的DNA,其中 DNA已優(yōu)選地從一個樣本經由單一操作過程被分離出來。更加優(yōu)選地,在步驟a)和b)中采用相等數(shù)量的DNA。在這種情況下,DNA也已優(yōu)選地從一個樣本經由單一操作過程被分離出來。在步驟b)(其總是用亞硫酸氫鹽化的DNA進行的),情況是相反的;至少一個引物應該包括步驟a)中所擴增的轉位子的差異性甲基化位點(即,CpG 二核苷酸的至少一個胞嘧啶)。所述至少一個引物具有特異性的至少一個差異性甲基化的位點是處在有義鏈還是反義鏈上是不相關的。因此,使用該引物,起始DNA的甲基化之存在與否可以在所涉及的檢測位置而被測得。由于在亞硫酸氫鹽化反應中沒有發(fā)生轉化,如果擴增物是通過特異于CpG 的引物而獲得,那么在相關位點就存在有起始DNA的甲基化。如果擴增物是通過特異于亞硫酸氫鹽化CpG的引物而獲得,那么在相關位點就不存在起始DNA的甲基化(去甲基化)。 相應地,依賴于所采用的引物的種類,可以檢測出甲基化或者去甲基化。由于甲基化或者去甲基化這兩種情況是直接相關的,對于根據(jù)本發(fā)明檢測甲基化水平來說,轉位子的甲基化或者去甲基化都是可以確定的。因此,如果采用特異于CpG的引物對,DNA甲基化水平是根據(jù)甲基化來測定的;如果采用特異于亞硫酸氫鹽化CpG的引物對,DNA甲基化水平則是根據(jù)去甲基化來測定的。在一個優(yōu)選的實施方式中,至少一個引物對的至少一個引物是特異于轉位子的至少一個差異性甲基化的位置;更優(yōu)選地,至少一個引物對的兩個引物都是特異于轉位子的至少一個差異性甲基化的位置。這對獲得較高特異性和較好的擴增過程是有利的。在另外的優(yōu)選實施方式中,采用的引物是特異于多于一個差異性甲基化的位置。 所述引物是特異于CpG或者亞硫酸氫鹽化CpG的多于一個的胞嘧啶。在尤其優(yōu)選的實施方式中,所述引物是特異于2、3、4個或多于4個的差異性甲基化的位置。另外,由于引物是特異于轉位子,在一個優(yōu)選的實施方式中,引物是特異于LINE 元件、Alu元件、HERV元件、HERV-K元件或它們的片段。在一個優(yōu)選的實施方式中,引物是特異于LINE-I元件或其片段。更為優(yōu)選地,引物是特異于轉位子的啟動子區(qū)域。這樣具有 CpG存在的高頻率的優(yōu)勢,從而較易檢測出甲基化水平。在尤其優(yōu)選的實施方式中,引物是特異于LINE-I元件的啟動子區(qū)域。在另一個實施方式中,采用的引物在長度上具有至少15個核苷酸,優(yōu)選為18、19、 20、21、22、23、M、25或多于25個核苷酸。引物對可以包括不同長度的引物。在一個優(yōu)選的實施方式中,所述引物具有18至35個核苷酸的長度,而在另一優(yōu)選的實施方式中,所述引物具有20至30個核苷酸的長度。在一個優(yōu)選實施方式中,引物對的引物唯獨特異于CpG 二核苷酸的至少一個胞嘧啶或者唯獨特異于已亞硫酸氫鹽化的CpG 二核苷酸的至少一個胞嘧啶。這些引物可以包括所述至少一個核苷酸,其特異于差異性甲基化的任何位置,即在引物低聚核苷酸的5'端、3'端或其間的任何位置。在一個特別優(yōu)選的實施方式中,特異于差異性甲基化位置的所述至少一個核苷酸是在引物核苷酸的3'端。這有利于增強特異性。在另一特別優(yōu)選的實施方式中,用于步驟a)和步驟b)的引物對是直接相鄰于轉位子的擴增區(qū)域。術語“直接相鄰”是用來表示在步驟a)和步驟b)中轉位子擴增的區(qū)域之間的距離為< 6000bp, ( 5000bp, ( 4000bp, ( 3000bp, ( 2000bp, ( IOOObp, ( 800bp, ^ 600bp,^ 500bp,更優(yōu)選為;^ 400bp 或;^ 300bp,尤其更優(yōu)選為< 200bp 或;^ lOObp。在更優(yōu)選的實施方式中,所述距離為< 80bp,< 50bp或< 10bp。在進一步更優(yōu)選的實施方式中,所述距離為Obp,即擴增的區(qū)域重疊。本領域的技術人員根據(jù)所具有的專業(yè)知識能夠根據(jù)本發(fā)明制備出大量不同的引物,這些引物是特異于轉位子的至少一個差異性甲基化的位置。這將在下文中通過LINE-I 元件的啟動子區(qū)域進行描述LINE-I元件的所述啟動子區(qū)域的核酸序列(GenBank Accession M80343)是ggggggaggagccaagatggcCGaataggaacagctcCGgtctacagctcccagCGtgagCGaCGcagaagaCGgtgatttctgcatttccatctgaggtacCGggttcatctcactagggagtgccagacagtgggCGcaggccagtgtgtgtgCGcacCGtgCGCGagcCGaagcagggCGaggcattgcctcacctgggaagCGcaaggggtcagggagttccctttctgagtcaaagaaaggggtgaCGgtCGcacctggaaaatCGggtcactcccaccCGaatattgCGcttttcagacCGgcttaagaaaCGgCGcaccaCGagactatatcccacacctggctCGgagggtcctaCGcccaCGgaatctCGctgattgctagcacagcagtctgagatcaaactgcaaggCG
11
其中,CpG是用大寫字母突出表示的。這樣,在具有后續(xù)亞硫酸氫鹽化的所述啟動子序列的完全甲基化的情況下,會形成核酸序列(SEQ ID No. 1)如下ggggggaggagTTaagatggTCGaaTaggaaTagTtTCGgtTtaTagTtTTTagCGtgagCGaCGTagaagaCGgtgatttTtgTatttTTatTtgaggtaTCGggttTatTtTaTtagggagtgTTagaTagtgggCGTaggTTagtgtgtgtgCGTaTCGtgCGCGagTCGaagTagggCGaggTattgTTtTaTTtgggaagCGTaaggggtTagggagttTTTtttTtgagtTaaagaaaggggtgaCGgtCGTaTTtggaaaatCGggtTaTtTTTaTTCGaatattgCGTttttTagaTCGgTttaagaaaCGgCGTaTTaCGagaTtatatTTTaTaTTtggTtCGgagggtTTtaCGTTTaCGgaatTtCGTtgattgTtagTaTagTagtTtgagatTaaaTtgTaaggCG其中,甲基化的CpG以及通過亞硫酸氫鹽化從C到U(或T)轉化的核苷酸是用大寫字母表示的。在具有后續(xù)亞硫酸氫鹽化的所述啟動子序列的完全去甲基化的情況下,會形成核酸序列(SEQ ID No. 2)如下ggggggaggagTTaagaTggTTGaaTaggaaTagTTTTGgTTTaTagTTTTTagTGTgagTGaTGTagaagaTGgTgaTTTTTgTaTTTTTaTTTgaggTaTTGggTTTaTTTTaTTagggagTgTTagaTagTgggTGTaggTTagTgTgTgTgTGTaTTGTgTGTGagTTGaagTagggTGaggTaTTgTTTTaTTTgggaagTGTaaggggTTagggagTTTTTTTTTTgagTTaaagaaaggggTgaTGgTTGTaTTTggaaaaTTGggTTaTTTTTaTTTGaaTaTTgTGTTTTTTagaTTGgTTTaagaaaTGgTGTaTTaTGagaTTaTaTTTTaTaTTTggTTTGgagggTTTTaTGTTTaTGgaaTTTTGTTgaTTgTTagTaTagTagTTTgagaTTaaaTTgTaaggTG其中,去甲基化的(以及轉化的)CpG和通過亞硫酸氫鹽作用從C到U(或T)轉化的核苷酸是用大寫字母表示的。因此,基于SEQ ID No. 1和SEQ ID No. 2,引物可以被選擇用來區(qū)別至少在一個位置差異性甲基化后的不同DNA。當然,本領域的技術人員知道也存在與所示有義鏈(sense strand)相對應的反義鏈(antisense strand)。在反義鏈上存在與5' -CpG_3' 二核苷酸相對應的5' -CpG-3' 二核苷酸,其也是差異性甲基化的。因此,引物也可基于反義鏈的序列信息進行選擇。由于有義鏈和反義鏈在亞硫酸氫鹽作用后不再互補,當存在有一個差異性甲基化的位置的時候,首先會產生出四個不同的特異性引物1)序列完全相同的并特異于已轉化的有義鏈,2)互補的并特異于已轉化的有義鏈,3)序列完全相同的并特異于已轉化的反義鏈,4)互補的并特異于已轉化的反義鏈。由于差異性甲基化的位置可以為兩種狀態(tài),因此有八種可能的引物。例如,我們可以從雙鏈DNA序列開始5、-AGCACGT-3、(有義)3 1 -TCGTGCA-5 1 (反義)在亞硫酸氫鹽化反應之后,其分別產生不再互補的鏈,這取決于甲基化的狀態(tài)甲基化的5 1 -AGUACGT-3 1和 3 1 -TUGTGCA-5 1 ;
去甲基化的5 1 -AGUAUGT-3 1和 3 1 -TUGTGUA-5現(xiàn)在,對于這四個序列的每一個來說,可以產生具有完全相同序列的引物和互補序列的引物,亦即甲基化的
1 -ACGTACT-3 S5 1 -ACGTGUT-35 1 -AGUACGT-3、和 5去甲基化的5 1 -AGUAUGT-3 ‘ 5 1 -AACACAT-3 1 .
禾口 5 1 -ACATACT-3 1,5
、禾口 5 1 -AACACGT-3、, -AUGTGUT-3 1 禾口在SEQ ID No. 3至1048或在表1至表12中列舉了特異于CpG 二核苷酸的一個或多個(亞硫酸氫鹽化的)胞嘧啶的、因而特異于轉位子的至少一個差異性甲基化的位置的所述引物的實施例以及更多的優(yōu)選實施方式。其中,表1至表4陳述了用于LINE-I元件的特別優(yōu)選引物,表5至表8陳述了用于Alu元件的特別優(yōu)選引物,而表9至表12陳述了用于HERV-K元件的特別優(yōu)選引物。這些引物顯示為處在5'至3'位置。在優(yōu)選的實施方式中,本發(fā)明涉及如下這些低聚核苷酸以及根據(jù)本發(fā)明提供的方法中這些低聚核苷酸的用途序列完全相同的或互補的引物序列,其特異于LINE-I元件的啟動子區(qū)域的經亞硫酸氫鹽化作用轉化并甲基化或去甲基化的有義鏈或反義鏈,即SEQ ID Nos. 3至436;更優(yōu)選 SEQ ID Nos. 3 至 112,或 SEQ ID Nos. 113 至 220,或 SEQ ID Nos. 221 至 336,或 SEQ ID Nos. 337 至 436 ;尤其更優(yōu)選 SEQ ID Nos. 3 至 57,或 SEQ ID Nos. 58 至 112,或 SEQ ID Nos. 113 至 166,或 SEQ ID Nos. 167 至 220,或 SEQ ID Nos. 221 至 278,或 SEQ ID Nos. 279 至 336,或 SEQ ID Nos. 337 至 386,或 SEQ ID Nos. 387 至 436。序列完全相同的或互補的引物序列,其特異于Alu元件的啟動子區(qū)域的經亞硫酸氫鹽化作用轉化并甲基化或去甲基化的有義鏈或反義鏈,即SEQ ID Nos. 437至612 ;更優(yōu)選 SEQ ID Nos. 437 至 476,或 SEQ ID Nos. 477 至 522,或 SEQ ID Nos. 523 至 570,或 SEQ ID Nos. 571 至 612 ;尤其更優(yōu)選 SEQ ID Nos. 437 至 456,或 SEQ ID Nos. 457 至 476,或 SEQ ID Nos. 477 至 499,或 SEQ ID Nos. 500 至 522,或 SEQ ID Nos. 523 至 546,或 SEQ ID Nos. 547 至 570,或 SEQ ID Nos. 571 至 591,或 SEQ ID Nos. 592 至 612。序列完全相同的或互補的引物序列,其特異于HERV-K元件的啟動子區(qū)域的經亞硫酸氫鹽化作用轉化并甲基化或去甲基化的有義鏈或反義鏈,即SEQ ID Nos. 613至1048 ; 更優(yōu)選 SEQ ID Nos. 613 至 708,或 SEQ ID Nos. 709 至 796,或 SEQ ID Nos. 797 至 922,或 SEQ ID Nos. 923 至 1048 ;尤其更優(yōu)選 SEQ ID Nos. 613 至 660,或 SEQ ID Nos. 661 至 708, 或 SEQ ID Nos. 709 至 752,或 SEQ ID Nos. 753 至 796,或 SEQ ID Nos. 797 至 859,或 SEQ ID Nos. 860 至 922,或 SEQ ID Nos. 923 至 985,或 SEQ ID Nos. 986 至 1048。表1 優(yōu)選的序列完全相同的引物序列,其特異于LINE-I元件的啟動子區(qū)域經亞硫酸氫鹽化作用轉化的甲基化或去甲基化的有義鏈。
權利要求
1.一種測定標準DNA甲基化水平的方法,包括如下步驟a)定量地測定在基因組DNA中轉位子或其片斷的存在,包括采用特異于轉位子或其片段的至少一個引物對而針對非亞硫酸氫鹽化的基因組DNA進行擴增,或者采用特異于亞硫酸氫鹽化轉位子或其片段的至少一個引物對而針對亞硫酸氫鹽化的基因組DNA進行擴增, 其中所述引物不包含所述轉位子的差異性甲基化位置。b)定量地測定在所述相同的轉位子或其片斷中CpG二核苷酸的至少一個差異性甲基化的C的存在,包括采用特異于轉位子或其片段的至少一個引物對而針對所述亞硫酸氫鹽化的基因組DNA進行擴增,其中包含至少一個引物其包含所述轉位子的至少一個差異性甲基化位置;以及c)通過在步驟a)和b)中測得的值確定所述標準DNA甲基化水平。
2.根據(jù)權利要求1所述的方法,其中所述轉位子或其片斷是選自于由LINE元件、 LINE-I元件、Alu元件、HERV元件所構成的組群,并且優(yōu)選地為LINE-I元件的啟動子區(qū)域。
3.根據(jù)權利要求1所述的方法,其中步驟c)包括通過步驟a)和b)所得擴增物的比率確定標準DNA甲基化水平。
4.根據(jù)以上任一項權利要求所述的方法,其中在步驟b)中的所述引物對的兩個引物都包含所述轉位子的至少一個差異性甲基化位置。
5.根據(jù)以上任一項權利要求所述的方法,其中在步驟b)中的所述引物包含所述轉位子的2、3或4個差異性甲基化位置。
6.根據(jù)以上任一項權利要求所述的方法,其中所述引物包含所述轉位子在其3'端的差異性甲基化位置。
7.根據(jù)以上任一項權利要求所述的方法,其中在步驟b)中的所述至少一個引子包含低聚核苷酸其選自于由SEQ ID Nos. 3至1048所構成的組群。
8.根據(jù)以上任一項權利要求所述的方法,其中在步驟a)和b)中的所述擴增步驟是通過實時PCR的方式進行的。
9.一種測定相對DNA甲基化水平的方法,包含如下步驟a)根據(jù)權利要求1的步驟a)至c)針對第一基因組DNA和第二基因組DNA測定甲基化水平;以及b)通過針對所述第一基因組DNA和所述第二基因組DNA所測得的甲基化水平的比率確定相對DNA甲基化水平。
10.根據(jù)權利要求9所述的方法其用于診斷與變異的DNA甲基化相關的疾病,其中所述第一基因組DNA為參照樣本而所述第二基因組DNA是取自待測樣本。
11.根據(jù)權利要求10所述的方法,其中所述疾病是腫瘤。
12.—種低聚核苷酸,其選自于由SEQ ID Nos. 3至1415所構成的組群,優(yōu)選為SEQ ID Nos. 3 至 436 和 / 或 SEQ ID Nos. 1049 至 1227。
13.利用權利要求12所述的至少一種低聚核苷酸測定所述標準和/或相對DNA甲基化水平的用途。
全文摘要
本發(fā)明提供低聚核苷酸和測定標準DNA甲基化水平以及測定至少兩個樣本之間相對DNA甲基化水平的方法。本發(fā)明采用基因組中轉位子的任意分布。所公開的低聚核苷酸和方法對于尤其是臨床診斷學具有重要意義。
文檔編號C12Q1/68GK102356160SQ201080006191
公開日2012年2月15日 申請日期2010年1月21日 優(yōu)先權日2009年1月22日
發(fā)明者西梅昂·圣托里迪斯 申請人:杜塞爾多夫海因里希·海涅大學