專利名稱:核酸相互作用分析的制作方法
核酸相互作用分析技術(shù)領(lǐng)域一般來說,本發(fā)明涉及基因表達(dá)領(lǐng)域。更確切地說,本發(fā)明涉及核酸的 相互作用。特別地,本發(fā)明涉及對核酸-蛋白相互作用的情況和相互作用的 組分進(jìn)行分析、檢測和識別。
背景技術(shù):
染色質(zhì)的相互作用是重要的基因調(diào)控方式。最近完成的人類基因組測序 提供了遺傳信息的框架。然而,人類基因組的結(jié)構(gòu)和信息通常表現(xiàn)為一維線 性關(guān)系,該一維線性關(guān)系不足以解釋細(xì)胞系統(tǒng)的復(fù)雜性和協(xié)同性。為了理解基因組怎樣作為和諧地結(jié)合的系統(tǒng)(orchestrated system)在活細(xì)胞的三維細(xì)胞 核中真實地作用,需要一種完全不同的視角。基因組DNA (估計伸長后為 兩米長)濃縮在位于細(xì)胞核中的染色體中,僅僅幾微米。已知染色體被不均 勻地組織成常染色質(zhì)和異染色質(zhì),它們被染色質(zhì)蛋白所包裝并通過用于轉(zhuǎn)錄 和復(fù)制的轉(zhuǎn)錄因子所轉(zhuǎn)達(dá)。這些活性看來是有序的??梢杂^察到,大的染色體環(huán)包括活性基因。此 外,還暗示了遠(yuǎn)端調(diào)控元件(如基因座控制區(qū)(LCR)、增強子、和絕緣子) 通過將特定的遺傳位點重新定位至活性轉(zhuǎn)錄或沉默轉(zhuǎn)錄的區(qū)域起作用。近期 在P-球蛋白以及最近在細(xì)胞因子基因(IFN-力的研究中證明了LCRs可以直接 與位于同一個染色體的相距較遠(yuǎn)的啟動子相互作用,甚至可以直接與位于不 同的染色體的啟動子相互作用。染色體內(nèi)和染色體間相互作用可能是發(fā)生在 重要路徑的協(xié)同基因調(diào)節(jié)中的多遺傳位點的普遍現(xiàn)象。疾病中也暗含有染色 體內(nèi)-染色體間相互作用。例如,染色體易位可以導(dǎo)致myc轉(zhuǎn)錄物的調(diào)節(jié)紊 亂,所述染色體易位使位于染色體15上的c-myc/pvt-l基因座與位于染色體12上的免疫球蛋白位點并列。此外,全基因組水平的染色體間相互作用的分 析對所有相互作用的識別是必需的,并且將清楚地顯示出細(xì)胞中的高水平的 基因調(diào)節(jié)。用于染色質(zhì)相互作用的研究的技術(shù)大多數(shù)用于研究三維結(jié)構(gòu)和染色質(zhì) 相互作用的方法均存在大量的限制??梢越鉀Q此問題的技術(shù)可以簡單地分 為可視化工具,如顯微鏡法、熒光素原位雜交(FISH)、和RNA標(biāo)簽和相 關(guān)蛋白的復(fù)性(RNA-TRAP);和分子生物學(xué)方法,如染色體構(gòu)象捕獲(3C)、 和3C后的染色質(zhì)免疫沉淀法(3C-ChlP)。在許多早期研究中,顯微鏡法被應(yīng)用于研究細(xì)胞核中染色質(zhì)的空間組 織。然而,這種細(xì)胞遺傳學(xué)方法僅能夠提供染色體中染色質(zhì)的粗略片段信息。 熒光素原位雜交(FISH)是這一方向中的重要改進(jìn),F(xiàn)ISH通過熒光標(biāo)記的 DNA或RNA探針與基因組DNA的雜交,使特定的遺傳位點定位到染色體 上特定的物理位置。然而,該方案仍然是受限制的。對FISH進(jìn)行改進(jìn)的 RNA-TRAP是一種能夠顯示出遠(yuǎn)端的增強子與基因啟動子在物理位置上極 為接近的方法。染色體構(gòu)象捕獲(3C)最初被設(shè)計成研究酵母染色體的構(gòu)造(Dekker等, 2002),以及用于研究遺傳成分的相互作用,所述遺傳成分分散在相距較遠(yuǎn) 的范圍內(nèi)和/或分散在不同的染色體中。在染色體構(gòu)象捕獲(3C)中,用甲醛對 DNA-蛋白(染色質(zhì))結(jié)構(gòu)進(jìn)行體內(nèi)交聯(lián),并且通過限制性內(nèi)切核酸酶將染 色質(zhì)消化成片段。然后,通過連接將具有DNA結(jié)合蛋白的DNA片段結(jié)合, 再通過PCR對兩種疑似已知的成分的連接物進(jìn)行檢測。通過特定的DNA結(jié) 合蛋白或轉(zhuǎn)錄因子調(diào)節(jié)的染色質(zhì)相互作用的檢測,可以通過染色質(zhì)免疫沉淀 法(3C-ChlP)被進(jìn)一步增強,其中,通過抗體拉開試驗(antibodypull-down) 使3C過程中導(dǎo)致的與蛋白交聯(lián)的嵌合DNA片段濃縮。雖然每種單獨的技術(shù)和一些結(jié)合被證實能夠用于對一些特定的染色體內(nèi)和染色體間相互作用進(jìn)行識別,但是這些方法依賴于關(guān)于存在哪些的遠(yuǎn)端染色質(zhì)相互作用的已有知識或推測,以及依賴于設(shè)計成用于通過PCR以每 次一個區(qū)域的方式對這種連接進(jìn)行檢測的引物。因而,目前用于研究染色質(zhì) 相互作用的技術(shù)在識別新的染色質(zhì)相互作用以及全基因組水平的大范圍識 別上受到了極大的限制。雖然對染色體在空間上被組裝入細(xì)胞核中的方式以及如何同時調(diào)節(jié)遠(yuǎn) 端基因的轉(zhuǎn)錄十分感興趣,但目前僅能夠得到零散的和間接的信息。在此方 面缺乏信息主要是由于缺乏能夠有效地解決染色體相互作用的三維問題的 強有力的技術(shù)。本領(lǐng)域需要能夠有效地解決染色體相互作用的三維問題的更有效的方 法和更強有力的技術(shù),以克服現(xiàn)有技術(shù)存在的缺點及限制。發(fā)明內(nèi)容本發(fā)明通過提供一種用于對核酸復(fù)合物中,特別是對核酸-蛋白質(zhì)復(fù)合 物中的至少一種核酸序列或片段進(jìn)行檢測、識別、和/或制備的新方法而解決 了上述問題。特別地,本發(fā)明的方法提供了一種對核酸-蛋白質(zhì)復(fù)合物中至 少兩種核酸序列或片段進(jìn)行檢測、識別、和/或制備的方法。本發(fā)明還涉及一 種寡核苷酸,該寡核苷酸是由根據(jù)本發(fā)明的任意一個實施方式的方法制備得 到的。本發(fā)明還提供了一種用于識別染色質(zhì)相互作用的情況的方法,所述染 色質(zhì)相互作用的情況是通過相距較遠(yuǎn)的特定DNA結(jié)合蛋白和不同染色體之 間的特定DNA結(jié)合蛋白來調(diào)節(jié)的。另一方面,本發(fā)明通過提供一種分離的寡核苷酸解決了上述提及的問 題,所述寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,其中,所述 第一標(biāo)簽和所述第二標(biāo)簽為核酸-蛋白質(zhì)復(fù)合物的標(biāo)簽。特別地,本發(fā)明提供了一種分離的寡核苷酸,該分離的寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得 自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物。所述第一多聚核苷酸和所述第二多聚核苷酸可以為所述核酸 -蛋白質(zhì)復(fù)合物的同一核酸區(qū)域或不同核酸區(qū)域的一部分。所述分離的寡核苷酸還可以含有至少一個限制性內(nèi)切核酸酶識別位點 和/或至少一個接頭。特別地,所述至少一個限制性內(nèi)切核酸酶識別位點可以 包括在接頭中。所述接頭可以插在所述標(biāo)簽之間,或者所述接頭可以與至少 一個標(biāo)簽側(cè)翼連接(即,定位的至少一個標(biāo)簽的上游和/或下游)。所述至少 一種限制性內(nèi)切核酸酶的識別位點可以不對稱。例如,所述至少一種限制性 內(nèi)切核酸酶的識別位點可以為lis型限制性內(nèi)切核酸酶的識別位點或歸巢限帝U性內(nèi)切酶(homing restriction enzyme)的識別位點。所述至少一個第一標(biāo)簽可以含有所述第一多聚核苷酸的5'末端和3'末 端,所述至少一個第二標(biāo)簽可以含有所述第二多聚核苷酸的5'末端和3'末 端。所述分離的寡核苷酸還可以含有至少一個接頭。所述接頭可以插在所述 標(biāo)簽之間,或者所述接頭可以定位在至少一個標(biāo)簽的上游和/或下游。所述接 頭含有至少一種限制性內(nèi)切核酸酶的識別位點。所述至少一種限制性內(nèi)切核 酸酶的識別位點可以不對稱。例如,所述至少一種限制性內(nèi)切核酸酶的識別 位點可以為lis型限制性內(nèi)切核酸酶的識別位點或歸巢限制性內(nèi)切酶的識別 位點。所述接頭可以含有第一限制性識別位點和第二限制性識別位點,所述第 一限制性識別位點被能夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一標(biāo)簽的限 制性內(nèi)切核酸酶所識別,所述第二限制性識別位點被能夠?qū)Φ诙嗑酆塑账?進(jìn)行酶切以得到第二標(biāo)簽的限制性內(nèi)切核酸酶所識別。特別地,所述接頭可 以含有第一限制性識別位點和第二限制性識別位點,所述第一限制性識別位 點被能夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一多聚核苷酸的3'末端的第一限制性內(nèi)切核酸酶所識別,所述第二限制性識別位點被能夠?qū)Φ诙嗑酆塑账徇M(jìn)行酶切以得到第二多聚核苷酸的5'末端的第二限制性內(nèi)切核酸酶所 識別。所述第一限制性識別位點和所述第二限制性識別位點可以被相同的或 不同的限制性內(nèi)切核酸酶所識別。根據(jù)另一方面,所述第一多聚核苷酸還可以被能夠識別第三識別位點的第三限制性內(nèi)切核酸酶所酶切,以得到第一多聚核苷酸的5,末端;所述第二 多聚核苷酸被能夠識別第四識別位點的第四限制性內(nèi)切核酸酶所酶切,以得 到第二多聚核苷酸的3'末端。根據(jù)這個實施方式,至少一個第一標(biāo)簽通過連 接所述第一多聚核苷酸的5'末端和3'末端獲得,至少一個第二標(biāo)簽通過連接 所述第二多聚核苷酸的5,末端和3'末端獲得。所述第三限制性識別位點和第 四限制性識別位點可以被相同的或不同的限制性內(nèi)切核酸酶所識別。其它的 識別位點可以包括在分別連接所述第一多聚核苷酸的5'末端和所述第二多 聚核苷酸的3'末端的銜接頭中??晒┻x擇性地,所述第三限制性識別位點和 第四限制性識別位點可以存在于載體中,該載體中插有第一多聚核苷酸-接 頭-第二多聚核苷酸結(jié)構(gòu)。在這種情況下,所述第三限制性識別位點與所述 第一多聚核苷酸的5'末端側(cè)翼連接,所述第四限制性識別位點與所述第二多 聚核苷酸的3'末端側(cè)翼連接。所述分離的寡核苷酸的核酸-蛋白質(zhì)復(fù)合物可以為染色質(zhì)結(jié)構(gòu)的一部 分。與感興趣的蛋白結(jié)合的核酸片段可以為含有能夠與感興趣的蛋白結(jié)合的 區(qū)域(例如,組蛋白結(jié)合位點)的任何核酸片段。所述多聚核苷酸可以為 DNA或RNA。另一個方面,本發(fā)明提供了一種寡核苷酸連環(huán)體,該寡核苷酸連環(huán)體含 有至少兩個分離的寡核苷酸,每個分離的寡核苷酸含有至少一個第一標(biāo)簽和 至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽和所述第二標(biāo)簽為核酸-蛋白質(zhì)復(fù) 合物的標(biāo)簽。特別地,本發(fā)明提供了一種寡核苷酸連環(huán)體,該寡核苷酸連環(huán)體含有至少兩個分離的寡核苷酸,每個分離的寡核苷酸含有至少一個第一標(biāo) 簽和至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽為第一多聚核苷酸的標(biāo)簽,所 述第二標(biāo)簽為第二多聚核苷酸的標(biāo)簽,所述第一多聚核苷酸和所述第二多聚 核苷酸源自核酸-蛋白質(zhì)復(fù)合物。所述連環(huán)體還可以含有至少一個接頭。所 述接頭可以含有至少一種限制性內(nèi)切核酸酶的識別位點。此外,所述連環(huán)體 的每一個分離的寡核苷酸均可以含有至少一種限制性內(nèi)切核酸酶的識別位 點。所述至少一個限制性內(nèi)切核酸酶識別位點包括在所述至少一個接頭中和 /或至少一個銜接頭中。所述接頭可以插在所述標(biāo)簽之間,或者所述接頭可以定位在至少一個標(biāo) 簽的上游和/或下游。所述接頭可以含有至少一種限制性內(nèi)切核酸酶的識別位點。所述至少一種限制性內(nèi)切核酸酶的識別位點可以為lis型限制性內(nèi)切核酸酶的識別位點或歸巢限制性內(nèi)切酶的識別位點。所述連環(huán)體的每一個寡核 苷酸的第一標(biāo)簽可以含有源自所述第一多聚核苷酸的5'末端和3'末端;所述第二標(biāo)簽可以含有源自所述第二多聚核苷酸的5'末端和3'末端。本發(fā)明的寡核苷酸或連環(huán)體可以插入載體和/或細(xì)胞中。所述細(xì)胞可以 為細(xì)菌細(xì)胞。所述多聚核苷酸核酸-蛋白質(zhì)復(fù)合物可以為染色質(zhì)結(jié)構(gòu)的一部分。所述 多聚核苷酸可以被定位在同一個染色體上,或者可以被定位在不同的染色體上。在另一方面,本發(fā)明提供了一種寡核苷酸文庫或者含有至少一種寡核苷 酸的寡核苷酸連環(huán)體文庫,所述寡核苷酸含有至少一個第一標(biāo)簽和至少一個 第二標(biāo)簽,其中,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第 二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核苷酸-蛋白質(zhì) 復(fù)合物。所述文庫中的至少一種寡核苷酸可以含有至少一個接頭。所述接頭可以插在所述標(biāo)簽之間,或者所述接頭可以定位在至少一個標(biāo)簽的上游和/或下 游。所述第一標(biāo)簽可以含有源自所述第一多聚核苷酸的5'末端和3'末端;所述第二標(biāo)簽還含有源自所述第二多聚核苷酸的5'末端和3'末端。另一方面,本發(fā)明提供了一種制備至少一種分離的寡核苷酸的方法,該方法包括(a) 提供核酸-蛋白質(zhì)復(fù)合物;(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽和所述第二標(biāo)簽得自核酸-蛋白質(zhì)復(fù)合物;和(c) 分離所述寡核苷酸。特別地,本發(fā)明提供了一種制備至少一種分離的寡核苷酸的方法,該方 法包括(a) 提供核酸-蛋白質(zhì)復(fù)合物;(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所 述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物;和(c) 分離所述寡核苷酸。在一個實施方式中,本發(fā)明此方面的步驟(b)包括(i) 插入至少一個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位 點,禾口(ii) 使用能夠識別位于所述接頭中的至少一個識別位點的至少一種限制 性內(nèi)切核酸酶,對第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以形成寡核 苷酸,該寡核苷酸含有第一標(biāo)簽、第二標(biāo)簽和位于所述標(biāo)簽之間的接頭,所 述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸。在另一個實施方式中,本發(fā)明此方面的步驟(b)包括(i)在所述復(fù)合物的第一多聚核苷酸和第二多聚核苷酸之間插入至少一個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位點;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分別加入至 少一個限制性內(nèi)切核酸酶識別位點;(iii) 使用能夠識別至少一個識別位點的至少一種限制性內(nèi)切核酸酶,對 第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以獲得酶切片段;和(iv) 連接所述酶切片段以形成寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第 二標(biāo)簽、含有每個多聚核苷酸的5'末端和3'末端的標(biāo)簽和插入在該標(biāo)簽之間 的接頭,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核 苷酸,步驟(ii)中的至少一種限制性內(nèi)切核酸酶的識別位點為銜接頭或載體的 一部分。所述多聚核苷酸可以通過將光活化成分加入到感興趣的核酸(例如, DNA)和/或蛋白中而從核酸-蛋白質(zhì)復(fù)合物中獲得,而核酸/蛋白質(zhì)復(fù)合物可 以通過抗體調(diào)節(jié)的沉淀或親和力介導(dǎo)的技術(shù)進(jìn)行分離。這種基于親和力的技 術(shù)的例子包括鏈霉親和素/生物素、谷胱甘肽-S-轉(zhuǎn)移酶/谷胱甘肽基質(zhì)、麥 芽糖結(jié)合蛋白/直鏈淀粉基質(zhì)的相互作用。另一方面,本發(fā)明提供了一種用于檢測和/或識別核酸-蛋白質(zhì)復(fù)合物中 的至少兩種多聚核苷酸的方法,該方法包括(a) 提供核酸-蛋白質(zhì)復(fù)合物;(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所 述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物;(c) 對所述寡核苷酸進(jìn)行測序;和(d) 根據(jù)所述第一標(biāo)簽和所述第二標(biāo)簽的核苷酸序列對所述至少兩種多 聚核苷酸進(jìn)行定位,從而對所述至少兩種多聚核苷酸進(jìn)行檢測和/或識別。在步驟(c)中進(jìn)行測序之前,可以對步驟(b)中得到的寡核苷酸進(jìn)行擴增。所述擴增可以通過聚合酶鏈?zhǔn)椒磻?yīng)進(jìn)行。在擴增后但在步驟(C)中的測序之 前,可以對擴增的寡核苷酸進(jìn)行至少一個純化的步驟。所述至少一個純化的 步驟可以為凝膠電泳。在測序前,本發(fā)明的寡核苷酸可以與至少一個通過的步驟(a)-(b)獲得的 另外的寡核苷酸連接。通過桑格法(Sanger method)或多重測序分析如焦磷酸(pyros叫uencing) 測序技術(shù)來進(jìn)行測序。所述檢測和/或識別可以用于所述多聚核苷酸的轉(zhuǎn)移或易位。因此,所 述方法可以用于對核酸-蛋白質(zhì)復(fù)合物如位于染色質(zhì)中的核酸-蛋白質(zhì)復(fù)合物 中彼此臨近的多聚核苷酸和/或基因進(jìn)行檢測和/或識別。另外,與感興趣的 蛋白結(jié)合的核酸片段可以為含有能夠與感興趣的蛋白結(jié)合的區(qū)域(例如,組 蛋白結(jié)合位點)的任何核酸片段。所述多聚核苷酸和以為DNA或RNA。所述寡核苷酸可以被轉(zhuǎn)染至至少一種細(xì)胞中。所述轉(zhuǎn)染可以通過電穿孔 來實現(xiàn)。所述細(xì)胞可以為細(xì)菌細(xì)胞。所述多聚核苷酸和以為DNA或RNA。另一個方面,本發(fā)明提供了一種載體,該載體包括寡核苷酸、寡核苷 酸的連環(huán)體,或者寡核苷酸或連環(huán)體的文庫。
圖1顯示了本發(fā)明的通過成對的末端(雙)標(biāo)簽測序進(jìn)行染色質(zhì)相互作用 分析(CIA-PET)的方法的概述;圖2顯示了本發(fā)明的另一種通過兩個成對的末端(雙)標(biāo)簽進(jìn)行染色質(zhì)相 互作用(CIA-diPET)的方法的概述;圖3顯示了對CIA-PET進(jìn)行定位;CIA-PETs表示的真實的相互作用區(qū) 域跨越兩個不同的基因組區(qū)域,并且多重的CIA-PETs為簇生的;圖4顯示了用于CIA-PET的相關(guān)限制性內(nèi)切核酸酶的識別序列;每個用N或X表示的堿基可以為任何一種核苷酸(A、 C、 G或T);含有N和 X的區(qū)域表示從不同的多聚核苷酸中得到的部分;圖中從頂部至底部顯示的 序列為SEQIDN0:1、 SEQIDN0:2、 SEQIDNO:36、 SEQIDNO:37、 SEQ IDNO:20、 SEQIDNO:21、 SEQIDNO:5、 SEQIDNO:6、 SEQIDNO:7、 SEQ IDNO:8、 SEQIDNO:13、 SEQIDNO:22、 SEQIDNO:23、 SEQIDNO:14、 SEQ ID NO:24、 SEQ ID NO:25 (SEQ ID No:24和SEQ ID No:25重復(fù)三次);圖5顯示了對CIA-diPET進(jìn)行定位;CIA-diPET表示的相互作用區(qū)域跨 越兩個不同的基因組區(qū)域;并且多重的CIA-diPET為簇生的;由CIA-diPET 的兩個PETs帶來的額外信息有益于將CIA-diPET定位到基因組中;圖6顯示了用于CIA-diPET的相關(guān)限制性內(nèi)切核酸酶的識別序列;堿基 N或X可以表示任何一種核苷酸(A、 C、 G或T),并且它們來自不同的 多聚核苷酸;數(shù)字1和2表示來自兩個區(qū)域的核苷酸或表示得自一個多聚核 苷酸的末端,數(shù)字3和4表示來自兩個區(qū)域的核苷酸或表示得自另一個多聚 核苷酸的末端;數(shù)字(1、 2、 3、和/或4)可以表示任何一種核苷酸(A、 C、 G或T);圖中從頂部至底部顯示的序列為SEQIDNO:3、 SEQIDNO:4、 SEQ ID NO:26、 SEQ ID NO:27、 SEQ ID NO:28、 SEQ ID NO:29、 SEQ ID NO:30、 SEQIDNO:31、 SEQ ID NO:32、 SEQIDNO:33、 SEQ ID NO:34、 SEQ ID NO:35 (SEQ ID No:24和SEQ ID No:25重復(fù)三次);圖7顯示了含有多個獨特克隆位點的載體pGIS8,載體pGIS8是可以用于本發(fā)明的載體的一個例子;圖8顯示了不具有插入的接頭的寡核苷酸如何不能夠被限制性內(nèi)切核酸 酶所酶切的;因而,由于該寡核苷酸過長而通過電泳被去去除;圖中從頂部 至底部顯示的序列為SEQIDNO:3、 SEQIDNO:4、 SEQIDNO:38、 SEQID NO:39、 SEQIDNO隱40、 SEQIDNO:41、 SEQIDNO:42、 SEQIDNO:43、 SEQ ID NO:44禾卩SEQ ID NO:45;圖9顯示了如果僅僅將部分插頭插入至寡核苷酸中,將如何導(dǎo)致寡核苷 酸被錯誤地酶切的,因而,由于該寡核苷酸過長而將通過電泳被去除;圖中 從頂部至底部顯示的序列為SEQIDNO:3、 SEQIDNO:4、 SEQIDNO:46、 SEQ ID NO:47、 SEQ ID NO:48、 SEQ ID NO:49、 SEQ ID NO:50、 SEQ ID NO:51、 SEQIDNO:52和SEQIDNO:53;圖10顯示了錯誤插入的接頭是如何產(chǎn)生一些寡核苷酸的,這些寡核苷 酸過長并且其長度發(fā)生變化,因而可以通過電泳而被去除;圖中從頂部至底 部顯示的序列為SEQIDNO:3、 SEQ ID NO:4、 SEQ ID NO:54、 SEQ ID NO:55、 SEQIDNO:56、 SEQ ID NO:57、 SEQIDNO:58、 SEQIDNO:59、 SEQ ID NO:60、 SEQ ID NO:61 、 SEQ ID NO:62和SEQ ID NO:63;圖11顯示了載體pGIS8的核苷酸序列,載體pGIS8為已標(biāo)出不同的限 制性內(nèi)切核酸酶的識別位點的載體實例,所述序列為序列表中的SEQ ID NO:18和SEQIDNO:19。
具體實施方式
定義限制性內(nèi)切核酸酶限制性內(nèi)切核酸酶為能夠切割雙鏈DNA的酶。所 述限制性內(nèi)切核酸酶可以切出兩個切口, 一個切口穿過雙螺旋的每一個磷酸 骨架而不對堿基產(chǎn)生破壞。酶切了的化學(xué)鍵可以通過稱為連接酶的其它酶而 重新形成,從而將得自不同染色體或基因的限制性酶切片段拼接在一起,其 前提是它們的末端完全互補。II型酶識別特定的核苷酸序列,并在臨近或位 于它們的識別序列位點中的確定的位點對DNA進(jìn)行酶切。它們生成不連續(xù) 的限制性酶切片段和不同的凝膠帶形式。lis型酶切開它們的識別序列的外 部一側(cè)。Mmel與多數(shù)lis型限制性內(nèi)切核酸酶一樣生成可變的末端長度 (Dunn et al, 2002 showed that Mmel can cut 18/20 or 19/21 bases away in a19rough proportion of 1 :1)。因而,在所有圖中給出的序列各自代表一種使用類 膜金屬內(nèi)肽酶后的常用變體。成對的末端雙標(biāo)簽(PET)中間體還具有可變的長度(g卩,在克隆至pGIS8質(zhì)粒和M PET中間體后的M和G銜接頭DNA序列),因為所述多聚核苷酸 可以為不同的長度。in性酶還可以為限制性內(nèi)切核酸酶-修飾酶的較大的聯(lián) 合體。它們切割其識別序列的外部,并且它們需要在同一個DNA分子中具 有相反取向的兩個這樣的序列以完成酶切。歸巢內(nèi)切核酸酶為罕見的雙鏈 DNA酶,該酶能識別較大的不對稱位點(12-40個堿基對)和編碼序列,該編 碼序列通常嵌入在內(nèi)含子(DNA)和內(nèi)含肽(蛋白質(zhì))中。限制性內(nèi)切核酸酶可 以進(jìn)行酶切以使平末端或粘性末端具有突出端。粘性末端片段不僅可以與最 初切割的片段連接,還可以與任何具有相容性的黏性或粘性末端的其它片段 連接。這樣,由不同的酶生成的末端可以為相容的。因此,粘性末端還可以 指能被連接的末端。多種II型限制性內(nèi)切核酸酶能夠?qū)匚腄NA序列進(jìn)行 酶切。如果限制性內(nèi)切核酸酶具有非簡并回文序列的酶切位點,則由此產(chǎn)生 的所有末端是相容的。"回文"序列為在一條鏈上閱讀的序列與反方向閱讀 其互補鏈的序列相同的一種序列。這樣,對于處理核酸鏈以獲得回文的粘性 末端來說,可能使所述核酸鏈的末端互補并使該核酸鏈自環(huán)化 (self-circularize)。上下文中"回文"的意思與其在語言學(xué)上的使用的意思是 不同的。例如,序列GTAATG不是回文DNA序列,序列GTATAC是回文 序列。能夠留下黏性或粘性末端的限制性內(nèi)切核酸酶的例子包括BamHI、 EcoRI和HindIII。能夠留下平整的、非黏性的、或非粘性的末端的限制性內(nèi) 切核酸酶的例子包括BseRl和Alul。核苷酸核苷的磷酸酯;核酸(DNA或RNA)的基本結(jié)構(gòu)單位。核苷 酸型堿基對通過氫鍵結(jié)合的化學(xué)堿基對中的一種,所述氫鍵連接具有兩條 鏈的DNA分子或RNA分子的互補鏈;對于DNA,所述堿基對為腺嘌呤-胸腺嘧啶、鳥嘌呤-胞嘧啶;對于RNA,所述堿基對為腺嘌呤-尿嘧啶、鳥嘌 呤-胞嘧啶。短鏈的核苷酸稱為寡核苷酸,較長鏈的核苷酸稱為多聚核苷酸。 核苷酸可以與另外的核苷酸結(jié)合或連接。術(shù)語核苷酸可以與術(shù)語核酸互換使 用。伸長的核酸具有5'末端和3'末端。伸長的核酸的末端區(qū)域分別稱為5' 末端和3'末端。關(guān)于多聚核苷酸的5,或3,末端,應(yīng)該理解的是,含有具有多 聚核苷酸的真實5,或3,末端的多聚核苷酸的任何區(qū)域、片段、或全部。連環(huán)體由末端與末端相連的至少兩個核苷酸單體序列組成,并且該連 環(huán)體可以被接頭或間隔物隨機地隔開。對于本發(fā)明的目的,根據(jù)本發(fā)明的方 法制備了含有至少兩個寡核苷酸的連環(huán)體??寺 o性繁殖從一個有機體向另一個有機體傳遞核苷酸,例如基因, 和/或通過遺傳工程技術(shù)復(fù)制核苷酸。文庫通常包含在一種或多種質(zhì)粒中的克隆的核酸序列、寡核苷酸或多 聚核苷酸的集合體。載體能夠?qū)⑦z傳物質(zhì)從一個細(xì)胞轉(zhuǎn)移至另一個細(xì)胞中的噬菌體、質(zhì)粒、 或其它介質(zhì)。得到、得自使用分子生物學(xué)方法、基因工程技術(shù)和操作技術(shù)賦予生物 材料如核酸和蛋白某些所需要的特性。術(shù)語得到和得自可以在本發(fā)明中互換 使用。擴增使核酸的拷貝數(shù)增加。通常使用的一種方法為聚合酶鏈?zhǔn)椒磻?yīng) (PCR)。也可以使用本領(lǐng)域技術(shù)人員所公知的其它擴增方法。轉(zhuǎn)染或轉(zhuǎn)化用于將外源分子引入細(xì)胞的任何方法。脂質(zhì)轉(zhuǎn)染、磷酸鈣 沉淀、逆轉(zhuǎn)錄病毒釋放、電穿孔、生物射彈轉(zhuǎn)化僅僅是能夠使用的技術(shù)中的 幾個實例。染色質(zhì)核酸與主要是組蛋白的蛋白質(zhì)的復(fù)合物,位于細(xì)胞核中容易被 堿性燃料所染色,并在細(xì)胞分裂期間濃縮形成染色體。染色質(zhì)是核酸-蛋白質(zhì)復(fù)合物的一個例子。染色體區(qū)域可以與同一個染色體上的或不同的染色體 上的其它區(qū)域相互作用。因此,所述相互作用情況可以為染色體間或染色體 內(nèi)的相互作用情況,并可以包括有關(guān)區(qū)域的遺傳物質(zhì)的重排。轉(zhuǎn)移遺傳信息在RNA加工水平的重排以形成新的嵌合的轉(zhuǎn)錄物。 易位遺傳信息在基因組DNA水平的重排。核酸-蛋白質(zhì)復(fù)合物遺傳物質(zhì)與蛋白質(zhì)的相互作用,例如,染色質(zhì)中 發(fā)現(xiàn)的;或者轉(zhuǎn)錄因子與伸長的核酸的結(jié)合。DNA-蛋白質(zhì)-DNA(DPD)是更 特殊的結(jié)構(gòu),其中,蛋白質(zhì)結(jié)合在感興趣的兩個伸長的核酸(DNA)之間???以將伸長的核酸如DNA作為DNA的標(biāo)簽或識別序列。標(biāo)簽、標(biāo)簽-接頭結(jié)構(gòu)標(biāo)簽或標(biāo)記是核酸的識別序列,標(biāo)簽或標(biāo)記涉 及源自任何臨近DNA區(qū)域的5,-或3,-的大部分核酸序列(末端;通常為 18-20bp),或者標(biāo)簽可以含有5,-和3,-大部分的核酸序列或任何臨近的DNA 區(qū)域的兩個末端。接頭為人工合成的核酸序列。因此,標(biāo)簽-接頭-標(biāo)簽結(jié)構(gòu) 是一種核酸排列,其中,接頭插在兩個標(biāo)簽之間。另一個可能的排列為接頭 -標(biāo)簽-標(biāo)簽-接頭結(jié)構(gòu),其中,接頭與標(biāo)簽側(cè)翼連接(即,接頭被定位在至少 一個標(biāo)簽的上游和/或下游)。術(shù)語標(biāo)簽和標(biāo)記在本發(fā)明中可以互換使用。雙標(biāo)簽短核酸片段(通常為12-60 bp)衍生自多聚核苷酸的末端的標(biāo) 簽或標(biāo)記??梢愿鶕?jù)美國專利20050255501和/或20050059022的方法來制備 雙標(biāo)記,這些專利的內(nèi)容在此一并引入作為參考。測序用于確定生物多聚體中的組分(在此情況下為核酸)的規(guī)則的方 法。所用的測序技術(shù)包括桑格法(Sanger method)及其改進(jìn)的變化、以及焦 磷酸測序技術(shù)或測序的"454法"。在以下說明書中,提供細(xì)節(jié)、具體的量和參數(shù)以描述本發(fā)明的實施方式。 然而,對于本領(lǐng)域技術(shù)人員來說,本發(fā)明可以不以這些細(xì)節(jié)的方式來實現(xiàn)是 顯而易見的。為了不使本發(fā)明含糊不清,可以不詳盡地描述一些細(xì)節(jié)。為了實施發(fā)明的方法的具體的實施方式、用于實施本發(fā)明的其它實施方 式公開的內(nèi)容也可以在此使用,并在此一并引入作為參考。特別是操作方法、 試劑、試驗條件、限制性酶切位點、酶、載體、引物等等。特別地,很明顯 本領(lǐng)域技術(shù)人員知道如何改變已公開的用于其它實施方式中的技術(shù)和材料 以適用本發(fā)明的實施方式。本領(lǐng)域的技術(shù)人員應(yīng)該理解的是在此沒有具體介紹的技術(shù)可以在標(biāo)準(zhǔn)的分子生物學(xué)參考書如分子克隆中找到(Molecular Cloning: A Laboratory Manual by Sambrook and Russell, Third Edition, 2001 , published by Cold Spring Harbor Laboratory Press)。描述本發(fā)明涉及一種用于對核酸復(fù)合物中,特別是對核酸-蛋白質(zhì)復(fù)合物中 至少一種核酸序列或片段進(jìn)行檢測、識別、和/或制備的新方法。特別地,本 發(fā)明的方法提供了一種對核酸-蛋白質(zhì)復(fù)合物中至少兩種核酸序列或片段進(jìn) 行檢測、識別、和/或制備的方法。本發(fā)明還提供了寡核苷酸和/或寡核苷酸 連環(huán)體。根據(jù)一個方面,本發(fā)明提供了一種染色質(zhì)相互作用的分析(CIA)方法。 染色質(zhì)相互作用的分析被設(shè)計成用于捕獲關(guān)于遠(yuǎn)端控制區(qū)和染色體間的相 互作用的全程過程的新信息。該方法被設(shè)計成用于在相距較遠(yuǎn)的位置和不同 的染色體之間識別由特定的DNA結(jié)合蛋白如組蛋白介導(dǎo)的染色質(zhì)相互作用 情況。本發(fā)明提供了以檢測這樣的DNA連接的CIA法的兩個實施方式,艮P, CIA-PET法,該方法從兩個連接的DNA片段中的每一個中得到單一的標(biāo)簽 標(biāo)記(約20bp)以形成標(biāo)簽1-接頭-標(biāo)簽2(還稱作"第一標(biāo)簽-接頭-第二標(biāo)簽") 成對的末端雙標(biāo)簽(PET)結(jié)構(gòu)(圖1);禾卩CIA-diPET法,該方法得到兩個 成對的末端雙標(biāo)簽(PET)以在"PETl-接頭-PET2"結(jié)構(gòu)中表示兩個相關(guān)的DNA片段,故稱作diPET (圖2)??梢允褂枚嘀販y序技術(shù)如"454"焦磷 酸測序方法對CIA-PET和CIA-diPET的標(biāo)簽直接測序,或者將CIA-PET和 CIA-diPET的標(biāo)簽連接以用于克隆并使用常規(guī)的測序方法進(jìn)行測序。因此,本發(fā)明提供了一種制備至少一種分離的寡核苷酸的方法,該方法 包括-(a) 提供核酸-蛋白質(zhì)復(fù)合物;(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽和第二標(biāo)簽得自核酸-蛋白質(zhì)復(fù)合物;和(c) 分離所述寡核苷酸。所述第一標(biāo)簽可以得自第一多聚核苷酸,所述第二標(biāo)簽可以得自第二多 聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物。 所述步驟(b)可以包括(i) 插入至少一個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位 點,禾口(ii) 使用能夠識別位于所述接頭中的至少一個識別位點的至少一種限制 性內(nèi)切核酸酶,對第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以形成寡核 苷酸,該寡核苷酸含有第一標(biāo)簽、第二標(biāo)簽和接頭,所述第一標(biāo)簽得自第一 多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸。特別地,所述步驟(b)可以包括(i) 在所述復(fù)合物的第一多聚核苷酸和第二多聚核苷酸之間插入至少一 個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位點;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分別加入至 少一種限制性內(nèi)切核酸酶的識別位點;(iii) 使用能夠識別至少一個識別位點的至少一種限制性內(nèi)切核酸酶,對 第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以獲得酶切片段;和(iv)連接所述酶切片段以形成寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第 二標(biāo)簽、和插在所述標(biāo)簽之間的接頭,所述第一標(biāo)簽得自第一多聚核苷酸, 所述第二標(biāo)簽得自第二多聚核苷酸,所述標(biāo)簽含有各個多聚核苷酸的5'末端 和3'末端。本發(fā)明還提供了一種用于檢測和/或識別核酸-蛋白質(zhì)復(fù)合物中的至少兩種多聚核苷酸的方法,該方法包括(a) 提供核酸-蛋白質(zhì)復(fù)合物;(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所 述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物;(c) 對所述寡核苷酸進(jìn)行測序;和(d) 根據(jù)所述第一標(biāo)簽和第二標(biāo)簽的核苷酸序列對所述至少兩種多聚核 苷酸進(jìn)行定位,從而對所述至少兩種多聚核苷酸進(jìn)行檢測和/或識別。所述接頭序列在它的兩個末端(圖2和4)分別攜帶一個II型限制性內(nèi) 切核酸酶的識別位點,因而,在II型限制性內(nèi)切核酸酶消化后,可以分別從 兩個連接的DNA片段中分離出一個標(biāo)簽序列標(biāo)記(約20bp),以形成標(biāo)簽-接 頭-標(biāo)簽結(jié)構(gòu),其中, 一個標(biāo)簽表示染色體的一個DNA區(qū)域,另一個標(biāo)簽表 示位于同一染色體或不同的染色體上的遠(yuǎn)端區(qū)域的基因座。這種成對的末端 雙標(biāo)簽結(jié)構(gòu)稱作"CIA-PET",通過連接至更長的伸長DNA中可以有效地 對其進(jìn)行測序,或者通過測序?qū)ζ溥M(jìn)行直接分析??晒┻x擇地,接頭序列可以與兩個標(biāo)簽側(cè)翼連接,以生成接頭-標(biāo)簽-接 頭結(jié)構(gòu)。在這種方法中,所述核酸-蛋白質(zhì)復(fù)合物,例如天然DNA-蛋白質(zhì)-DNA (DPD)復(fù)合物,可以通過合適的固定劑如甲醛、乙醛、或甲醇而被交聯(lián)。然 后,可以通過超聲波、水力剪切(Hydroshearing)(Hydroshear, Gene Machines)、皮下注射器針頭的反復(fù)抽提、或通過限制性內(nèi)切核酸酶的酶解作用將交聯(lián)的DPD復(fù)合物片段化。源自不同染色體的DNA片段或相距較遠(yuǎn)的DNA片段 被DPD復(fù)合物中的DNA結(jié)合蛋白所束縛。與需要這些DNA片段是什么的 已有信息或推測以生成PCR引物的3C技術(shù)不同,束縛在DPD復(fù)合物中的 具有遠(yuǎn)端相關(guān)性的DNA片段的末端可以使用特定的接頭通過連接而結(jié)合。所述接頭(約20bp)含有兩種II型限制性內(nèi)切核酸酶的識別位點,這 些識別位點能夠連接被各個DPD復(fù)合物中的蛋白質(zhì)所束縛的不同DNA片段 的末端。然后,可以通過成對的末端雙標(biāo)簽(PET)策略(US20050255501)對兩 個相關(guān)的DNA片段的DNA連接位點進(jìn)行標(biāo)記。優(yōu)選lis型限制性內(nèi)切核酸 酶的識別位點。除了II型限制性內(nèi)切核酸酶以外,也可以使用任何其它適合 的限制性內(nèi)切核酸酶,包括III型或歸巢限制性內(nèi)切酶。因而,本發(fā)明一方面提供了一種用于識別相距較長距離的染色質(zhì)相互作 用情況和不同的染色體之間的染色質(zhì)相互作用情況的方法,所述染色質(zhì)相互 作用情況由特定的DNA結(jié)合蛋白如組蛋白調(diào)節(jié)。另一方面,本發(fā)明提供了 一種分離的寡核苷酸,該寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo) 簽,其中,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚 核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物。 所述標(biāo)簽與核酸-蛋白質(zhì)復(fù)合物中的染色質(zhì)區(qū)域相對應(yīng)。然后,可以對這些 標(biāo)簽進(jìn)行測序,以對染色質(zhì)相互作用情況進(jìn)行分析、識別、和/或檢測(圖3 和5)。所述分離的寡核苷酸還可以含有至少一個接頭。所述接頭可以插在所述 標(biāo)簽之間,或者所述接頭可以定位在至少一個標(biāo)簽的上游和/或下游。所述接 頭可以含有至少一個限制性內(nèi)切核酸酶識別位點;所述至少一種限制性內(nèi)切 核酸酶的識別位點可以不對稱,所述至少一個限制性內(nèi)切核酸酶識別位點可 以為lis型限制性內(nèi)切核酸酶或歸巢限制性內(nèi)切酶的識別位點??晒┻x擇地,所述至少一個第一標(biāo)簽可以含有源自第一多聚核苷酸的5' 末端和3'末端,所述至少一個第二標(biāo)簽可以含有源自第二多聚核苷酸的5' 末端和3'末端。所述分離的寡核苷酸還可以含有至少一個接頭。所述接頭可 以插在所述標(biāo)簽之間,或者所述接頭可以定位在至少一個標(biāo)簽的上游和/或下 游。所述接頭可以含有至少一個限制性內(nèi)切核酸酶識別位點;所述至少一個 限制性內(nèi)切核酸酶識別位點可以不對稱,所述至少一個限制性內(nèi)切核酸酶識 別位點可以為lis型限制性內(nèi)切核酸酶或者歸巢限制性內(nèi)切酶的識別位點。所述接頭可以含有第一限制性識別位點和第二限制性識別位點,所述第 一限制性識別位點可以被能夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一標(biāo)簽 的限制性內(nèi)切核酸酶所識別;所述第二限制性識別位點可以被能夠?qū)Φ诙?聚核苷酸進(jìn)行酶切以得到第二標(biāo)簽的限制性內(nèi)切核酸酶所識別(圖1和4)。所述接頭可以含有第一限制性識別位點和第二限制性識別位點,所述第 一限制性識別位點可以被能夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一多聚 核苷酸的3'末端的限制性內(nèi)切核酸酶所識別;所述第二限制性識別位點可以 被能夠?qū)Φ诙嗑酆塑账徇M(jìn)行酶切以得到第二多聚核苷酸的5'末端的的限 制性內(nèi)切核酸酶所識別。可供選擇地,所述接頭可以含有第一限制性識別位 點和第二限制性識別位點,所述第一限制性識別位點可以被能夠?qū)Φ谝欢嗑?核苷酸進(jìn)行酶切以得到第一多聚核苷酸的5'末端的限制性內(nèi)切核酸酶所識 別;所述第二限制性識別位點可以被能夠?qū)Φ诙嗑酆塑账徇M(jìn)行酶切以得到 第二多聚核苷酸的3'末端的的限制性內(nèi)切核酸酶所識別。所述第一多聚核苷酸還可以被能夠識別第三識別位點的第三限制性內(nèi) 切核酸酶所酶切,以得到第一多聚核苷酸的3'末端;所述第二多聚核苷酸被 能夠識別第四識別位點的第四限制性內(nèi)切核酸酶所酶切,以得到第二多聚核 苷酸的5'末端;所述至少一個第一標(biāo)簽是通過連接所述第一多聚核苷酸的5' 末端和3'末端而獲得的,所述至少一個第二標(biāo)簽是通過連接所述第二多聚核苷酸的5'末端和3'末端而獲得的(圖2和6)。所述第一和第三識別位點可 以具有相同的序列,所述第二和第四識別位點可以具有相同的序列。所述分離的寡核苷酸的核酸-蛋白質(zhì)復(fù)合物可以為染色質(zhì)結(jié)構(gòu)的一部 分。與感興趣的蛋白結(jié)合的核苷酸片段可以為含有能夠與感興趣的蛋白結(jié)合 的區(qū)域(例如,組蛋白結(jié)合位點)的任何核苷酸片段。所述多聚核苷酸可以 為DNA或RNA。可以將得到的CIA-PET序列定位到參考基因組序列中以確定染色質(zhì)相 互作用的連節(jié)點的位置,所述染色質(zhì)作用可以是遠(yuǎn)程的染色體內(nèi)(位于同一 染色體)或染色體間(位于不同的染色體)作用。該信息可以用于研究細(xì)胞 核內(nèi)染色體的3-維組織結(jié)構(gòu)、由轉(zhuǎn)錄因子調(diào)節(jié)的相距較遠(yuǎn)的和跨越不同染色 體的協(xié)同基因調(diào)控、和其它后續(xù)的相關(guān)的問題(圖3和5)。通過全部可用的基因組序列,能夠發(fā)展全基因組方法以對所有潛在的染 色質(zhì)相互作用進(jìn)行識別。全基因組嵌合列陣是一種用于基因組問詢的有效方 法,其中,嵌合了 20-60mer的寡核苷酸以覆蓋微列陣中的整個基因組,并 且將具有生物量的DNA探針與所述列陣雜交,可以讀出所有列陣單元的雜 交信號強度的圖譜,以用于遺傳成分的問詢。所述嵌合列陣被證明能夠用于 識別外顯子,并且當(dāng)與ChIP(ChIP-芯片)耦合時還可以用于定位轉(zhuǎn)錄因子的 結(jié)合位點。雖然基于列陣的方法由于具有較高的多元和平行屬性而有效,但 很難想象基于雜交的檢測能夠?qū)θ旧|(zhì)相互作用的兩個DNA片段的非線性 關(guān)系進(jìn)行檢測。根據(jù)一個實施方式的寡核苷酸的制備所述核酸-蛋白質(zhì)復(fù)合物可以通過染色質(zhì)免疫沉淀法(CMP)得到。 染色質(zhì)免疫沉淀法(CMP)ChIP被用于富集,因而能夠?qū)Y(jié)合有特定蛋白如組蛋白的遺傳區(qū)域進(jìn) 行識別,以及對核酸-蛋白質(zhì)復(fù)合物中的接合到核酸的其它蛋白質(zhì)進(jìn)行識別(綜述見Tavemer等,Genome Biol, 2004. 5(3): p. 210)。目的在于在它們相 互作用的位點使DNA與蛋白質(zhì)交聯(lián)。通過向培養(yǎng)基中的活細(xì)胞中添加適合 的固定劑如甲醛、乙醛、或甲醇,可以快速有效地實現(xiàn)交聯(lián)。然后制備這些固定的細(xì)胞的粗提物,并通過超聲波、水力剪切、皮下注 射器針頭的反復(fù)抽提、或通過限制性內(nèi)切核酸酶的酶解作用,將染色質(zhì)剪切 至平均大小通常約為lkb;然后與感興趣的DNA結(jié)合蛋白(例如,轉(zhuǎn)錄因 子或組蛋白)的抗體一起用于免疫沉淀反應(yīng)。然后將在每一免疫沉淀反應(yīng)中 富集的DNA片段解除連接并純化,以通過多種方法對它們進(jìn)行識別。使用 ChIP的優(yōu)點在于,通過快速的交聯(lián)染色質(zhì)和其它非組蛋白蛋白質(zhì),能夠在 體內(nèi)"凍結(jié)"基因調(diào)控的網(wǎng)絡(luò),因而,在理論上及時地提出了任意點調(diào)節(jié)系 統(tǒng)的"真實"圖譜,所述優(yōu)點,例如,避免了通過異源表達(dá)產(chǎn)生的潛在的假 象。最近,ChIP與全基因組結(jié)合(Lieb等,Nat Genet, 2001. 28(4): p. 327-34)、 與全染色體結(jié)合(Euskirchen等,Mol Cell Biol, 2004. 24(9): p. 3804-14)、和與 CpG島結(jié)合(Weinmann等,Genes Dev, 2002. 16(2): p. 235-44),或者在"ChlP-芯片"或"芯片的ChIP" ( "ChlP-on-chip")法中與微陣列結(jié)合,這樣能 夠在基因組水平對蛋白質(zhì)結(jié)合位點如轉(zhuǎn)錄因子結(jié)合位點(TFBS)進(jìn)行定位(綜 述見Buck和Lieb, 2004)。雖然這種方法的有效性在小基因組如酵母基因組 中得到了證明(Lieb等,Nat Genet, 2001. 28(4): p. 327-34),但是生產(chǎn)用于更復(fù) 雜的生物體的全基因組微陣列的費用和復(fù)雜度仍然是限制因素。CpG島微陣列含有較高CpG含量的人基因組片段,并且由于CpG島通 常對應(yīng)于增強子區(qū)域(Antequera and Bird, Proc Natl Acad Sci USA, 1993. 90(24): p. 11995-9),這樣的微陣列顯示出可能的妥協(xié)(compromise)。然而, 假定的蛋白質(zhì)結(jié)合位點的定位仍然需要通過檢查在列陣上觀察到的富含 CpG的探針的基因組DNA的上游和下游(通常l-2kb,超聲波降解的ChIP片段的大約尺寸)進(jìn)行間接地推斷??晒┻x擇地,先前已經(jīng)嘗試了對富含ChIP的DNA片段進(jìn)行克隆和測序, 但僅取得了有限的成功。其問題在于ChIP富集的標(biāo)靶從相對于全基因組的 較高背景中獲得的。即使100倍富集的特定標(biāo)靶仍僅僅表示ChIP文庫中的 一小部分克隆,使得標(biāo)準(zhǔn)的DNA測序成為一種昂貴的方案。因此,在這種 情況下,對ChIP克隆進(jìn)行測序并不是一種識別富含標(biāo)靶的好方法。還建議 將基因表達(dá)的連續(xù)分析(SAGE)和大規(guī)模平行表示測序技術(shù)(MPSS) (Brenner 等,Nat Biotechnol, 2000. 18(6): p. 630-4)用作檢測ChIP富集的定量工具,根 本原理是與非特異的背景相比,從富含ChIP的DNA片段生成的標(biāo)簽的數(shù) 量較多。然后,可以將這些標(biāo)簽定位到基因組序列中以對感興趣的遺傳區(qū)域進(jìn)行 識別(即,假定為l-2kb,表示超聲波降解的片段)。雖然20bp的SAGE和 MPSS標(biāo)簽在大多數(shù)的情況下應(yīng)該具有足夠的特異性以確定特定的基因組位 置;當(dāng)定位到基因組中時,仍然需要對所述標(biāo)簽的上游和下游大約l-2kb的 所有序列進(jìn)行檢測。這與CpG島微列陣法面對的問題相同。此外,使用這 些方法的全面覆蓋取決于可得到的限制性內(nèi)切核酸酶的識別位點(定位酶位 點(mapping-enzyme site))的前提;如果某一基因區(qū)域缺少識別位點,則 特定的標(biāo)簽將錯過相應(yīng)的ChIP片段,因而,該區(qū)域?qū)⒊蔀榛蚪M中的"盲 點"。從上述的問題可以清楚地看出,促進(jìn)基因組水平轉(zhuǎn)錄調(diào)控的分析所需要 的是能夠準(zhǔn)確快速地找到側(cè)翼于連接蛋白質(zhì)結(jié)合區(qū)域的核酸序列的方法,以 該方法作為全基因組陣列的可供選擇的方法。在這一點上,本發(fā)明提供的新 方法具有多種優(yōu)點(i)由本發(fā)明的一種方法得到的標(biāo)簽序列進(jìn)行定位具有更 高的特異性,因為已知每個標(biāo)簽均源自被5,和3'標(biāo)記所包圍的連續(xù)的DNA 片段;這種信息使感興趣的基因組區(qū)域的精確定位更容易,并不需要重復(fù)地對標(biāo)準(zhǔn)的SAGE或MPSS標(biāo)簽的上游和下游的l-2kb的任意一個序列進(jìn)行檢 測;(ii)本發(fā)明的方法不需要存在任何的定位酶位點;(iii)測序前標(biāo)簽的連接 意味著可以在一次序列讀取中識別多個標(biāo)簽;(iv)該區(qū)域是基因簇中所有定 位標(biāo)簽的共有區(qū)域(即,重疊的),因此,對正在談?wù)摰暮怂?蛋白質(zhì)復(fù)合 物中的DNA區(qū)域進(jìn)行確定。 標(biāo)簽和雙標(biāo)簽為了本發(fā)明的目的,所述標(biāo)簽為得自核酸分子的核苷酸序列或標(biāo)記,并 且所述標(biāo)簽表示從其中能夠得到該標(biāo)簽的多聚核苷酸。意欲被縮短或表示的 多聚核苷酸可以為RNA、 mRNA、基因組DNA、全長cDNA、或cDNA。在本發(fā)明中,存在本發(fā)明的寡核苷酸中的兩個標(biāo)簽還可以被稱為雙標(biāo) 簽。與標(biāo)簽一樣,雙標(biāo)簽比其源自的或表示的初始核酸分子短。優(yōu)選情況下, 所述雙標(biāo)簽必須比初始核酸分子短的多。作為"縮短"的結(jié)果,所述雙標(biāo)簽 可以基本含有初始核酸分子的5'末端區(qū)域(還表示為5'標(biāo)簽)和/或3'末端 區(qū)域(還表示為3,標(biāo)簽)。因此,初始核酸分子的最初位于5,標(biāo)簽和3,標(biāo)簽 之間或內(nèi)部部分并不包括在雙標(biāo)簽中。本發(fā)明的雙標(biāo)簽保留有初始核酸分子 的多數(shù)信息特征,即,所述核酸分子的初始和終止標(biāo)記。形成有5'標(biāo)簽和3'標(biāo)簽的雙標(biāo)簽具有相同或不同的大小。優(yōu)選情況下, 它們具有相同數(shù)量的核苷酸。所述雙標(biāo)簽可以為各種大小,但需要有意義地 和有益地超過其源自的親本序列的大小。優(yōu)選的標(biāo)簽和雙標(biāo)簽的大小取決于 基因組的復(fù)雜程度。相對于細(xì)菌基因組,大小約為8bp-16bp的標(biāo)簽是足夠 的,但相對于復(fù)雜基因組如人基因組,可以考慮16-20bp (也就是,32-40bp 雙標(biāo)簽)的標(biāo)簽。 一般而言,所述雙標(biāo)簽的大小為約12-60bp。為了本發(fā)明的目的,術(shù)語5'-末端、5,-端、和5,-標(biāo)簽是相互等同的,并 可以互換使用。同樣,術(shù)語3,-末端、3,-端、和3,-標(biāo)簽是相互等同的,并可 以互換使用。在意欲被縮短或表示的初始核酸分子或核酸分子中的部分中,315'-端和3'-端分別表示臨近所述分子的末端的區(qū)域或部分,和與所述分子中 部相距最遠(yuǎn)的區(qū)域或部分。根據(jù)本發(fā)明的一個方面,雙標(biāo)簽中所含的5'-標(biāo)簽和3'-標(biāo)簽為被限制性 內(nèi)切核酸酶分別在臨近意欲被縮短或表示的核酸分子或其部分的5'-端和3'-端位置酶切的分子區(qū)域。因此,雙標(biāo)簽的大小可以取決于限制性內(nèi)切核酸酶 或所使用的酶。相應(yīng)地,本發(fā)明提供了一種分離的寡核苷酸,該寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物。所述寡核苷酸可以進(jìn)一步含有插在所述標(biāo)簽之間 的至少一個接頭。所述寡核苷酸還可以進(jìn)一步含有插在標(biāo)簽側(cè)翼的至少一個接頭(即,至少一個接頭可以定位在至少一個標(biāo)簽的上游和/或下游)。 接頭特別地,各個接頭可以含有至少一個第一限制性內(nèi)切核酸酶酶切位點; 和至少一個第二臨近的限制性內(nèi)切核酸酶酶切位點。因此,每個接頭中存在 的限制性內(nèi)切核酸酶的酶切位點的數(shù)量可以為一個或多個,優(yōu)選兩個。所述 限制性酶切位點可以為不對稱的限制性酶切位點。不對稱的限制性酶切位點 的例子為歸巢限制性內(nèi)切酶不對稱識別位點、和一部分II型(或II類)識 別位點。優(yōu)選能在它的識別位點的一側(cè)切割的II型限制性內(nèi)切核酸酶。然而,任何本領(lǐng)域已知的位點均可以使用。能夠識別核酸分子中至少一 個限制性酶切位點的限制性內(nèi)切核酸酶以及可以使用哪些限制性內(nèi)切核酸 酶對本領(lǐng)域技術(shù)人員來說是顯而易見的。(例如,見,Current Protocols in Molecular Biology, Vol. 2, 1995, Ed. Ausubel, et al., Greene Publish. Assoc. & Wiley Interscience, Unit 3.1.15; New England Biolabs Catalog, 2005)。 一些可能的限制性酶切位點和相應(yīng)的限制性內(nèi)切核酸酶將在下文中進(jìn)行描述。作為一個例子,為了制備根據(jù)本發(fā)明的雙標(biāo)簽,可以使用能夠識別限制 性酶切位點的限制性內(nèi)切核酸酶。特別是IIS型酶,例如類膜金屬內(nèi)肽酶。 當(dāng)使用類膜金屬內(nèi)肽酶時,該酶識別兩個銜接頭中每一個銜接頭的內(nèi)部序列,所述銜接頭與意欲被縮短的核酸分子側(cè)翼連接;而在內(nèi)部切割核酸分子 以形成含有17-21個核苷酸的標(biāo)簽(見圖1和4中表示的類膜金屬內(nèi)肽酶酶 切)。兩個這樣的標(biāo)簽可以通過鈍化和連接的額外處理以形成含有34-38個 核苷酸的雙標(biāo)簽。因此,通過剪接或連接相同的核酸分子的5'末端和3'末端, 可以得到所述雙標(biāo)簽。作為一個例子,可以引入不對稱的位點。能夠用于本發(fā)明的目的的不對 稱位點序列為i)兩個歸巢限制性內(nèi)切酶不對稱識別位點序列;或ii)能夠被 II型限制性內(nèi)切核酸酶識別的限制性內(nèi)切核酸酶不對稱切割位點序列。New England Biolabs公司銷售并描述了歸巢限制性內(nèi)切酶,并且在New England Biolabs目錄中提供了不對稱位點序列的描述。這些歸巢限制性內(nèi)切 酶識別位點序列為18-39bp。然而,在本發(fā)明中,識別位點序列并不限制于 這些序列也不限制于這些大小。優(yōu)選情況下,能夠切割不對稱位點序列的限 制性歸巢限制性內(nèi)切酶選自由I-CeuI、 PI-SceI、 PI-PspI、和I-Scel所組成的 組中。然而,上述提及的目錄并不是窮舉的。本領(lǐng)域公知的其它歸巢限制性 內(nèi)切酶和在下文中公開的歸巢限制性內(nèi)切酶也包括在本發(fā)明的范圍之內(nèi)。II型限制性內(nèi)切核酸酶的例子包括Aarl、 AceIII、 Alol、 Bael、 Bbr71、 Bbvl、 BbvII、 Bccl、 Bce831、 BceAI、 Bcefl、 Bcgl、 BciVI、 Bfil、 Binl、 BpII、 BsaXI、 BscAI、 BseMII、 BseRI、 Bsgl、 Bsml、 BsmAI、 BsmFI、 Bsp241、 BspCNI、 BspMI、 Bsrl、 BsrDI、 BstF51、 BtgZI、 Btsl、 Cjel、 CjePI、 Ecil、 Eco311、 Eco571、 Eco57MI、 Esp31、 FaII、 Faul、 Fokl、 Gsul、 HaeIV、 Hgal、 Hin41、 Hphl、 HpyAV、 Ksp6321、 MboII、 Mlyl、 Mmel、 MnII、 Plel、 Ppil、 Psrl、 RleAI、 Sapl、 SfaNI、 SspD51、 Sthl321、 Stsl、 TaqII、 TspDTI、 TspGWI、TspRI、和TthlllII (Rebase Enzymes 網(wǎng)站的列表http:〃rebase.neb.com/ gi-bin/outsidelist;還可見Szybalski, W., 1985, Gene, 40:169)。然而,上述列
表并不是窮舉的。本領(lǐng)域公知的其它II型限制性內(nèi)切核酸酶和在下文中公幵 的II型限制性內(nèi)切核酸酶也包括在本發(fā)明的范圍之內(nèi)。
限制性酶切位點和多個II型限制性內(nèi)切核酸酶的切割位點的例子為(括 號內(nèi)為識別位點和切割位點)BbvI(GCAGC 8/12)、 HgaI(GACGC 5/10)、 BsmFI(GGGAC 10/14)、 SfaNI(GCATC 5/9)、和Bsp I (ACCTGC 4/8)。
還可以使用人工的限制性內(nèi)切核酸酶。這些內(nèi)切核酸酶可以通過蛋白質(zhì) 工程技術(shù)制備得到。例如,通過插入物設(shè)計了內(nèi)切核酸酶FokI,從而使其在 遠(yuǎn)離位于DNA底物的兩條鏈上的識別位點處切割一個核苷酸。見Li和 Chandmsegaran, Proc. Nat. Acad. Sciences USA 90:2764-8, 1993。這樣的技術(shù) 可以用于制備具有期望的識別序列和期望的從識別位點至切割位點間的距 離的限制性內(nèi)切核酸酶。
在本發(fā)明的條件下,本發(fā)明的分離的寡核苷酸可以與其它分離的寡核苷 酸結(jié)合或連接,以形成寡核苷酸連環(huán)體。為了測序的目的或克隆至適合的質(zhì) 粒或載體中的目的,可以將任何數(shù)量的寡核苷酸結(jié)合在一起。
相應(yīng)地,另一方面,本發(fā)明提供了一種寡核苷酸連環(huán)體,該寡核苷酸連 環(huán)體含有至少兩個分離的寡核苷酸,每一個分離的寡核苷酸含有至少一個第 一標(biāo)簽和至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽得自第一多聚核苷酸,所 述第二標(biāo)簽得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得 自核酸-蛋白質(zhì)復(fù)合物。
寡核苷酸連環(huán)體中的分離的寡核苷酸可以進(jìn)一步含有至少一個接頭。所 述接頭可以插在所述標(biāo)簽之間??晒┻x擇地,接頭可以與標(biāo)簽側(cè)翼連接。所 述接頭可以含有至少一種限制性內(nèi)切核酸酶的識別位點;該至少一種限制性 內(nèi)切核酸酶的識別位點可以為lis型限制性內(nèi)切酶的識別位點。在一個實施方式中,寡核苷酸連環(huán)體的第一標(biāo)簽可以含有得自第一多聚核苷酸的3'末端,所述第二標(biāo)簽還含有得自第二多聚核苷酸的5'末端。連環(huán) 體寡核苷酸的每一個分離的寡核苷酸還可以含有至少一個插在所述標(biāo)簽之 間的接頭。在另一個實施方式中,寡核苷酸連環(huán)體的第一標(biāo)簽可以含有得自 第一多聚核苷酸的5'末端,所述第二標(biāo)簽還含有得自第二多聚核苷酸的3' 末端。在另一個實施方式中,寡核苷酸連環(huán)體的第一標(biāo)簽可以含有得自第一多 聚核苷酸的5'末端和3'末端,所述第二標(biāo)簽還含有得自第二多聚核苷酸的5' 末端和3'末端。寡核苷酸連環(huán)體的分離的寡核苷酸還可以含有至少一個插在 所述標(biāo)簽之間的接頭。這些實施方式中每一個實施方式的接頭均可以含有至少一種限制性內(nèi) 切核酸酶的識別位點;該至少一種限制性內(nèi)切核酸酶的識別位點可以為lis 型限制性內(nèi)切核酸酶的識別位點。寡核苷酸的連環(huán)體可以插入至載體或細(xì)胞中,所述細(xì)胞可以為細(xì)菌細(xì)胞。寡核苷酸的連環(huán)體可以源自染色質(zhì)結(jié)構(gòu)。所述多聚核苷酸定位在同一個 染色體上,或者所述多聚核苷酸定位在不同的染色體上。這些是優(yōu)選的連環(huán)體時,顯然能夠被連結(jié)的本發(fā)明的寡核苷酸的數(shù)量取 決于寡核苷酸的長度,并且不需要過多的試驗而由本領(lǐng)域技術(shù)人員容易地決 定。連環(huán)體形成后,可以將多個標(biāo)簽克隆至用于序列分析的載體,或者可以 通過本領(lǐng)域技術(shù)人員所公知的技術(shù)不經(jīng)過克隆而直接對雙標(biāo)簽或連環(huán)體進(jìn) 行測序。因此,雙標(biāo)簽的連接能夠允許在單個載體或克隆中以系列的方式通 過對多個雙標(biāo)簽進(jìn)行序列分析而對核酸分子如全長cDNA分子進(jìn)行有效地 分析。在提及術(shù)語載體或重組載體時,還可以使用通過雙標(biāo)簽基因序列的插入或合并而進(jìn)行操作的質(zhì)粒、病毒、或本領(lǐng)域公知的其它載體。這種載體含有 能夠促進(jìn)有效轉(zhuǎn)錄的啟動子序列。所述載體代表性地含有復(fù)制起始區(qū)、啟動 子、和特定的基因,該基因提供了選擇轉(zhuǎn)化的細(xì)胞的表型。例如,適用于本
發(fā)明的載體包括:pBlueScript (Stratagene, La JoIIa, CA); pBC, pZErO隱l (Invitrogen, Carlsbad, CA);禾卩pGEM3z (Promega, Madison, WI)或這些載體的
修飾載體;以及本領(lǐng)域技術(shù)人員公知的其它類似的載體。為了實現(xiàn)特定的目 的,對pGEM3z載體進(jìn)行修飾,并將這種修飾的載體稱為pGIS8(圖7和11)。 在美國專利no.4,766,072,中也公開了pGEM載體,該專利引入本文作為參 考。
為了生產(chǎn)能夠衍生出標(biāo)簽或雙標(biāo)簽的親代多聚核苷酸或核酸分子,可以 使用合適的載體作為全長文庫。相應(yīng)地,本發(fā)明范圍內(nèi)的合適的載體是那些 載體的主鏈不包括相同的限制性酶切位點的載體,所述限制性酶切位點包括 在在所述多聚核苷酸插入后與所述多聚核苷酸或所述雙標(biāo)簽側(cè)翼連接的銜 接頭中。優(yōu)選地,本發(fā)明提供了一種載體,其中,該載體骨架(除了在插入 多聚核苷酸時被除去的位于含有多克隆位點的填充片斷(stuffer)區(qū)域外)不 含有第一限制性酶切位點和包括在所述銜接頭中的第二限制行酶切位點或 其它限制性酶切位點。特別地,所述載體不含有至少II型限制性酶切位點(例 如lis型限制性酶切位點)和至少包括在所述銜接頭中的第二限制性酶切位 點或其它限制性酶切位點。更優(yōu)選地,所述載體骨架(除了在插入多聚核苷 酸時被除去的位于含有多克隆位點的填充片斷區(qū)域外)不含有Mmel和 BamHI的酶切位點。
在填充片段外部的任何區(qū)域不含有MmeI的酶切位點的載體的例子為圖 7禾口 11所示的載體pGIS8。在pGIS8中,Mmel的識別位點通過誘變而被除 去。
相應(yīng)地,本發(fā)明提供了一個寡核苷酸文庫,該寡核苷酸文庫包括至少一種寡核苷酸,該寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,所述 第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所述第 一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物。本發(fā)明還提供了 一個根據(jù)本發(fā)明的寡核苷酸連環(huán)體文庫。寡核苷酸文庫中的至少一種寡核苷酸可以含有插在所述標(biāo)簽之間的至 少一個接頭??晒┻x擇地,接頭可以替換性地與標(biāo)簽側(cè)翼連接。所述第一標(biāo)簽可以含有得自第一多聚核苷酸的5'末端和3'末端,第二標(biāo)簽還含有得自第 二多聚核苷酸的5'末端和3'末端。所述多聚核苷酸核酸-蛋白質(zhì)復(fù)合物可以為染色質(zhì)結(jié)構(gòu)的一部分。所述 多聚核苷酸可以定位在同一個染色體上,或者所述多核苷酸可以被定位在不 同的染色體上。根據(jù)一個方面,所述寡核苷酸被擴增。例如,通過PCR或其它已知的 擴增方法??梢愿鶕?jù)雙標(biāo)簽的序列的信息來制備PCR引物和探針序列。因 此,可以使用與載體內(nèi)部特定區(qū)域相應(yīng)的適合的PCR引物。這些區(qū)域與含 有雙標(biāo)簽和銜接頭的寡核苷酸側(cè)翼連接??梢酝ㄟ^連接(自環(huán)化)反應(yīng)直接 進(jìn)行PCR以得到短PCR產(chǎn)物(例如200bp)。然后,可以使用能夠識別至少第二限制性酶切位點(位于銜接頭內(nèi))的 酶,對這些含有所需要的雙標(biāo)簽的PCR產(chǎn)物進(jìn)行酶切,以得到所需要的短 粘性雙標(biāo)簽??梢允褂米鳛槟軌蜃R別第二限制性酶切位點或其它限制性酶切 位點的限制性內(nèi)切核酸酶,例如,BamHI,并生成50bp的粘性雙標(biāo)簽。這 種擴增步驟的優(yōu)點在于雙標(biāo)簽的生成不需要制備雙標(biāo)簽文庫的擴增物,這可 以通過不轉(zhuǎn)化帶有自環(huán)化的標(biāo)記的質(zhì)粒而避免。隨后可以從載體中切出擴增 的寡核苷酸(例如,用BamHI消化),并將該擴增的寡核苷酸連接在用于 后續(xù)克隆和序列分析的長的伸長的DNA或RNA中(圖1和2)。在一個特別的方面,本發(fā)明公開了cDNA文庫,其中,所述寡核苷酸含有至少一個雙標(biāo)簽,并且,其中所述雙標(biāo)簽含有約34-38個核苷酸,并且所 述雙標(biāo)簽是通過對從全長cDNA或它的片段的5'末端和3'末端核苷酸進(jìn)行剪 接而得到的。
本發(fā)明的雙標(biāo)簽文庫是包括初始核酸分子的代表性文庫。例如,當(dāng)包括 核酸分子的文庫是全長多聚核苷酸文庫時,所述雙標(biāo)簽文庫是全長雙標(biāo)簽代 表性文庫。每一個雙標(biāo)簽克隆具有表征特定的全長克隆的足夠信息。更重要 的是,本發(fā)明的雙標(biāo)簽含有源自核酸-蛋白質(zhì)復(fù)合物的初始全長多聚核苷酸 的5,末端和3'末端。因此,所述雙標(biāo)簽是所述多聚核苷酸代表性的結(jié)構(gòu)。
因此,足以對雙標(biāo)簽文庫的雙標(biāo)簽克隆進(jìn)行測序和分析。在發(fā)現(xiàn)感興趣 的雙標(biāo)簽的情況下,例如,可以通過PCR從全長多聚核苷酸文庫中選擇并 制備相應(yīng)的全長多聚核苷酸,或者通過逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng)(RT-PCR)直接 從目標(biāo)RNA樣本中選擇并制備相應(yīng)的全長多聚核苷酸。
可以通過"454"測序(焦磷酸測序技術(shù))法(Margulies等,2005)對本發(fā) 明的寡核苷酸進(jìn)行測序,并將本發(fā)明的寡核苷酸連接至用于克隆以制備 CIA-PET文庫的更長的伸長的DNA鏈中,隨后使用桑格毛細(xì)管法(Sanger capillary method)進(jìn)行領(lǐng)!l序。
因此,本發(fā)明提供了一種用于制備本發(fā)明寡核苷酸的方法、 一種從核酸 蛋白質(zhì)復(fù)合物中檢測和/或識別至少兩種多聚核苷酸的方法、和一種制備含有 本發(fā)明的寡核苷酸和連環(huán)體的寡核苷酸的載體的方法。
因此,另一方面,本發(fā)明提供了一種制備至少一種分離的寡核苷酸的方 法,該方法包括
(a) 提供核酸-蛋白質(zhì)復(fù)合物;
(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽和第二標(biāo)簽得自核酸-蛋白質(zhì)復(fù)合物;和
(c) 分離所述寡核苷酸。特別地,本發(fā)明提供了一種制備至少一種分離的寡核苷酸的方法,該方 法包括
(a) 提供核酸-蛋白質(zhì)復(fù)合物;
(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所 述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物;和
(c) 分離所述寡核苷酸。
在一個實施方式中,本發(fā)明此方面的步驟(b)包括
(i) 插入至少一個接頭,該接頭含有至少一種限制性內(nèi)切核酸酶的識別
位點,和
(ii) 使用能夠識別位于所述接頭中的至少一個識別位點的至少一種限制 性內(nèi)切核酸酶,對第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以形成寡核 苷酸,該寡核苷酸含有第一標(biāo)簽、第二標(biāo)簽和位于所述標(biāo)簽之間的接頭,所 述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸。
在另一個實施方式中,本發(fā)明此方面的步驟(b)包括
(i) 在所述復(fù)合物的第一多聚核苷酸和第二多聚核苷酸之間插入至少一 個接頭,該接頭含有至少一種限制性內(nèi)切核酸酶的識別位點;
(ii) 在第一多聚核苷酸的5,末端和第二多聚核苷酸的3'末端分別加入至 少一種限制性內(nèi)切核酸酶的識別位點;
(iii) 使用能夠識別至少一個識別位點的至少一種限制性內(nèi)切核酸酶,對 第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以獲得酶切片段;和
(iv) 連接所述酶切片段以形成寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第 二標(biāo)簽、和插在所述標(biāo)簽之間的接頭,所述第一標(biāo)簽得自第一多聚核苷酸, 所述第二標(biāo)簽得自第二多聚核苷酸,所述標(biāo)簽含有各個多聚核苷酸的5'末端 和3'末端,步驟(ii)中的至少一個限制性內(nèi)切核酸酶的識別位點為載體的一部分。所述核酸-蛋白質(zhì)復(fù)合物可以通過染色質(zhì)免疫沉淀方法得到。 另一方面,本發(fā)明提供了一種用于檢測和/或識別核酸-蛋白質(zhì)復(fù)合物中 的至少兩種多聚核苷酸的方法,該方法包括(a) 提供核酸-蛋白質(zhì)復(fù)合物;(b) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物;(c) 對所述寡核苷酸進(jìn)行測序;和(d) 根據(jù)所述第一標(biāo)簽和第二標(biāo)簽的核苷酸序列,對所述至少兩種多聚 核苷酸進(jìn)行定位,從而對所述至少兩種多聚核苷酸進(jìn)行檢測和/或識別。在一個實施方式中,本發(fā)明此方面的步驟(b)包括(i) 插入至少一個接頭,該接頭含有至少一種限制性內(nèi)切核酸酶的識別 位點,禾口(ii) 使用能夠識別位于所述接頭中的至少一個識別位點的至少一種限制 性內(nèi)切核酸酶,對第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以形成寡核 苷酸,該寡核苷酸含有第一標(biāo)簽、第二標(biāo)簽和位于所述標(biāo)簽之間的接頭,所 述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸。在另一個實施方式中,本發(fā)明此方面的步驟(b)包括(i) 在所述復(fù)合物的第一多聚核苷酸和第二多聚核苷酸之間插入至少一 個接頭,該接頭含有至少一種限制性內(nèi)切核酸酶的識別位點;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分別加入至 少一種限制性內(nèi)切核酸酶的識別位點;(iii) 使用能夠識別至少一個識別位點的至少一種限制性內(nèi)切核酸酶,對 第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以獲得酶切片段;和(iv)連接所述酶切片段以形成寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第 二標(biāo)簽、和插在所述標(biāo)簽之間的接頭,所述第一標(biāo)簽得自第一多聚核苷酸, 所述第二標(biāo)簽得自第二多聚核苷酸,所述標(biāo)簽含有各個多聚核苷酸的5'末端 和3'末端,步驟(ii)中的至少一個限制性內(nèi)切核酸酶的識別位點為銜接頭或 載體的一部分。
在本發(fā)明中,所述核酸-蛋白質(zhì)復(fù)合物可以通過染色質(zhì)免疫沉淀方法獲 得。所述核酸-蛋白質(zhì)復(fù)合物可以通過將光活化成分加入到感興趣的DNA和 /或蛋白質(zhì)中而得到,而DNA/蛋白質(zhì)復(fù)合物通過抗體介導(dǎo)的沉淀作用或親和 力介導(dǎo)的技術(shù)進(jìn)行分離。這種基于親和力的技術(shù)的例子包括鏈霉親和素/ 生物素、谷胱甘肽-S-轉(zhuǎn)移酶/谷胱甘肽基質(zhì)、麥芽糖結(jié)合蛋白/直鏈淀粉基質(zhì) 的相互作用。
在步驟(c)中進(jìn)行測序之前,可以對步驟(b)得到的寡核苷酸進(jìn)行擴增; 所述擴增可以通過聚合酶鏈?zhǔn)椒磻?yīng)進(jìn)行。在擴增之后但在步驟(c)中的測序之 前,可以對擴增的寡核苷酸進(jìn)行至少一個純化步驟。所述至少一個純化步驟 可以為凝膠電泳。
本發(fā)明的寡核苷酸可以與通過測序前的步驟(a)-(b)獲得至少一種另外的 寡核苷酸連接以形成寡核苷酸的連環(huán)體。
通過桑格法或多重測序方法進(jìn)行測序。所述多重測序方法可以為焦磷酸 測序方法??梢允褂萌魏芜m合的測序方法,如由Bonetta(2006)描述的方法。 與感興趣的蛋白結(jié)合的核酸片段可以為含有能夠與感興趣的蛋白結(jié)合的區(qū) 域(例如,組蛋白結(jié)合位點)的任何核酸片段。所述多聚核苷酸可以為DNA 或RNA。
所述多聚核苷酸可以定位在同一條染色體上,或者所述多核苷酸可以定 位在不同的染色體上。
所述檢測和/或識別可以用于所述多聚核苷酸的轉(zhuǎn)移或易位。所述寡核苷酸可以被轉(zhuǎn)染至細(xì)胞中。所述轉(zhuǎn)染的方法可以為電穿孔法。 所述細(xì)胞可以為細(xì)菌細(xì)胞。
下面將對本發(fā)明關(guān)于CIA-PET和CIA-diPET技術(shù)的這些方面的實施方 式進(jìn)行詳細(xì)地描述。
另一方面,本發(fā)明提供了一種載體,該載體包括本發(fā)明的寡核苷酸、寡 核苷酸連環(huán)體、或寡核苷酸的文庫。
CIA-PET
在CIA-PET方法中(圖1和4),通過連接,被位于DPD復(fù)合物中的 蛋白質(zhì)束縛的DNA片段可以通過接頭序列結(jié)合在一起。所述接頭序列含有 兩個MmeI位點。解交聯(lián)后,所述連接的DNA將被Mmel消化,以釋放出 成對的末端雙標(biāo)簽(CIA-PET)。每一個CIA-PETs均含有兩個側(cè)翼連接的標(biāo)簽 (每個約20bp)的接頭(圖1中標(biāo)記的步驟2)。因此,包含在CIA-PET 中的兩個標(biāo)簽表示兩個雙標(biāo)簽遺傳區(qū)域,該兩個雙標(biāo)遺傳簽區(qū)域在線性基因 組序列中彼此遠(yuǎn)離,但它們之間相互作用并受特定的蛋白質(zhì)如組蛋白蛋白質(zhì) 調(diào)節(jié)。
將CIA-PETs用凝膠純化后,將序列特異性銜接頭加在CIA-PETs的兩 側(cè),然后通過PCR進(jìn)行擴增(圖1中的步驟3)??梢酝ㄟ^多種測序方法如 "454"焦測序法和其它適合的測序方法直接對擴增的CIA-PETs進(jìn)行測序, 或者將擴增的CIA-PETs連接在更長的DNA延伸物上,用于克隆以得到 CIA-PET文庫,隨后通過桑格毛細(xì)管法進(jìn)行測序。將CIA-PET序列定位到 參照基因組序列中。染色質(zhì)相互作用位點可以基于在特定的基因座中頻繁出 現(xiàn)的CIA-PET來進(jìn)行識別,染色質(zhì)相互作用位點將與隨機單獨分布的背景 噪音分開(圖3)。
CIA-diPET
在CIA-diPET方法中(圖2和6),提取表示兩個相關(guān)的DNA片段的每一個DNA片段的成對的末端雙標(biāo)簽序列并只對每個序列中一個標(biāo)簽的序 列進(jìn)行測序和比較。通過這種方式,獲得的CIA-diPET含有比CIA-PET方 法中的標(biāo)簽更長的標(biāo)簽序列。因而,本領(lǐng)域技術(shù)人員能夠理解的是,與現(xiàn)有 技術(shù)中的其它方法相比,本發(fā)明的CIA檢測方法在定位染色質(zhì)間的相互作用 中更加具有特異性。DPD復(fù)合物中的DNA片段通過接頭序列被連接在一起, 所述接頭序列含有MmeI位點和Gsul位點。在解交聯(lián)后,通過超聲波降解 法可以隨機地破碎所述連接的DNA。然后,按大小分離DNA,并將DNA克隆至pGIS8載體中(圖2中的步 驟2) , pGIS8載體含有位于其克隆位點緊鄰的Mmel位點和Gsu位點(圖 7)。在細(xì)菌細(xì)胞中轉(zhuǎn)化和繁殖后,通過連續(xù)的消化、自連接、和轉(zhuǎn)化對文 庫克隆進(jìn)行處理,以得到單一的diPET文庫。單一的diPET文庫中的質(zhì)粒 DNA被BamHI消化以釋放出diPET結(jié)構(gòu)(圖2中的步驟4),所述diPET 結(jié)構(gòu)能夠通過MS-PET測序法直接進(jìn)行測序,或者進(jìn)一步進(jìn)行連接以進(jìn)行克 隆和測序??梢詫IA-diPET序列定位到參考基因組序列中。真實的染色質(zhì) 相互作用位點可以基于在特定的基因座中頻繁出現(xiàn)的CIA-diPET來迸行識 別,真實的染色質(zhì)相互作用位點將與隨機單獨分布的背景噪音分開(圖5)?,F(xiàn)在異對本發(fā)明進(jìn)行了一般性的描述,通過參考以下實施例能夠更容易 理解本發(fā)明的內(nèi)容,所述實施例僅作為說明的目的,而不是為了限制本發(fā)明 的范圍。在操作過程中,為了控制質(zhì)量并確保接頭或銜接頭的正確插入,通過凝 膠電泳去除不需要的片段(圖8-10)。實施例 CIA方法使用小鼠胚胎干細(xì)胞(ES)細(xì)胞中的Nanog轉(zhuǎn)錄因子、用于Nanog的ChIP-PET數(shù)據(jù)、和ES細(xì)胞的其它關(guān)鍵轉(zhuǎn)錄因子如Oct4和Sox2作為生物學(xué) 體系,來實施本發(fā)明。ChIP-PET數(shù)據(jù)提供了這些轉(zhuǎn)錄因子結(jié)合位置的線性 圖譜,并使用ChIP-PET數(shù)據(jù)作驗證染色質(zhì)相互作用數(shù)據(jù)的參考。通過 CIA-PET和CIA-diPET兩種方法來檢測染色質(zhì)之間的相互作用。
實施例中使用的序列如下文和序列表中所示。當(dāng)顯示了兩條鏈時,上面 的一條鏈為有義鏈,下面的一條鏈為反義鏈。所有示出的序列均為5'-3'方向。 當(dāng)核苷酸表示為N或n(或者圖中的X或數(shù)字)時,意指在該位點上可以為 任意一種核苷酸(A、 C、 G、或T)。
M&M接頭
5, GTCGGAGGCCAAGGCGGCCGTACGTCCAACT 3, (31 nt) (SEQ ID NO:l)
5' GTTGGACGTACGGCCGCCTTGGCCTCCGAC 3' (31 nt) (SEQ ID NO:2)
5'末端是磷酸化的
M&G接頭
5, GTCGGAGGCCAAGGCGGCCGTACGCTGGAGT 3, (31 nt) (SEQ ID NO:3)
5, CTCCAGCGTACGGCCGCCTTGGCCTCCGACT 3, (31 nt) (SEQ ID NO:4)
5'末端是磷酸化的
Pl連接銜接頭(PMR011 )
5, GGATCCCTTAATCGCCTTGCAGCACATC 3, (28 nt) (SEQ ID NO:5) 5, GATGTGCTGCAAGGCGATTAAGGGATCC麗3, (30 nt) (SEQ ID NO:6)
上面接頭的5'末端是磷酸化的 下面接頭的5'末端不是被磷酸化的P2連接銜接頭(PMR012)5, GGATCCCCTGTGTGAAATTGTTATCCGCT 3, (29 nt)(SEQ ID N0:7)5, AGCGGATAACAATTTCACACAGGGGATCC麗3, (31 nt) (SEQ ID NO:8)上面銜接頭的5'末端是磷酸化的 下面銜接頭的5'末端不是磷酸化的 D1 diPETing銜接頭(PMR 011)5, GGATCCCTTAATCGCCTTGCAGCACATC 3, (28 nt) (SEQ ID NO:9) 5, GATGTGCTGCAAGGCGATTAAGGGATCC麗3, (30 nt) (SEQ ID NO: 10)上面銜接頭的5'末端是磷酸化的 下面銜接頭的5'末端不是磷酸化的 D2 diPETing銜接頭(PMR 012)5, GGATCCAATGCTCCTCCCTGTGTGAAATTGTTATCCGCT 3, (39nt) (SEQ ID NO: 11 )5, AGCGGATAACAATTTCACACAGGGAGGAGCATTGGATCC麗3,(41 nt)(SEQ ID NO: 12)上面銜接頭的5'末端是磷酸化的 下面銜接頭的5'末端不是磷酸化的 PMR011引物5, GATGTGCTGCAAGGCGATTAAG 3, (22 nt) (SEQ ID NO: 13)5'末端是磷酸化的 PMR012引物5, AGCGGATAACAATTTCACACAGG 3, (23 nt) (SEQ ID NO: 14)5'末端是磷酸化的RecA選擇性寡聚核苷酸5, AGTCGGAGGCCAAGGCGGCCGTACGCTGGAGT 3, (SEQ ID NO: 15)(生物素化的) PGIS8載體該載體源自pGEM載體(Promega),含有用于以下限制性內(nèi)切核酸酶的 多個獨特的克隆位點,位點的規(guī)律為BamHI —Mmel;切割區(qū)域;Gsul —BamHI—BseRI。使用以下寡核苷酸5, AATTGGATCCGACTCGAGGATGAATTCTCCAGGATCCCTCCTC 3, (43nt) (SEQIDNO:16)5 , TCGAGAGGAGGGATCCTGGAGAATTCATCCTCGAGTCGGATCC 31 (43nt) (SEQIDNO:17)5'末端不是磷酸化的載體的其余部分不含有任何的BseRI、 BamHI、 Mmel或Gsul的位點。 pGIS8質(zhì)粒是可以使用的載體的一個實例(圖7)。有義鏈的序列為SEQ ID NO: 18,反義鏈的序列為SEQIDNO:19。含有限制性內(nèi)切核酸酶的識別 位點(表示為SEQ ID NO: 16和17)的多克隆位點被插入到所述載體中。顯 示了多個限制內(nèi)切酶的識別位點的pGIS8的序列表如圖11所示。本領(lǐng)域技 術(shù)人員可以制備并使用能夠滿足要求的其它載體。 M&M銜接頭PET5 ,NNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGT CCAACTN NNNNNNNNNNNNNNNNN 3 , (69 nt) (SEQ ID NO:20)5 ,NNNNNNNNNNNNNNNNNNAGTTGGACGTACGGCCGCCTTGGC CTCCGACT NNNNNNNNNNNNNNNNNNN 3, (69 nt) (SEQ ID NO:21)具有銜接頭序列的M&M銜接頭PET5 , GATGTGCTGC AAGGCGATTAAGGGATCCNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGTCCAACTNNNNNNNNN NNNNNNNNNGGATCCCCTGTGTGAAATTGTTATCCGCT 3,(128 nt) (SEQ ID NO:22)5'AGCGGATAACAATTTCACACAGGGGATCCNNNNNNNNNNNNN NNNNNAGTTGGACGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNN NNNNNNNNNGGATCCCTTA ATCGCCTTGCAGCACATC 3, (128 nt) (SEQ ID NO:23)M&M最終PET(切除銜接頭序列后)5 ,GATCCNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGG CCGTACG TCCAACTNNNKNNNNNNNNNNNNNNNNG 3, (77 nt) (SEQ ID NO:24) 5, GATCCNNNNNNNNNNNNNKNNNNNNAGTTGGACGTACGGCCGCCTT GGCCTCCGACTNNNNNNNNNNNNNNNNNNNG 3, (77 nt) (SEQ ID NO:25)超聲降解后的M&G銜接頭DNA序列5 ,NNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGG CCGTACGC TGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 3, (SEQ ID NO:26)5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTAC GGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNN 3, (SEQ ID NO:27)(可變nt)克隆至pGIS8質(zhì)粒中后的M&G銜接頭DNA序列(注質(zhì)粒的其它部分未給出)5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTC CAGGATCC 3, (140 nt) (SEQ ID NO:28)5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NGTCGGATCC 3, (140 nt) (SEQ ID NO:29) MPET中間體
5 , GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC 3, (132nt)(SEQ ID NO:30)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGG CCTCCGACTNNNNNNNKNNNNNNNNNNNNNNNNNNNGTCGGATCC 3, (132 nt) (SEQIDNO:31)
M和G diPET
5'ATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNN NNNNNNNNNNNNNNNNNCTCCAGGATCC 3, (116 nt) (SEQ ID NO:32)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNACTCA GCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNN NNNNNNNNGTCGGATC 3, (116 nt) (SEQ ID NO:33)
釋放出的具有BamHI粘性末端的diPET
5 ,GATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNN NNNNNNNNNNNNN NNNNNCTCCAG 3, (111 nt) (SEQ ID NO:34)
5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACT CCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNGTCG 3, (111 nt) (SEQ ID NO:35)
用Mmel消化前的M&M銜接頭PET5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAA GGCGGCCGTACGTCCAACTNNNNNNNNNNNNNNNNN1WNNNNNNNN NNNN 3 , (91 nt) (SEQ ID NO: 36)
5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNTCAGCCTCCGGTTC CGCCGGCATGCAGGTTGANNNNNNNNNNNNNNNNNNNNNNNNNNNN NNN 3, (91 nt)(SEQ ID NO:37)
在插入M&G接頭之前如圖8所示的寡核苷酸
5'NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNKNNN NNNNNNNNNNNN 3, (53 nt) (SEQ ID NO:38)
5'NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNN NNNNNNNNNNNNN 3, (53 nt) (SEQ ID NO:39)
插入到質(zhì)粒中的如圖8所示的寡核苷酸(質(zhì)粒的其它部分沒有給出)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCT CCAGGATCC 3'(M0 nt) (SEQ ID NO:40)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN GTCGGATCC 3, (140 nt) (SEQ ID NO:41)
插入到質(zhì)粒中的如圖8所示的寡核苷酸(質(zhì)粒的其它部分沒有給出)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCT CCAGGATCC 3, (140 nT)(SEQ ID NO:42)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC 3, (140 nt) (SEQ ID NO:43)
通過電泳除去的沒有插入M&G接頭的如圖8所示的寡核苷酸
5 ,GATCCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNCTCCAG 3, (112 nt) (SEQ ID NO:44)
5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNTCG 3, (112 nt) (SEQ ID NO:45)
插入M&G接頭之前如圖9所示的寡核苷酸
5 ,NNNNNNNNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNN NNNNNNNNNNNNNNNNN 3, (59 nt) (SEQ ID NO:46)
5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNN NNNNN NNNNNNNNNNNNN 3, (59 nt) (SEQ ID NO:47)
在插入部分M&G接頭后如圖9所示的寡核苷酸
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCT CCAGGATCC 3, (140 nt)(SEQ ID NO:48)
5 , GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN GTCGGATCC 3, (140 nt) (SEQ ID NO:49)
在被限制性內(nèi)切核酸酶消化后具有插入部分M&G接頭的如圖9所示的
寡核苷酸(質(zhì)粒的其它部分沒有給出)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNTCC GACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNN NNNNNNNNNNNNNNNNNNNNCTCCAGGATCC 3, (126 nt) (SEQIDNO:50)5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNN NNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNGTCGGATCC 3, (126 nt) (SEQIDNO:51)
從質(zhì)粒中去除后如圖9所示的寡核苷酸
5 ,GATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 麗TCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAG 3, (120 nt) (SEQ ID NO:52)
5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCG 3, (120 nt) (SEQ ID NO:53)
具有插入在相反方向的M&G接頭的如圖IO所示寡核苷酸
5 ,NNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGG
CCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 3,
(85 nt) (SEQ ID NO:54)
5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTAC
GGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNN 3' (85
nt) (SEQ ID NO:55)
插入在質(zhì)粒中的如圖10所示的寡核苷酸(質(zhì)粒的其它部分沒有給出) 5 , GG ACTGG AGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNGTCGGATCC 3, (148 nt) (SEQ ID NO:56)
5 , GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCT
CCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN麗NNNNCTC CAGTCC 3, (148 nt) (SEQ ID NO:57)
如圖IO所示的中間體寡核苷酸1
5 ,GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNN NNNNNNGTCGGATCC 3, (62 nt) (SEQ ID NO:58)
5 , GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNN NNNNNNCTCCAGTCC 3, (62 nt) (SEQ ID NO:59)
如圖10所示的中間體寡核苷酸2
5 ,GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNN 3, (62 nt) (SEQ ID NO:60)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNN NNNNNNCTCCAGTCC 3, (62 nt) (SEQ ID NO:61)
如圖10所示的產(chǎn)物寡核苷酸
5 , GATCCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 麗NNNNNNNN NNNNNNNNNNNNCTCCAG 3, (114 NT) (SEQ ID NO:62)
5 , GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNN NNNNNNNNNNNNNNNNTCG 3, (114 nt) (SEQ ID NO:63)
實施例l使用小鼠胚胎干細(xì)胞的CIA-PET方案
CIA-PET方法(圖1和4)包括五個階段:(l)生成ChlPDNA-蛋白質(zhì)-DNA 復(fù)合物;(2)制備CIA-PET; (3)擴增CIA-PET; (4)對CIA-PET進(jìn)行測序;和 (5)對CIA-PET序列定位(圖3)。
(1)生成ChIP DNA-蛋白質(zhì)-DNA復(fù)合物
(a) 在白血病抑制因子(Chemicon)的存在下,在無飼養(yǎng)層培養(yǎng)(feeder-free) 小鼠胚胎干(ES)細(xì)胞。
(b) 收集約1-2乂108個細(xì)胞,并用甲醛(最終濃度為1%, Sigma)在室溫下交聯(lián)10分鐘。
(C)細(xì)胞裂解和染色質(zhì)的制備
cl、使細(xì)胞在裂解緩沖液中裂解(50mMHEPES、 lmMEDTA、 0.15M NaCI、 1%SDS、 1% Triton X-100、 0.1%脫氧膽酸鹽,全部從Ambion購得)。
c2、通過超聲波降解法使用Branson 450超聲細(xì)胞破碎儀使染色質(zhì)溶解 (20%的負(fù)載輸出功率、30秒、5-8次)。
c3、將染色質(zhì)稀釋10倍,以使十二烷基磺酸鈉(SDS)降低至0.1%。
c4、然后將提取物在4'C, 14,000rpm的條件下離心IO分鐘。
c5、將提取物在-80'C下儲存直至使用。
(d)免疫沉淀反應(yīng)
dl、將2微克的單克隆抗體(F7, Santa Cruz)結(jié)合到蛋白質(zhì)G瓊脂糖凝
膠(Pharmacia)上。
d2、在4。C下將抗體包覆的珠子與染色質(zhì)提取物一起孵育16小時。 d3、然后通過以下緩沖液清洗所述珠子(試劑購自Sigma Chemical
Company):
洗滌緩沖液1 (50mMHEPES、 lmM乙二胺四乙酸(EDTA) 、 0.15M NaCl、 0.1%SDS、 1%去通X-IOO (Triton X-100) 、 0.1 %脫氧膽酸鹽),清 洗2次。
洗滌緩沖液2(50mMHEPES、 1 mM EDTA、 0.5MNaCl、 0.1%SDS、 1%. Triton X-100、 0.1 %脫氧膽酸鹽),清洗1次。
洗滌緩沖液3 (20 mM Tris.HCl pH 8.0、 1 mM EDTA、 0.25 M LiCl、 0.5%
NP40、 0.5%脫氧膽酸鹽),清洗1次。
洗滌緩沖液4 (20 mM Tris.HCl pH 8.0、 1 mM EDTA),清洗1次。
d4、然后在65"C下,使用洗脫緩沖液洗脫20分鐘以將蛋白質(zhì)-DNA復(fù)
合物從所述珠子上洗脫下來。d5、在4'C下,在PBS(Ambion)中對洗脫物透析3小時以去除SDS。 (2)制備CIA-PET
(a) 末端修復(fù)
使用Epicentre End-It試劑盒和以下化學(xué)品進(jìn)行末端修復(fù) 染色質(zhì)(最多5pg) 2.5P1 (10X)
末端修復(fù)緩沖液 5]il 2.5 mM脫氧核苷三磷酸(dNTP)混合物 5卩1 10mM三磷酸腺甙(ATP) 5pl 末端修復(fù)酶混合物
不含核酸酶的水 至50]jl
簡單地渦旋混合,然后在室溫下孵育45分鐘,在70'C下加熱IO分鐘以 停止反應(yīng)。通過加入27^1的不含核酸酶的水將濃度調(diào)節(jié)至65 ng 1。
(b) 力口尾(tailing)
DNA 20vil 10 mM脫氧三磷酸腺甙(dATP) (Roche) 0. 5pl
10XEx Taq緩沖液(Takara) 2. 5口1
Ex Taq聚合酶(Takara) 0. 5pl
不含核酸酶的水 至25P1
在PCR儀中于72。C下孵育30分鐘,然后在4。C保存。最好取出離心 管,在72。C下的孵育終止時立刻進(jìn)行連接。
(c) 使用M&M接頭(SEQ ID NOS: 1和2)連接DNA 染色質(zhì)DNA (20(Hig) 3. M疆銜接頭-T末端(38ng) 3. lpl 具有聚乙二醇(PEG)的5X連接酶緩沖液(Invitrogen) 6卩1 T4連接酶(5U/]al) (Invitrogen) lpl不含核酸酶的水 12.3pl
在16°C下過夜連接,得到插入有M&M接頭的寡核苷酸(SEQ ID NOS:
20和21)。
(d)使用蛋白酶K的解交聯(lián)
將DNA樣品分成2(^1的分裝體,并在15^1濃度為20mg/ml的蛋白酶 K(Ambion)的存在下于65'C孵育過夜,以解交聯(lián)。第二天,加入lpl濃度為 10mg/ml的RNA酶A以降解RNA,在37'C下降解RNA45分鐘,隨后進(jìn)行 苯酚抽提并用乙醇沉淀DNA。重懸在20pl洗提緩沖液中,并在-2(TC下保存。 獲得的濃度通常為500 ng/W。
定量DNA,并將0.5pl得到的DNA和Takara的寬范圍序列梯,以及 Invitrogen的低質(zhì)量序列梯和從(a)中得到的0.5pl的材料,在1%的凝膠中進(jìn) 行電泳來進(jìn)行質(zhì)量控制。(d)中得到的材料點樣量應(yīng)該較少,并且在50-100bp
的標(biāo)記范圍內(nèi)不應(yīng)該顯示出任何明亮的條帶。 (e)Mmel酶切
10卩g腿 20口1
10XNE緩沖液4 (New England Biolabs) 20口1
10X SAM (New England Biolabs) 20pl
Mmel (2U/vil) (New England Biolabs) 20pl
不含核酸酶的水 120pl
分裝在兩個離心管中,并在37'C下孵育過夜。SAM應(yīng)該是新制備的。
含有糖藍(lán)(glycoblue)的苯酚氯仿和乙醇的沉淀物。
定量DNA,并使用3pl得到的DNA與Takara的寬范圍序列梯,以及使 用Invitrogen的低質(zhì)量序列梯和從(d)中得到的0.5^1的材料,在2%的凝膠或 PAGE凝膠中進(jìn)行電泳來進(jìn)行質(zhì)量控制。
(f)凝膠純化將得到的DNA與合適的序列梯(例如,20plTakam的寬范圍序列梯) 負(fù)載到2%的瓊脂糖凝膠的Scie-Plas中等尺寸孔(每孔60pl)中。在80V下 電泳約1.5小時,然后在365nm的紫外光下觀察。具有錯誤插入的接頭的寡 核苷酸將通過電泳被去除掉(錯誤插入的接頭的例子,見圖8-10)。根據(jù)生 產(chǎn)商提供的建議使用一次性的Fermentas ElutaTubes切出雙標(biāo)簽條帶并進(jìn)行 電洗脫。在90V下電洗脫1-1.5小時,然后使用乙醇沉淀得到的雙標(biāo)簽每200p洗脫液,加入3 M NaOAc pH 5. 2 (Amresco) 20]jl1 M MgCl2(Ambion) 4. 5|il糖藍(lán)(Ambion) 2pl100%的乙醇 800vil在12(il的洗脫緩沖液(Qiagen)中重懸沉淀的雙標(biāo)簽,并使用2-5|il雙標(biāo) 簽溶液和低質(zhì)量序列梯(Invitrogen),在4-20%的PAGE微型膠中進(jìn)行電泳以 檢測純度并在視覺上進(jìn)行定量。得到的正確雙標(biāo)簽具有SEQ ID NOS: 22和 23所示的序列。(3)擴增PET(a)銜接頭的連接(連接的銜接頭SEQIDNOS'. 5-8)DNA (100 ng) 6pl銜接頭(IO pg) 6U1IOX連接酶緩沖液(具有亞精胺) 1.5卩1T4 DNA連接酶(5U/]jl, Irwitrogen) l卩l(xiāng)不含核酸酶的水 0.5]al總體積為15卩1,在16"C下孵育16小時。 具有亞精胺的IOX連接酶緩沖液由以下物質(zhì)組成:60mM Tris-HCl pH7. 5 (Ambion) 60mM MgCl2 (Ambion) 50mM NaCl (Ambion)
1mg/ml牛血清白蛋白(BSA) (NeW England Biolabs)
70mM p-巰基乙醇(Sigma)
ImM ATP (Irwitrogen)
20mM二硫蘇糖醇(DTT) (Invitrogen)
10mM亞精胺(Sigma)
(b) PCR擴增
使用引物PMRs 11和12(分別為SEQIDNOS: 13和14)以及購自Qiagen
的Hotstartaq試劑盒進(jìn)行擴增
DNA l卩l(xiāng)
10 X PCR緩沖液(Qiagen) lO]jl
dNTP混合物(每種10 mM) (Invitrogen) 2pl
PMR11 (0. 2pM)
PMR12 lpl (0.2卩M)
HotStarTaq DNA聚合酶(Qiagen) 0. 5jj1
不含核酸酶的水 至lOOpl
充分混合,在PCR儀上孵育
1、 95°c, 15分鐘
2、 94°c, 0. 5分鐘
3、 55°c, 0. 5分鐘
4、 72。C, l分鐘
5、 重復(fù)步驟2-4, 25個循環(huán)
6、 72°C, 10分鐘使用PCR純化試劑盒(Qiagen)進(jìn)行純化。 (4) CIA-PETs的測序可以根據(jù)454多重測序儀(454生命科學(xué))的方案直接對CIA-PETs進(jìn) 行測序。該技術(shù)描述在Margulies等(2005)和美國專利申請No. 20030068629 中。這些參考文獻(xiàn)的全文在此一并引入作為參考。對CIA-PETs進(jìn)行定位可以使用壓縮的后綴陣列(Compressed Suffix Array)進(jìn)行定位。穿越兩個 不同的DNA片段的多個連接應(yīng)該表示真實的遠(yuǎn)端控制區(qū)(圖3)。實施例3: CIA-diPET方法CIA-diPET方法(圖2和6)包括以下部分(l)生成ChIPDNA-蛋白質(zhì) -DNA復(fù)合物;(2)制備CIA文庫;(3)制備CIA-PET文庫;(4)測序;和(5) 對CIA-PET序列進(jìn)行定位(圖5 )。(1)生成ChIP DNA-蛋白質(zhì)-DNA復(fù)合物(如上所述)(a) 在白血病抑制因子(Chemicon)的存在下,在無飼層培養(yǎng)小鼠胚胎干 (ES)細(xì)胞。(b) 收集約l-2xl()S個細(xì)胞,并用甲醛(最終濃度為1%, Sigma)在室溫 下交聯(lián)IO分鐘。(c) 細(xì)胞裂解和染色質(zhì)的制備cl、使細(xì)胞在裂解緩沖液中裂解(50mMHEPES、 lmMEDTA、 0.15M NaCl、 1%SDS、 1% Triton X-IOO、 0.1%脫氧膽酸鹽,全部由Ambion購得)。c2、通過超聲降解法使用Branson 450超聲細(xì)胞破碎儀使染色質(zhì)溶解 (20%的負(fù)載輸出功率、30秒、5-8次)。c3、將染色質(zhì)稀釋10倍,以使SDS降低至0.1%。c4、然后將提取物在4'C, 14,000rpm的條件下離心IO分鐘。c5、將提取物在-8(TC下儲存直至使用。 (d)免疫沉淀反應(yīng)
dl、將2微克的單克隆抗體(F7, Santa Cruz)結(jié)合到蛋白質(zhì)G瓊脂糖凝
膠(Pharmacia)上。
d2、在4'C下將抗體包覆的珠子與染色質(zhì)提取物一起孵育16小時。 d3、然后通過以下緩沖液清洗所述珠子(試劑購自Sigma Chemical
Company) -
洗滌緩沖液1 (50 mM HEPES、 1 mM EDTA、 0.15 M NaCl、 0.1% SDS、 1%TritonX-100、 0.1 %脫氧膽酸鹽),清洗2次。 洗滌緩沖液2(50mMHEPES、 lmMEDTA、 0.5MNaCl、 0.1%SDS、 1%. Triton X-IOO、 0.1 %脫氧膽酸鹽),清洗1次。 洗漆緩沖液3 (20mMTris.HClpH8.0、 lmMEDTA、 0.25MLiCl、 0.5% NP40、 0,5%脫氧膽酸鹽),清洗1次。
洗滌緩沖液4 (20 mM Tris.HCl pH 8.0、 1 mM EDTA),清洗1次。
d4、然后在65X:下,使用洗脫緩沖液洗脫20分鐘以將蛋白質(zhì)-DNA復(fù)
合物從所述珠子上洗脫下來。
d5、然后在4'C下,在PBS(Ambion)中對洗脫物透析3小時以去除SDS。 (2)制備CIA-diPET文庫
(a)末端修復(fù)(用于制備CIA-PET),使用Epicentre End-It試劑盒進(jìn)行末
端修復(fù)
染色質(zhì)(最多5pg) 2.5P1
10 X末端修復(fù)緩沖液(Epicentre) 5pl
2. 5 mM dNTP混合物(Epicentre) 5pl
10mM ATP (Epicentre) 5pl
末端修復(fù)酶混合物(Epicentre) lpl停
不含核酸酶的水 31.5pl
簡單地渦旋混合,并在室溫下孵育45分鐘,在7(TC下加熱10分鐘以子 止反應(yīng)。通過加入27^1的不含核酸酶的水將濃度調(diào)節(jié)至65 ng/pl。
(b) 如上所述加尾以用于CIA-PET
腿 20pl 10 mM dATP (Roche) 0. 5pl
10XEx Taq緩沖液(Takara) 2. 5]jl
Ex Taq聚合酶(Takara) 0. 5口1
不含核酸酶的水 1.5pl
在PCR儀中于72。C孵育30分鐘,然后于4'C下保存。最好取出離心管, 在72r下的孵育終止時馬上進(jìn)行連接。
(c) DNA與M&M接頭的連接(SEQ ID NOS: 3和4) 染色質(zhì)DNA(200ng) 3. lpl M&G銜接頭-T末端(38ng) 7. 6pl 具有PEG的5X連接酶緩沖液(Invitrogen) 6pl T4連接酶(5U/V1) (Invitrogen) lpl 不含核酸酶的水 12.3pl
在16。C下過夜連接,得到插入有M&G接頭的寡核苷酸(SEQIDNOS: 26
和27)。
(d) 與上述CIA-PET—樣,使用蛋白酶K解交聯(lián)。
將DNA樣品分成20pl的分裝體,并在15^1濃度為20mg/ml的蛋白酶 K(Ambion)的存在下于65匸過夜以解交聯(lián)。第二天,加入濃度為10mg/ml 的RNA酶A以降解RNA (Qiagen),在37。C下降解RNA 45分鐘,隨后進(jìn) 行苯酚抽提并用乙醇沉淀DNA。重懸在20pl洗脫緩沖液中,并在-2(TC下保 存。獲得的濃度通常為500ng/Ktl。定量DNA,并將0.5^1得到的DNA和Takara的寬范圍序列梯,以及 Invitrogen的低質(zhì)量序列梯和從(a)中得到的0.5^1的材料,在1%的凝膠中進(jìn) 行電泳來進(jìn)行質(zhì)量控制。(d)中得到的材料點樣量應(yīng)該較少,并且在50-100bp 的標(biāo)記范圍內(nèi)不應(yīng)該顯示出任何明亮的條帶。(e)使用NIaIII的消化Nlain在-80。C下儲存(-80。C下半衰期6個月)。在使用前至于冰上。DNA (約1嗎) 2pl10XNE緩沖液4 (New England Biolabs) 5]jlNIa III (New England Biolabs) lpl100 XBSA (New England Biolabs) 0. 5|il不含核酸酶的水 41.5pl 制備5管上述反應(yīng)液。在37'C下孵育1小時。將含有糖藍(lán)的苯酚氯仿和 乙醇沉淀物重懸在10^d的洗脫緩沖液中(Qiagen)。 (f)使用Epicentre End-It試劑盒對末端進(jìn)行平整DNA (最多5pg) 34y:l10 X末端修復(fù)緩沖液(Epicentre) 5]jl2. 5 mM dNTP混合物(Epicentre) 5i_il10mM ATP (Epicentre) 5pl末端修復(fù)酶混合物(Epicentre) lpl室溫下孵育45分鐘,在70'C下加熱10分鐘以停止反應(yīng)。 (i)克隆至具有Mmel和GsuI側(cè)翼連接位點的pGIS8載體中(SEQ ID NOS: 18禾B 19;圖7和11)。置于冰上,使用1.7ml的微離心管(使用多個離心管) 40 ng/Vl預(yù)酶切的pGIS l卩l(xiāng) DNA 6pl具有PEG的5X連接酶緩沖液(Irwitrogen) 2P1 T4 DNA連接酶(5U/pl) (Invitrogen) l卩l(xiāng) 在16。C下孵育過夜(12-16小時),得到SEQIDNOS:28和2S所示的
寡核苷酸。
設(shè)置一個載體自連的對照。
通過電穿孔技術(shù),在每50|il感受態(tài)TOP10細(xì)胞(Invitrogen)中轉(zhuǎn)染lpl 的連接產(chǎn)物。在lml的LB培養(yǎng)基中恢復(fù)每一個等份式樣l小時,然后平板 培養(yǎng)一系列稀釋度(LB瓊脂糖+氨芐青霉素)用于質(zhì)量控制和滴定的試樣。
然后,通過將剩余的培養(yǎng)基在更大的瓊脂糖平板(Q-tmys)上進(jìn)行培養(yǎng)來 擴大該過程,并使用Qiagen的高速質(zhì)粒大量提取試劑盒(Qiagen HiSpeed
Plasmid Maxi Kit)進(jìn)行大量制備。 (3) CIA-diPET文庫 (a) Mmel酶切
10卩g DNA 100pl 10XNE緩沖液4 (New England Biolabs) 20|jl 10X SAM (New England Biolabs) 20pl Mmel(2U/vi1) (New England Biolabs) 12]jl 不含核酸酶的水 48
在37。C下孵育過夜,得到SEQIDNOS: 30和31所示的寡核苷酸。SAM 應(yīng)該是新制備的。將含有糖藍(lán)的苯酚氯仿和乙醇沉淀物重懸在12|il的洗脫 緩沖液中。
定量DNA,并將1^1得到的DNA和Takara的寬范圍序列梯,以及使用 Iiwitrogen的低質(zhì)量序列梯和從(e)中得到的的材料,在2%的凝膠或 PAGE凝膠中進(jìn)行電泳來進(jìn)行質(zhì)量控制。
(b)環(huán)化設(shè)置96孔培養(yǎng)板,每個孔均含有以下物質(zhì)(MJResearch): 100 ng DNA 50^1 連接溶液1 (Takara Ligation Kit ver 2) 50]al 密封培養(yǎng)板,以防止蒸發(fā)。 16"C下孵育過夜。使用三個純化柱進(jìn)行PCR純化(Qiagen),重懸在每個40^1的洗脫緩沖液 中,得到總量約為120W。(c) Gsul酶切 設(shè)置9管 環(huán)化的DNAIOX緩沖液TANGO (Fermentas) 10X SAM (New England Biolabs) GsuI(5U/]jl (Fermentas) 不含核酸酶的水在3(TC下酶切至少2小時,但并不酶切過夜 和33所示的寡核苷酸。(d) 環(huán)化設(shè)置9管,每管含有以下物質(zhì) 約100 ng DNA連接溶液1 (Takara Ligation Kit雷2) 16'C下孵育過夜。進(jìn)行苯酚氯仿乙醇沉淀,并重懸在12^1的洗脫緩沖液中。(e) 通過置于冰上的滾環(huán)擴增(Rolling Circle Amplication) (Templiphi試 劑盒,Amersham)的解凍溶液進(jìn)行擴增。制備3-4個含有以下物質(zhì)的管-2. 5 ng DNA l卩l(xiāng)12|il 8. 6P1 8. 6vill卩l(xiāng)55. 8]jl 得到如SEQ ID NOS: 3250]jlTempliphi試劑盒變性緩沖液(kit denature buffer) (Amersham) lO]jl 在95'C下加熱3分鐘,然后置于冰上冷卻。 在反應(yīng)緩沖液中加入
Templiphi kit premix(Amersham) lOpl
使用輕敲或溫和地渦旋混合均勻。
在3(TC下孵育16-18小時,但不搖動。
例如,微量移液l^il材料進(jìn)行檢測。它應(yīng)該是有粘性的。通過皮克綠 (picogreen)熒光測定法(Quant-iT DNA assay kit, Molecular Probes)對雙鏈
DNA進(jìn)行定量。
(f)BamHI酶切
100pgDNA lpl
lOX單一的BamHI緩沖液(New England Biolabs) lOpl
100X牛血清白蛋白(New England Biolabs) lpl
BamHI (20U/pl;超過2倍)(New England Bioiabs) IO卩I
不含核酸酶水 78P1
如需要消化DNA應(yīng)制備更多的管;在37'C下孵育過夜,以獲得SEQID NOS: 34和35所示的寡核苷酸。 (g)凝膠純化
將得到的DNA與合適的序列梯(例如,Takara的寬范圍序列梯) 一起 負(fù)載2%的瓊脂糖凝膠的Scie-Plas的中等尺寸孔(每孔60pl)中。在80V下 電泳約1.5小時,然后在365nm的紫外光下觀察。具有錯誤插入的接頭的寡 核苷酸將通過電泳被去除掉(錯誤插入的接頭的例子,見圖8-10)。根據(jù)生 產(chǎn)商的建議使用一次性Fermentas ElutaTubes將雙標(biāo)簽條帶切出并進(jìn)行電洗 脫。在90V電壓下電洗脫1-1.5小時,然后以如下方式將得到的雙標(biāo)簽進(jìn)行 乙醇沉淀每200|11洗脫液加入:3 M NaOAc pH 5. 2 20]jl1 M MgCl2 4. 5]jl糖藍(lán) 2pl100%的乙醇 800]il重懸沉淀的diPETs于12^1的洗脫緩沖液中,并使用2-5pl得到的diPETs 和低質(zhì)量序列梯(Invitrogen)在4-20%的PAGE微型膠中進(jìn)行電泳以檢測純度 并在視覺上進(jìn)行定量。(4)CIA-diPET的測序(a)凝膠純化的BamHI-粘結(jié)性diPETs的連接CIA-diPETs 200-1000ng 6pl10 X連接酶緩沖液(具有亞精胺) 1 plT4 DNA連接酶(5U/V1) (Invitrogen) l卩l(xiāng)不含核酸酶的水 2pl在16。C下孵育2小時至過夜。然后在65t下熱滅活10分鐘。 (b) CIA-diPET連環(huán)體的部分BamHI再消化使用Qiagen的PCR快速旋轉(zhuǎn)純化試劑盒(Qiagen PCR purification QuickSpin Kit)純化連環(huán)體DNA。然后使用l^il的納米微滴對DNA進(jìn)行定 量(納米微滴技術(shù)),并進(jìn)行短時間的BamHI再消化連環(huán)體 20pl10X BamHI緩沖液(New England Biolabs) 3|jlBamHI (稀釋至l U/pl) (New England Biolabs) 0. 2卩1100XBSA (New England Biolabs) 0. 5卩1不含核酸酶的水 6.3vd在37t:下孵育30分鐘,并不再孵育更長的時間。快速加入6(il的荷載染料,在65。C加熱15分鐘,并且在負(fù)載于PAGE 凝膠上之前置于冰上冷卻。
(c) 連環(huán)體化的CIA-diPETs的PAGE純化
優(yōu)選將全部的樣本負(fù)載于4-20%的序列梯PAGE微型膠的一個孔中,在 該微型膠的兩側(cè)負(fù)載有Takara的寬范圍序列梯和Invitrogen的低質(zhì)量序列 梯,以檢測大小。在200V下電泳約1小時。在SYBR Green I中染色15-30 分鐘,在用于切割凝膠的Dark Reader透照器(transilhiminator)(Clare Chemical) 中顯影。
(d) 連環(huán)體的切除
將連環(huán)體化的DNA切成3個分離部分,低(400-1000bp)、中等 (1000-2000bp)、和高(〉2000bp)。將每個切除大小片段的凝膠片段置于0.6ml 的夏普列斯超速微量離心管(microfUge)中,該離心管的底部被21G針刺 穿。將被刺穿的管置于1.7ml的夏普列斯超速微量離心管中,并在16110g, 4T下離心5分鐘。因而,凝膠片段方便地破碎,并收集在1.7ml管的底部。 在每個管中加入200^1的LoTE:NH4OAc (167:33) (LoTE配方如下,NH4OAc 購自Ambion),在65'C下加熱2小時進(jìn)行洗脫。
LoTE緩沖液
3 mM Tris-HCl pH 7.5 (Ambion) 0. 2 mM EDTA (Ambion)
在前述的微離心過濾裝置中下,在16110g, 4"C下離心10分鐘,從凝膠 片段中分離出上清液(含有洗脫的連接DNA)。對每個洗脫的大小片段進(jìn) 行苯酚/氯仿抽提,然后乙醇沉淀
洗脫的DNA片段 200vil 3M乙酸鈉pH 5. 2 20vil 糖藍(lán) 2.2pl100%的乙醇 800yl 在誦80。C下保存30分鐘;在16110g, 4。C下離心30分鐘;用75%的乙醇 沖洗1次。在6^1的LoTE緩沖液中重懸沉淀物。 (e)連接至pZErO-l載體在使用前,pZErO-l克隆載體通過使用10個單位的BamHI (New England Biolabs)在37。C下消化2pg的pZErO-l質(zhì)粒DNA (Invitrogen)2小時而得到。 消化的質(zhì)粒DNA進(jìn)行苯酚氯仿提純和乙醇沉淀,然后重懸于60^1濃度為 33ng/iLd的LoTE中??梢酝ㄟ^設(shè)置載體自連接作為對照(幾乎沒有菌落)并 進(jìn)行瓊脂糖凝膠電泳,來驗證所述載體的有效性。設(shè)置以下連接體系-連環(huán)體DNA片段 6]jl BamHI/pZErO-l5X連接酶緩沖液(具有PEG) (Invitrogen) 2pl T4 DNA連接酶(5UAiL) (Invitrogen) 16'C下孵育過夜。不進(jìn)行熱滅活。還平行設(shè)置了自連接載體作為對照。當(dāng)制備用于自連接的載體時,使用 不含核酸酶的水替代連環(huán)體DNA片段。在進(jìn)行電穿孔之前,純化各連接反應(yīng)產(chǎn)物以去除鹽用不含核酸酶的水 將體積調(diào)節(jié)至200^1,進(jìn)行苯酚/氯仿提純(pH 7.9)和在-80'C下乙醇沉淀30分 鐘(使用糖藍(lán))。離心,使用70%的乙醇清洗沉淀物至少兩次,并重懸在12^1 的LoTE中。在預(yù)冷的1.7ml夏普列斯超速微量離心管中,將1^1純化的連接反應(yīng)產(chǎn) 物加入到25pl的電轉(zhuǎn)化細(xì)胞(例如,購自Lucigen的E. cloni;購自invitrogen 的TOPIO)中。并不上下吹打混合,而是使用吸管端輕輕地攪動。置于冰上 5分鐘,然后轉(zhuǎn)入到預(yù)冷的Biorad電穿孔比色皿中(0.1cm縫隙)。再在冰上放置5分鐘。使用Biomd微脈沖發(fā)生器、單脈沖、程序EC1 進(jìn)行電穿孔。時間常數(shù)通常為4,5-5毫秒。
在IO秒的脈沖內(nèi),加入lml室溫普通的LB培養(yǎng)基,轉(zhuǎn)入到15ml Falcon 管中,在37"C、 200rpm振蕩下恢復(fù)1小時。
在含有低鹽LB瓊脂并添加有擇示(Zeocin ) (Immudia Zeocin Agar,Invitrogen)的小型瓊脂平板上涂布20-50pl(取自1 ml培養(yǎng)基),并在37°C 下孵育過夜。
(f) 文庫質(zhì)量控制
在除去自連接背景后,對克隆進(jìn)行計數(shù)并檢測文庫的有效性。挑24-48 個克隆用于PCR篩選,該PCR篩選使用引物PMROll和PMR012。包括對 pZErO-l載體本身的對照PCR。基于PCR結(jié)果,挑1-4x96孔板的過夜培養(yǎng)(在 低鹽LB十擇示,Immedia,Invitrogen)的克隆,對質(zhì)粒進(jìn)行純化和進(jìn)行測序, 以檢測每個插入物中雙標(biāo)簽的平均數(shù)。
在這個階段,所述文庫可以以純化的連接混合物的形式在-20'C下保存, 直到進(jìn)行更大規(guī)模的轉(zhuǎn)化、質(zhì)粒提取和測序。
(g) 對測序的文庫進(jìn)行平板培養(yǎng)并挑菌落
每個平板以小于2000個的菌落密度,將轉(zhuǎn)化的TOP10(Invitrogen)細(xì)菌 細(xì)胞置于22x22cm的瓊脂糖平板(Q-trays, Genetix)上進(jìn)行平板培養(yǎng),以便于 機器挑菌。挑取的單個菌落培養(yǎng)在含有添加有擇示的LB(見上文)的384孔平 板中,并在37'C下過夜。重復(fù)384孔平板的實驗多次,然后在15%的丙三 醇(Sigma)的存在下于-80 °C下保存。
(h) 模板的制備
使用Sprintprep的固相試劑盒(Agencourt),制備從pZERO-l衍生的克隆 得到的質(zhì)粒。
(i) DNA測序使用測序引物PMR011和PMR012 (分別為SEQ ID NOS: 13和14)從 兩個方向?qū)|(zhì)粒進(jìn)行測序。(5)對CIA-diPETs進(jìn)行定位使用壓縮的后綴陣列(Compressed Suffix Array)進(jìn)行定位。穿越兩個不同 的DNA片段的多個連接(n〉3)應(yīng)該表示真實的遠(yuǎn)端控制區(qū)(圖5)。在使用 含有定位到基因組的不同位點的標(biāo)簽的任何嵌合體表示基因組的重排之前, 多于3個PETs顯示了相同延伸的DNA的重排,艮卩,間隔超過10kb分布的 或者位于不同染色體上的標(biāo)簽1和標(biāo)簽2。實施例4:使用的M和G載體pGIS8的構(gòu)建.(a) 得到pGIS8載體。(b) 通過如上所述的置于冰上的滾環(huán)擴增(Templiphi試劑盒,Amersham) 的解凍溶液進(jìn)行擴增。制備3-4個含有以下物質(zhì)的管lng DNA (大規(guī)模制備的) lpl Templiphi試劑盒變性緩沖液 10pl 在95'C下加熱3分鐘,然后置于冰上暫時地冷卻。 在反應(yīng)緩沖液中加入Templiphi試劑盒預(yù)混合物 10卩1使用輕敲或溫和地渦旋混合均勻。在3(TC下孵育16-18小時,但不搖動。對材料進(jìn)行檢測。它應(yīng)該是有粘性的。通過皮克綠熒光測定法(Quaiit-iT kit, Molecular Probes)對雙鏈DNA進(jìn)行定量。(c) 進(jìn)行限制性內(nèi)切核酸酶的消化DNA 25vil Xhol (20U/卩l(xiāng)) (New England Biolabs) l卩l(xiāng)EcoRl (20U/ij1) (New England Biolabs) lpl10XEcoRl緩沖液(New England Biolabs) 5pl100XBSA (New England Biolabs) lpl不含核酸酶的水 17]il 在37"C下孵育16小時。 使用PCR純化試劑盒(Qiagen)進(jìn)行純化。使用1%的瓊脂糖凝膠檢測5pl的PCR產(chǎn)物。(d)末端鈍化制備兩個含有以下物質(zhì)的管-■ 22.5口110 X末端修復(fù)緩沖液(Epicentre) 5pl2. 5 mM dNTP混合物(Epicentre) 5pl10 mM ATP (Epicentre) 5卩1末端修復(fù)酶混合物 lpl不含核酸酶的水 11.5|il在室溫下孵育45分鐘,并在7(TC下加熱10分鐘停止反應(yīng)。 應(yīng)該理解的是,在不背離本發(fā)明的宗旨和范圍的情況下,本領(lǐng)域的技術(shù) 人員能夠進(jìn)行多種修改和改進(jìn)。例如,本發(fā)明的CIA法可以用于其它種類的細(xì)胞,例如,酵母細(xì)胞替代 哺乳動物細(xì)胞。同樣,替代使甩ChIP法,本發(fā)明的方法可以通過使用適合 的固定劑而不需要免疫沉淀作用而進(jìn)行實施。在這種變化中,所述方案為-1、 采集細(xì)胞。2、 使用甲醛在36。C下交聯(lián)IO分鐘。3、 使用珠子-破碎機使細(xì)胞裂解并隨后進(jìn)行離心,以獲得上清液。4、 通過超聲波裂解法、水力剪切、皮下注射器針頭的反復(fù)抽提、或通過限制性內(nèi)切核酸酶的酶解作用剪切DNA。5、通過SDS和去通-X (Triton-X)處理,去除不需要的蛋白質(zhì)。 此后,可以按照上文所描述的方法對DNA進(jìn)行進(jìn)一步的處理(末端鈍化,連接)。此外,在另一種變化中,可以使用滾環(huán)擴增替代PCR。在這種變化中, 去除不需要的蛋白質(zhì)的程序為.-1、 DNA的末端鈍化2、 DNA的加尾3、 連接4、 使用合適的商購試劑盒,如購自Amersham Biosciences的Templiphi 試劑盒,進(jìn)行滾環(huán)擴增。5、 可以使用 Invitrogen/Molecular Probes' PicoGreen熒光試齊!j盒 (fluorimetry kit)對DNA進(jìn)行定量。6、 使用MmeI限制性內(nèi)切核酸酶消化,以獲得分離的寡核苷酸。 此外,在另一個變化中,可以省略加尾步驟,可以使用合適的鈍化末端接頭。ReferencesAntequeraand Bird(1993), ProoM磁l Acad Sci USA,90(24): 11995-9Aus咖l (1艦)Current Pmtocols in Molecular Biology, VoL 2,1995, Ed. Ausubel,et al" Greene Publish. Assoc. & Wltey lntdrscience, Un汰3.1.15Bonetta (2006〉 Nature Methods 3(2): 141-147,Brenner al《2000》,,Nat Biotechnoi, 2000.18(6): p> 63CMBuck and Lteb (2004) G咖mics 8柳:349-60Dd<k r山mppe K, Dekker M and Kte汰ner M (2002) Science 295 (5558):1306-11,D,曰t 31(2002) Genome Research 12<1 ":1756-1765EuslUrchen al,,Ktol Cel Biol, 2004,24(9): p. 3804 14D and Chandrasegaran (1993) Proa N就Acaci, Sciences USA 90:2764-8Lieb et sl,, Nat Genet, 2001. 28(4): p. 327-34MarguHes et al, 2005 N幽re 437, 376~380 (15 Sep 2005)New England Bto咖Catalog 2005. N柳England Biolabs (lpswteh, MA)Szybsiski, W., 1985, Gene, 40:169Taverner et al" Gsnome Biol, 2004.5《3):210,US 20050255501US 20050059022US 20030068629US 4,766,072Wel師ann etal,, Genes Dev, 2002,16(2);235 44>
權(quán)利要求
1、一種分離的寡核苷酸,該分離的寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽和所述第二標(biāo)簽為核酸-蛋白質(zhì)復(fù)合物的標(biāo)簽。
2、 根據(jù)權(quán)利要求1所述的分離的寡核苷酸,其中,所述第一標(biāo)簽為第 一多聚核苷酸的標(biāo)簽,所述第二標(biāo)簽為第二多聚核苷酸的標(biāo)簽,其中所述第 一多聚核苷酸和所述第二多聚核苷酸為核酸-蛋白質(zhì)復(fù)合物的多聚核苷酸。
3、 根據(jù)權(quán)利要求1或2所述的分離的寡核苷酸,其中,該分離的寡核 苷酸還含有至少一個限制性內(nèi)切核酸酶識別位點。
4、 根據(jù)權(quán)利要求1-3中的任意一項所述的分離的寡核苷酸,其中,該 分離的寡核苷酸還含有至少一個接頭。
5、 根據(jù)權(quán)利要求4所述的分離的寡核苷酸,其中,所述接頭含有至少 一個限制性內(nèi)切核酸酶識別位點。
6、 根據(jù)權(quán)利要求4或5所述的分離的寡核苷酸,其中,所述至少一個 接頭插在所述標(biāo)簽之間,或者定位在所述第一標(biāo)簽的上游或第二標(biāo)簽的下 游。
7、 根據(jù)權(quán)利要求3、 5或6所述的分離的寡核苷酸,其中,所述至少一 個限制性內(nèi)切核酸酶識別位點為lis型限制性內(nèi)切核酸酶的識別位點。
8、 根據(jù)權(quán)利要求3、 5或6所述的分離的寡核苷酸,其中,所述至少一 個限制性內(nèi)切核酸酶識別位點為歸巢限制性內(nèi)切酶的識別位點。
9、 根據(jù)權(quán)利要求1-8中的任意一項所述的分離的寡核苷酸,其中,所 述至少一個第一標(biāo)簽含有第一多聚核苷酸的5'末端和3'末端,所述至少一個 第二標(biāo)簽含有第二多聚核苷酸的5,末端和3,末端,并且,所述第一多聚核苷 酸和所述第二多聚核苷酸為核酸-蛋白質(zhì)復(fù)合物的多聚核苷酸。
10、 根據(jù)權(quán)利要求5或6所述的分離的寡核苷酸,其中,所述接頭含有 第一限制性識別位點和第二限制性識別位點,所述第一限制性識別位點被能 夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一標(biāo)簽的限制性內(nèi)切核酸酶所識別, 所述第二限制性識別位點被能夠?qū)Φ诙嗑酆塑账徇M(jìn)行酶切以得到第二標(biāo) 簽的限制性內(nèi)切核酸酶所識別,所述第一多聚核苷酸和所述第二多聚核苷酸 為核酸-蛋白質(zhì)復(fù)合物的多聚核苷酸。
11、 根據(jù)權(quán)利要求5或6所述的分離的寡核苷酸,其中,所述接頭含有 第一限制性識別位點和第二限制性識別位點,所述第一限制性識別位點被能 夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一多聚核苷酸的3'末端的第一限制 性內(nèi)切核酸酶所識別,所述第二限制性識別位點被能夠?qū)Φ诙嗑酆塑账徇M(jìn) 行酶切以得到第二多聚核苷酸的5'末端的第二限制性內(nèi)切核酸酶所識別,所 述第一多聚核苷酸和所述第二多聚核苷酸為核酸-蛋白質(zhì)復(fù)合物的多聚核苷 酸。
12、 根據(jù)權(quán)利要求5或6所述的分離的寡核苷酸,其中,所述接頭含有 第一限制性識別位點和第二限制性識別位點,所述第一限制性識別位點被能 夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一多聚核苷酸的5'末端的第一限制 性內(nèi)切核酸酶所識別,所述第二限制性識別位點被能夠?qū)Φ诙嗑酆塑账徇M(jìn) 行酶切以得到第二多聚核苷酸的3'末端的第二限制性內(nèi)切核酸酶所識別,所述第一多聚核苷酸和所述第二多聚核苷酸為核酸-蛋白質(zhì)復(fù)合物的多聚核苷 酸。
13、 根據(jù)權(quán)利要求5、 6、或ll所述的分離的寡核苷酸,其中,所述接 頭含有第一限制性識別位點和第二限制性識別位點,所述第一限制性識別位 點被能夠?qū)Φ谝欢嗑酆塑账徇M(jìn)行酶切以得到第一多聚核苷酸的3'末端的第 一限制性內(nèi)切核酸酶所識別,所述第二限制性識別位點被能夠?qū)Φ诙嗑酆?苷酸進(jìn)行酶切以得到第二多聚核苷酸的5'末端的第二限制性內(nèi)切核酸酶所 識別;所述第一多聚核苷酸還含有第三識別位點,該第三識別位點被能夠?qū)?第一多聚核苷酸進(jìn)行酶切以得到第一多聚核苷酸的5'末端的第三限制性內(nèi) 切核酸酶所識別;所述第二多聚核苷酸含有第四識別位點,該第四識別位點 被能夠?qū)Φ诙嗑酆塑账徇M(jìn)行酶切以得到第二多聚核苷酸的3'末端的第四 限制性內(nèi)切核酸酶所識別;所述第一多聚核苷酸和所述第二多聚核苷酸為核 酸-蛋白質(zhì)復(fù)合物的多聚核苷酸;所述至少一個第一標(biāo)簽是通過連接所述第 一多聚核苷酸的5'末端和3'末端而獲得的,所述至少一個第二標(biāo)簽是通過連 接所述第二多聚核苷酸的5'末端和3'末端而獲得的。
14、 根據(jù)權(quán)利要求1-13中的任意一項所述的分離的寡核苷酸,其中, 所述核酸-蛋白質(zhì)復(fù)合物為染色質(zhì)結(jié)構(gòu)的一部分。
15、 根據(jù)權(quán)利要求1-14中的任意一項所述的分離的寡核苷酸,其中, 所述多聚核苷酸為DNA或RNA。
16、 一種載體,該載體含有權(quán)利要求1-15中的任意一項所述的寡核苷
17、 一種寡核苷酸連環(huán)體,該寡核苷酸連環(huán)體含有至少兩個分離的寡核 苷酸,每個分離的寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,其 中,所述第一標(biāo)簽和所述第二標(biāo)簽為核酸-蛋白質(zhì)復(fù)合物的標(biāo)簽。
18、 根據(jù)權(quán)利要求17所述的寡核苷酸連環(huán)體,其中,所述第一標(biāo)簽為 第一多聚核苷酸的標(biāo)簽,所述第二標(biāo)簽為第二多聚核苷酸的標(biāo)簽,所述第一 多聚核苷酸和所述第二多聚核苷酸源自核酸-蛋白質(zhì)復(fù)合物,并且,每個分 離的寡核苷酸含有至少一個限制性內(nèi)切核酸酶識別位點。
19、 根據(jù)權(quán)利要求18所述的寡核苷酸連環(huán)體,其中,所述至少一個限 制性內(nèi)切核酸酶識別位點包括在至少一個接頭中。
20、 根據(jù)權(quán)利要求19所述的寡核苷酸連環(huán)體,其中,所述至少一個接 頭插在所述標(biāo)簽之間,或者定位在所述第一標(biāo)簽的上游和/或第二標(biāo)簽的下 游。
21、 根據(jù)權(quán)利要求18-20中的任意一項所述的寡核苷酸連環(huán)體,其中, 所述至少一個限制性內(nèi)切核酸酶識別位點為lis型限制性內(nèi)切核酸酶的識別 位點。
22、 根據(jù)權(quán)利要求17-21中的任意一項所述的寡核苷酸連環(huán)體,其中, 所述第一標(biāo)簽含有源自所述第一多聚核苷酸的5,末端和3'末端,所述第二標(biāo) 簽還含有源自所述第二多聚核苷酸的5'末端和3'末端。
23、 一種寡核苷酸文庫,該寡核苷酸文庫包括至少一種根據(jù)權(quán)利要求 1-15中的任意一項所述的寡核苷酸。
24、 一種制備至少一種分離的寡核苷酸的方法,該方法包括-(d) 提供核酸-蛋白質(zhì)復(fù)合物;(e) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中,所述第一標(biāo)簽和所述第二標(biāo)簽得自核苷酸-蛋白質(zhì)復(fù)合物;和(f) 分離所述寡核苷酸。
25、 根據(jù)權(quán)利要求24所述的方法,其中,所述第一標(biāo)簽得自第一寡核 苷酸,所述第二標(biāo)簽得自第二寡核苷酸,所述第一寡核苷酸和所述第二寡核 苷酸得自核酸-蛋白質(zhì)復(fù)合物。
26、 根據(jù)權(quán)利要求24或25所述的方法,其中,步驟(b)包括(i) 插入至少一個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位 點,禾口(ii) 使用至少一種能夠識別位于所述接頭中的至少一個識別位點的限制 性內(nèi)切核酸酶,對所述第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以形成 寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第二標(biāo)簽和所述接頭,所述第一標(biāo)簽 得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸。
27、 根據(jù)權(quán)利要求24或25所述的方法,其中,步驟(b)包括(i) 在所述復(fù)合物的第一多聚核苷酸和第二多聚核苷酸之間插入至少一 個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位點;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分別加入至 少一個限制性內(nèi)切核酸酶識別位點;(iii) 使用能夠識別至少一個識別位點的至少一種限制性內(nèi)切核酸酶,對所述第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以獲得酶切片段;和(iv)連接所述酶切片段以形成寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第 二標(biāo)簽、和插入在該標(biāo)簽之間的接頭,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所述標(biāo)簽含有各個多聚核苷酸的5'末端 和3'末端。
28、 根據(jù)權(quán)利要求27所述的方法,其中,步驟(ii)中的所述至少一個限 制性內(nèi)切核酸酶識別位點為銜接頭或載體的一部分。
29、 根據(jù)權(quán)利要求24-28中的任意一項所述的方法,其中,所述核酸-蛋白質(zhì)復(fù)合物是通過染色質(zhì)的免疫沉淀作用得到的。
30、 一種檢測和/或識別核酸-蛋白質(zhì)復(fù)合物中的至少兩種多聚核苷酸的 方法,該方法包括(g) 提供核酸-蛋白質(zhì)復(fù)合物;(h) 制備含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽的寡核苷酸,其中, 所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸,所 述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白質(zhì)復(fù)合物;(i) 對所述寡核苷酸進(jìn)行測序;和(i)根據(jù)所述第一標(biāo)簽和所述第二標(biāo)簽的核苷酸序列對所述至少兩種多 聚核苷酸進(jìn)行定位,從而對所述至少兩種多聚核苷酸進(jìn)行檢測和/或識別。
31、 根據(jù)權(quán)利要求30所述的方法,其中,步驟(b)包括(i) 插入至少一個接頭,該接頭含有至少一個限制性酶切位點,和;(ii) 使用至少一種能夠識別位于所述接頭中的至少一個識別位點的限制 性內(nèi)切核酸酶,對所述第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以形成 寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第二標(biāo)簽、和位于所述標(biāo)簽之間的接頭,所述第一標(biāo)簽得自第一多聚核苷酸,所述第二標(biāo)簽得自第二多聚核苷酸。
32、 根據(jù)權(quán)利要求30所述的方法,其中,步驟(b)包括(i) 在所述復(fù)合物的第一多聚核苷酸和第二多聚核苷酸之間插入至少一 個接頭,該接頭含有至少一個限制性內(nèi)切核酸酶識別位點;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分別加入至 少一個限制性內(nèi)切核酸酶識別位點;(iii) 使用至少一種能夠識別至少一個識別位點的限制性內(nèi)切核酸酶,對 所述第一多聚核苷酸和第二多聚核苷酸進(jìn)行酶切,以獲得酶切片段;和(iv) 連接所述酶切片段以形成寡核苷酸,該寡核苷酸含有第一標(biāo)簽、第 二標(biāo)簽、和插入在所述標(biāo)簽之間的接頭,所述第一標(biāo)簽得自第一多聚核苷酸, 所述第二標(biāo)簽得自第二多聚核苷酸,所述標(biāo)簽含有各個多聚核苷酸的5'末端 禾口 3,末端。
33、 根據(jù)權(quán)利要求32所述的方法,其中,步驟(ii)中的所述至少一個限 制性內(nèi)切核酸酶識別位點為銜接頭或載體的一部分。
34、 根據(jù)權(quán)利要求30-33中的任意一項所述的方法,其中,所述核酸-蛋白質(zhì)復(fù)合物是通過染色質(zhì)的免疫沉淀作用得到的。
35、 根據(jù)權(quán)利要求30-34中的任意一項所述的方法,其中,所述寡核苷 酸與至少一種另一個寡核苷酸連接,所述另一個寡核苷酸是通過測序前的步 驟(a)-(b)得到的。
36、 根據(jù)權(quán)利要求30-35中的任意一項所述的方法,其中,所述多聚核 苷酸定位在同一個染色體上,或者所述多聚核苷酸定位在不同的染色體上。
全文摘要
本發(fā)明提供了一種分離的寡核苷酸和使用該分離的寡核苷酸對核酸-蛋白質(zhì)復(fù)合物中的至少兩種多聚核苷酸進(jìn)行檢測和/或識別的方法。所述寡核苷酸含有至少一個第一標(biāo)簽和至少一個第二標(biāo)簽,其中,所述第一標(biāo)簽和第二標(biāo)簽得自核酸-蛋白質(zhì)復(fù)合物。
文檔編號C12Q1/68GK101410516SQ200780009183
公開日2009年4月15日 申請日期2007年3月9日 優(yōu)先權(quán)日2006年3月13日
發(fā)明者莎 麗, 衛(wèi)嘉玲, 阮一駿 申請人:新加坡科技研究局