本發(fā)明涉及染色體構(gòu)象捕獲領(lǐng)域,具體地指一種DLOHi-C染色體構(gòu)象捕獲方法。
背景技術(shù):
:自基因組學(xué)啟動到今天,基因組學(xué)的發(fā)展經(jīng)歷了兩次大浪潮。第一次發(fā)展的浪潮是以人類基因組計劃為代表的,從90年代初到2003年,該計劃對人類基因組進行了測序,定義了人類基因組中的主要基因及其線性結(jié)構(gòu),同時極大的促進了測序技術(shù)的發(fā)展,開啟了基因組學(xué)時代;第二次浪潮是以“人類基因組DNA元件百科全書計劃”為代表的,從2003年開始,該計劃對人類基因組序列進行了系統(tǒng)的解讀和注釋,發(fā)現(xiàn)了大量的轉(zhuǎn)錄序列和基因調(diào)控元件,并對基因的表達(dá)和染色質(zhì)狀態(tài)進行了定義。有了基因組序列、調(diào)控元件和相關(guān)的注釋以后,研究人員發(fā)現(xiàn),這些離散的調(diào)控元件并不能有效地解釋很多基因的調(diào)控機制和結(jié)構(gòu)。雖然生物的基因組在它們的線性序列中儲存了遺傳信息,但是基因的正確表達(dá)、調(diào)控以及基因調(diào)控元件之間的相互作用都需要在染色體折疊成復(fù)雜的三維結(jié)構(gòu)中完成,因此科學(xué)家們面臨一個迫切需要解決的問題:基因組中的染色體是如何進行折疊的、基因組上線性距離遠(yuǎn)的調(diào)控元件是如何發(fā)生相互作用的。這個問題也是三維基因組學(xué)所致力解決的問題,對三維基因組學(xué)的研究也預(yù)示著基因組學(xué)第三次浪潮的到來。Hi-C技術(shù)是基因組三維結(jié)構(gòu)的研究的主要工具之一,它是基于經(jīng)典的染色體構(gòu)象捕獲技術(shù)3C(ChromosomeConformationCapture)發(fā)展而來的。經(jīng)典3C技術(shù)原理是先用甲醛固定細(xì)胞中的染色質(zhì),然后進行內(nèi)切酶酶切后DNA再連接,這樣就能將空間接近的序列片段聚攏在一起,之后通過測序分析這些連接處的特征,獲得一張詳細(xì)的染色質(zhì)互作圖譜。但3C技術(shù)聚焦于兩個特定位點之間的互作,最終結(jié)果是基于觀測特異性擴增片段的有無,因此僅能“一對一”的研究基因組中某一特定DNA片段在染色質(zhì)中與另一特定DNA片段的相互作用。隨著高通量測序技術(shù)和生物信息學(xué)的發(fā)展,人們希望尋求一種方法能夠克服3C技術(shù)通量低的缺陷,在全基因組的范圍內(nèi)分析染色體互作位點。2009年馬薩諸塞大學(xué)的JobDekker研究團隊首次提出Hi-C的概念。它以整個細(xì)胞核為研究對象,運用分子標(biāo)記與新一代測序(NGS)技術(shù),研究整個染色質(zhì)中DNA在空間位置上的關(guān)系,通過對染色質(zhì)內(nèi)全部DNA的全部相互作用模式進行捕獲,來獲得高分辨率的染色質(zhì)三維結(jié)構(gòu)信息。Hi-C主要包括以下步驟:6堿基或4堿基內(nèi)切酶酶切固定后的染色體;內(nèi)切酶切口補平、生物素標(biāo)記;鄰近染色體末端連接;未連接的染色體末端去生物素;DNA純化以及超聲波打斷;鏈霉親和素磁珠特異性分離純化DNA;DNA片段末端修補以及測序接頭連接;高通量測序分析。JobDekker等人利用Hi-C技術(shù)測量了人淋巴細(xì)胞染色體中基因座空間交互信息。隨后,科學(xué)家們利用Hi-C技術(shù)構(gòu)建了果蠅、人及小鼠胚胎干細(xì)胞等數(shù)個高分辨率三維基因組互作圖譜。2014年,來自Baylor醫(yī)學(xué)院、Rice大學(xué)、Broad研究所和哈佛大學(xué)的科學(xué)家們利用Hi-C技術(shù)繪制了人基因組空前詳細(xì)的圖譜,展示了2米長的人類基因組在細(xì)胞核內(nèi)的不同折疊方式。研究顯示,和我們長期以來的想象不同,細(xì)胞可以將基因組折疊成各種不同的形態(tài),進而調(diào)節(jié)自身的功能。自Hi-C技術(shù)提出以來,已經(jīng)有了很大的應(yīng)用,但是其自身存在較多缺陷,其中包括:1)成本高,需要生物素標(biāo)記以及鏈霉親和素磁珠選擇吸附,花費很大,不是一般實驗室所能承受的;2)噪音大,鏈霉親和素磁珠會吸附很多雜質(zhì)DNA片段,導(dǎo)致測序結(jié)果有用數(shù)據(jù)過低;3)試驗過程繁瑣,周期長,成功率低,往往要經(jīng)過幾次試驗才能得到可用的試驗結(jié)果;4)不能對文庫進行質(zhì)量檢測,只有測序結(jié)果出來后才能對文庫的質(zhì)量進行分析,實驗風(fēng)險性很大;5)分析難度大,要從海量的數(shù)據(jù)中去除噪音,對生物信息學(xué)分析造成的很大的難度。技術(shù)實現(xiàn)要素:本發(fā)明的目的提供了一種DLOHi-C(Digestion-Ligation-OnlyHi-C)染色體構(gòu)象捕獲方法,該方法采用同時酶切酶連(Simultaneousligationanddigestion)的方式,用高濃度內(nèi)切酶以及T7DNA連接酶將一個帶有MmeI酶切位點的20bp接頭(Linker)連接在了染色體內(nèi)切酶切口的黏性末端上,并采用高速離心的方法去除多余的接頭,然后對連有接頭的染色體片段進行T4DNA酶鄰近酶連、超濾管濃縮、蛋白酶K消化、酚仿抽提,得到純化后的DLOHi-C總DNA(TotalDNAofDLOHi-C),再用MmeI內(nèi)切酶將DLOHi-C總DNA進行酶切消化,并用非變性Page膠回收釋放出82bp左右的DLOHi-C片段(DLOHi-CDNAfragment),連上illumina高通量測序接頭,PCR擴增,最終得到了DLOHi-Clibrary。本發(fā)明只需要簡單的酶切酶連就能獲取質(zhì)量遠(yuǎn)高于傳統(tǒng)Hi-C的數(shù)據(jù)。為實現(xiàn)上述目的,本發(fā)明提供的一種DLOHi-C染色體構(gòu)象捕獲方法,包括以下步驟:1)將目的細(xì)胞離心,然后用EGS(ethyleneglycolbis(succinimidylsuccinate))和甲醛水溶液對目的細(xì)胞進行雙交聯(lián),終止交聯(lián)反應(yīng),離心分離溶解得到兩管細(xì)胞;2)分別對步驟1)得到兩管細(xì)胞進行裂解,提取得到基因組-蛋白復(fù)合物A和基因組-蛋白復(fù)合物B;3)選取一種限制性內(nèi)切酶分別對兩管基因組-蛋白復(fù)合物A和基因組-蛋白復(fù)合物B進行酶切消化,得到酶切產(chǎn)物A和酶切產(chǎn)物B;4)將酶切產(chǎn)物A和酶切產(chǎn)物B與對應(yīng)的雙鏈核苷酸序列LinkerA和雙鏈核苷酸序列LinkerB連接,將LinkerA和LinkerB分別連到酶切產(chǎn)物A和酶切產(chǎn)物B的-內(nèi)切酶粘性末端上;離心分離得到酶連產(chǎn)物A和酶連產(chǎn)物B;其中,雙鏈核苷酸序列LinkerA和雙鏈核苷酸序列LinkerB上均含有內(nèi)切酶酶切位點,且內(nèi)切酶酶切位點的識別位點和切割位點不在同一位點上;該步驟的關(guān)鍵為連接采用的是NEBT7DNAligase,該連接酶只能連接粘性末端,不能連平末端,因此避免了Linker之間的平末端自連;以HindIII染色體酶切產(chǎn)物為例,對應(yīng)的Linker上只有HindIII的粘性末端,連在染色體切口上后會滅掉HindIII的酶切位點,不會再被HindIII切開,而若發(fā)生染色體切口末端自連,連接形成的HindIII位點會再次被切開,采用同時酶切酶連的方法可以大大的提高連接效率且不會有Linker之間的自連。5)將酶連產(chǎn)物A和酶連產(chǎn)物B離心沉淀混合懸浮于ddH2O中,來回吹打溶解,得到DNA-蛋白復(fù)合物;6)向DNA-蛋白復(fù)合物中加入T4DNAligasebuffer、TritonX-100、低熔點瓊脂糖和T4DNA連接酶,待管內(nèi)瓊脂糖凝固后酶連反應(yīng)8~10h,酶連反應(yīng)結(jié)束后,將離心管置于水浴鍋中將低熔點瓊脂糖融化,再加入瓊脂糖酶消化瓊脂糖;濃縮至1ml,再加入SDS水溶液和蛋白酶K消化蛋白解交聯(lián),消化結(jié)束后酚仿抽提DNA,將提取的DNA溶于ddH2O中,測定濃度,得到的DNA即為DLOHi-C總DNA;7)將DLOHi-C總DNA用識別位點和切割位點不在同一位點的內(nèi)切酶進行酶切;酶切反應(yīng)結(jié)束后,點樣于非變性Page膠中跑膠分離酶切釋放出來長度為70~90bp的DLOHi-CDNAfragment;跑膠結(jié)束后用gel-red染色,并在紫外下切膠回收長度為70~90bp的DLOHi-CDNAfragment;8)在DLOHi-CDNAfragment片段上連接高通量測序的測序接頭,得到DLOHi-CPCR模板;9)以DLOHi-CPCR為模板設(shè)計illumina測序引物對,擴增回收即得到DLOHi-Clibrary;10)將DLOHi-Clibrary進行高通量測序,分析目的細(xì)胞中基因組的三維結(jié)果。進一步地,所述步驟1)中,甲醛水溶液的質(zhì)量分?jǐn)?shù)為1~3%,所述終止劑為甘氨酸,所述溶解所用的溶劑為1×的NEBuffer2.1,兩管細(xì)胞的細(xì)胞數(shù)目均為3×106~8×106個。再進一步地,所述步驟2)中,加入終濃度為1%的SDS,室溫裂解細(xì)胞及細(xì)胞核20min,待溶液變粘稠后,加入1×NEBuffer2.1致終體積為500μl,混合均勻,再加入終濃度為2%的TritonX-100中和SDS;再進一步地,所述步驟3)中,限制性內(nèi)切酶為NotI、HindIII、BgII、ClaI、NheI、NdeI、MspI、MboI、XbaI中任意一種;酶切體系為:基因組-蛋白復(fù)合物A或基因組-蛋白復(fù)合物B100-200μl酶切Buffer50μl限制性內(nèi)切酶(NEB100U/μl)15μl水補充至500μl酶切條件為,震蕩酶切6-8h。再進一步地,所述步驟4)中,所述雙鏈核苷酸序列LinkerA和雙鏈核苷酸序列LinkerB上均含有內(nèi)切酶酶切位點為MmeI、Ecop15i、BseRI、BpuEI、BpmI、BsgI、EciI、NmeAIII中任意一種。再進一步地,所述步驟4)中,所述雙鏈核苷酸序列LinkerA和雙鏈核苷酸序列LinkerB如下所述:酶連體系如下:酶切產(chǎn)物A/酶切產(chǎn)物B500μl酶切Buffer50μlDTT(1M)1.5μlATP(100mM)10μl限制性內(nèi)切酶(NEB100U/μl)10μlT7DNA連接酶5μlLinkerA/LinkerB(800ng/μl)200μlddH2O補充至1ml合計1ml酶連反應(yīng)如下:20℃連接1.5h。再進一步地,所述步驟6)中,酶連體系如下:DNA-蛋白復(fù)合物555μlT4DNAligasebuffer1.2mlTritonX-100(質(zhì)量分?jǐn)?shù)為20%)600μl低熔點瓊脂糖(質(zhì)量分?jǐn)?shù)為2%)4-5mlT4DNA連接酶(thermo2U/μl)200μlddH2O補水至12ml合計12ml將上述含有酶切體系的離心管置于冰上20ml,待管內(nèi)瓊脂糖凝固后,將離心管置于20℃酶連反應(yīng)8-10h。再進一步地,所述步驟8)中,高通量測序的測序片段命名為Illuminasequenceadapter,其序列為:PE-adapter1ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNTGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAPE-adapter2GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNCTAGCCTTCTCGTGTGCAGACTTGAGGTCAGTG連接體系如下:置于16℃酶連反應(yīng)2~3h。本發(fā)與傳統(tǒng)Hi-C方法相比,有益效果在于:1)本發(fā)明的方法使用EGS和甲醛水溶液,避免了后期實驗過程中解交聯(lián)的發(fā)生;2)本發(fā)明不需要生物素標(biāo)記,很大程度上節(jié)約了成本;3)本發(fā)明用時短,只需要進行簡單的酶切酶連步驟,文庫只需要2天半時間就可以構(gòu)建完成;4)本發(fā)明數(shù)據(jù)噪音更小,用page膠通過片段大小選擇回收DLOHi-C片段,測序所得數(shù)據(jù)基本上都是有效數(shù)據(jù),并且離心去除多余的Linker的同時,也去除了未結(jié)合蛋白的基因組碎片,降低了小片段自環(huán)化產(chǎn)生的噪音;5)本發(fā)明能夠進行文庫質(zhì)量檢測,將連有LinkerA和LinkerB的兩份樣品混合,再進行T4DNA連接酶鄰近酶連,能夠根據(jù)LinkerA和LinkerB的連接情況來判斷文庫質(zhì)量;6)本發(fā)明分析簡單,根據(jù)Linker的序列信息,大大的降低了噪音去除,數(shù)據(jù)提取以及后期分析的難度。附圖說明圖1為DLOHi-C文庫構(gòu)建流程圖;圖2為跑膠鑒定HindIII片段化染色體效率圖;圖3為利用同時酶切酶連的方式連接MmeILinker的示意圖;圖4為跑膠鑒定Linker連接效率;圖5為跑膠鑒定染色體末端鄰近連接效率;圖6為切膠回收80bpDLOHi-CDNAfragment的跑膠圖;圖7為DLOHi-Clibrary的PCR擴增圖8為DLOHi-Clibrary的質(zhì)量控制圖;圖9為雙酶切鑒定文庫質(zhì)量圖;圖10為DLOHi-C數(shù)據(jù)分析流程圖;圖11為HindIII酶切包含4種Linker有效片段圖;圖12為4種Hi-C方法得到K562的熱圖,圖中,圖12A為DLOHi-C得到交互熱圖、圖12B為傳統(tǒng)的Hi-C方法的交互熱圖、圖12C為DNaseHi-C得到的交互熱圖、圖12D為InsituHi-C得到的交互熱圖;圖13為由四種Hi-C方法捕獲的K562交互之間的皮爾遜相關(guān)系數(shù)圖。具體實施方式為了更好地解釋本發(fā)明,以下結(jié)合具體實施例進一步闡明本發(fā)明的主要內(nèi)容,但本發(fā)明的內(nèi)容不僅僅局限于以下實施例。一DLOHi-C染色體構(gòu)象捕獲方法如圖1示:DLOHi-C染色體構(gòu)象捕獲方法,首先用限制性內(nèi)切酶將染色體酶切消化后,本方法創(chuàng)新性的采用同時酶切酶連(Simultaneousligationanddigestion)的方式,用高濃度內(nèi)切酶以及T7DNA連接酶將一個帶有MmeI酶切位點的20bp接頭(Linker)連接在了染色體內(nèi)切酶切口的黏性末端上,并采用高速離心的方法去除多余的接頭,然后對連有接頭的染色體片段進行T4DNA酶鄰近酶連、超濾管濃縮、蛋白酶K消化、酚仿抽提,得到純化后的DLOHi-C總DNA(TotalDNAofDLOHi-C),再用MmeI內(nèi)切酶將DLOHi-C總DNA進行酶切消化,并用非變性Page膠回收釋放出82bp左右的DLOHi-C片段(DLOHi-CDNAfragment),連上illumina高通量測序接頭,PCR擴增,最終得到了DLOHi-Clibrary。在該方法中,我們對限制性內(nèi)切酶以6堿基限制性內(nèi)切酶HindIII為例進行說明,對后面的酶切接頭以MmeI限制性內(nèi)切酶為例進行說明。具體方法如下:1)將細(xì)胞離心,用1.5mMEGS和1%的甲醛進行雙交聯(lián);2)加入2M的甘氨酸,終濃度為200mM,室溫旋轉(zhuǎn)10min,終止交聯(lián)反應(yīng);3)3000×G離心收集細(xì)胞,用1×的NEBbuffer2.1洗滌一遍后,再離心重懸細(xì)胞于1×的buffer2.1中,按照50μl/管分裝細(xì)胞,每管細(xì)胞數(shù)約為5×106個;4)取A、B兩管細(xì)胞,分別加入終濃度為1%的SDS,室溫裂解細(xì)胞及細(xì)胞核20min,置于62℃水浴鍋水浴5min,待溶液變粘稠后,加入1.2×NEBbuffer2.1致終體積為500μl,混合均勻,再加入TritonX-100至終濃度為2%;5)分別加入15μl高濃度HindIII(NEB100U/μl),用槍頭混合均勻,置于震蕩器中震蕩酶切6-8h。酶切結(jié)束后兩管各取10μl的酶切產(chǎn)物,蛋白酶K消化后提DNA跑膠鑒定酶切效果;如下圖2顯示,在沒有加HindIII的樣品中,DNA富集在序列較長的區(qū)段;在加HindIII的樣品中,成功的染色體酶切產(chǎn)物DNA分布在序列長度很廣泛的區(qū)域。如圖2顯示:確定DNA酶切徹底后,加入DTT、ATP、HindIII內(nèi)切酶和T7DNA連接酶,采用同時酶切酶連的方法將LinkerA和LinkerB分別連到A,B兩管的基因組HindIII切口上如圖3所示;7)同時酶切酶連結(jié)束后,A和B兩管各取20μl蛋白酶K消化后提取基因組跑膠鑒定Linker連接效率,若Linker連接成功,則會出現(xiàn)如下圖4右邊的彌散條帶,左邊是沒有加入Linker的同時酶切酶連對照組。8)將A和B兩管同時酶切酶連產(chǎn)物置于離心機中高速離心1.5h,小心的用槍頭吸走上清,留沉淀(上清為多余的Linker,沉淀為染色體DNA-蛋白復(fù)合物),再加入1mlPBS,蓋上管蓋,上下輕柔顛倒?jié)櫹磶状?,再次置于離心機中高速離心1.5h,用槍頭小心吸走上清,留沉淀。9)將A,B兩管沉淀混合懸浮于500μl的ddH2O中,加入55μl10%SDS(SDS終濃度為1%),用200μl槍頭來回吹打溶解沉淀(SDS能斷裂蛋白質(zhì)分子之間的氫鍵,促進聚集的沉淀溶解)。10)將555μl的SDS溶解的DNA-蛋白復(fù)合物置于15ml離心管中,加入T4DNAligasebuffer,終濃度為1%的TritonX-100,終濃度為0.5%的低熔點瓊脂糖,T4DNA連接酶,最后補ddH2O致終體積為12ml,上下顛倒混勻,再將離心管置于冰上20ml,待管內(nèi)瓊脂糖凝固后,將離心管置于20℃酶連反應(yīng)8-10h,成功的酶連產(chǎn)物DNA大小分別如圖5所示;11)酶連反應(yīng)結(jié)束后,將離心管置于65℃水浴鍋中,待低熔點瓊脂糖融化后,加入20μl的瓊脂糖酶(Takara),置于65℃2h消化瓊脂糖。12)消化結(jié)束后將10ml的消化產(chǎn)物置于50kd超濾管(外管為50ml)離心濃縮至終體積為1ml左右,加入9mlddH2O稀釋,再次濃縮至1ml終體積。13)將濃縮產(chǎn)物置于2ml離心管中,加入濃度為10%的SDS至終濃度為1%,再加入蛋白酶K于60℃3h消化蛋白解交聯(lián),消化結(jié)束后酚仿抽提DNA,將提取的DNA溶于200μl的ddH2O中,測定濃度,得到的DNA即為DLOHi-C總DNA。14)將回收的DLOHi-C總DNA用MmeI進行酶切;15)酶切反應(yīng)結(jié)束后,向酶切產(chǎn)物中加入20μl的甘油,點樣于非變性page膠中跑膠分離酶切釋放出來80bp左右的DLOHi-CDNAfragment;16)跑膠結(jié)束后用gel-red染色,并在紫外下切膠回收80bp左右的DLOHi-CDNAfragment,如圖6所示。其中,page膠回收步驟為:a.在紫外燈下用手術(shù)刀切割大小在80bp左右的DNA條帶;b.先用直徑為21-G的針頭將0.6ml離心管管底戳一個洞,然后將切下的page膠置于0.6ml離心管中,再將1.5ml的離心管套在0.6ml的離心管外;c.將1.5ml離心管置于離心機中,14000r/min離心15min,在離心力的作用下,凝膠會通過0.6ml離心管底部的針孔,從而將凝膠擠壓成碎末并聚集在1.5ml離心管管底;d.移去0.6ml的離心管,向1.5ml離心管中加入500ml的TEbuffer,置于-80℃冷凍1h后再置于37℃震蕩3h,凝膠內(nèi)的DNA分子會析出并溶解于TEbuffer中;e.將混有凝膠碎末的TEbuffer置于2.0mlSpin-Xtubefilter(CostarCat#8160)中,14000r/min離心15min,將過濾得到的TE溶液轉(zhuǎn)移到新的2ml的離心管中;f.加入醋酸鈉和助沉淀劑,用酒精從TEbuffer中沉淀出DLOHi-CDNAfragment并溶于40μlddH2O中。17)連接IlluminasequenceadapterPE-adapter1ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNTGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAPE-adapter2GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNCTAGCCTTCTCGTGTGCAGACTTGAGGTCAGTG連接體系如下置于16℃酶連反應(yīng)2h。18)用1.8倍體積的AMPureXPbeads根據(jù)片段大小選擇性回收連有Illuminasequenceadapter的DLOHi-CDNAfragment并去除多余的Illuminasequenceadaper,其具體步驟如下:a.渦旋震蕩混勻AMPureXPbeads,吸取80μlAMPureXPbeads至50μl連接產(chǎn)物中,使用移液器輕輕吹打10次充分混勻,室溫孵育5min。b.將EP管置于磁力架中分離磁珠和液體,待溶液澄清后(約5min),小心移除上清。c.保持EP管始終處于磁力架中,加入200μl新鮮配制的80%乙醇漂洗磁珠。室溫孵育30秒,再置于磁力架中小心移除上清。d.重復(fù)上一步。e.保持EP管始終處于磁力架中,開蓋空氣干燥磁珠10min。f.將EP管從磁力架中取出,加入40μl滅菌超純水進行DNA洗脫。渦旋振蕩或使用移液器輕輕吹打充分混勻。將反應(yīng)管置于磁力架中分離磁珠和液體。待溶液澄清后(大約5min),小心吸取上清至一個新的滅菌EP管中。最后得到的40μl洗脫液即為連有Illuminasequenceadapter的DLOHi-CDNAfragment。19)用修復(fù)混合液(NEB)修補DNA損傷及連接Illuminasequenceadapter所造成的切口。將修復(fù)反應(yīng)體系置于37℃反應(yīng)20min后再置于室溫反應(yīng)1h,最后得到的50μl體系即為DLOHi-CPCR模板;20)取5-10μlDLOHi-CPCR模板用Illumina測序引物和高保真聚合酶進行PCR擴增。引物序列如下:UniversalPCRPrimerforIllumina5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’Index1PrimerforIllumina5’-CAAGCAGAAGACGGCATACGAGAT(index)GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-3’擴增循環(huán)數(shù)控制在15循以下,最后擴增得到的產(chǎn)物即為DLOHi-Clibrary,成功的DLOHi-Clibrary擴增產(chǎn)物見圖7,用1.4倍體積的AMPureXPbeads從PCR產(chǎn)物中回收DLOHi-Clibrary(回收步驟見18步)。如圖8所示,在第10步進行染色體末端鄰近連接時,若發(fā)生了有效的分子內(nèi)連接,則Linker間的LinkerA-LinkerA或者LinkerB-LinkerB連接占絕大部分比例;若發(fā)生了隨機連接,則LinkerA、LinkerB之間的連接比例是隨機沒有規(guī)律的,因此可以根據(jù)DLOHi-Clibrary中LinkerA-LinkerA或者LinkerB-LinkerB占的比例來判斷文庫的質(zhì)量。我們在對Linker進行設(shè)計時,若發(fā)生LinkerA-LinkerA連接,則在序列的正中間形成一個ClaI的酶切位點,若發(fā)生LinkerB-LinkerB連接,則會在序列正中間形成一個HindIII的酶切位點,若發(fā)生的是Linker(B-A)或者Linker(A-B)隨機連接,不會形成任何酶切位點,因此我們用ClaI和HindIII對DLOHi-Clibrary進行雙酶切,如圖9所示,就可以簡單方便的判斷我們的文庫質(zhì)量。二DLOHi-C數(shù)據(jù)分析1、DLOHi-C數(shù)據(jù)分析流程1.1接頭過濾上述DLOHi-Clibrary有效片段長度在78-82bp之間,MmeI的酶切長度在19-21bp。如圖11所示,目標(biāo)DNA序列位于Linker兩側(cè),長度為19-21bp。全長Linker為40bp,將原始序列和Linker進行比對,找出當(dāng)中至少有34個堿基和Linker序列比對上的候選序列,然后根據(jù)比對上的Linker的種類,將序列分為AA,BB,AB和BA4種類型。1.2序列比對在候選的4類序列中,根據(jù)Linker的位置信息產(chǎn)生序列左右兩端對應(yīng)的序列。在此為了提高比對效率,補全上圖中Linker兩端對應(yīng)酶切位點(紫色標(biāo)示)。例如上圖中所使用的酶是HindIII,在此步驟中左端序列AAGCT的末端加上堿基T,右端序列AGCTT的前端加上堿基A。然后用BWA對雙端序列分別和參考基因組比對,所使用的參數(shù)是-n0,進一步根據(jù)MAPQ值大于等于20篩選出唯一比對的序列,之后用BEDtools將雙端都唯一比對的序列合并成bedpe格式文件。1.3去冗余在上述處理后得到的交互片段中可能包含由PCR產(chǎn)生的交互序列,這種交互不是真正捕獲到的交互,在分析的過程中需要將這部分的序列過濾掉。我們將雙端序列都比對到相同位置的片段認(rèn)為是PCR擴增的過程產(chǎn)生的,僅保留一個比對到相同位置的序列用于后續(xù)分析。1.4去噪該過程去除的噪音是片段在酶切之后,單個片段兩端都為粘性末端,雙端接上接頭之后自連接形成環(huán),經(jīng)過MmeI酶切之后形成的線性DNA片段。此部分包含以下三個步驟:1.4.1標(biāo)記參考基因組所對應(yīng)的HindIII酶切片段的位置信息1.4.2比較序列雙端所對應(yīng)的酶切片段序列號1.4.3如果雙端的序列都位于同一個相同的酶切片段上,將此類序列歸類為自連接。去掉這部分序列,將剩余的序列進一步處理。1.5歸一化處理由于GC含量、酶的偏好性、可比對性等信息對于酶切后獲得的交互信息有一定的影響,所以我們要對交互數(shù)據(jù)進行歸一化處理。我們將得到的交互的信息按照基因組劃分合適的bins,將片段之間的交互轉(zhuǎn)化為bin之間的交互,進而轉(zhuǎn)化成相應(yīng)的交互矩陣。然后采用hiclib(Imakaevetal.,2012)中迭代矯正的方法對得到的交互矩陣進行不同分辨率的矯正。2K562細(xì)胞通過DLOHi-C技術(shù)捕獲的交互作用2.1K562細(xì)胞的DLOHi-C數(shù)據(jù)統(tǒng)計對K562細(xì)胞的測序數(shù)據(jù)進行統(tǒng)計,統(tǒng)計結(jié)果見下表。本次數(shù)據(jù)為雙端測序,長度為150bp,考慮到一端的序列已經(jīng)包含了我們所有的信息,并且左端的測序質(zhì)量優(yōu)于右端。我們在此選取左端的序列進行后續(xù)分析。篩選出比對分值大于等于34的Linker序列的比例為78.1%(197,562,663/252,981,479),即Linker的連接效率為78.1%,其中不同Linker的比例為3%,那么隨機連接的噪音占相同Linker連接的比例為3%。截取有效序然后用BWA將序列比對到hg19,使用參數(shù)-n0。篩選出雙端都唯一比對的序列。唯一比對序列占總序列的60%。3和現(xiàn)有的Hi-C技術(shù)進行比較將DLOHi-C方法測得的K562細(xì)胞得到的交互信息和已發(fā)表的傳統(tǒng)Hi-C(Lieberman-Aidenetal.,2009),DNaseHi-C(Maetal.,2014)和insituHi-C(Raoetal.,2014)3種方法得到的K562的交互進行比較。從上表中可以看出,在得到的有效交互片段中,DLOHi-C方法得到的染色質(zhì)內(nèi)部的交互最多,并且在近距離和遠(yuǎn)距離的交互上,DLOHi-C主要捕獲的是遠(yuǎn)距離的交互,并且遠(yuǎn)距離交互比例高于其他三者。通過K562的熱圖看出,總體上4種方法得到的交互總體上具有相同的趨勢,線性距離越近交互越強,染色質(zhì)內(nèi)部交互強于染色質(zhì)之間的交互。另外分析了,4種方法解析K562細(xì)胞的一致性。從交互作用的熱圖中可以看出DLOHi-C和insituHi-C的皮爾遜相關(guān)系數(shù)最大,達(dá)到0.9334,DLOHi-C和DNaseHi-C的相關(guān)系數(shù)最小(圖12~13)。其它未詳細(xì)說明的部分均為現(xiàn)有技術(shù)。盡管上述實施例對本發(fā)明做出了詳盡的描述,但它僅僅是本發(fā)明一部分實施例,而不是全部實施例,人們還可以根據(jù)本實施例在不經(jīng)創(chuàng)造性前提下獲得其他實施例,這些實施例都屬于本發(fā)明保護范圍。當(dāng)前第1頁1 2 3