專利名稱:基于小波變換識別基因組核小體占位邊界的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物信息技術(shù)領(lǐng)域,是一種識別基因組核小體占位邊界的方法。該發(fā)明可以應(yīng)用于不同物種的核小體占位研究。
背景技術(shù):
核小體(nucleosome)是染色體的基本結(jié)構(gòu)單位,由大約146bp的DNA纏繞4種組蛋白(histone)組成的八聚體形成的。核小體的形成及其在染色質(zhì)上的精確定位,除了導致DNA在組蛋白上纏繞得足夠緊密以便于細胞核的包裝作用以外,還有其它作用包括:弓丨起染色質(zhì)結(jié)構(gòu)不均,表現(xiàn)為染色質(zhì)某些區(qū)域核小體占據(jù)率高,某些區(qū)域核小體缺乏;影響其它的表觀現(xiàn)象的發(fā)生,比如各種組蛋白修飾、DNA甲基化,進一步為相關(guān)調(diào)控蛋白提供其在組蛋白上的附著位點,改變?nèi)旧|(zhì)結(jié)構(gòu)和活性。所以說核小體在基因組上的組裝方式及其定位機制的研究,對于理解轉(zhuǎn)錄因子結(jié)合和轉(zhuǎn)錄調(diào)控機制等多種生物學過程具有十分重要的作用。核小體定位是一個復雜的過程,它涉及DNA、轉(zhuǎn)錄因子、組蛋白修飾酶和染色質(zhì)重塑復合體等分子間相互作用。目前,大部分研究認為,基因組核小體定位受兩種機制調(diào)控:染色質(zhì)重塑的調(diào)控及DNA序列本身的影響。Kaplan等人通過體外核小體結(jié)合實驗,發(fā)現(xiàn)核小體定位的明顯具有GC偏好性即高GC區(qū)核小體富集,低GC區(qū)核小體匱乏。通過我們前期研究發(fā)現(xiàn),基因組中的核小體分別水平并不是均衡的,表現(xiàn)為一些區(qū)域富集,一些區(qū)域稀疏。同時,核小體富集區(qū)具有多種特征,比如說GC高、DNA甲基化水平低、轉(zhuǎn)錄水平活躍、管家基因聚集等。而核小體稀疏區(qū)域表現(xiàn)相反的特征。如果能夠根據(jù)核小體占位水平,界定出相應(yīng)的基因組區(qū)域,進而從基因組區(qū)域分析轉(zhuǎn)錄調(diào)控,為研究基因轉(zhuǎn)錄調(diào)控機制提供另一種思路。
發(fā)明內(nèi)容
基因組中的核小體定位并不是隨機的,受多種因素控制,比如:DNA、轉(zhuǎn)錄因子、組蛋白修飾酶、染色質(zhì)重塑復合體等等?;蚪M通過核小體不同的分布水平來調(diào)節(jié)基因的表達,所以研究基因組水平的染色體定位規(guī)律對研究基因表達調(diào)控機制有重要的意義。本研究通過Chip-Seq方法獲得全基因組核小體組蛋白H3分布數(shù)據(jù)。結(jié)合NCBI上公開發(fā)表的全基因組注釋信息,把測序獲得的組蛋白H3Tag定位到基因組上。采用小波變換法對全基因組核小體分布數(shù)據(jù)進行分析,最終將基因組按不同的核小體分布水平分成大小不同的區(qū)域,結(jié)果如圖1所示。進一步對區(qū)域內(nèi)其它生物學特征做統(tǒng)計分析,比如:基因類型、GC含量、DNA甲基化,發(fā)現(xiàn)這些因素在不同區(qū)域存在顯著差別。這一結(jié)果驗證了通過小波變換法劃分的基因組區(qū)域具有一定的生物學意義。
圖1是小鼠I號染色體上小波變換法獲得的基因組區(qū)域
具體實施例方式1.Chip-Seq 實驗準備a)組織提取b)主要試劑與儀器Trizol,IObp DNA Ladder,pUC18DNA/Mspl 購于 TIANGEN,pGEM-T 載體、T4 連接酶,One Shot ToplOCompetent Cell 購于 Promega。其他常見試劑如氯仿(Chloroform)等2.上機實驗利用新一代DNA測序平臺SOLiD進行Chip-Seq實驗3.數(shù)據(jù)分析a) SOLiD序列在基因組上的注釋b)小波變換法識別基因組區(qū)域I)首先把基因組劃分成若干個等長的片段,統(tǒng)計每個片段內(nèi)的H3測序tag數(shù)2)對核小體分布數(shù)據(jù)采用離散小波變換法,具體步驟:stepl:采用‘dbl’小波基分解數(shù)據(jù)信息st印2:提取近似、細節(jié)信號St印3:重構(gòu)信號St印4:圖形顯示識別的區(qū)域3)對區(qū)域內(nèi)其它生物學特征做統(tǒng)計分析,比如:基因類型、GC含量、DNA甲基化實駘實例取小鼠大腦組織,用DNA測序平臺SOLID做組蛋白H3Chip-Seq。把小鼠基因組區(qū)域分成IOOkbp長短的小片段,計算每個區(qū)域內(nèi)的tag數(shù),獲得全基因組H3分布的序列數(shù)據(jù)。進一步用離散小波變換法識別出50個不同核小體分布水平的基因組區(qū)域,最后通過對區(qū)域內(nèi)其它生物學特征做統(tǒng)計分析,驗證了這種區(qū)分基因組區(qū)域的方法具有生物學意義。以上是對本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實施方式,均在本發(fā)明的保護范圍之中。
權(quán)利要求
1.一種小波變換法智能識別基因組區(qū)域的模型,其特征在于,用小波分析法,根據(jù)基因組中核小體分布水平將基因組劃分成具備不同生物學意義的區(qū)域。
全文摘要
本發(fā)明旨在提供一種計算機智能識別基因組區(qū)域的模型。該模型根據(jù)基因組核小體分布水平采用小波變換法把基因組劃分成大小不同的區(qū)域。基因組中的核小體定位并不是隨機的,存在一定的特征?;蚪M通過核小體不同的分布水平來調(diào)節(jié)基因的表達,所以研究基因組水平的染色體定位規(guī)律對研究基因表達調(diào)控機制有重要的意義。本發(fā)明通過構(gòu)建小波變換識別模型,最終將小鼠基因組劃分成50個區(qū)域,進一步做統(tǒng)計分析證實這種識別方法具有生物學意義。
文檔編號G06F19/18GK103177196SQ20111043560
公開日2013年6月26日 申請日期2011年12月22日 優(yōu)先權(quán)日2011年12月22日
發(fā)明者曾華宗 申請人:上海聚類生物科技有限公司