欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)的制作方法

文檔序號(hào):10655790閱讀:382來源:國(guó)知局
一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)的制作方法
【專利摘要】本發(fā)明提供了一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),包括變異基因測(cè)序檢測(cè)模塊,用于完成對(duì)測(cè)序數(shù)據(jù)的基礎(chǔ)分析;功能富集分析模塊,用于利用功能富集分析工具分析變異基因功能;功能網(wǎng)絡(luò)構(gòu)建模塊,用于根據(jù)功能富集分析結(jié)果構(gòu)建功能網(wǎng)絡(luò);功能網(wǎng)絡(luò)挖掘模塊,用于從功能網(wǎng)絡(luò)中篩選出穩(wěn)定的網(wǎng)絡(luò)模塊;共享分子網(wǎng)絡(luò)識(shí)別模塊,用于根據(jù)網(wǎng)絡(luò)模塊識(shí)別不同疾病共享的分子模塊。本發(fā)明通過剖析不同疾病間基因組水平上的差異,從分子功能角度建立疾病間的關(guān)聯(lián)關(guān)系,可以更加系統(tǒng)地識(shí)別不同疾病間共享的分子功能模塊,有效的分析相似表型疾病的致病機(jī)理,從基因組層面揭示疾病間的差異,增加對(duì)疾病的全面理解,有助于臨床診斷和治療。
【專利說明】
一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于生物信息技術(shù)領(lǐng)域,尤其是涉及一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)?!颈尘凹夹g(shù)】
[0002]由于許多疾病在致病機(jī)理和臨床表征上都具有高度相似性,這種相似性不僅有助于研究某類疾病的共同致病機(jī)制,同時(shí)也在某種程度上增加了疾病診斷和治療過程中的難度,易造成誤診,從而延誤病情的治療。相似臨床表征不僅僅存在于不同疾病之間,也可能體現(xiàn)在相同疾病的不同亞型之間,因此,對(duì)于這種臨床表征相似、易造成混淆診斷的疾病或疾病亞型的聯(lián)合研究,將成為克服上述困難的有效方法。
[0003]近些年來,隨著測(cè)序技術(shù)的不斷發(fā)展和價(jià)格下降,使得疾病的診斷和治療已經(jīng)進(jìn)入了一個(gè)嶄新的時(shí)期,尤其是具有較全面基因組覆蓋度的全基因組測(cè)序技術(shù)和高測(cè)序深度的外顯子捕獲技術(shù),作為輔助臨床檢驗(yàn)的新技術(shù)手段,逐漸贏得廣泛關(guān)注。同時(shí),DNA測(cè)序技術(shù)誕生也為個(gè)性化精準(zhǔn)醫(yī)療提供了可能,使得臨床治療過程中可以有針對(duì)性地選擇藥物、 治療方式以及預(yù)防措施。
[0004]然而,先前研究往往針對(duì)單一疾病,刻畫其基因組變異情況,忽略了疾病間可能存在的潛在聯(lián)系,而基于功能網(wǎng)絡(luò)的方法,可以更加系統(tǒng)地識(shí)別不同疾病間共享的分子功能模塊,有效的分析相似表型疾病的致病機(jī)理。因此,整合測(cè)序技術(shù)和功能網(wǎng)絡(luò)分析,將從基因組層面揭示疾病間的差異,增加對(duì)疾病的全面理解,有助于臨床診斷和治療。
【發(fā)明內(nèi)容】

[0005]有鑒于此,本發(fā)明旨在提出一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),剖析不同疾病間基因組水平上的差異,同時(shí)從分子功能角度建立疾病間的關(guān)聯(lián)關(guān)系。[〇〇〇6]為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0007]—種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),包括依次相連接的
[0008]變異基因測(cè)序檢測(cè)模塊,用于完成對(duì)測(cè)序數(shù)據(jù)的基礎(chǔ)分析;
[0009]功能富集分析模塊,用于利用功能富集分析工具分析變異基因功能;
[0010]功能網(wǎng)絡(luò)構(gòu)建模塊,用于根據(jù)功能富集分析結(jié)果,構(gòu)建功能網(wǎng)絡(luò);[〇〇11]功能網(wǎng)絡(luò)挖掘模塊,用于從功能網(wǎng)絡(luò)中篩選出穩(wěn)定的網(wǎng)絡(luò)模塊;
[0012]共享分子網(wǎng)絡(luò)識(shí)別模塊,用于根據(jù)網(wǎng)絡(luò)模塊識(shí)別不同疾病共享的分子模塊,挖掘疾病間潛在的共同致病機(jī)理。
[0013]進(jìn)一步的,所述變異基因測(cè)序檢測(cè)模塊完成對(duì)測(cè)序數(shù)據(jù)的樣本信息統(tǒng)計(jì)、基因組變異位點(diǎn)(或變異基因)的樣本信息統(tǒng)計(jì),以及變異的樣本聚類和樣本間相似性等基礎(chǔ)分析,包括位點(diǎn)變異矩陣生成模塊、基因變異矩陣生成模塊、基因提取模塊。
[0014]進(jìn)一步的,所述功能富集分析工具包括DAVID。
[0015]進(jìn)一步的,所述功能網(wǎng)絡(luò)構(gòu)建模塊包括功能注釋模塊、功能富集模塊、網(wǎng)絡(luò)構(gòu)建模塊。
[0016]進(jìn)一步,所述功能網(wǎng)絡(luò)挖掘模塊包括最大網(wǎng)絡(luò)子圖獲取模塊、篩選模塊。
[0017]進(jìn)一步的,所述共享分子網(wǎng)絡(luò)識(shí)別模塊包括超幾何富集分析模塊、閾值分析模塊、 識(shí)別t吳塊。
[0018]相對(duì)于現(xiàn)有技術(shù),本發(fā)明所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)具有以下優(yōu)勢(shì):本發(fā)明通過剖析不同疾病間基因組水平上的差異,從分子功能角度建立疾病間的關(guān)聯(lián)關(guān)系,可以更加系統(tǒng)地識(shí)別不同疾病間共享的分子功能模塊,有效的分析相似表型疾病的致病機(jī)理,從基因組層面揭示疾病間的差異,增加對(duì)疾病的全面理解,有助于臨床診斷和治療?!靖綀D說明】
[0019]構(gòu)成本發(fā)明的一部分的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0020]圖1為本發(fā)明實(shí)施例所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)的結(jié)構(gòu)示意圖;[0021 ]圖2為本發(fā)明實(shí)施例所述的樣本列表實(shí)例;
[0022]圖3為本發(fā)明實(shí)施例所述的不同疾病樣本變異位點(diǎn)和變異基因數(shù)目統(tǒng)計(jì)表;
[0023]圖4為本發(fā)明實(shí)施例所述變異位點(diǎn)矩陣;
[0024]圖5為本發(fā)明實(shí)施例所述基因變異矩陣文件;
[0025]圖6為本發(fā)明創(chuàng)造實(shí)施例所述的分子功能網(wǎng)絡(luò)模塊圖;
[0026]圖7為本發(fā)明創(chuàng)造實(shí)施例所述的疾病間共享分子網(wǎng)絡(luò)模塊圖?!揪唧w實(shí)施方式】
[0027]需要說明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可以相互組合。[〇〇28]在本發(fā)明的描述中,需要理解的是,術(shù)語“中心”、“縱向”、“橫向”、“上”、“下”、 “前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡(jiǎn)化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對(duì)本發(fā)明的限制。此外,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”等的特征可以明示或者隱含地包括一個(gè)或者更多個(gè)該特征。在本發(fā)明的描述中,除非另有說明,“多個(gè)” 的含義是兩個(gè)或兩個(gè)以上。[〇〇29]在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術(shù)語“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個(gè)元件內(nèi)部的連通。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以通過具體情況理解上述術(shù)語在本發(fā)明中的具體含義。
[0030]下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
[0031]如圖1所示,一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),包括依次相連接的變異基因測(cè)序檢測(cè)模塊、功能富集分析模塊、功能網(wǎng)絡(luò)構(gòu)建模塊、功能網(wǎng)絡(luò)挖掘模塊、共享分子網(wǎng)絡(luò)識(shí)別t吳塊;
[0032]變異基因測(cè)序檢測(cè)模塊,用于完成對(duì)測(cè)序數(shù)據(jù)的基礎(chǔ)分析;所述變異基因測(cè)序檢測(cè)模塊完成對(duì)測(cè)序數(shù)據(jù)的樣本信息統(tǒng)計(jì)、基因組變異位點(diǎn)(或變異基因)的樣本信息統(tǒng)計(jì), 以及變異的樣本聚類和樣本間相似性等基礎(chǔ)分析;首先讀取注釋后基因變異文件,統(tǒng)計(jì)不同疾病樣本變異位點(diǎn)和變異基因數(shù)目,通過位點(diǎn)變異矩陣生成模塊產(chǎn)生位點(diǎn)變異矩陣,得到基于變異位點(diǎn)的基因樣本聚類結(jié)果;其次,讀取位點(diǎn)變異矩陣,通過基因變異矩陣生成模塊產(chǎn)生基因變異矩陣,統(tǒng)計(jì)變異位點(diǎn)和變異基因在不同疾病樣本中出現(xiàn)的次數(shù);最后,讀取基因變異矩陣,通過基因提取模塊提取不同疾病樣本具有較高變異頻率的基因;
[0033]變異基因測(cè)序檢測(cè)模塊對(duì)應(yīng)的程序?yàn)?[〇〇34] snvStatistic.r:讀取注釋后基因變異文件(目前只使用于SNV或INDEL的檢測(cè)注釋結(jié)果),統(tǒng)計(jì)不同疾病樣本變異位點(diǎn)和變異基因數(shù)目;[0〇35] sampleCluster.r:讀取注釋后基因變異文件,產(chǎn)生位點(diǎn)變異矩陣(位點(diǎn)變異矩陣: 行為變異位點(diǎn),列為樣本,矩陣中數(shù)據(jù)值為變異位點(diǎn)在對(duì)應(yīng)樣本中的變異頻率);
[0036]sampleClusterAnalysis ? r:讀取sampleCluster.r產(chǎn)生的變異矩陣,產(chǎn)生基因變異矩陣(行為變異基因,列為樣本,矩陣中數(shù)據(jù)值為變異基因在對(duì)應(yīng)樣本中的變異頻率);
[0037]smapleCorrelat1n ? r:讀取 sampleCluster ? r 產(chǎn)生的位點(diǎn)變異矩陣;
[0038]8}01113〇18.1':讀取8311^)16(]1118七6^的15^18.1'產(chǎn)生的基因變異矩陣,提取不同疾病樣本具有較高變異頻率的基因。
[0039]功能富集分析模塊,用于利用功能富集分析工具分析變異基因功能,所述功能富集分析工具包括DAVID。[〇〇4〇]功能網(wǎng)絡(luò)構(gòu)建模塊,用于根據(jù)功能富集分析結(jié)果,構(gòu)建功能網(wǎng)絡(luò);所述功能網(wǎng)絡(luò)構(gòu)建模塊包括功能注釋模塊、功能富集模塊、網(wǎng)絡(luò)構(gòu)建模塊;首先,通過功能注釋模塊將變異基因進(jìn)行DAVID功能注釋;其次,通過功能富集模塊獲得功能富集GO term及該term對(duì)應(yīng)的基因集合;最后,通過網(wǎng)絡(luò)構(gòu)建模塊構(gòu)建節(jié)點(diǎn)表示為GO term、邊表示為節(jié)點(diǎn)間共享基因數(shù)目的功能網(wǎng)絡(luò)。
[0041]功能網(wǎng)絡(luò)挖掘模塊,用于從功能網(wǎng)絡(luò)中篩選出穩(wěn)定的網(wǎng)絡(luò)模塊;所述功能網(wǎng)絡(luò)挖掘模塊包括最大網(wǎng)絡(luò)子圖獲取模塊、篩選模塊;首先,通過最大網(wǎng)絡(luò)子圖獲取模塊根據(jù)導(dǎo)出的功能網(wǎng)絡(luò)數(shù)據(jù),采用貪婪算法,逐一在種子節(jié)點(diǎn)中加入節(jié)點(diǎn),使得構(gòu)建的子網(wǎng)具有最大得分,當(dāng)再次加入新節(jié)點(diǎn)得分不變時(shí),停止迭代;其次,通過篩選模塊從功能網(wǎng)絡(luò)中篩選出穩(wěn)定的網(wǎng)絡(luò)t吳塊;
[0042]功能網(wǎng)絡(luò)挖掘模塊對(duì)應(yīng)的程序?yàn)?[0〇43] module.r:根據(jù)Cytoscape導(dǎo)出的功能網(wǎng)絡(luò)數(shù)據(jù),讀取經(jīng)預(yù)處理過的邊屬性文件 (edge.csv文件),通過迭代尋找最大網(wǎng)絡(luò)子圖,進(jìn)而挖掘分子功能網(wǎng)絡(luò)模塊;
[0044]共享分子網(wǎng)絡(luò)識(shí)別模塊,用于根據(jù)網(wǎng)絡(luò)模塊識(shí)別不同疾病共享的分子模塊,挖掘疾病間潛在的共同致病機(jī)理;所述共享分子網(wǎng)絡(luò)識(shí)別模塊包括超幾何富集分析模塊、閾值分析模塊、識(shí)別模塊;首先通過超幾何富集分析模塊計(jì)算疾病基因與功能網(wǎng)絡(luò)模塊中基因的超幾何富集顯著性;其次,通過閾值分析模塊據(jù)超幾何顯著性閾值(pvalUe〈0.05),獲得與不同疾病顯著富集的功能模塊;最后通過識(shí)別模塊獲得疾病間共享的分子網(wǎng)絡(luò)模塊;
[0045]共享分子網(wǎng)絡(luò)識(shí)別模塊對(duì)應(yīng)的程序?yàn)?[0〇46]term-term_cy t0.r:根據(jù)Cy toscape導(dǎo)出的功能網(wǎng)絡(luò)數(shù)據(jù),讀取經(jīng)預(yù)處理過的點(diǎn)屬性文件(node, csv文件),結(jié)合module.r得到的分子功能網(wǎng)絡(luò)模塊信息,計(jì)算不同疾病的已知疾病基因與分子網(wǎng)絡(luò)模塊基因的超幾何富集分析結(jié)果,顯著富集到已知的多種疾病基因列表的網(wǎng)絡(luò)模塊。[〇〇47]詳細(xì)運(yùn)行說明[〇〇48]下面以五種疾病(Diseasel-5)的外顯子捕獲測(cè)序?yàn)槔?,詳?xì)闡述本平臺(tái)的具體使用方法和運(yùn)行結(jié)果。首先,構(gòu)建樣本列表實(shí)例,如圖2所示,對(duì)于識(shí)別的變異位點(diǎn),要求提取經(jīng)ANN0VAR注釋后的結(jié)果,作為后續(xù)腳本的輸入文件;
[0049]首先,使用snvStati stic.r對(duì)不同樣本的變異位點(diǎn)和變異基因數(shù)目進(jìn)行統(tǒng)計(jì),結(jié)果如圖3所示(第一列為"疾病類型_樣本編號(hào)",第二列為檢測(cè)到的變異數(shù)目,第三列為檢測(cè)到的變異基因數(shù)目)。[0〇5〇]以注釋后基因組變異文件作為輸入,使用sampleCluster.r得到變異位點(diǎn)矩陣,如圖4所示;
[0051]將上述過程中產(chǎn)生的變異位點(diǎn)矩陣作為數(shù)據(jù)的輸入,使用 sampleClusterAnalysis.r得到基因變異矩陣文件,如圖5所示;
[0052]根據(jù)sampleCluster.r產(chǎn)生的變異位點(diǎn)矩陣,使用smapleCorrelat1n.r計(jì)算不同疾病樣本間變異位點(diǎn)相似性;
[0053]根據(jù)sampleClusterAnalysis.r產(chǎn)生的基因變異矩陣,使用symbols.r提取不同疾病樣本變異頻率排秩在前10 %的基因;[〇〇54] 經(jīng)過上述對(duì)變異位點(diǎn)和變異基因的基礎(chǔ)分析之后,使用DAVID來刻畫變異基因的功能富集分析,并將富集分析結(jié)果導(dǎo)入Cytoscape中,使用EnrichmentMap插件,建立功能網(wǎng)絡(luò),導(dǎo)出功能網(wǎng)絡(luò)的邊屬性和點(diǎn)屬性,作為疾病功能網(wǎng)絡(luò)模塊挖掘過程中的輸入文件,使用 module.r構(gòu)建的功能網(wǎng)絡(luò)中挖掘分子功能網(wǎng)絡(luò)模塊,如圖6所示,最后使用term-term_ cy t0.r識(shí)別疾病共享分子網(wǎng)絡(luò)模塊,如圖7所示。
[0055]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),其特征在于:包括依次相連接的變異基因測(cè)序檢測(cè)模塊,用于完成對(duì)測(cè)序數(shù)據(jù)的基礎(chǔ)分析;功能富集分析模塊,用于利用功能富集分析工具分析變異基因功能;功能網(wǎng)絡(luò)構(gòu)建模塊,用于根據(jù)功能富集分析結(jié)果,構(gòu)建功能網(wǎng)絡(luò);功能網(wǎng)絡(luò)挖掘模塊,用于從功能網(wǎng)絡(luò)中篩選出穩(wěn)定的網(wǎng)絡(luò)模塊;共享分子網(wǎng)絡(luò)識(shí)別模塊,用于根據(jù)網(wǎng)絡(luò)模塊識(shí)別不同疾病共享的分子模塊,挖掘疾病 間潛在的共同致病機(jī)理。2.根據(jù)權(quán)利要求1所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),其特征在于:所 述變異基因測(cè)序檢測(cè)模塊完成對(duì)測(cè)序數(shù)據(jù)的樣本信息統(tǒng)計(jì)、基因組變異位點(diǎn)(或變異基因) 的樣本信息統(tǒng)計(jì),以及變異的樣本聚類和樣本間相似性等基礎(chǔ)分析,包括位點(diǎn)變異矩陣生 成模塊、基因變異矩陣生成模塊、基因提取模塊。3.根據(jù)權(quán)利要求1所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),其特征在于:所 述功能富集分析工具包括DAVID。4.根據(jù)權(quán)利要求1所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái),其特征在于:所 述功能網(wǎng)絡(luò)構(gòu)建模塊包括功能注釋模塊、功能富集模塊、網(wǎng)絡(luò)構(gòu)建模塊。5.根據(jù)權(quán)利要求1所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)其特征在于:所 述功能網(wǎng)絡(luò)挖掘模塊包括最大網(wǎng)絡(luò)子圖獲取模塊、篩選模塊。6.根據(jù)權(quán)利要求1所述的一種基于功能網(wǎng)絡(luò)多疾病變異位點(diǎn)分析平臺(tái)其特征在于:所 述共享分子網(wǎng)絡(luò)識(shí)別模塊包括超幾何富集分析模塊、閾值分析模塊、識(shí)別模塊。
【文檔編號(hào)】G06F19/00GK106021981SQ201610318328
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月13日
【發(fā)明人】薛成海, 關(guān)晉霞, 李陽, 侯婷婷
【申請(qǐng)人】萬康源(天津)基因科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
襄樊市| 铜陵市| 全南县| 蒲江县| 郎溪县| 青冈县| 南木林县| 电白县| 东莞市| 平顶山市| 伊吾县| 崇阳县| 衡东县| 封丘县| 辽宁省| 旬邑县| 阿瓦提县| 西畴县| 利辛县| 太保市| 车险| 彩票| 威信县| 西畴县| 屏南县| 嵩明县| 黄冈市| 莱阳市| 盘山县| 若羌县| 松江区| 招远市| 雷山县| 临江市| 会泽县| 米林县| 越西县| 错那县| 尉犁县| 嘉兴市| 泾源县|