欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種預(yù)測(cè)兩種疾病共同致病基因的方法

文檔序號(hào):9865968閱讀:1635來源:國(guó)知局
一種預(yù)測(cè)兩種疾病共同致病基因的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及致病基因預(yù)測(cè)技術(shù)領(lǐng)域,特別設(shè)及一種預(yù)測(cè)兩種疾病共同致病基因的 方法。
【背景技術(shù)】
[0002] 目前在疾病治療及預(yù)測(cè)領(lǐng)域,有些病患會(huì)同時(shí)患有一種W上的疾病,運(yùn)種情況會(huì) 帶給患者極大痛苦,現(xiàn)代精準(zhǔn)醫(yī)學(xué)提出疾病診斷和治療需要了解疾病的遺傳物質(zhì)基礎(chǔ),W 開展針對(duì)個(gè)體遺傳差異的診斷和治療。但現(xiàn)實(shí)當(dāng)中某兩種特定的疾病發(fā)生在某個(gè)個(gè)體上的 幾率是比較低的,而一旦發(fā)生帶來的疾病負(fù)擔(dān)又是非常重的,例如有研究發(fā)現(xiàn)精神分裂癥 病人患結(jié)核病的比率為1.33~2.30%,與2010年第五次全國(guó)結(jié)核病流調(diào)抽樣調(diào)查報(bào)告的普 通人群中活動(dòng)性結(jié)核病的患病率459/10萬比較,精神分裂癥患者運(yùn)一特殊群體,結(jié)核病的 患病率為普通人群的2.9~5.5倍。所W如何找到一種方法,能夠預(yù)測(cè)兩種疾病的共同致病 基因,實(shí)現(xiàn)精準(zhǔn)醫(yī)療,就顯得非常關(guān)鍵。
[0003] 現(xiàn)有技術(shù)中進(jìn)行研究?jī)煞N疾病的共同致病基因的方法主要有:1、基于相互作用網(wǎng) 絡(luò)的致病基因預(yù)測(cè)方法;2、基于PPI網(wǎng)絡(luò)的疾病候選基因排名方法;3、基于協(xié)同過濾的疾病 基因預(yù)測(cè)方法;4、基于復(fù)雜網(wǎng)絡(luò)的癥狀基因預(yù)測(cè)方法等等。運(yùn)些方法均屬于W因果關(guān)系推 理的方式進(jìn)行預(yù)測(cè)的,因而運(yùn)些方法存在天然的偏倚,且依賴臨床病例,推廣難度較大。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的在于提供一種預(yù)測(cè)兩種疾病共同致病基因的方法,W解決現(xiàn)有技術(shù) 由于W因果關(guān)系推理的方式進(jìn)行預(yù)測(cè)所造成的存在偏倚且依賴臨床數(shù)據(jù)推廣難度大的問 題。
[0005] 本發(fā)明的第二目的在于提供一種預(yù)測(cè)兩種疾病共同致病基因的方法,W實(shí)現(xiàn)找到 兩種疾病共同的致病遺傳物質(zhì)基礎(chǔ)的目標(biāo)。
[0006] 為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種預(yù)測(cè)兩種疾病共同致病基因的方法,包括W 下步驟:
[0007] S1:分別收集已知的兩種疾病的致病基因,及獲取該兩種疾病的蛋白作用網(wǎng)絡(luò);
[0008] S2:尋找上述兩種疾病的致病基因?qū)?yīng)的蛋白在所述蛋白網(wǎng)絡(luò)中的位置;
[0009] S3:基于所述位置進(jìn)行基因擴(kuò)展后從擴(kuò)展基因中的重疊基因中尋找得到兩種疾病 的共同致病基因。
[0010] 較佳地,所述步驟S1具體包括:分別選取兩種疾病的已知致病基因作為種子基因 集a和b,種子基因集a內(nèi)包含若干個(gè)疾病A的種子基因,種子基因集b內(nèi)包含若干個(gè)疾病B的 種子基因;
[0011] 所述步驟S2具體包括:根據(jù)兩種疾病已知的蛋白作用網(wǎng)絡(luò)繪制W所述種子基因集 a和b為核屯、的蛋白作用網(wǎng)絡(luò)圖;
[0012] 所述步驟S3具體包括:
[0013] S31:W每個(gè)所述種子基因?yàn)槠瘘c(diǎn),在所述蛋白作用網(wǎng)絡(luò)中進(jìn)行基因擴(kuò)展W得到擴(kuò) 展基因,并賦予每個(gè)所述擴(kuò)展基因一個(gè)分值,所述分值與其所屬的擴(kuò)展基因?qū)?yīng)的疾病相 關(guān)性的強(qiáng)弱相關(guān);
[0014] S32:將所述擴(kuò)展基因依據(jù)分值大小進(jìn)行由高到低的排序;
[0015] S33:從所述排序中的最大值開始依次計(jì)算每個(gè)擴(kuò)展基因的加和,如對(duì)任意一個(gè)擴(kuò) 展基因 i,其為種子基因集a中的種子基因擴(kuò)展得到的,且其計(jì)算加和時(shí),加和中包括任意一 個(gè)種子基因集b的擴(kuò)展基因,則對(duì)擴(kuò)展基因 i進(jìn)行加分,否則減分;
[0016] S34:依據(jù)分值的預(yù)設(shè)闊值分別選取加和后的兩種疾病的擴(kuò)展基因;
[0017] S35:選取步驟S34中得到的兩種疾病的擴(kuò)展基因中的重疊基因;
[0018] S36:對(duì)所述重疊基因進(jìn)行篩選,得到兩種疾病的共同致病基因。
[0019] 較佳地,所述步驟S31中,采用重起始的隨機(jī)游走方法在所述蛋白作用網(wǎng)絡(luò)中進(jìn)行 基因擴(kuò)展W得到擴(kuò)展基因。
[0020] 較佳地,設(shè)任意一個(gè)擴(kuò)展基因 j的分值為Vj,若j屬于種子基因集a中的種子基因擴(kuò) 展得到的,則每次加和時(shí),加分時(shí)得到的分值為
減分時(shí)得到的分值為
;若^'屬于種子基因集b中的種子基因擴(kuò)展得到的,則每次加和時(shí),加分時(shí)得到 的分值為
庚中,N為蛋白作用網(wǎng)絡(luò)圖中所 有蛋白/基因的數(shù)量,Ga為疾病A的種子基因集a中的基因數(shù)量,姑為疾病B的種子基因集b中 的基因數(shù)量。
[0021] 較佳地,所述步驟S33中計(jì)算每個(gè)擴(kuò)展基因的加和時(shí),采用基因集富集分析法進(jìn)行 計(jì)算。
[0022] 較佳地,所述步驟S36中采用超幾何學(xué)方法計(jì)算所述重疊基因及其在蛋白作用網(wǎng) 絡(luò)中相鄰基因的P值,依據(jù)該P(yáng)值對(duì)重疊基因進(jìn)行篩選,其中,P值按下式計(jì)算:
[0023]
[0024] N為蛋白作用網(wǎng)絡(luò)圖中所有蛋白/基因的數(shù)量,Μ是共同蛋白/基因數(shù)目,η是相鄰蛋 白/基因的數(shù)目,m是相鄰蛋白/基因中共同蛋白/基因數(shù)目。
[0025] 本發(fā)明提供的預(yù)測(cè)兩種疾病共同致病基因的方法通過在兩種疾病的基因?qū)?yīng)的 蛋白作用網(wǎng)絡(luò)圖中進(jìn)行基因擴(kuò)展,并在擴(kuò)展基因中的共同基因中選取兩種疾病的共同致病 基因,并在預(yù)測(cè)過程中應(yīng)用了隨機(jī)游走方法、基因集富集分析法及超幾何檢驗(yàn)法,使得共同 致病基因的選取更加準(zhǔn)確。本發(fā)明方法能夠預(yù)測(cè)可能影響到兩種疾病的關(guān)鍵驅(qū)動(dòng)基因,可 實(shí)現(xiàn)精準(zhǔn)醫(yī)療,其中兩種疾病的類型可為任何已知病癥,特別是可為較少發(fā)生的病例,只要 具備兩種疾病分別的基因數(shù)據(jù)即可。
【附圖說明】
[0026] 圖1為本發(fā)明提供的預(yù)測(cè)兩種疾病共同致病基因的方法流程圖;
[0027] 圖2為本發(fā)明方法中的尋找得到兩種疾病的共同致病基因的方法流程圖;
[0028] 圖3A為本發(fā)明優(yōu)選實(shí)施例的W種子基因集為核屯、的蛋白作用網(wǎng)絡(luò)示意圖;
[0029] 圖3B為本發(fā)明優(yōu)選實(shí)施例的基因擴(kuò)展后共有基因的蛋白作用網(wǎng)絡(luò)示意圖;
[0030] 圖3C為本發(fā)明優(yōu)選實(shí)施例的找到了兩種疾病的共同致病基因的蛋白作用網(wǎng)絡(luò)示 意圖。
【具體實(shí)施方式】
[0031] 為更好地說明本發(fā)明,茲W-優(yōu)選實(shí)施例,并配合附圖對(duì)本發(fā)明作詳細(xì)說明,具體 如下:
[0032] 如圖1所示,為本發(fā)明提供的預(yù)測(cè)兩種疾病共同致病基因的方法,包括W下步驟S1 ~S3:
[0033] S1:分別收集已知的兩種疾病的致病基因,及獲取該兩種疾病的蛋白作用網(wǎng)絡(luò);
[0034] 具體包括:分別選取兩種疾病的已知致病基因作為種子基因集a和b,種子基因集a 內(nèi)包含若干個(gè)疾病A的種子基因,種子基因集b內(nèi)包含若干個(gè)疾病B的種子基因;
[0035] S2:尋找上述兩種疾病的致病基因?qū)?yīng)的蛋白在蛋白網(wǎng)絡(luò)中的位置;
[0036] 具體包括:根據(jù)兩種疾病A和B已知的蛋白作用網(wǎng)絡(luò)繪制W種子基因集a和b為核屯、 的蛋白作用網(wǎng)絡(luò)圖。該蛋白作用網(wǎng)絡(luò)圖如圖3A所示,該圖中包括基因 G1~G12共12個(gè)基因, 分別對(duì)應(yīng)12種蛋白,其中,G2~G4(圖中的G2a~G4a)為疾病A所對(duì)應(yīng)的種子基因集a中的種子 基因;G11、G12(圖中的Glib~G12b)為疾病B所對(duì)應(yīng)的種子基因集b中的種子基因。
[0037] S3:基于上述的位置在蛋白網(wǎng)絡(luò)中進(jìn)行基因擴(kuò)展后從擴(kuò)展基因中的重疊基因中尋 找得到兩種疾病的共同致病基因。
[003引如圖2所示,步驟S3具體包括:
[0039] S31:W每個(gè)所述種子基因?yàn)槠瘘c(diǎn),在上述的蛋白作用網(wǎng)絡(luò)中進(jìn)行基因擴(kuò)展W得到 擴(kuò)展基因,并賦予每個(gè)擴(kuò)展基
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
柯坪县| 霍山县| 台南县| 阿城市| 平潭县| 苗栗市| 深圳市| 元谋县| 宿州市| 花垣县| 子洲县| 平定县| 铜梁县| 武穴市| 新兴县| 墨竹工卡县| 信阳市| 奉贤区| 忻州市| 浦县| 甘泉县| 集贤县| 大悟县| 普宁市| 通州区| 庐江县| 云霄县| 西乌| 谢通门县| 开远市| 太白县| 天水市| 嘉峪关市| 霍城县| 沐川县| 三门峡市| 灌阳县| 禹城市| 寿光市| 西乌珠穆沁旗| 西安市|