一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法與流程

文檔序號(hào)：12125405閱讀：623來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域，尤其涉及的是一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法。

背景技術(shù)：

蛋白質(zhì)分子在生物細(xì)胞化學(xué)反應(yīng)過(guò)程中起著至關(guān)重要的作用。它們的結(jié)構(gòu)模型和生物活性狀態(tài)對(duì)我們理解和治愈多種疾病有重要的意義。蛋白質(zhì)只有折疊成特定的三維結(jié)構(gòu)才能產(chǎn)生其特有的生物學(xué)功能。因此，要了解蛋白質(zhì)的功能，就必須獲得其三維空間結(jié)構(gòu)。

蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問(wèn)題自上世紀(jì)50年代以來(lái)就一直備受關(guān)注，尤其是從頭預(yù)測(cè)構(gòu)象空間優(yōu)化方法，是生物信息學(xué)和計(jì)算生物學(xué)領(lǐng)域的熱點(diǎn)研究課題，因?yàn)榈鞍踪|(zhì)的三維空間結(jié)構(gòu)決定了它所承載的生物功能，想要了解其功能進(jìn)而對(duì)許多由蛋白質(zhì)結(jié)構(gòu)改變而引起的疾病進(jìn)行有效的控制和預(yù)防，就必須獲得其三維結(jié)構(gòu)。從頭預(yù)測(cè)方法直接從蛋白質(zhì)的氨基酸序列出發(fā)，根據(jù)Anfinsen原則，以計(jì)算機(jī)為工具，運(yùn)用適當(dāng)算法，通過(guò)計(jì)算得到蛋白質(zhì)的天然構(gòu)象，適用于同源性小于25％的大多數(shù)蛋白質(zhì)。而制約從頭預(yù)測(cè)方法預(yù)測(cè)精度的瓶頸因素主要有兩個(gè)方面：第一，蛋白質(zhì)構(gòu)象空間的高維復(fù)雜性以及能量表面的粗糙性，使其成為一個(gè)難解的NP-Hard問(wèn)題；第二，力場(chǎng)模型的不精確性也使得預(yù)測(cè)結(jié)果難以達(dá)到較高的精度。設(shè)計(jì)有效的算法增強(qiáng)對(duì)構(gòu)象空間的采樣是解決蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)瓶頸問(wèn)題的有效途徑。但是到目前還沒有一種十分完善的方法來(lái)預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)，即使獲得了很好的預(yù)測(cè)結(jié)果，但也只是針對(duì)某些蛋白質(zhì)而言的，目前主要的技術(shù)瓶頸在于兩個(gè)方面，第一方面在于采樣方法，現(xiàn)有技術(shù)對(duì)構(gòu)象空間采樣能力不強(qiáng)，另一方面在于構(gòu)象更新方法，現(xiàn)有技術(shù)對(duì)構(gòu)象的更新精度仍然不足。

因此，現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法存在不足，需要改進(jìn)。

技術(shù)實(shí)現(xiàn)要素：

為了克服現(xiàn)有蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的構(gòu)象空間搜索維數(shù)較高、收斂速度較慢、預(yù)測(cè)精度較低的不足，本發(fā)明基于差分進(jìn)化算法，提出一種構(gòu)象空間搜索維數(shù)較低、收斂速度較快、預(yù)測(cè)精度較高的局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法，在差分進(jìn)化算法框架下，采用Rosetta score3粗粒度知識(shí)能量模型來(lái)降低構(gòu)象空間維數(shù)；將構(gòu)象種群劃分為多個(gè)模態(tài)，以保持種群多樣性，采用片段組裝技術(shù)來(lái)提高預(yù)測(cè)精度，同時(shí)采用蒙特卡洛算法對(duì)種群做增強(qiáng)；在種群進(jìn)化后期，使用抽象凸估計(jì)技術(shù)，建立模態(tài)的下界估計(jì)模型，構(gòu)建廣義下降方向，對(duì)模態(tài)內(nèi)個(gè)體做局部增強(qiáng)，以得到更為優(yōu)良的局部構(gòu)象；結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力，可以對(duì)構(gòu)象空間進(jìn)行更為有效的搜索。

本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是：

一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法，包括以下步驟：

1)給定輸入序列信息；

2)設(shè)置系統(tǒng)參數(shù)：種群大小popSize，算法的迭代次數(shù)T，交叉因子CR，變異因子MU，片段的長(zhǎng)度L，模態(tài)數(shù)量N；

3)種群初始化：由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體P_init；

4)模態(tài)建立：將種群平均劃分為N個(gè)模態(tài)；

5)開始迭代，執(zhí)行種群進(jìn)化過(guò)程：

5.1)設(shè)i＝1，j＝1,其中i∈{1,2,3,…,N},j∈{1,2,3,…,N_modal}；令P_target＝P_ij，其中i,j為序號(hào)，N_modal表示模態(tài)中個(gè)體的數(shù)目，P_target表示目標(biāo)個(gè)體；

5.2)針對(duì)個(gè)體P_target做變異操作：從L＝3的片段庫(kù)中隨機(jī)選擇片段進(jìn)行片段組裝，得到中間個(gè)體P_trial′；

5.3)隨機(jī)生成正整數(shù)rand1，rand2，rand3，其中rand1∈{1,2,3,...,N_modal}，rand1≠j，rand2∈{1,2,…,Length}，rand3∈(0,1)，其中Length為序列長(zhǎng)度；

5.4)若隨機(jī)數(shù)rand3<＝CR，針對(duì)P_trial’做交叉操作：令l＝rand1；k＝rand2；令即：將P_trial′的第k個(gè)氨基酸所對(duì)應(yīng)的二面角替換為P_l相同位置氨基酸對(duì)應(yīng)的二面角

5.5)令P_trial＝P_trial′，得到測(cè)試個(gè)體P_trial；

5.6)執(zhí)行更新操作：根據(jù)Rosetta Score3能量函數(shù)計(jì)算P_target和P_trial的能量：E(P_target)，E(P_trial)；若E(P_target)>E(P_trial)令P_target＝P_trial，否則保持種群不變；

5.7)得到更新后的種群P_update；

5.8)針對(duì)種群P_update中的每一個(gè)模態(tài)做模態(tài)增強(qiáng)：

5.8.1)選擇模態(tài)中能量最低的兩個(gè)個(gè)體P_des1，P_des2，構(gòu)建當(dāng)前模態(tài)的下界支撐面，得到模態(tài)區(qū)域最小估計(jì)值x_min；

5.8.2)根據(jù)構(gòu)建廣義下降方向D_des，其中為個(gè)體P_des1的二面角表示；

5.8.3)根據(jù)生成增強(qiáng)個(gè)體P_enhance，其中為個(gè)體P_des2的二面角表示，λ為步長(zhǎng)調(diào)整因子；

5.8.4)根據(jù)Rosetta Score3能量函數(shù)計(jì)算增強(qiáng)個(gè)體的能量：E(P_enhance)，并與當(dāng)前模態(tài)中能量最高的個(gè)體P_max進(jìn)行比較，若能量下降，則用增強(qiáng)個(gè)體替換當(dāng)前能量最高個(gè)體；

6)迭代運(yùn)行步驟5)至達(dá)到終止條件。

進(jìn)一步，所述步驟6)中，終止條件為迭代次數(shù)T達(dá)到最大迭代次數(shù)T_max。

本發(fā)明的有益效果為：在差分進(jìn)化算法框架下，采用Rosetta score3粗粒度知識(shí)能量模型來(lái)降低構(gòu)象空間維數(shù)；將構(gòu)象種群劃分為多個(gè)模態(tài)，以保持種群多樣性，采用片段組裝技術(shù)來(lái)提高預(yù)測(cè)精度，同時(shí)采用蒙特卡洛算法對(duì)種群做增強(qiáng)；在種群進(jìn)化后期，使用抽象凸估計(jì)技術(shù)，建立模態(tài)的下界估計(jì)模型，構(gòu)建廣義下降方向，對(duì)模態(tài)內(nèi)個(gè)體做局部增強(qiáng)，以得到更為優(yōu)良的局部構(gòu)象；結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力，可以對(duì)構(gòu)象空間進(jìn)行更為有效的搜索。

附圖說(shuō)明

圖1是蛋白質(zhì)2L0G預(yù)測(cè)結(jié)構(gòu)和實(shí)驗(yàn)室測(cè)定結(jié)構(gòu)最接近的構(gòu)象三維示意圖。

具體實(shí)施方式

下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。

參照?qǐng)D1，一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法，包括以下步驟：

1)給定輸入序列信息；

2)設(shè)置系統(tǒng)參數(shù)：種群大小popSize，算法的迭代次數(shù)T，交叉因子CR，變異因子MU，片段的長(zhǎng)度L，模態(tài)數(shù)量N；

3)種群初始化：由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體P_init；

4)模態(tài)建立：將種群平均劃分為N個(gè)模態(tài)；

5)開始迭代，執(zhí)行種群進(jìn)化過(guò)程：

5.2)針對(duì)個(gè)體P_target做變異操作：從L＝3的片段庫(kù)中隨機(jī)選擇片段進(jìn)行片段組裝，得到中間個(gè)體P_trial′；

5.3)隨機(jī)生成正整數(shù)rand1，rand2，rand3，其中rand1∈{1,2,3,...,N_modal}，rand1≠j，rand2∈{1,2,…,Length}，rand3∈(0,1)，其中Length為序列長(zhǎng)度；

5.5)令P_trial＝P_trial′，得到測(cè)試個(gè)體P_trial；

5.7)得到更新后的種群P_update；

5.8)針對(duì)種群P_update中的每一個(gè)模態(tài)做模態(tài)增強(qiáng)：

5.8.1)選擇模態(tài)中能量最低的兩個(gè)個(gè)體P_des1，P_des2，構(gòu)建當(dāng)前模態(tài)的下界支撐面，得到模態(tài)區(qū)域最小估計(jì)值x_min；

5.8.2)根據(jù)構(gòu)建廣義下降方向D_des，其中為個(gè)體P_des1的二面角表示；

5.8.3)根據(jù)生成增強(qiáng)個(gè)體P_enhance，其中為個(gè)體P_des2的二面角表示，λ為步長(zhǎng)調(diào)整因子；

6)迭代運(yùn)行步驟5)至達(dá)到終止條件.

進(jìn)一步，所述步驟6)中，終止條件為迭代次數(shù)T達(dá)到最大迭代次數(shù)T_max。

本實(shí)施例以序列長(zhǎng)度為32的蛋白質(zhì)2L0G為實(shí)施例，一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法，其中包含以下步驟：

1)給定輸入序列信息；

2)設(shè)置系統(tǒng)參數(shù)：種群大小popSize，算法的迭代次數(shù)T，交叉因子CR，變異因子MU，片段的長(zhǎng)度L，模態(tài)數(shù)量N；

3)種群初始化：由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體P_init；

4)模態(tài)建立：將種群平均劃分為N個(gè)模態(tài)；

5)開始迭代，執(zhí)行種群進(jìn)化過(guò)程：

5.2)針對(duì)個(gè)體P_target做變異操作：從L＝3的片段庫(kù)中隨機(jī)選擇片段進(jìn)行片段組裝，得到中間個(gè)體P_trial′；

5.3)隨機(jī)生成正整數(shù)rand1，rand2，rand3，其中rand1∈{1,2,3,...,N_modal}，rand1≠j，rand2∈{1,2,…,Length}，rand3∈(0,1)，其中Length為序列長(zhǎng)度；

5.5)令P_trial＝P_trial′，得到測(cè)試個(gè)體P_trial；

5.7)得到更新后的種群P_update；

5.8)針對(duì)種群P_update中的每一個(gè)模態(tài)做模態(tài)增強(qiáng)：

5.8.1)選擇模態(tài)中能量最低的兩個(gè)個(gè)體P_des1，P_des2，構(gòu)建當(dāng)前模態(tài)的下界支撐面，得到模態(tài)區(qū)域最小估計(jì)值x_min；

5.8.2)根據(jù)構(gòu)建廣義下降方向D_des，其中為個(gè)體P_des1的二面角表示；

5.8.3)根據(jù)生成增強(qiáng)個(gè)體P_enhance，其中為個(gè)體P_des2的二面角表示，λ為步長(zhǎng)調(diào)整因子；

6)迭代運(yùn)行步驟5)至達(dá)到終止條件，終止條件為迭代次數(shù)T達(dá)到最大迭代次數(shù)T_max；

以序列長(zhǎng)度為32的蛋白質(zhì)2L0G為實(shí)施例，運(yùn)用以上方法得到了該蛋白質(zhì)的近天然態(tài)構(gòu)象，預(yù)測(cè)結(jié)構(gòu)和實(shí)驗(yàn)室測(cè)定結(jié)構(gòu)最接近的構(gòu)象三維示意圖如圖1所示。

以上闡述的是本發(fā)明給出的一個(gè)實(shí)施例表現(xiàn)出來(lái)的優(yōu)良效果，顯然本發(fā)明不僅適合上述實(shí)施例，在不偏離本發(fā)明基本精神及不超出本發(fā)明實(shí)質(zhì)內(nèi)容所涉及內(nèi)容的前提下可對(duì)其做種種變化加以實(shí)施。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張貴軍;郝小虎;王柳靜;周曉根;陳凱;謝騰宇;李章維;
技術(shù)所有人：浙江工業(yè)大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

胎兒局部腸管回聲增強(qiáng)相關(guān)技術(shù)

局部對(duì)比度增強(qiáng)相關(guān)技術(shù)

局部腸管回聲增強(qiáng)相關(guān)技術(shù)

局部對(duì)比度增強(qiáng)算法相關(guān)技術(shù)

圖像局部增強(qiáng)相關(guān)技術(shù)

局部增強(qiáng)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種局部增強(qiáng)的多模態(tài)差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測(cè)方法與流程