一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法與流程

文檔序號：11520100閱讀：310來源：國知局

本發(fā)明涉及一種生物學信息學、智能優(yōu)化、計算機應(yīng)用領(lǐng)域，尤其涉及的是，一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法。

背景技術(shù)：

蛋白質(zhì)是所有生物中最重要的大分子之一，一個細胞的干重的一半以上是蛋白質(zhì)。蛋白質(zhì)是由單一的肽鍵連接在一起的氨基酸的順序鏈，這些連接的鏈折疊成能體現(xiàn)它們功能的三維結(jié)構(gòu)，并調(diào)節(jié)生物體中的細胞活動，以保持生命。蛋白質(zhì)分子在分子水平上具體體現(xiàn)了蛋白質(zhì)結(jié)構(gòu)和功能之間的顯著關(guān)系。蛋白質(zhì)在生物學中有許多不同的功能。蛋白質(zhì)的三維天然結(jié)構(gòu)決定它的生物學機制，而反過來，蛋白質(zhì)氨基酸單體的一維鏈又對它的天然結(jié)構(gòu)進行編碼。蛋白質(zhì)的三維結(jié)構(gòu)在藥物設(shè)計、蛋白質(zhì)工程和生物技術(shù)中具有決定性的重要，因此，蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個重要的研究問題。

蛋白質(zhì)結(jié)構(gòu)實驗測定方法包括x射線晶體學、核磁共振光譜、和電子顯微鏡等，這些方法被廣泛用于蛋白質(zhì)結(jié)構(gòu)測定。x射線晶體學被認為是這些方法中相對可行且準確的測定方法之一。然而，x射線晶體學需要進行一個復(fù)雜的結(jié)晶過程，而對于一些不易結(jié)晶的蛋白(如膜蛋白)，此方法無法用于結(jié)構(gòu)測定。此外，這些實驗測定方法極其耗時，代價昂貴，而且容易發(fā)生錯誤。

anfinsen熱力學假說表明：蛋白質(zhì)的空間結(jié)構(gòu)由氨基酸序列唯一確定；蛋白質(zhì)的空間結(jié)構(gòu)是穩(wěn)定的；蛋白質(zhì)的天然構(gòu)象處于自由能最低點。根據(jù)anfinsen原則，以計算機為工具，運用適當?shù)乃惴?，從氨基酸序列出發(fā)直接預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)，成為當前生物信息學中一種主要的研究課題。在上世紀文獻中，通常將預(yù)測方法劃分為以下三類：針對高相似序列的同源建模方法；針對較低相似性序列的折疊識別方法；以及不依賴模板的從頭預(yù)測方法。從頭預(yù)測方法直接基于anfinsen假說建立蛋白質(zhì)物理或知識能量模型，然后設(shè)計適當優(yōu)化算法求解最小能量構(gòu)象。一方面，從生物學意義上來講，有助于揭示蛋白質(zhì)折疊機理，進而能夠最終闡明生物學中心法則中的第二遺傳密碼理論部分；另一方面，從現(xiàn)實意義來講，該方法具有普遍性，對于序列相似度<20％或寡肽(<10個殘基的小蛋白)來說，從頭預(yù)測方法是唯一的選擇。

目前主要的技術(shù)瓶頸在于兩個方面，第一方面在于采樣方法，現(xiàn)有技術(shù)對構(gòu)象空間采樣能力不強，另一方面在于構(gòu)象更新方法，現(xiàn)有技術(shù)對構(gòu)象的更新精度仍然不足。因此，現(xiàn)有的構(gòu)象空間搜索方法存在不足，需要改進。

技術(shù)實現(xiàn)要素：

為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法在預(yù)測精度和計算代價方面的不足，本發(fā)明提供一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法。根據(jù)當前個體的二面角與歷史最優(yōu)個體的二面角的差值，以及當前個體的二面角與種群最優(yōu)個體的二面角的差值引導下一代構(gòu)象搜索，并利用片段組裝進行隨機擾動，提高了全局探測能力，加快了收斂速度，降低了計算代價。

本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是：

一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法，所述方法包括以下步驟：

1)選取rosettascore3作為蛋白質(zhì)力場模型，即能量函數(shù)e(x)；

2)給定輸入序列信息；

3)參數(shù)初始化：設(shè)置粒子群規(guī)模np、慣性權(quán)重ω、加速度加速度和最大迭代次數(shù)gmax；

4)用二面角對表示蛋白質(zhì)構(gòu)象cⁱ(g)，其中，l為蛋白序列長度，表示第g代種群中第i個個體的第j個二面角對，為便于描述，將其記為其中表示構(gòu)象cⁱ(g)的第k維分量，k∈{1,...,2l}；

5)構(gòu)象初始化：根據(jù)給定輸入序列，生成np個伸展鏈構(gòu)象，作為初始粒子群p＝{c¹(g),c²(g),...,c^np(g)}，令g＝0；

6)對粒子群中的構(gòu)象cⁱ(g)依次進行l(wèi)次片段組裝，用e(x)計算新生成構(gòu)象的能量值，并將當前構(gòu)象作為個體cⁱ(g)的歷史最優(yōu)構(gòu)象表示pbestⁱ的第k維分量，k∈{1,2,...,2l}，選取當前粒子群中能量最低構(gòu)象作為粒子群全局最優(yōu)構(gòu)象gbest＝{y1,y2,...,yk,...,y2l}，yk表示gbest的第k維分量，k∈{1,2,...,2l}；

7)對粒子群中的每個個體迭代的執(zhí)行下述步驟：

7.1)根據(jù)計算構(gòu)象的各個殘基二面角增量其中ω是慣性權(quán)重因子，是加速度常數(shù)，均為非負值。rand(0,a1)和rand(0,a2)為[0,a1]、[0,a2]范圍內(nèi)具有均勻分布的隨機數(shù)，a1與a2為控制參數(shù)，表示第g代種群中第i個個體的第k維分量，k∈{1,2,...,2l}；

7.2)更新構(gòu)象：根據(jù)計算每個構(gòu)象的各個殘基二面角；

7.3)采用片段組裝對生成的個體執(zhí)行隨機擾動；

7.4)根據(jù)e(x)計算新生成構(gòu)象的能量，并與其歷史最優(yōu)個體的能量進行比較，若能量降低，則更新個體cⁱ(g)的歷史最優(yōu)個體pbestⁱ；

7.5)新生成的構(gòu)象能量與全局最優(yōu)個體gbest的能量進行比較，若能量降低，則用當前個體替換gbest；

8)判斷是否滿足終止條件：

8.1)若g＝gmax，則輸出結(jié)果并退出；

8.2)若g<gmax，則令g＝g+1，返回步驟7)。

本發(fā)明的技術(shù)構(gòu)思為：根據(jù)當前個體的二面角與歷史最優(yōu)個體的二面角的差值，以及當前個體的二面角與種群最優(yōu)個體的二面角的差值引導下一代構(gòu)象搜索，并利用片段組裝進行隨機擾動，提高了全局探測能力，加快了收斂速度，降低了計算代價。

本發(fā)明的有益效果為：本發(fā)明在蛋白質(zhì)結(jié)構(gòu)預(yù)測中應(yīng)用，可以得到預(yù)測精度較高、復(fù)雜度較低的構(gòu)象。

附圖說明

圖1是基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法對目標蛋白質(zhì)1acf預(yù)測結(jié)構(gòu)和實驗室測定結(jié)構(gòu)的三維示意圖。

具體實施方式

下面結(jié)合附圖對本發(fā)明作進一步描述。

參照圖1，一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法，包括以下步驟：

1)選取rosettascore3作為蛋白質(zhì)力場模型，即能量函數(shù)e(x)；

2)給定輸入序列信息；

3)參數(shù)初始化：設(shè)置粒子群規(guī)模np、慣性權(quán)重ω、加速度加速度和最大迭代次數(shù)gmax；

4)用二面角對表示蛋白質(zhì)構(gòu)象cⁱ(g)，

其中，l為蛋白序列長度，表示第g代種群中第i個個體的第j個二面角對，為便于描述，將其記為其中表示構(gòu)象cⁱ(g)的第k維分量，k∈{1,...,2l}；

5)構(gòu)象初始化：根據(jù)給定輸入序列，生成np個伸展鏈構(gòu)象，作為初始粒子群p＝{c¹(g),c²(g),...,c^np(g)}，令g＝0；

7)對粒子群中的每個個體迭代的執(zhí)行下述步驟：

7.2)更新構(gòu)象：根據(jù)計算每個構(gòu)象的各個殘基二面角；

7.3)采用片段組裝對生成的個體執(zhí)行隨機擾動；

7.4)根據(jù)e(x)計算新生成構(gòu)象的能量，并與其歷史最優(yōu)個體的能量進行比較，若能量降低，則更新個體cⁱ(g)的歷史最優(yōu)個體pbestⁱ；

7.5)新生成的構(gòu)象能量與全局最優(yōu)個體gbest的能量進行比較，若能量降低，則用當前個體替換gbest；

8)判斷是否滿足終止條件：

8.1)若g＝gmax，則輸出結(jié)果并退出；

8.2)若g<gmax，則令g＝g+1，返回步驟7)。

本實施例以目標蛋白質(zhì)1acf為實施例，一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法，所述方法包括以下步驟：

1)選取rosettascore3作為蛋白質(zhì)力場模型，即能量函數(shù)e(x)；

2)給定輸入序列信息；

3)參數(shù)初始化：設(shè)置粒子群規(guī)模np＝100、慣性權(quán)重ω＝1.0、加速度加速度和最大迭代次數(shù)gmax＝100000；

4)用二面角對表示蛋白質(zhì)構(gòu)象cⁱ(g)，

其中，l＝125為蛋白序列長度，表示第g代種群中第i個個體的第j個二面角對，為便于描述，將其記為其中表示構(gòu)象cⁱ(g)的第k維分量，k∈{1,...,2l}；

5)構(gòu)象初始化：根據(jù)給定輸入序列，生成np個伸展鏈構(gòu)象，作為初始粒子群p＝{c¹(g),c²(g),...,c^np(g)}，令g＝0；

7)對粒子群中的每個個體迭代的執(zhí)行下述步驟：

7.6)根據(jù)計算構(gòu)象的各個殘基二面角增量其中ω是慣性權(quán)重因子，是加速度常數(shù)，均為非負值。rand(0,a1)和rand(0,a2)為[0,a1]、[0,a2]范圍內(nèi)具有均勻分布的隨機數(shù)，a1＝1與a2＝1為控制參數(shù)，表示第g代種群中第i個個體的第k維分量，k∈{1,2,...,2l}；

7.7)更新構(gòu)象：根據(jù)計算每個構(gòu)象的各個殘基二面角；

7.8)采用片段組裝對生成的個體執(zhí)行隨機擾動；

7.9)根據(jù)e(x)計算新生成構(gòu)象的能量，并與其歷史最優(yōu)個體的能量進行比較，若能量降低，則更新個體cⁱ(g)的歷史最優(yōu)個體pbestⁱ；

7.10)新生成的構(gòu)象能量與全局最優(yōu)個體gbest的能量進行比較，若能量降低，則用當前個體替換gbest；

8)判斷是否滿足終止條件：

8.3)若g＝gmax，則輸出結(jié)果并退出；

8.4)若g<gmax，則令g＝g+1，返回步驟7)。

以上闡述的是本發(fā)明給出的一個實施例表現(xiàn)出來的優(yōu)良效果，顯然本發(fā)明不僅適合上述實施例，在不偏離本發(fā)明基本精神及不超出本發(fā)明實質(zhì)內(nèi)容所涉及內(nèi)容的前提下可對其做種種變化加以實施。

完整全部詳細技術(shù)資料下載

當前第1頁1 2

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王晨彤
技術(shù)所有人：王晨彤
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

粒子群優(yōu)化算法相關(guān)技術(shù)

多目標粒子群優(yōu)化算法相關(guān)技術(shù)

粒子群優(yōu)化算法matlab相關(guān)技術(shù)

粒子群優(yōu)化算法實例相關(guān)技術(shù)

粒子群優(yōu)化算法代碼相關(guān)技術(shù)

離散粒子群優(yōu)化算法相關(guān)技術(shù)

混沌粒子群優(yōu)化算法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法與流程