本發(fā)明涉及一種生物學信息學、智能優(yōu)化、計算機應(yīng)用領(lǐng)域,尤其涉及的是,一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法。
背景技術(shù):
蛋白質(zhì)是所有生物中最重要的大分子之一,一個細胞的干重的一半以上是蛋白質(zhì)。蛋白質(zhì)是由單一的肽鍵連接在一起的氨基酸的順序鏈,這些連接的鏈折疊成能體現(xiàn)它們功能的三維結(jié)構(gòu),并調(diào)節(jié)生物體中的細胞活動,以保持生命。蛋白質(zhì)分子在分子水平上具體體現(xiàn)了蛋白質(zhì)結(jié)構(gòu)和功能之間的顯著關(guān)系。蛋白質(zhì)在生物學中有許多不同的功能。蛋白質(zhì)的三維天然結(jié)構(gòu)決定它的生物學機制,而反過來,蛋白質(zhì)氨基酸單體的一維鏈又對它的天然結(jié)構(gòu)進行編碼。蛋白質(zhì)的三維結(jié)構(gòu)在藥物設(shè)計、蛋白質(zhì)工程和生物技術(shù)中具有決定性的重要,因此,蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個重要的研究問題。
蛋白質(zhì)結(jié)構(gòu)實驗測定方法包括x射線晶體學、核磁共振光譜、和電子顯微鏡等,這些方法被廣泛用于蛋白質(zhì)結(jié)構(gòu)測定。x射線晶體學被認為是這些方法中相對可行且準確的測定方法之一。然而,x射線晶體學需要進行一個復(fù)雜的結(jié)晶過程,而對于一些不易結(jié)晶的蛋白(如膜蛋白),此方法無法用于結(jié)構(gòu)測定。此外,這些實驗測定方法極其耗時,代價昂貴,而且容易發(fā)生錯誤。
anfinsen熱力學假說表明:蛋白質(zhì)的空間結(jié)構(gòu)由氨基酸序列唯一確定;蛋白質(zhì)的空間結(jié)構(gòu)是穩(wěn)定的;蛋白質(zhì)的天然構(gòu)象處于自由能最低點。根據(jù)anfinsen原則,以計算機為工具,運用適當?shù)乃惴?,從氨基酸序列出發(fā)直接預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),成為當前生物信息學中一種主要的研究課題。在上世紀文獻中,通常將預(yù)測方法劃分為以下三類:針對高相似序列的同源建模方法;針對較低相似性序列的折疊識別方法;以及不依賴模板的從頭預(yù)測方法。從頭預(yù)測方法直接基于anfinsen假說建立蛋白質(zhì)物理或知識能量模型,然后設(shè)計適當優(yōu)化算法求解最小能量構(gòu)象。一方面,從生物學意義上來講,有助于揭示蛋白質(zhì)折疊機理,進而能夠最終闡明生物學中心法則中的第二遺傳密碼理論部分;另一方面,從現(xiàn)實意義來講,該方法具有普遍性,對于序列相似度<20%或寡肽(<10個殘基的小蛋白)來說,從頭預(yù)測方法是唯一的選擇。
目前主要的技術(shù)瓶頸在于兩個方面,第一方面在于采樣方法,現(xiàn)有技術(shù)對構(gòu)象空間采樣能力不強,另一方面在于構(gòu)象更新方法,現(xiàn)有技術(shù)對構(gòu)象的更新精度仍然不足。因此,現(xiàn)有的構(gòu)象空間搜索方法存在不足,需要改進。
技術(shù)實現(xiàn)要素:
為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法在預(yù)測精度和計算代價方面的不足,本發(fā)明提供一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法。根據(jù)當前個體的二面角與歷史最優(yōu)個體的二面角的差值,以及當前個體的二面角與種群最優(yōu)個體的二面角的差值引導下一代構(gòu)象搜索,并利用片段組裝進行隨機擾動,提高了全局探測能力,加快了收斂速度,降低了計算代價。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,所述方法包括以下步驟:
1)選取rosettascore3作為蛋白質(zhì)力場模型,即能量函數(shù)e(x);
2)給定輸入序列信息;
3)參數(shù)初始化:設(shè)置粒子群規(guī)模np、慣性權(quán)重ω、加速度
4)用二面角對
5)構(gòu)象初始化:根據(jù)給定輸入序列,生成np個伸展鏈構(gòu)象,作為初始粒子群p={c1(g),c2(g),...,cnp(g)},令g=0;
6)對粒子群中的構(gòu)象ci(g)依次進行l(wèi)次片段組裝,用e(x)計算新生成構(gòu)象的能量值,并將當前構(gòu)象作為個體ci(g)的歷史最優(yōu)構(gòu)象
7)對粒子群中的每個個體迭代的執(zhí)行下述步驟:
7.1)根據(jù)
7.2)更新構(gòu)象:根據(jù)
7.3)采用片段組裝對生成的個體執(zhí)行隨機擾動;
7.4)根據(jù)e(x)計算新生成構(gòu)象的能量,并與其歷史最優(yōu)個體的能量進行比較,若能量降低,則更新個體ci(g)的歷史最優(yōu)個體pbesti;
7.5)新生成的構(gòu)象能量與全局最優(yōu)個體gbest的能量進行比較,若能量降低,則用當前個體替換gbest;
8)判斷是否滿足終止條件:
8.1)若g=gmax,則輸出結(jié)果并退出;
8.2)若g<gmax,則令g=g+1,返回步驟7)。
本發(fā)明的技術(shù)構(gòu)思為:根據(jù)當前個體的二面角與歷史最優(yōu)個體的二面角的差值,以及當前個體的二面角與種群最優(yōu)個體的二面角的差值引導下一代構(gòu)象搜索,并利用片段組裝進行隨機擾動,提高了全局探測能力,加快了收斂速度,降低了計算代價。
本發(fā)明的有益效果為:本發(fā)明在蛋白質(zhì)結(jié)構(gòu)預(yù)測中應(yīng)用,可以得到預(yù)測精度較高、復(fù)雜度較低的構(gòu)象。
附圖說明
圖1是基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法對目標蛋白質(zhì)1acf預(yù)測結(jié)構(gòu)和實驗室測定結(jié)構(gòu)的三維示意圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明作進一步描述。
參照圖1,一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,包括以下步驟:
1)選取rosettascore3作為蛋白質(zhì)力場模型,即能量函數(shù)e(x);
2)給定輸入序列信息;
3)參數(shù)初始化:設(shè)置粒子群規(guī)模np、慣性權(quán)重ω、加速度
4)用二面角對
5)構(gòu)象初始化:根據(jù)給定輸入序列,生成np個伸展鏈構(gòu)象,作為初始粒子群p={c1(g),c2(g),...,cnp(g)},令g=0;
6)對粒子群中的構(gòu)象ci(g)依次進行l(wèi)次片段組裝,用e(x)計算新生成構(gòu)象的能量值,并將當前構(gòu)象作為個體ci(g)的歷史最優(yōu)構(gòu)象
7)對粒子群中的每個個體迭代的執(zhí)行下述步驟:
7.1)根據(jù)
7.2)更新構(gòu)象:根據(jù)
7.3)采用片段組裝對生成的個體執(zhí)行隨機擾動;
7.4)根據(jù)e(x)計算新生成構(gòu)象的能量,并與其歷史最優(yōu)個體的能量進行比較,若能量降低,則更新個體ci(g)的歷史最優(yōu)個體pbesti;
7.5)新生成的構(gòu)象能量與全局最優(yōu)個體gbest的能量進行比較,若能量降低,則用當前個體替換gbest;
8)判斷是否滿足終止條件:
8.1)若g=gmax,則輸出結(jié)果并退出;
8.2)若g<gmax,則令g=g+1,返回步驟7)。
本實施例以目標蛋白質(zhì)1acf為實施例,一種基于粒子群優(yōu)化算法的蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測方法,所述方法包括以下步驟:
1)選取rosettascore3作為蛋白質(zhì)力場模型,即能量函數(shù)e(x);
2)給定輸入序列信息;
3)參數(shù)初始化:設(shè)置粒子群規(guī)模np=100、慣性權(quán)重ω=1.0、加速度
4)用二面角對
5)構(gòu)象初始化:根據(jù)給定輸入序列,生成np個伸展鏈構(gòu)象,作為初始粒子群p={c1(g),c2(g),...,cnp(g)},令g=0;
6)對粒子群中的構(gòu)象ci(g)依次進行l(wèi)次片段組裝,用e(x)計算新生成構(gòu)象的能量值,并將當前構(gòu)象作為個體ci(g)的歷史最優(yōu)構(gòu)象
7)對粒子群中的每個個體迭代的執(zhí)行下述步驟:
7.6)根據(jù)
7.7)更新構(gòu)象:根據(jù)
7.8)采用片段組裝對生成的個體執(zhí)行隨機擾動;
7.9)根據(jù)e(x)計算新生成構(gòu)象的能量,并與其歷史最優(yōu)個體的能量進行比較,若能量降低,則更新個體ci(g)的歷史最優(yōu)個體pbesti;
7.10)新生成的構(gòu)象能量與全局最優(yōu)個體gbest的能量進行比較,若能量降低,則用當前個體替換gbest;
8)判斷是否滿足終止條件:
8.3)若g=gmax,則輸出結(jié)果并退出;
8.4)若g<gmax,則令g=g+1,返回步驟7)。
以上闡述的是本發(fā)明給出的一個實施例表現(xiàn)出來的優(yōu)良效果,顯然本發(fā)明不僅適合上述實施例,在不偏離本發(fā)明基本精神及不超出本發(fā)明實質(zhì)內(nèi)容所涉及內(nèi)容的前提下可對其做種種變化加以實施。