欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法與流程

文檔序號:12125402閱讀:338來源:國知局
一種基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法與流程

本發(fā)明涉及一種生物學(xué)信息學(xué)、智能優(yōu)化、計算機應(yīng)用領(lǐng)域,尤其涉及的是,一種基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)預(yù)測方法。



背景技術(shù):

蛋白質(zhì)是所有生物中最重要的大分子之一,一個細(xì)胞的干重的一半以上是蛋白質(zhì)。蛋白質(zhì)是由單一的肽鍵連接在一起的氨基酸的順序鏈,這些連接的鏈折疊成能體現(xiàn)它們功能的三維結(jié)構(gòu),并調(diào)節(jié)生物體中的細(xì)胞活動,以保持生命。蛋白質(zhì)分子在分子水平上具體體現(xiàn)了蛋白質(zhì)結(jié)構(gòu)和功能之間的顯著關(guān)系。蛋白質(zhì)在生物學(xué)中有許多不同的功能。蛋白質(zhì)的三維天然結(jié)構(gòu)決定它的生物學(xué)機制,而反過來,蛋白質(zhì)氨基酸單體的一維鏈又對它的天然結(jié)構(gòu)進(jìn)行編碼。蛋白質(zhì)的三維結(jié)構(gòu)在藥物設(shè)計、蛋白質(zhì)工程和生物技術(shù)中具有決定性的重要,因此,蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個重要的研究問題。

蛋白質(zhì)結(jié)構(gòu)實驗測定方法包括X射線晶體學(xué)、核磁共振光譜、和電子顯微鏡等,這些方法被廣泛用于蛋白質(zhì)結(jié)構(gòu)測定。X射線晶體學(xué)被認(rèn)為是這些方法中相對可行且準(zhǔn)確的測定方法之一。然而,X射線晶體學(xué)需要進(jìn)行一個復(fù)雜的結(jié)晶過程,而對于一些不易結(jié)晶的蛋白(如膜蛋白),此方法無法用于結(jié)構(gòu)測定。此外,這些實驗測定方法極其耗時,代價昂貴,而且容易發(fā)生錯誤。

Anfinsen熱力學(xué)假說表明:蛋白質(zhì)的空間結(jié)構(gòu)由氨基酸序列唯一確定;蛋白質(zhì)的空間結(jié)構(gòu)是穩(wěn)定的;蛋白質(zhì)的天然構(gòu)象處于自由能最低點。根據(jù)Anfinsen原則,以計算機為工具,運用適當(dāng)?shù)乃惴ǎ瑥陌被嵝蛄谐霭l(fā)直接預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),成為當(dāng)前生物信息學(xué)中一種主要的研究課題。在上世紀(jì)文獻(xiàn)中,通常將預(yù)測方法劃分為以下三類:針對高相似序列的同源建模方法;針對較低相似性序列的折疊識別方法;以及不依賴模板的從頭預(yù)測方法。從頭預(yù)測方法直接基于Anfinsen假說建立蛋白質(zhì)物理或知識能量模型,然后設(shè)計適當(dāng)優(yōu)化算法求解最小能量構(gòu)象。一方面,從生物學(xué)意義上來講,有助于揭示蛋白質(zhì)折疊機理,進(jìn)而能夠最終闡明生物學(xué)中心法則中的第二遺傳密碼理論部分;另一方面,從現(xiàn)實意義來講,該方法具有普遍性,對于序列相似度<20%或寡肽(<10個殘基的小蛋白)來說,從頭預(yù)測方法是唯一的選擇[10]。

進(jìn)化類算法是研究蛋白質(zhì)分子構(gòu)象優(yōu)化的重要方法,主要包括遺傳算法、差分進(jìn)化算法。這些算法以結(jié)構(gòu)簡單,易于實現(xiàn),收斂速度快,以及魯棒性強等優(yōu)點被用于從頭預(yù)測方法中的全局最小能量構(gòu)象搜索。然后隨著蛋白質(zhì)規(guī)模的增大,現(xiàn)有方法在穩(wěn)定性、高效性、廣普性和易用性等方面還遠(yuǎn)不能滿足實際求解需求。例如,由于能量模型曲面的復(fù)雜性,算法容易早熟收斂,而無法得到全局最低能量構(gòu)象,從而影響預(yù)測精度。而且傳統(tǒng)的進(jìn)化類算法中沒有適當(dāng)應(yīng)用片段組裝技術(shù),導(dǎo)致其搜索空間極其龐大,計算代價較高。

因此,現(xiàn)有的構(gòu)象空間優(yōu)化方法在預(yù)測精度和計算代價方面存在著缺陷,需要改進(jìn)。



技術(shù)實現(xiàn)要素:

為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法在預(yù)測精度和計算代價方面的不足,本發(fā)明提出一種預(yù)測精度高、計算代價低的基于群體抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法。

本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:

一種基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,所述方法包括以下步驟:

1)選取蛋白質(zhì)力場模型,即能量函數(shù)E(X);

2)給定輸入序列信息;

3)初始化:種群規(guī)模NP,交叉概率CR,階段控制參數(shù)μ,支撐面斜率控制因子M;根據(jù)輸入序列產(chǎn)生初始構(gòu)象種群其中,N表示維數(shù),表示第i個構(gòu)象Ci的第N維坐標(biāo),并初始化迭代次數(shù)G=0;

4)隨機生成正整數(shù)rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4個隨機整數(shù)randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L為序列長度;令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取兩個數(shù)的最小值,max表示取兩個數(shù)的最大值;

5)如果G=0,對于當(dāng)前種群中的每個構(gòu)象個體Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目標(biāo)構(gòu)象個體,執(zhí)行如下操作生成測試構(gòu)象個體Ctrial

5.1)用Crand2上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Crand1的相同位置所對應(yīng)的二面角;再使用Crand3上位置c到位置d的片段的氨基酸p所對應(yīng)的二面角替換Crand1上相同位置所對應(yīng)的二面角,然后將所得Crand1進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

5.2)生成隨機數(shù)rand4,rand5,其中rand4∈(0,1),rand5∈(1,L),若rand4≤CR,則利用目標(biāo)構(gòu)象Ctarget中的rand5片段替換變異構(gòu)象Cmutant中的rand5片段,從而生成測試構(gòu)象Ctrial;若rand4>CR,則Ctrial直接等于變異構(gòu)象Cmutant;

6)如果G>0,則執(zhí)行如下階段性操作:

6.1)計算第G-1次迭代中生成的每個測試構(gòu)象個體的能量下界估計值:

6.1.1)計算當(dāng)前種群中每個構(gòu)象個體到測試構(gòu)象個體之間的距離其中表示第i個構(gòu)象Ci的第j維坐標(biāo),表示測試構(gòu)象Ctrial的第j維坐標(biāo),di表示第i個構(gòu)象Ci到測試構(gòu)象的距離;

6.1.2)根據(jù)距離對所有構(gòu)象進(jìn)行升序排列,選取前兩個構(gòu)象個體并記為并計算其下界估計支撐面:

其中,為所選構(gòu)象的能量函數(shù)值,為所選構(gòu)象個體的第j為坐標(biāo),為輔助變量,M為支撐面斜率控制因子;

6.1.3)計算測試構(gòu)象Ctrial的能量下界估計值其中max表示求最大值,min表示求最小值,為測試構(gòu)象向量的第j維元素,為支撐向量lk的第j維元素;

6.2)計算所有測試構(gòu)象的平均估計誤差其中表示第i個測試構(gòu)象的能量下界估計值,表示第i個測試構(gòu)象的實際能量函數(shù)值,如果G=0,則最大平均估計誤差為UEmax

6.3)對平均估計誤差UE進(jìn)行歸一化處理,UE的歸一化值為其中UEmin=0為最小平均估計誤差;

6.4)根據(jù)歸一化平均估計誤差值判斷算法所處的階段,并采樣不同的策略生成變異構(gòu)象Cmutant

6.4.1)如果則用Crand1上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Ctarget的相同位置所對應(yīng)的二面角;再使用Crand2上位置c到位置d的片段的氨基酸所對應(yīng)的二面角替換Ctarget上相同位置所對應(yīng)的二面角,然后將所得Ctarget進(jìn)行片段組裝得到變異構(gòu)象Cmutant,其中μ為階段控制參數(shù);

6.4.2)如果則根據(jù)如下操作生成變異構(gòu)象Cmutant

a)根據(jù)能量函數(shù)值對當(dāng)前種群中的構(gòu)象個體進(jìn)行降序排列,選取前NP/5個構(gòu)象并計算所選構(gòu)象的質(zhì)心構(gòu)象Ccentroid=(xcentroid,1,xcentroid,2,…,xcentroid,N),其中,構(gòu)象Ccentroid的第j維元素表示第m個選取構(gòu)象的第N維坐標(biāo),為構(gòu)象的實際能量函數(shù)值;

b)從當(dāng)前種群中隨機選取兩個不同的構(gòu)象Crand1和Crand2,其中rand1≠rand2∈[1,NP],提取構(gòu)象Crand1位置a到位置b的片段的氨基酸所對應(yīng)的二面角替換質(zhì)心構(gòu)象Ccentroid的相同位置所對應(yīng)的二面角,同時使用Crand2上位置c到位置d的片段的氨基酸所對應(yīng)的二面角替換質(zhì)心構(gòu)象Ccentroid相同位置所對應(yīng)的二面角,然后將所得Ccentroid進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

6.4.3)如果找出當(dāng)前種群中能量最低的構(gòu)象Cbest,用Cbest上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Ctarget的相同位置所對應(yīng)的二面角;再使用Crand1上位置c到位置d的片段的氨基酸p所對應(yīng)的二面角替換Ctarget上相同位置所對應(yīng)的二面角,然后將所得Ctarget進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

6.4.4)根據(jù)步驟5.2)生成測試構(gòu)象個體Ctrial;

7)分別計算目標(biāo)構(gòu)象和測試構(gòu)象的能量函數(shù)值f(Ctarget)和f(Ctrial),如果f(Ctrial)<f(Ctarget),則測試構(gòu)象個體替換目標(biāo)構(gòu)象個體;

8)判斷是否滿足終止條件,若滿足則輸出結(jié)果并退出,否則返回步驟4)。

進(jìn)一步,所述步驟8)中,對種群中的每個構(gòu)象個體都執(zhí)行完步驟4)—8)以后,迭代次數(shù)G=G+1,終止條件為迭代次數(shù)G達(dá)到預(yù)設(shè)最大迭代次數(shù)Gmax。

本發(fā)明的技術(shù)構(gòu)思為:首先,計算當(dāng)前種群中各構(gòu)象個體到新構(gòu)象的距離,并根據(jù)距離進(jìn)行升序排列;然后,對新構(gòu)象個體的鄰近構(gòu)象個體抽象凸下界估計支撐面,以獲取新構(gòu)象個體的能量下界估計值;其次,計算所有新構(gòu)象個體的能量下界估計值與實際能量值之間的平均估計誤差,并根據(jù)平均估計誤差的變化將整個算法分為多個優(yōu)化階段;最后,根據(jù)上一次迭代中的平均估計誤差判斷當(dāng)前迭代所處的階段,并對各階段設(shè)計不同的策略生成新構(gòu)象個體。

本發(fā)明的有益效果表現(xiàn)在:一方面,根據(jù)平均估計誤差的變化判斷算法所處的階段,從而設(shè)計不同的策略生成新構(gòu)象個體,不僅可以加快算法的收斂速度,而且可以提高預(yù)測精度;另一方面,在各階段的策略中選用不同個體的信息進(jìn)行片段組裝,縮小了搜索空間,從而降低了計算代價。

附圖說明

圖1是基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的基本流程圖。

圖2是基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法對蛋白質(zhì)1ENH進(jìn)行結(jié)構(gòu)預(yù)測時的構(gòu)象更新示意圖。

圖3是基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法對蛋白質(zhì)1ENH進(jìn)行結(jié)構(gòu)預(yù)測時得到的構(gòu)象分布圖。

圖4是基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法對蛋白質(zhì)1ENH進(jìn)行結(jié)構(gòu)預(yù)測得到的三維結(jié)構(gòu)圖。

具體實施方式

下面結(jié)合附圖對本發(fā)明作進(jìn)一步描述。

參照圖1~圖4,一種基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,包括以下步驟:

1)選取蛋白質(zhì)力場模型,即能量函數(shù)E(X);

2)給定輸入序列信息;

3)初始化:種群規(guī)模NP,交叉概率CR,階段控制參數(shù)μ,支撐面斜率控制因子M;根據(jù)輸入序列產(chǎn)生初始構(gòu)象種群其中,N表示維數(shù),表示第i個構(gòu)象Ci的第N維坐標(biāo),并初始化迭代次數(shù)G=0;

4)隨機生成正整數(shù)rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4個隨機整數(shù)randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L為序列長度;令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取兩個數(shù)的最小值,max表示取兩個數(shù)的最大值;

5)如果G=0,對于當(dāng)前種群中的每個構(gòu)象個體Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目標(biāo)構(gòu)象個體,執(zhí)行如下操作生成測試構(gòu)象個體Ctrial

5.1)用Crand2上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Crand1的相同位置所對應(yīng)的二面角;再使用Crand3上位置c到位置d的片段的氨基酸p所對應(yīng)的二面角替換Crand1上相同位置所對應(yīng)的二面角,然后將所得Crand1進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

5.2)生成隨機數(shù)rand4,rand5,其中rand4∈(0,1),rand5∈(1,L),若rand4≤CR,則利用目標(biāo)構(gòu)象Ctarget中的rand5片段替換變異構(gòu)象Cmutant中的rand5片段,從而生成測試構(gòu)象Ctrial;若rand4>CR,則Ctrial直接等于變異構(gòu)象Cmutant

6)如果G>0,則執(zhí)行如下階段性操作:

6.1)計算第G-1次迭代中生成的每個測試構(gòu)象個體的能量下界估計值:

6.1.1)計算當(dāng)前種群中每個構(gòu)象個體到測試構(gòu)象個體之間的距離其中表示第i個構(gòu)象Ci的第j維坐標(biāo),表示測試構(gòu)象Ctrial的第j維坐標(biāo),di表示第i個構(gòu)象Ci到測試構(gòu)象的距離;

6.1.2)根據(jù)距離對所有構(gòu)象進(jìn)行升序排列,選取前兩個構(gòu)象個體并記為并計算其下界估計支撐面:

其中,為所選構(gòu)象的能量函數(shù)值,為所選構(gòu)象個體的第j為坐標(biāo),為輔助變量,M為支撐面斜率控制因子;

6.1.3)計算測試構(gòu)象Ctrial的能量下界估計值其中max表示求最大值,min表示求最小值,為測試構(gòu)象向量的第j維元素,為支撐向量lk的第j維元素;

6.2)計算所有測試構(gòu)象的平均估計誤差其中表示第i個測試構(gòu)象的能量下界估計值,表示第i個測試構(gòu)象的實際能量函數(shù)值,如果G=0,則最大平均估計誤差為UEmax

6.3)對平均估計誤差UE進(jìn)行歸一化處理,UE的歸一化值為其中UEmin=0為最小平均估計誤差;

6.4)根據(jù)歸一化平均估計誤差值判斷算法所處的階段,并采樣不同的策略生成變異構(gòu)象Cmutant

6.4.1)如果則用Crand1上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Ctarget的相同位置所對應(yīng)的二面角;再使用Crand2上位置c到位置d的片段的氨基酸所對應(yīng)的二面角替換Ctarget上相同位置所對應(yīng)的二面角,然后將所得Ctarget進(jìn)行片段組裝得到變異構(gòu)象Cmutant,其中μ為階段控制參數(shù);

6.4.2)如果則根據(jù)如下操作生成變異構(gòu)象Cmutant

a)根據(jù)能量函數(shù)值對當(dāng)前種群中的構(gòu)象個體進(jìn)行降序排列,選取前NP/5個構(gòu)象并計算所選構(gòu)象的質(zhì)心構(gòu)象Ccentroid=(xcentroid,1,xcentroid,2,…,xcentroid,N),其中,構(gòu)象Ccentroid的第j維元素表示第m個選取構(gòu)象的第N維坐標(biāo),為構(gòu)象的實際能量函數(shù)值;

b)從當(dāng)前種群中隨機選取兩個不同的構(gòu)象Crand1和Crand2,其中rand1≠rand2∈[1,NP],提取構(gòu)象Crand1位置a到位置b的片段的氨基酸所對應(yīng)的二面角替換質(zhì)心構(gòu)象Ccentroid的相同位置所對應(yīng)的二面角,同時使用Crand2上位置c到位置d的片段的氨基酸所對應(yīng)的二面角替換質(zhì)心構(gòu)象Ccentroid相同位置所對應(yīng)的二面角,然后將所得Ccentroid進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

6.4.3)如果找出當(dāng)前種群中能量最低的構(gòu)象Cbest,用Cbest上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Ctarget的相同位置所對應(yīng)的二面角;再使用Crand1上位置c到位置d的片段的氨基酸p所對應(yīng)的二面角替換Ctarget上相同位置所對應(yīng)的二面角,然后將所得Ctarget進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

6.4.4)根據(jù)步驟5.2)生成測試構(gòu)象個體Ctrial;

7)分別計算目標(biāo)構(gòu)象和測試構(gòu)象的能量函數(shù)值f(Ctarget)和f(Ctrial),如果f(Ctrial)<f(Ctarget),則測試構(gòu)象個體替換目標(biāo)構(gòu)象個體;

8)判斷是否滿足終止條件,若滿足則輸出結(jié)果并退出,否則返回步驟4)。

進(jìn)一步,所述步驟8)中,對種群中的每一個個體都執(zhí)行完步驟4)—8)以后,迭代次數(shù)G=G+1,終止條件為迭代次數(shù)G達(dá)到預(yù)設(shè)最大迭代次數(shù)Gmax。

本實施例序列長度為54的α折疊蛋白質(zhì)1ENH為實施例,一種基于抽象凸估計的多階段差分進(jìn)化蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,其中包含以下步驟:

1)選取蛋白質(zhì)力場模型Rosetta Score3,即Rosetta Score3能量函數(shù)E(X);

2)給定1ENH蛋白質(zhì)的序列信息;

3)初始化:種群規(guī)模NP=50,交叉概率CR=0.5,階段控制參數(shù)μ=0.85,支撐面斜率控制因子M=1000,最大迭代次數(shù)Gmax=10000;根據(jù)輸入序列產(chǎn)生初始構(gòu)象種群其中,N表示維數(shù),表示第i個構(gòu)象Ci的第N維坐標(biāo),并初始化迭代次數(shù)G=0;

4)隨機生成正整數(shù)rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4個隨機整數(shù)randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L為序列長度;令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取兩個數(shù)的最小值,max表示取兩個數(shù)的最大值;

5)如果G=0,對于當(dāng)前種群中的每個構(gòu)象個體Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目標(biāo)構(gòu)象個體,執(zhí)行如下操作生成測試構(gòu)象個體Ctrial

5.1)用Crand2上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Crand1的相同位置所對應(yīng)的二面角;再使用Crand3上位置c到位置d的片段的氨基酸p所對應(yīng)的二面角替換Crand1上相同位置所對應(yīng)的二面角,然后將所得Crand1進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

5.2)生成隨機數(shù)rand4,rand5,其中rand4∈(0,1),rand5∈(1,L),若rand4≤CR,則利用目標(biāo)構(gòu)象Ctarget中的rand5片段替換變異構(gòu)象Cmutant中的rand5片段,從而生成測試構(gòu)象Ctrial;若rand4>CR,則Ctrial直接等于變異構(gòu)象Cmutant;

6)如果G>0,則執(zhí)行如下階段性操作:

6.1)計算第G-1次迭代中生成的每個測試構(gòu)象個體的能量下界估計值:

6.1.1)計算當(dāng)前種群中每個構(gòu)象個體到測試構(gòu)象個體之間的距離其中表示第i個構(gòu)象Ci的第j維坐標(biāo),表示測試構(gòu)象Ctrial的第j維坐標(biāo),di表示第i個構(gòu)象Ci到測試構(gòu)象的距離;

6.1.2)根據(jù)距離對所有構(gòu)象進(jìn)行升序排列,選取前兩個構(gòu)象個體并記為并計算其下界估計支撐面:

其中,為所選構(gòu)象的能量函數(shù)值,為所選構(gòu)象個體的第j為坐標(biāo),為輔助變量,M為支撐面斜率控制因子;

6.1.3)計算測試構(gòu)象Ctrial的能量下界估計值其中max表示求最大值,min表示求最小值,為測試構(gòu)象向量的第j維元素,為支撐向量lk的第j維元素;

6.2)計算所有測試構(gòu)象的平均估計誤差其中表示第i個測試構(gòu)象的能量下界估計值,表示第i個測試構(gòu)象的實際能量函數(shù)值,如果G=0,則最大平均估計誤差為UEmax;

6.3)對平均估計誤差UE進(jìn)行歸一化處理,UE的歸一化值為其中UEmin=0為最小平均估計誤差;

6.4)根據(jù)歸一化平均估計誤差值判斷算法所處的階段,并采樣不同的策略生成變異構(gòu)象Cmutant

6.4.1)如果則用Crand1上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Ctarget的相同位置所對應(yīng)的二面角;再使用Crand2上位置c到位置d的片段的氨基酸所對應(yīng)的二面角替換Ctarget上相同位置所對應(yīng)的二面角,然后將所得Ctarget進(jìn)行片段組裝得到變異構(gòu)象Cmutant,其中μ為階段控制參數(shù);

6.4.2)如果則根據(jù)如下操作生成變異構(gòu)象Cmutant

a)根據(jù)能量函數(shù)值對當(dāng)前種群中的構(gòu)象個體進(jìn)行降序排列,選取前NP/5個構(gòu)象并計算所選構(gòu)象的質(zhì)心構(gòu)象Ccentroid=(xcentroid,1,xcentroid,2,…,xcentroid,N),其中,構(gòu)象Ccentroid的第j維元素表示第m個選取構(gòu)象的第N維坐標(biāo),為構(gòu)象的實際能量函數(shù)值;

b)從當(dāng)前種群中隨機選取兩個不同的構(gòu)象Crand1和Crand2,其中rand1≠rand2∈[1,NP],提取構(gòu)象Crand1位置a到位置b的片段的氨基酸所對應(yīng)的二面角替換質(zhì)心構(gòu)象Ccentroid的相同位置所對應(yīng)的二面角,同時使用Crand2上位置c到位置d的片段的氨基酸所對應(yīng)的二面角替換質(zhì)心構(gòu)象Ccentroid相同位置所對應(yīng)的二面角,然后將所得Ccentroid進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant;

6.4.3)如果找出當(dāng)前種群中能量最低的構(gòu)象Cbest,用Cbest上位置a到位置b的片段的氨基酸k所對應(yīng)的二面角替換Ctarget的相同位置所對應(yīng)的二面角;再使用Crand1上位置c到位置d的片段的氨基酸p所對應(yīng)的二面角替換Ctarget上相同位置所對應(yīng)的二面角,然后將所得Ctarget進(jìn)行片段組裝得到變異構(gòu)象個體Cmutant

6.4.4)根據(jù)步驟5.2)生成測試構(gòu)象個體Ctrial;

7)分別計算目標(biāo)構(gòu)象和測試構(gòu)象的能量函數(shù)值f(Ctarget)和f(Ctrial),如果f(Ctrial)<f(Ctarget),則測試構(gòu)象個體替換目標(biāo)構(gòu)象個體;

8)對種群中的每一個個體都執(zhí)行完步驟4)—8)以后,迭代次數(shù)G=G+1,判斷G是否大于Gmax,若G大于Gmax,則輸出結(jié)果并退出,否則返回步驟4)。

以序列長度為54的α折疊蛋白質(zhì)1ENH為實施例,運用以上方法得到了該蛋白質(zhì)的近天然態(tài)構(gòu)象,最小均方根偏差為平均均方根偏差為預(yù)測結(jié)構(gòu)如圖4所示。

以上說明是本發(fā)明以1ENH蛋白質(zhì)為實例所得出的優(yōu)化效果,并非限定本發(fā)明的實施范圍,在不偏離本發(fā)明基本內(nèi)容所涉及范圍的的前提下對其做各種變形和改進(jìn),不應(yīng)排除在本發(fā)明的保護(hù)范圍之外。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
香港 | 无锡市| 金川县| 包头市| 循化| 屯昌县| 布拖县| 启东市| 鄢陵县| 湾仔区| 司法| 琼结县| 美姑县| 都昌县| 木兰县| 循化| 佛冈县| 苍山县| 大城县| 永福县| 盐山县| 虎林市| 阆中市| 扎鲁特旗| 疏勒县| 揭西县| 上蔡县| 泾川县| 论坛| 托里县| 九龙县| 曲阜市| 阳春市| 宣汉县| 宁陵县| 马山县| 北海市| 遂川县| 新巴尔虎右旗| 永顺县| 密山市|