基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法
【專利摘要】本發(fā)明涉及生物計算與蒙特卡洛模擬【技術領域】,具體公開一種基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法,包括步驟A:確定蛋白質(zhì)能量模型;步驟B:模擬及計算蛋白質(zhì)系統(tǒng)態(tài)密度。采用本發(fā)明提供的方法,可以高效地分析和研究蛋白質(zhì)折疊的整個熱力學過程,進而對蛋白質(zhì)折疊過程進行探索和研究。
【專利說明】基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法
【技術領域】
[0001]本發(fā)明涉及生物計算與蒙特卡洛模擬【技術領域】,具體公開一種基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法。
【背景技術】
[0002]蛋白質(zhì)工程是現(xiàn)代生物技術發(fā)展的前沿領域,其根本目的是要將天然存在的蛋白質(zhì)按照人們的設想進行改造,或者根據(jù)需要設計出具有某種特殊功能的非天然的新蛋白質(zhì)。而這種改造和設計的重要基礎之一是蛋白質(zhì)折疊結構的預測。蛋白質(zhì)折疊結構的形態(tài)在很大程度上決定了其可能具有的生物學功能。這就是說,蛋白質(zhì)的結構與功能之間具有一致性。因此對蛋白質(zhì)折疊結構的預測和研究在蛋白質(zhì)工程,醫(yī)藥領域等都有著極其重要的意義。
[0003]蒙特卡洛模擬是一種被廣泛使用的隨機搜索算法,通過隨機改變蛋白質(zhì)系統(tǒng)的粒子位置去搜索構象空間,獲得系統(tǒng)的態(tài)密度,從而可以計算系統(tǒng)的各種熱力學性質(zhì),進而研究蛋白質(zhì)折疊的整個熱動力學過程。但是,由于蛋白質(zhì)能量空間復雜,能量值局部最低區(qū)間與全局最低區(qū)間存在能壘,傳統(tǒng)的蒙特卡洛算法在低溫下的模擬容易陷入能量局部最低區(qū)間,很難跳出來找到全局最優(yōu)解。由此產(chǎn)生了很多新的蒙特卡洛模擬算法,如多正則系綜(multicanonical)蒙特卡洛算法、模擬回火(simulated tempering)算法、副本交換(Replica Exchange Method)算法和 Wang-Landau 算法。
[0004]Wang-Landau算法的基本思想是使用非波爾茲曼分布函數(shù)實現(xiàn)在能量區(qū)間自由行走的模擬仿真,從而更為廣泛地搜索構型空間;同時還可自動獲得蛋白質(zhì)系統(tǒng)的態(tài)密度,從而可以計算寬廣溫度范圍內(nèi)的許多正則系統(tǒng)熱力學量,進而研究蛋白質(zhì)折疊的整個熱動力學過程。Wang-Landau由于直觀簡潔的特點,其應用范圍已經(jīng)擴展到磁系統(tǒng)、液態(tài)晶體、液體、原子簇、自旋玻璃模型以及蛋白質(zhì)折疊中。但Wang-Landau算法在計算精度和速度上還有待進一步的改進。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在克服現(xiàn)有技術在蛋白質(zhì)熱力學分析中計算精度和速度不足的缺陷,提供一種基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法。
[0006]本發(fā)明的技術方案為1、一種基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法,其特征在于,包括步驟A:確定蛋白質(zhì)能量模型;以及B:模擬及計算蛋白質(zhì)系統(tǒng)態(tài)密度。
[0007]進一步地,步驟A進一步包括:采用ECEPP能量力場模型以及角度坐標系,ECEPP能量力場的表達形式為:
[0008]EECEPP-Ec+ELj+EHB+ETor
[0009]其中
【權利要求】
1.一種基于蒙特卡洛模擬的蛋白質(zhì)熱力學分析方法,其特征在于,包括步驟 A:確定蛋白質(zhì)能量I旲型;以及 B:模擬及計算蛋白質(zhì)系統(tǒng)態(tài)密度。
2.如權利要求1所述的蛋白質(zhì)熱力學分析方法,其中,步驟A進一步包括: 釆用ECEPP能量力場模型以及角度坐標系,ECEPP能量力場的表達形式為:
3.如權利要求1所述的蛋白質(zhì)熱力學分析方法,其中,步驟A進一步包括: 對所使用的蛋白質(zhì)能量區(qū)間進行離散化處理,若取k個能量bin區(qū)間值,則需對[Efflin, EfflaJ平均劃分k個bin區(qū)間,用每個區(qū)間中間的一個能量值代表該能量區(qū)間值。
4.如權利要求1所述的蛋白質(zhì)熱力學分析方法,其中,步驟B進一步包括: 通過主從進程模式的MPI并行程序算法,模擬及計算蛋白質(zhì)系統(tǒng)的態(tài)密度。
5.如權利要求4所述的蛋白質(zhì)熱力學分析方法,其中,在所述主從進程模式的N個分進程中,分進程I為主進程,其余分進程均為子進程。
6.如權利要求5所述的蛋白質(zhì)熱力學分析方法,其中,所述主進程包括步驟: 511:初始化蛋白質(zhì)系統(tǒng)態(tài)密度函數(shù)的對數(shù)S(E)=Ing(E)=O,直方圖H(E)=O(Emin ^ E ^ Emax), s=l,修正因子 df |Ε=(κ Θ (Eq-E)+1) Inf,其中 Θ (E0-E)是 Heaviside 分段函數(shù),K、匕、f是相關于模型的參數(shù);
512:t=l ; 513:在主進程中,對原來的構型進行隨機變動,產(chǎn)生新的構型,計算能量EnOT,根據(jù)Metropolis準則確定新構型被接受的概率,t=t+l, s=s+l,修正因子為df IE= ( K Θ (E0-E)+1) Inf ; 步驟S13循環(huán)tmax次; S14:所有進程間相互通信,主進程收集所有從進程的Stmp(E)和Htmp(E)并累加計算出全局的S (E)和H (E),即全局的S (E) =S (E) +所有從進程的Stmp (E),全局的H (E) =H (E) +所有從進程的Htmp (E),將全局的S (E)和H (E)的廣播給所有從進程,求得Hreal (E) =H(E) X [1+ K O (E0-E)],判斷直方圖平緩條件:
max(//;.ra/(£)) + min(//r?,,(£ ))、'Φ (0<φ<1) 若不滿足則返回到S12繼續(xù)迭代;若滿足則至S15 ;S15:改變修正因子f,再返回執(zhí)行S12繼續(xù)迭代,直到滿足條件
7.如權利要求6所述的蛋白質(zhì)熱力學分析方法,其中,所述從進程包括步驟:
521:初始化系統(tǒng)的態(tài)密度的對數(shù)S (E) =Ing (E) =0,Stmp (E) =Ingtmp (E) =0,直方圖H(E) =0,Htmp (E)=O (Emin ≤ E ≤ Emax),S=I,修正因子 df|E=(K Θ (E0-E)+1) Inf,其中 O (E0-E)是Heaviside分段函數(shù),κ、Ec^ f是相關于模型的參數(shù);S22:t=l ;S23:在從進程中,對原來的構型進行隨機變動,產(chǎn)生新的構型,計算能量EnOT,根據(jù)Metropolis準則確定新構型被接受的概率,t=t+l, s=s+l,修正因子為df IE= ( K Θ (E0-E)+1) Inf ; 步驟S23循環(huán)tmax次;S24:所有進程間相互通信,從進程將Stmp (E)和Htmp (E)發(fā)送給主進程,然后接收經(jīng)主進程計算得出的全局的S(E)和H(E)更新原來的S(E)和H(E),將Stmp(E)和Htmp(E)初始化為0,求得Hreal (E) =H(E) X [1+ K O (E0-E)],判斷直方圖平緩條件:
8.如權利要求7所述的蛋白質(zhì)熱力學分析方法,其中,步驟S13中根據(jù)Metropolis準則確定新構型被接受的概率進一步包括:
9.如權利要求8所述的蛋白質(zhì)熱力學分析方法,其中,步驟S16和S26中,根據(jù)Metropolis準則確定新構型被接受的概率進一步包括:
10.如權利要求9所述的蛋白質(zhì)熱力學分析方法,其中,步驟S15和S25中,改變修正因子f方式為: 先連續(xù)進行N次迭代的f=f° (0< α〈I),再進行I次迭代的
【文檔編號】G06F19/18GK103699816SQ201310686687
【公開日】2014年4月2日 申請日期:2013年12月12日 優(yōu)先權日:2013年12月12日
【發(fā)明者】彭豐斌, 魏彥杰, 張慧玲 申請人:深圳先進技術研究院