本發(fā)明涉及網(wǎng)絡(luò)模型工具包,特別是涉及到一種多約束代謝網(wǎng)絡(luò)模型工具包的生成方法和應(yīng)用。
背景技術(shù):
1、基因組代謝網(wǎng)絡(luò)模型(genome-scale?metabolic?models,gems/gsmm)是一種數(shù)學(xué)模型,涵蓋了細(xì)胞中生化反應(yīng)網(wǎng)絡(luò),可以定量描述基因與表型的關(guān)系,被廣泛用來模擬和預(yù)測不同系統(tǒng)水平的代謝通量。目前,代謝網(wǎng)絡(luò)模型分析算法主要可分為兩類:一類是通量平衡分析類算法,這類算法的基礎(chǔ)是通量平衡分析(flux?balanceanalysis,fba),主要用于預(yù)測代謝途徑的通量分布。
2、為了提高預(yù)測通量分布的準(zhǔn)確性并拓展模型的應(yīng)用范圍,出現(xiàn)了一系列對代謝通量量增加額外約束的算法,如regulatory?fba(rfba)、integratedfba(ifba)、dynamic?fba(dfba)和community?fba(cfba)等。另一類算法與代謝工程改造靶點(diǎn)預(yù)測相關(guān),可分為基因敲除算法(optknock)、基因添加算法(optswap)、基因表達(dá)調(diào)控算法(optforce和k-optforce)以及異源途徑表達(dá)算法(optstrain和simoptstrain)以及通量掃描算法(fesof)。這些算法通過模擬識別代謝途徑中可用于提高目標(biāo)產(chǎn)品通量的過表達(dá)靶點(diǎn)、弱化靶點(diǎn)和敲除靶點(diǎn)等。
3、在基于計量學(xué)的代謝網(wǎng)絡(luò)通量平衡分析中,大多數(shù)反應(yīng)速率受到寬泛的上下限值約束。因此,當(dāng)?shù)孜镙斎胨俾试O(shè)定值較高時,可能會導(dǎo)致內(nèi)部反應(yīng)通量值過大,而與實驗值偏離。在實際細(xì)胞中,每個反應(yīng)的速率受到催化該反應(yīng)的酶的含量和比酶活性的限制。此外,單位質(zhì)量、單位體積或單個細(xì)胞中酶的總量也需要限定在一定范圍內(nèi)。將這些系統(tǒng)水平的酶資源約束以特定數(shù)學(xué)形式引入計量學(xué)模型中即可得到酶約束模型。
4、目前酶約束代謝網(wǎng)絡(luò)模型分析算法主要分為兩類:一類算法是用于生物學(xué)現(xiàn)象模擬和預(yù)測,例如溢流代謝、底物層級利用和能量效率等多種生物學(xué)現(xiàn)象。另一類算法是代謝工程靶點(diǎn)模擬,可用于識別途徑中的關(guān)鍵酶,例如基于酶成本的排序法、基于fesof的酶量掃描算法,以及基于不同實驗條件(如高生長低產(chǎn)物生成(hglp)和低生長高產(chǎn)物生成(lghp)條件下)的酶成本差異方法。
5、此外,由于上述模型中熱力學(xué)相關(guān)參數(shù)的缺失,人們常常難以準(zhǔn)確評估反應(yīng)的可逆性,這可能導(dǎo)致模型預(yù)測的途徑缺乏生物學(xué)可行性,例如出現(xiàn)能量和還原力的無限循環(huán)問題。目前,將反應(yīng)的熱力學(xué)參數(shù)引入代謝網(wǎng)絡(luò)模型的方法主要有兩種:一種是,對gem中的每個代謝反應(yīng)添加熱力學(xué)約束,通過混合整數(shù)線性規(guī)劃實現(xiàn),途徑熱力學(xué)約束的引入。另一種方法是將熱力學(xué)驅(qū)動力最大化作為目標(biāo)函數(shù)(mdf方法)。該方法的核心原則遵循木桶原理,即在滿足代謝物濃度約束的解空間內(nèi),尋找能使途徑中熱力學(xué)上的瓶頸反應(yīng)驅(qū)動力最高的濃度分布。通過這種方法,可以預(yù)測途徑中的熱力學(xué)瓶頸(指途徑中的熱力學(xué)可行性最差的反應(yīng))和限制性代謝物(指對于途徑的熱力學(xué)水平發(fā)揮限制性作用的代謝物),并制定相應(yīng)的優(yōu)化策略。但是熱力學(xué)瓶頸和限制性代謝物的評估方法很早就已經(jīng)提出,但是一直沒有可以直接使用的算法。
6、綜上所述,隨著約束條件的增多,會導(dǎo)致模擬計算非常緩慢。為此,本技術(shù)提供一種多約束代謝網(wǎng)絡(luò)模型工具包的生成方法和應(yīng)用。
技術(shù)實現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供一種多約束代謝網(wǎng)絡(luò)模型工具包的生成方法和應(yīng)用,所述的生成辦法,通過整合熱力學(xué)因素,可以有效體現(xiàn)代謝物濃度對可逆性的影響,從而彌補(bǔ)了當(dāng)前酶約束模型普遍存在的過度簡化所導(dǎo)致的約束松弛、預(yù)測失真和研究角度單一等問題。
2、本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
3、本技術(shù)的第一目的,一種多約束代謝網(wǎng)絡(luò)模型工具包的生成方法,包括以下步驟:
4、構(gòu)建多約束代謝網(wǎng)絡(luò)模型;
5、對所述多約束代謝網(wǎng)絡(luò)模型,進(jìn)行參數(shù)校正,獲得參數(shù)修正后的模型;
6、使用所述參數(shù)修正后的模型,進(jìn)行模型分析,獲得模型分析結(jié)果;
7、所述多約束代謝網(wǎng)絡(luò)模型包括酶約束模型、酶熱約束模型、熱力學(xué)約束模型;
8、所述參數(shù)校正包括酶動力學(xué)參數(shù)修正、熱力學(xué)參數(shù)修正。
9、優(yōu)選地,所述模型分析包括表型模擬分析和代謝工程靶點(diǎn)預(yù)測分析;
10、所述代謝工程靶點(diǎn)預(yù)測分析包括瓶頸反應(yīng)挖掘、同工酶偶聯(lián)挖掘、連續(xù)反應(yīng)偶聯(lián)挖掘、能量偶聯(lián)挖掘、限制性代謝物挖掘、關(guān)鍵酶挖掘。
11、優(yōu)選地,所述模型分析結(jié)果為將結(jié)果進(jìn)行可視化;
12、所述結(jié)果可視化包括mdf折線圖、累計分布圖、表型相平面圖、代謝溢流圖、tradeoff圖、途徑可視化。
13、優(yōu)選地,所述熱力學(xué)參數(shù)修正包括動力學(xué)參數(shù)修正、熱動力學(xué)參數(shù)修正。
14、優(yōu)選地,所述動力學(xué)參數(shù)修正包括使用酶動力學(xué)參數(shù)自動化校正算法,流程為:
15、首先,根據(jù)當(dāng)前模型計算酶的使用情況,并從中選擇使用酶最多的反應(yīng);
16、然后,根據(jù)該反應(yīng)的ec?code在kcat_max字典中找到相應(yīng)的kcat最大值,并將其應(yīng)用到模型中;
17、最后,更新循環(huán)計數(shù)器,記錄每次運(yùn)算結(jié)果,并打印結(jié)果。
18、優(yōu)選地,根據(jù)權(quán)利要求4所述的生成方法,其特征在于,所述動力學(xué)參數(shù)修正包括使用熱力學(xué)參數(shù)自動化校正算法,進(jìn)行修正。
19、優(yōu)選地,所述表型模擬分析包括生長速率模擬和產(chǎn)品模擬。
20、優(yōu)選地,所述瓶頸反應(yīng)挖掘的算法,流程為:
21、設(shè)置生物量合成反應(yīng)的通量下限,然后確定通路可達(dá)到的mdf水平;
22、隨后,將此mdf值用作約束條件,求解最大生長速率水平;
23、然后,將最大生物量合成速率和mdf值同時作為約束條件,計算模型中每個反應(yīng)的熱力學(xué)驅(qū)動力的上下限;
24、最后,如果上限和下限都等于mdf值,則將反應(yīng)識別為瓶頸反應(yīng);其中,通過pfba方法輸出的通路內(nèi)對反應(yīng)進(jìn)行可變性分析,熱力學(xué)驅(qū)動力值等于mdf。
25、更優(yōu)選地,針對所述瓶頸反應(yīng)尋找同工酶偶聯(lián),流程為:根據(jù)識別的瓶頸反應(yīng),在多約束模型中搜索與相同基因-蛋白質(zhì)-反應(yīng)(gpr)關(guān)聯(lián)并且標(biāo)準(zhǔn)吉布斯自由能小于0的反應(yīng)。
26、本技術(shù)的第二目的,提供一種多約束代謝網(wǎng)絡(luò)模型工具包的應(yīng)用,將多約束代謝網(wǎng)絡(luò)模型工具包,應(yīng)用到預(yù)測細(xì)胞代謝的瓶頸和關(guān)鍵調(diào)控改造靶點(diǎn)上。
27、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
28、1.本技術(shù)所述的生成方法,生成得到的工具包,含有多種模擬分析方法和可視化方法,比如熱力學(xué)瓶頸反應(yīng)分析算法、限制性酶分析算法,以及限制性代謝物分析算法等。以及還包括同工酶偶聯(lián)挖掘算法、連續(xù)反應(yīng)偶聯(lián)挖掘算法以及能量偶聯(lián)挖掘算法;工具包可以從途徑熱力學(xué)可行角度挖掘出尚未被廣泛關(guān)注的途徑瓶頸反應(yīng)。此外,工具包的模擬結(jié)果可視化方法,使無編程能力的科研人員也能直觀看到模型分析的相關(guān)結(jié)果。
29、2.本技術(shù)所述的生成方法,生成得到的工具包,可以幫助研究人員從多角度對多約束網(wǎng)絡(luò)模型進(jìn)行分析,從而獲得生長和化學(xué)品生產(chǎn)途徑中的熱力學(xué)瓶頸反應(yīng)、限制性酶和限制性代謝物等多種類型的靶點(diǎn),提高了靶點(diǎn)的覆蓋度和可選擇性,提升了菌種改造的效率。
30、3.本技術(shù)所述的生成方法,在應(yīng)用時,可以發(fā)現(xiàn)多種類型的靶點(diǎn),用于輔助代謝工程改造,開發(fā)可生產(chǎn)高附加值產(chǎn)品的工業(yè)菌株。