本技術涉及結構生物學和生物分子建模的,具體而言,涉及一種分子力場建模方法、裝置、電子設備及存儲介質。
背景技術:
1、目前,分子力場中的原子類型大都是人為經驗化定義的,在具體的實踐過程中發(fā)現(xiàn),基于化學家們對化學分子結構的知識來對原子類型進行分類,以及對于原子間作用能量的數(shù)學描述是不夠客觀和精確的,因為當前認知水平下存在其局限性,認知屏障(cognitive?barriers)的存在使得無法以現(xiàn)有的知識和人的直覺客觀地基于原子在不同分子結構中的電子密度分布特征去進行分類,并在現(xiàn)有計算機的計算能力可支撐的運算條件下,建立數(shù)學模型對復雜目標分子體系的能量進行準確運算。在現(xiàn)有的計算能力的基礎上,大多數(shù)相關模型使用經典牛頓力學公式來進行分子能量運算,并據此描述分子運動,這種運算方式存在計算過程的累積誤差,因此對于介于宏觀和微觀尺度之間的原子級別物體描述不夠精確,即模擬的分子力場的精確度不夠。
技術實現(xiàn)思路
1、本技術實施例的目的在于提供一種分子力場建模方法、裝置、電子設備及存儲介質,用于改善模擬的分子力場的精確度不夠的問題。
2、本技術實施例提供了一種分子力場建模方法,包括:根據目標分子的結構特征信息和能量特征信息建立目標分子中的每個原子的指紋圖譜;對目標分子中的每種原子的指紋圖譜進行聚類,得到多種原子類別;針對多種原子類別中的每種原子類別,對不同類別的原子集群進行建模,得到原子集群間的勢能方程;根據不同類別的原子集群的勢能方程建立分子力場。在上述方案的實現(xiàn)過程中,通過根據目標分子的結構特征信息和能量特征信息建立目標分子中的每個原子的指紋圖譜,并對目標分子中的每種原子的指紋圖譜進行聚類,有效地使用聚類過程替代了以人為經驗對原子類型進行分類的情況,從而提高了模擬的分子力場的精確度。
3、可選地,在本技術實施例中,根據目標分子的結構特征信息和能量特征信息建立目標分子中的每個原子的指紋圖譜,包括:獲取目標分子中的所有原子的電荷分布總量;將目標分子中的所有原子的電荷分布總量投影到針對每個原子構建的斐波那契球點陣上,以模擬每個原子表面的電荷密度分布;對目標分子每個原子表面的電荷密度分布進行降維排序,獲得目標分子中的每個原子的指紋圖譜。在上述方案的實現(xiàn)過程中,通過將目標分子中的所有原子的電荷分布總量投影到針對每個原子構建的斐波那契球點陣上,并對目標分子每個原子表面的電荷密度分布進行降維排序,獲得目標分子中的每個原子的指紋圖譜,由于無需考慮分子的全局構型,從而提高了處理分子結構和性質的速度。
4、可選地,在本技術實施例中,獲取目標分子中的所有原子的電荷分布總量,包括:從標準復合物分子文件中提取出目標分子的結構特征信息和目標分子的能量特征信息;根據結構特征信息和能量特征信息確定目標分子中每個原子的電荷分布總量。在上述方案的實現(xiàn)過程中,通過提取文件中的信息,可以更有效地獲得目標分子的結構特征信息和能量特征信息,避免了進行實驗或計算模擬的時間和資源消耗,提高了確定電荷分布總量的效率和準確性。
5、可選地,在本技術實施例中,對目標分子中的每種原子的指紋圖譜進行聚類,包括:根據原子的電荷密度分布對目標分子中的每種原子的指紋圖譜進行聚類,使用聚類評估方法評估聚類結果,并最終確立分類標準。
6、可選地,在本技術實施例中,分子力場包括:原子集群之間的勢能方程;對不同類別的原子集群進行建模,包括:對原子集群進行建模,獲得原子集群原子間的玻爾茲曼概率分布;根據原子集群原子間的玻爾茲曼概率分布確定原子集群之間的勢能方程。在上述方案的實現(xiàn)過程中,通過原子集群原子間的玻爾茲曼概率分布可以更準確地描述分子內部的相互作用,進而有效地提高了勢能方程的準確度。
7、可選地,在本技術實施例中,原子集群包括:二個原子構成的原子對,或者,三個原子構成的原子群;對不同類別的原子集群進行建模,包括:將目標分子中的所有原子劃分為核心區(qū)原子和背景區(qū)原子;通過迭代方式去除背景區(qū)原子對核心區(qū)原子的概率密度分布影響,得到原子群之間的勢能方程,或者,原子對之間的勢能方程。在上述方案的實現(xiàn)過程中,由于迭代方式可以將背景區(qū)原子對于核心區(qū)原子的影響逐漸減小,從而得到更加準確的概率密度分布,進而有效地提高了勢能方程的準確度。
8、可選地,在本技術實施例中,根據不同類別的原子集群的勢能方程建立分子力場,包括:以目標分子中的原子為節(jié)點,以原子集群間的勢能方程為節(jié)點與節(jié)點之間的邊,對不同類別的原子集群進行建模,獲得分子力場。在上述方案的實現(xiàn)過程中,通過對不同類別的原子集群進行建模,從而能夠更加精確地描述分子中的相互作用,提高了分子力場的建模精度和準確率。
9、可選地,在本技術實施例中,目標分子包括:生物分子和類藥分子。
10、本技術實施例還提供了一種分子力場模擬裝置,包括:指紋圖譜建立模塊,用于根據目標分子的結構特征信息和能量特征信息建立目標分子中的每個原子的指紋圖譜;原子類別獲得模塊,用于對目標分子中的每種原子的指紋圖譜進行聚類,得到多種原子類別;勢能方程獲得模塊,用于針對多種原子類別中的每種原子類別,對不同類別的原子集群進行建模,得到原子集群間的勢能方程;分子力場建立模塊,用于根據不同類別的原子集群的勢能方程建立分子力場。
11、可選地,在本技術實施例中,指紋圖譜建立模塊,包括:電荷分布獲取子模塊,用于獲取目標分子中的所有原子的電荷分布總量;電荷密度模擬子模塊,用于將目標分子中的所有原子的電荷分布總量投影到針對每個原子構建的斐波那契球點陣上,以模擬每個原子表面的電荷密度分布;指紋圖譜獲得子模塊,用于對目標分子每個原子表面的電荷密度分布進行降維排序,獲得目標分子中的每個原子的指紋圖譜。
12、可選地,在本技術實施例中,電荷分布獲取子模塊,包括:特征信息提取單元,用于從標準復合物分子文件中提取出目標分子的結構特征信息和目標分子的能量特征信息;電荷分布確定單元,用于根據結構特征信息和能量特征信息確定目標分子中每個原子的電荷分布總量。
13、可選地,在本技術實施例中,原子類別獲得模塊,包括:指紋圖譜聚類子模塊,用于根據原子的電荷密度分布對目標分子中的每種原子的指紋圖譜進行聚類。
14、可選地,在本技術實施例中,分子力場包括:原子集群之間的勢能方程;勢能方程獲得模塊,包括:概率分布獲得子模塊,用于對不同類別的原子集群進行建模,獲得原子集群原子間的玻爾茲曼概率分布;勢能方程確定子模塊,用于根據原子集群原子間的玻爾茲曼概率分布確定原子集群之間的勢能方程。
15、可選地,在本技術實施例中,原子集群包括:二個原子構成的原子對,或者,三個原子構成的原子群;概率分布獲得子模塊,包括:分子原子劃分單元,用于將目標分子中的所有原子劃分為核心區(qū)原子和背景區(qū)原子;去除背景影響單元,用于通過迭代方式去除背景區(qū)原子對核心區(qū)原子的概率密度分布影響,得到原子群之間的勢能方程,或者,原子對之間的勢能方程。
16、可選地,在本技術實施例中,分子力場建立模塊,包括:原子集群建模子模塊,用于以目標分子中的原子為節(jié)點,以原子集群間的勢能方程為節(jié)點與節(jié)點之間的邊,對不同類別的原子集群進行建模,獲得分子力場。
17、可選地,在本技術實施例中,目標分子包括:生物分子和類藥分子。
18、本技術實施例還提供了一種電子設備,包括:處理器和存儲器,存儲器存儲有處理器可執(zhí)行的機器可讀指令,機器可讀指令被處理器執(zhí)行時執(zhí)行如上面描述的方法。
19、本技術實施例還提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機程序,該計算機程序被處理器運行時執(zhí)行如上面描述的方法。