欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于擴散模型進行藥物分子生成的處理方法和裝置與流程

文檔序號:40574180發(fā)布日期:2025-01-03 11:38閱讀:12來源:國知局
一種基于擴散模型進行藥物分子生成的處理方法和裝置與流程

本發(fā)明涉及數(shù)據(jù)處理,特別涉及一種基于擴散模型進行藥物分子生成的處理方法和裝置。


背景技術(shù):

1、在藥物研發(fā)領域,基于結(jié)構(gòu)的藥物設計(structure-based?drug?design,?sbdd)方式是通過分析靶標蛋白質(zhì)(又稱目標蛋白質(zhì))分子的三維構(gòu)象來設計能與其進行有效結(jié)合的配體分子。常規(guī)的分析方式是通過分子運動模擬和量子化學計算來進行處理,而通過實踐應用我們發(fā)現(xiàn)這種常規(guī)分析方式的模擬/計算周期較長、分析效率并不高。


技術(shù)實現(xiàn)思路

1、本發(fā)明的目的,就是針對現(xiàn)有技術(shù)的缺陷,提供一種基于擴散模型進行藥物分子生成的處理方法、裝置、電子設備及計算機可讀存儲介質(zhì)。本發(fā)明預先設計一個用于根據(jù)模型輸入的蛋白質(zhì)口袋構(gòu)象進行對應的配體質(zhì)心坐標和配體原子總數(shù)預測處理的模型作為分子預測模型并對其進行訓練,并將三類基于擴散模型實現(xiàn)并已訓練成熟的配體分子生成模型(diffbp模型、targetdiff模型、d3fg模型)作為對應的配體分子生成模型、原子級優(yōu)化模型和組件級優(yōu)化模型;然后使用上述四類模型(分子預測模型、配體分子生成模型、原子級優(yōu)化模型和組件級優(yōu)化模型)來自動處理配體分子的批量生成任務,并在任務處理過程中利用計算機輔助藥物設計(computer-aided?drug?design,ccad)工具對每個配體分子的五類指標分數(shù)(ba、qed、sa、sim、lpsk)進行計算,并在任務處理結(jié)束之前對當次批量任務的五類指標分數(shù)進行統(tǒng)計評估。使用本發(fā)明基于擴散模型的配體分子設計方式對傳統(tǒng)基于分子運動模擬和量子化學計算的配體分子設計方式進行替換,可以縮短分子設計周期、提高設計效率。

2、為實現(xiàn)上述目的,本發(fā)明實施例第一方面提供了一種基于擴散模型進行藥物分子生成的處理方法,所述方法包括:

3、設計一個用于根據(jù)模型輸入的蛋白質(zhì)口袋構(gòu)象進行對應的配體質(zhì)心坐標和配體原子總數(shù)預測處理的模型作為分子預測模型;并基于預設的第一數(shù)據(jù)集對所述分子預測模型進行訓練;并將訓練成熟的diffbp模型、targetdiff模型和d3fg模型作為對應的配體分子生成模型、原子級優(yōu)化模型和組件級優(yōu)化模型;所述diffbp模型、所述targetdiff模型和所述d3fg模型各為一類基于擴散模型實現(xiàn)的配體分子生成模型;

4、接收用戶輸入的藥物分子生成任務數(shù)據(jù)集合作為對應的第一數(shù)據(jù)集合;所述第一數(shù)據(jù)集合包括第一生成分子數(shù)量、第一蛋白質(zhì)口袋構(gòu)象、第一參考配體分子構(gòu)象和第一指標集;所述第一生成分子數(shù)量為一個正整數(shù);所述第一蛋白質(zhì)口袋構(gòu)象為一個蛋白質(zhì)口袋對應的三維分子構(gòu)象;所述第一參考配體分子構(gòu)象為一個參考配體分子的所述三維分子構(gòu)象;所述第一指標集至少包括第一ba指標閾值、第一qed指標閾值、第一sa指標閾值、第一sim指標閾值和第一lpsk指標閾值組成;所述三維分子構(gòu)象由多個原子對象組成;所述原子對象包括原子索引、原子類型和原子坐標;

5、基于所述分子預測模型、所述配體分子生成模型、所述原子級優(yōu)化模型和所述組件級優(yōu)化模型根據(jù)所述第一數(shù)據(jù)集合進行配體分子生成任務處理得到對應的第一任務報告向用戶反饋。

6、優(yōu)選的,所述分子預測模型的模型輸入為一個蛋白質(zhì)口袋構(gòu)象a0,模型輸出為一個參數(shù)預測向量p;所述分子預測模型用于對模型輸入的所述蛋白質(zhì)口袋構(gòu)象a0對應的配體分子的質(zhì)心坐標和原子總數(shù)進行預測處理并輸出對應的所述參數(shù)預測向量p;所述蛋白質(zhì)口袋構(gòu)象a0為一個蛋白質(zhì)口袋對應的所述三維分子構(gòu)象;所述參數(shù)預測向量p包括預測質(zhì)心坐標和預測原子總數(shù);

7、所述diffbp模型的模型輸入包括蛋白質(zhì)口袋構(gòu)象a1、配體分子輸入構(gòu)象bin,1和配體分子質(zhì)心坐標,模型輸出為一個對應的配體分子輸出構(gòu)象bout,1;所述diffbp模型用于將模型輸入的所述配體分子輸入構(gòu)象bin,1作為一個已加擾的擴散后構(gòu)象,并根據(jù)模型輸入的所述蛋白質(zhì)口袋構(gòu)象a1和所述配體分子質(zhì)心坐標對當前擴散后構(gòu)象中的各原子類型與坐標進行迭代去噪處理得到對應的去噪后配體構(gòu)象,并將當前得到的去噪后配體構(gòu)象作為對應的所述配體分子輸出構(gòu)象bout,1輸出;其中,所述蛋白質(zhì)口袋構(gòu)象a1為一個蛋白質(zhì)口袋對應的所述三維分子構(gòu)象;所述配體分子輸入構(gòu)象bin,1和所述配體分子輸出構(gòu)象bout,1為一個與當前蛋白質(zhì)口袋結(jié)合的配體分子在所述diffbp模型處理前后的所述三維分子構(gòu)象;

8、所述targetdiff模型的模型輸入包括蛋白質(zhì)口袋構(gòu)象a2和配體分子輸入構(gòu)象bin,2,模型輸出為一個對應的配體分子輸出構(gòu)象bout,2;所述targetdiff模型用于將模型輸入的所述配體分子輸入構(gòu)象bin,2作為一個已加擾的擴散后構(gòu)象,并根據(jù)模型輸入的所述蛋白質(zhì)口袋構(gòu)象a2對當前擴散后構(gòu)象中的各原子類型與坐標進行迭代去噪處理得到對應的去噪后配體構(gòu)象,并將當前得到的去噪后配體構(gòu)象作為對應的所述配體分子輸出構(gòu)象bout,2輸出;其中,所述蛋白質(zhì)口袋構(gòu)象a2為一個蛋白質(zhì)口袋對應的所述三維分子構(gòu)象;所述配體分子輸入構(gòu)象bin,2和所述配體分子輸出構(gòu)象bout,2為一個與當前蛋白質(zhì)口袋結(jié)合的配體分子在所述targetdiff模型處理前后的所述三維分子構(gòu)象;

9、所述d3fg模型的模型輸入包括蛋白質(zhì)口袋構(gòu)象a3和配體分子輸入構(gòu)象bin,3,模型輸出為一個對應的配體分子輸出構(gòu)象bout,3;所述d3fg模型用于對模型輸入的所述蛋白質(zhì)口袋構(gòu)象a3進行對應的氨基酸組件識別得到對應的氨基酸組件集合,并對模型輸入的所述配體分子輸入構(gòu)象bin,2進行對應的官能團與連接器組件識別得到對應的官能團組件集合和連接器組件集合,并根據(jù)所述氨基酸組件集合對所述官能團組件集合和所述連接器組件集合中的各官能團組件以及各連接器組件的三維構(gòu)象進行迭代去噪處理得到對應的去噪后配體構(gòu)象,并將當前得到的去噪后配體構(gòu)象作為對應的所述配體分子輸出構(gòu)象bout,3輸出;其中,所述蛋白質(zhì)口袋構(gòu)象a3為一個蛋白質(zhì)口袋對應的所述三維分子構(gòu)象;所述配體分子輸入構(gòu)象bin,3和所述配體分子輸出構(gòu)象bout,3為一個與當前蛋白質(zhì)口袋結(jié)合的配體分子在所述d3fg模型處理前后的所述三維分子構(gòu)象。

10、優(yōu)選的,所述第一ba指標閾值為親和力評估指標閾值;

11、所述第一qed指標閾值為藥物性質(zhì)定量評估指標閾值;

12、所述第一sa指標閾值為可合成性評估指標閾值;

13、所述第一sim指標閾值為結(jié)構(gòu)相似性評估指標閾值;

14、所述第一lpsk指標閾值為lipinski五規(guī)則的評估指標閾值。

15、優(yōu)選的,所述第一數(shù)據(jù)集包括多個第一數(shù)據(jù)記錄;所述第一數(shù)據(jù)記錄包括第一訓練構(gòu)象、第一口袋原子索引集和第一配體原子索引集;所述第一訓練構(gòu)象為一個復合物分子對應的所述三維分子構(gòu)象,該復合物分子由一個蛋白質(zhì)口袋和一個配體分子結(jié)合而成;所述第一口袋原子索引集和所述第一配體原子索引集各自都由所述第一訓練構(gòu)象中的多個所述原子索引組成;所述第一口袋原子索引集為當前復合物分子中蛋白質(zhì)口袋的原子索引集;所述第一配體原子索引集當前復合物分子中配體分子的原子索引集;

16、所述第一任務報告包括第一配體分子列表和第一指標分析列表;

17、所述第一配體分子列表由所述第一任務數(shù)量的第一配體分子記錄組成;

18、所述第一配體分子記錄包括第一配體構(gòu)象字段、第一ba指標字段、第一qed指標字段、第一sa指標字段、第一sim指標字段和第一lpsk指標字段;

19、所述第一指標分析列表包括多個第一指標分析記錄;

20、所述第一指標分析記錄包括第一指標類型字段、第一指標閾值字段、第一指標統(tǒng)計字段和第一指標達標狀態(tài)字段;所述第一指標類型字段包括ba類型、qed類型、sa類型、sim類型和lpsk類型;所述第一指標閾值字段為所述第一指標類型字段對應的所述第一ba指標閾值、所述第一qed指標閾值、所述第一sa指標閾值、所述第一sim指標閾值或所述第一lpsk指標閾值;所述第一指標統(tǒng)計字段為與所述第一指標類型字段對應的指標統(tǒng)計參數(shù);所述第一指標達標狀態(tài)字段包括達標和未達標。

21、優(yōu)選的,所述基于預設的第一數(shù)據(jù)集對所述分子預測模型進行訓練,具體包括:

22、步驟51,基于預設的第一切分比例對所述第一數(shù)據(jù)集進行隨機切分得到對應的兩個子數(shù)據(jù)集記為對應的第一訓練集和第一評估集;

23、其中,所述第一訓練集和所述第一評估集都由多個所述第一數(shù)據(jù)記錄組成;所述第一訓練集的記錄總數(shù)與所述第一評估集的記錄總數(shù)的比值滿足所述第一切分比例;

24、步驟52,將所述第一訓練集的第一個所述第一數(shù)據(jù)記錄提取出來作為對應的當前訓練記錄;

25、步驟53,將所述當前訓練記錄的所述第一訓練構(gòu)象、所述第一口袋原子索引集和所述第一配體原子索引集作為對應的當前訓練構(gòu)象、第一原子索引集和第二原子索引集;并分別基于所述第一、第二原子索引集對所述當前訓練構(gòu)象進行對應的蛋白質(zhì)口袋和配體分子構(gòu)象提取處理得到對應的第一口袋構(gòu)象和第一配體構(gòu)象;并對所述第一配體構(gòu)象中的所有所述原子對象的所述原子坐標進行均值計算并將計算結(jié)果作為對應的第一標簽質(zhì)心坐標;并對所述第一配體構(gòu)象的原子對象總數(shù)進行統(tǒng)計并將統(tǒng)計結(jié)果作為對應的第一標簽原子總數(shù);并由所述第一標簽質(zhì)心坐標和所述第一標簽原子總數(shù)組成對應的第一參數(shù)標簽向量;

26、步驟54,由所述分子預測模型對所述第一口袋構(gòu)象對應的配體分子的質(zhì)心坐標和原子總數(shù)進行預測處理得到對應的第一參數(shù)預測向量;

27、步驟55,將所述第一參數(shù)標簽向量和所述第一參數(shù)預測向量帶入預設的第一模型損失函數(shù)進行計算得到對應的第一損失值;

28、其中,所述第一模型損失函數(shù)至少包括l1損失函數(shù)、l2損失函數(shù);

29、步驟56,對所述第一損失值是否滿足預設的第一損失值范圍進行識別;若所述第一損失值滿足所述第一損失值范圍,則對所述當前訓練記錄是否為所述第一訓練集的最后一個所述第一數(shù)據(jù)記錄進行識別,若是則轉(zhuǎn)至步驟57,若否則將所述第一訓練集的下一個所述第一數(shù)據(jù)記錄提取出來作為新的所述當前訓練記錄并返回步驟53;若所述第一損失值不滿足所述第一損失值范圍,則基于預設的第一模型優(yōu)化器朝著使所述第一模型損失函數(shù)達到最小值的方向?qū)λ龇肿宇A測模型的模型參數(shù)進行一輪調(diào)制,并在本輪調(diào)制結(jié)束時返回步驟54;

30、其中,所述第一模型優(yōu)化器至少包括sgd優(yōu)化器和adam優(yōu)化器;

31、步驟57,對所述第一評估集的所有所述第一數(shù)據(jù)記錄進行一輪遍歷;并在本輪遍歷過程中,將當前遍歷的所述第一數(shù)據(jù)記錄作為對應的當前評估記錄;并將所述當前評估記錄的所述第一訓練構(gòu)象、所述第一口袋原子索引集和所述第一配體原子索引集作為對應的當前訓練構(gòu)象、第三原子索引集和第四原子索引集;并分別基于所述第三、第四原子索引集對所述當前訓練構(gòu)象進行對應的蛋白質(zhì)口袋和配體分子構(gòu)象提取處理得到對應的第二口袋構(gòu)象和第二配體構(gòu)象;并對所述第二配體構(gòu)象中的所有所述原子對象的所述原子坐標進行均值計算并將計算結(jié)果作為對應的第二標簽質(zhì)心坐標;并對所述第二配體構(gòu)象的原子對象總數(shù)進行統(tǒng)計并將統(tǒng)計結(jié)果作為對應的第二標簽原子總數(shù);并由所述第二標簽質(zhì)心坐標和所述第二標簽原子總數(shù)組成對應的第二參數(shù)標簽向量;并由所述分子預測模型對所述第二口袋構(gòu)象對應的配體分子的質(zhì)心坐標和原子總數(shù)進行預測處理得到對應的第二參數(shù)預測向量;并由本次得到的所述第二參數(shù)標簽向量和對應的所述第二參數(shù)預測向量組成一個對應的第一標簽-預測對;并在本輪遍歷結(jié)束時,將得到的所有所述第一預測-標簽對帶入預設的第一模型評估函數(shù)進行計算得到對應的第一評估值;

32、其中,所述第一模型評估函數(shù)至少包括rmse函數(shù);

33、步驟58,對所述第一評估值是否滿足預設的第一評估值范圍進行識別;若所述第一評估值不滿足所述第一評估值范圍,則返回步驟51繼續(xù)訓練;若所述第一評估值滿足所述第一評估值范圍,則停止訓練并確認所述分子預測模型的模型訓練結(jié)束。

34、優(yōu)選的,所述基于所述分子預測模型、所述配體分子生成模型、所述原子級優(yōu)化模型和所述組件級優(yōu)化模型根據(jù)所述第一數(shù)據(jù)集合進行配體分子生成任務處理得到對應的第一任務報告向用戶反饋,具體包括:

35、步驟6-1,從所述第一數(shù)據(jù)集合中提取出對應的所述第一生成分子數(shù)量、所述第一蛋白質(zhì)口袋構(gòu)象、所述第一參考配體分子構(gòu)象和所述第一指標集;并初始化對應的第一計數(shù)器為1;

36、步驟6-2,由所述分子預測模型對所述第一蛋白質(zhì)口袋構(gòu)象對應的配體分子的質(zhì)心坐標和原子總數(shù)進行預測處理得到對應的當前參數(shù)預測向量;并將所述參數(shù)預測向量中的所述預測質(zhì)心坐標和所述預測原子總數(shù)作為對應的第一質(zhì)心坐標和第一原子總數(shù);

37、步驟6-3,基于所述第一質(zhì)心坐標和所述第一原子總數(shù)初始化一個配體分子構(gòu)象作為對應的第一配體分子構(gòu)象;

38、其中,所述第一配體分子構(gòu)象的原子對象總數(shù)與所述第一原子總數(shù)匹配;所述第一配體分子構(gòu)象內(nèi)的所有所述原子類型均為預設的無效原子類型;所述第一配體分子構(gòu)象內(nèi)的所有所述原子坐標為滿足高斯分布的隨機坐標,且所述第一配體分子構(gòu)象內(nèi)的所有所述原子坐標的坐標均值與所述第一質(zhì)心坐標匹配;所述第一配體分子構(gòu)象內(nèi)任意兩個所述原子對象之間的連線不會與所述第一蛋白質(zhì)口袋構(gòu)象內(nèi)對應的任意兩個所述原子對象之間的連線相交;

39、步驟6-4,將所述第一蛋白質(zhì)口袋構(gòu)象、所述第一質(zhì)心坐標和所述第一配體分子構(gòu)象輸入所述配體分子生成模型;由所述配體分子生成模型將所述第一配體分子構(gòu)象作為一個已加擾的擴散后構(gòu)象,并所述第一蛋白質(zhì)口袋構(gòu)象和所述第一質(zhì)心坐標對當前擴散后構(gòu)象中的各原子類型與坐標進行迭代去噪處理得到對應的去噪后配體構(gòu)象,并將當前得到的去噪后配體構(gòu)象作為對應的第二配體分子構(gòu)象輸出;

40、步驟6-5,將所述第一蛋白質(zhì)口袋構(gòu)象和所述第二配體分子構(gòu)象輸入所述原子級優(yōu)化模型;由所述原子級優(yōu)化模型將所述第二配體分子構(gòu)象作為一個已加擾的擴散后構(gòu)象,并根據(jù)所述第一蛋白質(zhì)口袋構(gòu)象對當前擴散后構(gòu)象中的各原子類型與坐標進行迭代去噪處理得到對應的去噪后配體構(gòu)象,并將當前得到的去噪后配體構(gòu)象作為對應的第三配體分子構(gòu)象輸出;

41、步驟6-6,將所述第一蛋白質(zhì)口袋構(gòu)象和所述第三配體分子構(gòu)象輸入所述組件級優(yōu)化模型;由所述組件級優(yōu)化模型對所述第一蛋白質(zhì)口袋構(gòu)象進行對應的氨基酸組件識別得到對應的第一氨基酸組件集合,并對所述第三配體分子構(gòu)象進行對應的官能團與連接器組件識別得到對應的第一官能團組件集合和第一連接器組件集合,并根據(jù)所述第一氨基酸組件集合對所述第一官能團組件集合和所述第一連接器組件集合中的各官能團組件以及各連接器組件的三維構(gòu)象進行迭代去噪處理得到對應的去噪后配體構(gòu)象,并將當前得到的去噪后配體構(gòu)象作為對應的第四配體分子構(gòu)象輸出;

42、步驟6-7,使用預設的計算機輔助藥物設計工具,對所述第一蛋白質(zhì)口袋構(gòu)象與所述第四配體分子構(gòu)象的結(jié)合親和力分數(shù)進行計算得到對應的第一指標分數(shù);并對所述第四配體分子構(gòu)象的藥物性質(zhì)定量評估分數(shù)進行計算得到對應的第二指標分數(shù);并對所述第四配體分子構(gòu)象的可合成性分數(shù)進行計算得到對應的第三指標分數(shù);并對所述第四配體分子構(gòu)象與所述第一參考配體分子構(gòu)象的結(jié)構(gòu)相似分數(shù)進行計算得到對應的第四指標分數(shù);并對所述第四配體分子構(gòu)象是否滿足lipinski五規(guī)則進行識別,若滿足則設置對應的第五指標分數(shù)為1,若不滿足則設置對應的所述第五指標分數(shù)為0;

43、其中,所述計算機輔助藥物設計工具至少包括dock、autodock、gold、flexx、glide、icm、rdkits、discovery?studio;

44、步驟6-8,由所述第四配體分子構(gòu)象、所述第一指標分數(shù)、所述第二指標分數(shù)、所述第三指標分數(shù)、所述第四指標分數(shù)和所述第五指標分數(shù)作為對應的所述第一配體構(gòu)象字段、所述第一ba分數(shù)字段、所述第一qed分數(shù)字段、所述第一sa分數(shù)字段、所述第一sim分數(shù)字段和所述第一lpsk分數(shù)字段組成一個對應的所述第一配體分子記錄;

45、步驟6-9,對所述第一計數(shù)器加1;并對本次加1后的所述第一計數(shù)器是否超過對應的所述第一生成分子數(shù)量進行識別;若未超過,則返回步驟6-3;若已超過,則由得到的所述第一生成分子數(shù)量的所述第一配體分子記錄組成對應的所述第一配體分子列表,并轉(zhuǎn)至步驟6-10;

46、步驟6-10,將所述第一配體分子列表中的所有所述第一ba分數(shù)字段帶入預設的第一評估函數(shù)進行計算得到對應的第一指標評估值、所有所述第一qed分數(shù)字段帶入預設的第二評估函數(shù)進行計算得到對應的第二指標評估值、所有所述第一sa分數(shù)字段帶入預設的第三評估函數(shù)進行計算得到對應的第三指標評估值、所有所述第一sim分數(shù)字段帶入預設的第四評估函數(shù)進行計算得到對應的第四指標評估值;并對所述第一配體分子列表中所述第一lpsk分數(shù)字段為1的所述第一配體分子記錄的總數(shù)進行統(tǒng)計d得到對應的第一總數(shù),并基于所述第一總數(shù)和所述第一生成分子數(shù)量計算對應的第五指標評估值=(第一總數(shù)/第一生成分子數(shù)量)×100%;

47、其中,所述第一、第二、第三和第四評估函數(shù)均基于rmse函數(shù)實現(xiàn);

48、步驟6-11,將所述第一、第二、第三、第四和第五指標評估值依次作為對應的當前指標評估值;并設置一個對應的當前指標類型為所述當前指標評估值對應的ba類型、qed類型、sa類型、sim類型或lpsk類型;并將所述第一指標集中與所述當前指標類型對應的所述第一ba指標閾值、所述第一qed指標閾值、所述第一sa指標閾值、所述第一sim指標閾值或所述第一lpsk指標閾值作為對應的當前指標閾值;并對所述當前指標評估值是否低于對應的所述當前指標閾值進行識別,若是則設置一個對應的當前指標達標狀態(tài)為未達標,若否則設置一個對應的所述當前指標達標狀態(tài)為達標;并將所述當前指標類型、所述當前指標閾值、所述當前指標評估值和所述當前指標達標狀態(tài)作為對應的所述第一指標類型字段、所述第一指標閾值字段、所述第一指標統(tǒng)計字段和所述第一指標達標狀態(tài)字段組成一個對應的所述第一指標分析記錄;并由得到的所有所述第一指標分析記錄組成一個對應的所述第一指標分析列表;

49、步驟6-12,由得到的所述第一配體分子列表和所述第一指標分析列表組成對應的所述第一任務報告向用戶反饋。

50、本發(fā)明實施例第二方面提供了一種用于實現(xiàn)上述第一方面所述的基于擴散模型進行藥物分子生成的處理方法的裝置,所述裝置包括:模型準備模塊、任務數(shù)據(jù)接收模塊和任務處理模塊;

51、所述模型準備模塊用于設計一個用于根據(jù)模型輸入的蛋白質(zhì)口袋構(gòu)象進行對應的配體質(zhì)心坐標和配體原子總數(shù)預測處理的模型作為分子預測模型;并基于預設的第一數(shù)據(jù)集對所述分子預測模型進行訓練;并將訓練成熟的diffbp模型、targetdiff模型和d3fg模型作為對應的配體分子生成模型、原子級優(yōu)化模型和組件級優(yōu)化模型;所述diffbp模型、所述targetdiff模型和所述d3fg模型各為一類基于擴散模型實現(xiàn)的配體分子生成模型;

52、所述任務數(shù)據(jù)接收模塊用于接收用戶輸入的藥物分子生成任務數(shù)據(jù)集合作為對應的第一數(shù)據(jù)集合;所述第一數(shù)據(jù)集合包括第一生成分子數(shù)量、第一蛋白質(zhì)口袋構(gòu)象、第一參考配體分子構(gòu)象和第一指標集;所述第一生成分子數(shù)量為一個正整數(shù);所述第一蛋白質(zhì)口袋構(gòu)象為一個蛋白質(zhì)口袋對應的三維分子構(gòu)象;所述第一參考配體分子構(gòu)象為一個參考配體分子的所述三維分子構(gòu)象;所述第一指標集至少包括第一ba指標閾值、第一qed指標閾值、第一sa指標閾值、第一sim指標閾值和第一lpsk指標閾值組成;所述三維分子構(gòu)象由多個原子對象組成;所述原子對象包括原子索引、原子類型和原子坐標;

53、所述任務處理模塊用于基于所述分子預測模型、所述配體分子生成模型、所述原子級優(yōu)化模型和所述組件級優(yōu)化模型根據(jù)所述第一數(shù)據(jù)集合進行配體分子生成任務處理得到對應的第一任務報告向用戶反饋。

54、本發(fā)明實施例第三方面提供了一種電子設備,包括:存儲器、處理器和收發(fā)器;

55、所述處理器用于與所述存儲器耦合,讀取并執(zhí)行所述存儲器中的指令,以實現(xiàn)上述第一方面所述的方法步驟;

56、所述收發(fā)器與所述處理器耦合,由所述處理器控制所述收發(fā)器進行消息收發(fā)。

57、本發(fā)明實施例第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機指令,當所述計算機指令被計算機執(zhí)行時,使得所述計算機執(zhí)行上述第一方面所述的方法的指令。

58、本發(fā)明實施例提供了一種基于擴散模型進行藥物分子生成的處理方法、裝置、電子設備及計算機可讀存儲介質(zhì)。由上述內(nèi)容可知,本發(fā)明實施例預先設計一個用于根據(jù)模型輸入的蛋白質(zhì)口袋構(gòu)象進行對應的配體質(zhì)心坐標和配體原子總數(shù)預測處理的模型作為分子預測模型并對其進行訓練,并將三類基于擴散模型實現(xiàn)并已訓練成熟的配體分子生成模型(diffbp模型、targetdiff模型、d3fg模型)作為對應的配體分子生成模型、原子級優(yōu)化模型和組件級優(yōu)化模型;然后使用上述四類模型(分子預測模型、配體分子生成模型、原子級優(yōu)化模型和組件級優(yōu)化模型)來自動處理配體分子的批量生成任務,并在任務處理過程中利用計算機輔助藥物設計工具對每個配體分子的五類指標分數(shù)(ba、qed、sa、sim、lpsk)進行計算,并在任務處理結(jié)束之前對當次批量任務的五類指標分數(shù)進行統(tǒng)計評估。使用本發(fā)明實施例基于擴散模型的配體分子設計方式對傳統(tǒng)基于分子運動模擬和量子化學計算的配體分子設計方式進行替換,既縮短了分子設計周期、又提高了設計效率。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
花莲市| 武功县| 克拉玛依市| 淮阳县| 琼中| 伊吾县| 巴青县| 利津县| 子长县| 雷山县| 新兴县| 哈巴河县| 定日县| 永新县| 太仆寺旗| 丹阳市| 筠连县| 宁城县| 平顶山市| 黔江区| 海口市| 海盐县| 竹北市| 玉溪市| 双鸭山市| 永登县| 沙田区| 金塔县| 鄂温| 长沙县| 合江县| 肥乡县| 澜沧| 龙山县| 当涂县| 商南县| 阳谷县| 南部县| 德阳市| 无锡市| 千阳县|