1.一種分子生成方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的分子生成方法,其特征在于,所述特征處理模塊包括特征編碼模塊、投影器與模態(tài)恢復(fù)模塊,所述基于訓(xùn)練后的多模態(tài)語言模型的特征處理模塊對所述已知模態(tài)蛋白質(zhì)信息進行特征處理,獲取所述目標蛋白質(zhì)對應(yīng)的多模態(tài)標準化特征,包括:
3.如權(quán)利要求2所述的分子生成方法,其特征在于,所述基于訓(xùn)練后的多模態(tài)語言模型的特征處理模塊對所述已知模態(tài)蛋白質(zhì)信息與所述模態(tài)集合進行特征處理,獲取所述目標蛋白質(zhì)對應(yīng)的多模態(tài)標準化特征,還包括:
4.如權(quán)利要求2所述的分子生成方法,其特征在于,所述分子生成模塊包括模態(tài)嵌入模塊、編碼器和解碼器,所述基于訓(xùn)練后的多模態(tài)語言模型的分子生成模塊對所述多模態(tài)標準化特征進行分子生成處理,得到針對所述目標蛋白質(zhì)的目標分子,包括:
5.如權(quán)利要求4所述的分子生成方法,其特征在于,所述基于所述模態(tài)嵌入模塊對所述多模態(tài)標準化特征中各個標準化特征進行模態(tài)嵌入處理,得到多模態(tài)嵌入特征,包括:
6.如權(quán)利要求4所述的分子生成方法,其特征在于,訓(xùn)練所述多模態(tài)語言模型的步驟,包括:
7.如權(quán)利要求6所述的分子生成方法,其特征在于,所述根據(jù)所述多模態(tài)數(shù)據(jù)集訓(xùn)練所述多模態(tài)語言模型中的所述特征處理模塊,確定模態(tài)恢復(fù)損失函數(shù),包括:
8.如權(quán)利要求7所述的分子生成方法,其特征在于,所述基于所述特征處理模塊中的所述特征編碼模塊與所述投影器對所述完整模態(tài)樣本子集進行特征處理,得到所述樣本蛋白質(zhì)對應(yīng)的多模態(tài)標準化特征真實值,包括:
9.如權(quán)利要求7所述的分子生成方法,其特征在于,所述基于所述特征處理模塊中的所述特征編碼模塊、所述投影器與所述模態(tài)恢復(fù)模塊,對所述序列模態(tài)樣本子集或者所述口袋模態(tài)樣本子集進行特征處理,得到所述樣本蛋白質(zhì)對應(yīng)的多模態(tài)標準化特征預(yù)測值,包括:
10.如權(quán)利要求6所述的分子生成方法,其特征在于,所述根據(jù)所述多模態(tài)數(shù)據(jù)集訓(xùn)練所述多模態(tài)語言模型中的所述分子生成模塊,確定分子生成損失函數(shù),包括:
11.如權(quán)利要求6所述的分子生成方法,其特征在于,所述根據(jù)所述多模態(tài)數(shù)據(jù)集訓(xùn)練所述多模態(tài)語言模型中的所述分子生成模塊,確定分子生成損失函數(shù),包括:
12.如權(quán)利要求6所述的分子生成方法,其特征在于,所述模型參數(shù)包括所述投影器的投影參數(shù)、所述模態(tài)恢復(fù)模塊的模態(tài)恢復(fù)參數(shù)與所述分子生成模塊的分子生成參數(shù);所述基于所述模態(tài)恢復(fù)損失函數(shù)與所述分子生成損失函數(shù)更新所述多模態(tài)語言模型的模型參數(shù),包括:
13.一種分子生成裝置,其特征在于,所述裝置包括:
14.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序適于處理器進行加載,以執(zhí)行如權(quán)利要求1-12任一項所述的分子生成方法。
15.一種計算機設(shè)備,其特征在于,所述計算機設(shè)備包括處理器和存儲器,所述存儲器中存儲有計算機程序,所述處理器通過調(diào)用所述存儲器中存儲的所述計算機程序,用于執(zhí)行如權(quán)利要求1-12任一項所述的分子生成方法。
16.一種計算機程序產(chǎn)品,包括計算機指令,其特征在于,所述計算機指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-12任一項所述的分子生成方法。