本公開涉及深度學(xué)習(xí),并且更具體地涉及人工智能和生物計(jì)算等。尤其涉及一種核糖核酸rna結(jié)構(gòu)的搜索方法、裝置及電子設(shè)備。
背景技術(shù):
1、核糖核酸(ribonucleicacid,簡稱rna)結(jié)構(gòu)搜索技術(shù)具有重要的價(jià)值和廣闊的應(yīng)用前景,但也面臨一定的挑戰(zhàn),相關(guān)技術(shù)中,往往直接基于結(jié)構(gòu)進(jìn)行搜索比對(duì)以確定rna結(jié)構(gòu)的搜索結(jié)果,但是上述方法,往往復(fù)雜度較高,且往往導(dǎo)致核糖核酸rna結(jié)構(gòu)的搜索的效率和準(zhǔn)確率較低,因此,如何在降低獲取rna結(jié)構(gòu)的復(fù)雜度的同時(shí),提高獲取rna結(jié)構(gòu)的效率和準(zhǔn)確性,已成為了亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供了一種核糖核酸rna結(jié)構(gòu)的搜索方法、裝置及電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
2、根據(jù)本公開的一方面,提供了一種核糖核酸rna結(jié)構(gòu)的搜索方法,包括:根據(jù)所述樣本rna結(jié)構(gòu)和所述還原rna結(jié)構(gòu),確定重建損失;根據(jù)所述樣本潛在空間表示和所述樣本離散化表示,確定量化損失;根據(jù)所述重建損失和所述量化損失,對(duì)所述vq-vae模型進(jìn)行模型參數(shù)的調(diào)整。
3、根據(jù)本公開的另一方面,提供了一種核糖核酸rna結(jié)構(gòu)的搜索裝置,包括:獲取模塊,用于獲取待搜索的第一rna結(jié)構(gòu)的第一離散化序列,作為查詢序列;確定模塊,用于基于所述查詢序列,在預(yù)先構(gòu)建的rna結(jié)構(gòu)數(shù)據(jù)庫進(jìn)行索引搜索,確定命中索引序列;搜索模塊,用于根據(jù)所述查詢序列和所述命中索引序列,在所述rna結(jié)構(gòu)數(shù)據(jù)庫中進(jìn)行結(jié)構(gòu)搜索,確定所述第一rna結(jié)構(gòu)對(duì)應(yīng)的至少一個(gè)目標(biāo)rna結(jié)構(gòu)。
4、根據(jù)本公開的另一方面,提供了一種電子設(shè)備,包括:至少一個(gè)處理器;以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本公開的一方面所述的核糖核酸rna結(jié)構(gòu)的搜索方法。
5、根據(jù)本公開的另一方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)本公開的一方面所述的核糖核酸rna結(jié)構(gòu)的搜索方法。
6、根據(jù)本公開的另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本公開的一方面所述的核糖核酸rna結(jié)構(gòu)的搜索方法的步驟。
7、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種核糖核酸rna結(jié)構(gòu)的搜索方法,其中,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取待搜索的第一rna結(jié)構(gòu)的第一離散化序列,作為查詢序列之前,還包括:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述根據(jù)所述第二離散化序列,構(gòu)建所述rna結(jié)構(gòu)數(shù)據(jù)庫的索引信息,包括:
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,所述基于所述查詢序列,在預(yù)先構(gòu)建的rna結(jié)構(gòu)數(shù)據(jù)庫中進(jìn)行搜索,得到命中索引序列,包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述根據(jù)所述查詢序列和所述命中索引序列,從所述rna結(jié)構(gòu)數(shù)據(jù)庫中,確定所述第一rna結(jié)構(gòu)對(duì)應(yīng)的至少一個(gè)目標(biāo)rna結(jié)構(gòu),包括:
6.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,所述方法包括:
7.根據(jù)權(quán)利要求6所述的方法,其中,所述獲取所述任一rna結(jié)構(gòu)的結(jié)構(gòu)信息,包括:
8.根據(jù)權(quán)利要求6所述的方法,其中,所述根據(jù)所述任一rna結(jié)構(gòu)的結(jié)構(gòu)信息,確定所述任一rna結(jié)構(gòu)的離散化序列,包括:
9.根據(jù)權(quán)利要求8所述的方法,其中,所述方法包括:
10.根據(jù)權(quán)利要求9所述的方法,其中,所述離散化詞表包括多個(gè)碼本向量和所述碼本向量對(duì)應(yīng)的狀態(tài)碼,其中,所述rna結(jié)構(gòu)的離散化序列包括所述離散化詞表中與所述量化向量匹配的碼本向量對(duì)應(yīng)的狀態(tài)碼組成。
11.根據(jù)權(quán)利要求9所述的方法,其中,所述vq-vae模型的訓(xùn)練過程,包括:
12.根據(jù)權(quán)利要求11所述的方法,其中,所述根據(jù)所述樣本rna結(jié)構(gòu)和所述還原rna結(jié)構(gòu),所述樣本潛在空間表示和所述樣本離散化表示,對(duì)所述vq-vae模型進(jìn)行模型參數(shù)的調(diào)整,包括:
13.一種核糖核酸rna結(jié)構(gòu)的搜索裝置,包括:
14.根據(jù)權(quán)利要求13所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述獲取待搜索的第一rna結(jié)構(gòu)的第一離散化序列,作為查詢序列之前,所述裝置,還用于:
15.根據(jù)權(quán)利要求14所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述裝置,還用于:
16.根據(jù)權(quán)利要求13-15所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述確定模塊,還用于:
17.根據(jù)權(quán)利要求16所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述確定模塊,還用于:
18.根據(jù)權(quán)利要求18所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述裝置,還用于:
19.根據(jù)權(quán)利要求18所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述裝置,還用于:
20.根據(jù)權(quán)利要求18所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述裝置,還用于:
21.根據(jù)權(quán)利要求20所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述裝置,還用于:
22.根據(jù)權(quán)利要求21所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述離散化詞表包括多個(gè)碼本向量和所述碼本向量對(duì)應(yīng)的狀態(tài)碼,其中,所述rna結(jié)構(gòu)的離散化序列包括所述離散化詞表中與所述量化向量匹配的碼本向量對(duì)應(yīng)的狀態(tài)碼組成。
23.根據(jù)權(quán)利要求21所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述vq-vae模型的訓(xùn)練過程,包括:
24.根據(jù)權(quán)利要求23所述的核糖核酸rna結(jié)構(gòu)的搜索裝置,其中,所述裝置,還用于:
25.一種電子設(shè)備,包括:
26.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1-12中任一項(xiàng)所述的方法。
27.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1-12中任一項(xiàng)所述的方法的步驟。