本公開(kāi)屬于檢測(cè),更具體地說(shuō),是涉及一種二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法及裝置。
背景技術(shù):
1、利用液質(zhì)聯(lián)用技術(shù)(lc-ms/ms)產(chǎn)生的質(zhì)譜數(shù)據(jù)進(jìn)行從頭測(cè)序(de?novosequencing),已成為蛋白質(zhì)組學(xué)研究中的一項(xiàng)關(guān)鍵手段。動(dòng)態(tài)規(guī)劃(dynamicprogramming)是實(shí)現(xiàn)從頭測(cè)序的主要方法,動(dòng)態(tài)規(guī)劃這項(xiàng)技術(shù)具有運(yùn)算時(shí)間復(fù)雜度高、復(fù)雜的賦分函數(shù)(scoring?function)難以應(yīng)用的缺點(diǎn)。以往的優(yōu)化方向傾向于降低動(dòng)態(tài)規(guī)劃計(jì)算時(shí)候的精度,例如將計(jì)算單位從0.01道爾頓(dalton)擴(kuò)大到0.1道爾頓,然后將從頭測(cè)序生成的多肽序列與二級(jí)質(zhì)譜進(jìn)行數(shù)據(jù)庫(kù)比對(duì),達(dá)到優(yōu)化的目的。但如果數(shù)據(jù)庫(kù)內(nèi)不包含相應(yīng)的多肽序列,優(yōu)化結(jié)果的可信度很低。另一種優(yōu)化方向則是在二級(jí)質(zhì)譜集中,通過(guò)停留時(shí)間(retention?time)等質(zhì)譜參數(shù),找到同源的質(zhì)譜進(jìn)行結(jié)果比對(duì)。這種方法的缺點(diǎn)在于,同一實(shí)驗(yàn)組的質(zhì)譜采用的動(dòng)態(tài)規(guī)劃方法相同,同源的質(zhì)譜鑒定結(jié)果互相影響,質(zhì)譜中的噪音峰對(duì)鑒定結(jié)果的干擾會(huì)擴(kuò)大。因此,存在優(yōu)化結(jié)果變差的可能性。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)的目的在于提供一種二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法及裝置,以提高二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化效果。
2、本公開(kāi)實(shí)施例的第一方面,提供了一種二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,包括:
3、生成每個(gè)原始序列對(duì)應(yīng)的第一候選序列;其中,分別將第一原始序列中的每一個(gè)片段替換為片段分子質(zhì)量相同的隨機(jī)子序列,得到第一原始序列對(duì)應(yīng)的多個(gè)第一候選序列;所述第一原始序列為任一個(gè)原始序列,所述原始序列為基于二級(jí)質(zhì)譜得到的鑒定序列;
4、基于多個(gè)所述第一原始序列和對(duì)應(yīng)的多個(gè)第一候選序列構(gòu)建評(píng)估序列集,計(jì)算所述評(píng)估序列集中每個(gè)序列與二級(jí)質(zhì)譜的匹配度;
5、基于所述匹配度從所述評(píng)估序列集中選取第一序列,將所述第一序列確定為評(píng)估優(yōu)化結(jié)果。
6、本公開(kāi)實(shí)施例的第二方面,提供了一種二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化裝置,包括:
7、第一生成模塊,用于生成每個(gè)原始序列對(duì)應(yīng)的第一候選序列;其中,分別將第一原始序列中的每一個(gè)片段替換為片段分子質(zhì)量相同的隨機(jī)子序列,得到第一原始序列對(duì)應(yīng)的多個(gè)第一候選序列;所述第一原始序列為任一個(gè)原始序列,所述原始序列為基于二級(jí)質(zhì)譜得到的鑒定序列;
8、第一計(jì)算模塊,用于基于多個(gè)所述第一原始序列和對(duì)應(yīng)的多個(gè)第一候選序列構(gòu)建評(píng)估序列集,計(jì)算所述評(píng)估序列集中每個(gè)序列與二級(jí)質(zhì)譜的匹配度;
9、第一篩選模塊,用于基于所述匹配度從所述評(píng)估序列集中選取第一序列,將所述第一序列確定為評(píng)估優(yōu)化結(jié)果。
10、本公開(kāi)實(shí)施例的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法的步驟。
11、本公開(kāi)實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法的步驟。
12、本公開(kāi)實(shí)施例提供的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法及裝置的有益效果在于:
13、本公開(kāi)實(shí)施例中,首先將原始序列中的每一個(gè)片段替換為片段分子質(zhì)量相同的隨機(jī)子序列,嘗試生成與二級(jí)質(zhì)譜更加匹配的第一候選序列,然后基于多個(gè)第一原始序列和對(duì)應(yīng)的多個(gè)第一候選序列構(gòu)建評(píng)估序列集,將評(píng)估序列集中的每個(gè)序列分別與二級(jí)質(zhì)譜進(jìn)行匹配,對(duì)于匹配度高的序列,表明二級(jí)質(zhì)譜中包含有足夠的、明顯的峰來(lái)支持這一片段部分的解析,據(jù)此,可以從評(píng)估序列集中選取匹配度高的第一序列,從而實(shí)現(xiàn)對(duì)第一原始序列的評(píng)估優(yōu)化。
14、本公開(kāi)實(shí)施例可以不借助數(shù)據(jù)庫(kù)或其他二級(jí)質(zhì)譜的信息對(duì)序列的鑒定結(jié)果進(jìn)行評(píng)估優(yōu)化,避免了數(shù)據(jù)庫(kù)或其他二級(jí)質(zhì)譜對(duì)優(yōu)化結(jié)果的影響,有利于提高二級(jí)質(zhì)譜鑒定序列的優(yōu)化效果。
1.一種二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,包括:
2.如權(quán)利要求1所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,還包括:
3.如權(quán)利要求2所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,所述確定每個(gè)片段分子質(zhì)量對(duì)應(yīng)的多個(gè)第一子序列,包括:
4.如權(quán)利要求2所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,還包括:
5.如權(quán)利要求4所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,所述分別將第一原始序列中的每一個(gè)片段替換為片段分子質(zhì)量相同的隨機(jī)子序列,包括:
6.如權(quán)利要求2所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,還包括:
7.如權(quán)利要求1所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,所述基于多個(gè)所述第一原始序列和對(duì)應(yīng)的多個(gè)第一候選序列構(gòu)建評(píng)估序列集,包括:
8.如權(quán)利要求1所述的二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化方法,其特征在于,所述計(jì)算所述評(píng)估序列集中每個(gè)序列與二級(jí)質(zhì)譜的匹配度,包括:
9.一種二級(jí)質(zhì)譜鑒定序列的評(píng)估優(yōu)化裝置,其特征在于,包括:
10.一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至8任一項(xiàng)所述方法的步驟。