技術(shù)總結(jié)
本發(fā)明提出一種肽段液相色譜保留時間預(yù)測方法及系統(tǒng),涉及生物信息學(xué),該方法包括對原始質(zhì)譜數(shù)據(jù)文件進(jìn)行搜索,獲取肽段?譜圖匹配作為鑒定結(jié)果,對于所述鑒定結(jié)果中FDR小于1%的來自目標(biāo)庫的肽段?譜圖匹配,提取肽段?譜圖匹配中相應(yīng)肽段的實(shí)驗(yàn)保留時間,并設(shè)置訓(xùn)練樣本與測試樣本;使用所述訓(xùn)練樣本,將帶有修飾的氨基酸作為新氨基酸,建立多元線性回歸模型,使用梯度下降法求解每種氨基酸的保留系數(shù);對所述訓(xùn)練樣本中的每條肽段,提取56維特征,并計算相應(yīng)的特征值;建立預(yù)測模型,對所述測試樣本中已知序列的肽段進(jìn)行保留時間預(yù)測。本發(fā)明可以用于不同色譜條件下帶有修飾的肽段的保留時間預(yù)測,大大提升了速度,在不同的數(shù)據(jù)集合上與Elude對比,速度加快了30倍以上。
技術(shù)研發(fā)人員:涂慧君;劉超;遲浩;賀思敏
受保護(hù)的技術(shù)使用者:中國科學(xué)院計算技術(shù)研究所
文檔號碼:201610941299
技術(shù)研發(fā)日:2016.10.25
技術(shù)公布日:2016.12.21