1.一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述步驟s1中,獲取的質(zhì)譜原始數(shù)據(jù)以及病理學注釋信息為imzml格式,數(shù)據(jù)預處理包括:
3.根據(jù)權(quán)利要求1所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述步驟s2中,無監(jiān)督學習模型的計算框架基于不少于五層的全連接變分神經(jīng)網(wǎng)絡,所述神經(jīng)網(wǎng)絡包括輸入層、隱藏層和輸出層。
4.根據(jù)權(quán)利要求3所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述無監(jiān)督學習模型的特征學習包括:
5.根據(jù)權(quán)利要求4所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,
6.根據(jù)權(quán)利要求4所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述重構(gòu)損失用于評估解碼后的樣本與輸入的匹配程度,正則化損失用于評估潛在空間對訓練數(shù)據(jù)的過擬合程度,均方誤差值越小,模型則越精準,均方誤差值公式為:
7.根據(jù)權(quán)利要求1所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述步驟s3中,在實現(xiàn)峰值學習,識別獲得所述潛在m/z離子列表時,將模型所學習的低維特征表示與原始數(shù)據(jù)中的特征相關聯(lián),基于神經(jīng)網(wǎng)絡權(quán)重超參數(shù)的反向傳播的閾值分析進行識別。
8.根據(jù)權(quán)利要求7所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述閾值分析包括:
9.根據(jù)權(quán)利要求1所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述步驟s4中,采用能夠使高斯混合模型聚類過程應用于預期范圍內(nèi)不同數(shù)量的聚類數(shù)k的迭代方法進行聚類分析,其中,聚類數(shù)k是一個用戶可調(diào)參數(shù)。
10.根據(jù)權(quán)利要求1所述的一種基于全連接變分神經(jīng)網(wǎng)絡的質(zhì)譜數(shù)據(jù)處理與識別方法,其特征在于,所述步驟s4中,通過皮爾遜相關系數(shù)測量感興趣區(qū)域簇類與特征離子之間的共定位,其中,皮爾遜相關系數(shù)介于0與1之間,系數(shù)越高,感興趣區(qū)域簇類與特征離子之間的共定位程度越高。