本發(fā)明涉及生物醫(yī)學檢測,特別是涉及一種基于拉曼光譜的口腔癌多任務(wù)診斷系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提到了與本發(fā)明相關(guān)的背景技術(shù),并不必然構(gòu)成現(xiàn)有技術(shù)。
2、拉曼光譜是一種快速簡便的光學技術(shù),它是分子和材料無損表征中應(yīng)用最廣泛的技術(shù)之一。拉曼光譜可以探測分子的振動模式,對其化學鍵敏感,并提供獨特的“指紋”,從而實現(xiàn)化學物質(zhì)的識別,因此它可以用于各種類型癌癥的早期診斷。
3、拉曼光譜數(shù)據(jù)的分類方法主要分為兩個部分:傳統(tǒng)的機器學習和深度學習。傳統(tǒng)的機器學習方法主要包括主成分分析、線性判別分析、支持向量機等。深度學習方法主要使用各種經(jīng)典的神經(jīng)網(wǎng)絡(luò)模型與拉曼光譜技術(shù)相結(jié)合,以實現(xiàn)腫瘤分期等任務(wù)。卷積神經(jīng)網(wǎng)絡(luò)通過堆疊卷積運算提取局部結(jié)構(gòu)和位置信息,其池化層會丟失大量有價值信息,忽略了局部和整體之間的關(guān)聯(lián)性,無法獲取額外的全局信息。transformer模型通過自注意力機制和全連接網(wǎng)絡(luò)來獲取數(shù)據(jù)中的長距離依賴關(guān)系和位置信息,但是其復雜性太大,訓練和推理速度較慢,模型的穩(wěn)定性有限。
4、此外,腫瘤的tnm分期系統(tǒng)(腫瘤分期、淋巴結(jié)分期和轉(zhuǎn)移)為臨床醫(yī)生提供了患者的預后和管理決策的可靠依據(jù),是口腔癌患者生存的最可靠的預測指標。但在臨床實踐中,僅僅依靠tnm分類是不夠的,還需要分析其他預后因素的預測能力,其中組織學分級可能是治療結(jié)果的重要預后因素。因此,在口腔癌的診斷工作中不僅要關(guān)注腫瘤分期和淋巴結(jié)分期,還要關(guān)注組織學分級,三者在促進口腔癌的及時治療和評估預后方面都起著關(guān)鍵作用。
5、但現(xiàn)有研究的重點大多僅限于單個任務(wù),沒有探索拉曼光譜數(shù)據(jù)在腫瘤分期、淋巴結(jié)分期和組織學分級三個任務(wù)中的共享特征信息,限制了數(shù)據(jù)中潛在信息的分析能力。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于拉曼光譜的口腔癌多任務(wù)診斷系統(tǒng)、電子設(shè)備、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品,通過雙向mamba模塊提取全局特征信息,通過殘差注意力融合模塊提取局部特征信息并減小全局特征和局部特征之間的差異,實現(xiàn)對拉曼光譜數(shù)據(jù)的有效特征提取,提高診斷的準確性。
2、第一方面,本發(fā)明提供了一種基于拉曼光譜的口腔癌多任務(wù)診斷系統(tǒng);
3、一種基于拉曼光譜的口腔癌多任務(wù)診斷系統(tǒng),包括:
4、獲取模塊,用于獲取拉曼光譜數(shù)據(jù);
5、口腔癌多任務(wù)診斷模塊,用于通過訓練好的口腔癌多任務(wù)診斷模型處理所述拉曼光譜數(shù)據(jù),以生成并輸出腫瘤分期結(jié)果、淋巴結(jié)分期結(jié)果和組織學分期結(jié)果;
6、其中,所述口腔癌多任務(wù)診斷模型包括雙向mamba分支和殘差注意力融合分支,利用殘差注意力融合分支提取所述拉曼光譜數(shù)據(jù)中的局部特征信息,并融合雙向mamba分支提取的全局特征信息生成多尺度特征。
7、在一些實施方式中,所述雙向mamba分支包括依次連接的位置編碼層和若干個雙向mamba模塊;
8、所述位置編碼層用于對預處理后的所述拉曼光譜數(shù)據(jù)添加位置編碼,所述雙向mamba模塊用于對輸入數(shù)據(jù)進行雙向序列全局建模。
9、在一些實施方式中,所述對輸入數(shù)據(jù)進行雙向序列全局建模具體包括:
10、對輸入數(shù)據(jù)進行層歸一化并分別線性投影,得到維度相同的第一序列和第二序列;
11、對第一序列進行雙向ssm處理,獲取前向序列和后向序列,并分別與經(jīng)激活函數(shù)處理的第二序列融合,得到更新后的前向序列和后向序列;
12、將更新后的前向序列和后向序列相加并經(jīng)線性投影處理,與輸入數(shù)據(jù)殘差連接,獲取輸出序列。
13、在一些實施方式中,所述殘差注意力融合分支包括若干個殘差注意力融合模塊,所述殘差注意力融合模塊用于將雙向mamba分支的同層輸出和上一層殘差注意力融合模塊的輸出進行特征融合。
14、在一些實施方式中,所述將雙向mamba分支的同層輸出和上一層殘差注意力融合模塊的輸出進行特征融合具體包括:
15、對雙向mamba分支的同層輸出依次進行層歸一化、卷積和歸一化操作,獲取第一輸出序列;
16、對上一層殘差注意力融合模塊的輸出依次進行層歸一化和多頭注意力機制融合,獲取第二輸出序列;
17、將第一輸出序列和第二輸出序列融合,依次進行卷積和歸一化操作并與一級殘差注意力融合模塊的輸出進行殘差連接,獲取融合輸出序列。
18、在一些實施方式中,所述口腔癌多任務(wù)診斷模型還包括多任務(wù)分類頭,所述多任務(wù)分類頭為多個并行的多層感知機。
19、在一些實施方式中,使用交叉熵損失函數(shù)訓練所述口腔癌多任務(wù)診斷模型。
20、第二方面,本發(fā)明提供了一種電子設(shè)備;
21、一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)如下步驟:
22、用于獲取拉曼光譜數(shù)據(jù);
23、通過訓練好的口腔癌多任務(wù)診斷模型處理所述拉曼光譜數(shù)據(jù),以生成并輸出腫瘤分期結(jié)果、淋巴結(jié)分期結(jié)果和組織學分期結(jié)果;
24、其中,所述口腔癌多任務(wù)診斷模型包括雙向mamba分支和殘差注意力融合分支,利用殘差注意力融合分支提取所述拉曼光譜數(shù)據(jù)中的局部特征信息,并融合雙向mamba分支提取的全局特征信息生成多尺度特征。
25、第三方面,本發(fā)明提供了一種計算機可讀存儲介質(zhì);
26、一種計算機可讀存儲介質(zhì),其上存儲有計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時以實現(xiàn)如下步驟:
27、用于獲取拉曼光譜數(shù)據(jù);
28、通過訓練好的口腔癌多任務(wù)診斷模型處理所述拉曼光譜數(shù)據(jù),以生成并輸出腫瘤分期結(jié)果、淋巴結(jié)分期結(jié)果和組織學分期結(jié)果;
29、其中,所述口腔癌多任務(wù)診斷模型包括雙向mamba分支和殘差注意力融合分支,利用殘差注意力融合分支提取所述拉曼光譜數(shù)據(jù)中的局部特征信息,并融合雙向mamba分支提取的全局特征信息生成多尺度特征。
30、第四方面,本發(fā)明提供了一種計算機程序產(chǎn)品;
31、一種計算機程序產(chǎn)品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)以實現(xiàn)如下步驟:
32、用于獲取拉曼光譜數(shù)據(jù);
33、通過訓練好的口腔癌多任務(wù)診斷模型處理所述拉曼光譜數(shù)據(jù),以生成并輸出腫瘤分期結(jié)果、淋巴結(jié)分期結(jié)果和組織學分期結(jié)果;
34、其中,所述口腔癌多任務(wù)診斷模型包括雙向mamba分支和殘差注意力融合分支,利用殘差注意力融合分支提取所述拉曼光譜數(shù)據(jù)中的局部特征信息,并融合雙向mamba分支提取的全局特征信息生成多尺度特征。
35、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
36、1、本發(fā)明提供的技術(shù)方案,通過雙向mamba模塊對具有空間特性的拉曼光譜數(shù)據(jù)進行處理,提取全局特征信息,實現(xiàn)遠程關(guān)系建模能力的同時保證了較低的復雜度,避免有價值信息的丟失,提高口腔癌多任務(wù)診斷的推理速度和穩(wěn)定性。
37、2、本發(fā)明提供的技術(shù)方案,考慮到局部信息和整體信息之前的關(guān)聯(lián)性,通過殘差注意力融合模塊可以從拉曼光譜數(shù)據(jù)中有效的提取小區(qū)域內(nèi)的特征信息,幫助捕捉樣本中微觀結(jié)構(gòu)的細節(jié),例如特定的波峰和波谷,進而更好地捕獲樣本中微小區(qū)域的細微變化,有助于區(qū)分樣本之間的差異。同時,有助于處理數(shù)據(jù)中的噪聲和干擾,增強模型的魯棒性。
38、3、本發(fā)明提供的技術(shù)方案,引入多頭注意力機制模塊來增加遠程建模的依賴關(guān)系,并通過融合雙向mamba分支的全局特征信息來生成多尺度特征,最終將它們投影到同一特征空間中,完成特征融合,實現(xiàn)拉曼光譜數(shù)據(jù)特征的全面提取。通過全局特征可以提供更廣泛的數(shù)據(jù)背景信息,反映整體樣本的特征,有助于捕捉樣本之間的共性和一般性,減少過擬合,提高模型的泛化能力。局部特征和全局特征兩者相輔相成,可以促進建模過程的有效進行。
39、3、本發(fā)明提供的技術(shù)方案,設(shè)計了一種新的多任務(wù)網(wǎng)絡(luò)模型,通過共享權(quán)重和計算量來實現(xiàn)三個任務(wù)的同時判別,在提高單個任務(wù)性能的同時降低整體的計算成本。