本發(fā)明涉及拉曼光譜降噪領(lǐng)域,尤其涉及一種基于msc-u-net算法的拉曼光譜降噪方法。
背景技術(shù):
1、由于儀器、環(huán)境、宇宙射線等因素的干擾,測(cè)量得到的拉曼光譜都存在一定的噪聲,會(huì)對(duì)拉曼光譜后續(xù)的定量或定性分析等產(chǎn)生干擾,因此對(duì)光譜進(jìn)行降噪處理是必要的。
2、1.傳統(tǒng)降噪方法
3、常用的基于統(tǒng)計(jì)學(xué)的光譜降噪方法有s-g濾波、wt平滑、滑動(dòng)平均法等,在專利cn117574063a中,通過使用離散傅里葉變換得到光譜的頻譜數(shù)據(jù),并從其中提取有效信號(hào),去除噪聲信號(hào),然后再將有效信號(hào)利用傅里葉變換復(fù)原得到降噪后的光。在專利cn111289106中,通過設(shè)計(jì)光譜信號(hào)s的頻率-幅度響應(yīng)函數(shù)pf,將pf變換得到相應(yīng)濾波卷積傳遞函數(shù)h,并計(jì)算光譜與h的卷積y,截取與光譜s等長(zhǎng)的數(shù)據(jù),得到降噪后光譜數(shù)據(jù)。在專利cn110208211a中,利用eemd方法對(duì)港普進(jìn)行信號(hào)分解,等到若干imf分量,依據(jù)imf分量自適應(yīng)獲得與之,選取出含噪聲的imf分量,對(duì)選取的噪聲分量平滑處理,在將處理后的信號(hào)重構(gòu)獲得降噪光譜。
4、2.機(jī)器學(xué)習(xí)
5、在專利cn111678599a中,通過建立adam算法神經(jīng)網(wǎng)絡(luò)拓?fù)淠P?,選取s-g濾波的最佳參數(shù)組合,根據(jù)最佳參數(shù)再使用s-g濾波算法對(duì)光譜進(jìn)行自適應(yīng)降噪。在專利cn110135320a中,公開了一種基于bp神經(jīng)網(wǎng)絡(luò)與方差補(bǔ)償?shù)墓庾V降噪方法以及裝置,使用bp神經(jīng)網(wǎng)絡(luò)算法獲取最有濾波參數(shù)組合對(duì)光譜進(jìn)行降噪。
6、在測(cè)量拉曼光譜過程中,由于環(huán)境、儀器、宇宙射線等影響,光譜中存在的噪聲有周期性噪聲也有隨機(jī)分布噪聲,而傳統(tǒng)頻譜法只對(duì)于周期性噪聲信號(hào)有很好的降噪效果,對(duì)于隨機(jī)噪聲的去除表現(xiàn)一般;而基于多項(xiàng)式擬合的降噪方法對(duì)于參數(shù)的選取很敏感,參數(shù)的選擇對(duì)結(jié)果有很大影響,并且在降噪的同時(shí)也會(huì)損失部分有效信號(hào);一些網(wǎng)絡(luò)光譜降噪模型使用人工合成數(shù)據(jù)訓(xùn)練,在實(shí)際應(yīng)用中有很大的區(qū)別。
7、因此,有必要提供一種基于u-net神經(jīng)網(wǎng)絡(luò)算法的拉曼光譜降噪方法,能有效去除拉曼光譜中的噪聲信號(hào),包括傳統(tǒng)方法難以去除的奇異峰,以提高拉曼光譜信噪比,為后續(xù)光譜定量或定性分析奠定基礎(chǔ)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是提供一種基于msc-u-net算法的拉曼光譜降噪方法,能有效去除拉曼光譜中的噪聲信號(hào),以提高拉曼光譜信噪比。
2、為解決上述技術(shù)問題,本發(fā)明提供了一種基于msc-u-net算法的拉曼光譜降噪方法,包括如下步驟:s1:在同一測(cè)量條件、環(huán)境下,測(cè)量多種物質(zhì)不同濃度的拉曼光譜,每種物質(zhì)的每個(gè)濃度分別測(cè)量多條光譜,得到含有噪聲的原始光譜數(shù)據(jù)集;s2:對(duì)采集的所有光譜進(jìn)行歸一化預(yù)處理,將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,構(gòu)建降噪模型所需數(shù)據(jù)集;s3:將采集的原始光譜按照同一物質(zhì)同一濃度的多條光譜分別做平均處理,得到不含噪聲的理想光譜;s4:構(gòu)建msc-u-net模型,將訓(xùn)練集輸入模型進(jìn)行參數(shù)學(xué)習(xí),根據(jù)損失函數(shù)迭代優(yōu)化,得到光譜降噪模型。
3、進(jìn)一步地,所述步驟s4包括如下步驟:s41:msc處理:按照同一物質(zhì)同一濃度,將訓(xùn)練集、驗(yàn)證集光譜進(jìn)行msc處理;s42:下采樣:卷積層、池化層、bn層交替形成,其中卷積層卷積核大小為1×3,使用padd?ing處理,bn層對(duì)輸出數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,池化層均采用1×2最大池化,激活函數(shù)采用relu函數(shù);s43:上采樣:由卷積層和反卷積層組成,上采樣采用1×2大小卷積核進(jìn)行反卷積操作,并與對(duì)應(yīng)下采樣特征圖連接;卷積層同樣使用1×3卷積核進(jìn)行卷積操作,使用padd?ing處理,bn層對(duì)輸出數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,激活函數(shù)采用relu函數(shù);s44:輸出層由兩層卷積層組成,卷積核大小均為1×1,激活函數(shù)為relu函數(shù)。
4、進(jìn)一步地,所述步驟s4中的relu函數(shù)如下:
5、f(x)=max(0,x)。
6、進(jìn)一步地,所述步驟s4中的損失函數(shù)計(jì)算公式如下:
7、。
8、
9、進(jìn)一步地,所述步驟s1中測(cè)量至少6種不同物質(zhì)至少5種不同濃度的拉曼光譜,每種物質(zhì)的每個(gè)濃度分別測(cè)量至少7條光譜。
10、進(jìn)一步地,所述步驟s2中,訓(xùn)練集、驗(yàn)證集和測(cè)試集的比例為8:1:1或6:2:2。
11、進(jìn)一步地,所述步驟s4采用的優(yōu)化策略為adam算法,參數(shù)初始學(xué)習(xí)率為1×10-2-1×10-3,迭代更新次數(shù)根據(jù)驗(yàn)證集損失函數(shù)值確定,當(dāng)驗(yàn)證集損失函數(shù)值不再下降時(shí)結(jié)束迭代。
12、進(jìn)一步地,還包括步驟s5:將未參與訓(xùn)練的測(cè)試集數(shù)據(jù)使用訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行降噪處理,計(jì)算與理想光譜的mse以驗(yàn)證模型的降噪能力,mse小于10-5表明數(shù)據(jù)降噪效果較為理想,若降噪效果較差,則返回步驟s1增加數(shù)據(jù)集繼續(xù)優(yōu)化模型。
13、本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的優(yōu)勢(shì)效果:本發(fā)明提供的基于msc-u-net算法的拉曼光譜降噪方法,通過對(duì)采集的所有光譜進(jìn)行歸一化預(yù)處理并劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,然后將采集的原始光譜按照同一物質(zhì)同一濃度的多條光譜分別做平均處理,得到不含噪聲的理想光譜;最后構(gòu)建msc-u-net模型,將訓(xùn)練集輸入模型進(jìn)行參數(shù)學(xué)習(xí),根據(jù)損失函數(shù)迭代優(yōu)化,得到光譜降噪模型。能有效去除拉曼光譜中的噪聲信號(hào),包括去除傳統(tǒng)方法難以去除的奇異峰,同時(shí)又不損失有效信號(hào),提高了拉曼光譜信噪比,為后續(xù)光譜定量或定性分析奠定基礎(chǔ)。
1.一種基于msc-u-net算法的拉曼光譜降噪方法,其特征在于,包括如下步驟:
2.如權(quán)利要求1所述的拉曼光譜降噪方法,其特征在于,所述步驟s4包括如下步驟:
3.如權(quán)利要求2所述的拉曼光譜降噪方法,其特征在于,所述步驟s4中的relu函數(shù)如下:
4.如權(quán)利要求1所述的拉曼光譜降噪方法,其特征在于,所述步驟s4中的損失函數(shù)計(jì)算公式如下:
5.如權(quán)利要求1所述的拉曼光譜降噪方法,其特征在于,所述步驟s1中測(cè)量至少6種不同物質(zhì)至少5種不同濃度的拉曼光譜,每種物質(zhì)的每個(gè)濃度分別測(cè)量至少7條光譜。
6.如權(quán)利要求1所述的拉曼光譜降噪方法,其特征在于,所述步驟s2中,訓(xùn)練集、驗(yàn)證集和測(cè)試集的比例為8:1:1或6:2:2。
7.如權(quán)利要求6所述的拉曼光譜降噪方法,其特征在于,所述步驟s4采用的優(yōu)化策略為adam算法,參數(shù)初始學(xué)習(xí)率為1×10-2-1×10-3,迭代更新次數(shù)根據(jù)驗(yàn)證集損失函數(shù)值確定,當(dāng)驗(yàn)證集損失函數(shù)值不再下降時(shí)結(jié)束迭代。
8.如權(quán)利要求7所述的拉曼光譜降噪方法,其特征在于,還包括步驟s5:將未參與訓(xùn)練的測(cè)試集數(shù)據(jù)使用訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行降噪處理,計(jì)算與理想光譜的mse以驗(yàn)證模型的降噪能力,若mse大于等于10-5,則返回步驟s1增加數(shù)據(jù)集繼續(xù)優(yōu)化模型,直到mse小于10-5。