本發(fā)明涉及一種基于近紅外的煙葉焦油解析方法,屬于煙草工業(yè)領(lǐng)域。
背景技術(shù):
:焦油是卷煙成品的一種重要致香物質(zhì),其是卷煙香氣的重要組成部分之一;但是卷煙焦油在煙氣的形成中也會(huì)對(duì)人體形成一定的危害,一般認(rèn)為卷煙煙氣中的有害成分主要集中在焦油中,國(guó)際上一般以焦油量的高低來(lái)評(píng)價(jià)卷煙的安全性,因此焦油檢測(cè)在煙草成品的檢測(cè)中起到非常重要而且必要的作用。在傳統(tǒng)的焦油檢測(cè)中,一般采取抽煙機(jī)的檢測(cè)形式;抽煙機(jī)檢測(cè)一般耗時(shí)比較長(zhǎng),對(duì)卷煙質(zhì)量的尤其是卷煙的安全性指標(biāo)的評(píng)價(jià)比較滯后;更重要的是,在抽煙機(jī)的檢測(cè)中,抽煙機(jī)的檢測(cè)結(jié)果受卷煙濾嘴,卷煙濾紙等卷煙輔料的影響較大。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提供一種基于近紅外的煙葉焦油檢測(cè)方法,以快速無(wú)損的檢測(cè)和評(píng)價(jià)煙葉中的焦油量。本發(fā)明采用了如下技術(shù)方案:一種基于近紅外的煙葉焦油解析方法,其特征在于,包括如下步驟:步驟一:獲取不同品種的成品煙絲樣本,掃描煙絲樣本的近紅外光譜,獲取近紅外光譜信息;步驟二:將對(duì)應(yīng)的近紅外光譜信息關(guān)聯(lián)到抽煙機(jī)給出的焦油標(biāo)準(zhǔn)值數(shù)據(jù),并建立焦油模型;步驟三:設(shè)定校正集樣本數(shù)量m組,通過(guò)光譜的差異性篩選檢驗(yàn)集樣本數(shù)量n組;步驟四:通過(guò)半重?cái)?shù)采樣法、蒙特卡洛交叉驗(yàn)證進(jìn)行異常樣本的剔除;步驟五:使用一階導(dǎo)數(shù)對(duì)光譜進(jìn)行預(yù)處理;步驟六:使用遺傳算法篩選光譜波長(zhǎng);步驟七:運(yùn)用GAPLS(基于遺傳算法的偏最小二乘法)對(duì)波長(zhǎng)篩選后的光譜與對(duì)應(yīng)的焦油數(shù)據(jù)進(jìn)行建模,構(gòu)建基于近紅外光譜的焦油定量模型;PLS的算法如下:式中,X為校正子集組成的吸光度矩陣,Y為校正子集相對(duì)應(yīng)的化學(xué)值矩陣,tk(nX1)為X的第k個(gè)主因子的得分,pk(1Xm)為X矩陣的第k個(gè)主因子的載荷;f為主因子數(shù),即:T和U分別為X和Y矩陣的得分矩陣,P和Q分別為X和Y矩陣的載荷矩陣,EX和EY分別為X和Y的PLS擬合殘差矩陣。進(jìn)一步,本發(fā)明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟七中,在校正過(guò)程中,最初是忽略殘差矩陣E,求出中間的參數(shù)后,再返回求殘差矩陣;具體過(guò)程如下:X=TPT,左邊乘TT然后右乘P得:T=XP/(PTP);Y=UQT,左邊乘UT然后兩邊同除以QT得:U=Y(jié)/QT;取濃度陣Y的某一列作為U的起始迭代值,以U代替T,計(jì)算W,方程為:X=UWT,其解為:WT=UTX/(UTU),W為吸光度陣X的權(quán)重向量;對(duì)權(quán)重歸一化后求吸光度陣X的因子得分T,方程為:X=TWT,其解為:T=XW/WTW;以T代替U計(jì)算濃度陣Y的載荷Q值,其方程為:Y=TQT;其解為:QT=TTY/(TTT);對(duì)載荷Q歸一化后求濃度陣Y的因子得分U,方程為:Y=UQT;其解為:U=Y(jié)Q/QTQ;再以此U代替T返回最開(kāi)始計(jì)算WT,由WT計(jì)算T1,如此反復(fù)迭代,若T已收斂(‖T1-T2‖≤10-6‖T1‖),T1為轉(zhuǎn)入計(jì)算收斂后的T,否則返回繼續(xù)求吸光度陣X的權(quán)重W;收斂后的T求吸光度陣X的載荷向量P,其方程為:X=TPT;其解為:PT=TTY/(TTT);對(duì)載荷P歸一化后求標(biāo)準(zhǔn)化X的因子得分T=T‖P‖;標(biāo)準(zhǔn)化權(quán)重向量W=W‖P‖;計(jì)算T與U之間的內(nèi)在關(guān)系B=UTT/(TTT);再計(jì)算殘差陣EX=X-TPT;EY=Y(jié)-BTQT;最后以EX代替X,EY代替Y,返回最開(kāi)始的步驟即求吸光度陣X的權(quán)重向量W,以此類(lèi)推,求出X、Y的主因子的W、T、P、U、Q、B,最后通過(guò)交互檢驗(yàn)法Q2h≤0.0975確定最佳主因子數(shù)f時(shí)迭代停止。進(jìn)一步,本發(fā)明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟三中,首先將所有的焦油光譜組成一個(gè)光譜陣,選取前面m組為校正子集,剩下的n組為驗(yàn)證集樣本。進(jìn)一步,本發(fā)明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征,還包括:步驟八:對(duì)步驟七得到的模型進(jìn)行外部驗(yàn)證。進(jìn)一步,本發(fā)明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟四中,隨機(jī)將焦油的驗(yàn)證集樣本進(jìn)行預(yù)測(cè)誤差計(jì)算,正常焦油樣本的預(yù)測(cè)誤差較小,其均值在零附近,呈正態(tài)分布趨勢(shì),異常樣本數(shù)據(jù)奇異的預(yù)測(cè)誤差則較大,遠(yuǎn)離零點(diǎn),以焦油預(yù)測(cè)樣本的均值絕對(duì)值為X軸,標(biāo)準(zhǔn)差為Y軸作圖,判斷異常光譜和異?;瘜W(xué)值焦油樣本并進(jìn)行剔除。進(jìn)一步,本發(fā)明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟五中,使用一階導(dǎo)數(shù)對(duì)光譜進(jìn)行預(yù)處理的具體過(guò)程是:使用移動(dòng)窗口對(duì)每個(gè)校正集的焦油樣本移動(dòng)平滑,過(guò)濾噪聲。進(jìn)一步,本發(fā)明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟六中,使用遺傳算法篩選光譜波長(zhǎng)包括如下步驟:①對(duì)焦油校正集樣本的波長(zhǎng)進(jìn)行編碼,形成二進(jìn)制字符;②將校正集樣本波長(zhǎng)進(jìn)行初始化,隨機(jī)選擇80%為初始種群;③選擇近紅外定量回歸模型的預(yù)測(cè)標(biāo)準(zhǔn)偏差為適應(yīng)度函數(shù);④選擇近紅外焦油樣本波長(zhǎng)點(diǎn)適應(yīng)度高的個(gè)體保留到下一代一起搜索新的波長(zhǎng)點(diǎn)組,根據(jù)通過(guò)適應(yīng)度函數(shù)的波長(zhǎng)點(diǎn)出現(xiàn)的頻率來(lái)選擇建模的波長(zhǎng)點(diǎn);⑤用留一驗(yàn)證的方法通過(guò)驗(yàn)證集的預(yù)測(cè)標(biāo)準(zhǔn)偏差來(lái)確定波長(zhǎng)點(diǎn)選擇的數(shù)目以及主成分?jǐn)?shù)。發(fā)明的有益效果本發(fā)明的基于近紅外的煙葉焦油解析方法,將焦油量的化學(xué)值與近紅外光譜聯(lián)系起來(lái),并建立焦油模型,然后通過(guò)步驟四到七的處理,使得通過(guò)近紅外光譜對(duì)焦油量的測(cè)定更加準(zhǔn)確。附圖說(shuō)明圖1是近紅外光譜圖;圖2是化學(xué)值分布圖;圖3是異常光譜分布圖;圖4是一階導(dǎo)數(shù)預(yù)處理圖;圖5是波長(zhǎng)選擇圖;圖6是根據(jù)圖5中選擇的波長(zhǎng)點(diǎn)對(duì)應(yīng)的光譜圖;圖7是真實(shí)值與預(yù)測(cè)值對(duì)比圖;圖8是真實(shí)值與絕對(duì)誤差圖;圖9是整體流程圖。具體實(shí)施方式以下結(jié)合附圖來(lái)說(shuō)明本發(fā)明的具體實(shí)施方式。圖9是本發(fā)明的基于近紅外的煙葉焦油檢測(cè)方法的流程圖,如圖9所示,本發(fā)明的基于近紅外的煙葉焦油檢測(cè)方法包括如下步驟:1)在A卷煙廠獲取具有代表性的75組不同品種的成品煙絲樣本,通過(guò)磨粉后掃描得到近紅外光譜,見(jiàn)附圖1,獲取與其相對(duì)應(yīng)的近紅外光譜信息。2)將對(duì)應(yīng)的近紅外光譜信息關(guān)聯(lián)到抽煙機(jī)給出的焦油標(biāo)準(zhǔn)值數(shù)據(jù),見(jiàn)附圖2,并建立焦油模型。3)設(shè)定校正集樣本數(shù)量60組,檢驗(yàn)集樣本數(shù)量15組。具體過(guò)程:首先將所有的焦油光譜組成一個(gè)光譜陣,選取前面60組為校正子集,剩下的為驗(yàn)證集樣本數(shù),相對(duì)應(yīng)的選取濃度陣對(duì)應(yīng)的校正集和驗(yàn)證集。4)通過(guò)半重?cái)?shù)采樣法、蒙特卡洛交叉驗(yàn)證法,進(jìn)行異常光譜分析和異常樣本化學(xué)值分析,并剔除異常光譜和異?;瘜W(xué)值樣本;具體過(guò)程是:隨機(jī)將焦油的驗(yàn)證集樣本進(jìn)行預(yù)測(cè)誤差計(jì)算,正常焦油樣本的預(yù)測(cè)誤差一般較小,其均值在零附近,呈正態(tài)分布趨勢(shì),異常樣本數(shù)據(jù)奇異的預(yù)測(cè)誤差則一般較大,遠(yuǎn)離零點(diǎn),但是焦油樣本光譜奇異點(diǎn)預(yù)測(cè)誤差分布的方差一般較大,即不同性質(zhì)的樣本具有不同的分布,以焦油預(yù)測(cè)樣本的均值絕對(duì)值為X軸,標(biāo)準(zhǔn)差為Y軸作圖,可以得到附圖3所示的散點(diǎn)圖,根據(jù)圖可以判斷出異常光譜和異?;瘜W(xué)值焦油樣本并進(jìn)行剔除。5)利用一階導(dǎo)數(shù)(SG)對(duì)光譜進(jìn)行預(yù)處理,其具體過(guò)程:使用移動(dòng)窗口寬度為13對(duì)每個(gè)校正集的焦油樣本逐步移動(dòng)平滑,過(guò)濾掉無(wú)用的噪聲,保留有效的光譜信息,如附圖4;6)利用遺傳算法(GA)進(jìn)行波長(zhǎng)篩選;具體過(guò)程:①對(duì)焦油校正集樣本的波長(zhǎng)進(jìn)行編碼,形成二進(jìn)制字符;②將校正集樣本波長(zhǎng)進(jìn)行初始化,隨機(jī)選擇80%為初始種群;③選擇近紅外定量回歸模型的預(yù)測(cè)標(biāo)準(zhǔn)偏差為適應(yīng)度函數(shù)④選擇近紅外焦油樣本波長(zhǎng)點(diǎn)適應(yīng)度高的個(gè)體保留到下一代一起搜索新的波長(zhǎng)點(diǎn)組,根據(jù)通過(guò)適應(yīng)度函數(shù)的波長(zhǎng)點(diǎn)出現(xiàn)的頻率來(lái)選擇建模的波長(zhǎng)點(diǎn);⑤用留一驗(yàn)證的方法通過(guò)驗(yàn)證集的預(yù)測(cè)標(biāo)準(zhǔn)偏差來(lái)確定波長(zhǎng)點(diǎn)選擇的數(shù)目以及主成分?jǐn)?shù)。圖5中有三根橫向的直線,自下而上,第一根直線代表選取合適的適應(yīng)度函數(shù),選擇波長(zhǎng)點(diǎn)數(shù)高于這個(gè)函數(shù)的波長(zhǎng)點(diǎn)數(shù)保留到下一代一起搜索新的波長(zhǎng)點(diǎn)組,第二根根據(jù)通過(guò)適應(yīng)度函數(shù)的波長(zhǎng)點(diǎn)出現(xiàn)的頻率來(lái)選擇建模的波長(zhǎng)點(diǎn),第三根用留一驗(yàn)證的方法通過(guò)驗(yàn)證集的預(yù)測(cè)標(biāo)準(zhǔn)偏差來(lái)確定波長(zhǎng)點(diǎn)選擇的數(shù)目。圖6是根據(jù)選擇的波長(zhǎng)點(diǎn)數(shù)對(duì)應(yīng)的光譜圖。7)運(yùn)用GAPLS對(duì)波長(zhǎng)篩選后的光譜與對(duì)應(yīng)焦油數(shù)據(jù)進(jìn)行建模;構(gòu)建基于近紅外光譜的焦油定量模型;見(jiàn)附圖7、附圖8;具體過(guò)程:用偏最小二乘法對(duì)校正集以及相對(duì)應(yīng)的濃度集進(jìn)行回歸,采用10個(gè)最佳主因子進(jìn)行建模,可以得到驗(yàn)證集的模型預(yù)測(cè)濃度,他們的平均絕對(duì)誤差可以通過(guò)焦油標(biāo)準(zhǔn)值減去相對(duì)應(yīng)模型預(yù)測(cè)濃度的絕對(duì)值,再求其平均值得到,平均相對(duì)誤差可以通過(guò)平均絕對(duì)誤差分別除以每個(gè)驗(yàn)證集的焦油標(biāo)準(zhǔn)值得到,相關(guān)系數(shù)可以通過(guò)焦油標(biāo)準(zhǔn)值和模型預(yù)測(cè)值得曲線擬合得到。PLS的算法如下:X=TPT+EX=Σk=1ftkpkT+EX;Y=UQT+EY=Σk=1fukqkT+EY]]>式中,X為校正子集組成的吸光度矩陣,Y為校正子集相對(duì)應(yīng)的化學(xué)值矩陣,tk(nX1)為X的第k個(gè)主因子的得分,pk(1Xm)為X矩陣的第k個(gè)主因子的載荷;f為主因子數(shù),即:T和U分別為X和Y矩陣的得分矩陣,P和Q分別為X和Y矩陣的載荷矩陣,EX和EY分別為X和Y的PLS擬合殘差矩陣。在校正過(guò)程中,最初是忽略殘差矩陣E,求出中間的參數(shù)后,再返回求殘差矩陣;具體過(guò)程如下:X=TPT,左邊乘TT然后右乘P得:T=XP/(PTP);Y=UQT,左邊乘UT然后兩邊同除以QT得:U=Y(jié)/QT;取濃度陣Y的某一列作為U的起始迭代值,以U代替T,計(jì)算W,方程為:X=UWT,其解為:WT=UTX/(UTU),W為吸光度陣X的權(quán)重向量;對(duì)權(quán)重歸一化后求吸光度陣X的因子得分T,方程為:X=TWT,其解為:T=XW/WTW;以T代替U計(jì)算濃度陣Y的載荷Q值,其方程為:Y=TQT;其解為:QT=TTY/(TTT);對(duì)載荷Q歸一化后求濃度陣Y的因子得分U,方程為:Y=UQT;其解為:U=Y(jié)Q/QTQ;再以此U代替T返回最開(kāi)始計(jì)算WT,由WT計(jì)算T1,如此反復(fù)迭代,若T已收斂(‖T1-T2‖≤10-6‖T1‖),T1為轉(zhuǎn)入計(jì)算收斂后的T,否則返回繼續(xù)求吸光度陣X的權(quán)重W;收斂后的T求吸光度陣X的載荷向量P,其方程為:X=TPT;其解為:PT=TTY/(TTT);對(duì)載荷P歸一化后求標(biāo)準(zhǔn)化X的因子得分T=T‖P‖;標(biāo)準(zhǔn)化權(quán)重向量W=W‖P‖;計(jì)算T與U之間的內(nèi)在關(guān)系B=UTT/(TTT);再計(jì)算殘差陣EX=X-TPT;EY=Y(jié)-BTQT;最后以EX代替X,EY代替Y,返回最開(kāi)始的步驟即求吸光度陣X的權(quán)重向量W,以此類(lèi)推,求出X、Y的主因子的W、T、P、U、Q、B,最后通過(guò)交互檢驗(yàn)法Q2h≤0.0975確定最佳主因子數(shù)f時(shí)迭代停止。8)對(duì)模型進(jìn)行外部驗(yàn)證;表1模型的外部驗(yàn)證表:9)其它化學(xué)計(jì)量學(xué)方法對(duì)比列表表2本發(fā)明的方法與其它化學(xué)計(jì)量學(xué)方法的對(duì)比表方法絕對(duì)誤差相對(duì)誤差相關(guān)系數(shù)11.4106357140.1280020440.7391623421.2046557660.109664550.71972844930.8412718890.0774421410.6874861440.8442666670.080178015-0.47882612150.6746269280.0640666570.63370481461.4524546130.135665914-0.313321007當(dāng)前第1頁(yè)1 2 3