基于近紅外光譜的校正模型建模方法
【專利摘要】本發(fā)明提供一種基于近紅外光譜的校正模型建模方法,包括:步驟1,根據(jù)近紅外光譜數(shù)據(jù)的預處理結果,獲取全譜權重值;步驟2,以全譜波長的權重值為閥值,將全譜濾長劃分為相關波長集、無關波長集和噪聲波長集;步驟3,將濃度數(shù)據(jù)、相關波長集和無關波長集作為RBF神經網絡的輸入,同時將RBF神經網絡的隱節(jié)點數(shù)設置為訓練集的樣本個數(shù),訓練RBF神經網絡;步驟4,利用RBF神經網絡的輸出值與濃度數(shù)據(jù)通過偏最小二乘算法得出主成分個數(shù);步驟5,根據(jù)訓練集中的各樣本的貢獻值和貢獻率的大小確定RBF神經網絡的隱含層節(jié)點。本發(fā)明降低了校正模型的復雜度、校正模型的復雜度,有效提高了校正模型的精確度。
【專利說明】基于近紅外光譜的校正模型建模方法
【技術領域】
[0001]本發(fā)明屬于分析化學領域的無損分析技術,特指一種基于近紅外光譜的校正模型建模方法。
【背景技術】
[0002]近紅外光譜分析技術是分析化學領域迅猛發(fā)展的高新分析技術,其具有無破壞、無污染、分析重現(xiàn)性好、成本低等優(yōu)點,廣泛應用于石油化工、農業(yè)、食品等行業(yè)。近紅外光譜分析技術主要分為定性和定量分析,定量分析的基礎是利用近紅外光譜獲取的信息,通過建立校正模型,實現(xiàn)對物質各組分濃度的分析。但是,近紅外區(qū)域(780-2526nm)主要體現(xiàn)含氫基團(_0H、-NH、-CH)的合頻和各級倍頻的吸收,該區(qū)間波段信息強度弱、譜峰重疊,導致校正模型的建立十分困難。
[0003]目前,在實際應用中校正模型創(chuàng)建方法主要采用線性方法多元線性回歸算法、主成分回歸算法和偏最小二乘回歸算法。但是在實際中,光譜信息與濃度之間具有一定的非線性,特別是濃度范圍較大時非線性更加明顯。另外,由于物質的各成分相互作用、光譜儀的噪聲和基線漂移等原因,也會引起非線性,這些導致線性校正模型方法精度不高。
[0004]針對該問題,專利“一種紅花提取液測定方法(專利號:201310269615.X) ”采用最小二乘支持向量創(chuàng)建校正模型,但是在高維的近紅外光譜數(shù)據(jù)下,該算法需要上百個樣本才能建立滿足實際應用的校正模型,這在一些實際工程應用中很不現(xiàn)實。
[0005]專利“一種近紅外光譜的多模型建模方法(專利號:201310537968.3)提出了集成建模思路,將訓練樣本劃分為那個子集,建立各個子集的校正模型,得到各子集校正模型的預測結果,將各子集預測結果利用權重值得到最終預測結果。但是該方法訓練次數(shù)多,計算復雜。
【發(fā)明內容】
[0006]為解決上述技術問題,本發(fā)明提供了一種預測精確度高、模型穩(wěn)健性好、所需樣本少的基于近紅外光譜的校正模型建模方法。
[0007]作為本發(fā)明的一個方面,提供了一種基于近紅外光譜的校正模型建模方法,包括:步驟1,根據(jù)近紅外光譜數(shù)據(jù)的預處理結果,獲取全譜權重值;步驟2,以全譜波長的權重值為閥值,將全譜濾長劃分為相關波長集、無關波長集和噪聲波長集;步驟3,將濃度數(shù)據(jù)、相關波長集和無關波長集作為RBF神經網絡的輸入,同時將RBF神經網絡的隱節(jié)點數(shù)設置為訓練集的樣本個數(shù),訓練RBF神經網絡;步驟4,利用RBF神經網絡的輸出值與濃度數(shù)據(jù)通過偏最小二乘算法得出主成分個數(shù);步驟5,根據(jù)訓練集中的各樣本的貢獻值和貢獻率的大小確定RBF神經網絡的隱含層節(jié)點;步驟6,將主成分個數(shù)作為新的RBF神經網絡的隱含層的節(jié)點個數(shù),并將步驟5中的隱含層節(jié)點作為新的RBF神經網絡的陷節(jié)點,將相關波數(shù)集、無關波數(shù)集作為新的RBF神經網絡的輸入,訓練新的RBF神經網絡從而得到校正模型。
[0008]進一步地,步驟I之前還包括以下步驟:根據(jù)光譜樣本之間的距離及濃度樣本之間的距離,對光譜數(shù)據(jù)進行劃分,從而得到校正集,其中,校正集用于建立校正模型。
[0009]進一步地,步驟2還包括:將校正集等分為多個子區(qū)間,分別計算每個子區(qū)間的權重值;根據(jù)全譜權重值和每個子區(qū)間的權重值,利用下式將各子區(qū)間劃分到相關波長集、無關波長集和噪聲波長集中:
【權利要求】
1.一種基于近紅外光譜的校正模型建模方法,其特征在于,包括: 步驟1,根據(jù)近紅外光譜數(shù)據(jù)的預處理結果,獲取全譜權重值; 步驟2,以所述全譜波長的權重值為閥值,將所述全譜濾長劃分為相關波長集、無關波長集和噪聲波長集; 步驟3,將濃度數(shù)據(jù)、所述相關波長集和所述無關波長集作為RBF神經網絡的輸入,同時將所述RBF神經網絡的隱節(jié)點數(shù)設置為訓練集的樣本個數(shù),訓練所述RBF神經網絡;步驟4,利用所述RBF神經網絡的輸出值與所述濃度數(shù)據(jù)通過偏最小二乘算法得出主成分個數(shù); 步驟5,根據(jù)所述訓練集中的各樣本的貢獻值和貢獻率的大小確定所述RBF神經網絡的隱含層節(jié)點; 步驟6,將所述主成分個數(shù)作為新的RBF神經網絡的隱含層的節(jié)點個數(shù),并將步驟5中的隱含層節(jié)點作為所述新的RBF神經網絡的陷節(jié)點,將所述相關波數(shù)集、無關波數(shù)集作為所述新的RBF神經網絡的輸入,訓練所述新的RBF神經網絡從而得到校正模型。
2.根據(jù)權利要求1所述的方法,其特征在于,所述步驟I之前還包括以下步驟: 根據(jù)光譜樣本之間的距離及濃度樣本之間的距離,對光譜數(shù)據(jù)進行劃分,從而得到校正集,其中,所述校正集用于建立所述校正模型。
3.根據(jù)權利要求1所述的方法,其特征在于,所述步驟2還包括: 將所述校正集等分為多個子區(qū)間,分別計算每個所述子區(qū)間的權重值; 根據(jù)所述全譜權重值和所述每個子區(qū)間的權重值,利用下式將所述各子區(qū)間劃分到所述相關波長集、無關波長集和噪聲波長集中:
4.根據(jù)權利要求1所述的方法,其特征在于,所述貢獻值通過下式確定:
5.根據(jù)權利要求1所述的方法,其特征在于,所述貢獻率由下式計算得到:
6.根據(jù)權利要求1所述的方法,其特征在于,所述步驟4包括: 將所述RBF神經網絡的輸出值構成多維歐式空間,將所述多維歐式空間與所述濃度數(shù)據(jù)通過偏最小二乘算 法得出主成分個數(shù)。
【文檔編號】G01N21/359GK104020135SQ201410272819
【公開日】2014年9月3日 申請日期:2014年6月18日 優(yōu)先權日:2014年6月18日
【發(fā)明者】徐澤宇, 劉永福, 何國田, 趙健, 林遠長, 朱曉強, 何驥鳴, 吳嬌嬌, 何瑞英 申請人:中國科學院重慶綠色智能技術研究院