基于一元線性回歸的光譜模型傳遞方法
【專利摘要】本發(fā)明為基于一元線性回歸的光譜模型傳遞方法,主要步驟Ⅰ對M臺光譜儀器的樣品光譜進行相同預處理;Ⅱ根據(jù)樣品的m種成分將光譜數(shù)據(jù)分為m個校正集和預測集,分別在M臺儀器上建立m個校正模型;Ⅲ校正模型評價;Ⅳ將預測效果最好的儀器作為主儀器,其它為從儀器;Ⅴ選取主儀器校正集中針對各從儀器的最佳樣品,按其序號確定各從儀器轉換集樣品,用一元線性回歸求回歸系數(shù),校正從儀器光譜,然后代入主儀器校正模型得樣品成分含量結果。本方法有效消除不同光譜儀器的差異,實現(xiàn)主儀器上建立的校正模型能夠在多臺從儀器上共享,減少了分析測試工作量,節(jié)約模型建立的成本;且所求參數(shù)少、模型簡單,預測準確度更高。
【專利說明】基于一元線性回歸的光譜模型傳遞方法
【技術領域】
[0001] 本發(fā)明屬于光譜分析【技術領域】,具體為一種基于一元線性回歸的光譜模型傳遞方 法。
【背景技術】
[0002] 光譜分析技術是在光譜檢測、化學計量學、計算機科學與應用測試等技術的基礎 上發(fā)展起來的一門綜合性分析技術,現(xiàn)在己受到越來越多的重視。同時,光譜分析技術以其 獨特的優(yōu)點,成為了化學分析領域的研究熱點之一。光譜分析技術中的定量應用依賴于校 正模型,即對標準樣品集的參考值(成分含量或物理化學性質)和對應的光譜進行關聯(lián),建 立兩者之間的函數(shù)關系,對未知樣品的光譜應用該定量校正模型計算該樣品成分等參考值 的預測值。
[0003] 但是,在實際應用中,由于儀器老化、儀器間差異及空氣、光源、探測器和測量引入 的隨機噪聲,各儀器測量的光譜有差異,因此在某一臺光譜儀器上建立的校正模型,在應用 于另一臺儀器上時無法適用或結果會產(chǎn)生較大的誤差。而要為每臺儀器分別建立校正模 型,因費用過高,顯然是不可取的。根據(jù)相關文獻報道,使用近紅外光譜法建立一個柴油 十六烷值的校正模型,至少十幾萬元。對毒性較大、不穩(wěn)定的樣品建立校正模型,費用會更 商。
[0004] 所謂光譜模型傳遞是指經(jīng)過數(shù)學處理后,使一臺光譜儀器上的校正模型能夠用于 另一臺光譜儀器,從而減少重新建模所帶來的巨大工作量和費用,實現(xiàn)樣品和數(shù)據(jù)資源的 共享。模型傳遞的成功與否直接影響光譜分析技術的應用和推廣。
[0005] 光譜模型傳遞方法主要有兩種,一種為有標樣方法,如直接校正(DS)法、分段直 接校正(ros)法和Shenk's法等。這類方法需要選擇一定數(shù)量的樣品組成標樣集(也稱轉 換集),并在主儀器和從儀器上分別測得其光譜,從而找出該函數(shù)關系。另一種是無標樣方 法,如有限脈沖響應(FIR)法等。這類方法不需要選擇標樣集。
[0006] 目前DS法和PDS方法是最常用、最有效的方法。DS法利用全譜區(qū)的光譜數(shù)據(jù)逐一 校正每個波長點,原理簡單,使用方便,但所需標樣數(shù)多。PDS法是一種多元全光譜模型傳遞 方法,它的基本假設是實際光譜數(shù)據(jù)的變化只局限于一個小的區(qū)域,選擇合適的窗口對各 個波長點的光譜進行較正,但在實際中不同光譜儀上測量的光譜存在較大差異,這些差異 大小及體現(xiàn)在譜區(qū)的范圍有很大的不同,有的是局部,有的是全譜區(qū),因此會產(chǎn)生一定的校 正誤差。
[0007] 總之現(xiàn)有的光譜模型傳遞方法需要參數(shù)較多,且傳遞模型的準確度不夠高。
【發(fā)明內容】
[0008] 本發(fā)明的目的是提供一種基于一元線性回歸的光譜模型傳遞方法,利用偏最小二 乘法對樣品各成分在不同儀器上分別建立校正模型;利用預測集樣品對校正模型進行性能 評價,選擇預測效果好的儀器作為主儀器,利用基于一元線性回歸的光譜模型傳遞方法對 從儀器上的光譜進行校正。本方法所求參數(shù)少、模型簡單,預測的準確度高。
[0009] 本發(fā)明提供一種基于一元線性回歸的光譜模型傳遞方法,主要步驟如下:
[0010] I、樣品光譜的預處理
[0011] 光譜分析儀器臺數(shù)Μ彡2,已知樣品在各臺儀器上采集的光譜數(shù)據(jù)及樣品m種主要 成分含量的參考值。對各臺光譜儀器上采集的樣品光譜數(shù)據(jù)進行相同的預處理,以消除非 目標因素的干擾,提高模型傳遞精度。
[0012] II、校正模型的建立
[0013] 分別將Μ臺儀器上采集的樣品光譜數(shù)據(jù)針對m種成分劃分為m個校正集和對應的 m個預測集,校正集中的樣品數(shù)&彡30,預測集中的樣品數(shù)N2> 10,且&>隊,各臺儀器上 校正集和預測集樣品的選取一致。利用多元校正方法,以校正集樣品的m種成分含量為定 標值,即作為因變量,以校正集樣品的光譜數(shù)據(jù)作為自變量,分別建立Μ臺儀器上的m個校 正模型。
[0014] III、校正模型評價
[0015] 根據(jù)步驟II建立的校正模型,將相應的預測集樣品的光譜數(shù)據(jù)代入其中,計算得 到預測集樣品各成分含量的預測值,將預測值與實際成分含量相比較,進行MXm個校正模 型的評價。評價參數(shù)選用預測標準偏差(SEP)。
[0016] IV、主儀器的選擇
[0017] 根據(jù)步驟III的評價結果,選擇預測效果最好的校正模型對應的儀器作為主儀器, 其他儀器作為從儀器。
[0018] V、模型傳遞,光譜校正
[0019] 利用基于一元線性回歸光譜模型傳遞,對從儀器預測集樣品光譜進行校正,具體 步驟如下:
[0020] V a、轉換集樣品的選擇
[0021] 本方法為有標樣方法,需要選擇轉換集樣品。轉換集樣品數(shù)的選取對轉移效果有 重要影響,轉換集樣品數(shù)小,則使轉化信息不夠充分;轉換集樣品數(shù)太大,則使實際應用太 復雜。轉換集樣品取自校正集,轉換集樣品數(shù)隊的范圍設為1 < N3 < 20,對樣品不同成分, 以預測標準偏差SEP最小為原則,由主儀器的某成分校正集中分別選擇針對各從儀器的最 佳樣品,在各從儀器的該成分校正集中,分別選擇相同序號的樣品作為各從儀器該成分的 轉換集樣品。
[0022] V b、求回歸系數(shù)
[0023] 設任意光譜矩陣表示為X(nXp),其中η為樣品數(shù);p為變量數(shù);X(i,j)表示第i 個樣品在第j個波長點處的吸光度;X(i,:)為光譜矩陣的行向量,表示第i個樣品在所有 波長處的吸光度;X(:,j)為光譜矩陣的列向量,表示所有樣品在第j個波長處的吸光度;X m 和Xs分別表示主從儀器上的轉換集光譜矩陣。
[0024] 本方法假設不同波長間吸光度是相互獨立的,利用一元線性回歸對從儀器采集的 樣品光譜進行校正。
[0025] 設Xm(i,j)和Xs(i,j)滿足如下一元線性方程:
[0026]
【權利要求】
1.基于一元線性回歸的光譜模型傳遞方法,主要步驟如下: I、 樣品光譜的預處理 光譜分析儀器臺數(shù)Μ > 2,已知樣品在各臺儀器上采集的光譜數(shù)據(jù)及樣品m種主要成分 含量的參考值;對各臺光譜儀器上采集的樣品光譜數(shù)據(jù)進行相同的預處理; II、 校正模型的建立 分別將Μ臺儀器上采集的樣品光譜數(shù)據(jù)針對m種成分劃分為m個校正集和對應的m個 預測集,校正集中的樣品數(shù)K > 30,預測集中的樣品數(shù)N2 > 10,且&> N2,各臺儀器上校正 集和預測集樣品的選取一致;利用多元校正方法,以校正集樣品的m種成分含量為因變量, 以校正集中K個樣品的光譜數(shù)據(jù)作為自變量,分別建立Μ臺儀器上的m個校正模型; III、 校正模型評價 根據(jù)步驟II建立的校正模型,將相應的預測集樣品的光譜數(shù)據(jù)代入其中,計算得到預 測集樣品各成分含量的預測值,將預測值與實際成分含量相比較,進行MXm個校正模型的 評價;評價參數(shù)選用預測標準偏差; IV、 主儀器的選擇 根據(jù)步驟III的評價結果,選擇預測效果最好的校正模型對應的儀器作為主儀器,其它 儀器作為從儀器; V、 模型傳遞,光譜校正 利用基于一元線性回歸光譜模型傳遞,對從儀器預測集樣品光譜進行校正,具體步驟 如下: V a、轉換集樣品的選擇 轉換集樣品取自校正集,轉換集樣品數(shù)隊的范圍設為1 < N3 < 20,對樣品不同成分, 以預測標準偏差最小為原則,由主儀器的某成分校正集中分別選擇針對各從儀器的最佳樣 品,然后在各從儀器的該成分校正集中分別選擇相同序號樣品作為各從儀器上的該成分轉 換集; V b、求回歸系數(shù) 設任意光譜矩陣表示為X(nXp),其中η為樣品數(shù);p為變量數(shù);X(i,j)表示第i個樣 品在第j個波長點處的吸光度;X(i,:)為光譜矩陣的行向量,表示第i個樣品在所有波長 處的吸光度;X(:,j)為光譜矩陣的列向量,表示所有樣品在第j個波長處的吸光度;X_^PX S 分別表示主從儀器上的轉換集光譜矩陣; 本方法假設不同波長間吸光度是相互獨立的,利用一元線性回歸對從儀器采集的樣品 光譜進行校正; 通過下式求出各從儀器上任意波長點j,j的取值滿足j e 1…p,對應的回歸系數(shù)bjj) 和b(j)各p個,共有pX2個,
其中,IXi為元素全為1的nX 1的列向量;[lnX1Xs(:,j)]+為[lnX1Xs(:,j)]的廣義逆 矩陣; V c、光譜校正 對在從儀器上測得的未知樣品光譜xmknOTn,用下式進行轉換得到與主儀器上測得的光 譜相一致的光譜xstd,
根據(jù)校正后的從儀器光譜xstd,由主儀器建立的校正模型得到樣品各成分含量的最終 結果。
2. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟I中的光譜為近紅外光譜、中紅外光譜、拉曼光譜及紫外-可見光譜中的任 一種。
3. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟I中的預處理為平滑處理、二階求導處理、標準化處理、基線偏移處理、標準 正態(tài)變量處理、多元散射校正處理和去趨勢處理中的任意一種或多種的組合。
4. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟I中的已知m種主要成分含量的樣品集,分別按某種成分含量梯度排序,然 后按隔Λ選一,選取N2個此種成分的預測集樣品,其余作為此種成分的校正集樣品,Λ為 3?6的整數(shù)。
5. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟II中建立校正模型的多元校正方法為主成分回歸法、偏最小二乘法、支持向 量回歸法和人工神經(jīng)網(wǎng)絡回歸法中的任意一種。
6. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟III中校正模型評價為預測標準偏差組合校正標準偏差和/或決定系數(shù)。
7. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟V a中自校正集選取轉換集樣品的方法為杠桿點算法、MSID算法、 Kennard-Stone算法及隨機選取法中的任一種。
8. 根據(jù)權利要求1所述的基于一元線性回歸的光譜模型傳遞方法,其特征在于: 所述步驟V a中轉換集樣品數(shù)滿足1 < N3 < 20。
【文檔編號】G01N21/359GK104089911SQ201410299422
【公開日】2014年10月8日 申請日期:2014年6月27日 優(yōu)先權日:2014年6月27日
【發(fā)明者】楊輝華, 樊永顯, 張曉鳳, 謝譜模, 李靈巧 申請人:桂林電子科技大學