本發(fā)明涉及一種工業(yè)過程軟測量方法,尤其是涉及一種基于集成變量選擇型偏最小二乘回歸的軟測量方法。
背景技術(shù):
在現(xiàn)代流程工業(yè)過程中,實時測量與監(jiān)控產(chǎn)品的質(zhì)量指標(biāo)或其他某些能間接反映產(chǎn)品質(zhì)量的指標(biāo)是保證產(chǎn)品質(zhì)量穩(wěn)定性的最直接最簡單的途徑。相比于溫度、流量、壓力等容易測量的數(shù)據(jù)信息而言,這些能直接或間接反映產(chǎn)品質(zhì)量信息的關(guān)鍵變量通常不是那么容易獲取的。以液體產(chǎn)品的濃度為例,獲取濃度信息可通過在線分析儀實時測量,也可通過人工采集液體樣本進(jìn)行離線分析,兩種手段各有優(yōu)劣。在線分析儀雖能保證實時測量到的質(zhì)量信息,但設(shè)備價格高昂,而且后期維護(hù)成本較高。離線分析手段所需設(shè)備價格低廉,但會造成嚴(yán)重的滯后,無法及時反映當(dāng)前質(zhì)量狀況。在這種背景下,軟測量技術(shù)應(yīng)運而生,其基本思想在于:先利用生產(chǎn)過程歷史數(shù)據(jù)建立回歸模型,后在線利用與之相關(guān)的其他容易測量的變量(如溫度、壓力、流量等),估計出該難以測量變量的數(shù)值以便實時監(jiān)控產(chǎn)品的質(zhì)量信息。
查閱已有的文獻(xiàn)與專利,可以發(fā)現(xiàn)實施軟測量的方法主要有:統(tǒng)計回歸法、神經(jīng)網(wǎng)絡(luò)、支持向量回歸等。通常來講,在數(shù)據(jù)量非常充分以及非線性特性很強的條件下,利用神經(jīng)網(wǎng)絡(luò)或支持向量回歸建立相應(yīng)的軟測量模型,通常能取得較好的軟測量效果,但是這類方法在模型更新時會受限于訓(xùn)練耗時大的問題。相比之下,統(tǒng)計回歸法所需的數(shù)據(jù)量較小,而且訓(xùn)練時間很短,可較好的適應(yīng)于模型更新,已越來越多地被應(yīng)用在軟測量建模領(lǐng)域。偏最小二乘回歸(partialleastsquareregression,plsr)是最常用的統(tǒng)計回歸算法,各種改進(jìn)舉措層出不窮。plsr算法旨在最大化輸入數(shù)據(jù)與輸出數(shù)據(jù)間的協(xié)方差,這里的輸入數(shù)據(jù)通常是歷史數(shù)據(jù)庫中容易測量的數(shù)據(jù)(如溫度、壓力、流量等),而輸出數(shù)據(jù)一般是直接或間接反映產(chǎn)品質(zhì)量信息的測量數(shù)據(jù)(如濃度、成分比等)。然而,若是輸入數(shù)據(jù)中包含了很多與輸出不怎么相關(guān)的干擾變量的測量數(shù)據(jù),plsr模型的回歸擬合精度會受到很大影響。由于軟測量方法通常針對的都是數(shù)據(jù),直接通過數(shù)據(jù)剔除與輸出不相關(guān)的測量變量是非常困難的。若是依賴生產(chǎn)機理或操作人員經(jīng)驗,那么相應(yīng)的plsr模型建立方法不具備通用性,而且對機理知識或經(jīng)驗的正確性要求也非常高。
為此,科研文獻(xiàn)中出現(xiàn)了很多關(guān)于輸入數(shù)據(jù)變量選擇的方法以改進(jìn)plsr模型的回歸精度,較常見的有回歸系數(shù)plsr法(β-plsr)、變量重要性plsr法(vip-plsr)、無益變量剔除plsr法(uve-plsr)等。不同的選擇方法揭示訓(xùn)練數(shù)據(jù)不同的潛在特征,但直至目前為止,還沒有文獻(xiàn)或?qū)@苯幼C明哪種變量選擇方法無論針對何種工業(yè)對象的采樣數(shù)據(jù)始終是最佳的。針對某一個工業(yè)過程對象,確定哪種方法最合適實際上只有通過數(shù)據(jù)驗證才能知曉??紤]到現(xiàn)代流程工業(yè)的時變特性,環(huán)境以及設(shè)備狀態(tài)在不斷變化,相應(yīng)采樣數(shù)據(jù)的特征同樣是在變化的。可能某一段時間類采樣數(shù)據(jù)適合于某種變量選擇法,而另一時間段的采樣數(shù)據(jù)卻適合于使用另外一種變量選擇方法。因此,工業(yè)過程的時變特性給變量選擇型plsr方法的適用性提出了新的挑戰(zhàn)。因此,丞待設(shè)計出一種能應(yīng)對這種數(shù)據(jù)變化特性的變量選擇型plsr軟測量方法。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的主要技術(shù)問題是:在實際應(yīng)用中,很難確定哪種變量選擇型plsr方法最適合于為當(dāng)前數(shù)據(jù)建立軟測量模型。為此,本發(fā)明提供一種基于集成變量選擇型偏最小二乘回歸的軟測量方法。該方法首先同時使用多種變量選擇方法建立一個集成變量選擇型plsr模型。其次,在線實施軟測量時,利用該集成變量選擇型plsr模型計算得到多個輸出估計值。最后,通過加權(quán)計算得到最終的輸出估計值。
本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案為:一種基于集成變量選擇型偏最小二乘回歸的軟測量方法,包括以下步驟:
(1)利用集散控制系統(tǒng)收集工業(yè)生產(chǎn)過程中容易測量的數(shù)據(jù)組成軟測量模型的輸入訓(xùn)練數(shù)據(jù)矩陣x∈rn×m,并對其進(jìn)行標(biāo)準(zhǔn)化處理使各個過程變量的均值為0,標(biāo)準(zhǔn)差為1,得到新數(shù)據(jù)矩陣
(2)采用離線分析手段獲取與輸入訓(xùn)練數(shù)據(jù)x相對應(yīng)的產(chǎn)品質(zhì)量數(shù)據(jù)組成輸出訓(xùn)練數(shù)據(jù)y∈rn×1,計算向量y的均值μ與標(biāo)準(zhǔn)差ε,并對其進(jìn)行標(biāo)準(zhǔn)化處理得到新數(shù)據(jù)向量
(3)利用plsr算法建立輸入數(shù)據(jù)
(4)分別實施β-plsr、vip-plsr、和uve-plsr方法,建立相應(yīng)的軟測量模型。
(5)利用β-plsr、vip-plsr、和uve-plsr模型計算對應(yīng)于輸出
(6)再次利用plsr算法建立新輸入z與輸出
(7)收集新的容易測量的數(shù)據(jù)xt∈rm×l,并對其進(jìn)行與x相同的標(biāo)準(zhǔn)化處理得到
(8)分別利用β-plsr、vip-plsr、和uve-plsr模型計算得到t時刻的輸出估計值
(9)通過加權(quán)法計算t時刻的輸出估計值
與現(xiàn)有技術(shù)方法相比,本發(fā)明方法的主要優(yōu)勢在于:同時建立了三個不同的變量加權(quán)型plsr軟測量模型,并通過加權(quán)的方式集成得到最終的輸出估計值,在線實施軟測量值時不再拘泥于單個的變量加權(quán)型plsr模型,而是采用多個軟測量模型集成的方式,巧妙地避免了確定哪種變量選擇型plsr方法最適合于為當(dāng)前數(shù)據(jù)建立軟測量模型這一難題。此外,本發(fā)明方法通過plsr算法計算出來的回歸系數(shù)向量來對各模型輸出估計值進(jìn)行適當(dāng)加權(quán),不僅不需要反復(fù)驗證某個變量選擇方法的適用性,而且還可以進(jìn)一步地提高軟測量模型的精度。可以說,本發(fā)明方法是在已有工作的基礎(chǔ)上,利用集成建模思路有效地提升變量選擇型plsr方法用于軟測量建模的適用性。
附圖說明
圖1為本發(fā)明方法的實施流程圖。
圖2為plsr算法迭代求取回歸模型的流程示意圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明方法進(jìn)行詳細(xì)的說明。
如圖1所示,本發(fā)明涉及了一種基于集成變量選擇型偏最小二乘回歸的軟測量方法,該方法的具體實施步驟如下所示:
步驟1:利用集散控制系統(tǒng)收集工業(yè)生產(chǎn)過程中容易測量的數(shù)據(jù)組成軟測量模型的輸入訓(xùn)練數(shù)據(jù)矩陣x∈rn×m,并對其進(jìn)行標(biāo)準(zhǔn)化處理使各個過程變量的均值為0,標(biāo)準(zhǔn)差為1,得到新數(shù)據(jù)矩陣
步驟2:采用離線分析手段獲取與輸入訓(xùn)練數(shù)據(jù)x相對應(yīng)的產(chǎn)品質(zhì)量數(shù)據(jù)組成輸出訓(xùn)練數(shù)據(jù)y∈rn×l,計算向量y的均值μ與標(biāo)準(zhǔn)差ε,并對其進(jìn)行標(biāo)準(zhǔn)化處理得到新向量
步驟3:利用plsr算法建立輸入數(shù)據(jù)
其中,
①初始化d=1,并設(shè)置向量
②依據(jù)公式wd=x0tu/(utu)計算輸入權(quán)值向量wd,并用公式wd=wd/||wd||單位化向量wd;
③依據(jù)公式sd=x0wd/(wdtwd)計算得分向量sd;
④依據(jù)公式gd=y(tǒng)0tsd/(sdtsd)計算輸出權(quán)值gd;
⑤依據(jù)公式u=y(tǒng)0gd更新向量u;
⑥重復(fù)②~⑤直至sd收斂(即向量sd中各元素不再變化);
⑦保留輸入權(quán)值向量wd與輸出權(quán)值gd,并依據(jù)公式pd=x0tsd/(sdtsd)計算投影向量ph;
⑧依據(jù)如下兩式更新輸入矩陣x0與輸出向量y0:
x0=x0-sdpdt(2)
y0=y(tǒng)0-sdgd(3)
⑨令d=d+1后,若d≤3m/4,重復(fù)②~⑧求解下一個wd、gd、和pd;若d>3m/4,則執(zhí)行⑩;
⑩將得到的所有輸入權(quán)值向量組成矩陣w=[w1,w2,…,wd]、所有輸出權(quán)值向量組成行向量g=[g1,g2,…,gd]、以及所有投影向量組成矩陣p=[p1,p2,…,pd],那么plsr模型中的投影變換矩陣為u=w(ptw)-1,d個得分向量組成的矩陣為
步驟4:分別實施β-plsr、vip-plsr、和uve-plsr方法,建立相應(yīng)的軟測量模型,具體的操作步驟如下所示:
實施β-plsr方法的具體步驟為:
①對回歸系數(shù)向量β中各元素求取絕對值得到新向量b,并計算向量b的均值,記為α;
②找出向量b中大于α的元素,并將相應(yīng)的位置標(biāo)號存放于位置標(biāo)號集θ1中;
③根據(jù)記錄的位置標(biāo)號θ1,從輸入數(shù)據(jù)矩陣
④利用plsr算法建立輸入x1與輸出
實施vip-plsr方法的具體步驟為:
①初始化h=1;
②根據(jù)如下所示公式計算輸入數(shù)據(jù)矩陣
其中,wj,h表示向量wj中的第h個元素,符號||||表示計算向量的長度。
③判斷h<m?若是,置h=h+1后,若返回②計算下一個變量的重要性;若否,執(zhí)行下一步驟④;
④找出向量v=[v1,v2,…,vm]中大于1的元素,并將相應(yīng)的位置標(biāo)號存放于位置標(biāo)號集θ2中;
⑤根據(jù)記錄的位置標(biāo)號θ2,從輸入數(shù)據(jù)矩陣
⑥利用plsr算法建立輸入x2與輸出
實施uve-plsr方法的具體步驟為:
①隨機產(chǎn)生一個n×m的數(shù)據(jù)矩陣n,矩陣n中各元素都是在區(qū)間[0,1]上均勻分布的隨機數(shù);
②對矩陣n中各列進(jìn)行標(biāo)準(zhǔn)化處理得到
③利用plsr算法建立輸入
④將向量
⑤找出向量b1中絕對值大于δ的元素,并將相應(yīng)的位置標(biāo)號存放于位置標(biāo)號集θ3中;
⑥根據(jù)記錄的位置標(biāo)號θ3,從輸入數(shù)據(jù)矩陣
⑦利用plsr算法建立輸入x3與輸出
步驟5:按照如下所示公式,分別利用β-plsr、vip-plsr、和uve-plsr模型中的回歸系數(shù)向量β1,β2,β3計算對應(yīng)于輸出
yk=xkβk(5)
上式中,下標(biāo)號k=1,2,3。并將其組成新的輸入矩陣z=[y1,y2,y3]∈rn×3。
步驟6:再次利用plsr算法建立新輸入z與輸出
步驟7:收集新的容易測量的數(shù)據(jù)xt∈rm×l,并對其進(jìn)行與x相同的標(biāo)準(zhǔn)化處理得到
步驟8:依據(jù)位置標(biāo)號集θ1,θ2,θ3分別從向量
步驟9:根據(jù)如下所示公式,利用β-plsr、vip-plsr、和uve-plsr模型中的回歸系數(shù)向量分別計算得到t時刻的輸出估計值
步驟10:通過加權(quán)法計算t時刻的輸出估計值
上述實施例只用來解釋本發(fā)明,而不是對本發(fā)明進(jìn)行限制,在本發(fā)明的精神和權(quán)利要求的保護(hù)范圍內(nèi),對本發(fā)明做出的任何修改和改變,都落入本發(fā)明的保護(hù)范圍內(nèi)。