基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法
【專利摘要】本發(fā)明公開了一種基于高斯混合模型(GMM)的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建摸方法,該方法首先訓(xùn)練過程高斯混合模型,獲取各高斯成分參數(shù),建立相應(yīng)的子模型;然后通過貝葉斯方法計(jì)算待預(yù)測(cè)樣本屬于各高斯成分的后驗(yàn)概率,以及各高斯成分下局部馬氏距離,從而得到加權(quán)的樣本相似度定義指標(biāo);最后采用新的相似度指標(biāo)合理選擇相似樣本用于局部建模。本發(fā)明不僅能夠很好的處理過程非高斯性和非線性,而且充分提取待預(yù)測(cè)樣本特性,更為合理的選擇相似樣本用于即時(shí)學(xué)習(xí)建摸,有利于提高模型預(yù)測(cè)精度。
【專利說明】基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于工業(yè)過程軟測(cè)量建模領(lǐng)域,尤其涉及一種基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法。
【背景技術(shù)】
[0002]隨著現(xiàn)代工業(yè)過程對(duì)質(zhì)量控制、可靠性等要求的不斷提高,質(zhì)量相關(guān)的過程變量進(jìn)行實(shí)時(shí)監(jiān)測(cè)和控制變得更加重要。然而在復(fù)雜的工業(yè)生產(chǎn)過程中,由于工藝和條件的限制,存在許多難以直接測(cè)量的變量。這些變量雖然可以用在線分析儀進(jìn)行測(cè)量,但是由于在線分析儀成本高、維護(hù)困難,且存在較大的測(cè)量滯后,不能滿足實(shí)時(shí)控制的需要。為了解決上述問題,軟測(cè)量技術(shù)作為具有廣闊發(fā)展前景的新興技術(shù)應(yīng)運(yùn)而生。軟測(cè)量技術(shù)的核心是對(duì)于一些難以測(cè)量的重要變量(主導(dǎo)變量),選擇另外一些容易測(cè)量的變量(輔助變量)通過構(gòu)建數(shù)學(xué)模型,以實(shí)現(xiàn)對(duì)主導(dǎo)變量的最佳估計(jì)。目前常用的軟測(cè)量建模方法有主元回歸(PCR)、偏最小二乘回歸(PLS)、支持向量回歸(SVR)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等。
[0003]在實(shí)際過程中,軟測(cè)量模型投入運(yùn)行后,由于催化劑老化、設(shè)備老化、原料變化、產(chǎn)品質(zhì)量要求改變等過程時(shí)變特性以及建模樣本的不完備性,隨著時(shí)間的推移,離線建立的軟測(cè)量模型預(yù)測(cè)精度會(huì)下降,出現(xiàn)“模型老化”現(xiàn)象,導(dǎo)致模型的輸出估計(jì)值出現(xiàn)較大的偏差,不再適應(yīng)當(dāng)前的工況特性。因此需要對(duì)軟測(cè)量模型進(jìn)行自適應(yīng)更新,根據(jù)在線樣本數(shù)據(jù)不斷修正模型參數(shù)以適應(yīng)過程時(shí)變特性。
[0004]目前常用的對(duì)模型進(jìn)行更新的方法有滑動(dòng)窗方法和遞歸方法,能夠有效處理慢時(shí)變過程,對(duì)于過程突變或者變化相對(duì)頻繁的過程,這類方法效果并不理想。為了解決這個(gè)問題,國(guó)外學(xué)者Cheng(2005)提出基于即時(shí)學(xué)習(xí)(JITL)的局部建模方法用于非線性過程的建模。該方法對(duì)于待預(yù)測(cè)的樣本,在歷史數(shù)據(jù)中找出與其最相似的若干個(gè)樣本建立局部模型,通過局部模型進(jìn)行在線預(yù)測(cè)輸出。JITL方法既能解決過程時(shí)變問題,又能解決過程非線性問題,主要特征有以下幾個(gè)方面:(I)局部建模針對(duì)當(dāng)前樣本建立;(2)采用對(duì)應(yīng)的局部模型計(jì)算當(dāng)前樣本的輸出預(yù)測(cè)值;(3)局部模型隨著當(dāng)前樣本進(jìn)行實(shí)時(shí)更新。
[0005]相似度準(zhǔn)則的選取是JITL建模的核心部分,對(duì)于局部模型的預(yù)測(cè)精度至關(guān)重要。目前基于歐式距離(ED)和基于馬氏距離(MD)的方法為常用的相似度準(zhǔn)則。傳統(tǒng)的相似度準(zhǔn)則為一種全局相似度指標(biāo),僅僅考慮了樣本之間的距離信息,并未充分考慮新增樣本的特性,同時(shí)傳統(tǒng)的相似度準(zhǔn)則適用于高斯過程,事實(shí)上復(fù)雜多變的實(shí)際工業(yè)過程往往會(huì)呈現(xiàn)非高斯的特性。這些缺陷將會(huì)影響相似樣本的選擇,進(jìn)而導(dǎo)致模型預(yù)測(cè)精度降低。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法。
[0007]本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的:一種基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法,包括以下步驟:[0008]( I)通過集散控制系統(tǒng)和實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)收集脫丁烷工業(yè)生產(chǎn)過程關(guān)鍵變量在正常工況下的數(shù)據(jù):X={xi e RmI i=i,2,...,n°其中,η為樣本個(gè)數(shù),m為關(guān)鍵變量個(gè)數(shù),R為實(shí)數(shù)集。分別將這些數(shù)據(jù)存入數(shù)據(jù)庫(kù)。
[0009](2)通過離線實(shí)驗(yàn)室分析獲取歷史數(shù)據(jù)中用于建模的樣本所對(duì)應(yīng)的脫丁烷塔塔底丁烷濃度,作為軟測(cè)量模型的輸出I e Rn。
[0010](3)分別對(duì)關(guān)鍵變量和輸出變量進(jìn)行預(yù)處理和歸一化,使得各個(gè)過程變量和塔底丁烷濃度的均值為零,方差為1,得到新的數(shù)據(jù)集。
[0011](4)給定高斯混合模型的高斯成分個(gè)數(shù)K,采用K-means方法對(duì)數(shù)據(jù)進(jìn)行聚類,將數(shù)據(jù)聚類為K類,計(jì)算初始值Ω ω:
[0012]
【權(quán)利要求】
1.一種基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法,其特征在于,包括以下步驟: (1)通過集散控制系統(tǒng)和實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)收集脫丁烷工業(yè)生產(chǎn)過程關(guān)鍵變量在正常工況下的數(shù)據(jù):X={xi ∈ Rm}?=1,2,...,η。其中,η為樣本個(gè)數(shù),m為關(guān)鍵變量個(gè)數(shù),R為實(shí)數(shù)集。分別將這些數(shù)據(jù)存入數(shù)據(jù)庫(kù); (2)通過離線實(shí)驗(yàn)室分析獲取歷史數(shù)據(jù)中用于建模的樣本所對(duì)應(yīng)的脫丁烷塔塔底丁烷濃度,作為軟測(cè)量模型的輸出y e Rn; (3)分別對(duì)關(guān)鍵變量和輸出變量進(jìn)行預(yù)處理和歸一化,使得各個(gè)過程變量和塔底丁烷濃度的均值為零,方差為1,得到新的數(shù)據(jù)集; (4)給定高斯混合模型的高斯成分個(gè)數(shù)K,采用K-means方法對(duì)數(shù)據(jù)進(jìn)行聚類,將數(shù)據(jù)聚類為K類,計(jì)算初始值Ωω: 其中,πκ(°),μκ(°),Σκ(°)分別為樣本屬于第K個(gè)高斯成分的先驗(yàn)概率初始值、第K個(gè)高斯成分的均值初始值以及協(xié)方差的初始值; (5)利用初始值Ω(°)和訓(xùn)練樣本X=Ixie線訓(xùn)練高斯混合模型,通過EM算法迭代計(jì)算模型參數(shù)Ω:
2.根據(jù)權(quán)利要求1所述基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法,其特征在于,所述步驟4具體為: Ca)從數(shù)據(jù)集中任意選擇K個(gè)對(duì)象作為初始聚類中心; (b)根據(jù)每個(gè)聚類中所有數(shù)據(jù)的均值,計(jì)算樣本集中每個(gè)對(duì)象與這些中心對(duì)象的距離,并根據(jù)最小距離重新對(duì)相應(yīng)對(duì)象進(jìn)行劃分; (c)重新計(jì)算變化后每個(gè)聚類的均值; (d)重復(fù)b步和c步,直到每個(gè)聚類不再發(fā)生變化為止,計(jì)算聚類后K個(gè)數(shù)據(jù)類參數(shù)
3.根據(jù)權(quán)利要求1所述基于高斯混合模型的即時(shí)學(xué)習(xí)軟測(cè)量建模方法,其特征在于,所述步驟5具體為: 給定訓(xùn)練樣本X=Ix1, χ2,...,χη}以及初始化參數(shù)
4.根據(jù)權(quán)利要求1所述基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法,其特征在于,所述步驟8具體為:(a)對(duì)待預(yù)測(cè)樣本Xq,采用貝葉斯公式計(jì)算其屬于每個(gè)高斯成分的概率p(Xqe Cjxq):
5.根據(jù)權(quán)利要求1所述基于高斯混合模型的即時(shí)學(xué)習(xí)脫丁烷塔軟測(cè)量建模方法,其特征在于,所述步驟9具體為: 局部建模輸入輸出數(shù)據(jù)集為{Xu yL},PLS將輸入輸出分解成得分矩陣?Υ,負(fù)載矩陣和%,權(quán)值矩陣I,如下所示:
xl=tltpl+el
yL=TLqL+fL 其中,L為局部建模的樣本個(gè)數(shù),E和f分別為輸入和輸出殘差; 對(duì)于待預(yù)測(cè)數(shù)據(jù)&輸出yq為:
【文檔編號(hào)】G06F17/50GK103927412SQ201410129014
【公開日】2014年7月16日 申請(qǐng)日期:2014年4月1日 優(yōu)先權(quán)日:2014年4月1日
【發(fā)明者】范苗, 葛志強(qiáng), 宋執(zhí)環(huán) 申請(qǐng)人:浙江大學(xué)