基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法
【專利摘要】本發(fā)明公開(kāi)了一種基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,該方法首先將三維的過(guò)程測(cè)量數(shù)據(jù)按變量方向展開(kāi)成二維矩陣;其次定義新的不相似度函數(shù),建立模糊高斯混合模型,刻畫間歇過(guò)程的多階段特性,將過(guò)程與質(zhì)量變量劃分到對(duì)應(yīng)不同階段的多個(gè)高斯成分區(qū)域;然后計(jì)算待預(yù)測(cè)樣本屬于各高斯成分的模糊隸屬度,識(shí)別出相應(yīng)的高斯成分;再次計(jì)算出測(cè)量數(shù)據(jù)在相鄰兩個(gè)階段的后驗(yàn)概率作為自適應(yīng)權(quán)重,用于過(guò)渡區(qū)域的質(zhì)量預(yù)測(cè);最后根據(jù)識(shí)別出的局部高斯成分進(jìn)行質(zhì)量預(yù)測(cè)。本發(fā)明不僅能有效地提取間歇過(guò)程的多階段特性,而且較好地抓取了相鄰階段之間過(guò)渡區(qū)域的動(dòng)態(tài)變化,建立較為合理、準(zhǔn)確的模型,從而提高了模型的預(yù)測(cè)精度。
【專利說(shuō)明】基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生化過(guò)程軟測(cè)量領(lǐng)域,尤其涉及一種基于模糊高斯混合模型的多階段 間歇過(guò)程軟測(cè)量方法。
【背景技術(shù)】
[0002] 間歇過(guò)程已經(jīng)廣泛應(yīng)用于精細(xì)化工、材料、生物技術(shù)、聚合物反應(yīng)等領(lǐng)域。產(chǎn)品關(guān) 鍵變量的測(cè)量對(duì)工廠的先進(jìn)過(guò)程控制和優(yōu)化、過(guò)程效率的提高及產(chǎn)品質(zhì)量的改善具有十分 重要的作用。由于工藝和條件的限制,關(guān)鍵變量常難以進(jìn)行精確和實(shí)時(shí)測(cè)量,使得間歇操作 過(guò)程面臨巨大挑戰(zhàn)。相比于硬件儀器測(cè)量或離線實(shí)驗(yàn)分析,目前軟測(cè)量技術(shù)引起了廣泛關(guān) 注?;谲洔y(cè)量的預(yù)測(cè)模型具有強(qiáng)大的推理能力,對(duì)產(chǎn)品關(guān)鍵變量提供了可靠的實(shí)時(shí)預(yù)測(cè)。 軟測(cè)量技術(shù)主要通過(guò)對(duì)容易測(cè)量的過(guò)程變量進(jìn)行建模,以便預(yù)測(cè)出難以測(cè)量的關(guān)鍵變量。 常用的軟測(cè)量方法有主元回歸(PCR)、偏最小二乘回歸(PLS)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等。
[0003] 這些用于間歇過(guò)程中關(guān)鍵變量預(yù)測(cè)的軟測(cè)量技術(shù),通常是基于間歇過(guò)程處于同一 操作階段和同一模態(tài)假說(shuō)的單一回歸模型。在實(shí)際應(yīng)用中,間歇過(guò)程隨反應(yīng)進(jìn)程或操作條 件的變化呈現(xiàn)多階段特性,不同階段的數(shù)據(jù)會(huì)動(dòng)態(tài)變化,導(dǎo)致質(zhì)量變量預(yù)測(cè)的準(zhǔn)確性和可 靠性由于過(guò)程階段的迀移而發(fā)生退化。研宄者設(shè)計(jì)出了一些模型更新策略或多模態(tài)方法用 于操作階段的迀移,這些方法在不同階段的數(shù)據(jù)分布處于明顯不同的區(qū)域時(shí),可獲得較高 的預(yù)測(cè)精度。然而,階段之間的數(shù)據(jù)常出現(xiàn)交叉重疊分布,難以進(jìn)行清晰劃分。"硬"劃分方 法難以分割處于不同階段之間過(guò)渡區(qū)域的數(shù)據(jù),從而影響預(yù)測(cè)精度。
【發(fā)明內(nèi)容】
[0004] 鑒于現(xiàn)有方法存在的不足,提供了一種基于模糊高斯混合模型的多階段間歇過(guò)程 軟測(cè)量方法。
[0005] 本發(fā)明通過(guò)以下技術(shù)方案實(shí)現(xiàn):一種基于模糊高斯混合模型的多階段間歇過(guò)程軟 測(cè)量方法,包括以下步驟:
[0006] S1、數(shù)據(jù)預(yù)處理:選擇間歇過(guò)程多階段運(yùn)行的數(shù)據(jù)I (其中I是批次數(shù),J 是測(cè)量變量數(shù),K是采樣點(diǎn)數(shù)),組成訓(xùn)練樣本集。將三維矩陣f按照變量方向展開(kāi)成二維 矩陣X可表示為:^=[卻=1>碎=2>…七LiO Γ,對(duì)應(yīng)的輸出質(zhì)量變量以同樣的方式 表示成:y=[ 拉=2>…U T。
[0007] S2、建立高斯混合模型:利用訓(xùn)練樣本訓(xùn)練高斯混合模型,通過(guò)期望最大化算法迭 代計(jì)算模型參數(shù)? = (α,μ, Σ),其中α為混合系數(shù),μ、Σ為高斯成分的均值及協(xié)方 差。
[0008] S3、建立模糊高斯混合模型:定義新的不相似度函數(shù),最小化模糊C均值算法的目 標(biāo)函數(shù),得到新的聚類中心及樣本的模糊隸屬度,不斷更新模型,并決策出最佳的聚類數(shù)目 對(duì)應(yīng)不同的操作階段。
[0009] S4、鑒別出過(guò)渡區(qū)域:預(yù)設(shè)統(tǒng)計(jì)顯著性水平作為閾值,如果測(cè)量樣本的最大模糊隸 屬度大于閾值,說(shuō)明該樣本可劃分到獨(dú)立的操作階段;如果測(cè)量樣本的最大模糊隸屬度小 于閾值,表明其位于兩個(gè)相鄰階段之間的過(guò)渡區(qū)域;進(jìn)一步判斷出連接過(guò)渡區(qū)域的兩個(gè)相 鄰階段;
[0010] S5、建立多個(gè)局部預(yù)測(cè)模型:利用劃分到多個(gè)局部階段的測(cè)量子集建立多個(gè)局部 偏最小二乘回歸模型,同時(shí),將連接過(guò)渡區(qū)域的兩個(gè)相鄰階段的后驗(yàn)概率作為自適應(yīng)權(quán)重, 進(jìn)一步預(yù)測(cè)過(guò)渡區(qū)域的樣本。
[0011] 本發(fā)明的有益效果是:本發(fā)明引入新的不相似度函數(shù),建立模糊高斯混合模型,用 多個(gè)模糊高斯成分近似刻畫間歇過(guò)程的多階段特性,獲得間歇過(guò)程的各個(gè)模糊高斯成分參 數(shù),形成多個(gè)高斯成分區(qū)域。然后,計(jì)算待預(yù)測(cè)樣本屬于各高斯成分的模糊隸屬度,識(shí)別出 相應(yīng)的高斯成分;同時(shí),統(tǒng)計(jì)出測(cè)量數(shù)據(jù)在相鄰兩個(gè)階段的后驗(yàn)概率,作為自適應(yīng)權(quán)重,用 于過(guò)渡區(qū)域的質(zhì)量預(yù)測(cè)。根據(jù)識(shí)別出的高斯成分建立局部偏最小二乘回歸模型。與傳統(tǒng)硬 劃分的模型相比,本發(fā)明不僅有效的提取間歇過(guò)程的多階段特性,而且較好地抓取了相鄰 階段過(guò)渡區(qū)域的動(dòng)態(tài)變化,建立較為合理、準(zhǔn)確的模型,提高了模型的預(yù)測(cè)精度。
【專利附圖】
【附圖說(shuō)明】
[0012] 圖1是青霉素發(fā)酵過(guò)程示意圖;
[0013] 圖2是本發(fā)明方法的算法流程圖;
[0014] 圖3是傳統(tǒng)基于k均值聚類的偏最小二乘回歸方法對(duì)青霉素濃度輸出預(yù)測(cè)效果 圖;
[0015] 圖4是本發(fā)明方法對(duì)青霉素濃度輸出預(yù)測(cè)效果圖。
【具體實(shí)施方式】
[0016] 下面結(jié)合附圖和實(shí)施案例對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。本發(fā)明引入新的不相似度函 數(shù),建立模糊高斯混合模型,用多個(gè)模糊高斯成分近似刻畫間歇過(guò)程的多階段特性,獲得間 歇過(guò)程的各個(gè)模糊高斯成分參數(shù),形成多個(gè)高斯成分區(qū)域。然后,計(jì)算待預(yù)測(cè)樣本屬于各高 斯成分的模糊隸屬度,識(shí)別出相應(yīng)的高斯成分;同時(shí),統(tǒng)計(jì)出測(cè)量數(shù)據(jù)在相鄰兩個(gè)階段的后 驗(yàn)概率,作為自適應(yīng)權(quán)重,用于過(guò)渡區(qū)域的質(zhì)量預(yù)測(cè)。根據(jù)識(shí)別出的高斯成分建立局部PLS 模型。本發(fā)明不僅有效的處理間歇過(guò)程的多階段特性,而且較好地抓取了相鄰階段過(guò)渡區(qū) 域的動(dòng)態(tài)性,提高了模型的預(yù)測(cè)精度。
[0017] 本發(fā)明解決技術(shù)問(wèn)題所采取的技術(shù)方案是:
[0018] 參考圖2, 一種基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,包括以下步 驟:
[0019] S1、數(shù)據(jù)預(yù)處理:選擇間歇過(guò)程多階段運(yùn)行的數(shù)據(jù)1 (其中I是批次數(shù),J 是測(cè)量變量數(shù),K是采樣點(diǎn)數(shù)),組成訓(xùn)練樣本集。將三維矩陣尤按照變量方向展開(kāi)成二維 矩陣Zegihx75X可表不為:Ι=[χ?=υ ... AU7。對(duì)應(yīng)的輸出質(zhì)量變量以同樣的方式表 示成:
[0020] S2、建立高斯混合模型:利用訓(xùn)練樣本訓(xùn)練高斯混合模型,通過(guò)EM算法迭代計(jì)算 模型參數(shù)? = (α,μ, Σ),其中α為混合系數(shù),μ、Σ為高斯成分的均值及協(xié)方差;
[0021] S3、建立模糊高斯混合模型:定義新的不相似度函數(shù),最小化模糊C均值算法 (FCM)的目標(biāo)函數(shù),得到新的聚類中心及樣本的模糊隸屬度,不斷更新模型,決策出最佳的 聚類數(shù)目對(duì)應(yīng)不同的操作階段;
[0022] S4、鑒別出過(guò)渡區(qū)域:預(yù)設(shè)統(tǒng)計(jì)顯著性水平作為閾值,如果測(cè)量樣本的最大模糊隸 屬度大于閾值,說(shuō)明該樣本可劃分到獨(dú)立的操作階段;如果測(cè)量樣本的最大模糊隸屬度小 于閾值,表明其位于兩個(gè)相鄰階段之間的過(guò)渡區(qū)域;進(jìn)一步判斷出連接過(guò)渡區(qū)域的兩個(gè)相 鄰階段;
[0023] S5、建立多個(gè)局部預(yù)測(cè)模型:利用劃分到多個(gè)局部階段的測(cè)量子集建立多個(gè)局部 PLS模型,同時(shí),將連接過(guò)渡區(qū)域的兩個(gè)相鄰階段的后驗(yàn)概率作為自適應(yīng)權(quán)重,進(jìn)一步預(yù)測(cè) 過(guò)渡區(qū)域的樣本。
[0024] 步驟S2中,"建立高斯混合模型"的具體步驟如下:
[0025] S21 :假設(shè)間歇過(guò)程具有Q個(gè)不同的階段,每個(gè)階段表示為Cq(q=l,2,…,Q),Nq代 表每個(gè)階段內(nèi)的樣本數(shù)給定展開(kāi)的訓(xùn)練集,第i批次第k個(gè)樣本X (i,k)的后驗(yàn)概率為:
【權(quán)利要求】
1. 一種基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,其特征在于,包括以下 步驟: 51、 數(shù)據(jù)預(yù)處理:選擇間歇過(guò)程多階段運(yùn)行的數(shù)據(jù)^組成訓(xùn)練樣本集,其中I是批次數(shù),J是測(cè)量變量數(shù),K是采樣點(diǎn)數(shù);將三維矩陣f按照變量方向展開(kāi)成二維矩陣 作X可表示為:^=[4=υXfU...f;對(duì)應(yīng)的輸出質(zhì)量變量也按照變量方向展 開(kāi)成:r=[y(【=i)Γ(Ι=2)…7(!=幻]Γ; 52、 建立高斯混合模型:利用訓(xùn)練樣本訓(xùn)練高斯混合模型,通過(guò)期望最大化算法迭代計(jì) 算模型參數(shù)Θ= (α,μ,Σ),其中α為混合系數(shù),μ、Σ為高斯成分的均值及協(xié)方差; 53、 建立模糊高斯混合模型:引入新的不相似度函數(shù),最小化模糊C均值算法的目標(biāo)函 數(shù),多次迭代更新模型參數(shù),得到新的聚類中心及樣本的模糊隸屬度,決策出最佳的聚類數(shù) 目對(duì)應(yīng)不同的操作階段; 54、 鑒別出過(guò)渡區(qū)域:預(yù)設(shè)統(tǒng)計(jì)顯著性水平作為閾值,如果測(cè)量樣本的最大模糊隸屬度 大于閾值,表明該樣本可劃分到獨(dú)立的操作階段;如果測(cè)量樣本的最大模糊隸屬度小于閾 值,表明該樣本位于兩個(gè)相鄰階段之間的過(guò)渡區(qū)域;進(jìn)一步判斷出連接過(guò)渡區(qū)域的兩個(gè)相 鄰階段; 55、 建立多個(gè)局部預(yù)測(cè)模型:利用劃分到多個(gè)局部階段的測(cè)量子集建立多個(gè)局部PLS 模型,同時(shí),將連接過(guò)渡區(qū)域的兩個(gè)相鄰階段的后驗(yàn)概率作為自適應(yīng)權(quán)重,進(jìn)一步預(yù)測(cè)過(guò)渡 區(qū)域的樣本。
2. 根據(jù)權(quán)利要求1所述基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,其特征 在于,所述步驟S2具體為: 521 :假設(shè)間歇過(guò)程具有Q個(gè)不同的階段,每個(gè)階段表示為Cq(q= 1,2,…,Q),Nq代表 每個(gè)階段內(nèi)的樣本數(shù)給定展開(kāi)的訓(xùn)練集,第i批次第k個(gè)樣本X(i,k)的后驗(yàn)概率為:
式中,q為高斯成分對(duì)應(yīng)第q階段,為模型的混合系數(shù),Θq=(μq,Σ(?)為模型參 數(shù)包括均值和協(xié)方差,P(X(i,k)IΘ。)
為第q高斯成分的概率密度函數(shù),表示為: 522 :高斯混合模型的目標(biāo)函數(shù)定義為log似然函數(shù):
523 :最大化似然函數(shù),利用期望最大化算法估計(jì)參數(shù),當(dāng)前參數(shù)為Θω,更新模型參數(shù) 0 (t+ι):
3.根據(jù)權(quán)利要求1所述基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,其特征 在于,所述步驟S3具體為: 531 :新的不相似度函數(shù)定義為:
532 :基于上式的不相似度函數(shù),構(gòu)造模糊C均值模型的目標(biāo)函數(shù)為:
式中,m為權(quán)里指數(shù),U= {u^aiOhu^ak)是測(cè)量值x(i,k)對(duì)第q個(gè)聚類的模糊隸 屬度,且 0 彡uq(i,k)彡 1,ΣΙ?,Ο= 1; 533 :最小化FCM的目標(biāo)函數(shù),隸屬度和聚類中心更新為:
更新后的模型混合系數(shù)及協(xié)方差分別表示為:
執(zhí)行EM算法,不斷迭代直至獲得模型的最優(yōu)解,識(shí)別出不同的過(guò)程操作階段,輸入、輸 出數(shù)據(jù)分別產(chǎn)生Q個(gè)子集為:
S34 :根據(jù)模糊隸屬度,識(shí)別測(cè)試樣本所屬的局部操作階段,根據(jù)其最大隸屬度,劃分到 第qt個(gè)操作階段: Cjt = argmaxUj(IJi)〇 1華β'
4. 根據(jù)權(quán)利要求1所述基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,其特征 在于,所述步驟S4具體為: S41:預(yù)設(shè)統(tǒng)計(jì)顯著度水平δ,假如隸屬度滿足Uq(i,k)多δ,則將該樣本劃分到獨(dú)立 的單個(gè)階段中;假如uq(i,k)〈δ,則將該樣本劃分相鄰兩個(gè)階段的過(guò)渡區(qū)域qt:
式中,qt {1}、qt⑵連接過(guò)渡區(qū)域的第1和第2個(gè)階段,分別對(duì)應(yīng):
5. 根據(jù)權(quán)利要求1所述基于模糊高斯混合模型的多階段間歇過(guò)程軟測(cè)量方法,其特征 在于,所述步驟S5具體為: 551 :根據(jù)輸入輸出數(shù)據(jù)集{X,Y},建立偏最小二乘回歸模型: X=ATR+E Y=ATB+F 式中,A為得分矩陣,R、B為負(fù)載矩陣,E、F分別為輸入、輸出殘差; 552 :對(duì)于預(yù)處理后的待預(yù)測(cè)的數(shù)據(jù)Xm,假如劃分到第q個(gè)局部階段,則輸出為:
式中,W為權(quán)值矩陣; 553 :假如該測(cè)試樣本劃分到過(guò)渡區(qū)域,對(duì)應(yīng)為相鄰兩個(gè)階段C1Q= 1或2)之間,預(yù)測(cè) 值的局部后驗(yàn)概率表示為:
式中,戶(仏|?)為高斯密度概率,p(C1)為局部模型C1的系數(shù),正則化后的后驗(yàn)概率為 作為局部模型的自適應(yīng)權(quán)重; 554 :過(guò)渡區(qū)域的樣本對(duì)應(yīng)的預(yù)測(cè)估計(jì)表示為:
【文檔編號(hào)】G06F19/00GK104462850SQ201410822983
【公開(kāi)日】2015年3月25日 申請(qǐng)日期:2014年12月25日 優(yōu)先權(quán)日:2014年12月25日
【發(fā)明者】盧春紅, 顧曉峰 申請(qǐng)人:江南大學(xué)