基于改進(jìn)核熵成分分析的非線性故障檢測方法及應(yīng)用
【專利摘要】本發(fā)明公開了一種基于改進(jìn)核熵成分分析的非線性故障檢測方法及其應(yīng)用。該方法通過利用核熵成分分析方結(jié)合集成學(xué)習(xí)及貝葉斯推論實(shí)現(xiàn)對工業(yè)生成過程進(jìn)行監(jiān)測,判斷生產(chǎn)過程是否有故障發(fā)生。本發(fā)明針對實(shí)際生產(chǎn)過程中數(shù)據(jù)的非線性問題,采用核熵成分分析利用信息熵的特點(diǎn)有效避免考慮數(shù)據(jù)的實(shí)際分布情況(高斯分布、非高斯分布等),并通過集成學(xué)習(xí)引入多個模型從而避免了核熵成分分析中核函數(shù)參數(shù)盲目選取的問題。有效地提高了工業(yè)生成過程當(dāng)中故障的檢測效果。
【專利說明】
基于改進(jìn)核熵成分分析的非線性故障檢測方法及應(yīng)用
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于工業(yè)生產(chǎn)過程檢測,為故障檢測方法,特別涉及一種基于改進(jìn)核熵成 分分析的非線性故障檢測方法。
【背景技術(shù)】
[0002] 隨著生產(chǎn)規(guī)模的不斷擴(kuò)大,現(xiàn)代工業(yè)更加的注重生產(chǎn)過程的安全性,故障診斷被 用來監(jiān)測生產(chǎn)過程,它能夠檢測出生產(chǎn)過程的非正常工況并由此判定出其產(chǎn)生的根源。因 此,作為故障診斷方法的多變量統(tǒng)計過程監(jiān)測被大量的研究。
[0003] 主成分分析(PCA)是一種典型的多變量統(tǒng)計過程監(jiān)測方法,該方法被大量地應(yīng)用 于模式識別、圖像處理以及過程監(jiān)測。該方法通過提取過程主要成分來達(dá)到降維的目的,這 些主要成分通過方差的大小來反映。主成分分析方法能夠有效地應(yīng)用于具有高維、高相關(guān) 性等特征的過程當(dāng)中。但是這種方法也存在很明顯的不足,它是一種線性的方法,這就使得 該方法在處理非線性過程時候效果變得很差。
[0004] 為了克服主成分分析方法在處理非線性狀況時候的效果急劇惡化的情況,在過去 的幾十年當(dāng)中許多人都做了很多探索以及改進(jìn),其中,核主成分分析(KPCA)是一種最具影 響力的方法。在核主成分分析當(dāng)中,通過將原始的數(shù)據(jù)投影到一個高維或者無限維的空間 當(dāng)中,從而實(shí)現(xiàn)了將數(shù)據(jù)由非線性到線性化的映射。為了更好地將這種方法應(yīng)用于過程監(jiān) 測當(dāng)中來,Lee等人提出了平方預(yù)測誤差(SPE)的計算方法,由此,T~2和SPE兩個統(tǒng)計指標(biāo)被 用到KPCA當(dāng)中來檢測過程。然而,這兩個統(tǒng)計指標(biāo)的置信限計算方法都是假設(shè)輸入數(shù)據(jù)服 從高斯分布,但是考慮到過程的非線性這種假設(shè)在實(shí)際的生產(chǎn)過程當(dāng)中并不能很好地被滿 足。Ge等人將統(tǒng)計局部方法引入KPCA中,利用統(tǒng)計局部方法通過假設(shè)檢驗(yàn)重新構(gòu)造了兩個 檢測指標(biāo),新構(gòu)造的檢測指標(biāo)能夠$父好的滿足尚斯分布,從而使得故障的檢測率提尚。 Samuel等則是利用核密度估計(KDE)的方法計算監(jiān)測指標(biāo)的控制限,這也在一定程度上改 善了監(jiān)測質(zhì)量,然而,這也是建立在一定的假設(shè)基礎(chǔ)上的。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在針對現(xiàn)有技術(shù)的不足,提供一種基于改進(jìn)核熵成分分析的非線性 故障檢測方法及應(yīng)用,通過利用核熵成分分析方結(jié)合集成學(xué)習(xí)及貝葉斯推論實(shí)現(xiàn)對工業(yè)生 成過程進(jìn)行監(jiān)測,判斷生產(chǎn)過程是否有故障發(fā)生。本發(fā)明針對實(shí)際生產(chǎn)過程中數(shù)據(jù)的非線 性問題,采用核熵成分分析利用信息熵的特點(diǎn)有效避免考慮數(shù)據(jù)的實(shí)際分布情況(高斯分 布、非高斯分布等),并通過集成學(xué)習(xí)引入多個模型從而避免了核熵成分分析中核函數(shù)參數(shù) 盲目選取的問題。有效地提高了工業(yè)生成過程當(dāng)中故障的檢測效果。
[0006] -種基于改進(jìn)核熵成分分析的非線性故障檢測方法,該方法的步驟如下:
[0007] 步驟一:離線建立模型,利用正常工況下的數(shù)據(jù)通過核熵成分析方法建立不同核 參數(shù)的離線模型,其具體過程又分為:
[0008] 1)采集工業(yè)生產(chǎn)過程中的數(shù)據(jù),對相關(guān)變量進(jìn)行預(yù)處理,對樣本數(shù)據(jù)的歸一化,采 集到的數(shù)據(jù)可以表述為父=[11,^,一,幼]¥0'其中111表示過程變量的個數(shù)4表示樣本數(shù) 目,XleR'i = l,~,N對應(yīng)于第i個樣本,然后將數(shù)據(jù)去量綱,處理為0均值,方差為1的數(shù)據(jù); 對樣本數(shù)據(jù)的歸一化方法為:Χ,= (Xi-minxi)/(maxxi-minxi),其中Xi和xj分別表示歸一化 前后的值,maxxi和minxi分別表示樣本數(shù)據(jù)中的最大和最小值;
[0009] 2)利用正常工況下的數(shù)據(jù)經(jīng)預(yù)處理后通過核熵成分析方法建立不同核參數(shù)的離 線模型;熵估計可以表示為:
[0011]其中,1?)表示熵估計,K為核矩陣,1為元素均為1的列向量,k(Xl,x)為核函數(shù),本 發(fā)明采用高斯核函數(shù),其定義如下:
[0013]對核矩陣進(jìn)行特征分解,此時,熵估計表示為:
[0015] 其中λ表示分解后的特征值,e表示對應(yīng)的特征向量,那么,熵最大的值對應(yīng)的特征 向量即為其投影向量,投影后的非線性部分可以表示為:
[0016] T=KE;
[0017] 其中T為投影后的非線性部分,E為投影矩陣;
[0018] 3)確定每一個子模型對應(yīng)的控制限。
[0019] 步驟二:在線檢測,將在線數(shù)據(jù)利用離線建立的模型投影到各個模型熵最大的核 方向上;接著再利用貝葉斯推論將這些模型轉(zhuǎn)化為概率形式;最后利用集成學(xué)習(xí)將這些概 率形式的多個模型組合起來利用步驟一將實(shí)際生產(chǎn)過程的數(shù)據(jù)進(jìn)行檢測,判斷是否有故障 發(fā)生。其具體過程為:
[0020] 1)采用與離線建模階段相同的數(shù)據(jù)預(yù)處理方法將要進(jìn)行在線檢測的數(shù)據(jù)處理為0 均值,方差為1的數(shù)據(jù),歸一化方法為:Χ^= (Xi-minxi)/(maxxi-minxi),其中Xi和xZ分別表 示歸一化前后的值,maxxi和minxi分別表示樣本數(shù)據(jù)中的最大和最小值;
[0021] 2)將在線數(shù)據(jù)利用離線建立的模型投影到各個模型熵最大的核方向上,其中第i 個模型的投影可以表示為:
[0022] T(i)=K(i)E(i)
[0023] 分別對不同的模型進(jìn)行投影,分別提取各個模型的主成分部分;
[0024] 3)在利用核熵成分分析方法的模型將在線數(shù)據(jù)進(jìn)行投影之后,利用貝葉斯推論將 得到的投影部分轉(zhuǎn)化為概率的形式,其形式如下所示:
[0027]而分母中的概率可以由下面的兩個式子計算:
[0030] 其中N、F分別表示正常工況和故障工況,p(N)、p(F)則表示它們對應(yīng)的概率值,可 以由所給定的置信水平來計算,其它的概率形式可以根據(jù)其控制限與其實(shí)際值的比值的指 數(shù)形式來計算。
[0031] 4)利用集成學(xué)習(xí)通過權(quán)重將這些概率形式的多個模型組合起來,集成后統(tǒng)計指標(biāo) 如下所示:
[0034] 5)根據(jù)4)所計算的統(tǒng)計指標(biāo)與置信水平作比較判斷是否有故障發(fā)生,若統(tǒng)計指標(biāo) 大于置信水平則表示有故障發(fā)生,否則,則判斷為工況正常,沒有檢測到故障。
[0035]本發(fā)明的有益效果:
[0036]本發(fā)明公開了一種基于改進(jìn)核熵成分分析的故障檢測方法及其應(yīng)用。本發(fā)明針對 實(shí)際生產(chǎn)過程中數(shù)據(jù)的非線性問題,采用核熵成分分析利用信息熵的特點(diǎn)有效避免考慮數(shù) 據(jù)的實(shí)際分布情況(高斯分布、非高斯分布等),并通過集成學(xué)習(xí)引入多個模型從而避免了 核熵成分分析中核函數(shù)參數(shù)盲目選取的問題。針對工業(yè)過程的實(shí)際驗(yàn)證發(fā)現(xiàn)該方法具有較 好的故障檢測率,有效地提高了工業(yè)生成過程當(dāng)中故障的檢測效果。
【附圖說明】
[0037]圖1是本發(fā)明方法的一種流程圖。
【具體實(shí)施方式】
[0038]本發(fā)明針對工業(yè)生產(chǎn)過程數(shù)據(jù)的非線性問題,將核熵成分分析算法應(yīng)用于故障檢 測過程,建立基于核熵成分分析的離線模型。并引入集成學(xué)習(xí)和貝葉斯推論,有效避免了核 函數(shù)參數(shù)選擇的盲目性,同時使得該方法能夠適用于不同類型的故障診斷。該發(fā)明的流程 圖見圖1。
[0039]步驟一:離線建立模型,利用正常工況下的數(shù)據(jù)通過核熵成分析方法建立不同核 參數(shù)的離線模型。
[0040] 1)采集工業(yè)生產(chǎn)過程中的數(shù)據(jù),對相關(guān)變量進(jìn)行預(yù)處理,對樣本數(shù)據(jù)的歸一化,采 集到的數(shù)據(jù)可以表述為父=[11,^,一,幼]¥0'其中111表示過程變量的個數(shù)4表示樣本數(shù) 目,XleR'i = l,~,N對應(yīng)于第i個樣本,然后將數(shù)據(jù)去量綱,處理為0均值,方差為1的數(shù)據(jù); 對樣本數(shù)據(jù)的歸一化方法為:Χ,= (Xi-minxi)/(maxxi-minxi),其中Xi和xj分別表示歸一化 前后的值,maxxi和minxi分別表示樣本數(shù)據(jù)中的最大和最小值;
[0041] 2)利用正常工況下的數(shù)據(jù)經(jīng)預(yù)處理后通過核熵成分析方法建立不同核參數(shù)的離 線模型;熵估計可以表示為:
[0043]其中,泛㈦表示熵估計,K為核矩陣,1為元素均為1的列向量,k(Xl,x)為核函數(shù),本 發(fā)明采用高斯核函數(shù),其定義如下:
[0045]對核矩陣進(jìn)行特征分解,此時,熵估計表示為:
[0047] 其中λ表示分解后的特征值,e表示對應(yīng)的特征向量,那么,熵最大的值對應(yīng)的特征 向量即為其投影向量,投影后的非線性部分可以表示為:
[0048] T=KE;
[0049] 其中T為投影后的非線性部分,E為投影矩陣;
[0050] 3)確定每一個子模型對應(yīng)的控制限。
[0051] 步驟二:在線檢測,將在線數(shù)據(jù)利用離線建立的模型投影到各個模型熵最大的核 方向上;接著再利用貝葉斯推論將這些模型轉(zhuǎn)化為概率形式;最后利用集成學(xué)習(xí)將這些概 率形式的多個模型組合起來利用步驟一將實(shí)際生產(chǎn)過程的數(shù)據(jù)進(jìn)行檢測,判斷是否有故障 發(fā)生。其具體過程為:
[0052] 1)采用與離線建模階段相同的數(shù)據(jù)預(yù)處理方法將要進(jìn)行在線檢測的數(shù)據(jù)處理為0 均值,方差為1的數(shù)據(jù),歸一化方法為:Χ^= (Xi-minxi)/(maxxi-minxi),其中Xi和xZ分別表 示歸一化前后的值,maxxi和minxi分別表示樣本數(shù)據(jù)中的最大和最小值;
[0053] 2)將在線數(shù)據(jù)利用離線建立的模型投影到各個模型熵最大的核方向上,其中第i 個模型的投影可以表示為:
[0054] T(i)=K(i)E(i)
[0055] 分別對不同的模型進(jìn)行投影,分別提取各個模型的主成分部分;
[0056] 3)在利用核熵成分分析方法的模型將在線數(shù)據(jù)進(jìn)行投影之后,利用貝葉斯推論將 得到的投影部分轉(zhuǎn)化為概率的形式,其形式如下所示:
[0059]而分母中的概率可以由下面的兩個式子計算:
[0062] 其中N、F分別表示正常工況和故障工況,p(N)、p(F)則表示它們對應(yīng)的概率值,可 以由所給定的置信水平來計算,其它的概率形式可以根據(jù)其控制限與其實(shí)際值的比值的指 數(shù)形式來計算。
[0063] 4)利用集成學(xué)習(xí)通過權(quán)重將這些概率形式的多個模型組合起來,集成后統(tǒng)計指標(biāo) 如下所示:
[0066] 5)根據(jù)4)所計算的統(tǒng)計指標(biāo)與置信水平作比較判斷是否有故障發(fā)生,若統(tǒng)計指標(biāo) 大于置信水平則表示有故障發(fā)生,否則,則判斷為工況正常,沒有檢測到故障。
[0067] 實(shí)施例
[0068]我國是資源和能源短缺型國家,造紙工業(yè)對進(jìn)口纖維原料的依存度高達(dá)40 %以 上。對于化學(xué)機(jī)械制漿而言,打漿過程是纖維形成的主要工藝過程。打漿磨漿機(jī)是一個密閉 的反映環(huán)境,其內(nèi)部經(jīng)過一系列復(fù)雜的物理化學(xué)過程實(shí)現(xiàn)打漿。打漿過程所產(chǎn)生的數(shù)據(jù)具 有非線性等特點(diǎn)?;诖耍景l(fā)明所提出的故障檢測方法對打漿過程故障的診斷具有適應(yīng) 性。下面結(jié)合金東紙業(yè)(江蘇)股份有限公司(簡稱金東紙業(yè))來說明該發(fā)明的有效性。
[0069] 接下來結(jié)合該具體過程對本發(fā)明的實(shí)施步驟進(jìn)行詳細(xì)的闡述:
[0070] 步驟一:離線建立模型,利用正常工況下的數(shù)據(jù)通過核熵成分析方法建立不同核 參數(shù)的離線模型。
[0071] 1)采集造紙生成過程中的數(shù)據(jù)影響纖維形態(tài)分布的過程數(shù)據(jù),這些數(shù)據(jù)包括進(jìn)漿 濃度、出漿游離度、磨機(jī)功率、稀釋水量、模式壓力等59個變量。對這項(xiàng)相關(guān)變量進(jìn)行預(yù)處 理,對樣本數(shù)據(jù)的歸一化,采集到的數(shù)據(jù)可以表述為Χ=[ Χ1,Χ2,···,ΧΝ]τεΚΝΧη$ψπ^*# 程變量的個數(shù),Ν表示樣本數(shù)目,xi e Rm,i = 1,…,Ν對應(yīng)于第i個樣本,然后將數(shù)據(jù)去量綱,處 理為〇均值,方差為1的數(shù)據(jù)。歸一化方法為:χ^= (xi-minxi)/(maxxi_minxi),其中xi和χΖ分 別表不歸一化前后的值,maxxi和minxi分別表不樣本數(shù)據(jù)中的最大和最小值;
[0072] 2)取一段打漿過程正常生產(chǎn)工況下的數(shù)據(jù)經(jīng)預(yù)處理后通過核熵成分析方法建立 不同核參數(shù)的離線模型;熵估計可以表示為
[0074]其中,穴⑷表示熵估計,K為核矩陣,1為元素均為1的列向量,k(Xl,x)為核函數(shù),本 發(fā)明采用高斯核函數(shù),其定義如下:
[0076]對核矩陣進(jìn)行特征分解,此時,熵估計表示為:
[0078] 其中λ表示分解后的特征值,e表示對應(yīng)的特征向量,那么,熵最大的值對應(yīng)的特征 向量即為其投影向量,投影后的非線性部分可以表示為:
[0079] T=KE;
[0080] 其中T為投影后的非線性部分,E為投影矩陣;
[0081] 3)確定每一個子模型對應(yīng)的控制限。
[0082] 步驟二:在線檢測,將打漿過程的在線數(shù)據(jù)利用離線建立的模型投影到各個模型 熵最大的核方向上;接著再利用貝葉斯推論將這些模型轉(zhuǎn)化為概率形式;最后利用集成學(xué) 習(xí)將這些概率形式的多個模型組合起來利用步驟一將實(shí)際生產(chǎn)過程的數(shù)據(jù)進(jìn)行檢測,判斷 是否有故障發(fā)生。具體實(shí)施過程為:
[0083] 1)采用與離線建模階段相同的數(shù)據(jù)預(yù)處理方法將要進(jìn)行在線檢測的數(shù)據(jù)處理為0 均值,方差為1的數(shù)據(jù)。歸一化方法為:Χ^= (Xi-minxi)/(maxxi-minxi),其中Xi和xZ分別表 示歸一化前后的值,maxxi和minxi分別表示樣本數(shù)據(jù)中的最大和最小值;
[0084] 2)將在線數(shù)據(jù)利用離線建立的模型投影到各個模型熵最大的核方向上:其中第i 個模型的投影可以表示為:
[0085] T(i)=K(i)E(i)
[0086] 分別對不同的模型進(jìn)行投影,分別提取各個模型的主成分部分。
[0087] 3)在利用核熵成分分析方法的模型將在線數(shù)據(jù)進(jìn)行投影之后,利用貝葉斯推論將 得到的投影部分轉(zhuǎn)化為概率的形式,其形式如下所示:
[0090] 而分母中的概率可以由下面的兩個式子計算:
[0093] 其中N、F分別表示正常工況和故障工況,p(N)、p(F)則表示它們對應(yīng)的概率值,可 以由所給定的置信水平來計算,其他的概率形式可以根據(jù)其控制限與其實(shí)際值的比值的指 數(shù)形式來計算。
[0094] 4)利用集成學(xué)習(xí)通過權(quán)重將這些概率形式的多個模型組合起來,集成后統(tǒng)計指標(biāo) 如下所示:
[0097] 5)根據(jù)4)所計算的統(tǒng)計指標(biāo)與置信水平作比較判斷是否有故障發(fā)生,若統(tǒng)計指標(biāo) 大于置信水平則表示有故障發(fā)生,否則,則判斷為工況正常,沒有檢測到故障。
[0098] 上述實(shí)施例用來解釋說明本發(fā)明的有效性,本發(fā)明的使用并不僅僅局限在上述用 例的情況下,在本發(fā)明的精神和權(quán)利要求的保護(hù)范圍內(nèi),對本發(fā)明做出的任何修改和改變, 都落入本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 一種基于改進(jìn)核賭成分分析的非線性故障檢測方法,其特征在于,包括W下的步驟: 步驟一:離線建立模型,利用正常工況下的數(shù)據(jù)通過核賭成分析方法建立不同核參數(shù) 的離線模型。 步驟二:在線檢測,將在線數(shù)據(jù)利用離線模型投影到各個模型Renyi賭最大的核方向 上;接著再利用貝葉斯推論轉(zhuǎn)化為概率形式;最后利用集成學(xué)習(xí)將運(yùn)些概率形式的多個模 型組合起來利用步驟一對實(shí)際生產(chǎn)過程的數(shù)據(jù)進(jìn)行檢測,判斷是否有故障發(fā)生。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟一所述的離線建模過程為: 1) 采集工業(yè)生產(chǎn)過程中的數(shù)據(jù),對相關(guān)變量進(jìn)行預(yù)處理,對樣本數(shù)據(jù)的歸一化,采集到 的數(shù)據(jù)可W表述為X=[χl,χ2,…,χN]TeRW><m,其中m表示過程變量的個數(shù),N表示樣本數(shù)目, xier,i = i,…,N對應(yīng)于第i個樣本,然后將數(shù)據(jù)去量綱,處理為0均值,方差為1的數(shù)據(jù);對 樣本數(shù)據(jù)的歸一化方法為:xi*=(xi-min xi)/(max X廣min xi),其中xi和xi*分別表示歸一 化前后的值,max XI和min XI分別表示樣本數(shù)據(jù)中的最大和最小值; 2) 利用正常工況下的數(shù)據(jù)經(jīng)預(yù)處理后通過核賭成分析方法建立不同核參數(shù)的離線模 型;賭估計可W表示為:其中,巧切表示賭估計,K為核矩陣,1為元素均為1的列向量,k(Xi,X)為核函數(shù),采用高 斯核函數(shù),其定義如下:對核矩陣進(jìn)行特征分解,此時,賭估計表示為:其中λ表示分解后的特征值,e表示對應(yīng)的特征向量,那么,賭最大的值對應(yīng)的特征向量 即為其投影向量,投影后的非線性部分表示為: Τ =??; 其中Τ為投影后的非線性部分,Ε為投影矩陣; 3) 確定每一個子模型對應(yīng)的控制限。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟二所述的在線檢測過程如下: 1) 采用與離線建模階段相同的數(shù)據(jù)預(yù)處理方法將要進(jìn)行在線檢測的數(shù)據(jù)處理為0均 值,方差為1的數(shù)據(jù),歸一化方法為:xi*=(xi-min xi)/(max xi-min xi),其中xi和xi*分別表 示歸一化前后的值,max xi和min xi分別表示樣本數(shù)據(jù)中的最大和最小值; 2) 將在線數(shù)據(jù)利用離線建立的模型投影到各個模型賭最大的核方向上,其中第i個模 型的投影可W表示為:分別對不同的模型進(jìn)行投影,分別提取各個模型的主成分部分; 3) 在利用核賭成分分析方法的模型將在線數(shù)據(jù)進(jìn)行投影之后,利用貝葉斯推論將得到 的投影部分轉(zhuǎn)化為概率的形式,其形式如下所示:其中N、F分別表示正常工況和故障工況,p(N)、p(F)則表示它們對應(yīng)的概率值,可W由 所給定的置信水平來計算,其它的概率形式可W根據(jù)其控制限與其實(shí)際值的比值的指數(shù)形 式來計算; 4) 利用集成學(xué)習(xí)通過權(quán)重將運(yùn)些概率形式的多個模型組合起來,集成后統(tǒng)計指標(biāo)如下 所5) 根據(jù)4)所計算的統(tǒng)計指標(biāo)與置信水平作比較判斷是否有故障發(fā)生,若統(tǒng)計指標(biāo)大于 置信水平則表示有故障發(fā)生,否則,則判斷為工況正常,沒有檢測到故障。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,工業(yè)生產(chǎn)過程的數(shù)據(jù)具有非線性特點(diǎn)。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的工業(yè)故障為磨漿機(jī)打漿過程故障。6. -種根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法用于磨漿機(jī)打漿過程故障診斷。
【文檔編號】G05B19/418GK106094749SQ201610435033
【公開日】2016年11月9日
【申請日】2016年6月17日
【發(fā)明人】秦家祥, 楊春節(jié), 劉文輝, 孫夢園
【申請人】浙江大學(xué)