專利名稱:用于機器狀態(tài)監(jiān)測的、使用規(guī)則生成的樣本的監(jiān)督故障學習的制作方法
技術領域:
本發(fā)明總體涉及機器狀態(tài)監(jiān)測領域,具體涉及基于來自多個監(jiān)測傳感器的傳感器數(shù)據(jù)早期機器問題檢測。
背景技術:
機器狀態(tài)監(jiān)測的目標是在早期檢測機器故障,以便可以及時進行維修。執(zhí)行機器維修有幾種在用的策略。按照稱為修復性維修的第一策略,僅在機器故障時執(zhí)行維修。按照稱為預防性維修的第二策略,按預定計劃執(zhí)行維修。這兩種策略都容易實現(xiàn),但并未提供最佳效率。本發(fā)明集中于第三策略,稱為預見性維修或基于狀態(tài)的維修。根據(jù)這種策略,只在需要時執(zhí)行維修。預見性維修提供了最高經(jīng)濟效率,但也提出了最大的挑戰(zhàn)如何查明機器是否正常工作或異常工作(即處于故障狀態(tài)或需要維修狀態(tài))。另一挑戰(zhàn)是在故障的情況下,必須確定該故障的起因,以便可以采用對應的局部維修?;旧嫌袃煞N辦法應對執(zhí)行預見性維修所必需的故障診斷任務。首先,基于規(guī)則的技術也許是最廣泛使用的狀態(tài)監(jiān)測方法。例如,在G. Schreiber,H. Akkermans, A.Anjewierden, R. de Hoog, N. Shadbolt, W. V. De Velde 禾口 B.Wielinga 的"Knowledge Engineering and Management The Common KADS Methodology,,187-214 (MIT Press 2000);以及 Μ. Todd, Stephen D. J. McArthur, James R. McDonald 禾口 S.J.Shaw 的"A Semiautomatic Approach to Deriving Turbine Generator Diagnostic Knowledge,"IEEE Trans. On Systems, Man, and Cybernetics, part C, vol. 37, no. 5at 979-992 (2007)中描述了基于規(guī)則的機器監(jiān)測系統(tǒng)。在基于規(guī)則的預見性維修中,使用一組規(guī)則來分析機器的特征或狀態(tài)。這些規(guī)則的通用格式是“如果有一種狀態(tài),就有一種故障類型?!币?guī)則典型由具有底層系統(tǒng)模型知識的人類專家導出。規(guī)則提供用戶關于經(jīng)由規(guī)則條件探索為何達到特定結論的透明性。然而,精確規(guī)則的設計是非常審慎并且相當費時的過程,對于具有多個傳感器以及故障類型的復雜系統(tǒng)而言尤為如此。根據(jù)示例,大部分商業(yè)上成功的一種狀態(tài)監(jiān)測規(guī)則
80 A / ^^.T&^ijJfR (L. Trave-Massuyes and R. Milne,"Gas-turbine condition monitoring using qualitative model-based diagnosis," IEEE Expert,vol. 12,no. 3at 22-31 (May/June 1997))。狀態(tài)監(jiān)測的第二種途徑是使用機器學習?;诒O(jiān)督模式識別的技術諸如神經(jīng)網(wǎng)絡近來在該領域受到很多關注(M. J. Embrechts,and S. Benedek,"Hybrid identification of nuclear power plant transients with artificial neural networks,,,IEEE Trans. On Industrial Electronics, vol. 51, no. 3at 686-693 (June2004))。機器學習模型是數(shù)據(jù)驅動的,它們從代表正常狀態(tài)以及每個故障類型的訓練數(shù)據(jù)中學習。這與基于知識的規(guī)則途徑形成對比。機器學習算法可以非??斓剡M行學習(例如,數(shù)分鐘內),非常精確,并且也容易在不同機器之間轉移。然而,廣泛使用機器學習的障礙在于通常難以獲得足夠大量的訓練數(shù)據(jù)集。獲得代表正常狀態(tài)的訓練數(shù)據(jù)通常是簡單直接的,因為機器在其大部分使用壽命期間典型地都是正常運轉。然而,獲得代表每個故障類型的訓練數(shù)據(jù)卻是復雜困難的,因為某些類型的故障也許只是罕見地出現(xiàn),即使考慮來自多臺類似機器的數(shù)據(jù)依然如此。對于結合監(jiān)督機器學習與基于規(guī)則的模型已經(jīng)做出了一些努力。例如,在Z.Wang, Y. Liu 禾口 P. J. Griffin 的"A combined ANN and expert system tool for transformer fault diagnosis,"IEEE Power Engineering Society Winter Meeting 1261-1269 (2000) 中,將來自神經(jīng)網(wǎng)絡的結果與規(guī)則庫結合。但并未對神經(jīng)網(wǎng)絡或規(guī)則庫任一方面嘗試進行改進。在 M. Todd, 乂印1^11 D. J. McArthur, James R. McDonald 禾Π S. J. Shaw 的 ‘‘A Semiautomatic Approach to Deriving Turbine Generator Diagnostic Knowledge,"IEEE Trans. On Systems, Man, and Cybernetics, Part C, vol. 37, no. 5at 979—992(2007)中,使用了機器學習來輔助設計規(guī)則。目前,需要克服上面描述的現(xiàn)有機器監(jiān)測解決方案僅能得到有限故障數(shù)據(jù)的限制。對于機器監(jiān)測解決方案進一步存在這樣的需求,結合來自基于規(guī)則的系統(tǒng)以及機器學習系統(tǒng)二者的優(yōu)點,同時克服這些系統(tǒng)最嚴肅的限制。
發(fā)明內容
本發(fā)明針對上述需求提供了一種方法,用于將測量特征向量分類為代表正常機器狀態(tài)和故障機器狀態(tài)之一,測量特征向量包括在特定時間與機器有關的一組特征狀態(tài)。接收一組手動定義的規(guī)則,每個規(guī)則建立了指示正常機器狀態(tài)和故障機器狀態(tài)之一的一組特征狀態(tài)范圍。在特征狀態(tài)范圍上使用概率分布對手動定義的規(guī)則進行抽樣,產(chǎn)生人工樣本特征向量集,每個人工樣本特征向量包括指示正常機器狀態(tài)和故障機器狀態(tài)之一的注記。通過給訓練集的每個實際特征向量指定注記,對實際特征向量訓練集進行注記, 注記指示正常機器狀態(tài)和故障狀態(tài)之一。使用包括實際特征向量訓練集和人工樣本特征向量集的增強訓練集,訓練監(jiān)督模式識別算法。然后,使用訓練后的監(jiān)督模式識別算法對測試特征向量進行分類。監(jiān)督模式識別算法可以是支持向量機算法。概率分布可以包括均勻概率分布,或者可以包括單邊高斯概率分布。該方法可以包括構造為基于規(guī)則的分層樹結構。至少一個特征狀態(tài)可以是根據(jù)狀態(tài)估計模型得到的殘值,或者,可以是從傳感器接收的觀測值。實際特征向量訓練集的注記可以包括對涉及特定時間間隔并具有相同機器狀態(tài)的多組特征向量同時進行注記。在本發(fā)明的另一種實施方式中,一種非短暫性計算機可用介質具有存儲于其上的用于由處理器執(zhí)行以執(zhí)行上面描述的方法的計算機可讀指令。另一種實施方式是一種機器監(jiān)測系統(tǒng),用于將測量特征向量分類為代表正常機器狀態(tài)和故障機器狀態(tài)之一。
圖1是根據(jù)本發(fā)明的計算機系統(tǒng)的示意圖。圖2是在可能得到大量數(shù)據(jù)的情況下訓練數(shù)據(jù)以及由SVM分類器所產(chǎn)生的結果決策邊界的圖。圖3是在只能得到少量故障訓練數(shù)據(jù)的情況下訓練數(shù)據(jù)以及由SVM分類器所產(chǎn)生的結果決策邊界的圖。圖4是根據(jù)一組理論規(guī)則的決策邊界圖。圖5是示出代表圖4中的一組理論規(guī)則的分層樹結構。圖6是在使用一組理論規(guī)則產(chǎn)生故障訓練數(shù)據(jù)的情況下訓練數(shù)據(jù)以及由SVM分類器所產(chǎn)生的結果決策邊界的圖。圖7是在故障訓練數(shù)據(jù)是使用一組理論規(guī)則產(chǎn)生的數(shù)據(jù)與測量數(shù)據(jù)結合的情況下訓練數(shù)據(jù)以及由SVM分類器所產(chǎn)生的結果決策邊界的圖。圖8是圖示根據(jù)本發(fā)明一種實施例的數(shù)據(jù)采集及分析系統(tǒng)的方塊圖。
具體實施例方式根據(jù)本發(fā)明示范的實施例的用于采集并處理機器監(jiān)測數(shù)據(jù)的機器監(jiān)測系統(tǒng)100 示于圖1中。在系統(tǒng)100中,計算機110執(zhí)行本發(fā)明方法連同其他任務的步驟。盡管示出的是單個計算機110,但本領域技術人員應當理解,本發(fā)明方法的步驟可以由通過網(wǎng)絡或總線鏈接的多個計算機執(zhí)行。計算機110接收來自多個傳感器165的數(shù)據(jù),這些傳感器165可以通過一個或多個數(shù)據(jù)源160(諸如數(shù)據(jù)記錄器)與計算機連接。傳感器165布置成同時采集數(shù)據(jù),從而建立代表給定時刻機器狀態(tài)的向量。原始傳感器數(shù)據(jù)可以進行處理或組合,并且連同時間戳或者其他時間標識或索引一起存儲在測量數(shù)據(jù)庫125中。計算機110可以是便攜式或膝上型計算機,或者大型計算機或其他計算機結構, 計算機110包括中央處理器(CPU) 125和存儲器180。計算機110與輸入裝置150以及輸出裝置155連接。CPU 125包括一個或多個數(shù)據(jù)采集模塊145,數(shù)據(jù)采集模塊145被構造為用于執(zhí)行一種或多種采集、處理以及存儲傳感器數(shù)據(jù)的方法。CPU另外包括一個或多個數(shù)據(jù)分析模塊130,其中含有用于通過分析采集自傳感器165的數(shù)據(jù)監(jiān)測一臺或多臺機器的算法。數(shù)據(jù)分析模塊執(zhí)行預見性維修任務,包括檢測可能指示偏離正常運轉狀態(tài)的事件。如下文詳述,數(shù)據(jù)分析模塊利用可能存儲在規(guī)則數(shù)據(jù)庫135中的手動定義的規(guī)則。這些規(guī)則使數(shù)據(jù)值與機器狀態(tài)關聯(lián)。數(shù)據(jù)分析模塊還利用可能存儲在訓練數(shù)據(jù)數(shù)據(jù)庫136中的傳感器測量訓練數(shù)據(jù)。存儲器180包括隨機存取存儲器(RAM) 185和只讀存儲器(ROM) 190。存儲器180 還包括可移動介質諸如磁盤驅動器、磁帶驅動器等,或者其組合。RAM 185起數(shù)據(jù)存儲器的作用,其存儲在CPU 125中執(zhí)行程序期間所使用的數(shù)據(jù),并且作為工作區(qū)使用。ROM 190起程序存儲器的作用,用于存儲在CPU 125中執(zhí)行的程序。程序可以駐留于ROM 190或任何其他非易失性計算機可用介質,成為存儲于其上的計算機可讀指令,用于由CPU125或者其他處理器執(zhí)行,以執(zhí)行本發(fā)明的方法。ROM 190也可以容納由其他程序使用的數(shù)據(jù)。輸入150可以是鍵盤、鼠標、網(wǎng)絡接口等,而輸出155可以是液晶顯示器(IXD)、陰極射線管(CRT)顯示器、打印機等。計算機110可以與網(wǎng)絡連接,所有指令、輸入/輸出以及數(shù)據(jù)經(jīng)由網(wǎng)絡傳遞。計算機110可以被構造為通過使用例如輸入250和輸出255裝置來操作并顯示信息,以執(zhí)行某些任務。本發(fā)明是一種故障診斷系統(tǒng),其結合了上述“規(guī)則”和“機器學習”方法二者的優(yōu)點。特別地,提出了監(jiān)督機器學習方法,以區(qū)分正常狀態(tài)與一種或多種故障狀態(tài)。通常,關于機器正常運轉狀態(tài)的大量訓練樣本是可能得到的,并且根據(jù)機器的長期正常運轉比較容易采集這種樣本。然而,關于某些故障的訓練樣本數(shù)量經(jīng)常是很有限的。 目前所描述的技術用由規(guī)則產(chǎn)生的人工樣本擴大用于特定故障的原始真實訓練集。在這種方法中,規(guī)則并不要求非常精確,如商用基于規(guī)則的系統(tǒng)所要求的那樣。所以,規(guī)則可以容易并且快速地設計。使用原始真實訓練集與人工訓練集的結合,對機器學習模型進行訓練。 與只使用真實訓練集或單獨使用基于規(guī)則的系統(tǒng)訓練過的任何一種機器學習模型相比,這樣得到的機器學習模型執(zhí)行得更好。注記真實訓練樣本目前描述的系統(tǒng)中所使用的真實訓練樣本通過用戶注記得到。用戶指明在某一時間戳機器是否正常工作或者有特定故障。例如,通過圖形用戶界面諸如輸入150和輸出 155(圖1),可以進行這項工作。用戶使用鼠標簡單選擇時間戳或時段,并注記所選時段為 “故障”或“正?!?。注記處理可以反復進行若干次。一旦注記了時間戳tn,則形成代表該時間戳信息的特征向量χη。ι的第i元或^cni 是一個特征。特征的選擇是機器以及問題的特性。例如,特征可以是在時間戳&處的原始傳感器觀測值(例如,溫度、壓力)。特征可以是根據(jù)狀態(tài)估計模型得到的殘差(觀測值與估計值之間的偏差),諸如在C. Yuan禾口 C. Neubauer的、名稱為"Bayesian sensor estimation for machine condition monitoring”的美國專利No. 7,565,262中所描述的,該申請的全部內容在此以引用方式并入本文。特征可以使用關系式或濾波根據(jù)測量導出。一般而言, 特征可以是任何原始的或預先處理過的結果。將每個特征向量ι與注記或標志yn關聯(lián),如果注記是“故障”則yn為1,如果注記是“正常”則7 為_1。應當注意到,如果用戶選擇太多的訓練特征向量,并且其中有些彼此非常相似,則可以應用聚類算法諸如k-mean (k_平均值)算法以對這些數(shù)據(jù)進行聚類,而且,對于訓練只使用聚類中心。這種步驟降低了訓練的復雜性。監(jiān)督故障學習基于由N個特征向量、和對應標志yn(其中,n= 1,2,3,...N)構成的訓練數(shù)據(jù), 可以應用任何一種監(jiān)督模式識別算法,以區(qū)分故障狀態(tài)與正常狀態(tài)。在本文所描述的示范實施例中,由于所提供的分類性能,而使用了支持向量機(SVM)。在C. Cortes和V. Vapnik W "Support Vector Networks, "Machine Learning, V. 20at 273-297(1995) t^ffiiSTS 種算法,該文的全部內容在此以引用方式并入本文。訓練之后,SVM產(chǎn)生評價函數(shù)f(x)。對于時間戳t的測試特征向量X,其診斷結果 y如下進行計算如果f(x) >0,y = 1,這意味著在時間t,機器有對應的故障。否則,如果 f(x) < 0,y = -1,這意味著在時間t,機器正常工作。f(x) = 0所在的流形(manifold)經(jīng)常稱為決策邊界。決策邊界給出了如何執(zhí)行分類的直觀意義決策邊界一側的空間屬于一類;而決策邊界另一側的空間屬于另一類。 圖2的圖形200示出了 SVM如何分類特征向量的示例。假設橫軸205和縱軸206 分別代表有關兩個溫度傳感器的傳感器殘差(偏差)。如果機器正常運轉,這些殘差較小是比較理想的。否則,機器處于故障狀態(tài)。將正常狀態(tài)與故障分開的實際邊界標示為黑實線220。此分隔邊界意味著,如果特征向量位于此邊界的右上方(殘差較大)為有故障。否則,機器正常運轉。假設有代表正常狀態(tài)的100個訓練特征向量(圖2的三角形M0)。這些數(shù)據(jù)點容易采集。關于這些向量每一個的標志都是-1。假設現(xiàn)在還可得到關于故障的100個訓練特征向量(圖2的圓形250)。關于這些向量每一個的標志都是1。在使用這200個特征向量及其標志訓練SVM之后,得到如圖2 中點線225的決策邊界。學習后的決策邊界225非常接近于實際分隔邊界220,這表示如果有足夠的代表故障的訓練數(shù)據(jù)(這種情況下是100個樣本),學習后的SVM可以產(chǎn)生非常準確的故障診斷結果。在圖3的圖300中所示的更現(xiàn)實的情況下,關于故障并沒有足夠的訓練樣本。圖 300中僅僅含有10個樣本(圖3的圓形350)。出于舉例說明的目的,從如圖2所示代表故障的100個訓練樣本250中隨機選擇這10個樣本。圖3的圖形300示出了決策邊界325, 這是對這10個樣本350加上代表正常狀態(tài)的100個訓練樣本240總計110個訓練特征向量進行訓練時由SVM產(chǎn)生的。顯然,決策邊界325現(xiàn)在與潛在的分隔邊界220頗為不同,這表示如果使用這種未經(jīng)充分訓練的SVM,將會產(chǎn)生更多的錯誤。所以,實際上,監(jiān)督機器學習算法不能依賴于用戶所注記的訓練數(shù)據(jù)來達到良好的診斷結果。根據(jù)規(guī)則產(chǎn)生人工訓練樣本對于監(jiān)督機器學習方法,由規(guī)則定義的狀態(tài)也可以視為指定決策邊界的方式。主要差異在于基于規(guī)則的決策邊界由人類專家手動定義,而由監(jiān)督機器學習方法產(chǎn)生的決策邊界則是根據(jù)訓練數(shù)據(jù)自動學習。由規(guī)則定義的決策邊界425示于圖4的圖形400中。因為潛在的真實分隔邊界是高度非線性的,描述規(guī)則狀態(tài)以使其與分隔邊界精確匹配是比較困難的。如決策邊界425 所示,規(guī)則定義為如果(殘差1 > 0. 16并且殘差2 > 0. 62)或者(殘差1 > 0. 83 并且殘差 2 > 0. 37)貝丨J,這是故障。(1)規(guī)則定義了特征狀態(tài)的范圍,該范圍結合定義了故障條件。應當注意到,殘差越高,越可能有故障。有可能添加更多的條件,以便更好地擬合真實分隔邊界;然而,這需要更多的時間和努力。在現(xiàn)實應用中,有數(shù)百個涉及定義條件的特征,使成功的規(guī)則設計非常富有挑戰(zhàn)性。盡管簡單的規(guī)則諸如上文所示規(guī)則(1)自身工作得并不好,但其來自于專家知識,提供了關于真實故障數(shù)據(jù)分布的有用信息。本發(fā)明提出了根據(jù)簡單規(guī)則對人工訓練數(shù)據(jù)進行抽樣,并使用抽樣的訓練數(shù)據(jù)來訓練監(jiān)督機器學習算法。一般而言,規(guī)則條件可以書寫成分層樹結構,諸如圖5所示的樹結構500。在基于樹結構500的下列示例抽樣中,如下所述從左到右進行抽樣情況㈧對于“或”連接符510,其具有數(shù)量M的分支或子511、512,分類分布假定為每個子具有1/M的概率。隨機選擇子(分支)以繼續(xù)該子的抽樣。情況(B)對于“與”連接符諸如連接符520,其具有數(shù)量L的分支或子521、522,對每個子同時進行抽樣,并將結果進行組合。情況(C)對于葉節(jié)點諸如比較530 “殘差1 > 0. 16”,可以使用幾種可選抽樣策略。按照均勻抽樣策略,必須規(guī)定關于該特征的附加邊界,以進一步定義特征狀態(tài)范圍。例如,在比較530(殘差1)的情況下,上邊界是1,并且使用了 0. 16 <殘差1 < 1的限制。對 0. 16和1之間的間隔均勻抽樣。在另一示例抽樣策略中,使用了高斯分布。在這種情況下, 必須規(guī)定高斯分布的方差O 2,并且,使用均值0. 16和方差O2的單側高斯分布,對殘差1特征狀態(tài)范圍進行抽樣。在本示例中,使用了均勻抽樣策略。為了根據(jù)由樹結構500代表的規(guī)則(1)建立樣本特征向量,從根節(jié)點或如圖5中所示的左側開始計算。因為根510是“或”,其子的數(shù)量為M= 2,應用情況(A)。在M=2 類、每個類具有概率1/M = 0. 5的情況下,對分類分布進行抽樣。出于說明的目的,抽樣得到第一分支511,因而,抽樣出第一子520。因為該子520是“與”,其子的數(shù)量為L = 2,應用情況(B),其中同時抽樣每個子 530540,并且使結果進行組合。第一子530“殘差1 > 0. 16”是葉節(jié)點,所以落入情況(C)。 在這種情況下,對范圍從0. 16到1的均勻分布抽樣,得到殘差1 = 0. 5。第二子MO “殘差2>0.62”也是葉節(jié)點,所以,也落在情況(C)下。在本示例中, 對范圍從0. 62到1的均勻分布抽樣,得到殘差2 = 0. 8。結果是一個人工訓練特征向量 [0. 50. 重復此處理,直至產(chǎn)生所要求數(shù)量的樣本。通過上述基于規(guī)則的過程所產(chǎn)生的一百個人工樣本650示為圖6的圖形600中的圓形。使用這些樣本650,SVM產(chǎn)生的決策邊界625稍稍好于單獨使用規(guī)則所產(chǎn)生的決策邊界 425(圖 4)。使用組合訓練集的監(jiān)督故障學習現(xiàn)在,將代表故障的原始訓練集與由規(guī)則產(chǎn)生的人工訓練樣本進行組合,并使用圖7的圖形700中所示的組合訓練集來訓練監(jiān)督機器學習算法。繼續(xù)上述示例,代表故障的有10個實際訓練樣本(圖3中示為圓形350)和100個人工訓練樣本(圖6中示為圓形 650)。將這兩個集進行組合,以產(chǎn)生圖700中用圓形和虛圓形(圖7)代表的集750。同樣, SVM使用了代表正常狀態(tài)的100個實際訓練樣本(示于圖3、6、7中的三角形)。與如上所述根據(jù)其他數(shù)據(jù)所產(chǎn)生的決策邊界相比,示于圖7中的新決策邊界725更為接近潛在的分隔邊界220。具體而言,對于使用實際訓練樣本所產(chǎn)生的邊界325(圖3)、僅使用簡單規(guī)則所產(chǎn)生的邊界425 (圖4)、以及僅使用代表故障的人工樣本所產(chǎn)生的邊界625 (圖6),新決策邊界725有所改進。圖8所示的方法800總結了本發(fā)明方法的工作流程。接收一組手動定義的規(guī)則 810。這些規(guī)則可以由具有機器性能知識并且理解傳感器讀數(shù)如何證實機器故障的專家手動建立。應當注意,這些規(guī)則可以非常簡單,而且,不需要產(chǎn)生嚴密符合故障狀態(tài)與正常狀態(tài)之間潛在分隔邊界的決策邊界。每個規(guī)則建立一組特征狀態(tài)范圍,這些范圍表示正常機器狀態(tài)和故障機器狀態(tài)之一。規(guī)則可以通過用戶輸入150(圖1)手動輸入,或者可以從這種規(guī)則的數(shù)據(jù)庫135裝載。根據(jù)如上示范的技術,根據(jù)該組手動定義的規(guī)則使用概率,產(chǎn)生人工樣本特征向量集820。通過使用概率來選擇決策分支,并且通過在特征狀態(tài)范圍上使用概率分布對規(guī)則進行抽樣,完成這項工作。使用了諸如均勻分布或高斯分布的概率分布。每個人工樣本特征向量包括指明正常機器狀態(tài)和故障機器狀態(tài)之一的注記。另外,通過給訓練集的每個實際特征向量指定注記,對實際特征向量訓練集進行注記。注記指明正常狀態(tài)和故障機器狀態(tài)之一。通過選擇時段包括具有相同機器狀態(tài)(正?;蚬收?的特征向量并同時注記這些特征矢量,可以成群地注記特征向量。使用增強的訓練集(包括實際特征向量訓練集和人工樣本特征向量集),對監(jiān)督模式識別算法進行訓練840。該算法可以是SVM。然后,使用訓練過的監(jiān)督模式識別算法, 系統(tǒng)可以對測試特征向量進行分類850。應當理解,上述具體描述在每一方面都是說明性及示范性而非限制性的,以及,在此披露的本發(fā)明的范圍并非根據(jù)本發(fā)明的描述確定,而是如根據(jù)專利法所允許的完全范圍所解釋的那樣由權利要求確定。例如,為了抽樣規(guī)則樹的葉節(jié)點,雖然說明了高斯和均勻抽樣策略,但也可以使用其他概率分布而仍然保持在本發(fā)明的范圍內。在另一示例中,本披露使用SVM說明了監(jiān)督模式識別算法,但也可以使用其他算法。應當理解,本文所示出并描述的實施例只是說明本發(fā)明的原理,本領域技術人員可以實現(xiàn)多種修改,而不脫離本發(fā)明范圍和精神。
權利要求
1.一種方法,用于將測量特征向量分類為代表正常機器狀態(tài)和故障機器狀態(tài)之一,所述測量特征向量包括在特定時間與機器有關的一組特征狀態(tài),包括接收一組手動定義的規(guī)則,每個規(guī)則建立起指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一的一組特征狀態(tài)范圍;在所述特征狀態(tài)范圍中使用概率分布對所述手動定義的規(guī)則進行抽樣,產(chǎn)生人工樣本特征向量集,每個人工樣本特征向量包括指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一的注記;通過給訓練集的每個實際特征向量指定注記,對實際特征向量訓練集進行注記,所述注記指示所述正常機器狀態(tài)和所述故障狀態(tài)之一;使用包括了所述實際特征向量訓練集和所述人工樣本特征向量集的增強訓練集,訓練監(jiān)督模式識別算法;以及使用所述訓練后的監(jiān)督模式識別算法對測試特征向量進行分類。
2.根據(jù)權利要求1所述的方法,其中,所述監(jiān)督模式識別算法是支持向量機算法。
3.根據(jù)權利要求1所述的方法,其中,所述概率分布包括均勻概率分布。
4.根據(jù)權利要求1所述的方法,其中,所述概率分布包括單邊高斯概率分布。
5.根據(jù)權利要求1所述的方法,其中,產(chǎn)生人工特征向量集進一步包括構造基于所述規(guī)則的分層樹結構。
6.根據(jù)權利要求1所述的方法,其中,至少一個所述特征狀態(tài)是根據(jù)狀態(tài)估計模型得到的殘值。
7.根據(jù)權利要求1所述的方法,其中,至少一個所述特征狀態(tài)是從傳感器接收的觀測值。
8.根據(jù)權利要求1所述的方法,其中,注記實際特征向量的訓練集包括同時注記與特定時間間隔有關并具有相同機器狀態(tài)的多組特征向量。
9.一種非短暫性計算機可用介質,具有存儲于其上的由處理器執(zhí)行的計算機可讀指令,以執(zhí)行一種將測量特征向量分類為代表正常機器狀態(tài)和故障機器狀態(tài)之一的方法,所述測量特征向量包括在特定時間與機器有關的一組特征狀態(tài),所述方法包括接收一組手動定義的規(guī)則,每個規(guī)則建立一組特征狀態(tài)范圍,指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一;使用概率分布在所述特征狀態(tài)范圍中對所述手動定義的規(guī)則進行抽樣,產(chǎn)生人工樣本特征向量集,每個人工樣本特征向量包括指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一的注記;通過給所述訓練集的每個實際特征向量指定注記,對所述實際特征向量訓練集進行注記,所述注記指示所述正常機器狀態(tài)和所述故障狀態(tài)之一;使用包括了所述實際特征向量訓練集和所述人工樣本特征向量集的增強訓練集,訓練監(jiān)督模式識別算法;以及使用所述訓練后的監(jiān)督模式識別算法分類測試特征向量。
10.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,所述監(jiān)督模式識別算法是支持向量機算法。
11.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,所述概率分布包括均勻概率分布。
12.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,所述概率分布包括單邊高斯概率分布。
13.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,產(chǎn)生人工特征向量集進一步包括構造基于所述規(guī)則的分層樹結構。
14.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,至少一個所述特征狀態(tài)是根據(jù)狀態(tài)估計模型得到的殘值。
15.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,至少一個所述特征狀態(tài)是從傳感器接收的觀測值。
16.根據(jù)權利要求9所述的非短暫性計算機可用介質,其中,注記實際特征向量的訓練集包括同時注記與特定時間間隔有關并具有相同機器狀態(tài)的多組特征向量。
17.一種機器監(jiān)測系統(tǒng),包括用于將測量特征向量分類為代表正常機器狀態(tài)和故障機器狀態(tài)之一的分類器,所述測量特征向量包括在特定時間涉及機器的一組特征狀態(tài),所述方法包括用于接收一組手動定義的規(guī)則的輸入裝置,每個規(guī)則建立一組特征狀態(tài)范圍,指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一;在所述特征狀態(tài)范圍中使用概率分布對所述手動定義的規(guī)則抽樣以產(chǎn)生人工樣本特征向量集的裝置,每個人工樣本特征向量包括指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一的注記;通過給所述訓練集的每個實際特征向量指定注記對所述實際特征向量訓練集進行注記的裝置,所述注記指示所述正常機器狀態(tài)和所述故障機器狀態(tài)之一;使用包括了所述實際特征向量訓練集和所述人工樣本特征向量集的增強訓練集對監(jiān)督模式識別算法進行訓練的裝置;用于對測試特征向量進行測量的測量裝置;以及使用所述訓練后的監(jiān)督模式識別算法對測試特征向量進行分類的裝置。
18.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,所述監(jiān)督模式識別算法是支持向量機算法。
19.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,所述概率分布包括均勻概率分布。
20.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,所述概率分布包括單邊高斯概率分布。
21.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,人工特征向量集的產(chǎn)生進一步包括構造基于所述規(guī)則的分層樹結構。
22.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,至少一個所述特征狀態(tài)是根據(jù)狀態(tài)估計模型得到的殘值。
23.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,至少一個所述特征狀態(tài)是從傳感器接收的觀測值。
24.根據(jù)權利要求17所述的機器監(jiān)測系統(tǒng),其中,用于對實際特征向量訓練集進行注記的裝置包括用于對與特定時間間隔有關并具有相同機器狀態(tài)的多組特征向量同時進行注記的裝置。
全文摘要
一種機器故障診斷系統(tǒng),結合了基于規(guī)則的預見性維修策略與機器學習系統(tǒng)。使用由人類專家手動定義的一組簡單規(guī)則來產(chǎn)生描繪機器故障狀態(tài)的人工訓練特征向量,對于所述機器故障狀態(tài)只能得到很少的真實數(shù)據(jù)點。將這些人工訓練特征向量與真實訓練特征向量結合,并使用結合集來訓練監(jiān)督模式識別算法諸如支持向量機(SVM)。所得到的決策邊界極其接近故障狀態(tài)與正常狀態(tài)之間潛在的真實分隔邊界。
文檔編號G05B23/02GK102498445SQ201080041705
公開日2012年6月13日 申請日期2010年9月13日 優(yōu)先權日2009年9月17日
發(fā)明者C.紐鮑爾, C.袁, H.哈克斯坦 申請人:西門子公司