一種基于hmm的選礦設備故障異常音頻分析與識別方法
【技術領域】
[0001] 本發(fā)明涉及一種基于隱馬爾可夫模型(HiddenMarkovModel,HMM)的選礦設備故 障異常音頻分析與識別方法,屬于數(shù)字音頻處理技術領域。
【背景技術】
[0002] 選礦設備廣泛用于礦產的選礦、資源回收等各種領域,用途十分廣泛。礦產資源的 大量開發(fā)利用、可供資源量不斷減少以及人類日益加強的環(huán)保意識都對選礦設備提出了越 來越高的要求,促使選礦設備不斷向更大、更優(yōu)和高效節(jié)能的方向發(fā)展。
[0003]隨著科學技術的飛速發(fā)展和工廠自動化程度的不斷提高,選礦設備的日常維護及 整修就顯得尤為重要。國內外對這方面的研究一直都非常重視,如何在故障早期發(fā)現(xiàn)先 兆一直都是非常重要的課題。
[0004] 通常情況下,設備故障和部件缺陷都會以某些特定的方式,如電流的波動、殼體表 面的振動變化、部件不同位置的異常溫升、或音頻幅值和頻率的變化等顯示出來。如果能對 這些信息進行收集記錄,采用智能化信息處理手段,結合專家知識和各類分析方法,就能有 效實現(xiàn)選礦設備的故障判別,從而降低設備故障所造成的人員和財產損失。
[0005] 傳統(tǒng)的檢修手段都是以人工為主,由檢修人員定期檢查設備運轉狀況并對設備進 行保養(yǎng),或者是巡檢時聆聽各個部件工作時發(fā)出的聲音,從而判斷運行中的設備是否存在 故障。
[0006]但在實際生產車間中,故障產生的低頻噪聲可能被工業(yè)噪聲中的高頻部分所掩蓋 (工業(yè)噪聲,通常指的是工廠正常生產中,由于機械設備摩擦撞擊、震動等相關原因產生的 噪聲)。同時,工業(yè)噪聲對工作人員的聽力影響非常大,長期在這種環(huán)境下工作,會對聽力及 身體健康造成不可逆轉的損傷。
[0007]因此,選礦設備的早期故障診斷已經(jīng)成為國內外研究的熱點,開展選礦設備的故 障診斷研究對于生產實踐、避免重大事故發(fā)生都有著重要的現(xiàn)實意義。
【發(fā)明內容】
[0008]本發(fā)明所要解決的技術問題是:對選礦設備所產生的音頻進行故障診斷和識別。
[0009] 所采用的技術方案是: 步驟1 :建立選礦設備故障異常音頻樣本庫; 步驟2 :對采集的音頻樣本進行預處理步驟; 步驟3 :音頻特征參數(shù)提取及降維; 步驟4 :采用Baum-Welch算法進行訓練;建立隱馬爾可夫參數(shù)訓練模型,通過訓練得到 狀態(tài)轉移概率矩陣; 步驟5 :采用Viterbi算法通過計算未知音頻信號在轉移過程中的最大概率,并根據(jù)最 大概率對應的模型進行識別。
[0010] 本發(fā)明的優(yōu)點:本發(fā)明提供一種基于隱馬爾可夫模型的選礦設備故障異常音頻分 析與識別方法,這種音頻信號隨時間變化的特性,采用狀態(tài)的概念是比較恰當?shù)模纛l信號 特征的變化表現(xiàn)為從一個狀態(tài)到另一個狀態(tài)的轉移,特征從一個狀態(tài)到另一個狀態(tài)只是以 一定的概率轉移。因此,用隱馬爾可夫模型可以很好的表示這一轉移過程。該方法基于HMM 與多特征融合的音頻分析和識別技術,具有較高的故障識別率。
【附圖說明】
[0011] 圖1 :基于HMM的選礦設備故障異常音頻分析與識別框圖
【具體實施方式】
[0012] 如圖1所示,輸入選礦設備音頻信號,對采集的音頻樣本進行預處理,提取音頻信 號的特征參數(shù),建立設備故障異常音頻樣本庫,為音頻樣本信號建立隱馬爾可夫參數(shù)訓練 模型,并形成設備音頻故障類型的參考模板庫。另對于待測音頻進行輸入、預處理、提取音 頻信號的特征參數(shù)之后,采用Viterbi算法,計算未知音頻信號在轉移過程中的最大概率, 并根據(jù)最大概率對應的模型與參考模板庫進行模板匹配,從而識別待測樣本的故障類型。
[0013] 本發(fā)明采用如下技術方案: 一種基于HMM的選礦設備故障異常音頻分析與識別方法,其步驟如下: 步驟1 :建立選礦設備故障異常音頻樣本庫; 該音頻樣本庫包括多種選礦設備系列在不同狀態(tài)下的音頻信號:設備包括一系列至五 系列一次、二次筒體、齒輪座、同步電機內小瓦、軸承和機上部傘齒輪,設備狀態(tài)包括五種: 正常、漏油、擺動、振動和抖動;均從企業(yè)生產現(xiàn)場采集;樣本庫中存儲的內容均為音頻信 號; 樣本庫中存儲的全是音頻信號,其聲音屬性設置為單聲道(8KHz,8位,705Kb/s),格式 均為".wav",錄制的音頻信號時長在1~15分鐘不等。
[0014] 步驟2:預處理步驟; 對采集的音頻樣本進行預加重、分幀和加窗處理,以便于后續(xù)處理。預加重是將語音信 號的高頻部分提升,其目的是增加語音的高頻分辨率;分幀是將語音信號分割成一幀一幀 的(通常為l〇ms-30mS),其目的以具備短時平穩(wěn)特性;加窗處理,其目的是為了減少幀起始 和結束信號的不連續(xù)性問題。利用交疊分段法【交疊分段法是現(xiàn)有技術】進行分幀,使幀與 幀之間過渡平滑,保證其連續(xù)性。本發(fā)明設置幀長為256 (幀長為32ms),幀移為128 (幀移 為 16ms)〇
[0015] 步驟3 :音頻特征參數(shù)提取及降維; 經(jīng)過預處理后,提取音頻樣本的特征參數(shù),并對該特征參數(shù)進行降維處理;本發(fā)明所提 取的特征參數(shù)包括:短時能量及短時幅度的均值、標準差、一階差分均值、一階差分標準差, 共8維;短時過零率的均值、標準差、一階差分均值、一階差分標準差,共4維;12維LPCC及 其一階差分的均值、標準差、一階差分均值、一階差分標準差,共96維;12維MFCC及其一階 差分的均值、標準差、一階差分均值、一階差分標準差,共96維;總計204維特征參數(shù); 本發(fā)明所述的降維處理是指通過主成分分析法實現(xiàn)降維,得到樣本特征矢量序列?!局?成分分析法是是現(xiàn)有技術】。降維的目的一方面是為了刪除冗余信息,從而減少模式識別算 法的計算量;另一方面是為了提高特征對分類的有效性,避免信息干擾。
[0016] 步驟4 :基于Baum-Welch算法的訓練過程; 得到降維后的音頻特征參數(shù),采用Baum-Welch算法進行訓練,并結合樣本標記,為音 頻樣本信號建立隱馬爾可夫參數(shù)訓練模型,通過訓練得到狀態(tài)轉移概率矩陣; HMM是一種基于參數(shù)的統(tǒng)計識別方法,通常將其模型定義為QUOTEλ= (Α,Β,π)λ= (Α,Β,π),由模型參數(shù)Ν,Μ和概率分布參數(shù)Α,Β來確定,其特征參數(shù)定義如下: 狀態(tài)轉移概率分布QUOTEA=[aij]A= [aj,其中P[qt+1 = .j|qt=i]l彡i彡N,1 彡j彡N 觀察符號的概率分布QUOTEB= [1^(10]Β= [bjGO],其中 bj(k) =P[ot=VkIqt=j] 1 ^k^M, 1 ^j^N 初始狀態(tài)概率分布QUOTEπ= = [、],其中 πi=P[qi=i] 1 ^i^N 其中:N是隱馬爾可夫模型中的狀態(tài)個數(shù),M是每個狀態(tài)中可以觀察到的符號數(shù)。各個 觀察符號為QUOTEV= {v^v2,…,vM}V= {v^v2,…,vM},觀察序列為QUOTE0={cv 〇2,···,〇t1〇 {〇i,