本發(fā)明涉及一種emd虛假分量識(shí)別的數(shù)學(xué)模型建模方法,應(yīng)用于利用經(jīng)驗(yàn)?zāi)B(tài)分解進(jìn)行信號(hào)分析的
技術(shù)領(lǐng)域:
。
背景技術(shù):
:經(jīng)驗(yàn)?zāi)B(tài)分解(empiricalmodedecomposition,emd)法是美籍華人n.e.huang等人于1998年提出的一種基于數(shù)據(jù)局部時(shí)間特征的自適應(yīng)時(shí)頻分析方法。它能夠?qū)?fù)雜信號(hào)分解為有限個(gè)本征模態(tài)函數(shù)分量,簡(jiǎn)稱為imf(intrinsicmodefunction)分量,被廣泛的應(yīng)用于非線性、非平穩(wěn)時(shí)間序列處理過(guò)程。一方面,較為理想的emd應(yīng)用條件為采樣頻率大于4倍的nyquist頻率,而應(yīng)用emd的最低要求應(yīng)為采樣頻率大于2倍的nyquist頻率;另一方面,emd過(guò)程中每一個(gè)imf分量的產(chǎn)生都需要利用信號(hào)(或剩余信號(hào))的局部極值點(diǎn),并利用樣條插值法構(gòu)成包絡(luò)。低采樣率及樣條插值方法的不當(dāng)使得emd過(guò)程中,容易分解出與原信號(hào)無(wú)關(guān)的imf分量,即虛假分量(反之,對(duì)于emd分解出的與原信號(hào)有關(guān)的imf分量,本發(fā)明中簡(jiǎn)稱為真實(shí)分量)。通過(guò)提高信號(hào)的采樣頻率及優(yōu)化樣條差值雖然能夠在一定程度上抑制虛假分量的產(chǎn)生,但仍然無(wú)法完全消除。而在利用emd方法處理信號(hào)時(shí),能否有效的識(shí)別和剔除虛假分量,是避免新產(chǎn)生的低頻噪聲污染原始數(shù)據(jù),保障了后續(xù)處理的精確性和有效性的前提條件。文獻(xiàn)“黃迪山.經(jīng)驗(yàn)?zāi)B(tài)分解中虛假模態(tài)分量解除法[j].振動(dòng)、測(cè)試與診斷,2011,31(3):381-384.”(簡(jiǎn)稱:能量增減法)提出根據(jù)emd分解的完備性,能量原理及虛假模態(tài)分量的性質(zhì),通過(guò)判斷第一階imf分量與高階imf分量相加后能量的增減來(lái)判斷虛假分量,但該方法僅適用于特定的規(guī)則信號(hào);文獻(xiàn)“林麗.基于相關(guān)系數(shù)的emd改進(jìn)算法[j]計(jì)算機(jī)與數(shù)字工程.2008,36(12):28-29,38”將文獻(xiàn)“pengzk,tsepw,chufl.acomparisonstudyofimprovedhilbert-huangtransformandwavelettransform:applicationtofaultdiagnosisforrollingbearing[j].mechanicalsystemsandsignalprocessing,2005(19):974-988.”(簡(jiǎn)稱:相關(guān)系數(shù)法)中利用imf分量與原信號(hào)之間的相關(guān)系數(shù)進(jìn)行去噪數(shù)進(jìn)行去噪的思想用于emd虛假分量的判別,并設(shè)定閾值為最大相關(guān)系數(shù)的1/10,小于閾值的情況判斷為虛假分量,但對(duì)于頻率成分較多的機(jī)械振動(dòng)信號(hào)而言,有時(shí)真實(shí)分量與虛假分量所對(duì)應(yīng)的相關(guān)系數(shù)大小差異并不明顯,容易造成誤判;文獻(xiàn)“韓中合,朱霄珣,李文華.k-l散度的假分量識(shí)別方法研究[j].中國(guó)電機(jī)工程學(xué)報(bào).2012,32(11):112-117.”與文獻(xiàn)“宋娜,石玉,周克印,遺傳算法在emd虛假分量識(shí)別中的應(yīng)用”(兩種方法都簡(jiǎn)稱:kl散度法)都提出通過(guò)計(jì)算imf分量與原信號(hào)之間的k-l散度值(相對(duì)熵),并將所有imf分量的k-l散度值歸一化,當(dāng)歸一化后的散度值大于某一給定閾值時(shí)則判為虛假分量,該方法對(duì)于閾值的確定,作者仍是根據(jù)經(jīng)驗(yàn)給出,且并不具備普適性。針對(duì)上述問(wèn)題,本發(fā)明提出了一種基于k-l散度及svm的emd虛假分量識(shí)別的數(shù)學(xué)模型(簡(jiǎn)稱kl+svm模型)及建模方法。技術(shù)實(shí)現(xiàn)要素:本發(fā)明解決的技術(shù)問(wèn)題是針對(duì)信號(hào)emd虛假分量識(shí)別,提出了一種基于k-l散度及svm的emd虛假分量識(shí)別的數(shù)學(xué)模型(簡(jiǎn)稱kl+svm模型)及建模方法,其特征在于:將一組最普通的雙音信號(hào)作emd分解,利用頻譜比值法對(duì)所有的imf分量標(biāo)定為真實(shí)分量或虛假分量,并計(jì)算各imf分量與原信號(hào)之間的k-l散度值,將其作為描述該imf分量的唯一特征輸入svm,訓(xùn)練出能識(shí)別emd虛假分量的分類器數(shù)學(xué)模型。本發(fā)明的目的在于:提供一種基于k-l散度及svm的emd虛假分量識(shí)別的數(shù)學(xué)模型及建模方法,所述方法包括如下步驟:1)生成雙音信號(hào)集;2)將每個(gè)雙音信號(hào)emd分解得到若干個(gè)imf分量,獲得訓(xùn)練樣本集,并利用頻譜比值法將所有的imf分量進(jìn)行標(biāo)定,從而獲得真實(shí)分量和虛假分量?jī)深愑?xùn)練樣本集;3)計(jì)算上述訓(xùn)練樣本集中每個(gè)樣本與其原信號(hào)間的k-l散度值;4)設(shè)置svm參數(shù);5)將每個(gè)訓(xùn)練樣本與原信號(hào)的k-l散度值作為該樣本的唯一特征代入svm中,訓(xùn)練能識(shí)別emd虛假分量的二元分類器數(shù)學(xué)模型;6)對(duì)采集到的測(cè)試樣本集按步驟2)、步驟3)依次進(jìn)行emd分解、通過(guò)頻譜比值法對(duì)imf樣本進(jìn)行標(biāo)定、提取用于識(shí)別虛假分量的唯一特征k-l散度值,最后將提取的特征送入訓(xùn)練好的svm二元分類器數(shù)學(xué)模型,根據(jù)分類結(jié)果識(shí)別虛假分量。本發(fā)明的有益效果是:參與數(shù)學(xué)模型訓(xùn)練的樣本只是由一些簡(jiǎn)單的理論雙音信號(hào)生成,信號(hào)簡(jiǎn)單易得;對(duì)訓(xùn)練樣本集中的虛假分量樣本和真實(shí)分量樣本的標(biāo)定采用了頻譜比值法,標(biāo)準(zhǔn)比較客觀;將每個(gè)訓(xùn)練樣本與原信號(hào)之間的k-l散度值作為該樣本的唯一特征輸入svm中進(jìn)行訓(xùn)練,樣本的特征維數(shù)低,計(jì)算簡(jiǎn)單;訓(xùn)練得到的數(shù)學(xué)模型簡(jiǎn)單,而此后再識(shí)別某信號(hào)的emd虛假分量時(shí),只需要將其imf分量與原信號(hào)之間的k-l散度值輸入該數(shù)學(xué)模型即可;數(shù)學(xué)模型具有普適性,能夠解決三音、四音乃至多音信號(hào)進(jìn)行emd分解后虛假分量的識(shí)別問(wèn)題,此外,對(duì)于這些信號(hào)中出現(xiàn)模態(tài)混疊現(xiàn)象時(shí),該數(shù)學(xué)模型對(duì)其emd虛假分量的識(shí)別仍然具有較強(qiáng)的魯棒性。附圖說(shuō)明圖1為算法流程圖;圖2為二元分類器數(shù)學(xué)模型應(yīng)用流程圖;圖3為尋優(yōu)等高線圖;圖4為打點(diǎn)振動(dòng)信號(hào)采集裝置圖;圖5為打點(diǎn)機(jī)振動(dòng)信號(hào)的時(shí)域波形圖和頻譜圖;圖6為打點(diǎn)振動(dòng)信號(hào)emd分解結(jié)果;圖7為實(shí)際六音信號(hào)的時(shí)域波形圖和頻譜圖;圖8為實(shí)際六音信號(hào)emd分解結(jié)果。具體實(shí)施方式為了使本發(fā)明的技術(shù)手段、創(chuàng)作特征、工作流程、使用方法達(dá)成目的與功效易于明白了解,下面結(jié)合附圖和具體實(shí)施例,進(jìn)一步闡述本發(fā)明具體實(shí)施方式,本領(lǐng)域技術(shù)人員可以在不違背本發(fā)明內(nèi)涵的情況下做類似的推廣,因此本發(fā)明不受下面公開(kāi)的具體實(shí)施例的限制。如圖1、圖2所示,本發(fā)明公開(kāi)了一種基于k-l散度及svm的emd虛假分量識(shí)別的數(shù)學(xué)模型及建模方法,詳細(xì)步驟如下:1)生成雙音信號(hào)集;建立雙音信號(hào)的數(shù)學(xué)模型如式(1)所示:x(t)=a1cosω1t+a2cosω2t(1)其中:ω1和ω2為雙音信號(hào)的頻率,a1和a2分別為雙音信號(hào)的幅值,若設(shè)emd采樣頻率為ωs,則ω1,ω2≤0.25ωs,并隨機(jī)選擇ω1、ω2、a1和a2,生成一系列不同的雙音信號(hào)。2)將每個(gè)雙音信號(hào)通過(guò)emd分解為若干imf分量,利用頻譜比值法對(duì)每個(gè)imf分量進(jìn)行標(biāo)定;將雙音信號(hào)通過(guò)emd分解為imf分量和殘差函數(shù)的形式,如式(2)所示:其中ci(t)為頻率從高到低的各階imf分量,rn(t)為殘差函數(shù)。并對(duì)ci(t)做傅里葉變換得ci(ω),各imf分量與原信號(hào)的頻譜比值如式(3)所示:當(dāng)ρij<0.1時(shí),則標(biāo)定ci(t)所表示的imf分量為原信號(hào)x(t)的虛假分量;反之,則標(biāo)定ci(t)為原信號(hào)x(t)的真實(shí)分量。3)計(jì)算所有已標(biāo)定的imf分量與其原信號(hào)間的k-l散度值;通過(guò)非參數(shù)估計(jì)分別計(jì)算各imf分量與原信號(hào)的概率密度函數(shù),分別用采樣后的信號(hào)集{x1,x2,...,xn}和{ci1,ci2,...,cin}表示原信號(hào)x(t)及其第i個(gè)imf分量ci(t),分別用p(x)和qi(x)分別表示原信號(hào)x(t)及其第i個(gè)imf分量ci(t)的概率密度,如式(4)和式(5)所示:其中k(·)稱為核函數(shù),h為窗寬。再計(jì)算各imf分量與其原信號(hào)間的相對(duì)熵值,如對(duì)某原信號(hào)x(t)及其第i個(gè)imf分量ci(t)來(lái)說(shuō),其相對(duì)熵值可由下式表示:4)svm參數(shù)的設(shè)置。利用臺(tái)灣大學(xué)林智仁教授主導(dǎo)開(kāi)發(fā)的libsvm工具箱訓(xùn)練作為能區(qū)分emd真實(shí)分量和emd虛假分量的二元分類器數(shù)學(xué)模型,對(duì)于具體參數(shù)的設(shè)置說(shuō)明如下:選用的svm類型為c-svc,核函數(shù)選用高斯徑向基函數(shù),即:核函數(shù)的寬度δ選用libsvm工具箱的默認(rèn)值,與核函數(shù)密切相關(guān)參數(shù)g和c-svc的懲罰函數(shù)參數(shù)c則通過(guò)交叉驗(yàn)證尋得最優(yōu)獲得,尋優(yōu)等高線如圖3所示,當(dāng)c和g分別為:c=0.25,g=0.0625時(shí),分類精度達(dá)99.8%。5)分類器數(shù)學(xué)模型的訓(xùn)練將2)中已標(biāo)定的所有imf分量作為訓(xùn)練樣本;將3)中通過(guò)式(4)、(5)和(6)計(jì)算獲得的各imf分量ci(t)與原信號(hào)x(t)之間的k-l散度值d(x(t),ci(t))作為各訓(xùn)練樣本的唯一特征;代入4)中的已完成設(shè)置的svm訓(xùn)練能識(shí)別emd虛假分量的分類器數(shù)學(xué)模型。6)對(duì)采集到的測(cè)試樣本集按步驟2)、步驟3)依次進(jìn)行emd分解、頻譜比值法對(duì)imf樣本進(jìn)行標(biāo)定、提取用于識(shí)別虛假分量的唯一特征k-l散度值,最后將提取的特征送入訓(xùn)練好的svm二元分類器數(shù)學(xué)模型,根據(jù)分類結(jié)果識(shí)別虛假分量。7)驗(yàn)證該二元分類器數(shù)學(xué)模型的有效性及普適性。為驗(yàn)證本發(fā)明中所創(chuàng)建的鑒別imf虛假分量數(shù)學(xué)模型的優(yōu)勢(shì),本發(fā)明完成了四個(gè)驗(yàn)證性實(shí)驗(yàn),每個(gè)實(shí)驗(yàn)都會(huì)將本發(fā)明中訓(xùn)練的分類器數(shù)學(xué)模型與能量增減法、k-l散度法和相關(guān)系數(shù)法進(jìn)行比較。實(shí)驗(yàn)一:對(duì)雙音信號(hào)中emd虛假分量的識(shí)別利用式(1)隨機(jī)產(chǎn)生400個(gè)雙音信號(hào),emd分解得到1870個(gè)imf分量,經(jīng)過(guò)頻譜比值法標(biāo)定后,其中真實(shí)分量樣本667個(gè),另外1204個(gè)為虛假分量樣本,表1給出了四種方法識(shí)別虛假分量的正確率。表1.雙音信號(hào)中emd虛假分量的識(shí)別率比較識(shí)別方法能量增減法kl散度法相關(guān)系數(shù)法本文方法準(zhǔn)確率52.44%88.6%96.9%99.8%實(shí)驗(yàn)二:打點(diǎn)機(jī)振動(dòng)信號(hào)(實(shí)際雙音信號(hào))中emd虛假分量的識(shí)別在某微結(jié)構(gòu)密集陣列超精密加工機(jī)床上,利用ai005c加速度傳感器測(cè)量直線電機(jī)方向的振動(dòng)(如圖4所示),獲得包含2個(gè)主頻的200組打點(diǎn)振動(dòng)信號(hào),兩個(gè)主頻分別約為36.8hz和73.6hz,其時(shí)域波形與頻譜圖如圖5所示,emd分解得到1025個(gè)imf分量,隨機(jī)取一組打點(diǎn)振動(dòng)信號(hào),其emd分解結(jié)果如圖6所示,經(jīng)過(guò)頻譜比值法標(biāo)定后,其中真實(shí)分量樣本397個(gè),另外628個(gè)為虛假分量樣本,表2給出了四種方法識(shí)別imf虛假分量的準(zhǔn)確率。表2.打點(diǎn)機(jī)振動(dòng)信號(hào)(實(shí)際雙音信號(hào))中emd虛假分量的識(shí)別識(shí)別方法能量增減法kl散度法相關(guān)系數(shù)法本文方法準(zhǔn)確率55.41%97.17%97.45%98.04%實(shí)驗(yàn)三:三音及四音信號(hào)(多音信號(hào))中emd虛假分量的識(shí)別類比于式(1)建立三音數(shù)學(xué)模型,隨機(jī)產(chǎn)生250個(gè)三音信號(hào),emd分解得到1408個(gè)imf分量,經(jīng)過(guò)頻譜比值法標(biāo)定后,其中真實(shí)分量樣本748個(gè),另外660個(gè)為虛假分量樣本;類比于式(1)建立四音數(shù)學(xué)模型,隨機(jī)產(chǎn)生120個(gè)四音信號(hào),emd分解后分別得到805個(gè)imf分量,經(jīng)過(guò)頻譜比值法標(biāo)定后,其中真實(shí)分量樣本475個(gè),另外330個(gè)為虛假分量樣本。表3給出了四種方法識(shí)別分別識(shí)別三音信號(hào)和四音信號(hào)的emd虛假分量的準(zhǔn)確率。表3.三音及四音信號(hào)(多音信號(hào))中emd虛假分量的識(shí)別識(shí)別方法能量增減法kl散度法相關(guān)系數(shù)法本文方法準(zhǔn)確率(三音信號(hào))68.8%70.8%89.7%100%準(zhǔn)確率(四音信號(hào))73.3%41.2%86.5%100%實(shí)驗(yàn)四:實(shí)際六音信號(hào)中emd虛假分量的識(shí)別選取uci數(shù)據(jù)集中的spokenarabicdigit信號(hào)(網(wǎng)絡(luò)鏈接:http://archive.ics.uci.edu/ml/datasets.html)前214組,每組信號(hào)均包含6個(gè)頻率成分,分別約為40hz、79hz、120hz、159hz、199hz和238hz,其時(shí)域和頻域波形如圖7所示,經(jīng)過(guò)emd分解得到1716個(gè)imf分量,隨機(jī)取一組實(shí)際六音信號(hào)其emd分解結(jié)果如圖8所示,經(jīng)過(guò)頻譜比值法標(biāo)定后,其中真實(shí)分量樣本為920個(gè),另外796個(gè)為虛假分量樣本,表4給出了四種方法識(shí)別imf虛假分量的準(zhǔn)確率。表4.實(shí)際六音信號(hào)中emd虛假分量的識(shí)別識(shí)別方法能量增減法kl散度法相關(guān)系數(shù)法本文方法準(zhǔn)確率44.25%74.19%81.52%93.29%實(shí)驗(yàn)一以數(shù)學(xué)模型隨機(jī)生成的雙音信號(hào)為實(shí)驗(yàn)對(duì)象,實(shí)驗(yàn)結(jié)果表明:針對(duì)于雙音信號(hào),kl散度法、相關(guān)系數(shù)法以及本發(fā)明中提出的數(shù)學(xué)模型對(duì)比基于能量的方法具有明顯的優(yōu)勢(shì),識(shí)別率都比較高,而本發(fā)明中提出的數(shù)學(xué)模型對(duì)于imf虛假分量的識(shí)別率略高于相關(guān)系數(shù)法。實(shí)驗(yàn)二采用在打點(diǎn)機(jī)上利用運(yùn)動(dòng)傳感器采集到的實(shí)際雙音信號(hào)為實(shí)驗(yàn)對(duì)象,實(shí)際雙音信號(hào)測(cè)試中本文算法與kl散度和相關(guān)系數(shù)法相比并沒(méi)有明顯的優(yōu)勢(shì);而實(shí)驗(yàn)一理論雙音信號(hào)測(cè)試中kl散度法與相關(guān)系數(shù)法與本文算法存在一定的差距,原因在于實(shí)際雙音信號(hào)所包含的兩個(gè)主頻均存在2倍以上的大小關(guān)系,且兩個(gè)主頻的幅值相當(dāng),即信號(hào)通過(guò)emd分解能夠完全分離出兩個(gè)主頻,而理論的雙音測(cè)試樣本中包含存在頻譜混疊的樣本,導(dǎo)致kl散度法及相關(guān)系數(shù)方法的誤判增多。從實(shí)驗(yàn)三結(jié)果分析,當(dāng)信號(hào)的頻率成分增加時(shí),kl散度法和相關(guān)系數(shù)法的識(shí)別率明顯下降,原因在于隨著信號(hào)所包含的頻率成分的增加,emd分解過(guò)程產(chǎn)生頻譜混疊現(xiàn)象的情況增加,導(dǎo)致上述兩種方法的誤判也增加。實(shí)驗(yàn)四選取了開(kāi)源數(shù)據(jù)集選取uci數(shù)據(jù)集中的spokenarabicdigit信號(hào)(網(wǎng)絡(luò)鏈接:http://archive.ics.uci.edu/ml/datasets.html),從該六音信號(hào)所包含的6個(gè)主頻大小來(lái)看,emd過(guò)程無(wú)法完全分離出6個(gè)獨(dú)立的頻率成分,說(shuō)明信號(hào)中存在頻譜混疊現(xiàn)象;從表4的統(tǒng)計(jì)結(jié)果來(lái)看,本文算法較相關(guān)系數(shù)的方法高出接近12個(gè)百分點(diǎn),較kl散度法高出19個(gè)百分點(diǎn);由此可見(jiàn),對(duì)于多頻規(guī)則信號(hào),尤其是包含頻譜混疊的信號(hào),kl散度法和相關(guān)系數(shù)法誤判較多,而本文算法仍然具有較高的識(shí)別率。在不脫離本發(fā)明精神或必要特性的情況下,可以其它特定形式來(lái)體現(xiàn)本發(fā)明。應(yīng)將所述具體實(shí)施例各方面僅視為解說(shuō)性而非限制性。因此,本發(fā)明的范疇如隨附申請(qǐng)專利范圍所示而非如前述說(shuō)明所示。所有落在申請(qǐng)專利范圍的等效意義及范圍內(nèi)的變更應(yīng)視為落在申請(qǐng)專利范圍的范疇內(nèi)。當(dāng)前第1頁(yè)12