基于小波變換的多重分形維數(shù)端點(diǎn)檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其設(shè)及一種基于小波變換的多重分形維數(shù)端點(diǎn) 檢測(cè)方法。
【背景技術(shù)】
[0002] 語(yǔ)音識(shí)別技術(shù)作為21世紀(jì)科技的主要研究方向之一。實(shí)際生活中,語(yǔ)音信號(hào)往往 伴有噪聲或其它干擾,而語(yǔ)音處理系統(tǒng)的處理對(duì)象是有效的語(yǔ)音信號(hào),該就需要采用一定 技術(shù)從混雜信號(hào)中分割出有效的語(yǔ)音段。針對(duì)語(yǔ)音通信,找到有效語(yǔ)音的始末位置,并對(duì)其 有效語(yǔ)音進(jìn)行編碼、傳輸,可W很大程度節(jié)省系統(tǒng)資源;而對(duì)于語(yǔ)音識(shí)別,特別是大詞量的 連續(xù)語(yǔ)音識(shí)別,語(yǔ)音段和音節(jié)的分割對(duì)后續(xù)的識(shí)別過(guò)程非常有益?,F(xiàn)階段,國(guó)內(nèi)外的一些語(yǔ) 音識(shí)別系統(tǒng)中已經(jīng)應(yīng)用了不同端點(diǎn)檢測(cè)技術(shù),也有許多研究者對(duì)實(shí)際應(yīng)用中的端點(diǎn)檢測(cè)進(jìn) 行了研究。LULie等人提出基于時(shí)域特征參數(shù)檢測(cè)方法。該種算法基于W下原理;在信噪 比較高的情況下,噪聲和語(yǔ)音的區(qū)分點(diǎn)區(qū)域,由于信號(hào)帖的變化較劇烈,選取的參數(shù)是一個(gè) 小于1的正數(shù);而在噪聲區(qū)間或者語(yǔ)音區(qū)間,由于信號(hào)不同,帖間的能量較平穩(wěn),變化不大, 選取參數(shù)為0值。R油iner等人提出基于LPC歐氏距離測(cè)度的方法,其算法主要思路是:先 對(duì)該=種語(yǔ)音各自進(jìn)行訓(xùn)練,得到各自的頻域特性;然后利用LPC的測(cè)度和能量的非線(xiàn)性 組合來(lái)對(duì)該=種語(yǔ)音進(jìn)行檢測(cè)。
[0003] 但是,現(xiàn)有解決方案存在如下一些問(wèn)題;在低信噪比的情況下,一些端點(diǎn)檢測(cè)算 法的效果就會(huì)顯著失效。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明要解決的技術(shù)問(wèn)題在于針對(duì)現(xiàn)有技術(shù)中的缺陷,提供一種基于小波變換的 多重分形維數(shù)端點(diǎn)檢測(cè)方法。
[0005] 本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是;基于小波變換的多重分形維數(shù)端點(diǎn) 檢測(cè)方法,包括W下步驟:
[0006] 1)使用小波變換對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理,得到小波重構(gòu)去噪后的語(yǔ)音信號(hào);
[0007] 2)對(duì)小波重構(gòu)之后的語(yǔ)音信號(hào)進(jìn)行分帖處理;
[0008] 3)計(jì)算語(yǔ)音信號(hào)的多重分形維數(shù),得到每一個(gè)帖窗口的多重分形維數(shù);
[000引4)分別計(jì)算每一個(gè)帖窗口的多重分形維數(shù)巧與和Of的相關(guān)性,記語(yǔ)音段的 相關(guān)性函數(shù)為R保,X),非語(yǔ)音段的相關(guān)性函數(shù)為R0(2,x);其中巧表示語(yǔ)音段的多重分 形維數(shù),取值為=[1'7159,1'2387,1,6734; 表示非語(yǔ)音段的多重分形維數(shù),取值為 =[1.5139,1.7324,1.1734. ' 9
[0010]W繪制兩個(gè)相關(guān)性函數(shù)R〇(i,x)和R〇(2,x)的曲線(xiàn)圖,兩曲線(xiàn)的交匯處即為語(yǔ)音 信號(hào)的起始點(diǎn)和結(jié)束點(diǎn)。
[0011] 按上述方案,所述步驟1)中小波重構(gòu)語(yǔ)音信號(hào),選擇合適的闊值T,大于尺度T的 噪音和語(yǔ)音信號(hào)被平滑處理。
[0012] 按上述方案,所述步驟1)中闊值T的選取過(guò)程如下,在給定一個(gè)初始值之后,根據(jù) 對(duì)重構(gòu)之后的信號(hào)與噪音進(jìn)行相關(guān)性分析自適應(yīng)調(diào)整闊值T的大小。
[0013] 按上述方案,所述步驟3)中語(yǔ)音信號(hào)多重分形維數(shù)的計(jì)算方法如下:
[0014] (3. 1)對(duì)不同語(yǔ)音信號(hào)X(t)進(jìn)行數(shù)據(jù)采集,設(shè)采樣點(diǎn)數(shù)為M,采樣頻率為f,則采樣 間隔心=j:,采樣信號(hào)表示為X化),k= 1,2,3…M;
[0015] (3.2)對(duì)分形維數(shù)集合進(jìn)行網(wǎng)格劃分,在e網(wǎng)格劃分中,取網(wǎng)格寬度為Ej= 2jAt,其中j為網(wǎng)格劃分的種類(lèi)數(shù);則網(wǎng)格的行數(shù)和列數(shù)可W表示為s(j) =MAt/ej.; [001引定義m行n列的網(wǎng)格為皿網(wǎng)格,落入皿網(wǎng)格內(nèi)的數(shù)據(jù)點(diǎn)數(shù)為Nm。, 則皿網(wǎng)格覆蓋信號(hào)的概率為Pm"(ej.) =Nm"/M,結(jié)合General信息滴可得到:
【主權(quán)項(xiàng)】
1. 一種基于小波變換的多重分形維數(shù)端點(diǎn)檢測(cè)方法,包括以下步驟: 1) 使用小波變換對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理,得到小波重構(gòu)去噪后的語(yǔ)音信號(hào); 2) 對(duì)小波重構(gòu)之后的語(yǔ)音信號(hào)進(jìn)行分幀處理; 3) 計(jì)算語(yǔ)音信號(hào)的多重分形維數(shù),得到每一個(gè)幀窗口的多重分形維數(shù); 4) 分別計(jì)算每一個(gè)幀窗口的多重分形維數(shù)£>丨與Af1和Af2的相關(guān)性,記語(yǔ)音段的相關(guān) 性函數(shù)為R(X 1J),非語(yǔ)音段的相關(guān)性函數(shù)為R(X2,x);其中Of1表示語(yǔ)音段X1的多重分形 維數(shù);表示非語(yǔ)音段X2的多重分形維數(shù); 5) 繪制兩個(gè)相關(guān)性函數(shù)R(Ax)和R(X2,x)的曲線(xiàn)圖,兩曲線(xiàn)的交匯處即為語(yǔ)音信號(hào) 的起始點(diǎn)和結(jié)束點(diǎn)。
2. 根據(jù)權(quán)利要求1所述的端點(diǎn)檢測(cè)方法,其特征在于,所述步驟1)中小波重構(gòu)語(yǔ)音信 號(hào),選擇合適的閾值T,大于尺度T的噪音和語(yǔ)音信號(hào)被平滑處理。
3. 根據(jù)權(quán)利要求2所述的端點(diǎn)檢測(cè)方法,其特征在于,所述步驟1)中閾值T的選取過(guò) 程如下,在給定一個(gè)初始值之后,根據(jù)對(duì)重構(gòu)之后的信號(hào)與噪音進(jìn)行相關(guān)性分析自適應(yīng)調(diào) 整閾值T的大小。
4. 根據(jù)權(quán)利要求1所述的端點(diǎn)檢測(cè)方法,其特征在于,所述步驟3)中語(yǔ)音信號(hào)多重分 形維數(shù)的計(jì)算方法如下: (3. 1)對(duì)不同語(yǔ)音信號(hào)X(t)進(jìn)行數(shù)據(jù)采集,設(shè)采樣點(diǎn)數(shù)為M,采樣頻率為f,則采樣間隔
,采樣信號(hào)表示為X (k),k = 1,2, 3…M ; (3. 2)將語(yǔ)音信號(hào)的分形維數(shù)視為一個(gè)集合空間,采用覆蓋法,對(duì)其進(jìn)行網(wǎng)格劃分,在 ε網(wǎng)格劃分中,取網(wǎng)格寬度為%_= 2jAt,其中j為網(wǎng)格劃分的種類(lèi)數(shù);則網(wǎng)格的行數(shù)和 列數(shù)可以表示為s(j) =MAt/e j; 定義m行η列的網(wǎng)格為mn網(wǎng)格,落入mn網(wǎng)格內(nèi)的數(shù)據(jù)點(diǎn)數(shù)為Nnm,則mn網(wǎng)格覆蓋信號(hào)
的概率為Pmn( ε』)=Nmn/M,結(jié)合General信息j:商可得到: 其中q為給定參數(shù),Kq為General信息j:商值; (3. 3)改變網(wǎng)格尺度ε大小,可計(jì)算出一系列的General信息熵Kq(M)值,從而在 Ig ε」-Κ,( ε P圖上得到無(wú)標(biāo)度區(qū)范圍,在該區(qū)間內(nèi)進(jìn)行一次曲線(xiàn)擬合則可獲得廣義維度值 Dq; (3. 4)在無(wú)標(biāo)度區(qū)區(qū)間內(nèi)進(jìn)行一次曲線(xiàn)擬合則可獲得廣義維度值Dq; 設(shè)X(j) = Kq( ε j),y(j) = Ig ε j,擬合直線(xiàn)為y(j) = -Dqx(j)+b ;建立最小二乘法擬 合函數(shù)為
,使得擬合函數(shù)獲得最小值的條件為:
5. 根據(jù)權(quán)利要求1所述的端點(diǎn)檢測(cè)方法,其特征在于,所述步驟4)中相關(guān)性的計(jì)算公 式為:
其中4表示第i個(gè)幀窗口所對(duì)應(yīng)的多重分形維數(shù),X為語(yǔ)音信號(hào)的狀態(tài)空間{X\X2} 中某一種狀態(tài)。
6. 根據(jù)權(quán)利要求1所述的端點(diǎn)檢測(cè)方法,其特征在于,語(yǔ)音段的多重分形維數(shù)和非語(yǔ) 音段的多重分形維數(shù)通過(guò)訓(xùn)練獲得,具體過(guò)程如下: (4. 1)語(yǔ)音信號(hào)具有分形特性,將非純凈的語(yǔ)音信號(hào)定義在兩個(gè)狀態(tài)空間:語(yǔ)音段X1 和非語(yǔ)音段X2,則有Z = (X1, X2}。 (4. 2)對(duì)不同語(yǔ)音信號(hào)X(t)進(jìn)行數(shù)據(jù)采集,設(shè)采樣點(diǎn)數(shù)為M,采樣頻率為f,則采樣間隔
采樣信號(hào)表示為X (k),k = 1,2, 3…M ; (4. 3)人為標(biāo)記語(yǔ)音信號(hào)的語(yǔ)音段和非語(yǔ)音段,得到語(yǔ)音段樣本空間Y1和非語(yǔ)音段樣 本空間Y2。 (4. 4)依據(jù)步驟3. 2)至3. 4)所述多重分形維數(shù)的計(jì)算方法,得到樣本空間YJP Y 2的
多重分形維數(shù)集合 ,」.3 3 其中N和M分別表示語(yǔ) 音段和非語(yǔ)音段的樣本數(shù); (4. 5)語(yǔ)音段的多重分形維數(shù)和非語(yǔ)音段的多重分形維數(shù)可近似表示為:
7. 根據(jù)權(quán)利要求6所述的端點(diǎn)檢測(cè)方法,其特征在于,D表示語(yǔ)音段的多重分形 維數(shù),取值為.,,.
I A,''-表示非語(yǔ)音段的多重分形維數(shù),取值為
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于小波變換的多重分形維數(shù)端點(diǎn)檢測(cè)方法,該方法包括以下步驟:使用小波變換對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理,得到小波重構(gòu)去噪后的語(yǔ)音信號(hào);對(duì)小波重構(gòu)之后的語(yǔ)音信號(hào)進(jìn)行分幀處理;計(jì)算語(yǔ)音信號(hào)的多重分形維數(shù),得到每一個(gè)幀窗口的多重分形維數(shù);分別計(jì)算每一個(gè)幀窗口的多重分形維數(shù)與語(yǔ)音段的多重分形維數(shù)和非語(yǔ)音段的多重分形維數(shù)的相關(guān)性;繪制兩個(gè)相關(guān)性函數(shù)的曲線(xiàn)圖,兩曲線(xiàn)的交匯處即為語(yǔ)音信號(hào)的起始點(diǎn)和結(jié)束點(diǎn)。本發(fā)明方法能在低信噪比的情況下有效進(jìn)行語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)。
【IPC分類(lèi)】G10L15-05
【公開(kāi)號(hào)】CN104867493
【申請(qǐng)?zhí)枴緾N201510169332
【發(fā)明人】羅斌, 趙彤洲
【申請(qǐng)人】武漢工程大學(xué)
【公開(kāi)日】2015年8月26日
【申請(qǐng)日】2015年4月10日