欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語(yǔ)音信號(hào)處理方法及裝置的制作方法

文檔序號(hào):2832074閱讀:312來(lái)源:國(guó)知局

專利名稱::一種語(yǔ)音信號(hào)處理方法及裝置的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及語(yǔ)音識(shí)別
技術(shù)領(lǐng)域
,特別是涉及一種語(yǔ)音信號(hào)處理方法及裝置。
背景技術(shù)
:語(yǔ)音識(shí)別技術(shù)經(jīng)過(guò)全球半個(gè)多世紀(jì)的研究,目前已經(jīng)開始逐步進(jìn)入實(shí)用階段。近年來(lái)語(yǔ)音芯片應(yīng)用越來(lái)越廣泛,主要包括電話通信中的語(yǔ)音撥號(hào),語(yǔ)音身份認(rèn)證,語(yǔ)音輸入,汽車的語(yǔ)音控制,工業(yè)控制及醫(yī)療領(lǐng)域,個(gè)人數(shù)字助理(PersonalDigitalAssistant,PDA)的語(yǔ)音交互界面,智能玩具,家電遙控,等等。語(yǔ)音識(shí)別過(guò)程主要包括語(yǔ)音信號(hào)的預(yù)處理、語(yǔ)音識(shí)別特征提取、根據(jù)提取出的語(yǔ)音識(shí)別特征進(jìn)行模式匹配幾個(gè)部分。其中,語(yǔ)音信號(hào)識(shí)別最重要的一環(huán)就是語(yǔ)音識(shí)別特征的提取,提取的特征參數(shù)必須滿足以下要求(l)提取的特征參數(shù)能有效地代表語(yǔ)音特征,具有很好的區(qū)分性;(2)各階參數(shù)之間有良好的獨(dú)立性;(3)特征參數(shù)要計(jì)算方便,最好有高效的算法,以保證語(yǔ)音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。但是,在目前的語(yǔ)音識(shí)別系統(tǒng)中,由于傳輸語(yǔ)音信號(hào)的傳輸信道的影響,導(dǎo)致語(yǔ)音信號(hào)的特性發(fā)生了一定的變化,導(dǎo)致識(shí)別性能的下降。并且,這種問(wèn)題對(duì)于不同的傳輸信道有不同程度的體現(xiàn)。因此,為了抑制或者抵消傳輸信道引入的信號(hào)畸變,需要采取措施消除信道干擾。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種語(yǔ)音信號(hào)處理方法及裝置,以解決語(yǔ)音信號(hào)的信道干擾問(wèn)題。為了解決上述問(wèn)題,本發(fā)明公開了一種語(yǔ)音信號(hào)處理方法,包括在對(duì)數(shù)倒譜域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒譜系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值;將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去所述傳輸信道對(duì)數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜;所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。其中,所述根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值,具體包括計(jì)算E[Tc(K);hE[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對(duì)數(shù)倒譜,Sc(K)表示觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值;當(dāng)傳輸信道上存在語(yǔ)音信號(hào)時(shí),對(duì)上述公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranC印(K)j二TranC印(K)w(1-q)+(Sc(K)-RefC印(K))q;其中,TranCep(K)表示傳輸信道對(duì)數(shù)倒譜的估計(jì)值,j為幀序號(hào),^為平滑因子。優(yōu)選的,所述方法還包括當(dāng)傳輸信道上不存在語(yǔ)音信號(hào)時(shí),對(duì)上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranCep(K)j二TranC6p(K)H(l-《)+Sc(K)《;其中,^與"2的取值不同。優(yōu)選的,所述方法還包括利用觀測(cè)到的語(yǔ)音信號(hào)的信噪比,將利用A和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)j4ranC印00^(1—%)+(Sc(K)-RefC印(K))^+Sc(K)爲(wèi);其中,A+A="3,A和A根據(jù)所述信噪比確定。優(yōu)選的,所述方法還包括根據(jù)公式1^106(^+1=1^忙6(^(1-力+^<《)^利用當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K),更新未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中^為一個(gè)小量,且/<"。本發(fā)明還4是供了一種語(yǔ)音信號(hào)處理裝置,包括倒譜系數(shù)提取單元,用于在對(duì)數(shù)倒譜域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒譜系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;信道對(duì)數(shù)倒譜估算單元,用于根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值;干擾分離單元,用于將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去所述傳輸信道對(duì)數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜;所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)凄t倒譜即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。其中,所述信道對(duì)數(shù)倒譜估算單元包括均值計(jì)算子單元,用于計(jì)算E[Tc(K)]-E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對(duì)數(shù)倒譜,Sc(K)表示觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值;第一估算子單元,用于當(dāng)傳輸信道上存在語(yǔ)音信號(hào)時(shí),對(duì)上述公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranC印(K),TranC印(K)」—i)+(Sc(K)-RefC印(K))《;其中,TranCep(K)表示傳輸信道對(duì)數(shù)倒鐠的估計(jì)值,j為幀序號(hào),cd為平滑因子。優(yōu)選的,所述信道對(duì)數(shù)倒譜估算單元還包括第二估算子單元,用于當(dāng)傳輸信道上不存在語(yǔ)音信號(hào)時(shí),對(duì)上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranCep(K)j二TranCepOOH(1-c^)+Sc(K)《;其中,",與"2的取值不同。優(yōu)選的,所述信道對(duì)數(shù)倒譜估算單元還包括綜合估算子單元,用于利用觀測(cè)到的語(yǔ)音信號(hào)的信噪比,將利用%和"2計(jì)算TranC印(K)的兩個(gè)公式綜合如下TranC印(K),TranC印00^(1—^)+(Sc(K)—RefC印(K))^+Sc(K)爲(wèi);其中,A+A=or3,A和A根據(jù)所述信噪比確定。優(yōu)選的,所述裝置還包括更新單元,用于根據(jù)公式RefCep(K)j+廣RefCep(K)j(l-力+Zc(幻y,利用當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K),更新未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中7為一個(gè)小量,且^<"。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)首先,本發(fā)明在提取語(yǔ)音識(shí)別特征的過(guò)程中,將M^測(cè)到的語(yǔ)音信號(hào)轉(zhuǎn)換為對(duì)數(shù)倒譜,并通過(guò)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,來(lái)估算傳輸信道的對(duì)數(shù)倒鐠;然后,將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去傳輸信道對(duì)數(shù)倒譜的估計(jì)值,從而在倒譜域,將語(yǔ)音信號(hào)與傳輸信道的干擾分離開來(lái),提取出未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜。這種方法可以消除傳輸信道對(duì)語(yǔ)音信號(hào)的干擾,提高語(yǔ)音識(shí)別特征提取過(guò)程中抗傳輸信道干擾的能力,從而提高識(shí)別率。而且,在估算傳輸信道的對(duì)數(shù)倒譜的過(guò)程中,采用低通濾波的方法,利用當(dāng)前幀以及前幾幀的信號(hào)就能計(jì)算出近似的均值,因此能夠滿足語(yǔ)音識(shí)別特征實(shí)時(shí)提取的需求。其次,本發(fā)明提供的傳輸信道對(duì)數(shù)倒譜的估算方法,能夠?qū)φZ(yǔ)音段(即傳輸信道上存在語(yǔ)音信號(hào)的情況)和非語(yǔ)音段(即傳輸信道上不存在語(yǔ)音信號(hào)的情況)進(jìn)行不同處理,即分別采用不同的估算公式,從而更精確地估算出非語(yǔ)音段的傳輸信道對(duì)數(shù)倒譜,進(jìn)一步提高抗信道干擾的能力。再次,本發(fā)明根據(jù)實(shí)際說(shuō)話人的特點(diǎn),每幀語(yǔ)音信號(hào)的計(jì)算過(guò)程中都利用當(dāng)前計(jì)算得出的未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜,來(lái)更新未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒語(yǔ)的統(tǒng)計(jì)均值(初始值是一個(gè)常量),從而使所述統(tǒng)計(jì)均值更接近說(shuō)話人的個(gè)性特征。圖1是本發(fā)明實(shí)施例一所述一種語(yǔ)音信號(hào)處理方法流程圖2是本發(fā)明實(shí)施例所述語(yǔ)音識(shí)別特征4是取的流程圖3是本發(fā)明裝置實(shí)施例所述一種語(yǔ)音信號(hào)處理裝置結(jié)構(gòu)圖4是本發(fā)明圖3中信道對(duì)數(shù)倒譜估算單元U32的結(jié)構(gòu)圖5是本發(fā)明圖3中信道對(duì)數(shù)倒譜估算單元U32的另一結(jié)構(gòu)圖6是本發(fā)明另一裝置實(shí)施例所述一種語(yǔ)音信號(hào)處理裝置結(jié)構(gòu)圖。具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。本發(fā)明提供了一種語(yǔ)音信號(hào)處理方法,該方法適用于一般的信道傳輸情況,一般的信道滿足信道屬于巻積信道;信道特性比較穩(wěn)定,變化緩慢;語(yǔ)音信號(hào)的倒鐠特征從長(zhǎng)期統(tǒng)計(jì)來(lái)看,趨于常量。因此,對(duì)于一般的信道傳輸,有如下關(guān)系假設(shè)未經(jīng)信道的語(yǔ)音信號(hào)(即理想情況下的均衡信道的語(yǔ)音信號(hào))為x(n):傳輸信道為t(n),則根據(jù)巻積信道的性質(zhì),觀測(cè)到的語(yǔ)音信號(hào)s(n)為s(n)=x(n)*t(n)(中間符號(hào)為巻積)(1.1)上述公式(1.1)在頻域有S(i),T(i)上述公式(1.1)在對(duì)數(shù)倒譜域有Sc(K)=Xc(K)+Tc(K)(1.2)即在對(duì)數(shù)倒譜域,觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜Sc(K)等于未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K)加上傳輸信道的對(duì)數(shù)倒譜Tc(K)。其中,K是倒譜參數(shù)。本發(fā)明正是利用公式(1.2),在倒譜域上,通過(guò)對(duì)觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行處理,將語(yǔ)音信號(hào)與傳輸信道的千擾分離開來(lái),從而消除傳輸信道對(duì)語(yǔ)音信號(hào)的干擾,提取出未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒語(yǔ),即提取出語(yǔ)音信號(hào)的均衡倒譜特征。本發(fā)明所述消除信道干擾的實(shí)現(xiàn)原理如下根據(jù)公式(1.2),得到未經(jīng)信道的語(yǔ)音信號(hào)或者均衡的語(yǔ)音信號(hào)在對(duì)數(shù)倒譜域?yàn)閄c(K)=Sc(K)-Tc(K)(1.3)其中,Sc(K)可以根據(jù)觀測(cè)信號(hào)計(jì)算得出。因此,提取Xc(K)的關(guān)鍵是估計(jì)傳輸信道的對(duì)數(shù)倒譜Tc(K)。下面將通過(guò)實(shí)施例詳細(xì)說(shuō)明消除信道干擾的方法。實(shí)施例一參照?qǐng)D1,是實(shí)施例所述一種語(yǔ)音信號(hào)處理方法流程圖。S101,在對(duì)數(shù)倒i普域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒譜系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜Sc(K);倒語(yǔ)系數(shù)提取是語(yǔ)音識(shí)別處理過(guò)程中的一個(gè)常用步驟,而梅爾倒頻譜系數(shù)(Mel-scaleFrequencyCepstralCoefficients,簡(jiǎn)稱MFCC)在語(yǔ)音識(shí)別中是常用的特征參數(shù)之一。MFCC模擬了人耳的聽覺(jué)特性,能夠反映人對(duì)語(yǔ)音的感知特性,從說(shuō)話人的語(yǔ)音信號(hào)中提取出說(shuō)話人的個(gè)性特征,在語(yǔ)音識(shí)別實(shí)際應(yīng)用中取得了較高的識(shí)別率。本實(shí)施例可采用標(biāo)準(zhǔn)的MFCC系數(shù)提取算法,該算法首先用FFT(FastFourierTransform,快速傅里葉變換)將時(shí)域信號(hào)轉(zhuǎn)化成頻域,之后對(duì)其對(duì)數(shù)能量譜用依照Mel刻度分布的三角濾波器組進(jìn)行巻積,最后對(duì)各個(gè)濾波器的輸出構(gòu)成的向量進(jìn)行離散余弦變換(DCT變換),取前N個(gè)系數(shù)。由于該算法屬于公知內(nèi)容,因此在此不再詳述。S102,根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒語(yǔ)的估計(jì)值;本步驟即估算傳輸信道的對(duì)數(shù)倒譜Tc(K),本實(shí)施例釆用的估算方法如下第一步,利用公式(1.3)計(jì)算傳輸信道對(duì)數(shù)倒譜Tc(K)的統(tǒng)計(jì)均值E[Tc(K)],具體為用E[X]表示計(jì)算X的統(tǒng)計(jì)均值,X可以表示公式中的Xc(K)、Sc(K)、Tc(K);根據(jù)公式(1.3),有E[Xc(K)]=E[Sc(K)]-E[Tc(K)]即E[Tc(K)]=E[Sc(K)]-E[Xc(K)]=E[Sc(K)]-RefCep(K)=E[Sc(K)-RefCep(K)](1.4)其中,RefCep(K)表示未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,即E[Xc(K)]=RefCep(K)。所述RefCep(K)是預(yù)先根據(jù)在均衡-信道下(理想情況)的語(yǔ)音信號(hào)對(duì)數(shù)倒譜特征矢量經(jīng)過(guò)長(zhǎng)期統(tǒng)計(jì)得到,K-l一N,N—般取12。由于RefCep(K)為一常量,所以對(duì)RefCep(K)取均值仍為一常量,即E[RefCep(K)]=RefCep(K)。第二步,釆用^^通濾波的方法來(lái)近似所述均值E[Tc(K)],得到傳輸信道對(duì)數(shù)倒語(yǔ)的估計(jì)值;在公式(1.4)中,由于E[Sc(K)-RefCep(K)]需要長(zhǎng)期數(shù)據(jù)統(tǒng)計(jì)得到,才能進(jìn)一步得出E[Tc(K)],所以本實(shí)施例通過(guò)求近似值的方法來(lái)估計(jì)E[Tc(K)]的值。為了滿足實(shí)時(shí)的需求,針對(duì)公式(1.4),本實(shí)施例采用低通濾波的方法來(lái)近似E[X]。所述低通濾波是指容許低頻信號(hào)通過(guò),但減弱(或減少)頻率高于截止頻率的信號(hào)的通過(guò),即去掉高頻干擾,從而降低采樣頻率,避免頻率混淆。低通濾波的方法有多種,在此不作限定。本實(shí)施例采用的是一階IIR(無(wú)限長(zhǎng)沖激響應(yīng))低通濾波,得到TranC印(K)j二TranC印(K)w(1-q)+(Sc(K)-RefC印(K))q(1.5)其中,TranCep(K)表示傳輸信道對(duì)數(shù)倒譜的估計(jì)值,j為幀序號(hào),%為平滑因子。上述公式(1.5)的物理含義是濾出MFCC系數(shù)變化緩慢的部分,逼近均值,因此可以利用公式(1,5)的計(jì)算結(jié)果TranC印(K)來(lái)近似均值E[Tc(K)]。由公式(1.5)可知,本實(shí)施例利用當(dāng)前幀以及前一幀的信號(hào),就能計(jì)算出近似的傳輸信道對(duì)數(shù)倒譜的均值,并將該近似均值作為Tc(K)的估計(jì)值,因此能夠滿足語(yǔ)音識(shí)別特征實(shí)時(shí)提取的需求。S103,將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒語(yǔ)Sc(K)減去所述傳輸信道對(duì)數(shù)倒譜的估計(jì)值TmnCep(K),得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K);所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K)即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。上述SIOI計(jì)算出了Sc(K),S102計(jì)算出了Tc(K)的估計(jì)值,根據(jù)公式(1.3),即可得到Xc(K)。當(dāng)語(yǔ)音信號(hào)經(jīng)過(guò)信道傳輸時(shí),消除信道干擾后的語(yǔ)音信號(hào)對(duì)數(shù)倒i普即為Xc(K)。綜上所迷,^是取未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K)的計(jì)算方法總結(jié)如下Xc(K)=Sc(K)-TranC印(K)(1.6)TraiC印0Oj二TranC印0Owa—c^+(Sc00—RefC印(K))《(1,5)其中,TranCep(K)初值為0,RefCep(K)通過(guò)預(yù)先統(tǒng)計(jì)得出。上述方法可以消除傳輸信道對(duì)語(yǔ)音信號(hào)的干擾,提高語(yǔ)音識(shí)別特征提取過(guò)程中抗傳輸信道干擾的能力,從而提高識(shí)別率。實(shí)施例二上述實(shí)施例一的方法只考慮了傳輸信道上存在語(yǔ)音信號(hào)的情況(即語(yǔ)音段),但對(duì)于傳輸信道上不存在語(yǔ)音信號(hào)的情況(即非語(yǔ)音段),則傳輸信道對(duì)數(shù)倒譜的估算方法不能采用公式(1.5),而應(yīng)該采用下述公式TranCep(K)j;TranCep(K)H(H^)+Sc(K)%(1.7)其中,TranC印(K)表示傳輸信道對(duì)數(shù)倒譜的估計(jì)值,j為幀序號(hào),"2也為平滑因子,但與A的取值不同。在現(xiàn)有技術(shù)中,很多去信道干擾的方法都沒(méi)有考慮非語(yǔ)音段的處理,例如頻域基于LMS(LeastMeanSquare,最小均方)的盲均衡方法和倒譜域基于LMS的盲均衡方法,這兩種方法都是一種盲均衡方法,通過(guò)LMS算法,最小化觀測(cè)語(yǔ)音特征與參考語(yǔ)音特征的誤差,從而得到收斂的均衡語(yǔ)音特征參數(shù)。所述第一種方法在頻譜域,第二種方法在倒譜域,而在倒譜域做基于LMS的盲均衡可以使得計(jì)算量更小,收斂效果更好。但是在非語(yǔ)音段,盲均衡算法可能會(huì)帶來(lái)錯(cuò)誤的收斂,從而影響語(yǔ)音識(shí)別特征的提取。針對(duì)此問(wèn)題,本實(shí)施例能夠?qū)φZ(yǔ)音段和非語(yǔ)音段進(jìn)行不同處理,即分別采用不同的傳輸信道對(duì)數(shù)倒譜的估算公式,從而更精確地估算出非語(yǔ)音段的傳輸信道對(duì)數(shù)倒i普,進(jìn)一步提高抗信道干擾的能力。優(yōu)選的,本實(shí)施例還可以利用觀測(cè)到的語(yǔ)音信號(hào)的信噪比(SNR),將利用^和"2計(jì)算TranCep(K)的兩個(gè)公式(1.5)和(1.7)綜合如下<formula>formulaseeoriginaldocumentpage12</formula>其中,"3也為平滑因子,A與A、"2的關(guān)系是在語(yǔ)音段,"3即為"1;在非語(yǔ)音段,"3即為"2。A+A="3,A和A根據(jù)信噪比確定。信噪比指信號(hào)中原有部分和由于設(shè)備自身、環(huán)境干擾等原因造成的噪聲的比例,通常以"SNR,,或"S/N"表示,一般用分貝(dB)為單位,信噪比越高越好。A和A滿足當(dāng)SNR高時(shí),A〉>A;當(dāng)SNR低時(shí),AA,詳見下表:<table>tableseeoriginaldocumentpage13</column></row><table>表1綜上所述,未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K)的計(jì)算方法為Xc(K)=Sc(K)-TranCep(K)(1.6)TranC印(K)^TranC印(K)j—,(1-+(Sc(K)-RefC印(K))^+Sc(K)"2(1.8)根據(jù)表1,如果SNR>=0dB,則"3=%,否則"3="2。即SNR為OdB是語(yǔ)音段和非語(yǔ)音段的臨界點(diǎn)。實(shí)施例三在上述計(jì)算過(guò)程中,未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K),是通過(guò)預(yù)先統(tǒng)計(jì)得出的一個(gè)常量,僅表示一個(gè)普遍適用的均值。本實(shí)施例為了使該值更接近每個(gè)說(shuō)話人的個(gè)性特征,根據(jù)實(shí)際說(shuō)話人的特點(diǎn),在每幀語(yǔ)音信號(hào)的計(jì)算過(guò)程中都利用當(dāng)前計(jì)算得出的未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K)來(lái)更新RefCep(K),具體如下'.RefCep(K)j^RefCep(K)j(l-;r)+Xc,(1.9)其中^為一個(gè)小量,且"<"。即針對(duì)每個(gè)說(shuō)話人的語(yǔ)音信號(hào),RefCep(K)初始值為統(tǒng)計(jì)得出的常量,在計(jì)算完當(dāng)前幀的Xc(K)后,根據(jù)公式(1.9)利用該Xc(K)更新RefCep(K),所述更新后的RefCep(K)用于下一幀的計(jì)算。這樣,i兌話人不同,更新得到的RefCep(K)也不同,RefCep(K)更接近說(shuō)話人的個(gè)性特征,可以提高語(yǔ)音識(shí)別率。在實(shí)際應(yīng)用中,為了達(dá)到更好的效果,可以在傳輸信道對(duì)數(shù)倒i普的估計(jì)值TranCep(K)收斂的時(shí)候,并且信噪比SNR較高的情況下進(jìn)行更新?;谏鲜鋈齻€(gè)實(shí)施例的說(shuō)明,利用本發(fā)明提取語(yǔ)音識(shí)別特征的方法如圖2所示。5201,對(duì)觀測(cè)到的語(yǔ)音信號(hào)s(n)進(jìn)行語(yǔ)音增強(qiáng)處理,得到增強(qiáng)后的語(yǔ)音信號(hào)s,(n);本步驟是預(yù)處理步驟。語(yǔ)音增強(qiáng)的目的是從有噪聲的語(yǔ)音信號(hào)中提取盡可能純凈的原始語(yǔ)音,目前常用的增強(qiáng)算法^f艮多,如減i普法或維納濾波算法等,本實(shí)施例不作詳細(xì)說(shuō)明。5202,對(duì)增強(qiáng)后的語(yǔ)音信號(hào)s,(n)進(jìn)行MFCC系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒語(yǔ)Sc(K);S203,利用長(zhǎng)期語(yǔ)音對(duì)數(shù)倒譜特征均值RefCep(K)以及觀測(cè)信號(hào)的信噪比,消除信道干擾,得到語(yǔ)音均衡倒譜特征。所述RefCep(K)即指上文的未經(jīng)信道的語(yǔ)音信號(hào)對(duì)lt倒譜的統(tǒng)計(jì)均值,所述語(yǔ)音均衡倒語(yǔ)特征即為提取出的語(yǔ)音識(shí)別特征,該語(yǔ)音識(shí)別特征用于后續(xù)的模式匹配識(shí)別過(guò)程?;谝陨蟽?nèi)容,為了說(shuō)明本發(fā)明所述消除信道干擾方法的性能,下面通過(guò)測(cè)試?yán)舆M(jìn)行對(duì)比說(shuō)明。該測(cè)試?yán)捎肏TK工具包作為語(yǔ)音識(shí)別的工具,采用標(biāo)準(zhǔn)的MFCC系數(shù)及其一階二階導(dǎo)數(shù)作為特征參數(shù)。測(cè)試序列分為三組A、B、C,每組50個(gè)數(shù)字串,每個(gè)數(shù)字串包含8個(gè)數(shù)字,即每組測(cè)試序列包含400個(gè)數(shù)字。A為與訓(xùn)練數(shù)據(jù)相同信道下采集的一組數(shù)據(jù),B為與訓(xùn)練數(shù)據(jù)不同信道信噪比較高下采集的一組數(shù)據(jù),C為與訓(xùn)練數(shù)據(jù)不同信道信噪比較低下采集的一組數(shù)據(jù)。測(cè)試的情況為以下5種1、不應(yīng)用去信道干擾方法;2、采用現(xiàn)有的LMS盲均衡算法;3、采用本發(fā)明的(1.5)、(1.6)式構(gòu)成的實(shí)例;4、采用本發(fā)明的(1.6)、(1.8)式構(gòu)成的實(shí)例;5、采用本發(fā)明的(1.9)式構(gòu)成的實(shí)例;才艮據(jù)上面的5種情況,分別進(jìn)行A、B、C三組序列的語(yǔ)音識(shí)別測(cè)試。識(shí)別結(jié)果如下表所示(注錯(cuò)誤率減小是相對(duì)測(cè)試1為基準(zhǔn))<table>tableseeoriginaldocumentpage15</column></row><table>表2從表中數(shù)據(jù)可見,本發(fā)明提供的去信道干擾方法,對(duì)與訓(xùn)練數(shù)據(jù)不同信道下采集的測(cè)試序列有較好的改進(jìn)作用。并且,本發(fā)明所述的方法與現(xiàn)有方法相比,錯(cuò)誤率進(jìn)一步減小。針對(duì)上述實(shí)施例的說(shuō)明,本發(fā)明還提供了相應(yīng)的裝置實(shí)施例。參照?qǐng)D3,是實(shí)施例所述一種語(yǔ)音信號(hào)處理裝置結(jié)構(gòu)圖。所述裝置主要包括倒語(yǔ)系數(shù)提取單元U31,用于在對(duì)數(shù)倒譜域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒i普系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;信道對(duì)凄t倒譜估算單元U32,用于根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值;干擾分離單元U33,用于將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去所述傳輸信道對(duì)數(shù)倒鐠的估計(jì)值,得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒語(yǔ);所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。其中,參照?qǐng)D4,所述信道對(duì)數(shù)倒譜估算單元U32可以進(jìn)一步包括均值計(jì)算子單元U321,用于計(jì)算E[Tc(K)]=E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對(duì)數(shù)倒譜,Sc(K)表示觀測(cè)語(yǔ)音的對(duì)數(shù)倒i普;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值;第一估算子單元U322,用于當(dāng)傳輸信道上存在語(yǔ)音信號(hào)時(shí),對(duì)上述公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranC印(K)^TranC印(K)h"-^)+(Sc(K)-RefC印(K))《;其中,TranCep(K)表示傳輸信道對(duì)數(shù)倒譜的估計(jì)值,j為幀序號(hào),cd為平滑因子。優(yōu)選的,參照?qǐng)D5,所述信道對(duì)數(shù)倒譜估算單元U32還可以包括第二估算子單元U323,用于當(dāng)傳輸信道上不存在語(yǔ)音信號(hào)時(shí),對(duì)上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranCepOOj二TranC6p(K)j—認(rèn)l一《)+Sc(K)《;其中,"!與"2的取值不同。優(yōu)選的,所述信道對(duì)數(shù)倒譜估算單元U32還可以包括綜合估算子單元,用于利用觀測(cè)到的語(yǔ)音信號(hào)的信噪比,將利用%和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)j二TranC印00^^-^)+(Sc(K)-RefC印(K)+Sc(K)/2;其中,A+A="3,^和A根據(jù)所述信噪比確定。優(yōu)選的,參照?qǐng)D6,所述裝置還可以包括更新單元U34,用于根據(jù)公式RefCep(K)j+嚴(yán)RefC:ep(K)j(l-力+Xc(iQ^利用當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K),更新未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中7為一個(gè)小量,且"<"。本說(shuō)明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較筒單,相關(guān)之處參見方法實(shí)施例的部分說(shuō)明即可。以上對(duì)本發(fā)明所提供的一種消除傳輸信道對(duì)語(yǔ)音信號(hào)影響的方法及裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。權(quán)利要求1、一種語(yǔ)音信號(hào)處理方法,其特征在于,包括在對(duì)數(shù)倒譜域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒譜系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值;將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去所述傳輸信道對(duì)數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜;所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。2、根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值,具體包括計(jì)算E[Tc(K)]=E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對(duì)數(shù)倒譜,Sc(K)表示觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值;當(dāng)傳輸信道上存在語(yǔ)音信號(hào)時(shí),對(duì)上述公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranC印(K)j二TranC印00^(1-^)+(Sc(K)-RefC印(K))《;其中,TranCep(K)表示傳輸信道對(duì)數(shù)倒譜的估計(jì)值,j為幀序號(hào),%為平滑因子。3、根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括當(dāng)傳輸信道上不存在語(yǔ)音信號(hào)時(shí),對(duì)上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranCep(K)j二TranCep(K)H(1-《)+Sc(K)《;其中,A與"2的取值不同。4、根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括利用觀測(cè)到的語(yǔ)音信號(hào)的信噪比,將利用%和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)」TranC印(K)」—i(卜%)+(Sc(K)-RefC印(K))^+Sc(K)/2;其中,A+A="3,A和A根據(jù)所述信噪比確定。5、根據(jù)權(quán)利要求2至4任一所述的方法,其特征在于,還包括根據(jù)公式RefCep(K)j,RefCep(K)j(l-力+^(iO^利用當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K),更新未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中Z為一個(gè)小量,且^<"。6、一種語(yǔ)音信號(hào)處理裝置,其特征在于,包括倒譜系數(shù)提取單元,用于在對(duì)數(shù)倒譜域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒譜系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;信道對(duì)數(shù)倒譜估算單元,用于根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒語(yǔ)的估計(jì)值;干擾分離單元,用于將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去所述傳輸信道對(duì)數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒鐠;所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。7、根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述信道對(duì)數(shù)倒譜估算單元包括均值計(jì)算子單元,用于計(jì)算E[Tc(K)]=E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對(duì)數(shù)倒i普,Sc(K)表示觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值;第一估算子單元,用于當(dāng)傳輸信道上存在語(yǔ)音信號(hào)時(shí),對(duì)上述公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranC印(K)^TranCep(K)卜"1-q)+(Sc(K)-RefCep(K))《;其中,TranCep(K)表示傳輸信道對(duì)數(shù)倒譜的估計(jì)值,j為幀序號(hào),cd為平滑因子。8、根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述信道對(duì)數(shù)倒譜估算單元還包括第二估算子單元,用于當(dāng)傳輸信道上不存在語(yǔ)音信號(hào)時(shí),對(duì)上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來(lái)近似E[Tc(K)],得到TranCep(lOj=TrariCep(K)H(l—《)+Sc(K)%;其中,<^與"2的取值不同。9、根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述信道對(duì)數(shù)倒譜估算單元還包括綜合估算子單元,用于利用觀測(cè)到的語(yǔ)音信號(hào)的信噪比,將利用%和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)」二T週C印(K)」—}(1,)+(Sc(K)-RefC印(K))+Sc(K)々2;其中,A+A="3,A和A根據(jù)所述信噪比確定。10、根據(jù)權(quán)利要求7至9任一所述的裝置,其特征在于,所述裝置還包括更新單元,用于根據(jù)公式RefCep(K)j+嚴(yán)RefCep(K)j(l-力+Zc(iq;K,利用當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜Xc(K),更新未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中^為一個(gè)小量,且7<"。全文摘要本發(fā)明提供了一種語(yǔ)音信號(hào)處理方法及裝置,以解決語(yǔ)音信號(hào)的信道干擾問(wèn)題。所述方法包括在對(duì)數(shù)倒譜域上,對(duì)當(dāng)前觀測(cè)到的語(yǔ)音信號(hào)進(jìn)行倒譜系數(shù)提取,得到觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜;根據(jù)未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對(duì)數(shù)倒譜的估計(jì)值;將所述觀測(cè)語(yǔ)音的對(duì)數(shù)倒譜減去所述傳輸信道對(duì)數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜;所述未經(jīng)信道的語(yǔ)音信號(hào)對(duì)數(shù)倒譜即為語(yǔ)音信號(hào)與信道干擾的分離結(jié)果。本發(fā)明可以消除語(yǔ)音信號(hào)的信道干擾,提高語(yǔ)音識(shí)別特征提取過(guò)程中抗傳輸信道干擾的能力,從而提高識(shí)別率。文檔編號(hào)G10L21/02GK101533642SQ20091007833公開日2009年9月16日申請(qǐng)日期2009年2月25日優(yōu)先權(quán)日2009年2月25日發(fā)明者馮宇紅,晨張申請(qǐng)人:北京中星微電子有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
景东| 融水| 万州区| 崇信县| 永登县| 抚远县| 新乡市| 巴南区| 德令哈市| 阳原县| 湄潭县| 黄大仙区| 诸暨市| 梧州市| 工布江达县| 浦县| 杭锦旗| 益阳市| 闻喜县| 东乌| 德江县| 宁明县| 驻马店市| 固原市| 达孜县| 射阳县| 桂平市| 甘肃省| 新余市| 平乐县| 澄江县| 溆浦县| 浦县| 龙川县| 宁安市| 娱乐| 万源市| 汾阳市| 德安县| 万源市| 宁蒗|