欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

增益受限的噪音抑制的制作方法

文檔序號(hào):2822440閱讀:184來源:國知局
專利名稱:增益受限的噪音抑制的制作方法
技術(shù)領(lǐng)域
本發(fā)明主要涉及數(shù)字音頻信號(hào)處理,尤其涉及在聲音或語音中的噪聲抑制。
背景技術(shù)
語音信號(hào)的噪聲抑制(NS)對(duì)許多應(yīng)用來說是有用的。在蜂窩電話中,例如,噪聲抑制能夠用于消除背景噪聲,以便從噪聲環(huán)境中建立的通話中提供更加容易清晰的語音。同樣,噪聲抑制能夠提高無線電話會(huì)議、在線游戲中的語音聊天、基于互聯(lián)網(wǎng)的語音消息和語音聊天、以及類似通信應(yīng)用中的感性音質(zhì)和語音可識(shí)度。因?yàn)橛涗洯h(huán)境不是理想的,所以對(duì)這些應(yīng)用來說輸入的音頻信號(hào)典型地是噪聲。進(jìn)一步地,當(dāng)在聲音信號(hào)的編碼或壓縮技術(shù)(例如,通過Windows Media Voice編解碼器,以及類似編解碼器)之前使用時(shí),噪聲抑制能提高壓縮性能。噪聲抑制還能在語音識(shí)別之前應(yīng)用,以提高識(shí)別準(zhǔn)確度。
有一些公知的用于語音信號(hào)中的噪聲抑制的技術(shù),例如頻譜相減和最小均方誤差(MMSE)。幾乎所有的這些公知技術(shù)抑制噪聲都是通過將基于在語音信號(hào)中噪聲估計(jì)的頻譜增益G(m,k)應(yīng)用到語音信號(hào)中的每個(gè)短時(shí)頻譜值S(m,k)上,其中m是幀數(shù),以及k是頻譜指數(shù)。(參見,例如,S.F.Boll,A.V.Oppenheim,“Suppression of acoustic noise in speech using spectral subtraction,”IEEE Trans.Acoustics,Speech and Signal Processing,ASSP-27(2),1979年4月;和RainerMartin,“Noise Power Spectral Density Estimation Based on Optimal Smoothing andMinimum Statistics,”IEEE Transactions on Speech and Audio Processing,Vol.9,No.pp.504-512,2001年7月.)將很低的頻譜增益應(yīng)用到被估計(jì)的包含噪聲的頻譜值中,以便抑制信號(hào)中的噪聲。
不幸地,噪聲抑制的應(yīng)用可能將人為失真(可聽的“人為產(chǎn)物”)引入語音信號(hào)中,例如因?yàn)樵肼曇种扑鶓?yīng)用的頻譜增益不是太大(消除了多于噪聲的成份)就是太小(消除噪音完全失敗)。許多NS技術(shù)所遭遇的人為產(chǎn)物被叫做音樂噪音,其中NS技術(shù)引入了可察覺的人為產(chǎn)物,其作為有旋律的音頻信號(hào)模式在輸入中并沒有出現(xiàn)。在這些情況下,這樣的音樂噪聲除了使出現(xiàn)在輸入信號(hào)中的語音表現(xiàn)不準(zhǔn)確之外,還變得顯著和分散注意的。
概述在這里描述的語音噪聲抑制設(shè)備中,引入新的增益受限技術(shù),以提高噪聲抑制精度并因此減少音樂噪聲人為產(chǎn)物的發(fā)生。該技術(shù)在通話期間估計(jì)噪聲頻譜,而不僅僅在通話暫停期間,以便在長(zhǎng)時(shí)間通話期間能保持噪聲估計(jì)更為精確。進(jìn)一步地,使用噪聲估計(jì)平滑以達(dá)到更好的噪聲估計(jì)。聽音試驗(yàn)顯示該增益受限的噪聲抑制和噪聲估計(jì)平滑技術(shù)有效地提高了語音信號(hào)的聲音質(zhì)量。
該增益受限的噪聲抑制與平滑的噪聲估計(jì)技術(shù)能夠在噪聲抑制設(shè)備中使用,該噪聲抑制設(shè)備通過將頻譜增益G(m,k)應(yīng)用到每個(gè)短時(shí)頻譜值S(m,k)中來實(shí)施。這里的m是幀數(shù),以及k是頻譜指數(shù)。
更尤其在噪聲抑制設(shè)備的一個(gè)例子中,輸入的聲音信號(hào)被分割成幀。將分析窗口應(yīng)用到每個(gè)幀中,然后通過使用快速傅立葉變換(FFT)將信號(hào)轉(zhuǎn)換為頻域信號(hào)S(m,k)。將頻譜值分組成N個(gè)分辨元以用于進(jìn)一步的處理。當(dāng)每個(gè)分辨元(bin)被分類為噪聲分辨元時(shí),對(duì)每個(gè)分辨元的噪聲特性進(jìn)行估計(jì)。在時(shí)域和頻域中都對(duì)能量參數(shù)進(jìn)行平滑,以得到更好的每個(gè)分辨元的噪聲估計(jì)?;诋?dāng)前信號(hào)頻譜和噪聲估計(jì)來計(jì)算增益因子G(m,k)。在將增益因子應(yīng)用到信號(hào)頻譜S(m,k)之前,將增益平滑濾波器應(yīng)用到平滑增益因子上。將修改后的信號(hào)頻譜轉(zhuǎn)換為時(shí)域以用于輸出。
在將增益因子應(yīng)用到頻譜值之前,增益平滑濾波器執(zhí)行兩個(gè)步驟以平滑增益因子。首先,計(jì)算當(dāng)前幀的噪聲因子ξ(m)∈
。分辨元是基于噪聲分辨元數(shù)和分辨元總數(shù)的比值來確定的。零值噪聲因子ξ(m)=0表示對(duì)所有的頻譜值僅僅使用固定增益,而噪聲因子ξ(m)=1表示根本沒有進(jìn)行平滑。然后噪聲因子被用于改變?cè)鲆嬉蜃覩(m,k),以產(chǎn)生平滑增益因子Gs(m,k)。在噪聲抑制設(shè)備的例子中,通過在G(m,k)上應(yīng)用FFT來實(shí)現(xiàn),然后截止高頻分量。
本發(fā)明其它的特征和優(yōu)點(diǎn)將通過參考附圖從下面的實(shí)施例的詳細(xì)描述中變得明顯。


圖1是執(zhí)行在這里所描述的增益受限噪聲抑制技術(shù)的語音噪聲抑制器的框圖。
圖2是說明在圖1中語音噪聲抑制器中執(zhí)行的增益受限噪聲抑制處理的流程圖。
圖3是說明在圖2的增益受限噪聲抑制處理中將疊加的窗口函數(shù)應(yīng)用到輸入的語音信號(hào)中的圖表。
圖4是顯示在圖2的增益受限噪聲抑制處理中所執(zhí)行的更新確定檢測(cè)的流程圖。
圖5和6是顯示基于在圖2的增益受限噪聲抑制處理中所執(zhí)行的更新確定檢測(cè)來對(duì)噪聲統(tǒng)計(jì)進(jìn)行更新(分別為平均數(shù)和方差)的流程圖。
圖7是適于實(shí)施圖1的語音噪聲抑制器的計(jì)算環(huán)境的框圖。
詳細(xì)描述下面的描述將關(guān)注于在音頻或語音處理系統(tǒng)中使用的增益受限噪聲抑制技術(shù)。如圖1所述,在用各種類型的音頻信號(hào)處理器130處理噪聲抑制的語音信號(hào)125的結(jié)果(例如編碼或壓縮,語音聊天或無線電話會(huì)議,語音識(shí)別等等)之前,在增益受限噪聲抑制系統(tǒng)100中將該增益受限噪聲抑制技術(shù)作為一個(gè)預(yù)處理(通過噪聲抑制器120)應(yīng)用到語音信號(hào)115中。音頻信號(hào)處理器生成處理過的信號(hào)輸出135(例如語音或音頻信號(hào),語音識(shí)別或其他分析參數(shù)等等),其可以通過增益受限噪聲抑制來改善(例如感性音質(zhì),識(shí)別或分析精度等等)。
1、具體說明圖2說明在噪聲抑制器120(圖1)中所執(zhí)行的增益受限噪聲抑制處理200。增益受限噪聲抑制處理200從語音信號(hào)的輸入210開始,例如麥克風(fēng)或語音信號(hào)的記錄。語音信號(hào)被數(shù)字化或以采樣率Fs進(jìn)行定時(shí)采樣,其典型地是8000、11025、16000、22050Hz或其他適合應(yīng)用的采樣率。然后輸入的語音信號(hào)具有時(shí)序格式或語音信號(hào)采樣流,表示為經(jīng)x(i)。
在預(yù)增強(qiáng)階段220上,該輸入語音信號(hào)(x(i))被處理以增強(qiáng)語音,例如,通過高通濾波(雖然可以選擇性地應(yīng)用其他的增強(qiáng)形式)。首先,幀被執(zhí)行以將語音信號(hào)采樣分組為預(yù)置長(zhǎng)度N的幀,其可以是160個(gè)采樣。所述幀語音信號(hào)表示為x(m,n),其中m是幀數(shù),n是在幀內(nèi)采樣數(shù)。適用于增強(qiáng)的合適高通濾波能夠由下面的公式表示H(z)=1+βz-1采用適宜的β值是-0.8。能夠通過計(jì)算增強(qiáng)的語音信號(hào)xh(m,n)來實(shí)現(xiàn)高通濾波器,xh(m,n)作為與前述采樣所對(duì)應(yīng)的輸入語音信號(hào)采樣的加權(quán)移動(dòng)平均值,按如下方程所述xh(m,n)=xh(m,n)+βx(m,n-1)然后在疊加階段230和窗口階段231中將窗口函數(shù)300(如圖3所示)應(yīng)用在語音增強(qiáng)信號(hào)的疊加幀函數(shù)上。在一個(gè)實(shí)施例中,下面給出了采用窗口長(zhǎng)度(L=256)和幀疊加(Lw=48)的窗口函數(shù)w(n)w(n)=12(1-cosnLwπ),0≤n<Lw1,Lw≤n<N12(1-cosN+Lw-n-1Lwπ),N≤n<N+Lw0,N+Lw≤n<L]]>該窗口函數(shù)與增強(qiáng)的(高通濾波的)信號(hào)xh(m,n-Lw)的疊加幀(xw)相乘,如下面所給出的xw(n)=xh(m-1,n+N-LW),0≤n<Lwxh(m,n),Lw≤n<N+Lw0,N+Lw≤n<L]]>該乘法運(yùn)算生成窗口函數(shù)sw(m,n),如下方程式所述sw(m,n)=xw(n)w(n),0≤n<L在窗口之后,通過頻率分析(例如使用快速傅立葉變換(FFT)240或其他類似變換)將語音信號(hào)轉(zhuǎn)換為頻域。這會(huì)生成用于每個(gè)信號(hào)幀的一組頻譜系數(shù)或頻譜,如下述方程式S(m,k)=FFTL(sw(m,n))頻譜系數(shù)是混合值,因此根據(jù)如下關(guān)系所示其即表示語音信號(hào)的頻譜振幅(SA),也表示相位(SP)SA(m,k)=|S(m,k)|SP(m,k)=tan-1S(m,k)在接下來的處理中分析頻譜振幅以提供在噪聲抑制中所使用的更精確的增益估計(jì),而相位被保持以用于逆FFT。
在階段250-251中,對(duì)每個(gè)幀在頻譜的能帶上執(zhí)行頻域和時(shí)域平滑。首先按如下方程執(zhí)行在頻域上可調(diào)的窗口平滑S0(m,k)=12ks+1Σk=k-ksk+ksSA2(m,k)]]>接下來的時(shí)域平滑按如下方程式所述Ss(m,k)=S0(m,k),m=0αS0(m-1,k)+(1-α)S0(m,k),m>0]]>其中α=γN/Fs-1γN/Fs+1]]>這里,γ值是一個(gè)可以被任意選擇以控制平滑的數(shù)值的參數(shù)。特別地,當(dāng)γ值逼近比率(N/Fs)時(shí),則α趨近于0,當(dāng)應(yīng)用上述時(shí)域平滑時(shí)導(dǎo)致較少的平滑。另一方面,當(dāng)值變大(γ→∞)時(shí),則α逼近于固定值,導(dǎo)致較多的平滑。
階段260和261分別計(jì)算幀能量和歷史最低能量。根據(jù)下面方程式來計(jì)算幀能量SE(m)=Σk=0k-1Ss(m,k)]]>通過下面方程式給出歷史最低能量Smin(m)=minl=m-M+1m-1SE(l)]]>其中M是常數(shù)參數(shù),典型地表示為1或2秒。
在更新檢測(cè)階段262中,噪聲抑制器120判斷是否更新語音信號(hào)的噪聲統(tǒng)計(jì),其在頻率分辨元基礎(chǔ)上被追蹤。噪聲抑制器120將語音信號(hào)幀的頻譜值分組為多個(gè)頻率分辨元。在所描述的實(shí)施例中,頻譜值(k)被分組為每個(gè)頻率分辨元一個(gè)頻譜值。然而,在可選擇的實(shí)施例中,能夠做出幀頻譜值到頻率分辨元的各種其它分組,例如每個(gè)頻率分辨元多于一個(gè)的頻譜值,或頻譜值到頻譜分辨元的不統(tǒng)一的分組。
圖4說明了一個(gè)在更新檢測(cè)階段270(圖2)中使用用噪聲抑制120(圖1)的過程400,以確定是否和怎樣更新語音信號(hào)的噪聲統(tǒng)計(jì)。在過程400中,噪聲抑制器確定在當(dāng)前語音信號(hào)幀中重置噪聲統(tǒng)計(jì),還確定是否更新每個(gè)頻率分辨元的噪聲統(tǒng)計(jì)。噪聲抑制器在每個(gè)語音信號(hào)的幀上執(zhí)行該過程。
首先,在確定是否重置噪聲統(tǒng)計(jì)中,噪聲抑制器對(duì)語音信號(hào)檢測(cè)(判定410)幀能量是否低于歷史最低能量的第一域值倍數(shù)(λ1)(其通常表示語音中的暫停),如下方程式所示SE(m)<λ1Smin(m)如果這樣(在塊415中),噪聲抑制器對(duì)幀到幀設(shè)置重置標(biāo)記(R(m)=1),其表示噪聲統(tǒng)計(jì)在當(dāng)前幀中被重置。
另外,噪聲抑制器接下來檢測(cè)是否更新頻率分辨元。對(duì)于該檢測(cè)(判斷420),噪聲抑制器檢測(cè)幀能量是否低于歷史最低能量的第二(較高)域值的倍數(shù)(λ2)(其通常表示持續(xù)語音暫停),如下方程式所示SE(m)<λ1Smin(m)如果這樣,噪聲抑制器對(duì)幀頻率分辨元到幀頻率分辨元設(shè)置更新標(biāo)記(即,U(m,k)=1).
另外(在“for”循環(huán)塊430,460里),噪聲抑制器在每個(gè)頻率分辨元上確定是否更新相應(yīng)的頻率分辨元。對(duì)每個(gè)頻率分辨元來說,噪聲抑制器檢測(cè)幀能量是否低于先前幀中相應(yīng)的頻率分辨元的噪聲平均值和噪聲方差的函數(shù)(判斷440),如下方程式所示logSE(m)<SM(m-1,k)+λ3SV(m-1,k)]]>如果頻率分辨元能量的對(duì)數(shù)低于先前幀中的頻率分辨元的噪聲平均值和噪聲方差的閾值函數(shù),那么在塊445中噪聲抑制器對(duì)頻率分辨元到頻率分辨元設(shè)置更新標(biāo)記(U(m,k)=1)。否則在塊445中將當(dāng)前頻率分辨元的更新標(biāo)記設(shè)置為沒有更新的零(U(m,k)=0)。
再次參考圖2,在塊263中噪聲抑制器根據(jù)在塊262中作出的更新判定來更新每個(gè)頻率的噪聲頻譜統(tǒng)計(jì)。噪聲統(tǒng)計(jì)跟蹤包括噪聲平均值和噪聲方差的每個(gè)頻率分辨元。
圖5說明了用于更新語音信號(hào)幀的噪聲平均值的過程500。在噪聲平均值更新過程500的初始判斷510中,噪聲抑制器檢測(cè)是否重置表示幀的噪聲統(tǒng)計(jì)的重置標(biāo)記(即,如果R(m)=1)。如果是這樣,噪聲抑制器重置頻率分辨元的噪聲平均值計(jì)算結(jié)果(0≤k<K),如下方程式所示SM(m,k)=logSS(m,k)否則,如果沒有設(shè)置幀的重置標(biāo)記(R(m)≠1),那么噪聲抑制器根據(jù)它們的更新標(biāo)記來更新頻率分辨元的噪聲平均值。在“for”循環(huán)520,550中,噪聲抑制器檢測(cè)每個(gè)頻率分辨元的更新標(biāo)記(判斷530)。如果更新標(biāo)記被設(shè)置(U(m,k)=1),用于頻率分辨元的噪聲平均值作為先前幀中頻率分辨元的噪聲平均值與當(dāng)前幀頻率分辨元的語音信號(hào)的加權(quán)和被更新,如下方程式所示SM(m,k)=αMSM(m-1,k)+(1-αM)logSS(m,k)否則,頻率分辨元的噪聲平均值不被更新,并因此從先前幀中被轉(zhuǎn)入,如下方程式所示SM(m,k)=SM(m-1,k)圖6描述了用于更新語音信號(hào)幀的噪聲方差的過程600。在噪聲平均值更新過程600的初始判斷610,噪聲抑制器檢測(cè)是否重置了表示幀噪聲統(tǒng)計(jì)的重置標(biāo)記(即,是否R(m)=1)。如果是這樣,噪聲抑制器重置頻率分辨元的噪聲方差計(jì)算值(0≤k<K),如下方程式所示SV(m,k)=|logSS(m,k)-SM(m,k)|2否則,如果沒有設(shè)置幀的重置標(biāo)記(R(m)≠1),那么噪聲抑制器根據(jù)它們的更新標(biāo)記來更新頻率分辨元的噪聲方差。在“for”循環(huán)620,650中,噪聲抑制器檢測(cè)每個(gè)頻率分辨元的更新標(biāo)記(判斷630)。如果更新標(biāo)記被設(shè)置(U(m,k)=1),用于頻率分辨元的噪聲方差作為先前幀中頻率分辨元的噪聲方差與當(dāng)前幀頻率分辨元的語音信號(hào)的噪聲方差的加權(quán)函數(shù)被更新,如下方程式所示SV(m,k)=αVSV(m-1,k)+(1-αV)|logSS(m,k)-SM(m,k)|2否則,頻率分辨元的噪聲方差不被更新,并因此從先前幀中被轉(zhuǎn)入,如下方程式所示SV(m,k)=SV(m-1,k)
再次參考圖2,在增益受限噪聲抑制處理200的接下來的階段270-271中的噪聲抑制器基于從階段263中作為增益濾波器被提供的當(dāng)前信號(hào)頻譜和噪聲估計(jì)來計(jì)算和平滑增益因子(G(m,k),以便在階段272中改變語音信號(hào)頻譜。
在信噪比(SNR)增益濾波器階段270中,噪聲抑制器開始計(jì)算頻率分辨元的SNR,如下方程式所示SNR(m,k)=SS(m,k)exp(SM(m,k))]]>然后噪聲抑制器用SNR來計(jì)算用于增益抑制器的增益因子,如下所示G(m,k)=SNR(m,k)-γaγb]]>G(m,k)=Gmin,G(m,k)<GminG(m,k),Gmin≤G(m,k)<Gmax,Gmax≤G(m,k)Gmax]]>在增益平滑階段271中,噪聲抑制器然后根據(jù)幀的“噪聲”計(jì)算值(在這里稱為“噪聲因子”)來平滑增益因子,其中對(duì)更多的噪聲幀提供的平滑比提供給語音幀的要強(qiáng)。噪聲抑制器計(jì)算幀的噪聲比,其作為噪聲頻率分辨元(即標(biāo)記用于更新的分辨元)的數(shù)目與分辨元的總數(shù)之間的比值,如下所示RN(m)=1KΣk=0K-1U(m,k)]]>噪聲抑制器然后計(jì)算幀的平滑因子(在范圍0到1之間),如下所示M(m)=(Mmax-Mmin)RN(m)+MminM(m)=0,M(m)<0M(m),0≤M(m)<11,1≤M(m)]]>在該實(shí)施例中,噪聲抑制器提供頻域中的平滑,使用FFT將增益濾波器轉(zhuǎn)換為頻域。對(duì)于頻域轉(zhuǎn)換來說,噪聲抑制器一組從增益因子(G(m,k))中計(jì)算出擴(kuò)展的增益因子(G′(m,k)),如下所示
G′(m,k)=G(m,k),0<k<KG(m,L-k),K≤k<L]]>其中K示頻率分辨元的數(shù)目。L典型地是2K。擴(kuò)展的增益因子如此有效地從0到K-1復(fù)制增益因子,并從K到L-1復(fù)制增益因子的鏡象。
然后噪聲一直器通過擴(kuò)展增益因子的FFT來計(jì)算增益頻譜(g(Λ)),如下所示g(Λ)=FFT(G′(m,k))FFT生成具有混合值的頻譜系數(shù),從中按如下所示計(jì)算增益頻譜的振幅和相位gA(Λ)=|g(Λ)|gP(Λ)=tan-1(g(Λ))然后噪聲抑制器通過增益頻譜的零位高頻分量來平滑增益濾波器。噪聲抑制器基于所述數(shù)目上的平滑因子(M(m))和零位分量來保持若干增益頻譜系數(shù)直到某一數(shù)目,其根據(jù)如下方程式Ng=roundoff[(1-M(m))(k-1)]+1如此以致g′A(Λ‾)=gA(Λ‾),0≤Λ‾<Ng0,Ng≤Λ‾]]>然后提供逆FFT給該減少的增益頻譜以便生成平滑增益濾波器,其通過GS(m,k)=IFFT(g′A(Λ),gP(Λ))該基于平滑的FFT有效地對(duì)近于零點(diǎn)的平滑因子(例如,具有在幀內(nèi)由更新標(biāo)記所標(biāo)記的沒有或少的“噪聲”頻率分辨元)進(jìn)行少的或不進(jìn)行平滑,并作為趨近于1的平滑因子對(duì)增益濾波器向常數(shù)進(jìn)行平滑(例如,具有所有的或幾乎所有的“噪聲”分辨元)。因此,對(duì)零點(diǎn)平滑因子(M(m)=0)來說,平滑增益濾波器是GS(m,k)=G(m,k)而對(duì)于平滑因子等于1(M(m)=1)來說,平滑增益濾波器是Gs(m,k)=1kΣi=0k-1G(m,i)]]>在接下來的階段272中,噪聲抑制器提供平滑的增益濾波器結(jié)果給語音信號(hào)幀的平譜振幅,如下所示S′A(m,k)=SA(m,k)GS(m,k)作為噪聲統(tǒng)計(jì)估計(jì)和平滑處理的結(jié)果,提供給噪聲分辨元的增益因子應(yīng)當(dāng)相對(duì)于非噪聲平率分辨元是比較低的,以便語音信號(hào)中的噪聲被抑制。
在階段280中,噪聲抑制器提供逆變換給作為由增益濾波器改變的語音信號(hào)的頻譜,如下所示y0(m,n)=IFFTL(S′A(m,k),SP(m,k))然后在階段281,282中提供疊加和預(yù)加重(高通濾波)的逆變換,以便生成噪聲抑制器的最后輸出290,如下公式所示y1(m,n)=y0(m-1,n+N)+y0(m,n),0≤n<N-Ly0(m,n),N-L≤n<N]]>y(m,n)=y(tǒng)1(m,n)-βy(m,n-1)2、計(jì)算環(huán)境上面所描述的噪聲抑制系統(tǒng)100(圖1)和增益受限噪聲抑制處理200能在任何多種裝置中能被實(shí)施,其中在所述裝置中執(zhí)行音頻信號(hào)處理,包括在其他例子中的計(jì)算機(jī);音頻播放,傳輸和接收裝置;便攜音頻播放器;音頻會(huì)議;網(wǎng)絡(luò)音頻流應(yīng)用等等。增益受限噪聲抑制能夠在硬件電路中(例如,在ASIC,F(xiàn)PGA等電路中)實(shí)施,還可以在如圖7所示的計(jì)算機(jī)或其他計(jì)算環(huán)境中執(zhí)行的音頻處理軟件中實(shí)施(不管在中央處理單元(CPU)中還是在數(shù)字信號(hào)處理器,音頻卡等等中執(zhí)行)。
圖7描述了在其中可以適合實(shí)施所描述的增益受限噪聲抑制的計(jì)算環(huán)境(700)的一般例子。計(jì)算環(huán)境(700)不打算建議關(guān)于本發(fā)明的使用范圍或功能的任何限制,因?yàn)楸景l(fā)明可以在各種一般目的或特殊目的的計(jì)算環(huán)境中實(shí)施。
參考圖7,計(jì)算環(huán)境(700)包括至少一個(gè)處理單元(710)和存儲(chǔ)器(720)。在圖7中,最基本的結(jié)構(gòu)(730)包含在虛線內(nèi)。處理單元(710)執(zhí)行計(jì)算機(jī)可讀指令并可以是真實(shí)的或虛擬的處理器。在多處理系統(tǒng)中,多處理單元執(zhí)行計(jì)算機(jī)可讀指令以增加處理能力。存儲(chǔ)器(720)可以是易失性存儲(chǔ)器(例如,寄存器,超高速緩沖存儲(chǔ)器,RAM),非易失性存儲(chǔ)器(例如,ROM,EEPROM,閃存等),或兩者的一些組合。存儲(chǔ)器(720)存儲(chǔ)實(shí)施所述增益受限噪聲抑制技術(shù)的軟件(780)。
計(jì)算環(huán)境可以具有附加特征。例如,計(jì)算環(huán)境(700)包括存儲(chǔ)器(740),一個(gè)或多個(gè)輸入裝置(750),一個(gè)或多個(gè)輸出裝置(760),以及一個(gè)或多個(gè)通信連接(770)。例如總線、控制器、或網(wǎng)絡(luò)這樣的互連機(jī)制(未顯示)與計(jì)算環(huán)境(700)的各部分互連。典型地,操作體統(tǒng)軟件(未顯示)提供用于在計(jì)算環(huán)境(700)中執(zhí)行其他軟件的操作環(huán)境,并協(xié)調(diào)計(jì)算環(huán)境(700)各部分的活動(dòng)。
存儲(chǔ)器(740)可以是可拆卸或不可拆卸的,并包括磁盤,磁帶或盒式磁帶,CD-ROMs,CD-RWs,DVDs,或能用于存儲(chǔ)信息并能在計(jì)算環(huán)境(700)中被訪問的任何其他介質(zhì)。存儲(chǔ)器(740)存儲(chǔ)用于可實(shí)施增益受限噪聲抑制處理200(圖2)的軟件(780)的指令。
輸入裝置(750)可以是例如鍵盤、鼠標(biāo)、筆、或跟蹤球這樣的觸動(dòng)式輸入裝置,聲音輸入裝置,掃描裝置,或其它可以向計(jì)算環(huán)境(700)提供輸入的設(shè)備。對(duì)于音頻來說,輸入裝置(750)可以式聲卡或可以模擬或數(shù)字格式接收音頻輸入的類似裝置,或可向計(jì)算環(huán)境提供音頻采樣的CD-ROM閱讀器。輸出裝置(760)可以是顯示器,打印機(jī),揚(yáng)聲器,CD復(fù)寫器,或其它可從計(jì)算環(huán)境(700)中提供輸出的裝置。
通信連接(770)通過通信介質(zhì)與其他計(jì)算機(jī)構(gòu)進(jìn)行通信。通信介質(zhì)傳輸諸如計(jì)算機(jī)可讀質(zhì)量、壓縮音頻或視頻信息、或在調(diào)制數(shù)據(jù)信號(hào)中的其它數(shù)據(jù)這樣的信息。調(diào)制數(shù)據(jù)信號(hào)是一個(gè)具有以在信號(hào)中編碼信息這樣的方式來設(shè)置或改變其一個(gè)或多個(gè)特征的信號(hào)。通過例子的方式,并不限制于,通信介質(zhì)包括采用電子、光學(xué)、RF、紅外線、聲學(xué)、或其他載波來實(shí)施的有線或無線技術(shù)。
計(jì)算機(jī)可讀介質(zhì)的一般上下文中描述了此處的快述耳機(jī)虛擬化技術(shù)。計(jì)算機(jī)可讀介質(zhì)是可利用介質(zhì),其能在計(jì)算環(huán)境中被訪問。通過例子的方式,并不限制于,通過計(jì)算環(huán)境(700),計(jì)算機(jī)可讀介質(zhì)包括儲(chǔ)存器(720)、存儲(chǔ)器(740)、通信介質(zhì)、以及上述任何的組合。
計(jì)算機(jī)可讀指令的一般上下文中描述了此處的快速耳機(jī)虛擬化技術(shù),例如它們包括在程序模塊中,在目標(biāo)真實(shí)或虛擬的處理上的計(jì)算環(huán)境中執(zhí)行。通常,程序模塊包括例行程序、程序、程序庫、目標(biāo)程序、分類、分量、數(shù)據(jù)結(jié)構(gòu)等等,其可執(zhí)行特別的任務(wù)或?qū)嵤┨貏e的抽象數(shù)據(jù)類型。程序模塊的功能可以在各種實(shí)施例中所需的程序模塊之間進(jìn)行組合或分離。用于程序模塊的計(jì)算機(jī)可讀指令可以在本地或分布的計(jì)算環(huán)境中執(zhí)行。
由于介紹的緣故,詳細(xì)的描述中使用術(shù)語“確定”、“產(chǎn)生”、“調(diào)整”、和“應(yīng)用”來描述在計(jì)算環(huán)境中計(jì)算機(jī)操作。這些術(shù)語是用于計(jì)算機(jī)執(zhí)行操作的高級(jí)抽象,并不應(yīng)該于人的行為相混淆。對(duì)應(yīng)這些術(shù)語的現(xiàn)行計(jì)算機(jī)操作依據(jù)實(shí)施而改變。
考慮到本發(fā)明的原理可以應(yīng)用到許多可能的實(shí)施例上,我們要求像下面權(quán)利要求及其等價(jià)的范圍和精神下可以得到的那樣的本發(fā)明所有實(shí)施例。
權(quán)利要求
1.一種語音噪聲抑制方法,包括將輸入語音信號(hào)的幀轉(zhuǎn)換為具有多個(gè)頻譜值的頻域表示;將多個(gè)頻率分辨元分類為噪聲或非噪聲;計(jì)算用于頻率分辨元的多個(gè)增益因子;基于噪聲分辨元數(shù)目與頻率分辨元的總數(shù)之間的比值來計(jì)算噪聲因子,從表現(xiàn)為非平滑的值到表現(xiàn)為平滑的值之間將增益因子變化為常數(shù)增益;根據(jù)噪聲因子來平滑增益因子;以及通過將增益因子應(yīng)用到相關(guān)的頻譜值上來修正頻譜值;以及變換修正的頻譜值以生成輸出語音信號(hào)。
2.如權(quán)利要求1所述的語音噪聲抑制方法,其中平滑增益因子包括將增益因子轉(zhuǎn)換為頻域表示;根據(jù)噪聲因子來截止增益因子頻域表示的高頻分量;以及逆變換增益因子的頻域表示。
3.如權(quán)利要求1所述的語音噪聲抑制方法,其中分類頻率分辨元包括計(jì)算幀能量;跟蹤用于頻率分辨元的噪聲平均值和方差的估計(jì);當(dāng)幀能量低于先前幀的相應(yīng)頻率分辨元的噪聲平均值和方差估計(jì)的函數(shù)時(shí),將頻率分辨元分類為噪聲;以及由于頻率分辨元被分類為噪聲,更新噪聲平均值和方差的估計(jì)。
4.如權(quán)利要求3所述的語音噪聲抑制方法,進(jìn)一步包括平滑頻譜值;以及在計(jì)算幀能量和噪聲平均值和方差的估計(jì)中使用平滑的頻譜值。
5.如權(quán)利要求3所述的語音噪聲抑制方法,其中平滑頻譜值包括執(zhí)行頻譜值的時(shí)域和頻域平滑。
6.如權(quán)利要求3所述的語音噪聲抑制方法,進(jìn)一步包括計(jì)算歷史低幀能量測(cè)量;如果幀能量測(cè)量低于歷史低幀能量測(cè)量的第一閾值倍數(shù),那么確定重置噪聲平均值和方差的估計(jì);如果幀能量測(cè)量低于歷史低幀能量測(cè)量的第二閾值倍數(shù),那么確定更新頻率分辨元的噪聲平均值和方差的估計(jì)。
7.如權(quán)利要求3所述的語音噪聲抑制方法,其中計(jì)算增益因子包括按照相應(yīng)頻率分辨元的噪聲平均值和方差的估計(jì)以及頻譜值的函數(shù)來計(jì)算增益因子。
8.語音噪聲抑制器,包括裝置,用于將輸入語音信號(hào)的幀轉(zhuǎn)換為具有多個(gè)頻譜值的頻域表示;裝置,用于將多個(gè)頻率分辨元分類為噪聲或非噪聲;裝置,用于計(jì)算用于頻率分辨元的多個(gè)增益因子;裝置,用于基于噪聲分辨元數(shù)目與頻率分辨元的總數(shù)之間的比值來計(jì)算噪聲因子,從表現(xiàn)為非平滑的值到表現(xiàn)為平滑的值之間將增益因子變化為常數(shù)增益;裝置,用于根據(jù)噪聲因子來平滑增益因子;以及裝置,用于通過將增益因子應(yīng)用到相關(guān)的頻譜值上來修正頻譜值;以及裝置,用于變換修正的頻譜值以生成輸出語音信號(hào)。
9.如權(quán)利要求8所述的語音噪聲抑制器,其中用于平滑增益因子的裝置包括裝置,用于將增益因子轉(zhuǎn)換為頻域表示;裝置,用于根據(jù)噪聲因子來截止增益因子頻域表示的高頻分量;以及裝置,用于逆變換增益因子的頻域表示。
10.如權(quán)利要求8所述的語音噪聲抑制器,其中用于分類頻率分辨元的裝置包括裝置,用于計(jì)算幀能量;裝置,用于跟蹤用于頻率分辨元的噪聲平均值和方差的估計(jì);裝置,用于當(dāng)幀能量低于先前幀的相應(yīng)頻率分辨元的噪聲平均值和方差估計(jì)的函數(shù)時(shí),將頻率分辨元分類為噪聲;以及裝置,用于由于頻率分辨元被分類為噪聲,更新噪聲平均值和方差的估計(jì)。
11.如權(quán)利要求10所述的語音噪聲抑制器,進(jìn)一步包括裝置,用于平滑頻譜值;以及裝置,用于在計(jì)算幀能量和噪聲平均值和方差的估計(jì)中使用平滑的頻譜值。
12.如權(quán)利要求10所述的語音噪聲抑制器,其中用于平滑頻譜值的裝置包括用于執(zhí)行頻譜值的時(shí)域和頻域平滑的裝置。
13.如權(quán)利要求10所述的語音噪聲抑制器,進(jìn)一步包括裝置,用于計(jì)算歷史低幀能量測(cè)量;裝置,用于如果幀能量測(cè)量低于歷史低幀能量測(cè)量的第一閾值倍數(shù),那么確定重置噪聲平均值和方差的估計(jì);裝置,用于如果幀能量測(cè)量低于歷史低幀能量測(cè)量的第二閾值倍數(shù),那么確定更新頻率分辨元的噪聲平均值和方差的估計(jì)。
14.如權(quán)利要求10所述的語音噪聲抑制器,其中用于計(jì)算增益因子的裝置包括裝置,用于按照相應(yīng)頻率分辨元的噪聲平均值和方差的估計(jì)以及頻譜值的函數(shù)來計(jì)算增益因子。
全文摘要
一種用于語音的增益受限的噪聲抑制能在通話期間更準(zhǔn)確地估計(jì)噪聲,以減少噪聲抑制中產(chǎn)生的音樂的人為噪音。通過將頻譜增益G(m,k)應(yīng)用到語音信號(hào)的每個(gè)短時(shí)頻譜值S(m,k)上來操作噪聲抑制,其中m是幀數(shù)目,以及k是頻譜指數(shù)。頻譜值被分組為頻率分辨元,以及對(duì)每個(gè)被分類為“噪聲分辨元”的分辨元估計(jì)噪聲特性。能量參數(shù)在時(shí)域和頻域中被平滑以便提高每個(gè)分辨元的噪聲估計(jì)。基于當(dāng)前信號(hào)頻譜和噪聲估計(jì)來計(jì)算增益因子G(m,k),然后在其被應(yīng)用到信號(hào)頻譜值S(m,k)之前被平滑。首先,基于當(dāng)前幀的噪聲分辨元的數(shù)目與分辨元的總數(shù)之間的比值來計(jì)算噪聲因子,其中零值噪聲因子意味著僅僅對(duì)所有的頻譜值使用了常數(shù)增益且其噪聲因子意味著根本沒有平滑。然后,該噪聲因子被用于改變?cè)鲆嬉蜃?,例如通過截止頻域中增益因子的高頻分量。
文檔編號(hào)G10L15/00GK1727860SQ20051009224
公開日2006年2月1日 申請(qǐng)日期2005年6月15日 優(yōu)先權(quán)日2004年6月15日
發(fā)明者K·克史達(dá), F·諸葛, H·A·哈利勒, T·王, W·陳 申請(qǐng)人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
定州市| 花莲市| 那坡县| 大冶市| 常熟市| 油尖旺区| 海晏县| 乐至县| 东莞市| 理塘县| 溆浦县| 白河县| 云龙县| 瑞金市| 庄河市| 江孜县| 会理县| 乐亭县| 夏河县| 廉江市| 甘德县| 日喀则市| 二连浩特市| 宁蒗| 盐源县| 阜城县| 庆阳市| 阿鲁科尔沁旗| 清涧县| 永平县| 景洪市| 醴陵市| 信丰县| 景谷| 白水县| 稻城县| 库车县| 商都县| 井研县| 泽州县| 商城县|