專利名稱:通過使用與頻譜有關(guān)的指數(shù)增益函數(shù)平均進行的頻譜相減而減小信號噪聲的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信系統(tǒng),更具體地,涉及用于減小通信信號中破壞性的背景噪聲分量的影響的方法和設(shè)備。
背景技術(shù):
今天,移動電話和其它通信設(shè)備中免提裝置的使用正日益增長。與免提解決方案有關(guān)的、熟知的問題(特別是在汽車應(yīng)用中)是關(guān)于在免提話筒處拾取和被發(fā)送到遠端用戶的破壞性背景噪聲的問題。換句話說,由于免提話筒與近端用戶之間的距離可能相當(dāng)大,所以免提話筒不單拾取近端用戶的語音,也拾取在近端位置處可能存在的任何噪聲。例如,在汽車電話應(yīng)用中,近端話筒典型地拾取周圍的交通、道路和行人的分門別類的噪聲。最終的有噪聲的近端語音對于遠端用戶而言可能是很煩人的或甚至是不可容忍的。因此,希望背景噪聲盡可能地減小,最好是盡早地在近端信號處理鏈中被減小(例如,在接收的近端話筒信號被輸入到近端語音編碼器之前)。
結(jié)果,許多免提系統(tǒng)都包括用來消除在近端信號處理鏈的輸入端處的背景噪聲的噪聲減小處理器。
圖1是這樣的免提系統(tǒng)100的高層的方框圖。在圖1上,噪聲減小處理器110被放置在免提話筒120的輸出端和近端信號處理通路(未示出)的輸入端。在運行時,噪聲減小處理器110接收來自話筒120的有噪聲的語音信號x,以及處理該有噪聲的語音信號x,以便提供較干凈的、噪聲減小的語音信號SNR,SNR被傳送通過近端信號處理鏈,最后送給遠端用戶。
圖1的用于實施噪聲減小處理器110的一個熟知的方法在技術(shù)上被稱為頻譜相減。例如,參閱S.F.Boll的“Suppression of AcousticNoise in Speech using Spectral Subtraction(通過使用頻譜相減來抑制語音中的聲音噪聲)”IEEE Trans.Acoust.Speech and Sig.Proc.,27:113-120,1979,該論文在此引用以供參考。通常,頻譜相減使用噪聲頻譜和有噪聲的語音頻譜的估計來形成基于信號-噪聲比(SNR)的增益函數(shù),該增益函數(shù)與輸入頻譜相乘,以便抑制具有低SNR的頻率。雖然頻譜相減確實提供了顯著的噪聲減小,但它有幾個熟知的缺點。例如,頻譜相減輸出信號典型地包含一種在技術(shù)上稱為音樂音的人工產(chǎn)物,而且,從遠端用戶看來,被處理的信號塊之間的不連續(xù)性常常導(dǎo)致降低的語音質(zhì)量。
近年來已開發(fā)了許多對于基本頻譜相減方法進行改進的方案。例如,參閱N.Virage的“Speech Enhancement Based on MaskingProperties ofthe Auditory System(基于聽覺系統(tǒng)的遮蔽特性的語音改善)”,IEEE ICASSP.Proc.796-799 vol.1,1995;D.Tsoukalas,M.Paraskevas和J.Mourjopoulos的“Speech Enhancement usingPsychoacoustic Criteria(使用心理聲音準則的語音改善)”,IEEEICASSP.Proc.,359-362 vol.2,1993;F.Xie and D.Van Compernolle的“Speech Enhancement by Spectral Magnitude Estimation-AUnifying Approach(通過頻譜幅度估值的語音改善-統(tǒng)一方法)”,IEEESpeech Communication(IEEE語音通信),89-104 vol.19,1996;R.Martin的“Spectral Subtraction Based on Minimum Statistics(基于最小統(tǒng)計的頻譜相減)”,UESIPCO,Proc.,1182-1185 vol.2,1995;以及S.M.McOlash,R.J.Niederjohn和J.A.Heinen的“A SpectralSubtraction Method for Enhancement of Speech Corrupted byNonwhite,Nonstationary Noise(用于改善被非白、非平穩(wěn)噪聲污染的語音的頻譜相減方法)”,IEEE IECON.Proc.,872-877 vol.2,1995。
雖然這些方法確實提供了各種程度的語音改善,但無論如何,如果能夠開發(fā)用于解決上述與音樂音和塊間不連續(xù)性有關(guān)的頻譜相減問題的替換技術(shù),仍將是有利的。因此,需要一種用于通過頻譜相減進行噪聲減小的改進的方法和設(shè)備。
發(fā)明概要本發(fā)明通過提供一些用于通過頻譜相減進行噪聲減小的改進的方法和設(shè)備而滿足上述的和其它需要。按照示例性實施例,通過使用線性卷積、因果濾波和/或頻譜相減增益函數(shù)的與頻譜有關(guān)的指數(shù)平均,來實行頻譜相減。有利地,按照本發(fā)明構(gòu)建的系統(tǒng),比起現(xiàn)有技術(shù)的系統(tǒng)來說,給出了大大改進的語音質(zhì)量而不引入過度的復(fù)雜性。
按照本發(fā)明,開發(fā)了低階頻譜估計,它比起傳統(tǒng)的頻譜相減系統(tǒng)中的頻譜估計具有較低的頻率分辨率和減小的方差。按照本發(fā)明的頻譜被使用來形成具有想要的低方差的增益函數(shù),這個增益函數(shù)進而又減小了頻譜相減輸出信號中的音樂音。按照示例性實施例,通過使用與輸入頻譜有關(guān)的指數(shù)平均來使增益函數(shù)在塊間進一步被平滑。低分辨率的增益函數(shù)被內(nèi)插到全部塊長度的增益函數(shù)中,但仍然相應(yīng)于低階長度的濾波。有利地,低階的增益函數(shù)允許相位在內(nèi)插期間被添加。按照示例性實施例,增益函數(shù)的相位可以是線性相位或最小相位,它使得增益濾波器是因果的,以及阻止了塊之間的不連續(xù)性。在示例性實施例中,因果濾波器與輸入信號頻譜相乘,以及通過使用重疊和相加技術(shù)來裝配這些塊。而且,幀的長度被做得盡可能小,以便減小引入的延時而不引入頻譜估計中的過度的變化。
在一個示例性實施例中,一種噪聲減小系統(tǒng)包括頻譜相減處理器,用來濾波有噪聲的輸入信號以給出噪聲減小的輸出信號,其中頻譜相減處理器的增益函數(shù)根據(jù)輸入信號的頻譜密度的估值和根據(jù)輸入信號的噪聲分量的頻譜密度的平均估值而被計算,以及其中增益函數(shù)的連續(xù)樣本塊被平均。例如,頻譜相減增益函數(shù)的連續(xù)塊可以根據(jù)輸入信號的頻譜密度的估值與輸入信號的噪聲分量的頻譜密度的平均估值之間的差異被平均。
按照示例性實施例,通過使用控制的指數(shù)平均,把連續(xù)的增益函數(shù)塊進行平均。控制是通過例如制做反比于差異的指數(shù)平均的存儲器而被提供的。替換地,平均存儲器可被制做成隨差異減小成正比增長,而隨差異的增加成指數(shù)衰減,以便防止可聽到的模糊的話音。
按照本發(fā)明的示例性方法包括以下步驟計算輸入信號的頻譜密度的估值和輸入信號的噪聲分量的頻譜密度的平均估值,以及使用頻譜相減來根據(jù)有噪聲的輸入信號計算噪聲減小的輸出信號。按照示例性方法,在使用頻譜相減的步驟中所用的增益函數(shù)的連續(xù)塊被平均。例如,平均可以是根據(jù)輸入信號的頻譜密度的估值和噪聲分量的頻譜密度的平均估值之間的差異來進行的。
下面參照附圖上所示的說明性實例,詳細地描述本發(fā)明的上述及其它特征和優(yōu)點。本領(lǐng)域技術(shù)人員將會看到,所描述的實施例是為了說明和了解的目的而提供的,以及這里可能會有多個等價的實施例。
附圖簡述圖1是其中可實施本發(fā)明的教導(dǎo)的噪聲減小系統(tǒng)的方框圖。
圖2顯示了傳統(tǒng)的頻譜相減噪聲減小處理器。
圖3-4顯示了按照本發(fā)明的示例性頻譜相減噪聲減小處理器。
圖5顯示了通過使用按照本發(fā)明的頻譜相減技術(shù)而得到的示例的頻譜圖。
圖6-7顯示了通過使用按照本發(fā)明的頻譜相減技術(shù)而得到的示例的增益函數(shù)。
圖8-28顯示了按照本發(fā)明的示例的頻譜相減技術(shù)的仿真。
發(fā)明詳細描述為了了解本發(fā)明的各種特征和優(yōu)點,首先考慮傳統(tǒng)的頻譜相減技術(shù)是有用的。一般地,頻譜相減是根據(jù)這樣的假設(shè)而建立的,即,在通信應(yīng)用中的噪聲信號和語音信號是隨機的、不相關(guān)的,以及它們被相加在一起形成有噪聲的語音信號。例如,如果s(n)、w(n)和x(n)是分別代表語音、噪聲和有噪聲的語音的隨機的短時間平穩(wěn)過程,則x(n)=s(n)+w(n)(1)Rx(f)=Rs(f)+Rw(f) (2)其中R(f)表示隨機過程的功率譜密度。
噪聲功率譜密度Rw(f)可以在語音暫停期間被估值(即,其中x(n)=w(n))。為了估計語音的功率譜密度,估值被形成為R^S(f)=R^x(f)-R^w(f)------(3)]]>估計功率譜密度的傳統(tǒng)方法是使用周期圖。例如,如果XN(fu)是x(n)的N長度傅里葉變換,以及WN(fu)是w(n)的相應(yīng)傅里葉變換,則R^x(fx)=Px,N(fu)=1N|XN(fu)|2,fu=uN,u=0,...,N-1------(4)]]>R^w(fu)=Pw,N(fu)=1N|WN(fu)|2,fu=uN,u=0,...,N-1------(5)]]>式(3)、(4)和(5)可被組合來得到|SN(fu)|2=|XN(fu)|2-|WN(fu)|2(6)替換地,更一般的形式被給出為
|Sn(fu)|a=|XN(fu)|a-|WN(fu)|a(7)其中功率譜密度被調(diào)換為譜密度的一般形式。
由于人耳對語音的相位誤差不敏感,所以有噪聲的語音相位φx(f)可以作為干凈的語音相位的近似值φs(f)被使用φs(fu)≈φx(fu) (8)用于估計干凈語音的傅里葉變換的一般表示式因此被形成為SN(fu)=(|XN(fu)|a-k·|WN(fu)|a)1a·ejφx(fk)------(9)]]>其中參量k被引入來控制噪聲相減量。
為了簡化表示法,引入向量形式 向量按逐個元素被計算。為簡明起見,向量的逐個元素的乘法在這里用⊙表示。這樣,通過采用增益函數(shù)GN和使用向量表示法,式(9)可被寫為 其中增益函數(shù)被給出為GN=(|XN|a-k·|WN|a|XN|a)1a=(1-k·|WN|a|XN|a)1a------(12)]]>式(12)代表傳統(tǒng)的頻譜相減算法,如圖2所示。在圖2上,傳統(tǒng)的頻譜相減噪聲減小處理器200包括快速傅里葉變換處理器210、幅度平方處理器220、話音活動性檢測器230、塊方式平均裝置240、塊方式增益計算處理器250、乘法器260和快速傅里葉反變換處理器270。
如上所述,有噪聲的語音輸入信號被耦合到快速傅里葉變換處理器210的輸入端,以及快速傅里葉變換處理器210的輸出被耦合到幅度平方處理器220的輸入端和乘法器260的第一輸入端。幅度平方處理器220的輸出被耦合到開關(guān)225的第一觸片和增益計算處理器250的第一輸入端。話音活動性檢測器230的輸出被耦合到開關(guān)225的推動輸入端,以及開關(guān)225的第二觸片被耦合到塊方式平均裝置240的輸入端。塊方式平均裝置240的輸出被耦合到增益計算處理器250的第二輸入端,以及增益計算處理器250的輸出端被耦合到乘法器260的第二輸入端。乘法器260的輸出端被耦合到快速傅里葉反變換處理器270的輸入端,以及快速傅里葉反變換處理器270的輸出提供傳統(tǒng)的頻譜相減系統(tǒng)200的輸出。
在運行時,傳統(tǒng)的頻譜相減系統(tǒng)200通過使用上述的傳統(tǒng)的頻譜相減算法來處理進入的有噪聲的語音信號,以便提供更干凈的、噪聲減小的語音信號。實際上,圖2的各個部分可以通過使用任何的已知數(shù)字信號處理技術(shù)來實施,包括通用的計算機、一批集成電路和/或?qū)S眉呻娐?ASIC)。
應(yīng)當(dāng)指出,在傳統(tǒng)的頻譜相減算法中,有兩個參量a和k,它們控制噪聲相減量和語音質(zhì)量。設(shè)定第一個參量為a=2可提供功率頻譜相減,而設(shè)定第一個參量為a=1可提供幅度頻譜相減。另外,設(shè)定第一個參量為a=0.5可產(chǎn)生噪聲減小量的增加而同時僅僅使得語音適度地失真。這是由于在噪聲從有噪聲的語音中被減去以前頻譜已被壓縮。
第二參量k被調(diào)節(jié),以使得達到期望的噪聲減小。例如,如果選擇大的k,則語音失真增加。實際上,參量k典型地根據(jù)第一參量a被如何選擇而被設(shè)定。a的減小典型地也導(dǎo)致k參量的減小,以保持失真很低的語音。在功率頻譜相減的情況下,通常使用過相減(即,k>1)。
傳統(tǒng)的頻譜相減增益函數(shù)(見式(12))是從全部塊估值得到的,以及具有零相位。結(jié)果,相應(yīng)的沖激響應(yīng)gN(u)是非因果的,以及具有長度N(等于塊長度)。所以,增益函數(shù)GN(l)和輸入信號XN相乘(見式(11))導(dǎo)致具有非因果濾波的周期循環(huán)卷積。如上所述,周期循環(huán)卷積在時域上會導(dǎo)致不想要的混迭,以及濾波的非因果特性會導(dǎo)致塊間的不連續(xù)性,從而導(dǎo)致較差的語音質(zhì)量。有利地,本發(fā)明給出用于提供帶有因果增益濾波的正確卷積的方法和設(shè)備,由此消除了上述的時域混迭和塊間不連續(xù)性的問題。
對于時域混迭問題,應(yīng)注意到,在時域上的卷積相應(yīng)于頻域上的相乘。換句話說x(u)*y(u)-X(f)·Y(f),u=-∞,…,∞(13)當(dāng)變換是從長度N的快速傅里葉變換(FFT)得出時,相乘的結(jié)果不是正確的卷積。相反地,結(jié)果為帶有N的周期性的循環(huán)卷積 其中符號 表示循環(huán)卷積。
為了在使用快速傅里葉變換時得出正確的卷積,沖激響應(yīng)xN和yN的累積階數(shù)必須小于或等于塊長度減1,即N-1。
這樣,按照本發(fā)明,由于周期循環(huán)卷積造成的時域混迭問題可以通過使用增益函數(shù)GN(l)和具有小于或等于N-1的總階數(shù)的輸入信號塊XN而被解決。
按照傳統(tǒng)的頻譜相減,輸入信號的頻譜XN具有全部塊長度N。然而,按照本發(fā)明,長度L(L<N)的輸入信號塊xL被使用來構(gòu)建L階的頻譜。長度L被稱為幀長度,因此xL是一幀。由于與長度N的增益函數(shù)相乘的頻譜也是具有長度N,所以幀xL是用零填充到全部塊長度N而導(dǎo)致XL↑N。
為了構(gòu)建長度N的增益函數(shù),按照本發(fā)明的增益函數(shù)可以從長度M的增益函數(shù)GM(l)被內(nèi)插以形成GM↑N(l),其中M<N。為了得到按照本發(fā)明的低階增益函數(shù)GM↑N(l),可以使用任何已知的或還在開發(fā)的頻譜估計技術(shù)來作為對上述簡單的傅里葉變換周期圖的替換例。幾種已知的頻譜估計技術(shù)提供了結(jié)果的增益函數(shù)中的較低的方差。例如,參閱J.G.Proakis和D.G.Manolakis的“Digital Signal Processing:Principles,Algorithms,and Applications(數(shù)字信號處理原理,算法和應(yīng)用)”,Macmillan,Second Ed.,1992。
例如,按照熟知的Bartlett方法,長度N的塊被劃分成K個長度M的子塊。每個子塊的周期圖然后被計算,以及其結(jié)果被平均以給出對于整個塊的M長的周期圖為Px,M(fu)=1KΣK=0K-1Px,M,k(fu),fu=uM,u=0,...,M-1]]> 有利地,當(dāng)子塊是不相關(guān)時,比起全部塊長度周期圖方差減小K倍。頻率分辨率也減小相同的倍數(shù)。
替換地,可以使用Welch方法。除了每個子塊用Hanning窗加上窗口以及允許子塊互相重疊以產(chǎn)生更多的子塊外,Welch方法類似于Bartlett方法。由Welch方法提供的方差與Bartlett方法相比被進一步減小。Bartlett和Welch方法只是兩種頻譜估值方法,也可以使用其它已知的頻譜估值技術(shù)。
不考慮實施的精確頻譜估值技術(shù),甚至進一步通過使用平均技術(shù),也有可能和有希望減小噪聲周期圖估值的方差。例如,在噪聲是長期平穩(wěn)的假設(shè)下,有可能平均從上述的Bartlett和Welch方法造成的周期圖。一種技術(shù)利用的指數(shù)平均為Px,M(l)=α·Px,M(l-1)+(1-α)·Px,M(l)(16)在式(16)中,通過使用Bartlett或Welch方法計算函數(shù)Px,M(l),函數(shù)Px,M(l)是當(dāng)前決的指數(shù)平均,以及函數(shù)Px,M(l-1)是先前塊的指數(shù)平均。參量α控制指數(shù)存儲器的長度,以及典型地不應(yīng)當(dāng)超過可以認為噪聲是平穩(wěn)的那個長度。更接近于1的α導(dǎo)致更長的指數(shù)存儲器以及周期圖方差的顯著減小。
長度M被稱為子塊長度,以及產(chǎn)生的低階增益函數(shù)具有長度M的沖激響應(yīng)。因此,在增益函數(shù)的組合中利用的噪聲周期圖估值PxL,M(l)和有噪聲的語音周期圖估值PxL,M(l)也具有長度MGM(l)=(1-k·P_xL·Ma(l)PxL·Ma(l))1a------(17)]]>按照本發(fā)明,這是通過使用來自輸入幀XL的較短的周期圖估值和使用例如Bartlett方法的平均而達到的。Bartlett方法(或其它適當(dāng)?shù)墓乐捣椒?減小了估值的周期圖的方差,以及頻率分辨率也有減小。從L個頻率接收器到M個頻率接收器的分辨率的減小,意味著周期圖估值PxL,M(l)也是具有長度M的。另外,噪聲周期圖估值PxL,M(l)通過使用如上所述的指數(shù)平均可以進一步減小。
為了滿足總的階數(shù)小于或等于N-1的要求,要使得被加到子塊長度M的幀的長度L小于N。因此,有可能形成想要的輸出塊為SN=GMIN(l)⊙ XLIN(18)有利地,按照本發(fā)明的低階濾波器也提供了機會去解決在傳統(tǒng)的頻譜相減算法中由增益濾波器的非因果性質(zhì)造成的問題(即,塊間不連續(xù)性和降低的語音質(zhì)量)。具體地,按照本發(fā)明,可以把相位加到增益函數(shù)中以提供因果濾波器。按照示例性實施例,相位可以根據(jù)幅度函數(shù)被構(gòu)建,以及可以是(按所想要的)線性相位或最小相位。
為了構(gòu)建按照本發(fā)明的線性相位濾波器,首先觀察,如果FFT的塊長度是長度M,則在時域上的循環(huán)移位是在頻域上的與相位函數(shù)的相乘g(n-l)M-GM(fu)·e-j2πullM,fu=uM,u=0,...,M-1------(19)]]>在當(dāng)前的情況下,l等于M/2+l,因為沖激響應(yīng)中的第一位置具有零延時(即,因果濾波器)。所以g(n-(M/2+1))M·GM(fu)·e-jπu(1+2M)------(20)]]>以及因此線性相位濾波器GM(fu)被得出為G_M(fu)=GM(fu)·e-jπu(1+2M)------(21)]]>按照本發(fā)明,增益函數(shù)也被內(nèi)插成長度N,這是通過例如使用平滑內(nèi)插完成的。被加到增益函數(shù)中的相位隨之被改變,導(dǎo)致G_M|N(fu)=GM|N(fu)·e-jπu(1+2M)·MN------(22)]]>有利地,線性相位濾波器的構(gòu)建也可以在時域上被實現(xiàn)。在這樣的情況下,通過使用IFFT,增益函數(shù)GM(fu)被變換到時域,在其中完成循環(huán)移位。移位的沖激響應(yīng)被用零填充到長度N,然后通過使用N長度的FFT被變換回去。這導(dǎo)致所想要的內(nèi)插因果線性相位濾波器GM↑N(fu)。
按照本發(fā)明的因果最小相位濾波器可以通過利用Hilbert變換關(guān)系根據(jù)增益函數(shù)被構(gòu)建。例如,參閱A.V.Oppenheim和R.W.Schafer的“Discrete-Time Signal Processing(離散時間信號處理)”,Prentic-Hall,Inter.Ed.,1989。Hilbert變換關(guān)系是指復(fù)函數(shù)的實部與虛部之間的唯一關(guān)系。有利地,當(dāng)使用復(fù)數(shù)信號的對數(shù)時,這也可以被利用于幅度與相位之間的關(guān)系ln(|GM(fu)|·ej·arg(GM(fu)))=ln(|GM(fu)|)+ln(ej·arg(GM(fu)))------(23)]]>=ln(|GM(fu)|)+j·arg(GM(fu))]]>在本文中,相位是零,結(jié)果是實函數(shù)。通過利用長度M的IFFT,函數(shù)ln(|GM(fu)|)被變換到時域而形成gM(n)。時域函數(shù)被重新安排為 通過使用M長的FFT,函數(shù)gM(n)被變換回頻域而產(chǎn)生 由此,形成函數(shù)GM(fu)。因果最小相位濾波GM(fu)然后被內(nèi)插成長度N。內(nèi)插是以與上述線性相位情形中相同的方式進行的。產(chǎn)生的內(nèi)插的濾波器GM↑N(fu)是因果的,以及具有近似的最小相位。
圖3顯示按照本發(fā)明的、上述的頻譜相減方案。在圖3上,用來提供線性卷積和因果濾波的頻譜相減噪聲減小處理器300被顯示為包括Bartlett處理器305、幅度平方處理器320、話音活動性檢測器330、塊方式平均處理器340、低階增益計算處理器350、增益相位處理器355、內(nèi)插處理器356、乘法器360、快速傅里葉反變換處理器370以及重疊與相加處理器380。
如圖所示,有噪聲的語音輸入信號被耦合到Bartlett處理器305的輸入端和快速傅里葉變換處理器310的輸入端。Bartlett處理器305的輸出被耦合到幅度平方處理器320的輸入端以及快速傅里葉變換處理器310的輸出被耦合到乘法器360的第一輸入端。幅度平方處理器320的輸出被耦合到開關(guān)325的第一觸片和低階增益計算處理器350的第一輸入端。話音活動性檢測器330的控制輸出端被耦合到開關(guān)325的推動輸入端,以及開關(guān)325的第二觸片被耦合到塊方式平均裝置340的輸入端。
塊方式平均裝置340的輸出端被耦合到低階增益計算處理器350的第二輸入端,以及低階增益計算處理器350的輸出被耦合到增益相位處理器355的輸入端。增益相位處理器355的輸出被耦合到內(nèi)插處理器356的輸入端,以及內(nèi)插處理器356的輸出被耦合到乘法器360的第二輸入端。乘法器360的輸出被耦合到快速傅里葉反變換處理器370的輸入端,以及快速傅里葉反變換處理器370的輸出被耦合到重疊和相加處理器380的輸入端。重疊和相加處理器380的輸出端提供示例的噪聲減小處理器300的減小噪聲的、干凈的語音輸出。
在運行時,按照本發(fā)明的頻譜相減噪聲減小處理器300通過使用上述的線性卷積、因果濾波算法來處理進入的有噪聲的語音信號,以便提供干凈的、噪聲減小的語音信號。實際上,圖3的各個組成部分可以通過使用任何的已知數(shù)字信號處理技術(shù)來實施,其中包括通用的計算機、一批集成電路和/或?qū)S眉呻娐?ASIC)。
有利地,通過根據(jù)本發(fā)明的控制的指數(shù)增益函數(shù)平均方案,本發(fā)明的增益函數(shù)GM(l)的方差可被進一步減小。按照示例性實施例,平均是取決于當(dāng)前塊頻譜Px,M(l)與平均的噪聲頻譜Px,M(l)之間的差異來進行的。例如,當(dāng)有小的差異時,可以提供增益函數(shù)GM(l)的長的平均,相應(yīng)于平穩(wěn)背景噪聲情形。反之,當(dāng)有大的差異時,可以提供增益函數(shù)GM(l)的短的平均或不進行平均,相應(yīng)于有語音或背景噪聲變化很大的情形。
為了處理從語音時間間隔瞬時切換到背景噪聲時間間隔,增益函數(shù)的平均不是正比于差異的減小而被增加,因為這樣做會引入可聽見的模糊的話音(因為適用于語音頻譜的增益函數(shù)將保持長的時間間隔)。所以作為替代,將允許平均慢慢地增加以提供時間使增益函數(shù)適合于平穩(wěn)輸入。
按照示例性實施例,頻譜之間的差異度量被規(guī)定為,β(l)=Σu|Px,M,u(l)-P_x,M,u(l)|ΣuP_x,M,u(l)------(25)]]>其中β(l)被限制為, 以及其中β(l)=1導(dǎo)致增益函數(shù)的非指數(shù)平均,以及β(l)=βmin提供最大程度的指數(shù)平均。
參量β(l)是頻譜之間差異的指數(shù)平均,被描述為,β(l)=γ·β(l-1)+(1-γ)·β(l)(27)當(dāng)從頻譜之間具有高差異的時間間隔轉(zhuǎn)移到具有低差異的時間間隔的情形出現(xiàn)時,式(27)中的參量γ被使用來確保增益函數(shù)適應(yīng)于新的水平。如上所述,完成這一點是為了防止模糊的話音。按照示例性實施例,適應(yīng)是在由于β(l)的減小的水平而開始增益函數(shù)的增加的指數(shù)平均之前完成的。這樣 當(dāng)差異β(l)增加時,參量β(l)直接隨之增加,但當(dāng)差異減小時,對于β(l)采用指數(shù)平均以形成平均的參量β(l)。增益函數(shù)的指數(shù)平均被描述為GM(l)=(1-β(l))·GM(l-1)+β(l)·GM(l)(29)以上的等式可以對于不同的輸入信號條件解釋如下。在噪聲期間,方差被減小。只要噪聲頻譜對于每個頻率具有平穩(wěn)的數(shù)值,它可被平均以減小方差。噪聲電平改變會導(dǎo)致平均噪聲頻譜Px,M(l)與當(dāng)前塊的頻譜Px,M(l)之間的差異。因此,控制的指數(shù)平均方法降低了增益函數(shù)平均,直至噪聲電平平穩(wěn)在一個新的水平。這種情形使得能夠控制噪聲電平改變,以及使得在平穩(wěn)噪聲時間間隔期間的方差減小和提示響應(yīng)于噪聲改變。高能量的語音常常具有時變的頻譜峰值。當(dāng)來自不同塊的頻譜峰值被平均時,它們的頻譜估值包含這些峰值的平均,因此看來像更寬的頻譜,這會導(dǎo)致降低的語音質(zhì)量。這樣,在高能量語音時間間隔期間指數(shù)平均被保持為最小。由于平均噪聲頻譜Px,M(l)與當(dāng)前的高能量語音頻譜Px,M(l)之間的差異很大,所以不執(zhí)行增益函數(shù)的指數(shù)平均。在低能量語音時間間隔期間,通過短存儲器來使用指數(shù)平均,短存儲器取決于當(dāng)前低能量語音頻譜與平均噪聲頻譜之間的差異。因此低能量語音的方差減小量比背景噪聲時間間隔期間的低,而比高能量語音時間間隔期間的大。
圖4上顯示按照本發(fā)明的、上述的頻譜相減方案。在圖4上,頻譜相減噪聲減小處理器400提供線性卷積、因果濾波和控制的指數(shù)平均,它被顯示為包括圖3的系統(tǒng)300的Bartlett處理器305、幅度平方處理器320、話音活動性檢測器330、塊方式平均裝置340、低階增益計算處理器350、增益相位處理器355、內(nèi)插處理器356、乘法器360、快速傅里葉反變換處理器370和重疊與相加處理器380,以及平均控制處理器445、指數(shù)平均處理器446和可任選的固定FIR后濾波器465。
如圖所示,有噪聲的語音輸入信號被耦合到Bartlett處理器305的輸入端和快速傅里葉變換處理器310的輸入端。Bartlett處理器305的輸出被耦合到幅度平方處理器320的輸入端以及快速傅里葉變換處理器310的輸出被耦合到乘法器360的第一輸入端。幅度平方處理器320的輸出被耦合到開關(guān)325的第一觸片、低階增益計算處理器350的第一輸入端和平均控制處理器445的第一輸入端。
話音活動性檢測器330的控制輸出端被耦合到開關(guān)325的推動輸入端,以及開關(guān)325的第二觸片被耦合到塊方式平均裝置340的輸入端。塊方式平均裝置340的輸出端被耦合到低階增益計算處理器350的第二輸入端和平均控制器445的第二輸入端。低階增益計算處理器350的輸出端被耦合到指數(shù)平均處理器446的信號輸入端,以及平均控制器445的輸出被耦合到指數(shù)平均處理器446的控制輸入端。
指數(shù)平均處理器446的輸出被耦合到增益相位處理器355的輸入端,以及增益相位處理器355的輸出被耦合到內(nèi)插處理器356的輸入端。內(nèi)插處理器356的輸出被耦合到乘法器360的第二輸入端,以及可任選的固定FIR后濾波器465的輸出被耦合到乘法器360的第三輸入端。乘法器360的輸出被耦合到快速傅里葉反變換處理器370的輸入端,以及快速傅里葉反變換處理器370的輸出被耦合到重疊和相加處理器380的輸入端。重疊和相加處理器380的輸出端提供示例的系統(tǒng)400的干凈的語音信號。
在運行時,按照本發(fā)明的頻譜相減噪聲減小處理器400通過使用上述的線性卷積、因果濾波和控制指數(shù)平均算法來處理進入的有噪聲的語音信號,以便提供改善的、噪聲減小的語音信號。正如圖3的實施例那樣,圖4的各個組成部分可以通過使用任何的已知數(shù)字信號處理技術(shù)來實施,其中包括通用的計算機、一批集成電路和/或?qū)S眉呻娐?ASIC)。
應(yīng)當(dāng)指出,由于按照示例性實施例,選擇幀長度L和子塊長度M的總和小于N-1,所以可以加上長度為J≤N-1-L-M的額外的固定FIR濾波器465,如圖4所示。后濾波器465是如圖所示通過把濾波器的內(nèi)插沖激響應(yīng)乘上信號頻譜而被實施的。內(nèi)插到長度N是通過用零填充的濾波器和利用N長度的FFT而實施的。這個后濾波器465可被使用來濾除電話帶寬或恒定音調(diào)的分量。替換地,后濾波器465的功能可被直接包括在增益函數(shù)內(nèi)。
上述算法的參量實際上根據(jù)在其中實施該算法的特定應(yīng)用而被設(shè)定。作為實例,此后針對免提GSM汽車移動電話來描述參量選擇。
首先,根據(jù)GSM技術(shù)規(guī)范,幀長度L被設(shè)定為160個樣本,它提供20毫秒的幀。L的其它選擇可被使用于其它系統(tǒng)。然而,應(yīng)當(dāng)指出,幀長度L的增加相應(yīng)于延時的增加。子塊長度M(例如,用于Bartlett處理器的周期圖長度)被做得很小,以便提供增加的方差減小量M。由于FFT被使用來計算周期圖,所以長度M可以方便地被設(shè)定為2的冪次。頻率分辨率因而被確定為B=FsM------(30)]]>GSM系統(tǒng)的采樣速率是8000Hz。這樣,長度M=16、M=32、和M=64便分別給出500Hz、250Hz、和125Hz的頻率分辨率,如圖5所示。在圖5上,曲線(a)描繪干凈的語音信號的簡單周期圖,以及曲線(b)、(c)和(d)分別描繪通過使用Bartlett方法用32、16和8個頻帶計算的干凈的語音信號的周期圖。250Hz的頻率分辨率對于語音和噪聲信號是合理的,因此M=32。這便產(chǎn)生長度L+M=160+32=192,如上所述,它應(yīng)當(dāng)小于N-1。這樣,例如,把N選擇為大于192的、2的冪(例如,N=256)。在這種情況下,如果想要的話,可以應(yīng)用長度J≤63的可任選的FIR后濾波器。
如上所述,噪聲相減量由a和k參量控制。參量選擇a=0.5(即,頻譜相減的平方根)提供強的噪聲減小,而同時保持低的語音失真。這被顯示在圖6中(其中語音加噪聲估值是1以及k是1)。從圖6上看到,a=0.5與更高的a的數(shù)值相比提供更多的噪聲減小。為了簡明起見,圖6只表示了一個頻率接收器,并且在后面描述的是針對這個頻率接收器的SNR。
按照示例性實施例,當(dāng)使用a=0.5時,把參量k做得相對較小。在圖7上,顯示了對于a=0.5(再次地,語音加噪聲估值是1)時對于不同k數(shù)值的增益函數(shù)。當(dāng)趨近較低的SNR時,增益函數(shù)應(yīng)當(dāng)連續(xù)地減小,這是k≤1時的情況。仿真表明,k=0.7給出低的語音失真,而同時保持高的噪聲減小。
如上所述,噪聲頻譜估值被指數(shù)平均,以及參量α控制指數(shù)存儲器的長度。因為增益函數(shù)被平均,對于噪聲頻譜估值平均的要求將較小。仿真表明,0.6<α<0.9提供了想要的方差減小,產(chǎn)生大約2到10幀的時間常數(shù)τframe≈-1lnα------(31)]]>噪聲估值的指數(shù)平均被選擇為,例如,α=0.8。
參量βmin確定增益函數(shù)的指數(shù)平均的最大時間常數(shù)。以秒計的時間常數(shù)τβmin被使用來確定βmin為βmin=1-e-LFs·τβmin------(32)]]>2分鐘的時間常數(shù)對于平穩(wěn)的噪聲信號是合理的,相應(yīng)于βmin≈0。換句話說,(在式(32)中)對于β(l)不需要有下限,因為β(l)≥0(按照式(25))。
參量γc控制在從語音轉(zhuǎn)換到平穩(wěn)輸入信號時所允許的被控制指數(shù)平均存儲器的增加速度(即,參照式(27)和(28)允許參量β(l)以怎樣的速度減小)。當(dāng)使用長的存儲器完成增益函數(shù)的平均時,這會導(dǎo)致模糊的話音,因為增益函數(shù)記錄了語音頻譜。
例如,考慮在有噪聲的語音頻譜估值PM(l)與噪聲頻譜估值PM(l)之間的差異從一個極端值變到另一個極端值的極端情形。在第一種情形下,差異是很大的,這樣在一段長的時間間隔內(nèi)對于所有的頻率GM(l)≈1。因此,β(l)=β(l)=1。接著,頻譜估值被處理成PM(l)=PM(l),為了仿真極端情形,其中β(l)=0和GM(l)=(1-k)1/a。β(l)參量將取決于參量γc而減小到零。因此,參量值為β(-1)=1,GM(-1)=1,β(-1)=1,GM(-1)=1,(33)β(l)=0,GM(l)=0.09,l=0,1,2…把已知的參量代入式(27)和(29)中,產(chǎn)生β(l)=γc(l+1)(34)GM(l)=(1-β(l))·GM(l-1)+0.09·β(l)(35)其中l(wèi)是減小能量后的塊數(shù)。如果增益函數(shù)被選擇為在2幀后達到時間常數(shù)水平e-1,那么γc≈0.506。圖8的曲線(a)和(b)顯示對于不同的γc數(shù)值的這種極端情形。圖8的曲線(c)和(d)也給出了對于能量較慢的減小的更現(xiàn)實的仿真。e-1水平線代表一個時間常數(shù)的水平(即,當(dāng)這個水平被交叉時,一個時間常數(shù)已過去)。圖9給出使用記錄的輸入信號的實際仿真的結(jié)果,表明γc=0.8是對于防止模糊話音的良好的選擇。
此后,給出使用以上提出的參量選擇所得到的結(jié)果。有利地,仿真結(jié)果表明,比起其它的頻譜相減方法來說,達到了在語音質(zhì)量和殘余背景噪聲質(zhì)量方面的改進,而同時仍提供了強的噪聲減小。增益函數(shù)的指數(shù)平均主要負責(zé)提高殘余噪聲的質(zhì)量。正確的卷積與因果濾波相組合,提高總的聲音質(zhì)量,以及有可能得到短的延時。
在仿真時,對于有噪聲的語音信號使用了熟知的GSM話音活動性檢測器(例如,參閱歐洲數(shù)字蜂窩電信系統(tǒng)(階段2);話音活動性檢測(VAD)(GSM 06.32),歐洲電信標準委員會,1994)。在仿真時使用的信號是根據(jù)汽車中記錄的語音和噪聲的分開的記錄被組合的。語音記錄是在安靜的汽車中使用免提設(shè)備和模擬電話帶寬濾波器進行的。噪聲序列是使用相同的設(shè)備在運動的汽車中被記錄的。
比較所執(zhí)行的噪聲減小與所接收的語音質(zhì)量。上述的參量選擇相對大的噪聲減小而言更重視有良好的聲音質(zhì)量。當(dāng)作出更積極的選擇時,得到改進的噪聲減小。圖10和11分別給出輸入的語音和噪聲,其中使用1∶1的關(guān)系把兩個輸入相加在一起。圖12給出產(chǎn)生的有噪聲的輸入語音信號。圖13顯示噪聲減小的輸出信號。這些結(jié)果也可以在能量的意義上被給出,這使得容易計算噪聲減小以及如果某些語音時間間隔沒有被增強,則也可顯露出。圖14、15和16分別給出干凈的語音、有噪聲的語音和在噪聲減小后產(chǎn)生的輸出語音。如圖所示,得到大約13dB的噪聲減小。當(dāng)輸入是通過使用語音和汽車噪聲以2∶1的關(guān)系相加在一起而被形成時,輸入SNR的增加是如圖17和19給出的。圖18和20給出結(jié)果的信號,其中可以估計有接近于18dB的噪聲減小。
進行了附加的仿真以便清楚地表明具有增益函數(shù)的適當(dāng)?shù)臎_激響應(yīng)長度以及因果性質(zhì)的重要性。后面給出的序列都是來自長度為30秒的有噪聲的語音的。這些序列被表示為來自IFFT的輸出的絕對平均值|sN|(見圖4)。IFFT給出256長的數(shù)據(jù)塊,取每個數(shù)據(jù)值的絕對值以及進行平均。這樣,可以明顯地看出增益函數(shù)的不同選擇的效果(即,非因果濾波、較短和較長的沖激響應(yīng)、最小相位或線性相位)。
圖21給出由具有較短長度M的沖激響應(yīng)的增益函數(shù)產(chǎn)生的平均值|sN|,以及由于增益函數(shù)具有零相位所以是非因果的。這可以通過在平均塊的末端處的M=32樣本中的高水平而觀察到。
圖22給出由具有全部長度N的沖激響應(yīng)的增益函數(shù)產(chǎn)生的平均值|sN|,以及由于增益函數(shù)具有零相位所以是非因果的。這可以通過在平均塊的末端處的樣本中的高水平而觀察到。這種情況下的相位和長度相應(yīng)于用于傳統(tǒng)的頻譜相減的增益函數(shù)。全部長度增益函數(shù)是通過內(nèi)插噪聲和有噪聲的語音周期圖而不是內(nèi)插增益函數(shù)而得到的。
圖23給出由具有較短長度M的沖激響應(yīng)的最小相位的增益函數(shù)產(chǎn)生的平均值|sN|。施加到增益函數(shù)的最小相位使得它是因果的。因果性可以通過在平均塊的末端處的樣本中的低水平而觀察到。最小相位濾波器給出M=32樣本的最大延時,這可在圖23上從樣本160到192的斜率看出。該延時在增益函數(shù)是因果的限制條件下是最小的。
圖24給出由具有全部長度N的沖激響應(yīng)的增益函數(shù)產(chǎn)生的平均值|sN|,以及被限制為具有最小相位。限制于最小相位給出N=256樣本的最大延時,以及由于該幀在256個樣本的全部塊的起始處是160個樣本,所以所述塊可以保持96個樣本的最大線性延時。這可以在圖24上通過從樣本160到255的斜率看出,它沒有達到零。由于延時可以長于96,所以這導(dǎo)致循環(huán)延時,以及在最小相位的情況下,很難檢測到與幀部分重疊的延時的樣本。
圖25給出由具有較短長度M的沖激響應(yīng)的線性相位的增益函數(shù)產(chǎn)生的平均值|sN|。施加到增益函數(shù)的線性相位使得增益函數(shù)是因果的。這可以通過在平均塊的末端處的樣本中的低水平而觀察到。具有線性相位增益函數(shù)的延時是M/2=16樣本,正如從樣本0到15和160到175的斜率可看出的。
圖26給出由具有全部長度N的沖激響應(yīng)的增益函數(shù)產(chǎn)生的平均值|sN|,以及被限制為具有線性相位。限制于線性相位給出N/2=128樣本的最大延時。由于該幀在256個樣本的全部塊的起始處是160個樣本,所以該塊可以保持96個樣本的最大線性延時。被延時超過96個樣本的樣本導(dǎo)致看到的循環(huán)延時。
相應(yīng)于重疊的、塊中的低樣本值的好處是減小的塊間干擾,因為重疊不會引入不連續(xù)性。當(dāng)使用全部長度的沖激響應(yīng)時(這是傳統(tǒng)的頻譜相減的情況),對于線性相位或最小相位引入的延時會超過塊的長度。產(chǎn)生的循環(huán)延時給出繞回的延時樣本,所以輸出的樣本可以是按錯誤的次序的。這表示,當(dāng)線性相位或最小相位增益函數(shù)被使用時應(yīng)當(dāng)選擇較短的沖激響應(yīng)的長度。線性或最小相位的引入使得增益函數(shù)是因果的。
當(dāng)輸出信號的聲音質(zhì)量是最重要的因素時,應(yīng)當(dāng)使用線性相位濾波器。當(dāng)延時是重要因素時,應(yīng)當(dāng)使用非因果零相位濾波器,盡管比起使用線性相位濾波器來說,這會失去語音質(zhì)量。比較好的折衷是具有短的延時和良好的語音質(zhì)量的最小相位濾波器,雖然這樣會使復(fù)雜性比起使用線性相位濾波器更高。相應(yīng)于短的長度M的沖激響應(yīng)的增益函數(shù)總是應(yīng)當(dāng)被使用來改進聲音質(zhì)量的。
當(dāng)信號平穩(wěn)時,增益函數(shù)的指數(shù)平均提供較低的方差。主要優(yōu)點是音樂音和殘余噪聲的減小。圖27和28上給出帶有和沒有指數(shù)平均的增益函數(shù)。如圖所示,當(dāng)采用指數(shù)平均時,在噪聲時間間隔期間和在低能量的語音時間間隔內(nèi),信號的變化性是較低的。增益函數(shù)的較低的變化性導(dǎo)致輸出信號中不太顯著的人工產(chǎn)生的音調(diào)。
總之,本發(fā)明提供通過使用線性卷積、因果濾波、和/或增益函數(shù)的控制的指數(shù)平均而用于頻譜相減的改進的方法和設(shè)備。示例性方法提供改進的噪聲減小,以及對于不一定是2的冪次的幀長度很起作用。當(dāng)噪聲減小方法與其它的語音增強方法以及語音編碼器相結(jié)合時,這可以是重要的性質(zhì)。
示例性方法以兩種重要的方式減小增益函數(shù)(在本例中是復(fù)函數(shù))的變化性。首先,當(dāng)前塊頻譜估計的方差是用頻譜估計方法通過用頻率分辨率交換方差減小而被減小的。第二,提供增益函數(shù)的指數(shù)平均,它取決于估計的噪聲頻譜與當(dāng)前輸入信號頻譜估值之間的差異。在平穩(wěn)輸入信號期間增益函數(shù)的低的變化性給出具有較小的音調(diào)殘余噪聲的輸出。增益函數(shù)的較低的分辨率也被利用來執(zhí)行正確的卷積,產(chǎn)生改善的聲音質(zhì)量。通過把因果性質(zhì)加到增益函數(shù)上,聲音質(zhì)量被進一步增強。有利地,質(zhì)量改善可以在輸出塊中看到。聲音質(zhì)量的改善是由于輸出塊的重疊部分具有大大地減小的樣本值,所以,當(dāng)用長度和相加方法裝配這些塊時,這些塊的干擾較少。通過使用上述的示例性參量選擇,輸出的噪聲可減小13-18dB。
本領(lǐng)域技術(shù)人員將看到,本發(fā)明并不限于這里為了說明目的而描述的特定的示例性實施例,以及多種替換的實施例也是可以預(yù)料的。例如,雖然是在免提通信應(yīng)用方面描述了本發(fā)明,但本領(lǐng)域技術(shù)人員將看到,本發(fā)明的教導(dǎo)同樣可應(yīng)用于其中希望去除特定的信號分量的任何信號處理應(yīng)用中。所以,本發(fā)明的范圍是由附屬的權(quán)利要求,而不是由以上的說明規(guī)定的,以及應(yīng)能把與權(quán)利要求的意義一致的所有等價物都包括在內(nèi)。
權(quán)利要求
1.一種噪聲減小系統(tǒng),包括頻譜相減處理器,被配置來濾波有噪聲的輸入信號以給出噪聲減小的輸出信號,其中頻譜相減處理器的增益函數(shù)根據(jù)輸入信號的頻譜密度的估值和根據(jù)輸入信號的噪聲分量的頻譜密度的平均估值而被計算,以及其中增益函數(shù)的樣本的連續(xù)塊被平均。
2.權(quán)利要求1的噪聲減小系統(tǒng),其特征在于,其中增益函數(shù)的連續(xù)塊根據(jù)輸入信號的頻譜密度的估值與輸入信號的噪聲分量的頻譜密度的平均估值之間的差異被平均。
3.權(quán)利要求1的噪聲減小系統(tǒng),其特征在于,其中通過使用指數(shù)平均來對增益函數(shù)的樣本的連續(xù)塊進行平均。
4.權(quán)利要求1的噪聲減小系統(tǒng),其特征在于,其中平均的存儲器反比于差異。
5.權(quán)利要求1的噪聲減小系統(tǒng),其特征在于,其中平均的存儲器被做成隨差異減小而成正比增長,以及被做成隨差異增加而成指數(shù)衰減。
6.用于處理有噪聲的輸入信號以便提供噪聲減小的輸出信號的方法,它包括以下步驟計算輸入信號的頻譜密度的估值和輸入信號的噪聲分量的頻譜密度的平均估值;使用頻譜相減來根據(jù)有噪聲的輸入信號計算噪聲減小的輸出信號;以及平均增益函數(shù)的連續(xù)塊,該增益函數(shù)用于所述使用頻譜相減以便計算噪聲減小的輸出信號的步驟中。
7.權(quán)利要求6的方法,其特征在于,包括以下步驟根據(jù)輸入信號的頻譜密度的估值和輸入信號的噪聲分量的頻譜密度的平均估值的差異來平均增益函數(shù)的連續(xù)塊。
8.權(quán)利要求6的方法,其特征在于,包括通過使用指數(shù)平均來平均增益函數(shù)的樣本的連續(xù)塊的步驟。
9.權(quán)利要求6的方法,其特征在于,其中增益函數(shù)的連續(xù)塊的平均的存儲器反比于該差異。
10.權(quán)利要求6的方法,其特征在于,其中連續(xù)塊的平均的存儲器被做成隨差異減小而成正比增長,以及被做成隨差異增加而成指數(shù)衰減。
11.一種移動電話,包括頻譜相減處理器,被配置成濾波有噪聲的近端語音信號以給出噪聲減小的近端語音信號,其中頻譜相減處理器的增益函數(shù)根據(jù)有噪聲的近端語音信號的頻譜密度的估值和根據(jù)有噪聲的近端語音信號的噪聲分量的頻譜密度的平均估值而被計算,以及其中增益函數(shù)的樣本的連續(xù)塊被平均。
12.權(quán)利要求11的移動電話,其特征在于,其中增益函數(shù)的連續(xù)塊根據(jù)有噪聲的近端語音信號的頻譜密度的估值與有噪聲的近端語音信號的噪聲分量的頻譜密度的平均估值之間的差異而被平均。
13.權(quán)利要求11的移動電話,其特征在于,其中通過使用指數(shù)平均來平均增益函數(shù)的樣本的連續(xù)塊。
14.權(quán)利要求11的移動電話,其特征在于,其中平均的存儲器反比于該差異。
15.權(quán)利要求11的移動電話,其特征在于,其中平均的存儲器被做成隨差異減小而成正比增長,以及被做成隨差異增加而成指數(shù)衰減。
全文摘要
噪聲減小系統(tǒng)中用于提供語音增強的方法和設(shè)備,包括使用線性卷積、因果濾波和/或頻譜相減增益函數(shù)的頻譜有關(guān)的指數(shù)平均的頻譜相減算法。按照示例性實施例,頻譜相減增益函數(shù)的連續(xù)塊根據(jù)有噪聲的語音信號的頻譜密度的估值和有噪聲的語音信號的噪聲分量的頻譜密度的平均估值而被平均。增益函數(shù)的連續(xù)塊被例如通過使用控制的指數(shù)平均被平均??刂剖抢缤ㄟ^制做反比于差異的指數(shù)平均存儲器而被提供的。替換地,平均存儲器可被做成隨差異減小而成正比增長,以及隨差異增加而成指數(shù)衰減,以便防止可聽到的模糊的話音。
文檔編號G10L15/20GK1310840SQ9980898
公開日2001年8月29日 申請日期1999年5月27日 優(yōu)先權(quán)日1998年5月27日
發(fā)明者H·古斯塔夫松, I·克萊松, S·諾德霍姆 申請人:艾利森電話股份有限公司