本發(fā)明實施例涉及語音信號處理技術,尤其涉及一種語音去噪的方法及裝置。
背景技術:
在實時語音通信過程中,會遇到各種噪聲干擾問題,特別是對于手機等移動設備來說,語音噪聲問題顯得尤為突出。此外,在通過揚聲器播放聲音的情況下,由于存在回聲問題,所以相對于遠距離錄音來說,該情況下語音的音質極易受到外在環(huán)境噪音和非線性殘余回聲的影響。
為了提高語音通信質量,需要對語音進行去噪處理,以提高語音的清晰度。傳統(tǒng)的語音去噪算法通常假設噪聲是加性的及平穩(wěn)的,使用語音活動檢測(Voice Activity Detection,VAD)技術將帶噪語音區(qū)分為語音部分和非語音部分(即無聲段),非語音部分主要表現(xiàn)為噪聲特性,然后再通過某種統(tǒng)計方法對非語音部分進行處理,即可獲得背景噪聲特性的近似估計。然而,語音部分中的噪聲與非語音部分的噪聲可能存在區(qū)別,尤其是在受到殘余回聲影響的情況下(存在乘性的噪音),僅根據(jù)對非語音部分的噪聲估計結果來對整體語音信號進行去噪處理的效果不佳。
技術實現(xiàn)要素:
本發(fā)明實施例提供了一種語音去噪的方法及裝置,以改善現(xiàn)有語音去噪方案的去噪效果。
第一方面,本發(fā)明實施例提供了一種語音去噪的方法,該方法包括:
對帶噪語音信號進行語音檢測,以區(qū)分出語音幀和非語音幀;
分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值,其中,所述噪聲功率譜融合估計值為語音幀噪聲功率譜估計值與非語音幀噪聲功率譜估計值的融合值;
根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行去噪處理。
第二方面,本發(fā)明實施例還提供了一種語音去噪的裝置,該裝置包括:
語音檢測模塊,用于對帶噪語音信號進行語音檢測,以區(qū)分出語音幀和非語音幀;
噪聲估計模塊,用于分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值,其中,所述噪聲功率譜融合估計值為語音幀噪聲功率譜估計值與非語音幀噪聲功率譜估計值的融合值;
去噪處理模塊,用于根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行去噪處理。
本發(fā)明實施例提供了一種語音去噪的方法及裝置,通過對帶噪語音信號進行語音檢測,區(qū)分出語音幀和非語音幀,并對其進行噪聲估計,得到噪聲功率譜融合估計值,根據(jù)噪聲功率譜融合估計值對帶噪語音信號進行去噪處理。通過采用上述技術方案,對語音幀和非語音幀均進行了噪聲估計,并綜合兩者的噪聲估計結果對帶噪語音信號進行去噪處理,可有效改善現(xiàn)有語音去噪方案的去噪效果,提高了語音質量。
附圖說明
圖1是本發(fā)明實施例一提供的語音去噪的方法流程圖;
圖2是本發(fā)明實施例二提供的語音去噪的方法流程圖;
圖3是本發(fā)明實施例三提供的語音去噪的方法流程圖;
圖4是本發(fā)明實施例四提供的語音去噪的方法流程圖;
圖5a是本發(fā)明實施例四提供的原始帶噪語音信號頻譜圖;
圖5b是本發(fā)明實施例四提供的去噪后的語音信號頻譜圖;
圖6是本發(fā)明實施例五提供的語音去噪的裝置的結構示意圖。
具體實施方式
下面結合附圖和實施例對本發(fā)明作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部結構。
實施例一
圖1為本發(fā)明實施例一提供的語音去噪的方法流程圖,本實施例可用于語音去噪,該方法可由語音去噪的裝置來執(zhí)行,該裝置可以由軟件和/或硬件的方式實現(xiàn),該裝置可以集成在任何提供語音去噪功能的智能終端中,具體實現(xiàn)中,智能終端可包括:平板電腦、手機及電子閱讀器等移動終端,上述終端僅是舉例,而非窮舉,包含但不限于上述智能終端。
參見圖1,所述語音去噪的方法,包括:
S110、對帶噪語音信號進行語音檢測,以區(qū)分出語音幀和非語音幀。
智能終端接收到語音信號是一種受到環(huán)境干擾后形成的非平穩(wěn)時變帶噪語音信號。智能終端接收到非平穩(wěn)時變語音信號后,首先,對時域帶噪語音信號進行采樣,將模擬信號轉化為數(shù)字信號。通常,時域帶噪語音信號的采樣頻率為44100Hz,即一秒鐘得到44100個采樣數(shù)據(jù)。對采樣后的時域帶噪語音信號進行加窗分幀,使每一幀時域帶噪語音信號都是平穩(wěn)的。優(yōu)選的,語音處理中常用的窗函數(shù)有矩形窗、漢寧窗和漢明窗。對加窗分幀的時域帶噪語音信號進行傅里葉變換,將其轉換為頻域帶噪語音信號幀。其中,采樣、分幀及傅里葉變換為本領域技術人員的常用技術手段,為了簡明起見,在此不再贅述。
對頻域帶噪語音信號幀,逐幀進行語音檢測,以區(qū)分出語音幀和非語音幀。語音檢測可理解為根據(jù)語音特征參數(shù)進行特征提取,其中,語音特征參數(shù)能夠有效代表語音特征,具有良好的區(qū)分性,能夠根據(jù)其特征有效地區(qū)分出語音和非語音。本實施例中可采用VAD技術進行語音檢測。通常,可通過提取語音信號的頻域特征參數(shù)中的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)來區(qū)分出語音幀和非語音幀。
S120、分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值。
示例性的,經過語音檢測(VAD)后,可逐一對每一幀進行噪聲估計。如果判斷當前幀為語音幀,則按照語音幀的噪聲估計方式對當前幀進行進行噪聲估計,得到語音幀噪聲功率估計值。例如可采用最小值追蹤算法或分位數(shù)噪聲估計方法進行噪聲估計。優(yōu)選的,采用分位數(shù)估計方法進行噪聲估計,一段時間內,帶噪語音信號在這一頻率窄帶的分位數(shù)的值被認為是當前頻帶的噪聲功率估計值(也可理解為噪聲能量)。具體的,可以根據(jù)如下公式得出語音幀噪聲功率譜估計值:
λd(n,k)=Quantiles(X(n,k)2) n=0,1,2...,M
其中,M表示幀數(shù);X(n,k)表示第n幀第k個頻點的語音頻譜分量;Quantiles()表示取分位數(shù),一般取0.25或0.5。需要說明的是,M表示對帶噪語音信號進行分幀處理后得到的總幀數(shù),上式中n表示語音幀的幀號,n的具體取值由語音檢測結果決定。
如果判斷當前幀為非語音幀,則按照非語音幀的噪聲估計方式對當前幀進行噪聲估計,得到非語音噪聲功率估計值??梢愿鶕?jù)如下公式得出非語音幀噪聲功率譜估計值:
λd(n,k)=a*X(n,k)2+(1-a)*Quantiles(X(n,k)2) n=0,1,2...,M
需要說明的是,該式中n表示非語音幀的幀號,n的具體取值由語音檢測結果決定。
噪聲功率譜融合估計值為語音幀噪聲功率譜估計值與非語音幀噪聲功率譜估計值的融合值,可根據(jù)如下公式得出噪聲功率譜融合估計值:
其中,L表示噪聲平滑區(qū)間長度,可取9幀;a表示權重系數(shù),優(yōu)選的,a取0.8;λd(n,k)表示語音幀噪聲功率譜估計值或非語音幀噪聲功率譜估計值,具體可由n的值來確定;λlast(n,k)表示噪聲功率譜融合估計值。
S130、根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行去噪處理。
實例性的,在得到噪聲功率譜融合估計值后,可利用直接判決法對先驗信噪比進行估計。估計先驗信噪比的方法不僅限于上述直接判決法,還可以使用其他適合的算法,例如Casual算法、Non-Casual算法等。本實施例中,可根據(jù)噪聲功率譜融合估計值計算先驗信噪比,根據(jù)先驗信噪比可以相應地得到維納濾波增益函數(shù)。在獲得維納濾波的增益函數(shù)之后,對頻域帶噪語音信號進行維納濾波,得到頻域去噪語音信號。先驗信噪比的估計、維納濾波增益函數(shù)的計算可參照現(xiàn)有的計算方式,在此不再贅述。
進一步的,可對頻域去噪的語音信號進行反傅里葉變換,并可以通過Overlap方法合成最終的輸出語音,完成整個語音去噪的過程。其中,合成最終輸出語音的方法并不僅限于Overlap,在此不再一一列舉。
本實施例提供的技術方案,通過對帶噪語音信號進行語音檢測,區(qū)分出語音幀和非語音幀,并對其進行噪聲估計,得到噪聲功率譜融合估計值,根據(jù)噪聲功率譜融合估計值對帶噪語音信號進行去噪處理。通過采用上述技術方案,不僅在非語音幀能估計出噪聲值,同時在語音幀中,也能更新噪聲分量的估計值,并綜合兩者的噪聲估計結果對帶噪語音信號進行去噪處理,可有效改善現(xiàn)有語音去噪方案的去噪效果,提高了語音質量。
本發(fā)明實施例的語音去噪方法可適用于對實時語音網絡通信過程中的語音信號進行去噪,在實時語音聊天以及在線答疑等應用場景下的去噪效果相比于現(xiàn)有語音去噪方案來說效果尤為突出。與傳統(tǒng)電話語音通信和社交網絡電話相比,在線答疑時語音去噪的難度較大,這是因為在線答疑時,學生為了看手機或電腦屏幕的實時筆記,不肯能像傳統(tǒng)打電話一樣貼著耳朵說話,而且在線答疑時學生很少戴耳機。基于上述情況,通過揚聲器播放聲音,回聲問題較為突出,且相對遠距離錄音,語音音質極易受到外在環(huán)境噪音和非線性殘余回聲的影響。本發(fā)明實施例的語音去噪方法,對實時語音聊天以及在線答疑等應用場景下的語音去噪,不僅可以抑制非語音部分中的噪聲,而且可以抑制語音部分的噪聲,尤其是對殘余回聲的抑制效果較為明顯,可有效改善現(xiàn)有語音去噪方案的去噪效果,提高了語音質量。
實施例二
圖2為本發(fā)明實施例二提供的語音去噪的方法流程圖,本實施例在上述實施例的基礎上,對帶噪語音信號進行語音檢測時,提出了一個有效的語音特征組合,能夠更加準確地區(qū)分出帶噪語音幀和非語音幀。
參見圖2,所述語音去噪的方法,包括:
S210、提取帶噪語音信號的語音特征。
提取的帶噪語音特征包括梅爾倒譜系數(shù)MFCC、線性預測編碼殘差和頻譜質心Centroid。人類對不同頻率語音有不同的感知能力:對1kHz以下,與頻率成線性關系,對1kHz以上,與頻率成對數(shù)關系。頻率越高,感知能力就越差。在應用中常常只使用低頻MFCC,而丟棄中高頻MFCC。在梅爾(Mel)頻域內,人對音調的感知能力為線性關系,如果兩段語音的Mel頻率差兩倍,則人在感知上也差兩倍。Mel頻域是模擬人耳對不同頻率語音的感知能力的,為了模擬人耳的這種感知特性,根據(jù)如下公式將普通頻率尺度轉化到Mel頻率尺度:
其中,f為實際線性頻率,fmel為Mel標頻。
對加窗分幀的時域帶噪語音信號進行傅里葉變換,將其轉換為頻域帶噪語音信號幀后,用一組M個Mel標頻上線性分布的三角帶通濾波器組,對語音信號的功率譜濾波。每一個三角帶通濾波器覆蓋的范圍都近似于人耳的一個臨界帶寬,以此來模擬人耳的掩蔽效應。其中,M個Mel標頻上線性分布的三角帶通濾波器組響應公式如下:
其中,Hm(k)表示Mel標頻上線性分布的三角帶通濾波器組,k表示第k個濾波器,1≤m≤M,M一般取40,f(m)表示第m個三角濾波器的中心頻率。
根據(jù)如下公式對三角帶通濾波器組的輸出P(m)求取對數(shù),可以得到近似于同態(tài)變換的結果:
X(m)=log(P(m))
對X(m)進行N階離散余弦變換(Discrete Cosine Transformation,DCT),去除各維語音信號之間的相關性,將語音信號映射到低維空間,求得標準的MFCC參數(shù)。根據(jù)如下公式求得標準的MFCC參數(shù):
其中,N一般取13,Xk表示標準的MFCC參數(shù)。
線性預測編碼(Linear Prediction Coding LPC)殘差即LPC殘差,它屬于激勵信息源信息,反映了聲帶振動的周期特性,而噪聲并沒有該特性。其中,第n個采樣點的語音頻譜輸出X(n)可以通過前p個樣本采樣點的線性組合估算得到,可以根據(jù)如下公式得到:
X(n)≈a1X(n-1)+a2X(n-2)+...apX(n-p)
其中,a1、a2...ap為p階LPC系數(shù),由該模型的系統(tǒng)誤差平方和最小化求得,又原始幀語音頻譜數(shù)據(jù)與X(n)作差,得到LPC殘差。
頻譜質心Centroid反映了頻譜的質心,其中,語音區(qū)的質心更接近于800~4000Hz,而噪聲的質心分布明顯不同??梢愿鶕?jù)如下公式得到頻譜質心Centroid:
優(yōu)選的,所述語音特征還包括頻譜平坦度Flatness、頻譜偏移量Rolloff和頻譜擾動度Zcr中的至少一個。
其中,可以根據(jù)如下公式得到頻譜平坦度Flatness:
頻譜偏移量Rolloff是對頻譜形狀的一種度量,它描述85%能量譜的偏移位置??梢愿鶕?jù)如下公式得到頻譜偏移量Rolloff:
頻譜擾動度Zcr反映了語音頻譜擾動、混亂的的程度??梢愿鶕?jù)如下公式得到頻譜擾動度Zcr:
S220、根據(jù)所提取的語音特征利用分類器訓練生成語音模型和噪聲模型,以區(qū)分出語音幀和非語音幀。
將上述提取的語音特征構成語音特征向量,利用分類器對語音進行訓練,生成語音模型和噪聲模型。其中,分類器可采用混合高斯模型(Gaussian Mixture Model,GMM)或支持向量機(Support Vector Machine,SVM),本實施例中采用混合高斯模型對語音進行訓練,生成語音模型和噪聲模型。根據(jù)語音模型和噪聲模型的輸出概率最大對每幀語音進行判斷,以區(qū)分出語音幀和非語音幀。對語音模型和噪聲模型進行訓練時,可使用期望最大化方法,基于k均值算法估計出各個高斯的初始參數(shù),經若干次迭代,直到語音模型和噪聲模型趨近收斂。
S230、分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值。
S240、根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行去噪處理。
本實施例提供的語音去噪的方法,通過對帶噪語音信號進行語音檢測時,提取帶噪語音信號的語音特征,構成一個有效的語音特征組合,能夠更加準確地區(qū)分出帶噪語音幀和非語音幀,有助于進一步改善語音去噪方案的去噪效果,提高了語音質量。
實施例三
圖3為本發(fā)明實施例三提供的語音去噪的方法流程圖,本實施例在上述實施例的基礎上,對帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制。
參見圖3,所述語音去噪的方法,包括:
S310、對帶噪語音信號進行語音檢測,以區(qū)分出語音幀和非語音幀。
S320、分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值。
S330、根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制。
示例性的,在得到噪聲功率譜融合估計值后,可根據(jù)計算的維納濾波增益函數(shù)對所述頻域帶噪語音信號進行去噪處理。通過上述過程可以完成對平穩(wěn)噪聲的抑制、非語音噪聲的抑制和非平穩(wěn)噪聲的抑制,其中,對所述三種噪聲的抑制可以分步進行,即先對語音信號的平穩(wěn)噪聲進行抑制,然后再對非語音噪聲進行抑制,最后再利用一個非平穩(wěn)噪聲抑制因子對非平穩(wěn)噪聲進行抑制,最后將完成上述三種噪聲抑制的語音信號輸出,即可得到最終去噪的語音信號。此外,也可綜合三種噪聲的特點進行一次性的噪聲抑制,并輸出去噪語音信號。
本實施例提供的語音去噪的方法,通過對帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制,進一步提升了語音去噪方案的去噪效果,不僅能抑制平穩(wěn)噪聲,還能抑制非平穩(wěn)噪聲及殘余回聲,提高了語音質量。
實施例四
圖4為本發(fā)明實施例四提供的語音去噪的方法流程圖,本實施例在上述實施例的基礎上,根據(jù)噪聲功率譜融合估計值生成平穩(wěn)噪聲、非語音噪聲及非平穩(wěn)噪聲的融合噪聲抑制因子,并根據(jù)所述融合噪聲抑制因子對所述帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制。
參見圖4,所述語音去噪的方法,包括:
S410、對帶噪語音信號進行語音檢測,以區(qū)分出語音幀和非語音幀。
S420、分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值。
S430、根據(jù)所述噪聲功率譜融合估計值生成平穩(wěn)噪聲、非語音噪聲及非平穩(wěn)噪聲的融合噪聲抑制因子。
平穩(wěn)噪聲、非語音噪聲及非平穩(wěn)噪聲的融合噪聲抑制因子是對語音信號中所有噪聲的一個綜合考量,根據(jù)所述融合噪聲抑制因子,可以一次性的對語音信號中所有的噪聲進行抑制,而無需對三類噪聲分步進行抑制,提高語音去噪的處理效率。根據(jù)如下公式可以得到融合噪聲抑制因子:
其中,X(n,k)表示第n幀第k個頻點的語音頻譜分量,g(n,k)表示維納抑制因子,coeff(n,k)表示非語音抑制因子,θ表示非平穩(wěn)噪聲抑制因子。θ是一個常數(shù)因子,取值一般為0.001-0.1之間的一個常量。
其中,所述維納抑制因子可以由如下公式得出:
其中,γ(n,k)表示后驗信噪比,表示先驗信噪比,max()表示取最大值,λlast(n,k)表示噪聲功率譜融合估計值,β(n)表示時變因子。傳統(tǒng)算法中,β為固定因子,通常取0.9~0.98,而在算法中采用時變的β(n),有利于對語音信號變換作出快速反應。
因為殘余回聲的問題,致使VAD檢測可能會出現(xiàn)誤判,需要進一步對頻譜進行分析,因為語音主要集中在低頻0~4000Hz以內,即便在殘余回聲的干擾下,占據(jù)語音至少50%以上能量,所以需要對非語音部分(包括噪聲和殘余回聲)進行抑制。
本步驟中,所述非語音抑制因子可以由如下公式得出:
當Ratio>=threshold時
否則,coeff(n,k)=1.0
其中,Ratio表示與的比值;low為預設最低值,為一經驗值;threshold為設定閾值,threshold通常取1.0。
可選的,所述融合噪聲抑制因子也可以為:
其中,X(n,k)表示第n幀第k個頻點的語音頻譜分量,g(n,k)表示維納抑制因子,coeff(n,k)表示非語音抑制因子,θ表示非平穩(wěn)噪聲抑制因子。
S440、根據(jù)所述融合噪聲抑制因子對所述帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制。
得到所述融合噪聲抑制因子后,可以對帶噪語音信號進行抑制,得到去噪的語音信號。根據(jù)如下公式(1)或公式(2)可以得到最終的去噪語音信號。如圖5a所示,為原始帶噪語音信號的頻譜圖;如圖5b所示,為根據(jù)本實施例提供的語音去噪的方法去噪后的語音信號頻譜圖。
其中,output(n,k)表示第n幀第k個頻點的去噪后的語音頻譜分量。
對比圖5a和圖5b可以看出,本實施例的方法可對各種噪聲分量進行有效抑制,對非平穩(wěn)噪聲的抑制效果尤為突出,且去噪后,語音分量得到了很好的保留。
本實施例提供的語音去噪的方法,通過根據(jù)噪聲功率譜融合估計值生成平穩(wěn)噪聲、非語音噪聲及非平穩(wěn)噪聲的融合噪聲抑制因子,并根據(jù)融合噪聲抑制因子對帶噪語音信號進行去噪處理,能夠一次性完成對語音去噪的工作,提高語音去噪的處理效率。有效改善了語音去噪方案的去噪效果,不僅能抑制平穩(wěn)噪聲,還能分析估計出非語音成分,對非語音噪聲進行抑制,同時對非平穩(wěn)噪聲進行抑制時,對弱分量進行縮小、強分量進行放大,實現(xiàn)動態(tài)平滑非平穩(wěn)降噪,提高了語音質量。
實施例五
圖5為本發(fā)明實施例五提供的語音去噪的裝置的結構示意圖,所述語音去噪的裝置包括語音檢測模塊610、噪聲估計模塊620和去噪處理模塊630,下面對各模塊進行具體說明。
所述語音檢測模塊610,用于對帶噪語音信號進行語音檢測,以區(qū)分出語音幀和非語音幀;
所述噪聲估計模塊620,用于分別對語音幀和非語音幀進行噪聲估計,得到噪聲功率譜融合估計值,其中,所述噪聲功率譜融合估計值為語音幀噪聲功率譜估計值與非語音幀噪聲功率譜估計值的融合值;
所述去噪處理模塊630,用于根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行去噪處理。
本實施例提供的技術方案,通過對帶噪語音信號進行語音檢測,區(qū)分出語音幀和非語音幀,并對其進行噪聲估計,得到噪聲功率譜融合估計值,根據(jù)噪聲功率譜融合估計值對帶噪語音信號進行去噪處理。通過采用上述技術方案,不僅在非語音幀能估計出噪聲值,同時在語音幀中,也能更新噪聲分量的估計值,并綜合兩者的噪聲估計結果對帶噪語音信號進行去噪處理,可有效改善現(xiàn)有語音去噪方案的去噪效果,提高了語音質量。
可選的,語音檢測模塊610包括:
語音特征提取單元,用于提取帶噪語音信號的語音特征,其中,所述語音特征包括梅爾倒譜系數(shù)MFCC、線性預測編碼殘差和頻譜質心Centroid;
分類單元,用于根據(jù)所提取的語音特征利用分類器訓練生成語音模型和噪聲模型,以區(qū)分出語音幀和非語音幀。
可選的,所述語音特征還包括頻譜平坦度Flatness、頻譜偏移量Rolloff和頻譜擾動度Zcr中的至少一個。
可選的,噪聲估計模塊620包括:
語音幀噪聲估計模塊,用于根據(jù)如下公式得出語音幀噪聲功率譜估計值:
λd(n,k)=Quantiles(X(n,k)2) n=0,1,2...,M
非語音幀噪聲估計模塊,用于根據(jù)如下公式得出非語音幀噪聲功率譜估計值:
λd(n,k)=a*X(n,k)2+(1-a)*Quantiles(X(n,k)2) n=0,1,2...,M
融合噪聲估計模塊,用于根據(jù)如下公式得出噪聲功率譜融合估計值:
其中,M表示幀數(shù),X(n,k)表示第n幀第k個頻點的語音頻譜分量,Quantiles()表示取分位數(shù),L表示噪聲平滑區(qū)間長度,a表示權重系數(shù),λd(n,k)表示語音幀噪聲功率譜估計值或非語音幀噪聲功率譜估計值,λlast(n,k)表示噪聲功率譜融合估計值。
可選的,去噪處理模塊630包括:
去噪處理單元,用于根據(jù)所述噪聲功率譜融合估計值對所述帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制。
可選的,去噪處理單元具體用于:
根據(jù)所述噪聲功率譜融合估計值生成平穩(wěn)噪聲、非語音噪聲及非平穩(wěn)噪聲的融合噪聲抑制因子;
根據(jù)所述融合噪聲抑制因子對所述帶噪語音信號進行平穩(wěn)噪聲抑制、非語音噪聲抑制以及非平穩(wěn)噪聲抑制。
可選的,所述融合噪聲抑制因子為:
其中,X(n,k)表示第n幀第k個頻點的語音頻譜分量,g(n,k)表示維納抑制因子,coeff(n,k)表示非語音抑制因子,θ表示非平穩(wěn)噪聲抑制因子。
可選的,所述融合噪聲抑制因子為:
其中,X(n,k)表示第n幀第k個頻點的語音頻譜分量,g(n,k)表示維納抑制因子,coeff(n,k)表示非語音抑制因子,θ表示非平穩(wěn)噪聲抑制因子。
可選的,所述維納抑制因子由如下公式得出:
其中,γ(n,k)表示后驗信噪比,表示先驗信噪比,max()表示取最大值,λlast(n,k)表示噪聲功率譜融合估計值,β(n)表示時變因子。
可選的,所述非語音抑制因子由如下公式得出:
當Ratio>=threshold時
否則,coeff(n,k)=1.0
其中,Ratio表示與的比值,low為預設最低值,threshold為設定閾值。
本發(fā)明實施例所提供的語音去噪的裝置可執(zhí)行本發(fā)明任意實施例所提供的語音去噪的方法,具備執(zhí)行方法相應的功能模塊和有益效果。
顯然,本領域技術人員應該明白,上述的本發(fā)明的各模塊或各步驟可以通過如上所述的分片服務器以及管理服務器來實施??蛇x的,本發(fā)明實施例可以用計算機裝置可執(zhí)行的程序來實現(xiàn),從而可以將它們存儲在存儲裝置中由處理器來執(zhí)行,所述的程序可以存儲于一種計算機可讀存儲介質中,上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等;或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件的結合。
注意,上述僅為本發(fā)明的較佳實施例及所運用技術原理。本領域技術人員會理解,本發(fā)明不限于這里所述的特定實施例,對本領域技術人員來說能夠進行各種明顯的變化、重新調整和替代而不會脫離本發(fā)明的保護范圍。因此,雖然通過以上實施例對本發(fā)明進行了較為詳細的說明,但是本發(fā)明不僅僅限于以上實施例,在不脫離本發(fā)明構思的情況下,還可以包括更多其他等效實施例,而本發(fā)明的范圍由所附的權利要求范圍決定。