用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法
【專利摘要】本發(fā)明公開一種用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,包括如下步驟:對目標(biāo)信號利用窗函數(shù)分成相互疊加的幀并對每幀進(jìn)行短時傅立葉變換,得到目標(biāo)信號的頻域表示:Y(k,l)=X(k,l)+D(k,l);將所述目標(biāo)信號根據(jù)語音出現(xiàn)與否劃分為語音出現(xiàn)狀態(tài)H1(k,l)和語音缺失狀態(tài)H0(k,l),并按照如下公式分別估計噪聲上述方法中,引入了殘差噪聲In(k,l),殘差噪聲In(k,l)的本質(zhì)是在噪聲估計算法中引入反饋機(jī)制對估計的噪聲進(jìn)行自適應(yīng)調(diào)節(jié),因此解決了在語音出現(xiàn)狀態(tài)下的噪聲估計不準(zhǔn)確的問題。
【專利說明】用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音增強(qiáng)處理【技術(shù)領(lǐng)域】,特別是涉及一種用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法。
【背景技術(shù)】
[0002]在語音增強(qiáng)處理的過程中,比較關(guān)鍵的一步就是對背景噪聲的估計。噪聲估計過高,在濾除噪聲時微弱語音將被去掉,使得經(jīng)過增強(qiáng)處理的語音產(chǎn)生大的失真;而噪聲估計過低,在濾除噪聲后會殘留過多的背景噪聲。當(dāng)背景噪聲為平穩(wěn)噪聲時,通過對靜音段的噪聲功率譜取均值可得噪聲的估計值。當(dāng)背景噪聲為非平穩(wěn)噪聲時,由于噪聲隨時間快速變化,噪聲的估計就比較困難,要克服這個問題,需要對噪聲進(jìn)行連續(xù)跟蹤與修正。
[0003]傳統(tǒng)的噪聲估計法是基于語音活動檢測(Voice Activity Detector, VAD)的噪聲估計方法。該方法在信噪比較高的情況下可以得到較好的噪聲估計,但是在低信噪比的情況下,對語音信號的檢測變得比較難,VAD的誤檢率很高,噪聲估計不準(zhǔn)確。
[0004]實際噪聲通常是非平穩(wěn)的,在語音存在期間噪聲也可能發(fā)生變化,要想取得好的語音增強(qiáng)效果,就必須隨時跟蹤噪聲的變化,及時更新噪聲估計。Doblinger通過比較前幀帶噪語音子帶平滑功率譜最小值和后幀帶噪語音子帶平滑功率譜之間大小,對帶噪語音子帶平滑功率譜最小值每幀進(jìn)行追蹤和更新,并將其作為估計的噪聲譜,該噪聲譜估計方法計算效率高,能快速適應(yīng)背景噪聲的變化,但它直接把帶噪語音子帶平滑功率譜最小值作為估計的噪聲譜,使得估計的噪聲譜準(zhǔn)確度不高,同時它會將帶噪語音中語音電平的突然上升當(dāng)作噪聲電平突變的情況來處理,造成噪聲的過估計。
[0005]Martin提出了基于最優(yōu)平滑和最小統(tǒng)計的噪聲估計算法,它依據(jù)帶噪語音能量可以衰減到噪聲能量級的思想,通過對平滑后的帶噪語音的短時功率譜取最小值來獲得噪聲功率估計。然而,該方法在估計噪聲時,當(dāng)搜索窗較小時會削弱語音能量,當(dāng)搜索窗太大時,其噪聲估計更新較慢難以實時估計噪聲。
[0006]Israel Cohen 提出 了改進(jìn)的最小受控遞歸平均(Improved Minima ControlledRecursive Average, IMCRA)噪聲估計法,其可以進(jìn)行連續(xù)的噪聲估計。算法使用一個時變頻率依賴的平滑因子對過去信號幀的功率譜進(jìn)行平均后估計噪聲,該平滑因子依據(jù)語音信號存在概率調(diào)整。語音出現(xiàn)概率的估計基于高斯統(tǒng)計模型,但受平滑周期圖的最小值控制控制。該算法包括兩次平滑和最小值跟蹤過程。第一次平滑過程對每個頻帶語音出現(xiàn)情況做粗略的估計,然后在第二次平滑過程中通過最小值跟蹤剔除強(qiáng)語音分量,對噪聲譜進(jìn)行平滑。但是,現(xiàn)有的IMCRA噪聲估計方法是在語音缺失段對噪聲進(jìn)行遞歸平滑而在語音段則對噪聲的估計保持不變。然而,在實際情況中,噪聲通常是非平穩(wěn)的,即使在語音信號存在期間,噪聲也可能會發(fā)生變化。
【發(fā)明內(nèi)容】
[0007]基于此,有必要提供一種能夠?qū)崟r跟蹤帶噪語音中的噪聲變化的背景噪聲估計方法。
[0008]一種語音噪聲估計方法,包括如下步驟:
[0009]對目標(biāo)信號利用窗函數(shù)分成相互疊加的幀并對每幀進(jìn)行短時傅立葉變換,得到目標(biāo)信號的頻域表示:Y(k,l)=X(k, 1)+D(k, I);其中Y(k,I)是帶噪語音信號進(jìn)行快速傅立葉變換變換后的頻譜,X(k,I)是純語音信號進(jìn)行快速傅立葉變換變換后的頻譜,D(k,I)是與語音信號無關(guān)的加性噪聲進(jìn)行快速傅立葉變換變換后的頻譜4表示頻譜序號,I表示幀序號;
[0010]將所述目標(biāo)信號根據(jù)語音出現(xiàn)與否劃分為語音出現(xiàn)狀態(tài)H1 (k,I)和語音缺失狀態(tài)Htl (k,I),并按照如下公式估計噪聲:
【權(quán)利要求】
1.一種用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,包括如下步驟: 對目標(biāo)信號利用窗函數(shù)分成相互疊加的幀并對每幀進(jìn)行短時傅立葉變換,得到目標(biāo)信號的頻域表示:Y(k,l)=X(k, 1)+D(k, I);其中Y(k,I)是帶噪語音信號進(jìn)行快速傅立葉變換變換后的頻譜,x(k,I)是純語音信號進(jìn)行快速傅立葉變換后的頻譜,D(k,I)是與語音信號無關(guān)的加性噪聲進(jìn)行快速傅立葉變換后的頻譜4表示頻譜序號,I表示幀序號; 將所述目標(biāo)信號根據(jù)語音出現(xiàn)與否劃分為語音出現(xiàn)狀態(tài)H1 (k,I)和語音缺失狀態(tài)Htl (k,I),并按照如下公式估計噪聲:
2.根據(jù)權(quán)利要求1所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,所述短時傅立葉變換基于假定變換系數(shù)為復(fù)高斯分布的前提下。
3.根據(jù)權(quán)利要求2所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,進(jìn)一步包括: 利用條件語音出現(xiàn)概率對噪聲估計進(jìn)行遞歸平均得到:
4.根據(jù)權(quán)利要求3所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,進(jìn)一步地,
5.根據(jù)權(quán)利要求3所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,進(jìn)一步對噪聲估計進(jìn)行偏差補(bǔ)償: 其中β為補(bǔ)償因子,其定義為:
6.根據(jù)權(quán)利要求1所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,進(jìn)一步包括最小受控估計的步驟,所述最小受控估計的步驟用于估計先驗語音不存在概率q (k, I),且 P (k, I) +q (k, I) =1。
7.根據(jù)權(quán)利要求1所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,所述噪聲估計方法基于采用維納濾波法的語音增強(qiáng)系統(tǒng),所述譜增益函數(shù)G(k,I)為:
8.根據(jù)權(quán)利要求1所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,所述噪聲估計方法基于采用譜減法的語音增強(qiáng)系統(tǒng),所述譜增益函數(shù)G (k,I)為:
9.根據(jù)權(quán)利要求1所述的用于語音增強(qiáng)系統(tǒng)的背景噪聲估計方法,其特征在于,所述噪聲估計方法基于采用MMSE-LSA估計法的語音增強(qiáng)系統(tǒng),所述譜增益函數(shù)G (k,I)為:
【文檔編號】G10L21/0216GK103559887SQ201310538432
【公開日】2014年2月5日 申請日期:2013年11月4日 優(yōu)先權(quán)日:2013年11月4日
【發(fā)明者】張勇, 劉軼 申請人:深港產(chǎn)學(xué)研基地