一種低信噪比語(yǔ)音降噪方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種低信噪比語(yǔ)音降噪方法,該方法包括以下步驟:對(duì)輸入語(yǔ)音信號(hào)分幀組幀,乘入漢明窗,進(jìn)行時(shí)頻轉(zhuǎn)換,計(jì)算信號(hào)的譜能量分布;根據(jù)接收信號(hào)的狀態(tài)判斷對(duì)接收信號(hào)進(jìn)行增益振蕩檢測(cè),更新底噪譜能量分布;計(jì)算譜分布后驗(yàn)信噪比,進(jìn)行MMSE噪聲抑制;計(jì)算幀信噪比,保存并更新最近一定時(shí)間內(nèi)的幀信噪比;進(jìn)行譜包絡(luò)多狀態(tài)轉(zhuǎn)移,根據(jù)狀態(tài)轉(zhuǎn)移的狀態(tài)輸出判斷輸入信號(hào)是語(yǔ)音或是噪聲;對(duì)降噪后的信號(hào)進(jìn)行頻時(shí)轉(zhuǎn)換以及窗疊加,對(duì)輸出信號(hào)進(jìn)行語(yǔ)音頭保護(hù),根據(jù)靜音檢測(cè)的結(jié)果輸出降噪后語(yǔ)音或是靜音。本發(fā)明能夠有效的抑制短波通信噪聲,提高通信話音的質(zhì)量,從技術(shù)手段上保證語(yǔ)音降噪的有效性。
【專(zhuān)利說(shuō)明】一種低信噪比語(yǔ)音降噪方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及無(wú)線電通信的語(yǔ)音信號(hào)處理領(lǐng)域,特別涉及一種低信噪比語(yǔ)音降噪方法。
【背景技術(shù)】
[0002]語(yǔ)音通信為無(wú)線通信中最基本的業(yè)務(wù),目前在很多領(lǐng)域中仍然是以模擬話音為主,如飛機(jī)與地面通信、遠(yuǎn)程指揮通信、無(wú)線電廣播等等。在這些應(yīng)用中受無(wú)線信道的多徑、衰落、反射等多種因素影響,語(yǔ)音信號(hào)在傳輸過(guò)程中會(huì)出現(xiàn)畸變和衰落,同時(shí)天線會(huì)接收到無(wú)線信道上的各種噪聲信號(hào),導(dǎo)致接收到的話音具有較大的噪聲干擾。特別是當(dāng)沒(méi)有語(yǔ)音信號(hào)傳輸時(shí),接收設(shè)備會(huì)將收到的各種無(wú)線信道噪聲信號(hào)當(dāng)成語(yǔ)音信號(hào)播放出來(lái),使通信員長(zhǎng)期承受著較為惡劣的噪聲,嚴(yán)重地影響通信員的聽(tīng)覺(jué)感受。
[0003]針對(duì)上述問(wèn)題,通常做法是采用語(yǔ)音降噪和靜音檢測(cè)來(lái)降低噪聲的影響,具體是:通過(guò)靜音檢測(cè)判斷是否有語(yǔ)音信號(hào)到達(dá),如果沒(méi)有語(yǔ)音信號(hào)則關(guān)閉聲音;如果有信號(hào)則進(jìn)行降噪處理并輸出降噪后的語(yǔ)音。但是傳統(tǒng)方法在信噪比較低、噪聲信號(hào)能量大于或者遠(yuǎn)大于語(yǔ)音信號(hào)時(shí),往往無(wú)法有效的檢測(cè)出語(yǔ)音信號(hào)并降噪,導(dǎo)致語(yǔ)音通信中丟字丟句子,降噪輸出的話音失真較大。
[0004]因此,研究一種即使信噪比比較低仍能夠準(zhǔn)確檢測(cè)出語(yǔ)音信號(hào)的語(yǔ)音降噪方法具
有重要意義。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供一種低信噪比語(yǔ)音降噪方法,該方法能夠在信噪比較低,甚至只能聽(tīng)到有話音而難以分辯話音內(nèi)容的情況下準(zhǔn)確的檢測(cè)出語(yǔ)音信號(hào),并抑制噪聲。
[0006]本發(fā)明的目的通過(guò)以下的技術(shù)方案實(shí)現(xiàn):一種低信噪比語(yǔ)音降噪方法,包括以下步驟:
[0007](I)對(duì)輸入語(yǔ)音信號(hào)分巾貞組巾貞,乘入漢明窗;
[0008](2)將時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào),計(jì)算信號(hào)的譜能量分布;
[0009](3)根據(jù)接收信號(hào)的狀態(tài)判斷對(duì)接收信號(hào)進(jìn)行增益振蕩檢測(cè),檢測(cè)結(jié)束后根據(jù)當(dāng)前所處的狀態(tài)更新底噪譜能量分布;
[0010](4)利用接收信號(hào)的譜能量分布和底噪的譜能量分布計(jì)算譜分布后驗(yàn)信噪比,通過(guò)MMSE估計(jì)方法計(jì)算譜增益系數(shù),并利用增益系數(shù)抑制噪聲;
[0011](5)利用降噪后的譜能量分布及底噪譜能量分布計(jì)算幀信噪比,保存并更新最近一定時(shí)間內(nèi)的幀信噪比;
[0012](6)根據(jù)幀信噪比和譜包絡(luò)信噪比記錄信息,進(jìn)行譜包絡(luò)多狀態(tài)轉(zhuǎn)移,根據(jù)多狀態(tài)轉(zhuǎn)移的狀態(tài)輸出判斷輸入信號(hào)是語(yǔ)音或是噪聲;
[0013](7)對(duì)降噪后的信號(hào)進(jìn)行頻時(shí)轉(zhuǎn)換以及窗疊加,對(duì)輸出信號(hào)進(jìn)行語(yǔ)音頭保護(hù),根據(jù)靜音檢測(cè)的結(jié)果輸出降噪后語(yǔ)音或是靜音。
[0014]優(yōu)選的,所述步驟(1)對(duì)輸入語(yǔ)音信號(hào)分幀組幀,每幀由128-512個(gè)樣點(diǎn)組成,每次更新幀長(zhǎng)度一半的樣點(diǎn),將每幀信號(hào)乘以一漢明窗,窗長(zhǎng)度與幀長(zhǎng)度相同。米用這樣的漢明窗可以保證幀間信號(hào)的連續(xù)性和平穩(wěn)性。
[0015]優(yōu)選的,所述步驟(2),通過(guò)快速傅立葉變換將收到的時(shí)域信號(hào)轉(zhuǎn)為頻域信號(hào);根據(jù)人類(lèi)發(fā)聲特性,將低于300Hz以及大于3400Hz的頻譜能量置為零。從而可以減少后續(xù)的
計(jì)算量。
[0016]優(yōu)選的,所述步驟(3),進(jìn)行增益振蕩檢測(cè)的步驟是:
[0017](3-1)如果接收信號(hào)的狀態(tài)為噪聲狀態(tài),則先判斷一定時(shí)間前信號(hào)是否為語(yǔ)音狀態(tài),如果不是,則不進(jìn)行檢測(cè),否則獲取其包絡(luò)譜能量,進(jìn)入步驟(3-3);
[0018](3-2)如果接收信號(hào)的狀態(tài)為語(yǔ)音狀態(tài),則獲取其包絡(luò)譜能量,進(jìn)入步驟(3-3);
[0019](3-3)判斷幀能量是否大于包絡(luò)能量10dB,如果是,則進(jìn)行幀能量縮放,否則,則不進(jìn)行檢測(cè)。
[0020]優(yōu)選的,所述步驟(3)中更新底噪譜能量分布包括以下三種方式:譜分布初始化更新、譜分布正向更新和譜分布反向更新;如果當(dāng)前所處的狀態(tài)是初始化狀態(tài)則采用譜分布初始化更新;如果當(dāng)前所處的狀態(tài)是噪聲狀態(tài)則采用譜分布正向更新;如果當(dāng)前所處的狀態(tài)是信號(hào)狀態(tài)則采用譜分布反向更新。
[0021]具體的,所述步驟(4),利用接收信號(hào)的譜能量分布和底噪的譜能量分布計(jì)算譜分布后驗(yàn)信噪比,通過(guò)直接判決反饋法將后驗(yàn)信噪比轉(zhuǎn)為先驗(yàn)信噪比,根據(jù)MMSE估計(jì)得到基于先驗(yàn)信噪比的對(duì)數(shù)譜估計(jì)增益系數(shù),將增益系數(shù)與譜分布相乘得到降噪后的信號(hào)譜分布。
[0022]更進(jìn)一步的,所述后驗(yàn)信噪比計(jì)算公式如下:
[0023]
【權(quán)利要求】
1.一種低信噪比語(yǔ)音降噪方法,其特征在于,包括以下步驟: (1)對(duì)輸入語(yǔ)音信號(hào)分幀組幀,乘入漢明窗; (2)將時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào),計(jì)算信號(hào)的譜能量分布; (3)根據(jù)接收信號(hào)的狀態(tài)判斷對(duì)接收信號(hào)進(jìn)行增益振蕩檢測(cè),檢測(cè)結(jié)束后根據(jù)當(dāng)前所處的狀態(tài)更新底噪譜能量分布; (4)利用接收信號(hào)的譜能量分布和底噪的譜能量分布計(jì)算譜分布后驗(yàn)信噪比,通過(guò)MMSE估計(jì)方法計(jì)算譜增益系數(shù),并利用增益系數(shù)抑制噪聲; (5)利用降噪后的譜能量分布及底噪譜能量分布計(jì)算幀信噪比,保存并更新最近一定時(shí)間內(nèi)的幀信噪比; (6)根據(jù)幀信噪比和譜包絡(luò)信噪比記錄信息,進(jìn)行譜包絡(luò)多狀態(tài)轉(zhuǎn)移,根據(jù)多狀態(tài)轉(zhuǎn)移的狀態(tài)輸出判斷輸入信號(hào)是語(yǔ)音或是噪聲; (7)對(duì)降噪后的信號(hào)進(jìn)行頻時(shí)轉(zhuǎn)換以及窗疊加,對(duì)輸出信號(hào)進(jìn)行語(yǔ)音頭保護(hù),根據(jù)靜音檢測(cè)的結(jié)果輸出降噪后語(yǔ)音或是靜音。
2.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(1)對(duì)輸入語(yǔ)音信號(hào)分幀組幀,每幀由128-512個(gè)樣點(diǎn)組成,每次更新幀長(zhǎng)度一半的樣點(diǎn),將每幀信號(hào)乘以一漢明窗,窗長(zhǎng)度與幀長(zhǎng)度相同。
3.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(2),通過(guò)快速傅立葉變換將收到的時(shí)域信號(hào)轉(zhuǎn)為頻域信號(hào);根據(jù)人類(lèi)發(fā)聲特性,將低于300Hz以及大于3400Hz的頻譜能量置為零。
4.根據(jù)權(quán)利要求1所述的 低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(3),進(jìn)行增益振蕩檢測(cè)的步驟是: (3-1)如果接收信號(hào)的狀態(tài)為噪聲狀態(tài),則先判斷一定時(shí)間前信號(hào)是否為語(yǔ)音狀態(tài),如果不是,則不進(jìn)行檢測(cè),否則獲取其包絡(luò)譜能量,進(jìn)入步驟(3-3); (3-2)如果接收信號(hào)的狀態(tài)為語(yǔ)音狀態(tài),則獲取其包絡(luò)譜能量,進(jìn)入步驟(3-3); (3-3)判斷幀能量是否大于包絡(luò)能量10dB,如果是,則進(jìn)行幀能量縮放,否則,則不進(jìn)行檢測(cè)。
5.根據(jù)權(quán)利要求1或4所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(3沖更新底噪譜能量分布包括以下三種方式:譜分布初始化更新、譜分布正向更新和譜分布反向更新;如果當(dāng)前所處的狀態(tài)是初始化狀態(tài)則采用譜分布初始化更新;如果當(dāng)前所處的狀態(tài)是噪聲狀態(tài)則采用譜分布正向更新;如果當(dāng)前所處的狀態(tài)是信號(hào)狀態(tài)則采用譜分布反向更新。
6.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(4),利用接收信號(hào)的譜能量分布和底噪的譜能量分布計(jì)算譜分布后驗(yàn)信噪比,通過(guò)直接判決反饋法將后驗(yàn)信噪比轉(zhuǎn)為先驗(yàn)信噪比,根據(jù)MMSE估計(jì)得到基于先驗(yàn)信噪比的對(duì)數(shù)譜估計(jì)增益系數(shù),將增益系數(shù)與譜分布相乘得到降噪后的信號(hào)譜分布。
7.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述后驗(yàn)信噪比計(jì)算公式如下:
8.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(5)中,幀信噪比計(jì)算公式如下:
9.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(6)中,根據(jù)多狀態(tài)轉(zhuǎn)移的狀態(tài)輸出判斷輸入信號(hào)是語(yǔ)音或是噪聲,其中先定義三個(gè)狀態(tài),噪聲狀態(tài)表示當(dāng)前接收到信號(hào)為噪聲,語(yǔ)音狀態(tài)表示當(dāng)前接收到信號(hào)為語(yǔ)音,過(guò)渡狀態(tài)表示當(dāng)前接收到的信號(hào)還需要進(jìn)一步判斷是噪聲還是語(yǔ)音,具體判斷過(guò)程是: (6-1)設(shè)置第一門(mén)限和第二門(mén)限;初始化為噪聲狀態(tài); (6-2)判斷當(dāng)前的幀信噪比是否大于第一門(mén)限,如果是,則由噪聲狀態(tài)轉(zhuǎn)移至過(guò)渡狀態(tài),進(jìn)入步驟(6-3),否則繼續(xù)保持為噪聲狀態(tài); (6-3)計(jì)算進(jìn)入過(guò)渡狀態(tài)的連續(xù)若干幀的平均信噪比,判斷平均信噪比是否大于第二門(mén)限,如果是則進(jìn)入語(yǔ)音狀態(tài),進(jìn)入步驟(6-4),否則進(jìn)入噪聲狀態(tài); (6-4)檢測(cè)一定時(shí)間內(nèi)的譜包絡(luò)信噪比,判斷此譜包絡(luò)信噪比是否大于第一門(mén)限,如果是則保持為語(yǔ)音狀態(tài),否則進(jìn)入過(guò)渡狀態(tài)。
10.根據(jù)權(quán)利要求1所述的低信噪比語(yǔ)音降噪方法,其特征在于,所述步驟(7),利用快速傅里葉逆變換將譜分布信號(hào)變?yōu)闀r(shí)域信號(hào),并通過(guò)窗重合疊加輸出所述步驟(1)中幀長(zhǎng)度一半的樣點(diǎn);根據(jù)對(duì)每一幀靜音檢測(cè)的記錄,對(duì)輸出信號(hào)進(jìn)行語(yǔ)音頭保護(hù),將輸出樣點(diǎn)延遲輸出50-200ms,根據(jù)延遲后的靜音檢測(cè)結(jié)果決定輸出內(nèi)容,如果靜音檢測(cè)結(jié)果為噪聲,則輸出靜音;如果靜音檢測(cè)結(jié) 果為語(yǔ)音,則輸出降噪后語(yǔ)音信號(hào)。
【文檔編號(hào)】G10L21/0232GK103632676SQ201310561790
【公開(kāi)日】2014年3月12日 申請(qǐng)日期:2013年11月12日 優(yōu)先權(quán)日:2013年11月12日
【發(fā)明者】楊劍鋒, 王健, 謝映海, 林振華, 劉紹華, 蘇全超, 李健斌 申請(qǐng)人:廣州海格通信集團(tuán)股份有限公司