基于心理聲學模型的語音后置感知濾波器的制造方法
【專利摘要】本發(fā)明涉及基于心理聲學模型的語音后置感知濾波器,首先,該感知濾波器不需要融合在各個算法中,因而不會影響算法的復雜度,但是卻獲得了同樣增強聽覺感知度的效果。其次,它只是針對增強語音的再次處理的過程,使得增強語音的聽覺感知度進一步的提高,即使噪聲存在,信噪比沒有提高的情況下,利用這個后置的感知濾波器,也能達到提高聽覺感知度的目的;該后置感知濾波器是建立在語音信號失真最小的情況下使殘留噪聲盡可能不被人耳聽到的條件下,且濾波器的增益是由在該條件下構建含有掩蔽閾值的代價函數獲得,并由掩蔽閾值構建的感知歸一化因子進一步優(yōu)化,目的是避免了過度的削弱信號,保證了增強后語音感知失真最小。
【專利說明】基于心理聲學模型的語音后置感知濾波器
【技術領域】
[0001]本發(fā)明涉及基于心理聲學模型的語音后置感知濾波器。
【背景技術】
[0002]目前,語音增強的各種算法都能不同程度地去除噪聲,但是或多或少還存在殘留噪聲和音樂噪聲,影響了語音的質量,所以需要進一步消除它;再加上對語音的評價最終依賴于人的聽覺感受,因而對語音增強的研究應結合運用人類聽覺系統(tǒng)對語音的感知特性,即人耳的掩蔽效應,對不需要的噪聲有特殊抑制功能,使增強后的語音盡可能地降低聽覺疲勞度、改善聽覺感受性,起到提高語音質量的效能。所以,結合人耳聽覺特性中的掩蔽效應對語音增強的性能有著非常重要的作用。
[0003]近年來,有許多專家學者對基于人耳掩蔽效應的語音增強作了研究,并取得了一定的效果。但這些算法都是建立在同別的算法進行融合的基礎上,使原本的算法因為加入了掩蔽模型的計算更加復雜,甚至不能實時實現(xiàn)。針對這個問題,本章提出了一種基于掩蔽效應的后置感知濾波器,并把它運用在語音增強中。
【發(fā)明內容】
[0004]本發(fā)明針對增強后的語音存在殘留噪聲,導致聽覺感知度差的問題,提出一種基于心理聲學模型的后置感知濾波器,并把它運用在語音增強中。首先,該感知濾波器不需要融合在各個算法中,因而不會影響算法的復雜度,但是卻獲得了同樣增強聽覺感知度的效果。其次,它只是針對增強語音的再次處理的過程,使得增強語音的聽覺感知度進一步的提高,即使噪聲存在,信噪比沒有提高的情況下,利用這個后置的感知濾波器,也能達到提高聽覺感知度的目的;該后置感知濾波器是建立在語音信號失真最小的情況下使殘留噪聲盡可能不被人耳聽到的條件下,且濾波器的增益是由在該條件下構建含有掩蔽閾值的代價函數獲得,并由掩蔽閾值構建的感`知歸一化因子進一步優(yōu)化,目的是避免了過度的削弱信號,保證了增強后語音感知失真最小。
[0005]如圖1所示,具體方案為:
[0006]I)帶噪語音經過譜減法(這個方法可以改變)增強后,根據心理聲學模型分幀計算每幀的掩蔽閾值。
[0007]2)用第一步求解的掩蔽閾值構建代價函數,目的是保證語音信號失真最小的條件下、使殘留噪聲盡可能不被人耳聽到。
[0008]J = Ρ( ε 3) + μ (P( ε r)_E[Tk]) = G~112E[ | Sk| ]2+μ (IG12E[ |Nk| J2-E[Tk])
[0009]其中,Es = Sk(G-1)為語音失真,ε ^ = NkG為殘留噪聲。因為語音和噪聲不
[0010]相關,所以E(NkSk) = 0,語音失真的功率P(es)、殘留噪聲的功率P(e J。
[0011]3)通過使代價函數最下,求解感知濾波器的增益。
[0012]4)為了避免過度的削弱信號,再用感知歸一化因子對感知濾波器進行修正,避免了過度的削弱信號,保證了增強后語音感知失真最小。[0013]感知歸一化因子為
【權利要求】
1.基于心理聲學模型的語音后置感知濾波器,其特征在于: 在所述濾波器中, 1)帶噪語音經過連續(xù)可導的譜減法增強后,根據心理聲學模型分幀計算每幀的掩蔽閾值; 2)用第一步求解的掩蔽閾值構建代價函數:
【文檔編號】G10L21/0208GK103824562SQ201410046572
【公開日】2014年5月28日 申請日期:2014年2月10日 優(yōu)先權日:2014年2月10日
【發(fā)明者】賈海蓉, 李鴻燕, 武奕峰, 張雪英 申請人:太原理工大學