欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種多通道語(yǔ)音增強(qiáng)方法

文檔序號(hào):2833674閱讀:254來(lái)源:國(guó)知局
專利名稱:一種多通道語(yǔ)音增強(qiáng)方法
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音增強(qiáng)和噪聲消除的語(yǔ)音信號(hào)處理領(lǐng)域,特別涉及一種多通道語(yǔ)音增強(qiáng)方法。
背景技術(shù)
信號(hào)子空間方法(Signal Subspace Approach, SSA)主要基于矩陣正交分解理論,利用特征值分解(Eigenvalue Decomposition, EVD 或奇異值分解(Singular ValueDecomposition, SVD),將帶噪語(yǔ)音信號(hào)的向量空間分解為彼此正交的兩部分信號(hào)子空間(信號(hào)+噪聲)和噪聲子空間(只有噪聲)。其中,EVD利用信號(hào)的自相關(guān)矩陣,實(shí)現(xiàn)由時(shí)域到特征域的變換,被視為依賴于信號(hào)的變換,其經(jīng)常被稱作Kariumen-Loeve變換(KLT)。本質(zhì)上,基于SSA的語(yǔ)音增強(qiáng)是將噪聲子空間置零,同時(shí)去除信號(hào)子空間中的噪聲成分。SSA首先被引入到單通道語(yǔ)音增強(qiáng)領(lǐng)域(參考文獻(xiàn)I IEphraim andH. L. VanTrees,“A signal subspace approach for speech enhancement,”IEEETrans. SpeechAudio Process.,vol. 3,no. 4,pp. 251-266,Jul. 1995),在 Karhunen-Loeve 域上設(shè)計(jì)了多種有約束的線性濾波器,很好的處理了白噪聲污染的語(yǔ)音信號(hào)。Hu等人(參考文獻(xiàn)2 :Y. Huand P. C. Loizou,“Ageneralized subspace approach for enhancing speech corruptedby colorednoise,,’ IEEE Trans. Speech Audio Process.,vol. 11,no. 4,pp. 334-341,Jul. 2003)利用廣義特征值分解(Generalized Eigenvalue Decomposition,GEVD)的方法,提高了 SSA處理有色噪聲的能力。程寧等人(參考文獻(xiàn)3 :N. Cheng,W. Liu and L. Wang,“Masking Property Based Microphone Array Post-filterDesign”, Interspeech,2010)將人耳的聽(tīng)覺(jué)掩蔽效應(yīng)應(yīng)用到了 SSA中,精確了約束條件,使算法性能進(jìn)一步得到提升。Doclo等人(參考文獻(xiàn)4 :S. Doclo and Μ· Moonen,“GSVD_basedoptimal filteringfor single and multimicrophone speech enhancement,,,IEEETrans. Signal Process.,vol. 50,no. 9,pp. 2230-2244, Sep. 2002)將SSA應(yīng)用到多通道語(yǔ)音增強(qiáng)算法中,它以廣義奇異值分解(Generalized SingularValue Decomposition, GSVD)為工具,推導(dǎo)了在多通道環(huán)境下SSA的最優(yōu)線性濾波器。Kim等人為提高語(yǔ)音識(shí)別系統(tǒng)的性能,先后提出了子頻帶獨(dú)立插值方法(參考文獻(xiàn) 5 G. Kim and N. I. Cho, Principal subspacemodification formulti-channel wiener filter in multi-microphone noisereduction, Proc.IEEE Int.Conference on Acoustics,Speech and SignalProcessing, 2008)和將多干擾源分離到不同的子空間中的子空間建模方法(參考文獻(xiàn)6 :G. Kim and P. C. Loizou,Improving SpeechIntelligibility inNoise Using Environment-Optimized Algorithms, IEEE Trans.Audio,Speech,And Language Process.,vol. 18,no. 8,pp.2080-2090,2010)。多通道SSA也存在著諸多缺陷,主要包括在實(shí)際環(huán)境中應(yīng)用KLT時(shí),信號(hào)子空間維度的難以精確估計(jì);處理有色噪聲時(shí)的廣義特征向量矩陣并不是正交陣,因此在特征值域上設(shè)計(jì)的線性信號(hào)估計(jì)器會(huì)引入語(yǔ)音畸變;多通道條件下GEVD的計(jì)算復(fù)雜度極高,不利于SSA在實(shí)時(shí)系統(tǒng)中應(yīng)用,而現(xiàn)有的快速算法并不能保證算法的性能。
從先驗(yàn)知識(shí)的角度來(lái)審視SSA,其基于這樣一個(gè)假設(shè)一個(gè)長(zhǎng)為P的隨機(jī)序列可以由長(zhǎng)為Q < P的隨機(jī)序列的線性變換得到,稱之為低秩模型。由自回歸(AutoRegressive,AR)模型模型和線性預(yù)測(cè)系數(shù)(Linear PredictionCoefficients, LPC)等知識(shí),我們知道這個(gè)假設(shè)對(duì)于語(yǔ)音信號(hào)是成立的。但將這個(gè)假設(shè)應(yīng)用到語(yǔ)音增強(qiáng)算方法中,卻必須非常小心,對(duì)信號(hào)子空間(低秩模型)的維度必須精確估計(jì)。一方面,對(duì)信號(hào)子空間維度的過(guò)估計(jì)會(huì)導(dǎo)致信號(hào)子空間中噪聲成分增加,從而在增強(qiáng)后的語(yǔ)音中保留了過(guò)多殘余噪聲;另一方面,對(duì)信號(hào)子空間的欠估計(jì)又會(huì)導(dǎo)致語(yǔ)音成分的丟失,從而增大語(yǔ)音畸變,降低語(yǔ)音感知質(zhì)量。因此,精確的信號(hào)子空間維度估計(jì)是SSA優(yōu)異性能的保證,并直接影響到算法后續(xù)過(guò)程的有效性。但在實(shí)際應(yīng)用,由于房間回聲和非平穩(wěn)噪聲等因素的影響,信號(hào)子空間的維度往往難以精確估計(jì),因此低秩模型的先驗(yàn)知識(shí)難以準(zhǔn)確運(yùn)用。信號(hào)子空間維度估計(jì)的傳統(tǒng)方法的根本缺陷在于過(guò)分依賴噪聲估計(jì),而忽略了信號(hào)子空間維度自身的變化規(guī)律。當(dāng)基于SSA的語(yǔ)音增強(qiáng)算法工作在真實(shí)環(huán)境中時(shí),由于噪聲的干擾,SVD或EVD都會(huì)產(chǎn)生大量接近于零的奇異值或特征值,而且其值變化具有連續(xù)性,這也信號(hào)子空間維度的確定增加了難度。

發(fā)明內(nèi)容
(一 )要解決的技術(shù)問(wèn)題針對(duì)傳統(tǒng)的信號(hào)子空間維度估計(jì)方法在真實(shí)環(huán)境中難以有效工作,其原因是過(guò)分依賴噪聲的估計(jì),本發(fā)明充分利用語(yǔ)音離散傅里葉變換(Discrete Fourier Transform,DFT)數(shù)幅值的超高斯分布特性和麥克風(fēng)之間的相關(guān)性,提出了一種新的信號(hào)子空間維度估計(jì)方法,目的在于精確估計(jì)信號(hào)子空間的維度。(二)技術(shù)方案本發(fā)明為解決上述問(wèn)題而提出的一種F范數(shù)表征信號(hào)子空間維度的多通道語(yǔ)音增強(qiáng)方法,其包括下列步驟步驟I :通過(guò)N個(gè)麥克風(fēng)組成的麥克風(fēng)陣列采集帶噪聲的多路語(yǔ)音信號(hào)y(t),并計(jì)算該多路語(yǔ)音信號(hào)y (t)的帶噪語(yǔ)音互相關(guān)矩陣Ryy,其中,t表示離散時(shí)間點(diǎn);步驟2 :利用噪聲估計(jì)算法估計(jì)加性噪聲互相關(guān)矩陣R ;步驟3 :利用所述帶噪語(yǔ)音互相關(guān)矩陣Ryy和加性噪聲互相關(guān)矩陣^vr估計(jì)純凈語(yǔ)音互相關(guān)矩陣I步驟4 :利用所述純凈語(yǔ)音互相關(guān)矩陣估計(jì)信號(hào)子空間的維度(_);步驟5 :對(duì)食=倉(cāng) 進(jìn)行廣義特征值分解,并結(jié)合信號(hào)子空間的維度0和拉格朗日乘子μ獲得時(shí)域約束線性信號(hào)估計(jì)器;步驟6 :利用時(shí)域約束線性信號(hào)估計(jì)器對(duì)多路語(yǔ)音信號(hào)y(t)進(jìn)行濾波獲得增強(qiáng)后的語(yǔ)音ο(三)有益效果本發(fā)明充分利用了語(yǔ)音DFT系數(shù)幅值的超高斯分布特性和麥克風(fēng)之間的相關(guān)性。首先利用超高斯分布模型來(lái)更好地?cái)M合各個(gè)頻點(diǎn)上語(yǔ)音幅值譜的統(tǒng)計(jì)柱狀圖。其次,利用麥克風(fēng)之間的相關(guān)性和正交變換不改變矩陣F范數(shù)的特點(diǎn),獲得了語(yǔ)音互相關(guān)矩陣F范數(shù)的高斯分布模型。然后,利用一種基于最大化原則的估計(jì)策略,在接受原假設(shè)的前提下最大化信號(hào)子空間的維度。通過(guò)以上步驟,本發(fā)明能夠克服真實(shí)環(huán)境中噪聲能量波動(dòng)的不利影響,更精確地估計(jì)信號(hào)子空間的維度,使SSA可以在語(yǔ)音畸變和噪聲消除之間建立更合理的折中。


圖I是本發(fā)明中F范數(shù)表征信號(hào)子空間維度的多通道語(yǔ)音增強(qiáng)方法流程圖;圖2是本發(fā)明中基于F范數(shù)的估計(jì)信號(hào)子空間維度的方法流程圖;圖3是本發(fā)明中TDC線性信號(hào)估計(jì)器的設(shè)計(jì)流程圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。本發(fā)明提供一種基于F范數(shù)的信號(hào)子空間維度估計(jì)方法,該方法的具體步驟如下步驟SI :通過(guò)N個(gè)麥克風(fēng)組成的麥克風(fēng)陣列采集多路帶噪語(yǔ)音信號(hào)y(t),具體包括步驟Sll :采集信號(hào)所用的麥克風(fēng)陣列,其由N個(gè)等間距的麥克風(fēng)組成。假設(shè)第η個(gè)麥克風(fēng)在時(shí)刻t采集到的帶噪語(yǔ)音信號(hào)yn(t)為Xn(t)與Vn(k)之和,即yn (t) = gn*s(t)+vn(t) =xn(t)+vn(t) (I)其中,gn是聲源s(t)到第η個(gè)麥克風(fēng)的沖擊響應(yīng),xn(t)是第η個(gè)麥克風(fēng)采集到的純凈語(yǔ)音,vn(t)是第η個(gè)麥克風(fēng)采集到的加性噪聲,t表示離散時(shí)間點(diǎn)。步驟S12 :利用長(zhǎng)為L(zhǎng)的漢寧窗對(duì)信號(hào)進(jìn)行截短。信號(hào)模型可表示為向量形式y(tǒng)n = χη+νη, η = 1,2, ...,N (2)其中,yn= [yn(t)yn(t_l). . . yn(t_L+l)]T,其包含了帶噪語(yǔ)音信號(hào) yn(t)最近的 L個(gè)采樣,vn和xn類比定義。那么,所有麥克風(fēng)采集到的帶噪語(yǔ)音信號(hào)的全局向量形式為y = x+v (3)其中,
權(quán)利要求
1.一種F范數(shù)表征信號(hào)子空間維度的多通道語(yǔ)音增強(qiáng)方法,其特征在于,包括下列步驟 步驟I :通過(guò)N個(gè)麥克風(fēng)組成的麥克風(fēng)陣列采集帶噪聲的多路語(yǔ)音信號(hào)y (t),并計(jì)算該多路語(yǔ)音信號(hào)y (t)的帶噪語(yǔ)音互相關(guān)矩陣Ryy,其中,t表示離散時(shí)間點(diǎn); 步驟2 :利用噪聲估計(jì)算法估計(jì)加性噪聲互相關(guān)矩陣食w ; 步驟3 :利用所述帶噪語(yǔ)音互相關(guān)矩陣Ryy和加性噪聲互相關(guān)矩陣R估計(jì)純凈語(yǔ)音互相關(guān)矩陣食 ; 步驟4 :利用所述純凈語(yǔ)音互相關(guān)矩陣食 估計(jì)信號(hào)子空間的維度^ ; 步驟5 :對(duì)食;;食口進(jìn)行廣義特征值分解,并結(jié)合信號(hào)子空間的維度0和拉格朗日乘子u獲得時(shí)域約束線性信號(hào)估計(jì)器; 步驟6 :利用時(shí)域約束線性信號(hào)估計(jì)器對(duì)多路語(yǔ)音信號(hào)y(t)進(jìn)行濾波獲得增強(qiáng)后的語(yǔ)音負(fù)O O
2.如權(quán)利要求I所述的方法,其特征在于,所述麥克風(fēng)陣列由N個(gè)等間距的麥克風(fēng)組成,利用長(zhǎng)為L(zhǎng)的漢寧窗對(duì)語(yǔ)音信號(hào)進(jìn)行截短,所述帶噪語(yǔ)音互相關(guān)矩陣Ryy的階數(shù)為NLXNL。
3.如權(quán)利要求I所述的方法,其特征在于,所述步驟2中加性噪聲互相關(guān)矩陣的估計(jì)R通過(guò)下式得到 其中,Yth為SNR的下限閾值,Yk為第k幀的SNR;所述:是前一幀加性噪聲互相關(guān)矩陣的估計(jì),Ryy是當(dāng)前幀帶噪語(yǔ)音互相關(guān)矩陣,k是幀號(hào)。
4.如權(quán)利要求I所述的方法,其特征在于步驟4中所述估計(jì)信號(hào)子空間的維度0具體包括 步驟41 :計(jì)算純凈語(yǔ)音離散傅里葉變換系數(shù)幅值的超高斯分布模型 其中,0和n是可調(diào)參數(shù),ax是純凈語(yǔ)音離散傅里葉變換系數(shù)的幅值,0;£是純凈語(yǔ)音的標(biāo)準(zhǔn)差,r是Ga_a函數(shù),exp { }是指數(shù)算子; 步驟42 :利用所述純凈語(yǔ)音離散傅里葉變換系數(shù)幅值的超高斯分布模型獲得純凈語(yǔ)音互相關(guān)矩陣的F范數(shù)其中,E { }是求和算子,ax( )是純凈語(yǔ)音在頻點(diǎn)《處的離散傅里葉變換系數(shù)的幅值,
5.如權(quán)利要求4所述的方法,其特征在于,所述步驟41還包括 利用純凈語(yǔ)音數(shù)據(jù)訓(xùn)練得到純凈語(yǔ)音離散傅里葉變換系數(shù)幅值的統(tǒng)計(jì)柱狀圖P。;通過(guò)將所述純凈語(yǔ)音離散傅里葉變換系數(shù)幅值的超高斯分布模型和純凈語(yǔ)音離散傅里葉變換系數(shù)幅值的統(tǒng)計(jì)柱狀圖P。之間的KLD距離最小化,得到最佳參數(shù)組合(θ,η),其中,KLD距離如下計(jì)算
6.如權(quán)利要求4所述的方法,其特征在于,所述當(dāng)前幀語(yǔ)音互相關(guān)矩陣的拒絕水平δ如下計(jì)算
7.如權(quán)利要求I所述的方法,其特征在于,所述步驟5具體包括以下內(nèi)容步驟51、對(duì)進(jìn)行廣義特征值分解(GEVD),得到特征向量矩陣W和特征值矩陣A 步驟52、利用信噪比SNR Y計(jì)算拉格朗日乘子U
8.如權(quán)利要求3-7中任一項(xiàng)所述的方法,其特征在于,所述當(dāng)前幀的后驗(yàn)信噪比SNRY如下計(jì)算
9.如權(quán)利要求I所述的方法,其特征在于,所述步驟6具體為利用所述TDC線性信號(hào)估計(jì)器H對(duì)所述多路語(yǔ)音信號(hào)y (t)進(jìn)行濾波,并對(duì)得到的濾波后的語(yǔ)音信號(hào)i(/)進(jìn)行幀間重疊獲得增強(qiáng)后語(yǔ)音,其中濾波如下公式所示
10.如權(quán)利要求I所述的方法,其特征在于,所述步驟3中純凈語(yǔ)音互相關(guān)矩陣R如下估計(jì) R = RA。
全文摘要
本發(fā)明公開(kāi)了一種F范數(shù)表征信號(hào)子空間維度的多通道語(yǔ)音增強(qiáng)方法,該方法包括步驟1通過(guò)N個(gè)麥克風(fēng)組成的麥克風(fēng)陣列采集帶噪聲的多路語(yǔ)音信號(hào)y(t),并計(jì)算該多路語(yǔ)音信號(hào)y(t)的帶噪語(yǔ)音互相關(guān)矩陣Ryy,其中,t表示離散時(shí)間點(diǎn);步驟2利用噪聲估計(jì)算法估計(jì)加性噪聲互相關(guān)矩陣步驟3利用所述帶噪語(yǔ)音互相關(guān)矩陣Ryy和加性噪聲互相關(guān)矩陣估計(jì)純凈語(yǔ)音互相關(guān)矩陣步驟4利用所述純凈語(yǔ)音互相關(guān)矩陣估計(jì)信號(hào)子空間的維度步驟5對(duì)進(jìn)行廣義特征值分解,并結(jié)合信號(hào)子空間的維度和拉格朗日乘子μ獲得時(shí)域約束線性信號(hào)估計(jì)器;步驟6利用時(shí)域約束線性信號(hào)估計(jì)器對(duì)多路語(yǔ)音信號(hào)y(t)進(jìn)行濾波獲得增強(qiáng)后的語(yǔ)音
文檔編號(hào)G10L21/02GK102969000SQ20121051486
公開(kāi)日2013年3月13日 申請(qǐng)日期2012年12月4日 優(yōu)先權(quán)日2012年12月4日
發(fā)明者劉文舉, 李超 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
西乡县| 天镇县| 阿尔山市| 旌德县| 许昌县| 淳安县| 尚义县| 沂源县| 丹棱县| 遵义市| 玛曲县| 广平县| 宝清县| 宜春市| 阿拉善右旗| 泽库县| 韶山市| 都兰县| 绥德县| 杭锦后旗| 静宁县| 昌邑市| 绥德县| 广河县| 宝应县| 邛崃市| 手游| 平南县| 襄垣县| 武安市| 甘南县| 马山县| 兴义市| 泉州市| 宁城县| 民勤县| 青冈县| 北碚区| 来宾市| 凤冈县| 泰安市|