本發(fā)明具體涉及一種基于寬帶噪聲的同態(tài)濾波語(yǔ)音增強(qiáng)方法,屬于語(yǔ)音處理方法
技術(shù)領(lǐng)域:
。
背景技術(shù):
:實(shí)際環(huán)境中語(yǔ)音信號(hào)處理技術(shù)包含著很多方面,而語(yǔ)音增強(qiáng)技術(shù)是其中解決語(yǔ)音受噪聲污染的有效方法之一,它所研究的目標(biāo)就是系統(tǒng)輸出盡可能的從帶噪語(yǔ)音信號(hào)中提取純凈的語(yǔ)音信號(hào),提高傳輸質(zhì)量;而傳統(tǒng)的語(yǔ)音增強(qiáng)技術(shù)也有很多種,有譜減法、中心濾波法、同態(tài)濾波抗噪法、非線性處理法,自適應(yīng)分析方法、小波分析方法等等,噪聲的處理過(guò)程中,根據(jù)語(yǔ)音不同的特性,人耳的感知特性,不同的噪聲性質(zhì),將選用不同的語(yǔ)音增強(qiáng)方法。傳統(tǒng)的同態(tài)濾波抗噪法在同態(tài)處理時(shí),許多情況下倒譜中的基音峰值將變得不清晰甚至?xí)?,在語(yǔ)音信號(hào)與噪聲信號(hào)分離時(shí),容易產(chǎn)生相位多值性問(wèn)題,即相位卷繞,會(huì)造成提取的特征參數(shù)誤差過(guò)大,很難恢復(fù)原始的語(yǔ)音信號(hào),不能滿足系統(tǒng)的實(shí)時(shí)性;傳統(tǒng)的自相關(guān)分析方法在自相關(guān)處理時(shí)容易產(chǎn)生二次諧波,不易直接對(duì)帶噪語(yǔ)音信號(hào)的自相關(guān)系數(shù)做特征提取,以達(dá)到語(yǔ)音增強(qiáng)的目的,并且自相關(guān)分析要求信號(hào)要有很強(qiáng)的周期性,否則自相關(guān)函數(shù)類似于噪聲的高頻波形,更不易除噪分析;傳統(tǒng)的中心濾波法在語(yǔ)音增強(qiáng)時(shí)會(huì)造成語(yǔ)音質(zhì)量的損壞,中心濾波法的門限選擇很重要,很容易損失語(yǔ)音信號(hào)的相關(guān)信息,且只能在頻域中分析;傳統(tǒng)的譜減法由于語(yǔ)音能量較集中在某頻段內(nèi),語(yǔ)音增強(qiáng)處理后,仍然會(huì)有大量的殘余噪聲,在除噪過(guò)程中,如果不能消除大功率分量的噪聲,語(yǔ)音信號(hào)中仍然容易產(chǎn)生純音噪聲。針對(duì)傳統(tǒng)方法語(yǔ)音增強(qiáng)時(shí)存在的問(wèn)題,目前,也有很多不同背景噪聲環(huán)境下的語(yǔ)音增強(qiáng)的新方法研究,白噪聲下基于各向異性濾波的語(yǔ)音增強(qiáng)算法研究[j].佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,06:902-904,提出在白噪聲為背景噪聲的情況下,采用各向異性濾波方法,具有較好的濾波性能,其算法復(fù)雜度低,計(jì)算量小,運(yùn)行時(shí)間較短;改進(jìn)小波閾值函數(shù)的語(yǔ)音增強(qiáng)算法研究[j].信號(hào)處理,2016,02:203-213,是采用改進(jìn)小波閾值函數(shù)的語(yǔ)音增強(qiáng)算法來(lái)有效提升語(yǔ)音信號(hào)的可懂度和整體質(zhì)量;基于倒譜預(yù)處理技術(shù)的語(yǔ)音增強(qiáng)算法研究[j].科學(xué)技術(shù)與工程,2013,21:6111-6117,采用倒譜預(yù)處理通過(guò)抑制語(yǔ)音中濁音的諧頻成分,避免在非平穩(wěn)噪聲跟蹤過(guò)程中將語(yǔ)音濁音信號(hào)功率譜錯(cuò)誤估計(jì)成噪聲功率譜,快速有效跟蹤噪聲的同時(shí)能避免噪聲功率譜過(guò)估,來(lái)提高語(yǔ)音的傳輸質(zhì)量;低信噪比條件下的語(yǔ)音增強(qiáng)算法研究[j].中國(guó)新通信,2015,15:73-74,針對(duì)低信噪比背景條件下,譜減算法在話音增強(qiáng)方面存在著音樂(lè)噪聲問(wèn)題和低清晰度問(wèn)題,提出了基于倒譜距離和譜減算法的話音增強(qiáng)算法。短時(shí)自相關(guān)分析是語(yǔ)音信號(hào)時(shí)域分析中常用的方法,定義語(yǔ)音信號(hào)sn(m)的短時(shí)自相關(guān)函數(shù)zn(k)的計(jì)算表達(dá)式如下:其中,l是最大延遲點(diǎn)數(shù)。自相關(guān)處理抗噪法,濾波后諧波分量減少了,曲線變得平滑,但仍存在二次諧波,峰值仍然不是很尖銳,在提取語(yǔ)音信號(hào)特征時(shí)仍然容易產(chǎn)生誤差。傳統(tǒng)的同態(tài)濾波抗噪法,語(yǔ)音信號(hào)的倒譜第一峰值仍然不是很明顯,原點(diǎn)與第二峰值間的高頻分量較多,這會(huì)影響觀察特征值的準(zhǔn)確性。降噪后的語(yǔ)音信號(hào)仍然會(huì)存在較多的殘留噪聲。技術(shù)實(shí)現(xiàn)要素:因此,針對(duì)現(xiàn)有技術(shù)在提取語(yǔ)音信號(hào)特征時(shí)仍然容易產(chǎn)生誤差,以及降噪后的語(yǔ)音信號(hào)仍然會(huì)存在較多的殘留噪聲的問(wèn)題,本發(fā)明提供一種基于寬帶噪聲的同態(tài)濾波語(yǔ)音增強(qiáng)方法。所述方法具體為:獲取短時(shí)平穩(wěn)的語(yǔ)音信號(hào),然后對(duì)語(yǔ)音信號(hào)進(jìn)行自相關(guān)分析,得到自相關(guān)系數(shù),再將自相關(guān)系數(shù)做同態(tài)濾波分析處理,同態(tài)濾波分析處理時(shí),求出帶噪語(yǔ)音信號(hào)的倒譜,清除帶噪語(yǔ)音信號(hào)的倒譜的噪聲成分,得到增強(qiáng)語(yǔ)音的倒譜,經(jīng)過(guò)譜分析獲得降噪后的特征參數(shù),合成降噪后的語(yǔ)音信號(hào)。進(jìn)一步的,所述方法中對(duì)語(yǔ)音信號(hào)進(jìn)行自相關(guān)分析,得到自相關(guān)系數(shù)具體為:設(shè)語(yǔ)音信號(hào)sn(m)所占的間隔是[0,n-1],則語(yǔ)音信號(hào)的短時(shí)自相關(guān)為:其中,l是最大延遲點(diǎn)數(shù)。進(jìn)一步的,所述方法中將自相關(guān)系數(shù)做同態(tài)濾波分析處理具體為:自相關(guān)系數(shù)fft變換rn(ejw);對(duì)rn(ejw)的實(shí)部作對(duì)數(shù)運(yùn)算可得:對(duì)結(jié)果進(jìn)行fft逆變換得到改進(jìn)的cn(m):本發(fā)明的有益效果在于:本發(fā)明提供一種基于寬帶噪聲的同態(tài)濾波語(yǔ)音增強(qiáng)方法,通過(guò)對(duì)傳統(tǒng)方法的改進(jìn),優(yōu)于傳統(tǒng)方法,其平均相對(duì)誤差更小,準(zhǔn)確性更高,將更有利于語(yǔ)音識(shí)別和語(yǔ)音合成。改進(jìn)的同態(tài)濾波抗噪法能夠增強(qiáng)語(yǔ)音倒譜特征對(duì)環(huán)境噪聲的魯棒性,較準(zhǔn)確的得到語(yǔ)音的特征信息,其頑健性更好,能夠更好的達(dá)到語(yǔ)音增強(qiáng)的目的。附圖說(shuō)明圖1為實(shí)施例中自相關(guān)抗噪法的處理流程圖;圖2為實(shí)施例中自相關(guān)抗噪法中原始的語(yǔ)音信號(hào)“你好”的波形圖;圖3為在圖2中截取一幀語(yǔ)音信號(hào)做自相關(guān)分析示意圖;圖4為傳統(tǒng)的自相關(guān)抗噪法語(yǔ)音增強(qiáng)的仿真效果圖;圖5為傳統(tǒng)的同態(tài)濾波抗噪法流程圖;圖6為傳統(tǒng)的同態(tài)濾波抗噪法效果圖;圖7為傳統(tǒng)的同態(tài)濾波特征提取示意圖;圖8為改進(jìn)的同態(tài)濾波抗噪法流程圖;圖9為改進(jìn)的同態(tài)濾波抗噪法語(yǔ)音增強(qiáng)的仿真效果圖;圖10為改進(jìn)的同態(tài)濾波輸出提取語(yǔ)音信號(hào)的特征參數(shù)仿真圖。具體實(shí)施方式下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式進(jìn)行說(shuō)明:本發(fā)明在傳統(tǒng)的自相關(guān)處理抗噪法和傳統(tǒng)的同態(tài)濾波抗噪法基礎(chǔ)上改進(jìn),設(shè)計(jì)了改進(jìn)的同態(tài)濾波抗噪法。傳統(tǒng)的自相關(guān)抗噪法自相關(guān)處理抗噪法對(duì)帶噪聲的語(yǔ)音信號(hào)進(jìn)行自相關(guān)分析,可以得到與不帶噪聲的語(yǔ)音信號(hào)同樣的自相關(guān)序列,語(yǔ)音信號(hào)的自相關(guān)與噪聲無(wú)關(guān),因此,帶噪語(yǔ)音信號(hào)的自相關(guān)可以近似為純凈語(yǔ)音信號(hào)的自相關(guān),所以,將自相關(guān)系數(shù)作為語(yǔ)音處理系統(tǒng)的特征值,就可以達(dá)到抗噪聲的目的。自相關(guān)抗噪法的處理流程如圖1所示。在普通室內(nèi)環(huán)境采用cooledit錄制女生帶噪語(yǔ)音信號(hào)“你好”,采樣頻率為22khz,單聲道,如圖2所示。截取一幀語(yǔ)音信號(hào)做自相關(guān)分析,如圖3所示。圖3可以看出,原始的一幀帶噪語(yǔ)音信號(hào)有一定的周期性,但諧波分量較多,峰值不是很尖銳,在特征參數(shù)的提取過(guò)程中會(huì)產(chǎn)生一定的誤差。對(duì)原始的帶噪語(yǔ)音信號(hào)采用傳統(tǒng)的自相關(guān)抗噪法語(yǔ)音增強(qiáng)的仿真效果如圖4所示。通過(guò)仿真圖4可以看出,濾波后諧波分量減少了,曲線變得平滑,但仍存在二次諧波,峰值仍然不是很尖銳,在提取語(yǔ)音信號(hào)特征時(shí)仍然容易產(chǎn)生誤差。傳統(tǒng)的同態(tài)濾波抗噪法語(yǔ)音信號(hào)不是加性信號(hào),而是卷積性信號(hào)。為了能用線性系統(tǒng)對(duì)其進(jìn)行處理,可以先采用卷積同態(tài)系統(tǒng)處理。假設(shè)被處理的語(yǔ)音信號(hào)s(n)所占用的間隔是[0,n-1],這里所用的間隔長(zhǎng)度n可以選擇大于實(shí)際的長(zhǎng)度;n的大小決定著倒譜c(n)中是否存在有混疊,代表著離散時(shí)域頻譜是否有更佳的分辨率。當(dāng)n大于s(n)的實(shí)際長(zhǎng)度時(shí),可以在s(n)的后方添若干個(gè)零來(lái)補(bǔ)足所需的長(zhǎng)度,這稱為“補(bǔ)零”。若語(yǔ)音信號(hào)s(n)經(jīng)過(guò)同態(tài)濾波可以還原原始的語(yǔ)音信號(hào),則證明該語(yǔ)音信號(hào)不存在混疊失真,可以直接求出語(yǔ)音信號(hào)s(n)的倒譜c(n)。設(shè):則對(duì)其取對(duì)數(shù)可得:復(fù)數(shù)的對(duì)數(shù)仍然是復(fù)數(shù),它包含實(shí)部和虛部;對(duì)數(shù)的虛部arg[s(ejw)]由于是s(ejw)的相位,所以將產(chǎn)生不一致性。如果我們只考慮的實(shí)部,并令c(n)=f-1ln|s(ejw)|(公式c)c(n)是可以認(rèn)為是語(yǔ)音信號(hào)s(n)對(duì)數(shù)幅度譜的傅里葉逆變換,c(n)稱為“倒譜”。那么,傳統(tǒng)的同態(tài)濾波抗噪法流程圖如圖5所示。其中,a為短時(shí)語(yǔ)音信號(hào);b為短時(shí)頻譜;c為對(duì)數(shù)頻譜;d為倒譜系數(shù);e為對(duì)數(shù)頻譜包絡(luò);f為基本周期。對(duì)原始的帶噪語(yǔ)音信號(hào)采用傳統(tǒng)的同態(tài)濾波抗噪法,語(yǔ)音增強(qiáng)的仿真效果如圖6所示。通過(guò)仿真圖6可以看出,采用傳統(tǒng)的同態(tài)濾波抗噪法后,語(yǔ)音信號(hào)的倒譜第一峰值仍然不是很明顯,原點(diǎn)與第二峰值間的高頻分量較多,這會(huì)影響觀察特征值的準(zhǔn)確性。對(duì)傳統(tǒng)的同態(tài)濾波輸出提取語(yǔ)音信號(hào)的特征參數(shù),如圖7所示。從圖7可以看出,傳統(tǒng)的同態(tài)濾波輸出,接近原點(diǎn)的第一峰值坐標(biāo)為(12,0.12),第一峰值比較平滑,特征提取時(shí)會(huì)造成較大的誤差,降噪后的語(yǔ)音信號(hào)仍然會(huì)存在較多的殘留噪聲。本發(fā)明的方法在本發(fā)明中,采用改進(jìn)的同態(tài)濾波抗噪法對(duì)語(yǔ)音信號(hào)的前期處理和傳統(tǒng)的同態(tài)濾波抗噪法是一樣的,語(yǔ)音信號(hào)都必須先進(jìn)行數(shù)字化和預(yù)處理,獲取短時(shí)平穩(wěn)的語(yǔ)音信號(hào),然后對(duì)其信號(hào)進(jìn)行自相關(guān)分析,得到自相關(guān)系數(shù),再將自相關(guān)系數(shù)做同態(tài)濾波分析,同態(tài)處理時(shí),求出帶噪語(yǔ)音信號(hào)的倒譜,清除帶噪語(yǔ)音信號(hào)的倒譜的噪聲成分,得到增強(qiáng)語(yǔ)音的倒譜,并經(jīng)過(guò)譜分析獲得降噪后的特征參數(shù),合成降噪后的語(yǔ)音信號(hào),到達(dá)語(yǔ)音增強(qiáng)的目的,具體算法流程如圖8所示。其中,a為短時(shí)語(yǔ)音信號(hào);b為自相關(guān)系數(shù);c為自相關(guān)短時(shí)頻譜;d為自相關(guān)對(duì)數(shù)頻譜;e為改進(jìn)的倒譜系數(shù);f為對(duì)數(shù)頻譜包絡(luò);g為基本周期。1)求短時(shí)語(yǔ)音信號(hào)的自相關(guān):設(shè)語(yǔ)音信號(hào)sn(m)所占的間隔是[0,n-1]。則語(yǔ)音信號(hào)的短時(shí)自相關(guān)為:2)對(duì)自相關(guān)系數(shù)同態(tài)處理:a)自相關(guān)系數(shù)fft變換rn(ejw);b)對(duì)rn(ejw)的實(shí)部作對(duì)數(shù)運(yùn)算可得:c)對(duì)上面的結(jié)果進(jìn)行fft逆變換得到改進(jìn)的cn(m):對(duì)原始的帶噪語(yǔ)音信號(hào)采用改進(jìn)的同態(tài)濾波抗噪法,語(yǔ)音增強(qiáng)的仿真效果如圖9所示;通過(guò)仿真圖9可以看出,采用改進(jìn)的同態(tài)濾波抗噪法,諧波分量明顯減少了,周期性變得更加清楚,這將提高帶噪語(yǔ)音信號(hào)特征參數(shù)提取的準(zhǔn)確性。對(duì)改進(jìn)的同態(tài)濾波輸出提取語(yǔ)音信號(hào)的特征參數(shù)仿真如圖10所示。從圖10可以看出,改進(jìn)的同態(tài)濾波輸出,接近原點(diǎn)的第一峰值坐標(biāo)為(11,0.34),第一峰值比較尖銳,更接近原點(diǎn),會(huì)提高特征提取的準(zhǔn)確性,可以更好的合成降噪后的語(yǔ)音信號(hào),從而到達(dá)語(yǔ)音增強(qiáng)的目的。本發(fā)明方法與傳統(tǒng)同態(tài)濾波抗噪法的比對(duì)分析為進(jìn)一步比較傳統(tǒng)同態(tài)濾波抗噪法和本發(fā)明相關(guān)-同態(tài)濾波抗噪法的性能,對(duì)帶噪語(yǔ)音錄音進(jìn)行20次的實(shí)驗(yàn)仿真。使用兩種算法進(jìn)行信噪比的比對(duì)分析,進(jìn)行10次語(yǔ)音信號(hào)大信噪比和10次語(yǔ)音信號(hào)小信噪比的比對(duì),并計(jì)算平均相對(duì)誤差(百分比)。實(shí)驗(yàn)結(jié)果大信噪比語(yǔ)音信號(hào)平均相對(duì)誤差如表1所示,小信噪比語(yǔ)音信號(hào)平均相對(duì)誤差如表2所示。表1檢測(cè)算法傳統(tǒng)同態(tài)濾波相關(guān)-同態(tài)濾波平均相對(duì)誤差0.550.46表2檢測(cè)算法傳統(tǒng)同態(tài)濾波相關(guān)-同態(tài)濾波平均相對(duì)誤差20.315.9由以上帶噪語(yǔ)音信號(hào)信噪比的比對(duì)分析可得,相關(guān)-同態(tài)濾波法優(yōu)于傳統(tǒng)同態(tài)濾波法,其平均相對(duì)誤差更小,準(zhǔn)確性更高,將更有利于語(yǔ)音識(shí)別和語(yǔ)音合成。噪聲可以是加性噪聲,也可以是非加性噪聲,而說(shuō)話時(shí)呼吸引起的寬帶噪聲為非加性噪聲,需要采用同態(tài)濾波轉(zhuǎn)為加性噪聲,對(duì)純凈的語(yǔ)音信號(hào)和噪聲信號(hào)進(jìn)行分離,提出純凈語(yǔ)音信號(hào),在上述分析中,可以看出,改進(jìn)的同態(tài)濾波抗噪法能夠增強(qiáng)語(yǔ)音倒譜特征對(duì)環(huán)境噪聲的魯棒性,較準(zhǔn)確的得到語(yǔ)音的特征信息,其頑健性更好,能夠更好的達(dá)到語(yǔ)音增強(qiáng)的目的。以上是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以作出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。當(dāng)前第1頁(yè)12