專利名稱:語(yǔ)音濾波的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在通信網(wǎng)絡(luò)中對(duì)語(yǔ)音進(jìn)行濾波。
背景技術(shù):
通信網(wǎng)絡(luò)使用戶之間在網(wǎng)絡(luò)上進(jìn)行實(shí)時(shí)語(yǔ)音通信。隨著時(shí)間推移,通信網(wǎng)絡(luò)的用戶數(shù)量快速增加,而且每個(gè)用戶都期望更好質(zhì)量的語(yǔ)音通信。為了滿足用戶的期望,實(shí)時(shí)通信應(yīng)用的核心部分是語(yǔ)音編碼器,所述語(yǔ)音編碼器壓縮音頻信號(hào)以便于在網(wǎng)絡(luò)上進(jìn)行高效傳輸。語(yǔ)音編碼器的復(fù)雜性日益增加,因此音頻信號(hào)可以進(jìn)一步被壓縮而不會(huì)使所述信號(hào)的質(zhì)量降低到可接收水平以下?,F(xiàn)代的語(yǔ)音編碼器尤其適合壓縮作為語(yǔ)音信號(hào)的音頻信號(hào)。當(dāng)用戶收聽語(yǔ)音信號(hào)時(shí),他對(duì)所述語(yǔ)音的理解能力對(duì)語(yǔ)音信號(hào)的某些成分的依賴大于對(duì)語(yǔ)音信號(hào)的其他成分的依賴。為了反映此種情況,語(yǔ)音編碼器能夠分析進(jìn)來(lái)的語(yǔ)音信號(hào), 并以不丟失語(yǔ)音信號(hào)的較重要的信息成分而壓縮語(yǔ)音信號(hào)的方式來(lái)壓縮語(yǔ)音信號(hào)。理想地,進(jìn)來(lái)的語(yǔ)音信號(hào)僅由待編碼的語(yǔ)音組成。在這種理想的情況下,在壓縮語(yǔ)音信號(hào)時(shí),在語(yǔ)音編碼器中進(jìn)行的語(yǔ)音分析以及編碼會(huì)非常有效。然而,事實(shí)上,進(jìn)來(lái)的語(yǔ)音信號(hào)幾乎總是包含所需的語(yǔ)音和一些背景噪聲。所述背景噪聲會(huì)影響在語(yǔ)音編碼器中進(jìn)行的語(yǔ)音分析以及編碼,使得其不如在沒有背景噪聲的理想情況下有效。人的語(yǔ)音在低頻率(例如,在O-SOHz的范圍內(nèi))時(shí)通常不具有強(qiáng)的成分。然而, 低頻噪聲通常能夠具有由機(jī)器等引起的大的振幅。在語(yǔ)音編碼器的語(yǔ)音分析以及編碼的輸入中還可能存在不需要的直流偏壓。所述直流偏壓和低頻噪聲對(duì)編碼過(guò)程有損害,因?yàn)樗鼈儠?huì)導(dǎo)致在語(yǔ)音分析中的數(shù)值問(wèn)題并且會(huì)增加編碼偽像(coding artifact)。當(dāng)所述信號(hào)被編碼并且被送至接收解碼器時(shí),在編碼過(guò)程中的數(shù)值問(wèn)題和編碼偽像會(huì)產(chǎn)生聽起來(lái)更嘈雜的經(jīng)解碼信號(hào)。因此,在所述語(yǔ)音信號(hào)被分析和編碼之前,希望從進(jìn)來(lái)的語(yǔ)音信號(hào)中除去低頻噪聲和直流偏壓。過(guò)去,高通濾波器已被用在進(jìn)來(lái)的語(yǔ)音信號(hào)以除去直流偏壓和低頻噪聲。用于這種高通濾波器的典型截止頻率為80-150HZ。圖1顯示作為頻率的函數(shù)的典型語(yǔ)音信號(hào)的能量的曲線圖。使用具有高截止頻率(例如,150Hz)的高通濾波器是有益的,因?yàn)榭梢詮妮斎胄盘?hào)中除去更多的低頻噪聲。這具有降低在編碼過(guò)程中由背景噪聲產(chǎn)生的數(shù)值問(wèn)題和編碼偽像的優(yōu)點(diǎn)。然而,如果將高通濾波器的截止頻率設(shè)定為高值,則除去更大部分的語(yǔ)音信號(hào)。在編碼語(yǔ)音信號(hào)之前除去太多的語(yǔ)音信號(hào)顯然是不利的。如圖1所示,如果將截止頻率設(shè)定為150Hz,那么圖1所示的語(yǔ)音信號(hào)的第一大峰值(在大約120Hz處)被除去。然而, 如果將截止頻率設(shè)定為80Hz,則除去了更少的背景噪聲。尤其,頻率在80Hz和語(yǔ)音信號(hào)的第一大峰值(在大約120Hz)之間的背景噪聲沒有被除去。因此,為了在盡可能多地除去低頻噪聲的需求與確保不除去太多的語(yǔ)音信號(hào)的需求之間平衡,在選擇高通濾波器的截止頻率時(shí)存在問(wèn)題。
發(fā)明內(nèi)容
在本發(fā)明的一個(gè)方案中,提供了一種在通信網(wǎng)絡(luò)中用于語(yǔ)音編碼的語(yǔ)音信號(hào)濾波方法,所述方法包括確定濾波器的截止頻率,其中,低于所述截止頻率的頻率范圍內(nèi)的語(yǔ)音信號(hào)的成分由濾波器進(jìn)行衰減;在所述濾波器處接收語(yǔ)音信號(hào);確定所述接收到的語(yǔ)音信號(hào)的至少一個(gè)參數(shù),所述至少一個(gè)參數(shù)提供要衰減的所述接收到的語(yǔ)音信號(hào)的成分的能量的指示;以及根據(jù)所述至少一個(gè)參數(shù)來(lái)調(diào)節(jié)所述截止頻率,從而調(diào)節(jié)要衰減的頻率范圍。 所述至少一個(gè)參數(shù)包括所述語(yǔ)音信號(hào)的基音頻率。所述截止頻率被調(diào)節(jié)為不大于確定的基音頻率。所述至少一個(gè)參數(shù)可進(jìn)一步包括所述語(yǔ)音信號(hào)的信噪比。所述方法可進(jìn)一步包括利用所述信噪比計(jì)算信號(hào)質(zhì)量標(biāo)準(zhǔn);以及根據(jù)所述的信號(hào)質(zhì)量標(biāo)準(zhǔn)來(lái)調(diào)節(jié)確定的基音頻率。所述方法可進(jìn)一步包括對(duì)多個(gè)所述接收到的語(yǔ)音信號(hào)的幀平滑所述確定的基音頻率。可以使用所述接收到的語(yǔ)音信號(hào)的基音延遲來(lái)確定基音頻率,所述方法進(jìn)一步包括通過(guò)使所述語(yǔ)音信號(hào)的第一幀與由所述基音延遲所延遲的所述語(yǔ)音信號(hào)的第二幀相關(guān)聯(lián)來(lái)確定基音關(guān)聯(lián)值,其中,所述關(guān)聯(lián)值在閾值以下的幀被分類為清音幀,而所述關(guān)聯(lián)值至少為所述閾值的幀被分類為濁音幀,并且其中,對(duì)濁音幀進(jìn)行基音頻率的平滑,而對(duì)清音幀保持經(jīng)平滑的基音頻率不變??蓪⑺鼋刂诡l率調(diào)節(jié)為等于確定的基音頻率。當(dāng)信噪比提高時(shí),可降低所述截止頻率。所述信號(hào)可被拆分為頻率子帶,并且所述信噪比為最低頻率子帶的信噪比??梢詣?dòng)態(tài)地確定所述至少一個(gè)參數(shù),并且可以動(dòng)態(tài)地調(diào)節(jié)所述截止頻率。對(duì)于接收到的語(yǔ)音信號(hào)的每幀可以至少確定一次所述至少一個(gè)參數(shù),并且對(duì)于接收到的語(yǔ)音信號(hào)的每幀可以至少調(diào)節(jié)一次所述截止頻率。要衰減的所述接收到的語(yǔ)音信號(hào)的成分可為包含語(yǔ)音的語(yǔ)音信號(hào)的語(yǔ)音成分。在本發(fā)明的另一個(gè)方案中,提供了一種在通信網(wǎng)絡(luò)中用于語(yǔ)音編碼的語(yǔ)音信號(hào)濾波的濾波器,所述濾波器具有截止頻率,其中,低于所述截止頻率的頻率范圍內(nèi)的語(yǔ)音信號(hào)的成分由濾波器進(jìn)行衰減;確定所述接收到的語(yǔ)音信號(hào)的至少一個(gè)參數(shù)的部件,所述至少一個(gè)參數(shù)提供要衰減的所述接收到的語(yǔ)音信號(hào)的成分的能量的指示;以及根據(jù)所述至少一個(gè)參數(shù)調(diào)節(jié)所述截止頻率從而調(diào)節(jié)要衰減的頻率范圍的部件。所述至少一個(gè)參數(shù)包括所述語(yǔ)音信號(hào)的基音頻率。設(shè)置用于調(diào)節(jié)截止頻率的所述部件以使得所述截止頻率被調(diào)節(jié)為不大于所述確定的基音頻率。所述至少一個(gè)參數(shù)可包括所述語(yǔ)音信號(hào)的信噪比。所述至少一個(gè)參數(shù)可包括基音延遲和所述語(yǔ)音信號(hào)的信噪比。所述濾波器可進(jìn)一步具有利用所述信噪比來(lái)計(jì)算信號(hào)質(zhì)量標(biāo)準(zhǔn)的部件;以及根據(jù)所述信號(hào)質(zhì)量標(biāo)準(zhǔn)來(lái)調(diào)節(jié)確定的基音頻率的部件。所述濾波器可進(jìn)一步包括對(duì)多個(gè)接收到的語(yǔ)音信號(hào)的幀平滑確定的基音頻率的部件。
利用所述接收到的語(yǔ)音信號(hào)的基音延遲可以確定所述基音頻率。所述濾波器進(jìn)一步包括通過(guò)使所述語(yǔ)音信號(hào)的第一幀與由所述基音延遲所延遲的信號(hào)的第二幀相關(guān)聯(lián)來(lái)確定基音關(guān)聯(lián)值的部件,其中,所述關(guān)聯(lián)值在閾值以下的幀被分類為清音幀,而所述關(guān)聯(lián)值至少為閾值的幀被分類為濁音幀,并且其中,對(duì)濁音幀進(jìn)行所述基音頻率的平滑,而對(duì)清音幀保持經(jīng)平滑的基音頻率不變。可以將所述截止頻率調(diào)節(jié)為等于所述確定的基音頻率。在信噪比增加時(shí),用于調(diào)節(jié)所述截止頻率的所述部件可降低截止頻率。所述濾波器可進(jìn)一步包括將所述語(yǔ)音信號(hào)拆分成頻率子帶的部件,其中所述信噪比為最低頻率子帶的信噪比??梢詣?dòng)態(tài)地確定所述至少一個(gè)參數(shù),并且可以動(dòng)態(tài)地調(diào)節(jié)所述截止頻率。對(duì)于接收到的語(yǔ)音信號(hào)的每幀可以至少確定一次所述至少一個(gè)參數(shù),并且對(duì)于接收到的語(yǔ)音信號(hào)的每幀可以至少調(diào)節(jié)一次所述截止頻率。要衰減的所述接收到的語(yǔ)音信號(hào)的成分可為包含語(yǔ)音的語(yǔ)音信號(hào)的語(yǔ)音成分??梢栽O(shè)置包括用于執(zhí)行上述方法的計(jì)算機(jī)可讀指令的計(jì)算機(jī)可讀介質(zhì)。
為了更好地理解本發(fā)明以及顯示可以如何實(shí)施本發(fā)明,現(xiàn)在將通過(guò)實(shí)例的方式以下列附圖為參考,其中圖1顯示作為頻率的函數(shù)的典型語(yǔ)音信號(hào)的能量的曲線圖;圖2為語(yǔ)音編碼器的示意圖;圖3顯示語(yǔ)音編碼器的更詳細(xì)的示意圖;圖4為在語(yǔ)音編碼器處執(zhí)行的方法的流程圖;圖5為噪聲整形量化器的框圖;以及圖6為解碼器的框圖。
具體實(shí)施例方式首先參考圖示語(yǔ)音編碼器200的圖2。所述語(yǔ)音編碼器200包括高通濾波器202、 語(yǔ)音分析塊204、噪聲整形量化器206和算術(shù)編碼塊208。在高通濾波器202和語(yǔ)音分析塊204處從輸入設(shè)備(例如話筒)接收輸入的語(yǔ)音信號(hào)。所述語(yǔ)音信號(hào)可包括語(yǔ)音或背景噪聲或其他干擾。以取樣頻率Fs按幀對(duì)所述輸入的語(yǔ)音信號(hào)進(jìn)行取樣。作為示例,所述取樣頻率可為16kHz,并且所述幀的持續(xù)時(shí)間可為20 毫秒。設(shè)置所述高通濾波器202以濾波所述語(yǔ)音信號(hào),來(lái)衰減語(yǔ)音信號(hào)的具有低于所述濾波器202的截止頻率的頻率的成分。在語(yǔ)音分析塊204處和在噪聲整形量化器206處接收經(jīng)濾波的語(yǔ)音信號(hào)。所述語(yǔ)音分析塊204使用所述語(yǔ)音信號(hào)和經(jīng)濾波的語(yǔ)音信號(hào)來(lái)確定接收的語(yǔ)音信號(hào)的參數(shù)。參數(shù)(在圖1中被標(biāo)為“濾波器參數(shù)”)被輸出到高通濾波器202。根據(jù)在語(yǔ)音分析塊204中確定的參數(shù)來(lái)調(diào)節(jié)所述高通濾波器202的截止頻率。下面將更加詳細(xì)地描述所述濾波器參數(shù),并且所述濾波器參數(shù)可包括語(yǔ)音信號(hào)的信噪比和/或語(yǔ)音信號(hào)的基音延遲。
將噪聲整形參數(shù)從語(yǔ)音分析塊204輸出到噪聲整形量化器206。所述噪聲整形量化器206產(chǎn)生量化索引(quantization indices),所述量化索引被輸出到算術(shù)編碼塊208。 所述算術(shù)編碼塊208從語(yǔ)音分析塊204接收編碼參數(shù)。為了從輸出設(shè)備(例如,有線的調(diào)制解調(diào)器或無(wú)線的收發(fā)器)進(jìn)行傳輸,設(shè)置所述算術(shù)編碼塊208以基于其輸入產(chǎn)生輸出比特流。圖3顯示編碼器200的更詳細(xì)的圖。所述語(yǔ)音分析塊204的成分示于圖2中。所述語(yǔ)音分析塊204包括話音活動(dòng)檢測(cè)器302、線性預(yù)測(cè)編碼(LPC)分析塊304、第一向量量化器206、開環(huán)基音分析塊308、長(zhǎng)期預(yù)測(cè)(LTP)分析塊310、第二向量量化器312和噪聲整形分析塊314。所述話音活動(dòng)檢測(cè)器302包括用于確定輸入信號(hào)的SNR(信噪比)的SNR模塊316。所述開環(huán)基音分析塊308包括用于確定輸入信號(hào)的基音延遲的基音延遲模塊318。 所述話音活動(dòng)檢測(cè)器302具有被設(shè)置來(lái)接收所述輸入語(yǔ)音信號(hào)的輸入端、聯(lián)接到高通濾波器202的第一輸出端和聯(lián)接到開環(huán)基音分析塊308的第二輸出端。所述高通濾波器202具有聯(lián)接到所述LPC分析塊304和噪聲整形分析塊314的輸入端的輸出端。所述LPC分析塊具有聯(lián)接到所述第一向量量化器306的輸入端的輸出端,并且所述第一向量量化器306具有聯(lián)接到算術(shù)編碼塊208和噪聲整形量化器206的輸入端的輸出端。所述LPC分析塊304 具有聯(lián)接到開環(huán)基音分析塊308和LTP分析塊310的輸入端的輸出端。所述LTP分析塊 310具有聯(lián)接到所述第二向量量化器312的輸入端的輸出端,并且所述第二向量量化器312 具有聯(lián)接到算術(shù)編碼塊208和噪聲整形量化器206的輸入端的輸出端。所述開環(huán)基音分析塊308具有聯(lián)接到LTP分析塊310、噪聲整形分析塊314和高通濾波器202的輸入端的輸出端。所述噪聲整形分析塊314具有聯(lián)接到算術(shù)編碼塊208和噪聲整形量化器206的輸入端的輸出端。對(duì)輸入語(yǔ)音信號(hào)的每幀,設(shè)置所述話音活動(dòng)檢測(cè)器302以確定話音活動(dòng)、波譜傾斜和信噪估算量的標(biāo)準(zhǔn)。利用所述SNR模塊316確定所述信噪估算量。在一個(gè)實(shí)施方式中,所述話音活動(dòng)檢測(cè)器302利用半帶濾波器組的序列將信號(hào)拆分成四個(gè)頻率子帶0-Fs/16、Fs/16-Fs/8、Fs/8_Fs/4、Fs/4_Fs/2,其中 Fs 為取樣頻率(16kHz 或MkHz)。可以通過(guò)一階MA (移動(dòng)平均)濾波器(H(z) = I-Z-1)在話音活動(dòng)檢測(cè)器302中對(duì)最低子帶(0-Fs/16)進(jìn)行高通濾波以除去最低頻率。對(duì)于語(yǔ)音信號(hào)的每幀,計(jì)算每個(gè)子帶的信號(hào)能量。在各子帶中,噪聲水平估值器測(cè)量背景噪聲水平,并且將SNR值計(jì)算為能量對(duì)噪聲水平的比率的對(duì)數(shù)。利用這些中間變量,計(jì)算下列參數(shù) 平均SNR-子帶SNR值的平均值 平滑的子帶SNR-時(shí)間平滑的子帶SNR值 語(yǔ)音活動(dòng)水平-基于平均SNR和子帶能量的加權(quán)平均值 波譜傾斜-子帶SNR的加權(quán)平均,對(duì)低子帶具有正權(quán)重,而對(duì)高子帶具有負(fù)權(quán)重。如上所述,設(shè)置所述高通濾波器202以對(duì)取樣的語(yǔ)音信號(hào)進(jìn)行濾波,來(lái)除去包含小的語(yǔ)音能量并且可包含噪音的波譜的最低部分?,F(xiàn)在參考圖4,圖4顯示出在語(yǔ)音編碼器中執(zhí)行的方法的流程圖。在步驟S402所述語(yǔ)音編碼器200接收語(yǔ)音信號(hào)。如上所述,在高通濾波器202處以及在語(yǔ)音分析塊204 的話音活動(dòng)檢測(cè)器302處接收語(yǔ)音信號(hào)。所述語(yǔ)音信號(hào)可被拆分成幀,例如,每幀的持續(xù)時(shí)間可為20毫秒。在步驟S404,如上所述,在話音活動(dòng)檢測(cè)器302的SNR模塊316中確定所述語(yǔ)音信號(hào)的SNR值。還是如上所述,可以通過(guò)SNR模塊316來(lái)確定所述語(yǔ)音信號(hào)的最低頻率子帶 (0-Fs/16)的平滑的SNR值。高通濾波器202從話音活動(dòng)檢測(cè)器302接收最低子帶的平滑的子帶SNR。高通濾波器202還可以從話音活動(dòng)檢測(cè)器302接收話音活動(dòng)水平。在步驟S406,如上所述,在開環(huán)基音分析塊308的基音延遲模塊318中確定所述語(yǔ)音信號(hào)的基音延遲。所述基音延遲及時(shí)給出在任何給定點(diǎn)處的語(yǔ)音信號(hào)的近似周期的指示。利用下面更詳細(xì)描述的關(guān)聯(lián)方法確定基音延遲。高通濾波器202從開環(huán)基音分析塊308接收基音延遲值。如下所述,利用接收的基音延遲,高通濾波器202可以確定平滑的基音頻率。在步驟S408,調(diào)節(jié)高通濾波器202的截止頻率。在優(yōu)選的實(shí)施方式中,設(shè)置高通濾波器202以基于最低子帶的平滑的子帶SNR和平滑的基音頻率來(lái)調(diào)節(jié)其截止頻率。在另一實(shí)施方式中,可以僅基于最低子帶的平滑的子帶SNR來(lái)調(diào)節(jié)高通濾波器202的截止頻率。 在另一實(shí)施方式中,可以僅基于平滑的基音頻率來(lái)調(diào)節(jié)高通濾波器202的截止頻率。如果最低子帶的平滑的子帶SNR的值在閾值以下,則設(shè)置所述截止頻率為高值。 在一個(gè)實(shí)施方式中,當(dāng)確定的語(yǔ)音信號(hào)的SNR值增加時(shí),所述截止頻率降低。通過(guò)這種方法,當(dāng)在語(yǔ)音信號(hào)中存在很少的噪聲時(shí),降低截止頻率以使更少的輸入語(yǔ)音信號(hào)被衰減。相似地,當(dāng)確定的語(yǔ)音信號(hào)的SNR值降低時(shí),所述截止頻率升高,使得當(dāng)在語(yǔ)音信號(hào)中存在許多噪聲時(shí),輸入語(yǔ)音信號(hào)的更大頻率范圍被衰減。按照如下所述根據(jù)確定的基音延遲計(jì)算平滑的基音頻率以Hz計(jì)的基音頻率的對(duì)數(shù)(LP)計(jì)算為取樣頻率Fs和在前一幀結(jié)束時(shí)確定的基音延遲的比率。因此對(duì)于第k幀,基音頻率(LP(k))的對(duì)數(shù)用下式表示LP (k) = log(Fs/Lag(k-l))根據(jù)由話音活動(dòng)檢測(cè)器302確定的對(duì)于第k幀的最低子帶的平滑的子帶 SNR(SNR(k))計(jì)算具有值在0和ι之間的低頻信號(hào)質(zhì)量標(biāo)準(zhǔn)⑴)。如在上述實(shí)例中所描述的,當(dāng)取樣頻率為16HZ并且最低子帶為0-Fs/16時(shí),那么最低子帶的頻率范圍為O-lOOOHz。 根據(jù)下列等式計(jì)算對(duì)于第k幀的低頻信號(hào)質(zhì)量標(biāo)準(zhǔn)OKk))Q(k) = sigmoid (0. 25 (SNR (k)-16))其中,sigmoid函數(shù)定義為sigmoid (a)=--—-
1 + exp(-a)對(duì)于高值的SNR,Q也高。對(duì)于低值的SNR,Q也低??墒褂盟龅皖l信號(hào)質(zhì)量標(biāo)準(zhǔn)(Q)來(lái)調(diào)節(jié)基音頻率的對(duì)數(shù)(LP),以使得當(dāng)對(duì)于低頻率SNR為高時(shí)降低基音頻率的對(duì)數(shù) (LP)。通過(guò)利用經(jīng)調(diào)節(jié)的基音頻率的對(duì)數(shù),當(dāng)對(duì)于低頻率SNR為高時(shí),可以降低利用經(jīng)調(diào)節(jié)的基音頻率的對(duì)數(shù)計(jì)算的截止頻率。根據(jù)下列等式計(jì)算對(duì)于第k幀的經(jīng)調(diào)節(jié)的基音頻率的對(duì)數(shù)(LPadjusted (k))LPadjusted (k) = LP (k) +0. 5 (0. 6_Q (k)) -Q (k)2 (LP (k) -log (Pmin))其中,Pmin為允許的最低截止頻率,例如,80Hz。對(duì)每幀遞歸地平滑經(jīng)調(diào)節(jié)的基音頻率的對(duì)數(shù),使得對(duì)于第k幀,平滑的基音頻率的對(duì)數(shù)(LPs_th(k))用下式表示LPsmooth (k) = LPsmooth (k-1) +coef (LPadjusted (k) -LPsmooth (k-1))如果LPadjusted (k) > LPsmooth (k-1),則平滑系數(shù)coef等于0. 1,否則等于0. 3。平滑系數(shù)的這種適應(yīng)性具有如下效果使平滑濾波器(smoother)在開環(huán)基音分析塊308中發(fā)現(xiàn)的基音頻率的范圍的低端附近跟蹤基音頻率的對(duì)數(shù)。平滑的基音頻率的對(duì)數(shù)的以上計(jì)算僅對(duì)濁音幀進(jìn)行;對(duì)于清音幀,平滑的基音頻率的對(duì)數(shù)保持不變。通過(guò)將對(duì)于第k幀的平滑的基音頻率的對(duì)數(shù)(LPs_th(k)轉(zhuǎn)換回線性域可以獲得高通濾波器的截止頻率,以使得根據(jù)下列等式響應(yīng)第k幀的接收而調(diào)節(jié)所述截止頻率Fc Fc (k) = exp (LPsmooth (k))當(dāng)在輸入語(yǔ)音信號(hào)的最低頻率處存在大量的背景噪聲時(shí)(即,當(dāng)最低子帶的平滑的SNR值為低時(shí)),將高通濾波器202的截止頻率調(diào)節(jié)為近似于語(yǔ)音信號(hào)的第一語(yǔ)音諧波的頻率。語(yǔ)音信號(hào)的第一諧波具有等于基音頻率的頻率。因此,將截止頻率調(diào)節(jié)為檢測(cè)到的基音頻率使高通濾波器202衰減盡可能多的低頻噪聲而不除去太多的語(yǔ)音信號(hào),即,不衰減語(yǔ)音信號(hào)的第一諧波??梢詫⒔刂诡l率確定為不大于語(yǔ)音信號(hào)的基音頻率,以使得不衰減語(yǔ)音信號(hào)的第一諧波(例如,圖1所示的在約120Hz處的峰值)。語(yǔ)音信號(hào)確實(shí)含有一些在第一諧波以下的能量。因此,當(dāng)存在很少或沒有背景噪聲時(shí)(即,當(dāng)最低子帶的平滑的SNR值為高時(shí)),在低頻率衰減更少的輸入信號(hào)是有益的。 當(dāng)在低頻率處的SNR值為高時(shí),這可以通過(guò)從基音頻率降低截止頻率來(lái)實(shí)現(xiàn)。如上所述,通過(guò)基于信噪比(SNR(k))計(jì)算經(jīng)調(diào)節(jié)的基音頻率的對(duì)數(shù)LPadjusted(k)以及利用經(jīng)調(diào)節(jié)的基音頻率的對(duì)數(shù)來(lái)確定截止頻率F。(k),可以進(jìn)行截止頻率的這種調(diào)節(jié)。因?yàn)槔闷交幕纛l率的對(duì)數(shù)來(lái)確定截止頻率,因此可以平滑地調(diào)節(jié)截止頻率。截止頻率的平滑使編碼的信號(hào)給人的感覺更加穩(wěn)定和令人愉悅。在優(yōu)選的實(shí)施方式中,當(dāng)將語(yǔ)音信號(hào)的第k幀輸入到高通濾波器202時(shí),高通濾波器202的截止頻率具有響應(yīng)在前一幀(即,第(k-Ι)幀)進(jìn)行的語(yǔ)音分析而已被調(diào)節(jié)的值 (Fc (k-1))。在可選的實(shí)施方式中,在被輸入到高通濾波器202以前,第k幀被輸入到緩沖器。 然而,第k幀被直接輸入到語(yǔ)音分析塊204中。按照這種方式,在第k幀位于緩沖器中時(shí), 可以對(duì)第k幀進(jìn)行語(yǔ)音分析以調(diào)節(jié)截止頻率。然后,當(dāng)?shù)趉幀被輸入到高通濾波器202時(shí), 高通濾波器202的截止頻率具有響應(yīng)對(duì)第k幀進(jìn)行的語(yǔ)音分析而已被調(diào)節(jié)的截止頻率。在本發(fā)明的優(yōu)選實(shí)施方式中,所述高通濾波器202為二階ARMA (自回歸移動(dòng)平均) 濾波器。由語(yǔ)音分析塊204確定的參數(shù)被實(shí)時(shí)確定。這能夠?qū)崟r(shí)地調(diào)節(jié)高通濾波器202的截止頻率。例如,對(duì)于語(yǔ)音信號(hào)的每幀,可以由語(yǔ)音分析塊204確定參數(shù),以使得對(duì)于語(yǔ)音信號(hào)的每幀可以調(diào)節(jié)高通濾波器202的截止頻率。濾波器參數(shù)的動(dòng)態(tài)確定和高通濾波器 202的截止頻率的動(dòng)態(tài)調(diào)節(jié)使高通濾波器202的截止頻率跟蹤語(yǔ)音信號(hào)的變化。通過(guò)這種方法,高通濾波器202的截止頻率能夠?qū)φZ(yǔ)音信號(hào)的變化作出反應(yīng),其目的是優(yōu)化要衰減的信號(hào)的量。調(diào)節(jié)高通濾波器202的截止頻率的目的是盡可能多地除去在低頻處的背景噪聲而不從語(yǔ)音信號(hào)中衰減不能接受的語(yǔ)音的能量的量。在優(yōu)選的實(shí)施方式中,所述截止頻率實(shí)時(shí)地動(dòng)態(tài)跟隨語(yǔ)音信號(hào)的基音頻率,使得截止頻率從不會(huì)超過(guò)基音頻率。通過(guò)這種方法,語(yǔ)音的第一諧波(在基音頻率處)不會(huì)被衰減,而在低于基音頻率的頻率處語(yǔ)音信號(hào)的成分會(huì)被衰減。通過(guò)這種方法,能夠盡可能多地衰減在低頻處的噪聲而不衰減語(yǔ)音信號(hào)的第一諧波。最低子帶的SNR值和基音延遲二者都給出包含在由高通濾波器202衰減的語(yǔ)音信號(hào)的語(yǔ)音成分中的能量的量的指示。當(dāng)最低子帶的SNR值為高時(shí),從語(yǔ)音信號(hào)衰減較少的包含在語(yǔ)音成分中語(yǔ)音能量。當(dāng)基音延遲表示低于截止頻率的基音頻率時(shí),由高通濾波器 202衰減語(yǔ)音的第一諧波。由于第一諧波包含大量的能量,所以衰減第一諧波導(dǎo)致從語(yǔ)音信號(hào)中衰減大量的語(yǔ)音能量。為了調(diào)節(jié)高通濾波器202的截止頻率,可以使用發(fā)出由高通濾波器202衰減的語(yǔ)音成分的能量的指示的其他參數(shù)。以這種方式,可以調(diào)節(jié)從語(yǔ)音信號(hào)中要衰減的語(yǔ)音能量的量?,F(xiàn)在我們給出優(yōu)選實(shí)施方式的語(yǔ)音編碼器200的細(xì)節(jié)。高通濾波器202的輸出xHP被輸入到線性預(yù)測(cè)編碼(LPC)分析塊304,所述線性預(yù)測(cè)編碼(LPC)分析塊304利用使LPC殘差ιγΡ。的能量最小化的協(xié)方差方法計(jì)算16個(gè)LPC系數(shù)屮
權(quán)利要求
1.一種在通信網(wǎng)絡(luò)中用于語(yǔ)音編碼的語(yǔ)音信號(hào)濾波方法,所述方法包括確定濾波器的截止頻率,其中,低于所述截止頻率的頻率范圍內(nèi)的所述語(yǔ)音信號(hào)的成分由所述濾波器進(jìn)行衰減;在所述濾波器處接收語(yǔ)音信號(hào);確定所述接收到的語(yǔ)音信號(hào)的至少一個(gè)參數(shù),所述至少一個(gè)參數(shù)提供要衰減的所述接收到的語(yǔ)音信號(hào)的成分的能量的指示;以及根據(jù)所述至少一個(gè)參數(shù)調(diào)節(jié)所述截止頻率,從而調(diào)節(jié)要衰減的頻率范圍;其中,所述至少一個(gè)參數(shù)包括所述語(yǔ)音信號(hào)的基音頻率,并且其中,所述截止頻率被調(diào)節(jié)為不大于確定的基音頻率。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述至少一個(gè)參數(shù)進(jìn)一步包括所述語(yǔ)音信號(hào)的信噪比。
3.根據(jù)權(quán)利要求2所述的方法,進(jìn)一步包括利用所述信噪比計(jì)算信號(hào)質(zhì)量標(biāo)準(zhǔn);以及根據(jù)所述信號(hào)質(zhì)量標(biāo)準(zhǔn)調(diào)節(jié)所述確定的基音頻率。
4.根據(jù)任一在先權(quán)利要求所述的方法,進(jìn)一步包括對(duì)多個(gè)所述接收到的語(yǔ)音信號(hào)的幀平滑所述確定的基音頻率。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述接收到的語(yǔ)音信號(hào)的基音延遲用于確定所述基音頻率,所述方法進(jìn)一步包括通過(guò)使所述語(yǔ)音信號(hào)的第一幀與由所述基音延遲所延遲的語(yǔ)音信號(hào)的第二幀相關(guān)聯(lián)來(lái)確定基音關(guān)聯(lián)值,其中,所述關(guān)聯(lián)值在閾值以下的幀被分類為清音幀,而所述關(guān)聯(lián)值至少為所述閾值的幀被分類為濁音幀,并且其中,對(duì)于濁音幀執(zhí)行所述基音頻率的平滑,而對(duì)清音幀保持經(jīng)平滑的基音頻率不變。
6.根據(jù)任一在先權(quán)利要求所述的方法,其中,所述截止頻率被調(diào)節(jié)為等于所述確定的基音頻率。
7.根據(jù)權(quán)利要求2或者引用權(quán)利要求2的任一權(quán)利要求所述的方法,其中,當(dāng)所述信噪比提高時(shí),所述截止頻率降低。
8.根據(jù)權(quán)利要求2或者引用權(quán)利要求2的任一權(quán)利要求所述的方法,其中,將所述語(yǔ)音信號(hào)拆分為頻率子帶,并且所述信噪比為最低頻率子帶的信噪比。
9.根據(jù)任一在先權(quán)利要求所述的方法,其中,動(dòng)態(tài)地確定所述至少一個(gè)參數(shù)并且動(dòng)態(tài)地調(diào)節(jié)所述截止頻率。
10.根據(jù)任一在先權(quán)利要求所述的方法,其中,對(duì)于所述接收到的語(yǔ)音信號(hào)的每幀至少確定一次所述至少一個(gè)參數(shù),并且對(duì)于所述接收到的語(yǔ)音信號(hào)的每幀至少調(diào)節(jié)一次所述截止頻率。
11.根據(jù)任一在先權(quán)利要求所述的方法,其中,要衰減的所述接收到的語(yǔ)音信號(hào)的成分為包含語(yǔ)音的所述語(yǔ)音信號(hào)的語(yǔ)音成分。
12.—種在通信網(wǎng)絡(luò)中用于語(yǔ)音編碼的語(yǔ)音信號(hào)濾波的濾波器,所述濾波器具有截止頻率,其中,低于所述截止頻率的頻率范圍內(nèi)的語(yǔ)音信號(hào)的成分由所述濾波器進(jìn)行衰減;確定接收到的語(yǔ)音信號(hào)的至少一個(gè)參數(shù)的部件,所述至少一個(gè)參數(shù)提供要衰減的所述接收到的語(yǔ)音信號(hào)的成分的能量的指示;以及根據(jù)所述至少一個(gè)參數(shù)調(diào)節(jié)所述截止頻率從而調(diào)節(jié)要衰減的頻率范圍的部件;其中,所述至少一個(gè)參數(shù)包括所述語(yǔ)音信號(hào)的基音頻率,并且設(shè)置用于調(diào)節(jié)所述截止頻率的所述部件使得所述截止頻率被調(diào)節(jié)為不大于所述確定的基音頻率。
13.根據(jù)權(quán)利要求12所述的濾波器,其中,所述至少一個(gè)參數(shù)進(jìn)一步包括所述語(yǔ)音信號(hào)的信噪比。
14.根據(jù)權(quán)利要求13所述的濾波器,進(jìn)一步具有利用所述信噪比計(jì)算信號(hào)質(zhì)量標(biāo)準(zhǔn)的部件;以及根據(jù)所述信號(hào)質(zhì)量標(biāo)準(zhǔn)調(diào)節(jié)確定的基音頻率的部件。
15.根據(jù)權(quán)利要求12-14中任一項(xiàng)所述的濾波器,進(jìn)一步包括對(duì)多個(gè)所述接收到的語(yǔ)音信號(hào)的幀平滑所述確定的基音頻率的部件。
16.根據(jù)權(quán)利要求15所述的濾波器,其中,利用所述接收到的語(yǔ)音信號(hào)的基音延遲確定所述基音頻率,所述濾波器進(jìn)一步包括通過(guò)使所述語(yǔ)音信號(hào)的第一幀與由所述基音延遲所延遲的信號(hào)的第二幀相關(guān)聯(lián)來(lái)確定基音關(guān)聯(lián)值的部件,其中,所述關(guān)聯(lián)值在閾值以下的幀被分類為清音幀,而所述關(guān)聯(lián)值至少為所述閾值的幀被分類為濁音幀,并且其中,對(duì)濁音幀進(jìn)行所述基音頻率的平滑,而對(duì)清音幀保持所述平滑的基音頻率不變。
17.根據(jù)權(quán)利要求12-16中任一項(xiàng)所述的濾波器,其中,所述截止頻率被調(diào)節(jié)為等于所述確定的基音頻率。
18.根據(jù)權(quán)利要求13或者引用權(quán)利要求13的任一權(quán)利要求所述的濾波器,其中,當(dāng)所述信噪比提高時(shí),用于調(diào)節(jié)所述截止頻率的所述部件降低所述截止頻率。
19.根據(jù)權(quán)利要求13或者引用權(quán)利要求13的任一權(quán)利要求所述的濾波器,進(jìn)一步包括將所述語(yǔ)音信號(hào)拆分為頻率子帶的部件,其中,所述信噪比為最低頻率子帶的信噪比。
20.根據(jù)權(quán)利要求12-19中任一項(xiàng)所述的濾波器,其中,動(dòng)態(tài)地確定所述至少一個(gè)參數(shù),并且動(dòng)態(tài)地調(diào)節(jié)所述截止頻率。
21.根據(jù)權(quán)利要求12-20中任一項(xiàng)所述的濾波器,其中,對(duì)于所述接收到的語(yǔ)音信號(hào)的每幀至少確定一次所述至少一個(gè)參數(shù),并且對(duì)于所述接收到的語(yǔ)音信號(hào)的每幀至少調(diào)節(jié)一次所述截止頻率。
22.根據(jù)權(quán)利要求12-21中任一項(xiàng)所述的濾波器,其中,要衰減的所述接收到的語(yǔ)音信號(hào)的成分為包含語(yǔ)音的所述語(yǔ)音信號(hào)的語(yǔ)音成分。
23.一種計(jì)算機(jī)可讀介質(zhì),包括用于執(zhí)行權(quán)利要求1-11中任一項(xiàng)所述的方法的計(jì)算機(jī)可讀指令。
全文摘要
在通信網(wǎng)絡(luò)中用于語(yǔ)音編碼的語(yǔ)音信號(hào)濾波的方法和濾波器。所述方法包括確定濾波器的截止頻率,其中,低于所述截止頻率的頻率范圍內(nèi)的語(yǔ)音信號(hào)的成分由濾波器進(jìn)行衰減;在所述濾波器處接收語(yǔ)音信號(hào);確定所述接收到的語(yǔ)音信號(hào)的至少一個(gè)參數(shù),所述至少一個(gè)參數(shù)提供要衰減的所述接收到的語(yǔ)音信號(hào)的成分的能量的指示;以及根據(jù)所述至少一個(gè)參數(shù)調(diào)節(jié)所述截止頻率,從而調(diào)節(jié)要衰減的頻率范圍;其中,所述至少一個(gè)參數(shù)包括所述語(yǔ)音信號(hào)的基音頻率,并且其中,所述截止頻率被調(diào)節(jié)為不大于確定的基音頻率。
文檔編號(hào)G10L21/02GK102341852SQ201080009839
公開日2012年2月1日 申請(qǐng)日期2010年1月5日 優(yōu)先權(quán)日2009年1月6日
發(fā)明者斯特凡·施特羅默, 科恩·貝爾納德·福斯 申請(qǐng)人:斯凱普有限公司