專利名稱:用于處理音頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號的處理,具體涉及用于通過后置濾波來改進感知質(zhì)量的方法和裝置。
背景技術(shù):
低或中等比特率的音頻編碼被廣泛用于降低網(wǎng)絡負載。然而,由于量化噪聲量的增加,比特率降低不可避免地導致質(zhì)量下降。最小化量化噪聲的感知影響的一種方式是使用后置濾波器。后置濾波器操作于解碼器處,并且影響重構(gòu)的信號參數(shù)或直接影響信號波形。使用后置濾波器的目的在于使最易聽到量化噪聲的頻譜谷衰減,從而實現(xiàn)改進的感知
質(zhì)量。 在所謂的ACELP (代數(shù)碼激勵線性預測)語音編解碼器中使用基音和共振峰后置濾波器來增強質(zhì)量。這些濾波器操作于時域,且典型地基于在ACELP編解碼器中使用的語音模型[I]。然而,該后置濾波器族不能很好地適于與變換音頻編解碼器(如,G.719[2])
一起使用。因此,需要提高已進行了變換音頻編碼的音頻信號的感知質(zhì)量。
發(fā)明內(nèi)容
期望實現(xiàn)已進行了變換音頻編碼的音頻信號的提高的感知質(zhì)量。本發(fā)明的目的是,提高已進行了變換音頻編碼的音頻信號的感知質(zhì)量。此外,本發(fā)明的目的是,提供用于對已進行了變換音頻編碼的音頻信號進行后置濾波的方法和裝置。這些目的可由根據(jù)所附獨立權(quán)利要求的方法和設(shè)備來滿足。從屬權(quán)利要求中記載了實施例。根據(jù)第一方面,在解碼器中提供了一種方法。該方法涉及獲得矢量d,該矢量d包括音頻信號的時間片段的量化后的MDCT域系數(shù)。此外,通過直接對矢量d應用后置濾波器來導出處理后的矢量^。所述后置濾波器被配置為具有傳遞函數(shù)H,該傳遞函數(shù)H是矢量d的包絡的壓縮版本。此外,通過對處理后的矢量^執(zhí)行逆MDCT變換來導出信號波形。根據(jù)第二方面,提供了一種解碼器。該解碼器包括適于獲得矢量d的功能單元,該矢量d包括音頻信號的時間片段的量化后的MDCT域系數(shù)。該解碼器還包括適于通過直接對矢量d應用后置濾波器來導出處理后的矢量^的功能單元。所述后置濾波器被配置為具有傳遞函數(shù)H,該傳遞函數(shù)H是矢量d的包絡的壓縮版本。該解碼器還包括適于通過對處理后的矢量j執(zhí)行逆MDCT變換來導出信號波形的功能單元。上述涉及MDCT后置濾波器的方法和裝置可用于提高中等和低比特率音頻編碼系統(tǒng)的質(zhì)量。當在MDCT編解碼器中使用后置濾波器時,由于后置濾波器直接對MDCT矢量操作,附加復雜度極低??梢砸圆煌膶嵤├龑崿F(xiàn)上述方法和裝置。在一些實施例中,所述傳遞函數(shù)H的分母被配置為包括矢量Idl的最大值,該矢量Idl的最大值可以是通過對矢量Idl進行遞歸最大值跟蹤而獲得的估計。在一些實施例中,傳遞函數(shù)H被配置為包括加強分量,被配置為控制后置濾波器對于MDCT頻譜的作用強度(aggresiveness)。加強分量可以是例如頻率相關(guān)的或恒定的。此外,處理后的矢量^的能量可以相對于矢量d的能量而歸一化。在一些實施例中,僅在音頻信號時間片段被確定為包括語音時導出處理后的矢量j。此外,可以在音頻信號片段被確定為主要由例如清音(unvoiced speech)、背景噪聲和音樂中的一項或多項組成時限制或抑制傳遞函數(shù)H。主要就方法而言描述了上述實施例。然而,上述描述還意在涵蓋適于使得能夠執(zhí)行上述特征的解碼器的實施例??梢愿鶕?jù)需要、要求或偏好,以不同方式組合上述示例實施例的不同特征。
下面將通過示例實施例,參照附圖來更詳細地描述本發(fā)明,其中圖I示出了根據(jù)示例實施例的隨頻率變高而減小(以限制后置濾波器的作用)的示例加強因子a(k)的圖。圖2示出了示意根據(jù)示例實施例的后置濾波器對信號頻譜的作用的圖,其中,細虛線表示后置濾波前的信號頻譜,實線表示后置濾波后的信號頻譜。圖3示出了根據(jù)示例實施例的將帶有和不帶有后置濾波器的MDCT音頻編解碼器進行比較的MUSHRA收聽測試的結(jié)果。圖4是示出了根據(jù)示例實施例的在解碼器中執(zhí)行的過程的動作的流程圖。圖5-7是示出了根據(jù)示例實施例的解碼器和音頻處理實體中的相應裝置的框圖。
具體實施例方式簡言之,提供了一種包括后置濾波器在內(nèi)的解碼器,所述后置濾波器被設(shè)計為與MDCT(修正離散余弦變換)型變換編解碼器(如,G. 719[2]) —起工作。所提出的后置濾波器直接在MDCT域上操作,且無需將音頻信號附加變換至DFT域或時域,從而保持了較低的計算復雜度。歸功于后置濾波器的質(zhì)量提高在收聽測試中得到了確認。變換編碼的概念是將要編碼的音頻信號轉(zhuǎn)換或變換至頻域;然后對頻率系數(shù)進行量化,量化后的頻率系數(shù)接著被存儲或傳輸至解碼器。解碼器通過應用逆頻率變換,使用接收到的(量化后的)頻率系數(shù)來重構(gòu)音頻信號波形。該編碼方案背后的動機在于與時域系數(shù)相比,能夠更高效地對頻域系數(shù)進行量化。 在MDCT型變換編碼器中,將塊信號波形X (η)變換為MDCT矢量d * (k)。這樣的矢量的長度“L”對應于20-40ms的語音片段。MDCT變換可以被定義為
L-I f 1);τ( IV I^] 7Γ /* (^) = V sin η + — — cos n + — k + — — x(n)
h LL 2)2] LI 2 人 2h」對MDCT進行量化,從而形成要由MDCT解碼器解碼的量化后的MDCT系數(shù)矢量d (k)=Q(d · (k))。可以在解碼器處直接對接收到的矢量d(k)應用后置濾波器,從而將后置濾波后的矢量^導出為
權(quán)利要求
1.一種解碼器中的方法,包括 -獲得(402)矢量d,該矢量d包括音頻信號的時間片段的量化后的MDCT域系數(shù), -通過直接對矢量d應用后置濾波器來導出(404)處理后的矢量^,所述后置濾波器被配置為具有傳遞函數(shù)H,該傳遞函數(shù)H是矢量d的包絡的壓縮版本, -通過對處理后的矢量^執(zhí)行逆MDCT變換來導出(406)信號波形。
2.根據(jù)權(quán)利要求I所述的方法,其中,所述傳遞函數(shù)H的分母被配置為包括矢量|d|的最大值。
3.根據(jù)權(quán)利要求I或2所述的方法,其中,所述傳遞函數(shù)H的分母被配置為包括矢量d|的最大值的估計,所述估計是通過對矢量Idl進行遞歸最大值跟蹤而獲得的。
4.根據(jù)前述權(quán)利要求中任一項所述的方法,其中,所述傳遞函數(shù)H被配置為包括加強分量,所述加強分量被配置為控制后置濾波器對于MDCT頻譜的作用強度。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述加強分量是頻率相關(guān)的。
6.根據(jù)前述權(quán)利要求中任一項所述的方法,其中,處理后的矢量^的能量相對于矢量d的能量而歸一化。
7.根據(jù)前述權(quán)利要求中仟一項所述的方法,其中,僅在音頻信號時間片段被確定為包括語音時導出處理后的矢量J
8.根據(jù)前述權(quán)利要求中任一項所述的方法,其中,在音頻信號時間片段被確定為主要由以下一項或多項組成時,限制或抑制傳遞函數(shù)H -清音, -背景噪聲,一 ΓΤ. -曰爾。
9.一種解碼器,包括 -獲得單元(502),適于獲得矢量d,該矢量d包括音頻信號的時間片段的量化后的MDCT域系數(shù), -濾波器單元(504),適于通過直接對所獲得的矢量d應用后置濾波器來導出處理后的矢I d聽述后置濾波器被配置為具有傳遞函數(shù)H,該傳遞函數(shù)H是所獲得的矢量d的包絡的壓縮版本,以及 -轉(zhuǎn)換單元(506),被配置為通過對處理后的矢量^執(zhí)行逆MDCT變換來導出信號波形。
10.根據(jù)權(quán)利要求9所述的解碼器,其中,傳遞函數(shù)H被配置為在分母中包括矢量|d|的最大值。
11.根據(jù)權(quán)利要求9或10所述的解碼器,其中,傳遞函數(shù)H被配置為在分母中包括矢量Idl的最大值的估計,所述估計是通過對矢量Idl進行遞歸最大值跟蹤而獲得的。
12.根據(jù)權(quán)利要求9-11中任一項所述的解碼器,其中,所述傳遞函數(shù)H被配置為包括頻率相關(guān)的加強分量,被配置為控制后置濾波器對于MDCT頻譜的作用強度。
13.根據(jù)權(quán)利要求9-12中任一項所述的解碼器,還適于將處理后的矢量^的能量相對于矢量d的能量而歸一化。
14.根據(jù)權(quán)利要求9-13中任一項所述的解碼器,還適于僅在音頻信號時間片段被確定為包括語音時導出處理后的矢量^。
15.根據(jù)權(quán)利要求9-14中任一項所述的解碼器,還適于在音頻信號時間片段被確定為主要由以下一項或多項組成時,限制或抑制傳遞函數(shù)H -清音, -背景噪聲, 一 Vr. ΓΤ. -曰爾。
16.一種音頻處理實體¢01),包括根據(jù)權(quán)利要求9-15中任一項所述的解碼器。
全文摘要
本發(fā)明提供了用于處理音頻信號的方法和解碼器。所述方法和解碼器涉及通過直接對矢量d應用后置濾波器來導出處理后的矢量所述矢量d包括音頻信號的時間片段的量化后的MDCT域系數(shù)。所述后置濾波器被配置為具有傳遞函數(shù)H,該傳遞函數(shù)H是矢量d的包絡的壓縮版本。通過對處理后的矢量執(zhí)行逆MDCT變換來重構(gòu)信號波形。
文檔編號G10L19/16GK102893330SQ201180023340
公開日2013年1月23日 申請日期2011年4月28日 優(yōu)先權(quán)日2010年5月11日
發(fā)明者沃洛佳·格蘭恰諾夫, 西德格爾·思維里森 申請人:瑞典愛立信有限公司