音頻編碼裝置、音頻編碼方法和音頻編碼程序以及音頻解碼裝置、音頻解碼方法和音頻解 ...的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及經(jīng)由IP網(wǎng)和移動通信網(wǎng)傳輸音頻分組時的錯誤隱藏隱藏,更具體而 言,涉及實現(xiàn)錯誤隱藏的高精度分組丟失隱藏信號(7卜口只隠蔽信號)生成用的音 頻編碼裝置、音頻編碼方法和音頻編碼程序以及音頻解碼裝置、音頻解碼方法和音頻解碼 程序。
【背景技術(shù)】
[0002] 在IP網(wǎng)和移動通信中傳輸音頻/聲音信號(以下稱作"音頻信號")時,按照某固 定時間長度對音頻信號進行編碼而生成音頻分組,經(jīng)由通信網(wǎng)進行傳輸。在接收側(cè)通過通 信網(wǎng)接收音頻分組,并在接收側(cè)的服務(wù)器、MCU(Multipoint Control Unit)、終端等中進行 解碼,從而得到解碼音頻信號。
[0003] 音頻信號通常以數(shù)字形式被收音。即,作為與每一秒鐘的采樣頻率相同數(shù)量的數(shù) 列進行計測和蓄積。將該數(shù)列的各個要素稱為采樣(sample)。在音頻編碼中,每當所確定 的采樣數(shù)量的音頻信號在內(nèi)置的緩存器中蓄積了預(yù)定量時,就對緩存器內(nèi)的音頻信號進行 編碼。將所述規(guī)定的采樣數(shù)量稱為幀長,將與幀長相同數(shù)量的采樣的集合稱為幀。例如,當 在32kHz的采樣頻率中將幀長設(shè)為20ms時,幀長為640個采樣。另外,緩存器的長度也可 以比1幀長。
[0004] 在通過通信網(wǎng)傳輸音頻分組時,由于通信網(wǎng)的擁擠狀態(tài)等,可能會產(chǎn)生一部分音 頻分組丟失或?qū)懭胍纛l分組中的一部分信息產(chǎn)生錯誤的現(xiàn)象(所謂的分組丟失)。在這種 情況下,由于無法在接收側(cè)對音頻分組進行正確解碼,因此不能得到期望的解碼音頻信號。 此外,由于與產(chǎn)生分組丟失的音頻分組對應(yīng)的解碼音頻信號被感知為噪音,因此顯著損壞 對收聽的人提供的主觀品質(zhì)。
[0005] 為了消除上述那樣的不良情況,作為對由于分組丟失而丟失的部分的音頻聲音信 號進行插值的技術(shù),采用分組丟失隱藏技術(shù)。分組丟失隱藏技術(shù)包括僅在接收側(cè)進行分組 丟失隱藏的"不使用輔助信息的分組丟失隱藏技術(shù)",以及在發(fā)送側(cè)求出有助于分組丟失隱 藏的參數(shù)并傳輸給接收側(cè),然后在接收側(cè)利用接收到的參數(shù)進行丟失隱藏的"使用輔助信 息的分組丟失隱藏技術(shù)"。
[0006] 在其中的"不使用輔助信息的分組丟失隱藏技術(shù)"中,例如非專利文獻1的技術(shù)那 樣,通過以基音(pitch)為單位對之前正常接收到的分組所包含的解碼音頻信號進行復(fù)制 后,乘以預(yù)先確定的衰減系數(shù),生成與分組丟失的部分對應(yīng)的音頻信號。"不使用輔助信息 的分組丟失隱藏技術(shù)"以分組丟失了的部分的音頻性質(zhì)與即將分組丟失時的音頻相似為前 提,因此在分組丟失了的部分具有與即將丟失時的音頻不同性質(zhì)的情況、和功率急劇變化 的情況下不能充分發(fā)揮隱藏效果。
[0007]另一方面,在"使用輔助信息的分組丟失隱藏技術(shù)"中有如專利文獻1的技術(shù),在 發(fā)送側(cè)對分組丟失隱藏所需要的參數(shù)進行編碼并傳輸,并在接收側(cè)的分組丟失隱藏中使 用。在專利文獻1中,采用主要編碼/冗余編碼這兩種編碼方式對音頻進行編碼。冗余編 碼是以低于主要編碼的比特速率對即將進行主要編碼的幀的前一個幀進行編碼(參照圖 1 (a))。例如,在第N個分組中包含采用主要編碼對第N幀進行編碼而得到的音頻碼、和采 用冗余編碼對第N-1幀進行編碼而得到的輔助信息碼來進行傳輸。
[0008] 在接收側(cè),等待在時間上連續(xù)的兩個以上分組的到達,然后對時間上較早的分組 進行解碼,從而得到解碼音頻信號。例如,在得到與第N幀對應(yīng)的信號的情況下,等待第N+1 分組到達后進行解碼。在正常接收到第N分組、第N+1分組的情況下,對第N分組所包含的 音頻碼進行解碼,從而得到第N幀的音頻信號(參照圖1(b))。另一方面,在分組丟失的情 況下(在第N分組丟失的狀況下得到了第N+1分組的情況),對第N+1分組所包含的輔助信 息碼進行解碼,從而得到第N幀的音頻信號(參照圖1(c))。
[0009] 在專利文獻1的方法中,即使作為解碼對象的分組到達了,在又一個以上的分組 到達之前,也必須等待解碼,算法延遲增加了 1個分組量以上。因此,在專利文獻1的方法 中,雖然能夠期待通過分組丟失隱藏來提高音質(zhì),但是算法延遲增加,音頻通話質(zhì)量下降。
[0010] 另外,在將如上所述的分組丟失技術(shù)適用于CELP (Code Excited Linear Prediction,碼激勵線性預(yù)測)編碼時,由于CELP的動作特點而產(chǎn)生其它問題。CELP是基 于線性預(yù)測的音頻模型,能夠高精度且以較高的壓縮率對音頻信號進行編碼,因而在許多 的國際標準中被采用。
[0011] 在CELP中,通過利用全極型合成濾波器對激勵信號e(n)進行濾波來實現(xiàn)合成。 即,按照下式將音頻信號s(n)合成。
[0012] [數(shù)式 1]
[0013]
【主權(quán)項】
1. 一種對音頻信號進行編碼的音頻編碼裝置,該音頻編碼裝置具有: 音頻編碼部,其對音頻信號進行編碼;以及 輔助信息編碼部,其根據(jù)先行信號計算輔助信息而進行編碼。
2. 根據(jù)權(quán)利要求1所述的音頻編碼裝置,其中, 所述輔助信息與先行信號中的基音滯后相關(guān)。
3. 根據(jù)權(quán)利要求1所述的音頻編碼裝置,其中, 所述輔助信息與先行信號中的基音增益相關(guān)。
4. 根據(jù)權(quán)利要求1所述的音頻編碼裝置,其中, 所述輔助信息與先行信號中的基音滯后及基音增益相關(guān)。
5. 根據(jù)權(quán)利要求1~4中任意一項所述的音頻編碼裝置,其中, 所述輔助信息包括與輔助信息可否利用相關(guān)的信息。
6. 根據(jù)權(quán)利要求1~5中任意一項所述的音頻編碼裝置,其中, 所述輔助信息編碼部對先行信號部分計算輔助信息而進行編碼,進而生成隱藏信號, 所述音頻編碼裝置還具有: 誤差信號編碼部,其對輸入音頻信號和所述輔助信息編碼部輸出的隱藏信號之間的誤 差f目號進行編碼;以及 主要編碼部,其對輸入音頻信號本身進行編碼。
7. -種音頻解碼裝置,其對音頻碼進行解碼而輸出音頻信號,該音頻解碼裝置具有: 音頻碼緩存器,其根據(jù)音頻分組的接收狀態(tài)檢測分組丟失; 音頻參數(shù)解碼部,其在音頻分組正常接收時對音頻碼進行解碼; 輔助信息解碼部,其在音頻分組正常接收時對輔助信息碼進行解碼; 輔助信息蓄積部,其蓄積對輔助信息碼進行解碼而得到的輔助信息; 音頻參數(shù)丟失處理部,其在音頻分組丟失檢測時輸出音頻參數(shù);以及 音頻合成部,其根據(jù)音頻參數(shù)合成解碼音頻。
8. 根據(jù)權(quán)利要求7所述的音頻解碼裝置,其中, 所述輔助信息與先行信號中的基音滯后相關(guān)。
9. 根據(jù)權(quán)利要求7所述的音頻解碼裝置,其中, 所述輔助信息與先行信號中的基音增益相關(guān)。
10. 根據(jù)權(quán)利要求7所述的音頻解碼裝置,其中, 所述輔助信息與先行信號中的基音滯后及基音增益相關(guān)。
11. 根據(jù)權(quán)利要求7~10中任意一項所述的音頻解碼裝置,其中, 所述輔助信息包括與輔助信息可否利用相關(guān)的信息。
12. 根據(jù)權(quán)利要求7~11中任意一項所述的音頻解碼裝置,其中, 所述輔助信息解碼部對輔助信息碼進行解碼而輸出輔助信息,而且利用輔助信息輸出 有關(guān)先行部分的隱藏信號, 所述音頻解碼裝置還具有: 誤差解碼部,其對和音頻信號與隱藏信號之間的誤差信號有關(guān)的碼進行解碼; 主要解碼部,其對與音頻信號有關(guān)的碼進行解碼;以及 隱藏信號蓄積部,其蓄積由所述輔助信息解碼部輸出的隱藏信號。
13. 根據(jù)權(quán)利要求12所述的音頻解碼裝置,其中, 在音頻分組正常接收時,將從所述隱藏信號蓄積部讀出的隱藏信號、和所述誤差解碼 部輸出的解碼誤差信號相加,由此生成一部分解碼信號,并利用所述輔助信息解碼部輸出 的隱藏信號更新所述隱藏信號蓄積部。
14. 根據(jù)權(quán)利要求12或13所述的音頻解碼裝置,其中, 在音頻分組丟失檢測時,將從所述隱藏信號蓄積部讀出的隱藏信號作為解碼信號的一 部分或者全部。
15. 根據(jù)權(quán)利要求12~14中任意一項所述的音頻解碼裝置,其中, 在音頻分組丟失檢測時,使用由所述音頻分組丟失處理部預(yù)測出的音頻參數(shù)生成解碼 信號,使用其中一部分解碼信號更新所述隱藏信號蓄積部。
16. 根據(jù)權(quán)利要求7~11中任意一項所述的音頻解碼裝置,其中, 在音頻分組丟失檢測時,所述音頻分組丟失處理部使用從所述輔助信息蓄積部讀出的 輔助信息作為音頻參數(shù)的預(yù)測值的一部分。
17. 根據(jù)權(quán)利要求7~16中任意一項所述的音頻解碼裝置,其中, 在音頻分組丟失檢測時,所述音頻合成部使用從所述輔助信息蓄積部讀出的輔助信 息,修正作為音頻參數(shù)之一的自適應(yīng)碼本向量。
18. -種對音頻信號進行編碼的音頻編碼裝置的音頻編碼方法,該音頻編碼方法包 括: 音頻編碼步驟,對音頻信號進行編碼;以及 輔助信息編碼步驟,根據(jù)先行信號計算輔助信息而進行編碼。
19. 一種對音頻碼進行解碼而輸出音頻信號的音頻解碼裝置的音頻解碼方法,該音頻 解碼方法包括: 音頻碼緩存步驟,根據(jù)音頻分組的接收狀態(tài)檢測分組丟失; 音頻參數(shù)解碼步驟,在音頻分組正常接收時對音頻碼進行解碼; 輔助信息解碼步驟,在音頻分組正常接收時對輔助信息碼進行解碼; 輔助信息蓄積步驟,蓄積對輔助信息碼進行解碼而得到的輔助信息; 音頻參數(shù)丟失處理步驟,在音頻分組丟失檢測時輸出音頻參數(shù);以及 音頻合成步驟,根據(jù)音頻參數(shù)合成解碼音頻。
20. -種音頻編碼程序,其使計算機作為以下要素發(fā)揮作用: 音頻編碼部,其對音頻信號進行編碼;以及 輔助信息編碼部,其根據(jù)先行信號計算輔助信息而進行編碼。
21. -種音頻解碼程序,其使計算機作為以下要素發(fā)揮作用: 音頻碼緩沖器,其根據(jù)音頻分組的接收狀態(tài)檢測分組丟失; 音頻參數(shù)解碼部,其在音頻分組正常接收時對音頻碼進行解碼; 輔助信息解碼部,其在音頻分組正常接收時對輔助信息碼進行解碼; 輔助信息蓄積部,其蓄積對輔助信息碼進行解碼而得到的輔助信息; 音頻參數(shù)丟失處理部,其在音頻分組丟失檢測時輸出音頻參數(shù);以及 音頻合成部,其根據(jù)音頻參數(shù)合成解碼音頻。
【專利摘要】本發(fā)明的目的在于,在音頻編碼中的分組丟失時,能夠在不增加算法延遲的情況下恢復(fù)音頻質(zhì)量。對音頻信號進行編碼的音頻信號發(fā)送裝置具有:音頻編碼部,其對音頻信號進行編碼;以及輔助信息編碼部,其根據(jù)先行信號計算輔助信息而進行編碼。另一方面,對音頻碼進行解碼而輸出音頻信號的音頻信號接收裝置具有:音頻碼緩存器,其根據(jù)音頻分組的接收狀態(tài)檢測分組丟失;音頻參數(shù)解碼部,其在音頻分組正常接收時對音頻碼進行解碼;輔助信息解碼部,其在音頻分組正常接收時對輔助信息碼進行解碼;輔助信息蓄積部,其蓄積對輔助信息碼進行解碼而得到的輔助信息;音頻參數(shù)丟失處理部,其在音頻分組丟失檢測時輸出音頻參數(shù);以及音頻合成部,其根據(jù)音頻參數(shù)合成解碼音頻。
【IPC分類】G10L19-09, G10L19-005
【公開號】CN104781876
【申請?zhí)枴緾N201380058010
【發(fā)明人】堤公孝, 菊入圭, 山口貴史
【申請人】株式會社Ntt都科摩
【公開日】2015年7月15日
【申請日】2013年11月12日
【公告號】CA2886140A1, EP2922053A1, US20150262588, WO2014077254A1