編碼方法、解碼方法、編碼裝置、解碼裝置、程序、記錄介質(zhì)的制作方法
【專利摘要】在編碼處理中,對將來自音響信號的頻域的樣本串除以加權(quán)包絡(luò)、除以增益所得的結(jié)果進行量化,從而將各樣本進行可變長編碼。使用此時在可變長編碼中可節(jié)省的信息,對量化前的樣本和量化后的樣本的誤差進行量化。決定根據(jù)可節(jié)省的比特數(shù)來量化哪個樣本的誤差的規(guī)則而進行量化。在解碼處理中,對輸入的碼串的可變長碼進行解碼而獲得頻域的樣本串,進而,以與可變長碼的比特數(shù)對應(yīng)的規(guī)則來解碼誤差信號,并從該獲得的樣本串基于輔助信息而獲得原來的樣本串。
【專利說明】編碼方法、解碼方法、編碼裝置、解碼裝置、程序、記錄介質(zhì)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音響信號的編碼技術(shù)以及通過該編碼技術(shù)而獲得的碼串的解碼技術(shù)。更詳細而言,涉及將音響信號變換為頻域而獲得的頻域的樣本串的編碼和其解碼。
【背景技術(shù)】
[0002]作為低比特(例如10kbit/s?20kbit/s左右)的聲音信號或音響信號的編碼方法,已知DFT (離散傅里葉變換)或MDCT (變形離散余弦變換)等的對于正交變換系數(shù)的自適應(yīng)編碼。例如作為標準規(guī)格技術(shù)的AMR-WB+(Extended Adaptive Mult1-Rate Wideband)具有TCX (transform coded excitation:變換編碼勵振)編碼模式,其中,將DFT系數(shù)按每8個樣本進行歸一化而進行矢量量化(例如,參照非專利文獻I。)。
[0003]現(xiàn)有技術(shù)文獻
[0004]非專利文獻
[0005]非專利文獻1:ETSI TS126290V6.3.0 (2005-06)
【發(fā)明內(nèi)容】
[0006]發(fā)明要解決的課題
[0007]以AMR-WB+為首,由于在基于TCX的編碼中不考慮基于周期性的頻域的系數(shù)的幅度的偏差,所以若匯集偏差大的幅度而編碼則編碼效率降低。在TCX中的量化或編碼中有各種變形例,但例如考慮通過算術(shù)碼等的熵編碼對將通過將系數(shù)除以增益所得的信號的量化而成為了離散值的MDCT系數(shù)從頻率低到高進行了排列的序列進行壓縮的情況。此時,將多個樣本設(shè)為I碼元(編碼單位),依賴就在該碼元之前的碼元而自適應(yīng)性地控制分配碼。一般,幅度越小則越分配短碼,在幅度大的情況下分配長碼。其結(jié)果,每個幀的比特數(shù)平均地降低,但在每個幀的分配比特數(shù)固定的情況下,存在被降低的比特不能有效利用的可能性。
[0008]本發(fā)明鑒于這樣的技術(shù)的背景,其目的在于,提供一種能夠以低運算量改善離散信號、尤其是聲音音響數(shù)字信號的低比特的編碼的質(zhì)量的編碼、解碼技術(shù)。
[0009]用于解決課題的手段
[0010]本發(fā)明的一個方式的編碼方法,將來自規(guī)定的時間區(qū)間的音響信號的頻域的樣本串以規(guī)定的個數(shù)的比特進行編碼,包括:編碼步驟,將與頻域的樣本串的各樣本的值對應(yīng)的整數(shù)值通過可變長編碼進行編碼而生成可變長碼;誤差計算步驟,計算從頻域的樣本串的各樣本的值減去與該各樣本的值對應(yīng)的整數(shù)值所得的誤差值的串;以及誤差編碼步驟,使用作為從規(guī)定的個數(shù)減去可變長碼的比特的個數(shù)所得的個數(shù)的比特的剩余比特,對誤差值的串進行編碼而生成誤差碼。
[0011 ] 本發(fā)明的一個方式的解碼方法解碼方法,對輸入的由規(guī)定的個數(shù)的比特構(gòu)成的碼進行解碼,包括:解碼步驟,對在碼中包含的可變長碼進行解碼而生成整數(shù)值的串;誤差解碼步驟,對由作為從規(guī)定的個數(shù)減去可變長碼的比特的個數(shù)所得的個數(shù)的比特的剩余比特構(gòu)成的、碼中包含的誤差碼進行解碼,從而生成誤差值的串;以及加法運算步驟,將整數(shù)值的串的各樣本與誤差值的串的對應(yīng)的誤差樣本進行相加。
[0012]發(fā)明效果
[0013]通過以能夠通過對于整數(shù)值的可變長碼而節(jié)省的比特即剩余比特解碼誤差值,從而即使是在每個幀的比特數(shù)固定的情況下也能夠?qū)崿F(xiàn)編碼效率的提高或量化失真的減輕
坐寸ο
【專利附圖】
【附圖說明】
[0014]圖1是用于說明實施方式的編碼裝置的構(gòu)成的方框圖。
[0015]圖2是用于說明實施方式的編碼裝置的處理的流程圖。
[0016]圖3是用于說明加權(quán)歸一化MDCT系數(shù)和功率譜包絡(luò)的關(guān)系的圖。
[0017]圖4是用于說明剩余比特數(shù)多的情況下的處理的例的圖。
[0018]圖5是用于說明實施方式的解碼裝置的構(gòu)成的方框圖。
[0019]圖6是用于說明實施方式的編碼裝置的處理的流程圖。
【具體實施方式】
[0020]參照【專利附圖】
【附圖說明】本發(fā)明的實施方式。另外,對于重復的構(gòu)成要素分配相同的參照標號并省略重復說明。
[0021 ] 該實施方式的一個特征在于,將規(guī)定的時間區(qū)間設(shè)為幀,將對來自幀內(nèi)的音響信號的頻域的樣本串進行量化的框架中,進行頻域的樣本的加權(quán)平坦化后的序列的可變長編碼,以及通過使用可通過該可變長編碼而節(jié)省的剩余比特決定優(yōu)先級而量化誤差信號來減少編碼的失真的編碼的改善。尤其,即使是在每個幀的分配比特數(shù)固定的情況下,也產(chǎn)生可變長編碼的優(yōu)點。
[0022]作為來自音響信號的頻域的樣本串、換言之基于音響信號的頻域的樣本串,例如能夠例示將幀單位的聲音音響數(shù)字信號從時域變換為頻域而獲得的DFT系數(shù)串或MDCT系數(shù)串、對這樣的系數(shù)串應(yīng)用了歸一化或加權(quán)或量化等的處理的系數(shù)串等。以下,以MDCT系數(shù)串為例說明實施方式。
[0023][編碼的實施方式]
[0024]最初,參照圖1至圖4說明編碼處理。
[0025]如圖1所示,編碼裝置I例如包括頻域變換部11、線性預測分析部12、線性預測系數(shù)量化編碼部13、功率譜包絡(luò)計算部14、加權(quán)包絡(luò)歸一化部15、歸一化增益計算部16、量化部17、誤差計算部18、編碼部19、誤差編碼部110。編碼裝置I進行圖2中例示的編碼方法的各處理。以下,說明編碼裝置I的各處理。
[0026]“頻域變換部11”
[0027]首先,頻域變換部11以幀單位將聲音音響數(shù)字信號變換為頻域的N點的MDCT系數(shù)串(步驟S11)。
[0028]一般,在編碼側(cè)量化MDCT系數(shù)串,將已量化的MDCT系數(shù)串進行編碼,并將獲得的碼串傳輸?shù)浇獯a側(cè),在解碼側(cè)從該碼串再構(gòu)成已量化的MDCT系數(shù)串,進一步,通過MDCT反變換能夠再構(gòu)成時域的聲音音響數(shù)字信號。
[0029]另外,MDCT系數(shù)的幅度具有與通常的DFT的功率譜近似相同的幅度包絡(luò)(功率譜包絡(luò))。因此,通過進行與幅度包絡(luò)的對數(shù)值成比例的信息分配,能夠使全部頻帶的MDCT系數(shù)的量化失真(量化誤差)均勻地分散,能夠減小整體的量化失真,除此之外,還實現(xiàn)信息壓縮。另外,功率譜包絡(luò)能夠使用通過線性預測分析而求出的線性預測系數(shù)而高效地估計。
[0030]作為控制這樣的量化誤差的方法,有自適應(yīng)性地分配各MDCT系數(shù)的量化比特的(將幅度平坦化后調(diào)整量化的步驟幅度的)方法或、通過加權(quán)矢量量化而自適應(yīng)性地加權(quán)而決定碼的方法。這里,說明在本發(fā)明的實施方式中執(zhí)行的量化方法的一例,但希望留意并不限定于說明的量化方法。
[0031]“線性預測分析部12”
[0032]線性預測分析部12以幀單位對聲音音響數(shù)字信號進行線性預測分析,求出預定的次數(shù)為止的線性預測系數(shù)而輸出(步驟S12)。
[0033]“線性預測系數(shù)量化編碼部13”
[0034]線性預測系數(shù)量化編碼部13求出與線性預測分析部12求出的線性預測系數(shù)對應(yīng)的碼和已量化線性預測系數(shù)而輸出(步驟S13)。此時,也可以進行將線性預測系數(shù)變換為LSP (Line Spectral Pairs,線譜對),求出與LSP對應(yīng)的碼與已量化LSP,將已量化LSP變換為已量化線性預測系數(shù)的處理。
[0035]作為與線性預測系數(shù)對應(yīng)的碼的線性預測系數(shù)碼成為對解碼裝置2發(fā)送的碼的一部分。
[0036]“功率譜包絡(luò)計算部14”
[0037]功率譜包絡(luò)計算部14將線性預測系數(shù)量化編碼部13輸出的已量化線性預測系數(shù)變換為頻域而求出功率譜包絡(luò)(步驟S14)。求出的功率譜包絡(luò)發(fā)送到加權(quán)包絡(luò)歸一化部15。此外,如圖1中虛線所示,根據(jù)需要而發(fā)送到誤差編碼部110。
[0038]與N點的MDCT系數(shù)串的各系數(shù)X(I)、……、X(N)對應(yīng)的功率譜包絡(luò)系數(shù)串的各系數(shù)W(l)、……、W(N),能夠通過將已量化線性預測系數(shù)變換為頻域而獲得。例如,通過作為全極型模型的P次自回歸過程,時刻t的時間信號y⑴通過追溯到P時刻的過去的自己的值y(t-l)、……、y(t-p)和預測殘差e(t)以及已量化線性預測系數(shù)αι、……、^。而由式(I)表示。此時,功率譜包絡(luò)系數(shù)串的各系數(shù)W(n) [I < η < N]由式(2)表示。exp(.)為以納皮爾數(shù)作為底數(shù)的指數(shù)函數(shù)、j為虛數(shù)單位、σ 2為預測殘差能量。
[0039]【數(shù)I】
[0040]
【權(quán)利要求】
1.一種編碼方法,將來自規(guī)定的時間區(qū)間的音響信號的頻域的樣本串以規(guī)定的個數(shù)的比特進行編碼,包括: 編碼步驟,將與上述頻域的樣本串的各樣本的值對應(yīng)的整數(shù)值通過可變長編碼進行編碼而生成可變長碼; 誤差計算步驟,計算從上述頻域的樣本串的各樣本的值減去與該各樣本的值對應(yīng)的整數(shù)值所得的誤差值的串;以及 誤差編碼步驟,使用作為從上述規(guī)定的個數(shù)減去上述可變長碼的比特的個數(shù)所得的個數(shù)的比特的剩余比特,對上述誤差值的串進行編碼而生成誤差碼。
2.如權(quán)利要求1所述的編碼方法,其中, 上述誤差編碼步驟使用上述剩余比特,優(yōu)先編碼在構(gòu)成上述誤差的串的誤差樣本中對應(yīng)的上述整數(shù)值不為O的誤差樣本。
3.如權(quán)利要求1所述的編碼方法,其中, 上述誤差編碼步驟使用上述剩余比特,優(yōu)先編碼在構(gòu)成上述誤差值的串的誤差樣本中對應(yīng)的功率譜包絡(luò)值、功率譜包絡(luò)值的概算值或者功率譜包絡(luò)值的估計值大的誤差樣本。
4.如權(quán)利要求1至3的任一項所述的編碼方法,其中, 上述誤差編碼步驟以I比特編碼在構(gòu)成上述誤差值的串的誤差樣本中成為編碼的對象的各誤差樣本的值的正負的信息。
5.如權(quán)利要求4所述的編碼方法,其中,` 將根據(jù)整數(shù)值而決定的值設(shè)為再構(gòu)成值的絕對值、將上述再構(gòu)成值的絕對值設(shè)為在誤差樣本的值為正時對應(yīng)的再構(gòu)成值、將從O減去上述再構(gòu)成值的絕對值所得的值設(shè)為在誤差樣本的值為負時對應(yīng)的再構(gòu)成值, 上述誤差編碼步驟在上述剩余比特的數(shù)大于構(gòu)成上述誤差值的串的誤差樣本的數(shù)的情況下,對從上述各誤差樣本的值減去與上述各誤差樣本對應(yīng)的再構(gòu)成值所得的值的正負的信息使用別的I比特進一步編碼。
6.如權(quán)利要求4或5所述的編碼方法,其中, 在整數(shù)值不為O時的再構(gòu)成值的絕對值大于在整數(shù)值為O時的再構(gòu)成值的絕對值。
7.一種解碼方法,對輸入的由規(guī)定的個數(shù)的比特構(gòu)成的碼進行解碼,包括: 解碼步驟,對在上述碼中包含的可變長碼進行解碼而生成整數(shù)值的串; 誤差解碼步驟,對由作為從上述規(guī)定的個數(shù)減去上述可變長碼的比特的個數(shù)所得的個數(shù)的比特的剩余比特構(gòu)成的、上述碼中包含的誤差碼進行解碼,從而生成誤差值的串;以及 加法運算步驟,將上述整數(shù)值的串的各樣本與上述誤差值的串的對應(yīng)的誤差樣本進行相加。
8.如權(quán)利要求7所述的解碼方法,其中, 上述誤差解碼步驟解碼以上述剩余比特表現(xiàn)的、構(gòu)成上述誤差的串的誤差樣本中對應(yīng)的上述整數(shù)值不為O的誤差樣本。
9.如權(quán)利要求7所述的解碼方法,其中, 上述誤差解碼步驟解碼以上述剩余比特表現(xiàn)的、構(gòu)成上述誤差值的串的誤差樣本中對應(yīng)的功率譜包絡(luò)值、功率譜包絡(luò)值的概算值或者功率譜包絡(luò)值的估計值大的誤差樣本。
10.如權(quán)利要求7至9的任一項所述的解碼方法,其中,將根據(jù)整數(shù)值而決定的值設(shè)為再構(gòu)成值的絕對值, 上述誤差解碼步驟將上述誤差值的串的各誤差樣本的值設(shè)為如下值,即將由通過解碼上述誤差碼而獲得的與上述各誤差樣本對應(yīng)的I比特的信息確定的正負反映到基于與上述各誤差樣本對應(yīng)的整數(shù)值的再構(gòu)成值的絕對值的值。
11.如權(quán)利要求10所述的解碼方法,其中, 上述誤差解碼步驟在有與上述各誤差樣本的值對應(yīng)的別的I比特的信息的情況下,將上述各誤差樣本的值設(shè)為如下值,即將上述反映的值與將由上述別的I比特的信息確定的正負反映到基于與上述各誤差樣本對應(yīng)的整數(shù)值的再構(gòu)成值的絕對值的1/2的值的值相加的值。
12.如權(quán)利要求10或11所述的解碼方法,其中, 在整數(shù)值不為O時的再構(gòu)成值的絕對值大于在整數(shù)值為O時的再構(gòu)成值的絕對值。
13.—種編碼裝置,將來自規(guī)定的時間區(qū)間的音響信號的頻域的樣本串以規(guī)定的個數(shù)的比特進行編碼,包括: 編碼部,將與上述頻域的樣本串的各樣本的值對應(yīng)的整數(shù)值通過可變長編碼進行編碼而生成可變長碼; 誤差計算部,計算從上述頻域的樣本串的各樣本的值減去與該各樣本的值對應(yīng)的整數(shù)值所得的誤差值的串;以及 誤差編碼部,使用作為從上述規(guī)定的個數(shù)減去上述可變長碼的比特的個數(shù)所得的個數(shù)的比特的剩余比特,對上述誤差值的串進行編碼而生成誤差碼。
14.如權(quán)利要求13所 述的編碼裝置,其中, 上述誤差編碼部使用上述剩余比特,優(yōu)先編碼在構(gòu)成上述誤差的串的誤差樣本中對應(yīng)的上述整數(shù)值不為O的誤差樣本。
15.如權(quán)利要求13所述的編碼裝置,其中, 上述誤差編碼部使用上述剩余比特,優(yōu)先編碼在構(gòu)成上述誤差值的串的誤差樣本中對應(yīng)的功率譜包絡(luò)值、功率譜包絡(luò)值的概算值或者功率譜包絡(luò)值的估計值大的誤差樣本。
16.一種解碼裝置,對輸入的由規(guī)定的個數(shù)的比特構(gòu)成的碼進行解碼,包括: 解碼部,對在上述碼中包含的可變長碼進行解碼而生成整數(shù)值的串; 誤差解碼部,對由作為從上述規(guī)定的個數(shù)減去上述可變長碼的比特的個數(shù)所得的個數(shù)的比特的剩余比特構(gòu)成的、上述碼中包含的誤差碼進行解碼,從而生成誤差值的串;以及 加法運算部,將上述整數(shù)值的串的各樣本與上述誤差值的串的對應(yīng)的誤差樣本進行相加。
17.如權(quán)利要求16所述的解碼裝置,其中, 上述誤差解碼步驟解碼以上述剩余比特表現(xiàn)的、構(gòu)成上述誤差的串的誤差樣本中對應(yīng)的上述整數(shù)值不為O的誤差樣本。
18.如權(quán)利要求16所述的解碼裝置,其中, 上述誤差解碼部解碼以上述剩余比特表現(xiàn)的、構(gòu)成上述誤差值的串的誤差樣本中對應(yīng)的功率譜包絡(luò)值、功率譜包絡(luò)值的概算值或者功率譜包絡(luò)值的估計值大的誤差樣本。
19.一種程序,使計算機實現(xiàn)權(quán)利要求1至12所述的方法的各步驟。
20.一種計算機可讀取的記錄介質(zhì),記錄了用于使計算機實現(xiàn)權(quán)利要求1至12所述的方法的各 步驟的程序。
【文檔編號】G10L19/035GK103460287SQ201280015955
【公開日】2013年12月18日 申請日期:2012年3月26日 優(yōu)先權(quán)日:2011年4月5日
【發(fā)明者】守谷健弘, 原田登, 鎌本優(yōu), 日和崎佑介, 福井勝宏 申請人:日本電信電話株式會社