編碼裝置、解碼裝置、編碼方法以及解碼方法

文檔序號(hào)：2827388閱讀：150來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

編碼裝置、解碼裝置、編碼方法以及解碼方法
【專利摘要】本發(fā)明公開(kāi)了編碼裝置、解碼裝置、編碼方法以及解碼方法。所述編碼裝置包括：第一層編碼單元；第一層解碼單元；加權(quán)濾波單元；第一層誤差變換系數(shù)計(jì)算單元；以及第二層編碼單元，所述第二層編碼單元包括：第一形狀向量編碼單元；目標(biāo)增益計(jì)算單元；增益向量構(gòu)成單元；以及增益向量編碼單元。
【專利說(shuō)明】編碼裝置、解碼裝置、編碼方法以及解碼方法
[0001]本申請(qǐng)是以下專利申請(qǐng)的分案申請(qǐng):
[0002]申請(qǐng)?zhí)?200880006787.5
[0003]申請(qǐng)日:2008年2月29日
[0004]發(fā)明名稱:編碼裝置和編碼方法
【技術(shù)領(lǐng)域】
[0005]本發(fā)明涉及對(duì)語(yǔ)音信號(hào)等的輸入信號(hào)進(jìn)行編碼并傳輸?shù)耐ㄐ畔到y(tǒng)所使用的編碼裝置和編碼方法。
【背景技術(shù)】
[0006]在移動(dòng)通信系統(tǒng)中，為了有效利用電波資源等，要求將語(yǔ)音信號(hào)壓縮到低比特率后傳輸。另一方面，還期望提高通話語(yǔ)音的質(zhì)量及實(shí)現(xiàn)較高的現(xiàn)場(chǎng)感的通話服務(wù)，為了實(shí)現(xiàn)該需求，既期望提高語(yǔ)音信號(hào)的質(zhì)量，又期望高質(zhì)量地對(duì)頻帶更寬的音頻信號(hào)等語(yǔ)音信號(hào)以外的信號(hào)進(jìn)行編碼。
[0007]對(duì)于這樣相反的兩種要求，分層地合并多個(gè)編碼技術(shù)的技術(shù)備受關(guān)注。該技術(shù)分層組合基本層和擴(kuò)展層，所述基本層通過(guò)適合于語(yǔ)音信號(hào)的模型(model)以低比特率對(duì)輸入信號(hào)進(jìn)行編碼，所述擴(kuò)展層通過(guò)也適合于語(yǔ)音以外的信號(hào)的模型對(duì)輸入信號(hào)與基本層的解碼信號(hào)之間的差分信號(hào)進(jìn)行編碼。這樣分層地進(jìn)行編碼的技術(shù)，由于從編碼裝置得到的比特流具有擴(kuò)展性(scalability)，即具有即使通過(guò)比特流的一部分信息也能夠得到解碼信號(hào)的性質(zhì)，因此一般被稱為可擴(kuò)展編碼(分層編碼)。
[0008]根據(jù)該性質(zhì)，可擴(kuò)展編碼方式能夠靈活地應(yīng)對(duì)比特率不同的網(wǎng)絡(luò)間的通信，因此可以說(shuō)該方式適合于以IP(Internet Protocol,因特網(wǎng)協(xié)議)合并各種各樣的網(wǎng)絡(luò)的、今后的網(wǎng)絡(luò)環(huán)境。
[0009]作為利用以MPEG-4(Moving Picture Experts Group phase (運(yùn)動(dòng)圖像專家組)-4)進(jìn)行標(biāo)準(zhǔn)化的技術(shù)來(lái)實(shí)現(xiàn)可擴(kuò)展編碼的例子，例如有非專利文獻(xiàn)I所公開(kāi)的技術(shù)。該技術(shù)在基本層中，利用適合于語(yǔ)音信號(hào)的CELP(Code Excited Linear Prediction,碼激勵(lì)線性預(yù)測(cè))編碼，在擴(kuò)展層中，對(duì)殘差信號(hào)利用諸如AAC (Advanced Audio Coder,高級(jí)音步頁(yè)編石馬器)或者TwinVQ (Transform Domain Weighted Interleave Vector Quantization,傳輸域加權(quán)交織向量量化)等的變換編碼，所述殘差信號(hào)是從原信號(hào)減去第一層解碼信號(hào)而得到的信號(hào)。
[0010]另外，為了靈活地應(yīng)對(duì)通信速度因異構(gòu)網(wǎng)絡(luò)(heterogeneous network)間切換(handover)或擁塞的發(fā)生等動(dòng)態(tài)地變動(dòng)的網(wǎng)絡(luò)環(huán)境，需要實(shí)現(xiàn)比特率間隔較小的可擴(kuò)展編碼，因此需要對(duì)降低了比特率的層進(jìn)行多層化處理而構(gòu)成可擴(kuò)展編碼。
[0011]另一方面，在專利文獻(xiàn)I和專利文獻(xiàn)2中公開(kāi)了以下技術(shù):將作為編碼對(duì)象的信號(hào)變換到頻域，在由此得到的頻域信號(hào)中進(jìn)行編碼的變換編碼。在這樣的變換編碼中，首先對(duì)每個(gè)子帶計(jì)算并量化頻域信號(hào)的能量分量即增益(縮放因子，scale factor)，接著計(jì)算并量化上述頻域信號(hào)的微細(xì)分量即形狀向量。
[0012]非專利文獻(xiàn)1:三木弼一編著，《MPEG-4仍弋< O第一版、株式會(huì)社工業(yè)調(diào)查會(huì)、1998 年 9 月 30 日、p.126-127
[0013]專利文獻(xiàn)1:日本專利申請(qǐng)?zhí)乇淼?006-513457號(hào)公報(bào)
[0014]專利文獻(xiàn)2:日本專利申請(qǐng)?zhí)亻_(kāi)平7-261800號(hào)公報(bào)

【發(fā)明內(nèi)容】

[0015]發(fā)明需要解決的問(wèn)題
[0016]然而，在對(duì)兩個(gè)參數(shù)依前后的順序進(jìn)行量化時(shí)，因?yàn)樵诤罅炕膮?shù)受到在前量化的參數(shù)的量化失真的影響，所以存在量化失真變大的傾向。因此，在專利文獻(xiàn)I和專利文獻(xiàn)2所記載的依增益、形狀向量的順序進(jìn)行量化的變換編碼中，存在形狀向量的量化失真變大，從而無(wú)法正確地表示頻譜的形狀的傾向。該問(wèn)題對(duì)如元音(vowel sound)那樣的調(diào)性(tonality)較強(qiáng)的信號(hào)即可觀察到多個(gè)波峰(peak)形狀的頻譜特性的信號(hào)，產(chǎn)生較大的質(zhì)量劣化。該問(wèn)題在實(shí)現(xiàn)低比特率時(shí)變得顯著。
[0017]本發(fā)明的目的在于，提供能夠正確地對(duì)如元音那樣的調(diào)性較強(qiáng)的信號(hào)即可觀察到多個(gè)波峰形狀的頻譜特性的信號(hào)的頻譜的形狀進(jìn)行編碼，從而能夠提高解碼語(yǔ)音的音質(zhì)等解碼信號(hào)的質(zhì)量的編碼裝置和編碼方法。
[0018]解決問(wèn)題的方案
[0019]本發(fā)明的編碼裝置所采用的結(jié)構(gòu)包括:第一層編碼單元，對(duì)輸入信號(hào)進(jìn)行編碼獲得第一層編碼數(shù)據(jù)；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼獲得第一層解碼信號(hào)；加權(quán)濾波單元，對(duì)所述輸入信號(hào)與所述第一層解碼信號(hào)之差即第一層誤差信號(hào)進(jìn)行濾波，獲得加權(quán)第一層誤差信號(hào)；第一層誤差變換系數(shù)計(jì)算單元，將所述加權(quán)第一層誤差信號(hào)變換到頻域，計(jì)算第一層誤差變換系數(shù)；以及第二層編碼單元，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼獲得第二層編碼數(shù)據(jù)，所述第二層編碼單元包括:第一形狀向量編碼單元，參照所述第一層誤差變換系數(shù)，該第一層誤差變換系數(shù)包含在包括頻率低于規(guī)定頻率的第二頻帶、并具有規(guī)定的第一帶寬的第一頻帶中，在所述第一頻帶上配置規(guī)定數(shù)目的脈沖而生成第一形狀向量，并且從所述規(guī)定數(shù)目的脈沖的位置生成第一形狀編碼信息；目標(biāo)增益計(jì)算單元，使用所述頻帶所包含的所述第一層誤差變換系數(shù)和所述第一形狀向量，對(duì)具有規(guī)定的第二帶寬的每個(gè)子帶計(jì)算目標(biāo)增益；增益向量構(gòu)成單元，使用對(duì)于每個(gè)所述子帶計(jì)算出的多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量；以及增益向量編碼單元，對(duì)所述增益向量進(jìn)行編碼獲得第一增益編碼息。
[0020]本發(fā)明的解碼裝置所采用的結(jié)構(gòu)包括:接收單元，接收通過(guò)對(duì)輸入信號(hào)進(jìn)行編碼而得到的第一層編碼數(shù)據(jù)、以及通過(guò)對(duì)第一層誤差變換系數(shù)進(jìn)行編碼而得到的第二層編碼數(shù)據(jù)，所述第一層誤差變換系數(shù)通過(guò)將所述輸入信號(hào)與對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而得到的第一層解碼信號(hào)之差、即第一層誤差信號(hào)變換為頻域而計(jì)算得到；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼信號(hào)；第二層解碼單元，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼誤差變換系數(shù)；時(shí)域變換單元，將所述第一層解碼誤差變換系數(shù)變換到時(shí)域而生成第一解碼誤差信號(hào)；以及加法單元，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，所述第二層編碼數(shù)據(jù)包含第一形狀編碼信息和第一增益編碼信息，所述第一形狀編碼信息根據(jù)第一形狀向量的多個(gè)脈沖的位置而求出，所述第一形狀向量通過(guò)對(duì)于包含頻率比所述第一層誤差變換系數(shù)的規(guī)定頻率低的第二頻帶、并且具有規(guī)定的第一帶寬的第一頻帶，將脈沖配置在多個(gè)變換系數(shù)的位置而生成，所述第一增益編碼信息通過(guò)對(duì)使用多個(gè)目標(biāo)增益構(gòu)成的一個(gè)增益向量進(jìn)行編碼而得到，所述目標(biāo)增益通過(guò)將所述第一形狀向量分為具有規(guī)定的第二帶寬的多個(gè)子帶、并對(duì)所述多個(gè)子帶的每個(gè)子帶使用所述第一形狀向量和所述第一層誤差變換系數(shù)進(jìn)行計(jì)算而得到。
[0021]本發(fā)明的編碼方法包括以下步驟:第一層編碼步驟，對(duì)輸入信號(hào)進(jìn)行編碼獲得第一層編碼數(shù)據(jù)；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼獲得第一層解碼信號(hào)；加權(quán)濾波步驟，對(duì)所述輸入信號(hào)與所述第一層解碼信號(hào)之差即第一層誤差信號(hào)進(jìn)行濾波，獲得加權(quán)第一層誤差信號(hào)；第一層誤差變換系數(shù)計(jì)算步驟，將所述加權(quán)第一層誤差信號(hào)變換到頻域，計(jì)算第一層誤差變換系數(shù)；以及第二層編碼步驟，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼獲得第二層編碼數(shù)據(jù)，所述第二層編碼步驟包括:第一形狀向量編碼步驟，參照所述第一層誤差變換系數(shù)，該第一層誤差變換系數(shù)包含在包括頻率低于規(guī)定頻率的第二頻帶、并具有規(guī)定的第一帶寬的第一頻帶中，在所述第一頻帶上配置規(guī)定數(shù)目的脈沖而生成第一形狀向量，并且從所述規(guī)定數(shù)目的脈沖的位置生成第一形狀編碼信息；目標(biāo)增益計(jì)算步驟，使用所述頻帶所包含的所述第一層誤差變換系數(shù)和所述第一形狀向量，對(duì)具有規(guī)定的第二帶寬的每個(gè)子帶計(jì)算目標(biāo)增益；增益向量構(gòu)成步驟，使用對(duì)于每個(gè)所述子帶計(jì)算出的多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量；以及增益向量編碼步驟，對(duì)所述增益向量進(jìn)行編碼獲得第一增益編碼息。
[0022]本發(fā)明的解碼方法包括以下步驟:接收步驟，接收通過(guò)對(duì)輸入信號(hào)進(jìn)行編碼而得到的第一層編碼數(shù)據(jù)、以及通過(guò)對(duì)第一層誤差變換系數(shù)進(jìn)行編碼而得到的第二層編碼數(shù)據(jù)，所述第一層誤差變換系數(shù)通過(guò)將所述輸入信號(hào)與對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而得到的第一層解碼信號(hào)之差、即第一層誤差信號(hào)變換為頻域而計(jì)算得到；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼信號(hào)；第二層解碼步驟，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼誤差變換系數(shù)；時(shí)域變換步驟，將所述第一層解碼誤差變換系數(shù)變換到時(shí)域而生成第一解碼誤差信號(hào)；以及加法步驟，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，所述第二層編碼數(shù)據(jù)包含第一形狀編碼信息和第一增益編碼信息，所述第一形狀編碼信息根據(jù)第一形狀向量的多個(gè)脈沖的位置而求出，所述第一形狀向量通過(guò)對(duì)于包含頻率比所述第一層誤差變換系數(shù)的規(guī)定頻率低的第二頻帶、并且具有規(guī)定的第一帶寬的第一頻帶，將脈沖配置在振幅值大的多個(gè)變換系數(shù)的位置而生成，所述第一增益編碼信息通過(guò)對(duì)使用多個(gè)目標(biāo)增益構(gòu)成的一個(gè)增益向量進(jìn)行編碼而得到，所述目標(biāo)增益通過(guò)將所述第一形狀向量分為具有規(guī)定的第二帶寬的多個(gè)子帶、并對(duì)所述多個(gè)子帶的每個(gè)子帶使用所述第一形狀向量和所述第一層誤差變換系數(shù)進(jìn)行計(jì)算而得到。
[0023]本發(fā)明的編碼裝置所采用的結(jié)構(gòu)包括:基本層編碼單元，對(duì)輸入信號(hào)進(jìn)行編碼而獲得基本層編碼數(shù)據(jù)；基本層解碼單元，對(duì)所述基本層編碼數(shù)據(jù)進(jìn)行解碼而獲得基本層解碼信號(hào)；以及擴(kuò)展層編碼單元，對(duì)作為所述輸入信號(hào)與所述基本層解碼信號(hào)之間的差的殘差信號(hào)進(jìn)行編碼而獲得擴(kuò)展層編碼數(shù)據(jù)，所述擴(kuò)展層編碼單元包括:分割單元，將所述殘差信號(hào)分割為多個(gè)子帶；第一形狀向量編碼單元，對(duì)所述多個(gè)子帶的各個(gè)子帶進(jìn)行編碼而獲得第一形狀編碼信息，并且計(jì)算所述多個(gè)子帶的各個(gè)子帶的目標(biāo)增益；增益向量構(gòu)成單元，利用所述多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量；以及增益向量編碼單元，對(duì)所述增益向量進(jìn)行編碼而獲得第一增益編碼?目息。
[0024]本發(fā)明的編碼方法包括以下的步驟:將變換系數(shù)分割為多個(gè)子帶，所述變換系數(shù)是將輸入信號(hào)變換到頻域而獲得的變換系數(shù)；對(duì)所述多個(gè)子帶的變換系數(shù)的各個(gè)變換系數(shù)進(jìn)行編碼而獲得第一形狀編碼信息，并且計(jì)算所述多個(gè)子帶的各個(gè)變換系數(shù)的目標(biāo)增益；利用所述多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量；以及對(duì)所述增益向量進(jìn)行編碼而獲得第一增益編碼息。
[0025]發(fā)明的效果
[0026]根據(jù)本發(fā)明，能夠進(jìn)一步正確地對(duì)如元音那樣的調(diào)性較強(qiáng)的信號(hào)即可觀察到多個(gè)波峰形狀的頻譜特性的信號(hào)的頻譜的形狀進(jìn)行編碼，從而能夠提高解碼語(yǔ)音的音質(zhì)等解碼信號(hào)的質(zhì)量。
【專利附圖】

【附圖說(shuō)明】
[0027]圖1是表示本發(fā)明實(shí)施方式I的語(yǔ)音編碼裝置的主要結(jié)構(gòu)的方框圖。
[0028]圖2是表示本發(fā)明實(shí)施方式I的第二層編碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0029]圖3是表示本發(fā)明實(shí)施方式I的第二層編碼單元中的第二層編碼處理的步驟的流程圖。
[0030]圖4是表示本發(fā)明實(shí)施方式I的形狀向量編碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0031]圖5是表示本發(fā)明實(shí)施方式I的增益向量構(gòu)成單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0032]圖6是用于詳細(xì)地說(shuō)明本發(fā)明實(shí)施方式I的目標(biāo)增益配置單元的動(dòng)作的圖。
[0033]圖7是表示本發(fā)明實(shí)施方式I的增益向量編碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0034]圖8是表示本發(fā)明實(shí)施方式I的語(yǔ)音解碼裝置的主要結(jié)構(gòu)的方框圖。
[0035]圖9是表示本發(fā)明實(shí)施方式I的第二層解碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0036]圖10是用于說(shuō)明本發(fā)明實(shí)施方式2的形狀向量碼本的圖。
[0037]圖11是舉例說(shuō)明本發(fā)明實(shí)施方式2的形狀向量碼本所包含的多個(gè)形狀向量候補(bǔ)的圖。
[0038]圖12是表示本發(fā)明實(shí)施方式3的第二層編碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0039]圖13是用于說(shuō)明本發(fā)明實(shí)施方式3的范圍選擇單元中的范圍選擇處理的圖。
[0040]圖14是表示本發(fā)明實(shí)施方式3的第二層解碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0041]圖15是表示本發(fā)明實(shí)施方式3的范圍選擇單元的變化(variation)的圖。
[0042]圖16是表示本發(fā)明實(shí)施方式3的范圍選擇單元中的范圍選擇方法的變化的圖。
[0043]圖17是表示本發(fā)明實(shí)施方式3的范圍選擇單元的結(jié)構(gòu)的變化的方框圖。
[0044]圖18是舉例說(shuō)明本發(fā)明實(shí)施方式3的、在范圍信息構(gòu)成單元中構(gòu)成范圍信息的情形的圖。
[0045]圖19是用于說(shuō)明本發(fā)明實(shí)施方式3的第一層誤差變換系數(shù)生成單元的變化的動(dòng)作的圖。
[0046]圖20是表示本發(fā)明實(shí)施方式3的范圍選擇單元中的范圍選擇方法的變化的圖。
[0047] 圖21是表示本發(fā)明實(shí)施方式3的范圍選擇單元中的范圍選擇方法的變化的圖。[0048]圖22是表示本發(fā)明實(shí)施方式4的第二層編碼單元內(nèi)部的結(jié)構(gòu)的方框圖。
[0049]圖23是表示本發(fā)明實(shí)施方式5的語(yǔ)音編碼裝置的主要結(jié)構(gòu)的方框圖。
[0050]圖24是表示本發(fā)明實(shí)施方式5的第一層編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
[0051]圖25是表示本發(fā)明實(shí)施方式5的第一層解碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
[0052]圖26是表示本發(fā)明實(shí)施方式5的語(yǔ)音解碼裝置的主要結(jié)構(gòu)的方框圖。
[0053]圖27是表示本發(fā)明實(shí)施方式6的語(yǔ)音編碼裝置的主要結(jié)構(gòu)的方框圖。
[0054]圖28是表示本發(fā)明實(shí)施方式6的語(yǔ)音解碼裝置的主要結(jié)構(gòu)的方框圖。
[0055]圖29是表示本發(fā)明實(shí)施方式7的語(yǔ)音編碼裝置的主要結(jié)構(gòu)的方框圖。
[0056]圖30A?圖30C是用于說(shuō)明在本發(fā)明實(shí)施方式7的語(yǔ)音編碼裝置的編碼處理中、作為編碼對(duì)象的范圍的選擇處理的圖。
[0057]圖31是表示本發(fā)明實(shí)施方式7的語(yǔ)音解碼裝置的主要結(jié)構(gòu)的方框圖。
[0058]圖32A、圖32B是用于說(shuō)明在本發(fā)明實(shí)施方式7的語(yǔ)音編碼裝置的編碼處理中、從等間隔地配置的范圍的候補(bǔ)中選擇編碼對(duì)象的情況的圖。
[0059]圖33是用于說(shuō)明在本發(fā)明實(shí)施方式7的語(yǔ)音編碼裝置的編碼處理中、從等間隔地配置的范圍的候補(bǔ)中選擇編碼對(duì)象的情況的圖。
【具體實(shí)施方式】
[0060]下面，參照附圖詳細(xì)地說(shuō)明本發(fā)明的實(shí)施方式。下面，使用語(yǔ)音編碼裝置/語(yǔ)音解碼裝置作為本發(fā)明的編碼裝置/解碼裝置的例子進(jìn)行說(shuō)明。
[0061](實(shí)施方式I)
[0062]圖1是表示本發(fā)明實(shí)施方式I的語(yǔ)音編碼裝置100的主要結(jié)構(gòu)的方框圖。作為本實(shí)施方式的語(yǔ)音編碼裝置和語(yǔ)音解碼裝置的結(jié)構(gòu)，以采用兩層的可擴(kuò)展結(jié)構(gòu)為例進(jìn)行說(shuō)明。另外，第一層構(gòu)成基本層，第二層構(gòu)成擴(kuò)展層。
[0063]在圖1中，語(yǔ)音編碼裝置100包括:頻域變換單元101、第一層編碼單元102、第一層解碼單元103、減法器104、第二層編碼單元105、以及復(fù)用單元106。
[0064]頻域變換單元101將時(shí)域的輸入信號(hào)變換到頻域的信號(hào)，并將所獲得的輸入變換系數(shù)輸出到第一層編碼單元102和減法器104。
[0065]第一層編碼單元102對(duì)由頻域變換單元101輸入的輸入變換系數(shù)進(jìn)行編碼處理，并將所獲得的第一層編碼數(shù)據(jù)輸出到第一層解碼單元103和復(fù)用單元106。
[0066]第一層解碼單元103利用由第一層編碼單元102輸入的第一層編碼數(shù)據(jù)進(jìn)行解碼處理，并將所獲得的第一層解碼變換系數(shù)輸出到減法器104。
[0067]減法器104從由頻域變換單元101輸入的輸入變換系數(shù)減去由第一層解碼單元103輸入的第一層解碼變換系數(shù)，并將所獲得的第一層誤差變換系數(shù)輸出到第二層編碼單元 105。
[0068]第二層編碼單元105對(duì)由減法器104輸入的第一層誤差變換系數(shù)進(jìn)行編碼處理，并將所獲得的第二層編碼數(shù)據(jù)輸出到復(fù)用單元106。另外，將在后面敘述第二層編碼單元105的細(xì)節(jié)。
[0069]復(fù)用單元106將由第一層編碼單元102輸入的第一層編碼數(shù)據(jù)與由第二層編碼單元105輸入的第二層編碼數(shù)據(jù)復(fù)用，并將所獲得的比特流輸出到通信路徑。[0070]圖2是表示第二層編碼單元105內(nèi)部的結(jié)構(gòu)的方框圖。
[0071]在圖2中，第二層編碼單元105包括:子帶構(gòu)成單元151、形狀向量編碼單元152、增益向量構(gòu)成單元153、增益向量編碼單元154、以及復(fù)用單元155。
[0072]子帶構(gòu)成單元151將由減法器104輸入的第一層誤差變換系數(shù)分割為M個(gè)子帶，并將所獲得的M個(gè)子帶變換系數(shù)輸出到形狀向量編碼單元152。這里，在將第一層誤差變換系數(shù)表示為ei(k)時(shí)，第m(0<m<M-l)子帶變換系數(shù)e(m，k)由下式⑴表示。
[0073]e (m, k) = G1 (k+F (m)) …(I) (O < k < F (m+1) -F (m))
[0074]在式(I)中，F(xiàn)(m)表示各個(gè)子帶邊界的頻率，滿足O≤F(O)〈F(I)〈…〈F(M) ^ FH的關(guān)系。這里，F(xiàn)H表示第一層誤差變換系數(shù)的最大頻率，m取O≤m≤M-1的整數(shù)。
[0075]形狀向量編碼單元152對(duì)由子帶構(gòu)成單元151依序輸入的M個(gè)子帶變換系數(shù)的各個(gè)系數(shù)進(jìn)行形狀向量量化，以生成M個(gè)子帶的各個(gè)形狀編碼信息，并且計(jì)算M個(gè)子帶變換系數(shù)各自的目標(biāo)增益。形狀向量編碼單元152將所生成的形狀編碼信息輸出到復(fù)用單元155，并將目標(biāo)增益輸出到增益向量構(gòu)成單元153。另外，將在后面敘述形狀向量編碼單元152的細(xì)節(jié)。
[0076]增益向量構(gòu)成單元153以由形狀向量編碼單元152輸入的M個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量，并將其輸出到增益向量編碼單元154。另外，將在后面敘述增益向量構(gòu)成單元153的細(xì)節(jié)。
[0077]增益向量編碼單元154將由增益向量構(gòu)成單元153輸入的增益向量作為目標(biāo)值而進(jìn)行向量量化，并將所獲得的增益編碼信息輸出到復(fù)用單元155。另外，將在后面敘述增益向量編碼單元154的細(xì)節(jié)。
[0078]復(fù)用單元155將由形狀向量編碼單元152輸入的形狀編碼信息與由增益向量編碼單元154輸入的增益編碼信息復(fù)用，并將所獲得的比特流作為第二層編碼數(shù)據(jù)輸出到復(fù)用單元106。
[0079]圖3是表示第二層編碼單元105中的第二層編碼處理的步驟的流程圖。
[0080]首先，在步驟(以下，略稱為“ST”)1010中，子帶構(gòu)成單元151將第一層誤差變換系數(shù)分割為M個(gè)子帶，構(gòu)成M個(gè)子帶變換系數(shù)。
[0081]接著，在ST1020中，第二層編碼單元105將作為用于計(jì)數(shù)子帶的數(shù)目的值的、子帶計(jì)數(shù)值m初始化為“O”。
[0082]接著，在ST1030中，形狀向量編碼單元152對(duì)第m子帶變換系數(shù)進(jìn)行形狀向量編碼，生成第m子帶的形狀編碼信息，并且生成第m子帶變換系數(shù)的目標(biāo)增益。
[0083]接著，在ST1040中，第二層編碼單元105將子帶計(jì)數(shù)值m增值I。
[0084]接著，在ST1050中，第二層編碼單元105判定是否為m〈M。
[0085]在ST1050中，在判定為m〈M時(shí)(ST1050 是”)，第二層編碼單元105使處理步驟返回到ST1030。
[0086]另一方面，在ST1050中，在判定不為m〈M時(shí)(ST1050 否”)，在ST1060中，增益向量構(gòu)成單元153利用M個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量。
[0087]接著，在ST1070中，增益向量編碼單元154將由增益向量構(gòu)成單元153構(gòu)成的增益向量作為目標(biāo)值進(jìn)行量化，生成增益編碼信息。
[0088]接著，在ST1080中，復(fù)用單元155將由形狀向量編碼單元152生成的形狀編碼信息與由增益向量編碼單元154生成的增益編碼信息復(fù)用。
[0089]圖4是表示形狀向量編碼單元152內(nèi)部的結(jié)構(gòu)的方框圖。
[0090]在圖4中，形狀向量編碼單元152包括:形狀向量碼本521、互相關(guān)計(jì)算單元522、自相關(guān)計(jì)算單元523、搜索單元524、以及目標(biāo)增益計(jì)算單元525。
[0091]形狀向量碼本521存儲(chǔ)了多個(gè)表示第一層誤差變換系數(shù)的形狀的形狀向量候補(bǔ)，基于由搜索單元524輸入的控制信號(hào)，將形狀向量候補(bǔ)依序輸出到互相關(guān)計(jì)算單元522和自相關(guān)計(jì)算單元523。另外，一般而言，形狀向量碼本既有采用實(shí)際地確保存儲(chǔ)區(qū)域來(lái)存儲(chǔ)形狀向量候補(bǔ)的形態(tài)的情況，也有根據(jù)預(yù)先規(guī)定的處理步驟構(gòu)成形狀向量候補(bǔ)的情況。在后者的情況下，無(wú)需實(shí)際地確保存儲(chǔ)區(qū)域。在本實(shí)施方式中采用哪種形狀向量碼本都可以，但下面以具有如圖4所示的、存儲(chǔ)有形狀向量候補(bǔ)的形狀向量碼本521為前提進(jìn)行說(shuō)明。以下，將形狀向量碼本521所存儲(chǔ)的多個(gè)形狀向量候補(bǔ)中的第i候補(bǔ)表示為c(i，k)。這里，k表示用于構(gòu)成形狀向量候補(bǔ)的多個(gè)元素中的第k個(gè)。
[0092]互相關(guān)計(jì)算單元522根據(jù)下式(2)計(jì)算由子帶構(gòu)成單元151輸入的第m子帶變換系數(shù)與由形狀向量碼本521輸入的第i形狀向量候補(bǔ)之間的互相關(guān)ccor (i)，并將其輸出到搜索單元524和目標(biāo)增益計(jì)算單元525。
[0093]
【權(quán)利要求】
1.編碼裝置，包括: 第一層編碼單元，對(duì)輸入信號(hào)進(jìn)行編碼獲得第一層編碼數(shù)據(jù)；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼獲得第一層解碼信號(hào)；加權(quán)濾波單元，對(duì)所述輸入信號(hào)與所述第一層解碼信號(hào)之差即第一層誤差信號(hào)進(jìn)行濾波，獲得加權(quán)第一層誤差信號(hào)；第一層誤差變換系數(shù)計(jì)算單元，將所述加權(quán)第一層誤差信號(hào)變換到頻域，計(jì)算第一層誤差變換系數(shù)；以及第二層編碼單元，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼獲得第二層編碼數(shù)據(jù)，所述第二層編碼單元包括: 第一形狀向量編碼單元，參照所述第一層誤差變換系數(shù)，該第一層誤差變換系數(shù)包含在包括頻率低于規(guī)定頻率的第二頻帶、并具有規(guī)定的第一帶寬的第一頻帶中，在所述第一頻帶上配置規(guī)定數(shù)目的脈沖而生成第一形狀向量，并且從所述規(guī)定數(shù)目的脈沖的位置生成第一形狀編碼信息；目標(biāo)增益計(jì)算單元，使用所述頻帶所包含的所述第一層誤差變換系數(shù)和所述第一形狀向量，對(duì)具有規(guī)定的第二帶寬的每個(gè)子帶計(jì)算目標(biāo)增益；增益向量構(gòu)成單元，使用對(duì)于每個(gè)所述子帶計(jì)算出的多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量；以及增益向量編碼單元，對(duì)所述增益向量進(jìn)行編碼獲得第一增益編碼信息。
2.如權(quán)利要求1所述的編碼裝置，所述第二層編碼單元還包括范圍選擇單元，該范圍選擇單元計(jì)算使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍的調(diào)性，從所述多個(gè)范圍中選擇所述調(diào)性最高的一個(gè)范圍，所述第一形狀向量編碼單元、所述增益向量構(gòu)成單元以及所述增益向量編碼單元對(duì)構(gòu)成選擇出的所述范圍的多個(gè)子帶進(jìn)行動(dòng)作。
3.如權(quán)利要求1所述的編碼裝置，所述第二層編碼單元還包括范圍選擇單元，該范圍選擇單元計(jì)算使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍的平均能量，從所述多個(gè)范圍中選擇所述平均能量最高的一個(gè)范圍，所述第一形狀向量編碼單元、所述增益向量構(gòu)成單元以及所述增益向量編碼單元對(duì)構(gòu)成選擇出的所述范圍的多個(gè)子帶進(jìn)行動(dòng)作。
4.如權(quán)利要求1所述的編碼裝置，所述第二層編碼單元還包括范圍選擇單元，該范圍選擇單元計(jì)算使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍的聽(tīng)覺(jué)加權(quán)能量，從所述多個(gè)范圍中選擇所述聽(tīng)覺(jué)加權(quán)能量最高的一個(gè)范圍，所述第一形狀向量編碼單元、所述增益向量構(gòu)成單元以及所述增益向量編碼單元對(duì)構(gòu)成選擇出的所述范圍的多個(gè)子帶進(jìn)行動(dòng)作。
5.如權(quán)利要求1所述的編碼裝置，所述第二層編碼單元還包括范圍選擇單元，該范圍選擇單元使用任意數(shù)目的相鄰的所述子帶構(gòu)成多個(gè)范圍，使用任意數(shù)目的所述范圍構(gòu)成多個(gè)部分頻帶，在所述多個(gè)部分頻帶的每一個(gè)部分頻帶中，選擇平均能量最高的一個(gè)范圍，結(jié)合選擇出的多個(gè)范圍構(gòu)成結(jié)合范圍，所述第一形狀向量編碼單元、所述增益向量構(gòu)成單元以及所述增益向量編碼單元對(duì)構(gòu)成選擇出的所述結(jié)合范圍的多個(gè)子帶進(jìn)行動(dòng)作。
6.如權(quán)利要求5所述的編碼裝置，所述范圍選擇單元在所述多個(gè)部分頻帶的至少一個(gè)中，總是選擇預(yù)先確定的固定范圍。
7.如權(quán)利要求1所述的編碼裝置，所述第二層編碼單元還包括判定所述輸入信號(hào)的調(diào)性的強(qiáng)度的調(diào)性判定單元，在判定為所述輸入信號(hào)的調(diào)性的強(qiáng)度為規(guī)定水平以上時(shí)，將所述第一層誤差變換系數(shù)分給多個(gè)子帶，對(duì)所述多個(gè)子帶的每一個(gè)子帶進(jìn)行編碼而獲得第一形狀編碼信息，并計(jì)算所述多個(gè)子帶的每一個(gè)子帶的目標(biāo)增益，使用所述多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量，對(duì)所述增益向量進(jìn)行編碼獲得第一增益編碼信息。
8.如權(quán)利要求1至權(quán)利要求7中任一項(xiàng)所述的編碼裝置，所述第一層編碼單元包括: 下采樣單元，對(duì)所述輸入信號(hào)進(jìn)行下采樣獲得下采樣信號(hào)；以及核心編碼單元，對(duì)所述下采樣信號(hào)進(jìn)行編碼獲得作為編碼數(shù)據(jù)的核心編碼數(shù)據(jù)，所述第一層解碼單元包括: 核心解碼單元，對(duì)所述核心編碼數(shù)據(jù)進(jìn)行解碼獲得核心解碼信號(hào)；上采樣單元，對(duì)所述核心解碼信號(hào)進(jìn)行上采樣獲得上采樣信號(hào)；以及代用單元，以噪聲代用所述上采樣信號(hào)的高頻分量。
9.如權(quán)利要求1所述的編碼裝置，還包括: 增益編碼單元，對(duì)所述多個(gè)子帶的各變換系數(shù)的增益進(jìn)行編碼，獲得第二增益編碼信息；歸一化單元，使用對(duì)所述增益編碼信息進(jìn)行解碼而得到的解碼增益，對(duì)所述多個(gè)子帶的各變換系數(shù)進(jìn)行歸一化而獲得歸一化形狀向量；第二形狀向量編碼單元，對(duì)所述多個(gè)歸一化形狀向量的每一個(gè)歸一化形狀向量進(jìn)行編碼而獲得第二形狀編碼信息；判定單元，對(duì)每個(gè)幀計(jì)算所述輸入信號(hào)的調(diào)性，在判定為所述調(diào)性為閾值以上時(shí)，將所述多個(gè)子帶的變換系數(shù)輸出到所述第一形狀向量編碼單元，在判定為所述調(diào)性小于所述閾值時(shí)，將所述多個(gè)子帶的變換系數(shù)輸出到所述增益編碼單元。
10.解碼裝置，包括: 接收單元，接收通過(guò)對(duì)輸入信號(hào)進(jìn)行編碼而得到的第一層編碼數(shù)據(jù)、以及通過(guò)對(duì)第一層誤差變換系數(shù)進(jìn)行編碼而得到的第二層編碼數(shù)據(jù)，所述第一層誤差變換系數(shù)通過(guò)將所述輸入信號(hào)與對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而得到的第一層解碼信號(hào)之差、即第一層誤差信號(hào)變換為頻域而計(jì)算得到；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼信號(hào)；第二層解碼單元，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼誤差變換系數(shù)；時(shí)域變換單元，將所述第一層解碼誤差變換系數(shù)變換到時(shí)域而生成第一解碼誤差信號(hào)；以及加法單元，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，所述第二層編碼數(shù)據(jù)包含第一形狀編碼信息和第一增益編碼信息，所述第一形狀編碼信息根據(jù)第一形狀向量的多個(gè)脈沖的位置而求出，所述第一形狀向量通過(guò)對(duì)于包含頻率比所述第一層誤差變換系數(shù)的規(guī)定頻率低的第二頻帶、并且具有規(guī)定的第一帶寬的第一頻帶，將脈沖配置在多個(gè)變換系數(shù)的位置而生成，所述第一增益編碼信息通過(guò)對(duì)使用多個(gè)目標(biāo)增益構(gòu)成的一個(gè)增益向量進(jìn)行編碼而得到，所述目標(biāo)增益通過(guò)將所述第一形狀向量分為具有規(guī)定的第二帶寬的多個(gè)子帶、并對(duì)所述多個(gè)子帶的每個(gè)子帶使用所述第一形狀向量和所述第一層誤差變換系數(shù)進(jìn)行計(jì)算而得到。
11.如權(quán)利要求10所述的解碼裝置，所述第二層編碼數(shù)據(jù)包括范圍選擇信息，該范圍選擇信息表示使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍內(nèi)的調(diào)性最高的范圍，所述第二層解碼單元對(duì)構(gòu)成所述范圍選擇信息表示的范圍的子帶進(jìn)行解碼處理，生成所述第一層解碼誤差變換系數(shù)。
12.如權(quán)利要求10所述的解碼裝置，所述第二層編碼數(shù)據(jù)包括范圍選擇信息，該范圍選擇信息表示使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍內(nèi)的平均能量最高的范圍，所述第二層解碼單元對(duì)構(gòu)成所述范圍選擇信息表示的范圍的子帶進(jìn)行解碼處理，生成所述第一層解碼誤差變換系數(shù)。
13.如權(quán)利要求10所述的解碼裝置，所述第二層編碼數(shù)據(jù)包括范圍選擇信息，該范圍選擇信息表示使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍內(nèi)的聽(tīng)覺(jué)加權(quán)能量最高的范圍，所述第二層解碼單元對(duì)構(gòu)成所述范圍選擇信息表示的范圍的子帶進(jìn)行解碼處理，生成所述第一層解碼誤差變換系數(shù)。
14.如權(quán)利要求10所述的解碼裝置，所述第二層編碼數(shù)據(jù)包括范圍選擇信息，該范圍選擇信息表示在使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)部分頻帶的每個(gè)頻帶中，使用任意數(shù)目的相鄰的所述子帶構(gòu)成的多個(gè)范圍內(nèi)的平均能量最高的范圍，所述第二層解碼單元對(duì)構(gòu)成結(jié)合所述范圍選擇信息表示的所述部分頻帶的各范圍而構(gòu)成的結(jié)合范圍的子帶進(jìn)行解碼處理，生成所述第一層解碼誤差變換系數(shù)。
15.如權(quán)利要求14所述的解碼裝置，在所述多個(gè)部分頻帶的至少一個(gè)部分頻帶中，總是選擇預(yù)先確定的固定范圍，所述范圍選擇信息包括表示成為所述固定范圍的部分頻帶以外的部分頻帶的范圍的信息。
16.編碼方法，包括: 第一層編碼步驟，對(duì)輸入信號(hào)進(jìn)行編碼獲得第一層編碼數(shù)據(jù)；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼獲得第一層解碼信號(hào)；加權(quán)濾波步驟，對(duì)所述輸入信號(hào)與所述第一層解碼信號(hào)之差即第一層誤差信號(hào)進(jìn)行濾波，獲得加權(quán)第一層誤差信號(hào)；第一層誤差變換系數(shù)計(jì)算步驟，將所述加權(quán)第一層誤差信號(hào)變換到頻域，計(jì)算第一層誤差變換系數(shù)；以及第二層編碼步驟，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼獲得第二層編碼數(shù)據(jù)，所述第二層編碼步驟包括: 第一形狀向量編碼步驟，參照所述第一層誤差變換系數(shù)，該第一層誤差變換系數(shù)包含在包括頻率低于規(guī)定頻率的第二頻帶、并具有規(guī)定的第一帶寬的第一頻帶中，在所述第一頻帶上配置規(guī)定數(shù)目的脈沖而生成第一形狀向量，并且從所述規(guī)定數(shù)目的脈沖的位置生成第一形狀編碼信息；目標(biāo)增益計(jì)算步驟，使用所述頻帶所包含的所述第一層誤差變換系數(shù)和所述第一形狀向量，對(duì)具有規(guī)定的第二帶寬的每個(gè)子帶計(jì)算目標(biāo)增益；增益向量構(gòu)成步驟，使用對(duì)于每個(gè)所述子帶計(jì)算出的多個(gè)目標(biāo)增益構(gòu)成一個(gè)增益向量；以及增益向量編碼步驟，對(duì)所述增益向量進(jìn)行編碼獲得第一增益編碼信息。
17.解碼方法，包括: 接收步驟，接收通過(guò)對(duì)輸入信號(hào)進(jìn)行編碼而得到的第一層編碼數(shù)據(jù)、以及通過(guò)對(duì)第一層誤差變換系數(shù)進(jìn)行編碼而得到的第二層編碼數(shù)據(jù)，所述第一層誤差變換系數(shù)通過(guò)將所述輸入信號(hào)與對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而得到的第一層解碼信號(hào)之差、即第一層誤差信號(hào)變換為頻域而計(jì)算得到；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼信號(hào)；第二層解碼步驟，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼誤差變換系數(shù)；時(shí)域變換步驟，將所述第一層解碼誤差變換系數(shù)變換到時(shí)域而生成第一解碼誤差信號(hào)；以及加法步驟，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，所述第二層編碼數(shù)據(jù)包含第一形狀編碼信息和第一增益編碼信息，所述第一形狀編碼信息根據(jù)第一形狀向量的多個(gè)脈沖的位置而求出，所述第一形狀向量通過(guò)對(duì)于包含頻率比所述第一層誤差變換系數(shù)的規(guī)定頻率低的第二頻帶、并且具有規(guī)定的第一帶寬的第一頻帶，將脈沖配置在振幅值大的多個(gè)變換系數(shù)的位置而生成，所述第一增益編碼信息通過(guò)對(duì)使用多個(gè)目標(biāo)增益構(gòu)成的一個(gè)增益向量進(jìn)行編碼而得到，所述目標(biāo)增益通過(guò)將所述第一形狀向量分為具有規(guī)定的第二帶寬的多個(gè)子帶、并對(duì)所述多個(gè)子帶的每個(gè)子帶使用所述第一形狀向量和所述第一層誤差變換系數(shù)進(jìn)行計(jì)算而得到。
【文檔編號(hào)】G10L19/16GK103903626SQ201410119876
【公開(kāi)日】2014年7月2日申請(qǐng)日期:2008年2月29日優(yōu)先權(quán)日:2007年3月2日
【發(fā)明者】押切正浩, 森井利幸, 山梨智史申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載