解碼裝置、解碼方法以及通信終端和基站裝置的制作方法

文檔序號(hào)：2832345閱讀：181來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：解碼裝置、解碼方法以及通信終端和基站裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對(duì)語(yǔ)音信號(hào)、音頻信號(hào)等進(jìn)行編碼/解碼的編碼裝置、解碼裝置以及編碼/解碼方法。
背景技術(shù)：
將語(yǔ)音信號(hào)通過(guò)低比特率進(jìn)行壓縮的語(yǔ)音編碼技術(shù)，對(duì)于移動(dòng)臺(tái)通信進(jìn) 行電波等的有效利用十分重要。特別是作為近年來(lái)的趨勢(shì)來(lái)講，對(duì)提高通話語(yǔ)音的質(zhì)量寄予的期待日益增加，希望能夠?qū)崿F(xiàn)具有高度的真實(shí)感的通話服務(wù)。在此所指的真實(shí)感為說(shuō)話者置身的環(huán)境(譬如BGM),因此希望對(duì)音頻等的語(yǔ)音之外的信號(hào)也能夠高質(zhì)量地進(jìn)行編碼。
在將語(yǔ)音信號(hào)編碼的語(yǔ)音編碼技術(shù)中，存在G726、 G729等的由ITU-T (International Telecommunication Union Telecommunication Standardization Sector)標(biāo)準(zhǔn)化的方式。這些方式是以窄帶信號(hào)(300Hz 3.4kHz)為對(duì)象，能夠通過(guò)8kbit/s ~ 32kbit/s進(jìn)行編碼。雖然這些方式可以通過(guò)^[氐比特率進(jìn)^f亍編碼，但是作為編碼對(duì)象的窄帶信號(hào)的頻域最大只到3.4KHz,仍然太窄，因此其質(zhì) 量不能提高而導(dǎo)致缺乏真實(shí)感。
另夕卜，在ITU-T和3GPP ( The 3rd Generation Partnership Project)中存在對(duì)信號(hào)頻帶為50Hz-7kHz的語(yǔ)音進(jìn)行編碼的標(biāo)準(zhǔn)方式(G722、 G.722.1、 AMR-WB等)。雖然這些方式能夠通過(guò)6.6kbit/s ~ 64kbit/s的比特率進(jìn)行寬帶語(yǔ)音信號(hào)的編碼，但是對(duì)寬帶語(yǔ)音信號(hào)高質(zhì)量地進(jìn)行編碼需要相對(duì)提高比特率。而且從音質(zhì)的角度來(lái)講，寬帶語(yǔ)音與窄帶語(yǔ)音相比雖然具有高音質(zhì)，但是對(duì)要求高度的真實(shí)感的服務(wù)來(lái)講很難說(shuō)已經(jīng)足夠。一^殳來(lái)講，當(dāng)信號(hào)的最大頻率達(dá)到10-15kHz左右時(shí)，能夠得到相當(dāng)于 FM廣播的真實(shí)感，而達(dá)到20kHz左右時(shí)，能夠得到相當(dāng)于CD的質(zhì)量。對(duì) 于具有如此頻帶的信號(hào)，由MPEG ( Moving Picture Expert Group )標(biāo)準(zhǔn)化了的以層3方式和AAC方式等為代表的音頻編碼方式比較適合。但是，如果將這些音頻編碼方式作為語(yǔ)音通信的編碼方式來(lái)采用的話，需要設(shè)定高比特率以對(duì)語(yǔ)音高質(zhì)量地進(jìn)行編碼。另外還會(huì)發(fā)生編碼遲延變大等的問(wèn)題。
作為將寬頻域的信號(hào)通過(guò)低比特率高質(zhì)量地進(jìn)行編碼的方法，具有下述技術(shù)將輸入信號(hào)的頻譜分割為低頻部分和高頻部分的兩個(gè)頻譜，然后將低頻頻譜進(jìn)行復(fù)制并置換高頻頻譜(將高頻頻譜通過(guò)低頻頻鐠代用)，由此降低整體的比特率(譬如參照專利文獻(xiàn)1 )。該技術(shù)將較多的比特分配用于低頻頻譜的編碼而進(jìn)行高質(zhì)量的編碼，相反，對(duì)于高頻頻譜則進(jìn)行將編碼后的低頻頻譜進(jìn)行復(fù)制的基本處理，由此可以通過(guò)較少的比特分配來(lái)進(jìn)行編碼。
另外，作為與該技術(shù)類似的技術(shù)，還有下述技術(shù)對(duì)不能充分分配編碼比特的頻帶，利用其它預(yù)定的部分頻頻頻譜信息進(jìn)行近似處理而提高質(zhì)量(譬如參照專利文獻(xiàn)2 )。在沒(méi)有附加信息的情況下對(duì)窄帶信號(hào)進(jìn)行頻帶擴(kuò)展使其成為寬帶信號(hào)，因此將窄帶信號(hào)的低頻頻譜復(fù)制于高頻頻譜來(lái)作為基本處理 (譬如參照專利文獻(xiàn)3)。
再者，不論在哪種技術(shù)中，都將其它頻帶的頻譜進(jìn)行復(fù)制，并在用于使頻鐠包絡(luò)線變得平滑而進(jìn)行的增益調(diào)整后，將該復(fù)制頻譜插入需要進(jìn)行頻i普補(bǔ)充的頻帶。日本專利申請(qǐng)?zhí)乇?001-521648號(hào)公報(bào) [專利文獻(xiàn)2]日本專利申請(qǐng)?zhí)亻_(kāi)平9-153811號(hào)公報(bào) [專利文獻(xiàn)3 ]日本專利申請(qǐng)?zhí)亻_(kāi)平9-90992號(hào)公報(bào)

發(fā)明內(nèi)容
發(fā)明需要解決的問(wèn)題
但是，在語(yǔ)音信號(hào)或音頻信號(hào)的頻譜中，低頻頻譜的動(dòng)態(tài)范圍(頻語(yǔ)振幅的絕對(duì)值(絕對(duì)振幅)的最大值與最小值的比)比高頻頻語(yǔ)的動(dòng)態(tài)范圍大的現(xiàn)象很常見(jiàn)。圖1為用來(lái)說(shuō)明該現(xiàn)象的圖，其示出了音頻信號(hào)的頻譜的一例。該頻譜為將采樣頻率32kHz的音頻信號(hào)通過(guò)30ms的長(zhǎng)度來(lái)進(jìn)行頻率分析時(shí)的對(duì)數(shù)頻譜。如該圖所示，頻率為0~ 8000Hz的低頻頻語(yǔ)峰值性很強(qiáng)(存在多個(gè)銳利的譜峰)，在該頻帶的頻i普的動(dòng)態(tài)范圍很大。與此相反，頻率為8~ 15000Hz 的高頻頻譜的動(dòng)態(tài)范圍則很小。對(duì)具有這樣的頻譜特性的信號(hào)，如果利用傳統(tǒng)的將低頻頻語(yǔ)復(fù)制于高頻頻譜的方法的話，即使進(jìn)行高頻頻譜的增益調(diào)整，也會(huì)出現(xiàn)下述的現(xiàn)象，即在高頻頻譜中出現(xiàn)不必要的譜峰形狀。
圖2為表示將如圖1所示頻謙的低頻頻譜(1000 ~ 7000Hz)復(fù)制，并通過(guò)功率調(diào)整而得到高頻頻譜(10000- 16000Hz)時(shí)的全頻帶頻譜的圖。
如該圖所示，當(dāng)進(jìn)4亍上述處理時(shí)，在高于10000Hz的頻帶Rl出現(xiàn)了不必要的譜峰形狀。該譜峰為原來(lái)的高頻頻譜中所沒(méi)有的。而且，在將該頻譜變換到時(shí)域而得到的解碼信號(hào)中，會(huì)發(fā)生鈴響似的噪聲，而導(dǎo)致主觀質(zhì)量降低的問(wèn)題。如上所述，在將某頻帶的頻譜通過(guò)其它頻帶的頻譜代用的技術(shù)中，需要恰當(dāng)?shù)卣{(diào)整插入頻譜的動(dòng)態(tài)范圍。
因此，本發(fā)明旨在提供一種編碼裝置、解碼裝置以及編碼/解碼方法，在將某頻帶的頻譜通過(guò)其它頻帶的頻譜代用(置換)的技術(shù)中，能夠恰當(dāng)?shù)卣{(diào) 整插入頻譜的動(dòng)態(tài)范圍來(lái)提高解碼信號(hào)的主觀質(zhì)量。
解決該問(wèn)題的方案
本發(fā)明的解碼裝置采用這種結(jié)構(gòu)，包括變換單元，將對(duì)包含于通過(guò)編
域信號(hào)而生成第一低頻頻譜；限制單元，根據(jù)包含于通過(guò)所述編碼裝置所生成的編碼中的頻譜變形信息，對(duì)所述第一低頻頻鐠的振幅進(jìn)行一致性限制而生成第二低頻頻譜；以及解碼單元，基于所述第二低頻頻譜對(duì)包含于通過(guò)所述編碼裝置生成出的編碼中的高頻頻譜部分的編碼進(jìn)行解碼而生成高頻頻譜。
本發(fā)明還提供一種包括上述解碼裝置的通信終端裝置。本發(fā)明還提供一種包括上述解碼裝置的基站裝置。
本發(fā)明還提供一種解碼方法，包括變換步驟，將對(duì)包含于編碼裝置所生成的編碼中的低頻頻譜部分的編碼進(jìn)行解碼所得的信號(hào)變換成頻域信號(hào)而生成第一低頻頻譜；限制步驟，根據(jù)包含于通過(guò)所述編碼裝置所生成的編碼中的頻譜變形信息，對(duì)所述第一低頻頻譜的振幅進(jìn)行一致性限制而生成第二低頻頻語(yǔ)；以及解碼步驟，基于所述第二低頻頻譜對(duì)包含于所述編碼裝置所生成的編碼中的高頻頻譜部分的編碼進(jìn)行解碼而生成高頻頻譜。發(fā)明的有益效果
根據(jù)本發(fā)明，在將某頻帶的頻譜通過(guò)其它頻帶的頻譜代用的技術(shù)中，能夠恰當(dāng)?shù)卣{(diào)整插入頻譜的動(dòng)態(tài)范圍而提高解碼信號(hào)的主觀質(zhì)量。

圖1是表示音頻信號(hào)的頻譜的示例的圖。
圖2為表示復(fù)制低頻頻譜并進(jìn)行功率調(diào)整而得到高頻頻譜時(shí)的全頻帶的頻譜的圖。
圖3是表示實(shí)施方式1的編碼裝置的主要結(jié)構(gòu)的方框圖。
圖4是表示實(shí)施方式1的頻語(yǔ)編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖5是表示實(shí)施方式1的頻譜變形單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖6是表示實(shí)施方式1的變形單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖7是表示實(shí)施方式1的通過(guò)變形單元而得到的變形頻譜的例子的圖。
圖8是表示實(shí)施方式1的變形單元的其它變化形式的結(jié)構(gòu)的方框圖。
圖9是表示實(shí)施方式1的分層解碼裝置的主要結(jié)構(gòu)的方框圖。
圖IO是表示實(shí)施方式1的頻譜解碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖11是表示用于說(shuō)明實(shí)施方式2的頻譜編碼單元的方框圖。
圖12是表示實(shí)施方式2的頻譜編碼單元的其它變化形式的結(jié)構(gòu)的方框圖。
圖13是表示實(shí)施方式2的頻譜解碼單元的主要結(jié)構(gòu)的方框圖。圖14是表示實(shí)施方式3的頻譜編碼單元的主要結(jié)構(gòu)的方框圖。圖15是表示用于說(shuō)明實(shí)施方式3的變形信息估計(jì)單元的方框圖。圖16是表示實(shí)施方式3的變形單元的主要結(jié)構(gòu)的方框圖。圖17是表示實(shí)施方式3的頻譜解碼單元的主要結(jié)構(gòu)的方框圖。圖18是表示實(shí)施方式4的分層編碼裝置的主要結(jié)構(gòu)的方框圖。圖19是表示實(shí)施方式4的頻譜編碼單元的主要結(jié)構(gòu)的方框圖。圖20是表示實(shí)施方式4的分層解碼裝置的主要結(jié)構(gòu)的方框圖。圖21是表示實(shí)施方式4的頻譜解碼單元的主要結(jié)構(gòu)的方框圖。圖22是表示實(shí)施方式5的頻譜編碼單元的主要結(jié)構(gòu)的圖。圖23是表示實(shí)施方式5的變換信息估計(jì)單元的主要結(jié)構(gòu)的方框圖。圖24是表示實(shí)施方式5的頻譜解碼單元的主要結(jié)構(gòu)的圖。圖25是用于說(shuō)明實(shí)施方式6的頻譜變形方法的圖。
圖26是表示實(shí)施方式6的頻譜變形單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖27是用于說(shuō)明變形頻譜的生成方法的圖。
圖28是用于說(shuō)明變形頻譜的生成方法的圖。
具體實(shí)施例方式
以下，參照附圖詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式。 (實(shí)施方式1 )
圖3是表示本發(fā)明實(shí)施方式1的分層編碼裝置100的主要結(jié)構(gòu)的方框圖。在此，以編碼信息具有由多層構(gòu)成的分層結(jié)構(gòu)的情形，也就是進(jìn)行分層編碼 (可擴(kuò)展性編碼)的情形為例來(lái)說(shuō)明。
分層編碼裝置100的各個(gè)部分，隨著信號(hào)的輸入執(zhí)行以下動(dòng)作。
下采樣單元101根據(jù)輸入信號(hào)生成低采樣率的信號(hào)，并提供給第一層編碼單元102。第一層編碼單元102對(duì)從下采樣單元101輸出的信號(hào)進(jìn)行編碼。將通過(guò)第一層編碼單元102得到的編碼符號(hào)提供給復(fù)用單元103和第一層解碼單元104。然后，第一層解碼單元104根據(jù)第一層編碼單元102輸出的編碼符號(hào)生成第一層解碼信號(hào)Sl。
另一方面，延遲單元105將預(yù)定長(zhǎng)度的延遲賦予輸入信號(hào)。該延遲用于校正在下采樣單元101、第一層編碼單元102以及第一層解碼單元104中產(chǎn) 生的時(shí)間延遲。頻譜編碼單元106利用由第一層解碼單元104生成的第一層解碼信號(hào)si ，對(duì)由延遲單元105輸出的、經(jīng)延遲預(yù)定時(shí)間的輸入信號(hào)S2進(jìn) 行頻譜編碼，并將生成的編碼符號(hào)輸出到復(fù)用單元103。
復(fù)用單元103對(duì)由第一層編碼單元102求出的編碼符號(hào)與由頻譜編碼單元106求出的編碼符號(hào)進(jìn)行復(fù)用，并將其作為輸出編碼符號(hào)輸出到編碼裝置 100的外部。
圖4是表示上述頻譜編碼單元106內(nèi)部的主要結(jié)構(gòu)的方框圖。該頻譜編碼單元106主要包括頻域變換單元lll、頻譜變形單元112、
頻域變換單元113、擴(kuò)展頻帶頻譜編碼單元114以及復(fù)用單元115。
頻譜編碼單元106從第一層解碼單元104接收具有有效信號(hào)頻帶為
0^k<FL (k為各子帶的頻率)的第一信號(hào)Sl,并且從延遲單元105接收具有有效信號(hào)頻帶為0^k<FH (其中FL<FH)的第二信號(hào)S2。頻譜編碼單元106 利用第一信號(hào)SI的頻帶0^k<FL的頻譜來(lái)估計(jì)第二信號(hào)S2的頻帶FI^k<FH 的頻i普，并對(duì)該估計(jì)信息進(jìn)行編碼并輸出。
頻域變換單元111對(duì)輸入的第一信號(hào)SI進(jìn)行頻率變換，計(jì)算出低頻頻譜的第一頻語(yǔ)S1 (k)。另一方面，頻域變換單元113對(duì)輸入的第二信號(hào)S2進(jìn) 行頻率變換，計(jì)算出寬帶的第二頻譜S2 (k)。在此所述的頻率變換的方法適用離散傅立葉變換(DFT)、離散余弦變換(DCT)以及變形離散余弦變換 (MDCT)等。另外，SI (k)為第一頻語(yǔ)的頻率k的子帶的頻譜、S2 (k) 為第二頻譜的頻率k的子帶的頻譜。
頻譜變形單元112將第一頻譜Sl(k)進(jìn)行各種各樣的變形來(lái)改變第一頻譜的動(dòng)態(tài)范圍，從而調(diào)查作為恰當(dāng)?shù)膭?dòng)態(tài)范圍的變形方法。而且，將有關(guān)該變形的信息(變形信息)進(jìn)行編碼并提供給復(fù)用單元115。有關(guān)該頻譜變形處理的詳細(xì)內(nèi)容將在后面敘述。另外，頻譜變形單元112將動(dòng)態(tài)范圍變得恰當(dāng) 的第一頻譜Sl(k)輸出到擴(kuò)展頻帶頻譜編碼單元114。
擴(kuò)展頻帶頻譜編碼單元114將第二頻帶S2(k)作為參照信號(hào)，估計(jì)應(yīng)當(dāng)包含于第一頻譜Sl(k)的高頻(FI^k<FH)的頻譜(擴(kuò)展頻帶頻譜)，并將有關(guān) 該估計(jì)頻譜的信息(估計(jì)信息)進(jìn)行編碼提供給復(fù)用單元115。在此，擴(kuò)展頻帶頻譜的估計(jì)基于變形后的第一頻譜S1 ，(k)進(jìn)行。
然后，復(fù)用單元115將由頻譜變形單元112輸出的變形信息的編碼符號(hào) 以及由擴(kuò)展頻帶頻譜編碼單元114輸出的有關(guān)擴(kuò)展頻帶頻譜的估計(jì)信息的編碼符號(hào)進(jìn)行復(fù)用并輸出。
圖5是表示上述頻語(yǔ)變形單元112內(nèi)部的主要結(jié)構(gòu)的方框圖。
頻譜變形單元112對(duì)第一頻譜S1 (k)施加變形，該變形為使第一頻譜 Sl (k)的動(dòng)態(tài)范圍最接近于第二頻譜S2 (k)的高頻頻譜(FL￡k<FH)的動(dòng) 態(tài)范圍的變形。接下來(lái)，將此時(shí)的變形信息進(jìn)行編碼并輸出。
緩沖單元121暫時(shí)存儲(chǔ)輸入的第一頻譜S1 (k)，并根據(jù)需要將第一頻譜 Sl (k)提供給變形單元122。
變形單元122按照下述的步驟，對(duì)第一頻鐠S1 (k)進(jìn)行各種各樣的變形來(lái)生成第一頻譜S1， (j， k)，并將其提供給子帶功率計(jì)算單元123。在此， j為用來(lái)識(shí)別各種變形處理的索引。
子帶功率計(jì)算單元123將變形第一頻譜S1， (j， k)的頻域分割成多個(gè)子帶，并求出預(yù)定范圍的子帶的功率(子帶功率)。譬如，將求解子帶功率的范
圍設(shè)定為FlL^k〈FlH時(shí)，對(duì)該帶寬進(jìn)行N分割時(shí)的子帶寬BWS表示為下式 (式1)。
BWS= (F1H-F1L+1 ) /N (式l) 因此，第n子帶的最小頻率FlL (n)以及最大頻率F1H (n)分別表示為(式2)和(式3)。
FlL(n) =FlL+n.BWS (式2)
F1H (n) =F1L+ (n+1 ) 'BWS-1 (式3)
其中，n取0 N畫l的值。
此時(shí)，子帶功率P1 (j, n)如下式(式4)所示計(jì)算。
!>i'(m)2
尸1(7,，") = ^^- (式4)
另外，也可以如下式(式5)所示計(jì)算包含于子帶的頻語(yǔ)的平均值。
尸i(,fy^H^- (式5)
II鮮s 、、"
然后將如上所述求出的子帶功率P1 (j， n)提供給方差計(jì)算單元124。方差計(jì)算單元124為了表示子帶功率P1 (j， n)的偏差程度，根據(jù)下式 (式6)來(lái)計(jì)算出方差dl2 (j)。
al2C0 = |j(Ha")—尸lme朋C/))2 (式6)
在此，Plmean (j)表示子帶功率P1 (j, n)的平均值，并如下式(式7)
計(jì)算出來(lái)。
Plme""(力=~~ (式7 )
然后將如上所述計(jì)算出來(lái)的表示變形信息j的子帶功率的偏差程度的方差cj12 (j)提供給搜索單元125。
子帶功率計(jì)算單元126以及方差計(jì)算單元127，進(jìn)行與上述子帶功率計(jì) 算單元123以及方差計(jì)算單元124所進(jìn)行的一系列的處理相同的處理對(duì)輸入的第二頻譜S2(k)，計(jì)算出表示子帶功率的偏差程度的方差Cl2"j)。不過(guò)，
子帶功率計(jì)算單元126以及方差計(jì)算單元127進(jìn)行的處理與上述處理的不同處如下所述。也就是，將計(jì)算第二頻譜S2 (k)的子帶功率的規(guī)定范圍設(shè)定為F2I^k〈F2H。在此，因?yàn)橛斜匾沟谝活l譜的動(dòng)態(tài)范圍接近第二頻譜的高頻頻譜的動(dòng)態(tài)范圍，所以設(shè)定F2L以滿足FI^F2L〈F2H。而且，沒(méi)有必要使對(duì)應(yīng)于第二頻譜的子帶的數(shù)量與第一頻譜的子帶的數(shù)量N相一致。不過(guò)，設(shè) 定第二頻語(yǔ)的子帶數(shù)使第一頻語(yǔ)的子帶寬與第二頻語(yǔ)的子帶寬基本一致。
搜索單元125通過(guò)搜索來(lái)確定第一頻譜的子帶的方差cj12 (j )，使第一頻譜的子帶的方差dl2 (j)與第二頻譜的子帶的方差cj22 (j)最為接近。具體來(lái)講，搜索單元125對(duì)所有的變形候補(bǔ)03<1計(jì)算出第一頻譜的子帶的方差 al2(j),將該計(jì)算值與第二頻譜的子帶的方差cj22 (j)相比較，確定兩者最為接近時(shí)的j的值(最優(yōu)變形信息jopt),并將該jopt輸出到頻譜變形單元112 的外部以及變形單元128。
變形單元128生成對(duì)應(yīng)于該最優(yōu)變形信息jopt的經(jīng)變形的第一頻譜Sl， (jopt, k)，并將其輸出到頻譜變形單元112的外部。將最優(yōu)變形信息jopt 傳輸?shù)綇?fù)用單元115,并傳輸經(jīng)變形的第一頻譜S1， (jopt， k)到擴(kuò)展頻帶頻譜編碼單元114。
圖6是表示上述變形單元122內(nèi)部的主要結(jié)構(gòu)的方框圖。而且，變形單元128的內(nèi)部結(jié)構(gòu)基本上與變形單元122相同。
正號(hào)/負(fù)號(hào)提取單元131求出第一頻譜的各個(gè)子帶的符號(hào)信息sign (k)，并輸出到正號(hào)/負(fù)號(hào)賦予單元134。
絕對(duì)值計(jì)算單元132對(duì)第一頻譜的各個(gè)子帶計(jì)算振幅的絕對(duì)值，并將該值提供給指數(shù)值計(jì)算單元133。
指數(shù)變量表格135記錄用于第一頻譜的變形的指數(shù)變量a(j )。包含于該表格的變量中的j所對(duì)應(yīng)的值從指數(shù)變量表格135輸出。具體來(lái)講，在指數(shù) 變量表格135中，譬如記錄著由4個(gè)指數(shù)變量組成的指數(shù)變量候補(bǔ)，即指數(shù) 變量a(j) = U.0, 0.8， 0.6, 0.4}，根據(jù)由搜索單元125指定的索引j，選擇其中i個(gè)指數(shù)變量a (j),并提供給指數(shù)值計(jì)算單元133。
指數(shù)值計(jì)算單元133利用從指數(shù)變量表格135輸出的指數(shù)變量，計(jì)算從絕對(duì)值計(jì)算單元132輸出的頻諳(絕對(duì)值)的指數(shù)值，也就是計(jì)算出對(duì)各個(gè) 子帶的振幅絕對(duì)值進(jìn)行a (j)次乘冪所得的值。正號(hào)/負(fù)號(hào)賦予單元134，對(duì)指數(shù)值計(jì)算單元133輸出的指數(shù)值，賦予通過(guò)正號(hào)/負(fù)號(hào)提取單元131于先前求出的符號(hào)信息sign (k),作為變形第一頻
語(yǔ)sr(j, k)輸出。
因此，由變形單元122輸出的變形第一頻譜Sl，(j， k)如下式(式8)表示。
<formula>formula see original document page 11</formula> (式8 )
例子的圖。
這里，以取指數(shù)變量a(j) = U.O， 0.6， 0.2}的情形為例進(jìn)行說(shuō)明。另外，在此為了容易地比較各個(gè)頻譜，將a(j) = 1.0時(shí)的頻譜S71向上移動(dòng)了 40dB，將a(j) =0.6時(shí)的頻譜S72向上移動(dòng)了 20dB。從該圖可以得知，通過(guò)指數(shù)變量a (j)能夠改變頻譜的動(dòng)態(tài)范圍。
如上所述，根據(jù)本實(shí)施方式的編碼裝置(頻譜編碼單元106)，使用通過(guò)第一信號(hào)(0^k<FL)求出的第一頻譜，估計(jì)第二信號(hào)(0^k<FH)求出的第二頻譜的高頻部分(FI^k<FH)，并對(duì)估計(jì)信息進(jìn)行編碼時(shí)，不直接使用第一頻譜而是對(duì)第一頻譜施加變形后再進(jìn)行上述估計(jì)。此時(shí)，將表示如何進(jìn)行變形的信息(變形信息)也一并進(jìn)行編碼，傳輸?shù)浇獯a端。
對(duì)第一頻譜施加變形的具體方法為，將第一頻譜分割成子帶，對(duì)每個(gè)子
譜變形以使對(duì)這些平均振幅進(jìn)行統(tǒng)計(jì)處理而求出的方差與根據(jù)第二頻譜的高頻部分的頻譜同樣求出的子帶平均振幅的方差最為接近。也就是，將第一頻譜變形以使第一頻譜的絕對(duì)振幅的平均擺動(dòng)范圍與第二頻譜的高頻頻譜的絕對(duì)振幅的平均擺動(dòng)范圍成為相等的值。而且，對(duì)表示該具體的變形方法的變形信息進(jìn)行編碼。另外，也可以利用包含于各個(gè)子帶的頻語(yǔ)的功率來(lái)代替子帶平均振幅。
進(jìn)一步具體地說(shuō)，上述具體的變形方法就是通過(guò)對(duì)第一頻譜的頻語(yǔ)進(jìn)行a乘冪(0^c^1),來(lái)控制子帶內(nèi)的頻譜的絕對(duì)振幅的偏差(擺動(dòng))。而且，將有關(guān)所使用的a的信息傳輸?shù)浇獯a端。
通過(guò)采用上述結(jié)構(gòu)，即使當(dāng)?shù)?一頻譜的動(dòng)態(tài)范圍與第二頻譜的高頻部分的動(dòng)態(tài)范圍大小不同時(shí)，也能夠恰當(dāng)?shù)卣{(diào)整估計(jì)頻譜的動(dòng)態(tài)范圍，由此提高解碼信號(hào)的主觀質(zhì)量。
另外，在上述的結(jié)構(gòu)中，通過(guò)將第一頻譜整體進(jìn)行a乘冪(O^c^l )，對(duì)
頻譜的振幅施加一致性限制。由此能夠鈍化銳利(陵哨)的譜峰。另外，譬如只是對(duì)預(yù)定值以上的譜峰進(jìn)行消峰而變形時(shí)，有可能導(dǎo)致頻譜變得不連續(xù)而產(chǎn)生奇怪的噪聲，但是通過(guò)采用上述的結(jié)構(gòu)，則能夠使頻譜變得平滑而防止發(fā)生奇怪的噪聲。
另外，在本實(shí)施方式中，以作為表示頻譜的絕對(duì)振幅的偏差的程度(擺動(dòng)幅度)的指標(biāo)使用方差時(shí)的情形為例進(jìn)行了說(shuō)明，但本發(fā)明并不只限于此，譬如也可以適用標(biāo)準(zhǔn)偏差等其他的指標(biāo)。
另外，在本實(shí)施方式中，以在編碼裝置100的變形單元122 (或變形單元128)中使用指數(shù)函數(shù)的情形為例進(jìn)行了說(shuō)明，但是也可以使用以下示出的方法。
圖8是表示變形單元的其他變化形式(變形單元122a)的結(jié)構(gòu)的方框圖。對(duì)于與變形單元122 (或變形單元128)相同的構(gòu)成要素賦予相同的編號(hào)，并省略其說(shuō)明。
在上述的變形單元122 (或變形單元128)中，因?yàn)槭褂弥笖?shù)函數(shù)，所以計(jì)算量具有變大的趨勢(shì)。于是，通過(guò)不使用指數(shù)函數(shù)而變化頻譜的動(dòng)態(tài)范圍
的方法來(lái)避免計(jì)算量的增加。
絕對(duì)值計(jì)算單元132計(jì)算輸入的第一頻譜S1 (k)的各個(gè)頻譜的絕對(duì)值，并將其輸出到平均值計(jì)算單元142以及變形頻譜計(jì)算單元143。平均值計(jì)算單元142按照下式(式9)來(lái)計(jì)算頻鐠的絕對(duì)值的平均值Slmean。
<formula>formula see original document page 12</formula> (式9)
乘數(shù)表格144中記錄著用于變形頻語(yǔ)計(jì)算單元143的乘數(shù)的候補(bǔ)，基于搜索單元125指定的索引選擇一個(gè)乘數(shù)，并輸出到變形頻譜計(jì)算單元143。在此，假設(shè)乘數(shù)表格中記錄著乘數(shù)g (j) = U.O， .0.9， 0.8， 0.7}的4個(gè)候補(bǔ)。
變形頻譜計(jì)算單元143利用由絕對(duì)值計(jì)算單元132輸出的第一頻譜的絕對(duì)值與由乘數(shù)表格144輸出的乘數(shù)g(j)，將變形頻譜S1， (k)的絕對(duì)值通過(guò)下式(式10)計(jì)算出來(lái)，并輸出到正號(hào)/負(fù)號(hào)賦予單元134。
|Sl'a^ = g(J.).|Sl(A)| + (l —(式10)(k)賦予由變形頻譜計(jì)算單元143輸出的變形頻譜S1， (k)的絕對(duì)值，生成
并輸出由下式(式ii)表示的最后的變形頻譜sr (k)。
wca)"一(A:).lsi'ca)i (式ii)
另外，在本實(shí)施方式，以變形單元包括正號(hào)/負(fù)號(hào)提取單元、絕對(duì)值計(jì)算單元、正號(hào)/負(fù)號(hào)賦予單元的情形為例進(jìn)行了說(shuō)明，但當(dāng)輸入的頻譜恒定為正時(shí)，不需要這些結(jié)構(gòu)。
接下來(lái)，詳細(xì)說(shuō)明分層解碼裝置150的結(jié)構(gòu)，該解碼裝置能夠?qū)τ缮鲜龇謱泳幋a裝置100生成的編碼符號(hào)進(jìn)行解碼。
圖9是表示本實(shí)施方式的分層解碼裝置150的主要結(jié)構(gòu)的方框圖。分離單元151對(duì)輸入的編碼符號(hào)進(jìn)行分離處理，并生成用于第一層解碼單元152的編碼符號(hào)S51與用于頻語(yǔ)解碼單元153的編碼符號(hào)S52。第一層解碼單元152利用通過(guò)分離單元151得到的編碼符號(hào)解碼出信號(hào)頻帶0^k<FL的解碼信號(hào)，并將該解碼信號(hào)S53提供給頻語(yǔ)解碼單元153。另外，第一層解碼單元152的輸出同時(shí)連接于解碼裝置150的輸出端子。由此，當(dāng)需要輸出由第一層解碼單元152生成的第一層解碼信號(hào)時(shí)，可以經(jīng)由該輸出端子輸出。
由分離單元151分離出的編碼符號(hào)S52與由第一層解碼單元152輸出的第一層解碼信號(hào)S53提供給頻譜解碼單元153。頻譜解碼單元153進(jìn)行后述的頻譜解碼，生成信號(hào)頻帶0^k〈FH的寬帶解碼信號(hào)，并將其輸出。在頻譜解碼單元153中，將由第一層解碼單元152提供的第一層解碼信號(hào)S53作為第一信號(hào)并進(jìn)行處理。
圖IO是表示上述頻譜解碼單元153內(nèi)部的主要結(jié)構(gòu)的方框圖。
該頻譜解碼單元153輸入編碼符號(hào)S52以及第一層解碼信號(hào)S53 (有效頻域?yàn)?^k<FL的第一信號(hào))。
分離單元161從輸入的編碼符號(hào)S52中，將由上述的編碼端的頻譜變形單元112生成的變形信息與擴(kuò)展頻帶頻譜編碼信息分離開(kāi)來(lái)，將變形信息輸出到變形單元162，將擴(kuò)展頻帶頻譜編碼信息輸出到擴(kuò)展頻帶頻語(yǔ)生成單元163。
頻域變換單元164對(duì)輸入的時(shí)域信號(hào)的第一層解碼信號(hào)S53進(jìn)行頻率變換而計(jì)算第一頻諳S1 (k)。該頻率變換的方法使用離散傅立葉變換(DFT)、離散余弦變換(DCT)以及變形離散余弦變換(MDCT)等。
變形單元162基于由分離單元161提供的變形信息，對(duì)由頻域變換單元164提供的第一頻譜S1 (k)施加變形來(lái)生成變形第一頻譜S1， (k)。另外，該變形單元162內(nèi)部的結(jié)構(gòu)與業(yè)已說(shuō)明的編碼端的變形單元122 (參照?qǐng)D6)一樣，因此省略對(duì)其iJL明。
擴(kuò)展頻帶頻語(yǔ)生成單元163，利用變形后的第一頻譜S1， (k),生成應(yīng)當(dāng)包含于第一頻譜S1 (k)的擴(kuò)展頻帶FI^k〈FH的第二頻譜的估計(jì)值S2" (k)，并將該第二頻i普的估計(jì)值S2" (k)提供給頻譜構(gòu)成單元165。
頻譜構(gòu)成單元165將由頻域變換單元164提供的第一頻譜S1 (k)與由擴(kuò)展頻帶頻譜生成單元163提供的第二頻譜的估計(jì)值S2" (k)結(jié)合起來(lái)生成解碼頻語(yǔ)S3 (k)。該解碼頻譜S3 (k)如下式(式12)所示。
該解碼頻譜S3 (k)提供給時(shí)域變換單元166。
時(shí)域變換單元166將在解碼頻譜S3 (k)被變換為時(shí)域信號(hào)后，根據(jù)需要進(jìn)行開(kāi)窗(windowing)以及疊力。(superposition addition )等處理，以避免在幀之間發(fā)生不連續(xù)的現(xiàn)象，并輸出最后的解碼信號(hào)。
如上所述，根據(jù)本實(shí)施方式的解碼裝置(頻語(yǔ)解碼單元153),能夠?qū)τ杀緦?shí)施方式的編碼裝置編碼的信號(hào)進(jìn)行解碼。(實(shí)施方式2)
在本發(fā)明的實(shí)施方式2中，利用作為內(nèi)部狀態(tài)持有第一頻譜的音調(diào)濾波器來(lái)估計(jì)第二頻譜，并對(duì)該音調(diào)濾波器的特性進(jìn)行編碼。
本實(shí)施方式的分層編碼裝置的結(jié)構(gòu)與實(shí)施方式1所示的分層編碼裝置相同，因此利用圖11的方框圖來(lái)說(shuō)明結(jié)構(gòu)的不同之處，即頻語(yǔ)編碼單元201。并且，對(duì)于與實(shí)施方式1所示的頻譜編碼單元106 (參照?qǐng)D4)相同的構(gòu)成要素賦予相同的編號(hào)，并省略對(duì)其說(shuō)明。
內(nèi)部狀態(tài)設(shè)定單元203使用通過(guò)頻譜變形單元112生成的變形第一頻譜Sl, (k)來(lái)設(shè)定用于濾波單元204的內(nèi)部狀態(tài)S (k)。
濾波單元204基于由內(nèi)部狀態(tài)設(shè)定單元203設(shè)定的內(nèi)部狀態(tài)S (k)與由延遲系數(shù)設(shè)定單元206提供的延遲系數(shù)T來(lái)進(jìn)行濾波，而計(jì)算出第二頻譜的
(式12)估計(jì)值S2"(k)。另外，本實(shí)施方式對(duì)使用通過(guò)下式(式13)表示的濾波器的情形進(jìn)行說(shuō)明。<formula>formula see original document page 15</formula>
在此，T表示為由延遲系數(shù)設(shè)定單元206提供的系數(shù)，而假設(shè)M-1。如下式(式14 )所示，濾波單元204的濾波處理通過(guò)主要使用按照升序以降低了頻率T的頻譜為中心乘上相應(yīng)的系數(shù)&并進(jìn)行相加，來(lái)計(jì)算出估計(jì)值。
<formula>formula see original document page 15</formula>
按照該式的處理在FI^k〈FH的范圍內(nèi)進(jìn)行。在此，S(k)表示濾波器的內(nèi)部狀態(tài)。此時(shí)，計(jì)算出的S (k)(其中FI^k<FH)作為第二頻譜的估計(jì)值S2" (k)使用。
搜索單元205計(jì)算由頻域變換單元113提供的第二頻譜S2 (k)與由濾波單元204提供的第二頻譜的估計(jì)值S2" (k)的相似程度。
另外，該相似程度存在各種各樣的定義，但是在本實(shí)施方式中，使用以下的相似程度首先將濾波器系數(shù)(^以及(3,視為0，基于最小平方差(aminimum square error)所定義的、按照下式(式15 )來(lái)計(jì)算出的相似程度。<formula>formula see original document page 15</formula>
根據(jù)該方法，在計(jì)算出最優(yōu)的延遲系數(shù)T之后確定濾波器系數(shù)Pi。在此E表示S2 (k)與S2" (k)之間的最小平方差。另外，上式(式15)的右邊第一項(xiàng)為與延遲系數(shù)T無(wú)關(guān)的固定值，因此能夠搜索出生成使(式15)的右邊第二項(xiàng)為最大的S2" (k)的時(shí)延遲系數(shù)T。本實(shí)施方式中，將(式15)的右邊第二項(xiàng)稱為相似程度。
延遲系數(shù)設(shè)定單元206將包含于預(yù)先規(guī)定的搜索范圍TMIN ~ TMAX的延遲系數(shù)T依次輸出到濾波單元204。因此，在濾波單元204中，當(dāng)每次由延遲系數(shù)設(shè)定單元206提供延遲系數(shù)T時(shí)，都在具有FI^k<FH的范圍的S( k )歸零后進(jìn)行濾波，而搜索單元205則每次都計(jì)算出相似程度。搜索單元205從TMIN ~ TMAX的范圍中確定使計(jì)算出的相似程度為最大時(shí)的系數(shù)Tmax，將該系數(shù)Tmax提供給濾波器系數(shù)計(jì)算單元207、頻譜輪廓編碼單元208以及復(fù)用單元115。
濾波器系數(shù)計(jì)算單元207利用由搜索單元205提供的系數(shù)Tmax求出濾波器系數(shù)Pi。在此，所求濾波器系數(shù)Pi使按照下式(式16)的平方差E成為最小。
ot-i/i v
￡=s ^w-ZA雄-r讓-'
*=fz\ '=-1 乂
(式16)
濾波器系數(shù)計(jì)算單元207將多個(gè)Pi的組合預(yù)先作為表格來(lái)持有，確定使上式(式16)的平方差E成為最小的Pi的組合，將該編碼輸出到復(fù)用單元115，并將濾波器系數(shù)Pi提供給頻譜輪廓編碼單元208。
頻譜輪廓編碼單元208利用由內(nèi)部狀態(tài)設(shè)定單元203提供的內(nèi)部狀態(tài)S(k )、由搜索單元205提供的延遲系數(shù)Tmax以及由濾波器系數(shù)計(jì)算單元207提供的濾波器系數(shù)l3i，進(jìn)行濾波處理，求出頻帶為FI^k〈FH的第二頻譜的估計(jì)值S2" ( k )。接下來(lái)，頻譜輪廓編碼單元208利用第二頻譜的估計(jì)值S2"(k)和第二頻譜S2 (k)對(duì)頻譜輪廓的調(diào)整系數(shù)進(jìn)行編碼。
在本實(shí)施方式中，說(shuō)明了將該頻譜輪廓信息用每個(gè)子帶的頻鐠功率來(lái)表示的情形。此時(shí)、第j個(gè)子帶的頻譜功率如下式(式17)所示。
W)=藝S2財(cái) (式17)
在此，BL (j)表示第j個(gè)子帶的最小頻率，BH (j)表示第j個(gè)子帶的最大頻率。視如此求出的第二頻語(yǔ)的子帶的頻譜功率為第二頻譜的頻率輪廓信息。
同樣，頻譜輪廓編碼單元208按照下式(式18 )計(jì)算第二頻i普的估計(jì)值S2" (k)的子帶的頻譜功率B" (j),并按照下式(式19)計(jì)算每個(gè)子帶的變化量V (j)。
斷乂) ，"
藝S"2(A;)2 (式18)耶
(式19)
接下來(lái)，頻譜輪廓編碼單元208對(duì)變化量V (j)進(jìn)行編碼并將該編碼送到復(fù)用單元115。
復(fù)用單元115將以下的信息復(fù)用并輸出由頻譜變形單元112得到的變形信息；由搜索單元205得到的最優(yōu)延遲系數(shù)Tmax的信息；由濾波器系數(shù)計(jì)算單元207得到的濾波器系數(shù)的信息；由頻鐠輪廓編碼單元208得到的頻譜輪廓調(diào)整系數(shù)的信息。
如上所述，根據(jù)本發(fā)明的實(shí)施方式，利用具有作為內(nèi)部狀態(tài)的第一頻譜的音調(diào)濾波器來(lái)估計(jì)第二頻譜，因此只需要對(duì)該音調(diào)濾波器的特性進(jìn)行編碼，就能夠?qū)崿F(xiàn)低比特率。
在本實(shí)施方式中，雖然說(shuō)明了包括頻域變換單元的情形，但是這些結(jié)構(gòu)為將時(shí)域作為輸入時(shí)所需的結(jié)構(gòu)，當(dāng)直接輸入頻鐠時(shí)，則無(wú)需頻域變換單元。
另外，本實(shí)施方式雖然在上述(式13)中以M= 1的情形為例進(jìn)行了說(shuō)明，但是M的值不只限定為l,可以使用O以上的整數(shù)。
另外，本實(shí)施方式雖然以音調(diào)濾波器利用上述(式13)的濾波器函數(shù)(傳遞函數(shù))的情形為例進(jìn)行了說(shuō)明，但是音調(diào)濾波器也可以為一次的音調(diào)濾波
圖12是表示實(shí)施方式的頻鐠編碼單元201的其它變化形式(頻譜編碼單元201a)的結(jié)構(gòu)的方框圖。并且，對(duì)于與頻譜編碼單元201相同的構(gòu)成要素賦予相同的編號(hào)，并省略對(duì)其說(shuō)明。
用于濾波單元204的濾波器如下式(式20) —樣簡(jiǎn)略。
該式為上述(式13)中，取M-O、 &=1時(shí)的濾波器函數(shù)。通過(guò)該濾波器生成的第二頻譜的估計(jì)值S2" (k)可以利用下式(式21 )，將離開(kāi)T的內(nèi)部狀態(tài)S (k)的低頻頻譜依次復(fù)制而求出。
另外，搜索單元205與上述同樣地搜索使上述(式15)成為最小的系數(shù)
尸(z)
(式20)
(式21)T而確定最優(yōu)的系數(shù)Tmax。如此求出的系數(shù)Tmax提供給復(fù)用單元115 。
通過(guò)采用上述結(jié)構(gòu)，用于濾波單元204的濾波器的結(jié)構(gòu)可以變得簡(jiǎn)便，并無(wú)需濾波器系數(shù)計(jì)算單元207，因此通過(guò)較少的計(jì)算量來(lái)進(jìn)行第二頻譜的估計(jì)。也就是，根據(jù)該結(jié)構(gòu)，編碼裝置的結(jié)構(gòu)變得簡(jiǎn)便，因此能夠減少編碼處理的計(jì)算量。
接下來(lái)，詳細(xì)說(shuō)明解碼端的頻譜解碼單元251的結(jié)構(gòu)，該頻譜解碼單元能夠?qū)τ缮鲜鲱l譜編碼單元201 (或頻譜編碼單元201a)生成的編碼符號(hào)進(jìn)行解碼。
圖13是表示本實(shí)施方式的頻譜解碼單元251的主要結(jié)構(gòu)的方框圖。并且，該頻譜解碼單元251具有與實(shí)施方式1所示的頻譜解碼單元153(參照?qǐng)D10)相同的基本結(jié)構(gòu)，對(duì)于相同的構(gòu)成要素賦予相同的編號(hào)，并省略對(duì)其說(shuō)明。不同之處在于擴(kuò)展頻帶頻譜生成單元163a的內(nèi)部結(jié)構(gòu)。
(k)來(lái)設(shè)定用于濾波單元253的濾波器的內(nèi)部狀態(tài)S (k)。
濾波單元253才艮據(jù)由編碼端的頻譜編碼單元201 (201a)生成的編碼符號(hào)，經(jīng)由分離單元161而得到有關(guān)濾波器的信息。具體來(lái)講，使用頻譜編碼單元201時(shí)，得到延遲系數(shù)Tmax以及濾波器系數(shù)(3;;使用頻譜編碼單元201a時(shí)，只得到延遲系數(shù)Tmax。而且，濾波單元253將由變形單元162生成的變形第一頻語(yǔ)S1， (k)作為濾波器的內(nèi)部狀態(tài)S (k),基于得到的濾波器信息進(jìn)行濾波而計(jì)算出解碼頻語(yǔ)S" (k)。該濾波方法有賴于編碼端的頻譜編碼單元201 (201a)所用的濾波器函數(shù)，使用頻譜編碼單元201時(shí)，在解碼端也按照上述(式13 )來(lái)進(jìn)行濾波，而使用頻譜編碼單元201a時(shí)，在解碼端也按照上述(式20)來(lái)進(jìn)行濾波。
頻譜輪廓解碼單元254基于由分離單元161提供的頻譜輪廓信息來(lái)解碼頻譜輪廓信息。本實(shí)施方式以使用每個(gè)子帶的變化量的量化值Vq (j)的情形為例來(lái)說(shuō)明。
頻譜調(diào)整單元255在由濾波單元253得到的解碼頻譜S" (k)上，按照下式(式22)乘上由頻譜輪廓解碼單元254得到的每個(gè)子帶的變化量的量化值Vq (j )，由此調(diào)整頻譜S" ( k )的頻域FI^k<FH的頻譜形狀，而生成第二頻譜的估計(jì)值S2" (k)。S"2(" = S'' (A). F《(7) " S B//(/), "http://力 (式22 )
在此，BL (j)以及BH (j)分別表示第j個(gè)子帶的最小頻率、最大頻率。將按照上述(式22 )計(jì)算出的第二頻譜的估計(jì)值S2" ( k)提供給頻譜構(gòu)成單元165。
頻譜構(gòu)成單元165如在實(shí)施方式1所述，將第一頻譜S1 (k)與第二頻譜的估計(jì)值S2" (k)結(jié)合起來(lái)生成解碼頻譜S3 (k)，并提供給時(shí)域變換單元 166。
如上所述，根據(jù)本實(shí)施方式的解碼裝置(頻譜解碼單元251)，能夠?qū)τ?本實(shí)施方式的編碼裝置編碼的信號(hào)進(jìn)行解碼。 (實(shí)施方式3)
圖14是表示本發(fā)明實(shí)施方式3的頻譜編碼單元的主要結(jié)構(gòu)的方框圖。在圖14中，與圖4具有相同名稱以及相同編號(hào)的模塊具有相同的功能，因此省略對(duì)其說(shuō)明。在本實(shí)施方式3中，基于編碼端、解碼端共用的信息來(lái)調(diào)整頻譜的動(dòng)態(tài)范圍。因此，無(wú)需輸出表示調(diào)整頻譜的動(dòng)態(tài)范圍的動(dòng)態(tài)范圍系數(shù)的編碼符號(hào)。因?yàn)闊o(wú)需輸出將表示調(diào)整頻譜的動(dòng)態(tài)范圍的動(dòng)態(tài)范圍系數(shù)的編碼符號(hào)，所以能夠降#^匕特率。
圖14中的頻譜編碼單元301在頻域變換單元111與擴(kuò)展頻帶頻譜編碼單元114之間，具有動(dòng)態(tài)范圍計(jì)算單元302、變形信息估計(jì)單元303以及變形單元304來(lái)代替圖4中的頻譜變形單元112。實(shí)施方式1中的頻譜變形單元 112將第一頻譜Sl(k)進(jìn)行各種各樣的變形來(lái)改變第一頻譜的動(dòng)態(tài)范圍，從而調(diào)查作為恰當(dāng)?shù)膭?dòng)態(tài)范圍的變形方法，并將該變形信息進(jìn)行編碼且輸出。另一方面，本實(shí)施方式3則基于編碼端以及解碼端共用的信息來(lái)進(jìn)行該變形信息的估計(jì)，并根據(jù)該估計(jì)變形信息來(lái)進(jìn)行第一頻譜Sl(k)的變形。
因此，本實(shí)施方式3具有動(dòng)態(tài)范圍計(jì)算單元302、變形信息估計(jì)單元303 以及根據(jù)該估計(jì)變形信息來(lái)進(jìn)行第一頻譜S1 (k)變形的變形單元304來(lái)代替頻譜變形單元112。另外，變形信息通過(guò)在頻譜編碼單元以及頻譜解碼單元的內(nèi)部分別進(jìn)行的估計(jì)而求出，無(wú)需由頻譜編碼單元301將變形信息作為編碼符號(hào)輸出，因此無(wú)需在圖4的頻譜編碼單元106中設(shè)置的復(fù)用單元115。
由頻域變換單元111輸出第一頻譜Sl( k )，提供給動(dòng)態(tài)范圍計(jì)算單元302 以及變形單元304。動(dòng)態(tài)范圍計(jì)算單元302將第一頻譜S1 (k)的動(dòng)態(tài)范圍量化，并將其結(jié)果作為動(dòng)態(tài)范圍信息輸出。與實(shí)施方式l同樣，量化動(dòng)態(tài)范圍的方法將第一頻譜的頻域分割成多個(gè)子帶，求出規(guī)定范圍的子帶的功率(子帶功率)，計(jì)算出該子帶功率的方差，并將該方差作為動(dòng)態(tài)范圍信息輸出。
接下來(lái)，使用圖15說(shuō)明變形信息估計(jì)單元303。變形信息估計(jì)單元303 從由動(dòng)態(tài)范圍計(jì)算單元302輸入動(dòng)態(tài)范圍信息，并提供給切換單元305。切換單元305基于所述動(dòng)態(tài)范圍信息，從存儲(chǔ)于變形信息表格306的估計(jì)變形信息的候補(bǔ)中選擇1個(gè)估計(jì)變形信息并輸出。變形信息表格306中記錄著取 0~ 1之間的值的多個(gè)估計(jì)變形信息的候補(bǔ)，這些候補(bǔ)通過(guò)學(xué)習(xí)而預(yù)先確定，以對(duì)應(yīng)于動(dòng)態(tài)范圍信息。
圖16是表示變形單元304的主要結(jié)構(gòu)的方框圖。與圖6具有相同名稱以及相同編號(hào)的模塊具有相同的功能，因此省略對(duì)其說(shuō)明。圖16的變形單元 304中的指數(shù)值計(jì)算單元307按照由變形信息估計(jì)單元303提供的估計(jì)變形信息(取0 ~ 1之間的值)，將由絕對(duì)值計(jì)算單元132輸出的頻譜的絕對(duì)振幅的指數(shù)值，即通過(guò)估計(jì)變形信息進(jìn)行乘冪的值，輸出到正號(hào)/負(fù)號(hào)賦予單元 134。正號(hào)/負(fù)號(hào)賦予單元134,對(duì)指數(shù)值計(jì)算單元307輸出的指數(shù)值，賦予通過(guò)正號(hào)/負(fù)號(hào)提取單元131于先前求出的符號(hào)信息，作為變形第一頻譜輸出。
如上所述，根據(jù)本實(shí)施方式的編碼裝置(頻譜編碼單元301 )，使用通過(guò) 第一信號(hào)求出的第一頻譜(0^k<FL),估計(jì)從第二信號(hào)求出的第二頻譜 (0^k<FH)的高頻部分(FI^k<FH)，并將估計(jì)信息進(jìn)行編碼時(shí)，不直接使用第一頻譜而是對(duì)第一頻譜施加變形后再進(jìn)行上述估計(jì)，由此能夠恰當(dāng)?shù)卣{(diào) 整估計(jì)頻譜的動(dòng)態(tài)范圍來(lái)提高解碼信號(hào)的主觀質(zhì)量。此時(shí)，對(duì)于表示如何進(jìn) 行變形的信息(變形信息)，因?yàn)榛谠诮獯a端、編碼端共用的信息(本實(shí)施方式中為第一頻譜)來(lái)確定變形信息，所以無(wú)需將有關(guān)變形信息的編碼符號(hào) 傳輸?shù)浇獯a裝置，因此能夠降低比特率。
另外，變形信息估計(jì)單元303中，也可以使用將第一頻譜的動(dòng)態(tài)范圍信息作為輸入值，將估計(jì)變形信息作為輸出值的映射函數(shù)，來(lái)代替利用變形信息表格306而建立第一頻譜的動(dòng)態(tài)范圍信息與估計(jì)變形信息的對(duì)應(yīng)關(guān)系。此時(shí)，作為函數(shù)輸出值的估計(jì)變形信息限定取0 1之間的值。
圖17是表示本實(shí)施方式3的頻譜解碼單元353的主要結(jié)構(gòu)的方框圖。在該結(jié)構(gòu)中，與圖IO具有相同名稱以及相同編號(hào)的模塊具有相同的功能，因此省略對(duì)其說(shuō)明。在頻域變換單元164與擴(kuò)展頻帶頻譜生成單元163之間，具有動(dòng)態(tài)范圍計(jì)算單元361、變形信息估計(jì)單元362以及變形單元363。圖10 中的變形單元162輸入由編碼端的頻譜變形單元112生成的變形信息，并基于該變形信息對(duì)由頻域變換單元164提供的第一頻譜S1 (k)施加變形。相對(duì)于此，本實(shí)施方式3則與上述頻譜編碼單元301相同基于編碼端以及解碼端的共用的信息來(lái)進(jìn)行該變形信息的估計(jì)，并根據(jù)該估計(jì)變形信息來(lái)進(jìn)行第一頻譜S1 (k)的變形。
因此，本實(shí)施方式3具有動(dòng)態(tài)范圍計(jì)算單元361、變形信息估計(jì)單元362 以及變形單元363。另外，與上述頻譜編碼單元301相同，變形信息通過(guò)在頻諳解碼單元的內(nèi)部進(jìn)行的估計(jì)而求出，輸入的編碼符號(hào)中未包含變形信息，因此無(wú)需圖10中的設(shè)置于頻譜解碼單元153的分離單元161。
由頻域變換單元164輸出第一頻鐠Sl(k)，提供給動(dòng)態(tài)范圍計(jì)算單元361 以及變形單元363。有關(guān)動(dòng)態(tài)范圍計(jì)算單元361、變形信息估計(jì)單元362以及變形單元363的接下來(lái)的操作，與業(yè)已說(shuō)明的編碼端的頻譜編碼單元301(參照?qǐng)D14)內(nèi)的動(dòng)態(tài)范圍計(jì)算單元302、變形信息估計(jì)單元303以及變形單元 304相同，因此省略對(duì)其說(shuō)明。另外，變形信息估計(jì)單元362中的變形信息表格記錄著與頻譜編碼單元301中的變形信息估計(jì)單元303中的變形信息表格306相同的估計(jì)變形信息的候補(bǔ)。
另外，有關(guān)擴(kuò)展頻帶頻譜生成單元163、頻譜構(gòu)成單元165以及時(shí)域變換單元166的操作與實(shí)施方式1的圖IO示意的相同，省略對(duì)其說(shuō)明。
如上所述，根據(jù)本實(shí)施方式的解碼裝置(頻語(yǔ)解碼單元353 )，能夠?qū)τ?本實(shí)施方式的編碼裝置編碼的信號(hào)進(jìn)行解碼，由此能夠恰當(dāng)?shù)卣{(diào)整估計(jì)頻譜的動(dòng)態(tài)范圍來(lái)提高解碼信號(hào)的主觀質(zhì)量。
另外，本實(shí)施方式中，估計(jì)變形信息通過(guò)變形信息估計(jì)單元303求出，但是也可以將該估計(jì)變形信息適用于實(shí)施方式1的圖4示意的頻譜編碼單元 106，并將該估計(jì)變形信息提供給頻語(yǔ)變形單元112,頻鐠變形單元112將由變形信息估計(jì)單元303提供的估計(jì)變形信息作為基準(zhǔn)，將其附近的變形信息從指數(shù)變量表格135中選擇出來(lái)，并從該限定的變形信息中通過(guò)搜索單元125 確定最恰當(dāng)?shù)淖冃涡畔?。在該結(jié)構(gòu)中，最終所選^^的變形信息的編碼符號(hào)表示為對(duì)于作為上述基準(zhǔn)的估計(jì)變形信息的相對(duì)值。如此能將正確的變形信息進(jìn)行編碼并向解碼單元傳輸，因此能夠得到維持解碼信號(hào)的主觀質(zhì)量并減少表示變形信息的比特?cái)?shù)的效果。(實(shí)施方式4)
本發(fā)明的實(shí)施方式4中，基于有第一層編碼單元4是供的音調(diào)增益，確定輸出給頻譜編碼單元內(nèi)的變形單元的估計(jì)變形信息。
圖18是表示本實(shí)施方式的分層編碼裝置400的主要結(jié)構(gòu)的方框圖。在圖 18中，與圖3具有相同名稱以及相同編號(hào)的模塊具有相同的功能，因此省略對(duì)其il明。
本實(shí)施方式4中的分層編碼裝置400，將由第一層編碼單元402求出的音調(diào)增益提供給頻譜編碼單元406。具體來(lái)講，在第一層編碼單元402中，在由第一層編碼單元402固有的自適應(yīng)碼本(圖中未示出)輸出的自適應(yīng)碼矢量上所乘的自適應(yīng)碼矢量增益，作為音調(diào)增益輸出，并輸入給頻譜編碼單元406。該自適應(yīng)碼矢量增益具有當(dāng)輸入信號(hào)的周期性強(qiáng)時(shí)取大值，當(dāng)輸入信號(hào)的周期性弱時(shí)取小值的特點(diǎn)。圖19是表示本實(shí)施方式4的頻譜編碼裝置406的主要結(jié)構(gòu)的方框圖。在圖19中，與圖14具有相同名稱以及相同編號(hào)的模塊具有相同的功能，因此省略對(duì)其說(shuō)明。變形信息估計(jì)單元411使用由第一層編碼單元402提供的音調(diào)增益來(lái)輸出估計(jì)變形信息。變形信息估計(jì) 單元411具有上述圖15的變形信息估計(jì)單元303相同的結(jié)構(gòu)。不過(guò)，變形信息表格是對(duì)應(yīng)音調(diào)增益而設(shè)計(jì)的。另外，在本實(shí)施方式中，也可以采用利用映射函數(shù)的結(jié)構(gòu)來(lái)代替利用變形信息表格的結(jié)構(gòu)。
如上所述，根據(jù)本實(shí)施方式的編碼裝置(頻鐠編碼單元406),能夠考慮輸入信號(hào)的周期性而恰當(dāng)?shù)卣{(diào)整估計(jì)頻譜的動(dòng)態(tài)范圍，來(lái)提高解碼信號(hào)的主觀質(zhì)量。
接下來(lái)，詳細(xì)說(shuō)明分層解碼裝置450的結(jié)構(gòu)，該解碼裝置能夠?qū)τ缮鲜?分層編碼裝置400生成的編碼符號(hào)進(jìn)行解碼。
圖20是表示本實(shí)施方式的分層解碼裝置450的主要結(jié)構(gòu)的方框圖。在圖 20中，由第一層解碼單元452輸出的音調(diào)增益提供給頻鐠解碼單元453。在第一層解碼單元452中，在由第一層解碼單元452固有的自適應(yīng)碼本(圖中未示出)輸出的自適應(yīng)碼矢量上所乘的自適應(yīng)碼矢量增益，作為音調(diào)增益輸出，并輸入給頻諮解碼單元453。
圖21是表示本實(shí)施方式4的頻譜解碼單元453的主要結(jié)構(gòu)的方框圖。變形信息估計(jì)單元461使用由第一層解碼單元452提供的音調(diào)增益來(lái)輸出估計(jì) 變形信息。變形信息估計(jì)單元461具有于上述圖15的變形信息估計(jì)單元303相同的結(jié)構(gòu)。不過(guò)，變形信息表格與變形信息估計(jì)單元411中的一樣，是對(duì)
應(yīng)音調(diào)增益而i殳計(jì)的。另外，在本實(shí)施方式中，也可以采用利用映射函it的
結(jié)構(gòu)來(lái)代替利用變形信息表格的結(jié)構(gòu)。
如上所述，根據(jù)本實(shí)施方式的解碼裝置(頻譜解碼單元453 )，能夠?qū)τ?本實(shí)施方式的編碼裝置編碼的信號(hào)進(jìn)行解碼，并能夠考慮輸入信號(hào)的周期性而恰當(dāng)?shù)卣{(diào)整估計(jì)頻譜的動(dòng)態(tài)范圍，來(lái)提高解碼信號(hào)的主觀質(zhì)量。
另外，也可以采用除了音調(diào)增益同時(shí)使用音調(diào)周期(通過(guò)搜索第一層編碼單元402中固有的自適應(yīng)碼本的結(jié)果而得到的延遲)來(lái)估計(jì)變形信息的結(jié) 構(gòu)。此時(shí)，通過(guò)利用音調(diào)周期，能夠進(jìn)行分別對(duì)音調(diào)周期短的語(yǔ)音(譬如女性的聲音)以及音調(diào)周期長(zhǎng)的語(yǔ)音(譬如男性的聲音)恰當(dāng)?shù)淖冃涡畔⒌墓?計(jì)，從而提高估計(jì)的準(zhǔn)確度。
另外，本實(shí)施方式中，估計(jì)變形信息通過(guò)變形信息估計(jì)單元411求出，但是也可以與實(shí)施方式3相同將該估計(jì)變形信息適用于實(shí)施方式1的圖4 示意的頻譜編碼單元106，并將該估計(jì)變形信息提供給頻譜變形單元112,頻譜變形單元112將由變形信息估計(jì)單元411提供的估計(jì)變形信息作為基準(zhǔn)，將其附近的變形信息從指數(shù)變量表格135中選擇出來(lái)，并從該限定的變形信息中通過(guò)搜索單元125確定最恰當(dāng)?shù)淖冃涡畔?。在該結(jié)構(gòu)中，最終所選擇的變形信息的編碼符號(hào)表示為對(duì)于作為上述基準(zhǔn)的估計(jì)變形信息的相對(duì)值。如此能對(duì)正確的變形信息進(jìn)行編碼并向解碼單元傳輸，因此能夠得到維持解碼信號(hào)的主觀質(zhì)量并減少表示變形信息的比特?cái)?shù)的效果。 (實(shí)施方式5)
本發(fā)明的實(shí)施方式5中，基于由第一層編碼單元提供的LPC系數(shù)，確定輸出到頻譜編碼單元內(nèi)的變形單元的估計(jì)變形信息。
本實(shí)施方式5的分層編碼裝置的結(jié)構(gòu)與上述圖18—樣。不過(guò)，由第一層編碼單元402輸出給頻譜編碼單元406的參數(shù)為L(zhǎng)PC系數(shù)而不是音調(diào)增益。
實(shí)施方式的頻語(yǔ)編碼單元406的主要結(jié)構(gòu)為如圖22所示的結(jié)構(gòu)。與上述圖19的不同之處在于，提供給變形信息估計(jì)單元511的參數(shù)為L(zhǎng)PC系數(shù)而不是音調(diào)增益以及變形信息估計(jì)單元511內(nèi)部的結(jié)構(gòu)。
圖23是表示本實(shí)施方式的變形信息估計(jì)單元511的主要結(jié)構(gòu)的方框圖。變形信息估計(jì)單元511包括判斷表格512、類似程度判斷單元513、變形信息表格514以及切換單元515。變形信息表格514與圖15中的變形信息表格306同樣地記錄著估計(jì)變形信息的候補(bǔ)。不過(guò)，該估計(jì)變形信息的候補(bǔ)是對(duì) 應(yīng)LPC系數(shù)而設(shè)計(jì)的。判斷表格512中記錄著LPC系數(shù)的候補(bǔ)，判斷表格 512與變形信息表格514設(shè)有相互對(duì)應(yīng)的關(guān)系。也就是，當(dāng)從判斷表格512 中選擇第j個(gè)的LPC系數(shù)的候補(bǔ)時(shí)，適合于該LPC系數(shù)候補(bǔ)的估計(jì)變形信息存儲(chǔ)為變形信息表格514的第j個(gè)。LPC系數(shù)具有能夠用較少的參數(shù)準(zhǔn)確地表現(xiàn)頻譜的輪廓(頻譜包絡(luò))的特點(diǎn)，能夠?qū)⒃擃l譜輪廓與控制動(dòng)態(tài)范圍的估計(jì)變形信息對(duì)應(yīng)起來(lái)。本實(shí)施方式采用了利用該特點(diǎn)的結(jié)構(gòu)。
相似程度判斷單元513從判斷表格512中求出與第一層編碼單元402提供的LPC系數(shù)最為相似的LPC系數(shù)。該相似程度判斷中，通過(guò)判斷表格512，求出LPC系數(shù)之間的距離(失真)、或者求出將LPC系數(shù)變換為L(zhǎng)SP (Line Spectrum Pair)系數(shù)等的其他的參數(shù)后的兩者的失真，并求出使該失真為最小時(shí)的LPC系數(shù)。
表示使失真為最小(即相似程度最大)時(shí)的判斷表格512中的LPC系數(shù) 候補(bǔ)的索引，由相似程度判斷單元513輸出，并提供給切換單元515。切換單元515選擇該索引表示的估計(jì)變形信息的候補(bǔ)，并由變形信息估計(jì)單元511輸出。
如上所述，根據(jù)本實(shí)施方式的編碼裝置(頻譜編碼單元406)，能夠考慮輸入信號(hào)的頻譜輪廓而恰當(dāng)?shù)卣{(diào)整估計(jì)頻譜的動(dòng)態(tài)范圍，來(lái)提高解碼信號(hào)的主觀質(zhì)量。
接下來(lái)，說(shuō)明本實(shí)施方式5的分層解碼裝置的結(jié)構(gòu)，該解碼裝置能夠?qū)?由本實(shí)施方式5的分層編碼裝置生成的編碼符號(hào)進(jìn)行解碼。
本實(shí)施方式5的分層解碼裝置的結(jié)構(gòu)與上述圖20—樣。不過(guò)，由第一層解碼單元452輸出給頻譜解碼單元453的參數(shù)為L(zhǎng)PC系數(shù)而不是音調(diào)增益。
實(shí)施方式的頻譜解碼單元453的主要結(jié)構(gòu)如圖24所示。與上述圖21的不同之處在于，提供給變形信息估計(jì)單元561的參數(shù)為L(zhǎng)PC系數(shù)而不是音調(diào) 增益以及變形信息估計(jì)單元561內(nèi)部的結(jié)構(gòu)。
變形信息估計(jì)單元561內(nèi)部的結(jié)構(gòu)，與圖22中的頻譜編碼單元406中的變形信息估計(jì)單元511，即圖23所示的相同，存儲(chǔ)于判斷表格512以及變形信息表格514的信息也是編碼端和解碼端共用的。
如上所述，根據(jù)本實(shí)施方式的解碼裝置(頻譜解碼單元453 )，能夠?qū)τ?本實(shí)施方式的編碼裝置編碼的信號(hào)進(jìn)行解碼，并能夠考慮輸入信號(hào)的頻譜輪廓而恰當(dāng)?shù)卣{(diào)整估計(jì)頻譜的動(dòng)態(tài)范圍，從而提高解碼信號(hào)的主觀質(zhì)量。
另外，本實(shí)施方式中，估計(jì)變形信息通過(guò)變形信息估計(jì)單元511求出，
但是也可以與實(shí)施方式4相同將該估計(jì)變形信息適用于實(shí)施方式1的圖4 示意的頻譜編碼單元106，并將該估計(jì)變形信息提供給頻譜變形單元112，頻譜變形單元112將由變形信息估計(jì)單元511提供的估計(jì)變形信息作為基準(zhǔn)，從指數(shù)變量表格135中選擇其附近的變形信息，并從該限定的變形信息中通過(guò)搜索單元125確定最恰當(dāng)?shù)淖冃涡畔?。在該結(jié)構(gòu)中，最終所選擇的變形信息的編碼符號(hào)表示為對(duì)于作為上述基準(zhǔn)的估計(jì)變形信息的相對(duì)值。如此能對(duì) 正確的變形信息進(jìn)行編碼并向解碼單元傳輸，因此能夠得到維持解碼信號(hào)的主觀質(zhì)量并減少表示變形信息的比特?cái)?shù)的效果。 (實(shí)施方式6)
本發(fā)明的實(shí)施方式6的分層編碼裝置的基本結(jié)構(gòu)與實(shí)施方式1所示的分層編碼裝置一樣，所以省略對(duì)其說(shuō)明，以下只對(duì)與頻譜變形單元112的結(jié)構(gòu) 不同的頻譜變形單元612進(jìn)行說(shuō)明。
頻譜變形單元612將以下的變形施加于第一頻譜S1 (k)(0^k<FL)，使第一頻譜S1 (k)的動(dòng)態(tài)范圍接近于第二頻謙S2(k)的高頻部分(FI^k〈FH) 的動(dòng)態(tài)范圍。頻譜變形單元612對(duì)有關(guān)該變形的變形信息進(jìn)行編碼且輸出。
圖25是用于說(shuō)明本實(shí)施方式的頻譜變形方法的圖。
該圖示出了第一頻譜S1 (k)的振幅的分布。第一頻譜S1 (k)顯示出因頻率k (0^k<FL)的值而各異的振幅。于是，如果橫軸取振幅，縱軸取該振幅出現(xiàn)的概率，則如圖所示，出現(xiàn)以振幅的平均值ml為中心的類似正態(tài) 分布的分布。
本實(shí)施方式中，首先將該分布粗分為距離平均值ml較近的組(圖中的區(qū)域B)和距離平均值ml較遠(yuǎn)的組(圖中的區(qū)域A)。接下來(lái)，求出這兩組的振幅的代表值，具體來(lái)講，求出包含于區(qū)域A的頻譜的振幅的平均值和包含于區(qū)域B的頻i普的振幅的平均值。在此，振幅使用將設(shè)平均值ml設(shè)為零而換算出來(lái)時(shí)的振幅的絕對(duì)值(從各值減去平均值ml )。譬如，區(qū)域A由振幅比平均值ml大的和振幅比平均值ml小的兩個(gè)區(qū)域構(gòu)成，通過(guò)i殳平均值 ml為零而換算的處理，則包含于兩個(gè)區(qū)域的頻譜的振幅的絕對(duì)值具有相同的值。因此，譬如區(qū)域A的平均值，相當(dāng)于將第一頻譜中換算后的振幅(絕對(duì) 值)比較大的頻i普匯成一個(gè)組并將該組的振幅的代表值計(jì)算出來(lái)；區(qū)域B的平均值，相當(dāng)于將第一頻譜中換算后的振幅(絕對(duì)值)比較小的頻語(yǔ)匯成一個(gè)組并將該組的振幅的代表值計(jì)算出來(lái)。由此，這兩個(gè)代表值為概括地表現(xiàn) 第一頻諳的動(dòng)態(tài)范圍的參數(shù)。
其次，在本實(shí)施方式，對(duì)第二頻譜進(jìn)行與對(duì)第一頻譜進(jìn)行的相同的處理，
而求出對(duì)應(yīng)于第二頻譜的各組的代表值。接下來(lái)，求出區(qū)域A的第一頻譜的
代表值與第二頻語(yǔ)的代表值的比(具體來(lái)講為，第二頻譜的代表值對(duì)第一頻
譜的代表值的比)，以及求出區(qū)域B的第一頻譜的代表值與第二頻譜的代表值的比。因此，能夠大概地計(jì)算出第一頻譜的動(dòng)態(tài)范圍與第二頻譜的動(dòng)態(tài)范圍的比。本實(shí)施方式的頻譜變形單元將該比作為頻譜的變形信息進(jìn)行編碼且輸出。
圖26是表示頻譜變形單元612內(nèi)部的主要結(jié)構(gòu)的方框圖。
頻譜變形單元612大致分為對(duì)第一頻譜的上述各組進(jìn)行代表值計(jì)算的系統(tǒng)；對(duì)第二頻譜的上述各組進(jìn)行代表值計(jì)算的系統(tǒng)；基于這兩個(gè)系統(tǒng)計(jì)算出來(lái)的代表值，確定變形信息的變形信息確定單元626;以及，基于該變形信息來(lái)生成變形頻譜的變形頻譜生成單元627。
計(jì)算第一頻鐠的代表值的系統(tǒng)，具體來(lái)講，包括偏差程度計(jì)算單元 621-1、第一閾值設(shè)定單元622-1、第二閾值設(shè)定單元622-1、第一平均頻譜計(jì) 算單元624-1以及第二平均頻譜計(jì)算單元625-1。計(jì)算第二頻譜的代表值的系統(tǒng)、基本上與計(jì)算第一頻譜的代表值的系統(tǒng)具有相同的結(jié)構(gòu)，對(duì)圖中相同的結(jié)構(gòu)編上相同的編號(hào)，編號(hào)后面的分支號(hào)表示處理系統(tǒng)的不同。并且對(duì)于相同的結(jié)構(gòu)要素省略對(duì)其說(shuō)明。
偏差程度計(jì)算單元621-1根據(jù)輸入的第一頻譜S1 (k)的振幅分布，計(jì) 算與第一頻譜的平均值ml的"偏差程度"，并輸出到第一閾值設(shè)定單元622-1 以及第二閾值設(shè)定單元623-1。"偏差程度"具體來(lái)講是第一頻譜的振幅分布的標(biāo)準(zhǔn)偏差cj1。
第一閾值設(shè)定單元622-1利用由偏差計(jì)算單元621-1求出的第一頻語(yǔ)的標(biāo)準(zhǔn)偏差cj1來(lái)求出第一閾值TH1 。在此第一閾值TH1是指第一頻譜中用來(lái) 指定包含于上述區(qū)域A的絕對(duì)振幅比較大的頻譜的閾值，是將標(biāo)準(zhǔn)偏差(Jl 乘上預(yù)定的常數(shù)a的值。
第二閾值設(shè)定單元623-1的操作與第一閾值設(shè)定單元622-1的操作相同，求出的第二閾值TH2是指第一頻譜中用來(lái)指定包含于區(qū)域B的絕對(duì)振幅比較小的頻譜的閾值，是將標(biāo)準(zhǔn)偏差cil乘上預(yù)定的常數(shù)b (<a)的值。
第一平均頻譜計(jì)算單元624-1求出位于第一閾值TH1外側(cè)的頻i普，即包含于區(qū)域A的頻譜的振幅的平均值(以下稱為第一平均值)，并輸出到變形信息確定單元626。
具體來(lái)講，第一平均頻譜計(jì)算單元624-1將第一頻譜的各個(gè)子帶的頻譜的振幅(但是為換算前的值)與第一頻譜的平均值ml加上第一閾值TH1的值(ml + THl)進(jìn)行比較，指定具有比該值還大的振幅的頻鐠(步驟l)。接下來(lái)，第一平均頻譜計(jì)算單元624-1將第一頻譜的各個(gè)子帶的頻譜的振幅與第一頻譜的平均值ml減去第一閾值TH1的值(m卜THl)進(jìn)行比較，指定具有比該值還小的振幅的頻譜(步驟2)。然后，對(duì)由步驟1以及步驟2求出的頻譜的振幅進(jìn)行上述設(shè)平均值ml為零的換算，求出得到的換算值的絕對(duì) 值的平均值，并輸出到變形信息確定單元626。
第二平均頻譜計(jì)算單元625-1求出位于第二閾值TH2內(nèi)側(cè)的頻i普，即包含于區(qū)域B的頻譜的振幅的平均值(以下稱為第二平均值)，并輸出到變形信息確定單元626。具體的操作與第一平均頻鐠計(jì)算單元624-1相同。
上述處理求出的第一平均值以及第二平均值為第一頻鐠的區(qū)域A以及區(qū) 域B的代表值。
求出第二頻譜的代表值的處理基本上與上述相同。不過(guò)，第一頻譜與第二頻譜為不同的頻譜，所以相當(dāng)于第一閾值TH1的第三閾值TH3為在第二頻譜的標(biāo)準(zhǔn)偏差cj1上乘上預(yù)定的常數(shù)c的值；相當(dāng)于第二閾值TH2的第四閾值TH4為在第二頻譜的標(biāo)準(zhǔn)偏差dl上乘上預(yù)定的常數(shù)d (<c)的值。
變形信息確定單元626利用由第一平均頻譜計(jì)算單元624-1得到的第一平均值、由第二平均頻譜計(jì)算單元625-1得到的第二平均值、由第三平均頻語(yǔ)計(jì)算單元624-2得到的第三平均值以及由第四平均頻鐠計(jì)算單元625-2得到的第四平均值，如以下所示確定變形信息。
即，變形信息確定單元626計(jì)算第一平均值與第三平均值的比(以下稱為第一增益)，以及第三平均值第四平均值的比(以下稱為第二增益)。然后，因?yàn)樽冃涡畔⒋_定單元626在內(nèi)部具有預(yù)先存儲(chǔ)變形信息的多個(gè)編碼候補(bǔ)的數(shù)據(jù)表格，將第一增益以及第二增益與這些編碼候補(bǔ)相比較，選擇最為相似的編碼候補(bǔ)，并將表示該編碼候補(bǔ)的索引作為變形信息輸出。而且，該索引還送到變形頻譜生成單元627。變形頻譜生成單元627利用作為輸入信號(hào)的第一頻語(yǔ)、由第一閾值設(shè)定單元622-1得到的第一閾值TH1、由第二闞值設(shè)定單元623-1得到的第二閾值TH2以及由變形信息確定單元626輸出的變形信息，進(jìn)行第一頻-潛的變形處理，并將生成的變形頻譜輸出。
圖27、圖28是用于說(shuō)明變形頻鐠的生成方法的圖。
變形頻譜生成單元627利用變形信息，計(jì)算第一平均值與第三平均值的比的解碼值(以下稱為解碼第一增益)，以及第二平均值與第四平均^直的比的解碼值(以下稱為解碼第二增益)。這些對(duì)應(yīng)關(guān)系如圖27所示。
接下來(lái)，變形頻譜生成單元627通過(guò)比較第一頻譜的振幅值與第一閾值 TH1,指定屬于區(qū)域A的頻譜，并將這些頻譜乘上解碼第一增益。同樣地，變形頻譜生成單元627通過(guò)比較第一頻譜的振幅值與第二閾值TH2，指定屬于區(qū)域B的頻譜，并將這些頻語(yǔ)乘上解碼第二增益。
另一方面，如圖28所示，在第一頻譜中，對(duì)于夾在第一閾值TH1與第二閾值TH2之間的區(qū)域(以下稱為區(qū)域C)所屬的頻譜，不存在編碼信息。于是，變形頻譜生成單元627使用具有解碼第一增益與解碼第二增益的中心值的增益。譬如，如圖28所示，根據(jù)基于解碼第一增益、解碼第二增益、第一閾值TH1以及第二閾值TH2的特性曲線，求出對(duì)應(yīng)某振幅x的解碼增益y, 并將該增益乘上第一頻譜的振幅即可。也就是，解碼增益y為解碼第一增益以及解碼第二增益的線性插值。
圖29是表示用于解碼裝置的頻譜變形單元662內(nèi)部的主要結(jié)構(gòu)的方框圖。另外，該頻鐠變形單元662對(duì)應(yīng)于實(shí)施方式1所示的變形單元162。
因?yàn)榛静僮髋c上述頻譜變形單元612相同，省略對(duì)其詳細(xì)"i兌明。該頻語(yǔ)變形單元662只以第一頻譜為處理對(duì)象，因此處理系統(tǒng)為一個(gè)。
如上所述，根據(jù)本實(shí)施方式，分別掌握第一頻譜的振幅的分布以及第二頻譜的振幅的分布，分成絕對(duì)振幅比較大的組與絕對(duì)振幅比較小的組，并求出各組的振幅的代表值。而且，通過(guò)求出第一頻譜和第二頻譜的各組的振幅的代表值的比，得到第一頻譜以及第二頻譜之間的動(dòng)態(tài)范圍的比，即得到頻譜的變形信息，并將其進(jìn)行編碼。由此，無(wú)需使用如指數(shù)函數(shù)那樣的計(jì)算量大的函數(shù)而得到變形信息。
另外，根據(jù)本實(shí)施方式，利用第一頻譜以及第二頻譜的振幅的分布求出標(biāo)準(zhǔn)偏差，并基于該標(biāo)準(zhǔn)偏差求出第一閾值-第四閾值。由此設(shè)定基于實(shí)際的頻譜的閾值，因此能夠提高變形信息的編碼精確度。另外，根據(jù)本實(shí)施方式，利用解碼第一增益以及解碼第二增益對(duì)第一頻譜進(jìn)行增益調(diào)整，由此控制第一頻譜的動(dòng)態(tài)范圍。而且，確定解碼第一增益以及解碼第二增益，以使得第一頻譜接近第二頻譜的高頻部分。因此，第一頻譜的動(dòng)態(tài)范圍接近第二頻語(yǔ)的高頻部分的動(dòng)態(tài)范圍。而且，解碼第一增益以及解碼第二增益的計(jì)算無(wú)需使用如指數(shù)函數(shù)那樣的計(jì)算量大的函數(shù)。另外，本實(shí)施方式以解碼第一增益比解碼第二增益大的情形為例進(jìn)行了說(shuō)明，根據(jù)語(yǔ)音信號(hào)的性質(zhì)，也有解碼第二增益比解碼第一增益大的情形。也就是，第二頻譜的高頻部分動(dòng)態(tài)范圍比第一頻i普的動(dòng)態(tài)范圍大的情形。這樣的現(xiàn)象多在輸入語(yǔ)音信息為如摩擦音的聲音時(shí)發(fā)生。在該情形也能夠適用本實(shí)施方式的頻譜變形方法。另外，在本實(shí)施方式中，將頻譜分成絕對(duì)振幅較大的組與絕對(duì)振幅較小的組兩個(gè)組，并以該情形為例進(jìn)行了說(shuō)明，但是為了提高動(dòng)態(tài)范圍的再現(xiàn)性，也可以分成更多的組。另外，在本實(shí)施方式中，將平均值作為基準(zhǔn)來(lái)?yè)Q算振幅，而且基于該換算后的振幅將頻i普分為振幅比較大的組和振幅比較小的組，并以該情形為例進(jìn)行了說(shuō)明，但是直接使用原來(lái)的振幅值，并基于該振幅對(duì)頻譜進(jìn)行分組也可以。另外，在本實(shí)施方式中，使用標(biāo)準(zhǔn)偏差來(lái)計(jì)算頻譜的絕對(duì)振幅的偏差，并以該情形為例進(jìn)行了說(shuō)明，但是并不只限于此，譬如作為與標(biāo)準(zhǔn)偏差同樣的統(tǒng)計(jì)參數(shù)也可以利用方差。另外，在本實(shí)施方式中，使用各組的頻譜的絕對(duì)振幅的平均值作為各組的頻譜振幅的代表值，并以該情形為例進(jìn)行了說(shuō)明，但是并不只限于此，譬如也可以利用各組的頻譜的絕對(duì)振幅的中心值。另外，在本實(shí)施方式中，以使用各頻譜的振幅值來(lái)調(diào)整動(dòng)態(tài)范圍的情形為例進(jìn)行了說(shuō)明，但是也可以使用頻譜的功率值來(lái)代替振幅值。另外，在求出所對(duì)應(yīng)各組的代表值時(shí)，譬如像MDCT系數(shù)那樣，當(dāng)從一開(kāi)始頻譜的振幅就具有正或者負(fù)的符號(hào)時(shí)，無(wú)需將平均值換算為零，只要利用頻譜的振幅的絕對(duì)值來(lái)求出各組所對(duì)應(yīng)的代表值即可。以上，說(shuō)明了本發(fā)明的各個(gè)實(shí)施方式。本發(fā)明的編碼裝置以及解碼裝置，不為上述各實(shí)施方式所限定，可以加以各種變更來(lái)實(shí)施。本發(fā)明的編碼裝置以及解碼裝置，可以配置于移動(dòng)臺(tái)通信系統(tǒng)的通信終端裝置以及基站裝置，并且可以以此提供具有同樣作用效果的通信終端裝置以及基站裝置。還可以適用于其他的編碼方式。另外，在此舉了通過(guò)硬件來(lái)構(gòu)成本發(fā)明的例子來(lái)說(shuō)明，本發(fā)明還可以通過(guò)軟件來(lái)實(shí)現(xiàn)。譬如，通過(guò)編程語(yǔ)言，對(duì)本發(fā)明的編碼方法(解碼方法)的算法進(jìn)行記述，并在內(nèi)存中保存該程序并通過(guò)信息處理裝置來(lái)實(shí)行，從而能夠?qū)崿F(xiàn)與本發(fā)明的編碼裝置(解碼裝置)相同的功能。另外，上述的各功能模塊，典型地由集成電路LSI (大規(guī)模集成電路)來(lái)實(shí)現(xiàn)。這些既可以分別實(shí)行單芯片化，也可以包含其中一部分或者是全部而實(shí)行單芯片化。另外，在此雖然稱做LSI，但根據(jù)集成度的不同也可以稱為IC (集成電路)、系統(tǒng)LSI (系統(tǒng)大規(guī)模集成電路)、超LSI (超大規(guī)模集成電路)、極大 LSI (極大規(guī)模集成電路)。另外，集成電路化的技術(shù)不只限于LSI，也可以使用專用電路或通用處理器來(lái)實(shí)現(xiàn)。也可以利用LSI制造后能夠編程的FPGA ( Field Programmable GateArray,現(xiàn)場(chǎng)可編程門陣列)，或可以利用將LSI內(nèi)部的電路塊連接或設(shè) 定重新配置的可重配置處理器(Reconfigurable Processor )。再有，如果隨著半導(dǎo)體技術(shù)的進(jìn)步或者其他技術(shù)的派生，出現(xiàn)了替換LSI 集成電路的技術(shù)，當(dāng)然也可以利用該技術(shù)來(lái)實(shí)現(xiàn)功能塊的集成化。也有應(yīng)用生物工程學(xué)技術(shù)等的可能性。本說(shuō)明書根據(jù)2004年5月14日申請(qǐng)的日本專利特愿2004-145425、 2004 年11月5日申請(qǐng)的日本專利特愿2004-322953號(hào)以及2005年4月28日申請(qǐng) 的曰本專利特愿2005-133729。該內(nèi)容全部包括在此作為參考。工業(yè)實(shí)用性本發(fā)明的編碼裝置、解碼裝置以及編碼/解碼的方法能夠適用于可擴(kuò)展編碼/解碼等。
權(quán)利要求
1.一種解碼裝置，包括變換單元，將對(duì)包含于通過(guò)編碼裝置所生成的編碼中的低頻頻譜部分的編碼進(jìn)行解碼所得的信號(hào)變換成頻域信號(hào)而生成第一低頻頻譜；限制單元，根據(jù)包含于通過(guò)所述編碼裝置所生成的編碼中的頻譜變形信息，對(duì)所述第一低頻頻譜的振幅進(jìn)行一致性限制而生成第二低頻頻譜；以及解碼單元，基于所述第二低頻頻譜對(duì)包含于通過(guò)所述編碼裝置生成出的編碼中的高頻頻譜部分的編碼進(jìn)行解碼而生成高頻頻譜。
2. 如權(quán)利要求1所述的解碼裝置，其中，所述限制單元對(duì)所述第一低頻頻譜的振幅進(jìn)行一致性限制，以使所述第二低頻頻譜的振幅的平均擺動(dòng)幅度與所述高頻頻語(yǔ)部分的振幅的平均擺動(dòng)幅度同等。
3. 如權(quán)利要求1所述的解碼裝置，其中，所述限制單元使用從0到1的范圍內(nèi)的預(yù)定值對(duì)所述第一低頻頻譜的振幅一致地進(jìn)行乘冪，由此生成所述第二低頻頻譜。
4. 如權(quán)利要求1所述的解碼裝置，其中，所述解碼單元使用音調(diào)濾波器生成所述高頻頻譜部分，所述音調(diào)濾波器具有所述第二低頻頻譜作為內(nèi)部狀態(tài)。
5. 如權(quán)利要求1所述的解碼裝置，其中，所述解碼單元復(fù)制所述第二低頻頻譜而對(duì)所述高頻頻譜部分進(jìn)行解碼。
6. —種包括權(quán)利要求1所述的解碼裝置的通信終端裝置。
7. —種包括權(quán)利要求1所述的解碼裝置的基站裝置。
8. —種解碼方法，包括變換步驟，將對(duì)包含于編碼裝置所生成的編碼中的低頻頻譜部分的編碼進(jìn)行解碼所得的信號(hào)變換成頻域信號(hào)而生成第一低頻頻譜；限制步驟，根據(jù)包含于通過(guò)所述編碼裝置所生成的編碼中的頻譜變形信息，對(duì)所述第一低頻頻鐠的振幅進(jìn)行一致性限制而生成第二低頻頻譜；以及解碼步驟，基于所述第二低頻頻語(yǔ)對(duì)包含于所述編碼裝置所生成的編碼中的高頻頻譜部分的編碼進(jìn)行解碼而生成高頻頻i普。
全文摘要
本發(fā)明公開(kāi)一種解碼裝置，包括變換單元，將對(duì)包含于通過(guò)編碼裝置所生成的編碼中的低頻頻譜部分的編碼進(jìn)行解碼所得的信號(hào)變換成頻域信號(hào)而生成第一低頻頻譜；限制單元，根據(jù)包含于通過(guò)所述編碼裝置所生成的編碼中的頻譜變形信息，對(duì)所述第一低頻頻譜的振幅進(jìn)行一致性限制而生成第二低頻頻譜；以及解碼單元，基于所述第二低頻頻譜對(duì)包含于通過(guò)所述編碼裝置生成出的編碼中的高頻頻譜部分的編碼進(jìn)行解碼而生成高頻頻譜。
文檔編號(hào)G10L21/00GK101656075SQ20091017758
公開(kāi)日2010年2月24日申請(qǐng)日期2005年5月13日優(yōu)先權(quán)日2004年5月14日
發(fā)明者押切正浩, 江原宏幸申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載