專利名稱:固定碼本搜索裝置以及固定碼本搜索方法
技術(shù)領域:
本發(fā)明涉及固定碼本搜索裝置以及固定碼本搜索方法,用于通過碼激勵線性預測 (Code Excited Linear Prediction =CELP)型的語音編碼裝置對語音信號進行編碼。
背景技術(shù):
在語音編碼處理中,一般而言CELP型語音編碼裝置中的固定碼本的搜索處理在處理量中占得最多,因此以往就開發(fā)了各種各樣的固定碼本的結(jié)構(gòu)和固定碼本的搜索方法。作為比較能夠減少用于搜索的處理量的固定碼本,可舉出在ITU-T建議G. 729和 G. 723. 1,或者3GPP標準AMR等國際標準編解碼(codec)中被廣泛采用的利用了代數(shù)碼本 (Algebraic Codebook)的固定碼本(Fixed Codebook)(參照例如非專利文獻1至3)。利用這些固定碼本,通過稀疏(sparse)根據(jù)代數(shù)碼本生成的脈沖數(shù),能夠減少固定碼本搜索所需的處理量。另一方面,可利用稀疏的脈沖聲源表現(xiàn)的信號特性有限,因此有時在編碼質(zhì)量上發(fā)生問題。為了對應這樣的問題,提出了為使根據(jù)代數(shù)碼本生成的脈沖聲源具有特性而使其通過濾波器的方法(參照例如非專利文獻4)。非專禾0文獻 1ITU-T Recommendation G. 729, "Coding of Speech at 8kbit/s using Conjugate-structure Algebraic-Code-Excited Lineare-Prediction(CS-ACELP)”,1996 年 3 月非專利文獻2ITU_T Recommendation G. 723. l,“Dual Rate Speech Coder for Multimedia Communications Transmitting at 5. 3 and 6. 3kbit/s,,,1996 年 3 月非專利文獻33GPP TS 26. 090,"AMR speech codec ;Transcoding functions" V4. 0. 0,2001 年 3 月專禾Ij JC ■ 4R. Hageri ·,“Removal of sparse-excitation artifacts inCELP”and IEEE ICASSP ‘98,pp.145 148,1998
發(fā)明內(nèi)容
發(fā)明所要解決的課題但是,在聲源脈沖所通過的濾波器無法用下三角特普利茨(Tc^plitz)矩陣表現(xiàn)時(例如,在非專利文獻4那樣的循環(huán)卷積處理時等,為在負的時間具有值的濾波器的情況下),在矩陣運算中需要額外的存儲器和運算量。本發(fā)明的目的在于提供語音編碼裝置等,即使聲源脈沖所通過的濾波器具有無法用下三角矩陣表示的特性,也將運算量的增加抑制得較小,從而能夠?qū)崿F(xiàn)次優(yōu)的固定碼本搜索。
用于解決課題的手段本發(fā)明通過固定碼本搜索裝置具有以下單元來達到上述目的脈沖聲源矢量生成單元,生成脈沖聲源矢量;第一卷積運算單元,向在負的時間具有值的脈沖響應矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應,從而生成在負的時間具有值的第二脈沖響應矢量;矩陣生成單元,利用由所述第一卷積運算單元生成的第二脈沖響應矢量生成特普利茨型的卷積矩陣;以及搜索單元,利用由所述矩陣生成單元生成的矩陣,對由所述脈沖聲源矢量生成單元生成的脈沖聲源矢量進行卷積處理,并搜索使經(jīng)所述卷積處理得到的聽覺加權(quán)合成信號與根據(jù)輸入語音信號得到的對象信號之間的誤差成為最小的脈沖聲源矢量,以確定用于生成搜索出的脈沖聲源矢量的編碼索引。另外,本發(fā)明通過具有固定碼本搜索方法來達到上述目的,該固定碼本搜索方法包括脈沖聲源矢量生成步驟,生成脈沖聲源矢量;第一卷積運算步驟,在負的時間具有值的脈沖響應矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應,從而生成在負的時間具有值的第二脈沖響應矢量;矩陣生成步驟,利用在所述第一卷積運算步驟中生成的第二脈沖響應矢量,生成特普利茨型的卷積矩陣;以及搜索步驟,利用所述特普利茨型的卷積矩陣,對所述脈沖聲源矢量進行卷積處理,并搜索使經(jīng)所述卷積處理得到的聽覺加權(quán)合成信號與根據(jù)輸入語音信號得到的對象信號之間的誤差成為最小的脈沖聲源矢量,以確定用于生成搜索出的脈沖聲源矢量的編碼索引。另外,本發(fā)明通過固定碼本搜索裝置具有以下單元來達到上述目的卷積運算單元,向在負的時間具有非零值的脈沖響應矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應,以生成在負的時間具有非零值的第二脈沖響應矢量;矩陣生成單元,利用由所述卷積運算單元生成的第二脈沖響應矢量生成特普利茨型的卷積矩陣;以及搜索單元,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進行碼本搜索,所述第二脈沖響應矢量的、負的時間的構(gòu)成要素的能量比非負的時間的構(gòu)成要素的能量小。發(fā)明的效果根據(jù)本發(fā)明,將無法用特普利茨矩陣表現(xiàn)的傳遞函數(shù),使用截取了下三角特普利茨矩陣的行元素的一部分的形式的矩陣來近似,因此能夠以與用下三角特普利茨矩陣表現(xiàn)的因果的濾波器的情況大致相同的存儲量和運算量進行語音信號的編碼處理。
圖1是表示本發(fā)明的一個實施方式的語音編碼裝置的固定碼本矢量生成裝置的方框圖。圖2是表示本發(fā)明的一個實施方式的語音編碼裝置的一例固定碼本搜索裝置的方框圖。圖3是表示本發(fā)明的一個實施方式的一例語音編碼裝置的方框圖。
具體實施例方式本發(fā)明在使用縮減(truncate) 了下三角特普利茨型矩陣的行元素的矩陣進行固定碼本的搜索的結(jié)構(gòu)上具有特征。下面,適當?shù)貐⒄崭綀D詳細地說明本發(fā)明的實施方式。
權(quán)利要求
1.一種固定碼本搜索裝置,包括卷積運算單元,向在負的時間具有非零值的脈沖響應矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應,以生成在負的時間具有非零值的第二脈沖響應矢量;矩陣生成單元,利用由所述卷積運算單元生成的第二脈沖響應矢量生成特普利茨型的卷積矩陣;以及搜索單元,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進行碼本搜索, 所述第二脈沖響應矢量的、負的時間的構(gòu)成要素的能量比非負的時間的構(gòu)成要素的能量小。
2.一種固定碼本搜索方法,包括卷積運算步驟,向在負的時間具有非零值的脈沖響應矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應,以生成在負的時間具有非零值的第二脈沖響應矢量;矩陣生成步驟,利用在所述卷積運算步驟中生成的第二脈沖響應矢量生成特普利茨型的卷積矩陣;以及搜索步驟,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進行碼本搜索, 所述第二脈沖響應矢量的、負的時間的構(gòu)成要素的能量比非負的時間的構(gòu)成要素的能量小。
全文摘要
公開了固定碼本搜索裝置,即使聲源脈沖所通過的濾波器具有無法用下三角矩陣表示的特性,也將運算量的增加抑制得較小,從而實現(xiàn)次優(yōu)的固定碼本搜索。該裝置包括卷積運算單元,向在負的時間具有非零值的脈沖響應矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應,以生成在負的時間具有非零值的第二脈沖響應矢量;矩陣生成單元,利用由所述卷積運算單元生成的第二脈沖響應矢量生成特普利茨型的卷積矩陣;以及搜索單元,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進行碼本搜索,所述第二脈沖響應矢量的、負的時間的構(gòu)成要素的能量比非負的時間的構(gòu)成要素的能量小。
文檔編號G10L19/10GK102201239SQ20111018874
公開日2011年9月28日 申請日期2007年3月8日 優(yōu)先權(quán)日2006年3月10日
發(fā)明者吉田幸司, 江原宏幸 申請人:松下電器產(chǎn)業(yè)株式會社