專利名稱:固定碼本搜索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及固定碼本搜索裝置以及固定碼本搜索方法,用于通過(guò)碼激勵(lì)線性預(yù)測(cè) (Code Excited Linear Prediction =CELP)型的語(yǔ)音編碼裝置對(duì)語(yǔ)音信號(hào)進(jìn)行編碼。
背景技術(shù):
在語(yǔ)音編碼處理中,一般而言CELP型語(yǔ)音編碼裝置中的固定碼本的搜索處理在處理量中占得最多,因此以往就開發(fā)了各種各樣的固定碼本的結(jié)構(gòu)和固定碼本的搜索方法。作為比較能夠減少用于搜索的處理量的固定碼本,可舉出在ITU-T建議G. 729和 G. 723. 1,或者3GPP標(biāo)準(zhǔn)AMR等國(guó)際標(biāo)準(zhǔn)編解碼(codec)中被廣泛采用的利用了代數(shù)碼本 (Algebraic Codebook)的固定碼本(Fixed Codebook)(參照例如非專利文獻(xiàn)1至3)。利用這些固定碼本,通過(guò)稀疏(sparse)根據(jù)代數(shù)碼本生成的脈沖數(shù),能夠減少固定碼本搜索所需的處理量。另一方面,可利用稀疏的脈沖聲源表現(xiàn)的信號(hào)特性有限,因此有時(shí)在編碼質(zhì)量上發(fā)生問(wèn)題。為了對(duì)應(yīng)這樣的問(wèn)題,提出了為使根據(jù)代數(shù)碼本生成的脈沖聲源具有特性而使其通過(guò)濾波器的方法(參照例如非專利文獻(xiàn)4)。非專禾0文獻(xiàn) 1ITU-T Recommendation G. 729, "Coding of Speech at 8kbit/s using Conjugate-structure Algebraic-Code-Excited Lineare-Prediction(CS-ACELP)”,1996 年 3 月非專利文獻(xiàn)2ITU_T Recommendation G. 723. l,“Dual Rate Speech Coder for Multimedia Communications Transmitting at 5. 3 and 6. 3 kbit/s,,,1996 年 3 月非專利文獻(xiàn)33GPP TS 26. 090,"AMR speech codec ;Transcoding functions" V4. 0. 0,2001 年 3 月非專利文獻(xiàn) 4R. Hagen 等,"Removal of sparse-excitation artifacts in CELP"and IEEE ICASSP ‘98,PP. 145 148,1998
發(fā)明內(nèi)容
發(fā)明所要解決的課題但是,在聲源脈沖所通過(guò)的濾波器無(wú)法用下三角特普利茨(Tc^plitz)矩陣表現(xiàn)時(shí)(例如,在非專利文獻(xiàn)4那樣的循環(huán)卷積處理時(shí)等,為在負(fù)的時(shí)間具有值的濾波器的情況下),在矩陣運(yùn)算中需要額外的存儲(chǔ)器和運(yùn)算量。本發(fā)明的目的在于提供語(yǔ)音編碼裝置等,即使聲源脈沖所通過(guò)的濾波器具有無(wú)法用下三角矩陣表示的特性,也將運(yùn)算量的增加抑制得較小,從而能夠?qū)崿F(xiàn)次優(yōu)的固定碼本搜索。
用于解決課題的手段本發(fā)明通過(guò)固定碼本搜索裝置具有以下單元來(lái)達(dá)到上述目的脈沖聲源矢量生成單元,生成脈沖聲源矢量;第一卷積運(yùn)算單元,向在負(fù)的時(shí)間具有值的脈沖響應(yīng)矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應(yīng),從而生成在負(fù)的時(shí)間具有值的第二脈沖響應(yīng)矢量;矩陣生成單元,利用由所述第一卷積運(yùn)算單元生成的第二脈沖響應(yīng)矢量生成特普利茨型的卷積矩陣;以及搜索單元,利用由所述矩陣生成單元生成的矩陣,對(duì)由所述脈沖聲源矢量生成單元生成的脈沖聲源矢量進(jìn)行卷積處理,并搜索使經(jīng)所述卷積處理得到的聽覺加權(quán)合成信號(hào)與根據(jù)輸入語(yǔ)音信號(hào)得到的對(duì)象信號(hào)之間的誤差成為最小的脈沖聲源矢量,以確定用于生成搜索出的脈沖聲源矢量的編碼索引。另外,本發(fā)明通過(guò)具有固定碼本搜索方法來(lái)達(dá)到上述目的,該固定碼本搜索方法包括脈沖聲源矢量生成步驟,生成脈沖聲源矢量;第一卷積運(yùn)算步驟,在負(fù)的時(shí)間具有值的脈沖響應(yīng)矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應(yīng),從而生成在負(fù)的時(shí)間具有值的第二脈沖響應(yīng)矢量;矩陣生成步驟,利用在所述第一卷積運(yùn)算步驟中生成的第二脈沖響應(yīng)矢量,生成特普利茨型的卷積矩陣;以及搜索步驟,利用所述特普利茨型的卷積矩陣,對(duì)所述脈沖聲源矢量進(jìn)行卷積處理,并搜索使經(jīng)所述卷積處理得到的聽覺加權(quán)合成信號(hào)與根據(jù)輸入語(yǔ)音信號(hào)得到的對(duì)象信號(hào)之間的誤差成為最小的脈沖聲源矢量,以確定用于生成搜索出的脈沖聲源矢量的編碼索引。另外,本發(fā)明通過(guò)固定碼本搜索裝置具有以下單元來(lái)達(dá)到上述目的卷積運(yùn)算單元,向在負(fù)的時(shí)間具有非零值的脈沖響應(yīng)矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應(yīng),以生成在負(fù)的時(shí)間具有非零值的第二脈沖響應(yīng)矢量;矩陣生成單元,利用由所述卷積運(yùn)算單元生成的第二脈沖響應(yīng)矢量生成特普利茨型的卷積矩陣;以及搜索單元,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進(jìn)行碼本搜索,所述第二脈沖響應(yīng)矢量的負(fù)的時(shí)間分量的時(shí)間長(zhǎng)度比非負(fù)的時(shí)間分量的時(shí)間長(zhǎng)度短。發(fā)明的效果根據(jù)本發(fā)明,將無(wú)法用特普利茨矩陣表現(xiàn)的傳遞函數(shù),使用截取了下三角特普利茨矩陣的行元素的一部分的形式的矩陣來(lái)近似,因此能夠以與用下三角特普利茨矩陣表現(xiàn)的因果的濾波器的情況大致相同的存儲(chǔ)量和運(yùn)算量進(jìn)行語(yǔ)音信號(hào)的編碼處理。
圖1是表示本發(fā)明的一個(gè)實(shí)施方式的語(yǔ)音編碼裝置的固定碼本矢量生成裝置的方框圖。圖2是表示本發(fā)明的一個(gè)實(shí)施方式的語(yǔ)音編碼裝置的一例固定碼本搜索裝置的方框圖。圖3是表示本發(fā)明的一個(gè)實(shí)施方式的一例語(yǔ)音編碼裝置的方框圖。
具體實(shí)施例方式本發(fā)明在使用縮減(truncate) 了下三角特普利茨型矩陣的行元素的矩陣進(jìn)行固定碼本的搜索的結(jié)構(gòu)上具有特征。下面,適當(dāng)?shù)貐⒄崭綀D詳細(xì)地說(shuō)明本發(fā)明的實(shí)施方式。
(實(shí)施方式)圖1是表示本發(fā)明的一個(gè)實(shí)施方式的語(yǔ)音編碼裝置中的固定碼本矢量生成裝置 100的結(jié)構(gòu)的方框圖。另外,在本實(shí)施方式中,設(shè)固定碼本矢量生成裝置100為作為搭載并使用于移動(dòng)電話等通信終端裝置的CELP型語(yǔ)音編碼裝置的固定碼本而使用的裝置。固定碼本矢量生成裝置100具備代數(shù)碼本101和卷積運(yùn)算單元102。代數(shù)碼本101生成在以輸入的碼本索引k指定的位置上代數(shù)方式地配置了音源脈沖的脈沖音源矢量ck,并將所生成的脈沖音源矢量輸出到卷積運(yùn)算單元102。代數(shù)碼本的結(jié)構(gòu)為哪種結(jié)構(gòu)都可以,也可以為例如ITU-T建議G. 729所記載的結(jié)構(gòu)。卷積運(yùn)算單元102在從代數(shù)碼本101輸入的脈沖音源矢量上,卷積另外輸入的、 在負(fù)的時(shí)間具有值的脈沖響應(yīng)矢量,并將卷積的結(jié)果的矢量作為固定碼本矢量輸出。雖然在負(fù)的時(shí)間具有值的脈沖響應(yīng)矢量可以為任意的形狀,但是在時(shí)間0的點(diǎn)的元素的振幅最大,而且時(shí)間0的點(diǎn)占有矢量整體的能量的多半的形狀的矢量較適宜。另外,對(duì)于非因果的部分(也就是負(fù)的時(shí)間的矢量元素)而言,矢量長(zhǎng)度比包含時(shí)間0的點(diǎn)的因果的部分(也就是非負(fù)的時(shí)間的矢量元素)短的矢量較適宜。在負(fù)的時(shí)間具有值的脈沖響應(yīng)矢量既可以作為固定的矢量預(yù)先記憶在存儲(chǔ)器,也可以為通過(guò)逐次計(jì)算求出的可變的矢量。以下,在本實(shí)施方式中,具體地說(shuō)明在負(fù)的時(shí)間具有值的脈沖響應(yīng)從時(shí)間“-m”開始具有值(也就是時(shí)間“-m-1”以前全都為0)的例子。在圖1中,使參照所輸入的固定碼本索引k根據(jù)固定碼本生成的脈沖聲源矢量ck, 通過(guò)卷積濾波器F(相當(dāng)于圖1中的卷積運(yùn)算單元10 和未圖示的聽覺加權(quán)合成濾波器H, 由此得到的聽覺加權(quán)合成信號(hào)s如下式(1)那樣表示。s = HFck
權(quán)利要求
1.一種固定碼本搜索裝置,包括卷積運(yùn)算單元,向在負(fù)的時(shí)間具有非零值的脈沖響應(yīng)矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應(yīng),以生成在負(fù)的時(shí)間具有非零值的第二脈沖響應(yīng)矢量;矩陣生成單元,利用由所述卷積運(yùn)算單元生成的第二脈沖響應(yīng)矢量生成特普利茨型的卷積矩陣;以及搜索單元,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進(jìn)行碼本搜索, 所述第二脈沖響應(yīng)矢量的負(fù)的時(shí)間分量的時(shí)間長(zhǎng)度比非負(fù)的時(shí)間分量的時(shí)間長(zhǎng)度短。
2.如權(quán)利要求1所述的固定碼本搜索裝置,所述第二脈沖響應(yīng)矢量包括一個(gè)負(fù)的時(shí)間分量。
全文摘要
公開了固定碼本搜索裝置,即使聲源脈沖所通過(guò)的濾波器具有無(wú)法用下三角矩陣表示的特性,也將運(yùn)算量的增加抑制得較小,從而實(shí)現(xiàn)次優(yōu)的固定碼本搜索。在該固定碼本搜索裝置中,包括卷積運(yùn)算單元,向在負(fù)的時(shí)間具有非零值的脈沖響應(yīng)矢量上卷積聽覺加權(quán)合成濾波器的脈沖響應(yīng),以生成在負(fù)的時(shí)間具有非零值的第二脈沖響應(yīng)矢量;矩陣生成單元,利用由所述卷積運(yùn)算單元生成的第二脈沖響應(yīng)矢量生成特普利茨型的卷積矩陣;以及搜索單元,使利用了所述特普利茨型的卷積矩陣的數(shù)式最大,以進(jìn)行碼本搜索,所述第二脈沖響應(yīng)矢量的負(fù)的時(shí)間分量的時(shí)間長(zhǎng)度比非負(fù)的時(shí)間分量的時(shí)間長(zhǎng)度短。
文檔編號(hào)G10L19/10GK102194462SQ20111018773
公開日2011年9月21日 申請(qǐng)日期2007年3月8日 優(yōu)先權(quán)日2006年3月10日
發(fā)明者吉田幸司, 江原宏幸 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社