專利名稱:可擴展性編碼裝置以及可擴展性編碼方法
技術(shù)領域:
本發(fā)明涉及對立體聲語音信號進行CELP方式的編碼處理(以下有時只簡稱為CELP編碼)從而實現(xiàn)可擴展性編碼處理的可擴展性編碼裝置以及可擴展性編碼方法。
背景技術(shù):
正像通過便攜式電話進行通話那樣,現(xiàn)在移動通信系統(tǒng)中的語音通信以單聲道方式進行的通信(單聲道通信)為主流。但是,今后像第四代移動通信系統(tǒng)那樣,隨著傳輸速率更高的比特速率高速化的實現(xiàn),因為能夠確保用于傳輸多個聲道的頻寬,所以期待著在語音通信中普及通過立體聲方式的通信(立體聲通信)。
比如,將音樂存儲于裝載了HDD(硬盤)的便攜式音頻播放器(audioplayer),并在該播放器安裝用于立體聲的耳塞機或耳機等來欣賞立體聲音樂的用戶越來越多,考慮到這樣的現(xiàn)狀可以預測到,今后將便攜式電話與音樂播放器結(jié)合在一起,在使用用于立體聲的耳塞機或耳機等的配件的同時,進行通過立體聲方式的語音通信的生活方式將廣為普及。另外,在逐漸普及起來的電視會議等的環(huán)境中,為了使富有臨場感的對話成為可能,預計也要進行立體聲通信。
但是可以預計,即使立體聲通信得到普及,仍然要進行單聲道通信。這是因為單聲道通信利用低比特速率,所以可以期待降低通信成本,而且只適合單聲道通信的便攜式電話能夠縮小電路規(guī)模而價格低廉,不需要高品質(zhì)語音通信的用戶可能購買只適合單聲道通信的便攜式電話。因此,在一個通信系統(tǒng)中,同時存在適合立體聲通信的便攜式電話和適合單聲道通信的便攜式電話,通信系統(tǒng)需要同時適合立體聲通信以及單聲道通信。
另外,移動通信系統(tǒng)通過無線信號進行通信數(shù)據(jù)的交換,因此根據(jù)傳播路徑環(huán)境,有時丟失一部分通信數(shù)據(jù)。因此,對于以上的情況,如果有一種便攜式電話具有能夠由剩余的接收數(shù)據(jù)恢復原來的通信數(shù)據(jù)的功能的話,將非常具有實用價值。
存在通過立體聲信號和單聲道信號構(gòu)成的可擴展性編碼技術(shù),其具有如下功能能夠同時支持立體聲通信以及單聲道通信,并且即使通信數(shù)據(jù)的一部分發(fā)生了丟失,也能夠由剩余的接收數(shù)據(jù)恢復原來的通信數(shù)據(jù),。作為具有該功能的可擴展性編碼裝置的例子,比如有非專利文獻1所公開的裝置。
ISO/IEC 14496-31999 (B.14 Scalable AAC with core coder)發(fā)明內(nèi)容發(fā)明要解決的問題但是,非專利文獻1所公開的可擴展性編碼裝置以音頻信號為對象而沒有考慮到語音信號,因此對語音信號原封不動地應用可擴展性編碼,會發(fā)生編碼效率下降的問題。特別是,對于語音信號,最佳的是應用能夠高效地進行編碼處理的CELP編碼,但是在非專利文獻1中并沒有公開適用CELP方式的情形的具體配置,特別是將CELP編碼處理適用于擴展層,對于未經(jīng)估計的語音信號原封不動地應用最佳化的CELP編碼處理,很難得到所期望的編碼效率。
因此,本發(fā)明旨在提供一種可擴展性編碼裝置以及可擴展性編碼方法,能夠?qū)αⅢw聲語音信號實現(xiàn)通過CELP編碼處理的可擴展性編碼,從而能夠提高編碼效率。
解決該問題的方案本發(fā)明的可擴展性編碼裝置,采取以下的結(jié)構(gòu),包括生成單元,由立體聲語音信號生成單聲道語音信號;第一編碼單元,對所述單聲道語音信號通過CELP方式進行編碼處理,得到所述單聲道語音信號的編碼參數(shù);以及第二編碼單元,將所述立體聲語音信號的R聲道或者L聲道的任意一個作為編碼對象聲道,對所述編碼對象聲道進行線性預測分析以及自適應音源代碼本搜索而取得參數(shù),求取該參數(shù)與所述單聲道語音信號的編碼參數(shù)的差分,并由該差分取得所述編碼對象聲道的編碼參數(shù)。
發(fā)明有益效果根據(jù)本發(fā)明,對立體聲語音信號能夠?qū)崿F(xiàn)通過CELP編碼處理的可擴展性編碼,從而能夠提高編碼效率。
圖1是表示實施例1的可擴展性編碼裝置的主要結(jié)構(gòu)的方框圖;圖2是表示單聲道信號與第一聲道信號以及第二聲道信號之間的關(guān)系的圖;圖3是表示實施例1的CELP編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖4是表示實施例1的第一聲道差分信息編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖5是表示實施例2的可擴展性編碼裝置的主要結(jié)構(gòu)的方框圖;以及圖6是表示實施例2的第二聲道差分信息編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
具體實施例方式
以下,參照附圖詳細說明本發(fā)明的實施例。另外,在此,說明對由2個聲道構(gòu)成的立體聲語音信號進行編碼處理的情形的例子,而且,下面表示的第一聲道以及第二聲道分別為L聲道以及R聲道,或者R聲道以及L聲道。
(實施例1)圖1是表示本發(fā)明實施例1的可擴展性編碼裝置100的主要結(jié)構(gòu)的方框圖。該可擴展性編碼裝置100包括加法器101、乘法器102、CELP編碼單元103以及第一聲道差分信息編碼單元104。
可擴展性編碼裝置100的各個部分進行以下的操作。
加法器101對輸入到可擴展性編碼裝置100的第一聲道信號CH1以及第二聲道信號CH1進行加法處理,生成相加信號。乘法器102將該相加信號乘以1/2,使其的標量減半,生成單聲道信號M。也就是,加法器101以及乘法器1 02求取第一聲道信號CH1以及第二聲道信號CH2的平均信號,使其作為單聲道信號M。
CELP編碼單元103對該單聲道信號M進行CELP編碼處理,并將得到的單聲道信號的CELP編碼參數(shù)輸出到可擴展性編碼裝置100的外部以及第一聲道差分信息編碼單元104。這里,CELP編碼參數(shù)為LSP參數(shù)、自適應音源代碼本索引、自適應音源增益、固定音源代碼本索引以及固定音源增益。
第一聲道差分信息編碼單元104對輸入到可擴展性編碼裝置100的第一信道信號CH1進行基于CELP編碼的編碼處理,也就是通過進行線性預測分析、自適應音源代碼本搜索以及固定音源代碼本搜索而進行編碼處理,并求取在該過程得到的編碼參數(shù)與從CELP編碼單元103輸出的CELP編碼參數(shù)的差分。另外,如果對于該編碼處理也簡單稱為CELP編碼處理的話,則以上的處理相當于對單聲道信號M與第一聲道信號CH1在CELP編碼參數(shù)的水平(階段)求取差分。繼而,第一聲道差分信息編碼單元104對該有關(guān)第一聲道的差分信息(第一聲道差分信息)進行編碼,并將得到的第一聲道差分信息的編碼參數(shù)輸出到可擴展性編碼裝置100的外部。
該可擴展性編碼裝置100的一個特征在于由加法器101、乘法器102以及CELP編碼單元103構(gòu)成第一層,由第一聲道差分信息編碼單元104構(gòu)成第二層,從第一層輸出單聲道信號的編碼參數(shù),從第二層輸出編碼參數(shù),對該編碼參數(shù)與第一層(單聲道信號)的編碼參數(shù)一起進行解碼處理能夠得到立體聲信號。也就是,本實施例的可擴展性編碼裝置實現(xiàn)由單聲道信號和立體聲信號構(gòu)成的可擴展性編碼。
根據(jù)該結(jié)構(gòu),取得由上述第一層以及第二層構(gòu)成的編碼參數(shù)的解碼裝置可為同時適合立體聲通信以及單聲道通信的可擴展性解碼裝置,也可為只適合單聲道通信的解碼裝置。另外,即使是同時適合立體聲通信以及單聲道通信的可擴展性解碼裝置,也存在由于傳播路徑的環(huán)境惡化,不能取得第二層的編碼參數(shù)而只能取得第一層的編碼參數(shù)的情形。但是,對于上述的情形,該可擴展性解碼裝置也能夠解碼單聲道信號,雖然該單聲道信號的質(zhì)量較低。另外,該可擴展性解碼裝置在能夠取得第一層以及第二層的編碼參數(shù)時,能夠利用兩者的參數(shù)解碼高品質(zhì)的立體聲信號。
在下面,說明解碼裝置能夠利用從可擴展性編碼裝置100輸出的第一層以及第二層的編碼參數(shù),解碼立體聲信號的原理。圖2是表示對于單聲道信號與第一信道信號以及第二信道信號之間的關(guān)系,比較編碼處理前后的狀態(tài)的圖。
單聲道信號M能夠通過在第一聲道信號CH1以及第二聲道信號CH2的相加信號上乘上1/2,也就是通過下式等式(1)求取。
M=(CH1+CH2)/2 等式(1)也就是,設對于單聲道信號M的CH1的差分(第一聲道信號差分)為ΔCH1,則CH1如圖2A所示,滿足下式等式(2)的關(guān)系。
CH1=M+ΔCH1等式(2)
由此可以知道,當CH1為編碼參數(shù)時,為了將其解碼只需解碼M以及ΔCH1的兩者的編碼參數(shù)即可。
同樣地,對于第二聲道信號CH2,設對于單聲道信號M的CH2的差分(第二聲道信號差分)為ΔCH2,則具有下式等式(3)的關(guān)系。
CH2=M+ΔCH2 等式(3)于是,如果能夠像以下的等式(4)那樣近似的話,上述等式(3)變化成等式(5)。
ΔCH1=-ΔCH2等式(4)CH2=M-ΔCH1 等式(5)由此可以知道,上述等式(4)的近似如果成立的話,與CH1的編碼參數(shù)相同,通過解碼M以及ΔCH1的兩者的編碼參數(shù)就可以間接地解碼CH2的編碼參數(shù)。
但是,經(jīng)過編碼處理通常會發(fā)生編碼失真,如圖2B所示,在經(jīng)編碼處理后,嚴格地來講ΔCH1與ΔCH2的大小發(fā)生了變化。因此,上述等式(4)的意思為,編碼處理后的第一聲道差分信息以及第二聲道差分信息的大小近似為相同,換句話說,在分別對第一聲道以及第二聲道進行編碼時的兩者的編碼失真近似為相同。實際上,這些編碼失真即使在實際的裝置上也不會存在很大的變化,因此可以考慮為,即使忽視第一聲道以及第二聲道的編碼失真的差而進行編碼處理,也不會導致解碼信號的音質(zhì)發(fā)生顯著的惡化。
于是,本實施例的可擴展性編碼裝置100利用上述的原理,輸出M以及ΔCH1的2個編碼參數(shù)。取得這些參數(shù)的解碼裝置通過解碼M以及ΔCH1,不僅能夠解碼CH1,還能夠解碼CH2。
圖3是表示CELP編碼單元103內(nèi)部的主要結(jié)構(gòu)的方框圖。
該CELP編碼單元103包括LPC分析單元111、LPC量化單元112、LPC合成濾波器113、加法器114、聽覺加權(quán)單元115、失真最小化單元116、自適應音源代碼本117、乘法器118、固定音源代碼本119、乘法器120、增益代碼本121以及加法器122。
LPC分析單元111對從乘法器102輸出的單聲道信號M進行線性預測分析,并將作為分析結(jié)果的LPC參數(shù)輸出到LPC量化單元112以及聽覺加權(quán)單元115。
LPC量化單元112將從LPC分析單元111輸出的LPC參數(shù)變換為適于進行量化的LSP參數(shù)后進行量化,并將得到的量化LSP參數(shù)(CL)輸出到CELP編碼單元103的外部。該量化LSP參數(shù)為通過CELP編碼單元103得到的CELP編碼參數(shù)的其中一個。另外,LPC量化單元112將該量化LSP參數(shù)再次變換為量化LPC參數(shù)后,將其輸出到LPC合成濾波器113。
LPC合成濾波器113利用從LPC量化單元112輸出的量化LPC參數(shù),將由后述的自適應音源代碼本117以及固定音源代碼本119生成的音源矢量作為驅(qū)動音源,通過LPC合成濾波器進行合成。將得到的合成信號輸出到加法器114。
加法器114反轉(zhuǎn)從LPC合成濾波器113輸出的合成信號的極性,通過與單聲道信號M進行相加而計算誤差信號,并將該誤差信號輸出到聽覺加權(quán)單元115。該誤差信號相當于編碼失真。
聽覺加權(quán)單元115使用基于從LPC分析單元111輸出的LPC參數(shù)而構(gòu)成的聽覺加權(quán)濾波器,對從加法器114輸出的編碼失真進行聽覺加權(quán)處理,并將該信號輸出到失真最小化單元116。
失真最小化單元116對自適應音源代碼本117、固定音源代碼本119以及增益代碼本121指示各種參數(shù),以使從聽覺加權(quán)單元115輸出的編碼失真成為最小。具體而言,失真最小化單元116對自適應音源代碼本117、固定音源代碼本119以及增益代碼本121指示使用的索引(CA、CD、CG)。
自適應音源代碼本117將過去生成的、去往LPC合成濾波器113的驅(qū)動音源的音源矢量存儲于內(nèi)部緩沖器,基于對應于由失真最小化單元116指示的索引的自適應音源延遲,從該被存儲的音源矢量中取出相當于一個子幀的矢量,并作為自適應音源矢量輸出到乘法器118。
固定音源代碼本119將對應于由失真最小化單元116指示的索引的音源矢量作為固定音源矢量輸出到乘法器120。
增益代碼本121生成對應于由失真最小化單元116指示的索引的增益,具體而言,生成對應于來自自適應音源代碼本117的自適應音源矢量以及來自固定音源代碼本119的固定音源矢量的各個增益,并分別輸出到乘法器118和乘法器120。
乘法器118將從增益代碼本121輸出的自適應音源增益乘于從自適應音源代碼本117輸出的自適應音源矢量,并輸出到加法器122。
乘法器120將從增益代碼本121輸出的固定音源增益乘于從固定音源代碼本119輸出的固定音源矢量,并輸出到加法器122。
加法器122將從乘法器118輸出的自適應音源矢量和從乘法器120輸出的固定音源矢量相加,并將相加后的音源矢量作為驅(qū)動音源輸出到LPC合成濾波器113。另外,加法器122將得到的驅(qū)動音源的音源矢量反饋給自適應音源代碼本117。
LPC合成濾波器113如上所述,從加法器122輸出的音源矢量,也就是通過自適應音源代碼本117以及固定音源代碼本119生成的音源矢量,作為驅(qū)動音源,通過LPC合成濾波器進行合成。
像這樣,利用由自適應音11源代碼本117以及固定音源代碼本119生成的音源矢量求取編碼失真的一系列處理為閉環(huán)(反饋環(huán)),并且失真最小化單元116對自適應音源代碼本117、固定音源代碼本119以及增益代碼本121進行指示以使該編碼失真成為最小。繼而,失真最小化單元116將使編碼失真成為最小的各種CELP編碼參數(shù)(CA、CD、CG)輸出到CELP編碼單元103的外部。
圖4是表示第一聲道差分信息編碼單元104內(nèi)部的主要結(jié)構(gòu)的方框圖。
該第一聲道差分信息編碼單元104對第一聲道信號CH1的音源分量的參數(shù)和單聲道信號M的頻譜包絡分量的參數(shù)之間的差分進行編碼處理。這里,音源分量的參數(shù)為,自適應音源代碼本索引、自適應音源增益、固定音源代碼本索引以及固定音源增益,另外,頻譜包絡分量的參數(shù)為進行LPC分析而得到的LPC參數(shù)。
另外,在第一聲道差分信息編碼單元104中,LPC分析單元131、LPC合成濾波器133、加法器134、聽覺加權(quán)單元135、失真最小化單元136、乘法器138、乘法器140以及加法器142與上述的CELP編碼單元103中的,LPC分析單元111、LPC合成濾波器113、加法器114、聽覺加權(quán)單元115、失真最小化單元116、乘法器118、乘法器120以及加法器122分別具有相同的結(jié)構(gòu),因此省略其說明,以下詳細地說明與CELP編碼單元103不同的結(jié)構(gòu)。
差分量化單元132求取通過LPC分析單元131得到的第一聲道信號CH1的LPC參數(shù)ω1(i)與在CELP編碼單元103已經(jīng)求出的單聲道信號M的LPC參數(shù)(CL)之間的差分,通過對該差分進行量化,作為第一聲道差分信息的頻譜包絡分量的編碼參數(shù)Δω1(i),輸出到第一聲道差分信息編碼單元104的外部。另外,差分量化單元132將第一聲道信號的LPC參數(shù)的量化參數(shù)ω1(i)輸出到LPC合成濾波器133。
增益代碼本143基于從CELP編碼單元103輸出的用于單聲道信號的增益代碼本索引,生成與其對應的自適應音源增益以及固定音源增益,分別輸出到乘法器138、140。
自適應音源代碼本137將在以前的子幀中生成出的驅(qū)動音源存儲于內(nèi)部緩沖器。當為有聲語音時,自適應音源代碼本137的緩沖器的以前的驅(qū)動音源與當前幀的音調(diào)波形的驅(qū)動音源波形具有很強的相關(guān),因此自適應音源代碼本137提取(extract)相當于該音調(diào)周期的以前的驅(qū)動音源,并將以其為周期而重復的信號作為驅(qū)動音源的第一近似。繼而,自適應音源代碼本137對該音調(diào)周期,也就是自適應音源延遲進行編碼。特別是,自適應音源代碼本137對CH1的音調(diào)周期,作為與經(jīng)CELP編碼單元103進行編碼處理過的單聲道信號M的音調(diào)周期的差分進行編碼。這是因為,單聲道信號M為由第一聲道信號CH1與第2聲道信號CH2生成的信號,因此可以認為自然與第一聲道信號CH1高度類似。也就是,這是因為可以認為,對于第一聲道信號CH1,與其重新進行自適應音源代碼本搜索,不如以對單聲道信號M得到的音調(diào)周期為基準,作為與該音調(diào)周期的差分來表現(xiàn)第一聲道信號CH1的音調(diào)周期時的編碼效率高。具體而言,利用對于單聲道信號已經(jīng)計算出來的音調(diào)周期TM和從該值計算出的差分參數(shù)的ΔT1,將CH1的音調(diào)周期T1用下面的等式(6)表示,將用于通過對CH1進行自適應音源代碼本搜索得到最佳的T1時的差分參數(shù)ΔT1編碼。
T1=TM+ΔT1等式(6)固定音源代碼本139對于當前幀的音源分量中不能由自適應音源代碼本137基于以前的音源所生成的音源信號近似的殘余差分分量,生成表現(xiàn)該分量的音源信號。該殘余差分分量與由自適應音源代碼本137生成的分量相比較,相對來講對合成信號的貢獻較小。另外,就像上述說明一樣,單聲道信號M和第一聲道信號CH1的類似性較高。因此,固定音源代碼本139使用固定音源代碼本119所使用的用于單聲道信號M的固定音源代碼本索引作為CH1的固定音源代碼本索引。這相當于,使CH1的固定音源矢量成為與單聲道信號的固定音源矢量相同的信號。
增益代碼本141將用于CH1的自適應音源矢量的增益通過以下兩個參數(shù)來確定,即用于單聲道信號的自適應音源增益和用于乘以該自適應音源增益的系數(shù)。另外,對于用于CH1的固定音源矢量的增益,增益代碼本141同樣地通過以下兩個參數(shù)來確定,即通過用于單聲道信號的固定音源增益和用于乘以該固定音源增益的系數(shù)。而且,這兩個系數(shù)作為共有的增益乘數(shù)γ1被確定,并輸出到乘法器144。γ1的確定方法為,從預先準備的用于CH1的增益代碼本中選擇最佳的增益索引,使CH1的合成信號和CH1的源信號的誤差成為最小。
乘法器144對從加法器142輸出的驅(qū)動音源ex1’乘以γ1得到ex1,并輸出到LPC合成濾波器133。
像這樣,根據(jù)本實施例,由構(gòu)成立體聲信號的第一聲道信號CH1和第二聲道信號CH2生成單聲道信號,進行單聲道信號的CELP編碼處理,同時在對CH1進行編碼處理時,將作為與單聲道信號的CELP參數(shù)的差分進行編碼處理。因此,能夠?qū)崿F(xiàn)比特速率低且質(zhì)量高的立體聲信號的編碼處理。
另外,在以上的結(jié)構(gòu)中,ΔCH1的編碼方法為利用單聲道信號的CELP編碼參數(shù)和對其的差分參數(shù),確定CELP編碼的差分參數(shù),以使由這些生成的CH1的合成信號和CH1的源信號之間的誤差成為最小。
另外,在以上的結(jié)構(gòu)中,第二層的編碼對象不為單聲道信號和第一聲道信號在波形上的差分,而為在CELP編碼參數(shù)的階段求取出來的差分。該理由為,CELP編碼原本為通過對人的聲帶/聲道建模來進行編碼處理的技術(shù),可以認為在波形上求取差分的話,得到的差分信息與CELP編碼的模型實際上并不對應。因此,可以認為以波形上的差分為對象進行CELP編碼不能高效地進行編碼處理,本發(fā)明在CELP編碼參數(shù)的階段求取差分。
另外,在以上的結(jié)構(gòu),對于單聲道信號的CH2的差分ΔCH2,設通過上述的近似式等式(4)來求取,而不進行編碼處理。而且,接收由本實施例的可擴展性編碼裝置生成出來的編碼參數(shù)的解碼裝置能夠利用接收的ΔCH1的編碼參數(shù),通過上述等式(5)的計算得到解碼信號。
另外,本實施例說明了以下的例子,即固定音源代碼本139使用與固定音源代碼本119相同的索引的情形,也就是固定音源代碼本139生成與用于單聲道的固定音源矢量相同的固定音源矢量的情形。但是,本發(fā)明并不只限于此,比如為了求取與單聲道信號的固定音源矢量相加的附加性固定音源矢量,對固定音源代碼本139進行固定音源代碼本搜索,求取用于附加于CH1的固定音源代碼本索引也是可以的。此時,雖然增加了編碼比特速率,但是能夠?qū)崿F(xiàn)更高音質(zhì)的CH1的編碼。
另外,本實施例說明了以下的例子,即如從增益代碼本141輸出的γ1那樣,共用與自適應音源增益相乘的系數(shù)和與固定音源增益相乘的系數(shù)的情形。但是,不共用這兩個系數(shù)也是可以的。也就是,設與自適應音源增益相乘的系數(shù)為γ1,設與固定音源增益相乘的系數(shù)為γ2,并分別進行編碼也是可以的。在以上的情形,γ1的確定方法與共用增益的情形相同,從預先準備的用于CH1的增益代碼本中選擇最佳的增益索引,使CH1的合成信號和CH1的源信號的誤差成為最小。此時,γ2的確定方法與γ1的確定方法相同,即從預先準備的用于CH2的增益代碼本中選擇最佳的增益索引,使CH2的合成信號和CH2的源信號的誤差成為最小。
(實施例2)在實施例1中,表示了假設第一聲道的編碼失真與第二聲道的編碼失真近似為相等,通過第一層以及第二層的兩層進行編碼處理的可擴展性編碼裝置的結(jié)構(gòu)。在本實施例中表示以下的結(jié)構(gòu),即為了更加精確地對CH2進行編碼處理而追加了第三層,在該第三層,對第一聲道以及第二聲道的編碼失真的差進行編碼處理,更加具體的為下述步驟,即對包含于第一聲道差分信息的編碼失真和包含于第二聲道差分信息的編碼失真之間的差分進一步進行編碼處理,并將其作為新的編碼信息而輸出。
具體而言,定義以下的ΔCH2’,以減少包含于ΔCH1的量化誤差(編碼失真)并進行編碼處理。更加具體的為下述處理,對CH2的預測信號CH2’與CH2的差分信號ΔCH2’(=CH2-M+ΔCH1)進行編碼處理,所述預測信號CH2’是根據(jù)經(jīng)第一層編碼處理的單聲道信號以及經(jīng)第二層編碼處理的ΔCH1估計出的CH2的預測信號CH2’(=M-ΔCH1)。
這里,ΔCH2’的編碼方法為確定校正參數(shù),所述校正參數(shù)是使利用該參數(shù)和CH2的CELP編碼參數(shù)生成出的CH2的合成信號與CH2的源信號之間的誤差成為最小的校正參數(shù),所述CH2的合成信號是利用通過單聲道信號的CELP編碼參數(shù)以及經(jīng)第二層編碼處理的差分CELP編碼參數(shù)的兩者的參數(shù)而估計出的CH2的CELP編碼參數(shù),以及對其進行校正的參數(shù)(即所述校正參數(shù))而生成出的合成信號。與第二層相同,不對在波形上的差分本身進行CELP編碼處理的理由與實施例1相同。
由此,使單聲道信號與立體聲信號具有可擴展性、精確度良好且高效的立體聲編碼成為可能。使用單聲道的參數(shù)以及對于CH1的單聲道的差分參數(shù),估計CH2的CELP編碼參數(shù),并對與其對應的誤差分量進行編碼,通過這樣的結(jié)構(gòu)能夠進行更有效率的編碼處理。
圖5是表示本發(fā)明實施例2的可擴展性編碼裝置200的主要結(jié)構(gòu)的方框圖。該可擴展性編碼裝置200具有與實施例1所示的可擴展性編碼裝置100相同的基本結(jié)構(gòu)。對于相同的構(gòu)成元素賦予相同的標號,并省略其說明。追加的結(jié)構(gòu)為構(gòu)成第三層的第二聲道差分信息編碼單元201。
圖6是表示第二聲道差分信息編碼單元201內(nèi)部的主要結(jié)構(gòu)的方框圖。
另外,在該第二聲道差分信息編碼單元201中,LPC分析單元211、差分量化單元212、LPC合成濾波器213、加法器214、聽覺加權(quán)單元215、失真最小化單元216、自適應音源代碼本217、乘法器218、固定音源代碼本219、乘法器220、增益代碼本221、加法器222、增益代碼本223以及乘法器224與上述的第一聲道差分信息編碼單元的,LPC分析單元131、差分量化單元132、LPC合成濾波器133、加法器134、聽覺加權(quán)單元135、失真最小化單元136、自適應音源代碼本137、乘法器138、固定音源代碼本139、乘法器140、增益代碼本141、加法器142、增益代碼本143以及乘法器144分別具有相同的結(jié)構(gòu),因此省略其說明。
第二聲道延遲參數(shù)估計單元225使用單聲道信號的音調(diào)周期TM和作為CH1的CELP編碼參數(shù)的ΔT1,預測CH2的音調(diào)周期(自適應音源延遲),并將預測值T2’輸出到自適應音源代碼本217。這里,CH1的CELP編碼參數(shù)ΔT1可以作為對于單聲道信號的音調(diào)周期TM和CH1的音調(diào)周期T1的差分而求出。
第二聲道LPC參數(shù)估計單元226使用單聲道信號的LPC參數(shù)ωM(i)和CH1的LPC參數(shù)ω1(i)預測CH2的LPC參數(shù),并將預測值ω2’(i)輸出到差分量化單元212。
第二聲道音源增益估計單元227利用單聲道信號的驅(qū)動音源可以根據(jù)CH1以及CH2的驅(qū)動音源通過上述等式(1)求取的事實,根據(jù)CH1的增益乘數(shù)γ1通過逆向運算預測CH2的增益乘數(shù),并將預測值γ2’輸出到乘法器228。該預測值γ2’乘以從增益代碼本221輸出的第二聲道音源增益Δγ2。
通過失真最小化單元216控制的閉環(huán)的編碼處理,也就是第二聲道信號CH2的音調(diào)周期(自適應音源遲延)T2的編碼處理方法為,利用經(jīng)編碼處理的單聲道信號的音調(diào)周期TM、和該TM與CH1的音調(diào)周期T1的差分的ΔT1,預測CH2的音調(diào)周期T2(預測值T2’),并對從T2到該預測出的音調(diào)周期的T2’為止的差分(誤差分量)ΔT2進行編碼處理而實現(xiàn)。首先,假設以下的等式(7)。
TM≌(Y1+T2)/2等式(7)另外,因為存在以下的等式(8)的關(guān)系,由上述等式(7),T2的預測值T2’表示為到等式(9)。
T1=TM+ΔT1等式(8)T2′=2TM-T1等式(9)將該等式(8)代入等式(9)成為以下的等式(10)。
T2′=TM-ΔT1等式(10)因此,將CH2的音調(diào)周期T2用其預測值T2’和其對應的校正值ΔT2,通過以下的等式(11)來表示。
T2=T2′+ΔAT2等式(11)將等式(10)代入等式(11)成為以下的等式(12)。
T2=(TM-ΔT1)+ΔT2等式(12)本實施例的可擴展性編碼裝置對校正參數(shù)ΔT2進行編碼處理,所述校正參數(shù)ΔT2是對CH2進行自適應音源代碼本的搜索而得到最佳的T2時的校正參數(shù)ΔT2。這里,因為ΔT2為對于預測值的差分分量,所以與ΔT1相比微不足道,從而能夠更加有效地進行編碼處理,所述預測值是利用單聲道的參數(shù)TM以及CH1中的對于單聲道的差分參數(shù)ΔT1而估計出的預測值。
固定音源代碼本219與第一聲道差分信息編碼單元104的固定音源代碼本139類似,在當前幀的音源分量中,生成對由自適應音源代碼本217生成的音源信號不能近似的殘余差分分量的音源信號。另外,固定音源代碼本219還是與固定音源代碼本139類似地,作為CH2的固定音源代碼本索引,使用單聲道信號M的固定音源代碼本索引。也就是,使CH2的固定音源矢量成為與單聲道信號的固定音源矢量相同的信號。
另外,與實施例1相同,為了求取與單聲道信號的固定音源矢量相加的附加性固定音源矢量,對固定音源代碼本219進行固定音源代碼本搜索,并可求取用于附加于CH2的固定音源代碼本索引也是可以的。此時,雖然增加了編碼比特速率,但是能夠?qū)崿F(xiàn)更高品質(zhì)的CH2的編碼。
增益代碼本221作為增益乘數(shù)γ2確定用于CH2的音源矢量的增益,該增益乘數(shù)γ2為共用乘于用于單聲道信號的自適應音源增益以及固定音源矢量的增益的兩者的增益乘數(shù)。具體而言,因為在CELP編碼單元103中用于單聲道信號的增益、在第一聲道差分信息編碼單元104中用于CH1的增益乘數(shù)γ1已經(jīng)求出,所以增益代碼本221,求取通過這些預測出的預測估計值γ2’,并通過決定對于該預測估計值γ2’的校正值Δγ2來確定CH2的乘數(shù)γ2。在增益代碼本中所準備的模式中,選擇使CH2的合成信號和CH2的輸入信號之間的波形失真成為最小的圖案來決定校正值Δγ2。
更為具體的是,增益代碼本221首先根據(jù)CH1的增益乘數(shù)γ1估計對于CH2的增益乘數(shù)γ2。設單聲道信號的驅(qū)動音源為exM(n),CH1的驅(qū)動音源為ex1(n)并且CH2的驅(qū)動音源為ex2(n),則成為以下的等式(13)。
exM(n)=12(ex1(n)+ex2(n))]]>等式(13)這里,設γ2的預測值為γ2’,利用以下的等式(14)、等式(15),上述等式(13)成為等式(16)。
ex1(n)=γ1·ex1′(n) 等式(14)ex2(n)=γ2′·ex2′(n)等式(15)exM(n)=12(γ1·ex1′(n)+γ2′·ex2′(n))]]>等式(16)這里,假設ex1’(n)與ex2’(n)之間的相關(guān)較高,則滿足等式(17)及等式(18)的關(guān)系。
Σnex1′(n)·ex2′(n)≅ΣnexM(n)2]]>等式(17)Σnex1′(n)2≅Σnex2′(n)2≅ΣnexM(n)2]]>等式(18)另外,取等式(16)的兩邊的平方并求和,可以得到以下的等式(19)。
ΣnexM(n)2=14(γ12Σnex1′(n)2+γ2′2Σnex2′(n)2+2γ1·γ2′Σnex1′(n)·ex2′(n))]]>等式(19)因此,將等式(17)以及等式(18)代入等式(19)成為以下的等式(20)。
ΣnexM(n)2=14ΣnexM(n)2(γ12+γ2′2+2γ1·γ2′)]]>等式(20)通過求解等式(20)的方程式可以得到以下的等式(21)的關(guān)系。
γ2′=2-γ1,-2-γ1...等式(21)這里,通過預測值γ2’和其對應的校正系數(shù)Δγ2之間的積表示γ2,則成為以下的等式(22)。
γ2=γ2′Δγ2(其中,γ2′=2-γ1)...等式(22)繼而,對得到對于CH2的最佳的γ2時的校正系數(shù)Δγ2通過增益代碼本搜索進行編碼處理。這里,因為Δγ2為對于預測值的校正分量,所以與γ1相比微不足道,從而能夠更加有效地進行編碼處理,所述預測值為利用單聲道的增益以及CH1中的對于單聲道的增益乘數(shù)γ1而估計出的預測值。
進行CH2信號的LPC分析而求出LPC參數(shù),利用已經(jīng)求出的單聲道信號的LPC參數(shù)以及對于單聲道信號的LPC參數(shù)的CH1的LPC參數(shù)的差分分量,估計CH2的LPC參數(shù),通過量化該估計參數(shù)的校正分量(誤差分量),由此得到CH2的頻譜包絡分量參數(shù)。
根據(jù)單聲道信號的LSP參數(shù)ωM(i)、以及第一聲道信號的LSP參數(shù)ω1(i)與單聲道信號的LSP參數(shù)ωM(i)之間的差分Δω1(i)的兩者求取CH2的LSP參數(shù)ω2(i)(其中,i=0,1,...,p-1)。
首先,假設以下的等式(23)。
ωM(i)≅12(ω1(i)+ω2(i))]]>等式(23)另外,CH1的LSP參數(shù)ω1(i)通過以下的等式(24)表示。
ω1(i)=ωM(i)+Δω1(i)等式(24)因此,ω2(i)的預測值ω2’(i)由根據(jù)等式(23)以及等式(24)成為的等式(25)表示。
ω2′(i)=ωM(i)-Δω1(i) 等式(25)將CH2的LSP的ω2(i),利用ω2(i)的預測值ω2’(i)以及其對應的校正分量Δω2(i)通過以下的等式(26)表示。
ω2(i)=ω2′(i)+Δω2(i)等式(26)將等式(25)代入等式(26)可以得到以下的等式(27)。
ω2(i)=ωM(i)-Δω1(i)+Δω2(i)等式(27)本實施例的可擴展性編碼裝置對Δω2(i)進行編碼處理,該Δω2(i)是對ω2(i)使量化誤差成為最小的校正值。這里,因為Δω2(i)為對于預測值的誤差分量,所以與Δω1(i)相比微不足道,從而能夠更加有效地進行編碼處理,所述預測值為利用單聲道的LSP參數(shù)以及CH1中的對于單聲道的差分參數(shù)Δω1(i)而估計出的預測值。
如上所述,根據(jù)本實施例,在ΔCH2’的編碼中確定校正參數(shù),所述校正參數(shù)是使利用該參數(shù)和CH2的CELP編碼參數(shù)生成出的CH2的合成信號與CH2的原信號之間的誤差成為最小的校正參數(shù),所述CH2的合成信號為利用通過單聲道信號的CELP編碼參數(shù)以及經(jīng)第二層編碼處理的差分CELP編碼參數(shù)的兩者的參數(shù)而估計出的CH2的CELP編碼參數(shù),以及對其進行校正的參數(shù)(即所述校正參數(shù))而生成出的合成信號。因此,能夠更加精確地對CH2進行編碼以及解碼處理。
以上說明了本發(fā)明的實施例1和2。
另外,在上述各個實施例中,雖然將單聲道信號M設為CH1與CH2的平均信號,但是并不一定只限于此。
另外,自適應音源代碼本有時也稱為自適應代碼本。另外,固定音源代碼本也有可能被稱為固定代碼本、噪聲代碼本、概率代碼本(stochasticcodebook)、或者隨機代碼本(random codebook)。
本發(fā)明的可擴展性編碼裝置,不被所示各實施例所限定,可以對本發(fā)明加以各種變更來實施。
本發(fā)明的可擴展性編碼裝置,還能夠配置于移動通信系統(tǒng)的通信終端裝置以及基站裝置,并且能夠提供由此具有同樣作用效果的通信終端裝置以及基站裝置。
另外,雖然在此以通過硬件來構(gòu)成本發(fā)明為例進行了說明,但是本發(fā)明還可以通過軟件來實現(xiàn)。
另外,用于說明上述的各個實施例的各個功能模塊,典型的由集成電路LSI(大規(guī)模集成電路)來實現(xiàn)。它們既可以分別實行單芯片化,也可以其中一部分或者是全部地包含在單個芯片中。
另外,在此雖然稱做LSI,但根據(jù)集成度的不同也可以稱為IC、系統(tǒng)LSI、超LSI、極大LSI等。
另外,集成電路化的技術(shù)不只限于LSI,也可以使用專用電路或通用處理器來實現(xiàn)。也可以利用LSI制造后能夠編程的FPGA(Field ProgrammableGate Array,現(xiàn)場可編程門陣列),或可以利用對LSI內(nèi)部的電路塊的連接或設定為進行重新配置的可重配置處理器(Reconfigurable Processor)。
再有,如果隨著半導體技術(shù)的進步或者其他技術(shù)的派生,出現(xiàn)了替換LSI集成電路的技術(shù),當然也可以利用該技術(shù)來實現(xiàn)功能塊的集成化。也有應用生物技術(shù)等的可能性。
本說明書是根據(jù)2004年9月28日提交的日本專利申請?zhí)卦傅?004-282525號。該內(nèi)容通過引用全部包括在此。
工業(yè)實用性本發(fā)明的可擴展性編碼裝置以及可擴展性編碼方法能夠適用于在移動通信系統(tǒng)中對立體聲信號進行可擴展性編碼處理的通信終端裝置、基站裝置等的用途。
權(quán)利要求
1.一種可擴展性編碼裝置,包括生成單元,由立體聲語音信號生成單聲道語音信號;第一編碼單元,對所述單聲道語音信號通過CELP方式進行編碼處理,得到所述單聲道語音信號的編碼參數(shù);以及第二編碼單元,將所述立體聲語音信號的R聲道或者L聲道的任意一個作為編碼對象聲道,對所述編碼對象聲道進行線性預測分析以及自適應音源代碼本搜索而取得參數(shù),求取該參數(shù)與所述單聲道語音信號的編碼參數(shù)的差分,并由該差分取得所述編碼對象聲道的編碼參數(shù)。
2.如權(quán)利要求1所述的可擴展性編碼裝置,其中,所述生成單元,求取所述R聲道以及所述L聲道的平均來作為所述單聲道語音信號。
3.如權(quán)利要求1所述的可擴展性編碼裝置,其中,所述第二編碼單元,使用所述單聲道語音信號的所述編碼參數(shù)的固定音源代碼本索引,作為所述編碼對象聲道的固定音源代碼本索引。
4.如權(quán)利要求1所述的可擴展性編碼裝置,其中,對所述R聲道以及L聲道中的、所述第二編碼單元的編碼對象聲道以外的聲道不進行編碼處理。
5.如權(quán)利要求1所述的可擴展性編碼裝置,還包括第三編碼單元,將所述R聲道以及L聲道中的、所述第二編碼單元的編碼對象聲道以外的聲道作為編碼對象,利用通過所述第一以及第二編碼單元得到的編碼參數(shù)來生成合成信號,并進行編碼處理以使該合成信號的編碼失真成為最小。
6.一種包括權(quán)利要求1所述的可擴展性編碼裝置的通信終端裝置。
7.一種包括權(quán)利要求1所述的可擴展性編碼裝置的基站裝置。
8.一種可擴展性編碼方法,包括生成步驟,由立體聲語音信號生成單聲道語音信號;第一編碼步驟,對所述單聲道語音信號通過CELP方式進行編碼處理,得到所述單聲道語音信號的編碼參數(shù);以及第二編碼步驟,將所述單聲道語音信號的R聲道或者L聲道的任意一個作為編碼對象聲道,對所述編碼對象聲道進行線性預測分析以及自適應音源代碼本搜索而取得參數(shù),求取該參數(shù)與所述單聲道語音信號的編碼參數(shù)的差分,并由該差分取得所述編碼對象聲道的編碼參數(shù)。
全文摘要
本發(fā)明公開一種可擴展性編碼裝置,能夠?qū)αⅢw聲語音信號實現(xiàn)通過CELP編碼處理的可擴展性編碼,從而提高編碼效率。在該裝置中,加法器(101)以及乘法器(102)求取第一聲道信號CH1以及第二聲道信號CH2的平均作為單聲道信號M。CELP編碼單元(103)對單聲道信號M進行CELP編碼處理。第一聲道差分信息編碼單元(104)對第一聲道信號CH1進行基于CELP編碼的編碼處理,并求取在該過程得到的編碼參數(shù)與從CELP編碼單元(103)輸出的編碼參數(shù)的差分。繼而,第一聲道差分信息編碼單元(104)對該差分進行編碼處理,并輸出所得到的編碼參數(shù)。
文檔編號G10L19/00GK101027718SQ20058003262
公開日2007年8月29日 申請日期2005年9月26日 優(yōu)先權(quán)日2004年9月28日
發(fā)明者后藤道代, 吉田幸司 申請人:松下電器產(chǎn)業(yè)株式會社