專利名稱:語音/音頻解碼裝置以及語音/音頻解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在將語音/音頻信號編碼并傳輸?shù)耐ㄐ畔到y(tǒng)中使用的語音/音頻解碼裝置以及語音/音頻解碼方法。
背景技術(shù):
在以數(shù)字無線通信和因特網(wǎng)通信為代表的分組通信或語音存儲等領(lǐng)域中,為實(shí)現(xiàn)電波等的傳輸路徑容量和存儲媒體的有效利用,語音信號的編碼/解碼技術(shù)不可或缺,因此至今已開發(fā)出多種語音編碼/解碼方式。其中,CELP方式的語音編碼/解碼方式已作為主流方式被付諸實(shí)用(例如,參照非專利文獻(xiàn)1)。
CELO方式的語音編碼裝置基于事先存儲的語音模型將輸入語音編碼。具體地說,將數(shù)字化語音信號劃分成大約10~20ms的幀,一幀一幀地對語音信號進(jìn)行線性預(yù)測分析,獲取線性預(yù)測系數(shù)和線性預(yù)測殘差矢量,并個別對線性預(yù)測系數(shù)和線性預(yù)測殘差矢量進(jìn)行編碼。然后,為了進(jìn)行低比特率通信,由于存儲的語音模型量是有限的,在傳統(tǒng)CELP型語音編碼/解碼方式中主要存儲發(fā)聲語音模型。
在諸如因特網(wǎng)通信之類傳輸分組的通信系統(tǒng)中,會因網(wǎng)絡(luò)狀態(tài)而發(fā)生分組丟失,因此最理想的是,即使部分編碼信息丟失,也能夠從其余編碼信息部分中解碼出語音和音頻。同樣地,在根據(jù)通信容量改變比特率的可變速率通信系統(tǒng)中,當(dāng)通信容量降低時,理想的是,通過只傳輸部分編碼信息就可以輕易地減輕通信容量的負(fù)擔(dān)。于是,作為使用所有編碼信息或僅使用部分編碼信息來解碼語音和音頻的技術(shù),最近,可擴(kuò)展編碼技術(shù)備受矚目。在以往,一些可擴(kuò)展編碼方式已被公開(例如,參照專利文獻(xiàn)1)。
可擴(kuò)展編碼方式一般包括基本層和多個增強(qiáng)層,各個層以基本層作為最低層來形成分層結(jié)構(gòu)。并且,在各個層中,對作為較低層的輸入信號和輸出信號的差的殘差信號進(jìn)行編碼。根據(jù)這個結(jié)構(gòu),能夠僅使用所有層的編碼信息或較低層的編碼信息來解碼語音/音頻。
另外,在傳輸所述分組的通信系統(tǒng)中,因分組丟失等而不能在解碼裝置側(cè)接收編碼信息時,通過丟失補(bǔ)償(隱藏)處理能夠?qū)⒔獯a語音信號的惡化抑制某些程度。例如,在ITU-T建議G.729等規(guī)定了幀丟失的隱藏方法作為解碼算法的一部分。
丟失補(bǔ)償(隱藏)處理一般是基于事前接收的幀中包含的編碼信息來進(jìn)行當(dāng)前幀的再現(xiàn)。例如,通過將丟失幀的前一個幀中包含的編碼信息用作丟失幀的編碼信息,并逐漸地使使用前一個幀中包含的編碼信息生成的解碼信號的功率衰減等方法,來形成丟失幀的解碼語音信號。
特開平10-97295號公報[非專利文獻(xiàn)1]M.R.Schroeder,B.S.Atal,″Code Excited Linear PredictionHigh Quality Speech at Low Bit Rate″,IEEE proc.,ICASSP′85pp.937-940發(fā)明內(nèi)容然而,在以往的丟失補(bǔ)償(隱藏)處理中,僅是使用丟失幀的前一個幀中包含的編碼信息來再現(xiàn)解碼語音信號,雖然能將解碼語音信號的惡化抑制某些程度,但解碼語音信號的質(zhì)量仍不能說是足夠。并且,在可擴(kuò)展編碼方式中,一般說來基本層的編碼信息的重要度高,在基本層的編碼信息因幀丟失而失去時,僅使用前一個幀中包含的編碼信息來再現(xiàn)解碼語音信號的話,不能獲得質(zhì)量充分的解碼語音信號。
本發(fā)明的目的在于提供一種在可擴(kuò)展編碼方式中,即使在發(fā)生幀丟失而失去編碼信息時也能夠獲得充分質(zhì)量的解碼語音信號的語音/音頻解碼裝置以及語音/音頻解碼方法。
本發(fā)明的語音/音頻解碼裝置是對通過可擴(kuò)展編碼由多個層構(gòu)成的編碼信息進(jìn)行解碼并生成解碼信號的語音/音頻解碼裝置,所采取的結(jié)構(gòu)包括幀丟失檢測單元,判定接收到的幀的所述各個層的編碼信息是否正常,生成作為判定結(jié)果的幀丟失信息;以及與所述層相同數(shù)量的解碼單元,基于所述幀丟失信息由所述接收到的編碼信息和之前接收到的多個編碼信息決定用于各個層的解碼的編碼信息,并使用決定的編碼信息進(jìn)行解碼來生成解碼信號。
本發(fā)明的語音/音頻解碼方法是對通過可擴(kuò)展編碼由多個層構(gòu)成的編碼信息進(jìn)行解碼并生成解碼信號的語音/音頻解碼方法,所采用的方法包括幀丟失檢測步驟,判定接收到的幀的所述各個層的編碼信息是否正常,生成作為判定結(jié)果的幀丟失信息;以及與所述層相同數(shù)量的解碼步驟,基于所述幀丟失信息由所述接收到的編碼信息和之前接收到的多個編碼信息決定用于各個層的解碼的編碼信息,并使用決定的編碼信息進(jìn)行解碼來生成解碼信號。
根據(jù)本發(fā)明,與僅使用之前獲得編碼信息的情況相比,通過除了之前獲得的編碼信息之外,還使用由其他編碼單元獲得的編碼信息來獲得解碼信號,能夠?qū)崿F(xiàn)解碼語音信號的質(zhì)量提升。
圖1是表示本發(fā)明實(shí)施方式1的編碼裝置以及解碼裝置的結(jié)構(gòu)方框圖。
圖2是表示本發(fā)明實(shí)施方式1的第一編碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖3是用于說明決定自適應(yīng)聲源延遲的處理的圖。
圖4是用于說明決定固定聲源向量的處理。
圖5是表示本發(fā)明實(shí)施方式1的第一局部解碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖6是表示本發(fā)明實(shí)施方式1的第二編碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖7是用于簡單地說明決定自適應(yīng)聲源延遲的處理的圖。
圖8是表示本發(fā)明實(shí)施方式1的第一解碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖9是表示本發(fā)明實(shí)施方式1的第二解碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖10是表示本發(fā)明實(shí)施方式1的編碼信息操作單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖11是表示本發(fā)明實(shí)施方式1的編碼信息操作單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖12是表示本發(fā)明實(shí)施方式1的幀丟失信息以及在解碼單元使用的參數(shù)的圖。
圖13是用于在從視覺上說明通過添加第二編碼信息來提高質(zhì)量的原理的圖。
圖14A是表示本發(fā)明實(shí)施方式2的語音/音頻發(fā)送裝置的結(jié)構(gòu)方框圖。
圖14B是表示本發(fā)明實(shí)施方式2的語音/音頻接收裝置的結(jié)構(gòu)方框圖。
具體實(shí)施例方式
本發(fā)明的要旨在于,在由多個編碼單元構(gòu)成的可擴(kuò)展編碼方式中,從各個編碼單元輸出編碼信息并傳輸?shù)浇獯a裝置側(cè),在解碼裝置側(cè)判定編碼信息是否沒有丟失地被傳輸,在檢測出編碼信息的丟失時,通過除了丟失幀的前一個幀的編碼信息之外,還使用從其他編碼單元輸出的編碼信息來進(jìn)行解碼,能夠?qū)崿F(xiàn)解碼語音信號的質(zhì)量提升。
下面,參照附圖詳細(xì)地說明本發(fā)明的實(shí)施方式。并且,這里以進(jìn)行CELP方式的語音/音頻編碼/解碼的情況為例進(jìn)行說明。
(實(shí)施方式1)圖1是表示本發(fā)明實(shí)施方式1的編碼裝置100以及解碼裝置150的主要結(jié)構(gòu)的方框圖。
編碼裝置100主要包括第一編碼單元101、第一局部解碼單元102、加法器103、第二編碼單元104、判定單元105、復(fù)用單元106。并且,解碼裝置150主要包括復(fù)用分離單元151、幀丟失檢測單元152、第一解碼單元153、第二解碼單元154、加法器155。從編碼裝置100輸出的編碼信息通過傳輸路徑130被傳輸?shù)浇獯a裝置150。
下面,說明編碼裝置100的各個單元的處理。作為輸入信號的語音/音頻信號被輸入到第一編碼單元101和加法器103。
第一編碼單元101使用CELP方式的語音/音頻編碼方法由輸入的語音/音頻信號求出第一編碼信息,將獲得的第一編碼信息輸出到第一局部解碼單元102和復(fù)用單元106。
第一局部解碼單元102使用CELP方式的語音/音頻解碼方法將從第一編碼單元101輸出的第一編碼信息解碼為第一解碼信號,將通過這個解碼獲得的解碼信號輸出到加法器103。
加法器103將從第一局部解碼單元102輸出的第一解碼信號的極性反轉(zhuǎn)后與輸入的語音/音頻信號相加,將作為相加結(jié)果的殘差信號輸出到第二編碼單元104。
第二編碼單元104使用CELP方式的語音/音頻編碼方法由從加法器103輸出的殘差信號求出第二編碼信息,將獲得的第二編碼信息輸出到復(fù)用單元106。
判定單元105由后述的方法生成標(biāo)記信息,將此輸出到復(fù)用單元106。這里,“標(biāo)記信息”是用于在解碼裝置150中檢測出第一編碼信息的丟失時,指示第一解碼單元153是否將第二編碼信息包含在用于解碼的編碼信息的信息。這里,使用“0”或“1”的值作為標(biāo)記信息。標(biāo)記信息為“0”時,第一解碼單元153僅使用前面幀的第一編碼信息進(jìn)行解碼,標(biāo)記信息為“1”時,第一解碼單元153使用前面幀的第一編碼信息和第二編碼信息進(jìn)行解碼。
復(fù)用單元106對從第一編碼單元101輸出的第一編碼信息、從第二編碼單元104輸出的第二編碼信息、從判定單元105輸出的標(biāo)記信息進(jìn)行復(fù)用,并作為復(fù)用信息輸出到傳輸路徑130。
在本說明書中,假設(shè)在編碼裝置100以幀為單位進(jìn)行語音/音頻信號的編碼處理,將1幀的第一編碼信息和第二編碼信息分別存儲到一個分組中并進(jìn)行傳輸。因此,一個幀內(nèi)有存儲了第一編碼信息的分組和存儲了第二編碼信息的分組的兩個分組存在。所述兩個分組按每個幀被傳輸?shù)浇獯a裝置150,在發(fā)生分組丟失時,失去第一編碼信息和第二編碼信息中的至少一個以上的編碼信息。
接著,說明解碼裝置150的各個單元的處理。復(fù)用分離單元151將從編碼裝置100傳輸?shù)膹?fù)用信息分離為第一編碼信息、第二編碼信息以及標(biāo)記信息,將分離的第一及第二編碼信息輸出到幀丟失檢測單元152,并將標(biāo)記信息輸出到第一解碼單元153。
幀丟失檢測單元152判定從復(fù)用分離單元151輸出的第一及第二編碼信息是否被正常接收,生成表示判定結(jié)果的幀丟失信息。另外,作為幀丟失的檢測方法,例如已知有對被附加在分組的識別信息進(jìn)行監(jiān)視的方法。例如,通過在接收側(cè)監(jiān)視分組的序列號(分組號)、表示分組被生成的時刻的時戳等附加在分組的識別信息,檢測這些識別信息的不連續(xù)性來檢測分組的丟失。作為識別信息,例如可利用通信協(xié)議的TCP/IP的序列號、UDP/IP的序列號、時戳信息等。
這里,使用“0”~“3”的值作為幀丟失信息。幀丟失信息在第一編碼信息和第二編碼信息都沒有被正常接收時取“0”值,在第一編碼信息被正常接收、第二編碼信息沒有被正常接收時取“1”值,在第二編碼信息被正常接收、第一編碼信息沒有被正常接收時取“2”值,在第一編碼信息和第二編碼信息都被正常接收時取“3”值。然后,幀丟失檢測單元152將幀丟失信息輸出到第一解碼單元153和第二解碼單元154。接著,幀丟失檢測單元152將被正常接收的編碼信息輸出到對應(yīng)的解碼單元。具體地說,幀丟失檢測單元152在幀丟失信息為“1”或“3”時(第一編碼信息被正常接收時),將第一編碼信息輸出到第一解碼信息153,在幀丟失信息為“2”或“3”時(第二編碼信息被正常接收時),將第二編碼信息輸出到第二解碼單元154。
第一解碼單元153從復(fù)用分離單元151輸入標(biāo)記信息,從幀丟失檢測單元152輸入幀丟失信息。并且,第一解碼單元153在內(nèi)部設(shè)有存儲前一個幀的第一編碼信息的緩沖器,在當(dāng)前幀的第一編碼信息沒有被正常接收時,在解碼時使用存儲在緩沖器的前一個幀的第一編碼信息。
接著,第一解碼單元153參照幀丟失信息,幀丟失信息為“1”或“3”時(第一編碼信息被正常接收時),從幀丟失檢測單元152輸入第一編碼信息,使用CELP方式的語音/音頻解碼方法解碼第一編碼信息,幀丟失信息為“0”時,使用CELP方式的語音/音頻解碼方法解碼前一個幀的第一編碼信息,幀丟失信息為“2”時,從第二解碼單元154輸入第二編碼信息,使用CELP方式的語音/音頻解碼方法對由第二編碼信息和前一個幀的第一編碼信息獲得的編碼信息進(jìn)行解碼。另外,第一解碼單元153在標(biāo)記信息為“0”時,不使用第二編碼信息。
這樣,在本實(shí)施方式中,在第一編碼信息被正常接收時,解碼第一編碼信息,在第一編碼信息沒有被正常接收時,解碼包含在前一個幀的第一編碼信息。并且,在本實(shí)施方式中,在第二編碼信息被正常接收且第一編碼信息沒有被正常接收時,通過除了包含在前一個幀的第一編碼信息之外,還使用第二編碼信息,由此能夠?qū)崿F(xiàn)解碼信號質(zhì)量的進(jìn)一步提升。
接著,第一解碼單元153將通過解碼獲得的第一解碼信號輸出到加法器155。另外,第一解碼單元153在幀丟失信息為“1”或“3”時,將第一編碼信息輸出到第二解碼單元154。并且,第一解碼單元153在幀丟失信息為“0”或“2”時,將前一個幀的第一編碼信息輸出到第二解碼單元154。
另外,第一解碼單元153的具體的編碼信息的解碼方法將后述。
第二解碼單元154從幀丟失檢測單元152輸入幀丟失信息。并且,第二解碼單元154在內(nèi)部設(shè)有存儲前一個幀的第二編碼信息的緩沖器,在當(dāng)前幀的第二編碼信息沒有被正常接收時,在解碼時使用存儲在緩沖器的前一個幀的第二編碼信息。
接著,第二解碼單元154參照幀丟失信息,幀丟失信息為“3”時,從幀丟失檢測單元152輸入第二編碼信息,使用CELP方式的語音/音頻解碼方法解碼第二編碼信息,幀丟失信息為“2”時,從幀丟失檢測單元152輸入第二編碼信息,并從第一解碼單元153輸入前一個幀的第一編碼信息,使用CELP方式的語音/音頻解碼方法解碼由第二編碼信息和前一個幀的第一編碼信息獲得的編碼信息,幀丟失信息為“1”時,從第一解碼單元153輸入第一編碼信息,使用CELP方式的語音/音頻解碼方法對由第一編碼信息和前一個幀的第二編碼信息獲得的編碼信息進(jìn)行解碼,幀丟失信息為“0”時,從第一解碼單元153輸入前一個幀的第一編碼信息,使用CELP方式的語音/音頻解碼方法對由前一個幀的第一編碼信息和前一個幀的第二編碼信息獲得的編碼信息進(jìn)行解碼。
這樣,第二解碼單元154在第二編碼信息沒有被正常接收時,使用第二編碼信息和第一編碼信息或前一個幀的第一編碼信息進(jìn)行解碼,在第二編碼信息沒有被正常接收時,使用前一個幀的第二編碼信息和第一編碼信息或前一個幀的第一編碼信息進(jìn)行解碼。
接著,第二解碼單元154將通過解碼獲得的第二解碼信號輸出到加法器155。另外,第二解碼單元154在幀丟失信息為“2”時,將第二編碼信息輸出到第一解碼單元153。
另外,第二解碼單元154的具體的編碼信息的解碼方法將后述。
加法器155從第一解碼單元153輸入第一解碼信號,從第二解碼單元154輸入第二解碼信號,將第一解碼信號和第二解碼信號相加,將作為相加結(jié)果的解碼信號作為輸入信號輸出。
接著,說明編碼裝置100的第一編碼單元101的內(nèi)部結(jié)構(gòu)。圖2是表示第一編碼單元101的內(nèi)部結(jié)構(gòu)的方框圖。第一編碼單元101將輸入的語音/音頻信號按N個樣本進(jìn)行劃分(N為自然數(shù)),以N個樣本作為一個幀,并對每個幀進(jìn)行編碼。
第一編碼單元101的輸入信號被輸入到預(yù)處理單元201。預(yù)處理單元201進(jìn)行除去DC(直流)成分的高通濾波處理、以及用以改善后續(xù)編碼處理的性能的波形整形處理和預(yù)加強(qiáng)處理,并將經(jīng)過這些處理后的信號(Xin)輸出到LPC分析單元202和加法器205。
LSP分析單元202使用Xin進(jìn)行線性預(yù)測分析,將作為分析結(jié)果的LPC(線性預(yù)測系數(shù))變換為LSP(Line Spectral Pairs),將變換結(jié)果作為第一LSP輸出到LSP量化單元203和判定單元105。
LSP量化單元203進(jìn)行從LSP分析單元202輸出的第一LSP的量化處理,將量化的第一LSP(第一量化LSP)輸出到合成濾波器204。并且,LSP量化單元203將表示第一量化LSP的第一量化LSP代碼(L1)輸出到復(fù)用單元214。
合成濾波器204根據(jù)基于第一量化LSP的濾波系數(shù),對從后述的加法器211輸出的驅(qū)動聲源進(jìn)行濾波合成來生成合成信號,將合成信號輸出到加法器205。
加法器205將合成信號的極性反轉(zhuǎn)后與Xin相加,由此計算誤差信號并將誤差信號輸出到聽覺加權(quán)單元212。
自適應(yīng)聲源代碼本206將之前由加法器211輸出的驅(qū)動聲源存儲在緩沖器,并且在從參數(shù)決定單元213輸出的信號所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,作為第一自適應(yīng)聲源向量輸出到乘法器209。并且,自適應(yīng)聲源代碼本206在每次從加法器211輸入驅(qū)動聲源時進(jìn)行緩沖器的更新。
量化增益生成單元207由從參數(shù)決定單元213輸出的信號決定第一量化自適應(yīng)聲源增益和第一量化固定聲源增益,并分別輸出到乘法器209和乘法器210。
固定聲源代碼本208將具有由參數(shù)決定單元213輸出的信號所指定的形狀的向量作為第一固定聲源向量輸出到乘法器210。
乘法器209將從量化增益生成單元207輸出的第一量化自適應(yīng)聲源增益與從自適應(yīng)聲源代碼本206輸出的第一自適應(yīng)聲源向量相乘,并輸出到加法器211。乘法器210將從量化增益生成單元207輸出的第一量化固定聲源增益與從固定聲源代碼本208輸出的第一固定聲源向量相乘,并輸出到加法器211。
加法器211分別從乘法器209和乘法器210輸入已乘以增益的第一自適應(yīng)聲源向量和第一固定聲源向量,將已乘以增益的第一自適應(yīng)聲源向量和第一固定聲源向量相加,將作為相加結(jié)果的驅(qū)動聲源輸出到合成濾波器204和自適應(yīng)聲源代碼本206。另外,輸入自適應(yīng)聲源代碼本206的驅(qū)動聲源被存儲在緩沖器。
聽覺加權(quán)單元212對從加法器205輸出的誤差信號進(jìn)行聽覺加權(quán),并作為編碼失真輸出到參數(shù)決定單元213。
參數(shù)決定單元213從自適應(yīng)聲源代碼本206選擇使聽覺加權(quán)單元212輸出的編碼失真最小的第一自適應(yīng)聲源延遲,并將表示選擇結(jié)果的第一自適應(yīng)聲源延遲代碼(A1)輸出到復(fù)用單元214。這里,“第一自適應(yīng)聲源延遲”是截取第一自適應(yīng)聲源向量的截取位置,詳細(xì)說明將后述。并且,參數(shù)決定單元213從固定聲源代碼本208選擇使聽覺加權(quán)單元212輸出的編碼失真最小的第一固定聲源向量,并將表示選擇結(jié)果的第一固定聲源向量代碼(F1)輸出到復(fù)用單元214。另外,參數(shù)決定單元213從量化增益生成單元207選擇使聽覺加權(quán)單元212輸出的編碼失真最小的第一量化自適應(yīng)聲源增益和第一量化固定聲源增益,并將表示選擇結(jié)果的第一量化聲源增益代碼(G1)輸出到復(fù)用單元214。
復(fù)用單元214從LSP量化單元203輸入第一量化LSP代碼(L1),從參數(shù)決定單元213輸入第一自適應(yīng)聲源延遲代碼(A1)、第一固定聲源向量代碼(F1)以及第一量化聲源增益代碼(G1),對這些信息進(jìn)行復(fù)用后作為第一編碼信息輸出。
接著,以使分配給第一量化LSP代碼(L1)的比特數(shù)為“8”,并對第一LSP進(jìn)行向量量化的情況為例,對LSP量化單元203決定第一量化LSP的處理進(jìn)行簡單的說明。
LSP量化單元203具有存儲了事先生成的256種類的第一LSP代碼向量lsp1(l1)(i)的第一LSP碼本。這里,(l1)是附加在第一LSP代碼向量的索引,取0~255的值。并且,第一LSP代碼向量lsp1(l1)(i)是N維向量,i取0~N-1的值。LSP量化單元203將從LSP分析單元202輸出的第一LSPα(i)輸入。這里,第一LSPα(i)是N維向量。
接著,LSP量化單元203基于式(1)求出第一LSPα(i)和第一LSP代碼向量lsp1(l1)(i)的均方誤差er1。
er1=Σi=0N-1(α1(i)-lsp1(l1)(i))2---(1)]]>然后,LSP量化單元203對所有l(wèi)1求出均方誤差er1,決定均方誤差er1成為最小的l1的值(l1min)。接著,LSP量化單元203將l1min作為第一量化LSP代碼(L1)輸出到復(fù)用單元214,并且,將lsp1(l1min)(i)作為第一量化LSP輸出到合成濾波器204。
這樣,由LSP量化單元203求出的lsp1(l1min)(i)就是“第一量化LSP”。
接著,使用圖3說明參數(shù)決定單元213決定第一自適應(yīng)聲源延遲的處理。在圖3,緩沖器301是備有自適應(yīng)聲源代碼本206的緩沖器,位置302是第一自適應(yīng)聲源向量的截取位置,向量303是被截取的第一自適應(yīng)聲源向量。并且,數(shù)值“41”、“296”分別對應(yīng)于移動截取位置302的范圍的下限和上限。
在分配給表示第一自適應(yīng)聲源延遲的代碼(A1)的比特數(shù)為“8”的情況,移動截取位置302的范圍可以設(shè)定在“256”的長度范圍(例如,41~296)上。并且,移動截取位置302的范圍可以任意地設(shè)定。
參數(shù)決定單元213在設(shè)定的范圍內(nèi)移動截取位置302,并依次向自適應(yīng)聲源代碼本206指示截取位置302。接著,自適應(yīng)聲源代碼本206使用由參數(shù)決定單元213指示的截取位置302,按幀長截取第一自適應(yīng)聲源向量303,并將截取的第一自適應(yīng)聲源向量輸出到乘法器209。然后,參數(shù)決定單元213對于在所有的截取位置302截取第一自適應(yīng)聲源向量303的情況,求出從聽覺加權(quán)單元212輸出的編碼失真,并決定使編碼失真最小的截取位置302。
因此,由參數(shù)決定單元213求出的緩沖器的截取位置302就是“第一自適應(yīng)聲源延遲”。
接著,參數(shù)決定單元213將表示使編碼失真最小的第一自適應(yīng)聲源延遲的第一自適應(yīng)聲源延遲代碼(A1)輸出到復(fù)用單元214。
接著,使用圖4說明參數(shù)決定單元213決定第一固定聲源向量的處理。并且,這里以分配給第一固定聲源向量代碼(F1)的比特數(shù)為“12”的情況為例進(jìn)行說明。
在圖4,軌跡(track)401、402及403分別生成1條單位脈沖(振幅值為1)。并且,乘法器404、405及406對由軌跡401、402及403生成的單位脈沖附加極性。加法器407是將生成的3條單位脈沖相加的加法器,向量408是由3條單位脈沖構(gòu)成的“第一固定聲源向量”。
各軌跡能生成的單位脈沖的位置不同,在圖4中,其構(gòu)成為,軌跡401能在然后,生成的單位脈沖分別由乘法器404、405及406附加極性,由加法器407將3條單位脈沖相加,由此構(gòu)成作為相加結(jié)果的第一固定聲源向量408。
在圖4的例子中,對于各個單位脈沖,位置有8種,極性有正負(fù)2種,所以位置信息3比特和極性信息1比特用于表現(xiàn)各單位脈沖。因此,變成合計為12比特的固定聲源代碼本。參數(shù)決定單元213為了使3條單位脈沖的生成位置和極性移動,依次將生成位置和極性指示給固定聲源代碼本208。然后,固定聲源代碼本208使用參數(shù)決定單元213指示的生成位置和極性來構(gòu)成第一固定聲源向量408,將所構(gòu)成的第一固定聲源向量408輸出到乘法器210。接著,參數(shù)決定單元213對于所有的生成位置和極性的組合,求出從聽覺加權(quán)單元212輸出的編碼失真,來決定使編碼失真最小的生成位置和極性的組合。然后,參數(shù)決定單元213將表示使編碼失真最小的生成位置和極性的組合的第一固定聲源向量代碼(F1)輸出到復(fù)用單元214。
接著,以使分配給第一量化聲源增益代碼(G1)的比特數(shù)為“8”的情況為例,對參數(shù)決定單元213決定由量化增益生成單元207生成的第一量化自適應(yīng)聲源增益和第一量化固定聲源增益的處理進(jìn)行說明。量化增益生成單元207具有存儲了事先生成的256種類的第一聲源增益代碼向量gain1(k1)(i)的第一聲源增益碼本。這里,k1是附加在第一聲源增益代碼向量的索引,取0~255的值。并且,第一聲源增益代碼向量gain1(k1)(i)是二維向量,i取0~1的值。參數(shù)決定單元213從0~255為止依次將K1的值指示給量化增益生成單元207。量化增益生成單元207使用由參數(shù)決定單元213指示的K1,從第一聲源增益碼本中選擇第一聲源增益代碼向量gain1(k1)(i),將gain1(k1)(0)作為第一量化自適應(yīng)聲源增益輸出到乘法器209,并將gain1(k1)(1)作為第一量化固定聲源增益輸出到乘法器210。
由此,由量化增益生成單元207求出的gain1(k1)(0)為“第一量化自適應(yīng)聲源增益”,gain1(k1)(1)為“第一量化固定聲源增益”。參數(shù)決定單元213對所有的k1求出由聽覺加權(quán)單元212輸出的編碼失真,并決定編碼失真最小的k1的值(k1min)。接著,參數(shù)決定單元213將k1min作為第一量化聲源增益代碼(G1)輸出到復(fù)用單元214。
接著,使用圖5表示的方框圖說明第一局部解碼單元102的內(nèi)部結(jié)構(gòu)。在圖5,輸入第一局部解碼單元102的第一編碼信息由復(fù)用分離單元501分離成各個代碼(L1、A1、G1、F1)。分離出的第一量化LSP代碼(L1)被輸出到LSP解碼單元502,分離出的第一自適應(yīng)聲源延遲代碼(A1)被輸出到自適應(yīng)聲源代碼本505,分離出的第一量化聲源增益代碼(G1)被輸出到量化增益生成單元506,分離出的第一固定聲源向量代碼(F1)被輸出到固定聲源代碼本507。
LSP解碼單元502由從復(fù)用分離單元501輸出的第一量化LSP代碼(L1)解碼第一量化LSP,將解碼的第一量化LSP輸出到合成濾波器503、第二編碼單元104和判定單元105。
自適應(yīng)聲源代碼本505在從復(fù)用分離單元501輸出的第一自適應(yīng)聲源延遲代碼(A1)指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,將截取的向量作為第一自適應(yīng)聲源向量輸出到乘法器508。并且,自適應(yīng)聲源代碼本505將第一自適應(yīng)聲源延遲代碼(A1)指定的截取位置作為第一自適應(yīng)聲源延遲輸出到第二編碼單元104。另外,自適應(yīng)聲源代碼本505在每次從加法器510輸入驅(qū)動聲源時進(jìn)行緩沖器的更新。
量化增益生成單元506對從復(fù)用分離單元501輸出的第一量化聲源增益代碼(G1)指定的第一量化自適應(yīng)聲源增益和第一量化固定聲源增益進(jìn)行解碼,將第一量化自適應(yīng)聲源增益輸出到乘法器508,并將第一量化固定聲源增益輸出到乘法器509。
固定聲源代碼本507生成從復(fù)用分離單元501輸出的第一固定聲源向量代碼(F1)指定的第一固定聲源向量,并輸出到乘法器509。
乘法器508對第一自適應(yīng)聲源向量乘以第一量化自適應(yīng)聲源增益,并輸出到加法器510。乘法器509對第一固定聲源向量乘以第一量化固定聲源增益,并輸出到加法器510。
加法器510對從乘法器508和509輸出的、已乘以增益后的第一自適應(yīng)聲源向量和第一固定聲源向量進(jìn)行相加,生成驅(qū)動聲源,并將驅(qū)動聲源輸出到合成濾波器503和自適應(yīng)聲源代碼本505。另外,輸入自適應(yīng)聲源代碼本505的驅(qū)動聲源被存儲在緩沖器。
合成濾波器503使用從加法器510輸出的驅(qū)動聲源和由LSP解碼單元502解碼的濾波系數(shù)來進(jìn)行濾波合成,將合成信號輸出到后處理單元504。
后處理單元504對從合成濾波器503輸出的合成信號進(jìn)行共振峰增強(qiáng)和音調(diào)增強(qiáng)之類的改善語音主觀質(zhì)量的處理以及改善靜態(tài)噪聲的主觀質(zhì)量的處理等,作為第一解碼信號輸出。
接著,使用圖6表示的方框圖說明第二編碼單元104的內(nèi)部結(jié)構(gòu)。第二編碼單元104將輸入的殘差信號按N個樣本進(jìn)行劃分(N為自然數(shù)),以N個樣本作為一個幀,并對每個幀進(jìn)行編碼。
第二編碼單元104的輸入信號被輸入到預(yù)處理單元601。預(yù)處理單元601進(jìn)行除去DC(直流)成分的高通濾波處理、以及用以改善后續(xù)編碼處理的性能的波形整形處理和預(yù)加強(qiáng)處理,并將經(jīng)過這些處理后的信號(Xin)輸出到LPC分析單元602和加法器605。
LSP分析單元602使用Xin進(jìn)行線性預(yù)測分析,將作為分析結(jié)果的LPC(線性預(yù)測系數(shù))變換為LSP(Line Spectral Pairs),將變換結(jié)果作為第二LSP輸出到LSP量化單元603。
LSP量化單元603輸入第一量化LSP并從LSP分析單元602輸入第二LSP。然后,LSP量化單元603將第一量化LSP的極性反轉(zhuǎn)并與第二LSP相加,由此計算出殘差LSP。然后,LSP量化單元603進(jìn)行殘差LSP的量化處理,通過將已量化的殘差LSP(量化殘差LSP)與第一量化LSP相加來計算第二量化LSP。然后,LSP量化單元603將第二量化LSP輸出到合成濾波器604,同時將表示量化殘差LSP的第二量化LSP代碼(L2)輸出到復(fù)用單元614。并且,LSP量化單元603將量化殘差LSP輸出到判定單元105。
合成濾波器604根據(jù)基于第二量化LSP的濾波系數(shù),對從后述的加法器611輸出的驅(qū)動聲源進(jìn)行濾波合成來生成合成信號,將合成信號輸出到加法器605。
加法器605將合成信號的極性反轉(zhuǎn)后與Xin相加,由此計算誤差信號并將誤差信號輸出到聽覺加權(quán)單元612。
自適應(yīng)聲源代碼本606將之前由加法器611輸出的驅(qū)動聲源存儲在緩沖器,并且在第一自適應(yīng)聲源延遲和參數(shù)決定單元613輸出的信號所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,作為第二自適應(yīng)聲源向量輸出到乘法器609。另外,自適應(yīng)聲源代碼本606在每次從加法器611輸入驅(qū)動聲源時進(jìn)行緩沖器的更新。
量化增益生成單元607由從參數(shù)決定單元613輸出的信號決定第二量化自適應(yīng)聲源增益和第二量化固定聲源增益,并分別輸出到乘法器609和乘法器610。
固定聲源代碼本608將具有由參數(shù)決定單元613輸出的信號所指定的形狀的向量作為第二固定聲源向量輸出到乘法器610。
乘法器609將從量化增益生成單元607輸出的第二量化自適應(yīng)聲源增益與從自適應(yīng)聲源代碼本606輸出的第二自適應(yīng)聲源向量相乘,并輸出到加法器611。乘法器610將從量化增益生成單元607輸出的第二量化固定聲源增益與從固定聲源代碼本608輸出的第二固定聲源向量相乘,并輸出到加法器611。
加法器611分別從乘法器609和乘法器610輸入已乘以增益的第二自適應(yīng)聲源向量和第二固定聲源向量,并將其相加,將作為相加結(jié)果的驅(qū)動聲源輸出到合成濾波器604和自適應(yīng)聲源代碼本606。另外,輸入自適應(yīng)聲源代碼本606的驅(qū)動聲源被存儲在緩沖器。
聽覺加權(quán)單元612對從加法器605輸出的誤差信號進(jìn)行聽覺加權(quán),并作為編碼失真輸出到參數(shù)決定單元613。
參數(shù)決定單元613從自適應(yīng)聲源代碼本606選擇使聽覺加權(quán)單元612輸出的編碼失真最小的第二自適應(yīng)聲源延遲,并將表示選擇結(jié)果的第二自適應(yīng)聲源延遲代碼(A2)輸出到復(fù)用單元614。這里,“第二自適應(yīng)聲源延遲”是截取第二自適應(yīng)聲源向量的截取位置,詳細(xì)說明將后述。并且,參數(shù)決定單元613從固定聲源代碼本608選擇使聽覺加權(quán)單元612輸出的編碼失真最小的第二固定聲源向量,并將表示選擇結(jié)果的第二固定聲源向量代碼(F2)輸出到復(fù)用單元614。并且,參數(shù)決定單元613從量化增益生成單元607選擇使聽覺加權(quán)單元612輸出的編碼失真最小的第二量化自適應(yīng)聲源增益和第二量化固定聲源增益,并將表示選擇結(jié)果的第二量化聲源增益代碼(G2)輸出到復(fù)用單元614。
復(fù)用單元614從LSP量化單元603輸入第二量化LSP代碼(L2),從參數(shù)決定單元613輸入第二自適應(yīng)聲源延遲代碼(A2)、第二固定聲源向量代碼(F2)以及第二量化聲源增益代碼(G2),對這些信息進(jìn)行復(fù)用后作為第二編碼信息輸出。
接著,以使分配給第二量化LSP代碼(L2)的比特數(shù)為“8”,并對殘差LSP進(jìn)行向量量化的情況為例,對LSP量化單元603決定第二量化LSP的處理進(jìn)行簡單的說明。
LSP量化單元603具有存儲了事先生成的256種類的第二LSP代碼向量lspres(l2)(i)的第二LSP碼本。這里,(l2)是附加在第二LSP代碼向量的索引,取0~255的值。并且,第二LSP代碼向量lspres(l2)(i)是N維向量,i取0~N-1的值。LSP量化單元603將從LSP分析單元602輸出的第二LSPα(i)輸入。這里,第二LSPα(i)是N維向量。LSP量化單元603將從第一局部解碼單元102輸出的第一量化LSPlsp1(l1min)(i)輸入。這里,第一量化LSPlsp1(l1min)(i)是N維向量,i取0~N-1的值。
然后,LSP量化單元603由式(2)求出殘差LSPres(i)。
res(i)=α2(i)-lsp1(l1min)(i),(i=0,···,N-1)---(2)]]>接著,LSP量化單元603基于式(3)求出殘差LSPres(i)和第二LSP代碼向量lspres(l2)(i)的均方誤差er2。
er2=Σi=0N-1(res(i)-lspres(l2)(i))2---(3)]]>
然后,LSP量化單元603對所有l(wèi)2求出均方誤差er2,決定均方誤差er2成為最小的l2的值(l2min)。然后,LSP量化單元603將l2min作為第二量化LSP代碼(L2)輸出到復(fù)用單元614。
然后,LSP量化單元603由式(4)求出第二量化LSPlsp2(i)。
lsp2(i)=lsp1(l1min)(i)+lspres(l2min)(i),(i=0,···,N-1)---(4)]]>然后,LSP量化單元603將第二量化LSPlsp2(i)輸出到合成濾波器604。
這樣,由LSP量化單元603求出的lsp2(i)為“第二量化LSP”,使均方誤差er2最小的LSPres(l2min)(i)為“量化殘差LSP”。
接著,使用圖7說明參數(shù)決定單元613決定第二自適應(yīng)聲源延遲的處理。在圖7,緩沖器701是備有自適應(yīng)聲源代碼本606的緩沖器,位置702是第二自適應(yīng)聲源向量的截取位置,向量703是被截取的第二自適應(yīng)聲源向量。并且,“t”是第一自適應(yīng)聲源延遲,而數(shù)值“41”、“296”對應(yīng)于參數(shù)決定單元213進(jìn)行第一自適應(yīng)聲源延遲的搜索的范圍的下限和上限。另外、“t-16”、“t+15”對應(yīng)于移動第二自適應(yīng)聲源向量的截取位置的下限和上限。
在分配給表示第二自適應(yīng)聲源延遲的代碼(A2)的比特數(shù)為“5”的情況,移動截取位置702的范圍可以設(shè)定在“32”的長度范圍(例如,t-16~t+15)上。并且,移動截取位置702的范圍可以任意地設(shè)定。
參數(shù)決定單元613從第一局部解碼單元102輸入第一自適應(yīng)聲源延遲“t”,將移動截取位置702的范圍設(shè)定在t-16~t+15。接著,參數(shù)決定單元613在設(shè)定的范圍內(nèi)移動截取位置702,并依次向自適應(yīng)聲源代碼本606指示截取位置702。接著,自適應(yīng)聲源代碼本606使用由參數(shù)決定單元613指示的截取位置702,按幀長截取第二自適應(yīng)聲源向量703,并將截取的第二自適應(yīng)聲源向量703輸出到乘法器609。然后,參數(shù)決定單元613對于在所有的截取位置702截取第二自適應(yīng)聲源向量703的情況,求出從聽覺加權(quán)單元612輸出的編碼失真,并決定使編碼失真最小的截取位置702。
這樣,由參數(shù)決定單元613求出的緩沖器的截取位置702為t+γ時,γ(γ為-16~15的任一個值)為“第二自適應(yīng)聲源延遲”。因此,為了由第二解碼單元154截取第二自適應(yīng)聲源向量703,需通過將第一自適應(yīng)聲源延遲t和第二自適應(yīng)聲源延遲γ相加,將相加結(jié)果t+γ作為截取位置702,由此截取第二自適應(yīng)聲源延遲703。
接著,參數(shù)決定單元613將表示使編碼失真最小的第二自適應(yīng)聲源延遲的第二自適應(yīng)聲源延遲代碼(A2)輸出到復(fù)用單元614。
另外,參數(shù)決定單元613通過與參數(shù)決定單元213決定第一固定聲源向量代碼(F1)的處理相同的處理,來決定第二固定聲源向量代碼(F2)。
再有,參數(shù)決定單元613通過與參數(shù)決定單元213決定第一量化聲源增益代碼(G1)的處理相同的處理,來決定第二量化聲源增益代碼(G2)。
接著,說明判定單元105生成標(biāo)記信息的處理。判定單元105從第一編碼單元101輸入第一LSP,從第一局部解碼單元102輸入第一量化LSP,從第二編碼單元輸入量化殘差LSP。并且,判定單元105在內(nèi)部具有存儲前面幀的第一量化LSP的緩沖器。
接著,判定單元105使用式(5)求出第一LSP和前面幀第一量化LSP的均方誤差er3。
er2=Σi=0N-1(res(i)-lspres(l2)(i))2---(3)]]>這里,α(i)是第一LSP,lspprel(i)是存儲在緩沖器的前面幀第一量化LSP。
接著,判定單元105使用式(6)求出第一LSP和將前面幀第一量化LSP與量化殘差LSP相加的向量的均方誤差er4。
er4=Σi=0N-1(α1(i)-(lspprel(i)+lspres(i)))2---(6)]]>這里,lspres(i)是量化殘差LSP。
接著,判定單元105進(jìn)行均方誤差er3和均方誤差er4的大小比較,在均方誤差er3較小時,標(biāo)記信息取“0”值,在均方誤差er4較小時,標(biāo)記信息取“1”值。接著,判定單元105將標(biāo)記信息輸出到復(fù)用單元106。然后,判定單元105通過將從第一局部解碼單元102輸入的第一量化LSP存儲在緩沖器來進(jìn)行緩沖器的更新。存儲的第一量化LSP在下一個幀中被用作前面幀第一量化LSP。
這樣,在將僅使用前面幀第一編碼信息的情況與使用前面幀第一編碼信息和量化殘差LSP的情況相比,哪個情況能夠獲得更接近第一LSP的值的信息作為標(biāo)記信息并傳輸?shù)浇獯a裝置側(cè),由此能夠在解碼裝置側(cè)檢測出第一編碼信息的丟失時,指示在第一解碼單元是僅使用前面幀第一編碼信息來進(jìn)行解碼,還是使用前面幀第一編碼信息和量化殘差LSP進(jìn)行解碼。
接著,使用圖8表示的方框圖說明第一解碼單元153的內(nèi)部結(jié)構(gòu)。在圖8,在第一編碼信息沒有被丟失地被傳輸時,輸入第一解碼單元153的第一編碼信息由復(fù)用分離單元801分離成各個代碼(L1、A1、G1、F1)。分離出的第一量化LSP代碼(L1)被輸出到LSP解碼單元802,分離出的第一自適應(yīng)聲源延遲代碼(A1)被輸出到自適應(yīng)聲源代碼本805,分離出的第一量化聲源增益代碼(G1)被輸出到量化增益生成單元806,分離出的第一固定聲源向量代碼(F1)被輸出到固定聲源代碼本807。
LSP解碼單元802從復(fù)用分離單元151輸入標(biāo)記信息,并從編碼信息操作單元811輸入幀丟失信息。LSP解碼單元802在幀丟失信息為“1”或“3”時,從復(fù)用分離單元801輸入第一量化LSP代碼(L1),并從第一量化LSP代碼(L1)解碼第一量化LSP。LSP解碼單元802在幀丟失信息為“0”時,從編碼信息操作單元811輸入前面幀第一量化LSP,并將此作為第一量化LSP。LSP解碼單元802在幀丟失信息為“2”時,從編碼信息操作單元811輸入前面幀第一量化LSP和量化殘差LSP,并將相加的相加結(jié)果作為第一量化LSP??墒?,LSP解碼單元802在標(biāo)記信息為“0”時,不使用量化殘差LSP。接著,LSP解碼單元802將所述第一量化LSP輸出到合成濾波器803和編碼信息操作單元811。輸出到編碼信息操作單元811的第一量化LSP在下一個幀的解碼處理時被用作前面幀第一量化LSP。
自適應(yīng)聲源代碼本805將之前由加法器810輸出的驅(qū)動聲源存儲在緩沖器。自適應(yīng)聲源代碼本805從編碼信息操作單元811輸入幀丟失信息。自適應(yīng)聲源代碼本805在幀丟失信息為“1”或“3”時,從復(fù)用分離單元801輸入第一自適應(yīng)聲源延遲代碼(A1),在第一自適應(yīng)聲源延遲代碼(A1)指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,將截取的向量作為第一自適應(yīng)聲源向量。自適應(yīng)聲源代碼本805在幀丟失信息為“0”時,從編碼信息操作單元811輸入前面幀第一自適應(yīng)聲源延遲,在前面幀第一自適應(yīng)聲源延遲所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,使截截取的向量作為第一自適應(yīng)聲源向量。自適應(yīng)聲源代碼本805在幀丟失信息為“2”時,從編碼信息操作單元811輸入前面幀第一自適應(yīng)聲源延遲和第二自適應(yīng)聲源延遲,在將這兩者相加后的相加結(jié)果所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,將截取的向量作為第一自適應(yīng)聲源向量。
然后,自適應(yīng)聲源代碼本805將第一自適應(yīng)聲源向量輸出到乘法器808。并且,自適應(yīng)聲源代碼本805將第一自適應(yīng)聲源向量的截取位置作為第一自適應(yīng)聲源延遲輸出到編碼信息操作單元811。輸出到編碼信息操作單元811的第一自適應(yīng)聲源延遲在下一個幀的解碼處理時被用作前面幀第一自適應(yīng)聲源延遲。另外,自適應(yīng)聲源代碼本805在每次從加法器810輸入驅(qū)動聲源時進(jìn)行緩沖器的更新。
量化增益生成單元806從編碼信息操作單元811輸入幀丟失信息。量化增益生成單元806在幀丟失信息為“1”或“3”時,從復(fù)用分離單元801輸入第一量化聲源增益代碼(G1),并對第一量化聲源增益代碼(G1)指定的第一量化自適應(yīng)聲源增益和第一量化固定聲源增益進(jìn)行解碼。量化增益生成單元806在幀丟失信息為“0”時,從編碼信息操作單元811輸入前面幀第一量化自適應(yīng)聲源增益和前面幀第一量化自適應(yīng)聲源增益,并將此作為第一量化自適應(yīng)聲源增益和第一量化固定聲源增益。量化增益生成單元806在幀丟失信息為“2”時,從編碼信息操作單元811輸入前面幀第一量化自適應(yīng)聲源增益和前面幀第一量化固定聲源增益和第二量化自適應(yīng)聲源增益和第二量化固定聲源增益,將前面幀第一量化自適應(yīng)聲源增益和第二量化自適應(yīng)聲源增益相加,將相加結(jié)果乘以0.5后的乘法運(yùn)算結(jié)果作為第一量化自適應(yīng)聲源增益,并且將前面幀第一量化固定聲源增益和第二量化固定聲源增益相加,將相加結(jié)果乘以0.5后的乘法運(yùn)算結(jié)果作為第一量化固定聲源增益。然后,量化增益生成單元806將第一量化自適應(yīng)聲源增益輸出到乘法器808和編碼信息操作單元811,并將第一量化固定聲源增益輸出到乘法器809和編碼信息操作單元811。輸出到編碼信息操作單元811的第一量化自適應(yīng)聲源增益和第一量化固定聲源增益在下一個幀的解碼處理時被用作前面幀第一量化自適應(yīng)聲源增益和前面幀第一量化固定聲源增益。
固定聲源代碼本807從編碼信息操作單元811輸入幀丟失信息。固定聲源代碼本807在幀丟失信息為“1”或“3”時,從復(fù)用分離單元801輸入第一固定聲源向量代碼(F1),并生成第一固定聲源向量代碼(F1)指定的第一固定聲源向量。固定聲源代碼本807在幀丟失信息為“0”或“2”時,從編碼信息操作單元811輸入前面幀第一固定聲源向量,并將此作為第一固定聲源向量。然后,固定聲源代碼本807將第一固定聲源向量輸出到乘法器809和編碼信息操作單元811。輸出到編碼信息操作單元811的第一固定聲源向量在下一個幀的解碼處理時被用作前面幀第一固定聲源向量。
乘法器808對第一自適應(yīng)聲源向量乘以第一量化自適應(yīng)聲源增益,并輸出到加法器810。乘法器809對第一固定聲源向量乘以第一量化固定聲源增益,并輸出到加法器810。
加法器810對從乘法器808和809輸出的、已乘以增益后的第一自適應(yīng)聲源向量和第一固定聲源向量進(jìn)行相加,生成驅(qū)動聲源,并將驅(qū)動聲源輸出到合成濾波器803和自適應(yīng)聲源代碼本805。
合成濾波器803使用從加法器810輸出的驅(qū)動聲源和由LSP解碼單元802解碼的濾波系數(shù)來進(jìn)行濾波合成,將合成信號輸出到后處理單元804。
后處理單元804對從合成濾波器803輸出的合成信號進(jìn)行共振峰增強(qiáng)和音調(diào)增強(qiáng)之類的改善語音主觀質(zhì)量的處理以及改善靜態(tài)噪聲的主觀質(zhì)量的處理等,作為第一解碼信號輸出。
編碼信息操作單元811在內(nèi)部設(shè)有存儲各種參數(shù)的緩沖器,在緩沖器中存儲了在前面幀求出的第一量化LSP(前面幀第一量化LSP)、在前面幀求出的第一自適應(yīng)聲源延遲(前面幀第一自適應(yīng)聲源延遲)、在前面幀求出的第一量化自適應(yīng)聲源增益(前面幀第一量化自適應(yīng)聲源增益)、在前面幀求出的第一量化固定聲源增益(前面幀第一量化固定聲源增益)以及在前面幀求出的第一固定聲源向量(前面幀第一固定聲源向量)。
編碼信息操作單元811從幀丟失檢測單元152輸入幀丟失信息。另外,編碼信息操作單元811在幀丟失信息為“2”時,從第二解碼單元154輸入量化殘差LSP、第二自適應(yīng)聲源延遲、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益。然后,編碼信息操作單元811將幀丟失信息輸出到LSP解碼單元802、自適應(yīng)聲源代碼本805、量化增益生成單元806以及固定聲源代碼本807。編碼信息操作單元811在幀丟失信息為“0”時,將前面幀第一量化LSP輸出到LSP解碼單元802,將前面幀第一自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本805,將前面幀第一量化自適應(yīng)聲源增益和前面幀第一量化固定聲源增益輸出到量化增益生成單元806,并將前面幀第一固定聲源向量輸出到固定聲源代碼本807。編碼信息操作單元811在幀丟失信息為“2”時,將前面幀第一量化LSP和量化殘差LSP輸出到LSP解碼單元802,將前面幀第一自適應(yīng)聲源延遲和第二自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本805,將前面幀第一量化自適應(yīng)聲源增益、前面幀第一量化固定聲源增益、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益輸出到量化增益生成單元806,并將前面幀第一固定聲源向量輸出到固定聲源代碼本807。
接著,編碼信息操作單元811從LSP解碼單元802輸入已用于當(dāng)前幀的解碼處理的第一量化LSP,從自適應(yīng)聲源代碼本805輸入已用于當(dāng)前幀的解碼處理的第一自適應(yīng)聲源延遲,從量化增益生成單元806輸入已用于當(dāng)前幀的解碼處理的第一量化自適應(yīng)聲源增益和第一量化固定聲源增益,并從固定聲源代碼本807輸入已用于當(dāng)前幀的解碼處理的第一固定聲源向量。然后,編碼信息操作單元811在幀丟失信息為“1”或“3”時,將第一量化LSP、第一自適應(yīng)聲源延遲、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益輸出到第二解碼單元154,在幀丟失信息為“0”或“2”時,將存儲在緩沖器的前面幀第一量化LSP和前面幀第一自適應(yīng)聲源延遲輸出到第二解碼單元154。
編碼信息操作單元811在上述處理結(jié)束后,使已用于當(dāng)前幀的解碼處理的第一量化LSP作為前面幀第一量化LSP、第一自適應(yīng)聲源延遲作為前面幀第一自適應(yīng)聲源延遲、第一量化自適應(yīng)聲源增益作為前面幀第一量化自適應(yīng)聲源增益、第一量化固定聲源增益作為前面幀第一量化固定聲源增益、第一固定聲源向量作為前面幀第一固定聲源向量存儲到緩沖器,進(jìn)行緩沖器的更新。
接著,使用圖9表示的方框圖說明第二解碼單元154的內(nèi)部結(jié)構(gòu)。在圖9,在第二編碼信息沒有被丟失地被傳輸時,輸入第二解碼單元154的第二編碼信息由復(fù)用分離單元901分離成各個代碼(L2、A2、G2、F2)。分離出的第二量化LSP代碼(L2)被輸出到LSP解碼單元902,分離出的第二自適應(yīng)聲源延遲代碼(A2)被輸出到自適應(yīng)聲源代碼本905,分離出的第二量化聲源增益代碼(G2)被輸出到量化增益生成單元906,分離出的第二固定聲源向量代碼(F2)被輸出到固定聲源代碼本907。
LSP解碼單元902從編碼信息操作單元911輸入幀丟失信息。LSP解碼單元902在幀丟失信息為“3”時,從編碼信息操作單元911輸入第一量化LSP,并且從復(fù)用分離單元901輸入第二量化LSP代碼(L2),從第二量化LSP代碼(L2)解碼量化殘差LSP,并將第一量化LSP和量化殘差LSP相加的相加結(jié)果作為第二量化LSP。LSP解碼單元902在幀丟失信息為“1”時,從編碼信息操作單元911輸入第一量化LSP和前面幀量化殘差LSP,并將第一量化LSP和前面幀量化殘差LSP相加的相加結(jié)果作為第二量化LSP。LSP解碼單元902在幀丟失信息為“2”時,從編碼信息操作單元911輸入前面幀第一量化LSP,并且從復(fù)用分離單元901輸入第二量化LSP代碼(L2),從第二量化LSP代碼(L2)解碼量化殘差LSP,并將前面幀第一量化LSP和量化殘差LSP相加的相加結(jié)果作為第二量化LSP。LSP解碼單元902在幀丟失信息為“0”時,從編碼信息操作單元911輸入前面幀第一量化LSP和前面幀量化殘差LSP,并將前面幀第一量化LSP和前面幀量化殘差LSP相加的相加結(jié)果作為第二量化LSP。
然后,LSP解碼單元902將所述第二量化LSP輸出到合成濾波器903。接著,LSP解碼單元902在幀丟失信息為“2”或“3”時,將解碼第二量化LSP代碼(L2)而獲得的量化殘差LSP輸出到編碼信息操作單元911,在幀丟失信息為“0”或“1”時,將前面幀量化殘差LSP輸出到編碼信息操作單元911。輸出到編碼信息操作單元911的量化殘差LSP或前面幀量化殘差LSP在下一個幀的解碼處理時被用作前面幀量化殘差LSP。
自適應(yīng)聲源代碼本905將之前由加法器910輸出的驅(qū)動聲源存儲在緩沖器。自適應(yīng)聲源代碼本905從編碼信息操作單元911輸入幀丟失信息。自適應(yīng)聲源代碼本905在幀丟失信息為“3”時,從編碼信息操作單元911輸入第一自適應(yīng)聲源延遲,并從復(fù)用分離單元901輸入第二自適應(yīng)聲源延遲代碼(A2),在將第一自適應(yīng)聲源延遲和第二自適應(yīng)聲源延遲代碼(A2)相加后的相加結(jié)果所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,使截截取的向量作為第二自適應(yīng)聲源向量。自適應(yīng)聲源代碼本905在幀丟失信息為“1”時,從編碼信息操作單元911輸入第一自適應(yīng)聲源延遲和第二自適應(yīng)聲源延遲,在將這兩個自適應(yīng)聲源延遲相加后的相加結(jié)果所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,將截取的向量作為第二自適應(yīng)聲源向量。自適應(yīng)聲源代碼本905在幀丟失信息為“2”時,從編碼信息操作單元911輸入前面幀第一自適應(yīng)聲源延遲,并從復(fù)用分離單元901輸入第二自適應(yīng)聲源延遲代碼(A2),在將前面幀第一自適應(yīng)聲源延遲和第二自適應(yīng)聲源延遲代碼(A2)相加后的相加結(jié)果所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,使截截取的向量作為第二自適應(yīng)聲源向量。自適應(yīng)聲源代碼本905在幀丟失信息為“0”時,從編碼信息操作單元911輸入前面幀第一自適應(yīng)聲源延遲和前面幀第二自適應(yīng)聲源延遲,在將這兩個自適應(yīng)聲源延遲相加后的相加結(jié)果所指定的截取位置從緩沖器截取相當(dāng)于1幀的樣本,將截取的向量作為第二自適應(yīng)聲源向量。
然后,自適應(yīng)聲源代碼本905將第二自適應(yīng)聲源向量輸出到乘法器908。接著,自適應(yīng)聲源代碼本905在幀丟失信息為“2”或“3”時,將第二自適應(yīng)聲源延遲代碼(A2)作為第二自適應(yīng)聲源延遲輸出到編碼信息操作單元911,在幀丟失信息為“0”或“1”時,將前面幀第二自適應(yīng)聲源延遲輸出到編碼信息操作單元911。輸出到編碼信息操作單元911的第二自適應(yīng)聲源延遲或前面幀第二自適應(yīng)聲源延遲在下一個幀的解碼處理時被用作前面幀第二自適應(yīng)聲源延遲。并且,自適應(yīng)聲源代碼本905在每次從加法器910輸入驅(qū)動聲源時進(jìn)行緩沖器的更新。
量化增益生成單元906從編碼信息操作單元911輸入幀丟失信息。量化增益生成單元906在幀丟失信息為“2”或“3”時,從復(fù)用分離單元901輸入第二量化聲源增益代碼(G2),并對第二量化聲源增益代碼(G2)指定的第二量化自適應(yīng)聲源增益和第二量化固定聲源增益進(jìn)行解碼。量化增益生成單元906在幀丟失信息為“1”時,從編碼信息操作單元911輸入第一量化自適應(yīng)聲源增益和第一量化固定聲源增益和前面幀第二量化自適應(yīng)聲源增益和前面幀第二量化固定聲源增益,將第一量化自適應(yīng)聲源增益和前面幀第二量化自適應(yīng)聲源增益相加,將相加結(jié)果乘以0.5后的乘法運(yùn)算結(jié)果作為第二量化自適應(yīng)聲源增益,并且將第一量化固定聲源增益和前面幀第二量化固定聲源增益相加,將相加結(jié)果乘以0.5后的乘法運(yùn)算結(jié)果作為第二量化固定聲源增益。量化增益生成單元906在幀丟失信息為“0”時,從編碼信息操作單元911輸入前面幀第二量化自適應(yīng)聲源增益和前面幀第二量化自適應(yīng)聲源增益,并將此作為第二量化自適應(yīng)聲源增益和第二量化固定聲源增益。
然后,量化增益生成單元906將第二量化自適應(yīng)聲源增益輸出到乘法器908和編碼信息操作單元911,并將第二量化固定聲源增益輸出到乘法器909和編碼信息操作單元911。輸出到編碼信息操作單元911的第二量化自適應(yīng)聲源增益和第二量化固定聲源增益在下一個幀的解碼處理時被用作前面幀第二量化自適應(yīng)聲源增益和前面幀第二量化固定聲源增益。
固定聲源代碼本907從編碼信息操作單元911輸入幀丟失信息。固定聲源代碼本907在幀丟失信息為“2”或“3”時,從復(fù)用分離單元901輸入第二固定聲源向量代碼(F2),并生成第一固定聲源向量代碼(F2)指定的第二固定聲源向量。固定聲源代碼本907在幀丟失信息為“0”或“1”時,從編碼信息操作單元911輸入前面幀第二固定聲源向量,并將此作為第二固定聲源向量。然后,固定聲源代碼本907將第二固定聲源向量輸出到乘法器909和編碼信息操作單元911。輸出到編碼信息操作單元911的第二固定聲源向量在下一個幀的解碼處理時被用作前面幀第二固定聲源向量。
乘法器908對第二自適應(yīng)聲源向量乘以第二量化自適應(yīng)聲源增益,并輸出到加法器910。乘法器909對第二固定聲源向量乘以第二量化固定聲源增益,并輸出到加法器910。
加法器910對從乘法器908和909輸出的、已乘以增益后的第二自適應(yīng)聲源向量和第二固定聲源向量進(jìn)行相加,生成驅(qū)動聲源,并將驅(qū)動聲源輸出到合成濾波器903和自適應(yīng)聲源代碼本905。
合成濾波器903使用從加法器910輸出的驅(qū)動聲源和由LSP解碼單元902解碼的濾波系數(shù)來進(jìn)行濾波合成,將合成信號輸出到后處理單元904。
后處理單元904對從合成濾波器903輸出的合成信號進(jìn)行共振峰增強(qiáng)和音調(diào)增強(qiáng)之類的改善語音主觀質(zhì)量的處理以及改善靜態(tài)噪聲的主觀質(zhì)量的處理等,作為第二解碼信號輸出。
編碼信息操作單元911在內(nèi)部設(shè)有存儲各種參數(shù)的緩沖器,在緩沖器中存儲了在前面幀求出的量化殘差LSP(前面幀量化殘差LSP)、在前面幀求出的第二自適應(yīng)聲源延遲(前面幀第二自適應(yīng)聲源延遲)、在前面幀求出的第二量化自適應(yīng)聲源增益(前面幀第二量化自適應(yīng)聲源增益)、在前面幀求出的第二量化固定聲源增益(前面幀第二量化固定聲源增益)以及在前面幀求出的第二固定聲源向量(前面幀第二固定聲源向量)。
編碼信息操作單元911從幀丟失檢測單元152輸入幀丟失信息。編碼信息操作單元911在幀丟失信息為“1”或“3”時,從第一解碼單元153輸入第一量化LSP、第一自適應(yīng)聲源延遲、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益。編碼信息操作單元911在幀丟失信息為“0”或“2”時,從第一解碼單元153輸入前面幀第一量化LSP和前面幀第一自適應(yīng)聲源延遲。然后,編碼信息操作單元911將幀丟失信息輸出到LSP解碼單元902、自適應(yīng)聲源代碼本905、量化增益生成單元906以及固定聲源代碼本907。編碼信息操作單元911在幀丟失信息為“0”時,將前面幀第一量化LSP和前面幀量化殘差LSP輸出到LSP解碼單元902,將前面幀第一自適應(yīng)聲源延遲和前面幀第二自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905,將前面幀第二量化自適應(yīng)聲源增益和前面幀第二量化固定聲源增益輸出到量化增益生成單元906,并將前面幀第二固定聲源向量輸出到固定聲源代碼本907。編碼信息操作單元911在幀丟失信息為“1”時,將第一量化LSP和前面幀量化殘差LSP輸出到LSP解碼單元902,將第一自適應(yīng)聲源延遲和前面幀第二自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905,將第一量化自適應(yīng)聲源增益、第一量化固定聲源增益、前面幀第二量化自適應(yīng)聲源增益以及前面幀第二量化固定聲源增益輸出到量化增益生成單元906,并將前面幀第二固定聲源向量輸出到固定聲源代碼本907。編碼信息操作單元911在幀丟失信息為“2”時,將前面幀第一量化LSP輸出到LSP解碼單元902,并將前面幀第一自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905。編碼信息操作單元911在幀丟失信息為“3”時,將第一量化LSP輸出到LSP解碼單元902,并將第一自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905。
接著,編碼信息操作單元911從LSP解碼單元902輸入已用于當(dāng)前幀的解碼處理的量化殘差LSP,從自適應(yīng)聲源代碼本905輸入已用于當(dāng)前幀的解碼處理的第二自適應(yīng)聲源延遲,從量化增益生成單元906輸入已用于當(dāng)前幀的解碼處理的第二量化自適應(yīng)聲源增益和第二量化固定聲源增益,并從固定聲源代碼本907輸入已用于當(dāng)前幀的解碼處理的第二固定聲源向量。另外,編碼信息操作單元911在幀丟失信息為“2”時,將量化殘差LSP、第二自適應(yīng)聲源延遲、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益輸出到第一解碼單元153。
編碼信息操作單元911在上述處理結(jié)束后,使已用于當(dāng)前幀的解碼處理的量化殘差LSP作為前面幀量化殘差LSP、第二自適應(yīng)聲源延遲作為前面幀第二自適應(yīng)聲源延遲、第二量化自適應(yīng)聲源增益作為前面幀第二量化自適應(yīng)聲源增益、第二量化固定聲源增益作為前面幀第二量化固定聲源增益、第二固定聲源向量作為前面幀第二固定聲源向量存儲到緩沖器,進(jìn)行緩沖器的更新。
由此,在第一解碼單元153和第二解碼單元154中,通過基于幀丟失信息,從第一編碼信息、第二編碼信息、前面幀第一編碼信息以及前面幀第二編碼信息中適宜地選擇用于解碼的參數(shù),能夠進(jìn)行適合于編碼信息的丟失狀態(tài)的解碼,從而能夠獲得質(zhì)量良好的解碼信號。
接著,使用圖10表示的方框圖說明編碼信息操作單元811的內(nèi)部結(jié)構(gòu)。幀丟失信息分配單元1001從幀丟失檢測單元152輸入幀丟失信息,并將此輸出到第一編碼信息分配單元1002、編碼信息存儲單元1003、第二編碼信息分配單元1004、LSP解碼單元802、自適應(yīng)聲源代碼本805、量化增益生成單元806以及固定聲源代碼本807。
第一編碼信息分配單元1002從幀丟失信息分配單元1001輸入幀丟失信息。接著,第一編碼信息分配單元1002從LSP解碼單元802輸入第一量化LSP,從自適應(yīng)聲源代碼本805輸入第一自適應(yīng)聲源延遲,從量化增益生成單元806輸入第一量化自適應(yīng)聲源增益和第一量化固定聲源增益,并從固定聲源代碼本807輸入第一固定聲源向量。然后,第一編碼信息分配單元1002將第一量化LSP、第一自適應(yīng)聲源延遲、第一固定聲源向量、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益輸出到編碼信息存儲單元1003。接著,第一編碼信息分配單元1002在幀丟失信息為“1”或“3”時,將第一量化LSP、第一自適應(yīng)聲源延遲、第一固定聲源向量、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益輸出到第二解碼單元154。
編碼信息存儲單元1003從幀丟失信息分配單元1001輸入幀丟失信息。并且,編碼信息存儲單元1003在內(nèi)部設(shè)有對前面幀的第一量化LSP、第一自適應(yīng)聲源延遲、第一固定聲源向量、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益進(jìn)行存儲的緩沖器。編碼信息存儲單元1003在幀丟失信息為“0”或“2”時,將前面幀第一量化LSP輸出到LSP解碼單元802,將前面幀第一自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本805,將前面幀第一固定聲源向量輸出到固定聲源代碼本807,并將前面幀第一量化自適應(yīng)聲源增益和前面幀第一量化固定聲源增益輸出到量化增益生成單元806。編碼信息存儲單元1003在幀丟失信息為“0”或“2”時,將前面幀第一量化LSP和前面幀第一自適應(yīng)聲源延遲輸出到第二解碼單元154。然后,編碼信息存儲單元1003從第一編碼信息分配單元1002輸入第一量化LSP、第一自適應(yīng)聲源延遲、第一固定聲源向量、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益。接著,編碼信息存儲單元1003通過將第一量化LSP、第一自適應(yīng)聲源延遲、第一固定聲源向量、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益存儲到緩沖器,來對緩沖器進(jìn)行更新。存儲的第一量化LSP、第一自適應(yīng)聲源延遲、第一固定聲源向量、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益在下一個幀中被用作前面幀第一量化LSP、前面幀第一自適應(yīng)聲源延遲、前面幀第一固定聲源向量、前面幀第一量化自適應(yīng)聲源增益以及前面幀第一量化固定聲源增益。
第二編碼信息分配單元1004從幀丟失信息分配單元1001輸入幀丟失信息。然后,第二編碼信息分配單元1004在幀丟失信息為“2”時,從第二解碼單元154輸入量化殘差LSP、第二自適應(yīng)聲源延遲、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益。接著,第二編碼信息分配單元1004在幀丟失信息為“2”時,將量化殘差LSP輸出到LSP解碼單元802,將第二自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本805,將第二量化自適應(yīng)聲源增益和第二量化固定聲源增益輸出到量化增益生成單元806。
接著,使用圖11表示的方框圖說明編碼信息操作單元911的內(nèi)部結(jié)構(gòu)。幀丟失信息分配單元1101從幀丟失檢測單元152輸入幀丟失信息,并將此輸出到第一編碼信息分配單元1102、編碼信息存儲單元1103、第二編碼信息分配單元1104、LSP解碼單元902、自適應(yīng)聲源代碼本905、量化增益生成單元906以及固定聲源代碼本907。
第一編碼信息分配單元1102從幀丟失信息分配單元1101輸入幀丟失信息。然后,第二編碼信息分配單元1102在幀丟失信息為“1”或“3”時,從第一解碼單元153輸入第一量化LSP、第二自適應(yīng)聲源延遲、第一量化自適應(yīng)聲源增益以及第一量化固定聲源增益。并且,第一編碼信息分配單元1102在幀丟失信息為“0”或“2”時,從第一解碼單元153輸入前面幀第一量化LSP和前面幀第一自適應(yīng)聲源延遲。然后,第一編碼信息分配單元1102在幀丟失信息為“1”或“3”時,將第一量化LSP輸出到LSP解碼單元902,并將第一自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905。并且,第一編碼信息分配單元1102在幀丟失信息為“1”時,將第一量化自適應(yīng)聲源增益和第一量化固定聲源增益輸出到量化增益生成單元906。另外,第一編碼信息分配單元1102在幀丟失信息為“0”或“2”時,將前面幀第一量化LSP輸出到LSP解碼單元902,并將前面幀第一自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905。
第二編碼信息分配單元1104從幀丟失信息分配單元1101輸入幀丟失信息。然后,第二編碼信息分配單元1104從LSP解碼單元902輸入量化殘差LSP,從自適應(yīng)聲源代碼本905輸入第二自適應(yīng)聲源延遲,從量化增益生成單元906輸入第二量化自適應(yīng)聲源增益和第一量化固定聲源增益,并從固定聲源代碼本907輸入第二固定聲源向量。接著,第二編碼信息分配單元1104將量化殘差LSP、第二自適應(yīng)聲源延遲、第二固定聲源向量、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益輸出到編碼信息存儲單元1103。然后,第二編碼信息分配單元1104在幀丟失信息為“2”時,將量化殘差LSP、第二自適應(yīng)聲源延遲、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益輸出到第一解碼單元153。
編碼信息存儲單元1103從幀丟失信息分配單元1101輸入幀丟失信息。并且,編碼信息存儲單元1103在內(nèi)部設(shè)有對前面幀的量化殘差LSP、第二自適應(yīng)聲源延遲、第二固定聲源向量、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益進(jìn)行存儲的緩沖器。然后,編碼信息存儲單元1103在幀丟失信息為“0”或“1”時,將前面幀量化殘差LSP輸出到LSP解碼單元902,將前面幀第二自適應(yīng)聲源延遲輸出到自適應(yīng)聲源代碼本905,將前面幀第二固定聲源向量輸出到固定聲源代碼本907,并將前面幀第二量化自適應(yīng)聲源增益和前面幀第二量化固定聲源增益輸出到量化增益生成單元906。接著,編碼信息存儲單元1103從第二編碼信息分配單元1104輸入量化殘差LSP、第二自適應(yīng)聲源延遲、第二固定聲源向量、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益。接著,編碼信息存儲單元1103通過將量化殘差LSP、第二自適應(yīng)聲源延遲、第二固定聲源向量、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益存儲到緩沖器,來對緩沖器進(jìn)行更新。存儲的量化殘差LSP、第二自適應(yīng)聲源延遲、第二固定聲源向量、第二量化自適應(yīng)聲源增益以及第二量化固定聲源增益在下一個幀中被用作前面幀量化LSP殘差、前面幀第二自適應(yīng)聲源延遲、前面幀第二固定聲源向量、前面幀第二量化自適應(yīng)聲源增益以及前面幀第二量化固定聲源增益。
圖12是表示幀丟失信息以及第一解碼單元153和第二解碼單元154基于幀丟失信息在解碼使用的參數(shù)的種類的圖。并且,將幀丟失信息及與此對應(yīng)的第一編碼信息的狀態(tài)和第二編碼信息的狀態(tài)一起示出。另外,在圖12中,“l(fā)sp”表示第一量化LSP、“p_lsp”表示前面幀第一量化LSP、“l(fā)ag”表示第一自適應(yīng)聲源延遲、“p_lag”表示前面幀第一自適應(yīng)聲源延遲、“sc”表示第一固定聲源向量、“p_sc”表示前面幀第一固定聲源向量、“ga”表示第一量化自適應(yīng)聲源增益、“p_ga”表示前面幀第一量化自適應(yīng)聲源增益、“gs”表示第一量化固定聲源增益、“p_gs”表示前面幀第一量化固定聲源增益、“d_lsp”表示量化殘差LSP、“p_d_lsp”表示前面幀量化殘差LSP、“d_lag”表示第二自適應(yīng)聲源延遲、“p_d_lag”前面幀第二自適應(yīng)聲源延遲、“e_sc”表示第二固定聲源向量、“p_e_sc”表示前面幀第二固定聲源向量、“e_ga”表示第二量化自適應(yīng)聲源增益、“p_e_ga”表示前面幀第二量化自適應(yīng)聲源增益、“e_gs”表示第二量化固定聲源增益、“p_e_gs”表示前面幀第二量化固定聲源增益。
并且,在圖12中,“正常接收”表示編碼信息被正常接收的狀態(tài),“丟失”表示沒有被正常接收(丟失)的狀態(tài)。
幀丟失信息為“3”時,由于第一編碼信息和第二編碼信息都被正常接收,第一解碼單元153和第二解碼單元154使用接收到的第一編碼信息和第二編碼信息進(jìn)行解碼。換言之,進(jìn)行不考慮幀丟失的一般解碼。
幀丟失信息為“2”時,由于第一編碼信息沒有被正常接收,第一解碼單元153和第二解碼單元154使用前面幀的第一編碼信息以取代第一編碼信息來進(jìn)行解碼。并且,第一解碼單元153通過除了前面幀的第一編碼信息之外,還使用第二編碼信息來進(jìn)行解碼,由此實(shí)現(xiàn)解碼信息的質(zhì)量提升。
幀丟失信息為“1”時,由于第二編碼信息沒有被正常接收,第二解碼單元154使用前面幀的第二編碼信息以取代第二編碼信息來進(jìn)行解碼。
幀丟失信息為“0”時,由于第一編碼信息和第二編碼信息都沒有被正常接收,第一解碼單元153和第二解碼單元154使用前面幀的第一編碼信息和前面幀第二編碼信息以取代第一編碼信息和第二編碼信息來進(jìn)行解碼。
圖13是從視覺上說明在第一編碼信息沒有被正常接收的情況,第一解碼單元153除了前面幀第一編碼信息之外還使用第二編碼信息來進(jìn)行解碼,由此實(shí)現(xiàn)解碼信號的質(zhì)量提升的圖。
這里,以第一解碼單元153的LSP解碼單元802求出第一量化LSP的情況為例進(jìn)行說明。并且,為簡化說明,假設(shè)第一量化LSP為二維向量。
在圖13中,參考標(biāo)號1300是示意性地表示第一量化LSP、量化殘差LSP以及第一LSP的圖。這里,“×”表示第一LSP,較長的箭頭表示第一量化LSP,較短的箭頭表示量化殘差LSP。第一量化LSP包含在第一編碼信息,量化殘差LSP包含在第二編碼信息。
另外,參考標(biāo)號1301是示意性地表示第一量化LSP、前面幀第一量化LSP以及第一LSP的圖。這里,“×”表示第一LSP,虛線的箭頭表示第一量化LSP,實(shí)線的箭頭表示前面幀第一量化LSP。換言之,這表示第一編碼信息(第一量化LSP)沒有被正常接收,LSP解碼單元802僅使用前面幀第一量化LSP求出第一量化LSP(使前面幀第一量化LSP作為第一量化LSP)的情況。
另外,參考標(biāo)號1302是示意性地表示第一量化LSP、前面幀第一量化LSP、量化殘差LSP以及第一LSP的圖。這里,“×”表示第一LSP,虛線箭頭表示第一量化LSP,較長的實(shí)線箭頭表示前面幀第一量化LSP,較短的實(shí)線箭頭表示量化殘差LSP。換言之,第一編碼信息(第一量化LSP)沒有被正常接收,LSP解碼單元802將前面幀第一量化LSP和量化殘差LSP相加,將相加的結(jié)果作為第一量化LSP的情況。
在第一量化LSP和前面幀第一量化LSP之間的相關(guān)高且誤差小的情況,與僅使用前面幀第一量化LSP的方法(1301)相比,使用前面幀第一量化LSP和量化殘差LSP的方法(1302)求出的第一量化LSP較接近第一LSP(“×”)。
然而,在第一量化LSP和前面幀第一量化LSP之間的相關(guān)低且誤差大的情況,使用前面幀第一量化LSP和量化殘差LSP的方法所求出的第一量化LSP不一定較接近第一LSP(“×”)(1303)。因此,關(guān)于僅使用前面幀第一量化LSP的方法和使用前面幀第一量化LSP和量化殘差LSP的方法的兩種方法,進(jìn)行實(shí)際地以幀為單位求出第一量化LSP并進(jìn)行比較,看哪一個方法的第一量化LSP較接近第一LSP,并以幀為單位輸出的實(shí)驗(yàn)。使用8秒左右的語音信號的8個樣本進(jìn)行實(shí)驗(yàn)的結(jié)果,獲得了關(guān)于所有8個樣本,后者的方法的接近第一LSP的幀數(shù)較多的結(jié)果。并且,可得知上述傾向尤其在有聲區(qū)間表示得更為明顯。
另外,本實(shí)施方式雖然以編碼裝置100具有兩個編碼單元的情況為例進(jìn)行了說明,但編碼單元的數(shù)量不限于此,可以是三個以上。
并且,本實(shí)施方式雖然以解碼裝置150具有兩個解碼單元的情況為例進(jìn)行了說明,但解碼單元的數(shù)量不限于此,可以是三個以上。
另外,在本實(shí)施方式中說明了下述情況,即,幀丟失信息為“0”時,第一解碼單元153僅使用前面幀的第一編碼信息進(jìn)行解碼,但本發(fā)明也能夠適用于第一解碼單元153除了前面幀的第一編碼信息之外,還使用前面幀的第二編碼信息進(jìn)行解碼的情況,并且能夠獲得與本實(shí)施方式相同的作用效果。此時,能夠以與幀丟失信息為“2”時的第一解碼單元153的解碼方法相同的方法求出第一解碼信號。
并且,在本實(shí)施方式中雖然對下述情況進(jìn)行了說明,即,使用標(biāo)記信息來指示是否將第二編碼信息包含在第一解碼單元153用于解碼的編碼信息,但本發(fā)明也能夠適用于不使用標(biāo)記信息,而一定將第二編碼信息包含在第一解碼單元153用于解碼的編碼信息的情況,并且能夠獲得與本實(shí)施方式相同的作用效果。
另外,在本實(shí)施方式中對下述情況進(jìn)行了說明,即,第一解碼單元153和第二解碼單元154將前面幀的編碼信息直接用作當(dāng)前幀的編碼信息并生成解碼信號,但也可以對前面幀的編碼信息乘以某個一定的衰減率來求出驅(qū)動聲源,使在當(dāng)前幀生成的驅(qū)動聲源與在前面幀生成的驅(qū)動聲源相比變得稍微衰減,由此來生成解碼信號。例如,幀丟失信息為“2”時,量化增益生成單元806對求出的第一量化自適應(yīng)聲源增益(第一量化固定聲源增益)乘以某個一定的衰減率(例如,0.9),使乘法運(yùn)算結(jié)果作為第一量化自適應(yīng)聲源增益(第一量化固定聲源增益)輸出,由此能夠使在當(dāng)前幀生成的驅(qū)動聲源衰減。
并且,在本實(shí)施方式中說明了下述情況,即,在幀丟失信息為“2”時,量化增益生成單元806將前面幀第一量化自適應(yīng)聲源增益(前面幀第一量化固定聲源增益)和第二量化自適應(yīng)聲源增益(第二量化固定聲源增益)相加,使對相加結(jié)果乘以0.5的乘法運(yùn)算結(jié)果作為第一量化自適應(yīng)聲源增益(第一量化固定聲源增益),但也可以以某個一定的比例將前面幀第一量化自適應(yīng)聲源增益(前面幀第一量化固定聲源增益)和第二量化自適應(yīng)聲源增益(第二量化固定聲源增益)相加,來求出第一量化自適應(yīng)聲源增益(第一量化固定聲源增益)。例如,通過式(7)能夠求出第一量化自適應(yīng)聲源增益(第一量化固定聲源增益)b_gain。
b_gain=p_gain×β+e_gain×(1-β)…(7)這里,p_gain表示前面幀第一量化自適應(yīng)聲源增益(前面幀第一量化固定聲源增益),e_gain表示第二量化自適應(yīng)聲源增益(第二量化固定聲源增益),β取0到1的任一個值。并且,β的值可以任意設(shè)定。
并且,在本實(shí)施方式中說明了下述情況,即,在幀丟失信息為“1”時,量化增益生成單元906將第一量化自適應(yīng)聲源增益(前面幀第一量化固定聲源增益)和前面幀第二量化自適應(yīng)聲源增益(前面幀第二量化固定聲源增益)相加,使對相加結(jié)果乘以0.5的乘法運(yùn)算結(jié)果作為第二量化自適應(yīng)聲源增益(第二量化固定聲源增益),但也可以使用與上述相同的方法來求出第二量化自適應(yīng)聲源增益(第二量化固定聲源增益)。
另外,在本實(shí)施方式中,雖然以使用十進(jìn)數(shù)作為幀丟失信息的情況為例進(jìn)行了說明,但本發(fā)明也能夠適用于使用二進(jìn)數(shù)作為幀丟失信息的情況,并能夠獲得與本實(shí)施方式相同的作用效果。例如,在使用二進(jìn)數(shù)表現(xiàn)兩個編碼信息(第一~二編碼信息)的狀態(tài)時,通過以“1”表示被正常接收的狀態(tài),以“0”表示沒有被正常接收的狀態(tài),能夠以兩位的二進(jìn)數(shù)(“00”~“11”)來表現(xiàn)幀丟失信息。
再有,在本實(shí)施方式中,說明了固定聲源代碼本208生成的固定聲源向量是通過脈沖形成的情況,但本發(fā)明也能夠適用于形成固定聲源向量的脈沖為擴(kuò)頻脈沖的情況,并且能夠獲得與本實(shí)施方式相同的作用效果。
另外,在本實(shí)施方式中雖然說明了編碼單元/解碼單元為CELP型的語音/音頻編碼/解碼方法的情況,但本發(fā)明也能夠適用于編碼單元/解碼單元為CELP型以外的語音/音頻編碼/解碼方法(例如,脈沖代碼調(diào)制、預(yù)測編碼、向量量化、聲碼器(vocoder))的情況,并且能夠獲得與本實(shí)施方式相同的作用效果。再有,本發(fā)明也能夠適用于語音/音頻編碼/解碼方法在各個編碼單元/解碼單元不同的語音/音頻編碼/解碼方法的情況,并且能夠獲得與本實(shí)施方式相同的作用效果。
(實(shí)施方式2)圖14(a)是包含上述實(shí)施方式1說明的編碼裝置的本發(fā)明實(shí)施方式2的語音/音頻發(fā)送裝置的結(jié)構(gòu)方框圖。
語音/音頻信號1401由輸入裝置1402變換成電信號,被輸出到A/D變換裝置1403。A/D變換裝置1403將從輸入裝置1402輸出的(模擬)信號變換為數(shù)字信號,并輸出到語音/音頻編碼裝置1404。語音/音頻編碼裝置1404搭載圖1所示的編碼裝置100,對從A/D變換裝置1403輸出的數(shù)字語音/音頻信號進(jìn)行編碼,將編碼信息輸出到RF調(diào)制裝置1405。RF調(diào)制裝置1405將從語音/音頻編碼裝置1404輸出的編碼信息變換成用于載入電波等傳播介質(zhì)進(jìn)行發(fā)送的信號,并輸出到發(fā)送天線1406。發(fā)送天線1406將從RF調(diào)制裝置1405輸出的輸出信號作為電波(RF信號)發(fā)送。另外,圖中的RF信號1407表示從發(fā)送天線1406發(fā)送的電波(RF信號)。
以上為語音/音頻信號發(fā)送裝置的結(jié)構(gòu)以及動作。
圖14(b)是包含上述實(shí)施方式1說明的解碼裝置的本發(fā)明實(shí)施方式2的語音/音頻接收裝置的結(jié)構(gòu)方框圖。
RF信號1408被接收天線1409接收后被輸出到RF解調(diào)裝置1410。另外,圖中的RF信號1408表示由接收天線1409接收的電波,在傳播路徑上如果沒有信號的衰減或噪聲的重疊,則與RF信號1407完全相同。
RF解調(diào)裝置1410根據(jù)從接收天線1409輸出的RF信號對編碼信息進(jìn)行解調(diào),并輸出到語音/音頻解碼裝置1411。語音/音頻解碼裝置1411搭載圖1所示的解碼裝置150,從RF解調(diào)裝置1410輸出的編碼信息解調(diào)語音/音頻信號,并輸出到D/A變換裝置1412。D/A變換裝置1412將從語音/音頻解碼裝置1411輸出的數(shù)字語音/音頻信號變換為模擬的電信號,并輸出到輸出裝置1413。輸出裝置1413將電信號變換成空氣的振動輸出,以便作為聲波使人耳能聽到。并且,在圖中,參考標(biāo)號1414表示被輸出的聲波。
以上為語音/音頻信號接收裝置的結(jié)構(gòu)以及動作。
在無線通信系統(tǒng)中的基站裝置以及通信終端裝置上,通過具備上述的語音/音頻信號發(fā)送裝置以及語音/音頻信號接收裝置,能夠得到高質(zhì)量的輸出信號。
這樣,根據(jù)本實(shí)施方式,能夠?qū)⒈景l(fā)明中的編碼裝置以及解碼裝置實(shí)際安裝在語音/音頻信號發(fā)送裝置以及語音/音頻信號接收裝置。
本發(fā)明中的編碼裝置以及解碼裝置不限于上述的實(shí)施方式1~2,能夠?qū)嵤└鞣N變更。
本發(fā)明中的編碼裝置以及語音解碼裝置也能搭載于移動通信系統(tǒng)中的移動終端裝置和基站裝置,由此,能夠提供具有與上述同樣的作用效果的移動終端裝置和基站裝置。
另外,在這里舉例說明了由硬件構(gòu)成本發(fā)明的情況,但是,本發(fā)明也能由軟件來實(shí)現(xiàn)。
本說明書基于2004年5月24日申請的特愿2004-153997。其內(nèi)容全部包含于此。
工業(yè)利用性本發(fā)明的編碼裝置和解碼裝置具有即使在失去編碼信息的情況下也能夠獲得質(zhì)量良好的解碼語音信號的效果,作為在將語音/音頻信號編碼并傳輸?shù)耐ㄐ畔到y(tǒng)中使用的語音/音頻編碼裝置和語音/音頻解碼方法等特別有用。
權(quán)利要求
1.一種對通過可擴(kuò)展編碼由多個層構(gòu)成的編碼信息進(jìn)行解碼并生成解碼信號的語音/音頻解碼裝置,包括幀丟失檢測單元,判定接收到的幀的所述各個層的編碼信息是否正常,生成作為判定結(jié)果的幀丟失信息;以及與所述層相同數(shù)量的解碼單元,基于所述幀丟失信息由所述接收到的編碼信息和之前接收到的多個編碼信息決定用于各個層的解碼的編碼信息,并使用決定的編碼信息進(jìn)行解碼來生成解碼信號。
2.如權(quán)利要求1所述的語音/音頻解碼裝置,其中,所述第i層(i為2以上的整數(shù))的解碼單元在第i層中檢測到幀丟失時,從接收到的第(i+1)層之后的編碼信息和前面幀的第i層編碼信息中選擇至少一個以上的編碼信息,使用選擇的編碼信息進(jìn)行解碼,由此生成解碼信號。
3.如權(quán)利要求1所述的語音/音頻解碼裝置,其中,所述第1層的解碼單元在第1層的編碼信息沒有被正常接收時,從第2層的編碼信息和前面幀的第1層編碼信息中選擇至少一個以上的編碼信息,使用選擇的編碼信息進(jìn)行解碼,由此生成解碼信號。
4.如權(quán)利要求1所述的語音/音頻解碼裝置,其中,幀丟失信息由數(shù)值表現(xiàn)編碼信息的接收狀態(tài)。
5.如權(quán)利要求1所述的語音/音頻解碼裝置,其中,幀丟失信息由二進(jìn)數(shù)表現(xiàn)編碼信息的接收狀態(tài)。
6.如權(quán)利要求1所述的語音/音頻解碼裝置,其中,至少一個解碼單元通過CELP型的語音/音頻解碼方法進(jìn)行解碼。
7.如權(quán)利要求6所述的語音/音頻解碼裝置,其中,CELP型的解碼單元包括LSP解碼單元,解碼量化LSP代碼并生成量化LSP;自適應(yīng)聲源向量生成單元,解碼自適應(yīng)聲源延遲代碼并生成自適應(yīng)聲源向量;固定聲源向量生成單元,解碼固定聲源向量代碼并生成固定聲源向量;量化聲源增益生成單元,解碼量化聲源增益代碼,并生成量化自適應(yīng)聲源增益和量化固定聲源增益;以及編碼信息操作單元,在第i層的編碼信息沒有被正常接收時,從包含在第(i+1)層之后的編碼信息和前面幀的第i層的編碼信息的多個量化LSP代碼中選擇至少一個以上的量化LSP代碼,所述LSP解碼單元使用在所述編碼信息操作單元選擇的量化LSP代碼進(jìn)行解碼,并生成量化LSP。
8.如權(quán)利要求7所述的語音/音頻解碼裝置,其中,所述LSP解碼單元將通過對所述編碼信息操作單元選擇的量化LSP代碼進(jìn)行解碼而獲得的所有量化LSP相加,并將相加結(jié)果作為量化LSP。
9.如權(quán)利要求7所述的語音/音頻解碼裝置,其中,所述編碼信息操作單元在第i層的編碼信息沒有被正常接收時,從包含在第(i+1)層之后的編碼信息和前面幀的第i層的編碼信息的多個自適應(yīng)聲源延遲代碼中選擇至少一個以上的自適應(yīng)聲源延遲代碼,所述自適應(yīng)聲源向量生成單元使用在所述編碼信息操作單元選擇的自適應(yīng)聲源延遲代碼進(jìn)行解碼,并生成自適應(yīng)聲源向量。
10.如權(quán)利要求7所述的語音/音頻解碼裝置,其中,所述自適應(yīng)聲源向量生成單元將通過對所述編碼信息操作單元選擇的自適應(yīng)聲源延遲代碼進(jìn)行解碼而獲得的所有自適應(yīng)聲源延遲相加,并使用相加結(jié)果生成自適應(yīng)聲源向量。
11.如權(quán)利要求7所述的語音/音頻解碼裝置,其中,所述編碼信息操作單元在第i層的編碼信息沒有被正常接收時,從包含在第(i+1)層之后的編碼信息和前面幀的第i層的編碼信息的多個量化聲源增益代碼中選擇至少一個以上的量化聲源增益代碼,所述量化聲源增益生成單元使用選擇的量化聲源增益代碼進(jìn)行解碼,并生成量化自適應(yīng)聲源增益和量化固定聲源增益。
12.如權(quán)利要求7所述的語音/音頻解碼裝置,其中,所述量化聲源增益生成單元以某個一定的比例,將通過對所述編碼信息操作單元選擇的量化自適應(yīng)聲源增益代碼進(jìn)行解碼而獲得的所有量化自適應(yīng)聲源增益相加,并使相加結(jié)果作為量化自適應(yīng)聲源增益,并且以某個一定的比例將所有的量化固定聲源增益相加,使相加結(jié)果作為量化固定聲源。
13.一種語音/音頻信號接收裝置,具備如權(quán)利要求1所述的語音/音頻解碼裝置。
14.一種基站裝置,具備如權(quán)利要求13所述的語音/音頻信號接收裝置。
15.一種通信終端裝置,具備如權(quán)利要求13所述的語音/音頻信號接收裝置。
16.一種對通過可擴(kuò)展編碼由多個層構(gòu)成的編碼信息進(jìn)行解碼并生成解碼信號的語音/音頻解碼方法,包括幀丟失檢測步驟,判定接收到的幀的所述各個層的編碼信息是否正常,生成作為判定結(jié)果的幀丟失信息;以及與所述層相同數(shù)量的解碼步驟,基于所述幀丟失信息由所述接收到的編碼信息和之前接收到的多個編碼信息決定用于各個層的解碼的編碼信息,并使用決定的編碼信息進(jìn)行解碼來生成解碼信號。
全文摘要
能夠在可擴(kuò)展編碼方式中實(shí)現(xiàn)通過幀丟失的隱藏處理而生成的解碼信號的質(zhì)量提升的語音/音頻解碼裝置。在該語音/音頻解碼裝置中,幀丟失檢測單元(152)判定編碼信息是否被正常接收,生成表示判定結(jié)果的幀丟失信息。第一解碼單元(153)基于幀丟失信息,在解碼時使用前一個幀的第一編碼信息、當(dāng)前幀的第一編碼信息以及當(dāng)前幀的第二編碼信息中的至少一個以上的編碼信息。第二解碼單元(154)基于幀丟失信息,在解碼時使用前一個幀的第一編碼信息、當(dāng)前幀的第一編碼信息、前一個幀的第二編碼信息以及當(dāng)前幀的第二編碼信息中的至少一個以上的編碼信息。加法器(155)將從第一解碼單元(153)輸出的解碼信號和從第二解碼單元(154)輸出的解碼信號相加。
文檔編號G10L19/14GK1957399SQ20058001682
公開日2007年5月2日 申請日期2005年5月13日 優(yōu)先權(quán)日2004年5月24日
發(fā)明者佐藤薰, 森井利幸, 山梨智史 申請人:松下電器產(chǎn)業(yè)株式會社