專利名稱:編碼方法和裝置以及解碼方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種編碼方法和裝置,用于將輸入的音頻信號(hào)分成預(yù)定的編碼單位例如數(shù)據(jù)塊和幀,對(duì)每一編碼單位實(shí)行編碼處理;以及涉及用于對(duì)該編碼信號(hào)解碼的方法和裝置。
已知有各種編碼方法,通過利用在音頻信號(hào)(包含語音信號(hào)和音響信號(hào))的時(shí)域和頻域中的統(tǒng)計(jì)特性和人聽覺的特性實(shí)行信號(hào)壓縮。關(guān)于編碼方法方面,有所謂的CELP(代碼激勵(lì)線性預(yù)測(cè))編碼例如VSEL(矢量和激勵(lì)線性預(yù)測(cè))編碼方法和PSI-CELP(音調(diào)合成修正-CELP)編碼方法,它們目前被認(rèn)為是低位速率的音頻編碼方法。
按波形編碼方法例如CELP編碼方法,將輸入音頻信號(hào)的預(yù)定數(shù)量的采樣用作編碼單位例如一數(shù)據(jù)塊或幀,使得對(duì)音頻信號(hào)沿時(shí)間軸的波形的每一數(shù)據(jù)塊或幀運(yùn)用分析附加合成的方法,以便實(shí)行對(duì)用于量化該波形的最佳矢量的閉環(huán)搜索并輸出矢量的系數(shù)。
利用低位速率例如2kbps(千位/秒)或4kbps的上述音頻編碼方法得到的編碼位作為音頻信號(hào)可以廣泛地應(yīng)用通信、計(jì)算機(jī)、廣播之類,而不論具體的音頻信息的內(nèi)容。因此,應(yīng)當(dāng)嚴(yán)格地保護(hù)防止在傳輸通路產(chǎn)生信息錯(cuò)誤。
如果在傳輸通路中重復(fù)發(fā)生信息錯(cuò)誤,音頻信號(hào)解碼就伴隨長(zhǎng)時(shí)間的漏掉聲音信息,使音頻信號(hào)質(zhì)量下降。
因此,本發(fā)明的目的是提供一種編碼方法和裝置以及解碼方法和裝置,它們能抑制傳輸通路信息錯(cuò)誤發(fā)生,能夠提高降低的質(zhì)量。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的編碼方法包含音頻編碼步驟,用于沿時(shí)間軸將輸入的音頻信號(hào)分成預(yù)定的編碼單位,并對(duì)每個(gè)編碼單位進(jìn)行編碼,以便輸出多種類型的音頻編碼參數(shù);錯(cuò)誤檢測(cè)代碼建立步驟,用于由根據(jù)音頻編碼步驟得到的多種類型的音頻編碼參數(shù)中選擇對(duì)于聽覺為重要的位,以及由該重要的位組建立錯(cuò)誤校驗(yàn)代碼;以及卷積編碼步驟,用于對(duì)根據(jù)錯(cuò)誤校驗(yàn)代碼建立步驟建立的錯(cuò)誤校驗(yàn)代碼和重要的位組實(shí)行卷積編碼。因而,可以防止對(duì)于聽覺為重要的位產(chǎn)生傳輸通路錯(cuò)誤。
這里,音頻編碼步驟包含短周期預(yù)測(cè)余(residue)計(jì)算步驟,用于得到輸入的音頻信號(hào)的短周期預(yù)測(cè)余數(shù);正弦波分析編碼步驟,用于對(duì)所得到的短周期預(yù)測(cè)余數(shù)實(shí)行正弦波分析編碼;以及波形編碼步驟,用于利用波形編碼對(duì)輸入的音頻信號(hào)進(jìn)行編碼。
此外,錯(cuò)誤校驗(yàn)代碼建立步驟選擇如下部分作為重要的位當(dāng)在短周期預(yù)測(cè)余數(shù)計(jì)算步驟中得到短周期預(yù)測(cè)余數(shù)時(shí)建立的參數(shù)中的某些或全部;正弦波分析編碼步驟的編碼輸出中的某些或全部;以及根據(jù)波形編碼步驟的編碼輸出中的某些或全部;以及根據(jù)該重要的位建立錯(cuò)誤校驗(yàn)代碼。
應(yīng)當(dāng)指出,由短周期預(yù)測(cè)余數(shù)計(jì)算步驟為得到短周期預(yù)測(cè)余數(shù)而建立的上述參數(shù)是形成輸入音頻信號(hào)的頻譜輪廓的線性頻譜成對(duì)參數(shù);由正弦波分析編碼步驟得到的編碼輸出包含表明輸入的音頻信號(hào)是發(fā)聲部分還是非發(fā)聲部分的發(fā)聲/非發(fā)聲確定參數(shù);以及如果輸入的音頻信號(hào)是發(fā)聲部分時(shí)的音調(diào)數(shù)據(jù)。以及表示短周期預(yù)測(cè)編碼余數(shù)的頻譜包絡(luò)線的頻譜碼本索引和增益索引;根據(jù)波形編碼步驟的編碼輸出是當(dāng)輸入信號(hào)為非發(fā)聲部分時(shí)的基于短周期預(yù)測(cè)余數(shù)的噪聲碼本索引和增益索引。
此外,為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的編碼裝置包含音頻編碼裝置,用于沿時(shí)間軸將輸入的音頻信號(hào)分成預(yù)定的編碼單位并且對(duì)每個(gè)單位進(jìn)行編碼,以便輸出多種類型的音頻編碼的參數(shù);錯(cuò)誤校驗(yàn)代碼建立裝置,用于由來自音頻編碼裝置的多種類型的音頻編碼的參數(shù)中選擇對(duì)于聽覺為重要的位,和由該重要的位建立錯(cuò)誤校驗(yàn)代碼;以及卷積編碼裝置,用于對(duì)來自錯(cuò)誤校驗(yàn)代碼建立裝置的錯(cuò)誤校驗(yàn)代碼和該重復(fù)位實(shí)行卷積編碼。
此外,根據(jù)本發(fā)明的解碼方法,用于對(duì)由輸入的音頻信號(hào)得到的編碼數(shù)據(jù)進(jìn)行解碼,該輸入音頻信號(hào)已沿時(shí)間軸分成預(yù)定的單位,該單位已經(jīng)編碼,以便得到多種類型的音頻編碼參數(shù),根據(jù)這些參數(shù)已將對(duì)于聽覺為重要的位用于建立錯(cuò)誤校驗(yàn)代碼,其中的錯(cuò)誤校驗(yàn)代碼和重要的位已進(jìn)行卷積編碼得到編碼的輸出,該輸出已與非重要的位相結(jié)合用以進(jìn)行傳輸,該解碼方法包含卷積解碼步驟,用于對(duì)經(jīng)卷積編碼的輸出實(shí)行卷積解碼,以便由附加有錯(cuò)誤校驗(yàn)代碼的重要位和非重要位得到解碼的輸出;錯(cuò)誤校驗(yàn)步驟,用于利用附加到根據(jù)卷積解碼步驟得到的卷積解碼輸出上的錯(cuò)誤校驗(yàn)代碼校驗(yàn)傳輸信息錯(cuò)誤,輸出調(diào)節(jié)步驟,用于根據(jù)在錯(cuò)誤校驗(yàn)步驟中的錯(cuò)誤校驗(yàn)結(jié)果調(diào)節(jié)經(jīng)卷積解碼的輸出;以及音頻解碼步驟,用于對(duì)根據(jù)輸出調(diào)節(jié)步驟得到的經(jīng)卷積解碼的輸出實(shí)行音頻解碼處理。
這里,如果在錯(cuò)誤校驗(yàn)步驟中檢測(cè)到錯(cuò)誤,則輸出調(diào)節(jié)步驟輸出通過內(nèi)插處理得到的內(nèi)插數(shù)據(jù),替代經(jīng)卷積的解碼輸出。
此外,輸出調(diào)節(jié)步驟根據(jù)錯(cuò)誤校驗(yàn)的結(jié)果對(duì)經(jīng)卷積解碼的輸出實(shí)行不良幀屏蔽處理。
此外,根據(jù)本發(fā)明的解碼裝置用于對(duì)由輸入音頻信號(hào)得到的編碼數(shù)據(jù)進(jìn)行解碼,該信號(hào)已沿時(shí)間軸分成預(yù)定的單位,這些單位已經(jīng)過編碼以得到多種類型的音頻編碼的參數(shù),根據(jù)這些參數(shù)已利用對(duì)于聽覺為重要的位建立錯(cuò)誤校驗(yàn)代碼,其中已對(duì)該錯(cuò)誤校驗(yàn)代碼和重要的位進(jìn)行卷積編碼以得到編碼的輸出,這些輸出已與非重要的位相結(jié)合用以進(jìn)行傳輸;該解碼裝置包含卷積解碼裝置,用于對(duì)該經(jīng)卷積編碼的輸出實(shí)行卷積解碼,以便由附加有錯(cuò)誤校驗(yàn)代碼的重要位和非重要位得到解碼的輸出;錯(cuò)誤校驗(yàn)和輸出調(diào)節(jié)裝置,用于利用附加到來自卷積解碼裝置的經(jīng)卷積解碼的輸出上的錯(cuò)誤校驗(yàn)代碼來校驗(yàn)傳輸信息錯(cuò)誤以及根據(jù)錯(cuò)誤校驗(yàn)結(jié)果調(diào)節(jié)經(jīng)卷積解碼的輸出;以及音頻解碼裝置,用于對(duì)來自錯(cuò)誤校驗(yàn)和輸出調(diào)節(jié)裝置的經(jīng)卷積解碼的輸出實(shí)行音頻解碼處理。
圖1是一表示根據(jù)本發(fā)明的作為編碼方法和裝置以及解碼方法和裝置的一個(gè)實(shí)施例的移動(dòng)電話裝置的基本結(jié)構(gòu)的方塊圖。
圖2是一表示構(gòu)成移動(dòng)電話裝置用的音頻解碼器基本結(jié)構(gòu)的方塊圖。
圖3是一表示音頻解碼器的詳細(xì)結(jié)構(gòu)的方塊圖。
圖4表示一用于解釋構(gòu)成移動(dòng)電話裝置用的傳輸通路解碼器的工作清況的狀態(tài)傳輸?shù)男蛄小?br>
圖5是一表示構(gòu)成移動(dòng)電話裝置用的音頻解碼器的基本結(jié)構(gòu)的方塊圖。
圖6是一表示音頻解碼器的詳細(xì)結(jié)構(gòu)的方塊圖。
圖7是一用于解釋由移動(dòng)電話裝置實(shí)施的編碼方法的流程圖。
圖8是一用于解釋由移動(dòng)電話裝置實(shí)施的編碼方法的流程圖。
下面將對(duì)根據(jù)本發(fā)明的一實(shí)施例的編碼方法和裝置以及解碼方法和裝置進(jìn)行介紹。
圖1表示一移動(dòng)電話裝置,其包含構(gòu)成編碼裝置的音頻編碼器3和傳輸通路解碼器4,以及構(gòu)成解碼裝置的傳輸通路解碼器14和音頻解碼器17,均根據(jù)本發(fā)明的一個(gè)實(shí)施例。傳輸通路編碼器4具有-CRC代碼計(jì)算功能塊5和卷積編碼器6。傳輸通路解碼器14具有卷積解碼器16以及CRC代碼比較功能塊和幀屏蔽功能塊15。
即,在這種移動(dòng)電話裝置中,采用本發(fā)明的編碼方法的編碼裝置音頻編碼器3,其將輸入的音頻信號(hào)沿時(shí)間軸分成預(yù)定的單位,對(duì)每一單位進(jìn)行編碼并輸出多種類型的音頻編碼參數(shù);CRC代碼計(jì)算功能塊5,其由來自音頻編碼器3的多種類型的音頻編碼參數(shù)中間選擇對(duì)于聽覺來說是重要的位組,以便建立CRC(循環(huán)冗余碼校驗(yàn))代碼;以及編碼器6,其對(duì)來自CRC代碼計(jì)算功能塊5的上述CRC代碼和重要的位組進(jìn)行卷積編碼。
此外,在這種移動(dòng)電話裝置中,采用根據(jù)本發(fā)明的解碼方法的解碼裝置對(duì)經(jīng)卷積編碼的輸出進(jìn)行解碼。即,將輸入的音頻信號(hào)沿時(shí)間軸分成預(yù)定的單位,對(duì)每一單位進(jìn)行編碼,以便得到多種類型的音頻編碼參數(shù),根據(jù)這些參數(shù)使用一對(duì)于聽覺來說是重要的位組,以便建立CRC代碼。對(duì)因此建立的CRC代碼和上述重要的位組進(jìn)行卷積編碼以便得到經(jīng)卷積編碼的輸出,其再與已除去該重要的位組以外的其余位組相結(jié)合。由解碼裝置對(duì)與該其余位組組合的這一經(jīng)卷積編碼的輸出進(jìn)行解碼。該解碼裝置包含卷積解碼器16,用于對(duì)該經(jīng)卷積編碼的輸出進(jìn)行卷積解碼并輸出該附加CRC代碼的重要的位組和其余的位組作為解碼輸出;CRC代碼比較和幀屏蔽功能塊15,用于將來自卷積解碼器16的附加到經(jīng)卷積解碼的輸出上的CRC代碼與由其余位位計(jì)算的CRC差錯(cuò)校碼代碼相比較,并根據(jù)比較結(jié)果進(jìn)行調(diào)節(jié)該上述經(jīng)卷積解碼的輸出;以及音頻解碼器17,用于對(duì)來自這一CRC代碼比較和幀屏蔽功能塊15的經(jīng)卷積解碼的輸出進(jìn)行音頻解碼處理。
在這一移動(dòng)電話裝置中,在傳輸過程中,由麥克風(fēng)1輸入的音頻信號(hào)由A/D變換器變換為數(shù)字信號(hào),由音頻編碼器3按照2kbps(千位/秒)/4kbps的低位編碼方式進(jìn)行編碼。該經(jīng)編碼的數(shù)字信號(hào)由傳輸通路編碼器進(jìn)一步編碼,使音頻信號(hào)質(zhì)量不受傳輸通路質(zhì)量的影響。在此之后,由調(diào)制器7對(duì)該數(shù)字信號(hào)進(jìn)行調(diào)制,并且在經(jīng)過公用天線裝置9由天線10發(fā)射之前利用發(fā)射器8對(duì)其輸出位進(jìn)行發(fā)射處理。
此外,在接收過程中,利用接收器11經(jīng)過公用天線裝置9接收由天線10獲得的無線電波,由解調(diào)器13進(jìn)行解碼,在傳輸通路解碼器14中進(jìn)行傳輸通路差錯(cuò)進(jìn)行校正,由音頻解碼器17解碼,并由D/A變換器變換為模擬音頻信號(hào),以便由擴(kuò)音器19輸出。
此外,控制功能塊20控制各上述組成部分,合成器12向發(fā)射器8和接收器11提供發(fā)射和接收頻率。此外,鍵盤21和LCD顯示器22用作人機(jī)接口界面。
在具有上述結(jié)構(gòu)的移動(dòng)電話裝置中,CRC代碼計(jì)算功能塊5按照上述重要位組選擇構(gòu)成上述音頻信號(hào)的頻譜包絡(luò)線的所有線性譜成對(duì)(LSP)參數(shù)中的一部分;表明音頻信號(hào)是清音(V)還是濁音(UV)部分的所有V/UV確定參數(shù);如果音頻信號(hào)是清音時(shí)的部分或所有音調(diào)參數(shù);如果音頻信號(hào)是濁音時(shí),表示線性預(yù)測(cè)編碼(LPC)的余數(shù)信號(hào)頻譜包絡(luò)線的頻譜碼本索引和增益索引的一部分或全部;以及如果音頻信號(hào)為清音時(shí)的表示線性預(yù)測(cè)編碼(LPC)的剩余信號(hào)的噪聲碼本索引和增益索引的一部分或全部。根據(jù)這些重要的位,建立CRC代碼。
這些重要的位是由音頻編碼器3得到的。這一音頻編碼器3進(jìn)行的音頻(信號(hào))編碼包含短期預(yù)測(cè)余數(shù)的計(jì)算步驟,用于確定輸入音頻信號(hào)的短期余數(shù);正弦波分析編碼步驟,用于對(duì)所得到的短期余數(shù)進(jìn)行正弦波分析編碼;以及波形編碼步驟,用于通過波形編碼對(duì)輸入的音頻信號(hào)編碼。下面參照?qǐng)D2和圖3將詳細(xì)介紹這一音頻編碼器3。
圖2中的音頻編碼器3基于使用兩個(gè)編碼器;第一編碼功能塊(器),其確定輸入音頻信號(hào)的短期預(yù)測(cè)余數(shù)例如LPC(線性預(yù)測(cè)編碼)余數(shù)并進(jìn)行正弦波分析編碼例如諧波編碼;以及第二編碼功能塊(器)120,從而使第一編碼功能塊110用于對(duì)輸入信號(hào)中的清音(V)部分進(jìn)行編碼以及使第二編碼功能塊120用于對(duì)輸入信號(hào)中的濁音(UV)部分進(jìn)行編碼。
第一編碼功能塊110的結(jié)構(gòu)適于對(duì)LPC余數(shù)進(jìn)行正弦波分析編碼例如諧波編碼和多帶激勵(lì)(MBE)編碼。第二編碼功能塊120例如具有的結(jié)構(gòu)適于利用在合成的基礎(chǔ)上的分析借助對(duì)于最佳矢量的閉環(huán)搜索,利用矢量量化進(jìn)行代碼激勵(lì)線性預(yù)測(cè)(CELP)編碼。
在圖2的實(shí)例中,提供到輸入端101的音頻信號(hào)輸送到第一編碼功能塊110中的LPC逆濾波器111和LPC分析量化功能塊113。由LPC分析一量化功能塊113得到的LPC系數(shù)即所謂的α參數(shù)提供到LPC逆濾波器111。這一LPC逆慮波器111線性預(yù)測(cè)余數(shù)(輸入音頻信號(hào)的LPC余數(shù)。此外,LPC分析一量化功能塊113正如下面將詳細(xì)介紹的輸出LSP(線性預(yù)測(cè)成對(duì)系數(shù)),以及這一輸出被輸送到輸出端102。來自LPC逆濾波器111的LPC余數(shù)被輸送到正弦波編碼功能塊114。正弦波編碼功能塊114進(jìn)行音頻檢測(cè)和頻譜包絡(luò)線幅值計(jì)算以及在V(清音)/UV(濁音)確定功能塊115中進(jìn)行V/UV確定。正弦波分析編碼功能塊114向頻譜量化功能塊16提供頻譜包絡(luò)線幅值數(shù)據(jù)。矢量量化功能塊116輸出作為頻譜包絡(luò)線的矢量量化輸出的碼本索引,經(jīng)過開關(guān)117提供到輸出端103。來自正弦波分析編碼功能塊114的輸出經(jīng)過開關(guān)118提供到輸出端104。此外,來自V/UV確定功能塊115的V/UV確定結(jié)果輸送到輸出端105以及提供作為開關(guān)117和118的控制信號(hào)。在為上述清音(V)的情況下,選擇上述索引和音調(diào),并分別由輸出端103和104輸出。
圖2中的第二編碼功能塊120具有一CELP(代碼激勵(lì)線性預(yù)測(cè))編碼結(jié)構(gòu)。來自噪聲碼本121的輸出由加權(quán)合成濾波器122進(jìn)行合成。所得到的經(jīng)加權(quán)的音頻(信號(hào))提供到減法器123,在其中確定在經(jīng)加權(quán)的音頻(信號(hào))與提供到輸入端101并再提供到加權(quán)濾波器125上的音頻信號(hào)之間的差。第一誤差差值提供到一用于位距計(jì)算的位距計(jì)算電路124,并在噪聲碼本121中搜索使該誤差差值最小的矢量。因此,將合成分析方法應(yīng)用在閉環(huán)搜索中,用以實(shí)現(xiàn)沿時(shí)間軸的波形的矢量量化。正如上面已經(jīng)介紹的,對(duì)于濁音采用這種CELP編碼。來自噪聲碼本121的作為UV數(shù)據(jù)的碼本經(jīng)過開關(guān)127由輸出端107取出,當(dāng)來自V/UV確定功能塊115的V/UV確定結(jié)果為濁音(UV)時(shí)接通該開關(guān)。
圖3表示在圖2中所示的音頻編碼器3的更具體的結(jié)構(gòu)。在圖3中與圖2中相似的組成部分用相同的標(biāo)號(hào)標(biāo)準(zhǔn)。
在圖3中所示的音頻編碼器中,在高通濾波器(HPF)109中對(duì)提供到輸入端101的音頻信號(hào)進(jìn)行濾波處理,以便除去不需要的頻帶的信號(hào),且再傳輸?shù)絃PC分析電路和LPC(線性預(yù)測(cè)編碼)分析量化功能塊113中的LPC反相電路111。
LPC分析一量化功能塊113中的LPC分析電路132將一Hamming(漢明)窗口應(yīng)用于由約256采樣構(gòu)成的輸入信號(hào)波形中的一個(gè)(數(shù)據(jù))塊,以便利用自相關(guān)法得到線性預(yù)測(cè)系數(shù),即所謂α參數(shù)。作為數(shù)據(jù)輸出單位的成幀間隔約160采樣。當(dāng)采樣頻率fs例如為8KHZ(千赫)時(shí),在20ms(毫秒)內(nèi)成幀間隔為160采樣。
來自LPC分析電路132的α參數(shù)提供到α-LSP變換電路133,以便變換為線性頻譜成對(duì)(LSP)參數(shù)。即作為正向(direct)型濾波器系數(shù)得到的α參數(shù)變?yōu)?0個(gè),即5對(duì)LSP參數(shù)。例如利用Newton-Raphson法或類似方法進(jìn)行這種變換。LSP參數(shù)具有比α參數(shù)更優(yōu)良的內(nèi)插特性。
來自α-LSP變換電路133的LSP參數(shù)由LSP量化器134進(jìn)行矩陣量化或矢量量化。這里,可以確定在矢量量化之間的各幀之間的差,或者一次對(duì)多幀進(jìn)行矩陣量化。這里,20ms構(gòu)成一幀,對(duì)每個(gè)在每20ms內(nèi)計(jì)算的2幀LSP參數(shù)進(jìn)行矩陣量化和矢量量化。
來自LSP量化器134的量化輸出即LSP量化系數(shù)經(jīng)過連接端102取出,并將經(jīng)矢量量化的LSP提供到LSP內(nèi)插電路136。
LSP內(nèi)插電路136每20ms或40ms按8倍的速率將經(jīng)LSP矢量量化的LSP進(jìn)行內(nèi)插,這樣LSP矢量每2.5ms進(jìn)行更新。利用諧波編碼解碼方法進(jìn)行分析一合成的余數(shù)波形成為一種具有十分平緩和平滑包絡(luò)線的合成波形。如果LPC系數(shù)每20ms急劇變化就會(huì)產(chǎn)生異常的噪聲。如果LPC系數(shù)每2.5ms逐漸地變化就能防止這種異常噪聲的發(fā)生。
為了實(shí)現(xiàn)這樣輸入音頻(信號(hào))的逆濾波,利用每2.5ms內(nèi)插的LSP矢量來進(jìn)行,LSP-α變換電路137將LSP參數(shù)變換為α參數(shù),即為例如為10階的正向型濾波器的系數(shù)。來自這-LSP-α變換電路137的輸出提供到上述LPC逆濾波器111。這一LPC逆濾波器111利用每2.5ms更新的α參數(shù)進(jìn)行逆濾波,以便得到平滑的輸出。來自LPC逆濾波器111的輸出提供到正弦波分析編碼功能塊114,更具體地說,提供到一例如為DFE(離散Fourier變換)電路的諧波編碼電路中的正交變換電路145。
來自LPC分析一量化功能塊113的LPC分析電路132的α參數(shù)提供到按聽覺加權(quán)濾波器計(jì)算電路139,以便得到用于按聽覺加權(quán)的數(shù)據(jù)。這一加權(quán)數(shù)據(jù)提供到具有按聽覺的權(quán)重的矢量量化器116和第二編碼功能塊120,即按聽覺加權(quán)濾波器125和按聽覺加權(quán)的合成濾波器122。
在例如為諧波編碼電路的正弦波分析編碼功能塊114中,來自LPC逆濾波器111的輸出利用諧波編碼方法進(jìn)行分析。即進(jìn)行音調(diào)檢測(cè)、每一諧波幅值A(chǔ)m的計(jì)算、清音(V)濁音(UV)部分的識(shí)別,以便通過范圍變換,根據(jù)音調(diào)或幅值A(chǔ)m的數(shù)量形成持續(xù)的諧波包絡(luò)線變化。
在圖3中所示的正弦波分析編碼功能塊114的特定實(shí)例中,該為一般的諧波編碼。在MBE(多帶激勵(lì))編碼的情況下,設(shè)想,在每一頻帶中出現(xiàn)清音和濁音,即在相同時(shí)間處在一頻率軸區(qū)域內(nèi)(在一數(shù)據(jù)塊或幀內(nèi))。在另外諧波編碼中,確定在一數(shù)據(jù)塊或幀內(nèi)的音頻信號(hào))屬于清音還是濁音。應(yīng)當(dāng)指出,在下面的解釋中,當(dāng)使用于MBE編碼時(shí),按這樣一種方式確定在一幀內(nèi)的V/UV,即如果整個(gè)頻帶屬于UV,則確定該幀為UV部分。上述MBE分析-合成法在本發(fā)明的申請(qǐng)人申請(qǐng)的4-91422號(hào)日本專利申請(qǐng)的說明書和附圖中有詳細(xì)說明。
在圖3中的正弦波分析編碼功能塊114具有-開環(huán)音調(diào)搜索功能塊141,由輸入端101向其提供輸入音頻信號(hào);以及還有一過零計(jì)數(shù)器142,由上述HPF(高通濾波器)109向其提供信號(hào)。在正弦波分析編碼功能塊114中,由LPC(逆濾波器111向正交變換電路145提供LPC余數(shù)或線性預(yù)測(cè)余數(shù)。在開環(huán)搜索碼本141中,根據(jù)輸入信號(hào)的LPC余數(shù),利用開環(huán)進(jìn)行比較粗略的音調(diào)搜索。所抽取的粗略音調(diào)數(shù)據(jù)提供到高精度音調(diào)搜索功能塊146,使得利用后面將詳細(xì)介紹的閉環(huán)進(jìn)行精細(xì)音調(diào)搜索。開環(huán)音調(diào)搜索功能塊141輸出上述粗略音調(diào)數(shù)據(jù)時(shí)連同一起輸出由功率歸一化的LPC余數(shù)的自相關(guān)最大值,即提供到V/UV確定功能塊115的歸一化的自相關(guān)最大值r(P)。
在正交變換電路145中,進(jìn)行例如為DFT(離散Fourier變換)的正交變換處理,以便將沿時(shí)間軸的LPC余數(shù)變換為沿頻率軸的頻譜幅值數(shù)據(jù)。來自正交變換電路145的輸出提供到一精細(xì)音調(diào)搜索功能塊146和一用于評(píng)估頻譜幅值或包絡(luò)線的頻譜評(píng)估功能塊148。
向精細(xì)音調(diào)搜索功能塊146提供由開環(huán)音調(diào)搜索功能塊141中抽取的比較粗略的音調(diào)數(shù)據(jù)和來自正交變換功能塊145的沿頻率軸的經(jīng)DFT的數(shù)據(jù)。在這一精細(xì)音調(diào)搜索功能塊146中,少許采樣力圖按0.2到0.5的間隔在上述粗略音調(diào)數(shù)據(jù)以上和以下分布,以便得到一最佳散布的精細(xì)音調(diào)數(shù)據(jù)數(shù)值。這里采用的精細(xì)搜索方法被稱之為分析附帶合成的方法,在其中按這樣一種方式即使合成的功率譜最接近原有的音頻(信號(hào))功率譜的方式選擇音調(diào)。利用這種閉環(huán)在精細(xì)音調(diào)搜索功能塊中得到的音調(diào)數(shù)據(jù)經(jīng)過開關(guān)118提供到輸出端104。
在頻譜評(píng)估功能塊148中,根據(jù)頻譜的幅值和作為L(zhǎng)PC余數(shù)的正交變換輸出的音調(diào),評(píng)估每一諧波的大小以及其組合,即頻譜包絡(luò)線。這一評(píng)估結(jié)果提供到精細(xì)音調(diào)搜索功能塊146、V/UV(清音/濁音)確定功能塊以及按聽覺加權(quán)的矢量量化器116。
V/UV確定功能塊115根據(jù)來自正交變換電路145的輸出、來自精細(xì)音調(diào)搜索功能塊146的最佳音調(diào)、來自頻譜評(píng)估功能塊148的頻譜幅值數(shù)據(jù),來自開環(huán)音調(diào)搜索功能塊141的歸一化的自相關(guān)最大值r(p)以及來自過零記數(shù)器142的過零記數(shù)值,確定該幀屬于V還是UV部分。此外,在MBE的情況下,可以利用對(duì)于每一頻帶的V/UV確定結(jié)果的邊界位置作為該幀的V/UV確定狀態(tài)。由這一V/UV確定功能塊輸出的確定結(jié)果經(jīng)過輸出端105取出。
另一方面,在頻譜評(píng)估功能塊148的輸出功能塊中或者在矢量量化器116的輸入功能塊中設(shè)有數(shù)據(jù)計(jì)數(shù)變換(一種采樣速率變換)功能塊。這一數(shù)據(jù)計(jì)數(shù)變換功能塊用于保持恒定數(shù)目的包絡(luò)線幅值數(shù)據(jù)|Am|,這里考慮到沿頻率軸被劃分的頻帶的數(shù)目和數(shù)據(jù)的數(shù)目根據(jù)上述音調(diào)而變化。即,如果例如有效的頻帶設(shè)想高達(dá)3400KH,這一有效的頻帶根據(jù)上述音調(diào)被分成8到63個(gè)頻帶,因此,對(duì)于每一頻帶得到的數(shù)目為mMX+1的幅值數(shù)據(jù)|Am|,其數(shù)目由8變換到63。為了按其編碼,數(shù)據(jù)計(jì)數(shù)變換功能塊119將幅值數(shù)據(jù)的可變數(shù)目mMX+1變換為一恒定的數(shù)目例如44。
設(shè)在頻譜評(píng)估功能塊148的輸出功能塊中或矢量量化器116的輸入功能塊中的數(shù)據(jù)計(jì)數(shù)變換功能塊輸出的幅值數(shù)據(jù)或包絡(luò)線數(shù)據(jù)的恒定數(shù)目M(例如44)被匯集為一個(gè)矢量的例如為44的預(yù)定數(shù)目的數(shù)據(jù),該矢量為一要進(jìn)行加權(quán)矢量量化的矢量。利用來自按聽覺加權(quán)濾波器計(jì)算電路139的輸出提供這種加權(quán)。來自矢量量化器116的包絡(luò)線經(jīng)過開關(guān)117由輸出端113取出。應(yīng)當(dāng)指出,在進(jìn)行加權(quán)矢量量化之前,對(duì)于由預(yù)定數(shù)目的數(shù)據(jù)構(gòu)成的矢量利用適當(dāng)?shù)姆逯迪禂?shù)可以得到幀內(nèi)的差。
按著對(duì)第二編碼功能塊120進(jìn)行解釋。第二編碼功能塊120具有一所謂的CELP(代碼激勵(lì)線性預(yù)測(cè))編碼結(jié)構(gòu),并特別適用于對(duì)輸入的音頻信號(hào)中的濁音的部分編碼。在用于濁音的部分的這一CELP編碼結(jié)構(gòu)中,一噪聲碼本即所謂的隨機(jī)碼本121輸出與濁音的音頻信號(hào)LPC余數(shù)相對(duì)應(yīng)的噪聲輸出的典型數(shù)值,其再經(jīng)過增益電路126提供到加權(quán)合成濾波器122。在這一加權(quán)合成濾波器122中,對(duì)輸入的噪聲進(jìn)行LPC合成處理,將所得到的經(jīng)加權(quán)的濁音部分的音頻信號(hào)提供到減法器123。還向減法器123提供有由輸入端101經(jīng)過HPF(高通濾波器)和按聽覺加權(quán)濾波器125提供的音頻信號(hào),在濾波器125中已對(duì)音調(diào)信號(hào)進(jìn)行按聽覺加權(quán)。在減法器中,得到這一加權(quán)的信號(hào)和來自合成濾波器122的信號(hào)之間差值或誤差。應(yīng)指出,這是設(shè)想,來自按聽覺加權(quán)濾波器的輸出是預(yù)先減去按聽覺加權(quán)的合成濾波器的零輸入響應(yīng)的。這一差值或誤差提供到一用于位距計(jì)算的位距計(jì)算電路124,在噪聲碼本122中搜索一使該差值或誤差降至最小的有代表性數(shù)值的矢量。因此,借助分析附加合成方法利用閉環(huán)搜索進(jìn)行沿時(shí)間軸的波形的矢量量化。
由利用CELP編碼結(jié)構(gòu)的第二編碼功能塊120取得作為UV(濁音)部分的數(shù)據(jù)的,來自噪聲碼本的碼本的形狀索引和來自增益電路126的碼本中的增益索引。
作為來自噪聲碼本121的UV數(shù)據(jù)的形狀索引經(jīng)過開關(guān)127s提供到該輸出端107s,而作為增益電路126的UV數(shù)據(jù)的增益索引經(jīng)過一開關(guān)127g提供到該輸出端107g。
這里指出,這些開關(guān)127g、127s以及上述的開關(guān)117和118都根據(jù)來自V/UV確定功能塊115的V/UV確定結(jié)果進(jìn)行通斷控制。當(dāng)所傳輸?shù)囊粋€(gè)當(dāng)前幀的音頻信號(hào)被確定為清音(V)時(shí),控制開關(guān)117和118接通,而當(dāng)所傳輸?shù)囊粋€(gè)當(dāng)前幀的音頻信號(hào)被確定為濁音(UV)時(shí),控制開關(guān)127s和127g接通。
表1表示由具有上述結(jié)構(gòu)的音頻編碼器3輸出的參數(shù)LSP參數(shù)、清音/濁音確定參數(shù)、音調(diào)參數(shù)、頻譜包絡(luò)線碼本參數(shù)以及增益系數(shù)、噪聲碼本參數(shù)和增益系數(shù),它們都分成2/4kbps(千位/秒)進(jìn)行編碼。表1還介紹了分配的位數(shù)。
上述的傳輸通路編碼器4使CRC代碼計(jì)算功能塊5能選擇表1中所示的某些或全部參數(shù)作為用于聽覺來說是重要的位組和計(jì)算CRC代碼。利用卷積編碼器6對(duì)CRC代碼和該重要的位組進(jìn)行卷積編碼。
如在表2中所示,在2kbps的情況下,關(guān)于每2幀40ms為120位的情況下,80位的重要位組按照Ⅰ類被處理,其余40位按照Ⅱ類被處理。
根據(jù)Ⅰ類80位,CRC代碼計(jì)算功能塊5建立14位CRC代碼。卷積編碼器6利用Ⅰ類的80位、14位CRC代碼和10表格位進(jìn)行卷積編碼。
對(duì)利用這一卷積編碼器6得到的104位和Ⅱ類的40位(即總共144位)進(jìn)行位交錯(cuò)和2幀交錯(cuò)以便傳輸,因此實(shí)現(xiàn)按2kbps對(duì)音頻信號(hào)編碼。應(yīng)當(dāng)指出,當(dāng)準(zhǔn)確進(jìn)行傳輸時(shí),附加其它冗余位。
此外,在4kbps的情況下,如表2中所示,該重要位組中的112位作為Ⅰ類處理以及其它104位按照Ⅱ類處理。
根據(jù)Ⅰ類的112位,CRC代碼計(jì)算功能塊5建立14位的CRC代碼。利用Ⅰ類的112位、14位CRC代碼和10表格位進(jìn)行卷積編碼。
對(duì)利用這一卷積編碼器6得到的136位和Ⅱ類的104位(即總共240位)進(jìn)行位交錯(cuò)和2幀交錯(cuò)用以傳輸,因此實(shí)現(xiàn)按4kbps對(duì)音頻信號(hào)編碼。應(yīng)當(dāng)指出,當(dāng)準(zhǔn)確進(jìn)行傳輸時(shí),附加其它冗余位。
表3表示在2kbps的情況下Ⅰ類和Ⅱ類的分配情況。Ⅰ類是分配作為被保護(hù)位的重要位組,Ⅱ類分配作為非被保護(hù)的。應(yīng)當(dāng)指出,這里所提供的實(shí)例是針對(duì)20ms一幀的。
此外,表4表示在4kbps的情況下的Ⅰ類和Ⅱ類的分配情況。
表4
上述表2和表3表示被保護(hù)位/非被保護(hù)位的分配實(shí)例,即對(duì)于聽覺來說是重要的位的分配實(shí)例構(gòu)成音頻信號(hào)的頻譜的輪廊的線性頻譜成對(duì)(LSP)參數(shù)中的某些或全部;表示音頻信號(hào)是清音還是濁音的部分的清音(V)濁音(UV)定參數(shù)的全部;當(dāng)音頻信號(hào)為清音時(shí)的音調(diào)參數(shù)中的某些或全部;表示當(dāng)音頻信號(hào)為清音時(shí)的線性預(yù)測(cè)編碼(LPC)冗余信號(hào)的頻譜包絡(luò)線的頻譜碼本索引和增益索引中的某些或全部;當(dāng)音頻信號(hào)是濁音時(shí)的線性預(yù)測(cè)編碼(LPC)冗余信號(hào)的噪聲碼本索引和增益索引中的某些或全部。
在移動(dòng)電話裝置中,為了維持通話質(zhì)量,第一LSP參數(shù)LSP0是與由碼本得到的實(shí)際LSP系數(shù)接近的LSP頻率。由于要求準(zhǔn)確地傳輸,所有的6位都按照被保護(hù)位處理。此外,用作V/UV確定參數(shù)的V/UV參數(shù)表示信號(hào)的質(zhì)量,以及所有兩位都受保護(hù)。另外,音調(diào)參(PCH)是信號(hào)的基頻,高達(dá)7位中的6位受到保護(hù)。此外,在為清音的情況下,表示LPC余部信號(hào)的頻譜包絡(luò)線的碼本中的增益索引代表信號(hào)的聲級(jí),由于準(zhǔn)確傳輸通信的要求,所有5位受到保護(hù)。
即,在傳輸通路易引起信息錯(cuò)誤的環(huán)境下,這些重要的位用于在一定程度上維持通信質(zhì)量。這樣就能防止可能由于位錯(cuò)誤引起的異常聲音的產(chǎn)生。
下面詳細(xì)解釋利用CRC代碼計(jì)算功能塊5進(jìn)行的CRC代碼計(jì)算和利用卷積編碼器6進(jìn)行的卷積編碼。
表5和表6表示了關(guān)于在2kbps情況下的Ⅰ類和關(guān)于在4kbps情況下的Ⅰ類時(shí)加入-CRC建立多項(xiàng)式中的輸入位次序P[i]。這里,下標(biāo)“P”代表前一幀的參數(shù)。此外,位0代表-LSP0在一項(xiàng)之中提供兩個(gè)參數(shù)的情況下,在上一列中提供的參數(shù)是針對(duì)清音的。在下一列中提供的參數(shù)是針對(duì)濁音的。。R(x)=Σi=06CRC[i]•xt---(1)]]>[方程2]x7Σi=0NP[i]•xt=Q(x)•GCRC(x)+R(x)---(2)]]>[方程3]GCRC(x)=1+x4+x5+x6+x7...(3)在方程(2)中,如果為2kbps則N=39;如果為4kbps則N=55。在此之后,如果不另外規(guī)定,即采取這一假設(shè)。
利用由上述方程(1)到(3)得到的CRC代碼CRC[i]和在表5和表6中所示的P[i],按照在下面提供的方程(4)中表示的建立加入到卷積編碼器6中的輸入位串CVin[i]。
向卷積編碼器6提供有該輸入位串CVin[i]和上述重復(fù)位組,以便利用如在下面的方程(5)和(6)中表示的兩個(gè)新建多項(xiàng)式進(jìn)行卷積編碼。G1(D)=i+D+D3+D5...(5)[方程6]G2(D)=i+D2+D3+D4+D5...(6)由G1(D)開始,及交替利用方程(5)和(6),這一卷積編碼器6進(jìn)行卷積編碼。
表7和表8分別表示針對(duì)2kbps和4kbps時(shí)的Ⅱ類的位次序。按照這種輸入次序,將Ⅱ類位與由卷積編碼器6的編碼輸出相組合,用以進(jìn)行傳輸。
表8
<p>應(yīng)當(dāng)指出,在按照4kbps的如表8中所示的Ⅱ類位次序中,位數(shù)大至104。對(duì)于2幀組合,僅顯示1幀。實(shí)際上,前一幀的和后一幀的位是交替排列的。
接著在上述解碼裝置中,例如在對(duì)作為卷積編碼的輸出的,由另一個(gè)移動(dòng)電話裝置的編碼裝置接收的位串解碼之后,卷積解碼器16進(jìn)行卷積解碼,以及該CRC代碼比較和幀屏蔽功能塊15將附加到來自卷積解碼器16的經(jīng)卷積解碼的輸出的CRC檢驗(yàn)代碼與由重要位組檢測(cè)的位組計(jì)算的CRC錯(cuò)誤檢驗(yàn)代碼相比較,以便根據(jù)比較結(jié)果調(diào)節(jié)經(jīng)卷積解碼的輸出。
CRC代碼比較和幀屏蔽功能塊15通過利用附加到利用卷積解碼器16執(zhí)行的卷積解碼步驟的經(jīng)卷積解碼輸出的上述錯(cuò)誤校驗(yàn)代碼,執(zhí)行錯(cuò)誤校驗(yàn)步驟,用以校驗(yàn)傳輸錯(cuò)誤;以及執(zhí)行輸出調(diào)節(jié)步驟,即根據(jù)上述錯(cuò)誤校驗(yàn)步驟的錯(cuò)誤校驗(yàn)結(jié)果,調(diào)節(jié)經(jīng)卷積解碼的輸出。
當(dāng)CRC代碼不一致時(shí),利用幀數(shù)據(jù)的音頻信號(hào)解碼導(dǎo)致音頻信號(hào)的質(zhì)量明顯地劣化。如果重復(fù)地進(jìn)行錯(cuò)誤檢測(cè),在提供到音頻解碼器17以前,進(jìn)行參數(shù)替換,使得將經(jīng)調(diào)節(jié)的輸出提供到其上。通過將不良幀屏蔽可以實(shí)現(xiàn)參數(shù)替換。
圖4表示在不良幀屏蔽過程中的狀態(tài)轉(zhuǎn)換。根據(jù)CRC代碼校驗(yàn)處理的結(jié)果,對(duì)現(xiàn)時(shí)幀的狀態(tài)變量進(jìn)行改變。沿由箭頭指示的方向狀態(tài)。到7由一個(gè)向另一個(gè)轉(zhuǎn)變。發(fā)射傳輸在起點(diǎn)0開始并且如果有錯(cuò)誤沿“1”的方向進(jìn)行;如果無錯(cuò)誤則沿“0”的方向進(jìn)行。
即,狀態(tài)“0”代表沒有CRC錯(cuò)誤。例如如果CRC未連續(xù)地滿足6次則達(dá)到狀態(tài)6。比外,在狀態(tài)“0”,不進(jìn)行處理。即進(jìn)行正常解碼。
例如,當(dāng)在狀態(tài)1到6對(duì)上述LSP參數(shù)解碼時(shí)。使用前一幀的LSP參數(shù)。此外,在狀態(tài)7,如果LSP參數(shù)按正確模式,使用LSP0到LSP5;以及如果LSP參數(shù)按不同模式,僅使用第0LSP代碼系數(shù)LSP0。
此外,例如狀態(tài)變量,“狀態(tài)”數(shù)值,即一消(mute)變量“狀態(tài)”按照表9下方所示的設(shè)定,用以控制輸出聲音。如果該狀態(tài)變量是狀態(tài)=7,mute(p)表示前一幀的消音變量。
表9
此外,例如,如果V/UV參數(shù)是V,在狀態(tài)變量狀態(tài)=1到6,使用頻譜參數(shù)idS0,idS1,頻譜增益參數(shù)idG以及4kbps頻譜參數(shù)idS0_4K到前一幀的idS3_4K。
再者,按照方程(7)所示形成余數(shù)信號(hào)中的頻譜變量Am
,以便控制輸出音量。這里,由該參數(shù)得到的Am[i]構(gòu)成為Am(org)[i]。Am[i]=mute*Am(org)[i](0≤i≤159)...(7)此外,例如如果V/UV確定參數(shù)為UV,在狀態(tài)變量1到6,使用噪聲碼本增益參數(shù)idGL00,idGL01以及前一幀的4kbps噪聲碼本增益參數(shù)idGL10到idGL13。至于噪聲碼本參數(shù)idSL00、idSL01,以及4kbps噪聲碼本參數(shù)idSL10到idSL13,在每一種位數(shù)的范圍內(nèi)產(chǎn)生的隨機(jī)數(shù)都被采用。
再者,余數(shù)信號(hào)res
是按照方程(8)所示構(gòu)成的。這里由該參數(shù)得到的res[i]構(gòu)成為res(org)[i]。res[i]mute*res(org)[i](0≤i≤159)…(8)已經(jīng)利用CRC代碼比較和幀屏蔽功能塊15對(duì)不良幀屏蔽的經(jīng)卷積編碼的輸出提供到音頻解碼器17。
音頻解碼器17的結(jié)構(gòu)如圖5和6中所示。CRC代碼比較和幀屏蔽功能塊15輸出有經(jīng)過連接端202的,與來自圖3中的連接端102的上述LSP(線性頻譜成對(duì)參數(shù))的量化輸出相對(duì)應(yīng)的碼本系數(shù);經(jīng)過連接端203、204和205的,作為與來自圖3中的連接端103、104和105的輸出相對(duì)應(yīng)的包絡(luò)線量化輸出的系數(shù)、音調(diào)和V/UV確定結(jié)果;以及經(jīng)過連接端207的,作為與來自圖3中連接端107的輸出相對(duì)應(yīng)的UV(濁音)數(shù)據(jù)的系數(shù)。進(jìn)而,將作為利用CRC代碼比較和幀屏蔽功能塊15得到的CRC校驗(yàn)結(jié)果得到的CRC誤差信號(hào)提供到濁音部分音頻合成功能塊220。
作為來自連接端203的包絡(luò)線量化輸出的索引傳送到逆矢量量化器212,以便對(duì)其進(jìn)行矢量量化,得到LPC余數(shù)的頻譜包絡(luò)線,再提供到清音部分音頻合成功能塊211。清音部分音頻合成功能塊211利用正弦波合成對(duì)清音部分的LPC(線性預(yù)測(cè)編碼)余數(shù)進(jìn)行合成。還向這一清音部分音頻合成功能塊211提供有由連接端204和205輸出的音調(diào)和V/UV確定結(jié)果。來自清音部分音頻合成功能塊211的清音LPC余數(shù)提供到LPC合成濾波器214。此外,來自連接端207的UV數(shù)據(jù)索引提供到濁音部分音頻合成功能塊220,在其中查詢一噪聲碼本,以便取出作為濁音部分的激勵(lì)矢量的LPC余數(shù)。這一LPC余數(shù)還提供到LPC合成濾波器214。在LPC合成濾波器214中,對(duì)清音部分的LPC余數(shù)和濁音部分的LPC余數(shù)彼此獨(dú)立地進(jìn)行LPC合成處理。另外,還可以將清音部分的LPC余數(shù)附加到濁音部分的LPC余數(shù)上,以便一起進(jìn)行LPC合成處理。這里,來自連接端202的LSP系數(shù)提供到LPC參數(shù)重現(xiàn)功能塊213,在其中取出LPC的α參數(shù)并提供到IPC合成濾波器214。由輸出端201輸出利用LPC合成濾波器通過LPC合成得到的音頻信號(hào)。
接著,圖6表示圖5中的音頻解碼器17的更具體的結(jié)構(gòu)。在這一圖6中,與圖5中相同的組成部分用相同標(biāo)號(hào)標(biāo)注。
在圖6中,向輸入端202提供有所謂的碼本索引,即與來自圖2和圖3中的輸出端102的輸出相對(duì)應(yīng)的LSP矢量量化的輸出。經(jīng)過上述CRC代碼比較和幀屏蔽功能塊15。
這一LSP索引提供到LPC參數(shù)重現(xiàn)功能塊213中的逆矢量量化器231并對(duì)其進(jìn)行逆矢量量化成為L(zhǎng)SP(線性頻譜成對(duì)參數(shù)),其再提供到LSP內(nèi)插電路232、233,在其中進(jìn)行LSP內(nèi)插處理。在此之后,將所得數(shù)據(jù)提供到由LSP向α的變換電路234和235,以便變換成LPC(線性預(yù)測(cè)代碼)的α參數(shù)。這一α參數(shù)提供到LPC合成濾波器214。這里,LSP內(nèi)插電路213和由LSP向α變換電路235用于清音(V)部分,而LSP內(nèi)插電路233和由LSP向α變換電路235用于濁音部分(UV)。此外,LPC合成濾波器214由用于清音部分的LPC合成濾波器236和用于濁音部分的LPC合成濾波器237構(gòu)成。即,對(duì)清音部分和濁音部分彼此獨(dú)立地進(jìn)行LPC系數(shù)內(nèi)插,以便在由清音部分向濁音部分或由濁音部分向清音部分轉(zhuǎn)變的部分處在具有完全不同特性的各LSP之間由于內(nèi)插引起的有害影響。
此外,向圖4中的輸入端203提供有已經(jīng)對(duì)其進(jìn)行加權(quán)矢量量化的頻譜包絡(luò)線(Am)代碼索引數(shù)據(jù),這種量化對(duì)應(yīng)于來自圖2和圖3中所示的編碼器的連接端103的輸出。經(jīng)過上述CRC代碼比較和幀屏蔽功能塊。向圖4中的輸入端204提供有來自圖2和3中的連接端104經(jīng)過CRC代碼比較和幀屏蔽功能塊15的音調(diào)數(shù)據(jù)。向圖4中的輸入端205提供有來自圖2和圖3中的連接端105的經(jīng)過CRC代碼比較和幀屏蔽功能塊15提供的V/UV確定數(shù)據(jù)。
頻譜包絡(luò)線Am的矢量量化的索引數(shù)據(jù)提供到逆矢量量化器212,以便對(duì)其進(jìn)行逆量化,即與上述數(shù)據(jù)計(jì)數(shù)變換相對(duì)應(yīng)的逆變換,并作為頻譜包絡(luò)線數(shù)據(jù)提供到清音音頻合成功能塊211中的正弦波合成電路215。
應(yīng)當(dāng)指出,在編碼過程中在頻譜的矢量量化之前確定幀內(nèi)差值的情況下,這里接著逆矢量量化的是幀內(nèi)差值的解碼,以便得到關(guān)于頻譜包絡(luò)線的數(shù)據(jù)。
由輸入端204向正弦波合成濾波器215提供音調(diào),由輸入端205向其提供V/UV確定數(shù)據(jù)。正弦波合成電路215響應(yīng)于圖2和3的LPC逆濾波器111的輸出,輸出LPS余數(shù)數(shù)據(jù),該數(shù)據(jù)再提供到加法器218。這種正弦波合成的特定方法例如公開在由本發(fā)明的發(fā)明人申請(qǐng)的4-91422號(hào)的日本專利申請(qǐng)的說明書和附圖中,或者在6-198451號(hào)的日本專利申請(qǐng)的說明書和附圖中。
此外,來自逆矢量量化器212的包絡(luò)線數(shù)據(jù)、來自輸入端204的音調(diào)數(shù)據(jù)和來自輸入端205的V/UV確定數(shù)據(jù)提供到噪聲合成電路216,用于對(duì)清音部分(V)附加噪聲。這一噪聲合成電路216輸出的數(shù)據(jù)經(jīng)過一加權(quán)疊加的加法器電路217提供到加法器218。這種方式基于如下的事實(shí)。當(dāng)利用正弦波分析形成清音音頻的激勵(lì)時(shí)作為輸入提供到LPC合成濾波器,由于代音調(diào)聲音例如人的聲音引起鼻堵塞的感覺或者如果由清音向濁音變化時(shí)聲音的質(zhì)量急劇地變化會(huì)引起不自然的聲音的感覺。為此,將LPC余數(shù)信號(hào)中的清音部分疊加噪聲,根據(jù)音頻編碼數(shù)據(jù)例如音調(diào)、頻譜包絡(luò)線幅值,在一幀內(nèi)的最大幅值、余數(shù)信號(hào)電平等的各種參數(shù)都予以考慮。
來自加法器218的輸出提供到LPC合成慮波器214中的清音部分音頻合成濾波器236,用以通過LPC合成處理成為時(shí)間波形數(shù)據(jù),再提供到清音部分音頻后置濾波器238,以便在提供到加法器239之間對(duì)其進(jìn)行濾波處理。
接著,向圖6中的輸入端207s和207g提供UV數(shù)據(jù),即分別來自圖3中的輸出端107s和107g的形狀索引和增益索引,以及該數(shù)據(jù)提供到濁音部分音頻合成功能塊220。來自連接端207s的形狀索引提供到濁音部分合成功能塊220中的噪聲碼本221,來自連接端207g的增益索引提供到增益電路222。由噪聲碼本221讀出的有代表性的數(shù)值輸出是一與濁音部分的LPC余數(shù)相對(duì)應(yīng)的噪聲信號(hào)部分;其用作在增益電路222中的預(yù)定增益數(shù)值并提供到窗口電路223,以便對(duì)其進(jìn)行窗口處理,用以平滑與清音部分的連接部分。
來自窗口電路223的輸出作為來自濁音部分音頻合成功能塊220的輸出提供到LPC合成濾波器214中的濁音部分音頻合成濾波器237。在合成濾波器237中,進(jìn)行LPC合成處理,以便得到濁音部分的時(shí)間波形數(shù)據(jù),在其提供到加法器239之前,在濁音部分音頻后置濾波器238u中對(duì)其進(jìn)行濾波處理。
在加法器239中,將來自清音部分音頻后置濾波器238v的清音部分的時(shí)間波形信號(hào)疊加到來自濁音部分音頻后置濾波器238u的濁音部分的時(shí)間波形數(shù)據(jù)上,用以由輸出端201輸出。
利用D/A變換器18將來自輸出端201的音頻解碼輸出變換為模擬音頻信號(hào),作為聲音由揚(yáng)聲器19輸出。
圖7和圖8是表示利用上述移動(dòng)電話裝置執(zhí)行的音調(diào)編碼方法和音頻解碼步驟。
即,利用移動(dòng)電話裝置中的編碼裝置實(shí)施音頻編碼方法包含步驟S1,用于對(duì)輸入音頻信號(hào)編碼;步驟S2,用于由根據(jù)步驟S1的多個(gè)音頻編碼參數(shù)中選擇按聽覺為重要的位組以及根據(jù)這一位組計(jì)算CRC檢驗(yàn)代碼;以及步驟S3,用于對(duì)在步驟S2中得到的CRC檢驗(yàn)代碼和該重要位組進(jìn)行卷積編碼。
此外,利用移動(dòng)電話裝置中的解碼裝置實(shí)行音頻解碼方法包含步驟S11,用于對(duì)來自另一移動(dòng)電話裝置的經(jīng)卷積編碼的輸出實(shí)行卷積解碼;步驟S12,用于利用疊加到根據(jù)步驟S11的經(jīng)卷積解碼的輸出的CRC檢驗(yàn)代碼實(shí)行CRC錯(cuò)誤校驗(yàn);步驟S13,用于確定CRC代碼是否有錯(cuò)誤,如果在步驟S13檢測(cè)到有錯(cuò)誤,控制進(jìn)行步驟S14,用于實(shí)行不良幀屏蔽處理,以及步驟S15,用于實(shí)行音頻解碼。
因此,在采用本發(fā)明的編碼方法和裝置的移動(dòng)電話裝置中,按照該在發(fā)射側(cè)傳輸通路編碼器4和編碼器3,可以輸出能抑制產(chǎn)生傳輸通路信息錯(cuò)誤的編碼數(shù)據(jù)。
此外,在采用根據(jù)本發(fā)明的解碼方法和裝置的移動(dòng)電話裝置中,按照該傳輸通路解碼器和音頻解碼器,可以對(duì)音頻信號(hào)解碼,其中抑制了由于傳輸通路信息錯(cuò)誤引起的質(zhì)量下降。
根據(jù)本發(fā)明的編碼方法和裝置可以輸出能抑制產(chǎn)生傳輸通路信息錯(cuò)誤的編碼數(shù)據(jù)。
此外,根據(jù)本發(fā)明的解碼方法和裝置可以對(duì)音頻信號(hào)解碼,其中抑制了由于傳輸通路信息錯(cuò)誤引起的質(zhì)量下降。
權(quán)利要求
1.一種編碼方法,包含音頻編碼步驟,用于沿時(shí)間軸將輸入的音頻信號(hào)分成預(yù)定的編碼單位,并對(duì)每個(gè)所述編碼單位進(jìn)行編碼以便輸出多種類型的音頻編碼的參數(shù);錯(cuò)誤檢測(cè)代碼建立步驟,用于由根據(jù)所述音頻編碼步驟產(chǎn)生的所述多種類型的音頻編碼的參數(shù)選擇對(duì)聽覺為重要的一些位,以及根據(jù)所述重要的位組建立錯(cuò)誤檢驗(yàn)代碼;以及卷積編碼步驟,用于對(duì)根據(jù)所述錯(cuò)誤校驗(yàn)代碼建立步驟產(chǎn)生的所述錯(cuò)誤校驗(yàn)代碼和所述重要的位組進(jìn)行卷積編碼。
2.如權(quán)利要求1所述的編碼方法,其中所述音頻編碼步驟包含短期預(yù)測(cè)余數(shù)計(jì)算步驟,用于得到所述輸入音頻信號(hào)的短期預(yù)測(cè)余數(shù);正弦波分析編碼步驟,用于對(duì)得到的所述短期預(yù)測(cè)余數(shù)實(shí)行正弦波分析編碼;以及波形編碼步驟,用于利用波形編碼對(duì)所述輸入的音頻信號(hào)進(jìn)行編碼。
3.如權(quán)利要求2所述的編碼方法,其中所述錯(cuò)誤校驗(yàn)代碼產(chǎn)生步驟選擇如下部分作為所述重要的位當(dāng)在所述短期預(yù)測(cè)余數(shù)計(jì)算步驟中得到所述短期預(yù)測(cè)余數(shù)時(shí)建立的參數(shù)中的某些或者全部;所述正弦波分析編碼步驟的編碼輸出中的某些或者全部;根據(jù)所述波形編碼步驟的編碼輸出中的某些或者全部;以及根據(jù)所述重要的位建立錯(cuò)誤校驗(yàn)代碼。
4.如權(quán)利要求2所述的編碼方法,其中所述錯(cuò)誤校驗(yàn)代碼建立步驟選擇如下部分作為所述重要的位當(dāng)利用所述短期預(yù)測(cè)余數(shù)計(jì)算步驟得到所述短期預(yù)測(cè)余數(shù)時(shí)建立的線性頻譜成對(duì)參數(shù)中的某些或者全部;全部清音/濁音確定參數(shù);某些或全部音調(diào)參數(shù);作為根據(jù)所述正弦波分析編碼步驟的編碼輸出的短期預(yù)測(cè)余數(shù)信號(hào)的頻譜包絡(luò)線增益參數(shù)中的某些或者全部;作為所述短期預(yù)測(cè)余數(shù)的經(jīng)波形編碼的輸出的噪聲碼本增益參數(shù)中的某些或者全部;以及根據(jù)所述重要的位建立錯(cuò)誤校驗(yàn)代碼。
5.如權(quán)利要求3所述的方法,利用所述短期余數(shù)計(jì)算步驟以便得到短期預(yù)測(cè)余數(shù)而建立的所述各參數(shù)是構(gòu)成所述輸入的音頻信號(hào)的頻譜的輪廊的線性頻譜成對(duì)參數(shù);所述正弦波分析編碼步驟的所述編碼輸出包含表明所述輸入音頻信號(hào)是清音部分還是濁音部分音頻的清音/濁音確定參數(shù),以及如果所述輸入音頻信號(hào)為清音部分時(shí)的音調(diào)參數(shù),以及表示所述短期預(yù)測(cè)編碼的余數(shù)信號(hào)的頻譜包絡(luò)線的頻譜碼本索引和增益索引;以及當(dāng)所述輸入音頻信號(hào)為濁音部分時(shí)所述波形編碼步驟的所述編碼輸出是基于短期余數(shù)的噪聲碼本索引和增益索引。
6.如權(quán)利要求1所述的編碼方法,其中所述音頻編碼步驟對(duì)于所述輸入音頻信號(hào)實(shí)行按2/4千位/秒的音頻編碼。
7.一種編碼裝置,包含音頻編碼裝置,用于沿時(shí)間軸將輸入音頻信號(hào)分成預(yù)定的編碼單位以及對(duì)每個(gè)編碼單位進(jìn)行編碼以便輸出多種類型的音頻編碼的參數(shù);錯(cuò)誤校驗(yàn)代碼建立裝置,用于根據(jù)來自所述音頻編碼裝置的所述多種類型的音頻編碼參數(shù)選擇對(duì)于聽覺為重要的位,以及根據(jù)所述重要的位建立錯(cuò)誤校驗(yàn)代碼,以及卷積編碼裝置,用于對(duì)來自所述錯(cuò)誤校驗(yàn)代碼建立裝置的所述錯(cuò)誤校驗(yàn)代碼和所述重要位實(shí)行卷積編碼。
8.一種解碼方法,用于對(duì)由輸入的音頻信號(hào)得到的編碼數(shù)據(jù)進(jìn)行解碼,該已編碼的輸入音頻信號(hào)已沿時(shí)間被分成預(yù)定的單位,以便得到多種類型的音頻編碼的參數(shù),根據(jù)這些參數(shù)采用對(duì)于聽覺為重要的位以便建立錯(cuò)誤校驗(yàn)代碼;其中對(duì)所述錯(cuò)誤校驗(yàn)代碼和所述重要位已進(jìn)行卷積編碼以得到編碼輸出,這些編碼輸出已和非重要位相結(jié)合用以發(fā)射傳輸,所述解碼方法包含卷積解碼步驟,用于對(duì)所述經(jīng)卷積編碼的輸出進(jìn)行卷積解碼,以便由附加有所述錯(cuò)誤校驗(yàn)代碼的所述重要位和所述非重要位得到解碼的輸出;錯(cuò)誤校驗(yàn)步驟,用于利用根據(jù)所述卷積步驟得到的附加到所述卷積解碼的輸出上的所述校驗(yàn)代碼校驗(yàn)傳輸錯(cuò)誤;輸出調(diào)節(jié)步驟,用于根據(jù)在所述錯(cuò)誤校驗(yàn)步驟中的所述錯(cuò)誤校驗(yàn)結(jié)果調(diào)節(jié)所述經(jīng)卷積解碼的輸出;以及音頻解碼步驟,用于對(duì)根據(jù)所述輸出調(diào)節(jié)步驟得到的所述經(jīng)卷積解碼的輸出實(shí)行音頻解碼處理。
9.如權(quán)利要求8中所述的方法,其中所述校驗(yàn)步驟選擇如下部分作為所述重要的位當(dāng)利用所述短期預(yù)測(cè)余數(shù)計(jì)算步驟得到所述短期預(yù)測(cè)余數(shù)時(shí)建立的線性頻譜成對(duì)參數(shù)中的某些或者全部;所有清音/濁音確定參數(shù);某些或全部音調(diào)數(shù)據(jù);作為根據(jù)所述正弦波分析編碼步驟的編碼輸出的短期預(yù)測(cè)余數(shù)的頻譜包絡(luò)線增益參數(shù)中的某些或全部;以及作為所述短期預(yù)測(cè)余數(shù)的波形編碼輸出的噪聲碼本增益參數(shù)中的某些或者全部,并且利用根據(jù)所述卷積編碼的輸出得到的所述重要位和所述錯(cuò)誤校驗(yàn)代碼建立的錯(cuò)誤校驗(yàn)代碼,以便檢測(cè)傳輸錯(cuò)誤。
10.如權(quán)利要求8所述的方法,如果在所述錯(cuò)誤校驗(yàn)步驟中檢測(cè)到錯(cuò)誤,所述輸出調(diào)節(jié)步驟輸出通過內(nèi)插處理得到的內(nèi)插數(shù)據(jù)取代所述經(jīng)卷積解碼的輸出。
11.如權(quán)利要求8所述的解碼方法,其中所述輸出調(diào)節(jié)步驟根據(jù)所述錯(cuò)誤校驗(yàn)的結(jié)果對(duì)所述經(jīng)卷積解碼的輸出實(shí)行不良幀屏蔽處理。
12.如權(quán)利要求8所述的解碼方法,其中所述編碼數(shù)據(jù)是通過按照2/4 4位/秒對(duì)所述輸入音頻信號(hào)實(shí)行音頻編碼得到的。
13.一種解碼裝置,用于對(duì)由已沿時(shí)間軸分成預(yù)定單位的已編碼的輸入音頻信號(hào)得到的編碼數(shù)據(jù)進(jìn)行解碼,以便得到多種類型的音頻編碼參數(shù),根據(jù)該參數(shù)已利用重要的位建立錯(cuò)誤校驗(yàn)代碼,其中所述錯(cuò)誤校驗(yàn)代碼和所述重要的位已卷積得到編碼輸出,該輸出已與非重要位結(jié)合用以傳輸,所述解碼裝置包含卷積解碼裝置,用于對(duì)所述經(jīng)卷積編碼的輸出實(shí)行卷積解碼,以便由附加有所述錯(cuò)誤校驗(yàn)代碼的所述重要位和所述非重要位得到解碼的輸出;錯(cuò)誤校驗(yàn)和輸出調(diào)節(jié)裝置,用于利用附加到來自所述卷積解碼裝置的所述卷積解碼的輸出上的所述錯(cuò)誤校驗(yàn)代碼校驗(yàn)傳輸錯(cuò)誤以及根據(jù)所述錯(cuò)誤校驗(yàn)的結(jié)果調(diào)節(jié)所述經(jīng)卷積解碼的輸出;以及音頻解碼裝置,用于對(duì)來自所述錯(cuò)誤校驗(yàn)和輸出調(diào)節(jié)裝置的所述經(jīng)卷積解碼的輸出實(shí)行音頻解碼。
全文摘要
音頻編碼器3將輸入音頻信號(hào)分成預(yù)定的編碼單位并對(duì)每一編碼單位實(shí)行編碼以便輸出多種類型的音頻編碼參數(shù)。CRC代碼計(jì)算功能塊5由來自音頻編碼器3的多種類型的音頻編碼參數(shù)選擇對(duì)聽覺為重要的位。卷積編碼器6對(duì)來自CRC代碼計(jì)算功能塊的CRC校驗(yàn)代碼和重要位實(shí)行卷積編碼。
文檔編號(hào)H04L1/00GK1221169SQ98113100
公開日1999年6月30日 申請(qǐng)日期1998年10月17日 優(yōu)先權(quán)日1997年10月17日
發(fā)明者前田祐児 申請(qǐng)人:索尼公司