在比特率分級(jí)和帶寬分級(jí)的音頻解碼中的比特率切換方法

文檔序號(hào)：2836908閱讀：420來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：在比特率分級(jí)和帶寬分級(jí)的音頻解碼中的比特率切換方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種在解碼由多速率音頻編碼系統(tǒng)編碼的音頻信號(hào)的時(shí)候轉(zhuǎn) 換比特率的方法，更具體地涉及一種比特率分級(jí)和，適合的話，帶寬分級(jí)的音頻編碼系統(tǒng)。它也涉及用于比特率分級(jí)和帶寬分級(jí)的音頻解碼系統(tǒng)的所述方法的應(yīng)用，以及比特率分級(jí)和帶寬分級(jí)的音頻解碼器。
背景技術(shù)：
本發(fā)明在IP類(lèi)承載語(yǔ)音的分組網(wǎng)絡(luò)上傳送語(yǔ)音和/或音頻信號(hào)的領(lǐng)域有著特別有利的應(yīng)用，以便提供基于該傳送信道的容量能夠被修改的質(zhì)量。本發(fā)明的方法實(shí)現(xiàn)在比特率分級(jí)和帶寬分級(jí)的音頻編碼器/解碼器(編解碼器)的各種比特率之間無(wú)人為干擾的轉(zhuǎn)換，更具體地用于在具有比特率獨(dú) 立的后處理的電話頻帶寬核心和一個(gè)或多個(gè)寬帶增強(qiáng)層的比特率分級(jí)和帶寬分級(jí)的音頻編碼的環(huán)境中介于電話頻帶寬和寬帶之間的轉(zhuǎn)換。在一般方式中，術(shù)語(yǔ)"電話頻帶寬"和"窄帶"指示頻帶由300赫茲(I-Iz) 到3400 Hz而術(shù)語(yǔ)"寬帶"預(yù)定為從50 Hz到7000 Hz的頻帶。如今有#種用于將音頻(語(yǔ)音和/或音頻)信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的技術(shù)以及以此方式處理數(shù)字化的信號(hào)。最廣泛使用的技術(shù)是諸如PCM或ADPCM編碼一樣的"波形編碼"方法，諸如CELP(碼本激勵(lì)線性預(yù)測(cè))編碼一樣的"通過(guò)分析與合成的參數(shù)編碼"，以及"在子帶或通過(guò)變換的感知編碼"方法。窄帶CELP編碼一般采用后處理來(lái)增強(qiáng)質(zhì)量。該后處理典型地包括自適應(yīng)后濾波和高通濾波。在例如 "Speech Coding and Synthesis",編者W,B. Kleijn和K.K. Paliwal， Elsevier, 1995中描述用于編碼音頻信號(hào)的標(biāo)準(zhǔn)技術(shù)。僅用于音頻信號(hào)的雙向傳送的技術(shù)與此相關(guān)。在傳統(tǒng)的語(yǔ)音編碼中，編碼器產(chǎn)生固定比特率的比特流。該固定的比特率約束了該編碼器和解碼器的簡(jiǎn)化實(shí)現(xiàn)和使用。如此系統(tǒng)的例子有64千比特每秒(kbps )的G.711編碼和8 kbps的G.729編碼。在一些應(yīng)用中，諸如移動(dòng)電話、IP承載的話音、或ad/70C網(wǎng)絡(luò)承載的通信，優(yōu)選地產(chǎn)生不同比特率的比特流，該比特率值從預(yù)定義組中選取。存在各種多速率編碼技術(shù)* 由源和/或信道控制的多模編碼，如在AMR-NB 、 AMR-WB 、 SMV、或VMR-WB系統(tǒng)中4吏用的。等級(jí)編碼，也稱(chēng)為"分級(jí)'，編碼，其產(chǎn)生被稱(chēng)為分等級(jí)的比特流，因?yàn)樗ê诵谋忍芈屎鸵粋€(gè)或多個(gè)增強(qiáng)層。48kbps、 56kbps、和64 kbps 的G.722系統(tǒng)是比特率分級(jí)編碼的簡(jiǎn)單例子。MPEG-4CELP編解碼器是比特率分級(jí)和帶寬分級(jí)的(見(jiàn)T. Numura et al., A bitrate and bandwidth scalable CELP coder, ICASSP 1998 )。多描述編碼(見(jiàn)A. Gersho， J.D. Gibson, V. Cupe腿n, H. Dong, A multiple description speech coder based on AMR-WB for mobile ad hoc networks, ICASSP 2004)。在多速率編碼中，由必要確保從一種編碼比特率到另一種的轉(zhuǎn)換不產(chǎn)生誤差或人為干擾。如果在所有比特率處的編碼是基于通過(guò)在相同帶寬中的語(yǔ)音信號(hào)的相同編碼模型的表示則比特率切換很簡(jiǎn)單。例如，在AMR-NB系統(tǒng)中，除了由與 ACELP模型兼容的LPC (線性預(yù)測(cè)編碼)類(lèi)模型處理的舒適噪音(comfort noise )的產(chǎn)生，在電話頻帶(300 Hz-3400 Hz )中定義信號(hào)并且編碼依靠ACELP (代數(shù)碼本激勵(lì)線性預(yù)測(cè))模型。注意AMR-NB編碼使用傳統(tǒng)方式的以自適應(yīng)后濾波和高通濾波形式的后處理，該自適應(yīng)后濾波系數(shù)取決于該解碼比特率。然而，沒(méi)有采用預(yù)防措施來(lái)管理與根據(jù)比特率改變的后處理參數(shù)的使用關(guān)聯(lián)的任何問(wèn)題。相反，AMR-WB類(lèi)型的寬帶CELP編碼沒(méi)使用后處理，主要是復(fù)雜之故。比特率轉(zhuǎn)換在比特率分級(jí)和帶寬分級(jí)的音頻編碼中甚至更成問(wèn)題。編碼于是基于根據(jù)比特率而不同的模型和帶寬。例如在Y. Hiwasaki, T. Mori, H. Ohmuro, J. Ikedo, D. Tokumoto禾口 A. Kataoka， Scalable Speech Coding Technology for High-Quality Ubiqutous Communications, NTT Technical Review, March 2004的文章中說(shuō)明了等級(jí)音頻編碼的基本概念。在此類(lèi)編碼中，比特流包括基本層和一個(gè)或多個(gè)增強(qiáng)層。基本層通過(guò)叫做"核心編解碼器"的固定低比特率編解碼器產(chǎn)生，保證最小編碼質(zhì)量。該層必須被解碼器接收以維持可接受的質(zhì)量級(jí)別。該增強(qiáng)層用來(lái) 增強(qiáng)質(zhì)量。雖然它們?nèi)坑删幋a器送出，但是它們可能并不全被解碼器接收。等級(jí)編碼的主要好處是其允許僅僅通過(guò)截取比特流的比特率的調(diào)節(jié)。層的數(shù) 目，即，比特流可能截取的數(shù)目，定義編碼的顆粒度。如果該比特流包括數(shù) 層，達(dá)到兩到四層，則編碼被稱(chēng)為具有強(qiáng)顆粒度，精細(xì)顆粒度編碼允許達(dá)lkbps的增量。在此對(duì)等級(jí)編碼技術(shù)有極大興趣的是具有電話頻帶CELP類(lèi)型核心編碼器和一個(gè)或多個(gè)寬帶增強(qiáng)層的比特率分級(jí)和帶寬分級(jí)。在H.Tadd6ietal.，A Scalable Three Bitrate (8, 14.2 and 24 kbps) Audio Coder; 107lh Convention AES, 1999中給出具有強(qiáng)顆粒度8、 14.2和24kbps，和在B. Kovesi， D. Massaloux， A. Sollaud, A scalable speech and audio coding scheme with continuous bitrate flexibility, ICASSP 2004中給出具有在32 kbps處精細(xì)顆粒度6.4，或MPEG-4 CELP編碼的此種系統(tǒng)的例子。在國(guó)際申請(qǐng)WO 01/48931和WO 02/060075涉及與在比特率分級(jí)和帶寬分級(jí)音頻編碼的環(huán)境中的比特率切換的問(wèn)題關(guān)聯(lián)。然而，在以上兩個(gè)文件中描述的技術(shù)僅應(yīng)對(duì)在使用電話頻帶寬和寬帶編碼的通信網(wǎng)絡(luò)之間互通的問(wèn)題。特別是，國(guó)際申請(qǐng)WO 02/060075描述一種用于從寬帶到電話頻帶轉(zhuǎn)換的優(yōu)化的抽選系統(tǒng)。在國(guó)際申請(qǐng)WO 01/48931中提出的方法是從電話頻帶信號(hào)中產(chǎn)生偽隨機(jī) 寬帶信號(hào)，尤其通過(guò)提取"頻語(yǔ)包絡(luò)"的頻帶擴(kuò)展技術(shù)?，F(xiàn)有技術(shù)中的公知類(lèi)似技術(shù)主要解決與寬帶向電話頻帶轉(zhuǎn)換關(guān)聯(lián)的問(wèn)題，其中通過(guò)使用不傳送用于從接收的電話頻帶信號(hào)中產(chǎn)生寬帶信號(hào)的信息的頻帶擴(kuò)展技術(shù)尋求避免頻帶減少。注意到這些方法并不真地尋求控制在各帶寬之間的傳送，且它們也具有依賴(lài)質(zhì)量高度改變的頻帶擴(kuò)展技術(shù)的缺點(diǎn)，以及它們因此無(wú)法確保穩(wěn) 定的輸出質(zhì)量。發(fā)明內(nèi)容因此，本發(fā)明的主題要解決的技術(shù)問(wèn)題是要提出一種在解碼由多速率音頻編碼系統(tǒng)編碼的音頻信號(hào)時(shí)的切換比特率的方法，所述解碼包括至少一個(gè) 依靠比特率的后處理步驟，該方法允許將在不同比特率之間被處理的轉(zhuǎn)換，對(duì)于該比特率，使用的后處理依靠該解碼的比特率，從而如果當(dāng)解碼時(shí)發(fā)生比特率的快速改變時(shí)消除特別敏感的人為干擾。后處理對(duì)信號(hào)引入相移并且兩種不同形式的后處理的使用意味著在轉(zhuǎn)換期間的相位連續(xù)性的問(wèn)題根據(jù)本發(fā)明，對(duì)于所述的技術(shù)問(wèn)題的解決方案是，在從初始比特率到最終比特率的轉(zhuǎn)換期間，所述方法包括從在初始比特率的信號(hào)向在最終比特率的信號(hào)的連續(xù)改變的轉(zhuǎn)換步驟，所述信號(hào)之一或兩者均被后處理。因此本發(fā)明具有這樣的優(yōu)點(diǎn)，解碼包括依靠比特率的后處理，以及在所述轉(zhuǎn)換步驟期間實(shí)現(xiàn)從在初始比特率的后處理向在最終比特率的后處理的連續(xù)改變。本發(fā)明的該特征在下面詳細(xì)介紹，并且對(duì)應(yīng)于在施加到在初始比特率解碼的音頻信號(hào)的后處理中實(shí)現(xiàn)"交叉衰落"。能夠看到這在電話頻帶(在其中后處理經(jīng)解碼的信號(hào))和寬度(在其中一般沒(méi)有后處理該音頻信號(hào))之間的比特率轉(zhuǎn)換上特別有利。在一個(gè)具體實(shí)施例中，通過(guò)減低處于初始比特率信號(hào)的權(quán)重和增加處于最終比特率信號(hào)的權(quán)重的加權(quán)來(lái)實(shí)現(xiàn)所述連續(xù)改變。本發(fā)明也適用處于初始比特率的信號(hào)和處于最終比特率的信號(hào)均被后處理的情況。本發(fā)明也提供一種計(jì)算機(jī)程序，其包括當(dāng)所述程序由計(jì)算機(jī)執(zhí)行時(shí)用于執(zhí)行本發(fā)明的方法的代碼指令。本發(fā)明還對(duì)比特率分級(jí)的音頻解碼系統(tǒng)提供本發(fā)明方法的應(yīng)用。本發(fā)明還對(duì)比特率分級(jí)和帶寬分級(jí)的音頻解碼系統(tǒng)提供本發(fā)明方法的應(yīng) 用，在該系統(tǒng)中通過(guò)第一頻帶的第一解碼層獲得初始比特率以及通過(guò)第二解碼層(指將所述第一頻帶擴(kuò)展成第二頻帶的層)獲得最終比特率，該后處理步驟被施加到以初始比特率執(zhí)行的解碼。本發(fā)明還對(duì)比特率分級(jí)和帶寬分級(jí)的音頻解碼系統(tǒng)提供本發(fā)明方法的應(yīng) 用，在該系統(tǒng)中通過(guò)第一頻帶的第一解碼層獲得最終比特率以及通過(guò)第二解碼層(指將所述第一頻帶擴(kuò)展成第二頻帶的層)獲得初始比特率，該后處理步驟被施加到以最終比特率執(zhí)行的解碼。"擴(kuò)展頻帶"的具體例子是以上定義的"寬帶"，所述第一頻帶則是電話頻帶。本發(fā)明還提供多速率音頻解碼器，在其中突出的是所述解碼器包括依靠比特率的后處理階段，當(dāng)從初始比特率向最終比特率轉(zhuǎn)換時(shí)適配所述后處理階段以通過(guò)從處于初始比特率的信號(hào)向最終比特率處的信號(hào)的連續(xù)改變實(shí)現(xiàn) 轉(zhuǎn)換，其中所述信號(hào)中至少一個(gè)被后處理。尤其，適配所述后處理階段以通過(guò)減低處于初始比特率信號(hào)的權(quán)重和增加處于最終比特率信號(hào)的權(quán)重的加權(quán)來(lái)實(shí)現(xiàn)所述連續(xù)改變。

作為非限制性示例并參考附圖提供的以下說(shuō)明清楚地解釋本發(fā)明的構(gòu)成以及如何實(shí)現(xiàn)本發(fā)明。圖1是4層比特率分級(jí)和帶寬分級(jí)的編碼器的圖；圖2是與圖1的編碼器關(guān)聯(lián)的本發(fā)明的解碼器的圖；圖3展示與圖1的編碼器關(guān)聯(lián)的比特流的結(jié)構(gòu)；圖4是在本發(fā)明的解碼器的電話頻帶中后處理信號(hào)和非后處理信號(hào)之間的轉(zhuǎn)換方法的流程圖；圖5是依照本發(fā)明的用于在電話頻帶和具有頻帶擴(kuò)展的寬帶之間轉(zhuǎn)換的方法的流程圖；圖6是依照本發(fā)明的用于在電話頻帶和具有預(yù)測(cè)變換解碼層的寬帶之間轉(zhuǎn)換的轉(zhuǎn)換方法的流程圖；圖7是通過(guò)本發(fā)明的方法用于為各比特率之間和各頻帶之間的轉(zhuǎn)換管理接收的寬帶幀的計(jì)數(shù)的過(guò)程的流程圖；圖8是概括圖7的流程圖的操作的表；圖9是設(shè)置用于從電話頻帶向?qū)拵袚Q的自適應(yīng)衰減系數(shù)的表。
具體實(shí)施方式
以下在比特率分級(jí)和帶寬分級(jí)的音頻編碼器的環(huán)境中描述本發(fā)明。在此考慮的比特率分級(jí)和帶寬分級(jí)的編碼結(jié)構(gòu)使用電話頻帶CELP類(lèi)型編碼器作為核心編碼，其一個(gè)具體的例子使用如ITU-T建議G.729, Coding of speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP), March 1996和R. Salami et al.， Description of ITU-T Recommendation G.729 Annex A: Reduced complexity 8 kbit/s CS-ACELP codec, ICASSP 1997描述的G.729A編碼器。三個(gè)增強(qiáng)階段;波加入到CELP核心編碼中，即電話頻帶CELP編碼增強(qiáng)、碼。在此考慮的比特率轉(zhuǎn)換是在電話頻帶和寬帶之間的轉(zhuǎn)換。圖1是使用的編碼器的圖。具有以16 kHz采樣的50Hz-7000Hz的音頻頻帶的音頻信號(hào)被分成320 個(gè)樣本的20毫秒(ms)幀。具有截止頻率50Hz的高通濾波101被施加到輸入信號(hào)。獲得的信號(hào)SWB被用于編碼器的多個(gè)分支。首先，在第一分支，將低通濾波和從16 kHz到8 kHz的按系數(shù)2的向下采樣，102,施加到信號(hào)SWB。該操作產(chǎn)生以8kHz采樣的電話頻帶信號(hào)。由使用CELP類(lèi)型編碼的核心編碼器103處理該信號(hào)。這里該編碼對(duì)應(yīng)于G729A 編碼器，其產(chǎn)生具有比特率8 kbps的比特流核心。然后第一增強(qiáng)層引入CELP編碼的第二階段103。尤其對(duì)非語(yǔ)音的聲音，存在于革新者字典中的實(shí)現(xiàn)CELP激勵(lì)的增加和提供質(zhì)量增強(qiáng)。該第二編碼階段的比特率是4 kbps并且該關(guān)聯(lián)的參數(shù)是脈沖的位置和符號(hào)以及對(duì)于40 個(gè)樣本(5ms以8kHz)的每個(gè)子幀關(guān)聯(lián)的革新者字典的增益。進(jìn)行該核心編碼器和第一增強(qiáng)層的解碼以獲得在電話頻帶中合成的12 kbps信號(hào)104。從8 kHz到16 kHz按系數(shù)2的過(guò)采樣和低通濾波105從編碼器的頭兩個(gè)階段中產(chǎn)生以16kHz采樣的版本(version)。第三增強(qiáng)層實(shí)現(xiàn)對(duì)寬帶的帶寬擴(kuò)展106。能夠通過(guò)預(yù)加重濾波器預(yù)處理輸入信號(hào)SWB。該預(yù)加重濾波器從寬帶線性預(yù)測(cè)濾波器中產(chǎn)生高頻的更好表示。為了補(bǔ)償預(yù)加重濾波器的影響，于是在合成中使用反向去加重濾波器。此編碼和解碼結(jié)構(gòu)的替代沒(méi)有使用預(yù)加重或去加重濾波器。下一步計(jì)算和量化該寬代線性預(yù)測(cè)濾波器。該線性預(yù)測(cè)濾波器是第18階濾波器，但是能夠選擇比如第16階預(yù)測(cè)的較低預(yù)測(cè)階。能夠通過(guò)使用 Levinson-Durbin算法的自相關(guān)方法計(jì)算該線性預(yù)測(cè)濾波器。使用來(lái)自電話頻帶核心編碼器的濾波器iWB (z)的系數(shù)的預(yù)測(cè)量化此寬帶線性預(yù)測(cè)濾波器AWB(z)。然后能夠使用例如多級(jí)矢量量化和使用電話頻帶核心編碼器的去量化LSF (線頻語(yǔ)頻率)參數(shù)來(lái)量化該系數(shù)，如在H. Ehara, T. Morii， M. Oshikiri,和K. Yoshida, Predictive VQ for bandwidth scalable LSP quantization, ICASSP 2005文章中記載的。從核心編碼器的電話頻帶激勵(lì)參數(shù)音調(diào)周期延遲、關(guān)聯(lián)增益和核心編碼器的代數(shù)激勵(lì)以及CELP激勵(lì)的第一增加層和關(guān)聯(lián)的增益中獲得寬帶激勵(lì)。使用電話頻帶階段的激勵(lì)參數(shù)的過(guò)采樣版本產(chǎn)生此激勵(lì)。然后由先前已經(jīng)計(jì)算的合成濾波器過(guò)濾該寬帶激勵(lì)。如果已經(jīng)對(duì)輸入信號(hào)施加預(yù)加重，則對(duì)合成濾波器的輸出信號(hào)施加去加重濾波器。獲得的信號(hào)是寬帶信號(hào)，其能量沒(méi)有被調(diào)整。為了計(jì)算用于校平該高頻帶(3 4 0 0 H z - 7 0 0 0 H z )的能量的增益，向該寬帶合成信號(hào)施加高通濾波器。與此并行的，相同的高通濾波器被施加到誤差信號(hào)，其對(duì)應(yīng)于在延遲的原始信號(hào)和先前兩個(gè)階段的合成信號(hào)之間的差別。然后這兩個(gè)信號(hào)被用來(lái)計(jì)算將被施加到該合成寬帶信號(hào)的增益。依靠在這兩個(gè)信號(hào)之間的能量比率計(jì)算增益。然后將該量化的增益g稀施加到80個(gè)樣本的子幀層級(jí)的信號(hào)S14 WB ( 5ms到 16kHz),并且以此方式獲得的信號(hào)然后被添加到來(lái)自先前階段的合成的信號(hào) 以便創(chuàng)建對(duì)應(yīng)于14 kbps比特率的寬帶信號(hào)。編碼的剩余部分在頻域使用預(yù)測(cè)變換編碼方案實(shí)現(xiàn)。延遲的輸入信號(hào)108 和14kbps合成信號(hào)107經(jīng)過(guò)AwB(z/y) * (1-pz)的感知等待濾波器109、 111 濾波，一般y = 0.92且ti = 0.68。然后通過(guò)TDAC (時(shí)域聲音混淆消除)交迭變換編碼方案(Y. Mahieux and J.P. Petit, Transform coding of audio signals at 64 kbit/s， IEEE GLOBECOM 1990 )編碼這些信號(hào)。施加》f正的離散余弦變換(MDCT )110到具有50% (每隔20 ms刷新 MDCT分析)的交迭的加權(quán)的輸入信號(hào)的640個(gè)樣本的塊，以及施加112到來(lái)自先前的頻帶擴(kuò)展階段的14kbps (相同塊長(zhǎng)度和相同的交迭)處的加權(quán)的合成信號(hào)。將被編碼的MDCT頻譜，113，對(duì)應(yīng)于在14 kbps處關(guān)于0到3400 Hz的在加權(quán)的輸入信號(hào)和合成信號(hào)之間的差異，以及對(duì)應(yīng)于從3400Hz到 7000 Hz的加權(quán)的輸入信號(hào)。通過(guò)將最后40個(gè)系數(shù)(僅編碼頭280個(gè)系數(shù)) 設(shè)置為零來(lái)限制該頻語(yǔ)為7000 Hz。將頻語(yǔ)劃分為18個(gè)頻帶一個(gè)含八個(gè)系數(shù)的頻帶和17個(gè)含16個(gè)系數(shù)的頻帶。對(duì)于該頻語(yǔ)的每個(gè)頻帶，MDCT系數(shù) 的能量被計(jì)算(縮放因子)。該18個(gè)縮放因子構(gòu)成其后被量化、編碼和按幀傳送的該加權(quán)信號(hào)的頻語(yǔ)包絡(luò)。圖3示出該比特流的格式。動(dòng)態(tài)比特分配基于來(lái)自頻譜包絡(luò)的去量化版本的頻譜的頻帶能量。這實(shí) 現(xiàn)了在編碼器和解碼器的二進(jìn)制分配之間的兼容性。然后通過(guò)使用在大小和維度上字典交織的矢量量化量化在每個(gè)頻帶的歸一化(精細(xì)結(jié)構(gòu))MDCT系數(shù)，正如C, Lamblin et al., "Quantification vectorielle en dimension et resolution variables" ["Vector quantization with variable dimension and resolution"], patentPCT FR 04 00219, 2004記載的，該字典包括置換代碼的聯(lián)合。最后，將關(guān)于核心編碼器、電話頻帶CELP增強(qiáng)階段、寬帶CELP階段和最后該頻鐠包絡(luò) 的信息和歸一化的編碼系數(shù)復(fù)用并且以幀來(lái)傳送。圖2是與圖1的編碼器關(guān)聯(lián)的解碼器的框圖。模塊2701解復(fù)用包含在比特流中的參數(shù)。作為接收的比特的數(shù)目的函數(shù) 對(duì)幀解碼存在多種情況，且參考圖2描述了四種情況1 . 對(duì)于8 kbps的接收比特率，第一關(guān)注由解碼器接收最小數(shù)目的比特。在此情況下，僅解碼第一階段。因此僅涉及CELP (G.729A+)類(lèi)型核心解碼器202的比特流被接收和解碼。能夠由G.729解碼器通過(guò)自適應(yīng)后濾波 203和高通濾波后處理204處理該合成。在該實(shí)施例中，術(shù)語(yǔ)"后處理"指的是這兩種操作的組合。然而，顯然該術(shù)語(yǔ)"后處理"也能夠僅指自適應(yīng)后濾波或僅指高通濾波型的后處理。該信號(hào)被過(guò)采樣，206，和濾波，207,以產(chǎn)生以16 kHz的采樣信號(hào)。2. 對(duì)于12 kbps的接收比特率，第二情況關(guān)注僅涉及第一和第二解碼階段的比特?cái)?shù)目的接收。在此情況下，解碼核心解碼器和第一CELP激勵(lì) 增強(qiáng)階段。能夠由G,729解碼器通過(guò)后處理203、 204處理該合成。如同前面，該信號(hào)被過(guò)采樣206和濾波207以產(chǎn)生以16 kHz的采樣信號(hào)。3. 對(duì)于14 kbps的接收比特率，第三情況對(duì)應(yīng)于涉及頭三個(gè)解碼階段的比特?cái)?shù)目的接收。在此情況下，除了沒(méi)有向CELP解碼輸出施加后處理的事實(shí)之外，如同情況2,首先實(shí)現(xiàn)頭兩個(gè)解碼階段，在這之后頻帶擴(kuò)展模塊在解碼在寬帶209以及與激勵(lì)關(guān)聯(lián)的增益213中成對(duì)頻譜線(WB-LSF )的參數(shù)后產(chǎn)生以16kHz的采樣信號(hào)。從核心編碼器和第一CELP增強(qiáng)階段208 中產(chǎn)生寬帶激勵(lì)。然后由合成濾波器210和適合的話(如果在編碼器中使用了預(yù)加重濾波器)由去加重濾波器211濾波該激勵(lì)。高通濾波器212被施加到獲得的信號(hào)，且依靠關(guān)聯(lián)的增益214每隔5ms適配該頻帶擴(kuò)展信號(hào)的能量。該信號(hào)然后被加入從頭兩個(gè)解碼階段215中獲得的以16kHz采樣的電話頻帶信號(hào)。在反向MDCT 220和加權(quán)的合成濾波器221之前通過(guò)將最后40個(gè)MDCT 系數(shù)設(shè)為0來(lái)在變換域過(guò)濾該信號(hào)，目的是獲取限制在7000 Hz的信號(hào)。4. 對(duì)于比16kbps大或相等的接收比特率，最后的情況對(duì)應(yīng)于解碼解碼器的全部階段。最后階段由預(yù)測(cè)變換解碼器構(gòu)成。首先執(zhí)行上述的步驟3. 然后，作為額外接收比特?cái)?shù)目的函數(shù)，預(yù)測(cè)變換解碼方案被適配來(lái)*如果比特?cái)?shù)目對(duì)應(yīng)于僅僅部分頻i普包絡(luò)，或?qū)?yīng)于其整個(gè)但是不具有接收的精細(xì)結(jié)構(gòu)(fine structure ),則對(duì)應(yīng)于由頻帶擴(kuò)展階l殳215產(chǎn)生的信號(hào)，部分或完整的頻語(yǔ)包絡(luò)被用來(lái)調(diào)整MDCT系數(shù)的頻帶的能量，216和217，在范圍3400 Hz到7000 Hz中，218。此系統(tǒng)作為接收比特?cái)?shù)目的函數(shù)實(shí)現(xiàn)音頻質(zhì)量的逐步改進(jìn)。*如果比特?cái)?shù)目對(duì)應(yīng)于整個(gè)頻語(yǔ)包絡(luò)并且對(duì)應(yīng)于部分或整個(gè)精細(xì)結(jié)構(gòu)，則以與在編碼器中相同的方式實(shí)現(xiàn)比特分配。在接收精細(xì)結(jié)構(gòu)的頻帶中，從頻語(yǔ)包絡(luò)和去量化的精細(xì)結(jié)構(gòu)中計(jì)算解碼的MDCT系數(shù)。在沒(méi)有接收精細(xì)結(jié) 構(gòu)的范圍3400Hz到7000Hz的頻帶中，使用前面段落的程序，即，基于接收的頻謙包絡(luò)在能量上調(diào)整根據(jù)通過(guò)頻帶擴(kuò)展獲得的信號(hào)計(jì)算的MDCT系 H 216和217, 218。因此由以下構(gòu)成用于合成的MDCT頻-譜由在頭兩個(gè) 解碼階段被加入到在0到3400 Hz之間的頻帶解碼的誤差信號(hào)中的合成信號(hào)；以及還有，對(duì)于范圍3400 Hz到7000 Hz的頻帶，由已經(jīng)接收精細(xì)結(jié)構(gòu)的頻帶中解碼的MDCT系數(shù)和對(duì)其它頻譜頻帶在能量上調(diào)整的頻帶擴(kuò)展階段的 MDCT系數(shù)。然后反向MDCT被施加到解碼的MDCT系數(shù)，220,以及由加權(quán)的合成濾波器濾波，221,產(chǎn)生輸出信號(hào)。以下在圖2的解碼器的環(huán)境中描述依照本發(fā)明的轉(zhuǎn)換方法。塊205表示"交叉衰落"模塊。如果由解碼器接收的比特?cái)?shù)目不足夠解碼除了第一階段或第一和第二階段，即，對(duì)于8kbps或12kbps的接收比特率，則解碼器的最終輸出的有效帶寬是電話頻帶。在此情形下，為了增強(qiáng)合成信號(hào)的質(zhì)量，在過(guò)采樣之前，廣義上是G,729A解碼器的一部分的后處理 203、 204被施加到電話頻帶。相反，如果也實(shí)現(xiàn)在寬帶階段的解碼，對(duì)于接收比特率大于或等于14 kbps，則該后處理沒(méi)有起作用，因?yàn)樵诰幋a器中，已經(jīng)從電話頻帶的沒(méi)有后處理的版本中計(jì)算較高階段的編碼。后處理203和204向信號(hào)引入相移。當(dāng)在有和沒(méi)有后處理的模式之間轉(zhuǎn) 換時(shí)，由此必須提供軟轉(zhuǎn)換。圖4示出塊205的實(shí)現(xiàn)，其通過(guò)施加交叉衰落在后處理和非后處理的電話頻帶信號(hào)之間提供此緩慢的轉(zhuǎn)換。步驟401檢查當(dāng)前幀是否是電話頻帶幀，即，驗(yàn)證當(dāng)前幀的比特率是否是8 kbps或12 kbps。在否定答復(fù)的情況下，觸發(fā)步驟402以驗(yàn)證先前幀是否在電話頻帶中被后處理(這等于驗(yàn)證先前幀的比特率是否是8 kbps-12 kbps )。在否定答復(fù)的情況下，在步驟403中，非后處理信號(hào)S,被復(fù)制到信號(hào)S3。相反，當(dāng)對(duì)檢測(cè)402為肯定答復(fù)時(shí)，在步驟404中，信號(hào)S3將包含交叉衰落的結(jié)果，其中非后處理分量S,的權(quán)重增加而后濾波分量S2的權(quán)重減少。步驟404之后跟著以值0來(lái)更新標(biāo)志prevPF的步驟405。當(dāng)在步驟401中存在肯定答復(fù)時(shí)，在步驟406中對(duì)于在電話頻帶中的后處理是否在先前幀中起作用執(zhí)行驗(yàn)證。在肯定答復(fù)時(shí)，在步驟408中，后處理信號(hào)S2被復(fù)制到信號(hào)S3。相反，在步驟406為否定答復(fù)時(shí)，在步驟407中，信號(hào)S3被計(jì)算為交叉衰落的結(jié)果，這次非后處理分量S,的權(quán)重減少而后處理分量S2的權(quán)重增加。在步驟407之后，觸發(fā)步驟409以便利用值1來(lái)更新標(biāo) 志prevPF。在本實(shí)施例的變體中，如果由解碼器接收的比特?cái)?shù)目?jī)H允許解碼第一階段或第一和第二階段，即，對(duì)于8或12kbps的接收比特率，則解碼器的最終輸出的有效帶寬是電話頻帶(信號(hào)S,)。在此情形下，為了增強(qiáng)合成信號(hào)的質(zhì) 量，在過(guò)采樣之前，在電話頻帶的后處理被施加。相反，如果也實(shí)現(xiàn)寬帶階段的解碼，對(duì)于接收比特率大于或等于14kbps，則在編碼器中不同的后處理發(fā)生作用(信號(hào)S2)，已經(jīng)從具有電話頻帶的后處理的版本中計(jì)算較高階段的編碼。用于8或12 kbps的比特率的后處理和用于比特率大于或等于14 kbps的后處理向信號(hào)引入不同的相移。當(dāng)在不同版本的后處理的模式之間轉(zhuǎn)換時(shí)，由此必須提供軟轉(zhuǎn)換。通過(guò)施加交叉衰落(其產(chǎn)生信號(hào)S3)實(shí)現(xiàn)在具有各種形式的后處理的電話頻帶信號(hào)之間的緩慢轉(zhuǎn)換。驗(yàn)證當(dāng)前幀是否是電話頻帶幀。在否定答復(fù)的情況下，驗(yàn)證先前幀是否是電話頻帶幀。在否定答復(fù)的情況下，后處理信號(hào)Sl被復(fù)制到信號(hào)S3。相反，在肯定答復(fù)的情況下，信號(hào)S3將包含交叉衰落的結(jié)果，其中后處理分量 Sl的權(quán)重增加而后處理分量S2的權(quán)重減少。當(dāng)存在肯定答復(fù)時(shí)，驗(yàn)證先前幀是否是電話頻帶幀。在肯定答復(fù)時(shí)，后處理信號(hào)S2被復(fù)制到信號(hào)S3。相反，在否定答復(fù)時(shí)，信號(hào)S3被計(jì)算為交叉衰落的結(jié)果，這次后處理分量Sl的權(quán)重減少而后處理分量S2的權(quán)重增加。塊209計(jì)算頻帶擴(kuò)展和預(yù)測(cè)變換解碼階段必須的寬帶線性預(yù)測(cè)濾波器。如果在接收寬帶幀后，一幀的比特流僅僅電話頻帶部分被接收則該計(jì)算是必須的，以及需要頻帶擴(kuò)展以便維持頻帶效果。然后從電話頻帶核心解碼器的LSF中外推出一組LSF。例如，8個(gè)LSF能夠被一致地分布在介于來(lái)自電話頻帶的最后的LSF和Nyquist頻率之間的頻帶上。然后線性預(yù)測(cè)濾波器能夠趨向用于高頻的平坦振幅響應(yīng)濾波器。塊213依照本發(fā)明提供用于頻帶擴(kuò)展的增益適配。參考圖5和7描述對(duì) 應(yīng)于所述塊的流程圖。參考圖5描述向高頻帶施加自適應(yīng)增益衰減的原理。首先，依照兩種可能性計(jì)算第一寬帶解碼層的增益，501。如果已經(jīng)接收對(duì)應(yīng)于頻帶擴(kuò)展層的比特流，則通過(guò)解碼獲得該增益，503。相反，如果在比特流中沒(méi)有接收到此增益，則外推與該解碼層關(guān)聯(lián)的增益，502。例如，能夠通過(guò)利用先前進(jìn)行的電話頻帶的真實(shí)解碼來(lái)校正寬帶解碼階段的基帶的能量進(jìn)行增益計(jì)算。然后根據(jù)參考圖7描述的原理更新先前接收的寬帶幀數(shù)目的計(jì)數(shù)器，504。最后，該計(jì)數(shù)器被用來(lái)設(shè)置施加到第一寬帶解碼階段的增益的衰減系數(shù)，505。圖7表示用于管理接收的寬帶幀數(shù)目的計(jì)數(shù)的過(guò)程的流程圖。按以下方式更新計(jì)數(shù)器。如果當(dāng)前幀是寬帶幀，則如果已經(jīng)接收與第一寬帶解碼階段關(guān)聯(lián)的增益(圖5，塊501 )并且先前幀也是寬帶幀，則該計(jì)數(shù)器增加1并且在值MAX—COUNT—RCV處飽和。該值對(duì)應(yīng)于在介于電話頻帶比特率和寬帶比特率之間切換期間幀(在其間該寬帶解碼信號(hào)將被衰減)的數(shù)目。相反，如果接收的當(dāng)前幀是電話頻帶幀，則存在幾種可能的行為。如果先前幀也是電話頻帶幀，則計(jì)數(shù)器置0。如果不是，如果先前幀是寬帶幀且計(jì)數(shù)器具有小于MAX—COUNT一RCV的值，則計(jì)數(shù)器也置0。在所有其它情況下，計(jì)數(shù)器保持前一值。該流程圖的功能總結(jié)在圖8的表中。當(dāng)MAX—COUNT—RCV采用值100 時(shí)，在圖9的表中示出由衰減系數(shù)采用的值，該表作為示例提供。注意對(duì)應(yīng) 于相位擴(kuò)展在電話頻帶的解碼，衰減系數(shù)保持為0直到幀65。通過(guò)逐漸地增加該衰減系數(shù)從幀66實(shí)現(xiàn)適當(dāng)?shù)霓D(zhuǎn)換狀態(tài)。自適應(yīng)衰減。該圖是預(yù)測(cè)變換解碼層的自適應(yīng)衰減程序的流程圖。首先，驗(yàn)證該層的頻語(yǔ)包絡(luò)是否已經(jīng)完整接收，601。如果是的話，則使用接收的寬帶幀計(jì)數(shù)器和圖9的衰減表將0-3500 Hz低頻帶校正MDCT校正系數(shù)衰減，602。然后，在兩種情況下，監(jiān)視接收的寬帶幀的數(shù)目。如果該數(shù)目小于 MAX—COUNT—RCV，則對(duì)應(yīng)于具有信息傳送的頻帶擴(kuò)展的第一寬帶解碼階段的MDCT系數(shù)被用于預(yù)測(cè)變換解碼階段。相反，如果計(jì)數(shù)器具有最大值，則執(zhí)行用于利用解碼的頻譜包絡(luò)校平預(yù)測(cè)變換解碼頻帶的能量的程序。
權(quán)利要求
1.一種在解碼由多速率音頻編碼系統(tǒng)編碼的音頻信號(hào)時(shí)的比特率切換方法，所述解碼包括依靠所述比特率的至少一個(gè)后處理步驟，其特征在于，當(dāng)從初始比特率向最終比特率切換時(shí)，所述方法包括從處于初始比特率的信號(hào)向處于最終比特率的信號(hào)連續(xù)改變的轉(zhuǎn)換步驟，所述信號(hào)之一或兩者被后處理。
2. 如權(quán)利要求l所述的方法，其特征在于所述后處理是高通濾波。
3. 如權(quán)利要求l所述的方法，其特征在于所述后處理是自適應(yīng)后濾波。
4. 如權(quán)利要求l所述的方法，其特征在于所述后處理是高通濾波和自適應(yīng)后濾波的組合。
5. 如權(quán)利要求1到4中的任何一項(xiàng)所述的方法，其特征在于通過(guò)降低處于初始比特率的信號(hào)的權(quán)重和增加處于最終比特率的信號(hào)的權(quán)重的加權(quán)來(lái)實(shí) 現(xiàn)所述連續(xù)轉(zhuǎn)變。
6. 如權(quán)利要求1到5中的任何一項(xiàng)所述的方法，其特征在于處于初始比特率的信號(hào)和處于最終比特率的信號(hào)被后處理。
7. —種計(jì)算機(jī)程序，包括用于當(dāng)由計(jì)算機(jī)執(zhí)行所述程序時(shí)執(zhí)行根據(jù)權(quán)利要求1到6中的任何一項(xiàng)的方法的代碼指令。
8. —種對(duì)于比特率分級(jí)音頻解碼系統(tǒng)的根據(jù)權(quán)利要求1到6中的任何一項(xiàng)的方法的應(yīng)用。
9. 一種對(duì)于比特率分級(jí)和帶寬分級(jí)音頻解碼系統(tǒng)的根據(jù)權(quán)利要求1到6 中的任何一項(xiàng)的方法的應(yīng)用，其中由在第一頻帶中的第一解碼層獲得初始比特率并且通過(guò)作為將所述第一頻帶擴(kuò)展成第二頻帶的層的第二解碼層獲得最終比特率，該后處理步驟被應(yīng)用到以初始比特率執(zhí)行的解碼。
10. —種對(duì)于比特率分級(jí)和帶寬分級(jí)音頻解碼系統(tǒng)的根據(jù)權(quán)利要求1到 6中的任何一項(xiàng)的方法的應(yīng)用，其中在第一頻帶中的第一解碼層獲得最終比特率并且通過(guò)作為將所述第一頻帶擴(kuò)展成第二頻帶的層的第二解碼層獲得初始比特率，該后處理步驟被應(yīng)用到以最終比特率執(zhí)行的解碼。
11. 一種多速率音頻解碼器，其特征在于，所述解碼器包括依靠所述比特率的后處理階段，當(dāng)從初始比特率向最終比特率切換時(shí)適配所述后處理階段以通過(guò)從處于初始比特率的信號(hào)向處于最終比特率的信號(hào)的連續(xù)改變實(shí)現(xiàn)轉(zhuǎn)換，其中所述信號(hào)之一或兩者被后處理。
12. 如權(quán)利要求11所述的解碼器，其特征在于所述后處理是高通濾波。
13. 如權(quán)利要求11所述的解碼器，其特征在于所述后處理是自適應(yīng)后濾波。
14. 如權(quán)利要求11所述的解碼器，其特征在于所述后處理是高通濾波和自適應(yīng)后濾波的組合。
15. 如權(quán)利要求11到14中的任何一項(xiàng)所述的解碼器，其特征在于所述后處理階段被適配為通過(guò)降低處于初始比特率的信號(hào)的權(quán)重和增加處于最終比特率的信號(hào)的權(quán)重的加權(quán)來(lái)實(shí)現(xiàn)所述連續(xù)改變。
16. 如權(quán)利要求11到15中的任何一項(xiàng)所述的解碼器，其特征在于處于初始比特率的信號(hào)和處于最終比特率的信號(hào)被后處理。
全文摘要
一種在解碼由音頻編碼系統(tǒng)編碼的音頻信號(hào)時(shí)轉(zhuǎn)換比特率的方法，所述解碼包括依靠比特率的后處理步驟。根據(jù)本發(fā)明，在從初始比特率向最終比特率轉(zhuǎn)換時(shí)，所述方法包括從初始比特率的信號(hào)向最終比特率的信號(hào)連續(xù)改變的轉(zhuǎn)換步驟，所述信號(hào)之一或兩者被后處理。應(yīng)用于數(shù)據(jù)分組網(wǎng)絡(luò)的VoIP語(yǔ)音和/或音頻信號(hào)的傳送。
文檔編號(hào)G10L19/24GK101263554SQ200680033807
公開(kāi)日2008年9月10日申請(qǐng)日期2006年7月10日優(yōu)先權(quán)日2005年7月22日
發(fā)明者戴維·維雷特, 斯蒂法尼·拉戈特, 貝拉茨·科維塞申請(qǐng)人:法國(guó)電信公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：斯蒂法尼.拉戈特;戴維.維雷特;貝拉茨.科維塞
技術(shù)所有人：法國(guó)電信公司
我是此專(zhuān)利的發(fā)明人

上一篇：使用相位修改給音頻信號(hào)隱蔽地加水印的制作方法
上一篇：生成3d聲音的方法和設(shè)備的制作方法

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻比特率相關(guān)技術(shù)

音頻采樣率和比特率相關(guān)技術(shù)

愛(ài)剪輯音頻比特率相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在比特率分級(jí)和帶寬分級(jí)的音頻解碼中的比特率切換方法