專(zhuān)利名稱(chēng):在比特率分級(jí)和帶寬分級(jí)的音頻解碼中的比特率切換方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在解碼由多速率音頻編碼系統(tǒng)編碼的音頻信號(hào)的時(shí)候轉(zhuǎn) 換比特率的方法,更具體地涉及一種比特率分級(jí)和,適合的話,帶寬分級(jí)的 音頻編碼系統(tǒng)。它也涉及用于比特率分級(jí)和帶寬分級(jí)的音頻解碼系統(tǒng)的所述 方法的應(yīng)用,以及比特率分級(jí)和帶寬分級(jí)的音頻解碼器。
背景技術(shù):
本發(fā)明在IP類(lèi)承載語(yǔ)音的分組網(wǎng)絡(luò)上傳送語(yǔ)音和/或音頻信號(hào)的領(lǐng)域有 著特別有利的應(yīng)用,以便提供基于該傳送信道的容量能夠被修改的質(zhì)量。本發(fā)明的方法實(shí)現(xiàn)在比特率分級(jí)和帶寬分級(jí)的音頻編碼器/解碼器(編解 碼器)的各種比特率之間無(wú)人為干擾的轉(zhuǎn)換,更具體地用于在具有比特率獨(dú) 立的后處理的電話頻帶寬核心和一個(gè)或多個(gè)寬帶增強(qiáng)層的比特率分級(jí)和帶寬 分級(jí)的音頻編碼的環(huán)境中介于電話頻帶寬和寬帶之間的轉(zhuǎn)換。在一般方式中,術(shù)語(yǔ)"電話頻帶寬"和"窄帶"指示頻帶由300赫茲(I-Iz) 到3400 Hz而術(shù)語(yǔ)"寬帶"預(yù)定為從50 Hz到7000 Hz的頻帶。如今有#種用于將音頻(語(yǔ)音和/或音頻)信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的技術(shù)以 及以此方式處理數(shù)字化的信號(hào)。最廣泛使用的技術(shù)是諸如PCM或ADPCM編碼一樣的"波形編碼"方 法,諸如CELP(碼本激勵(lì)線性預(yù)測(cè))編碼一樣的"通過(guò)分析與合成的參數(shù)編 碼",以及"在子帶或通過(guò)變換的感知編碼"方法。窄帶CELP編碼一般采用 后處理來(lái)增強(qiáng)質(zhì)量。該后處理典型地包括自適應(yīng)后濾波和高通濾波。在例如 "Speech Coding and Synthesis",編者W,B. Kleijn和K.K. Paliwal, Elsevier, 1995中描述用于編碼音頻信號(hào)的標(biāo)準(zhǔn)技術(shù)。僅用于音頻信號(hào)的雙向傳送的技 術(shù)與此相關(guān)。在傳統(tǒng)的語(yǔ)音編碼中,編碼器產(chǎn)生固定比特率的比特流。該固定的比特 率約束了該編碼器和解碼器的簡(jiǎn)化實(shí)現(xiàn)和使用。如此系統(tǒng)的例子有64千比特 每秒(kbps )的G.711編碼和8 kbps的G.729編碼。在一些應(yīng)用中,諸如移動(dòng)電話、IP承載的話音、或ad/70C網(wǎng)絡(luò)承載的通 信,優(yōu)選地產(chǎn)生不同比特率的比特流,該比特率值從預(yù)定義組中選取。存在各種多速率編碼技術(shù)* 由源和/或信道控制的多模編碼,如在AMR-NB 、 AMR-WB 、 SMV、 或VMR-WB系統(tǒng)中4吏用的。 等級(jí)編碼,也稱(chēng)為"分級(jí)',編碼,其產(chǎn)生被稱(chēng)為分等級(jí)的比特流, 因?yàn)樗ê诵谋忍芈屎鸵粋€(gè)或多個(gè)增強(qiáng)層。48kbps、 56kbps、和64 kbps 的G.722系統(tǒng)是比特率分級(jí)編碼的簡(jiǎn)單例子。MPEG-4CELP編解碼器是比特 率分級(jí)和帶寬分級(jí)的(見(jiàn)T. Numura et al., A bitrate and bandwidth scalable CELP coder, ICASSP 1998 )。 多描述編碼(見(jiàn)A. Gersho, J.D. Gibson, V. Cupe腿n, H. Dong, A multiple description speech coder based on AMR-WB for mobile ad hoc networks, ICASSP 2004)。在多速率編碼中,由必要確保從一種編碼比特率到另 一種的轉(zhuǎn)換不產(chǎn)生 誤差或人為干擾。如果在所有比特率處的編碼是基于通過(guò)在相同帶寬中的語(yǔ)音信號(hào)的相同 編碼模型的表示則比特率切換很簡(jiǎn)單。例如,在AMR-NB系統(tǒng)中,除了由與 ACELP模型兼容的LPC (線性預(yù)測(cè)編碼)類(lèi)模型處理的舒適噪音(comfort noise )的產(chǎn)生,在電話頻帶(300 Hz-3400 Hz )中定義信號(hào)并且編碼依靠ACELP (代數(shù)碼本激勵(lì)線性預(yù)測(cè))模型。注意AMR-NB編碼使用傳統(tǒng)方式的以自適 應(yīng)后濾波和高通濾波形式的后處理,該自適應(yīng)后濾波系數(shù)取決于該解碼比特 率。然而,沒(méi)有采用預(yù)防措施來(lái)管理與根據(jù)比特率改變的后處理參數(shù)的使用 關(guān)聯(lián)的任何問(wèn)題。相反,AMR-WB類(lèi)型的寬帶CELP編碼沒(méi)使用后處理,主 要是復(fù)雜之故。比特率轉(zhuǎn)換在比特率分級(jí)和帶寬分級(jí)的音頻編碼中甚至更成問(wèn)題。編碼于是基于根據(jù)比特率而不同的模型和帶寬。例如在Y. Hiwasaki, T. Mori, H. Ohmuro, J. Ikedo, D. Tokumoto禾口 A. Kataoka, Scalable Speech Coding Technology for High-Quality Ubiqutous Communications, NTT Technical Review, March 2004的文章中說(shuō)明了等級(jí)音 頻編碼的基本概念。在此類(lèi)編碼中,比特流包括基本層和一個(gè)或多個(gè)增強(qiáng)層。 基本層通過(guò)叫做"核心編解碼器"的固定低比特率編解碼器產(chǎn)生,保證最小編碼質(zhì)量。該層必須被解碼器接收以維持可接受的質(zhì)量級(jí)別。該增強(qiáng)層用來(lái) 增強(qiáng)質(zhì)量。雖然它們?nèi)坑删幋a器送出,但是它們可能并不全被解碼器接收。 等級(jí)編碼的主要好處是其允許僅僅通過(guò)截取比特流的比特率的調(diào)節(jié)。層的數(shù) 目,即,比特流可能截取的數(shù)目,定義編碼的顆粒度。如果該比特流包括數(shù) 層,達(dá)到兩到四層,則編碼被稱(chēng)為具有強(qiáng)顆粒度,精細(xì)顆粒度編碼允許達(dá)lkbps的增量。在此對(duì)等級(jí)編碼技術(shù)有極大興趣的是具有電話頻帶CELP類(lèi)型核心編碼 器和一個(gè)或多個(gè)寬帶增強(qiáng)層的比特率分級(jí)和帶寬分級(jí)。在H.Tadd6ietal.,A Scalable Three Bitrate (8, 14.2 and 24 kbps) Audio Coder; 107lh Convention AES, 1999中給出具有強(qiáng)顆粒度8、 14.2和24kbps,和在B. Kovesi, D. Massaloux, A. Sollaud, A scalable speech and audio coding scheme with continuous bitrate flexibility, ICASSP 2004中給出具有在32 kbps處精細(xì)顆粒度6.4,或MPEG-4 CELP編碼的此種系統(tǒng)的例子。在國(guó)際申請(qǐng)WO 01/48931和WO 02/060075涉及與在比特率分級(jí)和帶寬 分級(jí)音頻編碼的環(huán)境中的比特率切換的問(wèn)題關(guān)聯(lián)。然而,在以上兩個(gè)文件中描述的技術(shù)僅應(yīng)對(duì)在使用電話頻帶寬和寬帶編 碼的通信網(wǎng)絡(luò)之間互通的問(wèn)題。特別是,國(guó)際申請(qǐng)WO 02/060075描述一種用于從寬帶到電話頻帶轉(zhuǎn)換的 優(yōu)化的抽選系統(tǒng)。在國(guó)際申請(qǐng)WO 01/48931中提出的方法是從電話頻帶信號(hào)中產(chǎn)生偽隨機(jī) 寬帶信號(hào),尤其通過(guò)提取"頻語(yǔ)包絡(luò)"的頻帶擴(kuò)展技術(shù)?,F(xiàn)有技術(shù)中的公知 類(lèi)似技術(shù)主要解決與寬帶向電話頻帶轉(zhuǎn)換關(guān)聯(lián)的問(wèn)題,其中通過(guò)使用不傳送 用于從接收的電話頻帶信號(hào)中產(chǎn)生寬帶信號(hào)的信息的頻帶擴(kuò)展技術(shù)尋求避免 頻帶減少。注意到這些方法并不真地尋求控制在各帶寬之間的傳送,且它們 也具有依賴(lài)質(zhì)量高度改變的頻帶擴(kuò)展技術(shù)的缺點(diǎn),以及它們因此無(wú)法確保穩(wěn) 定的輸出質(zhì)量。發(fā)明內(nèi)容因此,本發(fā)明的主題要解決的技術(shù)問(wèn)題是要提出一種在解碼由多速率音 頻編碼系統(tǒng)編碼的音頻信號(hào)時(shí)的切換比特率的方法,所述解碼包括至少一個(gè) 依靠比特率的后處理步驟,該方法允許將在不同比特率之間被處理的轉(zhuǎn)換,對(duì)于該比特率,使用的后處理依靠該解碼的比特率,從而如果當(dāng)解碼時(shí)發(fā)生 比特率的快速改變時(shí)消除特別敏感的人為干擾。后處理對(duì)信號(hào)引入相移并且 兩種不同形式的后處理的使用意味著在轉(zhuǎn)換期間的相位連續(xù)性的問(wèn)題根據(jù)本發(fā)明,對(duì)于所述的技術(shù)問(wèn)題的解決方案是,在從初始比特率到最 終比特率的轉(zhuǎn)換期間,所述方法包括從在初始比特率的信號(hào)向在最終比特率的信號(hào)的連續(xù)改變的轉(zhuǎn)換步驟,所述信號(hào)之一或兩者均被后處理。因此本發(fā)明具有這樣的優(yōu)點(diǎn),解碼包括依靠比特率的后處理,以及在所 述轉(zhuǎn)換步驟期間實(shí)現(xiàn)從在初始比特率的后處理向在最終比特率的后處理的連續(xù)改變。本發(fā)明的該特征在下面詳細(xì)介紹,并且對(duì)應(yīng)于在施加到在初始比特 率解碼的音頻信號(hào)的后處理中實(shí)現(xiàn)"交叉衰落"。能夠看到這在電話頻帶(在 其中后處理經(jīng)解碼的信號(hào))和寬度(在其中一般沒(méi)有后處理該音頻信號(hào))之 間的比特率轉(zhuǎn)換上特別有利。在一個(gè)具體實(shí)施例中,通過(guò)減低處于初始比特率信號(hào)的權(quán)重和增加處于 最終比特率信號(hào)的權(quán)重的加權(quán)來(lái)實(shí)現(xiàn)所述連續(xù)改變。本發(fā)明也適用處于初始比特率的信號(hào)和處于最終比特率的信號(hào)均被后處 理的情況。本發(fā)明也提供一種計(jì)算機(jī)程序,其包括當(dāng)所述程序由計(jì)算機(jī)執(zhí)行時(shí)用于 執(zhí)行本發(fā)明的方法的代碼指令。本發(fā)明還對(duì)比特率分級(jí)的音頻解碼系統(tǒng)提供本發(fā)明方法的應(yīng)用。本發(fā)明還對(duì)比特率分級(jí)和帶寬分級(jí)的音頻解碼系統(tǒng)提供本發(fā)明方法的應(yīng) 用,在該系統(tǒng)中通過(guò)第 一頻帶的第 一解碼層獲得初始比特率以及通過(guò)第二解 碼層(指將所述第一頻帶擴(kuò)展成第二頻帶的層)獲得最終比特率,該后處理 步驟被施加到以初始比特率執(zhí)行的解碼。本發(fā)明還對(duì)比特率分級(jí)和帶寬分級(jí)的音頻解碼系統(tǒng)提供本發(fā)明方法的應(yīng) 用,在該系統(tǒng)中通過(guò)第 一頻帶的第 一解碼層獲得最終比特率以及通過(guò)第二解 碼層(指將所述第一頻帶擴(kuò)展成第二頻帶的層)獲得初始比特率,該后處理 步驟被施加到以最終比特率執(zhí)行的解碼。"擴(kuò)展頻帶"的具體例子是以上定義的"寬帶",所述第一頻帶則是電話頻帶。本發(fā)明還提供多速率音頻解碼器,在其中突出的是所述解碼器包括依靠 比特率的后處理階段,當(dāng)從初始比特率向最終比特率轉(zhuǎn)換時(shí)適配所述后處理階段以通過(guò)從處于初始比特率的信號(hào)向最終比特率處的信號(hào)的連續(xù)改變實(shí)現(xiàn) 轉(zhuǎn)換,其中所述信號(hào)中至少一個(gè)被后處理。尤其,適配所述后處理階段以通過(guò)減低處于初始比特率信號(hào)的權(quán)重和增 加處于最終比特率信號(hào)的權(quán)重的加權(quán)來(lái)實(shí)現(xiàn)所述連續(xù)改變。
作為非限制性示例并參考附圖提供的以下說(shuō)明清楚地解釋本發(fā)明的構(gòu)成 以及如何實(shí)現(xiàn)本發(fā)明。圖1是4層比特率分級(jí)和帶寬分級(jí)的編碼器的圖; 圖2是與圖1的編碼器關(guān)聯(lián)的本發(fā)明的解碼器的圖; 圖3展示與圖1的編碼器關(guān)聯(lián)的比特流的結(jié)構(gòu);圖4是在本發(fā)明的解碼器的電話頻帶中后處理信號(hào)和非后處理信號(hào)之間 的轉(zhuǎn)換方法的流程圖;圖5是依照本發(fā)明的用于在電話頻帶和具有頻帶擴(kuò)展的寬帶之間轉(zhuǎn)換的 方法的流程圖;圖6是依照本發(fā)明的用于在電話頻帶和具有預(yù)測(cè)變換解碼層的寬帶之間 轉(zhuǎn)換的轉(zhuǎn)換方法的流程圖;圖7是通過(guò)本發(fā)明的方法用于為各比特率之間和各頻帶之間的轉(zhuǎn)換管理 接收的寬帶幀的計(jì)數(shù)的過(guò)程的流程圖;圖8是概括圖7的流程圖的操作的表;圖9是設(shè)置用于從電話頻帶向?qū)拵袚Q的自適應(yīng)衰減系數(shù)的表。
具體實(shí)施方式
以下在比特率分級(jí)和帶寬分級(jí)的音頻編碼器的環(huán)境中描述本發(fā)明。在此 考慮的比特率分級(jí)和帶寬分級(jí)的編碼結(jié)構(gòu)使用電話頻帶CELP類(lèi)型編碼器作 為核心編碼,其一個(gè)具體的例子使用如ITU-T建議G.729, Coding of speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP), March 1996和R. Salami et al., Description of ITU-T Recommendation G.729 Annex A: Reduced complexity 8 kbit/s CS-ACELP codec, ICASSP 1997描述的G.729A編碼器。三個(gè)增強(qiáng)階段;波加入到CELP核心編碼中,即電話頻帶CELP編碼增強(qiáng)、碼。在此考慮的比特率轉(zhuǎn)換是在電話頻帶和寬帶之間的轉(zhuǎn)換。 圖1是使用的編碼器的圖。具有以16 kHz采樣的50Hz-7000Hz的音頻頻帶的音頻信號(hào)被分成320 個(gè)樣本的20毫秒(ms)幀。具有截止頻率50Hz的高通濾波101被施加到輸 入信號(hào)。獲得的信號(hào)SWB被用于編碼器的多個(gè)分支。首先,在第 一分支,將低通濾波和從16 kHz到8 kHz的按系數(shù)2的向下 采樣,102,施加到信號(hào)SWB。該操作產(chǎn)生以8kHz采樣的電話頻帶信號(hào)。由 使用CELP類(lèi)型編碼的核心編碼器103處理該信號(hào)。這里該編碼對(duì)應(yīng)于G729A 編碼器,其產(chǎn)生具有比特率8 kbps的比特流核心。然后第一增強(qiáng)層引入CELP編碼的第二階段103。尤其對(duì)非語(yǔ)音的聲音, 存在于革新者字典中的實(shí)現(xiàn)CELP激勵(lì)的增加和提供質(zhì)量增強(qiáng)。該第二編碼 階段的比特率是4 kbps并且該關(guān)聯(lián)的參數(shù)是脈沖的位置和符號(hào)以及對(duì)于40 個(gè)樣本(5ms以8kHz)的每個(gè)子幀關(guān)聯(lián)的革新者字典的增益。進(jìn)行該核心編碼器和第 一增強(qiáng)層的解碼以獲得在電話頻帶中合成的12 kbps信號(hào)104。從8 kHz到16 kHz按系數(shù)2的過(guò)采樣和低通濾波105從編碼 器的頭兩個(gè)階段中產(chǎn)生以16kHz采樣的版本(version)。第三增強(qiáng)層實(shí)現(xiàn)對(duì)寬帶的帶寬擴(kuò)展106。能夠通過(guò)預(yù)加重濾波器預(yù)處理 輸入信號(hào)SWB。該預(yù)加重濾波器從寬帶線性預(yù)測(cè)濾波器中產(chǎn)生高頻的更好表 示。為了補(bǔ)償預(yù)加重濾波器的影響,于是在合成中使用反向去加重濾波器。 此編碼和解碼結(jié)構(gòu)的替代沒(méi)有使用預(yù)加重或去加重濾波器。下一步計(jì)算和量化該寬代線性預(yù)測(cè)濾波器。該線性預(yù)測(cè)濾波器是第18階濾波器,但是能夠選擇比如第16階預(yù)測(cè)的較低預(yù)測(cè)階。能夠通過(guò)使用 Levinson-Durbin算法的自相關(guān)方法計(jì)算該線性預(yù)測(cè)濾波器。使用來(lái)自電話頻帶核心編碼器的濾波器iWB (z)的系數(shù)的預(yù)測(cè)量化此寬 帶線性預(yù)測(cè)濾波器AWB(z)。然后能夠使用例如多級(jí)矢量量化和使用電話頻帶 核心編碼器的去量化LSF (線頻語(yǔ)頻率)參數(shù)來(lái)量化該系數(shù),如在H. Ehara, T. Morii, M. Oshikiri,和K. Yoshida, Predictive VQ for bandwidth scalable LSP quantization, ICASSP 2005文章中記載的。從核心編碼器的電話頻帶激勵(lì)參數(shù)音調(diào)周期延遲、關(guān)聯(lián)增益和核心編 碼器的代數(shù)激勵(lì)以及CELP激勵(lì)的第 一增加層和關(guān)聯(lián)的增益中獲得寬帶激勵(lì)。使用電話頻帶階段的激勵(lì)參數(shù)的過(guò)采樣版本產(chǎn)生此激勵(lì)。然后由先前已經(jīng)計(jì)算的合成濾波器過(guò)濾該寬帶激勵(lì)。如果已經(jīng)對(duì)輸入信 號(hào)施加預(yù)加重,則對(duì)合成濾波器的輸出信號(hào)施加去加重濾波器。獲得的信號(hào)是寬帶信號(hào),其能量沒(méi)有被調(diào)整。為了計(jì)算用于校平該高頻帶(3 4 0 0 H z - 7 0 0 0 H z )的能量的增益,向該寬帶合成信號(hào)施加高通濾波器。與 此并行的,相同的高通濾波器被施加到誤差信號(hào),其對(duì)應(yīng)于在延遲的原始信 號(hào)和先前兩個(gè)階段的合成信號(hào)之間的差別。然后這兩個(gè)信號(hào)被用來(lái)計(jì)算將被 施加到該合成寬帶信號(hào)的增益。依靠在這兩個(gè)信號(hào)之間的能量比率計(jì)算增益。 然后將該量化的增益g稀施加到80個(gè)樣本的子幀層級(jí)的信號(hào)S14 WB ( 5ms到 16kHz),并且以此方式獲得的信號(hào)然后被添加到來(lái)自先前階段的合成的信號(hào) 以便創(chuàng)建對(duì)應(yīng)于14 kbps比特率的寬帶信號(hào)。編碼的剩余部分在頻域使用預(yù)測(cè)變換編碼方案實(shí)現(xiàn)。延遲的輸入信號(hào)108 和14kbps合成信號(hào)107經(jīng)過(guò)AwB(z/y) * (1-pz)的感知等待濾波器109、 111 濾波, 一般y = 0.92且ti = 0.68。然后通過(guò)TDAC (時(shí)域聲音混淆消 除)交迭變換編碼方案(Y. Mahieux and J.P. Petit, Transform coding of audio signals at 64 kbit/s, IEEE GLOBECOM 1990 )編碼這些信號(hào)。施加》f正的離散余弦變換(MDCT )110到具有50% (每隔20 ms刷新 MDCT分析)的交迭的加權(quán)的輸入信號(hào)的640個(gè)樣本的塊,以及施加112到 來(lái)自先前的頻帶擴(kuò)展階段的14kbps (相同塊長(zhǎng)度和相同的交迭)處的加權(quán)的 合成信號(hào)。將被編碼的MDCT頻譜,113,對(duì)應(yīng)于在14 kbps處關(guān)于0到3400 Hz的在加權(quán)的輸入信號(hào)和合成信號(hào)之間的差異,以及對(duì)應(yīng)于從3400Hz到 7000 Hz的加權(quán)的輸入信號(hào)。通過(guò)將最后40個(gè)系數(shù)(僅編碼頭280個(gè)系數(shù)) 設(shè)置為零來(lái)限制該頻語(yǔ)為7000 Hz。將頻語(yǔ)劃分為18個(gè)頻帶 一個(gè)含八個(gè)系 數(shù)的頻帶和17個(gè)含16個(gè)系數(shù)的頻帶。對(duì)于該頻語(yǔ)的每個(gè)頻帶,MDCT系數(shù) 的能量被計(jì)算(縮放因子)。該18個(gè)縮放因子構(gòu)成其后被量化、編碼和按幀 傳送的該加權(quán)信號(hào)的頻語(yǔ)包絡(luò)。圖3示出該比特流的格式。動(dòng)態(tài)比特分配基于來(lái)自頻譜包絡(luò)的去量化版本的頻譜的頻帶能量。這實(shí) 現(xiàn)了在編碼器和解碼器的二進(jìn)制分配之間的兼容性。然后通過(guò)使用在大小和 維度上字典交織的矢量量化量化在每個(gè)頻帶的歸一化(精細(xì)結(jié)構(gòu))MDCT系 數(shù),正如C, Lamblin et al., "Quantification vectorielle en dimension et resolution variables" ["Vector quantization with variable dimension and resolution"], patentPCT FR 04 00219, 2004記載的,該字典包括置換代碼的聯(lián)合。最后,將關(guān)于 核心編碼器、電話頻帶CELP增強(qiáng)階段、寬帶CELP階段和最后該頻鐠包絡(luò) 的信息和歸一化的編碼系數(shù)復(fù)用并且以幀來(lái)傳送。 圖2是與圖1的編碼器關(guān)聯(lián)的解碼器的框圖。模塊2701解復(fù)用包含在比特流中的參數(shù)。作為接收的比特的數(shù)目的函數(shù) 對(duì)幀解碼存在多種情況,且參考圖2描述了四種情況1 . 對(duì)于8 kbps的接收比特率,第一關(guān)注由解碼器接收最小數(shù)目的比 特。在此情況下,僅解碼第一階段。因此僅涉及CELP (G.729A+)類(lèi)型核心 解碼器202的比特流被接收和解碼。能夠由G.729解碼器通過(guò)自適應(yīng)后濾波 203和高通濾波后處理204處理該合成。在該實(shí)施例中,術(shù)語(yǔ)"后處理"指 的是這兩種操作的組合。然而,顯然該術(shù)語(yǔ)"后處理"也能夠僅指自適應(yīng)后 濾波或僅指高通濾波型的后處理。該信號(hào)被過(guò)采樣,206,和濾波,207,以 產(chǎn)生以16 kHz的采樣信號(hào)。2. 對(duì)于12 kbps的接收比特率,第二情況關(guān)注僅涉及第一和第二解 碼階段的比特?cái)?shù)目的接收。在此情況下,解碼核心解碼器和第一CELP激勵(lì) 增強(qiáng)階段。能夠由G,729解碼器通過(guò)后處理203、 204處理該合成。如同前面, 該信號(hào)被過(guò)采樣206和濾波207以產(chǎn)生以16 kHz的采樣信號(hào)。3. 對(duì)于14 kbps的接收比特率,第三情況對(duì)應(yīng)于涉及頭三個(gè)解碼階 段的比特?cái)?shù)目的接收。在此情況下,除了沒(méi)有向CELP解碼輸出施加后處理 的事實(shí)之外,如同情況2,首先實(shí)現(xiàn)頭兩個(gè)解碼階段,在這之后頻帶擴(kuò)展模 塊在解碼在寬帶209以及與激勵(lì)關(guān)聯(lián)的增益213中成對(duì)頻譜線(WB-LSF )的 參數(shù)后產(chǎn)生以16kHz的采樣信號(hào)。從核心編碼器和第一CELP增強(qiáng)階段208 中產(chǎn)生寬帶激勵(lì)。然后由合成濾波器210和適合的話(如果在編碼器中使用了 預(yù)加重濾波器)由去加重濾波器211濾波該激勵(lì)。高通濾波器212被施加到獲 得的信號(hào),且依靠關(guān)聯(lián)的增益214每隔5ms適配該頻帶擴(kuò)展信號(hào)的能量。該 信號(hào)然后被加入從頭兩個(gè)解碼階段215中獲得的以16kHz采樣的電話頻帶信 號(hào)。在反向MDCT 220和加權(quán)的合成濾波器221之前通過(guò)將最后40個(gè)MDCT 系數(shù)設(shè)為0來(lái)在變換域過(guò)濾該信號(hào),目的是獲取限制在7000 Hz的信號(hào)。4. 對(duì)于比16kbps大或相等的接收比特率,最后的情況對(duì)應(yīng)于解碼解 碼器的全部階段。最后階段由預(yù)測(cè)變換解碼器構(gòu)成。首先執(zhí)行上述的步驟3. 然后,作為額外接收比特?cái)?shù)目的函數(shù),預(yù)測(cè)變換解碼方案被適配來(lái)*如果比特?cái)?shù)目對(duì)應(yīng)于僅僅部分頻i普包絡(luò),或?qū)?yīng)于其整個(gè)但是不具有接收的精細(xì)結(jié)構(gòu)(fine structure ),則對(duì)應(yīng)于由頻帶擴(kuò)展階l殳215產(chǎn)生的信號(hào), 部分或完整的頻語(yǔ)包絡(luò)被用來(lái)調(diào)整MDCT系數(shù)的頻帶的能量,216和217, 在范圍3400 Hz到7000 Hz中,218。此系統(tǒng)作為接收比特?cái)?shù)目的函數(shù)實(shí)現(xiàn)音 頻質(zhì)量的逐步改進(jìn)。*如果比特?cái)?shù)目對(duì)應(yīng)于整個(gè)頻語(yǔ)包絡(luò)并且對(duì)應(yīng)于部分或整個(gè)精細(xì)結(jié)構(gòu), 則以與在編碼器中相同的方式實(shí)現(xiàn)比特分配。在接收精細(xì)結(jié)構(gòu)的頻帶中,從 頻語(yǔ)包絡(luò)和去量化的精細(xì)結(jié)構(gòu)中計(jì)算解碼的MDCT系數(shù)。在沒(méi)有接收精細(xì)結(jié) 構(gòu)的范圍3400Hz到7000Hz的頻帶中,使用前面段落的程序,即,基于接 收的頻謙包絡(luò)在能量上調(diào)整根據(jù)通過(guò)頻帶擴(kuò)展獲得的信號(hào)計(jì)算的MDCT系 H 216和217, 218。因此由以下構(gòu)成用于合成的MDCT頻-譜由在頭兩個(gè) 解碼階段被加入到在0到3400 Hz之間的頻帶解碼的誤差信號(hào)中的合成信號(hào); 以及還有,對(duì)于范圍3400 Hz到7000 Hz的頻帶,由已經(jīng)接收精細(xì)結(jié)構(gòu)的頻 帶中解碼的MDCT系數(shù)和對(duì)其它頻譜頻帶在能量上調(diào)整的頻帶擴(kuò)展階段的 MDCT系數(shù)。然后反向MDCT被施加到解碼的MDCT系數(shù),220,以及由加權(quán)的合成 濾波器濾波,221,產(chǎn)生輸出信號(hào)。以下在圖2的解碼器的環(huán)境中描述依照本發(fā)明的轉(zhuǎn)換方法。塊205表示"交叉衰落"模塊。如果由解碼器接收的比特?cái)?shù)目不足夠解 碼除了第一階段或第一和第二階段,即,對(duì)于8kbps或12kbps的接收比特 率,則解碼器的最終輸出的有效帶寬是電話頻帶。在此情形下,為了增強(qiáng)合 成信號(hào)的質(zhì)量,在過(guò)采樣之前,廣義上是G,729A解碼器的一部分的后處理 203、 204被施加到電話頻帶。相反,如果也實(shí)現(xiàn)在寬帶階段的解碼,對(duì)于接收比特率大于或等于14 kbps,則該后處理沒(méi)有起作用,因?yàn)樵诰幋a器中,已經(jīng)從電話頻帶的沒(méi)有后 處理的版本中計(jì)算較高階段的編碼。后處理203和204向信號(hào)引入相移。當(dāng)在有和沒(méi)有后處理的模式之間轉(zhuǎn) 換時(shí),由此必須提供軟轉(zhuǎn)換。圖4示出塊205的實(shí)現(xiàn),其通過(guò)施加交叉衰落 在后處理和非后處理的電話頻帶信號(hào)之間提供此緩慢的轉(zhuǎn)換。步驟401檢查當(dāng)前幀是否是電話頻帶幀,即,驗(yàn)證當(dāng)前幀的比特率是否 是8 kbps或12 kbps。在否定答復(fù)的情況下,觸發(fā)步驟402以驗(yàn)證先前幀是否在電話頻帶中被后處理(這等于驗(yàn)證先前幀的比特率是否是8 kbps-12 kbps )。 在否定答復(fù)的情況下,在步驟403中,非后處理信號(hào)S,被復(fù)制到信號(hào)S3。相 反,當(dāng)對(duì)檢測(cè)402為肯定答復(fù)時(shí),在步驟404中,信號(hào)S3將包含交叉衰落的結(jié)果,其中非后處理分量S,的權(quán)重增加而后濾波分量S2的權(quán)重減少。步驟404之后跟著以值0來(lái)更新標(biāo)志prevPF的步驟405。當(dāng)在步驟401中存在肯定答復(fù)時(shí),在步驟406中對(duì)于在電話頻帶中的后 處理是否在先前幀中起作用執(zhí)行驗(yàn)證。在肯定答復(fù)時(shí),在步驟408中,后處 理信號(hào)S2被復(fù)制到信號(hào)S3。相反,在步驟406為否定答復(fù)時(shí),在步驟407中, 信號(hào)S3被計(jì)算為交叉衰落的結(jié)果,這次非后處理分量S,的權(quán)重減少而后處理 分量S2的權(quán)重增加。在步驟407之后,觸發(fā)步驟409以便利用值1來(lái)更新標(biāo) 志prevPF。在本實(shí)施例的變體中,如果由解碼器接收的比特?cái)?shù)目?jī)H允許解碼第 一階 段或第一和第二階段,即,對(duì)于8或12kbps的接收比特率,則解碼器的最終 輸出的有效帶寬是電話頻帶(信號(hào)S,)。在此情形下,為了增強(qiáng)合成信號(hào)的質(zhì) 量,在過(guò)采樣之前,在電話頻帶的后處理被施加。相反,如果也實(shí)現(xiàn)寬帶階段的解碼,對(duì)于接收比特率大于或等于14kbps, 則在編碼器中不同的后處理發(fā)生作用(信號(hào)S2),已經(jīng)從具有電話頻帶的后處 理的版本中計(jì)算較高階段的編碼。用于8或12 kbps的比特率的后處理和用于比特率大于或等于14 kbps的 后處理向信號(hào)引入不同的相移。當(dāng)在不同版本的后處理的模式之間轉(zhuǎn)換時(shí), 由此必須提供軟轉(zhuǎn)換。通過(guò)施加交叉衰落(其產(chǎn)生信號(hào)S3)實(shí)現(xiàn)在具有各種 形式的后處理的電話頻帶信號(hào)之間的緩慢轉(zhuǎn)換。驗(yàn)證當(dāng)前幀是否是電話頻帶幀。在否定答復(fù)的情況下,驗(yàn)證先前幀是否 是電話頻帶幀。在否定答復(fù)的情況下,后處理信號(hào)Sl被復(fù)制到信號(hào)S3。相 反,在肯定答復(fù)的情況下,信號(hào)S3將包含交叉衰落的結(jié)果,其中后處理分量 Sl的權(quán)重增加而后處理分量S2的權(quán)重減少。當(dāng)存在肯定答復(fù)時(shí),驗(yàn)證先前幀是否是電話頻帶幀。在肯定答復(fù)時(shí),后 處理信號(hào)S2被復(fù)制到信號(hào)S3。相反,在否定答復(fù)時(shí),信號(hào)S3被計(jì)算為交叉 衰落的結(jié)果,這次后處理分量Sl的權(quán)重減少而后處理分量S2的權(quán)重增加。塊209計(jì)算頻帶擴(kuò)展和預(yù)測(cè)變換解碼階段必須的寬帶線性預(yù)測(cè)濾波器。 如果在接收寬帶幀后, 一幀的比特流僅僅電話頻帶部分被接收則該計(jì)算是必須的,以及需要頻帶擴(kuò)展以便維持頻帶效果。然后從電話頻帶核心解碼器的LSF中外推出一組LSF。例如,8個(gè)LSF能夠被一致地分布在介于來(lái)自電話 頻帶的最后的LSF和Nyquist頻率之間的頻帶上。然后線性預(yù)測(cè)濾波器能夠 趨向用于高頻的平坦振幅響應(yīng)濾波器。塊213依照本發(fā)明提供用于頻帶擴(kuò)展的增益適配。參考圖5和7描述對(duì) 應(yīng)于所述塊的流程圖。參考圖5描述向高頻帶施加自適應(yīng)增益衰減的原理。首先,依照兩種可 能性計(jì)算第一寬帶解碼層的增益,501。如果已經(jīng)接收對(duì)應(yīng)于頻帶擴(kuò)展層的比 特流,則通過(guò)解碼獲得該增益,503。相反,如果在比特流中沒(méi)有接收到此增 益,則外推與該解碼層關(guān)聯(lián)的增益,502。例如,能夠通過(guò)利用先前進(jìn)行的電 話頻帶的真實(shí)解碼來(lái)校正寬帶解碼階段的基帶的能量進(jìn)行增益計(jì)算。然后根據(jù)參考圖7描述的原理更新先前接收的寬帶幀數(shù)目的計(jì)數(shù)器,504。最后,該計(jì)數(shù)器被用來(lái)設(shè)置施加到第 一 寬帶解碼階段的增益的衰減系數(shù),505。圖7表示用于管理接收的寬帶幀數(shù)目的計(jì)數(shù)的過(guò)程的流程圖。按以下方 式更新計(jì)數(shù)器。如果當(dāng)前幀是寬帶幀,則如果已經(jīng)接收與第一寬帶解碼階段 關(guān)聯(lián)的增益(圖5,塊501 )并且先前幀也是寬帶幀,則該計(jì)數(shù)器增加1并且 在值MAX—COUNT—RCV處飽和。該值對(duì)應(yīng)于在介于電話頻帶比特率和寬帶 比特率之間切換期間幀(在其間該寬帶解碼信號(hào)將被衰減)的數(shù)目。相反,如果接收的當(dāng)前幀是電話頻帶幀,則存在幾種可能的行為。如果 先前幀也是電話頻帶幀,則計(jì)數(shù)器置0。如果不是,如果先前幀是寬帶幀且 計(jì)數(shù)器具有小于MAX—COUNT一RCV的值,則計(jì)數(shù)器也置0。在所有其它情 況下,計(jì)數(shù)器保持前一值。該流程圖的功能總結(jié)在圖8的表中。當(dāng)MAX—COUNT—RCV采用值100 時(shí),在圖9的表中示出由衰減系數(shù)采用的值,該表作為示例提供。注意對(duì)應(yīng) 于相位擴(kuò)展在電話頻帶的解碼,衰減系數(shù)保持為0直到幀65。通過(guò)逐漸地增 加該衰減系數(shù)從幀66實(shí)現(xiàn)適當(dāng)?shù)霓D(zhuǎn)換狀態(tài)。自適應(yīng)衰減。該圖是預(yù)測(cè)變換解碼層的自適應(yīng)衰減程序的流程圖。首先,驗(yàn)證該層的頻語(yǔ)包絡(luò)是否已經(jīng)完整接收,601。如果是的話,則使用接收的寬帶幀計(jì)數(shù)器 和圖9的衰減表將0-3500 Hz低頻帶校正MDCT校正系數(shù)衰減,602。然后,在兩種情況下,監(jiān)視接收的寬帶幀的數(shù)目。如果該數(shù)目小于 MAX—COUNT—RCV,則對(duì)應(yīng)于具有信息傳送的頻帶擴(kuò)展的第一寬帶解碼階 段的MDCT系數(shù)被用于預(yù)測(cè)變換解碼階段。相反,如果計(jì)數(shù)器具有最大值, 則執(zhí)行用于利用解碼的頻譜包絡(luò)校平預(yù)測(cè)變換解碼頻帶的能量的程序。
權(quán)利要求
1.一種在解碼由多速率音頻編碼系統(tǒng)編碼的音頻信號(hào)時(shí)的比特率切換方法,所述解碼包括依靠所述比特率的至少一個(gè)后處理步驟,其特征在于,當(dāng)從初始比特率向最終比特率切換時(shí),所述方法包括從處于初始比特率的信號(hào)向處于最終比特率的信號(hào)連續(xù)改變的轉(zhuǎn)換步驟,所述信號(hào)之一或兩者被后處理。
2. 如權(quán)利要求l所述的方法,其特征在于所述后處理是高通濾波。
3. 如權(quán)利要求l所述的方法,其特征在于所述后處理是自適應(yīng)后濾波。
4. 如權(quán)利要求l所述的方法,其特征在于所述后處理是高通濾波和自適 應(yīng)后濾波的組合。
5. 如權(quán)利要求1到4中的任何一項(xiàng)所述的方法,其特征在于通過(guò)降低處 于初始比特率的信號(hào)的權(quán)重和增加處于最終比特率的信號(hào)的權(quán)重的加權(quán)來(lái)實(shí) 現(xiàn)所述連續(xù)轉(zhuǎn)變。
6. 如權(quán)利要求1到5中的任何一項(xiàng)所述的方法,其特征在于處于初始比 特率的信號(hào)和處于最終比特率的信號(hào)被后處理。
7. —種計(jì)算機(jī)程序,包括用于當(dāng)由計(jì)算機(jī)執(zhí)行所述程序時(shí)執(zhí)行根據(jù)權(quán)利 要求1到6中的任何一項(xiàng)的方法的代碼指令。
8. —種對(duì)于比特率分級(jí)音頻解碼系統(tǒng)的根據(jù)權(quán)利要求1到6中的任何一 項(xiàng)的方法的應(yīng)用。
9. 一種對(duì)于比特率分級(jí)和帶寬分級(jí)音頻解碼系統(tǒng)的根據(jù)權(quán)利要求1到6 中的任何一項(xiàng)的方法的應(yīng)用,其中由在第 一頻帶中的第 一解碼層獲得初始比 特率并且通過(guò)作為將所述第一頻帶擴(kuò)展成第二頻帶的層的第二解碼層獲得最 終比特率,該后處理步驟被應(yīng)用到以初始比特率執(zhí)行的解碼。
10. —種對(duì)于比特率分級(jí)和帶寬分級(jí)音頻解碼系統(tǒng)的根據(jù)權(quán)利要求1到 6中的任何一項(xiàng)的方法的應(yīng)用,其中在第一頻帶中的第一解碼層獲得最終比 特率并且通過(guò)作為將所述第一頻帶擴(kuò)展成第二頻帶的層的第二解碼層獲得初始比特率,該后處理步驟被應(yīng)用到以最終比特率執(zhí)行的解碼。
11. 一種多速率音頻解碼器,其特征在于,所述解碼器包括依靠所述比 特率的后處理階段,當(dāng)從初始比特率向最終比特率切換時(shí)適配所述后處理階段以通過(guò)從處于初始比特率的信號(hào)向處于最終比特率的信號(hào)的連續(xù)改變實(shí)現(xiàn)轉(zhuǎn)換,其中所述信號(hào)之一或兩者被后處理。
12. 如權(quán)利要求11所述的解碼器,其特征在于所述后處理是高通濾波。
13. 如權(quán)利要求11所述的解碼器,其特征在于所述后處理是自適應(yīng)后濾波。
14. 如權(quán)利要求11所述的解碼器,其特征在于所述后處理是高通濾波和 自適應(yīng)后濾波的組合。
15. 如權(quán)利要求11到14中的任何一項(xiàng)所述的解碼器,其特征在于所述 后處理階段被適配為通過(guò)降低處于初始比特率的信號(hào)的權(quán)重和增加處于最終 比特率的信號(hào)的權(quán)重的加權(quán)來(lái)實(shí)現(xiàn)所述連續(xù)改變。
16. 如權(quán)利要求11到15中的任何一項(xiàng)所述的解碼器,其特征在于處于 初始比特率的信號(hào)和處于最終比特率的信號(hào)被后處理。
全文摘要
一種在解碼由音頻編碼系統(tǒng)編碼的音頻信號(hào)時(shí)轉(zhuǎn)換比特率的方法,所述解碼包括依靠比特率的后處理步驟。根據(jù)本發(fā)明,在從初始比特率向最終比特率轉(zhuǎn)換時(shí),所述方法包括從初始比特率的信號(hào)向最終比特率的信號(hào)連續(xù)改變的轉(zhuǎn)換步驟,所述信號(hào)之一或兩者被后處理。應(yīng)用于數(shù)據(jù)分組網(wǎng)絡(luò)的VoIP語(yǔ)音和/或音頻信號(hào)的傳送。
文檔編號(hào)G10L19/24GK101263554SQ200680033807
公開(kāi)日2008年9月10日 申請(qǐng)日期2006年7月10日 優(yōu)先權(quán)日2005年7月22日
發(fā)明者戴維·維雷特, 斯蒂法尼·拉戈特, 貝拉茨·科維塞 申請(qǐng)人:法國(guó)電信公司