專利名稱:用于帶寬延伸語音預(yù)測激勵信號的抗稀疏濾波的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信號處理。
背景技術(shù):
公共交換電話網(wǎng)絡(luò)(PSTN)上的語音通信的帶寬傳統(tǒng)上限于300-3400 kHz的頻率范 圍。用于語音通信(例如蜂窩式電話和IP語音(因特網(wǎng)協(xié)議,VoIP))的新的網(wǎng)絡(luò)可能 不具有相同的帶寬限制,且可能需要在此類網(wǎng)絡(luò)上發(fā)射和接收包含寬頻帶頻率范圍的語
音通信。舉例來說,可能需要支持向下延伸到50Hz和/或一直到7或8kHz的音頻頻率 范圍。還可能需要支持可能具有在傳統(tǒng)PSTN限制以外的范圍內(nèi)的音頻語音內(nèi)容的其它 應(yīng)用,例如高質(zhì)量音頻或音頻/視頻會議。
語音編碼器所支持的范圍向較高頻率的延伸可改進(jìn)清晰度。舉例來說,區(qū)分例如"s" 與"f"的摩擦音的信息主要處于高頻率。高頻帶延伸還可改進(jìn)語音的其它質(zhì)量,例如存 在率。舉例來說,甚至濁元音也可具有遠(yuǎn)遠(yuǎn)高于PSTN限制的頻譜能量。
寬頻帶語音編碼的一種方法涉及縮放窄頻帶語音編碼技術(shù)(例如,經(jīng)配置以編碼0-4 kHz的范圍的技術(shù))以覆蓋寬頻帶頻譜。舉例來說,語音信號可以較高速率取樣以包含 處于高頻率的分量,且窄頻帶編碼技術(shù)可重新配置以使用更多濾波系數(shù)來表示此寬頻帶 信號。然而,例如CELP (密碼本激勵線性預(yù)測)的窄頻帶編碼技術(shù)計(jì)算量較大,而寬頻 帶CELP編碼器可能消耗過多處理循環(huán),以至于對于許多移動和其它嵌入式應(yīng)用而言不 現(xiàn)實(shí)。使用這種技術(shù)將寬頻帶信號的整個頻譜編碼為所需質(zhì)量還可能導(dǎo)致帶寬大大增加 而令人無法接受。此外,甚至在此經(jīng)編碼信號的窄頻帶部分可傳輸?shù)絻H支持窄頻帶編碼 的系統(tǒng)中和/或由所述系統(tǒng)解碼之前,將需要對所述經(jīng)編碼信號進(jìn)行代碼轉(zhuǎn)換。
寬頻帶語音編碼的另一種方法涉及從經(jīng)編碼窄頻帶頻譜包絡(luò)外推高頻帶頻譜包絡(luò)。 雖然這種方法可在不增加帶寬且不需要代碼轉(zhuǎn)換的情況下實(shí)施,但通常無法從窄頻帶部 分的頻譜包絡(luò)中精確地預(yù)測出語音信號的高頻帶部分的粗略頻譜包絡(luò)或共振峰結(jié)構(gòu)。
可能需要實(shí)施寬頻帶語音編碼,使得至少經(jīng)編碼信號的窄頻帶部分可通過窄頻帶信 道(例如,PSTN信道)發(fā)送,而不進(jìn)行代碼轉(zhuǎn)換或其它顯著修改。還可能需要寬頻帶編 碼延伸有效率,以便(例如)避免在例如無線蜂窩式電話以及有線和無線信道上的廣播 的應(yīng)用中可能接受服務(wù)的用戶的數(shù)目顯著減少。
發(fā)明內(nèi)容
在--個實(shí)施例中, 一種產(chǎn)生高頻帶激勵信號的方法包含通過延伸基于經(jīng)編碼低頻 帶激勵信號的信號的頻譜來產(chǎn)生頻譜延伸信號;以及對基于所述經(jīng)編碼低頻帶激勵信號 的信號執(zhí)行抗稀疏濾波。在此方法中,所述高頻帶激勵信號基于所述頻譜延伸信號,且 所述高頻帶激勵信號基于執(zhí)行抗稀疏濾波的結(jié)果。
在另一實(shí)施例中, 一種設(shè)備包含頻譜延伸器,其經(jīng)配置以通過延伸基于經(jīng)編碼低 頻帶激勵信號的信號的頻譜來產(chǎn)生頻譜延伸信號;以及抗稀疏濾波器,其經(jīng)配置以對基 于所述經(jīng)編碼低頻帶激勵信號的信號進(jìn)行濾波。在此設(shè)備中,所述高頻帶激勵信號基于 所述頻譜延伸信號,且所述高頻帶激勵信號基于所述抗稀疏濾波器的輸出。
在另一實(shí)施例中, 一種設(shè)備包含用于通過延伸基于經(jīng)編碼低頻帶激勵信號的信號 的頻譜來產(chǎn)生頻譜延伸信號的裝置;以及抗稀疏濾波器,其經(jīng)配置以對基于所述經(jīng)編碼 低頻帶激勵信號的信號進(jìn)行濾波。在此設(shè)備中,所述高頻帶激勵信號基于所述頻譜延伸 信號,且所述高頻帶激勵信號基于所述抗稀疏濾波器的輸出。
圖la展示根據(jù)一實(shí)施例的寬頻帶語音編碼器A100的方塊圖。 圖lb展示寬頻帶語音編碼器A100的實(shí)施方案A102的方塊圖。 圖2a展示根據(jù)一實(shí)施例的寬頻帶語音解碼器B100的方塊圖。 圖2b展示寬頻帶語音編碼器B100的實(shí)施方案B102的方塊圖。 圖3a展示濾波器組A110的實(shí)施方案A112的方塊圖。 圖3b展示濾波器組B120的實(shí)施方案B122的方塊圖。 圖4a展示濾波器組A110的一個實(shí)例的低和高頻帶的帶寬覆蓋。 圖4b展示濾波器組A110的另一實(shí)例的低和高頻帶的帶寬覆蓋。 圖4c展示濾波器組A112的實(shí)施方案A114的方塊圖。 圖4d展示濾波器組B122的實(shí)施方案B124的方塊圖。 圖5a展示語音信號的頻率與對數(shù)幅值的曲線的實(shí)例。 圖5b展示基礎(chǔ)線性預(yù)測編碼系統(tǒng)的方塊圖。
圖6展示窄頻帶編碼器A120的實(shí)施方案A122的方塊圖。
圖7展示窄頻帶解碼器B110的實(shí)施方案B112的方塊圖。
圖8a展示濁語音的殘留信號的頻率與對數(shù)幅值的曲線的實(shí)例。
圖8b展示濁語音的殘留信號的時間與對數(shù)幅值的曲線的實(shí)例。
圖9展示也執(zhí)行長期預(yù)測的基礎(chǔ)線性預(yù)測編碼系統(tǒng)的方塊圖。
圖10展示高頻帶編碼器A200的實(shí)施方案A202的方塊圖。
圖11展示高頻帶激勵發(fā)生器A300的實(shí)施方案A302的方塊圖。
圖12展示頻譜延伸器A400的實(shí)施方案A402的方塊圖。
圖12a展示頻譜延伸操作的一個實(shí)例中各點(diǎn)處的信號頻譜的曲線。
圖12b展示頻譜延伸操作的另一實(shí)例中各點(diǎn)處的信號頻譜的曲線。
圖13展示高頻帶激勵發(fā)生器A302的實(shí)施方案A304的方塊圖。
圖14展示高頻帶激勵發(fā)生器A302的實(shí)施方案A306的方塊圖。
圖15展示包絡(luò)計(jì)算任務(wù)T100的流程圖。
圖16展示組合器4卯的實(shí)施方案492的方塊圖。
圖17說明計(jì)算高頻帶信號S30的周期性的指標(biāo)的方法。
圖18展示高頻帶激勵發(fā)生器A302的實(shí)施方案A312的方塊圖。
圖19展示高頻帶激勵發(fā)生器A302的實(shí)施方案A314的方塊圖。
圖20展示高頻帶激勵發(fā)生器A302的實(shí)施方案A316的方塊圖。
圖21展示增益計(jì)算任務(wù)T200的流程圖。
圖22展示增益計(jì)算任務(wù)T200的實(shí)施方案T210的流程圖。
圖23a展示窗口函數(shù)的圖。
圖23b展示將如圖23a所示的窗口函數(shù)應(yīng)用于語音信號的子幀。
圖24展示高頻帶解碼器B200的實(shí)施方案B202的方塊圖。
圖25展示寬頻帶語音編碼器A100的實(shí)施方案AD10的方塊圖。
圖26a展示延遲線D120的實(shí)施方案D122的示意圖。
圖26b展示延遲線D120的實(shí)施方案D124的示意圖。
圖27展示延遲線D120的實(shí)施方案D130的示意圖。
圖28展示寬頻帶語音編碼器AD10的實(shí)施方案AD12的方塊圖。
圖29展示根據(jù)一實(shí)施例的信號處理方法MD100的流程圖。
圖30展示根據(jù)一實(shí)施例的方法M100的流程圖。
圖31a展示根據(jù)一實(shí)施例的方法M200的流程圖。 圖31b展示方法M200的實(shí)施方案M210的流程圖。 圖32展示根據(jù)一實(shí)施例的方法M300的流程圖。
在各圖以及隨附的描述中,相同參考標(biāo)號表示相同或類似的元件或信號。
具體實(shí)施例方式
本文描述的實(shí)施例包含可經(jīng)配置以向窄頻帶語音編碼器提供延伸以支持傳輸和/或 存儲寬頻帶語音信號而帶寬僅增加約800到1000 bps (位/秒)的系統(tǒng)、方法和設(shè)備。此 類實(shí)施方案的潛在優(yōu)點(diǎn)包含支持與窄頻帶系統(tǒng)的兼容性的嵌入式編碼、在窄頻帶與高頻 帶編碼信道之間相對容易地分配和再分配位、避免計(jì)算量較大的寬頻帶合成操作,以及 維持待通過計(jì)算量較大的波形編碼例行程序處理的信號的低取樣速率。
除非特別受到上下文限制,否則本文使用術(shù)語"計(jì)算"來表示其普通含義的任一者, 例如計(jì)算、產(chǎn)生和從值的列表中選擇。本描述內(nèi)容和權(quán)利要求書中使用術(shù)語"包括"時, 不排除其它元件或操作。使用術(shù)語"A基于B"來表示其普通含義的任一者,包含以下 情況(i) "A等于B"禾d (ii) "A至少基于B"。術(shù)語"因特網(wǎng)協(xié)議"包含如IETF (因 特網(wǎng)工程工作小組)RFC (請求注解)791中描述的版本4和隨后版本(例如,版本6)。
圖la展示根據(jù)一實(shí)施例的寬頻帶語音編碼器A100的方塊圖。濾波器組A110經(jīng)配 置以對寬頻帶語音信號S10進(jìn)行濾波以產(chǎn)生窄頻帶信號S20和高頻帶信號S30。窄頻帶 編碼器A120經(jīng)配置以編碼窄頻帶信號S20以產(chǎn)生窄頻帶(NB)濾波器參數(shù)S40和窄頻 帶殘留信號S50。如本文進(jìn)一步詳細(xì)描述,窄頻帶編碼器A120通常經(jīng)配置以作為密碼本 索引或采取另一量化形式而產(chǎn)生窄頻帶濾波器參數(shù)S40和經(jīng)編碼窄頻帶激勵信號S50。 高頻帶編碼器A200經(jīng)配置以根據(jù)經(jīng)編碼窄頻帶激勵信號S50中的信息編碼高頻帶信號 S30以產(chǎn)生高頻帶編碼參數(shù)S60。如本文進(jìn)一步詳細(xì)描述,高頻帶編碼器A200通常經(jīng)配 置以作為密碼本索引或采取另一量化形式而產(chǎn)生高頻帶編碼參數(shù)S60。寬頻帶語音編碼 器A100的一個特定實(shí)例經(jīng)配置以在約8.55 kbps (千位/秒)的速率下編碼寬頻帶語音信 號SIO,其中約7.55 kbps用于窄頻帶濾波器參數(shù)S40和經(jīng)編碼窄頻帶激勵信號S50,且 約1 kbps用于高頻帶編碼參數(shù)S60。
可能需要將經(jīng)編碼窄頻帶和高頻帶信號組合為單一位流。舉例來說,可能需要將經(jīng) 編碼信號多路復(fù)用在一起以作為經(jīng)編碼寬頻帶語音信號用于傳輸(例如,在有線、光學(xué) 或無線傳輸信道上)或用于存儲。圖lb展示寬頻帶語音編碼器A100的實(shí)施方案A102 的方塊圖,寬頻帶語音編碼器A100包含多路復(fù)用器A130,其經(jīng)配置以將窄頻帶濾波器
參數(shù)S40、經(jīng)編碼窄頻帶激勵信號S50和高頻帶濾波器參數(shù)S60組合為多路復(fù)用信號S70。 一種包含編碼器A102的設(shè)備還可包含經(jīng)配置以將多路復(fù)用信號S70傳輸?shù)嚼缬?線、光學(xué)或無線信道的傳輸信道中的電路。此設(shè)備還可經(jīng)配置以對信號執(zhí)行一個或一個 以上信道編碼操作,例如誤差校正編碼(例如,速率兼容巻積編碼)和/或誤差檢測編碼 (例如,循環(huán)冗余編碼),和/或一層或一層以上網(wǎng)絡(luò)協(xié)議編碼(例如,以太網(wǎng)、TCP/IP、 cdma2000)。
可能需要多路復(fù)用器A130經(jīng)配置以嵌入經(jīng)編碼窄頻帶信號(包含窄頻帶濾波器參數(shù) S40和經(jīng)編碼窄頻帶激勵信號S50)作為可分離的多路復(fù)用信號S70支流,使得經(jīng)編碼窄 頻帶信號可獨(dú)立于多路復(fù)用信號S70的另一部分(例如,高頻帶和/或低頻帶信號)被恢 復(fù)并解碼。舉例來說,多路復(fù)用信號S70可經(jīng)配置使得經(jīng)編碼窄頻帶信號可通過剝除高 頻帶濾波器參數(shù)S60而恢復(fù)。這一特征的一個潛在優(yōu)點(diǎn)是避免在將經(jīng)編碼寬頻帶信號傳 遞到支持窄頻帶信號的解碼但不支持高頻帶部分的解碼的系統(tǒng)之前需要對所述經(jīng)編碼寬 頻帶信號進(jìn)行代碼轉(zhuǎn)換。
圖2a展示根據(jù)一實(shí)施例的寬頻帶語音解碼器B10O的方塊圖。窄頻帶解碼器B110 經(jīng)配置以解碼窄頻帶濾波器參數(shù)S40和經(jīng)編碼窄頻帶激勵信號S50以產(chǎn)生窄頻帶信號 S90。高頻帶解碼器B200經(jīng)配置以根據(jù)基于經(jīng)編碼窄頻帶激勵信號S50的窄頻帶激勵信 號S80而解碼高頻帶編碼參數(shù)S60,以產(chǎn)生高頻帶信號SIOO。在此實(shí)例中,窄頻帶解碼 器B110經(jīng)配置以將窄頻帶激勵信號S80提供到高頻帶解碼器B200。濾波器組B120經(jīng)配 置以將窄頻帶信號S90與高頻帶信號S100組合以產(chǎn)生寬頻帶語音信號SllO。
圖2b是寬頻帶語音解碼器B100的實(shí)施方案B102的方塊圖,寬頻帶語音解碼器BIOO 包含多路分解器B130,其經(jīng)配置以從多路復(fù)用信號S70中產(chǎn)生經(jīng)編碼信號S40、 S50和 S60。 一種包含解碼器B102的設(shè)備可包含經(jīng)配置以從例如有線、光學(xué)或無線信道的傳輸 信道接收多路復(fù)用信號S70的電路。此設(shè)備還可經(jīng)配置以對信號執(zhí)行一個或一個以上信 道解碼操作,例如誤差校正解碼(例如,速率兼容巻積解碼)和/或誤差檢測解碼(例如, 循環(huán)冗余解碼),和/或一層或一層以上網(wǎng)絡(luò)協(xié)議解碼(例如,以太網(wǎng)、TCP/IP、 cdma2000)。
濾波器組A110經(jīng)配置以根據(jù)分裂頻帶方案對輸入信號進(jìn)行濾波以產(chǎn)生低頻率子頻 帶和高頻率子頻帶。視特定應(yīng)用的設(shè)計(jì)標(biāo)準(zhǔn)而定,輸出子頻帶可具有相等或不等的帶寬 且可能重疊或不重疊。產(chǎn)生兩個以上子頻帶的濾波器組A110配置也是可能的。舉例來說, 此濾波器組可經(jīng)配置以產(chǎn)生一個或一個以上低頻帶信號,所述低頻帶信號包含處于窄頻 帶信號S20的頻率范圍以下的頻率范圍(例如50-300 Hz的范圍)內(nèi)的分量。此濾波器
組也可能經(jīng)配置以產(chǎn)生一個或一個以上額外高頻帶信號,所述額外高頻帶信號包含處于 高頻帶信號S30的頻率范圍以上的頻率范圍(例如14-20、 16-20或16-32 kHz的范圍) 內(nèi)的分量。在此情況下,可實(shí)施寬頻帶語音編碼器A100以單獨(dú)編碼此信號(一個或多個), 且多路復(fù)用器A130可經(jīng)配置以將額外經(jīng)編碼信號(一個或多個)包含在多路復(fù)用信號 S70中(例如,作為可分離部分)。
圖3a展示濾波器組A110的實(shí)施方案A112的方塊圖,濾波器組A110經(jīng)配置以產(chǎn)生 具有減小的取樣速率的兩個子頻帶信號。濾波器組A110經(jīng)配置以接收具有高頻率(或高 頻帶)部分和低頻率(或低頻帶)部分的寬頻帶語音信號SIO。濾波器組A112包含經(jīng)配 置以接收寬頻帶語音信號S10并產(chǎn)生窄頻帶語音信號S20的低頻帶處理路徑,和經(jīng)配置 以接收寬頻帶語音信號S10并產(chǎn)生高頻帶語音信號S30的高頻帶處理路徑。低通濾波器 110對寬頻帶語音信號S10進(jìn)行濾波以通過選定的低頻率子頻帶,且高通濾波器130對 寬頻帶語音信號S10進(jìn)行濾波以通過選定的高頻率子頻帶。因?yàn)閮蓚€子頻帶信號的帶寬 比寬頻帶語音信號S10窄,所以其取樣速率可在一定程度上減小而無信息損失。向下取 樣器120根據(jù)所需的抽選因數(shù)(例如,通過去除信號的樣本和/或用平均值代替樣本)來 減小低通信號的取樣速率,且向下取樣器140同樣地根據(jù)另一所需的抽選因數(shù)來減小高 通信號的取樣速率。
圖3b展示濾波器組B120的相應(yīng)實(shí)施方案B122的方塊圖。向上取樣器150 (例如, 通過零塞入和/或通過復(fù)制樣本)增加窄頻帶信號S90的取樣速率,且低通濾波器160對 向上取樣信號進(jìn)行濾波以僅通過低頻帶部分(例如,以防止混疊)。同樣,向上取樣器 170增加高頻帶信號S100的取樣速率,且高通濾波器180對向上取樣信號進(jìn)行濾波以僅 通過高頻帶部分。接著,將兩個通帶信號求和以形成寬頻帶語音信號S110。在解碼器B100 的一些實(shí)施方案中,濾波器組B120經(jīng)配置以根據(jù)由高頻帶解碼器B200接收和/或計(jì)算的 一個或一個以上權(quán)數(shù)來產(chǎn)生兩個通帶信號的加權(quán)總和。還預(yù)期將兩個以上通帶信號組合 的濾波器組B120配置。
濾波器110、 130、 160、 180的每一者可實(shí)施為有限脈沖響應(yīng)(FIR)濾波器或?qū)嵤?為無限脈沖響應(yīng)(IIR)濾波器。編碼器濾波器IIO和130的頻率響應(yīng)可具有抑止頻帶與 通帶之間的對稱或相異形狀的轉(zhuǎn)變區(qū)。同樣,解碼器濾波器160和180的頻率響應(yīng)可具 有抑止頻帶與通帶之間的對稱或相異形狀的轉(zhuǎn)變區(qū)??赡苄枰?但不是嚴(yán)格有必要)低 通濾波器110與低通濾波器160具有相同響應(yīng),且高通濾波器130與高通濾波器180具 有相同響應(yīng)。在一個實(shí)例中,兩個濾波器對110、 130和160、180是正交鏡像濾波器(QMF)組,其中濾波器對110、 130與濾波器對160、 180具有相同系數(shù)。
在典型實(shí)例中,低通濾波器110具有包含300-3400 Hz的有限PSTN范圍的通帶(例 如,0到4kHz的頻帶)。圖4a和4b展示兩個不同實(shí)施實(shí)例中寬頻帶語音信號SIO、窄 頻帶信號S20和高頻帶信號S30的相對帶寬。在這兩個特定實(shí)例中,寬頻帶語音信號S10 具有16kHz的取樣速率(表示O到8kHz范圍內(nèi)的頻率分量),且窄頻帶信號S20具有8 kHz的取樣速率(表示0到4kHz范圍內(nèi)的頻率分量)。
在圖4a的實(shí)例中,兩個子頻帶之間不存在明顯重疊。此實(shí)例中所示的高頻帶信號 S30可通過使用具有4-8kHz的通帶的高通濾波器130來獲得。在此情況下,可能需要通 過以2為因數(shù)向下取樣經(jīng)濾波信號而將取樣速率減小為8 kHz??深A(yù)期此操作會顯著減小 對信號的進(jìn)一步處理操作的計(jì)算復(fù)雜性,此操作將把通帶能量下移到0到4 kHz范圍內(nèi) 而無信息損失。
在圖4b的替代實(shí)例中,上部和下部子頻帶具有明顯重疊,使得兩個子頻帶信號均描 述3.5到4 kHz的區(qū)域。此實(shí)例中的高頻帶信號S30可通過使用具有3.5-7 kHz的通帶的 高通濾波器130來獲得。在此情況下,可能需要通過以16/7為因數(shù)向下取樣經(jīng)濾波信號 而將取樣速率減小為7kHz??深A(yù)期此操作會顯著減小對信號的進(jìn)一步處理操作的計(jì)算復(fù) 雜性,此操作將把通帶能量下移到0到3.5 kHz范圍內(nèi)而無信息損失。
在典型電話通信手機(jī)中, 一個或一個以上變換器(即,麥克風(fēng)和耳機(jī)或揚(yáng)聲器)缺 乏7-8 kHz的頻率范圍上的明顯響應(yīng)。在圖4b的實(shí)例中,寬頻帶語音信號S10的處于7 與8 kHz之間的部分不包含在經(jīng)編碼信號中。高通濾波器130的其它特定實(shí)例具有3.5-7.5 kHz禾n 3.5-8 kHz的通帶。
在一些實(shí)施方案中,如在圖4b的實(shí)例中在子頻帶之間提供重疊允許使用在重疊區(qū)上 具有平滑衰減的低通和/或高通濾波器。此類濾波器與具有較急劇或"磚墻式(brick-wall)" 響應(yīng)的濾波器相比,通常較易設(shè)計(jì),計(jì)算上不太復(fù)雜,且/或引起的延遲較少。具有急劇 轉(zhuǎn)變區(qū)的濾波器往往比具有平滑衰減的類似等級的濾波器具有更高的旁瓣(這可能引起 混疊)。具有急劇轉(zhuǎn)變區(qū)的濾波器還可能具有長脈沖響應(yīng),這可能引起振鈴假象。對于具 有一個或一個以上IIR濾波器的濾波器組實(shí)施方案,允許重疊區(qū)上的平滑衰減可使得能 夠使用極點(diǎn)較遠(yuǎn)離單位圓的濾波器(一個或多個),這對于確保穩(wěn)定的定點(diǎn)實(shí)施方案可能 較重要。
子頻帶重疊允許低頻帶與高頻帶的平滑混合,這可導(dǎo)致較少的可聽到的假象,減少 混疊,且/或使一個頻帶到另一頻帶的轉(zhuǎn)變不太明顯。此外,窄頻帶編碼器A120 (例如, 波形編碼器)的編碼效率可隨著頻率不斷增加而下降。舉例來說,可能在低位速率下, 尤其在存在背景噪聲的情況下減小窄頻帶編碼器的編碼質(zhì)量。在此類情況下,提供子頻 帶重疊可提高重疊區(qū)中復(fù)制的頻率分量的質(zhì)量。
此外,子頻帶重疊允許低頻帶與高頻帶的平滑混合,其可能導(dǎo)致較少的可聽到的假 象,減少混疊,且/或使一個頻帶到另一頻帶的轉(zhuǎn)變不太明顯。此特征對于窄頻帶編碼器 A120和高頻帶編碼器A200根據(jù)不同編碼方法操作的實(shí)施方案可能尤其合乎需要。舉例 來說,不同編碼技術(shù)可產(chǎn)生聽起來非常不同的信號。以密碼本索引形式編碼頻譜包絡(luò)的 編碼器可產(chǎn)生具有與改為編碼幅值譜的編碼器不同的聲音的信號。時域編碼器(例如, 脈沖-代碼調(diào)制或PCM編碼器)可產(chǎn)生具有與頻域編碼器不同的聲音的信號。以頻譜包 絡(luò)和相應(yīng)殘留信號的表示形式編碼信號的編碼器可產(chǎn)生具有與僅以頻譜包絡(luò)表示形式編 碼信號的編碼器不同的聲音的信號。將信號編碼為其波形的表示形式的編碼器可產(chǎn)生具 有與來自正弦編碼器的輸出不同的聲音的輸出。在此類情況下,使用具有急劇轉(zhuǎn)變區(qū)的 濾波器來界定非重疊子頻帶可能導(dǎo)致合成的寬頻帶信號中子頻帶之間的轉(zhuǎn)變較突然且感 覺上較明顯。
盡管子頻帶技術(shù)中通常使用具有互補(bǔ)重疊頻率響應(yīng)的QMF濾波器組,但此類濾波器 不適于本文描述的寬頻帶編碼實(shí)施方案中的至少一些實(shí)施方案。編碼器處的QMF濾波器 組經(jīng)配置以產(chǎn)生較大程度的混疊,所述混疊在解碼器處的相應(yīng)QMF濾波器組中被消去。 此配置可能不適于信號招致濾波器組之間的大量失真的應(yīng)用,因?yàn)槭д婵蓽p小混疊消去 性質(zhì)的效力。舉例來說,本文描述的應(yīng)用包含經(jīng)配置以在非常低的位速率下操作的編碼 實(shí)施方案。由于位速率非常低,所以經(jīng)解碼信號很可能與原始信號相比呈現(xiàn)為明顯失真, 使得QMF濾波器組的使用可導(dǎo)致未消去的混疊。使用QMF濾波器組的應(yīng)用通常具有較 高位速率(例如,對于AMR超過12kbps,且對于G722超過64kbps)。
另外,編碼器可經(jīng)配置以產(chǎn)生感覺上類似于原始信號但實(shí)際上顯著不同于原始信號 的合成信號。舉例來說,如本文所描述從窄頻帶殘留中導(dǎo)出高頻帶激勵的編碼器可產(chǎn)生 此信號,因?yàn)榻?jīng)解碼信號中可能完全不存在實(shí)際高頻帶殘留。在此類應(yīng)用中使用QMF濾 波器組可導(dǎo)致由未消去的混疊引起的較大程度的失真。
如果受影響子頻帶較窄,那么可減小QMF混疊引起的失真量,因?yàn)榛殳B的影響限于 與子頻帶寬度相等的帶寬。然而,對于本文描述的其中每一子頻帶包含寬頻帶帶寬的約 一半的實(shí)例,由未消去的混疊引起的失真可能影響信號的大部分。信號的質(zhì)量也可能受 上面發(fā)生未消去的混疊的頻帶的位置影響。舉例來說,寬頻帶語音信號中心附近(例如,
3與4kHz之間)產(chǎn)生的失真可能比信號邊緣附近(例如,6kHz以上)發(fā)生的失真有害 得多。
雖然QMF濾波器組的濾波器的響應(yīng)彼此嚴(yán)格相關(guān),但濾波器組A110和B120的低
頻帶和高頻帶路徑可經(jīng)配置以具有除兩個子頻帶的重疊外完全不相關(guān)的頻譜。我們將兩 個子頻帶的重疊定義為高頻帶濾波器的頻率響應(yīng)下降到-20 dB的點(diǎn)至低頻帶濾波器的頻 率響應(yīng)下降到-20dB的點(diǎn)的距離。在濾波器組A110和/或B120的各種實(shí)例中,此重疊范 圍為約200 Hz到約1 kHz。約400到約600 Hz的范圍可表示編碼效率與感知平滑度之間 的理想折衷。在上文提及的一個特定實(shí)例中,重疊在500 Hz附近。
可能需要實(shí)施濾波器組Al 12和/或B122來在若干階段執(zhí)行圖4a和4b中說明的操作。 舉例來說,圖4c展示濾波器組A112的實(shí)施方案A114的方塊圖,實(shí)施方案A114使用一 系列內(nèi)插、再取樣、抽選和其它操作來執(zhí)行功能等效的高通濾波和向下取樣操作。此類 實(shí)施方案可較易設(shè)計(jì)且/或可允許再使用邏輯和/或代碼的功能塊。舉例來說,可使用相同 功能塊來執(zhí)行如圖4c所示至14 kHz的抽選以及至7 kHz的抽選的操作??赏ㄟ^將信號 與函數(shù)—^或序列(-l)n相乘來實(shí)施頻譜反轉(zhuǎn)操作,所述序列(-l)n的值在+l與-1之間交替。 頻譜成形操作可實(shí)施為經(jīng)配置以使信號成形從而獲得所需的總體濾波器響應(yīng)的低通濾波 器。
注意到,由于頻譜反轉(zhuǎn)操作的緣故,高頻帶信號S30的頻譜反轉(zhuǎn)??上鄳?yīng)地配置編 碼器和相應(yīng)解碼器中的后續(xù)操作。舉例來說,本文描述的高頻帶激勵發(fā)生器A300可經(jīng)配 置以產(chǎn)生同樣具有頻譜反轉(zhuǎn)形式的高頻帶激勵信號S120。
圖4d展示濾波器組B122的實(shí)施方案B124的方塊圖,濾波器組B122使用一系列內(nèi) 插、再取樣和其它操作來執(zhí)行功能等效的向上取樣和高通濾波操作。濾波器組B124包含 高頻帶中的頻譜反轉(zhuǎn)操作,其使與例如編碼器的濾波器組(例如,濾波器組A114)中執(zhí) 行的類似的操作反轉(zhuǎn)。在此特定實(shí)例中,濾波器組B124還包含低頻帶和高頻帶中的陷波 濾波器,其削弱7100 Hz處的信號分量,但此類濾波器是任選的且不需要包含此類濾波 器。與此一同申請的代理人案號為050551的專利申請案"SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING"包含關(guān)于濾波器組AllO和B120的特 定實(shí)施方案的元件的響應(yīng)的額外描述和圖式,且此材料在此以引用的方式并入。
窄頻帶編碼器A120根據(jù)源-濾波器模型而實(shí)施,其將輸入語音信號編碼為(A) — 組描述濾波器的參數(shù)和(B)驅(qū)動所描述的濾波器產(chǎn)生輸入語音信號的合成復(fù)制物的激勵 信號。圖5a展示語音信號的頻譜包絡(luò)的實(shí)例。表現(xiàn)此頻譜包絡(luò)的特征的峰值表示聲域的諧振且稱為共振峰。大多數(shù)語音編碼器至少將此粗略譜結(jié)構(gòu)編碼為一組參數(shù)(例如,濾 波器系數(shù))。
圖5b展示如應(yīng)用于窄頻帶信號S20的頻譜包絡(luò)的編碼的基礎(chǔ)源-濾波器配置的實(shí)例。 分析模塊計(jì)算描述對應(yīng)于一段時間(通常20毫秒)內(nèi)的語音聲音的濾波器的一組參數(shù)。 根據(jù)那些濾波器參數(shù)配置的白化濾波器(也稱為分析或預(yù)測誤差濾波器)去除頻譜包絡(luò) 以對信號進(jìn)行頻譜整平。所得的白化信號(也稱為殘留)與原始語音信號相比,具有較 少能量且因此變化較小并且較易于編碼。由于對殘留信號編碼引起的誤差還可能較均勻 地散布在頻譜上。濾波器參數(shù)和殘留通常經(jīng)過量化以用于在信道上有效傳輸。在解碼器 處,根據(jù)濾波器參數(shù)配置的合成濾波器由基于殘留的信號激勵以產(chǎn)生原始語音聲音的合 成版本。合成濾波器通常經(jīng)配置以具有轉(zhuǎn)移函數(shù),所述轉(zhuǎn)移函數(shù)是白化濾波器的轉(zhuǎn)移函 數(shù)的反轉(zhuǎn)形式。
圖6展示窄頻帶編碼器A120的基礎(chǔ)實(shí)施方案A122的方塊圖。在此實(shí)例中,線性預(yù) 測編碼(LPC)分析模塊210將窄頻帶信號S20的頻譜包絡(luò)編碼為一組線性預(yù)測(LP) 系數(shù)(例如,全極濾波器的系數(shù)1/A(z))。分析模塊通常將輸入信號處理為一系列非重疊 幀,其中為每一幀計(jì)算一組新的系數(shù)。幀周期通常是可預(yù)期信號在本地靜止的周期;一 個常見實(shí)例為20毫秒(等效于8 kHz的取樣速率下160個樣本)。在一個實(shí)例中,LPC 分析模塊210經(jīng)配置以計(jì)算一組IO個LP濾波器系數(shù)以描述每一 20毫秒幀的共振峰結(jié)構(gòu)。 也可能實(shí)施分析模塊以將輸入信號處理為一系列重疊幀。
分析模塊可經(jīng)配置以直接分析每一幀的樣本,或者可首先根據(jù)窗口函數(shù)(例如,漢 明窗口)對樣本進(jìn)行加權(quán)。也可在大于幀的窗口 (例如,30毫秒窗口)上執(zhí)行分析。此 窗口可對稱(例如5-20-5,使得其包含緊接著20毫秒幀之前和之后的5毫秒)或不對稱 (例如10-20,使得其包含先前幀的最后10毫秒)。LPC分析模塊通常經(jīng)配置以使用 Levinson-Durbin遞歸式或Leroux-Gueguen算法計(jì)算LP濾波器系數(shù)。在另一實(shí)施方案中, 分析模塊可經(jīng)配置以計(jì)算每一幀的一組倒譜系數(shù)而不是一組LP濾波器系數(shù)。
編碼器A120的輸出速率可通過量化濾波器系數(shù)而顯著減小,且對復(fù)制質(zhì)量的影響相 對較小。線性預(yù)測濾波器系數(shù)難以有效量化,且通常映射為另一表示形式,例如線譜對 (LSP)或線譜頻率(LSF),以用于量化和/或熵編碼。在圖6的實(shí)例中,LP濾波器系數(shù) -LSF變換220將所述組LP濾波器系數(shù)變換為一組相應(yīng)的LSF。 LP濾波器系數(shù)的其它一 對一表示形式包含部分自相關(guān)系數(shù)、對數(shù)面積比值、導(dǎo)抗譜對(ISP)和導(dǎo)抗譜頻率(ISF), 其用于GSM (全球移動通信系統(tǒng))AMR-WB (自適應(yīng)多速寬頻帶)編譯碼器中。通常, 一組LP濾波器系數(shù)與一組相應(yīng)的LSF之間的變換是可逆的,但實(shí)施例還包含變換不可 在無誤差情況下可逆的編碼器A120實(shí)施方案。
量化器230經(jīng)配置以量化所述組窄頻帶LSF (或其它系數(shù)表示形式),且窄頻帶編碼 器A122經(jīng)配置以輸出此量化的結(jié)果作為窄頻帶濾波器參數(shù)S40。此量化器通常包含向量 量化器,其將輸入向量編碼為對于表或密碼本中的相應(yīng)向量條目的索引。
如圖6所示,窄頻帶編碼器A122還通過使窄頻帶信號S20通過根據(jù)所述組濾波器 系數(shù)配置的白化濾波器260 (也稱為分析或預(yù)測誤差濾波器)來產(chǎn)生殘留信號。在此特 定實(shí)例中,白化濾波器260實(shí)施為FIR濾波器,但也可使用IIR實(shí)施方案。此殘留信號 通常將含有窄頻帶濾波器參數(shù)S40中未表示的感覺上較重要的語音幀信息,例如與音調(diào) 有關(guān)的長期結(jié)構(gòu)。量化器270經(jīng)配置以計(jì)算此殘留信號的量化表示形式以作為經(jīng)編碼的 窄頻帶激勵信號S50輸出。此量化器通常包含向量量化器,其將輸入向量編碼為對于表 或密碼本中的相應(yīng)向量條目的索引?;蛘?,此量化器可經(jīng)配置以發(fā)送一個或一個以上參 數(shù),可在解碼器處從所述參數(shù)中動態(tài)地產(chǎn)生向量,而不是如稀疏密碼本方法中一樣從存 儲裝置中檢索向量。此方法用于例如代數(shù)CELP (密碼本激勵線性預(yù)測)的編碼方案和例 如3GPP2 (第三代合作伙伴關(guān)系2) EVRC (增強(qiáng)可變速率編譯碼器)的編譯碼器中。
需要窄頻帶編碼器A120根據(jù)將可用于相應(yīng)窄頻帶解碼器的相同濾波器參數(shù)值來產(chǎn) 生經(jīng)編碼窄頻帶激勵信號。以此方式,所得的經(jīng)編碼窄頻帶激勵信號可能已在某種程度 上考慮那些參數(shù)值的不理想性,例如量化誤差。因此,需要使用將在解碼器處可用的相 同系數(shù)值來配置白化濾波器。在如圖6所示的編碼器A122的基礎(chǔ)實(shí)例中,反轉(zhuǎn)量化器 240對窄頻帶編碼參數(shù)S40解量化,LSF-LP濾波器系數(shù)變換250將所得值映射回一組相 應(yīng)的LP濾波器系數(shù),且此組系數(shù)用于配置白化濾波器260以產(chǎn)生由量化器270量化的殘 留信號。
窄頻帶編碼器A120的一些實(shí)施方案經(jīng)配置以通過從一組密碼本向量中識別出與殘 留信號最佳匹配的一個向量來計(jì)算經(jīng)編碼窄頻帶激勵信號S50。然而,注意到,窄頻帶 編碼器A120也可經(jīng)實(shí)施以計(jì)算殘留信號的量化表示形式而不實(shí)際上產(chǎn)生殘留信號。舉例 來說,窄頻帶編碼器A120可經(jīng)配置以使用許多密碼本向量來產(chǎn)生相應(yīng)的合成信號(例如, 根據(jù)一組當(dāng)前濾波器參數(shù)),并選擇與感知加權(quán)域中和原始窄頻帶信號S20最佳匹配的所 產(chǎn)生信號相關(guān)聯(lián)的密碼本向量。
圖7展示窄頻帶解碼器B110的實(shí)施方案B112的方塊圖。反轉(zhuǎn)量化器310對窄頻帶 濾波器參數(shù)S40解量化(在此情況下,解量化為一組LSF),且LSF-LP濾波器系數(shù)變換
320將LSF變換為一組濾波器系數(shù)(例如,如上文參照窄頻帶編碼器A122的反轉(zhuǎn)量化器 240和變換250所描述)。反轉(zhuǎn)量化器340對窄頻帶殘留信號S40解量化以產(chǎn)生窄頻帶激 勵信號S80?;跒V波器系數(shù)和窄頻帶激勵信號S80,窄頻帶合成濾波器330合成窄頻帶 信號S90。換句話說,窄頻帶合成濾波器330經(jīng)配置以根據(jù)解量化濾波器系數(shù)對窄頻帶 激勵信號S80進(jìn)行頻譜成形,以產(chǎn)生窄頻帶信號S90。窄頻帶解碼器B112還將窄頻帶激 勵信號S80提供到高頻帶編碼器A200,高頻帶編碼器A200使用窄頻帶激勵信號S80來 導(dǎo)出高頻帶激勵信號S120,如本文所描述。在下文描述的一些實(shí)施方案中,窄頻帶解碼 器B110可經(jīng)配置以將與窄頻帶信號有關(guān)的額外信息(例如,頻譜傾斜、音調(diào)增益和滯后, 以及語音模式)提供到高頻帶解碼器B200。
窄頻帶編碼器A122和窄頻帶解碼器B112的系統(tǒng)是合成分析語音編譯碼器的基礎(chǔ)實(shí) 例。密碼本激勵線性預(yù)測(CELP)編碼是合成分析編碼的一個普遍系列,且此類編碼器 的實(shí)施方案可執(zhí)行殘留的波形編碼,其中包含例如從固定和自適應(yīng)密碼本中選擇條目的 操作、誤差最小化操作和/或感知加權(quán)操作。合成分析編碼的其它實(shí)施方案包含混合激勵 線性預(yù)測(MELP)、代數(shù)CELP (ACELP)、松弛CELP (RCELP)、規(guī)則脈沖激勵(RPE)、 多脈沖CELP (MPE)和向量和激勵線性預(yù)測(VSELP)編碼。相關(guān)編碼方法包含多頻帶 激勵(MBE)和原型波形內(nèi)插(PWI)編碼。標(biāo)準(zhǔn)合成分析語音編譯碼器的實(shí)例包含使 用殘留激勵線性預(yù)測(RELP)的ETSI (歐洲電信標(biāo)準(zhǔn)協(xié)會)GSM全速率編譯碼器(GSM 06.10)、 GSM增強(qiáng)全速率編譯碼器(ETSI-GSM 06.60)、 ITU (國際電信聯(lián)盟)標(biāo)準(zhǔn)11.8 kb/s G.729 Annex E編碼器、IS-136的IS (臨時標(biāo)準(zhǔn))641編譯碼器(時分多址方案)、 GSM自適應(yīng)多速率(GSM-AMR)編譯碼器,和4GV (第四代Vocoder )編譯碼器 (加州圣地亞哥市的高通公司(QUALCOMM Incorporated, San Diego, CA))。窄頻帶編碼 器A120和相應(yīng)的解碼器B110可根據(jù)這些技術(shù)中的任一者或任何其它語音編碼技術(shù)(已 知的或待開發(fā)的)實(shí)施,所述語音編碼技術(shù)將語音信號表示為(A) —組描述濾波器的參 數(shù)和(B)用于驅(qū)動所描述的濾波器復(fù)制語音信號的激勵信號。
即使在白化濾波器己從窄頻帶信號S20中去除粗略頻譜包絡(luò)之后,也可能保留相當(dāng) 大量的精細(xì)諧波結(jié)構(gòu)(尤其對于濁語音來說)。圖8a展示濁音信號(例如,元音)的殘 留信號(如可能由白化濾波器產(chǎn)生)的一個實(shí)例的頻譜曲線。此實(shí)例中可見的周期性結(jié) 構(gòu)與音調(diào)有關(guān),且同一說話者發(fā)出的不同濁音可能具有不同的共振峰結(jié)構(gòu)但具有類似的 音調(diào)結(jié)構(gòu)。圖8b展示此殘留信號的實(shí)例的時域曲線,其展示音調(diào)脈沖的時間序列。
可通過使用一個或一個以上參數(shù)值編碼音調(diào)結(jié)構(gòu)的特性來增加編碼效率和/或語音
質(zhì)量。音調(diào)結(jié)構(gòu)的一個重要特性是第一諧波的頻率(也稱為基頻),其通常在60到400Hz 范圍內(nèi)。此特性通常編碼為基頻的反轉(zhuǎn)形式,也稱為音調(diào)滯后(pitch lag)。音調(diào)滯后指 示一個音調(diào)周期中樣本的數(shù)目,且可編碼為一個或一個以上密碼本索引。來自男性說話 者的語音信號往往比來自女性說話者的語音信號具有更大的音調(diào)滯后。
與音調(diào)結(jié)構(gòu)有關(guān)的另一信號特性是周期性,其指示諧波結(jié)構(gòu)的強(qiáng)度,或換句話說, 信號為諧波或非諧波的程度。周期性的兩個典型指示符是零交叉和標(biāo)準(zhǔn)化自相關(guān)函數(shù) (NACF)。周期性也可由音調(diào)增益來指示,所述音調(diào)增益通常編碼為密碼本增益(例如, 量化自適應(yīng)密碼本增益)。
窄頻帶編碼器A120可包含經(jīng)配置以編碼窄頻帶信號S20的長期諧波結(jié)構(gòu)的一個或 一個以上模塊。如圖9所示,可使用的一個典型CELP范例包含開放式回路LPC分析模 塊,其編碼短期特性或粗略頻譜包絡(luò),之后是閉合式回路長期預(yù)測分析階段,所述階段 編碼精細(xì)音調(diào)或諧波結(jié)構(gòu)。短期特性編碼為濾波器系數(shù),且長期特性編碼為例如音調(diào)滯 后和音調(diào)增益的參數(shù)的值。舉例來說,窄頻帶編碼器A120可經(jīng)配置以便以包含一個或一 個以上密碼本索引(例如,固定密碼本索引和自適應(yīng)密碼本索引)和相應(yīng)增益值的形式 輸出經(jīng)編碼窄頻帶激勵信號S50。窄頻帶殘留信號的這種量化表示形式的計(jì)算(例如, 通過量化器270)可包含選擇這些索引和計(jì)算這些值。音調(diào)結(jié)構(gòu)的編碼還可包含內(nèi)插音 調(diào)原型波形,所述操作可包含計(jì)算連續(xù)音調(diào)脈沖之間的差。可針對對應(yīng)于清語音(其通 常類似于噪聲且未系統(tǒng)化)的幀禁用長期結(jié)構(gòu)的建模。
根據(jù)圖9所示的范例的窄頻帶解碼器B110的實(shí)施方案可經(jīng)配置以在長期結(jié)構(gòu)(音調(diào) 或諧波結(jié)構(gòu))已恢復(fù)之后將窄頻帶激勵信號S80輸出到高頻帶解碼器B200。舉例來說, 此解碼器可經(jīng)配置以輸出窄頻帶激勵信號S80作為經(jīng)編碼窄頻帶激勵信號S50的解量化 版本。當(dāng)然,也可能實(shí)施窄頻帶解碼器BllO,使得高頻帶解碼器B200執(zhí)行經(jīng)編碼窄頻 帶激勵信號S50的解量化以獲得窄頻帶激勵信號S80。
在根據(jù)圖9所示的范例的寬頻帶語音編碼器A100的實(shí)施方案中,高頻帶編碼器A200 可經(jīng)配置以接收由短期分析或白化濾波器產(chǎn)生的窄頻帶激勵信號。換句話說,窄頻帶編 碼器A120可經(jīng)配置以在編碼長期結(jié)構(gòu)之前將窄頻帶激勵信號輸出到高頻帶編碼器 A200。然而,高頻帶編碼器A200需要從窄頻帶信道接收將由高頻帶解碼器B200接收的 相同編碼信息,使得高頻帶編碼器A200產(chǎn)生的編碼參數(shù)可能已在某種程度上考慮所述信 息的不理想性。因此,可能優(yōu)選的是,高頻帶編碼器A200從待由寬頻帶語音編碼器A100 輸出的相同參數(shù)化和/或量化經(jīng)編碼窄頻帶激勵信號S50中重建窄頻帶激勵信號SSO。此
方法的一個潛在優(yōu)點(diǎn)是較準(zhǔn)確地計(jì)算下文描述的高頻帶增益因數(shù)S60b。
除了描述窄頻帶信號S20的短期和/或長期結(jié)構(gòu)的參數(shù)外,窄頻帶編碼器A120還可 產(chǎn)生與窄頻帶信號S20的其它特性有關(guān)的參數(shù)值。這些值(其可能經(jīng)適宜量化以由寬頻 帶語音編碼器A100輸出)可包含在窄頻帶濾波器參數(shù)S40中或單獨(dú)輸出。高頻帶編碼 器A200也可經(jīng)配置以根據(jù)這些額外參數(shù)中的一者或一者以上(例如,解量化之后)計(jì)算 高頻帶編碼參數(shù)S60。在寬頻帶語音解碼器B100處,高頻帶解碼器B200可經(jīng)配置以經(jīng) 由窄頻帶解碼器BllO (例如,解量化之后)接收參數(shù)值?;蛘?,高頻帶解碼器B200可 經(jīng)配置以直接接收(且可能用于解量化)參數(shù)值。
在額外窄頻帶編碼參數(shù)的一個實(shí)例中,窄頻帶編碼器A120產(chǎn)生每一幀的頻譜傾斜和 語音模式參數(shù)的值。頻譜傾斜與通帶上頻譜包絡(luò)的形狀有關(guān),且通常由量化第一反射系 數(shù)表示。對于大多數(shù)濁音,頻譜能量隨著頻率的不斷增加而減小,使得第一反射系數(shù)為 負(fù)且可接近-1。大多數(shù)清音具有平整的頻譜,從而使得第一反射系數(shù)接近零,或者在高 頻率下具有較多能量,從而使得第一反射系數(shù)為正且可接近+1。
語音模式(也稱為發(fā)聲模式)指示當(dāng)前幀表示濁語音還是清語音。此參數(shù)可具有二 進(jìn)制值,其基于周期性的一個或一個以上指標(biāo)(例如,零交叉、NACF、音調(diào)增益)禾口/ 或幀的聲音活動(例如,此指標(biāo)與閾值之間的關(guān)系)。在其它實(shí)施方案中,語音模式參數(shù) 具有一個或一個以上其它狀態(tài)以指示例如無聲或背景噪聲或無聲與濁語音之間的轉(zhuǎn)變的 模式。
高頻帶編碼器A200經(jīng)配置以根據(jù)源-濾波器模型來編碼高頻帶信號S30,其中此濾 波器的激勵是基于經(jīng)編碼窄頻帶激勵信號。圖10展示高頻帶編碼器A200的實(shí)施方案 A202的方塊圖,高頻帶編碼器A200經(jīng)配置以產(chǎn)生包含高頻帶濾波器參數(shù)S60a和高頻帶 增益因數(shù)S60b的高頻帶編碼參數(shù)S60流。高頻帶激勵發(fā)生器A300從經(jīng)編碼窄頻帶激勵 信號S50中導(dǎo)出高頻帶激勵信號S120。分析模塊A210產(chǎn)生描述高頻帶信號S30的頻譜 包絡(luò)的一組參數(shù)值。在此特定實(shí)例中,分析模塊A210經(jīng)配置以執(zhí)行LPC分析以便為高 頻帶信號S30的每一幀產(chǎn)生一組LP濾波器系數(shù)。線性預(yù)測濾波器系數(shù)-LSF變換410將 所述組LP濾波器系數(shù)變換為一組相應(yīng)的LSF。如上文參照分析模塊210和變換220所述, 分析模塊A210和/或變換410可經(jīng)配置以使用其它系數(shù)組(例如,倒譜系數(shù))和/或系數(shù) 表示形式(例如,ISP)。
量化器420經(jīng)配置以量化所述組高頻帶LSF (或其它系數(shù)表示形式,例如ISP),且 高頻帶編碼器A202經(jīng)配置以輸出此量化的結(jié)果作為高頻帶濾波器參數(shù)S60a。此量化器 通常包含向量量化器,其將輸入向量編碼為對于表或密碼本中的相應(yīng)向量條目的索引。
高頻帶編碼器A202還包含合成濾波器A220,其經(jīng)配置以根據(jù)分析模塊A210產(chǎn)生 的高頻帶激勵信號S120和經(jīng)編碼頻譜包絡(luò)(例如,所述組LP濾波器系數(shù))來產(chǎn)生合成 高頻帶信號S130。合成濾波器A220通常實(shí)施為IIR濾波器,但也可使用FIR實(shí)施方案。 在特定實(shí)例中,合成濾波器A220實(shí)施為六次線性自回歸濾波器。
高頻帶增益因數(shù)計(jì)算器A230計(jì)算原始高頻帶信號S30與合成高頻帶信號S130的電 平之間的一個或一個以上差,以指定幀的增益包絡(luò)。量化器430可實(shí)施為將輸入向量編 碼為對于表或密碼本中的相應(yīng)向量條目的索引的向量量化器,其量化指定增益包絡(luò)的值 (一或多個),且高頻帶編碼器A202經(jīng)配置以輸出此量化的結(jié)果作為高頻帶增益因數(shù) S60b。
在如圖IO所示的實(shí)施方案中,合成濾波器A220經(jīng)配置以從分析模塊A210接收濾 波器系數(shù)。高頻帶編碼器A202的替代實(shí)施方案包含反轉(zhuǎn)量化器和反轉(zhuǎn)變換,其經(jīng)配置以 從高頻帶濾波器參數(shù)S60a中解碼濾波器系數(shù),且在此情況下合成濾波器A220經(jīng)配置以 改為接收經(jīng)解碼濾波器系數(shù)。此替代配置可支持由高頻帶增益計(jì)算器A230較準(zhǔn)確地計(jì)算 增益包絡(luò)。
在一個特定實(shí)例中,分析模塊A210和高頻帶增益計(jì)算器A230分別每幀輸出一組六 個LSF和一組五個增益值,使得可僅用每幀十一個額外值來實(shí)現(xiàn)窄頻帶信號S20的寬頻 帶延伸。耳朵對于高頻率下的頻率誤差往往較不敏感,因而低LPC級的高頻帶編碼可產(chǎn) 生具有可與較高LPC級的窄頻帶編碼相比的感知質(zhì)量的信號。高頻帶編碼器A200的典 型實(shí)施方案可經(jīng)配置以每幀輸出8到12位用于頻譜包絡(luò)的高質(zhì)量重建,以及每幀輸出另 外8到12位用于時間包絡(luò)的高質(zhì)量重建。在另一特定實(shí)例中,分析模塊A210每幀輸出 一組八個LSF。
高頻帶編碼器A200的一些實(shí)施方案經(jīng)配置以通過以下方式產(chǎn)生高頻帶激勵信號 S120:產(chǎn)生具有高頻帶頻率分量的隨機(jī)噪聲信號,并根據(jù)窄頻帶信號S20、窄頻帶激勵 信號S80或高頻帶信號S30的時域包絡(luò)對噪聲信號進(jìn)行幅值調(diào)制。雖然這種基于噪聲的 方法對于清音可產(chǎn)生適當(dāng)結(jié)果,然而,其對于濁音可能不理想,濁音的殘留通常為諧波 且因此具有某種周期性結(jié)構(gòu)。
高頻帶激勵發(fā)生器A300經(jīng)配置以通過將窄頻帶激勵信號S80的頻譜延伸到高頻帶 頻率范圍中來產(chǎn)生高頻帶激勵信號S120。圖11展示高頻帶激勵發(fā)生器A300的實(shí)施方案 A302的方塊圖。反轉(zhuǎn)量化器450經(jīng)配置以解量化經(jīng)編碼窄頻帶激勵信號S50以產(chǎn)生窄頻
帶激勵信號S80。頻譜延伸器A400經(jīng)配置以基于窄頻帶激勵信號S80產(chǎn)生諧波延伸信號 S160。組合器470經(jīng)配置以將噪聲發(fā)生器480產(chǎn)生的隨機(jī)噪聲信號與包絡(luò)計(jì)算器460計(jì) 算的時域包絡(luò)組合以產(chǎn)生經(jīng)調(diào)制噪聲信號S170。組合器4卯經(jīng)配置以將諧波延伸信號S60 與經(jīng)調(diào)制噪聲信號S170混合以產(chǎn)生高頻帶激勵信號S120。
在一個實(shí)例中,頻譜延伸器A400經(jīng)配置以對窄頻帶激勵信號S80執(zhí)行頻譜折疊操 作(也稱為鏡射)以產(chǎn)生諧波延伸信號S160。頻譜折疊可由零塞入激勵信號S80執(zhí)行且 接著應(yīng)用高通濾波器來保留偽信號。在另一實(shí)例中,頻譜延伸器A400經(jīng)配置以通過將窄 頻帶激勵信號S80頻譜轉(zhuǎn)譯到高頻帶中(例如,經(jīng)由向上取樣,之后與恒定頻率余弦信 號相乘)來產(chǎn)生諧波延伸信號S160。
頻譜折疊和轉(zhuǎn)譯方法可產(chǎn)生諧波結(jié)構(gòu)在相位和/或頻率上與窄頻帶激勵信號S80的原 始諧波結(jié)構(gòu)不連續(xù)的頻譜延伸信號。舉例來說,此類方法可產(chǎn)生具有通常不位于基頻的 倍數(shù)處的峰值的信號,這可能在重建的語音信號中引起聲音微弱的假象。這些方法往往 還產(chǎn)生具有不自然較強(qiáng)音調(diào)特性的高頻率諧波。然而,因?yàn)镻STN信號可在8 kHz下取
樣但帶寬被限制為不大于3400 Hz,所以窄頻帶激勵信號S80的上部頻譜可能含有極少或 不含有能量,使得根據(jù)頻譜折疊或頻譜轉(zhuǎn)譯操作產(chǎn)生的延伸信號可具有3400 Hz以上的 頻譜缺陷。
產(chǎn)生諧波延伸信號S160的其它方法包含識別窄頻帶激勵信號S80的一個或一個以上 基頻,和根據(jù)所述信息產(chǎn)生諧音。舉例來說,激勵信號的諧波結(jié)構(gòu)可由基頻與幅值和相 位信息一起描述。高頻帶激勵發(fā)生器A300的另一實(shí)施方案基于基頻和幅值(例如,如由 音調(diào)滯后和音調(diào)增益指示)來產(chǎn)生諧波延伸信號S160。然而,除非諧波延伸信號與窄頻 帶激勵信號S80在相位上相干,否則所得的經(jīng)解碼語音的質(zhì)量可能不可接受。
可使用非線性函數(shù)來產(chǎn)生與窄頻帶激勵相位上相干并保持諧波結(jié)構(gòu)而沒有相位不連 續(xù)性的高頻帶激勵信號。非線性函數(shù)還可提供高頻率諧波之間的增加的噪聲電平,其往 往比通過例如頻譜折疊和頻譜轉(zhuǎn)譯的方法產(chǎn)生的音調(diào)高頻率諧波聽起來更為自然??捎?頻譜延伸器A400的各種實(shí)施方案應(yīng)用的典型無記憶非線性函數(shù)包含絕對值函數(shù)(也稱為 全波整流)、半波整流、平方、立方和削波。頻譜延伸器A400的其它實(shí)施方案可經(jīng)配置 以應(yīng)用具有記憶的非線性函數(shù)。
圖12是頻譜延伸器A400的實(shí)施方案A402的方塊圖,頻譜延伸器A400經(jīng)配置以應(yīng) 用非線性函數(shù)來延伸窄頻帶激勵信號S80的頻譜。向上取樣器510經(jīng)配置以對窄頻帶激 勵信號S80進(jìn)行向上取樣??赡苄枰獙π盘栠M(jìn)行充分向上取樣以使應(yīng)用非線性函數(shù)時的
混疊最小化。在一個特定實(shí)例中,向上取樣器510以8為因數(shù)對信號進(jìn)行向上取樣。向 上取樣器510可經(jīng)配置以通過對輸入信號進(jìn)行零塞入并對結(jié)果進(jìn)行低通濾波來執(zhí)行向上 取樣操作。非線性函數(shù)計(jì)算器520經(jīng)配置以將非線性函數(shù)應(yīng)用于向上取樣信號。對于頻 譜延伸而言,絕對值函數(shù)相對于其它非線性函數(shù)(例如,平方函數(shù))的一個潛在優(yōu)點(diǎn)是, 不需要能量標(biāo)準(zhǔn)化。在一些實(shí)施方案中,可通過剝離或清除每一樣本的符號位來有效地 應(yīng)用絕對值函數(shù)。非線性函數(shù)計(jì)算器520還可經(jīng)配置以執(zhí)行向上取樣信號或頻譜延伸信 號的幅值偏差。
向下取樣器530經(jīng)配置以對應(yīng)用非線性函數(shù)的頻譜延伸結(jié)果進(jìn)行向下取樣。向下取 樣器530可能需要執(zhí)行帶通濾波操作以在減小取樣速率(例如,以便減小或避免由于不 必要圖像引起的混疊或訛誤)之前選擇頻譜延伸信號的所需頻帶。向下取樣器530可能 還需要在一個以上階段減小取樣速率。
圖12a是展示頻譜延伸操作的一個實(shí)例中各點(diǎn)處的信號頻譜的圖,其中頻率標(biāo)度在 各曲線上相同。曲線(a)展示窄頻帶激勵信號S80的一個實(shí)例的頻譜。曲線(b)展示信號S80 已被以8為因數(shù)向上取樣之后的頻譜。曲線(c)展示應(yīng)用非線性函數(shù)之后的延伸頻譜的實(shí) 例。曲線(d)展示低通濾波之后的頻譜。在此實(shí)例中,通帶延伸到高頻帶信號S30的頻率 上限(例如,7kHz或8kHz)。
曲線(e)展示向下取樣的第一階段之后的頻譜,其中使取樣速率以4為因數(shù)減小以獲 得寬頻帶信號。曲線(f)展示進(jìn)行高通濾波操作以選擇延伸信號的高頻帶部分之后的頻譜, 且曲線(g)展示向下取樣的第二階段之后的頻譜,其中使取樣速率以2為因數(shù)減小。在一 個特定實(shí)例中,向下取樣器530通過使寬頻帶信號通過濾波器組A112 (或具有相同響應(yīng) 的其它結(jié)構(gòu)或例行程序)的高通濾波器130和向下取樣器140來執(zhí)行高通濾波和向下取 樣的第二階段,以產(chǎn)生具有高頻帶信號S30的頻率范圍和取樣速率的頻譜延伸信號。
如曲線(g)中可見,曲線(f)所示的高通信號的向下取樣促使其頻譜反轉(zhuǎn)。在此實(shí)例中, 向下取樣器530還經(jīng)配置以對信號執(zhí)行頻譜翻轉(zhuǎn)操作。曲線(h)展示應(yīng)用頻譜翻轉(zhuǎn)操作的 結(jié)果,所述頻譜翻轉(zhuǎn)操作可通過將信號與函數(shù)e一或序列(-l)n相乘來執(zhí)行,所述序列(-l)11 的值在+1與-1之間交替。此操作等效于在頻域中將信號的數(shù)字頻譜移位距離u。注意到, 還可通過以不同次序應(yīng)用向下取樣和頻譜翻轉(zhuǎn)操作來獲得相同結(jié)果。向上取樣和/或向下 取樣的操作還可經(jīng)配置以包含再取樣來獲得具有高頻帶信號S30的取樣速率(例如,7 kHz)的頻譜延伸信號。
如上文注意到,濾波器組A110和B120可經(jīng)實(shí)施使得窄頻帶和高頻帶信號S20、 S30
中的一者或兩者在濾波器組A110的輸出處具有頻譜反轉(zhuǎn)形式,以頻譜反轉(zhuǎn)形式被編碼和 解碼,并在寬頻帶語音信號S110中輸出之前在濾波器組B120處再次頻譜反轉(zhuǎn)。當(dāng)然, 在此情況下,將不需要如圖12a所示的頻譜翻轉(zhuǎn)操作,因?yàn)楦哳l帶激勵信號S120將也需 要具有頻譜反轉(zhuǎn)形式。
頻譜延伸器A402執(zhí)行的頻譜延伸操作的向上取樣和向下取樣的各個任務(wù)可以許多 不同方式配置和安排。舉例來說,圖12b是展示頻譜延伸操作的另一實(shí)例中各點(diǎn)處的信 號頻譜的圖,其中頻率標(biāo)度在各曲線上相同。曲線(a)展示窄頻帶激勵信號S80的一個實(shí) 例的頻譜。曲線(b)展示信號S80已被以2為因數(shù)向上取樣之后的頻譜。曲線(c)展示應(yīng)用 非線性函數(shù)之后的延伸頻譜的實(shí)例。在此情況下,接受較高頻率中可能發(fā)生的混疊。
曲線(d)展示頻譜反轉(zhuǎn)操作之后的頻譜。曲線(e)展示向下取樣的單一階段之后的頻 譜,其中使取樣速率以2為因數(shù)減小以獲得所需頻譜延伸信號。在此實(shí)例中,所述信號 采取頻譜反轉(zhuǎn)形式,且可用于處理采取此形式的高頻帶信號S30的高頻帶編碼器A200 的實(shí)施方案中。
非線性函數(shù)計(jì)算器520產(chǎn)生的頻譜延伸信號很可能隨著頻率增加而幅值明顯降低。 頻譜延伸器A402包含頻譜整平器540,其經(jīng)配置以對經(jīng)向下取樣信號執(zhí)行白化操作。頻 譜整平器540可經(jīng)配置以執(zhí)行固定白化操作或執(zhí)行自適應(yīng)白化操作。在自適應(yīng)白化的特 定實(shí)例中,頻譜整平器540包含LPC分析模塊,其經(jīng)配置以依據(jù)經(jīng)向下取樣信號計(jì)算 一組四個濾波器系數(shù);以及四次分析濾波器,其經(jīng)配置以根據(jù)那些系數(shù)對信號進(jìn)行白化。 頻譜延伸器A400的其它實(shí)施方案包含頻譜整平器540在向下取樣器530之前對頻譜延伸 信號操作的配置。
可實(shí)施高頻帶激勵發(fā)生器A300以輸出諧波延伸信號S160作為高頻帶激勵信號 S120。然而,在一些情況下,僅使用諧波延伸信號作為高頻帶激勵可能導(dǎo)致可聽到的假 象。語音的諧波結(jié)構(gòu)在高頻帶中通常不如低頻帶中明顯,且在高頻帶激勵信號中使用過 多諧波結(jié)構(gòu)可能導(dǎo)致嗡嗡聲。此假象在來自女性說話者的語音信號中可能尤其明顯。
實(shí)施例包含經(jīng)配置以將諧波延伸信號S160與噪聲信號混合的高頻帶激勵發(fā)生器 A300的實(shí)施方案。如圖11所示,高頻帶激勵發(fā)生器A302包含噪聲發(fā)生器480,其經(jīng)配 置以產(chǎn)生隨機(jī)噪聲信號。在一個實(shí)例中,噪聲發(fā)生器480經(jīng)配置以產(chǎn)生單位方差白色偽 隨機(jī)噪聲信號,但在其它實(shí)施方案中,噪聲信號不需要為白色的且可具有隨著頻率變化 的功率密度。噪聲發(fā)生器480可能需要經(jīng)配置以輸出噪聲信號作為確定性函數(shù)以便可在 解碼器處復(fù)制其狀態(tài)。舉例來說,噪聲發(fā)生器480可經(jīng)配置以輸出噪聲信號作為早先在
相同幀內(nèi)編碼的信息(例如,窄頻帶濾波器參數(shù)S40和/或經(jīng)編碼窄頻帶激勵信號S50) 的確定性函數(shù)。
在與諧波延伸信號S160混合之前,噪聲發(fā)生器480產(chǎn)生的隨機(jī)噪聲信號可經(jīng)幅值調(diào) 制以具有近似窄頻帶信號S20、高頻帶信號S30、窄頻帶激勵信號S80或諧波延伸信號 S160的隨時間能量分布的時域包絡(luò)。如圖11所示,高頻帶激勵發(fā)生器A302包含組合器 470,其經(jīng)配置以根據(jù)包絡(luò)計(jì)算器460計(jì)算的時域包絡(luò)對噪聲發(fā)生器480產(chǎn)生的噪聲信號 進(jìn)行幅值調(diào)制。舉例來說,組合器470可實(shí)施為乘法器,其經(jīng)配置以根據(jù)包絡(luò)計(jì)算器460 計(jì)算的時域包絡(luò)來縮放噪聲發(fā)生器480的輸出以產(chǎn)生經(jīng)調(diào)制噪聲信號S170。
如圖13的方塊圖所示,在高頻帶激勵發(fā)生器A302的實(shí)施方案A304中,包絡(luò)計(jì)算 器460經(jīng)配置以計(jì)算諧波延伸信號S160的包絡(luò)。如圖14的方塊圖所示,在高頻帶激勵 發(fā)生器A302的實(shí)施方案A306中,包絡(luò)計(jì)算器460經(jīng)配置以計(jì)算窄頻帶激勵信號S80的 包絡(luò)。高頻帶激勵發(fā)生器A302的另外的實(shí)施方案可以其它方式配置以根據(jù)窄頻帶音調(diào)脈 沖的位置及時向諧波延伸信號S160添加噪聲。
包絡(luò)計(jì)算器460可經(jīng)配置以作為一項(xiàng)包含一系列子任務(wù)的任務(wù)而執(zhí)行包絡(luò)計(jì)算。圖 15展示此任務(wù)的實(shí)例T100的流程圖。子任務(wù)T110計(jì)算包絡(luò)待建模的信號(例如,窄頻 帶激勵信號S80或諧波延伸信號S160)的幀的每一樣本的平方以產(chǎn)生平方值序列。子任 務(wù)T120對平方值序列執(zhí)行平滑操作。在一個實(shí)例中,子任務(wù)T120根據(jù)以下表達(dá)式向序 列應(yīng)用一次IIR低通濾波器
y(n) = ax(n) + (l-a)y(n-l), (1)
其中x是濾波器輸入,y是濾波器輸出,n是時域索引,且a是具有0.5與1之間的 值的平滑系數(shù)。平滑系數(shù)a的值可為固定的,或者在替代實(shí)施方案中,可根據(jù)輸入信號 中噪聲的指示而自適應(yīng),使得在無噪聲的情況下a較接近l,且在存在噪聲的情況下較接 近0.5。子任務(wù)T130將平方根函數(shù)應(yīng)用于經(jīng)平滑序列的每一樣本以產(chǎn)生時域包絡(luò)。
包絡(luò)計(jì)算器460的此實(shí)施方案可經(jīng)配置以按照串行和/或并行方式執(zhí)行任務(wù)T100的 各個子任務(wù)。在任務(wù)T100的另外的實(shí)施方案中,子任務(wù)T110之前可以是帶通操作,其 經(jīng)配置以選擇包絡(luò)待建模的信號的所需頻率部分,例如3-4kHz范圍。
組合器490經(jīng)配置以將諧波延伸信號S160與經(jīng)調(diào)制噪聲信號S170混合以產(chǎn)生高頻 帶激勵信號S120。組合器490的實(shí)施方案可經(jīng)配置(例如)以將高頻帶激勵信號S120 計(jì)算為諧波延伸信號S160與經(jīng)調(diào)制噪聲信號S170的和。組合器490的此實(shí)施方案可經(jīng) 配置以通過在求和之前向諧波延伸信號S160和/或向經(jīng)調(diào)制噪聲信號S170應(yīng)用加權(quán)因
數(shù),而將高頻帶激勵信號S120計(jì)算為加權(quán)總和??筛鶕?jù)一個或一個以上標(biāo)準(zhǔn)來計(jì)算每一 此類加權(quán)因數(shù),且所述加權(quán)因數(shù)可為固定值,或者在逐幀或逐子幀基礎(chǔ)上計(jì)算出的自適 應(yīng)值。
圖16展示組合器490的實(shí)施方案492的方塊圖,所述實(shí)施方案492經(jīng)配置以將高頻 帶激勵信號S120計(jì)算為諧波延伸信號S160與經(jīng)調(diào)制噪聲信號S170的加權(quán)總和。組合器 492經(jīng)配置以根據(jù)諧波加權(quán)因數(shù)S180加權(quán)諧波延伸信號S160,根據(jù)噪聲加權(quán)因數(shù)S190 加權(quán)經(jīng)調(diào)制噪聲信號S170,并輸出高頻帶激勵信號S120作為被加權(quán)信號的總和。在此 實(shí)例中,組合器492包含加權(quán)因數(shù)計(jì)算器550,其經(jīng)配置以計(jì)算諧波加權(quán)因數(shù)S180和噪 聲加權(quán)因數(shù)S190。
加權(quán)因數(shù)計(jì)算器550可經(jīng)配置以根據(jù)高頻帶激勵信號S120中諧波含量與噪聲含量的 所需比率來計(jì)算加權(quán)因數(shù)S180和S190。舉例來說,組合器492可能需要產(chǎn)生高頻帶激 勵信號S120以具有與高頻帶信號S30的諧波能量與噪聲能量比類似的諧波能量與噪聲能 量比。在加權(quán)因數(shù)計(jì)算器550的一些實(shí)施方案中,根據(jù)與窄頻帶信號S20或窄頻帶殘留 信號的周期性有關(guān)的一個或一個以上參數(shù)(例如,音調(diào)增益和/或語音模式)來計(jì)算加權(quán) 因數(shù)S180、 S190。加權(quán)因數(shù)計(jì)算器550的此實(shí)施方案可經(jīng)配置以向諧波加權(quán)因數(shù)S180 指派(例如)與音調(diào)增益成比例的值,且/或?qū)τ谇逭Z音信號比對于濁語音信號向噪聲加 權(quán)因數(shù)S190指派更高的值。
在其它實(shí)施方案中,加權(quán)因數(shù)計(jì)算器550經(jīng)配置以根據(jù)高頻帶信號S30的周期性的 指標(biāo)來計(jì)算諧波加權(quán)因數(shù)S180和/或噪聲加權(quán)因數(shù)S190的值。在一個此類實(shí)例中,加權(quán) 因數(shù)計(jì)算器550將諧波加權(quán)因數(shù)S180計(jì)算為高頻帶信號S30的當(dāng)前幀或子幀的自相關(guān)系 數(shù)的最大值,其中在包含一個音調(diào)滯后的延遲且不包含零樣本的延遲的搜索范圍上執(zhí)行 自相關(guān)。圖17展示以一個音調(diào)滯后的延遲為中心并具有不大于一個音調(diào)滯后的寬度的長 度為n個樣本的此搜索范圍的實(shí)例。
圖17還展示加權(quán)因數(shù)計(jì)算器550在若干階段計(jì)算高頻帶信號S30的周期性的指標(biāo)的 另一方法的實(shí)例。在第一階段,將當(dāng)前幀劃分為許多子幀,且針對每一子幀單獨(dú)識別自 相關(guān)系數(shù)為最大時的延遲。如上文所提及,在包含一個音調(diào)滯后的延遲且不包含零樣本 的延遲的搜索范圍上執(zhí)行自相關(guān)。
在第二階段,通過將相應(yīng)識別的延遲應(yīng)用于每一子幀,連接所得的子幀以建立最佳 延遲幀,并將諧波加權(quán)因數(shù)S180計(jì)算為原始幀與最佳延遲幀之間的相關(guān)系數(shù),來建立延 遲幀。在另一替代實(shí)施方案中,加權(quán)因數(shù)計(jì)算器550將諧波加權(quán)因數(shù)S180計(jì)算為第一階
段中針對每一子幀獲得的最大自相關(guān)系數(shù)的平均值。加權(quán)因數(shù)計(jì)算器550的實(shí)施方案還 可經(jīng)配置以縮放相關(guān)系數(shù),和/或?qū)⑵渑c另一值組合,以計(jì)算諧波加權(quán)因數(shù)S180的值。
加權(quán)因數(shù)計(jì)算器550可能需要僅在以其它方式指示幀存在周期性的情況下計(jì)算高頻 帶信號S30的周期性的指標(biāo)。舉例來說,加權(quán)因數(shù)計(jì)算器550可經(jīng)配置以根據(jù)當(dāng)前幀的 周期性的另一指示符(例如,音調(diào)增益)與閾值之間的關(guān)系來計(jì)算高頻帶信號S30的周 期性的指標(biāo)。在一個實(shí)例中,加權(quán)因數(shù)計(jì)算器550經(jīng)配置以僅當(dāng)幀的音調(diào)增益(例如, 窄頻帶殘留的自適應(yīng)密碼本增益)的值大于0.5 (或者,至少0.5)時才對高頻帶信號S30 執(zhí)行自相關(guān)運(yùn)算。在另一實(shí)例中,加權(quán)因數(shù)計(jì)算器550經(jīng)配置以僅針對具有特定語音模 式狀態(tài)的幀(例如,僅針對濁音信號)對高頻帶信號S30執(zhí)行自相關(guān)運(yùn)算。在此類情況 下,加權(quán)因數(shù)計(jì)算器550可經(jīng)配置以針對具有其它語音模式狀態(tài)和/或較小的音調(diào)增益值 的幀分派默認(rèn)加權(quán)因數(shù)。
實(shí)施例包含經(jīng)配置以根據(jù)不同于周期性或除周期性以外的特性來計(jì)算加權(quán)因數(shù)的加 權(quán)因數(shù)計(jì)算器550的另外的實(shí)施方案。舉例來說,此實(shí)施方案可經(jīng)配置以針對具有大音 調(diào)滯后的語音信號比針對具有小音調(diào)滯后的語音信號向噪聲增益因數(shù)S190分派更大的 值。加權(quán)因數(shù)計(jì)算器550的另一此類實(shí)施方案經(jīng)配置以根據(jù)處于基頻的倍數(shù)處的信號能 量相對于處于其它頻率分量處的信號能量的指標(biāo),來確定寬頻帶語音信號S10或高頻帶 信號S30的諧度的指標(biāo)。
寬頻帶語音編碼器A100的一些實(shí)施方案經(jīng)配置以基于本文描述的音調(diào)增益和/或周 期性或諧度的另一指標(biāo)來輸出周期性或諧度的指示(例如,指示幀為諧波還是非諧波的 1位旗標(biāo))。在一個實(shí)例中,相應(yīng)的寬頻帶語音解碼器B100使用此指示來配置例如加權(quán) 因數(shù)計(jì)算的操作。在另一實(shí)例中,此指示用于編碼器和/或解碼器處來計(jì)算語音模式參數(shù) 的值。
可能需要高頻帶激勵發(fā)生器A302產(chǎn)生高頻帶激勵信號S120,使得激勵信號的能量 大致不受加權(quán)因數(shù)S180和S190的特定值的影響。在此情況下,加權(quán)因數(shù)計(jì)算器550可 經(jīng)配置以計(jì)算諧波加權(quán)因數(shù)S180或噪聲加權(quán)因數(shù)S190的值(或從存儲裝置或高頻帶編 碼器A200的另一元件接收此值),并根據(jù)例如以下表達(dá)式導(dǎo)出另一加權(quán)因數(shù)的值-
(W諧波)2+(W噪聲)2:1, (2)
其中W諧波表示諧波加權(quán)因數(shù)S180,且W噪聲表示噪聲加權(quán)因數(shù)S190?;蛘?,加權(quán)因 數(shù)計(jì)算器550可經(jīng)配置以根據(jù)當(dāng)前幀或子幀的周期性指標(biāo)的值從多對加權(quán)因數(shù)S180、 S190中選出相應(yīng)一者,其中所述對經(jīng)預(yù)先計(jì)算以滿足例如表達(dá)式(2)的恒定能量比。
對于遵循表達(dá)式(2)的加權(quán)因數(shù)計(jì)算器550的實(shí)施方案,諧波加權(quán)因數(shù)S180的典型值 在約0.7到約l.O范圍內(nèi),且噪聲加權(quán)因數(shù)S190的典型值在約0.1到約0.7范圍內(nèi)。加權(quán) 因數(shù)計(jì)算器550的其它實(shí)施方案可經(jīng)配置以根據(jù)一種形式的表達(dá)式(2)來操作,所述形 式的表達(dá)式(2)依據(jù)諧波延伸信號S160與經(jīng)調(diào)制噪聲信號S170之間的所需基線加權(quán)進(jìn) 行修改。
當(dāng)已使用稀疏密碼本(條目大部分為零值的密碼本)來計(jì)算殘留的量化表示形式時, 合成語音信號中可能發(fā)生假象。尤其當(dāng)以低位速率編碼窄頻帶信號時,會發(fā)生密碼本稀 疏。密碼本稀疏引起的假象通常在時間上是準(zhǔn)周期性的,且主要在3 kHz以上發(fā)生。因 為人耳在較高頻率下具有較好的時間分辨能力,所以這些假象在高頻帶中可能較明顯。
實(shí)施例包含經(jīng)配置以執(zhí)行抗稀疏濾波的高頻帶激勵發(fā)生器A300的實(shí)施方案。圖18 展示高頻帶激勵發(fā)生器A302的實(shí)施方案A312的方塊圖,所述實(shí)施方案A312包含抗稀 疏濾波器600,其經(jīng)配置以對反轉(zhuǎn)量化器450產(chǎn)生的經(jīng)解量化窄頻帶激勵信號進(jìn)行濾波。 圖19展示高頻帶激勵發(fā)生器A302的實(shí)施方案A314的方塊圖,所述實(shí)施方案A314包含 抗稀疏濾波器600,其經(jīng)配置以對頻譜延伸器A400產(chǎn)生的頻譜延伸信號進(jìn)行濾波。圖20 展示高頻帶激勵發(fā)生器A302的實(shí)施方案A316的方塊圖,所述實(shí)施方案A316包含抗稀 疏濾波器600,其經(jīng)配置以對組合器4卯的輸出進(jìn)行濾波以產(chǎn)生高頻帶激勵信號S120。 當(dāng)然,預(yù)期并在此明確地揭示將實(shí)施方案A304和A306的任一者的特征與實(shí)施方案 A312、 A314和A316的任一者的特征組合的高頻帶激勵發(fā)生器A300的實(shí)施方案??瓜?疏濾波器600也可配置在頻譜延伸器A400內(nèi)例如在頻譜延伸器A402中的元件510、 520、530和540的任一者之后。特別注意到,抗稀疏濾波器600也可用于頻譜延伸器A400 的執(zhí)行頻譜折疊、頻譜轉(zhuǎn)譯或諧波延伸的實(shí)施方案。
抗稀疏濾波器600可經(jīng)配置以改變其輸入信號的相位。舉例來說,抗稀疏濾波器600 可能需要經(jīng)配置和安排,使得高頻帶激勵信號S120的相位隨著時間隨機(jī)化或其它方式更 為均勻地分布??赡苓€需要抗稀疏濾波器600的響應(yīng)為頻譜整平的,使得經(jīng)濾波信號的 幅值頻譜不會有相當(dāng)大的改變。在一個實(shí)例中,抗稀疏濾波器600根據(jù)以下表達(dá)式實(shí)施 為具有轉(zhuǎn)移函數(shù)的全通濾波器
,=Z^±4.^±4。 (3) 1-0.7z_4 l + 0.6z—6
此濾波器的一個作用可以是將輸入信號的能量散布開使得其不再僅集中于幾個樣本中。
密碼本稀疏引起的假象通常對于其中殘留包含較少音調(diào)信息的類似噪聲的信號較明
顯,且對于背景噪聲中的語音也較明顯。稀疏在激勵具有長期結(jié)構(gòu)的情況下通常引起較 少假象,且事實(shí)上相位修改可引起濁音信號中的噪聲。因此,可能需要配置抗稀疏濾波 器600以對清音信號進(jìn)行濾波并在不作出改變的情況下使至少一些濁音信號通過。清音 信號的特征在于低音調(diào)增益(例如,量化窄頻帶自適應(yīng)密碼本增益)和接近零或?yàn)檎?頻譜傾斜(例如,量化第一反射系數(shù)),從而指示整平或隨著頻率的不斷增加而向上傾斜 的頻譜包絡(luò)??瓜∈铻V波器600的典型實(shí)施方案經(jīng)配置以對清音(例如,如頻譜傾斜的 值所指示)進(jìn)行濾波,當(dāng)音調(diào)增益低于閾值(或者,不大于閾值)時對濁音進(jìn)行濾波, 且否則在不作出改變的情況下使信號通過。
抗稀疏濾波器600的另外的實(shí)施方案包含兩個或兩個以上濾波器,其經(jīng)配置以具有 不同的最大相位修改角(例如,高達(dá)180度)。在此情況下,抗稀疏濾波器600可經(jīng)配置 以根據(jù)音調(diào)增益(例如,量化自適應(yīng)密碼本或LTP增益)的值在這些組成濾波器中進(jìn)行 選擇,以便將較大的最大相位修改角用于具有較低音調(diào)增益值的幀??瓜∈铻V波器600 的實(shí)施方案還可包含不同的組成濾波器,其經(jīng)配置以在頻譜的或多或少的部分上修改相 位,以便將經(jīng)配置以在輸入信號的較寬頻率范圍上修改相位的濾波器用于具有較低音調(diào) 增益值的幀。
為了準(zhǔn)確地復(fù)制經(jīng)編碼語音信號,可能需要使合成寬頻帶語音信號S100的高頻帶與 窄頻帶部分的電平之間的比率類似于原始寬頻帶語音信號S10中的所述比率。除了高頻 帶編碼參數(shù)S60a表示的頻譜包絡(luò)外,高頻帶編碼器A200還可經(jīng)配置以通過指定時間或 增益包絡(luò)來表征高頻帶信號S30。如圖10所示,高頻帶編碼器A202包含高頻帶增益因 數(shù)計(jì)算器A230,其經(jīng)配置和安排以根據(jù)高頻帶信號S30與合成高頻帶信號S130之間的 關(guān)系(例如,所述兩個信號在幀或其某一部分上的能量之間的差或比率)來計(jì)算一個或 一個以上增益因數(shù)。在高頻帶編碼器A202的其它實(shí)施方案中,高頻帶增益計(jì)算器A230 可同樣地配置但改為經(jīng)安排以根據(jù)高頻帶信號S30與窄頻帶激勵信號S80或高頻帶激勵 信號S120之間的這種時間變化關(guān)系來計(jì)算增益包絡(luò)。
窄頻帶激勵信號S80和高頻帶信號S30的時間包絡(luò)很可能類似。因此,編碼基于高 頻帶信號S30與窄頻帶激勵信號S80 (或從中導(dǎo)出的信號,例如高頻帶激勵信號S120或 合成高頻帶信號S130)之間的關(guān)系的增益包絡(luò)通常將比編碼僅基于高頻帶信號S30的增 益包絡(luò)有效。在典型實(shí)施方案中,高頻帶編碼器A202經(jīng)配置以輸出為每一幀指定5個增 益因數(shù)的8到12位的量化索引。
高頻帶增益因數(shù)計(jì)算器A230可經(jīng)配置以作為一項(xiàng)包含一個或一個以上系列的子任
務(wù)的任務(wù)而執(zhí)行增益因數(shù)計(jì)算。圖21展示根據(jù)高頻帶信號S30與合成高頻帶信號S130 的相對能量計(jì)算相應(yīng)子幀的增益值的任務(wù)的實(shí)例T200的流程圖。任務(wù)220a和220b計(jì)算 各個信號的相應(yīng)子幀的能量。舉例來說,任務(wù)220a和220b可經(jīng)配置以將能量計(jì)算為各 個子幀的樣本的平方的和。任務(wù)T230將子幀的增益因數(shù)計(jì)算為那些能量的比率的平方 根。在此實(shí)例中,任務(wù)T230將增益因數(shù)計(jì)算為子幀上高頻帶信號S30的能量與合成高頻 帶信號S130的能量的比率的平方根。
高頻帶增益因數(shù)計(jì)算器A230可能需要經(jīng)配置以根據(jù)窗口函數(shù)來計(jì)算子幀能量。圖 22展示增益因數(shù)計(jì)算任務(wù)T200的此實(shí)施方案T210的流程圖。任務(wù)T215a將窗口函數(shù)應(yīng) 用于高頻帶信號S30,且任務(wù)T2I5b將相同窗口函數(shù)應(yīng)用于合成高頻帶信號S130。任務(wù) 220a和220b的實(shí)施方案222a和222b計(jì)算各自窗口的能量,且任務(wù)T230將子幀的增益 因數(shù)計(jì)算為能量的比率的平方根。
可能需要應(yīng)用與鄰近子幀重疊的窗口函數(shù)。舉例來說,可以重疊-相加方式應(yīng)用的產(chǎn) 生增益因數(shù)的窗口函數(shù)可幫助減小或避免子幀之間的不連續(xù)性。在一個實(shí)例中,高頻帶 增益因數(shù)計(jì)算器A230經(jīng)配置以應(yīng)用如圖23a所示的梯形窗口函數(shù),其中窗口與兩個鄰近 子幀的每一者重疊一毫秒。圖23b展示將此窗口函數(shù)應(yīng)用于20毫秒幀的五個子幀的每一 者。高頻帶增益因數(shù)計(jì)算器A230的其它實(shí)施方案可經(jīng)配置以應(yīng)用具有不同重疊周期和/ 或不同窗口形狀(例如,矩形、漢明)(其可對稱或不對稱)的窗口函數(shù)。高頻帶增益因 數(shù)計(jì)算器A230的實(shí)施方案還可能經(jīng)配置以將不同窗口函數(shù)應(yīng)用于幀內(nèi)的不同子幀和/或 包含具有不同長度的子幀的幀。
提供以下值(沒有限制)作為特定實(shí)施方案的實(shí)例。針對這些情況假定一個20毫秒 的幀,但可使用任何其它持續(xù)時間。對于以7 kHz取樣的高頻帶信號,每一幀具有140 個樣本。如果將此幀劃分為具有相等長度的五個子幀,那么每一子幀將具有28個樣本, 且如圖23a所示的窗口將為42個樣本寬。對于以8kHz取樣的高頻帶信號,每一幀具有 160個樣本。如果此幀劃分為具有相等長度的五個子幀,那么每一子幀將具有32個樣本, 且如圖23a所示的窗口將為48個樣本寬。在其它實(shí)施方案中,可使用具有任何寬度的子 幀,且甚至可能使高頻帶增益計(jì)算器A230的實(shí)施方案經(jīng)配置以針對幀的每一樣本產(chǎn)生不 同的增益因數(shù)。
圖24展示高頻帶解碼器B200的實(shí)施方案B202的方塊圖。高頻帶解碼器B202包含 高頻帶激勵發(fā)生器B300,其經(jīng)配置以基于窄頻帶激勵信號S80產(chǎn)生高頻帶激勵信號 S120。視特定系統(tǒng)設(shè)計(jì)選擇而定,可根據(jù)本文描述的高頻帶激勵發(fā)生器A300的實(shí)施方
案的任一者來實(shí)施高頻帶激勵發(fā)生器B300。通常,需要將高頻帶激勵發(fā)生器B300實(shí)施 為具有與特定編碼系統(tǒng)的高頻帶編碼器的高頻帶激勵發(fā)生器相同的響應(yīng)。然而,因?yàn)檎?頻帶解碼器B110通常將執(zhí)行經(jīng)編碼窄頻帶激勵信號S50的解量化,所以在大多數(shù)情況下, 高頻帶激勵發(fā)生器B300可經(jīng)實(shí)施以從窄頻帶解碼器B110接收窄頻帶激勵信號S80,而 不需要包含經(jīng)配置以對經(jīng)編碼窄頻帶激勵信號S50解量化的反轉(zhuǎn)量化器。窄頻帶解碼器 B110也可能經(jīng)實(shí)施以包含抗稀疏濾波器600的實(shí)例,其經(jīng)配置以在將經(jīng)解量化的窄頻帶 激勵信號輸入到例如濾波器330的窄頻帶合成濾波器之前對所述信號進(jìn)行濾波。
反轉(zhuǎn)量化器560經(jīng)配置以對高頻帶濾波器參數(shù)S60a (在此實(shí)例中為一組LSF)解量 化,且LSF-LP濾波器系數(shù)變換570經(jīng)配置以將LSF變換為一組濾波器系數(shù)(例如,如 上文參照窄頻帶編碼器A122的反轉(zhuǎn)量化器240和變換250所描述)。在其它實(shí)施方案中, 如上文所提及,可使用不同系數(shù)組(例如,倒譜系數(shù))和/或系數(shù)表示形式(例如,ISP)。 高頻帶合成濾波器B200經(jīng)配置以根據(jù)高頻帶激勵信號S120和所述組濾波器系數(shù)產(chǎn)生合 成高頻帶信號。對于其中高頻帶編碼器包含合成濾波器的系統(tǒng)(例如,如上述編碼器A202 的實(shí)例中),可能需要將高頻帶合成濾波器B200實(shí)施為具有與所述合成濾波器相同的響 應(yīng)(例如,相同轉(zhuǎn)移函數(shù))。
高頻帶解碼器B202還包含經(jīng)配置以對高頻帶增益因數(shù)S60b解量化的反轉(zhuǎn)量化器 580,和經(jīng)配置和安排以將經(jīng)解量化的增益因數(shù)應(yīng)用于合成高頻帶信號以產(chǎn)生高頻帶信號 S100的增益控制元件590 (例如,乘法器或放大器)。對于其中幀的增益包絡(luò)由一個以上 增益因數(shù)指定的情況,增益控制元件590可包含經(jīng)配置以可能根據(jù)窗口函數(shù)將增益因數(shù) 應(yīng)用于各個子幀的邏輯,所述窗口函數(shù)可與由相應(yīng)高頻帶編碼器的增益計(jì)算器(例如, 高頻帶增益計(jì)算器A230)應(yīng)用的窗口函數(shù)相同或不同。在高頻帶解碼器B202的其它實(shí) 施方案中,增益控制元件590經(jīng)類似地配置但經(jīng)安排以改為將經(jīng)解量化的增益因數(shù)應(yīng)用 于窄頻帶激勵信號S80或應(yīng)用于高頻帶激勵信號S120。
如上文所提及,可能需要在高頻帶編碼器與高頻帶解碼器中獲得相同狀態(tài)(例如, 通過在編碼期間使用經(jīng)解量化值)。因此,可能需要在根據(jù)此實(shí)施方案的編碼系統(tǒng)中確保 高頻帶激勵發(fā)生器A300和B300中的相應(yīng)噪聲發(fā)生器具有相同狀態(tài)。舉例來說,此實(shí)施 方案的高頻帶激勵發(fā)生器A300和B300可經(jīng)配置而使得噪聲發(fā)生器的狀態(tài)是相同幀內(nèi)已 編碼的信息(例如,窄頻帶濾波器參數(shù)S40或其一部分,和/或經(jīng)編碼窄頻帶激勵信號S50 或其一部分)的確定性函數(shù)。
本文描述的元件的量化器中的一者或一者以上(例如,量化器230、 420或430)可
經(jīng)配置以執(zhí)行分類向量量化。舉例來說,此量化器可經(jīng)配置以基于窄頻帶信道中和/或高 頻帶信道中的相同幀內(nèi)已編碼的信息從一組密碼本中選出一個密碼本。此技術(shù)通常以存 儲額外的密碼本為代價(jià)提供增加的編碼效率。
如上文參看例如圖8和9所論述,在從窄頻帶語音信號S20中去除粗略頻譜包絡(luò)之 后,相當(dāng)大量的周期性結(jié)構(gòu)可能保留在殘留信號中。舉例來說,殘留信號可隨時間而含 有粗略周期性脈沖或尖峰信號序列。此結(jié)構(gòu)(通常與音調(diào)有關(guān))尤其有可能發(fā)生在濁音 語音信號中。窄頻帶殘留信號的量化表示形式的計(jì)算可包含根據(jù)由(例如) 一個或一個 以上密碼本表示的長期周期性的模型來編碼此音調(diào)結(jié)構(gòu)。
實(shí)際殘留信號的音調(diào)結(jié)構(gòu)可能不與周期性模型完全匹配。舉例來說,殘留信號可能 包含音調(diào)脈沖的位置規(guī)則性的較小抖動,使得幀中連續(xù)音調(diào)脈沖之間的距離不完全相等 且所述結(jié)構(gòu)并非相當(dāng)規(guī)則。這些不規(guī)則性往往會降低編碼效率。
窄頻帶編碼器A120的一些實(shí)施方案經(jīng)配置以通過在量化之前或期間將自適應(yīng)時間 偏差應(yīng)用于殘留,或通過以其它方式在經(jīng)編碼激勵信號中包含自適應(yīng)時間偏差,來執(zhí)行 音調(diào)結(jié)構(gòu)的規(guī)則化。舉例來說,此編碼器可經(jīng)配置以選擇或以其它方式計(jì)算時間偏差的 程度(例如,根據(jù)一個或一個以上感知加權(quán)和/或誤差最小化標(biāo)準(zhǔn)),使得所得的激勵信 號與長期周期性的模型最佳擬和。音調(diào)結(jié)構(gòu)的規(guī)則化由稱為松弛代碼激勵線性預(yù)測 (RCELP)編碼器的CELP編碼器子組執(zhí)行。
RCELP編碼器通常經(jīng)配置以執(zhí)行時間偏差作為自適應(yīng)時移。此時移可為負(fù)幾毫秒到 正幾毫秒范圍的延遲,且其通常平滑地變化以避免可聽到的不連續(xù)性。在一些實(shí)施方案 中,此編碼器經(jīng)配置以用分段方式應(yīng)用規(guī)則化,其中每一幀或子幀偏差相應(yīng)的固定時移。 在其它實(shí)施方案中,編碼器經(jīng)配置以應(yīng)用規(guī)則化作為連續(xù)偏差函數(shù),使得幀或子幀根據(jù) 音調(diào)輪廓(也稱為音調(diào)軌跡)而偏差。在一些情況下(例如,如第2004/0098255號美國 專利申請公開案中所描述),編碼器經(jīng)配置以通過將偏移應(yīng)用于用于計(jì)算經(jīng)編碼激勵信號 的感知加權(quán)輸入信號而在經(jīng)編碼激勵信號中包含時間偏差。
編碼器計(jì)算規(guī)則化和量化的經(jīng)編碼激勵信號,且解碼器對經(jīng)編碼激勵信號解量化以
獲得用于合成經(jīng)解碼語音信號的激勵信號。經(jīng)解碼輸出信號因此展現(xiàn)出與通過規(guī)則化而 包含在經(jīng)編碼激勵信號中的延遲相同的變化的延遲。通常,不將任何指定規(guī)則化量的信 息傳輸?shù)浇獯a器。
規(guī)則化往往使殘留信號較易編碼,這改進(jìn)了來自長期預(yù)測器的編碼增益且因此推進(jìn) 了總體編碼效率,而通常不會產(chǎn)生假象??赡苄枰獌H對濁音幀執(zhí)行規(guī)則化。舉例來說,
窄頻帶編碼器A124可經(jīng)配置以僅偏移那些具有長期結(jié)構(gòu)(例如,濁音信號)的幀或子幀。 甚至可能需要僅對包含音調(diào)脈沖能量的子幀執(zhí)行規(guī)則化。第5,704,003號美國專利(Kleijti 等人)和第6,879,955號美國專利(Rao)和第2004/0098255號美國專利申請公開案(Kovesi 等人)中描述了 RCELP編碼的各種實(shí)施方案。RCELP編碼器的現(xiàn)有實(shí)施方案包含如電 信工業(yè)協(xié)會(TIA) IS-127中所描述的增強(qiáng)可變速率編譯碼器(EVRC),和第三代合作 伙伴關(guān)系計(jì)劃2 (3GPP2)可選模式聲碼器(SMV)。
不幸的是,規(guī)則化對于其中從經(jīng)編碼窄頻帶激勵信號導(dǎo)出高頻帶激勵的寬頻帶語音 編碼器(例如,包含寬頻帶語音編碼器A100和寬頻帶語音解碼器B100的系統(tǒng))可能導(dǎo) 致若干問題。由于高頻帶激勵信號相對于時間偏差信號的偏轉(zhuǎn),所以高頻帶激勵信號通 常將具有與原始高頻帶語音信號的時間表不同的時間表。換句話說,高頻帶激勵信號將
不再與原始高頻帶語音信號同步。
偏差高頻帶激勵信號與原始高頻帶語音信號之間的時間上的不對準(zhǔn)可能引起若干問 題。舉例來說,偏差高頻帶激勵信號可能不再為根據(jù)從原始高頻帶語音信號中提取的濾 波器參數(shù)配置的合成濾波器提供適宜的源激勵。因此,合成高頻帶信號可含有減小經(jīng)解 碼寬頻帶語音信號的感知質(zhì)量的可聽到的假象。
時間上的不對準(zhǔn)還可能引起增益包絡(luò)編碼的低效率。如上文所提及,窄頻帶激勵信 號S80與高頻帶信號S30的時間包絡(luò)之間很可能存在相關(guān)。通過根據(jù)這兩個時間包絡(luò)之 間的關(guān)系編碼高頻帶信號的增益包絡(luò),與直接編碼增益包絡(luò)相比可實(shí)現(xiàn)編碼效率的提高。 然而,當(dāng)經(jīng)編碼窄頻帶激勵信號規(guī)則化時,此相關(guān)可能削弱。窄頻帶激勵信號S80與高 頻帶信號S30之間的時間上的不對準(zhǔn)可導(dǎo)致高頻帶增益因數(shù)S60b中出現(xiàn)波動,且編碼效 率可能降低。
實(shí)施例包含根據(jù)相應(yīng)經(jīng)編碼窄頻帶激勵信號中包含的時間偏差對高頻帶語音信號執(zhí) 行時間偏差的寬頻帶語音編碼方法。此類方法的潛在優(yōu)點(diǎn)包含改進(jìn)經(jīng)解碼寬頻帶語音信 號的質(zhì)量和/或改進(jìn)編碼高頻帶增益包絡(luò)的效率。
圖25展示寬頻帶語音編碼器A100的實(shí)施方案AD10的方塊圖。編碼器AD10包含 窄頻帶編碼器A120的實(shí)施方案A124,所述實(shí)施方案A124經(jīng)配置以在計(jì)算經(jīng)編碼窄頻 帶激勵信號S50期間執(zhí)行規(guī)則化。舉例來說,窄頻帶編碼器A124可根據(jù)上文論述的 RCELP實(shí)施方案中的一者或一者以上配置。
窄頻帶編碼器A124還經(jīng)配置以輸出指定所應(yīng)用的時間偏差的程度的規(guī)則化數(shù)據(jù)信 號SD10。對于窄頻帶編碼器A124經(jīng)配置以將固定時移應(yīng)用于每一幀或子幀的各種情況,
規(guī)則化數(shù)據(jù)信號SD10可包含一系列值,其以樣本、毫秒或某一其它時間增量為單位將 每一時移量指示為整數(shù)或非整數(shù)值。對于窄頻帶編碼器A124經(jīng)配置以用其它方式修改幀 或其它樣本序列的時間標(biāo)度(例如,通過壓縮一個部分并擴(kuò)展另一部分)的情況,規(guī)則 化信息信號SD10可包含對修改的相應(yīng)描述,例如一組函數(shù)參數(shù)。在一個特定實(shí)例中, 窄頻帶編碼器A124經(jīng)配置以將幀劃分為三個子幀并計(jì)算每一子幀的固定時移,使得規(guī)則 化數(shù)據(jù)信號SD10指示經(jīng)編碼窄頻帶信號的每一規(guī)則化幀的三個時移量。
寬頻帶語音編碼器AD10包含延遲線D120,其經(jīng)配置以根據(jù)由輸入信號指示的延遲 量來推進(jìn)或阻滯高頻帶語音信號S30的若干部分,從而產(chǎn)生時間偏差高頻帶語音信號 S30a。在圖25所示的實(shí)例中,延遲線D120經(jīng)配置以根據(jù)由規(guī)則化數(shù)據(jù)信號SD10指示 的偏差來對高頻帶語音信號S30執(zhí)行時間偏差。以此方式,經(jīng)編碼窄頻帶激勵信號S50 中包含的相同時間偏差量也在分析之前應(yīng)用于高頻帶語音信號S30的相應(yīng)部分。盡管此 實(shí)例將延遲線D120展示為高頻帶編碼器A200的單獨(dú)元件,但在其它實(shí)施方案中,延遲 線D120配置為高頻帶編碼器的一部分。
高頻帶編碼器A200的另外的實(shí)施方案可經(jīng)配置以執(zhí)行未偏差高頻帶語音信號S30 的頻譜分析(例如,LPC分析),并在計(jì)算高頻帶增益參數(shù)S60b之前執(zhí)行高頻帶語音信 號S30的時間偏差。此編碼器可包含(例如)經(jīng)配置以執(zhí)行時間偏差的延遲線D120的 實(shí)施方案。然而,在此類情況下,基于對未偏差信號S30的分析的高頻帶濾波器參數(shù)S60a 可描述與高頻帶激勵信號S120在時間上不對準(zhǔn)的頻譜包絡(luò)。
延遲線D120可根據(jù)適于將所需時間偏差操作應(yīng)用于高頻帶語音信號S30的邏輯元 件與存儲元件的任何組合來配置。舉例來說,延遲線D120可經(jīng)配置以根據(jù)所需的時移從 緩沖器中讀取高頻帶語音信號S30。圖26a展示延遲線D120的此實(shí)施方案D122的示意 圖,所述延遲線D120包含移位寄存器SR1。移位寄存器SR1是經(jīng)配置以接收和存儲高 頻帶語音信號S30的m個最新近樣本的具有大約長度m的緩沖器。值m至少等于將支 持的最大正(或"推進(jìn)")與負(fù)(或"阻滯")時移的總和。值m等于高頻帶信號S30的 幀或子幀的長度可能會較方便。
延遲線D122經(jīng)配置以從移位寄存器SR1的偏移位置OL輸出時間偏差高頻帶信號 S30a。偏移位置OL的定位根據(jù)由例如規(guī)則化數(shù)據(jù)信號SD10指示的當(dāng)前時移而在參考位 置(零時移)附近變化。延遲線D122可經(jīng)配置以支持相等的推進(jìn)和阻滯限制,或者一個 限制大于另一限制,使得可在一個方向上比在另一方向上執(zhí)行更大偏移。圖26a展示支 持的正時移大于負(fù)時移的特定實(shí)例。延遲線D122可經(jīng)配置以一次輸出一個或一個以上樣
本(例如視輸出總線寬度而定)。
具有大于幾毫秒的量值的規(guī)則化時移可引起經(jīng)解碼信號中的可聽到的假象。通常, 由窄頻帶編碼器A124執(zhí)行的規(guī)則化時移的量值將不超過幾毫秒,使得由規(guī)則化數(shù)據(jù)信號 SD10指示的時移將有限。然而,在此類情況下可能需要延遲線D122經(jīng)配置以對正和/ 或負(fù)方向上的時移強(qiáng)加最大限制(例如,以遵循比窄頻帶編碼器強(qiáng)加的限制更為嚴(yán)格的 限制)。
圖26b展示延遲線D122的實(shí)施方案D124的示意圖,延遲線D122包含移位窗口 SW。 在此實(shí)例中,偏移位置OL的定位受移位窗口 SW限制。盡管圖26b展示緩沖器長度m 大于移位窗口 SW的寬度的情況,但延遲線D124也可經(jīng)實(shí)施使得移位窗口 SW的寬度等 于m。
在其它實(shí)施方案中,延遲線D120經(jīng)配置以根據(jù)所需時移將高頻帶語音信號S30寫 入到緩沖器。圖27展示延遲線D120的實(shí)施方案D130的示意圖,所述實(shí)施方案D130 包含經(jīng)配置以接收和存儲高頻帶語音信號S30的兩個移位寄存器SR2和SR3。延遲線 D130經(jīng)配置以根據(jù)例如由規(guī)則化數(shù)據(jù)信號SD10指示的時移而將來自移位寄存器SR2的 幀或子幀寫入到移位寄存器SR3。移位寄存器SR3配置為FIFO緩沖器,其經(jīng)配置以輸 出時間偏差高頻帶信號S30。
在圖27所示的特定實(shí)例中,移位寄存器SR2包含幀緩沖器部分FBI和延遲緩沖器 部分DB,且移位寄存器SR3包含幀緩沖器部分FB2、推進(jìn)緩沖器部分AB和阻滯緩沖器 部分RB。推進(jìn)緩沖器AB和阻滯緩沖器RB的長度可相等,或者其中一者可大于另一者, 使得所支持的一個方向上的偏移大于所支持的另一方向上的偏移。延遲緩沖器DB和阻 滯緩沖器部分RB可經(jīng)配置以具有相同長度?;蛘?,延遲緩沖器DB可比阻滯緩沖器RB 短以考慮到將樣本從幀緩沖器FBI轉(zhuǎn)移到移位寄存器SR3所需的時間間隔,所述轉(zhuǎn)移可 包含例如在存儲到移位寄存器SR3之前先使樣本偏差的其它處理操作。
在圖27的實(shí)例中,幀緩沖器FBI經(jīng)配置以具有與高頻帶信號S30的一個幀的長度 相等的長度。在另一實(shí)例中,幀緩沖器FB1經(jīng)配置以具有與高頻帶信號S30的一個子幀 的長度相等的長度。在此情況下,延遲線D130可經(jīng)配置以包含用于將相同(例如,平均) 延遲應(yīng)用于待偏移的幀的所有子幀的邏輯。延遲線D130還可包含用于將來自幀緩沖器 FBI的值與阻滯緩沖器RB或推進(jìn)緩沖器AB中待重寫的值進(jìn)行平均的邏輯。在另一實(shí)例 中,移位寄存器SR3可經(jīng)配置以僅經(jīng)由幀緩沖器FB1接收高頻帶信號S30的值,且在此 情況下,延遲線D130可包含用于在寫入到移位寄存器SR3的連續(xù)幀或子幀之間的間隙上進(jìn)行內(nèi)插的邏輯。在其它實(shí)施方案中,延遲線D130可經(jīng)配置以在將來自幀緩沖器FB1 的樣本寫入到移位寄存器SR3之前對所述樣本執(zhí)行偏差操作(例如,根據(jù)由規(guī)則化數(shù)據(jù) 信號SD10描述的函數(shù))。
延遲線D120可能需要應(yīng)用基于但不等同于由規(guī)則化數(shù)據(jù)信號SD10指定的偏差的時 間偏差。圖28展示寬頻帶語音編碼器AD10的實(shí)施方案AD12的方塊圖,寬頻帶語音編 碼器AD10包含延遲值映射器DllO。延遲值映射器D110經(jīng)配置以將由規(guī)則化數(shù)據(jù)信號 SD10指示的偏差映射為經(jīng)映射延遲值SD10a。延遲線D120經(jīng)配置以根據(jù)由經(jīng)映射延遲 值SD10a指示的偏差來產(chǎn)生時間偏差高頻帶語音信號S30a。
可預(yù)期窄頻帶編碼器應(yīng)用的時移隨時間平滑地進(jìn)展。因此,通常計(jì)算語音幀期間應(yīng) 用于子幀的平均窄頻帶時移并根據(jù)此平均值來偏移高頻帶語音信號S30的相應(yīng)幀已足 夠。在一個此類實(shí)例中,延遲值映射器D110經(jīng)配置以計(jì)算每一幀的子幀延遲值的平均值, 且延遲線D120經(jīng)配置以將計(jì)算出的平均值應(yīng)用于高頻帶信號S30的相應(yīng)幀。在其它實(shí) 例中,可計(jì)算和應(yīng)用較短周期(例如,兩個子幀,或半個幀)或較長周期(例如,兩個 幀)內(nèi)的平均值。在平均值是樣本的非整數(shù)值的情況下,延遲值映射器D110可經(jīng)配置以 在將所述值輸出到延遲線D120之前將所述值四舍五入為樣本的整數(shù)數(shù)目。
窄頻帶編碼器A124可經(jīng)配置以在經(jīng)編碼窄頻帶激勵信號中包含非整數(shù)數(shù)目的樣本 的規(guī)則化時移。在此情況下,延遲值映射器D110可能需要經(jīng)配置以將窄頻帶時移四舍五 入為樣本的整數(shù)數(shù)目,且延遲線D120可能需要將經(jīng)四舍五入的時移應(yīng)用于高頻帶語音信 號S30。
在寬頻帶語音編碼器AD10的一些實(shí)施方案中,窄頻帶語音信號S20與高頻帶語音 信號S30的取樣速率可能不同。在此類情況下,延遲值映射器D110可經(jīng)配置以調(diào)節(jié)規(guī)則 化數(shù)據(jù)信號SD10中指示的時移量,以考慮窄頻帶語音信號S20(或窄頻帶激勵信號S80) 與高頻帶語音信號S30的取樣速率之間的差異。舉例來說,延遲值映射器D110可經(jīng)配置 以根據(jù)取樣速率的比率縮放時移量。在上文提及的一個特定實(shí)例中,以8kHz對窄頻帶 語音信號S20進(jìn)行取樣,且以7 kHz對高頻帶語音信號S30進(jìn)行取樣。在此情況下,延 遲值映射器D110經(jīng)配置以將每一偏移量乘以7/8。延遲值映射器D110的實(shí)施方案還可 經(jīng)配置以執(zhí)行此縮放運(yùn)算以及本文描述的整數(shù)四舍五入和/或時移平均運(yùn)算。
在另外的實(shí)施方案中,延遲線D120經(jīng)配置以用其它方式修改幀或其它樣本序列的時 間標(biāo)度(例如,通過壓縮一個部分并擴(kuò)展另一部分)。舉例來說,窄頻帶編碼器A124可 經(jīng)配置以根據(jù)例如音調(diào)輪廓或軌跡的函數(shù)來執(zhí)行規(guī)則化。在此情況下,規(guī)則化數(shù)據(jù)信號 SD10可包含對所述函數(shù)的相應(yīng)描述(例如一組參數(shù)),且延遲線D120可包含經(jīng)配置以根 據(jù)所述函數(shù)對高頻帶語音信號S30的幀或子幀執(zhí)行偏差的邏輯。在其它實(shí)施方案中,延 遲值映射器D110經(jīng)配置以在將所述函數(shù)通過延遲線D120應(yīng)用于高頻帶語音信號S30之 前對所述函數(shù)進(jìn)行平均、縮放和/或四舍五入。舉例來說,延遲值映射器D110可經(jīng)配置 以根據(jù)所述函數(shù)計(jì)算一個或一個以上延遲值,每一延遲值指示樣本數(shù)目,其接著由延遲 線D120應(yīng)用以對高頻帶語音信號S30的一個或一個以上相應(yīng)幀或子幀執(zhí)行時間偏差。
圖29展示根據(jù)相應(yīng)經(jīng)編碼窄頻帶激勵信號中包含的時間偏差對高頻帶語音信號執(zhí) 行時間偏差的方法MD100的流程圖。任務(wù)TD100處理寬頻帶語音信號以獲得窄頻帶語 音信號和高頻帶語音信號。舉例來說,任務(wù)TD100可經(jīng)配置以使用具有低通濾波器和高 通濾波器的濾波器組(例如濾波器組A110的實(shí)施方案)對寬頻帶語音信號進(jìn)行濾波。任 務(wù)TD200將窄頻帶語音信號至少編碼為經(jīng)編碼的窄頻帶激勵信號和多個窄頻帶濾波器參 數(shù)。所述經(jīng)編碼的窄頻帶激勵信號和/或?yàn)V波器參數(shù)可量化,且經(jīng)編碼的窄頻帶激勵信號 還可包含例如語音模式參數(shù)的其它參數(shù)。任務(wù)TD200還包含經(jīng)編碼的窄頻帶激勵信號中 的時間偏差。
任務(wù)TD300基于窄頻帶激勵信號產(chǎn)生高頻帶激勵信號。在此情況下,窄頻帶激勵信 號基于經(jīng)編碼的窄頻帶激勵信號。任務(wù)TD400根據(jù)至少所述高頻帶激勵信號,將高頻帶 語音信號至少編碼為多個高頻帶濾波器參數(shù)。舉例來說,任務(wù)TD400可經(jīng)配置以將高頻 帶語音信號編碼為多個量化LSF。任務(wù)TD500將時移應(yīng)用于高頻帶語音信號,所述時移 基于與經(jīng)編碼窄頻帶激勵信號中包含的時間偏差有關(guān)的信息。
任務(wù)TD400可經(jīng)配置以對高頻帶語音信號執(zhí)行頻譜分析(例如,LPC分析),且/或 計(jì)算高頻帶語音信號的增益包絡(luò)。在此類情況下,任務(wù)TD500可經(jīng)配置以在所述分析和 /或增益包絡(luò)計(jì)算之前將時移應(yīng)用于高頻帶語音信號。
寬頻帶語音編碼器A100的其它實(shí)施方案經(jīng)配置以將由經(jīng)編碼窄頻帶激勵信號中包 含的時間偏差引起的高頻帶激勵信號S120的時間偏差反轉(zhuǎn)。舉例來說,高頻帶激勵發(fā)生 器A300可經(jīng)實(shí)施以包含延遲線D120的實(shí)施方案,延遲線D120的所述實(shí)施方案經(jīng)配置 以接收規(guī)則化數(shù)據(jù)信號SD10或經(jīng)映射延遲值SD10a,并將相應(yīng)的反轉(zhuǎn)時移應(yīng)用于窄頻帶 激勵信號S80,且/或應(yīng)用于基于所述窄頻帶激勵信號S80的隨后信號(例如,諧波延伸 信號S160或高頻帶激勵信號S120)。
另外的寬頻帶語音編碼器實(shí)施方案可經(jīng)配置以彼此獨(dú)立地對窄頻帶語音信號S20和 高頻帶語音信號S30進(jìn)行編碼,使得高頻帶語音信號S30被編碼為高頻帶頻譜包絡(luò)和高
頻帶激勵信號的表示形式。此實(shí)施方案可經(jīng)配置以根據(jù)與經(jīng)編碼窄頻帶激勵信號中包含 的時間偏差有關(guān)的信息對高頻帶殘留信號執(zhí)行時間偏差,或用其它方式將時間偏差包含 在經(jīng)編碼高頻帶激勵信號中。舉例來說,高頻帶編碼器可包含本文描述的經(jīng)配置以將時 間偏差應(yīng)用于高頻帶殘留信號的延遲線D120和/或延遲值映射器D110的實(shí)施方案。此操 作的潛在優(yōu)點(diǎn)包含對高頻帶殘留信號的較有效編碼,和合成窄頻帶與高頻帶語音信號之 間的較好匹配。
如上文所提及,本文描述的實(shí)施例包含可用于執(zhí)行嵌入式編碼的實(shí)施方案、支持與 窄頻帶系統(tǒng)的兼容性并避免需要代碼轉(zhuǎn)換。對高頻帶編碼的支持還可用于按照成本來區(qū) 分具有帶有向后兼容性的寬頻帶支持的芯片、芯片組、裝置和/或網(wǎng)絡(luò)與僅具有窄頻帶支
持的芯片、芯片組、裝置和/或網(wǎng)絡(luò)。如本文所描述的對高頻帶編碼的支持也可與用于支 持低頻帶編碼的技術(shù)結(jié)合使用,且根據(jù)此實(shí)施例的系統(tǒng)、方法或設(shè)備可支持對例如約50 或100 Hz —直到約7或8 kHz的頻率分量的編碼。
如上文所提及,向語音編碼器添加高頻帶支持可改進(jìn)清晰度,尤其是關(guān)于摩擦音的 區(qū)分的清晰度。盡管這種區(qū)分通??赡苡扇祟愂章犝吒鶕?jù)特定上下文推導(dǎo)出來,但高頻 帶支持可充當(dāng)語音識別和其它機(jī)器解譯應(yīng)用(例如用于自動化語音菜單導(dǎo)航和/或自動呼 叫處理的系統(tǒng))中的啟用特征。
根據(jù)一實(shí)施例的設(shè)備可嵌入到便攜式無線通信裝置(例如,蜂窩式電話或個人數(shù)字 助理(PDA))中?;蛘?,此設(shè)備可包含在另一通信裝置中,例如VoIP手機(jī)、經(jīng)配置以 支持VoIP通信的個人計(jì)算機(jī)或經(jīng)配置以路由電話或VoIP通信的網(wǎng)絡(luò)裝置。舉例來說, 根據(jù)一實(shí)施例的設(shè)備可實(shí)施在通信裝置的芯片或芯片組中。視特定應(yīng)用而定,此裝置還 可包含例如以下特征對語音信號的模擬-數(shù)字和/或數(shù)字-模擬轉(zhuǎn)換、用于對語音信號執(zhí) 行放大和/或其它信號處理操作的電路,和/或用于發(fā)射和/或接收經(jīng)編碼語音信號的射頻 電路。
明確預(yù)期且揭示實(shí)施例可包含第60/667,901號和第60/673,965號美國臨時專利申請 案中揭示的其它特征中的任一者或一者以上且/或與其一起使用,本申請案中主張所述臨 時專利申請案的權(quán)益。此類特征包含去除發(fā)生于高頻帶中且在窄頻帶中大體上不存在的 具有短持續(xù)時間的高能量突發(fā)。此類特征包含例如高頻帶LSF的系數(shù)表示形式的固定或 自適應(yīng)平滑。此類特征包含與例如LSF的系數(shù)表示形式的量化相關(guān)聯(lián)的噪聲的固定或自 適應(yīng)成形。此類特征還包含增益包絡(luò)的固定或自適應(yīng)平滑,以及增益包絡(luò)的自適應(yīng)衰減。
提供對所描述實(shí)施例的以上介紹以便使所屬領(lǐng)域的技術(shù)人員能夠制造或使用本發(fā)
明??赡軐@些實(shí)施例作出各種修改,且本文提供的一般原理也可應(yīng)用于其它實(shí)施例。 舉例來說,實(shí)施例可部分或整體地實(shí)施為硬連線電路,實(shí)施為制造到專用集成電路中的 電路配置,或者實(shí)施為作為機(jī)器可讀代碼加載到非易失性存儲裝置中的固件程序、或從 數(shù)據(jù)存儲媒體加載或加載到數(shù)據(jù)存儲媒體中的軟件程序,所述代碼為可由例如微處理器 或其它數(shù)字信號處理單元的邏輯元件陣列執(zhí)行的指令。數(shù)據(jù)存儲媒體可為存儲元件陣列, 例如半導(dǎo)體存儲器(其可包含(不限于)動態(tài)或靜態(tài)RAM (隨機(jī)存取存儲器)、ROM (只 讀存儲器)和/或快閃RAM),或鐵電、磁阻、雙向開關(guān)半導(dǎo)體、聚合物或相變存儲器; 或者例如磁盤或光盤的圓盤式媒體。術(shù)語"軟件"應(yīng)理解為包含源代碼、匯編語言代碼、 機(jī)器代碼、二進(jìn)制代碼、固件、宏代碼、微碼、可由邏輯元件陣列執(zhí)行的任何一個或一 個以上指令組或序列,以及此類實(shí)例的任何組合。
高頻帶激勵發(fā)生器A300和B300、高頻帶編碼器AIOO、高頻帶解碼器B200、寬頻 帶語音編碼器A100和寬頻帶語音解碼器B100的實(shí)施方案的各種元件可實(shí)施為(例如) 駐存在芯片組中的同一芯片上或兩個或兩個以上芯片之間的電子和/或光學(xué)裝置,但也預(yù) 期存在沒有此限制的其它配置。此設(shè)備的一個或一個以上元件可整體或部分地實(shí)施為一 個或一個以上指令組,所述指令組經(jīng)配置以在一個或一個以上固定或可編程邏輯元件(例 如,晶體管、門)陣列上執(zhí)行,所述元件例如為微處理器、內(nèi)嵌式處理器、IP核心、數(shù) 字信號處理器、FPGA (場可編程門陣列)、ASSP (專用標(biāo)準(zhǔn)產(chǎn)品)和ASIC (專用集成 電路)。 一個或一個以上此類元件也可能具有共同結(jié)構(gòu)(例如,用于在不同時間執(zhí)行對應(yīng) 于不同元件的代碼部分的處理器、經(jīng)執(zhí)行以在不同時間執(zhí)行對應(yīng)于不同元件的任務(wù)的指 令組,或者在不同時間針對不同元件執(zhí)行操作的電子和/或光學(xué)裝置的配置)。此外,一 個或一個以上此類元件可能用于執(zhí)行與設(shè)備的操作并不直接相關(guān)的任務(wù)或其它指令組, 例如與內(nèi)嵌有所述設(shè)備的裝置或系統(tǒng)的另一操作相關(guān)的任務(wù)。
圖30展示根據(jù)一實(shí)施例對具有窄頻帶部分和高頻帶部分的語音信號的所述高頻帶 部分進(jìn)行編碼的方法M100的流程圖。任務(wù)X100計(jì)算表征高頻帶部分的頻譜包絡(luò)的一組 濾波器參數(shù)。任務(wù)X200通過將非線性函數(shù)應(yīng)用于從窄頻帶部分導(dǎo)出的信號來計(jì)算頻譜延 伸信號。任務(wù)X300根據(jù)(A)所述組濾波器參數(shù)和(B)基于所述頻譜延伸信號的高頻 帶激勵信號來產(chǎn)生合成高頻帶信號。任務(wù)X400基于(C)高頻帶部分的能量與(D)從 窄頻帶部分導(dǎo)出的信號的能量之間的關(guān)系來計(jì)算增益包絡(luò)。
圖31a展示根據(jù)一實(shí)施例產(chǎn)生高頻帶激勵信號的方法M200的流程圖。任務(wù)Y100通 過將非線性函數(shù)應(yīng)用于從語音信號的窄頻帶部分導(dǎo)出的窄頻帶激勵信號來計(jì)算經(jīng)諧波延
伸信號。任務(wù)Y200將經(jīng)諧波延伸信號與經(jīng)調(diào)制噪聲信號混合以產(chǎn)生高頻帶激勵信號。圖 31b展示根據(jù)包含任務(wù)Y300和Y400的另一實(shí)施例產(chǎn)生高頻帶激勵信號的方法M210的 流程圖。任務(wù)Y300根據(jù)窄頻帶激勵信號和經(jīng)諧波延伸信號中的一者的隨時間的能量來計(jì) 算時域包絡(luò)。任務(wù)Y400根據(jù)時域包絡(luò)調(diào)制噪聲信號以產(chǎn)生經(jīng)調(diào)制噪聲信號。
圖32展示根據(jù)一實(shí)施例對具有窄頻帶部分和高頻帶部分的語音信號的所述高頻帶 部分進(jìn)行解碼的方法M300的流程圖。任務(wù)Z100接收表征所述高頻帶部分的頻譜包絡(luò)的 一組濾波器參數(shù)和表征所述高頻帶部分的時間包絡(luò)的一組增益因數(shù)。任務(wù)Z200通過將非 線性函數(shù)應(yīng)用于從窄頻帶部分導(dǎo)出的信號來計(jì)算頻譜延伸信號。任務(wù)Z300根據(jù)(A)所 述組濾波器參數(shù)和(B)基于所述頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻帶信號。 任務(wù)Z400基于所述組增益因數(shù)來調(diào)制所述合成高頻帶信號的增益包絡(luò)。舉例來說,任務(wù) Z400可經(jīng)配置以通過將所述組增益因數(shù)應(yīng)用于從窄頻帶部分導(dǎo)出的激勵信號、應(yīng)用于頻 譜延伸信號、應(yīng)用于高頻帶激勵信號,或應(yīng)用于合成高頻帶信號,來調(diào)制所述合成高頻 帶信號的增益包絡(luò)。
實(shí)施例還包含如本文中(例如)通過對經(jīng)配置以執(zhí)行額外語音譯碼、編碼和解碼方 法的結(jié)構(gòu)實(shí)施例的描述而明確揭示的所述額外語音譯碼、編碼和解碼方法。這些方法的 每一者也可確實(shí)地實(shí)施(例如,在如上文列舉的一個或一個以上數(shù)據(jù)存儲媒體中)為可 由包含邏輯元件(例如,處理器、微處理器、微控制器或其它有限狀態(tài)機(jī))陣列的機(jī)器 讀取和/或執(zhí)行的一個或一個以上指令組。因此,本發(fā)明不希望限于上文展示的實(shí)施例, 而是應(yīng)符合與本文中(包含所提交的形成原始揭示案的一部分的所附權(quán)利要求書中)以 任何方式揭示的原理和新穎特征一致的最廣泛范圍。
權(quán)利要求
1.一種產(chǎn)生高頻帶激勵信號的方法,所述方法包括通過延伸基于經(jīng)編碼低頻帶激勵信號的信號的頻譜來產(chǎn)生頻譜延伸信號;以及對基于所述經(jīng)編碼低頻帶激勵信號的信號執(zhí)行抗稀疏濾波,其中所述高頻帶激勵信號基于所述頻譜延伸信號,且其中所述高頻帶激勵信號基于所述執(zhí)行抗稀疏濾波的結(jié)果。
2. 根據(jù)權(quán)利要求l所述的方法,其中所述執(zhí)行抗稀疏濾波包含對所述頻譜延伸信號執(zhí) 行抗稀疏濾波。
3. 根據(jù)權(quán)利要求1所述的方法,其中所述執(zhí)行抗稀疏濾波包含對所述高頻帶激勵信號 執(zhí)行抗稀疏濾波。
4. 根據(jù)權(quán)利要求l所述的方法,其中所述對信號執(zhí)行抗稀疏濾波包含根據(jù)全通轉(zhuǎn)移函 數(shù)對所述信號執(zhí)行濾波操作。
5. 根據(jù)權(quán)利要求l所述的方法,其中所述對信號執(zhí)行抗稀疏濾波包含在不顯著修改所 述信號的量值頻譜的情況下改變所述信號的相位頻譜。
6. 根據(jù)權(quán)利要求1所述的方法,所述方法包括決定是否對基于所述經(jīng)編碼低頻帶激勵 信號的信號執(zhí)行抗稀疏濾波,其中所述決定的結(jié)果基于頻譜傾斜參數(shù)、音調(diào)增益參數(shù)和語音模式參數(shù)中至少一 者的值。
7. 根據(jù)權(quán)利要求1所述的方法,其中所述產(chǎn)生頻譜延伸信號包括諧波延伸基于所述經(jīng) 編碼低頻帶激勵信號的信號的頻譜以獲得所述頻譜延伸信號。
8. 根據(jù)權(quán)利要求1所述的方法,其中所述產(chǎn)生頻譜延伸信號包括將非線性函數(shù)應(yīng)用于 基于所述經(jīng)編碼低頻帶激勵信號的信號以產(chǎn)生所述頻譜延伸信號。
9. 根據(jù)權(quán)利要求8所述的方法,其中所述非線性函數(shù)包括絕對值函數(shù)、平方函數(shù)和削 波函數(shù)中的至少一者。
10. 根據(jù)權(quán)利要求l所述的方法,所述方法包括將基于所述頻譜延伸信號的信號與經(jīng)調(diào) 制噪聲信號混合,其中所述高頻帶激勵信號基于所述混合信號。
11. 根據(jù)權(quán)利要求10所述的方法,其中所述混合包含計(jì)算所述經(jīng)調(diào)制噪聲信號與基于 所述頻譜延伸信號的信號的加權(quán)總和,其中所述高頻帶激勵信號基于所述加權(quán)總 禾口。
12. 根據(jù)權(quán)利要求10所述的方法,其中所述經(jīng)調(diào)制噪聲信號基于根據(jù)一信號的時域包 絡(luò)來調(diào)制噪聲信號的結(jié)果,所述信號基于所述經(jīng)編碼低頻帶激勵信號和所述頻譜延 伸信號中的至少一者。
13. 根據(jù)權(quán)利要求12所述的方法,所述方法包括根據(jù)經(jīng)編碼語音信號內(nèi)的信息的確定 性函數(shù)來產(chǎn)生所述噪聲信號。
14. 根據(jù)權(quán)利要求l所述的方法,其中所述產(chǎn)生頻譜延伸信號包含諧波延伸基于所述經(jīng) 編碼低頻帶激勵信號的向上取樣信號的頻譜。
15. 根據(jù)權(quán)利要求l所述的方法,所述方法包括以下中的至少一者(A)對所述頻譜延 伸信號進(jìn)行頻譜整平,和(B)對所述高頻帶激勵信號進(jìn)行頻譜整平。
16. 根據(jù)權(quán)利要求15所述的方法,其中所述頻譜整平包括基于待頻譜整平的信號計(jì)算多個濾波器系數(shù);以及用根據(jù)所述多個濾波器系數(shù)配置的白化濾波器對所述待頻譜整平的信號進(jìn)行濾 波。
17. 根據(jù)權(quán)利要求16所述的方法,其中所述計(jì)算多個濾波器系數(shù)包含對所述待頻譜整 平的信號執(zhí)行線性預(yù)測分析。
18. 根據(jù)權(quán)利要求1所述的方法,所述方法包括以下中的至少一者(i)根據(jù)所述高頻 帶激勵信號編碼高頻帶語音信號,和(ii)根據(jù)所述高頻帶激勵信號解碼高頻帶語 音信號。
19. 一種具有機(jī)器可執(zhí)行指令的數(shù)據(jù)存儲媒體,所述機(jī)器可執(zhí)行指令描述根據(jù)權(quán)利要求 l所述的信號處理方法。
20. —種設(shè)備,其包括-頻譜延伸器,其經(jīng)配置以通過延伸基于經(jīng)編碼低頻帶激勵信號的信號的頻譜來產(chǎn) 生頻譜延伸信號;以及抗稀疏濾波器,其經(jīng)配置以對基于所述經(jīng)編碼低頻帶激勵信號的信號進(jìn)行濾波, 其中所述高頻帶激勵信號基于所述頻譜延伸信號,且 其中所述高頻帶激勵信號基于所述抗稀疏濾波器的輸出。
21. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述抗稀疏濾波器經(jīng)配置以對所述頻譜延伸信 號進(jìn)行濾波。
22. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述抗稀疏濾波器經(jīng)配置以對所述高頻帶激勵 信號進(jìn)行濾波。
23. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述抗稀疏濾波器經(jīng)配置以根據(jù)全通轉(zhuǎn)移函數(shù) 對所述信號進(jìn)行濾波。
24. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述抗稀疏濾波器經(jīng)配置以在不顯著修改所述 信號的量值頻譜的情況下改變所述信號的相位頻譜。
25. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述抗稀疏濾波器包含決策邏輯,所述決策邏 輯經(jīng)配置以決定是否對基于所述經(jīng)編碼低頻帶激勵信號的信號進(jìn)行濾波,其中所述決策邏輯經(jīng)配置以基于頻譜傾斜參數(shù)、音調(diào)增益參數(shù)和語音模式參數(shù)中 至少一者的值來作出決定。
26. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述頻譜延伸器經(jīng)配置以諧波延伸基于所述經(jīng) 編碼低頻帶激勵信號的信號的頻譜以獲得所述頻譜延伸信號。
27. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述頻譜延伸器經(jīng)配置以將非線性函數(shù)應(yīng)用于 基于所述經(jīng)編碼低頻帶激勵信號的信號以產(chǎn)生所述頻譜延伸信號。
28. 根據(jù)權(quán)利要求27所述的設(shè)備,其中所述非線性函數(shù)包括絕對值函數(shù)、平方函數(shù)和 削波函數(shù)中的至少一者。
29. 根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備包括組合器,所述組合器經(jīng)配置以將基于 所述頻譜延伸信號的信號與經(jīng)調(diào)制噪聲信號混合,其中所述高頻帶激勵信號基于所 述組合器的輸出。
30. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述混合器經(jīng)配置以計(jì)算所述經(jīng)調(diào)制噪聲信號 與基于所述頻譜延伸信號的信號的加權(quán)總和,其中所述高頻帶激勵信號基于所述加 權(quán)總和。
31. 根據(jù)權(quán)利要求29所述的設(shè)備,所述設(shè)備包含第二組合器,所述第二組合器經(jīng)配置 以根據(jù)一信號的時域包絡(luò)來調(diào)制噪聲信號,所述信號基于所述經(jīng)編碼低頻帶激勵信 號和所述頻譜延伸信號中的至少一者,其中所述經(jīng)調(diào)制噪聲信號基于所述第二組合器的輸出。
32. 根據(jù)權(quán)利要求31所述的設(shè)備,所述設(shè)備包括噪聲發(fā)生器,所述噪聲發(fā)生器經(jīng)配置 以根據(jù)經(jīng)編碼語音信號內(nèi)的信息的確定性函數(shù)來產(chǎn)生所述噪聲信號。
33. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述頻譜延伸器經(jīng)配置以諧波延伸基于所述經(jīng) 編碼低頻帶激勵信號的向上取樣信號的頻譜。
34. 根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備包括頻譜整平器,所述頻譜整平器經(jīng)配置 以對所述頻譜延伸信號和所述高頻帶激勵信號中的至少一者進(jìn)行頻譜整平。
35. 根據(jù)權(quán)利要求34所述的設(shè)備,其中所述頻譜整平器經(jīng)配置以基于待頻譜整平的信 號計(jì)算多個濾波器系數(shù),并用根據(jù)所述多個濾波器系數(shù)配置的白化濾波器對所述待 頻譜整平的信號進(jìn)行濾波。
36. 根據(jù)權(quán)利要求35所述的設(shè)備,其中所述頻譜整平器經(jīng)配置以基于對所述待頻譜整 平的信號的線性預(yù)測分析來計(jì)算所述多個濾波器系數(shù)。
37. 根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備包括以下中的至少一者(i)高頻帶語音編 碼器,其經(jīng)配置以根據(jù)所述高頻帶激勵信號編碼高頻帶語音信號,和(ii)高頻帶 語音解碼器,其經(jīng)配置以根據(jù)所述高頻帶激勵信號解碼高頻帶語音信號。
38. 根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備包括蜂窩式電話。
39. 根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備包括經(jīng)配置以發(fā)射與因特網(wǎng)協(xié)議的版本一 致的多個包的裝置,其中所述多個包描述所述窄頻帶激勵信號。
40. 根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備包括經(jīng)配置以接收與所述因特網(wǎng)協(xié)議的版 本一致的多個包的裝置,其中所述多個包描述所述窄頻帶激勵信號。
41. 一種設(shè)備,其包括用于通過延伸基于經(jīng)編碼低頻帶激勵信號的信號的頻譜來產(chǎn)生頻譜延伸信號的 裝置;以及抗稀疏濾波器,其經(jīng)配置以對基于所述經(jīng)編碼低頻帶激勵信號的信號進(jìn)行濾波, 其中所述高頻帶激勵信號基于所述頻譜延伸信號,且 其中所述高頻帶激勵信號基于所述抗稀疏濾波器的輸出。
42. 根據(jù)權(quán)利要求41所述的設(shè)備,所述設(shè)備包括蜂窩式電話。
全文摘要
一種用于產(chǎn)生高頻帶激勵信號(S120)的方法和設(shè)備包含通過延伸基于經(jīng)編碼低頻帶激勵信號(S50)的信號的頻譜來產(chǎn)生頻譜延伸信號(A400);以及對基于所述經(jīng)編碼低頻帶激勵信號的信號執(zhí)行抗稀疏濾波(600)。所述高頻帶激勵信號基于所述頻譜延伸信號,且所述高頻帶激勵信號基于所述抗稀疏濾波的結(jié)果。
文檔編號G10L21/02GK101185125SQ200680018353
公開日2008年5月21日 申請日期2006年4月3日 優(yōu)先權(quán)日2005年4月1日
發(fā)明者科恩·貝爾納德·福斯, 阿南塔帕德馬納卜漢·A·坎達(dá)達(dá)伊 申請人:高通股份有限公司