專利名稱:格型矢量量化音頻編解碼方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻編解碼技術(shù),尤其是一種格型矢量量化音頻編解碼方法和系 統(tǒng)。
背景技術(shù):
音頻編碼技術(shù)是諸如數(shù)字音頻廣播、互聯(lián)網(wǎng)的傳播音樂和音頻通訊等多媒體應(yīng)用 技術(shù)的核心,這些應(yīng)用會極大地受益于音頻編碼器壓縮性能的提高。感知音頻編碼器作為 有損變換域編碼的一種,是現(xiàn)代的主流音頻編碼器?,F(xiàn)有音頻編解碼器如MPEG 4AAC等采 用非均勻標(biāo)量量化方式進(jìn)行變換域音頻編解碼,運(yùn)算復(fù)雜度較高,壓縮能力不強(qiáng);基于傳統(tǒng) 的統(tǒng)計(jì)型矢量量化器(如用LBG算法設(shè)計(jì)的矢量量化器)具有很強(qiáng)的壓縮能力,因而在音 視頻壓縮領(lǐng)域得到了廣泛應(yīng)用,但是量化器運(yùn)算復(fù)雜度隨維數(shù)呈指數(shù)關(guān)系增長,并且用聚 類算法對訓(xùn)練序列進(jìn)行訓(xùn)練得到的碼本通常不是全局最佳的。近年來出現(xiàn)一種新的音頻編 解碼矢量量化器,也就是格型矢量量化,格型矢量量化器是以空間網(wǎng)格中的格點(diǎn)作為矢量 量化器來對信號進(jìn)行量化。由于空間格點(diǎn)是有規(guī)律的,其碼本可以通過代數(shù)方法構(gòu)造僅占 用很少的存儲空間,并且格型矢量量化具有運(yùn)算復(fù)雜度低、量化精度高的優(yōu)點(diǎn)。然而現(xiàn)有的 基于格型矢量量化的音頻編解碼器(如G. 719等)在編解碼碼本選擇上采用了球型網(wǎng)格, 其碼本截?cái)喾绞絻H僅適用于均勻分布和高斯分布的信源,而針對于語音這種拉普拉斯分布 的信源來說編碼效果不好;同時(shí)現(xiàn)有的格型矢量量化器(如G. 719)在編碼過程中比特步長 為整數(shù)個比特(如一個比特),低比特分配時(shí)步長過長,造成比特分配過于集中而不能更加 有效地使用有限的比特;另外該編解碼器的單個比特的網(wǎng)格碼本占用過多的存儲空間。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種格型矢量量化音頻編解碼方法和系統(tǒng),以獲 得較好的語音信源編碼效果。為解決以上技術(shù)問題,本發(fā)明提供一種格型矢量量化音頻編碼方法,該方法包 括將音頻信號經(jīng)過修正離散余弦逆變換(MDCT)變換后的頻域系數(shù)劃分為若干個編 碼子帶,并對各編碼子帶的幅值包絡(luò)值進(jìn)行量化和編碼,得到幅值包絡(luò)的編碼比特;對各編碼子帶進(jìn)行比特分配,并對低比特編碼子帶和高比特編碼子帶中的矢量分 別使用塔型格型矢量量化方法和球型格型矢量量化方法進(jìn)行歸一化、量化和編碼,得到頻 域系數(shù)的編碼比特,其中,所述低比特編碼子帶是指該編碼子帶中單個頻域系數(shù)所分配到 的比特?cái)?shù)小于預(yù)設(shè)閾值的編碼子帶,所述高比特編碼子帶是指該編碼子帶中單個頻域系數(shù) 所分配到的比特?cái)?shù)大于或等于預(yù)設(shè)閾值的編碼子帶;將各編碼子帶的幅值包絡(luò)的編碼比特和頻域系數(shù)的編碼比特復(fù)用打包后,傳送給 解碼端。進(jìn)一步地,劃分編碼子帶時(shí),將所述MDCT變換后的頻域系數(shù)分成若干個等間隔的編碼子帶,或者按照聽覺感知特性劃分成若干個非均勻編碼子帶。進(jìn)一步地,對各編碼子帶進(jìn)行比特分配前,先根據(jù)編碼子帶幅值包絡(luò)值計(jì)算各編 碼子帶重要性的初始值,再根據(jù)編碼子帶的重要性對編碼子帶中每個頻域系數(shù)進(jìn)行比特分 配,在比特分配過程中,比特分配步長及比特分配后重要性降低的步長均是變化的。進(jìn)一步地,所述重要性初始值是根據(jù)最大量化信噪比增益條件下的最佳比特值和 符合人耳感知特性的比例因子計(jì)算的,或者是各編碼子帶幅值包絡(luò)的量化指數(shù)
權(quán)利要求
1.一種格型矢量量化音頻編碼方法,其特征在于,該方法包括將音頻信號經(jīng)過修正離散余弦逆變換(MDCT)變換后的頻域系數(shù)劃分為若干個編碼子 帶,并對各編碼子帶的幅值包絡(luò)值進(jìn)行量化和編碼,得到幅值包絡(luò)的編碼比特;對各編碼子帶進(jìn)行比特分配,并對低比特編碼子帶和高比特編碼子帶中的矢量分別使 用塔型格型矢量量化方法和球型格型矢量量化方法進(jìn)行歸一化、量化和編碼,得到頻域系 數(shù)的編碼比特,其中,所述低比特編碼子帶是指該編碼子帶中單個頻域系數(shù)所分配到的比 特?cái)?shù)小于預(yù)設(shè)閾值的編碼子帶,所述高比特編碼子帶是指該編碼子帶中單個頻域系數(shù)所分 配到的比特?cái)?shù)大于或等于預(yù)設(shè)閾值的編碼子帶;將各編碼子帶的幅值包絡(luò)的編碼比特和頻域系數(shù)的編碼比特復(fù)用打包后,傳送給解碼端。
2.如權(quán)利要求1所述的方法,其特征在于,劃分編碼子帶時(shí),將所述MDCT變換后的頻域系數(shù)分成若干個等間隔的編碼子帶,或者 按照聽覺感知特性劃分成若干個非均勻編碼子帶。
3.如權(quán)利要求1所述的方法,其特征在于,對各編碼子帶進(jìn)行比特分配前,先根據(jù)編碼子帶幅值包絡(luò)值計(jì)算各編碼子帶重要性的 初始值,再根據(jù)編碼子帶的重要性對編碼子帶中每個頻域系數(shù)進(jìn)行比特分配,在比特分配 過程中,比特分配步長及比特分配后重要性降低的步長均是變化的。
4.如權(quán)利要求3所述的方法,其特征在于,所述重要性初始值是根據(jù)最大量化信噪比 增益條件下的最佳比特值和符合人耳感知特性的比例因子計(jì)算的,或者是各編碼子帶幅值 包絡(luò)的量化指數(shù)I\(j)或χIog2[TTzC/)]+V」,其中μ >0,μ和ν均為實(shí)數(shù)。
5.如權(quán)利要求1或3所述的方法,其特征在于,對各編碼子帶進(jìn)行比特分配的過程包括計(jì)算單個頻域系數(shù)的比特消耗平均值;根據(jù)碼率失真理論計(jì)算在最大量化信噪比增益條件下的最佳比特值; 計(jì)算各編碼子帶在比特分配中的重要性初始值;根據(jù)各編碼子帶的重要性對各編碼子帶進(jìn)行比特分配增加重要性最大的編碼子帶中 每個頻域系數(shù)的編碼比特?cái)?shù),并降低該編碼子帶的重要性;直至所有編碼子帶所消耗比特 數(shù)的總和滿足可提供比特限制條件下的最大值。
6.如權(quán)利要求1或3所述的方法,其特征在于,低比特編碼子帶的比特分配步長及比特分配后的重要性降低步長小于零比特編碼子 帶和高比特編碼子帶的比特分配步長及比特分配后的重要性降低步長。
7.如權(quán)利要求1或3所述的方法,其特征在于,低比特編碼子帶的比特分配步長及比特分配后的重要性降低步長均為0. 5 ;零比特編 碼子帶和高比特編碼子帶的比特分配步長及比特分配后的重要性降低步長均為1。
8.如權(quán)利要求1所述的方法,其特征在于,對所述低比特編碼子帶進(jìn)行塔型格型矢量量化的過程包括使用編碼子帶的量化幅值包絡(luò)值對該編碼子帶中所有頻域系數(shù)進(jìn)行歸一化處理,并分 組形成若干個8維待量化矢量;對各待量化矢量進(jìn)行量化的過程包括以下步驟;對編碼子帶中的8維待量化矢量進(jìn)行能量規(guī)整,將能量規(guī)整后的8維待量化矢量量化 到D8格點(diǎn);將通過量化得到的D8格點(diǎn)的能量和編碼碼本中的最大塔面能量半徑進(jìn)行比較,如果小 于或等于最大塔面能量半徑,則計(jì)算所述D8格點(diǎn)在碼本中的量化索引;如果大于最大塔面 能量半徑,則將該編碼子帶規(guī)整后的待量化矢量進(jìn)行能量截?cái)啵敝聊芰拷財(cái)嗪蟮拇炕?矢量的量化格點(diǎn)的能量不大于最大塔面能量半徑,同時(shí)對能量截?cái)嗪蟮拇炕噶砍掷m(xù)增 加其自身的一個小能量,直至其量化到的D8格點(diǎn)的能量超過最大塔面能量半徑,確定最后 一個能量不超過最大塔面能量半徑的D8格點(diǎn)為矢量量化格點(diǎn)并計(jì)算其在碼本中的量化索 引。
9.如權(quán)利要求8所述的方法,其特征在于,對所述8維待量化矢量進(jìn)行能量規(guī)整時(shí),先根據(jù)所述8維待量化矢量所在編碼子帶j 中單個頻域系數(shù)所分配到的比特?cái)?shù)regi0n_bit(j),從下表中查詢到該比特?cái)?shù)所對應(yīng)的碼 本序號index和能量縮放因子scale ;然后根據(jù)下面的公式對待量化矢量進(jìn)行能量規(guī)整
10.如權(quán)利要求1所述的方法,其特征在于, 對所述高比特編碼子帶進(jìn)行球型格型矢量量化的過程使用編碼子帶的量化幅值包絡(luò)值對該子帶中所有頻域系數(shù)進(jìn)行歸一化處理,并分組形 成若干個多維待量化矢量;對各待量化矢量進(jìn)行量化的過程包括以下步驟對編碼子帶中的8維待量化矢量進(jìn)行能量規(guī)整,將能量規(guī)整后的8維矢量量化到D8格點(diǎn);將通過矢量量化得到的D8格點(diǎn)值除以2region_bit(j)的比特分配數(shù)次方后再量化到D8格點(diǎn),判斷再量化的D8格點(diǎn)值是否是零矢量,如果是則稱為零矢量條件滿足,否則稱為零矢 量條件不滿足,其中regi0n_bit(j)表示第j個編碼子帶中單個頻域系數(shù)所分配到的比特 數(shù);如果零矢量條件滿足,則計(jì)算所述D8格點(diǎn)的索引矢量;如果零矢量條件不滿足,則將待量化矢量的值進(jìn)行截?cái)?,直至零矢量條件滿足,備份待 量化矢量自身的小倍數(shù)值w,對能量截?cái)嗪蟮拇炕噶考由蟼浞莸男”稊?shù)值w,然后再量 化到D8格點(diǎn),判斷零矢量條件是否滿足,如果零矢量條件不滿足,則計(jì)算最近滿足零矢量條 件的D8格點(diǎn)的索引矢量k,否則繼續(xù)對待量化矢量增加備份的小倍數(shù)值w,然后再量化到D8 格點(diǎn),直至零矢量條件不滿足。
11.如權(quán)利要求10所述的方法,其特征在于,對所述8維待量化矢量進(jìn)行能量規(guī)整時(shí),先根據(jù)待量化矢量
12.如權(quán)利要求1所述的方法,其特征在于,對低比特編碼子帶使用塔型格型矢量量化得到的量化索引進(jìn)行編碼的過程包括對所有低比特編碼子帶的量化索引進(jìn)行霍夫曼編碼;若所有低比特編碼子帶的量化索引經(jīng)過霍夫曼編碼后所消耗比特的總數(shù)小于所有低 比特編碼子帶的量化索引的自然編碼所需要的比特?cái)?shù)總和,則使用霍夫曼編碼并設(shè)置頻域 系數(shù)霍夫曼編碼標(biāo)識為1或true,利用霍夫曼編碼節(jié)省下來的比特對編碼子帶的比特分配 數(shù)進(jìn)行修正,以及對修正了比特分配數(shù)的編碼子帶再次進(jìn)行矢量量化和編碼;否則重新對 量化索引進(jìn)行自然編碼,并設(shè)置頻域系數(shù)霍夫曼編碼標(biāo)識為0或false。
13.如權(quán)利要求12所述的方法,其特征在于,利用霍夫曼編碼節(jié)省下來的比特對編碼子帶的比特分配數(shù)進(jìn)行修正的過程如下計(jì)算霍夫曼編碼所節(jié)省的比特?cái)?shù);在所有編碼子帶中尋找重要性最大的編碼子帶,如果該編碼子帶所分配的比特?cái)?shù)已經(jīng) 達(dá)到可能分配給與的最大值,則將該編碼子帶的重要性調(diào)整到最低,不再對該編碼子帶修 正比特分配數(shù),否則對該重要性最大的編碼子帶進(jìn)行比特分配修正;在比特分配修正過程中,對比特分配數(shù)為0的編碼子帶分配1個比特,比特分配后重要 性降低1 ;對比特分配數(shù)大于0且小于5的編碼子帶分配0. 5個比特,比特分配后重要性降 低0. 5 ;對比特分配數(shù)大于5的編碼子帶分配1個比特,比特分配后重要性降低1。
14.如權(quán)利要求13所述的方法,其特征在于比特分配數(shù)每修正1次,即將比特分配修正迭代次數(shù)count加1,當(dāng)比特分配修正迭代 次數(shù)count達(dá)到預(yù)設(shè)上限值或能夠使用的比特?cái)?shù)小于比特分配修正所需要的比特?cái)?shù)時(shí),比 特分配修正流程結(jié)束。
15.如權(quán)利要求14所述的方法,其特征在于編碼后的比特復(fù)用打包的順序依次為幅 值包絡(luò)霍夫曼編碼標(biāo)識、頻域系數(shù)霍夫曼編碼標(biāo)識、比特分配修正迭代次數(shù)、幅值包絡(luò)的編 碼比特、頻域系數(shù)的編碼比特。
16.如權(quán)利要求1所述的方法,其特征在于,對所有低比特編碼子帶的量化索引進(jìn)行霍夫曼編碼時(shí),根據(jù)編碼子帶中單個頻域系數(shù) 所分配到的比特?cái)?shù),對編碼子帶的矢量量化索引使用不同的碼本進(jìn)行編碼;
17.如權(quán)利要求1所述的方法,其特征在于,對所有低比特編碼子帶的量化索引進(jìn)行霍夫曼編碼時(shí)在單個頻域系數(shù)所分配到的比特?cái)?shù)為大于1小于5但除去2的所有編碼子帶中,對每 個矢量量化索引的自然二進(jìn)制碼中每4位分成一組并對其進(jìn)行霍夫曼編碼,所有4位一組 的霍夫曼編碼比特?cái)?shù)之和就是該量化索引的霍夫曼編碼的消耗比特?cái)?shù);在單個頻域系數(shù)所分配到的比特?cái)?shù)為2的所有編碼子帶中,對每個8維矢量的塔型格 型矢量量化索引使用15個比特進(jìn)行編碼,將15個比特分成3組4位比特和1組3位比特, 然后對它們分別進(jìn)行霍夫曼編碼,4組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍 夫曼編碼消耗比特?cái)?shù);當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引小于127,則對量 化索引使用7個比特進(jìn)行編碼,把7個比特分成1組3比特和1組4比特,分別對兩組進(jìn) 行霍夫曼編碼,兩組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍夫曼編碼消耗比特 數(shù);當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引等于127,則定義 它的自然二進(jìn)制碼值為” 1111 1110”,把前面7個1分成1組3比特和1組4比特,分別對 兩組進(jìn)行霍夫曼編碼,兩組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍夫曼編碼消 耗比特?cái)?shù);當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引等于128,則定義 它的自然二進(jìn)制碼值為” 1111 1111”,把前面7個1分成1組3比特和1組4比特,分別對 兩組進(jìn)行霍夫曼編碼,兩組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍夫曼編碼消 耗比特?cái)?shù)。
18.一種格型矢量量化音頻解碼方法,其特征在于,該方法包括對待解碼比特流中各幅值包絡(luò)編碼比特進(jìn)行解碼,得到各編碼子帶的幅值包絡(luò)量化指數(shù);對各編碼子帶進(jìn)行比特分配,并對低比特編碼子帶進(jìn)行解碼、塔型格型矢量量化的反 量化及反歸一化,以及對高比特編碼子帶進(jìn)行解碼、球型格型矢量量化的反量化及反歸一 化,得到低比特編碼子帶和高比特編碼子帶的頻域系數(shù);其中,所述低比特編碼子帶是指該 編碼子帶中單個頻域系數(shù)所分配到的比特?cái)?shù)小于預(yù)設(shè)閾值的編碼子帶,所述高比特編碼子 帶是指該編碼子帶中單個頻域系數(shù)所分配到的比特?cái)?shù)大于預(yù)設(shè)閾值的編碼子帶;對噪聲填充后的頻域系數(shù)進(jìn)行修正離散余弦逆變換(IMDCT),得到最終的音頻信號。
19.如權(quán)利要求18所述的方法,其特征在于,對各編碼子帶進(jìn)行比特分配前,先根據(jù)編碼子帶幅值包絡(luò)值計(jì)算各編碼子帶重要性的 初始值,再根據(jù)各編碼子帶的重要性對編碼子帶中每個頻域系數(shù)進(jìn)行比特分配,在比特分 配過程中,比特分配步長及比特分配后重要性降低的步長均是變化的。
20.如權(quán)利要求18所述的方法,其特征在于,在進(jìn)行比特分配之后,解碼之前,根據(jù)編碼端的比特分配修正迭代次數(shù)count值和各 編碼子帶的重要性,對編碼子帶再進(jìn)行count次比特分配修正。
21.如權(quán)利要求19或20所述的方法,其特征在于,進(jìn)行比特分配時(shí),低比特編碼子帶的比特分配步長及比特分配后的重要性降低步長小 于零比特編碼子帶和高比特編碼子帶的比特分配步長及比特分配后的重要性降低步長;比特分配修正時(shí),低比特編碼子帶的比特修正步長及比特修正后的重要性降低步長小 于零比特編碼子帶和高比特編碼子帶的比特修正步長及比特修正后的重要性降低步長。
22.如權(quán)利要求21所述的方法,其特征在于,低比特編碼子帶的比特分配步長及比特分配后的重要性降低步長均為0. 5 ;零比特編 碼子帶和高比特編碼子帶的比特分配步長及比特分配后的重要性降低步長均為1。
23.如權(quán)利要求18所述的方法,其特征在于對低比特編碼子帶解碼時(shí),根據(jù)編碼端的頻域系數(shù)霍夫曼編碼標(biāo)識對低比特編碼子帶 進(jìn)行霍夫曼解碼或直接解碼得到低比特編碼子帶的矢量量化索引,對所有矢量量化索引進(jìn) 行塔型格型矢量量化的反量化及反歸一化,得到該編碼子帶的頻域系數(shù);對高比特編碼子 帶解碼時(shí),直接采用自然解碼得到高比特編碼子帶的矢量量化索引,對所有矢量量化索引 進(jìn)行球型格型矢量量化的反量化及反歸一化,得到該編碼子帶的頻域系數(shù)。
24.如權(quán)利要求18或23所述的方法,其特征在于,在低比特編碼子帶的霍夫曼解碼過程中,當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特 數(shù)為1時(shí),如果量化索引的自然二進(jìn)制碼值小于” 1111 111”,則按照自然二進(jìn)制碼值計(jì)算量 化索引;如果量化索引的自然二進(jìn)制碼值等于” 1111 111”,則繼續(xù)讀入下一位比特,如果下 一位比特是0,則量化索引值為127,如果下一位比特是1,則量化索引值為128。
25.如權(quán)利要求18或23所述的方法,其特征在于, 對低比特編碼子帶的編碼比特進(jìn)行解碼時(shí)如果頻域系數(shù)霍夫曼編碼標(biāo)識表明未使用霍夫曼編碼,則直接解碼得到低比特編碼子 帶j的第m個矢量量化索引indeX_b(j,m),如果頻域系數(shù)霍夫曼編碼標(biāo)識表明采用了霍夫 曼編碼,則通過霍夫曼解碼得到低比特編碼子帶j的第m個矢量量化索引indeX_b(j,m); 對該量化索引的塔式格型矢量反量化的過程包括 a 確定量化索引所在的能量塔面及在該能量塔面上的標(biāo)號 在塔面能量從2到LargeK (regi0n_bit(j))中尋找kk,使得下面的不等式滿足 N(8, kk) <= index_b(j,m) < N(8, kk+2),如果找到這樣的Ick,則K = Ick為量化索引indeX_b(j,m)所對應(yīng)D8格點(diǎn)所在塔面的能 量,b = index_b(j, m)-N(8,kk)為該D8格點(diǎn)在所在塔面上的索引標(biāo)號;如果找不到這樣的kk,則量化索引indeX_b (j, m)所對應(yīng)D8格點(diǎn)的塔面能量K = 0及 索引標(biāo)號b = 0;b 求解塔面能量為K和索引標(biāo)號為b的D8格點(diǎn)矢量Y = (yl,y2y3, y4, y5, y6, y7, y8,)的具體步驟如下步驟 1 令 Y = (0,0,0,0,0,0,0,0),xb = 0,i = 1,k = K,1 = 8 ;步驟2 如果b = xb那么yi = 0 ;跳轉(zhuǎn)至步驟6 ;步驟3 如果b < xb+N(l-l, k),則yi = 0,跳轉(zhuǎn)至步驟5 ;否則,xb = xb+N(l-l, k);令 j = 1 ;步驟 4 如果 b < xb+2*N(l-l,k-j),則如果 xb < = b < xb+N(l-l, k-j), M yi = j ;如果 b >= xb+N(1-1,k-j),則 yi = -j,xb = xb+N(1-1,k-j);否則 xb = xb+2*N(l-l,k-j),j = j+1 ;繼續(xù)本步驟;到步驟5 更新k = k-|yi|,1 = 1-1,i = i+1,如果k> 0,則跳轉(zhuǎn)到步驟2 ; 步驟6:如果k>0,則y8 = k-|yi|,Y= (yl, y2,…,y8)為所求格點(diǎn); c 對所求D8格點(diǎn)進(jìn)行能量反規(guī)整,得到
26.權(quán)利要求18或23所述的方法,其特征在于,對高比特編碼子帶的編碼比特直接進(jìn)行自然解碼得到高比特編碼子帶j的第m個索引 矢量k,對該索引矢量進(jìn)行球型格型矢量量化的反量化過程包括a)計(jì)算x = k*G,并計(jì)算ytemp = X/(2~(regi0n_bit(j));其中,k為矢量量化的索引 矢量,regi0n_bit(j)表示編碼子帶j中單個頻域系數(shù)的比特分配數(shù);6為隊(duì)格點(diǎn)的生成矩 陣,形式如下
27. —種格型矢量量化音頻編碼系統(tǒng),其特征在于,該系統(tǒng)包括修正離散余弦變換 (MDCT)單元、幅值包絡(luò)計(jì)算單元、幅值包絡(luò)量化和編碼單元、比特分配單元、歸一化處理單 元、分類格型矢量量化和編碼單元;其中所述MDCT單元,用于對音頻信號進(jìn)行修正離散余弦變換生成頻域系數(shù);所述幅值包絡(luò)計(jì)算單元,與所述MDCT單元連接,用于將所述MDCT生成的頻域系數(shù)劃分為若干個編碼子帶,并計(jì)算各編碼子帶的幅值包絡(luò)值;所述幅值包絡(luò)量化和編碼單元,與所述幅值包絡(luò)計(jì)算單元連接,用于將各編碼子帶的 幅值包絡(luò)值進(jìn)行量化和編碼,生成各編碼子帶幅值包絡(luò)的編碼比特;所述比特分配單元,與所述幅值包絡(luò)量化和編碼單元連接,用于進(jìn)行比特分配,得到各 編碼子帶中為每個頻域系數(shù)所分配的編碼比特?cái)?shù);歸一化處理單元,與MDCT單元連接,用于使用編碼子帶的量化幅值包絡(luò)值對各編碼子 帶中所有頻域系數(shù)進(jìn)行歸一化處理;所述分類格型矢量量化和編碼單元,與所述歸一化處理單元及比特分配單元連接,用 于對低比特編碼子帶和高比特編碼子帶中的歸一化后的待量化矢量分別使用塔型格型矢 量量化方法和球型格型矢量量化方法進(jìn)行量化和編碼,得到頻域系數(shù)的編碼比特;其中,所 述低比特編碼子帶是指該編碼子帶中單個頻域系數(shù)所分配到的比特?cái)?shù)小于預(yù)設(shè)閾值的編 碼子帶,所述高比特編碼子帶是指該編碼子帶中單個頻域系數(shù)所分配到的比特?cái)?shù)大于或等 于預(yù)設(shè)閾值的編碼子帶;比特流復(fù)用器,與所述幅值包絡(luò)量化和編碼單元以及分類格型矢量量化和編碼單元連 接,用于將各編碼子帶的編碼比特以及頻域系數(shù)的編碼比特復(fù)用并發(fā)送到解碼端。
28.如權(quán)利要求27所述的系統(tǒng),其特征在于,所述幅值包絡(luò)計(jì)算單元劃分編碼子帶時(shí),將所述MDCT變換后的頻域系數(shù)分成若干個 等間隔的編碼子帶,或者按照聽覺感知特性劃分成若干個非均勻編碼子帶。
29.如權(quán)利要求27所述的系統(tǒng),其特征在于,所述比特分配單元包括相連接的重要性計(jì)算模塊及比特分配模塊,其中 重要性計(jì)算模塊用于根據(jù)編碼子帶幅值包絡(luò)值計(jì)算各編碼子帶重要性的初始值; 所述比特分配模塊用于根據(jù)各編碼子帶的重要性對編碼子帶中每個頻域系數(shù)進(jìn)行比 特分配,且在比特分配過程中,比特分配步長及比特分配后重要性降低的步長均是變化的。
30.如權(quán)利要求27所述的系統(tǒng),其特征在于,所述重要性初始值是根據(jù)最大量化信噪比增益條件下的最佳比特值和符合人 耳感知特性的比例因子計(jì)算的,或者是各編碼子帶幅值包絡(luò)的量化指數(shù)
31.如權(quán)利要求27或四所述的方法,其特征在于,所述重要性計(jì)算模塊中計(jì)算所述重要性初始值時(shí),先計(jì)算單個頻域系數(shù)的比特消耗平 均值;再根據(jù)碼率失真理論計(jì)算在最大量化信噪比增益條件下的最佳比特值;之后再根據(jù) 所述比特消耗平均值及最佳比特值計(jì)算各編碼子帶在比特分配中的重要性初始值;所述比特分配模塊根據(jù)各編碼子帶的重要性對各編碼子帶進(jìn)行比特分配增加重要性 最大的編碼子帶中每個頻域系數(shù)的編碼比特?cái)?shù),并降低該編碼子帶的重要性;直至所有編 碼子帶所消耗比特?cái)?shù)的總和滿足可提供比特限制條件下的最大值。
32.如權(quán)利要求27或四所述的系統(tǒng),其特征在于,所述比特分配模塊進(jìn)行比特分配時(shí),低比特編碼子帶的比特分配步長及比特分配后的 重要性降低步長小于零比特編碼子帶和高比特編碼子帶的比特分配步長及比特分配后的 重要性降低步長。
33.如權(quán)利要求27或四所述的系統(tǒng),其特征在于,所述比特分配模塊進(jìn)行比特分配時(shí),低比特編碼子帶的比特分配步長及比特分配后的重要性降低步長均為0. 5 ;零比特編碼子 帶和高比特編碼子帶的比特分配步長及比特分配后的重要性降低步長均為1。
34.如權(quán)利要求27所述的系統(tǒng),其特征在于,所述分類格型矢量量化和編碼單元包括分類處理模塊及塔型格型矢量量化模塊,其中所述分類處理模塊,與所述歸一化處理單元連接,用于對歸一化后的頻域系數(shù)進(jìn)行分 組形成8維待量化矢量,將低比特編碼子帶歸一化后的待量化矢量轉(zhuǎn)給塔型格型矢量量化 器,將高比特編碼子帶歸一化后的待量化矢量轉(zhuǎn)給球型格型矢量量化器;塔型格型矢量量化模塊,與所述分類處理模塊連接,用于對各低比特編碼子帶歸一化 處理后的待量化矢量進(jìn)行塔型格型矢量量化,包括能量規(guī)整子模塊、格點(diǎn)量化子模塊、能量 調(diào)整子模塊及量化索引計(jì)算子模塊,其中所述能量規(guī)整子模塊,用于對編碼子帶中的8維待量化矢量進(jìn)行能量規(guī)整;所述格點(diǎn)量化子模塊,與所述能量規(guī)整子模塊連接,用于將8維待量化矢量量化到D8 格點(diǎn);所述能量調(diào)整子模塊,與所述格點(diǎn)量化子模塊連接,用于將D8格點(diǎn)的能量和編碼碼本 中的最大塔面能量半徑進(jìn)行比較,如果小于或等于最大塔面能量半徑,則通知所述量化索 引計(jì)算子模塊計(jì)算所述D8格點(diǎn)在碼本中的量化索引;如果大于最大塔面能量半徑,還用于 將該編碼子帶規(guī)整后的待量化矢量進(jìn)行能量截?cái)?,并通知所述格點(diǎn)量化子模塊將能量截 斷,直至能量截?cái)嗪蟮拇炕噶康牧炕顸c(diǎn)的能量不大于最大塔面能量半徑,同時(shí)對能 量截?cái)嗪蟮拇炕噶砍掷m(xù)增加其自身的一個小能量,并通知所述格點(diǎn)量化子模塊將增加 小能量后的待量化矢量量化到D8格點(diǎn),直至其量化到的D8格點(diǎn)的能量超過最大塔面能量半 徑,還用于通知量化索引計(jì)算子模塊計(jì)算最后一個能量不超過最大塔面能量半徑的D8格點(diǎn) 在碼本中的量化索引;索引量化計(jì)算模塊,與所述能量調(diào)整子模塊連接,用于根據(jù)能量調(diào)整子模塊的通知計(jì) 算所述隊(duì)格點(diǎn)在碼本中的量化索引。
35.如權(quán)利要求34所述的系統(tǒng),其特征在于,所述能量規(guī)整子模塊對所述8維待量化矢量進(jìn)行能量規(guī)整時(shí),用于根據(jù)所述8維待量 化矢量所在編碼子帶j中單個頻域系數(shù)所分配到的比特?cái)?shù)regi0n_bit(j),從下表中查詢 到該比特?cái)?shù)所對應(yīng)的碼本序號index和能量縮放因子scale ;然后根據(jù)下面的公式對待量 化矢量進(jìn)行能量規(guī)整
36.如權(quán)利要求27所述的系統(tǒng),其特征在于,所述分類格型矢量量化和編碼單元還包括與所述分類處理模塊連接的球型格型矢量 量化模塊,所述分類處理模塊還用于將高比特編碼子帶歸一化處理后的待量化矢量轉(zhuǎn)給球 型格型矢量量化模塊處理;所述球型格型矢量量化模塊用于對高比特編碼子帶歸一化處理 后的待量化矢量進(jìn)行球型格型矢量量化,包括能量規(guī)整子模塊、格點(diǎn)量化子模塊、零矢量條 件判斷子模塊、能量調(diào)整子模塊及索引矢量計(jì)算子模塊,其中所述能量規(guī)整子模塊,用于對編碼子帶中的8維待量化矢量進(jìn)行能量規(guī)整; 所述格點(diǎn)量化子模塊,與所述能量規(guī)整子模塊連接,用于將8維待量化矢量量化到D8 格點(diǎn);零矢量條件判斷子模塊,與所述格點(diǎn)量化子模塊連接,用于判斷所述D8格點(diǎn)是否滿足 零矢量條件,具體包括,能量規(guī)整后的格點(diǎn)滿足零矢量條件時(shí),通知索引矢量計(jì)算子模塊計(jì) 算所述格點(diǎn)的索引矢量;能量規(guī)整后的格點(diǎn)不滿足零矢量條件時(shí),通知所述能量調(diào)整子模 塊對待量化矢量的能量進(jìn)行調(diào)整;所述零矢量條件是指將通過矢量量化得到的隊(duì)格點(diǎn)值除 以2的比特分配數(shù)次方后再投影到D8格點(diǎn),投影后的D8格點(diǎn)值是零矢量,其中 region_bit(j)表示第j個編碼子帶中單個頻域系數(shù)所分配到的比特?cái)?shù);所述能量調(diào)整子模塊,與所述零矢量條件判斷子模塊及格點(diǎn)量化子模塊連接,用于將待量化矢量的值進(jìn)行截?cái)?,并通知所述格點(diǎn)量化子模塊將能量截?cái)嗪蟮拇炕噶苛炕?D8格點(diǎn),直至零矢量條件滿足;還用于備份待量化矢量自身的小倍數(shù)值w,對能量截?cái)嗪蟮?待量化矢量加上備份的小倍數(shù)值w,以及通知所述格點(diǎn)量化子模塊將能量截?cái)嗪蟮拇炕?矢量量化到D8格點(diǎn),直至零矢量條件不滿足,還用于通知索引矢量計(jì)算子模塊計(jì)算最近滿 足零矢量條件的D8格點(diǎn)的索引矢量;所述索引矢量計(jì)算子模塊,用于與所述零矢量條件判斷子模塊及能量調(diào)整子模塊連 接,用于根據(jù)零矢量條件判斷子模塊及能量調(diào)整子模塊的通知計(jì)算所述D8格點(diǎn)在碼本中的 量化索引。
37.如權(quán)利要求36所述的系統(tǒng),其特征在于,所述能量規(guī)整子模塊,對所述8維待量化矢量進(jìn)行能量規(guī)整時(shí),先根據(jù)待量化矢量 所在編碼子帶j中單個頻域系數(shù)所分配到的比特?cái)?shù)regi0n_bit(j),查詢到該比特?cái)?shù)所對 應(yīng)和能量縮放因子scale (regi0n_bit(j));然后根據(jù)下面的公式第m個對待量化矢量 進(jìn)行能量規(guī)整
38.如權(quán)利要求37所述的系統(tǒng),其特征在于,所述分類格型矢量量化和編碼單元還包括編碼類型判斷模塊、霍夫曼編碼模塊、自然 編碼模塊及比特分配修正模塊,其中編碼類型判斷模塊,用于判斷所有低比特編碼子帶的量化索引經(jīng)過霍夫曼編碼后所消 耗比特的總數(shù)是否小于所有低比特編碼子帶的量化索引自然編碼所需要的比特?cái)?shù)總數(shù),如 果是,則通知霍夫曼編碼模塊及比特分配修正模塊;否則通知自然編碼模塊;霍夫曼編碼模塊,用于對低比特編碼子帶的量化索引進(jìn)行霍夫曼編碼,并設(shè)置頻域系 數(shù)霍夫曼編碼標(biāo)識為1或true ;自然編碼模塊,用于對低比特編碼子帶的量化索引及高比特編碼子帶的索引矢量進(jìn)行 自然編碼;所述比特分配修正模塊,用于利用霍夫曼編碼節(jié)省下來的比特對編碼子帶的比特分配 數(shù)進(jìn)行修正,以及通知所述分類處理模塊對修正了比特分配數(shù)的編碼子帶分類后,再次進(jìn)行矢量量化和編碼。
39.如權(quán)利要求38所述的系統(tǒng),其特征在于,所述比特分配修正模塊進(jìn)行比特分配時(shí), 在所有編碼子帶中尋找重要性最大的編碼子帶,如果該編碼子帶所分配的比特?cái)?shù)已經(jīng)達(dá)到 可能分配給與的最大值,則將該編碼子帶的重要性調(diào)整到最低,不再對該編碼子帶修正比 特分配數(shù),否則對該重要性最大的編碼子帶進(jìn)行比特分配修正;在比特分配修正過程中,對比特分配數(shù)為0的編碼子帶分配1個比特,比特分配后重要 性降低1 ;對比特分配數(shù)大于0且小于5的編碼子帶分配0. 5個比特,比特分配后重要性降 低0. 5 ;對比特分配數(shù)大于5的編碼子帶分配1個比特,比特分配后重要性降低1。
40.如權(quán)利要求38所述的系統(tǒng),其特征在于所述比特分配修正模塊每修正一次比特 分配數(shù),即將比特分配修正迭代次數(shù)count加1,當(dāng)比特分配修正迭代次數(shù)count達(dá)到預(yù) 設(shè)上限值或能夠使用的比特?cái)?shù)小于比特分配修正所需要的比特?cái)?shù)時(shí),結(jié)束比特分配修正流 程。
41.如權(quán)利要求40所述的系統(tǒng),其特征在于所述比特流復(fù)用器對編碼后的比特復(fù)用 打包的順序依次為幅值包絡(luò)霍夫曼編碼標(biāo)識、頻域系數(shù)霍夫曼編碼標(biāo)識、比特分配修正迭 代次數(shù)、幅值包絡(luò)的編碼比特、頻域系數(shù)的編碼比特。
42.如權(quán)利要求38所述的系統(tǒng),其特征在于,所述霍夫曼編碼模塊對所有低比特編碼子帶的量化索引進(jìn)行霍夫曼編碼時(shí),根據(jù)編碼子帶中單個頻域系數(shù)所分配到的比特?cái)?shù),對編碼子帶的矢量量化索引使用不同的碼本進(jìn)行 編碼。
43.如權(quán)利要求38所述的系統(tǒng),其特征在于,所述霍夫曼編碼模塊對所有低比特編碼子帶的量化索引進(jìn)行霍夫曼編碼時(shí)在單個頻域系數(shù)所分配到的比特?cái)?shù)為大于1小于5但除去2的所有編碼子帶中,對每 個矢量量化索引的自然二進(jìn)制碼中每4位分成一組并對其進(jìn)行霍夫曼編碼,所有4位一組 的霍夫曼編碼比特?cái)?shù)之和就是該量化索引的霍夫曼編碼的消耗比特?cái)?shù);在單個頻域系數(shù)所分配到的比特?cái)?shù)為2的所有編碼子帶中,對每個8維矢量的塔型格 型矢量量化索引使用15個比特進(jìn)行編碼,將15個比特分成3組4位比特和1組3位比特, 然后對它們分別進(jìn)行霍夫曼編碼,4組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍 夫曼編碼消耗比特?cái)?shù);當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引小于127,則對量 化索引使用7個比特進(jìn)行編碼,把7個比特分成1組3比特和1組4比特,分別對兩組進(jìn) 行霍夫曼編碼,兩組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍夫曼編碼消耗比特 數(shù);當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引等于127,則定義 它的自然二進(jìn)制碼值為” 1111 1110”,把前面7個1分成1組3比特和1組4比特,分別對 兩組進(jìn)行霍夫曼編碼,兩組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍夫曼編碼消 耗比特?cái)?shù);當(dāng)編碼子帶的單個頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引等于128,則定義 它的自然二進(jìn)制碼值為” 1111 1111”,把前面7個1分成1組3比特和1組4比特,分別對 兩組進(jìn)行霍夫曼編碼,兩組的霍夫曼編碼比特消耗數(shù)之和就是該量化索引的霍夫曼編碼消 耗比特?cái)?shù)。
44.一種格型矢量量化音頻解碼系統(tǒng),其特征在于,該系統(tǒng)包括比特流解復(fù)用器、編碼 子帶幅值包絡(luò)解碼單元、比特分配單元、頻域系數(shù)解碼單元;分類格型矢量量化反量化單 元、反歸一化處理單元、噪聲填充單元、修正離散余弦逆變換(IMDCT)單元,其中比特流解復(fù)用器,用于從待解碼比特流中分離出幅值包絡(luò)編碼比特、頻域系數(shù)編碼比特;所述幅值包絡(luò)解碼單元,與所述比特流解復(fù)用器連接,用于對所述比特流解復(fù)用器輸 出的幅值包絡(luò)的編碼比特進(jìn)行解碼,得到各編碼子帶的幅值包絡(luò)量化指數(shù);所述比特分配單元,與所述幅值包絡(luò)解碼單元連接,用于進(jìn)行比特分配,得到各編碼子 帶中為每個頻域系數(shù)所分配的編碼比特?cái)?shù);頻域系數(shù)解碼單元,與幅值包絡(luò)解碼單元和比特分配單元連接,用于對低比特編碼子 帶解碼,得到低比特編碼子帶的量化索引;以及對高比特編碼子帶進(jìn)行解碼得到高比特編 碼子帶的索引矢量,其中,所述低比特編碼子帶是指該編碼子帶中單個頻域系數(shù)所分配到 的比特?cái)?shù)小于預(yù)設(shè)閾值的編碼子帶,所述高比特編碼子帶是指該編碼子帶中單個頻域系數(shù) 所分配到的比特?cái)?shù)大于或等于預(yù)設(shè)閾值的編碼子帶;分類格型矢量量化反量化單元,用于對低比特編碼子帶的量化索引進(jìn)行塔型格型矢量 量化反量化,以及對高比特編碼子帶的索引矢量進(jìn)行球型格型矢量量化反量化;反歸一化處理單元,用于對編碼子帶反量化后的值進(jìn)行反歸一化,得到頻域系數(shù);噪聲填充單元,用于對頻域系數(shù)生成單元輸出的頻域系數(shù)輸出值中未分配比特的子帶 進(jìn)行噪聲填充;修正離散余弦逆變換(IMDCT)單元,與所述噪聲填充單元連接,用于對噪聲填充后的 頻域系數(shù)進(jìn)行IMDCT,得到音頻信號。
45.如權(quán)利要求44所述的系統(tǒng),其特征在于,所述比特分配單元包括相連接的重要性計(jì)算模塊及比特分配模塊,其中重要性計(jì)算模塊用于根據(jù)編碼子帶幅值包絡(luò)值計(jì)算各編碼子帶重要性的初始值;所述比特分配模塊用于根據(jù)各編碼子帶的重要性對編碼子帶中每個頻域系數(shù)進(jìn)行比 特分配,且在比特分配過程中,比特分配步長及比特分配后重要性降低的步長均是變化的。
46.如權(quán)利要求44所述的系統(tǒng),其特征在于,所述比特分配單元,還包括與所述比特分配模塊連接的比特分配修正模塊,用于在進(jìn) 行比特分配之后,根據(jù)編碼端的比特分配修正迭代次數(shù)count值和各編碼子帶的重要性, 對編碼子帶再進(jìn)行count次比特分配修正。
47.如權(quán)利要求46所述的系統(tǒng),其特征在于,所述比特分配模塊進(jìn)行比特分配時(shí),低比特編碼子帶的比特分配步長及比特分配后的 重要性降低步長小于零比特編碼子帶和高比特編碼子帶的比特分配步長及比特分配后的 重要性降低步長。所述比特分配修正模塊進(jìn)行比特分配修正時(shí),低比特編碼子帶的比特分配修正步長及 比特分配修正后的重要性降低步長小于零比特編碼子帶和高比特編碼子帶的比特分配修 正步長及比特分配修正后的重要性降低步長。
48.如權(quán)利要求45所述的系統(tǒng),其特征在于,所述頻域系數(shù)解碼單元,對低比特編碼子帶解碼時(shí),根據(jù)編碼端的頻域系數(shù)霍夫曼編 碼標(biāo)識對低比特編碼子帶進(jìn)行霍夫曼解碼或進(jìn)行自然解碼得到低比特編碼子帶的矢量量 化索引;對高比特編碼子帶解碼時(shí),直接進(jìn)行自然解碼得到高比特編碼子帶的矢量量化索 引。
49.如權(quán)利要求45所述的系統(tǒng),其特征在于,所述頻域系數(shù)解碼單元對低比特編碼子帶進(jìn)行霍夫曼解碼方法時(shí),當(dāng)編碼子帶的單個 頻域系數(shù)所分配到的比特?cái)?shù)為1時(shí),如果量化索引的自然二進(jìn)制碼值小于” 1111 111”,則按 照自然二進(jìn)制碼值計(jì)算量化索引;如果量化索引的自然二進(jìn)制碼值等于” 1111 111”,則繼 續(xù)讀入下一位比特,如果下一位比特是0,則量化索引值為127,如果下一位比特是1,則量 化索引值為128。
50.如權(quán)利要求45所述的系統(tǒng),其特征在于,所述分類格型矢量量化反量化單元包括分類處理模塊及塔型格型矢量量化反量化模 塊,其中,分類處理模塊,用于將低比特編碼子帶的量化索引轉(zhuǎn)給塔型格型矢量量化器;所述塔型格型矢量量化反量化模塊,用于對低比特編碼子帶的量化索引進(jìn)行反量化, 包括相連接的格點(diǎn)反量化子模塊及能量反規(guī)整子模塊,其中所述格點(diǎn)反量化子模塊,用于確定低比特編碼子帶的量化索引所在的能量塔面及在該能量塔面上的標(biāo)號,以及進(jìn)一步求解對應(yīng)的D8格點(diǎn);能量反規(guī)整子模塊,用于對所求D8格點(diǎn)Y進(jìn)行能量反規(guī)整,得到
51.權(quán)利要求45所述的系統(tǒng),其特征在于,所述分類格型矢量量化反量化單元還包括球型格型矢量量化反量化模塊,所述分類處 理模塊,還用于將高比特編碼子帶的索引矢量轉(zhuǎn)給球型格型矢量量化模塊處理;球型格型矢量量化反量化模塊用于對高比特編碼子帶的索引矢量進(jìn)行反量化,包括相 連接的格點(diǎn)反量化子模塊及能量反規(guī)整子模塊,其中所述格點(diǎn)反量化子模塊,用于求解索引矢量對應(yīng)的D8格點(diǎn),具體包括 計(jì)算 χ = k * G,并計(jì)算 ytemp = x/(2" (region_bit (j));和計(jì)算D8格點(diǎn)y = X-fD8(ytemp)*(2~(regi0n_bit(j));其中,k為矢量量化的索引矢 量,regi0n_bit(j)表示編碼子帶j中單個頻域系數(shù)的比特分配數(shù);6為隊(duì)格點(diǎn)的生成矩陣, 形式如下
全文摘要
本發(fā)明格型矢量量化音頻編碼方法包括將音頻信號經(jīng)過MDCT變換后的頻域系數(shù)劃分為若干個編碼子帶,并對各編碼子帶的幅值包絡(luò)值進(jìn)行量化和編碼,得到幅值包絡(luò)的編碼比特;對各編碼子帶進(jìn)行比特分配,并對低比特編碼子帶和高比特編碼子帶中的矢量分別使用塔型格型矢量量化方法和球型格型矢量量化方法進(jìn)行歸一化、量化和編碼,得到頻域系數(shù)的編碼比特;將各編碼子帶的幅值包絡(luò)的編碼比特和頻域系數(shù)的編碼比特復(fù)用打包后,傳送給解碼端。本發(fā)明格型矢量量化音頻編解碼方法和系統(tǒng),以獲得較好的語音信源編碼效果。
文檔編號G10L19/00GK102081926SQ20091024985
公開日2011年6月1日 申請日期2009年11月27日 優(yōu)先權(quán)日2009年11月27日
發(fā)明者劉開文, 彭科, 林志斌, 袁浩, 鄧崢, 陳國明, 黎家力 申請人:中興通訊股份有限公司