專利名稱:一種音頻碼率控制方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及音頻編解碼領(lǐng)域,尤其涉及一種音頻碼率控制方法及系統(tǒng)。
背景技術(shù):
傳統(tǒng)的數(shù)字音頻壓縮技術(shù)主要采用波形編碼,通過(guò)降低數(shù)據(jù)的熵冗余度, 實(shí)現(xiàn)對(duì)數(shù)據(jù)的壓縮。這種方法沒(méi)有考慮到人耳聽(tīng)覺(jué)效果的主觀特性,算法壓縮
率較低,音質(zhì)也較差,其主要用于窄帶音頻信號(hào)的壓縮,如A律編碼。為了 在有限的網(wǎng)絡(luò)帶寬上傳輸更好的聲音質(zhì)量,一種基于人耳主觀感知特征的音頻 壓縮技術(shù)得到了發(fā)展,相關(guān)方面先后制定了 MPEG-1 Audio、 MPEG-2Audio、 MPEG-2 AAC (Advanced Audio Coding,高級(jí)音頻編碼)、Dolby(AC國(guó)3)、 MPEG國(guó)4 AAC等音頻壓縮標(biāo)準(zhǔn)。這種音頻數(shù)據(jù)壓縮方法充分利用人耳聽(tīng)覺(jué)系統(tǒng)的感知 特性,在原始數(shù)據(jù)中去掉人耳無(wú)法聽(tīng)到的信號(hào)細(xì)節(jié),從而實(shí)現(xiàn)了較低碼率下的 寬頻語(yǔ)音或音頻信號(hào)的編碼。經(jīng)過(guò)這種方法壓縮的音頻信號(hào)雖然存在失真,但 是這些失真人耳是聽(tīng)不到的,對(duì)人耳是"透明"的,也就是說(shuō)對(duì)人耳的聽(tīng)覺(jué)是 沒(méi)有影響的。
現(xiàn)有技術(shù)在比特分配和量化的過(guò)程中,AAC規(guī)范中釆用 一種被廣泛使用 的基于兩層嵌套循環(huán)的比特分配方案,ACC標(biāo)準(zhǔn)通過(guò)兩層循環(huán)來(lái)調(diào)整各個(gè)子 帶的比例因子的大小,并以此來(lái)實(shí)現(xiàn)各個(gè)子帶間的比特分配,其中外層循環(huán)用 來(lái)控制各個(gè)子帶的量化噪聲不超過(guò)掩蔽閾值,內(nèi)層循環(huán)用來(lái)控制量化編碼頻域 系數(shù)所需要的比特?cái)?shù)不超過(guò)當(dāng)前可用比特?cái)?shù),這兩層循環(huán)交替進(jìn)行,直到兩層 循環(huán)的控制條件都被滿足或別的退出條件被滿足。如圖l所示,內(nèi)層循環(huán)根據(jù) 全局比例因子對(duì)頻域系統(tǒng)進(jìn)行量化和編碼,并統(tǒng)計(jì)編碼比特?cái)?shù),若編碼所需比 特?cái)?shù)大于可用比特?cái)?shù),則增大全局比例因子,重復(fù)上述過(guò)程直到編碼所需比特 數(shù)小于可用比特?cái)?shù)。如圖2所示,外層循環(huán)計(jì)算每個(gè)比例因子帶的量化噪聲,并將每個(gè)比例因子帶的量化噪聲控制在心理聲學(xué)模型計(jì)算出的掩蔽閾值范圍 內(nèi)。當(dāng)某個(gè)比例因子帶的量化噪聲超過(guò)掩蔽閾值時(shí),則增加該比例因子帶的比 例因子,通過(guò)降低量化步長(zhǎng)來(lái)減少量化噪聲,盡可能地使該比例因子帶的量化 噪聲小于掩蔽閾值。在所述的外層循環(huán)中,各子帶的頻域系數(shù)被由比例因子所 確定的量化步長(zhǎng)進(jìn)行量化,得到量化系數(shù),接著量化系數(shù)又被反量化得到反量 化系數(shù),然后由頻域系數(shù)與反量化系數(shù)相減得到各個(gè)子帶的量化噪聲。在內(nèi)層 循環(huán)中,同樣,各個(gè)子帶的頻域系數(shù)被量化成量化系數(shù),然后量化系數(shù)被編碼 成相應(yīng)的碼字,再統(tǒng)計(jì)這些碼字的總長(zhǎng)度,這個(gè)長(zhǎng)度加上其它一些輔助信息的 編碼長(zhǎng)度后就得到了編碼所需的比特?cái)?shù)。
發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn),現(xiàn)有技術(shù)至少存在以下缺點(diǎn)現(xiàn)有技 術(shù)需要進(jìn)行大量的運(yùn)算,計(jì)算復(fù)雜。內(nèi)層循環(huán)對(duì)頻域系數(shù)進(jìn)行量化和編碼,各 比例因子帶遍歷一次,計(jì)算復(fù)雜;外層循環(huán)計(jì)算每個(gè)比例因子帶的量化噪聲, 只要有一個(gè)子帶不滿足要求,就會(huì)再次調(diào)用內(nèi)層循環(huán),導(dǎo)致內(nèi)層循環(huán)運(yùn)行次數(shù) 增多,算法運(yùn)算量增大。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提出一種音頻碼率控制方法及系統(tǒng),能夠在降低算法復(fù)雜度 的基礎(chǔ)上兼顧聲音質(zhì)量。
本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的
一種音頻碼率控制方法,包括
根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶;
根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值;
才艮據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子d吏得所述 子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例因子對(duì)所述子 帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù);
當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步調(diào)整子帶的有效比例
因子來(lái)調(diào)整編碼所需比特?cái)?shù)。
一種音頻碼率控制系統(tǒng),包括
第一確定單元,用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶;第一計(jì)算單元,用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因
子的初始l直;
第一編碼單元,用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效 比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有 效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所 需比特?cái)?shù);
判斷單元,用于判斷編碼所需比特?cái)?shù)是否大于所述可用比特?cái)?shù); 調(diào)整單元,用于當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步調(diào)整
子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù),使編碼所需比特?cái)?shù)小于或等于所
述可用比特?cái)?shù)。
本發(fā)明實(shí)施例所述技術(shù)方案將比特分配、量化編碼過(guò)程拆分成兩個(gè)獨(dú)立的 循環(huán),大大降低了計(jì)算復(fù)雜度,在量化噪聲、編碼碼率不能同時(shí)滿足要求時(shí), 通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)降低編碼比特?cái)?shù),從而有利于保持較 高的語(yǔ)音質(zhì)量,在降低算法復(fù)雜度的基礎(chǔ)上兼顧了聲音質(zhì)量。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施 例或現(xiàn)有技術(shù)描迷中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述 中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付 出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為現(xiàn)有技術(shù)AAC規(guī)范中比特分配方法的內(nèi)層循環(huán)示意流程圖2為現(xiàn)有技術(shù)AAC規(guī)范中比特分配方法的外層循環(huán)示意流程圖3為子帶編碼示意圖4為現(xiàn)有技術(shù)中MPEG-4 AAC的編碼流程示意圖5為本發(fā)明一種音頻碼率控制方法第一實(shí)施例的流程圖6為本發(fā)明一種音頻碼率控制方法第二實(shí)施例的流程圖7為本發(fā)明一種音頻碼率控制方法第三實(shí)施例的流程圖8為本發(fā)明一種音頻碼率控制方法第四實(shí)施例的流程圖9為本發(fā)明一種音頻碼率控制系統(tǒng)第一實(shí)施例的組成結(jié)構(gòu)7圖10為本發(fā)明一種音頻碼率控制系統(tǒng)第二實(shí)施例的組成結(jié)構(gòu)圖; 圖11為本發(fā)明一種音頻碼率控制系統(tǒng)第三實(shí)施例的組成結(jié)構(gòu)圖; 圖12為本發(fā)明一種音頻碼率控制系統(tǒng)第四實(shí)施例的組成結(jié)構(gòu)圖。
具體實(shí)施例方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清 楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是 全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造 性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
為了更清楚的闡述本發(fā)明實(shí)施例的技術(shù)方案,下面先以MPEG-4 AAC音 頻編碼算法為例,闡述基于人耳聽(tīng)覺(jué)系統(tǒng)感知特性的音頻編碼器的關(guān)鍵技術(shù)點(diǎn) 和編》馬過(guò)禾呈。
1、所述關(guān)鍵技術(shù)點(diǎn)包括心理聲學(xué)模型和子帶編碼。
(1) 心理聲學(xué)模型主要用來(lái)描述人耳聽(tīng)覺(jué)系統(tǒng)對(duì)聲音的感知特性,是所 有基于感知音頻編碼算法的核心。其主要利用了人耳聽(tīng)覺(jué)的兩個(gè)特性來(lái)進(jìn)行壓 縮編碼聽(tīng)覺(jué)閾度、掩蔽效應(yīng)。
聽(tīng)覺(jué)閾度人耳對(duì)聲音的感知在頻率、響度上都有一定范圍。頻率方面, 正常人可以聽(tīng)到20Hz 20000Hz的聲音信號(hào);響度方面,人耳對(duì)不同頻率的響 度有一條聽(tīng)閾曲線,在這條曲線之下的對(duì)應(yīng)頻率的信號(hào)是聽(tīng)不到的。此外人耳 對(duì)不同頻率的聲音敏感程度差別很大,其中對(duì)2000Hz 4000Hz范圍的信號(hào)最 敏感,幅度很低的信號(hào)都能被人耳聽(tīng)到,而對(duì)于高頻信號(hào),敏感程度明顯降低。
掩蔽效應(yīng) 一種頻率的聲音阻礙聽(tīng)覺(jué)系統(tǒng)感知另一種頻率的聲音的現(xiàn)象稱 為掩蔽效應(yīng)。兩個(gè)聲音的頻率越接近,相互的掩蔽效應(yīng)越明顯;低頻信號(hào)對(duì)高 頻信號(hào)掩蔽作用明顯,但高頻信號(hào)對(duì)低頻信號(hào)的掩蔽效應(yīng)不明顯。對(duì)于被掩蔽 的信號(hào)可以不參與編碼,從而降低編碼速率。
(2) 子帶編碼
如圖3所述,子帶編碼將信號(hào)在頻域劃分成N個(gè)子帶(比例因子帶),每 個(gè)比例因子帶內(nèi)包含若干條語(yǔ)線,同一個(gè)比例因子帶內(nèi)的各條譜線,采用相同 的量化階(相同的比例因子)進(jìn)行量化。各比例因子帶的量化誤差等于子帶內(nèi)
8各條譜線量化誤差之和。利用心理聲學(xué)模型計(jì)算出各個(gè)比例因子帶的掩蔽閾 值,在對(duì)鐠線進(jìn)行量化編碼時(shí),只要比例因子帶的量化噪聲小于掩蔽閾值,量 化噪聲就不會(huì)人耳察覺(jué),從而實(shí)現(xiàn)對(duì)人耳的"無(wú)損壓縮"。
2、 MPEG-4 AAC簡(jiǎn)化的編碼流程如圖4所示。
1 、心理聲學(xué)模型模塊根據(jù)人耳的聽(tīng)覺(jué)特性計(jì)算出各個(gè)比例因子帶的掩蔽 閾值;
2、音頻時(shí)域信號(hào)經(jīng)過(guò)時(shí)頻變換得到頻域的MDCT( Modified discrete cosine transform,改進(jìn)型的離散余弦變換)鐠系數(shù);
3 )量化編碼-溪塊根據(jù)全局比例因子、各子帶比例因子對(duì)MDCT語(yǔ)系數(shù)進(jìn) 行量化和編碼,AAC中MDCT鐠系數(shù)量化公式為
旦疆一 MDCT譜線絕對(duì)值o'75
里K/1且 -^ 0.1875 * (全局比例因子~~-子帶比例因子)~ ,其中有效比例因子-
全局比例因子-子帶比例因子;
4) 碼率控制模塊根據(jù)量化編碼模塊的量化噪聲及編碼所需比特?cái)?shù),調(diào)整 全局比例因子、各子帶比例因子,使得每個(gè)比例因子帶的量化噪聲小于該比例 因子帶的掩蔽閾值,同時(shí)編碼所需比特?cái)?shù)小于可用比特?cái)?shù),。在量化噪聲、編 碼所需比特?cái)?shù)不能同時(shí)滿足要求時(shí),就需要在聲音效果、編碼比特?cái)?shù)之間作出 平衡,以保證在較低的碼率下提供更好的聲音質(zhì)量。
5) 比特流格式器將MDCT諳系數(shù)的Huffman編碼值及相關(guān)邊信息按照 AAC的碼流格式寫入碼流。
參照?qǐng)D5,示出了本發(fā)明一種音頻碼率控制方法第一實(shí)施例的流程圖,包 括步驟
步驟510、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù),即確定該碼率下優(yōu)先保證的頻帶 寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下,在選擇初次編碼子帶 數(shù)時(shí),可以使其僅覆蓋到14kHz頻帶寬度,即優(yōu)先保證14kHz頻帶寬度內(nèi)的 聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感,因此在 有帶寬限制的情況下,優(yōu)先量化編碼低頻的子帶,這樣對(duì)聲音的壓縮損失會(huì)少 很多,甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。為了完成對(duì)音頻信號(hào)的編碼處理,首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)
換,時(shí)頻變化除了前面描述的MDCT外,現(xiàn)有技術(shù)中還有多種實(shí)現(xiàn)方式,參 照相關(guān)現(xiàn)有的描述即可,得到所述音頻信號(hào)的頻域系數(shù),然后將所述頻域系數(shù) 按固定的頻帶分劃劃分為若干個(gè)頻域子帶,此過(guò)程在前面進(jìn)行了詳細(xì)描述,在 此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù),根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編 碼的子帶。
值。'* 、'々、,、、 、、
通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析,得到各個(gè)頻域子帶的噪聲掩蔽閾 值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù),在此 不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后,利用待編碼子帶的掩蔽閾值 計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量 化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整,因此所述計(jì)算不必太精確,利用各子帶的掩蔽閾值 估計(jì)出各子帶有效比例因子的初始值即可。
步驟530、根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因 子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例 因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比 例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行Huffinan編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟540、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步調(diào)整子帶的有 效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù),使所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
若初次編碼所需比特?cái)?shù)大于可用比特?cái)?shù),則表明需要進(jìn)行碼率控制,通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù),直到滿足可用比特 數(shù)的要求。分步調(diào)整有效比例因子的方法可以有多種,將在后面的實(shí)施例中進(jìn) 行詳細(xì)描述,本領(lǐng)域技術(shù)人員可以理解,也并不局限于后面各實(shí)施例所描述的 方法,其它分步調(diào)整有效比例因子的方法也在本發(fā)明的保護(hù)范圍之內(nèi)。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻 率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
本發(fā)明實(shí)施例所述技術(shù)方案將比特分配、量化編碼過(guò)程拆分成兩個(gè)獨(dú)立的 循環(huán),大大降低了計(jì)算復(fù)雜度,在量化噪聲、編碼碼率不能同時(shí)滿足要求時(shí), 通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)降低編碼比特?cái)?shù),從而有利于保持較 高的語(yǔ)音質(zhì)量,在降低算法復(fù)雜度的基礎(chǔ)上兼顧了聲音質(zhì)量。
參照?qǐng)D6,示出了本發(fā)明一種音頻碼率控制方法第二實(shí)施例的流程圖,包 括步驟
步驟610、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù),即確定該碼率下優(yōu)先保證的頻帶 寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下,在選擇初次編碼子帶 數(shù)時(shí),可以使其僅覆蓋到14kHz頻帶寬度,即優(yōu)先保證14kHz頻帶寬度內(nèi)的 聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感,因此在 有帶寬限制的情況下,優(yōu)先量化編碼低頻的子帶,這樣對(duì)聲音的壓縮損失會(huì)少 很多,甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理,首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換,得到所述音頻信號(hào)的頻域系數(shù),然后將所述頻域系數(shù)按固定的頻帶分劃劃 分為若干個(gè)頻域子帶,此過(guò)程在前面進(jìn)行了詳細(xì)描述,在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù),根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編 碼的子帶。
步驟620、根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析,得到各個(gè)頻域子帶的噪聲掩蔽閾 值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù),在此 不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后,利用待編碼子帶的掩蔽閾值 計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)^f亍量 化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整,因此所述計(jì)算不必太精確,利用各子帶的掩蔽閾值 估計(jì)出各子帶有效比例因子的初始值即可。
步驟630、才艮據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因 子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例 因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比 例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行huffman編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟640、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù),如果所需比特?cái)?shù)大 于所述可用比特?cái)?shù),則進(jìn)入步驟650;否則進(jìn)入步驟690。
步驟650、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),確定有效比例因子最小 值的子帶。
根據(jù)各子帶能量的大小,優(yōu)先調(diào)整能量小的子帶。根據(jù)人耳聽(tīng)覺(jué)感知特性 中的掩蔽效應(yīng)可知,音量大的信號(hào)可以掩蔽音量小的信號(hào),故優(yōu)先調(diào)整能量小 的子帶,可以最大限度將量化噪聲的影響降到最低。 一般而言,子帶的能量越 大,則有效比例因子也就越大,因此可以用有效比例因子的大小反應(yīng)子帶能量 的大小。
步驟660、放大所述子帶的有效比例因子。
調(diào)整所述有效比例因子最小值的子帶的有效比例因子(量化步長(zhǎng)),由于 所需比特?cái)?shù)大于所述可用比特?cái)?shù),因此需要放大所述子帶的有效比例因子。 步驟670、對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定其所需比特^t。
根據(jù)放大后的有效比例因子對(duì)該子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù) 進(jìn)行編碼,確定所需比特?cái)?shù)。
步驟680、判斷所需比特?cái)?shù)是否大于可用比特?cái)?shù),如果所需比特?cái)?shù)大于所 述可用比特?cái)?shù),則進(jìn)入步驟650;否則結(jié)束流程。
步驟6卯、當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它 子帶按照頻率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí),優(yōu)先調(diào)整能量小的子帶的有效 比例因子,從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D7,示出了本發(fā)明一種音頻碼率控制方法第三實(shí)施例的流程圖,包 括步驟
步驟710、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù),即確定該碼率下優(yōu)先保證的頻帶 寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下,在選擇初次編碼子帶 數(shù)時(shí),可以使其僅覆蓋到14kHz頻帶寬度,即優(yōu)先保證14kHz頻帶寬度內(nèi)的 聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感,因此在 有帶寬限制的情況下,優(yōu)先量化編碼低頻的子帶,這樣對(duì)聲音的壓縮損失會(huì)少 很多,甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理,首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換,得到所述音頻信號(hào)的頻域系數(shù),然后將所述頻域系數(shù)按固定的頻帶分劃劃 分為若干個(gè)頻域子帶,此過(guò)程在前面進(jìn)行了詳細(xì)描述,在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù),根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編 碼的子帶。
步驟720、根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。
通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析,得到各個(gè)頻域子帶的噪聲掩蔽閾
13值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù),在此 不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽闊值后,利用待編碼子帶的掩蔽閾值 計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量
化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整,因此所述計(jì)算不必太精確,利用各子帶的掩蔽閾值 估計(jì)出各子帶有效比例因子的初始值即可。
步驟730、 #4居所述子帶的有效比例因子的初始值調(diào)整所述有效比例因 子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例 因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比 例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行huffinan編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟740、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù),如果所需比特?cái)?shù)大 于所述可用比特?cái)?shù),則進(jìn)入步驟750;否則進(jìn)入步驟790。
步驟750、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),確定頻率最高的子帶。
當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),按照先高頻后低頻的原則,逐個(gè)調(diào) 整各子帶的有效比例因子。人耳對(duì)不同頻率的聲音敏感度差別很大,其中對(duì) 2000Hz 4000Hz范圍的信號(hào)最敏感,幅度很低的信號(hào)都能被人耳聽(tīng)到,而對(duì) 于高頻信號(hào),敏感程度明顯降低。因此,在聲音效果和碼率之間需要做出平衡 的時(shí)候,優(yōu)先調(diào)整高頻子帶,使噪聲更多的分布在高子帶,減少由于碼率控制 對(duì)聲音質(zhì)量的影響程度。
步驟760、放大所述子帶的有效比例因子。
調(diào)整所述頻率最高的子帶的有效比例因子(量化步長(zhǎng)),由于所需比特?cái)?shù) 大于所述可用比特?cái)?shù),因此需要放大所述子帶的有效比例因子。
步驟770、對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確 定其所需比特?cái)?shù)。根據(jù)放大后的有效比例因子對(duì)該子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù) 進(jìn)行編碼,確定所需比特?cái)?shù)。
步驟780、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù),如果所需比特?cái)?shù)大 于所述可用比特l史,則進(jìn)入步驟750;否則結(jié)束流程。
步驟790、當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它 子帶按照頻率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍,結(jié)束流程。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí),優(yōu)先調(diào)整頻率最高的子帶的有 效比例因子,從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D8,示出了本發(fā)明一種音頻碼率控制方法第四實(shí)施例的流程圖,包 括步驟
步驟810、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù),即確定該碼率下優(yōu)先保證的頻帶 寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下,在選擇初次編碼子帶 數(shù)時(shí),可以使其僅覆蓋到14kHz頻帶寬度,即優(yōu)先保證14kHz頻帶寬度內(nèi)的 聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感,因此在 有帶寬限制的情況下,優(yōu)先量化編碼低頻的子帶,這樣對(duì)聲音的壓縮損失會(huì)少 很多,甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理,首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換,得到所述音頻信號(hào)的頻域系數(shù),然后將所述頻域系數(shù)按固定的頻帶分劃劃 分為若干個(gè)頻域子帶,此過(guò)程在前面進(jìn)行了詳細(xì)描述,在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù),根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編 碼的子帶。
值。'a 、 、 ^ 、',、、
通過(guò)心理聲學(xué)沖莫型對(duì)時(shí)域信號(hào)進(jìn)行分析,得到各個(gè)頻域子帶的噪聲掩蔽閾 值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù),在此不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后,利用待編碼子帶的掩蔽閾值 計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量 化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整,因此所述計(jì)算不必太精確,利用各子帶的掩蔽閾值 估計(jì)出各子帶有效比例因子的初始值即可。
步驟830、根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因 子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,才艮據(jù)所述有效比例 因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比 例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行huffman編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟840、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù),如果所需比特?cái)?shù)大 于所述可用比特?cái)?shù),則進(jìn)入步驟850;否則進(jìn)入811。
步驟850、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),確定有效比例因子最小 值的子帶。
步驟860、當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí),確定所述多個(gè)子帶中 頻率最高的子帶。
步驟870、放大所述子帶的有效比例因子。
步驟880、對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確 定其所需比特?cái)?shù)。
根據(jù)放大后的有效比例因子對(duì)該子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù) 進(jìn)行編碼,確定所需比特?cái)?shù)。
步驟8卯、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù),如果所需比特?cái)?shù)大 于所述可用比特?cái)?shù),則進(jìn)入步驟850;否則進(jìn)入步驟811。
步驟811、當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它 子帶按照頻率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
16若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍,結(jié)束流程。
本實(shí)施例通過(guò)子帶的能量大小與先高頻后低頻相結(jié)合的方法,分步調(diào)整有 效比例因子,這種分步調(diào)整方法綜合考慮了掩蔽效應(yīng)、以及人耳對(duì)不同頻率的 敏感度。
參照?qǐng)D9,示出了本發(fā)明一種音頻碼率控制系統(tǒng)第一實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第 一編碼單元930、判斷單元940和調(diào)整單元950。
所述第一確定單元910、用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有 效比例因子的初始值。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整 所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根 據(jù)所迷有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確 定所需比特?cái)?shù)。
所述判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。 所述調(diào)整單元950、用于當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步
調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù),使所需比特?cái)?shù)小于或等于所
述可用比特?cái)?shù)。
本發(fā)明實(shí)施例所述技術(shù)方案將比特分配、量化編碼過(guò)程拆分成兩個(gè)獨(dú)立的 循環(huán),大大降低了計(jì)算復(fù)雜度,在量化噪聲、編碼碼率不能同時(shí)滿足要求時(shí), 通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)降低編碼比特?cái)?shù),從而有利于保持較 高的語(yǔ)音質(zhì)量,在降低算法復(fù)雜度的基礎(chǔ)上兼顧了聲音質(zhì)量。
參照?qǐng)D10,示出了本發(fā)明一種音頻碼率控制系統(tǒng)第二實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第 一編碼單元930、判斷單元940和調(diào)整單元950;所述調(diào)整單元950包括第 二確定模塊951、第一放大模塊952、第二編碼模塊953。
所述第一確定單元910、用于4艮據(jù)可用比特凄t確定進(jìn)行初次編碼的子帶。根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù),即確定該碼率下優(yōu)先保證的頻帶
寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下,在選擇初次編碼子帶 數(shù)時(shí),可以使其僅覆蓋到14kHz頻帶寬度,即優(yōu)先保證14kHz頻帶寬度內(nèi)的 聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感,因此在 有帶寬限制的情況下,優(yōu)先量化編碼低頻的子帶,這樣對(duì)聲音的壓縮損失會(huì)少 很多,甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理,首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換,得到所述音頻信號(hào)的頻域系數(shù),然后將所述頻域系數(shù)按固定的頻帶分劃劃 分為若干個(gè)頻域子帶,此過(guò)程在前面進(jìn)行了詳細(xì)描述,在此不再贅述。
因此,所述音頻碼率控制系統(tǒng)還包括轉(zhuǎn)換單元960、用于對(duì)輸入音頻信號(hào) 進(jìn)行時(shí)頻轉(zhuǎn)換,得到所述音頻信號(hào)的頻域系數(shù)。
劃分單元970、用于將所述頻域系數(shù)"^要固定的頻帶分劃劃分為頻域子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有 效比例因子的初始值。
通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析,得到各個(gè)頻域子帶的噪聲掩蔽閾 值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù),在此 不再贅述。
因此,所述音頻碼率控制系統(tǒng)還包括第二計(jì)算單元980、用于根據(jù)心理 聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后,利用待編碼子帶的掩蔽閾值 計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量 化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整,因此所述計(jì)算不必太精確,利用各子帶的掩蔽閾值 估計(jì)出各子帶有效比例因子的初始值即可。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整 所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根 據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確 定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行huffinan編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
所述判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。 所述調(diào)整單元950包括
第二確定模塊951、用于確定有效比例因子最小值的子帶。 第一放大模塊952、用于放大所述子帶的有效比例因子。 第二編碼模塊953、用于對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù) 進(jìn)行編碼,確定其所需比特?cái)?shù)。
當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),確定有效比例因子最小值的子帶。 根據(jù)各子帶能量的大小,優(yōu)先調(diào)整能量小的子帶。根據(jù)人耳聽(tīng)覺(jué)感知特性中的 掩蔽效應(yīng)可知,音量大的信號(hào)可以掩蔽音量小的信號(hào),故優(yōu)先調(diào)整能量小的子 帶,可以最大限度將量化噪聲的影響降到最低。 一般而言,子帶的能量越大, 則有效比例因子也就越大,因此可以用有效比例因子的大小反應(yīng)子帶能量的大 小。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻 率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
因此,所述音頻碼率控制系統(tǒng)還包括第五編碼單元990、用于當(dāng)所需比特 數(shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順 序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí),優(yōu)先調(diào)整能量小的子帶的有效 比例因子,從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D11,示出了本發(fā)明一種音頻碼率控制系統(tǒng)第三實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第 一編碼單元930、判斷單元940和調(diào)整單元950;所述調(diào)整單元950包括第三確定模塊954、第二放大模塊955、第三編碼模塊956。
所述第一確定單元910、用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。 所述音頻碼率控制系統(tǒng)還包括轉(zhuǎn)換單元960、用于對(duì)輸入音頻信號(hào)進(jìn)行時(shí)
頻轉(zhuǎn)換,得到所述音頻信號(hào)的頻域系數(shù)。
以及劃分單元970、用于將所述頻域系數(shù)按固定的頻帶分劃劃分為頻域子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有 效比例因子的初始值。
所迷音頻碼率控制系統(tǒng)還包括第二計(jì)算單元980、用于根據(jù)心理聲學(xué)模 型計(jì)算出所述子帶的掩蔽閾值。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整 所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根 據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確 定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比 例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行huffman編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
所迷判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。 所述調(diào)整單元950包括
第三確定模塊954、用于確定頻率最高的子帶。 第二放大模塊955、用于放大所述子帶的有效比例因子。 第三編碼模塊956、用于對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù) 進(jìn)行編碼,確定其所需比特?cái)?shù)。
當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),按照先高頻后低頻的原則,逐個(gè)調(diào) 整各子帶的有效比例因子。人耳對(duì)不同頻率的聲音敏感度差別很大,其中對(duì) 2000Hz 4000Hz范圍的信號(hào)最敏感,幅度很低的信號(hào)都能被人耳聽(tīng)到,而對(duì)
20于高頻信號(hào),敏感程度明顯降低。因此,在聲音效果和碼率之間需要做出平衡 的時(shí)候,優(yōu)先調(diào)整高頻子帶,^t噪聲更多的分布在高子帶,減少由于碼率控制 對(duì)聲音質(zhì)量的影響程度。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻 率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
因此,所述音頻碼率控制系統(tǒng)還包括第五編碼單元990、用于當(dāng)所需比特 數(shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順 序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí),優(yōu)先調(diào)整頻率最高的子帶的有 效比例因子,從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D12,示出了本發(fā)明一種音頻碼率控制系統(tǒng)第四實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第 一編碼單元930、判斷單元940和調(diào)整單元950;所述調(diào)整單元950包括第 四確定模塊957、第五確定模塊961、第三放大模塊958、第四編碼模塊959。
所述第一確定單元910、用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
所述音頻碼率控制系統(tǒng)還包括轉(zhuǎn)換單元960、用于對(duì)輸入音頻信號(hào)進(jìn)行時(shí) 頻轉(zhuǎn)換,得到所述音頻信號(hào)的頻域系數(shù)。
以及劃分單元970、用于將所述頻域系數(shù)按固定的頻帶分劃劃分為頻域子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有 效比例因子的初始值。
所述音頻碼率控制系統(tǒng)還包括第二計(jì)算單元980、用于根據(jù)心理聲學(xué)模 型計(jì)算出所述子帶的掩蔽閾值。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整 所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根 據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定所需比特^:。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化,調(diào)整各子帶的有效比例因子,使得待 編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比
例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行huffinan編碼,并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果,必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
所述判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。 所述調(diào)整單元950包括
第四確定模塊957、用于確定有效比例因子最小值的子帶。
第五確定模塊961、用于當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí),確定所 述多個(gè)子帶中頻率最高的子帶。
第三放大模塊958、用于放大所述子帶的有效比例因子。
第四編碼模塊959、用于對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù) 進(jìn)行編碼,確定其所需比特?cái)?shù)。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻 率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù),則說(shuō)明在優(yōu)先保證了低頻帶寬效 果的前提下,仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則,逐個(gè) 量化、編碼高頻子帶,直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
因此,所述音頻碼率控制系統(tǒng)還包括第五編碼單元9卯、用于當(dāng)所需比特 數(shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順 序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
本實(shí)施例通過(guò)子帶的能量大小與先高頻后低頻相結(jié)合的方法,分步調(diào)整有 效比例因子,這種分步調(diào)整方法綜合考慮了掩蔽效應(yīng)、以及人耳對(duì)不同頻率的 敏感度。
本發(fā)明各實(shí)施例中的第一編碼單元、第二編碼模塊、第三編碼模塊、第四 編碼模塊、第五編碼單元可以是同一個(gè)編碼裝置,也可以是獨(dú)立的多個(gè)編碼裝 置,本發(fā)明各實(shí)施例為了表明不同的功能將其分為多個(gè)編碼裝置,不能因此理解為不同的編碼裝置。
本發(fā)明各系統(tǒng)實(shí)施例是與方法實(shí)施例對(duì)應(yīng)的,因此,在系統(tǒng)實(shí)施例中未詳 細(xì)描述的部分參照方法實(shí)施例相應(yīng)部分的描述即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā) 明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā) 明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種音頻碼率控制方法,其特征在于,包括根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶;根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值;根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù);當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)。
2. 根據(jù)權(quán)利要求1所述的音頻碼率控制方法,其特征在于,所述通過(guò)分 步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)包括確定有效比例因子最小值的子帶; 放大所述子帶的有效比例因子;對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需 比特?cái)?shù);上述過(guò)程循環(huán)進(jìn)行直至編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
3. 根據(jù)權(quán)利要求1所述的音頻碼率控制方法,其特征在于,所述通過(guò)分 步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)包括確定頻率最高的子帶; 放大所述子帶的有效比例因子;對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需 比特?cái)?shù);上述過(guò)程循環(huán)進(jìn)行直至編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
4. 根據(jù)權(quán)利要求1所述的音頻碼率控制方法,其特征在于,所述通過(guò)分 步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)包括-.確定有效比例因子最小值的子帶;當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí),確定所述多個(gè)子帶中頻率最高的 子帶;放大所述子帶的有效比例因子;對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù);上述過(guò)程循環(huán)進(jìn)行直至編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
5. 根據(jù)權(quán)利要求1至4任一項(xiàng)所述的音頻碼率控制方法,其特征在于,在所述根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶前還包括對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)換,得到所述音頻信號(hào)的頻域系數(shù);將所述頻域系數(shù)《1安固定的頻帶分劃劃分為頻域子帶。
6. 根據(jù)權(quán)利要求5所述的音頻碼率控制方法,其特征在于,在根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值前還包括根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
7. 根據(jù)權(quán)利要求5所述的音頻碼率控制方法,其特征在于,在對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù)后還包括當(dāng)編碼所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
8. —種音頻碼率控制系統(tǒng),其特征在于,包括第一確定單元,用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶;第一計(jì)算單元,用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因^的4刀士臺(tái)4直;第一編碼單元,用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù);判斷單元,用于判斷編碼所需比特?cái)?shù)是否大于所述可用比特?cái)?shù);調(diào)整單元,用于當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù),使編碼所需比特?cái)?shù)小于或等于所述可用比特凄t。
9. 根據(jù)權(quán)利要求8所述的音頻碼率控制系統(tǒng),其特征在于,所述調(diào)整單元包括第二確定模塊,用于確定有效比例因子最小值的子帶;第一放大模塊,用于放大所述子帶的有效比例因子;第二編碼模塊,用于對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù)。
10. 根據(jù)權(quán)利要求8所述的音頻碼率控制系統(tǒng),其特征在于,所述調(diào)整單 元包括第三確定模塊,用于確定頻率最高的子帶; 第二放大模塊,用于放大所述子帶的有效比例因子; 第三編碼模塊,用于對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行 編碼,確定編碼所需比特?cái)?shù)。
11. 根據(jù)權(quán)利要求8所述的音頻碼率控制系統(tǒng),其特征在于,所述調(diào)整單 元包括第四確定模塊,用于確定有效比例因子最小值的子帶; 第五確定模塊,用于當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí),確定所述多 個(gè)子帶中頻率最高的子帶;第三放大模塊,用于放大所述子帶的有效比例因子;第四編碼模塊,用于對(duì)所述子帶重新進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù)。
12. 根據(jù)權(quán)利要求8至11任一項(xiàng)所述的音頻碼率控制系統(tǒng),其特征在于, 還包括轉(zhuǎn)換單元,用于對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)換,得到所述音頻信號(hào)的頻域 系數(shù);劃分單元,用于將所述頻域系數(shù)按固定的頻帶分劃劃分為頻域子帶。
13. 根據(jù)權(quán)利要求12所述的音頻碼率控制系統(tǒng),其特征在于,還包括 第二計(jì)算單元,用于根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
14. 根據(jù)權(quán)利要求12所述的音頻碼率控制系統(tǒng),其特征在于,還包括 第五編碼單元,用于當(dāng)編碼所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí),對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn) 行編碼。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種音頻碼率控制方法及系統(tǒng)。所述方法包括根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶;根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值;根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子,使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值,根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化,對(duì)量化后的頻域系數(shù)進(jìn)行編碼,確定編碼所需比特?cái)?shù);當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí),通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù),使編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。能夠在降低算法復(fù)雜度的基礎(chǔ)上兼顧聲音質(zhì)量。
文檔編號(hào)G10L19/02GK101494054SQ20091007801
公開(kāi)日2009年7月29日 申請(qǐng)日期2009年2月9日 優(yōu)先權(quán)日2009年2月9日
發(fā)明者趙云軒 申請(qǐng)人:深圳華為通信技術(shù)有限公司