一種音頻碼率控制方法及系統(tǒng)的制作方法

文檔序號(hào)：2832072閱讀：372來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種音頻碼率控制方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明主要涉及音頻編解碼領(lǐng)域，尤其涉及一種音頻碼率控制方法及系統(tǒng)。
背景技術(shù)：
傳統(tǒng)的數(shù)字音頻壓縮技術(shù)主要采用波形編碼，通過(guò)降低數(shù)據(jù)的熵冗余度，實(shí)現(xiàn)對(duì)數(shù)據(jù)的壓縮。這種方法沒(méi)有考慮到人耳聽(tīng)覺(jué)效果的主觀特性，算法壓縮
率較低，音質(zhì)也較差，其主要用于窄帶音頻信號(hào)的壓縮，如A律編碼。為了在有限的網(wǎng)絡(luò)帶寬上傳輸更好的聲音質(zhì)量，一種基于人耳主觀感知特征的音頻壓縮技術(shù)得到了發(fā)展，相關(guān)方面先后制定了 MPEG-1 Audio、 MPEG-2Audio、 MPEG-2 AAC (Advanced Audio Coding,高級(jí)音頻編碼)、Dolby(AC國(guó)3)、 MPEG國(guó)4 AAC等音頻壓縮標(biāo)準(zhǔn)。這種音頻數(shù)據(jù)壓縮方法充分利用人耳聽(tīng)覺(jué)系統(tǒng)的感知特性，在原始數(shù)據(jù)中去掉人耳無(wú)法聽(tīng)到的信號(hào)細(xì)節(jié)，從而實(shí)現(xiàn)了較低碼率下的寬頻語(yǔ)音或音頻信號(hào)的編碼。經(jīng)過(guò)這種方法壓縮的音頻信號(hào)雖然存在失真，但是這些失真人耳是聽(tīng)不到的，對(duì)人耳是"透明"的，也就是說(shuō)對(duì)人耳的聽(tīng)覺(jué)是沒(méi)有影響的。
現(xiàn)有技術(shù)在比特分配和量化的過(guò)程中，AAC規(guī)范中釆用一種被廣泛使用的基于兩層嵌套循環(huán)的比特分配方案，ACC標(biāo)準(zhǔn)通過(guò)兩層循環(huán)來(lái)調(diào)整各個(gè)子帶的比例因子的大小，并以此來(lái)實(shí)現(xiàn)各個(gè)子帶間的比特分配，其中外層循環(huán)用來(lái)控制各個(gè)子帶的量化噪聲不超過(guò)掩蔽閾值，內(nèi)層循環(huán)用來(lái)控制量化編碼頻域系數(shù)所需要的比特?cái)?shù)不超過(guò)當(dāng)前可用比特?cái)?shù)，這兩層循環(huán)交替進(jìn)行，直到兩層循環(huán)的控制條件都被滿足或別的退出條件被滿足。如圖l所示，內(nèi)層循環(huán)根據(jù) 全局比例因子對(duì)頻域系統(tǒng)進(jìn)行量化和編碼，并統(tǒng)計(jì)編碼比特?cái)?shù)，若編碼所需比特?cái)?shù)大于可用比特?cái)?shù)，則增大全局比例因子，重復(fù)上述過(guò)程直到編碼所需比特數(shù)小于可用比特?cái)?shù)。如圖2所示，外層循環(huán)計(jì)算每個(gè)比例因子帶的量化噪聲，并將每個(gè)比例因子帶的量化噪聲控制在心理聲學(xué)模型計(jì)算出的掩蔽閾值范圍內(nèi)。當(dāng)某個(gè)比例因子帶的量化噪聲超過(guò)掩蔽閾值時(shí)，則增加該比例因子帶的比例因子，通過(guò)降低量化步長(zhǎng)來(lái)減少量化噪聲，盡可能地使該比例因子帶的量化噪聲小于掩蔽閾值。在所述的外層循環(huán)中，各子帶的頻域系數(shù)被由比例因子所確定的量化步長(zhǎng)進(jìn)行量化，得到量化系數(shù)，接著量化系數(shù)又被反量化得到反量化系數(shù)，然后由頻域系數(shù)與反量化系數(shù)相減得到各個(gè)子帶的量化噪聲。在內(nèi)層循環(huán)中，同樣，各個(gè)子帶的頻域系數(shù)被量化成量化系數(shù)，然后量化系數(shù)被編碼成相應(yīng)的碼字，再統(tǒng)計(jì)這些碼字的總長(zhǎng)度，這個(gè)長(zhǎng)度加上其它一些輔助信息的編碼長(zhǎng)度后就得到了編碼所需的比特?cái)?shù)。
發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn)，現(xiàn)有技術(shù)至少存在以下缺點(diǎn)現(xiàn)有技術(shù)需要進(jìn)行大量的運(yùn)算，計(jì)算復(fù)雜。內(nèi)層循環(huán)對(duì)頻域系數(shù)進(jìn)行量化和編碼，各比例因子帶遍歷一次，計(jì)算復(fù)雜；外層循環(huán)計(jì)算每個(gè)比例因子帶的量化噪聲，只要有一個(gè)子帶不滿足要求，就會(huì)再次調(diào)用內(nèi)層循環(huán)，導(dǎo)致內(nèi)層循環(huán)運(yùn)行次數(shù) 增多，算法運(yùn)算量增大。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提出一種音頻碼率控制方法及系統(tǒng)，能夠在降低算法復(fù)雜度的基礎(chǔ)上兼顧聲音質(zhì)量。
本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的
一種音頻碼率控制方法，包括
根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶；
根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值；
才艮據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子d吏得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；
當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步調(diào)整子帶的有效比例
因子來(lái)調(diào)整編碼所需比特?cái)?shù)。
一種音頻碼率控制系統(tǒng)，包括
第一確定單元，用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶；第一計(jì)算單元，用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因
子的初始l直；
第一編碼單元，用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；
判斷單元，用于判斷編碼所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)；調(diào)整單元，用于當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步調(diào)整
子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)，使編碼所需比特?cái)?shù)小于或等于所
述可用比特?cái)?shù)。
本發(fā)明實(shí)施例所述技術(shù)方案將比特分配、量化編碼過(guò)程拆分成兩個(gè)獨(dú)立的循環(huán)，大大降低了計(jì)算復(fù)雜度，在量化噪聲、編碼碼率不能同時(shí)滿足要求時(shí)，通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)降低編碼比特?cái)?shù)，從而有利于保持較高的語(yǔ)音質(zhì)量，在降低算法復(fù)雜度的基礎(chǔ)上兼顧了聲音質(zhì)量。

為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描迷中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
圖1為現(xiàn)有技術(shù)AAC規(guī)范中比特分配方法的內(nèi)層循環(huán)示意流程圖2為現(xiàn)有技術(shù)AAC規(guī)范中比特分配方法的外層循環(huán)示意流程圖3為子帶編碼示意圖4為現(xiàn)有技術(shù)中MPEG-4 AAC的編碼流程示意圖5為本發(fā)明一種音頻碼率控制方法第一實(shí)施例的流程圖6為本發(fā)明一種音頻碼率控制方法第二實(shí)施例的流程圖7為本發(fā)明一種音頻碼率控制方法第三實(shí)施例的流程圖8為本發(fā)明一種音頻碼率控制方法第四實(shí)施例的流程圖9為本發(fā)明一種音頻碼率控制系統(tǒng)第一實(shí)施例的組成結(jié)構(gòu)7圖10為本發(fā)明一種音頻碼率控制系統(tǒng)第二實(shí)施例的組成結(jié)構(gòu)圖；圖11為本發(fā)明一種音頻碼率控制系統(tǒng)第三實(shí)施例的組成結(jié)構(gòu)圖；圖12為本發(fā)明一種音頻碼率控制系統(tǒng)第四實(shí)施例的組成結(jié)構(gòu)圖。
具體實(shí)施例方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。
為了更清楚的闡述本發(fā)明實(shí)施例的技術(shù)方案，下面先以MPEG-4 AAC音頻編碼算法為例，闡述基于人耳聽(tīng)覺(jué)系統(tǒng)感知特性的音頻編碼器的關(guān)鍵技術(shù)點(diǎn) 和編》馬過(guò)禾呈。
1、所述關(guān)鍵技術(shù)點(diǎn)包括心理聲學(xué)模型和子帶編碼。
(1) 心理聲學(xué)模型主要用來(lái)描述人耳聽(tīng)覺(jué)系統(tǒng)對(duì)聲音的感知特性，是所有基于感知音頻編碼算法的核心。其主要利用了人耳聽(tīng)覺(jué)的兩個(gè)特性來(lái)進(jìn)行壓縮編碼聽(tīng)覺(jué)閾度、掩蔽效應(yīng)。
聽(tīng)覺(jué)閾度人耳對(duì)聲音的感知在頻率、響度上都有一定范圍。頻率方面，正常人可以聽(tīng)到20Hz 20000Hz的聲音信號(hào)；響度方面，人耳對(duì)不同頻率的響度有一條聽(tīng)閾曲線，在這條曲線之下的對(duì)應(yīng)頻率的信號(hào)是聽(tīng)不到的。此外人耳對(duì)不同頻率的聲音敏感程度差別很大，其中對(duì)2000Hz 4000Hz范圍的信號(hào)最敏感，幅度很低的信號(hào)都能被人耳聽(tīng)到，而對(duì)于高頻信號(hào)，敏感程度明顯降低。
掩蔽效應(yīng) 一種頻率的聲音阻礙聽(tīng)覺(jué)系統(tǒng)感知另一種頻率的聲音的現(xiàn)象稱為掩蔽效應(yīng)。兩個(gè)聲音的頻率越接近，相互的掩蔽效應(yīng)越明顯；低頻信號(hào)對(duì)高頻信號(hào)掩蔽作用明顯，但高頻信號(hào)對(duì)低頻信號(hào)的掩蔽效應(yīng)不明顯。對(duì)于被掩蔽的信號(hào)可以不參與編碼，從而降低編碼速率。
(2) 子帶編碼
如圖3所述，子帶編碼將信號(hào)在頻域劃分成N個(gè)子帶(比例因子帶)，每個(gè)比例因子帶內(nèi)包含若干條語(yǔ)線，同一個(gè)比例因子帶內(nèi)的各條譜線，采用相同的量化階(相同的比例因子)進(jìn)行量化。各比例因子帶的量化誤差等于子帶內(nèi)
8各條譜線量化誤差之和。利用心理聲學(xué)模型計(jì)算出各個(gè)比例因子帶的掩蔽閾值，在對(duì)鐠線進(jìn)行量化編碼時(shí)，只要比例因子帶的量化噪聲小于掩蔽閾值，量化噪聲就不會(huì)人耳察覺(jué)，從而實(shí)現(xiàn)對(duì)人耳的"無(wú)損壓縮"。
2、 MPEG-4 AAC簡(jiǎn)化的編碼流程如圖4所示。
1 、心理聲學(xué)模型模塊根據(jù)人耳的聽(tīng)覺(jué)特性計(jì)算出各個(gè)比例因子帶的掩蔽閾值；
2、音頻時(shí)域信號(hào)經(jīng)過(guò)時(shí)頻變換得到頻域的MDCT( Modified discrete cosine transform,改進(jìn)型的離散余弦變換)鐠系數(shù)；
3 )量化編碼-溪塊根據(jù)全局比例因子、各子帶比例因子對(duì)MDCT語(yǔ)系數(shù)進(jìn) 行量化和編碼，AAC中MDCT鐠系數(shù)量化公式為
旦疆一 MDCT譜線絕對(duì)值o'75
里K/1且 -^ 0.1875 * (全局比例因子~~-子帶比例因子)~ ，其中有效比例因子-
全局比例因子-子帶比例因子；
4) 碼率控制模塊根據(jù)量化編碼模塊的量化噪聲及編碼所需比特?cái)?shù)，調(diào)整全局比例因子、各子帶比例因子，使得每個(gè)比例因子帶的量化噪聲小于該比例因子帶的掩蔽閾值，同時(shí)編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，。在量化噪聲、編碼所需比特?cái)?shù)不能同時(shí)滿足要求時(shí)，就需要在聲音效果、編碼比特?cái)?shù)之間作出平衡，以保證在較低的碼率下提供更好的聲音質(zhì)量。
5) 比特流格式器將MDCT諳系數(shù)的Huffman編碼值及相關(guān)邊信息按照 AAC的碼流格式寫入碼流。
參照?qǐng)D5，示出了本發(fā)明一種音頻碼率控制方法第一實(shí)施例的流程圖，包括步驟
步驟510、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù)，即確定該碼率下優(yōu)先保證的頻帶寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下，在選擇初次編碼子帶數(shù)時(shí)，可以使其僅覆蓋到14kHz頻帶寬度，即優(yōu)先保證14kHz頻帶寬度內(nèi)的聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感，因此在有帶寬限制的情況下，優(yōu)先量化編碼低頻的子帶，這樣對(duì)聲音的壓縮損失會(huì)少很多，甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。為了完成對(duì)音頻信號(hào)的編碼處理，首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)
換，時(shí)頻變化除了前面描述的MDCT外，現(xiàn)有技術(shù)中還有多種實(shí)現(xiàn)方式，參照相關(guān)現(xiàn)有的描述即可，得到所述音頻信號(hào)的頻域系數(shù)，然后將所述頻域系數(shù) 按固定的頻帶分劃劃分為若干個(gè)頻域子帶，此過(guò)程在前面進(jìn)行了詳細(xì)描述，在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù)，根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
值。'* 、'々、，、、、、
通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析，得到各個(gè)頻域子帶的噪聲掩蔽閾值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù)，在此不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后，利用待編碼子帶的掩蔽閾值計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整，因此所述計(jì)算不必太精確，利用各子帶的掩蔽閾值估計(jì)出各子帶有效比例因子的初始值即可。
步驟530、根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行Huffinan編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟540、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)，使所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
若初次編碼所需比特?cái)?shù)大于可用比特?cái)?shù)，則表明需要進(jìn)行碼率控制，通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)，直到滿足可用比特數(shù)的要求。分步調(diào)整有效比例因子的方法可以有多種，將在后面的實(shí)施例中進(jìn) 行詳細(xì)描述，本領(lǐng)域技術(shù)人員可以理解，也并不局限于后面各實(shí)施例所描述的方法，其它分步調(diào)整有效比例因子的方法也在本發(fā)明的保護(hù)范圍之內(nèi)。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
本發(fā)明實(shí)施例所述技術(shù)方案將比特分配、量化編碼過(guò)程拆分成兩個(gè)獨(dú)立的循環(huán)，大大降低了計(jì)算復(fù)雜度，在量化噪聲、編碼碼率不能同時(shí)滿足要求時(shí)，通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)降低編碼比特?cái)?shù)，從而有利于保持較高的語(yǔ)音質(zhì)量，在降低算法復(fù)雜度的基礎(chǔ)上兼顧了聲音質(zhì)量。
參照?qǐng)D6，示出了本發(fā)明一種音頻碼率控制方法第二實(shí)施例的流程圖，包括步驟
步驟610、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù)，即確定該碼率下優(yōu)先保證的頻帶寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下，在選擇初次編碼子帶數(shù)時(shí)，可以使其僅覆蓋到14kHz頻帶寬度，即優(yōu)先保證14kHz頻帶寬度內(nèi)的聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感，因此在有帶寬限制的情況下，優(yōu)先量化編碼低頻的子帶，這樣對(duì)聲音的壓縮損失會(huì)少很多，甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理，首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換，得到所述音頻信號(hào)的頻域系數(shù)，然后將所述頻域系數(shù)按固定的頻帶分劃劃分為若干個(gè)頻域子帶，此過(guò)程在前面進(jìn)行了詳細(xì)描述，在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù)，根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
步驟620、根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析，得到各個(gè)頻域子帶的噪聲掩蔽閾值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù)，在此不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后，利用待編碼子帶的掩蔽閾值計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)^f亍量化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整，因此所述計(jì)算不必太精確，利用各子帶的掩蔽閾值估計(jì)出各子帶有效比例因子的初始值即可。
步驟630、才艮據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行huffman編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟640、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)，如果所需比特?cái)?shù)大于所述可用比特?cái)?shù)，則進(jìn)入步驟650;否則進(jìn)入步驟690。
步驟650、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，確定有效比例因子最小值的子帶。
根據(jù)各子帶能量的大小，優(yōu)先調(diào)整能量小的子帶。根據(jù)人耳聽(tīng)覺(jué)感知特性中的掩蔽效應(yīng)可知，音量大的信號(hào)可以掩蔽音量小的信號(hào)，故優(yōu)先調(diào)整能量小的子帶，可以最大限度將量化噪聲的影響降到最低。一般而言，子帶的能量越大，則有效比例因子也就越大，因此可以用有效比例因子的大小反應(yīng)子帶能量的大小。
步驟660、放大所述子帶的有效比例因子。
調(diào)整所述有效比例因子最小值的子帶的有效比例因子(量化步長(zhǎng))，由于所需比特?cái)?shù)大于所述可用比特?cái)?shù)，因此需要放大所述子帶的有效比例因子。步驟670、對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定其所需比特^t。
根據(jù)放大后的有效比例因子對(duì)該子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù) 進(jìn)行編碼，確定所需比特?cái)?shù)。
步驟680、判斷所需比特?cái)?shù)是否大于可用比特?cái)?shù)，如果所需比特?cái)?shù)大于所述可用比特?cái)?shù)，則進(jìn)入步驟650;否則結(jié)束流程。
步驟6卯、當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí)，優(yōu)先調(diào)整能量小的子帶的有效比例因子，從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D7，示出了本發(fā)明一種音頻碼率控制方法第三實(shí)施例的流程圖，包括步驟
步驟710、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù)，即確定該碼率下優(yōu)先保證的頻帶寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下，在選擇初次編碼子帶數(shù)時(shí)，可以使其僅覆蓋到14kHz頻帶寬度，即優(yōu)先保證14kHz頻帶寬度內(nèi)的聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感，因此在有帶寬限制的情況下，優(yōu)先量化編碼低頻的子帶，這樣對(duì)聲音的壓縮損失會(huì)少很多，甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理，首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換，得到所述音頻信號(hào)的頻域系數(shù)，然后將所述頻域系數(shù)按固定的頻帶分劃劃分為若干個(gè)頻域子帶，此過(guò)程在前面進(jìn)行了詳細(xì)描述，在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù)，根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
步驟720、根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。
通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析，得到各個(gè)頻域子帶的噪聲掩蔽閾
13值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù)，在此不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽闊值后，利用待編碼子帶的掩蔽閾值計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量
化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整，因此所述計(jì)算不必太精確，利用各子帶的掩蔽閾值估計(jì)出各子帶有效比例因子的初始值即可。
步驟730、 #4居所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行huffinan編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟740、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)，如果所需比特?cái)?shù)大于所述可用比特?cái)?shù)，則進(jìn)入步驟750;否則進(jìn)入步驟790。
步驟750、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，確定頻率最高的子帶。
當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，按照先高頻后低頻的原則，逐個(gè)調(diào) 整各子帶的有效比例因子。人耳對(duì)不同頻率的聲音敏感度差別很大，其中對(duì) 2000Hz 4000Hz范圍的信號(hào)最敏感，幅度很低的信號(hào)都能被人耳聽(tīng)到，而對(duì) 于高頻信號(hào)，敏感程度明顯降低。因此，在聲音效果和碼率之間需要做出平衡的時(shí)候，優(yōu)先調(diào)整高頻子帶，使噪聲更多的分布在高子帶，減少由于碼率控制對(duì)聲音質(zhì)量的影響程度。
步驟760、放大所述子帶的有效比例因子。
調(diào)整所述頻率最高的子帶的有效比例因子(量化步長(zhǎng))，由于所需比特?cái)?shù) 大于所述可用比特?cái)?shù)，因此需要放大所述子帶的有效比例因子。
步驟770、對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定其所需比特?cái)?shù)。根據(jù)放大后的有效比例因子對(duì)該子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù) 進(jìn)行編碼，確定所需比特?cái)?shù)。
步驟780、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)，如果所需比特?cái)?shù)大于所述可用比特l史，則進(jìn)入步驟750;否則結(jié)束流程。
步驟790、當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍，結(jié)束流程。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí)，優(yōu)先調(diào)整頻率最高的子帶的有效比例因子，從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D8，示出了本發(fā)明一種音頻碼率控制方法第四實(shí)施例的流程圖，包括步驟
步驟810、根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù)，即確定該碼率下優(yōu)先保證的頻帶寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下，在選擇初次編碼子帶數(shù)時(shí)，可以使其僅覆蓋到14kHz頻帶寬度，即優(yōu)先保證14kHz頻帶寬度內(nèi)的聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感，因此在有帶寬限制的情況下，優(yōu)先量化編碼低頻的子帶，這樣對(duì)聲音的壓縮損失會(huì)少很多，甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理，首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換，得到所述音頻信號(hào)的頻域系數(shù)，然后將所述頻域系數(shù)按固定的頻帶分劃劃分為若干個(gè)頻域子帶，此過(guò)程在前面進(jìn)行了詳細(xì)描述，在此不再贅述。
根據(jù)目標(biāo)碼率等參數(shù)計(jì)算出可用比特?cái)?shù)，根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
值。'a 、、 ^ 、'，、、
通過(guò)心理聲學(xué)沖莫型對(duì)時(shí)域信號(hào)進(jìn)行分析，得到各個(gè)頻域子帶的噪聲掩蔽閾值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù)，在此不再贅述。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后，利用待編碼子帶的掩蔽閾值計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整，因此所述計(jì)算不必太精確，利用各子帶的掩蔽閾值估計(jì)出各子帶有效比例因子的初始值即可。
步驟830、根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，才艮據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行huffman編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
步驟840、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)，如果所需比特?cái)?shù)大于所述可用比特?cái)?shù)，則進(jìn)入步驟850;否則進(jìn)入811。
步驟850、當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，確定有效比例因子最小值的子帶。
步驟860、當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí)，確定所述多個(gè)子帶中頻率最高的子帶。
步驟870、放大所述子帶的有效比例因子。
步驟880、對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定其所需比特?cái)?shù)。
根據(jù)放大后的有效比例因子對(duì)該子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù) 進(jìn)行編碼，確定所需比特?cái)?shù)。
步驟8卯、判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)，如果所需比特?cái)?shù)大于所述可用比特?cái)?shù)，則進(jìn)入步驟850;否則進(jìn)入步驟811。
步驟811、當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
16若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍，結(jié)束流程。
本實(shí)施例通過(guò)子帶的能量大小與先高頻后低頻相結(jié)合的方法，分步調(diào)整有效比例因子，這種分步調(diào)整方法綜合考慮了掩蔽效應(yīng)、以及人耳對(duì)不同頻率的敏感度。
參照?qǐng)D9，示出了本發(fā)明一種音頻碼率控制系統(tǒng)第一實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第一編碼單元930、判斷單元940和調(diào)整單元950。
所述第一確定單元910、用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所迷有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
所述判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。所述調(diào)整單元950、用于當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步
調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)，使所需比特?cái)?shù)小于或等于所
述可用比特?cái)?shù)。
本發(fā)明實(shí)施例所述技術(shù)方案將比特分配、量化編碼過(guò)程拆分成兩個(gè)獨(dú)立的循環(huán)，大大降低了計(jì)算復(fù)雜度，在量化噪聲、編碼碼率不能同時(shí)滿足要求時(shí)，通過(guò)分步調(diào)整各個(gè)子帶的有效比例因子來(lái)降低編碼比特?cái)?shù)，從而有利于保持較高的語(yǔ)音質(zhì)量，在降低算法復(fù)雜度的基礎(chǔ)上兼顧了聲音質(zhì)量。
參照?qǐng)D10,示出了本發(fā)明一種音頻碼率控制系統(tǒng)第二實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第一編碼單元930、判斷單元940和調(diào)整單元950;所述調(diào)整單元950包括第二確定模塊951、第一放大模塊952、第二編碼模塊953。
所述第一確定單元910、用于4艮據(jù)可用比特凄t確定進(jìn)行初次編碼的子帶。根據(jù)可用比特?cái)?shù)選擇初次編碼的子帶數(shù)，即確定該碼率下優(yōu)先保證的頻帶
寬度。例如在48kHz采樣率、64kbps網(wǎng)絡(luò)帶寬限制下，在選擇初次編碼子帶數(shù)時(shí)，可以使其僅覆蓋到14kHz頻帶寬度，即優(yōu)先保證14kHz頻帶寬度內(nèi)的聲音質(zhì)量。因?yàn)槿祟惵?tīng)覺(jué)系統(tǒng)對(duì)低頻的聲音比對(duì)高頻的聲音更加敏感，因此在有帶寬限制的情況下，優(yōu)先量化編碼低頻的子帶，這樣對(duì)聲音的壓縮損失會(huì)少很多，甚至對(duì)聽(tīng)覺(jué)系統(tǒng)沒(méi)有影響。
為了完成對(duì)音頻信號(hào)的壓縮處理，首先需要對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn) 換，得到所述音頻信號(hào)的頻域系數(shù)，然后將所述頻域系數(shù)按固定的頻帶分劃劃分為若干個(gè)頻域子帶，此過(guò)程在前面進(jìn)行了詳細(xì)描述，在此不再贅述。
因此，所述音頻碼率控制系統(tǒng)還包括轉(zhuǎn)換單元960、用于對(duì)輸入音頻信號(hào) 進(jìn)行時(shí)頻轉(zhuǎn)換，得到所述音頻信號(hào)的頻域系數(shù)。
劃分單元970、用于將所述頻域系數(shù)"^要固定的頻帶分劃劃分為頻域子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。
通過(guò)心理聲學(xué)模型對(duì)時(shí)域信號(hào)進(jìn)行分析，得到各個(gè)頻域子帶的噪聲掩蔽閾值。所述通過(guò)心理聲學(xué)模型計(jì)算出所述子帶掩蔽閾值的過(guò)程為現(xiàn)有技術(shù)，在此不再贅述。
因此，所述音頻碼率控制系統(tǒng)還包括第二計(jì)算單元980、用于根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
利用心理聲學(xué)模型確定各子帶的掩蔽閾值后，利用待編碼子帶的掩蔽閾值計(jì)算出各子帶的有效比例因子的初始值。所述有效比例因子的初始值在進(jìn)行量化編碼時(shí)會(huì)不斷進(jìn)行調(diào)整，因此所述計(jì)算不必太精確，利用各子帶的掩蔽閾值估計(jì)出各子帶有效比例因子的初始值即可。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行huffinan編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
所述判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。所述調(diào)整單元950包括
第二確定模塊951、用于確定有效比例因子最小值的子帶。第一放大模塊952、用于放大所述子帶的有效比例因子。第二編碼模塊953、用于對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù) 進(jìn)行編碼，確定其所需比特?cái)?shù)。
當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，確定有效比例因子最小值的子帶。根據(jù)各子帶能量的大小，優(yōu)先調(diào)整能量小的子帶。根據(jù)人耳聽(tīng)覺(jué)感知特性中的掩蔽效應(yīng)可知，音量大的信號(hào)可以掩蔽音量小的信號(hào)，故優(yōu)先調(diào)整能量小的子帶，可以最大限度將量化噪聲的影響降到最低。一般而言，子帶的能量越大，則有效比例因子也就越大，因此可以用有效比例因子的大小反應(yīng)子帶能量的大小。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
因此，所述音頻碼率控制系統(tǒng)還包括第五編碼單元990、用于當(dāng)所需比特數(shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí)，優(yōu)先調(diào)整能量小的子帶的有效比例因子，從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D11，示出了本發(fā)明一種音頻碼率控制系統(tǒng)第三實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第一編碼單元930、判斷單元940和調(diào)整單元950;所述調(diào)整單元950包括第三確定模塊954、第二放大模塊955、第三編碼模塊956。
所述第一確定單元910、用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。所述音頻碼率控制系統(tǒng)還包括轉(zhuǎn)換單元960、用于對(duì)輸入音頻信號(hào)進(jìn)行時(shí)
頻轉(zhuǎn)換，得到所述音頻信號(hào)的頻域系數(shù)。
以及劃分單元970、用于將所述頻域系數(shù)按固定的頻帶分劃劃分為頻域子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。
所迷音頻碼率控制系統(tǒng)還包括第二計(jì)算單元980、用于根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特?cái)?shù)。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行huffman編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
所迷判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。所述調(diào)整單元950包括
第三確定模塊954、用于確定頻率最高的子帶。第二放大模塊955、用于放大所述子帶的有效比例因子。第三編碼模塊956、用于對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù) 進(jìn)行編碼，確定其所需比特?cái)?shù)。
當(dāng)所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，按照先高頻后低頻的原則，逐個(gè)調(diào) 整各子帶的有效比例因子。人耳對(duì)不同頻率的聲音敏感度差別很大，其中對(duì) 2000Hz 4000Hz范圍的信號(hào)最敏感，幅度很低的信號(hào)都能被人耳聽(tīng)到，而對(duì)
20于高頻信號(hào)，敏感程度明顯降低。因此，在聲音效果和碼率之間需要做出平衡的時(shí)候，優(yōu)先調(diào)整高頻子帶，^t噪聲更多的分布在高子帶，減少由于碼率控制對(duì)聲音質(zhì)量的影響程度。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
因此，所述音頻碼率控制系統(tǒng)還包括第五編碼單元990、用于當(dāng)所需比特數(shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
本實(shí)施例在所需比特?cái)?shù)大于可用比特?cái)?shù)時(shí)，優(yōu)先調(diào)整頻率最高的子帶的有效比例因子，從而在同樣的可用比特?cái)?shù)時(shí)能最大程度的兼顧聲音質(zhì)量。
參照?qǐng)D12,示出了本發(fā)明一種音頻碼率控制系統(tǒng)第四實(shí)施例的組成結(jié)構(gòu) 圖。所述音頻碼率控制系統(tǒng)包括第一確定單元910、第一計(jì)算單元920、第一編碼單元930、判斷單元940和調(diào)整單元950;所述調(diào)整單元950包括第四確定模塊957、第五確定模塊961、第三放大模塊958、第四編碼模塊959。
所述第一確定單元910、用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶。
所述音頻碼率控制系統(tǒng)還包括轉(zhuǎn)換單元960、用于對(duì)輸入音頻信號(hào)進(jìn)行時(shí) 頻轉(zhuǎn)換，得到所述音頻信號(hào)的頻域系數(shù)。
以及劃分單元970、用于將所述頻域系數(shù)按固定的頻帶分劃劃分為頻域子帶。
所述第一計(jì)算單元920、用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值。
所述音頻碼率控制系統(tǒng)還包括第二計(jì)算單元980、用于根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
所述第一編碼單元930、用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定所需比特^:。
對(duì)待編碼的各個(gè)子帶進(jìn)行初次量化，調(diào)整各子帶的有效比例因子，使得待編碼的每個(gè)子帶的頻域系數(shù)量化噪聲小于該子帶的掩蔽閾值。根據(jù)所述有效比
例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行huffinan編碼，并統(tǒng)計(jì) 所需比特?cái)?shù)。
為了使音頻編碼達(dá)到感知透明的效果，必須使各個(gè)子帶系數(shù)的編碼噪聲 (量化噪聲)小于對(duì)應(yīng)的噪聲閾值(掩蔽閾值)。
所述判斷單元940、用于判斷所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)。所述調(diào)整單元950包括
第四確定模塊957、用于確定有效比例因子最小值的子帶。
第五確定模塊961、用于當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí)，確定所述多個(gè)子帶中頻率最高的子帶。
第三放大模塊958、用于放大所述子帶的有效比例因子。
第四編碼模塊959、用于對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù) 進(jìn)行編碼，確定其所需比特?cái)?shù)。
當(dāng)所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
若初次編碼所需比特?cái)?shù)小于可用比特?cái)?shù)，則說(shuō)明在優(yōu)先保證了低頻帶寬效果的前提下，仍有剩余比特?cái)?shù)可以利用。此時(shí)遵循由低頻到高頻的原則，逐個(gè) 量化、編碼高頻子帶，直到用完剩余的比特?cái)?shù)或覆蓋所有頻率范圍。
因此，所述音頻碼率控制系統(tǒng)還包括第五編碼單元9卯、用于當(dāng)所需比特數(shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
本實(shí)施例通過(guò)子帶的能量大小與先高頻后低頻相結(jié)合的方法，分步調(diào)整有效比例因子，這種分步調(diào)整方法綜合考慮了掩蔽效應(yīng)、以及人耳對(duì)不同頻率的敏感度。
本發(fā)明各實(shí)施例中的第一編碼單元、第二編碼模塊、第三編碼模塊、第四編碼模塊、第五編碼單元可以是同一個(gè)編碼裝置，也可以是獨(dú)立的多個(gè)編碼裝置，本發(fā)明各實(shí)施例為了表明不同的功能將其分為多個(gè)編碼裝置，不能因此理解為不同的編碼裝置。
本發(fā)明各系統(tǒng)實(shí)施例是與方法實(shí)施例對(duì)應(yīng)的，因此，在系統(tǒng)實(shí)施例中未詳細(xì)描述的部分參照方法實(shí)施例相應(yīng)部分的描述即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā) 明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā) 明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種音頻碼率控制方法，其特征在于，包括根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶；根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值；根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)。
2. 根據(jù)權(quán)利要求1所述的音頻碼率控制方法，其特征在于，所述通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)包括確定有效比例因子最小值的子帶；放大所述子帶的有效比例因子；對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；上述過(guò)程循環(huán)進(jìn)行直至編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
3. 根據(jù)權(quán)利要求1所述的音頻碼率控制方法，其特征在于，所述通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)包括確定頻率最高的子帶；放大所述子帶的有效比例因子；對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；上述過(guò)程循環(huán)進(jìn)行直至編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
4. 根據(jù)權(quán)利要求1所述的音頻碼率控制方法，其特征在于，所述通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)包括-.確定有效比例因子最小值的子帶；當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí)，確定所述多個(gè)子帶中頻率最高的子帶；放大所述子帶的有效比例因子；對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；上述過(guò)程循環(huán)進(jìn)行直至編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。
5. 根據(jù)權(quán)利要求1至4任一項(xiàng)所述的音頻碼率控制方法，其特征在于，在所述根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶前還包括對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)換，得到所述音頻信號(hào)的頻域系數(shù)；將所述頻域系數(shù)《1安固定的頻帶分劃劃分為頻域子帶。
6. 根據(jù)權(quán)利要求5所述的音頻碼率控制方法，其特征在于，在根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值前還包括根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
7. 根據(jù)權(quán)利要求5所述的音頻碼率控制方法，其特征在于，在對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)后還包括當(dāng)編碼所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼。
8. —種音頻碼率控制系統(tǒng)，其特征在于，包括第一確定單元，用于根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶；第一計(jì)算單元，用于根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因^的4刀士臺(tái)4直；第一編碼單元，用于根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；判斷單元，用于判斷編碼所需比特?cái)?shù)是否大于所述可用比特?cái)?shù)；調(diào)整單元，用于當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)，使編碼所需比特?cái)?shù)小于或等于所述可用比特凄t。
9. 根據(jù)權(quán)利要求8所述的音頻碼率控制系統(tǒng)，其特征在于，所述調(diào)整單元包括第二確定模塊，用于確定有效比例因子最小值的子帶；第一放大模塊，用于放大所述子帶的有效比例因子；第二編碼模塊，用于對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)。
10. 根據(jù)權(quán)利要求8所述的音頻碼率控制系統(tǒng)，其特征在于，所述調(diào)整單元包括第三確定模塊，用于確定頻率最高的子帶；第二放大模塊，用于放大所述子帶的有效比例因子；第三編碼模塊，用于對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)。
11. 根據(jù)權(quán)利要求8所述的音頻碼率控制系統(tǒng)，其特征在于，所述調(diào)整單元包括第四確定模塊，用于確定有效比例因子最小值的子帶；第五確定模塊，用于當(dāng)有效比例因子最小值的子帶有多個(gè)時(shí)，確定所述多個(gè)子帶中頻率最高的子帶；第三放大模塊，用于放大所述子帶的有效比例因子；第四編碼模塊，用于對(duì)所述子帶重新進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)。
12. 根據(jù)權(quán)利要求8至11任一項(xiàng)所述的音頻碼率控制系統(tǒng)，其特征在于，還包括轉(zhuǎn)換單元，用于對(duì)輸入音頻信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)換，得到所述音頻信號(hào)的頻域系數(shù)；劃分單元，用于將所述頻域系數(shù)按固定的頻帶分劃劃分為頻域子帶。
13. 根據(jù)權(quán)利要求12所述的音頻碼率控制系統(tǒng)，其特征在于，還包括第二計(jì)算單元，用于根據(jù)心理聲學(xué)模型計(jì)算出所述子帶的掩蔽閾值。
14. 根據(jù)權(quán)利要求12所述的音頻碼率控制系統(tǒng)，其特征在于，還包括第五編碼單元，用于當(dāng)編碼所需比特?cái)?shù)小于所述可用比特?cái)?shù)時(shí)，對(duì)所述頻域系數(shù)的其它子帶按照頻率從低到高的順序進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn) 行編碼。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種音頻碼率控制方法及系統(tǒng)。所述方法包括根據(jù)可用比特?cái)?shù)確定進(jìn)行初次編碼的子帶；根據(jù)所述子帶的掩蔽閾值計(jì)算所述子帶的有效比例因子的初始值；根據(jù)所述子帶的有效比例因子的初始值調(diào)整所述有效比例因子，使得所述子帶頻域系數(shù)的量化噪聲小于所述掩蔽閾值，根據(jù)所述有效比例因子對(duì)所述子帶進(jìn)行量化，對(duì)量化后的頻域系數(shù)進(jìn)行編碼，確定編碼所需比特?cái)?shù)；當(dāng)編碼所需比特?cái)?shù)大于所述可用比特?cái)?shù)時(shí)，通過(guò)分步調(diào)整子帶的有效比例因子來(lái)調(diào)整編碼所需比特?cái)?shù)，使編碼所需比特?cái)?shù)小于或等于所述可用比特?cái)?shù)。能夠在降低算法復(fù)雜度的基礎(chǔ)上兼顧聲音質(zhì)量。
文檔編號(hào)G10L19/02GK101494054SQ20091007801
公開(kāi)日2009年7月29日申請(qǐng)日期2009年2月9日優(yōu)先權(quán)日2009年2月9日
發(fā)明者趙云軒申請(qǐng)人:深圳華為通信技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：趙云軒
技術(shù)所有人：深圳華為通信技術(shù)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻碼率相關(guān)技術(shù)

音頻輸出碼率相關(guān)技術(shù)

音頻編碼碼率相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種音頻碼率控制方法及系統(tǒng)的制作方法