欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻編碼的制作方法

文檔序號(hào):2836947閱讀:320來源:國知局
專利名稱:音頻編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明 一般涉及音頻編碼以及解碼技術(shù)。
背景技術(shù)
對(duì)于音頻編碼,過去已經(jīng)應(yīng)用了不同的編碼方案。這些編碼方 案中的一種編碼方案是應(yīng)用心理聲學(xué)編碼。關(guān)于這些編碼方案,使 用輸入音頻信號(hào)的頻謙特性來減小冗余。分析輸入音頻信號(hào)的頻譜 分量并且去除顯然不能由人耳識(shí)別的頻譜分量。為了應(yīng)用這些編碼 方案,獲得輸入音頻信號(hào)的頻譜系數(shù)。
諸如高級(jí)音頻編碼器(AAC)以及MPEG音頻的心理聲學(xué)編碼 中的頻譜系數(shù)的量化通過以下方式來執(zhí)行,即先使用標(biāo)量量化,接 著使用標(biāo)度因子(scale factor )以及定標(biāo)的頻譜系數(shù)的熵編碼。使用 針對(duì)頻譜系數(shù)的十 一 個(gè)可能的固定霍夫曼樹、以及針對(duì)標(biāo)度因子的 一個(gè)樹作為微分編碼來執(zhí)行熵編碼。
理想的編碼情況產(chǎn)生原始信號(hào)的壓縮版本,這導(dǎo)致與原始非常 接近(至少在可感知的意義上)的信號(hào)的解碼過程,同時(shí)具有高壓 縮比并且壓縮算法不太復(fù)雜。由于當(dāng)今流傳甚廣的多媒體通信以及 異類網(wǎng)絡(luò),為了相同或者更好的質(zhì)量而同時(shí)保持較低復(fù)雜度而提高 壓縮比率是一項(xiàng)持久的挑戰(zhàn)。

發(fā)明內(nèi)容
根據(jù)一個(gè)方面,本申請(qǐng)?zhí)峁┝艘环N用于音頻編碼的方法,該方 法通過以下步驟來進(jìn)行接收輸入音頻信號(hào),將所述輸入音頻信號(hào) 劃分為至少兩個(gè)子帶,利用第一因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo), 對(duì)所述至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展,以及對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。根據(jù)另一方面,本申請(qǐng)?zhí)峁┝艘环N編碼器,該編碼器包括變 換單元,適用于接收輸入音頻信號(hào),并且將所述輸入音頻信號(hào)劃分 為至少兩個(gè)子帶;定標(biāo)單元,適用于利用第一因子對(duì)至少兩個(gè)子帶 進(jìn)行定標(biāo);壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè) 子帶進(jìn)行壓縮擴(kuò)展;以及量化單元,適用于對(duì)所述已壓縮擴(kuò)展的、 已定標(biāo)的子帶進(jìn)行量化。根據(jù)另 一方面,本申請(qǐng)?zhí)峁┝?一種包括與上述編碼器相同組件 的電子設(shè)備。根據(jù)另 一方面,本申請(qǐng)?zhí)峁┝?一種存儲(chǔ)軟件代碼的軟件程序產(chǎn) 品,當(dāng)在電子設(shè)備的處理單元中執(zhí)行時(shí),所述軟件代碼適用于實(shí)現(xiàn) 上述編碼方法。根據(jù)另一方面,本申請(qǐng)?zhí)峁┝艘环N用于音頻解碼的方法,該方 法通過以下步驟來實(shí)現(xiàn)接收已編碼的音頻數(shù)據(jù),從所述已編碼的 音頻數(shù)據(jù)生成至少兩個(gè)已壓縮擴(kuò)展的子帶;對(duì)每個(gè)已壓縮擴(kuò)展的子 帶進(jìn)行解壓縮擴(kuò)展,利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的 子帶進(jìn)行定標(biāo);以及將所述已解壓縮擴(kuò)展的和已定標(biāo)的子帶結(jié)合到 已解碼的音頻信號(hào)。根據(jù)另一方面,本申請(qǐng)?zhí)峁┝艘环N解碼器,該解碼器包括解 壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò) 展,其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼的音頻數(shù)據(jù)生 成;定標(biāo)單元,適用于利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展 的子帶進(jìn)行定標(biāo);以及變換單元,適用于將所述已解壓縮擴(kuò)展和已 定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。根據(jù)另 一方面,本申請(qǐng)?zhí)峁┝?一種存儲(chǔ)軟件代碼的軟件程序產(chǎn) 品,當(dāng)在電子設(shè)備的處理單元中執(zhí)行時(shí),所述軟件代碼適用于實(shí)現(xiàn) 上述解碼方法。根據(jù)另一方面,本申請(qǐng)?zhí)峁┝艘环N包括與上述解碼器相同組件 的電子設(shè)備。根據(jù)另 一 方面,本申請(qǐng)?zhí)峁┝?一種包括上述編碼器和上述解碼 器的系統(tǒng)。
本申請(qǐng)?jiān)陬l譜數(shù)據(jù)的向量量化之前提供對(duì)輸入音頻信號(hào)子帶的 頻譜分量進(jìn)行壓縮擴(kuò)展。根據(jù)一個(gè)方面,壓縮擴(kuò)展通過使用已定標(biāo) 的子帶來考慮輸入音頻數(shù)據(jù)的心理聲學(xué)現(xiàn)象以及頻譜系數(shù)的分布, 其中所述已定標(biāo)的子帶實(shí)現(xiàn)性能-復(fù)雜度有效的量化。
根據(jù)一個(gè)實(shí)施方式,定標(biāo)包括利用第一定標(biāo)因子對(duì)至少兩個(gè)子 帶進(jìn)行定標(biāo)。該第 一 定標(biāo)因子可以例如依賴于針對(duì)已編碼數(shù)據(jù)流的 總可用比特率,依賴于針對(duì)每個(gè)子帶的可用比特率、和/或依賴于各 個(gè)子帶的特性。第一定標(biāo)因子可以包括例如基數(shù)和指數(shù)??偙忍芈?例如可以由用戶來設(shè)置,然后可以以適合的方式向子帶自動(dòng)分布所 述總比特率。
然后,如果整體比特率(用戶可以對(duì)其施加影響)具有較高的
值,則例如可以將針對(duì)各個(gè)子帶的基數(shù)設(shè)置為較低的值;以及如果 由用戶施加影響的比特率具有較低的值,則可以將該基數(shù)設(shè)置為較 高的值。
例如可以針對(duì)每個(gè)子帶確定指數(shù),使得已編碼音頻信號(hào)的總比 特率盡可能地接近,但可以不小于可用比特率,并且所有子帶中的 整體失真是最小化的。這允許對(duì)比特率-失真測(cè)量進(jìn)行優(yōu)化。
可以以各種方式確定指數(shù)。例如,可以根據(jù)針對(duì)每個(gè)子帶所允 許的失真來計(jì)算用于該子帶的最小的所考慮的指數(shù)。
為了對(duì)已編碼音頻信號(hào)進(jìn)行解碼,關(guān)于在編碼側(cè)定標(biāo)的信息還 必須在解碼側(cè)也可用。為此,可以編碼所需的信息,例如熵編碼。 僅提供和編碼第一定標(biāo)因子的一部分可以是足夠的。在編碼器和解 碼器兩側(cè)已知由用戶設(shè)置的整體比特率,因此僅編碼指數(shù)而不編碼 基數(shù)可以是足夠的。
根據(jù)其他實(shí)施方式,定標(biāo)可以包括第二因子,該第二因子是根 據(jù)用第一因子定標(biāo)的子帶的標(biāo)準(zhǔn)差。利用第一定標(biāo)因子的定標(biāo)可以
代替利用第二定標(biāo)因子的定標(biāo)。根據(jù)其他實(shí)施方式,利用已定標(biāo)子帶的概率函數(shù)來創(chuàng)建用于壓縮擴(kuò)展的累積密度函數(shù)。頻譜數(shù)據(jù)可以近似為具有0.5的形狀因子的 廣義高斯概率密度函數(shù)。這一發(fā)現(xiàn)可以使得使用解析的廣義高斯概 率密度函數(shù)來以傳統(tǒng)方式計(jì)算累積密度函數(shù)以及獲取壓縮擴(kuò)展函 數(shù)。這一經(jīng)典方法稱作"直方圖均衡化"。其思想是變換數(shù)據(jù),使 得結(jié)果生成的已變換數(shù)據(jù)的概率密度函數(shù)是一致的。示出了將由數(shù) 據(jù)的累積密度函數(shù)給出的變換函數(shù)。累計(jì)密度函數(shù)是最大值為1的 非下降函數(shù)??梢噪x線預(yù)先確定該函數(shù)并且在編碼端存儲(chǔ)該函數(shù),根據(jù)其他實(shí)施方式,在利用第三定標(biāo)因子量化之前對(duì)已壓縮擴(kuò) 展的子帶進(jìn)行定標(biāo)。此第三定標(biāo)因子針對(duì)較高整體比特率可以比針 對(duì)較低整體比特率較高。此第三因子可以依賴于子帶系數(shù)的標(biāo)準(zhǔn)差, 由此通過這樣的乘法,提供了其他裝置用于針對(duì)每個(gè)子帶分別調(diào)整 量化分辨率。格型量化器可以使用例如矩形截?cái)嗟母裥陀糜趯?duì)已壓縮擴(kuò)展 的、已定標(biāo)的子帶進(jìn)行量化,這生成針對(duì)每個(gè)子帶的碼向量。對(duì)于每個(gè)子帶,可以計(jì)算具體范數(shù)用于包括已量化子帶的格型 截?cái)?。針?duì)每個(gè)子帶,可以選擇用于矩形截?cái)嗟母裥偷姆稊?shù),以便 對(duì)應(yīng)于與各個(gè)碼向量的范數(shù)。在解碼端不能預(yù)先已知這種范數(shù),可 以對(duì)其進(jìn)行編碼(例如,熵編碼),使得可以將其提供作為用于已 編碼音頻信號(hào)的另 一 側(cè)的信息。例如可以通過索引來編碼導(dǎo)致量化的碼向量。例如但并非排他地,可以在AAC編碼框架中應(yīng)用上述編碼選項(xiàng)。根據(jù)示出可能實(shí)施方式的以下描述,本申請(qǐng)的其他方面將變得 清楚明了。


圖1示意性地示出了根據(jù)本發(fā)明的一個(gè)實(shí)施方式的第一電子設(shè) 備的編碼器的功能塊;圖2示意性地示出了根據(jù)實(shí)施方式的編碼器組件的功能塊; 圖3是示出根據(jù)本發(fā)明的一個(gè)實(shí)施方式的編碼操作的流程圖; 圖4示意性地示出了根據(jù)本發(fā)明的一個(gè)實(shí)施方式的第二電子設(shè) 備的解碼器的功能塊;
圖5示意性地示出了根據(jù)實(shí)施方式的解碼器組件的功能塊。
具體實(shí)施例方式
圖1是其中可以實(shí)現(xiàn)根據(jù)本發(fā)明的一個(gè)實(shí)施方式的低復(fù)雜度編 碼的示例性電子設(shè)備1的圖示。
電子設(shè)備l包括編碼器2,示意性地示出了編碼器2的功能塊。 編碼器2包括改進(jìn)的離散余弦變換(MDCT)單元4、定標(biāo)單元6、 壓縮擴(kuò)展單元8、量化單元10、索引單元以及熵編碼單元13。
在MDCT單元4中,輸入音頻信號(hào)14經(jīng)MDCT變換到頻率域。 然后,在定標(biāo)單元6中,利用各個(gè)定標(biāo)因子來定標(biāo)頻率域信號(hào)的多 個(gè)頻率子帶的頻鐠分量。例如,這種定標(biāo)可以是利用第一和/或第二 定標(biāo)因子的下定標(biāo)。
向壓縮擴(kuò)展單元8提供子帶的這些已定標(biāo)的頻譜分量,在所述 壓縮擴(kuò)展單元8中壓縮擴(kuò)展該頻語分量。向量化單元IO提供已壓縮 擴(kuò)展的頻鐠分量,其中利用第三定標(biāo)因子乘以所述已壓縮擴(kuò)展的頻 譜分量,并且使用格型量化器來量化??梢栽诹炕瘑卧狪O外部實(shí)現(xiàn) 定標(biāo)。如果使用Zn格型,則此步驟對(duì)應(yīng)于四舍五入到最接近的整數(shù) 以便獲得量化的頻譜分量。每個(gè)子帶的量化的頻譜分量可以用各個(gè) 格型向量來表示。
在索引單元12中,可以針對(duì)每個(gè)子帶通過適合的索引方法來將 所獲得的整數(shù)格型向量進(jìn)行索引。
可以以硬件(HW)和/或軟件(SW)來實(shí)現(xiàn)編碼器2。關(guān)于以 軟件實(shí)現(xiàn)的情況,當(dāng)在設(shè)備1的處理單元中執(zhí)行該軟件時(shí),存儲(chǔ)在 計(jì)算機(jī)可讀介質(zhì)上的軟件代碼實(shí)現(xiàn)所述功能。
現(xiàn)在,將參考圖2來更詳細(xì)地描述用于音頻信號(hào)的MDCT頻諳系數(shù)的非常低復(fù)雜度量化的新結(jié)構(gòu)的實(shí)施方式。示出了 MDCT單元 4、改進(jìn)的定標(biāo)單元6以及壓縮擴(kuò)展格型向量量化器單元16。壓縮擴(kuò) 展格型向量量化器單元16包括圖1的壓縮擴(kuò)展單元8、量化單元10 以及索引單元12。

根據(jù)實(shí)施方式,利用標(biāo)度因子^、以及利用已定標(biāo)子帶標(biāo)準(zhǔn)差 丄
的倒數(shù) ,在定標(biāo)單元6中對(duì)由MDCT單元4提供的每個(gè)子帶SBi (其中i=l至N)進(jìn)行定標(biāo)。由于僅可從訓(xùn)練集來離線估計(jì)標(biāo)準(zhǔn)差的 值,所以已定標(biāo)的子帶分量的方差值可以不同于1。然而,估計(jì)越好 則方差值越接近等于1。
利用第 一 定標(biāo)因子已經(jīng)定標(biāo)的數(shù)據(jù)的標(biāo)準(zhǔn)差的分割使得已定標(biāo) 數(shù)據(jù)具有"1"的方差。
用于標(biāo)度因子的計(jì)算的基數(shù)b是根據(jù)可用比特率,該比特率可 以由用戶來設(shè)置。對(duì)于高于或者等于48kBit/s的比特率,此基數(shù)b 可以是1.45;而對(duì)于低于48kBit/s的比特率,基數(shù)b可以是2。應(yīng) 該理解,如果發(fā)現(xiàn)適合則還可以選擇其他的值。使用不同的基數(shù)值 允許在不同比特率使用不同的量化分辨率。在下文中將進(jìn)一步描述 針對(duì)每個(gè)子帶的標(biāo)度因子計(jì)算所使用的指數(shù){^}的確定,其中所述指 數(shù)可以是從0至42的整數(shù)。
在編碼器和解碼器兩側(cè),對(duì)于每個(gè)子帶的標(biāo)準(zhǔn)差和基數(shù)b都是 已知的。根據(jù)實(shí)施方式,可以例如在訓(xùn)練集上,離線計(jì)算所使用的 標(biāo)準(zhǔn)差。由此,僅使得指數(shù)"}必須可用于解碼端。
以傳統(tǒng)方式使用通過定標(biāo)結(jié)果生成的頻譜分量的概率密度函 數(shù),以便推斷產(chǎn)生壓縮擴(kuò)展函數(shù)的累積密度函數(shù)。通過示例方式, 從訓(xùn)練數(shù)據(jù)集抽取累積密度函數(shù)并將其存儲(chǔ)為700個(gè)二維點(diǎn)(x, f (x))的表。"x,,是部分線性的(具有3個(gè)不同斜率),從而使 用一維點(diǎn)(僅僅f (x))可實(shí)現(xiàn)函數(shù)的存儲(chǔ)。
在壓縮擴(kuò)展格型向量量化器單元16中,使用產(chǎn)生的壓縮擴(kuò)展函 數(shù)來壓縮擴(kuò)展已定標(biāo)的頻譜分量。在壓縮擴(kuò)展之后,已壓縮擴(kuò)展的200680039020.3說明書第7/12頁數(shù)據(jù)幾乎具有一致的分布并且可以使用格型量化器來有效地得以量 化。為了增加量化分辨率,在量化之前,另外可以由另一第三定標(biāo) 因子來乘以已壓縮擴(kuò)展的數(shù)據(jù),這可以是相應(yīng)子帶的標(biāo)準(zhǔn)差乘以一個(gè)因子,其中對(duì)于大于或者等于48 kbit/s的比特率,所述因子等于3, 而對(duì)于小于48kbit/s的比特率,所述因子等于2.1。由此,在相同的編碼結(jié)構(gòu)中,可以通過兩個(gè)參數(shù)來改變量化分 辨率,即第 一定標(biāo)因子的基數(shù)b和量化之前直接應(yīng)用的乘法的第三 定標(biāo)因子。例如,這允許針對(duì)不同的比特率域使用相同的編解碼器, 所述不同比特率域例如在44.1 kHz的從16 kbit/s至128 kbit/s。對(duì)于已壓縮擴(kuò)展數(shù)據(jù)的量化,壓縮擴(kuò)展格型向量量化器16更適 合用于針對(duì)每個(gè)頻譜子帶使用矩形截?cái)嗟腪n格型向量量化器,例如 在每1024長度量化幀處。除Zn格型以外,其他格型也是適用的并 且在本申請(qǐng)的范圍中。各個(gè)Zn格型的維度可以等于各個(gè)子帶中頻譜 分量的數(shù)目。Zn格型包括n維空間的所有整數(shù)坐標(biāo)點(diǎn)。格型的有限截?cái)嘈纬?"碼本,,,并且可將一個(gè)點(diǎn)稱作"碼向量"。每個(gè)碼向量可以關(guān)聯(lián) 于各個(gè)索引。另一方面,可以通過整數(shù)向量來表示各個(gè)子帶的量化 的頻譜分量,所述整數(shù)向量與Zn格型量化器的特定碼向量相對(duì)應(yīng)。 由此,代替對(duì)每個(gè)向量分量單獨(dú)進(jìn)行編碼的是可以從格型生成單 個(gè)索引并將其針對(duì)向量而發(fā)送。在截?cái)嗟母裥椭?,格型的點(diǎn)的數(shù)目是有限的。在其中包含了向 量的矩形截?cái)喔裥驮试S簡(jiǎn)單的索引算法。繼而格型碼向量是來自格 型截?cái)嗟狞c(diǎn)。如果截?cái)嗍蔷匦蔚模瑒t與此截?cái)嘞鄬?duì)應(yīng)的范數(shù)可以是所考慮向 量的分量的最大絕對(duì)值JV(;c) = m'ax(|xj), x = (x!,…,;x:")e Z (1)壓縮擴(kuò)展格型向量量化器16的輸出包括碼向量的范數(shù)"^和格 型碼向量索引" )h其中碼向量可以是從0至141的整數(shù)。索引i表示子帶并且索引j枚舉在比特率最小化算法中使用的可能的指數(shù) 值??梢允褂帽玖炕?,因?yàn)樗隽炕轻槍?duì)音頻信號(hào)的頻譜量化、 或者適用于其他類型的數(shù)據(jù)的量化。為了給出某些示例,范數(shù)^"^ }和指數(shù){& }可以是使用香農(nóng)編碼或者算術(shù)編碼在熵編碼器13中編碼的熵。由實(shí)現(xiàn)所提出的頻譜量化方法的編碼器2所輸出的比特流包括 每個(gè)子帶的碼向量的索引的二進(jìn)制表示、以及熵編碼的范數(shù)和指數(shù)。如果碼向量的范數(shù)是零,則不能編碼標(biāo)度因子的指數(shù),這是因 為其不再有效??梢匀缦掠?jì)算針對(duì)各個(gè)索引所需的比特?cái)?shù)目<formula>formula see original document page 14</formula> 其中n是量化空間的維度,即當(dāng)前子帶,以及「1'表示最接近朝向無限四舍五入自變量的整數(shù)。編碼器具有例如可以由用戶設(shè)置的可用總比特率,并且由編碼 器輸出的比特流應(yīng)具有該比特率。為了確定適合的指數(shù)(& },定標(biāo)單元6可以通過應(yīng)用優(yōu)化算法 來執(zhí)行失真/比特率優(yōu)化。為此,針對(duì)具有n維的每個(gè)子帶的指數(shù)P??梢酝ㄟ^下式來定 <formula>formula see original document page 14</formula> 其中aD是每個(gè)子帶所允許的失真??蓮囊韵赂兄J絹慝@取允 許的失真。L」表示整數(shù)部分或者最接近于自變量的較小整數(shù)。失真測(cè)量是每個(gè)子帶的量化的歐幾里德失真與針對(duì)所考慮子帶所允許的 失真之間的比率。針對(duì)每個(gè)子帶SBj,選擇上至20個(gè)(作為示例,可以是不同的 值)指數(shù)值用于評(píng)估。這些指數(shù)包括大于初始值的19個(gè)指數(shù)值和初 始值。如果不存在大于初始值的20個(gè)指數(shù)值,則僅考慮這些可用的指數(shù)值。應(yīng)該注意,這些數(shù)目還可以是變化的,但是如果考慮更多 的值,則編碼時(shí)間會(huì)增加。相反,考慮較少的值將使得編碼時(shí)間降 低,這在編碼質(zhì)量方面將付出輕微的代價(jià)。
針對(duì)每個(gè)子帶和指數(shù)的每個(gè)考慮的值5針對(duì)給定的幀來應(yīng)用上 述定標(biāo)、壓縮擴(kuò)展、乘法以及量化的處理。在這些情況的每個(gè)中, 針對(duì)每個(gè)子帶以及每個(gè)所考慮指數(shù)來獲取已量化的向量。
為了編碼結(jié)果生成的向量,需要Rmax的比特?cái)?shù)目加上編碼向量 的最大范數(shù)的比特?cái)?shù)目和編碼所考慮的指數(shù)的比特?cái)?shù)目。這三個(gè)量 的總和對(duì)應(yīng)于所謂的比特率值。
率-失真測(cè)量可以是關(guān)于每個(gè)子帶所允許失真的錯(cuò)誤率。當(dāng)計(jì)算
錯(cuò)誤率時(shí),存在兩種可能途徑 一種是從其定義來計(jì)算實(shí)際錯(cuò)誤率;
而第二種是,如果所允許的失真測(cè)量大于在所考慮子帶中的信號(hào)能 量,則將錯(cuò)誤率設(shè)置為零。第一種途徑可以認(rèn)為是"定義",而第 二種途徑可認(rèn)為是"改進(jìn)的定義"。
由此,針對(duì)每個(gè)子帶和每個(gè)考慮的指數(shù),可以獲得比特率與錯(cuò)
誤率的各個(gè)配對(duì)。此配對(duì)還稱作率-失真測(cè)量。
對(duì)于每個(gè)子帶,排序率-失真測(cè)量使得比特率是增加的。通常, 隨著比特率的增加,失真將降低。如果不滿足此規(guī)律,則排除具有 較高比特率的失真測(cè)量。這就是不是所有子帶都具有相同數(shù)目的率-失真測(cè)量的原因。
優(yōu)化算法具有兩種類型的初始化
1. 由與最低錯(cuò)誤率相對(duì)應(yīng)的率-失真測(cè)量開始,該最低錯(cuò)誤率等 效于最高比特率,或者
2. 由與針對(duì)所有子帶的小于1.0的錯(cuò)誤率相對(duì)應(yīng)的率-失真測(cè)量 開始。
優(yōu)化算法的目標(biāo)在于針對(duì)當(dāng)前幀的每個(gè)子帶,從所考慮指數(shù)值 中選擇指數(shù)值,使得所選擇的率-失真測(cè)量的累積比特率小于或者等 于針對(duì)幀的可用比特率,并且整體錯(cuò)誤率盡可能地小。用于此優(yōu)化 的標(biāo)準(zhǔn)應(yīng)該為最小的4晉誤率,而比特率應(yīng)該在由比特池才幾制所給出的可用比特?cái)?shù)目以內(nèi),例如在AAC中那樣。
根據(jù)示例性的優(yōu)化算法,率-失真測(cè)量按照沿子帶i (其中i=l: N)增加的比特率的值而從1至Ri, Ni地排序,并且結(jié)果是降低的錯(cuò) 誤率,Dj,j (其中i=l:N, j = l:Ni)。由具有最小失真的率-失真測(cè)
量來初始該算法。初始比特率是"=^《,。為了選擇具有索引k的 最佳率-失真測(cè)量,可以應(yīng)用如下偽代碼
<formula>formula see original document page 16</formula>索引k(i)(其中i=l:N)指向率-失真測(cè)量,而且還指向應(yīng)該 針對(duì)每個(gè)子帶所選擇的指數(shù)值,該值可以用于生成率-失真測(cè)量。 對(duì)于高的比特率,例如,>48kbit/s,可以在第5行將算法修改
為<formula>formula see original document page 16</formula>
使得如果通過降低其比特率,將所有系數(shù)設(shè)置為零,則在最大 化過程不考慮子帶i,并且用于該子帶的比特率變?yōu)?。
如果總比特率過高,則應(yīng)降低一些,由此某些子帶將具有較小 比特率。如果僅可應(yīng)用于一個(gè)子帶的率-失真測(cè)量是一個(gè)具有等于1 的比特率的率-失真測(cè)量,其中相應(yīng)于被設(shè)置為零的子帶中的所有系 數(shù),1是針對(duì)子帶比特率的最小可能值,則在該子帶中,不能進(jìn)一步 降低比特率。這是測(cè)試k (i)是否大于1的原因。對(duì)于每個(gè)符合條件的子帶,計(jì)算對(duì)應(yīng)于一個(gè)配對(duì)向左側(cè)前進(jìn)的梯度,并且選擇具有 最低增加的失真并且具有最大降低的比特率的配對(duì)。然后,檢查結(jié) 果生成的總比特率,等等。圖3是概括上述編碼的流程圖。首先,對(duì)接收到的音頻信號(hào)進(jìn)行變換,并將其劃分為多個(gè)子帶 SBi,其中i=l至N (步驟101 )。然后,針對(duì)每個(gè)子帶,基于在此子帶中所允許的失真來確定指 數(shù)Si的初始值(步驟102)。如上所述,使用所確定的Sj的初始值, 通過第一和/或第二定標(biāo)因子將子帶分量進(jìn)行分割(步驟103),其 中定標(biāo)因子可以是標(biāo)準(zhǔn)差o'和^ ,進(jìn)行壓縮擴(kuò)展(步驟104),進(jìn) 一步利用第三定標(biāo)因子進(jìn)行定標(biāo)(步驟105),以及進(jìn)行量化(步驟 106)。針對(duì)Si的多達(dá)19個(gè)的其他值來重復(fù)相同操作,只要該值沒 有超過42,則在每次重復(fù)中將Sj遞增l(步驟107、步驟103至106)。 對(duì)于每個(gè)所使用的Si值,確定結(jié)果生成的比特率和結(jié)果生成的失真 (步驟108)。然后,根據(jù)增加的相關(guān)聯(lián)的比特率來Si值進(jìn)行排序(步 驟109)。丟棄導(dǎo)致比各個(gè)先前Si值更高失真的那些Si值。接著,共同估計(jì)針對(duì)所有子帶的排序的Sj值。更具體地,針對(duì) 每個(gè)子帶選擇一個(gè)Si值,從而針對(duì)所有子帶的Si值的集合(sJ導(dǎo)致盡可能地靠近所允許的總比特率的總比特率,并且同時(shí)將整體失真最 小化(步驟110)。最后,針對(duì)每個(gè)子帶SBi,對(duì)具有所選擇Si值的在步驟106的量 化中產(chǎn)生的碼向量進(jìn)行索引,以及對(duì)在此量化中使用的范數(shù)和所選 擇的Sj值進(jìn)行熵編碼(步驟111 )。圖4是其中可以實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施方式的低復(fù)雜度解碼的 示例性電子設(shè)備17的圖示。電子設(shè)備1和17可以一起形成根據(jù)本 發(fā)明的系統(tǒng)的示例性實(shí)施方式。電子設(shè)備17包括解碼器18,示意性地示出了其中的功能塊。解 碼器18包括熵解碼器21、逆索引單元22、解壓縮擴(kuò)展單元24、逆 定標(biāo)單元26以及逆MDCT單元28。在解碼器18中接收已編碼的比特流20。首先,通過熵解碼單元 21來抽取定標(biāo)因子的范數(shù)和指數(shù)。在熵解碼單元21和逆索引單元 22之間存在連接器。將已解碼的范數(shù)從熵解碼單元21饋送至逆索引 單元22,從而通知該索引表示多少比特。從二進(jìn)制字讀取碼向量索 引,并將其饋送至逆索引單元22,其中所述二進(jìn)制字具有根據(jù)公式 (2)由已解碼范數(shù)給出的長度。然后,在逆索引單元22中取回碼向量。在解壓縮擴(kuò)展單元24 中使用碼向量的分量,以便獲得已解壓縮擴(kuò)展的值的集合。在逆定 標(biāo)單元26中通過逆定標(biāo)因子來定標(biāo)這些值。在逆MDCT單元28中 使用已定標(biāo)的值以獲取期望的音頻信號(hào)。解碼器18可以以硬件(HW)和/或軟件(SW)來實(shí)現(xiàn)。如果以 軟件來實(shí)現(xiàn),則當(dāng)在設(shè)備17的處理單元中執(zhí)行時(shí),存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的軟件代碼實(shí)現(xiàn)所描述的功能。圖5示出了根據(jù)實(shí)施方式的解碼器18的所選擇組件。這些組件 包括逆索引單元22、定標(biāo)單元33 (在圖3中未示出)、解壓縮擴(kuò)展 單元24以及改進(jìn)的逆定標(biāo)單元26。已編碼的比特流20包括針對(duì)每個(gè)子帶SBj的碼向量索引t對(duì)"h針對(duì)每個(gè)子帶SBi的已編碼范數(shù)仏"H以及針對(duì)每個(gè)子帶SBi的已編碼指數(shù)(Si〉。逆索引單元22利用從熵解碼單元21接收的碼向量索引WW以 及已解碼范數(shù)仏"W,來取回每個(gè)子帶的已壓縮擴(kuò)展的頻譜分量。這 些已壓縮擴(kuò)展的頻譜分量在定標(biāo)單元33中通過因子來分割,在編碼 器2中使用所述因子來乘以已壓縮擴(kuò)展的數(shù)據(jù),即2'15^'或者" 。在解壓縮擴(kuò)展單元24中對(duì)結(jié)果生成的數(shù)據(jù)進(jìn)行解壓縮擴(kuò)展。使用從熵解碼單元21接收的已解碼指數(shù)(Sj),隨已知的基數(shù)b 一起生成針對(duì)各個(gè)子帶的逆標(biāo)度因子。在逆定標(biāo)單元26中,針對(duì)各 個(gè)子帶,使用針對(duì)各個(gè)子帶的逆標(biāo)度因子和已知的標(biāo)準(zhǔn)差a,'來重新 定標(biāo)由解壓縮擴(kuò)展單元24輸出的頻譜分量。應(yīng)該注意,所述實(shí)施方式可以以許多方式變化。
權(quán)利要求
1.一種用于音頻編碼的方法,該方法包括-接收輸入音頻信號(hào),-將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶,-利用第一因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo),-對(duì)所述至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展,以及-對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述第一因子依賴于以下 項(xiàng)中至少一個(gè)A) 針對(duì)已編碼數(shù)據(jù)流可用的總比特率,B) 針對(duì)每個(gè)子帶可用的比特率,以及C) 各個(gè)子帶的特性。
3. 根據(jù)權(quán)利要求1所述的方法,其中所述定標(biāo)進(jìn)一步包括利用 第二因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo),所述第二因子至少取決于 所述各個(gè)已定標(biāo)子帶的標(biāo)準(zhǔn)差。
4. 根據(jù)權(quán)利要求1所述的方法,其中量化包括使用格型量化器 進(jìn)行量化。
5. 根據(jù)權(quán)利要求1所述的方法,其中所述第一因子包括基數(shù)和 指數(shù),以及其中針對(duì)整體較高比特率將針對(duì)各個(gè)子帶的所述基數(shù)設(shè) 置為較低值,并且針對(duì)整體較低比特率將針對(duì)各個(gè)子帶的所述基數(shù) 設(shè)置為較高值。
6. 根據(jù)權(quán)利要求1所述的方法,其中所述第一因子包括基數(shù)和 指數(shù),以及其中針對(duì)每個(gè)子帶確定所述指數(shù),使得所述已編碼音頻 信號(hào)的所述總比特率盡可能地接近于可用比特率,以及所有子帶中 的整體錯(cuò)誤率被最小化。
7. 根據(jù)權(quán)利要求1所述的方法,其中所述第一因子包括基數(shù)和 指數(shù),以及其中至少從率-失真測(cè)量來確定所述指數(shù)。
8. 根據(jù)權(quán)利要求6所述的方法,進(jìn)一步包括選擇以下值作為針對(duì)每個(gè)子帶的最優(yōu)化的最小的所考慮的指數(shù)值其中aD是每個(gè)子帶允許的失真,其從感知編碼模式得出,并且 U表示整數(shù)部分、或者最接近于自變量的較小整數(shù)。
9. 根據(jù)權(quán)利要求7所述的方法,其中對(duì)針對(duì)每個(gè)子帶的所述率-失真測(cè)量進(jìn)行排序使得比特率增加。
10. 根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括通過以下之一來初 始化一個(gè)搜索用于導(dǎo)致優(yōu)化的指數(shù)的率-失真測(cè)量A) 由與所述最低錯(cuò)誤率相對(duì)應(yīng)的所述率-失真測(cè)量開始,所述最 低錯(cuò)誤率等效于最高比特率,或者B) 由與針對(duì)所有子帶小于1.0的錯(cuò)誤率相對(duì)應(yīng)的所述率-失真測(cè) 量開始。
11. 根據(jù)權(quán)利要求7所述的方法,其中所述率-失真測(cè)量是關(guān)于 每個(gè)子帶所允許的失真的錯(cuò)誤率,所述錯(cuò)誤率通過以下的至少一個(gè) 來計(jì)算A) 從錯(cuò)誤率定義計(jì)算實(shí)際錯(cuò)誤率,或者B) 如果所述允許的失真測(cè)量大于在所述考慮的子帶中的所述信 號(hào)的能量,則將所述錯(cuò)誤率設(shè)置為零。
12. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括使用熵編碼對(duì)所述 第 一 因子的至少 一個(gè)分量進(jìn)行編碼。
13. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括利用所述已定標(biāo)子 帶的所述概率函數(shù),用于創(chuàng)建用于壓縮擴(kuò)展的累積密度函數(shù)。
14. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括,在利用第三定標(biāo) 因子量化之前對(duì)所述已壓縮擴(kuò)展的子帶進(jìn)行定標(biāo),其中所述第三定 標(biāo)因子針對(duì)較高比特率比針對(duì)較低比特率較高。
15. 根據(jù)權(quán)利要求1所述的方法,使用矩形截?cái)嗟母裥陀糜趯?duì)所 述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化,所述量化導(dǎo)致用于每個(gè) 子帶的碼向量。
16. 根據(jù)權(quán)利要求15所述的方法,進(jìn)一步包括針對(duì)每個(gè)子帶計(jì)算用于包括所迷已量化子帶的格型截?cái)嗟姆稊?shù),使用熵編碼對(duì)針對(duì) 每個(gè)子帶所計(jì)算的范數(shù)進(jìn)行編碼,以及通過索引對(duì)所述碼向量進(jìn)行編碼。
17. —種編碼器,包括-變換單元,適用于接收輸入音頻信號(hào)以及將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶;-定標(biāo)單元,適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo); -壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展;以及-量化單元,適用于對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
18. —種電子設(shè)備,包括-變換單元,適用于接收輸入音頻信號(hào)以及將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶;-定標(biāo)單元,適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo); -壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展;以及-量化單元,適用于對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
19. 一種軟件程序產(chǎn)品,其中存儲(chǔ)了用于音頻編碼的軟件代碼, 當(dāng)由電子設(shè)備的處理單元執(zhí)行時(shí),所述軟件代碼實(shí)現(xiàn)以下步驟-接收輸入音頻信號(hào);-將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶;-利用第一因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo);-對(duì)所述至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展;以及-對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
20. —種用于音頻解碼的方法,該方法包括 -接收已編碼的音頻數(shù)據(jù),-從所述已編碼的音頻數(shù)據(jù)生成至少兩個(gè)已壓縮擴(kuò)展的子帶;-對(duì)每個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展,-利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo), 以及-將所述已解壓縮擴(kuò)展的和已定標(biāo)的子帶結(jié)合到已解碼的音頻 信號(hào)。
21. —種解碼器,包括-解壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解 壓縮擴(kuò)展,其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼音頻數(shù) 據(jù)生成的;-定標(biāo)單元,適用于利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展 的子帶進(jìn)行定標(biāo);以及-變換單元,適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到 已解碼的音頻信號(hào)。
22. —種電子設(shè)備,包括-解壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解 壓縮擴(kuò)展,其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼音頻數(shù) 據(jù)生成的;-定標(biāo)單元,適用于利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展 的子帶進(jìn)行定標(biāo);以及-變換單元,適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到 已解碼的音頻信號(hào)。
23. —種軟件程序產(chǎn)品,其中存儲(chǔ)有用于音頻解碼的軟件代碼, 當(dāng)由電子設(shè)備的處理單元執(zhí)行時(shí),所述軟件代碼實(shí)現(xiàn)以下步驟-接收已編碼的音頻數(shù)據(jù),-從所述已編碼的音頻數(shù)據(jù)生成至少兩個(gè)已壓縮擴(kuò)展的子帶, -對(duì)每個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展, -利用第 一 因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo), 以及-將所述已解壓縮擴(kuò)展的和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。
24. —種包括用于對(duì)音頻數(shù)據(jù)進(jìn)行編碼的編碼器以及用于對(duì)已 編碼音頻數(shù)據(jù)進(jìn)行解碼的解碼器的系統(tǒng),所述編碼器包括-變換單元,適用于接收輸入音頻信號(hào)以及將所述輸入音頻信號(hào) 劃分為至少兩個(gè)子帶;-定標(biāo)單元,適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo);-壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓 縮擴(kuò)展;以及-量化單元,適用于對(duì)已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化; 并且所述解碼器包括-解壓縮擴(kuò)展單元,適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解 壓縮擴(kuò)展,其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼音頻數(shù) 據(jù)生成的;隱定標(biāo)單元,適用于利用所述第一因子對(duì)所述至少兩個(gè)已解壓縮 擴(kuò)展的子帶進(jìn)行定標(biāo);以及-變換單元,適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到 已解碼的音頻信號(hào)。
全文摘要
音頻編碼,通過以下步驟進(jìn)行接收輸入音頻信號(hào);將輸入音頻信號(hào)劃分為至少兩個(gè)子帶;利用至少根據(jù)相應(yīng)子帶的標(biāo)準(zhǔn)差的因子來對(duì)所述至少兩個(gè)子帶進(jìn)行下定標(biāo);對(duì)所述至少兩個(gè)已下定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展;以及利用格型量化器對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
文檔編號(hào)G10L19/00GK101292286SQ200680039020
公開日2008年10月22日 申請(qǐng)日期2006年10月9日 優(yōu)先權(quán)日2005年10月21日
發(fā)明者A·瓦西拉切 申請(qǐng)人:諾基亞公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
义马市| 沙湾县| 小金县| 集贤县| 阿拉善盟| 洪湖市| 金门县| 安平县| 黄平县| 健康| 湘潭县| 沙田区| 扬州市| 喜德县| 鸡泽县| 武夷山市| 沙洋县| 禹城市| 夏邑县| 永丰县| 运城市| 宁强县| 马山县| 莱西市| 巍山| 庆元县| 乐山市| 仙居县| 杭锦旗| 通渭县| 抚顺市| 云和县| 桦南县| 莲花县| 忻州市| 桂阳县| 安乡县| 大厂| 麻栗坡县| 金溪县| 普兰店市|