音頻編碼的制作方法

文檔序號(hào)：2836947閱讀：320來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻編碼的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般涉及音頻編碼以及解碼技術(shù)。
背景技術(shù)：
對(duì)于音頻編碼，過去已經(jīng)應(yīng)用了不同的編碼方案。這些編碼方案中的一種編碼方案是應(yīng)用心理聲學(xué)編碼。關(guān)于這些編碼方案，使用輸入音頻信號(hào)的頻謙特性來減小冗余。分析輸入音頻信號(hào)的頻譜分量并且去除顯然不能由人耳識(shí)別的頻譜分量。為了應(yīng)用這些編碼方案，獲得輸入音頻信號(hào)的頻譜系數(shù)。
諸如高級(jí)音頻編碼器(AAC)以及MPEG音頻的心理聲學(xué)編碼中的頻譜系數(shù)的量化通過以下方式來執(zhí)行，即先使用標(biāo)量量化，接著使用標(biāo)度因子(scale factor )以及定標(biāo)的頻譜系數(shù)的熵編碼。使用針對(duì)頻譜系數(shù)的十一個(gè)可能的固定霍夫曼樹、以及針對(duì)標(biāo)度因子的一個(gè)樹作為微分編碼來執(zhí)行熵編碼。
理想的編碼情況產(chǎn)生原始信號(hào)的壓縮版本，這導(dǎo)致與原始非常接近(至少在可感知的意義上)的信號(hào)的解碼過程，同時(shí)具有高壓縮比并且壓縮算法不太復(fù)雜。由于當(dāng)今流傳甚廣的多媒體通信以及異類網(wǎng)絡(luò)，為了相同或者更好的質(zhì)量而同時(shí)保持較低復(fù)雜度而提高壓縮比率是一項(xiàng)持久的挑戰(zhàn)。

發(fā)明內(nèi)容
根據(jù)一個(gè)方面，本申請(qǐng)?zhí)峁┝艘环N用于音頻編碼的方法，該方法通過以下步驟來進(jìn)行接收輸入音頻信號(hào)，將所述輸入音頻信號(hào) 劃分為至少兩個(gè)子帶，利用第一因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo)，對(duì)所述至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展，以及對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝艘环N編碼器，該編碼器包括變換單元，適用于接收輸入音頻信號(hào)，并且將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶；定標(biāo)單元，適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo)；壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè) 子帶進(jìn)行壓縮擴(kuò)展；以及量化單元，適用于對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝?一種包括與上述編碼器相同組件的電子設(shè)備。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝?一種存儲(chǔ)軟件代碼的軟件程序產(chǎn) 品，當(dāng)在電子設(shè)備的處理單元中執(zhí)行時(shí)，所述軟件代碼適用于實(shí)現(xiàn) 上述編碼方法。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝艘环N用于音頻解碼的方法，該方法通過以下步驟來實(shí)現(xiàn)接收已編碼的音頻數(shù)據(jù)，從所述已編碼的音頻數(shù)據(jù)生成至少兩個(gè)已壓縮擴(kuò)展的子帶；對(duì)每個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展，利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)；以及將所述已解壓縮擴(kuò)展的和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝艘环N解碼器，該解碼器包括解壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò) 展，其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼的音頻數(shù)據(jù)生成；定標(biāo)單元，適用于利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)；以及變換單元，適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝?一種存儲(chǔ)軟件代碼的軟件程序產(chǎn) 品，當(dāng)在電子設(shè)備的處理單元中執(zhí)行時(shí)，所述軟件代碼適用于實(shí)現(xiàn) 上述解碼方法。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝艘环N包括與上述解碼器相同組件的電子設(shè)備。根據(jù)另一方面，本申請(qǐng)?zhí)峁┝?一種包括上述編碼器和上述解碼器的系統(tǒng)。
本申請(qǐng)?jiān)陬l譜數(shù)據(jù)的向量量化之前提供對(duì)輸入音頻信號(hào)子帶的頻譜分量進(jìn)行壓縮擴(kuò)展。根據(jù)一個(gè)方面，壓縮擴(kuò)展通過使用已定標(biāo) 的子帶來考慮輸入音頻數(shù)據(jù)的心理聲學(xué)現(xiàn)象以及頻譜系數(shù)的分布，其中所述已定標(biāo)的子帶實(shí)現(xiàn)性能-復(fù)雜度有效的量化。
根據(jù)一個(gè)實(shí)施方式，定標(biāo)包括利用第一定標(biāo)因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo)。該第一定標(biāo)因子可以例如依賴于針對(duì)已編碼數(shù)據(jù)流的總可用比特率，依賴于針對(duì)每個(gè)子帶的可用比特率、和/或依賴于各個(gè)子帶的特性。第一定標(biāo)因子可以包括例如基數(shù)和指數(shù)?？偙忍芈?例如可以由用戶來設(shè)置，然后可以以適合的方式向子帶自動(dòng)分布所述總比特率。
然后，如果整體比特率(用戶可以對(duì)其施加影響)具有較高的
值，則例如可以將針對(duì)各個(gè)子帶的基數(shù)設(shè)置為較低的值；以及如果由用戶施加影響的比特率具有較低的值，則可以將該基數(shù)設(shè)置為較高的值。
例如可以針對(duì)每個(gè)子帶確定指數(shù)，使得已編碼音頻信號(hào)的總比特率盡可能地接近，但可以不小于可用比特率，并且所有子帶中的整體失真是最小化的。這允許對(duì)比特率-失真測(cè)量進(jìn)行優(yōu)化。
可以以各種方式確定指數(shù)。例如，可以根據(jù)針對(duì)每個(gè)子帶所允許的失真來計(jì)算用于該子帶的最小的所考慮的指數(shù)。
為了對(duì)已編碼音頻信號(hào)進(jìn)行解碼，關(guān)于在編碼側(cè)定標(biāo)的信息還必須在解碼側(cè)也可用。為此，可以編碼所需的信息，例如熵編碼。僅提供和編碼第一定標(biāo)因子的一部分可以是足夠的。在編碼器和解碼器兩側(cè)已知由用戶設(shè)置的整體比特率，因此僅編碼指數(shù)而不編碼基數(shù)可以是足夠的。
根據(jù)其他實(shí)施方式，定標(biāo)可以包括第二因子，該第二因子是根據(jù)用第一因子定標(biāo)的子帶的標(biāo)準(zhǔn)差。利用第一定標(biāo)因子的定標(biāo)可以
代替利用第二定標(biāo)因子的定標(biāo)。根據(jù)其他實(shí)施方式，利用已定標(biāo)子帶的概率函數(shù)來創(chuàng)建用于壓縮擴(kuò)展的累積密度函數(shù)。頻譜數(shù)據(jù)可以近似為具有0.5的形狀因子的廣義高斯概率密度函數(shù)。這一發(fā)現(xiàn)可以使得使用解析的廣義高斯概率密度函數(shù)來以傳統(tǒng)方式計(jì)算累積密度函數(shù)以及獲取壓縮擴(kuò)展函數(shù)。這一經(jīng)典方法稱作"直方圖均衡化"。其思想是變換數(shù)據(jù)，使得結(jié)果生成的已變換數(shù)據(jù)的概率密度函數(shù)是一致的。示出了將由數(shù) 據(jù)的累積密度函數(shù)給出的變換函數(shù)。累計(jì)密度函數(shù)是最大值為1的非下降函數(shù)?？梢噪x線預(yù)先確定該函數(shù)并且在編碼端存儲(chǔ)該函數(shù)，根據(jù)其他實(shí)施方式，在利用第三定標(biāo)因子量化之前對(duì)已壓縮擴(kuò) 展的子帶進(jìn)行定標(biāo)。此第三定標(biāo)因子針對(duì)較高整體比特率可以比針對(duì)較低整體比特率較高。此第三因子可以依賴于子帶系數(shù)的標(biāo)準(zhǔn)差，由此通過這樣的乘法，提供了其他裝置用于針對(duì)每個(gè)子帶分別調(diào)整量化分辨率。格型量化器可以使用例如矩形截?cái)嗟母裥陀糜趯?duì)已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化，這生成針對(duì)每個(gè)子帶的碼向量。對(duì)于每個(gè)子帶，可以計(jì)算具體范數(shù)用于包括已量化子帶的格型截?cái)?。針?duì)每個(gè)子帶，可以選擇用于矩形截?cái)嗟母裥偷姆稊?shù)，以便對(duì)應(yīng)于與各個(gè)碼向量的范數(shù)。在解碼端不能預(yù)先已知這種范數(shù)，可以對(duì)其進(jìn)行編碼(例如，熵編碼)，使得可以將其提供作為用于已編碼音頻信號(hào)的另一側(cè)的信息。例如可以通過索引來編碼導(dǎo)致量化的碼向量。例如但并非排他地，可以在AAC編碼框架中應(yīng)用上述編碼選項(xiàng)。根據(jù)示出可能實(shí)施方式的以下描述，本申請(qǐng)的其他方面將變得清楚明了。

圖1示意性地示出了根據(jù)本發(fā)明的一個(gè)實(shí)施方式的第一電子設(shè) 備的編碼器的功能塊；圖2示意性地示出了根據(jù)實(shí)施方式的編碼器組件的功能塊；圖3是示出根據(jù)本發(fā)明的一個(gè)實(shí)施方式的編碼操作的流程圖；圖4示意性地示出了根據(jù)本發(fā)明的一個(gè)實(shí)施方式的第二電子設(shè) 備的解碼器的功能塊；
圖5示意性地示出了根據(jù)實(shí)施方式的解碼器組件的功能塊。
具體實(shí)施例方式
圖1是其中可以實(shí)現(xiàn)根據(jù)本發(fā)明的一個(gè)實(shí)施方式的低復(fù)雜度編碼的示例性電子設(shè)備1的圖示。
電子設(shè)備l包括編碼器2，示意性地示出了編碼器2的功能塊。編碼器2包括改進(jìn)的離散余弦變換(MDCT)單元4、定標(biāo)單元6、壓縮擴(kuò)展單元8、量化單元10、索引單元以及熵編碼單元13。
在MDCT單元4中，輸入音頻信號(hào)14經(jīng)MDCT變換到頻率域。然后，在定標(biāo)單元6中，利用各個(gè)定標(biāo)因子來定標(biāo)頻率域信號(hào)的多個(gè)頻率子帶的頻鐠分量。例如，這種定標(biāo)可以是利用第一和/或第二定標(biāo)因子的下定標(biāo)。
向壓縮擴(kuò)展單元8提供子帶的這些已定標(biāo)的頻譜分量，在所述壓縮擴(kuò)展單元8中壓縮擴(kuò)展該頻語分量。向量化單元IO提供已壓縮擴(kuò)展的頻鐠分量，其中利用第三定標(biāo)因子乘以所述已壓縮擴(kuò)展的頻譜分量，并且使用格型量化器來量化?？梢栽诹炕瘑卧狪O外部實(shí)現(xiàn) 定標(biāo)。如果使用Zn格型，則此步驟對(duì)應(yīng)于四舍五入到最接近的整數(shù) 以便獲得量化的頻譜分量。每個(gè)子帶的量化的頻譜分量可以用各個(gè) 格型向量來表示。
在索引單元12中，可以針對(duì)每個(gè)子帶通過適合的索引方法來將所獲得的整數(shù)格型向量進(jìn)行索引。
可以以硬件(HW)和/或軟件(SW)來實(shí)現(xiàn)編碼器2。關(guān)于以軟件實(shí)現(xiàn)的情況，當(dāng)在設(shè)備1的處理單元中執(zhí)行該軟件時(shí)，存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的軟件代碼實(shí)現(xiàn)所述功能。
現(xiàn)在，將參考圖2來更詳細(xì)地描述用于音頻信號(hào)的MDCT頻諳系數(shù)的非常低復(fù)雜度量化的新結(jié)構(gòu)的實(shí)施方式。示出了 MDCT單元 4、改進(jìn)的定標(biāo)單元6以及壓縮擴(kuò)展格型向量量化器單元16。壓縮擴(kuò) 展格型向量量化器單元16包括圖1的壓縮擴(kuò)展單元8、量化單元10 以及索引單元12。
丄
根據(jù)實(shí)施方式，利用標(biāo)度因子^、以及利用已定標(biāo)子帶標(biāo)準(zhǔn)差丄
的倒數(shù) ，在定標(biāo)單元6中對(duì)由MDCT單元4提供的每個(gè)子帶SBi (其中i=l至N)進(jìn)行定標(biāo)。由于僅可從訓(xùn)練集來離線估計(jì)標(biāo)準(zhǔn)差的值，所以已定標(biāo)的子帶分量的方差值可以不同于1。然而，估計(jì)越好則方差值越接近等于1。
利用第一定標(biāo)因子已經(jīng)定標(biāo)的數(shù)據(jù)的標(biāo)準(zhǔn)差的分割使得已定標(biāo) 數(shù)據(jù)具有"1"的方差。
用于標(biāo)度因子的計(jì)算的基數(shù)b是根據(jù)可用比特率，該比特率可以由用戶來設(shè)置。對(duì)于高于或者等于48kBit/s的比特率，此基數(shù)b 可以是1.45;而對(duì)于低于48kBit/s的比特率，基數(shù)b可以是2。應(yīng) 該理解，如果發(fā)現(xiàn)適合則還可以選擇其他的值。使用不同的基數(shù)值允許在不同比特率使用不同的量化分辨率。在下文中將進(jìn)一步描述針對(duì)每個(gè)子帶的標(biāo)度因子計(jì)算所使用的指數(shù){^}的確定，其中所述指數(shù)可以是從0至42的整數(shù)。
在編碼器和解碼器兩側(cè)，對(duì)于每個(gè)子帶的標(biāo)準(zhǔn)差和基數(shù)b都是已知的。根據(jù)實(shí)施方式，可以例如在訓(xùn)練集上，離線計(jì)算所使用的標(biāo)準(zhǔn)差。由此，僅使得指數(shù)"}必須可用于解碼端。
以傳統(tǒng)方式使用通過定標(biāo)結(jié)果生成的頻譜分量的概率密度函數(shù)，以便推斷產(chǎn)生壓縮擴(kuò)展函數(shù)的累積密度函數(shù)。通過示例方式，從訓(xùn)練數(shù)據(jù)集抽取累積密度函數(shù)并將其存儲(chǔ)為700個(gè)二維點(diǎn)(x, f (x))的表。"x，，是部分線性的(具有3個(gè)不同斜率)，從而使用一維點(diǎn)(僅僅f (x))可實(shí)現(xiàn)函數(shù)的存儲(chǔ)。
在壓縮擴(kuò)展格型向量量化器單元16中，使用產(chǎn)生的壓縮擴(kuò)展函數(shù)來壓縮擴(kuò)展已定標(biāo)的頻譜分量。在壓縮擴(kuò)展之后，已壓縮擴(kuò)展的200680039020.3說明書第7/12頁數(shù)據(jù)幾乎具有一致的分布并且可以使用格型量化器來有效地得以量化。為了增加量化分辨率，在量化之前，另外可以由另一第三定標(biāo) 因子來乘以已壓縮擴(kuò)展的數(shù)據(jù)，這可以是相應(yīng)子帶的標(biāo)準(zhǔn)差乘以一個(gè)因子，其中對(duì)于大于或者等于48 kbit/s的比特率，所述因子等于3，而對(duì)于小于48kbit/s的比特率，所述因子等于2.1。由此，在相同的編碼結(jié)構(gòu)中，可以通過兩個(gè)參數(shù)來改變量化分辨率，即第一定標(biāo)因子的基數(shù)b和量化之前直接應(yīng)用的乘法的第三定標(biāo)因子。例如，這允許針對(duì)不同的比特率域使用相同的編解碼器，所述不同比特率域例如在44.1 kHz的從16 kbit/s至128 kbit/s。對(duì)于已壓縮擴(kuò)展數(shù)據(jù)的量化，壓縮擴(kuò)展格型向量量化器16更適合用于針對(duì)每個(gè)頻譜子帶使用矩形截?cái)嗟腪n格型向量量化器，例如在每1024長度量化幀處。除Zn格型以外，其他格型也是適用的并且在本申請(qǐng)的范圍中。各個(gè)Zn格型的維度可以等于各個(gè)子帶中頻譜分量的數(shù)目。Zn格型包括n維空間的所有整數(shù)坐標(biāo)點(diǎn)。格型的有限截?cái)嘈纬?"碼本，，，并且可將一個(gè)點(diǎn)稱作"碼向量"。每個(gè)碼向量可以關(guān)聯(lián) 于各個(gè)索引。另一方面，可以通過整數(shù)向量來表示各個(gè)子帶的量化的頻譜分量，所述整數(shù)向量與Zn格型量化器的特定碼向量相對(duì)應(yīng)。由此，代替對(duì)每個(gè)向量分量單獨(dú)進(jìn)行編碼的是可以從格型生成單個(gè)索引并將其針對(duì)向量而發(fā)送。在截?cái)嗟母裥椭?，格型的點(diǎn)的數(shù)目是有限的。在其中包含了向量的矩形截?cái)喔裥驮试S簡(jiǎn)單的索引算法。繼而格型碼向量是來自格型截?cái)嗟狞c(diǎn)。如果截?cái)嗍蔷匦蔚模瑒t與此截?cái)嘞鄬?duì)應(yīng)的范數(shù)可以是所考慮向量的分量的最大絕對(duì)值JV(;c) = m'ax(|xj), x = (x!,…，;x:")e Z (1)壓縮擴(kuò)展格型向量量化器16的輸出包括碼向量的范數(shù)"^和格型碼向量索引" )h其中碼向量可以是從0至141的整數(shù)。索引i表示子帶并且索引j枚舉在比特率最小化算法中使用的可能的指數(shù) 值?？梢允褂帽玖炕?，因?yàn)樗隽炕轻槍?duì)音頻信號(hào)的頻譜量化、或者適用于其他類型的數(shù)據(jù)的量化。為了給出某些示例，范數(shù)^"^ }和指數(shù){& }可以是使用香農(nóng)編碼或者算術(shù)編碼在熵編碼器13中編碼的熵。由實(shí)現(xiàn)所提出的頻譜量化方法的編碼器2所輸出的比特流包括每個(gè)子帶的碼向量的索引的二進(jìn)制表示、以及熵編碼的范數(shù)和指數(shù)。如果碼向量的范數(shù)是零，則不能編碼標(biāo)度因子的指數(shù)，這是因為其不再有效?？梢匀缦掠?jì)算針對(duì)各個(gè)索引所需的比特?cái)?shù)目<formula>formula see original document page 14</formula> 其中n是量化空間的維度，即當(dāng)前子帶，以及「1'表示最接近朝向無限四舍五入自變量的整數(shù)。編碼器具有例如可以由用戶設(shè)置的可用總比特率，并且由編碼器輸出的比特流應(yīng)具有該比特率。為了確定適合的指數(shù)(& }，定標(biāo)單元6可以通過應(yīng)用優(yōu)化算法來執(zhí)行失真/比特率優(yōu)化。為此，針對(duì)具有n維的每個(gè)子帶的指數(shù)P?？梢酝ㄟ^下式來定 <formula>formula see original document page 14</formula> 其中aD是每個(gè)子帶所允許的失真?？蓮囊韵赂兄Ｊ絹慝@取允許的失真。L」表示整數(shù)部分或者最接近于自變量的較小整數(shù)。失真測(cè)量是每個(gè)子帶的量化的歐幾里德失真與針對(duì)所考慮子帶所允許的失真之間的比率。針對(duì)每個(gè)子帶SBj，選擇上至20個(gè)(作為示例，可以是不同的值)指數(shù)值用于評(píng)估。這些指數(shù)包括大于初始值的19個(gè)指數(shù)值和初始值。如果不存在大于初始值的20個(gè)指數(shù)值，則僅考慮這些可用的指數(shù)值。應(yīng)該注意，這些數(shù)目還可以是變化的，但是如果考慮更多的值，則編碼時(shí)間會(huì)增加。相反，考慮較少的值將使得編碼時(shí)間降低，這在編碼質(zhì)量方面將付出輕微的代價(jià)。
針對(duì)每個(gè)子帶和指數(shù)的每個(gè)考慮的值5針對(duì)給定的幀來應(yīng)用上述定標(biāo)、壓縮擴(kuò)展、乘法以及量化的處理。在這些情況的每個(gè)中，針對(duì)每個(gè)子帶以及每個(gè)所考慮指數(shù)來獲取已量化的向量。
為了編碼結(jié)果生成的向量，需要Rmax的比特?cái)?shù)目加上編碼向量的最大范數(shù)的比特?cái)?shù)目和編碼所考慮的指數(shù)的比特?cái)?shù)目。這三個(gè)量的總和對(duì)應(yīng)于所謂的比特率值。
率-失真測(cè)量可以是關(guān)于每個(gè)子帶所允許失真的錯(cuò)誤率。當(dāng)計(jì)算
錯(cuò)誤率時(shí)，存在兩種可能途徑一種是從其定義來計(jì)算實(shí)際錯(cuò)誤率；
而第二種是，如果所允許的失真測(cè)量大于在所考慮子帶中的信號(hào)能量，則將錯(cuò)誤率設(shè)置為零。第一種途徑可以認(rèn)為是"定義"，而第二種途徑可認(rèn)為是"改進(jìn)的定義"。
由此，針對(duì)每個(gè)子帶和每個(gè)考慮的指數(shù)，可以獲得比特率與錯(cuò)
誤率的各個(gè)配對(duì)。此配對(duì)還稱作率-失真測(cè)量。
對(duì)于每個(gè)子帶，排序率-失真測(cè)量使得比特率是增加的。通常，隨著比特率的增加，失真將降低。如果不滿足此規(guī)律，則排除具有較高比特率的失真測(cè)量。這就是不是所有子帶都具有相同數(shù)目的率-失真測(cè)量的原因。
優(yōu)化算法具有兩種類型的初始化
1. 由與最低錯(cuò)誤率相對(duì)應(yīng)的率-失真測(cè)量開始，該最低錯(cuò)誤率等效于最高比特率，或者
2. 由與針對(duì)所有子帶的小于1.0的錯(cuò)誤率相對(duì)應(yīng)的率-失真測(cè)量開始。
優(yōu)化算法的目標(biāo)在于針對(duì)當(dāng)前幀的每個(gè)子帶，從所考慮指數(shù)值中選擇指數(shù)值，使得所選擇的率-失真測(cè)量的累積比特率小于或者等于針對(duì)幀的可用比特率，并且整體錯(cuò)誤率盡可能地小。用于此優(yōu)化的標(biāo)準(zhǔn)應(yīng)該為最小的4晉誤率，而比特率應(yīng)該在由比特池才幾制所給出的可用比特?cái)?shù)目以內(nèi)，例如在AAC中那樣。
根據(jù)示例性的優(yōu)化算法，率-失真測(cè)量按照沿子帶i (其中i=l: N)增加的比特率的值而從1至Ri, Ni地排序，并且結(jié)果是降低的錯(cuò) 誤率，Dj，j (其中i=l:N, j = l:Ni)。由具有最小失真的率-失真測(cè)
量來初始該算法。初始比特率是"=^《，。為了選擇具有索引k的最佳率-失真測(cè)量，可以應(yīng)用如下偽代碼
<formula>formula see original document page 16</formula>索引k(i)(其中i=l:N)指向率-失真測(cè)量，而且還指向應(yīng)該針對(duì)每個(gè)子帶所選擇的指數(shù)值，該值可以用于生成率-失真測(cè)量。對(duì)于高的比特率，例如，>48kbit/s，可以在第5行將算法修改
為<formula>formula see original document page 16</formula>
使得如果通過降低其比特率，將所有系數(shù)設(shè)置為零，則在最大化過程不考慮子帶i，并且用于該子帶的比特率變?yōu)?。
如果總比特率過高，則應(yīng)降低一些，由此某些子帶將具有較小比特率。如果僅可應(yīng)用于一個(gè)子帶的率-失真測(cè)量是一個(gè)具有等于1 的比特率的率-失真測(cè)量，其中相應(yīng)于被設(shè)置為零的子帶中的所有系數(shù)，1是針對(duì)子帶比特率的最小可能值，則在該子帶中，不能進(jìn)一步降低比特率。這是測(cè)試k (i)是否大于1的原因。對(duì)于每個(gè)符合條件的子帶，計(jì)算對(duì)應(yīng)于一個(gè)配對(duì)向左側(cè)前進(jìn)的梯度，并且選擇具有最低增加的失真并且具有最大降低的比特率的配對(duì)。然后，檢查結(jié) 果生成的總比特率，等等。圖3是概括上述編碼的流程圖。首先，對(duì)接收到的音頻信號(hào)進(jìn)行變換，并將其劃分為多個(gè)子帶 SBi,其中i=l至N (步驟101 )。然后，針對(duì)每個(gè)子帶，基于在此子帶中所允許的失真來確定指數(shù)Si的初始值(步驟102)。如上所述，使用所確定的Sj的初始值，通過第一和/或第二定標(biāo)因子將子帶分量進(jìn)行分割(步驟103),其中定標(biāo)因子可以是標(biāo)準(zhǔn)差o'和^ ，進(jìn)行壓縮擴(kuò)展(步驟104)，進(jìn) 一步利用第三定標(biāo)因子進(jìn)行定標(biāo)(步驟105),以及進(jìn)行量化(步驟 106)。針對(duì)Si的多達(dá)19個(gè)的其他值來重復(fù)相同操作，只要該值沒有超過42，則在每次重復(fù)中將Sj遞增l(步驟107、步驟103至106)。對(duì)于每個(gè)所使用的Si值，確定結(jié)果生成的比特率和結(jié)果生成的失真 (步驟108)。然后，根據(jù)增加的相關(guān)聯(lián)的比特率來Si值進(jìn)行排序(步驟109)。丟棄導(dǎo)致比各個(gè)先前Si值更高失真的那些Si值。接著，共同估計(jì)針對(duì)所有子帶的排序的Sj值。更具體地，針對(duì) 每個(gè)子帶選擇一個(gè)Si值，從而針對(duì)所有子帶的Si值的集合(sJ導(dǎo)致盡可能地靠近所允許的總比特率的總比特率，并且同時(shí)將整體失真最小化(步驟110)。最后，針對(duì)每個(gè)子帶SBi,對(duì)具有所選擇Si值的在步驟106的量化中產(chǎn)生的碼向量進(jìn)行索引，以及對(duì)在此量化中使用的范數(shù)和所選擇的Sj值進(jìn)行熵編碼(步驟111 )。圖4是其中可以實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施方式的低復(fù)雜度解碼的示例性電子設(shè)備17的圖示。電子設(shè)備1和17可以一起形成根據(jù)本發(fā)明的系統(tǒng)的示例性實(shí)施方式。電子設(shè)備17包括解碼器18，示意性地示出了其中的功能塊。解碼器18包括熵解碼器21、逆索引單元22、解壓縮擴(kuò)展單元24、逆定標(biāo)單元26以及逆MDCT單元28。在解碼器18中接收已編碼的比特流20。首先，通過熵解碼單元 21來抽取定標(biāo)因子的范數(shù)和指數(shù)。在熵解碼單元21和逆索引單元 22之間存在連接器。將已解碼的范數(shù)從熵解碼單元21饋送至逆索引單元22,從而通知該索引表示多少比特。從二進(jìn)制字讀取碼向量索引，并將其饋送至逆索引單元22,其中所述二進(jìn)制字具有根據(jù)公式 (2)由已解碼范數(shù)給出的長度。然后，在逆索引單元22中取回碼向量。在解壓縮擴(kuò)展單元24 中使用碼向量的分量，以便獲得已解壓縮擴(kuò)展的值的集合。在逆定標(biāo)單元26中通過逆定標(biāo)因子來定標(biāo)這些值。在逆MDCT單元28中使用已定標(biāo)的值以獲取期望的音頻信號(hào)。解碼器18可以以硬件(HW)和/或軟件(SW)來實(shí)現(xiàn)。如果以軟件來實(shí)現(xiàn)，則當(dāng)在設(shè)備17的處理單元中執(zhí)行時(shí)，存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的軟件代碼實(shí)現(xiàn)所描述的功能。圖5示出了根據(jù)實(shí)施方式的解碼器18的所選擇組件。這些組件包括逆索引單元22、定標(biāo)單元33 (在圖3中未示出)、解壓縮擴(kuò)展單元24以及改進(jìn)的逆定標(biāo)單元26。已編碼的比特流20包括針對(duì)每個(gè)子帶SBj的碼向量索引t對(duì)"h針對(duì)每個(gè)子帶SBi的已編碼范數(shù)仏"H以及針對(duì)每個(gè)子帶SBi的已編碼指數(shù)(Si〉。逆索引單元22利用從熵解碼單元21接收的碼向量索引WW以及已解碼范數(shù)仏"W,來取回每個(gè)子帶的已壓縮擴(kuò)展的頻譜分量。這些已壓縮擴(kuò)展的頻譜分量在定標(biāo)單元33中通過因子來分割，在編碼器2中使用所述因子來乘以已壓縮擴(kuò)展的數(shù)據(jù)，即2'15^'或者" 。在解壓縮擴(kuò)展單元24中對(duì)結(jié)果生成的數(shù)據(jù)進(jìn)行解壓縮擴(kuò)展。使用從熵解碼單元21接收的已解碼指數(shù)(Sj),隨已知的基數(shù)b 一起生成針對(duì)各個(gè)子帶的逆標(biāo)度因子。在逆定標(biāo)單元26中，針對(duì)各個(gè)子帶，使用針對(duì)各個(gè)子帶的逆標(biāo)度因子和已知的標(biāo)準(zhǔn)差a,'來重新定標(biāo)由解壓縮擴(kuò)展單元24輸出的頻譜分量。應(yīng)該注意，所述實(shí)施方式可以以許多方式變化。
權(quán)利要求
1.一種用于音頻編碼的方法，該方法包括-接收輸入音頻信號(hào)，-將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶，-利用第一因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo)，-對(duì)所述至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展，以及-對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
2. 根據(jù)權(quán)利要求1所述的方法，其中所述第一因子依賴于以下項(xiàng)中至少一個(gè)A) 針對(duì)已編碼數(shù)據(jù)流可用的總比特率，B) 針對(duì)每個(gè)子帶可用的比特率，以及C) 各個(gè)子帶的特性。
3. 根據(jù)權(quán)利要求1所述的方法，其中所述定標(biāo)進(jìn)一步包括利用第二因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo)，所述第二因子至少取決于所述各個(gè)已定標(biāo)子帶的標(biāo)準(zhǔn)差。
4. 根據(jù)權(quán)利要求1所述的方法，其中量化包括使用格型量化器進(jìn)行量化。
5. 根據(jù)權(quán)利要求1所述的方法，其中所述第一因子包括基數(shù)和指數(shù)，以及其中針對(duì)整體較高比特率將針對(duì)各個(gè)子帶的所述基數(shù)設(shè) 置為較低值，并且針對(duì)整體較低比特率將針對(duì)各個(gè)子帶的所述基數(shù) 設(shè)置為較高值。
6. 根據(jù)權(quán)利要求1所述的方法，其中所述第一因子包括基數(shù)和指數(shù)，以及其中針對(duì)每個(gè)子帶確定所述指數(shù)，使得所述已編碼音頻信號(hào)的所述總比特率盡可能地接近于可用比特率，以及所有子帶中的整體錯(cuò)誤率被最小化。
7. 根據(jù)權(quán)利要求1所述的方法，其中所述第一因子包括基數(shù)和指數(shù)，以及其中至少從率-失真測(cè)量來確定所述指數(shù)。
8. 根據(jù)權(quán)利要求6所述的方法，進(jìn)一步包括選擇以下值作為針對(duì)每個(gè)子帶的最優(yōu)化的最小的所考慮的指數(shù)值其中aD是每個(gè)子帶允許的失真，其從感知編碼模式得出，并且 U表示整數(shù)部分、或者最接近于自變量的較小整數(shù)。
9. 根據(jù)權(quán)利要求7所述的方法，其中對(duì)針對(duì)每個(gè)子帶的所述率-失真測(cè)量進(jìn)行排序使得比特率增加。
10. 根據(jù)權(quán)利要求7所述的方法，進(jìn)一步包括通過以下之一來初始化一個(gè)搜索用于導(dǎo)致優(yōu)化的指數(shù)的率-失真測(cè)量A) 由與所述最低錯(cuò)誤率相對(duì)應(yīng)的所述率-失真測(cè)量開始，所述最低錯(cuò)誤率等效于最高比特率，或者B) 由與針對(duì)所有子帶小于1.0的錯(cuò)誤率相對(duì)應(yīng)的所述率-失真測(cè) 量開始。
11. 根據(jù)權(quán)利要求7所述的方法，其中所述率-失真測(cè)量是關(guān)于每個(gè)子帶所允許的失真的錯(cuò)誤率，所述錯(cuò)誤率通過以下的至少一個(gè) 來計(jì)算A) 從錯(cuò)誤率定義計(jì)算實(shí)際錯(cuò)誤率，或者B) 如果所述允許的失真測(cè)量大于在所述考慮的子帶中的所述信號(hào)的能量，則將所述錯(cuò)誤率設(shè)置為零。
12. 根據(jù)權(quán)利要求1所述的方法，進(jìn)一步包括使用熵編碼對(duì)所述第一因子的至少一個(gè)分量進(jìn)行編碼。
13. 根據(jù)權(quán)利要求1所述的方法，進(jìn)一步包括利用所述已定標(biāo)子帶的所述概率函數(shù)，用于創(chuàng)建用于壓縮擴(kuò)展的累積密度函數(shù)。
14. 根據(jù)權(quán)利要求1所述的方法，進(jìn)一步包括，在利用第三定標(biāo) 因子量化之前對(duì)所述已壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)，其中所述第三定標(biāo)因子針對(duì)較高比特率比針對(duì)較低比特率較高。
15. 根據(jù)權(quán)利要求1所述的方法，使用矩形截?cái)嗟母裥陀糜趯?duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化，所述量化導(dǎo)致用于每個(gè) 子帶的碼向量。
16. 根據(jù)權(quán)利要求15所述的方法，進(jìn)一步包括針對(duì)每個(gè)子帶計(jì)算用于包括所迷已量化子帶的格型截?cái)嗟姆稊?shù)，使用熵編碼對(duì)針對(duì) 每個(gè)子帶所計(jì)算的范數(shù)進(jìn)行編碼，以及通過索引對(duì)所述碼向量進(jìn)行編碼。
17. —種編碼器，包括-變換單元，適用于接收輸入音頻信號(hào)以及將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶；-定標(biāo)單元，適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo)； -壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展；以及-量化單元，適用于對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
18. —種電子設(shè)備，包括-變換單元，適用于接收輸入音頻信號(hào)以及將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶；-定標(biāo)單元，適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo)； -壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展；以及-量化單元，適用于對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
19. 一種軟件程序產(chǎn)品，其中存儲(chǔ)了用于音頻編碼的軟件代碼，當(dāng)由電子設(shè)備的處理單元執(zhí)行時(shí)，所述軟件代碼實(shí)現(xiàn)以下步驟-接收輸入音頻信號(hào)；-將所述輸入音頻信號(hào)劃分為至少兩個(gè)子帶；-利用第一因子對(duì)所述至少兩個(gè)子帶進(jìn)行定標(biāo)；-對(duì)所述至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展；以及-對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
20. —種用于音頻解碼的方法，該方法包括 -接收已編碼的音頻數(shù)據(jù)，-從所述已編碼的音頻數(shù)據(jù)生成至少兩個(gè)已壓縮擴(kuò)展的子帶；-對(duì)每個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展，-利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)，以及-將所述已解壓縮擴(kuò)展的和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。
21. —種解碼器，包括-解壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展，其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼音頻數(shù) 據(jù)生成的；-定標(biāo)單元，適用于利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)；以及-變換單元，適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。
22. —種電子設(shè)備，包括-解壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展，其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼音頻數(shù) 據(jù)生成的；-定標(biāo)單元，適用于利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)；以及-變換單元，適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。
23. —種軟件程序產(chǎn)品，其中存儲(chǔ)有用于音頻解碼的軟件代碼，當(dāng)由電子設(shè)備的處理單元執(zhí)行時(shí)，所述軟件代碼實(shí)現(xiàn)以下步驟-接收已編碼的音頻數(shù)據(jù)，-從所述已編碼的音頻數(shù)據(jù)生成至少兩個(gè)已壓縮擴(kuò)展的子帶， -對(duì)每個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展， -利用第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)，以及-將所述已解壓縮擴(kuò)展的和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。
24. —種包括用于對(duì)音頻數(shù)據(jù)進(jìn)行編碼的編碼器以及用于對(duì)已編碼音頻數(shù)據(jù)進(jìn)行解碼的解碼器的系統(tǒng)，所述編碼器包括-變換單元，適用于接收輸入音頻信號(hào)以及將所述輸入音頻信號(hào) 劃分為至少兩個(gè)子帶；-定標(biāo)單元，適用于利用第一因子對(duì)至少兩個(gè)子帶進(jìn)行定標(biāo)；-壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展；以及-量化單元，適用于對(duì)已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化；并且所述解碼器包括-解壓縮擴(kuò)展單元，適用于對(duì)至少兩個(gè)已壓縮擴(kuò)展的子帶進(jìn)行解壓縮擴(kuò)展，其中所述已壓縮擴(kuò)展的子帶是從所接收的已編碼音頻數(shù) 據(jù)生成的；隱定標(biāo)單元，適用于利用所述第一因子對(duì)所述至少兩個(gè)已解壓縮擴(kuò)展的子帶進(jìn)行定標(biāo)；以及-變換單元，適用于將所述已解壓縮擴(kuò)展和已定標(biāo)的子帶結(jié)合到已解碼的音頻信號(hào)。
全文摘要
音頻編碼，通過以下步驟進(jìn)行接收輸入音頻信號(hào)；將輸入音頻信號(hào)劃分為至少兩個(gè)子帶；利用至少根據(jù)相應(yīng)子帶的標(biāo)準(zhǔn)差的因子來對(duì)所述至少兩個(gè)子帶進(jìn)行下定標(biāo)；對(duì)所述至少兩個(gè)已下定標(biāo)的子帶的每個(gè)進(jìn)行壓縮擴(kuò)展；以及利用格型量化器對(duì)所述已壓縮擴(kuò)展的、已定標(biāo)的子帶進(jìn)行量化。
文檔編號(hào)G10L19/00GK101292286SQ200680039020
公開日2008年10月22日申請(qǐng)日期2006年10月9日優(yōu)先權(quán)日2005年10月21日
發(fā)明者A·瓦西拉切申請(qǐng)人:諾基亞公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：A.瓦西拉切
技術(shù)所有人：諾基亞公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻編碼的分類相關(guān)技術(shù)

音頻采集器相關(guān)技術(shù)

音頻編碼器相關(guān)技術(shù)

flash音頻編碼相關(guān)技術(shù)

mp3編碼相關(guān)技術(shù)

音頻編碼標(biāo)準(zhǔn)相關(guān)技術(shù)

pcm音頻編碼相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻編碼的制作方法