本發(fā)明涉及音頻信號(hào)處理,更具體地,涉及音頻數(shù)據(jù)位流編碼和解碼以便實(shí)現(xiàn)輸出音頻信號(hào)的期望響度水平。
背景技術(shù):
1、dolby?ac-4是用于高效率地分布富媒體內(nèi)容的音頻格式。ac-4為廣播公司和內(nèi)容制作商提供了以高效率的方式分布和編碼內(nèi)容的靈活框架。內(nèi)容可以分布在若干個(gè)子流上,例如m&e(音樂(lè)和效果)在一個(gè)子流中,對(duì)話在第二子流中。對(duì)于一些音頻內(nèi)容,可能有利的是,例如,將對(duì)話的語(yǔ)言從一種語(yǔ)言切換到另一種語(yǔ)言,或者能夠?qū)⒗缭u(píng)論子流添加到內(nèi)容或包括為了視力障礙者而進(jìn)行的描述的附加子流。
2、為了確保呈現(xiàn)給消費(fèi)者的內(nèi)容的適當(dāng)調(diào)平(leveling),對(duì)內(nèi)容的響度需要有一定精確度的了解。當(dāng)前響度要求具有2db(atsc?a/85)、0.5db(ebu?r128)的容限,而一些規(guī)范具有低達(dá)0.1db的容限。這意味著,具有評(píng)論音軌并且具有使用第一語(yǔ)言的對(duì)話的輸出音頻信號(hào)的響度應(yīng)與不具有評(píng)論音軌、但具有使用第二語(yǔ)言的對(duì)話的輸出音頻信號(hào)的響度基本上相同。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種對(duì)包括多個(gè)內(nèi)容子流的位流進(jìn)行處理的方法,每個(gè)內(nèi)容子流表示音頻信號(hào),該方法包括:從位流提取一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu),每個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)包括對(duì)于所述內(nèi)容子流中的至少一個(gè)的引用,每個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)還包括對(duì)于元數(shù)據(jù)子流的引用,該元數(shù)據(jù)子流表示描述所引用的一個(gè)或多個(gè)內(nèi)容子流的組合的響度數(shù)據(jù);接收指示所述一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)中的選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)和期望響度水平的數(shù)據(jù);對(duì)選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的一個(gè)或多個(gè)內(nèi)容子流進(jìn)行解碼;并且基于解碼的內(nèi)容子流形成輸出音頻信號(hào),該方法還包括基于選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的響度數(shù)據(jù)來(lái)對(duì)解碼的一個(gè)或多個(gè)內(nèi)容子流或輸出音頻信號(hào)進(jìn)行處理以達(dá)到所述期望響度水平。
2、本發(fā)明還提供了一種用于對(duì)包括多個(gè)內(nèi)容子流的位流進(jìn)行處理的解碼器,每個(gè)內(nèi)容子流表示音頻信號(hào),該解碼器包括:接收部件,其被配置為接收位流;解復(fù)用器,其被配置為從位流提取一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu),每個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)包括對(duì)所述內(nèi)容子流中的至少一個(gè)的引用,并且還包括對(duì)元數(shù)據(jù)子流的引用,該元數(shù)據(jù)子流表示描述所引用的一個(gè)或多個(gè)內(nèi)容子流的組合的響度數(shù)據(jù);回放狀態(tài)部件,其被配置為接收指示在一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)之中的選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)以及期望響度水平的數(shù)據(jù);以及混合部件,其被配置為對(duì)選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的一個(gè)或多個(gè)內(nèi)容子流進(jìn)行解碼,并且基于解碼的內(nèi)容子流形成輸出音頻信號(hào),其中,混合部件還被配置為基于選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的響度數(shù)據(jù)來(lái)對(duì)解碼的一個(gè)或多個(gè)內(nèi)容子流或輸出音頻信號(hào)進(jìn)行處理以達(dá)到所述期望響度水平。
3、本發(fā)明還提供了一種音頻編碼方法,包括:接收表示相應(yīng)音頻信號(hào)的多個(gè)內(nèi)容子流;定義一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu),每個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)引用所述多個(gè)內(nèi)容子流中的至少一個(gè);對(duì)于一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)中的每個(gè),應(yīng)用預(yù)定義響度函數(shù)來(lái)獲得描述所引用的一個(gè)或多個(gè)內(nèi)容子流的組合的響度數(shù)據(jù),并且包括對(duì)來(lái)自呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)的響度數(shù)據(jù)的引用;并且形成位流,該位流包括所述多個(gè)內(nèi)容子流、所述一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)以及呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的響度數(shù)據(jù)。
4、本發(fā)明還提供了一種音頻編碼器,包括:響度部件,其被配置為應(yīng)用預(yù)定義響度函數(shù)來(lái)獲得響度數(shù)據(jù),該響度數(shù)據(jù)描述表示相應(yīng)音頻信號(hào)的一個(gè)或多個(gè)內(nèi)容子流的組合;呈現(xiàn)數(shù)據(jù)部件,其被配置為定義一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu),每個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)包括對(duì)多個(gè)內(nèi)容子流之中的一個(gè)或多個(gè)內(nèi)容子流的引用以及對(duì)描述所引用的內(nèi)容子流的組合的響度數(shù)據(jù)的引用;以及復(fù)用部件,其被配置為形成位流,該位流包括所述多個(gè)內(nèi)容子流、所述一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)以及呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的響度數(shù)據(jù)。
1.一種對(duì)包括多個(gè)內(nèi)容子流(412)的位流(p)進(jìn)行處理的方法,每個(gè)內(nèi)容子流表示音頻信號(hào),所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)還引用要應(yīng)用于所述多個(gè)內(nèi)容子流的至少兩個(gè)混合系數(shù),
3.根據(jù)權(quán)利要求2所述的方法,其中,所述位流包括多個(gè)時(shí)間幀,并且其中,所述選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)所引用的混合系數(shù)能夠獨(dú)立地分配給每個(gè)時(shí)間幀;和/或
4.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,其中,所述位流包括多個(gè)時(shí)間幀,并且其中,指示所述一個(gè)或多個(gè)呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)當(dāng)中的所述選擇的呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)能夠獨(dú)立地分配給每個(gè)時(shí)間幀。
5.根據(jù)權(quán)利要求4所述的方法,還包括:
6.一種用于對(duì)包括多個(gè)內(nèi)容子流(412)的位流(p)進(jìn)行處理的解碼器,每個(gè)內(nèi)容子流表示音頻信號(hào),所述解碼器包括被配置為執(zhí)行根據(jù)權(quán)利要求1-5中的任一項(xiàng)所述的方法的一個(gè)或多個(gè)部件。
7.一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括指令,所述指令在由計(jì)算設(shè)備或系統(tǒng)執(zhí)行時(shí)執(zhí)行根據(jù)權(quán)利要求1-5中的任一項(xiàng)所述的方法。
8.一種方法,包括:
9.一種解碼裝置,包括: