專利名稱:生成等級(jí)參數(shù)的設(shè)備和方法及生成多通道表示的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用空間參數(shù)對(duì)音頻信號(hào)多通道表示進(jìn)行編碼。本發(fā)明公開了用于根據(jù)少于輸出通道數(shù)的多個(gè)通道來估計(jì)和定義用來重建多通道信號(hào)的新方法。具體地講,本發(fā)明旨在最小化多通道表示的比特率,并提供多通道信號(hào)的編碼表示,使得能夠?qū)λ锌赡艿耐ǖ琅渲萌菀椎鼐幋a和解碼數(shù)據(jù)。
背景技術(shù):
在PCT/SE02/01372“Efficient and scalable Parametric Stereo codingfor Low Bit rate Audio Coding Applications”中已經(jīng)表明,可以根據(jù)給出立體聲像的非常緊湊表示的單聲道信號(hào),來重建逼近原始立體聲像的立體聲像。基本原理是將輸入信號(hào)劃分為頻帶和時(shí)間段,估計(jì)通道間強(qiáng)度差(IID)和通道間相干性(ICC)。第一參數(shù)是特定頻帶中兩個(gè)通道之間功率分布的測(cè)量,第二參數(shù)是特定頻帶中兩個(gè)通道之間相關(guān)性的估計(jì)。在解碼器一側(cè),通過根據(jù)IID數(shù)據(jù)在兩個(gè)輸出通道之間分配單聲道信號(hào),并且添加去相關(guān)信號(hào)以保留原始立體聲通道的通道相關(guān)性,來根據(jù)單聲道信號(hào)重建立體聲像。
對(duì)于多通道(在此環(huán)境中,多通道意味著多于兩個(gè)輸出通道)的情況,必須考慮幾個(gè)其他問題。存在數(shù)種多通道配置。最常見的是5.1配置(中央通道、正面左/右通道、環(huán)繞左/右通道、和LFE通道)。然而,還存在許多其他配置。根據(jù)完整的編碼器/解碼器系統(tǒng)的觀點(diǎn),希望系統(tǒng)對(duì)所有通道配置可以使用相同的參數(shù)集(例如,IID和ICC)或其子集。ITU-R BS.775定義了數(shù)種下混方案,能夠根據(jù)給定的通道配置獲得包括較少通道的通道配置。而不是總是要對(duì)所有通道解碼和依賴下混,可能希望具有一種多通道表示,使得接收機(jī)能夠在解碼通道之前立即提取通道配置有關(guān)的參數(shù)。另外,根據(jù)可擴(kuò)展或嵌入式編碼的觀點(diǎn),希望固有地可擴(kuò)展的參數(shù)集,其中,例如可以在位流中的增強(qiáng)層中存儲(chǔ)與環(huán)繞通道相對(duì)應(yīng)的數(shù)據(jù)。
與上面不同,還可能希望能夠根據(jù)所處理的信號(hào)特性使用不同的參數(shù)定義,以便在參數(shù)化之間切換,這導(dǎo)致針對(duì)當(dāng)前所處理信號(hào)段的最小比特率開銷。
在本領(lǐng)域中,已知另一種使用和信號(hào)或下混信號(hào)以及額外參數(shù)側(cè)面信息的多通道信號(hào)表示,稱作雙耳提示編碼(binaural cue coding,BCC)。在“Binaural Cue Coding-Part 1Psycho-Acoustic Fundamentalsand Design Principles”,IEEE Transactions on Speech and AudioProcessing,vol.11,No.6,November 2003,F(xiàn).Baumgarte,C.Faller和“Binaural Cue Coding.Part 2Schemes and Applications”,IEEETransactions on Speech and Audio Processing,vol.11,No.6,November2003,C.Faller&F.Baumgarte中描述了這種技術(shù)。
一般而言,雙耳提示編碼是一種根據(jù)一個(gè)下混音頻通道和側(cè)面信息進(jìn)行多通道空間呈現(xiàn)的方法。BCC編碼器要計(jì)算的且BCC解碼器用于音頻重構(gòu)或音頻呈現(xiàn)的數(shù)個(gè)參數(shù)包括通道間等級(jí)差、通道間時(shí)間差和通道間相干性參數(shù)。這些通道間提示是對(duì)空間像的感覺的確定因素。這些參數(shù)是針對(duì)原始多通道信號(hào)的時(shí)間樣本塊所給出的,并且還是頻率選擇性的,從而每個(gè)多通道信號(hào)樣本塊具有針對(duì)數(shù)個(gè)頻帶的數(shù)個(gè)提示。在一般的C播放通道情況下,在每個(gè)子帶中考慮通道對(duì),即,每個(gè)通道相對(duì)于參考通道之間的通道間等級(jí)差和通道間時(shí)間差。對(duì)于每個(gè)通道間等級(jí)差,將一個(gè)通道定義為參考通道。利用通道間等級(jí)差和通道間時(shí)間差,可以向所使用的播放設(shè)置的揚(yáng)聲器對(duì)中一對(duì)之間的任意方向呈現(xiàn)源。為了確定所呈現(xiàn)的源的寬度或擴(kuò)散,對(duì)于所有音頻通道,每個(gè)子帶考慮一個(gè)參數(shù)就足夠了。該參數(shù)是通道間相干性參數(shù)。通過修改子帶信號(hào)使所有可能的通道對(duì)具有相同的通道間相干性參數(shù),來控制所呈現(xiàn)的源的寬度。
在BCC編碼中,確定參考通道1和任何其他通道之間的所有通道間等級(jí)差。例如,當(dāng)確定中央通道為參考通道時(shí),計(jì)算左通道和中央通道之間的第一通道間等級(jí)差、右通道和中央通道之間的第二通道間等級(jí)差、左環(huán)繞通道和中央通道之間的第三通道間等級(jí)差、和右環(huán)繞通道和中央通道之間的第四通道間等級(jí)差。這種情況描述了五通道方案。當(dāng)五通道方案另外包括低頻增強(qiáng)通道(也稱作“重低音”通道)時(shí),計(jì)算低頻增強(qiáng)通道和作為信號(hào)參考通道的中央通道之間的第五通道間等級(jí)差。
當(dāng)使用信號(hào)下混通道(也稱作“單聲道”通道)和諸如ICLD(通道間等級(jí)差)、ICTD(通道間時(shí)間差)和ICC(通道間相干性)之類所傳送的提示重構(gòu)原始多通道時(shí),使用這些提示修改單聲道信號(hào)的頻譜系數(shù)。使用正實(shí)數(shù)執(zhí)行等級(jí)修改,其中正實(shí)數(shù)確定每個(gè)頻譜系數(shù)的等級(jí)修改。使用復(fù)數(shù)生成通道間時(shí)間差,其中復(fù)數(shù)的大小確定每個(gè)頻譜系數(shù)的相位修改。另一函數(shù)確定相干性影響。通過首先計(jì)算參考通道的因子,來計(jì)算每個(gè)通道的等級(jí)修改的因子。計(jì)算參考通道的因子,使得對(duì)每個(gè)頻率分區(qū),所有通道的功率之和與和信號(hào)的功率相同。然后,根據(jù)參考通道的等級(jí)修改因子,使用各自的ICLD參數(shù),計(jì)算其他通道的等級(jí)修改因子。
于是,為了執(zhí)行BCC合成,要計(jì)算參考通道的等級(jí)修改因子。為了該計(jì)算,一個(gè)頻帶的所有ICLD參數(shù)都是必須的。然后,根據(jù)該信號(hào)通道的此等級(jí)修改,可以計(jì)算非參考通道的其他通道的等級(jí)修改因子。
這種方法的缺點(diǎn)在于,為了完美的重構(gòu),需要每一個(gè)通道間等級(jí)差。當(dāng)存在易出錯(cuò)的傳輸通道時(shí),這種要求甚至更成問題。所傳輸?shù)耐ǖ篱g等級(jí)差之中的每個(gè)錯(cuò)誤將導(dǎo)致重構(gòu)多通道信號(hào)中的錯(cuò)誤,因?yàn)樾枰妹總€(gè)通道間等級(jí)差來計(jì)算多通道輸出信號(hào)中的每一個(gè)。另外,當(dāng)在傳輸期間丟失了通道間等級(jí)差時(shí),不能進(jìn)行重構(gòu),盡管這種通道間等級(jí)差例如僅僅對(duì)于左環(huán)繞通道或右環(huán)繞通道是必要的,但這些通道對(duì)于多通道重構(gòu)沒有那么重要,因?yàn)榇蟛糠中畔ㄔ谡孀笸ǖ?后文稱作左通道)、正面右通道(后文稱作右通道)或中央通道中。當(dāng)在傳輸期間丟失了低頻增強(qiáng)通道的通道間等級(jí)差時(shí),情況變得更惡劣。在這種情況下,不可能進(jìn)行多通道重構(gòu),或者只可能進(jìn)行錯(cuò)誤的多通道重構(gòu),盡管低頻增強(qiáng)通道對(duì)于聽眾的收聽舒適性不是決定性的。于是,單個(gè)通道間等級(jí)差中的錯(cuò)誤蔓延為每個(gè)重構(gòu)輸出通道內(nèi)的錯(cuò)誤。
參數(shù)多通道表示的問題在于,通常,給出通道間等級(jí)差,例如,BCC編碼中的ICLD,或者其他參數(shù)多通道表示中的平衡值,作為相對(duì)值,而不是絕對(duì)值。在BCC中,ICLD參數(shù)描述通道和參考通道之間的等級(jí)差。也可以給出平衡值,作為通道對(duì)中兩個(gè)通道之間的比例。當(dāng)重構(gòu)多通道信號(hào)時(shí),將這種等級(jí)差或平衡參數(shù)應(yīng)用于基礎(chǔ)通道,可以是單聲道基礎(chǔ)通道或具有兩個(gè)基礎(chǔ)通道的立體聲基礎(chǔ)通道信號(hào)。于是,例如在五或六個(gè)重構(gòu)輸出通道之間分配至少一個(gè)基礎(chǔ)通道中所包括的能量。于是,重構(gòu)輸出通道中的絕對(duì)能量由通道間等級(jí)差或平衡參數(shù)以及接收機(jī)輸入處的下混信號(hào)能量確定。
當(dāng)接收機(jī)輸入處的下混信號(hào)能量相對(duì)于編碼器輸出的下混信號(hào)變化時(shí),將出現(xiàn)等級(jí)改變。在這種情況下,要強(qiáng)調(diào)的是,取決于所使用的參數(shù)化方案,當(dāng)參數(shù)是頻率選擇性的時(shí),這種等級(jí)變化不僅會(huì)導(dǎo)致重構(gòu)信號(hào)的一般音量變化,而且還會(huì)導(dǎo)致嚴(yán)重的假象。因?yàn)檩敵鐾ǖ涝谠撎囟l帶中的頻率分量具有太低或太高的等級(jí),例如,當(dāng)對(duì)下混信號(hào)的特定頻帶的操作多于頻率刻度上別處的頻帶時(shí),這種操作在重構(gòu)輸出信號(hào)中容易顯現(xiàn)。
另外,時(shí)變等級(jí)操作也會(huì)導(dǎo)致重構(gòu)輸出信號(hào)的整體等級(jí)隨時(shí)間變化,因此感覺到討厭的假象。
雖然上面的情況集中在編碼、傳輸和解碼下混信號(hào)所導(dǎo)致的等級(jí)操作,但也可能出現(xiàn)其他等級(jí)偏差。由于被下混為一個(gè)或兩個(gè)通道的不同通道之間的相位依賴性,可能出現(xiàn)這樣的情況單聲道信號(hào)具有的能量不等于原始信號(hào)的能量和。因?yàn)橥ǔT跇颖痉矫?sample-wise),即通過添加時(shí)間波形,執(zhí)行下混,所以左信號(hào)和右信號(hào)之間例如180度的相位差將導(dǎo)致下混信號(hào)中兩個(gè)通道的完全抵消,這將導(dǎo)致零能量,盡管兩個(gè)信號(hào)肯定都具有一定的信號(hào)能量。雖然在通常情況下這種極端情況不太可能發(fā)生,但是仍將出現(xiàn)能量變化,因?yàn)樗行盘?hào)當(dāng)然并非完全不相關(guān)。這種變化也可以導(dǎo)致重構(gòu)輸出信號(hào)的音量波動(dòng),并且還將導(dǎo)致假象,因?yàn)橹貥?gòu)輸出信號(hào)的能量將不同于原始多通道信號(hào)的能量。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種參數(shù)化概念,這導(dǎo)致具有改進(jìn)輸出質(zhì)量的多通道重構(gòu)。
該目的通過根據(jù)權(quán)利要求1所述的用于生成等級(jí)參數(shù)的設(shè)備、根據(jù)權(quán)利要求7所述的用于生成重構(gòu)多通道表示的設(shè)備、根據(jù)權(quán)利要求9所述的用于生成等級(jí)參數(shù)的方法、根據(jù)權(quán)利要求10所述的用于生成重構(gòu)多通道表示的方法、根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序或者根據(jù)權(quán)利要求12所述的參數(shù)表示來實(shí)現(xiàn)。
本發(fā)明基于如下發(fā)現(xiàn)為了高質(zhì)量重構(gòu),以及由于靈活的編碼/傳輸和解碼方案,與下混信號(hào)或多通道信號(hào)的參數(shù)表示一起發(fā)送額外的等級(jí)參數(shù),從而多通道重構(gòu)器可以使用該等級(jí)參數(shù)和等級(jí)差參數(shù)以及下混信號(hào)一起來重新生成多通道輸出信號(hào),該輸出信號(hào)不會(huì)出現(xiàn)等級(jí)變化或頻率選擇性的、等級(jí)導(dǎo)致的假象。
根據(jù)本發(fā)明,如此計(jì)算等級(jí)參數(shù),使得由等級(jí)參數(shù)加權(quán)(例如,相乘或相除)的至少一個(gè)下混通道的能量等于原始通道的能量和。
在一個(gè)實(shí)施例中,根據(jù)下混通道的能量和原始通道的能量和之比得到等級(jí)參數(shù)。在該實(shí)施例中,在編碼器一側(cè)計(jì)算下混通道和原始多通道信號(hào)之間的等級(jí)差,并且輸入到數(shù)據(jù)流中作為等級(jí)校正因子,將等級(jí)校正因子視為額外的參數(shù),這也是對(duì)于下混通道的樣本塊以及特定頻帶給出的。于是,對(duì)于存在通道間等級(jí)差和平衡參數(shù)的每個(gè)塊和頻帶,加入了新的等級(jí)參數(shù)。
本發(fā)明還提供了靈活性,因?yàn)樵试S傳輸多通道信號(hào)的下混,這不同于參數(shù)所基于的下混。例如,當(dāng)廣播臺(tái)不希望廣播由多通道編碼器所生成的下混信號(hào),而是希望廣播由音響工程師在音響工作室中生成的下混信號(hào)(這是基于人類的主觀和創(chuàng)造性印象的下混)時(shí),可能出現(xiàn)這種情況。盡管如此,廣播臺(tái)可能希望與此“主下混”結(jié)合還發(fā)送多通道參數(shù)。根據(jù)本發(fā)明,參數(shù)集和主下混之間的適配由等級(jí)參數(shù)提供,在這種情況下,等級(jí)參數(shù)是主下混和參數(shù)集所基于的參數(shù)下混之間的等級(jí)差。
本發(fā)明的優(yōu)點(diǎn)在于額外的等級(jí)參數(shù)提供了改進(jìn)的輸出質(zhì)量和改進(jìn)的靈活性,因?yàn)榕c一個(gè)下混信號(hào)有關(guān)的參數(shù)集也可以適配于不是在參數(shù)計(jì)算期間生成的另一下混。
為了比特率減小的目的,優(yōu)選的是,應(yīng)用新等級(jí)參數(shù)的Δ編碼以及量化和熵編碼。具體地講,Δ編碼將導(dǎo)致高編碼增益,因?yàn)閹c帶之間或者時(shí)間塊與時(shí)間塊之間的變化將不會(huì)如此之高,從而獲得相對(duì)小的差值,這在與隨后的諸如Huffman編碼器之類的熵編碼結(jié)合使用時(shí)允許良好的編碼增益。
在本發(fā)明的優(yōu)選實(shí)施例中,使用多通道信號(hào)參數(shù)表示,其包括至少兩個(gè)不同的平衡參數(shù),平衡參數(shù)指示兩個(gè)不同通道對(duì)之間的平衡。具體地講,靈活性、可擴(kuò)展性、錯(cuò)誤魯棒性、甚至比特率效率是由于作為第一平衡參數(shù)基礎(chǔ)的第一通道對(duì)不同于作為第二平衡參數(shù)的第二通道對(duì)的結(jié)果,其中形成這些通道對(duì)的四個(gè)通道彼此都不同。
于是,優(yōu)選的概念偏離了單個(gè)參考通道的概念,并且使用多平衡或超平衡的概念,這對(duì)于人類的聲音印象更為直觀和自然。具體地講,第一和第二平衡參數(shù)之下的參數(shù)對(duì)可以包括原始通道、下混通道,或者優(yōu)選地,輸入通道之間的特定組合。
已經(jīng)發(fā)現(xiàn),根據(jù)作為第一通道的中央通道以及作為通道對(duì)的第二通道的左原始通道和右原始通道之和得到的平衡參數(shù)對(duì)于提供中央通道和左右通道之間的確切能量分配尤其有用。應(yīng)該注意,在此環(huán)境中,這三個(gè)通道通常包括音頻場(chǎng)景的大部分信息,其中特別是左右立體聲定位不僅受到左和右之間平衡的影響,而且還受到中央與左和右之和之間平衡的影響。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,使用此平衡參數(shù),來反映這種觀察。
優(yōu)選的是,當(dāng)發(fā)送單個(gè)單聲道下混信號(hào)時(shí),已經(jīng)發(fā)現(xiàn),除了中央/左加上右平衡參數(shù)之外,左/右平衡參數(shù)、背面-左/背面-右平衡參數(shù)以及正面/背面平衡參數(shù)是比特率高效參數(shù)表示的最佳解,該最佳解是靈活的,具有錯(cuò)誤魯棒性,并且在較大程度無假象的。
在接收機(jī)一側(cè),與其中僅由所發(fā)送的信息來計(jì)算每個(gè)通道的BCC合成不同,優(yōu)選的多通道表示還利用有關(guān)用來生成下混通道的下混方案的信息。于是,除了平衡參數(shù)之外,還使用現(xiàn)有技術(shù)系統(tǒng)中不使用的關(guān)于下混方案的信息來進(jìn)行上混。因此,執(zhí)行上混操作,使得形成針對(duì)平衡參數(shù)的通道對(duì)的重構(gòu)多通道信號(hào)內(nèi)的通道之間的平衡由平衡參數(shù)確定。
這一概念,即對(duì)不同平衡參數(shù)使用不同通道對(duì),使得可以生成一些通道,而不需要每個(gè)所傳輸平衡參數(shù)的知識(shí)。特別是,不需要關(guān)于任何背面-左/背面-右平衡或者正面/背面平衡的任何知識(shí),可以重構(gòu)左、右和中央通道。從位流提取額外參數(shù)或者線接收器發(fā)送額外平衡參數(shù)允許重構(gòu)一個(gè)或多個(gè)額外通道,這種效果允許非常精調(diào)的可擴(kuò)展性。這與現(xiàn)有技術(shù)的單參考系統(tǒng)不同,在現(xiàn)有技術(shù)的單參考系統(tǒng)中,需要每個(gè)通道間電平差來重構(gòu)所有重構(gòu)輸出通道的全部或僅僅其子組。
優(yōu)選概念的靈活性還在于,平衡參數(shù)的選擇能夠適于特定的重構(gòu)環(huán)境。例如,當(dāng)五通道設(shè)置形成原始多通道信號(hào)設(shè)置,以及四通道設(shè)置形成重構(gòu)多通道設(shè)置,即,僅具有單個(gè)環(huán)繞揚(yáng)聲器,例如位于聽眾身后時(shí),正面-背面平衡參數(shù)允許計(jì)算組合環(huán)繞通道,而不需要關(guān)于左環(huán)繞通道和右環(huán)繞通道的任何知識(shí)。這與單參考通道系統(tǒng)不同,在單參考通道系統(tǒng)中,必須從數(shù)據(jù)流中提取針對(duì)左環(huán)繞通道的通道間等級(jí)差以及針對(duì)右環(huán)繞通道的通道間等級(jí)差。然后,必須計(jì)算左環(huán)繞通道和右環(huán)繞通道。最后,必須加上兩個(gè)通道,以獲得四通道再現(xiàn)配置的單個(gè)環(huán)繞揚(yáng)聲器通道。在更直觀和更加面向用戶的平衡參數(shù)表示中,不需要執(zhí)行所有這些步驟,因?yàn)檫@種表示自動(dòng)給予組合環(huán)繞通道,因?yàn)槠胶鈪?shù)表示不依賴單個(gè)參考通道,而是還允許使用原始通道的組合作為平衡參數(shù)通道對(duì)的通道。
本發(fā)明涉及音頻信號(hào)的參數(shù)化多通道表示的問題。本發(fā)明提供了對(duì)多通道表示定義適當(dāng)參數(shù)的有效方式,并且還提供了不必對(duì)所有通道解碼就能提取代表所希望的通道配置的參數(shù)的能力。本發(fā)明還解決了對(duì)給定信號(hào)段選擇最優(yōu)參數(shù)配置以最小化編碼給定信號(hào)段的空間參數(shù)所需比特率的問題。本發(fā)明還提出了在一般的多通道環(huán)境中如何應(yīng)用先前僅適用于雙通道情況的去相關(guān)方法。
在優(yōu)選實(shí)施例中,本發(fā)明包括如下特征-在編碼器一側(cè),將多通道信號(hào)下混為一個(gè)或兩個(gè)通道表示;-給定多通道信號(hào),或者以靈活的方式或者以每幀為基礎(chǔ),定義表示多通道信號(hào)的參數(shù),以便最小化比特率,或者以便使解碼器能夠提取位流等級(jí)上的通道配置;-在解碼器一側(cè),給定解碼器當(dāng)前所支持的通道配置,提取相關(guān)參數(shù)集;-給定當(dāng)前通道配置,創(chuàng)建所需數(shù)目的彼此去相關(guān)信號(hào);-給定從位流數(shù)據(jù)解碼的參數(shù)集以及去相關(guān)信號(hào),重建輸出信號(hào)。
-多通道音頻信號(hào)的參數(shù)化定義,從而無論通道配置如何,可以使用相同的參數(shù)或參數(shù)子集。
-多通道音頻信號(hào)的參數(shù)化定義,從而可以在可擴(kuò)展編碼方案中使用參數(shù),其中在可擴(kuò)展流的不同層中傳輸參數(shù)集的子集。
-多通道音頻信號(hào)的參數(shù)化定義,從而解碼器輸出信號(hào)的能量重構(gòu)不受用來編碼下混信號(hào)的底層音頻編解碼器的影響。
-在多通道音頻信號(hào)的不同參數(shù)化之間切換,從而最小化編碼參數(shù)化的比特率開銷。
-多通道音頻信號(hào)的參數(shù)化定義,其中包括表示下混信號(hào)的能量校正因子的參數(shù)。
-使用數(shù)個(gè)彼此去相關(guān)的去相關(guān)器來重建多通道信號(hào)。
-根據(jù)上混矩陣H重建多通道信號(hào),上混矩陣H是根據(jù)所傳輸?shù)膮?shù)集計(jì)算的。
現(xiàn)在將參考附圖描述本發(fā)明,這些描述僅作為示例而不是限制本發(fā)明的范圍或精神,在附圖中圖1示出了本發(fā)明中使用的用于5.1通道配置的命名法;圖2示出了本發(fā)明優(yōu)選實(shí)施例的可能編碼器實(shí)施方式;
圖3示出了本發(fā)明優(yōu)選實(shí)施例的可能解碼器實(shí)施方式;圖4示出了根據(jù)本發(fā)明的多通道信號(hào)的一種優(yōu)選參數(shù)化;圖5示出了根據(jù)本發(fā)明的多通道信號(hào)的一種優(yōu)選參數(shù)化;圖6示出了根據(jù)本發(fā)明的多通道信號(hào)的一種優(yōu)選參數(shù)化;圖7示出了生成單個(gè)基礎(chǔ)通道或兩個(gè)基礎(chǔ)通道的下混方案的示意設(shè)置;圖8示出了上混方案的示意表示,上混方案基于本發(fā)明的平衡參數(shù)和關(guān)于下混方案的信息;圖9a示意性地示出了根據(jù)本發(fā)明的編碼器側(cè)等級(jí)參數(shù)的確定;圖9b示意性地示出了根據(jù)本發(fā)明的解碼器側(cè)等級(jí)參數(shù)的使用;圖10a示出了可擴(kuò)展位流,在該位流的不同層中,具有多通道參數(shù)化的不同部分;圖10b示出了可擴(kuò)展性表,指示使用哪些平衡參數(shù)可以構(gòu)建哪些通道,以及沒有使用或計(jì)算哪些平衡參數(shù)和通道;以及圖11示出了根據(jù)本發(fā)明的上混矩陣的應(yīng)用。
具體實(shí)施例方式
下述實(shí)施例僅僅是對(duì)本發(fā)明的原理應(yīng)用在音頻信號(hào)的多通道表示方面的說明。應(yīng)該理解,下面所述的布置和細(xì)節(jié)的修改和改變對(duì)本領(lǐng)域技術(shù)人員而言是顯而易見的。因此,本發(fā)明僅由所附權(quán)利要求的范圍限制,而非由此處作為對(duì)實(shí)施例的說明和解釋而提出的具體細(xì)節(jié)來限制。
在下面概述如何參數(shù)化IID和ICC參數(shù)以及如何應(yīng)用它們以重建音頻信號(hào)多通道表示的本發(fā)明描述中,假設(shè)所有引用的信號(hào)都是濾波器組中的子帶信號(hào),或者相應(yīng)通道的全部頻率范圍中一部分的某些其他頻率選擇性表示。因此,應(yīng)該理解,本發(fā)明不限于具體濾波器組,并且在下面針對(duì)信號(hào)的子帶表示的一個(gè)頻帶概述了本發(fā)明,并且相同操作適用于所有子帶信號(hào)。
雖然平衡參數(shù)也稱作“通道間強(qiáng)度差(IID)”參數(shù),要強(qiáng)調(diào)的是,通道對(duì)之間的平衡參數(shù)不必是通道對(duì)的第一通道中的能量或強(qiáng)度與通道對(duì)中第二通道的能量或強(qiáng)度之比。一般而言,平衡參數(shù)指示通道對(duì)的兩個(gè)通道之間聲音源的定位。雖然這種定位通常由能量/等級(jí)/強(qiáng)度差給出,但是可以使用信號(hào)的其他特性,例如兩個(gè)通道的功率測(cè)量或者通道的時(shí)間或頻率包絡(luò)等。
在圖1中,示出了5.1通道配置的不同通道,其中a(t)101表示左環(huán)繞通道,b(t)102表示左前通道,c(t)103表示中央通道,d(t)104表示右前通道,e(t)105表示右環(huán)繞通道,f(t)106表示LFE(低頻效果)通道。
假設(shè)將期望算符定義為E[f(x)]=1T∫0Tf(x(t))dt]]>于是,上述通道的能量可以根據(jù)如下等式定義(這里以左環(huán)繞通道為示例)A=E[a2(t)]五個(gè)通道在編碼器一側(cè)下混為雙通道表示或單通道表示。這可以以多種方式來進(jìn)行,并且一種常用方式是根據(jù)如下等式定義的ITU下混5.1到雙通道下混ld(t)=αb(t)+βa(t)+γc(t)+δf(t)rd(t)=αd(t)+βe(t)+γc(t)+δf(t)和5.1到單通道下混md(t)=12(ld(t)+rd(t))]]>常數(shù)α、β、γ和δ的常用值是α=1,β=γ=12]]>及δ=0。
IDD參數(shù)定義為兩個(gè)任意選擇的通道或者通道加權(quán)組的能量比。給定5.1通道配置的上述通道的能量,可以定義多個(gè)IDD參數(shù)集合。
圖7示出了使用上述等式來計(jì)算基于單個(gè)的通道m(xù)或優(yōu)選的兩個(gè)基于立體聲的通道ld和rd的一般下混頻器700。一般而言,下混頻器使用特定的下混信息。在線性下混的優(yōu)選實(shí)施例中,該下混信息包括加權(quán)因子α、β、γ和δ。在本領(lǐng)域中已知,可以使用更多或更少的常數(shù)或非常數(shù)加權(quán)因子。
在ITU推薦的下混中,將α設(shè)置為1,β和γ設(shè)置為相等,并且等于0.5的平方根,并且將δ設(shè)置為0。一般而言,因子α可以在1.5和0.5之間變化。另外,因子β和γ可以彼此不同,并且在0和1之間變化。對(duì)低頻增強(qiáng)通道f(t)同樣如此。該通道的因子δ可以在0和1之間變化。另外,左下混和右下混的因子不必彼此相等。當(dāng)考慮非自動(dòng)下混(例如,由音響工程師執(zhí)行)時(shí),這是顯而易見。音響工程師更注重執(zhí)行創(chuàng)造性下混而非由任何數(shù)學(xué)規(guī)則所指導(dǎo)的下混。實(shí)際上,音響工程師由其自身的創(chuàng)造性感覺來引導(dǎo)。當(dāng)這種“創(chuàng)造性”下混由特定參數(shù)集來記錄時(shí),根據(jù)本發(fā)明將由圖8所示的本發(fā)明上混頻器來使用,該上混頻器不僅由參數(shù)來指導(dǎo),而且還由關(guān)于下混方案的額外信息來指導(dǎo)。
當(dāng)如圖7所示執(zhí)行了線性下混時(shí),加權(quán)參數(shù)是上混頻器要使用的關(guān)于下混方案的優(yōu)選信息。然而,當(dāng)存在信號(hào)方案中所使用的其他信息時(shí),上混頻器也可以使用該其他信息作為關(guān)于下混方案的信息。例如,這種其他信息可以是特定的矩陣元素或特定因子或上混矩陣的矩陣元素內(nèi)的函數(shù),例如如圖11所示。
給定圖1所示的5.1通道配置并觀察其他通道配置如何涉及5.1通道配置對(duì)于三通道的情況,其中環(huán)繞通道不可用,即,根據(jù)上面的標(biāo)記,B、C和D可用。對(duì)于四通道配置,B、C和D可用,并且表示單個(gè)環(huán)繞通道的A和E的組合也可用,或者在此環(huán)境中更一般地稱作背面通道。
本發(fā)明使用適用于所有這些通道的IID參數(shù),即5.1通道配置的四通道子集具有描述5.1通道的IID參數(shù)集內(nèi)的相應(yīng)子集。
下面的IID參數(shù)集解決此問題r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>r2=γ22Cα2(B+D)]]>
r3=β2(A+E)α2(B+D)+γ22C]]>r4=β2Aβ2E=AE]]>r5=δ22Fα2(B+D)+β2(A+E)+γ22C]]>顯而易見,r1參數(shù)對(duì)應(yīng)于左下混通道和右通道下混之間的能量比。r2參數(shù)對(duì)應(yīng)于中央通道和左右前通道之間的能量比。r3參數(shù)對(duì)應(yīng)于三個(gè)正面通道和兩個(gè)環(huán)繞通道之間的能量比。r4參數(shù)對(duì)應(yīng)于兩個(gè)環(huán)繞通道之間的能量比。r5參數(shù)對(duì)應(yīng)于LFE通道和所有其他通道之間的能量比。
在圖4中,示出了上述能量比。不同的輸出通道由101至105表示,并且與圖1中相同,因此這里不再贅述。揚(yáng)聲器設(shè)置分為左半部和右半部,其中中央通道103是兩個(gè)半部的一部分。左半邊和右半邊之間的能量比就是稱作r1的參數(shù)。這在圖4中由r1下的實(shí)線表示。另外,中央通道103與左右前通道102和103之間的能量分配由r2表示。最后,整個(gè)前面通道設(shè)置(102、103和104)與背面通道(101和105)之間的能量分配在圖5中由r3參數(shù)旁的箭頭表示。
給定上面的參數(shù)化以及所傳送的單個(gè)下混通道的能量M=12(α2(B+D)+β2(A+E)+2γ2C+2δ2F)]]>重構(gòu)通道的能量可以表示為F=12γ2r51+r52M]]>A=1β2r41+r4r31+r311+r52M]]>E=1β211+r4r31+r311+r52M]]>C=12γ2r21+r211+r311+r52M]]>
B=1α2(2r11+r1M-β2A-γ2C-δ2F)]]>D=1α2(211+r1M-β2E-γ2C-δ2F)]]>因此,M信號(hào)的能量可以分配到重構(gòu)通道中,導(dǎo)致重構(gòu)通道具有與原始通道相同的能量。
圖8中示出了上面優(yōu)選的上混方案。根據(jù)F、A、E、C、B和D的等式,顯而易見,上混頻器要使用的關(guān)于下混方案的信息是加權(quán)因子α、β、γ和δ,它們用于在如此加權(quán)或未加權(quán)的通道加在一起或者彼此相減以達(dá)到一定數(shù)目的下混通道(少于原始通道數(shù))之前對(duì)原始通道進(jìn)行加權(quán)。于是,根據(jù)圖8可知,根據(jù)本發(fā)明,重構(gòu)通道的能量不僅由從編碼器側(cè)向解碼器側(cè)發(fā)送的平衡參數(shù)確定,而且還由下混因子α、β、γ和δ確定。
在考慮圖8時(shí)可知,為了計(jì)算左和右能量B和D,在等式內(nèi)使用已經(jīng)計(jì)算的通道能量F、A、E、C。然而,這并不一定意味著順序上混方案。實(shí)際上,為了獲得完全并行的上混方案(例如使用具有特定上混矩陣元素的特定上混矩陣來執(zhí)行),將A、C、E和F的等式插入到B和D的等式中。于是,可知重構(gòu)通道能量?jī)H由平衡參數(shù)、下混通道以及關(guān)于下混方案的信息(例如,下混因子)確定。
給定上述IID參數(shù),可知定義可以用于多種通道配置的IID參數(shù)的參數(shù)集的問題已經(jīng)解決,這在下面是顯而易見。作為示例,觀察三通道配置(即,根據(jù)一個(gè)可用通道重建三個(gè)前面的通道),可知,r3、r4和r5參數(shù)是無用的,因?yàn)锳、E和F通道不存在。還可知,參數(shù)r1和r2足以根據(jù)下混的單個(gè)通道來重建三個(gè)通道,因?yàn)閞1描述左和右前通道之間的能量比,r2描述中央通道與左和右前通道之間的能量比。
在更一般的情況下,容易得知,如上定義的IID參數(shù)(r1...r5)適用于根據(jù)m個(gè)通道重建n個(gè)通道的所有子集,其中m<n≤6。觀察圖4,可知-對(duì)于根據(jù)1個(gè)通道重建2個(gè)通道的系統(tǒng),根據(jù)r1參數(shù),獲得了保留通道之間正確的能量比的足夠信息;
-對(duì)于根據(jù)1個(gè)通道重建3個(gè)通道的系統(tǒng),根據(jù)r1和r2參數(shù),獲得了保留通道之間正確的能量比的足夠信息;-對(duì)于根據(jù)1個(gè)通道重建4個(gè)通道的系統(tǒng),根據(jù)r1、r2和r3參數(shù),獲得了保留通道之間正確的能量比的足夠信息;-對(duì)于根據(jù)1個(gè)通道重建5個(gè)通道的系統(tǒng),根據(jù)r1、r2、r3和r4參數(shù),獲得了保留通道之間正確的能量比的足夠信息;-對(duì)于根據(jù)1個(gè)通道重建5.1通道的系統(tǒng),根據(jù)r1、r2、r3、r4和r5參數(shù),獲得了保留通道之間正確的能量比的足夠信息;-對(duì)于根據(jù)2個(gè)通道重建5.1通道的系統(tǒng),根據(jù)r2、r3、r4和r5參數(shù),獲得了保留通道之間正確的能量比的足夠信息。
圖10b中的表示出了上述可擴(kuò)展性特征。圖10a中所示出的、稍后將解釋的可擴(kuò)展位流還可以適用于圖10b中的表,以獲得比圖10a所示出的好得多的可擴(kuò)展性。
特別是,優(yōu)選的概念有利之處在于,可以根據(jù)單個(gè)平衡參數(shù)r1,容易地重構(gòu)左右通道,而不需要任何其他平衡參數(shù)的知識(shí)或提取。為此,在圖8中的B、D的等式中,簡(jiǎn)單地將通道A、C、F和E設(shè)置為零。
作為另一種選擇,當(dāng)僅考慮平衡參數(shù)r2時(shí),重構(gòu)通道一方面是中央通道和低頻通道(當(dāng)該通道沒有設(shè)置為零時(shí))之間的和,另一方面是左右通道之間的和。于是,僅使用單個(gè)參數(shù),一方面可以重構(gòu)中央通道,另一方面可以重構(gòu)單聲道信號(hào)。該特征可能已經(jīng)對(duì)簡(jiǎn)單的3通道表示有用,其中例如通過均分根據(jù)左和右之和得到左和右信號(hào),并且中央與左和右之和之間的能量就是由平衡參數(shù)r2確定。
在這種環(huán)境中,平衡參數(shù)r1或r2處于較低的擴(kuò)展(scaling)層。
至于圖10b的表中的第二項(xiàng),這一項(xiàng)指示如何僅使用兩個(gè)平衡參數(shù)而不是所有5個(gè)平衡參數(shù)來生成3個(gè)通道B、D及C和F之和,這些參數(shù)r1和r2之一可能已經(jīng)處于比位于較低擴(kuò)展層中的參數(shù)r1或r2高的擴(kuò)展層中。
當(dāng)考慮圖8中的等式時(shí)可知,為計(jì)算C,將非提取參數(shù)r5和另一非提取參數(shù)r3設(shè)置為0。另外,將未使用的通道A、E、F也設(shè)置為0,從而可以計(jì)算3個(gè)通道B、D以及中央通道C和低頻增強(qiáng)通道F之間的組合。
當(dāng)要上混4通道表示時(shí),僅從參數(shù)數(shù)據(jù)流中提取參數(shù)r1、r2和r3就足夠了。在這種環(huán)境中,r3可以處于其他參數(shù)r1或r2的下一較高擴(kuò)展層中。4通道配置尤其適用于與本發(fā)明的超級(jí)平衡參數(shù)表示相結(jié)合,因?yàn)槿缟院髤⒖紙D6所述,一方面根據(jù)正面通道的組合,另一方面根據(jù)背面通道,已經(jīng)得到第三平衡參數(shù)r3。這是由于參數(shù)r3是正面-背面平衡參數(shù),它是根據(jù)具有背面通道A和E的組合作為第一通道以及左通道B、右通道E和中央通道C的組合作為正面通道的通道對(duì)得到的。
于是,自動(dòng)獲得兩個(gè)環(huán)繞通道的組合通道能量,而不需要任何進(jìn)一步的單獨(dú)計(jì)算和后繼組合,與單個(gè)參考通道設(shè)置中的情況一樣。
當(dāng)要從單個(gè)通道重建5個(gè)通道時(shí),進(jìn)一步的平衡參數(shù)r4是必要的。該參數(shù)r4可以處于下一較高擴(kuò)展層中。
當(dāng)要執(zhí)行5.1重構(gòu)時(shí),需要每個(gè)平衡參數(shù)。于是,必須將包括下一平衡參數(shù)r5的下一較高擴(kuò)展層發(fā)送到接收機(jī),并且由接收機(jī)評(píng)估。
然而,使用根據(jù)通道擴(kuò)展數(shù)來擴(kuò)展IID參數(shù)的相同方法,上述IID參數(shù)可以擴(kuò)展為覆蓋通道數(shù)大于5.1配置的通道配置s。因此,本發(fā)明不限于上述示例。
現(xiàn)在觀察通道配置為5.1通道配置的情況,這是最常用的情況。另外,假設(shè)根據(jù)兩個(gè)通道重建5.1通道。針對(duì)該情況,可以通過以如下參數(shù)替換參數(shù)r3和r4來定義不同的參數(shù)集q3=β2Aα2B]]>q4=β2Eα2D]]>參數(shù)q3和q4表示正面和背面左通道之間的能量比、以及正面和背面右通道之間的能量比??梢栽O(shè)想數(shù)種其他參數(shù)化。
在圖5中使修改的參數(shù)化形象化。不是用一個(gè)參數(shù)描述正面和背面通道之間的能量分配(如圖4中r3所示)以及用參數(shù)描述左環(huán)繞通道和右環(huán)繞通道之間的能量分配(如圖4中r4所示),而是使用參數(shù)q3和q4描述左前通道102和左環(huán)繞通道101之間的能量比、以及右前通道104和右環(huán)繞通道105之間的能量比。
本發(fā)明優(yōu)選的是可以使用多個(gè)參數(shù)集來表示多通道信號(hào)。本發(fā)明的附加特征在于,可以根據(jù)所使用的參數(shù)的量化類型,選擇不同的參數(shù)化。
例如,由于高比特率的約束而使用參數(shù)化的粗量化的系統(tǒng),應(yīng)該使用在上混處理期間不會(huì)使錯(cuò)誤加大的參數(shù)化。
觀察在根據(jù)一個(gè)通道重建5.1通道的系統(tǒng)中針對(duì)重構(gòu)能量的上述表達(dá)式中兩個(gè)B=1α2(2r11+r1M-β2A-γ2C-δ2F)]]>D=1α2(211+r1M-β2E-γ2C-δ2F)]]>很顯然,由于M、A、C和F參數(shù)的極小的量化效果,相減可以導(dǎo)致B和D能量的大變化。
根據(jù)本發(fā)明,應(yīng)該使用對(duì)參數(shù)的量化不那么敏感的不同參數(shù)化。因此,如果使用粗量化,則如上定義的r1參數(shù)r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>可以由根據(jù)如下等式定義的替代定義來代替r1=BD]]>這樣,能夠得到如下的重構(gòu)能量等式B=1α2r11+r111+r211+r311+r52M]]>D=1α211+r111+r211+r311+r52M]]>而A、E、C和F的重構(gòu)能量等式仍然與上面相同。很顯然,根據(jù)量化的觀點(diǎn),這種參數(shù)化代表了更好地調(diào)節(jié)的系統(tǒng)。
在圖6中示出了如上面說明的能量比。不同的輸出通道由101至105表示,并且與圖1中相同,因此這里不再贅述。揚(yáng)聲器設(shè)置分為正面部分和背面部分。整個(gè)正面通道設(shè)置(102、103和104)與背面通道(101和105)之間的能量分配由圖6中r3參數(shù)所指示的箭頭表示。
本發(fā)明的另一顯著的重要特征是當(dāng)觀察如下參數(shù)化時(shí)r2=γ22Cα2(B+D)]]>r1=BD]]>根據(jù)量化的觀點(diǎn),這不僅是更好地調(diào)節(jié)的系統(tǒng)。上述參數(shù)化還具有這樣的優(yōu)點(diǎn)得到用來重構(gòu)三個(gè)正面通道的參數(shù),而不會(huì)影響環(huán)繞通道??梢栽O(shè)想描述中央通道和所有其他通道之間的關(guān)系的參數(shù)r2。然而,這也具有缺點(diǎn)環(huán)繞通道將包括在描述正面通道的參數(shù)的估計(jì)中。
應(yīng)該記住,在本發(fā)明中,所描述的參數(shù)化也可以應(yīng)用于通道之間相關(guān)性或相干性的測(cè)量,顯而易見,在r2的計(jì)算中包括背面通道可以對(duì)成功地準(zhǔn)確重建正面通道產(chǎn)生重大的負(fù)面影響。
例如,可以想象在所有正面通道中具有相同信號(hào),并且在背面通道中具有完全非相關(guān)信號(hào)的情況。如果頻繁使用背面通道來重建原始聲音的環(huán)境信息,這是不常見的。
如果相對(duì)于所有其他通道來描述中央通道,中央通道和所有其他通道之和之間的相關(guān)性測(cè)量將非常低,因?yàn)楸趁嫱ǖ劳耆幌嚓P(guān)。對(duì)于估計(jì)正面左/右通道與背面左/右通道之間的相關(guān)性的參數(shù)同樣如此。
因此,得到了可以正確重構(gòu)能量的參數(shù)化,但是不包括所有正面通道相同(即,強(qiáng)相關(guān))的信息。該參數(shù)化不包括左和右前通道與背面通道去相關(guān)以及中央通道也與背面通道去相關(guān)的信息。然而,所有正面通道相同的事實(shí)不是從這種參數(shù)化得到的。
利用本發(fā)明所教導(dǎo)的如下參數(shù)化克服此問題r2=γ22Cα2(B+D)]]>
r1=BD]]>因?yàn)楸趁嫱ǖ啦话ㄔ诮獯a器側(cè)用來重建正面通道的參數(shù)的估計(jì)中。
根據(jù)本發(fā)明,中央通道103與左前通道102和右前通道103之間的能量分配由r2指示。左環(huán)繞通道101和右環(huán)繞通道105之間的能量分配由r4指示。最后,左前通道102和右前通道104之間的能量分配由r1給出。很顯然,除了r1之外所有參數(shù)與圖4所示相同,此處r1對(duì)應(yīng)于左前揚(yáng)聲器和右前揚(yáng)聲器之間的能量分配,而非整個(gè)左側(cè)與整個(gè)右側(cè)之間的能量分配。為了完整起見,還給出了描述中央通道103和lfe通道106之間的能量分配的參數(shù)r5。
圖6示出了本發(fā)明的優(yōu)選參數(shù)化實(shí)施例的概述。第一平衡參數(shù)r1(由實(shí)線指示)構(gòu)成前左/前右平衡參數(shù)。第二平衡參數(shù)r2是中左-右平衡參數(shù)。第三平衡參數(shù)r3構(gòu)成正面/背面平衡參數(shù)。第四平衡參數(shù)r4構(gòu)成左后/右后平衡參數(shù)。最后,第五平衡參數(shù)r5構(gòu)成中央/lfe平衡參數(shù)。
圖4示出了相關(guān)情形。圖4中實(shí)線所示出的下混左/右平衡情況下的第一平衡參數(shù)r1可以由原始前左/前右平衡參數(shù)代替,其中原始前左/前右平衡參數(shù)在作為底層通道對(duì)的通道B和D之間定義。在圖4中由虛線r1示出了這一情況,并且對(duì)應(yīng)于圖5和圖6中的實(shí)線r1。
在雙基礎(chǔ)通道的情況下,參數(shù)r3和r4,即正面/背面平衡參數(shù)和背面左/右平衡參數(shù)右兩個(gè)單側(cè)正面/背面參數(shù)代替。第一單側(cè)正面/背面參數(shù)q3也可以視為第一平衡參數(shù),它是根據(jù)由左環(huán)繞通道A和左通道B構(gòu)成的通道對(duì)得到的。第二單側(cè)正面/背面參數(shù)是參數(shù)q4,它也可以視為第二參數(shù),它基于由右通道D和右環(huán)繞通道E構(gòu)成的第二通道對(duì)。此外,兩個(gè)通道對(duì)彼此獨(dú)立。對(duì)于中央/左-右平衡參數(shù)r2也是如此,中央/左-右平衡參數(shù)r2具有中央通道C作為第一通道以及左和右通道B和D之和作為第二通道。
根據(jù)本發(fā)明,下面定義另一種非常適用于根據(jù)一個(gè)或兩個(gè)通道重建5.1通道的系統(tǒng)的粗量化的參數(shù)化。
對(duì)于一到5.1通道
q1=β2AM,q2=α2BM,q3=γ2CM,q4=α2DM,q2=β2EM]]>及q5=δ2FM]]>對(duì)于二到5.1通道q1=β2AL,q2=α2BL,q3=γ2CM,q4=α2DR,q2=β2ER]]>及q5=δ2FM]]>很顯然,上述參數(shù)化包括的參數(shù)多于根據(jù)嚴(yán)格的理論觀點(diǎn)來正確重新分配所傳輸信號(hào)的能量以重構(gòu)信號(hào)所需的參數(shù)。然而,這種參數(shù)化對(duì)于量化誤差非常不敏感。
針對(duì)雙基通道設(shè)置的上述參數(shù)集利用多個(gè)參考通道。然而,與圖6中的參數(shù)配置不同,圖7中的參數(shù)集僅僅依賴于下混通道而非原始通道作為參考通道。根據(jù)完全不同的通道對(duì)得到平衡參數(shù)q1、q3和q4。
雖然已經(jīng)描述了多個(gè)本發(fā)明的實(shí)施例,其中用于得到平衡參數(shù)的通道對(duì)僅包括原始通道(圖4、圖5、圖6)或包括原始通道以及下混通道(圖4、圖5)或者僅依賴于下混通道作為參考通道(如圖7中下部所示),優(yōu)選的是,圖2的環(huán)繞數(shù)據(jù)編碼器206中包括的參數(shù)生成器可操作來僅使用原始通道或原始通道的組合,而針對(duì)非平衡參數(shù)所基于的通道對(duì)中通道的基礎(chǔ)通道或基礎(chǔ)通道的組合。這是由于不能完全保證單個(gè)基礎(chǔ)通道或兩個(gè)立體聲基礎(chǔ)通道在它們從環(huán)繞編碼器發(fā)送到環(huán)繞解碼器期間不出現(xiàn)能量改變。這種下混通道或單個(gè)下混通道的能量變化可以是由在低比特率條件下工作的音頻編碼器205(圖2)或音頻解碼器302(圖3)引起的。這種情況可以導(dǎo)致對(duì)單聲道下混通道或立體聲下混通道的能量的操作,這種操作可能在左和右立體聲下混通道之間不同,或者甚至可以是頻率選擇性和時(shí)間選擇性的。
為了確保針對(duì)這種能量變化的完全安全,根據(jù)本發(fā)明,對(duì)每個(gè)下混通道的每一塊和頻帶發(fā)送額外的等級(jí)信息。當(dāng)平衡參數(shù)基于原始信號(hào)而非下混信號(hào)時(shí),對(duì)于每個(gè)頻帶單個(gè)校正因子就足夠了,因?yàn)槿魏文芰啃U龑⒉粫?huì)影響原始通道之間的平衡情況。即使當(dāng)不傳送額外的等級(jí)信息時(shí),任何下混通道能量變化也不會(huì)導(dǎo)致聲音源在音頻像中的定位失真,而是只會(huì)導(dǎo)致一般的音量變化,這不像由于平衡條件改變而引起的聲音源遷移那樣使人煩惱。
重要的是要注意,如上所述,需要小心使(信號(hào)通道的)能量M是能量B、D、A、E、C和F之和。并不總是這樣的,因?yàn)橄禄斓揭粋€(gè)通道中的不同通道間存在相位依賴。能量校正因子可以作為額外參數(shù)rM發(fā)送,并且解碼器側(cè)接收到的下混信號(hào)能量如此定義rMM=12(α2(B+D)+β2(A+E)+2γ2C+2δ2F).]]>在圖9中示出了根據(jù)本發(fā)明的額外參數(shù)rM的應(yīng)用。在901中,在將下混輸入信號(hào)發(fā)送到701~705的上混模塊之前,利用rM參數(shù)修改下混輸入信號(hào)。這與圖7中相同,因此不再贅述。本領(lǐng)域技術(shù)人員可知,上面單通道下混示例的參數(shù)rM可以擴(kuò)展為每個(gè)下混通道一個(gè)參數(shù),因此不限于單個(gè)下混通道。
圖9a示出了本發(fā)明的等級(jí)參數(shù)計(jì)算器900,而圖9b示出了本發(fā)明的等級(jí)校正器902。圖9a示出了編碼器側(cè)的情況,圖9b示出了相應(yīng)的解碼器側(cè)情況。等級(jí)參數(shù)或“額外”參數(shù)rM是給出特定能量比的校正因子。為了對(duì)此進(jìn)行解釋,假設(shè)如下的示例性場(chǎng)景。對(duì)于特定的原始多通道信號(hào),一方面存在“主下混”,另一方面存在“參數(shù)下混”。例如,音響工程師已經(jīng)在音響工作室中根據(jù)主觀質(zhì)量印象生成了主下混。另外,特定的音頻存儲(chǔ)介質(zhì)也包括參數(shù)下混,參數(shù)下混例如由圖2的環(huán)繞編碼器203執(zhí)行。參數(shù)下混包括一個(gè)基礎(chǔ)通道或兩個(gè)基礎(chǔ)通道,這些基礎(chǔ)通道形成了使用平衡參數(shù)集或者原始多通道信號(hào)的任何其他參數(shù)表示來進(jìn)行多通道重構(gòu)的基礎(chǔ)。
例如,可以是這樣的情況,廣播臺(tái)不希望從發(fā)射機(jī)向接收機(jī)發(fā)送參數(shù)下混而是發(fā)送主下混。另外,為了將主下混升級(jí)為多通道表示,廣播臺(tái)還發(fā)送原始多通道信號(hào)的參數(shù)表示。因?yàn)?一個(gè)塊和一個(gè)頻帶中的)能量可以(并且通常會(huì))在主下混和參數(shù)下混之間改變,在塊900中生成相對(duì)等級(jí)參數(shù)rM,并且發(fā)送到接收機(jī)作為附加參數(shù)。根據(jù)主下混和參數(shù)下混得到等級(jí)參數(shù),并且優(yōu)選的是,等級(jí)參數(shù)是主下混和參數(shù)下混的一個(gè)塊和一個(gè)頻帶內(nèi)的能量之比。
通常,等級(jí)參數(shù)計(jì)算為原始通道的能量(Eorig)和與下混通道的能量之比,其中該下混通道可以是參數(shù)下混(EPD)或主下混(EMD)或者任何其他下混信號(hào)。通常,使用從編碼器向解碼器發(fā)送的具體下混信號(hào)的能量。
圖9b示出了在解碼器側(cè)的等級(jí)參數(shù)使用的實(shí)施方式。等級(jí)參數(shù)以及下混信號(hào)輸入到等級(jí)校正器模塊902中。等級(jí)校正器根據(jù)等級(jí)參數(shù),校正單基通道或多基通道。因?yàn)楦郊訁?shù)rM是相對(duì)值,所以將此相對(duì)值乘以相應(yīng)基礎(chǔ)通道的能量。
雖然圖9a和9b示出了將等級(jí)校正應(yīng)用于下混通道的情況,但是等級(jí)參數(shù)也可以集成在上混矩陣中。為此,圖8中的等式中每次出現(xiàn)的M由項(xiàng)“rMM”代替。
研究根據(jù)2個(gè)通道重建5.1通道的情況,進(jìn)行如下觀察。
如果本發(fā)明與圖2和圖3中205和302所示的底層編解碼器一起使用,需要做出更多的考慮。觀察前面定義的IID參數(shù),其中r1如下定義r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>該參數(shù)在解碼器側(cè)是隱式可用的,因?yàn)橄到y(tǒng)是根據(jù)2個(gè)通道重建5.1通道,假如所傳輸?shù)膬蓚€(gè)通道是環(huán)繞通道的立體聲下混。
然而,在比特率約束下工作的音頻編解碼器可以修改頻譜分布,從而解碼器側(cè)測(cè)量的L和R能量不同于它們?cè)诰幋a器側(cè)的值。根據(jù)本發(fā)明,同樣對(duì)于根據(jù)兩個(gè)通道重構(gòu)5.1通道的情況,對(duì)重構(gòu)通道能量分布的這種影響通過傳輸如下參數(shù)而消失r1=BD.]]>如果提供信令裝置,編碼器可以使用不同參數(shù)集來編碼當(dāng)前信號(hào)段,并且選擇對(duì)于所處理的特定信號(hào)段給出最低開銷的IID參數(shù)集。右前通道和背面通道之間的能量等級(jí)類似,正面和背面左通道之間的能量等級(jí)類似,但是可能與右前和背面通道中的等級(jí)明顯不同。給定參數(shù)的Δ編碼和隨后的熵編碼,使用參數(shù)q3和q4而非r3和r4可以更有效。對(duì)于具有不同特性的另一個(gè)信號(hào)段,不同的參數(shù)集可以給出較低的比特率開銷。給定信號(hào)段的特性,本發(fā)明允許在不同參數(shù)表示之間自由切換,以便最小化當(dāng)前編碼信號(hào)段的比特率開銷。在IID參數(shù)的不同參數(shù)化之間切換,以便獲得最低的可能比特率開銷,以及提供信令裝置以指示當(dāng)前使用何種參數(shù)化的能力是本發(fā)明的本質(zhì)特征。
另外,參數(shù)的Δ編碼可以在頻率方向或者時(shí)間方向中進(jìn)行,并進(jìn)行不同參數(shù)之間的Δ編碼。根據(jù)本發(fā)明,如果提供指示所使用的特定Δ編碼的信令裝置,參數(shù)可以相對(duì)于任何其他參數(shù)來進(jìn)行Δ編碼。
對(duì)任何編碼方案感興趣的特征是進(jìn)行可擴(kuò)展編碼的能力。這意味著可以將編碼位流分為多個(gè)不同的層。核心層是可自解碼的,并且可以解碼較高層以增強(qiáng)解碼核心層信號(hào)。對(duì)于不同的環(huán)境,可用層的數(shù)目可以改變,但是只要核心層可用,解碼器可以產(chǎn)生輸出樣本。如上所述,使用r1至r5參數(shù)對(duì)多通道編碼進(jìn)行參數(shù)化,使它們自身非常適于可擴(kuò)展編碼。因此,可以在增強(qiáng)層中存儲(chǔ)例如兩個(gè)環(huán)繞通道(A和E)的數(shù)據(jù)(即參數(shù)r3和r4),并且在核心層中存儲(chǔ)與正面通道相對(duì)應(yīng)的參數(shù),由參數(shù)r1和r2表示。
在圖10中示出了根據(jù)本發(fā)明的可擴(kuò)展位流實(shí)施方式。位流層由1001和1002表示,其中1001是保持波形編碼下混信號(hào)和重建正面通道(102、103和104)所需的參數(shù)r1和r2的核心層。1002所表示的增強(qiáng)層保持用于重建背面通道(101和105)的參數(shù)。
本發(fā)明的另一個(gè)重要方面是在多通道配置中使用去相關(guān)器。在文獻(xiàn)PCT/SE02/01372中針對(duì)一到二通道的情況描述了使用去相關(guān)器的概念。然而,當(dāng)將此理論擴(kuò)展到兩個(gè)以上的通道時(shí),出現(xiàn)了多個(gè)問題,本發(fā)明解決了這些問題。
初等數(shù)學(xué)表明,為了從N個(gè)信號(hào)得到M個(gè)彼此去相關(guān)的信號(hào),需要M-N個(gè)去相關(guān)器,其中所有不同的去相關(guān)器是根據(jù)公共輸入信號(hào)創(chuàng)建彼此正交的輸出信號(hào)的函數(shù)。去相關(guān)器通常是全通或近全通濾波器,給定輸入x(t),產(chǎn)生輸出y(t),其中E[|y|2]=E[|x|2],并且?guī)缀跸嘶ハ嚓P(guān)E[yx*]。好的去相關(guān)器設(shè)計(jì)還涉及到進(jìn)一步的感覺標(biāo)準(zhǔn),設(shè)計(jì)方法的一些示例可以是當(dāng)向去相關(guān)信號(hào)加入原始信號(hào)時(shí),最小化梳狀濾波器特性,以及最小化在瞬態(tài)信號(hào)處有時(shí)太長(zhǎng)的沖激響應(yīng)的效果。某些現(xiàn)有技術(shù)的去相關(guān)器利用人工混響器來去相關(guān)。現(xiàn)有技術(shù)還包括例如通過修改復(fù)子帶樣本的相位來進(jìn)行分?jǐn)?shù)延遲,以獲得較高的回響密度,因此獲得更大的時(shí)間擴(kuò)散。
本發(fā)明提出了如下方法修改基于混響的去相關(guān)器,以便實(shí)現(xiàn)根據(jù)公共輸入信號(hào)創(chuàng)建彼此去相關(guān)的輸出信號(hào)的多個(gè)去相關(guān)器。如果兩個(gè)去相關(guān)器在相同輸入的情況下的輸出y1(t)和y2(t)消除或幾乎消除了互相關(guān),則這兩個(gè)去相關(guān)器彼此去相關(guān)。假設(shè)輸入是平穩(wěn)白噪聲,那么沖激響應(yīng)h1和h2必須正交,因?yàn)镋[h1h2*]消除或幾乎消除??梢砸远喾N方式構(gòu)建對(duì)集彼此去相關(guān)的去相關(guān)器。進(jìn)行這種修改的一種有效方式是改變相位旋轉(zhuǎn)因子q,這是分?jǐn)?shù)延遲的一部分。
本發(fā)明規(guī)定相位旋轉(zhuǎn)因子可以是全通濾波器中延遲線的一部分,或者就是整個(gè)分?jǐn)?shù)延遲。在后一種情況下,該方法不限于全通或混響之類的濾波器,而是也可以應(yīng)用于例如包括分?jǐn)?shù)延遲部分的簡(jiǎn)單延遲。去相關(guān)器中的全通濾波器鏈路在Z域中可以如下描述H(z)=qz-m-a1-aqz-m]]>其中,q是復(fù)值相位旋轉(zhuǎn)因子(|q|=1),m是樣本中延遲線長(zhǎng)度,并且a是濾波器系數(shù)。由于穩(wěn)定性原因,濾波器吸收的大小應(yīng)該限制于|a|<1。然而,通過使用可選的濾波器系數(shù)a′=-a,定義了新的混響器,其具有相同的混響衰落特性,但是輸出與未修改的混響器的輸出顯著不相關(guān)。另外,相位旋轉(zhuǎn)因子q的修改可以通過例如添加恒定相位偏移q′=qejC]]>來進(jìn)行。常數(shù)C可以用作恒定相位偏移,或者可以進(jìn)行縮放,使其對(duì)應(yīng)于其所應(yīng)用的所有頻帶的恒定時(shí)間偏移。相位偏移常數(shù)C也可以是對(duì)所有頻帶不同的隨機(jī)值。
根據(jù)本發(fā)明,通過向如下大小為(m+p)×1個(gè)信號(hào)的列向量應(yīng)用大小為n×(m+p)的上混矩陣H,來執(zhí)行從m個(gè)通道生成n個(gè)通道的操作y=ms]]>其中,m是m個(gè)被下混且編碼的信號(hào),并且s中的p個(gè)信號(hào)被兩兩彼此去相關(guān),并且與m中的所有信號(hào)去相關(guān)。這些去相關(guān)信號(hào)是由去相關(guān)器根據(jù)m中的信號(hào)產(chǎn)生的。然后n個(gè)重構(gòu)信號(hào)a′、b′...包含在如下列向量中x′=Hy圖11中示出了上述操作,其中去相關(guān)信號(hào)由去相關(guān)器1102、1103和1104創(chuàng)建。上混矩陣H由1101給出,其對(duì)向量y進(jìn)行操作,給出輸出信號(hào)x′。
設(shè)R=E[xx*]是原始信號(hào)向量的相關(guān)矩陣,R′=E[x′x′*]是重構(gòu)信號(hào)的相關(guān)矩陣。此處以及下文中,對(duì)于具有復(fù)數(shù)項(xiàng)的矩陣或向量X,X*表示X的伴隨矩陣、復(fù)共軛轉(zhuǎn)置。
R的對(duì)角線包含能量值A(chǔ)、B、C...,并且可以根據(jù)如上定義的能量配額,解碼為總能量等級(jí)。因?yàn)镽*=R,所以只有n(n-1)/2個(gè)不同的離對(duì)角線互相關(guān)值,包含要通過調(diào)整上混矩陣H來全部或部分重構(gòu)的信息。全相關(guān)結(jié)構(gòu)的重構(gòu)對(duì)應(yīng)于R′=R的情況。正確的能量等級(jí)的重構(gòu)僅對(duì)應(yīng)于R′和R在它們的對(duì)角線上相同的情況。
在從m=1個(gè)通道得到n個(gè)通道的情況下,全相關(guān)結(jié)構(gòu)的重構(gòu)通過使用p=n-1個(gè)彼此去相關(guān)的去相關(guān)器、滿足如下條件的上混矩陣H來實(shí)現(xiàn)HH*=1MR]]>其中M是單個(gè)所傳輸信號(hào)的能量。因?yàn)镽是半正定的,這種解的存在是公知的。此外,對(duì)于H的設(shè)計(jì)留下了n(n-1)/2的自由度,它們?cè)诒景l(fā)明中用來獲得上混矩陣的進(jìn)一步希望的特性。中心設(shè)計(jì)標(biāo)準(zhǔn)是H對(duì)所傳輸?shù)南嚓P(guān)性數(shù)據(jù)的依賴性應(yīng)該是平滑的。
參數(shù)化上混矩陣的一種方便方式是H=UDV,其中U和V是正交矩陣,并且D是對(duì)角矩陣??梢赃x擇D的絕對(duì)值的平方等于R/M的特征值。忽略V并對(duì)特征值進(jìn)行排序,使最大的值應(yīng)用于第一坐標(biāo),將使輸出中去相關(guān)信號(hào)的總體能量最小化。正交矩陣U處于由n(n-1)/2個(gè)旋轉(zhuǎn)角度來參數(shù)化的實(shí)狀態(tài)。以這些角度和D的n個(gè)對(duì)角線值的形式發(fā)送相關(guān)性數(shù)據(jù),將立即給出所希望的H的平滑依賴性。然而,因?yàn)楸仨殞⒛芰繑?shù)據(jù)變換為特征值,所以這種方法犧牲了可擴(kuò)展性。
本發(fā)明所教導(dǎo)的第二方法包括通過根據(jù)R=GR0G定義歸一化相關(guān)矩陣R0,來從R中的相關(guān)性部分分離能量部分,其中G是對(duì)角矩陣,對(duì)角線值等于R的對(duì)角線項(xiàng)的平方根,即, 并且R0在對(duì)角線上為1。設(shè)H0是正交上混矩陣,其定義在等能量的完全非相關(guān)信號(hào)情況下優(yōu)選的歸一化上混。這種優(yōu)選上混矩陣的示例有121-111,1212211-22-20,12111111-1-11-1-111-11-1.]]>然后由H=GSH0/M]]>定義上混,其中矩陣S是SS*=R0的解。選擇此解對(duì)R0中歸一化的互相關(guān)值的依賴性是連續(xù)的,從而S在R0=I情況下等于單位矩陣I。
將n個(gè)通道分為較少通道的組,這是一種重構(gòu)局部互相關(guān)結(jié)構(gòu)的方便方式。根據(jù)本發(fā)明,對(duì)于從1個(gè)通道重構(gòu)5.1通道的情況,尤其有利的分組方式是{a,e},{c},{b,d},{f},其中對(duì)組{c},{f}不應(yīng)用去相關(guān),并且通過對(duì)相同的下混/去相關(guān)對(duì)進(jìn)行上混來產(chǎn)生組{a,e},{b,d}。對(duì)于這兩個(gè)子系統(tǒng),在完全不相關(guān)情況下優(yōu)選的歸一化上混可以分別選擇為121-111,12111-1,]]>于是,將只發(fā)送和重構(gòu)總共15個(gè)互相關(guān)中的兩個(gè),即,通道{a,e}和{b,d}之間的互相關(guān)。在上面使用的術(shù)語(yǔ)中,這是針對(duì)n=6,m=1且p=1情況的設(shè)計(jì)示例。上混矩陣H大小為6×2,在第3行和第6行的第二列中的兩項(xiàng)為零,對(duì)應(yīng)于輸出c′和f′。
本發(fā)明所教導(dǎo)的用于合并去相關(guān)信號(hào)的第三種方法是更為簡(jiǎn)單的觀點(diǎn)每個(gè)輸出通道具有不同的去相關(guān)器,導(dǎo)致去相關(guān)信號(hào)sa,sb,...。然后,形成重構(gòu)信號(hào)如下
etc...
參數(shù)a,b,...控制輸出通道a′,b′,...中出現(xiàn)的去相關(guān)信號(hào)的數(shù)量。以這些角度的形式發(fā)送相關(guān)性數(shù)據(jù)。容易計(jì)算所得到的例如通道a′和b′之間的歸一化互相關(guān)等于乘積cosacosb。因?yàn)槌蓪?duì)的互相關(guān)的數(shù)目為n(n-1)/2,并且存在n個(gè)去相關(guān)器,所以如果n>3,一般不能用這種方法來匹配給定的相關(guān)性結(jié)果,但是其優(yōu)點(diǎn)是這是一種非常簡(jiǎn)單且穩(wěn)定的解碼方法,并且直接控制每個(gè)輸出通道中去相關(guān)信號(hào)的產(chǎn)生量。這使得去相關(guān)信號(hào)的混合能夠基于結(jié)合了例如通道對(duì)的能量等級(jí)差的感覺標(biāo)準(zhǔn)。
對(duì)于從m>1個(gè)通道重構(gòu)n個(gè)通道的情況,不再假設(shè)相關(guān)矩陣Ry=E[yy*]是對(duì)角矩陣,并且在將R′=HRyH*匹配到目標(biāo)R時(shí)必須考慮這一點(diǎn)。因?yàn)镽y具有塊矩陣結(jié)構(gòu),所以可以簡(jiǎn)化,Ry=Rm00Rs,]]>其中,Rm=E[mm*]且Rs=E[ss*]。另外,假設(shè)彼此去相關(guān)的去相關(guān)器,矩陣Rs是對(duì)角矩陣。應(yīng)該指出,這還在重構(gòu)正確能量方面影響上混設(shè)計(jì)。在解碼器中計(jì)算解,或者從編碼器發(fā)送關(guān)于下混信號(hào)的相關(guān)性結(jié)構(gòu)Rm的信息。
對(duì)于從2個(gè)通道重構(gòu)5.1通道的情況,上混的優(yōu)選方法是a′b′c′d′e′f′=h110h130h210h230h31h32000h420h440h520h54h61h6200·m1m2s1s2,]]>其中,s1是根據(jù)m1=ld的去相關(guān)得到的,s2是根據(jù)m2=rd的去相關(guān)得到的。
此處,將組{a,b}和{d,e}視為分離的1→2通道系統(tǒng),其中考慮對(duì)的互相關(guān)。對(duì)于通道c和f,如下調(diào)整權(quán)重
E[|h31m1+h32m2|2]=C,]]>E[|h61m1+h62m2|2]=F.]]>本發(fā)明可以以硬件芯片和DSP的形式實(shí)現(xiàn),對(duì)于各種系統(tǒng),對(duì)于模擬或數(shù)字信號(hào)的存儲(chǔ)或傳輸,可以使用任意編解碼器。圖2和圖3示出了本發(fā)明的可能實(shí)施方式。在該示例中,示出了以六個(gè)輸入信號(hào)工作的系統(tǒng)(5.1通道配置)。在圖2中,在編碼器側(cè),將各個(gè)通道的模擬輸入信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)201,并且對(duì)每個(gè)通道使用濾波器組進(jìn)行分析202。濾波器組的輸出送入環(huán)繞編碼器203,環(huán)繞編碼器203包括參數(shù)生成器,其執(zhí)行下混,創(chuàng)建一個(gè)或兩個(gè)有音頻編碼器205編碼的通道。另外,根據(jù)本發(fā)明,提取諸如IID和ICC參數(shù)之類的環(huán)繞參數(shù),并且根據(jù)本發(fā)明,提取204描述時(shí)間頻率網(wǎng)格以及使用了哪種參數(shù)化的控制數(shù)據(jù)。根據(jù)本發(fā)明,對(duì)所提取的參數(shù)206進(jìn)行編碼,或者在不同的參數(shù)化之間進(jìn)行切換,或者以可擴(kuò)展方式安排參數(shù)。環(huán)繞參數(shù)207、控制信號(hào)和編碼下混信號(hào)208復(fù)用209為串行位流。
在圖3中示出了一種典型的解碼器實(shí)施方式,即,用于生成多通道重構(gòu)的設(shè)備。在此,假設(shè)音頻解碼器輸出頻域表示的信號(hào),例如,來自QMF合成濾波器組之前的MPEG-4高效AAC解碼器的輸出。對(duì)串行位流進(jìn)行解復(fù)用301,并且將編碼環(huán)繞數(shù)據(jù)送入環(huán)繞數(shù)據(jù)解碼器303,并且將下混編碼通道送入音頻解碼器302,在該示例中,音頻解碼器302是MPEG-4高效AAC解碼器。環(huán)繞數(shù)據(jù)解碼器對(duì)環(huán)繞數(shù)據(jù)進(jìn)行解碼,并且將其送入環(huán)繞解碼器305,環(huán)繞解碼器305包括上混頻器,上混頻器根據(jù)解碼的下混通道和環(huán)繞數(shù)據(jù)及控制信號(hào),重建六個(gè)通道。將來自環(huán)繞解碼器的輸出合成306到時(shí)域信號(hào),隨后DAC 307將時(shí)域信號(hào)轉(zhuǎn)換為模擬信號(hào)。
雖然主要參考平衡參數(shù)的生成和使用描述了本發(fā)明,但是應(yīng)該強(qiáng)調(diào),優(yōu)選的是,為得到平衡參數(shù),對(duì)通道對(duì)的相同分組也可以用來計(jì)算通道間相干性參數(shù)或者這些雙通道對(duì)之間的“寬度”參數(shù)。另外,使用與平衡參數(shù)計(jì)算相同的通道對(duì),也可以得到通道間時(shí)間差或一種“相位提示”。在接收機(jī)一側(cè),這些參數(shù)可以用作平衡參數(shù)的補(bǔ)充或者替代,以生成多通道重構(gòu)。作為另一種選擇,除了由其他參考通道所確定的其他通道間等級(jí)差之外,還可以使用通道間相干性參數(shù)或者甚至通道間時(shí)間差。然而,由于結(jié)合圖10a和圖10b所討論的本發(fā)明的可擴(kuò)展性特征,優(yōu)選的是,對(duì)所有參數(shù)使用相同的通道對(duì),從而在可擴(kuò)展位流中,每個(gè)擴(kuò)展層包括用于重構(gòu)輸出通道的子組的所有參數(shù),它們可以由相應(yīng)擴(kuò)展層生成,如圖10b的表中倒數(shù)第二列所示。當(dāng)僅計(jì)算并向解碼器發(fā)送了各個(gè)通道對(duì)之間的相干性參數(shù)或時(shí)間差參數(shù)時(shí),本發(fā)明是有用的。在這種情況下,當(dāng)執(zhí)行多通道重構(gòu)時(shí),等級(jí)參數(shù)已經(jīng)在解碼器處以供使用。
依據(jù)本發(fā)明方法的特定實(shí)施要求,本發(fā)明的方法可以通過硬件或軟件來實(shí)現(xiàn)。可以使用數(shù)字存儲(chǔ)介質(zhì),具體地講,存儲(chǔ)有電子可讀控制信號(hào)的盤或CD來實(shí)施,其與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,從而執(zhí)行本發(fā)明的方法。因此,一般而言,本發(fā)明是計(jì)算機(jī)程序產(chǎn)品,在機(jī)器可讀載體上存儲(chǔ)了程序代碼,當(dāng)該計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí),所述程序代碼可操作來執(zhí)行本發(fā)明的方法。因此,換句話說,本發(fā)明的方法是具有程序代碼的計(jì)算機(jī)程序,在該計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí),程序代碼執(zhí)行本發(fā)明中的至少一種方法。
權(quán)利要求
1.一種設(shè)備,用于生成多通道信號(hào)的參數(shù)表示中的等級(jí)參數(shù),其中多通道信號(hào)具有多個(gè)原始通道,所述參數(shù)表示包括參數(shù)集,當(dāng)所述參數(shù)集與至少一個(gè)下混通道一起使用時(shí),允許多通道重構(gòu),所述設(shè)備包括等級(jí)參數(shù)計(jì)算器(900),用于計(jì)算等級(jí)參數(shù)(rM),以使由所述等級(jí)參數(shù)加權(quán)的所述至少一個(gè)下混通道的能量等于原始通道的能量之和的方式計(jì)算所述等級(jí)參數(shù);和輸出接口,用于生成輸出數(shù)據(jù),所述輸出數(shù)據(jù)包括所述等級(jí)參數(shù)和所述參數(shù)集,或者所述等級(jí)參數(shù)和所述至少一個(gè)下混通道。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述等級(jí)參數(shù)計(jì)算器(900)計(jì)算原始通道的能量之和與所述至少一個(gè)下混通道的能量之比的量度作為所述等級(jí)參數(shù)。
3.根據(jù)前述任何一項(xiàng)權(quán)利要求所述的設(shè)備,其中所述參數(shù)表示包括所述至少一個(gè)下混通道的多個(gè)頻帶中每一個(gè)頻帶的參數(shù)集,其中所述等級(jí)參數(shù)計(jì)算器(900)計(jì)算每個(gè)頻帶的等級(jí)參數(shù)。
4.根據(jù)前述任何一項(xiàng)權(quán)利要求所述的設(shè)備,其中所述參數(shù)表述包括所述至少一個(gè)下混通道的時(shí)間段序列中時(shí)間段的參數(shù)集,和其中所述等級(jí)參數(shù)計(jì)算器(900)計(jì)算所述至少一個(gè)下混通道的時(shí)間段序列中每個(gè)時(shí)間段的等級(jí)參數(shù)。
5.根據(jù)前述任何一項(xiàng)權(quán)利要求所述的設(shè)備,其中所述輸出接口生成可擴(kuò)展數(shù)據(jù)流,所述可擴(kuò)展數(shù)據(jù)流在較低擴(kuò)展層中包括所述參數(shù)集的第一參數(shù)子組,所述第一參數(shù)子組允許重構(gòu)輸出通道的第一子組。所述可擴(kuò)展數(shù)據(jù)流在較高擴(kuò)展層中包括所述參數(shù)集的第二參數(shù)子組,所述第二參數(shù)子組與所述第一子組一起允許重構(gòu)輸出通道的第二子組,和其中所述輸出接口將所述等級(jí)參數(shù)輸入到所述較低擴(kuò)展層。
6.根據(jù)前述任何一項(xiàng)權(quán)利要求所述的設(shè)備,還包括參數(shù)生成器,所述參數(shù)生成器生成左/右平衡參數(shù)作為第一平衡參數(shù),生成中央平衡參數(shù)作為第二平衡參數(shù),生成正面/背面平衡參數(shù)作為第三參數(shù),生成左后/右后平衡參數(shù)作為第四平衡參數(shù),生成低頻增強(qiáng)平衡參數(shù)作為第五平衡參數(shù)。
7.一種設(shè)備,用于使用具有參數(shù)集的參數(shù)表示,生成原始多通道信號(hào)的重構(gòu)多通道表示,所述原始多通道信號(hào)具有至少三個(gè)原始通道,所述參數(shù)集當(dāng)與至少一個(gè)下混通道一起使用時(shí),允許多通道重構(gòu),所述參數(shù)表示包括等級(jí)參數(shù),對(duì)所述等級(jí)參數(shù)進(jìn)行計(jì)算,使得由所述等級(jí)參數(shù)加權(quán)的所述至少一個(gè)下混通道的能量等于原始通道的能量之和,所述設(shè)備包括等級(jí)校正器(902),用于使用所述等級(jí)參數(shù)對(duì)所述至少一個(gè)下混通道應(yīng)用等級(jí)校正,從而通過使用參數(shù)集中的參數(shù)進(jìn)行上混來得到校正的多通道重構(gòu)。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中所述等級(jí)參數(shù)是通道的能量之比,其中所述等級(jí)校正器(902)使用所述等級(jí)參數(shù)對(duì)所述至少一個(gè)下混通道加權(quán)。
9.一種方法,用于生成多通道信號(hào)的參數(shù)表示中的等級(jí)參數(shù),所述多通道信號(hào)具有多個(gè)原始通道,所述參數(shù)表示包括參數(shù)集,當(dāng)所述參數(shù)集與至少一個(gè)下混通道一起使用時(shí),允許多通道重構(gòu),所述方法包括計(jì)算(900)等級(jí)參數(shù)(rM),對(duì)以使由所述等級(jí)參數(shù)加權(quán)的所述至少一個(gè)下混通道的能量等于所述原始通道的能量之和的方式計(jì)算所述等級(jí)參數(shù);和生成輸出數(shù)據(jù),所述輸出數(shù)據(jù)包括所述等級(jí)參數(shù)和所述參數(shù)集,或者所述等級(jí)參數(shù)和所述至少一個(gè)下混通道。
10.一種方法,用于使用具有參數(shù)集的參數(shù)表示,生成原始多通道信號(hào)的重構(gòu)多通道表示,所述原始多通道信號(hào)具有至少三個(gè)原始通道,所述參數(shù)集當(dāng)與至少一個(gè)下混通道一起使用時(shí),允許多通道重構(gòu),所述參數(shù)表示包括等級(jí)參數(shù),以使由所述等級(jí)參數(shù)加權(quán)的所述至少一個(gè)下混通道的能量等于所述原始通道的能量之和的方式計(jì)算所述等級(jí)參數(shù),所述方法包括使用所述等級(jí)參數(shù)對(duì)所述至少一個(gè)下混通道應(yīng)用等級(jí)校正,從而通過使用所述參數(shù)集中的參數(shù)進(jìn)行上混來得到校正的多通道重構(gòu)。
11.一種計(jì)算機(jī)程序,具有機(jī)器可讀指令,用于在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行根據(jù)權(quán)利要求9或10所述的方法。
12.一種具有參數(shù)集的參數(shù)表示,當(dāng)所述參數(shù)集與至少一個(gè)下混通道一起使用時(shí),允許多通道重構(gòu),所述參數(shù)表示包括等級(jí)參數(shù),以使由所述等級(jí)參數(shù)加權(quán)的所述至少一個(gè)下混通道的能量等于原始通道的能量之和的方式計(jì)算等級(jí)參數(shù)。
13.根據(jù)權(quán)利要求12所述的參數(shù)表示,用于在輸入到根據(jù)權(quán)利要求7所述的設(shè)備時(shí)控制多通道重構(gòu)。
全文摘要
具有多個(gè)原始通道的多通道信號(hào)的參數(shù)表示包括參數(shù)集,當(dāng)參數(shù)集與至少一個(gè)下混通道一起使用時(shí),允許多通道重構(gòu)。計(jì)算額外的等級(jí)參數(shù)(r
文檔編號(hào)G10L19/008GK1930608SQ200580007351
公開日2007年3月14日 申請(qǐng)日期2005年4月12日 優(yōu)先權(quán)日2004年4月16日
發(fā)明者海科·普爾哈根, 拉爾斯·維爾莫斯, 約納斯·恩德格拉德, 約納斯·勒登, 克里斯托弗·薛林 申請(qǐng)人:科丁技術(shù)公司