音頻解碼的制作方法

文檔序號：2830455閱讀：324來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻解碼的制作方法
專利說明音頻解碼本發(fā)明涉及音頻解碼，尤其涉及但不局限于MPEG環(huán)繞信號解碼。
在最近十年，隨著數(shù)字信號表示和通信越來越多地取代模擬表示和通信，各種源信號的數(shù)字編碼也變得日益重要。例如，諸如視頻和音樂之類的媒體內(nèi)容的分發(fā)越來越多地以數(shù)字內(nèi)容編碼為基礎(chǔ)。
此外，最近十年呈現(xiàn)了發(fā)展多聲道音頻、尤其是超越常規(guī)立體聲信號的空間音頻的趨勢。例如，傳統(tǒng)的立體聲錄音只包括兩個(gè)聲道，而現(xiàn)代的先進(jìn)音頻系統(tǒng)則通常使用了五或六個(gè)聲道，就好像流行的5.1環(huán)繞聲系統(tǒng)那樣。這樣做提供了更復(fù)雜的聆聽體驗(yàn)，其中用戶可以被聲源所環(huán)繞。
目前還開發(fā)了各種技術(shù)和標(biāo)準(zhǔn)，以便傳遞此類多聲道信號。例如，代表5.1環(huán)繞系統(tǒng)的六個(gè)離散聲道可以依照諸如先進(jìn)音頻編碼(ACC)或Dolby數(shù)字標(biāo)準(zhǔn)之類的標(biāo)準(zhǔn)來傳送。
但是，眾所周知，為了提供后向兼容性，數(shù)量較多的聲道會(huì)被下混合成數(shù)量較少的聲道，特別地，經(jīng)常采用的用法是將5.1環(huán)繞聲信號下混合成立體聲信號，以便允許傳統(tǒng)(立體聲)解碼器再現(xiàn)立體聲信號，以及允許環(huán)繞聲解碼器再現(xiàn)5.1信號。
這其中的一個(gè)實(shí)例是MPEG2后向兼容編碼方法。多聲道信號下混合成立體聲信號。在輔助數(shù)據(jù)部分中，附加信號將被編碼為多聲道數(shù)據(jù)，由此允許MPEG2多聲道解碼器產(chǎn)生多聲道信號表示。MPEG1解碼器則會(huì)丟棄輔助數(shù)據(jù)，并且由此僅僅解碼立體聲下混合信號。這種應(yīng)用在MPEG2中的編碼方法的主要缺點(diǎn)是附加信號所需要的附加數(shù)據(jù)速率與立體聲信號所需要的數(shù)據(jù)速率處于相同的數(shù)量級。由此，用于將立體聲擴(kuò)展成多聲道音頻的附加比特率將會(huì)很大。
其他那些用于在沒有附加多聲道信息的情況下后向兼容多聲道傳輸?shù)默F(xiàn)有方法通?？梢员碚鳛榫仃囀江h(huán)繞方法。關(guān)于矩陣環(huán)繞方法的實(shí)例包括Dolby Prologic II和Logic-7之類的方法。這些方法的共同原理是其對輸入信號的多個(gè)聲道與適當(dāng)矩陣執(zhí)行矩陣乘法，由此產(chǎn)生聲道數(shù)量較少的輸出信號。特別地，在將環(huán)繞聲道與前置聲道和中置聲道混合之前，矩陣編碼器通常會(huì)對環(huán)繞聲道施加相移處理。
執(zhí)行聲道變換的另一個(gè)原因是編碼效率。舉個(gè)例子，人們已經(jīng)發(fā)現(xiàn)，環(huán)繞聲音頻信號可以編碼成與描述音頻信號空間屬性的參數(shù)比特流相混合的立體聲音頻信號。而解碼器則可以以非常令人滿意的精確度來再現(xiàn)立體聲音頻信號。這樣做可以極大節(jié)約比特率。
我們可以采用若干個(gè)參數(shù)來描述音頻信號的空間屬性。這其中的一個(gè)參數(shù)是聲道間互相關(guān)，例如立體聲信號的左聲道和右聲道之間的互相關(guān)。另一個(gè)參數(shù)是聲道功率比。在所謂的(參數(shù)化)空間音頻編碼器、例如MPEG環(huán)繞編碼器中，這些和其他參數(shù)是從原始音頻信號中提取的，由此將會(huì)產(chǎn)生聲道數(shù)量減少、例如只具有單個(gè)聲道的音頻信號，以及一組描述原始音頻信號空間屬性的參數(shù)。在所謂的(參數(shù)化)空間音頻解碼器中則會(huì)恢復(fù)由所傳送的空間參數(shù)描述的空間屬性。
優(yōu)選地，這種空間音頻編碼使用了包含編碼器和解碼器中的標(biāo)準(zhǔn)單元的級聯(lián)或基于樹形的分層結(jié)構(gòu)。在編碼器中，這些標(biāo)準(zhǔn)單元可以是將聲道下混合成數(shù)量減少的聲道的下混合器，例如2-1、3-1、3-2等等下混合器，而在解碼器中，相應(yīng)的標(biāo)準(zhǔn)單元可以是將聲道分離成數(shù)量更多的聲道的上混合器，例如1-2、2-3上混合器。

圖1描述了一個(gè)依照當(dāng)前由MPEG制定標(biāo)準(zhǔn)并且名為MPEG環(huán)繞的方法來對多聲道音頻信號進(jìn)行編碼的編碼器的實(shí)例。MPEG環(huán)繞系統(tǒng)將多聲道信號編碼成一個(gè)伴有一組參數(shù)的單聲道或立體聲下混合信號。這個(gè)下混合信號可以由傳統(tǒng)的音頻編碼器、例如MP3或AAC編碼器來進(jìn)行編碼。這些參數(shù)則代表了多聲道音頻信號的空間圖像，并且可以采用與傳統(tǒng)音頻流后向兼容的方式而被編碼和嵌入。
在解碼器端，首先解碼的是核心比特流，其結(jié)果是產(chǎn)生了單聲道或立體聲下混合信號。對傳統(tǒng)解碼器、也就是不使用MPEG環(huán)繞解碼的解碼器來說，這些解碼器仍舊可以解碼這個(gè)下混合信號。但是，如果MPEG環(huán)繞解碼器可用，那么空間參數(shù)將被恢復(fù)，由此將會(huì)產(chǎn)生一個(gè)在知覺上與原始的多聲道輸入信號接近的多聲道表示。在圖2中描述了MPEG環(huán)繞解碼器的一個(gè)實(shí)例。
與圖1和圖2所示的基本空間編碼/解碼處理不同，MPEG環(huán)繞系統(tǒng)提供了允許在大量應(yīng)用領(lǐng)域中實(shí)行的豐富特征集合。這其中的一個(gè)最為突出的特征被稱為矩陣兼容性或矩陣式環(huán)繞兼容性。
傳統(tǒng)矩陣環(huán)繞系統(tǒng)的實(shí)例是Dolby Pro Logic I和II以及CircleSurround(圓形環(huán)繞)。這些系統(tǒng)是依照圖3所示方式工作的。多聲道PCM輸入信號變換成所謂的矩陣式下混合信號，其中所述變換通常是使用5(.1)-2矩陣來進(jìn)行的。矩陣環(huán)繞系統(tǒng)所依據(jù)的思想在于在立體聲下混合信號中，前置和環(huán)繞(后置)聲道分別是同相和異相混合的。在某種程度上，這樣做允許在解碼器端執(zhí)行倒置，由此實(shí)現(xiàn)多聲道重建。
在矩陣環(huán)繞系統(tǒng)中，立體聲信號可以用專供立體聲傳輸使用的傳統(tǒng)聲道來傳送。因此，與MPEG環(huán)繞系統(tǒng)相似，矩陣環(huán)繞系統(tǒng)同樣提供了一種后向兼容性。但是，由于立體聲下混合信號具有因?yàn)榫仃嚮旌暇幋a而產(chǎn)生的特定相位屬性，因此，在將這些信號作為立體聲信號而從揚(yáng)聲器或耳機(jī)收聽時(shí)，這些信號通常是不具有很高的聲音質(zhì)量的。
在矩陣環(huán)繞解碼器中，通過應(yīng)用M-N(其中舉例來說，M＝2并且N＝5(.1))矩陣，來產(chǎn)生多聲道PCM輸出信號。但是一般來說，N-M矩陣(N>M)是不可逆的，由此，矩陣環(huán)繞系統(tǒng)通常不能精確重建那些往往具有很明顯的贗象(artefact)的原始多聲道PCM輸出信號。
與這種傳統(tǒng)的矩陣環(huán)繞系統(tǒng)相比，MPEG環(huán)繞中的矩陣環(huán)繞兼容性是通過在MPEG環(huán)繞編碼之后將2×2矩陣應(yīng)用于MPEG環(huán)繞編碼器的頻率子波段中的復(fù)數(shù)采樣值來實(shí)現(xiàn)的。在圖4中描述了這種編碼器的一個(gè)實(shí)例。通常，2×2矩陣是一個(gè)復(fù)數(shù)值矩陣，并且該矩陣的系數(shù)取決于空間參數(shù)。該系統(tǒng)中的空間參數(shù)是時(shí)變和頻變的，由此，這個(gè)2×2矩陣同樣是時(shí)變和頻變的。相應(yīng)地，復(fù)數(shù)矩陣操作通常被應(yīng)用于時(shí)間-頻率矩陣塊(tile)。
通過在MPEG環(huán)繞編碼器中應(yīng)用矩陣環(huán)繞兼容性，可以允許最終得到的立體聲信號與常規(guī)矩陣環(huán)繞編碼器、例如Dolby Pro-LogicTM產(chǎn)生的信號相兼容。這樣做將會(huì)允許傳統(tǒng)解碼器解碼環(huán)繞信號。此外，在兼容的MPEG環(huán)繞解碼器中可以反轉(zhuǎn)矩陣環(huán)繞兼容性的操作，由此允許產(chǎn)生高質(zhì)量的多聲道信號。
矩陣兼容性編碼矩陣可以描述如下其中L，R是常規(guī)的MPEG立體聲下混合信號，LMTX、RMTX是經(jīng)過矩陣環(huán)繞編碼的下混合信號，并且其中hxy是響應(yīng)于多聲道參數(shù)而被確定的復(fù)數(shù)系數(shù)。
通過借助2×2矩陣來提供矩陣兼容的立體聲信號的主要優(yōu)點(diǎn)在于這些矩陣都是可逆的。由此，無論在編碼器上是否使用矩陣兼容的立體聲下混合信號，MPEG環(huán)繞解碼器都可以實(shí)現(xiàn)相同的輸出音頻質(zhì)量。在圖5中描述了兼容的MPEG環(huán)繞解碼器的一個(gè)實(shí)例。
由此，在常規(guī)的MPEG環(huán)繞解碼器中，解碼器端的逆過程可以如下確定這樣一來，由于H可逆，因此矩陣兼容性編碼器的操作也是可逆的。
在MPEG環(huán)繞系統(tǒng)中，包括矩陣兼容性操作在內(nèi)的處理是在頻域中進(jìn)行的。更具體地說，所謂的復(fù)指數(shù)調(diào)制正交鏡像濾波器(QMF)組將被使用，以便將頻率軸分為多個(gè)波段。
在不同方面，這種QMF組可以等同于重疊相加的離散傅里葉變換(DFT)組，或是等同于作為其有效對應(yīng)物的快速傅里葉變換(FFT)。QMF組以及DFT組共同擁有用于信號處理的下列預(yù)期屬性 -頻域表示是過采樣的。由于該屬性，我們可以在不引入混淆失真的情況下應(yīng)用諸如均衡(單個(gè)波段擴(kuò)縮)之類的處理。對臨界采樣表示、例如在AAC中使用的公知的改良離散余弦逆變換(MDCT)來說，這些表示并不遵守這個(gè)屬性。因此，在合成處理之前實(shí)施的MDCT系數(shù)的時(shí)變和頻變修改將會(huì)招致混淆，而這轉(zhuǎn)而會(huì)在輸出信號中導(dǎo)致聽覺贗象。
-頻域表示的值是復(fù)數(shù)的。與實(shí)數(shù)值表示相比，復(fù)數(shù)值表示允許對信號相位進(jìn)行簡單的修改。
雖然在信號處理方面有很多超越臨界采樣實(shí)數(shù)值表示的優(yōu)點(diǎn)，但是與這種表示相比，一個(gè)非常顯著的缺點(diǎn)是計(jì)算復(fù)雜度。對MPEG環(huán)繞解碼器來說，其復(fù)雜度的一個(gè)主要部分歸因于QMF分析和合成濾波器組，以及針對復(fù)數(shù)值信號所進(jìn)行的相應(yīng)處理。
相應(yīng)地，目前還提出了在實(shí)數(shù)值域中為所謂的低功率(LP)解碼器執(zhí)行一部分處理。為此目的，復(fù)數(shù)調(diào)制的濾波器組將會(huì)被實(shí)數(shù)值余弦調(diào)制濾波器組所取代，其后跟隨的是用于較低頻率波段且針對復(fù)數(shù)值域的局部擴(kuò)展。在圖6中描述了這樣一個(gè)濾波器組。
在常規(guī)的操作模式中，MPEG環(huán)繞解碼器將實(shí)數(shù)值處理應(yīng)用于復(fù)數(shù)值的子波段域采樣，對LP來說，該解碼器會(huì)將這些處理應(yīng)用于實(shí)數(shù)值的子波段域采樣。但是，在解碼器中，矩陣兼容性特性包含了相位旋轉(zhuǎn)，以便在頻域中恢復(fù)原始的立體聲下混合信號。這些相位旋轉(zhuǎn)是借助復(fù)數(shù)值處理來完成的。換句話說，矩陣兼容性解碼矩陣H-1本身是復(fù)數(shù)值的，由此可以引入所需要的相位旋轉(zhuǎn)。相應(yīng)地，在該系統(tǒng)中，矩陣環(huán)繞兼容操作在LP頻域表示的實(shí)數(shù)值部分是不可逆的，由此將會(huì)導(dǎo)致解碼質(zhì)量下降。
因此，較為有利的是具有一種改進(jìn)的音頻解碼處理。
相應(yīng)地，本發(fā)明試圖較合適地減輕、緩解或者消除如上所述的一個(gè)或多個(gè)單獨(dú)缺陷或是其組合。
根據(jù)本發(fā)明的第一個(gè)方面，在這里提供了一種音頻解碼器，包括用于接收輸入數(shù)據(jù)的裝置，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，M>N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣，以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；用于為N聲道信號產(chǎn)生頻率子波段的裝置，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；用于確定實(shí)數(shù)值子波段解碼矩陣，以便響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來補(bǔ)償編碼矩陣應(yīng)用的確定裝置；通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號的數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)的裝置。
本發(fā)明可以提供改進(jìn)和/或便利的解碼處理。特別地，本發(fā)明可以極大降低復(fù)雜度，同時(shí)實(shí)現(xiàn)很高的音頻質(zhì)量。舉個(gè)例子，本發(fā)明允許使用實(shí)數(shù)值頻率子波段而在解碼器上至少部分翻轉(zhuǎn)復(fù)數(shù)值子波段矩陣復(fù)數(shù)值子波段矩陣乘法的效果。
作為一個(gè)特定實(shí)例，舉例來說，本發(fā)明可以允許在MPEG環(huán)繞解碼器中使用實(shí)數(shù)值頻率子波段來部分翻轉(zhuǎn)MPEG矩陣兼容的編碼處理。
解碼器可以包括響應(yīng)于下混合數(shù)據(jù)來產(chǎn)生下混合信號的裝置，并且還可以包括響應(yīng)于下混合數(shù)據(jù)和參數(shù)化多聲道數(shù)據(jù)來產(chǎn)生M聲道音頻信號的裝置。在此類實(shí)施例中，本發(fā)明可以至少部分基于實(shí)數(shù)值頻率子波段來產(chǎn)生精確的多聲道音頻信號。
在這里可以為每一個(gè)頻率子波段確定一個(gè)不同的解碼矩陣。
根據(jù)本發(fā)明的一個(gè)可選特征，確定裝置被調(diào)整成確定編碼矩陣的復(fù)數(shù)值子波段逆矩陣，以及響應(yīng)于所述逆矩陣來確定解碼矩陣。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。
根據(jù)本發(fā)明的一個(gè)可選特征，確定裝置被調(diào)整成響應(yīng)于逆矩陣的相應(yīng)矩陣系數(shù)的絕對值來確定解碼矩陣的每一個(gè)實(shí)數(shù)值矩陣系數(shù)。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。解碼矩陣的每一個(gè)實(shí)數(shù)值矩陣系數(shù)都可以僅僅響應(yīng)于逆矩陣中的相應(yīng)矩陣系數(shù)的絕對值來確定，而不用考慮其他任何矩陣系數(shù)。相應(yīng)的矩陣系數(shù)可以是用于相同頻率子波段的逆矩陣中的相同位置的矩陣系數(shù)。
根據(jù)本發(fā)明的一個(gè)可選特征，確定裝置被調(diào)整成將每一個(gè)實(shí)數(shù)值矩陣系數(shù)實(shí)際確定成是逆矩陣中相應(yīng)矩陣系數(shù)的絕對值。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。
根據(jù)本發(fā)明的一個(gè)可選特征，確定裝置被調(diào)整成響應(yīng)于子波段變換矩陣來確定解碼矩陣，其中所述子波段變換矩陣是相應(yīng)解碼矩陣與編碼矩陣的乘積。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。相應(yīng)的解碼和編碼矩陣可以是用于相同頻率子波段的編碼和解碼矩陣。特別地，確定裝置可以被調(diào)整成選擇解碼矩陣的系數(shù)值，以使變換矩陣具有預(yù)期特性。
根據(jù)本發(fā)明的一個(gè)可選特征，確定裝置被調(diào)整成僅僅響應(yīng)于變換矩陣的幅度量度來確定解碼矩陣。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。特別地，確定裝置可以被調(diào)整成在確定解碼矩陣時(shí)忽略相位量度。這樣做可以降低復(fù)雜度，同時(shí)保持很低的可知覺音頻質(zhì)量降級。
根據(jù)本發(fā)明的一個(gè)可選特征，每一個(gè)子波段的變換矩陣是如下給出的其中G是子波段解碼矩陣，H是子波段編碼矩陣，并且確定裝置被調(diào)整成選擇矩陣系數(shù) 以使p12和p21的功率量度滿足一個(gè)判據(jù)。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。通過選擇解碼矩陣，可以產(chǎn)生低于某個(gè)閾值(該閾值可以響應(yīng)于約束條件或其他參數(shù)而被確定)的功率量度，或者舉例來說，該解碼矩陣也可以被選作是產(chǎn)生最小功率量度的解碼矩陣。
根據(jù)本發(fā)明的一個(gè)可選特征，幅度量度是響應(yīng)于

來確定的。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。
根據(jù)本發(fā)明的一個(gè)可選特征，確定裝置還被調(diào)整成在基本等于1的p11和p22的幅度的約束下選擇矩陣系數(shù)。
這樣做可以提供特別有效的實(shí)施方式和/或改進(jìn)的解碼質(zhì)量。
根據(jù)本發(fā)明的一個(gè)可選特征，下混合信號和參數(shù)化多聲道數(shù)據(jù)依照的是MPEG環(huán)繞標(biāo)準(zhǔn)。
本發(fā)明可以為MPEG環(huán)繞兼容信號提供特別有效、復(fù)雜度低和/或音頻質(zhì)量改進(jìn)的解碼處理。
根據(jù)本發(fā)明的一個(gè)可選特征，編碼矩陣是一個(gè)MPEG矩陣環(huán)繞兼容性編碼矩陣，并且第一個(gè)N聲道信號是一個(gè)MPEG矩陣環(huán)繞兼容性信號。
本發(fā)明可以提供特別有效、復(fù)雜度低和/或改進(jìn)的音頻質(zhì)量，尤其可以提供低復(fù)雜度的解碼處理，以便補(bǔ)償在編碼器上執(zhí)行的MPEG矩陣環(huán)繞兼容性操作。
根據(jù)本發(fā)明的另一個(gè)方面，在這里提供了一種音頻解碼方法，該方法包括接收輸入數(shù)據(jù)，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，M>N，由此具有應(yīng)用于頻率子波段的復(fù)數(shù)值子波段編碼矩陣以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；為N聲道信號產(chǎn)生頻率子波段，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣；以及通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)。
根據(jù)本發(fā)明的另一個(gè)方面，在這里提供了一種用于接收N聲道信號的接收機(jī)，該接收機(jī)包括用于接收輸入數(shù)據(jù)的裝置，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，M>N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣，以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；用于為N聲道信號產(chǎn)生頻率子波段的裝置，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；用于確定實(shí)數(shù)值子波段解碼矩陣，以便響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來補(bǔ)償編碼矩陣應(yīng)用的確定裝置；通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)的裝置。
根據(jù)本發(fā)明的另一個(gè)方面，在這里提供了一種用于傳送音頻信號的傳輸系統(tǒng)，該傳輸系統(tǒng)包括發(fā)射機(jī)，其中該發(fā)射機(jī)包括用于產(chǎn)生M聲道音頻信號的N聲道下混合信號的裝置，其中M>N，用于產(chǎn)生與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)的裝置，通過將復(fù)數(shù)值子波段編碼矩陣應(yīng)用于頻率子波段中的N聲道下混合信號來產(chǎn)生第一個(gè)N聲道信號的裝置，用于產(chǎn)生第二個(gè)N聲道信號的裝置，其中所述第二個(gè)N聲道信號包括第一個(gè)N聲道信號和參數(shù)化多聲道數(shù)據(jù)，以及用于將第二個(gè)N聲道信號傳送到接收機(jī)的裝置；以及接收機(jī)，其中該接收機(jī)包括用于接收第二個(gè)N聲道信號的裝置，用于為第一個(gè)N聲道信號產(chǎn)生頻率子波段的裝置，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段，響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣的確定裝置，以及通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與N聲道下混合信號相對應(yīng)的下混合數(shù)據(jù)的裝置。
第二個(gè)N聲道信號可以具有附加的相關(guān)聲道，其中該聲道包括參數(shù)化多聲道數(shù)據(jù)。
根據(jù)本發(fā)明的另一個(gè)方面，在這里提供了一種用于從可伸縮比特流中接收音頻信號的方法，該方法包括接收輸入數(shù)據(jù)，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，并且M>N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣，以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；為N聲道信號產(chǎn)生頻率子波段，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣；以及通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)。
根據(jù)本發(fā)明的另一個(gè)方面，在這里提供了一種用于傳送和接收音頻信號的方法，該方法包括在發(fā)射機(jī)上執(zhí)行下列步驟產(chǎn)生M聲道音頻信號的N聲道下混合信號，其中M>N，產(chǎn)生與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)，通過將復(fù)數(shù)值子波段編碼矩陣應(yīng)用于頻率子波段中的N聲道下混合信號來產(chǎn)生第一個(gè)N聲道信號，產(chǎn)生包含了第一個(gè)N聲道信號和參數(shù)化多聲道數(shù)據(jù)的第二個(gè)N聲道信號，以及將第二個(gè)N聲道信號傳送到接收機(jī)；以及在接收機(jī)上執(zhí)行下列步驟接收第二個(gè)N聲道信號；為N聲道信號產(chǎn)生頻率子波段，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣；以及通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)。
從下文描述的一個(gè)或多個(gè)實(shí)施例中可以清楚了解本發(fā)明的這些和其他方面、特征和優(yōu)點(diǎn)，并且本發(fā)明的這些和其他方面、特征和優(yōu)點(diǎn)是通過參考這些實(shí)施例來進(jìn)行說明的。
現(xiàn)在將參考附圖來舉例描述本發(fā)明的實(shí)施例，其中圖1描述的是依照現(xiàn)有技術(shù)來編碼多聲道音頻信號的編碼器的實(shí)例；圖2描述的是依照現(xiàn)有技術(shù)來解碼多聲道音頻信號的解碼器的實(shí)例；圖3描述的是依照現(xiàn)有技術(shù)的矩陣環(huán)繞編碼/解碼系統(tǒng)的實(shí)例；圖4描述的是依照現(xiàn)有技術(shù)來編碼多聲道音頻信號的編碼器的實(shí)例；圖5描述的是依照現(xiàn)有技術(shù)來解碼多聲道音頻信號的解碼器的實(shí)例；圖6描述的是用于產(chǎn)生復(fù)數(shù)和實(shí)數(shù)值頻率子波段的濾波器組的實(shí)例；圖7描述的是依照本發(fā)明某些實(shí)施例來傳遞音頻信號的傳輸系統(tǒng)；圖8描述的是依照本發(fā)明某些實(shí)施例的解碼器；圖9-14描述的是依照本發(fā)明某些實(shí)施例的解碼器的性能特性；以及圖15描述的是依照本發(fā)明某些實(shí)施例的解碼方法。
以下描述專注的是適用于對包括矩陣環(huán)繞兼容性編碼在內(nèi)的MPEG環(huán)繞編碼信號進(jìn)行解碼的解碼器的本發(fā)明的實(shí)施例。但是應(yīng)該了解，本發(fā)明并不局限于這種應(yīng)用，而是可以應(yīng)用于眾多其他的編碼標(biāo)準(zhǔn)。
圖7描述了一個(gè)依照本發(fā)明某些實(shí)施例來傳遞音頻信號的傳輸系統(tǒng)700。該傳輸系統(tǒng)700包括一個(gè)通過網(wǎng)絡(luò)705而與接收機(jī)703耦合的發(fā)射機(jī)701，特別地，該網(wǎng)絡(luò)可以是因特網(wǎng)。
在具體實(shí)例中，發(fā)射機(jī)701是信號記錄設(shè)備，而接收機(jī)703是信號播放器設(shè)備，但是應(yīng)該了解，在其他實(shí)施例中，發(fā)射機(jī)和接收機(jī)也可以在其他應(yīng)用中使用，并且可以用于其他用途。
在支持信號記錄功能的具體實(shí)施例中，發(fā)射機(jī)701包括一個(gè)接收模擬多聲道信號的數(shù)字化器707，該信號則通過采樣和模數(shù)轉(zhuǎn)換而被轉(zhuǎn)換成數(shù)字PCM(脈沖編碼調(diào)制)多聲道信號。
發(fā)射機(jī)701與圖1的編碼器709相耦合，其中該編碼器依照MPEG環(huán)繞編碼算法來編碼PCM信號，并且該算法包含了用于矩陣環(huán)繞兼容性編碼的功能。舉例來說，編碼器709可以是圖4中的現(xiàn)有技術(shù)的解碼器。特別地，在本實(shí)例中，編碼器709產(chǎn)生的是立體聲MPEG矩陣環(huán)繞兼容的立體聲下混合信號。
由此，編碼器709將會(huì)產(chǎn)生如下給出的信號其中L，R是常規(guī)的MPEG立體聲下混合信號，LMTX、RMTX是編碼器709輸出的經(jīng)過矩陣環(huán)繞兼容編碼的下混合信號。此外，編碼器709產(chǎn)生的信號包括MPEG環(huán)繞編碼處理產(chǎn)生的多聲道參數(shù)化數(shù)據(jù)。另外，hxy是響應(yīng)于多聲道參數(shù)而被確定的復(fù)數(shù)系數(shù)。正如本領(lǐng)域技術(shù)人員很容易了解的那樣，編碼器709執(zhí)行的處理是在復(fù)數(shù)值子波段中使用復(fù)數(shù)操作來執(zhí)行的。
編碼器709與網(wǎng)絡(luò)發(fā)射機(jī)711相耦合，其中該發(fā)射機(jī)接收編碼信號，并且與網(wǎng)絡(luò)705相對接。該網(wǎng)絡(luò)發(fā)射機(jī)711可以通過網(wǎng)絡(luò)705來向接收機(jī)703傳送編碼信號。
接收機(jī)703包括網(wǎng)絡(luò)接口713，其中該網(wǎng)絡(luò)接口與網(wǎng)絡(luò)705相對接，并且被調(diào)整成接收來自發(fā)射機(jī)701的編碼信號。
網(wǎng)絡(luò)接口713與解碼器715相耦合。該解碼器715接收編碼信號，并且依照解碼算法來解碼該信號。在本實(shí)例中，解碼器715重新產(chǎn)生原始的多聲道信號。特別地，解碼器715首先產(chǎn)生與在執(zhí)行MPEG矩陣環(huán)繞兼容操作之前由MPEG環(huán)繞編碼產(chǎn)生的下混合信號相對應(yīng)的已補(bǔ)償?shù)牧Ⅲw聲下混合信號。然后，經(jīng)過解碼的多聲道信號將會(huì)從這個(gè)下混合信號以及接收到的多聲道參數(shù)化數(shù)據(jù)中產(chǎn)生。
在支持信號播放功能的具體實(shí)例中，接收機(jī)703還包括接收來自編碼器715的已解碼多聲道音頻信號并且將其顯示給用戶的信號播放器717。特別地，該信號播放器717可以包括輸出解碼音頻信號所需要的數(shù)模轉(zhuǎn)換器、放大器以及揚(yáng)聲器。
圖8更詳細(xì)地描述了解碼器715。
解碼器715包括用于接收編碼器709所產(chǎn)生的信號的接收機(jī)801。如先前所述，該信號是一個(gè)與下混合信號相對應(yīng)的立體聲信號，其中所述下混合信號是由那些與復(fù)數(shù)值編碼矩陣H相乘的復(fù)數(shù)值頻率表子波段中的復(fù)數(shù)采樣值來處理的。此外，接收信號還包括與下混合信號相對應(yīng)的多聲道參數(shù)化數(shù)據(jù)。特別地，接收信號是一個(gè)具有矩陣環(huán)繞兼容性處理的MPEG環(huán)繞編碼信號。
接收機(jī)801還提供了關(guān)于接收信號的核心解碼處理，以便產(chǎn)生下混合PCM信號。
接收機(jī)801與參數(shù)化數(shù)據(jù)處理器803相耦合，該處理器則從接收到的信號中提取多聲道參數(shù)化數(shù)據(jù)。
接收機(jī)801還與子波段濾波器組805相耦合，其中所述子波段濾波器組將接收到的立體聲信號變換到頻域。特別地，子波段濾波器組805產(chǎn)生多個(gè)頻率子波段。這其中的至少某些頻率子波段是實(shí)數(shù)值頻率子波段。特別地，該子波段濾波器組805可以對應(yīng)于圖6所示的功能。由此，子波段濾波器組805可以產(chǎn)生K個(gè)復(fù)數(shù)值子波段以及M-K個(gè)實(shí)數(shù)值子波段。實(shí)數(shù)值子波段通常是較高頻率子波段，例如高于2kHz的子波段。通過使用實(shí)數(shù)值子波段，可以極大便利子波段生成處理以及在這些子波段中的采樣上執(zhí)行的操作。由此，在解碼器715中，M-K個(gè)子波段是作為實(shí)數(shù)值數(shù)據(jù)和操作而不是復(fù)數(shù)值數(shù)據(jù)和操作來處理的，由此將會(huì)極大地降低復(fù)雜性和成本。
子波段濾波器組805與補(bǔ)償處理器807相耦合，其中該處理器產(chǎn)生的是與下混合信號相對應(yīng)的下混合數(shù)據(jù)。特別地，補(bǔ)償處理器807是通過嘗試反轉(zhuǎn)編碼器709的頻率子波段中的編碼矩陣H的乘積來補(bǔ)償矩陣環(huán)繞兼容性操作的。這種補(bǔ)償是通過將子波段的數(shù)據(jù)值與子波段解碼矩陣G相乘來執(zhí)行的。但是，與編碼器709上的處理相比，解碼器715的實(shí)數(shù)值子波段中的矩陣乘法僅僅是在實(shí)域中執(zhí)行的。由此，不但采樣值是實(shí)數(shù)值采樣，而且解碼矩陣G的矩陣系數(shù)同樣也是實(shí)數(shù)值系數(shù)。
補(bǔ)償處理器807與矩陣處理器809相耦合，其中該矩陣處理器確定的是在子波段中應(yīng)用的解碼矩陣。對M個(gè)復(fù)數(shù)值子波段來說，解碼矩陣G可以簡單地作為相同子波段中的編碼矩陣H的逆矩陣來確定。但是，對實(shí)數(shù)值子波段來說，矩陣處理器809將會(huì)確定實(shí)數(shù)值矩陣系數(shù)，并且該系數(shù)可以為編碼矩陣操作提供有效補(bǔ)償。
由此，補(bǔ)償處理器807的輸出對應(yīng)的是MPEG環(huán)繞編碼下混合信號的子波段表示。相應(yīng)地，矩陣環(huán)繞兼容性操作的效果可以極大降低或消除。
補(bǔ)償處理器807與合成子波段濾波器組811相耦合，其中所述合成子波段濾波器組從子波段表示中產(chǎn)生時(shí)域PCM MPEG環(huán)繞解碼器下混合信號。由此，在具體實(shí)例中，合成子波段濾波器組811會(huì)在將信號反向轉(zhuǎn)換到時(shí)域的過程中形成子波段濾波器組805的對應(yīng)物。
合成子波段濾波器組811被饋送到多聲道解碼器813，其中所述解碼器還與參數(shù)化數(shù)據(jù)處理器803相耦合。所述多聲道解碼器813接收時(shí)域PCM下混合信號和多聲道參數(shù)化數(shù)據(jù)，并且產(chǎn)生原始的多聲道信號。
在本實(shí)例中，合成子波段濾波器組811將執(zhí)行了矩陣操作的子波段信號變換到時(shí)域。由此，多聲道解碼器813接收一個(gè)MPEG環(huán)繞編碼信號，該信號可以與在解碼器上未應(yīng)用矩陣環(huán)繞兼容操作時(shí)接收的信號相比較。這樣一來，相同的MPEG多聲道解碼算法可以用于矩陣環(huán)繞兼容信號以及非矩陣環(huán)繞兼容信號。但是，在其他實(shí)施例中，多聲道解碼器813可以直接作用于子波段采樣，隨后利用補(bǔ)償處理器807執(zhí)行補(bǔ)償。在這種情況下，合成子波段濾波器組811可以被忽略，或者合成子波段濾波器組811的某些功能可以與多聲道解碼器813整合。
由此，為了降低復(fù)雜度，較為優(yōu)選的通常是在向多聲道解碼器813提供已補(bǔ)償信號的時(shí)候停留在子波段域。由此，在這里可以避免合成子波段濾波器組811和分析濾波器組的復(fù)雜度，其中該分析濾波器組是多聲道解碼器813的一部分。
實(shí)際上，如果可能的話，通常較為優(yōu)選的是不在頻域與時(shí)域之間往返移動(dòng)，因?yàn)檫@樣做的計(jì)算成本將會(huì)很高。由此，在依照本發(fā)明某些實(shí)施例的解碼器中，在將信號轉(zhuǎn)換到子波段(頻率)域時(shí)(這轉(zhuǎn)而是通過解碼核心比特流以及將濾波器組應(yīng)用于所得到的PCM信號來確定的)，在補(bǔ)償處理器807中將會(huì)應(yīng)用矩陣環(huán)繞反轉(zhuǎn)處理(如果適合的話，也就是說，如果在比特流中用信號通告的話)，然后，得到的子波段域信號被直接用于重建多聲道(子波段域)信號。最后，合成濾波器組將被應(yīng)用，以便獲取時(shí)域多聲道信號。
由此，在圖7的系統(tǒng)中，編碼器709可以產(chǎn)生矩陣環(huán)繞兼容信號，并且該信號可以由Dolby Pro LogicTM解碼器之類的傳統(tǒng)矩陣環(huán)繞解碼器來解碼。雖然這樣做需要通過矩陣環(huán)繞兼容性操作來使原始MPEG環(huán)繞編碼下混合信號失真，但在MPEG多聲道解碼器中可以有效移除這種操作，由此允許使用參數(shù)化數(shù)據(jù)來精確表示那些將要產(chǎn)生的原始多聲道。
此外，解碼器715允許補(bǔ)償那些將要在實(shí)數(shù)值頻率子波段中執(zhí)行的矩陣環(huán)繞兼容性操作，而不需要復(fù)數(shù)值頻率子波段，由此極大降低了解碼器715的復(fù)雜度，同時(shí)還實(shí)現(xiàn)了很高的音頻質(zhì)量。
在下文中將會(huì)描述用于為解碼矩陣確定適當(dāng)矩陣系數(shù)的實(shí)例。
編碼器709通過在每個(gè)子波段中應(yīng)用以下復(fù)數(shù)值編碼矩陣來執(zhí)行矩陣環(huán)繞兼容性操作(可以理解的是，每一個(gè)子波段都具有不同的編碼矩陣) 其中L、R是常規(guī)的立體聲下混合信號，并且LMTX、RMTX是矩陣環(huán)繞編碼下混合信號。而編碼器矩陣H則是如下給出的其中w1和w2取決于MPEG環(huán)繞編碼處理產(chǎn)生的空間參數(shù)。特別地其中w1，t和w2，t是非歸一化加權(quán)，并且它們是如下定義的其中CLD1和CLDr分別代表的是左前、左環(huán)繞和右前、右環(huán)繞聲道配對的聲道等級差值(以dB為單位)。c1，MTX和c2，MTX是作為預(yù)測系數(shù)c1和c2的函數(shù)的矩陣系數(shù)，并且所述預(yù)測系數(shù)c1和c2被用于在解碼器中以如下方式從左LDMX和右RDMX下混合信號中推導(dǎo)中間的左L、中C和右R信號 c1，MTX和c2，MTX分別是如下確定的其中x＝{0，1}。
作為替換，MPEG環(huán)繞解碼器支持這樣一種模式，在該模式中，系數(shù)c1和c2分別代表的是左與左中以及右與右中的功率比。這種情況下將會(huì)為c1，MTX和c2，MTX應(yīng)用不同的函數(shù)。
由此，對每一個(gè)時(shí)間/頻率矩陣塊來說，復(fù)數(shù)值編碼矩陣H被應(yīng)用于復(fù)數(shù)采樣值。如果前置信號在原始的多聲道輸入信號占據(jù)統(tǒng)治地位，那么加權(quán)w1和w2將會(huì)接近于零。這樣一來，矩陣環(huán)繞下混合信號將會(huì)接近于輸入的立體聲下混合信號。如果環(huán)繞(后置)信號在原始的多聲道輸入信號中占據(jù)統(tǒng)治地位，那么加權(quán)w1和w2將會(huì)接近于1。由此，矩陣環(huán)繞下混合信號將會(huì)包含由MPEG環(huán)繞編碼器提供的原始立體聲下混合信號的高度異相版本。
借助2×2矩陣來提供矩陣兼容立體聲信號的主要優(yōu)點(diǎn)在于這些矩陣是可逆的。由此，無論編碼器是否使用矩陣兼容的立體聲下混合信號，MPEG環(huán)繞解碼器都可以實(shí)現(xiàn)相同的輸出音頻質(zhì)量。
由此，在所有頻率子波段都是復(fù)數(shù)值子波段的MPEG環(huán)繞解碼器中(例如使用復(fù)數(shù)調(diào)制的QMF組)，解碼器端的逆處理是如下給出的其中并且其中 N＝h11h22-h12h21 但是，這種逆操作需要使用復(fù)數(shù)值，由此將無法在圖7的解碼器715中使用，這是因?yàn)樵摻獯a器(至少部分)使用了實(shí)數(shù)值子波段。相應(yīng)地，矩陣處理器809產(chǎn)生一個(gè)實(shí)數(shù)值解碼矩陣，并且該矩陣可以用于顯著減小編碼矩陣的影響。
在每一個(gè)子波段中，編碼和解碼矩陣的整體影響可以用如下給出的變換矩陣P來表示其中H代表的是編碼器矩陣，并且G代表的是解碼器矩陣。
理論上，G＝H-1，由此P＝H-1·H＝I，即單位矩陣。由于編碼器矩陣H的加權(quán)hxy全都是復(fù)數(shù)值，因此，在解碼器中不能為實(shí)數(shù)值子波段反轉(zhuǎn)該矩陣。
通常，實(shí)數(shù)值子波段處于較高的頻率，例如2kHz以上的子波段。在這些頻率上，相位關(guān)系在知覺方面的重要性是很小的，由此，矩陣處理器809將會(huì)確定具有適當(dāng)幅度(功率)特性的解碼矩陣系數(shù)，而不會(huì)考慮相位特性。特別地，矩陣處理器809可以確定實(shí)數(shù)值系數(shù)，在假設(shè)或者限定|p11|≈1和|p22|≈1的情況下，該系數(shù)將會(huì)產(chǎn)生低幅度或低功率值的串?dāng)_項(xiàng)p12和p21。
在某些實(shí)施例中，矩陣處理器809可以確定編碼矩陣的復(fù)數(shù)值子波段逆矩陣H-1，然后則可以從這個(gè)矩陣的矩陣系數(shù)中確定實(shí)數(shù)值解碼矩陣G。特別地，G的每一個(gè)系數(shù)都可以從處于相同位置的H-1的系數(shù)中確定。例如，實(shí)數(shù)值系數(shù)可以從H-1的相應(yīng)系數(shù)的幅度值中確定。實(shí)際上，在某些實(shí)施例中，矩陣處理器可以確定H-1的系數(shù)，由此可以確定G的系數(shù)，以此作為逆矩陣H-1中的相應(yīng)矩陣系數(shù)的絕對值。
由此，矩陣處理器809可以將確定為其中 N＝h11h22-h12h21 如所示，在w1＝w2＝0和w1＝w2＝1的特殊情形中，這種解決方案完美滿足了上述約束條件((|p11|＝|p22|＝1和|p12|＝|p21|＝0)。
圖9描述了用于該解決方案的變換矩陣主項(xiàng)(10log10|p11|2)的幅度。圖10描述了圖11的p11與串?dāng)_項(xiàng)(10log10|p21|2)相位角。
特別地，圖9以dB為單位顯示了作為w1和w2的函數(shù)的主矩陣項(xiàng)p11相對于理想值|p11|＝1的幅度偏差?？梢杂^察到的是，與理想情況的最大偏差小于1dB。圖10顯示了作為w1和w2的函數(shù)的p11的角度?？梢詮呐c理想復(fù)數(shù)值情形相對的差值中預(yù)期，相位差值高達(dá)90度。圖11顯示了作為加權(quán)w1和w2的函數(shù)并且以dB為單位測量的串?dāng)_矩陣項(xiàng)P21的幅度。應(yīng)該指出的是，通過互換w1和w2，也可以獲取其他變換矩陣元素。
在某些實(shí)施例中，矩陣處理器809可以響應(yīng)于子波段變換矩陣P＝G·H來為子波段確定解碼矩陣G。特別地，矩陣處理器可以選擇G的系數(shù)值，以便為P實(shí)現(xiàn)指定特性。
同樣，由于用于實(shí)數(shù)值子波段的相位值往往具有很低的感知加權(quán)，因此，例示解碼器715僅僅考慮了P的幅度特性。高質(zhì)量性能可以由矩陣處理器809來實(shí)現(xiàn)，其中該處理器選擇解碼矩陣系數(shù)，以使p12和p21的功率量度滿足某個(gè)判據(jù)——例如最小化功率量度或者功率量度低于指定判據(jù)。舉個(gè)例子，矩陣處理器809可以搜索一定范圍的可能實(shí)數(shù)值系數(shù)，并且選擇那些為p12和p21產(chǎn)生最低功率量度的系數(shù)。此外，這種評估還有可能遭遇到其他約束條件，例如p11和p12基本等于1(例如介于0.9與1.1之間) 在某些實(shí)施例中，矩陣處理器809可以執(zhí)行某種數(shù)學(xué)算法，以便為解碼方法確定合適的實(shí)數(shù)系數(shù)值。這其中的一個(gè)具體實(shí)例是在下文中描述的，其中該算法試圖在|p11|1＝1和|p22|2＝1的約束下最小化總體串?dāng)_|p12|2+|p21|2。
這個(gè)問題可以通過一種標(biāo)準(zhǔn)的多元數(shù)學(xué)分析工具來解決。特別地，較為適合的是使用拉格朗日乘數(shù)方法，其中對G的每一個(gè)行矢量v來說，該方法會(huì)變換成一種形式為vA＝λvB的矩陣本征值問題，其具有由二次形式q給出的歸一化需求q(v)＝1。矩陣A和B以及二次形式q取決于復(fù)數(shù)矩陣H的條目。
在下文中給出了關(guān)于v＝[g11 g12]的解決方案。在以下的解決方案中，通過互換變量w1和w2來求解v＝[g21 g22]的處理是沒有意義的。拉格朗日矩陣A和B是如下定義的其中q1和q2被定義為本征值則是如下發(fā)現(xiàn)的 det(A-λB)＝0，由此將會(huì)產(chǎn)生二次多項(xiàng)式的根其中現(xiàn)在可以確定兩個(gè)候選解 (A-λ1，2B)v1，2＝0 最終解是通過v＝ci·vi確定的，其中i是1或2，由此|p11|2＝1并且具有最小串?dāng)_。首先，ci是如下計(jì)算的然后，這兩個(gè)解的串?dāng)_|p12|2是如下計(jì)算的產(chǎn)生最小串?dāng)_的索引i將會(huì)給出v＝ci·vi。在沒有進(jìn)一步論證的情況下可以聲明，索引i始終等于2，而與變量w1和w2無關(guān)。
出于完整性考慮，在下文中給出了依照分析等式且關(guān)于G的完整解。在這里定義了以下變量 s＝q1+q2，然后，變量b是如下計(jì)算的用于矩陣G中的兩個(gè)行的兩個(gè)根rα和rβ是如下計(jì)算的然后，非伸縮解vtemp，1和vtemp，2可以被確定成是歸一化常數(shù)c是如下計(jì)算的最后，矩陣G是如下給出的圖12、13和14描述的是關(guān)于該解決方案的性能。圖12以dB為單位顯示了作為w1和w2的函數(shù)，主矩陣項(xiàng)p11相對于理想值|p11|＝1的偏差?？梢杂^察到的是，由于為該解決方案設(shè)置了約束條件，因此，該幅度始終等于理想值|p11|＝1。
圖13顯示了作為w1和w2的函數(shù)的p11的角度。應(yīng)該指出的是，由于所有實(shí)際解決方案都會(huì)提出約束條件，因此，這里的相位差將會(huì)高達(dá)90度。
圖14顯示了作為加權(quán)w1和w2的函數(shù)并且以dB為單位測得的串?dāng)_矩陣項(xiàng)p21的幅度。
如圖所示，這種將解碼矩陣系數(shù)設(shè)置為逆編碼矩陣系數(shù)絕對值的解決方案在主項(xiàng)增益和串?dāng)_抑制方面與更復(fù)雜的串?dāng)_最小化方法僅僅相差+/-1dB。
圖15描述的是一種根據(jù)本發(fā)明某些實(shí)施例的音頻解碼方法。
在步驟1501，解碼器接收輸入數(shù)據(jù)，其中該輸入信號包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，M>N，由此具有應(yīng)用于頻率子波段的復(fù)數(shù)值子波段編碼矩陣以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)。
在步驟1501之后跟隨的是步驟1503，在該步驟中，將會(huì)為N聲道信號產(chǎn)生頻率子波段。其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段。
在步驟1503之后跟隨的是步驟1505，在該步驟中，將會(huì)響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣。
在步驟1505之后跟隨的是步驟1507，在該步驟中，將會(huì)通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)。
應(yīng)該了解的是，為了清楚起見，在以上描述中是通過參考不同的功能單元和處理器來描述本發(fā)明的實(shí)施例的。然而非常明顯的是，在不同功能單元或處理器之間可以使用任何適當(dāng)?shù)墓δ芊植挤绞?，而不?huì)有損于本發(fā)明。例如，被描述成由獨(dú)立處理器或控制器執(zhí)行的功能可以由同一個(gè)處理器或控制器來執(zhí)行。因此，針對特定功能單元所做的參考僅僅被視為是對用于提供所描述的功能的適當(dāng)裝置的參考，而并未表示嚴(yán)格的邏輯或物理結(jié)構(gòu)或組織。
本發(fā)明可以采用包括硬件、軟件、固件或其任何組合在內(nèi)的任何適當(dāng)形式來實(shí)施。作為選擇，本發(fā)明至少部分可以作為在一個(gè)或多個(gè)數(shù)據(jù)處理器和/或數(shù)字信號處理器上運(yùn)行的計(jì)算機(jī)軟件來實(shí)施。本發(fā)明實(shí)施例的部件和組件可以在物理、功能和邏輯上以任何適當(dāng)?shù)姆绞綄?shí)施。實(shí)際上，該功能既可以在單個(gè)單元中實(shí)施，也可以在多個(gè)單元中實(shí)施，還可以作為其他功能單元的一部分來實(shí)施。同樣，本發(fā)明既可以在單個(gè)單元中實(shí)施，也可以在物理和功能上被分布于不同的單元和處理器之間。
雖然在這里結(jié)合某些實(shí)施例而對本發(fā)明進(jìn)行了描述，但是本發(fā)明并不局限于這里闡述的具體形式。相反，本發(fā)明的范圍僅僅受附帶的權(quán)利要求的限制。此外，雖然某個(gè)特征可以顯現(xiàn)成是結(jié)合特定實(shí)施例來描述的，但是本領(lǐng)域技術(shù)人員將會(huì)認(rèn)識到，所描述的實(shí)施例的各種特征可以依照本發(fā)明來組合。在權(quán)利要求中，術(shù)語“包括”并未排除其他部件或步驟的存在。
此外，雖然單獨(dú)列舉了多個(gè)裝置、部件或方法步驟，但是這些裝置、部件或方法步驟是可以由單個(gè)單元或處理器來實(shí)現(xiàn)的。此外，雖然在不同實(shí)施例中可以包含單個(gè)特征，但是這些特征有可能是以很有利的方式組合在一起的，如果是包含在不同權(quán)利要求中的，那么這并不意味著特征無法組合和/或特征組合無益。此外，如果將某個(gè)特征包含在一類權(quán)利要求中，那么這并不意味著針對這個(gè)類別的限制，相反，這表明該特征同樣可以酌情應(yīng)用于其他權(quán)利要求類別。此外，這些特征在權(quán)利要求中的順序并未暗指這些特征工作時(shí)所要依照的任何具體順序，特別地，單個(gè)步驟在方法權(quán)利要求中的順序并不暗指這些步驟必須依照該順序執(zhí)行。相反，這些步驟可以按照任何適當(dāng)?shù)捻樞騺韴?zhí)行。此外，單數(shù)標(biāo)引并未排除復(fù)數(shù)。由此，標(biāo)引“一”、“一個(gè)”、“第一”、“第二”等等并不排除復(fù)數(shù)個(gè)數(shù)。權(quán)利要求中的參考符號僅僅是作為澄清實(shí)例提供的，并且這些參考符號不應(yīng)該被解釋成是對權(quán)利要求的范圍進(jìn)行限制。
權(quán)利要求
1.一種音頻解碼器(715)，包括
用于接收輸入數(shù)據(jù)的裝置(801)，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，并且M>N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣，以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；
用于為N聲道信號產(chǎn)生頻率子波段的裝置(805)，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；
響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定實(shí)數(shù)值子波段解碼矩陣以補(bǔ)償編碼矩陣應(yīng)用的確定裝置(809)；以及
通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)的裝置(807)。
2.權(quán)利要求1的音頻解碼器(715)，其中確定裝置(809)被調(diào)整成確定編碼矩陣的復(fù)數(shù)值子波段逆矩陣，以及響應(yīng)于所述逆矩陣來確定解碼矩陣。
3.權(quán)利要求2的音頻解碼器(715)，其中確定裝置(809)被調(diào)整成響應(yīng)于逆矩陣的相應(yīng)矩陣系數(shù)絕對值來確定解碼矩陣的每一個(gè)實(shí)數(shù)值矩陣系數(shù)。
4.權(quán)利要求3的音頻解碼器(715)，其中確定裝置(809)被調(diào)整成將每一個(gè)實(shí)數(shù)值矩陣系數(shù)實(shí)際確定成是逆矩陣中相應(yīng)矩陣系數(shù)的絕對值。
5.權(quán)利要求1的音頻解碼器(715)，其中確定裝置(809)被調(diào)整成響應(yīng)于子波段變換矩陣來確定解碼矩陣，其中所述子波段變換矩陣是相應(yīng)解碼矩陣與編碼矩陣的乘積。
6.權(quán)利要求5的音頻解碼器(715)，其中確定裝置(809)被調(diào)整成僅僅響應(yīng)于變換矩陣的幅度量度來確定解碼矩陣。
7.權(quán)利要求5的音頻解碼器(715)，其中每一個(gè)子波段的變換矩陣是如下給出的
其中G是子波段解碼矩陣，H是子波段編碼矩陣，并且確定裝置被調(diào)整成選擇矩陣系數(shù)
以使p12和p21的功率量度滿足判據(jù)。
8.權(quán)利要求7的音頻解碼器(715)，其中幅度量度是響應(yīng)于來確定的。
9.權(quán)利要求7的音頻解碼器(715)，其中確定裝置(809)還被調(diào)整成在p11和p22的幅度基本等于1的約束下選擇矩陣系數(shù)。
10、權(quán)利要求1的音頻解碼器，其中下混合信號和參數(shù)化多聲道數(shù)據(jù)依照的是MPEG環(huán)繞標(biāo)準(zhǔn)。
11.權(quán)利要求1的音頻解碼器(715)，其中編碼矩陣是一個(gè)MPEG矩陣環(huán)繞兼容性編碼矩陣，并且第一個(gè)N聲道信號是一個(gè)MPEG矩陣環(huán)繞兼容信號。
12.一種音頻解碼方法，該方法包括
接收(1501)輸入數(shù)據(jù)，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，M>N，由此具有應(yīng)用于頻率子波段的復(fù)數(shù)值子波段編碼矩陣以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；
為N聲道信號產(chǎn)生(1503)頻率子波段，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；
響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定(1505)用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣；以及
通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生(1507)與下混合信號相對應(yīng)的下混合數(shù)據(jù)。
13.一種用于接收N聲道信號的接收機(jī)(703)，該接收機(jī)(703)包括
用于接收輸入數(shù)據(jù)的裝置(801)，其中該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，M>N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；
用于為N聲道信號產(chǎn)生頻率子波段的裝置(805)，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；
用于響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定實(shí)數(shù)值子波段解碼矩陣以補(bǔ)償編碼矩陣應(yīng)用的確定裝置(809)；以及
通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)的裝置(807)。
14.一種用于傳送音頻信號的傳輸系統(tǒng)(700)，該傳輸系統(tǒng)包括
發(fā)射機(jī)(701)，該發(fā)射機(jī)包括
用于產(chǎn)生M聲道音頻信號的N聲道下混合信號的裝置(709)，其中M>N，
用于產(chǎn)生與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)的裝置(709)，
通過將復(fù)數(shù)值子波段編碼矩陣應(yīng)用于頻率子波段中的N聲道下混合信號來產(chǎn)生第一個(gè)N聲道信號的裝置(709)，
用于產(chǎn)生第二個(gè)N聲道信號的裝置(709)，所述第二個(gè)N聲道信號包括第一個(gè)N聲道信號和參數(shù)化多聲道數(shù)據(jù)，以及
用于將第二個(gè)N聲道信號傳送到接收機(jī)的裝置(711)；
以及
接收機(jī)(703)，該接收機(jī)包括
用于接收第二個(gè)N聲道信號的裝置(801)，
用于為第一個(gè)N聲道信號產(chǎn)生頻率子波段的裝置(805)，至少某些頻率子波段是實(shí)數(shù)值頻率子波段，
響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣的確定裝置(809)，以及
通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)的裝置(807)。
15.一種用于接收音頻信號的方法，該方法包括
接收(1501)輸入數(shù)據(jù)，該輸入數(shù)據(jù)包括與M聲道音頻信號的下混合信號相對應(yīng)的N聲道信號，并且M>N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣以及與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)；
為N聲道信號產(chǎn)生(1503)頻率子波段，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；
響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定(1505)用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣；以及
通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生(1507)與下混合信號相對應(yīng)的下混合數(shù)據(jù)。
16.一種用于傳送和接收音頻信號的方法，該方法包括
在發(fā)射機(jī)(701)上執(zhí)行下列步驟
產(chǎn)生M聲道音頻信號的N聲道下混合信號，其中M>N，
產(chǎn)生與下混合信號相關(guān)聯(lián)的參數(shù)化多聲道數(shù)據(jù)，
通過將復(fù)數(shù)值子波段編碼矩陣應(yīng)用于頻率子波段中的N聲道下混合信號來產(chǎn)生第一個(gè)N聲道信號，
產(chǎn)生包含了第一個(gè)N聲道信號和參數(shù)化多聲道數(shù)據(jù)的第二個(gè)N聲道信號，以及
將第二個(gè)N聲道信號傳送到接收機(jī)(703)；
以及
在接收機(jī)(703)上執(zhí)行下列步驟
接收(1501)第二個(gè)N聲道信號；
為第一個(gè)N聲道信號產(chǎn)生(1503)頻率子波段，其中至少某些頻率子波段是實(shí)數(shù)值頻率子波段；
響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定(1505)用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣；以及
通過對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法來產(chǎn)生(1507)與N聲道下混合信號相對應(yīng)的下混合數(shù)據(jù)。
17.一種用于執(zhí)行權(quán)利要求12、15、16中任一權(quán)利要求的方法的計(jì)算機(jī)程序產(chǎn)品。
18.一種音頻播放設(shè)備(703)，包括根據(jù)權(quán)利要求1的解碼器(715)。
全文摘要
一種音頻解碼器，包括用于接收輸入數(shù)據(jù)的接收機(jī)(801)，其中該輸入數(shù)據(jù)包括與M聲道信號的下混合信號相對應(yīng)的N聲道信號，并且M＞N，由此具有在頻率子波段中應(yīng)用的復(fù)數(shù)值子波段編碼矩陣以及參數(shù)化多聲道數(shù)據(jù)。子波段濾波器組(805)為N聲道信號產(chǎn)生實(shí)數(shù)值頻率子波段。矩陣處理器(809)響應(yīng)于參數(shù)化多聲道數(shù)據(jù)來確定用于補(bǔ)償編碼矩陣應(yīng)用的實(shí)數(shù)值子波段解碼矩陣。補(bǔ)償處理器(807)則對實(shí)數(shù)值子波段解碼矩陣和至少某些實(shí)數(shù)值頻率子波段中的N聲道信號數(shù)據(jù)執(zhí)行矩陣乘法，以便產(chǎn)生與下混合信號相對應(yīng)的下混合數(shù)據(jù)。下混合數(shù)據(jù)可以用于重新產(chǎn)生下混合信號以及M聲道音頻信號。解碼器可以使用實(shí)數(shù)值頻率子波段來補(bǔ)償在編碼器上執(zhí)行的MPEG矩陣環(huán)繞兼容性操作。
文檔編號G10L19/00GK101484936SQ200780012271
公開日2009年7月15日申請日期2007年3月23日優(yōu)先權(quán)日2006年3月29日
發(fā)明者L·F·威爾莫斯, E·G·P·舒杰斯申請人:皇家飛利浦電子股份有限公司, 多爾比瑞典有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：E.G.P.舒杰斯;L.F.威爾莫斯
技術(shù)所有人：多爾比瑞典有限公司;皇家飛利浦電子股份有限公司
我是此專利的發(fā)明人

上一篇：音頻編碼和解碼中的激勵(lì)處理的制作方法
上一篇：用于弦樂器的裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

mp3音頻解碼芯片相關(guān)技術(shù)

音頻解碼芯片排名相關(guān)技術(shù)

音頻編碼相關(guān)技術(shù)

聲音解碼相關(guān)技術(shù)

音頻解碼芯片相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻解碼的制作方法