立體聲兼容的多聲道音頻編碼的制作方法

文檔序號(hào)：2829214閱讀：317來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：立體聲兼容的多聲道音頻編碼的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及多聲道音頻編碼，具體涉及產(chǎn)生和使用完全向后兼容參數(shù)立體聲重放環(huán)境的多聲道音頻信號(hào)的參數(shù)表示的構(gòu)思。
本發(fā)明涉及使用空間音頻參數(shù)以與使用參數(shù)立體聲參數(shù)編碼2聲道立體聲信號(hào)相兼容的方式編碼音頻信號(hào)的多聲道表示。本發(fā)明教導(dǎo)以向后兼容的方式有效地編碼空間音頻參數(shù)和參數(shù)立體聲參數(shù)以及將編碼的參數(shù)嵌入到比特流中的新穎方法。特別是本發(fā)明旨在最小化向后兼容比特流中的參數(shù)立體聲和空間音頻參數(shù)的總比特率而不損害被解碼立體聲或多聲道音頻信號(hào)的質(zhì)量。當(dāng)稍微損害的被解碼立體聲信號(hào)的質(zhì)量可接受時(shí)，甚至能夠進(jìn)一步減小總比特率。
近來(lái)，多聲道音頻再現(xiàn)技術(shù)正變得越來(lái)越重要。為了有效發(fā)送具有5個(gè)或更多獨(dú)立聲道的多聲道音頻信號(hào)，已經(jīng)開發(fā)出壓縮立體聲或多聲道信號(hào)的若干方式。用于參數(shù)編碼多聲道音頻信號(hào)(參數(shù)立體聲(PS)，雙耳提示編碼(BCC)等等)的最新方法通過(guò)下混信號(hào)(可能是單聲道的或包括若干信道)和參數(shù)補(bǔ)充信息(也被稱為“空間提示”)表示多聲道音頻信號(hào)，表征它的感知的空間聲級(jí)。
多聲道編碼設(shè)備通常接收至少兩個(gè)聲道作為輸入，并輸出一個(gè)或更多載波聲道和參數(shù)數(shù)據(jù)。這樣導(dǎo)出該參數(shù)數(shù)據(jù)，以便在解碼器中能夠計(jì)算原始多聲道信號(hào)的近似。通常，所述載波聲道將會(huì)包括提供基礎(chǔ)信號(hào)的相對(duì)精細(xì)的表示的子頻帶采樣、頻譜系數(shù)、時(shí)域采樣等等，而參數(shù)數(shù)據(jù)不包括頻譜系數(shù)的這些采樣但是包括控制某種重構(gòu)算法的控制參數(shù)。這種重構(gòu)可以包括通過(guò)相乘進(jìn)行加權(quán)、時(shí)移、頻移、相移等等。因此，所述參數(shù)數(shù)據(jù)只包括信號(hào)或相關(guān)聲道的相對(duì)粗略的表示。
在許多公開文獻(xiàn)中描述了這種雙耳提示編碼(BCC)技術(shù)，如“Binaural Cue Coding applied to Stereo and Multi-Channel AudioCompression”，C.Faller，F(xiàn).Baumgarte，AES convention paper 5574，2002年5月，慕尼黑；作者均為C.Faller和F.Baumgarte的2個(gè)ICASSP出版物“Estimation of auditory spatial cues for binaural cuecoding”和“Binaural cue codinga normal and efficient representationof spatial audio”，Orlando，F(xiàn)L，2002年5月。
在BCC編碼中，使用基于DFT(離散傅里葉變換)的具有疊加窗口的變換將許多音頻輸入聲道轉(zhuǎn)換成頻譜表示。然后所產(chǎn)生的均勻頻譜被劃分成非疊加的部分。每個(gè)部分具有與等效矩形帶寬(ERB)成比例的帶寬。然后，對(duì)于每個(gè)部分估計(jì)被稱為ICLD(聲道間級(jí)別差)和ICTD(聲道間時(shí)間差)的空間參數(shù)。ICLD參數(shù)描述兩個(gè)聲道之間的級(jí)別差以及ICTD參數(shù)描述不同聲道的兩個(gè)信號(hào)之間的時(shí)間差(相移)。通常相對(duì)于參考聲道為每個(gè)聲道給定所述級(jí)別差和時(shí)間差。在導(dǎo)出這些參數(shù)之后，量化該參數(shù)并最終對(duì)其編碼用于發(fā)送。
盡管ICLD和ICTD參數(shù)表示最重要的聲音源定位參數(shù)，但是通過(guò)引入附加參數(shù)能夠增強(qiáng)使用這些參數(shù)的空間表示。
稱為“參數(shù)立體聲”的相關(guān)技術(shù)描述了基于發(fā)送的單聲道信號(hào)加上參數(shù)補(bǔ)充信息參數(shù)編碼雙聲道立體聲信號(hào)。引入稱為聲道間強(qiáng)度差(IID)、聲道間相位差(IPD)、和聲道間相干性(IC)的三種類型空間參數(shù)。利用相干性參數(shù)(相關(guān)參數(shù))擴(kuò)展空間參數(shù)集使得能夠?qū)β暭?jí)的感知空間“擴(kuò)散”或空間“緊湊”進(jìn)行參數(shù)化。在以下文獻(xiàn)中更詳細(xì)地描述了參數(shù)立體聲“Parametric Coding of stereo audio”，J.Breebaart，S.van de Par，A.Kohlrausch，E.Schuijers(2005)Eurasip，J.Applied Signal Proc.9，第1305-1322頁(yè)；“High-QualityParametric Spatial Audio Coding at Low Bitrate”，J.Breebaart，S.van de Par，A.Kohlrausch，E.Schuijers，AES 116thConvention，Preprint 6072，Berlin，2004年5月；以及“Low Complexity ParametricStereo Coding”，E.Schuijers，J.Breebaart，H.Purnhagen，J.Engdegard，AES 116thConvention，Preprint 6073，Berlin，2004年5月。
如上所述，近來(lái)已經(jīng)開發(fā)出用于參數(shù)立體聲編碼以及空間音頻編碼的系統(tǒng)。如在參數(shù)立體聲中通過(guò)單聲道下混音頻信號(hào)和承載立體聲參數(shù)的附加補(bǔ)充信息表示雙聲道立體聲音頻信號(hào)(參見PCT/SE02/01372“Efficient and scalable Parametric Stereo Coding forLow Bitrate Audio Coding Applications”)，傳統(tǒng)參數(shù)立體聲解碼器根據(jù)單聲道信號(hào)和補(bǔ)充信息重構(gòu)雙聲道立體聲信號(hào)。
在空間音頻編碼方案中，通過(guò)單聲道或立體聲下混音頻信號(hào)和承載空間音頻參數(shù)的附加補(bǔ)充信息表示多聲道環(huán)繞音頻信號(hào)。眾所周知的例子是家庭娛樂系統(tǒng)所使用的5.1聲道結(jié)構(gòu)。
傳統(tǒng)空間音頻解碼器基于單聲道或立體聲信號(hào)以及附加的空間音頻參數(shù)重構(gòu)5.1多聲道信號(hào)。
典型地使用低比特率感知音頻編碼技術(shù)(像MPEG AAC)附加地編碼在參數(shù)立體聲或空間音頻編碼系統(tǒng)中應(yīng)用的下混信號(hào)以進(jìn)一步減小傳輸不同類型信號(hào)所需的傳輸帶寬。而且該下混信號(hào)通常以保證向后兼容傳統(tǒng)解碼器即利用不可操作用來(lái)處理參數(shù)立體聲或空間音頻參數(shù)的解碼器的方式與參數(shù)立體聲或空間音頻補(bǔ)充信息組合在比特流中。以這種方式，傳統(tǒng)音頻解碼器僅重構(gòu)所傳輸?shù)膯温暤阑蛄Ⅲw聲下混信號(hào)。當(dāng)使用實(shí)現(xiàn)參數(shù)立體聲或空間音頻編碼的解碼器時(shí)，該解碼器還將恢復(fù)嵌入到比特流中的補(bǔ)充信息和重構(gòu)完整的雙聲道立體聲或5.1聲道環(huán)繞信號(hào)。
當(dāng)基于單聲道下混信號(hào)使用空間音頻編碼時(shí)，進(jìn)一步希望通過(guò)提供一種信號(hào)來(lái)增強(qiáng)向后兼容性，使得不僅傳統(tǒng)感知音頻解碼器能夠?qū)С鰡温暤老禄煨盘?hào)，而且另外對(duì)于不支持空間音頻解碼的參數(shù)立體聲解碼器來(lái)說(shuō)也有可能參數(shù)立體聲解碼這種比特流。為了實(shí)現(xiàn)這個(gè)目標(biāo)，必需在比特流中包括參數(shù)立體聲補(bǔ)充信息和空間音頻補(bǔ)充信息二者。這種明顯的方法導(dǎo)致在比特流中不希望地存在大量的補(bǔ)充信息。對(duì)于必須保持總的最大比特率以傳送單聲道信號(hào)和補(bǔ)充信息的情形而言，這意味著補(bǔ)充信息的增加將會(huì)導(dǎo)致感知編碼單聲道下混可用的數(shù)據(jù)速率減小，這明顯減小了解碼的單聲道下混信號(hào)的音頻質(zhì)量。
另一種同時(shí)包括參數(shù)立體聲和空間音頻參數(shù)以及補(bǔ)充信息的現(xiàn)有技術(shù)方法需要一組如此構(gòu)造的空間音頻參數(shù)，即這些參數(shù)的子集允許根據(jù)單聲道下混信號(hào)重構(gòu)雙聲道立體聲信號(hào)。這個(gè)子集作為參數(shù)補(bǔ)充信息以兼容參數(shù)立體聲比特流的方式嵌入到比特流中，同時(shí)不屬于該子集的剩余的空間音頻參數(shù)作為空間音頻補(bǔ)充信息嵌入到兼容空間音頻編碼器的比特流中。在解碼器側(cè)，僅實(shí)現(xiàn)參數(shù)立體聲的解碼器將根據(jù)作為參數(shù)立體聲補(bǔ)充信息被嵌入的參數(shù)子集重構(gòu)雙聲道立體聲信號(hào)。另一方面，僅實(shí)現(xiàn)空間音頻的解碼器將恢復(fù)參數(shù)立體聲子集以及剩余的空間音頻參數(shù)。利用這組完整的空間參數(shù)，能夠重構(gòu)多聲道信號(hào)。
但是，這種方法所具有的缺點(diǎn)是它損害了向后兼容參數(shù)立體聲重構(gòu)或多聲道重構(gòu)的音頻質(zhì)量。這種損害是明顯的，因?yàn)樵诘谝环N情況下，也被用作空間音頻參數(shù)的參數(shù)子集描述了5.1信號(hào)的兩個(gè)聲道之間的相互關(guān)系。最自然的選擇將是左前(l)和右前(r)聲道，但是它們可能顯著不同于對(duì)于立體聲下混的左(l0)和右(r0)聲道關(guān)系的校正值。在第二種情況下，立體聲下混的校正值形成所述第一子集，這意味著它們被用來(lái)描述多聲道環(huán)繞信號(hào)的左前和右前聲道之間的相互關(guān)系。然而，由于為了以多聲道兼容的方式在比特流中嵌入?yún)?shù)所需的參數(shù)量化，這可能導(dǎo)致空間音頻重構(gòu)的顯著缺陷。
本發(fā)明的目的是提供一種創(chuàng)建和使用多聲道音頻信號(hào)的參數(shù)表示以允許更有效的表示而幾乎不損害參數(shù)立體聲重構(gòu)質(zhì)量或空間音頻重構(gòu)質(zhì)量的構(gòu)思。
該目的通過(guò)根據(jù)權(quán)利要求1所述的多聲道音頻解碼器或根據(jù)權(quán)利要求11所述的音頻編碼器實(shí)現(xiàn)。
本發(fā)明基于這樣的發(fā)現(xiàn)當(dāng)參數(shù)合并器被用于通過(guò)將一組空間參數(shù)與立體聲參數(shù)合并來(lái)產(chǎn)生多聲道音頻信號(hào)的參數(shù)表示時(shí)，能夠以向后兼容的方式有效地導(dǎo)出具有適于與單聲道下混信號(hào)一起使用的參數(shù)的該多聲道音頻信號(hào)的參數(shù)表示，所得到的參數(shù)表示具有解碼器可使用的立體聲參數(shù)和與該解碼器可使用的立體聲參數(shù)一起表示該組空間參數(shù)的有關(guān)該組空間參數(shù)的信息。
通過(guò)使用描述也通過(guò)空間參數(shù)描述的同一多聲道音頻信號(hào)立體聲下混的空間參數(shù)和立體聲參數(shù)之間的相互關(guān)系，能夠根據(jù)參數(shù)立體聲參數(shù)有利地預(yù)測(cè)空間參數(shù)的子集。
由于通過(guò)立體聲參數(shù)描述的雙聲道立體聲信號(hào)表示某種形式的5.1多聲道信號(hào)的立體聲下混，所以如上所述，在參數(shù)立體聲系統(tǒng)的立體聲參數(shù)與空間音頻編碼系統(tǒng)的空間參數(shù)之間存在一種相關(guān)性，本發(fā)明組合空間音頻參數(shù)的子集來(lái)使用這些立體聲參數(shù)以預(yù)測(cè)不包括在所述子集中的剩余空間音頻參數(shù)的值。然后，僅有不包含在子集中的空間音頻參數(shù)的預(yù)測(cè)值和實(shí)際值之差需要被傳送。這種差(即預(yù)測(cè)誤差)的熵典型小于實(shí)際參數(shù)本身的熵。這可能被應(yīng)用本發(fā)明的系統(tǒng)以及接下來(lái)的某種熵編碼所使用。這種系統(tǒng)與簡(jiǎn)單地獨(dú)立嵌入所有參數(shù)的系統(tǒng)相比需要較少的補(bǔ)充信息比特率用于參數(shù)立體聲和空間音頻參數(shù)。應(yīng)該注意到與此同時(shí)，應(yīng)用本發(fā)明的這種系統(tǒng)并不損害參數(shù)立體聲重構(gòu)的質(zhì)量或空間音頻重構(gòu)的質(zhì)量。
因?yàn)楸景l(fā)明的目的是提供一種向后兼容參數(shù)立體聲解碼器的參數(shù)表示，優(yōu)選的是應(yīng)該使用表示立體聲下混的正確參數(shù)以便不損害由參數(shù)立體聲解碼器重構(gòu)的雙聲道立體聲信號(hào)的質(zhì)量。盡管如此，在本發(fā)明的替換實(shí)施例中，在編碼器中根據(jù)估計(jì)的空間參數(shù)應(yīng)用參數(shù)立體聲參數(shù)的小修改，以便提高對(duì)空間音頻參數(shù)進(jìn)行參數(shù)預(yù)測(cè)的性能。很清楚參數(shù)立體聲(PS)參數(shù)的這種修改導(dǎo)致通過(guò)實(shí)現(xiàn)參數(shù)立體聲解碼器的解碼器所重構(gòu)的立體聲信號(hào)稍微地降低質(zhì)量。通過(guò)本發(fā)明的本實(shí)施例，重構(gòu)空間音頻信號(hào)的質(zhì)量保持不受PS參數(shù)修改的影響，同時(shí)減小PS以及嵌入到兼容比特流中空間補(bǔ)充信息所需的總比特率。
在本發(fā)明的優(yōu)選實(shí)施例中，使用導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示的編碼器產(chǎn)生比特流，其中所述多聲道信號(hào)的立體聲下混的空間音頻參數(shù)以及參數(shù)立體聲參數(shù)被以完全向后兼容的方式嵌入。即，只能夠處理參數(shù)立體聲參數(shù)的參數(shù)立體聲解碼器將會(huì)能夠使用參數(shù)立體聲參數(shù)重構(gòu)高質(zhì)量的立體聲信號(hào)。而且，本發(fā)明的編碼器通過(guò)實(shí)際空間參數(shù)和預(yù)測(cè)空間參數(shù)的差分表示替換了某些空間參數(shù)，但是空間參數(shù)的預(yù)測(cè)基于立體聲參數(shù)和一組未被替換的空間音頻參數(shù)。由于空間音頻參數(shù)表示以及參數(shù)立體聲表示參數(shù)都描述聲道對(duì)之間的級(jí)別差和相關(guān)性，所以在空間音頻參數(shù)和立體聲參數(shù)之間存在一種相互關(guān)系，以及二者都以相同的數(shù)據(jù)即多聲道信號(hào)為基礎(chǔ)進(jìn)行導(dǎo)出。然后，由于所述差值的熵通常遠(yuǎn)遠(yuǎn)小于基礎(chǔ)空間音頻參數(shù)的熵，通過(guò)使用預(yù)測(cè)和實(shí)際值之間的差用于發(fā)送，能夠節(jié)約比特率。當(dāng)所述預(yù)測(cè)精確為預(yù)測(cè)值和實(shí)際值之間的差值顯然是零時(shí)，這意味著必須發(fā)送或在參數(shù)表示中存儲(chǔ)被替換空間參數(shù)的只有零值的表示，當(dāng)對(duì)該表示進(jìn)一步執(zhí)行熵編碼步驟時(shí)這最為有利，正如通常的情況一樣。
通過(guò)使用如上所述的構(gòu)思，本發(fā)明的編碼器或解碼器具有以下明顯的優(yōu)點(diǎn)即盡管精確地毫無(wú)損耗地向后兼容發(fā)送空間音頻和參數(shù)立體聲參數(shù)，但是相比在比特流中簡(jiǎn)單地獨(dú)立發(fā)送空間音頻參數(shù)和參數(shù)立體聲參數(shù)的情形而言本發(fā)明還能夠降低比特率。
在本發(fā)明進(jìn)一步的實(shí)施例中，在預(yù)測(cè)空間參數(shù)和發(fā)送修改的空間參數(shù)之前對(duì)參數(shù)立體聲參數(shù)應(yīng)用小的改變。這具有重要的優(yōu)點(diǎn)即通過(guò)參數(shù)立體聲參數(shù)的小改變能夠提高預(yù)測(cè)的穩(wěn)定性，并且因此，能夠進(jìn)一步降低總比特率。代價(jià)是由于在編碼過(guò)程中改變實(shí)際上最佳的參數(shù)立體聲參數(shù)，所以使用經(jīng)修改立體聲參數(shù)被重構(gòu)的立體聲上混的質(zhì)量小幅降低。
在本發(fā)明進(jìn)一步的實(shí)施例中，本發(fā)明的音頻編碼器包括根據(jù)輸入到編碼器的多聲道信號(hào)產(chǎn)生單聲道信號(hào)的空間下混器。所述單聲道信號(hào)進(jìn)一步被音頻編碼器使用例如感知音頻壓縮進(jìn)行壓縮，以進(jìn)一步降低單聲道下混信號(hào)在發(fā)送期間使用的比特率。比特流發(fā)生器最終產(chǎn)生用于將單聲道信號(hào)、空間音頻參數(shù)和參數(shù)立體聲參數(shù)合并到單個(gè)、參數(shù)立體聲兼容的比特流中的比特流。
在本發(fā)明進(jìn)一步的實(shí)施例中，參數(shù)編碼器或解碼器包括允許進(jìn)一步降低所需比特率的控制單元。這通過(guò)比較使用實(shí)際空間參數(shù)及其預(yù)測(cè)參數(shù)產(chǎn)生的空間參數(shù)差分表示所需的比特率與直接編碼空間參數(shù)所需的比特率予以實(shí)現(xiàn)。編碼通過(guò)二步編碼過(guò)程的方式執(zhí)行，首先包括單獨(dú)地時(shí)間和/或頻率差分編碼每個(gè)參數(shù)，以及接下來(lái)進(jìn)行熵編碼(使用例如霍夫曼編碼器、算術(shù)編碼器或游程長(zhǎng)度編碼器)。這種處理使用基于其自己歷史的用于每個(gè)參數(shù)的可預(yù)測(cè)性(或冗余性)(與如上所述的在參數(shù)集上的預(yù)測(cè)比較)。在差分預(yù)測(cè)編碼導(dǎo)致較高比特率的情況下，通過(guò)對(duì)于給定的時(shí)間幀直接發(fā)送空間參數(shù)能夠進(jìn)一步節(jié)約比特率。選擇策略的判定能夠在比特流中發(fā)送以在解碼器側(cè)被處理或者解碼器可以在沒有通知的情況下通過(guò)應(yīng)用適當(dāng)?shù)臋z測(cè)算法判定原來(lái)已經(jīng)使用過(guò)哪種策略。
如上所述，根據(jù)本發(fā)明產(chǎn)生的信號(hào)具有的重要優(yōu)點(diǎn)是向后兼容參數(shù)立體聲解碼器以及并且當(dāng)它被發(fā)送到本發(fā)明的解碼器時(shí)保持完整的空間(環(huán)繞)信號(hào)再現(xiàn)所需的信息。
所以，本發(fā)明的接收參數(shù)立體聲參數(shù)和空間音頻參數(shù)的解碼器能夠通過(guò)應(yīng)用差分發(fā)送的空間音頻參數(shù)的相同預(yù)測(cè)和逆變換重構(gòu)一組完整的空間參數(shù)，以從根據(jù)本發(fā)明的比特流導(dǎo)出表示多聲道信號(hào)空間特性的一組完整的空間音頻參數(shù)。
換言之，用于合并參數(shù)立體聲參數(shù)和所接收空間音頻參數(shù)以重構(gòu)一組完整空間參數(shù)的合并規(guī)則與編碼器側(cè)應(yīng)用的規(guī)則相反。在如上所述的差分編碼的情況下，這將會(huì)意味著首先使用參數(shù)立體聲參數(shù)之一或更多以及所接收空間音頻參數(shù)之一或更多計(jì)算想要參數(shù)的預(yù)測(cè)。然后，計(jì)算預(yù)測(cè)值和發(fā)送值之和，該求和是該組完整空間參數(shù)的想要的參數(shù)。
在本發(fā)明進(jìn)一步的實(shí)施例中，本發(fā)明的解碼器還能夠使用高質(zhì)量的參數(shù)立體聲參數(shù)重構(gòu)多聲道信號(hào)的立體聲表示。這具有的重要優(yōu)點(diǎn)是本發(fā)明的解碼器能夠根據(jù)需要被配置，即當(dāng)只有立體聲重放環(huán)境可用時(shí)，通過(guò)本發(fā)明的解碼器能夠再現(xiàn)高質(zhì)量的立體聲信號(hào)，但是當(dāng)多聲道重放環(huán)境可用時(shí)，可以再現(xiàn)信號(hào)的多聲道表示以允許令人愉快地聆聽環(huán)繞聲音。
在本發(fā)明進(jìn)一步的實(shí)施例中，本發(fā)明的編碼器包括在發(fā)送器或音頻記錄器中，允許音頻信號(hào)的比特率節(jié)約存儲(chǔ)或發(fā)送，其中所述音頻信號(hào)可以利用極佳的質(zhì)量被再現(xiàn)為立體聲信號(hào)或完整的環(huán)繞信號(hào)。
在本發(fā)明進(jìn)一步的實(shí)施例中，本發(fā)明的解碼器包括在接收器或音頻播放器中，以允許使用不同的揚(yáng)聲器設(shè)置接收或重放信號(hào)，其中所述音頻信號(hào)能夠以最佳擬合現(xiàn)有重放環(huán)境的表示被再現(xiàn)。
總而言之，本發(fā)明包括以下的有利特征-兼容編碼多聲道音頻信號(hào)，包括在編碼器側(cè)，下混多聲道信號(hào)成一個(gè)信道表示，在編碼器側(cè)給定所述多聲道信號(hào)表示該多聲道信號(hào)的參數(shù)定義，在編碼器側(cè)給定所述多聲道信號(hào)表示該多聲道信號(hào)立體聲下混的參數(shù)定義，在編碼器側(cè)，以比特率有效和向后兼容的方式將參數(shù)集嵌入到比特流中，在解碼器側(cè)，從比特流中提取被嵌入的參數(shù)，在解碼器側(cè)，根據(jù)從所述比特流提取的參數(shù)重構(gòu)表示多聲道信號(hào)的參數(shù)，在解碼器側(cè)，給定根據(jù)比特流數(shù)據(jù)重構(gòu)的參數(shù)，和所述下混的信號(hào)以重構(gòu)多聲道輸出信號(hào)；-嵌入表示立體聲下混的參數(shù)到所述比特流中，以便通過(guò)僅支持參數(shù)立體聲解碼的(傳統(tǒng))解碼方法對(duì)它們進(jìn)行解碼；-分離表示多聲道信號(hào)的該組參數(shù)成第一子集和第二子集；-根據(jù)參數(shù)所述第二子集以及表示多聲道信號(hào)立體聲下混的參數(shù)預(yù)測(cè)參數(shù)所述第一子集中的值；-控制自動(dòng)選擇是否直接編碼參數(shù)的第一子集還是僅編碼和預(yù)測(cè)的參數(shù)值相關(guān)的差值的機(jī)制；-修改表示立體聲下混的參數(shù)，這里表示多聲道信號(hào)的原始參數(shù)和表示立體聲下混的原始參數(shù)都被用作導(dǎo)出所述經(jīng)修改的參數(shù)的基礎(chǔ)；
-使用查詢表查找所述預(yù)測(cè)的參數(shù)值；-使用多項(xiàng)式函數(shù)查找所述預(yù)測(cè)的參數(shù)值；-使用根據(jù)被應(yīng)用于產(chǎn)生立體聲下混的方法導(dǎo)出的數(shù)學(xué)函數(shù)查找所述預(yù)測(cè)的參數(shù)值。
下面將參考附圖描述本發(fā)明的優(yōu)選實(shí)施例，其中

圖1所示為本發(fā)明編碼器的方框圖；圖2所示為根據(jù)本發(fā)明產(chǎn)生的比特流；圖3所示為本發(fā)明編碼器的另一實(shí)施例；圖4所示為圖3中本發(fā)明編碼器的細(xì)節(jié)；圖5所示為本發(fā)明的解碼器；圖6所示為本發(fā)明多聲道解碼器的優(yōu)選實(shí)施例；圖7所示為圖6中本發(fā)明多聲道解碼器的細(xì)節(jié)；圖8例示本發(fā)明信號(hào)的向后兼容性；圖9所示為具有本發(fā)明編碼器的發(fā)送器或音頻記錄器；圖10所示為具有本發(fā)明多聲道解碼器的接收器或音頻播放器；以及圖11所示為傳輸系統(tǒng)。
以下描述的實(shí)施例僅僅用于示例本發(fā)明用于改進(jìn)參數(shù)立體聲兼容編碼空間音頻的原理。應(yīng)該明白對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)對(duì)這里所描述結(jié)構(gòu)和細(xì)節(jié)的修改和變型將是顯而易見的。所以，意圖僅通過(guò)附屬權(quán)利要求的范圍而不是通過(guò)這里實(shí)施例描述和說(shuō)明的具體細(xì)節(jié)來(lái)限定本發(fā)明。
圖1所示為用于導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示12的本發(fā)明編碼器10。編碼器10包括空間參數(shù)計(jì)算器14、立體聲參數(shù)計(jì)算器16和參數(shù)合并器18。
空間參數(shù)計(jì)算器14計(jì)算描述多聲道信號(hào)的空間特性的一組空間參數(shù)20。立體聲參數(shù)計(jì)算器16計(jì)算描述多聲道信號(hào)立體聲下混的空間特性的立體聲參數(shù)22。所述空間參數(shù)20和立體聲參數(shù)22被傳送到導(dǎo)出參數(shù)表示12的參數(shù)合并器18，該參數(shù)表示包括解碼器可使用的立體聲參數(shù)24和有關(guān)該組空間參數(shù)的信息26。
圖2所示為向后兼容比特流的實(shí)例，該比特流是如通過(guò)根據(jù)圖1的本發(fā)明編碼器產(chǎn)生的多聲道音頻信號(hào)的參數(shù)表示。所述比特流包括立體聲參數(shù)區(qū)30和空間參數(shù)區(qū)32。立體聲參數(shù)區(qū)30在立體聲參數(shù)區(qū)30的開頭具有立體聲標(biāo)題34，之后是兩個(gè)解碼器可使用的立體聲參數(shù)36a和36b，參數(shù)立體聲解碼器將會(huì)使用它們來(lái)重構(gòu)立體聲信號(hào)。能夠處理參數(shù)立體聲參數(shù)的解碼器將僅通過(guò)包括在立體聲標(biāo)題34中的信息識(shí)別參數(shù)立體聲參數(shù)36a和36b。
空間音頻區(qū)32從空間標(biāo)題38開始并且包括四個(gè)空間音頻參數(shù)40a到40d。根據(jù)本發(fā)明的多聲道解碼器將通過(guò)借助空間標(biāo)題38以及如通過(guò)立體聲標(biāo)題34被識(shí)別的立體聲參數(shù)36a和36b識(shí)別它們來(lái)使用空間參數(shù)40a到40d。如在圖2中所示，空間參數(shù)40a比空間參數(shù)40b到40d消耗較少的比特率。在圖2所示的實(shí)例中，空間參數(shù)40a通過(guò)基礎(chǔ)的原始空間參數(shù)和使用立體聲參數(shù)36a之一或更多以及空間音頻參數(shù)40b到40d之一或更多而導(dǎo)出的預(yù)測(cè)空間參數(shù)的差值表示。所以本發(fā)明的多聲道解碼器需要使用立體聲參數(shù)36a和36b以及空間參數(shù)40b到40d重構(gòu)有關(guān)在比特流中發(fā)送的空間參數(shù)40a的空間參數(shù)基礎(chǔ)信息。
圖3所示為用于導(dǎo)出多聲道音頻信號(hào)50的參數(shù)表示的本發(fā)明編碼器52的優(yōu)選實(shí)施例，所述信號(hào)具有三個(gè)聲道，左聲道l、右聲道r和中間聲道c。
本發(fā)明的編碼器52包括空間下混器54、空間參數(shù)估計(jì)器56、立體聲下混器58、參數(shù)立體聲參數(shù)估計(jì)器60、音頻編碼器62、參數(shù)合并器(聯(lián)合編碼塊)64以及比特流計(jì)算器(多路復(fù)用器(MUX))66。
空間下混器54、空間參數(shù)估計(jì)器56、立體聲下混器58、接收多聲道信號(hào)50作為輸入。空間下混器54根據(jù)多聲道信號(hào)50產(chǎn)生單聲道下混信號(hào)68，空間參數(shù)估計(jì)器56導(dǎo)出描述多聲道信號(hào)的空間特性的空間參數(shù)70，以及立體聲下混器58根據(jù)多聲道信號(hào)50產(chǎn)生立體聲下混信號(hào)72。
立體聲下混信號(hào)72被輸入到參數(shù)立體聲參數(shù)估計(jì)器60，它用于根據(jù)描述立體聲下混信號(hào)72的空間特性的立體聲下混信號(hào)導(dǎo)出立體聲參數(shù)74。單聲道下混信號(hào)68被輸入到音頻編碼器62中，它通過(guò)使用例如感知音頻編碼技術(shù)進(jìn)行編碼導(dǎo)出表示單聲道下混信號(hào)68的音頻比特流76。參數(shù)合并器64接收空間參數(shù)70和參數(shù)立體聲參數(shù)74作為輸入并且通過(guò)空間參數(shù)預(yù)測(cè)和空間參數(shù)本身的差值替換該組空間參數(shù)來(lái)導(dǎo)出解碼器可使用的立體聲參數(shù)(參數(shù)立體聲補(bǔ)充信息)78和有關(guān)空間參數(shù)的信息(空間補(bǔ)充信息)80作為輸出。這將通過(guò)以下的附圖更詳細(xì)地描述。
比特流計(jì)算器66最后接收音頻比特流76、有關(guān)該組空間參數(shù)的信息80以及解碼器可使用的立體聲參數(shù)78作為輸入并且合并所述輸入到參數(shù)立體聲兼容的比特流82中，該比特流可以例如包括在圖2中詳細(xì)描述參數(shù)的分段。
比特流計(jì)算器66可能是簡(jiǎn)單的多路復(fù)用器。但是根據(jù)本發(fā)明還可以實(shí)現(xiàn)用于合并三個(gè)輸入到兼容比特流中的其他方式來(lái)導(dǎo)出比特流。
換言之，圖3例示采用多聲道音頻信號(hào)作為輸入并且產(chǎn)生允許通過(guò)空間解碼器解碼以及通過(guò)PS解碼器向后兼容解碼的兼容比特流的編碼器，該信號(hào)包括三個(gè)聲道l、r和c。所述空間下混采用多聲道信號(hào)l、r和c并且產(chǎn)生單聲道下混信號(hào)m。然后通過(guò)可選的感知音頻編碼器對(duì)該信號(hào)進(jìn)行編碼以產(chǎn)生表示單聲道信號(hào)的壓縮音頻比特流。所述空間參數(shù)估計(jì)采用多聲道信號(hào)l、r和c作為輸入并且產(chǎn)生一組量化的空間參數(shù)。這些參數(shù)可能是時(shí)間和頻率的函數(shù)。所述立體聲下混例如使用ITU-R下混方程或替換的方法產(chǎn)生多聲道信號(hào)的雙聲道立體聲下混l0、r0。所述參數(shù)立體聲(PS)參數(shù)估計(jì)采用這種立體聲下混作為輸入并且產(chǎn)生一組量化的可能是時(shí)間和頻率函數(shù)的PS參數(shù)。所述量化編碼塊采用空間參數(shù)和PS參數(shù)二者作為輸入并且產(chǎn)生參數(shù)立體聲補(bǔ)充信息(PS補(bǔ)充信息)和空間補(bǔ)充信息。最后多路復(fù)用器采用音頻比特流以及空間和PS補(bǔ)充信息比特流作為輸入并且以有可能通過(guò)傳統(tǒng)解碼器(僅實(shí)現(xiàn)PS)向后兼容解碼的這樣一種方式將補(bǔ)充信息嵌入到比特流中。
圖4詳細(xì)描述圖3中所示的參數(shù)合并器64。參數(shù)合并器64具有參數(shù)分離器90、參數(shù)立體聲參數(shù)修改器92、空間參數(shù)預(yù)測(cè)器94、合并器96、控制單元98、空間參數(shù)匯編器100以及第一差分編碼器102、第二差分編碼器104、第三差分編碼器106a和第四差分編碼器106b。
參數(shù)合并器64接收空間參數(shù)70和參數(shù)立體聲參數(shù)74作為輸入。參數(shù)立體聲參數(shù)74在參數(shù)立體聲參數(shù)修改器的第一輸入被輸入到參數(shù)立體聲參數(shù)修改器92中，以及空間參數(shù)70在其第二輸入被輸入到參數(shù)立體聲參數(shù)修改器92中。
空間參數(shù)70還被輸入到參數(shù)分離器90中。參數(shù)立體聲參數(shù)修改器92是可選的裝置，它可以被用于通過(guò)使用空間參數(shù)70的信息修改參數(shù)立體聲參數(shù)74以導(dǎo)出解碼器可使用的立體聲參數(shù)110。
參數(shù)分離器90將空間參數(shù)70劃分成空間參數(shù)的第一子集112和空間參數(shù)的第二子集114，其中第一子集112是可以通過(guò)多聲道信號(hào)最終參數(shù)表示中的差分預(yù)測(cè)所替換的空間參數(shù)的子集。
由于使用解碼器可使用的立體聲參數(shù)110和空間參數(shù)的第二子集114執(zhí)行第一子集中的參數(shù)預(yù)測(cè)，解碼器可使用的參數(shù)110和空間參數(shù)114的第二子集都被輸入到空間參數(shù)預(yù)測(cè)器94中?？臻g參數(shù)預(yù)測(cè)器94使用解碼器可使用的參數(shù)立體聲參數(shù)110和空間參數(shù)114的第二子集導(dǎo)出預(yù)測(cè)參數(shù)116。預(yù)測(cè)參數(shù)116是第一子集112參數(shù)的預(yù)測(cè)并且被與第一子集112的參數(shù)進(jìn)行比較。
因此，通過(guò)合并器96以參數(shù)方式計(jì)算預(yù)測(cè)參數(shù)116和參數(shù)112的第一子集的差值，即這種導(dǎo)出的差分參數(shù)118。參數(shù)112的第一子集被輸入到通過(guò)應(yīng)用時(shí)間或頻率差分編碼對(duì)該參數(shù)第一子集進(jìn)行差分編碼的第三差分編碼器106a中。差分參數(shù)118被輸入到第四差分編碼器106b中。
根據(jù)在圖4中所示的本發(fā)明優(yōu)選實(shí)施例，通過(guò)控制單元98比較第一子集112的差分編碼表示和差分參數(shù)118的差分編碼表示以估計(jì)哪種表示在比特流中需要更多的比特?？刂茊卧?8控制開關(guān)120提供第一子集112的表示到需要較少比特的空間參數(shù)匯編器100，但是表示使用的信息被另外從控制單元98傳送到空間參數(shù)匯編器100。
還通過(guò)第二差分編碼器104差分編碼空間參數(shù)的第二子集114，以及第二子集114的差分編碼表示被輸入到空間參數(shù)匯編器100中，因此具有有關(guān)空間參數(shù)70的完整信息。空間參數(shù)匯編器100最終通過(guò)重新匯編第一子集112和第二子集114的表示到有關(guān)保持空間參數(shù)70完整信息的該組空間參數(shù)的信息80中導(dǎo)出有關(guān)空間參數(shù)的信息80。
因此，有關(guān)該組空間參數(shù)80的最終信息包括未經(jīng)修改但是差分編碼的空間參數(shù)的第二子集以及空間參數(shù)第一子集的表示，取決于哪種表示需要更少的比特率，這種表示可能是第一子集112的直接差分編碼表示或者是差分參數(shù)118的差分編碼表示。
通過(guò)本發(fā)明參數(shù)合并器64導(dǎo)出的解碼器可使用的參數(shù)立體聲參數(shù)78通過(guò)第一差分編碼器102導(dǎo)出。第一差分編碼器102接收經(jīng)修改的參數(shù)立體聲參數(shù)110作為輸入并且通過(guò)差分編碼經(jīng)修改的參數(shù)立體聲參數(shù)110導(dǎo)出解碼器可使用的參數(shù)立體聲參數(shù)78。
換言之，圖4例示采用空間參數(shù)和PS參數(shù)作為輸入并且產(chǎn)生空間補(bǔ)充信息和PS補(bǔ)充信息的聯(lián)合編碼塊?？蛇x的PS參數(shù)修改塊采用空間參數(shù)和PS參數(shù)作為輸入并產(chǎn)生經(jīng)修改的PS參數(shù)。這允許以犧牲損害根據(jù)經(jīng)修改的PS參數(shù)重構(gòu)的2聲道立體聲信號(hào)的質(zhì)量為代價(jià)實(shí)現(xiàn)空間參數(shù)的較佳預(yù)測(cè)。如果不應(yīng)用PS參數(shù)修改塊，輸入PS參數(shù)直接用作空間參數(shù)預(yù)測(cè)塊和PS編碼的輸入。(經(jīng)修改的)PS參數(shù)集能夠使用時(shí)間差分(dt)或頻率差分(df)編碼，即分別在時(shí)間或頻率方向編碼連續(xù)參數(shù)的差值，以及使用霍夫曼編碼即無(wú)損熵編碼被編碼，以便最小化表示參數(shù)集所需比特的數(shù)量。所述參數(shù)分離塊分離被直接編碼的第二子集中的所述空間參數(shù)集以及包含所有剩余參數(shù)并能夠使用參數(shù)預(yù)測(cè)被編碼的互補(bǔ)的第一子集。所述空間參數(shù)預(yù)測(cè)塊采用空間參數(shù)的第二子集和(經(jīng)修改的)PS參數(shù)作為輸入并且計(jì)算用于空間參數(shù)的第一子集的預(yù)測(cè)值。然后從第一子集中的空間參數(shù)的實(shí)際值中減去這些預(yù)測(cè)值，產(chǎn)生一組預(yù)測(cè)誤差值。
使用時(shí)間或頻率差分編碼和霍夫曼編碼對(duì)第二參數(shù)子集進(jìn)行編碼以便最小化表示該參數(shù)子集所需比特的數(shù)量。使用時(shí)間或頻率差分編碼和霍夫曼編碼對(duì)第一參數(shù)子集編碼以便最小化表示該參數(shù)子集所需比特的數(shù)量。使用時(shí)間或頻率差分編碼和霍夫曼編碼對(duì)第一參數(shù)子集的預(yù)測(cè)誤差值進(jìn)行編碼以便最小化表示該參數(shù)子集所需比特的數(shù)量?？刂茐K選擇是否應(yīng)該直接編碼第一參數(shù)子集或應(yīng)該編碼預(yù)測(cè)誤差以最小化表示第一參數(shù)子集所需比特的數(shù)量。對(duì)于所述子集中的每個(gè)參數(shù)這種選擇能夠單獨(dú)地完成。實(shí)際的選擇判定能夠作為補(bǔ)充信息在比特流中傳送或者基于為空間參數(shù)預(yù)測(cè)一部分的規(guī)則。在后者的情況下，這種判定不必作為補(bǔ)充信息而被傳送。最后，多路復(fù)用器合并所有編碼的數(shù)據(jù)以形成空間補(bǔ)充信息。
為使用本發(fā)明的編碼或解碼構(gòu)思，參數(shù)預(yù)測(cè)的不同實(shí)現(xiàn)是可行的。通常，有可能使用適當(dāng)設(shè)計(jì)的查詢表根據(jù)立體聲參數(shù)和空間參數(shù)的第二子集導(dǎo)出空間參數(shù)第一子集的預(yù)測(cè)或者能夠替換地應(yīng)用解析函數(shù)根據(jù)具體下混處理的知識(shí)以及導(dǎo)出空間參數(shù)和立體聲參數(shù)的方式導(dǎo)出所述預(yù)測(cè)的參數(shù)。以下段落給出了實(shí)現(xiàn)適當(dāng)預(yù)測(cè)的某些具體實(shí)例的概述。
這種概述基于具有三個(gè)聲道的多聲道信號(hào)，-l左，-c中，-r右，這僅僅被認(rèn)為是作為一個(gè)實(shí)例。介紹的原理顯然還相應(yīng)地應(yīng)用于其他聲道結(jié)構(gòu)。例如，在5.1聲道結(jié)構(gòu)的情況下，使用參數(shù)立體聲模塊合并左前和左環(huán)繞聲道形成左信號(hào)(l)，使用參數(shù)立體聲模塊合并右前和右環(huán)繞聲道形成右信號(hào)(r)，以及使用參數(shù)立體聲模塊合并中前和低頻增強(qiáng)聲道形成中間信號(hào)(c)。
以下的描述更詳細(xì)地討論空間參數(shù)預(yù)測(cè)塊。立體聲下混信號(hào)的2個(gè)聲道表示為l0左下混，r0右下混，以及單聲道下混表示為m單聲道下混。
所述預(yù)測(cè)塊輸出第一K個(gè)量化空間參數(shù)s1，....，sK(即空間參數(shù)的第一子集)的預(yù)測(cè)值給定量化的經(jīng)修改或未經(jīng)修改的PS參數(shù)p1和p2以及剩余量化空間參數(shù)的第二子集sK+1，sK+2，....，sN。
在最普遍的意義上，它由列表函數(shù)(查詢表)構(gòu)成(s^1,...,s^K)=F(p1,p2,sK+1,...,sN)---(1)]]>那么所述差分信號(hào)等于預(yù)測(cè)誤差(d1,...,dK)=(s1-s^1,...,sK-s^K)---(2)]]>第一種設(shè)計(jì)方法是讓F為所選擇的列表函數(shù)或多元多項(xiàng)式以便在大型參數(shù)數(shù)據(jù)庫(kù)上以最小二乘法來(lái)最小化預(yù)測(cè)誤差?？商鎿Q地，F(xiàn)能夠被如此選擇以最小化所產(chǎn)生的表示空間參數(shù)第一子集所需的比特率，這里在這種意義上大型參數(shù)數(shù)據(jù)庫(kù)被用作查找最佳F的訓(xùn)練數(shù)據(jù)。在預(yù)測(cè)單元中使用它們之前，這種列表函數(shù)或多項(xiàng)式能夠跟隨舍入或量化操作以便產(chǎn)生整數(shù)結(jié)果。
這種方法的一個(gè)重要的特殊情況是使用其中F是一階多項(xiàng)式的線性預(yù)測(cè)。
第二種預(yù)測(cè)器設(shè)計(jì)是考慮所使用的實(shí)際參數(shù)結(jié)構(gòu)。在本發(fā)明的優(yōu)選實(shí)施例中，K＝2和N＝4，以及所述參數(shù)根據(jù)以下傳送信息p1iid_l0_r0聲道l0和r0之間的聲道間強(qiáng)度差(IID)；p2icc_l0_r0聲道l0和r0之間的聲道間相干或互相關(guān)(ICC)；s1iid_l_r 聲道l和r之間的聲道間強(qiáng)度差(IID)；s2icc_l_r 聲道l和r之間的聲道間相干或互相關(guān)(ICC)；s3iid_lr_c 聲道l+r和c之間的聲道間強(qiáng)度差(IID)；s4icc_lr_c 聲道l+r和c之間的聲道間相干或互相關(guān)(ICC)。
這種設(shè)計(jì)的第一實(shí)例是以上線性預(yù)測(cè)器設(shè)計(jì)的一種特例并且由以下簡(jiǎn)單地設(shè)置構(gòu)成s^1=p1,s^2=p2---(3)]]>這種簡(jiǎn)單的預(yù)測(cè)器所具有的優(yōu)點(diǎn)是它產(chǎn)生更加穩(wěn)定的預(yù)測(cè)誤差(而不是最小的預(yù)測(cè)誤差)，其很適于時(shí)間差分或頻率差分編碼所述預(yù)測(cè)誤差。這對(duì)于像上述多項(xiàng)式的所有預(yù)測(cè)器來(lái)說(shuō)是正確的。
第二實(shí)例基于假設(shè)立體聲下混利用已知的中間聲道增益q(典型為1或1/)通過(guò)以下產(chǎn)生l0＝l+q·c，r0＝r+q·c(4)所有信號(hào)l、r、c是典型根據(jù)時(shí)間信號(hào)的復(fù)調(diào)制的濾波器組分析由子頻帶采樣的時(shí)間和頻率間隔產(chǎn)生的有限長(zhǎng)度向量。對(duì)于復(fù)向量x、y，復(fù)內(nèi)積和模平方通過(guò)以下定義<x,y>=Σnx(n)y*(n),X=||x||2=<x,y>=Σn|x(n)|2,Y=||y||2=<y,y>Σn|y(n)|2,---(5)]]>其中星號(hào)表示復(fù)共軛。然后假設(shè)IID參數(shù)的線性和非量化形式通過(guò)以下獲得P1=L0R0,S1=LR,S3=L+RC.---(6)]]>對(duì)于ICC參數(shù)，在互相關(guān)的情況下，公式如下P2=Re<l0,r0>L0·R0,S2=Re<l,r>L·R,S4=Re<l+r,c>||l+r||·||c||.---(7)]]>在相干的情況下，公式(7)中實(shí)值運(yùn)算被替換成絕對(duì)值(復(fù)幅度)運(yùn)算。
假設(shè)簡(jiǎn)化成<l，c>＝<r，c>＝0，從而得出能夠被插入到(6)的第一公式中的L0＝L+q2C和R0＝R+q2C。通過(guò)求解具有兩個(gè)未知數(shù)的兩個(gè)方程，然后根據(jù)P1和S3獲得X＝L/C和Y＝R/C的以下估計(jì)X^=p12S32+q2(p12-1)p12+1,Y^=S32-q2(p12-1)p12+1---(8)]]>當(dāng)公式(8)中的兩個(gè)值都為正值時(shí)，S1的估計(jì)被公式化為S^1=X^/Y^.]]>這里，通過(guò)去量化給定的整數(shù)參數(shù)獲得所需的線性參數(shù)值以及然后通過(guò)量化獲得整數(shù)參數(shù)估計(jì) 當(dāng)稍微損害質(zhì)量的解碼立體聲信號(hào)可接受時(shí)，通過(guò)應(yīng)用參數(shù)立體聲參數(shù)的修改能夠進(jìn)一步減小總比特率。這種修改的目的是實(shí)現(xiàn)空間參數(shù)第一子集的更加穩(wěn)定的預(yù)測(cè)和減小預(yù)測(cè)誤差。它能夠被看作是一種穩(wěn)定上述計(jì)算的方式。這種參數(shù)修改的最極端情況將是使用p1’＝s1，p2’＝s2，這里p1’，p2’表示經(jīng)修改的參數(shù)立體聲參數(shù)。由于僅在編碼器側(cè)執(zhí)行這種參數(shù)修改操作，所以在解碼器側(cè)不需要采取任何特殊處理。
更為普遍的方法包含在P1，P2，S3，S4中可用的完整功率和相關(guān)結(jié)構(gòu)信息以經(jīng)由公式(6)和(7)獲得S1和S2的估計(jì)。通過(guò)參數(shù)的縮放不變性，為了計(jì)算目的假設(shè)C＝1不失普遍性。然后利用定義a＝Re<l，c>，b＝Re<r，c>，p＝Re<l，r> (9)產(chǎn)生以下的方程系L+q2+2qa=P12(R+q2+2qb)ρ+q2+1q(a+b)=P2(L+q2+2qa)1/2(R+q2+2qb)1/2L+R=S32a+b=S4(L+R+2ρ)1/2.---(10)]]>對(duì)于估計(jì)感興趣的未知數(shù)是L、R、p，以及a、b是附加的未知數(shù)。取決于對(duì)a、b對(duì)的限制的選擇，這種(未確定的)方程系能夠用作許多預(yù)測(cè)公式的指引。例如，(10)中的第一和第三方程意味著(1+P12)L=q2(P12-1)+2q(P12b-a)+P12S32(1+P12)R=S32-q2(P12-1)-2q(P12b-a)---(11)]]>因此導(dǎo)致公式(8)的所述計(jì)算對(duì)應(yīng)于p12b=a]]>的情況。更普遍而言，啟發(fā)式參數(shù)γ經(jīng)由γ=p12b-a]]>定義對(duì)a、b對(duì)的限制。
再次強(qiáng)調(diào)上述預(yù)測(cè)方案僅僅是在編碼器側(cè)以及解碼器側(cè)實(shí)現(xiàn)的可能預(yù)測(cè)方案的一些例子。
圖5所示為本發(fā)明用于處理參數(shù)表示202的多聲道音頻解碼器200。
參數(shù)表示202包括有關(guān)描述多聲道信號(hào)空間特性的一組空間參數(shù)204的信息以及描述多聲道信號(hào)立體聲下混空間特性的解碼器可使用的立體聲參數(shù)206。本發(fā)明的多聲道音頻解碼器200具有參數(shù)重構(gòu)器208，它用于合并解碼器可使用的立體聲參數(shù)206和有關(guān)該組空間參數(shù)的信息以獲得空間參數(shù)210。
圖6所示為根據(jù)本發(fā)明的多聲道音頻解碼器220的實(shí)施例。多聲道音頻解碼器220具有比特流分解器(去多路復(fù)用器(DEMUX))222、音頻解碼器224、參數(shù)重構(gòu)器(聯(lián)合解碼器)226和上混器228。
比特流分解器222接收向后兼容的比特流230，該比特流包括音頻比特流231、有關(guān)一組空間參數(shù)232和解碼器可使用的立體聲參數(shù)234(PS補(bǔ)充信息)的信息。所述比特流分解器分解或去多路復(fù)用向后兼容的比特流230以導(dǎo)出音頻比特流231、以及有關(guān)該組空間參數(shù)232和解碼器可使用立體聲參數(shù)234的信息。音頻解碼器224接收音頻比特流231作為輸入并且根據(jù)音頻比特流231導(dǎo)出單聲道下混信號(hào)236。
參數(shù)重構(gòu)器226接收有關(guān)該組空間參數(shù)232和解碼器可使用立體聲參數(shù)234的信息作為輸入。參數(shù)重構(gòu)器226合并有關(guān)該組空間參數(shù)和解碼器可使用立體聲參數(shù)的信息以導(dǎo)出一組用作上混器228輸入的空間參數(shù)238，所述上混器還接收單聲道下混信號(hào)236作為第二輸入。根據(jù)空間參數(shù)238和單聲道下混信號(hào)236，上混器228導(dǎo)出多聲道信號(hào)240的重構(gòu)作為其輸出。
因此圖6例示采用兼容的比特流作為輸入并且產(chǎn)生包括聲道l、r和c的多聲道音頻信號(hào)的空間音頻解碼器。首先去多路復(fù)用器采用兼容的比特流作為輸入并且將它分解成音頻比特流以及所述空間和PS補(bǔ)充信息。如果應(yīng)用感知音頻編碼給所述單聲道信號(hào)，相應(yīng)的音頻解碼器則采用音頻比特流作為輸入并產(chǎn)生解碼的單聲道音頻信號(hào)m，其經(jīng)受如通過(guò)感知音頻編譯碼器引入的失真。所述聯(lián)合解碼塊采用空間和PS補(bǔ)充信息作為輸入并重構(gòu)空間參數(shù)。最后該空間重構(gòu)采用解碼的單聲道信號(hào)m和空間參數(shù)作為輸入并重構(gòu)所述多聲道音頻信號(hào)。
圖7給出了多聲道音頻解碼器220所使用的參數(shù)重構(gòu)器226的詳細(xì)描述。參數(shù)重構(gòu)器226包括空間參數(shù)反匯編器250、控制單元252、空間參數(shù)預(yù)測(cè)器254、空間參數(shù)匯編器256和第一差分解碼器258、第二差分解碼器260、第三差分解碼器262a、和第四差分解碼器262b。
空間參數(shù)反匯編器250接收有關(guān)該組空間參數(shù)232的信息作為輸入并且根據(jù)有關(guān)該組空間音頻參數(shù)232的信息導(dǎo)出第一子集266和第二子集268。第一子集266包括可能通過(guò)在編碼器側(cè)執(zhí)行的預(yù)測(cè)差分表示所表示的參數(shù)，以及第二子集268包括在比特流中未經(jīng)修改發(fā)送的有關(guān)該組空間參數(shù)信息的子集。
而且，控制單元252可選地從空間參數(shù)反匯編器接收控制信息，該信息指示是否在編碼期間已經(jīng)使用過(guò)預(yù)測(cè)差分表示。在某種意義上即控制單元252能夠可替換地使用適當(dāng)?shù)乃惴▽?dǎo)出是否已經(jīng)執(zhí)行這種預(yù)測(cè)而不用訪問(wèn)指示參數(shù)這種信息是可選的。
參數(shù)的第二子集268被輸入到差分解碼第二子集以導(dǎo)出空間參數(shù)第二子集270的第二差分解碼器260。
第一差分解碼器258接收解碼器可使用的立體聲參數(shù)234作為輸入，以根據(jù)編碼的表示導(dǎo)出參數(shù)立體聲參數(shù)272。空間參數(shù)預(yù)測(cè)器254以與其在編碼器側(cè)上的對(duì)應(yīng)部分相同的方式操作，所以它接收參數(shù)立體聲參數(shù)272作為第一輸入以及空間參數(shù)270作為第二輸入來(lái)導(dǎo)出預(yù)測(cè)的參數(shù)274。
控制單元252控制用于有關(guān)該組空間參數(shù)信息的第一子集的兩種可能不同的數(shù)據(jù)路徑。當(dāng)控制單元252指示還未使用預(yù)測(cè)差分編碼發(fā)送有關(guān)該組空間參數(shù)信息的第一子集時(shí)，控制單元252如此控制開關(guān)278a和278b即第一子集266被輸入到第三差分解碼器262a中以導(dǎo)出該組空間參數(shù)的第一子集280而不應(yīng)用反向預(yù)測(cè)?？臻g參數(shù)的第一子集280然后在該匯編器的第二輸入端被輸入到空間參數(shù)匯編器256中。
但是，如果控制單元252指示差分預(yù)測(cè)的參數(shù)時(shí)，該組空間參數(shù)信息的第一子集266被輸入到第四差分解碼器262b中以在該差分解碼器的輸出端282導(dǎo)出第一子集266的差分預(yù)測(cè)表示。然后，通過(guò)加法器284計(jì)算所述差分表示和預(yù)測(cè)的參數(shù)274之和，因此反轉(zhuǎn)在編碼器側(cè)執(zhí)行的差分預(yù)測(cè)操作。結(jié)果，在空間參數(shù)匯編器256的第二輸入端可獲得空間參數(shù)的第一子集280，空間參數(shù)匯編器256合并空間參數(shù)的第一子集280和空間參數(shù)的第二子集270以在其輸出端提供一組完整的空間參數(shù)290，它是已編碼信號(hào)的多聲道重構(gòu)的基礎(chǔ)。
總而言之，圖7例示采用空間補(bǔ)充信息和PS補(bǔ)充信息作為輸入并且重構(gòu)所述空間參數(shù)的聯(lián)合解碼塊。該去多路復(fù)用器將空間補(bǔ)充信息分割成編碼的空間參數(shù)第二子集和編碼的空間參數(shù)第一子集以及控制信息。所述解碼塊采用編碼的空間參數(shù)第二子集作為輸入并重構(gòu)這個(gè)參數(shù)子集。在編碼器中應(yīng)用這些編碼的情況下這包括霍夫曼解碼和時(shí)間差分(dt)或頻率差分(df)解碼。所述解碼塊采用PS補(bǔ)充信息作為輸入并重構(gòu)(經(jīng)修改的)PS參數(shù)。所述空間參數(shù)預(yù)測(cè)塊采用空間參數(shù)的第二子集和(經(jīng)修改的)PS參數(shù)作為輸入并以與其在編碼器中的對(duì)應(yīng)部分相同的方式計(jì)算空間參數(shù)第一子集的預(yù)測(cè)值。所述控制塊確定其對(duì)應(yīng)部分即編碼器中的控制塊采取哪種選擇判定。根據(jù)這種選擇，直接解碼所述編碼的空間參數(shù)第一子集或者考慮所述預(yù)測(cè)對(duì)其進(jìn)行解碼。在兩種情況下，在編碼器中應(yīng)用這些編碼的情況下這包括霍夫曼解碼和時(shí)間或頻率差分解碼。在所述控制塊確定不使用預(yù)測(cè)的情況下，采用解碼塊的輸出作為重構(gòu)的空間參數(shù)的第一子集。否則，所述解碼塊的輸出包含然后被添加到如通過(guò)空間參數(shù)預(yù)測(cè)所產(chǎn)生的預(yù)測(cè)參數(shù)值，以便獲得所述空間參數(shù)第一子集的原始值的預(yù)測(cè)誤差值。最后重構(gòu)的空間參數(shù)的第一和第二子集被合并形成該組完整的空間參數(shù)。
圖8例示如何通過(guò)傳統(tǒng)參數(shù)立體聲解碼器處理兼容的本發(fā)明比特流來(lái)導(dǎo)出立體聲上混信號(hào)以強(qiáng)調(diào)本發(fā)明構(gòu)思完全向后兼容的重要優(yōu)點(diǎn)。
參數(shù)立體聲解碼器300接收兼容的比特流302作為輸入。參數(shù)立體聲解碼器300包括去多路復(fù)用器304、音頻解碼器306、差分解碼器308和上混器310。去多路復(fù)用器304根據(jù)兼容的比特流302導(dǎo)出音頻比特流312和解碼器可使用的參數(shù)立體聲參數(shù)314。
由于參數(shù)立體聲解碼器300不能對(duì)空間音頻參數(shù)操作，去多路復(fù)用器304例如通過(guò)跳過(guò)對(duì)于所述解碼器未知的比特流中的標(biāo)題字段和相關(guān)數(shù)據(jù)區(qū)，簡(jiǎn)單地忽略包括在兼容比特流302中的空間音頻參數(shù)。音頻比特流312被輸入到導(dǎo)出單聲道下混信號(hào)316的音頻解碼器306中但是解碼器可使用的立體聲參數(shù)314被通過(guò)差分解碼器308差分解碼以導(dǎo)出參數(shù)立體聲參數(shù)318。單聲道下混信號(hào)316和參數(shù)立體聲參數(shù)318被輸入到上混器310，它使用單聲道下混信號(hào)316和參數(shù)立體聲參數(shù)318導(dǎo)出立體聲上混信號(hào)320。
換言之，圖8例示采用兼容比特流作為輸入并產(chǎn)生包括聲道l0和r0的2聲道立體聲音頻信號(hào)的參數(shù)立體聲(PS)解碼器。首先去多路復(fù)用器采用兼容比特流作為輸入并將它分解成音頻比特流和PS補(bǔ)充信息。由于所述空間補(bǔ)充信息被以向后兼容的方式嵌入到兼容的比特流中，它不影響去多路復(fù)用器。如果應(yīng)用感知音頻編碼給單聲道信號(hào)，相應(yīng)的音頻解碼器則采用音頻比特流作為輸入和產(chǎn)生解碼的單聲道音頻信號(hào)m，它經(jīng)受如通過(guò)感知音頻編譯碼器引入的失真。PS解碼塊采用PS補(bǔ)充信息作為輸入并重構(gòu)PS參數(shù)。在編碼器中應(yīng)用這些編碼的情況下這包括霍夫曼解碼和時(shí)間差分(dt)或頻率差分(df)解碼。最后所述PS重構(gòu)采用解碼的單聲道信號(hào)m和PS參數(shù)作為輸入并重構(gòu)2聲道立體聲信號(hào)。
圖9所示為本發(fā)明音頻發(fā)送器或記錄器330，它具有音頻編碼器10、輸入接口332和輸出接口334。
在發(fā)送器/記錄器330的輸入接口332提供音頻信號(hào)。通過(guò)位于發(fā)送器/記錄器內(nèi)的本發(fā)明編碼器10編碼該音頻信號(hào)并且在發(fā)送器/記錄器330的輸出接口334輸出所述編碼表示。然后該編碼表示可以被發(fā)送或存儲(chǔ)在存儲(chǔ)介質(zhì)上。
圖10所示為本發(fā)明的接收器或音頻播放器340，它具有本發(fā)明的音頻解碼器180、比特流輸入端342、和音頻輸出端344。
在本發(fā)明接收器/音頻播放器340的輸入端342輸入比特流。然后通過(guò)解碼器180解碼所述比特流以及在本發(fā)明的接收器/音頻播放器340的輸出端344輸出或播放解碼的信號(hào)。
圖11所示為包括本發(fā)明發(fā)送器330、以及本發(fā)明接收器340的傳輸系統(tǒng)。
編碼在發(fā)送器330的輸入接口332輸入的音頻信號(hào)并從發(fā)送器330的輸出端334傳送到接收器340的輸入端342。接收器解碼該音頻信號(hào)并在其輸出端344重放或輸出音頻信號(hào)。
總結(jié)本發(fā)明的構(gòu)思，可以說(shuō)本發(fā)明涉及以和使用參數(shù)立體聲參數(shù)編碼2聲道立體聲信號(hào)相兼容的方式使用空間音頻參數(shù)編碼音頻信號(hào)的多聲道表示。本發(fā)明教導(dǎo)有效編碼空間音頻參數(shù)和參數(shù)立體聲參數(shù)以及以向后兼容的方式在比特流中嵌入被編碼參數(shù)的新穎方法。特別是本發(fā)明旨在最小化向后兼容比特流中的參數(shù)立體聲和空間音頻參數(shù)的總比特率而不損害解碼的立體聲或多聲道音頻信號(hào)的質(zhì)量。但是，當(dāng)稍微損害的解碼的立體聲信號(hào)質(zhì)量可接受時(shí)，能夠進(jìn)一步減小總比特率。
盡管描述本發(fā)明信號(hào)的向后兼容性及其產(chǎn)生的比特流不包括描述單聲道下混信號(hào)的參數(shù)，但是理所當(dāng)然的是這些參數(shù)能夠被容易地包含在所示的比特流中。
如果能夠?qū)С鲞m當(dāng)?shù)囊?guī)則來(lái)預(yù)測(cè)這些參數(shù)，通過(guò)使用參數(shù)立體聲參數(shù)能夠預(yù)測(cè)任意數(shù)量的空間音頻參數(shù)。所以，以上給出的詳細(xì)的預(yù)測(cè)規(guī)則應(yīng)該理解成僅僅作為實(shí)例。顯然其他預(yù)測(cè)規(guī)則能夠?qū)е峦瑯拥谋忍毓?jié)約效果，所以，本發(fā)明并不局限于使用以上描述的預(yù)測(cè)規(guī)則之一。
盡管導(dǎo)出多聲道信號(hào)的立體聲下混的參數(shù)立體聲下混器58存在于所給出的本發(fā)明編碼器的實(shí)例中，在實(shí)際的實(shí)施中，如果已知下混規(guī)則，并且所以當(dāng)根據(jù)多聲道信號(hào)能夠直接導(dǎo)出參數(shù)立體聲參數(shù)時(shí)，則能夠省略立體聲下混器。
在給定的實(shí)施中，還通過(guò)音頻編碼器編碼單聲道下混信號(hào)或在解碼器側(cè)對(duì)其解碼。這種編碼和解碼是可選的，即省略對(duì)單聲道下混信號(hào)的進(jìn)一步壓縮還將會(huì)產(chǎn)生包含本發(fā)明構(gòu)思的本發(fā)明編碼器和解碼器。
當(dāng)差分預(yù)測(cè)的表示不節(jié)約發(fā)送比特率時(shí)，位于本發(fā)明編碼器和解碼器中的控制單元可以被省略以及在少數(shù)情況下可能為了普通的判定以節(jié)約控制單元為益處和以接受稍微較高的比特率為代價(jià)通過(guò)差分預(yù)測(cè)的參數(shù)表示空間參數(shù)的子集。
盡管，在給定的實(shí)例中，在信號(hào)路徑中應(yīng)用的其他編碼器僅被稱為差分編碼器或差分解碼器，但是應(yīng)該明白還可以使用適于壓縮參數(shù)的任何其他適當(dāng)?shù)木幋a器或解碼器，特別是差分解碼器或編碼器和霍夫曼解碼器或編碼器的組合。這種組合以這樣一種方式被使用，即首先差分編碼所述參數(shù)以及然后霍夫曼編碼差分編碼的參數(shù)，這樣最終使用較小的比特率產(chǎn)生參數(shù)表示，因?yàn)椴罘诸A(yù)測(cè)的表示通常比空間參數(shù)基礎(chǔ)本身具有較低的熵。
總結(jié)本發(fā)明的思想，本發(fā)明教導(dǎo)如下內(nèi)容在第一方面，一種用于兼容編碼多聲道音頻信號(hào)的方法，其特征在于在編碼器側(cè)，下混多聲道信號(hào)成一個(gè)信道表示；在編碼器側(cè)給出所述多聲道信號(hào)，定義表示多聲道信號(hào)的參數(shù)；在編碼器側(cè)給出所述多聲道信號(hào)，定義表示多聲道信號(hào)立體聲下混的參數(shù)；在編碼器側(cè)，以比特率有效和向后兼容的方式在比特流中嵌入兩組參數(shù)；在解碼器側(cè)，從比特流中提取被嵌入的參數(shù)；在解碼器側(cè)，根據(jù)從比特流提取的參數(shù)重構(gòu)表示多聲道信號(hào)的參數(shù)；在解碼器側(cè)，給定根據(jù)比特流數(shù)據(jù)重構(gòu)的參數(shù)，和所述下混的信號(hào)以重構(gòu)多聲道輸出信號(hào)。
作為第二方面，根據(jù)第一方面的方法，其特征在于在所述比特流中嵌入表示立體聲下混的參數(shù)，從而通過(guò)僅支持參數(shù)立體聲解碼的(傳統(tǒng))解碼方法對(duì)它們進(jìn)行解碼。
作為第三方面，根據(jù)第一方面的方法，其特征在于分離表示多聲道信號(hào)的該組參數(shù)成第一子集和第二子集。
作為第四方面，根據(jù)第三方面的方法，其特征在于根據(jù)所述參數(shù)第二子集和表示多聲道信號(hào)立體聲下混的參數(shù)預(yù)測(cè)所述參數(shù)第一子集的值。
作為第五方面，根據(jù)第四方面的方法，其特征在于控制方法，該方法自動(dòng)選擇直接編碼所述參數(shù)的第一子集還是僅編碼和預(yù)測(cè)參數(shù)值相關(guān)的差值。
作為第六方面，根據(jù)第三方面的方法，其特征在于修改表示立體聲下混的參數(shù)，其中使用表示多聲道信號(hào)的原始參數(shù)和表示立體聲下混的原始參數(shù)作為導(dǎo)出修改參數(shù)的基礎(chǔ)。
作為第七方面，根據(jù)第四方面的方法，其特征在于使用查詢表查找所述預(yù)測(cè)的參數(shù)值。
作為第八方面，根據(jù)第四方面的方法，其中在第四方面中使用多項(xiàng)式函數(shù)查找所述預(yù)測(cè)的參數(shù)值。
作為第九方面，根據(jù)第四方面的方法，其特征在于使用根據(jù)被應(yīng)用于產(chǎn)生立體聲下混的方法導(dǎo)出的數(shù)學(xué)函數(shù)查找所述預(yù)測(cè)的參數(shù)值。
作為第十方面，一種用于編碼多聲道音頻信號(hào)表示的設(shè)備，其特征在于用于下混多聲道信號(hào)成一個(gè)信道表示的裝置；用于定義表示多聲道信號(hào)的參數(shù)的裝置；用于定義表示多聲道信號(hào)立體聲下混的參數(shù)的裝置；用于以比特率有效和向后兼容的方式在比特流中嵌入兩組參數(shù)的裝置。
作為第十一方面，一種用于根據(jù)下混的信號(hào)和相應(yīng)的參數(shù)集重構(gòu)多聲道信號(hào)的設(shè)備，其特征在于用于提取在比特流中嵌入的參數(shù)集的裝置；用于根據(jù)從比特流提取的參數(shù)重構(gòu)表示多聲道信號(hào)的參數(shù)的裝置；用于給定根據(jù)比特流數(shù)據(jù)重構(gòu)的參數(shù)集，和所述下混的信號(hào)以重構(gòu)多聲道輸出信號(hào)的裝置。
取決于本發(fā)明方法的某些實(shí)現(xiàn)需求，本發(fā)明的方法能夠以硬件或軟件實(shí)現(xiàn)。這種實(shí)現(xiàn)能夠使用數(shù)字存儲(chǔ)介質(zhì)，特別是光盤如在其上面存儲(chǔ)有電子可讀控制信號(hào)的DVD或CD執(zhí)行，所述介質(zhì)與可編程計(jì)算機(jī)系統(tǒng)互操作以便執(zhí)行本發(fā)明的方法。一般而言，本發(fā)明因此是具有在機(jī)器可讀載體上存儲(chǔ)的程序代碼的計(jì)算機(jī)程序產(chǎn)品，當(dāng)計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)該程序代碼可操作用于執(zhí)行本發(fā)明的方法。換言之，當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí)本發(fā)明的方法因此是具有用于執(zhí)行本發(fā)明方法其中至少之一的程序代碼的計(jì)算機(jī)程序。
盡管已經(jīng)參考本發(fā)明的特定實(shí)施例特定地顯示和描述了以上內(nèi)容，但是本領(lǐng)域的普通技術(shù)人員將會(huì)明白可以在形式和細(xì)節(jié)方面作出各種其他改變而不背離本發(fā)明的精神和范圍。應(yīng)該明白適應(yīng)于不同實(shí)施例可以作出各種改變而不背離這里所公開的以及通過(guò)以下權(quán)利要求書所包含的更為廣泛的構(gòu)思。
權(quán)利要求
1.一種用于處理參數(shù)表示(202)的多聲道音頻解碼器(200)，其中參數(shù)表示(202)包括有關(guān)描述多聲道信號(hào)空間特性的一個(gè)或更多空間參數(shù)的信息(204)以及描述多聲道信號(hào)的立體聲下混空間特性的立體聲參數(shù)(206)，其中有關(guān)一個(gè)或更多空間參數(shù)的信息(204)和立體聲參數(shù)(206)，當(dāng)使用合并規(guī)則被合并時(shí)，產(chǎn)生一個(gè)或更多空間參數(shù)(210)，所述解碼器包括參數(shù)重構(gòu)器(208)，用于使用合并規(guī)則合并立體聲參數(shù)(206)和有關(guān)一個(gè)或更多空間參數(shù)的信息(204)以獲得一個(gè)或更多空間參數(shù)(210)。
2.根據(jù)權(quán)利要求1所述的多聲道音頻解碼器(200)，其中所述合并規(guī)則是所述合并包括通過(guò)由合并立體聲參數(shù)(206)和參數(shù)第一子集導(dǎo)出的替換參數(shù)替換有關(guān)一個(gè)或更多空間參數(shù)信息(204)的參數(shù)的第一子集。
3.根據(jù)權(quán)利要求2所述的多聲道音頻解碼器(200)，其中所述合并規(guī)則是這樣的，即通過(guò)線性合并來(lái)自參數(shù)第一子集的相應(yīng)參數(shù)和該參數(shù)的預(yù)測(cè)導(dǎo)出替換參數(shù)，其中所述預(yù)測(cè)使用有關(guān)一個(gè)或更多空間參數(shù)的信息(204)的第二子集參數(shù)以及立體聲參數(shù)(206)進(jìn)行導(dǎo)出，使用一種預(yù)測(cè)規(guī)則合并它們。
4.根據(jù)權(quán)利要求3所述的多聲道音頻解碼器(200)，其中所述預(yù)測(cè)規(guī)則是使用立體聲參數(shù)(206)導(dǎo)出所述預(yù)測(cè)。
5.根據(jù)權(quán)利要求4所述的多聲道音頻解碼器(200)，其中所述預(yù)測(cè)規(guī)則是立體聲參數(shù)(206)被用作空間參數(shù)的預(yù)測(cè)。
6.根據(jù)前述權(quán)利要求之一所述的多聲道音頻解碼器(200)，其中立體聲參數(shù)(206)包括描述立體聲下混聲道之間強(qiáng)度差的第一參數(shù)P1和描述立體聲下混聲道之間相關(guān)性的第二參數(shù)P2；其中所述參數(shù)的第二子集包括描述多聲道信號(hào)的左聲道和右聲道之和與多聲道信號(hào)的中間聲道之間的強(qiáng)度差的參數(shù)S3；以及所述預(yù)測(cè)規(guī)則是參數(shù)第一子集的參數(shù)S1，即描述多聲道信號(hào)左聲道和右聲道之間的強(qiáng)度差的參數(shù)，根據(jù)以下公式通過(guò)預(yù)測(cè)參數(shù) 進(jìn)行預(yù)測(cè)S^1=X^/Y^,]]>其中，X^=p12S32+q2(p12-1)p12+1,Y^=S32-q2(p12-1)p12+1.]]>
7.根據(jù)前述權(quán)利要求之一所述的多聲道音頻解碼器(200，220)，其中參數(shù)重構(gòu)器(226)還包括用于判定是否通過(guò)替換參數(shù)替換參數(shù)第一子集的判定單元(252)。
8.根據(jù)前述權(quán)利要求之一所述的多聲道音頻解碼器(200，220)，還包括比特流分解器(222)，它從比特流(230)中分解立體聲參數(shù)的表示(234)和有關(guān)一個(gè)或更多空間參數(shù)的信息的表示(232)，其中比特流(230)是向后兼容的以可通過(guò)傳統(tǒng)參數(shù)立體聲設(shè)備進(jìn)行處理。
9.根據(jù)權(quán)利要求8所述的多聲道音頻解碼器(200，220)，還包括熵解碼器和差分解碼器(258，260，262a，262b)，其用于根據(jù)立體聲參數(shù)的表示(234)以及有關(guān)一個(gè)或更多空間參數(shù)的信息的表示(232)以導(dǎo)出立體聲參數(shù)(272)和有關(guān)一個(gè)或更多空間參數(shù)的信息(266，268)。
10.根據(jù)權(quán)利要求8或9所述的多聲道音頻解碼器(220)，其中比特流分解器(222)還操作用于從所述比特流中分解單聲道下混信號(hào)(236)，單聲道下混信號(hào)(236)是多聲道信號(hào)的單聲道下混；以及該解碼器還包括使用下混信號(hào)(236)和一個(gè)或更多參數(shù)(238)導(dǎo)出多聲道信號(hào)(240)重構(gòu)的上混器(228)。
11.根據(jù)權(quán)利要求10所述的多聲道音頻解碼器(220)，還包括音頻解碼器(224)，它用于根據(jù)從比特流(230)中分解的編碼的單聲道下混信號(hào)(231)表示以導(dǎo)出單聲道下混信號(hào)(236)。
12.一種用于導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示(12)的編碼器(10)，參數(shù)表示(12)具有適于和單聲道下混信號(hào)一起使用的參數(shù)，編碼器(10)包括空間參數(shù)計(jì)算器(14)，用于計(jì)算描述多聲道信號(hào)的空間特性的一個(gè)或更多空間參數(shù)(20)；立體聲參數(shù)計(jì)算器(16)，用于計(jì)算描述根據(jù)多聲道信號(hào)所導(dǎo)出的立體聲下混信號(hào)的空間特性的立體聲參數(shù)(22)；參數(shù)合并器(18)，用于通過(guò)使用一種合并規(guī)則合并一個(gè)或更多空間參數(shù)(20)和立體聲參數(shù)(22)產(chǎn)生參數(shù)表示(12)，其中參數(shù)合并器(18)可操作用于使用合并規(guī)則，這種規(guī)則產(chǎn)生解碼器可使用的立體聲參數(shù)(24)和與解碼器可使用的立體聲參數(shù)(24)一起表示一個(gè)或更多空間參數(shù)(20)的有關(guān)一個(gè)或更多空間參數(shù)的信息(26)。
13.根據(jù)權(quán)利要求12所述的編碼器(10；52)，其中立體聲參數(shù)計(jì)算器(16)還包括根據(jù)多聲道信號(hào)(50)導(dǎo)出立體聲下混信號(hào)的立體聲下混器(58)。
14.根據(jù)權(quán)利要求12或13所述的編碼器(10；52)，還包括根據(jù)多聲道信號(hào)(50)導(dǎo)出單聲道下混信號(hào)(68)的空間下混器(54)。
15.根據(jù)權(quán)利要求12到14之一所述的編碼器(10；52)，還包括用于以一種向后兼容于傳統(tǒng)參數(shù)立體聲解碼器的方式導(dǎo)出比特流(82)的比特流計(jì)算器(66)，該比特流包括所述參數(shù)表示和單聲道下混。
16.根據(jù)權(quán)利要求14或15所述的編碼器，其中空間下混器(54)還包括使用一種壓縮規(guī)則壓縮單聲道下混信號(hào)(68)的音頻編碼器(62)。
17.一種處理參數(shù)表示的方法，其中該參數(shù)表示包括有關(guān)描述多聲道信號(hào)空間特性的一個(gè)或更多空間參數(shù)的信息以及描述多聲道信號(hào)立體聲下混空間特性的立體聲參數(shù)，有關(guān)一個(gè)或更多空間參數(shù)的信息以及立體聲參數(shù)，當(dāng)被使用一種合并規(guī)則合并時(shí)，產(chǎn)生一個(gè)或更多空間參數(shù)，該方法包括使用所述合并規(guī)則合并所述立體聲參數(shù)和有關(guān)一個(gè)或更多空間參數(shù)的信息以獲得一個(gè)或更多空間參數(shù)。
18.一種用于導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示的方法，該參數(shù)表示具有適于和單聲道下混信號(hào)一起使用的參數(shù)，該方法包括計(jì)算描述多聲道信號(hào)的空間特性的一個(gè)或更多空間參數(shù)；計(jì)算描述根據(jù)多聲道信號(hào)所導(dǎo)出的立體聲下混信號(hào)的空間特性的立體聲參數(shù)；和通過(guò)使用一種合并規(guī)則合并一個(gè)或更多空間參數(shù)和立體聲參數(shù)產(chǎn)生參數(shù)表示，其中使用所述合并規(guī)則產(chǎn)生解碼器可使用的立體聲參數(shù)和與解碼器可使用的立體聲參數(shù)一起表示一個(gè)或更多空間參數(shù)的有關(guān)一個(gè)或更多空間參數(shù)的信息。
19.一種多聲道音頻信號(hào)的參數(shù)表示，該參數(shù)表示具有適于和單聲道下混信號(hào)一起使用的參數(shù)，其中參數(shù)表示具有描述多聲道信號(hào)立體聲下混空間特性的解碼器可使用的立體聲參數(shù)以及有關(guān)一個(gè)或更多空間參數(shù)的信息，該信息通過(guò)合并描述多聲道音頻信號(hào)空間特性的一個(gè)或更多空間參數(shù)和立體聲參數(shù)產(chǎn)生，以便有關(guān)一個(gè)或更多空間參數(shù)的信息和解碼器可使用的立體聲參數(shù)一起表示所述一個(gè)或更多空間參數(shù)。
20.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，在其上面存儲(chǔ)有根據(jù)權(quán)利要求19所述的多聲道音頻信號(hào)的參數(shù)表示。
21.一種發(fā)送器或音頻記錄器(330)，它具有根據(jù)權(quán)利要求12所述的用于導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示的編碼器。
22.一種接收器或音頻播放器(340)，它具有根據(jù)權(quán)利要求1所述的多聲道音頻解碼器(200)。
23.一種發(fā)送或音頻記錄的方法，該方法具有根據(jù)權(quán)利要求18所述的用于導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示的方法。
24.一種接收或音頻播放的方法，該方法具有根據(jù)權(quán)利要求17所述的用于處理參數(shù)表示的方法。
25.一種具有發(fā)送器(330)和接收器(340)的傳輸系統(tǒng)，其中，發(fā)送器(330)具有根據(jù)權(quán)利要求12所述的用于導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示的編碼器；以及接收器(340)具有根據(jù)權(quán)利要求1所述的多聲道音頻解碼器。
26.一種發(fā)送和接收的方法，該方法包括發(fā)送方法，具有根據(jù)權(quán)利要求18所述用于導(dǎo)出多聲道音頻信號(hào)參數(shù)表示的方法；和接收方法，具有根據(jù)權(quán)利要求17所述用于處理參數(shù)表示的方法。
27.一種計(jì)算機(jī)程序，用于當(dāng)在計(jì)算機(jī)上運(yùn)行時(shí)，執(zhí)行根據(jù)方法權(quán)利要求17、18、23、24或26中任一所述的方法。
全文摘要
當(dāng)使用參數(shù)合并器(18)通過(guò)合并一個(gè)或更多空間參數(shù)(20)以及立體聲參數(shù)(22)產(chǎn)生參數(shù)表示(12)時(shí)，這導(dǎo)致參數(shù)表示(12)具有解碼器可使用的立體聲參數(shù)(24)以及和解碼器可使用的立體聲參數(shù)(24)一起表示一個(gè)或更多空間參數(shù)(20)的有關(guān)一個(gè)或更多空間參數(shù)的信息(26)，能夠以立體聲向后兼容的方式有效地導(dǎo)出多聲道音頻信號(hào)的參數(shù)表示(12)，它具有適于和單聲道下混信號(hào)一起使用以計(jì)算多聲道音頻信號(hào)重構(gòu)的參數(shù)。
文檔編號(hào)G10L19/008GK101036183SQ200580033858
公開日2007年9月12日申請(qǐng)日期2005年10月31日優(yōu)先權(quán)日2004年11月2日
發(fā)明者?？啤て斩鞴? 杰羅恩·布瑞巴特, 艾瑞克·斯奎杰斯, 拉斯·維勒莫斯, 喬納斯·羅丹, 約納斯·恩德加德申請(qǐng)人:編碼技術(shù)股份公司, 皇家飛利浦電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：?？?普恩哈根;杰羅恩.布瑞巴特;艾瑞克.斯奎杰斯;拉斯.維勒莫斯;喬納斯.羅丹;約納斯.恩德加德
技術(shù)所有人：杜比國(guó)際公司;皇家飛利浦電子有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻編解碼芯片相關(guān)技術(shù)

音頻編解碼相關(guān)技術(shù)

silk音頻編解碼協(xié)議相關(guān)技術(shù)

音頻編解碼技術(shù)相關(guān)技術(shù)

音頻編解碼matlab相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

立體聲兼容的多聲道音頻編碼的制作方法