高質(zhì)量音頻的可縮放編碼方法

文檔序號(hào)：7509122閱讀：231來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子電路裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱：高質(zhì)量音頻的可縮放編碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及音頻編碼和解碼，更具體地說(shuō)，涉及可縮放地把音頻數(shù)據(jù)編譯到標(biāo)準(zhǔn)數(shù)據(jù)通道的若干層中以及可縮放地從標(biāo)準(zhǔn)數(shù)據(jù)通道中譯解音頻數(shù)據(jù)。
在最近幾年里，由于各種原因，這種信念受到挑戰(zhàn)。對(duì)于所有樂(lè)音的無(wú)噪聲再現(xiàn)來(lái)說(shuō)，16位PCM的動(dòng)態(tài)范圍過(guò)于有限。當(dāng)音頻被量化成16位PCM時(shí)，微妙的細(xì)節(jié)被丟失。此外，這種看法不能考慮降低量化分辨率，從而以降低信噪比和降低信號(hào)分辨率為代價(jià)提供額外的凈空高度(headroom)的實(shí)踐。由于這些利害關(guān)系的緣故，目前非常需要能夠提供優(yōu)于16位PCM的信號(hào)分辨率的音頻處理。
目前還非常需要多通道音頻。多通道音頻提供音頻的多個(gè)通道，和傳統(tǒng)的單聲道和立體聲技術(shù)相比，這可改善再現(xiàn)聲音的空間化。普通系統(tǒng)提供位于聽(tīng)場(chǎng)(listening field)前后的獨(dú)立左右聲道，并且還可提供中央聲道和次低音聲道(subwoofer channel)。近來(lái)的修改提供圍繞聽(tīng)場(chǎng)的用于再現(xiàn)或合成不同類(lèi)型的音頻數(shù)據(jù)的空間間隔的許多音頻通道。
知覺(jué)(perceptual)編碼是相對(duì)于可比位速率的PCM信號(hào)，提高音頻信號(hào)的感覺(jué)清晰度的多種技術(shù)中的一種。知覺(jué)編碼通過(guò)消除被認(rèn)為與主觀音頻質(zhì)量的保持無(wú)關(guān)的信息，可降低編碼信號(hào)的位速率，同時(shí)保持從編碼信號(hào)恢復(fù)的主觀音頻質(zhì)量。這可通過(guò)把音頻信號(hào)分成頻率分波段信號(hào)，并在引入低到可被解碼信號(hào)本身掩蔽的量化噪聲水平的量化分辨率下量化各個(gè)分波段信號(hào)來(lái)實(shí)現(xiàn)。在指定位速率的約束范圍內(nèi)，通過(guò)對(duì)更高分辨率的第二PCM信號(hào)進(jìn)行知覺(jué)編碼，把編碼信號(hào)的位速率降低到和第一PCM信號(hào)的位速率基本相同，能夠與指定分辨率的第一PCM信號(hào)相比，增大感知的信號(hào)分辨率。隨后可使用這種編碼形式的第二PCM信號(hào)替代第一PCM信號(hào)，并在重放時(shí)譯解所述第二PCM信號(hào)。
知覺(jué)編碼的一個(gè)例子具體體現(xiàn)于遵守在高級(jí)電視標(biāo)準(zhǔn)委員會(huì)(ATSC)A52文件(1994)中規(guī)定的公用ATSC AC-3位流規(guī)范的設(shè)備中。這種特殊的編碼技術(shù)以及其它知覺(jué)編碼技術(shù)具體體現(xiàn)于各種型式的Dolby Digitial編碼器和解碼器中。這些編碼器和解碼器可從California，San Francisco的Dolby Laboratories，Inc.購(gòu)買(mǎi)。知覺(jué)編碼技術(shù)的另一例子體現(xiàn)在遵守MPEG-1音頻編碼標(biāo)準(zhǔn)ISO 11172-3(1993)的設(shè)備中。
常規(guī)知覺(jué)編碼技術(shù)的一個(gè)缺點(diǎn)是對(duì)于指定主觀質(zhì)量水平，知覺(jué)編碼信號(hào)的位速率可能超過(guò)通信通道及存儲(chǔ)介質(zhì)的可用數(shù)據(jù)容量。例如，24位PCM音頻信號(hào)的知覺(jué)編碼會(huì)產(chǎn)生需要比16位寬數(shù)據(jù)通道所提供數(shù)據(jù)容量更大的數(shù)據(jù)容量的知覺(jué)編碼信號(hào)。降低編碼信號(hào)的位速率會(huì)降低可從編碼信號(hào)再現(xiàn)的音頻的主觀質(zhì)量。常規(guī)知覺(jué)編碼技術(shù)的另一缺點(diǎn)是它們不支持譯解單個(gè)知覺(jué)編碼信號(hào)，從而不能在一個(gè)以上的主觀質(zhì)量水平條件下再現(xiàn)音頻信號(hào)。
可縮放編碼技術(shù)是一種能夠提供各種解碼質(zhì)量的技術(shù)。可縮放編碼使用一個(gè)或多個(gè)低分辨率編碼中的數(shù)據(jù)以及擴(kuò)充數(shù)據(jù)，提供音頻信號(hào)的高分辨率編碼?？稍谌舾蓪又刑峁┑头直媛示幋a和擴(kuò)充數(shù)據(jù)。另外還特別需要可縮放的知覺(jué)編碼，尤其是在解碼階段與市場(chǎng)上買(mǎi)得到的16位數(shù)字信號(hào)傳送或存儲(chǔ)裝置向后兼容的可縮放知覺(jué)編碼。
公開(kāi)了只譯解數(shù)據(jù)通道的核心層的系統(tǒng)和方法。另外還公開(kāi)了既譯解核心層又譯解數(shù)據(jù)通道的一層或多層擴(kuò)展層的系統(tǒng)和方法，和只譯解核心層得到的音頻質(zhì)量相比，既譯解核心層又譯解擴(kuò)展層的系統(tǒng)和方法提供更好的音頻質(zhì)量。
本發(fā)明的某些實(shí)施例應(yīng)用于分波段信號(hào)。正如本領(lǐng)域中已知的那樣，可以各種方式產(chǎn)生分波段信號(hào)，包括應(yīng)用諸如正交鏡象濾波器之類(lèi)的數(shù)字濾波器，以及借助各種時(shí)域-頻譜變換及子波變換。
本發(fā)明采用的數(shù)據(jù)通道最好具有遵守音頻工程協(xié)會(huì)(AES)公布的標(biāo)準(zhǔn)AES3的一個(gè)16位寬的核心層和兩個(gè)4位寬的擴(kuò)展層。該標(biāo)準(zhǔn)也被美國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)會(huì)(ANSI)稱為ANSI S4.40。這里把這種數(shù)據(jù)通道稱為標(biāo)準(zhǔn)AES3數(shù)據(jù)通道。
根據(jù)本發(fā)明各個(gè)方面的可縮放音頻編碼和解碼可由分立邏輯組件，一個(gè)或多個(gè)ASIC，程控處理器實(shí)現(xiàn)，并且可由其它可從市場(chǎng)上買(mǎi)到的組件實(shí)現(xiàn)。這些組件的實(shí)現(xiàn)方式對(duì)本發(fā)明并不重要。優(yōu)選實(shí)施例使用程控處理器，例如Motorola的DSP563xx系列數(shù)字信號(hào)處理器。用于這種實(shí)現(xiàn)的程序包括由機(jī)器可讀介質(zhì)，例如基帶或調(diào)制通信路徑和存儲(chǔ)介質(zhì)傳送的指令。通信路徑最好在從超聲波頻率到紫外線頻率的頻譜中。實(shí)際上任意磁或光記錄技術(shù)都可用作存儲(chǔ)介質(zhì)，包括磁帶、磁盤(pán)和光盤(pán)。
根據(jù)本發(fā)明的各個(gè)方面，根據(jù)本發(fā)明編碼的音頻信息可由這樣的機(jī)器可讀介質(zhì)傳送給路由器、解碼器及其它處理器，并且可被這樣的機(jī)器可讀介質(zhì)保存，以便稍后再發(fā)送、解碼或進(jìn)行其它處理。在優(yōu)選實(shí)施例中，音頻信息按照本發(fā)明編碼，并存儲(chǔ)到諸如光盤(pán)之類(lèi)的機(jī)器可讀介質(zhì)上。最好按照各種幀和/或其它公開(kāi)的數(shù)據(jù)結(jié)構(gòu)格式化這種數(shù)據(jù)。隨后解碼器可讀取存儲(chǔ)的信息進(jìn)行解碼和重放。這種解碼器不必包含編碼功能。
根據(jù)本發(fā)明一方面的可縮放編碼過(guò)程利用具有一個(gè)核心層和一個(gè)或多個(gè)擴(kuò)展層的數(shù)據(jù)通道。接收若干分波段信號(hào)。根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率，并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第一編碼信號(hào)。根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率，并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第二編碼信號(hào)。產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間的殘數(shù)的殘數(shù)信號(hào)。第一編碼信號(hào)被輸出到核心層，殘數(shù)信號(hào)被輸出到擴(kuò)展層。
根據(jù)本發(fā)明的另一方面，音頻信號(hào)的編碼過(guò)程使用具有若干層的標(biāo)準(zhǔn)數(shù)據(jù)通道。接收若干分波段信號(hào)。產(chǎn)生分波段信號(hào)的知覺(jué)編碼和第二編碼。產(chǎn)生指示相對(duì)于知覺(jué)編碼的第二編碼殘數(shù)的殘數(shù)信號(hào)。知覺(jué)編碼被輸出到數(shù)據(jù)通道的第一層中，殘數(shù)信號(hào)被輸出到數(shù)據(jù)通道的第二層中。
根據(jù)本發(fā)明的另一方面，標(biāo)準(zhǔn)數(shù)據(jù)通道的處理系統(tǒng)包括存儲(chǔ)器和程控處理器。存儲(chǔ)器包括按照本發(fā)明對(duì)音頻信息編碼的指令程序。程控處理器與存儲(chǔ)器耦接，以便接收所述指令程序，并且還被耦接成接收若干分波段信號(hào)，以便進(jìn)行處理。根據(jù)指令程序，程控處理器按照本發(fā)明處理分波段信號(hào)。在一個(gè)實(shí)施例中，這包括按照上面說(shuō)明的可縮放編碼過(guò)程，把第一編碼或知覺(jué)編碼信號(hào)輸出到數(shù)據(jù)通道的一層中，把殘數(shù)信號(hào)輸出到數(shù)據(jù)通道的另一層中。
根據(jù)本發(fā)明的另一方面，數(shù)據(jù)處理方法使用具有包含音頻信號(hào)的知覺(jué)編碼的第一層和包含用于提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)的第二層的多層數(shù)據(jù)通道。根據(jù)該方法，通過(guò)數(shù)據(jù)通道接收音頻信號(hào)的知覺(jué)編碼和擴(kuò)充數(shù)據(jù)。知覺(jué)編碼被送給解碼器或者其它處理器進(jìn)行進(jìn)一步的處理。在不考慮擴(kuò)充數(shù)據(jù)的情況下，這可包括譯解知覺(jué)編碼產(chǎn)生第一解碼信號(hào)。另一方面，擴(kuò)充數(shù)據(jù)可被送到解碼器或者其它處理器，并在所述解碼器或者其它處理器與知覺(jué)編碼組合產(chǎn)生第二編碼信號(hào)，譯解所述第二編碼信號(hào)產(chǎn)生分辨率高于第一解碼信號(hào)的第二解碼信號(hào)。
根據(jù)本發(fā)明的另一方面，公開(kāi)了處理多層數(shù)據(jù)通道上的數(shù)據(jù)的處理系統(tǒng)。多層數(shù)據(jù)通道具有包含音頻信號(hào)的知覺(jué)編碼的第一層和包含用于提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)的第二層。處理系統(tǒng)包括信號(hào)路由電路、存儲(chǔ)器和程控處理器。信號(hào)路由電路通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù)，并把知覺(jué)數(shù)據(jù)和可選的擴(kuò)充數(shù)據(jù)送到程控處理器。存儲(chǔ)器存儲(chǔ)根據(jù)本發(fā)明處理音頻信息的指令程序。程控處理器與信號(hào)路由電路耦合，以便接收知覺(jué)編碼，程控處理器還與存儲(chǔ)器耦合，以便接收指令程序。根據(jù)指令程序，程控處理器按照本發(fā)明處理知覺(jué)編碼及可選的擴(kuò)充數(shù)據(jù)。在一個(gè)實(shí)施例中，這包括如上所述的一層或多層信息的路由和解碼。
根據(jù)本發(fā)明的另一方面，機(jī)器可讀介質(zhì)包含按照本發(fā)明執(zhí)行編碼過(guò)程的機(jī)器可執(zhí)行的指令程序。根據(jù)本發(fā)明的另一方面，機(jī)器可讀介質(zhì)包含根據(jù)本發(fā)明執(zhí)行路由和/或譯解多層數(shù)據(jù)通道所攜帶的數(shù)據(jù)的方法的機(jī)器可執(zhí)行的指令程序。前面及在下面的詳細(xì)說(shuō)明中公開(kāi)了這種編碼、路由和解碼的例子。根據(jù)本發(fā)明的另一例子，機(jī)器可讀介質(zhì)包含根據(jù)本發(fā)明編碼的編碼音頻信息，例如按照公開(kāi)的過(guò)程或方法處理的任意信息。
根據(jù)本發(fā)明的另一方面，可以各種方式實(shí)現(xiàn)本發(fā)明的編碼和解碼過(guò)程。例如，可由諸如可編程數(shù)字信號(hào)處理器或計(jì)算機(jī)處理器之類(lèi)機(jī)器執(zhí)行，從而實(shí)現(xiàn)這種過(guò)程的指令程序可由機(jī)器可讀的介質(zhì)傳送，機(jī)器可讀取所述介質(zhì)，獲得所述程序，并且根據(jù)所述程序執(zhí)行這樣的過(guò)程。通過(guò)只借助所述介質(zhì)傳送相應(yīng)的程序材料，機(jī)器可專(zhuān)用于只執(zhí)行一部分的這種過(guò)程。
結(jié)合附圖，參考下面的說(shuō)明將更好地理解本發(fā)明的各種特征及其優(yōu)選實(shí)施例，附圖中，相同的附圖標(biāo)記代表相同的部分。下述說(shuō)明的內(nèi)容及附圖僅僅是作為本發(fā)明的例子給出的，不應(yīng)被理解為代表對(duì)本發(fā)明的范圍的限制。

圖1B是對(duì)音頻信號(hào)編碼和/或解碼的計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)的示意圖。
圖2A是按照心理聲學(xué)原理和數(shù)據(jù)容量標(biāo)準(zhǔn)對(duì)音頻通道編碼的過(guò)程的流程圖。
圖2B是包含一連串幀的數(shù)據(jù)通道的示意圖，每一幀包括一連串的字，每個(gè)字的寬度為16位。
圖3A是包括組織成多幀、多段和多部分的若干層的可縮放數(shù)據(jù)通道的示意圖。
圖3B是可縮放數(shù)據(jù)通道的幀的示意圖。
圖4A是可縮放編碼過(guò)程的流程圖。
圖4B是確定圖4A中圖解說(shuō)明的可縮放編碼過(guò)程的恰當(dāng)量化分辨率的過(guò)程的流程圖。
圖5是圖解說(shuō)明可縮放解碼過(guò)程的流程圖。
圖6A是可縮放數(shù)據(jù)通道的幀的示意圖。
圖6B是圖6A中圖解說(shuō)明的音頻段和音頻擴(kuò)充段的優(yōu)選結(jié)構(gòu)的示意圖。
圖6C是圖6A中圖解說(shuō)明的元數(shù)據(jù)段的優(yōu)選結(jié)構(gòu)的示意圖。
圖6D是圖6A中圖解說(shuō)明的元數(shù)據(jù)擴(kuò)充段的優(yōu)選結(jié)構(gòu)的示意圖。
可利用各種技術(shù)產(chǎn)生分波段信號(hào)。一種技術(shù)是對(duì)音頻數(shù)據(jù)應(yīng)用頻譜變換，在譜域中產(chǎn)生分波段信號(hào)單元。一個(gè)或多個(gè)相鄰的分波段信號(hào)單元可被組合成組，形成分波段信號(hào)。形成指定分波段信號(hào)的分波段信號(hào)單元的數(shù)目及身份可預(yù)先確定，或者可以被編碼的音頻數(shù)據(jù)的特征為基礎(chǔ)。適宜的頻譜變換的例子包括離散傅里葉變換(DFT)和包括有時(shí)稱為時(shí)域假信號(hào)消除(TDAC)變換的特殊的改進(jìn)離散余弦變換(MDCT)的各種離散余弦變換(DCT)。在Princen，Johnson和Bradley的“Subband/Transform Coding Using Filter Bank Designs Based On Time DomainAliasing Cancellation”，Proc.Int.Conf.Acoust，Speech，and SignalProc.，pp.2161-2164，1987年5月中說(shuō)明了時(shí)域假信號(hào)消除(TDAC)變換。產(chǎn)生分波段信號(hào)的另一種技術(shù)是把一組串聯(lián)的正交鏡象濾波器(QMF)或者其它一些帶通濾波器應(yīng)用于音頻數(shù)據(jù)，產(chǎn)生分波段信號(hào)。雖然實(shí)現(xiàn)方法的選擇對(duì)編碼系統(tǒng)的性能具有深遠(yuǎn)的影響，但是在原理上，對(duì)于本發(fā)明來(lái)說(shuō)，不存在任何重要的特殊實(shí)現(xiàn)方法。
這里術(shù)語(yǔ)“分波段”被用于表示音頻信號(hào)的一部分帶寬。術(shù)語(yǔ)“分波段信號(hào)”被用于表示代表分波段的信號(hào)。術(shù)語(yǔ)“分波段信號(hào)單元”被用于表示分波段信號(hào)的單元或組分。例如，在使用頻譜變換的實(shí)現(xiàn)中，分波段信號(hào)單元是變換系數(shù)。出于簡(jiǎn)便起見(jiàn)，這里把分波段信號(hào)的產(chǎn)生稱為分波段濾波，而不管是通過(guò)應(yīng)用頻譜變換還是其它類(lèi)型的濾波器實(shí)現(xiàn)這種信號(hào)產(chǎn)生的。這里，濾波器本身被稱為濾波器組，或者更特別地被稱為分析濾波器組。按照常規(guī)的方式，合成濾波器組與分析濾波器組相反或者基本相反。
可提供糾錯(cuò)信息，以便檢測(cè)根據(jù)本發(fā)明處理的數(shù)據(jù)中的一個(gè)或多個(gè)錯(cuò)誤。錯(cuò)誤可產(chǎn)生于，例如這種數(shù)據(jù)的傳輸或緩沖過(guò)程中，在重放數(shù)據(jù)之前檢測(cè)錯(cuò)誤并恰當(dāng)?shù)匦Ｕ龜?shù)據(jù)通常都是有益的。術(shù)語(yǔ)“糾錯(cuò)”指的是任意錯(cuò)誤檢測(cè)和/或校正方案，例如奇偶校驗(yàn)位、循環(huán)冗余碼、檢查和和Reed-Solomon碼。
現(xiàn)在參考圖1A，圖中示意表示了根據(jù)本發(fā)明的對(duì)音頻數(shù)據(jù)編碼和解碼的處理系統(tǒng)100的一個(gè)實(shí)施例的方框圖。處理系統(tǒng)100包括按照常規(guī)方式由總線116互連的程控處理器110、只讀存儲(chǔ)器120、隨機(jī)存取存儲(chǔ)器130和音頻輸入/輸出接口140。程控處理器110是可從Motorola買(mǎi)到的DSP563xx型數(shù)字信號(hào)處理器。只讀存儲(chǔ)器120和隨機(jī)存取存儲(chǔ)器130具有常規(guī)的設(shè)計(jì)。只讀存儲(chǔ)器120存儲(chǔ)有指令程序，允許程控處理器110如同參考圖2A-7D說(shuō)明的那樣執(zhí)行分析和合成功能，以及處理音頻信號(hào)。當(dāng)處理系統(tǒng)100處于掉電狀態(tài)時(shí)，程序原樣保存在只讀存儲(chǔ)器120中。根據(jù)本發(fā)明，實(shí)際也可用任意磁或光記錄技術(shù)，例如使用磁帶、磁盤(pán)或光盤(pán)的那些磁或光記錄技術(shù)代替只讀存儲(chǔ)器120。隨機(jī)存取存儲(chǔ)器130按照常規(guī)方式為程控處理器110緩沖指令和數(shù)據(jù)，包括接收的和處理的信號(hào)。音頻輸入/輸出接口140包括把一層或多層接收信號(hào)送到其它組件，例如程控處理器110的信號(hào)路由電路。信號(hào)路由電路可包括輸入和輸出信號(hào)的獨(dú)立端子，或者可使用相同端子進(jìn)行輸入和輸出。通過(guò)忽略合成和解碼指令，處理系統(tǒng)100可專(zhuān)用于編碼，另一方面，通過(guò)忽略分析和編碼指令，處理系統(tǒng)100也可專(zhuān)用于解碼。處理系統(tǒng)100是適于實(shí)現(xiàn)本發(fā)明的典型處理操作的代表，并不是用來(lái)描述本發(fā)明的特殊硬件實(shí)現(xiàn)。
為了進(jìn)行編碼，程控處理器110從只讀存儲(chǔ)器120獲取編碼指令程序。在音頻輸入/輸出接口140，音頻信號(hào)被提供給處理器100，并且被送給程控處理器110以便進(jìn)行編碼。響應(yīng)編碼指令程序，分析濾波器組對(duì)音頻信號(hào)濾波，產(chǎn)生分波段信號(hào)，并且分波段信號(hào)被編碼，從而產(chǎn)生編碼信號(hào)。編碼信號(hào)通過(guò)音頻輸入/輸出接口140被提供給其它器件，或者被存儲(chǔ)在隨機(jī)存取存儲(chǔ)器130中。
為了進(jìn)行解碼，程控處理器110從只讀存儲(chǔ)器120獲取解碼指令程序。最好已按照本發(fā)明編碼的音頻信號(hào)在音頻輸入/輸出接口140被提供給處理系統(tǒng)100，并且被送給程控處理器110以便進(jìn)行解碼。響應(yīng)解碼指令程序，譯解音頻信號(hào)，獲得相應(yīng)的分波段信號(hào)，并且分波段信號(hào)被合成濾波器組過(guò)濾，從而獲得輸出信號(hào)。輸出信號(hào)通過(guò)音頻輸入/輸出接口140被提供給其它器件，或者被存儲(chǔ)在隨機(jī)存取存儲(chǔ)器130中。
現(xiàn)在參見(jiàn)圖1B，圖中表示了根據(jù)本發(fā)明用于對(duì)音頻信號(hào)編碼和解碼的計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150的一個(gè)實(shí)施例的示意方框圖。計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150包括由總線158按照常規(guī)方式互連的中央處理器152、隨機(jī)存取存儲(chǔ)器153、硬盤(pán)154、輸入裝置155、端子156和輸出裝置157。中央處理器152最好實(shí)現(xiàn)Intelx86指令集體系結(jié)構(gòu)，最好包括支持實(shí)現(xiàn)浮點(diǎn)算術(shù)處理的硬件，并且可以是，例如可從California Santa Clara的Intel公司購(gòu)買(mǎi)的IntelPentiumIII微處理器。音頻信息通過(guò)端子156被提供給計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150，并被送給中央處理器152。存儲(chǔ)在硬盤(pán)154上的指令程序允許計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150按照本發(fā)明處理音頻數(shù)據(jù)。處理后的呈數(shù)字形式的音頻數(shù)據(jù)隨后通過(guò)端子被提供156，或者被記錄并存儲(chǔ)在硬盤(pán)154中。
可以預(yù)料本發(fā)明的處理系統(tǒng)100、計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150及其它實(shí)施例將用在可能既包括音頻處理又包括視頻處理的應(yīng)用中。典型的視頻應(yīng)用會(huì)使其操作與視頻時(shí)鐘信號(hào)和音頻時(shí)鐘信號(hào)同步。視頻時(shí)鐘信號(hào)向視頻幀提供同步基準(zhǔn)。視頻時(shí)鐘信號(hào)可向NTSC、PAL幀或者ATSC視頻信號(hào)提供基準(zhǔn)。音頻時(shí)鐘信號(hào)向音頻樣本提供同步基準(zhǔn)。時(shí)鐘信號(hào)可具有任意頻率。例如，在專(zhuān)業(yè)應(yīng)用中，48kHZ是常見(jiàn)的音頻時(shí)鐘頻率。對(duì)于實(shí)踐本發(fā)明來(lái)說(shuō)，不存在特別重要的時(shí)鐘信號(hào)或時(shí)鐘信號(hào)頻率。
現(xiàn)在參見(jiàn)圖2A，圖中表示了按照心理聲學(xué)及數(shù)據(jù)容量標(biāo)準(zhǔn)，把音頻數(shù)據(jù)編碼到數(shù)據(jù)通道中的過(guò)程200的流程圖。另外還參見(jiàn)圖2B，圖中表示了數(shù)據(jù)通道250的方框圖。數(shù)據(jù)通道250包括一系列幀260，每一幀260包括一系列的字。每個(gè)字被表示為一系列的位(n)，這里n是介于0和15之間的整數(shù)(包括0和15)，并且符號(hào)位(n～m)表示字的位(n)～位(m)。每一幀260包括控制段270和音頻段280，控制段270和音頻段280均包含相應(yīng)整數(shù)數(shù)量的幀260的字。
在步驟210，接收代表音頻信號(hào)的第一數(shù)據(jù)塊的若干分波段信號(hào)。每個(gè)分波段信號(hào)包含一個(gè)或多個(gè)分波段單元，每個(gè)分波段單元由一個(gè)字代表。在步驟212，分析分波段信號(hào)，確定聽(tīng)覺(jué)掩蔽曲線。聽(tīng)覺(jué)掩蔽曲線指出在聽(tīng)不見(jiàn)的情況下，可注入各個(gè)相應(yīng)分波段中的噪聲的最大量。在這方面，什么是聽(tīng)得見(jiàn)的是以人類(lèi)聽(tīng)力的心理聲學(xué)模型為基礎(chǔ)的，并且可能涉及分波段信號(hào)代表多個(gè)音頻通道的交叉通道掩蔽特性。聽(tīng)覺(jué)掩蔽曲線用作理想噪聲頻譜的第一估計(jì)。在步驟214，分析理想的噪聲頻譜，確定各個(gè)分波段信號(hào)的相應(yīng)量化分辨率，以致當(dāng)據(jù)此量化分波段信號(hào)，并且隨后對(duì)分波段信號(hào)解量化并將其轉(zhuǎn)換成聲波時(shí)，所得到的編碼噪聲在理想噪聲頻譜之下。在步驟216確定據(jù)此量化的分波段信號(hào)是否能夠在音頻段280的范圍內(nèi)，并且基本填滿音頻段280。如果否，則在步驟218調(diào)整理想噪聲頻譜，并重復(fù)步驟214、216。如果是，則在步驟220據(jù)此量化分波段信號(hào)，并在步驟222把分波段信號(hào)輸入音頻段280。
為幀260的控制段270產(chǎn)生控制數(shù)據(jù)。這包括輸出到控制段270的第一字272中的同步模式。同步模式使解碼器能夠與數(shù)據(jù)通道250中的連續(xù)幀260同步。指示幀速率，段260、270的邊界，編碼操作的參數(shù)及檢錯(cuò)信息的輔助控制數(shù)據(jù)被輸出到控制段270的剩余部分274中。對(duì)于音頻信號(hào)的各個(gè)數(shù)據(jù)塊重復(fù)該過(guò)程，同時(shí)每個(gè)順序數(shù)據(jù)塊最好被編碼到數(shù)據(jù)通道250的相應(yīng)順序幀260中。
過(guò)程200可用于把數(shù)據(jù)編碼到多層音頻通道的一層或多層中。在按照過(guò)程200對(duì)一層以上的多層編碼的情況下，這些層中攜帶的數(shù)據(jù)之間可能存在大致的相關(guān)性，因此顯著浪費(fèi)了多層音頻通道的數(shù)據(jù)容量。下面說(shuō)明把擴(kuò)充數(shù)據(jù)編碼輸出到數(shù)據(jù)通道的第二層中，從而提高這種數(shù)據(jù)通道的第一層中攜帶的數(shù)據(jù)的分辨率的可縮放過(guò)程。分辨率的提高最好可以表述為第一層的編碼參數(shù)的功能關(guān)系，例如當(dāng)被應(yīng)用于用于對(duì)第一層編碼的理想噪聲頻譜時(shí)，產(chǎn)生用于對(duì)第二層編碼的理想噪聲頻譜的偏移量。隨后這種偏移量可被輸出到數(shù)據(jù)通道的確定位置，例如在第二層的某一字段或分段中，向解碼器指出提高的數(shù)值。所述提高數(shù)值隨后可用于確定第二層中每個(gè)分波段信號(hào)單元或與之相關(guān)的信息的位置。接下來(lái)說(shuō)明的是用于據(jù)此組織可縮放數(shù)據(jù)通道的幀結(jié)構(gòu)。
現(xiàn)在參見(jiàn)圖3A，圖中表示了包括核心層310、第一擴(kuò)展層320和第二擴(kuò)展層330的可縮放數(shù)據(jù)通道300的一個(gè)實(shí)施例的示意圖。核心層310的寬度為L(zhǎng)位，第一擴(kuò)展層320的寬度為M位，第二擴(kuò)展層330的寬度為N位，L、M、N為正整數(shù)。核心層310包括一序列的L位字。核心層310和第一擴(kuò)展層320的組合包括一系列的(L+N)位字，核心層310、第一擴(kuò)展層320和第二擴(kuò)展層330的組合包括一系列的(L+M+N)位字。這里符號(hào)(n～m)用于表示字的位(n)～位(m)，這里n和m是整數(shù)，并且m＞n，并且m、n可以介于0～23之間(含0和23)?？煽s放的數(shù)據(jù)通道300可以是，例如L、M、N分別等于16、4和4的24位寬的標(biāo)準(zhǔn)AES3數(shù)據(jù)通道。
根據(jù)本發(fā)明，可縮放的數(shù)據(jù)通道300可被組織成一系列的幀340。各幀340被分離成控制段350和跟隨其后的音頻段360?？刂贫?50包括由控制段350與核心層310的交集確定的核心層部分352，由控制段350與第一擴(kuò)展層320的交集確定的第一擴(kuò)展層部分354，以及由控制段350與第二擴(kuò)展層330的交集確定的第二擴(kuò)展層部分356。音頻段360包括第一子段和第二子段370、380。第一子段370包括由第一子段370與核心層310的交集確定的核心層部分372，由第一子段370與第一擴(kuò)展層320的交集確定的第一擴(kuò)展層部分374，以及由第一子段370與第二擴(kuò)展層330的交集確定的第二擴(kuò)展層部分376。類(lèi)似地，第二子段380包括由第二子段380與核心層310的交集確定的核心層部分382，由第二子段380與第一擴(kuò)展層320的交集確定的第一擴(kuò)展層部分384，以及由第二子段380與第二擴(kuò)展層330的交集確定的第二擴(kuò)展層部分386。
本實(shí)施例中，核心層部分372、382攜帶按照心理聲學(xué)標(biāo)準(zhǔn)壓縮的編碼音頻數(shù)據(jù)，從而編碼音頻數(shù)據(jù)在核心層310的范圍內(nèi)。以編碼過(guò)程的輸入的形式提供的音頻數(shù)據(jù)可包括，例如均由寬度為P位的字表示的分波段信號(hào)單元，整數(shù)P大于L。隨后可應(yīng)用心理聲學(xué)原理把分波段信號(hào)單元編碼成平均寬度約為L(zhǎng)位的編碼值或“符號(hào)”。從而分波段信號(hào)單元占據(jù)的數(shù)據(jù)體積被顯著壓縮，從而可以通過(guò)核心層310便利地傳輸分波段信號(hào)。編碼操作最好與L位寬數(shù)據(jù)通道上音頻數(shù)據(jù)的常規(guī)音頻傳輸標(biāo)準(zhǔn)一致，以致可按照常規(guī)方式譯解核心層310。第一擴(kuò)展層部分374、384攜帶擴(kuò)充數(shù)據(jù)，所述擴(kuò)充數(shù)據(jù)可與核心層310中的編碼信息結(jié)合使用，恢復(fù)與只根據(jù)核心層310中的編碼信息恢復(fù)的音頻信號(hào)相比，分辨率更高的音頻信號(hào)。第二擴(kuò)展層部分376、386攜帶輔助擴(kuò)充數(shù)據(jù)，所述輔助擴(kuò)充數(shù)據(jù)可與核心層310及第一擴(kuò)展層320中的編碼信息結(jié)合使用，恢復(fù)與只根據(jù)核心層310和第一擴(kuò)展層320的結(jié)合體中攜帶的編碼信息恢復(fù)的音頻信號(hào)相比，分辨率更高的音頻信號(hào)。本例中，第一子段370攜帶左聲道CH_L的編碼音頻數(shù)據(jù)，第二子段380攜帶右聲道CH_R的編碼音頻數(shù)據(jù)。
控制段350的核心層部分352攜帶用于控制解碼過(guò)程的操作的控制數(shù)據(jù)。這種控制數(shù)據(jù)可包括指示幀340的起始位置的同步數(shù)據(jù)，指示程序結(jié)構(gòu)(program configuration)和幀速率的格式數(shù)據(jù)，指示幀340中段及子段的邊界的段數(shù)據(jù)，指示編碼操作參數(shù)的參數(shù)數(shù)據(jù)，以及保護(hù)核心層部分352中的數(shù)據(jù)的檢錯(cuò)信息。最好在核心層部分352中為每種控制數(shù)據(jù)設(shè)置預(yù)定或確定的位置，從而允許解碼器從核心層部分352中快速解析每種控制數(shù)據(jù)。根據(jù)本實(shí)施例，譯解和處理核心層310所必不可少的所有控制數(shù)據(jù)都包含在核心層部分352中。這允許例如由信號(hào)路由電路剝離或丟棄擴(kuò)展層320、330，而不會(huì)損失基本控制數(shù)據(jù)，從而支持與被設(shè)計(jì)成接收格式化成L位字的數(shù)據(jù)兼容的數(shù)字信號(hào)處理器。根據(jù)本實(shí)施例，擴(kuò)展層320、330的輔助控制數(shù)據(jù)可包含在擴(kuò)展層部分354中。
在控制段350中，層310、320、330都最好攜帶用于譯解音頻段360中編碼音頻數(shù)據(jù)的相應(yīng)部分的參數(shù)及其它信息。例如，核心層部分352可攜帶聽(tīng)覺(jué)掩蔽曲線的偏移量，所述聽(tīng)覺(jué)掩蔽曲線產(chǎn)生用于把信息知覺(jué)編碼到核心層部分372、382中的第一理想噪聲頻譜。類(lèi)似地，第一擴(kuò)展層部分354可攜帶第一理想噪聲頻譜的偏移量，所述第一理想噪聲頻譜產(chǎn)生用于把信息編碼到擴(kuò)展層部分374、384中的第二理想噪聲頻譜，第二擴(kuò)展層部分356可攜帶第二理想噪聲頻譜的偏移量，所述第二理想噪聲頻譜產(chǎn)生用于把信息編碼到第二擴(kuò)展層部分376、386中的第三理想噪聲頻譜。
現(xiàn)在參見(jiàn)圖3B，圖中表示了可縮放數(shù)據(jù)通道300的備選幀390的示意圖。幀390包括幀340的控制段350和音頻段360。在幀390中，控制段350還包括分別位于核心層310、第一擴(kuò)展層320及第二擴(kuò)展層330中的字段392、394和396。
字段392攜帶指出擴(kuò)充數(shù)據(jù)的組織的標(biāo)記。根據(jù)第一標(biāo)記值，按照預(yù)定的結(jié)構(gòu)組織擴(kuò)充數(shù)據(jù)。所述預(yù)定結(jié)構(gòu)最好是幀340的結(jié)構(gòu)，以便用于左聲道CH_L的擴(kuò)充數(shù)據(jù)包含在第一子段370中，用于右聲道CH_R的擴(kuò)充數(shù)據(jù)包含在第二子段380中。這里把其中各個(gè)通道的核心及擴(kuò)充數(shù)據(jù)包含在同一子段中的結(jié)構(gòu)稱為校準(zhǔn)結(jié)構(gòu)(aligned configuration)。根據(jù)第二標(biāo)記值，擴(kuò)充數(shù)據(jù)以自適應(yīng)方式分布在擴(kuò)展層320、330中，字段394、396分別包含各個(gè)相應(yīng)音頻通道的擴(kuò)充數(shù)據(jù)包含在何處的指示。
字段392的大小最好足以包含用于控制段350的核心層部分352中的數(shù)據(jù)的檢錯(cuò)碼。由于這種控制數(shù)據(jù)控制核心層310的解碼操作，因此保護(hù)這種控制數(shù)據(jù)是最好不過(guò)的。另一方面，字段392可包含保護(hù)音頻段360的核心層部分372、382的檢錯(cuò)碼。不需要為擴(kuò)展層320、330中的數(shù)據(jù)提供任何檢錯(cuò)，因?yàn)橐话銇?lái)說(shuō)在核心層310的寬度L足夠的情況下，這種錯(cuò)誤的效果幾乎是不能感覺(jué)到的。例如，在核心層310被知覺(jué)(perceptually)編碼成16位字深度(depth)的情況下，擴(kuò)充數(shù)據(jù)主要提供微妙的細(xì)節(jié)，一般來(lái)說(shuō)，解碼和重放時(shí)，擴(kuò)充數(shù)據(jù)中的錯(cuò)誤是難以聽(tīng)見(jiàn)的。
字段394、396可分別包含一個(gè)檢錯(cuò)碼。所述檢錯(cuò)碼分別為擴(kuò)展層320、330提供保護(hù)，所述檢錯(cuò)碼分別包含在擴(kuò)展層320、330中。這最好包括控制數(shù)據(jù)的錯(cuò)誤檢測(cè)，不過(guò)也可包括音頻數(shù)據(jù)的錯(cuò)誤檢測(cè)，或者同時(shí)包括控制數(shù)據(jù)及音頻數(shù)據(jù)的錯(cuò)誤檢測(cè)?？蔀閿U(kuò)展層320、330分別規(guī)定兩種不同的檢錯(cuò)碼。第一檢錯(cuò)碼規(guī)定按照預(yù)定的結(jié)構(gòu)，例如幀340的結(jié)構(gòu)組織相應(yīng)擴(kuò)展層的擴(kuò)充數(shù)據(jù)。各層的第二檢錯(cuò)碼規(guī)定相應(yīng)層的擴(kuò)充數(shù)據(jù)分布在相應(yīng)層中，并且規(guī)定指針包含在控制段350中以指示該擴(kuò)充數(shù)據(jù)的位置。擴(kuò)充數(shù)據(jù)最好和核心層310中的相應(yīng)數(shù)據(jù)一樣，位于數(shù)據(jù)通道300的相同幀390中。預(yù)定結(jié)構(gòu)可用于組織某一擴(kuò)展層及指針，從而組織另一擴(kuò)展層及其它指針。檢錯(cuò)碼也可以是糾錯(cuò)碼。
現(xiàn)在參見(jiàn)圖4A，圖中表示了根據(jù)本發(fā)明的可縮放編碼過(guò)程400的實(shí)施例的流程圖。該實(shí)施例使用圖3A中所示的數(shù)據(jù)通道300的核心層310和第一擴(kuò)展層320。在步驟402接收若干分波段信號(hào)，每個(gè)分波段信號(hào)包含一個(gè)或多個(gè)分波段信號(hào)單元。在步驟404，響應(yīng)第一理想噪聲頻譜，確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率。根據(jù)心理聲學(xué)原理，并且最好還根據(jù)核心層310的數(shù)據(jù)容量要求，確定第一理想噪聲頻譜。這種要求可以是，例如核心層部分372、382的總數(shù)據(jù)容量極限。按照相應(yīng)的第一量化分辨率量化分波段信號(hào)，產(chǎn)生第一編碼信號(hào)。在步驟406，第一編碼信號(hào)被輸出到音頻段360的核心層部分372、382中。
在步驟408，確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率。最好根據(jù)核心層和第一擴(kuò)展層310、320的結(jié)合體的數(shù)據(jù)容量要求，并且最好還根據(jù)心理聲學(xué)原理確定第二量化分辨率。該數(shù)據(jù)容量要求可以是，例如核心層部分和第一擴(kuò)展層部分372、374的結(jié)合體的總數(shù)據(jù)容量極限。按照相應(yīng)的第二量化分辨率量化分波段信號(hào)，產(chǎn)生第二編碼信號(hào)。在步驟410產(chǎn)生傳送第一和第二編碼信號(hào)間的某些殘數(shù)量度(measure)或差別的第一殘數(shù)信號(hào)。這最好是通過(guò)按照二進(jìn)制補(bǔ)碼或者其它形式的二進(jìn)制算術(shù)運(yùn)算，從第二編碼信號(hào)中減去第一編碼信號(hào)來(lái)實(shí)現(xiàn)。在步驟412，第一殘數(shù)信號(hào)被輸出到音頻段360的第一擴(kuò)展層部分374、384中。
在步驟414，確定相應(yīng)分波段信號(hào)的第三量化分辨率。最好根據(jù)層310、320、330的結(jié)合體的數(shù)據(jù)容量，確定第三量化分辨率。另外最好還使用心理聲學(xué)原理確定第三量化分辨率。按照相應(yīng)的第三量化分辨率量化分波段信號(hào)，產(chǎn)生第三編碼信號(hào)。在步驟416產(chǎn)生傳送第二編碼信號(hào)和第三編碼信號(hào)之間的某些殘數(shù)量度或差別的第二殘數(shù)信號(hào)。最好通過(guò)形成第二編碼信號(hào)和第三編碼信號(hào)之間的二進(jìn)制補(bǔ)碼(或者其它二進(jìn)制算術(shù))差別產(chǎn)生第二殘數(shù)信號(hào)。另一方面可產(chǎn)生傳送第一編碼信號(hào)和第三編碼信號(hào)之間的殘數(shù)量度或差別的第二殘數(shù)信號(hào)。在步驟418，第二殘數(shù)信號(hào)被輸出到音頻360的第二擴(kuò)展層部分376、386中。
在步驟404、408、414中，當(dāng)分波段信號(hào)包括一個(gè)以上的分波段信號(hào)單元時(shí)，按照特定分辨率的分波段信號(hào)的量化可包括按照特定分辨率統(tǒng)一量化分波段信號(hào)的各個(gè)單元。從而，如果某一分波段信號(hào)(ss)包括三個(gè)分波段信號(hào)單元(se1，se2，se3)，則可通過(guò)按照量化分辨率Q，統(tǒng)一量化分波段信號(hào)的各個(gè)分波段信號(hào)單元，按照該量化分辨率Q量化該分波段信號(hào)。量化分波段信號(hào)可被記錄為Q(ss)，量化分波段信號(hào)單元可被記錄為Q(se1)、Q(se2)、Q(se3)。這樣，量化分波段信號(hào)Q(ss)包括量化分波段信號(hào)單元Q(se1)、Q(se2)、Q(se3)的集合。識(shí)別相對(duì)于基點(diǎn)許可的分波段信號(hào)單元的量化范圍的編碼范圍可被規(guī)定為編碼參數(shù)?；c(diǎn)最好是能夠產(chǎn)生基本上和聽(tīng)覺(jué)掩蔽曲線相符的注入噪聲(injected noise)的量化水平。相對(duì)于聽(tīng)覺(jué)掩蔽曲線，編碼范圍可以介于，例如濾除噪聲的約144分貝～注入噪聲的約48分貝之間，或者簡(jiǎn)而言之，介于-148dB～+48dB之間。
在本發(fā)明的一個(gè)備選實(shí)施例中，按照特定的量化分辨率Q平均量化同一分波段信號(hào)內(nèi)的分波段信號(hào)單元，但是按照不同的分辨率非均勻地量化單獨(dú)的分波段信號(hào)單元。在本發(fā)明的又一個(gè)提供分波段內(nèi)非均勻量化的實(shí)施例中，增益自適應(yīng)量化技術(shù)按照特定的量化分辨率Q量化相同分波段內(nèi)的某些分波段信號(hào)單元，并按照可能比分辨率Q更細(xì)微或更粗略某一可確定量值的不同分辨率，量化該分波段中的其它分波段信號(hào)單元。在Davidson等于1999年7月7日申請(qǐng)的專(zhuān)利申請(qǐng)“Using Gain-Adaptive Quantization and Non-Uniform Symbol Lengths for ImprovedAudio Coding”中公開(kāi)了在相應(yīng)分波段內(nèi)執(zhí)行非均勻量化的優(yōu)選方法，該專(zhuān)利申請(qǐng)作為參考包含于此。
在步驟402，接收的分波段信號(hào)最好包括一組代表左聲道CH_L的左分波段信號(hào)SS_L和一組代表右聲道CH_R的右分波段信號(hào)SS_R。這些聲道可以是一對(duì)立體聲聲道，或者可以彼此基本無(wú)關(guān)。最好利用一對(duì)理想噪聲頻譜進(jìn)行音頻信號(hào)通道CH_L、CH_R的知覺(jué)編碼，一個(gè)噪聲頻譜用于聲道CH_L、CH_R之一。這樣可在與組SS_R的相應(yīng)分波段信號(hào)不同的分辨率下量化組SS_L的分波段信號(hào)。通過(guò)考慮交叉通道掩蔽效應(yīng)，一個(gè)音頻通道的理想噪聲頻譜會(huì)受到其它通道的信號(hào)內(nèi)容的影響。在優(yōu)選實(shí)施例中，交叉通道掩蔽效應(yīng)被忽略。
如下所述根據(jù)分波段信號(hào)SS_L的聽(tīng)覺(jué)掩蔽特征，另外還可根據(jù)分波段信號(hào)SS_R的交叉通道掩蔽特征，以及諸如核心層部分372的可用數(shù)據(jù)容量之類(lèi)的可選標(biāo)準(zhǔn)，確定左聲道CH_L的第一理想噪聲頻譜。分析左分波段信號(hào)SS_L，并且還可分析右分波段信號(hào)SS_R，確定左聲道CH_L的聽(tīng)覺(jué)掩蔽曲線AMC_L。聽(tīng)覺(jué)掩蔽曲線指出在聽(tīng)不見(jiàn)的情況下，可注入左聲道CH_L的各個(gè)相應(yīng)分波段中的最大噪聲量。在這方面，聽(tīng)得見(jiàn)的標(biāo)準(zhǔn)是以人類(lèi)聽(tīng)力的心理聲學(xué)模型為基礎(chǔ)確定的，并且可以涉及右聲道CH_R的交叉通道掩蔽特征。聽(tīng)覺(jué)掩蔽曲線AMC_L用作左聲道CH_L的第一理想噪聲頻譜的初始值，分析所述第一理想噪聲頻譜初始值，確定組SS_L的各個(gè)分波段信號(hào)的相應(yīng)量化分辨率Q1_L，以致當(dāng)根據(jù)Q1_L(SS_L)量化組SS_L的分波段信號(hào)，并且隨后解量化并將其轉(zhuǎn)換成聲波時(shí)，所得到的編碼噪聲是聽(tīng)不見(jiàn)的。為了清楚起見(jiàn)，注意術(shù)語(yǔ)Q1_L指的是一組量化分辨率，對(duì)于分波段信號(hào)組SS_L中的各個(gè)分波段信號(hào)ss，該組量化分辨率具有相應(yīng)的值Q1_LSS。要明白的是符號(hào)Q1_L(SS_L)意味著按照相應(yīng)的量化分辨率量化組SS_L中的各個(gè)分波段信號(hào)?？扇缟纤鼍鶆蚧蛘叻蔷鶆虻亓炕鱾€(gè)分波段信號(hào)內(nèi)的分波段信號(hào)單元。
按照類(lèi)似的方式，分析右分波段信號(hào)SS_R，最好還分析左分波段信號(hào)SS_L，產(chǎn)生右聲道CH_R的聽(tīng)覺(jué)掩蔽曲線AMC_R。聽(tīng)覺(jué)掩蔽曲線AMC_R可用作右聲道CH_R的初始第一理想噪聲頻譜，分析所述初始第一理想噪聲頻譜，確定組SS_R的各個(gè)分波段信號(hào)的相應(yīng)量化分辨率Q1_R。
現(xiàn)在參見(jiàn)圖4B，圖中表示了根據(jù)本發(fā)明確定量化分辨率的過(guò)程的流程圖。過(guò)程420可用于，例如找出用于根據(jù)過(guò)程400對(duì)各層進(jìn)行編碼的適當(dāng)量化分辨率。下面將關(guān)于左聲道CH_L說(shuō)明過(guò)程420，按照類(lèi)似的方式處理右聲道CH_R。
在步驟422把第一理想噪聲頻譜FDNS_L的初始值設(shè)置為等于聽(tīng)覺(jué)掩蔽曲線AMC_L。在步驟424確定組SS_L的各個(gè)分波段信號(hào)的相應(yīng)量化分辨率，以便據(jù)此量化這些分波段信號(hào)，隨后進(jìn)行解量化并將其轉(zhuǎn)換成聲波，因此而產(chǎn)生的任何量化噪聲基本上與第一理想噪聲頻譜FDNS_L相符。在步驟426，確定據(jù)此量化的分波段信號(hào)是否滿足核心層310的數(shù)據(jù)容量要求。在過(guò)程420的本實(shí)施例中，數(shù)據(jù)容量要求被規(guī)定為據(jù)此量化的分波段信號(hào)是否放入核心層部分372中并且基本用盡核心層部分372的數(shù)據(jù)容量。根據(jù)步驟426中的否定確定，在步驟428調(diào)整第一理想噪聲頻譜FDNS_L。調(diào)整包括移動(dòng)第一理想噪聲頻譜FDNS_L，所述移動(dòng)的移動(dòng)量在左聲道CH_L的分波段內(nèi)最好基本相同。在步驟426的確定結(jié)果為據(jù)此量化的分波段信號(hào)未被放入核心層部分372中的情況下，向上移動(dòng)，這對(duì)應(yīng)于更粗的分辨率。在步驟426的確定結(jié)果為據(jù)此量化的分波段信號(hào)放入核心層372中的情況下，向下移動(dòng)，這對(duì)應(yīng)于更精細(xì)的量化。第一次移動(dòng)的移動(dòng)量最好等于沿移動(dòng)方向到編碼范圍的極值的剩余距離的大約一半。從而，在編碼范圍被規(guī)定為-144dB～+48dB的情況下，第一次移動(dòng)可包括，例如向上移動(dòng)FDNS_L約24dB。隨后每次移動(dòng)的移動(dòng)量最好約為前一次移動(dòng)量的一半。一旦在步驟428調(diào)整第一理想噪聲頻譜FDNS_L，則重復(fù)步驟424和426。當(dāng)在執(zhí)行步驟426中產(chǎn)生肯定確定時(shí)，在步驟430終止過(guò)程420，并且認(rèn)為確定的量化分辨率Q1_L是合適的。
按照確定的量化分辨率Q1_L量化組SS_L的分波段信號(hào)，產(chǎn)生量化分波段信號(hào)Q1_L(SS_L)。量化分波段信號(hào)Q1_L(SS_L)用作左聲道CH_L的第一編碼信號(hào)FCS_L?？砂凑疹A(yù)先確定的任意順序，例如依據(jù)分波段信號(hào)單元的頻譜頻率遞增順序方便地把量化分波段信號(hào)Q1_L(SS_L)輸出到核心層部分372中。這樣，在給定核心層310的核心層部分372的數(shù)據(jù)容量的情況下，在量分分波段信號(hào)Q1_L(SS_L)間分配核心層部分372的數(shù)據(jù)容量是以掩藏盡可能多的量化噪聲為基礎(chǔ)的。按照相似的方式處理右聲道CH_R的分波段信號(hào)SS_R，產(chǎn)生右聲道CH_R的第一編碼信號(hào)FCS_R，所述第一編碼信號(hào)FCS_R被輸出到核心層部分382中。
如下所述按照過(guò)程420確定用于對(duì)第一擴(kuò)展層部分374編碼的適當(dāng)量化分辨率Q2_L。在步驟422，把左聲道CH_L的第二理想噪聲頻譜SDNS_L的初始值設(shè)定為等于第一理想噪聲頻譜FDNS_L。分析第二理想噪聲頻譜SDNS_L，確定組SS_L的各個(gè)分波段信號(hào)ss的相應(yīng)第二量化分辨率Q2_LSS，以致在按照Q2_L(SS_L)量化組SS_L的分波段信號(hào)，并且隨后進(jìn)行解量化并將其轉(zhuǎn)換成聲波的情況下，所得到的量化噪聲基本上與第二理想噪聲頻譜SDNS_L相符。在步驟426，確定據(jù)此量化的分波段信號(hào)是否滿足第一擴(kuò)展層320的數(shù)據(jù)容量要求。在過(guò)程420的本實(shí)施例中，數(shù)據(jù)容量要求被規(guī)定為殘數(shù)信號(hào)是否放入第一擴(kuò)展層部分374中，并基本用盡第一擴(kuò)展層部分374的數(shù)據(jù)容量。殘數(shù)信號(hào)被規(guī)定為據(jù)此確定的量化分波段信號(hào)Q2_L(SS_L)和為核心層部分372確定的量化分波段信號(hào)Q1_L(SS_L)之間的殘數(shù)量度或差別。
響應(yīng)步驟426中的否定確定，在步驟428調(diào)整第二理想噪聲頻譜SDNS_L。調(diào)整包括移動(dòng)第二理想噪聲頻譜SDNS_L，所述移動(dòng)的移動(dòng)量在左聲道CH_L的分波段內(nèi)最好基本相同。在步驟426的殘數(shù)信號(hào)未被放入第一擴(kuò)展層部分372中的情況下，向上移動(dòng)，否則向下移動(dòng)。第一次移動(dòng)的移動(dòng)量最好等于沿移動(dòng)方向到編碼范圍的極值的剩余距離的大約一半。隨后每次移動(dòng)的移動(dòng)量最好約為前一次移動(dòng)量的一半。一旦在步驟428調(diào)整第二理想噪聲頻譜SDNS_L，則重復(fù)步驟424和426。當(dāng)在執(zhí)行步驟426中產(chǎn)生肯定確定時(shí)，在步驟430終止過(guò)程420，并且認(rèn)為確定的量化分辨率Q2_L是合適的。
按照確定的量化分辨率Q2_L量化組SS_L的分波段信號(hào)，產(chǎn)生相應(yīng)的量化分波段信號(hào)Q2_L(SS_L)，量化分波段信號(hào)Q2_L(SS_L)用作左聲道CH_L的第二編碼信號(hào)SCS_L。產(chǎn)生用于左聲道CH_L的相應(yīng)的第一殘數(shù)信號(hào)FRS_L。優(yōu)選方法是形成各個(gè)分波段信號(hào)單元的殘數(shù)(residue)，并通過(guò)按照預(yù)定的順序，例如按照分波段信號(hào)單元的頻率遞增順序，把這些殘數(shù)的二進(jìn)制位表示輸出到第一擴(kuò)展層部分374中。這樣，在給定第一擴(kuò)展層320的第一擴(kuò)展層部分374的數(shù)據(jù)容量的情況下，在量化分波段信號(hào)Q2_L(SS_L)間分配第一擴(kuò)展層部分374的數(shù)據(jù)容量是以掩藏盡可能多的量化噪聲為基礎(chǔ)的。按照相似的方式處理右聲道CH_R的分波段信號(hào)SS_R，產(chǎn)生右聲道CH_R的第二編碼信號(hào)SCS_R和第一殘數(shù)信號(hào)FRS_R。右聲道CH_R的所述第一殘數(shù)信號(hào)FRS_R被輸出到第一擴(kuò)展層部分384中。
可并行確定量化分波段信號(hào)Q2_L(SS_L)和Q1_L(SS_L)。最好通過(guò)把左聲道CH_L的第二理想噪聲頻譜SDNS_L設(shè)置成等于聽(tīng)覺(jué)掩蔽曲線AMC_L或者不依賴于所確定的用于對(duì)核心層編碼的第一理想噪聲頻譜FDNS_L的其它規(guī)范，實(shí)現(xiàn)這種并行確定。數(shù)據(jù)容量要求被規(guī)定為據(jù)此量化的分波段信號(hào)Q2_L(SS_L)是否會(huì)放入核心層部分372和第一擴(kuò)展層部分374的結(jié)合體，并基本用盡所述結(jié)合體的數(shù)據(jù)容量。
就象對(duì)于第二理想噪聲頻譜那樣，得到音頻通道CH_L的第三理想噪聲頻譜的初始值，并且應(yīng)用過(guò)程420，得到相應(yīng)的第三量化分辨率Q3_L。據(jù)此量化的分波段信號(hào)Q3_L(SS_L)用作左聲道CH_L的第三編碼信號(hào)TCS_L。隨后可按照類(lèi)似于第一擴(kuò)展層的方式產(chǎn)生左聲道CH_L的第二殘數(shù)信號(hào)SRS_L。但是在這種情況下，通過(guò)從第二編碼信號(hào)SCS_L中的相應(yīng)分波段信號(hào)單元中減去第三編碼信號(hào)TCS_L中的分波段信號(hào)單元，得到所述殘數(shù)信號(hào)。第二殘數(shù)信號(hào)SRS_L被輸出到第二擴(kuò)展層部分376中。按照相似的方式處理右聲道CH_R的分波段信號(hào)SS_R，產(chǎn)生右聲道CH_R的第三編碼信號(hào)TCS_R和第二殘數(shù)信號(hào)SRS_R。右聲道CH_R的第二殘數(shù)信號(hào)SRS_R被輸出到第二擴(kuò)展層部分386中。
為核心層部分352產(chǎn)生控制數(shù)據(jù)。一般來(lái)說(shuō)，控制數(shù)據(jù)允許解碼器與一連串編碼幀中的各幀同步，并且向解碼器指出如何分析并譯解在諸如幀340之類(lèi)的各幀中提供的數(shù)據(jù)。由于設(shè)置了多種編碼分辨率，因此控制數(shù)據(jù)一般要比不可縮放的編碼實(shí)現(xiàn)中的控制數(shù)據(jù)復(fù)雜。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中，控制數(shù)據(jù)包括同步模式，格式數(shù)據(jù)，段數(shù)據(jù)，參數(shù)據(jù)數(shù)據(jù)及檢錯(cuò)碼，所有這些將在下面說(shuō)明。為擴(kuò)展層320、330產(chǎn)生具體說(shuō)明如何譯解擴(kuò)展層320、330的輔助控制信息。
可產(chǎn)生用于指示幀的起點(diǎn)的預(yù)定同步字。同步模式被輸出到各幀的第一個(gè)字的前L位中，指出幀開(kāi)始于何處。最好在幀中的任意其它位置不出現(xiàn)同步模式。同步模式向解碼器指出如何從編碼數(shù)據(jù)流中解析數(shù)據(jù)幀。
可產(chǎn)生指示程序結(jié)構(gòu)(program configuration)、位流簡(jiǎn)表(profile)及幀速率的格式數(shù)據(jù)。程序結(jié)構(gòu)指出包含在編碼位流中的通道的數(shù)目及分布。位流簡(jiǎn)表指出利用的是幀的哪些層。位流簡(jiǎn)表的第一數(shù)值指出只在核心層310中提供編碼。這種情況下最好省略擴(kuò)展層320、330，以便節(jié)省數(shù)據(jù)通道上的數(shù)據(jù)容量。位流簡(jiǎn)表的第二數(shù)值指出在核心層310和第一擴(kuò)展層320中提供編碼數(shù)據(jù)。這種情況下，最好省略第二擴(kuò)展層330。位流簡(jiǎn)表的第三數(shù)值指出在各層310、320、330中提供編碼數(shù)據(jù)。最好按照AES3規(guī)范確定位流簡(jiǎn)表的第一、第二及第三數(shù)值。幀速率可被規(guī)定為單位時(shí)間的幀數(shù)或者近似數(shù)目，例如30Hz，對(duì)于AES3標(biāo)準(zhǔn)來(lái)說(shuō)，這對(duì)應(yīng)于每3200字一幀。幀速率幫助解碼器保持同步并且有效緩沖輸入的編碼數(shù)據(jù)。
產(chǎn)生指出段及子段邊界的段數(shù)據(jù)。這些段數(shù)據(jù)包括指出控制段350、音頻360、第一子段370和第二子段380的邊界的段數(shù)據(jù)。在可縮放編碼過(guò)程400的備選實(shí)施例中，例如對(duì)于多通道音頻，在幀中包含有另外的子段。還可提供另外的音頻段，以便通過(guò)把來(lái)自若干幀的音頻信息組合成一個(gè)更大的幀，減小幀中控制數(shù)據(jù)的平均容量。對(duì)于需要較少音頻通道的音頻應(yīng)用，還可省略子段?？梢远螖?shù)據(jù)的形式提供關(guān)于附加子段或被省略子段的邊界的數(shù)據(jù)。也可按照相似的方式分別規(guī)定層310、320及330的深度L、M、N。L最好被規(guī)定為16，以便支持向后兼容常規(guī)的16位數(shù)字信號(hào)處理器。M和N最好被規(guī)定為4和4，以便支持由AES3標(biāo)準(zhǔn)確定的可縮放的數(shù)據(jù)通道標(biāo)準(zhǔn)。規(guī)定的深度最好不以數(shù)據(jù)的形式明確包含在幀中，而是在編碼時(shí)推定規(guī)定的深度，以便恰當(dāng)?shù)貙?shí)現(xiàn)在解碼體系結(jié)構(gòu)中。
產(chǎn)生指出編碼操作參數(shù)的參數(shù)數(shù)據(jù)。這種參數(shù)指出哪些種類(lèi)的編碼操作被用于把數(shù)據(jù)編碼成幀。參數(shù)數(shù)據(jù)的第一數(shù)值指出按照高級(jí)電視標(biāo)準(zhǔn)委員會(huì)(ATSC)A52文件(1994)中規(guī)定的公用ATSC AC-3位流規(guī)范對(duì)核心層310編碼。參數(shù)數(shù)據(jù)的第二數(shù)值指出按照體現(xiàn)于DolbyDigital編碼器及解碼器中的知覺(jué)(perceptual)編碼技術(shù)對(duì)核心層310編碼。Dolby Digital編碼器及解碼器可從California，San Francisco的Dolby Laboratories，Inc.購(gòu)買(mǎi)。本發(fā)明可以和各種知覺(jué)編碼及解碼技術(shù)一起應(yīng)用。在美國(guó)專(zhuān)利5913191(Fielder)、5222189(Fielder)、5109417(Fielder等)、5632003(Davidson等)、5583962(Davis等)和5623577(Fielder)，以及在Ubale等的美國(guó)專(zhuān)利申請(qǐng)序列號(hào)09/289865中公開(kāi)了這些知覺(jué)編碼和解碼技術(shù)的各個(gè)方面，所有這些專(zhuān)利及申請(qǐng)均作為參考整體包含于此。實(shí)踐本發(fā)明并不需要任何特殊的知覺(jué)編碼或解碼技術(shù)。
產(chǎn)生一個(gè)或多個(gè)檢錯(cuò)碼，用于保護(hù)核心層部分352中的數(shù)據(jù)以及核心層310的音段子段372、382中的數(shù)據(jù)(數(shù)據(jù)容量許可的話)。由于核心層部分352包括對(duì)相對(duì)于編碼數(shù)據(jù)流中的幀340同步以及解析各幀340的核心層310來(lái)說(shuō)必不可少的所有信息，因此和幀340的其它任何部分相比，最好在更高的程度上保護(hù)核心層部分352。
在本發(fā)明的該實(shí)施例中，數(shù)據(jù)如下所述被輸出到幀中。第一編碼信號(hào)FCS_L、FCS_R分別被輸出到核心層部分372、382中，第一殘數(shù)信號(hào)FRS_L、FRS_R分別被輸出到第一擴(kuò)展層部分374、384中，第二殘數(shù)信號(hào)SRS_L、SRS_R分別被輸出到第二擴(kuò)展層部分376、386中。這可通過(guò)在信號(hào)FCS_L由前L位攜帶，信號(hào)FRS_L由接下來(lái)的M位攜帶，信號(hào)SRS_L由最后N位攜帶，對(duì)于信號(hào)FCS_R、FRS_R、SRS_R來(lái)說(shuō)同樣如此的情況下，同時(shí)多路復(fù)用這些信號(hào)FCS_L、FCS_R、FRS_L、FRS_R、SRS_L、SRS_R，形成字長(zhǎng)度均為L(zhǎng)+M+N的一連串字來(lái)實(shí)現(xiàn)。該串字被串行輸出到音頻段360中。同步字、格式數(shù)據(jù)、段數(shù)據(jù)、參數(shù)數(shù)據(jù)及數(shù)據(jù)保護(hù)信息被輸出到核心層部分352中。擴(kuò)展層320、330的附加控制信息被提供給它們相應(yīng)的擴(kuò)展層320、330。
根據(jù)可縮放音頻編碼過(guò)程400的優(yōu)選實(shí)施例，以包含比例因子和一個(gè)或多個(gè)代表各個(gè)分波段信號(hào)單元的縮放值的塊縮放形式(block-scaledform)表示核心層中的各個(gè)分波段信號(hào)。例如，可以用成組浮點(diǎn)表示各個(gè)分波段信號(hào)，其中成組浮點(diǎn)指數(shù)是比例因子，各個(gè)分波段信號(hào)單元由浮點(diǎn)尾數(shù)表示。實(shí)際上可使用任意形式的按比例縮放。為了簡(jiǎn)化解析編碼數(shù)據(jù)流，恢復(fù)比例因子及縮放值，可在各幀內(nèi)的預(yù)定位置把比例因子編碼到數(shù)據(jù)流中，以致位于音頻段360內(nèi)的各個(gè)子段370、380的起點(diǎn)。
在優(yōu)選實(shí)施例中，比例因子提供分波段信號(hào)功率的量度，心理聲學(xué)模型可使用所述分波段信號(hào)功率的量度確定如前所述的聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R。最好，第一擴(kuò)展層310的比例因子被用作擴(kuò)展層320、330的比例因子，從而不必為每層產(chǎn)生并輸出一組截然不同的比例因子。一般來(lái)說(shuō)，只有各個(gè)編碼信號(hào)的相應(yīng)分波段信號(hào)單元之間的差別的最高有效位才被編碼到擴(kuò)展層中。
在優(yōu)選實(shí)施例中，進(jìn)行輔助處理，從編碼數(shù)據(jù)中消除保留的或禁止的數(shù)據(jù)模式。例如，應(yīng)避免編碼音頻數(shù)據(jù)中會(huì)模仿被保留而出現(xiàn)于幀起點(diǎn)的同步模式的數(shù)據(jù)模式。避免特殊的非零數(shù)據(jù)模式的一種簡(jiǎn)單方式是通過(guò)在編碼音頻數(shù)據(jù)和適當(dāng)?shù)拿荑€之間進(jìn)行逐位“異”操作。在Vernon等于1998年10月19日申請(qǐng)的美國(guó)專(zhuān)利申請(qǐng)，序列號(hào)09/175090“AvoidingForbidden Data Patterns I、in Coded Audio Data”中公開(kāi)了避免禁止的及保留的數(shù)據(jù)模式的其它細(xì)節(jié)及輔助技術(shù)。密鑰或其它控制信息可包含在各幀中，反轉(zhuǎn)所執(zhí)行的任何修改的效果，從而消除這些模式。
現(xiàn)在參見(jiàn)圖5，圖中表示了圖解說(shuō)明根據(jù)本發(fā)明的可縮放解碼過(guò)程500的流程圖?？煽s放的解碼過(guò)程500接收編碼到一連串層中的音頻信號(hào)。第一層包括音頻信號(hào)的知覺(jué)(perceptual)編碼。所述知覺(jué)編碼表現(xiàn)具有第一分辨率的音頻信號(hào)。其余各層均包含有和音頻信號(hào)的另一相應(yīng)編碼相關(guān)的數(shù)據(jù)。所述一連串層按照編碼音頻分辨率的遞增順序排序。更特別的是，可以組合并譯解前K層的數(shù)據(jù)，提供與前K-1層中的數(shù)據(jù)相比分辨率更高的音頻，這里K是大于1并且不大于層數(shù)總數(shù)的整數(shù)。
根據(jù)過(guò)程500，在步驟511選擇譯解分辨率。確定與選擇的分辨率相聯(lián)系的層次。如果為了消除保留或禁止數(shù)據(jù)模式而修改了數(shù)據(jù)流，則應(yīng)反轉(zhuǎn)這些修改的效果。在步驟513組合所確定層次中包含的數(shù)據(jù)與先前各層中的數(shù)據(jù)，隨后在步驟515根據(jù)采用的按照相應(yīng)分辨率對(duì)音頻信號(hào)編碼的編碼過(guò)程的反向操作，譯解組合數(shù)據(jù)。信號(hào)路由電路可剝離或忽略與比選擇的分辨率更高的分辨率相聯(lián)系的各層。在解碼前應(yīng)進(jìn)行反轉(zhuǎn)縮放效果所需的任何過(guò)程或操作。
現(xiàn)在說(shuō)明處理系統(tǒng)100對(duì)通過(guò)標(biāo)準(zhǔn)AES3數(shù)據(jù)通道接收的音頻數(shù)據(jù)進(jìn)行的可縮放解碼過(guò)程500的一個(gè)實(shí)施例。標(biāo)準(zhǔn)AES3數(shù)據(jù)通道以一連串位寬為24的字的形式提供數(shù)據(jù)。借助從0(它是最高有效位)到23(它是最低有效位)的位編號(hào)，可方便地識(shí)別字的各個(gè)二進(jìn)制位。這里符號(hào)位(n～m)用于表示字的位(n)～(m)，n和m為整數(shù)，并且m＞n。按照本發(fā)明的可縮放數(shù)據(jù)結(jié)構(gòu)300，AES3數(shù)據(jù)通道被分成一連串的幀，例如幀340。核心層310包括位(0～15)，第一擴(kuò)展層320包括位(16～19)，第二擴(kuò)展層330包括位(20～23)。
通過(guò)處理系統(tǒng)100的音頻輸入/輸出接口140接收層310、320、330中的數(shù)據(jù)。響應(yīng)解碼指令的程序，處理系統(tǒng)100在數(shù)據(jù)流中搜索16位的同步模式，以便使其處理與各幀邊界對(duì)準(zhǔn)，把從同步模式順序開(kāi)始的數(shù)據(jù)分成表示為位(0～23)的24位字。從而第一個(gè)字的位(0～15)是同步模式。此時(shí)可執(zhí)行反轉(zhuǎn)為消除專(zhuān)用模式而進(jìn)行的修改的效果所需的任何處理。
讀取核心層310中的預(yù)定位置，從而獲得格式數(shù)據(jù)、段數(shù)據(jù)、參數(shù)數(shù)據(jù)、偏移量及數(shù)據(jù)保護(hù)信息。處理檢錯(cuò)碼，以便檢測(cè)控制層部分352中數(shù)據(jù)中的任何錯(cuò)誤。當(dāng)檢測(cè)到數(shù)據(jù)錯(cuò)誤時(shí)，可使相應(yīng)音頻靜音或者重新傳送數(shù)據(jù)。隨后解析幀340，獲得用于后續(xù)解碼操作的數(shù)據(jù)。
為了只對(duì)核心層310進(jìn)行解碼，在步驟511選擇16位分辨率。讀取第一和第二音頻子段370、380的核心層部分372、382中的確定位置，從而獲得編碼分波段信號(hào)單元。在利用塊縮放表示法的優(yōu)選實(shí)施例中，這是通過(guò)首先獲得各個(gè)分波段信號(hào)的塊比例因子(block scaling factor)，并使用這些比例因子產(chǎn)生和編碼過(guò)程中使用的聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R相同的聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R來(lái)實(shí)現(xiàn)的。對(duì)于從核心層部分352讀出的各個(gè)通道，通過(guò)使聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R移動(dòng)相應(yīng)的偏移量O1_L、O1_R，產(chǎn)生音頻通道CH_L、CH_R的第一理想噪聲頻譜。隨后按照編碼過(guò)程400使用的相同方式確定音頻通道的第一量化分辨率Q1_L、Q1_R?，F(xiàn)在處理系統(tǒng)100可分別確定音頻子段370、380的核心層部分372、382中代表分波段信號(hào)單元的縮放值的編碼縮放值的長(zhǎng)度和位置。從子段370、380中解析出編碼縮放值，并使之與相應(yīng)的分波段比例因子組合，從而得到音頻通道CH_L、CH_R的量化分波段信號(hào)單元，所述量化分波段信號(hào)單元隨后被轉(zhuǎn)換成數(shù)字音頻流。通過(guò)采用與編碼過(guò)程中采用的分析濾波器組互補(bǔ)的合成濾波器組實(shí)現(xiàn)這種轉(zhuǎn)換。數(shù)字音頻流表現(xiàn)左聲道CH_L和右聲道CH_R。借助可按照常規(guī)方式實(shí)現(xiàn)的數(shù)-模轉(zhuǎn)換，這些數(shù)字信號(hào)可被轉(zhuǎn)換成模擬信號(hào)。
可如下所示譯解核心層和第一擴(kuò)展層310、320。在步驟511選擇20位編碼分辨率。如上所述獲得核心層310中的分波段信號(hào)單元。從控制段350的擴(kuò)展層部分354讀出附加偏移量O2_L。通過(guò)使左聲道CH_L的第一理想噪聲頻譜移動(dòng)偏移量O2_L，產(chǎn)生音頻通道CH_L的第二理想噪聲頻譜，并且響應(yīng)獲得的噪聲頻譜，按照關(guān)于根據(jù)編碼過(guò)程400對(duì)第一擴(kuò)展層進(jìn)行知覺(jué)編碼所描述的方式確定第二量化分辨率Q2_L。這些量化分辨率Q2_L指出擴(kuò)展層部分374中殘數(shù)信號(hào)RES1_L的各個(gè)分量的長(zhǎng)度和位置。處理系統(tǒng)100讀取相應(yīng)的殘數(shù)信號(hào)，并通過(guò)在步驟513組合殘數(shù)信號(hào)RES1_L和從核心層310獲得的縮放表示(scaledrepresentation)，得到量化分波段信號(hào)單元的縮放表示。在本發(fā)明的該實(shí)施例中，這是利用二進(jìn)制編碼加法實(shí)現(xiàn)的，逐一對(duì)分波段信號(hào)單元執(zhí)行所述加法。根據(jù)各個(gè)分波段信號(hào)的縮放表示得到量化的分波段信號(hào)單元，隨后利用適當(dāng)?shù)男盘?hào)合成過(guò)程轉(zhuǎn)換量化的分波段信號(hào)單元，產(chǎn)生各個(gè)通道的數(shù)字音頻流。借助數(shù)-模轉(zhuǎn)換，數(shù)字音頻流可被轉(zhuǎn)換成模擬信號(hào)。可按照類(lèi)似于上面說(shuō)明的方式譯解核心層和第一、第二擴(kuò)展層310、320、330。
現(xiàn)在參考圖6A，圖中表示了用于根據(jù)本發(fā)明的可縮放音頻編碼的幀700的備選實(shí)施例的示意圖。幀700確定24位寬AES數(shù)據(jù)通道701的數(shù)據(jù)容量的分配。AES3數(shù)據(jù)通道包括一連串的24位寬的字。AES3數(shù)據(jù)通道包括核心層710和標(biāo)識(shí)為中間層720及精細(xì)層(fine layer)730的兩個(gè)擴(kuò)展層。核心層710、中間層720及精細(xì)層730分別包括各個(gè)字的位(0～15)、位(16～19)及位(20～23)。從而，精細(xì)層730包括AES3數(shù)據(jù)通道的四個(gè)最低有效位，中間層720包括該數(shù)據(jù)通道的四個(gè)次低有效位。
分配數(shù)據(jù)通道701的數(shù)據(jù)容量，以便支持若干分辨率條件下的音頻解碼。這里這些分辨率指的是核心層710支持的16位分辨率，核心層710和中間層720的結(jié)合體支持的20位分辨率，以及由核心層710、中間層720和精細(xì)層730的結(jié)合體支持的24位分辨率。應(yīng)明白上面提及的各種分辨率中的位數(shù)指的是傳輸或存儲(chǔ)過(guò)程中各個(gè)相應(yīng)層次的容量，并不涉及各層中包含的表現(xiàn)編碼音頻信號(hào)的符號(hào)的量化分辨率或者位長(zhǎng)度。從而，所謂的“16位分辨率”對(duì)應(yīng)于基本分辨率條件下的知覺(jué)編碼，并且當(dāng)解碼和重放時(shí)，通常感到比16位PCM音頻信號(hào)更精確。類(lèi)似地，20位和24位分辨率對(duì)應(yīng)于逐漸更高的分辨率條件下的知覺(jué)編碼，并且一般來(lái)說(shuō)可感到比相應(yīng)的20位及24位PCM音頻信號(hào)更為精確。
幀700被分成包括同步段740、元數(shù)據(jù)段750、音頻段760，并且還可包括元數(shù)據(jù)擴(kuò)充段770、音頻擴(kuò)充段780和量度(meter)段790的一系列段。元數(shù)據(jù)擴(kuò)充段770和音頻擴(kuò)充段780相互依賴，因此要么同時(shí)包含有元數(shù)據(jù)擴(kuò)充段770和音頻擴(kuò)充段780，要么既不包含元數(shù)據(jù)擴(kuò)充段770又不包含音頻擴(kuò)充段780。在幀700的本實(shí)施例中，各段包括各層710、720、730中的多個(gè)部分。現(xiàn)在參見(jiàn)圖6B、6C和6D，圖中表示了音頻段760和音頻擴(kuò)充段780、元數(shù)據(jù)段750和元數(shù)據(jù)擴(kuò)充段770的優(yōu)選結(jié)構(gòu)的示意圖。
在同步段740中，位(0～15)包含一個(gè)16位的同步模式，位(16～19)包含用于中間層720的一個(gè)或多個(gè)檢錯(cuò)碼，位(20～23)包含用于精細(xì)層730的一個(gè)或多個(gè)檢錯(cuò)碼。擴(kuò)充數(shù)據(jù)中的錯(cuò)誤一般產(chǎn)生聽(tīng)得見(jiàn)的微妙效果，因此數(shù)據(jù)保護(hù)局限于每個(gè)擴(kuò)展層4位代碼有益于節(jié)約AES3數(shù)據(jù)通道中的數(shù)據(jù)。在如上所述的元數(shù)據(jù)段750和元數(shù)據(jù)擴(kuò)充段770中可提供擴(kuò)展層720、730的輔助數(shù)據(jù)保護(hù)。還可為各個(gè)相應(yīng)的擴(kuò)展層720、730規(guī)定兩個(gè)不同的數(shù)據(jù)保護(hù)值。任意一個(gè)所述數(shù)據(jù)保護(hù)值為相應(yīng)層次720、730提供數(shù)據(jù)保護(hù)。第一數(shù)據(jù)保護(hù)值指出按照諸如校準(zhǔn)結(jié)構(gòu)之類(lèi)的預(yù)定方式配置音頻段760的相應(yīng)層。第二數(shù)據(jù)保護(hù)值指出元數(shù)據(jù)段750包含的指針指出擴(kuò)充數(shù)據(jù)包含在音頻段760的相應(yīng)層次中的位置，并且如果包含有音頻擴(kuò)充段780，則元數(shù)據(jù)擴(kuò)充段770中的指針指出擴(kuò)充數(shù)據(jù)包含在音頻擴(kuò)充段780的相應(yīng)層次中的位置。
音頻段760基本上類(lèi)似于前面說(shuō)明的幀390的音頻段360。音頻段760包括第一子段761和第二子段7610。第一子段761包括一個(gè)數(shù)據(jù)保護(hù)段767，分別包含第一子段761的相應(yīng)子段763、764、765、766的四個(gè)相應(yīng)通道子段(CS_0、CS_1、CS_2、CS_3)，并且還可包括一個(gè)前綴762。通道子段對(duì)應(yīng)于多通道音頻信號(hào)的四個(gè)相應(yīng)音頻通道(CH_0、CH_1、CH_2、CH_3)。
在可選的前綴762中，核心層710包含用于避免核心層710相應(yīng)攜帶的第一子段部分內(nèi)的禁止模式的禁止模式密鑰(KEY1_C)，中間層720包含用于避免中間層720攜帶的第一子段部分內(nèi)的禁止模式的禁止模式密鑰(KEY1_I)，精細(xì)層730包含用于避免精細(xì)層730相應(yīng)攜帶的第一子段部分內(nèi)的禁止模式的禁止模式密鑰(KEY1_F)。
在通道子段CS_0中，核心層710包含音頻通道CH_0的第一編碼信號(hào)，中間層720包括音頻通道CH_0的第一殘數(shù)信號(hào)，精細(xì)層730包括音頻通道CH_0的第二殘數(shù)信號(hào)。最好利用如下所述修改的編碼過(guò)程401把這些信號(hào)編碼到各自相應(yīng)的層次中。通道段CS_1、CS_2、CS_3按照類(lèi)似的方式分別包含音頻通道CH_1、CH_2、CH_3的數(shù)據(jù)。
在數(shù)據(jù)保護(hù)段767中，核心層710攜帶由核心層710相應(yīng)包含的第一子段部分的一個(gè)或多個(gè)檢錯(cuò)碼，中間層720攜帶中間層720包含的第一子段部分的一個(gè)或多個(gè)檢錯(cuò)碼，精細(xì)層730攜帶由精細(xì)層730相應(yīng)包含的第一子段部分的一個(gè)或多個(gè)檢錯(cuò)碼。在本實(shí)施例中，最好借助循環(huán)冗余碼(CRC)提供數(shù)據(jù)保護(hù)。
第二子段7610類(lèi)似地包括一個(gè)數(shù)據(jù)保護(hù)段7670、分別包含第二子段7610的相應(yīng)子段7630、7640、7650、7660的四個(gè)通道子段(CS_4、CS_5、CS_6、CS_7)，并且還可包括一個(gè)前綴7620。按照類(lèi)似于子段761的方式配置第二子段7610。類(lèi)似于音頻段760配置音頻擴(kuò)充段780，允許兩個(gè)或多個(gè)音頻段位于單一幀內(nèi)，從而減小標(biāo)準(zhǔn)AES3數(shù)據(jù)通道中消耗的數(shù)據(jù)容量。
如下所述配置元數(shù)據(jù)段750。由核心層710攜帶的元數(shù)據(jù)段750部分包括標(biāo)題段751、幀控制段752、元數(shù)據(jù)子段753和數(shù)據(jù)保護(hù)段754。中間層720攜帶的元數(shù)據(jù)段750部分包括中間元數(shù)據(jù)子段755和數(shù)據(jù)保護(hù)子段757，精細(xì)層730攜帶的元數(shù)據(jù)段750部分包括中間元數(shù)據(jù)子段756和數(shù)據(jù)保護(hù)子段758。在各層之間，數(shù)據(jù)保護(hù)子段754、757、758不必對(duì)準(zhǔn)，但是最好均位于其相應(yīng)各層的尾部或者位于另外某一預(yù)定位置。
標(biāo)題751包括指示程序結(jié)構(gòu)和幀速率的格式數(shù)據(jù)。幀控制段752包括規(guī)定同步段740、元數(shù)據(jù)段750和音頻段760中各段及各子段的邊界的段數(shù)據(jù)。元數(shù)據(jù)子段753、755、756包括指示執(zhí)行的把音頻數(shù)據(jù)分別編碼到核心層710、中間層720和精細(xì)層730中的編碼操作參數(shù)的參數(shù)數(shù)據(jù)。這些參數(shù)數(shù)據(jù)指出使用何種編碼操作對(duì)相應(yīng)層進(jìn)行編碼。最好相同類(lèi)型的編碼操作被用于具有相適應(yīng)的分辨率的各個(gè)層次，以便反映各層中數(shù)據(jù)容量的相對(duì)數(shù)量。另一方面也可在核心層720中包含中間層720和精細(xì)層730的參數(shù)數(shù)據(jù)。但是核心層710的所有參數(shù)數(shù)據(jù)最好只包含在核心層710中，從而信號(hào)路由電路可剝離或忽略擴(kuò)展層720、730，而不影響譯解核心層710的能力。數(shù)據(jù)保護(hù)段754、757、758包含分別保護(hù)核心層710、中間層720及精細(xì)層730的一個(gè)或多個(gè)檢錯(cuò)碼。
除了元數(shù)據(jù)擴(kuò)充段770不包括幀控制段752之外，元數(shù)據(jù)擴(kuò)充段770基本上類(lèi)似于元數(shù)據(jù)段750。元數(shù)據(jù)擴(kuò)充段770和音頻擴(kuò)充段780中各段和各子段的邊界由它們與元數(shù)據(jù)段750和音頻段760的實(shí)質(zhì)相似性結(jié)合由元數(shù)據(jù)段750中幀控制段752包含的段數(shù)據(jù)來(lái)指示。
可選的量度段790包含幀700中所含的編碼音頻數(shù)據(jù)的平均幅度。特別地，在忽略音頻擴(kuò)充段780的情況下，量度段790的位(0～15)包含音頻段760的位(0～15)中所含的編碼音頻數(shù)據(jù)的平均幅度的表示，位(16～19)和(20～23)分別包含分別被稱為中間量度(IM)和精細(xì)量度(FM)的擴(kuò)充數(shù)據(jù)。IM可以是包含在音頻段760的位(16～19)中的編碼音頻數(shù)據(jù)的平均幅度，F(xiàn)M可以是包含在音頻段760的位(20～23)中的編碼音頻數(shù)據(jù)的平均幅度。在包含音頻擴(kuò)充段780的情況下，平均幅度IM和FM最好反映包含在音頻擴(kuò)充段780各層中的編碼音頻。量度段790支持解碼時(shí)方便地顯示平均音頻幅度。對(duì)于正確的音頻解碼來(lái)說(shuō)這并不是必需的，為了節(jié)約AES3數(shù)據(jù)通道上的數(shù)據(jù)容量，可將其省略。
最好利用如下所述修改的可縮放的編碼過(guò)程400和420把音頻數(shù)據(jù)編碼到幀700中。接收八個(gè)通道中各個(gè)通道的音頻分波段信號(hào)。最好通過(guò)對(duì)時(shí)域音頻數(shù)據(jù)的八個(gè)相應(yīng)通道的成批樣本應(yīng)用塊變換(blocktransform)，并組合變換系數(shù)，從而形成分波段信號(hào)來(lái)產(chǎn)生這些分波段信號(hào)。均以包含分波段中各個(gè)系數(shù)的塊指數(shù)(block exponent)和尾數(shù)的塊浮點(diǎn)(block-floating-point)形式表示這些分波段信號(hào)。
通過(guò)利用一組分波段的“主指數(shù)”，可擴(kuò)展指定位長(zhǎng)度的分波段指數(shù)的動(dòng)態(tài)范圍。比較該組分波段中分波段的指數(shù)和某一閾值，確定相關(guān)主指數(shù)的數(shù)值。如果該組中每個(gè)分波段指數(shù)都大于例如，為3的閾值，則主指數(shù)的數(shù)值被設(shè)定為1，并且相關(guān)分波段指數(shù)減3，否則主指數(shù)被設(shè)定為0。
也可使用前面簡(jiǎn)要說(shuō)明的增益自適應(yīng)量化技術(shù)。在一個(gè)實(shí)施例中，根據(jù)各個(gè)分波段信號(hào)的尾數(shù)的量值是否大于二分之一，把各個(gè)分波段信號(hào)的尾數(shù)分成兩組。小于或等于二分之一的尾數(shù)的數(shù)值被加倍，以便減少表現(xiàn)這些尾數(shù)所需的二進(jìn)制位的數(shù)目。調(diào)整尾數(shù)的量化，反映這種加倍。尾數(shù)也可被分成兩組上以的多組。例如，根據(jù)尾數(shù)的量值是在0～1/4之間、1/4～1/2之間還是在1/2～1之間，可把尾數(shù)分成三組，分別乘以4、2和1的比例因子，并據(jù)此量化，以便節(jié)約額外的數(shù)據(jù)容量。從上面引用的美國(guó)專(zhuān)利申請(qǐng)中可獲得其它信息。
產(chǎn)生各個(gè)通道的聽(tīng)覺(jué)掩蔽曲線。各個(gè)聽(tīng)覺(jué)掩蔽曲線可能依賴于多個(gè)通道(在本實(shí)現(xiàn)中多達(dá)8個(gè)通道)，而不僅僅是一個(gè)或二個(gè)通道的音頻數(shù)據(jù)。利用這些聽(tīng)覺(jué)掩蔽曲線，并在如上所述修改尾數(shù)量化的情況下，對(duì)各個(gè)通道應(yīng)用可縮放的編碼過(guò)程400。應(yīng)用迭代過(guò)程420確定對(duì)各層進(jìn)行編碼的適當(dāng)量化分辨率。本實(shí)施例中，相對(duì)于對(duì)應(yīng)的聽(tīng)覺(jué)掩蔽曲線，編碼范圍被規(guī)定為約-144dB～+48dB。隨后分析過(guò)程400和420所產(chǎn)生的各個(gè)通道的第一編碼信號(hào)、第一及第二殘數(shù)信號(hào)，確定音頻段760的第一子段761的禁止模式密鑰KEY1_C、KEY1_I、KEY1_F(對(duì)于第二子段7610來(lái)說(shuō)，與此類(lèi)似)。
為第一批多通道音頻產(chǎn)生元數(shù)據(jù)段750的控制數(shù)據(jù)。除了省略第二批多通道音頻的段信息之外，按照類(lèi)似方式為第二批多通道音頻產(chǎn)生元數(shù)據(jù)擴(kuò)充段770的控制數(shù)據(jù)。利用如上所述的相應(yīng)禁止模式密鑰分別修改這些控制數(shù)據(jù)，并分別輸出到元數(shù)據(jù)段750和元數(shù)據(jù)段擴(kuò)充段770中。
同樣對(duì)第二批的八個(gè)音頻通道進(jìn)行上述過(guò)程，同時(shí)按照相似的方式把產(chǎn)生的編碼信號(hào)輸出到音頻擴(kuò)充段780中。除了對(duì)于第二批多通道音頻來(lái)說(shuō)不產(chǎn)生任何段數(shù)據(jù)之外，按照和第一批多通道音頻相同的方式產(chǎn)生第二批多通道音頻的控制數(shù)據(jù)。該控制數(shù)據(jù)輸出到元數(shù)據(jù)擴(kuò)充段770中。
同步模式被輸出到同步段740的位(0～15)中。分別為中間層720和精細(xì)層730產(chǎn)生兩個(gè)位寬為4的檢錯(cuò)碼，并分別輸出到同步段740的位(16～19)和位(20-23)中。本實(shí)施例中，擴(kuò)充數(shù)據(jù)中的錯(cuò)誤通常產(chǎn)生聽(tīng)得見(jiàn)的細(xì)微效果，因此錯(cuò)誤檢測(cè)局限于每個(gè)擴(kuò)展層的4位代碼有益于節(jié)約標(biāo)準(zhǔn)AES3數(shù)據(jù)通道中的數(shù)據(jù)容量。
根據(jù)本發(fā)明，檢錯(cuò)碼可具有不依賴于所保護(hù)的數(shù)據(jù)的位模式的預(yù)定值，例如“0001”。通過(guò)檢查這種檢錯(cuò)碼，確定代碼本身是否已被破壞，提供錯(cuò)誤檢測(cè)。如果代碼本身已被破壞，則認(rèn)為層中的其它數(shù)據(jù)被破壞，獲得該數(shù)據(jù)的另一副本，或者抑制所述錯(cuò)誤。優(yōu)選實(shí)施例為每個(gè)擴(kuò)展層規(guī)定了多個(gè)預(yù)定檢錯(cuò)碼。這些代碼也可指示層的結(jié)構(gòu)。例如，第一檢錯(cuò)碼“0101”指出層具有預(yù)定的結(jié)構(gòu)，例如校準(zhǔn)結(jié)構(gòu)。第二檢錯(cuò)碼“1001”指出層具有分布式結(jié)構(gòu)，并且指針或其它數(shù)據(jù)被輸出到元數(shù)據(jù)段750或其它位置，以指示層中數(shù)據(jù)的分布模式。在傳輸過(guò)程中幾乎不可能一個(gè)代碼受到破壞而產(chǎn)生另一代碼，因?yàn)楸囟ㄊ瞧茐脑摯a的2個(gè)二進(jìn)制位，而不破壞其余二進(jìn)制位。從而該實(shí)施例基本上可避免單個(gè)位(single bit)傳輸錯(cuò)誤。此外，譯解擴(kuò)展層時(shí)產(chǎn)生的任何錯(cuò)誤一般最多只產(chǎn)生細(xì)微的聽(tīng)得到的效果。
在本發(fā)明的一個(gè)備選實(shí)施例中，采用其它形式的平均信息量編碼壓縮音頻數(shù)據(jù)。例如，在一個(gè)備選實(shí)施例中，16位平均信息量編碼過(guò)程產(chǎn)生輸出到核心層上的壓縮數(shù)據(jù)。對(duì)在更高分辨率下的數(shù)據(jù)編碼重復(fù)該過(guò)程，產(chǎn)生試用編碼信號(hào)。結(jié)合試用編碼信號(hào)和壓縮的音頻數(shù)據(jù)，產(chǎn)生試用殘數(shù)信號(hào)。根據(jù)需要重復(fù)上述過(guò)程，直到試用殘數(shù)信號(hào)有效利用第一擴(kuò)展層的數(shù)據(jù)容量為止，并把試用殘數(shù)信號(hào)輸出到第一擴(kuò)展層上。通過(guò)再次提高平均信息量編碼的分辨率，對(duì)第二層或多個(gè)附加擴(kuò)展層重復(fù)上述過(guò)程。
對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō)，當(dāng)參考本申請(qǐng)時(shí)，本發(fā)明的各種變化和修改將是顯而易見(jiàn)的。本發(fā)明提供了這樣的修改和變化，本發(fā)明的范圍只由下述權(quán)利要求限定。
權(quán)利要求
1.一種可縮放編碼過(guò)程，所述過(guò)程利用具有一個(gè)核心層和一個(gè)擴(kuò)展層的標(biāo)準(zhǔn)數(shù)據(jù)通道，所述過(guò)程包括接收若干分波段信號(hào)；根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率，并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第一編碼信號(hào)；根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率，并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第二編碼信號(hào)；產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào)；和把第一編碼信號(hào)輸出到核心層中，把殘數(shù)信號(hào)輸出到擴(kuò)展層中。
2.按照權(quán)利要求1所述的過(guò)程，其中根據(jù)按照心理聲學(xué)原理確定的分波段信號(hào)的音頻掩蔽特性曲線，確定第一理想噪聲頻譜。
3.按照權(quán)利要求1所述的過(guò)程，其中按照根據(jù)滿足核心層數(shù)據(jù)容量要求的這樣的第一量化分辨率量化的分波段信號(hào)，確定第一量化分辨率。
4.按照權(quán)利要求1所述的過(guò)程，其中以對(duì)準(zhǔn)的形式輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
5.按照權(quán)利要求1所述的過(guò)程，其中輸出輔助數(shù)據(jù)，以指示殘數(shù)信號(hào)相對(duì)于第一編碼信號(hào)的結(jié)構(gòu)模式。
6.按照權(quán)利要求1所述的過(guò)程，其中相對(duì)于第一理想噪聲頻譜，使第二理想噪聲頻譜編移基本均勻的量值，其中所述基本均勻量值的指示被輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
7.按照權(quán)利要求1所述的過(guò)程，其中第一編碼信號(hào)包括若干比例因子，其中殘數(shù)信號(hào)由第一編碼信號(hào)的比例因子表示。
8.按照權(quán)利要求1所述的過(guò)程，其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示，其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
9.一種可縮放編碼過(guò)程，所述過(guò)程使用具有若干層的標(biāo)準(zhǔn)數(shù)據(jù)通道，所述過(guò)程包括接收若干分波段信號(hào)；產(chǎn)生分波段信號(hào)的知覺(jué)編碼和第二編碼；產(chǎn)生指示相對(duì)于知覺(jué)編碼的第二編碼殘數(shù)的殘數(shù)信號(hào)；以及把知覺(jué)編碼輸出到第一層中，把殘數(shù)信號(hào)輸出到第二層中。
10.按照權(quán)利要求9所述的可縮放編碼過(guò)程，還包括產(chǎn)生分波段信號(hào)的第三編碼；產(chǎn)生指示相對(duì)于知覺(jué)編碼和第二編碼中至少之一的第三編碼殘數(shù)的第二殘數(shù)信號(hào)；和把第二殘數(shù)信號(hào)輸出到第三層中。
11.按照權(quán)利要求9所述的可縮放編碼過(guò)程，其中數(shù)據(jù)通道遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3，第一層是16位寬的數(shù)據(jù)通道層，第二層和第三層均為4位寬的數(shù)據(jù)通道層。
12.按照權(quán)利要求9所述的過(guò)程，還包括產(chǎn)生指示相對(duì)于知覺(jué)編碼的殘數(shù)信號(hào)結(jié)構(gòu)的檢錯(cuò)數(shù)據(jù)；和把檢錯(cuò)數(shù)據(jù)輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
13.按照權(quán)利要求9所述的過(guò)程，還包括產(chǎn)生一連串的二進(jìn)制位；把所述一連串二進(jìn)制位輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中；在接收器接收對(duì)應(yīng)于二進(jìn)制位的輸出序列的一連串二進(jìn)制位；分析接收的一連串二進(jìn)制位，確定其是否與產(chǎn)生的一連串二進(jìn)制位相符；和根據(jù)分析結(jié)果確定知覺(jué)編碼和殘數(shù)信號(hào)之一是否包括傳輸錯(cuò)誤。
14.按照權(quán)利要求9所述的過(guò)程，其中根據(jù)第一層和第二層的結(jié)合體的數(shù)據(jù)容量，產(chǎn)生第二編碼。
15.多層數(shù)據(jù)通道包含的數(shù)據(jù)的處理方法，其中所述數(shù)據(jù)通道的第一層包含音頻信號(hào)的知覺(jué)編碼，數(shù)據(jù)通道的第二層包含提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)，所述方法使用解碼器，并且包括通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù)；和把音頻信號(hào)的知覺(jué)編碼送到解碼器。
16.按照權(quán)利要求15所述的方法，還包括譯解音頻信號(hào)的知覺(jué)編碼。
17.按照權(quán)利要求15所述的方法，還包括組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)，產(chǎn)生分辨率高于音頻信號(hào)的知覺(jué)編碼的第二音頻信號(hào)編碼；和譯解音頻信號(hào)的第二編碼。
18.按照權(quán)利要求17所述的方法，其中通過(guò)遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3的數(shù)據(jù)通道的16位核心層，接收知覺(jué)編碼，其中通過(guò)數(shù)據(jù)通道的至少一個(gè)4位寬的擴(kuò)展層接收擴(kuò)充數(shù)據(jù)。
19.按照權(quán)利要求15所述的方法，其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的，分別對(duì)應(yīng)于一個(gè)截然不同音頻通道的若干片段；和把所述若干片段之一包含的知覺(jué)編碼的各個(gè)部分與它所包含的擴(kuò)充數(shù)據(jù)的各個(gè)部分相結(jié)合，產(chǎn)生代表音頻通道之一的中間信號(hào)。
20.按照權(quán)利要求17所述的方法，其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的，對(duì)應(yīng)于單個(gè)音頻通道的一個(gè)片段；處理擴(kuò)充數(shù)據(jù)，確定所述音頻通道的殘數(shù)的位置，并且恢復(fù)所述殘數(shù)；和把所述片段包含的知覺(jué)編碼的各個(gè)部分與殘數(shù)相結(jié)合，產(chǎn)生在和音頻信號(hào)的知覺(jué)編碼相比更高的分辨率下表現(xiàn)所述音頻通道的中間信號(hào)。
21.標(biāo)準(zhǔn)數(shù)據(jù)通道的處理系統(tǒng)，所述標(biāo)準(zhǔn)數(shù)據(jù)通道具有一層核心層和一層擴(kuò)展層，所述處理系統(tǒng)包括存儲(chǔ)指令程序的存儲(chǔ)器；程控處理器，所述程控處理器被耦接成接收若干分波段信號(hào)，并且與存儲(chǔ)器耦接，以便接收所述程序，根據(jù)程序，程控處理器按照第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率，并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第一編碼信號(hào)，按照第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率，并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第二編碼信號(hào)，產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào)，并把第一編碼信號(hào)輸出到核心層上，把殘數(shù)信號(hào)輸出到擴(kuò)展層上。
22.按照權(quán)利要求21所述的處理系統(tǒng)，其中根據(jù)程序，程控處理器按照心理聲學(xué)原理確定分波段信號(hào)的聽(tīng)覺(jué)掩蔽特性曲線，并根據(jù)確定的聽(tīng)覺(jué)掩蔽特性曲線確定第一理想噪聲頻譜。
23.按照權(quán)利要求21所述的處理系統(tǒng)，其中根據(jù)程序，程控處理器確定第一量化分辨率，從而按照確定的第一量化分辨率量化的分波段信號(hào)滿足核心層的數(shù)據(jù)容量要求。
24.按照權(quán)利要求21所述的處理系統(tǒng)，其中根據(jù)程序，程控處理器以對(duì)準(zhǔn)的構(gòu)形輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
25.按照權(quán)利要求21所述的處理系統(tǒng)，其中根據(jù)程序，程控處理器在數(shù)據(jù)通道上輸出指示相對(duì)于第一編碼信號(hào)的殘數(shù)信號(hào)結(jié)構(gòu)模式的數(shù)據(jù)。
26.按照權(quán)利要求21所述的處理系統(tǒng)，其中根據(jù)程序，程控處理器通過(guò)使第一理想噪聲頻譜移動(dòng)基本均勻的量值，確定第二理想噪聲頻譜，并在標(biāo)準(zhǔn)數(shù)據(jù)通道中輸出基本均勻量值的指示。
27.按照權(quán)利要求21所述的處理系統(tǒng)，其中根據(jù)程序，程控處理器產(chǎn)生表示第一編碼信號(hào)的若干比例因子，并且使用產(chǎn)生的比例因子表示第一編碼信號(hào)的比例因子。
28.按照權(quán)利要求21所述的處理系統(tǒng)，其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示，并且其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
29.多層數(shù)據(jù)通道的處理系統(tǒng)，其中數(shù)據(jù)通道的第一層包含音頻信號(hào)的知覺(jué)編碼，數(shù)據(jù)通道的第二層包含提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)，所述處理系統(tǒng)包括通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù)的信號(hào)路由電路；存儲(chǔ)指令程序的存儲(chǔ)器；和程控處理器，所述程控處理器與信號(hào)路由電路耦合，以便接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù)，所述程控處理器還與存儲(chǔ)器耦合，以便接收所述程序，并根據(jù)程序產(chǎn)生解碼信號(hào)。
30.按照權(quán)利要求29所述的處理系統(tǒng)，其中程控處理器譯解音頻信號(hào)的知覺(jué)編碼，產(chǎn)生解碼信號(hào)。
31.按照權(quán)利要求29所述的處理系統(tǒng)，其中程控處理器組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)，產(chǎn)生分辨率高于音頻信號(hào)的知覺(jué)編碼的第二音頻信號(hào)編碼；和譯解音頻信號(hào)的第二編碼，產(chǎn)生解碼信號(hào)。
32.按照權(quán)利要求29所述的處理系統(tǒng)，其中信號(hào)路由電路通過(guò)遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3的數(shù)據(jù)通道的16位核心層，接收知覺(jué)編碼，并且通過(guò)數(shù)據(jù)通道的至少一個(gè)4位寬的擴(kuò)展層接收擴(kuò)充數(shù)據(jù)。
33.按照權(quán)利要求29所述的處理系統(tǒng)，其中程控處理器識(shí)別沿著數(shù)據(jù)通道的，分別對(duì)應(yīng)于一個(gè)截然不同音頻通道的若干片段；和把所述若干片段之一包含的知覺(jué)編碼的各個(gè)部分與其所包含的擴(kuò)充數(shù)據(jù)的各個(gè)部分相結(jié)合，產(chǎn)生代表音頻通道之一的中間信號(hào)。
34.按照權(quán)利要求29所述的處理系統(tǒng)，其中程控處理器識(shí)別沿著數(shù)據(jù)通道的，對(duì)應(yīng)于單個(gè)音頻通道的一個(gè)片段；處理擴(kuò)充數(shù)據(jù)，確定所述音頻通道的殘數(shù)的位置，并且恢復(fù)所述殘數(shù)；和把所述片段包含的知覺(jué)編碼的各個(gè)部分與殘數(shù)相結(jié)合，產(chǎn)生在和音頻信號(hào)的知覺(jué)編碼相比更高的分辨率下表現(xiàn)所述音頻通道的中間信號(hào)。
35.一種機(jī)器可讀介質(zhì)，所述介質(zhì)包含機(jī)器執(zhí)行的實(shí)現(xiàn)編碼過(guò)程的指令程序，編碼過(guò)程使用具有一個(gè)核心層和一個(gè)擴(kuò)展層的標(biāo)準(zhǔn)數(shù)據(jù)通道，所述過(guò)程包括接收若干分波段信號(hào)；根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率，并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第一編碼信號(hào)；根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率，并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第二編碼信號(hào)；產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào)；和把第一編碼信號(hào)輸出到核心層中，把殘數(shù)信號(hào)輸出到擴(kuò)展層中。
36.按照權(quán)利要求35所述的介質(zhì)，其中根據(jù)按照心理聲學(xué)原理確定的分波段信號(hào)的音頻掩蔽特性曲線，確定第一理想噪聲頻譜。
37.按照權(quán)利要求35所述的介質(zhì)，其中按照根據(jù)滿足核心層數(shù)據(jù)容量要求的這樣的第一量化分辨率量化的分波段信號(hào)，確定第一量化分辨率。
38.按照權(quán)利要求35所述的介質(zhì)，其中以對(duì)準(zhǔn)的形式輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
39.按照權(quán)利要求35所述的介質(zhì)，其中輸出指示相對(duì)于第一編碼信號(hào)的殘數(shù)信號(hào)結(jié)構(gòu)模式的輔助數(shù)據(jù)。
40.按照權(quán)利要求35所述的介質(zhì)，其中相對(duì)于第一理想噪聲頻譜，使第二理想噪聲頻譜編移基本均勻的量值，其中所述基本均勻量值的指示被輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
41.按照權(quán)利要求35所述的介質(zhì)，其中第一編碼信號(hào)包括若干比例因子，其中殘數(shù)信號(hào)由第一編碼信號(hào)的比例因子表示。
42.按照權(quán)利要求35所述的介質(zhì)，其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示，其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
43.一種機(jī)器可讀介質(zhì)，所述介質(zhì)包含機(jī)器執(zhí)行的，實(shí)現(xiàn)處理由多層數(shù)據(jù)通道所攜帶的數(shù)據(jù)的方法的指令程序，其中數(shù)據(jù)通道的第一層包含音頻信號(hào)的知覺(jué)編碼，數(shù)據(jù)通道的第二層包含用于提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)，所述方法使用解碼器，并且包括通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù)；和把音頻信號(hào)的知覺(jué)編碼送到解碼器。
44.按照權(quán)利要求43所述的介質(zhì)，還包括譯解音頻信號(hào)的知覺(jué)編碼。
45.按照權(quán)利要求43所述的介質(zhì)，還包括組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)，產(chǎn)生分辨率高于音頻信號(hào)的知覺(jué)編碼的第二音頻信號(hào)編碼；和譯解音頻信號(hào)的第二編碼。
46.按照權(quán)利要求43所述的介質(zhì)，其中通過(guò)遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3的數(shù)據(jù)通道的16位核心層，接收知覺(jué)編碼，并且其中通過(guò)數(shù)據(jù)通道的至少一個(gè)4位寬的擴(kuò)展層接收擴(kuò)充數(shù)據(jù)。
47.按照權(quán)利要求45所述的介質(zhì)，其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的，分別對(duì)應(yīng)于一個(gè)截然不同音頻通道的若干片段；和把所述若干片段之一包含的知覺(jué)編碼的各個(gè)部分與其所包含的擴(kuò)充數(shù)據(jù)的各個(gè)部分相結(jié)合，產(chǎn)生代表音頻通道之一的中間信號(hào)。
48.按照權(quán)利要求45所述的介質(zhì)，其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的，對(duì)應(yīng)于單個(gè)音頻通道的一個(gè)片段；處理擴(kuò)充數(shù)據(jù)，確定所述音頻通道的殘數(shù)的位置，并且恢復(fù)所述殘數(shù)；和把所述片段包含的知覺(jué)編碼的各個(gè)部分與殘數(shù)相結(jié)合，產(chǎn)生在比第一編碼信號(hào)更高的分辨率下表現(xiàn)所述音頻通道的中間信號(hào)。
49.包含編碼音頻信息的機(jī)器可讀介質(zhì)，所述編碼音頻信息按照編碼過(guò)程產(chǎn)生，所述編碼過(guò)程包括接收若干分波段信號(hào)；根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率，并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第一編碼信號(hào)；根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率，并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào)，產(chǎn)生第二編碼信號(hào)；產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào)；和把第一編碼信號(hào)輸出到核心層中，把殘數(shù)信號(hào)輸出到擴(kuò)展層中。
50.按照權(quán)利要求49所述的介質(zhì)，其中根據(jù)按照心理聲學(xué)原理確定的分波段信號(hào)的音頻掩蔽特性曲線，確定第一理想噪聲頻譜。
51.按照權(quán)利要求49所述的介質(zhì)，其中按照根據(jù)滿足核心層數(shù)據(jù)容量要求的這樣的第一量化分辨率量化的分波段信號(hào)，確定第一量化分辨率。
52.按照權(quán)利要求49所述的介質(zhì)，其中以對(duì)準(zhǔn)的形式輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
53.按照權(quán)利要求49所述的介質(zhì)，其中輸出指示相對(duì)于第一編碼信號(hào)的殘數(shù)信號(hào)結(jié)構(gòu)模式的輔助數(shù)據(jù)。
54.按照權(quán)利要求49所述的介質(zhì)，其中相對(duì)于第一理想噪聲頻譜，使第二理想噪聲頻譜編移基本均勻的量值，其中所述基本均勻量值的指示被輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
55.按照權(quán)利要求49所述的介質(zhì)，其中第一編碼信號(hào)包括若干比例因子，其中殘數(shù)信號(hào)由第一編碼信號(hào)的比例因子表示。
56.按照權(quán)利要求49所述的介質(zhì)，其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示，其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
全文摘要
根據(jù)按照心理聲學(xué)原理確定的理想噪聲頻譜把音頻可縮放地編碼到核心層中支持根據(jù)包括這種理想噪聲頻譜的偏移在內(nèi)的各種標(biāo)準(zhǔn),把擴(kuò)充數(shù)據(jù)編碼到擴(kuò)展層中。兼容解碼由單個(gè)信號(hào)提供多個(gè)解碼分辨率。最好對(duì)按照音頻輸入的頻譜變換、正交鏡象濾波或者其它常規(guī)處理產(chǎn)生的分波段信號(hào)進(jìn)行編碼。用于音頻傳輸?shù)目煽s放數(shù)據(jù)結(jié)構(gòu)包括核心層和擴(kuò)展層,核心層包含使后解碼噪聲低于理想噪聲頻譜的音頻信號(hào)第一編碼,擴(kuò)展層包含關(guān)于理想噪聲頻譜的偏移數(shù)據(jù)和與使后解碼噪聲低于移動(dòng)偏移數(shù)據(jù)的理想噪聲頻譜的音頻信號(hào)的編碼有關(guān)的數(shù)據(jù)。
文檔編號(hào)H03M7/30GK1369092SQ00811328
公開(kāi)日2002年9月11日申請(qǐng)日期2000年8月4日優(yōu)先權(quán)日1999年8月9日
發(fā)明者路易斯·杜恩·菲爾德, 史蒂芬·戴克·維諾申請(qǐng)人:多爾拜實(shí)驗(yàn)特許公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：路易斯.杜恩.菲爾德;史蒂芬.戴克.維諾
技術(shù)所有人：多爾拜實(shí)驗(yàn)特許公司
我是此專(zhuān)利的發(fā)明人

上一篇：時(shí)鐘同步裝置的制作方法
上一篇：電源線數(shù)據(jù)網(wǎng)絡(luò)濾波器的制作方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、田老師：1: 建筑節(jié)能綠色建筑能耗的模擬與檢測(cè)(EnergyPlus)；建筑碳排放和生命周期評(píng)價(jià)；城市微氣候、建筑能耗與太陽(yáng)能技術(shù)的相互影響；地理信息系統(tǒng)(GIS)和空間回歸方法用于城市建筑能耗分析；不確定性、敏感性分析和機(jī)器學(xué)習(xí)方法應(yīng)用于建筑能耗分析(R)；貝葉斯方法用于城市和單體建筑能源分析 2: 過(guò)
2、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
3、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、周老師：1.智能機(jī)器人技術(shù) 2.智能檢測(cè)與控制技術(shù) 3.機(jī)構(gòu)運(yùn)動(dòng)學(xué)與動(dòng)力學(xué) 4.機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻編碼相關(guān)技術(shù)

音頻編解碼芯片相關(guān)技術(shù)

音頻編碼器相關(guān)技術(shù)

音視頻編碼相關(guān)技術(shù)

音頻編解碼相關(guān)技術(shù)

語(yǔ)音與音頻編碼相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

高質(zhì)量音頻的可縮放編碼方法