欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

高質(zhì)量音頻的可縮放編碼方法

文檔序號(hào):7509122閱讀:231來(lái)源:國(guó)知局
專(zhuān)利名稱:高質(zhì)量音頻的可縮放編碼方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻編碼和解碼,更具體地說(shuō),涉及可縮放地把音頻數(shù)據(jù)編譯到標(biāo)準(zhǔn)數(shù)據(jù)通道的若干層中以及可縮放地從標(biāo)準(zhǔn)數(shù)據(jù)通道中譯解音頻數(shù)據(jù)。
在最近幾年里,由于各種原因,這種信念受到挑戰(zhàn)。對(duì)于所有樂(lè)音的無(wú)噪聲再現(xiàn)來(lái)說(shuō),16位PCM的動(dòng)態(tài)范圍過(guò)于有限。當(dāng)音頻被量化成16位PCM時(shí),微妙的細(xì)節(jié)被丟失。此外,這種看法不能考慮降低量化分辨率,從而以降低信噪比和降低信號(hào)分辨率為代價(jià)提供額外的凈空高度(headroom)的實(shí)踐。由于這些利害關(guān)系的緣故,目前非常需要能夠提供優(yōu)于16位PCM的信號(hào)分辨率的音頻處理。
目前還非常需要多通道音頻。多通道音頻提供音頻的多個(gè)通道,和傳統(tǒng)的單聲道和立體聲技術(shù)相比,這可改善再現(xiàn)聲音的空間化。普通系統(tǒng)提供位于聽(tīng)場(chǎng)(listening field)前后的獨(dú)立左右聲道,并且還可提供中央聲道和次低音聲道(subwoofer channel)。近來(lái)的修改提供圍繞聽(tīng)場(chǎng)的用于再現(xiàn)或合成不同類(lèi)型的音頻數(shù)據(jù)的空間間隔的許多音頻通道。
知覺(jué)(perceptual)編碼是相對(duì)于可比位速率的PCM信號(hào),提高音頻信號(hào)的感覺(jué)清晰度的多種技術(shù)中的一種。知覺(jué)編碼通過(guò)消除被認(rèn)為與主觀音頻質(zhì)量的保持無(wú)關(guān)的信息,可降低編碼信號(hào)的位速率,同時(shí)保持從編碼信號(hào)恢復(fù)的主觀音頻質(zhì)量。這可通過(guò)把音頻信號(hào)分成頻率分波段信號(hào),并在引入低到可被解碼信號(hào)本身掩蔽的量化噪聲水平的量化分辨率下量化各個(gè)分波段信號(hào)來(lái)實(shí)現(xiàn)。在指定位速率的約束范圍內(nèi),通過(guò)對(duì)更高分辨率的第二PCM信號(hào)進(jìn)行知覺(jué)編碼,把編碼信號(hào)的位速率降低到和第一PCM信號(hào)的位速率基本相同,能夠與指定分辨率的第一PCM信號(hào)相比,增大感知的信號(hào)分辨率。隨后可使用這種編碼形式的第二PCM信號(hào)替代第一PCM信號(hào),并在重放時(shí)譯解所述第二PCM信號(hào)。
知覺(jué)編碼的一個(gè)例子具體體現(xiàn)于遵守在高級(jí)電視標(biāo)準(zhǔn)委員會(huì)(ATSC)A52文件(1994)中規(guī)定的公用ATSC AC-3位流規(guī)范的設(shè)備中。這種特殊的編碼技術(shù)以及其它知覺(jué)編碼技術(shù)具體體現(xiàn)于各種型式的Dolby Digitial編碼器和解碼器中。這些編碼器和解碼器可從California,San Francisco的Dolby Laboratories,Inc.購(gòu)買(mǎi)。知覺(jué)編碼技術(shù)的另一例子體現(xiàn)在遵守MPEG-1音頻編碼標(biāo)準(zhǔn)ISO 11172-3(1993)的設(shè)備中。
常規(guī)知覺(jué)編碼技術(shù)的一個(gè)缺點(diǎn)是對(duì)于指定主觀質(zhì)量水平,知覺(jué)編碼信號(hào)的位速率可能超過(guò)通信通道及存儲(chǔ)介質(zhì)的可用數(shù)據(jù)容量。例如,24位PCM音頻信號(hào)的知覺(jué)編碼會(huì)產(chǎn)生需要比16位寬數(shù)據(jù)通道所提供數(shù)據(jù)容量更大的數(shù)據(jù)容量的知覺(jué)編碼信號(hào)。降低編碼信號(hào)的位速率會(huì)降低可從編碼信號(hào)再現(xiàn)的音頻的主觀質(zhì)量。常規(guī)知覺(jué)編碼技術(shù)的另一缺點(diǎn)是它們不支持譯解單個(gè)知覺(jué)編碼信號(hào),從而不能在一個(gè)以上的主觀質(zhì)量水平條件下再現(xiàn)音頻信號(hào)。
可縮放編碼技術(shù)是一種能夠提供各種解碼質(zhì)量的技術(shù)。可縮放編碼使用一個(gè)或多個(gè)低分辨率編碼中的數(shù)據(jù)以及擴(kuò)充數(shù)據(jù),提供音頻信號(hào)的高分辨率編碼??稍谌舾蓪又刑峁┑头直媛示幋a和擴(kuò)充數(shù)據(jù)。另外還特別需要可縮放的知覺(jué)編碼,尤其是在解碼階段與市場(chǎng)上買(mǎi)得到的16位數(shù)字信號(hào)傳送或存儲(chǔ)裝置向后兼容的可縮放知覺(jué)編碼。
公開(kāi)了只譯解數(shù)據(jù)通道的核心層的系統(tǒng)和方法。另外還公開(kāi)了既譯解核心層又譯解數(shù)據(jù)通道的一層或多層擴(kuò)展層的系統(tǒng)和方法,和只譯解核心層得到的音頻質(zhì)量相比,既譯解核心層又譯解擴(kuò)展層的系統(tǒng)和方法提供更好的音頻質(zhì)量。
本發(fā)明的某些實(shí)施例應(yīng)用于分波段信號(hào)。正如本領(lǐng)域中已知的那樣,可以各種方式產(chǎn)生分波段信號(hào),包括應(yīng)用諸如正交鏡象濾波器之類(lèi)的數(shù)字濾波器,以及借助各種時(shí)域-頻譜變換及子波變換。
本發(fā)明采用的數(shù)據(jù)通道最好具有遵守音頻工程協(xié)會(huì)(AES)公布的標(biāo)準(zhǔn)AES3的一個(gè)16位寬的核心層和兩個(gè)4位寬的擴(kuò)展層。該標(biāo)準(zhǔn)也被美國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)會(huì)(ANSI)稱為ANSI S4.40。這里把這種數(shù)據(jù)通道稱為標(biāo)準(zhǔn)AES3數(shù)據(jù)通道。
根據(jù)本發(fā)明各個(gè)方面的可縮放音頻編碼和解碼可由分立邏輯組件,一個(gè)或多個(gè)ASIC,程控處理器實(shí)現(xiàn),并且可由其它可從市場(chǎng)上買(mǎi)到的組件實(shí)現(xiàn)。這些組件的實(shí)現(xiàn)方式對(duì)本發(fā)明并不重要。優(yōu)選實(shí)施例使用程控處理器,例如Motorola的DSP563xx系列數(shù)字信號(hào)處理器。用于這種實(shí)現(xiàn)的程序包括由機(jī)器可讀介質(zhì),例如基帶或調(diào)制通信路徑和存儲(chǔ)介質(zhì)傳送的指令。通信路徑最好在從超聲波頻率到紫外線頻率的頻譜中。實(shí)際上任意磁或光記錄技術(shù)都可用作存儲(chǔ)介質(zhì),包括磁帶、磁盤(pán)和光盤(pán)。
根據(jù)本發(fā)明的各個(gè)方面,根據(jù)本發(fā)明編碼的音頻信息可由這樣的機(jī)器可讀介質(zhì)傳送給路由器、解碼器及其它處理器,并且可被這樣的機(jī)器可讀介質(zhì)保存,以便稍后再發(fā)送、解碼或進(jìn)行其它處理。在優(yōu)選實(shí)施例中,音頻信息按照本發(fā)明編碼,并存儲(chǔ)到諸如光盤(pán)之類(lèi)的機(jī)器可讀介質(zhì)上。最好按照各種幀和/或其它公開(kāi)的數(shù)據(jù)結(jié)構(gòu)格式化這種數(shù)據(jù)。隨后解碼器可讀取存儲(chǔ)的信息進(jìn)行解碼和重放。這種解碼器不必包含編碼功能。
根據(jù)本發(fā)明一方面的可縮放編碼過(guò)程利用具有一個(gè)核心層和一個(gè)或多個(gè)擴(kuò)展層的數(shù)據(jù)通道。接收若干分波段信號(hào)。根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率,并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第一編碼信號(hào)。根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率,并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第二編碼信號(hào)。產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間的殘數(shù)的殘數(shù)信號(hào)。第一編碼信號(hào)被輸出到核心層,殘數(shù)信號(hào)被輸出到擴(kuò)展層。
根據(jù)本發(fā)明的另一方面,音頻信號(hào)的編碼過(guò)程使用具有若干層的標(biāo)準(zhǔn)數(shù)據(jù)通道。接收若干分波段信號(hào)。產(chǎn)生分波段信號(hào)的知覺(jué)編碼和第二編碼。產(chǎn)生指示相對(duì)于知覺(jué)編碼的第二編碼殘數(shù)的殘數(shù)信號(hào)。知覺(jué)編碼被輸出到數(shù)據(jù)通道的第一層中,殘數(shù)信號(hào)被輸出到數(shù)據(jù)通道的第二層中。
根據(jù)本發(fā)明的另一方面,標(biāo)準(zhǔn)數(shù)據(jù)通道的處理系統(tǒng)包括存儲(chǔ)器和程控處理器。存儲(chǔ)器包括按照本發(fā)明對(duì)音頻信息編碼的指令程序。程控處理器與存儲(chǔ)器耦接,以便接收所述指令程序,并且還被耦接成接收若干分波段信號(hào),以便進(jìn)行處理。根據(jù)指令程序,程控處理器按照本發(fā)明處理分波段信號(hào)。在一個(gè)實(shí)施例中,這包括按照上面說(shuō)明的可縮放編碼過(guò)程,把第一編碼或知覺(jué)編碼信號(hào)輸出到數(shù)據(jù)通道的一層中,把殘數(shù)信號(hào)輸出到數(shù)據(jù)通道的另一層中。
根據(jù)本發(fā)明的另一方面,數(shù)據(jù)處理方法使用具有包含音頻信號(hào)的知覺(jué)編碼的第一層和包含用于提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)的第二層的多層數(shù)據(jù)通道。根據(jù)該方法,通過(guò)數(shù)據(jù)通道接收音頻信號(hào)的知覺(jué)編碼和擴(kuò)充數(shù)據(jù)。知覺(jué)編碼被送給解碼器或者其它處理器進(jìn)行進(jìn)一步的處理。在不考慮擴(kuò)充數(shù)據(jù)的情況下,這可包括譯解知覺(jué)編碼產(chǎn)生第一解碼信號(hào)。另一方面,擴(kuò)充數(shù)據(jù)可被送到解碼器或者其它處理器,并在所述解碼器或者其它處理器與知覺(jué)編碼組合產(chǎn)生第二編碼信號(hào),譯解所述第二編碼信號(hào)產(chǎn)生分辨率高于第一解碼信號(hào)的第二解碼信號(hào)。
根據(jù)本發(fā)明的另一方面,公開(kāi)了處理多層數(shù)據(jù)通道上的數(shù)據(jù)的處理系統(tǒng)。多層數(shù)據(jù)通道具有包含音頻信號(hào)的知覺(jué)編碼的第一層和包含用于提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù)的第二層。處理系統(tǒng)包括信號(hào)路由電路、存儲(chǔ)器和程控處理器。信號(hào)路由電路通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù),并把知覺(jué)數(shù)據(jù)和可選的擴(kuò)充數(shù)據(jù)送到程控處理器。存儲(chǔ)器存儲(chǔ)根據(jù)本發(fā)明處理音頻信息的指令程序。程控處理器與信號(hào)路由電路耦合,以便接收知覺(jué)編碼,程控處理器還與存儲(chǔ)器耦合,以便接收指令程序。根據(jù)指令程序,程控處理器按照本發(fā)明處理知覺(jué)編碼及可選的擴(kuò)充數(shù)據(jù)。在一個(gè)實(shí)施例中,這包括如上所述的一層或多層信息的路由和解碼。
根據(jù)本發(fā)明的另一方面,機(jī)器可讀介質(zhì)包含按照本發(fā)明執(zhí)行編碼過(guò)程的機(jī)器可執(zhí)行的指令程序。根據(jù)本發(fā)明的另一方面,機(jī)器可讀介質(zhì)包含根據(jù)本發(fā)明執(zhí)行路由和/或譯解多層數(shù)據(jù)通道所攜帶的數(shù)據(jù)的方法的機(jī)器可執(zhí)行的指令程序。前面及在下面的詳細(xì)說(shuō)明中公開(kāi)了這種編碼、路由和解碼的例子。根據(jù)本發(fā)明的另一例子,機(jī)器可讀介質(zhì)包含根據(jù)本發(fā)明編碼的編碼音頻信息,例如按照公開(kāi)的過(guò)程或方法處理的任意信息。
根據(jù)本發(fā)明的另一方面,可以各種方式實(shí)現(xiàn)本發(fā)明的編碼和解碼過(guò)程。例如,可由諸如可編程數(shù)字信號(hào)處理器或計(jì)算機(jī)處理器之類(lèi)機(jī)器執(zhí)行,從而實(shí)現(xiàn)這種過(guò)程的指令程序可由機(jī)器可讀的介質(zhì)傳送,機(jī)器可讀取所述介質(zhì),獲得所述程序,并且根據(jù)所述程序執(zhí)行這樣的過(guò)程。通過(guò)只借助所述介質(zhì)傳送相應(yīng)的程序材料,機(jī)器可專(zhuān)用于只執(zhí)行一部分的這種過(guò)程。
結(jié)合附圖,參考下面的說(shuō)明將更好地理解本發(fā)明的各種特征及其優(yōu)選實(shí)施例,附圖中,相同的附圖標(biāo)記代表相同的部分。下述說(shuō)明的內(nèi)容及附圖僅僅是作為本發(fā)明的例子給出的,不應(yīng)被理解為代表對(duì)本發(fā)明的范圍的限制。


圖1B是對(duì)音頻信號(hào)編碼和/或解碼的計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)的示意圖。
圖2A是按照心理聲學(xué)原理和數(shù)據(jù)容量標(biāo)準(zhǔn)對(duì)音頻通道編碼的過(guò)程的流程圖。
圖2B是包含一連串幀的數(shù)據(jù)通道的示意圖,每一幀包括一連串的字,每個(gè)字的寬度為16位。
圖3A是包括組織成多幀、多段和多部分的若干層的可縮放數(shù)據(jù)通道的示意圖。
圖3B是可縮放數(shù)據(jù)通道的幀的示意圖。
圖4A是可縮放編碼過(guò)程的流程圖。
圖4B是確定圖4A中圖解說(shuō)明的可縮放編碼過(guò)程的恰當(dāng)量化分辨率的過(guò)程的流程圖。
圖5是圖解說(shuō)明可縮放解碼過(guò)程的流程圖。
圖6A是可縮放數(shù)據(jù)通道的幀的示意圖。
圖6B是圖6A中圖解說(shuō)明的音頻段和音頻擴(kuò)充段的優(yōu)選結(jié)構(gòu)的示意圖。
圖6C是圖6A中圖解說(shuō)明的元數(shù)據(jù)段的優(yōu)選結(jié)構(gòu)的示意圖。
圖6D是圖6A中圖解說(shuō)明的元數(shù)據(jù)擴(kuò)充段的優(yōu)選結(jié)構(gòu)的示意圖。
可利用各種技術(shù)產(chǎn)生分波段信號(hào)。一種技術(shù)是對(duì)音頻數(shù)據(jù)應(yīng)用頻譜變換,在譜域中產(chǎn)生分波段信號(hào)單元。一個(gè)或多個(gè)相鄰的分波段信號(hào)單元可被組合成組,形成分波段信號(hào)。形成指定分波段信號(hào)的分波段信號(hào)單元的數(shù)目及身份可預(yù)先確定,或者可以被編碼的音頻數(shù)據(jù)的特征為基礎(chǔ)。適宜的頻譜變換的例子包括離散傅里葉變換(DFT)和包括有時(shí)稱為時(shí)域假信號(hào)消除(TDAC)變換的特殊的改進(jìn)離散余弦變換(MDCT)的各種離散余弦變換(DCT)。在Princen,Johnson和Bradley的“Subband/Transform Coding Using Filter Bank Designs Based On Time DomainAliasing Cancellation”,Proc.Int.Conf.Acoust,Speech,and SignalProc.,pp.2161-2164,1987年5月中說(shuō)明了時(shí)域假信號(hào)消除(TDAC)變換。產(chǎn)生分波段信號(hào)的另一種技術(shù)是把一組串聯(lián)的正交鏡象濾波器(QMF)或者其它一些帶通濾波器應(yīng)用于音頻數(shù)據(jù),產(chǎn)生分波段信號(hào)。雖然實(shí)現(xiàn)方法的選擇對(duì)編碼系統(tǒng)的性能具有深遠(yuǎn)的影響,但是在原理上,對(duì)于本發(fā)明來(lái)說(shuō),不存在任何重要的特殊實(shí)現(xiàn)方法。
這里術(shù)語(yǔ)“分波段”被用于表示音頻信號(hào)的一部分帶寬。術(shù)語(yǔ)“分波段信號(hào)”被用于表示代表分波段的信號(hào)。術(shù)語(yǔ)“分波段信號(hào)單元”被用于表示分波段信號(hào)的單元或組分。例如,在使用頻譜變換的實(shí)現(xiàn)中,分波段信號(hào)單元是變換系數(shù)。出于簡(jiǎn)便起見(jiàn),這里把分波段信號(hào)的產(chǎn)生稱為分波段濾波,而不管是通過(guò)應(yīng)用頻譜變換還是其它類(lèi)型的濾波器實(shí)現(xiàn)這種信號(hào)產(chǎn)生的。這里,濾波器本身被稱為濾波器組,或者更特別地被稱為分析濾波器組。按照常規(guī)的方式,合成濾波器組與分析濾波器組相反或者基本相反。
可提供糾錯(cuò)信息,以便檢測(cè)根據(jù)本發(fā)明處理的數(shù)據(jù)中的一個(gè)或多個(gè)錯(cuò)誤。錯(cuò)誤可產(chǎn)生于,例如這種數(shù)據(jù)的傳輸或緩沖過(guò)程中,在重放數(shù)據(jù)之前檢測(cè)錯(cuò)誤并恰當(dāng)?shù)匦U龜?shù)據(jù)通常都是有益的。術(shù)語(yǔ)“糾錯(cuò)”指的是任意錯(cuò)誤檢測(cè)和/或校正方案,例如奇偶校驗(yàn)位、循環(huán)冗余碼、檢查和和Reed-Solomon碼。
現(xiàn)在參考圖1A,圖中示意表示了根據(jù)本發(fā)明的對(duì)音頻數(shù)據(jù)編碼和解碼的處理系統(tǒng)100的一個(gè)實(shí)施例的方框圖。處理系統(tǒng)100包括按照常規(guī)方式由總線116互連的程控處理器110、只讀存儲(chǔ)器120、隨機(jī)存取存儲(chǔ)器130和音頻輸入/輸出接口140。程控處理器110是可從Motorola買(mǎi)到的DSP563xx型數(shù)字信號(hào)處理器。只讀存儲(chǔ)器120和隨機(jī)存取存儲(chǔ)器130具有常規(guī)的設(shè)計(jì)。只讀存儲(chǔ)器120存儲(chǔ)有指令程序,允許程控處理器110如同參考圖2A-7D說(shuō)明的那樣執(zhí)行分析和合成功能,以及處理音頻信號(hào)。當(dāng)處理系統(tǒng)100處于掉電狀態(tài)時(shí),程序原樣保存在只讀存儲(chǔ)器120中。根據(jù)本發(fā)明,實(shí)際也可用任意磁或光記錄技術(shù),例如使用磁帶、磁盤(pán)或光盤(pán)的那些磁或光記錄技術(shù)代替只讀存儲(chǔ)器120。隨機(jī)存取存儲(chǔ)器130按照常規(guī)方式為程控處理器110緩沖指令和數(shù)據(jù),包括接收的和處理的信號(hào)。音頻輸入/輸出接口140包括把一層或多層接收信號(hào)送到其它組件,例如程控處理器110的信號(hào)路由電路。信號(hào)路由電路可包括輸入和輸出信號(hào)的獨(dú)立端子,或者可使用相同端子進(jìn)行輸入和輸出。通過(guò)忽略合成和解碼指令,處理系統(tǒng)100可專(zhuān)用于編碼,另一方面,通過(guò)忽略分析和編碼指令,處理系統(tǒng)100也可專(zhuān)用于解碼。處理系統(tǒng)100是適于實(shí)現(xiàn)本發(fā)明的典型處理操作的代表,并不是用來(lái)描述本發(fā)明的特殊硬件實(shí)現(xiàn)。
為了進(jìn)行編碼,程控處理器110從只讀存儲(chǔ)器120獲取編碼指令程序。在音頻輸入/輸出接口140,音頻信號(hào)被提供給處理器100,并且被送給程控處理器110以便進(jìn)行編碼。響應(yīng)編碼指令程序,分析濾波器組對(duì)音頻信號(hào)濾波,產(chǎn)生分波段信號(hào),并且分波段信號(hào)被編碼,從而產(chǎn)生編碼信號(hào)。編碼信號(hào)通過(guò)音頻輸入/輸出接口140被提供給其它器件,或者被存儲(chǔ)在隨機(jī)存取存儲(chǔ)器130中。
為了進(jìn)行解碼,程控處理器110從只讀存儲(chǔ)器120獲取解碼指令程序。最好已按照本發(fā)明編碼的音頻信號(hào)在音頻輸入/輸出接口140被提供給處理系統(tǒng)100,并且被送給程控處理器110以便進(jìn)行解碼。響應(yīng)解碼指令程序,譯解音頻信號(hào),獲得相應(yīng)的分波段信號(hào),并且分波段信號(hào)被合成濾波器組過(guò)濾,從而獲得輸出信號(hào)。輸出信號(hào)通過(guò)音頻輸入/輸出接口140被提供給其它器件,或者被存儲(chǔ)在隨機(jī)存取存儲(chǔ)器130中。
現(xiàn)在參見(jiàn)圖1B,圖中表示了根據(jù)本發(fā)明用于對(duì)音頻信號(hào)編碼和解碼的計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150的一個(gè)實(shí)施例的示意方框圖。計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150包括由總線158按照常規(guī)方式互連的中央處理器152、隨機(jī)存取存儲(chǔ)器153、硬盤(pán)154、輸入裝置155、端子156和輸出裝置157。中央處理器152最好實(shí)現(xiàn)Intelx86指令集體系結(jié)構(gòu),最好包括支持實(shí)現(xiàn)浮點(diǎn)算術(shù)處理的硬件,并且可以是,例如可從California Santa Clara的Intel公司購(gòu)買(mǎi)的IntelPentiumIII微處理器。音頻信息通過(guò)端子156被提供給計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150,并被送給中央處理器152。存儲(chǔ)在硬盤(pán)154上的指令程序允許計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150按照本發(fā)明處理音頻數(shù)據(jù)。處理后的呈數(shù)字形式的音頻數(shù)據(jù)隨后通過(guò)端子被提供156,或者被記錄并存儲(chǔ)在硬盤(pán)154中。
可以預(yù)料本發(fā)明的處理系統(tǒng)100、計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)150及其它實(shí)施例將用在可能既包括音頻處理又包括視頻處理的應(yīng)用中。典型的視頻應(yīng)用會(huì)使其操作與視頻時(shí)鐘信號(hào)和音頻時(shí)鐘信號(hào)同步。視頻時(shí)鐘信號(hào)向視頻幀提供同步基準(zhǔn)。視頻時(shí)鐘信號(hào)可向NTSC、PAL幀或者ATSC視頻信號(hào)提供基準(zhǔn)。音頻時(shí)鐘信號(hào)向音頻樣本提供同步基準(zhǔn)。時(shí)鐘信號(hào)可具有任意頻率。例如,在專(zhuān)業(yè)應(yīng)用中,48kHZ是常見(jiàn)的音頻時(shí)鐘頻率。對(duì)于實(shí)踐本發(fā)明來(lái)說(shuō),不存在特別重要的時(shí)鐘信號(hào)或時(shí)鐘信號(hào)頻率。
現(xiàn)在參見(jiàn)圖2A,圖中表示了按照心理聲學(xué)及數(shù)據(jù)容量標(biāo)準(zhǔn),把音頻數(shù)據(jù)編碼到數(shù)據(jù)通道中的過(guò)程200的流程圖。另外還參見(jiàn)圖2B,圖中表示了數(shù)據(jù)通道250的方框圖。數(shù)據(jù)通道250包括一系列幀260,每一幀260包括一系列的字。每個(gè)字被表示為一系列的位(n),這里n是介于0和15之間的整數(shù)(包括0和15),并且符號(hào)位(n~m)表示字的位(n)~位(m)。每一幀260包括控制段270和音頻段280,控制段270和音頻段280均包含相應(yīng)整數(shù)數(shù)量的幀260的字。
在步驟210,接收代表音頻信號(hào)的第一數(shù)據(jù)塊的若干分波段信號(hào)。每個(gè)分波段信號(hào)包含一個(gè)或多個(gè)分波段單元,每個(gè)分波段單元由一個(gè)字代表。在步驟212,分析分波段信號(hào),確定聽(tīng)覺(jué)掩蔽曲線。聽(tīng)覺(jué)掩蔽曲線指出在聽(tīng)不見(jiàn)的情況下,可注入各個(gè)相應(yīng)分波段中的噪聲的最大量。在這方面,什么是聽(tīng)得見(jiàn)的是以人類(lèi)聽(tīng)力的心理聲學(xué)模型為基礎(chǔ)的,并且可能涉及分波段信號(hào)代表多個(gè)音頻通道的交叉通道掩蔽特性。聽(tīng)覺(jué)掩蔽曲線用作理想噪聲頻譜的第一估計(jì)。在步驟214,分析理想的噪聲頻譜,確定各個(gè)分波段信號(hào)的相應(yīng)量化分辨率,以致當(dāng)據(jù)此量化分波段信號(hào),并且隨后對(duì)分波段信號(hào)解量化并將其轉(zhuǎn)換成聲波時(shí),所得到的編碼噪聲在理想噪聲頻譜之下。在步驟216確定據(jù)此量化的分波段信號(hào)是否能夠在音頻段280的范圍內(nèi),并且基本填滿音頻段280。如果否,則在步驟218調(diào)整理想噪聲頻譜,并重復(fù)步驟214、216。如果是,則在步驟220據(jù)此量化分波段信號(hào),并在步驟222把分波段信號(hào)輸入音頻段280。
為幀260的控制段270產(chǎn)生控制數(shù)據(jù)。這包括輸出到控制段270的第一字272中的同步模式。同步模式使解碼器能夠與數(shù)據(jù)通道250中的連續(xù)幀260同步。指示幀速率,段260、270的邊界,編碼操作的參數(shù)及檢錯(cuò)信息的輔助控制數(shù)據(jù)被輸出到控制段270的剩余部分274中。對(duì)于音頻信號(hào)的各個(gè)數(shù)據(jù)塊重復(fù)該過(guò)程,同時(shí)每個(gè)順序數(shù)據(jù)塊最好被編碼到數(shù)據(jù)通道250的相應(yīng)順序幀260中。
過(guò)程200可用于把數(shù)據(jù)編碼到多層音頻通道的一層或多層中。在按照過(guò)程200對(duì)一層以上的多層編碼的情況下,這些層中攜帶的數(shù)據(jù)之間可能存在大致的相關(guān)性,因此顯著浪費(fèi)了多層音頻通道的數(shù)據(jù)容量。下面說(shuō)明把擴(kuò)充數(shù)據(jù)編碼輸出到數(shù)據(jù)通道的第二層中,從而提高這種數(shù)據(jù)通道的第一層中攜帶的數(shù)據(jù)的分辨率的可縮放過(guò)程。分辨率的提高最好可以表述為第一層的編碼參數(shù)的功能關(guān)系,例如當(dāng)被應(yīng)用于用于對(duì)第一層編碼的理想噪聲頻譜時(shí),產(chǎn)生用于對(duì)第二層編碼的理想噪聲頻譜的偏移量。隨后這種偏移量可被輸出到數(shù)據(jù)通道的確定位置,例如在第二層的某一字段或分段中,向解碼器指出提高的數(shù)值。所述提高數(shù)值隨后可用于確定第二層中每個(gè)分波段信號(hào)單元或與之相關(guān)的信息的位置。接下來(lái)說(shuō)明的是用于據(jù)此組織可縮放數(shù)據(jù)通道的幀結(jié)構(gòu)。
現(xiàn)在參見(jiàn)圖3A,圖中表示了包括核心層310、第一擴(kuò)展層320和第二擴(kuò)展層330的可縮放數(shù)據(jù)通道300的一個(gè)實(shí)施例的示意圖。核心層310的寬度為L(zhǎng)位,第一擴(kuò)展層320的寬度為M位,第二擴(kuò)展層330的寬度為N位,L、M、N為正整數(shù)。核心層310包括一序列的L位字。核心層310和第一擴(kuò)展層320的組合包括一系列的(L+N)位字,核心層310、第一擴(kuò)展層320和第二擴(kuò)展層330的組合包括一系列的(L+M+N)位字。這里符號(hào)(n~m)用于表示字的位(n)~位(m),這里n和m是整數(shù),并且m>n,并且m、n可以介于0~23之間(含0和23)??煽s放的數(shù)據(jù)通道300可以是,例如L、M、N分別等于16、4和4的24位寬的標(biāo)準(zhǔn)AES3數(shù)據(jù)通道。
根據(jù)本發(fā)明,可縮放的數(shù)據(jù)通道300可被組織成一系列的幀340。各幀340被分離成控制段350和跟隨其后的音頻段360??刂贫?50包括由控制段350與核心層310的交集確定的核心層部分352,由控制段350與第一擴(kuò)展層320的交集確定的第一擴(kuò)展層部分354,以及由控制段350與第二擴(kuò)展層330的交集確定的第二擴(kuò)展層部分356。音頻段360包括第一子段和第二子段370、380。第一子段370包括由第一子段370與核心層310的交集確定的核心層部分372,由第一子段370與第一擴(kuò)展層320的交集確定的第一擴(kuò)展層部分374,以及由第一子段370與第二擴(kuò)展層330的交集確定的第二擴(kuò)展層部分376。類(lèi)似地,第二子段380包括由第二子段380與核心層310的交集確定的核心層部分382,由第二子段380與第一擴(kuò)展層320的交集確定的第一擴(kuò)展層部分384,以及由第二子段380與第二擴(kuò)展層330的交集確定的第二擴(kuò)展層部分386。
本實(shí)施例中,核心層部分372、382攜帶按照心理聲學(xué)標(biāo)準(zhǔn)壓縮的編碼音頻數(shù)據(jù),從而編碼音頻數(shù)據(jù)在核心層310的范圍內(nèi)。以編碼過(guò)程的輸入的形式提供的音頻數(shù)據(jù)可包括,例如均由寬度為P位的字表示的分波段信號(hào)單元,整數(shù)P大于L。隨后可應(yīng)用心理聲學(xué)原理把分波段信號(hào)單元編碼成平均寬度約為L(zhǎng)位的編碼值或“符號(hào)”。從而分波段信號(hào)單元占據(jù)的數(shù)據(jù)體積被顯著壓縮,從而可以通過(guò)核心層310便利地傳輸分波段信號(hào)。編碼操作最好與L位寬數(shù)據(jù)通道上音頻數(shù)據(jù)的常規(guī)音頻傳輸標(biāo)準(zhǔn)一致,以致可按照常規(guī)方式譯解核心層310。第一擴(kuò)展層部分374、384攜帶擴(kuò)充數(shù)據(jù),所述擴(kuò)充數(shù)據(jù)可與核心層310中的編碼信息結(jié)合使用,恢復(fù)與只根據(jù)核心層310中的編碼信息恢復(fù)的音頻信號(hào)相比,分辨率更高的音頻信號(hào)。第二擴(kuò)展層部分376、386攜帶輔助擴(kuò)充數(shù)據(jù),所述輔助擴(kuò)充數(shù)據(jù)可與核心層310及第一擴(kuò)展層320中的編碼信息結(jié)合使用,恢復(fù)與只根據(jù)核心層310和第一擴(kuò)展層320的結(jié)合體中攜帶的編碼信息恢復(fù)的音頻信號(hào)相比,分辨率更高的音頻信號(hào)。本例中,第一子段370攜帶左聲道CH_L的編碼音頻數(shù)據(jù),第二子段380攜帶右聲道CH_R的編碼音頻數(shù)據(jù)。
控制段350的核心層部分352攜帶用于控制解碼過(guò)程的操作的控制數(shù)據(jù)。這種控制數(shù)據(jù)可包括指示幀340的起始位置的同步數(shù)據(jù),指示程序結(jié)構(gòu)(program configuration)和幀速率的格式數(shù)據(jù),指示幀340中段及子段的邊界的段數(shù)據(jù),指示編碼操作參數(shù)的參數(shù)數(shù)據(jù),以及保護(hù)核心層部分352中的數(shù)據(jù)的檢錯(cuò)信息。最好在核心層部分352中為每種控制數(shù)據(jù)設(shè)置預(yù)定或確定的位置,從而允許解碼器從核心層部分352中快速解析每種控制數(shù)據(jù)。根據(jù)本實(shí)施例,譯解和處理核心層310所必不可少的所有控制數(shù)據(jù)都包含在核心層部分352中。這允許例如由信號(hào)路由電路剝離或丟棄擴(kuò)展層320、330,而不會(huì)損失基本控制數(shù)據(jù),從而支持與被設(shè)計(jì)成接收格式化成L位字的數(shù)據(jù)兼容的數(shù)字信號(hào)處理器。根據(jù)本實(shí)施例,擴(kuò)展層320、330的輔助控制數(shù)據(jù)可包含在擴(kuò)展層部分354中。
在控制段350中,層310、320、330都最好攜帶用于譯解音頻段360中編碼音頻數(shù)據(jù)的相應(yīng)部分的參數(shù)及其它信息。例如,核心層部分352可攜帶聽(tīng)覺(jué)掩蔽曲線的偏移量,所述聽(tīng)覺(jué)掩蔽曲線產(chǎn)生用于把信息知覺(jué)編碼到核心層部分372、382中的第一理想噪聲頻譜。類(lèi)似地,第一擴(kuò)展層部分354可攜帶第一理想噪聲頻譜的偏移量,所述第一理想噪聲頻譜產(chǎn)生用于把信息編碼到擴(kuò)展層部分374、384中的第二理想噪聲頻譜,第二擴(kuò)展層部分356可攜帶第二理想噪聲頻譜的偏移量,所述第二理想噪聲頻譜產(chǎn)生用于把信息編碼到第二擴(kuò)展層部分376、386中的第三理想噪聲頻譜。
現(xiàn)在參見(jiàn)圖3B,圖中表示了可縮放數(shù)據(jù)通道300的備選幀390的示意圖。幀390包括幀340的控制段350和音頻段360。在幀390中,控制段350還包括分別位于核心層310、第一擴(kuò)展層320及第二擴(kuò)展層330中的字段392、394和396。
字段392攜帶指出擴(kuò)充數(shù)據(jù)的組織的標(biāo)記。根據(jù)第一標(biāo)記值,按照預(yù)定的結(jié)構(gòu)組織擴(kuò)充數(shù)據(jù)。所述預(yù)定結(jié)構(gòu)最好是幀340的結(jié)構(gòu),以便用于左聲道CH_L的擴(kuò)充數(shù)據(jù)包含在第一子段370中,用于右聲道CH_R的擴(kuò)充數(shù)據(jù)包含在第二子段380中。這里把其中各個(gè)通道的核心及擴(kuò)充數(shù)據(jù)包含在同一子段中的結(jié)構(gòu)稱為校準(zhǔn)結(jié)構(gòu)(aligned configuration)。根據(jù)第二標(biāo)記值,擴(kuò)充數(shù)據(jù)以自適應(yīng)方式分布在擴(kuò)展層320、330中,字段394、396分別包含各個(gè)相應(yīng)音頻通道的擴(kuò)充數(shù)據(jù)包含在何處的指示。
字段392的大小最好足以包含用于控制段350的核心層部分352中的數(shù)據(jù)的檢錯(cuò)碼。由于這種控制數(shù)據(jù)控制核心層310的解碼操作,因此保護(hù)這種控制數(shù)據(jù)是最好不過(guò)的。另一方面,字段392可包含保護(hù)音頻段360的核心層部分372、382的檢錯(cuò)碼。不需要為擴(kuò)展層320、330中的數(shù)據(jù)提供任何檢錯(cuò),因?yàn)橐话銇?lái)說(shuō)在核心層310的寬度L足夠的情況下,這種錯(cuò)誤的效果幾乎是不能感覺(jué)到的。例如,在核心層310被知覺(jué)(perceptually)編碼成16位字深度(depth)的情況下,擴(kuò)充數(shù)據(jù)主要提供微妙的細(xì)節(jié),一般來(lái)說(shuō),解碼和重放時(shí),擴(kuò)充數(shù)據(jù)中的錯(cuò)誤是難以聽(tīng)見(jiàn)的。
字段394、396可分別包含一個(gè)檢錯(cuò)碼。所述檢錯(cuò)碼分別為擴(kuò)展層320、330提供保護(hù),所述檢錯(cuò)碼分別包含在擴(kuò)展層320、330中。這最好包括控制數(shù)據(jù)的錯(cuò)誤檢測(cè),不過(guò)也可包括音頻數(shù)據(jù)的錯(cuò)誤檢測(cè),或者同時(shí)包括控制數(shù)據(jù)及音頻數(shù)據(jù)的錯(cuò)誤檢測(cè)??蔀閿U(kuò)展層320、330分別規(guī)定兩種不同的檢錯(cuò)碼。第一檢錯(cuò)碼規(guī)定按照預(yù)定的結(jié)構(gòu),例如幀340的結(jié)構(gòu)組織相應(yīng)擴(kuò)展層的擴(kuò)充數(shù)據(jù)。各層的第二檢錯(cuò)碼規(guī)定相應(yīng)層的擴(kuò)充數(shù)據(jù)分布在相應(yīng)層中,并且規(guī)定指針包含在控制段350中以指示該擴(kuò)充數(shù)據(jù)的位置。擴(kuò)充數(shù)據(jù)最好和核心層310中的相應(yīng)數(shù)據(jù)一樣,位于數(shù)據(jù)通道300的相同幀390中。預(yù)定結(jié)構(gòu)可用于組織某一擴(kuò)展層及指針,從而組織另一擴(kuò)展層及其它指針。檢錯(cuò)碼也可以是糾錯(cuò)碼。
現(xiàn)在參見(jiàn)圖4A,圖中表示了根據(jù)本發(fā)明的可縮放編碼過(guò)程400的實(shí)施例的流程圖。該實(shí)施例使用圖3A中所示的數(shù)據(jù)通道300的核心層310和第一擴(kuò)展層320。在步驟402接收若干分波段信號(hào),每個(gè)分波段信號(hào)包含一個(gè)或多個(gè)分波段信號(hào)單元。在步驟404,響應(yīng)第一理想噪聲頻譜,確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率。根據(jù)心理聲學(xué)原理,并且最好還根據(jù)核心層310的數(shù)據(jù)容量要求,確定第一理想噪聲頻譜。這種要求可以是,例如核心層部分372、382的總數(shù)據(jù)容量極限。按照相應(yīng)的第一量化分辨率量化分波段信號(hào),產(chǎn)生第一編碼信號(hào)。在步驟406,第一編碼信號(hào)被輸出到音頻段360的核心層部分372、382中。
在步驟408,確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率。最好根據(jù)核心層和第一擴(kuò)展層310、320的結(jié)合體的數(shù)據(jù)容量要求,并且最好還根據(jù)心理聲學(xué)原理確定第二量化分辨率。該數(shù)據(jù)容量要求可以是,例如核心層部分和第一擴(kuò)展層部分372、374的結(jié)合體的總數(shù)據(jù)容量極限。按照相應(yīng)的第二量化分辨率量化分波段信號(hào),產(chǎn)生第二編碼信號(hào)。在步驟410產(chǎn)生傳送第一和第二編碼信號(hào)間的某些殘數(shù)量度(measure)或差別的第一殘數(shù)信號(hào)。這最好是通過(guò)按照二進(jìn)制補(bǔ)碼或者其它形式的二進(jìn)制算術(shù)運(yùn)算,從第二編碼信號(hào)中減去第一編碼信號(hào)來(lái)實(shí)現(xiàn)。在步驟412,第一殘數(shù)信號(hào)被輸出到音頻段360的第一擴(kuò)展層部分374、384中。
在步驟414,確定相應(yīng)分波段信號(hào)的第三量化分辨率。最好根據(jù)層310、320、330的結(jié)合體的數(shù)據(jù)容量,確定第三量化分辨率。另外最好還使用心理聲學(xué)原理確定第三量化分辨率。按照相應(yīng)的第三量化分辨率量化分波段信號(hào),產(chǎn)生第三編碼信號(hào)。在步驟416產(chǎn)生傳送第二編碼信號(hào)和第三編碼信號(hào)之間的某些殘數(shù)量度或差別的第二殘數(shù)信號(hào)。最好通過(guò)形成第二編碼信號(hào)和第三編碼信號(hào)之間的二進(jìn)制補(bǔ)碼(或者其它二進(jìn)制算術(shù))差別產(chǎn)生第二殘數(shù)信號(hào)。另一方面可產(chǎn)生傳送第一編碼信號(hào)和第三編碼信號(hào)之間的殘數(shù)量度或差別的第二殘數(shù)信號(hào)。在步驟418,第二殘數(shù)信號(hào)被輸出到音頻360的第二擴(kuò)展層部分376、386中。
在步驟404、408、414中,當(dāng)分波段信號(hào)包括一個(gè)以上的分波段信號(hào)單元時(shí),按照特定分辨率的分波段信號(hào)的量化可包括按照特定分辨率統(tǒng)一量化分波段信號(hào)的各個(gè)單元。從而,如果某一分波段信號(hào)(ss)包括三個(gè)分波段信號(hào)單元(se1,se2,se3),則可通過(guò)按照量化分辨率Q,統(tǒng)一量化分波段信號(hào)的各個(gè)分波段信號(hào)單元,按照該量化分辨率Q量化該分波段信號(hào)。量化分波段信號(hào)可被記錄為Q(ss),量化分波段信號(hào)單元可被記錄為Q(se1)、Q(se2)、Q(se3)。這樣,量化分波段信號(hào)Q(ss)包括量化分波段信號(hào)單元Q(se1)、Q(se2)、Q(se3)的集合。識(shí)別相對(duì)于基點(diǎn)許可的分波段信號(hào)單元的量化范圍的編碼范圍可被規(guī)定為編碼參數(shù)?;c(diǎn)最好是能夠產(chǎn)生基本上和聽(tīng)覺(jué)掩蔽曲線相符的注入噪聲(injected noise)的量化水平。相對(duì)于聽(tīng)覺(jué)掩蔽曲線,編碼范圍可以介于,例如濾除噪聲的約144分貝~注入噪聲的約48分貝之間,或者簡(jiǎn)而言之,介于-148dB~+48dB之間。
在本發(fā)明的一個(gè)備選實(shí)施例中,按照特定的量化分辨率Q平均量化同一分波段信號(hào)內(nèi)的分波段信號(hào)單元,但是按照不同的分辨率非均勻地量化單獨(dú)的分波段信號(hào)單元。在本發(fā)明的又一個(gè)提供分波段內(nèi)非均勻量化的實(shí)施例中,增益自適應(yīng)量化技術(shù)按照特定的量化分辨率Q量化相同分波段內(nèi)的某些分波段信號(hào)單元,并按照可能比分辨率Q更細(xì)微或更粗略某一可確定量值的不同分辨率,量化該分波段中的其它分波段信號(hào)單元。在Davidson等于1999年7月7日申請(qǐng)的專(zhuān)利申請(qǐng)“Using Gain-Adaptive Quantization and Non-Uniform Symbol Lengths for ImprovedAudio Coding”中公開(kāi)了在相應(yīng)分波段內(nèi)執(zhí)行非均勻量化的優(yōu)選方法,該專(zhuān)利申請(qǐng)作為參考包含于此。
在步驟402,接收的分波段信號(hào)最好包括一組代表左聲道CH_L的左分波段信號(hào)SS_L和一組代表右聲道CH_R的右分波段信號(hào)SS_R。這些聲道可以是一對(duì)立體聲聲道,或者可以彼此基本無(wú)關(guān)。最好利用一對(duì)理想噪聲頻譜進(jìn)行音頻信號(hào)通道CH_L、CH_R的知覺(jué)編碼,一個(gè)噪聲頻譜用于聲道CH_L、CH_R之一。這樣可在與組SS_R的相應(yīng)分波段信號(hào)不同的分辨率下量化組SS_L的分波段信號(hào)。通過(guò)考慮交叉通道掩蔽效應(yīng),一個(gè)音頻通道的理想噪聲頻譜會(huì)受到其它通道的信號(hào)內(nèi)容的影響。在優(yōu)選實(shí)施例中,交叉通道掩蔽效應(yīng)被忽略。
如下所述根據(jù)分波段信號(hào)SS_L的聽(tīng)覺(jué)掩蔽特征,另外還可根據(jù)分波段信號(hào)SS_R的交叉通道掩蔽特征,以及諸如核心層部分372的可用數(shù)據(jù)容量之類(lèi)的可選標(biāo)準(zhǔn),確定左聲道CH_L的第一理想噪聲頻譜。分析左分波段信號(hào)SS_L,并且還可分析右分波段信號(hào)SS_R,確定左聲道CH_L的聽(tīng)覺(jué)掩蔽曲線AMC_L。聽(tīng)覺(jué)掩蔽曲線指出在聽(tīng)不見(jiàn)的情況下,可注入左聲道CH_L的各個(gè)相應(yīng)分波段中的最大噪聲量。在這方面,聽(tīng)得見(jiàn)的標(biāo)準(zhǔn)是以人類(lèi)聽(tīng)力的心理聲學(xué)模型為基礎(chǔ)確定的,并且可以涉及右聲道CH_R的交叉通道掩蔽特征。聽(tīng)覺(jué)掩蔽曲線AMC_L用作左聲道CH_L的第一理想噪聲頻譜的初始值,分析所述第一理想噪聲頻譜初始值,確定組SS_L的各個(gè)分波段信號(hào)的相應(yīng)量化分辨率Q1_L,以致當(dāng)根據(jù)Q1_L(SS_L)量化組SS_L的分波段信號(hào),并且隨后解量化并將其轉(zhuǎn)換成聲波時(shí),所得到的編碼噪聲是聽(tīng)不見(jiàn)的。為了清楚起見(jiàn),注意術(shù)語(yǔ)Q1_L指的是一組量化分辨率,對(duì)于分波段信號(hào)組SS_L中的各個(gè)分波段信號(hào)ss,該組量化分辨率具有相應(yīng)的值Q1_LSS。要明白的是符號(hào)Q1_L(SS_L)意味著按照相應(yīng)的量化分辨率量化組SS_L中的各個(gè)分波段信號(hào)??扇缟纤鼍鶆蚧蛘叻蔷鶆虻亓炕鱾€(gè)分波段信號(hào)內(nèi)的分波段信號(hào)單元。
按照類(lèi)似的方式,分析右分波段信號(hào)SS_R,最好還分析左分波段信號(hào)SS_L,產(chǎn)生右聲道CH_R的聽(tīng)覺(jué)掩蔽曲線AMC_R。聽(tīng)覺(jué)掩蔽曲線AMC_R可用作右聲道CH_R的初始第一理想噪聲頻譜,分析所述初始第一理想噪聲頻譜,確定組SS_R的各個(gè)分波段信號(hào)的相應(yīng)量化分辨率Q1_R。
現(xiàn)在參見(jiàn)圖4B,圖中表示了根據(jù)本發(fā)明確定量化分辨率的過(guò)程的流程圖。過(guò)程420可用于,例如找出用于根據(jù)過(guò)程400對(duì)各層進(jìn)行編碼的適當(dāng)量化分辨率。下面將關(guān)于左聲道CH_L說(shuō)明過(guò)程420,按照類(lèi)似的方式處理右聲道CH_R。
在步驟422把第一理想噪聲頻譜FDNS_L的初始值設(shè)置為等于聽(tīng)覺(jué)掩蔽曲線AMC_L。在步驟424確定組SS_L的各個(gè)分波段信號(hào)的相應(yīng)量化分辨率,以便據(jù)此量化這些分波段信號(hào),隨后進(jìn)行解量化并將其轉(zhuǎn)換成聲波,因此而產(chǎn)生的任何量化噪聲基本上與第一理想噪聲頻譜FDNS_L相符。在步驟426,確定據(jù)此量化的分波段信號(hào)是否滿足核心層310的數(shù)據(jù)容量要求。在過(guò)程420的本實(shí)施例中,數(shù)據(jù)容量要求被規(guī)定為據(jù)此量化的分波段信號(hào)是否放入核心層部分372中并且基本用盡核心層部分372的數(shù)據(jù)容量。根據(jù)步驟426中的否定確定,在步驟428調(diào)整第一理想噪聲頻譜FDNS_L。調(diào)整包括移動(dòng)第一理想噪聲頻譜FDNS_L,所述移動(dòng)的移動(dòng)量在左聲道CH_L的分波段內(nèi)最好基本相同。在步驟426的確定結(jié)果為據(jù)此量化的分波段信號(hào)未被放入核心層部分372中的情況下,向上移動(dòng),這對(duì)應(yīng)于更粗的分辨率。在步驟426的確定結(jié)果為據(jù)此量化的分波段信號(hào)放入核心層372中的情況下,向下移動(dòng),這對(duì)應(yīng)于更精細(xì)的量化。第一次移動(dòng)的移動(dòng)量最好等于沿移動(dòng)方向到編碼范圍的極值的剩余距離的大約一半。從而,在編碼范圍被規(guī)定為-144dB~+48dB的情況下,第一次移動(dòng)可包括,例如向上移動(dòng)FDNS_L約24dB。隨后每次移動(dòng)的移動(dòng)量最好約為前一次移動(dòng)量的一半。一旦在步驟428調(diào)整第一理想噪聲頻譜FDNS_L,則重復(fù)步驟424和426。當(dāng)在執(zhí)行步驟426中產(chǎn)生肯定確定時(shí),在步驟430終止過(guò)程420,并且認(rèn)為確定的量化分辨率Q1_L是合適的。
按照確定的量化分辨率Q1_L量化組SS_L的分波段信號(hào),產(chǎn)生量化分波段信號(hào)Q1_L(SS_L)。量化分波段信號(hào)Q1_L(SS_L)用作左聲道CH_L的第一編碼信號(hào)FCS_L??砂凑疹A(yù)先確定的任意順序,例如依據(jù)分波段信號(hào)單元的頻譜頻率遞增順序方便地把量化分波段信號(hào)Q1_L(SS_L)輸出到核心層部分372中。這樣,在給定核心層310的核心層部分372的數(shù)據(jù)容量的情況下,在量分分波段信號(hào)Q1_L(SS_L)間分配核心層部分372的數(shù)據(jù)容量是以掩藏盡可能多的量化噪聲為基礎(chǔ)的。按照相似的方式處理右聲道CH_R的分波段信號(hào)SS_R,產(chǎn)生右聲道CH_R的第一編碼信號(hào)FCS_R,所述第一編碼信號(hào)FCS_R被輸出到核心層部分382中。
如下所述按照過(guò)程420確定用于對(duì)第一擴(kuò)展層部分374編碼的適當(dāng)量化分辨率Q2_L。在步驟422,把左聲道CH_L的第二理想噪聲頻譜SDNS_L的初始值設(shè)定為等于第一理想噪聲頻譜FDNS_L。分析第二理想噪聲頻譜SDNS_L,確定組SS_L的各個(gè)分波段信號(hào)ss的相應(yīng)第二量化分辨率Q2_LSS,以致在按照Q2_L(SS_L)量化組SS_L的分波段信號(hào),并且隨后進(jìn)行解量化并將其轉(zhuǎn)換成聲波的情況下,所得到的量化噪聲基本上與第二理想噪聲頻譜SDNS_L相符。在步驟426,確定據(jù)此量化的分波段信號(hào)是否滿足第一擴(kuò)展層320的數(shù)據(jù)容量要求。在過(guò)程420的本實(shí)施例中,數(shù)據(jù)容量要求被規(guī)定為殘數(shù)信號(hào)是否放入第一擴(kuò)展層部分374中,并基本用盡第一擴(kuò)展層部分374的數(shù)據(jù)容量。殘數(shù)信號(hào)被規(guī)定為據(jù)此確定的量化分波段信號(hào)Q2_L(SS_L)和為核心層部分372確定的量化分波段信號(hào)Q1_L(SS_L)之間的殘數(shù)量度或差別。
響應(yīng)步驟426中的否定確定,在步驟428調(diào)整第二理想噪聲頻譜SDNS_L。調(diào)整包括移動(dòng)第二理想噪聲頻譜SDNS_L,所述移動(dòng)的移動(dòng)量在左聲道CH_L的分波段內(nèi)最好基本相同。在步驟426的殘數(shù)信號(hào)未被放入第一擴(kuò)展層部分372中的情況下,向上移動(dòng),否則向下移動(dòng)。第一次移動(dòng)的移動(dòng)量最好等于沿移動(dòng)方向到編碼范圍的極值的剩余距離的大約一半。隨后每次移動(dòng)的移動(dòng)量最好約為前一次移動(dòng)量的一半。一旦在步驟428調(diào)整第二理想噪聲頻譜SDNS_L,則重復(fù)步驟424和426。當(dāng)在執(zhí)行步驟426中產(chǎn)生肯定確定時(shí),在步驟430終止過(guò)程420,并且認(rèn)為確定的量化分辨率Q2_L是合適的。
按照確定的量化分辨率Q2_L量化組SS_L的分波段信號(hào),產(chǎn)生相應(yīng)的量化分波段信號(hào)Q2_L(SS_L),量化分波段信號(hào)Q2_L(SS_L)用作左聲道CH_L的第二編碼信號(hào)SCS_L。產(chǎn)生用于左聲道CH_L的相應(yīng)的第一殘數(shù)信號(hào)FRS_L。優(yōu)選方法是形成各個(gè)分波段信號(hào)單元的殘數(shù)(residue),并通過(guò)按照預(yù)定的順序,例如按照分波段信號(hào)單元的頻率遞增順序,把這些殘數(shù)的二進(jìn)制位表示輸出到第一擴(kuò)展層部分374中。這樣,在給定第一擴(kuò)展層320的第一擴(kuò)展層部分374的數(shù)據(jù)容量的情況下,在量化分波段信號(hào)Q2_L(SS_L)間分配第一擴(kuò)展層部分374的數(shù)據(jù)容量是以掩藏盡可能多的量化噪聲為基礎(chǔ)的。按照相似的方式處理右聲道CH_R的分波段信號(hào)SS_R,產(chǎn)生右聲道CH_R的第二編碼信號(hào)SCS_R和第一殘數(shù)信號(hào)FRS_R。右聲道CH_R的所述第一殘數(shù)信號(hào)FRS_R被輸出到第一擴(kuò)展層部分384中。
可并行確定量化分波段信號(hào)Q2_L(SS_L)和Q1_L(SS_L)。最好通過(guò)把左聲道CH_L的第二理想噪聲頻譜SDNS_L設(shè)置成等于聽(tīng)覺(jué)掩蔽曲線AMC_L或者不依賴于所確定的用于對(duì)核心層編碼的第一理想噪聲頻譜FDNS_L的其它規(guī)范,實(shí)現(xiàn)這種并行確定。數(shù)據(jù)容量要求被規(guī)定為據(jù)此量化的分波段信號(hào)Q2_L(SS_L)是否會(huì)放入核心層部分372和第一擴(kuò)展層部分374的結(jié)合體,并基本用盡所述結(jié)合體的數(shù)據(jù)容量。
就象對(duì)于第二理想噪聲頻譜那樣,得到音頻通道CH_L的第三理想噪聲頻譜的初始值,并且應(yīng)用過(guò)程420,得到相應(yīng)的第三量化分辨率Q3_L。據(jù)此量化的分波段信號(hào)Q3_L(SS_L)用作左聲道CH_L的第三編碼信號(hào)TCS_L。隨后可按照類(lèi)似于第一擴(kuò)展層的方式產(chǎn)生左聲道CH_L的第二殘數(shù)信號(hào)SRS_L。但是在這種情況下,通過(guò)從第二編碼信號(hào)SCS_L中的相應(yīng)分波段信號(hào)單元中減去第三編碼信號(hào)TCS_L中的分波段信號(hào)單元,得到所述殘數(shù)信號(hào)。第二殘數(shù)信號(hào)SRS_L被輸出到第二擴(kuò)展層部分376中。按照相似的方式處理右聲道CH_R的分波段信號(hào)SS_R,產(chǎn)生右聲道CH_R的第三編碼信號(hào)TCS_R和第二殘數(shù)信號(hào)SRS_R。右聲道CH_R的第二殘數(shù)信號(hào)SRS_R被輸出到第二擴(kuò)展層部分386中。
為核心層部分352產(chǎn)生控制數(shù)據(jù)。一般來(lái)說(shuō),控制數(shù)據(jù)允許解碼器與一連串編碼幀中的各幀同步,并且向解碼器指出如何分析并譯解在諸如幀340之類(lèi)的各幀中提供的數(shù)據(jù)。由于設(shè)置了多種編碼分辨率,因此控制數(shù)據(jù)一般要比不可縮放的編碼實(shí)現(xiàn)中的控制數(shù)據(jù)復(fù)雜。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,控制數(shù)據(jù)包括同步模式,格式數(shù)據(jù),段數(shù)據(jù),參數(shù)據(jù)數(shù)據(jù)及檢錯(cuò)碼,所有這些將在下面說(shuō)明。為擴(kuò)展層320、330產(chǎn)生具體說(shuō)明如何譯解擴(kuò)展層320、330的輔助控制信息。
可產(chǎn)生用于指示幀的起點(diǎn)的預(yù)定同步字。同步模式被輸出到各幀的第一個(gè)字的前L位中,指出幀開(kāi)始于何處。最好在幀中的任意其它位置不出現(xiàn)同步模式。同步模式向解碼器指出如何從編碼數(shù)據(jù)流中解析數(shù)據(jù)幀。
可產(chǎn)生指示程序結(jié)構(gòu)(program configuration)、位流簡(jiǎn)表(profile)及幀速率的格式數(shù)據(jù)。程序結(jié)構(gòu)指出包含在編碼位流中的通道的數(shù)目及分布。位流簡(jiǎn)表指出利用的是幀的哪些層。位流簡(jiǎn)表的第一數(shù)值指出只在核心層310中提供編碼。這種情況下最好省略擴(kuò)展層320、330,以便節(jié)省數(shù)據(jù)通道上的數(shù)據(jù)容量。位流簡(jiǎn)表的第二數(shù)值指出在核心層310和第一擴(kuò)展層320中提供編碼數(shù)據(jù)。這種情況下,最好省略第二擴(kuò)展層330。位流簡(jiǎn)表的第三數(shù)值指出在各層310、320、330中提供編碼數(shù)據(jù)。最好按照AES3規(guī)范確定位流簡(jiǎn)表的第一、第二及第三數(shù)值。幀速率可被規(guī)定為單位時(shí)間的幀數(shù)或者近似數(shù)目,例如30Hz,對(duì)于AES3標(biāo)準(zhǔn)來(lái)說(shuō),這對(duì)應(yīng)于每3200字一幀。幀速率幫助解碼器保持同步并且有效緩沖輸入的編碼數(shù)據(jù)。
產(chǎn)生指出段及子段邊界的段數(shù)據(jù)。這些段數(shù)據(jù)包括指出控制段350、音頻360、第一子段370和第二子段380的邊界的段數(shù)據(jù)。在可縮放編碼過(guò)程400的備選實(shí)施例中,例如對(duì)于多通道音頻,在幀中包含有另外的子段。還可提供另外的音頻段,以便通過(guò)把來(lái)自若干幀的音頻信息組合成一個(gè)更大的幀,減小幀中控制數(shù)據(jù)的平均容量。對(duì)于需要較少音頻通道的音頻應(yīng)用,還可省略子段??梢远螖?shù)據(jù)的形式提供關(guān)于附加子段或被省略子段的邊界的數(shù)據(jù)。也可按照相似的方式分別規(guī)定層310、320及330的深度L、M、N。L最好被規(guī)定為16,以便支持向后兼容常規(guī)的16位數(shù)字信號(hào)處理器。M和N最好被規(guī)定為4和4,以便支持由AES3標(biāo)準(zhǔn)確定的可縮放的數(shù)據(jù)通道標(biāo)準(zhǔn)。規(guī)定的深度最好不以數(shù)據(jù)的形式明確包含在幀中,而是在編碼時(shí)推定規(guī)定的深度,以便恰當(dāng)?shù)貙?shí)現(xiàn)在解碼體系結(jié)構(gòu)中。
產(chǎn)生指出編碼操作參數(shù)的參數(shù)數(shù)據(jù)。這種參數(shù)指出哪些種類(lèi)的編碼操作被用于把數(shù)據(jù)編碼成幀。參數(shù)數(shù)據(jù)的第一數(shù)值指出按照高級(jí)電視標(biāo)準(zhǔn)委員會(huì)(ATSC)A52文件(1994)中規(guī)定的公用ATSC AC-3位流規(guī)范對(duì)核心層310編碼。參數(shù)數(shù)據(jù)的第二數(shù)值指出按照體現(xiàn)于DolbyDigital編碼器及解碼器中的知覺(jué)(perceptual)編碼技術(shù)對(duì)核心層310編碼。Dolby Digital編碼器及解碼器可從California,San Francisco的Dolby Laboratories,Inc.購(gòu)買(mǎi)。本發(fā)明可以和各種知覺(jué)編碼及解碼技術(shù)一起應(yīng)用。在美國(guó)專(zhuān)利5913191(Fielder)、5222189(Fielder)、5109417(Fielder等)、5632003(Davidson等)、5583962(Davis等)和5623577(Fielder),以及在Ubale等的美國(guó)專(zhuān)利申請(qǐng)序列號(hào)09/289865中公開(kāi)了這些知覺(jué)編碼和解碼技術(shù)的各個(gè)方面,所有這些專(zhuān)利及申請(qǐng)均作為參考整體包含于此。實(shí)踐本發(fā)明并不需要任何特殊的知覺(jué)編碼或解碼技術(shù)。
產(chǎn)生一個(gè)或多個(gè)檢錯(cuò)碼,用于保護(hù)核心層部分352中的數(shù)據(jù)以及核心層310的音段子段372、382中的數(shù)據(jù)(數(shù)據(jù)容量許可的話)。由于核心層部分352包括對(duì)相對(duì)于編碼數(shù)據(jù)流中的幀340同步以及解析各幀340的核心層310來(lái)說(shuō)必不可少的所有信息,因此和幀340的其它任何部分相比,最好在更高的程度上保護(hù)核心層部分352。
在本發(fā)明的該實(shí)施例中,數(shù)據(jù)如下所述被輸出到幀中。第一編碼信號(hào)FCS_L、FCS_R分別被輸出到核心層部分372、382中,第一殘數(shù)信號(hào)FRS_L、FRS_R分別被輸出到第一擴(kuò)展層部分374、384中,第二殘數(shù)信號(hào)SRS_L、SRS_R分別被輸出到第二擴(kuò)展層部分376、386中。這可通過(guò)在信號(hào)FCS_L由前L位攜帶,信號(hào)FRS_L由接下來(lái)的M位攜帶,信號(hào)SRS_L由最后N位攜帶,對(duì)于信號(hào)FCS_R、FRS_R、SRS_R來(lái)說(shuō)同樣如此的情況下,同時(shí)多路復(fù)用這些信號(hào)FCS_L、FCS_R、FRS_L、FRS_R、SRS_L、SRS_R,形成字長(zhǎng)度均為L(zhǎng)+M+N的一連串字來(lái)實(shí)現(xiàn)。該串字被串行輸出到音頻段360中。同步字、格式數(shù)據(jù)、段數(shù)據(jù)、參數(shù)數(shù)據(jù)及數(shù)據(jù)保護(hù)信息被輸出到核心層部分352中。擴(kuò)展層320、330的附加控制信息被提供給它們相應(yīng)的擴(kuò)展層320、330。
根據(jù)可縮放音頻編碼過(guò)程400的優(yōu)選實(shí)施例,以包含比例因子和一個(gè)或多個(gè)代表各個(gè)分波段信號(hào)單元的縮放值的塊縮放形式(block-scaledform)表示核心層中的各個(gè)分波段信號(hào)。例如,可以用成組浮點(diǎn)表示各個(gè)分波段信號(hào),其中成組浮點(diǎn)指數(shù)是比例因子,各個(gè)分波段信號(hào)單元由浮點(diǎn)尾數(shù)表示。實(shí)際上可使用任意形式的按比例縮放。為了簡(jiǎn)化解析編碼數(shù)據(jù)流,恢復(fù)比例因子及縮放值,可在各幀內(nèi)的預(yù)定位置把比例因子編碼到數(shù)據(jù)流中,以致位于音頻段360內(nèi)的各個(gè)子段370、380的起點(diǎn)。
在優(yōu)選實(shí)施例中,比例因子提供分波段信號(hào)功率的量度,心理聲學(xué)模型可使用所述分波段信號(hào)功率的量度確定如前所述的聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R。最好,第一擴(kuò)展層310的比例因子被用作擴(kuò)展層320、330的比例因子,從而不必為每層產(chǎn)生并輸出一組截然不同的比例因子。一般來(lái)說(shuō),只有各個(gè)編碼信號(hào)的相應(yīng)分波段信號(hào)單元之間的差別的最高有效位才被編碼到擴(kuò)展層中。
在優(yōu)選實(shí)施例中,進(jìn)行輔助處理,從編碼數(shù)據(jù)中消除保留的或禁止的數(shù)據(jù)模式。例如,應(yīng)避免編碼音頻數(shù)據(jù)中會(huì)模仿被保留而出現(xiàn)于幀起點(diǎn)的同步模式的數(shù)據(jù)模式。避免特殊的非零數(shù)據(jù)模式的一種簡(jiǎn)單方式是通過(guò)在編碼音頻數(shù)據(jù)和適當(dāng)?shù)拿荑€之間進(jìn)行逐位“異”操作。在Vernon等于1998年10月19日申請(qǐng)的美國(guó)專(zhuān)利申請(qǐng),序列號(hào)09/175090“AvoidingForbidden Data Patterns I、in Coded Audio Data”中公開(kāi)了避免禁止的及保留的數(shù)據(jù)模式的其它細(xì)節(jié)及輔助技術(shù)。密鑰或其它控制信息可包含在各幀中,反轉(zhuǎn)所執(zhí)行的任何修改的效果,從而消除這些模式。
現(xiàn)在參見(jiàn)圖5,圖中表示了圖解說(shuō)明根據(jù)本發(fā)明的可縮放解碼過(guò)程500的流程圖??煽s放的解碼過(guò)程500接收編碼到一連串層中的音頻信號(hào)。第一層包括音頻信號(hào)的知覺(jué)(perceptual)編碼。所述知覺(jué)編碼表現(xiàn)具有第一分辨率的音頻信號(hào)。其余各層均包含有和音頻信號(hào)的另一相應(yīng)編碼相關(guān)的數(shù)據(jù)。所述一連串層按照編碼音頻分辨率的遞增順序排序。更特別的是,可以組合并譯解前K層的數(shù)據(jù),提供與前K-1層中的數(shù)據(jù)相比分辨率更高的音頻,這里K是大于1并且不大于層數(shù)總數(shù)的整數(shù)。
根據(jù)過(guò)程500,在步驟511選擇譯解分辨率。確定與選擇的分辨率相聯(lián)系的層次。如果為了消除保留或禁止數(shù)據(jù)模式而修改了數(shù)據(jù)流,則應(yīng)反轉(zhuǎn)這些修改的效果。在步驟513組合所確定層次中包含的數(shù)據(jù)與先前各層中的數(shù)據(jù),隨后在步驟515根據(jù)采用的按照相應(yīng)分辨率對(duì)音頻信號(hào)編碼的編碼過(guò)程的反向操作,譯解組合數(shù)據(jù)。信號(hào)路由電路可剝離或忽略與比選擇的分辨率更高的分辨率相聯(lián)系的各層。在解碼前應(yīng)進(jìn)行反轉(zhuǎn)縮放效果所需的任何過(guò)程或操作。
現(xiàn)在說(shuō)明處理系統(tǒng)100對(duì)通過(guò)標(biāo)準(zhǔn)AES3數(shù)據(jù)通道接收的音頻數(shù)據(jù)進(jìn)行的可縮放解碼過(guò)程500的一個(gè)實(shí)施例。標(biāo)準(zhǔn)AES3數(shù)據(jù)通道以一連串位寬為24的字的形式提供數(shù)據(jù)。借助從0(它是最高有效位)到23(它是最低有效位)的位編號(hào),可方便地識(shí)別字的各個(gè)二進(jìn)制位。這里符號(hào)位(n~m)用于表示字的位(n)~(m),n和m為整數(shù),并且m>n。按照本發(fā)明的可縮放數(shù)據(jù)結(jié)構(gòu)300,AES3數(shù)據(jù)通道被分成一連串的幀,例如幀340。核心層310包括位(0~15),第一擴(kuò)展層320包括位(16~19),第二擴(kuò)展層330包括位(20~23)。
通過(guò)處理系統(tǒng)100的音頻輸入/輸出接口140接收層310、320、330中的數(shù)據(jù)。響應(yīng)解碼指令的程序,處理系統(tǒng)100在數(shù)據(jù)流中搜索16位的同步模式,以便使其處理與各幀邊界對(duì)準(zhǔn),把從同步模式順序開(kāi)始的數(shù)據(jù)分成表示為位(0~23)的24位字。從而第一個(gè)字的位(0~15)是同步模式。此時(shí)可執(zhí)行反轉(zhuǎn)為消除專(zhuān)用模式而進(jìn)行的修改的效果所需的任何處理。
讀取核心層310中的預(yù)定位置,從而獲得格式數(shù)據(jù)、段數(shù)據(jù)、參數(shù)數(shù)據(jù)、偏移量及數(shù)據(jù)保護(hù)信息。處理檢錯(cuò)碼,以便檢測(cè)控制層部分352中數(shù)據(jù)中的任何錯(cuò)誤。當(dāng)檢測(cè)到數(shù)據(jù)錯(cuò)誤時(shí),可使相應(yīng)音頻靜音或者重新傳送數(shù)據(jù)。隨后解析幀340,獲得用于后續(xù)解碼操作的數(shù)據(jù)。
為了只對(duì)核心層310進(jìn)行解碼,在步驟511選擇16位分辨率。讀取第一和第二音頻子段370、380的核心層部分372、382中的確定位置,從而獲得編碼分波段信號(hào)單元。在利用塊縮放表示法的優(yōu)選實(shí)施例中,這是通過(guò)首先獲得各個(gè)分波段信號(hào)的塊比例因子(block scaling factor),并使用這些比例因子產(chǎn)生和編碼過(guò)程中使用的聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R相同的聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R來(lái)實(shí)現(xiàn)的。對(duì)于從核心層部分352讀出的各個(gè)通道,通過(guò)使聽(tīng)覺(jué)掩蔽曲線AMC_L、AMC_R移動(dòng)相應(yīng)的偏移量O1_L、O1_R,產(chǎn)生音頻通道CH_L、CH_R的第一理想噪聲頻譜。隨后按照編碼過(guò)程400使用的相同方式確定音頻通道的第一量化分辨率Q1_L、Q1_R?,F(xiàn)在處理系統(tǒng)100可分別確定音頻子段370、380的核心層部分372、382中代表分波段信號(hào)單元的縮放值的編碼縮放值的長(zhǎng)度和位置。從子段370、380中解析出編碼縮放值,并使之與相應(yīng)的分波段比例因子組合,從而得到音頻通道CH_L、CH_R的量化分波段信號(hào)單元,所述量化分波段信號(hào)單元隨后被轉(zhuǎn)換成數(shù)字音頻流。通過(guò)采用與編碼過(guò)程中采用的分析濾波器組互補(bǔ)的合成濾波器組實(shí)現(xiàn)這種轉(zhuǎn)換。數(shù)字音頻流表現(xiàn)左聲道CH_L和右聲道CH_R。借助可按照常規(guī)方式實(shí)現(xiàn)的數(shù)-模轉(zhuǎn)換,這些數(shù)字信號(hào)可被轉(zhuǎn)換成模擬信號(hào)。
可如下所示譯解核心層和第一擴(kuò)展層310、320。在步驟511選擇20位編碼分辨率。如上所述獲得核心層310中的分波段信號(hào)單元。從控制段350的擴(kuò)展層部分354讀出附加偏移量O2_L。通過(guò)使左聲道CH_L的第一理想噪聲頻譜移動(dòng)偏移量O2_L,產(chǎn)生音頻通道CH_L的第二理想噪聲頻譜,并且響應(yīng)獲得的噪聲頻譜,按照關(guān)于根據(jù)編碼過(guò)程400對(duì)第一擴(kuò)展層進(jìn)行知覺(jué)編碼所描述的方式確定第二量化分辨率Q2_L。這些量化分辨率Q2_L指出擴(kuò)展層部分374中殘數(shù)信號(hào)RES1_L的各個(gè)分量的長(zhǎng)度和位置。處理系統(tǒng)100讀取相應(yīng)的殘數(shù)信號(hào),并通過(guò)在步驟513組合殘數(shù)信號(hào)RES1_L和從核心層310獲得的縮放表示(scaledrepresentation),得到量化分波段信號(hào)單元的縮放表示。在本發(fā)明的該實(shí)施例中,這是利用二進(jìn)制編碼加法實(shí)現(xiàn)的,逐一對(duì)分波段信號(hào)單元執(zhí)行所述加法。根據(jù)各個(gè)分波段信號(hào)的縮放表示得到量化的分波段信號(hào)單元,隨后利用適當(dāng)?shù)男盘?hào)合成過(guò)程轉(zhuǎn)換量化的分波段信號(hào)單元,產(chǎn)生各個(gè)通道的數(shù)字音頻流。借助數(shù)-模轉(zhuǎn)換,數(shù)字音頻流可被轉(zhuǎn)換成模擬信號(hào)。可按照類(lèi)似于上面說(shuō)明的方式譯解核心層和第一、第二擴(kuò)展層310、320、330。
現(xiàn)在參考圖6A,圖中表示了用于根據(jù)本發(fā)明的可縮放音頻編碼的幀700的備選實(shí)施例的示意圖。幀700確定24位寬AES數(shù)據(jù)通道701的數(shù)據(jù)容量的分配。AES3數(shù)據(jù)通道包括一連串的24位寬的字。AES3數(shù)據(jù)通道包括核心層710和標(biāo)識(shí)為中間層720及精細(xì)層(fine layer)730的兩個(gè)擴(kuò)展層。核心層710、中間層720及精細(xì)層730分別包括各個(gè)字的位(0~15)、位(16~19)及位(20~23)。從而,精細(xì)層730包括AES3數(shù)據(jù)通道的四個(gè)最低有效位,中間層720包括該數(shù)據(jù)通道的四個(gè)次低有效位。
分配數(shù)據(jù)通道701的數(shù)據(jù)容量,以便支持若干分辨率條件下的音頻解碼。這里這些分辨率指的是核心層710支持的16位分辨率,核心層710和中間層720的結(jié)合體支持的20位分辨率,以及由核心層710、中間層720和精細(xì)層730的結(jié)合體支持的24位分辨率。應(yīng)明白上面提及的各種分辨率中的位數(shù)指的是傳輸或存儲(chǔ)過(guò)程中各個(gè)相應(yīng)層次的容量,并不涉及各層中包含的表現(xiàn)編碼音頻信號(hào)的符號(hào)的量化分辨率或者位長(zhǎng)度。從而,所謂的“16位分辨率”對(duì)應(yīng)于基本分辨率條件下的知覺(jué)編碼,并且當(dāng)解碼和重放時(shí),通常感到比16位PCM音頻信號(hào)更精確。類(lèi)似地,20位和24位分辨率對(duì)應(yīng)于逐漸更高的分辨率條件下的知覺(jué)編碼,并且一般來(lái)說(shuō)可感到比相應(yīng)的20位及24位PCM音頻信號(hào)更為精確。
幀700被分成包括同步段740、元數(shù)據(jù)段750、音頻段760,并且還可包括元數(shù)據(jù)擴(kuò)充段770、音頻擴(kuò)充段780和量度(meter)段790的一系列段。元數(shù)據(jù)擴(kuò)充段770和音頻擴(kuò)充段780相互依賴,因此要么同時(shí)包含有元數(shù)據(jù)擴(kuò)充段770和音頻擴(kuò)充段780,要么既不包含元數(shù)據(jù)擴(kuò)充段770又不包含音頻擴(kuò)充段780。在幀700的本實(shí)施例中,各段包括各層710、720、730中的多個(gè)部分。現(xiàn)在參見(jiàn)圖6B、6C和6D,圖中表示了音頻段760和音頻擴(kuò)充段780、元數(shù)據(jù)段750和元數(shù)據(jù)擴(kuò)充段770的優(yōu)選結(jié)構(gòu)的示意圖。
在同步段740中,位(0~15)包含一個(gè)16位的同步模式,位(16~19)包含用于中間層720的一個(gè)或多個(gè)檢錯(cuò)碼,位(20~23)包含用于精細(xì)層730的一個(gè)或多個(gè)檢錯(cuò)碼。擴(kuò)充數(shù)據(jù)中的錯(cuò)誤一般產(chǎn)生聽(tīng)得見(jiàn)的微妙效果,因此數(shù)據(jù)保護(hù)局限于每個(gè)擴(kuò)展層4位代碼有益于節(jié)約AES3數(shù)據(jù)通道中的數(shù)據(jù)。在如上所述的元數(shù)據(jù)段750和元數(shù)據(jù)擴(kuò)充段770中可提供擴(kuò)展層720、730的輔助數(shù)據(jù)保護(hù)。還可為各個(gè)相應(yīng)的擴(kuò)展層720、730規(guī)定兩個(gè)不同的數(shù)據(jù)保護(hù)值。任意一個(gè)所述數(shù)據(jù)保護(hù)值為相應(yīng)層次720、730提供數(shù)據(jù)保護(hù)。第一數(shù)據(jù)保護(hù)值指出按照諸如校準(zhǔn)結(jié)構(gòu)之類(lèi)的預(yù)定方式配置音頻段760的相應(yīng)層。第二數(shù)據(jù)保護(hù)值指出元數(shù)據(jù)段750包含的指針指出擴(kuò)充數(shù)據(jù)包含在音頻段760的相應(yīng)層次中的位置,并且如果包含有音頻擴(kuò)充段780,則元數(shù)據(jù)擴(kuò)充段770中的指針指出擴(kuò)充數(shù)據(jù)包含在音頻擴(kuò)充段780的相應(yīng)層次中的位置。
音頻段760基本上類(lèi)似于前面說(shuō)明的幀390的音頻段360。音頻段760包括第一子段761和第二子段7610。第一子段761包括一個(gè)數(shù)據(jù)保護(hù)段767,分別包含第一子段761的相應(yīng)子段763、764、765、766的四個(gè)相應(yīng)通道子段(CS_0、CS_1、CS_2、CS_3),并且還可包括一個(gè)前綴762。通道子段對(duì)應(yīng)于多通道音頻信號(hào)的四個(gè)相應(yīng)音頻通道(CH_0、CH_1、CH_2、CH_3)。
在可選的前綴762中,核心層710包含用于避免核心層710相應(yīng)攜帶的第一子段部分內(nèi)的禁止模式的禁止模式密鑰(KEY1_C),中間層720包含用于避免中間層720攜帶的第一子段部分內(nèi)的禁止模式的禁止模式密鑰(KEY1_I),精細(xì)層730包含用于避免精細(xì)層730相應(yīng)攜帶的第一子段部分內(nèi)的禁止模式的禁止模式密鑰(KEY1_F)。
在通道子段CS_0中,核心層710包含音頻通道CH_0的第一編碼信號(hào),中間層720包括音頻通道CH_0的第一殘數(shù)信號(hào),精細(xì)層730包括音頻通道CH_0的第二殘數(shù)信號(hào)。最好利用如下所述修改的編碼過(guò)程401把這些信號(hào)編碼到各自相應(yīng)的層次中。通道段CS_1、CS_2、CS_3按照類(lèi)似的方式分別包含音頻通道CH_1、CH_2、CH_3的數(shù)據(jù)。
在數(shù)據(jù)保護(hù)段767中,核心層710攜帶由核心層710相應(yīng)包含的第一子段部分的一個(gè)或多個(gè)檢錯(cuò)碼,中間層720攜帶中間層720包含的第一子段部分的一個(gè)或多個(gè)檢錯(cuò)碼,精細(xì)層730攜帶由精細(xì)層730相應(yīng)包含的第一子段部分的一個(gè)或多個(gè)檢錯(cuò)碼。在本實(shí)施例中,最好借助循環(huán)冗余碼(CRC)提供數(shù)據(jù)保護(hù)。
第二子段7610類(lèi)似地包括一個(gè)數(shù)據(jù)保護(hù)段7670、分別包含第二子段7610的相應(yīng)子段7630、7640、7650、7660的四個(gè)通道子段(CS_4、CS_5、CS_6、CS_7),并且還可包括一個(gè)前綴7620。按照類(lèi)似于子段761的方式配置第二子段7610。類(lèi)似于音頻段760配置音頻擴(kuò)充段780,允許兩個(gè)或多個(gè)音頻段位于單一幀內(nèi),從而減小標(biāo)準(zhǔn)AES3數(shù)據(jù)通道中消耗的數(shù)據(jù)容量。
如下所述配置元數(shù)據(jù)段750。由核心層710攜帶的元數(shù)據(jù)段750部分包括標(biāo)題段751、幀控制段752、元數(shù)據(jù)子段753和數(shù)據(jù)保護(hù)段754。中間層720攜帶的元數(shù)據(jù)段750部分包括中間元數(shù)據(jù)子段755和數(shù)據(jù)保護(hù)子段757,精細(xì)層730攜帶的元數(shù)據(jù)段750部分包括中間元數(shù)據(jù)子段756和數(shù)據(jù)保護(hù)子段758。在各層之間,數(shù)據(jù)保護(hù)子段754、757、758不必對(duì)準(zhǔn),但是最好均位于其相應(yīng)各層的尾部或者位于另外某一預(yù)定位置。
標(biāo)題751包括指示程序結(jié)構(gòu)和幀速率的格式數(shù)據(jù)。幀控制段752包括規(guī)定同步段740、元數(shù)據(jù)段750和音頻段760中各段及各子段的邊界的段數(shù)據(jù)。元數(shù)據(jù)子段753、755、756包括指示執(zhí)行的把音頻數(shù)據(jù)分別編碼到核心層710、中間層720和精細(xì)層730中的編碼操作參數(shù)的參數(shù)數(shù)據(jù)。這些參數(shù)數(shù)據(jù)指出使用何種編碼操作對(duì)相應(yīng)層進(jìn)行編碼。最好相同類(lèi)型的編碼操作被用于具有相適應(yīng)的分辨率的各個(gè)層次,以便反映各層中數(shù)據(jù)容量的相對(duì)數(shù)量。另一方面也可在核心層720中包含中間層720和精細(xì)層730的參數(shù)數(shù)據(jù)。但是核心層710的所有參數(shù)數(shù)據(jù)最好只包含在核心層710中,從而信號(hào)路由電路可剝離或忽略擴(kuò)展層720、730,而不影響譯解核心層710的能力。數(shù)據(jù)保護(hù)段754、757、758包含分別保護(hù)核心層710、中間層720及精細(xì)層730的一個(gè)或多個(gè)檢錯(cuò)碼。
除了元數(shù)據(jù)擴(kuò)充段770不包括幀控制段752之外,元數(shù)據(jù)擴(kuò)充段770基本上類(lèi)似于元數(shù)據(jù)段750。元數(shù)據(jù)擴(kuò)充段770和音頻擴(kuò)充段780中各段和各子段的邊界由它們與元數(shù)據(jù)段750和音頻段760的實(shí)質(zhì)相似性結(jié)合由元數(shù)據(jù)段750中幀控制段752包含的段數(shù)據(jù)來(lái)指示。
可選的量度段790包含幀700中所含的編碼音頻數(shù)據(jù)的平均幅度。特別地,在忽略音頻擴(kuò)充段780的情況下,量度段790的位(0~15)包含音頻段760的位(0~15)中所含的編碼音頻數(shù)據(jù)的平均幅度的表示,位(16~19)和(20~23)分別包含分別被稱為中間量度(IM)和精細(xì)量度(FM)的擴(kuò)充數(shù)據(jù)。IM可以是包含在音頻段760的位(16~19)中的編碼音頻數(shù)據(jù)的平均幅度,F(xiàn)M可以是包含在音頻段760的位(20~23)中的編碼音頻數(shù)據(jù)的平均幅度。在包含音頻擴(kuò)充段780的情況下,平均幅度IM和FM最好反映包含在音頻擴(kuò)充段780各層中的編碼音頻。量度段790支持解碼時(shí)方便地顯示平均音頻幅度。對(duì)于正確的音頻解碼來(lái)說(shuō)這并不是必需的,為了節(jié)約AES3數(shù)據(jù)通道上的數(shù)據(jù)容量,可將其省略。
最好利用如下所述修改的可縮放的編碼過(guò)程400和420把音頻數(shù)據(jù)編碼到幀700中。接收八個(gè)通道中各個(gè)通道的音頻分波段信號(hào)。最好通過(guò)對(duì)時(shí)域音頻數(shù)據(jù)的八個(gè)相應(yīng)通道的成批樣本應(yīng)用塊變換(blocktransform),并組合變換系數(shù),從而形成分波段信號(hào)來(lái)產(chǎn)生這些分波段信號(hào)。均以包含分波段中各個(gè)系數(shù)的塊指數(shù)(block exponent)和尾數(shù)的塊浮點(diǎn)(block-floating-point)形式表示這些分波段信號(hào)。
通過(guò)利用一組分波段的“主指數(shù)”,可擴(kuò)展指定位長(zhǎng)度的分波段指數(shù)的動(dòng)態(tài)范圍。比較該組分波段中分波段的指數(shù)和某一閾值,確定相關(guān)主指數(shù)的數(shù)值。如果該組中每個(gè)分波段指數(shù)都大于例如,為3的閾值,則主指數(shù)的數(shù)值被設(shè)定為1,并且相關(guān)分波段指數(shù)減3,否則主指數(shù)被設(shè)定為0。
也可使用前面簡(jiǎn)要說(shuō)明的增益自適應(yīng)量化技術(shù)。在一個(gè)實(shí)施例中,根據(jù)各個(gè)分波段信號(hào)的尾數(shù)的量值是否大于二分之一,把各個(gè)分波段信號(hào)的尾數(shù)分成兩組。小于或等于二分之一的尾數(shù)的數(shù)值被加倍,以便減少表現(xiàn)這些尾數(shù)所需的二進(jìn)制位的數(shù)目。調(diào)整尾數(shù)的量化,反映這種加倍。尾數(shù)也可被分成兩組上以的多組。例如,根據(jù)尾數(shù)的量值是在0~1/4之間、1/4~1/2之間還是在1/2~1之間,可把尾數(shù)分成三組,分別乘以4、2和1的比例因子,并據(jù)此量化,以便節(jié)約額外的數(shù)據(jù)容量。從上面引用的美國(guó)專(zhuān)利申請(qǐng)中可獲得其它信息。
產(chǎn)生各個(gè)通道的聽(tīng)覺(jué)掩蔽曲線。各個(gè)聽(tīng)覺(jué)掩蔽曲線可能依賴于多個(gè)通道(在本實(shí)現(xiàn)中多達(dá)8個(gè)通道),而不僅僅是一個(gè)或二個(gè)通道的音頻數(shù)據(jù)。利用這些聽(tīng)覺(jué)掩蔽曲線,并在如上所述修改尾數(shù)量化的情況下,對(duì)各個(gè)通道應(yīng)用可縮放的編碼過(guò)程400。應(yīng)用迭代過(guò)程420確定對(duì)各層進(jìn)行編碼的適當(dāng)量化分辨率。本實(shí)施例中,相對(duì)于對(duì)應(yīng)的聽(tīng)覺(jué)掩蔽曲線,編碼范圍被規(guī)定為約-144dB~+48dB。隨后分析過(guò)程400和420所產(chǎn)生的各個(gè)通道的第一編碼信號(hào)、第一及第二殘數(shù)信號(hào),確定音頻段760的第一子段761的禁止模式密鑰KEY1_C、KEY1_I、KEY1_F(對(duì)于第二子段7610來(lái)說(shuō),與此類(lèi)似)。
為第一批多通道音頻產(chǎn)生元數(shù)據(jù)段750的控制數(shù)據(jù)。除了省略第二批多通道音頻的段信息之外,按照類(lèi)似方式為第二批多通道音頻產(chǎn)生元數(shù)據(jù)擴(kuò)充段770的控制數(shù)據(jù)。利用如上所述的相應(yīng)禁止模式密鑰分別修改這些控制數(shù)據(jù),并分別輸出到元數(shù)據(jù)段750和元數(shù)據(jù)段擴(kuò)充段770中。
同樣對(duì)第二批的八個(gè)音頻通道進(jìn)行上述過(guò)程,同時(shí)按照相似的方式把產(chǎn)生的編碼信號(hào)輸出到音頻擴(kuò)充段780中。除了對(duì)于第二批多通道音頻來(lái)說(shuō)不產(chǎn)生任何段數(shù)據(jù)之外,按照和第一批多通道音頻相同的方式產(chǎn)生第二批多通道音頻的控制數(shù)據(jù)。該控制數(shù)據(jù)輸出到元數(shù)據(jù)擴(kuò)充段770中。
同步模式被輸出到同步段740的位(0~15)中。分別為中間層720和精細(xì)層730產(chǎn)生兩個(gè)位寬為4的檢錯(cuò)碼,并分別輸出到同步段740的位(16~19)和位(20-23)中。本實(shí)施例中,擴(kuò)充數(shù)據(jù)中的錯(cuò)誤通常產(chǎn)生聽(tīng)得見(jiàn)的細(xì)微效果,因此錯(cuò)誤檢測(cè)局限于每個(gè)擴(kuò)展層的4位代碼有益于節(jié)約標(biāo)準(zhǔn)AES3數(shù)據(jù)通道中的數(shù)據(jù)容量。
根據(jù)本發(fā)明,檢錯(cuò)碼可具有不依賴于所保護(hù)的數(shù)據(jù)的位模式的預(yù)定值,例如“0001”。通過(guò)檢查這種檢錯(cuò)碼,確定代碼本身是否已被破壞,提供錯(cuò)誤檢測(cè)。如果代碼本身已被破壞,則認(rèn)為層中的其它數(shù)據(jù)被破壞,獲得該數(shù)據(jù)的另一副本,或者抑制所述錯(cuò)誤。優(yōu)選實(shí)施例為每個(gè)擴(kuò)展層規(guī)定了多個(gè)預(yù)定檢錯(cuò)碼。這些代碼也可指示層的結(jié)構(gòu)。例如,第一檢錯(cuò)碼“0101”指出層具有預(yù)定的結(jié)構(gòu),例如校準(zhǔn)結(jié)構(gòu)。第二檢錯(cuò)碼“1001”指出層具有分布式結(jié)構(gòu),并且指針或其它數(shù)據(jù)被輸出到元數(shù)據(jù)段750或其它位置,以指示層中數(shù)據(jù)的分布模式。在傳輸過(guò)程中幾乎不可能一個(gè)代碼受到破壞而產(chǎn)生另一代碼,因?yàn)楸囟ㄊ瞧茐脑摯a的2個(gè)二進(jìn)制位,而不破壞其余二進(jìn)制位。從而該實(shí)施例基本上可避免單個(gè)位(single bit)傳輸錯(cuò)誤。此外,譯解擴(kuò)展層時(shí)產(chǎn)生的任何錯(cuò)誤一般最多只產(chǎn)生細(xì)微的聽(tīng)得到的效果。
在本發(fā)明的一個(gè)備選實(shí)施例中,采用其它形式的平均信息量編碼壓縮音頻數(shù)據(jù)。例如,在一個(gè)備選實(shí)施例中,16位平均信息量編碼過(guò)程產(chǎn)生輸出到核心層上的壓縮數(shù)據(jù)。對(duì)在更高分辨率下的數(shù)據(jù)編碼重復(fù)該過(guò)程,產(chǎn)生試用編碼信號(hào)。結(jié)合試用編碼信號(hào)和壓縮的音頻數(shù)據(jù),產(chǎn)生試用殘數(shù)信號(hào)。根據(jù)需要重復(fù)上述過(guò)程,直到試用殘數(shù)信號(hào)有效利用第一擴(kuò)展層的數(shù)據(jù)容量為止,并把試用殘數(shù)信號(hào)輸出到第一擴(kuò)展層上。通過(guò)再次提高平均信息量編碼的分辨率,對(duì)第二層或多個(gè)附加擴(kuò)展層重復(fù)上述過(guò)程。
對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),當(dāng)參考本申請(qǐng)時(shí),本發(fā)明的各種變化和修改將是顯而易見(jiàn)的。本發(fā)明提供了這樣的修改和變化,本發(fā)明的范圍只由下述權(quán)利要求限定。
權(quán)利要求
1.一種可縮放編碼過(guò)程,所述過(guò)程利用具有一個(gè)核心層和一個(gè)擴(kuò)展層的標(biāo)準(zhǔn)數(shù)據(jù)通道,所述過(guò)程包括接收若干分波段信號(hào);根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率,并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第一編碼信號(hào);根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率,并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第二編碼信號(hào);產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào);和把第一編碼信號(hào)輸出到核心層中,把殘數(shù)信號(hào)輸出到擴(kuò)展層中。
2.按照權(quán)利要求1所述的過(guò)程,其中根據(jù)按照心理聲學(xué)原理確定的分波段信號(hào)的音頻掩蔽特性曲線,確定第一理想噪聲頻譜。
3.按照權(quán)利要求1所述的過(guò)程,其中按照根據(jù)滿足核心層數(shù)據(jù)容量要求的這樣的第一量化分辨率量化的分波段信號(hào),確定第一量化分辨率。
4.按照權(quán)利要求1所述的過(guò)程,其中以對(duì)準(zhǔn)的形式輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
5.按照權(quán)利要求1所述的過(guò)程,其中輸出輔助數(shù)據(jù),以指示殘數(shù)信號(hào)相對(duì)于第一編碼信號(hào)的結(jié)構(gòu)模式。
6.按照權(quán)利要求1所述的過(guò)程,其中相對(duì)于第一理想噪聲頻譜,使第二理想噪聲頻譜編移基本均勻的量值,其中所述基本均勻量值的指示被輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
7.按照權(quán)利要求1所述的過(guò)程,其中第一編碼信號(hào)包括若干比例因子,其中殘數(shù)信號(hào)由第一編碼信號(hào)的比例因子表示。
8.按照權(quán)利要求1所述的過(guò)程,其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示,其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
9.一種可縮放編碼過(guò)程,所述過(guò)程使用具有若干層的標(biāo)準(zhǔn)數(shù)據(jù)通道,所述過(guò)程包括接收若干分波段信號(hào);產(chǎn)生分波段信號(hào)的知覺(jué)編碼和第二編碼;產(chǎn)生指示相對(duì)于知覺(jué)編碼的第二編碼殘數(shù)的殘數(shù)信號(hào);以及把知覺(jué)編碼輸出到第一層中,把殘數(shù)信號(hào)輸出到第二層中。
10.按照權(quán)利要求9所述的可縮放編碼過(guò)程,還包括產(chǎn)生分波段信號(hào)的第三編碼;產(chǎn)生指示相對(duì)于知覺(jué)編碼和第二編碼中至少之一的第三編碼殘數(shù)的第二殘數(shù)信號(hào);和把第二殘數(shù)信號(hào)輸出到第三層中。
11.按照權(quán)利要求9所述的可縮放編碼過(guò)程,其中數(shù)據(jù)通道遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3,第一層是16位寬的數(shù)據(jù)通道層,第二層和第三層均為4位寬的數(shù)據(jù)通道層。
12.按照權(quán)利要求9所述的過(guò)程,還包括產(chǎn)生指示相對(duì)于知覺(jué)編碼的殘數(shù)信號(hào)結(jié)構(gòu)的檢錯(cuò)數(shù)據(jù);和把檢錯(cuò)數(shù)據(jù)輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
13.按照權(quán)利要求9所述的過(guò)程,還包括產(chǎn)生一連串的二進(jìn)制位;把所述一連串二進(jìn)制位輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中;在接收器接收對(duì)應(yīng)于二進(jìn)制位的輸出序列的一連串二進(jìn)制位;分析接收的一連串二進(jìn)制位,確定其是否與產(chǎn)生的一連串二進(jìn)制位相符;和根據(jù)分析結(jié)果確定知覺(jué)編碼和殘數(shù)信號(hào)之一是否包括傳輸錯(cuò)誤。
14.按照權(quán)利要求9所述的過(guò)程,其中根據(jù)第一層和第二層的結(jié)合體的數(shù)據(jù)容量,產(chǎn)生第二編碼。
15.多層數(shù)據(jù)通道包含的數(shù)據(jù)的處理方法,其中所述數(shù)據(jù)通道的第一層包含音頻信號(hào)的知覺(jué)編碼,數(shù)據(jù)通道的第二層包含提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù),所述方法使用解碼器,并且包括通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù);和把音頻信號(hào)的知覺(jué)編碼送到解碼器。
16.按照權(quán)利要求15所述的方法,還包括譯解音頻信號(hào)的知覺(jué)編碼。
17.按照權(quán)利要求15所述的方法,還包括組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù),產(chǎn)生分辨率高于音頻信號(hào)的知覺(jué)編碼的第二音頻信號(hào)編碼;和譯解音頻信號(hào)的第二編碼。
18.按照權(quán)利要求17所述的方法,其中通過(guò)遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3的數(shù)據(jù)通道的16位核心層,接收知覺(jué)編碼,其中通過(guò)數(shù)據(jù)通道的至少一個(gè)4位寬的擴(kuò)展層接收擴(kuò)充數(shù)據(jù)。
19.按照權(quán)利要求15所述的方法,其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的,分別對(duì)應(yīng)于一個(gè)截然不同音頻通道的若干片段;和把所述若干片段之一包含的知覺(jué)編碼的各個(gè)部分與它所包含的擴(kuò)充數(shù)據(jù)的各個(gè)部分相結(jié)合,產(chǎn)生代表音頻通道之一的中間信號(hào)。
20.按照權(quán)利要求17所述的方法,其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的,對(duì)應(yīng)于單個(gè)音頻通道的一個(gè)片段;處理擴(kuò)充數(shù)據(jù),確定所述音頻通道的殘數(shù)的位置,并且恢復(fù)所述殘數(shù);和把所述片段包含的知覺(jué)編碼的各個(gè)部分與殘數(shù)相結(jié)合,產(chǎn)生在和音頻信號(hào)的知覺(jué)編碼相比更高的分辨率下表現(xiàn)所述音頻通道的中間信號(hào)。
21.標(biāo)準(zhǔn)數(shù)據(jù)通道的處理系統(tǒng),所述標(biāo)準(zhǔn)數(shù)據(jù)通道具有一層核心層和一層擴(kuò)展層,所述處理系統(tǒng)包括存儲(chǔ)指令程序的存儲(chǔ)器;程控處理器,所述程控處理器被耦接成接收若干分波段信號(hào),并且與存儲(chǔ)器耦接,以便接收所述程序,根據(jù)程序,程控處理器按照第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率,并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第一編碼信號(hào),按照第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率,并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第二編碼信號(hào),產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào),并把第一編碼信號(hào)輸出到核心層上,把殘數(shù)信號(hào)輸出到擴(kuò)展層上。
22.按照權(quán)利要求21所述的處理系統(tǒng),其中根據(jù)程序,程控處理器按照心理聲學(xué)原理確定分波段信號(hào)的聽(tīng)覺(jué)掩蔽特性曲線,并根據(jù)確定的聽(tīng)覺(jué)掩蔽特性曲線確定第一理想噪聲頻譜。
23.按照權(quán)利要求21所述的處理系統(tǒng),其中根據(jù)程序,程控處理器確定第一量化分辨率,從而按照確定的第一量化分辨率量化的分波段信號(hào)滿足核心層的數(shù)據(jù)容量要求。
24.按照權(quán)利要求21所述的處理系統(tǒng),其中根據(jù)程序,程控處理器以對(duì)準(zhǔn)的構(gòu)形輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
25.按照權(quán)利要求21所述的處理系統(tǒng),其中根據(jù)程序,程控處理器在數(shù)據(jù)通道上輸出指示相對(duì)于第一編碼信號(hào)的殘數(shù)信號(hào)結(jié)構(gòu)模式的數(shù)據(jù)。
26.按照權(quán)利要求21所述的處理系統(tǒng),其中根據(jù)程序,程控處理器通過(guò)使第一理想噪聲頻譜移動(dòng)基本均勻的量值,確定第二理想噪聲頻譜,并在標(biāo)準(zhǔn)數(shù)據(jù)通道中輸出基本均勻量值的指示。
27.按照權(quán)利要求21所述的處理系統(tǒng),其中根據(jù)程序,程控處理器產(chǎn)生表示第一編碼信號(hào)的若干比例因子,并且使用產(chǎn)生的比例因子表示第一編碼信號(hào)的比例因子。
28.按照權(quán)利要求21所述的處理系統(tǒng),其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示,并且其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
29.多層數(shù)據(jù)通道的處理系統(tǒng),其中數(shù)據(jù)通道的第一層包含音頻信號(hào)的知覺(jué)編碼,數(shù)據(jù)通道的第二層包含提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù),所述處理系統(tǒng)包括通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù)的信號(hào)路由電路;存儲(chǔ)指令程序的存儲(chǔ)器;和程控處理器,所述程控處理器與信號(hào)路由電路耦合,以便接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù),所述程控處理器還與存儲(chǔ)器耦合,以便接收所述程序,并根據(jù)程序產(chǎn)生解碼信號(hào)。
30.按照權(quán)利要求29所述的處理系統(tǒng),其中程控處理器譯解音頻信號(hào)的知覺(jué)編碼,產(chǎn)生解碼信號(hào)。
31.按照權(quán)利要求29所述的處理系統(tǒng),其中程控處理器組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù),產(chǎn)生分辨率高于音頻信號(hào)的知覺(jué)編碼的第二音頻信號(hào)編碼;和譯解音頻信號(hào)的第二編碼,產(chǎn)生解碼信號(hào)。
32.按照權(quán)利要求29所述的處理系統(tǒng),其中信號(hào)路由電路通過(guò)遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3的數(shù)據(jù)通道的16位核心層,接收知覺(jué)編碼,并且通過(guò)數(shù)據(jù)通道的至少一個(gè)4位寬的擴(kuò)展層接收擴(kuò)充數(shù)據(jù)。
33.按照權(quán)利要求29所述的處理系統(tǒng),其中程控處理器識(shí)別沿著數(shù)據(jù)通道的,分別對(duì)應(yīng)于一個(gè)截然不同音頻通道的若干片段;和把所述若干片段之一包含的知覺(jué)編碼的各個(gè)部分與其所包含的擴(kuò)充數(shù)據(jù)的各個(gè)部分相結(jié)合,產(chǎn)生代表音頻通道之一的中間信號(hào)。
34.按照權(quán)利要求29所述的處理系統(tǒng),其中程控處理器識(shí)別沿著數(shù)據(jù)通道的,對(duì)應(yīng)于單個(gè)音頻通道的一個(gè)片段;處理擴(kuò)充數(shù)據(jù),確定所述音頻通道的殘數(shù)的位置,并且恢復(fù)所述殘數(shù);和把所述片段包含的知覺(jué)編碼的各個(gè)部分與殘數(shù)相結(jié)合,產(chǎn)生在和音頻信號(hào)的知覺(jué)編碼相比更高的分辨率下表現(xiàn)所述音頻通道的中間信號(hào)。
35.一種機(jī)器可讀介質(zhì),所述介質(zhì)包含機(jī)器執(zhí)行的實(shí)現(xiàn)編碼過(guò)程的指令程序,編碼過(guò)程使用具有一個(gè)核心層和一個(gè)擴(kuò)展層的標(biāo)準(zhǔn)數(shù)據(jù)通道,所述過(guò)程包括接收若干分波段信號(hào);根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率,并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第一編碼信號(hào);根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率,并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第二編碼信號(hào);產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào);和把第一編碼信號(hào)輸出到核心層中,把殘數(shù)信號(hào)輸出到擴(kuò)展層中。
36.按照權(quán)利要求35所述的介質(zhì),其中根據(jù)按照心理聲學(xué)原理確定的分波段信號(hào)的音頻掩蔽特性曲線,確定第一理想噪聲頻譜。
37.按照權(quán)利要求35所述的介質(zhì),其中按照根據(jù)滿足核心層數(shù)據(jù)容量要求的這樣的第一量化分辨率量化的分波段信號(hào),確定第一量化分辨率。
38.按照權(quán)利要求35所述的介質(zhì),其中以對(duì)準(zhǔn)的形式輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
39.按照權(quán)利要求35所述的介質(zhì),其中輸出指示相對(duì)于第一編碼信號(hào)的殘數(shù)信號(hào)結(jié)構(gòu)模式的輔助數(shù)據(jù)。
40.按照權(quán)利要求35所述的介質(zhì),其中相對(duì)于第一理想噪聲頻譜,使第二理想噪聲頻譜編移基本均勻的量值,其中所述基本均勻量值的指示被輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
41.按照權(quán)利要求35所述的介質(zhì),其中第一編碼信號(hào)包括若干比例因子,其中殘數(shù)信號(hào)由第一編碼信號(hào)的比例因子表示。
42.按照權(quán)利要求35所述的介質(zhì),其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示,其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
43.一種機(jī)器可讀介質(zhì),所述介質(zhì)包含機(jī)器執(zhí)行的,實(shí)現(xiàn)處理由多層數(shù)據(jù)通道所攜帶的數(shù)據(jù)的方法的指令程序,其中數(shù)據(jù)通道的第一層包含音頻信號(hào)的知覺(jué)編碼,數(shù)據(jù)通道的第二層包含用于提高音頻信號(hào)的知覺(jué)編碼的分辨率的擴(kuò)充數(shù)據(jù),所述方法使用解碼器,并且包括通過(guò)數(shù)據(jù)通道接收知覺(jué)編碼和擴(kuò)充數(shù)據(jù);和把音頻信號(hào)的知覺(jué)編碼送到解碼器。
44.按照權(quán)利要求43所述的介質(zhì),還包括譯解音頻信號(hào)的知覺(jué)編碼。
45.按照權(quán)利要求43所述的介質(zhì),還包括組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù),產(chǎn)生分辨率高于音頻信號(hào)的知覺(jué)編碼的第二音頻信號(hào)編碼;和譯解音頻信號(hào)的第二編碼。
46.按照權(quán)利要求43所述的介質(zhì),其中通過(guò)遵守音頻工程協(xié)會(huì)的標(biāo)準(zhǔn)AES3的數(shù)據(jù)通道的16位核心層,接收知覺(jué)編碼,并且其中通過(guò)數(shù)據(jù)通道的至少一個(gè)4位寬的擴(kuò)展層接收擴(kuò)充數(shù)據(jù)。
47.按照權(quán)利要求45所述的介質(zhì),其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的,分別對(duì)應(yīng)于一個(gè)截然不同音頻通道的若干片段;和把所述若干片段之一包含的知覺(jué)編碼的各個(gè)部分與其所包含的擴(kuò)充數(shù)據(jù)的各個(gè)部分相結(jié)合,產(chǎn)生代表音頻通道之一的中間信號(hào)。
48.按照權(quán)利要求45所述的介質(zhì),其中組合知覺(jué)編碼和擴(kuò)充數(shù)據(jù)包括識(shí)別沿著數(shù)據(jù)通道的,對(duì)應(yīng)于單個(gè)音頻通道的一個(gè)片段;處理擴(kuò)充數(shù)據(jù),確定所述音頻通道的殘數(shù)的位置,并且恢復(fù)所述殘數(shù);和把所述片段包含的知覺(jué)編碼的各個(gè)部分與殘數(shù)相結(jié)合,產(chǎn)生在比第一編碼信號(hào)更高的分辨率下表現(xiàn)所述音頻通道的中間信號(hào)。
49.包含編碼音頻信息的機(jī)器可讀介質(zhì),所述編碼音頻信息按照編碼過(guò)程產(chǎn)生,所述編碼過(guò)程包括接收若干分波段信號(hào);根據(jù)第一理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第一量化分辨率,并按照相應(yīng)的第一量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第一編碼信號(hào);根據(jù)第二理想噪聲頻譜確定各個(gè)分波段信號(hào)的相應(yīng)第二量化分辨率,并按照相應(yīng)的第二量化分辨率量化各個(gè)分波段信號(hào),產(chǎn)生第二編碼信號(hào);產(chǎn)生指示第一編碼信號(hào)和第二編碼信號(hào)之間殘數(shù)的殘數(shù)信號(hào);和把第一編碼信號(hào)輸出到核心層中,把殘數(shù)信號(hào)輸出到擴(kuò)展層中。
50.按照權(quán)利要求49所述的介質(zhì),其中根據(jù)按照心理聲學(xué)原理確定的分波段信號(hào)的音頻掩蔽特性曲線,確定第一理想噪聲頻譜。
51.按照權(quán)利要求49所述的介質(zhì),其中按照根據(jù)滿足核心層數(shù)據(jù)容量要求的這樣的第一量化分辨率量化的分波段信號(hào),確定第一量化分辨率。
52.按照權(quán)利要求49所述的介質(zhì),其中以對(duì)準(zhǔn)的形式輸出第一編碼信號(hào)和殘數(shù)信號(hào)。
53.按照權(quán)利要求49所述的介質(zhì),其中輸出指示相對(duì)于第一編碼信號(hào)的殘數(shù)信號(hào)結(jié)構(gòu)模式的輔助數(shù)據(jù)。
54.按照權(quán)利要求49所述的介質(zhì),其中相對(duì)于第一理想噪聲頻譜,使第二理想噪聲頻譜編移基本均勻的量值,其中所述基本均勻量值的指示被輸出到標(biāo)準(zhǔn)數(shù)據(jù)通道中。
55.按照權(quán)利要求49所述的介質(zhì),其中第一編碼信號(hào)包括若干比例因子,其中殘數(shù)信號(hào)由第一編碼信號(hào)的比例因子表示。
56.按照權(quán)利要求49所述的介質(zhì),其中按照相應(yīng)的第二量化分辨率量化的分波段信號(hào)由包括一連串二進(jìn)制位的縮放值表示,其中按照相應(yīng)的第一量化分辨率量化的分波段信號(hào)由包括所述二進(jìn)制位的子序列的另一縮放值表示。
全文摘要
根據(jù)按照心理聲學(xué)原理確定的理想噪聲頻譜把音頻可縮放地編碼到核心層中支持根據(jù)包括這種理想噪聲頻譜的偏移在內(nèi)的各種標(biāo)準(zhǔn),把擴(kuò)充數(shù)據(jù)編碼到擴(kuò)展層中。兼容解碼由單個(gè)信號(hào)提供多個(gè)解碼分辨率。最好對(duì)按照音頻輸入的頻譜變換、正交鏡象濾波或者其它常規(guī)處理產(chǎn)生的分波段信號(hào)進(jìn)行編碼。用于音頻傳輸?shù)目煽s放數(shù)據(jù)結(jié)構(gòu)包括核心層和擴(kuò)展層,核心層包含使后解碼噪聲低于理想噪聲頻譜的音頻信號(hào)第一編碼,擴(kuò)展層包含關(guān)于理想噪聲頻譜的偏移數(shù)據(jù)和與使后解碼噪聲低于移動(dòng)偏移數(shù)據(jù)的理想噪聲頻譜的音頻信號(hào)的編碼有關(guān)的數(shù)據(jù)。
文檔編號(hào)H03M7/30GK1369092SQ00811328
公開(kāi)日2002年9月11日 申請(qǐng)日期2000年8月4日 優(yōu)先權(quán)日1999年8月9日
發(fā)明者路易斯·杜恩·菲爾德, 史蒂芬·戴克·維諾 申請(qǐng)人:多爾拜實(shí)驗(yàn)特許公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
瑞丽市| 平顶山市| 阿克苏市| 衡南县| 福清市| 泰州市| 兰西县| 望城县| 达孜县| 洞头县| 乌苏市| 汉川市| 定日县| 青州市| 吉水县| 鲁甸县| 西平县| 恩施市| 阳谷县| 潮安县| 旺苍县| 沂水县| 怀化市| 永顺县| 韶山市| 黎平县| 乌鲁木齐县| 湄潭县| 余姚市| 南江县| 武冈市| 武城县| 大丰市| 平凉市| 兴业县| 怀仁县| 郸城县| 保山市| 江源县| 南通市| 大丰市|