專利名稱:靈活量化的制作方法
靈活量化本申請(qǐng)是申請(qǐng)日為2008年11月3日,申請(qǐng)?zhí)枮?00780015871. 9 (國(guó)際申請(qǐng)?zhí)枮镻CT/US2007/010848),名為“靈活量化”申請(qǐng)的分案申請(qǐng)。背景I.基于塊變換的編碼變換編碼是在許多音頻、圖像和視頻壓縮系統(tǒng)中使用的一種壓縮技術(shù)。未壓縮數(shù)字圖像和視頻通常被表示或捕捉為以二維(2D)網(wǎng)格排列的圖像或視頻幀中各位置處的圖元或色彩的樣本。這被稱為圖像或視頻的空間域表示。例如,用于圖像的典型格式由被排列為網(wǎng)格的24位彩色圖元流構(gòu)成。每一樣本是表示諸如RGB或HQ等色彩空間內(nèi)該網(wǎng)格中的一個(gè)像素位置處的色彩分量的數(shù)字。各種圖像和視頻系統(tǒng)可使用各種不同的色彩、空間和時(shí)間分辨率的采樣。類似地,數(shù)字音頻通常被表示為時(shí)間采樣的音頻信號(hào)流。例如,典 型的音頻格式由在有規(guī)律的時(shí)間間隔處所取的16位音頻信號(hào)幅度樣本流構(gòu)成。未壓縮數(shù)字音頻、圖像和視頻信號(hào)可消耗大量的存儲(chǔ)和傳輸能力。變換編碼通過將信號(hào)的空間域表示變換成頻域(或其它類似的變換域)表示,然后降低該變換域表示的某些一般較不可感知的頻率分量的分辨率,減小了數(shù)字音頻、圖像和視頻的大小。這一般與降低空間域中的圖像或視頻或時(shí)域中的音頻的色彩或空間分辨率相比,產(chǎn)生了較不可感知的數(shù)字信號(hào)劣化。更具體而言,圖I所示的典型的基于塊變換的編解碼器100將未壓縮的數(shù)字圖像的像素劃分成固定大小的二維塊(X1,...Xn),每一塊可能與其它塊重疊。對(duì)每一塊應(yīng)用進(jìn)行空間-頻率分析的線性變換120-121,這將塊內(nèi)彼此隔開的樣本轉(zhuǎn)換成一般表示塊間隔上相應(yīng)的頻帶內(nèi)的數(shù)字信號(hào)的強(qiáng)度的一組頻率(或變換)系數(shù)。為了壓縮,變換系數(shù)可被選擇性地量化130 (即,諸如通過丟棄系數(shù)值的最低有效位或?qū)⑤^高分辨率數(shù)字集中的值映射到較低分辨率來(lái)降低分辨率),并且還被熵或可變長(zhǎng)度編碼130成壓縮的數(shù)據(jù)流。在解碼時(shí),變換系數(shù)進(jìn)行反變換170-171以便幾乎重構(gòu)原始的色彩/空間采樣圖像/視頻信號(hào)(重
構(gòu)塊尤,…之)。塊變換120-121可被定義為對(duì)大小為N的向量X的數(shù)學(xué)運(yùn)算。最通常的是,該運(yùn)算是線性乘法,從而產(chǎn)生變換域輸出y=Mx,M是變換矩陣。當(dāng)輸入數(shù)據(jù)是任意長(zhǎng)時(shí),它被分段成大小為N的向量,并且向每一段應(yīng)用塊變換。出于數(shù)據(jù)壓縮的目的,選擇可逆塊變換。換言之,矩陣M是可逆的。在多個(gè)維度中(例如,對(duì)于圖像和視頻),塊變換通常被實(shí)現(xiàn)為可分操作。沿?cái)?shù)據(jù)的每一維(即,行和列)可分地應(yīng)用矩陣乘法。對(duì)于壓縮,變換系數(shù)(向量y的分量)可被選擇性地量化(即,諸如通過丟棄系數(shù)值的最低有效位或?qū)⑤^高分辨率數(shù)字集中的值映射到較低分辨率來(lái)降低分辨率),并還可被熵或可變長(zhǎng)度編碼為壓縮的數(shù)據(jù)流。在解碼器150中解碼時(shí),如圖I所示,在解碼器150側(cè)應(yīng)用這些操作的反過程(反量化/熵解碼160和反塊變換170-171)。在重構(gòu)數(shù)據(jù)時(shí),將逆矩陣M—1 (反變換170-171)作為乘數(shù)應(yīng)用于變換域數(shù)據(jù)。當(dāng)應(yīng)用于變換域數(shù)據(jù)時(shí),反變換幾乎重構(gòu)原始時(shí)域或空間域數(shù)字媒體。
在許多基于塊變換達(dá)到編碼應(yīng)用中,變換理想地是可逆的以取決于量化因子同時(shí)支持有損和無(wú)損壓縮兩者。如果例如沒有量化(一般被表示為量化因子1),則利用可逆變換的編解碼器可在解碼時(shí)精確地再現(xiàn)輸入數(shù)據(jù)。然而,這些應(yīng)用中的可逆性的要求約束了對(duì)用于設(shè)計(jì)編解碼器的變換的選擇。諸如MPEG和Windows Media等許多圖像和視頻壓縮系統(tǒng)利用基于離散余弦變換(DCT)的變換。已知DCT具有得到近乎最優(yōu)的數(shù)據(jù)壓縮的良好能量壓縮特性。在這些壓縮系統(tǒng)中,在壓縮系統(tǒng)的編碼器和解碼器兩者中的重構(gòu)環(huán)路中采用了反DCT (IDCT)來(lái)重構(gòu)各個(gè)圖像塊。2.量化根據(jù)一個(gè)可能的定義,量化是用于通常用于有損壓縮的近似不可逆映射函數(shù)的術(shù)語(yǔ),其中有一組指定的可能輸出值,并且該組可能的輸出值中的每一成員具有導(dǎo)致對(duì)該特定輸出值的選擇的一組相關(guān)聯(lián)的輸入值。已經(jīng)開發(fā)了各種量化技術(shù),包括標(biāo)量或矢量、均勻或非均勻、有或沒有死區(qū)、以及自適應(yīng)或非自適應(yīng)量化。 量化操作本質(zhì)上是按照量化參數(shù)QP的加偏除法(biased division),這在編碼器處執(zhí)行。反量化或乘法操作是與QP的乘法,這在解碼器處執(zhí)行。這些過程共同引入了原始變換系數(shù)數(shù)據(jù)的丟失,這表現(xiàn)為解碼的圖像中的壓縮誤差或偽像。在最簡(jiǎn)單的編解碼器中,可向一幀中的所有變換系數(shù)應(yīng)用特定的固定QP值。盡管這在某些情況下可能是可接受的解決方案,但是它也有幾個(gè)缺點(diǎn)人類視覺系統(tǒng)對(duì)于所有頻率,或?qū)σ粠瑑?nèi)的所有空間位置,或?qū)λ辛炼群蜕韧ǖ啦⒉欢际峭瑯用舾械?。?duì)不同系數(shù)使用不同QP值提供了甚至具有相同或更少數(shù)量的壓縮比特的視覺上更出眾的編碼。同樣,也可適當(dāng)?shù)貎?yōu)化其它誤差度量。碼率控制或編碼器產(chǎn)生期望大小的壓縮文件的能力并不容易在整個(gè)幀上用單個(gè)QP來(lái)執(zhí)行。因此,期望的是允許編碼器以任意的方式跨圖像改變QP。然而,這意味著用于每一數(shù)據(jù)分區(qū)的實(shí)際QP值應(yīng)在比特流中用信號(hào)表示。這導(dǎo)致巨大的開銷,僅僅是為了攜帶QP信號(hào)表示信息,從而導(dǎo)致其在實(shí)踐中是不合適的。所需的是用信號(hào)通知QP的靈活但節(jié)省比特的手段,尤其是對(duì)于經(jīng)常遇到的情形。概括而言,量化是大多數(shù)圖像和視頻編解碼器控制壓縮的圖像質(zhì)量和壓縮比的主要機(jī)制。大多數(shù)流行的編解碼器支持的量化方法提供了極少的特征或極少的靈活性,或者導(dǎo)致附加比特的重大開銷。通常,圖像或視頻幀通常被均勻地量化,或以在空間位置上改變量化的有限能力來(lái)量化。這一靈活性的缺乏損害了壓縮質(zhì)量,并阻止了進(jìn)行中的準(zhǔn)確的碼率控制。另一方面,某些編解碼器在支持量化方法方面提供幾乎無(wú)限制的的自由。編碼來(lái)用信號(hào)表示不同量化器的使用在已編碼媒體中花費(fèi)了額外的比特,并且本身會(huì)不利地影響壓縮效率。此外,構(gòu)建一致解碼器的過程需要量化器方法的所有可能組合生成的大量測(cè)試遍,這可能是費(fèi)力的。概述以下詳細(xì)描述呈現(xiàn)了提供沿著已編碼的數(shù)字媒體數(shù)據(jù)的各維改變量化的能力的靈活量化技術(shù)的各種變型。例如,該靈活量化技術(shù)的一種代表性實(shí)現(xiàn)可以在三個(gè)維度上改變量化一在(i)空間位置,(ii)頻率子帶,以及(iii)色通道上。該詳細(xì)描述還呈現(xiàn)了在已編碼數(shù)字媒體數(shù)據(jù)中高效地用信號(hào)表示該靈活量化的方式。該量化方法的好處是因涉及量化的輔助信息而引入的開銷對(duì)于主要使用情形被最小化,同時(shí)如果編碼器需要?jiǎng)t允許最大的靈活性。提供本概述以便以簡(jiǎn)化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。該概述不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或本質(zhì)特征,也不旨在用于幫助確定所要求保護(hù)的主題的范圍。本發(fā)明的其它特征和優(yōu)點(diǎn)在參考附圖繼續(xù)閱讀以下對(duì)實(shí)施例的詳細(xì)描述后將變得顯而易見。附圖簡(jiǎn)述圖I是現(xiàn)有技術(shù)中常規(guī)的基于塊變換的編解碼器的框圖。圖2是包含塊模式編碼的代表性編碼器的流程圖。
圖3是包含塊模式編碼的代表性解碼器的流程圖。圖4是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示DC量化器的偽代碼定義的表。圖5是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示低通量化器的偽代碼定義的表。圖6是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示高通量化器的偽代碼定義的表。圖7是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示幀層處的量化器的偽代碼定義的表。圖8是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示瓦塊層處的量化器的偽代碼定義的表。圖9是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示瓦塊層處的DC子帶的量化器的偽代碼定義的表。
圖10是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示瓦塊層處的低通子帶的量化器的偽代碼定義的表。圖11是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示瓦塊層處的高通子帶的量化器的偽代碼定義的表。圖12是根據(jù)靈活量化技術(shù)的包含用于用信號(hào)表示宏塊層處的量化器的偽代碼定義的表。圖13是根據(jù)靈活量化技術(shù)的包含用于在頻率模式中用信號(hào)表示宏塊層處的低通量化器的偽代碼定義的表。圖14是根據(jù)靈活量化技術(shù)的包含用于在頻率模式中用信號(hào)表示宏塊層處的高通量化器的偽代碼定義的表。圖15是用于實(shí)現(xiàn)具有靈活量化的媒體編碼器/解碼器的合適的計(jì)算環(huán)境的框圖。詳細(xì)描述以下詳細(xì)描述涉及提供能夠改變沿著空間、頻率和色彩維度應(yīng)用的量化的高效靈活量化(此處稱為“靈活量化”)的編碼和解碼技術(shù)。以下描述在數(shù)字媒體壓縮系統(tǒng)或編解碼器的上下文中描述了該技術(shù)的一個(gè)示例實(shí)現(xiàn)。該數(shù)字媒體系統(tǒng)以壓縮形式對(duì)數(shù)字媒體數(shù)據(jù)進(jìn)行編碼以便傳輸或存儲(chǔ),并解碼該數(shù)據(jù)以供回放或其它處理。出于說(shuō)明的目的,包含這一靈活量化的該示例性壓縮系統(tǒng)是圖像或視頻壓縮系統(tǒng)?;蛘撸摷夹g(shù)也可被結(jié)合到用于其它2D數(shù)據(jù)的壓縮系統(tǒng)或編解碼器中。靈活量化技術(shù)不要求數(shù)字媒體壓縮系統(tǒng)以特定的編碼格式來(lái)編碼壓縮的數(shù)字媒體數(shù)據(jù)。
I.編碼器/解碼器圖2和3是在代表性2維(2D)數(shù)據(jù)編碼器200和解碼器300中采用的過程的一般化圖示。該圖呈現(xiàn)了結(jié)合了實(shí)現(xiàn)塊模式編碼的2D數(shù)據(jù)編碼器和解碼器的壓縮系統(tǒng)的一般化或簡(jiǎn)化的圖示。在使用塊模式編碼的替換壓縮系統(tǒng)中,可使用比本代表性編碼器和解碼器中所示的更多或更少的過程來(lái)進(jìn)行2D數(shù)據(jù)壓縮。例如,某些編碼器/解碼器還可包括色彩轉(zhuǎn)換、色彩格式、可縮放編碼、無(wú)損編碼、宏塊模式等等。取決于量化,壓縮系統(tǒng)(編碼器和解碼器)可提供2D數(shù)據(jù)的無(wú)損和/或有損壓縮,量化可基于從無(wú)損到有損變化的量化參數(shù)。2D數(shù)據(jù)編碼器200產(chǎn)生壓縮比特流220,它是作為輸入提供給編碼器的2D數(shù)據(jù)210的更緊湊表示(對(duì)于典型輸入)。例如,2D數(shù)據(jù)輸入可以是圖像、視頻序列的一幀、或具有兩個(gè)維度的其它數(shù)據(jù)。2D數(shù)據(jù)編碼器將輸入數(shù)據(jù)幀劃分成塊(一般在圖2中示為分區(qū)230),這在所示的實(shí)現(xiàn)中是形成塊該幀的平面的規(guī)則圖案的非重疊4x4像素塊。這些塊被分組成稱為宏塊的群集,在該代表性編碼器中其大小是16x16像素。宏塊進(jìn)而被分組成稱為瓦塊 的規(guī)則結(jié)構(gòu)。瓦塊也可形成圖像上的規(guī)則圖案,使得水平行中的瓦塊是統(tǒng)一的高度且是對(duì)齊的,而垂直列中的瓦塊是統(tǒng)一的寬度且是對(duì)齊的。在該代表性編碼器中,瓦塊可以是任意大小,該大小在水平和/或垂直方向上是16的倍數(shù)。替換編碼器實(shí)現(xiàn)可以將圖像劃分成塊、宏塊、瓦塊或其它大小和結(jié)構(gòu)的其它單元。對(duì)塊之間的每一邊緣應(yīng)用“前向重疊”算子240,之后使用塊變換250來(lái)變換每一 4X4的塊。該塊變換250可以是由Srinivasan在2004年12月17日提交的題為“Reversible Transform For Lossy And Lossless 2-D Data Compression,,(用于有損和無(wú)損2D數(shù)據(jù)壓縮的可逆變換)的美國(guó)專利申請(qǐng)第11/015,707號(hào)中所描述的可逆的、無(wú)縮放的2D變換。重疊算子240可以是由Tu等人在2004年12月17日提交的題為“ReversibleOverlap Operator for Efficient Lossless Data Compression”(用于高效無(wú)損數(shù)據(jù)壓縮的可逆重疊算子)的美國(guó)專利申請(qǐng)第11/015,148號(hào);以及Tu等人在2005年I月14日提交的題為 “Reversible 2-Dimensional Pre-/Post_Filter for Lapped BiorthogonalTransform”(用于重疊雙正交變換的可逆2維預(yù)/后濾波器)的美國(guó)專利申請(qǐng)第11/035,991號(hào)中描述的可逆重疊算子?;蛘?,可使用離散余弦變換或其它塊變換和重疊算子。在變換之后,令每一 4X4的變換塊的DC系數(shù)260經(jīng)受一類似的處理鏈(塊化、前向重疊、之后是4X4的塊變換)。所得的DC變換系數(shù)和AC變換系數(shù)被量化270、熵編碼280和分組化290。解碼器執(zhí)行反過程。在解碼器側(cè),從其各自的分組中提取310變換系數(shù)位,從中系數(shù)本身被解碼320和解量化330。DC系數(shù)340通過應(yīng)用反變換來(lái)重新生成,并且DC系數(shù)的平面使用跨DC塊邊緣應(yīng)用的合適的平滑算子來(lái)“反重疊”。隨后,通過向DC系數(shù)應(yīng)用4X4的反變換350來(lái)重新生成整個(gè)數(shù)據(jù),并從比特流中解碼AC系數(shù)342。最后,對(duì)所得圖像平面中的塊邊緣進(jìn)行反重疊濾波360。這產(chǎn)生經(jīng)重構(gòu)的2D數(shù)據(jù)輸出。在一個(gè)示例性實(shí)現(xiàn)中,編碼器200(圖2)將輸入圖像壓縮成壓縮比特流220(例如,文件),而解碼器300 (圖3)基于是采用無(wú)損還是有損編碼來(lái)重構(gòu)原始輸入或其近似。編碼過程涉及應(yīng)用以下所討論的前向重疊變換(LT),這是用同樣在以下更全面描述的可逆2維預(yù)/后濾波來(lái)實(shí)現(xiàn)的。解碼過程涉及應(yīng)用使用可逆2維預(yù)/后濾波的反重疊變換(ILT)。所示的LT和ILT在確切的意義上是彼此的逆,并且因此可被統(tǒng)稱為可逆重疊變換。作為一種可逆變換,LT/ILT對(duì)可用于無(wú)損圖像壓縮。由所示的編碼器200/解碼器300壓縮的輸入數(shù)據(jù)210可以是各種色彩格式(例如,RGB/YUV 4:4:4、YUV 4:2:2或YUV 4:2:0彩色圖像格式)的圖像。通常,輸入圖像總是具有亮度(Y)分量。如果它是RGB/YUV 4:4:4、YUV 4:2:2或YUV 4:2:0圖像,則該圖像還具有色度分量,諸如U分量和V分量。圖像的這些單獨(dú)的色彩平面或分量可具有不同的空間分辨率。在例如YUV 4:2:0色彩格式的輸入圖像的情況下,U和V分量具有Y分量一半的寬度和高度。如上所述,編碼器200將輸入圖像或圖片塊化成宏塊。在一個(gè)示例性實(shí)現(xiàn)中,編碼器200將輸入圖像塊化成Y通道中的16X16像素區(qū)域(稱為“宏塊”)(取決于色彩格式,可以是U和V通道中的16X16、16X8或8X8區(qū)域)。每一宏塊色彩平面被塊化成4X4像素的區(qū)域或塊。因此,宏塊按以下對(duì)于本示例性編碼器實(shí)現(xiàn)的方式由各種色彩格式組成I.對(duì)于灰度圖像,每一宏塊包含16個(gè)4X4的亮度(Y)塊。
2.對(duì)于YUV 4:2:0格式彩色圖像,每一宏塊包含16個(gè)4X4的Y塊,并且4個(gè)各自為4X4的色度(U和V)塊。3.對(duì)于YUV 4:2:2格式彩色圖像,每一宏塊包含16個(gè)4X4的Y塊,并且8個(gè)各自為4X4的色度(U和V)塊。4.對(duì)于RGB或YUV 4:4:4彩色圖像,每一宏塊對(duì)Y、U和V通道中的每一個(gè)包含16個(gè)塊。因此,在變換之后,該代表性編碼器200/解碼器300中的宏塊具有三個(gè)頻率子帶DC子帶(DC宏塊)、低通子帶(低通宏塊)和高通子帶(高通宏塊)。在該代表性系統(tǒng)中,低通和/或高通子帶在比特流中是可任選的一這些子帶可被完全丟棄。此外,壓縮的數(shù)據(jù)可按以下兩種次序之一被壓縮到比特流中空間次序和頻率次序。對(duì)于空間次序,瓦塊內(nèi)的同一宏塊的不同子帶被排序在一起,且所得的每一瓦塊的比特流被寫入一個(gè)分組中。對(duì)于頻率次序,來(lái)自瓦塊內(nèi)的不同宏塊的同一子帶被分組在一起,且因此瓦塊的比特流被寫入三個(gè)分組中DC瓦塊分組、低通瓦塊分組和高通瓦塊分組。另外,可以有其它數(shù)據(jù)層。由此,對(duì)于該代表性系統(tǒng),圖像按以下“維度”來(lái)組織空間維度幀一瓦塊一宏塊;頻率維度DC|低通I高通;以及通道維度亮度I色度_0色度_1……(例如,Y|U|V)。以上箭頭表示分層結(jié)構(gòu),而垂直條表示劃分。盡管該代表性系統(tǒng)按照空間、頻率和通道維度來(lái)組織壓縮的數(shù)字媒體數(shù)據(jù),但是此處描述的靈活量化方法可以應(yīng)用于沿著更少、更多或其它維度來(lái)組織其數(shù)據(jù)的替換編碼器/解碼器系統(tǒng)。例如,該靈活量化方法可應(yīng)用于使用更大數(shù)量的頻帶、其它格式的色通道(例如,YIQ>RGB等)、附加圖像通道(例如,用于立體聲視覺或其它多照相機(jī)陣列)的編碼。2.靈活量化綜述在該代表性編碼器/解碼器中,量化操作本質(zhì)上是按照量化參數(shù)QP的加偏除法,這在編碼器處執(zhí)行。反量化或乘法操作是與QP的乘法,這在解碼器處執(zhí)行。然而,此處描述的靈活量化的替換實(shí)現(xiàn)可利用其它形式的量化,包括均勻和非均勻、標(biāo)量或矢量、有或沒有死區(qū)等。這些量化/反量化過程共同引入了原始變換系數(shù)數(shù)據(jù)的丟失,這表現(xiàn)為解碼的圖像中的壓縮誤差或偽像。在最簡(jiǎn)單的編解碼器中,可向一幀中的所有變換系數(shù)應(yīng)用特定的固定QP值。盡管這在某些情況下可能是可接受的解決方案,但是它也有幾個(gè)缺點(diǎn)人類視覺系統(tǒng)對(duì)于所有頻率,或?qū)σ粠瑑?nèi)的所有空間位置,或?qū)λ辛炼群蜕韧ǖ啦⒉欢际峭瑯用舾械?。?duì)不同系數(shù)使用不同QP值提供了甚至具有相同或更少數(shù)量的壓縮比特的視覺上更出眾的編碼。同樣,也可適當(dāng)?shù)貎?yōu)化其它誤差度量。碼率控制或編碼器產(chǎn)生期望大小的壓縮文件的能力并不容易在整個(gè)幀上用單個(gè)QP來(lái)執(zhí)行。因此,理想地,應(yīng)當(dāng)可能允許編碼器以任意的方式跨圖像改變QP。然而,這意味著用于每一數(shù)據(jù)分區(qū)(宏塊/瓦塊/通道/子帶等)的實(shí)際QP值應(yīng)在比特流中用信號(hào)表示。這導(dǎo)致巨大的開銷,僅僅是為了攜帶QP信號(hào)表示信息,從而導(dǎo)致其在實(shí)踐中是不合適的。所需的是用信號(hào)通知QP的靈活但節(jié)省比特的手段,尤其是對(duì)于經(jīng)常遇到的情形。 此處描述的靈活量化技術(shù)提供了沿著已編碼數(shù)字媒體數(shù)據(jù)的各個(gè)分區(qū)或維度來(lái)改變量化的能力。例如,代表性編碼器200/解碼器300系統(tǒng)中的靈活量化技術(shù)的一種實(shí)現(xiàn)可以在三個(gè)維度上改變量化一在(i)空間位置,(ii)頻率子帶,以及(iii)色通道上。然而,在該靈活量化技術(shù)的其它替換實(shí)現(xiàn)中,量化可以在更少、更多或其它數(shù)據(jù)維度或分組上變化。該技術(shù)還包括在已編碼媒體數(shù)據(jù)中高效地用信號(hào)表示靈活量化的方式。該量化方法的好處是因涉及量化的輔助信息而引入的開銷對(duì)于主要使用情形被最小化,同時(shí)如果編碼器需要?jiǎng)t允許最大的靈活性。該靈活量化技術(shù)提供了對(duì)量化的細(xì)空間粒度控制。在一個(gè)具體實(shí)現(xiàn)中,該靈活量化允許對(duì)應(yīng)用于幀、瓦塊或向下到宏塊的量化的控制。如果幀沒有被均勻量化,則每一瓦塊可以被均勻量化;如果瓦塊沒有被均勻量化,則每一宏塊將被不同地量化。該靈活量化還允許沿著頻率子帶維度進(jìn)行量化控制。在一個(gè)具體實(shí)現(xiàn)中,該靈活量化包括指定頻率子帶之間的量化關(guān)系的子帶模式。子帶可被均勻量化,或被部分均勻量化(低通子帶使用DC子帶量化器,和/或高通子帶使用低通量化器),或被獨(dú)立量化。該靈活量化還允許對(duì)沿著數(shù)據(jù)的通道維度應(yīng)用的量化的控制。在一個(gè)具體實(shí)現(xiàn)中,該靈活量化包括指定色通道之間的量化關(guān)系的通道模式。通道可被均勻量化,或者部分地均勻量化(色度通道均勻,但亮度通道獨(dú)立),或者被獨(dú)立量化。此處描述的靈活量化還提供高效地在壓縮的數(shù)字媒體數(shù)據(jù)的輔助信息中用信號(hào)表示上述對(duì)空間、頻率子帶和通道的量化控制的組合的技術(shù),這對(duì)于主要使用情形是重要的。此外,該靈活量化技術(shù)提供了通過從數(shù)字媒體數(shù)據(jù)中的一組定義的可能量化器子集進(jìn)行索引來(lái)高效地定義量化器選擇的方式。3.空間維度中的靈活量化在空間維度中,在代表性編碼器/解碼器中由靈活量化技術(shù)提供三個(gè)選擇·整個(gè)幀可使用相同的量化規(guī)則來(lái)編碼?!し駝t,整個(gè)瓦塊可使用相同的量化規(guī)則來(lái)編碼,而幀中的不同瓦塊可以使用不同的量化規(guī)則?!し駝t,瓦塊中的每一宏塊可使用相同的量化規(guī)則來(lái)編碼,而瓦塊中的不同宏塊可以使用不同的量化規(guī)則。
用信號(hào)表示這些可能性的一種手段如下在幀級(jí)的比特流中發(fā)送指示第一可能性是否為真的二進(jìn)制信號(hào)。如果否,則在每一瓦塊內(nèi)的比特流中發(fā)送指示對(duì)該瓦塊使用的量化規(guī)則的數(shù)目的固定長(zhǎng)度碼元。如果瓦塊使用了多于一個(gè)量化規(guī)則,則在對(duì)應(yīng)的瓦塊內(nèi)的每一宏塊中發(fā)送指示由該宏塊使用的量化規(guī)則的可變長(zhǎng)度碼元。解碼器以與編碼器一致的方式解釋該比特流。代表性編碼器200/解碼器300使用上述信號(hào)表示的變體。由此處標(biāo)記為“XXX_FRAME_UNIF0RM”的通用句法元素表示的二進(jìn)制信號(hào)僅在幀級(jí)發(fā)送(其中XXX是指定量化器控制的特定頻率子帶或通道維度的占位符)。在瓦塊級(jí),僅當(dāng)幀級(jí)句法元素(XXX_FRAME_UNIFORM)為假時(shí)在瓦塊級(jí)句法元素(XXX_QUANTIZERS)中發(fā)送不同量化器規(guī)則的數(shù)目。如果該數(shù)目等于1,則意味著僅有一個(gè)規(guī)則,且因此該瓦塊內(nèi)的所有宏塊用相同的量化規(guī)則來(lái)均勻編碼(指示選擇2),如果否,則指示第三種可能性的選擇。4.跨頻帶的靈活量化對(duì)于跨頻帶的靈活量化,代表性編碼器200/解碼器300的比特流句法定義兩個(gè)開 關(guān) 低通宏塊使用與同一空間位置處的DC宏塊相同的量化規(guī)則。這對(duì)應(yīng)于句法元素USE_DC_QUANTIZER0·高通宏塊使用與同一空間位置處的低通宏塊相同的量化規(guī)則。這對(duì)應(yīng)于句法元素 USE_LP_QUANTIZER。這些開關(guān)在整個(gè)幀使用相同的量化規(guī)則時(shí)在幀層啟用,或者在其它情況下在瓦塊層啟用。這些開關(guān)不在宏塊層啟用。因此,瓦塊內(nèi)的所有宏塊跨頻率子帶遵守相同的規(guī)則。在適當(dāng)(幀或瓦塊)層處對(duì)每一開關(guān)發(fā)送一二進(jìn)制碼元。5.跨圖像通道的靈活量化對(duì)于跨通道的靈活量化,代表性編碼器200/解碼器300的比特流句法定義三個(gè)選擇·所有通道一亮度和色度具有相同的量化規(guī)則。這由通用句法元素XXX_CH_M0DE==CH_UNIF0RM 來(lái)指示?!ち炼茸裱粋€(gè)量化規(guī)則,而所有色度通道遵循一不同的量化規(guī)則,由XXX_CH_M0DE==CH_MIXED 指示?!に型ǖ蓝甲杂蛇x擇不同的量化規(guī)則,由XXX_CH_MODE==CH_INDEPENDENT指示。6.組合的靈活量化代表性編碼器200/解碼器300使用在以下圖4_14所示的代碼表中定義的比特流句法,該句法可以如上所述高效地跨維度來(lái)編碼靈活量化選項(xiàng)中的特定選擇。采用跨每一空間、頻率子帶和通道維度可用的若干量化選項(xiàng),可用量化選項(xiàng)的排列數(shù)目是很大的。代表性編碼器200/解碼器300的比特流可以用空間或頻率排序來(lái)布局的事實(shí)增加了跨三個(gè)維度的靈活量化的復(fù)雜性。然而,這不改變可用量化選項(xiàng),并且僅影響信號(hào)的串行化。圖4-14定義的句法提供了對(duì)組合的靈活量化規(guī)則的高效編碼。如在代表性編碼器/解碼器的句法中定義的組合的量化規(guī)則的某些突出特征如下。不允許DC量化在宏塊的基礎(chǔ)上變化。這允許對(duì)量化的DC值不同地編碼而不必進(jìn)行反縮放操作。即使在AC (低通和高通)頻帶用變化的量化編碼的時(shí)候也用相對(duì)較小的量化器來(lái)對(duì)圖像瓦塊的DC頻帶編碼不會(huì)顯著影響比特率。在一個(gè)極端,幀內(nèi)的所有變換系數(shù)使用相同的量化參數(shù)。在另一極端,用于所有通道的低通和高通量化規(guī)則都允許對(duì)瓦塊/幀的每一宏塊獨(dú)立地變化。唯一的限制是不同低通和高通量化器規(guī)則(覆蓋所有通道)的數(shù)目各自被限于16。每一這樣的規(guī)則可以為每一通道指定獨(dú)立的量化參數(shù)值。在這些極端之間,允許如由圖4-14所示的句法表指定的若干組合。7.量化器參數(shù)的索引代表性編碼器/解碼器中的特定量化參數(shù)(QP)基于諧波比例。量化器參數(shù)索引(QPI)的8位值對(duì)應(yīng)于可能相當(dāng)大的QP值。執(zhí)行第二級(jí)索引使得跨宏塊變化的QPI可以用高效的方式來(lái)編碼。 更具體而言,編碼器200可以定義比特流中包含I到16個(gè)QPP‘矢量”的集合?;谶x擇哪一 XXX_CHANNEL_MODE,每一 QPI矢量由一個(gè)或多個(gè)QPI值組成。基于頻率子帶開關(guān),這些集合是為DC、低通和高通子帶定義的。此外,DC集合僅有一個(gè)QPI矢量,因?yàn)樵谕邏K通道中只允許一個(gè)DC量化器。對(duì)這些集合的編碼在圖4-6所示的表中定義。如圖7-11的表所示,對(duì)DC、低通和高通頻率子帶的QPI矢量集合的信號(hào)表示如下發(fā)生?;谄渌幋a模式,每一集合的勢(shì)(即,該集合中的QPI矢量數(shù))對(duì)低通和高通子帶在相應(yīng)的瓦塊或幀的開始處指示。DC集合的勢(shì)為I。在該偽代碼表中,表示勢(shì)的句法元素被標(biāo)記為“XXX_QUANTIZERS”。(在實(shí)踐中,在比特流中發(fā)送XXX_QUANTIZERS - I)。表中標(biāo)記為“XXX_QUANTIZER”的句法元素表示QPI集合的編碼,這在圖4_6所示的表中定義。
在宏塊級(jí),僅發(fā)送來(lái)自QPI集合內(nèi)的所需QPI矢量的索引QI就足夠。圖12-14的表定義了在宏塊的基礎(chǔ)上發(fā)送QI的句法。對(duì)應(yīng)于QI的句法元素被標(biāo)記為“XXX_QUANTIZER_INDEX”。使用可變長(zhǎng)度代碼來(lái)用信號(hào)表示QI。首先,發(fā)送指示QI是否為O的一位碼元。如果不是,則發(fā)送指示與O不同的特定QI的其長(zhǎng)度由ceil (Iog2 (XXX_QUANTIZERS-1))給出的固定長(zhǎng)度代碼。這允許用低至每宏塊一位來(lái)對(duì)“默認(rèn)”量化規(guī)則(QI=O)進(jìn)行高效編碼。當(dāng)XXX_QUANTIZERS為I時(shí),XXX_QUANTIZER_INDEX唯一地為0,且因此不需要用信號(hào)表示QI。8.擴(kuò)展以上對(duì)靈活量化的描述是專用于其在代表性編碼器和解碼器中的實(shí)現(xiàn)以及句法的。然而,該技術(shù)的原理也可擴(kuò)展到其它數(shù)字媒體壓縮系統(tǒng)和格式。例如,代表性編碼器/解碼器只有三個(gè)頻率子帶(DC、低通和高通)。但是,更一般地,靈活量化的替換實(shí)現(xiàn)可以用直接的方式擴(kuò)展到多個(gè)頻率子帶。同樣,替換靈活量化實(shí)現(xiàn)可以在更細(xì)的空間粒度改變量化器,諸如通過在子宏塊(諸如塊)級(jí)發(fā)送量化索引(QI)信息。對(duì)靈活量化技術(shù)的基本原理的許多擴(kuò)展在同一框架內(nèi)都是可能的。9.計(jì)算環(huán)境上述用于靈活量化的處理技術(shù)可以在各種數(shù)字媒體編碼和/或解碼系統(tǒng)的任一種上實(shí)現(xiàn),包括計(jì)算機(jī)(各種形狀因數(shù),包括服務(wù)器、臺(tái)式機(jī)、膝上型計(jì)算機(jī)、手持式計(jì)算機(jī)等);數(shù)字媒體記錄器和播放器;圖像和視頻捕捉設(shè)備(諸如照相機(jī)、掃描儀等);通信設(shè)備(諸如電話、移動(dòng)電話、會(huì)議設(shè)備等);顯示、打印或其它呈現(xiàn)設(shè)備;以及其它示例等等。該靈活量化技術(shù)可用硬件電路、控制數(shù)字媒體處理硬件的固件、以及在計(jì)算機(jī)或在其他計(jì)算環(huán)境中執(zhí)行的通信軟件來(lái)實(shí)現(xiàn),諸如圖15中所示。圖15示出了其中可實(shí)現(xiàn)所描述的實(shí)施例的合適計(jì)算環(huán)境(1500)的一個(gè)一般示例。計(jì)算環(huán)境(1500)并不旨在對(duì)本發(fā)明的使用范圍或功能提出任何局限,因?yàn)楸景l(fā)明可在不同的通用或?qū)S糜?jì)算環(huán)境中實(shí)現(xiàn)。參考圖15,計(jì)算環(huán)境(1500)包括至少一個(gè)處理單元(1510)和存儲(chǔ)器(1520)。在圖15中,這一最基本的配置(1530)被包括在虛線內(nèi)。處理單元(1510)執(zhí)行計(jì)算機(jī)可執(zhí)行指令,并且可以是真實(shí)或虛擬處理器。在多處理系統(tǒng)中,多個(gè)處理單元執(zhí)行計(jì)算機(jī)可執(zhí)行指令以提高處理能力。存儲(chǔ)器(1520)可以是易失性存儲(chǔ)器(例如,寄存器、高速緩存、RAM)、非易失性存儲(chǔ)器(例如,R0M、EEPR0M、閃存等)或兩者的某種組合。存儲(chǔ)器(1502)儲(chǔ)存實(shí)現(xiàn)所描述的使用靈活量化技術(shù)的數(shù)字媒體編碼/解碼的軟件(1580)。計(jì)算環(huán)境可具有額外的特征。例如,計(jì)算環(huán)境(1500)包括存儲(chǔ)(1540)、一個(gè)或多個(gè)輸入設(shè)備(1550)、一個(gè)或多個(gè)輸出設(shè)備(1560)以及一個(gè)或多個(gè)通信連接(1570)。諸如總 線、控制器或網(wǎng)絡(luò)等互連機(jī)制(未示出)將計(jì)算環(huán)境(1500)的各組件互連。通常,操作系統(tǒng)軟件(未示出)為在計(jì)算環(huán)境(1500)中執(zhí)行的其它軟件提供操作環(huán)境,并協(xié)調(diào)計(jì)算環(huán)境(1500)的各組件的活動(dòng)。存儲(chǔ)(1540)可以是可移動(dòng)或不可移動(dòng)的,并包括磁盤、磁帶或磁帶盒、⑶-ROM、CD-RW,DVD或可用于儲(chǔ)存信息并可在計(jì)算環(huán)境(1500)內(nèi)訪問的任何其它介質(zhì)。存儲(chǔ)(1540)儲(chǔ)存實(shí)現(xiàn)所描述的使用靈活量化技術(shù)的數(shù)字媒體編碼/解碼的軟件(1580)的指令。輸入設(shè)備(1550)可以是諸如鍵盤、鼠標(biāo)、筆或跟蹤球等觸摸輸入設(shè)備、語(yǔ)音輸入設(shè)備、掃描設(shè)備或向計(jì)算環(huán)境(1500)提供輸入的另一設(shè)備。對(duì)于音頻,輸入設(shè)備(1550)可以是聲卡或接受來(lái)自話筒或話筒陣列的模擬或數(shù)字形式的音頻輸入的類似設(shè)備,或向計(jì)算環(huán)境提供音頻樣本的⑶-ROM讀取器。輸出設(shè)備(1560)可以是顯不器、打印機(jī)、揚(yáng)聲器、⑶刻錄機(jī)或提供來(lái)自計(jì)算環(huán)境(1500)的輸出的另一設(shè)備。通信連接(1570)允許在通信介質(zhì)上與另一計(jì)算實(shí)體的通信。通信介質(zhì)傳達(dá)諸如計(jì)算機(jī)可執(zhí)行指令、壓縮音頻或視頻信息、或已調(diào)制數(shù)據(jù)信號(hào)中的其它數(shù)據(jù)的信息。已調(diào)制數(shù)據(jù)信號(hào)是其一個(gè)或多個(gè)特征以在信號(hào)中編碼信息的方式設(shè)置或改變的信號(hào)。作為示例而非局限,通信介質(zhì)包括以電、光、RF、紅外、聲學(xué)或其它載波實(shí)現(xiàn)的有線或無(wú)線技術(shù)。此處所描述的使用靈活量化技術(shù)的數(shù)字媒體編碼/解碼可在計(jì)算機(jī)可讀介質(zhì)的一般上下文中描述。計(jì)算機(jī)可讀介質(zhì)可以是可在計(jì)算環(huán)境內(nèi)訪問的任何可用介質(zhì)。作為示例而非局限,對(duì)于計(jì)算環(huán)境(1500),計(jì)算機(jī)可讀介質(zhì)可包括存儲(chǔ)器(1520)、存儲(chǔ)(1540)、通信介質(zhì)和以上任一種的組合。此處描述的使用靈活量化技術(shù)的數(shù)字媒體編碼/解碼可在諸如程序模塊中所包括的、在目標(biāo)真實(shí)或虛擬處理器上的計(jì)算環(huán)境中執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、庫(kù)、對(duì)象、類、組件、數(shù)據(jù)結(jié)構(gòu)等。程序模塊的功能可以如各實(shí)施例中所需的組合或在程序模塊之間分離。用于程序模塊的計(jì)算機(jī)可執(zhí)行指令可以在本地或分布式計(jì)算環(huán)境中執(zhí)行。出于表示的目的,詳細(xì)描述使用了如“確定”、“生成”、“調(diào)整”和“應(yīng)用”等術(shù)語(yǔ)來(lái)描述計(jì)算環(huán)境中的計(jì)算機(jī)操作。這些術(shù)語(yǔ)是由計(jì)算機(jī)執(zhí)行的操作的高級(jí)抽象,且不應(yīng)與人類所執(zhí)行的動(dòng)作混淆。對(duì)應(yīng)于這些術(shù)語(yǔ)的實(shí)際的計(jì)算機(jī)操作取決于實(shí)現(xiàn)而不同。
鑒于可應(yīng)用本發(fā)明的原理的許多可能的實(shí)施例,要求保護(hù)落入所附權(quán)利要求書及其等效技術(shù)方案的范圍和精神之內(nèi)的所有這樣的實(shí)施例作為本發(fā)明 。
權(quán)利要求
1.一種數(shù)字媒體處理方法,包括 存儲(chǔ)表示存儲(chǔ)器中的壓縮的數(shù)字媒體數(shù)據(jù)的比特流的至少部分;以及 通過向所述數(shù)字媒體數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述數(shù)字媒體數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中所述量化參數(shù)選擇性地跨空間維度、頻率維度和色通道維度的至少一個(gè)來(lái)變化,并且其中所述跨每個(gè)維度選擇性的變化在所述比特流中用信號(hào)表示。
2.如權(quán)利要求I所述的方法,其特征在于,所述信號(hào)包括指示相同的一個(gè)或多個(gè)量化參數(shù)是否應(yīng)用到整個(gè)幀的信號(hào)。
3.如權(quán)利要求I所述的方法,其特征在于,所述信號(hào)包括指示相同的一個(gè)或多個(gè)量化參數(shù)是否應(yīng)用于DC系數(shù)和AC系數(shù)的信號(hào)。
4.如權(quán)利要求I所述的方法,其特征在于,所述信號(hào)包括指示相同的一個(gè)或多個(gè)量化參數(shù)是否應(yīng)用于亮度值和色度值的信號(hào)。
5.一種數(shù)字媒體處理方法,包括 存儲(chǔ)表示存儲(chǔ)器中的壓縮的數(shù)字媒體數(shù)據(jù)的比特流的至少部分;以及 通過向所述數(shù)字媒體數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述數(shù)字媒體數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中應(yīng)用于DC系數(shù)和AC系數(shù)的所述量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù)。
6.如權(quán)利要求5所述的方法,其特征在于,所述第一頻率量化模式和所述第二頻率量化模式在所述比特流中用信號(hào)表示。
7.如權(quán)利要求5所述的方法,其特征在于,應(yīng)用于亮度系數(shù)和色度系數(shù)的量化參數(shù)至少在第一色度量化模式和第二色度量化模式之間選擇性地變化,在所述第一色度量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二色度量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù)。
8.如權(quán)利要求7所述的方法,其特征在于,所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部部分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù)。
9.一種數(shù)字媒體處理方法,包括 存儲(chǔ)表示存儲(chǔ)器中的壓縮的數(shù)字媒體數(shù)據(jù)的比特流的至少部分;以及 通過向所述數(shù)字媒體數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述數(shù)字媒體數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中應(yīng)用于亮度系數(shù)和色度系數(shù)的所述量化參數(shù)至少在第一色度量化模式和第二色度量化模式之間選擇性地變化,在所述第一色度量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二色度量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù)。
10.如權(quán)利要求9所述的方法,其特征在于,所述第一色度量化模式和所述第二色度量化模式在所述比特流中用信號(hào)表示。
11.如權(quán)利要求9所述的方法,其特征在于,所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部細(xì)分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的細(xì)分使用不同的量化參數(shù)。
12.如權(quán)利要求11所述的方法,其特征在于,應(yīng)用于DC系數(shù)和AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù)。
13.如權(quán)利要求11所述的方法,其特征在于,應(yīng)用于低通DC系數(shù)、低通AC系數(shù)和高通AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述高通AC系數(shù)使用與所述低通DC系數(shù)和所述低通AC系數(shù)相同 的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述高通AC系數(shù)、所述低通DC系數(shù)和所述低通AC系數(shù)使用不同的量化參數(shù)。
14.一種數(shù)字媒體處理方法,包括 存儲(chǔ)表示存儲(chǔ)器中的壓縮的數(shù)字媒體數(shù)據(jù)的比特流的至少部分;以及 通過向所述數(shù)字媒體數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述數(shù)字媒體數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部部分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù)。
15.如權(quán)利要求14所述的方法,其特征在于,所述第一空間維度量化模式和所述第二空間維度量化模式在所述比特流中用信號(hào)表示。
16.如權(quán)利要求14所述的方法,其特征在于,應(yīng)用于亮度系數(shù)和色度系數(shù)的量化參數(shù)至少在第一色度量化模式和第二色度量化模式之間選擇性地變化,在所述第一色度量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二色度量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù)。
17.如權(quán)利要求16所述的方法,其特征在于,應(yīng)用于DC系數(shù)和AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù)。
18.如權(quán)利要求16所述的方法,其特征在于,應(yīng)用于低通DC系數(shù)、低通AC系數(shù)和高通AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述高通AC系數(shù)使用與所述低通DC系數(shù)和所述低通AC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述高通AC系數(shù)、所述低通DC系數(shù)和所述低通AC系數(shù)使用不同的量化參數(shù)。
19.一種圖片解碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)已編碼的圖片數(shù)據(jù)的至少部分;以及 處理器,被編程用于通過根據(jù)量化規(guī)則向所述圖片數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述圖片數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,所述量化規(guī)則根據(jù)比特流中的信號(hào)選擇性地應(yīng)用,所述比特流中的信號(hào)包括第一信號(hào)、第二信號(hào),和第三信號(hào),所述第一信號(hào)用于確定如何跨空間維度應(yīng)用量化規(guī)則,所述第二信號(hào)用于確定如何跨頻率維度應(yīng)用量化規(guī)則,所述第三信號(hào)用于確定如何跨色通道維度應(yīng)用量化規(guī)則。
20.如權(quán)利要求19所述的設(shè)備,其特征在于,所述第一信號(hào)指示相同的一個(gè)或多個(gè)量化參數(shù)是否應(yīng)用到整個(gè)幀。
21.如權(quán)利要求19所述的設(shè)備,其特征在于,所述第二信號(hào)指示相同的一個(gè)或多個(gè)量化參數(shù)是否應(yīng)用于DC系數(shù)和AC系數(shù)。
22.如權(quán)利要求19所述的設(shè)備,其特征在于,所述第三信號(hào)指示相同的一個(gè)或多個(gè)量化參數(shù)是否應(yīng)用于亮度系數(shù)和色度系數(shù)。
23.一種圖片解碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)已編碼的圖片數(shù)據(jù)的至少部分;以及 處理器,被編程用于通過向所述圖片數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述圖片數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中應(yīng)用于DC系數(shù)和AC系數(shù)的所述量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù)。
24.如權(quán)利要求23所述的設(shè)備,其特征在于,所述第一頻率量化模式和所述第二頻率量化模式在所述比特流中用信號(hào)表示。
25.如權(quán)利要求23所述的設(shè)備,其特征在于,應(yīng)用于亮度系數(shù)和色度系數(shù)的量化參數(shù)至少在第一色度量化模式和第二色度量化模式之間選擇性地變化,在所述第一色度量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二色度量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù)。
26.如權(quán)利要求25所述的設(shè)備,其特征在于,所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部部分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù)。
27.一種圖片解碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)已編碼的圖片數(shù)據(jù)的至少部分;以及 處理器,被編程用于通過向所述圖片數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述圖片數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中應(yīng)用于亮度系數(shù)和色度系數(shù)的所述量化參數(shù)至少在第一色度量化模式和第二色度量化模式之間選擇性地變化,在所述第一色度量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的量化參數(shù),在所述第二色度量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù)。
28.如權(quán)利要求27所述的設(shè)備,其特征在于,所述第一色度量化模式和所述第二色度量化模式在所述比特流中用信號(hào)表示。
29.如權(quán)利要求27所述的設(shè)備,其特征在于,所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部部分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù)。
30.如權(quán)利要求29所述的設(shè)備,其特征在于,應(yīng)用于DC系數(shù)和AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù)。
31.如權(quán)利要求29所述的設(shè)備,其特征在于,應(yīng)用于低通DC系數(shù)、低通AC系數(shù)和高通AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述高通AC系數(shù)使用與所述低通DC系數(shù)和所述低通AC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述高通AC系數(shù)、所述低通DC系數(shù)和所述低通AC系數(shù)使用不同的量化參數(shù)。
32.—種圖片解碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)已編碼的圖片數(shù)據(jù)的至少部分;以及 處理器,被編程用于通過向所述圖片數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)并向所述圖片數(shù)據(jù)的所述塊應(yīng)用變換的反向操作來(lái)解碼所述比特流的所述至少部分,其中所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨所述圖片數(shù)據(jù)的幀的全部部分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù)。
33.如權(quán)利要求32所述的設(shè)備,其特征在于,所述第一空間維度量化模式和所述第二空間維度量化模式在所述比特流中用信號(hào)表示。
34.如權(quán)利要求32所述的設(shè)備,其特征在于,應(yīng)用于亮度系數(shù)和色度系數(shù)的量化參數(shù)至少在第一色度量化模式和第二色度量化模式之間選擇性地變化,在所述第一色度量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二色度量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù)。
35.如權(quán)利要求34所述的設(shè)備,其特征在于,應(yīng)用于DC系數(shù)和AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù)。
36.如權(quán)利要求34所述的方法,其特征在于,應(yīng)用于低通DC系數(shù)、低通AC系數(shù)和高通AC系數(shù)的量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述高通AC系數(shù)使用與所述低通DC系數(shù)和所述低通AC系數(shù)相同的一個(gè)或多個(gè)量化參數(shù),在所述第二頻率量化模式中所述高通AC系數(shù)、所述低通DC系數(shù)和所述低通AC系數(shù)使用不同的量化參數(shù)。
37.一種數(shù)字媒體處理方法,包括 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其特征在于所述量化參數(shù)跨空間維度、頻率維度和色通道維度的至少之一選擇性地變化,以及 生成已編碼的數(shù)字媒體數(shù)據(jù)的比特流,所述比特流還包括用于指示如何跨所述空間維度、頻率維度和所述色通道維度應(yīng)用量化參數(shù)的信號(hào)。
38.一種數(shù)字媒體處理方法,包括 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的所述塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其中應(yīng)用于DC系數(shù)和AC系數(shù)的所述量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù);以及 生成已編碼數(shù)字媒體數(shù)據(jù)的比特流,所述比特流包括指示根據(jù)第一頻率量化模式或第二頻率量化模式進(jìn)行編碼的信號(hào)。
39.一種數(shù)字媒體處理方法,包括 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的所述塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其中應(yīng)用于亮度系數(shù)和色度系數(shù)的所述量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的量化參數(shù),在所述第二頻率量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù);以及 生成已編碼數(shù)字媒體數(shù)據(jù)的比特流,所述比特流包括指示根據(jù)第一色度量化模式或第 二色度量化模式進(jìn)行編碼的信號(hào)。
40.一種數(shù)字媒體處理方法,包括 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的所述塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其中所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部部分應(yīng)用相同的一個(gè)或多個(gè)量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù);以及 生成已編碼數(shù)字媒體數(shù)據(jù)的比特流,所述比特流包括指示根據(jù)第一空間維度量化模式或第二空間維度量化模式進(jìn)行編碼的信號(hào)。
41.一種圖片編碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)要被編碼的圖片數(shù)據(jù);以及 處理器,被編程為 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其特征在于所述量化參數(shù)跨空間維度、頻率維度和色通道維度的至少之一選擇性地變化,以及 生成已編碼的數(shù)字媒體數(shù)據(jù)的比特流,所述比特流還包括用于指示如何跨所述空間維度、頻率維度和所述色通道維度應(yīng)用量化參數(shù)的信號(hào)。
42.—種圖片編碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)要被編碼的圖片數(shù)據(jù);以及 處理器,被編程為 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的所述塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其中應(yīng)用于DC系數(shù)和AC系數(shù)的所述量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述AC系數(shù)使用與所述DC系數(shù)相同的量化參數(shù),在所述第二頻率量化模式中所述AC系數(shù)使用不同于所述DC系數(shù)的量化參數(shù);以及 生成已編碼數(shù)字媒體數(shù)據(jù)的比特流,所述比特流包括指示根據(jù)第一頻率量化模式或第二頻率量化模式進(jìn)行編碼的信號(hào)。
43.一種圖片編碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)要被編碼的圖片數(shù)據(jù);以及 處理器,被編程為 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的所述塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其中應(yīng)用于亮度系數(shù)和色度系數(shù)的所述量化參數(shù)至少在第一頻率量化模式和第二頻率量化模式之間選擇性地變化,在所述第一頻率量化模式中所述色度系數(shù)使用與所述亮度系數(shù)相同的量化參數(shù),在所述第二頻率量化模式中所述色度系數(shù)使用不同于所述亮度系數(shù)的量化參數(shù);以及 生成已編碼數(shù)字媒體數(shù)據(jù)的比特流,所述比特流包括指示根據(jù)第一色度量化模式或第二色度量化模式進(jìn)行編碼的信號(hào)。
44.一種圖片編碼器設(shè)備,包括 數(shù)據(jù)存儲(chǔ)緩沖區(qū),用于存儲(chǔ)要被編碼的圖片數(shù)據(jù);以及 處理器,被編程為 通過向所述數(shù)字媒體數(shù)據(jù)的塊應(yīng)用變換的操作并向所述數(shù)字媒體數(shù)據(jù)的所述塊的變換系數(shù)應(yīng)用量化參數(shù)來(lái)編碼數(shù)字媒體數(shù)據(jù),其中所述量化參數(shù)至少在第一空間維度量化模式和第二空間維度量化模式之間選擇性地變化,在所述第一空間維度量化模式中跨幀的全部部分應(yīng)用相同的量化參數(shù),在所述第二空間維度量化模式中所述幀的不同部分使用不同的量化參數(shù);以及 生成已編碼數(shù)字媒體數(shù)據(jù)的比特流,所述比特流包括指示根據(jù)第一空間維度量化模式或第二空間維度量化模式進(jìn)行編碼的信號(hào)。
全文摘要
一種數(shù)字媒體編碼器/解碼器使用提供沿著所編碼的數(shù)字媒體數(shù)據(jù)的各個(gè)維度改變量化的功能的靈活量化技術(shù),這些維度包括空間、頻率子帶和色通道。該編解碼器利用一信號(hào)表示方案來(lái)高效地用信號(hào)表示靈活量化組合的各種排列以用于主要使用情形。當(dāng)量化器選擇可用時(shí),該編解碼器通過定義一量化器子集并從該集合中索引當(dāng)前量化器來(lái)高效地編碼當(dāng)前量化器。
文檔編號(hào)H04N7/26GK102833545SQ20121029790
公開日2012年12月19日 申請(qǐng)日期2007年5月4日 優(yōu)先權(quán)日2006年5月5日
發(fā)明者C·屠, S·斯里尼瓦桑 申請(qǐng)人:微軟公司