專利名稱:對圖像進(jìn)行編碼的方法及實(shí)現(xiàn)所述方法的裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對圖像進(jìn)行編碼的方法。更精確地其涉及對所述圖4象進(jìn)4于量化的方法。本發(fā)明還涉及實(shí)現(xiàn)所述方法的編碼裝置。
背景技術(shù):
為了對圖^象進(jìn)行編碼,通常需要減少空間冗余。為了實(shí)現(xiàn)該目
標(biāo),在典型的圖像編碼方法中,將圖像分成非重疊的多個(gè)NxN像素塊,然后每個(gè)像素塊都被變換成系數(shù)變換塊。這些編碼方法對各圖像像素進(jìn)行解相關(guān)(decorrelate ),以更有效地減少變換域中的冗余。在該方面,變換的能量壓縮特性是重要的。在常用的各種變換中,離散余弦變換(DCT)由于其優(yōu)良的能量壓縮特性而被廣泛應(yīng)用。變換塊利用增加的空間頻率來表示一組系數(shù)。變換塊的上左(O,0)位置中的系數(shù)稱作DC系數(shù),其表示NxN塊的平均值。其他的(A^-"個(gè)系數(shù)稱作AC系數(shù),它們表示高頻細(xì)節(jié)。才艮據(jù)不同的應(yīng)用,維凄史NxN可以是16x16、 8x8、或4x4。為了減少對圖4象編石馬所需的比特?cái)?shù),典型的圖像編碼方法都利用量化步驟對各變換塊的系數(shù)進(jìn)行量化。量化是減少可能的數(shù)量值的數(shù)目的處理,從而減少表示其所需的比特?cái)?shù)。量化步驟的選擇對保證高質(zhì)量的解碼圖像是決定性的。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種用于對圖像進(jìn)行量化的解決方案。為了實(shí)現(xiàn)該目的,本發(fā)明涉及一種將分成多個(gè)非重疊宏塊的圖
像編碼成二進(jìn)制流的方法,其中,非重疊宏塊本身被分成NxN像素的多個(gè)非重疊塊。該方法包括以下步驟
將每個(gè)塊都變換成系數(shù)變換塊,系數(shù)變換塊包括一個(gè)低頻系數(shù)和N2-1個(gè)稱作高頻系凄t的系凄t,該高頻具有高于該4氐頻的頻率;
利用量化參數(shù)對每個(gè)變換塊的每個(gè)系數(shù)進(jìn)行量化;
將所量化的系凄丈編碼成二進(jìn)制流。
根據(jù)本發(fā)明,利用稱作第一量化參數(shù)的同一量化參數(shù)對這些變換塊的低頻系數(shù)進(jìn)行量化。這有利地使得保證整個(gè)圖像上的連續(xù)基本質(zhì)量成為可能。
有利地,利用稱作第二量化參數(shù)的同 一量化參數(shù)對同 一宏塊的這些高頻系數(shù)進(jìn)行量化。
優(yōu)選地,第二量化參凄t作為第 一量化參凄t和增量的和進(jìn)4亍計(jì)算,其中,增量基于為宏塊計(jì)算的視知覺興趣值(visual perceptualinterest value )來確定。
根據(jù)本發(fā)明的第 一方面,視知覺興趣值取決于宏塊的平均亮度值。
才艮據(jù)一個(gè)變體,—見知覺興趣值還取決于宏塊的每個(gè)塊的方差。根據(jù)另一個(gè)變體,視知覺興趣值還取決于宏塊的色度信息。本發(fā)明還涉及一種用于將被分成多個(gè)非重疊宏塊的圖像編碼
成二進(jìn)制流的裝置,其中,非重疊宏塊本身被分成NxN像素的多個(gè)非重疊塊。該裝置包括
變換裝置,用于將每個(gè)塊都變換成系數(shù)變換塊,該系數(shù)變換塊包括一個(gè)低頻系數(shù)和N2-1個(gè)稱作高頻系數(shù)的系數(shù),該高頻具有高于該低頻的頻率;
量化裝置,用于利用量化參數(shù)對每個(gè)變換塊的每個(gè)系數(shù)進(jìn)行量
化;
編碼裝置,用于將所量化的系凄t編碼成二進(jìn)制流。
根據(jù)本發(fā)明,量化裝置利用稱作第 一量化參數(shù)的同 一量化參數(shù)對這些變換塊的低頻系數(shù)進(jìn)行量化。
根據(jù)本發(fā)明的一個(gè)方面,變換裝置是DCT變換單元。
本發(fā)明的其他特征和優(yōu)點(diǎn)將通過下面其一些實(shí)施例的描述而變得顯而易見,結(jié)合附圖進(jìn)行了描述,附圖中
圖l示出了才艮據(jù)本發(fā)明第一實(shí)施例的方法的流程圖2示出了4艮據(jù)本發(fā)明第一實(shí)施例的方法的量化步驟的詳細(xì)流程圖3示出了根據(jù)本發(fā)明第一實(shí)施例的方法的特征提取步驟的詳細(xì)流程圖;圖4示出了對于圖像中的多個(gè)區(qū)域,使用不同灰度級的這些區(qū)域的視知覺興趣等級;
圖5示出了根據(jù)本發(fā)明第二實(shí)施例的方法的流程圖6示出了根據(jù)本發(fā)明第一實(shí)施例的編碼裝置;以及
圖7示出了^4居本發(fā)明第二實(shí)施例的編碼裝置。
具體實(shí)施例方式
圖1至圖3以及圖5中,所表示的框是純粹的功能實(shí)體,它們不必對應(yīng)于物理上獨(dú)立的實(shí)體。即,它們可以以軟件的形式進(jìn)行開發(fā),或在一個(gè)或多個(gè)集成電路中實(shí)現(xiàn)。在這些附圖上,相似的元件才示以相同的才示號(hào)。
本發(fā)明涉及一種對圖像進(jìn)行編碼的方法。該圖像由多個(gè)像素組成并^L分成非重疊的多個(gè)宏塊M,,其中,各宏塊本身也凈皮分成多個(gè)像素塊bp,q,其中,l是宏塊的索引(index), (p,q)是該塊的坐標(biāo),
即,塊bp,q位于塊的第P列、第q行。在許多應(yīng)用中,塊bp,q都是8
像素x8像素的塊,且一個(gè)宏塊由4個(gè)塊bp,q組成。然而,本發(fā)明并不限于這種情況,而是無論塊bp,q的大小和宏塊MB i的大小如何都可以4吏用本發(fā)明。
下面參照圖1、圖2和圖3來描述該方法的第一實(shí)施例。該方法包括步驟10,用于將圖像的每個(gè)塊bp,q都變換成系數(shù)的變換塊
Bp,q。如果bp,q位于宏塊M,中,則變換塊Bp,q位于以MB!表示的相應(yīng)的變換宏塊中。例如,每個(gè)塊bp,q利用根據(jù)下式的離散余弦變換
(DCT)變換成變換塊B。。<formula>formula see original document page 8</formula>
其中,-m,v-0,1,…,N — i;
畫、力',A:)是坐標(biāo)為(j,k)的塊bp,q的像素的亮度值(或
色度值);
-5p^,力是坐標(biāo)為(u,v)的變換塊Bp,q的系數(shù)值;以及<formula>formula see original document page 8</formula>
在步驟20,每個(gè)變換塊Bp,q的每個(gè)系數(shù)Bp,q(U,V)被利用量化參數(shù)QPp,q(U,V)量化成量化系數(shù)BQp,q(U,V)。根據(jù)本發(fā)明的第一方面,圖
像中的所有DC系凄t都在210中^皮利用相同的量化參凄t QPf進(jìn)^f亍量
化,即,VQ7,W, QPp,q(O,O) = QPf。這使得保證整個(gè)圖像上的連續(xù)基
本質(zhì)量成為可能。該量化參lt QPf例如是由速率控制方法(諸如眾所周知的來自ISO/IECJTC/SC29/WG11的于1993年4月登載的標(biāo)題為"Test Model 5"的文獻(xiàn)N0400中為MPEG2描述的TM5速率控制方法)確定的。根據(jù)本發(fā)明的另一個(gè)方面,在220中采用同一量化參凝:es對位于同 一宏塊MB,中的所有塊Bp,q的所有AC系凄t進(jìn)4亍
量化,該量化參數(shù)2S可以等于也可以不等于QPf。根據(jù)具體特性,用于對所有這些AC系數(shù)進(jìn)行量化的量化參數(shù)等于2尸/=2戶/+厶2尸/,其中,Agi^根據(jù)宏塊MB,的感知興趣來確定。在這種情況中,對于MB,中的所有AC系數(shù),都有QPp,q(u,v) = 2尸,2尸,+Ae《。才艮據(jù)第一實(shí)施例,A^^W卜QPstep,其中,QP鄉(xiāng)例如設(shè)置為2。在步驟30中,通過在340中結(jié)合分別乂人步艱《310、 320和330計(jì)算出三個(gè)不同的特征F,1、 W和F/來計(jì)算權(quán)重Wlt>與圖像中的每個(gè)宏塊1V^都相關(guān)的第一特征^采用其在集合{0,1}中的值。如果巧,廣l,則宏塊M,屬于皮膚區(qū),例如,人臉,否則,即^=0,則該塊不屬于皮膚區(qū)。為了在310中計(jì)算該特征,需要沖企測膚色。為了實(shí)現(xiàn)該目的,如果在圖像中有皮膚區(qū)的話,就使用諸如由D. Cai和K.N.Ngan于1999年在IEEE transactions on CSVT上發(fā)表6勺題為"Face segmentation usingskin color map in videophone applications"的文獻(xiàn)中提出的分色(color segmentation)方法來4企測圖l象中的皮月夫區(qū)。該特4^吏4尋對從視覺角度看對人眼重要的皮膚區(qū)進(jìn)行更精細(xì)地量化是可能的。與圖像中的每個(gè)宏塊M,都相關(guān)的第二特征巧2采用其在集合{0,1}中的
值。如果,,2=1,則宏塊M!是平坦區(qū),否則就不是。為了實(shí)現(xiàn)該目的,位于宏塊M,中的每個(gè)塊bp,q中的變量vk用于如下計(jì)算值"",
其中,Vk是位于宏塊中的第k個(gè)塊的方差(variance )。如果a",小于預(yù)定閾值THT,則宏塊M,是平坦區(qū),即,《2 = 1,否則^2 = 0。在大多數(shù)應(yīng)用中將THT設(shè)置為8。該特征使得更精細(xì)地對平坦區(qū)(即低細(xì)節(jié)區(qū))進(jìn)行量化是可能的。事實(shí)上,這種平坦區(qū)中的一見覺缺陷會(huì)更加干擾人眼。與圖像中的每個(gè)宏塊M,都相關(guān)的第三特征^采用其在集合{0,1}中的值。為了在330中計(jì)算F,3,將宏塊M!上的平均
亮度水平分別與可被二沒置為23和1952的兩個(gè)閾值THL和THH進(jìn)行比較。如下得到稱作等級(level)的值
0, ifOS/,a<7m
1, if 77/£幺/w附a《77///
2, if77///</,"255
^口果level=0或2,貝'J F/= 0, ^口果level=l,貝'J巧2 = 1 。 ^亥凈爭4iM吏4尋只于中調(diào)區(qū)(mid-tone region)進(jìn)^f亍更^r細(xì)的量化成為可能,其中,/人一見覺質(zhì)量方面看,人眼^J"中調(diào)區(qū)更力。每文感。
這三個(gè)特4i如下以^又重W!在340中進(jìn)4亍組合「3,宏塊M,具有三個(gè)等于1的特4正2,宏塊M,只具有兩個(gè)等于1的特4正1,宏塊M,只具有一個(gè)等于1的特4正-2,宏塊M,沒有等于1的特征
這由圖4示出
然后在步驟40中通過例如經(jīng)典的熵編碼方法(諸如來自ISO/IEC 14496-10的題為《Information technology — Coding ofaudio-visual objects — Part 10: Advanced Video Coding》文獻(xiàn)中第7.9部分中描述的一種方法)對這些量化系lt進(jìn)行編碼。
下面參照圖2和圖5來描述該方法的第一實(shí)施例。該方法包括「
步驟10,用于將圖像的每個(gè)塊bp,q都變換成系數(shù)的變換塊Bp,q。如果bp,q位于宏塊M中,則變換塊Bp,q位于以MB,表示的相應(yīng)的變換宏塊中。例如,每個(gè)塊bp,q利用根據(jù)下式的離散余弦變換(DCT)
變換成變換塊Bp,q:
4
iV2
J ■]'cos[:^~~rT^~],
2iV
2iV
乂=0 t=0
其中,-m,v = o,i,...,n-i;
-、力")是坐標(biāo)為(j,k)的塊bp,q的像素的亮度值(或
色度值);
-~>,力是坐標(biāo)為(u,v)的變換塊Bp,q的系數(shù)值;以及
7, ifw = 01, if w = l,2,...,7V — l
在步驟20,每個(gè)變換塊Bp,q的每個(gè)系數(shù)Bp,q(U,V)都被利用量化
參數(shù)QPp,q(u,v)量化成量化系數(shù)BQp,q(u,v)。根據(jù)本發(fā)明的第 一方面,圖像中的所有DC系數(shù)都在210中被利用相同的量化參數(shù)QPf進(jìn)行量化,即,vo^),QPp,q(0,0) = QPf。這使得保證整個(gè)圖4象上的連續(xù)基本質(zhì)量成為可能。該量化參數(shù)QPf例如是由速率控制方法(諸如眾所周知的來自ISO/IECJTC/SC29/WG11的于1993年4月登載的標(biāo)題為"Test Model 5"的文獻(xiàn)N0400中為MPEG2描述的TM5速率控制方法)確定的。根據(jù)本發(fā)明的另一個(gè)方面,在220中采用同一量化參凝:2尸,對位于同 一宏塊MB,中的所有塊Bp,q的所有AC系數(shù)進(jìn)4亍量化,該量化參凄史e《可以等于也可以不等于QPf。 4艮據(jù)具體特性,用于對所有這些AC系數(shù)進(jìn)行量化的量化參數(shù)等于^=2尸/+厶^,其中,Agi^艮據(jù)宏塊MB,的感知興趣來確定。在這種情況中,對于MB,中的所有AC系數(shù),都有QPp,q(u,v) = e尸,2尸,+A2《。才艮據(jù)第二
實(shí)施例,A^-tl^.Qp'鄉(xiāng),其中,V,是宏塊M,的重要性等級。在
128
這種情況中,QP'鄉(xiāng)可以設(shè)置為6。在步驟31中由宏塊M,計(jì)算V,,
并對V,進(jìn)行削波(clip)使之位于范圍
內(nèi)。為了實(shí)現(xiàn)該目的,在31中對整個(gè)圖4象計(jì)算由N. Bruce在2004年8月在Proceeding ofthe 17th International Conference on Pattern Recognition, pp. 616-619發(fā)表的題為"Image analysis through local information measure"的文獻(xiàn)中描述的信息圖。該圖為每個(gè)宏塊M,分配重要性等級V,。該方法l吏得通過以經(jīng)典的信息理i侖i殳置分析局部圖^f象統(tǒng)計(jì)特性來識(shí)別圖像中的感知重要區(qū)域。因此,能夠更加連續(xù)地調(diào)整量化參數(shù),從而提高解碼圖像的視覺質(zhì)量。
然后在步驟40,通過例如經(jīng)典的熵編碼方法(諸如來自ISO/IEC14496-10的題為《Information technology — Coding of audio-visualobjects — Part 10: Advanced Video Coding》文獻(xiàn)中第7.9部分中描述的一種方法)對這些量化的系數(shù)進(jìn)行編碼。
該解決方案使得以對整個(gè)比特率進(jìn)行很小的改變來獲得平滑分布的感知質(zhì)量^是高成為可能。本發(fā)明還涉及圖6和圖7所示的編碼裝置CODEC。在這些圖中,相似的元件標(biāo)以相同的標(biāo)號(hào)。該裝置CODEC包括模塊T,模
塊T用于將圖像的每個(gè)塊bp,q變換成系數(shù)的變換塊Bp,q。其實(shí)現(xiàn)了
例如DCT。模塊T連接至模塊Q,模塊Q適于將每個(gè)變換塊Bp,q的每個(gè)系數(shù)Bp,q(u,v)都量化成量化系數(shù)BQp,q(u,v)。模塊Q實(shí)現(xiàn)上述方法的步驟20。因此,裝置CODEC包括模塊ROL,模塊ROL連4妄至4莫塊Q并適于通過例如實(shí)現(xiàn)上述方法的步驟310至340來計(jì)算圖像的每個(gè)宏塊M,的權(quán)重W"根據(jù)圖7中所示的另一個(gè)特性,裝置CODEC中的模塊ROh被模塊ROI2取代,模塊ROI2適于通過實(shí)現(xiàn)在2004年8月在Proceeding of the 17th International Conference onPattern Recognition, pp. 616-619發(fā)表的題為"Image analysis throughlocal information measure"的文獻(xiàn)中描述方法來計(jì)算圖^f象的每個(gè)宏塊M,的重要性等級V,。模塊Q還連接至模塊COD,模塊COD適于對量化系數(shù)B ,q(u,v)進(jìn)行編碼。其優(yōu)選地為熵編碼器。
所述用于圖^f象的本發(fā)明可以有利地應(yīng)用于^L頻,更確切地i兌應(yīng)用于一見頻的每個(gè)圖像。
權(quán)利要求
1.一種用于將分成多個(gè)非重疊宏塊的圖像編碼成二進(jìn)制流的方法,其中,所述非重疊宏塊本身被分成N×N像素的多個(gè)非重疊塊,所述方法包括以下步驟將每個(gè)所述塊都變換成系數(shù)變換塊(10),所述系數(shù)變換塊包括一個(gè)低頻系數(shù)和N2-1個(gè)稱作高頻系數(shù)的系數(shù),所述高頻具有高于所述低頻的頻率;利用量化參數(shù)對每個(gè)所述變換塊的每個(gè)系數(shù)進(jìn)行量化(20);將所量化的系數(shù)編碼成二進(jìn)制流(40);其特征在于,利用稱作第一量化參數(shù)的同一量化參數(shù)(QPf)對這些所述變換塊的所述低頻系數(shù)進(jìn)行量化。
2. 根據(jù)權(quán)利要求1所述的方法,其中,利用稱作第二量化參數(shù)的 同一量化參數(shù)(2《)對同一宏塊的這些所述高頻系數(shù)進(jìn)行量 化。
3. 根據(jù)權(quán)利要求2所述的方法,其中,所述第二量化參數(shù)(^ ) 作為所述第一量化參數(shù)(QPf)和增量(A05,)的和來計(jì)算, 所述增量(AgP,)基于為所述宏塊計(jì)算(30, 31)的纟見知覺興趣 ^直來確定。
4. 根據(jù)權(quán)利要求3所述的方法,其中,所述視知覺興趣值取決于 所述宏塊的平均亮度值。
5. 根據(jù)權(quán)利要求3或4所述的方法,其中,所述視知覺興趣值取 決于所述宏塊的每個(gè)塊的方差。
6. 根據(jù)權(quán)利要求3-5中任一項(xiàng)所述的方法,其中,所述視知覺興 趣值取決于所述宏塊的色度信息。
7. —種用于將^皮分成多個(gè)非重疊宏塊的圖4象編碼成二進(jìn)制流的 裝置,其中,所述非重疊宏塊本身被分成NxN像素的多個(gè)非 重疊塊,所述裝置包括變換裝置(T),用于將每個(gè)所述塊都變換成系數(shù)變換塊, 所述系數(shù)變換塊包括一個(gè)低頻系凄t和N2-l個(gè)稱作高頻系數(shù)的 系數(shù),所述高頻具有高于所述低頻的頻率;量化裝置(Q),用于利用量化參數(shù)對每個(gè)所述變換塊的 每個(gè)系凄t進(jìn)行量化;編碼裝置(COD ),用于將所量化的系數(shù)編碼成二進(jìn)制流;其特征在于,所述量化裝置(Q)利用稱作第一量化參數(shù) 的同一量化參數(shù)(QPf)對這些所述變換塊的所述低頻系數(shù)進(jìn) 4亍量化。
8. 根據(jù)權(quán)利要求7所述的裝置,其中,所述變換裝置(T)是 DCT變換單元。
全文摘要
本發(fā)明涉及一種將分成多個(gè)非重疊宏塊的圖像編碼成二進(jìn)制流的方法,其中,非重疊宏塊本身被分成N×N像素的多個(gè)非重疊塊。該方法包括以下步驟將每個(gè)塊都變換成系數(shù)變換塊,該系數(shù)變換塊包括一個(gè)低頻系數(shù)和N<sup>2</sup>-1個(gè)稱作高頻系數(shù)的系數(shù),高頻具有高于低頻的頻率;利用量化參數(shù)對每個(gè)變換塊的每個(gè)系數(shù)進(jìn)行量化;將所量化的系數(shù)編碼成二進(jìn)制流。根據(jù)本發(fā)明,利用稱作第一量化參數(shù)的同一量化參數(shù)對變換塊的低頻系數(shù)進(jìn)行量化。
文檔編號(hào)H04N7/30GK101601303SQ200680056509
公開日2009年12月9日 申請日期2006年12月11日 優(yōu)先權(quán)日2006年12月11日
發(fā)明者呂小安, 朱立華, 楊黎波 申請人:湯姆遜許可公司