圖像壓縮處理方法

文檔序號(hào)：7525307閱讀：398來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子電路裝置的制造及其應(yīng)用技術(shù)

專利名稱：圖像壓縮處理方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種圖像壓縮處理方法，其中每幅圖像或圖像宏塊用從幾種編碼方法中選擇的一種編碼方法所編碼。
本發(fā)明特別涉及一種MPEG2壓縮處理方法。盡管本發(fā)明不限于這種類型的壓縮，在下文的描述中，我們將主要參照這種類型進(jìn)行說(shuō)明。
下面是對(duì)這種壓縮的原理的回顧，并且在此將指出為每個(gè)宏塊選擇的編碼類型。
按照MPEG2標(biāo)準(zhǔn)，可以從遞進(jìn)模式中包含的圖像開(kāi)始，這種圖像有576行每行720點(diǎn)。按照隔行模式，這種圖像包括兩幀，每幀包括288行，也是每行720點(diǎn)。
每幅圖像被分為多個(gè)宏塊，每個(gè)宏塊由成正方形的16×16亮度點(diǎn)形成。因此，每個(gè)宏塊由4個(gè)8×8亮度點(diǎn)的方塊所形成。按照4．2．0格式，與這4個(gè)亮度點(diǎn)的方塊中的每一個(gè)與兩個(gè)各有8×8點(diǎn)的色度塊關(guān)聯(lián)，其中一個(gè)色度塊表示色差或紅色度信號(hào)Cr，而另一色度塊表示色差或藍(lán)色度信號(hào)Cb。按照4．2．2格式，與每個(gè)亮度宏塊相關(guān)聯(lián)的是四個(gè)8×8的色度塊，其中兩個(gè)色度塊用于藍(lán)色色度，兩個(gè)色度塊用于紅色色度。在此還有4．4．4格式，其中每個(gè)亮度和色度成分包括4個(gè)8×8的塊。

圖1中表示的是在該組合中具有參考標(biāo)號(hào)10的四個(gè)8×8的亮度塊，并且8×8的色度塊12和14分別用于藍(lán)色和紅色色度，該組合示出在4．2．0標(biāo)準(zhǔn)中的一個(gè)宏塊。
每個(gè)塊通過(guò)利用稱為DCT(離散余弦變換)的變換法進(jìn)行編碼，這種變換使得有可能把一個(gè)亮度或色度塊變換為一個(gè)表示空間頻率的系數(shù)塊。如圖2中所示，一個(gè)源塊16被變換為8×8系數(shù)的塊18。該塊18的左上角20對(duì)應(yīng)于零空間頻率(該塊的平均亮度值)，并且在這一源點(diǎn)20的正向上，水平頻率向右增加，如箭頭22表示，而垂直空間頻率從上到下增加，如箭頭24所示。
對(duì)于每個(gè)宏塊而言，必須選擇編碼類型或者“內(nèi)部”型，或者“中間”型。“內(nèi)部”編碼在于把DCT變換應(yīng)用于該圖像的一個(gè)源塊，而“中間”編碼在于把DCT變換應(yīng)用于表示源塊與預(yù)測(cè)塊之間或者與前幅或后幅圖像的預(yù)測(cè)塊之間的差值的塊。
該選擇取決于該宏塊所屬的圖像類型。這些圖像有三種類型第一種是所謂的I型或內(nèi)部型，它對(duì)所有宏塊的編碼是內(nèi)部型的。
第二種是P型或預(yù)測(cè)型，在這種類型的圖像中，每個(gè)宏塊的編碼可以是內(nèi)部型或中間型的。在P型圖像的一個(gè)宏塊的中間編碼的情況下，DCT變換被應(yīng)用于該圖像P的當(dāng)前宏塊與從在前的I或P圖像產(chǎn)生的預(yù)測(cè)宏塊之間的差值。
第三種類型圖像被稱為N型或雙向型。這類圖像的每個(gè)宏塊是內(nèi)部編碼或中間編碼的。中間編碼也在于把該變換應(yīng)用于B圖像的當(dāng)前宏塊與預(yù)測(cè)宏塊之間的差值。該預(yù)測(cè)宏塊可以從前幅圖像產(chǎn)生或者從后幅圖像產(chǎn)生，或者同時(shí)從這兩幅圖像產(chǎn)生(雙向預(yù)測(cè))，所謂的在先或在后預(yù)測(cè)圖像有可能僅僅是I或P型圖像。
圖3中表示的是形成所謂GOP(圖像組)的一組圖像，其中包括12幅圖像，即一幅I圖像之后順次B，B，P，B，B，P，B，B，P，B，B跟隨著11個(gè)B和P圖像。
在預(yù)測(cè)圖像的情況中(也就是說(shuō)從其他圖像引出的圖像)，運(yùn)動(dòng)估計(jì)和隨后的運(yùn)動(dòng)補(bǔ)償都被應(yīng)用于要編碼的宏塊。這是因?yàn)樵趦煞鶊D像之間，宏塊可因中間圖像和中間幀的運(yùn)動(dòng)而位于不同的位置。運(yùn)動(dòng)補(bǔ)償?shù)男Ч歉鶕?jù)給定的內(nèi)插模式(通常稱為預(yù)測(cè)模式)計(jì)算預(yù)測(cè)宏塊；這種宏塊實(shí)際將被用作對(duì)于給定的編碼模式對(duì)在中間圖像模式中的當(dāng)前宏塊的預(yù)測(cè)。在下文中，按照所取同樣的編碼模式，根據(jù)在用于計(jì)算編碼模式的選擇的程序中的判斷，將保留或排除這種預(yù)測(cè)宏塊和這種編碼模式。
另外，在隔行掃描的情況下，其中每幅圖像由兩個(gè)相繼的幀，即偶數(shù)幀和奇數(shù)幀形成，需要確定是否應(yīng)對(duì)每個(gè)幀逐次或單獨(dú)地實(shí)行DCT變換。這是因?yàn)楦鶕?jù)該圖像的運(yùn)動(dòng)或該圖像的結(jié)構(gòu)，編碼的結(jié)果可能不同，這取決于是否對(duì)圖像或每個(gè)幀執(zhí)行變換。
這種選擇由圖4a和圖4b表示。圖4a中表示的是奇數(shù)幀的行301、303、…、3015和由偶數(shù)幀的行302、304、…、3016所形成的間隔圖像的宏塊28。圖4a對(duì)應(yīng)于關(guān)于該圖像執(zhí)行的DTC變換；宏塊28的四個(gè)塊中的每一個(gè)被變換，而不對(duì)各行重新排列。因此，關(guān)于形成宏塊28的這四個(gè)塊281、282、283、284進(jìn)行編碼，并關(guān)于塊281和282的行301至308和塊283和284的行309至3016進(jìn)行變換。
另一方面，圖4b示出分別對(duì)奇數(shù)和偶數(shù)幀進(jìn)行的變換。塊321和322對(duì)應(yīng)于奇數(shù)幀，塊323和324對(duì)應(yīng)于偶數(shù)幀。因此，塊321包括行301、303、…、3015，而塊323和324包括行302、304、…、3016。
圖5表示的是要關(guān)于圖像壓縮和視頻壓縮執(zhí)行的各種操作的方框圖。把每個(gè)數(shù)字化圖形加給功能塊40的輸入端，該功能塊分割為8×8的塊，并將這些8×8塊發(fā)送到功能塊42，用于在內(nèi)部編碼和中間編碼之間選擇。如果所選的編碼是內(nèi)部編碼，則將這種塊發(fā)送到DCT變換功能塊44。如果該編碼是中間編碼，則使這種塊被減法器功能塊46所減，所述功能塊46取得該塊本身與由時(shí)間預(yù)測(cè)功能塊48所傳送的預(yù)測(cè)塊之間的差。
在DCT變換44之后，執(zhí)行量化50，并按可變或固定長(zhǎng)度的VLC編碼法將如此獲得的量化系數(shù)編碼52。在編碼器52的輸出端獲得的這種編碼的系數(shù)被直接傳送到緩沖存儲(chǔ)器54，存儲(chǔ)器54的輸出構(gòu)成編碼輸出56。為了避免緩沖存儲(chǔ)器54的飽和與空白，執(zhí)行調(diào)節(jié)60，這改變量化50。
為了能進(jìn)行時(shí)間預(yù)測(cè)，將量化功能塊50的輸出連接到用于反量化Q—1。的功能塊62的輸入端，功能塊62的輸出被提供給執(zhí)行反余弦變換DCT—1的功能塊64。當(dāng)由功能塊68確定該塊的編碼是內(nèi)部編碼時(shí)，該功能塊64的輸出被直接發(fā)送給圖像存儲(chǔ)器66。另一方面，當(dāng)功能塊68確定該編碼是中間編碼時(shí)，利用加法器70把該方塊64的輸出加給由功能塊48所傳送的預(yù)測(cè)宏塊，并且它是來(lái)自加法器70的輸出，其被發(fā)送到圖像存儲(chǔ)器66。存儲(chǔ)器66保存解碼的圖像。
中間圖像和中間幀的運(yùn)動(dòng)由功能塊72所預(yù)測(cè)，該功能塊一方面從圖像存儲(chǔ)器66接收信息，另一方面從用于構(gòu)成塊的功能塊40的輸出接收信息。因此，可以看出，一方面時(shí)間預(yù)測(cè)48根據(jù)圖像存儲(chǔ)器66而執(zhí)行，另一方面根據(jù)運(yùn)動(dòng)估計(jì)72而執(zhí)行。
在其它情況中，編碼或二進(jìn)制序列52的計(jì)算取決于來(lái)自運(yùn)動(dòng)估計(jì)72的運(yùn)動(dòng)矢量、編碼的DCT系數(shù)、宏塊的標(biāo)頭、以及由功能塊74所傳送的MPEG2編碼信息。這個(gè)信息與MPEG2信號(hào)有關(guān)，即宏塊(或“片段”)各行的標(biāo)頭、GOP圖像的標(biāo)頭以及要被編碼的序列的標(biāo)頭。
對(duì)于I型圖像而言，必須在幀方式內(nèi)部編碼或圖像方式內(nèi)部編碼之間選擇編碼方式。根據(jù)對(duì)包含在宏塊中的活動(dòng)量的分析做出這種選擇；這通常都給出良好的結(jié)果。
對(duì)于P型圖像和B型圖像而言，要作出的判斷數(shù)量明顯會(huì)更大。
因此，可按8種基本模式給一個(gè)P宏塊編碼—內(nèi)部；幀DCT，—內(nèi)部；圖像DCT，—沒(méi)有運(yùn)動(dòng)補(bǔ)償(noMC)；幀DCT，—沒(méi)有運(yùn)動(dòng)補(bǔ)償(noMC)；圖像DCT，—有運(yùn)動(dòng)補(bǔ)償；由較早的幀預(yù)測(cè)；幀DCT，—有運(yùn)動(dòng)補(bǔ)償；由較早的幀預(yù)測(cè)；圖像DCT，—有運(yùn)動(dòng)補(bǔ)償；由較早的圖像預(yù)測(cè)；幀DCT，—有運(yùn)動(dòng)補(bǔ)償；由較早的圖像預(yù)測(cè)；圖像DCT。
對(duì)于B型圖像而言，可有14種的基本編碼模式，即兩種內(nèi)部編碼模式、四種專用于P型圖像的具有運(yùn)動(dòng)補(bǔ)償?shù)哪Ｊ健⒘硗庥兴姆N基于較后預(yù)測(cè)圖像的類似編碼模式和四種雙向模式，即—由較后的幀預(yù)測(cè)；幀DCT，—由較后的幀預(yù)測(cè)；圖像DCT，—由較后的圖像預(yù)測(cè)；幀DCT，—由較后的圖像預(yù)測(cè)；圖像DCT，—幀方式雙向預(yù)測(cè)；幀DCT，
—幀方式雙向預(yù)測(cè)；圖像DCT，—圖像方式雙向預(yù)測(cè)；幀DCT，—圖像方式雙向預(yù)測(cè)；圖像DCT。
應(yīng)予說(shuō)明的是，迄今在用于P和B圖像的各種模式之間選擇的標(biāo)準(zhǔn)給出質(zhì)量可變的結(jié)果。
1998年8月28日以湯姆森多媒體公司名義提出的在先專利申請(qǐng)第9810802號(hào)中描述了一種壓縮處理方法，其中根據(jù)所有可能模式或者根據(jù)其中一些模式進(jìn)行嘗試編碼，并對(duì)每種嘗試編碼確定編碼的成本和／或質(zhì)量因子，所用編碼模式被選擇作為編碼成本的數(shù)值和／或質(zhì)量因子的數(shù)值的函數(shù)。
換句話說(shuō)，根據(jù)在先申請(qǐng)中描述的處理方法，不是作為宏塊內(nèi)部分析的函數(shù)選擇編碼模式，而是通過(guò)嘗試所有可能的編碼(或者一些可能的編碼)以及通過(guò)采用給出最佳結(jié)果的模式而選擇編碼模式，或者因?yàn)樗咕幋a成本最小化，或者因?yàn)樗箞D像質(zhì)量最大化，或者因?yàn)樗诰幋a成本與圖像質(zhì)量之間給出最佳的協(xié)調(diào)。
特別是當(dāng)選擇給定的成本／質(zhì)量標(biāo)準(zhǔn)時(shí)，這種處理方法每個(gè)宏塊提供最佳的結(jié)果。但是，難以對(duì)必須實(shí)時(shí)進(jìn)行的編碼應(yīng)用這種方法，因?yàn)樗婕跋喈?dāng)多計(jì)算時(shí)間，特別對(duì)便攜式裝置來(lái)說(shuō)難以減少該計(jì)算時(shí)間。
但是，按照所述在先申請(qǐng)，編碼仍然被用于確定可被實(shí)時(shí)計(jì)算的參數(shù)，而且在P和B圖像的情況下，使其有可能選擇提供最佳結(jié)果的編碼模式。
根據(jù)本發(fā)明第一方面，為了確定P和／或B圖像的編碼宏塊的模式，對(duì)每個(gè)編碼模式計(jì)算能量參數(shù)，該參數(shù)對(duì)于中間編碼模式來(lái)說(shuō)是中間圖像能量，并且對(duì)于內(nèi)部編碼模式來(lái)說(shuō)是相對(duì)于亮度的平均值的相對(duì)能量，并且采用提供最小能量參數(shù)的編碼模式，或者采用提供不比該最小能量參數(shù)高出預(yù)定的因子k的能量參數(shù)。在一個(gè)例子中，該因子k等于2．5。
在中間宏塊的情況中，中間圖像能量MBdfd具有如下數(shù)值MBdfd=(Σi,j=0i,j=15|e(i,j)|)]]>(1)在該公式中，e(i，j)表示預(yù)測(cè)誤差，i表示宏塊中的行數(shù)，并且j表示在該宏塊中的列數(shù)。
在內(nèi)部編碼模式的情況下，可以通過(guò)對(duì)每個(gè)8×8塊計(jì)算該塊的像素亮度x(i，j)與該塊亮度的平均值(bl．a(chǎn)vr．lum．)之間的差的絕對(duì)值的和來(lái)確定相對(duì)能量，也就是說(shuō)
(2)平均值bl．a(chǎn)vr．lum．是按圖像編碼模式和幀編碼模式確定的。
應(yīng)當(dāng)指出，在實(shí)踐中已經(jīng)知道在中間宏塊的情況下利用參數(shù)MBdfd。但是，本發(fā)明人發(fā)現(xiàn)，由上述公式(2)所定義的參數(shù)MBdfd可以用于內(nèi)部編碼模式。換句話說(shuō)，為了確定編碼模式，采用新的參數(shù)。
還可將這個(gè)新的參數(shù)MBdfd用于在幀DCT模式和圖像DCT模式之間的選擇。公知的是，為了確定圖像DCT模式與幀DCT模式之間的選擇，按圖像模式和幀模式比較宏塊的局部活動(dòng)性被，并選擇提供最低局部活動(dòng)性的模式。當(dāng)圖像和幀局部活動(dòng)性相等時(shí)，本發(fā)明使得有可能優(yōu)化選擇。在這種情況下，比較上文所定義的能量參數(shù)MBdfd，并選擇使得參數(shù)MBdfd更小的圖像或幀DCT編碼模式。
最后，如果圖像和幀參數(shù)MBdfd相等，則優(yōu)先執(zhí)行圖像DCT編碼。
回顧局部活動(dòng)性的定義如下
其中
在這些公式中，x(i，j)以及i和j具有上述含義。但是，對(duì)于預(yù)測(cè)模式，在預(yù)測(cè)誤差的宏塊上計(jì)算MB_activ。
按照可以獨(dú)立于上述特征而應(yīng)用的本發(fā)明的另一個(gè)特征，對(duì)P和B圖像的所有可能模式確定如下參數(shù)MB_activ—α_Q，并且選擇使該參數(shù)最小的編碼模式。
MB_activ是宏塊的局部活動(dòng)性，Q表示量化間隔，而α是一個(gè)系數(shù)，它取決于用于加權(quán)量化矩陣的參數(shù)。在一個(gè)實(shí)例中，該參數(shù)α等于1。
通過(guò)從MB_activ中減去數(shù)值α_Q，數(shù)值(MB_activ—α_Q)提供對(duì)所述宏塊的潛在成本的一個(gè)估計(jì)。確實(shí)，為了確定MB_activ ，量化間隔Q越大，則宏塊的成本越低，因?yàn)樵诹炕^(guò)程中所采用的系數(shù)更小。
實(shí)際上，在量化過(guò)程中，MPEG2編碼標(biāo)準(zhǔn)采用量化間隔Q和用于DCT系數(shù)的所謂加權(quán)矩陣(其大小對(duì)應(yīng)于DCT的8×8)，通常，它使得有可能減小高頻系數(shù)的幅度。因此，DCT系數(shù)c(i，j)是通過(guò)把其幅度除以量化間隔Q與加權(quán)矩陣的對(duì)應(yīng)系數(shù)p(i，j)的數(shù)值的乘積而量化的。
一般說(shuō)來(lái)，中間以及內(nèi)部圖像加權(quán)矩陣是不一致的。另外，這些矩陣的內(nèi)容不由該標(biāo)準(zhǔn)所確定；因此它可以作為編碼器的規(guī)格的一個(gè)函數(shù)而改變。
在如下的一組內(nèi)部和中間加權(quán)矩陣的情況，數(shù)值1被選擇用于α內(nèi)部矩陣m_intra_1 中間矩陣m_inter_108 16 16 19 16 19 22 2216 17 17 19 18 19 20 2022 22 22 22 26 24 26 2720 20 22 21 22 21 22 2327 27 26 26 26 26 27 2723 24 23 24 23 25 25 2627 29 29 29 34 34 34 2925 26 24 25 26 26 27 2729 29 27 27 29 29 32 3228 27 27 26 28 29 29 3034 34 37 38 37 35 35 3429 29 28 31 31 32 31 3235 38 38 40 40 40 48 4830 33 34 33 34 33 36 3546 46 56 56 58 69 69 8336 35 38 39 38 41 40 43另一方面，在如下矩陣的結(jié)構(gòu)中亦然內(nèi)部矩陣m_intra_1 中間矩陣m_inter_208 16 16 19 16 19 22 2216 16 16 16 16 16 16 1622 22 22 22 26 24 26 2716 16 16 16 16 16 16 1627 27 26 26 26 26 27 2716 16 16 16 16 16 16 1627 29 29 29 34 34 34 2916 16 16 16 16 16 16 1629 29 27 27 29 29 32 3216 16 16 16 16 16 16 1634 34 37 38 37 35 35 3416 16 16 16 16 16 16 1635 38 38 40 40 40 48 4816 16 16 16 16 16 16 1646 46 56 56 58 69 69 8316 16 16 16 16 16 16 16選擇小于1的參數(shù)值α用于中間圖像編碼模式，例如0．875。這是因?yàn)榫仃噈_inter_2允許通過(guò)比矩陣m_inter_1多得多的DCT系數(shù)。按照這種結(jié)構(gòu)，可有如下關(guān)系在內(nèi)部圖像模式中α=α_intra=1，在中間圖像模式中α=α_inter=0．875按照一種具體實(shí)施例，在內(nèi)部編碼塊的情況下，如果對(duì)于一個(gè)塊而言，參數(shù)的block_activ—α．Q小于一個(gè)給定值，則給這個(gè)參數(shù)的block_activ—α．Q一個(gè)缺省值，比如對(duì)應(yīng)于內(nèi)部編碼宏塊的最小成本的四分之一。確實(shí)，在內(nèi)部模式下編碼的宏塊不可能是零成本的，這與中間圖像模式的情況不同。一個(gè)塊的實(shí)際最小成本對(duì)應(yīng)于該塊的平均值(DC)的編碼成本以及表示該塊的末端的代碼的編碼成本。因此—在4．2．0編碼結(jié)構(gòu)中，塊的最小成本的估計(jì)給予bl_intra_420_min(例如bl_intra_420_min=11)，—在4．2．2編碼結(jié)構(gòu)中，塊的最小成本的估計(jì)可以給予bl_intra_422_min(例如bl_intra_422_min=15)，當(dāng)然，這些最小值實(shí)際上可以作為用于編碼該系數(shù)的VLC表的類型的一個(gè)函數(shù)而變化，它們的塊尾代碼的長(zhǎng)度也變化。該方法的基本特點(diǎn)是使得內(nèi)部宏塊為零成本是不可想象的。
在本明的優(yōu)選實(shí)施例中，采用上述標(biāo)準(zhǔn)的結(jié)合，以如下方式對(duì)P和B圖像進(jìn)行處理
對(duì)每個(gè)宏塊從所有可能的編碼模式(包括內(nèi)部編碼)確定參數(shù)MBdfd的最小值，即MBdfdmin，并選擇該編碼模式使得MBdfd＜k．MBdfdmin，其中k是預(yù)定的因子，其在一個(gè)實(shí)例中它等于2．5。
為了確定DCT的類型(幀或圖像型)，進(jìn)行上述方法，也就是說(shuō)考慮局部活動(dòng)性參數(shù)MB_activ，并根據(jù)所述圖像或幀的MB_activ是否為更小，選擇圖像或幀DCT；如果這兩個(gè)參數(shù)相等，則根據(jù)該圖像或幀MBdfd參數(shù)是否為更小，選擇圖像或幀DCT。在參數(shù)MBdfd相等的情況下，選擇圖像DCT。
最后，為了從候選的編碼模式中選擇要采用的編碼模式，考慮如下參數(shù)Val=(MB_activ—α．Q)．MBdfd／MBdfdmin+Hdr_MB(3)而且，選擇提供參數(shù)Val的最小值的編碼模式。
在公式(3)中，Hdr_MB表示除參數(shù)CBP(編碼的塊模式)之外，宏塊的標(biāo)頭的所有參數(shù)。后者是可變長(zhǎng)編碼，它使得有可能把包含系數(shù)的塊的分布給予解碼器，假定，在中間圖像模式中，特定的塊可以為空白。確實(shí)，除了參數(shù)CBP之外，該標(biāo)頭的所有參數(shù)可以在編碼之前確定。可以由Hdr_MB中的預(yù)定值代替這個(gè)參數(shù)。
根據(jù)VLC代碼表，對(duì)于一個(gè)4．2．0宏塊(4個(gè)亮度塊，2個(gè)色度塊)的CBP代碼的長(zhǎng)度從3位到9位變化。該預(yù)定值例如可以為4。在4．2．2標(biāo)準(zhǔn)(4個(gè)亮度塊，4個(gè)色度塊)中，該值將略為更高(例如為6)。
對(duì)于所有有用的目的而言，這里回顧一個(gè)宏塊的標(biāo)頭包括如下參數(shù)MBA地址代碼(宏塊地址)，它表示該宏塊相對(duì)于最后的編碼宏塊的相對(duì)地址；編碼模式；量化間隔的數(shù)值；DCT的類型(圖像或幀)；以及各矢量。
對(duì)于最后一點(diǎn)，應(yīng)當(dāng)指出這些矢量的成本通常在幀模式中比在圖像模式中更大，由于在第一情況中(幀)，必須提供為在第二種情況(圖像)的兩倍那樣多的矢量。但是，在幀模式中的編碼成本不一定比在圖像模式中更高，因?yàn)楦魇噶康木幋a對(duì)于最后發(fā)送的矢量而不同。
在上述公式(3)中，最好給MBdfd分配一個(gè)加權(quán)因子，在中間編碼模式的情況下它等于1，而在內(nèi)部編碼模式的情況下大于1，這個(gè)加權(quán)因子可以表現(xiàn)為不同數(shù)值，這根據(jù)是否處理P圖像或B圖像而由經(jīng)驗(yàn)確定。
所述加權(quán)因子傳達(dá)這樣的事實(shí)，即在內(nèi)部模式中編碼宏塊的成本通常比在中間模式中編碼宏塊的成本更大。
如果MB_activ—α．Q=0，則該宏塊為空白或者未被編碼。
在這種情況下，任何時(shí)候下，參數(shù)val都限于標(biāo)頭Hdr_MB的成本。
另外，在宏塊被估計(jì)為潛在地為空白并且因此未被編碼的情況下(仍然在中間圖像模式中)，考慮被省略的宏塊(被忽略的宏塊)的結(jié)構(gòu)。這個(gè)結(jié)構(gòu)對(duì)應(yīng)于兩種特定的情況在P圖像情況下，該宏塊為空白，因此未被編碼，并且編碼模式為noMC，這是所謂的非補(bǔ)償模式(實(shí)際上，該矢量缺省值為零)。
第二種情況是B圖像宏塊為空白，因此未被編碼，并且運(yùn)動(dòng)矢量與以前發(fā)送的相同。
對(duì)于省略的宏塊而言，沒(méi)有關(guān)于相關(guān)宏塊的信息被發(fā)送。
因此，采用這個(gè)參數(shù)val，其中包括嘗試識(shí)別空白的宏塊，使得有可能加速未被編碼的宏塊，或者甚至被省略的宏塊，在“先驗(yàn)”方法的情況下，所有這些都是為了合理的成本／質(zhì)量比，也就是說(shuō)能夠?qū)崟r(shí)地設(shè)置。
應(yīng)當(dāng)指出，對(duì)于內(nèi)部類型的圖像通常必須單獨(dú)在幀DCT編碼和圖像DCT編碼之間作出選擇。為此目的，利用參數(shù)MB_activ，并且根據(jù)幀或圖像的MB_activ參數(shù)是否為最小，選擇幀或圖像編碼模式。
實(shí)驗(yàn)表明，與現(xiàn)有的處理方法相比，這種圖像壓縮處理方法對(duì)于相同的質(zhì)量有可能減小編碼成本，或者對(duì)于同樣的編碼成本提高質(zhì)量，而與本發(fā)明的實(shí)施例無(wú)關(guān)。
一般而言，本發(fā)明提供一種圖像壓縮處理方法，特別是MPEG2類型的壓縮處理方法，其中每個(gè)圖像宏塊10受到編碼選擇，對(duì)于每個(gè)宏塊而言，從幾種編碼類型中選擇編碼。為了選擇要應(yīng)用于該宏塊的編碼類型，確定如下參數(shù)MB_activ—α_Q，在該公式中MB_activ有如下值
其中
Q是量化間隔，α是預(yù)定的參數(shù)，被選擇的編碼模式對(duì)應(yīng)于所述參數(shù)MB_activ—α_Q的最小值。
根據(jù)一個(gè)實(shí)施例，系數(shù)α等于1。
另外，可以使α的數(shù)值取決于用在量化DCT系數(shù)的程序中的加權(quán)矩陣的內(nèi)容。
根據(jù)這種方法的一個(gè)實(shí)施例，在內(nèi)部(或中間)圖像模式下，α=1，中間(或內(nèi)部)圖像模式下所用的加權(quán)矩陣執(zhí)行比在內(nèi)部(或中間)模式下更低的加權(quán)，中間(或內(nèi)部)圖像模式下所用的系數(shù)α小于l。
根據(jù)一個(gè)實(shí)施例，對(duì)于每個(gè)塊(16)而言，在中間編碼模式下，當(dāng)該參數(shù)下降到預(yù)定的閾值時(shí)，對(duì)block_activ—α_Q給定一個(gè)預(yù)定值。
該預(yù)定值對(duì)應(yīng)于內(nèi)部編碼宏塊的最小成本的四分之一。
根據(jù)一個(gè)實(shí)施例，通過(guò)加權(quán)所計(jì)算的數(shù)值val能夠便于編碼“忽略宏塊”，在這種情況下，估計(jì)所述宏塊為潛在地為空白。這些情況在上文中已有說(shuō)明，即—在P圖像的情況下，編碼模式為noMC，即所謂的非補(bǔ)償模式(實(shí)際上該矢量缺省值為零)。
—在B圖像的情況下，運(yùn)動(dòng)矢量等于以前發(fā)送的矢量，也就是說(shuō)由最后編碼的宏塊所采用。
根據(jù)本發(fā)明一種改形，在val的表達(dá)式中，由可變的“Context”加權(quán)Hdr_MB的值val=MB_activ×MB_dfd／MB_dfd_min+Hdr_MB×Context該變量具有如下數(shù)值1)如果MB_val_avg≤threshold_val_avg并且MB_mean_activ≤threshold_mean_activContext=(MB_val_avg／256)×(MB_mean_activ／16)所述的閾值為預(yù)定的閾值。
2)否則Context=1因此該加權(quán)取決于兩個(gè)參數(shù)—源宏塊的平均活動(dòng)性該數(shù)值使得通過(guò)估計(jì)要被編碼的宏塊的平均活動(dòng)性有可能考慮到該Context。以如下方式計(jì)算
—源宏塊的平均亮度值在平均活動(dòng)性的情況中，該信息用于估計(jì)當(dāng)前宏塊所在的環(huán)境，以使得判定標(biāo)準(zhǔn)最佳化。僅僅對(duì)亮度塊計(jì)算該平均值
MB_src(i，j)對(duì)應(yīng)于在宏塊MB中的像素(i，j)的亮度。更加一般地來(lái)說(shuō)，所選擇的加權(quán)與源宏塊的平均亮度值成正比，并且與該源宏塊的平均活動(dòng)性成反比。這使得有可能考慮到宏塊的活動(dòng)性以及該宏塊的平均亮度。
在均勻宏塊的情況下，也就是說(shuō)對(duì)于MB_activ的小數(shù)值而言，或者在量化間隔較大的情況下，與標(biāo)頭的成本相比，表達(dá)式MB_activ—α．Q較小。于是，所述算法有利于根據(jù)在先圖像或幀或者在后圖像或幀的預(yù)測(cè)模式，對(duì)于成本Hdr_MB較高的幀或圖像雙向預(yù)測(cè)模式不利。
現(xiàn)在，雙向預(yù)測(cè)模式對(duì)預(yù)測(cè)誤差求平均，并且提高主觀質(zhì)量。這是因?yàn)?，在源宏塊的平均亮度值低于預(yù)定閾值的情況下，通過(guò)利用標(biāo)頭成本的加權(quán)，參數(shù)val的數(shù)值對(duì)于雙向預(yù)測(cè)模式降低，以便有利于該模式，也即DFDmin的選擇。
在宏塊的低平均活動(dòng)性和低平均亮度情況下，由于均勻黑區(qū)域的存在，該塊的影響最為可見(jiàn)。于是，執(zhí)行加權(quán)，以有利于雙向編碼，這有可能限制人為編碼的類型。
如果宏塊的平均活動(dòng)性較高或者至少大于預(yù)定的閾值，則存在紋理化的區(qū)域，并且塊的影響最為不可見(jiàn)，而且無(wú)需有利于雙向模式(Context=1)。這里應(yīng)當(dāng)指出的是，確實(shí)考慮到宏塊的平均編碼用于加權(quán)，而不是考慮宏塊的活動(dòng)性。因?yàn)榧词箖H僅一個(gè)或一些像素在亮度上相對(duì)于該宏塊的其它像素具有大的差別，宏塊的活動(dòng)性可能較高。
權(quán)利要求
1．一種圖像壓縮處理方法，特別是MPEG2類型的壓縮處理方法，其中每個(gè)圖像宏塊(10)受到編碼選擇，對(duì)每個(gè)宏塊而言，從幾種類型的編碼中選擇編碼類型，其特征在于，為了選擇要應(yīng)用于所述宏塊的編碼類型，確定如下參數(shù)MB_activ—α_Q，在該公式中MB_activ對(duì)應(yīng)于宏塊的能量或者活動(dòng)性，Q為量化間隔，并且α為預(yù)定參數(shù)，所選擇的編碼模式取決于所述參數(shù)MB_activ—α_Q的數(shù)值。
2．根據(jù)權(quán)利要求1所述的方法，其特征在于，宏塊的活動(dòng)性由如下的值確定
其中
其中公式x(i，j)表示在每個(gè)塊的i行和j列的點(diǎn)的亮度。
3．根據(jù)權(quán)利要求1所述的方法，其特征在于，被選擇的編碼模式是對(duì)應(yīng)于所述參數(shù)MB_activ—α_Q的最小值的模式。
4．根據(jù)權(quán)利要求3所述的方法，其特征在于，所述系數(shù)α等于1。
5．根據(jù)權(quán)利要求3所述的方法，其特征在于，所述α的值取決于用在量化DCT系數(shù)的程序中的加權(quán)矩陣的內(nèi)容。
6．根據(jù)權(quán)利要求5所述的方法，其特征在于，在內(nèi)部(或中間)圖像模式下，α=1，并且中間(或內(nèi)部)圖像模式下所用的加權(quán)矩陣執(zhí)行比內(nèi)部(或中間)模式下低的加權(quán)，中間(或內(nèi)部)圖像模式下所用的系數(shù)α小于1。
7．根據(jù)權(quán)利要求2至6中任意一項(xiàng)所述的方法，其特征在于，對(duì)于每個(gè)塊(16)，在中間編碼模式下，當(dāng)所述參數(shù)下降到低于預(yù)定的閾值時(shí)，對(duì)block_activ—α_Q給定一個(gè)預(yù)定值。
8．根據(jù)權(quán)利要求7所述的方法，其特征在于，所述預(yù)定值對(duì)應(yīng)于內(nèi)部編碼宏塊的最小成本的四分之一。
9．根據(jù)權(quán)利要求1或2所述的方法，其特征在于，對(duì)于相關(guān)的編碼而言，所述編碼模式的選擇還取決于編碼標(biāo)頭Hdr_MB的成本。
10．根據(jù)權(quán)利要求9所述的方法，其特征在于，對(duì)于中間編碼模式來(lái)說(shuō)，所述標(biāo)頭的編碼成本不考慮CBP參數(shù)。
11．根據(jù)權(quán)利要求10所述的方法，其特征在于，根據(jù)要被編碼的圖像的標(biāo)準(zhǔn)，所述CBP參數(shù)被預(yù)定數(shù)值所代替。
12．根據(jù)權(quán)利要求9所述的方法，其特征在于，從各種編碼模式中選擇的編碼模式是一種提供參數(shù)val的最小值的編碼方式，該參數(shù)對(duì)應(yīng)于表達(dá)式Val=(MBactiv—α．Q)×MBdfd／MBdfdmin+Hdr_MB，該公式中，MB_activ表示宏塊的活動(dòng)性，Q表示量化間隔，α是常量系數(shù)，Hdr_MB表示對(duì)于相關(guān)的編碼模式而言標(biāo)頭的編碼成本，MBdfd表示宏塊的能量參數(shù)，該參數(shù)MBdfd對(duì)于中間編碼有如下的值MBdfd=(Σi,j=0i,j=15|e(i,j)|)]]>該公式中的i和j表示每個(gè)點(diǎn)的行數(shù)和列數(shù)，而e(i，j)表示對(duì)于相應(yīng)點(diǎn)的亮度預(yù)測(cè)誤差；在內(nèi)部模式下，該能量參數(shù)具有如下數(shù)值
該公式中的x(i，j)表示每個(gè)塊的i行和j列中的點(diǎn)的亮度，而bl．a(chǎn)vt．lum表示每個(gè)塊的亮度平均值。
13．根據(jù)權(quán)利要求9所述的方法，其特征在于，所述參數(shù)MBdfd對(duì)于內(nèi)部編碼模式中比對(duì)于中間編碼中分配更高的系數(shù)。
14．根據(jù)權(quán)利要求13所述的方法，其特征在于，在內(nèi)部模式情況下，被分配給參數(shù)MBdfd的系數(shù)取決于要被編碼的圖像P或B的特性。
15．根據(jù)權(quán)利要求9至14中任一項(xiàng)所述的方法，其特征在于，當(dāng)MB_activ—α．Q下降到低于預(yù)定閾值時(shí)，數(shù)值MB_activ被以缺省值分配給量MB_activ—α．Q。
16．根據(jù)權(quán)利要求15所述的方法，其特征在于，所述缺省值對(duì)應(yīng)于內(nèi)部編碼的宏塊的最小編碼成本的四分之一。
17．根據(jù)權(quán)利要求9至16中任一項(xiàng)所述的方法，其特征在于，所述圖像或者幀DCT編碼模式被選擇作為局部活動(dòng)性的數(shù)值的一個(gè)函數(shù)，被選擇的DCT編碼模式對(duì)應(yīng)于局部活動(dòng)性更小的情況，在相等的情況下，比較幀和圖像能量參數(shù)MBdfd，并選擇參數(shù)MBdfd更小的情況。
18．根據(jù)權(quán)利要求17所述的方法，其特征在于，在參數(shù)MBdfd相等的情況下，選擇圖像DCT模式。
19．根據(jù)權(quán)利要求12所述的方法，其特征在于，當(dāng)必須編碼一個(gè)“忽略的宏塊”的概率較大時(shí)，也就是說(shuō)，對(duì)于P型圖像而言，如果用所謂的非補(bǔ)償“no MC”編碼模式，或者對(duì)于B型圖像而言，如果運(yùn)動(dòng)矢量與由最后編碼的宏塊所采用的矢量相同，則數(shù)值val下降一個(gè)預(yù)定的值。
20．根據(jù)權(quán)利要求12所述的方法，其特征在于，當(dāng)源宏塊的平均活動(dòng)性
以及它的平均值
都低于預(yù)定閾值時(shí)，在“val”的表達(dá)式中Hdr_MB項(xiàng)被加權(quán)，以便于雙向預(yù)測(cè)模式，其中表達(dá)式MB_src(i，j)對(duì)應(yīng)于在宏塊MB中像素(i，j)的亮度。
21．根據(jù)權(quán)利要求20所述的方法，其特征在于，所述加權(quán)與源宏塊的平均值成正比，并與所述源宏塊的平均活動(dòng)性成反比。
全文摘要
一種圖像壓縮處理方法,特別是一種MPEG2型壓縮處理方法,其中每個(gè)圖像宏塊(10)受到編碼選擇,對(duì)每個(gè)宏塊而言,從幾種類型的編碼中選擇編碼類型。為了選擇要應(yīng)用于所述宏塊的編碼類型,確定參數(shù)MB activ－α Q,在該公式:MBactiv的數(shù)值為1式,其中block activ為2式,Q為量化間隔,α為預(yù)定參數(shù),如1。所選擇的編碼模式對(duì)應(yīng)于參數(shù)MB activ－α Q的最小值。
文檔編號(hào)H03M7/30GK1278693SQ0010964
公開(kāi)日2001年1月3日申請(qǐng)日期2000年6月19日優(yōu)先權(quán)日1999年6月18日
發(fā)明者多米尼克·托羅, 皮埃爾·魯埃洛申請(qǐng)人:湯姆森多媒體公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：多米尼克.托羅;皮埃爾.魯埃洛
技術(shù)所有人：湯姆森多媒體公司
我是此專利的發(fā)明人

上一篇：鍵輸入設(shè)備中處理多鍵的方法
上一篇：具有測(cè)試電路的σ-δadc的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、田老師：1: 建筑節(jié)能綠色建筑能耗的模擬與檢測(cè)(EnergyPlus)；建筑碳排放和生命周期評(píng)價(jià)；城市微氣候、建筑能耗與太陽(yáng)能技術(shù)的相互影響；地理信息系統(tǒng)(GIS)和空間回歸方法用于城市建筑能耗分析；不確定性、敏感性分析和機(jī)器學(xué)習(xí)方法應(yīng)用于建筑能耗分析(R)；貝葉斯方法用于城市和單體建筑能源分析 2: 過(guò)
2、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
3、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、周老師：1.智能機(jī)器人技術(shù) 2.智能檢測(cè)與控制技術(shù) 3.機(jī)構(gòu)運(yùn)動(dòng)學(xué)與動(dòng)力學(xué) 4.機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像壓縮相關(guān)技術(shù)

圖像壓縮算法相關(guān)技術(shù)

圖像壓縮編碼相關(guān)技術(shù)

圖像壓縮技術(shù)相關(guān)技術(shù)

jpeg圖像壓縮算法代碼相關(guān)技術(shù)

dct圖像壓縮相關(guān)技術(shù)

圖像壓縮標(biāo)準(zhǔn)相關(guān)技術(shù)

哈夫曼編碼圖像壓縮相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖像壓縮處理方法