專利名稱::用于圖像和視頻壓縮的正交整數(shù)變換方法用于圖像和視頻壓縮的正交整數(shù)變換方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及信息
技術(shù)領(lǐng)域:
,具體涉及一種用于數(shù)字圖像和數(shù)字視頻壓縮編碼變換方法。
背景技術(shù):
:隨著計(jì)算機(jī)、微電子、信息處理、通信以及激光等技術(shù)的迅猛發(fā)展,集圖文、聲音、圖像于一體的多媒體技術(shù)更是迅速滲透到計(jì)算機(jī)、通信、廣播電視以及消費(fèi)娛樂業(yè),在上述各領(lǐng)域中,越來越多地采用通過數(shù)字信號(hào)傳輸之?dāng)?shù)字設(shè)備。數(shù)字信號(hào)有很多優(yōu)點(diǎn),但當(dāng)模擬信號(hào)數(shù)字化后其頻帶會(huì)大大加寬,如一路6MHz的普通電視信號(hào)數(shù)字化后,其數(shù)碼率將高達(dá)167Mbps,這對儲(chǔ)存器容量和傳輸帶寬要求很大,從而使數(shù)字信號(hào)失去實(shí)用價(jià)值。數(shù)字壓縮技術(shù)很好地解決了上述困難,壓縮后信號(hào)所占用的頻帶大大低于原模擬信號(hào)的頻帶。因此說,數(shù)字壓縮編碼技術(shù)是使數(shù)字信號(hào)走向?qū)嵱没年P(guān)鍵技術(shù)之一,數(shù)字圖像和數(shù)字視頻之所以能傳輸和保存的一個(gè)關(guān)鍵因素在于數(shù)字圖像和數(shù)字視頻的這種可壓縮性。這種壓縮是以降低圖像或視頻的質(zhì)量為前提的,以犧牲圖像或視頻的質(zhì)量換取寶貴的存儲(chǔ)空間或傳輸帶寬。當(dāng)然,這種壓縮不能過度,以致圖像或視頻的視覺效果變得不可接受,這就要求在一定的質(zhì)量條件下,不斷提高壓縮效率。此外,壓縮行為應(yīng)該是規(guī)范的,這樣將有利于信息的傳輸與共享。為了規(guī)范這種壓縮編碼行為,目前出臺(tái)了不少國際標(biāo)準(zhǔn),如圖像壓縮標(biāo)準(zhǔn)JPEG(國際標(biāo)準(zhǔn)ISO/ICEIS10918,大量使用在數(shù)碼相機(jī)和國際互聯(lián)網(wǎng)),視頻壓縮標(biāo)準(zhǔn)MPEG-1(國際標(biāo)準(zhǔn)ISO/ICE11172,在VCD里使用)、MPEG-2(國際標(biāo)準(zhǔn)ISO/ICE13818,使用在DVD和數(shù)字電視里)和MPEG-4(國際標(biāo)準(zhǔn)ISO/ICE14496,使用在流媒體技術(shù)中)等。這些標(biāo)準(zhǔn)除了規(guī)范了壓縮行為外,壓縮效率也在不斷提高。如MPEG-2的壓縮效率高于MPEG-1,MPEG-4的壓縮效率高于MPEG-2。在這些壓縮標(biāo)準(zhǔn)和技術(shù)里,有一個(gè)通用的方法,那就是使用了正交變換技術(shù)。目前,在JPEG、MPEG-1、MPEG-2和MPEG-4里,所用的正交變換方法都是離散余弦變換(DiscreteCosineTransformation,簡稱DCT)。DCT是經(jīng)典譜分析常采用的工具,它的問世,對數(shù)字圖像和視頻壓縮技術(shù)而言具有里程碑式的意義。它是先將整體圖像分成NXN像素塊,然后對NXN像素塊逐一進(jìn)行離散余弦變換。然后舍棄對視覺不敏感的頻率信息,只保留最為重要的數(shù)據(jù)信息。這樣,壓縮過程對圖像細(xì)膩平滑程度方面必然有所損失。人們也試圖研究和尋找其它更好更有效的正交變換來取代DCT,如傅立葉變換,離散正弦變換,哈達(dá)姆變換等等??蛇@些變換在性能上都無法超越DCT,甚至相差還較遠(yuǎn)。理論上也有一些證據(jù)證明DCT"幾乎是最優(yōu)變換"。近幾年來,由于手持設(shè)備應(yīng)用和普及,壓縮算法要求進(jìn)一步簡化以節(jié)省有關(guān)芯片的成本和功耗。因此,整數(shù)變換技術(shù)和方法取得了不少進(jìn)展,但這些整數(shù)變換也有一些不足有的整數(shù)變換的計(jì)算性能還有改進(jìn)空間,尤其在反變換上,目前的整數(shù)變換計(jì)算效率還不高。如在最新的國際標(biāo)準(zhǔn)11.264里,建議采用一種如下近似DCT的整數(shù)變換D1:、111111「121063-3-6-10-1221-l-2-2-l12D=10-3-12-66123-1011-1-111-l-l1°6-12310-10-312—61一22-l-12_213—610-1212-106-3上述矩陣"的計(jì)算性能雖然得到了一定的改善,但并未見到有其壓縮性能超過DCT的報(bào)道。本申請人曾提出下列變換矩陣D2:D2=11111111一7一5-3_1135771—3一5一5一317-7573-3—7一577-13-399-3-137一723_17-151517-2371-59-5—59一51一l7一2135—3521一71但該矩陣D2的編碼性能與DCT各有所長低碼率時(shí),優(yōu)于DCT;而在高碼率時(shí),DCT則優(yōu)于該矩陣D2。目前,現(xiàn)有的整數(shù)變換的技術(shù)思路還是尋求DCT的近似矩陣,整數(shù)化后性能有一定程度的下降。因此,需要新的發(fā)明思路進(jìn)一步改善整數(shù)變換技術(shù)。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種用于圖像和視頻壓縮的正交整數(shù)變換方法,其壓縮性能全面優(yōu)于離散余弦變換。為達(dá)到上述發(fā)明目的,本發(fā)明所提出的技術(shù)方案是一種用于圖像和視頻壓縮的正交整數(shù)變換方法,其是先將圖像分成8X8的小塊M,然后用8X8正交變換矩陣P對每一個(gè)小塊M作二維變換,用于壓縮編碼,得到變換系數(shù)矩陣N,再對N的每一個(gè)系數(shù)量化后熵編碼,其特征在于所述8X8正交變換矩陣P為尸=11111111義2一jc2乂^3凡y3z2z3一Z2一z'1_i一l11_1一l1一5少2一乂少3一h一X4x3—X2x2_x37其中<formula>formulaseeoriginaldocumentpage8</formula>以及<formula>formulaseeoriginaldocumentpage8</formula>且XpX2,X3,X4,乂,y2,乂,乂,Zl,Z2,Z3,^4都是整數(shù)。本發(fā)明基于特殊整數(shù)矩陣類的構(gòu)造,設(shè)計(jì)了一個(gè)新的8X8正交整數(shù)變換矩陣類,可形成無限個(gè)整數(shù)矩陣,通過一定條件的約束,在一個(gè)優(yōu)化數(shù)學(xué)模型下的作用下,在成千上萬個(gè)矩陣?yán)?,產(chǎn)生最優(yōu)整數(shù)變換。在變換的計(jì)算效率上,達(dá)到了理論上的最優(yōu)。由于本發(fā)明是在幾萬個(gè)矩陣?yán)锿ㄟ^優(yōu)化程序選出來的,試驗(yàn)證明,用這個(gè)正交變換壓縮圖像和視頻,其壓縮性能己全面優(yōu)于DCT。圖1為本發(fā)明Pi之第二行的波形圖;圖2為本發(fā)明P2之第二行的波形圖;圖3為現(xiàn)有技術(shù)中仏之第二行的波形圖;圖4為現(xiàn)有技術(shù)中D2之第二行的波形圖;圖5為現(xiàn)有技術(shù)中DCT之第二行的波形圖。具體實(shí)施方式在圖像和視頻壓縮
技術(shù)領(lǐng)域:
中,圖像壓縮是最核心的基礎(chǔ),正交變換方法是圖像和視頻壓縮技術(shù)中的最核心的技術(shù)。在圖像壓縮標(biāo)準(zhǔn)JPEG(國際標(biāo)準(zhǔn)ISO/ICEIS10918)和視頻壓縮標(biāo)準(zhǔn)MPEG-l(國際標(biāo)準(zhǔn)ISO/ICE11172)、MPEG-2(國際標(biāo)準(zhǔn)ISO/ICE13818)以及MPEG-4(國際標(biāo)準(zhǔn)ISO/ICE14496)里,目前,所采用的正交變換方法是8X8的離散余弦變換(DCT,即DiscreteCosineTransform)。正交整數(shù)矩陣的概念為如果A的所有元素都是整數(shù),且AAT是一個(gè)對角矩陣,就稱A為正交整數(shù)矩陣,在不引起混淆的情況下,也簡稱為整數(shù)矩陣。這里,"AT"表示矩陣A的轉(zhuǎn)置。最簡單的整數(shù)矩陣為著名的Walsh-Hadamard矩陣,它的元素為1或-1,所有行的范數(shù)都相等。這個(gè)結(jié)論反過來也是對的,即如果一個(gè)整數(shù)矩陣所有行的范數(shù)都相等,且除一行外,其它行均有一階消失矩(即這行的元素和為0),則這個(gè)正交整數(shù)矩陣為Walsh-Hadamard矩陣。就計(jì)算效率而言,Walsh-Hadamard矩陣是最高的,主要得益于它的行的范數(shù)都是同一個(gè)數(shù)。可以驗(yàn)證,矩陣Di中的行范數(shù)有3個(gè)不同的數(shù),而矩陣D2的行范數(shù)有6個(gè)不同的數(shù)。一般說來,行范數(shù)越少,計(jì)算效率越高,尤其對于反變換。為了理解這一點(diǎn),我們考慮矩陣R和矩陣D,的反變換形式分別為+C2)/2+;^(15C3+12c4+8c5+3c6+14c7+5c8》,(1)和*+c2)/2+^(12c3+10c4+6c5+3c6)+*(c7+2cs))。(2)式(1)和(2)中的Ci為整數(shù)。很明顯,對應(yīng)于矩陣Du式(2)比對應(yīng)于P,之式(1)的計(jì)算要復(fù)雜,因?yàn)橐?個(gè)除法,而(l)中只需一個(gè)除法。注意,在二維變換里,變成了2,從而2的除法變成移位運(yùn)算。D2的反變換更復(fù)雜一些。本發(fā)明提出了一種8X8正交整數(shù)變換矩陣P,其為<formula>formulaseeoriginaldocumentpage10</formula>其中<formula>formulaseeoriginaldocumentpage10</formula>以及<formula>formulaseeoriginaldocumentpage10</formula>且<formula>formulaseeoriginaldocumentpage10</formula>都是整數(shù)。上述整數(shù)變換矩陣p中行順序不同者,為與上述整數(shù)矩陣p之等效變換;矩陣p中行相差一個(gè)因子者,為與上述整數(shù)矩陣p之等效變換。此兩種情形具有等效的編碼效果,這是因?yàn)?,變換后的數(shù)據(jù)只是改變了位置和符號(hào),大小沒有改變。符號(hào)是單獨(dú)編碼的,改變符號(hào)對編碼效率沒有影響。對變化了的位置,可調(diào)整到同原來的一樣。當(dāng)然,一般會(huì)對矩陣的行有一個(gè)排列法。一行中元素符號(hào)改變的次數(shù)稱為消失矩的階數(shù)。一般根據(jù)消失矩的階數(shù)由低到高排列矩陣的行。如在上面的矩陣p:中,消失矩的階數(shù)依次為0,1,2,3,4,5,6,7。上述正交矩陣設(shè)計(jì)的主要思想之一是使矩陣p的行范數(shù)為2個(gè),從而在最少的計(jì)算復(fù)雜性的同時(shí),尋求性能最優(yōu)者。這是因?yàn)?,矩陣類p里的整數(shù)矩陣有無限個(gè),其計(jì)算性能都能達(dá)到理論上的最優(yōu)(最多兩個(gè)行范數(shù)),但并不是所有矩陣都有好的壓縮性能。如何選出好的矩陣是一個(gè)目前圖像和視頻壓縮技術(shù)中的難題。一個(gè)可行的辦法是,建立一個(gè)數(shù)學(xué)模型,將大部分矩陣排除,留下少量的較優(yōu)矩陣,用實(shí)驗(yàn)的辦法確定最優(yōu)矩陣。如果限制、,x2,a,x,,乂,^,A,;vv^,&,^的絕對值不超過20,矩陣P將有4000多個(gè);如果限制其絕對值不超過30,矩陣P則有20000多個(gè)。在圖像和視頻壓縮中,通過變換將空間域變換成頻率域,然后對頻域系數(shù)編碼。頻域系數(shù)越小,越有利于編碼。用這個(gè)原理,我們建立一個(gè)基于信號(hào)的模型。具體說來,對矩陣P中的每個(gè)A,它的標(biāo)準(zhǔn)正交矩陣記為B.取一幅512X512典型測試圖I,將I劃分為4096個(gè)8X8數(shù)據(jù)塊Ii,然后采取下面的步驟St印1:計(jì)算g=[^〗=5/,5r;St印2:計(jì)算St印3:計(jì)算MCP,j)=2>,.這樣,對圖像I,我們能解出巧"(M(戶,辱(3)一般說來,式(3)依賴于圖像I。然而,如果圖像比較典型,(3)的解應(yīng)該有一致性,即對于不同的圖像,(3)的最優(yōu)解在一個(gè)小的集合里面。這樣,我們可以得到下列矩陣<formula>formulaseeoriginaldocumentpage11</formula><formula>formulaseeoriginaldocumentpage12</formula>我們對多幅典型的測試圖,如Lena,Barbara,Goldhill等,遍歷4000多個(gè)整數(shù)解,最優(yōu)解一般集中在矩陣P,和P2上,有些圖像&最優(yōu),P2次優(yōu);而對于另外的圖像,P2最優(yōu),P,次優(yōu)。特別地,我們對Lena圖像遍歷了20000多個(gè)矩陣,最優(yōu)解始終是P,。所以,我們用R作具體實(shí)例,來進(jìn)行壓縮測試。對于變換矩陣,第二行的性質(zhì)尤其重要,越光滑越好,它幾乎決定了變換的性能。如圖l、圖2、圖3、圖4、圖5所示,我們給出了對應(yīng)的R、P2、D"D2和DCT的波形圖,其光滑程度一目了然。從上述波形圖也可以看出,h和P2更相似于DCT。將上述被壓縮的圖像數(shù)據(jù)塊M(8X8矩陣),用P中的正交變換對這個(gè)數(shù)據(jù)塊作二維變換,所得到的變換系數(shù)矩陣N為N=PMPT,以便完成后續(xù)的壓縮編碼過程。其中,"PT"為P的轉(zhuǎn)置矩陣。對經(jīng)過熵解碼和反量化等處理后的數(shù)據(jù)塊》,用所述8X8正交整數(shù)變換矩陣P正交變換,其二維反變換恢復(fù)圖像數(shù)據(jù)塊為其中,"pT"表示p的轉(zhuǎn)置矩陣。實(shí)施例我們用MPEG-4的一個(gè)開放源代碼的驗(yàn)證模型XVID(Ver.1.1.0,可以通過互聯(lián)網(wǎng)下載)來測試R的視頻壓縮性能。為了簡化試驗(yàn),我們用其基本模型(baseline),使用"IPPIPPIPP"幀結(jié)構(gòu),熵編碼采用Huffman編碼。在XVID里,我們只改變兩項(xiàng)內(nèi)容以測驗(yàn)R的壓縮編碼性能(1)用矩陣P,的標(biāo)準(zhǔn)正交形式代替DCT;(2)兩個(gè)量化矩陣調(diào)整為下列兩個(gè)矩陣h和P4:<table>tableseeoriginaldocumentpage13</column></row><table>其中P3為幀間量化矩陣,P4為幀內(nèi)量化矩陣。從而形成一個(gè)新的視頻壓縮編碼解決方案。通過和原始的XVID方案對比,就能比較矩陣P,和DCT性能的優(yōu)劣。在兩個(gè)方案里,Huffman碼表都是相同的。常用的5個(gè)視頻片斷,F(xiàn)oreman,Akiyo,Motheranddaughter,CoastGuard和Mobile,被用于測試試驗(yàn)。這些視頻片斷都是300幀長,43.5MB大小,每幀大小是352x288x1.5bytes,YUV分量,播放速度為25幀/秒。測試結(jié)果:我們對5個(gè)視頻序列在4個(gè)碼率作了編碼測試,然后解碼后計(jì)算每一幀Y,U和V分量的峰值信噪比(PSNR),最后求平均值。所有的實(shí)驗(yàn)結(jié)果列在Tab.1-Tab.5.我們看到,幾乎所有視頻在所有的碼率下,新方案都超過了原始的XVID方案。尤其在低碼率下,優(yōu)勢更明顯。這些測試結(jié)果說明R的壓縮編碼性能較DCT的有顯著改善。表1:實(shí)驗(yàn)結(jié)果一ForemanDCT方案碼率(Kbps)PSNR(dB)均值碼率(Kbps)PSNR(dB)均值YUVYUV60737.8939.6542.1161237.5239.4341.6729834.9037.4640.2828734.3837.0339.6222533.2335.5337.8722732.3434.8237.0715631.9533.6136.0215731.5333.1735.54表2:實(shí)驗(yàn)結(jié)果""AkiyoDCT方案碼率(Kbps)PSNR(dB)均值碼率(Kbps)PSNR(dB)均1直YUVYUV60141.2442.4744.3960441.0142.3344.1731838.1540.6742.5432137.8540.2942.3819536.2639.4141.2319035.8939.1240.9015535.2438.79肌8215934.6538.3440.33表3:實(shí)驗(yàn)結(jié)果一CoastGuardDCT方案碼率(Kbps)PSNR(dB)均值碼率(Kbps)PSNR(dB)均1直YUVYUV58138.8840.5343.3758738.5940.2543.1630335.0138.1540.8130234.7337.9340.3619333.6537.1640.2719433.3436.7639.8515631.8634.6038.6114931.1734.0237.99表4:實(shí)驗(yàn)結(jié)果""Mobile<table>tableseeoriginaldocumentpage15</column></row><table>以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種較佳的實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。權(quán)利要求1、一種用于圖像和視頻壓縮的正交整數(shù)變換方法,其是先將圖像分成8×8的小塊M,然后用8×8正交變換矩陣P對每一個(gè)小塊M作二維變換,用于壓縮編碼,得到變換系數(shù)矩陣N,再對N的每一個(gè)系數(shù)量化后熵編碼,其特征在于所述8×8正交變換矩陣P為<mathsid="math0001"num="0001"><math><![CDATA[<mrow><mi>P</mi><mo>=</mo><mfencedopen='['close=']'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><msub><mi>x</mi><mn>1</mn></msub></mtd><mtd><msub><mi>x</mi><mn>2</mn></msub></mtd><mtd><msub><mi>x</mi><mn>3</mn></msub></mtd><mtd><msub><mi>x</mi><mn>4</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>4</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>3</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>2</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>y</mi><mn>1</mn></msub></mtd><mtd><msub><mi>y</mi><mn>2</mn></msub></mtd><mtd><msub><mi>y</mi><mn>3</mn></msub></mtd><mtd><msub><mi>y</mi><mn>4</mn></msub></mtd><mtd><msub><mi>y</mi><mn>4</mn></msub></mtd><mtd><msub><mi>y</mi><mn>3</mn></msub></mtd><mtd><msub><mi>y</mi><mn>2</mn></msub></mtd><mtd><msub><mi>y</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>z</mi><mn>1</mn></msub></mtd><mtd><msub><mi>z</mi><mn>2</mn></msub></mtd><mtd><msub><mi>z</mi><mn>3</mn></msub></mtd><mtd><msub><mi>z</mi><mn>4</mn></msub></mtd><mtd><msub><mrow><mo>-</mo><mi>z</mi></mrow><mn>4</mn></msub></mtd><mtd><mo>-</mo><msub><mi>z</mi><mn>3</mn></msub></mtd><mtd><msub><mrow><mo>-</mo><mi>z</mi></mrow><mn>2</mn></msub></mtd><mtd><mo>-</mo><msub><mi>z</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mo>-</mo><msub><mi>z</mi><mn>4</mn></msub></mtd><mtd><msub><mi>z</mi><mn>3</mn></msub></mtd><mtd><mo>-</mo><msub><mi>z</mi><mn>2</mn></msub></mtd><mtd><msub><mi>z</mi><mn>1</mn></msub></mtd><mtd><mo>-</mo><msub><mi>z</mi><mn>1</mn></msub></mtd><mtd><msub><mi>z</mi><mn>2</mn></msub></mtd><mtd><mo>-</mo><msub><mi>z</mi><mn>3</mn></msub></mtd><mtd><msub><mi>z</mi><mn>4</mn></msub></mtd></mtr><mtr><mtd><msub><mi>y</mi><mn>2</mn></msub></mtd><mtd><mo>-</mo><msub><mi>y</mi><mn>1</mn></msub></mtd><mtd><mo>-</mo><msub><mi>y</mi><mn>4</mn></msub></mtd><mtd><msub><mi>y</mi><mn>3</mn></msub></mtd><mtd><msub><mi>y</mi><mn>3</mn></msub></mtd><mtd><mo>-</mo><msub><mi>y</mi><mn>4</mn></msub></mtd><mtd><mo>-</mo><msub><mi>y</mi><mn>1</mn></msub></mtd><mtd><msub><mi>y</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><mo>-</mo><msub><mi>x</mi><mn>4</mn></msub></mtd><mtd><msub><mi>x</mi><mn>3</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>2</mn></msub></mtd><mtd><msub><mi>x</mi><mn>1</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>1</mn></msub></mtd><mtd><msub><mi>x</mi><mn>2</mn></msub></mtd><mtd><mo>-</mo><msub><mi>x</mi><mn>3</mn></msub></mtd><mtd><msub><mi>x</mi><mn>4</mn></msub></mtd></mtr></mtable></mfenced></mrow>]]></math></maths>其中<mathsid="math0002"num="0002"><math><![CDATA[<mrow><mfencedopen='{'close=''><mtable><mtr><mtd><msub><mi>y</mi><mn>1</mn></msub><mo>=</mo><mo>-</mo><msub><mi>y</mi><mn>4</mn></msub></mtd></mtr><mtr><mtd><msub><mi>y</mi><mn>2</mn></msub><mo>=</mo><mo>-</mo><msub><mi>y</mi><mn>3</mn></msub></mtd></mtr><mtr><mtd><msub><mi>x</mi><mn>1</mn></msub><msub><mi>z</mi><mn>1</mn></msub><mo>+</mo><msub><mi>x</mi><mn>2</mn></msub><msub><mi>z</mi><mn>2</mn></msub><mo>+</mo><msub><mi>x</mi><mn>3</mn></msub><msub><mi>z</mi><mn>3</mn></msub><mo>+</mo><msub><mi>x</mi><mn>4</mn></msub><msub><mi>z</mi><mn>4</mn></msub><mo>=</mo><mn>0</mn></mtd></mtr><mtr><mtd><mo>-</mo><msub><mi>x</mi><mn>1</mn></msub><msub><mi>z</mi><mn>4</mn></msub><mo>+</mo><msub><mi>x</mi><mn>2</mn></msub><msub><mi>z</mi><mn>3</mn></msub><mo>-</mo><msub><mi>x</mi><mn>3</mn></msub><msub><mi>z</mi><mn>2</mn></msub><mo>+</mo><msub><mi>x</mi><mn>4</mn></msub><msub><mi>z</mi><mn>1</mn></msub><mo>=</mo><mn>0</mn></mtd></mtr></mtable></mfenced><mo>.</mo></mrow>]]></math></maths>以及<mathsid="math0003"num="0003"><math><![CDATA[<mrow><msubsup><mi>x</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>x</mi><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>x</mi><mn>3</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>x</mi><mn>4</mn><mn>2</mn></msubsup><mo>=</mo><msubsup><mi>z</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>z</mi><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>z</mi><mn>3</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>z</mi><mn>4</mn><mn>2</mn></msubsup><mo>=</mo><mn>2</mn><mrow><mo>(</mo><msubsup><mi>y</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>y</mi><mn>2</mn><mn>2</mn></msubsup><mo>)</mo></mrow><mo>,</mo></mrow>]]></math></maths>且x1,x2,x3,x4,y1,y2,y3,y4,z1,z2,z3,z4都是整數(shù)。2、根據(jù)權(quán)利要求1所述的用于圖像和視頻壓縮的正交整數(shù)變換方法,其特征在于:所述8X8正交整數(shù)變換矩陣P中行順序不同者,為與上述整數(shù)矩陣P之等效變換。3、根據(jù)權(quán)利要求1所述的用于圖像和視頻壓縮的正交整數(shù)變換方法,其特征在于:所述8X8正交整數(shù)變換矩陣P中行相差一個(gè)因子者,為與上述整數(shù)矩陣P之等效變換。4、根據(jù)權(quán)利要求1或2或3所述的用于圖像和視頻壓縮的正交整數(shù)變換方法,其特征在于所述8X8正交整數(shù)變換矩陣P中各行的行范數(shù)只由兩個(gè)不同的數(shù)組成。5、根據(jù)權(quán)利要求1所述的用于圖像和視頻壓縮的正交整數(shù)變換方法,其特征在于:所述8X8正交整數(shù)變換矩陣P之較優(yōu)解為<table>tableseeoriginaldocumentpage3</column></row><table>6、根據(jù)權(quán)利要求1所述的用于圖像和視頻壓縮的正交整數(shù)變換方法,其特征在于:所述8X8正交整數(shù)變換矩陣P之較優(yōu)解為<table>tableseeoriginaldocumentpage3</column></row><table>7、根據(jù)權(quán)利要求1或2或3所述的用于圖像和視頻壓縮的正交整數(shù)變換方法,其特征在于對被壓縮的圖像數(shù)據(jù)塊M做二維變換,所得到的變換系數(shù)矩陣N為N=PMPT,其中,"PT"為P的轉(zhuǎn)置矩陣。8、根據(jù)權(quán)利要求1或2或3所述的用于圖像和視頻壓縮的正交變換方法,其特征在于對經(jīng)過熵解碼和反量化等處理后的數(shù)據(jù)塊》,用所述8X8正交整數(shù)變換矩陣P正交反變換,其二維恢復(fù)圖像反變換數(shù)據(jù)塊為<formula>formulaseeoriginaldocumentpage4</formula>其中,"PT"表示P的轉(zhuǎn)置矩陣。全文摘要一種用于圖像和視頻壓縮的正交整數(shù)變換方法,其是先將圖像分成8×8的小塊M,然后用8×8正交變換矩陣P對每一個(gè)小塊M作二維變換,用于壓縮編碼,得到變換系數(shù)矩陣N,再對N的每一個(gè)系數(shù)量化后熵編碼,完成圖像和視頻壓縮過程,其特征在于所述正交變換矩陣所有的元素皆為整數(shù),且滿足一定的條件,同時(shí)各行的順序不同者或行相差一個(gè)因子者,視為同一矩陣。本發(fā)明設(shè)計(jì)了一個(gè)新的8×8正交整數(shù)變換矩陣,可形成一個(gè)無限的整數(shù)矩陣類,通過一定條件的約束,在一個(gè)優(yōu)化數(shù)學(xué)模型的作用下,在成千上萬個(gè)矩陣?yán)?,產(chǎn)生最優(yōu)整數(shù)變換,在計(jì)算效率上,達(dá)到了理論上的最優(yōu)。試驗(yàn)證明,用這個(gè)正交變換壓縮圖像和視頻,其壓縮性能已全面優(yōu)于DCT。文檔編號(hào)H04N7/30GK101321285SQ20081003155公開日2008年12月10日申請日期2008年6月23日優(yōu)先權(quán)日2008年6月23日發(fā)明者王國秋申請人:王國秋