本發(fā)明涉及計算機信息技術領域,具體地涉及圖形圖像的壓縮及傳輸領域。
技術背景
隨著數(shù)字化生活的日益常態(tài)化,各類硬件設備的更新的加速化,所采集的無論是圖像數(shù)據(jù)還是圖形的數(shù)據(jù)都以幾何速度在增長。這些迅猛增長的數(shù)據(jù)給存儲、處理和傳輸帶來了巨大的負擔。圖像壓縮作為圖像處理的一個重要組成部分,一直受到廣大研究人員的關注。圖像壓縮算法從最初的編碼方法上的研究到后來的空間變換編碼上的研究,隨著小波理論、分形理論、人工神經(jīng)網(wǎng)絡理論和視覺仿真理論建立,圖像壓縮編碼方法向著更高的壓縮比和更好的壓縮效果方向發(fā)展。
圖像壓縮分為有損壓縮和無損壓縮,無損壓縮關心的是重構(gòu)數(shù)據(jù)和原始數(shù)據(jù)是否完全一致,通常被用于文本文件的壓縮。相較于無損壓縮,有損壓縮能夠獲得更高的壓縮比,但是得到的通常是原始數(shù)據(jù)的近似數(shù)據(jù)。當近似數(shù)據(jù)不影響視覺效果時,有損壓縮有著更廣泛的應用領域。隨著硬件設備的不斷更新,所獲取的圖像品質(zhì)越來越好,尺寸越來越大,這樣的高細節(jié)圖像給存儲和傳輸都造成了極大的負擔。無損壓縮由于要保留圖像所有的細節(jié),因此該類算法的壓縮比并不會太高。由于人類的視覺系統(tǒng)存在缺陷,并不會辨別所有失真。當近似數(shù)據(jù)不影響視覺效果時,有損壓縮有著更廣泛的應用領域。有損圖像壓縮實際上是對原始圖像的截斷,在限定的存儲空間內(nèi)達到最好的壓縮效果是圖像壓縮算法努力的方向。
傳統(tǒng)的有損壓縮方法根據(jù)原理可以分為預測編碼、基于變化法、基于分形法、基于視覺特性和向量量化壓縮,然而各種壓縮方法都在圖像的籌夠過程中對圖像細節(jié)還原成都底,不能準確描述圖像細節(jié),并且壓縮比越高,圖像重構(gòu)誤差越大,所需圖像精確度與壓縮比之間很難直接描述。
技術實現(xiàn)要素:
本發(fā)明針對圖形圖像壓縮在現(xiàn)有技術下,壓縮量化時部分圖像將被舍棄或者更改,于是很難達到較高的壓縮比,于是重構(gòu)的圖像更加接近甚至等于原圖是很難實現(xiàn)的。于是本發(fā)明提供了一種圖形圖像壓縮方法,主要是對圖形圖像的有損壓縮,本發(fā)明對小波變換后的小波系數(shù)矩陣進行圖像失真函數(shù)和比特率函數(shù)之間關系進行建模,充分考慮到了最優(yōu)的壓縮比率和圖像各像素點之間的聯(lián)系。
一種圖形圖像壓縮方法,其執(zhí)行步驟如下:
對原始圖像進行三次小波變換,得到小波變換的的小波系數(shù)矩陣;
采用H*分塊方法進行分割;
建立壓縮函數(shù)即失真函數(shù);
建立圖像在每個圖像子塊失真函數(shù)和比特率函數(shù)的數(shù)學模型;
反帶入求解得到當前背景下的優(yōu)化后的小波系數(shù)矩陣;
對優(yōu)化后的小波系數(shù)采用SPIHT編碼進行編碼。
本發(fā)明的有益效果是:該發(fā)明不僅能獲得較大的壓縮比,還充分考慮到了圖像各像素點之間的內(nèi)在聯(lián)系,更加注重圖像紋理和體現(xiàn)圖像的細節(jié),該方法也可以用來把圖像分隔成多個數(shù)據(jù)包,逐一地釋放這些數(shù)據(jù)包,可以達到不同壓縮率下的最優(yōu)壓縮效果,可以用于網(wǎng)絡圖像數(shù)據(jù)的傳輸。
附圖說明
圖1:該發(fā)明的詳細流程圖
圖2:三層小波分解示例圖
圖3:小波變換后圖像分解示例圖
圖4:R-D曲線模型示例圖
具體實施方式
本發(fā)明中圖像的壓縮過程和結(jié)果過程如圖1所示,首先對原始數(shù)據(jù)進行采集,然后進行小波變化,然后進行量化,編碼,最后得到圖像壓縮數(shù)據(jù),解壓過程為壓縮過程的逆運算。主要步驟結(jié)合圖2、圖3如下:
步驟一:讀入壓縮圖像,對圖像進行三次小波變換,得到小波變換的的小波系數(shù)矩陣;
步驟二:采用H*分塊方法進行分割;
步驟三:建立壓縮函數(shù),即失真函數(shù);
步驟四:建立圖像失真函數(shù)和比特率函數(shù)的數(shù)學模型即R-D曲線模型;
步驟五:根據(jù)繪制的R-D曲線,計算得到新的小波系數(shù)矩陣;
步驟六:采用SPIHT編碼方法對得到的新小波數(shù)據(jù)矩陣編碼,完成圖像壓縮;
下面對每個步驟進行詳細說明。
1、圖像進行小波變化結(jié)合圖2、圖3有以下幾個步驟
1.1YUV通道
在壓縮計算過程中,可以將RGB彩色圖像看成一個函數(shù)則I(X,y)=I(R(x,y),G(x,y),B(x,y)),在函數(shù)中,每個分量都是相同重要的,將RGB三個通道轉(zhuǎn)化為YUV通道:
Y=0.299R=0.587G+0.114B
U=0.437R-0.148G-0.289B
V=0.615R-0.515G-0.100B
1.2小波基
為了使圖像能量跟多的聚集到低頻區(qū)域,方法采用Daubechies9/7小波基,
Y(2n+1)←Xext(2n+1)+α(Xext(2n)+Xext(2n+2))
Y(2n)←Xext(2n)+β(Y(2n-1)+Y(2n+1))
Y(2n+1)←Y(2n+1)+γ(Y(2n)+Y(2n+2))
Y(2n)←Y(2n)+δ(Y(2n-1)+Y(2n+1))
Y(2n+1)←-kY(2n+1)
Y(2n)←Y(2n)/k
系數(shù)α、β、γ、δ和K分別取值為-1.586134342、-0.052980118、0.882911075、0.443506852和1.230174105。
1.3對圖像進行三次小波變換
小波變換目的是使能量越多集中于低頻越好,使得高頻中同方向不同分辨率的子代越相關越好,不同方向同分辨率的各個子塊相關性越強越好。
如圖2,選擇緊支集光滑正交的Daubechies小波基利,用小波變化把圖像劃分為低頻(圖像的基本信息)和不同方向不同分辨率的高頻(圖像的細節(jié)信息)。在相同的分辨率上各個頻段的高頻尺寸相同,同方向不同分辨率下高頻的尺寸是上一級高頻尺寸大小的四倍;圖像經(jīng)過小波變換將會被劃分為低頻部分和若干個高頻部分,考慮到圖像重構(gòu)時保留更多的細節(jié)信心,對圖像進行3層小波分解,低頻為LL3,高頻為LH3,HL3,HH3…,LH1,HL1HH1。
如圖3,對最外層的高頻,即LH1,HL1和HH1采用尺寸最大的圖像子塊,次一級的圖像子塊尺寸為最大圖像子塊的四分之一,以此類推下去的分塊原則稱為H*分塊方法。舉例來說,如果最外層的高選擇圖像子塊大小為64X 64,那么下一級的高頻(LH2,HL2,HH2)選擇的圖像子塊大小為32X 32。最大圖像子塊尺寸的選擇往往基于原始圖像尺寸和小波分解的層數(shù)這兩個方面的考慮,。
圖像經(jīng)三次小波變換后得到一個小波系數(shù)矩陣。圖像在經(jīng)過變換后,大小不變,能量集中到了低頻區(qū)域。
2、圖像分塊
圖像經(jīng)過小波變換后,得到了新的圖像數(shù)據(jù),圖像經(jīng)過小波變換后并不會改變其尺寸大小,改變的是像素值;將圖像分為若干個小塊,在各圖像子塊上建立壓縮模型曲線,對最外層的高頻,即LH1、HL1和HH1,采用尺寸最大的圖像子塊,次一級的圖像子塊尺寸為最大圖像子塊的四分之一,以此類推下去的分塊原則進行分塊,舉例來說,如果最外層的高選擇圖像子塊大小為64X 64,那么下一級的高頻(LH2,HL2,HH2)選擇的圖像子塊大小為32X 32。最大圖像子塊尺寸的選擇往往基于原始圖像尺寸和小波分解的層數(shù)這兩個方面的考慮。圖像的壓縮,可以看成圖像的截斷,分塊夠各個子圖像對應各個截斷點。
3、失真公式建立
失真函數(shù)的建立在不同的背景下,有以下兩種形式:
3.1:圖像的壓縮即失真過程,圖像在經(jīng)過三次小波變換后,能量充分集中到了低頻區(qū)域,也就是充分體現(xiàn)圖像細節(jié)的區(qū)域,此時失真公式的建立尤為重要,去除冗余的信息,同時要保留圖像的紋理,為了保護更多的細節(jié),在不增加計算量的條件下,建立如下失真函數(shù)D(T),設圖像被分成m個圖像子塊,在各個圖像子塊上的截斷位為T=(t1,t2,···tm),這里ti為第i個圖像子塊的截斷位。因此整個圖像的失真函數(shù)D(T)表示為:
這里b(ti)是一個關于圖像分塊處-截斷位ti的單調(diào)遞減函數(shù),b(x)可以被寫成
b(x)=s-kx (3)
且b(X)>0。這里為最可截斷位;k表示降低曲線陡度的一個參量,賦值為1
因此:
3.2:在實際中,釆用低的壓縮比通??梢允沟谜鶊D像都有很高的壓縮質(zhì)量,但采用高壓縮比的時候,我們往往希望對感興趣的部分采用低壓縮比以獲取較好的圖像效果,而對其他部分采用高壓縮比以節(jié)省存儲空間,這類壓縮算法叫做感興趣區(qū)域算法。它的目標失真函數(shù)可以構(gòu)造成如下形式:
這里,bj是集合Q={0,q}中的某一元素,當像素點Xj屬于感興趣區(qū)域時,bj=q;當像素點xj屬于背景區(qū)域(非感興趣區(qū)域)時,bj=0,q值的大小可以根據(jù)所選擇的感興趣區(qū)域編碼方法來確定,例如最大位面移位方法(Max Bit-planes Shift Method)中,q的值等于感興趣區(qū)域中小波系數(shù)最大的位面數(shù),即當目標失真函數(shù)為上述形式時,相當于把感興趣區(qū)域內(nèi)的像素值先提升q位后,在同其他的像素值一起進行截斷,并且當bj>ti時,感興趣區(qū)域的失真為零。
如果在實際應用中,對圖像的某些區(qū)域有著不同的重視程度,即不同的重要性劃分,這時單一的q值己經(jīng)不能滿足實際應用的需要。這時可以在感興趣區(qū)域編碼方法的基礎上進行改進,得到了多級感興趣區(qū)域編碼方法。它的目標失真函數(shù)的表達式和感興趣區(qū)域的表達式完全一樣,但是集合Q中的元素不再是0和q兩個值,而是根據(jù)重要等級的劃分給出不同的值。當感興趣區(qū)域被劃分為n個重要級別時,集合Q可以表示為Q={0,q1,q2,…qn},這q1>q2>···qn,qi表示第i個感興趣區(qū)域的上移位面,它們可以被人為地確定也可以被通過統(tǒng)計經(jīng)驗獲得。容易發(fā)現(xiàn)一級感興趣具有最高的重要級別,該區(qū)域也將得到的最好的重構(gòu)效果。當圖像需要進行某些變換后再進行感興趣區(qū)域編碼或多級感興趣區(qū)域編碼時,必須同時轉(zhuǎn)換原來的感興趣區(qū)域的空間位置到變換后的空間位置。
4、建立圖像失真函數(shù)和比特率函數(shù)的數(shù)學模型
在不同的背景、條件下,有不同的優(yōu)化模型,如下:
4.1:定義目標失真函數(shù)Z=D(T),在限定條件下下,通過Langrange乘法來求極值。對于一個給定的比特率限制R,圖像壓縮的數(shù)學優(yōu)化模型可表達為:
這里D(T)和R(T)分別表示圖像的失真函數(shù)和比特率函數(shù)。直接對整個圖像求截斷點是很麻煩的,這里我們把對整個圖像的截斷(壓縮)轉(zhuǎn)化為對每個子塊的截斷。通過在每個子塊上找到最優(yōu)的截斷點來完成對整個圖像的截斷。
4.1.1:λ系數(shù)的求解
對于每個給定的圖像壓縮比特率R0,可以根據(jù)拉格朗日乘數(shù)法求得相應的值λ0。設向量為失真函數(shù)Z=D{T)在約束條件下的解,λ0用下面的公式計算:
對于不同的圖像比特率限制R,相應的參數(shù)λ和各個圖像子塊上的截斷位T=(t1,t2,···tm)是不同的。同時,根據(jù)不同的目標失真函數(shù)D(T),在相同的比特率限制R下各個圖像子塊的截斷點也是不同的。
4.2:根據(jù)不同的實際背景,圖像壓縮并不僅僅是在限定比特率下求最小失真的優(yōu)化問題,也可以是在限定失真下,求最小的比特率的優(yōu)化問題,其優(yōu)化模型可以表示為::
令這個極值為R。它表示在容許的最大圖像失真D下所能達到的最小圖像壓縮比特率。它的求解方法與前所述一樣,通過對圖像的壓縮比特率(Rate)和失真(Distortion)程度的相關變化情況分析,圖像的比特率和失真程度表現(xiàn)為圖像存在唯一的一條最優(yōu)比特率和失真曲線,即最優(yōu)R-D曲線
R-D曲線結(jié)合圖4描述如下:最優(yōu)R-D曲線上每個點表示的是在當前比特率(失真)下最優(yōu)的壓縮效果(最小的比特率)根據(jù)不同的目標失真公式D(T),相應的最優(yōu)R-D曲線也是不同。這些最優(yōu)R-D曲線表現(xiàn)為具有不同的彎曲程度,但是它們的整體趨勢(斜率單調(diào)遞增)都是相同的。圖像壓縮形象地說,是在相應的最優(yōu)曲線上找到一個點,該點橫坐標表示的是當前的圖像壓縮比特率,縱坐標表示在該比特率下圖像的最小失真。任意壓縮算法都是無限地逼近這條最優(yōu)R-D曲線。
5、根據(jù)繪制的R-D曲線,計算得到新的小波系數(shù)矩陣
本發(fā)明提出的圖像壓縮優(yōu)化模型是基于圖像存在最優(yōu)R-D曲線這樣一個事實基礎上的,但是在實際中,無法顯式地表達出整個圖像的最優(yōu)R-D曲線以及各個圖像子塊的最優(yōu)R-D曲線。雖然無法繪制連續(xù)的最優(yōu)R-D曲線,但是卻可以通過描繪曲線上一些離散點來確定最優(yōu)R-D曲線,從而完成對圖像的截斷。
由于目標失真函數(shù)D(T)和比特率函數(shù)R(T)所確定的相關變化曲線(最優(yōu)R-D曲線)的斜率總是遞增的(這里斜率為負,它們的絕對值是遞減),因此這條離散最優(yōu)R-D曲線上的離散點應該也符合這一原則。但是在實際計算中,由于舍入誤差的引進,有時會出現(xiàn)不符合這一原則的點,為了不影響截斷點的確定需要刪除這些不符合條件的點。
確定符合這個原則的最優(yōu)R-D曲線的離散點方法如下:
設{j1<j2<···}是第i個圖像子塊通過計算得到的可執(zhí)行截斷位的枚舉。對應截斷位jk,它在曲線上斜率可以通過公式求得:
這里,和表示函數(shù)D(T)和R(T)的差分,用中心差分來計算:
由圖4可知,失真函數(shù)D(T)和比特率函數(shù)R(T)所確定的最優(yōu)R-D曲線表現(xiàn)為斜率遞增,由于斜率為負,因此序列應該是單調(diào)遞減的。的絕對值大于等于的絕對值,則原來的截斷位枚舉中jk必須從這個集合{j1<j2<···}中被去掉,以此類推,就可以得到“合格”的截斷點枚舉序列Ti={j`1<j`2<····}。
對整個圖像的最優(yōu)截斷歸結(jié)為對各個圖像子塊的最優(yōu)截斷,即在各個圖像子塊的最優(yōu)R-D曲線上找到與限制比特率所對應的截斷點。由于各個圖像子塊的最優(yōu)R-D曲線的凹性彎曲程度不同,因此在各個子塊上要找的截斷點的位置也是不同的,相同的是這些截斷的斜率
本方法的目標函數(shù)是在約束條件φ(T)=R(T)-R=0下求得的極值,但是實際上這個約束條件可以放寬為:
R(T)≤R (11)
由于每個圖像子塊所確定的最優(yōu)R-D曲線的彎曲程度是不同的,這意味著即使在相同的截斷位上,各個子塊的失真也是不同的,為了公平,我們選擇各個子塊的截斷點不是根據(jù)截斷位,而是根據(jù)這些位置上的斜率即選擇在各個圖像子塊中具有相同下降趨勢的截斷點。對于相同的下降趨勢S,各個圖像子塊的截斷位為:
隨著斜率S的不同,各圖像子塊的截斷點也相應地改變。本發(fā)明通過不斷地循環(huán)斜率S來滿足限定條件R(T)≤R完成對各個圖像子塊的截斷點的選取,從而對整個圖像的進行最優(yōu)截斷的。具體過程如下:
初始截斷位為表示第i個圖像子塊相對于斜率S的截斷位;
循環(huán)j=1,2,3,<····,
如果更新
這里,是各個圖像子塊被允許的最高截斷位。
6、SPIHT編碼
圖像原始數(shù)據(jù)經(jīng)過小波變換后得到新的小波系數(shù)矩陣,小波系數(shù)矩陣經(jīng)過以上失真函數(shù)定義的優(yōu)化過程后得到一個線性相關良好的小波系數(shù)矩陣的圖像數(shù)據(jù),此時采用SPIHT算法對得到的小波系數(shù)進行量化編碼,SPIHT編碼方法是公認的效率很高的靜止圖像編碼方法,采用了有效的空間方向樹結(jié)構(gòu)和比特平面編碼方法,不僅能獲得很高的壓縮編碼效率,而且產(chǎn)生的碼流是嵌入式的,支持多碼率解碼;由于SPIHT編碼方法是公認較好的編碼方法,本發(fā)明也采用此編碼方法,編碼具體過程則不做詳細描述。
盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領域的普通技術人員在本發(fā)明的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。因此,本發(fā)明的保護范圍應當由所附的權(quán)利要求書的內(nèi)容確定。