專利名稱:全相位沃爾什雙正交變換及其對jpeg的改進(jìn)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)圖像處理技術(shù)領(lǐng)域。
背景技術(shù):
目前,多媒體和互聯(lián)網(wǎng)的發(fā)展要求采用合適的方法對圖像進(jìn)行壓縮編碼,以便于圖像的存儲(chǔ)和傳輸。JPEG是靜止圖像壓縮的國際標(biāo)準(zhǔn)(見文獻(xiàn)ISO/IEC10918-1|ITU-T Rec.T.81,Digital compression and coding of continuous-tone stillimages)。JPEG圖像壓縮編碼算法的主要步驟為圖像的8×8方塊化、二維離散余弦變換(Discrete Cosine Transform,DCT)、根據(jù)量化表量化、“之”字形(Zig-Zag)掃描游程編碼、哈夫曼(Huffman)熵編碼等。接收端解壓縮是編碼的逆過程,經(jīng)過反量化和反DCT變換,得到重建圖像。8×8像塊[f]的二維DCT變換公式為[F]=[C][f][CT],其中,[C]為8×8的DCT變換矩陣,[CT]為[C]的轉(zhuǎn)置。DCT變換是正交變換,[C]的轉(zhuǎn)置即為[C]的逆,即[CT]=[C-1]。因此,由[f]=[CT][F][C]重建圖像。[C]的行向量是分解基矢量,[CT]的列向量是合成基矢量,DCT變換和反變換中的分解基矢量和合成基矢量是相同的。
JPEG中采用DCT變換是因?yàn)镈CT的基矢量接近理想正交變換(K-L變換)的基矢量。然而我們發(fā)現(xiàn),對于圖像壓縮編碼來說,正交變換并不是最優(yōu)的選擇。其缺點(diǎn)之一是量化表比較復(fù)雜,對不同的DCT系數(shù)采用不同的量化間隔,量化特別是改變壓縮率時(shí)的量化需要較復(fù)雜的計(jì)算,量化表也需要占一定的內(nèi)存空間。
發(fā)明內(nèi)容本發(fā)明的目的是解決現(xiàn)有技術(shù)中需要量化表,且量化表復(fù)雜,需要進(jìn)行大量計(jì)算的問題,提供一種全相位沃爾什雙正交變換法,及采用該變換對JPEG存儲(chǔ)和傳輸?shù)母倪M(jìn)方法。
該方法最大的優(yōu)點(diǎn)是無需量化表,對變換系數(shù)進(jìn)行均一量化,從而可大大縮短運(yùn)算時(shí)間,硬件實(shí)現(xiàn)也比較簡單,并且能達(dá)到與DCT變換基本相同的圖像壓縮效果。
本發(fā)明提供的全相位沃爾什雙正交變換法,是將二維全相位沃爾什雙正交變換定義為[F]=[V][f][VT],反變換定義為[f]=[V-1][F][(V-1)T],其中[V]是全相位沃爾什雙正交變換矩陣。
本發(fā)明定義的全相位沃爾什雙正交變換矩陣[V]是由沃爾什正交變換矩陣用如下的迭代公式得到的Vm(j,l)=Σi=07-jVm-1-1(i+j,l)Vm-1(l,i)---(1)]]>[V]=[Vm](2)其中,m為自然數(shù),[V0]為沃爾什正交變換矩陣[V0]=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-11-111-11-1-11-111-11-11-11-1.]]>本發(fā)明用公式(1)迭代5次后得到的[V5]作為全相位沃爾什雙正交變換矩陣[V],即m取5,則[V]=[V5]=188.00008.00008.00008.00008.00008.00008.00008.00007.00005.18333.62202.01860.7104-4.8184-4.5786-9.13726.00002.4593-0.9738-4.5986-6.2573-3.1366-2.04558.55255.0000-1.0781-4.1499-3.4166-0.95944.81136.1078-6.31524.0000-1.8218-3.9411-0.38624.20720.2307-5.31963.03093.0000-3.3642-1.19662.23020.4331-3.51403.5731-1.16162.0000-3.19330.98331.7602-2.60112.1770-1.33420.20801.0000-2.22801.8363-1.35421.0357-0.3971-0.07580.1831.]]>一種采用上述全相位沃爾什雙正交變換法對JPEG存儲(chǔ)和傳輸?shù)母倪M(jìn)方法是,用全相位沃爾什雙正交變換代替二維離散余弦變換,對所有變換系數(shù)采用均一量化,具體過程如下——輸入原始圖像及比特率;——分成8×8像素塊,分別進(jìn)行全相位沃爾什雙正交變換;——根據(jù)比特率確定量化間隔,對變換系數(shù)進(jìn)行均一量化;
——直流系數(shù)(DC)的預(yù)測編碼和交流系數(shù)(AC)的“之”字形(Zig-Zag)掃描、可變長編碼;——哈夫曼(Huffman)熵編碼;——輸出壓縮圖像的比特序列。
對JPEG存儲(chǔ)和傳輸?shù)母倪M(jìn)方法,其接收端解壓縮過程如下——接收輸入的經(jīng)變換后的壓縮圖像比特序列;——哈夫曼(Huffman)熵解碼;——對直流系數(shù)(DC)和交流系數(shù)(AC)可變長解碼;——反量化;——反全相位沃爾什雙正交變換;——得到重建圖像。
本發(fā)明的優(yōu)點(diǎn)和積極效果1、本發(fā)明基于全相位數(shù)字濾波理論和傳統(tǒng)的沃爾什正交變換提出了一種新型變換即全相位沃爾什雙正交變換,并將其成功應(yīng)用于圖像壓縮領(lǐng)域。2、全相位沃爾什雙正交變換矩陣[V]與DCT正交變換矩陣[C]的相似之處是基矢量的列率隨行序號(hào)的增加而增加,不同之處是[C]的各個(gè)基矢量是等模的,而[V]的基矢量的模隨列率的增高而衰減。這就使得全相位沃爾什雙正交變換系數(shù)具有高頻衰減的性質(zhì)。當(dāng)對各變換系數(shù)采用均一的量化間隔量化時(shí),就相當(dāng)于DCT變換低頻系數(shù)細(xì)量化、高頻系數(shù)粗量化的效果。因此可以去掉基于DCT變換的JPEG算法中的復(fù)雜的量化表。3、本發(fā)明對JPEG的改進(jìn)之處是,用全相位沃爾什雙正交變換代替DCT變換,對所有變換系數(shù)采用均一量化。圖像壓縮編碼的其他部分與JPEG相同。在接收端,經(jīng)過哈夫曼(Huffman)熵解碼、直流系數(shù)(DC)和交流系數(shù)(AC)可變長解碼、反量化后,再進(jìn)行反全相位沃爾什雙正交變換得到重建圖像。本發(fā)明提出的改進(jìn)JPEG方法與標(biāo)準(zhǔn)JPEG方法相比的最大優(yōu)點(diǎn)是,對變換系數(shù)進(jìn)行均一量化,去掉了量化表,節(jié)省了內(nèi)存,簡化了計(jì)算,提高了編解碼速度,從而可大大縮短運(yùn)算時(shí)間,硬件實(shí)現(xiàn)也比較簡單,并且能達(dá)到與DCT變換基本相同的圖像壓縮效果。比如,在Celeron(R)CPU 2.80GHz、256M內(nèi)存計(jì)算機(jī)環(huán)境下,在編碼時(shí)間上,對九幅512×512大小的圖像,在標(biāo)準(zhǔn)壓縮率下,全相位沃爾什雙正交變換方案比DCT方案平均少用2.3924秒;對一幅512×512大小的圖像,在不同的壓縮率下,全相位沃爾什雙正交變換方案比DCT方案平均少用2.8072秒。在內(nèi)存使用上,因?yàn)镈CT方案需要存儲(chǔ)復(fù)雜的量化表,存儲(chǔ)量化表所用內(nèi)存為全相位沃爾什雙正交變換方案的64倍。當(dāng)調(diào)整編碼比特率時(shí),因DCT方案需要計(jì)算量化矩陣而要做大量的乘法運(yùn)算,這一計(jì)算量大約為全相位沃爾什雙正交變換方案的64倍。
圖1是兩種變換和量化方案下圖像“announcer”的率失真曲線;圖2是用本發(fā)明方法對圖像進(jìn)行壓縮與重建的方框圖。
具體實(shí)施方式實(shí)施例1本發(fā)明定義的全相位沃爾什雙正交變換矩陣[V]是由沃爾什正交變換矩陣用如下的迭代公式得到的Vm(j,l)=Σi=07-jVm-1-1(i+j,l)Vm-1(l,i)---(1)]]>[V]=[Vm] (2)其中,m為自然數(shù),[V0]為沃爾什正交變換矩陣[V0]=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-111-11-11-1-11-111-11-11-11-1]]>本發(fā)明用公式(1)迭代5次后得到的[V5]作為全相位沃爾什雙正交變換矩陣[V],即m取5,則=[V5]=188.00008.00008.00008.00008.00008.00008.00008.00007.00005.18333.62202.01860.7104-4.8184-4.5786-9.13726.00002.4593-0.9738-4.5986-6.2573-3.1366-2.04558.55255.0000-1.0781-4.1499-3.4166-0.95944.81136.1078-6.31524.0000-1.8218-3.9411-0.38624.20720.2307-5.31963.03093.0000-3.3642-1.19662.23020.4331-3.51403.5731-1016162.0000-3.19330.98331.7602-2.60112.1770-1.33420.20801.0000-2.22801.8363-1.35421.0357-0.3971-0.07580.1831.]]>全相位沃爾什雙正交變換矩陣[V]與DCT正交變換矩陣[C]的相似之處是基矢量的列率隨行序號(hào)的增加而增加,不同之處是[C]的各個(gè)基矢量是等模的,而[V]的基矢量的模隨列率的增高而衰減。這就使得全相位沃爾什雙正交變換系數(shù)具有高頻衰減的性質(zhì)。當(dāng)對各變換系數(shù)采用均一的量化間隔量化時(shí),就相當(dāng)于DCT變換低頻系數(shù)細(xì)量化、高頻系數(shù)粗量化的效果。因此可以去掉基于DCT變換的JPEG算法中的復(fù)雜的量化表。
實(shí)施例2在本發(fā)明中,區(qū)別現(xiàn)有技術(shù)的必要技術(shù)特征是首先提出了一種新型變換即全相位沃爾什雙正交變換,并且用全相位沃爾什雙正交變換代替JPEG壓縮算法中的DCT變換,應(yīng)用于圖像壓縮。本發(fā)明基于軟件實(shí)現(xiàn)。
如圖2所示,首先,輸入原始圖像和比特率,把圖像分成8×8的像素塊,分塊進(jìn)行全相位沃爾什雙正交變換,根據(jù)輸入比特率選定量化間隔,將變換系數(shù)進(jìn)行均一量化,再對直流系數(shù)(DC)進(jìn)行預(yù)測編碼,對交流系數(shù)(AC)進(jìn)行“之”字形(Zig-Zag)掃描和可變長編碼,然后根據(jù)標(biāo)準(zhǔn)的哈夫曼(Huffman)碼表進(jìn)行熵編碼,輸出壓縮圖像的比特序列,實(shí)現(xiàn)了圖像壓縮。在接收端,經(jīng)過哈夫曼(Huffman)熵解碼、直流系數(shù)(DC)和交流系數(shù)(AC)可變長解碼、反量化后,再進(jìn)行反全相位沃爾什雙正交變換得到重建圖像。
需要注意的是,在圖2的程序流程圖中,進(jìn)行哈夫曼(Huffman)編碼時(shí),對于直流系數(shù)(DC),因?yàn)槭菍ο噜張D像塊之間的差值進(jìn)行編碼的,所以在量化后掃描之前要先對直流系數(shù)(DC)進(jìn)行預(yù)處理。將量化后直流系數(shù)(DC)的原始值替換成相鄰圖像塊之間的差值。在對交流系數(shù)(AC)進(jìn)行編碼時(shí),又要考慮63個(gè)系數(shù)全是零和連續(xù)出現(xiàn)16個(gè)連零這兩種特殊情況等等。
本發(fā)明對JPEG的改進(jìn)之處是,用全相位沃爾什雙正交變換代替DCT變換,對所有變換系數(shù)采用均一量化。圖像壓縮編碼的其他部分與JPEG相同。
在Matlab 6.5環(huán)境下對本發(fā)明提出的技術(shù)方案進(jìn)行了計(jì)算機(jī)仿真實(shí)驗(yàn)。實(shí)驗(yàn)得到以下結(jié)論1.當(dāng)采用均一量化時(shí),用[V5]作為全相位沃爾什雙正交變換矩陣可以達(dá)到比其他[Vm]更好的圖像壓縮效果。
2.采用全相位沃爾什雙正交變換、均一量化間隔取為60時(shí)的圖像壓縮率和重建圖像信噪比指標(biāo),與采用DCT變換、用JPEG標(biāo)準(zhǔn)中的量化表進(jìn)行量化時(shí)的指標(biāo)近似。但全相位沃爾什雙正交變換方案所用編碼時(shí)間比DCT方案少。
3.在其他編碼比特率下,本發(fā)明提出的技術(shù)方案與標(biāo)準(zhǔn)JPEG方案在重建圖像的主觀效果和峰值信噪比方面也大致相同。但全相位沃爾什雙正交變換方案所用編碼時(shí)間比DCT方案少。
表1給出了對512×512的九幅圖像采用DCT變換、用JPEG標(biāo)準(zhǔn)中的量化表進(jìn)行量化和采用全相位沃爾什雙正交變換、均一量化間隔取為60進(jìn)行圖像編碼和重建的實(shí)驗(yàn)結(jié)果。表1標(biāo)準(zhǔn)壓縮率下兩種方案性能比較
表2給出了對圖像“announcer”,這兩種變換和量化方案在不同的壓縮比、編碼比特率和重建圖像峰值信噪比下的實(shí)驗(yàn)結(jié)果。
表2 不同壓縮率下兩種方案性能比較
由表1和表2可以看出,二者的壓縮效果基本相同。但全相位沃爾什雙正交變換方案與DCT方案相比,對九幅512×512大小的圖像,在標(biāo)準(zhǔn)壓縮率下,全相位沃爾什雙正交變換方案的編碼時(shí)間平均少用2.3924秒;對一幅512×512大小的圖像,在不同的壓縮率下,全相位沃爾什雙正交變換方案的編碼時(shí)間平均少用2.8072秒。由表2數(shù)據(jù)繪制的兩種變換和量化方案下圖像“announcer”的率失真曲線如圖1所示。
由圖1可以看出,在編碼比特率比較小時(shí),本發(fā)明提出的改進(jìn)JPEG方法優(yōu)于標(biāo)準(zhǔn)JPEG方法。而在編碼比特率比較大時(shí),改進(jìn)的JPEG方法效果略差一些,但二者基本接近。
本發(fā)明提出的改進(jìn)JPEG方法與標(biāo)準(zhǔn)JPEG方法相比的最大優(yōu)點(diǎn)是,去掉了量化表,節(jié)省了內(nèi)存,簡化了計(jì)算,提高了編解碼速度。
權(quán)利要求
1.一種全相位沃爾什雙正交變換法,其特征是本發(fā)明將二維全相位沃爾什雙正交變換定義為[F]=[V][f][VT],反變換定義為[f]=[V-1][F][(V-1)T],其中[V]是全相位沃爾什雙正交變換矩陣。
2.根據(jù)權(quán)利要求1所述的全相位沃爾什雙正交變換法,其特征是本發(fā)明定義的全相位沃爾什雙正交變換矩陣[V]是由沃爾什正交變換矩陣用如下的迭代公式得到的Vm(j,l)=Σi=07-jVm-1-1(i+j,l)Vm-1(l,i)---(1)]]>[V]=[Vm] (2)其中,m為自然數(shù),[V0]為沃爾什正交變換矩陣[V0]=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-111-11-11-1-11-111-11-11-11-1.]]>
3.根據(jù)權(quán)利要求2所述的全相位沃爾什雙正交變換法,其特征是本發(fā)明用上述公式(1)迭代5次后得到的[V5]作為全相位沃爾什雙正交變換矩陣[V],即m取5,則[V]=[V5]=188.00008.00008.00008.00008.00008.00008.00008.00007.00005.18333.62202.01860.7104-4.8184-4.5786-9.13726.00002.4593-0.9738-4.5986-6.2573-3.1366-2.04558.55255.0000-1.0781-4.1499-3.4166-0.95944.81136.1078-6.31524.0000-1.8218-3.9411-0.38624.20720.2307-5.31963.03093.0000-3.3642-1.19662.23020.4331-3.51403.5731-1.16162.0000-3.193300.98331.7602-2.60112.1770-1.33420.20801.0000-2.22801.8363-1.35421.0357-0.3971-0.07580.1831.]]>
4.一種采用權(quán)利要求1所述的全相位沃爾什雙正交變換法對JPEG的改進(jìn)方法,其特征是本發(fā)明對JPEG的改進(jìn)之處是,用全相位沃爾什雙正交變換代替二維離散余弦變換,對所有變換系數(shù)采用均一量化,具體過程如下——輸入原始圖像及比特率;——分成8×8像素塊,分別進(jìn)行全相位沃爾什雙正交變換;——根據(jù)比特率確定量化間隔,對變換系數(shù)進(jìn)行均一量化;——直流系數(shù)(DC)的預(yù)測編碼和交流系數(shù)(AC)的“之”字形(Zig-Zag)掃描、可變長編碼;——哈夫曼(Huffman)熵編碼;——輸出壓縮圖像的比特序列。
5.根據(jù)權(quán)利要求4所述的對JPEG的改進(jìn)方法,其特征是接收端解壓縮過程如下——接收輸入的經(jīng)變換后的壓縮圖像比特序列;——哈夫曼(Huffman)熵解碼;——對直流系數(shù)(DC)和交流系數(shù)(AC)可變長解碼;——反量化;——反全相位沃爾什雙正交變換;——得到重建圖像。
全文摘要
全相位沃爾什雙正交變換及其對JPEG的改進(jìn)方法。本發(fā)明將二維全相位沃爾什雙正交變換定義為[F]=[V][f][V
文檔編號(hào)H04N7/32GK1829327SQ20061001334
公開日2006年9月6日 申請日期2006年3月22日 優(yōu)先權(quán)日2006年3月22日
發(fā)明者侯正信, 王成優(yōu) 申請人:天津大學(xué)