本發(fā)明屬于圖像壓縮編碼領(lǐng)域,涉及一種基于二維不可分小波變換的端到端圖像無(wú)損壓縮方法。
背景技術(shù):
1、圖像壓縮在現(xiàn)代數(shù)字信號(hào)處理和多媒體應(yīng)用中是一個(gè)關(guān)鍵研究領(lǐng)域,旨在提高信息傳輸和存儲(chǔ)的效率。圖像壓縮算法包括傳統(tǒng)圖像壓縮算法和基于深度學(xué)習(xí)的端到端圖像壓縮算法。傳統(tǒng)圖像壓縮標(biāo)準(zhǔn)如jpeg、jpeg2000通過手工設(shè)計(jì)的模塊實(shí)現(xiàn),具有低解碼復(fù)雜度和強(qiáng)通用性。然而這些標(biāo)準(zhǔn)依賴固定的編碼架構(gòu),難以適應(yīng)圖像內(nèi)容的多樣性和復(fù)雜性。相比之下,端到端圖像壓縮算法利用大量的圖像數(shù)據(jù)進(jìn)行訓(xùn)練,通過神經(jīng)網(wǎng)絡(luò)的反復(fù)迭代和優(yōu)化,顯著提高了編碼效率和圖像質(zhì)量。
2、作為經(jīng)典的圖像編碼方法,jpeg2000使用小波變換將圖像轉(zhuǎn)化為系數(shù)。在jpeg2000中,小波變換采用提升形式,即通過一系列預(yù)測(cè)和更新操作來(lái)實(shí)現(xiàn)小波變換。
3、為了進(jìn)一步提升圖像編碼的性能,研究人員將小波變換應(yīng)用于端到端圖像壓縮方法,提出了一種基于學(xué)習(xí)類小波變換的端到端圖像編碼方法,即iwave++。在該方法中,小波變換采用具有卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的預(yù)測(cè)濾波器和更新濾波器,圖像編碼的其他模塊也使用了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從而構(gòu)成了一個(gè)整體的端到端圖像壓縮框架。iwave++方法在無(wú)損壓縮方面表現(xiàn)出較為優(yōu)異的性能,但仍存在進(jìn)一步提升的空間。
4、這種優(yōu)化需求的一個(gè)主要原因在于無(wú)損壓縮必須在整數(shù)域內(nèi)進(jìn)行,因此,在由卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成的濾波器后需要進(jìn)行舍入操作。傳統(tǒng)的小波變換處理二維圖像的方法是先在水平方向上執(zhí)行一維變換,然后在垂直方向上執(zhí)行一維變換,最終得到四個(gè)子帶。每個(gè)一維變換包含一個(gè)更新濾波器和一個(gè)預(yù)測(cè)濾波器,每個(gè)濾波器處理系數(shù)后都需要舍入操作,因此總共需要六次舍入操作。由于舍入操作會(huì)引入舍入誤差,過多的舍入操作會(huì)導(dǎo)致誤差的積累,進(jìn)而影響無(wú)損壓縮的性能。
5、因此,為了進(jìn)一步提高該方法的性能,通過改變二維小波變換的結(jié)構(gòu)來(lái)減少舍入操作的次數(shù)是一個(gè)重要方向。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的不足,提出一種基于二維不可分小波變換的端到端圖像無(wú)損壓縮方法,包括以下步驟:
2、步驟1:獲取rgb格式圖像,轉(zhuǎn)換為灰度圖像;
3、步驟2:采用多級(jí)小波變換對(duì)灰度圖像進(jìn)行多尺度分解,獲得多個(gè)子帶;
4、步驟3:將所有子帶信息輸入基于學(xué)習(xí)的熵編碼模塊進(jìn)行壓縮編碼處理,獲得各子帶系數(shù)的編碼數(shù)據(jù);
5、步驟4:對(duì)編碼后的碼流進(jìn)行解碼,根據(jù)各子帶系數(shù)的概率分布恢復(fù)對(duì)應(yīng)的子帶系數(shù)值;
6、步驟5:對(duì)解碼出的各子帶系數(shù)進(jìn)行與步驟2對(duì)應(yīng)的多級(jí)小波逆變換,重建圖像的像素參數(shù),重構(gòu)出原始圖像;
7、步驟6:將解碼重構(gòu)后得到的灰度圖像轉(zhuǎn)換為原始的rgb格式圖像。
8、進(jìn)一步地,步驟2中,采用多級(jí)小波變換對(duì)灰度圖像進(jìn)行多尺度分解具體為;
9、對(duì)灰度圖像進(jìn)行一次小波變換,得到四個(gè)子帶系數(shù)?、、、;
10、對(duì)低頻子帶系數(shù)繼續(xù)進(jìn)行小波變換,得到更高頻的子帶系數(shù)、、、;
11、以此類推,進(jìn)行小波變化次,總共得到個(gè)子帶系數(shù),,表示小波變換次數(shù)。
12、進(jìn)一步地,小波變換采用基于學(xué)習(xí)的二維不可分離結(jié)構(gòu),包括分解步驟、預(yù)測(cè)步驟和更新步驟;
13、分解步驟:將灰度圖像的近似系數(shù),按橫縱向的奇偶性分解為四個(gè)分量:、、、,其中表示小波分解的次數(shù),表示像素位置;
14、預(yù)測(cè)步驟:采用預(yù)測(cè)濾波器對(duì)各分量進(jìn)行處理;
15、更新步驟:計(jì)算預(yù)測(cè)濾波器的輸出與各原始分量的差值得到處理后的子帶分量、以及,輸入更新濾波器,得到的結(jié)果和結(jié)合生成更新后的低頻信號(hào)。
16、進(jìn)一步地,所述預(yù)測(cè)濾波器和更新濾波器均為卷積神經(jīng)網(wǎng)絡(luò),濾波處理后均進(jìn)行舍入操作,小波變換得到四個(gè)輸出分量的系數(shù),,以及;
17、用、、、代表四個(gè)由卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成的濾波器, p表示預(yù)測(cè)濾波器, u表示更新濾波器;由分解的四個(gè)分量得到輸出的四個(gè)系數(shù)值的計(jì)算公式如下:
18、,
19、,
20、,
21、,
22、其中,[?]表示舍入運(yùn)算,*表示卷積運(yùn)算;舍入運(yùn)算的目的在于保證編碼為無(wú)損編碼。
23、進(jìn)一步地,預(yù)測(cè)濾波器和更新濾波器均為卷積神經(jīng)網(wǎng)絡(luò),包括卷積層和非線性激活函數(shù);
24、通過第一卷積層對(duì)輸入圖像進(jìn)行特征提??;
25、經(jīng)過兩個(gè)并行的?tanh?激活函數(shù)與第二卷積層對(duì)第一卷積層得到的特征繼續(xù)處理,輸出特征圖;
26、將特征圖與提取的特征進(jìn)行合并,采用第三卷積層對(duì)合并后的特征圖進(jìn)行特征融合;
27、將融合特征圖與輸入圖像進(jìn)行加法運(yùn)算,得到最終輸出。
28、進(jìn)一步地,所述基于學(xué)習(xí)的熵編碼模塊包括:
29、上下文模型,采用自回歸模型處理對(duì)所有子帶信息依次進(jìn)行處理,輸出一組熵參數(shù)作為各子帶系數(shù),,……,概率分布的參數(shù);
30、概率模型,根據(jù)上下文信息預(yù)測(cè)每個(gè)系數(shù)的概率分布,確定系數(shù)的出現(xiàn)概率用于算術(shù)編碼;
31、算術(shù)編碼器,基于概率模型得到的概率對(duì)各子帶系數(shù)進(jìn)行壓縮編碼;
32、進(jìn)一步地,所述上下文模型包括長(zhǎng)期上下文提取模型和上下文融合模型;
33、長(zhǎng)期上下文提取模型,對(duì)編碼后的個(gè)子帶進(jìn)行提取,獲得長(zhǎng)期上下文信息;
34、上下文融合模型,將長(zhǎng)期上下文信息中的信息與當(dāng)前子帶中已經(jīng)編碼的系數(shù)的信息相結(jié)合,生成當(dāng)前系數(shù)概率分布的參數(shù)。
35、進(jìn)一步地,所述的步驟3中,算術(shù)編碼器中使用的概率模型是高斯混合模型,包含3個(gè)高斯分布。
36、進(jìn)一步地,步驟4中,對(duì)編碼后的碼流進(jìn)行解碼,恢復(fù)各子帶系數(shù)的概率分布以及對(duì)應(yīng)的子帶系數(shù)值,,……,;
37、使用與編碼階段相同的上下文模型,得到系數(shù)概率分布的參數(shù),恢復(fù)每個(gè)系數(shù)的概率分布;
38、使用與編碼階段相同的概率模型,根據(jù)上下文模型生成的參數(shù),還原每個(gè)系數(shù)的概率分布用于算術(shù)解碼;
39、算術(shù)解碼器,根據(jù)概率模型的輸出逐步解碼比特流,恢復(fù)各子帶系數(shù)的原始值。
40、進(jìn)一步地,步驟5中,對(duì)解碼出的各子帶系數(shù)進(jìn)行與步驟2對(duì)應(yīng)的多級(jí)小波逆變換具體為從最高頻的子帶開始,逐級(jí)進(jìn)行逆變換;
41、對(duì)最后一次小波變換生成的四個(gè)子帶、、、進(jìn)行逆變換,得到上一級(jí)的低頻子帶;
42、合并上一級(jí)的四個(gè)子帶、、、,得到再上一級(jí)的低頻子帶;
43、重復(fù)這一過程,最終將最高級(jí)的子帶系數(shù)、、、值,合并得到圖像的完整像素信息。
44、進(jìn)一步地,二維不可分小波逆變換是二維不可分小波變換嚴(yán)格的逆過程,包括以下步驟:
45、逆更新、逆預(yù)測(cè)和合并,逆更新、逆預(yù)測(cè)使用的濾波器參數(shù)與正變換完全一致;
46、同樣地,每次經(jīng)過濾波器后需要進(jìn)行舍入運(yùn)算,以確保所有操作的結(jié)果都是整數(shù),從而實(shí)現(xiàn)無(wú)損的圖像重建;逆更新和逆預(yù)測(cè)對(duì)應(yīng)的數(shù)學(xué)表達(dá)式如下:
47、,
48、,
49、,
50、,
51、其中 p、 u表示預(yù)測(cè)濾波器和更新濾波器,[?]表示舍入運(yùn)算,*表示卷積運(yùn)算。將得到的四個(gè)分量值、、、合并得到逆變化結(jié)果。
52、進(jìn)一步地,還包括步驟7:構(gòu)建損失函數(shù),利用優(yōu)化器對(duì)整體圖像壓縮模型進(jìn)行端到端訓(xùn)練優(yōu)化,得到最優(yōu)模型。
53、本發(fā)明的有益效果:
54、本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)在于:
55、(1)傳統(tǒng)的小波變換在進(jìn)行二維分解時(shí),先水平再垂直變換需要六個(gè)舍入運(yùn)算,二維不可分小波變換只需要四個(gè)舍入運(yùn)算。舍入運(yùn)算越少,產(chǎn)生的舍入誤差越小。所以使用二維不可分小波變換的圖像壓縮方法相比于現(xiàn)有的使用經(jīng)典二維小波變化的方法可以得到更好的無(wú)損壓縮效果。
56、(2)在端到端圖像壓縮方法中,采用二維不可分小波變換,其濾波器采用卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并與圖像壓縮方法中其他模塊所使用的參數(shù)一同基于深度學(xué)習(xí)進(jìn)行整體優(yōu)化。這個(gè)過程持續(xù)對(duì)模型進(jìn)行訓(xùn)練和優(yōu)化,從而使其性能不斷提升,實(shí)現(xiàn)更卓越的無(wú)損壓縮效果。
57、本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后具體實(shí)施方式部分予以詳細(xì)說明。