本發(fā)明涉及一種圖像處理方法,特別是涉及一種圖像及視頻壓縮方法,應(yīng)用于數(shù)據(jù)管理和數(shù)據(jù)傳輸技術(shù)利用。
背景技術(shù):
圖像的數(shù)據(jù)量一般較大,如果不對其進(jìn)行壓縮而直接傳輸,將對現(xiàn)有的網(wǎng)絡(luò)資源造成很大的負(fù)擔(dān)。如今雖然已經(jīng)存在很多比較高效的圖像壓縮算法,最常見的如JPEG、H.261、MPEG等。但這些算法往往需要對信號進(jìn)行復(fù)雜的計算,通過運(yùn)算去除圖像中的冗余信息。因此這些壓縮方法對于計算機(jī)的性能有較高要求,并不適用于對編碼端有較高功耗限制的場合,比如無線傳感網(wǎng)絡(luò)。
近幾年來逐漸發(fā)展起來的壓縮感知技術(shù)卻能在一定程度上很好地解決以上兩個問題。壓縮感知是由Donoho[1]等人在2006年首次提出來的。作為一種新的信號處理理論,壓縮感知可以通過遠(yuǎn)低于奈奎斯特定理所要求的采樣率對信號進(jìn)行隨機(jī)觀測,此時將信號的采集和數(shù)據(jù)的壓縮合成為了一個過程,這大大降低了編碼端的復(fù)雜度,當(dāng)然其代價就是必須得在解碼端進(jìn)行復(fù)雜的運(yùn)算,從而恢復(fù)原始的信號。研究表明只要信號滿足稀疏的特性,壓縮感知技術(shù)就能表現(xiàn)出很好的性能。但是,壓縮感知編碼方法一開始并沒有考慮人類的視覺特性,即仍然存在進(jìn)一步改進(jìn)的空間。
[1]Candès E J,Romberg J,Tao T,“Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information,”IEEE Transactions on Information Theory,52(2),489-509(2006).
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)問題,本發(fā)明的目的在于克服已有技術(shù)存在的不足,提供一種基于感知及隨機(jī)置換的圖像壓縮感知方法,首次提出將JND模型用于對原始圖像進(jìn)行處理,從而使圖像信號更加稀疏,最終達(dá)到提高圖像質(zhì)量的目的。本發(fā)明方法能有效地降低編碼端的計算復(fù)雜度,能夠適用于編碼端計算能力弱而同時解碼端擁有強(qiáng)大計算能力的情景。此外,本發(fā)明對于壓縮感知技術(shù)在視頻壓縮中的應(yīng)用也具有重要的借鑒意義。
為達(dá)到上述發(fā)明創(chuàng)造目的,本發(fā)明采用下述技術(shù)方案:
一種基于感知及隨機(jī)置換的圖像壓縮感知方法,包括如下步驟:
a.分塊DCT變換:將原始圖像分割成n×n的圖像塊,然后對每個圖像塊分別進(jìn)行二維的DCT變換,得到一系列原始的DCT系數(shù)值;
b.JND預(yù)處理:在DCT域利用JND模型計算JND閾值,并利用計算得到的JND閾值對在所述步驟a中得到的原始的DCT系數(shù)值進(jìn)行預(yù)處理,即將小于JND閾值的DCT值置零,同時大于JND閾值的DCT值保持不變,JND預(yù)處理計算公式如下:
在上述公式中,DCTafter為進(jìn)行JND預(yù)處理后的計算結(jié)果DCT值,DCTbefore為在所述步驟a中得到的原始的DCT系數(shù)值,JND為JND閾值;
c.隨機(jī)置換:對經(jīng)過步驟b的JND預(yù)處理后得到的DCT值數(shù)據(jù)進(jìn)行隨機(jī)置換;
d.隨機(jī)測量:利用隨機(jī)矩陣對經(jīng)過所述步驟c隨機(jī)置換后得到數(shù)據(jù)進(jìn)行隨機(jī)測量,得到壓縮感知的測量值,完成對所述步驟a的原始圖像數(shù)據(jù)的壓縮過程,得到圖像壓縮數(shù)據(jù);對經(jīng)過所述步驟c隨機(jī)置換后得到數(shù)據(jù)進(jìn)行隨機(jī)測量時,優(yōu)選測量率不低于0.3,進(jìn)一步優(yōu)選測量率不低于0.4;作為優(yōu)選的技術(shù)方案,對經(jīng)過所述步驟c隨機(jī)置換后得到數(shù)據(jù)進(jìn)行隨機(jī)測量時,首先通過計算機(jī)產(chǎn)生一個隨機(jī)矩陣,然后將該矩陣與信號相乘得到測量值,這就完成了信號的測量,得到圖像壓縮數(shù)據(jù);在進(jìn)行隨機(jī)置換時,優(yōu)選事先確定隨機(jī)置換的交換位置,并設(shè)定一個整數(shù)作為隨機(jī)種子數(shù)值,來表征所有的數(shù)值交換位置,這樣便不需要傳輸具體的位置數(shù)據(jù)了,也有利于得到相同的實(shí)驗(yàn)結(jié)果;
e.信號重建與圖像恢復(fù):將獲得的在所述d中得到的圖像壓縮數(shù)據(jù)進(jìn)行信號重建,初步恢復(fù)出信號,然后按照所述步驟c的逆向隨機(jī)置換方法,再對恢復(fù)的數(shù)據(jù)進(jìn)行DCT反變換,最終得到恢復(fù)圖像。
作為本發(fā)明優(yōu)選的技術(shù)方案,在所述d中得到的圖像壓縮數(shù)據(jù)通過數(shù)據(jù)傳輸后,再通過所述步驟e進(jìn)行信號重建與圖像恢復(fù)。
最小可覺察失真,Just Noticeable Distortion,JND,是指人類視覺系統(tǒng)存在的各種視覺屏蔽效應(yīng),表現(xiàn)為人眼要能覺察到像素點(diǎn)的變化,必須超過的一定閾值。利用JND的這一特性,可以進(jìn)一步提高信號的稀疏性,從而提高壓縮感知技術(shù)對于圖像的壓縮效率。本發(fā)明首次提出將JND模型用于對原始圖像進(jìn)行處理,從而使圖像信號更加稀疏,最終達(dá)到提高圖像質(zhì)量的目的。此外,本發(fā)明對于壓縮感知技術(shù)在視頻壓縮中的應(yīng)用也具有重要的借鑒意義。
本發(fā)明方法主要是考慮到人眼存在視覺掩蓋效應(yīng),因此借助于JND模型,能有效地去除圖像中存在的視覺冗余,與此同時,也提高了信號的稀疏度。首先將圖像進(jìn)行分塊并對圖像塊進(jìn)行DCT變換;然后利用JND模型計算圖像在DCT域的JND閾值;接著用計算得到的JND閾值對原始圖像所對應(yīng)的DCT系數(shù)進(jìn)行預(yù)處理,具體做法是將DCT系數(shù)中小于JND閾值的部分置為零,大于JND閾值的部分則保持不變,由于JND模型能在對DCT系數(shù)進(jìn)行適當(dāng)調(diào)整的情況下保證圖像不會出現(xiàn)人眼可以覺察的變化,因此本發(fā)明方法是合理的。而且采用本發(fā)明方法最終能使DCT系數(shù)中出現(xiàn)大量的零,這樣做的目的是為了增加信號的稀疏度,從而使壓縮感知技術(shù)在這里能取得更好的效果。下面還要將處理后的數(shù)據(jù)進(jìn)行隨機(jī)置換,這是由于圖像信號屬于非平穩(wěn)信號,即有些區(qū)域細(xì)節(jié)很豐富而另一些區(qū)域很平坦,表現(xiàn)在DCT系數(shù)上就是有些區(qū)域高頻系數(shù)的數(shù)值比較大而另一些區(qū)域高頻系數(shù)的數(shù)值較小。這種特性對于壓縮感知中測量率的確定是很不利的。如果采用較低的測量率,顯然細(xì)節(jié)豐富的區(qū)域會由于測量率不夠而使得恢復(fù)效果不理想;如果采用較高的測量率,對于比較平滑的區(qū)域這樣的高測量率顯然是一種浪費(fèi)。更進(jìn)一步,在一些細(xì)節(jié)非常豐富的區(qū)域,信號幾乎是不稀疏的,這時即使測量率非常高,由于不滿足信號的稀疏特性,信號還是無法被較好地恢復(fù)。從以上分析可以看出,如果不采取其他措施必然導(dǎo)致圖像中各個區(qū)域的恢復(fù)質(zhì)量并不一致,即平滑的區(qū)域恢復(fù)質(zhì)量較好而紋理豐富的區(qū)域恢復(fù)質(zhì)量可能較差。而本發(fā)明進(jìn)行數(shù)據(jù)的隨機(jī)交換能很好地平衡圖像不同區(qū)域之間的稀疏性,原來的非平穩(wěn)信號通過隨機(jī)交換就能變成平穩(wěn)信號,這時就不會出現(xiàn)前面提到的問題了,從而也提高了壓縮的效率。
本發(fā)明與現(xiàn)有技術(shù)相比較,具有如下顯而易見的突出實(shí)質(zhì)性特點(diǎn)和顯著優(yōu)點(diǎn):
1.本發(fā)明方法在降低編碼端復(fù)雜度的同時具有一定的抗數(shù)據(jù)丟失的能力,能夠適用于編碼端計算能力差而同時擁有強(qiáng)大的解碼端的場合;
2.本發(fā)明利用計算得到的JND閾值,對原始圖像所對應(yīng)的DCT系數(shù)進(jìn)行預(yù)處理,顯著增加信號的稀疏度,從而使壓縮感知技術(shù)在這里能取得更好的效果,本發(fā)明將處理后的數(shù)據(jù)進(jìn)行隨機(jī)置換,這樣原來的非平穩(wěn)信號就能通過隨機(jī)交換變成平穩(wěn)信號,從而也提高了壓縮的效率,本發(fā)明方法適用于編碼端對功耗有較高限制,計算能力較弱而同時解碼端具有較強(qiáng)計算能力的情景。
附圖說明
圖1為本發(fā)明優(yōu)選實(shí)施例圖像壓縮感知方法的操作程序框圖。
圖2為本發(fā)明優(yōu)選實(shí)施例Monarch圖像和Monarch圖像在JND預(yù)處理前后每個圖像塊中非零值的個數(shù)分布對比示意圖。
圖3為本發(fā)明優(yōu)選實(shí)施例DCT系數(shù)隨機(jī)置換過程示意圖。
圖4為在本發(fā)明優(yōu)選實(shí)施例算法下和其他不同算法下Barbara的恢復(fù)質(zhì)量比較圖像。
具體實(shí)施方式
本發(fā)明的優(yōu)選實(shí)施例詳述如下:
在本實(shí)施例中,參見圖1~4,本實(shí)施例利用視覺感知特性及壓縮感知技術(shù)的圖像壓縮方法,具體采用如下技術(shù)方案,步驟如圖1流程圖所示。在matlab2014a平臺上編程實(shí)現(xiàn)本發(fā)明方法,首先對圖像進(jìn)行分塊DCT變換,之后建立DCT域的JND模型,并利用該模型對DCT系數(shù)進(jìn)行預(yù)處理,再對處理后的數(shù)據(jù)進(jìn)行隨機(jī)打亂,最后完成隨機(jī)測量。在解碼端通過逆過程實(shí)現(xiàn)圖像的恢復(fù)重建。
在本實(shí)施例中,參見圖1~4,一種基于感知及隨機(jī)置換的圖像壓縮感知方法,包括如下步驟:
a.分塊DCT變換:將原始圖像分割成n×n的圖像塊,然后對每個圖像塊分別進(jìn)行二維的DCT變換,得到一系列原始的DCT系數(shù)值;由于圖像信號一般比較大,通常至少會由上萬個甚至百萬個像素點(diǎn)組成,如果直接對原始圖像進(jìn)行處理將耗費(fèi)巨大的內(nèi)存,因此一般需要將圖像進(jìn)行分塊處理,以降低內(nèi)存消耗和計算的復(fù)雜度。這里先將圖像分割成n×n=16×16的小塊,然后對每一個圖像塊分別進(jìn)行二維的DCT變換;
b.JND預(yù)處理:在DCT域利用JND模型計算JND閾值,并利用計算得到的JND閾值對在所述步驟a中得到的原始的DCT系數(shù)值進(jìn)行預(yù)處理,即將小于JND閾值的DCT值置零,同時大于JND閾值的DCT值保持不變,JND預(yù)處理計算公式如下:
在上述公式中,DCTafter為進(jìn)行JND預(yù)處理后的計算結(jié)果DCT值,DCTbefore為在所述步驟a中得到的原始的DCT系數(shù)值,JND為JND閾值;壓縮感知技術(shù)能實(shí)現(xiàn)的前提是要求信號是稀疏的,而且信號的稀疏程度越高,即信號中數(shù)值為零的數(shù)據(jù)越多,則最終圖像的恢復(fù)質(zhì)量也會越好;JND模型是基于人類的視覺特性開發(fā)的,模型的選擇沒有特別的要求,其中利用DCT域的JND模型能將一些小于JND值的DCT系數(shù)置零,該過程達(dá)到了增加信號稀疏度的目的,而同時又能保證圖像不發(fā)生能引起人眼察覺的變化;這一特性使得本實(shí)施例方法可以在相同測量率下提高最終恢復(fù)圖像的主觀質(zhì)量,通過建立DCT域的JND模型,并對該模型原始的DCT系數(shù)進(jìn)行預(yù)處理,即將小于JND值的DCT系數(shù)置零,同時大于JND值的DCT系數(shù)將保持不變;圖2是對Monarch進(jìn)行JND預(yù)處理的實(shí)驗(yàn)結(jié)果,原始圖像的分辨率為256×256,參見圖2(a),然后將其按照16×16進(jìn)行分塊DCT變換,接著通過DCT域的JND模型計算閾值,并利用式(1)對原始的DCT系數(shù)進(jìn)行預(yù)處理;從圖2中可以看出預(yù)處理之后的非零值明顯減少了,在圖2(b)中,上方的線表示原始圖像塊中非零值的個數(shù)分布,下方的線表示在JND預(yù)處理后圖像塊中非零值的個數(shù)分布,可見經(jīng)過JND預(yù)處理后,使信號變得非常稀疏,有利于最終圖像質(zhì)量的提升;
c.隨機(jī)置換:對經(jīng)過步驟b的JND預(yù)處理后得到的DCT值數(shù)據(jù)進(jìn)行隨機(jī)置換;通常,圖像是典型的非平穩(wěn)信號,如果對圖像的不同區(qū)域都采用相同的測量率,這樣顯然是不太合理的;因?yàn)閳D像的某些區(qū)域,即紋理豐富區(qū)域幾乎在任何空間中都是不稀疏的,對于這些區(qū)域僅僅通過提高測量率是無法提高圖像質(zhì)量的;而對于某些區(qū)域信號可能非常稀疏,這時過高的測量率反而是一種浪費(fèi);本實(shí)施例采用隨機(jī)置換DCT系數(shù)的方法可以將非平穩(wěn)信號轉(zhuǎn)換為平穩(wěn)信號,這樣圖像信號在整體上其稀疏度會趨于一個中間值,就不會出現(xiàn)某些區(qū)域不稀疏而另一些區(qū)域非常稀疏的情況了;隨機(jī)置換方法是通過將DCT隨機(jī)交換來達(dá)到使信號平穩(wěn)的效果,交換過程如圖3所示。圖3(a)為DCT系數(shù)隨機(jī)置亂過程,然后將圖像進(jìn)行n×n分塊,見圖3(b),再將DCT系數(shù)展開成列向量,參見圖3(c),將DCT系數(shù)進(jìn)行隨機(jī)置換;
d.隨機(jī)測量:利用隨機(jī)矩陣對經(jīng)過所述步驟c隨機(jī)置換后得到數(shù)據(jù)進(jìn)行隨機(jī)測量,得到壓縮感知的測量值,完成對所述步驟a的原始圖像數(shù)據(jù)的壓縮過程,得到圖像壓縮數(shù)據(jù);本步驟過程首先通過計算機(jī)產(chǎn)生一個隨機(jī)矩陣,然后將該矩陣與信號相乘得到測量值,這就完成了信號的測量,同時由于測量值信號向量遠(yuǎn)小于原始信號的長度因此也是一個數(shù)據(jù)壓縮的過程;
e.信號重建與圖像恢復(fù):將獲得的在所述d中得到的圖像壓縮數(shù)據(jù)進(jìn)行信號重建,初步恢復(fù)出信號,然后按照所述步驟c的逆向隨機(jī)置換方法,再對恢復(fù)的數(shù)據(jù)進(jìn)行DCT反變換,最終得到恢復(fù)圖像。本實(shí)施例壓縮感知方法對信號的重建有很多比較成熟的技術(shù)比如凸優(yōu)化,線性規(guī)劃等。首先通過這些方法初步恢復(fù)出信號。然后,由于對數(shù)據(jù)進(jìn)行了隨機(jī)置換,因此這里還需要將恢復(fù)出來的數(shù)據(jù)換回到其原先的位置。為了保證壓縮效率,隨機(jī)置換的交換位置是事先確定的,在計算機(jī)上只需要確定隨機(jī)種子,采用一個整數(shù)便能確定所有的交換位置,這樣便不需要傳輸具體的位置數(shù)據(jù)了,也有利于得到相同的實(shí)驗(yàn)結(jié)果。最后,對交換后的數(shù)據(jù)進(jìn)行DCT反變換就能得到恢復(fù)圖像了。
實(shí)驗(yàn)測試分析:
在不同算法下Barbara的恢復(fù)質(zhì)量比較,參見表1.PSNR不同的算法相比較(dB),得到不同算法下Barbara的恢復(fù)質(zhì)量比較,參見圖4,其中圖4(a)為原始圖像,圖4(b)為BCS-SPL恢復(fù)的圖像,圖4(c)為LiRan恢復(fù)的圖像,圖4(d)為CRP恢復(fù)的圖像,圖4(e)為本實(shí)施例Proposed恢復(fù)的圖像。
表1 PSNR不同的算法相比較(dB)
從圖4中明顯可以看出本方法具有很好的效果,具體的實(shí)驗(yàn)數(shù)據(jù)可以參考表1.從表中可以看出當(dāng)測量率大于0.3時,本實(shí)施例取得比其他方法更好的實(shí)驗(yàn)結(jié)果。
本實(shí)施例首先將圖像進(jìn)行分塊并對圖像塊進(jìn)行DCT變換;然后利用JND模型計算圖像在DCT域的JND閾值;接著用計算得到的JND閾值對原始圖像所對應(yīng)的DCT系數(shù)進(jìn)行預(yù)處理,具體做法是將DCT系數(shù)中小于JND閾值的部分置為零,大于JND閾值的部分則保持不變,最終能使DCT系數(shù)中出現(xiàn)大量的零,本實(shí)施例這樣做的目的是為了增加信號的稀疏度,從而使壓縮感知技術(shù)在這里能取得更好的效果。本實(shí)施例后面還要將處理后的數(shù)據(jù)進(jìn)行隨機(jī)置換,這樣原來的非平穩(wěn)信號就能通過隨機(jī)交換變成平穩(wěn)信號,從而也提高了壓縮的效率。本實(shí)施例方法在降低編碼端復(fù)雜度的同時具有一定的抗數(shù)據(jù)丟失的能力,能夠適用于編碼端計算能力差而同時擁有強(qiáng)大的解碼端的場合。
上面結(jié)合附圖對本發(fā)明實(shí)施例進(jìn)行了說明,但本發(fā)明不限于上述實(shí)施例,還可以根據(jù)本發(fā)明的發(fā)明創(chuàng)造的目的做出多種變化,凡依據(jù)本發(fā)明技術(shù)方案的精神實(shí)質(zhì)和原理下做的改變、修飾、替代、組合或簡化,均應(yīng)為等效的置換方式,只要符合本發(fā)明的發(fā)明目的,只要不背離本發(fā)明基于感知及隨機(jī)置換的圖像壓縮感知方法的技術(shù)原理和發(fā)明構(gòu)思,都屬于本發(fā)明的保護(hù)范圍。