專利名稱:基于子空間分解的高效數(shù)字圖像大尺度放大方法
技術(shù)領(lǐng)域:
基于子空間分解的高效數(shù)字圖像大尺度放大方法,屬于數(shù)字圖像處理技術(shù)領(lǐng)域。
通用的分塊處理策略在N≤16時是不分塊的,在N>16時才分塊,見文獻W.Lu,Adaptive noise attenuation of seismic image based on singular value decompositionand texture direction detection,in Proc.of IEEE ICIP’2002,Vol.2,pp.465-468,2002.
通用的快速SVD算法見文獻G.Golub,C.Van Loan,Matrix Computations,Baltimore,MDJohns Hopkins Univ.Press,1992.其步驟如下(1)計算分塊后子矩陣A(尺寸為M*L)的QR分解A=QR式中,Q是M*L的列正交矩陣,R是L*L的上三角矩陣。
(2)利用標(biāo)準的SVD算法計算矩陣R的奇異值分解R=U′EVT(3)計算左奇異值向量矩陣U=QU′本發(fā)明的特征在于它是將二維圖像插值轉(zhuǎn)換成若干奇異向量的一維插值的一種插值方法,它依次含有以下步驟(1)向計算機輸入M*N圖像X,選用的一維插值算子,插值尺度;(2)奇異值分解用下述矩陣X表示大小為M*N的圖像M≥N,矩陣元素xij,i=1...M;j=1...N,X=UEVT=Σi=1rσiuiviT]]>其中,E=diag(σ1,σ2…,σr)E奇異值矩陣
U=[u1,u2…,uN]U左奇異值向量矩陣V=[v1,v2…vM] V右奇異值向量矩陣σi,i=1...r為奇異值,ui,i=1...r為左奇異值向量,vi,i=1...r為右奇異值向量。
(3)基于奇異值分解的圖像插值(3.1)利用一維插值算子對兩個左、右奇異值向量進行插值,通過下式得到r個秩為1的本征圖SiI=σiInt1(ui)Int1(vi)i=1...r]]>其中Int1()為一維插值算子。插值可以利用任何現(xiàn)有的一維插值方法。
(3.2)將所有r個本征圖相加后得到插值圖像XI=Σi=1rSiI.]]>當(dāng)N>16,首先要按以下步驟確定分塊處理尺寸,進行分塊(1)按下式確定分塊數(shù)TT-1<(N/16)≤T,(2)再按下式確定分塊用的尺寸LL-1<(N/T)≤L。
當(dāng)所述的一維插值算子為最近鄰一維插值算子(SVD-Nearest)時,它依次含有以下步驟(1)對數(shù)字圖像進行分塊,分塊尺寸M*L。
(2)對每一塊子圖用已有技術(shù)進行快速SVD,即只計算L個奇異值和2L個奇異向量。
(3)對2L個奇異向量進行一維的最近鄰插值。
(4)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖。
(5)全部子圖插值后合并得到插值圖像。
當(dāng)所述的一維插值算子為線性一維插值算子(SVD-Linear)時,它依次含有以下步驟(1)對數(shù)字圖像進行分塊,分塊尺寸M*L。
(2)對每一塊子圖用已有技術(shù)進行快速SVD,即只計算L個奇異值和2L個奇異向量。
(3)對2L個奇異向量進行一維的線性鄰插值。
(4)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖。
(5)把插值后的全部子圖合并得到插值圖像。
當(dāng)所述的一維插值算子為三次一維插值算子(SVD-Cubic)時,它依次含有以下步驟(1)對數(shù)字圖像進行分塊,分塊尺寸M*L。
(2)對每一塊子圖進行鑲邊,鑲邊列數(shù)為1,設(shè)鑲邊后子圖塊的尺寸為M*L′(3)對每一塊子圖進行快速SVD,即只計算L′個奇異值和2L′個奇異向量。
(4)對2L′個奇異向量進行一維三次插值。
(5)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖。
(6)全部子圖插值后合并得到插值圖像。
所述的插值后的全部子圖合并成插值圖像的步驟,其過程如下(1)當(dāng)放大尺度為d時,則第1塊去掉右邊od列,o為每一塊子圖左右兩邊需要鑲邊的列數(shù),對于最近鄰插值和線性插值為0,對于三次插值算子需要鑲邊1列;(2)第2-T-1塊,去掉右邊od列,去掉左邊od+1列;(3)第T塊,去掉左邊od+1列;(4)合并以上去掉鑲邊后的所有插值處理后的子圖。
仿真實驗證明當(dāng)選用一維的三次插值算子時,插值視覺效果和實際能量誤差都很接近圖像的三次插值結(jié)果,但我們的方法即使用最快的圖像最近鄰方法比較,計算量也大大下降。如對16*8的圖像進行插值,分塊尺寸為16*8,在放大尺度為120時,設(shè)圖像三次插值需要時間為1,則圖像線性插值時間為0.42,圖像最近鄰插值時間為0.295,而我們利用一維的三次插值算子的方法所用的時間僅為0.0158。
圖3.圖像尺寸256*256,分塊尺寸256*16時的放大尺度和運算時間的關(guān)系曲線,圖中曲線標(biāo)號的意義同圖2。
圖4.圖像尺寸1024*16,分塊尺寸1024*16時的放大尺度和運算時間的關(guān)系曲線,圖中曲線標(biāo)號的意義同圖2。
圖5.圖像尺寸1024*64,分塊尺寸1024*16時的放大尺度和運算時間的關(guān)系曲線,圖中曲線標(biāo)號的意義同圖2。
圖6.圖像尺寸16*8,分塊尺寸16*8時的插值誤差的統(tǒng)計曲線,圖中曲線標(biāo)號的意義同圖2。
圖7.圖像尺寸256*256,分塊尺寸256*16時的插值誤差的統(tǒng)計曲線,圖中曲線標(biāo)號的意義同圖2。
圖8.圖像尺寸1024*16,分塊尺寸1024*16時的插值誤差的統(tǒng)計曲線,圖中曲線標(biāo)號的意義同圖2。
圖9.圖像尺寸1024*64,分塊尺寸1024*16時的插值誤差的統(tǒng)計曲線,圖中曲線標(biāo)號的意義同圖2。
(1)確定分塊尺寸,對數(shù)字圖像進行分塊;(2)根據(jù)所采用的一維插值算子決定是否對分塊算子進行鑲邊每一塊子圖左右兩邊需要鑲邊的列數(shù)為o=p/2-1,p為一維插值算子的長度,取值為偶數(shù)。如最近鄰插值和線性插值算子的長度為2,所以不用鑲邊,三次插值算子長度為4,需要鑲邊1列。設(shè)鑲邊后子圖塊的尺寸為M*L′,不鑲邊時L′=L;當(dāng)不需鑲邊時就直接進入下一步;(3)對每一塊子圖進行快速SVD,即只計算L′個奇異值和2L′個奇異向量;(4)對2L′個奇異向量進行一維插值。可以使用任何現(xiàn)有的算法;(5)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖;(6)插值后的全部子圖合并得到插值圖像執(zhí)行流程框圖見
圖1。
在我們的仿真實驗中,使用HP-Pavilion N5425計算機。我們用一維線性插值和一維三次插值算子。下面稱我們的利用一維線性插值算子的圖像插值為SVDLinear,利用一維三次插值算子的圖像插值為SVDCubic。
結(jié)果比較是在我們的算法和圖像最近鄰插值,線性插值,三次插值之間進行的。我們采用了MATLB中的SVD,1D,2D插值算法,并以Cubic圖像插值為標(biāo)準,進行了插值速度及誤差的統(tǒng)計。在統(tǒng)計運算時間時,假設(shè)Cubic圖像插值時間為1,每一種情況重復(fù)進行100次,得到各種方法的相對運算時間。從處理結(jié)果來看,SVDLinear和圖像線性插值結(jié)果一樣,SVDCubic在視覺和誤差上都很接近圖像的三次插值,但運算時間少的多。如對16*8的圖像進行插值,分塊尺寸為16*8。在放大尺度為120時,圖像線性插值時間為0.42,圖像最近鄰插值時間為0.295,SVDLinear時間為0.0148,SVDCubic時間為0.0158。
下面我們給出幾個仿真結(jié)果,Linear是圖像線性插值,Nearest是圖像最近鄰插值。圖2-5是運算時間的統(tǒng)計,我們假設(shè)圖像三次插值時間為1,橫坐標(biāo)是放大尺度,縱坐標(biāo)是相對運算時間。圖6-9是插值誤差的統(tǒng)計,我們用圖像三次插值結(jié)果為標(biāo)準,橫坐標(biāo)是放大尺度,縱坐標(biāo)是能量誤差。
權(quán)利要求
1.基于子空間分解的高效數(shù)字圖像大尺度放大方法,含有用于圖像子空間分解的奇異值分解(SVD)的步驟其特征在于,它是將二維圖像插值轉(zhuǎn)換成若干奇異向量的一維插值的一種插值方法,它依次含有以下步驟(1)向計算機輸入M*N圖像X,選用的一維插值算子,插值尺度;(2)奇異值分解用下述矩陣X表示大小為M*N的圖像M≥N,矩陣元素xij,i=1...M;j=1...N,X=UEVT=Σi=1rσiuiviT]]>其中,E=diag(σ1,σ2…,σr) E奇異值矩陣U=[u1,u2…,uN] U左奇異值向量矩陣V=[v1,v2…vM] V右奇異值向量矩陣σi,i=1...r為奇異值,ui,i=1...r為左奇異值向量,vi,i=1...r為右奇異值向量;(3)基于奇異值分解的圖像插值(3.1)利用一維插值算子對兩個左、右奇異值向量進行插值,通過下式得到r個秩為1的本征圖SiI=σiInt1(ui)Int1(vi)]]>i=1...r,其中Intl()為一維插值算子,插值可以利用任何現(xiàn)有的一維插值方法;(3.2)將所有r個本征圖相加后得到插值圖像XI=Σi=1rSiI.]]>
2.根據(jù)權(quán)利要求,所述的基于子空間分解的高效數(shù)字圖像大尺度放大方法其特征在于,當(dāng)N>16,首先要按以下步驟確定分塊尺寸,進行分塊處理(1)按下式確定分塊數(shù)TT-1<(N/16)≤T,(2)再按下式確定分塊用的尺寸LL-1<(N/T)≤L。
3.根據(jù)權(quán)利要求1,2所述的基于子空間分解的高效數(shù)字圖像大尺度放大方法,其特征在于,當(dāng)所述的一維插值算子為最近鄰一維插值算子(SVD-Nearest)時,它依次含有以下步驟(1)對數(shù)字圖像進行分塊,分塊尺寸M*L;(2)對每一塊子圖用已有技術(shù)進行快速SVD,即只計算L個奇異值和2L個奇異向量;(3)對2L個奇異向量進行一維的最近鄰插值;(4)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖;(5)全部子圖插值后合并得到插值圖像。
4.根據(jù)權(quán)利要求1,2所述的基于子空間分解的高效數(shù)字圖像大尺度放大方法,其特征在于,當(dāng)所述的一維插值算子為線性一維插值算子(SVD-Linear)時,它依次含有以下步驟(1)對數(shù)字圖像進行分塊,分塊尺寸M*L;(2)對每一塊子圖用已有技術(shù)進行快速SVD,即只計算L個奇異值和2L個奇異向量;(3)對2L個奇異向量進行一維的線性鄰插值;(4)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖;(5)把插值后的全部子圖合并得到插值圖像。
5.根據(jù)權(quán)利要求1,2所述的基于子空間分解的高效數(shù)字圖像大尺度放大方法,其特征在于,當(dāng)所述的一維插值算子為三次一維插值算子(SVD-Cubic)時,它依次含有以下步驟(1)對數(shù)字圖像進行分塊,分塊尺寸M*L;(2)對每一塊子圖進行鑲邊,鑲邊列數(shù)為1,設(shè)鑲邊后子圖塊的尺寸為M*L′;(3)對每一塊子圖進行快速SVD,即只計算L′個奇異值和2L′個奇異向量;(4)對2L′個奇異向量進行一維三次插值;(5)利用奇異值矩陣和插值后的奇異向量矩陣重構(gòu)得到插值后的子圖;(6)全部子圖插值后合并得到插值圖像。
6.根據(jù)權(quán)利要求1所述的基于子空間分解的高效數(shù)字圖像大尺度放大方法,其特征在于,所述的插值后的全部子圖合并成插值圖像的步驟,其過程如下(1)當(dāng)放大尺度為d時,第1塊去掉右邊od列,o為每一塊子圖左右兩邊要鑲邊的列數(shù),對于最近鄰插值和線性插值為0,對于三次插值算子窗要鑲邊1列;(2)第2-T-1塊,去掉右邊od列,去掉左邊od+1列;(3)第T塊,去掉左邊od+1列;(4)合并以上去掉鑲邊后的所有插值處理后的子圖。
全文摘要
基于子空間分解的高效數(shù)字圖像大尺度放大方法屬于數(shù)字圖像處理技術(shù)領(lǐng)域,其特征在于它是把二維圖像插值轉(zhuǎn)換成若干奇異向量的一維插值的一種插值方法,它依次含有奇異值分解、奇異值向量的一維插值和奇異值重構(gòu)三個步驟,它還通過分塊處理算法大大地降低了在大尺度放大情況下的插值復(fù)雜度。同時,在同樣的圖像尺寸和分塊尺寸條件下,本方法的運算時間和圖像二維三次插值方法的運算時間的比值隨放大尺度的增加而減少。如在分塊尺寸為16*8,放大尺度為120時,設(shè)圖像三次插值需要時間為1,則圖像線性插值時間為0.42,圖像最近鄰插值時間為0.295,而本方法采用三次一維插值時所用的時間僅為0.0158。
文檔編號G06T5/00GK1416103SQ0215546
公開日2003年5月7日 申請日期2002年12月13日 優(yōu)先權(quán)日2002年12月13日
發(fā)明者陸文凱 申請人:清華大學(xué)