本發(fā)明屬于遙感圖像處理技術(shù)領域,涉及基于區(qū)域相似性低秩表示方法,具體是一種基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法,用于高光譜遙感圖像的數(shù)據(jù)降維和分類。
背景技術(shù):高光譜遙感技術(shù)利用成像光譜儀對地表物成像,形成由連續(xù)波段圖像組成三維數(shù)據(jù),已經(jīng)被廣泛地應用于目標識別,精細農(nóng)業(yè),資源勘探,環(huán)境監(jiān)測等領域。高光譜遙感技術(shù)獲取的圖像包含了豐富的空間、輻射和光譜三重信息,一方面,大量的信息為像元分類提供了大量的依據(jù),但另一方面,數(shù)據(jù)量大,導致高光譜圖像處理計算復雜度很高,也給數(shù)據(jù)的存儲、傳遞和顯示帶來了挑戰(zhàn);高光譜圖像的波段多,而且相鄰波段之間的波長差異往往只在納米數(shù)量級,它們之間的相關(guān)系數(shù)一般都非常高,因此,在鄰近波段之間存在大量的冗余信息,也會降低高光譜圖像的分類精度。為了有效地減少運算量,降低計算復雜度以及改善分類效率、提高分類精度,因此高光譜圖像的降維在高光譜圖像分類應用中具有非常重要的作用。目前,已經(jīng)有許多針對高光譜圖像的維數(shù)約簡方法被提出,可以分為線性方法和非線性方法。線性方法最經(jīng)典的是主成分分析方法(Principalcomponentanalysis,PCA),線性判別分析(Lineardiscriminantanalysis,LDA),并在高光譜圖像上得到了有效地應用。然而,PCA和LDA的全局的線性數(shù)據(jù)限制了這些方法在非高斯分布數(shù)據(jù)上的有效性,由于PCA和LDA等方法是將三維的圖像拉伸轉(zhuǎn)換為二維的圖像,丟失了圖像的空間結(jié)構(gòu)信息,因此也沒有利用到高光譜圖像數(shù)據(jù)的空間信息。非線性方法主要有基于核的方法,以及近年來的流形學習方法。流形學習方法可以通過構(gòu)建局部線性重構(gòu)的方法描述數(shù)據(jù)的局部幾何結(jié)構(gòu),比如等距特征映射(Isometricfeaturemapping,ISOMAP),局部保留映射(Localitypreservingprojections,LPP)等。但是由于高光譜數(shù)據(jù)的大數(shù)據(jù)量,因此無法構(gòu)造出ISOMAP等流形學習中相似性矩陣,限制了很多流形學習的降維方法在高光譜圖像上的應用,而且丟失了數(shù)據(jù)的全局信息。目前高光譜圖像降維方法主要存在的問題是:僅利用高光譜圖像的譜段信息,并沒有有效地利用高光譜圖像的空間信息;要處理的數(shù)據(jù)量很大,降維后的圖像不能很好地保留原高光譜圖像數(shù)據(jù)提供的所有有用信息。
技術(shù)實現(xiàn)要素:本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提出一種利用高光譜圖像的空間信息,有效地提高高光譜圖像分類的正確率的基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法。本發(fā)明是一種基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法,包括如下步驟:步驟1:輸入高光譜圖像X,該高光譜圖像X包含c類像素點,所有類別像素點共有N個像素點,圖像的每一個像素點為一個樣本,每個樣本用一個特征向量xi,i=1,...,N進行表示,R表示實數(shù)域,樣本的特征維數(shù)為H。步驟2:根據(jù)均值漂移方法將高光譜圖像X分割成M塊,得到預分割后的高光譜圖像XG,對分割后的每一個圖像塊里的所有樣本點做平均,每一個圖像塊得到一個新樣本點m=1,...,M,由新樣本點得到新的樣本集步驟3:對均值漂移預分割后的高光譜圖像XG構(gòu)造相似性矩陣U。步驟4:使用低秩表示方法計算新的樣本集Xnew的低秩系數(shù)矩陣Z,采用非精確增廣拉格朗日乘子法獲得低秩系數(shù)矩陣Z。步驟5:根據(jù)相似性矩陣U和低秩系數(shù)矩陣Z,構(gòu)造基于新的樣本集Xnew的特征值方程f,設置降維后的維數(shù)d,并學習出降維映射矩陣A。步驟6:將原始高光譜圖像X通過降維映射矩陣A映射到低維空間Rd中,得到降維后的樣本集x′i是降維后的樣本集X′的第i個樣本。步驟7:在降維后的樣本集X′中每類選取t個樣本作為訓練樣本集Xp,其余的樣本作為測試樣本集Xq,將訓練樣本集Xp輸入到支撐矢量機SVM中進行分類,學習出來一個分類器,然后將測試樣本集Xq輸入到這個分類器中,得到測試樣本Xq的分類標簽向量Y,標簽向量Y是高光譜圖像X分類的結(jié)果。針對高光譜圖像降維技術(shù)中對高光譜圖像空間信息的利用不足,而且沒有有效地利用到高光譜圖像提供的所有有用信息,使得在高光譜圖像進行降維后,沒有較大程度的提高高光譜圖像的分類精度,本發(fā)明的技術(shù)方案是,首先使用圖像的均值漂移技術(shù)對高光譜圖像進行預分割,然后對預分割后的圖像塊的均值進行低秩表示,再使用預分割后的高光譜圖像構(gòu)造區(qū)域相似性矩陣,通過低秩系數(shù)矩陣和區(qū)域相似性矩陣構(gòu)造出特征方程,學習出降維的映射矩陣,將原始高維數(shù)據(jù)轉(zhuǎn)換到低維空間中再進行分類,從而獲得更好的分類性能。本發(fā)明的實現(xiàn)還在于:步驟3所述的構(gòu)造使用均值漂移預分割后的高光譜圖像XG構(gòu)造相似性矩陣U,是通過從高光譜圖像X數(shù)據(jù)集中隨機選取n個樣本點構(gòu)成隨機樣本集XU,xl和xk是隨機樣本集XU中的第l個和第k個樣本,l,k=1,...,n,然后構(gòu)造一個n×n的零矩陣U。當樣本點xl和xk,l,k=1,...,n屬于步驟2中預分割后高光譜圖像XG中的同一個區(qū)域時,Ul,k=1;當樣本點xl和xk分別屬于不同區(qū)域時,Ul,k=0。由于高光譜圖像具有區(qū)域一致性,所以預分割后的每一個圖像塊基本上是類屬于同一類別的,本發(fā)明使用均值漂移進行圖像預分割有效地利用到高光譜圖像的局部結(jié)構(gòu)信息,因此在構(gòu)造降維映射矩陣過程中利用到區(qū)域相似性信息,對高光譜圖像的分類的有效性具有非常顯著的作用。本發(fā)明的實現(xiàn)還在于:步驟5所述的根據(jù)相似性矩陣U和低秩系數(shù)矩陣Z,構(gòu)造基于新的樣本集Xnew的特征值方程f,設置降維后的維數(shù)d,并學習出降維映射矩陣A,按如下步驟進行:5a)令矩陣Zβ=Z+ZT-ZTZ,ZT表示Z的轉(zhuǎn)置;5b)對相似性矩陣U的每一行進行求和,得到一個列向量Q,對Q進行對角化,得到對角矩陣D,然后計算拉格朗日算子L=D-U;5c)構(gòu)造基于高光譜圖像預分割后新的樣本集Xnew和隨機樣本集XU的特征值方程e=1,...,d,其中,ae是第e個特征向量,γe為第e個特征值,d是降維后的維數(shù);5d)求解出該基于高光譜圖像預分割后新的樣本集Xnew和隨機樣本集XU的特征值方程的d個最大特征值γ1,γ2,...,γd及其對應的特征向量a1,a2,…ad;5e)由上述特征向量a1,a2,…ad構(gòu)造出高光譜圖像X的降維映射矩陣A=[a1,a2,…ad]∈RH×d。本發(fā)明通過求解特征值方程學習出映射矩陣,求解出的前d個最大特征值所對應的特征向量包含了高光譜圖像中的大部分的有用信息,因此對高光譜圖像進行維數(shù)約簡后,不僅提高了高光譜圖像分類的速度,同時也提高了高光譜圖像分類的精確度。而且,對高光譜圖像進行低秩表示可以有效地表示高光譜圖像的全局信息,而且利用均值漂移預分割后的圖像進行低秩表示可以有效地降低低秩表示的計算復雜度。本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點:1、本發(fā)明由于采用維數(shù)約減算法對高光譜圖像數(shù)據(jù)進行降維后,再進行分類,大大減少了計算量,并且提高了分類的速度。2、本發(fā)明由于同時利用高光譜圖像的空間信息和譜段信息構(gòu)造出一個降維的投影矩陣,該投影矩陣包含了更有效地高光譜圖像的信息,因此可以獲得更理想的低維投影空間,從而獲得高維數(shù)據(jù)在低維空間中更精確的表示,提高了后續(xù)分類的準確率。3、本發(fā)表由于采用了區(qū)域相似性結(jié)構(gòu)信息,從而更準確地構(gòu)造出高光譜圖像數(shù)據(jù)降維的映射矩陣,從而提高了降維的有效性。4、本發(fā)表由于采用了結(jié)合圖像的預分割的低秩表示方法,不僅降低了低秩表示的計算復雜度,而且可以表示出高光譜圖像的全局信息,因此在高光譜圖像降維過程中,更有效地對高光譜圖像進行數(shù)據(jù)表示。對比實驗表明,本發(fā)明有效地提高了高光譜遙感圖像的分類準確率。附圖說明圖1是本發(fā)明的流程示意圖;圖2是本發(fā)明中均值漂移分割過程中鄰域區(qū)域以及均值向量的表示圖;圖3是本發(fā)明仿真采用的IndianPine圖像;圖4a、4b是本發(fā)明與現(xiàn)有方法在有標記樣本個數(shù)不同時,采用不同的特征維數(shù)得到的分類結(jié)果曲線圖。具體實施方式下面結(jié)合附圖和實施例對本發(fā)明再作說明實施例1本發(fā)明提出了一種基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法。目前高光譜圖像在軍事和民用領域中得到極其重要的應用。但由于高光譜圖像的豐富的譜段信息不僅包含了大量的冗余信息,而且巨大的數(shù)據(jù)量也影響到高光譜圖像的分類效率以及分類精度,因此高光譜圖像的降維在高光譜圖像分類應用中具有十分重要的作用。針對現(xiàn)有高光譜圖像降維方法沒有充分利用到高光譜圖像的空間結(jié)構(gòu)信息,以及高光譜圖像提供的所有有用信息,結(jié)合均值漂移預分割和低秩表示,本發(fā)明提出了一種基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法。參照圖1,本例中具體實施步驟包括:步驟1:輸入高光譜圖像X,該高光譜圖像X包含c類像素點,所有類別像素點共有N個像素點,N個像素點是每一類圖像所有像素點的和總數(shù),圖像的每一個像素點為一個樣本,第i個樣本用一個特征向量xi表示,i是樣本的序號,i=1,...,N,R表示實數(shù)域,樣本的特征維數(shù)為H。步驟2:根據(jù)均值漂移方法將高光譜圖像X分割成M塊,得到預分割后的高光譜圖像XG,對分割后的每一個圖像塊里的所有樣本點做平均,每一個圖像塊得到一個新的樣本點m是新樣本的序號,m=1,...,M,由新樣本點得到新的樣本集具體步驟如下:2a)隨機取出高光譜數(shù)據(jù)X中一個樣本點x,以x為圓心,h為半徑,做一個空間球Sh,如圖2所示,所有落在球內(nèi)的點xi∈Sh為x的鄰域樣本,h的取值是根據(jù)經(jīng)驗選取,h的取值越小,分塊越多,本例中空間球半徑h=20;2b)根據(jù)高斯核函數(shù)得到鄰域樣本xi和樣本x之間的相似度;2c)計算核函數(shù)的導數(shù)的負方向,即2d)根據(jù)式得到空間球Sh內(nèi)所有鄰域樣本xi,對應的均值漂移向量m(x);2e)如果m(x)<ε時,即收斂,得到x的均值漂移向量;如果m(x)>ε時,則返回2b),繼續(xù)執(zhí)行,直到滿足收斂條件。閾值ε是根據(jù)經(jīng)驗選取,選取的值越小則分割的圖像塊越小,本例中ε=10-5;2f)重復執(zhí)行2a),2b),2c),2d),2e),直到遍歷所有樣本數(shù)據(jù)x;根據(jù)半徑h,利用種子生長法對高光譜圖像X進行區(qū)域標號,每一種相同標號的區(qū)域代表一個分割后的圖像塊,最后計算每一個圖像塊的均值,每一個圖像塊得到一個新的樣本點m=1,...,M,由新樣本點得到一個基于圖像分塊的新的樣本集M是新樣本的總個數(shù),本例中所用到的高光譜圖像中,新樣本總個數(shù)M=161。步驟3:對均值漂移預分割后的高光譜圖像XG構(gòu)造相似性矩陣U。從高光譜圖像X數(shù)據(jù)集中隨機選取n個樣本點構(gòu)成隨機樣本集XU,xl和xk是隨機樣本集XU中的第l個和第k個樣本,l,k=1,...,n。然后構(gòu)造一個n×n的零矩陣U,當樣本點xl和xk,屬于步驟2中均值漂移分割后高光譜圖像XG中的同一個區(qū)域時,Ui,j=1;當樣本點xl和xk分別屬于不同區(qū)域時,Ui,j=0,其中隨機選取樣本點個數(shù)n選取范圍應該大于類別數(shù)c,小于等于總的樣本數(shù)N,選取的樣本數(shù)越多越能表示出圖像的區(qū)域信息,N的大小取決于計算機的內(nèi)存能力。步驟4:使用低秩表示方法計算新的樣本集Xnew的低秩系數(shù)矩陣Z,采用非精確增廣拉格朗日乘子法獲得低秩系數(shù)矩陣Z。具體數(shù)學模型如下,將樣本矩陣在自身上進行低秩表示,其中,Z∈RM×M表示低秩系數(shù)矩陣,E∈RM×M表示誤差矩陣,λ是控制誤差矩陣的參數(shù),||·||*表示核范數(shù)函數(shù),即矩陣奇異值的和,j=1,...,M表示l2,1范數(shù)。上述優(yōu)化問題是通過非精確增廣拉格朗日乘子法求解出低秩系數(shù)矩陣Z,控制誤差矩陣的參數(shù)λ是按照經(jīng)驗值選取,一般選取范圍為0到10。步驟5:根據(jù)相似性矩陣U和低秩系數(shù)矩陣Z,構(gòu)造基于新的樣本集Xnew的特征值方程f,設置降維后的維數(shù)d,并學習出降維映射矩陣A。具體步驟如下:5a)令矩陣Zβ=Z+ZT-ZTZ,ZT表示Z的轉(zhuǎn)置;5b)對相似性矩陣U的每一行進行求和,得到一個列向量Q,對Q進行對角化,得到對角矩陣D,然后計算拉格朗日算子L=D-U;5c)構(gòu)造基于高光譜圖像預分割后新的樣本集Xnew和隨機樣本集XU的特征值方程e=1,...,d,其中,ae是第e個特征向量,γe為第e個特征值,d是降維后的維數(shù),本例中d設置為30;5d)求解出該基于高光譜圖像預分割后新的樣本集Xnew和隨機樣本集XU的特征值方程的d個最大特征值γ1,γ2,...,γd及其對應的特征向量a1,a2,…ad;5e)由上述特征向量a1,a2,…ad構(gòu)造出高光譜圖像X的降維映射矩陣A=[a1,a2,…ad]∈RH×d。步驟6:將原始樣本集X通過降維映射矩陣A映射到低維空間中,得到新的降維后的樣本集x′i是降維后的樣本集X′的第i個樣本。步驟7:在降維后的樣本集X′中每類選取t個樣本作為訓練樣本集Xp,其余的樣本作為測試樣本集Xq,將訓練樣本集Xp輸入到支撐矢量機SVM中進行分類,學習出來一個分類器,然后將測試樣本集Xq輸入到這個分類器中,得到測試樣本Xq的分類標簽向量Y,標簽向量Y是高光譜圖像X分類的結(jié)果。本發(fā)明由于同時利用高光譜圖像的空間信息和譜段信息構(gòu)造出一個降維的投影矩陣,該投影矩陣包含了更有效地高光譜圖像的信息,因此可以獲得更理想的低維投影空間,從而獲得高維數(shù)據(jù)在低維空間中更精確的表示,提高了后續(xù)分類的準確率。本發(fā)明的效果可以通過以下仿真實驗進一步說明:實施例2基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法,同實施例11.仿真條件:仿真實驗采用美國宇航局NASA噴氣推進實驗室的空載可見光/紅外成像光譜儀AVIRIS于1992年6月在印第安納西北部獲取的IndianPine圖像,如圖3所示,圖像大小為145×145,共220個波段,去除噪聲以及大氣和水域吸收的波段還有200個波段,共16類地物信息。仿真實驗在CPU為IntelCore(TM)2Duo、主頻2.33GHz,內(nèi)存為2G的WINDOWS7系統(tǒng)上用MATLABR2012b軟件進行。2.仿真內(nèi)容及分析:使用本發(fā)明與現(xiàn)有四種方法對高光譜圖像IndianPine進行分類,現(xiàn)有四種方法分別是:支撐矢量機SVM,主成分分析結(jié)合支撐矢量機PCA+SVM,線性判別分析結(jié)合支撐矢量機LDA+SVM,核線性判別分析結(jié)合支撐矢量機KDA+SVM,本發(fā)明基于區(qū)域相似性低秩表示降維結(jié)合支撐矢量機的高光譜圖像分類方法的縮寫為MSLRR+SVM。其他各類分類方法有SVM、PCA+SVM、LDA+SVM、KDA+SVM,這些分類方法中的分類器SVM核參數(shù)g對應上述順序,分別設置為10-9,10-9,10-8,10-0,本發(fā)明MSLRR+SVM中的分類器SVM核參數(shù)g設置為10-4,所有方法的懲罰因子C一律設置為10000。本例中低秩表示中的噪聲參數(shù)λ設置為0.001,隨機選取的樣本數(shù)n設置為4000,對于LDA和KDA兩種方法,降維的維數(shù)設置為15。從IndianaPine數(shù)據(jù)中選取部分像素點作為有標記像素點,剩余像素點作為無標記像素點,本發(fā)明與現(xiàn)有四種方法對IndianaPine數(shù)據(jù)進行30次分類實驗,取分類結(jié)果的平均值,作為最終分類正確率,如圖4a、4b所示,其中圖4a是有標記樣本數(shù)目為全部樣本的5%時各方法的分類結(jié)果曲線圖,圖4b是有標記樣本為全部樣本數(shù)的10%時各方法的分類結(jié)果曲線圖。圖4a是五種方法在有標記樣本是總樣本數(shù)的5%的時候的分類正確率與特征維數(shù)的曲線關(guān)系圖,維數(shù)范圍是1至30,縱坐標為分類正確率。從圖4a可以看出當特征維數(shù)大于10時,本發(fā)明的分類正確率超越SVM,并且在13維時性能趨于穩(wěn)定,并且明顯高于現(xiàn)有方法。從圖4a中看出PCA降維后的分類結(jié)果和SVM相當,比本發(fā)明的方法要低7%左右。從圖4a中還可看出,在維數(shù)大于13后,本發(fā)明的結(jié)果趨于穩(wěn)定,因此本發(fā)明只需要采用15維特征,即可以得到較高的識別率,并且大大減少了計算量。本發(fā)明在基于區(qū)域相似性低秩表示維數(shù)約減的基礎上結(jié)合支撐矢量機對高光譜圖像進行分類,充分利用了空間信息與譜段信息,并且能有效地結(jié)合高光譜圖像的區(qū)域相似性結(jié)構(gòu),并得到較高的識別率,與現(xiàn)有的方法相比具有一定的優(yōu)勢。實施例3基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法同實施例1和實施例2從IndianaPine數(shù)據(jù)中選取部分像素點作為有標記像素點,剩余像素點作為無標記像素點,本發(fā)明與現(xiàn)有四種方法對IndianaPine數(shù)據(jù)進行30次分類實驗,取分類結(jié)果的平均值,作為最終分類正確率,如圖4b所示,圖4b是五種方法在有標記樣本是總樣本數(shù)的10%時的分類正確率與特征維數(shù)的曲線關(guān)系圖,橫坐標為特征維數(shù),維數(shù)范圍是1至30,縱坐標為分類正確率。從圖4b中可以看出當特征維數(shù)大于12時,本發(fā)明的分類正確率高于其他方法,并且呈上升趨勢,在20維左右趨于穩(wěn)定,達到89%。從圖4b中可以看出,在維數(shù)大于20后,本發(fā)明的結(jié)果趨于穩(wěn)定,且分類正確率明顯高于PCA。因此本發(fā)明只需要采用20維特征,即得到較高的識別率,本發(fā)明大大減少了高光譜圖像分類的計算量。實施例4基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法同實施例1和實施例2如表1所示,表1是每類選取不同訓練樣本數(shù)時,MSLRR和PCA維數(shù)約簡到30維,LDA和KDA維數(shù)約簡到15維。高光譜圖像IndianPine的分類正確率,表1中的結(jié)果是30次隨機選取訓練樣本數(shù)的分類結(jié)果的平均值。本例中,每類分別隨機選取5個,10個,15個作為訓練樣本,其余作為測試樣本。從表1中看出,當訓練樣本數(shù)特別少的時候,本發(fā)明的優(yōu)勢非常明顯,尤其在每類僅有5個訓練樣本數(shù)時,分類的正確率就可以達到69.41%,遠超于其他方法。本發(fā)明的方法在訓練樣本數(shù)增加時,分類的正確率也相應的提高。由于高光譜圖像很難獲取有標記信息,因此,本發(fā)明僅用很少的訓練樣本即可得到較好的分類性能,對于高光譜圖像的分類具有非常重要的作用。表1:每類選取不同訓練樣本數(shù)時的高光譜圖像IndianPine的分類正確率(%)綜上所述,本發(fā)明的基于區(qū)域相似性低秩表示降維的高光譜圖像分類方法,主要解決高光譜圖像數(shù)據(jù)維數(shù)過高而導致的計算量大以及現(xiàn)有方法的分類正確率低的問題。其步驟包括:將高光譜圖像的每一個像素點用特征向量表示,用均值漂移方法對高光譜圖像進行區(qū)域預分割,然后將分割后的圖像塊進行平均,每一個圖像塊的均值構(gòu)成一個新的樣本,從而構(gòu)造出新的樣本集;對新的樣本集進行低秩表示,從而學習出一個低秩系數(shù)矩陣;利用均值漂移分割后的高光譜圖像構(gòu)造出一個區(qū)域相似性矩陣;然后用區(qū)域相似性矩陣結(jié)合低秩系數(shù)矩陣構(gòu)造特征值方程并求解,得到投影矩陣;將高光譜數(shù)據(jù)投影到低維空間,得到降維后的樣本集;將降維后的樣本集輸入到支撐矢量機中進行分類,得到類別信息。本發(fā)明使用均值漂移進行圖像預分割后可以有效地利用到高光譜圖像的空間結(jié)構(gòu)信息,而且,對高光譜圖像進行低秩表示有效地表示高光譜圖像的全局信息,并且利用均值漂移預分割后的圖像進行低秩表示有效地降低低秩表示的計算復雜度。本發(fā)明對高光譜圖像的分類能夠獲得較好的分類正確率,可用于地圖制圖,植被調(diào)查,軍事情報獲取等軍事和民用領域。