本發(fā)明屬于圖像處理
技術(shù)領(lǐng)域:
,涉及一種高光譜圖像分類方法,可用于高光譜遙感圖像的分類。
背景技術(shù):
:目前,隨著遙感傳感器的光譜分辨率不斷提高,人們對地物光譜屬性、特征的認知也不斷深入,許多隱藏在狹窄光譜范圍內(nèi)的地物特征逐漸得以發(fā)現(xiàn),大大加速了遙感技術(shù)的發(fā)展,使高光譜遙感成為21世紀遙感領(lǐng)域最重要的研究方向之一。不同于多光譜遙感,光譜遙感技術(shù)利用成像光譜儀以納米級的光譜分辨率,用幾十或幾百個波段同時對地表物成像,能夠獲得地物的連續(xù)光譜信息,具有“圖譜合一”的特性,在國民經(jīng)濟、國防建設(shè)等方面都發(fā)揮著重要作用,已經(jīng)廣泛地應(yīng)用于地標分類、目標探測、農(nóng)業(yè)監(jiān)測、礦物填圖、環(huán)境管理和國防建設(shè)等領(lǐng)域。高光譜圖像的分類是高光譜遙感影像處理和應(yīng)用的一項重要內(nèi)容,其最終目標是給影像中的每個像元賦以唯一的類別標識。對于高光譜圖像數(shù)據(jù)分類任務(wù)的研究和分析,主要就是通過高光譜數(shù)據(jù)分辨出圖像中的地物特征,即通過分析原始光譜或其他特征信息,將不同的地表區(qū)域劃分出來,如草地、農(nóng)田、水域、城鎮(zhèn)、橋梁等等,有助于人們識別和分析地表情況。面對高光譜圖像數(shù)據(jù)維度高,數(shù)據(jù)相關(guān)性強,冗余度高,局部空間一致性等特點,常用的分類方法主要從以下幾個方面入手:(1)稀疏表示與字典學習,選擇少量有標記樣本作為字典,用字典樣本的線性組合去表示其他樣本;(2)支撐矢量機SVM分類器及其核函數(shù)的相關(guān)變換,構(gòu)建新型核函數(shù),如多項式核等,適應(yīng)高光譜數(shù)據(jù)的非線性分布;(3)半監(jiān)督與主動學習,提升小樣本下的分類效果;(4)新分類器的提出與多分類器的組合;(5)特征的提取與組合變換等。其中常用的特征包括:1)光譜特征,即高光譜圖像自身光譜信息特征及其相關(guān)派生特征;2)空間特征,包括高光譜圖像的紋理、形狀、形態(tài)學特征;3)空-譜特征,即空間特征和光譜特征相結(jié)合得到的特征。這些特征都是從高光譜圖像的固有特性入手,通過簡單提取變換得到的低層特征。隨著近幾年深度學習的火熱興起,如何利用深度學習模型框架,充分提取具有更好表示性的高光譜圖像高層特征,提升高光譜圖像分類精度,越來越成為國內(nèi)外學者爭相研究的熱點。深度學習是一種特征提取技術(shù),它從神經(jīng)網(wǎng)絡(luò)技術(shù)發(fā)展而來,通過分層的方式對低層特征進行高度抽象,從而得到特征更好的表示方法。常用的深度學習框架主要有棧式自編碼器SAE,深度置信網(wǎng)絡(luò)DBN,卷積神經(jīng)網(wǎng)絡(luò)CNN,遞歸神經(jīng)網(wǎng)絡(luò)RNN,他們被廣泛應(yīng)用于自然語言處理、計算機視覺、語音識別、生物信息學等領(lǐng)域,并取得了非常好的效果。目前已有學者將棧式自編碼器SAE,深度置信網(wǎng)絡(luò)DBN和卷積神經(jīng)網(wǎng)絡(luò)CNN深度學習模型引入到高光譜圖像分類中來。在《DeepLearning-BasedClassificationofHyperspectralData》中,YushiChen將高光譜數(shù)據(jù)進行PCA降維,選取矩形窗口中的像素連接成以為特征向量作為局部空間特征,再與原始光譜特征連接起來,作為低層特征輸入構(gòu)建好棧式自編碼器SAE模型。在《Spectral-SpatialClassificationofHyperspectralDataBasedonDeepBeliefNetwork》中,YushiChen采用與上文相同的方法構(gòu)建低層特征,并輸入構(gòu)建好的深度置信網(wǎng)絡(luò)DBN模型。這種方法的分類效果一般,正確率并不高,而且存在很多不足,如直接采用光譜特征作為輸入特征,包含的雜亂噪聲太多,判別性較弱,無法取得很好的分類效果;而且在局部空間特征提取上,簡單地選取鄰域的所有像素而不加處理,則其中與中心像素差異較大的像素會嚴重影響到分類精度。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于針對上述現(xiàn)有技術(shù)的不足,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的高光譜圖像分類方法,以構(gòu)建純凈度更高分類效果更好的低層特征,同時加強對局部空間內(nèi)像素之間相關(guān)性的探索,提高重要像素的作用,減少無用像素的影響,并將低層特征抽象為判別性更高的高層語義特征,從而更充分地利用高光譜圖像的特性,提高分類精度。為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案包括如下:(1)輸入一幅高光譜圖像,該高光譜圖像包括K個像素,B個高光譜譜段,c類地物,其中K=K1×K2,K1表示高光譜圖像的長,K2表示高光譜圖像的寬,圖像的每一個像素為一個樣本,每個樣本用一個特征向量表示,樣本的特征維數(shù)即為B,在每類地物中選擇10%的樣本組成訓練樣本集,剩下90%的樣本組成測試樣本集;(2)采用Gabor濾波器對高光譜圖像的主成分灰度圖進行濾波,得到高光譜圖像的空間紋理特征其中R表示實數(shù)域,g為空間紋理特征向量維數(shù);(3)采用稀疏表示的方法計算高光譜圖像中每個像素的稀疏表示系數(shù),得到高光譜圖像的稀疏表示特征其中m為稀疏表示特征向量的維數(shù);(4)將高光譜圖像的空間紋理特征F1和稀疏表示特征F2堆疊組合成高光譜圖像的低層特征l為低層特征向量的維數(shù),l=g+m;(5)在高光譜圖像低層特征矩陣F上,以每個樣本為中心構(gòu)建窗口,提取樣本的局部空間特征塊,并利用樣本間的相似性構(gòu)建樣本的局部空間序列特征;(6)以窗口中樣本個數(shù)為時間步長數(shù)構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò)模型,并輸入訓練樣本的局部空間序列特征和對應(yīng)的類別標簽迭代訓練遞歸神經(jīng)網(wǎng)絡(luò)模型參數(shù),得到訓練好的遞歸神經(jīng)網(wǎng)絡(luò)模型;(7)將測試樣本的局部空間序列特征輸入到訓練好的遞歸神經(jīng)網(wǎng)絡(luò)模型中,得到分類類標,完成分類。本發(fā)明具有如下優(yōu)點:(1)本發(fā)明將高光譜圖像的空間紋理特征和稀疏表示特征整合起來,這種低層特征既包含高光譜圖像像素樣本局部空間信息,又包含該像素樣本關(guān)于其他樣本的稀疏表示信息,這樣的低層特征純凈度和判別性更高,對于分類任務(wù)效果更好;(2)本發(fā)明在高光譜圖像局部空間特征的基礎(chǔ)上,提取高光譜圖像的局部空間序列特征,不僅獲取了局部空間信息,還探索了局部空間內(nèi)各像素樣本之間的相似度信息,提高了重要像素的作用,減少了無用像素的影響,提高了分類效果;(3)本發(fā)明利用了常用于自然語言處理領(lǐng)域的遞歸神經(jīng)網(wǎng)絡(luò)模型,將遞歸神經(jīng)網(wǎng)絡(luò)的時序特性與高光譜圖像局部空間序列信息結(jié)合起來,可以有效整合高光譜圖像局部空間的上下文關(guān)系,將低層特征抽象提取為高層語義特征,充分利用了高光譜的特性,提高了分類正確率。附圖說明圖1是本發(fā)明的流程示意圖;圖2是遞歸神經(jīng)網(wǎng)絡(luò)模型示意圖;圖3是本發(fā)明仿真采用的IndianPines圖像;圖4是本發(fā)明與現(xiàn)有方法對IndianPines圖像的分類結(jié)果對比圖。具體實施方式參照圖1,本發(fā)明的具體實施步驟包括:步驟1,輸入高光譜圖像。輸入一幅三維矩陣高光譜圖像,該高光譜圖像包括K個像素樣本,B個高光譜譜段,c類地物,其中K=K1×K2,K1表示高光譜圖像的長,K2表示高光譜圖像的寬,在每類地物中選擇10%的樣本作為訓練樣本,剩下90%的樣本作為測試樣本。步驟2,獲取高光譜圖像的空間紋理特征F1。2a)利用主成分分析法對高光譜圖像進行變換,提取前k=10個主成分灰度圖;2b)設(shè)置4個方向3種尺度的Gabor濾波器,即設(shè)置4個不同的Gabor核函數(shù)方向和3個不同的正弦平面波波長,得到12個Gabor濾波器,每個Gabor濾波器的核函數(shù)如下:其中,x'=xcosθ+ysinθ,y'=-xcosθ+ysinθ,x和y表示坐標位置信息,λ表示正弦平面波的波長,θ表示Gabor核函數(shù)的方向,表示相位偏差,σ表示高斯包絡(luò)的標準差,γ表示空間縱橫比;2c)利用設(shè)置好的12個Gabor濾波器分別對前k個主成分灰度圖中的每個主成分灰度圖進行Gabor濾波,得到每個主成分灰度圖的12個濾波后圖像;2d)將12×k個濾波后的圖像堆疊在一起,得到高光譜圖像的空間紋理特征其中R表示實數(shù)域,g=12×k為空間紋理特征向量長度。步驟3,獲取高光譜圖像的稀疏表示特征F2。3a)從高光譜圖像的c類訓練樣本中每類隨機選取1%的樣本作為字典原子構(gòu)建子字典,其中第i類的子字典為i=1,2,...,c,表示第i類的第j個字典原子,j=1,2,...,mi,mi表示第i類的字典原子個數(shù);3b)將c個子字典排列起來,合并成一個整體,得到總的結(jié)構(gòu)化字典D=[D1...Di...Dc],D∈RB×m是一個二維矩陣,表示所有類的子字典構(gòu)成的總的結(jié)構(gòu)化字典,m=m1+…+mi+…+mc表示所有類別的子字典原子個數(shù)之和;3c)利用正交匹配追蹤算法求解每個像素的稀疏表示向量,即通過正交匹配追蹤算法優(yōu)化如下公式,得到高光譜圖像中每個像素x關(guān)于結(jié)構(gòu)化字典D的稀疏表示向量α:s.t.Dα=x其中||α||0表示對α取0范數(shù);3d)將高光譜圖像中所有樣本的稀疏表示向量α,按照原始圖像數(shù)據(jù)對應(yīng)位置組成一個三維的稀疏表示特征矩陣步驟4,將空間紋理特征和稀疏表示特征堆疊組合起來,得到高光譜圖像的低層特征矩陣其中l(wèi)=g+m為低層特征向量長度。步驟5,構(gòu)建樣本的局部空間序列特征。5a)在高光譜圖像低層特征矩陣F上,以每個樣本x為中心,以w=9為邊長構(gòu)建大小為w×w的窗口,提取x的局部空間特征塊,則x的局部空間特征塊包含w2=81個樣本,其中每個樣本是一個長為l的低層特征向量;5b)根據(jù)歐式距離公式計算局部空間特征塊中各個樣本與中心樣本x的相似度大小,歐氏距離越小相似度越大,并將各個樣本按照相似度從大到小排列起來,得到樣本x的局部空間序列特征步驟6,利用訓練樣本集及其對應(yīng)類別標簽訓練遞歸神經(jīng)網(wǎng)絡(luò)模型。6a)以窗口中樣本個數(shù)為時間步長數(shù)T,構(gòu)建輸入層和隱層節(jié)點個數(shù)均為l的遞歸神經(jīng)網(wǎng)絡(luò)模型,其中T=w×w=81;6b)將訓練樣本的局部空間序列特征和對應(yīng)的類別標簽輸入到遞歸神經(jīng)網(wǎng)絡(luò)模型,即將樣本局部空間序列特征中的每一個低層特征向量輸入每一個對應(yīng)的時間步長,具體方法是將任意一個訓練樣本x的局部空間序列特征中第t個低層特征xt輸入遞歸神經(jīng)網(wǎng)絡(luò)的第t個時間步長,由該時間步長的輸入xt與前一個即第t-1個時步長的隱層狀態(tài)st-1共同構(gòu)成該時間步長的隱層狀態(tài)st:st=σ(Uxt+Wst-1),其中U表示輸入層到隱層的權(quán)重矩陣,W表示隱層到隱層的權(quán)重矩陣,σ表示非線性激活函數(shù),本發(fā)明的σ選擇ReLU函數(shù),則最后的輸出o81由最后一個時間步長的隱層狀態(tài)s81決定,即:其中V表示隱層到輸出層的權(quán)重矩陣,表示非線性激活函數(shù),本實例的選擇softmax函數(shù),然后采用通過時間的反向傳播方法迭代訓練遞歸神經(jīng)網(wǎng)絡(luò)模型中的參數(shù),迭代200次后停止,得到訓練好的遞歸神經(jīng)網(wǎng)絡(luò)模型。步驟7,將測試樣本的局部空間序列特征輸入到訓練好的遞歸神經(jīng)網(wǎng)絡(luò)模型中,得到分類類標,完成分類。本發(fā)明的效果可以通過以下仿真實驗進一步說明:1.仿真條件:仿真實驗采用IndianPines圖像,該圖像于1992年6月由美國宇航局NASA噴氣推進實驗室的空載可見光/紅外成像光譜儀AVIRIS在印第安納西北部獲取,如圖3所示,圖像大小為145×145,共220個波段,去除噪聲以及大氣和水域吸收的波段還有200個波段,共16類地物信息,如表1所示。仿真實驗在CPU為IntelCorei5-4210、主頻2.90GHz,內(nèi)存為8G的Windows10系統(tǒng)上用Python進行。表1IndianPines圖像中的16類數(shù)據(jù)類別類別名稱樣本個數(shù)類別類別名稱樣本個數(shù)1Alfalfa469Oats202Corn-notill142810Soybean-notill9723Corn-mintill83011Soybean-mintill24554Corn23712Soybean-clean5935Grass-pasture48313Wheat2056Grass-trees73014Woods12657Grass-pasture-mowed2815Buildings-Grass-Trees-Drives3868Hay-windrowed47816Stone-Steal-Towers932.仿真參數(shù):以上仿真實驗統(tǒng)一選擇10%作為訓練樣本,剩下的90%作為測試樣本,SVM懲罰因子設(shè)置為491;SRC方法中,直接用訓練樣本構(gòu)成字典,稀疏度設(shè)置為10;SOMP方法中,直接用訓練樣本構(gòu)成字典,窗口大小w設(shè)置為9,稀疏度設(shè)置為30;本發(fā)明中,PCA變換保留前10個主成分,Gabor濾波器的頻率選擇{0.25,0.5,0.75}3種尺度,方向選擇4種方向共12個濾波器,稀疏表示每類樣本隨機選擇1%構(gòu)建字典,稀疏度設(shè)置為30,窗口大小w設(shè)置為9,時間節(jié)點個數(shù)T設(shè)置為81。3.仿真內(nèi)容及結(jié)果:使用本發(fā)明與現(xiàn)有的三種常用方法對高光譜圖像IndianPine進行分類,常用的三種方法分別是:基于支撐矢量機SVM分類方法,基于稀疏表示SRC的分類方法,基于局部區(qū)域的稀疏表示SOMP分類方法。用本發(fā)明與上述三種常用方法對IndianPines圖像進行分類,結(jié)果如圖4所示,其中圖4a是用SVM方法的分類結(jié)果圖,圖4b是用稀疏表示SRC方法的分類結(jié)果圖,圖4c是用SOMP方法的分類結(jié)果圖,圖4d是本發(fā)明的分類結(jié)果圖。從圖4中可以看出,相比于常用的三種方法,本發(fā)明的結(jié)果圖更加清晰干凈,局部空間一致性和邊緣一致性都比現(xiàn)有方法要好,分類精度更高。本發(fā)明與其他各種方法各進行10次仿真實驗,取分類結(jié)果的平均值作為最終的分類正確率,包括整體正確率(OA),每類平均正確率(AA)和卡帕系數(shù)(Kappa),結(jié)果如表2所示。表2本發(fā)明與其他方法的分類正確率方法OA(%)AA(%)KappaSVM81.2474.060.79SRC68.5364.230.64SOMP95.2783.480.95本發(fā)明97.1795.840.97從表2可見,本發(fā)明和現(xiàn)有的SOMP方法由于包含了局部空間信息,相比于只用單像素信息的SVM方法和SRC方法,分類正確率明顯要更高,而且本發(fā)明既整合了空間紋理特征和稀疏表示特征的信息,又充分挖掘了局部空間像素間的信息,并用遞歸神經(jīng)網(wǎng)絡(luò)模型將低層特征抽取為判別性更高表示性更好的高層語義特征,可以獲得更高的分類正確率,在整體正確率、平均正確率、卡帕系數(shù)上都好過其他三種方法。綜上,本發(fā)明將高光譜圖像的空間紋理特征和稀疏表示特征整合為低層特征,并在局部空間特征的基礎(chǔ)上提取了局部空間序列特征,并利用深度學習框架中的遞歸神經(jīng)網(wǎng)絡(luò)模型對高光譜圖像進行分類,既提高了低層特征的純凈度和判別性,又探索了高光譜圖像的局部空間內(nèi)各像素樣本之間的相似度信息,提高了重要像素的作用,減少了無用像素的影響,同時將遞歸神經(jīng)網(wǎng)絡(luò)的時序特性與高光譜圖像局部空間序列信息結(jié)合起來,可以有效整合高光譜圖像局部空間的上下文關(guān)系,將低層特征抽象提取為高層語義特征,充分利用了高光譜的特性,得到較高的識別率,與現(xiàn)有的方法相比具有明顯的優(yōu)勢。當前第1頁1 2 3