面向高空間分辨率遙感大數(shù)據(jù)的特征提取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及面向高空間分辨率遙感大數(shù)據(jù)的特征提取方法,屬于遙感圖像特征提取技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]近十幾年來,高空間分辨率遙感圖像已經(jīng)廣泛用于農(nóng)業(yè)、林業(yè)、海洋和環(huán)境監(jiān)測等領(lǐng)域,具有巨大的經(jīng)濟(jì)價(jià)值和社會效益。然而,由于高空間分辨率遙感圖像的體量(Volume)大,數(shù)據(jù)類型(Variety)多,信息豐富,解譯分析過程復(fù)雜,迄今為止還難以準(zhǔn)確、高效地對高空間分辨率遙感圖像進(jìn)行自動(dòng)的地物分類。如何對高空間分辨率遙感大數(shù)據(jù)進(jìn)行地物分類成為影響其大規(guī)模應(yīng)用的技術(shù)難點(diǎn)與瓶頸之一。
[0003]與中低分辨率遙感圖像相比,高空間分辨率遙感圖像紋理更加豐富、形狀更加明顯,空間關(guān)系更加復(fù)雜?,F(xiàn)有的技術(shù)常常采用光譜、形狀和紋理特征來描述高空間分辨率遙感圖像中地類的不同特點(diǎn)。然而,這些特征是底層特征,難以全面描述高空間分辨率圖像上地物的幾何和結(jié)構(gòu)信息。近幾年來,文本分析和場景理解中的詞包模型(Bag-of-Word, BOW))和主題模型(Topic model)被引入遙感領(lǐng)域。這些方法通過詞包模型來提取局部特征的統(tǒng)計(jì)信息或語義信息,并據(jù)此來分析高空間分辨率遙感圖像中的主題,從而達(dá)到分類的目的。
[0004]現(xiàn)有的特征提取方法大多是統(tǒng)計(jì)特征,難以準(zhǔn)確地描述地類的本質(zhì)信息,難于實(shí)現(xiàn)高空間分辨率遙感圖像自動(dòng)解譯。如何針對傳感器的多樣性、成像條件的多變性以及地面目標(biāo)的復(fù)雜性,提取高空間分辨率遙感大數(shù)據(jù)上地物的深層結(jié)構(gòu)信息,盡可能完備地描述地類特性,是高空間分辨率遙感大數(shù)據(jù)中的地物分類的關(guān)鍵。為了發(fā)掘更好的特征,人們不得不投入大量的精力去研宄一個(gè)好的特征。而好的特征開發(fā)往往需要對問題有很深的理解,需要反復(fù)摸索。因此當(dāng)下需要能夠自動(dòng)生成合適的特征。
[0005]另外,人們常常認(rèn)為:在大數(shù)據(jù)條件下,簡單模型比復(fù)雜模型更加有效。例如,在相對多的大數(shù)據(jù)應(yīng)用中,大量使用最簡單的線性模型,其實(shí)質(zhì)上效果并不理想。實(shí)際上,只有對大數(shù)據(jù)應(yīng)用比較復(fù)雜的模型或表達(dá)能力強(qiáng)的模型,才能夠充分發(fā)掘大數(shù)據(jù)中蘊(yùn)藏的豐富的有價(jià)值的信息。
[0006]深度學(xué)習(xí)(DeepLearning, DL)是機(jī)器學(xué)習(xí)(Machine Learning, ML)領(lǐng)域中一個(gè)新方法。該方法通過學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,在語音和圖像識別方面取得了良好的效果,解決了很多復(fù)雜的模式識別難題。其實(shí)質(zhì)是面向海量數(shù)據(jù),通過構(gòu)建具有包括大量隱層的機(jī)器學(xué)習(xí)模型,來學(xué)習(xí)數(shù)據(jù)的本質(zhì)特征,從而最終提升分類或預(yù)測的準(zhǔn)確性。即基于“深度模型”進(jìn)行“特征學(xué)習(xí)”,所述深度模型通常有5層、6層、甚至10多層的隱層節(jié)點(diǎn),所述特征學(xué)習(xí)是通過逐層特征變換,將樣本原始的特征表示映射到一個(gè)新特征空間,從而使得分類或預(yù)測更加容易。
[0007]目前,高空間分辨率圖像的分類和識別準(zhǔn)確率都相對較低,其根源之一在于高空間分辨率遙感圖像細(xì)節(jié)豐富,難以提取合適的特征以準(zhǔn)確地表達(dá)解譯員所能感知到的地物本質(zhì)?,F(xiàn)有的特征大多基于分割算法,即對分割出的對象提取光譜、形狀和紋理等特征。然而,這些特征都是底層特征,難以準(zhǔn)確表達(dá)地物本質(zhì)所表達(dá)的高層信息。
【發(fā)明內(nèi)容】
[0008]本發(fā)明目的是為了解決現(xiàn)有對高空間分辨率遙感圖像的特征進(jìn)行提取獲取的為底層特征,不能準(zhǔn)確表達(dá)地物本質(zhì)的問題,提供了一種面向高空間分辨率遙感大數(shù)據(jù)的特征提取方法。
[0009]本發(fā)明所述面向高空間分辨率遙感大數(shù)據(jù)的特征提取方法,它包括以下步驟:
[0010]步驟一:采集遙感圖像,并對遙感圖像進(jìn)行預(yù)處理,獲得輸入數(shù)據(jù);
[0011]步驟二:將輸入數(shù)據(jù)分割成連續(xù)且不重疊的31X31或者51X51像素的子圖數(shù)據(jù);
[0012]步驟三:將子圖數(shù)據(jù)依次輸入給卷積深度玻爾茲曼機(jī)輸入層的相應(yīng)節(jié)點(diǎn),所述子圖數(shù)據(jù)通過卷積深度玻爾茲曼機(jī)低級語義層的隱含子層進(jìn)行修改卷積核之后的卷積映射后,再通過所述低級語義層的提取子層進(jìn)行提取操作,獲得子圖數(shù)據(jù)的低級語義特征;
[0013]步驟四:將子圖數(shù)據(jù)的低級語義特征作為卷積深度玻爾茲曼機(jī)高級語義層的輸入,所述高級語義層的隱含子層和提取子層對子圖數(shù)據(jù)的低級語義特征以無監(jiān)督學(xué)習(xí)的方式進(jìn)行高層語義的提取,獲得子圖數(shù)據(jù)的本質(zhì)特征數(shù)據(jù);
[0014]步驟五:采用子圖數(shù)據(jù)的本質(zhì)特征數(shù)據(jù)以無監(jiān)督學(xué)習(xí)的方式對卷積深度玻爾茲曼機(jī)進(jìn)行均值場訓(xùn)練,使所述低級語義層同時(shí)接收來自輸入層的子圖數(shù)據(jù)和高級語義層的本質(zhì)特征數(shù)據(jù),并以概率型最大抽取的方法,概率化抽樣輸入層和高級語義層數(shù)據(jù)的上下文信息,獲得規(guī)范化的上下文信息;
[0015]步驟六:將規(guī)范化上下文信息作為子圖數(shù)據(jù)的高級語義特征,對子圖數(shù)據(jù)的高級語義特征采用Logistic分類器的回歸方法進(jìn)行監(jiān)督訓(xùn)練,完成輸入數(shù)據(jù)的整體訓(xùn)練過程,并由Logistic分類器輸出所述輸入數(shù)據(jù)的特征提取結(jié)果。
[0016]遙感圖像的預(yù)處理包括:對遙感圖像依次進(jìn)行幾何精校正、圖像配準(zhǔn)、圖像鑲嵌與裁剪及大氣校正。
[0017]本發(fā)明的優(yōu)點(diǎn):本發(fā)明方法針對實(shí)際應(yīng)用中高空間分辨率遙感圖像海量多源、空間分辨率高、紋理和形狀信息豐富的數(shù)據(jù)特性,提出了基于深層網(wǎng)絡(luò)結(jié)構(gòu)的圖像特征提取方法,本發(fā)明方法通過獲取地物的高層語義信息、非線性和不變性信息,量化分析和評價(jià)地類,提取出具有深度結(jié)構(gòu)的數(shù)據(jù)特征,從而準(zhǔn)確的表達(dá)地物本質(zhì),它提高了遙感大數(shù)據(jù)的分類性能,實(shí)現(xiàn)了遙感數(shù)據(jù)向空間信息的準(zhǔn)確、快速、可靠轉(zhuǎn)化。
[0018]本發(fā)明方法旨在利用卷積深度玻爾茲曼機(jī)的模型結(jié)構(gòu)模擬解譯員判讀機(jī)制,直接提取出一種有利于后續(xù)處理及應(yīng)用的具有深層結(jié)構(gòu)的特征。該特征能夠清晰地挖掘地物的高層語義,充分表征高空間分辨率遙感圖像中的細(xì)節(jié)信息。
【附圖說明】
[0019]圖1是本發(fā)明所述面向高空間分辨率遙感大數(shù)據(jù)的特征提取方法的流程框圖?!揪唧w實(shí)施方式】
[0020]【具體實(shí)施方式】一:下面結(jié)合圖1說明本實(shí)施方式,本實(shí)施方式所述面向高空間分辨率遙感大數(shù)據(jù)的特征提取方法,它包括以下步驟:
[0021]步驟一:采集遙感圖像,并對遙感圖像進(jìn)行預(yù)處理,獲得輸入數(shù)據(jù);
[0022]步驟二:將輸入數(shù)據(jù)分割成連續(xù)且不重疊的31X31或者51X51像素的子圖數(shù)據(jù);
[0023]步驟三:將子圖數(shù)據(jù)依次輸入給卷積深度玻爾茲曼機(jī)輸入層的相應(yīng)節(jié)點(diǎn),所述子圖數(shù)據(jù)通過卷積深度玻爾茲曼