一種自適應(yīng)特征權(quán)重合成的lidar數(shù)據(jù)地物精確分類方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明屬于遙感數(shù)據(jù)地物分類領(lǐng)域,具體為一種自適應(yīng)特征權(quán)重合成的LIDAR數(shù) 據(jù)地物精確分類方法。
【背景技術(shù)】
[0002] 利用機載LIDAR系統(tǒng)獲得的遙感數(shù)據(jù)實現(xiàn)地物的精確分類能夠應(yīng)用數(shù)字城市建 設(shè)、城區(qū)管理、自然災(zāi)害調(diào)查等領(lǐng)域,具有廣闊的應(yīng)用前景。LIDAR系統(tǒng)可以快速、主動地獲 取大范圍地物密集采樣點的三維信息,通過處理分析點云高度,強度及波形等信息,能夠得 到高精度數(shù)字高程模型。同時,光譜相機獲取的相同場景的多光譜圖像具備豐富的光譜和 紋理信息,彌補了傳統(tǒng)攝影測量技術(shù)獲取地物信息單一的缺陷。與被動遙感技術(shù)相比,基于 LIDAR的地物分類很大程度上排除了大氣分子和氣溶膠的影響,三維點云和多光譜圖像數(shù) 據(jù)從不同的側(cè)面表達了地物豐富的信息,將兩者包含的地物特征信息融合進行地物分類, 增強了對地物目標(biāo)的識別和解譯能力,明顯提高單一數(shù)據(jù)源遙感地物分類的精度,為行業(yè) 具體應(yīng)用決策提供更真實可靠的基礎(chǔ)信息,如城市違建處置過程的證據(jù)快速、可靠獲取等。
[0003] 基于機載LIDAR系統(tǒng)的地物分類通常包括樣本采集、特征提取與選擇、模型選擇、 分類器訓(xùn)練與結(jié)果評估等過程。其中特征提取與選擇是關(guān)鍵一環(huán),與分類器有著緊密的聯(lián) 系。目前,一般是將描述地物高程的三維LIDAR點云與表面材質(zhì)的強度信息轉(zhuǎn)化為圖像,結(jié) 合光譜信息利用監(jiān)督學(xué)習(xí)算法完成LIDAR地物分類。常用的分類算法主要包括人工神經(jīng)網(wǎng) 絡(luò)(ANN)、支持向量機(SVM)、最大似然(ML)、決策樹(DT)與隨機森林(RF)等。Li Guo等利用 隨機森林初步討論了特征重要性,用對分類結(jié)果影響較大的特征替代原有的特征參與分 類,一定程度上提升了算法的運行效率,但簡單替代特征的做法否認(rèn)了某些特征對分類的 貢獻,損失了部分地物信息。吳軍等利用SVM估計單個特征對分類精度影響程度并計算不同 特征的權(quán)重,然后組合差異特征進行SVM訓(xùn)練和分類,但僅考慮了不同特征在分類中的重要 性差異,沒有考慮不同特征分類結(jié)果的沖突所包含的信息。以上的兩個研究代表了機載 LIDAR系統(tǒng)數(shù)據(jù)地物分類的重要研究內(nèi)容,但其分類結(jié)果的精度有待進一步提高。在實際工 程中,不同類型特征不僅對分類精度影響程度不同,而且不可避免地存在沖突。由于某個或 少數(shù)證據(jù)間的完全沖突或嚴(yán)重沖突,而傳統(tǒng)證據(jù)合成規(guī)則一般不考慮沖突證據(jù)的信息,可 能導(dǎo)致推理結(jié)果出現(xiàn)較嚴(yán)重悖論,從而影響分類精度。實際上即使證據(jù)之間存在著沖突,其 包含的信息也是部分可用的。在不改變規(guī)則的前提下修改證據(jù)源模型方面的研究中, Murphy提出了一種處理沖突的方法,但是其沒有考慮到各個證據(jù)間的相關(guān)性,只是簡單的 平均,對提高分類精度具有一定的局限。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明綜合研究機載LIDAR系統(tǒng)數(shù)據(jù)不同類型特征在遙感地物分類中的重要性差 異與證據(jù)合成中的沖突證據(jù)信息,提出了一種自適應(yīng)特征權(quán)重合成的LIDAR數(shù)據(jù)地物精確 分類方法。首先對實驗圖像進行充分特征信息提取,根據(jù)特征的物理意義與包含地物信息 的差異,構(gòu)建高程、光譜、強度與紋理特征子集;其次在隨機森林框架下分析不同特征子集 在地物分類過程中的重要性差異,計算各特征子集的重要性測度,獲得每個像元對各類地 物的類別隸屬度;然后綜合利用特征子集重要性測度與基于證據(jù)沖突計算的權(quán)重系數(shù),對 各個特征子集構(gòu)成的多證據(jù)源合成;最后根據(jù)合成結(jié)果采用投票決策規(guī)則實現(xiàn)地物精確分 類,并采用有效的空間限制策略優(yōu)化初分類結(jié)果。
[0005] 本發(fā)明一種自適應(yīng)特征權(quán)重合成的LIDAR數(shù)據(jù)地物精確分類方法包括以下具體步 驟:
[0006] S1:獲得LIDAR系統(tǒng)的點云數(shù)據(jù)和光譜相機拍攝的多光譜數(shù)據(jù),并進行中值濾波預(yù) 處理;
[0007] S2:提取LIDAR系統(tǒng)數(shù)據(jù)特征,根據(jù)物理意義和地物信息區(qū)別構(gòu)建高程特征子集 Ti、光譜特征子集T 2、強度特征子集T3和紋理特征子集T4;
[0008] S3:隨機選擇樣本進行訓(xùn)練,基于隨機森林框架計算各個特征子集的重要性測度 Fj,計算各像元對各類地物的類別隸屬度mj (Αι);
[0009] S4:基于特征重要性測度與證據(jù)沖突權(quán)重的隨機森林自適應(yīng)權(quán)重合成方法實現(xiàn)特 征子集證據(jù)合成;
[0010] S5:根據(jù)證據(jù)合成結(jié)果,采用最大投票決策規(guī)則決策,確定各像元的類別屬性,獲 得初分類結(jié)果;
[0011] S6:對初分類結(jié)果中易被錯分或漏分的混淆像元(包括樹冠中心與墻面點)采用空 間鄰域限制策略實現(xiàn)分類結(jié)果的優(yōu)化;
[0012] S7:輸出分類結(jié)果及分類性能指標(biāo)。
[0013] 其中步驟S3所述的基于隨機森林框架計算各個特征子集的重要性測度匕,計算各 像元對各類地物的類別隸屬度叫(M ),主要包括以下步驟:
[0014] S32:計算各個特征子集的重要性測度,
[0015] 6 = 1/(/) Π)
[0016]其中Tj表示j特征子集,j = l,2,. . .,Μ,本例中Μ=4;
[0017] S33:根據(jù)各個特征子集計算各個像元對各個地物類別的隸屬程度
[0018]⑷
/
[0019] 其中Μ為將某像元判定為1類的焦元,ntrew為特征子集j隨機森林的決策樹數(shù)目, treeij為根據(jù)特征子集j像元屬于1類的決策樹數(shù)目。
[0020] 步驟S4所述的基于特征重要性測度與證據(jù)沖突權(quán)重的隨機森林自適應(yīng)權(quán)重合成 方法實現(xiàn)特征子集證據(jù)合成,按以下步驟進行:
[0021] S43:計算證據(jù)Ei的沖突權(quán)重系數(shù)
[0022]
[0023] S44:根據(jù)^和特征子集重要性測度構(gòu)造總權(quán)重系數(shù)并進行歸一化
[0024] 。
[0025] 本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點:
[0026] 1、本發(fā)明提取LIDAR系統(tǒng)數(shù)據(jù)的特征構(gòu)建四個特征子集,隨機選擇樣本構(gòu)建隨機 森林框架,獲得了各個特征子集的重要性測度,減少了隨機森林根據(jù)單個特征重要性程度 簡單替代的特征信息損失,充分利用了不同類型的地物信息,同時也作為后續(xù)證據(jù)合成的 多個證據(jù)源。
[0027] 2、本發(fā)明在進行證據(jù)合成時,根據(jù)證據(jù)間的沖突程度適時調(diào)整描述證據(jù)的權(quán)重系 數(shù),綜合研究特征重要測度與基于沖突信息的證據(jù)權(quán)重兩個不同層面自適應(yīng)計算不同證據(jù) 的權(quán)重系數(shù),能夠在某特征重要測度較高但分類結(jié)果與其它特征存在較大沖突的情況下, 全面地利用不同類型的特征子集以及沖突證據(jù)包含的地物信息,反之亦然,提高了機載 LIDAR數(shù)據(jù)地物的分類精度。
【附圖說明】
[0028]圖1為本發(fā)明的流程圖;
[0029] 圖2為實驗特征圖像,(a)強度;(b)高度差;(c)近紅外波段;(d)偽彩色圖;
[0030] 圖3為不同特征集實現(xiàn)的分類結(jié)果,(a)高程特征子集;(b)光譜特征子集;(c)強度 特征子集;(d)紋理特征子集;
[0031] 圖4為證據(jù)合成前后分類結(jié)果,(a)全特征集隨機森林;(b)本發(fā)明合成方法;
[0032] 圖5為初分類結(jié)果優(yōu)化后分類結(jié)果(a)優(yōu)化后;(b)地面真值。
【具體實施方式】
[0033]本發(fā)明實驗數(shù)據(jù)由TopoSys公司采用光纖掃描方式的Falcon Π傳感器采集,航高 約600m,平均激光腳點密度和點間距分別為4點/m2和0.5m,被配準(zhǔn)為0.5m空間分辨率。光譜 數(shù)據(jù)包括藍、綠、紅和近紅外等四個波段,高程數(shù)據(jù)包括首末次回波高程。被測區(qū)域具有典 型的城市地貌,真實數(shù)據(jù)由人工獲取,作為地面真值。具體實施步驟如下:
[0034]如圖1所示,S1:獲得LIDAR系統(tǒng)的點云數(shù)據(jù)和光譜相機拍攝的多光譜數(shù)據(jù),并進行 中值濾波預(yù)處理;
[0035] S2:提取LIDAR系統(tǒng)數(shù)據(jù)特征,根據(jù)物理意義和地物信息區(qū)別構(gòu)建高程特征子集 Ti、光譜特征子集T2、強度特征子集T3和紋理特征子集T4,具體步驟如下:
[0036] S21:提取高程特征子集h,包括3種特征,分別為LIDAR首次回波、末次回波與高程 差。首次歸一化數(shù)字表面模型(nDSMk)反映去除地形影響的地物絕對高度,由DSM與DEM衍生 而來,數(shù)字表面模型(DSM)表達了地表所有地物(如植被、建筑物)的高度信息,數(shù)字高程模 型(DEM)只包含地球自然表面的高程值(即裸地數(shù)字高程模型),高程差(HD)用于區(qū)分激光 可穿透地物與不可穿透地物,由首次回波nDSMf e與末次回波nDSMie相差來實現(xiàn)。
[0037] S22:提取光譜特征子集T2,包括6種特征,分別為多光譜圖像的紅、綠、藍、近紅外4 個波段灰度值口^口^^^口~^以及通過波段間的運算生成的衍生光譜特征歸一化植被指數(shù) (NDVI)和修正型土壤調(diào)節(jié)植被指數(shù)(MSAVI)。
[0038] S23:提取激光回波強度特征子集Τ3,包含1種特征一激光回波強度(IN)描述地物 材質(zhì)以及地物表面不規(guī)則程度,當(dāng)激光落在不同的物體表面時,其反射的強度值會有很大 的差別,其受多種因素的影響,包括物體表面材料的性質(zhì),回波數(shù)、激光發(fā)射點到入射點的 距離以及入射角等。
[0039] S24:提取紋理特征子集T4,包括6種特征,分別為3種高程紋理與3種光譜紋理特 征,高程紋理特征基于高程信息獲取其灰度共生矩陣(GLCM)局部紋理測度角二階矩 (ASM1)、熵(ΕΝΤ1)與慣性矩(Η1),