專利名稱:基于線性最小二乘支持向量機的高光譜圖像端元選擇方法
技術領域:
本發(fā)明涉及一種高光譜圖像的端元選擇方法,特別是一種基于支持向量機(SVM) 的端元選擇方法,屬于遙感信息處理技術領域。
背景技術:
高光譜圖像的空間分辨率一般較低,這種情況導致了混合像元的廣泛存在,即一 個像元可能是幾種類別的混合。分析各類別成分在混合像元內(nèi)所占的比例的技術稱為光譜 解混,是高光譜數(shù)據(jù)分析的最基本、最重要內(nèi)容之一。光譜解混實施的必要前提是要知道高 光譜數(shù)據(jù)中包含哪些地物類別,在此需求下提取各類別代表性純光譜的技術稱為光譜端元 選擇,簡稱端元選擇。在近十多年里,多種高光譜圖像端元選擇方法相繼發(fā)展起來。N-FINDR 是基于N維空間譜凸多面體的搜索光譜端元的經(jīng)典例子,因其具有全自動、無參數(shù)、選擇效 果較好等優(yōu)點而受到廣泛歡迎。但該方法需要進行數(shù)據(jù)降維預處理,且包含大量的體積計 算,這也是它最為耗時的部分。并且,體積計算(即主要為行列式的計算)的復雜度將隨著 所選擇的光譜端元數(shù)目增大而呈現(xiàn)立方增長,從而導致算法運算速度大大降低。
目前已有一些典型文獻提出了對N-FINDR算法的改進方案。WUCHA0-CHENG等采用 像元預選的方式來降低后續(xù)搜索的復雜性,是從側(cè)面來降低算法計算量。CHOWDHURYA.等 利用順次選擇的方式來代替聯(lián)合選擇的方式,這種順次選取的方式遠離了 N-FINDR算法的 基本特征,像元一經(jīng)選定便無法更新,光譜端元之間的相互依賴關系也無法得到最大滿足。 TA0 XUETA0等提出的方法可以直接在原始數(shù)據(jù)空間上進行而免于降維預處理,因此選出的 光譜端元更具合理性,在理論上突破了 N-FINDR算法需要降維處理的傳統(tǒng)模式,但該方法 也屬于順次選取。 另一方面,基于凸幾何分析的端元選擇方法容易受到野值點的影B向,而野值點在 高光譜圖像中大量存在,現(xiàn)有文獻對此并未提出相應的解決方案。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種一種無需降維預處理、低復雜度的基于線性最小二乘
支持向量機的高光譜圖像端元選擇方法。 本發(fā)明的目的是這樣實現(xiàn)的 步驟1.選取前N個像素點作為初始端元; 步驟2.令目前所選端元中的第i個為"1"類,其余N-l個為"0"類,首次執(zhí)行i =l,建立相應的LLSSVM判別函數(shù)即距離測算函數(shù)
f i (s) = 〈w*, s》b* ; 步驟3.依次計算每個像素的距離,如果某個像素的絕對距離大于l,則將該像素 替換第i個端元,置i二l,步驟2; 步驟4. l,若i 〉N,轉(zhuǎn)入步驟5,否則轉(zhuǎn)入步驟2; 步驟5.當前端元即為最終選擇端元,結(jié)束。
本發(fā)明還可以包括 1、在步驟1之前加入根據(jù)局域像元密度對野值點進行檢測和去除過程,包括以每 個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內(nèi)所包含的像元點數(shù)作為中心點的 孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除。 2、在步驟1之前加入利用光譜分量值直按進行像元預排序過程,包括a)由原始 數(shù)據(jù)空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標的點對;b)從 余下的數(shù)據(jù)空間中進行第一步操作;c)繼續(xù)進行這樣的過程,直至所有的數(shù)據(jù)點都被選 出、排列;待全部數(shù)據(jù)點排序完畢之后,排在最前面的若干特征數(shù)據(jù)點被選作初始端元,其 迭代更新過程也將按照排序結(jié)果依次進行。 3、在步驟1之前加入根據(jù)局域像元密度對野值點進行檢測和去除過程和加入利 用光譜分量值直接進行像元預排序過程;所述根據(jù)局域像元密度對野值點進行檢測和去除 過程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內(nèi)所包含的像元點 數(shù)作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除;所述 利用光譜分量值直接進行像元預排序過程包括a)由原始數(shù)據(jù)空間的第一維到最后一維 依次選出和排列對應于極大值和極小值坐標的點對;b)從余下的數(shù)據(jù)空間中進行第一步 操作;c)繼續(xù)進行這樣的過程,直至所有的數(shù)據(jù)點都被選出、排列;待全部數(shù)據(jù)點排序完畢 之后,排在最前面的若干特征數(shù)據(jù)點被選作初始端元,其迭代更新過程也將按照排序結(jié)果 依次進行。 4、在步驟1之前加入去除過程和加入利用光譜分量值直接進行像元預排序過程 和根據(jù)局域像元密度對野值點進行檢測;所述利用光譜分量值直接進行像元預排序過程包 括a)由原始數(shù)據(jù)空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標 的點對;b)從余下的數(shù)據(jù)空間中進行第一步操作;c)繼續(xù)進行這樣的過程,直至所有的數(shù) 據(jù)點都被選出、排列;待全部數(shù)據(jù)點排序完畢之后,排在最前面的若干特征數(shù)據(jù)點被選作初 始端元,其迭代更新過程也將按照排序結(jié)果依次進行;所述根據(jù)局域像元密度對野值點進 行檢測和去除過程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內(nèi)所 包含的像元點數(shù)作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點 被去除。 本發(fā)明為一種高光譜圖像端元選擇方法,采用LLSVM作為主要工具來完成。本發(fā) 明在深入分析線性最小二乘支持向量機(LINEAR LEAST SQUARESUPPORT VECTOR MACHINE, 簡記為LLSSVM)模型的基礎上,提出建立免于降維預處理、免于體積計算、并對野值點干擾 具有魯棒性的端元提取方法。無需降維預處理、復雜度低。 野值點預刪除和像元預排序可以與基于LLSSVM進行端元選擇算法結(jié)合使用,也 可以單獨或聯(lián)合用于其它端元選擇算法中來提高其效果、效率。利用LLSSVM進行端元選擇 過程可以推廣到其他有關空間距離計算方面的應用。
圖1為利用距離尺度替換體積尺度的原理圖。
圖2為2維合成數(shù)據(jù)及端元選擇結(jié)果。 圖3為真實高光譜圖像在不同方法下的端元選擇結(jié)果對比。其中圖3a)為真實光譜,圖3b)是未經(jīng)野值點去除的端元選擇結(jié)果,圖3c)是經(jīng)過野值點去除的端元選擇結(jié)果。
圖4的表1為1000點2維合成數(shù)據(jù)端元選擇的運行時間/迭代次數(shù)比較。
圖5的表2為10000點9維真實高光譜數(shù)據(jù)端元選擇的運行時間/迭代次數(shù)比較。
具體實施例方式
下面結(jié)合附圖舉例對本發(fā)明做更詳細地描述 本發(fā)明為一種高光譜圖像端元選擇方法,采用LLSVM作為主要理論工具來完成。 對野值點進行檢測和去除基本過程如下以每個像元點為中心建立固定尺寸的鄰域窗,通 過計算鄰域窗內(nèi)所包含的像元點數(shù)作為中心點的孤立程度度量指標來剔出野值點。像元預 排序基本過程如下利用投影統(tǒng)計的方法進行像元預排序,投影落在每個方向最遠端次數(shù) 越多的點越被排在前面。端元選擇基本過程如下根據(jù)LLSSVM具有相對距離測試功能,而 相對距離的比較和相應的體積比較具有一致性,建立基于LLSSVM的最大體積尋優(yōu)迭代方 法。下面給出本發(fā)明的詳細說明 1)根據(jù)局域像元密度對野值點進行檢測和去除實施步驟如下采用鄰域分析的 方法來確認并去除野值點。野值點通常以更加孤立的方式存在。這樣,以每個像元點為中 心建立固定尺寸的鄰域窗,通過計算鄰域窗內(nèi)所包含的像元點數(shù)作為中心點的孤立程度度 量指標。孤立程度度量指標越大的點作為野值點的可能性就越大而被去除。這里采用方鄰 域(高維盒子)替換常用的圓鄰域以降低計算量。 2)利用光譜分量值直接進行像元預排序?qū)嵤┎襟E如下為了能夠獲得快速收斂 的重要端元迭代搜索,將每個像元點根據(jù)其潛在的純度進行預先評價和排序。根據(jù)光譜端 元一般分布在相應的高維幾何空間角端的特性,利用投影統(tǒng)計的方法進行像元預排序。具 體地說,當將每個數(shù)據(jù)光譜投影于眾多的具有隨機方向的測試向量時,重要特征將以較大 的概率落在測試向量投影終端。折衷考慮計算的復雜性和選擇的準確性,我們只將光譜空 間的各維坐標選作測試向量,這樣所有的投影結(jié)果可以免除任何計算直接由數(shù)據(jù)的坐標值 得出。因此,我們按照下面的方式進行排序 a)由特征空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標 的點對; b)從余下的數(shù)據(jù)空間中進行第一步操作; c)繼續(xù)進行這樣的過程,直至所有的數(shù)據(jù)點都被選出、排列。 待全部數(shù)據(jù)點排序完畢之后,排在最前面的若干特征數(shù)據(jù)點被選作初始端元,其 迭代更新過程也將按照排序結(jié)果依次進行。 3)利用LLSSVM進行端元選擇實施步驟如下原理上講,方法首先選擇N個像元作 為初始的光譜端元,并相應地計算由它們所張成的凸多面體的體積。然后,用每個像元依次 替換每個當前選擇的光譜端元,如果某個替換能夠得到具有更大體積的凸多面體,那么這 樣的替換就作為有效替換得以保留,否則作為無效替換而被淘汰。重復這樣的基本過程,直 到?jīng)]有任何替換能夠引起凸多面體的體積增大為止。此時,當前選擇的結(jié)果將作為最終光 譜端元而被選擇出來。然而,直接進行體積計算不僅計算量太大(主要為行列式的計算,其 復雜度將隨著所選擇的光譜端元數(shù)目增大而呈現(xiàn)立方增長),而且需要將原始數(shù)據(jù)空間降 至N-1維。為此,下面應用LLSSVM實現(xiàn)距離比較來獲得體積比較信息,建立免于降維預處理的端元選擇方法。
步驟1.選取前N個像素點作為初始端元;
步驟2.令目前所選端元中的第i(首次執(zhí)行i "0"類。利用如下方程求解支持參數(shù)a = [Ql, a2,…:<formula>formula see original document page 6</formula>=1)個為"1"類,其余N-1個為 (1)
S,lv= [l,l,…,1]t, K為訓練 -個NXN的單位矩陣,y是常值
(2) 其中,y為第i個元素為0其他元素為1的列向 樣本的NXN核函數(shù)矩陣,Ki,j = K(Si,Sj) = 〈Si,Sj),I是-參數(shù)。進而通過下式求解超平面方程最優(yōu)參數(shù)及b* : m/ = g", .s',乂 ,y = —5(max乂o(〈M/A〉) + min,,)=+1 步驟3.禾lj用式(2)獲得的參數(shù)建立當前的距離測算函數(shù)
fjs) = 〈w*, s》b*(3) 步驟4.依次計算每個像素的距離,如果某個像素的絕對距離大于l,則將該像素 替換第i個端元,置i = 1,算法轉(zhuǎn)入步驟2 ; 步驟5. / 1 ,若i > N,算法轉(zhuǎn)入步驟6,否則算法轉(zhuǎn)入步驟2 ;
步驟6.當前端元即為最終選擇端元,算法結(jié)束。
權利要求
一種基于線性最小二乘支持向量機的高光譜圖像端元選擇方法,其特征是步驟1.選取前N個像素點作為初始端元;步驟2.令目前所選端元中的第i個為“1”類,其余N-1個為“0”類,首次執(zhí)行i=1,建立相應的LLSSVM判別函數(shù)即距離測算函數(shù)fi(s)=<w*,s>+b*;步驟3.依次計算每個像素的距離,如果某個像素的絕對距離大于1,則將該像素替換第i個端元,置i=1,轉(zhuǎn)入步驟2;步驟4.1,若i>N,轉(zhuǎn)入步驟5,否則轉(zhuǎn)入步驟2;步驟5.當前端元即為最終選擇端元,結(jié)束。FSA00000017106400011.tif
2. 根據(jù)權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法,其特征是在步驟1之前加入根據(jù)局域像元密度對野值點進行檢測和去除過程,包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內(nèi)所包含的像元點數(shù)作為中心點的 孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除。
3. 根據(jù)權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法,其特征是在步驟l之前加入利用光譜分量值直接進行像元預排序過程,包括a)由原始數(shù) 據(jù)空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標的點對;b)從余下的數(shù)據(jù)空間中進行第一步操作;c)繼續(xù)進行這樣的過程,直至所有的數(shù)據(jù)點都被選出、排列;待全部數(shù)據(jù)點排序完畢之后,排在最前面的若干特征數(shù)據(jù)點被選作初始端元,其迭代 更新過程也將按照排序結(jié)果依次進行。
4. 根據(jù)權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法, 其特征是在步驟1之前加入根據(jù)局域像元密度對野值點進行檢測和去除過程和加入利用 光譜分量值直接進行像元預排序過程;所述根據(jù)局域像元密度對野值點進行檢測和去除過 程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內(nèi)所包含的像元點數(shù) 作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除;所述利 用光譜分量值直接進行像元預排序過程包括a)由原始數(shù)據(jù)空間的第一維到最后一維依 次選出和排列對應于極大值和極小值坐標的點對;b)從余下的數(shù)據(jù)空間中進行第一步操 作;c)繼續(xù)進行這樣的過程,直至所有的數(shù)據(jù)點都被選出、排列;待全部數(shù)據(jù)點排序完畢之 后,排在最前面的若干特征數(shù)據(jù)點被選作初始端元,其迭代更新過程也將按照排序結(jié)果依 次進行。
5. 根據(jù)權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法, 其特征是在步驟1之前加入去除過程和加入利用光譜分量值直接進行像元預排序過程和 根據(jù)局域像元密度對野值點進行檢測;所述利用光譜分量值直接進行像元預排序過程包 括a)由原始數(shù)據(jù)空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標 的點對;b)從余下的數(shù)據(jù)空間中進行第一步操作;C)繼續(xù)進行這樣的過程,直至所有的數(shù) 據(jù)點都被選出、排列;待全部數(shù)據(jù)點排序完畢之后,排在最前面的若干特征數(shù)據(jù)點被選作初 始端元,其迭代更新過程也將按照排序結(jié)果依次進行;所述根據(jù)局域像元密度對野值點進 行檢測和去除過程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內(nèi)所 包含的像元點數(shù)作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點 被去除。
全文摘要
本發(fā)明提供的是一種基于線性最小二乘支持向量機的高光譜圖像端元選擇方法。步驟1.選取前N個像素點作為初始端元;步驟2.令目前所選端元中的第i個為“1”類,其余N-1個為“0”類,首次執(zhí)行i=1,建立相應的LLSSVM判別函數(shù)即距離測算函數(shù);步驟3.依次計算每個像素的距離,如果某個像素的絕對距離大于1,則將該像素替換第i個端元,置i=1,轉(zhuǎn)入步驟2;步驟4.i=i+1,若i>N,轉(zhuǎn)入步驟5,否則轉(zhuǎn)入步驟2;步驟5.當前端元即為最終選擇端元,結(jié)束。本發(fā)明為一種高光譜圖像端元選擇方法,采用LLSVM作為主要工具來完成。無需降維預處理、復雜度低。
文檔編號G06T7/00GK101794443SQ20101010180
公開日2010年8月4日 申請日期2010年1月28日 優(yōu)先權日2010年1月28日
發(fā)明者喬玉龍, 張晶, 王立國, 趙春暉, 鄧祿群 申請人:哈爾濱工程大學