本發(fā)明屬于遙感信息處理技術(shù)領(lǐng)域,特別涉及一種高光譜目標(biāo)檢測(cè)方法,可用于植被和生態(tài)研究、地質(zhì)巖礦的識(shí)別、海洋水色定量檢測(cè)、軍事和城市規(guī)劃等領(lǐng)域。
背景技術(shù):
隨著信息技術(shù)和空間技術(shù)的飛速發(fā)展,高光譜遙感圖像由于其“圖譜合一”的特性使得它在目標(biāo)檢測(cè)領(lǐng)域具有極大的優(yōu)勢(shì),因此高光譜目標(biāo)檢測(cè)系統(tǒng)已經(jīng)在植被和生態(tài)研究、地質(zhì)巖礦的識(shí)別、海洋水色定量檢測(cè)、軍事和城市規(guī)劃等領(lǐng)域廣泛應(yīng)用。根據(jù)是否需要目標(biāo)的光譜先驗(yàn)信息劃分,高光譜圖像目標(biāo)檢測(cè)可以分為異常檢測(cè)和光譜匹配檢測(cè)。光譜匹配檢測(cè)屬于有監(jiān)督的目標(biāo)檢測(cè),它們需要使用目標(biāo)光譜信號(hào)的先驗(yàn)知識(shí)。光譜匹配檢測(cè)通過對(duì)目標(biāo)光譜先驗(yàn)特征進(jìn)行相關(guān)和匹配來發(fā)現(xiàn)目標(biāo)。目標(biāo)的光譜特征不僅可以從已有的光譜庫(kù)中獲取,也可以從高光譜圖像中的已知位置的目標(biāo)像元中獲取。
目前,大多數(shù)的經(jīng)典的高光譜目標(biāo)檢測(cè)方法如匹配子空間檢測(cè),都是基于二元假設(shè)模型和統(tǒng)計(jì)分布假設(shè)模型。這些方法一般都是基于高斯分布假設(shè)的,并且通過更準(zhǔn)確的估計(jì)背景的協(xié)方差矩陣來提高檢測(cè)精度。然而,高斯分布假設(shè)并不能滿足實(shí)際場(chǎng)景,這些方法所獲得的結(jié)果精度有限。因此,y.chen等人在文獻(xiàn)“y.chen,n.m.nasrabadi,andt.d.tran,sparserepresentationfortargetdetectioninhyperspectralimagery.ieeejournalofselectedtopicsinsignalprocessing,vol.5,no.3,pp.629–640,2011”中提出基于稀疏表達(dá)的目標(biāo)檢測(cè)方法,該方法通過將待檢測(cè)像素用目標(biāo)和背景的聯(lián)合字典稀疏表達(dá),通過重構(gòu)誤差來檢測(cè)目標(biāo)。該方法相比于其他經(jīng)典的方法主要有以下兩個(gè)優(yōu)勢(shì):一,不需要對(duì)目標(biāo)和背景進(jìn)行統(tǒng)計(jì)假設(shè);二,不需要目標(biāo)和背景向量相互獨(dú)立的假設(shè)。
通過上述分析可得出,影響基于稀疏表達(dá)的目標(biāo)檢測(cè)方法的檢測(cè)精度的因素有兩個(gè):光譜字典和重構(gòu)誤差函數(shù)。y.chen等人所提出的方法是基于目標(biāo)和背景的聯(lián)合字典進(jìn)行稀疏表達(dá)的,其中重構(gòu)誤差函數(shù)采用的是最簡(jiǎn)單簡(jiǎn)單的均方誤差,不含有任何提高檢測(cè)精度的判別信息。由于高光譜圖像中所含有的目標(biāo)像素比較少(一般為5%左右),僅僅通過目標(biāo)光譜信息獲得的目標(biāo)樣本集很大可能會(huì)包含背景樣本,這樣會(huì)導(dǎo)致目標(biāo)字典純度不高,影響待測(cè)像素的稀疏表達(dá)準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的目標(biāo)訓(xùn)練數(shù)據(jù)中目標(biāo)樣本少和背景訓(xùn)練數(shù)據(jù)中背景樣本包含目標(biāo)的難題,克服現(xiàn)有方法識(shí)別率低的問題,本發(fā)明提出一種基于稀疏表達(dá)和判別分析相結(jié)合的高光譜目標(biāo)檢測(cè)方法。
本發(fā)明的解決方案主要包括如下步驟:
1)輸入待檢測(cè)的高光譜圖像和目標(biāo)光譜信息,采用基于歐氏距離的度量方法進(jìn)行預(yù)檢測(cè),將待檢測(cè)的高光譜圖像劃分為目標(biāo)訓(xùn)練集和背景訓(xùn)練集;
2)僅選取背景訓(xùn)練集,并在重構(gòu)函數(shù)中加入基于距離的判別信息,構(gòu)建判別性的字典;
3)估計(jì)待測(cè)像素所屬類別,即背景或目標(biāo),并計(jì)算對(duì)應(yīng)的稀疏編碼;
4)計(jì)算待測(cè)像素的重構(gòu)誤差,根據(jù)給定的閾值來判斷待測(cè)像素是背景還是目標(biāo),即得到高光譜目標(biāo)檢測(cè)結(jié)果。
基于以上方案,本發(fā)明還進(jìn)一步作了如下重要優(yōu)化:
在構(gòu)建判別性的字典的過程中,剔除疑似為目標(biāo)的像素。
步驟1)具體實(shí)現(xiàn)過程如下:通過下式計(jì)算相似度:
其中x和y分別表示目標(biāo)光譜和待檢測(cè)像素,b為波段數(shù),將計(jì)算后的所有待檢測(cè)像素的相似度矩陣按照降序排列,取相似度矩陣最后5%所對(duì)應(yīng)的像素構(gòu)建目標(biāo)訓(xùn)練集,剩余95%構(gòu)建背景訓(xùn)練集。
步驟2)具體實(shí)現(xiàn)過程如下:
2a)將待檢測(cè)圖像中步驟1)得到的目標(biāo)訓(xùn)練集替換為隨機(jī)抽取的背景像素,并將替換后待檢測(cè)圖像隨機(jī)打成5×5的塊;
2b)隨機(jī)選擇20%的總塊數(shù)所對(duì)應(yīng)的像素作為基函數(shù)構(gòu)成初始字典;
2c)采用lasso算法,計(jì)算字典對(duì)應(yīng)的稀疏編碼:
其中,α為稀疏系數(shù),λ為懲罰系數(shù),j(m,μ)為基于距離信息的判別性度量函數(shù),μdis表示背景訓(xùn)練集的均值,mdis為背景樣本集的協(xié)方差矩陣,當(dāng)t=1時(shí),dt-1為初始字典,并且t∈[1,30];
2d)更新字典
2e)提純字典
剔除疑似為目標(biāo)的原子,遍歷字典中的所有像素,按照如下公式計(jì)算重構(gòu)誤差
2f)重復(fù)迭代步驟2a)-2e)30次。
步驟3)具體實(shí)現(xiàn)過程如下:
根據(jù)學(xué)習(xí)到的字典dt和待測(cè)像素對(duì)其進(jìn)行編碼,利用如下目標(biāo)式:
求解待檢測(cè)像素xi的編碼值αi。
步驟4)具體實(shí)現(xiàn)過程如下:
4a)測(cè)試樣本xt的重構(gòu)誤差表示為
4b)通過上式計(jì)算待檢測(cè)圖像中像素的重構(gòu)誤差,此時(shí)給定一個(gè)閾值ξ判斷每個(gè)像素是背景還是目標(biāo)。
本發(fā)明的技術(shù)效果如下:
在構(gòu)建字典時(shí)只利用了背景樣本,解決了目標(biāo)樣本少導(dǎo)致字典學(xué)習(xí)中目標(biāo)樣本和背景樣本不均衡問題;并且通過對(duì)字典提純操作即剔除目標(biāo)樣本,解決了目標(biāo)樣本對(duì)稀疏編碼的干擾。在構(gòu)造重構(gòu)誤差函數(shù)時(shí)加入了基于距離的判別信息,提高了重構(gòu)誤差函數(shù)的檢測(cè)能力,進(jìn)而提高目標(biāo)檢測(cè)率。
附圖說明
圖1為本發(fā)明稀疏表達(dá)和判別分析相結(jié)合的高光譜目標(biāo)檢測(cè)方法的流程圖。
圖2為本發(fā)明所使用的三個(gè)數(shù)據(jù)庫(kù)及相應(yīng)的groundtruth,具體分別為:(a)nuancecri數(shù)據(jù)庫(kù),(b)hydice數(shù)據(jù)庫(kù),(c)和(d)aviris數(shù)據(jù)庫(kù)。
圖3為nuancecri數(shù)據(jù)庫(kù)上的roc曲線結(jié)果,其中(a)crii的roc曲線,(b)criii的roc曲線。
圖4為hydice數(shù)據(jù)庫(kù)上的roc曲線結(jié)果。
圖5為aviris數(shù)據(jù)庫(kù)上的roc曲線結(jié)果,其中(b)avirisi的roc曲線,(c)avirisii的roc曲線。
具體實(shí)施方式
為了更清楚地說明本發(fā)明實(shí)施的技術(shù)方案,下面結(jié)合附圖,對(duì)本發(fā)明實(shí)現(xiàn)的步驟作進(jìn)一步的詳細(xì)描述。
參照?qǐng)D1,本發(fā)明實(shí)現(xiàn)的步驟如下:
步驟1,通過預(yù)檢測(cè)將待檢測(cè)圖像劃分目標(biāo)訓(xùn)練集和背景訓(xùn)練集。
通過下述公式計(jì)算相似度
其中x和y分別表示目標(biāo)光譜和待檢測(cè)像素,b為波段數(shù)。將計(jì)算后的所有待檢測(cè)像素的相似度矩陣按照降序排列,取相似度矩陣最后5%所對(duì)應(yīng)的像素構(gòu)建目標(biāo)訓(xùn)練集,剩余95%構(gòu)建背景訓(xùn)練集。
步驟2,構(gòu)建判別性的字典。
(2a)將待檢測(cè)圖像中步驟1得到的目標(biāo)訓(xùn)練集替換為隨機(jī)抽取的背景像素,并將替換后待檢測(cè)圖像隨機(jī)打成5×5的塊;
(2b)隨機(jī)選擇20%的總塊數(shù)所對(duì)應(yīng)的像素作為基函數(shù)構(gòu)成初始字典,例如:待檢測(cè)圖像大小為60×60,則總塊數(shù)為144,則初始字典基的個(gè)數(shù)為0.2×144×5×5并取整為720;
(2c)采用lasso算法,計(jì)算字典對(duì)應(yīng)的稀疏編碼:
其中,j(m,μ)為基于距離信息的判別性度量函數(shù),μdis表示背景樣本集的均值,mdis為背景樣本集的協(xié)方差矩陣。當(dāng)t=1時(shí),dt-1為初始字典,并且t∈[1,30]。
(2d)更新字典。
(2e)提純字典,剔除可疑原子(疑似為目標(biāo)的原子)。遍歷字典中的所有原子,按照如下公式計(jì)算重構(gòu)誤差。
(2f)重復(fù)迭代步驟(2a)-(2e)30次。
步驟3,估計(jì)待檢測(cè)像素所屬類別如背景或目標(biāo),并計(jì)算對(duì)應(yīng)的稀疏編碼。
根據(jù)學(xué)習(xí)到的字典d和待測(cè)像素對(duì)其進(jìn)行編碼,利用如下目標(biāo)式:
求解待檢測(cè)像素xi的編碼值αi。
步驟4,計(jì)算待檢測(cè)像素的重構(gòu)誤差,并以此得到算法的檢測(cè)精度(auc值和roc曲線)。
(4a)測(cè)試樣本xt的重構(gòu)誤差可表示為
(4b)通過上式可以計(jì)算待檢測(cè)圖像中像素的重構(gòu)誤差,此時(shí)給定一個(gè)閾值ξ可以判斷每個(gè)像素是背景還是目標(biāo)。
在檢測(cè)結(jié)果中,如果背景像素被錯(cuò)誤檢測(cè)為目標(biāo)像素就認(rèn)為是錯(cuò)誤的檢測(cè)(falsepositive,fp),測(cè)試圖像中將目標(biāo)像素檢測(cè)為目標(biāo)像素被認(rèn)為是正確的檢測(cè)(truepositive,tp)。假設(shè)測(cè)試圖像中g(shù)roundtruth所標(biāo)記的目標(biāo)像素?cái)?shù)為p,測(cè)試圖像中g(shù)roundtruth所標(biāo)記的背景像素?cái)?shù)為n,則可以計(jì)算正確檢測(cè)的比率(truepositiverate,tpr)和錯(cuò)誤檢測(cè)的比率(falsepositiverate,fpr):tpr=tp/p,fpr=fp/n。通過改變閾值ξ,可以得到一系列的tpr和fpr。分別以fpr和tpr為橫、縱坐標(biāo)可以畫出roc(receiveroperatingcharacteristic)曲線。定量的對(duì)比指標(biāo)包括roc曲線下的面積值和roc曲線與主對(duì)角線交點(diǎn)處的fpr值和tpr值,分別表示為auc(areaundercurve)。
本發(fā)明的效果還通過以下實(shí)驗(yàn)作了進(jìn)一步的說明。
1.仿真條件
本發(fā)明是在中央處理器為intel(r)corei3-32403.4ghz、內(nèi)存10g、windows7操作系統(tǒng)上,運(yùn)用matlab軟件進(jìn)行的仿真。
實(shí)驗(yàn)中使用的圖像數(shù)據(jù)庫(kù)如圖2所示。
其中,nuancecri數(shù)據(jù)庫(kù)由nuancecri高光譜傳感器采集,含有24個(gè)波段,波長(zhǎng)范圍從650nm到1100um;hydice數(shù)據(jù)庫(kù)用可見近紅外和短波紅外的機(jī)器傳感器收集的2016年7月4號(hào)的cookercity,montanta的圖像,含有126個(gè)波段,波長(zhǎng)范圍從450nm到2500nm;aviris數(shù)據(jù)庫(kù)由機(jī)載可見光和紅外光譜儀采集的美國(guó)的sandiego的圖像,含有224個(gè)波段,波長(zhǎng)范圍從370nm到2510nm。
2.仿真內(nèi)容
首先,在上述的三個(gè)數(shù)據(jù)集中,完成本發(fā)明算法(基于稀疏表達(dá)和判別信息的高光譜目標(biāo)檢測(cè)方法)的實(shí)驗(yàn)。為了證明算法的有效性,綜合考慮算法的流行性、嶄新性,我們選取了7個(gè)對(duì)比方法ace、osp、hsd、amsd、cem、std、和hssd進(jìn)行比較。本發(fā)明提出的算法基于稀疏表達(dá)和判別信息的高光譜目標(biāo)檢測(cè)算法(ahybridsparsityanddistance-baseddiscriminationdetectorforhyperspectralimages),在實(shí)驗(yàn)比較中記為hsdd算法。本發(fā)明所提出的hsdd算法和其他7個(gè)對(duì)比算法在三個(gè)數(shù)據(jù)庫(kù)上的運(yùn)行結(jié)果的roc曲線如圖3、圖4、圖5所示,定量的檢測(cè)精度auc值如表1所示。其中:
osp和cem是在文獻(xiàn)“q.du,h.ren,andc.i.chang.acomparativestudyfororthogonalsubspaceprojectionandconstrainedenergyminimization.ieeetransactionsongeoscienceandremotesensing,vol.41,no.6,pp.1525–1529,2003.”提出的。
ace在“x.jin,s.paswaters,andh.cline.acomparativestudyoftargetdetectionalgorithmsforhyperspectralimagery.proceedingsofspie-theinternationalsocietyforopticalengineering,vol.7334,pp.73341w–73341w–12,2009.”中有詳細(xì)介紹。
hsd是在“j.broadwaterandr.chellappa.hybriddetectorsforsubpixeltargets.ieeetransactionsonpatternanalysisandmachineintelligence,vol.29,no.11,pp.1891–903,2007”提出的。
std是在“y.chen,n.m.nasrabadi,andt.d.tran.sparserepresentationfortargetdetectioninhyperspectralimagery.ieeejournalofselectedtopicsinsignalprocessing,vol.5,no.3,pp.629–640,2011.”中提出的。
hsdd在“b.du,y.zhang,l.zhang,andd.tao.beyondthesparsity-basedtargetdetector:ahybridsparsityandstatisticsbaseddetectorforhyperspectralimages.ieeetransactionsonimageprocessingapublicationoftheieeesignalprocessingsociety,2016.”中有詳細(xì)介紹。
表1目標(biāo)檢測(cè)的auc值
從圖3、圖4、圖5和表1可以看出,本發(fā)明在nuancecri數(shù)據(jù)庫(kù)、hydice數(shù)據(jù)庫(kù)和aviris數(shù)據(jù)庫(kù)上檢測(cè)精度都比現(xiàn)有的目標(biāo)檢測(cè)方法都好,因此本方法比其他7種方法更有效和更魯棒。std方法構(gòu)建字典時(shí),采用了目標(biāo)字典和背景字典聯(lián)合得到統(tǒng)一的字典。一般基于訓(xùn)練的高光譜圖像的目標(biāo)檢測(cè)方法的訓(xùn)練圖像和待檢測(cè)圖像為同一張圖,采用預(yù)檢測(cè)結(jié)果構(gòu)建訓(xùn)練集,因此預(yù)檢測(cè)結(jié)果的精度對(duì)字典的純度影響很大。同時(shí),待檢測(cè)圖像的目標(biāo)像素?cái)?shù)量少,導(dǎo)致目標(biāo)訓(xùn)練集中大多數(shù)情況含有背景像素,因此本發(fā)明只采用背景樣本構(gòu)建字典,并且加入了判別信息來提純字典,得到了具有判別信息的字典。當(dāng)待測(cè)像素采用判別性字典線性表示時(shí),使得目標(biāo)和與背景的差異更加顯著,從而提高了目標(biāo)檢測(cè)的精度。