本發(fā)明涉及圖像分析與圖像理解,尤其是涉及一種基于快速自動密度聚類的可變尺度紅外小目標的檢測方法。
背景技術:
紅外小目標的檢測、跟蹤、識別等系列問題,主要來自于紅外搜索與跟蹤系統(Infrared Search and Track,IRST)。其主要任務是對天空、海面等復雜場景下的飛機、船只等感興趣目標進行有效地檢測、識別以及跟蹤。由于其作用距離較遠,目標在圖像平面成像一般只有幾個像素大小,缺乏形狀、紋理等可資利用的信息,同時,受到天空云層,海面雜波、反光帶的影響,處于低信雜比(Signal-to-Clutter Ratio,SCR)的環(huán)境下,屬于典型的弱小目標,長期以來,一直是目標自動識別領域(Automatic Target Recognition,ATR)的難點與焦點問題。
基于序列圖像的邊檢測邊跟蹤方法(Track Before Detection,TBD)在早期成為該問題的主要技術框架。其將檢測軟判決(soft decision)推遲到穩(wěn)定地跟蹤目標一段時間之后,適用于目標運動軌跡具有時空一致性、相關性的低信雜比目標。圍繞該技術路線,一些經典的算法相繼被提出,如:動態(tài)規(guī)劃(dynamic programming,DP)、多級假設檢驗(multiple–stage hypothesis testing,MHT)、高階相關(high-order correlation)等,但是該類方法均需要構建初始的軌跡搜索空間,之后借助于數據融合(data association)利用目標的運動信息完成軌跡檢測,伴隨圖像幀數的增加,計算復雜度呈指數級增長。與TBD方法不同,后期提出的基于單幀圖像的先檢測后跟蹤(Detection before Track,DBT)方法,檢測思路是來一幀檢測一幀,具有更好的實時性。但是,該研究方法的有效性強度依賴于提取的目標特征的穩(wěn)定性。近些年來,研究者在不同的角度(時域、空域),不同變換域(頻率域、小波變換域)等嘗試挖掘更為魯棒、有效的目標特征,諸如局部小區(qū)域的灰度差,對比度等等。然而此類特征對環(huán)境變化和噪聲非常敏感,而且不滿足尺度不變(scale-invariant)特性,即:目標的大小會伴隨成像環(huán)境改變等。從而無法得到穩(wěn)定的檢測結果,算法具有局限性。
在該類目標的自動識別任務中,如何挖掘魯棒的目標特征,使其滿足尺度不變特性,適應成像距離以及光照等外部環(huán)境的影響是核心工作。同時,借助于序列圖像處理低信雜比目標的優(yōu)勢,并且克服其較高的計算代價,設計出低復雜度的數據融合(data association)方法也是亟待解決的問題。
作為計算機視覺領域中的一種局部特征檢測算子以及描述算子(speeded-up robust feature,SURF)是尺度不變特征轉換算子(scale-invariant feature transform,SIFT)的加速版本。由于其具有尺度不變特性,經常被用于人臉等有形目標的識別、圖像配準以及分類等任務,利用SURF完成感興趣點的提取(interest point extraction)是進行匹配的前期工作,其與本發(fā)明的紅外小目標的點狀特征匹配。
聚類分析(clustering analysis)是無監(jiān)督分類的主要方法,用于對未標注數據集進行分類。Alex等人在文獻“Clustering by fast search and find of density peaks.In SCIENCE,2014”中提出一種快速的密度聚類方法,區(qū)別于已有的DBSCAN,K-means等方法,該方法只以數據集中各點的距離矩陣為輸入參數完成檢測,適用于非球形聚類,同時由于簡潔、快速,成為非常實用的聚類方法。
分析小目標軌跡的特點,由于其作用距離遠,運動緩慢,與隨機性更強的噪聲相比,其軌跡片段在圖像平面會呈現一種局部密度聚集特性。這啟發(fā)我們可以利用聚類分析對這些數據點進行自動聚類,直接從空域完成軌跡的提取。由于在二維圖像平面進行操作,時間復雜度可以控制在多項式級別,避免使用傳統數據融合方法而帶來的計算代價過高問題。
密度聚類算法的主要缺陷是無法進行聚類中心的自動確定(尚需手工選取)以及無法克服聚類分割產生的兩類錯誤問題:過分割(over-segmentation)、欠分割(under-segmentation)。應用到我們的數據集,會產生兩種不理想的聚類結果,即:一條完整軌跡被聚集到不同的聚類(cluster);多條軌跡被分配到一個聚類中。這兩種錯誤聚類,將導致低檢測率(detection probability)和高誤檢率(False detection)。
技術實現要素:
本發(fā)明的目的在于針對上述方法的不足,提供一種結合魯棒的特征檢測算子和回溯策略,解決可變尺度紅外小目標的檢測問題,提高算法的實時性和魯棒性的基于快速自動密度聚類的可變尺度紅外小目標的檢測方法。
本發(fā)明包括如下步驟:
1)采集真實云天或者海天背景,構建仿真小目標,利用matlab中的imnoise函數疊加高斯噪聲,合成仿真圖像序列F(t)(t=1,...N)作為圖像數據,其中,N表示圖像序列的長度;
2)利用SURF加速魯棒特征檢測算子提取圖像序列F(t)中每一幀圖像的特征點;
3)篩選所有特征點中最強的K個點;
4)保存標記得到的所有候選目標點跡的圖像坐標,作為后續(xù)聚類的數據集;
5)計算數據集合中每個點i與其它各點的距離,生成距離矩陣dist,距離函數選取歐式距離;
6)確定自適應參數S(S代表每個數據點平均鄰居的個數);
給出S的選取原則為:假定S等于截斷距離dc,當S為序列長度N×幀間運動位移frameoff×1/2時,可以得到完整的軌跡片段。
7)由步驟6)中給出的S,確定截斷距離dc;
8)通過高斯核計算每個數據點i的局部密度ρi以及δi,并計算得到數組γi=ρi×δi;
9)針對每個γi,若γi>TH,(此處參數TH選取190~200之間,可以滿足軌跡的獨立性)則確定為聚類中心;
10)將所有的數據點聚集到與自己最近的聚類中心中;
11)剔除離散點;
12)保存得到的聚類,標記其數量;
13)設置軌跡長度門限;
14)對于得到的所有聚類,逐個依據下述步驟進行處理;
15)取出第i個聚類中的一個點A,判斷該點是否是聚類中倒數第1個點,若是,則處理下一個聚類,若不是,則繼續(xù)下列步驟;
16)取出聚類中的下一個點B;
17)生成直線C:A->B,將兩點存入直線集合E;
18)取出聚類中下一個點K,若線段AB和BK的夾角θ滿足平滑性約束(smooth-kept constraint),即:0≤θ≤π/2,則將其歸入直線集合E,否則轉步驟19);
19)判斷K是否是該聚類中的最后一個點,若是,則判斷直線集合E中點的個數是否大于軌跡最小長度,若小于,則轉步驟16);若大于,則轉步驟20);若不是該聚類的最后一個點,則返回到步驟18);
20)輸出直線集合E,轉步驟15);
21)處理完所有聚類后,將得到的所有軌跡片段進行標記保存。
本發(fā)明具有如下優(yōu)點:
1.本發(fā)明利用SURF算子解決尺度可變小目標的特征提取。由于算子具有優(yōu)良的尺度不變特性,用于提取候選感興趣的目標點,較好地解決了目前眾多方法中特征對于環(huán)境的敏感問題,為方法的魯棒性奠定了基礎。
2.快速自動化密度聚類算法,針對問題域,直接從空域完成軌跡的分割、提取,克服了原有序列檢測問題中數據融合帶來的指數級復雜度問題。同時,通過設計自適應參數,解決了聚類過程中產生的過分割以及欠分割問題,保證了軌跡提取的完整性和獨立性以及聚類中心的自動選擇。
3.在后期的軌跡提取中,利用回溯算法尋找最優(yōu)解,將軌跡具有的平滑不變約束融入剪枝函數的設計,快速剪掉無關的雜波分支,加快了搜索解的速度。
附圖說明
圖1是使用本發(fā)明與其它4種方法的比對結果。
在圖1中,(a)原始圖像序列中的一幀;(b)max-median;(c)top-hat;(d)背景剔除;(e)局部對比度映射;(f)本發(fā)明。
圖2是本發(fā)明與其它3種方法的ROC曲線(真實序列1)。
圖3是本發(fā)明與其它3種方法的ROC曲線(真實序列2)。
圖4是本發(fā)明與其它3種方法的ROC曲線(真實序列3)。
具體實施方式
本發(fā)明的實施步驟主要包括:基于SURF的感興趣點提取,快速自動密度聚類以及回溯算法。
第一步:合成仿真圖像序列F(t),(t=1,…N),參照文獻“Infrared patch-image model for small target detection in a single image.IEEE Trans.On Image processing,2013”提供的合成方法,其中,背景為真實采集的云天或者海天背景,嵌入的仿真小目標尺寸控制在3×3像素至10×10像素之間,噪聲方差控制在(0.01,0.03)范圍內。
第二步:對于仿真圖像序列F(t),(t=1,...N),逐幀進行基于SURF的感興趣點提取。
(1)將待檢測的灰度圖序列F(t),保存在文件夾F中;
(2)用matlab的fopen函數在步驟(1)中的文件夾F建立一個名為‘圖像坐標’的csv文件;
(3)用matlab的imread函數讀入步驟(1)中的文件夾F中的圖像F(T)(t的初始值為1);
(4)若t=1,則用matlab的imshow函數顯示該圖像,記為img。若t不等于1,則不做任何處理;
(5)用matlab的detectSURFFeatures函數尋找圖像的特征點,存入結構變量points中;
(6)用matlab的selectStrongest函數選出特征點points中最強的30個點(結合時間效率以及雜波點的干擾,一般選取20~30為宜),存入結構變量strongpoints,利用該結構變量的位置屬性得到strongpoints中所有點在圖像F(t)的位置坐標(x,y);
(7)用matlab的plot函數將strongpoints中的點標記在步驟(4)中顯示的圖像img上;
(8)用matlab的fprintf函數將點的位置坐標寫入圖像坐標.csv文件中;
(9)若i等于N,則進入下一步。若i不等于N,i自增1,則返回到步驟(3);
(10)用matlab的fclose函數關閉圖像坐標.csv,得到圖像序列F(t)所有特征點的坐標信息;
(11)用matlab的saves函數保存被標記后的圖像img。
第三步:執(zhí)行快速自動密度聚類。
(1)將存有特征點坐標信息的‘圖像坐標.csv’文件保存在文件夾F中;
(2)用matlab的csvread函數將步驟(1)中的‘圖像坐標.csv’文件載入到二維數組data中;
(3)計算步驟(2)中數組data所有特征點到其他點的距離,保存在數組dist中;
(4)確定截斷距離dc。用matlab的sort函數對步驟(3)得到的距離進行升序排列。選取升序序列中下標為position的數組元素作為截斷距離dc,S=5%。
position=1/2×N×(N-1)×S (1)
(5)通過高斯核計算每個數據點i的局部密度ρi,保存在數組rho,計算公式如式(2)所示:
其中,U代表所有的數據點構成的集合,dij表示數據點i,j按照歐氏距離計算得到的距離。
(6)生成數組delta(δ)和數組nneigh。其中數組delta(i)的含義是:若rho(i)(數組rho在步驟(5)中得到)具有最大局部密度時,則delta(i)表示與第i個點距離最大的數據點與第i個點的距離;否則,delta(i)表示在所有局部密度大于rho(i)的數據點中,與第i個點距離最小的那個數據點與第i個點的距離。數組nneigh(i)記錄比rho(i)更大的數據點中與第i個點距離最小的數據點的編號;
(7)根據公式(4),計算得到數組γi,并用matlab提供的sort函數進行降序排序,記作γ1i;
γi=ρi×δi (4)
(8)統計聚類個數,若γ1i>TH(TH=200),則聚類個數NCLUST自增1;
(9)對非聚類中心數據點進行歸類。對非聚類中心數據點進行歸類。遍歷所有的數據點,若第i個數據點未被歸類,則根據步驟(6)得到的數組nneigh,將第i個數據點歸入下標為neigh(i)的聚類中。
(10)去除離散點,去除聚類中局部密度小于1的點以及尺寸過小的聚類(結合允許的漏檢率,此處門限取10),標記得到的最后聚類的數量是NCLUST_final。
(11)遍歷所有數據點,將點的坐標按聚類分別存儲在文件中,并使用不同顏色將其標注在圖中,用matlab的saveas函數保存。
第四步:采用回溯算法進行雜波的剪枝以及軌跡的提取。
(1)在文件夾F中有文件夾data,文件夾data中的每個data_i.csv文件保存著(i=1,2,..,NCLUST_final;NCLUST_final是聚類的個數)各個聚類中點的坐標。
(2)設置直線長度閾值TraceLength=8。
(3)用matlab的dir函數獲得文件夾data下的所有’.csv’文件信息Files。
(4)對步驟(3)得到的Files(i)(i=1,2,3,...,LengthFiles)指向的文件做以下操作。
(5)將文件中的點的坐標讀入到數組points,計算點的個數num。建立1×num的標記數組surPoint,若surPoint(1,i)(i=1,2,3,...,num)的值為1,則表示第i個點在所求直線上;若surPoint(1,i)的值為0,則表示第i個點不在所求直線上。
(6)取出聚類中第j(j=1,2,3,...,num;j初始值為1)個點A。判斷該點是否是聚類中的最后一個點,若是,處理下一個聚類,若不是,繼續(xù)下列步驟。
(7)取出聚類中的下一個點B。
(8)由A和B計算直線的斜率與截距。若兩點的縱坐標之差的絕對值小于pp(pp設為0.05),則斜率設為0,截距設為A點的縱坐標;否則,若兩點橫坐標之差的絕對值小于zz(zz設為0.05),則斜率設為9999999,截距設為A點的橫坐標;否則,通過兩點式求出斜率kk和截距vv。
(9)根據兩點的縱坐標構建平滑不變約束標志yG,若B點的縱坐標大于A點的縱坐標,yG=1;否則yG=2。用步驟(5)得到的surPoint數組標記該兩點在直線集E中。
(10)取出聚類中的下一個點K。
(11)判斷K點是否滿足步驟(9)得到的平滑不變約束:若K點的縱坐標大于B點的縱坐標,則平滑約束標記等于1,否則等于2。若該平滑約束標記與步驟(9)中的yG相等,則說明K點滿足平滑不變約束,進行下一步。若不滿足直接跳到步驟(13)。
(12)判斷K點是否在步驟(8)得到的直線上:設k2為斜率的平方再加1的開方。設li是根據斜率kk,截距vv,K點的橫坐標得到的縱坐標。若li/k2<10,則K點在由斜率kk,截距vv得到直線上,否則不在。若K點在直線上,在surPoint數組中標記K點屬于直線集E,否則跳到步驟(13)。
(13)判斷K點是否是聚類中的最后一個點:若是,判斷標記在直線集內點的個數是否大于TraceLength若大于,將該直線集內標記的點的坐標保存在單獨的一個文件中。若小于則返回步驟(7);若K點不是聚類中的最后一個點,返回到步驟(10)。
(14)j自增1,返回到步驟(6)。
(15)處理完所有聚類后,按照保存的直線集用不同顏色標記每條直線上的點,保存標記圖。
本發(fā)明的優(yōu)點可以通過以下仿真實驗進一步證明。
1、仿真條件:CPU InterCeleron N2930;主頻1.83GHZ;內存4G;操作系統win10;仿真平臺Matlab2013b。
2、比對方法:
(1)、經典方法
Top-Hat(參考文獻“Morphology-based algorithm for point target detection in infrared backgrounds,Proc.SPIE,Oct.1993”)。
Max-mean/Max-median(參考文獻“Max-mean and max-median filters for detection of small targets,Proceedings of the SPIE 3809,1999”)。
(2)、最新方法:IPI、Local Contrast Map以及Background elimination.
IPI(參考文獻“Infrared patch-image model for small target detection in a single image.IEEE Trans.On Image processing,2013”)。
局部對比度映射(參考文獻“A local contrast method for small infrared target detection.IEEE Trans.on Geo-science and remote sensing,2014”)。
背景剔除(參考文獻“small target detection and tracking based on the background elimination and kalman filter.2015International symposium on artificial intelligence and signal processing”)。
3、實驗內容及結果分析
實驗1:與top-hat、max-median以及局部對比度映射、背景抑制比較實驗(圖1所示)。
圖1給出了4個圖像序列,分別是2個海天背景,2個云天背景。從圖1可以看出,圖像背景存在大量的云層邊緣、結構化的目標、海天分界線等,屬于典型的低信雜比環(huán)境。對于這種復雜背景下的目標檢測,依賴于局部灰度、對比度等特征的局部對比度映射以及背景剔除方法由于無法提取穩(wěn)定、突出的目標特征,導致算法性能很快衰減。比較而言,基于形態(tài)學的Top-hat以及max-median優(yōu)于前述的兩種方法,但是檢測結果出現了大量的虛警。與前述這幾個方法相比,本發(fā)明對于背景的適應性更好,均能夠得到令人滿意的檢測結果,并且具有更少的虛警。
實驗2:與性能較為穩(wěn)定的IPI算法的比較結果(表1所示)。為了進一步展示本發(fā)明的性能,給出下述的度量指標:檢測率Pd,虛警False alarm以及漏檢missing detection。實驗序列是8個海天,5個云天背景下的仿真序列。從表1的比較結果可以看出,對于大部分的實驗序列,兩種方法都給出了滿意的檢測率。但是從整體上看,算法IPI對于多個序列都產生了不同程度的虛警和漏檢。本發(fā)明雖然也針對海天序列-2、4、7產生了虛警和漏檢,但是明顯低于IPI。因此,從性能上看,本發(fā)明更能適應不同背景下的目標檢測,性能更為穩(wěn)定。
本發(fā)明與IPI方法的比較結果參見表1。
表1
實驗3:接收者操作特征曲線(Receiver Operating Characteristic,ROC)是公認的信號檢測理論中測度算法性能的分析工具。為此針對三個真實的序列圖像,圖2~4給出了max-mean、top-hat、IPI與本發(fā)明的比較結果。對于序列1,只有IPI方法比本發(fā)明稍快一點達到檢測率Pd為1,但是本發(fā)明具有更低的虛警。對于序列2和3,本發(fā)明明顯優(yōu)于其他算法,可以在同樣的虛警下得到理想的檢測率。