本發(fā)明屬于遙感圖像目標檢測與識別領域,涉及一種車輛高分遙感圖像的基于LLC特征的弱監(jiān)督識別方法,可以在沒有人工標注出具體目標的訓練樣本中訓練出目標模型并應用于高分辨率遙感圖像中車輛目標的檢測與識別。
背景技術:遙感圖像目標檢測與識別一直是遙感圖像處理和模式識別領域研究的熱點課題,它是隨著遙感技術的發(fā)展而興起的一項新技術,具有作用距離遠、覆蓋范圍廣、執(zhí)行效率高等方面的優(yōu)點,同時也有著重要的軍事意義和民用價值。隨著計算機技術的不斷發(fā)展,機器學習,模式識別,數(shù)據(jù)挖掘等方面的技術對遙感信息提取和處理產(chǎn)生了至關重要的作用。目前根據(jù)機器學習的形式,可以把遙感圖像目標識別算法主要分為兩類:無監(jiān)督的目標自動識別算法和有監(jiān)督目標自動識別算法。所謂無監(jiān)督目標自動識別算法,就是在沒有任何標注的訓練數(shù)據(jù)中,由算法尋求目標的潛在特性,從而完成遙感圖像中的目標自動檢測與識別。而有監(jiān)督目標檢測算法則是對已經(jīng)由人工標注完全的正負訓練樣本集進行訓練學習,是計算機找出特定目標的一類特征,然后根據(jù)訓練結(jié)果對測試數(shù)據(jù)中的目標進行自動檢測和識別。然而,無監(jiān)督的目標自動識別結(jié)果往往不夠準確,傳統(tǒng)的無監(jiān)督學習的方法在復雜背景下的遙感圖像中更是難以達到理想的效果。有監(jiān)督的目標檢測雖然在許多領域已經(jīng)取得了比較好的結(jié)果,但是在遙感圖像中,由于圖像數(shù)量繁多,每幅圖像包含信息量大,目標種類多,數(shù)量大等諸多因素,使得對遙感圖像數(shù)據(jù)庫的人工標注顯得尤為困難。此外,由于圖像分辨率有限,背景復雜等因素,目前常用的圖像特征(例如HOG和BOW)并不能在遙感圖像目標識別任務中取得十分突出的效果。為此,本發(fā)明提出一種基于LLC特征的弱監(jiān)督遙感目標自動識別算法,可以對復雜背景下的遙感圖像目標提取有效的特征向量,并在沒有人工標注出具體目標的訓練樣本中進行迭代訓練學習,得到的目標模型可以應用于遙感圖像中復雜背景下的車輛目標的自動檢測也識別。因此,本發(fā)明可以大大減少人工標注的復雜度,節(jié)省人工標注的時間,同時保證最終在弱監(jiān)督訓練出的目標模型可以在測試圖像庫中對車輛目標進行自動檢測與識別。
技術實現(xiàn)要素:要解決的技術問題為了避免現(xiàn)有技術的不足之處,本發(fā)明提出一種車輛高分遙感圖像的基于LLC特征的弱監(jiān)督識別方法,可以在沒有人工標注出具體目標的訓練樣本中獲取初始化訓練樣本集,然后提取樣本圖塊的LLC特征利用SVM分類器進行反復迭代訓練學習,得出最優(yōu)目標分類器。最后利用這個分類器對測試圖像中的候選圖塊進行分類和定位。技術方案一種車輛高分遙感圖像的基于LLC特征的弱監(jiān)督識別方法,其特征在于步驟如下:步驟1提取訓練圖像的顯著圖:將輸入圖像下采樣為N×N個像素,然后針對圖像中的每個像素提取顯著性特征并選取“基于視覺注意機制的遙感圖像感興趣目標分割方法”中的14顯著性特征,記為[sm1,sm2,…,sm14],然后將各類顯著特征分量圖的權重視為相同的,通過求取所有顯著特征分量圖的均值作生產(chǎn)顯著圖sm,步驟2圖像分割,獲取候選目標圖塊:采用自適應閾值分割方法對顯著圖進行顯著區(qū)域分割,其中閾值令t∈[0.5,5]中的兩個值對圖像分割后得到二值圖以二值圖中的顯著值為1的像素集為顯著區(qū)域,求取顯著區(qū)域的外接矩形獲取顯著圖塊;其中:W為顯著圖sm的列數(shù),H為顯著圖sm的行數(shù),S(x,y)為顯著圖sm在坐標為x,y處的顯著值;在訓練集中實施步驟1~2獲得的顯著圖塊為目標候選圖塊;在背景訓練集中實施步驟1~2獲得的顯著圖塊為負樣本字典;步驟3利用在背景訓練集中得出的負樣本字典對訓練集中的目標候選圖塊進行負樣本挖掘,完成初始化標注,步驟為:步驟a、首先分別提取負樣本字典和目標候選圖塊中的SIFT特征并進行聚類,然后使用BOW模型進行表示;步驟b、根據(jù)測量目標候選圖塊與負樣本字典中圖塊的相似性,將與負樣本字典最不相似的目標候選圖塊作為初始化標注結(jié)果;其中:||·||1表示L1范數(shù),表示第i幅圖像中第j個目標候選圖塊,表示負樣本字典中,其BOW特征與的BOW特征歐氏距離最近的一個負樣本圖塊;步驟4迭代訓練,優(yōu)化分類器:將所有初始化標注結(jié)果作為分類器的初始化正訓練樣本,并在負樣本字典中選取同等數(shù)量的圖塊作為分類器的初始化負訓練樣本,在每一次迭代訓練中,首先提取所有訓練樣本的LLC特征,利用SVM對特征訓練分類器,然后將訓練好的分類器對所有目標候選圖塊進行分類,將分類結(jié)果為車輛目標的圖塊作為下一次訓練的正訓練樣本,如此反復迭代直到達到迭代停止條件。本發(fā)明利用每一次迭代得到的分類器在負樣本字典中的錯誤率來判斷分類器的性能,當本次迭代得到的分類器比上一次迭代的分類器的錯誤率高的時候,迭代停止,并選取上一次迭代得到的分類器為最優(yōu)分類器輸出;步驟5車輛目標檢測識別:首先利用步驟1和步驟2對測試圖像進行處理,得到圖像中的顯著圖塊作為目標候選圖塊,然后利用步驟4訓練出的最優(yōu)分類器對所有候選圖塊進行分類,對分類為目標的圖塊在圖像中進行定位即可完成遙感圖像中車輛目標的檢測識別。所述步驟1中“基于視覺注意機制的遙感圖像感興趣目標分割方法”采用第一屆高分辨率對地觀測會議論文集中張鼎文、韓軍偉和郭雷發(fā)表的“基于視覺注意機制的遙感圖像感興趣目標分割方法”文獻。所述步驟2中的自適應閾值分割方法,采用R.Achanta,S.Hemami,F.EstradaandS.Susstrunk,“Frequency-tunedsalientregiondetection,”IEEEConferenceonComputerVisionandPatternRecognition,2009文獻中的方法實現(xiàn)。所述步驟2中顯著區(qū)域的外接矩形采用Pandey,M.,Lazebnik,S.“Scenerecognitionandweaklysupervisedobjectlocalizationwithdeformablepart-basedmodel”ICCV,2011中所提出的方法進行修正。所述步驟3中采用SIFT特征,利用LoweDG.“Distinctiveimagefeaturesfromscale-invariantkeypoints”[J].Internationaljournalofcomputervision,2004文獻中的方法實現(xiàn)。所述步驟3中采用BOW模型,利用L.Fei-FeiandP.Perona.“ABayesianHierarchicalModelforLearningNaturalSceneCategories.”IEEEComp.Vis.Patt.Recog.2005文獻中的方法實現(xiàn)。所述步驟4中采用LLC特征,利用Wang,Jinjun,etal.“Locality-constrainedlinearcodingforimageclassification.”ComputerVisionandPatternRecognition(CVPR),2010文獻中的方法實現(xiàn)。有益效果本發(fā)明提出一種車輛高分遙感圖像的基于LLC特征的弱監(jiān)督識別方法,可以在沒有人工標注出具體目標的訓練樣本中,首先利用顯著模型,自適應分割和負樣本挖掘方法獲得初始化訓練樣本集,然后提取樣本圖塊的LLC特征利用SVM分類器進行反復迭代訓練學習,得出最優(yōu)目標分類器。最后利用這個分類器對測試圖像中的候選圖塊進行分類和定位即可完成復雜背景遙感圖像中車輛目標的檢測和識別。附圖表說明圖1:本發(fā)明方法的基本流程圖圖2:實驗對比結(jié)果圖圖3:準確率-回想率曲線對比圖具體實施方式現(xiàn)結(jié)合實施例、附圖對本發(fā)明作進一步描述:用于實施的硬件環(huán)境是:IntelPentium2.93GHzCPU計算機、2.0GB內(nèi)存,運行的軟件環(huán)境是:MatlabR2011b和WindowsXP。選取了85幅高分辨率遙感圖像進行車輛識別,其中45幅作為訓練圖像,另外40幅作為測試圖像。本發(fā)明具體實施如下:1.提取訓練圖像的顯著圖:將輸入圖像下采樣為200×200個像素,然后針對圖像中的每個像素提取顯著性特征。本發(fā)明選取“基于視覺注意機制的遙感圖像感興趣目標分割方法”中的14顯著性特征,記為[sm1,sm2,…,sm14]。因為在弱監(jiān)督學習中,我們的訓練樣本只進行了弱標注,也就是我們只知道訓練樣本中哪些圖像中含有目標,哪些圖像中不含有目標,而不知道目標具體在圖像中的哪個位置,所以我們不能用訓練的方法來對提取的顯著圖進行融合。由于缺少先驗知識,我們將各類顯著特征分量圖的權重視為相同的,通過求取所有顯著特征分量圖的均值作生產(chǎn)顯著圖sm,2.圖像分割,獲取候選目標圖塊:本發(fā)明選取“Frequency-tunedsalientregiondetection”中的自適應閾值分割方法對顯著圖進行顯著區(qū)域分割,其中閾值其中:W為顯著圖sm的列數(shù),H為顯著圖sm的行數(shù),S(x,y)為顯著圖sm在坐標為x,y處的顯著值;令t∈[0.5,5]中的兩個值對圖像分割后得到二值圖在二值圖中,顯著值為1的像素集即為顯著區(qū)域。然后通過求取顯著區(qū)域的外接矩形,并采用“Scenerecognitionandweaklysupervisedobjectlocalizationwithdeformablepart-basedmodel”中的方法對這個外接矩形進行修正來獲取顯著圖塊。在訓練集中實施步驟1~3獲得的顯著圖塊為目標候選圖塊;在背景訓練集中實施步驟1~3獲得的顯著圖塊為負樣本字典;3.利用在背景訓練集中得出的負樣本字典對訓練集中的目標候選圖塊進行負樣本挖掘,完成初始化標注,步驟為:步驟a、首先分別提取負樣本字典和目標候選圖塊中的SIFT特征并進行聚類,然后使用BOW模型進行表示;步驟b、根據(jù)測量目標候選圖塊與負樣本字典中圖塊的相似性,將與負樣本字典最不相似的目標候選圖塊作為初始化標注結(jié)果;其中:||·||1表示L1范數(shù),表示第i幅圖像中第j個目標候選圖塊,表示負樣本字典中,其BOW特征與的BOW特征歐氏距離最近的一個負樣本圖塊;其中,設置聚類數(shù)k∈[50,200],每幅遙感圖像中初始化標注數(shù)為n∈[1,20]。4.迭代訓練,優(yōu)化分類器:將所有初始化標注結(jié)果作為分類器的初始化正訓練樣本,并在負樣本字典中選取同等數(shù)量的圖塊作為分類器的初始化負訓練樣本,在每一次迭代訓練中,首先根據(jù)文獻“Locality-constrainedlinearcodingforimageclassification”提取所有訓練樣本的LLC特征,利用SVM對特征訓練分類器,然后將訓練好的分類器對所有目標候選圖塊進行分類,將分類結(jié)果為車輛目標的圖塊作為下一次訓練的正訓練樣本,如此反復迭代直到達到迭代停止條件。本發(fā)明利用每一次迭代得到的分類器在負樣本字典中的錯誤率來判斷分類器的性能,當本次迭代得到的分類器比上一次迭代的分類器的錯誤率高的時候,迭代停止,并選取上一次迭代得到的分類器為最優(yōu)分類器輸出。5.車輛目標檢測識別:首先利用步驟1和步驟2對測試圖像進行處理,得到圖像中的顯著圖塊作為目標候選圖塊,然后利用步驟4訓練出的最優(yōu)分類器對所有候選圖塊進行分類,對分類為目標的圖塊在圖像中進行定位即可完成遙感圖像中車輛目標的檢測識別。本發(fā)明在40幅高分辨率遙感圖像測試集中進行車輛檢測識別,并選用準確率-回想率曲線對識別結(jié)果進行評估。其中準確率-回想率曲線定義為在分割閾值變化下,回想率(TPR)和準確率(Preci)的變化關系。計算公式如下:其中FP為檢測到的虛警,N為groundtruth中非目標的區(qū)域;TP為檢測到的實警,P為groundtruth中目標的區(qū)域。附圖2為一些對比實驗結(jié)果,其中,弱監(jiān)督方法指的是利用本發(fā)明方法進行遙感圖像車輛識別的結(jié)果,全監(jiān)督方法指的是利用人工標注的訓練樣本集,訓練基于LLC特征的SVM分類器,對測試圖像中候選目標圖塊進行分類的結(jié)果??梢钥闯霰景l(fā)明是一種行之有效的弱監(jiān)督遙感車輛識別算法,并且能夠達到與全監(jiān)督方法十分接近的車輛識別效果。附圖3為本發(fā)明方法和全監(jiān)督方法的準確率-回想率曲線,其中上方的曲線表示本發(fā)明方法的性能,下方的曲線表示傳統(tǒng)的全監(jiān)督方法的性能。從曲線中可以看出,按照本發(fā)明方法訓練出的弱監(jiān)督目標分類器在目標檢測結(jié)果中可以達到更高的準確值,而利用全監(jiān)督方法則可以達到更高的查全率(TP),總體來說,本發(fā)明能夠在沒有人工標注的情況下自動完成訓練樣本的初始化和迭代優(yōu)化,最終完成測試圖像的目標識別和定位,并取得與令人滿意的結(jié)果。