本發(fā)明涉及遙感圖像處理技術領域,特別涉及一種基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像目標快速檢測方法。
背景技術:
目標檢測是遙感圖像解譯分析中的一類重要的基礎應用,在軍事和民用領域具有重要的應用價值。隨著遙感成像技術的發(fā)展,反映在遙感圖像上的地物信息越來越豐富,這為圖像目標檢測任務提供了更多的可用目標信息,然而在復雜背景下進行目標檢測仍具有極大的挑戰(zhàn)性。以往解決目標檢測問題的一般方法是首先利用含有目標的圖像切片作為訓練數(shù)據(jù)來訓練一個目標檢測機,隨后在整幅待檢測圖像上利用窮盡搜索的辦法用目標檢測機掃描圖像的每個位置,雖然這類方法在實際應用中已經(jīng)取得了一定的效果,但仍存在許多問題和挑戰(zhàn)。
遙感圖像自動目標檢測任務存在的一個關鍵問題是如何選擇和提取判別性能較強的特征,將目標與背景進行準確的區(qū)分,并且這種特征需要在面對遙感圖像的復雜多變的背景時保持足夠的魯棒性。為了解決低層圖像特征與高層語義理解中的“語義鴻溝”問題,研究人員對于如何設計穩(wěn)定的高層語義特征進行了大量的研究。相對于低層特征,高層語義特征能夠更好地反映目標穩(wěn)定特性的先驗知識和語義信息,然而以往的語義特征提取算法非常依賴于人工特征設計和選取,在環(huán)境較為復雜或數(shù)據(jù)量較大的情況下,依靠人工選擇穩(wěn)定的特征仍然是一項較為困難的工作。
遙感圖像自動目標檢測中存在的另一個問題是如何進行圖像搜索以發(fā)現(xiàn)可能存在的目標,目標搜索中常用的基于滑動窗方法的窮盡搜索策略所需要的計算量巨大,且非常耗時,這使得以往的目標檢測算法通常非常緩慢,實用性較低,因此如何在遙感圖像中進行快速的目標搜索仍然是一個挑戰(zhàn)。
技術實現(xiàn)要素:
(一)要解決的技術問題
為了解決現(xiàn)有技術在大場景遙感圖像中人工特征選取困難、定位算法計算復雜、速度較慢的技術問題,本發(fā)明提出了一種基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像目標快速檢測方法。
(二)技術方案
根據(jù)本發(fā)明的一個方面,提供了一種基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像檢測方法,包括以下步驟:s1:利用基于視覺顯著性的圖像目標粗定位方法對待測圖像中的目標進行定位并產(chǎn)生候選待檢測窗口;s2:利用模型訓練獲得深度置信網(wǎng)絡模型;s3:利用步驟s2獲得的深度置信網(wǎng)絡模型對候選待檢測窗口內(nèi)的圖像進行分類并產(chǎn)生最終的檢測結果。
(三)有益效果
從上述技術方案可以看出,本發(fā)明的基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像檢測方法至少具有以下有益效果其中之一:
(1)圖像顯著性標注能夠在圖像顏色變化明顯的情況下獲得較為穩(wěn)定的目標分割結果,在快速搜索的過程中保證目標的定位精度;
(2)本發(fā)明采用一種不重疊的窗口初始化搜索方法,利用圖像顯著性標注結果,通過迭代優(yōu)化的方法進行目標定位,能夠顯著提高檢測時的目標定位搜索速度和精度;
(3)本發(fā)明利用深度置信網(wǎng)絡模型進行目標的特征提取和分類,傳統(tǒng)的限制玻爾茲曼機非監(jiān)督訓練方法通常將整幅訓練圖像作為輸入,無法對目標局部結構特征進行充分編碼,本發(fā)明采用一種基于圖像分塊策略的非監(jiān)督訓練方法,即將顯著性圖像和原圖像同時作為訓練數(shù)據(jù),同時利用局部區(qū)域約束,使限制玻爾茲曼機對局部區(qū)域結構特征的表達更充分,提高了模型的泛化能力和檢測的準確率。
附圖說明
圖1為本發(fā)明實施例基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像目標快速檢測方法的框架示意圖。
圖2為本發(fā)明實施例的檢測方法中基于視覺顯著性的圖像目標粗定位方法的示意圖。
圖3為本發(fā)明實施例的檢測方法中圖像目標粗定位方法的初始搜索窗口排布圖。
圖4為本發(fā)明實施例的檢測方法中圖像切片分塊示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下結合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。
本發(fā)明提供了一種基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像檢測方法,該遙感圖像檢測方法包括以下步驟:s1:利用基于視覺顯著性的圖像目標粗定位方法對待測圖像中的目標進行定位并產(chǎn)生一定數(shù)量的候選待檢測窗口;s2:利用模型訓練獲得深度置信網(wǎng)絡模型;s3:利用模型訓練得到的深度置信網(wǎng)絡模型對候選待檢測窗口內(nèi)的圖像進行分類并產(chǎn)生最終的檢測結果。
在本發(fā)明的示例性實施例中,提供了一種基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像目標快速檢測方法。圖1為本發(fā)明實施例基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像目標快速檢測方法的框架示意圖。如圖1所示,本發(fā)明的遙感圖像目標快速檢測方法的整個目標檢測過程分為模型訓練與待測圖像檢測兩個主要過程。模型訓練過程包括限制玻爾茲曼機非監(jiān)督預訓練和多層神經(jīng)網(wǎng)絡的參數(shù)微調(diào)訓練,在非監(jiān)督預訓練中,首先利用基于分塊策略的訓練方法分別訓練n個限制玻爾茲曼機,并將原始圖像和顯著性圖像(通過顯著性計算獲得)作為訓練數(shù)據(jù),如圖1中所示,最后利用合并方法將n個限制玻爾茲曼機進行融合,n≥2,并將融合后的限制玻爾茲曼機作為深度置信網(wǎng)絡的第一層去訓練下面的限制玻爾茲曼機,預訓練完成后,首先在深度置信網(wǎng)絡最上層添加一個監(jiān)督層,并利用反向傳播算法對深度置信網(wǎng)絡進行參數(shù)微調(diào),得到一個用于分類檢測的深度置信網(wǎng)絡模型。在目標檢測階段,首先利用基于視覺顯著性的圖像目標粗定位方法對待測圖像中的目標進行定位并產(chǎn)生一定數(shù)量的候選待檢測窗口,然后利用以上訓練得到的深度置信網(wǎng)絡模型進行分類并產(chǎn)生最終的檢測結果。
圖2為本發(fā)明實施例的檢測方法中基于視覺顯著性的圖像目標粗定位方法的示意圖。首先簡單介紹一下基于視覺顯著性的圖像目標粗定位方法的基本原理,生物視覺系統(tǒng)可以很容易地判斷一幅圖像中的感興趣區(qū)域,并注意到圖像中的重要信息,這種視覺顯著性是由圖像中的顏色、梯度、邊緣或邊界等圖像屬性所致,視覺顯著性與生物視覺系統(tǒng)如何感知和處理視覺刺激緊密相關,在多個科研領域中被廣泛研究,基于這種視覺處理機制,可以通過顯著性區(qū)域的計算提取來將有限的計算資源優(yōu)先分配給圖像中的包含感興趣信息的部分,因此利用計算機進行圖像中顯著性區(qū)域的檢測和提取,可以大大提高圖像分析理解的效率。如圖2所示,基于視覺顯著性的圖像目標粗定位方法包括以下步驟:s11:通過顯著性計算獲得一幅與原始圖像尺寸相同的顯著性圖像;s12:在該顯著性圖像上設置一定尺寸的初始的搜索窗口;s13:利用迭代優(yōu)化算法對搜索窗口的位置進行優(yōu)化調(diào)整;s14:利用非極大值抑制算法對有重疊的多個搜索窗口進行融合,從而得到一定數(shù)量的候選待檢測窗口。
作為一種具體的實施方式,進行顯著性計算時,采用賦范梯度算法作為顯著性圖像計算方法。
圖3為本發(fā)明實施例的檢測方法中圖像目標粗定位方法的初始的搜索窗口排布圖。如圖3所示,這些初始的搜索窗口之間互不重疊并緊密排列,以覆蓋整個圖像。與自然場景圖像不同,遙感圖像由于垂直成像的特點,典型地物目標(如飛機、車輛、建筑物等)通常不會有疊掩的情況發(fā)生,因此用圖3所示的方式排布初始的搜索窗口,如果初始的搜索窗口大小設置的得當,對于圖像中的某個目標,至少會有一個搜索窗口會覆蓋該目標的大部分區(qū)域。
具體地,本實施例中的迭代優(yōu)化算法歸納如下:a、輸入待測圖像的顯著性圖像m,初始的搜索窗口wp及其中心點位置pc,迭代停止步長δ,并令:pc=(xc,yc),δ=2,xij=i,yij=j;b、計算顯著性圖像m在初始的搜索窗口wp的像素值重心;c、計算pc'=(xc',yc')與pc的歐氏距離d;d、判斷d與δ的大小關系并進行以下操作:如果d>δ,則將pc'=(xc',yc')作為搜索窗口新的中心點,并回到步驟b繼續(xù)迭代,如果d<δ,則終止迭代;e、輸出最終的搜索窗口wo。
作為一種具體的實施方式,步驟b中圖像像素值重心坐標計算方法定義如下:
其中,sij表示顯著性圖像中坐標為(i,j)處的像素值,xij和yij分別為橫坐標和縱坐標的權重系數(shù),h為顯著性圖像的長度,w為顯著性圖像的寬度。
經(jīng)過以上算法的迭代優(yōu)化,包含目標大部分區(qū)域的初始的搜索窗口會有很大可能移動到目標所在的精確位置,而不包含目標的虛假窗口將在分類檢測中去除。以往的圖像目標檢測方法大多以滑動窗及其拓展方法為基礎,它們的原理是在圖像中用固定大小的檢測窗口,以一定步長在圖像中進行順序或按一定規(guī)則的圖像掃描,目的是將可能的目標圈入某個檢測窗口中,這類滑動窗方法不依賴于任何先驗知識或參數(shù)學習,因此具有許多缺點:首先,在圖像中的滑動窗掃描將產(chǎn)生大量的待檢測窗口,造成檢測效率較低;另外,由于不依賴于先驗,且以一定步長進行搜索,所產(chǎn)生的窗口往往無法準確的對目標進行定位,造成許多的虛警和漏警,降低了檢測的準確率和召回率;第三,傳統(tǒng)的滑動窗搜索方法無法對窗口的位置進行自動調(diào)整和優(yōu)化。與之相比,本發(fā)明的目標粗定位方法不僅能大大減少候選待檢測窗口數(shù)量,提高系統(tǒng)的檢測效率,同時經(jīng)過搜索窗口位置的調(diào)整能明顯地提高目標的定位精度,這將對隨后的特征提取和分類檢測過程帶來很大的改善,在提高目標檢測準確率的同時,極大的增強不同分類模型的魯棒性。
本實施例中利用的深度置信網(wǎng)絡模型為一個6層深度置信網(wǎng)絡,包括一個可視層、一個監(jiān)督層和四個隱藏層,每層節(jié)點數(shù)量為2592、300、100、100、300、2,可視層包含2592個輸入節(jié)點(用來輸入原始圖像和顯著性圖像,訓練時首先將圖像尺寸縮放為36像素×36像素,36×36×2=2592),在本實施例中,每個限制玻爾茲曼機的可視層數(shù)據(jù)均為0到1之間的實數(shù),同時前一層限制玻爾茲曼機的激活概率值作為后一層限制玻爾茲曼機的可視層輸入。
空間結構語義特征對遙感圖像目標來說非常重要,為了更好地提取局部結構特征,為高層限制玻爾茲曼機提供語義特征提取的基礎,本實施例采用了一種基于分塊的限制玻爾茲曼機預訓練方法。具體來說,在預訓練之前,首先將36像素×36像素大小的訓練圖像進行分塊,如圖4所示,之后隨機初始化50個相互獨立的限制玻爾茲曼機,每一個限制玻爾茲曼機用其中一組子圖像集進行訓練,當這些限制玻爾茲曼機訓練完成之后,它們的參數(shù)將被合并,去初始化一個更大的限制玻爾茲曼機,50個限制玻爾茲曼機(用srbm表示)的隱藏層節(jié)點數(shù)設置為6個,因此合并之后的限制玻爾茲曼機(用brbm表示)將擁有300個隱藏層節(jié)點。參數(shù)合并時,用第一個srbm的權值初始化brbm的前6個隱藏層節(jié)點所連接的權值,第二個srbm的權值初始化brbm另外6個隱藏層節(jié)點所連接的權值,并以此類推,然而,限制玻爾茲曼機兩層節(jié)點是互相全連接的,因此brbm中還有很多未被初始化的連接權值,這些權值將被初始化為0。同理,brbm參數(shù)中的偏置項將用srbm中的偏置項合并初始化。以上分塊訓練完成后,brbm將利用完整的訓練圖像進行合并訓練,直到網(wǎng)絡參數(shù)最終收斂。
至此,本發(fā)明示例性實施例基于視覺顯著性約束深度置信網(wǎng)絡的遙感圖像目標快速檢測方法介紹完畢。
綜上所述,在本發(fā)明中,利用的圖像顯著性標注能夠在圖像顏色變化明顯的情況下獲得較為穩(wěn)定的目標分割結果,在快速搜索的過程中保證目標的定位精度。本發(fā)明采用一種不重疊的窗口初始化搜索方法,利用圖像顯著性標注結果,通過迭代優(yōu)化的方法進行目標定位,能夠顯著提高檢測時的目標定位搜索速度和精度。本發(fā)明利用深度置信網(wǎng)絡模型進行目標的特征提取和分類,傳統(tǒng)的限制玻爾茲曼機非監(jiān)督訓練方法通常將整幅訓練圖像作為輸入,無法對目標局部結構特征進行充分編碼,本發(fā)明采用一種基于圖像分塊策略的非監(jiān)督訓練方法,即將顯著性圖像和原圖像同時作為訓練數(shù)據(jù),同時利用局部區(qū)域約束,使限制玻爾茲曼機對局部區(qū)域結構特征的表達更充分,提高了模型的泛化能力和檢測的準確率。
至此,已經(jīng)結合附圖對本實施例進行了詳細描述。依據(jù)以上描述,本領域技術人員應當對本發(fā)明基于視覺顯著性的遙感圖像目標快速檢測方法有了清楚的認識。
需要說明的是,在附圖或說明書正文中,未繪示或描述的實現(xiàn)方式,均為所屬技術領域中普通技術人員所知的形式,并未進行詳細說明。此外,上述對各元件和方法的定義并不僅限于實施例中提到的各種具體結構、形狀或方式,本領域普通技術人員可對其進行簡單地更改或替換。
在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設備固有相關。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構造這類系統(tǒng)所要求的結構是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
以上所述的具體實施例,對本發(fā)明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。