基于顯著點(diǎn)特征和稀疏自編碼的遙感圖像檢索方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,涉及一種基于顯著點(diǎn)特征和稀疏自編碼的遙感圖 像檢索方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著遙感對地觀測能力的提高,可獲取的遙感數(shù)據(jù)呈現(xiàn)出多元化和海量化的特 點(diǎn)。然而,海量遙感數(shù)據(jù)為各類重大應(yīng)用需求提供豐富數(shù)據(jù)源的同時,由于目前地面數(shù)據(jù)處 理和分析能力不足,遙感大數(shù)據(jù)的"數(shù)據(jù)海量、信息淹沒"問題日益突出。如何利用新興的 科學(xué)計(jì)算技術(shù)和手段,快速定位和智能檢索遙感圖像中的感興趣目標(biāo)或區(qū)域,是遙感大數(shù) 據(jù)處理和分析面臨的挑戰(zhàn),也是遙感圖像處理領(lǐng)域亟待解決的科學(xué)問題。遙感圖像檢索技 術(shù)是解決這一瓶頸問題的有效方法,研究高效的圖像檢索技術(shù)具有重要的意義。
[0003] 目前的遙感圖像檢索技術(shù)主要是通過對圖像的低層特征進(jìn)行相似性度量,進(jìn)而返 回相似圖像。相比傳統(tǒng)的基于關(guān)鍵字的檢索方法,基于內(nèi)容的檢索方法效率和準(zhǔn)確度更高, 但設(shè)計(jì)一種能有效描述各種復(fù)雜遙感圖像場景的特征描述方法是非常困難的。近些年,深 度學(xué)習(xí)由于具有良好的特征學(xué)習(xí)能力逐漸成為圖像識別領(lǐng)域的研究熱點(diǎn)。相比人工設(shè)計(jì)的 特征,基于深度學(xué)習(xí)的方法能通過樣本訓(xùn)練得到一個特征提取器以實(shí)現(xiàn)圖像特征的自動提 取,適用于包含復(fù)雜場景的遙感圖像檢索。由于網(wǎng)絡(luò)設(shè)計(jì)和訓(xùn)練相對簡單,稀疏自編碼已成 為一種常用的深度學(xué)習(xí)方法,并在圖像處理中應(yīng)用廣泛。
[0004] 對于稀疏自編碼網(wǎng)絡(luò)訓(xùn)練,在構(gòu)造訓(xùn)練樣本方面,現(xiàn)有方法通常是從訓(xùn)練圖像上 隨機(jī)選取一定數(shù)目和尺寸的圖像塊構(gòu)造訓(xùn)練樣本,這種樣本構(gòu)造方法有以下缺陷。第一,從 人眼視覺理論的角度來說,人們關(guān)注的是遙感圖像上的特定目標(biāo),而隨機(jī)選取的圖像塊可 能并不包含關(guān)注的特定目標(biāo)。第二,由于訓(xùn)練圖像的尺寸固定,因此隨機(jī)選取圖像塊構(gòu)造訓(xùn) 練樣本的方法可能會造成訓(xùn)練樣本不足。第三,由于訓(xùn)練樣本是圖像塊,利用訓(xùn)練好的網(wǎng)絡(luò) 進(jìn)行特征提取時得到是圖像塊而非整幅圖像的特征,因此不能直接用于圖像檢索。為了得 到整幅圖像的特征,通常需要采用卷積的方法,但這一過程不僅計(jì)算效率低而且會引入其 他參數(shù)。在激活函數(shù)選擇方面,現(xiàn)有方法通常采用sigmoid函數(shù)作為網(wǎng)絡(luò)隱含層神經(jīng)元的 激活函數(shù),而sigmoid函數(shù)在網(wǎng)絡(luò)反向傳播時存在嚴(yán)重的梯度消失等問題,不利于網(wǎng)絡(luò)訓(xùn) 練。對于稀疏自編碼網(wǎng)絡(luò)特征提取,現(xiàn)有方法通常是直接將隱含層的激活值作為提取的特 征而沒有經(jīng)過稀疏化處理,而實(shí)驗(yàn)表明稀疏特征性能更好。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)存在的不足,本發(fā)明提供了一種基于顯著點(diǎn)特征和稀疏自編碼的遙 感圖像檢索技術(shù)方案。本發(fā)明將提取遙感圖像的顯著點(diǎn)特征作為稀疏自編碼網(wǎng)絡(luò)的輸入進(jìn) 而對其進(jìn)行訓(xùn)練,最終利用訓(xùn)練的特征提取器提取圖像特征實(shí)現(xiàn)遙感圖像檢索。
[0006] 本發(fā)明所采用的技術(shù)方案是一種基于顯著點(diǎn)特征和稀疏自編碼的遙感圖像檢索 方法,包括以下步驟:
[0007] 步驟1,提取圖像庫中各圖像的特征點(diǎn)得到特征點(diǎn)矩陣,并利用視覺注意模型計(jì)算 各圖像的顯著圖;
[0008] 步驟2,對于圖像庫中各圖像的顯著圖,分別采用自適應(yīng)閾值法將顯著圖二值化, 并與圖像相應(yīng)的特征點(diǎn)矩陣進(jìn)行掩膜運(yùn)算得到過濾后的顯著特征點(diǎn);實(shí)現(xiàn)方式如下,
[0009] 采用自適應(yīng)閾值法將顯著圖二值化時,根據(jù)顯著圖像素的顯著性大小,確定顯著 圖的二值化閾值T如下,
[0011] 其中,w和h分別表示顯著圖的寬和高,I(x,y)表示顯著圖像素(x,y)的顯著值; [0012] 設(shè)根據(jù)二值化閾值T對顯著圖二值化,得到二值化顯著圖,相應(yīng)有矩陣Ibina",設(shè)P 表示圖像的特征點(diǎn)矩陣,?:表示過濾后的顯著特征點(diǎn)矩陣,計(jì)算顯著特征點(diǎn)矩陣如下,
[0013] Pt = P② h_n.
[0014] 步驟3,從圖像庫中取若干圖像作為訓(xùn)練圖像,從各訓(xùn)練圖像分別選取若干顯著 特征點(diǎn)構(gòu)造訓(xùn)練樣本,得到訓(xùn)練樣本集X,根據(jù)白化后的訓(xùn)練樣本集t訓(xùn)練稀疏自編碼網(wǎng) 絡(luò),得到特征提取器;
[0015] 所述稀疏自編碼網(wǎng)絡(luò)輸入層、隱含層以及輸出層,其中隱含層神經(jīng)元采用ReLU函 數(shù)作為激活函數(shù),輸出層神經(jīng)元采用softplus函數(shù)作為激活函數(shù),稀疏自編碼網(wǎng)絡(luò)的代價 函數(shù)定義如下,
[0017] 其中,第一項(xiàng)為均方誤差項(xiàng),第二項(xiàng)為正則項(xiàng),士,表示訓(xùn)練樣本集X'的網(wǎng)絡(luò)輸出 值,W= %,W2]和b=[byb2]分別表示網(wǎng)絡(luò)輸入層和隱含層間的權(quán)重%和偏置bi以及隱 含層和輸出層間的權(quán)重^和偏置b2構(gòu)成的權(quán)重矩陣,λ表示正則項(xiàng)系數(shù);
[0018] 步驟4,對圖像庫中的所有圖像,利用步驟3訓(xùn)練所得的特征提取器進(jìn)行特征提 取,并用閾值函數(shù)對提取的圖像特征進(jìn)行稀疏化處理,得到最終的用于檢索的特征向量;實(shí) 現(xiàn)方式如下,
[0019] 提取的圖像特征Υ表示如下,
[0020] Y=f!r +bi)
[0021] 其中,顯著特征點(diǎn)矩陣P:'是根據(jù)步驟2所得過濾后的顯著特征點(diǎn)矩陣?:白化后 的結(jié)果;
[0022] 對于提取的圖像特征Y,進(jìn)行如下稀疏化處理得到稀疏特征矩陣Z,
[0023] Z= [Z+,Z] =[max(0,Υ-a),max(0,α-Y)]
[0024] 其中,α表示閾值函數(shù)的閾值,矩陣Z+=max(0,Υ-α),Z=max(0,α-Υ);
[0025] 設(shè)從一幅圖像檢測到的SIFT點(diǎn)個數(shù)是n個,對稀疏特征矩陣Z進(jìn)一步處理,得到 特征向量F如下,
[0027] 其中,^和Z:分別表示矩陣Z+和Z的第i個列向量。
[0028] 步驟5,基于步驟4提取的特征向量,根據(jù)預(yù)設(shè)的相似性度量準(zhǔn)則進(jìn)行圖像檢索。
[0029] 而且,步驟1中,提取圖像庫中各圖像的特征點(diǎn)得到特征點(diǎn)矩陣,利用SIFT算子提 取實(shí)現(xiàn)。
[0030] 而且,步驟5中,預(yù)設(shè)的相似性度量準(zhǔn)則采用城區(qū)距離。
[0031] 本發(fā)明還相應(yīng)提供一種基于顯著點(diǎn)特征和稀疏自編碼的遙感圖像檢索系統(tǒng),包括 以下模塊,
[0032] 特征點(diǎn)提取模塊,用于提取圖像庫中各圖像的特征點(diǎn)得到特征點(diǎn)矩陣,并利用視 覺注意模型計(jì)算各圖像的顯著圖;
[0033] 顯著特征點(diǎn)提取模塊,用于對于圖像庫中各圖像的顯著圖,分別采用自適應(yīng)閾值 法將顯著圖二值化,并與圖像相應(yīng)的特征點(diǎn)矩陣進(jìn)行掩膜運(yùn)算得到過濾后的顯著特征點(diǎn); 實(shí)現(xiàn)方式如下,
[0034] 采用自適應(yīng)閾值法將顯著圖二值化時,根據(jù)顯著圖像素的顯著性大小,確定顯著 圖的二值化閾值T如下,
[0036] 其中,w和h分別表示顯著圖的寬和高,I(x,y)表示顯著圖像素(x,y)的顯著值;
[0037] 設(shè)根據(jù)二值化閾值T對顯著圖二值化,得到二值化顯著圖,相應(yīng)有矩陣Ibina",設(shè)P 表示圖像的特征點(diǎn)矩陣,?:表示過濾后的顯著特征點(diǎn)矩陣,計(jì)算顯著特征點(diǎn)矩陣如下,
[0038] 4 =戶?4_·ν
[0039] 訓(xùn)練模塊,用于從圖像庫中取若干圖像作為訓(xùn)練圖像,從各訓(xùn)練圖像分別選取若 干顯著特征點(diǎn)構(gòu)造訓(xùn)練樣本,得到訓(xùn)練樣本集X,根據(jù)白化后的訓(xùn)練樣本集t訓(xùn)練稀疏自 編碼網(wǎng)絡(luò),得到特征提取器;
[0040] 所述稀疏自編碼網(wǎng)絡(luò)輸入層、隱含層以及輸出層,其中隱含層神經(jīng)元采用ReLU函 數(shù)作為激活函數(shù),輸出層神經(jīng)元采用softplus函數(shù)作為激活函數(shù),稀疏自編碼網(wǎng)絡(luò)的代價 函數(shù)定義如下,
[0042] 其中,第一項(xiàng)為均方誤差項(xiàng),第二項(xiàng)為正則項(xiàng),士,表示訓(xùn)練樣本集X'的網(wǎng)絡(luò)輸出 值,W= %,W2]和b=[byb2]分別表示網(wǎng)絡(luò)輸入層和隱含層間的權(quán)重%和偏置bi以及隱 含層和輸出層間的權(quán)重^和偏置b2構(gòu)成的權(quán)重矩陣,λ表示正則項(xiàng)系數(shù);
[0043] 特征提取模塊,用于對圖像庫中的所有圖像,利用步驟3訓(xùn)練所得的特征提取器 進(jìn)行特征提取,并用閾值函數(shù)對提取的圖像特征進(jìn)行稀疏化處理,得到最終的用于檢索的 特征向量;實(shí)現(xiàn)方式如下,
[0044] 提取的圖像特征Υ表示如下,
[0045] Y=f! (WiP:r +bi)
[0046] 其中,顯著特征點(diǎn)矩陣P:'是根據(jù)步驟2所得過濾后的顯著特征點(diǎn)矩陣P:白化后 的結(jié)果;
[0047] 對于提取的圖像特征Y,進(jìn)行如下稀疏化處理得到稀疏特征矩陣Z,
[0048] Z= [Z+,Z] =[max(0,Υ-α),max(0,α-Y)]
[0049]其中,α表示閾值函數(shù)的閾值,矩陣Z+=max(0,Υ-α),Z=max(0,α-Y);
[0050] 設(shè)從一幅圖像檢測到的SIFT點(diǎn)個數(shù)是n個,對稀疏特征矩陣Z進(jìn)一步處理,得到 特征向量F如下,
[0052] 其中,(和疋分別表示矩陣Z+和Z的第i個列向量。
[0053] 檢索模塊,用于基于特征提取模塊提取的特征向量,根據(jù)預(yù)設(shè)的相似性度量準(zhǔn)則 進(jìn)行圖像檢索。
[0054] 而且,特征點(diǎn)提取模塊中,提取圖像庫中各圖像的特征點(diǎn)得到特征點(diǎn)矩陣,利用 SIFT算子提取實(shí)現(xiàn)。
[0055]