專利名稱:圖像檢索的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息檢索技術(shù),特別是涉及一種圖像檢索的方法和系統(tǒng)。
背景技術(shù):
隨著成像設(shè)備和存儲方法的容易獲得性,網(wǎng)絡(luò)上的圖像在過去的幾十年增長得很快。傳統(tǒng)的基于關(guān)鍵字的檢索方法因?yàn)椴荒芾斫鈭D像的內(nèi)容,難以捕捉用戶的搜索意圖,從而使得檢索結(jié)果欠佳。因此,為獲得較好的檢索結(jié)果,需采用基于圖像內(nèi)容的檢索方法。傳統(tǒng)的基于圖像內(nèi)容的檢索方法大致包括如下步驟第一步,提取圖像的特征表示。稀疏編碼因能很好地表示圖像內(nèi)容,故成為圖像特征表示的主要手段。第二步,對圖像的特征表示進(jìn)行空間金字塔集聚,得到圖像的表示向量。對圖像的稀疏編碼進(jìn)行空間金字塔集聚可進(jìn)一步提高圖像特征的表示能力。第三步,計(jì)算查詢圖像的表示向量與數(shù)據(jù)庫中圖像的表示向量的距離,并按照距離的大小進(jìn)行排序,從而得到檢索結(jié)果。在傳統(tǒng)的基于圖像內(nèi)容的檢索方法中,在進(jìn)行空間金字塔集聚時(shí),金字塔的層數(shù)越高則使檢索結(jié)果的精度越高。但是,金字塔的層數(shù)越高時(shí),會使圖像表示向量的維度過高(當(dāng)金字塔的層數(shù)為3,詞典大小為1024時(shí),表示向量的維度為21504),從而增加檢索過程中的計(jì)算復(fù)雜程度,使得到的表示向量不適用于基于圖像內(nèi)容的檢索。因此,在傳統(tǒng)的基于圖像內(nèi)容的檢索方法中,一般只進(jìn)行很少層的金字塔集聚。然而,降低金字塔的層數(shù)會使的圖像特征表示的表示能力受損,從而使得檢索結(jié)果不夠精確。
發(fā)明內(nèi)容
基于此,有必要針對傳統(tǒng)基于圖像內(nèi)容的檢索方法中檢索結(jié)果不夠精確的問題,提供一種能有效提聞檢索精度的圖像檢索的方法和系統(tǒng)。一種圖像檢索的方法,包括以下步驟獲取查詢圖像,并將所述查詢圖像劃分為顯著性圖像或非顯著性圖像;提取所述查詢圖像的SIFT描述符,并根據(jù)所述SIFT描述符獲得對所述查詢圖像的稀疏編碼;若所述查詢圖像為顯著性圖像,則采用指數(shù)函數(shù)加權(quán)所述稀疏編碼,若所述查詢圖像為非顯著性圖像,則采用線形函數(shù)加權(quán)所述稀疏編碼;對加權(quán)后的稀疏編碼進(jìn)行金字塔集聚,得到所述查詢圖像的表示向量;獲取所述查詢圖像的表示向量與數(shù)據(jù)庫中目標(biāo)圖像的表示向量的距離,并根據(jù)所述距離顯示檢索結(jié)果。在其中一個(gè)實(shí)施例中,所述獲取查詢圖像,并將所述查詢圖像劃分為顯著性圖像或非顯著性圖像的步驟包括獲取所述查詢圖像的顯著性圖;根據(jù)所述顯著性圖,利用隨機(jī)森林的方法將所述查詢圖像分為顯著性圖像或非顯著性圖像;
具體采取基于頻譜余留的檢測以及基于圖的檢測算法獲取所述顯著性圖,方式如下A(f) = R(F[I])P(f) = F(F[I])R(f) = log (A (f)) -hn (f) *log (A (f))Msr = g (X) * (F_1 [exp (P (f) +R (f)) ])2Isal =Msr Mgb其中,A(f)、P(f)和R(f)分別表示所述查詢圖像的幅度譜、相位譜和頻譜余留,F(xiàn)和F—1分別表示所述查詢圖像的傅里葉變換和逆傅里葉變換,hn(f)是一個(gè)局部均值濾波器,g(x)是一個(gè)高斯濾波器,I為所述查詢圖像的灰度圖;MOT和Mgb分別為單獨(dú)利用基于頻譜余留的檢測和基于圖的檢測算法得到的顯著性圖,Mgb通過構(gòu)建一個(gè)馬爾科夫鏈解出,符號‘ Θ表示兩幅顯著性圖對應(yīng)位置像素值的相加,Isal為最終得到的顯著性圖;所述隨機(jī)森林的方法具體為
權(quán)利要求
1.一種圖像檢索的方法,包括以下步驟 獲取查詢圖像,并將所述查詢圖像劃分為顯著性圖像或非顯著性圖像; 提取所述查詢圖像的SIFT描述符,并根據(jù)所述SIFT描述符獲得對所述查詢圖像的稀疏編碼; 若所述查詢圖像為顯著性圖像,則采用指數(shù)函數(shù)加權(quán)所述稀疏編碼,若所述查詢圖像為非顯著性圖像,則采用線形函數(shù)加權(quán)所述稀疏編碼; 對加權(quán)后的稀疏編碼進(jìn)行金字塔集聚,得到所述查詢圖像的表示向量; 獲取所述查詢圖像的表示向量與數(shù)據(jù)庫中目標(biāo)圖像的表示向量的距離,并根據(jù)所述距離顯示檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的圖像檢索的方法,其特征在于,所述獲取查詢圖像,并將所述查詢圖像劃分為顯著性圖像或非顯著性圖像的步驟包括 獲取所述查詢圖像的顯著性圖; 根據(jù)所述顯著性圖,利用隨機(jī)森林的方法將所述查詢圖像分為顯著性圖像或非顯著性圖像; 具體采取基于頻譜余留的檢測以及基于圖的檢測算法獲取所述顯著性圖,方式如下 A(f) = R(F[I])P(f) = F(F[I]) R(f) = log (A (f)) -hn(f) *log (A (f)) Msr = g(X) * (Γ1 [exp (P (f) +R(f))])2 Ll=Msr^Mgb 其中,A(f)、P(f)和R(f)分別表示所述查詢圖像的幅度譜、相位譜和頻譜余留,F(xiàn)和Γ1分別表示所述查詢圖像的傅里葉變換和逆傅里葉變換,hn(f)是一個(gè)局部均值濾波器,g(x)是一個(gè)高斯濾波器,I為所述查詢圖像的灰度圖;MSr和Mgb分別為單獨(dú)利用基于頻譜余留的檢測和基于圖的檢測算法得到的顯著性圖,Mgb通過構(gòu)建一個(gè)馬爾科夫鏈解出,符號“ ,,表示兩幅顯著性圖對應(yīng)位置像素值的相加,Isal為最終得到的顯著性圖; 所述隨機(jī)森林的方法具體為
3.根據(jù)權(quán)利要求2所述的圖像檢索的方法,其特征在于,將所述顯著性圖劃分為相同大小的圖塊,且在每個(gè)圖塊內(nèi)提取一個(gè)所述SIFT描述符; 所述稀疏編碼滿足如下公式
4.根據(jù)權(quán)利要求3所述的圖像檢索的方法,其特征在于,用于對所述稀疏編碼進(jìn)行加權(quán)的指數(shù)函數(shù)為
5.根據(jù)權(quán)利要求4所述的圖像檢索的方法,其特征在于,所述對加權(quán)后的稀疏編碼進(jìn)行金字塔集聚,得到所述查詢圖像的表示向量的步驟為 采用sqrt函數(shù)對加權(quán)后的系數(shù)編碼進(jìn)行金字塔集聚,得到所述查詢圖像的表示向量,其具體方式為
6.根據(jù)權(quán)利要求5所述的圖像檢索的方法,其特征在于,所述獲取所述查詢圖像的表示向量與數(shù)據(jù)庫中目標(biāo)圖像的表示向量的距離的具體方式為
7.一種圖像檢索的系統(tǒng),其特征在于,包括 接收模塊,用于獲取查詢圖像,并將所述查詢圖像劃分為顯著性圖像或非顯著性圖像; 編碼模塊,用于提取所述查詢圖像的SIFT描述符,并根據(jù)所述SIFT描述符獲得對所述查詢圖像的稀疏編碼; 加權(quán)模塊,用于若所述查詢圖像為顯著性圖像,則采用指數(shù)函數(shù)加權(quán)所述稀疏編碼,若所述查詢圖像為非顯著性圖像,則采用線形函數(shù)加權(quán)所述稀疏編碼; 統(tǒng)計(jì)模塊,用于對加權(quán)后的稀疏編碼進(jìn)行金字塔集聚,得到所述查詢圖像的表示向量; 查詢模塊,用于獲取所述查詢圖像的表示向量與數(shù)據(jù)庫中目標(biāo)圖像的表示向量的距離,并根據(jù)所述距離顯示檢索結(jié)果。
8.根據(jù)權(quán)利要求7所述的圖像檢索的系統(tǒng),其特征在于,所述接收模塊包括 顯著性提取單元,用于獲取所述查詢圖像的顯著性圖; 分類單元,用于根據(jù)所述顯著性圖,利用隨機(jī)森林的方法將所述查詢圖像分為顯著性圖像或非顯著性圖像;具體的,所述顯著性提取單元采取基于頻譜余留的檢測以及基于圖的檢測算法獲取所述顯著性圖,方式如下
9.根據(jù)權(quán)利要求8所述的圖像檢索的系統(tǒng),其特征在于,所述編碼模塊將所述顯著性圖劃分為相同大小的圖塊,且在每個(gè)圖塊內(nèi)提取一個(gè)所述SIFT描述符; 所述稀疏編碼滿足如下公式
10.根據(jù)權(quán)利要求9所述的圖像檢索的系統(tǒng),其特征在于,所述加權(quán)模塊用于對所述稀疏編碼進(jìn)行加權(quán)的指數(shù)函數(shù)為
11.根據(jù)權(quán)利要求10所述的圖像檢索的系統(tǒng),其特征在于,所述統(tǒng)計(jì)模塊用于采用sqrt函數(shù)對加權(quán)后的系數(shù)編碼進(jìn)行金字塔集聚,得到所述查詢圖像的表示向量,其具體方式為
12.根據(jù)權(quán)利要求11所述的圖像檢索的系統(tǒng),其特征在于,所述查詢模塊獲取所述查詢圖像的表示向量與數(shù)據(jù)庫中目標(biāo)圖像的表示向量的距離的具體方式為
全文摘要
一種圖像檢索的方法,將查詢圖像劃分為顯著性圖像和非顯著性圖像兩類。在獲得對查詢圖像的稀疏編碼后,利用函數(shù)對稀疏編碼進(jìn)行加權(quán),其中,對于顯著性圖像則采用指數(shù)函數(shù)進(jìn)行加權(quán),對于非顯著性圖像則采用線性函數(shù)進(jìn)行加權(quán)。顯著圖像為具有清晰背景的圖像,圖像范圍內(nèi)具有顯著區(qū)域,指數(shù)函數(shù)可賦予該顯著性區(qū)域更多的權(quán)重,從而將該顯著區(qū)域從背景中突出。而非顯著圖像則為背景模糊的圖像,圖像范圍內(nèi)不具有顯著區(qū)域,線性函數(shù)可均化了非顯著性圖像的顯著性效果。因此,通過加權(quán)處理,不同種類的查詢圖像的稀疏編碼的表示能力得到強(qiáng)化,即使金字塔集聚的層數(shù)減小,也能使檢索獲得較高的精度。此外,本發(fā)明還提供一種圖像檢索的系統(tǒng)。
文檔編號G06F17/30GK103020265SQ20121057272
公開日2013年4月3日 申請日期2012年12月25日 優(yōu)先權(quán)日2012年12月25日
發(fā)明者陳世峰, 杜書澤 申請人:深圳先進(jìn)技術(shù)研究院