專利名稱:一種基于圖像分類的圖像檢索方法
技術領域:
本發(fā)明屬于多媒體信息檢索領域,具體涉及一種基于圖像分類的圖像檢索方法, 該方法涉及圖像處理、計算機視覺、機器學習和圖像檢索等領域,可直接用于Web環(huán)境下和單臺計算機下的基于內(nèi)容的圖像檢索。
背景技術:
隨著互聯(lián)網(wǎng)的發(fā)展,多媒體信息特別是圖像信息正以爆炸性的速度在產(chǎn)生和傳播。面對這浩如煙海的圖像寶庫,如何挖掘那些符合自己需求的圖像已經(jīng)成為了一個十分棘手的問題,所以近年來圖像檢索領域正成為一個研究和工程實踐的熱點。目前,圖像檢索的方法主要有兩種基于文本的圖像檢索和基于內(nèi)容的圖像檢索。目前主流的圖像搜索引擎采取的都是基于文本的圖像檢索技術,這種技術的實質(zhì)還是傳統(tǒng)意義上的文本檢索技術,其過程是將與網(wǎng)絡圖像相關的文本信息如圖像標題、鏈接文本、內(nèi)容描述等建立索引來標注圖像,最后采用關鍵字匹配技術來進行檢索。然而由于語義的多義性以及描述的模糊性問題,使基于文本的圖像檢索技術的準確度受到比較大的限制,所返回的結(jié)果通常不符合用戶的預期?;趦?nèi)容的圖像檢索通過引入計算機視覺領域的技術,對圖像像素級對象進行數(shù)學建模與求解,這樣就用圖像本身的內(nèi)容特征作為了圖像的標識。針對圖像的內(nèi)容特征提取方面,圖像檢索目前有一些轉(zhuǎn)變從基于整幅圖像的特征提取轉(zhuǎn)變?yōu)榛趨^(qū)域(或?qū)ο? 的特征提取,這個轉(zhuǎn)變的過程使得所提取的圖像的特征更加的魯棒,使特征在圖像發(fā)生旋轉(zhuǎn)和平移前后保持不變,并且在圖像光照變化的前后也保持相對的不變性?;趦?nèi)容的圖像分類技術是計算機視覺與模式分類技術融合的結(jié)果,是在提取圖像內(nèi)容特征后運用模式分類的方法對圖像進行自動學習和分類的技術。近十年,分類技術也得到了長足的進步,產(chǎn)生了基于統(tǒng)計概率理論的支持向量機方法,建立在底層簡單分類器上的Adaboost方法,這些方法相較于之前的決策樹、神經(jīng)網(wǎng)絡等方法分類準確率都大大的提升了。但是,原來的基于內(nèi)容的圖像檢索由于計算量大很難應用到大型圖像庫系統(tǒng)中,在因特網(wǎng)上的應用就更少了,圖像的分類方法也只是找出圖像屬于某一類別而沒有進一步在這一類別中進行檢索操作。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于圖像分類的圖像檢索方法,該方法將圖像分類技術融入到圖像檢索中,解決了當前基于內(nèi)容的圖像檢索中檢索速度慢的局限性。本發(fā)明提供的一種基于圖像分類的圖像檢索方法,其步驟包括
A:確定在圖像分類中圖像的類別數(shù)Cm,各詳細類別(C1,C2,…,Cm)以及與各類別對應的訓練圖像集(P1,P2,-,Pm);
B:提取訓練圖像集的內(nèi)容特征用以訓練分類器得到分類器C ;
C:輸入待檢索圖像M,提取待檢索圖像M的內(nèi)容特征作為分類器C的輸入,分類器C的輸出結(jié)果Co即為M的類別;
D:獲得與類別Co對應的檢索圖像集IPo,并提取檢索圖像集IPo內(nèi)每幅圖像的內(nèi)容特
征;
E:根據(jù)C、D獲得的內(nèi)容特征運用相似度計算算法得到待檢索圖像M與檢索圖像集IPo 內(nèi)每幅圖像的相似度距離,對距離進行排序最后得到與待檢索圖像M距離最小的N幅圖像并輸出。優(yōu)選的,所述步驟B中提取的圖像內(nèi)容特征為SIFT特征,其具體步驟包括
Bll:提取訓練圖像集中每幅圖像的SIFT特征點,構(gòu)成一個特征點庫,其中每個SIFT 特征點都是由1 維特征點描述子向量表示;
B12:對這個特征點庫采用k均值聚類方法進行聚類操作,得到K類; B13:對于訓練圖像庫中的單幅圖像,將它的所有SIFT特征點根據(jù)最小距離原則各自映射到K類得到K維的特征向量VI,將特征向量Vl中的每個值除以該幅圖像的特征點總數(shù)得到頻率特征向量V2,V2即為該幅圖像的SIFT特征。優(yōu)選的,訴述步驟B中采用的分類器為支持向量機,可以采用開源的Iibsvm庫進行開發(fā),訓練分類器的具體步驟包括
B21:選擇RBF為支持向量機的核函數(shù);
B22:將訓練圖像庫中的特征向量結(jié)合每幅圖像的類別信息作為支持向量機的輸入; B23:采用交叉印證方法確定分類準確率最高時候的RBF核函數(shù)參數(shù),確定參數(shù)后即得到支持向量機分類器C。優(yōu)選的,步驟C中提取待檢索圖像M的內(nèi)容特征的具體步驟包括
Cl:提取待檢索圖像M的SIFT特征點,其中每個SIFT特征點都是由1 維特征點描述子向量表示;
C2:將待檢索圖像M的所有SIFT特征點根據(jù)最小距離原則各自映射到B12的K類得到K維的特征向量VI,將特征向量Vl中的每個值除以該幅圖像的特征點總數(shù)得到頻率特征向量Vm,Vm即為M的SIFT特征。優(yōu)選的,步驟E中采用的相似度計算算法為歐式距離法,相似度的度量準則為歐式距離越小越相似。本發(fā)明的有益效果本發(fā)明在傳統(tǒng)基于內(nèi)容的圖像檢索方法基礎上融入了圖像分類技術,大大提高了圖像檢索的速度。在圖像的內(nèi)容特征部分,采用了 SIFT特征,具有對圖像的尺度縮放、亮度變化、旋轉(zhuǎn)保持不變性的特點,使算法更加的魯棒。
為了更清楚地說明本發(fā)明實施實例或現(xiàn)有技術中的技術方案,下面將對實施實例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹。顯而易見的,下面描述中的附圖僅僅是本發(fā)明的一些實施實例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明整體構(gòu)架流程圖。圖2是高斯差分尺度空間的構(gòu)建過程。圖3是尺度空間中尋找極值點的示意圖。
圖4是關鍵點鄰域梯度信息生成特征向量的示意圖。
具體實施例方式本發(fā)明的目的在于提供一種基于圖像分類的圖像檢索方法,該方法將圖像分類技術融入到圖像檢索中,解決了當前基于內(nèi)容的圖像檢索中檢索速度慢得局限性,為了使本發(fā)明的目的、技術方案和優(yōu)點更加的清楚,下面將結(jié)合附圖對本發(fā)明實施方式做具體的闡述。在具體介紹本發(fā)明的細節(jié)流程之前,對本發(fā)明需要用到的基礎知識進行一下簡要的介紹
A 圖像的SIFT內(nèi)容特征提取
圖像的SIFT內(nèi)容特征提取里面包含了兩個基礎的算法SIFT特征點描述子的提取和圖像SIFT內(nèi)容特征構(gòu)造。Al: SIFT特征點描述子提取
SIFT算法由D. G. Lowe 1999年提出,2004年完善總結(jié)。SIFT算法是一種提取圖像局部特征的算法,具有如下特點a) SIFT特征是圖像的局部特征,其對圖像的尺度縮放、亮度變化、旋轉(zhuǎn)保持不變性,對放射變換、視角變化、噪聲也保持一定程度的穩(wěn)定性。b)信息量豐富,獨特性好,適用于在海量特征數(shù)據(jù)庫中進行快速、準確的匹配。c)即使少數(shù)的幾幅不同的圖像也可以產(chǎn)生大量不同的SIFT特征點描述子。d)可擴展性,可以很方便的與其他形式的特征向量進行融合。SIFT特征點描述子提取算法步驟如下1)檢測尺度空間上的極值點2)精確定位極值點3)計算每個關鍵點的方向參數(shù)4)生成關鍵點的描述子。下面就每一步做一個詳細的解釋。All:尺度空間的生成
尺度空間理論目的是模擬圖像數(shù)據(jù)的多尺度特性。實現(xiàn)尺度變換的唯一線性核只有高斯卷積核,一幅二維圖像 /(U)的尺度空間定義為
權(quán)利要求
1.一種基于圖像分類的圖像檢索方法,其特征在于該方法包括以下步驟A:確定在圖像分類中圖像的類別數(shù)Cm,各詳細類別(C1,C2,…,Cm)以及與各類別對應的訓練圖像集(P1,P2,-,Pm);B:提取訓練圖像集的內(nèi)容特征用以訓練分類器得到分類器C ;C:輸入待檢索圖像M,提取待檢索圖像M的內(nèi)容特征作為分類器C的輸入,分類器C的輸出結(jié)果Co即為M的類別;D:獲得與類別Co對應的檢索圖像集IPo,并提取檢索圖像集IPo內(nèi)每幅圖像的內(nèi)容特征;E:根據(jù)C、D獲得的內(nèi)容特征運用相似度計算算法得到待檢索圖像M與檢索圖像集IPo 內(nèi)每幅圖像的相似度距離,對距離進行排序最后得到與待檢索圖像M距離最小的N幅圖像并輸出。
2.根據(jù)權(quán)利要求1所述的圖像檢索方法,其特征在于所述步驟B中提取的內(nèi)容特征為SIFT特征,其具體步驟包括Bll:提取訓練圖像集中每幅圖像的SIFT特征點,構(gòu)成一個特征點庫,其中每個SIFT 特征點都是由1 維特征點描述子向量表示;B12:對這個特征點庫采用k均值聚類方法進行聚類操作,得到K類;B13:對于訓練圖像庫中的單幅圖像,將它的所有SIFT特征點根據(jù)最小距離原則各自映射到K類得到K維的特征向量VI,將特征向量Vl中的每個值除以該幅圖像的特征點總數(shù)得到頻率特征向量V2,V2即為該幅圖像的SIFT特征。
3.根據(jù)權(quán)利要求1所述的圖像檢索方法,其特征在于所述步驟B中采用的分類器為支持向量機,可以采用開源的Iibsvm庫進行開發(fā),訓練分類器的具體步驟包括B21:選擇RBF為支持向量機的核函數(shù)B22:將訓練圖像庫中的特征向量結(jié)合每幅圖像的類別信息作為支持向量機的輸入;B23:采用交叉印證方法確定分類準確率最高時候的RBF核函數(shù)參數(shù),確定參數(shù)后即得到支持向量機分類器C。
4.根據(jù)權(quán)利要求1所述的圖像檢索方法,其特征在于所述步驟C中提取待檢索圖像M 的內(nèi)容特征的具體步驟包括Cl:提取待檢索圖像M的SIFT特征點,其中每個SIFT特征點都是由1 維特征點描述子向量表示;C2:將待檢索圖像M的所有SIFT特征點根據(jù)最小距離原則各自映射到B12的K類得到K維的特征向量VI,將特征向量Vl中的每個值除以該幅圖像的特征點總數(shù)得到頻率特征向量Vm,Vm即為M的SIFT特征。
5.根據(jù)權(quán)利要求1所述的圖像檢索方法,其特征在于步驟E中采用的相似度計算算法為歐式距離法,相似度的度量準則為歐式距離越小越相似。
全文摘要
本發(fā)明涉及一種基于圖像分類的圖像檢索方法,現(xiàn)有的方法檢索速度比較慢。本發(fā)明首先確定在圖像分類中圖像的類別數(shù)以及與訓練圖像集;其次提取訓練圖像集的內(nèi)容特征用以訓練分類器得到分類器;然后輸入待檢索圖像,提取待檢索圖像的內(nèi)容特征作為分類器的輸入,獲得與類別對應的檢索圖像集,并提取檢索圖像集內(nèi)每幅圖像的內(nèi)容特征;最后根據(jù)獲得的內(nèi)容特征運用相似度計算算法得到待檢索圖像與檢索圖像集內(nèi)每幅圖像的相似度距離,對距離進行排序最后得到與待檢索圖像距離最小的N幅圖像并輸出。本發(fā)明在傳統(tǒng)基于內(nèi)容的圖像檢索方法基礎上融入了圖像分類技術,大大提高了圖像檢索的速度。
文檔編號G06F17/30GK102402621SQ20111044343
公開日2012年4月4日 申請日期2011年12月27日 優(yōu)先權(quán)日2011年12月27日
發(fā)明者張明敏, 張輝, 李文慶, 潘志庚 申請人:浙江大學