[0107] 與現(xiàn)有圖像搜索引擎相比,本發(fā)明優(yōu)選實施例中的技術(shù)增加了四個步驟,對一次 搜索結(jié)果分類,供用戶選擇較滿意的圖像,利用此用戶選擇作為用戶搜索意圖的猜測,并進 一步對搜索結(jié)果進行重新搜索和排序,很明顯,利用本發(fā)明實施例中的技術(shù)搜索獲取的圖 像更加接近用戶的檢索意圖,因而具有更高的精確性。而對于時間消耗問題,根據(jù)實驗初步 證明,當用戶需要小數(shù)目的符合搜索意圖的圖像時,本技術(shù)沒有明顯的優(yōu)勢,但當用戶的需 求變大時,該方法將會比現(xiàn)有的主流搜索引擎消耗更少的時間。
[0108] 以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技 術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修 改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1. 一種基于用戶搜索意圖定位的圖像檢索方法,其特征在于,包括以下步驟: S2 :根據(jù)用戶輸入的檢索關(guān)鍵字,使用任意一個圖像檢索平臺進行檢索獲取圖像結(jié)果 集; S4:根據(jù)所述圖像結(jié)果集中的圖像的文本信息,對所述圖像結(jié)果集中的圖像進行分 類; S6 :將所述分類后的圖像返回給用戶,并引導(dǎo)用戶在所述分類后的圖像中選取一個類 別中的至少一個圖像; S8:將所述被選取的圖像及與所述被選取的圖像相關(guān)的文本信息作為檢索條件,進行 二次檢索。2. 根據(jù)權(quán)利要求1所述的圖像檢索方法,其特征在于,所述對所述圖像結(jié)果集中的圖 像進行分類,包括以下步驟: 5401 :根據(jù)所述圖像結(jié)果集中的圖像的文本信息,將每個所述圖像在維基百科分類索 引中所屬的二級類目作為所述圖像的類別; 5402 :并將所述圖像的類別對應(yīng)的所有三級類目作為所述類別的同義詞保存到關(guān)系型 數(shù)據(jù)庫中。3. 根據(jù)權(quán)利要求2所述的圖像檢索方法,其特征在于,所述步驟S401,包括以下步驟: 54011 :根據(jù)所述圖像結(jié)果集中的圖像的文本信息,建立如下的信息矩陣:其中,N表示圖像結(jié)果集中的圖像的圖像數(shù)目,^表示圖像結(jié)果集中的一張圖像,其中 〇 < = i < = N Ji表示所述圖像的文本信息,其中O < = i < = N ;Ci表示與所述圖像相關(guān) 的類別名,其中〇 <= i <=N; 54012 :根據(jù)維基百科分類索引定義分類圖G,遍歷圖像結(jié)果集中的N個圖像,將圖像中 圖像的文本信息中包含的每個詞語或短語作為一個文本結(jié)點,對于每個所述圖像中的每個 文本結(jié)點,如果所述文本結(jié)點與所述分類圖G中的結(jié)點相匹配,則計算該文本結(jié)點出現(xiàn)在 所述圖像的文本信息!\中的頻率,最后將出現(xiàn)頻率最大的文本結(jié)點所對應(yīng)的分類圖G中的 分類名稱作為該圖像的分類。4. 根據(jù)權(quán)利要求1至3中任一項所述的圖像檢索方法,其特征在于,所述步驟S8中的 與所述被選取的圖像相關(guān)的文本信息,包括:所述被選取的圖像的類別名稱、用戶輸入的檢 索關(guān)鍵字和\或HTML中的圖像描述信息。5. 根據(jù)權(quán)利要求4所述的圖像檢索方法,其特征在于,所述步驟S8中,所述進行二次檢 索,包括以下步驟: 5801 :根據(jù)與所述被選取的圖像相關(guān)的文本信息的文本內(nèi)容,在所述圖像結(jié)果集中所 述被選取的圖像所在的分類中進行基于文本的圖像檢索; 5802 :提取所述被選取的圖像的視覺特征,采用感知哈希算法計算被選取的圖像以及 所述圖像結(jié)果集中所述被選取的圖像所在的分類中的圖像的圖像相似度,在所述圖像結(jié)果 集中所述被選取的圖像所在的分類中進行圖像檢索。6. 根據(jù)權(quán)利要求5所述的圖像檢索方法,其特征在于,所述步驟S802中,采用感知哈希 算法計算被選取的圖像以及圖像結(jié)果集中所述被選取的圖像所在的分類中的圖像的圖像 相似度,包括以下步驟: 58021 :將圖像轉(zhuǎn)化為灰度圖像,轉(zhuǎn)化公式如下: Gray = RXO. 299+GXO. 587+BX0. 114 (1) 其中,Gray表示灰度值,R、G和B分別表示原始像素中的紅、綠和藍的分量; 58022 :將所述灰度圖像分為8X8塊,將每個塊的灰度設(shè)置為該塊的灰度平均值,使用 Gray [8, 8]矩陣來存儲每個塊的灰度值,生成一個感知哈希矩陣H[8, 8],滿足以下條件:其中,avg是整張所述灰度圖像的灰度平均值,Gray[i,j]是圖像被劃分后,第i行、第 j列個塊的灰度值,others是指第i行、第j列個塊的灰度值小于avg時的情況,H[i, j]是 由第i行、第j列個塊的灰度值得到的感知哈希矩陣H[8, 8]的第i行、第j列個元素的值, 并滿足以下條件:其中,M是指圖像劃分后的行數(shù)且M = 8, N是指圖像劃分后的列數(shù)且N = 8,將獲得的 64位的二進制數(shù)值作為所述圖像的感知哈希值; 58023 :采用步驟S8021至步驟S8022分別提取所述被選取的圖像以及檢索結(jié)果所對應(yīng) 的圖像的感知哈希值,采用按位異或方式計算兩張圖像的相似度,圖像H 1和圖像H2的相似 度P (H1, H2)可以表示為位0的異或結(jié)果的百分比,公式如下:其中,C。是一個計算0異或結(jié)果的函數(shù)。7. 根據(jù)權(quán)利要求6所述的圖像檢索方法,其特征在于,所述步驟S801完成后,在所述步 驟S801所獲得的結(jié)果集中,采用步驟S802進行檢索排序,將排序后的結(jié)果集返回給用戶。8. -種基于用戶搜索意圖定位的圖像檢索系統(tǒng),其特征在于,包括: 一次檢索模塊,用于根據(jù)用戶輸入的檢索關(guān)鍵字,使用任意一個圖像檢索平臺進行檢 索獲取圖像結(jié)果集; 分類模塊,用于根據(jù)所述圖像結(jié)果集中的圖像的文本信息,對所述圖像結(jié)果集中的圖 像進行分類; 用戶交互模塊,用于將所述分類后的圖像返回給用戶,并引導(dǎo)用戶在所述分類后的圖 像中選取一個類別中的至少一個圖像; 二次檢索模塊,用于將所述被選取的圖像及與所述被選取的圖像相關(guān)的文本信息作為 檢索條件,進行二次檢索。9. 根據(jù)權(quán)利要求8所述的圖像檢索系統(tǒng),其特征在于,所述二次檢索模塊包括: 文本檢索單元,用于根據(jù)與所述被選取的圖像相關(guān)的文本信息的文本內(nèi)容,在所述圖 像結(jié)果集中所述被選取的圖像所在的分類中進行基于文本的圖像檢索; 圖像檢索單元,用于提取所述被選取的圖像的視覺特征,采用感知哈希算法計算被選 取的圖像以及所述圖像結(jié)果集中所述被選取的圖像所在的分類中的圖像的圖像相似度,在 所述圖像結(jié)果集中所述被選取的圖像所在的分類中進行圖像檢索。10.根據(jù)權(quán)利要求8或9所述的圖像檢索系統(tǒng),其特征在于,所述系統(tǒng)還包括: 排序模塊,用于在文本檢索單元完成后,在所述文本檢索單元所獲得的結(jié)果集中,采用 所述圖像檢索單元進行檢索排序,將排序后的結(jié)果集返回給用戶。
【專利摘要】本發(fā)明公開了一種基于用戶搜索意圖定位的圖像檢索方法及系統(tǒng),該方法包括步驟:根據(jù)用戶輸入的檢索關(guān)鍵字,使用任意一個圖像檢索平臺進行檢索獲取圖像結(jié)果集;根據(jù)圖像結(jié)果集中的圖像的文本信息,對圖像結(jié)果集中的圖像進行分類后返回給用戶,引導(dǎo)用戶在分類后的圖像中選取一個類別中的至少一個圖像;將被選取的圖像及與被選取的圖像相關(guān)的文本信息作為檢索條件,進行二次檢索。該系統(tǒng)包括一次檢索模塊、分類模塊、用戶交互模塊和二次檢索模塊。本發(fā)明通過較小的計算量、消耗更少的時間達到較高精確度的效果,節(jié)省了計算資源,提高了計算效率。
【IPC分類】G06F17/30
【公開號】CN105426529
【申請?zhí)枴緾N201510933574
【發(fā)明人】郭克華, 張瑞芳
【申請人】中南大學(xué)
【公開日】2016年3月23日
【申請日】2015年12月15日