類后的圖像中選取一個類別中 的至少一個圖像。實(shí)際應(yīng)用時,一些用戶可能會希望選擇多張較滿意的圖片,那么,他們可 以單擊選取多張,服務(wù)器會對這些選取的圖像執(zhí)行各自的二次檢索過程。若用戶對該頁中 的所有圖像都不滿意,他可以選擇"下一頁"查看其他圖像,處理過程同上。
[0080] S8 :將被選取的圖像及與被選取的圖像相關(guān)的文本信息作為檢索條件,進(jìn)行二次 檢索。
[0081] 與被選取的圖像相關(guān)的文本信息,包括:被選取的圖像的類別名稱、用戶輸入的檢 索關(guān)鍵字和\或HTML中的圖像描述信息(HTML,HyperTextMarkupLanguage,超文本標(biāo) 記語言,HTML中的圖像描述信息是指HTML中的"alt"字段屬性信息)。其中,類別名稱,即 用戶已選擇圖像所屬類別,如果圖像屬于"其他"類型,則該字段設(shè)為空值;用戶輸入的檢索 關(guān)鍵字,若用戶是通過上傳圖像進(jìn)行檢索的,則該字段為空值;HTML中的圖像描述信息即 圖像的"alt"屬性字段,在主搜索頁面的源代碼中,圖像可能會在"alt"屬性中設(shè)置圖像標(biāo) 簽來描述圖像信息,若無,則該字段設(shè)為空值。
[0082] 二次檢索的具體步驟如下:
[0083] S801 :根據(jù)與被選取的圖像相關(guān)的文本信息的文本內(nèi)容,在圖像結(jié)果集中被選取 的圖像所在的分類中進(jìn)行基于文本的圖像檢索。
[0084] S802:提取被選取的圖像的視覺特征,采用感知哈希算法計算被選取的圖像以及 圖像結(jié)果集中被選取的圖像所在的分類中的圖像的圖像相似度,在圖像結(jié)果集中被選取的 圖像所在的分類中進(jìn)行圖像檢索。參見圖2,圖像相似度計算的具體步驟如下:
[0085] S8021 :將圖像轉(zhuǎn)化為灰度圖像,轉(zhuǎn)化公式如下:
[0086] Gray=RXO. 299+GXO. 587+BX0. 114 (1)
[0087] 其中,Gray表示灰度值,R、G和B分別表示原始像素中的紅、綠和藍(lán)的分量。
[0088] S8022 :將灰度圖像分為8X8塊,將每個塊的灰度設(shè)置為該塊的灰度平均值,使用 Gray[8, 8]矩陣來存儲每個塊的灰度值,生成一個感知哈希矩陣H[8, 8],滿足以下條件:
[0089]
⑵
[0090] 其中,avg是整張灰度圖像的灰度平均值,Gray[i,j]是圖像被劃分后,第i行、第 j列個塊的灰度值,others是指第i行、第j列個塊的灰度值小于avg時的情況,H[i,j]是 由第i行、第j列個塊的灰度值得到的感知哈希矩陣H[8, 8]的第i行、第j列個元素的值, 并滿足以下條件:
[0091]
[0092] 其中,Μ是指圖像劃分后的行數(shù)且M= 8,N是指圖像劃分后的列數(shù)且N= 8,將獲 得的64位的二進(jìn)制數(shù)值作為圖像的感知哈希值。
[0093] S8023 :采用步驟S8021至步驟S8022分別提取被選取的圖像以及檢索結(jié)果(即圖 像結(jié)果集中被選取的圖像所在的分類中的圖像)所對應(yīng)的圖像的感知哈希值,采用按位異 或方式計算兩張圖像的相似度,圖像H1和圖像H2的相似度p(氏,H2)可以表示為位0的異 或結(jié)果的百分比,公式如下:
[0094]
⑷
[0095] 其中,C。是一個計算0異或結(jié)果的函數(shù)。
[0096] 采用簡化的感知哈希算法來在基于圖像而進(jìn)行圖像檢索的過程中,計算圖像之間 的相似度,可以顯者減少^?次檢索的運(yùn)算量,提尚檢索系統(tǒng)的處理速度,并能進(jìn)一步提尚檢 索的精度。
[0097] 在實(shí)際應(yīng)用中,為了進(jìn)一步提高檢索精度,還可以進(jìn)行:
[0098] S10 :在步驟S801完成后,在步驟S801所獲得的結(jié)果集中,采用步驟S802進(jìn)行檢 索排序,將排序后的結(jié)果集返回給用戶。具體排序方式如下:
[0099] S1001 :在步驟S801完成后,二次檢索中基于文本的圖像檢索從圖像結(jié)果集中選 出了一個圖像集IS。
[0100] S1002 :用pO^Hj公式來計算樣本圖像I與圖像集合IS中圖像的相似度,其中, 樣本圖像I指的是用戶從經(jīng)過分類的圖像中選取的一張或多張圖像。具體說明如下:
[0101] 首先定義一個向量P,用來保存樣本圖像I與IS中每個圖像is的相似程度,也就 是p(I,is),計算完成后,將P中的所有元素降序排列。因此,這些二次檢索所得的圖像結(jié)果 就有了一個新的排序序列,最后,我們只需要將排序結(jié)果返回給用戶即可。
[0102] 本發(fā)明實(shí)施例中,同時考慮文本和內(nèi)容的圖像搜索結(jié)果,而且,基于文本的搜索結(jié) 果會根據(jù)基于內(nèi)容的特征來進(jìn)行重排序,從而保證更相似的圖像位于重新檢索結(jié)果的頂 部。經(jīng)過重排序過程后,重新檢索圖像便被重組成一個新的序列。同樣的,該過程中處理的 數(shù)據(jù)量并不大,因為我們只需要考慮從當(dāng)前頁的返回結(jié)果中進(jìn)行二次檢索,當(dāng)用戶不滿意 當(dāng)前的結(jié)果時,點(diǎn)擊下一頁,才進(jìn)行下一頁結(jié)果集的二次檢索。
[0103] 參見圖4,在上述方法的同一原理的基礎(chǔ)上,本發(fā)明的基于用戶搜索意圖定位的圖 像檢索系統(tǒng),包括一次檢索模塊、分類模塊、用戶交互模塊以及二次檢索模塊。其中,一次檢 索模塊用于根據(jù)用戶輸入的檢索關(guān)鍵字,使用任意一個圖像檢索平臺進(jìn)行檢索獲取圖像結(jié) 果集;分類模塊用于根據(jù)圖像結(jié)果集中的圖像的文本信息,對圖像結(jié)果集中的圖像進(jìn)行分 類;用戶交互模塊用于將分類后的圖像返回給用戶,并引導(dǎo)用戶在分類后的圖像中選取一 個類別中的至少一個圖像;二次檢索模塊用于將被選取的圖像及與被選取的圖像相關(guān)的文 本信息作為檢索條件,進(jìn)行二次檢索。該系統(tǒng)采用一次檢索模塊進(jìn)行廣泛檢索,采用分類 模塊對廣泛檢索獲得的圖像結(jié)果集進(jìn)行分類,然后通過用戶交互模塊引導(dǎo)用戶進(jìn)行一次反 饋,根據(jù)反饋的結(jié)果進(jìn)行二次檢索,可以以增加較小的計算量,使得檢索精度獲得較大的提 尚。
[0104] 在實(shí)際應(yīng)用中,為了進(jìn)一步以較小的計算量提高檢索精度,該系統(tǒng)還可擴(kuò)充,其中 二次檢索模塊可包括:文本檢索單元和圖像檢索單元,其中,文本檢索單元用于根據(jù)與被選 取的圖像相關(guān)的文本信息的文本內(nèi)容,在圖像結(jié)果集中被選取的圖像所在的分類中進(jìn)行基 于文本的圖像檢索;圖像檢索單元用于提取被選取的圖像的視覺特征,采用感知哈希算法 計算被選取的圖像以及圖像結(jié)果集中被選取的圖像所在的分類中的圖像的圖像相似度,在 圖像結(jié)果集中被選取的圖像所在的分類中進(jìn)行圖像檢索。在基于圖像內(nèi)容進(jìn)行的圖像檢索 中,采用了一種改進(jìn)的感知哈希算法。該算法提取圖像特征作為其指紋,這種指紋可用來比 較。系統(tǒng)還可包括排序模塊,用于在文本檢索單元完成后,在文本檢索單元所獲得的結(jié)果集 中,采用圖像檢索單元進(jìn)行檢索排序,將排序后的結(jié)果集返回給用戶。
[0105] 結(jié)合上述的描述,下面從搜索精確度和時間消耗兩方面,對本發(fā)明實(shí)施例的優(yōu)點(diǎn) 進(jìn)行進(jìn)一步說明:
[0106] 而在本發(fā)明實(shí)施例中,先將圖像進(jìn)行分類,將分類結(jié)果展示給用戶讓用戶選擇,這 種方式與現(xiàn)在技術(shù)相比,用戶不需要面對大量圖像來選擇出一個較滿意的圖像,而是從少 數(shù)量的分類中找到一個較滿意的類,并從這個類中選擇出一個或多個較滿意的圖像,這樣 可產(chǎn)生更好的用戶體驗;其次,本系統(tǒng)對圖像重排序采用了計算量小的簡化的感知哈希算 法來計算兩圖的相似度,而現(xiàn)有技術(shù)采用的是更加復(fù)雜且計算量較大的算法。通過理論分 析及實(shí)驗證明,本發(fā)明實(shí)施例消耗更少的時間,不僅達(dá)到了較高精確度的效果,也節(jié)省了計 算資源,提高了計算效率。