圖片搜索方法及裝置制造方法
【專利摘要】本發(fā)明提供一種圖片搜索方法及裝置,其中,圖片搜索方法包括:獲得客戶端發(fā)送的當(dāng)前圖片,從當(dāng)前圖片中提取出當(dāng)前特征,根據(jù)當(dāng)前特征對倒排索引庫進行檢索,獲取倒排索引值,其中,倒排索引庫中包含多個與圖片的特征一一對應(yīng)的鏈表;根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并排序處理;以及根據(jù)處理后的結(jié)果向客戶端返回檢索結(jié)果,以便向用戶顯示。本發(fā)明實施例,提取獲得的當(dāng)前圖片的當(dāng)前特征,根據(jù)當(dāng)前特征對包含多個鏈表的倒排索引庫進行檢索獲取倒排索引值,根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并排序處理,并向用戶顯示檢索結(jié)果,操作方便、實現(xiàn)簡單,克服了依賴文字的輸入來獲取結(jié)果的不便。
【專利說明】圖片搜索方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機【技術(shù)領(lǐng)域】,尤其涉及一種圖片搜索方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們可以利用搜索引擎進行獲得需要的信息。搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
[0003]搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎等。
[0004]傳統(tǒng)的搜索引擎是依賴文字的輸入來獲取結(jié)果,這種模式在移動的時代不是很便利。例如,我們在大街上想去吃肯德基(KFC),但是想先獲取優(yōu)惠券后再進去,此時,我們打開百度,通過關(guān)鍵詞進行搜索會很麻煩。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本發(fā)明的實施例在于提出一種利用圖片進行搜索,從而獲得所需信息的圖片搜索方法及裝置。
[0006]根據(jù)本發(fā)明實施例的圖片搜索方法包括:獲得客戶端發(fā)送的當(dāng)前圖片,從當(dāng)前圖片中提取出當(dāng)前特征,根據(jù)當(dāng)前特征對倒排索引庫進行檢索,獲取倒排索引值,其中,倒排索引庫中包含多個與圖片的特征一一對應(yīng)的鏈表;根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并排序處理;以及根據(jù)處理后的結(jié)果向客戶端返回檢索結(jié)果,以便向用戶顯示。
[0007]根據(jù)本發(fā)明實施例的圖片搜索方法,提取獲得的當(dāng)前圖片的當(dāng)前特征,根據(jù)當(dāng)前特征對倒排索引庫進行檢索獲取倒排索引值,根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并排序處理,并向用戶顯示檢索結(jié)果,操作方便、實現(xiàn)簡單,克服了依賴文字的輸入來獲取結(jié)果的不便。
[0008]根據(jù)本發(fā)明實施例的圖片搜索裝置包括:檢索模塊,用于獲得客戶端發(fā)送的當(dāng)前圖片,從當(dāng)前圖片中提取出當(dāng)前特征,根據(jù)當(dāng)前特征對倒排索引庫進行檢索,獲取倒排索引值,其中,倒排索引庫中包含多個與圖片的特征一一對應(yīng)的鏈表;處理模塊,用于根據(jù)檢索模塊獲取的倒排索引值對對應(yīng)的鏈表進行歸并排序處理;以及發(fā)送模塊,用于根據(jù)處理模塊處理后的結(jié)果向客戶端返回檢索結(jié)果,以便向用戶顯示。
[0009]根據(jù)本發(fā)明實施例的圖片搜索裝置,通過檢索模塊提取獲得的當(dāng)前圖片的當(dāng)前特征,并根據(jù)當(dāng)前特征對倒排索引庫進行檢索獲取倒排索引值,通過處理模塊根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并排序處理,通過發(fā)送模塊向用戶顯示檢索結(jié)果,操作方便、實現(xiàn)簡單,克服了依賴文字的輸入來獲取結(jié)果的不便。
【專利附圖】
【附圖說明】
[0010]圖1是根據(jù)本發(fā)明一個實施例的圖片搜索方法的流程圖。[0011]圖2是根據(jù)本發(fā)明一個實施例的建立倒排索引庫的流程圖。
[0012]圖3是根據(jù)本發(fā)明另一個實施例的圖片搜索方法的流程圖。
[0013]圖4是根據(jù)本發(fā)明一個實施例的圖片搜索裝置的結(jié)構(gòu)示意圖。
[0014]圖5是根據(jù)本發(fā)明另一個實施例的圖片搜索裝置的結(jié)構(gòu)示意圖。
[0015]圖6是根據(jù)本發(fā)明一個實施例的建立模塊的結(jié)構(gòu)示意圖。
【具體實施方式】
[0016]下面詳細(xì)描述本發(fā)明的實施例,實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0017]在本發(fā)明的實施例中,可以使用圖片進行搜索,例如,針對【背景技術(shù)】中出現(xiàn)的需要獲取KFC優(yōu)惠券的情況,用戶可以拿起手機拍一下KFC的門店,然后獲取搜索結(jié)果,其中,第一條(排名(Rank)機制保證)就是優(yōu)惠券的網(wǎng)址,實現(xiàn)相當(dāng)方便。下面結(jié)合附圖描述本發(fā)明實施例的圖片搜索方法及裝置。
[0018]圖1是根據(jù)本發(fā)明一個實施例的圖片搜索方法的流程圖。如圖1所示,該方法可以包括以下步驟:
[0019]S101、建立倒排索引庫,其中,倒排索引庫中包含多個與圖片的特征一一對應(yīng)的鏈表。
[0020]在該實施例中,如圖2所示,上述步驟SlOl可以包括如下步驟:
[0021]S1011、獲得與每個網(wǎng)站--對應(yīng)的描述文件,通過爬蟲(Spider)從描述文件獲
取網(wǎng)站中的圖片與通用資源標(biāo)識符(Uniform Resource Identifier,簡稱URI)的映射關(guān)系O
[0022]在本實施例中,凡是想被圖像搜索引擎搜索到的網(wǎng)站(即Web站點),必須輸出有效的能被爬蟲(Spider)識別的描述文件,這個描述文件可以用現(xiàn)成的結(jié)構(gòu)化語言比如可擴展標(biāo)記語言(XML)來描述。這個描述文件可以規(guī)范每個URI與Web站點中的圖片(或圖像)的映射關(guān)系;可以規(guī)范Web站點在符合哪些位置信息例如指定了一個用戶的搜索區(qū)域的情況下才可以出現(xiàn);還可以規(guī)范下一個描述文件的位置,下一個描述文件可以是本站的,也可以是跨站的。
[0023]通過Spider從描述文件獲取圖片與URI的映射關(guān)系后,可以將映射關(guān)系保存至正排索引庫中。
[0024]S1012、提取出所有圖片的特征。
[0025]在本發(fā)明的實施例中,可以采用很多通用的提取算法提取所有圖片的特征,例如可以采用詞袋(bag of word,BOW)算法,提取圖片中的不定個數(shù)的特征,每個特征對應(yīng)一個特征向量,這樣可以從一張圖片中提取多個特征。
[0026]S1013、針對每個特征建立一個鏈表,鏈表中包含對應(yīng)特征的權(quán)重和具有對應(yīng)特征的圖片標(biāo)識及其權(quán)重信息。
[0027]在本發(fā)明的實施例中,每個特征對應(yīng)一個鏈表,鏈表的元素是符合這個特征的圖片標(biāo)識(ID)。為了更好地做Rank,需要為每個圖片ID賦予權(quán)重信息例如權(quán)重分?jǐn)?shù),還需要為每個特征賦予權(quán)重。[0028]建立好與所有特征一一對應(yīng)的鏈表,也就完成倒排索引庫的建立,即倒排索引庫中包含多個鏈表。
[0029]需要說明的是,該步驟SlOl為可選步驟,即若已建立好倒排索引庫則不需要再次建立。
[0030]S102、獲得客戶端發(fā)送的當(dāng)前圖片,從當(dāng)前圖片中提取出當(dāng)前特征,根據(jù)當(dāng)前特征對倒排索引庫進行檢索,獲取倒排索引值。
[0031]在本發(fā)明的實施例中,當(dāng)用戶在乘坐地鐵時看到某個電影的海報后,若想購買觀看該電影,則需要購買電影票,此時用戶可以拿起手機拍下這個海報,并通過手機客戶端發(fā)送海報圖片,然后可以采用BOW或其他提取算法提取出當(dāng)前特征。由于在步驟SlOl中已建立好倒排索引庫,所以可以根據(jù)當(dāng)前特征查詢該倒排索引庫獲得倒排索引值。
[0032]S103、根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并排序處理。
[0033]由于在步驟S102中會獲得多個倒排索引值,所以需要根據(jù)倒排索引值對對應(yīng)的鏈表進行歸并,并對歸并后的鏈表中的節(jié)點進行權(quán)重信息疊加,然后根據(jù)疊加后的權(quán)重信息對節(jié)點進行排序。
[0034]具體地,可以將每個節(jié)點中包含的所有特征的權(quán)重總和與包含的圖片標(biāo)識的權(quán)重信息之積作為對應(yīng)節(jié)點疊加后的權(quán)重信息。
[0035]以表1所示的 歸并后的鏈表的節(jié)點為例,對如何計算節(jié)點的權(quán)重信息進行說明。
[0036]表1歸并后的鏈表的節(jié)點
[0037]
【權(quán)利要求】
1.一種圖片搜索方法,其特征在于,所述方法包括: 獲得客戶端發(fā)送的當(dāng)前圖片,從所述當(dāng)前圖片中提取出當(dāng)前特征,根據(jù)所述當(dāng)前特征對倒排索引庫進行檢索,獲取倒排索引值,其中,所述倒排索引庫中包含多個與圖片的特征—對應(yīng)的鏈表; 根據(jù)所述倒排索引值對對應(yīng)的鏈表進行歸并排序處理;以及 根據(jù)處理后的結(jié)果向所述客戶端返回檢索結(jié)果,以便向所述用戶顯示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述當(dāng)前特征對倒排索引庫進行檢索之前,所述方法還包括: 建立倒排索引庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述建立倒排索引庫包括: 獲得與每個網(wǎng)站一一對應(yīng)的描述文件,通過爬蟲從所述描述文件獲取所述網(wǎng)站中的圖片與通用資源標(biāo)識符URI的映射關(guān)系; 提取出所有圖片的特征;以及 針對每個特征建立一個鏈表,所述鏈表中包含對應(yīng)特征的權(quán)重和具有對應(yīng)特征的圖片標(biāo)識及其權(quán)重信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述倒排索引值對對應(yīng)的鏈表進行歸并排序處理,包括: 根據(jù)所述倒排索引值對對應(yīng)的鏈表進行歸并,對歸并后的鏈表中的節(jié)點進行權(quán)重信息疊加,根據(jù)疊加后的權(quán)重信息對所述節(jié)點進行排序; 所述根據(jù)處理后的結(jié)果向所述客戶端返回檢索結(jié)果包括: 根據(jù)排序處理后的結(jié)果向所述客戶端返回所述檢索結(jié)果。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對歸并后的鏈表中的節(jié)點進行權(quán)重信息疊加包括: 將每個節(jié)點中包含的所有特征的權(quán)重總和與包含的圖片標(biāo)識的權(quán)重信息之積作為對應(yīng)節(jié)點疊加后的權(quán)重信息。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在所述通過爬蟲從所述描述文件獲取所述網(wǎng)站中的圖片與URI的映射關(guān)系之后,所述方法還包括: 從所述描述文件獲取位置信息; 將所述映射關(guān)系和所述位置信息對應(yīng)保存至正排索引數(shù)據(jù)庫中。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述根據(jù)所述倒排索引值對對應(yīng)的鏈表進行歸并排序處理之后,所述方法還包括: 從所述正排索引數(shù)據(jù)庫中獲得排序處理后的鏈表中包含的圖片標(biāo)識對應(yīng)的位置信息,根據(jù)所述位置信息對排序處理后的鏈表進行過濾; 所述根據(jù)處理后的結(jié)果向所述客戶端返回檢索結(jié)果包括: 根據(jù)過濾結(jié)果向所述客戶端返回檢索結(jié)果,以便向所述用戶顯示。
8.一種圖片搜索裝置,其特征在于,所述裝置包括: 檢索模塊,用于獲得客戶端發(fā)送的當(dāng)前圖片,從所述當(dāng)前圖片中提取出當(dāng)前特征,根據(jù)所述當(dāng)前特征對倒排索引庫進行檢索,獲取倒排索引值,其中,所述倒排索引庫中包含多個與圖片的特征一一對應(yīng)的鏈表;處理模塊,用于根據(jù)所述檢索模塊獲取的所述倒排索引值對對應(yīng)的鏈表進行歸并排序處理;以及 發(fā)送模塊,用于根據(jù)所述處理模塊處理后的結(jié)果向所述客戶端返回檢索結(jié)果,以便向所述用戶顯示。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 建立模塊,用于在所述檢索模塊根據(jù)所述當(dāng)前特征對倒排索引庫進行檢索之前,建立倒排索引庫。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述建立模塊包括: 獲得單元,用于獲得與每個網(wǎng)站一一對應(yīng)的描述文件,通過爬蟲從所述描述文件獲取所述網(wǎng)站中的圖片與通用資源標(biāo)識符URI的映射關(guān)系; 提取 單元,用于提取出所有圖片的特征;以及 建立單元,用于針對每個特征建立一個鏈表,所述鏈表中包含對應(yīng)特征的權(quán)重和具有對應(yīng)特征的圖片標(biāo)識及其權(quán)重信息。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述處理模塊,具體用于:根據(jù)所述倒排索引值對對應(yīng)的鏈表進行歸并,對歸并后的鏈表中的節(jié)點進行權(quán)重信息疊加,根據(jù)疊加后的權(quán)重信息對所述節(jié)點進行排序; 所述發(fā)送模塊,具體用于:根據(jù)排序處理后的結(jié)果向所述客戶端返回所述檢索結(jié)果。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述處理模塊,具體用于:將每個節(jié)點中包含的所有特征的權(quán)重總和與包含的圖片標(biāo)識的權(quán)重信息之積作為對應(yīng)節(jié)點疊加后的權(quán)重信息。
13.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述獲得單元,還用于:在通過爬蟲從所述描述文件獲取所述網(wǎng)站中的圖片與URI的映射關(guān)系之后,從所述描述文件獲取位置信息,將所述映射關(guān)系和所述位置信息對應(yīng)保存至正排索引數(shù)據(jù)庫中。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述處理模塊,還用于:在根據(jù)所述倒排索引值對對應(yīng)的鏈表進行歸并排序處理之后,從所述正排索引數(shù)據(jù)庫中獲得排序處理后的鏈表中包含的圖片標(biāo)識對應(yīng)的位置信息,根據(jù)所述位置信息對排序處理后的鏈表進行過濾; 所述發(fā)送模塊,具體用于:根據(jù)過濾結(jié)果向所述客戶端返回檢索結(jié)果,以便向所述用戶顯不O
【文檔編號】G06F17/30GK103995848SQ201410189773
【公開日】2014年8月20日 申請日期:2014年5月6日 優(yōu)先權(quán)日:2014年5月6日
【發(fā)明者】肖偉, 杜熙, 李穎超 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司