專利名稱:搜索成套圖像的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像搜索領(lǐng)域,更具體地講,涉及一種搜索成套圖像的方法和設(shè)備。
背景技術(shù):
圖像的表意性要遠好于文本,圖像可以幫助人們更迅速、更直觀的獲取信息。隨著信息社會的發(fā)展,人們對于網(wǎng)絡(luò)的依存度越來越高,對于在網(wǎng)絡(luò)上進行圖像獲取的需求也越來越大。在現(xiàn)有技術(shù)條件下,用戶通常需要輸入文本關(guān)鍵字來進行圖像的搜索,搜索出來的結(jié)果通常都是離散的。然而,隨著人們對于網(wǎng)絡(luò)信息需要的增加以及信息分享的增強,網(wǎng)絡(luò)上的圖像很多作為套圖集而成套地出現(xiàn)。例如,網(wǎng)絡(luò)上的很多關(guān)于新聞事件、教程(例如,菜譜、軟件使用教程等)、游記、寫真等的圖像都是成套出現(xiàn)的。這些圖集可能被別的網(wǎng)站轉(zhuǎn)載、引用,在轉(zhuǎn)載、引用時可能由于某些原因轉(zhuǎn)得不完整,久而久之一套原本精心編輯的圖集可能會變成一張張單獨的圖像,散落在互聯(lián)網(wǎng)上,很多用戶看到的只是其中的一兩張,不連貫也不完整。因此,當用戶擁有成套圖像之一時,可能希望看到整套圖像或者具有類似圖像的整套圖像。此外,網(wǎng)站也傾向于當用戶在瀏覽某個圖像時,將相應(yīng)地套圖提供給用戶。因此,需要一種搜索成套圖像的技術(shù),以能夠向用戶提供套圖集。
發(fā)明內(nèi)容
本發(fā)明提供一種搜索成套圖像的方法和設(shè)備,其能夠根據(jù)輸入的圖像搜索出與該圖像相關(guān)的套圖集。本發(fā)明的一方面提供一種搜索成套圖像的方法,包括:接收第一圖像;從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的第二圖像,其中,數(shù)據(jù)庫存儲有從網(wǎng)絡(luò)收集的圖像以及圖像所在的網(wǎng)頁;從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁;根據(jù)所述網(wǎng)頁獲取至少一個套圖集??蛇x地,根據(jù)所述網(wǎng)頁獲取至少一個套圖集的步驟包括:獲取所述網(wǎng)頁的至少一級深度的鏈接指向的第三圖像;從第三圖像之中選擇面積大于預(yù)定閾值的第四圖像;根據(jù)第四圖像的網(wǎng)址的構(gòu)成特征,對第四圖像進行分組,以獲得至少一個套圖集??蛇x地,獲取所述網(wǎng)頁的至少一級深度的鏈接指向的第三圖像的步驟包括:獲取所述網(wǎng)頁中的圖像作為第三圖像;當所述網(wǎng)頁的至少一級深度的鏈接中存在表示翻頁的鏈接時,獲取表示翻頁的鏈接所指向的網(wǎng)頁中的圖像作為第三圖像??蛇x地,根據(jù)所述網(wǎng)頁獲取至少一個套圖集的步驟還包括:選擇面積波動率小于預(yù)定閾值的套圖集??蛇x地,根據(jù)所述網(wǎng)頁獲取至少一個套圖集的步驟還包括:選擇圖像數(shù)量大于預(yù)定閾值的套圖集??蛇x地,面積波動率表示為S,
其中,S= (Imax-1min)/lave,
Imax表示套圖集中的面積最大的圖像的面積,Imin表示套圖集中面積最小的圖像的面積,Iave表示套圖集中的圖像的面積的均值。
可選地,所述方法還包括:根據(jù)下述因素中的至少一個因素從所述至少一個套圖集中選擇優(yōu)選的套圖集:關(guān)于套圖集中的圖像的描述文本與第一圖像的描述文本之間的相關(guān)性、套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)、對套圖集中的圖像中是否存在人臉的識別結(jié)果、在套圖集中的圖像中識別出的水印的數(shù)量。
本發(fā)明的另一方面提供一種搜索成套圖像的設(shè)備,包括:接收單元,接收第一圖像;圖像搜索單元,從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的第二圖像,其中,數(shù)據(jù)庫存儲有從網(wǎng)絡(luò)收集的圖像以及圖像所在的網(wǎng)頁;網(wǎng)頁識別單元,從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁;套圖集獲取單元,根據(jù)所述網(wǎng)頁獲取至少一個套圖集。
可選地,套圖集獲取單元包括:網(wǎng)頁圖像獲取單元,獲取所述網(wǎng)頁的至少一級深度的鏈接指向的第三圖像;篩選單元,從第三圖像之中選擇面積大于預(yù)定閾值的第四圖像;分組單元,根據(jù)第四圖像的網(wǎng)址的構(gòu)成特征,對第四圖像進行分組,以獲得至少一個套圖集。
可選地,網(wǎng)頁圖像獲取單元獲取所述網(wǎng)頁中的圖像作為第三圖像,其中,當所述網(wǎng)頁的至少一級深度的鏈接中存在表示翻頁的鏈接時,網(wǎng)頁圖像獲取單元獲取表示翻頁的鏈接所指向的網(wǎng)頁中的圖像作為第三圖像。
可選地,套圖集獲取單元還包括:選擇單元,選擇面積波動率小于預(yù)定閾值的套圖集。
可選地,選擇單元還選擇圖像數(shù)量大于預(yù)定閾值的套圖集。
可選地,面積波動率表示為S,
其中,S= (Imax-1min)/lave,
Imax表示套圖集中的面積最大的圖像的面積,Imin表示套圖集中面積最小的圖像的面積,Iave表示套圖集中的圖像的面積的均值。
可選地,所述設(shè)備還包括:優(yōu)選單元,根據(jù)下述因素中的至少一個因素從所述至少一個套圖集中選擇優(yōu)選的套圖集:關(guān)于套圖集中的圖像的描述文本與第一圖像的描述文本之間的相關(guān)性、套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)、對套圖集中的圖像中是否存在人臉的識別結(jié)果、在套圖集中的圖像中識別出的水印的數(shù)量。
本發(fā)明的另一方面提供一種在瀏覽圖像時提供成套圖像的方法,包括:獲取當前正在瀏覽的圖像作為第一圖像;基于第一圖像上述搜索成套圖像的方法,以獲取至少一個套圖集;提供獲取的至少一個套圖集。
根據(jù)本發(fā)明的搜索成套圖像的方法和設(shè)備,可以根據(jù)輸入的圖像來搜索與輸入的圖像相關(guān)聯(lián)的成套圖像。
此外,當用戶在使用圖像瀏覽器或者網(wǎng)絡(luò)瀏覽器瀏覽圖像時,圖像瀏覽器或者網(wǎng)絡(luò)瀏覽器可以利用本發(fā)明的方法/或設(shè)備,根據(jù)用戶當前瀏覽的圖像向用戶提供與該圖像相關(guān)聯(lián)的成套圖像。此外,當用戶在某個網(wǎng)站瀏覽圖像時,該網(wǎng)站也可以利用本發(fā)明的方法/或設(shè)備,根據(jù)用戶當前瀏覽的圖像向用戶提供與該圖像相關(guān)聯(lián)的成套圖像。
通過下面結(jié)合附圖進行的詳細描述,本發(fā)明的上述和其它目的、特點和優(yōu)點將會變得更加清楚,其中:圖1示出根據(jù)本發(fā)明的示例性實施例的搜索成套圖像的設(shè)備的框圖。圖2示出根據(jù)本發(fā)明的示例性實施例的套圖集獲取單元的框圖。圖3示出根據(jù)本發(fā)明的示例性實施例的搜索成套圖像的方法的流程圖。圖4示出根據(jù)本發(fā)明的示例性實施例的獲取至少一個套圖集的步驟的流程圖。
具體實施例方式下面,將參照附圖詳細描述本發(fā)明的實施例。圖1示出根據(jù)本發(fā)明的示例性實施例的搜索成套圖像的設(shè)備的框圖。如圖1所示,根據(jù)本發(fā)明的搜索成套圖像的設(shè)備100包括:接收單元110、圖像搜索單元120、網(wǎng)頁識別單元130、套圖集獲取單元140。接收單元110用于獲取用于搜索成套圖像的圖像(以下,稱為第一圖像)。例如,可以由希望進行搜索成套圖像的用戶輸入第一圖像,或者用戶當前正在瀏覽的圖像也可以作為第一圖像,從而可以通過本發(fā)明的搜索成套圖像的設(shè)備100自動為用戶提供與當前瀏覽的圖像相關(guān)聯(lián)的套圖集。這里,一套成套圖像稱為套圖集。圖像搜索單元120從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的圖像(以下,稱為第二圖像)。該數(shù)據(jù)庫可存儲有預(yù)先從網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))收集或抓取的圖像以及圖像所在的網(wǎng)頁。圖像搜索單元120可從數(shù)據(jù)庫中搜索與第一圖像的相似度大于預(yù)定閾值的圖像來作為第二圖像。圖像搜索單元120可以通過例如模式識別技術(shù)的各種現(xiàn)有技術(shù)的圖像對比技術(shù)
來搜索第二圖像。網(wǎng)頁識別單元130從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁。應(yīng)該理解,由于一個第二圖像有可能存在于多個網(wǎng)頁中,因此,針對每個第二圖像,網(wǎng)頁識別單元130可獲取至少一個網(wǎng)頁。套圖集獲取單元140根據(jù)網(wǎng)頁識別單元130獲取的網(wǎng)頁獲取至少一個套圖集。下面參照圖2詳細描述套圖集獲取單元140。圖2示出根據(jù)本發(fā)明的示例性實施例的套圖集獲取單元的框圖。如圖2所示,根據(jù)本發(fā)明的示例性實施例的套圖集獲取單元140包括:網(wǎng)頁圖像獲取單元141、篩選單元142、分組單元143、選擇單元144。針對每個網(wǎng)頁,網(wǎng)頁圖像獲取單元141獲取該網(wǎng)頁的至少一級深度的鏈接指向的圖像(以下,稱為第三圖像)。例如,網(wǎng)頁的第一級深度的鏈接表示該網(wǎng)頁上的鏈接,網(wǎng)頁的第二級鏈接表示該網(wǎng)頁上的鏈接指向的網(wǎng)頁上的鏈接,以此類推。優(yōu)選地,網(wǎng)頁圖像獲取單元141獲取所述網(wǎng)頁中的圖像作為第三圖像。此外,當所述網(wǎng)頁的至少一級深度的鏈接中存在表示翻頁的鏈接時,網(wǎng)頁圖像獲取單元141獲取表示翻頁的鏈接所指向的網(wǎng)頁中的圖像作為第三圖像??赏ㄟ^鏈接的描述文字(例如,上一頁、下一頁)等來確定該鏈接是否表示翻頁。
篩選單元142從第三圖像之中選擇面積(B卩,分辨率)大于預(yù)定閾值的圖像(以下,稱為第四圖像)。這樣,可以濾掉不重要的小圖、邊角圖等。
分組單元143根據(jù)第四圖像的網(wǎng)址的構(gòu)成特征,對第四圖像進行分組,以獲得至少一個套圖集。
通常,成套圖像的網(wǎng)址的大部分內(nèi)容是相同的,僅在于編號的不同(例如,網(wǎng)址的最后一個層次分隔符“/”之前的內(nèi)容相同,而之后的內(nèi)容不同),因此可以將網(wǎng)址的構(gòu)成特征相似的第四圖像分為一組,作為一個套圖集。
選擇單元144從分組單元143獲得的套圖集之中剔除不是成套圖像的套圖集,即,偽套圖集。
在一個實施例中,選擇單元144根據(jù)套圖集的面積波動率來判斷偽套圖集。具體地說,選擇單元144保留面積波動率小于預(yù)定閾值的套圖集,而丟棄作為偽套圖集的面積波動率大于等于預(yù)定閾值的套圖集。
面積波動率可被表示為S,
S= (Imax-1min) /lave,
Imax表示套圖集中的面積最大的圖像的面積,Imin表示套圖集中面積最小的圖像的面積,Iave表示套圖集中的圖像的面積的均值。
此外,選擇單元144還可進一步結(jié)合或單獨根據(jù)套圖集中的圖像的數(shù)量來判斷偽套圖集。此時,選擇單元144保留圖像數(shù)量大于預(yù)定閾值的套圖集,而丟棄作為偽套圖集的圖像數(shù)量小于等于預(yù)定閾值的套圖集。
在另一實施例中,搜索成套圖像的設(shè)備100還可包括優(yōu)選單元(未示出)。優(yōu)選單元根據(jù)套圖集獲取單元140獲取的套圖集的圖像特征,進一步優(yōu)選質(zhì)量高的套圖集。具體地說,優(yōu)選單元根據(jù)套圖集獲取單元140獲取的套圖集的圖像特征確定套圖集的質(zhì)量,根據(jù)質(zhì)量對套圖集進行排序,并選擇質(zhì)量高的套圖集。應(yīng)該理解,可選擇質(zhì)量排序最靠前的一個或多個套圖集。
優(yōu)選單元可根據(jù)下述圖像特征中的至少一個圖像特征確定套圖集的質(zhì)量:關(guān)于套圖集中的圖像的描述文本與第一圖像的描述文本之間的相關(guān)性、套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)、對套圖集中的圖像中是否存在人臉的識別結(jié)果、在套圖集中的圖像中識別出的水印的數(shù)量。
這里,套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)與套圖集的質(zhì)量成正比。
套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、在套圖集中的圖像中識別出的水印的數(shù)量與套圖集的質(zhì)量成反比。
此外,當?shù)谝粓D像中存在人臉時,如果套圖集中的圖像中存在人臉,則套圖集的質(zhì)量相對高;如果套圖集中的圖像中不存在人臉,則套圖集的質(zhì)量相對低。當?shù)谝粓D像中不存在人臉時,如果套圖集中的圖像中存在人臉,則套圖集的質(zhì)量相對低;如果套圖集中的圖像中不存在人臉,則套圖集的質(zhì)量相對高。圖3示出根據(jù)本發(fā)明的示例性實施例的搜索成套圖像的方法的流程圖。如圖3所示,在步驟301,接收單元110獲取用于搜索成套圖像的第一圖像。在步驟302,從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的第二圖像。該數(shù)據(jù)庫可存儲有預(yù)先從網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))收集或抓取的圖像以及圖像所在的網(wǎng)頁??蓮臄?shù)據(jù)庫中搜索與第一圖像的相似度大于預(yù)定閾值的圖像來作為第二圖像。可以通過例如模式識別技術(shù)的各種現(xiàn)有技術(shù)的圖像對比技術(shù)來搜索第二圖像。在步驟303,從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁。應(yīng)該理解,由于一個第二圖像有可能存在于多個網(wǎng)頁中,因此,針對每個第二圖像,可獲取至少一個網(wǎng)頁。在步驟304,根據(jù)在步驟303獲取的網(wǎng)頁獲取至少一個套圖集。下面參照圖4詳細描述獲取至少一個套圖集的步驟。圖4示出根據(jù)本發(fā)明的示例性實施例的獲取至少一個套圖集的步驟的流程圖。如圖4所示,在步驟401,針對每個網(wǎng)頁,獲取該網(wǎng)頁的至少一級深度的鏈接指向的第三圖像。例如,網(wǎng)頁的第一級深度的鏈接表示該網(wǎng)頁上的鏈接,網(wǎng)頁的第二級鏈接表示該網(wǎng)頁上的鏈接指向的網(wǎng)頁上的鏈接,以此類推。優(yōu)選地,獲取所述網(wǎng)頁中的圖像作為第三圖像。此外,當所述網(wǎng)頁的至少一級深度的鏈接中存在表示翻頁的鏈接時,獲取表示翻頁的鏈接所指向的網(wǎng)頁中的圖像作為第三圖像??赏ㄟ^鏈接的描述文字(例如,上一頁、下一頁)等來確定該鏈接是否表示翻頁。在步驟402,從第三圖像之中選擇面積(S卩,分辨率)大于預(yù)定閾值的圖像(以下,稱為第四圖像)。這樣,可以濾掉不重要的小圖、邊角圖等。在步驟403,根據(jù)第四圖像的網(wǎng)址的構(gòu)成特征,對第四圖像進行分組,以獲得至少
一個套圖集。通常,成套圖像的網(wǎng)址的大部分內(nèi)容是相同的,僅在于編號的不同(例如,網(wǎng)址的最后一個層次分隔符“/”之前的內(nèi)容相同,而之后的內(nèi)容不同),因此可以將網(wǎng)址的構(gòu)成特征相似的第四圖像分為一組,作為一個套圖集。在步驟404,從在步驟403獲得的套圖集之中剔除偽套圖集。在一個實施例中,根據(jù)套圖集的面積波動率來判斷偽套圖集。具體地說,保留面積波動率小于預(yù)定閾值的套圖集,而丟棄作為偽套圖集的面積波動率大于等于預(yù)定閾值的套圖集。此外,還可進一步結(jié)合或單獨根據(jù)套圖集中的圖像的數(shù)量來判斷偽套圖集。此時,保留圖像數(shù)量大于預(yù)定閾值的套圖集,而丟棄作為偽套圖集的圖像數(shù)量小于等于預(yù)定閾值的套圖集。在另一實施例中,圖3所示的方法還可包括根據(jù)圖像特征確定在步驟304獲取的套圖集的質(zhì)量,對套圖集的質(zhì)量進行排序,并進一步優(yōu)選質(zhì)量高的套圖集??蛇x擇質(zhì)量排序最靠前的一個或多個套圖集??筛鶕?jù)下述特性特征中的至少一個確定套圖集的質(zhì)量:關(guān)于套圖集中的圖像的描述文本與第一圖像的描述文本之間的相關(guān)性、套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)、對套圖集中的圖像中是否存在人臉的識別結(jié)果、在套圖集中的圖像中識別出的水印的數(shù)量。這里,套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)與套圖集的質(zhì)量成正比。套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、在套圖集中的圖像中識別出的水印的數(shù)量與套圖集的質(zhì)量成反比。此外,當?shù)谝粓D像中存在人臉時,如果套圖集中的圖像中存在人臉,則套圖集的質(zhì)量相對高;如果套圖集中的圖像中不存在人臉,則套圖集的質(zhì)量相對低。當?shù)谝粓D像中不存在人臉時,如果套圖集中的圖像中存在人臉,則套圖集的質(zhì)量相對低;如果套圖集中的圖像中不存在人臉,則套圖集的質(zhì)量相對高。此外,根據(jù)本發(fā)明的示例性實施例的搜索成套圖像的方法可以被實現(xiàn)為計算機程序。此外,根據(jù)本發(fā)明的示例性實施例的搜索成套圖像的設(shè)備中的各個單元可被實現(xiàn)硬件組件。本領(lǐng)域技術(shù)人員根據(jù)限定的各個單元所執(zhí)行的處理,可以例如使用現(xiàn)場可編程門陣列(FPGA)或?qū)S眉呻娐?ASIC)來實現(xiàn)各個單元。根據(jù)本發(fā)明的搜索成套圖像的方法和設(shè)備,可以根據(jù)輸入的圖像來搜索與輸入的圖像相關(guān)聯(lián)的成套圖像。此外,當用戶在使用圖像瀏覽器或者網(wǎng)絡(luò)瀏覽器瀏覽圖像時,圖像瀏覽器或者網(wǎng)絡(luò)瀏覽器可以利用本發(fā)明的方法/或設(shè)備,根據(jù)用戶當前瀏覽的圖像向用戶提供與該圖像相關(guān)聯(lián)的成套圖像。此外,當用戶在某個網(wǎng)站瀏覽圖像時,該網(wǎng)站也可以利用本發(fā)明的方法/或設(shè)備,根據(jù)用戶當前瀏覽的圖像向用戶提供與該圖像相關(guān)聯(lián)的成套圖像。盡管已經(jīng)參照其示例性實施例具體顯示和描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下,可以對其進行形式和細節(jié)上的各種改變。
權(quán)利要求
1.一種搜索成套圖像的方法,包括: 接收第一圖像; 從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的第二圖像,其中,數(shù)據(jù)庫存儲有從網(wǎng)絡(luò)收集的圖像以及圖像所在的網(wǎng)頁; 從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁; 根據(jù)所述網(wǎng)頁獲取至少一個套圖集。
2.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述網(wǎng)頁獲取至少一個套圖集的步驟包括: 獲取所述網(wǎng)頁的至少一級深度的鏈接指向的第三圖像; 從第三圖像之中選擇面積大于預(yù)定閾值的第四圖像; 根據(jù)第四圖像的網(wǎng)址的構(gòu)成特征,對第四圖像進行分組,以獲得至少一個套圖集。
3.根據(jù)權(quán)利要求2所述的方法,其中,獲取所述網(wǎng)頁的至少一級深度的鏈接指向的第三圖像的步驟包括: 獲取所述網(wǎng)頁中的圖像作為第三圖像; 當所述網(wǎng)頁的至少一級深度的鏈接中存在表示翻頁的鏈接時,獲取表示翻頁的鏈接所指向的網(wǎng)頁中的圖像作為第三圖像。
4.根據(jù)權(quán)利要求2所述的方法,其中,根據(jù)所述網(wǎng)頁獲取至少一個套圖集的步驟還包括: 選擇面積波動率小于預(yù)定閾值的套圖集。
5.根據(jù)權(quán)利要求4所述的方法,根據(jù)所述網(wǎng)頁獲取至少一個套圖集的步驟還包括:選擇圖像數(shù)量大于預(yù)定閾值的套圖集。
6.根據(jù)權(quán)利要求4所述的方法,其中,面積波動率表示為S, 其中,S = (Imax-1min)/lave, Imax表示套圖集中的面積最大的圖像的面積,Imin表示套圖集中面積最小的圖像的面積,Iave表示套圖集中的圖像的面積的均值。
7.根據(jù)權(quán)利要求1所述的方法,還包括:根據(jù)下述因素中的至少一個因素從所述至少一個套圖集中選擇優(yōu)選的套圖集:關(guān)于套圖集中的圖像的描述文本與第一圖像的描述文本之間的相關(guān)性、套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)、對套圖集中的圖像中是否存在人臉的識別結(jié)果、在套圖集中的圖像中識別出的水印的數(shù)量。
8.一種搜索成套圖像的設(shè)備,包括: 接收單元,接收第一圖像; 圖像搜索單元,從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的第二圖像,其中,數(shù)據(jù)庫存儲有從網(wǎng)絡(luò)收集的圖像以及圖像所在的網(wǎng)頁; 網(wǎng)頁識別單元,從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁; 套圖集獲取單元,根據(jù)所述網(wǎng)頁獲取至少一個套圖集。
9.根據(jù)權(quán)利要求8所述的設(shè)置,其中,套圖集獲取單元包括: 網(wǎng)頁圖像獲取單元,獲取所述網(wǎng)頁的至少一級深度的鏈接指向的第三圖像; 篩選單元,從 第三圖像之中選擇面積大于預(yù)定閾值的第四圖像;分組單元,根據(jù)第四圖像的網(wǎng)址的構(gòu)成特征,對第四圖像進行分組,以獲得至少一個套圖集。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中,網(wǎng)頁圖像獲取單元獲取所述網(wǎng)頁中的圖像作為第二圖像, 其中,當所述網(wǎng)頁的至少一級深度的鏈接中存在表示翻頁的鏈接時,網(wǎng)頁圖像獲取單元獲取表示翻頁的鏈接所指向的網(wǎng)頁中的圖像作為第三圖像。
11.根據(jù)權(quán)利要求9所述的設(shè)備,其中,套圖集獲取單元還包括: 選擇單元,選擇 面積波動率小于預(yù)定閾值的套圖集。
12.根據(jù)權(quán)利要求11所述的設(shè)備,其中,選擇單元還選擇圖像數(shù)量大于預(yù)定閾值的套圖集。
13.根據(jù)權(quán)利要求11所述的設(shè)備,其中,面積波動率表示為S, 其中,S = (Imax-1min)/lave, Imax表示套圖集中的面積最大的圖像的面積,Imin表示套圖集中面積最小的圖像的面積,Iave表示套圖集中的圖像的面積的均值。
14.根據(jù)權(quán)利要求9所述的設(shè)備,還包括,優(yōu)選單元,根據(jù)下述因素中的至少一個因素從所述至少一個套圖集中選擇優(yōu)選的套圖集:關(guān)于套圖集中的圖像的描述文本與第一圖像的描述文本之間的相關(guān)性、套圖集中的圖像的數(shù)量、套圖集中的圖像的平均面積、套圖集中的圖像的面積波動率、套圖集中存在的不同的圖像長寬比的數(shù)量、套圖集所在站點權(quán)威度、套圖集中的圖像在互聯(lián)網(wǎng)上的引用數(shù)、對套圖集中的圖像中是否存在人臉的識別結(jié)果、在套圖集中的圖像中識別出的水印的數(shù)量。
15.一種在瀏覽圖像時提供成套圖像的方法,包括: 獲取當前正在瀏覽的圖像作為第一圖像; 基于第一圖像執(zhí)行權(quán)利要求1所述的搜索成套圖像的方法,以獲取至少一個套圖集; 提供獲取的至少一個套圖集。
全文摘要
一種搜索成套圖像的方法和設(shè)備。所述方法,包括接收第一圖像;從圖像數(shù)據(jù)庫中搜索與第一圖像相似和/或相同的第二圖像,其中,數(shù)據(jù)庫存儲有從網(wǎng)絡(luò)收集的圖像以及圖像所在的網(wǎng)頁;從圖像數(shù)據(jù)庫獲取每個第二圖像所在的網(wǎng)頁;根據(jù)所述網(wǎng)頁獲取至少一個套圖集。根據(jù)本發(fā)明,可以根據(jù)輸入的圖像搜索到關(guān)聯(lián)的成套圖像。
文檔編號G06F17/30GK103177100SQ20131009056
公開日2013年6月26日 申請日期2013年3月20日 優(yōu)先權(quán)日2013年3月20日
發(fā)明者丁銳, 付晴川, 郭榮鋒, 劉婷婷, 陶哲 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司