本發(fā)明涉及網(wǎng)絡(luò)搜索技術(shù)領(lǐng)域,特別是涉及一種服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的方法,及一種服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的裝置。
背景技術(shù):
用戶在移動終端上輸入搜索關(guān)鍵詞時,不僅僅傾向于查看與搜索關(guān)鍵詞相關(guān)的文字信息,如博客文章、新聞報道文章、書籍文章等。例如,用戶輸入搜索關(guān)鍵詞“xx水怪”時,更傾向于瀏覽與搜索關(guān)鍵詞“xx水怪”相關(guān)的圖片。搜索引擎將搜索到的與搜索關(guān)鍵詞相關(guān)的標題、文字摘要和站點生成搜索結(jié)果頁面供用戶查看,標題或文字摘要鏈接到搜索結(jié)果的詳情頁面,用戶可以通過點擊標題或摘要進入詳情頁面查看具體的內(nèi)容。而采用目前的搜索結(jié)果展現(xiàn)方式,在搜索結(jié)果頁面中無法看出詳情頁面中是否有圖,也無法獲知詳情頁面中的圖片與搜索關(guān)鍵詞是否相關(guān)。因此,導(dǎo)致用戶反復(fù)點擊標題或摘要進入詳情頁面查看具體的內(nèi)容,增加了用戶查看與搜索關(guān)鍵詞相關(guān)的圖片的時間成本和反復(fù)查看無用的詳情頁面中的內(nèi)容的流量成本。
技術(shù)實現(xiàn)要素:
為克服上述技術(shù)問題或者至少部分地解決上述技術(shù)問題,特提出以下技術(shù)方案:
本發(fā)明的一個實施例提出了一種服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的方法,包括:
接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;
根據(jù)所述搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索, 其中,所述圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息;
獲得與所述搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將所述圖片以縮略圖片的方式返回至所述終端設(shè)備,以用于向用戶顯示。
可選地,所述接收用戶輸入的搜索關(guān)鍵詞之前,還包括:
對搜索引擎抓取的圖片進行內(nèi)容分析和/或?qū)λ鰣D片所在網(wǎng)頁的文本進行分析,獲得所述圖片的文本信息。
優(yōu)選地,對所述圖片所在網(wǎng)頁的文本進行分析,包括:
對所述圖片所在網(wǎng)頁的結(jié)構(gòu)化字段中的文本進行分析,所述圖片所在網(wǎng)頁的結(jié)構(gòu)化字段包括所述網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段和/或圖片屬性字段。
優(yōu)選地,對搜索引擎抓取的圖片進行內(nèi)容分析,包括:
對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的至少一種進行分析。
優(yōu)選地,將所述圖片以縮略圖片的方式返回至所述終端設(shè)備,包括:
對所述圖片進行縮略圖粒度化處理,生成相應(yīng)的縮略圖片;
將所述縮略圖片返回至所述終端設(shè)備。
優(yōu)選地,將所述圖片以縮略圖片的方式返回至所述終端設(shè)備,具體包括:
將所述縮略圖與相應(yīng)的文本信息相關(guān)聯(lián)的返回至所述終端設(shè)備。
本發(fā)明的另一實施例提出了一種服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的裝置,包括:
接收模塊,用于接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;
搜索模塊,用于根據(jù)所述搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,所述圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息;
返回模塊,用于獲得與所述搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將所述圖片以縮略圖片的方式返回至所述終端設(shè)備,以用于向用戶顯示。
可選地,所述接收模塊之前,該裝置還包括:
分析模塊,用于對搜索引擎抓取的圖片進行內(nèi)容分析和/或?qū)λ鰣D片所在網(wǎng)頁的文本進行分析,獲得所述圖片的文本信息。
優(yōu)選地,所述分析模塊包括:
第一分析單元,用于對所述圖片所在網(wǎng)頁的結(jié)構(gòu)化字段中的文本進行分析,所述圖片所在網(wǎng)頁的結(jié)構(gòu)化字段包括所述網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段和/或圖片屬性字段。
優(yōu)選地,所述分析模塊包括:
第二分析單元,用于對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的至少一種進行分析。
優(yōu)選地,所述返回模塊包括:
圖片生成單元,用于對所述圖片進行縮略圖粒度化處理,生成相應(yīng)的縮略圖片;
圖片返回單元,用于將所述縮略圖片返回至所述終端設(shè)備。
優(yōu)選地,所述返回模塊具體用于:將所述縮略圖與相應(yīng)的文本信息相關(guān)聯(lián)的返回至所述終端設(shè)備。
本發(fā)明解決了如何準確且快速地查找到與搜索關(guān)鍵詞相匹配的圖片信息的問題,同時,可保證后續(xù)在不增加用戶查看與搜索關(guān)鍵詞相關(guān)的圖片的時間成本和節(jié)省查看圖片所消耗的網(wǎng)絡(luò)流量成本的情況下,有效的向終端設(shè)備用戶提供與用戶輸入的搜索關(guān)鍵詞相匹配的圖片和與圖片相應(yīng)的文本信息的問題。首先,接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;接著,根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息,預(yù)先對在互聯(lián)網(wǎng)抓取到的圖片進行內(nèi)容分析獲得文本信息,并將圖片和與其想應(yīng)的圖片文本信息相應(yīng)的存儲在預(yù)先建立的圖片文本信息的索引中,避免了索引庫中的圖片與其附屬文本信息不對應(yīng)甚至缺少文本信息描述的情況,從而方便后續(xù)對圖片進行搜索;獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶展示與搜索關(guān)鍵詞匹配的索引對應(yīng)的縮略圖片;將縮略圖發(fā)送至終端設(shè)備相較于將正常規(guī)格的圖片發(fā)送至終端設(shè)備可大大降低網(wǎng)絡(luò)流量的耗費, 進一步地節(jié)省了用戶查看圖片的流量成本。
本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1為本發(fā)明實施例的服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的方法的流程示意圖;
圖2為本發(fā)明一個優(yōu)選實施例的服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的方法的流程示意圖;
圖3為本發(fā)明實施例的服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進一步理解的是,本發(fā)明的說明書中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個或多個其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應(yīng)該理解,當我們稱元件被“連接”或“耦接”到另一元件時,它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無線連接或無線耦接。這里使用的措辭“和/或”包括一個或更多個相關(guān)聯(lián)的列出項的全部或任一單元和全部組合。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語 (包括技術(shù)術(shù)語和科學術(shù)語),具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語,應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣被特定定義,否則不會用理想化或過于正式的含義來解釋。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,這里所使用的“終端”、“終端設(shè)備”既包括無線信號接收器的設(shè)備,其僅具備無發(fā)射能力的無線信號接收器的設(shè)備,又包括接收和發(fā)射硬件的設(shè)備,其具有能夠在雙向通信鏈路上,進行雙向通信的接收和發(fā)射硬件的設(shè)備。這種設(shè)備可以包括:蜂窩或其他通信設(shè)備,其具有單線路顯示器或多線路顯示器或沒有多線路顯示器的蜂窩或其他通信設(shè)備;pcs(personalcommunicationsservice,個人通信系統(tǒng)),其可以組合語音、數(shù)據(jù)處理、傳真和/或數(shù)據(jù)通信能力;pda(personaldigitalassistant,個人數(shù)字助理),其可以包括射頻接收器、尋呼機、互聯(lián)網(wǎng)/內(nèi)聯(lián)網(wǎng)訪問、網(wǎng)絡(luò)瀏覽器、記事本、日歷和/或gps(globalpositioningsystem,全球定位系統(tǒng))接收器;常規(guī)膝上型和/或掌上型計算機或其他設(shè)備,其具有和/或包括射頻接收器的常規(guī)膝上型和/或掌上型計算機或其他設(shè)備。這里所使用的“終端”、“終端設(shè)備”可以是便攜式、可運輸、安裝在交通工具(航空、海運和/或陸地)中的,或者適合于和/或配置為在本地運行,和/或以分布形式,運行在地球和/或空間的任何其他位置運行。這里所使用的“終端”、“終端設(shè)備”還可以是通信終端、上網(wǎng)終端、音樂/視頻播放終端,例如可以是pda、mid(mobileinternetdevice,移動互聯(lián)網(wǎng)設(shè)備)和/或具有音樂/視頻播放功能的移動電話,也可以是智能電視、機頂盒等設(shè)備。
圖1為本發(fā)明實施例的服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的方法的流程示意圖。
步驟s110:接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;步驟s120:根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息;步驟s130:獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶顯示。
步驟s110:接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞。
具體地,用戶可以在終端設(shè)備中的人機交互界面提供的搜索關(guān)鍵詞輸入對話框中輸入搜索關(guān)鍵詞;終端設(shè)備將用戶輸入的搜索關(guān)鍵詞發(fā)送至服務(wù)器;服務(wù)器接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞。
可選地,在接收用戶輸入的搜索關(guān)鍵詞的步驟之前,該方法還包括步驟s140(圖中未標出):步驟s140:對搜索引擎抓取的圖片進行內(nèi)容分析和/或?qū)D片所在網(wǎng)頁的文本進行分析,獲得圖片的文本信息。
需要說明的是,在預(yù)先建立的圖片文本信息的索引中相關(guān)聯(lián)地存儲有多張圖片、各張圖片的文本信息,文本可為圖片各自對應(yīng)的圖片關(guān)鍵詞。預(yù)先建立的圖片文本信息的索引中相關(guān)聯(lián)地存儲的多張圖片和各張圖片的文本信息是依靠于對搜索引擎蜘蛛在互聯(lián)網(wǎng)中爬取到的圖片進行內(nèi)容分析和/或?qū)D片所在網(wǎng)頁的文本進行分析得到的。具體地,搜索引擎會根據(jù)網(wǎng)站的robots文件對其網(wǎng)站頁面進行抓取,同時搜索引擎蜘蛛也會進入首頁根據(jù)首頁的鏈接進行爬取。它可以根據(jù)網(wǎng)站地圖直接爬取內(nèi)容頁,在爬行一個頁面后,搜索引擎可以下載網(wǎng)站內(nèi)容。
優(yōu)選地,對圖片所在網(wǎng)頁的文本進行分析的步驟包括:對圖片所在網(wǎng)頁的結(jié)構(gòu)化字段中的文本進行分析,圖片所在網(wǎng)頁的結(jié)構(gòu)化字段包括網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段和/或圖片屬性字段。
需要說明的是,搜索引擎可以對圖片所在網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段和/或圖片屬性字段中的文本進行分析,從而自動識別跟網(wǎng)站頁面中的圖片相匹配的文字描述。
例如,頁面內(nèi)文章是一篇報道手機上市的新聞,該新聞的配圖是一部手機的圖片。搜索引擎可以對該配圖所在網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段中的文本進行分析,識別出該配圖所在網(wǎng)頁的網(wǎng)頁標題字段是“第n代xx手機于2015年12月23日上市”,該配圖所在網(wǎng)頁的新聞內(nèi)容字段中包括標識信息為“xx手機”的錨文本字段;搜索引擎還可以對上述配圖所在網(wǎng)頁的圖片屬性字段中的文本進行分析,識別出圖片屬性字段包括“手機”,并將圖片屬性字段“手機”作為上述配圖對應(yīng)的圖片關(guān)鍵詞與該配圖和其所在網(wǎng)頁的網(wǎng)頁標題字段“第n代xx手機于2015年12月 23日上市”、包括標識信息為“xx手機”的錨文本字段相關(guān)聯(lián)地存儲在預(yù)先建立的圖片文本信息的索引中。
優(yōu)選地,對搜索引擎抓取的圖片進行內(nèi)容分析的步驟包括:對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的至少一種進行分析。
通常地,圖片中包括物體、風景、人物和文字中的一種或多種物體。相應(yīng)地,可以對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的一種或多種信息進行分析。
需要說明的是,對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的一種或多種信息的分析操作可以依靠于對圖片的特征進行分析操作;圖片的特征包括但不限于:顏色特征、紋理特征、形狀特征和空間關(guān)系特征。
具體地,顏色特征是一種全局特征,描述了搜索圖片或搜索圖片中局部區(qū)域所對應(yīng)的物體的表面性質(zhì)。顏色特征是基于像素點的特征,所有屬于搜索圖片或搜索圖片中局部區(qū)域的像素相結(jié)合以形成完整的顏色特征。顏色直方圖是最常用的表達顏色特征的方法,通過常用的顏色空間:rgb顏色空間、hsv顏色空間來對顏色特征進行描述。
紋理特征也是一種全局特征,它也描述了搜索圖片或搜索圖片中局部區(qū)域所對應(yīng)物體的表面性質(zhì)。與顏色特征不同,紋理特征不是基于像素點的特征,其需要在包含多個像素點的區(qū)域中進行統(tǒng)計計算。作為一種統(tǒng)計特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對于噪聲有較強的抵抗能力。
形狀特征包括兩類表示方法:一類是輪廓特征,另一類是區(qū)域特征。圖像的輪廓特征主要關(guān)注物體的外邊界,而圖像的區(qū)域特征則關(guān)系到整個形狀區(qū)域。常用的提取圖片形狀特征的方法包括:邊界特征法,該方法通過對邊界特征的描述來獲取圖像的形狀參數(shù);傅里葉形狀描述符法,通過物體邊界的傅里葉變換作為形狀描述,可由邊界點導(dǎo)出三種形狀表達,分別是曲率函數(shù)、質(zhì)心距離、復(fù)坐標函數(shù);幾何參數(shù)法,形狀的表達和匹配采用更為簡單的區(qū)域特征描述方法,例如采用有關(guān)形狀定量測度(如矩、面積、周長等)的形狀參數(shù)法(shapefactor)。
空間關(guān)系特征是指圖像中分割出來的多個目標之間的相互的空間位置或相對方向關(guān)系,這些關(guān)系也可分為連接關(guān)系、鄰接關(guān)系、交疊關(guān)系、重疊關(guān)系、包含關(guān)系、包容關(guān)系等。通??臻g位置信息可以分為兩類:相對空間位置信息和絕對空間位置信息。前一種關(guān)系強調(diào)的是目標之間的相對情況,如上下左右關(guān)系等;后一種關(guān)系強調(diào)的是目標之間的距離大小以及方位??臻g關(guān)系特征的使用可加強對搜索圖像內(nèi)容的描述區(qū)分能力。常用的提取圖像空間關(guān)系特征可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征,并建立索引;另一種方法則簡單地將圖像均勻地劃分為若干規(guī)則子塊,然后對每個圖像子塊提取特征,并建立索引。
因此,通過對搜索引擎抓取的圖片的顏色特征、紋理特征、形狀特征和空間關(guān)系特征的分析操作可以確定圖片中的物體信息、風景信息、人物信息和文字信息的一種或多種信息。
步驟s120:根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息。
將通過步驟s140獲得的圖片的文本信息和與其對應(yīng)的圖片相關(guān)聯(lián)地存儲在預(yù)先建立的圖片文本信息的索引中,在接收到來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞時,可以根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索。
例如,用戶m在終端設(shè)備w中的人機交互界面提供的搜索關(guān)鍵詞輸入對話框中輸入搜索關(guān)鍵詞“xx手機樣式”;終端設(shè)備w將用戶m輸入的搜索關(guān)鍵詞“xx手機樣式”發(fā)送至服務(wù)器;服務(wù)器接收來自終端設(shè)備w的用戶m輸入的搜索關(guān)鍵詞“xx手機樣式”;在預(yù)先建立的圖片文本信息的索引中預(yù)先相關(guān)聯(lián)地存儲海量的在互聯(lián)網(wǎng)抓取的圖片和與其相應(yīng)的圖片文本信息,服務(wù)器可以在在預(yù)先建立的圖片文本信息的索引中對搜索關(guān)鍵詞“xx手機樣式”進行搜索。
步驟s130:獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶顯示。
優(yōu)選地,如圖2所示,將圖片以縮略圖片的方式返回至終端設(shè)備的步驟包括步驟s231和步驟s232:步驟s231:對圖片進行縮略圖粒度化處理,生成相應(yīng)的縮略圖片;步驟s232:將縮略圖片返回至終端設(shè)備。
例如,接上例,服務(wù)器在在預(yù)先建立的圖片文本信息的索引中對搜索關(guān)鍵詞“xx手機樣式”進行搜索;查找到多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片文本信息包括“xx手機上市”、“xx手機價格”、“xx手機外觀”、“xx手機性能”,將其分別對應(yīng)的圖片確定為與搜索關(guān)鍵詞“xx手機樣式”匹配的索引對應(yīng)的多張圖片;分別對查找到的多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的多張圖片進行縮略圖粒度化處理,生成與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的多張縮略圖片,并將多張縮略圖片返回至終端設(shè)備w;終端設(shè)備w接收到來自服務(wù)器的多張與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片的縮略圖片,將該多個縮略圖片在人機交互界面以預(yù)定的方式如在終端設(shè)備w的屏幕上方每排展示10個一共展示5排的方式向用戶m展示。
優(yōu)選地,將圖片以縮略圖片的方式返回至終端設(shè)備的步驟具體包括:將縮略圖與相應(yīng)的文本信息相關(guān)聯(lián)的返回至終端設(shè)備。
例如,服務(wù)器在在預(yù)先建立的圖片文本信息的索引中對搜索關(guān)鍵詞“xx手機樣式”進行搜索;查找到多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片文本信息包括“xx手機上市”、“xx手機價格”、“xx手機外觀”、“xx手機性能”等的相應(yīng)的圖片;在分別對查找到的多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片進行縮略處理后,將多個縮略圖片與其對應(yīng)的包括“xx手機上市”、“xx手機價格”、“xx手機外觀”、“xx手機性能”等文本信息分別相關(guān)聯(lián)的返回至終端設(shè)備w。
本發(fā)明的技術(shù)方案解決了如何準確且快速地查找到與搜索關(guān)鍵詞相匹配的圖片信息的問題,同時,可保證后續(xù)在不增加用戶查看與搜索關(guān)鍵詞相關(guān)的圖片的時間成本和節(jié)省查看圖片所消耗的網(wǎng)絡(luò)流量成本的情況下,有效的向終端設(shè)備用戶提供與用戶輸入的搜索關(guān)鍵詞相匹配的圖片和與圖片相應(yīng)的文本信息的問題。首先,接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;接著,根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進 行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息,預(yù)先對在互聯(lián)網(wǎng)抓取到的圖片進行內(nèi)容分析獲得文本信息,并將圖片和與其想應(yīng)的圖片文本信息相應(yīng)的存儲在預(yù)先建立的圖片文本信息的索引中,避免了索引庫中的圖片與其附屬文本信息不對應(yīng)甚至缺少文本信息描述的情況,從而方便后續(xù)對圖片進行搜索;獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶展示與搜索關(guān)鍵詞匹配的索引對應(yīng)的縮略圖片;將縮略圖發(fā)送至終端設(shè)備相較于將正常規(guī)格的圖片發(fā)送至終端設(shè)備可大大降低網(wǎng)絡(luò)流量的耗費,進一步地節(jié)省了用戶查看圖片的流量成本。
圖3為本發(fā)明實施例的服務(wù)器中獲取與搜索關(guān)鍵詞相匹配的圖片的裝置的結(jié)構(gòu)示意圖。
接收模塊310接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;搜索模塊320根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息;返回模塊330獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶顯示。
接收模塊310接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞。
具體地,用戶可以在終端設(shè)備中的人機交互界面提供的搜索關(guān)鍵詞輸入對話框中輸入搜索關(guān)鍵詞;終端設(shè)備將用戶輸入的搜索關(guān)鍵詞發(fā)送至服務(wù)器;服務(wù)器接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞。
可選地,在接收模塊310接收用戶輸入的搜索關(guān)鍵詞之前,該裝置還包括分析模塊340(圖中未標出):分析模塊340對搜索引擎抓取的圖片進行內(nèi)容分析和/或?qū)D片所在網(wǎng)頁的文本進行分析,獲得圖片的文本信息。
需要說明的是,在預(yù)先建立的圖片文本信息的索引中相關(guān)聯(lián)地存儲有多張圖片、各張圖片的文本信息,文本可為圖片各自對應(yīng)的圖片關(guān)鍵詞。預(yù)先建立的圖片文本信息的索引中相關(guān)聯(lián)地存儲的多張圖片和各張圖片的文本信息是依靠于對搜索引擎蜘蛛在互聯(lián)網(wǎng)中爬取到的圖片進行內(nèi)容分析和/或?qū)D片所在網(wǎng)頁的文本進行分析得到的。具體地,搜索引擎會 根據(jù)網(wǎng)站的robots文件對其網(wǎng)站頁面進行抓取,同時搜索引擎蜘蛛也會進入首頁根據(jù)首頁的鏈接進行爬取。它可以根據(jù)網(wǎng)站地圖直接爬取內(nèi)容頁,在爬行一個頁面后,搜索引擎可以下載網(wǎng)站內(nèi)容。
優(yōu)選地,分析模塊340包括第一分析模塊341(圖中未標出):第一分析模塊341對圖片所在網(wǎng)頁的結(jié)構(gòu)化字段中的文本進行分析,圖片所在網(wǎng)頁的結(jié)構(gòu)化字段包括網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段和/或圖片屬性字段。
需要說明的是,搜索引擎可以對圖片所在網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段和/或圖片屬性字段中的文本進行分析,從而自動識別跟網(wǎng)站頁面中的圖片相匹配的文字描述。
例如,頁面內(nèi)文章是一篇報道手機上市的新聞,該新聞的配圖是一部手機的圖片。搜索引擎可以對該配圖所在網(wǎng)頁的網(wǎng)頁標題字段、錨文本字段中的文本進行分析,識別出該配圖所在網(wǎng)頁的網(wǎng)頁標題字段是“第n代xx手機于2015年12月23日上市”,該配圖所在網(wǎng)頁的新聞內(nèi)容字段中包括標識信息為“xx手機”的錨文本字段;搜索引擎還可以對上述配圖所在網(wǎng)頁的圖片屬性字段中的文本進行分析,識別出圖片屬性字段包括“手機”,并將圖片屬性字段“手機”作為上述配圖對應(yīng)的圖片關(guān)鍵詞與該配圖和其所在網(wǎng)頁的網(wǎng)頁標題字段“第n代xx手機于2015年12月23日上市”、包括標識信息為“xx手機”的錨文本字段相關(guān)聯(lián)地存儲在預(yù)先建立的圖片文本信息的索引中。
優(yōu)選地,分析模塊340包括第二分析模塊342(圖中未標出):第二分析模塊342對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的至少一種進行分析。
通常地,圖片中包括物體、風景、人物和文字中的一種或多種物體。相應(yīng)地,可以對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的一種或多種信息進行分析。
需要說明的是,對搜索引擎抓取的圖片中的物體信息、風景信息、人物信息和文字信息中的一種或多種信息的分析操作可以依靠于對圖片的特征進行分析操作;圖片的特征包括但不限于:顏色特征、紋理特征、形 狀特征和空間關(guān)系特征。
具體地,顏色特征是一種全局特征,描述了搜索圖片或搜索圖片中局部區(qū)域所對應(yīng)的物體的表面性質(zhì)。顏色特征是基于像素點的特征,所有屬于搜索圖片或搜索圖片中局部區(qū)域的像素相結(jié)合以形成完整的顏色特征。顏色直方圖是最常用的表達顏色特征的方法,通過常用的顏色空間:rgb顏色空間、hsv顏色空間來對顏色特征進行描述。
紋理特征也是一種全局特征,它也描述了搜索圖片或搜索圖片中局部區(qū)域所對應(yīng)物體的表面性質(zhì)。與顏色特征不同,紋理特征不是基于像素點的特征,其需要在包含多個像素點的區(qū)域中進行統(tǒng)計計算。作為一種統(tǒng)計特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對于噪聲有較強的抵抗能力。
形狀特征包括兩類表示方法:一類是輪廓特征,另一類是區(qū)域特征。圖像的輪廓特征主要關(guān)注物體的外邊界,而圖像的區(qū)域特征則關(guān)系到整個形狀區(qū)域。常用的提取圖片形狀特征的方法包括:邊界特征法,該方法通過對邊界特征的描述來獲取圖像的形狀參數(shù);傅里葉形狀描述符法,通過物體邊界的傅里葉變換作為形狀描述,可由邊界點導(dǎo)出三種形狀表達,分別是曲率函數(shù)、質(zhì)心距離、復(fù)坐標函數(shù);幾何參數(shù)法,形狀的表達和匹配采用更為簡單的區(qū)域特征描述方法,例如采用有關(guān)形狀定量測度(如矩、面積、周長等)的形狀參數(shù)法(shapefactor)。
空間關(guān)系特征是指圖像中分割出來的多個目標之間的相互的空間位置或相對方向關(guān)系,這些關(guān)系也可分為連接關(guān)系、鄰接關(guān)系、交疊關(guān)系、重疊關(guān)系、包含關(guān)系、包容關(guān)系等。通??臻g位置信息可以分為兩類:相對空間位置信息和絕對空間位置信息。前一種關(guān)系強調(diào)的是目標之間的相對情況,如上下左右關(guān)系等;后一種關(guān)系強調(diào)的是目標之間的距離大小以及方位。空間關(guān)系特征的使用可加強對搜索圖像內(nèi)容的描述區(qū)分能力。常用的提取圖像空間關(guān)系特征可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征,并建立索引;另一種方法則簡單地將圖像均勻地劃分為若干規(guī)則子塊,然后對每個圖像子塊提取特征,并建立索引。
因此,通過對搜索引擎抓取的圖片的顏色特征、紋理特征、形狀特征 和空間關(guān)系特征的分析操作可以確定圖片中的物體信息、風景信息、人物信息和文字信息的一種或多種信息。
搜索模塊320根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息。
將通過分析模塊340獲得的圖片的文本信息和與其對應(yīng)的圖片相關(guān)聯(lián)地存儲在預(yù)先建立的圖片文本信息的索引中,在接收到來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞時,可以根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索。
例如,用戶m在終端設(shè)備w中的人機交互界面提供的搜索關(guān)鍵詞輸入對話框中輸入搜索關(guān)鍵詞“xx手機樣式”;終端設(shè)備w將用戶m輸入的搜索關(guān)鍵詞“xx手機樣式”發(fā)送至服務(wù)器;服務(wù)器接收來自終端設(shè)備w的用戶m輸入的搜索關(guān)鍵詞“xx手機樣式”;在預(yù)先建立的圖片文本信息的索引中預(yù)先相關(guān)聯(lián)地存儲海量的在互聯(lián)網(wǎng)抓取的圖片和與其相應(yīng)的圖片文本信息,服務(wù)器可以在在預(yù)先建立的圖片文本信息的索引中對搜索關(guān)鍵詞“xx手機樣式”進行搜索。
返回模塊330獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶顯示。
優(yōu)選地,返回模塊330包括圖片生成單元331(圖中未標出)和圖片返回單元332(圖中未標出):圖片生成單元331對圖片進行縮略圖粒度化處理,生成相應(yīng)的縮略圖片;圖片返回單元332將縮略圖片返回至終端設(shè)備。
例如,接上例,服務(wù)器在在預(yù)先建立的圖片文本信息的索引中對搜索關(guān)鍵詞“xx手機樣式”進行搜索;查找到多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片文本信息包括“xx手機上市”、“xx手機價格”、“xx手機外觀”、“xx手機性能”,將其分別對應(yīng)的圖片確定為與搜索關(guān)鍵詞“xx手機樣式”匹配的索引對應(yīng)的多張圖片;分別對查找到的多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的多張圖片進行縮略圖粒度化處理,生成與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的多張縮略圖片,并將多張 縮略圖片返回至終端設(shè)備w;終端設(shè)備w接收到來自服務(wù)器的多張與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片的縮略圖片,將該多個縮略圖片在人機交互界面以預(yù)定的方式如在終端設(shè)備w的屏幕上方每排展示10個一共展示5排的方式向用戶m展示。
優(yōu)選地,返回模塊330具體用于:將縮略圖與相應(yīng)的文本信息相關(guān)聯(lián)的返回至終端設(shè)備。
例如,服務(wù)器在在預(yù)先建立的圖片文本信息的索引中對搜索關(guān)鍵詞“xx手機樣式”進行搜索;查找到多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片文本信息包括“xx手機上市”、“xx手機價格”、“xx手機外觀”、“xx手機性能”等的相應(yīng)的圖片;在分別對查找到的多個與搜索關(guān)鍵詞“xx手機樣式”相應(yīng)的圖片進行縮略處理后,將多個縮略圖片與其對應(yīng)的包括“xx手機上市”、“xx手機價格”、“xx手機外觀”、“xx手機性能”等文本信息分別相關(guān)聯(lián)的返回至終端設(shè)備w。
本發(fā)明的技術(shù)方案解決了如何準確且快速地查找到與搜索關(guān)鍵詞相匹配的圖片信息的問題,同時,可保證后續(xù)在不增加用戶查看與搜索關(guān)鍵詞相關(guān)的圖片的時間成本和節(jié)省查看圖片所消耗的網(wǎng)絡(luò)流量成本的情況下,有效的向終端設(shè)備用戶提供與用戶輸入的搜索關(guān)鍵詞相匹配的圖片和與圖片相應(yīng)的文本信息的問題。首先,接收來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞;接著,根據(jù)搜索關(guān)鍵詞在預(yù)先建立的圖片文本信息的索引中進行搜索,其中,圖片文本信息包括對搜索引擎抓取的圖片進行內(nèi)容分析獲得的文本信息,預(yù)先對在互聯(lián)網(wǎng)抓取到的圖片進行內(nèi)容分析獲得文本信息,并將圖片和與其想應(yīng)的圖片文本信息相應(yīng)的存儲在預(yù)先建立的圖片文本信息的索引中,避免了索引庫中的圖片與其附屬文本信息不對應(yīng)甚至缺少文本信息描述的情況,從而方便后續(xù)對圖片進行搜索;獲得與搜索關(guān)鍵詞匹配的索引對應(yīng)的圖片,并將圖片以縮略圖片的方式返回至終端設(shè)備,以用于向用戶展示與搜索關(guān)鍵詞匹配的索引對應(yīng)的縮略圖片;將縮略圖發(fā)送至終端設(shè)備相較于將正常規(guī)格的圖片發(fā)送至終端設(shè)備可大大降低網(wǎng)絡(luò)流量的耗費,進一步地節(jié)省了用戶查看圖片的流量成本。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明包括涉及用于執(zhí)行本申請中所 述操作中的一項或多項的設(shè)備。這些設(shè)備可以為所需的目的而專門設(shè)計和制造,或者也可以包括通用計算機中的已知設(shè)備。這些設(shè)備具有存儲在其內(nèi)的計算機程序,這些計算機程序選擇性地激活或重構(gòu)。這樣的計算機程序可以被存儲在設(shè)備(例如,計算機)可讀介質(zhì)中或者存儲在適于存儲電子指令并分別耦聯(lián)到總線的任何類型的介質(zhì)中,所述計算機可讀介質(zhì)包括但不限于任何類型的盤(包括軟盤、硬盤、光盤、cd-rom、和磁光盤)、rom(read-onlymemory,只讀存儲器)、ram(randomaccessmemory,隨即存儲器)、eprom(erasableprogrammableread-onlymemory,可擦寫可編程只讀存儲器)、eeprom(electricallyerasableprogrammableread-onlymemory,電可擦可編程只讀存儲器)、閃存、磁性卡片或光線卡片。也就是,可讀介質(zhì)包括由設(shè)備(例如,計算機)以能夠讀的形式存儲或傳輸信息的任何介質(zhì)。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以用計算機程序指令來實現(xiàn)這些結(jié)構(gòu)圖和/或框圖和/或流圖中的每個框以及這些結(jié)構(gòu)圖和/或框圖和/或流圖中的框的組合。本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以將這些計算機程序指令提供給通用計算機、專業(yè)計算機或其他可編程數(shù)據(jù)處理方法的處理器來實現(xiàn),從而通過計算機或其他可編程數(shù)據(jù)處理方法的處理器來執(zhí)行本發(fā)明公開的結(jié)構(gòu)圖和/或框圖和/或流圖的框或多個框中指定的方案。
本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的步驟、措施、方案可以被交替、更改、組合或刪除。進一步地,具有本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的其他步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。進一步地,現(xiàn)有技術(shù)中的具有與本發(fā)明中公開的各種操作、方法、流程中的步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。
以上所述僅是本發(fā)明的部分實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。