專利名稱:基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)中信息的搜索方法,尤其涉及互聯(lián)網(wǎng)中圖像和視頻等信息的圖 像搜索方法。
背景技術(shù):
伴隨著互聯(lián)網(wǎng)已經(jīng)日益成為日常生活中常用的、重要的信息來(lái)源,很多的電子商 務(wù)建立在互聯(lián)網(wǎng)信息的搜索引擎基礎(chǔ)之上而日益成長(zhǎng)、成熟。通常的模式是人們從海量信息中發(fā)現(xiàn)自己感興趣的某一類東西,然后利用通用 或垂直應(yīng)用類的搜索引擎去找到它們,接下來(lái)到電子商務(wù)網(wǎng)站去淘,即繼續(xù)用電子商務(wù)網(wǎng) 站提供的站內(nèi)搜索引擎去定位自己要買的特定東西。整個(gè)過程是消費(fèi)者思維和行為從粗到 細(xì)的過程,在這當(dāng)中搜索引擎起了非常關(guān)鍵的作用。在這種由信息到商務(wù)的過程中,用戶 的行為可以理解成被割裂成了三個(gè)階段首先,是信息的廣泛獲??;然后,是信息的精準(zhǔn)定 位;最后,是商務(wù)的實(shí)現(xiàn)。并且,各種各樣的服務(wù)是來(lái)自于不同的互聯(lián)網(wǎng)企業(yè),在這個(gè)轉(zhuǎn)換 過程中,人們的瞬時(shí)購(gòu)物沖動(dòng)往往會(huì)隨著沖浪時(shí)間的延續(xù)而逐漸流退,對(duì)于能夠用精確語(yǔ) 言文字描述的商品來(lái)講,這個(gè)過程還不是太痛苦,如購(gòu)買某某品牌的某某型號(hào)3C產(chǎn)品如手 機(jī)、電腦等,網(wǎng)頁(yè)的內(nèi)容提供商可以將描述產(chǎn)品的文字和搜索引擎鏈接起來(lái),從而使整個(gè)過 程平滑,用戶行為還是較為方便的。首先,對(duì)于購(gòu)買和圖像展示有密切關(guān)系的商品,如時(shí)尚和服飾類的產(chǎn)品,由于圖片 引用有版權(quán)的問題,不能夠?qū)D像拿來(lái)直接使用;同時(shí)用戶可能對(duì)一張圖片中的某某模特 穿著的衣服有興趣,而這完全超出了現(xiàn)有的文字搜索引擎和基于文字的圖像搜索引擎(對(duì) 圖像進(jìn)行標(biāo)簽處理,如Google的圖像搜索)的處理能力。然而,現(xiàn)在的搜索引擎巨擎,如 Google、Yahoo、百度等在開展的基于圖片文字標(biāo)識(shí)內(nèi)容的圖像搜索,其本質(zhì)還是文字搜索。其次,用戶在搜索到相關(guān)信息后,如何去進(jìn)一步滿足用戶商務(wù)需求也是個(gè)很大的 問題?,F(xiàn)在的搜索引擎巨擎,為了解決從內(nèi)容到商務(wù)的銜接,一般都開發(fā)了基于文本內(nèi)容的 垂直搜索購(gòu)物比價(jià)服務(wù),就是為了解決當(dāng)前搜索引擎仍然存在著查準(zhǔn)率太低、搜索結(jié)果充 斥著太多的無(wú)用信息的問題,而要想在對(duì)用戶更加直觀的如此龐大的圖像庫(kù)中找到用戶需 要的信息仍然充滿挑戰(zhàn)??梢姡壳按蠖鄶?shù)所謂的“圖像搜索”的圖像搜索引擎實(shí)質(zhì)上還是文本關(guān)鍵字搜 索,通常是從互聯(lián)網(wǎng)中搜集圖像,然后提取圖像所在網(wǎng)頁(yè)的一些文本信息來(lái)為圖像建立標(biāo) 簽索引,更簡(jiǎn)單的甚至只是提取圖像所在網(wǎng)頁(yè)的標(biāo)題作為圖像建立索引,用戶向搜索引擎 提交查詢時(shí),僅僅考慮查詢與預(yù)提取的信息的相似度并返回結(jié)果。而在真正的圖像搜索領(lǐng)域,目前有兩個(gè)層面欠考慮。第一在圖像識(shí)別的技術(shù)層面上,由于技術(shù)發(fā)展的限制,目前的解決方案更多的是 僅僅考慮了圖像的顏色分布、紋理分布,沒有考慮到其實(shí)圖像內(nèi)容的塊狀特征、形狀特征、 對(duì)比度特征等更多維的豐富信息在圖像識(shí)別中的作用,并運(yùn)用這些要素來(lái)豐富和構(gòu)建圖像 特征庫(kù)。
3
第二 在圖像搜索引擎的商務(wù)應(yīng)用層面,目前的圖像提交和結(jié)果排名方法往往采 用如文字搜索輸出結(jié)果一樣的較簡(jiǎn)單的方式,而且圖像搜索的查準(zhǔn)率還不太理想,并且僅 僅關(guān)注在準(zhǔn)確率上,沒有考慮用戶可能僅僅對(duì)所見圖像的部分感興趣,也沒有考慮到圖像 的版權(quán)問題,更沒有從用戶需求的角度去考慮到底用戶想通過圖像搜索服務(wù)獲得什么東 西。并且,現(xiàn)有的圖像搜索引擎幾乎都沒有考慮以下兩個(gè)情況1)圖像的版權(quán)問題,因?yàn)樽鳛閳D像搜索不可避免地會(huì)在后臺(tái)對(duì)圖像進(jìn)行處理,但 是通過網(wǎng)絡(luò)機(jī)器人找到被搜索圖像并直接存儲(chǔ)圖像作為模板是商業(yè)版權(quán)規(guī)定不可行的;2)圖像的焦點(diǎn)問題,以前的只考慮到利用圖像,沒有考慮到用戶可能只是對(duì)圖像 部分感興趣,而不是整個(gè)圖像,譬如兩個(gè)模特,用戶可以只對(duì)某個(gè)模特身上的服飾感興趣, 而不是用整個(gè)圖像來(lái)進(jìn)行搜索,僅僅是希望將服飾這部分圖像進(jìn)行搜索,從而找到提供相 似目標(biāo)的電子商務(wù)信息和商家。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于克服上述現(xiàn)有技術(shù)的不足,而提出一種圖像搜索引 擎的排名算法和電子商務(wù)結(jié)合的方法,它既充分借鑒已有的文本搜索引擎和用戶社區(qū)建設(shè) 較成熟的技術(shù),同時(shí)也考慮圖像固有的一些特點(diǎn),使得圖像搜索的結(jié)果具有較高的相關(guān)性, 更好地滿足用戶查詢的需求。本發(fā)明解決上述技術(shù)問題采用的技術(shù)方案是,提出一種基于網(wǎng)頁(yè)中圖像、視頻內(nèi) 容的圖像搜索方法,包括以下步驟一、接收?qǐng)D像搜索請(qǐng)求;二、搜索圖像預(yù)處理;三、歸一 化圖像搜索;四、目標(biāo)圖像搜索;五、用戶是否調(diào)整,是的話,設(shè)置歸一化真目標(biāo),并返回步 驟二,否則繼續(xù);六、用戶社區(qū)評(píng)測(cè);以及七、最終目標(biāo)圖像搜索列表。其中,步驟一包括采用網(wǎng)頁(yè)內(nèi)嵌和瀏覽器插件方式,截取網(wǎng)頁(yè)內(nèi)容所嵌圖像中所包含 的、用戶真正感興趣的目標(biāo)圖像。步驟二包括由后臺(tái)服務(wù)器對(duì)客戶上傳的目標(biāo)圖像內(nèi)容進(jìn)行分析與處理,即根據(jù) 目標(biāo)圖像的顏色、紋理、形狀、塊狀、對(duì)比度以及矢量特征構(gòu)建并保存該目標(biāo)圖像的樣本信 肩、ο步驟三包括對(duì)該目標(biāo)圖像的樣本信息進(jìn)行歸一化處理,得到歸一化真目標(biāo)。步驟四包括以該歸一化真目標(biāo)為比較對(duì)象,利用網(wǎng)絡(luò)機(jī)器人到定向的電子商務(wù) 網(wǎng)站進(jìn)行搜索,并按照相似度由高到低地建立目標(biāo)圖像搜索列表索引。步驟五包括提供用戶對(duì)歸一化真目標(biāo)進(jìn)行主動(dòng)修改的機(jī)會(huì)。步驟六包括根據(jù)用戶創(chuàng)建的內(nèi)容,動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)搜索結(jié)果。同現(xiàn)有技術(shù)相比,本發(fā)明的基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法,性能更 好,更智能,更實(shí)用。
圖1為本發(fā)明的基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法實(shí)施例的流程圖。圖2為本發(fā)明的基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法實(shí)施例的系統(tǒng)結(jié)構(gòu)示 意圖。
具體實(shí)施例方式以下結(jié)合各附圖所示之最佳實(shí)施例作進(jìn)一步詳述。本發(fā)明的基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法實(shí)施例,如圖1所示,包括 步驟10 接收?qǐng)D像搜索請(qǐng)求;步驟20 搜索圖像預(yù)處理;步驟30 歸一化圖像搜索;步驟 40 目標(biāo)圖像搜索;步驟50 用戶是否調(diào)整,是的話,設(shè)置歸一化真目標(biāo),并返回步驟二,否 則繼續(xù);步驟60 用戶社區(qū)評(píng)測(cè);以及步驟10 最終目標(biāo)圖像搜索列表。其中,步驟10具體涉及到原圖輸入來(lái)源來(lái)自網(wǎng)站內(nèi)容中的圖像,其中用戶提交圖像的輸入方式有以下兩 種網(wǎng)頁(yè)內(nèi)嵌用在網(wǎng)站上安裝插件的方式,給網(wǎng)頁(yè)上的圖像增加一個(gè)圖標(biāo)按鈕,用戶 點(diǎn)擊這個(gè)按鈕會(huì)浮出一個(gè)層,這個(gè)層會(huì)把原圖像用互動(dòng)動(dòng)畫的效果再顯示出來(lái),用戶可根 據(jù)自己的意愿框選圖片的任意部分進(jìn)行搜索,然后搜索引擎便會(huì)給出相關(guān)目標(biāo)的結(jié)果列表來(lái)。瀏覽器插件用在瀏覽器上安裝插件的方式,使任何網(wǎng)站的任何圖像都可以被用 戶框選進(jìn)行搜索,然后得到相關(guān)目標(biāo)列表。由于版權(quán)原因,即使合作伙伴有照片,也不能共享出使用,但是系統(tǒng)可以在網(wǎng)上 (定向網(wǎng)站聯(lián)盟如服飾等)通過網(wǎng)絡(luò)機(jī)器人去抓取,由于這個(gè)網(wǎng)站集合是有限的,因此對(duì)其 進(jìn)行定向圖像抓取是現(xiàn)實(shí)可行的。對(duì)于抓來(lái)的圖片,要帶有鏈接(合法)的可以,如GOOGLE的Image圖像搜索,但是 必須是以縮略圖的形式,并且圖片鏈接要指向到源圖地址。系統(tǒng)要開展可視化搜索,需要提取圖像的特征,因此系統(tǒng)存儲(chǔ)的圖片(放在非結(jié) 構(gòu)化數(shù)據(jù)庫(kù)中的)是一種介于原圖和縮略圖之間的,經(jīng)過處理了的符合要求的,而且還帶 有源圖鏈接指向的格式,這樣便可以合法存儲(chǔ)使用了。截取網(wǎng)頁(yè)內(nèi)容所嵌圖像中的感興趣內(nèi)容,這是所有工作的基礎(chǔ),可以采用網(wǎng)頁(yè)內(nèi) 嵌和瀏覽器插件方式實(shí)現(xiàn);從網(wǎng)頁(yè)內(nèi)容中提取圖像,這包括傳統(tǒng)互聯(lián)網(wǎng)和無(wú)線互聯(lián)網(wǎng)網(wǎng)頁(yè), 并獲取其中用戶感興趣的要進(jìn)行查詢搜索的圖像內(nèi)容,同時(shí)上傳到后臺(tái)服務(wù)器去處理。步驟20具體涉及到將輸入圖片的原有尺寸、格式調(diào)整為適合識(shí)別的規(guī)格;并按 照多種圖像特征來(lái)對(duì)上傳來(lái)的圖像進(jìn)行分析、閱讀,并按照系統(tǒng)期望的圖像特征來(lái)進(jìn)行計(jì) 算機(jī)存儲(chǔ)處理。對(duì)上傳到后臺(tái)服務(wù)器的圖像內(nèi)容進(jìn)行計(jì)算機(jī)分析并進(jìn)行存儲(chǔ)處理,這是后面計(jì)算 機(jī)人工智能來(lái)識(shí)別圖像的基礎(chǔ);為了更加精確的識(shí)別圖像并不漏過重要的圖像信息,可以 提取的圖像特征值有顏色、紋理、形狀、塊狀特征、對(duì)比度、矢量等以獲得目標(biāo)圖像的樣本 信息,也就是與一特定圖像對(duì)應(yīng)的特征庫(kù)。由于是由計(jì)算機(jī)來(lái)識(shí)別圖像,因此對(duì)圖像信息進(jìn) 行計(jì)算機(jī)處理來(lái)提取圖像自身關(guān)鍵特征顯得尤其重要,這樣會(huì)保證圖像信息描述的客觀和 穩(wěn)定,同時(shí)建立圖像信息庫(kù)以方便后續(xù)的圖像歸一化處理和模糊識(shí)別過程。顯而易見在實(shí) 際工程實(shí)現(xiàn)中為了保證信息的準(zhǔn)確和不遺漏圖像中的重要信息,特征越多越好,當(dāng)然和計(jì) 算機(jī)處理的復(fù)雜程度與處理能力速度要取得平衡。步驟30具體涉及到將上傳輸入來(lái)的圖像進(jìn)行分析并抽取圖像特征,然后和圖像庫(kù)中的圖像進(jìn)行匹配識(shí)別處理,找到歸一化的“真目標(biāo)”的標(biāo)準(zhǔn)圖像,來(lái)過濾掉上傳圖像時(shí) 圖像內(nèi)容環(huán)境的差異,如重影圖像、圖像部分、人工拍攝的圖像等。在這個(gè)過程中,如果上傳來(lái)的圖像沒有找到“真目標(biāo)“圖像,系統(tǒng)就直接進(jìn)入下面 的步驟進(jìn)行目標(biāo)圖像搜索;同時(shí)將這個(gè)圖像自動(dòng)設(shè)置為“代理” “真目標(biāo)”并建立一系列的 索引表,總之是將“代理” “真目標(biāo)”圖像和目標(biāo)圖像搜索得到的目標(biāo)圖像搜索結(jié)果列表的 “一對(duì)多”關(guān)系建立起來(lái)。對(duì)被選取的圖像或部分圖像內(nèi)容進(jìn)行歸一化處理,找到一個(gè)和用戶需求完全一致 或非常非常相似的圖像模板即“真目標(biāo)“,此步是后續(xù)繼續(xù)利用計(jì)算機(jī)網(wǎng)絡(luò)機(jī)器人到定向的 電子商務(wù)網(wǎng)站去搜索完全一樣或相似圖像內(nèi)容的基礎(chǔ)。所以要?dú)w一化是因?yàn)榧词故峭环?照片圖像,由于用戶是從不同網(wǎng)站的不同網(wǎng)頁(yè)中來(lái)截取圖像內(nèi)容,抑或用戶對(duì)一幅圖像的 其中某些感興趣目標(biāo)圖像要進(jìn)行搜索,如一個(gè)模特身上的穿著的一件服飾等,因此有必要 進(jìn)行圖像的歸一化處理以獲得“真目標(biāo)”這個(gè)元圖像。這是一步非常重要的“多對(duì)一”的圖 像精確識(shí)別處理過程,這里的多是指同一個(gè)目標(biāo)的圖像由于來(lái)源于多個(gè)不同的場(chǎng)景而造成 的所謂圖像搜索請(qǐng)求的多,或者說事實(shí)上這是不同來(lái)源圖像描述的是同一個(gè)目標(biāo)的圖像, 抑或說是“隱形”知識(shí)變成“顯性”知識(shí)。這是保證搜索引擎接受圖像搜索請(qǐng)求內(nèi)容一致性 或符合用戶圖像需求的不可缺少環(huán)節(jié),同時(shí)也是加快后面目標(biāo)圖像搜索的一個(gè)不可或缺的 步驟,對(duì)應(yīng)本質(zhì)是同樣的一幅圖像就沒有必要重復(fù)進(jìn)行目標(biāo)圖像搜索而直接輸出目標(biāo)圖像 搜索的結(jié)果列表。步驟40具體涉及到由于要到互聯(lián)網(wǎng)上去找相似結(jié)果,特別是為了保證搜索結(jié)果 的精確,在進(jìn)行圖像預(yù)處理的同時(shí),系統(tǒng)還會(huì)利用網(wǎng)絡(luò)機(jī)器人從圖像所在網(wǎng)頁(yè)內(nèi)容中抓取 的上下文關(guān)鍵字來(lái)分析以便配合圖像搜索,因此處理的工作量很大,為了提高響應(yīng)速度給 用戶更好的用戶體驗(yàn),經(jīng)過歸一化搜索過程的真目標(biāo)圖片對(duì)應(yīng)的結(jié)果會(huì)被緩存,當(dāng)下一次 進(jìn)行圖像搜索時(shí)就可以省略這個(gè)處理過程,這樣會(huì)大大加快圖像搜索的速度。對(duì)于那些完全新的搜索請(qǐng)求,即在系統(tǒng)中沒有真目標(biāo)的圖像或者說是上一步中提 到代理“真目標(biāo)”圖像,目標(biāo)圖像搜索過程同樣還是會(huì)進(jìn)行,這顯得尤其重要,但是為了防止 圖像搜索結(jié)果的偏差性太大(從圖像搜索的角度看圖像特征幾乎一樣,而且這是不可避免 的),系統(tǒng)會(huì)給用戶一個(gè)參與評(píng)判的機(jī)會(huì),如讓用戶協(xié)助設(shè)置圖像搜索“真目標(biāo)“圖像。這是一次真正意義上的目標(biāo)圖像搜索,因此要輸出對(duì)用戶有真正意義的搜索結(jié) 果,并且是要執(zhí)行“一對(duì)多”的所謂“模糊”目標(biāo)搜索策略,因此這里運(yùn)用的圖像特征值選取 和前面的歸一化處理時(shí)是不一樣的。目標(biāo)圖像搜索及搜索結(jié)果預(yù)處理,這里依然是圖像搜索,但是由于是基于歸一化 真目標(biāo)基礎(chǔ)的“一對(duì)多”圖像搜索,因此這里利用的圖像特征值和前面歸一化圖像搜索要用 到的圖像特征值是不一樣的,按照?qǐng)D像相似度由高到低在系統(tǒng)平臺(tái)內(nèi)部建立目標(biāo)圖像搜索 列表索引;由于人們對(duì)事物的認(rèn)識(shí)和決策是從粗到細(xì)的過程,因此用戶在看到感興趣的圖 像時(shí)首先需要的是和目標(biāo)圖像相似和與或相近的結(jié)果來(lái)輔助進(jìn)行下一步?jīng)Q策。這一步是 接近用戶需求的“一對(duì)多”的圖像模糊識(shí)別處理過程,這里的多是指多個(gè)相似和或相近的結(jié) 果;為了能夠更加精確地描述,系統(tǒng)也借助圖像所在網(wǎng)頁(yè)內(nèi)容的上下文關(guān)鍵字信息來(lái)輔助, 使目標(biāo)圖像搜索結(jié)果更精確。步驟50具體涉及到兩種情況,第一種情況,如果用戶滿意,即以代理“真目標(biāo)”為起點(diǎn)的目標(biāo)圖像搜索結(jié)果列表滿足用戶需求,系統(tǒng)就自動(dòng)將代理“真目標(biāo)”設(shè)置為“真目 標(biāo)”,今后的此圖像搜索請(qǐng)求模板就歸一化成這個(gè)“真目標(biāo)”。第二種情況,如果用戶不滿意, 那么用戶會(huì)在眾多目標(biāo)圖像搜索結(jié)果中選取一個(gè)最滿意的為“真目標(biāo)”,并自動(dòng)開始重復(fù)從 步驟二的搜索過程。通常情況下,由于真目標(biāo)庫(kù)足夠大,經(jīng)過歸一化圖像搜索和目標(biāo)圖像搜索,搜索結(jié) 果會(huì)相對(duì)精確滿足用戶需求;但是考慮到如果有一個(gè)新目標(biāo),或其圖像和現(xiàn)有的真目標(biāo)圖 像有顯著差異,就可以認(rèn)為這也是一個(gè)新目標(biāo),如從上拍攝的一個(gè)黑白相間棒球帽和從側(cè) 面拍攝的一個(gè)黑白相間棒球帽,即使有很大概率在目標(biāo)圖像搜索結(jié)果中會(huì)同時(shí)輸出這兩個(gè) 結(jié)果,在這里系統(tǒng)也還是給用戶一個(gè)自我調(diào)整搜索結(jié)果的機(jī)會(huì),用戶在眾多搜索結(jié)果中找 打自己認(rèn)為最符合實(shí)際情況的圖像如是一頂從側(cè)面拍攝的黑白相間棒球帽,進(jìn)而進(jìn)行迭代 搜索,系統(tǒng)自動(dòng)將這個(gè)圖像“側(cè)面拍攝的一頂黑白相間棒球帽“設(shè)置為歸一化的”真目標(biāo)“圖 像,并重新開始一個(gè)新的歸一化和目標(biāo)圖像搜索過程,以保證結(jié)果的準(zhǔn)確性和唯一性。這個(gè)目的是為了使搜索過程和搜索結(jié)果能夠智能化并有自我學(xué)習(xí)能力,能夠按照 圖像相似度由高到低返回給用戶,以實(shí)現(xiàn)對(duì)用戶而言有價(jià)值的靜態(tài)和動(dòng)態(tài)電子商務(wù)信息排 名目標(biāo)列表??紤]到圖像搜索的特殊性,這里給用戶一次修正搜索請(qǐng)求的機(jī)會(huì),再輸出目標(biāo)圖 像搜索列表給用戶進(jìn)行確認(rèn)結(jié)果或根據(jù)需要來(lái)重新設(shè)置圖像搜索的“真目標(biāo)”;譬如有一個(gè) 用戶第一次提交一個(gè)黑白相間棒球帽圖像搜索,在眾多搜索結(jié)果中之一可能會(huì)是一個(gè)黑白 相間的皮球,這時(shí)為了強(qiáng)化系統(tǒng)的自學(xué)習(xí)能力并在下次搜索結(jié)果中不會(huì)出現(xiàn)偏差性大的結(jié) 果,系統(tǒng)給用戶一個(gè)作選擇的機(jī)會(huì)來(lái)設(shè)置歸一化真目標(biāo)黑白相間棒球帽,并重新進(jìn)行目標(biāo) 圖像搜索,這樣搜索結(jié)果會(huì)更接近用戶期望;將來(lái)第二次有人提交一個(gè)黑白相間棒球帽圖 像搜索時(shí),系統(tǒng)能夠非??斓氐玫阶詈蟮哪繕?biāo)圖像搜索結(jié)果列表。步驟60具體涉及到更新搜索結(jié)果有以下三種更新方式系統(tǒng)周期更新系統(tǒng)會(huì) 周期性地對(duì)緩存中的數(shù)據(jù)進(jìn)行必要的更新。用戶社區(qū)(UGC)用戶更新對(duì)于通過系統(tǒng)圖像 搜索得到的“真目標(biāo)“和目標(biāo)圖像以及對(duì)應(yīng)的目標(biāo)圖像搜索結(jié)果,用戶可以根據(jù)自己的意愿 和需要進(jìn)行一些更新操作。如對(duì)有些用戶不滿意的目標(biāo)結(jié)果,提供刪除功能,用戶可刪除 該目標(biāo),然后系統(tǒng)中會(huì)保存用戶更新后的信息。CPC或其它商業(yè)模式更新調(diào)整系統(tǒng)采用競(jìng) 價(jià)排名的形式顯示目標(biāo)圖像列表,按單次點(diǎn)擊費(fèi)用高低進(jìn)行排名;商家可設(shè)置當(dāng)次點(diǎn)擊費(fèi) 用以調(diào)整排名。為了改進(jìn)搜索結(jié)果更人性化,更能夠反應(yīng)現(xiàn)實(shí)生活情況,在這里借用并采納了互 聯(lián)網(wǎng)用戶社區(qū)UGC的概念,進(jìn)一步動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)搜索結(jié)果,以使搜索結(jié)果能夠更真實(shí),并給 用戶推薦相應(yīng)的電子商務(wù)服務(wù)提供商鏈接,以幫助實(shí)施電子商務(wù)。譬如一個(gè)黑白相間棒球 帽搜索出來(lái)的是黑白相間的便帽,這時(shí)用戶可以選擇將這個(gè)結(jié)果從搜索目標(biāo)列表中刪除, 這樣在下次黑白相間棒球帽的圖像搜索結(jié)果中就不會(huì)出現(xiàn)這個(gè)內(nèi)容,大大加快搜索的速 度,用戶的體驗(yàn)會(huì)更好。經(jīng)過用戶調(diào)整后的搜索結(jié)果會(huì)比較真實(shí)地反映用戶的需求,并且 時(shí)尚行業(yè)用戶在瀏覽網(wǎng)頁(yè)時(shí),一般會(huì)對(duì)時(shí)尚等相關(guān)圖像即非傳統(tǒng)的用幾個(gè)關(guān)鍵詞能夠描述 的內(nèi)容進(jìn)行搜索時(shí),即使有一個(gè)以相似度為基礎(chǔ)的統(tǒng)一搜索結(jié)果,但是可能并不能滿足社 區(qū)大多數(shù)所有用戶,結(jié)合互聯(lián)網(wǎng)的發(fā)展,現(xiàn)在基于用戶社區(qū)的口口相傳營(yíng)銷模式是現(xiàn)實(shí)電 子商務(wù)實(shí)現(xiàn)過程中必須考慮的要素,因此引入U(xiǎn)GC概念即用戶自助的方式來(lái)再一次調(diào)整排
7名,按照受歡迎程度,以實(shí)現(xiàn)動(dòng)態(tài)電子商務(wù)信息和服務(wù)排名是有現(xiàn)實(shí)意義的。步驟70具體涉及到將搜索結(jié)構(gòu),以列表的方式,呈現(xiàn)給用戶。如圖2所示,用以實(shí)現(xiàn)本發(fā)明的基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法的系 統(tǒng)結(jié)構(gòu)包括表現(xiàn)層、業(yè)務(wù)層和數(shù)據(jù)層的分層機(jī)構(gòu),其中,數(shù)據(jù)層可以進(jìn)一步劃分為三大部 分業(yè)務(wù)數(shù)據(jù)包含商家、產(chǎn)品、通道、業(yè)務(wù)等方面的數(shù)據(jù)。動(dòng)態(tài)索引數(shù)據(jù)通過目標(biāo)圖像搜 索過程建立搜索圖像與目標(biāo)圖像搜索列表的索引,并且索引可以被將來(lái)的搜索引用;同時(shí) 目標(biāo)圖像搜索列表可以被用戶修改,以達(dá)到系統(tǒng)自學(xué)習(xí)目的。靜態(tài)圖片數(shù)據(jù)從類型上可分 為真目標(biāo)圖像、搜索圖像;從查看方式上可分為原圖和縮略圖兩種。相對(duì)現(xiàn)有技術(shù),本發(fā)明的基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法的有益之處 在于通過圖像的“多對(duì)一”的歸一化處理和“一對(duì)多”的目標(biāo)圖像搜索,整合靜態(tài)排名 和動(dòng)態(tài)排名部分并引入用戶參與的UGC概念,使搜索結(jié)果更能夠反映出實(shí)際的電子商務(wù)情 況;可以很好地解決圖像的版權(quán)問題和圖像的焦點(diǎn)問題。通過新引入增加了整個(gè)圖像內(nèi)容中的塊狀特征、對(duì)比度、矢量等特征,并根據(jù)實(shí)際 情況綜合使用這些特征,這樣能夠更好的描述一幅圖像,為后面精確識(shí)別圖像打下現(xiàn)實(shí)可 行的基礎(chǔ)。通過采用動(dòng)態(tài)和靜態(tài)的結(jié)合來(lái)解決圖像搜索的準(zhǔn)確性不如純文本的搜索的問題, 同時(shí)給用戶一個(gè)修正自己提交請(qǐng)求的一個(gè)機(jī)會(huì);進(jìn)而引入用戶社區(qū)UCG建設(shè)的概念是為了 更客觀地將圖像按相似度由高到低返回給用戶。總之,本發(fā)明的方法包含如何幫助用戶在瀏覽網(wǎng)頁(yè)內(nèi)容時(shí)利用感興趣的圖片或視 頻內(nèi)容作為搜索請(qǐng)求,去搜索更多的相似內(nèi)容;同時(shí)反饋給用戶的內(nèi)容是按照用戶上傳提 供的圖像相似度、相關(guān)度組織、并以電子商務(wù)廠家的目標(biāo)鏈接列表的形式展現(xiàn),其中含有靜 態(tài)排名和動(dòng)態(tài)排名概念;并綜合考慮電子商務(wù)服務(wù)提供商受歡迎程度,借助用戶社區(qū)評(píng)價(jià) 的理念整合了 UGC技術(shù)即用戶自助動(dòng)態(tài)調(diào)整排名,最后按照CPC或CPS的模式實(shí)現(xiàn)電子商 務(wù)。該方法較現(xiàn)有的方法具有更佳的性能、智能性、實(shí)用性。本發(fā)明之實(shí)施,并不限于以上最佳實(shí)施例所公開的方式,凡基于上述設(shè)計(jì)思路,進(jìn) 行簡(jiǎn)單推演與替換,得到的具體的,都屬于本發(fā)明的實(shí)施。
權(quán)利要求
一種基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法,其特征在于,包括以下步驟一、接收?qǐng)D像搜索請(qǐng)求;二、搜索圖像預(yù)處理;三、歸一化圖像搜索;四、目標(biāo)圖像搜索;五、用戶是否調(diào)整,是的話,設(shè)置歸一化真目標(biāo),并返回步驟二,否則繼續(xù);六、用戶社區(qū)評(píng)測(cè);以及,七、最終目標(biāo)圖像搜索列表。
2.如權(quán)利要求1所述的圖像搜索方法,其特征在于,該步驟一包括采用網(wǎng)頁(yè)內(nèi)嵌和瀏 覽器插件方式,截取網(wǎng)頁(yè)內(nèi)容所嵌圖像中所包含的、用戶真正感興趣的目標(biāo)圖像。
3.如權(quán)利要求2所述的圖像搜索方法,其特征在于,該步驟二包括由后臺(tái)服務(wù)器對(duì)客 戶上傳的目標(biāo)圖像內(nèi)容進(jìn)行分析與處理,即根據(jù)目標(biāo)圖像的顏色、紋理、形狀、塊狀、對(duì)比度 以及矢量特征構(gòu)建并保存該目標(biāo)圖像的樣本信息。
4.如權(quán)利要求3所述的圖像搜索方法,其特征在于,該步驟三包括對(duì)該目標(biāo)圖像的樣 本信息進(jìn)行歸一化處理,得到歸一化真目標(biāo)。
5.如權(quán)利要求4所述的圖像搜索方法,其特征在于,該步驟四包括以該歸一化真目標(biāo) 為比較對(duì)象,利用網(wǎng)絡(luò)機(jī)器人到定向的電子商務(wù)網(wǎng)站進(jìn)行搜索,并按照相似度由高到低地 建立目標(biāo)圖像搜索列表索引。
6.如權(quán)利要求5所述的圖像搜索方法,其特征在于,該步驟五包括提供用戶對(duì)歸一化 真目標(biāo)進(jìn)行主動(dòng)修改的機(jī)會(huì)。
7.如權(quán)利要求6所述的圖像搜索方法,其特征在于,該步驟六包括根據(jù)用戶創(chuàng)建的內(nèi) 容,動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)搜索結(jié)果。
全文摘要
本發(fā)明涉及一種基于網(wǎng)頁(yè)中圖像、視頻內(nèi)容的圖像搜索方法,包括以下步驟一、接收?qǐng)D像搜索請(qǐng)求;二、搜索圖像預(yù)處理;三、歸一化圖像搜索;四、目標(biāo)圖像搜索;五、用戶是否調(diào)整,是的話,設(shè)置歸一化真目標(biāo),并返回步驟二,否則繼續(xù);六、用戶社區(qū)評(píng)測(cè);以及七、最終目標(biāo)圖像搜索列表。性能更好,更智能,更實(shí)用。
文檔編號(hào)G06F17/30GK101957825SQ200910108788
公開日2011年1月26日 申請(qǐng)日期2009年7月17日 優(yōu)先權(quán)日2009年7月17日
發(fā)明者談璽 申請(qǐng)人:談璽