一種獲得視覺詞詞典、圖像檢索的方法及裝置制造方法

文檔序號(hào)：6508867閱讀：522來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種獲得視覺詞詞典、圖像檢索的方法及裝置制造方法
【專利摘要】本申請(qǐng)公開了一種獲得視覺詞詞典、圖像檢索的方法及裝置，所述獲得視覺詞詞典的方法包括：提取圖像庫(kù)中圖像的視覺特征并加以聚類，得到視覺詞詞典；從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為所述視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；將所述停用詞從所述視覺詞詞典中去除。本申請(qǐng)通過分析第一圖像信息內(nèi)容，根據(jù)視覺詞詞典來提取視覺詞，并進(jìn)行統(tǒng)計(jì)，獲取那些僅僅反映第一圖像信息，而不是商品外形、款式、元素的視覺詞，作為停用詞，有效地規(guī)避了第一圖像信息對(duì)檢索結(jié)果的干擾，提高了服裝和/或服飾類商品圖像同款檢索的查全率和查準(zhǔn)率，提高了用戶檢索結(jié)果的準(zhǔn)確性。
【專利說明】—種獲得視覺詞詞典、圖像檢索的方法及裝置

【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及圖像搜索領(lǐng)域，尤其涉及一種獲得視覺詞詞典、圖像檢索的方法及裝置。

【背景技術(shù)】
[0002]目前在圖像搜索領(lǐng)域，如何從海量的圖像庫(kù)中快速準(zhǔn)確的找到滿足用戶需求的圖像，是一個(gè)需迫切解決的關(guān)鍵問題。傳統(tǒng)的基于文本的檢索方式存在著嚴(yán)重的問題:首先，目前的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)無法自動(dòng)對(duì)圖像進(jìn)行語(yǔ)義標(biāo)注；其次，圖像中所包含的豐富的視覺特征也無法用文本進(jìn)行客觀準(zhǔn)確的描述。
[0003]為了克服這些問題，基于內(nèi)容的圖像檢索技術(shù)應(yīng)運(yùn)而生?；趦?nèi)容的圖像檢索技術(shù)通過提取圖像中用戶感興趣的特征，轉(zhuǎn)化為視覺詞，對(duì)用戶輸入的圖像在海量圖像集中進(jìn)行檢索，實(shí)現(xiàn)真正的基于圖像內(nèi)容特征的檢索。然而，將基于內(nèi)容的圖像檢索技術(shù)應(yīng)用到服裝和/或服飾類商品圖片同款檢索中時(shí)，遇到了新的問題:
[0004]基于內(nèi)容的圖像檢索方式，可以使用類似SIFT (Scale-1nvariant FeatureTransform,尺度不變特征轉(zhuǎn)換)這樣的局部特征生成視覺詞，以視覺詞來表達(dá)圖像的內(nèi)容，作為相似性判斷的依據(jù)。SIFT局部特征提取方法，對(duì)于視覺上變化分明的角、邊等元素有強(qiáng)烈的響應(yīng)，很容易在計(jì)算中被標(biāo)記為顯著點(diǎn)，從而提取出視覺詞。并且，這種方法并沒有區(qū)分不同的視覺詞表達(dá)的是圖像中的什么內(nèi)容，而是同等對(duì)待，認(rèn)為都可以表達(dá)圖像中的語(yǔ)義內(nèi)容。
[0005]在圖像檢索中，為了取得需要的效果，有時(shí)會(huì)希望在檢索時(shí)可以忽略指定類別的圖像信息。例如，對(duì)服裝和/或服飾圖像中大量存在的格子、波點(diǎn)、條紋等重復(fù)出現(xiàn)的紋理圖案，都具備視覺上變化分明的角、邊等元素，因此，這些圖案區(qū)域會(huì)被提取到大量的視覺詞。但是，這些視覺詞僅僅反映了商品圖片中的圖像信息，而不是款式信息。在進(jìn)行檢索匹配計(jì)算時(shí)，如果兩張圖像有相似的紋理圖案，則可能具有大量相同的視覺詞，造成計(jì)算得到的相似度很高，會(huì)降低乃至淹沒反映款式信息的視覺詞在相似性度量中的權(quán)重，將圖案類似但款式不同的商品誤判為同款商品。

【發(fā)明內(nèi)容】

[0006]本申請(qǐng)要解決的技術(shù)問題是提供一種獲得視覺詞詞典、圖像檢索的方法及裝置，可以提聞圖像檢索準(zhǔn)確性。
[0007]為解決上述技術(shù)問題，本申請(qǐng)的一種獲得視覺詞詞典的方法，包括:
[0008]提取圖像庫(kù)中圖像的視覺特征并加以聚類，得到視覺詞詞典；
[0009]從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為所述視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；
[0010]將所述停用詞從所述視覺詞詞典中去除。
[0011]進(jìn)一步地，所述從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，包括:
[0012]采用人工方式，從所述圖像庫(kù)中挑選出具有所述第一圖像信息的多幅圖像，分別挖取其中包含第一圖像信息的圖像區(qū)域并存儲(chǔ)為所述第一圖像，從所述第一圖像中提取視覺特征。
[0013]進(jìn)一步地，一種圖像檢索的方法，包括:
[0014]啟動(dòng)對(duì)輸入圖像的檢索，所述檢索針對(duì)第二圖像信息；
[0015]從所述輸入圖像和待匹配圖像分別提取視覺特征，使用去除了停用詞的視覺詞詞典將提取的視覺特征量化為視覺詞；
[0016]根據(jù)從所述輸入圖像和待匹配圖像得到的視覺詞判斷待匹配圖像是否與輸入圖像匹配，將匹配到的圖像作為所述輸入圖像的檢索結(jié)果；
[0017]其中，所述停用詞是第一圖像信息對(duì)應(yīng)的視覺特征量化得到的視覺詞，所述第二圖像信息不同于第一圖像信息。
[0018]進(jìn)一步地，所述去除了停用詞的視覺詞詞典根據(jù)上述獲得視覺詞詞典的方法的方法得到。
[0019]進(jìn)一步地，所述第一圖像信息包括重復(fù)紋理圖案；所述第二圖像信息是服裝和/或服飾類商品圖像款式。
[0020]進(jìn)一步地，一種獲得視覺詞詞典的裝置，包括:詞典生成模塊和停用模塊，其中:
[0021]所述詞典生成模塊，用于提取圖像庫(kù)中圖像的視覺特征并加以聚類，得到視覺詞詞典；
[0022]所述停用模塊，用于從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為所述視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；將所述停用詞從所述視覺詞詞典中去除。
[0023]進(jìn)一步地，所述停用模塊從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，包括:采用人工方式，從所述圖像庫(kù)中挑選出具有所述第一圖像信息的多幅圖像，分別挖取其中包含第一圖像信息的圖像區(qū)域并存儲(chǔ)為所述第一圖像，從所述第一圖像中提取視覺特征。
[0024]進(jìn)一步地，一種圖像檢索的裝置，包括:圖像處理模塊和檢索模塊，其中:
[0025]所述圖像處理模塊，用于啟動(dòng)對(duì)輸入圖像的檢索，所述檢索針對(duì)第二圖像信息，從所述輸入圖像和待匹配圖像分別提取視覺特征，使用去除了停用詞的視覺詞詞典將提取的視覺特征量化為視覺詞；
[0026]所述檢索模塊，用于根據(jù)從所述輸入圖像和待匹配圖像得到的視覺詞判斷待匹配圖像是否與輸入圖像匹配，將匹配到的圖像作為所述輸入圖像的檢索結(jié)果；
[0027]其中，所述停用詞是第一圖像信息對(duì)應(yīng)的視覺特征量化得到的視覺詞，所述第二圖像信息不同于第一圖像信息。
[0028]進(jìn)一步地，所述去除了停用詞的視覺詞詞典采用上述獲得視覺詞詞典的裝置得到。
[0029]進(jìn)一步地，所述第一圖像信息包括重復(fù)紋理圖案；所述第二圖像信息是服裝和/或服飾類商品圖像款式。
[0030]綜上所述，本申請(qǐng)通過分析第一圖像信息內(nèi)容，根據(jù)視覺詞詞典來提取視覺詞，并進(jìn)行統(tǒng)計(jì)，獲取那些僅僅反映第一圖像信息，而不是商品外形、款式、元素的視覺詞，作為停用詞，在做相似性度量時(shí)不予采納，有效地規(guī)避了第一圖像信息對(duì)檢索結(jié)果的干擾，提高了服裝和/或服飾類商品圖像同款檢索的查全率和查準(zhǔn)率，提高了用戶檢索結(jié)果的準(zhǔn)確性，尋找在視覺特征上滿足用戶要求的商品，幫助用戶找到真正想要的商品，可以改善商品搜索的用戶體驗(yàn)，提高用戶的搜索滿意度。

【專利附圖】

【附圖說明】
[0031]圖1為本申請(qǐng)的獲得視覺詞詞典的方法的流程圖；
[0032]圖2為本申請(qǐng)的圖像檢索的方法的流程圖；
[0033]圖3為本申請(qǐng)的獲得視覺詞詞典的裝置的架構(gòu)圖；
[0034]圖4為本申請(qǐng)的圖像檢索的裝置的架構(gòu)圖。

【具體實(shí)施方式】
[0035]為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白，下文中將結(jié)合附圖對(duì)本申請(qǐng)的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是，在不沖突的情況下，本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
[0036]在本申請(qǐng)一個(gè)典型的配置中，所涉及的計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
[0037]內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器，隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式，如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
[0038]計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括，但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶，磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì)，可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定，計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
[0039]本申請(qǐng)查找那些僅僅反映重復(fù)紋理圖案，而不是服裝和/或服飾款式的視覺詞，設(shè)置為停用詞，檢索時(shí)棄置不用。
[0040]圖1是本申請(qǐng)的獲得視覺詞詞典的方法，該方法包括:
[0041]步驟101:對(duì)圖像庫(kù)中的全部或部分圖像，提取圖像的視覺特征，對(duì)提取的視覺特征進(jìn)行聚類獲得視覺詞詞典；
[0042]本實(shí)施例中，圖像庫(kù)是指服裝和/或服飾類商品圖像庫(kù)，當(dāng)然本申請(qǐng)并不限定于針對(duì)服裝和/或服飾類商品圖像，其他本領(lǐng)域技術(shù)人員可以理解的物體圖像均在本申請(qǐng)保護(hù)范圍之內(nèi)，所述圖像庫(kù)也可以指其他商品、物體圖像庫(kù)。提取圖像的視覺特征可以是提取SIFT特征，包括:在商品圖像中，利用SIFT方法提取圖像的局部特征，得到圖像中具有旋轉(zhuǎn)不變性和尺度不變性的SIFT特征點(diǎn)，也稱為關(guān)鍵像素點(diǎn)。在一個(gè)示例中，以每個(gè)關(guān)鍵像素點(diǎn)為中心，選取四周的64個(gè)像素點(diǎn)，每相鄰的4個(gè)像素為一像素組，共得到16個(gè)像素組，每個(gè)像素組再與關(guān)鍵像素點(diǎn)比較得到8個(gè)坐標(biāo)值，共得到128個(gè)坐標(biāo)值，該128個(gè)坐標(biāo)值為關(guān)鍵像素點(diǎn)的SIFT特征。然后，對(duì)提取的視覺特征進(jìn)行聚類獲得視覺詞詞典，可以采用已有方法，以上述示例獲取的SIFT特征為例，可以利用K-means方法將提取的視覺特征聚類為K類，每一個(gè)類中的SIFT特征平均后求得一個(gè)中心，這個(gè)中心是一個(gè)128維的向量，這K個(gè)中心就是視覺詞樹根節(jié)點(diǎn)的K個(gè)分支；然后對(duì)根節(jié)點(diǎn)的某個(gè)分支(記為當(dāng)前節(jié)點(diǎn))，再將屬于該分支的SIFT特征用K-means方法聚類為K類，從而得到當(dāng)前節(jié)點(diǎn)的K個(gè)分支，重復(fù)這一過程，直到樹的深度達(dá)到m，得到的樹的最后一層，也就是沒有分支的這一層，稱為葉子結(jié)點(diǎn)，每個(gè)葉子節(jié)點(diǎn)中存儲(chǔ)一個(gè)128維的向量,每個(gè)葉子節(jié)點(diǎn)就是一個(gè)視覺詞,對(duì)葉子節(jié)點(diǎn)依次進(jìn)行編號(hào)，所有葉子節(jié)點(diǎn)的集合組成視覺詞詞典。
[0043]假設(shè)現(xiàn)在有三張圖像imgl，img2和img3，希望建立一個(gè)具有四個(gè)視覺詞的視覺詞詞典。
[0044](I)對(duì)三張圖像提取SIFT特征，假設(shè)三張圖像分別有3個(gè)，4個(gè)和5個(gè)SIFT特征(每個(gè)SIFT特征都是一個(gè)128維的向量)；
[0045](2)將3+4+5=12個(gè)特征,通過k-means聚類方法聚集成4類,每個(gè)類具有I個(gè)或者多個(gè)SIFT特征；
[0046](3)每個(gè)類的所有SIFT特征求平均值，記為類的中心，每個(gè)類的中心都是一個(gè)128維的向量，則這4個(gè)中心就是4個(gè)視覺詞的內(nèi)容。這樣就獲得了視覺詞詞典中所有的4個(gè)視覺詞:vwl,vw2,vw3和vw4,每個(gè)詞的內(nèi)容就是上面提到的128維的向量,至此,就獲得了視覺詞詞典。
[0047]視覺詞詞典可以采用以下方式記錄，其中，key(m，n)表示第m個(gè)視覺詞的第η個(gè)分量，每個(gè)key (m, η)都是一個(gè)浮點(diǎn)型變量:
[0048]vw1: key (I, I), key (I, 2), key (I, 3),…,key (I, 128);
[0049]vw2: key (2, I), key (2, 2), key (2, 3),…,key (2, 128);
[0050]vw3: key (3, I), key (3, 2), key (3, 3),…,key (3, 128);
[0051 ] vw4: key (4, I), key (4, 2), key (4，3)，…，key (4, 128);
[0052]步驟102:從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；
[0053]其中，從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，可以包括:
[0054]采用人工方式，從圖像庫(kù)中挑選出具有第一圖像信息的多幅圖像，分別挖取其中包含第一圖像信息的圖像區(qū)域，存儲(chǔ)為第一圖像，從第一圖像中提取視覺特征。在一個(gè)示例中，上述第一圖像信息包括重復(fù)紋理圖案。此時(shí)是采用人工的方式，從服裝和/或服飾類商品圖像庫(kù)中挑選出若干具有重復(fù)紋理圖案(比如格子、波點(diǎn)、條紋等)的圖像，手工挖取其中的重復(fù)紋理圖案的圖像區(qū)域，保存為第一圖像，再?gòu)乃龅谝粓D像中提取視覺特征。
[0055]在一示例中，將從第一圖像中提取的視覺特征如SIFT特征量化為視覺詞的過程，包括:將SIFT特征(I個(gè)128維的向量)與視覺詞詞典的根節(jié)點(diǎn)的K個(gè)分支節(jié)點(diǎn)(也是一個(gè)128維的向量)分別計(jì)算歐氏距離，將此SIFT特征歸屬到距離最小的那個(gè)節(jié)點(diǎn)。重復(fù)此過程，直到此SIFT特征歸屬到某個(gè)葉子節(jié)點(diǎn)。稱此SIF特征“命中” 了某葉子節(jié)點(diǎn)，該葉子節(jié)點(diǎn)對(duì)應(yīng)的編號(hào)就是此SIFT特征的視覺詞號(hào)。
[0056]統(tǒng)計(jì)各視覺詞出現(xiàn)的頻率，那些出現(xiàn)頻率高于預(yù)定值的視覺詞，就是表征重復(fù)紋理圖案的視覺詞。在一個(gè)示例中，設(shè)手工挖取的樣本為N，若某個(gè)視覺詞在至少N/5張圖像中出現(xiàn)，則判定其為停用詞。
[0057]步驟103:將停用詞從視覺詞詞典中去除。
[0058]具體地，可以將停用詞從視覺詞詞典中刪除，也可以是置為無效，使停用詞不參與相似度計(jì)算；例如，在第一圖像信息為重復(fù)紋理圖案時(shí)，將反映重復(fù)紋理圖案的視覺詞，在先前生成的視覺詞詞典中去除。
[0059]如圖2所示，本申請(qǐng)的圖像檢索的方法，包括:
[0060]步驟201:啟動(dòng)對(duì)輸入圖像的檢索，檢索針對(duì)第二圖像信息；
[0061]第二圖像信息不同于第一圖像信息。第一圖像信息可以包括重復(fù)紋理圖案；第二圖像信息是服裝和/或服飾類商品圖像款式。當(dāng)然本申請(qǐng)并不限定于針對(duì)服裝和/或服飾類商品圖像款式檢索，其他本領(lǐng)域技術(shù)人員可以理解的物體圖像的檢索均在本申請(qǐng)保護(hù)范圍之內(nèi)。
[0062]步驟202:從輸入圖像和待匹配圖像分別提取視覺特征，使用去除了停用詞的視覺詞詞典將提取的視覺特征量化為視覺詞；
[0063]停用詞是第一圖像信息對(duì)應(yīng)的視覺特征量化得到的視覺詞。去除了停用詞的視覺詞詞典是根據(jù)上述獲得視覺詞詞典的方法得到。
[0064]步驟203:根據(jù)從輸入圖像和待匹配圖像得到的視覺詞判斷待匹配圖像是否與輸入圖像匹配，將匹配到的圖像作為所述輸入圖像的檢索結(jié)果。
[0065]在進(jìn)行服裝和/或服飾類商品圖像同款檢索時(shí)，使用去除了停用詞的視覺詞詞典將輸入圖像和待匹配圖像中提取的視覺特征量化為視覺詞。針對(duì)服裝和/或服飾類商品圖像同款檢索這個(gè)需求而言，用戶并不關(guān)心兩張圖像中圖案的相似性，更多關(guān)注的是圖像中商品的款式。使用去除了停用詞的視覺詞詞典用于服裝和/或服飾類商品圖像的同款檢索時(shí)，就不會(huì)受到重復(fù)紋理圖案的影響，使得檢索的結(jié)果能夠真正反映款式信息，有效地提高了圖像檢索的查全查準(zhǔn)率，大大提升用戶的滿意度。
[0066]圖3是本實(shí)施例的獲得視覺詞詞典的裝置，包括:詞典生成模塊和停用模塊，其中:
[0067]詞典生成模塊，用于提取圖像庫(kù)中圖像的視覺特征并加以聚類，得到視覺詞詞血.ZN ?
[0068]停用模塊，用于從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；將停用詞從視覺詞詞典中去除。
[0069]停用模塊從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，包括:采用人工方式，從圖像庫(kù)中挑選出具有第一圖像信息的多幅圖像，分別挖取其中包含第一圖像信息的圖像區(qū)域并存儲(chǔ)為所述第一圖像，從第一圖像中提取視覺特征。
[0070]圖4本實(shí)施例的圖像檢索的裝置，包括:圖像處理模塊和檢索模塊，其中:
[0071]圖像處理模塊，用于啟動(dòng)對(duì)輸入圖像的檢索，檢索針對(duì)第二圖像信息，從輸入圖像和待匹配圖像分別提取視覺特征，使用去除了停用詞的視覺詞詞典將提取的視覺特征量化為視覺詞；
[0072]檢索模塊，用于根據(jù)從輸入圖像和待匹配圖像得到的視覺詞判斷待匹配圖像是否與輸入圖像匹配，將匹配到的圖像作為輸入圖像的檢索結(jié)果。
[0073]第二圖像信息不同于第一圖像信息。第一圖像信息可以包括重復(fù)紋理圖案；第二圖像信息是服裝和/或服飾類商品圖像款式。當(dāng)然本申請(qǐng)并不限定于針對(duì)服裝和/或服飾類商品圖像款式檢索，其他本領(lǐng)域技術(shù)人員可以理解的物體圖像的檢索均在本申請(qǐng)保護(hù)范圍之內(nèi)。
[0074]停用詞是第一圖像信息對(duì)應(yīng)的視覺特征量化得到的視覺詞。去除了停用詞的視覺詞詞典采用權(quán)利要求6的裝置得到。
[0075]綜上所述，本申請(qǐng)的圖像檢索方法是在語(yǔ)義聚類的基礎(chǔ)上，根據(jù)圖像視覺內(nèi)容，對(duì)視覺詞的表達(dá)意義進(jìn)行分類，去掉那些不反映服裝和/或服飾的款式信息，而且會(huì)對(duì)同款檢索產(chǎn)生干擾的視覺詞，從而在檢索過程中能夠快速、準(zhǔn)確的從圖像內(nèi)容千差萬(wàn)別的商品圖像庫(kù)中找到與檢索圖像中商品的款式大致相同的圖像結(jié)果集合。
[0076]本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關(guān)硬件完成，所述程序可以存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中，如只讀存儲(chǔ)器、磁盤或光盤等?？蛇x地，上述實(shí)施例的全部或部分步驟也可以使用一個(gè)或多個(gè)集成電路來實(shí)現(xiàn)，相應(yīng)地，上述實(shí)施例中的各模塊/單元可以采用硬件的形式實(shí)現(xiàn)，也可以采用軟件功能模塊的形式實(shí)現(xiàn)。本申請(qǐng)不限制于任何特定形式的硬件和軟件的結(jié)合。
[0077]以上所述僅為本申請(qǐng)的優(yōu)選實(shí)施例而已，并不用于限制本申請(qǐng)，對(duì)于本領(lǐng)域的技術(shù)人員來說，本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本申請(qǐng)的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種獲得視覺詞詞典的方法，包括: 提取圖像庫(kù)中圖像的視覺特征并加以聚類，得到視覺詞詞典；從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為所述視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；將所述停用詞從所述視覺詞詞典中去除。
2.如權(quán)利要求1所述的方法，其特征在于: 所述從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，包括: 采用人工方式，從所述圖像庫(kù)中挑選出具有所述第一圖像信息的多幅圖像，分別挖取其中包含第一圖像信息的圖像區(qū)域并存儲(chǔ)為所述第一圖像，從所述第一圖像中提取視覺特征。
3.一種圖像檢索的方法，包括: 啟動(dòng)對(duì)輸入圖像的檢索，所述檢索針對(duì)第二圖像信息；從所述輸入圖像和待匹配圖像分別提取視覺特征，使用去除了停用詞的視覺詞詞典將提取的視覺特征量化為視覺詞；根據(jù)從所述輸入圖像和待匹配圖像得到的視覺詞判斷待匹配圖像是否與輸入圖像匹配，將匹配到的圖像作為所述輸入圖像的檢索結(jié)果；其中，所述停用詞是第一圖像信息對(duì)應(yīng)的視覺特征量化得到的視覺詞，所述第二圖像信息不同于第一圖像信息。
4.如權(quán)利要求3所述的方法，其特征在于，所述去除了停用詞的視覺詞詞典根據(jù)權(quán)利要求I的方法得到。
5.如權(quán)利要求3所述的方法，其特征在于，所述第一圖像信息包括重復(fù)紋理圖案；所述第二圖像信息是服裝和/或服飾類商品圖像款式。
6.一種獲得視覺詞詞典的裝置，包括:詞典生成模塊和停用模塊，其中: 所述詞典生成模塊，用于提取圖像庫(kù)中圖像的視覺特征并加以聚類，得到視覺詞詞血.ZN ? 所述停用模塊，用于從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，并量化為所述視覺詞詞典中的視覺詞，將出現(xiàn)頻率高于預(yù)定值的視覺詞作為停用詞；將所述停用詞從所述視覺詞詞典中去除。
7.如權(quán)利要求9所述的裝置，其特征在于: 所述停用模塊從包含第一圖像信息的多個(gè)第一圖像提取視覺特征，包括:采用人工方式，從所述圖像庫(kù)中挑選出具有所述第一圖像信息的多幅圖像，分別挖取其中包含第一圖像信息的圖像區(qū)域并存儲(chǔ)為所述第一圖像，從所述第一圖像中提取視覺特征。
8.一種圖像檢索的裝置，包括:圖像處理模塊和檢索模塊，其中: 所述圖像處理模塊，用于啟動(dòng)對(duì)輸入圖像的檢索，所述檢索針對(duì)第二圖像信息，從所述輸入圖像和待匹配圖像分別提取視覺特征，使用去除了停用詞的視覺詞詞典將提取的視覺特征量化為視覺詞；所述檢索模塊，用于根據(jù)從所述輸入圖像和待匹配圖像得到的視覺詞判斷待匹配圖像是否與輸入圖像匹配，將匹配到的圖像作為所述輸入圖像的檢索結(jié)果；其中，所述停用詞是第一圖像信息對(duì)應(yīng)的視覺特征量化得到的視覺詞，所述第二圖像信息不同于第一圖像信息。
9.如權(quán)利要求8所述的裝置，其特征在于，所述去除了停用詞的視覺詞詞典采用權(quán)利要求6的裝置得到。
10.如權(quán)利要求8所述的裝置，其特征在于，所述第一圖像信息包括重復(fù)紋理圖案；所述第二圖像信息是服裝和/或服飾類商品圖像款式。
【文檔編號(hào)】G06F17/30GK104424226SQ201310375662
【公開日】2015年3月18日申請(qǐng)日期:2013年8月26日優(yōu)先權(quán)日:2013年8月26日
【發(fā)明者】張榮申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張榮;
技術(shù)所有人：阿里巴巴集團(tuán)控股有限公司;
我是此專利的發(fā)明人

上一篇：用于雨傳感器的數(shù)據(jù)處理方法
上一篇：基于文件傳輸過程的文件處理方法及裝置制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

平面設(shè)計(jì)視覺詞典相關(guān)技術(shù)

計(jì)算機(jī)視覺與圖像識(shí)別相關(guān)技術(shù)

圖像檢索相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種獲得視覺詞詞典、圖像檢索的方法及裝置制造方法

一種獲得視覺詞詞典、圖像檢索的方法及裝置制造方法