本發(fā)明涉及商品分類
技術領域:
,具體涉及一種多模態(tài)融合的商品分類系統(tǒng)。
背景技術:
:商品分類為商品檢索、商品置放策略制定以及智能推薦等提供了有力支撐。圖像作為商品的主要信息載體,基于圖像的商品分類技術研究己成為圖像處理、計算機視覺和模式識別領域的研究熱點。然而,現(xiàn)有的商品分類方法僅對商品的圖像進行研究而忽略了商品的文本信息,另一方面,現(xiàn)有的商品分類方法存在分類準確率低、分類速度慢等問題。技術實現(xiàn)要素:針對上述問題,本發(fā)明旨在提供一種多模態(tài)融合的商品分類系統(tǒng)。本發(fā)明的目的采用以下技術方案來實現(xiàn):提供了一種多模態(tài)融合的商品分類系統(tǒng),包括基于圖像的商品分類模塊、基于文本的商品分類模塊和圖文融合分類模塊;所述基于圖像的商品分類模塊用于獲取商品圖像的分類結果;所述基于文本的商品分類模塊用于獲取商品文本的分類結果;所述圖文融合分類模塊用于融合基于商品圖像的分類結果和基于商品文本的分類結果,得到并輸出商品類別。本發(fā)明的有益效果為:能夠實現(xiàn)較為精確和快速的商品分類。附圖說明利用附圖對本發(fā)明作進一步說明,但附圖中的實施例不構成對本發(fā)明的任何限制,對于本領域的普通技術人員,在不付出創(chuàng)造性勞動的前提下,還可以根據以下附圖獲得其它的附圖。圖1是本發(fā)明的結構連接示意圖;附圖標記:基于圖像的商品分類模塊1、基于文本的商品分類模塊2、圖文融合分類模塊3、商品分類準確度評價模塊4。具體實施方式結合以下實施例對本發(fā)明作進一步描述。參見圖1,本實施例的一種多模態(tài)融合的商品分類系統(tǒng),包括基于圖像的商品分類模塊1、基于文本的商品分類模塊2和圖文融合分類模塊3,所述基于圖像的商品分類模塊1用于獲取商品圖像的分類結果;所述基于文本的商品分類模塊2用于獲取商品文本的分類結果;所述圖文融合分類模塊3用于融合基于商品圖像的分類結果和基于文本圖像的分類結果,得到并輸出商品類別。本實施例能夠實現(xiàn)較為精確和快速的商品分類。優(yōu)選地,所述基于圖像的商品分類模塊1用于獲取商品圖像的分類結果,具體為:(1)對需分類的商品圖像進行圖像去噪處理,包括:1)進行需分類的商品圖像的光照歸一化處理,采用以下方式進行:將需分類的商品圖像P轉換到對數域,利用差分高斯濾波器對需分類的商品圖像P進行平滑處理,然后對需分類的商品圖像P進行全局對比度均衡化處理;2)對需分類的商品圖像P以滑動窗口方式按照預先設定的滑動距離進行塊劃分;3)提取得到的圖像塊中的每一塊的紋理特征,采用K-MEANS聚類方法基于提取的紋理特征對圖像塊進行聚類,獲得多個圖像塊組,利用多線性子空間學習濾波器對圖像塊組進行初次去噪;所述K-MEANS聚類方法具體描述如下:步驟1:隨機選取k個聚類質心點為μ1,μ2,…,μk,步驟2:對于每個樣本例i,計算其應該屬于的類,對于每一個類j,重新計算該類的質心,步驟3:重復步驟2,直到收斂;4)采用改進的自適應字典學習去噪方法對初次去噪后的需分類的商品圖像進行二次去噪。(2)將第j類商品圖像的訓練樣本集表示為Fj=[fj,1,fj,2,…,fj,n],則所有類別的訓練樣本集F=[F1,F2,…,FN]構成過完備字典,其中,N表示商品類別數,對于未知類別測試樣本t,可表示為F的線性組合:t=Fa式中,a為稀疏的系數向量,用稀疏編碼算法求得稀疏表示a;定義函數ρj(a),該函數將稀疏表示a中不屬于第j類的分量置0,則測試樣本所屬類別可表示為:式中,jbe表示測試樣本t所屬類別,F(xiàn)ρj(a)表示測試樣本第j類的重構圖像,||t-Fρj(a)||2表示原始圖像和第j類重構圖像的重構殘差;圖像分類得分為:式中,表示商品屬于第j類的圖像分類得分,1≤j,k≤N。一方面,本優(yōu)選實施例對需分類的商品圖像進行多次去噪處理,能夠獲得較好的去噪效果,并且適用于多維的商品圖像,在對商品圖像進行塊劃分之前先進行光照歸一化處理,有利于后續(xù)圖像塊特征的提取,從而提高聚類的精度,進而提高去噪的精度;另一方面,本優(yōu)選實施例使用上述算法確定圖像分類結果,提高了圖像分類準確度,定義了圖像分類得分,為進一步進行分類信息融合打下了基礎。優(yōu)選地,所述采用改進的自適應字典學習去噪方法對初次去噪后的需分類的商品圖像進行二次去噪,具體包括:(1)對初次去噪后的圖像塊進行重排列形成列向量矩陣,并對列向量矩陣進行降維,最終形成樣本塊集合{P};(2)對該樣本塊集合進行自適應字典訓練,得到自適應學習字典D;(3)對該需分類的商品圖像P按照另一設定的滑動距離再次進行滑動窗口的塊劃分,對得到的圖像塊進行重排列形成列向量矩陣,并對列向量矩陣進行降維,最終形成輸入圖像塊集合{P′};(4)求解輸入圖像塊集合{P′}中每一列向量在自適應學習字典上的稀疏表示稀疏μ,并按照下式計算輸出圖像塊y(P):y(P)=Dμ(5)將輸出圖像塊進行融合處理,得到預去噪圖像y′(P);(6)對預去噪圖像y′(P)進行低秩矩陣稀疏分解,得到低秩去噪分量DZ和稀疏含噪分量XS,對該低秩去噪分量DZ和稀疏含噪分量XS進行二次去噪處理,得到最終去噪圖像:y″(P)=DZ*XS′式中,XS′表示對稀疏含噪分量XS進行中值濾波后得到的稀疏去噪分量,*表示融合處理。所述基于文本的商品分類模塊2用于獲取商品文本的分類結果,具體為:訓練文本集式中,wi為已知類別文本,為文本類別,某商品待分類文本wt中包含不同的詞wi,將文本表示為wt=(w1,w2,…,wn),n為文本中詞的數量,統(tǒng)計wi在文本wt中出現(xiàn)的頻次pi和在訓練文本集文本中出現(xiàn)的最高頻次計算相對詞頻將文本表示為計算wt與W中文本wi的相似度,得到與wt最近似的l個wi,式中,表示wt的第i個詞wi的相對詞頻,表示wi的第i個詞wi的相對詞頻;Wl表示l個最近鄰文本,計算Wl中各類別占比,占比最大的類別包含文本數為l1,作為wt的類別占比第二大的類別文本數目為l2;文本分類得分為:所述圖文融合分類模塊3用于融合基于商品圖像的分類結果和基于商品文本的分類結果,得到并輸出商品類別,具體為:假設待分類商品圖文樣本(t,w,y),三元組中的t表示商品的圖像描述,w表示商品的文本描述,y表示商品的類別,商品的訓練樣本集(T,W,Y)={(ti,wi,yi)},其中,i=1,2,…,n,n表示樣本集中樣本數量;對圖像分類得分和文本分類得分進行線性組合:式中,為商品屬于第j類的圖文融合得分,為商品屬于第j類的圖像分類得分,為商品屬于第j類的文本分類得分,δ1和δ2為根據樣本學習得到的權重系數;通過下列商品類別判定公式得到商品類別:本優(yōu)選實施例對初次去噪后的需分類的商品圖像進行二次去噪處理,能夠很好地保留圖像的細節(jié),濾除噪聲;采用商品分類模塊確定文本分類結果,提高了文本分類準確率,定義了文本分類得分,為進一步進行分類信息融合打下了基礎;同時考慮商品的圖像視覺信息和描述文本信息,對兩種不同模態(tài)信息進行融合,提高了商品分類準確率。優(yōu)選地,還設有商品分類準確度評價模塊4,其用于根據設定的商品分類準確度評價函數對系統(tǒng)的商品分類準確度進行評價,商品分類準確度評價函數的值越大,表示商品分類的準確度越高,該商品分類準確度評價函數為:式中,NL為商品類別數量,mα為第α類正確分類商品樣本數量,Mα為第α類商品樣本數量。本優(yōu)選實施例設定商品分類準確度評價函數,從而能夠判定系統(tǒng)的商品分類準確度,有利于對商品分類系統(tǒng)的改進。采用本發(fā)明商品分類系統(tǒng)對待分類商品數分別為200、300、400、500、600時的分類情況進行分析統(tǒng)計,并將商品分類準確率和商品分類時間作為該商品分類系統(tǒng)的評價指標,同未采用該商品分類系統(tǒng)相比,產生的有益效果如下表所示:待分類商品數商品分類準確度提高商品分類時間縮短20020%10%30025%15%40030%20%50032%24%60036%31%最后應當說明的是,以上實施例僅用以說明本發(fā)明的技術方案,而非對本發(fā)明保護范圍的限制,盡管參照較佳實施例對本發(fā)明作了詳細地說明,本領域的普通技術人員應當理解,可以對本發(fā)明的技術方案進行修改或者等同替換,而不脫離本發(fā)明技術方案的實質和范圍。當前第1頁1 2 3