一種商品圖像精細(xì)分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種商品圖像精細(xì)分類方法,屬于圖像處理技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,電子商務(wù)的逐漸普及。電子商務(wù)網(wǎng)站需要通過對在線銷售商 品進(jìn)行標(biāo)注W方便用戶進(jìn)行捜索。但"一圖勝千言",傳統(tǒng)的基于人工標(biāo)注的方法不但費(fèi)時 費(fèi)力,又難做到準(zhǔn)確完整。如果在網(wǎng)站中設(shè)置圖片分類過濾器,無疑能方便用戶進(jìn)行瀏覽。 基于視覺信息的圖像自動分類技術(shù)能夠方便商家和用戶,如進(jìn)行商品自動標(biāo)注和輔助圖像 檢索。
[0003] 基于視覺信息的圖像自動分類是是根據(jù)圖像的視覺特征對圖像進(jìn)行自動語義 分類,需要克服類內(nèi)差異、遮擋、姿態(tài)變化和背景干擾對分類帶來的不利影響,目前是計(jì) 算機(jī)視覺領(lǐng)域最具挑戰(zhàn)的課題之一。針對商品圖像分類,S.Jia等(Automatic化St classificationofproductimageswithclass-specificdescriptor,Journal ofElectronics(Qiina).No. 6,pp. 7-10, 2010.)提出了 一種基于類描述的快速圖像分 類方法,在30類商品圖像中獲得了 84 %的正確率?;痚nBoiman等(InDefenseof Nearest-NeighborBasedImageClassification,ProceedingsofIEEEConferenceon ComputerVisionandPatternReco即ition)提出了一種樸素貝葉斯最近鄰的分類器 NB順,(化ive-BayesNearest-Nei曲bor),在圖像局部特征空間采用最近鄰方法,計(jì)算圖 像-類之間的距離,并且證明了在基于貝葉斯假設(shè)下,該種分類器可W近似理論上最優(yōu)的 圖像分類器。但由于該種方式基于窮盡捜索,當(dāng)標(biāo)記圖像數(shù)目比較多、類別數(shù)比較大時,運(yùn) 行時間就會變得越來越多,很難達(dá)到實(shí)際應(yīng)用的要求。同時,W上的所有方法都是基于人工 提取特征進(jìn)行商品圖像的分類,而且都是對大規(guī)模的商品圖像進(jìn)行分類。
【發(fā)明內(nèi)容】
[0004] 為了克服上述的不足,本發(fā)明提供了一種商品圖像精細(xì)分類方法。本發(fā)明是研究 商品圖像的精細(xì)分類,首先應(yīng)用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)商品圖像深層次的抽 象的特征,完全不用人為提取,其次,將自動學(xué)習(xí)到的圖像特征與支持向量機(jī)相結(jié)合,W克 服傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)時間長W及對硬件設(shè)備高的不足,最后完成對測試商品圖像 的分類。本發(fā)明可在保證較高正確率的情況下有效提高計(jì)算速度,適用于較大規(guī)模的商品 圖像精細(xì)分類。本發(fā)明要解決的技術(shù)問題是基于深度視覺特征的商品圖像分類,提供了一 種基于視覺信息的商品圖像分類方法,該種方法提取圖像的深層抽象特征,采用支持向量 機(jī)方法實(shí)現(xiàn)類別識別。
[0005] 本發(fā)明采取的技術(shù)方案如下:
[0006] 一種商品圖像精細(xì)分類方法,包括如下步驟:
[0007] 步驟一.輸入訓(xùn)練樣本:將分好類的商品圖像分別分為訓(xùn)練樣本與測試樣本,其 中訓(xùn)練樣本通常多于測試樣本;
[000引步驟二.簡單預(yù)處理:主要包括將輸入的RGB形式的訓(xùn)練樣本轉(zhuǎn)化為灰度圖像,其 次,由于圖像庫內(nèi)的圖像大小不一要將其歸一化到統(tǒng)一大小,同時由于圖像像素是在0~ 255的,所有需要對圖像像素做除W255的簡單操作,將像素統(tǒng)一歸一化到0~1,W方便后 續(xù)的運(yùn)算;
[0009] 步驟提取卷積特性;采用卷積神經(jīng)網(wǎng)絡(luò)首先對訓(xùn)練樣本進(jìn)行自動提取特征, 通過深層卷積網(wǎng)絡(luò)結(jié)構(gòu)的作用,從而得到深層抽象的特征;
[0010] 步驟四.轉(zhuǎn)化為特征向量;卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過層層抽象所提取的特征是二維的, 所W要將各類圖像提取的特征轉(zhuǎn)換為特征向量W方便分類器使用;
[0011] 步驟五.SVM訓(xùn)練;將所得的特征描述子與支持向量機(jī)分類器相結(jié)合,分別訓(xùn)練出 各類相應(yīng)的模型;
[0012] 步驟六.SVM測試;計(jì)算出每張測試圖像的特征描述子發(fā)送給支持向量機(jī),通過與 所得到的模型進(jìn)行逐一匹配;
[0013] 步驟走.分類結(jié)果;對每張測試圖像進(jìn)行模型匹配,所屬類別就是最匹配的模型 所屬的類別,將分類結(jié)果輸出。
[0014] 測試圖像的特征描述子的產(chǎn)生過程包括如下步驟:
[0015] 步驟一.輸入測試樣本:將分好類的商品圖像部分樣本作為測試樣本
[0016] 步驟二.簡單預(yù)處理:與訓(xùn)練樣本的處理方式相同主要包括圖像的灰度化與圖像 大小與像素的歸一化;
[0017] 步驟提取卷積特性:該過程與測試圖像提取特征過程一致,采用卷積神經(jīng)網(wǎng) 絡(luò)首先對訓(xùn)練樣本進(jìn)行自動提取特征,通過深層卷積網(wǎng)絡(luò)結(jié)構(gòu)的作用,從而得到深層抽象 的特征;
[001引步驟四.轉(zhuǎn)化為特征向量;該過程依然與對測試圖像所提取特征的處理方式一 致,由于卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過層層抽象所提取的特征是二維的,所W要將各類圖像提取的特 征轉(zhuǎn)換為特征向量W方便分類器使用。
[0019] 本發(fā)明的有益效果:
[0020] (1)能夠僅根據(jù)商品圖像的視覺內(nèi)容實(shí)現(xiàn)商品的精細(xì)分類;
[0021] (2)采用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)對商品圖像進(jìn)行多層次特征提取,W代替?zhèn)?統(tǒng)的人工提取特征。
[0022] (3)將卷積神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)相結(jié)合,W克服卷積神經(jīng)網(wǎng)絡(luò)耗時長,對硬件設(shè) 備要求高的不足,同時彌補(bǔ)支持向量機(jī)與人工特征才能達(dá)到理想分類效果的缺點(diǎn)。
【附圖說明】
[0023] 圖1是本發(fā)明所述分類方法的示意圖。
[0024] 圖2是本發(fā)明實(shí)施例中的卷積神經(jīng)網(wǎng)絡(luò)提取特征示意圖。
[0025] 圖3是本發(fā)明所述分類方法的流程圖。
【具體實(shí)施方式】
[0026] 本方明的示意圖如圖1所示,具體實(shí)施如下;
[0027] 步驟一.輸入訓(xùn)練樣本:將分好類的商品圖像分別分為訓(xùn)練樣本與測試樣本,其 中訓(xùn)練樣本通常多于測試樣本;獲取已知類別的商品圖像樣本為訓(xùn)練圖像,樣本示例如表 1所示。由于圖像庫的內(nèi)每類樣本數(shù)量不同,每類隨機(jī)選取90~300個樣本;
[002引步驟二.簡單預(yù)處理:主要包括將輸入的RGB形式的訓(xùn)練樣本轉(zhuǎn)化為灰度圖像,其 次,由于圖像庫內(nèi)的圖像大小不一要將其歸一化到統(tǒng)一大小,同時由于圖像像素是在0~ 255的,所有需要對圖像像素做除W255的簡單操作,將像素統(tǒng)一歸一化到0~1,W方便后 續(xù)的運(yùn)算;對輸入樣本圖像進(jìn)行簡單預(yù)處理,為了提高運(yùn)算速度,將輸入的RGB圖像轉(zhuǎn)化為 灰度圖像,即灰度化處理,其次,由于圖像庫內(nèi)的圖像大小不一要將其歸一化到統(tǒng)一大小, 同時由于像素值都是在0~255,所W要將像素值做除W255的簡單運(yùn)算歸一化到0~1的 區(qū)間內(nèi)W方便訓(xùn)練學(xué)習(xí)。
[0029] 步驟提取卷積特性;采用卷積神經(jīng)網(wǎng)絡(luò)首先對訓(xùn)練樣本進(jìn)行自動提取特征, 通過深層卷積網(wǎng)絡(luò)結(jié)構(gòu)的作用,從而得到深層抽象的特征;采用卷積神經(jīng)網(wǎng)絡(luò)提取各類的 圖片特征,具體過程如圖2所示。
[0030] 卷積神經(jīng)網(wǎng)絡(luò)的簡介如下所示:
[0031] 根據(jù)卷積的數(shù)學(xué)定義,其主要有標(biāo)準(zhǔn)型與離散型,其中卷積神經(jīng)網(wǎng)絡(luò)中卷積層的 網(wǎng)絡(luò)結(jié)構(gòu)采用的是離散型,在卷積神經(jīng)網(wǎng)絡(luò)中表示如下公式所示:
[0032]
【主權(quán)項(xiàng)】
1. 一種商品圖像精細(xì)分類方法,其特征在于:包括如下步驟: 步驟一.輸入訓(xùn)練樣本:將分好類的商品圖像分別分為訓(xùn)練樣本與測試樣本,其中訓(xùn) 練樣本通常多于測試樣本; 步驟二.簡單預(yù)處理:主要包括將輸入的RGB形式的訓(xùn)練樣本轉(zhuǎn)化為灰度圖像,其次, 由于圖像庫內(nèi)的圖像大小不一要將其歸一化到統(tǒng)一大小,同時由于圖像像素是在〇~255 的,所有需要對圖像像素做除以255的簡單操作,將像素統(tǒng)一歸一化到O~1,以方便后續(xù)的 運(yùn)算; 步驟三.提取卷積特性:采用卷積神經(jīng)網(wǎng)絡(luò)首先對訓(xùn)練樣本進(jìn)行自動提取特征,通過 深層卷積網(wǎng)絡(luò)結(jié)構(gòu)的作用,從而得到深層抽象的特征; 步驟四.轉(zhuǎn)化為特征向量:卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過層層抽象所提取的特征是二維的,所以 要將各類圖像提取的特征轉(zhuǎn)換為特征向量以方便分類器使用; 步驟五.SVM訓(xùn)練:將所得的特征描述子與支持向量機(jī)分類器相結(jié)合,分別訓(xùn)練出各類 相應(yīng)的模型; 步驟六.SVM測試:計(jì)算出每張測試圖像的特征描述子發(fā)送給支持向量機(jī),通過與所得 到的模型進(jìn)行逐一匹配; 步驟七.分類結(jié)果:對每張測試圖像進(jìn)行模型匹配,所屬類別就是最匹配的模型所屬 的類別,將分類結(jié)果輸出。
2. 根據(jù)權(quán)利要求1所述的一種商品圖像精細(xì)分類方法,其特征在于:測試圖像的特征 描述子的產(chǎn)生過程包括如下步驟: 步驟一.輸入測試樣本:將分好類的商品圖像部分樣本作為測試樣本: 步驟二.簡單預(yù)處理:與訓(xùn)練樣本的處理方式相同主要包括圖像的灰度化與圖像大小 與像素的歸一化; 步驟三.提取卷積特性:該過程與測試圖像提取特征過程一致,采用卷積神經(jīng)網(wǎng)絡(luò)首 先對訓(xùn)練樣本進(jìn)行自動提取特征,通過深層卷積網(wǎng)絡(luò)結(jié)構(gòu)的作用,從而得到深層抽象的特 征; 步驟四.轉(zhuǎn)化為特征向量:該過程依然與對測試圖像所提取特征的處理方式一致,由 于卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過層層抽象所提取的特征是二維的,所以要將各類圖像提取的特征轉(zhuǎn)換 為特征向量以方便分類器使用。
【專利摘要】本發(fā)明公開了一種商品圖像精細(xì)分類方法,屬于圖像處理技術(shù)領(lǐng)域。本發(fā)明包括如下步驟:步驟一.輸入訓(xùn)練樣本:將分好類的商品圖像分別分為訓(xùn)練樣本與測試樣本,其中訓(xùn)練樣本通常多于測試樣本;步驟二.簡單預(yù)處理:主要包括將輸入的RGB形式的訓(xùn)練樣本轉(zhuǎn)化為灰度圖像,其次,由于圖像庫內(nèi)的圖像大小不一要將其歸一化到統(tǒng)一大小,同時由于圖像像素是在0~255的,所有需要對圖像像素做除以255的簡單操作,將像素統(tǒng)一歸一化到0~1,以方便后續(xù)的運(yùn)算;步驟三.提取卷積特性:采用卷積神經(jīng)網(wǎng)絡(luò)首先對訓(xùn)練樣本進(jìn)行自動提取特征,通過深層卷積網(wǎng)絡(luò)結(jié)構(gòu)的作用,從而得到深層抽象的特征。
【IPC分類】G06F17-30, G06K9-00
【公開號】CN104866524
【申請?zhí)枴緾N201510168626
【發(fā)明人】賈世杰, 楊東坡, 曾潔, 陳少華
【申請人】大連交通大學(xué)
【公開日】2015年8月26日
【申請日】2015年4月10日