一種基于稀疏編碼k最近鄰直方圖的海量圖像分類方法
【專利摘要】本發(fā)明提出一種基于稀疏編碼K最近鄰直方圖的海量圖像分類方法,屬于模式識別與信息處理【技術(shù)領(lǐng)域】。本發(fā)明方法提出的圖像特征表達(dá)是在不同尺度上統(tǒng)計直方圖,在很大程度上捕捉到了圖像各個域的特征信息,使得獲得的圖像特征具有平移不變性,能夠有效地辨別各種變形后的圖片。本發(fā)明用盡量簡潔的圖像表達(dá)來提高海量圖像分類任務(wù)的準(zhǔn)確率,本發(fā)明提供的方法在圖像處理過程中圖像表達(dá)極其簡潔,計算復(fù)雜度低,同時對圖像的變形具有很強的魯棒性。
【專利說明】一種基于稀疏編碼K最近鄰直方圖的海量圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式識別與信息處理【技術(shù)領(lǐng)域】,涉及計算機視覺方面的海量圖像處 理,尤其涉及一種基于統(tǒng)計稀疏編碼K最近鄰直方圖的海量圖像分類方法。
【背景技術(shù)】
[0002] 近年來,隨著互聯(lián)網(wǎng)圖像大數(shù)據(jù)規(guī)模的與日俱增,無論是圖像數(shù)據(jù)庫的規(guī)模,還是 圖像的多樣性,都達(dá)到了前所未有的高峰。如何準(zhǔn)確地將海量圖像正確地進行分類成為當(dāng) 今相關(guān)領(lǐng)域的研究熱點。傳統(tǒng)的圖像分類方法主要基于兩種思路:1)圖像空間;2)特征空 間?;趫D像空間的方法主要是利用圖像的灰度直方圖和紋理特征;而基于特征空間的方 法思路是將原圖像經(jīng)過如小波變換這樣的變換操作映射到特征空間,然后在特征空間提取 圖像的更高層次更抽象的特征。其中,基于圖像空間的方法雖然準(zhǔn)確率比較高,但往往伴隨 著計算復(fù)雜度高的問題,而基于特征空間的方法雖能降低數(shù)據(jù)計算量,但分類效果與特征 提取的方法有很強的相關(guān)性。在海量圖像分類任務(wù)中,不僅是要追求較高的分類準(zhǔn)確率,還 要考慮如何以盡量簡潔的方式來表達(dá)原圖片,使該圖像表達(dá)既具有很強的區(qū)分力又能大幅 減少計算復(fù)雜度。從這方面來看,考慮到圖像空間和特征空間這兩種方法固有的內(nèi)在缺陷 與優(yōu)勢,單一地使用基于圖像空間或是特征空間的方法均難以勝任海量圖像的分類任務(wù)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明旨在用盡量簡潔的圖像表達(dá)來提高海量圖像分類任務(wù)的準(zhǔn)確率,提出了一 種結(jié)合圖像空間與特征空間兩種思路來得到適于進行海量圖像分類的方法;在本發(fā)明提出 的分類方法中圖像表達(dá)極其簡潔,計算復(fù)雜度低,同時對圖像的變形具有很強的魯棒性。
[0004] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
[0005] 步驟一:對訓(xùn)練圖像集提取N個大小為SXh的圖像塊,s、h均為像素單位,所述圖 像塊個數(shù)N不少于10萬,得到整個訓(xùn)練圖像集的圖像塊集合Patches ;
[0006] 步驟二:對圖像塊集合Patches進行預(yù)處理;對圖像塊集合Patches進行歸一化 用于保證每個數(shù)據(jù)的維度相同,;對歸一化后的圖像塊集合進行白化操作用于消除數(shù)據(jù)冗 余性,由此得到經(jīng)歸一化和白化操作后的圖像塊集合:
【權(quán)利要求】
1. 一種基于稀疏編碼K最近鄰直方圖的海量圖像分類方法,具體包括以下步驟: 步驟一:對訓(xùn)練圖像集提取N個大小為sXh的圖像塊,s、h均為像素單位,每個圖像塊 是一個D = sXhXd維的向量,當(dāng)圖片為RGB圖像時,d = 3 ;當(dāng)圖片為灰度圖像時,d = 1 ; 整個訓(xùn)練圖像集的圖像塊集合Patches表示為: Patches ^ , P1 e 其中,Pi是圖像塊集合Patches中第i個圖像塊的像素構(gòu)成的列向量,i = 1,…,仏N 為圖像塊集合Patches的圖像塊總數(shù),表示D維列向量; 步驟二:對圖像塊集合Patches進行預(yù)處理;對圖像塊集合Patches進行歸一化,得到 歸一化后的圖像塊集合^^;對歸一化后的圖像塊集合進行白化操作,得到經(jīng) 歸一化和白化操作后的圖像塊集合:
步驟三:對歸一化和白化操作后的圖像塊集合進行稀疏編碼,得到基字典 B ; 步驟四:對于每張訓(xùn)練圖片,從圖片中每隔1個像素距離提取一個大小為sXh的圖像 塊,每張訓(xùn)練圖片共計提取Z個所述大小為sXh的圖像塊,所述圖像塊的集合表示為im_ patch,對圖像塊集合im_patch經(jīng)過所述歸一化和白化操作后得到集合//H _ ,計算 圖像塊集合細(xì)中每個圖像塊impj與字典B中每一個基的歐式距離,j = 1…Z ; 針對圖像塊集合如中每個圖像塊imp』,找到字典B中與相應(yīng)圖像塊imp』歐式距 離最近的K個基(basis),將這些基記作KNN(imPj);每個圖像塊imPj的特征向量是W維且 其所有元素記為:4/"^1|),"_,^_"?/^,?/7( //?/)1,1;每個圖像塊111^的特征向量中每個 元素的計算公式為:
其中,B(w)是基字典B中的第w個基,w = I, "'W, /w/f表示圖像塊impj的特征向量 中的第w個元素位置;由此可得到訓(xùn)練圖片集所有圖片的每個圖像塊的特征向量; 步驟五:在得到訓(xùn)練圖片每個圖像塊的特征向量后,將圖片從三個尺度上劃分域: Level = O時,保留整個圖片為一個域;Level = 1時,將圖片分為2X2 = 4個域;Level = 2時,將圖片分為22X 22 = 16個域;在這三個尺度上的每個域中分別計算每個圖像塊imPj 的特征向量中每個元素的〇-1直方圖,將所有域的直方圖連接在一起即得到訓(xùn) 練圖片最終的特征表達(dá); 步驟六:將訓(xùn)練圖片集的特征表達(dá)輸入支持向量機SVM中,訓(xùn)練分類器SVM ; 步驟七:對測試樣本集依次進行步驟一、步驟二、步驟四、步驟五的操作后,將得到的測 試樣本集的特征表達(dá)輸入步驟六中訓(xùn)練好的分類器SVM中進行分類計算,最終實現(xiàn)測試圖 像的準(zhǔn)確分類。
2. 根據(jù)權(quán)利要求1所述的基于稀疏編碼K最近鄰直方圖的海量圖像分類方法,其特征 在于,所述的歸一化由以下公式實現(xiàn):
其中,Hiean(Pi)是每個圖像塊Pi中各個元素的平均值,Var(Pi)是每個圖像塊P i中元 素的方差,由此得到歸一化后的圖像塊集合八=[內(nèi),…,代,…,/J、.]; 所述的對歸一化后的圖像塊集合T5攸如.s'進行白化操作的具體方法如下:
其中,cov(/^'/k^是歸一化圖像塊集合的協(xié)方差矩陣,eig(_)是求協(xié)方差矩 陣C〇v(-)的特征值和特征向量,V是所求特征值組成的向量,U是對應(yīng)特征向量組成 的矩陣,U矩陣的每一列是一個特征向量,是特征向量矩陣的轉(zhuǎn)置Ut與歸一化圖像塊 集合中第i個圖像塊f相乘后的列向量,X i是向量V中第i個特征值,;是 圖像塊集合^^中第i個圖像塊經(jīng)白化操作后的列向量。
3. 根據(jù)權(quán)利要求1所述的基于稀疏編碼K最近鄰直方圖的海量圖像分類方法,其特征 在于,所述稀疏編碼由以下公式實現(xiàn)公式為:
其中,基字典B = Lb1,…,bw,…,bw],bw是基字典B中的基(basis),共有W個基;p whitm,i 為圖像塊集合中第i個圖像塊,a為稀疏性約束系數(shù),〇〈 a〈1 ;qi為圖像塊集 ^ Patches..^,,中第i個圖像塊映射到字典B的碼向量;s. t.表示"受約束于",I |bw| I是向 量bw的二范數(shù)。
4. 根據(jù)權(quán)利要求3所述的基于稀疏編碼K最近鄰直方圖的海量圖像分類方法,其特征 在于,利用最大期望算法求解稀疏編碼公式得到基字典B。
【文檔編號】G06K9/62GK104361354SQ201410709032
【公開日】2015年2月18日 申請日期:2014年11月28日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】董樂, 張寧, 賀玲 申請人:電子科技大學(xué)