專利名稱:基于核函數(shù)與稀疏編碼的高清圖像分類方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字圖像處理領(lǐng)域,具體涉及一種基于核函數(shù)與稀疏編碼的高清圖像分類方法。
背景技術(shù):
目前,隨著計算機網(wǎng)絡(luò)的迅速發(fā)展、數(shù)字媒體技術(shù)及智能信息處理技術(shù)的發(fā)展和廣泛應(yīng)用,大規(guī)模圖像資源不斷出現(xiàn)。面對著海量的圖像信息,如何對圖像進(jìn)行分類或標(biāo)注以便快速地、有效地從海量圖像數(shù)據(jù)中檢索出所感興趣的圖像已經(jīng)人工智能和模式識別中的研究熱點,在科學(xué)研究、國防軍事、工業(yè)生產(chǎn)、航空航天、生物醫(yī)學(xué)、交通監(jiān)控等領(lǐng)域有著廣泛的應(yīng)用。傳統(tǒng)的方法是通過關(guān)鍵字對圖像進(jìn)行人工標(biāo)注,但這種方法是非常耗時的,并具有較大的主觀性,對于相同的圖像,不同的人可能產(chǎn)生不同的標(biāo)注結(jié)果,因此這個方法在當(dāng)今“信息災(zāi)難”的時代是不可行的。對圖像分類的研究的幾十年歷史,期間涌現(xiàn)了各種基于不同理論的分類方法,但是,該領(lǐng)域一直沒有形成一個統(tǒng)一的理論體系指導(dǎo)新的分類方法的設(shè)計與實現(xiàn)。近幾年來,圖像分類的常用方法包括統(tǒng)計方法和結(jié)構(gòu)方法,但統(tǒng)計方法在圖像分類領(lǐng)域中表現(xiàn)活躍,產(chǎn)生了很多新的方法,如神經(jīng)網(wǎng)絡(luò)方法、支持向量機(Support Vector Machine, SVM)方法及Boosting方法。根據(jù)實現(xiàn)方法的不同,統(tǒng)計方法可以分為:I)非監(jiān)督分類法:又稱聚類分析法,根據(jù)模式之間的相似性進(jìn)行類別劃分,將相似性強的模式劃分為同一個類別。該方法不需要對分類數(shù)據(jù)有較深入的了解,自適應(yīng)地形成分類數(shù)據(jù)集,但分類效果在復(fù)雜數(shù)據(jù)中不太理想。2)監(jiān)督分類法:根據(jù)預(yù)先已知類別的訓(xùn)練樣本,得到各類在特征空間的分布規(guī)模,并利用這個分布規(guī)律對未知數(shù)據(jù)進(jìn)行分類方法。該方法充分利用分類數(shù)據(jù)的先驗知識,并可通過反復(fù)檢驗訓(xùn)練樣本,提高分類精度,因此該方法在高清圖像分類中廣泛應(yīng)用。目前支持向量機(SVM)廣泛應(yīng)用于圖像分類領(lǐng)域并取得良好的分類效果,最早的支持向量機(SVM)方法是由Vapnik和Chervonenkis在“Support-VectorNetworks, Machine Learning, 20, 1995.”一文中提出。支持向量機(SVM)是新型機器學(xué)習(xí)方法,具有完備的統(tǒng)計學(xué)習(xí)理論基礎(chǔ),它采用結(jié)構(gòu)風(fēng)險最小化原則代替?zhèn)鹘y(tǒng)統(tǒng)計學(xué)中的基于大樣本的經(jīng)驗風(fēng)險最小化原則,克服了神經(jīng)網(wǎng)絡(luò)受到網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性和樣本容量的影響大,容易出現(xiàn)過學(xué)習(xí)或低泛化能力的不足,對于小樣本數(shù)據(jù)分析具有出色的學(xué)習(xí)能力和推廣能力,在模式識別和函數(shù)估計中得到了有效的應(yīng)用,但該方法仍存在以下問題:(I)SVM方法對大規(guī)模訓(xùn)練樣本難以實施,由于SVM是借助二次規(guī)劃來求解支持向量,而求解二次規(guī)劃將涉及m階矩陣的計算(m為樣本的個數(shù)),當(dāng)m數(shù)目很大時該矩陣的存儲和計算將耗費大量的機器內(nèi)存和運算時間。(2)SVM方法的復(fù)雜度會隨特征個數(shù)的增加而快速增加,用來訓(xùn)練分類器和測試結(jié)果的樣本數(shù)量會隨著特征的數(shù)量呈指數(shù)關(guān)系增長;若增加適應(yīng)性不強的特征或者與已有特征有較強相關(guān)性的特征,反而會使分類器的分類能力下降,降低系統(tǒng)識別分類的能力。
發(fā)明內(nèi)容
本發(fā)明的目的是對高清圖像提供一種分類方法,該方法能夠解決目前監(jiān)督分類方法的分類速度慢、復(fù)雜度隨著特征個數(shù)增加而指數(shù)增長、相關(guān)性不強的特征影響分類精度的問題。本發(fā)明提供一種基于核函數(shù)與稀疏編碼的高清圖像分類方法,包括以下步驟:提取每張高清圖像的視覺特征;對視覺特征的歐氏空間進(jìn)行核函數(shù)映射;根據(jù)變換后的視覺特征生成高清圖像類別的稀疏編碼;依據(jù)所述的高清圖像類別的稀疏編碼建立圖像非線性分類器,確定所述高清圖像所屬的類別。較佳地,所述提取每張高清圖像的視覺特征包括:提取每張圖像的顏色、紋理、形狀、方向梯度直方圖、尺度不變特征轉(zhuǎn)換特征作為其視覺特征X=DC1,...,#],其中,K為視覺特征的數(shù)量。較佳地,所述對視覺特征的歐氏空間進(jìn)行核函數(shù)映射包括:對所述的視覺特征進(jìn)行核函數(shù)映射爐將視覺特征的歐氏空間變換成度量空間。較佳地,所述根據(jù)變換后的視覺特征生成高清圖像類別的稀疏編碼包括:定義高清圖像相互間的線性表示為
權(quán)利要求
1.一種基于核函數(shù)與稀疏編碼的高清圖像分類方法,其特征在于,包括以下步驟: 提取每張高清圖像的視覺特征; 對視覺特征的歐氏空間進(jìn)行核函數(shù)映射; 根據(jù)變換后的視覺特征生成高清圖像類別的稀疏編碼; 依據(jù)所述的高清圖像類別的稀疏編碼建立圖像非線性分類器,確定所述高清圖像所屬的類別。
2.如權(quán)利要求1所述的基于核函數(shù)與稀疏編碼的高清圖像分類方法,其特征在于,提取每張高清圖像的視覺特征包括: 提取每張圖像的顏色、紋理、形狀、方向梯度直方圖、尺度不變特征轉(zhuǎn)換特征作為其視覺特征X= [X1,…,Xk],其中,K為視覺特征的數(shù)量。
3.如權(quán)利要求1所述的涉及數(shù)字圖像處理領(lǐng)域,其特征在于,所述對視覺特征的歐氏空間進(jìn)行核函數(shù)映射包括: 對所述的視覺特征進(jìn)行核函數(shù)映射識,將視覺特征的歐氏空間變換成度量空間。
4.如權(quán)利要求1所述的基于核函數(shù)與稀疏編碼的高清圖像分類方法,其特征在于,根據(jù)變換后的視覺特征生成高清圖像類別的稀疏編碼包括:
5.如權(quán)利要求4所述的基于核函數(shù)與稀疏編碼的高清圖像分類方法,其特征在于,根據(jù)重構(gòu)誤差最優(yōu)化和編碼盡量稀疏原則,確定高清圖像類別的稀疏編碼的步驟包括: 高清圖像的稀疏編碼矩陣
6.如權(quán)利要求5所述的基于核函數(shù)與稀疏編碼的高清圖像分類方法,其特征在于,依據(jù)所述的高清圖像類別的稀疏編碼建立圖像非線性分類器,確定所述高清圖像所屬的類別的步驟包括: 確定高清圖像的K個視覺特征的權(quán)重wk(k=l,2,…K);根據(jù)所述的稀疏編碼矩陣R和視覺特征的權(quán)重向量wk(k=l,2,...!(),構(gòu)建高清圖像非線性分類器為:
7.如權(quán)利要求6所述的基于核函數(shù)與稀疏編碼的高清圖像分類方法,其特征在于,高清圖像的K個視覺特征的權(quán)重wk (k=l, 2,…K)應(yīng)滿足:
全文摘要
本發(fā)明公開了一種基于核函數(shù)與稀疏編碼的高清圖像分類方法,包括以下步驟提取每張高清圖像的視覺特征;對所述的視覺特征進(jìn)行核函數(shù)映射,將視覺特征的歐氏空間變換成度量空間;根據(jù)所述變換后的視覺特征生成高清圖像類別的稀疏編碼;依據(jù)所述的高清圖像類別的稀疏編碼建立圖像非線性分類器,對每個特征賦予權(quán)值,確定所述高清圖像所屬的類別。本發(fā)明能夠通過視覺特征的核函數(shù)映射,自動地根據(jù)特征的相關(guān)性賦予權(quán)值,提高強相關(guān)性的特征對分類能力的影響,并利用核方法減少分類過程的運算時間,大大減少了計算量,有效地提高分類的效率,使分類方法對高清圖像數(shù)據(jù)集的樣本空間分布具有較強的自適應(yīng)性,對復(fù)雜的圖像具有更好的魯棒性。
文檔編號G06K9/62GK103177265SQ20131009740
公開日2013年6月26日 申請日期2013年3月25日 優(yōu)先權(quán)日2013年3月25日
發(fā)明者周凡, 鄧偉財, 盛建強 申請人:中山大學(xué)