一種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺(jué)分類(lèi)方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明設(shè)及計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,更具體地說(shuō),設(shè)及一種聯(lián)合魯棒主 成分特征學(xué)習(xí)與視覺(jué)分類(lèi)方法及系統(tǒng)。
【背景技術(shù)】
[0002] 在眾多的實(shí)際應(yīng)用中,現(xiàn)實(shí)生活中的許多模式(例如圖像、音頻、視頻等多媒體對(duì) 象)均可用高維的屬性或特征進(jìn)行描述,然而高維的數(shù)據(jù)通常含有許多無(wú)用的干擾性特征、 冗余特征、W及噪聲數(shù)據(jù)等。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,如何通過(guò)特征學(xué)習(xí)或低秩與稀疏 編碼技術(shù)來(lái)恢復(fù)原始數(shù)據(jù)或更準(zhǔn)確地描述數(shù)據(jù)已經(jīng)發(fā)展成為計(jì)算機(jī)視覺(jué)和圖像處理中非 常重要的一個(gè)研究課題。特征提取的目的在于找到一個(gè)潛在投影或映射,通過(guò)將高維的數(shù) 據(jù)變換到一個(gè)描述性更強(qiáng)特征空間,同時(shí)有效保持?jǐn)?shù)據(jù)中的重要幾何特性。
[0003] 最具代表性的數(shù)據(jù)特征提取方法是主成分分析(Principal Component Analysis,簡(jiǎn)稱(chēng)PCA)"PCA是基于變量協(xié)方差矩陣對(duì)信息進(jìn)行處理、壓縮和特征抽取的有效 方法。PCA可有效掲示數(shù)據(jù)間的線(xiàn)性關(guān)系,但是基于L2范式的PCA被證明對(duì)噪聲或異常非常 敏感。近年來(lái),為了克服PCA的運(yùn)個(gè)缺點(diǎn),一些更加魯棒模型被提出,例如RPCAUobust Principal Component Analysis),基于Ll范式的PCA(PCA-Ll)和基于核范數(shù)的IRPCA (Inductive Robust Principal Component Analysis)等。PCA-Ll通過(guò)將PCA中的L2范數(shù)替 換成LI范數(shù)來(lái)衡量散度矩陣,因此運(yùn)種方法具有旋轉(zhuǎn)不變性并對(duì)噪音和異常值健壯。IRPCA 通過(guò)核范式最小化問(wèn)題來(lái)恢復(fù)和表示原始數(shù)據(jù),學(xué)習(xí)得到一個(gè)低秩的投影將給定數(shù)據(jù)映射 到基礎(chǔ)子空間中,進(jìn)而除去或糾正樣本數(shù)據(jù)中可能含有的錯(cuò)誤。和PCA-Ll和IRPCA相比, RPCA無(wú)法處理新來(lái)數(shù)據(jù),即直推式模型。盡管上述PCA-Ll和IRPCA均能夠有效提升數(shù)據(jù)特征 描述過(guò)程中魯棒性,但是發(fā)明人發(fā)現(xiàn),上述技術(shù)方案只考慮了特征提取問(wèn)題,且在特征提取 的過(guò)程中只考慮了數(shù)據(jù)的低秩或稀疏特性,但是卻無(wú)法保證提取得到的魯棒特征對(duì)于分類(lèi) 是最優(yōu)的。
[0004] 綜上所述,如何提供一種能夠在進(jìn)行聯(lián)合低秩與稀疏主成分特征提取的同時(shí),確 保得到的聯(lián)合主成分特征對(duì)于分類(lèi)是最優(yōu)的的技術(shù)方案,是目前本領(lǐng)域技術(shù)人員亟待解決 的問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺(jué)分類(lèi)方法及系統(tǒng),為了 確保得到的聯(lián)合主成分特征對(duì)于分類(lèi)是最優(yōu)的,本發(fā)明將魯棒主成分特征學(xué)習(xí)、編碼錯(cuò)誤 和基于主成分特征的分類(lèi)錯(cuò)誤集成到一個(gè)統(tǒng)一的最小化框架,W克服現(xiàn)有技術(shù)中只是單純 關(guān)注于編碼低秩或稀疏主成分特征,且沒(méi)有同時(shí)考慮聯(lián)合分類(lèi)的問(wèn)題,即本申請(qǐng)能夠在進(jìn) 行聯(lián)合低秩與稀疏主成分特征提取的同時(shí),確保得到的聯(lián)合主成分特征對(duì)于分類(lèi)是最優(yōu) 的。
[0006] -種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺(jué)分類(lèi)方法,包括:
[0007] 基于訓(xùn)練樣本集,通過(guò)將魯棒主成分特征學(xué)習(xí)、編碼錯(cuò)誤和基于主成分特征的分 類(lèi)錯(cuò)誤集成到一個(gè)統(tǒng)一的最小化框架,可同時(shí)進(jìn)行聯(lián)合低秩與稀疏主成分特征提取和數(shù)據(jù) 糾錯(cuò),且可確保得到的聯(lián)合主成分特征對(duì)于分類(lèi)是最優(yōu)的;為了得到描述性更強(qiáng)的魯棒特 征,同時(shí)考慮了數(shù)據(jù)的魯棒與稀疏特性,同時(shí)將經(jīng)過(guò)一個(gè)投影嵌入的特征進(jìn)行低秩和Ll-范 數(shù)最小化,確保提取的特征滿(mǎn)足低秩與稀疏特性;最終得到一個(gè)線(xiàn)性投影矩陣和一個(gè)線(xiàn)性 分類(lèi)器;其中,所述訓(xùn)練樣本集中包含的訓(xùn)練樣本為已知其類(lèi)別的樣本;
[0008] 利用所述線(xiàn)性投影矩陣通過(guò)嵌入方式提取待測(cè)樣本的聯(lián)合低秩與稀疏主成分特 征;其中,所述待測(cè)樣本為未知其類(lèi)別的樣本;
[0009] 將提取到的所述待測(cè)樣本對(duì)應(yīng)的聯(lián)合低秩與稀疏主成分特征向所述線(xiàn)性分類(lèi)器 進(jìn)行映射,得到所述待測(cè)樣本的軟類(lèi)別標(biāo)簽,其中包括測(cè)試樣本歸屬各個(gè)類(lèi)別的概率,根據(jù) 所述概率中最大值對(duì)應(yīng)的位置,確定為所述待測(cè)樣本的類(lèi)別,完成分類(lèi)過(guò)程。
[0010] 優(yōu)選的,在基于所述待測(cè)樣本集得到所述線(xiàn)性投影矩陣及所述線(xiàn)性分類(lèi)器之前, 還包括:
[0011] 對(duì)所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行預(yù)處理。
[0012] 優(yōu)選的,基于所述待測(cè)樣本集得到所述線(xiàn)性投影矩陣及所述線(xiàn)性分類(lèi)器,包括:
[0013] 按照下列公式將所述訓(xùn)練樣本集分解為一個(gè)聯(lián)合特征矩陣PX和一個(gè)稀疏錯(cuò)誤矩 陣E,并得到所述線(xiàn)性投影矩陣P及所述線(xiàn)性分類(lèi)器W:
[0014] 總聲圳I* +〇||腳| +尸|礦盧叫I" +義I怎I
[0015] s.t.X = PX+E
[0016] 其中,X表示所述訓(xùn)練樣本集,義=|>1,義2,...,而^]£化^&',]1表示每個(gè)所述訓(xùn)練樣本 的維度,N表示所述訓(xùn)練樣本的數(shù)量,化表示nXN的矩陣空間,MHT-xTpTw||2,i表示基于魯 棒1 2'1范數(shù)度量的分類(lèi)錯(cuò)誤;QE [0,1]表示用于權(quán)衡低秩主成分特征編碼和稀疏主成分特 征編碼的最小化項(xiàng);丫表示正的權(quán)衡參數(shù),為了衡量分類(lèi)錯(cuò)誤項(xiàng)||HT-xTpTw| ki的貢獻(xiàn)程 度;A>0表示依賴(lài)于錯(cuò)誤或噪音級(jí)別的權(quán)衡參數(shù);巧=執(zhí)為Jw]e政"W,表示與所述訓(xùn)練 樣本的類(lèi)別對(duì)應(yīng)的初始標(biāo)簽,C表示所述訓(xùn)練樣本中包含的類(lèi)別的個(gè)數(shù),政《^表示CXN的矩 陣空間;I IeMi表示稀疏錯(cuò)誤項(xiàng),Il ? II*表示核范數(shù),Il ? 111表示Ii范數(shù),Il ? Iki表示I2 '1范數(shù)。
[0017] 優(yōu)選的,利用所述線(xiàn)性投影矩陣通過(guò)嵌入方式提取待測(cè)樣本的聯(lián)合低秩與稀疏主 成分特征,包括:
[0018] 將所述待測(cè)樣本向所述線(xiàn)性投影矩陣進(jìn)行嵌入,得到對(duì)應(yīng)的嵌入結(jié)果即為所述待 測(cè)樣本的聯(lián)合低秩與稀疏主成分特征。
[0019] -種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺(jué)分類(lèi)系統(tǒng),包括:
[0020] 訓(xùn)練模塊,用于:基于訓(xùn)練樣本集,通過(guò)將魯棒主成分特征學(xué)習(xí)、編碼錯(cuò)誤和基于 主成分特征的分類(lèi)錯(cuò)誤集成到一個(gè)統(tǒng)一的最小化框架,可同時(shí)進(jìn)行聯(lián)合低秩與稀疏主成分 特征提取和數(shù)據(jù)糾錯(cuò),且可確保得到的聯(lián)合主成分特征對(duì)于分類(lèi)是最優(yōu)的;為了得到描述 性更強(qiáng)的魯棒特征,同時(shí)考慮了數(shù)據(jù)的魯棒與稀疏特性,同時(shí)將經(jīng)過(guò)一個(gè)投影嵌入的特征 進(jìn)行低秩和Ll-范數(shù)最小化,確保提取的特征滿(mǎn)足低秩與稀疏特性;最終得到一個(gè)線(xiàn)性投影 矩陣和一個(gè)線(xiàn)性分類(lèi)器;其中,所述訓(xùn)練樣本集中包含的訓(xùn)練樣本為已知其類(lèi)別的樣本;
[0021 ]投影模塊,用于利用所述線(xiàn)性投影矩陣通過(guò)嵌入方式提取待測(cè)樣本的聯(lián)合低秩與 稀疏主成分特征;其中,所述待測(cè)樣本為未知其類(lèi)別的樣本;
[0022] 分類(lèi)模塊,用于將提取到的所述待測(cè)樣本對(duì)應(yīng)的聯(lián)合低秩與稀疏主成分特征向所 述線(xiàn)性分類(lèi)器進(jìn)行映射,得到所述待測(cè)樣本的軟類(lèi)別標(biāo)簽,其中包括測(cè)試樣本歸屬各個(gè)類(lèi) 別的概率,根據(jù)所述概率中最大值對(duì)應(yīng)的位置,確定為所述待測(cè)樣本的類(lèi)別,完成分類(lèi)過(guò) 程。
[0023] 優(yōu)選的,還包括:
[0024] 訓(xùn)練預(yù)處理模塊,用于對(duì)所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行預(yù)處理。
[0025] 優(yōu)選的,訓(xùn)練模塊包括:
[0026] 訓(xùn)練單元,用于按照下列公式將所述訓(xùn)練樣本集分解為一個(gè)聯(lián)合特征矩陣PX和一 個(gè)稀疏錯(cuò)誤矩陣E:
[0027] |^?(1-?)||尸義||*+?|Rr| +/Il巧7' +乂I 應(yīng)I [002引 s.t.X = PX+E
[0029] 其中,X表示所述訓(xùn)練樣本集,X = [.Yi,jc2,...,Xv] E化"<&',n表示每個(gè)所述訓(xùn)練樣本 的維度,N表示所述訓(xùn)練樣本的數(shù)量,ITXW表示n X N的矩陣空間,M HT-XTpTw M 2,1表示基于魯 棒12'1范數(shù)度量的分類(lèi)錯(cuò)誤;QE [0,1]表示用于權(quán)衡低秩主成分特征編碼和稀疏主成分特 征編碼的最小化項(xiàng);丫表示正的權(quán)衡參數(shù),為了衡量分類(lèi)錯(cuò)誤項(xiàng)||HT-xTpTw| ki的貢獻(xiàn)程 度;A>0表示依賴(lài)于錯(cuò)誤或噪音級(jí)別的權(quán)衡參數(shù);巧=化,/;2,...,4^,]€股"'\',表示與所述訓(xùn)練 樣本的類(lèi)別對(duì)應(yīng)的初始標(biāo)簽,C表示所述訓(xùn)練樣本中包含的類(lèi)別的個(gè)數(shù),吸aw表示CXN的矩 陣空間;I IeMi表示稀疏錯(cuò)誤項(xiàng),Il ? II*表示核范數(shù),Il ? 111表示Ii范數(shù),Il ? Iki表示I2 '1范數(shù)。
[0030] 優(yōu)選的,投影模塊包括:
[0031] 投影單元,用于將所述待測(cè)樣本向所述線(xiàn)性投影矩陣進(jìn)行嵌入,得到對(duì)應(yīng)的嵌入 結(jié)果即為所述待測(cè)樣本的聯(lián)合低秩與稀疏主成分特征。
[0032] 經(jīng)由本發(fā)明公開(kāi)的上述技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明公開(kāi)了一種聯(lián)合 魯棒主成分特征學(xué)習(xí)與視覺(jué)分類(lèi)的新方案,通過(guò)對(duì)訓(xùn)練樣本運(yùn)用該方案進(jìn)行聯(lián)合訓(xùn)練