本發(fā)明涉及一種人臉識別方法,特別是一種基于二次近鄰稀疏重構(gòu)的人臉識別方法。
背景技術(shù):
如今,在交通運輸領(lǐng)域,特別是對安全等級要求較高的機場、車站等都通過計算機視覺系統(tǒng)進行實時安全監(jiān)控,任何對視頻中相關(guān)特征的提取和分析都基于人臉。因此,魯棒性人臉識別是目前生物特征識別領(lǐng)域的研究熱點與難點。這其中基于特征提取的方法,比如主成分分析(PCA)、二維主成分分析(2DPCA)和線性鑒別分析(LDA),均旨在尋找目標圖像的低維特征與分類的相關(guān)性。在此基礎(chǔ)上,針對光線、角度、甚至遮擋等更為復(fù)雜的環(huán)境,很多專家學者提出了新的技術(shù)與理論,也確在一定程度上提升了人臉識別的性能。但至今還沒有權(quán)威的高維圖像到低維空間的變換準則。其中基于PCA提取特征,由于須將二維圖像矩陣轉(zhuǎn)換為一維列向量,破壞了圖像的結(jié)構(gòu)性信息;2DPCA雖直接基于二維圖像矩陣提取特征,但不能提取對人臉識別很重要的局部成分;而LAD常常面臨“小樣本”問題,在單訓(xùn)練樣本情況下,該算法就失效了。近年來,基于壓縮感知編碼理論的稀疏表示(SRC)因?qū)D像噪聲不敏感而引起廣泛關(guān)注。此模型最先由WRIGHT等提出,它通過在高維空間對人臉圖像的估計來完成模式分類。此外,一些學者通過在稀疏求解中嵌入迭代加權(quán)系數(shù),提出了魯棒性更強的方法。由于SRC以l1-范數(shù)求解稀疏系數(shù),需要迭代,致使計算的復(fù)雜度較高。對此Yang和Zhang提出基于Gabor變換提取圖像局部方向性特征用于SRC,降低了算法的復(fù)雜度,且識別效果更佳。
通常在實際應(yīng)用中,用于訓(xùn)練的樣本往往是不完備的,這樣在使用SRC求解系數(shù)時,即使目標樣本確定歸屬,有限的屬類樣本也很難線性相關(guān)。因此,ZHANG等人通過分析指出類間樣本的相似性對于稀疏表示的作用,遂提出協(xié)同表示分類(CRC),此算法基于l2-范數(shù)的稀疏求解在大幅縮短運行時間的同時,依然保持和SRC相當?shù)淖R別效果。在此基礎(chǔ)上,有很多改進方案。比如有學者利用圖像的低維特征實施CRC分類,提高了識別率。LIN提出魯棒協(xié)同表示(RCR),此方法計算復(fù)雜度大大降低。此外,TIMOFT、WAQAS、LU指出樣本的有效局部信息對稀疏表示的重要性,通過訓(xùn)練樣本與目標樣本的相似度構(gòu)建加權(quán)矩陣,嵌入在系數(shù)求解中,分別提出加權(quán)稀疏表示,有效增強了分類性能。但此方法基于整個數(shù)據(jù)集協(xié)同表示前,要權(quán)衡各訓(xùn)練樣本與目標樣本的相似度,一定程度上會降低運行的效率。ZHANG等針對樣本中的光照、角度、姿態(tài)等信息不能有效利用對分類的干擾,通過不同場景構(gòu)造虛擬樣本嵌入在各類訓(xùn)練樣本中,雖然有較好的識別效果,但擴張的訓(xùn)練樣本無疑會消耗系數(shù)求解的時間。XU等通過階段性縮小目標類別的二級分類法使識別更精確,但同樣基于整個數(shù)據(jù)集的協(xié)同表示在運行時間上沒有太大優(yōu)勢。
綜上近年來流行的基于CRC方法的分析,均有著共同特征,即都是基于整個數(shù)據(jù)集進行協(xié)同表示,通過重構(gòu)完成模式分類。這里有兩個問題:(1)人臉庫規(guī)模較大,用所有樣本協(xié)同表示,勢必會降低系數(shù)求解的速度;(2)同類圖像不可避免存在遮擋,倘若既使用有遮擋也使用無遮擋的樣本去協(xié)同表示待測圖像,則必然會影響到表示的效果。并且ZHANG等驗證了只有合適的樣本數(shù)量才能獲得更高的識別率。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種對圖像本身存在的噪聲不敏感且整體識別性能都較高的二次近鄰稀疏重構(gòu)人臉識別新方法。
為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種基于二次近鄰稀疏重構(gòu)的人臉識別方法,其特征在于包含以下步驟:
Step1:人臉數(shù)據(jù)庫包含了C個人的圖像,每個人有ni幅圖像,每幅圖像大小為m×n,定義訓(xùn)練樣本集測試樣本為Y∈Rm×n,將各類訓(xùn)練樣本矢量化為這樣第i類訓(xùn)練樣本組成的矩陣為C類訓(xùn)練樣本構(gòu)成的矩陣為Χ=[Χ1,…,XC]∈Rm×N,將測試樣本Y矢量化為y∈Rm×1;
Step2:計算各訓(xùn)練樣本與y之間的距離,并找出各類訓(xùn)練樣本中與測試樣本y距離最近的K個近鄰樣本,第i類K個近鄰樣本組成的矩陣為其中p1,p2,…,pK∈[1,ni],則新的近鄰樣本矩陣
Step3:基于協(xié)同表示模型,將作為編碼字典,用最小二乘法求解編碼系數(shù)α,得
Step4:利用系數(shù)向量α中關(guān)聯(lián)于各類訓(xùn)練樣本的稀疏系數(shù)αi分別重構(gòu)測試樣本y,得到屬于各類的重構(gòu)樣本則構(gòu)建新的重構(gòu)樣本集,即
Step5:基于新的重構(gòu)樣本空間計算各類重構(gòu)樣本與測試樣本y的距離,并找出其中與y距離最近的K'個重構(gòu)樣本則新的近鄰重構(gòu)樣本矩陣其中q1,q2,…,qK'∈[1,C];
Step6:再次基于協(xié)同表示模型,將作為新的編碼字典,用最小二乘法求解編碼系數(shù)
Step7:利用系數(shù)向量中關(guān)聯(lián)于各K'近鄰重構(gòu)樣本的稀疏系數(shù)分別再次重構(gòu)測試樣本y,得二次重構(gòu)樣本其中qK'∈[1,C];
Step8:分別計算二次重構(gòu)樣本與測試樣本y的誤差即
Step9:根據(jù)重構(gòu)誤差的最小值判斷測試樣本y的歸屬。
進一步地,與測試樣本y近鄰的原始訓(xùn)練樣本及一次重構(gòu)樣本均通過歐式距離,即公式和計算得到;
進一步地,在第一次協(xié)同表示中,沒有直接根據(jù)測試樣本y與一次重構(gòu)樣本的誤差分類,而是再次選擇與測試樣本y相似的K'個重構(gòu)樣本用于二次重構(gòu)分類。其中qK'∈[1,C];
進一步地,二次協(xié)同表示分類時,測試樣本y與K'近鄰重構(gòu)樣本的誤差通過歐式距離計算得到,而非協(xié)同分類中傳統(tǒng)計算的方式,即
進一步地,所述判斷測試樣本y的歸屬則通過公式判別。
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點和效果:
1、鑒于各訓(xùn)練樣本與測試樣本存在很多局部相似信息,這樣協(xié)同分類在一定程度上會影響到分類的實效。通過選擇更有效的樣本協(xié)同表示可解決稀疏表示分類不穩(wěn)定的問題;
2、選擇和測試樣本更相似的訓(xùn)練樣本協(xié)同表示,在一定程度上提高了基于l2-范數(shù)求解系數(shù)的速度,且這種通過近鄰樣本的稀疏重構(gòu)在分類時依然有較好的識別效果;
3、基于第一次稀疏重構(gòu)的樣本二次選擇近鄰,縮小了分類范圍,使得識別更精確,且進一步縮短了運行時間。
具體實施方式
下面通過實施例對本發(fā)明作進一步的詳細說明,以下實施例是對本發(fā)明的解釋而本發(fā)明并不局限于以下實施例。
本發(fā)明基于二次近鄰稀疏重構(gòu)的人臉識別方法通過選擇和目標樣本更相似的訓(xùn)練樣本協(xié)同表示,可以降低系數(shù)求解時間,對目標樣本進行一次重構(gòu),從與原始樣本類別數(shù)相同的重構(gòu)樣本中二次選擇和目標樣本相近的樣本協(xié)同表示,可以縮小分類目標,使識別更精確,且進一步提高了運算效率。方法具體步驟如下:
Step1:設(shè)人臉數(shù)據(jù)庫包含了C個人的圖像,每個人有ni(i=1,2,…,C)幅圖像,由此定義訓(xùn)練樣本集是第i類第j幅圖像樣本,每幅圖像大小為m×n,測試樣本為Y∈Rm×n,將各類訓(xùn)練樣本矢量化為這樣第i類訓(xùn)練樣本組成的矩陣為C類訓(xùn)練樣本構(gòu)成的矩陣為Χ=[Χ1,…,XC]∈Rm×N,將測試樣本Y矢量化為y∈Rm×1。
Step2:用歐式距離計算第i類訓(xùn)練樣本與測試樣本y的距離即其中i=1,2,…C,j=1,2,…,ni。
Step3:在第i類訓(xùn)練樣本中找出與測試樣本y距離最近的K個近鄰樣本組成第i類近鄰樣本矩陣其中i=1,2,…,C,j=1,2,…,ni,p1,p2,…,pK∈[1,ni]。則新的近鄰樣本構(gòu)成的矩陣為
Step4:將作為協(xié)同表示分類的編碼字典,用最小二乘法求解編碼系數(shù)α,得其中λ為正則化參數(shù),以保持樣本重構(gòu)的穩(wěn)定及稀疏性。
Step5:利用系數(shù)向量α中關(guān)聯(lián)于各類近鄰樣本的稀疏系數(shù)αi各自重構(gòu)測試樣本y,得屬于各類的重構(gòu)樣本即其中i=1,2,…C,式中為第i類近鄰樣本的重構(gòu)。則C個重構(gòu)樣本組成的矩陣為
Step6:用歐式距離計算第i類重構(gòu)樣本與測試樣本y的距離即其中i=1,2,…C。
Step7:在C個重構(gòu)樣本中找出與測試樣本y距離最近的K'個近鄰樣本其中其中i=1,2,…,C,qK'∈[1,C],則K'個近鄰重構(gòu)樣本組成的矩陣為其中q1,q2,…,qK'∈[1,C]。
Step8:再次基于協(xié)同表示模型,將作為編碼字典,用最小二乘法求解編碼系數(shù)得
Step9:利用系數(shù)向量中關(guān)聯(lián)于K'近鄰重構(gòu)樣本的稀疏系數(shù)分別二次重構(gòu)測試樣本y,得各近鄰重構(gòu)樣本即其中qK'∈[1,C],式中為二次近鄰樣本的重構(gòu)。
Step10:根據(jù)歐式距離計算測試樣本y與各近鄰重構(gòu)樣本的誤差即其中qK'∈[1,C]。
Step11:根據(jù)下式判別測試樣本y的歸屬,即
基于整個數(shù)據(jù)集的稀疏表示在實際應(yīng)用中存在一定的缺陷,為進一步提升CRC在人臉識別中的性能,設(shè)計一種基于二次近鄰的稀疏重構(gòu)分類法。通過仿真實驗證明,本發(fā)明的人臉識別方法在識別性能上有很大的提升。該方法首先在原始樣本集上尋找測試樣本的近鄰,即僅選擇適合數(shù)量且有效的樣本協(xié)同表示,在一定程度上提高了系數(shù)求解的速度;然后分別用各類近鄰樣本稀疏重構(gòu)待測樣本,得到與原始樣本類別數(shù)相同的重構(gòu)樣本;接著基于重構(gòu)樣本集再次尋找測試樣本的近鄰,并協(xié)同表示,進行二次重構(gòu),最終實現(xiàn)模式分類。這種通過二次近鄰選擇更有效的樣本稀疏重構(gòu)方法進一步縮小了類別范圍,可使分類更精確,同時縮短了運行時間。
本說明書中所描述的以上內(nèi)容僅僅是對本發(fā)明所作的舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實施例做各種修改或補充或采用類似的方式替代,只要不偏離本發(fā)明說明書的內(nèi)容或者超越本權(quán)利要求書所定義的范圍,均應(yīng)屬于本發(fā)明的保護范圍。