專利名稱:一種計算復(fù)雜度低的人臉識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理、計算機視覺、模式識別技術(shù)領(lǐng)域,特別涉及人臉識別方法。
背景技術(shù):
近幾十年來,人臉識別是計算機視覺和模式識別領(lǐng)域研究的一個熱點問題。對于識別問題,尋找有效的圖像特征是解決問題的關(guān)鍵。以往的研究中,圖像特征主要分為視覺特征、統(tǒng)計特征、變換系數(shù)特征和代數(shù)特征。
文章Hong Z.Q.Algebraic feature extraction of image for recognition.Pattern Recognition,1991,24(3)211-219[1]中Hong首次提出了將奇異值向量作為圖像的一種代數(shù)特征,并證明了其具有穩(wěn)定性、旋轉(zhuǎn)不變性、平移不變性等良好性質(zhì)。基于此,文獻“周德龍,高文,趙德斌。基于奇異值分解和判別式KL投影的人臉識別。軟件學報,2003,14(4)783-789”、“王蘊紅,譚鐵牛,朱勇。基于奇異值分解和數(shù)據(jù)融合的臉像鑒別。計算機學報,23(6)649-653”、“魏小鵬,于萬波,金一粟。奇異值方法用于汽車模型識別。中國圖像圖形學報,2003,8A(1)47-50”等文將奇異值向量作為圖像的一種有效的代數(shù)特征用于人臉識別中。但是,文獻Tian Y.,TanT.N.Do singular values contain adequate information for face recognition?Pattern Recognition,2003,36649-655的研究表明,人臉圖像的奇異值向量并非包含了圖像的足夠信息,圖像的大量信息體現(xiàn)在圖像矩陣奇異值分解的兩個正交矩陣中,并提出了一種基于投影系數(shù)向量的特征提取和人臉識別方法。
發(fā)明內(nèi)容
本發(fā)明的目的是提出一種計算復(fù)雜度低的人臉識別方法。該法不僅所需的運行時間明顯降低,提高了效率,而且其識別精度也明顯優(yōu)于常規(guī)同類方法。
為實現(xiàn)上述目的,本發(fā)明提出了一種計算復(fù)雜度低的人臉識別方法。其技術(shù)方案是理論證明了圖像的大量信息主要體現(xiàn)在奇異值分解最大的k個奇異值所對應(yīng)的左、右奇異向量中;并利用奇異值分解的近似表示,給出了模板圖像的一組基圖像;然后將圖像表達成該組基圖像的線性表示,將其組合系數(shù)作為圖像的代數(shù)特征并用于人臉識別中。
本發(fā)明的人臉識別原理詳細說明如下定理1(SVD)對于任一個秩為r的矩陣A∈RN×M,必有兩個正交矩陣U,V使得A=UΣVT=ΣI=1rσiuiviT---(1)]]>其中符號“T”表示矩陣轉(zhuǎn)置;∑=diag(σ1,σ2,…,σr,0,…,0),U=(u1,u2,…,uN)∈RN×N,V=(v1,v2,…,vM)∈RM×M。σi(i=1,…,r)均為實數(shù),即為A的奇異值;ui,vi(i=1,…,r)分別稱為矩陣A的屬于σi的左、右奇異向量。
由奇異值分解的性質(zhì)可知,σi與左、右奇異向量ui,vi(i=1,…,r)是一一對應(yīng)的;且當σi(i=1,…,r)按從大到小的順序排列時,后面的大部分奇異值幾乎為零。這樣,式(1)可近似表示為A=Σi=1rσiuiviT≈Σi=1kσiuiviT(k<r)---(2)]]>該表示所產(chǎn)生的誤差為D=Σi=1rσiuiviT-Σi=1kσiuiviT=Σi=k+1rσiuiviT---(3)]]>文獻“Maria P.,Panagiota B.(賴劍煌,馮國燦等譯)。數(shù)字圖像處理疑難解析。北京機械工業(yè)出版社,2005”給出了用式(2)的近似表示重建圖像A的所損失的能量為||D||=Σi=k+1rσi2---(4)]]>即后面的r-k個奇異值的平方和,其中‖·‖為Frobenius范數(shù)。這樣,當奇異值σi(1≤i≤r)按從大到小的順序排列時,用式(2)近似重建圖像A的所損失的能量是很小的。
可以用文獻“Maria P.,Panagiota B.(賴劍煌,馮國燦等譯)。數(shù)字圖像處理疑難解析。北京機械工業(yè)出版社,2005”的方法類似證明圖像A的能量為||A||=Σi=1rσi2---(5)]]>于是式(2)中k值的選取應(yīng)滿足下面的不等式Σi=1kσi2/Σi=1rσi2≥θ---(6)]]>其中θ是一個預(yù)給的門限值,如θ=0.95。
文獻“Tian Y.,Tan T.N.Do singular values contain adequate information for face recognition?Pattern Recognition,2003,36649-655”證明了圖像的大量信息體現(xiàn)在圖像矩陣的SVD的兩個正交矩陣中。這里,我們將進一步說明圖像的大量信息體現(xiàn)在SVD最大的k個奇異值所對應(yīng)的左、右奇異向量中。設(shè)A,A′是兩幅同類型的圖像,對其分別作奇異值分解A=Σi=1rσiuiviT,A′=Σi=1rσi′ui′vi′T---(7)]]>令U=(u1,u2,…,uN),V=(v1,v2,…,vM),U′=(u1′,u2′,…,uN′),V′=(v1′,v2′,…,vM′)。設(shè)k(k<r)是一給定的數(shù),交換u1,u2,…,uk和u1′,u2′,…,uk′,并交換v1,v2,…,vk和v1′,v2′,…,vk′,然后按式(2)重建兩幅圖像;同樣,交換后面的k對左、右奇異向量,然后在按式(2)重建兩幅圖像。
設(shè)一模板圖像A,由式(2)可將其表示為A≈σ1u1v1T+σ2u2v2T+···+σkukvkT---(8)]]>
其中,σi(i=1,…,r)為A的按從大到小排列的最大的k個奇異值;u1,…,uk,v1,…,vk為A的屬于σi的k對左、右奇異向量。
由于圖像A的大量信息體現(xiàn)在這前k對向量中。我們稱u1v1T,u2v2T,…,ukvkT為圖像A奇異值分解的基圖像。這樣,式(8)中,模板圖像A是基圖像u1v1T,u2v2T,…,ukvkT的線性組合,其組合系數(shù)即為最大的k個奇異值σ1,σ2,…,σk。我們將這k個奇異值視為圖像A的代數(shù)特征。
設(shè)B為任一幅圖像,相對于模板圖像A,可將圖像B表示為基圖像u1v1T,u2v2T,…,ukvkT的線性組合,B=τ1u1v1T+τ2u2v2T+···+τkukvkT---(9)]]>這樣,由于圖像A的大量信息體現(xiàn)在列向量u1,…,uk,v1,…,vk中,組合系數(shù)τ1,τ2,…,τk描述了圖像B與模板圖像A的相似程度。于是,我們可以抽取組合系數(shù)τ1,τ2,…,τk作為圖像B的代數(shù)特征。因為ui,vi(i=1,…,k)是互相正交的列向量,式(9)中的組合系數(shù)由下式可得τi=uiTBvi(i=1,···,k)---(10)]]>假定訓練圖像庫有c個人,每個人有M個樣本Aj(j=1,2,…,M)。設(shè)每一幅圖像的大小為n×m,p=min(m,n)。下面給出了將上述組合系數(shù)用于人臉識別的算法的主要步驟1.對第i個人的樣本圖像,計算其平均圖像BiBi=1MΣj=1MAj(i=1,2,···,c)---(11)]]>并將其作為第i個人的模板圖像;2.對Bi作奇異值分解。并按預(yù)給的門限值θ確定k值,給出第i個模板圖像Bi的最大的k個奇異值所作成的奇異值向量SMi,及對應(yīng)的k個基圖像u1v1T,u2v2T,…,ukvkT,并將SMi作為第i個人的代數(shù)特征;3.對待識別的人臉圖像B,將B表示為第i個模板圖像Bi的基圖像u1v1T,u2v2T,…,ukvkT的線性組合,B=τ1u1v1T+τ2u2v2T+···+τkukvkT---(12)]]>將組合系數(shù)τ1,τ2,…,τk作為圖像B相對于Bi的代數(shù)特征,并作向量τ=(τ1,τ2,…,τk)T;4.用最近鄰法分類。計算B的第i個向量τ與奇異值向量SMi之間的距離
di=d(τ,SMi)=||τ-SMi||---(13)]]>若di0=mini(di),]]>則人臉圖像B屬于第i0個人。
圖1給出了當k=30,20,10,5時由式(2)所得的重建圖像。從圖1可見重建圖像所損失的能量是很小的,且當k值越大時重建圖像越接近原始圖像。在該圖中(a)、(b)、(c)、(d)、(e)分別為原始圖象、k=30、k=20、k=10、k=5五種情況。
圖2是k=30時原始圖像與各種情況重建圖像的比較。其中,(a)為原始圖像,(b)為交換U與U′、V與V′前k列向量時圖像,(c)為交換U與U′、V與V′后k列向量時圖像,(d)為僅交換U與U′的前k列向量圖像。由圖2的(b)(c)可知,最大的k個奇異值所對應(yīng)的左、右奇異向量的變化將引起圖像的巨大變化,而圖像對最小的k個奇異值所對應(yīng)的左、右奇異向量的變化是不敏感的;由(d)可知,圖像信息體現(xiàn)在左、右奇異向量中,而并非僅在左或右奇異向量中。
圖3是本專利技術(shù)的流程框圖。
具體實施例方式下面通過具體的實施對本發(fā)明的技術(shù)方案作進一步的描述。
我們在ORL人臉庫(http://www.uk.research.att.com/facedatabase.html)上做了實驗。ORL人臉庫由40個人,每個人10幅圖像,共400幅人臉圖像構(gòu)成。圖像的大小為112×92。對每個人的10幅圖像有姿態(tài)、表情和臉部細節(jié)(如是否戴眼鏡)等的變化;對一些圖像,可能是在不同的時期獲取的。在實驗中,我們比較了三種方法文[1]基于奇異值向量作為代數(shù)特征的方法、文[5]中的投影系數(shù)向量作為代數(shù)特征的方法及本文提出的方法的識別精度及所需的運行時間。
具體步驟為1、選擇任意模板圖像A,可以將其進行奇異值分解為A≈σ1u1v1T+σ2u2v2T+···+σkukvkT,---(14)]]>其中,σi(i=1,…,r)為A的按從大到小排列的最大的k個奇異值;u1…,uk,v1…,vk為A的屬于σi的k對左、右奇異向量。圖像A的大量信息體現(xiàn)在這前k對向量中。
我們稱u1v1T,u2v2T,…,ukvkT為圖像A奇異值分解的基圖像。這樣,式(14)中,模板圖像A是基圖像u1v1T,u2v2T,…,ukvkT的線性組合,其組合系數(shù)即為最大的k個奇異值σ1,σ2,…,σk。我們將這k個奇異值視為圖像A的代數(shù)特征。
2、設(shè)B為任意幅圖像,相對于模板圖像A,可將圖像B表示為基圖像u1v1T,u2v2T,…,ukvkT的線性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT.---(15)]]>式(15)中的組合系數(shù)由下式可得τi=uiTBvi(i=1,···,k)---(16)]]>3、假定訓練圖像庫有c個人,每個人有M個樣本Aj(j=1,2,…,M)。設(shè)每一幅圖像的大小為n×m,p=min(m,n)。
對第i個人的樣本圖像,計算其平均圖像BiBi=1MΣj=1MAj(i=1,2,···,c)---(17)]]>并將其作為第i個人的模板圖像;4、對Bi作奇異值分解。并按預(yù)給的門限值θ確定k值,給出第i個模板圖像Bi的最大的k個奇異值所作成的奇異值向量SMi,及對應(yīng)的k個基圖像u1v1T,u2v2T,…,ukvkT,并將SMi作為第i個人的代數(shù)特征;5、對待識別的人臉圖像B,將B表示為第i個模板圖像Bi的基圖像u1v1T,u2v2T,…,ukvkT的線性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT---(18)]]>將組合系數(shù)τ1,τ2,…,τk作為圖像B相對于Bi的代數(shù)特征,并作向量τ=(τ1,τ2,…,τk)T;6、用最近鄰法分類。計算B的第i個向量τi與奇異值向量SMi之間的距離di=d(τi,SMi)=||τi-SMi||---(19)]]>若di0=mini(di),]]>則人臉圖像B屬于第i0個人。
權(quán)利要求
1.本發(fā)明涉及一種計算復(fù)雜度低的人臉識別方法,其特征在于包括如下步驟步驟1、選擇任意模板圖像A,可以將其進行奇異值分解為A≈σ1u1v1T+σ2u2v2T+···σkukvkT,---(1)]]>其中,σi(i=1,…,r)為A的按從大到小排列的最大的k個奇異值;u1,…,uk,v1,…,vk為A的屬于σi的k對左、右奇異向量。圖像A的大量信息體現(xiàn)在這前k對向量中。我們稱u1v1T,u2v2T,…,ukvkT為圖像A奇異值分解的基圖像。這樣,式(1)中,模板圖像A是基圖像u1v1T,u2v2T,…,ukvkT的線性組合,其組合系數(shù)即為最大的k個奇異值σ1,σ2,…,σk。我們將這k個奇異值視為圖像A的代數(shù)特征。步驟2、設(shè)B為任意幅圖像,相對于模板圖像A,可將圖像B表示為基圖像u1v1T,u2v2T,…,ukvkT的線性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT.---(2)]]>式(2)中的組合系數(shù)由下式可得τi=uiTBvi(i=1,···,k)---(3)]]>步驟3、假定訓練圖像庫有e個人,每個人有M個樣本Aj(j=1,2,…,M)。設(shè)每一幅圖像的大小為n×m,p=min(m,n)。對第i個人的樣本圖像,計算其平均圖像BiBi=1MΣj=1MAj(i=1,2,···,c)---(4)]]>并將其作為第i個人的模板圖像;步驟4對Bi作奇異值分解。并按預(yù)給的門限值θ確定k值,給出第i個模板圖像Bi的最大的k個奇異值所作成的奇異值向量SMi,及對應(yīng)的k個基圖像u1v1T,u2v2T,…,ukvkT,并將SMi作為第i個人的代數(shù)特征;步驟5對待識別的人臉圖像B,將B表示為第i個模板圖像Bi的基圖像u1v1T,u2v2T,…,ukvkT的線性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT]]>將組合系數(shù)τ1,τ2,…,τk作為圖像B相對于Bi的代數(shù)特征,并作向量τ=(τ1,τ2,…,τk)T;步驟6用最近鄰法分類。計算B的第i個向量τ與奇異值向量SMi之間的距離di=d(τ,SMi)=||τ-SMi||]]>若di0=mini(di),]]>則人臉圖像B屬于第i0個人。
2.如權(quán)利要求1所說,一種計算復(fù)雜度低的人臉識別方法,其特征在于基于奇異值分解的基圖像人臉識別方法是基于人臉整體特征方法。
全文摘要
本發(fā)明屬于圖像處理、計算機視覺、模式識別技術(shù)領(lǐng)域。本發(fā)明提供了一種計算復(fù)雜度低的人臉識別方法。該法基于奇異值方法,利用模板圖像的基圖像,將圖像展開成基圖像的線性表示,提取其組合系數(shù)作為圖像的代數(shù)特征并用于人臉識別中。本發(fā)明所需的系數(shù)較少,運行時間明顯降低,而且其識別精度明顯優(yōu)于其他基于奇異值向量作為圖像特征的方法。
文檔編號G06K9/00GK101075292SQ20061003556
公開日2007年11月21日 申請日期2006年5月18日 優(yōu)先權(quán)日2006年5月18日
發(fā)明者羅仁澤, 冉瑞生 申請人:羅仁澤