專利名稱:基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法
基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法技術(shù)領(lǐng)域
本發(fā)明屬于人臉識別技術(shù)領(lǐng)域,涉及一種基于部分主分量分析和姿態(tài)估計聯(lián)合的 姿態(tài)魯棒的人臉識別方法,可以根據(jù)不同姿態(tài)的二維人臉圖生成虛擬三維人臉圖。
背景技術(shù):
近幾十年來,人臉識別一直是計算機視覺領(lǐng)域研究的熱點,它有著廣泛的實際應 用,可應用于人機交互領(lǐng)域、視頻監(jiān)控等。光照、表情和姿態(tài)等方面的變化增大了人臉識別 的難度,其中姿態(tài)變化是人臉識別的最大瓶頸,仍是一個具有挑戰(zhàn)性的課題。為了解決這個 問題,提出了很多方法,可以分為三大方面基于單視角,基于多視角,基于三維模型。在單 視角方法中,主要是提取不變特征,這種方法適用于小角度變化,但在角度變化大的情況下 無效。在多視角方法中,存放每個人各個角度的圖片,對每個角度構(gòu)建一個分類器,這種方 法雖然識別效果好,但是實際中不可能獲取每個人各個角度的照片?,F(xiàn)有技術(shù)中還提出基 于三維模型的人臉識別方法,該模型能夠較好的解決光照和姿態(tài)的變化問題。然而這種方 法存在著一些問題第一,計算量大,不適用于實時處理;第二,需要大量三維掃描模型來 構(gòu)建數(shù)據(jù)庫,在實際應用中,例如在視頻監(jiān)控中,能得到的圖像大部分是二維,一般無法獲 得三維信息,因此該方法的應用受限。發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述不足而提供一種簡單的基于部分主分量分析和姿態(tài) 估計聯(lián)合的人臉識別方法,以對不同姿態(tài)下的人臉進行識別。
為實現(xiàn)上述目的,本發(fā)明所采取的技術(shù)方案的主要步驟如下
(1)在原始樣本庫中事先存放虛擬三維人臉圖,應用主分量分析法計算所述原始 樣本庫中的擴展人臉空間;且應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對兩幅 不同姿態(tài)的二維訓練人臉圖進行姿態(tài)估計;
(2)根據(jù)步驟(1)得到的姿態(tài)估計結(jié)果在擴展人臉空間中尋找相應的子人臉空 間;
(3)根據(jù)所述兩幅不同姿態(tài)的二維訓練人臉圖、擴展人臉空間和子人臉空間,生成 新的虛擬三維人臉(4)使用所生成的新的虛擬三維人臉圖更新原始樣本庫;
(5)應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法,對待識別二維人臉圖 進行姿態(tài)估計;
(6)利用步驟( 得到的姿態(tài)估計結(jié)果和預設(shè)的查找表,對待識別二維人臉圖進 行截取得到截斷二維測試人臉圖,使用部分主分量分析法對所述截斷二維測試人臉圖進行 識別。
進一步地,本發(fā)明在步驟(1)中,應用部分主分量分析法結(jié)合人眼和嘴巴自動定 位算法對二維訓練人臉圖進行姿態(tài)估計的方法如下4
1)對二維訓練人臉圖用部分主分量分析法進行姿態(tài)估計,將姿態(tài)估計結(jié)果記為 Pl ;
2)利用姿態(tài)估計結(jié)果Pl和所述預設(shè)的查找表對所述二維訓練人臉圖截取,得到 截斷二維訓練人臉3)對所述截斷二維訓練人臉圖采用部分主分量分析法進行姿態(tài)估計,將姿態(tài)估計 結(jié)果記為P2 ;
4)計算Pl和P2的差,若Pl和P2的差的絕對值小于預設(shè)的閾值,則以Pl作為二 維訓練人臉圖的最終姿態(tài)估計結(jié)果;否則對所述二維訓練人臉圖進行眼睛和嘴巴的定位, 并根據(jù)定位結(jié)果估計姿態(tài),將姿態(tài)估計結(jié)果記為P3 ;
5)比較P3和Pl是否一致,若一致,則以Pl作為二維訓練人臉圖的最終姿態(tài)估計 結(jié)果;否則,以P2作為二維訓練人臉圖的最終姿態(tài)估計結(jié)果。
進一步地,本發(fā)明在步驟(5)中,應用部分主分量分析法結(jié)合人眼和嘴巴自動定 位算法對待識別二維人臉圖進行姿態(tài)估計的方法如下
a)對待識別二維人臉圖用部分主分量分析法進行姿態(tài)估計,將姿態(tài)估計結(jié)果記為 P4;
b)利用姿態(tài)估計結(jié)果P4和所述預設(shè)的查找表對所述待識別二維人臉圖截取,得 到截斷待識別二維人臉c)對所述截斷待識別二維人臉圖采用部分主分量分析法進行姿態(tài)估計,將姿態(tài)估 計結(jié)果記為P5 ;
d)計算P4和P5的差,若P4和P5的差的絕對值小于預設(shè)的閾值,則以P4作為待 識別二維人臉圖的最終姿態(tài)估計結(jié)果;否則對所述待識別二維人臉圖進行眼睛和嘴巴的定 位,并根據(jù)定位結(jié)果估計姿態(tài),將姿態(tài)估計結(jié)果記為P6 ;
f)比較P6和P4是否一致,若一致,則以P4作為待識別二維人臉圖的最終姿態(tài)估 計結(jié)果;否則,以P5作為待識別二維人臉圖的最終姿態(tài)估計結(jié)果。
本發(fā)明相比于現(xiàn)有技術(shù)的主要優(yōu)點為(1)利用兩張不同姿態(tài)的二維訓練人臉圖 生成新的虛擬三維人臉圖來更新原始樣本庫,較多視角方法而言,不需要獲得各個姿態(tài)的 二維訓練人臉圖作為樣本庫,因而本發(fā)明具有廣泛的適用性;( 較基于三維模型的人臉 識別方法而言,本發(fā)明無需利用三維掃描模型來構(gòu)建樣本庫,無需進行三維特征點運算,可 大幅降低計算的復雜性,有利于實時處理,同時又不失多姿態(tài)人臉識別的準確性;C3)較主 分量分析法而言,本發(fā)明對待識別二維人臉圖進行姿態(tài)估計,根據(jù)姿態(tài)估計的結(jié)果,采用部 分主分量分析法進行識別,對姿態(tài)的魯棒性更高;(4)本發(fā)明采用部分主分量分析法結(jié)合 人眼和嘴巴自動定位算法對人臉圖進行姿態(tài)估計,對姿態(tài)估計的準確性更高,同時計算復 雜性較原有的姿態(tài)估計方法并沒有太大增加;( 針對多姿態(tài)人臉識別的目的,根據(jù)預設(shè) 的查找表對待識別二維人臉圖截取,去除了待識別二維人臉圖與虛擬三維人臉圖不相關(guān)的 部分,提高了識別率。(6)本發(fā)明在視頻監(jiān)控領(lǐng)域有很好的應用。
圖1為基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法的流程示意圖2為二維訓練人臉圖和虛擬三維人臉圖的示意圖,其中,(a)為二維訓練人臉圖,(b)為虛擬三維人臉圖3為本發(fā)明基于部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對二維訓練 人臉圖進行姿態(tài)估計的流程圖4為人眼和嘴巴自動定位的結(jié)果圖,其中,(a)為姿態(tài)為0°的二維訓練人臉圖 的人眼和嘴巴定位結(jié)果,(b)為姿態(tài)為30°的二維訓練人臉圖的人眼和嘴巴定位結(jié)果,(c) 為姿態(tài)為60°的二維訓練人臉圖的人眼和嘴巴定位結(jié)果,(d)為姿態(tài)為90°的二維訓練人 臉圖的人眼和嘴巴定位結(jié)果;
圖5為本發(fā)明根據(jù)姿態(tài)為0°和姿態(tài)為90°的二維訓練人臉圖生成虛擬三維人臉 圖的結(jié)果圖,其中,圖(a)為姿態(tài)為0°的二維訓練人臉圖,圖(b)為姿態(tài)為90°的二維訓 練人臉圖,圖(c)為由圖(a)和圖(b)生成的新的虛擬三維人臉圖的結(jié)果圖。
具體實施方式
下面,結(jié)合附圖和具體實施例,以UPC人臉數(shù)據(jù)庫為例進一步舉例說明本發(fā)明。 UPC人臉庫是由44個人的人臉圖組成,每個人有27張人臉圖,分別是在3種不同光照情 況下(自然光,45°方向的強光,0°方向的強光)的9個不同姿態(tài)(0°,士30°,士45°, 士60°,士90° )。其中左邊臉方向假定為正方向。本實施例只考慮在自然光下的姿態(tài)變 化,不考慮其他光照變化情況。
一、如圖1所示,本實施例的步驟如下
步驟1 在原始樣本庫中事先存放虛擬三維人臉圖,應用主分量分析法計算所述 原始樣本庫中的擴展人臉空間
本實施例中UPC人臉數(shù)據(jù)庫的二維人臉圖如圖2(a)所示,將其分辨率歸一化到 122X100像素。原始樣本庫中事先存放了 50張由UPC人臉數(shù)據(jù)庫合成的虛擬三維人臉 圖,如圖2(b)所示,分別由25個人的虛擬三維人臉圖以及虛擬三維人臉圖的鏡像組成。虛 擬三維人臉圖是由正面圖、士45°、士90°共五張人臉圖拼接而成,并將其分辨率歸一化到 122X240像素。主分量分析法的主要目的是通過線性變化找到一組最優(yōu)的單位正交向量 基,用他們的線性組合來重建樣本,使重建后的樣本和原樣本誤差最小。原始樣本庫中的擴 展人臉空間也就是所求的一組最優(yōu)的單位正交向量基。其計算方法如下M
Sr = Y^ixi-μ)^ -μ)Τ( 1 )/=1
式(1)中,St是總體散度矩陣,M為原始樣本庫中的樣本數(shù)量,Xi為原始樣本庫中 第i個虛擬三維人臉圖的按行展開的列向量形式,μ是原始樣本庫中Xi(i = 1,2,. . .,50) 的平均值??傮w散度矩陣&的正交歸一化的特征向量就是子空間的正交基。采用主要的 特征向量作為正交基的方法就稱之為主分量分析法。由于主分量分析法是基于一維信號的 計算,因而其主要步驟如下所示將原始樣本庫中50張?zhí)摂M三維人臉圖按行展開轉(zhuǎn)化為N =122X240維的列向量,其中122和240分別為虛擬三維人臉圖的高度和寬度,50為原始 樣本庫中樣本的數(shù)量。令Xi為原始樣本庫中第i個虛擬三維人臉圖的按行展開的列向量 形式,則原始樣本庫可記為Xi (i = 1,2,...,50)。求出樣本庫Xi (i = 1,2,... ,50)的均值 μ,即均值臉;得到各個樣本與均值臉的差值Φ = Xi-P ;構(gòu)造總體散度矩陣C = AAT, A =[Φ1 Φ2, ... , Φ ];計算C的特征向量Vi,由于C是ΝΧΝ(Ν= 122X240)矩陣,N非常大會使得計算量很大。因而轉(zhuǎn)求AtA(MXM)的特征值λ 正交歸一化特征向量Ui,C的特 征向量Vi可以通過下式得到
vi⑵
將特征值λ ^人大到小順序,選取前k個最大特征值對應的非零特征向量Vi,其中, 作為本發(fā)明的優(yōu)選實施方式,k的選取可滿足的條件是前k個特征值的能量大于所有C的 特征值的總能量的90%。本實施例取k值為20。由各特征向量Vi(i = 1,2,...,20)組成 的子空間V就是特征向量空間,也就是擴展人臉空間。
步驟2 應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對兩幅不同姿態(tài)的 二維訓練人臉圖進行姿態(tài)估計,將最終姿態(tài)估計結(jié)果記為Q、Q’,其主要流程圖見圖3。
姿態(tài)估計的準確性不僅關(guān)系到合成的新的虛擬三維人臉圖的精度還影響到識別 率,由于應用部分主分量分析法對二維訓練人臉圖進行姿態(tài)估計的準確性并不是很高,可 以進一步提高,因此采用圖3所示的步驟,具體如下
1)對兩幅不同姿態(tài)的二維訓練人臉圖用部分主分量分析法進行姿態(tài)估計,將姿態(tài) 估計結(jié)果分別記為Pi、ΡΓ ;
其主要步驟是對原始樣本庫利用二維主分量分析法求得最優(yōu)投影軸zk, (k'= 1,...,N),具體如下__ι M__
Gt= [E(I-7)T(/-7)] =—£(I, -7)T(Ii -Τ)(3)Mtt
式(3)中,Gi為圖像的協(xié)方差矩陣,M為原始樣本庫中的樣本數(shù)量,Ii為原始樣本 庫中第1個虛擬三維人臉圖,7表示原始樣本庫中^1 = 1,2,...,50)的平均值。求得Gt 的特征值,對其特征值進行由大到小排序,前k’個最大特征值對應的特征向量即所要求的 最優(yōu)投影軸V (k' = 1,...,N),其中,作為本發(fā)明的優(yōu)選實施方式,k’的選取可滿足的條 件是前k’個最大特征值的能量大于所有Gt的特征值的總能量的90%。本實施例取k’ = 16。式中得到的j就是二維訓練人臉圖的姿態(tài)
min(X X (5,(/)-^(/ + 7))2}(4)3 A=I /=1
式中,N表示最優(yōu)投影軸的個數(shù),且N = k’,向量%表示二維訓練人臉圖在最 優(yōu)投影軸Zk,上的投影。每個向量%有卩個元素,其中P是二維訓練人臉圖的寬度,表示 7在最優(yōu)投影軸上的投影。由兩幅不同姿態(tài)的二維訓練人臉圖就可以得到兩個不同的 二維訓練人臉圖的姿態(tài)j和j’。其中,j即為其中一幅二維訓練人臉圖的姿態(tài)估計結(jié)果Pl, j’為另一幅二維訓練人臉圖的姿態(tài)估計結(jié)果ΡΓ。
2)利用姿態(tài)估計結(jié)果P1、ΡΓ和所述預設(shè)的查找表對所述二維訓練人臉圖截取, 得到兩幅截斷二維訓練人臉圖
通過對虛擬三維人臉圖和二維訓練人臉圖的比較,可以發(fā)現(xiàn)二維訓練人臉圖的某 些區(qū)域與虛擬三維人臉圖有很高的相關(guān)性,但有些地方是完全不相關(guān),因此如果利用了這 些不相關(guān)的信息會降低新的虛擬三維人臉圖的準確性,同時降低識別的準確性。因而,在生 成新的虛擬三維人臉圖的算法中的二維訓練人臉圖可以由與虛擬三維人臉圖相關(guān)性高的 部分代替,即得到截斷二維訓練人臉圖。所述預設(shè)的查找表是不同姿態(tài)的截斷二維訓練人臉圖截取寬度范圍的選取,截取寬度范圍的選取與二維訓練人臉圖和虛擬三維人臉圖的分 辨率有關(guān),是一種基于經(jīng)驗的設(shè)置,單位為像素。預設(shè)的查找表中截取寬度范圍的選取是通 過實驗選取,使得UPC人臉數(shù)據(jù)庫中不同姿態(tài)的待識別二維人臉圖的識別率最佳,表1示出 了一種查找表。其中UPC人臉數(shù)據(jù)庫中二維訓練人臉圖和待識別二維人臉圖的分辨率為 122X100像素,虛擬三維人臉圖的分辨率為122X240像素??紤]到30°,45°,60°之間 以及-30°,-45°,-60°之間區(qū)別很小,因而查找表中姿態(tài)為30°,45°,60°的二維訓練 人臉圖的截取寬帶范圍是一樣的,且姿態(tài)為-30°,-45°,-60°的二維訓練人臉圖的截取 寬帶范圍也是一樣的。
表1查找表
權(quán)利要求
1. 一種基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法,其特征在于包括如下步驟(1)在原始樣本庫中事先存放虛擬三維人臉圖,應用主分量分析法計算所述原始樣本 庫中的擴展人臉空間;且應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對兩幅不同 姿態(tài)的二維訓練人臉圖進行姿態(tài)估計;(2)根據(jù)步驟(1)得到的姿態(tài)估計結(jié)果在擴展人臉空間中尋找相應的子人臉空間;(3)根據(jù)所述兩幅不同姿態(tài)的二維訓練人臉圖、擴展人臉空間和子人臉空間,生成新的 虛擬三維人臉圖;(4)使用所生成的新的虛擬三維人臉圖更新原始樣本庫;(5)應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法,對待識別二維人臉圖進行 姿態(tài)估計;(6)利用步驟(5)得到的姿態(tài)估計結(jié)果和預設(shè)的查找表,對待識別二維人臉圖進行截 取得到截斷二維測試人臉圖,使用部分主分量分析法對所述截斷二維測試人臉圖進行識 別。
2.根據(jù)權(quán)利要求1所述的基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法,其特 征在于,在步驟(1)中,應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對二維訓練 人臉圖進行姿態(tài)估計的方法如下1)對二維訓練人臉圖用部分主分量分析法進行姿態(tài)估計,將姿態(tài)估計結(jié)果記為Pl;2)利用姿態(tài)估計結(jié)果Pl和所述預設(shè)的查找表對所述二維訓練人臉圖截取,得到截斷 二維訓練人臉圖;3)對所述截斷二維訓練人臉圖采用部分主分量分析法進行姿態(tài)估計,將該姿態(tài)估計結(jié) 果記為P2 ;4)計算Pl和P2的差,若Pl和P2的差的絕對值小于預設(shè)的閾值,則以Pl作為二維訓 練人臉圖的最終姿態(tài)估計結(jié)果;否則對所述二維訓練人臉圖進行眼睛和嘴巴的定位,并根 據(jù)定位結(jié)果估計姿態(tài),將該姿態(tài)估計結(jié)果記為P3 ;5)比較P3和Pl是否一致,若一致,則以Pl作為二維訓練人臉圖的最終姿態(tài)估計結(jié)果; 否則,以P2作為二維訓練人臉圖的最終姿態(tài)估計結(jié)果。
3.根據(jù)權(quán)利要求1所述的基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法,其特 征在于,在步驟(5)中,應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對待識別二 維人臉圖進行姿態(tài)估計的方法如下a)對待識別二維人臉圖用部分主分量分析法進行姿態(tài)估計,將該姿態(tài)估計結(jié)果記為P4 ;b)利用姿態(tài)估計結(jié)果P4和所述預設(shè)的查找表對所述待識別二維人臉圖截取,得到截 斷待識別二維人臉圖;c)對所述截斷待識別二維人臉圖采用部分主分量分析法進行姿態(tài)估計,將該姿態(tài)估計 結(jié)果記為P5 ;d)計算P4和P5的差,若P4和P5的差的絕對值小于預設(shè)的閾值,則以P4作為待識別 二維人臉圖的最終姿態(tài)估計結(jié)果;否則對所述待識別二維人臉圖進行眼睛和嘴巴的定位, 并根據(jù)定位結(jié)果估計姿態(tài),將該姿態(tài)估計結(jié)果記為P6 ;f)比較P6和P4是否一致,若一致,則以P4作為待識別二維人臉圖的最終姿態(tài)估計結(jié) 果;否則, 以P5作為待識別二維人臉圖的最終姿態(tài)估計結(jié)果。
全文摘要
本發(fā)明公開一種基于部分主分量分析和姿態(tài)估計聯(lián)合的人臉識別方法,包括如下步驟(1)在原始樣本庫中事先存放虛擬三維人臉圖,應用主分量分析法計算原始樣本庫中的擴展人臉空間;且應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對兩幅不同姿態(tài)的二維訓練人臉圖進行姿態(tài)估計;(2)根據(jù)姿態(tài)估計結(jié)果在擴展人臉空間中尋找相應的子人臉空間;(3)根據(jù)兩幅不同姿態(tài)的二維訓練人臉圖、擴展人臉空間和子人臉空間,生成新的虛擬三維人臉圖;(4)使用新的虛擬三維人臉圖更新原始樣本庫;(5)應用部分主分量分析法結(jié)合人眼和嘴巴自動定位算法對待識別二維人臉圖進行姿態(tài)估計;(6)使用部分主分量分析法對待識別二維人臉圖進行識別。
文檔編號G06K9/66GK102043966SQ20101058831
公開日2011年5月4日 申請日期2010年12月7日 優(yōu)先權(quán)日2010年12月7日
發(fā)明者潘翔, 王玲玲, 郭小虎 申請人:浙江大學