一種基于稀疏保持距離度量的人臉識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘與人工智能技術(shù)領(lǐng)域,具體涉及一種基于稀疏保持距離度量 的人臉識別方法。
【背景技術(shù)】
[0002] 傳統(tǒng)的身份驗(yàn)證方式一鑰匙、口令等,存在繁瑣、容易被盜取等缺點(diǎn)。隨著多媒體 時代的發(fā)展,這些傳統(tǒng)的身份驗(yàn)證方式已經(jīng)被逐漸取代。人臉識別技術(shù)就是當(dāng)前應(yīng)用極為 廣泛的身份驗(yàn)證方式之一。簡單的說,人臉識別技術(shù)即是將待分類人臉數(shù)據(jù)進(jìn)行處理,與數(shù) 據(jù)庫中人臉數(shù)據(jù)進(jìn)行相關(guān)性比對,對捕捉的人臉進(jìn)行識別。近些年,研究人員提出了很多人 臉識別的方法,基于人臉模板匹配、維數(shù)約簡、神經(jīng)網(wǎng)絡(luò)、SVM分類器等方法均在一定程度上 取得了不錯的人臉識別效果。
[0003] 然而,為了獲得更好的人臉識別系統(tǒng),使用一個恰當(dāng)?shù)木嚯x度量來衡量人臉圖像 間的相似性是至關(guān)重要的?,F(xiàn)有技術(shù)中很多距離度量算法(ITML,LMNN等)未充分利用所有 無標(biāo)簽樣本數(shù)據(jù),并且大多數(shù)算法考慮了樣本的類別標(biāo)簽而忽略樣本間的空間位置信息, 使得距離度量算法在很多應(yīng)用中很難進(jìn)一步提高識別精度。因此,使用一個恰當(dāng)?shù)木嚯x度 量算法對于很多應(yīng)用(如人臉識別)具有至關(guān)重要的影響。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于針對現(xiàn)有技術(shù)中的不足,提供一種基于稀疏保持距離度量的人 臉識別方法,充分利用所有樣本數(shù)據(jù)(標(biāo)簽樣本與無標(biāo)簽樣本),并充分保持樣本數(shù)據(jù)的稀 疏結(jié)構(gòu)化?目息,以提尚人臉識別的精度。
[0005] 本發(fā)明的目的通過下述技術(shù)方案實(shí)現(xiàn):一種基于稀疏保持距離度量的人臉識別方 法,具體實(shí)現(xiàn)方法如下:
[0006] 步驟1,從所有已存儲人臉數(shù)據(jù)中提取帶標(biāo)簽信息的人臉數(shù)據(jù),基于人臉數(shù)據(jù),使 用最大邊界理論構(gòu)建距離度量算法的框架;
[0007] 步驟2,使用稀疏表示理論,挖掘樣本間的稀疏結(jié)構(gòu)化信息,構(gòu)建稀疏權(quán)值矩陣;
[0008] 步驟3,構(gòu)建稀疏保持優(yōu)化函數(shù),使得在新構(gòu)建的距離度量空間中,樣本的稀疏結(jié) 構(gòu)化信息得以最大化的保存;
[0009] 步驟4,利用正則化框架,將最大邊界理論與稀疏保持優(yōu)化函數(shù)結(jié)合,得到稀疏保 持距1?度
[0010] 步驟5,使用特征描述子,提取待識別人臉的圖像特征,并在稀疏保持距離度量下, 進(jìn)行人臉識別實(shí)驗(yàn),對測試人臉數(shù)據(jù)進(jìn)行分類。
[0011] 進(jìn)一步,步驟1具體包括:
[0012] 根據(jù)樣本的標(biāo)簽信息,計(jì)算在使用距離度量矩陣A的情況下,不同類樣本間距離平 方和,計(jì)算公式為:
[0013]
[0014] 其中,(Xl,Xj)eD表示樣本x^x諫自不同類,dA(Xl, Xj)表示在使用距離度量矩陣 A的情況下,樣本^與幻之間的距離,T表示矩陣的轉(zhuǎn)置;
[0015] 根據(jù)樣本的標(biāo)簽信息,計(jì)算在使用距離度量矩陣A的情況下,相同類樣本間距離平 方和,計(jì)算公式為:
[0016]
[0017] 其中,(xk,xi) ES表示樣本xk與XI來自同一類,dA(xk,xi)表示在使用距離度量矩陣 A的情況下,樣本X1J^X1之間的距離,T表示矩陣的轉(zhuǎn)置;使用最大邊界理論,構(gòu)建距離度量框 架,使得在距離度量矩陣A下,不同類樣本間距離之和最大的同時同類樣本間距離之和最 小,距離度量框架如下:
[0018]
[0019] 其4
(Xi,Xj) GD表示樣本Xi與Xj來自不同類, (Xk,XI) E s表示樣本Xk與XI來自同一類,Nd為集合D中約束對的個數(shù),Ns為集合S中約束對的 個數(shù),α為正則化參數(shù),權(quán)衡不同類樣本間距離之和與同類樣本間距離之和的比例;
[0020] 將4=117帶入公式(3)進(jìn)行求解,通過矩陣的特征分解,求得最優(yōu)投影矩陣W,進(jìn)而 得到距離度量矩陣A;其中WT*W的轉(zhuǎn)置矩陣。
[0021] 進(jìn)一步,步驟3具體包括:
[0022] 通過保持稀疏表不構(gòu)成樣本間稀疏權(quán)值關(guān)系,構(gòu)建稀疏保持優(yōu)化函數(shù)如下:
[0023] (10)
[0024] 式中,Sl是除Xl以外所有樣本線性組成^的稀疏系數(shù),其表*Xl與其他所有樣本的 稀疏相關(guān)性;乂二匕^^…^一是由所有樣本組成的字典矩陣^為正整數(shù);
[0025]對公式(10)進(jìn)行等價變換如下:
[0026] (II)
[0027]式中,5=[81,82,'",811]是稀疏權(quán)值矩陣;[0028] 將公式(11)轉(zhuǎn)化為最大化問題并加入約束條件如下:
[0029] (12)
[0030] 式中,S是稀疏權(quán)值矩陣,X為字典矩陣,W為投影矩陣。
[0031]進(jìn)一步,步驟4具體包括:
[0033]
[0032] 將權(quán)利要求1步驟3中稀疏保持優(yōu)化函數(shù)通過正則化結(jié)構(gòu)加入距離度量框架中,得 到稀疏保持距離度量的目標(biāo)函數(shù)如下:
[0034] +ST_STS)XT,a與β均是正則化參數(shù),用于均衡各部分的比重,以得到最優(yōu)的度量子空間。
[0035] 與現(xiàn)有技術(shù)相比本發(fā)明的有益效果是:該方法恰當(dāng)?shù)乇3至巳四様?shù)據(jù)樣本間的稀 疏結(jié)構(gòu)化信息,并充分使用了大量的無標(biāo)簽人臉數(shù)據(jù),使得距離度量算法對樣本流形結(jié)構(gòu) 有更深入的理解,最終使得人臉識別系統(tǒng)的識別精度得到進(jìn)一步提高。
【附圖說明】
[0036]圖1是本發(fā)明的流程圖。
[0037]圖2是本發(fā)明不同類樣本分散開且同類樣本聚集的示意圖;
[0038]圖3是不同距離度量方法在0RL人臉數(shù)據(jù)上的識別精度比較圖;
[0039]圖4是不同距離度量方法在AR人臉數(shù)據(jù)上的識別精度比較圖。
【具體實(shí)施方式】
[0040] 下面結(jié)合附圖所示的各實(shí)施方式對本發(fā)明進(jìn)行詳細(xì)說明,但應(yīng)當(dāng)說明的是,這些 實(shí)施方式并非對本發(fā)明的限制,本領(lǐng)域普通技術(shù)人員根據(jù)這些實(shí)施方式所作的功能、方法、 或者結(jié)構(gòu)上的等效變換或替代,均屬于本發(fā)明的保護(hù)范圍之內(nèi)。
[0041] 參圖1所示,本實(shí)施例提供了一種基于稀疏保持距離度量的人臉識別方法,具體 實(shí)現(xiàn)方法如下:
[0042]步驟S1,從所有已存儲人臉數(shù)據(jù)中(標(biāo)簽數(shù)據(jù)與無標(biāo)簽數(shù)據(jù))提取帶標(biāo)簽信息的人 臉數(shù)據(jù),基于人臉數(shù)據(jù),使用最大邊界理論構(gòu)建距離度量算法的框架。
[0043]具體包括以下步驟:
[0044]步驟①.最大邊界理論利用了所有的標(biāo)簽數(shù)據(jù),使得在新的距離度量下,不同類樣 本間距離之和最大的同時,同類樣本間距離之和最小。首先定義不同類間距離之和如下:
[0045] t ' ⑴
[0046] 其中,(Xl,Xj)eD表示樣本x々x諫自不同類,集合D中包含了所有來自不同類的 成對樣本,最大化公式(1)使得不同類樣本間的距離之和最大。
[0047]步驟②.根據(jù)樣本的標(biāo)簽信息,定義在距離度量矩陣Α下,同類樣本間距離之和如 下: _] (2)
[0049]其中,(xk,xi)es表示樣本xk與XI來自同一類,集合S中包含了所有來自相同類的 成對樣本,最大化公式(2)使得同類樣本間的距離之和最小。
[0050] 步驟③.使用最大邊界理論,即求得最優(yōu)距離度量矩陣A,使得不同類樣本盡可能 的分散開的同時,同類樣本盡可能聚集(如圖2所示),從而構(gòu)建距離度量框架如下:
[0051] ⑶
[0052] 其中,其中
且(Xi,Xj) eD表示樣本Xi與Xj來自不 同類,(xk,XI) e S表示樣本xk與XI來自同一類,Nd為集合D中約束對的個數(shù),Ns為集合S中約 束對的個數(shù),α權(quán)衡兩項(xiàng)的比例,以獲得最優(yōu)的距離度量矩陣A。
[0053] 步驟④.為了便捷的得到度量矩陣Α,將A=ffffTS入公式(3)可得:
[0054] 、 ' (4)
[0055]這里tr( ·)代表矩陣的跡,為了以更緊湊的形式表示公式(4),我們定義了以下兩 個等式-
[0056] (5)
[0057] (6)
[0058]因此,最大邊界理論可以構(gòu)建距離度量框架如下:
[0059] ff=arg max2tr(ffT(MD-aMs)ff)
[0060] s.t.ffTff=I (7)
[0061 ]其中公式(7)中約束條件為了防止退化解。W= [wi,W2,…,wd],其中wi,W2,…,wd是 MD-aMs大于0的d個特征值對應(yīng)的特征向量。
[0062]通過最大邊界理論初步得到的距離度量矩陣即為A = ffffT。最大邊界理論充分利用 了樣本的標(biāo)簽信息,在其構(gòu)建的度量空間中,不同類樣本間距離之和盡可能大的同時,同類 樣本間距離盡可能的小。因此,最大邊界理論能進(jìn)一步的提高人臉識別系統(tǒng)的準(zhǔn)確性。
[0063] 步驟S2,使用稀疏表示理論,充分挖掘樣本間的稀疏結(jié)構(gòu)化信息,構(gòu)建稀疏權(quán)值矩 陣。
[0064] 由于最大邊界理論僅利用了標(biāo)簽樣本,浪費(fèi)了大量無標(biāo)簽樣本的同時,忽略了數(shù) 據(jù)集中樣本間的空間結(jié)構(gòu)。本發(fā)明利用稀疏表示理論,充分挖掘并保持了數(shù)據(jù)集的稀疏結(jié) 構(gòu)化信息。具體包括以下步驟:
[0065] 步驟①.利用稀疏表示,使用數(shù)據(jù)集中除樣本Χι&外所有樣本來構(gòu)建對xi的最稀 疏的表示如下:
[0066] (8