基于詞袋壓縮感知特征提取的人臉識別方法
【專利摘要】本發(fā)明公開了一種基于詞袋壓縮感知特征提取的人臉識別方法,包括人臉識別系統(tǒng),其特征在于其識別步驟包括:圖像的尺度不變特征變換特征提取、特征編碼、不同尺度的特征融合和分類。該方法相比于原來的詞袋模型,不僅簡單實用,而且更有效,用尺度不變特征變換提取圖像關鍵點特征后,不再找聚類中心或者學習字典,而是利用隨機矩陣。讓關鍵點特征通過與隨機矩陣來進行編碼,可以節(jié)省大量時間,而且沒有像原詞袋模型方法那樣,丟失大量的空間信息。能夠很好的克服人臉光照,遮擋以及表情等變化對人臉識別的影響,不僅可以獲得較高的識別率,運行速度也較快,在很具有挑戰(zhàn)性的AR數(shù)據(jù)庫上進行人臉識別,大大提高了人臉識別率,更具有實時性。
【專利說明】基于詞袋壓縮感知特征提取的人臉識別方法
【技術領域】
[0001] 本發(fā)明涉及涉及機器視覺與圖像處理技術,尤其是人臉識別方法。
【背景技術】
[0002] 在現(xiàn)有人臉識別系統(tǒng)中燈光的亮暗、人臉的姿態(tài)以及眼鏡等偽裝,一直是人臉識 別中富有挑戰(zhàn)性的問題,在圖像預處理中,特征提取是很關鍵的一步。現(xiàn)有的人臉識別方法 有多種,如基于詞袋特征的方法,因為詞袋模型忽略了特征的空間信息并且使特征無序,導 致算法識別率低,而且詞袋模型中K均值聚類花費時間長,使整個算法運行時間長。
【發(fā)明內容】
[0003] 本發(fā)明的目的地是提供一種提高了算法性能,速度運行更快的基于詞袋壓縮感知 特征提取的人臉識別方法。
[0004] 為達到上述目的,本方法的技術方案為: 一種基于詞袋壓縮感知特征提取的人臉識別方法,包括人臉識別系統(tǒng),其特征在于其 識別步驟包括: 步驟一、用尺度不變特征變換特征的方法來提取圖像特征 ⑴設一幅圖像的函數(shù)為為,圖像與高斯核函數(shù)卷積得到不同尺度下的尺度空間; 公式如下: L(x, y, Cf) = 0(x, y, <t) * / (x, j) (I) 其中,表示像素位置,i表示尺度空間,a表示尺度空間因子; (2) 得到圖像的尺度空間后,采用ItoG金字塔方法,即用差分高斯金字塔函數(shù)與圖像 卷積得到的空間的方法尋找來尋找極值點,得到的公式為: (G(x,調-〇(咖))哺以 = L(x,y,ka-)-L(x,y,cf, 其中k是相鄰兩個不同的尺度空間; (3) 根據(jù)極值點進而確定關鍵點,對關鍵點賦予的一個方向,實現(xiàn)圖像的旋轉不變性, 具體做法為,根據(jù)關鍵點所在的尺度,選擇與該尺度最相近的高斯平滑圖像計算£上每 一個點的梯度與方向;
【權利要求】
1. 一種基于詞袋壓縮感知特征提取的人臉識別方法,包括人臉識別系統(tǒng),其特征在于 其識別步驟為: 步驟一、用尺度不變特征變換特征的方法來提取圖像特征; (1)設一幅圖像的函數(shù)為2(47),圖像與高斯核函數(shù)卷積得到不同尺度下的尺度空 間;公式如下: L(x, y, σ) = 0(x,y, σ) * 1(χ, y") (1) 其中,(U;)表示像素位置,£表示尺度空間,σ表示尺度空間因子; 得到圖像的尺度空間后,采用金字塔方法,即用差分高斯金字塔函數(shù)與圖像卷積 得到的空間D(UA)的方法尋找來尋找極值點,得到D(HCr)的公式為: D(x.y,cr) = (G(x. y,k<f) - G(x,y, a)) *I(xry) + ' ' ' " (2) =L (x, y,ka)- L(x, y, σ) 其中k是相鄰兩個不同的尺度空間; (3) 根據(jù)極值點進而確定關鍵點,對關鍵點賦予的一個方向,實現(xiàn)圖像的旋轉不變性, 具體做法為,根據(jù)關鍵點所在的尺度,選擇與該尺度最相近的高斯平滑圖像計算£上每 一個點I(U)的梯度與方向;
(4) 關鍵點周圍選擇一個鄰域,以關鍵點為中心利用所有在此區(qū)域內的點的梯度形成 一個直方圖; 并對其中點的梯度做高斯加權; 這個鄰域劃分為四個子區(qū)域,在每個子區(qū)域取八個方向; 從而得到圖像的尺度不變特征變換; 步驟二、特征編碼 用分塊的方法將圖像分割為WxW塊后,每塊用上述的尺度不變特征變換得到圖像的 局部特征后,利用壓縮感知的思想,系統(tǒng)隨機生成一個隨機字典B,然后通過稀疏表示得到 特征編碼; 假如系統(tǒng)生成的隨機字典為,一幅圖像7分割為F塊# = [~工4是.F圖像尺度 不變特征變換提取的第》塊特征,一幅圖像的每一局部塊通過式(5)可求得特征編碼,公式 如下:
其中J是常數(shù),?是所求特征編碼 步驟三、圖像中不同尺度的特征融合 利用(5)式得到一副圖像的特征編碼矩陣為,t],4是對應Aj塊的系數(shù),為了 融合系數(shù)用最大池方法,其定義為: Zi = max {丨4丨工滅沉|} (6) 其中A是池向量Z的第1個元素,i·表示系數(shù)編碼矩陣?的I行,J列; 最后使用空間金字塔匹配算法,即將一副圖像分割成2x2與4x4不同的塊,就可以對 不同空間位置和尺度的子區(qū)域進行特征編碼,假如使用空間金字塔匹配算法求得該尺度的 最大池為^,然后將不同尺度和區(qū)域的特征向量串接起來,最后得到這副圖像特征向量; 步驟四、分類 用上述方法特征提取得到每幅圖像的特征向量后,采用核稀疏表示方法來分類,核函 數(shù)采用直方圖交叉核,其表達式如下:
其中XilYy是兩個維度為w的特征向量,aM,b s分別是Xil Yi特征向量的特征值; 假如圖像特征提取后得到的訓練集為測試樣本為3^],以第i個測試樣本 為例,A可以通過矩陣J核表示為:
其中3是核函數(shù)#高維特征投影空間的稀疏系數(shù),將上式展開后得到的式子如下:
其中yi表示第,個測試樣本,Σ?!.1也4)表示求Yi與I的直方圖交叉核; 解式(9)得到系數(shù)#后,最后通過求最小殘差^的來分類:
式中#/表示第J類相應的稀疏表示系數(shù)。
【文檔編號】G06K9/00GK104376312SQ201410739127
【公開日】2015年2月25日 申請日期:2014年12月8日 優(yōu)先權日:2014年12月8日
【發(fā)明者】周凱, 元昌安, 鄭彥, 宋文展 申請人:廣西大學