專利名稱:一種對人臉圖片進行笑臉識別的提取方法
技術領域:
本發(fā)明涉及模式識別與人工智能技術領域,特別是涉及一種對人臉圖片進行笑臉
識別的提取方法。
背景技術:
笑臉識別技術是指識別出一幅靜態(tài)人臉圖像,或一段動態(tài)視頻中的人臉是否為笑 臉表情的一種技術。笑臉識別技術屬于模式識別與人工智能技術領域,可以將其理解為人 臉表情技術的一個子集。人臉表情識別(Facial E鄧ressionRecognition) —般是指將人 類的表情分為七類(中性,快樂,害怕,悲傷,生氣,厭惡,鄙視),對靜態(tài)圖片或視頻中的人 臉表情進行自動分類。但是,表情識別技術還不夠成熟,還未能真正在實際中應用。相對而 言,笑臉識別技術更易實現,也更具實用性(除了中性,笑臉是人類最易做出的表情),因此 市場上已出現一些笑臉識別技術的應用。例如,以笑臉識別功能為賣點的數碼照相機和數 碼攝相機的問市,就是笑臉識別技術的典型應用。 典型的笑臉識別算法,是基于Gabor特征,以及AdaBoost和支持向量機(Support Vector Machine, SVM)算法實現的。首先對整個人臉圖像提取多尺度,多方面的Gabor特 征,以得到維數非常之大的特征向量。例如,在一幅64X48的圖像中,每融兩個像素點,提 取8方向和5個尺度的Gabor特征的話,所得到的特征向量的維數是30720。這樣高的特征 維數,是很難應用到實際系統(tǒng)中。因此一般要用AdaBoost算法對其進行特征選擇,主要思 想是從大量的特征值中選出對識別真正有用的特征。但AdaBoost算法的實現需要多次迭 代,一般需要比較長的訓練時間。比如,要從30720維特征中,選擇出對分類最有用的300 維特征,一般需要2小時的訓練時間,所以現有技術由于特征維數過高的缺點,存在算法實 現的代價比較大,實驗周期比較長。
發(fā)明內容
本發(fā)明的目的在于克服上述笑臉識別算法的實現效率與時間的不足,提供了一種
專門針笑臉的更加簡便并高效的識別算法。 本發(fā)明采用的技術方案為 本發(fā)明提供一種對人臉圖片進行笑臉識別的提取方法,笑臉識別中使用層次化的 梯度直方圖PH0G (PYRAMID HISTOGRAM OF ORIENTATION GRADIENTS)特征區(qū)別笑臉與非笑 臉,所述的笑臉識別方法步驟如下 (11)基于Haar特征與AdaBoost算法的人臉檢測; (12)定位人臉嘴部區(qū)域; (13)層次化的梯度直方圖特征提取算法; (14)支持向量機(Support Vector Machine, SVM)訓練與識別。
作為一種優(yōu)選方案,層次化的梯度直方圖raoG特征算法的提取步驟如下 (21)提取欲提特征區(qū)域的邊界輪廓,對于輸入圖像I(x, y),用ca皿y算子計算其邊緣,得到一個邊緣輪廓圖像E(x,y); (22)在金字塔等級為1的子框中,將圖像平均分成2工個網格; (23)在每個等級的每一個網格中,根據步驟(21)計算得到的圖像的輪廓信息,計
算其梯度直方圖H0G,即網格的梯度直方圖。 (24)將步驟(23)中算得的每一個網格中的HOG級聯疊加起來,以得到KTOG特征向量。 其中,步驟(23)的梯度直方圖HOG的計算方法如下 在一個網格中,對處于輪廓中的每一點,計算其梯度的大小以及方向,根據該點的 梯度方向,將其梯度大小加入到相應的方向直方圖中。 對于笑臉表情的識別,梯度直方圖統(tǒng)計20或40個方向的梯度方向,梯度的計算以 3X3的Sobel算子作為模版,計算梯度前,不對圖像進行高斯濾波。
步驟(24)的具體步驟如下 (71)在每個等級中,將特征向量的數值歸一化到0 1之間;
(72)級聯疊加起來的結果,即是我們的PHOG特征計算結果。 作為更進一步的優(yōu)選方案,步驟(12)中找出人臉圖像中的嘴部位置區(qū)域,在嘴部
區(qū)域提取raoG特征。 作為另外一種優(yōu)選方案,步驟(14)使用支持向量機對特征向量進行訓練以及識 別。 本發(fā)明的基本原理是以一種能夠表示嘴部形狀的特征來識別笑臉與非笑臉。提
取特征時,僅對嘴部區(qū)域提取raoG特征,即可做出識別效果。raoG特征原來是用于圖像分 類中,用于描述目標形狀的一種描述子。在大類別圖像分類中raoG特征起到了積極效果。
其可以描述目標圖像整體形狀和局部空間的形狀。等級0的HOG特征,相當于目標圖像的 整體形狀特征。而等級l以上各個網格的HOG特征,即相當于對局部空間形的描述了。
本發(fā)明與已有的笑臉識別算法相比,具有以下的優(yōu)點和有益效果
(1) raOG特征與Gabor特征相比,特征維數明顯減少,在訓練階段,提取特征時,效
率明顯提高了許多。 (2)因為raOG特征維數的減小,所以不需要經過一個類似于AdaBoost的特征選擇 過程。因此,提取出PHOG特征后,可以直接運用支持向量來對特征進行訓練,大大減化了算 法流程。 (3)ra0G作為一種描述目標形狀的描述子,具有更加直觀的物理意義。在只對嘴部 圖像進行特征提取的時候,其表達的意義即是對嘴部形狀的描述。顯然,嘴部的形狀,可以 輕易的區(qū)別出笑臉與非笑臉的表情。 本發(fā)明針對Gabor特征維數過高的缺點,提出使用KTOG特征來區(qū)分笑臉與非笑 臉,實驗結果表明,其可以以很低的特征維數,得到與Gabor特征識別率相當的實驗結果。 因此,可以大大的提高算法的效率,更易于在現實中使用。
圖1是本發(fā)明的系統(tǒng)結構2是raoG特征提取步驟示意圖
圖3是raOG特征與Gabor特征實驗結果對比圖
具體實施例方式
下面結合附圖對本發(fā)明做進一步的說明,實施本發(fā)明的識別設備可以是數碼相機 以及數碼攝相機等,用嵌入式系統(tǒng)設備為平臺進行識別,可采用C語言編制各類圖像處理 程序,便能較好的實施本發(fā)明。 本發(fā)明的系統(tǒng)結構框圖如圖l所示,當設備采集到某一圖像后,先進入人臉檢測 程序,判斷圖像中是否存在人臉。通??墒褂玫娜四樧R別算法為基于類Haar特征以及 AdaBoost的人臉檢測算法,當算法判定圖像中存在人臉時,其會返回一個或數個矩形框信 息,以標注圖像中人像存在的位置;當在人臉檢測階段檢測到人臉位置后,即可進入笑臉識 別階段,否則算法停止。進入笑臉識別階時,我們先定位人臉圖像中的嘴部區(qū)域,嘴部定位 的算法可以有多種選擇,只要能定位到嘴部的大致區(qū)域即可;之后,提取嘴部區(qū)域的raOG 特征,提取步驟如下首先提取欲提特征區(qū)域的邊界輪廓,然后圖像按不同的分辨率分解成 不同金字塔等級的網格,之后對每個等級中的每個網格提取HOG特征,最后將所有HOG特征 級聯起來,得到最終的raOG特征,如圖2所示,(a)為在不同金字塔等級切分子網格的結果,
(b)為圖像的輪廓圖像(c)為不同金字塔等級的特征,將其級聯起來,即得到raoG特征;最 后,直接將raoG特征用支持向量機進行訓練即可。 根據本發(fā)明的算法,在公用表情數據庫Cohn-Kanade數據庫進行對比實驗,所得 到的結果如圖3的表格對示,可以看出,使用raOG特征及SVM算法訓練,識別率比Gabor特 征更高。因此,本發(fā)明所提出的算法不僅簡單易實現,算法效率高,并且在識別精度上也比 傳統(tǒng)的Gabor特征更高。用在數碼照相機及其它智能設備,將有更高的效率。
權利要求
一種對人臉圖片進行笑臉識別的提取方法,其特征在于,笑臉識別中使用層次化的梯度直方圖PHOG特征區(qū)別笑臉與非笑臉,所述的笑臉識別方法步驟如下(11)基于Haar特征與AdaBoost算法的人臉檢測;(12)定位人臉嘴部區(qū)域;(13)層次化的梯度直方圖特征提取算法;(14)支持向量機訓練與識別。
2. 根據權利要求i所述的提取方法,其特征在于,所述層次化的梯度直方圖raoG特征算法的提取步驟如下(21) 提取欲提特征區(qū)域的邊界輪廓,對于輸入圖像I (x,y),用canny算子計算其邊緣, 得到一個邊緣輪廓圖像E(x,y);(22) 在金字塔等級為1的子框中,將圖像平均分成21個網格;(23) 在每個等級的每一個網格中,根據步驟(21)計算得到的圖像的輪廓信息,計算其 梯度直方圖HOG,即網格的梯度直方圖;(24) 將步驟(23)中算得的每一個網格中的HOG級聯疊加起來,以得到raOG特征向量。
3. 根據權利要求2所述的提取方法,其特征在于,所述步驟(23)的梯度直方圖HOG的 計算方法如下在一個網格中,對處于輪廓中的每一點,計算其梯度的大小以及方向,根據該點的梯度 方向,將其梯度大小加入到相應的方向直方圖中。
4. 根據權利要求3所述的提取方法,其特征在于,對于笑臉表情的識別,梯度直方圖統(tǒng) 計20或40個方向的梯度方向。
5. 根據權利要求3所述的提取方法,其特征在于,對于笑臉表情的識別,梯度的計算以 3X3的Sobel算子作為模版。
6. 根據權利要求3所述的提取方法,其特征在于,對于笑臉表情的識別,計算梯度前, 不對圖像進行高斯濾波。
7. 根據權利要求2所述的提取方法,其特征在于,所述步驟(24)的具體步驟如下(71) 在每個等級中,將特征向量的數值歸一化到0 1之間;(72) 級聯疊加起來的結果,即是我們的PH0G特征計算結果。
8. 根據要求l所述的提取方法,其特征在于所述步驟(12)中找出人臉圖像中的嘴部位置區(qū)域,在嘴部區(qū)域提取raoG特征。
9. 根據要求l所述的提取方法,其特征在于所步驟(14)使用支持向量機對特征向量進 行訓練以及識別。
全文摘要
本發(fā)明涉及模式識別與人工智能技術領域,特別是涉及一種對人臉圖片進行笑臉識別的提取方法。本發(fā)明提供一種對人臉圖片進行笑臉識別的提取方法,笑臉識別中使用層次化的梯度直方圖PHOG(PYRAMID HISTOGRAM OF ORIENTATIONGRADIENTS)特征區(qū)別笑臉與非笑臉,所述的笑臉識別方法步驟如下(11)基于Haar特征與AdaBoost算法的人臉檢測;(12)定位人臉嘴部區(qū)域;(13)層次化的梯度直方圖特征提取算法;(14)支持向量機(Support Vector Machine,SVM)訓練與識別。本發(fā)明針對Gabor特征維數過高的缺點,提出使用PHOG特征來區(qū)分笑臉與非笑臉,可以以很低的特征維數,得到與Gabor特征識別率相當的實驗結果。因此,可以大大的提高算法的效率,更易于在現實中使用。
文檔編號G06K9/46GK101699470SQ200910193459
公開日2010年4月28日 申請日期2009年10月30日 優(yōu)先權日2009年10月30日
發(fā)明者白洋, 郭禮華, 金連文 申請人:華南理工大學