基于最大方向編碼的人臉表情特征提取及識別方法
【技術(shù)領域】
[0001] 本發(fā)明屬于數(shù)字圖像處理技術(shù)領域,具體涉及對圖像的人臉表情特征提取及人臉 表情識別處理。
【背景技術(shù)】
[0002] 表情是人類用來表達情緒的一種基本方式,是非語言交流中的一種有效手段。人 們可通過表情準確而微妙地表達自己的思想感情,也可通過表情辨認對方的態(tài)度和內(nèi)心世 界。人臉表情識別所要研究的就是如何自動、可靠、高效地利用人臉表情所傳達的信息。人 臉表情可以分為6種基本情感類別:驚奇、恐懼、厭惡、憤怒、高興、悲傷,和一種最為普遍的 表情類別:中性。其中中性是人臉表情進行轉(zhuǎn)換的中間過程和所有人一般狀態(tài)下所表現(xiàn)出 來的最為普遍的表情類別。一個人臉表情識別系統(tǒng)(FER) -般包括3個環(huán)節(jié),即人臉檢測、 表情特征提取、表情分類。其中人臉檢測目前已經(jīng)成為了一個單獨的研究方向,現(xiàn)有的研究 已經(jīng)在該方面上研究出了一些成果。表情特征提取是FER系統(tǒng)中最重要的部分,有效的表 情特征提取工作將使識別的性能大大提高。
[0003]目前常用的人臉面部表情識別算法有:
[0004] (1)基于人臉動作編碼系統(tǒng)FACS和運動單元AU的算法,可參考文獻:J.Hamm, C.G.Kohler,R.C.Gur,andR.Verma,"Automatedfacialactioncodingsystemfor dynamicanalysisoffacialexpressionsinneuropsychiatricdisorders,',Journal ofNeuroscienceMethods,vol. 200,no. 2,pp.237-256,2011 ;
[0005] (2)基于主成分分析PCA的算法,可參考文獻:YongCY,SudirmanR,Chew KM.FacialExpressionMonitoringSystemUsingPCA-BayesClassifier[C].Future ComputerSciencesandApplication(ICFCSA),2011InternationalConference on.IEEE,2011 :187-191;
[0006] (3)基于LDP的算法,可參考文獻:T.Jabid,M.H.Kabir,and0?Chae,"Robust facialexpressionrecognitionbasedonlocaldirectionalpattern,'TTRIJournal, vol. 32,no. 5,pp.784-794,2010。
[0007] 上述人臉面部表情提取方法都在一定程度上存在問題。方法(1)需要準確的五官 定位及面部追蹤才可以獲得較好的效果,且對于噪聲光照敏感,易受到干擾;方法(2)雖然 擁有較小的計算量和特征維度,但是會忽略局部特征,局部特征在識別過程中也是非常重 要的部分,因此對于識別精度有一定的影響;方法(3)雖然較前述兩個有所改進,但是隨著 所取最大值個數(shù)的提升,其編碼組合數(shù)目會大幅增加,用于區(qū)域圖像分塊處理之后,其整幅 圖像的特征維度會急劇增加;且LDP也僅是用周圍像素與中心像素進行比較,直接取周圍 像素的最大運算值進行編碼,非理想條件下,對噪聲也不具有一定的抗力。LDP編碼由如下 公式計算而得:
[0008]
車中叫表示經(jīng)過Kirsch算 子運算后各像素點的八方向的響應值的絕對值,k表示取最大值的個數(shù),mk表示mi中最大 的第k個值。隨著k的增大其特征維度會急劇增大,且抗干擾的能力不高。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明針對上述存在的問題,公開了一種基于最大方向編碼的人臉表情特征提取 方法,能夠有效的提取有用信息并減少計算量,提高抗干擾能力。
[0010] 本發(fā)明的基于最大方向編碼的人臉表情特征提取方法,包括下列步驟
[0011] 對輸入的待處理人臉圖像進行預處理,得到待提取圖像,所述預處理包括:圖像灰 度化處理、尺寸歸一化處理;
[0012] 分別以待提取圖像的各像素點為中心,計算各中心像素點的八個方向響應值,并 對各響應值所在位置進行二進制編碼,例如從000到111 ;
[0013] 查找各中心像素點的最大響應值、最小響應值,并記最大響應值所在位置編碼為 Max,最小響應值所在位置編碼為Min;
[0014] 判斷與最小響應值的差值是否小于預設閾值Th(經(jīng)驗值,通??稍O置為 200-300),若是,則當前中心像素點的編碼值為0,若采用6位的二進制編碼,則其編碼值為 〇的編碼為〇〇〇〇〇〇 ;否則,當前中心像素點的編碼設置為:Max為高位,Min為低位的串接 碼;將各中心像素點的編碼的十進制值作為其特征值,即得到待提取圖像的各像素點的特 征值并輸出。
[0015] 本發(fā)明改進了LDP的原始編碼模式,首先,不直接使用所計算出來的響應值進行 編碼,而是利用最大最小響應值所在位置,將位置參數(shù)作為編碼值進行編碼,從而可以將 原來八位的二進制編碼縮減為六位的二進制編碼值,降低了特征維度和后續(xù)識別的運算時 間;其次因為對于中心像素而言,其八方向的響應值并不具有同等的地位,從而才會產(chǎn)生各 個方向不同的響應值,因此可以利用最大最小響應值的所在方向來確定一個目標像素,這 比直接選取最大三個響應值進行編碼的LDP方法更加精確,原始方法可能會出現(xiàn)完全不同 像素成為了同一種編碼的情況,利用周圍像素的明暗信息所代表的方向性進行編碼可以排 除部分偶然重合的情況,提高編碼準確度;最后,為了排除部分噪聲對于編碼方式的影響, 加入了門限值,當最大最小響應值之差達到門限值之后才進行編碼,門限的引入排除了部 分內(nèi)在外在誤差,提高了人臉表情特征提取方法的抗干擾能力。
[0016] 基于本發(fā)明的表情特征提取方法,本發(fā)明還公開了一種基于最大方向編碼的人臉 表情識別方法,包括下列步驟:
[0017] 步驟1 :輸入人臉圖像,基于本發(fā)明的表情特征提取方法得到各人臉圖像的像素 點的特征值;
[0018] 步驟2 :基于各人臉圖像的像素點的特征值進行SVM訓練,得到SVM分類器;
[0019] 步驟3 :輸入待識別人臉圖像,基于本發(fā)明的表情特征提取方法得到待識別人臉 圖像的像素點的特征值,并基于步驟2得到的SVM分類器輸出當前待識別人臉圖像的表情 識別結(jié)果。
[0020] 綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:降低了LDP原始編 碼的特征維度和計算量以及編碼準確度,提高了人臉表情特征提取及表情識別的抗干擾能 力。
【附圖說明】
[0021] 圖1是【具體實施方式】中,人臉表情識別流程示意圖;
[0022] 圖2是【具體實施方式】中,本發(fā)明改進的LDP編碼(DLDP編碼)示意圖。
【具體實施方式】
[0023] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合實施方式和附圖,對本發(fā) 明作進一步地詳細描述。
[0024] 為了方便描述,首先給出【具體實施方式】所涉及的相關專業(yè)術(shù)語的簡要描述:
[0025] (l)Haar-like特征。哈爾特征(Haar-like)是用于物體識別的一種數(shù)字圖像特 征,哈爾特征使用檢測窗口中指定位置的相鄰矩形,計算每一個矩形的像素和并取其差值, 然后用這些差值來對圖像的子區(qū)域進行分類。
[0026] (2)圖像二值化。就是將圖像上的像素點的灰度值設置為0或255,也就是將整個 圖像呈現(xiàn)出明顯的黑白效果。在灰度圖像中,常采用一個字節(jié)表示一個像素點,其灰度級為 0~255,其二值化方法為構(gòu)造用一個二進制位表示一個像素點的圖像,設置二值化閾值T, 將大于T的像素點設置為1,小于等于T的點設為0。
[0027] (3)Adaboost算法。Adaboost是一種迭代算法,其核心思想是針對同一個訓練集 訓練不同的弱分類器,然后把這些弱分類器集合起來,構(gòu)成一個強分類器。常用于人臉檢測 與定位。
[0028] (4) :Kirsch算子。Kirsch算子是R.Kirsch提出來一種邊緣檢測新算法,它采用 8個模板對圖像上的每一個像素點進行卷積求導數(shù),這8個模板代表8個方向,對圖像上的 8個特定邊緣方向做出最大響應,運算中取最大值作為圖像的邊緣輸出。
[0029] (6):直方圖均衡化。直方圖均衡化的基本思想是把原始圖的直方圖變換為均勻分 布的形式,這樣就增加了象素灰度值的動態(tài)范圍從而可達到增強圖像整體對比度的效果。
[0030] (7) :SVM。SVM(SupportVectorMachine,支持向量機)是一個有監(jiān)督的學習模 型,通常用來進行模式識別、分類、以及回歸分