本發(fā)明涉及圖像處理領(lǐng)域,具體涉及圖像中人臉區(qū)域的分割與定位及圖像中人臉的識別與匹配方法及系統(tǒng)的實現(xiàn)。
背景技術(shù):
現(xiàn)有技術(shù)采用相應的matlab軟件實現(xiàn)人臉數(shù)據(jù)的建模,本文構(gòu)建人臉圖像的特征臉,將人臉圖像數(shù)據(jù)化,對收集的離散數(shù)據(jù)合理的進行三維建模,為人臉圖像數(shù)據(jù)的采集方法提供新的思路?,F(xiàn)有技術(shù)人臉識別算法在lwf數(shù)據(jù)庫中數(shù)據(jù)對比結(jié)果準確度為99.7%,準確度較高,但實際應用過程中的人臉識別效果受外界因素的影響較大,難以實現(xiàn)較高的準確度,該作品通過多種算法實現(xiàn)人臉識別功能,同時對準確度進行對比,同時應用于實際選擇準確度最高的進行實際開發(fā)。因此,此技術(shù)還有待于改進和發(fā)展。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)的不足,本專利提供人臉定位檢測方法和人臉識別匹配方法同時提供一種基于上述方法實現(xiàn)的半自動化人臉識別系統(tǒng)。
為了實現(xiàn)上述目的,本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:人臉定位檢測方法和人臉識別匹配方法,包括以下步驟:(1)獲取一個或多個清晰人臉區(qū)域的彩色圖像;(2)檢測到的圖像生成YCrCb顏色分割圖像,其中生成圖像基于檢測到的圖像;(3)判斷圖像中人臉區(qū)域是否包含較為明顯的人眼區(qū)域和嘴巴區(qū)域,并且人眼區(qū)域為兩個,嘴巴區(qū)域水平位置介于兩個人眼區(qū)域之間;(4)匹配識別的訓練和測試圖像包含多組每組同一個人的多幅正面圖像,訓練圖像生成的特征臉圖像基于同一個人的多幅正面圖像。
步驟(1)進一步包括,使用matlab軟件啟動攝像頭設(shè)備,設(shè)置幀數(shù)間隔為5,采用背景差分的方式獲取攝像頭前的移動的人臉圖像并進行存儲。
進一步,背景差分方式包括原始圖像數(shù)據(jù)和轉(zhuǎn)化灰度圖像做差、中值、圖像增強、求全局閾值、二值化處理、填充空洞、標記二值化圖、連通域處理、面積比較、獲取圖像。
步驟(2)進一步包括,獲取RGB格式圖像采用YCrCb顏色空間分割算法轉(zhuǎn)換至YCrCb顏色空間,Y表示明亮度,Cr與Cb表示色度,Cr反映輸入信號紅色部分與RGB信號亮度值之間的差異,Cb反映輸入信號藍色部分與RGB信號亮度值之間的差異。原始圖像中的人臉區(qū)域的膚色影響YCrCb圖像中Cr、Cb值的范圍,Cr∈(105,127),Cb∈(137,162)為正常的人臉區(qū)域。
步驟(2)進一步包括,RGB轉(zhuǎn)換為YCrCb的具體公式為:
y1=65.481*r+128.553*g+24.966*b+16;y=y(tǒng)1/256;cr1=-37.797*r-74.203*g+112*b+128;cr=cr1/256;cb1=112*r-93.786*g-18.214*b+128;cb=cb1/256。
步驟(3)進一步包括,通過步驟(2)將圖像轉(zhuǎn)換為YCrCb格式的圖像,判斷人臉的區(qū)域后轉(zhuǎn)換為二值化圖像,Cr∈(105,127),Cb∈(137,162)的范圍二值化圖像的值為1,其余部分為0。
步驟(3)進一步包括,對二值化圖像值為1的連通域進行標記,并取能完整包含連通域的且長寬和原始圖像平行的最小矩形,并記錄矩形的長寬值與位置,計算矩形的長寬的比值,如果比值r∈(0.6,2),判斷該矩形區(qū)域為粗定位的人臉區(qū)域。
步驟(3)進一步包括,分別對粗定位的人臉區(qū)域進行判斷,選取其中一個區(qū)域,記錄并標記二值化圖像值為0的連通域,同樣取最小矩形記錄矩形的位置,設(shè)置條件:高度在粗定位人臉區(qū)域上部的矩形數(shù)目為2,判斷為該區(qū)域存在人眼;高度在粗定位人臉區(qū)域下部的矩形數(shù)目為1且寬度介于人眼矩形之間,判斷為該區(qū)域存在嘴巴。條件同時滿足則該區(qū)域為細定位的人臉區(qū)域。
步驟(3)進一步包括,根據(jù)細定位人臉區(qū)域的最小矩形的長寬和位置坐標在原始圖像中做紅色矩形框記錄,并提取圖像生成新圖像,排除原始圖像中的非人臉區(qū)域,提高人臉匹配識別的準確率。
步驟(4)進一步包括,將步驟(3)細識別的后圖像進行提取與分類,分類具體包括人臉識別匹配的訓練圖像和測試圖像,訓練圖像同一個人臉提取表情不同的圖像個數(shù)至少為5且不同圖像人臉區(qū)域的亮度影響圖像特征值提取等因素無明顯差異,將訓練圖像數(shù)據(jù)存儲在數(shù)據(jù)庫中。
進一步,測試圖像經(jīng)過步驟(2)(3)的提取后排除背景區(qū)域,并經(jīng)過圖像的壓縮變換將待識別匹配圖像的像素壓縮為112×92。
步驟(4)進一步包括,訓練圖像輸入的數(shù)據(jù)作為待識別的人臉數(shù)據(jù)在計算機中進行保存,訓練圖像應該滿足盡量要求數(shù)目較多、亮度變化范圍較小、相同人臉不同表情數(shù)目多等條件。
步驟(4)進一步包括,訓練集中大小為m×n圖像記為Ii,每個圖像的列相連構(gòu)成d=m×n維的列向量。得到{Xi}為第i圖像形成的人臉向量,
特征向量對應的圖像稱為特征臉。
步驟(4)進一步包括,得到特征臉和相應數(shù)據(jù)后,較大的特征值對應圖像的主要人臉結(jié)構(gòu),而較小的特征值對應噪聲等不確定因素,選取前k個最大特征值對應的特征向量計算訓練樣本集在前k個軸上的能量占整個能量的比例記為α,通常取90%,同時求出訓練圖像的特征集。
步驟(4)進一步包括,訓練樣本集在前k個軸上的能量占整個能量的比例α通常計算方法為:
步驟(4)進一步包括,把待識別的人臉圖像Γ投影到特征臉空間,得到特征向量,同時定義距離閾值與每個人臉的距離,計算原始圖像和特征重建圖像的距離。
步驟(4)進一步包括,在滿足原始圖像和特征重建圖像的距離小于距離閾值時,輸入圖像為訓練集中對應的其中一個人臉。
本發(fā)明還提供了一種半自動化的人臉識別系統(tǒng),包括如下模塊:原始圖像輸入模塊,通過相關(guān)按鈕設(shè)置或其他方法確認輸入原始圖像后輸入相關(guān)的初始密碼開始輸入原始圖像,調(diào)用攝像頭功能采用背景差分法對圖像確定圖像中包含人臉后獲取圖像,經(jīng)過定位檢測后提取人臉區(qū)域,獲取光照條件相似的多幅不同表情的人臉圖像;原始圖像數(shù)據(jù)保存模塊,同一人的多幅圖像和計算特征臉向量并構(gòu)建的特征重建圖像分類存儲在計算機中;待識別人臉圖像輸入模塊,通過相關(guān)按鈕設(shè)置或其他方法確定進行人臉圖像的匹配識別,調(diào)用攝像頭功能同理獲取圖像并檢測定位,細定位后將人臉區(qū)域壓縮;待識別人臉圖像匹配識別模塊,校正后投影在特征臉空間,計算其與原始圖像庫中特征重建圖像的距離,小于相關(guān)的閾值后匹配成功;深入識別匹配模塊,計算待識別圖像與匹配成功的特征重建圖像的原始圖像的距離,小于相關(guān)的閾值后深入匹配成功;閾值設(shè)定模塊,人為設(shè)定或采用多幅圖像訓練的方式計算閾值進行設(shè)定;預備模塊,人為設(shè)定密碼避免出現(xiàn)閾值設(shè)定不合理或者光照條件較差等情況下系統(tǒng)的正常使用。
本發(fā)明的優(yōu)點在于:人臉檢測方法可以有效的排除圖像中非人臉的背景區(qū)域,保證之后步驟的特征值的有效提取。人臉匹配識別方法較準確的對不同人臉圖像進行匹配識別,進而判斷待識別圖像是否為原始輸入人臉圖像。提供的半自動化系統(tǒng)僅需人工操作輸入圖像的步驟,其余步驟通過計算機實現(xiàn),方便用戶的日常生活,給用戶提供良好的體驗。
附圖說明
圖1為本發(fā)明人臉定位檢測和人臉匹配識別的流程圖。
圖2位本發(fā)明人臉匹配識別系統(tǒng)的模塊結(jié)構(gòu)示意圖。
具體實施方式
下面附圖對本發(fā)明提供的人臉定位檢測與匹配識別方法及系統(tǒng)做詳細說明。
圖1為人臉定位檢測與匹配識別方法,本發(fā)明提供方法具體包括如下步驟:步驟S11、調(diào)用計算機設(shè)備獲?。簃atlab軟件啟動攝像頭設(shè)備,設(shè)置幀數(shù)間隔,采用背景差分的方式獲取攝像頭前的移動的人臉圖像并進行存儲。步驟S12、將待處理的圖像由RGB顏色空間轉(zhuǎn)化到Y(jié)CrCb顏色空間,通過判斷Cr與Cb值的范圍來確定人臉區(qū)域并轉(zhuǎn)化為二值化圖像進行人臉粗定位。步驟S13、對粗定位人臉圖像人眼區(qū)域和嘴巴區(qū)域進行檢測實現(xiàn)圖像人臉區(qū)域細定位并提取圖像。步驟S14細定位成功的訓練與測試圖像采用特征臉識別算法進行匹配識別。
步驟S11、采用matlab軟件啟動攝像頭設(shè)備,設(shè)置幀數(shù)間隔,采用背景差分的方式獲取攝像頭前的移動的人臉圖像并進行存儲。
背景差分法作為目前運動檢測中最常用的一種方法,利用當前圖像與背景差分來檢測出來運動區(qū)域的一種模式,該算法首先選取背景中的一幅或幾幅圖像的平均作為背景圖像,然后把序列圖像當前幀和背景圖像相減,進行背景小區(qū),若得到的像素數(shù)大于某一閾值,則判定當前場景中有物體。具體程序設(shè)計時包括原始圖像數(shù)據(jù)和轉(zhuǎn)化灰度圖像做差、中值、圖像增強、求全局閾值、二值化處理、填充空洞、標記二值化圖、連通域處理、面積比較、獲取圖像。
步驟S12、將待處理的圖像由RGB顏色空間轉(zhuǎn)化到Y(jié)CrCb顏色空間,通過判斷Cr與Cb值的范圍來確定人臉區(qū)域并轉(zhuǎn)化為二值化圖像進行人臉粗定位。
YCrCb顏色空間中Y表示明亮度,Cr與Cb表示色度,Cr反映輸入信號紅色部分與RGB信號亮度值之間的差異,Cb反映輸入信號藍色部分與RGB信號亮度值之間的差異。原始圖像中的人臉區(qū)域的膚色影響YCrCb圖像中Cr、Cb值的范圍,Cr∈(105,127),Cb∈(137,162)為正常的人臉膚色范圍,該區(qū)域為人臉區(qū)域。
通過將圖像轉(zhuǎn)化至YCrCb顏色空間中判斷人臉區(qū)域后將圖像二值化,人臉區(qū)域的值為1,非人臉區(qū)域的值為0。
對二值化圖像值為1的連通域進行標記,并取能完整包含連通域的且長寬和原始圖像平行的最小矩形,并記錄矩形的長寬值與位置,計算矩形的長寬的比值,如果比值r∈(0.6,2),判斷該矩形區(qū)域為粗定位的人臉區(qū)域。
步驟S13、對粗定位人臉圖像人眼區(qū)域和嘴巴區(qū)域進行檢測實現(xiàn)圖像人臉區(qū)域細定位并提取圖像。
根據(jù)細定位人臉區(qū)域的最小矩形的長寬和位置坐標在原始圖像中做紅色矩形框記錄,并提取圖像生成新圖像,排除原始圖像中的非人臉區(qū)域,提高人臉匹配識別的準確率。同時將二值化圖像定位出的人眼和嘴巴的位置記錄在提取的圖像中,作為人臉識別匹配特征臉中特征值較大的區(qū)域。
步驟S14、細定位成功的訓練與測試圖像采用特征臉識別算法進行匹配識別。
細識別的后圖像進行提取與分類,分類具體包括人臉識別匹配的訓練圖像和測試圖像,其中測試圖像與訓練圖像進行匹配實現(xiàn)人臉識別匹配。
訓練圖像輸入的數(shù)據(jù)作為待識別的人臉數(shù)據(jù)在計算機中進行保存,訓練圖像應該滿足盡量要求數(shù)目較多、亮度變化范圍較小、相同人臉不同表情數(shù)目多等條件。
訓練集中大小為m×n圖像記為Ii,每個圖像的列相連構(gòu)成d=m×n維的列向量。得到{Xi}為第i圖像形成的人臉向量,特征向量對應的圖像稱為特征臉。
得到特征臉和相應數(shù)據(jù)后,較大的特征值對應圖像的主要人臉結(jié)構(gòu),包括人臉結(jié)構(gòu)中的人眼和嘴巴區(qū)域,而較小的特征值對應噪聲等不確定因素,選取前k個最大特征值對應的特征向量計算訓練樣本集在前k個軸上的能量占整個能量的比例記為α,通常取90%,同時求出訓練圖像的特征集。訓練圖像在特征臉空間投影系數(shù)為Ωi。
訓練樣本集在前k個軸上的能量占整個能量的比例α通常計算方法為:
計算訓練樣本的均值向量:
待識別的人臉圖像Γ投影到特征臉空間,得到特征向量
定義距離閾值與每個人臉的距離。
距離閾值為:
每個人臉的距離為:
εi2=||Γ-Xi||
計算原始圖像和特征重建圖像的距離
在滿足原始圖像和特征重建圖像的距離小于距離閾值時,輸入圖像為訓練集中對應的其中一個人臉。
圖2為人臉定位檢測與匹配識別系統(tǒng),本發(fā)明提供方法具體包括如下步驟:原始圖像輸入模塊S21;原始圖像數(shù)據(jù)保存模塊S22;待識別人臉圖像輸入模塊S23;待識別人臉圖像匹配識別模塊S24;深入識別匹配模塊S25;閾值設(shè)定模塊S26;預備模塊S27。
原始圖像輸入模塊S21,通過相關(guān)按鈕設(shè)置或其他方法確認輸入原始圖像后輸入相關(guān)的初始密碼開始輸入原始圖像,調(diào)用攝像頭功能采用步驟11的背景差分法對圖像確定圖像中包含人臉后獲取圖像,經(jīng)過定位檢測后提取人臉區(qū)域,獲取光照條件相似的多幅不同表情的人臉圖像。
原始圖像數(shù)據(jù)保存模塊S22,同一人的多幅圖像和計算特征臉向量并構(gòu)建的特征重建圖像分類存儲在計算機中。
待識別人臉圖像輸入模塊S23通過相關(guān)按鈕設(shè)置或其他方法確定進行人臉圖像的匹配識別,調(diào)用攝像頭功能同理獲取圖像并檢測定位,細定位后將人臉區(qū)域壓縮。
待識別人臉圖像匹配識別模塊S24,校正后投影在特征臉空間,計算其與原始圖像庫中特征重建圖像的距離,小于相關(guān)的閾值后匹配成功。
深入識別匹配模塊S25,計算待識別圖像與匹配成功的特征重建圖像的原始圖像的距離,小于相關(guān)的閾值后深入匹配成功。
閾值設(shè)定模塊S26,人為設(shè)定或采用多幅圖像訓練的方式計算閾值進行設(shè)定。
預備模塊S27,人為設(shè)定密碼避免出現(xiàn)閾值設(shè)定不合理或者光照條件較差等情況下系統(tǒng)的正常使用。
上述各模塊中操作方法與提供的方法中各步驟相呼應。
對于本領(lǐng)域技術(shù)人員而言,本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,均應將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化包括在本發(fā)明內(nèi)。
此外,應當理解,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一個獨立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應當將說明書作為一個整體,各實施例中的技術(shù)方案也可以經(jīng)適當組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實施方式。