一種眼睛定位圖像處理方法

文檔序號(hào)：6481606閱讀：212來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：一種眼睛定位圖像處理方法
技術(shù)領(lǐng)域：
本發(fā)明屬于模式識(shí)別和計(jì)算機(jī)視覺(jué)領(lǐng)域的一種生物特征識(shí)別方法，具體為非控條件下的魯棒精確人眼定位技術(shù)。
背景技術(shù)：
人臉識(shí)別作為一種新的生物認(rèn)證方法，由于其在公共安全、信息安全、金融等領(lǐng)域具有潛在的廣泛的應(yīng)用前景，而倍受關(guān)注。一個(gè)完整的人臉圖像信息處理系統(tǒng)，由以下幾個(gè)關(guān)鍵模塊組成人臉圖像獲取，人臉特征點(diǎn)定位，人臉規(guī)整化，人臉特征提取和特征匹配識(shí)別。
規(guī)整化的人臉是人臉識(shí)別算法執(zhí)行的重要條件，可以大大提高人臉識(shí)別的可靠性。但是，人臉檢測(cè)只能得到人臉的大致區(qū)域和尺寸大小，所以人臉檢測(cè)器所檢測(cè)出的人臉不適合直接用于人臉識(shí)別。
人眼是人面部的關(guān)鍵特征，根據(jù)兩只眼睛的位置可以準(zhǔn)確估計(jì)人臉的尺寸和位置，從而可以依據(jù)雙眼的位置進(jìn)行人臉圖像的規(guī)整化，規(guī)整化后的標(biāo)準(zhǔn)人臉便于后續(xù)工作的進(jìn)行。
在本發(fā)明之前，有多種人眼定位方法，主要分為三類(lèi)基于模板的方法、基于特征的方法、基于外^見(jiàn)的方法。
基于模板和特征的這兩種方法，通常都是利用人眼的幾何特征或其它有助于人眼定位的相關(guān)典型特征，進(jìn)行人眼定位。該類(lèi)方法對(duì)圖像的分辨率、光照和清晰度要求很高。而在復(fù)雜環(huán)境中這些條件很難滿(mǎn)足，因此無(wú)法實(shí)現(xiàn)真實(shí)環(huán)境中的精確人眼定位。
第三種基于外觀(guān)的方法，可以利用完備的統(tǒng)計(jì)技術(shù)來(lái)分析人眼的外觀(guān)特征，相對(duì)于前兩種方法有很大優(yōu)勢(shì)。但是在復(fù)雜環(huán)境下，人眼表現(xiàn)形式變化豐富，很難提取有判別力的外觀(guān)特征來(lái)區(qū)分人眼，因此僅依賴(lài)外觀(guān)特征也很難實(shí)現(xiàn)復(fù)雜環(huán)境下的精確人眼定位。
另外，圖模型(Pictorial Model)結(jié)合對(duì)象的外觀(guān)特征和對(duì)象的空間結(jié)構(gòu)特征進(jìn)行對(duì)象檢測(cè)，因此可以利用更多的信息來(lái)檢測(cè)對(duì)象。但是該模型中，簡(jiǎn)單的高斯分布外觀(guān)模型不足以刻畫(huà)人眼復(fù)雜變化的模式，同時(shí)基于特征間相對(duì)位置分布的結(jié)構(gòu)模型對(duì)旋轉(zhuǎn)、尺度縮放和平移變換不魯棒，因此很難實(shí)現(xiàn)復(fù)雜環(huán)境下的人眼精確定位。
綜上，現(xiàn)實(shí)環(huán)境中，人眼的外觀(guān)表現(xiàn)形式復(fù)雜，僅依據(jù)外觀(guān)特征或結(jié)合簡(jiǎn)單的空間結(jié)構(gòu)模型不易實(shí)現(xiàn)精確人眼定位。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述缺陷，設(shè)計(jì)、研制一種眼睛定位圖像處理方法。本發(fā)明的技術(shù)方案是
一種眼睛定位圖像處理方法，其主要技術(shù)步驟包括
(1) 攝像頭捕獲人臉圖像；
(2) 人臉檢測(cè)器對(duì)人臉圖^^測(cè)，截取出人臉；
(3) 對(duì)兩只眼睛和鼻子這三個(gè)構(gòu)件分別建立概率支持向量^L外觀(guān);漠型；
(4 )對(duì)選取的用來(lái)描述眼睛和鼻子之間的空間信息的三類(lèi)空間結(jié)構(gòu)度量參數(shù)
分別建立高斯分布模型，重定義三個(gè)邊長(zhǎng)為^ ^^，6蘭Z^，e3纟丄23 ，則最終的結(jié)構(gòu)相似度函數(shù)可以表示成如下公式
'—=1 'V=1,W Q,4=l i
其中，q， ^和^分別表示對(duì)三種類(lèi)型的結(jié)構(gòu)約束變量建立的高斯分布模
型，對(duì)模型參數(shù)的估計(jì)通過(guò)最大似然估計(jì)方法從訓(xùn)練樣本上獲得；(5)建立增強(qiáng)圖模型根據(jù)最大化后驗(yàn)概率估計(jì)原則，在所有的候選點(diǎn)中，依據(jù)如下的目標(biāo)優(yōu)化函數(shù)選取同時(shí)最大化外觀(guān)特征相似度和結(jié)構(gòu)相似度的候選點(diǎn)作為目標(biāo)的最佳位置，
丄* =argr^in(S(_logO (z, 1/i,w,))) + E(e！ +e2 +e3)) B
其中^(z'"，"')表示在圖像中的位置A處，依據(jù)建立的概率支持向量機(jī)外觀(guān)
模型，根據(jù)其呈現(xiàn)的外觀(guān)特征"'而判定是人眼212或鼻子23的可能性大小，從而定位眼睛。
本發(fā)明的優(yōu)點(diǎn)和效果在于，增強(qiáng)圖模型同時(shí)從眼睛的外觀(guān)特征和眼睛與鼻子的空間分布結(jié)構(gòu)特征入手，建立判別能力較強(qiáng)的外觀(guān)模型來(lái)應(yīng)對(duì)人眼特征的豐富變化，同時(shí)建立了能夠?qū)ΤＲ?jiàn)的圖像旋轉(zhuǎn)、尺度放縮和平移等變換較魯棒的空間結(jié)構(gòu)模型。最后通過(guò)最大化外觀(guān)特征相似度和結(jié)構(gòu)相似度來(lái)判定最佳的眼睛位置，可以綜合多種信息實(shí)現(xiàn)復(fù)雜環(huán)境變化下精確的人眼定位效果。另外，通過(guò)人臉圖像預(yù)處理工作，可以排除大量背景區(qū)域信息的干擾，減少人眼的尺度變化，降低復(fù)雜光照對(duì)人眼定位性能的影響，提高人眼定位的準(zhǔn)確度。
本發(fā)明的人眼定位方法可以做到非控真實(shí)環(huán)境下的精確人眼定位，基本上能夠滿(mǎn)足現(xiàn)實(shí)環(huán)境中的人眼定位的需要。本發(fā)明中所設(shè)計(jì)的增強(qiáng)圖模型可以擴(kuò)展成包含更多面部特征的復(fù)雜模型，從而進(jìn)一步提高人眼定位的魯棒性和精確度。

圖1——本發(fā)明基于增強(qiáng)圖模型的魯棒精確人眼定位算法流程圖。圖2 — _本發(fā)明中依據(jù)鼻子和兩只眼睛構(gòu)成的三角形結(jié)構(gòu)約束關(guān)系模型示意圖。
圖3—_本發(fā)明中使用的光照預(yù)處理方法的效果圖。圖4——本發(fā)明中非控真實(shí)環(huán)境人臉數(shù)據(jù)庫(kù)LFW上取得的數(shù)據(jù)示意圖。具體實(shí)施方法
技術(shù)領(lǐng)域：
本發(fā)明提出了一種基于增強(qiáng)圖模型的精確人眼定位方法，該方法可以分作兩個(gè)階段模型訓(xùn)練和模型測(cè)試。
在模型訓(xùn)練階段，首先選取兩只人眼和鼻子作為增強(qiáng)圖模型的三個(gè)關(guān)鍵構(gòu)件。然后在訓(xùn)練樣本上，依據(jù)每一個(gè)構(gòu)件的外觀(guān)特征，分別建立概率支持向量機(jī)外觀(guān)模型。接著，基于鼻子和兩只眼睛所構(gòu)成的三角形結(jié)構(gòu)約束關(guān)系，分別選取邊長(zhǎng)、邊長(zhǎng)比例和內(nèi)角余弦值作為空間結(jié)構(gòu)度量參數(shù)，具體形式如下面公式所示。其中，第一個(gè)公式表示構(gòu)件i和構(gòu)件j之間的距離，可以反映局部結(jié)構(gòu)特征。另外兩個(gè)公式分別表示邊長(zhǎng)比例和內(nèi)角余弦值，可以反映全局結(jié)構(gòu)特征。<formula>formula see original document page 5</formula>
最后，對(duì)這些度量參數(shù)分別建立高斯分布模型，由此建立了基于全局約束和局部
約束相結(jié)合的空間結(jié)構(gòu)模型。如圖2所示，其中q、 e2、 ^分別表示右眼與左眼、
右眼與鼻子、左眼與鼻子之間的距離，a表示右眼與左眼連線(xiàn)和右眼與鼻子連線(xiàn)之間的內(nèi)角夾角。
在模型測(cè)試階段，首先利用所建立的外觀(guān)模型判定人眼和鼻子出現(xiàn)在每個(gè)位置的可能性大小。然后，對(duì)于人眼和鼻子所有可能出現(xiàn)的位置的三元組組合，判定其結(jié)構(gòu)相似度。最后，遵照外觀(guān)特征相似度最大化和結(jié)構(gòu)相似度同時(shí)最大化的匹配原則，判定構(gòu)件的最佳位置。同時(shí)可以對(duì)定位結(jié)果的可信度^f故出判斷，并預(yù)測(cè)遮擋情況下人眼的可能位置。
基于本發(fā)明提出的增強(qiáng)圖模型的人眼定位算法的流程，如圖l所示。
其中，前兩步是人臉圖像預(yù)處理。首先通過(guò)人臉檢測(cè)器確定人臉的大致位置和尺寸，然后扭4企測(cè)出的人臉歸一化到統(tǒng)一的尺寸，最后進(jìn)行光照預(yù)處理。訓(xùn)練和測(cè)試過(guò)程中使用相同的人臉圖像預(yù)處理方法。
接著，根據(jù)已經(jīng)建立的增強(qiáng)圖模型，進(jìn)行人眼和鼻子的區(qū)域分割，提取一批候選點(diǎn)，再根據(jù)結(jié)構(gòu)模型驗(yàn)證結(jié)構(gòu)相似度，選取外觀(guān)特征相似度和結(jié)構(gòu)相似度都最大化的候選點(diǎn)作為人眼的最佳位置。
最后，把定位出的人眼位置映射到原圖中，從而可以依據(jù)定位出的人眼位置進(jìn)行人臉圖像的規(guī)整化，為人臉識(shí)別算法提供標(biāo)準(zhǔn)的人臉圖像。
具體實(shí)施例
第一步
使用人臉檢測(cè)器進(jìn)行人臉檢測(cè)，獲得從攝像頭捕獲的人臉圖像的大致位置和尺寸，并截取出人臉，然后尺度歸一化到IOO像素x IOO像素的大小。最后可以通過(guò)D0G (Difference of Gaussian)濾波進(jìn)行光照預(yù)處理，對(duì)光照補(bǔ)償，在盡量消除異常光照影響的同時(shí)保留大量的細(xì)節(jié)紋理特征，效果如圖3所示。
第二步'-
候選點(diǎn)篩選。對(duì)兩只人眼和鼻子這三個(gè)構(gòu)件，分別建立概率支持向量機(jī)外觀(guān)模型。其中涉及到幾個(gè)關(guān)鍵問(wèn)題1)人眼和鼻子圖像塊大小的選取。對(duì)人眼和鼻子這三個(gè)構(gòu)件，在固定的人臉圖像尺寸下，塊的大小對(duì)定位性能的影響很大。本發(fā)明中使用窮舉驗(yàn)證的方法在訓(xùn)練樣本上優(yōu)化選取人眼和鼻子塊的最佳大小，即把訓(xùn)練樣本分成兩部分，一部分用于訓(xùn)練模型，對(duì)于所有可能的塊大小，分別訓(xùn)練出一個(gè)外觀(guān)模型，然后在另一部分樣本上測(cè)試不同塊大小設(shè)置下訓(xùn)練的模型的性能，選取性能最優(yōu)的塊大小。2)收集具有代表性的正反例訓(xùn)練樣本。正例樣本可以根據(jù)已知的眼睛和鼻子的坐標(biāo)，直接在訓(xùn)練人臉圖像上截取指定大小的圖像塊，反例樣本可以在目標(biāo)坐標(biāo)周?chē)?一定區(qū)域內(nèi)隨機(jī)截取，也可以使用自舉法(Bootstrap)來(lái)搜集具有代表性的反例樣本來(lái)提高模型的性能，即用當(dāng)前訓(xùn)練出的外觀(guān)模型在訓(xùn)練樣本上收集被誤判為正例的反例樣本，如此更新反例訓(xùn)練樣本重新訓(xùn)練外觀(guān)模型。3)模型復(fù)雜度。為了滿(mǎn)足實(shí)時(shí)應(yīng)用的需要，對(duì)訓(xùn)練出的支持向量機(jī)外觀(guān)模型進(jìn)行支持向量約簡(jiǎn)，即在盡量保持最優(yōu)分類(lèi)面不變的前提下，合并相似度較大的支持向量來(lái)減少支持向量的個(gè)數(shù)，從而達(dá)到降低模型復(fù)雜的目的。4)支持向量機(jī)的概率化判定輸出。通過(guò)對(duì)標(biāo)準(zhǔn)支持向量機(jī)的輸出擬合一個(gè)Sigmoid函數(shù)，來(lái)獲取概率形式的類(lèi)別判定輸出。第三步
對(duì)選取的三類(lèi)空間結(jié)構(gòu)度量參數(shù)分別建立高斯分布模型，為了表述的方便，重定義三個(gè)邊長(zhǎng)為
ei = ^，^2蘭L^,e3 4i23 ，則最終的結(jié)構(gòu)相似度函數(shù)可以表示成如下公式
3 3 3
l '，W" '，_/，"1 眾
公式A中，^和a分別表示對(duì)三種類(lèi)型的結(jié)構(gòu)約束變量建立的高斯分
布模型。其中模型參數(shù)的估計(jì)(取對(duì)數(shù)后表示成求和的形式)，通過(guò)最大似然估計(jì)方法從訓(xùn)練樣本上獲得。第四步
結(jié)構(gòu)模型驗(yàn)證。在本發(fā)明設(shè)計(jì)的增強(qiáng)圖模型中，根據(jù)最大化后驗(yàn)概率估計(jì)原則，在所有的候選點(diǎn)中，依據(jù)如下的目標(biāo)優(yōu)化函數(shù)選取同時(shí)最大化外觀(guān)特征相似度和結(jié)構(gòu)相似度的候選點(diǎn)作為目標(biāo)的最佳位置。
丄* = arg min(S (— log(/ (zp | /;, w,))) + + e2 + e3》 B
公式B中，p(、l/,.,iO表示在圖像中的位置z'處，依據(jù)建立的概率支持向量
機(jī)外觀(guān)模型，根據(jù)其呈現(xiàn)的外觀(guān)特征"'而判定為眼睛212或鼻子23的可能性大小。
最后，驗(yàn)證人眼定位的可靠性，如果總的外觀(guān)相似度和結(jié)構(gòu)相似度很小，則可以判定為遮擋情況，同時(shí)依據(jù)其它相鄰構(gòu)件的檢測(cè)情況依據(jù)事先建立的空間結(jié)構(gòu)分布模型，做出大致位置的預(yù)測(cè)。比如，鼻子很少發(fā)生被遮擋的情況，且外觀(guān)特征較穩(wěn)定，常常可以被正確檢測(cè)到。所以可以根據(jù)鼻子的可靠定位結(jié)果來(lái)推測(cè)被遮擋人眼的大致位置。如果僅有一個(gè)眼睛被遮擋，則還可以同時(shí)根據(jù)另一個(gè)眼睛和鼻子的位置對(duì)被遮擋的眼睛^L出較可靠的位置預(yù)測(cè)。實(shí)驗(yàn)結(jié)果
最后，在真實(shí)環(huán)境人臉數(shù)據(jù)集LFW (Labeled Face in the Wild)上，驗(yàn)證了算法的有效性。圖4所示統(tǒng)計(jì)了在橫軸和縱軸方向上右眼定位準(zhǔn)確度的均值和方差。可以看出在兩個(gè)方向上的定位誤差的均值都小于1,而且保持在較低的方差下，表明了本發(fā)明提出的增強(qiáng)圖模型實(shí)現(xiàn)了非控復(fù)雜環(huán)境下的魯棒精確的人眼定位，能夠滿(mǎn)足現(xiàn)實(shí)應(yīng)用的需要。
權(quán)利要求
1. 一種眼睛定位圖像處理方法，其步驟包括(1)攝像頭捕獲人臉圖像；(2)人臉檢測(cè)器對(duì)人臉圖像檢測(cè)，截取出人臉；(3)對(duì)兩只眼睛和鼻子這三個(gè)構(gòu)件分別建立概率支持向量機(jī)外觀(guān)模型；(4)對(duì)選取的用來(lái)描述眼睛和鼻子之間的空間信息的三類(lèi)空間結(jié)構(gòu)度量參數(shù)分別建立高斯分布模型，重定義三個(gè)邊長(zhǎng)為則最終的結(jié)構(gòu)相似度函數(shù)可以表示成如下公式其中，和分別表示對(duì)三種類(lèi)型的結(jié)構(gòu)約束變量建立的高斯分布模型，對(duì)模型參數(shù)的估計(jì)通過(guò)最大似然估計(jì)方法從訓(xùn)練樣本上獲得；(5)建立增強(qiáng)圖模型根據(jù)最大化后驗(yàn)概率估計(jì)原則，在所有的候選點(diǎn)中，依據(jù)如下的目標(biāo)優(yōu)化函數(shù)選取同時(shí)最大化外觀(guān)特征相似度和結(jié)構(gòu)相似度的候選點(diǎn)作為目標(biāo)的最佳位置，其中p(zi|li，ui)表示在圖像中的位置li處，依據(jù)建立的概率支持向量機(jī)外觀(guān)模型，根據(jù)其呈現(xiàn)的外觀(guān)特征ui而判定是人眼z1，2或鼻子z3的可能性大小，從而定位眼睛。
2. 根據(jù)權(quán)利要求1所述的一種眼睛定位圖像處理方法，其特征在于在步驟(2 )中，對(duì)截取的人臉圖像通過(guò)DOG濾波。
3. 根據(jù)權(quán)利要求1所述的一種眼睛定位圖像處理方法，其特征在于在步驟(3)得到的概率支持向量機(jī)外觀(guān)模型在訓(xùn)練樣本上進(jìn)行窮舉驗(yàn)證，優(yōu)化選取眼睛和鼻子塊的大小，并在確定最優(yōu)塊大小之后，在所有訓(xùn)練樣本上收集具有代表性的正反例樣本，來(lái)優(yōu)化外觀(guān)模型。
全文摘要
本發(fā)明涉及一種眼睛定位圖像處理方法。本發(fā)明技術(shù)方案是捕獲人臉圖像；并檢測(cè)，對(duì)兩只眼睛和鼻子這三個(gè)構(gòu)件分別建立概率支持向量機(jī)外觀(guān)模型，對(duì)三者之間空間結(jié)構(gòu)度量參數(shù)分別建立高斯分布模型，重定義三個(gè)邊長(zhǎng)并建立高斯分布模型，建立增強(qiáng)圖模型，選取最大化外觀(guān)特征相似度和結(jié)構(gòu)相似度的候選點(diǎn)作為目標(biāo)的最佳位置，依據(jù)建立的概率支持向量機(jī)外觀(guān)模型，根據(jù)其呈現(xiàn)的外觀(guān)特征ui而判定是人眼z1，2或鼻子z3的可能性大小，從而定位眼睛。解決了以往存在的對(duì)圖像分辨率、光照和清晰度要求高，在現(xiàn)實(shí)復(fù)雜環(huán)境下難以實(shí)現(xiàn)人眼精確定位的缺陷。本發(fā)明從眼睛外觀(guān)特征和眼睛與鼻子的空間分布結(jié)構(gòu)特征入手，建立較魯棒空間結(jié)構(gòu)模型。提高了人眼定位的準(zhǔn)確度。
文檔編號(hào)G06K9/00GK101533466SQ20091002933
公開(kāi)日2009年9月16日申請(qǐng)日期2009年4月9日優(yōu)先權(quán)日2009年4月9日
發(fā)明者宋鳳義, 翼李, 譚曉陽(yáng) 申請(qǐng)人:南京壹進(jìn)制信息技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：宋鳳義;李翼;譚曉陽(yáng)
技術(shù)所有人：南京壹進(jìn)制信息技術(shù)有限公司
我是此專(zhuān)利的發(fā)明人

上一篇：基于kkt條件和最近鄰法的支持向量回歸機(jī)自適應(yīng)建模方法
上一篇：X86飛控計(jì)算機(jī)快速啟動(dòng)方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像處理的各種方法相關(guān)技術(shù)

envi遙感圖像處理方法相關(guān)技術(shù)

圖像處理方法相關(guān)技術(shù)

數(shù)字圖像處理方法相關(guān)技術(shù)

圖像處理的方法相關(guān)技術(shù)

圖像處理中的數(shù)學(xué)方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種眼睛定位圖像處理方法