專利名稱:基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種模式識別領(lǐng)域的方法,特別是一種基于級聯(lián)分類和哈 夫圓變換的人眼狀態(tài)檢測方法。
技術(shù)背景人眼檢測指的是在一幅圖像中檢測人眼區(qū)域,狀態(tài)檢測指的是通過對人眼 區(qū)域的分析,判斷眼睛的睜開和閉合狀態(tài)。人眼檢測在國內(nèi)外得到了廣泛的研 究和應(yīng)用,包括司機駕駛疲勞檢測等方面。人眼檢測的方法歸納起來包括利用 紅眼效應(yīng)定位人眼虹膜位置檢測人眼、利用眼睛灰度值較其它地方低的特性檢 測人眼、利用模板匹配的方法檢測人眼等等。但這些方法的不足之處在于,其 假設(shè)條件是在一幅人臉圖像中去檢測人眼,而且對檢測到的人眼沒做狀態(tài)檢測, 對于背景較復(fù)雜的圖像,這些方法的性能和效果不夠理想。經(jīng)對現(xiàn)有技術(shù)的檢索發(fā)現(xiàn),中國專利申請?zhí)枮?3147472. l的專利描述了一 種基于GaborEye (加博爾眼睛)模型的人眼檢測方法,該發(fā)明專利涉及一種自 動檢測人臉圖像中人眼中心位置的方法,該方法對攝像頭采集的人臉圖像采用 人臉檢測方法檢測到人臉,并選取合適的Gabor核函數(shù)對人臉進(jìn)行巻積得到 GaborEye模型,再分割出兩眼所在的區(qū)域。該方法其操作過程較復(fù)雜,非實時 檢測,同時缺乏對眼睛狀態(tài)的分析判斷。發(fā)明內(nèi)容本發(fā)明針對上述現(xiàn)有技術(shù)的不足,提出了一種基于級聯(lián)分類和哈夫圓變換 的人眼狀態(tài)檢測方法,使用橢圓膚色模型對圖像進(jìn)行膚色分割預(yù)處理,去除了 背景干擾,而且減小了級聯(lián)人眼分類器的檢測范圍,提升了檢測速度和準(zhǔn)確率, 并使用級聯(lián)人眼分類器得到人眼區(qū)域,綜合使用水平投影和哈夫圓變換檢測方 法分析眼睛的當(dāng)前狀態(tài)。本發(fā)明是通過以下技術(shù)方案實現(xiàn)的,本發(fā)明包括如下步驟
步驟一,采集人臉圖像;所述的采集人臉圖像,指的是通過攝像頭等設(shè)備采集RGB顏色空間的人臉圖像。步驟二,對于步驟一采集到的人臉圖像,使用橢圓膚色模型在YCbCr顏色 空間膚色分割得到膚色區(qū)域位置信息,具體如下① 、將步驟一中采集到的人臉圖像中每個像素點的RGB值(R, G, B)轉(zhuǎn)換成 (Y, Cb, Cr)值,其中,Y表示亮度信息、Cb表示藍(lán)色的色差信息、Cr表示紅 色的色差信息。② 、設(shè)置橢圓膚色模型的參數(shù);③ 、對圖像中的每個像素點,進(jìn)行膚色分割,得到二值膚色圖像 、在二值膚色圖像的四連通膚色區(qū)域的邊界中,得到膚色區(qū)域位置信息。 步驟三,使用訓(xùn)練好的級聯(lián)人眼分類器在步驟二提取的膚色區(qū)域位置使用 人眼檢測窗口遍歷的方式檢測矩形人眼區(qū)域,得到人眼矩形鏈表,使用矩形合 并方法合并人眼矩形鏈表中的矩形,直到?jīng)]有可以合并的矩形為止,得到合并 后的人眼矩形鏈表;所述的人眼檢測窗口遍歷的方式,指的是設(shè)定初始檢測窗口的大小,按照步 長大小從膚色區(qū)域的左上角開始向右移動,每移動一次,便得到一個檢測窗口, 如果級聯(lián)人眼分類器將該檢測窗口里的圖像分類為人眼,即檢測到矩形人眼區(qū) 域,把該矩形人眼區(qū)域加到人眼矩形鏈表中,否則不做任何操作,當(dāng)窗口移至 圖像最右邊時,從下一行開始重復(fù)同樣的操作,直至窗口到達(dá)圖像最右下方, 然后以一定倍率擴大檢測窗口,重復(fù)同樣的檢測過程,直至窗口的寬度大于指 定的寬度為止。所述的可以合并的矩形,指的是兩個矩形中,如果一個矩形中心包含在另 一個矩形之中,則這兩個矩形應(yīng)當(dāng)合并成一個矩形。所述的矩形合并方法,是指將兩個要合并的矩形的左上角坐標(biāo)值平均得到 新的坐標(biāo)值,把該坐標(biāo)值作為合并后的矩形的左上角坐標(biāo)值,同時將兩個矩形 的長和寬分別平均得到新的長和寬,并把新的長和寬作為合并后的矩形的長和 寬,這樣便確定了合并后的矩形的大小和位置,將合并后的矩形加到人眼矩形 鏈表中,并從人眼矩形鏈表中刪除對應(yīng)的兩個要合并的矩形。
步驟四,對于步驟三的合并后的人眼矩形鏈表中的每個矩形人眼區(qū)域,依 次使用Sobel (索貝爾)算子進(jìn)行邊緣檢測和二值化得到二值圖像;所述邊緣檢測和二值化,是指對矩形人眼區(qū)域,首先利用高斯濾波器濾波, 得到平滑后的灰度圖像,對灰度圖像用Sobel算子,進(jìn)行邊緣檢測,得到一幅 梯度圖像,最后采用閾值法,設(shè)定閾值,遍歷該梯度圖像,將大于或等于閾值 的像素點作為邊緣點,小于設(shè)定閾值的像素點作為背景點,得到二值圖像。所述Sobel算子,包括水平檢測算子和垂直檢測算子,具體如下水平檢測算子^-1 —2 —10 0 01 2 1垂直檢測算子=一l 0 1 _2 0 2 _1 0 1水平檢測算子對水平方向的灰度值變化敏感,垂直檢測算子對垂直方向的灰 度值變化敏感。步驟五,對于步驟四得到的每幅二值圖像,依次使用水平投影方法檢測人 眼狀態(tài);所述水平投影方法,是指累加水平方向上邊緣點的數(shù)目,得到水平投影 向量,在該水平投影向量中,如果存在兩個足夠大且靠得足夠近的高峰,判斷 該人眼當(dāng)前狀態(tài)是閉眼,如果不存在兩個足夠大且靠得足夠近的高峰,則不能 確定當(dāng)前狀態(tài)為閉眼,那么跳至步驟六。所述的足夠大,指的是水平方向上邊緣點的數(shù)目累加值大于第一閾值,該 第一閾值的大小范圍在wx0.2和wx0.35之間,所述的w是二值圖像的寬;所述的足夠近,指的是水平投影向量的兩個高峰的下標(biāo)差值小于或等于第 二閾值,該第二閾值的大小范圍在wx0.15和wx0.25之間,所述的w是二值圖 像的寬。步驟六,如果步驟五不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測方 法進(jìn)一步檢測人眼狀態(tài)。所述哈夫圓變換檢測方法,是指根據(jù)不同人眼大小和距離攝像頭遠(yuǎn)近的 關(guān)系而造成的圖像中眼睛的大小變化,選擇半徑變換范圍,使用哈夫圓變換得 到圓心位置和對應(yīng)的半徑,哈夫圓變換得到圓心位置和半徑之后,統(tǒng)計圓周上 邊緣點的數(shù)目和連續(xù)弧的邊緣點數(shù)目,并保存在數(shù)組中,統(tǒng)計數(shù)組中超過1/2
圓周的連續(xù)弧的數(shù)目M,統(tǒng)計數(shù)組中超過1/3圓周的連續(xù)弧的數(shù)目N,如果邊緣 點的數(shù)目大于等于20,并且M》1或N>2,判斷為睜眼,否則判斷為閉眼。 所述的連續(xù)弧,是指在圓周上間隔不超過2個像素點的相鄰邊緣點。 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果本發(fā)明集成了圖像采集、人 眼檢測以及眼睛狀態(tài)分析,通過橢圓膚色模型進(jìn)行膚色分割,有效減小了級聯(lián) 人眼分類器的檢測范圍,檢測速度提升了 1倍以上,使誤檢率降低到原來的一 半,準(zhǔn)確率提高了 20°/。,利用水平投影和哈夫圓變換檢測分析眼睛狀態(tài),則進(jìn)一 步分析了可能的眼睛當(dāng)前狀態(tài)。本發(fā)明實時檢測人眼和分析其狀態(tài),用于要求 注意力高度集中的工作場所,包括司機駕駛、工廠的監(jiān)控室等等。
圖l是本發(fā)明工作流程示意圖;圖2是本發(fā)明級聯(lián)人眼分類器檢測流程示意圖;圖3是本發(fā)明二值圖像水平投影示意圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明的實施例作詳細(xì)說明本實施例在以本發(fā)明技術(shù)方案 為前提下進(jìn)行實施,給出了詳細(xì)的實施方式和過程,但本發(fā)明的保護(hù)范圍不限 于下述的實施例。如圖1所示,本實施例包括如下步驟.-步驟一,通過USB攝像頭采集RGB顏色空間的人臉圖像;步驟二,對于步驟一采集到的人臉圖像,使用橢圓膚色模型在YCbCr顏色 空間得到膚色區(qū)域位置信息,具體如下①將步驟一中采集到的人臉圖像中每個像素點的RGB值(R, G, B),通過下 式轉(zhuǎn)換成(Y, Cb, Cr)值:7 = 0.299及+ 0.587G + 0.1145< Cb=-" + ! + 128 6 3 2C產(chǎn)U —A + 128 _ 2 12 12其中,Y表示亮度信息、Cb表示藍(lán)色的色差信息、Cr表示紅色的色差信息。
所述的轉(zhuǎn)換,是指將象素中的亮度信息Y、藍(lán)色的色差信息Cb、紅色的色 差信息Cr分離出來,從而減少外界光照環(huán)境對結(jié)果的影響。② 設(shè)置橢圓膚色模型的參數(shù)及其值如下式所示<formula>formula see original document page 10</formula>a是指橢圓的橫軸長度,b是指橢圓的縱軸長度,Cx是指膚色宇間原點在 YCbCr空間的Cb坐標(biāo),Cy指膚色空間原點在YCbCr空間的Cr坐標(biāo),9為兩個 空間的夾角,ecx為橢圓在膚色空間的X坐標(biāo),ecy為橢圓在膚色空間的Y坐標(biāo)。③ 對圖像中的每個像素點,進(jìn)行膚色分割,得到二值膚色圖像 由該像素點在YCbCr空間的值為(Y, Cb, Cr)按下列公式計算該像素點的膚色值<formula>formula see original document page 10</formula>如果該膚色值小于l,則該像素點屬于膚色區(qū)域,設(shè)置二值膚色圖像中該像素點為膚色點;否則不屬于膚色區(qū)域,設(shè)置二值膚色圖像中該像素點為背景點。④ 在二值膚色圖像中的四連通膚色區(qū)域的邊界中,得到膚色區(qū)域位置信息。 所述的四連通膚色區(qū)域,是指從膚色區(qū)域內(nèi)任一像素點出發(fā),通過上、下、左、右四個方向可以到達(dá)膚色區(qū)域內(nèi)的任意像素點。步驟三,使用訓(xùn)練好的級聯(lián)人眼分類器在步驟二提取的膚色區(qū)域位置使用 人眼檢測窗口遍歷的方式檢測矩形人眼區(qū)域,得到人眼矩形鏈表,使用矩形合 并方法合并人眼矩形鏈表中的矩形,直到?jīng)]有可以合并的矩形為止,得到合并 后的人眼矩形鏈表;所述的訓(xùn)練級聯(lián)人眼分類器,包括采集訓(xùn)練樣本和訓(xùn)練分類器兩個過程。 所述的采集訓(xùn)練樣本,指的是采集正片樣本和采集負(fù)片樣本。正片指的是 人眼樣本,正片樣本的數(shù)量為一千到四千張,采集正片樣本指的是通過從包含 睜開人眼的圖片中裁剪出矩形人眼區(qū)域,并經(jīng)過大小歸一化,得到24X24大小 的正片樣本;負(fù)片指的是非人眼樣本,負(fù)片的數(shù)量為正片的3到4倍,采集負(fù)
片樣本指的是從非人臉圖像如高分辨率的自然風(fēng)景圖片中截取分割出非人眼圖 片,并經(jīng)過大小歸一化,得到24X24大小的負(fù)片樣本。所述的訓(xùn)練分類器,指的是訓(xùn)練弱分類器、組合弱分類器得到強分類器以 及組合強分類器得到級聯(lián)人眼分類器。所述的訓(xùn)練弱分類器指的是通過計算訓(xùn) 練樣本的Harr特征值和統(tǒng)計使用該特征值對訓(xùn)練樣本進(jìn)行分類得到的錯誤率, 選取出使訓(xùn)練樣本分類錯誤率最小的Harr特征及閾值的組合;所述的組合弱分 類器得到強分類器,指的是將弱分類器根據(jù)AdaBoost (Adaptive Boosting,自 適應(yīng)提升)算法組合得到一個強分類器;所述的組合強分類器得到級聯(lián)人眼分 類器,是指在訓(xùn)練過程中根據(jù)預(yù)先設(shè)定的級聯(lián)人眼分類器正確率閾值(如 98.5%),調(diào)整強分類器的個數(shù),直至分類正確率達(dá)到正確率閾值時停止訓(xùn)練。所述的級聯(lián)人眼分類器是由多個強分類器組合而成,只有級聯(lián)人眼分類器 中的所有強分類器將待檢測圖像分類為人眼時,才表示級聯(lián)人眼分類器將該檢 測圖像分類為人眼。如圖2所示,所述的人眼檢測窗口遍歷的方式,指的是設(shè)定初始檢測窗口的 大小,如2*2,按照步長大小為1從膚色區(qū)域的左上角開始向右移動,每移動一 次,便得到一個檢測窗口,如果級聯(lián)人眼分類器將該檢測窗口里的圖像分類為 人眼,即檢測到矩形人眼區(qū)域,把該矩形人眼區(qū)域加到人眼矩形鏈表中;否則 不做任何操作;當(dāng)窗口移至圖像最右邊時,從下一行開始重復(fù)同樣的操作,直 至窗口到達(dá)圖像最右下方。然后以一定倍率如1.5倍擴大檢測窗口,此時窗口由 2*2變成3*3,重復(fù)同樣的檢測過程,直至窗口的寬度大于指定的寬度閾值20 為止。所述的可以合并的矩形,指的是兩個矩形中,如果一個矩形中心包含在另一 個矩形之中,則這兩個矩形應(yīng)當(dāng)合并成一個矩形。所述的矩形合并方法,是指將兩個要合并的矩形的左上角坐標(biāo)值平均得到 新的坐標(biāo)值,把該坐標(biāo)值作為合并后的矩形的左上角坐標(biāo)值,同時將兩個矩形 的長和寬分別平均得到新的長和寬,并把新的長和寬作為合并后的矩形的長和 寬,這樣便確定了合并后的矩形的大小和位置,將合并后的矩形加到人眼矩形 鏈表中,并從人眼矩形鏈表中刪除對應(yīng)的兩個要合并的矩形。步驟四,對于步驟三的合并后的人眼矩形鏈表中的每個矩形人眼區(qū)域,依次使用Sobel (索貝爾)算子進(jìn)行邊緣檢測和二值化得到二值圖像; 所述邊緣檢測和二值化,具體如下① 使用高斯濾波器對矩形人眼區(qū)域進(jìn)行濾波;② 使用Sobel算子進(jìn)行邊緣檢測,得到一幅梯度圖像; 所述的Sobel算子,包括水平檢測算子和垂直檢測算子,具體如下:水平檢測算子:—1 一2 -l0 0 01 2 1,垂直檢測算子=-1 0 1 _2 0 2 —1 0 1水平檢測算子對水平方向的灰度值變化敏感;垂直檢測算子對垂直方向的灰 度值變化敏感。在利用Sobel邊緣檢測的過程中,取水平方向和垂直方向中的梯度絕對值最 大的作為該像素點的梯度值。③使用閾值法對梯度圖像進(jìn)行二值化,得到二值圖像。所述的閾值法二值化,指的是選取一個閾值等于128,大于等于128的作為 邊緣,小于128的作為背景,這樣得到的是一幅二值圖像。步驟五,對于步驟四得到的二值圖像,使用水平投影方法分析人眼狀態(tài)。所述水平投影方法分析人眼狀態(tài),具體如下① 對于步驟四中得到的二值圖像,如圖3 (a)所示,累加水平方向上邊緣 點的數(shù)目,得到水平投影向量,如圖3 (b)所示;② 如果在水平投影向量中存在兩個足夠大且靠得足夠近的高峰,則判斷該 人眼圖像是一幅閉眼圖像,如果不存在兩個足夠大且靠得足夠近的高峰,則不 能確定當(dāng)前狀態(tài)為閉眼,那么跳至步驟六。所述的足夠大,是指水平方向上邊緣點的數(shù)目累加值比閾值大12,所述的 足夠近,是指兩個水平投影向量的兩個高峰的下標(biāo)相差比閾值小8。步驟六,如果步驟五不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測方 法進(jìn)一步分析人眼狀態(tài)。所述的哈夫圓變換檢測方法,具體如下①定義維度為mxn的Accumulator (累積矩陣)并設(shè)其初始值為0,其中m 是步驟四中二值圖像的高,n是步驟四中二值圖像的寬;② 根據(jù)不同人眼大小和距離攝像頭遠(yuǎn)近的關(guān)系而造成的圖像中眼睛的大小 變化,選擇半徑范圍,半徑在最小半徑rmi。和最大半徑rmax之間;本實施例在320*240的人臉圖像中,半徑r的范圍設(shè)置為[5, 20]。③ 對半徑范圍中的每個整數(shù)值半徑,遍歷步驟四中的二值圖像,忽略所有 的背景像素點,而對每個邊緣像素點,作哈夫圓變換,得到不同半徑對應(yīng)的圓 心坐標(biāo);所述的哈夫圓變換,具體如下a、 以圖像的左上角為原點,建立X-Y坐標(biāo)系,其中向右為X軸正方向,向 下為Y軸正方向,X-Y坐標(biāo)系中像素點坐標(biāo)為(x,y),其中x是該像素點的X坐 標(biāo),y是該像素點的Y坐標(biāo),圓心位置的X坐標(biāo)范圍為最小X坐標(biāo)lowX^-r, 最大X坐標(biāo)highX =x+r,如果lowX小于0,則lowX:O;如果highX大于w-1, 則highX^-l,其中w為二值圖像的寬;b、 對[iowx, high幻中的每個整數(shù)值jc',按如下公式計算y、少",得到兩個候選圓的圓心位置0c',/)和0c',/'),其中x'指圓心位置的X坐標(biāo),;;'、/'指 的是圓心位置的Y坐標(biāo);<formula>formula see original document page 13</formula>c、 對/,如果在
之內(nèi),h為二值圖像的高,則Accumulator[:c'][ /]增1;對/',如果在[O, h-l]之內(nèi),則Accumulator[;c'] [ y"]增l;d、 通過遍歷累積矩陣?yán)鄯e矩陣Accumulator搜索到最大累積值的坐標(biāo)及其 值;如果該值大于設(shè)定的閾值10,則保存對應(yīng)的圓心位置和半徑。④ 通過選取圓周上均勻分布的40個點,統(tǒng)計不同半徑下檢測到的圓,其圓 周上的點屬于邊緣點的數(shù)目,并取最大者及其對應(yīng)的半徑作為最終的圓心和半 徑結(jié)果;⑤ 根據(jù)檢測到的圓心位置和半徑,判斷眼睛當(dāng)前狀態(tài)。 所述的根據(jù)檢測到的圓心位置和半徑,判斷眼睛當(dāng)前狀態(tài),具體描述如下: a、統(tǒng)計圓周上邊緣點的數(shù)目t;b、 統(tǒng)計連續(xù)弧的邊緣點數(shù)目,并保存在數(shù)組Cc中,所謂連續(xù)弧,是指在 圓周上間隔不超過2個像素點的相鄰邊緣點;c、 統(tǒng)計數(shù)組Cc中超過1/2圓周的連續(xù)弧的數(shù)目M,統(tǒng)計數(shù)組Cc中超過 1/3圓周的連續(xù)弧的數(shù)目N;d、 如果圓周上邊緣點的數(shù)目t>20且M)l或N>2,判斷為睜眼;否則判斷為閉眼。在上述步驟結(jié)束后,若判斷出閉眼,發(fā)出聲音警報;如判斷出睜眼,用紅 色x標(biāo)示眼睛虹膜位置。本實施例通過橢圓膚色模型進(jìn)行膚色分割,有效減小了級聯(lián)人眼分類器的檢 測范圍,檢測速度提升了l倍以上,使誤檢率降低到原來的一半,準(zhǔn)確率提高 了 20%,而利用水平投影和哈夫圓變換檢測分析眼睛狀態(tài),則進(jìn)一步檢測可能的 眼睛當(dāng)前狀態(tài)。
權(quán)利要求
1、一種基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法,其特征在于,包括以下步驟,步驟一,采集人臉圖像;步驟二,對于步驟一采集到的人臉圖像,使用橢圓膚色模型在YCbCr顏色空間膚色分割得到膚色區(qū)域位置信息;步驟三,使用訓(xùn)練好的級聯(lián)人眼分類器在步驟二提取的膚色區(qū)域位置使用人眼檢測窗口遍歷的方式檢測矩形人眼區(qū)域,得到人眼矩形鏈表,使用矩形合并方法合并人眼矩形鏈表中的矩形,直到?jīng)]有可以合并的矩形為止,得到合并后的人眼矩形鏈表;步驟四,對于步驟三合并后的人眼矩形鏈表中的每個矩形人眼區(qū)域,依次使用索貝爾算子進(jìn)行邊緣檢測和二值化得到二值圖像;步驟五,對于步驟四得到的每幅二值圖像,依次使用水平投影方法檢測人眼狀態(tài);步驟六,如果步驟五不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測方法進(jìn)一步檢測人眼狀態(tài)。
2、 根據(jù)權(quán)利要求1所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法, 其特征是,所述得到膚色區(qū)域位置信息,包括如下具體步驟① 、將步驟一中采集到的人臉圖像中每個像素點的RGB值(R, G, B),轉(zhuǎn)換 成(Y, Cb, Cr)值,其中,Y表示亮度信息、Cb表示藍(lán)色的色差信息、Cr表示 紅色的色差信息;② 、設(shè)置橢圓膚色模型的參數(shù);③ 、對圖像中的每個像素點,進(jìn)行膚色分割,得到二值膚色圖像; 、在二值膚色圖像的四連通膚色區(qū)域的邊界中,得到膚色區(qū)域位置信息。
3、 根據(jù)權(quán)利要求1所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法, 其特征是,所述的人眼檢測窗口遍歷的方式,指的是設(shè)定初始檢測窗口的大小, 按照步長大小從膚色區(qū)域的左上角開始向右移動,每移動一次,便得到一個檢 測窗口,如果級聯(lián)人眼分類器將該檢測窗口里的圖像分類為人眼,即檢測到矩 形人眼區(qū)域,把該矩形人眼區(qū)域加到人眼矩形鏈表中,否則不做任何操作,當(dāng) 窗口移至圖像最右邊時,從下一行開始重復(fù)同樣的操作,直至窗口到達(dá)圖像最 右下方,然后以一定倍率擴大檢測窗口,重復(fù)同樣的檢測過程,直至窗口的寬 度大于指定的寬度為止。
4、 根據(jù)權(quán)利要求1所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法, 其特征是,所述的可合并的矩形,指的是兩個矩形中,如果一個矩形中心包含 在另一個矩形之中,則這兩個矩形應(yīng)當(dāng)合并成一個矩形;所述的矩形合并方法,是指將兩個要合并的矩形的左上角坐標(biāo)值平均得到 新的坐標(biāo)值,把該坐標(biāo)值作為合并后的矩形的左上角坐標(biāo)值,同時將兩個矩形 的長和寬分別平均得到新的長和寬,并把新的長和寬作為合并后的矩形的長和 寬,這樣便確定了合并后的矩形的大小和位置,將合并后的矩形加到人眼矩形 鏈表中,并從人眼矩形鏈表中刪除對應(yīng)的兩個要合并的矩形。
5、 根據(jù)權(quán)利要求1所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法, 其特征是,所述邊緣檢測和二值化,是指對矩形人眼區(qū)域,首先利用高斯濾波 器濾波,得到平滑后的灰度圖像,對灰度圖像用索貝爾算子,進(jìn)行邊緣檢測, 得到一幅梯度圖像,最后采用閾值法,設(shè)定閾值,遍歷該梯度圖像,將大于或 等于閾值的像素點作為邊緣點,小于設(shè)定閾值的像素點作為背景點,得到二值 圖像。
6、 根據(jù)權(quán)利要求1或5所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測 方法,其特征是,所述索貝爾算子,包括水平檢測算子和垂直檢測算子,具體 如下<formula>formula see original document page 3</formula>水平檢測算子對水平方向的灰度值變化敏感,垂直檢測算子對垂直方向的灰 度值變化敏感。
7、根據(jù)權(quán)利要求1所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法,其特征是,所述水平投影方法,是指累加水平方向上邊緣點的數(shù)目,得到水 平投影向量,在該水平投影向量中,如果存在兩個足夠大且靠得足夠近的高峰, 判斷該人眼當(dāng)前狀態(tài)是閉眼,如果不存在兩個足夠大且靠得足夠近的高峰,則 不能確定當(dāng)前狀態(tài)為閉眼,那么跳至步驟六。
8、 根據(jù)權(quán)利要求7所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法, 其特征是,所述的足夠大,指的是水平方向上邊緣點的數(shù)目累加值大于第一閾 值,第一閾值的大小范圍在wx0.2和wx0.35之間,所述的w是二值圖像的寬;所述的足夠近,指的是水平投影向量的兩個高峰的下標(biāo)差值小于或等于第 二閾值,第二閾值的大小范圍在wx0.15和wx0.25之間,所述的w是二值圖像 的寬。
9、 根據(jù)權(quán)利要求1所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法, 其特征是,所述的哈夫圓變換檢測方法,是指根據(jù)不同人眼大小和距離攝像 頭遠(yuǎn)近的關(guān)系而造成的圖像中眼睛的大小變化,選擇半徑變換范圍,使用哈夫 圓變換得到圓心位置和對應(yīng)的半徑,哈夫圓變換得到圓心位置和半徑之后,統(tǒng) 計圓周上邊緣點的數(shù)目和連續(xù)弧的邊緣點數(shù)目,并保存在數(shù)組中,統(tǒng)計數(shù)組中 超過1/2圓周的連續(xù)弧的數(shù)目M,統(tǒng)計數(shù)組中超過1/3圓周的連續(xù)弧的數(shù)目N, 如果邊緣點的數(shù)目大于等于20,并且M》1或N>2,判斷為睜眼,否則判斷為 閉眼。
10、 根據(jù)權(quán)利要求1或9所述的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測 方法,其特征是,所述的哈夫圓變換,具體如下① 以圖像的左上角為原點,建立X-Y坐標(biāo)系,其中向右為X軸正方向,向 下為Y軸正方向,X-Y坐標(biāo)系中像素點坐標(biāo)為(x,y),其中x是該像素點的X坐 標(biāo),y是該像素點的Y坐標(biāo),圓心位置的X坐標(biāo)范圍為最小X坐標(biāo)lowX:x-r, 最大X坐標(biāo)highX =x+r,如果lowX小于0,則lowX=0;如果highX大于w_l, 則highX^-l,其中w為二值圖像的寬;② 對[lowX, high幻中的每個整數(shù)值x',按如下公式計算/、 /',得到兩個候選圓的圓心位置Oc',力和(JC',/'),其中x'指圓心位置的X坐標(biāo),/、;;"指 的是圓心位置的Y坐標(biāo); <formula>formula see original document page 5</formula>③ 對/,如果在[O, h-l]之內(nèi),h為二值圖像的高,則累積矩陣[;c'][ 增l;對/',如果在[O, h-l]之內(nèi),則累積矩陣[;c'][;;"]增l;④ 通過遍歷累積矩陣?yán)鄯e矩陣搜索到最大累積值的坐標(biāo)及其值,如果該值大 于設(shè)定的閾值,則保存對應(yīng)的圓心位置和半徑。
全文摘要
一種模式識別領(lǐng)域的基于級聯(lián)分類和哈夫圓變換的人眼狀態(tài)檢測方法,包括以下步驟采集人臉圖像;使用橢圓膚色模型在YCbCr顏色空間膚色分割得到膚色區(qū)域位置信息;使用級聯(lián)人眼分類器在膚色區(qū)域位置使用人眼檢測窗口遍歷的方式檢測矩形人眼區(qū)域,并使用矩形合并方法合并矩形,得到合并后的人眼矩形鏈表;對于合并后的人眼矩形鏈表中的每個矩形人眼區(qū)域,依次使用索貝爾算子進(jìn)行邊緣檢測和二值化得到二值圖像;對于每幅二值圖像,依次使用水平投影方法檢測人眼狀態(tài);如果還不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測方法進(jìn)一步檢測人眼狀態(tài)。本發(fā)明利用膚色分割提升人眼檢測速度,跟蹤分析人的眼睛狀態(tài),適用于注意力檢測和疲勞度檢測。
文檔編號G06K9/62GK101127076SQ20071004647
公開日2008年2月20日 申請日期2007年9月27日 優(yōu)先權(quán)日2007年9月27日
發(fā)明者劉決仕, 申瑞民, 晶 金, 剛 陳, 陳華曦 申請人:上海交通大學(xué)