本發(fā)明屬于計算機視覺技術(shù)領(lǐng)域,具體涉及一種基于人臉識別的視頻監(jiān)控方法。
背景技術(shù):
人臉識別是基于人的臉部特征信息進行身份鑒別的一種生物特征識別技術(shù)。相對于其他生物識別技術(shù),人臉識別有著自身的優(yōu)勢,如不易被察覺,不需接觸設(shè)備等?,F(xiàn)如今,人臉識別技術(shù)已廣泛應(yīng)用于刑偵破案、門禁系統(tǒng)、攝像監(jiān)視、網(wǎng)絡(luò)應(yīng)用、身份辨識、信息安全及娛樂應(yīng)用等領(lǐng)域。人臉識別還應(yīng)用于刷臉支付系統(tǒng):如今,第一個刷臉支付系統(tǒng)誕生,進入相應(yīng)測試階段,PayPal(貝寶)在英國推出了“人臉識別”支付功能,這標志著人臉識別技術(shù)應(yīng)用又進入了嶄新的領(lǐng)域。
局部二值模式(Local Binary Pattern,LBP)是一種灰度范圍內(nèi)的紋理度量,最初是由Ojala等為了輔助性的度量圖像的局部對比度而提出的。它是描述圖像局部空間結(jié)構(gòu)的非參數(shù)算子,能夠高效的描述紋理。由于LBP方法原理相對簡單,計算復(fù)雜度低,同時又具有旋轉(zhuǎn)不變性和灰度不變性等顯著的優(yōu)點,因而該方法又被廣泛地應(yīng)用于圖像匹配、行人和汽車目標的檢測與跟蹤、生物和醫(yī)學(xué)圖像分析等領(lǐng)域。原始LBP算子共有256種變換模式,使用Uniform模式后減為59種,能夠起到很好的降維作用。雖然LBP有很多顯著的優(yōu)點,但是在光照變化和姿態(tài)變化的測試集上,它的人臉識別結(jié)果仍不是很理想,并且由于它是以確切的中心像素為閾值,所以對噪聲很敏感,尤其是均勻的或近似均勻的區(qū)域。Liao等人提出的基于多尺度塊的局 部二值模式(MB-LBP)彌補了LBP對噪聲敏感的缺陷,并進一步利用了圖像的宏觀結(jié)構(gòu),獲得了更加有效的圖像表示。J.Chen等人提出的Weber Local Descriptor(WLD)特征描述算子利用了LBP中被忽略的鄰域像素與中心像素的差值的幅值,求取差勵,并對其進行量化。Yue Ming等人提出的3DLBP,也利用了3DLBP鄰域像素與中心像素的差值,通過對差值進行編碼得到圖像的表示,但是3DLBP將差值大于7的值全部統(tǒng)一為7,這樣會損失大量圖像信息,對識別結(jié)果有很大的影響。
故一種魯棒性更好,人臉識別率更高的視頻監(jiān)控方法亟待提出。
技術(shù)實現(xiàn)要素:
本發(fā)明提出一種基于人臉識別的視頻監(jiān)控方法,該方法具有較好的魯棒性能,可以較好的抑制噪聲的影響,具有良好的人臉識別率。
為了達到上述目的,本發(fā)明的技術(shù)方案如下:
一種基于人臉識別的視頻監(jiān)控方法,包括以下具體步驟:
S1、采集監(jiān)控視頻數(shù)據(jù);
S2、對采集的監(jiān)控視頻數(shù)據(jù)進行解碼;
S3、對已解碼的監(jiān)控視頻數(shù)據(jù)進行檢測,當監(jiān)測到人臉時,獲得監(jiān)控人臉信息并將監(jiān)控人臉信息以及與監(jiān)控人臉信息相關(guān)聯(lián)的監(jiān)控視頻數(shù)據(jù)綁定后存儲到信息存儲模塊;
S4、將目標人臉信息在信息存儲模塊中進行檢索,當檢索到了匹配的人臉信息時,根據(jù)檢索到的人臉信息獲得相應(yīng)的監(jiān)控視頻數(shù)據(jù)。
其中,上述的監(jiān)控人臉信息、目標人臉信息的獲得方法包括以下具體步驟:
(1)對人臉圖像進行積分圖計算,利用所述積分圖求得以點(x,y)為中心,大小為s×s個像素的圖像塊的像素平均值vc,以及以該所述 圖像塊為中心的3×3塊鄰域內(nèi)同等大小的8個子圖像塊的像素平均值vi,i=0,...,7;
(2)對每個所述像素平均值進行方向編碼和幅值編碼,所述方向編碼后得到第一層人臉描述圖像,所述幅值編碼后得到第二層人臉描述圖像和第三層人臉描述圖像;
(3)將所述第一層人臉描述圖像、所述第二層人臉描述圖像和所述第三層人臉描述圖像分別進行分塊處理,得到若干子塊;
(4)對每個所述子塊提取特征直方圖,并利用Uniform模式對所述特征直方圖進行降維;
(5)將三層人臉描述圖像獲取的所有所述特征直方圖進行串聯(lián),得到人臉特征直方圖;
(6)對全部監(jiān)控人臉圖像、目標人臉圖像提取人臉特征直方圖,分別形成監(jiān)控人臉特征集、目標人臉特征集。
另外,上述的步驟S4中檢索監(jiān)控人臉特征集,通過分類識別方法預(yù)測目標人臉圖像的人臉特征直方圖所屬的對象。
本發(fā)明提供的一種基于人臉識別的視頻監(jiān)控方法,對圖像的噪聲具有較強的魯棒性,對人臉的拍攝時間變化、光照變化、表情變化和姿態(tài)具有很好的魯棒性。
作為優(yōu)選的方案,上述的積分圖采用下式進行計算:
其中:i(x′,y′)為灰度圖像內(nèi)任一點(x′,y′)處的像素值。
采用上述優(yōu)選的方案,使得本發(fā)明一種基于多尺度塊局部多值模式的人臉識別方法具有扎實的理論基礎(chǔ)。
作為優(yōu)選的方案,上述的分塊處理為:將每一層所述人臉描述圖 像進行均勻、無交疊的分成m×m個子塊。
采用上述優(yōu)選的方案,保證分塊處理的準確性,提高該方法的人臉識別率。
作為優(yōu)選的方案,上述的方向編碼具體步驟包括:
(1)利用所述積分圖計算人臉圖像中以點(x,y)為中心且大小為s×s的圖像塊的像素平均值vc,計算該圖像塊3×3塊鄰域內(nèi)的8個同樣大小的圖像塊各自的像素平均值v0,...,v7,并計算各鄰域塊像素平均值與中心塊像素平均值的差Δvi,i=0,...,7;
(2)根據(jù)每個Δvi的符號的正負,進行二值編碼,如果Δvi>0則標記為1,否則,標記為0,由八個二進制單元構(gòu)成一個八位的二進制數(shù),將其轉(zhuǎn)化為十進制即得到該點(x,y)方向編碼后的映射值;
(3)對人臉圖像上的所有點進行所述方向編碼即得到第一層人臉描述圖像。
采用上述優(yōu)選的方案,可以得到第一層人臉描述圖像。
作為優(yōu)選的方案,上述的幅值編碼的具體步驟包括:
(1)利用所述積分圖計算人臉圖像中以點(x,y)為中心且大小為s×s的圖像塊的像素平均值vc,計算該圖像塊3×3塊鄰域內(nèi)的8個同樣大小的圖像塊各自的像素平均值v0,...,v7,并計算各鄰域塊像素平均值與中心塊像素平均值的差Δvi,i=0,...,7;
(2)計算arctan(||Δvi||/vc),得到八個范圍都在[0,π/2]的值;
(3)對該八個值進行量化,所述量化的方法是:將[0,π/2]劃分為長度相等的四個區(qū)間,第j個區(qū)間為[j/8,(j+1)π/8],j=0,...,3,如果arctan(||Δvi||/vc)∈[j/8,(j+1)π/8],那么arctan(||Δvi||/vc)就被量化為j;
(4)將該八個量化后得到的值轉(zhuǎn)化為二進制數(shù);
(5)每個二進制數(shù)最多只有兩位,將每個數(shù)的高位按順序組合 成一個二進制數(shù),將每個數(shù)的低位按順序組合成一個二進制數(shù),分別將其轉(zhuǎn)化為十進制即得到該點(x,y)幅值編碼后的映射值;
(6)對人臉圖像上的所有點進行幅值編碼即得到所述第二層人臉描述圖像和所述第三層人臉描述圖像。
采用上述優(yōu)選的方案,可以得到第二層人臉描述圖像和第三層人臉描述圖像。
作為優(yōu)選的方案,上述的分類識別方法為最近鄰分類識別方法,所述最近鄰分類識別方法中的距離采用以下公式所示的卡方距離,
其中:S,M分別為目標人臉圖像和監(jiān)控人臉圖像的特征直方圖向量。
采用上述優(yōu)選的方案,采用最近鄰分類識別方法對測試樣本進行分類,分類便捷。
附圖說明
圖1為本發(fā)明實施例提供的流程圖。
具體實施方式
下面結(jié)合附圖詳細說明本發(fā)明的優(yōu)選實施方式。
為了達到本發(fā)明的目的,如圖1所示,在一種基于人臉識別的視頻監(jiān)控方法的實施例中,包括以下具體步驟:
S1、采集監(jiān)控視頻數(shù)據(jù);
S2、對采集的監(jiān)控視頻數(shù)據(jù)進行解碼;
S3、對已解碼的監(jiān)控視頻數(shù)據(jù)進行檢測,當監(jiān)測到人臉時,獲得監(jiān)控人臉信息并將監(jiān)控人臉信息以及與監(jiān)控人臉信息相關(guān)聯(lián)的監(jiān)控視頻數(shù)據(jù)綁定后存儲到信息存儲模塊;
S4、將目標人臉信息在信息存儲模塊中進行檢索,當檢索到了匹配的人臉信息時,根據(jù)檢索到的人臉信息獲得相應(yīng)的監(jiān)控視頻數(shù)據(jù)。
其中,s=3,m=3,上述的監(jiān)控人臉信息、目標人臉信息的獲得方法包括以下具體步驟:
(1)對人臉圖像進行積分圖計算,利用所述積分圖求得以點(x,y)為中心,大小為s×s個像素的圖像塊的像素平均值vc,以及以該所述圖像塊為中心的3×3塊鄰域內(nèi)同等大小的8個子圖像塊的像素平均值vi,i=0,...,7;
(2)對每個所述像素平均值進行方向編碼和幅值編碼,所述方向編碼后得到第一層人臉描述圖像,所述幅值編碼后得到第二層人臉描述圖像和第三層人臉描述圖像;
(3)將所述第一層人臉描述圖像、所述第二層人臉描述圖像和所述第三層人臉描述圖像分別進行分塊處理,得到若干子塊;
(4)對每個所述子塊提取特征直方圖,并利用Uniform模式對所述特征直方圖進行降維;
(5)將三層人臉描述圖像獲取的所有所述特征直方圖進行串聯(lián),得到人臉特征直方圖;
(6)對全部監(jiān)控人臉圖像、目標人臉圖像提取人臉特征直方圖,分別形成監(jiān)控人臉特征集、目標人臉特征集。
另外,上述的步驟S4中檢索監(jiān)控人臉特征集,通過分類識別方法預(yù)測目標人臉圖像的人臉特征直方圖所屬的對象。
首先,本實施方式一種基于人臉識別的視頻監(jiān)控方法中“尺度”指的是塊的尺度,塊的大小為s×s個像素,則稱其尺度為s,其中s≥1。其次,本發(fā)明對所有監(jiān)控人臉圖像的每張人臉圖像進行計算積分圖,計算積分圖的目的是為了簡化塊的平均像素的計算。在識別階段將所 有目標人臉圖像按照監(jiān)控人臉圖像中提取直方圖的方法提取人臉特征直方圖。
其中,利用積分圖法計算圖像塊的像素平均值的方法是:對于一個灰度圖像,圖像內(nèi)任一點A(x,y),定義其積分圖為其中i(x′,y′)為原始圖點(x′,y′)處的像素值,對于灰度圖像它的像素值范圍為0-255。其中ii(x,y)通過公式ii(x,y)=ii(x-1,y)+s(x,y)和s(x,y)=s(x-1,y)+i(x,y)迭代求出,其中s(x,y)為點(x,y)和其y方向上點(x,y)之上的所有原始圖像像素之和。列積分和定義為且s(x,0)=0,ii(0,y)=0。則對圖像上某個塊區(qū)域四個頂點,從上到下從左到右依次為(x1,y1),(x2,y2),(x3,y3),(x4,y4),那么這個塊區(qū)域的像素和為sum=ii(x1,y1)+ii(x2,y2)-ii(x3,y3)-ii(x4,y4),根據(jù)塊區(qū)域內(nèi)像素點的個數(shù)即可以求出該塊區(qū)域內(nèi)像素點的平均值。
方向編碼具體步驟包括:
(1)利用積分圖計算人臉圖像中以點(x,y)為中心且大小為s×s的圖像塊的像素平均值vc,計算該圖像塊3×3塊鄰域內(nèi)的8個同樣大小的圖像塊各自的像素平均值v0,...,v7,并計算各鄰域塊像素平均值與中心塊像素平均值的差Δvi,i=0,...,7;
(2)根據(jù)每個Δvi的符號的正負,進行二值編碼,如果Δvi>0則標記為1,否則,標記為0,由八個二進制單元構(gòu)成一個八位二進制數(shù),將其轉(zhuǎn)化為十進制即得到該點(x,y)方向編碼后的映射值;
(3)對人臉圖像上的所有點進行方向編碼即得到第一層人臉描述圖像。
幅值編碼的具體步驟包括:
(1)利用積分圖計算人臉圖像中以點(x,y)為中心且大小為s×s的圖像塊的像素平均值vc,計算該圖像塊3×3塊鄰域內(nèi)的8個同樣大小的圖像塊各自的像素平均值v0,...,v7,并計算各鄰域塊像素平均值與中心塊像素平均值的差Δvi,i=0,...,7;
(2)計算arctan(||Δvi||/vc),得到八個范圍都在[0,π/2]的值;
(3)對該八個值進行量化,量化的方法是:將[0,π/2]劃分為長度相等的四個區(qū)間,第j個區(qū)間為[j/8,(j+1)π/8],j=0,...,3,如果arctan(||Δvi||/vc)∈[j/8,(j+1)π/8],那么arctan(||Δvi||/vc)就被量化為j;
(4)將該八個量化后得到的值轉(zhuǎn)化為二進制數(shù);
(5)每個二進制數(shù)最多只有兩位,將每個數(shù)的高位按順序組合成一個二進制數(shù),將每個數(shù)的低位按順序組合成一個二進制數(shù),分別將其轉(zhuǎn)化為十進制即得到該點(x,y)幅值編碼后的映射值;
(6)對人臉圖像上的所有點進行幅值編碼即得到第二層人臉描述圖像和第三層人臉描述圖像。
所述Uniform模式為,當二進制編碼被視為首尾連接的環(huán)形時,當該二進制編碼最多存在兩處由0到1或由1到0的轉(zhuǎn)換時,該二進制編碼為Uniform模式,否則該二進制編碼為非均勻模式;即對于二進制編碼b1b2b3b4b5b6b7b8,若則二進制編碼為Uniform模式,否則為非Uniform模式;八位二進制編碼共有58種Uniform模式編碼值,依次記為0-57,非Uniform模式編碼值統(tǒng)一為58。
將三層人臉描述圖像所有子塊的特征直方圖進行整合得到一幅人臉圖像的整體人臉特征直方圖。
最近鄰分類識別方法中的距離采用以下公式所示的卡方距離,
其中:S,M分別為測試樣本和目標人臉樣本的特征直方圖向量。
得到目標人臉圖像的人臉特征直方圖后,檢索監(jiān)控人臉特征集,通過χ2概率統(tǒng)計和最近鄰分類識別方法預(yù)測目標人臉圖像的人臉特征直方圖所屬的對象。
本發(fā)明的有益效果是:對圖像的噪聲具有較強的魯棒性,對人臉的拍攝時間變化、光照變化、表情變化和姿態(tài)具有很好的魯棒性。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出:對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。