本發(fā)明屬于人臉識別技術(shù)領(lǐng)域,尤其涉及一種活體人臉識別方法及系統(tǒng)。
背景技術(shù):
生物特征識別系統(tǒng)的使用安全性是人們普遍關(guān)注的問題,人們對生物特征識別系統(tǒng)的信心和接受很大程度上取決于系統(tǒng)的魯棒性、低錯誤率和抗欺騙能力。因此活體檢測是生物特征識別系統(tǒng)中檢測和拒絕仿冒身份特征的一項重要功能。在人臉識別系統(tǒng)中有可能面臨的所有的欺騙中,通過照片或者視頻的方式毫無疑問是最常見的。如果沒有活體人臉檢測做保障,用一張照片、一段視頻都可以欺詐通過,那么這樣的人臉識別有什么實際應(yīng)用價值?因此,人臉識別技術(shù)目前還存在嚴重的安全隱患。比如,在智能家居的安防產(chǎn)品中,通過人臉識別認證是普遍的做法,但人臉識別有一個很大的問題,當(dāng)有人用照片來欺騙安防攝像頭時,有時候顯得無能為力。
現(xiàn)有技術(shù)中中,專利號cn201510633817《活體人臉識別方法和裝置》中,通過雙攝像頭采集圖像數(shù)據(jù),然后根據(jù)雙攝像頭采集的兩張圖片數(shù)據(jù)中通過一定算法提取人臉面目深度信息來確定是否是真實的人臉,因為照片是平面的,是沒有深度信息的。但這種傳統(tǒng)算法不可能是無缺陷的,這種方法在真實使用中很容易造成誤判,尤其是在復(fù)雜環(huán)境下,比如光照較差的情況下,準確率不高。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種活體人臉識別方法及系統(tǒng),可以避免使用含有人臉的照片或視頻來騙取認證,提高了系統(tǒng)安全性,同時縮短了識別時間,提高了識別準確率。
本發(fā)明一種活體人臉識別方法包括:
s100采集攝像頭拍攝的視頻幀圖像;
s200通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)來識別所述視頻幀圖像是否為活體人臉圖像。
本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的活體人臉檢測方法,該方法可以判別人臉圖像是活體人臉圖像還是照片(或者視頻),從而防止非法用戶使用合法用戶的照片、視頻進行欺騙。傳統(tǒng)的活體人臉檢測算法都是基于手工特征提取的,一種有效的手工特征需要很長時間才能設(shè)計出來,且算法也是存在一定缺陷的,對準確率有一定影響,而卷積神經(jīng)網(wǎng)絡(luò)不需要手工設(shè)計特征,只需要設(shè)計網(wǎng)絡(luò)結(jié)構(gòu),訓(xùn)練參數(shù)即可。
進一步地,所述步驟s100之前還包括步驟:
s010通過攝像頭采集用于訓(xùn)練的活體人臉圖像樣本及人臉照片樣本,并進行分類;
s020通過卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)所述活體人臉圖像樣本、人臉照片樣本,學(xué)習(xí)訓(xùn)練后獲得能分辨出活體人臉與照片的活體人臉識別模型。
訓(xùn)練樣本,如果想要分辨率高的話,樣本的數(shù)量自然是越多越好。由于訓(xùn)練的模型需要能分辨出拍攝的是活體人臉還是照片,因此在訓(xùn)練的時候就需要進行分類訓(xùn)練,通過攝像頭拍攝活體人臉獲得的活體人臉圖像作為活體人臉圖像樣本,并標(biāo)記為活體人臉,通過攝像頭拍攝人臉照片(或視頻)而獲得的人臉圖像作為人臉照片樣本,并標(biāo)記為人臉照片,從而讓卷積神經(jīng)網(wǎng)絡(luò)分類學(xué)習(xí)和訓(xùn)練,從而使得能快速區(qū)分活體人臉與照片。
進一步地,所述步驟s200包括步驟:
s210對所述視頻幀圖像進行圖像處理;
s220對處理后的視頻幀圖像進行人臉檢測,判斷所述視頻幀圖像是否包含了人臉,若是則進入下一步驟;
s230將所述處理后的視頻幀圖像作為所述活體人臉識別模型的輸入,獲得識別分類結(jié)果。
進一步地,所述步驟s210中所述的圖像處理包括對所述視頻幀圖像進行光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波及銳化處理。
對圖像進行預(yù)處理會更利用提高識別速度與效率。
進一步地,所述攝像頭為雙攝像頭。
本發(fā)明還公開了一種活體人臉識別系統(tǒng),包括攝像模塊、采集模塊、活體人臉檢測模塊,所述采集模塊分別與所述攝像模塊、活體人臉檢測模塊相連,其中:所述采集模塊對所述攝像模塊拍攝的視頻進行采樣獲得視頻幀圖像;所述活體人臉檢測模塊通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)檢測識別所述視頻幀圖像是否為活體人臉圖像。
進一步地,所述活體人臉檢測模塊包括學(xué)習(xí)子模塊、與所述學(xué)習(xí)子模塊相連的,活體人臉識別子模塊,其中:所述采集模塊通過所述攝像模塊采集用于訓(xùn)練的活體人臉圖像樣本及人臉照片樣本,并進行分類;所述學(xué)習(xí)子模塊通過卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)所述活體人臉圖像樣本、人臉照片樣本,并將訓(xùn)練的結(jié)果給到所述活體人臉識別子模塊,使得所述活體人臉識別子模塊能對活體人臉圖像與人臉照片進行區(qū)分。
進一步地,所述活體人臉檢測模塊還包括:圖像處理子模塊、人臉檢測子模塊、所述人臉檢測子模塊分別與所述圖像處理子模塊、活體人臉識別子模塊相連,所述活體人臉檢測子模塊與所述圖像處理子模塊相連,其中:所述圖像處理子模塊對所述視頻幀圖像進行圖像處理;所述人臉檢測子模塊對所述圖像處理子模塊處理后的視頻幀圖像進行人臉檢測,判斷所述視頻幀圖像是否包含了人臉,若是,則所述活體人臉識別子模塊對所述視頻幀圖像進行識別,判斷所述視頻幀圖像是否為活體人臉圖像。
進一步地,所述圖像處理模塊對所述視頻幀圖像進行光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波及銳化處理。
進一步地,所述攝像模塊包含至少兩個攝像頭。
本發(fā)明有益效果如下:
本發(fā)明采用基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法學(xué)習(xí)活體人臉數(shù)據(jù),深度學(xué)習(xí)的一些網(wǎng)絡(luò)結(jié)構(gòu)模擬人的大腦,通過網(wǎng)絡(luò)的深度和卷積,在活體人臉識別領(lǐng)域達到很好的效果,可以避免使用含有人臉的視頻或照片來騙取認證,提高了系統(tǒng)安全性,同時可縮短識別時間,提高識別準確率。且通過用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模擬人類的大腦,通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)來判別是否是照片,很大程度上讓計算機通過“直覺”來判別照片,而不是設(shè)計的算法,這樣避免了算法的缺陷,大大提高了識別的準確率。且深度學(xué)習(xí)網(wǎng)絡(luò)可以通過學(xué)習(xí)在復(fù)雜環(huán)境下的圖像樣本,使得在復(fù)雜環(huán)境下產(chǎn)生較好的效果。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一種活體人臉識別方法實施例一流程圖;
圖2為本發(fā)明一種活體人臉識別方法另一實施例流程圖;
圖3為本發(fā)明一種活體人臉識別系統(tǒng)實施例一框圖;
圖4為本發(fā)明一種活體人臉識別系統(tǒng)另一實施例框圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明作進一步地詳細描述,顯然,所描述的實施例僅僅是本發(fā)明一部份實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明公開了一種活體人臉識別方法,如圖1所示,包括步驟:
s100采集攝像頭拍攝的視頻幀圖像;
s200通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)來識別所述視頻幀圖像是否為活體人臉圖像。
卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的人臉檢測方法不同,它是通過直接作用于輸入樣本,用樣本來訓(xùn)練網(wǎng)絡(luò)并最終實現(xiàn)檢測任務(wù)的。它是非參數(shù)型的人臉檢測方法,可以省去傳統(tǒng)方法中建模、參數(shù)估計以及參數(shù)檢驗、重建模型等的一系列復(fù)雜過程。
已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),由于已對其進行了學(xué)習(xí)訓(xùn)練,因此能夠快速判斷出攝像頭拍攝的是不是活體人臉。由于照片是平面的,光線是固定的。而真實的人臉是3維的,在光線下將產(chǎn)生更多的特征,通過雙攝像頭獲取的真實人臉將內(nèi)含這種特征,而照片是沒有這種特征的。我們采取深度學(xué)習(xí)方法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)抓取這種特征。
在利用卷積神經(jīng)網(wǎng)絡(luò)來進行活體人臉識別之前,需要對該卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,具體的,包括步驟:
s010通過攝像頭采集用于訓(xùn)練的活體人臉圖像樣本及人臉照片樣本,并進行分類;
s020通過卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)所述活體人臉圖像樣本、人臉照片樣本,學(xué)習(xí)訓(xùn)練后獲得能分辨出活體人臉與照片的活體人臉識別模型。
訓(xùn)練方法很簡單,我們輸入大量的照片到深度學(xué)習(xí)網(wǎng)絡(luò),標(biāo)識其為照片。而輸入真實的人臉圖像(即活體人臉圖像)到深度學(xué)習(xí)網(wǎng)絡(luò),標(biāo)識其為活體人臉。在經(jīng)過大量的訓(xùn)練后,我們的網(wǎng)絡(luò)就會學(xué)習(xí)到什么是照片,什么是活體人臉。例如,我們可采用由兩個攝像頭采集的圖像,其中采集一組為真實人臉(即活體人臉)的圖像100000對(一張攝像頭1的照片和一張攝像頭2的照片為一對)。采集一組為人臉照片的圖像100000對。這兩組照片我們要進行分類學(xué)習(xí)。在選取照片和真實人臉的圖像時,我們采用不同光照條件下的圖片,包括任意大小、位置、姿勢、方向、膚色、面部表情和光照條件的真實人臉圖像和人臉照片。使得系統(tǒng)在各種可能出現(xiàn)的情況下均具有高的準確率。
本發(fā)明方法的另一實施例,如圖2所示,包括步驟:
s010通過攝像頭采集用于訓(xùn)練的活體人臉圖像樣本及人臉照片樣本,并進行分類;
s020通過卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)所述活體人臉圖像樣本、人臉照片樣本,學(xué)習(xí)訓(xùn)練后獲得能分辨出活體人臉與照片的活體人臉識別模型;
s100采集攝像頭拍攝的視頻幀圖像;
s210對所述視頻幀圖像進行圖像處理;
s220對處理后的視頻幀圖像進行人臉檢測,判斷所述視頻幀圖像是否包含了人臉,若是則進入下一步驟;
s230將所述處理后的視頻幀圖像作為所述活體人臉識別模型的輸入,獲得識別分類結(jié)果。
人臉檢測步驟主要是用來判斷視頻幀圖像是否包含了人臉。人臉檢測可以采用多種方式進行判別,只需要能檢測出圖像中是否含有人臉就可以了。比如,對攝像頭采集到的視頻幀圖像,進行灰度變換、濾波處理等圖像處理后,獲得高質(zhì)量的灰度圖,然后對灰度圖利用積分快速計算出haar-like小波特征值,應(yīng)用到離散訓(xùn)練好的adaboost(adaptiveboosting)分類器,判別是否是人臉。haar-like特征,即很多人常說的haar特征,是計算機視覺領(lǐng)域一種常用的特征描述算子,可用于人臉描述。得到haar-like小波特征值后,采用離散訓(xùn)練好的adaboost分類器進行人臉識別。所謂分類器,在這里就是指對人臉和非人臉進行分類的算法,在adaboost算法的基礎(chǔ)上,使用haar-like小波特征和積分圖方法進行人臉檢測。值得注意的是,本發(fā)明中關(guān)于人臉檢測的方法不限于本實施例中提到的方法,其它現(xiàn)有可以實現(xiàn)人臉檢測的方法均可。
如果判斷出采集的視頻幀圖像根本不含有人臉,那么也就無需進行后面的活體人臉認證,只有檢測出含有人臉后,才進一步判斷該視頻幀圖像是否是拍攝的活體人臉的圖像。由于卷積神經(jīng)網(wǎng)絡(luò)已深度學(xué)習(xí)了活體人臉的特征、及訓(xùn)練時分類為人臉照片的特征,由此獲得了能夠快速區(qū)分出該視頻幀圖像是活體人臉還是照片的活體人臉識別模型。只需將人臉檢測后的視頻幀圖像直接輸入到該活體人臉識別模型中,即可快速輸出識別結(jié)果。
較佳的,上述步驟s210中所述的圖像處理包括對所述視頻幀圖像進行光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波及銳化處理。
系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預(yù)處理。對于人臉圖像而言,其預(yù)處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。在通過活體人臉識別模型對視頻幀圖像進行識別之前,先對人臉圖像進行預(yù)處理,能有效的提高最終的識別效率及準確度。
較佳的,上述任一方法實施例中所述的攝像頭均可采用雙攝像頭。由于一個攝像頭采集的單個人臉平面圖像的識別率受到環(huán)境光線、采集角度、表情等等因素的影響,因此受到了受到較大的局限性。而通過雙攝像頭來采集的話則能較好的克服這些問題。
基于相同的技術(shù)構(gòu)思,本發(fā)明實施例還提供一種活體人臉識別系統(tǒng),該系統(tǒng)可執(zhí)行上述方法實施例,具體的,本發(fā)明活體人臉識別系統(tǒng)的實施例一如圖一所示,包括攝像模塊、采集模塊、活體人臉檢測模塊,所述采集模塊分別與所述攝像模塊、活體人臉檢測模塊相連,其中:所述采集模塊對所述攝像模塊拍攝的視頻進行采樣獲得視頻幀圖像;所述活體人臉檢測模塊通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)檢測識別所述視頻幀圖像是否為活體人臉圖像。
攝像頭用來拍攝視頻,而采集模塊則從攝像頭拍攝的視頻中進行采樣,采集視頻幀圖像,活體人臉檢測模塊則用來檢測采集的視頻幀圖像是否是拍攝的活體人臉的圖像。
本發(fā)明系統(tǒng)采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模擬人類的大腦,通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)來判別是否是活體人臉,很大程度上讓計算機通過“直覺”來判別活體人臉,而不是設(shè)計的算法,這樣避免了算法的缺陷,大大提高了識別的準確率。
在上述系統(tǒng)實施例一的基礎(chǔ)上,所述活體人臉檢測模塊包括學(xué)習(xí)子模塊、與所述學(xué)習(xí)子模塊相連的,活體人臉識別子模塊,其中:所述采集模塊通過所述攝像模塊采集用于訓(xùn)練的活體人臉圖像樣本及人臉照片樣本,并進行分類;所述學(xué)習(xí)子模塊通過卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)所述活體人臉圖像樣本、人臉照片樣本,并將訓(xùn)練的結(jié)果給到所述活體人臉識別子模塊,使得所述活體人臉識別子模塊能對活體人臉圖像與人臉照片進行區(qū)分。
較佳的,在上述實施例基礎(chǔ)上所述活體人臉檢測模塊還包括:圖像處理子模塊、人臉檢測子模塊、所述人臉檢測子模塊分別與所述圖像處理子模塊、活體人臉識別子模塊相連,所述活體人臉檢測子模塊與所述圖像處理子模塊相連,其中:所述圖像處理子模塊對所述視頻幀圖像進行圖像處理;所述人臉檢測子模塊對所述圖像處理子模塊處理后的視頻幀圖像進行人臉檢測,判斷所述視頻幀圖像是否包含了人臉,若是,則所述活體人臉識別子模塊對所述視頻幀圖像進行識別,判斷所述視頻幀圖像是否為活體人臉圖像。
先通過人臉檢測確定視頻幀圖像中是否含有人臉,含有的人臉的話才會進行下一步的活體人臉識別。
上述實施例中的所述圖像處理模塊對所述視頻幀圖像進行圖像處理包括進行光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波及銳化處理。
對于人臉的圖像預(yù)處理是基于人臉檢測結(jié)果,對圖像進行處理并最終服務(wù)于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預(yù)處理。對于人臉圖像而言,其預(yù)處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
上述任一系統(tǒng)實施例中所述的攝像模塊包含至少兩個攝像頭。單個攝像頭一般會受光照條件、采集角度、人臉表情等等的影響,而至少兩個攝像頭則能從一定程度上減小這些受限影響。本發(fā)明通過攝像模塊的至少兩個攝像頭拍攝圖片,由于照片是平面的,光線是固定的。而真實的人臉是3維的,在光線下將產(chǎn)生更多的特征,通過至少兩個攝像頭獲取的真實人臉將內(nèi)含這種特征,而照片是沒有這種特征的。
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。