活體驗證方法、裝置和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機視覺領(lǐng)域,具體來說涉及一種活體驗證方法、裝置和系統(tǒng)。
【背景技術(shù)】
[0002]近年來,人臉識別技術(shù)有了長足的發(fā)展。但是在很多應(yīng)用場合,例如人臉識別移動支付、視頻見證開戶等,在對人臉圖像進行驗證的時候,同時需要判斷該人臉圖像是活體的人臉圖像,還是照片或是錄制的視頻中的人臉圖像。
[0003]目前常用的人臉活體驗證方法主要有如下幾種:
[0004]1)通過采集人臉圖像的深度信息,將其建模重構(gòu)與三維模板匹配。這種方法的缺點是受環(huán)境條件限制,可能不易獲得完整的深度信息,且三維建模的準確性仍有待提高。
[0005]2)根據(jù)人臉紋理細節(jié)信息,將人臉圖像中的一些特征點或統(tǒng)計特征信息與真實人臉模板進行比對。但是,當待檢測圖像的分辨率較低或不夠完整時,無法準確獲得紋理細節(jié)信息時,該方法并不適用。
[0006]3)中國專利申請CN201210331141.2公開了一種活體檢測方法,其采集多幀人臉圖像,對各幀圖像中的人臉關(guān)鍵點/塊進行定位,通過判斷平均差異值是否大于預(yù)設(shè)閾值來判斷是否活體。中國專利申請CN201510243778.X也公開了一種活體檢測方法,同樣也是采集多幀人臉圖像,通過判斷關(guān)鍵點的屬性變化值的規(guī)律是否符合真實人臉的變化規(guī)律來判斷是否活體。然而,此類檢測人臉全局運動的方法由于人臉的運動是單一的生物特征,且不易改變,當該類方法與基于人臉的身份認證方法結(jié)合時,如果一個人被他人惡意收集到了大量本人的人臉運動圖像用于檢測,則此類方法的可靠性將會降低。
[0007]4)中國專利申請CN201310363154.2所公開的方法中,通過檢測圖像中的人臉的眨眼等運動來判斷是否是活體。然而,對于眨眼這樣簡單的動作,比較容易被偽造,使得此類方法防偽的可靠性降低。
【發(fā)明內(nèi)容】
[0008]本發(fā)明所要解決的技術(shù)問題在于現(xiàn)有活體驗證方案裝置復(fù)雜,且準確度和可靠性不尚。
[0009]為此,本發(fā)明實施例提出了一種活體驗證方法,包括:生成按預(yù)設(shè)軌跡運動的視覺中心點,并在所述視覺中心點運動過程中采集多幀被測對象的人臉圖像,在采集過程中,被測對象的視線始終跟隨所述視覺中心點運動;對所采集的每幀人臉圖像提取圖像信息;根據(jù)所提取的圖像信息估計出視線向量;根據(jù)估計出的視線向量得到估計的投影軌跡;將所述估計的投影軌跡與所述視覺中心點的預(yù)設(shè)軌跡進行對比,當兩者間的相似度大于或等于預(yù)設(shè)閾值時,判斷被測對象為活體,當兩者間的相似度小于預(yù)設(shè)閾值時,判斷被測對象不是活體。
[0010]優(yōu)選地,所述根據(jù)所提取的圖像信息估計出視線向量是將所述圖像信息輸入到神經(jīng)網(wǎng)絡(luò)模型來得到估計的視線向量,所述神經(jīng)網(wǎng)絡(luò)模型通過以下步驟得到:采集海量不同人、不同視線下的人臉圖像;從采集到的人臉圖像中提取圖像信息和視線向量;根據(jù)所得到的圖像信息和視線向量得到所述神經(jīng)網(wǎng)絡(luò)模型。
[0011]優(yōu)選地,所述圖像信息包括眼部圖像,所述從采集到的人臉圖像中提取圖像信息的步驟包括:對采集到的每幅人臉圖像進行人臉檢測,得到人臉區(qū)域;對所得到的人臉區(qū)域,標記出人臉特征點;根據(jù)標記出的人臉特征點,得到眼部的位置,裁剪出左右兩眼的眼部圖像,并將所裁剪出的眼部圖像統(tǒng)一到相同像素大小。
[0012]優(yōu)選地,所述根據(jù)所得到的圖像信息和視線向量得到所述神經(jīng)網(wǎng)絡(luò)模型的步驟包括:將所得到的眼部圖像作為輸入,搭建多層深度卷積神經(jīng)網(wǎng)絡(luò),所述多層深度卷積神經(jīng)網(wǎng)絡(luò)通過卷積層、降采樣層、非線性層依次連接,最后一層是一個f維的全連接層,所得到的視線向量作為輸出層;利用所得到的眼部圖像和視線向量,對所搭建的深度卷積神經(jīng)網(wǎng)絡(luò)進行訓練,所述訓練基于反向傳播算法,在訓練數(shù)據(jù)上利用隨機梯度下降更新模型參數(shù)。
[0013]優(yōu)選地,所述圖像信息包括人臉姿態(tài)特征和眼部圖像,所述從采集到的人臉圖像中提取圖像信息的步驟包括:對采集到的每幅人臉圖像進行人臉檢測,得到人臉區(qū)域;對所得到的人臉區(qū)域,標記出人臉特征點;對標記出的人臉特征點進行歸一化,將歸一化后的人臉特征點作為人臉姿態(tài)特征;根據(jù)標記出的人臉特征點,得到眼部的位置,裁剪出左右兩眼的眼部圖像,并將所裁剪出的眼部圖像統(tǒng)一到相同像素大小。
[0014]優(yōu)選地,所述根據(jù)所得到的圖像信息和視線向量得到所述神經(jīng)網(wǎng)絡(luò)模型的步驟包括:將所得到的眼部圖像作為輸入,搭建多層深度卷積神經(jīng)網(wǎng)絡(luò),所述多層深度卷積神經(jīng)網(wǎng)絡(luò)通過卷積層、降采樣層、非線性層依次連接,最后一層是一個f維的全連接層,并將所得到的人臉姿態(tài)特征和這個f維的全連接層拼接在一起,作為拓展的全連接層,所得到的視線向量作為輸出層;利用所得到的人臉姿態(tài)特征、眼部圖像和視線向量,對所搭建的深度卷積神經(jīng)網(wǎng)絡(luò)進行訓練,所述訓練基于反向傳播算法,在訓練數(shù)據(jù)上利用隨機梯度下降更新模型參數(shù)。
[0015]優(yōu)選地,所述從采集到的人臉圖像中提取視線向量的步驟包括:獲取頭部三維模型;將標記出的人臉特征點對齊到所述頭部三維模型上;根據(jù)所得到的人臉特征點和頭部三維模型的對齊結(jié)果和視覺中心點位置,計算視線向量。
[0016]優(yōu)選地,所述圖像信息包括眼部圖像,所述對所采集的每幀人臉圖像提取圖像信息的步驟包括:對每幀人臉圖像進行人臉檢測,得到人臉區(qū)域;對所得到的人臉區(qū)域,標記出人臉特征點;根據(jù)標記出的人臉特征點,得到眼部的位置,裁剪出左右兩眼的眼部圖像,并將所裁剪出的眼部圖像統(tǒng)一到相同像素大小。
[0017]優(yōu)選地,所述圖像信息包括人臉姿態(tài)特征和眼部圖像,所述對所采集的每幀人臉圖像提取圖像信息包括:對每幀人臉圖像進行人臉檢測,得到人臉區(qū)域;對所得到的人臉區(qū)域,標記出人臉特征點;對標記出的人臉特征點進行歸一化,將歸一化后的人臉特征點作為人臉姿態(tài)特征;根據(jù)標記出的人臉特征點,得到眼部的位置,裁剪出左右兩眼的眼部圖像,并將所裁剪出的眼部圖像統(tǒng)一到相同像素大小。
[0018]本發(fā)明實施例還提供了一種活體驗證裝置,包括:軌跡生成和圖像采集單元,用于生成按預(yù)設(shè)軌跡運動的視覺中心點,并在所述視覺中心點運動過程中采集被測對象的多幀人臉圖像,在采集過程中,被測對象的視線始終跟隨所述視覺中心點運動;圖像信息提取單元,用于對所采集的每幀人臉圖像提取圖像信息;視線向量估計單元,用于根據(jù)所提取的圖像信息估計出視線向量;投影軌跡生成單元,根據(jù)估計出的視線向量得到估計的投影軌跡;對比單元,將所述估計的投影軌跡與所述視覺中心點的預(yù)設(shè)軌跡進行對比,當兩者間的相似度大于或等于預(yù)設(shè)閾值時,判斷被測對象為活體,當兩者間的相似度小于預(yù)設(shè)閾值時,判斷被測對象不是活體。
[0019]優(yōu)選地,所述視線向量估計單元將所述圖像信息輸入到神經(jīng)網(wǎng)絡(luò)模型來得到估計的視線向量,所述神經(jīng)網(wǎng)絡(luò)模型通過以下子單元得到:采集子單元,用于采集海量不同人、不同視線下的人臉圖像;提取子單元,用于從采集到的人臉圖像中提取圖像信息和視線向量;神經(jīng)網(wǎng)絡(luò)模型生成子單元,用于根據(jù)所得到的圖像信息和視線向量得到所述神經(jīng)網(wǎng)絡(luò)模型。
[0020]優(yōu)選地,所述圖像信息包括眼部圖像,所述圖像信息提取單元包括:人臉檢測子單元,用于對每幀人臉圖像進行人臉檢測,得到人臉區(qū)域;人臉特征點標記子單元,用于對所得到的人臉區(qū)域,標記出人臉特征點;眼部圖像裁剪子單元,用于根據(jù)標記出的人臉特征點,得到眼部的位置,裁剪出左右兩眼的眼部圖像,并將所裁剪出的眼部圖像統(tǒng)一到相同像素大小。
[0021]優(yōu)選地,所述圖像信息包括人臉姿態(tài)特征和眼部圖像,所述圖像信息提取單元包括:人臉檢測子單元,用于對每幀人臉圖像進行人臉檢測,得到人臉區(qū)域;人臉特征點標記子單元,用于對所得到的人臉區(qū)域,標記出人臉特征點;人臉特征點歸一化子單元,用于對標記出的人臉特征點進行歸一化,將歸一化后的人臉特征點作為人臉姿態(tài)特征;眼部圖像裁剪子單元,用于根據(jù)標記出的人臉特征點,得到眼部的位置,裁剪出左右兩眼的眼部圖像,并將所裁剪出的眼部圖像統(tǒng)一到相同像素大小。
[0022]本發(fā)明實施例進一步還提供了一種活體驗證系統(tǒng),包括:顯示裝置,用于顯示預(yù)設(shè)軌跡運動的視覺中心點;圖像采集裝置,用于在所述視覺中心點運動過程中采集被測對象的多幀人臉圖像,在采集過程中,被測對象的視線始終跟隨所述視覺中心點運動;處理器,用于生成按所述預(yù)設(shè)軌跡運動的所述視覺中心點;對所采集的每幀人臉圖像提取圖像信息;根據(jù)所提取的圖像信息估計出視線向量;根據(jù)估計出的視線向量得到估計的投影軌跡;將估計的投影軌跡與視覺中心點的預(yù)設(shè)軌跡進行對比,當兩者間的相似度大于或等于預(yù)設(shè)閾值時,判斷被測對象為活體,當兩者間的相似度小于預(yù)設(shè)閾值時,判斷被測對象不是活體。
[0023]根據(jù)本發(fā)明實施例的活體驗證方法、裝置和系統(tǒng),通過在驗證過程中實時采集被測對象的人臉圖像,根據(jù)人臉圖像估計被測對象的視線軌跡,并通過將估計的視線軌跡與視覺中心點的實際運動軌跡對比來判斷被測對象是否活體,僅需要帶有攝像頭和屏幕的設(shè)備即可以完成判斷,不需要復(fù)雜的外設(shè)設(shè)備;采用視線追蹤的方式讓被測對象的視線隨著隨機生成的預(yù)設(shè)軌跡移動,難以被偽造,大大提升了活體驗證的準確度和可靠性。
[0024]根據(jù)本發(fā)明實施例的活體驗證方法、裝置和系統(tǒng),將所得到的圖像信息作為輸入,搭建多層深度卷積神經(jīng)網(wǎng)絡(luò),所述多層深度卷積神經(jīng)網(wǎng)絡(luò)通過卷積層、降采樣層、非線性層依次連接,最后一層是一個f維的全連接層,所得到的視線向量作為輸出層,并利用所得到的圖像信息和視線向量,對所搭建的深度卷積神經(jīng)網(wǎng)絡(luò)進行訓練以得到神經(jīng)網(wǎng)絡(luò)模型,從而可以快速準確地從所提取出的圖像信息估計出視線向量,進而提升了活體判斷的準確度。
[0025]根據(jù)本發(fā)明實施例的活體驗證方法、裝置和系統(tǒng),選取眼部圖像來作為圖像信息從而可以簡化計算,快速完成檢測;在進一步優(yōu)選的實施方式中,選取人臉姿態(tài)特征和眼部圖像這兩者來作為圖像信息,進一步考慮了被測對