本發(fā)明涉及人臉識別,尤其涉及人臉識別數(shù)據(jù)模型的構(gòu)建方法、人臉識別方法及終端。
背景技術(shù):
1、隨著科技的飛速發(fā)展,人臉識別技術(shù)在眾多領(lǐng)域得到了廣泛應(yīng)用,如安防監(jiān)控、門禁系統(tǒng)、金融支付、社交娛樂等。然而,現(xiàn)有人臉識別技術(shù)仍面臨諸多挑戰(zhàn)與不足。
2、在數(shù)據(jù)模型構(gòu)建方面,數(shù)據(jù)采集往往不夠全面和多樣化。許多人臉識別系統(tǒng)僅在有限的光照條件、角度和人群范圍內(nèi)采集數(shù)據(jù),導(dǎo)致模型對不同環(huán)境和個體特征的適應(yīng)性較差。例如,在一些低光照或強光直射場景下,人臉識別準確率大幅下降;對于側(cè)臉、仰頭或低頭等非正面人臉圖像,識別效果也不盡人意。同時,數(shù)據(jù)預(yù)處理環(huán)節(jié)可能存在缺陷,如去噪不徹底、圖像對比度增強效果不佳,影響后續(xù)特征提取的準確性。特征提取方法也有待改進,部分傳統(tǒng)方法難以有效捕捉人臉的細微特征和深層次特征,使得模型在面對相似人臉時容易出現(xiàn)誤判。模型訓(xùn)練過程中,訓(xùn)練數(shù)據(jù)的劃分比例不合理、訓(xùn)練算法選擇不當以及缺乏有效的防止過擬合措施等問題較為常見,導(dǎo)致模型的泛化能力和穩(wěn)定性不足。
3、在人臉識別方法應(yīng)用中,圖像采集設(shè)備的性能限制影響了待識別圖像的質(zhì)量。一些普通攝像頭在分辨率、對焦速度和防抖能力上存在不足,使得采集到的人臉圖像模糊或變形,增加了識別難度。而且,在人臉檢測步驟,現(xiàn)有的檢測算法對于復(fù)雜背景下的人臉、部分遮擋的人臉或多人臉場景的處理不夠精準,容易出現(xiàn)漏檢或誤檢情況。匹配算法方面,單一的相似度計算方法可能無法準確衡量人臉特征的差異,尤其是在特征向量維度較高且數(shù)據(jù)分布復(fù)雜時,容易導(dǎo)致識別錯誤。此外,缺乏有效的二次驗證機制,在識別結(jié)果模糊時無法進一步確認身份,降低了系統(tǒng)的可靠性。
4、在人臉識別終端設(shè)備上,功能集成度不夠完善。部分終端的圖像采集模塊缺少自動對焦和防抖功能,圖像預(yù)處理與檢測模塊計算速度慢,無法滿足實時性要求。特征提取與識別模塊的模型更新不及時,難以適應(yīng)新的人臉數(shù)據(jù)特征和應(yīng)用場景變化。結(jié)果輸出模塊的靈活性不足,不能根據(jù)不同用戶需求和應(yīng)用場景提供個性化的輸出格式和內(nèi)容。
5、綜上所述,現(xiàn)有人臉識別技術(shù)在數(shù)據(jù)模型構(gòu)建、識別方法和終端設(shè)備等方面存在諸多問題,迫切需要一種更先進、更可靠、更具適應(yīng)性的人臉識別技術(shù)方案來滿足日益增長的市場需求和應(yīng)用場景要求。
技術(shù)實現(xiàn)思路
1、本發(fā)明提出的人臉識別數(shù)據(jù)模型的構(gòu)建方法、人臉識別方法及終端,以解決上述現(xiàn)有技術(shù)中提到的問題。
2、為了實現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:一種人臉識別數(shù)據(jù)模型的構(gòu)建方法,包括以下步驟:
3、數(shù)據(jù)采集步驟:通過圖像采集設(shè)備收集人臉圖像數(shù)據(jù),所述圖像采集設(shè)備包括高清攝像頭、深度攝像頭以及紅外攝像頭,在不同光照條件下,以及不同角度下,對1000個不同年齡段、性別、種族的個體進行拍攝,采集數(shù)量不少于50000張圖像,對采集的圖像進行實時篩選,去除模糊、遮擋嚴重的圖像;
4、數(shù)據(jù)預(yù)處理步驟:對采集到的人臉圖像進行預(yù)處理,首先,進行圖像灰度化處理,將彩色圖像轉(zhuǎn)換為灰度圖像,然后,采用高斯濾波算法去除圖像噪聲,通過調(diào)整高斯核的大小為3x3來平衡去噪效果和圖像細節(jié)保留程度,利用直方圖均衡化增強圖像對比度,使面部特征清晰化,進行人臉檢測與定位,采用基于深度學(xué)習的yolov5目標檢測算法,識別出圖像中的人臉區(qū)域,并將其裁剪出來;
5、特征提取步驟:運用深度學(xué)習框架tensorflow,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)cnn模型用于特征提取,cnn模型包含3個卷積層、2個池化層和2個全連接層,卷積層通過不同大小的卷積核,包括3x3或5x5,提取人臉圖像的局部特征,池化層進行下采樣操作,降低數(shù)據(jù)維度并保留主要特征,全連接層將提取的特征進行整合與映射,得到表征人臉的高維特征向量;在訓(xùn)練過程中,采用公開人臉數(shù)據(jù)集,包括lfw數(shù)據(jù)集、celeba數(shù)據(jù)集,對cnn模型進行預(yù)訓(xùn)練,然后使用采集到的自有數(shù)據(jù)進行微調(diào),適應(yīng)人臉識別任務(wù)需求;
6、模型訓(xùn)練步驟:將提取的人臉特征數(shù)據(jù)分為訓(xùn)練集、驗證集和測試集,比例為6:2:2;使用訓(xùn)練集對人臉識別模型進行訓(xùn)練,訓(xùn)練算法采用隨機梯度下降sgd算法,在訓(xùn)練過程中,設(shè)置合適的損失函數(shù),包括交叉熵損失函數(shù),使損失函數(shù)值逐漸減小,采用早停法earlystopping防止過擬合,當驗證集上的損失函數(shù)值在連續(xù)5個訓(xùn)練周期內(nèi)不再下降時,停止訓(xùn)練;在測試集上評估模型的性能,根據(jù)準確率、召回率、f1值指標調(diào)整訓(xùn)練參數(shù),包括學(xué)習率設(shè)為0.001、批處理大小設(shè)為32,經(jīng)過100次迭代訓(xùn)練,得到訓(xùn)練好的人臉識別數(shù)據(jù)模型。
7、進一步的,在數(shù)據(jù)采集步驟中,利用3d重建技術(shù)對采集到的人臉圖像進行深度信息補充,增強模型對人臉形狀特征的識別能力。
8、進一步的,在數(shù)據(jù)預(yù)處理步驟中,采用自適應(yīng)直方圖均衡化算法,根據(jù)圖像的局部特征動態(tài)調(diào)整均衡化參數(shù),提高圖像對比度增強效果。
9、進一步的,在特征提取步驟中,在cnn模型中引入注意力機制,使模型聚焦于人臉的特征區(qū)域,提高特征提取的質(zhì)量。
10、進一步的,在模型訓(xùn)練步驟中,采用集成學(xué)習方法,將3個訓(xùn)練好的人臉識別模型進行集成,通過加權(quán)平均或投票法,提高模型的整體性能和穩(wěn)定性。
11、進一步的,一種應(yīng)用所述的人臉識別數(shù)據(jù)模型的構(gòu)建方法得到的人臉識別數(shù)據(jù)模型進行人臉識別的方法,包括以下步驟:
12、待識別圖像獲取步驟:通過圖像采集設(shè)備獲取待識別的人臉圖像,圖像采集設(shè)備需保證圖像的清晰度和分辨率,采集的圖像格式為常見的圖像格式,包括jpeg、png;
13、圖像預(yù)處理與人臉檢測步驟:對待識別圖像進行預(yù)處理,處理方式與數(shù)據(jù)預(yù)處理步驟類似,包括灰度化、去噪、對比度增強操作;采用人臉檢測算法檢測出圖像中的人臉區(qū)域,若未檢測到人臉或檢測到多個人臉,給出相應(yīng)提示信息并結(jié)束識別流程;
14、特征提取與匹配步驟:利用構(gòu)建好的人臉識別數(shù)據(jù)模型對檢測到的人臉區(qū)域進行特征提取,得到待識別圖像的人臉特征向量,將特征向量與數(shù)據(jù)庫中存儲的已知人臉特征向量進行匹配,匹配算法采用余弦相似度算法,計算待識別特征向量與數(shù)據(jù)庫中每個特征向量的相似度,設(shè)定相似度閾值為0.8,當相似度超過該閾值時,判定為匹配成功,識別出對應(yīng)的人員身份;若相似度均未超過閾值,則識別失敗,將該待識別圖像標記為未知人員,并可選擇將其特征向量存儲到數(shù)據(jù)庫中。
15、進一步的,在待識別圖像獲取步驟中,若圖像采集設(shè)備采集的圖像質(zhì)量不滿足要求,自動調(diào)整采集參數(shù),包括焦距、曝光時間,重新采集圖像。
16、進一步的,在特征提取與匹配步驟中,當匹配結(jié)果處于相似度閾值附近的模糊區(qū)域,即相似度在0.7至0.8之間時,采用二次驗證機制,包括結(jié)合活體檢測技術(shù)或要求輸入額外的身份驗證信息,提高識別結(jié)果的準確性。
17、進一步的,一種執(zhí)行所述的一種人臉識別的方法的人臉識別終端,包括:
18、圖像采集模塊:用于實現(xiàn)待識別圖像獲取步驟的功能,包括高清攝像頭等圖像采集設(shè)備;
19、圖像預(yù)處理與檢測模塊:執(zhí)行圖像預(yù)處理與人臉檢測步驟,對采集的圖像進行預(yù)處理和人臉檢測操作;
20、特征提取與識別模塊:按照特征提取與匹配步驟,利用構(gòu)建好的人臉識別數(shù)據(jù)模型進行特征提取與匹配識別;
21、結(jié)果輸出模塊:將人臉識別的結(jié)果輸出,輸出方式為在終端屏幕上顯示、語音播報或者通過網(wǎng)絡(luò)傳輸?shù)狡渌O(shè)備。
22、進一步的,所述圖像采集模塊具備自動對焦和圖像防抖功能,確保在不同環(huán)境下都能采集到高質(zhì)量圖像。
23、所述圖像預(yù)處理與檢測模塊采用硬件加速技術(shù),包括gpu加速;
24、所述特征提取與識別模塊具有模型更新功能,定期從服務(wù)器下載更新的人臉識別數(shù)據(jù)模型;
25、所述結(jié)果輸出模塊根據(jù)用戶需求定制輸出格式和內(nèi)容,滿足不同應(yīng)用場景的需求。
26、與現(xiàn)有的技術(shù)相比,本發(fā)明的有益效果是:
27、本專利具有多方面顯著有益效果。在數(shù)據(jù)模型構(gòu)建上,通過多類型攝像頭采集海量且多樣的人臉圖像,涵蓋不同光照、角度與人群,確保數(shù)據(jù)豐富全面。先進的數(shù)據(jù)預(yù)處理技術(shù)有效去除噪聲、增強對比度并精準定位人臉,為后續(xù)步驟奠定良好基礎(chǔ)。采用深度學(xué)習框架構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)結(jié)合注意力機制,能精準提取人臉關(guān)鍵特征,經(jīng)合理劃分數(shù)據(jù)集與優(yōu)化訓(xùn)練算法訓(xùn)練得到的模型,泛化能力強、穩(wěn)定性高,可適應(yīng)復(fù)雜多變的人臉識別任務(wù)。
28、人臉識別方法中,圖像采集設(shè)備可自動優(yōu)化采集參數(shù)獲取高質(zhì)量圖像,人臉檢測算法能在復(fù)雜場景準確識別,降低誤檢漏檢率。采用余弦相似度算法并設(shè)合理閾值,結(jié)合二次驗證機制,在模糊區(qū)域借助活體檢測或額外信息驗證,極大提高識別準確率與可靠性,有效避免誤識別情況發(fā)生。
29、人臉識別終端方面,圖像采集模塊的自動對焦和防抖功能保證圖像質(zhì)量,圖像預(yù)處理與檢測模塊的硬件加速技術(shù)實現(xiàn)快速處理,滿足實時性需求。特征提取與識別模塊的模型更新功能使其能緊跟技術(shù)發(fā)展與數(shù)據(jù)變化,持續(xù)提升識別性能。結(jié)果輸出模塊可定制化輸出,滿足不同場景需求,如安防領(lǐng)域的詳細報警信息輸出、社交娛樂應(yīng)用中的趣味互動結(jié)果展示等,極大拓展了人臉識別技術(shù)的應(yīng)用范圍與用戶體驗。