本發(fā)明涉及計(jì)算機(jī)識(shí)別技術(shù)領(lǐng)域,尤其涉及一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法。
背景技術(shù):
近年來(lái),隨著深度學(xué)習(xí)的興起,在很多領(lǐng)域都得到了廣泛的應(yīng)用,特別是計(jì)算機(jī)視覺(jué)領(lǐng)域尤其明顯。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,包含多個(gè)隱藏層是深度學(xué)習(xí)的一種結(jié)構(gòu)。深度學(xué)習(xí)是通過(guò)組合低層特征形成更加抽象的高層表示類(lèi)別屬性或特征,是用過(guò)多層建模來(lái)發(fā)現(xiàn)數(shù)據(jù)的分布特征。由于深度學(xué)習(xí)的結(jié)構(gòu)特點(diǎn)決定了其特別適合圖像處理領(lǐng)域。
但因現(xiàn)有的年齡圖像數(shù)據(jù)集都是小數(shù)據(jù)集,在運(yùn)用到深度遷移學(xué)習(xí)網(wǎng)絡(luò)模型過(guò)程中產(chǎn)生過(guò)擬合,導(dǎo)致測(cè)量出的年齡和實(shí)際的年齡偏差很大。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的不足,提供一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法,包括以下步驟:
s1:建立深度學(xué)習(xí)網(wǎng)絡(luò)模型,所述深度學(xué)習(xí)網(wǎng)絡(luò)模型為卷積神經(jīng)網(wǎng)絡(luò)模型;
s2:使用大規(guī)模數(shù)據(jù)集,采用分類(lèi)的方式預(yù)訓(xùn)練所述深度學(xué)習(xí)網(wǎng)絡(luò)模型使所述深度學(xué)習(xí)網(wǎng)絡(luò)模型具有分類(lèi)能力;
s3:在步驟s2的基礎(chǔ)上使用表觀年齡數(shù)據(jù)集進(jìn)行微調(diào),使所述深度學(xué)習(xí)網(wǎng)絡(luò)模型具有學(xué)習(xí)表觀年齡和估計(jì)表觀年齡的能力;
s4:在步驟s3的基礎(chǔ)上使用真實(shí)年齡數(shù)據(jù)集進(jìn)行微調(diào),所述真實(shí)年齡數(shù)據(jù)集中80%的數(shù)據(jù)集進(jìn)行所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的微調(diào),然后使用所述真實(shí)年齡數(shù)據(jù)集中20%的數(shù)據(jù)集進(jìn)行所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的測(cè)試;
s5:在所述三個(gè)全連接層中的最后一個(gè)全連接層輸出每一個(gè)年齡值的概率,再使用間接回歸方法進(jìn)行人臉的年齡預(yù)算
s6:將被測(cè)人臉圖像輸入至經(jīng)步驟s1-s5建立后的深度學(xué)習(xí)網(wǎng)絡(luò)模型中,得出所述被測(cè)人臉圖像的估計(jì)年齡值。
本發(fā)明還可以通過(guò)以下技術(shù)措施進(jìn)一步完善:
作為進(jìn)一步改進(jìn),所述深度學(xué)習(xí)網(wǎng)絡(luò)模型包括五個(gè)卷積層和三個(gè)全連接層;所述卷積層是所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的低層,用于學(xué)習(xí)邊緣特征信息;所述全連接層是所述網(wǎng)絡(luò)模型的高層,用于學(xué)習(xí)抽象特征信息。
作為進(jìn)一步改進(jìn),最終估算年齡數(shù)據(jù)通過(guò)公式:
其中,i表示所述最后一個(gè)全連接層的神經(jīng)元個(gè)數(shù)1-100,v(0)為估計(jì)的年齡值,oi表示卷積網(wǎng)絡(luò)最后一個(gè)全連接層的輸出值,yi表示卷積神經(jīng)網(wǎng)絡(luò)輸出的年齡標(biāo)簽值。
作為進(jìn)一步改進(jìn),所述人臉表觀年齡數(shù)據(jù)集中的信息來(lái)源于人臉表觀年齡數(shù)據(jù)庫(kù),所述表觀年齡數(shù)據(jù)庫(kù)中包括至少500k張不同人種的人臉圖像,且其表觀年齡值范圍為1-100歲。
作為進(jìn)一步改進(jìn),所述測(cè)試集的最終預(yù)測(cè)結(jié)果與所述人臉年齡公開(kāi)數(shù)據(jù)庫(kù)中的年齡平均誤差范圍為3.6-3.78,所述年齡平均誤差通過(guò)公式
其中,tk表示真實(shí)年齡值,pk估計(jì)出來(lái)的年齡值,k為測(cè)試年齡圖像的個(gè)數(shù)。
作為進(jìn)一步改進(jìn),所述被測(cè)人臉圖像、所述大數(shù)據(jù)集的圖像、所述表觀數(shù)據(jù)集的人臉圖像以及所述真實(shí)數(shù)據(jù)集中的人臉圖像大小范圍為200*200-300*300。
作為進(jìn)一步改進(jìn),當(dāng)所述深度學(xué)習(xí)網(wǎng)絡(luò)模型經(jīng)過(guò)步驟s1-s5調(diào)試完成后,輸入的所述被測(cè)人臉圖像可直接進(jìn)入步驟s6。
作為進(jìn)一步改進(jìn),在步驟s6中進(jìn)一步包括步驟s61,在得出所述被測(cè)人臉圖像的人臉年齡后與所述被測(cè)人臉圖像的準(zhǔn)確人臉年齡值進(jìn)行比對(duì),若比對(duì)誤差范圍在1歲內(nèi),將所述被測(cè)人臉圖像與被測(cè)人臉圖像的人臉年齡存入真實(shí)年齡數(shù)據(jù)集和大規(guī)模數(shù)據(jù)集中,若比對(duì)誤差范圍大于1歲則不存入真實(shí)年齡數(shù)據(jù)集和大規(guī)模數(shù)據(jù)集中。
與現(xiàn)有技術(shù)相比較,本發(fā)明具有以下優(yōu)點(diǎn):
1、本發(fā)明提供一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法,運(yùn)用大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)模型。因?yàn)椴皇怯么笠?guī)模數(shù)據(jù)集建立深度學(xué)習(xí)網(wǎng)絡(luò)模型,解決了現(xiàn)有年齡圖像數(shù)據(jù)集都是小規(guī)模數(shù)據(jù)集,在建立深度學(xué)習(xí)網(wǎng)絡(luò)模型中導(dǎo)致過(guò)擬合的問(wèn)題。
2、本發(fā)明提供一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法,用大規(guī)模數(shù)據(jù)集、表觀年齡數(shù)據(jù)集、真實(shí)年齡數(shù)據(jù)集逐級(jí)進(jìn)行微調(diào)、預(yù)訓(xùn)練,避免了隨機(jī)初始化網(wǎng)絡(luò)模型的權(quán)值參數(shù)。
4、本發(fā)明提供一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法,該方法的人臉年齡評(píng)估結(jié)果誤差范圍僅在3.6-3.78范圍內(nèi)。
附圖說(shuō)明
圖1是本發(fā)明一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法的流程圖。
圖2是本發(fā)明一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法的深度學(xué)習(xí)網(wǎng)絡(luò)模型示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施方式的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施方式中的附圖,對(duì)本發(fā)明實(shí)施方式中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施方式是本發(fā)明一部分實(shí)施方式,而不是全部的實(shí)施方式?;诒景l(fā)明中的實(shí)施方式,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施方式,都屬于本發(fā)明保護(hù)的范圍。因此,以下對(duì)在附圖中提供的本發(fā)明的實(shí)施方式的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施方式?;诒景l(fā)明中的實(shí)施方式,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施方式,都屬于本發(fā)明保護(hù)的范圍。
在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“上”、“下”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡(jiǎn)化描述,而不是指示或暗示所指的設(shè)備或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對(duì)本發(fā)明的限制。
此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個(gè)或者更多個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上,除非另有明確具體的限定。
在本發(fā)明中,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“安裝”、“相連”、“連接”、“固定”等術(shù)語(yǔ)應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或成一體;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連,可以是兩個(gè)元件內(nèi)部的連通或兩個(gè)元件的相互作用關(guān)系。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。
如圖1-2所示,本實(shí)施例中一種基于深度學(xué)習(xí)的人臉年齡估計(jì)方法,包括以下步驟:
s1:建立深度學(xué)習(xí)網(wǎng)絡(luò)模型,所述深度學(xué)習(xí)網(wǎng)絡(luò)模型為卷積神經(jīng)網(wǎng)絡(luò)模型,所述深度學(xué)習(xí)網(wǎng)絡(luò)模型包括五個(gè)卷積層和三個(gè)全連接層;所述卷積層是所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的低層,用于學(xué)習(xí)邊緣特征信息;所述全連接層是所述網(wǎng)絡(luò)模型的高層,用于學(xué)習(xí)抽象特征信息。因網(wǎng)絡(luò)層數(shù)增加所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的參數(shù)也會(huì)急劇增加,為保證參數(shù)不復(fù)雜,和高的識(shí)別效果故優(yōu)選采用五個(gè)卷積層和三個(gè)全連接層;
s2:使用大規(guī)模數(shù)據(jù)集,采用分類(lèi)的方式預(yù)訓(xùn)練所述深度學(xué)習(xí)網(wǎng)絡(luò)模型使所述深度學(xué)習(xí)網(wǎng)絡(luò)模型具有分類(lèi)能力,所述大規(guī)模數(shù)據(jù)集進(jìn)一步優(yōu)選為imagenet數(shù)據(jù)集,所述imagenet數(shù)據(jù)集是一個(gè)圖像識(shí)別數(shù)據(jù)庫(kù),用所述imagenet數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,避免了隨機(jī)初始化網(wǎng)絡(luò)模型的權(quán)值參數(shù),并且預(yù)訓(xùn)練后的深度學(xué)習(xí)網(wǎng)絡(luò)模型具有分類(lèi)的能力,即能識(shí)別出imagenet中圖像的類(lèi)別。因?yàn)楝F(xiàn)有的年齡數(shù)據(jù)集為小數(shù)據(jù)集,如表觀年齡數(shù)據(jù)集或真實(shí)年齡數(shù)據(jù)集等,如果直接使用現(xiàn)有年齡數(shù)據(jù)集,直接調(diào)整所述深度學(xué)習(xí)網(wǎng)絡(luò)模型,所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)權(quán)值需要初始化,就容易產(chǎn)生過(guò)擬合的問(wèn)題;
s3:在步驟s2的基礎(chǔ)使用表觀年齡數(shù)據(jù)集上進(jìn)行微調(diào),使所述深度學(xué)習(xí)網(wǎng)絡(luò)模型具有學(xué)習(xí)表觀年齡和估計(jì)表觀年齡的能力,所述微調(diào)是為避免重新訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)模型,其具體做法是,使用經(jīng)大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練后的所述深度學(xué)習(xí)網(wǎng)絡(luò)模型得到的網(wǎng)絡(luò)權(quán)值作為表觀年齡數(shù)據(jù)集預(yù)訓(xùn)練的初始化值;
所述人臉表觀年齡數(shù)據(jù)集中的信息來(lái)源于人臉表觀年齡數(shù)據(jù)庫(kù),為使所述深度學(xué)習(xí)網(wǎng)絡(luò)模型更準(zhǔn)確的具有表觀年齡學(xué)習(xí)的能力,所述表觀年齡數(shù)據(jù)庫(kù)中包括至少50k張不同人種且表觀年齡值范圍為1-100歲人臉圖像。所述表觀年齡數(shù)據(jù)集中的人臉圖像都包括有對(duì)應(yīng)的表觀年齡值標(biāo)簽。
s4:在步驟s3的基礎(chǔ)上使用真實(shí)年齡數(shù)據(jù)集進(jìn)行微調(diào),為保證所述訓(xùn)練集充分和所述測(cè)試集的合理,所述真實(shí)年齡數(shù)據(jù)集中70%-80%的數(shù)據(jù)集作為訓(xùn)練集進(jìn)行所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的微調(diào),使用所述真實(shí)年齡數(shù)據(jù)集中20%-30%的數(shù)據(jù)集作為測(cè)試集進(jìn)行所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的測(cè)試;為保證所述訓(xùn)練集最為充分和所述測(cè)試集最為合理,優(yōu)選的采用所述真實(shí)年齡數(shù)據(jù)集中80%的數(shù)據(jù)集作為訓(xùn)練集,采用所述真實(shí)年齡數(shù)據(jù)集中20%的數(shù)據(jù)集作為測(cè)試集。
所述真實(shí)年齡數(shù)據(jù)集中的信息來(lái)源于人臉年齡公開(kāi)數(shù)據(jù)庫(kù)其中對(duì)應(yīng)著有,所述人臉年齡公開(kāi)數(shù)據(jù)庫(kù)中至少包括50k張人臉圖像,為使人臉?biāo)錾疃葘W(xué)習(xí)網(wǎng)絡(luò)模型更好的學(xué)習(xí)所述真實(shí)年齡數(shù)據(jù)集中的人臉圖像,所述真實(shí)年齡數(shù)據(jù)集范圍為1-100歲,所述真實(shí)年齡數(shù)據(jù)集中的人臉圖像包括不同人種、不同亮度、不同姿勢(shì)、不同表情。所述真實(shí)年齡數(shù)據(jù)集中的人臉圖像對(duì)應(yīng)著有實(shí)際的年齡標(biāo)簽。
所述測(cè)試集的最終預(yù)測(cè)結(jié)果與所述人臉年齡公開(kāi)數(shù)據(jù)庫(kù)中的年齡平均誤差范圍為3.6-3.78,所述年齡平均誤差通過(guò)公式
其中,tk表示真實(shí)年齡值,pk估計(jì)出來(lái)的年齡值,k為測(cè)試年齡圖像的個(gè)數(shù)。所述年齡平均誤差優(yōu)選為3.72,當(dāng)所述平均誤差為3.72時(shí),估計(jì)出來(lái)的年齡和真是年齡最為準(zhǔn)確。
s5:在所述卷積神經(jīng)網(wǎng)絡(luò)模型中的最后一個(gè)全連接層的softmax輸出值的基礎(chǔ)上構(gòu)建間接回歸的方法得到最終估算年齡值。
所述最終估算年齡值通過(guò)公式:
其中,i表示所述最后一個(gè)全連接層的神經(jīng)元個(gè)數(shù)1-100,v(0)為估計(jì)的年齡值,oi表示卷積網(wǎng)絡(luò)最后一個(gè)全連接層的輸出值,yi表示卷積神經(jīng)網(wǎng)絡(luò)輸出的年齡標(biāo)簽值。
s6:將被測(cè)人臉圖像輸入至經(jīng)步驟s1-s5建立后的深度學(xué)習(xí)網(wǎng)絡(luò)模型中,得出所述被測(cè)人臉圖像的估計(jì)年齡值,所述被測(cè)人臉圖像采用攝像頭實(shí)時(shí)錄取、或照片上傳等形式獲得;
為方便預(yù)算,所述被測(cè)人臉圖像、所述大數(shù)據(jù)集的圖像、所述表觀數(shù)據(jù)集的人臉圖像以及所述真實(shí)數(shù)據(jù)集中的人臉圖像分辨率大小范圍為200*200-300*300,在保證預(yù)算效率,和圖像清晰度的條件下,人臉圖像大小優(yōu)選為227*227。
當(dāng)所述深度學(xué)習(xí)網(wǎng)絡(luò)模型經(jīng)過(guò)步驟s1-s5調(diào)試完成后,輸入的所述被測(cè)人臉圖像可直接進(jìn)入步驟s6。
在步驟s6中進(jìn)一步包括步驟s61,得出所述被測(cè)人臉圖像的人臉年齡后與所述被測(cè)人臉圖像的準(zhǔn)確人臉年齡值進(jìn)行比對(duì),若比對(duì)誤差范圍在1歲內(nèi),將所述被測(cè)人臉圖像與被測(cè)人臉圖像的人臉年齡存入真實(shí)年齡數(shù)據(jù)集和大規(guī)模數(shù)據(jù)集中,若比對(duì)誤差范圍大于1歲則不存入真實(shí)年齡數(shù)據(jù)集和大規(guī)模數(shù)據(jù)集中。通過(guò)不斷的選取準(zhǔn)確的數(shù)據(jù),擴(kuò)大所述真實(shí)年齡數(shù)據(jù)集和所述大規(guī)模數(shù)據(jù)集中的數(shù)據(jù)量,使深度學(xué)習(xí)網(wǎng)絡(luò)模型在不斷的測(cè)試中,得出的數(shù)據(jù)也更加準(zhǔn)確。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。