本發(fā)明涉及人臉識別技術(shù)領(lǐng)域,特別地,涉及一種人臉屬性識別方法及裝置.。
背景技術(shù):
人臉屬性識別技術(shù)是通過檢測人臉圖像,獲得該人臉圖像的年齡、性別等屬性信息。在目前的生活中,安全問題成為了大家關(guān)注的重心。通過監(jiān)控視頻獲取行人的年齡、性別等屬性則能夠更好的協(xié)助司法人員匹配嫌疑人的特征,協(xié)助辦案。對于購物網(wǎng)站,計(jì)算機(jī)系統(tǒng)在自動分析購物者年齡性別屬性后則能夠自動向消費(fèi)者推薦與其身份相符的商品。除此之外,包含人臉圖像屬性識別技術(shù)的應(yīng)用軟件也具有更強(qiáng)的娛樂特性。
早期的人臉屬性檢測技術(shù)多為利用傳統(tǒng)的svm(supportvectormachine,支撐向量機(jī))進(jìn)行分類的方法,對于性別、是否戴眼鏡等屬性可以利用分類器實(shí)現(xiàn)轉(zhuǎn)化為二分類問題,對于年齡則將其轉(zhuǎn)化為不同年齡或不同年齡段的多分類問題?,F(xiàn)階段深度學(xué)習(xí)技術(shù)因其卓越的性能而被廣泛使用,在人臉屬性識別中也有很多應(yīng)用。
然而,基于人臉圖像的屬性識別很大程度受人臉角度、姿態(tài)和光線等因素的影響,識別難度很大,傳統(tǒng)的利用svm的方法很難做到很高的準(zhǔn)確率,該方法容易受到環(huán)境因素影響。
gillevi和talhassner提出的利用深度學(xué)習(xí)進(jìn)行屬性識別的方法,識別出年齡的精度低,只能判斷出該人臉圖像屬于哪個年齡段。另外他們使用的深度殘差網(wǎng)絡(luò)模型層數(shù)少,對于圖像的表達(dá)能力弱,所以方法魯棒性較弱,識別結(jié)果的準(zhǔn)確性較差。
劉昕等人的方法由于使用了8個深層的網(wǎng)絡(luò),雖然年齡識別準(zhǔn)確度較高,但是識別速度慢,無法做到實(shí)時(shí)的屬性檢測。另外他們的方法只實(shí)現(xiàn)了年齡屬性的識別,而沒有做其他屬性的識別。
因此,現(xiàn)有的人臉屬性檢測技術(shù)在識別類型和識別準(zhǔn)確度上存在的缺陷,是一個亟待解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種人臉屬性識別方法及裝置,以解決現(xiàn)有的人臉屬性檢測技術(shù)在識別類型和識別準(zhǔn)確度上存在的缺陷的技術(shù)問題。
本發(fā)明采用的技術(shù)方案如下:
根據(jù)本發(fā)明的一個方面,提供一種人臉屬性識別方法,包括步驟:
利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;
運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。
進(jìn)一步地,利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型的步驟包括:
將已收集的人臉圖像輸入深度殘差網(wǎng)絡(luò),利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量;
對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型。
進(jìn)一步地,對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型的步驟包括:
在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的全連接層,使全連接層與深度殘差網(wǎng)絡(luò)輸出的人臉特征向量對應(yīng)連接;
將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征。
進(jìn)一步地,將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征的步驟之后包括:
在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)層,使損失函數(shù)層與深度殘差網(wǎng)絡(luò)中的輸出層對應(yīng)相連,獲取多屬性人臉特征訓(xùn)練圖像中的訓(xùn)練數(shù)據(jù)集標(biāo)簽,計(jì)算出深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。
進(jìn)一步地,運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性的步驟包括:
將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,提取待識別圖像中的多屬性人臉特征;
將提取的多屬性人臉特征分別輸入對應(yīng)的全連接層,得到設(shè)定維度的人臉圖像多屬性預(yù)測特征;
將全連接層的輸出結(jié)果送入softmax層,計(jì)算出多屬性人臉特征的最大概率值,以識別待識別圖像中的多種人臉屬性。
根據(jù)本發(fā)明的另一方面,還提供一種人臉屬性識別裝置,包括:
訓(xùn)練模塊,用于利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;
預(yù)測模塊,用于運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。
進(jìn)一步地,訓(xùn)練模塊包括第一提取單元和拓展單元,
第一提取單元,用于將已收集的人臉圖像輸入深度殘差網(wǎng)絡(luò),利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量;
拓展單元,用于對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型。
進(jìn)一步地,拓展單元包括連接子單元和訓(xùn)練圖像獲取子單元,
連接子單元,用于在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的全連接層,使全連接層與深度殘差網(wǎng)絡(luò)輸出的人臉特征向量對應(yīng)連接;
訓(xùn)練圖像獲取子單元,用于將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征。
進(jìn)一步地,拓展單元還包括損失計(jì)算子單元,
損失計(jì)算子單元,用于在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)層,使損失函數(shù)層與深度殘差網(wǎng)絡(luò)中的輸出層對應(yīng)相連,獲取多屬性人臉特征訓(xùn)練圖像中的訓(xùn)練數(shù)據(jù)集標(biāo)簽,計(jì)算出深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。
進(jìn)一步地,預(yù)測模塊包括第二提取單元、獲取單元和計(jì)算單元,
第二提取單元,用于將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,提取待識別圖像中的多屬性人臉特征;
獲取單元,用于將提取的多屬性人臉特征分別輸入對應(yīng)的全連接層,得到設(shè)定維度的人臉圖像多屬性預(yù)測特征;
計(jì)算單元,用于將全連接層的輸出結(jié)果送入softmax層,計(jì)算出多屬性人臉特征的最大概率值,以識別待識別圖像中的多種人臉屬性。
本發(fā)明具有以下有益效果:
本發(fā)明提供的人臉屬性識別方法及裝置,通過利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。本發(fā)明提供的人臉屬性識別方法及裝置,利用一個深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,根據(jù)特定任務(wù)訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,因多屬性網(wǎng)絡(luò)模型能提取出更強(qiáng)表達(dá)能力的人臉特征,從而可快速準(zhǔn)確識別人臉圖像中的多種人臉屬性。
除了上面所描述的目的、特征和優(yōu)點(diǎn)之外,本發(fā)明還有其它的目的、特征和優(yōu)點(diǎn)。下面將參照圖,對本發(fā)明作進(jìn)一步詳細(xì)的說明。
附圖說明
構(gòu)成本申請的一部分的附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1是本發(fā)明人臉屬性識別方法第一優(yōu)選實(shí)施例的流程示意圖;
圖2為圖1中利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型的步驟優(yōu)選實(shí)施例的細(xì)化流程示意圖;
圖3為本發(fā)明人臉屬性識別方法優(yōu)選實(shí)施例中人臉多屬性網(wǎng)絡(luò)訓(xùn)練流程圖;
圖4為圖2中對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型的步驟優(yōu)選實(shí)施例的細(xì)化流程示意圖;
圖5為圖1中運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性的步驟優(yōu)選實(shí)施例的細(xì)化流程示意圖;
圖6為本發(fā)明人臉屬性識別方法優(yōu)選實(shí)施例中人臉多屬性預(yù)測流程圖;
圖7為本發(fā)明人臉屬性識別裝置第一優(yōu)選實(shí)施例的功能框圖;
圖8為圖7中訓(xùn)練模塊優(yōu)選實(shí)施例的功能模塊示意圖;
圖9為圖8中拓展單元優(yōu)選實(shí)施例的功能模塊示意圖;
圖10為圖7中預(yù)測模塊優(yōu)選實(shí)施例的功能模塊示意圖。
附圖標(biāo)號說明:
10、訓(xùn)練模塊;20、預(yù)測模塊;11、第一提取單元;12、拓展單元;121、連接子單元;122、訓(xùn)練圖像獲取子單元;123、損失計(jì)算子單元;21、第二提取單元;22、獲取單元;23、計(jì)算單元。
具體實(shí)施方式
需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
參照圖1,本發(fā)明的優(yōu)選實(shí)施例提供一種人臉屬性識別方法,包括步驟:
步驟s100、利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型。
由于不同的人臉屬性相互間具有相關(guān)性,通過一個深度殘差網(wǎng)絡(luò)訓(xùn)練已收集的人臉圖像的所有人臉屬性,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型。在機(jī)器學(xué)習(xí)中,訓(xùn)練是用帶有標(biāo)簽的人臉圖像來訓(xùn)練一個機(jī)器學(xué)習(xí)的模型。由于深度殘差網(wǎng)絡(luò)具有更深的網(wǎng)絡(luò)層數(shù),對于不同的任務(wù)訓(xùn)練都取得了很好的效果。其中,人臉屬性包括年齡、性別、眼鏡、頭部姿態(tài)、胡須、眼睛狀態(tài)和微笑程度等中的二種或二種以上。
步驟s200、運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。
將待識別圖像輸入到訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型中,運(yùn)用多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性,并輸出識別結(jié)果。預(yù)測是指用訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型對未知標(biāo)簽的待識別圖像做預(yù)測,預(yù)測待識別圖像的未知標(biāo)簽。在本實(shí)施例中,對于性別、眼鏡、微笑這種較為容易的二分類問題,直接用softmax層得出該屬性是或否的概率,把最大概率值作為該屬性的預(yù)測。對于年齡,softmax層輸出與年齡對應(yīng)的80維年齡預(yù)測概率分布,用概率分布與標(biāo)準(zhǔn)年齡基求相似性,用相似性得到的權(quán)重對標(biāo)準(zhǔn)年齡基加權(quán)求和,最大值對應(yīng)維度為年齡屬性的預(yù)測。
本實(shí)施例提供的人臉屬性識別方法,利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。本實(shí)施例提供的人臉屬性識別方法,利用一個深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,根據(jù)特定任務(wù)訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,因多屬性網(wǎng)絡(luò)模型能提取出更強(qiáng)表達(dá)能力的人臉特征,從而可快速準(zhǔn)確識別人臉圖像中的多種人臉屬性。
優(yōu)選地,如圖2所示,本實(shí)施例提供的人臉屬性識別方法,步驟s100包括:
步驟s110、將已收集的人臉圖像輸入深度殘差網(wǎng)絡(luò),利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量。
深度殘差網(wǎng)絡(luò)是在2015年由微軟亞洲實(shí)驗(yàn)室提出的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)具有更深的網(wǎng)絡(luò)層數(shù),在多項(xiàng)圖像相關(guān)競賽中奪冠。在本實(shí)施例中,利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量,人臉屬性包括年齡、性別、眼鏡、頭部姿態(tài)、胡須、眼睛狀態(tài)和微笑程度等中的二種或二種以上。
步驟s120、對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型。
利用網(wǎng)上公布的在imagenet數(shù)據(jù)集上訓(xùn)練的網(wǎng)絡(luò)模型,對提取的人臉圖像中的人臉屬性特征進(jìn)行再訓(xùn)練來得到多屬性網(wǎng)絡(luò)模型。原深度殘差網(wǎng)絡(luò)輸出為1000維向量,對圖像做分類,能夠分類1000類物體,對應(yīng)輸出1000維度,每一維度對應(yīng)識別為某種分類物體的概率。在本實(shí)施例中,為了訓(xùn)練多屬性網(wǎng)絡(luò),對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加與每個屬性相對應(yīng)的損失函數(shù)層,使每個損失函數(shù)層都與深度殘差網(wǎng)絡(luò)的輸出層相連。如圖3所示,對于殘差網(wǎng)絡(luò)輸出的1000維特征向量分別連接不同的全連接層來識別不同任務(wù)。
本實(shí)施例提供的人臉屬性識別方法,將已收集的人臉圖像輸入深度殘差網(wǎng)絡(luò),利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量;對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型。本實(shí)施例提供的人臉屬性識別方法,利用一個深度殘差網(wǎng)絡(luò)實(shí)現(xiàn)人臉圖像多屬性的識別,根據(jù)特定任務(wù)訓(xùn)練出來的多屬性網(wǎng)絡(luò)模型提取出更強(qiáng)表達(dá)能力的人臉特征,實(shí)現(xiàn)人臉屬性的快速準(zhǔn)確的識別。
優(yōu)選地,如圖4所示,本實(shí)施例提供的人臉屬性識別方法,步驟s120包括:
步驟s121、在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的全連接層,使全連接層與深度殘差網(wǎng)絡(luò)輸出的人臉特征向量對應(yīng)連接。
請見圖3,由于臉部特征具有相關(guān)性,通過在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加不同的深度神經(jīng)網(wǎng)絡(luò)的全連接層,使全連接層與深度殘差網(wǎng)絡(luò)輸出的1000維多屬性特征向量對應(yīng)連接。從而使不同屬性的識別可以共享同一個神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)多個屬性的同時(shí)訓(xùn)練與識別,最大限度加快訓(xùn)練與預(yù)測速度。
步驟s122、將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征。
參見圖3,對于深度殘差網(wǎng)絡(luò)輸出的1000維特征向量分別連接不同的全連接層來識別不同任務(wù)。其中,對于年齡屬性,在對應(yīng)的全連接層fc1上輸出80維的人臉特征訓(xùn)練圖像的年齡屬性。對于性別屬性,在對應(yīng)的全連接層fc2上輸出2維的人臉特征訓(xùn)練圖像的性別屬性特征。對于眼鏡屬性,在對應(yīng)的全連接層fc3上輸出2維的人臉特征訓(xùn)練圖像的眼鏡屬性特征。
步驟s123、在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)層,使損失函數(shù)層與深度殘差網(wǎng)絡(luò)中的輸出層對應(yīng)相連,獲取多屬性人臉特征訓(xùn)練圖像中的訓(xùn)練數(shù)據(jù)集標(biāo)簽,計(jì)算出深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。
對于年齡屬性,不再使用常規(guī)的多年齡的分類方法來訓(xùn)練,而是將待識別圖像的年齡標(biāo)簽看作高斯函數(shù)的形式,利用交叉熵來計(jì)算深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。對于年齡為age的訓(xùn)練圖像,多屬性人臉特征訓(xùn)練圖像的年齡標(biāo)簽為:
其中,οage為該年齡對應(yīng)標(biāo)準(zhǔn)差,i取值從1到80表示預(yù)測年齡范圍為1歲到80歲。對于不同年齡設(shè)置οage有區(qū)別,在設(shè)定的年齡閾值范圍外時(shí),例如較小年齡(<10歲)以及較大年齡(>70歲)設(shè)置更小的οage,從而可以避免邊緣年齡識別向中間年齡段偏移的問題。
將全連接層fc1輸出的多屬性人臉特征訓(xùn)練圖像中的80維年齡特征通過softmax層,輸出多屬性人臉特征訓(xùn)練圖像屬于每個年齡的概率,softmax運(yùn)算如下:
其中,x為輸入向量,p為輸出概率。交叉熵函數(shù)能夠更好的度量兩個概率分布之間的距離,因此計(jì)算輸出年齡概率p=[p1,p2,…,p80]和標(biāo)簽q=[q1,q2,…,q80]之間的損失使用的交叉熵代價(jià)函數(shù),對于訓(xùn)練樣本標(biāo)簽,如下式所示:
其中,n為訓(xùn)練圖像張數(shù),i為對應(yīng)維度。
對于除年齡屬性外的其他屬性使用softmax損失函數(shù)計(jì)算代價(jià)并進(jìn)行優(yōu)化,softmax代價(jià)函數(shù)如下所示:
其中,pj為softmax運(yùn)算概率值,j為多屬性人臉特征訓(xùn)練圖像真實(shí)的類別編號。
通過以上運(yùn)算,可以計(jì)算每一個屬性對應(yīng)的代價(jià)。并通過反向傳播算法更新網(wǎng)絡(luò)參數(shù)。
本實(shí)施例提供的人臉屬性識別方法,通過將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征;在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)層,使損失函數(shù)層與深度殘差網(wǎng)絡(luò)中的輸出層對應(yīng)相連,獲取多屬性人臉特征訓(xùn)練圖像中的訓(xùn)練數(shù)據(jù)集標(biāo)簽,計(jì)算出深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。本實(shí)施例提供的人臉屬性識別方法,通過添加不同的神經(jīng)網(wǎng)絡(luò)的全連接層,從而使不同屬性的識別共享同一個神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)多個屬性的同時(shí)訓(xùn)練與識別,最大限度加快訓(xùn)練與預(yù)測速度;對于所有屬性中難度較大的年齡識別問題,將所有年齡圖像的標(biāo)簽表示為有方差區(qū)別的高斯函數(shù)的形式,采用交叉熵作為代價(jià)函數(shù)做訓(xùn)練,以得出合理的年齡預(yù)測方案,該方案通過一種軟分配的方法使得年齡識別具有更強(qiáng)的魯棒性。
優(yōu)選地,如圖5所示,本實(shí)施例提供的人臉屬性識別方法,步驟s200包括:
步驟s210、將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,提取待識別圖像中的多屬性人臉特征。
人臉多屬性預(yù)測的整體方案如圖6所示。將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,通過多屬性網(wǎng)絡(luò)訓(xùn)練模型提取待識別圖像中的多屬性人臉特征,網(wǎng)絡(luò)輸出1000維特征向量。
步驟s220、將提取的多屬性人臉特征分別輸入對應(yīng)的全連接層,得到設(shè)定維度的人臉圖像多屬性預(yù)測特征。
對于年齡屬性,將多屬性網(wǎng)絡(luò)訓(xùn)練模型網(wǎng)絡(luò)輸出的1000維特征向量輸入對應(yīng)的全連接層fc1,在全連接層fc1中輸出具有80維年齡特征的人臉圖像多屬性預(yù)測特征。對于性別、是否戴眼鏡等其他屬性,將1000維特征向量輸入對應(yīng)的全連接層fci,在全連接層fci中輸出具有2維特征的人臉圖像多屬性預(yù)測特征。
步驟s230、將全連接層的輸出結(jié)果送入softmax層,計(jì)算出多屬性人臉特征的最大概率值,以識別待識別圖像中的多種人臉屬性。
對于年齡屬性,將全連接層fc1輸出結(jié)果送入對應(yīng)的softmax層,以計(jì)算出初始的各年齡預(yù)測概率的結(jié)果,輸出預(yù)測年齡。對于性別、是否戴眼鏡等其他屬性,通過對應(yīng)的softmax層計(jì)算出2維特征屬性是與否的概率,并取最大概率對應(yīng)情況判斷2維特征屬性情況。
在本實(shí)施例中,網(wǎng)絡(luò)訓(xùn)練結(jié)束后通過多屬性網(wǎng)絡(luò)訓(xùn)練模型預(yù)測待識別圖像的多種人臉屬性。對于除年齡外的其他屬性,參考圖6可得到。對于年齡屬性,構(gòu)造一組標(biāo)準(zhǔn)特征基。因?yàn)榫W(wǎng)絡(luò)輸出特征結(jié)果可能存在誤差,但相似年齡圖像輸出特征是相似的,通過特征比對找到相似年齡圖像并利用軟分配的方法將年齡標(biāo)簽加權(quán)求和,實(shí)現(xiàn)更準(zhǔn)確的年齡識別。
對于每個年齡挑選n張圖像作為標(biāo)準(zhǔn)年齡圖像,生成維度與年齡對應(yīng)的80維年齡特征f(即圖6中fc1通過softmax運(yùn)算后的結(jié)果)作為標(biāo)準(zhǔn)年齡特征基。對于每張待識別圖像同樣提取80維年齡特征f,并計(jì)算80維年齡特征f與標(biāo)準(zhǔn)年齡特征基之間的權(quán)重εi:
其中,f為80維年齡特征,
將εi乘以圖像i對應(yīng)的標(biāo)準(zhǔn)的標(biāo)簽label作為圖像i對于年齡預(yù)測的貢獻(xiàn)值,將年齡特征基中所有圖像貢獻(xiàn)值對應(yīng)維度相加所得到的80維向量,則為最終預(yù)測結(jié)果,80維向量中最大值對應(yīng)維度即為預(yù)測年齡。
本實(shí)施例提供的人臉屬性識別方法,將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,提取待識別圖像中的多屬性人臉特征;將提取的多屬性人臉特征分別輸入對應(yīng)的全連接層,得到設(shè)定維度的人臉圖像多屬性預(yù)測特征;將全連接層的輸出結(jié)果送入softmax層,計(jì)算出多屬性人臉特征的最大概率值,以識別待識別圖像中的多種人臉屬性。本實(shí)施例提供的人臉屬性識別方法,由于臉部特征都具有相關(guān)性,通過添加不同的神經(jīng)網(wǎng)絡(luò)全連接層,不同屬性的識別可以共享同一個神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)多個屬性的同時(shí)訓(xùn)練與識別,最大限度加快訓(xùn)練與預(yù)測速度;預(yù)測時(shí)利用年齡特征基里的標(biāo)準(zhǔn)標(biāo)簽加權(quán)求和來選出年齡預(yù)測結(jié)果。對于訓(xùn)練好的多屬性網(wǎng)絡(luò)訓(xùn)練模型,生成與各個年齡段對應(yīng)維度的年齡特征,并將生成的對應(yīng)維度的年齡特征作為年齡特征基。在待識別圖像中提取年齡特征向量,并將提取的年齡特征向量與所有年齡特征基計(jì)算距離,用距離的指數(shù)函數(shù)加權(quán)年齡特征基所對應(yīng)的待識別圖像的標(biāo)準(zhǔn)標(biāo)簽,將所有加權(quán)后的標(biāo)準(zhǔn)標(biāo)簽相加后求和,最大值對應(yīng)維度則為年齡預(yù)測值。該方案通過一種軟分配的方法使得年齡識別具有更強(qiáng)的魯棒性。
優(yōu)選地,如圖7所示,本實(shí)施例還提供一種人臉屬性識別裝置,包括:訓(xùn)練模塊10,用于利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;預(yù)測模塊20,用于運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。
由于不同的人臉屬性相互間具有相關(guān)性,通過訓(xùn)練模塊10訓(xùn)練已收集的人臉圖像的所有人臉屬性,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型。在機(jī)器學(xué)習(xí)中,訓(xùn)練是用帶有標(biāo)簽的人臉圖像來訓(xùn)練一個機(jī)器學(xué)習(xí)的模型。由于深度殘差網(wǎng)絡(luò)具有更深的網(wǎng)絡(luò)層數(shù),對于不同的任務(wù)訓(xùn)練都取得了很好的效果。其中,人臉屬性包括年齡、性別、眼鏡、頭部姿態(tài)、胡須、眼睛狀態(tài)和微笑程度等中的二種或二種以上。
將待識別圖像輸入到訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型中,預(yù)測模塊20運(yùn)用多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性,并輸出識別結(jié)果。預(yù)測是指用訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型對未知標(biāo)簽的待識別圖像做預(yù)測,預(yù)測待識別圖像的未知標(biāo)簽。在本實(shí)施例中,對于性別、眼鏡、微笑這種較為容易的二分類問題,直接用softmax層得出該屬性是或否的概率,把最大概率值作為該屬性的預(yù)測。對于年齡,softmax層輸出與年齡對應(yīng)的80維年齡預(yù)測概率分布,用概率分布與標(biāo)準(zhǔn)年齡基求相似性,用相似性得到的權(quán)重對標(biāo)準(zhǔn)年齡基加權(quán)求和,最大值對應(yīng)維度為年齡屬性的預(yù)測。
本實(shí)施例提供的人臉屬性識別裝置,通過利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。本實(shí)施例提供的人臉屬性識別裝置,通過訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,可快速準(zhǔn)確識別人臉圖像中的多種人臉屬性。利用深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,得到帶有多種人臉屬性特征的多屬性網(wǎng)絡(luò)訓(xùn)練模型;運(yùn)用得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型來對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,以識別待識別圖像中的多種人臉屬性。本實(shí)施例提供的人臉屬性識別方法,利用一個深度殘差網(wǎng)絡(luò)對已收集的人臉圖像的人臉屬性進(jìn)行訓(xùn)練,根據(jù)特定任務(wù)訓(xùn)練得到的多屬性網(wǎng)絡(luò)訓(xùn)練模型對待識別圖像的人臉屬性進(jìn)行多屬性預(yù)測,因多屬性網(wǎng)絡(luò)模型能提取出更強(qiáng)表達(dá)能力的人臉特征,從而可快速準(zhǔn)確識別人臉圖像中的多種人臉屬性。
優(yōu)選地,本實(shí)施例提供的人臉屬性識別裝置,訓(xùn)練模塊10包括第一提取單元11和拓展單元12,第一提取單元11,用于將已收集的人臉圖像輸入深度殘差網(wǎng)絡(luò),利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量;拓展單元12,用于對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型。
深度殘差網(wǎng)絡(luò)是在2015年由微軟亞洲實(shí)驗(yàn)室提出的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)具有更深的網(wǎng)絡(luò)層數(shù),在多項(xiàng)圖像相關(guān)競賽中奪冠。在本實(shí)施例中,利用第一提取單元11提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量,人臉屬性包括年齡、性別、眼鏡、頭部姿態(tài)、胡須、眼睛狀態(tài)和微笑程度等中的二種或二種以上。
利用網(wǎng)上公布的在imagenet數(shù)據(jù)集上訓(xùn)練的網(wǎng)絡(luò)模型,對提取的人臉圖像中的人臉屬性特征進(jìn)行再訓(xùn)練來得到網(wǎng)絡(luò)模型。原深度殘差網(wǎng)絡(luò)輸出為1000維特征向量,對圖像做分類,能夠分類1000類物體,對應(yīng)輸出1000維度,每一維度對應(yīng)識別為某種分類物體的概率。在本實(shí)施例中,為了訓(xùn)練多屬性網(wǎng)絡(luò),拓展單元12在深度殘差網(wǎng)絡(luò)進(jìn)行拓展,在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加每個屬性的損失函數(shù)層,使每個損失函數(shù)層都與原深度殘差網(wǎng)絡(luò)的輸出層相連。如圖3所示,對于殘差網(wǎng)絡(luò)輸出的1000維特征向量分別連接不同的全連接層來識別不同任務(wù)。
本實(shí)施例提供的人臉屬性識別裝置,將已收集的人臉圖像輸入深度殘差網(wǎng)絡(luò),利用深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提取人臉圖像中的人臉屬性特征,以在深度殘差網(wǎng)絡(luò)中輸出人臉特征向量;對深度殘差網(wǎng)絡(luò)進(jìn)行拓展,將深度殘差網(wǎng)絡(luò)輸出的人臉特征向量集中訓(xùn)練成多屬性網(wǎng)絡(luò)模型。本實(shí)施例提供的人臉屬性識別裝置,利用一個深度殘差網(wǎng)絡(luò)實(shí)現(xiàn)人臉圖像多屬性的識別,根據(jù)特定任務(wù)訓(xùn)練出來的多屬性網(wǎng)絡(luò)模型提取出更強(qiáng)表達(dá)能力的特征,實(shí)現(xiàn)人臉屬性的快速準(zhǔn)確的識別。
優(yōu)選地,本實(shí)施例提供的人臉屬性識別裝置,拓展單元12包括連接子單元121、訓(xùn)練圖像獲取子單元122和損失計(jì)算子單元123,連接子單元121,用于在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的全連接層,使全連接層與深度殘差網(wǎng)絡(luò)輸出的人臉特征向量對應(yīng)連接。訓(xùn)練圖像獲取子單元122,用于將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征。損失計(jì)算子單元123,用于在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)層,使損失函數(shù)層與深度殘差網(wǎng)絡(luò)中的輸出層對應(yīng)相連,獲取多屬性人臉特征訓(xùn)練圖像中的訓(xùn)練數(shù)據(jù)集標(biāo)簽,計(jì)算出深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。
請見圖3,由于臉部特征具有相關(guān)性,通過在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加不同的深度神經(jīng)網(wǎng)絡(luò)的全連接層,使全連接層與深度殘差網(wǎng)絡(luò)輸出的1000維多屬性特征向量對應(yīng)連接。從而使不同屬性的識別可以共享同一個神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)多個屬性的同時(shí)訓(xùn)練與識別,最大限度加快訓(xùn)練與預(yù)測速度。
參見圖3,對于深度殘差網(wǎng)絡(luò)輸出的1000維特征向量分別連接不同的全連接層來識別不同任務(wù)。其中,對于年齡屬性,在對應(yīng)的全連接層fc1上輸出80維的人臉特征訓(xùn)練圖像的年齡屬性。對于性別屬性,在對應(yīng)的全連接層fc2上輸出2維的人臉特征訓(xùn)練圖像的性別屬性特征。對于眼鏡屬性,在對應(yīng)的全連接層fc3上輸出2維的人臉特征訓(xùn)練圖像的眼鏡屬性特征。
對于年齡屬性,不再使用常規(guī)的多年齡的分類方法來訓(xùn)練,而是通過損失計(jì)算子單元123將待識別圖像的年齡標(biāo)簽看作高斯函數(shù)的形式,利用交叉熵來計(jì)算深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。對于年齡為age的訓(xùn)練圖像,多屬性人臉特征訓(xùn)練圖像的年齡標(biāo)簽為:
其中,οage為該年齡對應(yīng)標(biāo)準(zhǔn)差,i取值從1到80表示預(yù)測年齡范圍為1歲到80歲。對于不同年齡設(shè)置οage有區(qū)別,在設(shè)定的年齡閾值范圍外時(shí),例如較小年齡(<10歲)以及較大年齡(>70歲)設(shè)置更小的οage,從而可以避免邊緣年齡識別向中間年齡段偏移的問題。
將全連接層fc1輸出的多屬性人臉特征訓(xùn)練圖像中的80維年齡特征通過softmax層,輸出多屬性人臉特征訓(xùn)練圖像屬于每個年齡的概率,softmax運(yùn)算如下:
其中,x為輸入向量,p為輸出概率。交叉熵函數(shù)能夠更好的度量兩個概率分布之間的距離,因此計(jì)算輸出年齡概率p=[p1,p2,…,p80]和標(biāo)簽q=[q1,q2,…,q80]之間的損失使用的交叉熵代價(jià)函數(shù),對于訓(xùn)練樣本標(biāo)簽,如下式所示:
其中,n為訓(xùn)練圖像張數(shù),i為對應(yīng)維度。
對于除年齡屬性外的其他屬性使用softmax損失函數(shù)計(jì)算代價(jià)并進(jìn)行優(yōu)化,softmax代價(jià)函數(shù)如下所示:
其中,pj為softmax運(yùn)算概率值,j為多屬性人臉特征訓(xùn)練圖像真實(shí)的類別編號。
通過以上運(yùn)算,可以計(jì)算每一個屬性對應(yīng)的代價(jià)。并通過反向傳播算法更新網(wǎng)絡(luò)參數(shù)。
本實(shí)施例提供的人臉屬性識別裝置,通過將深度殘差網(wǎng)絡(luò)中輸出的人臉特征向量對應(yīng)輸入到全連接層上,得到設(shè)定維度的人臉特征訓(xùn)練圖像的多屬性特征;在深度殘差網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)后面添加深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)層,使損失函數(shù)層與深度殘差網(wǎng)絡(luò)中的輸出層對應(yīng)相連,獲取多屬性人臉特征訓(xùn)練圖像中的訓(xùn)練數(shù)據(jù)集標(biāo)簽,計(jì)算出深度殘差網(wǎng)絡(luò)中多屬性人臉特征訓(xùn)練圖像前向傳播時(shí)的損失。本實(shí)施例提供的人臉屬性識別方法裝置,通過添加不同的神經(jīng)網(wǎng)絡(luò)的全連接層,從而使不同屬性的識別共享同一個神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)多個屬性的同時(shí)訓(xùn)練與識別,最大限度加快訓(xùn)練與預(yù)測速度;對于所有屬性中難度較大的年齡識別問題,將所有年齡圖像的標(biāo)簽表示為有方差區(qū)別的高斯函數(shù)的形式,采用交叉熵作為代價(jià)函數(shù)做訓(xùn)練,以得出合理的年齡預(yù)測方案,該方案通過一種軟分配的方法使得年齡識別具有更強(qiáng)的魯棒性。
優(yōu)選地,本實(shí)施例提供的人臉屬性識別裝置,預(yù)測模塊20包括第二提取單元21、獲取單元22和計(jì)算單元23,第二提取單元21,用于將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,提取待識別圖像中的多屬性人臉特征;獲取單元22,用于將提取的多屬性人臉特征分別輸入對應(yīng)的全連接層,得到設(shè)定維度的人臉圖像多屬性預(yù)測特征;計(jì)算單元23,用于將全連接層的輸出結(jié)果送入softmax層,計(jì)算出多屬性人臉特征的最大概率值,以識別待識別圖像中的多種人臉屬性。
人臉多屬性預(yù)測的整體方案如圖6所示。將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,第二提取單元21通過多屬性網(wǎng)絡(luò)訓(xùn)練模型提取待識別圖像中的多屬性人臉特征,網(wǎng)絡(luò)輸出1000維特征向量。
對于年齡屬性,獲取單元22將多屬性網(wǎng)絡(luò)訓(xùn)練模型網(wǎng)絡(luò)輸出的1000維特征向量輸入對應(yīng)的全連接層fc1,在全連接層fc1中輸出具有80維年齡特征的人臉圖像多屬性預(yù)測特征。對于性別、是否戴眼鏡等其他屬性,獲取單元22將1000維特征向量輸入對應(yīng)的全連接層fci,在全連接層fci中輸出具有2維特征的人臉圖像多屬性預(yù)測特征。
對于年齡屬性,計(jì)算單元23將全連接層fc1輸出結(jié)果送入對應(yīng)的softmax層,以計(jì)算出初始的各年齡預(yù)測概率的結(jié)果,輸出預(yù)測年齡。對于性別、是否戴眼鏡等其他屬性,計(jì)算單元23通過對應(yīng)的softmax層計(jì)算出2維特征屬性是與否的概率,并取最大概率對應(yīng)情況判斷2維特征屬性情況。
在本實(shí)施例中,網(wǎng)絡(luò)訓(xùn)練結(jié)束后通過多屬性網(wǎng)絡(luò)訓(xùn)練模型預(yù)測待識別圖像的多種人臉屬性。對于除年齡外的其他屬性,參考圖6可得到。對于年齡屬性,構(gòu)造一組標(biāo)準(zhǔn)特征基。因?yàn)榫W(wǎng)絡(luò)輸出特征結(jié)果可能存在誤差,但相似年齡圖像輸出特征是相似的,通過特征比對找到相似年齡圖像并利用軟分配的方法將年齡標(biāo)簽加權(quán)求和,實(shí)現(xiàn)更準(zhǔn)確的年齡識別。
對于每個年齡挑選n張圖像作為標(biāo)準(zhǔn)年齡圖像,生成維度與年齡對應(yīng)的80維年齡特征f(即圖6中fc1通過softmax運(yùn)算后的結(jié)果)作為標(biāo)準(zhǔn)年齡特征基。對于每張待識別圖像同樣提取80維年齡特征f,并計(jì)算80維年齡特征f與標(biāo)準(zhǔn)年齡特征基之間的權(quán)重εi:
其中,f為80維年齡特征,
將εi乘以圖像i對應(yīng)的標(biāo)準(zhǔn)的標(biāo)簽label作為圖像i對于年齡預(yù)測的貢獻(xiàn)值,將年齡特征基中所有圖像貢獻(xiàn)值對應(yīng)維度相加所得到的80維向量,則為最終預(yù)測結(jié)果,80維向量中最大值對應(yīng)維度即為預(yù)測年齡。
本實(shí)施例提供的人臉屬性識別裝置,將待識別圖像輸入多屬性網(wǎng)絡(luò)訓(xùn)練模型,提取待識別圖像中的多屬性人臉特征;將提取的多屬性人臉特征分別輸入對應(yīng)的全連接層,得到設(shè)定維度的人臉圖像多屬性預(yù)測特征;將全連接層的輸出結(jié)果送入softmax層,計(jì)算出多屬性人臉特征的最大概率值,以識別待識別圖像中的多種人臉屬性。本實(shí)施例提供的人臉屬性識別裝置,由于臉部特征都具有相關(guān)性,通過添加不同的神經(jīng)網(wǎng)絡(luò)全連接層,不同屬性的識別可以共享同一個神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)多個屬性的同時(shí)訓(xùn)練與識別,最大限度加快訓(xùn)練與預(yù)測速度;預(yù)測時(shí)利用年齡特征基里的標(biāo)準(zhǔn)標(biāo)簽加權(quán)求和來選出年齡預(yù)測結(jié)果。對于訓(xùn)練好的多屬性網(wǎng)絡(luò)訓(xùn)練模型,生成與各個年齡段對應(yīng)維度的年齡特征,并將生成的對應(yīng)維度的年齡特征作為年齡特征基。在待識別圖像中提取年齡特征向量,并將提取的年齡特征向量與所有年齡特征基計(jì)算距離,用距離的指數(shù)函數(shù)加權(quán)年齡特征基所對應(yīng)的待識別圖像的標(biāo)準(zhǔn)標(biāo)簽,將所有加權(quán)后的標(biāo)準(zhǔn)標(biāo)簽相加后求和,最大值對應(yīng)維度則為年齡預(yù)測值。該方案通過一種軟分配的方法使得年齡識別具有更強(qiáng)的魯棒性。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。