專利名稱:基于后驗概率神經(jīng)網(wǎng)絡(luò)的人類年齡自動估計方法
技術(shù)領(lǐng)域:
本發(fā)明涉及利用計算機對人類年齢進行自動估計的方法。
背景技術(shù):
年齡估計是人類的ー項基本的能力,目前信息化的發(fā)展越來越多的應(yīng)用需要計算機具備對人類年齡進行估計的能力。計算機進行人類年齡的估計主要經(jīng)過以下幾個步驟。 通過照相機或者攝像頭捕捉到人臉的圖像,通過ー些特征提取算法提取人臉圖像的特征并將其輸出到一個訓(xùn)練好的模型中,經(jīng)過該模型的處理可以得到估計的年齢。基于年齡估計的應(yīng)用近年來呈上升趨勢,例如基于年齡的人機交互系統(tǒng);基于年齡的訪問控制系統(tǒng);電子商務(wù);刑事偵查等等。基于自動年齡估計的人機交互系統(tǒng)是在普通的人機交互系統(tǒng)中引入了人類年齡的自動估計算法。不同年齡階段的人是有不同的審美要求的,年輕人喜歡活潑,歡快的風(fēng)格,而中年人則喜歡沉穩(wěn)大氣的風(fēng)格。用戶對軟件的操作是通過人機界面來完成的,如果軟件能夠為當(dāng)前正在使用的用戶提供一個他喜歡的風(fēng)格則會提高軟件的好評率?;谧詣幽挲g估計的人機交互系統(tǒng)可以利用其年齡估計算法來判斷當(dāng)前用戶的年齢區(qū)間從而可以提供一個個性化的服務(wù)。另外隨著年齢的增長,人的視カ 和聽カ是逐漸下降的。如果年齡估計系統(tǒng)判斷當(dāng)前的用戶為老年人,則系統(tǒng)可以適當(dāng)?shù)脑龃笞煮w提高音量,從而可以提高軟件的友好度?;谀挲g的訪問控制系統(tǒng)主要是指限制某一特定年齡階段的人進入該區(qū)域。例如很多國家有限制未成年人進入網(wǎng)吧,酒吧等等場所。 通過基于年齢的自動訪問控制系統(tǒng)則可以很好的幫助管理人員甄別進入的顧客,提高工作效率?;趫D像的年齢估計系統(tǒng)主要有兩個核心的部分組成,一個是人臉圖像的表示, 一個是分類器的選擇。目前常用的人臉圖像表示的方法主要有人體測量學(xué)方法,外觀模型, 年齢成長模式子空間等等。人體測量學(xué)是對人體頭部的幾何形狀進行建摸,能夠很好的表征嬰幼兒到成年人這ー個年齡階段人臉的變化。外觀模型則將人臉形狀和灰度結(jié)合起來, 能夠適應(yīng)各個年齡階段的人臉圖像。年齢成長模式子空間是指某個人的人臉圖像按年齡排序的序列。在模式識別中常用的分類器有決策樹,神經(jīng)網(wǎng)絡(luò),支持向量機等等。在現(xiàn)有的用神經(jīng)網(wǎng)絡(luò)進行預(yù)測人類年齢的方法中。主要是將年齢或者年齢段作為神經(jīng)網(wǎng)絡(luò)的監(jiān)督信號。Sarajedini提出了一種可以直接輸出后驗概率的神經(jīng)網(wǎng)絡(luò),但是他的這個神經(jīng)網(wǎng)絡(luò)是針對于連續(xù)型變量,并且是ー個無監(jiān)督的學(xué)習(xí)算法?,F(xiàn)有的年齡估計算法主要有以下兩點不足之處1.不能充分的利用數(shù)據(jù)庫中的數(shù)據(jù);2.不能即給出一個年齡同時又給出一個年齡段?,F(xiàn)有的人類年齡估計的算法將真實的年齢作為輸入,并在測試的情況下輸出ー個年齢作為預(yù)測的年齢。相比于將年齢的分布作為模型的輸入現(xiàn)有的方法不能充分的利用已有的數(shù)據(jù),而現(xiàn)有的年齢數(shù)據(jù)庫中的人臉圖像比較少。使用年齢的分布不僅表征了這幅年齡的真實年齡而且還給出了和那些年齡相關(guān)度大哪些年齡相關(guān)度小?,F(xiàn)有的人類年齡估計算法從輸出上講主要分為兩類。一類是輸出ー個年齢,ー類是輸出一個年齡區(qū)間。很少有算法能夠既輸出一個年齡的同時也能輸出ー個年齡區(qū)間。同時輸出年齡區(qū)間的算法中區(qū)間的范圍是固定的不能根據(jù)實際的年齡進行更改。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種讓計算機以類似于人的方式(即觀察人臉圖像)對人類年齡進行自動估計,該方法的估計精度可以達到與人類類似的水平。為實現(xiàn)上述目的,本發(fā)明提供了ー種使用后驗概率神經(jīng)網(wǎng)絡(luò)進行人類年齡估計的方法。在對該方法具體步驟進行描述之前,首先給出相關(guān)定義(a)樣本一組人臉圖像數(shù)據(jù)。(b)人臉圖像關(guān)于年齢分布是ー個關(guān)于年齢的分布并且該分布中的年齡越靠近真實年齢其概率值越大。(C)高斯分布概率論中最重要的ー種分布,也是自然界中常見的ー種分布。該分布由兩個參數(shù)--平均值和方差決定。概率密度函數(shù)曲線以均值為對稱中線,方差越小,分布越集中在均值附近。(d)三角分布是ー個以底限為a,眾數(shù)為C,上限為b的連續(xù)概率分布。(e)后驗概率神經(jīng)網(wǎng)絡(luò)一種可以輸出后驗概率的神經(jīng)網(wǎng)絡(luò)。(f)外觀模型 是ー個將形狀與灰度結(jié)合起來的用PCA建模的ー個統(tǒng)計模型。本發(fā)明提供的基于類別分布的年齡估計算法如圖1所示主要包括兩個階段訓(xùn)練階段和應(yīng)用階段。在訓(xùn)練階段主要有以下5個步驟(1)獲取人臉圖像;( 使用外觀模型對人臉圖像抽取特征;C3)生成圖像對應(yīng)的年齢分布;(4)將得到的特征和人臉圖像關(guān)于年齡的分布作為后驗概率神經(jīng)網(wǎng)絡(luò)的輸入并進行訓(xùn)練;(5)訓(xùn)練結(jié)束并得到ー個模型并輸出到下ー個階段。在應(yīng)用階段主要有以下幾個步驟(1)獲取待估計的人臉圖像;( 使用外觀模型進行特征抽?。籆3)將抽取到的特征輸入到在訓(xùn)練階段得到的模型中;(4)經(jīng)過模型的運算可以得出該副圖像對應(yīng)年齢的ー個分布,把這個分布中能夠得取到最大值的年齢作為系統(tǒng)估計的年齢。本發(fā)明的優(yōu)點主要體現(xiàn)在三個方面1.可以充分的利用已有的數(shù)據(jù);2.輸出ー個年齢的分布;3.直接給出后驗概;4.既可以給出年齢也可以給出年齢區(qū)間。本發(fā)明把年齢分布而不是年齢作為輸入的一部分可以有效的利用數(shù)據(jù)庫中的數(shù)據(jù),并且可以部分的緩解年齡估計中數(shù)據(jù)庫數(shù)據(jù)不充足的問題。因為把年齢的分布作為輸入可以使得這個方法不僅可以學(xué)習(xí)到這幅圖像對應(yīng)的年齢也可以學(xué)到其相鄰年齢。本發(fā)明的輸出的是ー個年齢的分布,和普通的方法相比可以更加清晰的表征模型的性能??梢匀≥敵龇植贾械淖畲笾底鳛槲覀兡挲g估計的輸出。從這個分布中也可以看出和那些年齢相關(guān)性較大,那些年齡相關(guān)性較小本發(fā)明直接輸出關(guān)于年齡的后驗概率,普通的方法要到達這個效果通常需要構(gòu)建兩個模型ー個輸出聯(lián)合概率,ー個輸出邊緣概率最后使用貝葉斯公式來進行計算。本發(fā)明在訓(xùn)練過程中使用了貝葉斯公式,從而避免了需要兩個模型才能得到后仰概率的限制。本發(fā)明輸出一個關(guān)于年齢的分布這樣就很容易的給出預(yù)測的年齢或者年齢區(qū)間。 并且這個區(qū)間是根據(jù)實際的情況得出的并不是事先定義好的年齡范圍。這個輸出是一年齡的后驗概率,而傳統(tǒng)的方法則需要兩個模型才可以得出后驗概率。
圖1是年齡估計系統(tǒng)的工作流程圖。
圖2是外觀模型的使用圖示。圖3是后驗概率神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖。圖4是系統(tǒng)的一個輸出例子。
權(quán)利要求
1. 一種基于后驗概率神經(jīng)網(wǎng)絡(luò)的人類年齡自動估計方法,其特點在于使用神經(jīng)網(wǎng)絡(luò)作為模型并且主要包括訓(xùn)練階段和應(yīng)用階段,在訓(xùn)練階段包括以下步驟(1)獲取人臉圖像;(2)使用外觀模型對人臉圖像抽取特征;(3)生成圖像對應(yīng)的年齢分布;(4)將得到的特征和人臉圖像關(guān)于年齢的分布作為輸入(5)使用后驗概率神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練;(6)訓(xùn)練結(jié)束并得到ー個模型并輸出到下一個階段; 在應(yīng)用階段包括以下幾個步驟(a)獲取待估計的人臉圖像;(b)使用外觀模型進行特征抽?。?c)將抽取到的特征輸入到在訓(xùn)練階段得到的模型中;(d)經(jīng)過模型的運算可以得出該副圖像對應(yīng)年齢的ー個分布,把這個分布中能夠得取到最大值的年齡作為系統(tǒng)估計的年齢。
全文摘要
本發(fā)明公布了一種基于后驗概率神經(jīng)網(wǎng)絡(luò)的人類年齡自動估計方法,所述方法包括訓(xùn)練階段和應(yīng)用階段,在訓(xùn)練階段包括以下步驟獲取人臉圖像;使用外觀模型對人臉圖像抽取特征;生成圖像對應(yīng)的年齡分布;將得到的特征和人臉圖像關(guān)于年齡的分布作為輸入,然后對后驗概率神經(jīng)網(wǎng)絡(luò)訓(xùn)練;訓(xùn)練結(jié)束并得到一個模型并輸出到下一個階段;應(yīng)用階段包括以下幾個步驟獲取待估計的人臉圖像;使用外觀模型進行特征抽取;將抽取到的特征輸入到由訓(xùn)練階段得到的模型中;經(jīng)過模型的運算可以得出該副圖像對應(yīng)年齡的一個分布,把這個分布中能夠得取到最大值的年齡作為系統(tǒng)估計的年齡。
文檔編號G06K9/00GK102567719SQ20111044267
公開日2012年7月11日 申請日期2011年12月26日 優(yōu)先權(quán)日2011年12月26日
發(fā)明者尹超, 耿新 申請人:東南大學(xué)