基于Adaboost算法的人臉識(shí)別優(yōu)化方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于機(jī)器學(xué)習(xí)和模式識(shí)別技術(shù)領(lǐng)域,是利用訓(xùn)練數(shù)據(jù)集成構(gòu)建一個(gè)具有較 強(qiáng)泛化能力的預(yù)測(cè)方法,以期對(duì)新的未知對(duì)象給出精確估計(jì)。
【背景技術(shù)】
[0002] 人臉識(shí)別技術(shù)是圖像處理方面的重要技術(shù),然而識(shí)別率不高是一直妨礙人臉識(shí)別 技術(shù)廣泛應(yīng)用的重要原因。研宄發(fā)現(xiàn)可以通過(guò)集成學(xué)習(xí)的方法來(lái)提高準(zhǔn)確率。集成學(xué)習(xí)使 用多個(gè)學(xué)習(xí)機(jī)來(lái)解決同一問(wèn)題,它通過(guò)調(diào)用一些簡(jiǎn)單的分類算法,以獲得多個(gè)不同的基學(xué) 習(xí)機(jī),然后采用某種方式將這些學(xué)習(xí)機(jī)組合成一個(gè)集成學(xué)習(xí)機(jī)。一般地,一個(gè)集成學(xué)習(xí)機(jī) 的構(gòu)建分為兩步:基學(xué)習(xí)機(jī)的生成和基學(xué)習(xí)機(jī)的合并,現(xiàn)有的許多集成學(xué)習(xí)算法主要是在 這兩方面存在差異。在構(gòu)建集成學(xué)習(xí)機(jī)時(shí),有效地產(chǎn)生泛化能力強(qiáng)、差異大的基學(xué)習(xí)機(jī)是關(guān) 鍵,即基學(xué)習(xí)機(jī)的準(zhǔn)確性和它們之間的多樣性是兩個(gè)重要因素。
[0003]目前,常見的用于生成基學(xué)習(xí)機(jī)的方法可以粗略地分為兩大類:一類是將不同類 型的學(xué)習(xí)算法應(yīng)用于同一數(shù)據(jù)集上,這種方法得到的基學(xué)習(xí)機(jī)通常被稱為是異質(zhì)類型的; 另一類是將同一學(xué)習(xí)算法應(yīng)用于不同的訓(xùn)練集,這種方法得到的機(jī)學(xué)習(xí)機(jī)被稱為是同質(zhì)類 型的。
[0004] 根據(jù)基分類器提供的信息水平將現(xiàn)有的合并準(zhǔn)則分成了三大類:抽象水平、秩水 平和置信值水平。抽象水平是指基分類器的輸出是類標(biāo)簽,秩水平假定基分類器的輸出是 根據(jù)分類器的預(yù)測(cè)效果好壞而對(duì)它們賦予的秩序列,而置信值水平則假定每個(gè)基分類器的 輸出是一個(gè)概率分布。在置信水平類的合并準(zhǔn)則中,根據(jù)是否需要估計(jì)額外的參數(shù),它們又 可以分為固定的合并準(zhǔn)則和可訓(xùn)練的合并準(zhǔn)則。固定的合并準(zhǔn)則是基于基分類器的輸出對(duì) 基分類器直接進(jìn)行合并,常用的有最大值、最小值、中位數(shù)、乘機(jī)、均值和多數(shù)投票準(zhǔn)則;而 可訓(xùn)練的合并準(zhǔn)則是將多個(gè)基分類器的輸出作為新的特征再構(gòu)建一個(gè)更高水平的分類器, 常見的方法有神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機(jī)、Bayes準(zhǔn)則、行為知識(shí)空間、Dempster-Shafer 理論等。
[0005] 集成學(xué)習(xí)中的Boosting算法已被成功應(yīng)用于二分類問(wèn)題。Adaboost.Ml算法將 Boosting算法擴(kuò)展到多分類問(wèn)題,但它要求每個(gè)弱分類器的正確率要大于1/2。但在多分 類問(wèn)題中尋找正確率大于1/2的弱分類器較為困難。近幾年,有學(xué)者針對(duì)該問(wèn)題提出了適 于多分類問(wèn)題的SAMME算法,并從理論上證明了新方法符合貝葉斯最佳分類規(guī)則。該方法 把對(duì)弱分類器正確率的要求從大于1/2降低到大于l/k(k為類別數(shù)),從而降低了尋找弱分 類器的難度。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于針對(duì)已有人臉識(shí)別技術(shù)存在的識(shí)別率低的問(wèn)題,提出一種改進(jìn) 的SAMME算法SAMME.R應(yīng)用于人臉識(shí)別中。
[0007] 為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是基于Adaboost算法的人臉識(shí)別優(yōu)化 方法,具體而言,
[0008] 首先對(duì)人臉圖像進(jìn)行特征提取和降維,即利用(2D)2PCA算法對(duì)圖像進(jìn)行特征提取 和降維,同時(shí)在行與列上對(duì)圖像矩陣進(jìn)行降維,進(jìn)一步降低特征向量的維數(shù),有效降低問(wèn)題 的時(shí)間復(fù)雜度。
[0009] 用降維后的矩陣數(shù)據(jù),使用SAMME.R算法進(jìn)行識(shí)別分類。該方法是把對(duì)弱分類器 (最近鄰算法)正確率的要求降低到大于forj= 1,...,K1/k,保證提供足夠多的弱分類 器參與集成。在訓(xùn)練弱分類器時(shí),判斷該弱分類器的結(jié)果,在所有同屬一類的樣本的分類 中,正確分類的樣本的權(quán)值和,是否比分到其他任意一類的權(quán)值和大。如果滿足該條件則繼 續(xù)進(jìn)行權(quán)值調(diào)整和下一次迭代。如果不滿足,由于訓(xùn)練出的弱分類器不夠好,達(dá)不到要求, 所以在權(quán)值不變的情況下重新訓(xùn)練弱分類器,然后再次判斷新的弱分類器是否滿足上邊所 述的條件,如果滿足進(jìn)入下一次調(diào)整,不滿足繼續(xù)重新訓(xùn)練弱分類器,不斷優(yōu)化弱分類器的 質(zhì)量,從而逼近最優(yōu)強(qiáng)分類器;得到最終的強(qiáng)分類器有效提高了人臉識(shí)別的準(zhǔn)確率。
[0010] 流程圖見圖1,其具體步驟如下:
[0011] 步驟一:數(shù)據(jù)初始化
[0012] 1. 1)對(duì)人臉庫(kù)中的所有圖像進(jìn)行歸一化處理,歸一化的操作是指先把圖像統(tǒng)一大 小為32X32灰度值矩陣,得到大小為1024X1的灰度值矩陣,用(2D) 2PCA算法降維得到大 小為256X1的矩陣。初始化權(quán)僅=1,. . .,m。其中m是圖像個(gè)數(shù)。
[0013] 步驟二:循環(huán)處理過(guò)程
【主權(quán)項(xiàng)】
1.基于Adaboost算法的人臉識(shí)別優(yōu)化方法,其特征在于: 首先對(duì)人臉圖像進(jìn)行特征提取和降維,即利用(2D)2PCA算法對(duì)圖像進(jìn)行特征提取和降 維,同時(shí)在行與列上對(duì)圖像矩陣進(jìn)行降維,進(jìn)一步降低特征向量的維數(shù),有效降低問(wèn)題的時(shí) 間復(fù)雜度; 用降維后的矩陣數(shù)據(jù),使用SAMME. R算法進(jìn)行識(shí)別分類;該方法是把對(duì)弱分類器正確 率的要求降低到大于for j = 1,...,K 1/k,保證提供足夠多的弱分類器參與集成;在訓(xùn)練 弱分類器時(shí),判斷該弱分類器的結(jié)果,在所有同屬一類的樣本的分類中,正確分類的樣本的 權(quán)值和,是否比分到其他任意一類的權(quán)值和大;如果滿足該條件則繼續(xù)進(jìn)行權(quán)值調(diào)整和下 一次迭代;如果不滿足,由于訓(xùn)練出的弱分類器不夠好,達(dá)不到要求,所以在權(quán)值不變的情 況下重新訓(xùn)練弱分類器,然后再次判斷新的弱分類器是否滿足上邊所述的條件,如果滿足 進(jìn)入下一次調(diào)整,不滿足繼續(xù)重新訓(xùn)練弱分類器,不斷優(yōu)化弱分類器的質(zhì)量,從而逼近最優(yōu) 強(qiáng)分類器;得到最終的強(qiáng)分類器有效提高了人臉識(shí)別的準(zhǔn)確率; 其具體步驟如下: 步驟一:數(shù)據(jù)初始化 I. 1)對(duì)人臉庫(kù)中的所有圖像進(jìn)行歸一化處理,歸一化的操作是指先把圖像統(tǒng)一大小為 32X32灰度值矩陣,得到大小為1024X1的灰度值矩陣,用(2D)2PCA算法降維得到大小為
步驟二:循環(huán)處理過(guò)程 2.1)for 1,...,T,執(zhí)行以下 7步: ① 按照權(quán)值選擇圖像樣本; ② 對(duì)樣本進(jìn)行分類識(shí)別,ht:X - Y ;即將每個(gè)樣本用最近鄰弱分類器 進(jìn)行分類識(shí)別,其中X是樣本,Y是樣本分類結(jié)果; ③ for k = 1,. . .,K,執(zhí)行以下2步;進(jìn)行權(quán)值調(diào)整; (1) 循環(huán)計(jì)算各類中,分到各類樣本的權(quán)值和 for j = 1,…,K (2) 判斷各類中分類正確的樣本權(quán)值和是否大于分到
其他各類樣本的權(quán)值和 [H'') = /] >= ) (/] 若滿足,則進(jìn)行下一次循環(huán); 若不滿足,則返回步驟二重新開始計(jì)算; 其中K是采樣個(gè)數(shù); ④ 計(jì)算ht的偽錯(cuò)誤率:& = 氣V,];用于判斷算法的的識(shí)別效果;
⑥ 計(jì)算新的權(quán)重向量= ?〖/#,.)# .Vj),用于后續(xù)圖像的選擇; ⑦ 歸一化權(quán)值w丨+1,使之在0-1范圍內(nèi); 其中T為迭代次數(shù); 步驟三:最終強(qiáng)分類器 3. 1)
其中hf(x)為最終生成的強(qiáng)分類器,用于人臉識(shí)別分類,輸出分類結(jié)果;X為輸入的人 臉頭像數(shù)據(jù),T為迭代次數(shù),ht(Xt)為弱分類器,yi為類別標(biāo)號(hào)。
【專利摘要】基于Adaboost算法的人臉識(shí)別優(yōu)化方法,首先對(duì)人臉圖像進(jìn)行特征提取和降維,用降維后的矩陣數(shù)據(jù),使用SAMME.R算法進(jìn)行識(shí)別分類;在訓(xùn)練弱分類器時(shí),判斷該弱分類器的結(jié)果,在所有同屬一類的樣本的分類中,正確分類的樣本的權(quán)值和,是否比分到其他任意一類的權(quán)值和大;如果滿足該條件則繼續(xù)進(jìn)行權(quán)值調(diào)整和下一次迭代;如果不滿足,由于訓(xùn)練出的弱分類器不夠好,達(dá)不到要求,所以在權(quán)值不變的情況下重新訓(xùn)練弱分類器,然后再次判斷新的弱分類器是否滿足上邊所述的條件,如果滿足進(jìn)入下一次調(diào)整,不滿足繼續(xù)重新訓(xùn)練弱分類器,不斷優(yōu)化弱分類器的質(zhì)量,從而逼近最優(yōu)強(qiáng)分類器;得到最終的強(qiáng)分類器有效提高了人臉識(shí)別的準(zhǔn)確率。
【IPC分類】G06K9-00, G06K9-62
【公開號(hào)】CN104820825
【申請(qǐng)?zhí)枴緾N201510203079
【發(fā)明人】楊新武, 袁順, 馬壯
【申請(qǐng)人】北京工業(yè)大學(xué)
【公開日】2015年8月5日
【申請(qǐng)日】2015年4月27日