海量人臉庫的快速準確檢索方法
【技術領域】
[0001] 本發(fā)明涉及一種海量人臉庫的快速準確檢索方法。
【背景技術】
[0002] 大規(guī)模人臉庫的快速檢索在人員管理、視頻監(jiān)控等系統(tǒng)中有重要的實用價值,如 人員身份驗證、嫌疑人員軌跡搜索等。人臉庫中的人臉圖像可能來源于靜態(tài)的人臉采集,如 身份證件照片,也可能來源于視頻監(jiān)控系統(tǒng)中的動態(tài)人臉檢測與提取。尤其是后者,將導致 采集的人臉數(shù)量指數(shù)增長,形成海量的人臉庫。對于一張待查詢的人臉圖像,如何在海量的 人臉庫中以近實時的方式進行檢索,準確的提供與待查詢?nèi)四樝嗨贫茸罡叩娜舾扇四樈Y果 及相關信息(如人臉圖像采集的時間、地點等),是人員管理、視頻監(jiān)控等系統(tǒng)中一個亟待 解決的問題。
[0003] 解決上述問題需要同時解決準確性和快速性兩方面問題?;谏疃葘W習的人臉識 別技術,盡管可以實現(xiàn)高準確度的人臉識別,但對計算資源有很高要求,無法應用于海量人 臉庫的檢索。另一方面,基于主成分分析(PCA)、線性判決分析(LDA)等技術實現(xiàn)人臉識別, 雖然計算復雜度較低,但在光照、姿態(tài)等條件變化下人臉識別的準確度不高,在大規(guī)模人臉 庫的情況下,無法提供滿意的檢索效果。從提高檢索速度的角度,大規(guī)模圖像庫的檢索,其 主要思想都是采用建立圖像庫層次索引結構的方法來實現(xiàn)加速檢索。具體到人臉檢索,如 何在保證人臉識別準確度的前提下,為海量人臉庫建立合適的層次索引結構,實現(xiàn)快速檢 索,是目前亟需解決的主要技術問題。
[0004] 在實際應用中,人臉庫中存儲的人臉數(shù)目和內(nèi)容都不斷變化。因此,海量人臉庫的 檢索,還需要解決層次索引結構的動態(tài)更新問題。此外,由于人臉檢索的結果通常都通過人 工進行最終的判定,因此,在海量人臉庫中存在一部分已確定匹配或不匹配的人臉圖像集 合。如何在人臉庫層次索引結構的建立和更新過程利用這部分先驗知識,也是目前亟需解 決的技術問題。
[0005] 海量人臉庫的檢索問題可以簡單表述為:給定一個有N張人臉的大規(guī)模人臉庫和 一張待查詢?nèi)四?,如何在庫中快速的檢索出與待查詢?nèi)四樧钕嗨频那皀張人臉圖像?這個 問題涉及到人臉識別和數(shù)據(jù)檢索兩方面技術。通過對人臉庫中每一張人臉進行特征提取, 得到每一張人臉的一個特征向量,從而建立與人臉圖像庫對應的人臉特征庫,再對應提取 待查詢?nèi)四樀奶卣飨蛄?,與人臉特征庫中的特征向量進行逐一比對,計算特征向量間距離 (如歐氏距離),特征向量距離越小,則對應的人臉相似度越高。
[0006] 由于對大規(guī)模人臉特征庫進行逐一比對的計算復雜度太高,通常采用聚類檢索的 方式。其基本思想是將整個人臉特征庫分成多個類,對每一個類計算一個中心向量,檢索時 通過與每一個類的中心向量比對,將檢索范圍迅速縮小到一個或幾個類,達到加速的目的。
[0007] 中國專利文件CN102609733A"海量人臉庫應用環(huán)境下的人臉快速識別方法"引入 二分K-均值聚類算法BKM結合PCA+LDA算法對大規(guī)模人臉庫進行特征提取。首先對人臉 庫計算每個樣本的均值向量,本著類內(nèi)聚合度最大、類間耦合度最小的原則映射到某個維 度空間;然后在這個維度空間對其進行聚類;得到聚類結果后,將各個樣本按照其簇屬性 重新組合分組;最后在每個簇上使用線性子空間人臉特征提取算法進行特征提取。
[0008] 現(xiàn)有技術基于人臉PCA和LDA特征,在光照、姿態(tài)等條件變化下人臉識別的準確度 不高,在大規(guī)模人臉庫的情況下,無法提供滿意的檢索效果。更重要的是,現(xiàn)有技術在對大 規(guī)模人臉庫進行層次聚類時通過簡單的距離度量進行類內(nèi)耦合度和類間相似度的判定,未 能實現(xiàn)最優(yōu)的特征降維和最具判決作用的聚類結果。此外,現(xiàn)有技術未能很好地解決層次 索引結構的動態(tài)更新問題,也沒有在人臉庫層次索引結構的建立和更新過程中利用人工標 注的人臉匹配結果。
[0009] 因此,亟需一種海量人臉庫的快速準確檢索方法。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明的目的是提供一種海量人臉庫的快速準確檢索方法。
[0011] 為了實現(xiàn)上述目的,本發(fā)明提供的技術方案為:提供:一種海量人臉庫的快速準 確檢索方法,包括:
[0012] (1)對人臉圖像庫中人臉圖像提取人臉局部特征或局部和整體特征,建立與人臉 圖像庫對應的人臉特征庫;
[0013] (2)利用人臉圖像庫中一個已標注為匹配或不匹配的人臉圖像集合及其對應特 征,通過距離度量學習獲得一個特征變換;
[0014] (3)將獲得的特征變換應用于人臉特征庫,對變換后的人臉特征采用K-均值方法 進行二分或多分聚類;
[0015] (4)對獲得的每一聚類所對應的人臉特征庫及其對應的人臉圖像庫重復步驟(2) 和(3),直至一結束條件得到滿足,從而建立海量人臉庫的層次索引結構,該索引結構的每 一葉節(jié)點和非葉節(jié)點分別對應于一個針對人臉局部特征或局部和整體特征的特征變換; [0016] (5)對待查詢?nèi)四槇D像提取與(1)對應的局部特征或局部和整體特征;
[0017] (6)對應層次索引結構及其相應的特征變換,對提取的人臉特征進行一次特征變 換后,通過與每一聚類的中心向量計算距離度量,判決屬于哪一聚類;
[0018] (7)若該聚類為層次索引結構中的非葉節(jié)點,則繼續(xù)(6),否則在該聚類中通過最 近鄰搜索的方法,檢索距離度量最小的人臉特征并返回對應的人臉圖像。
[0019] 其中提取的人臉局部特征或局部和整體特征為局域二值模式特征。
[0020] 其中提取的人臉局部特征或局部和整體特征為通過神經(jīng)網(wǎng)絡獲取的。
[0021]將一個已標注的人臉特征庫表示為{(Xi,Xj,yij)},其中Xi,Xj代表兩張人臉圖像 的局域二值模式特征,Yij= 1若Xi,Xj對應同一人,yU= -1若Xi,Xj對應不同人,則距離 度量學習的目標是找到一個線性特征變換,即投影矩陣H,使以下誤差函數(shù)最小:
【主權項】
1. 一種海量人臉庫的快速準確檢索方法,其特征在于,包括: (1) 對人臉圖像庫中人臉圖像提取人臉局部特征或局部和整體特征,建立與人臉圖像 庫對應的人臉特征庫; (2) 利用人臉圖像庫中一個已標注為匹配或不匹配的人臉圖像集合及其對應特征,通 過距離度量學習獲得一個特征變換; (3) 將獲得的特征變換應用于人臉特征庫,對變換后的人臉特征采用K-均值方法進行 二分或多分聚類; (4) 對獲得的每一聚類所對應的人臉特征庫及其對應的人臉圖像庫重復步驟(2)和 (3),直至一結束條件得到滿足,從而建立海量人臉庫的層次索引結構,該索引結構的每一 葉節(jié)點和非葉節(jié)點分別對應于一個針對人臉局部特征或局部和整體特征的特征變換; (5) 對待查詢?nèi)四槇D像提取與(1)對應的局部特征或局部和整體特征; (6) 對應層次索引結構及其相應的特征變換,對提取的人臉特征進行一次特征變換后, 通過與每一聚類的中心向量計算距離度量,判決屬于哪一聚類; (7) 若該聚類為層次索引結構中的非葉節(jié)點,則繼續(xù)(6),否則在該聚類中通過最近鄰 搜索的方法,檢索距離度量最小的人臉特征并返回對應的人臉圖像。
2. 如權利要求1所述的海量人臉庫的快速準確檢索方法,其特征在于:其中提取的人 臉局部特征或局部和整體特征為局域二值模式特征。
3. 如權利要求1所述的海量人臉庫的快速準確檢索方法,其特征在于:其中提取的人 臉局部特征或局部和整體特征為通過神經(jīng)網(wǎng)絡獲取的。
4. 如權利要求1所述的海量人臉庫的快速準確檢索方法,其特征在于:將一個已標注 的人臉特征庫表示為((Xi,X」,yd),其中X i, \代表兩張人臉圖像的局部特征或局部和整 體特征,yu= 1若X i,χ」對應同一人,y ij=-1若X i,χ」對應不同人,則距離度量學習的目 標是找到一個線性特征變換,即投影矩陣H,使以下誤差函數(shù)最?。?br>為邏輯回歸的損失函數(shù)。
5. 如權利要求1所述的海量人臉庫的快速準確檢索方法,其特征在于:通過距離度量 學習尋找一個投影空間,使投影后的特征中已標注為匹配的人臉間距離盡量小,而使已標 注為不匹配的人臉間距離盡量大。
6. 如權利要求4或權利要求5所述的海量人臉庫的快速準確檢索方法,其特征在于: 對人臉庫中所有人臉特征進行特征變換,對變換后的特征集合,采用K-均值的方法實現(xiàn)二 分或多分聚類,對得到的每一聚類,再針對該聚類中的人臉圖像和特征集合,采用同樣的方 法進行新的距離度量學習和K-均值聚類,直到層次結構達到預先定義的深度,或每一聚類 內(nèi)人臉數(shù)目滿足預定義的大小。
7. 如權利要求1所述的海量人臉庫的快速準確檢索方法,其特征在于:由步驟(1)建 立的層次索引結構中,每一葉節(jié)點和非葉節(jié)點均有一個對應的特征變換矩陣。
8. 如權利要求1所述的海量人臉庫的快速準確檢索方法,其特征在于:步驟(4)中的 結束條件為每一聚類對應的人臉數(shù)目不超過一個預定義的數(shù)目。
【專利摘要】本發(fā)明公開了一種海量人臉庫的快速準確檢索方法,包括:(1)建立與人臉圖像庫對應的人臉特征庫;(2)利用人臉圖像庫中的人臉圖像集合及其對應特征,通過距離度量學習獲得一個特征變換;(3)對變換后的人臉特征采用K-均值方法進行二分或多分聚類;(4)建立海量人臉庫的層次索引結構;(5)對待查詢?nèi)四槇D像提取局部特征或局部和整體特征;(6)對應層次索引結構及其相應的特征變換,對提取的人臉特征進行一次特征變換后,通過與每一聚類的中心向量計算距離度量,判決屬于哪一聚類;(7)若該聚類為層次索引結構中的非葉節(jié)點,則繼續(xù)(6),否則在該聚類中通過最近鄰搜索的方法,檢索距離度量最小的人臉特征并返回對應的人臉圖像。
【IPC分類】G06F17-30
【公開號】CN104765768
【申請?zhí)枴緾N201510103271
【發(fā)明人】田第鴻, 陳寧
【申請人】深圳云天勵飛技術有限公司
【公開日】2015年7月8日
【申請日】2015年3月9日