一種基于分塊統(tǒng)計特征與字典學(xué)習(xí)稀疏表示分類的三維人耳識別的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式識別領(lǐng)域,涉及一種身份信息驗證的方法,尤其是一種人耳識別 方法。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的不斷發(fā)展,海內(nèi)外學(xué)者以及多家科技公司熱衷于提高身份信息的 驗證效果,以滿足實際生活中,諸如門禁控制、海關(guān)通關(guān)、體育場館安檢等多個不同場合中, 對于識別人的身份的嚴苛需求?;谏锾卣髯R別的方法正受到人們越來越多的關(guān)注。其 中,人耳作為生物特征識別領(lǐng)域中一種新興的生物特征,在近年中受到了廣泛的研究,并通 過實驗證明人耳是一種性質(zhì)優(yōu)異的生物特征。人耳包括豐富的結(jié)構(gòu)以及特殊的形狀,具有 普遍性、獨特性、持久性等諸多特征。經(jīng)前期研究發(fā)現(xiàn),人耳的形狀在8至70歲之間都不會 發(fā)生改變。
[0003] 二維人耳識別系統(tǒng)受限于成像因素,受光照條件影響大。此外,二維人耳圖像容易 被他人復(fù)制頂替,不適合對身份識別有嚴格要求的應(yīng)用場合。對此,使用包含深度信息的人 耳的三維數(shù)據(jù)進行識別,可以從數(shù)據(jù)獲取途徑層面上有效地克服上述問題。然而,在使用人 耳的三維數(shù)據(jù)進行的識別過程中,通常需要進行三維數(shù)據(jù)之間的一對一的注冊匹配,耗時 漫長。另外,經(jīng)過注冊后,人耳的三維數(shù)據(jù)之間仍存在微小的注冊誤差,對提高人耳的三維 數(shù)據(jù)的識別效果造成了瓶頸。
[0004] 近年來,研究者將稀疏編碼的算法成功應(yīng)用于解決計算機視覺以及圖像處理中的 諸多問題中,包括圖像去噪、圖像恢復(fù)、物體識別、圖像質(zhì)量評價等。在稀疏編碼中,通過選 取一個過完備字典中的若干個元素,用所選取的元素線性表出輸入信號。根據(jù)稀疏編碼的 各元素的大小以及所對應(yīng)的字典項的類標(biāo),可用于解決物體識別問題。目前,有學(xué)者通過實 驗發(fā)現(xiàn),使用字典學(xué)習(xí)的方法更新字典項,所得到的新字典在用于稀疏編碼后,通常可以取 得更加出色的識別效果。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于分塊統(tǒng)計特征與字典學(xué)習(xí)稀疏表示分類的三維 人耳識別方法。在以往的三維人耳匹配過程中,需要把待測人耳與已知集合中的每一個人 耳的三維數(shù)據(jù)樣本逐一匹配。該方法效率隨樣本數(shù)據(jù)集合的容量增大而大幅降低。針對這 一問題,本發(fā)明采用字典學(xué)習(xí)與稀疏表示分類的算法,解決一對多的識別問題。此外,本發(fā) 明針對人耳的三維數(shù)據(jù)在注冊匹配后,仍然存在的微小對齊誤差的問題,采用基于分塊統(tǒng) 計特征的描述算子。通過實施上述策略,進而建立了一種精確、快速的三維人耳識別方法。
[0006] 為達到上述目的,本發(fā)明的解決方案是:
[0007] -種基于分塊統(tǒng)計特征與字典學(xué)習(xí)稀疏表示分類的三維人耳識別方法,
[0008] (一)確定人耳的三維數(shù)據(jù)特征:
[0009] (1)定義每為第i個人耳的第j次三維人耳的采樣圖像,其長、寬分別為u、v,共包 含1]\¥個點,用(\7,以^7))描述任意點?在三維空間中的位置;
[0010] (2)將考在長、寬方向上分別作u等分和V等分,得到UXv個三維人耳采樣圖像
上的第q個子區(qū)域,其中,1彡P(guān)彡u,ISqSv;
[0011] 所述步驟(2)中,若三維人耳圖像的長U無法被u整除和/或三維人耳圖像的 寬V無法被V整除,分塊時,保留三維人耳圖像的位于中心區(qū)域的點進行分塊以作為子區(qū) 域,刪除三維人耳圖像四周無法被整除區(qū)域的點,不作為進行識別的子區(qū)域,優(yōu)選方案為
[0012] (3)創(chuàng)建子區(qū)域的描述算子,用于描述子區(qū)域內(nèi)三位人耳表面的信息:
[0013] (3-1)確定子區(qū)域內(nèi)每個點的平均曲率H;
的平均曲率H,其中fx,仁分別表示該點的深度在x、y方向上的一階偏導(dǎo),fxx,fyy,fxy分別表 示該點的深度的二階偏導(dǎo)。
[0015] (3-2)確定子區(qū)域內(nèi)每個點的高斯曲率K;
其中fx,fy分別表示該點的深度在x、y方向上的一階偏導(dǎo),fxx,fyy,fxy分別表示該點的深度 的二階偏導(dǎo)。
[0017] 所述步驟(3-1)與(3-2)中,為了準確地計算偏導(dǎo)數(shù),可以采用P.J.Besl與 R.C.Jain在Segmentationthroughvariable-ordersurfacefitting一文中所使用的 方法。具體方法為,對于給定的深度圖像,可先使用二項式濾波器S對深度圖像f進行卷 積平滑操作,其中S=ssT,S= [1 6 15 20 15 6l]T/64,而后,使用預(yù)定義的窗口掩膜 Dj: = 、.Dy. '= 0?;?:=沒。技2、Dyy=技2忠、=didl計算偏導(dǎo)數(shù),其中,d。=
[IIIIIIl]1/?,^= [-3 -2-I0I2 3]T/28,d2= [5 0 -3 -4 -4 0 5]T/84。從而, 偏導(dǎo)數(shù)的計算公式為fx=DX*S*f,fy=Dy*S*f,fxx=Dxx*S*f,fyy=Dyy*S*f,fxy=Dxy*S*f, 其中,*代表卷積運算,可使用快速傅里葉變換的方法大幅度提升偏導(dǎo)數(shù)的計算效率。
[0018] (3-3)根據(jù)每個點的平均曲率H與高斯曲率K的符號,確定每個點的類型:若H〈0 且K>0,該點為類型1 ;若H〈0且K= 0,該點為類型2 ;若H〈0且K〈0,該點為類型3 ;若H= 0且K>0,該點為類型4;若H=O且K= 0,該點為類型5 ;若H= 0且K〈0,該點為類型6 ; 若H>0且K>0,該點為類型7 ;若H>0且K= 0,該點為類型8 ;若H>0且K〈0,該點為類型9 ;
[0019] 所述步驟(3-3)中,類型1呈峰狀,類型2呈山脊?fàn)睿愋?呈鞍嶺狀,類型5呈 平面狀,類型6為最小曲面,類型7呈凹陷狀,類型8呈山谷狀,類型9呈鞍谷狀,類型4為 特殊類型,包括除上述8種類型外的其他形狀。在實際判斷平均曲率H與高斯曲率K的符 號時,由于在實際計算得出的平均曲率H與高斯曲率K的值均為實數(shù)值,而實數(shù)值精確取 為O的概率極低,因此將實數(shù)值直接與O比較以確定符號的做法不適用于實際場景。在 實際實現(xiàn)中,可參照D.Zhang,G.Lu,W.Li和N.Luo在Palmprintrecognitionusing3-D information中首次提出的改進方法,該方法為:分別定義包含數(shù)值O的兩個非常短的區(qū)間 [_eH,£"]與[_eK,eK],將經(jīng)運算得到的H與K分別與對應(yīng)的區(qū)間進行比較,以最終確定 對應(yīng)的表面類型。此外,為了使得eH或者eK適應(yīng)于不同的人耳,可將H或者K的值,根據(jù) 其標(biāo)準差將其歸一化。優(yōu)選的4與eK分別為0.030和0.015。
[0020] (3-4)使用直方圖統(tǒng)計各類型出現(xiàn)的次數(shù),得到向量h=Qi1,h2, ???]!;???,hs,h9]以 用于描述該子區(qū)域,其中匕表示該子區(qū)域內(nèi)為類型i的點的個數(shù),I<i< 9 ;
[0021] (4)將各子區(qū)域的描述算子拼接在一起,構(gòu)成與的描述算子
[0022]
[0023] 其中hPiq表示_在長方向上的第p個、寬方向上的第q個子區(qū)域的描述算子,n= 9XuXV;
[0024] (二)根據(jù)步驟(一)中確定的人耳的三維數(shù)據(jù)特征構(gòu)建三維人耳數(shù)據(jù)庫Y二 S表示數(shù)據(jù)庫中的人耳總數(shù),N表示數(shù)據(jù)庫中的人耳采樣的總 數(shù),C,表示第j個人耳的采樣總數(shù);
[0025] 所述步驟(二)中,構(gòu)建得到的三維人耳數(shù)據(jù)庫Y與人耳的三維數(shù)據(jù)采樣總數(shù)N 與描述算子的維度n的大小關(guān)系應(yīng)滿足N>>n;
[0026] 在人耳的三維數(shù)據(jù)采樣總數(shù)N與描述算子的維度n的大小關(guān)系為NSn時, 可以采用隨機投影的算法對描述算子降維,即在步驟(三)中使用降維后的字典 F=PY€ 代替Y,其中P=私,…,Ps,fe為高斯白噪音隨機投影矩陣,滿足 Vi, ||p, |l2 = I-n'<N,
[0027](三)根據(jù)步驟(二)中確定的三維人耳數(shù)據(jù)庫Y,采用字典學(xué)習(xí)框架,得到學(xué)習(xí) 過的字典以及分類器:
[0028] (I)從Y中隨機選取K個人耳的三維數(shù)據(jù)特征,組成字典D=[屯…,1]E資》氣
[0029] 所述步驟(I)中,所選取的人耳的三維數(shù)