專利名稱:超大型指紋庫的索引結(jié)構(gòu)和檢索方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計算機識別領(lǐng)域,具體涉及到指紋識別、數(shù)據(jù)庫、數(shù)據(jù)檢索和圖像處理等領(lǐng) 域。本發(fā)明用于超大型指紋數(shù)據(jù)庫的指紋檢索。
背景技術(shù):
指紋識別技術(shù)用于鑒別身份已有幾百年的歷史,近幾十年來,隨著科技的不斷發(fā)展,自 動指紋識別系統(tǒng)(Automated Fingerprint Identification System,簡稱AFIS)己在多個領(lǐng)域中得 到了廣泛的應(yīng)用。但是,目前AFIS仍面臨著不少難題,其中一個亟待解決的問題就是超大 型指紋庫的檢索問題。
AFIS的工作模式一般分為兩類驗證(verification)和辨識(identification)。驗證就是通 過把一個現(xiàn)場采集到的指紋與指紋庫中某枚特定的指紋進行一對一的比對(one-to-one matching),來確認(rèn)身份的過程。驗證通常采用指紋細(xì)節(jié)點比對的方式實現(xiàn)。此時對整個處理 過程的速度要求并不太高,目前市場上的AFIS在進行驗證時,從圖像采集到最后給出驗證結(jié) 果,基本都能在l秒以內(nèi)完成,不會給用戶造成長時間等待的感覺。
辨識要遠比驗證復(fù)雜,該方法是把現(xiàn)場采集到的指紋同指紋數(shù)據(jù)庫中的所有指紋逐一對 比,從中找出與現(xiàn)場指紋相匹配的指紋。即該方法是"一對多匹配(one-to-manymatching)"。 對用戶來說,他(她)不會考慮庫中指紋數(shù)量有多大,真正關(guān)心的仍然是進行指紋按壓后, 多長時間能出結(jié)果。舉一個簡單例子如果庫中有指紋500000枚,算法的處理速度按每秒100 枚算,則需5000秒鐘(l小時38分鐘),則對一般用戶來說,顯然是難以接受的。據(jù)此速度, 對公安、司法領(lǐng)域等動輒百萬人乃至千萬人以上庫[注庫中每人一般會采集十枚手指的圖像, 因此指紋圖像數(shù)量是人數(shù)的十倍],辨識時間將是天文數(shù)字。
指紋檢索技術(shù)就是一種提高辨識速度的方法,該技術(shù)首先通過檢索對指紋數(shù)據(jù)庫進行粗篩 選,減少需要比對的指紋數(shù)目,然后將剩下的指紋進行細(xì)節(jié)點比對(簡稱細(xì)比對),從而提高 指紋辨識的速度。
圖1所示為指紋檢索技術(shù)示意圖。
發(fā)明內(nèi)容
本發(fā)明提出了用于超大型指紋數(shù)據(jù)庫檢索系統(tǒng)結(jié)構(gòu)的構(gòu)造方法、基于索引匹配錯誤概率 的索引評價方法、基于分層深度索引的指紋檢索方法以及基于一邊多次匹配結(jié)構(gòu)特征的檢索 評價方法。
本發(fā)明提出了一種用于超大型指紋庫檢索系統(tǒng)結(jié)構(gòu)的構(gòu)造方法。在離線建庫階段,該系
統(tǒng)采用基于索引匹配錯誤概率的索引評價方法,構(gòu)造了三個互補的索引器和索引數(shù)據(jù)庫;在 在線檢索階段,該系統(tǒng)采用基于索引匹配錯誤概率的索引評價方法根據(jù)現(xiàn)場指紋圖像的質(zhì)量 自適應(yīng)地選擇檢索方式,采用基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法對檢索結(jié)果進行打 分評價,判決指紋是否應(yīng)該被篩除。
本發(fā)明提出了基于索引匹配錯誤概率的索引評價方法。根據(jù)此方法可以針對不同的現(xiàn)場 指紋圖像質(zhì)量選擇合適的索引方法和檢索方法,以使系統(tǒng)達到最佳的性能和效率。本發(fā)明提出了基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法,該方法不以匹配三角形數(shù)目 作為唯一的評分基礎(chǔ),而是通過三元組匹配信息獲取多元組結(jié)構(gòu)的匹配數(shù)目,使得評分結(jié)果 更能體現(xiàn)指紋的相似性;同時,指紋特征參數(shù)組的存儲量并沒有增加,有效提高了指紋檢索 的性能和效率。
本發(fā)明提出了基于分層深度索引的指紋檢索方法。在大型指紋庫的應(yīng)用中,由于大部分 現(xiàn)場指紋屬于指紋質(zhì)量中等的情況,所述基于分層深度索引的指紋檢索方法能夠在保證檢索 速度沒有大幅降低的同時,保證了相對于哈希檢索法更好的檢索精度。具有實用價值和普遍 的適用性。
圖1指紋檢索技術(shù)示意圖
圖2超大型指紋庫檢索系統(tǒng)的結(jié)構(gòu)
圖3索引器工作流程
圖4檢索器工作流程
圖5細(xì)節(jié)點三角形參數(shù)圖示
圖6端點和分叉點可能出現(xiàn)的退化情況(a)為端點,("l)到(a3)為各種可能的退化情況; (6)為分叉點,(M)到(63)為各種可能的退化情況
圖7指紋圖像無法判斷細(xì)節(jié)點類型圖示加方框處為無法準(zhǔn)確判定其屬于分叉點還是端 點的情況
圖8前期累計誤差對量化結(jié)果的影響 圖9前期累計誤差引起的匹配錯誤 圖10量化區(qū)間邊界附近的值的匹配錯誤 圖ll分層深度索引的存儲方式
圖12三角形一邊二次匹配圖示,左圖為現(xiàn)場指紋,右圖為庫指紋
具體實施例方式
下面結(jié)合附圖對本發(fā)明所述方法進行詳細(xì)闡述。 1.超大型指紋庫檢索系統(tǒng)結(jié)構(gòu)
圖2所示為本發(fā)明提出的超大型指紋庫檢索系統(tǒng)的結(jié)構(gòu),包括指紋圖像預(yù)處理、計算細(xì) 節(jié)點三角形、索引器、索引數(shù)據(jù)庫、檢索器等模塊。 1.1索引器工作流程
索引器完成離線建庫功能,圖3所示為索引器的工作流程。
在離線階段,對于每一枚庫指紋,首先預(yù)處理得到細(xì)節(jié)點三角形,然后依據(jù)基于索引匹 配錯誤概率的索引評價方法,構(gòu)造三個互補的索引器及對應(yīng)的索引數(shù)據(jù)庫三角形全部參數(shù) 量化構(gòu)造哈希(hash)索引;三角形部分特征量化構(gòu)造分層深度索引;三角形全部參數(shù)都不 量化構(gòu)造特征值索引。
指紋庫的每枚指紋都要構(gòu)造對應(yīng)的三個索引器,然后將索引值寫入對應(yīng)的索引數(shù)據(jù)庫。 這三個索引器構(gòu)造方法參見圖2和圖3。索引器的構(gòu)造需要遍歷所有庫指紋,由于庫指紋的 數(shù)量是非常龐大的,所以需要很長的時間,但整個過程是在離線階段完成的,所以有效減了在線階段的計算量,這正是指紋索引方法能夠非常高效的原因之一。
1.2檢索器工作流程
檢索器完成在線檢索功能,檢索流程如圖2和圖4所示。 檢索分為三個步驟-
1、 用戶輸入一枚現(xiàn)場指紋,系統(tǒng)進行預(yù)處理得到細(xì)節(jié)點三角形,.然后依據(jù)基于索引匹配 錯誤概率的索引評價方法,根據(jù)指紋圖像質(zhì)量判斷采用三種檢索方法中的哪種方法;
2、 在選定了檢索方法之后,檢索該方法對應(yīng)的索引數(shù)據(jù)庫,獲取檢索信息;
3、 在得到檢索信息之后,采用基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法對庫指紋打分, 分?jǐn)?shù)大于閾值的庫指紋進入細(xì)比對環(huán)節(jié),小于閾值的從比對隊列篩除。
構(gòu)造指紋檢索系統(tǒng)的評價方法是整個系統(tǒng)性能和效率能否提高的核心環(huán)節(jié)之一。 一個好 的檢索評價方法能夠充分利用已得到的檢索信息對指紋的相似程度進行準(zhǔn)確的評價,從而能 夠有效提高整個系統(tǒng)的檢索精度,增大索引系統(tǒng)的篩選率,進而減少進入細(xì)比對環(huán)節(jié)的指紋 數(shù)量,提高整個超大型指紋庫的比對速度(包括檢索和細(xì)比對兩個階段)。
本發(fā)明提出的基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法能夠使評分結(jié)果更能體現(xiàn)指紋 結(jié)構(gòu)的相似性;同時,指紋特征參數(shù)組的存儲量并沒有增加,從而有效提高了系統(tǒng)的效率。 2細(xì)節(jié)點三角形特征參數(shù)的提取和篩選 2.1細(xì)節(jié)點三角形的特征組
如圖5所示,A、 a、 a為指紋圖像的三個細(xì)節(jié)點,它們組成了一個細(xì)節(jié)點三角形。5
表示頂點a指向a的矢量,^表示a指向a的矢量,"p 2、 "3表示組成的三角形的三 個內(nèi)角,A、 A、 ^分別表示對應(yīng)的細(xì)節(jié)點的方向。
我們從指紋圖像中能夠得到的細(xì)節(jié)點信息有細(xì)節(jié)點坐標(biāo)p,.(;c,.,30,細(xì)節(jié)點方向角^, 細(xì)節(jié)點類型K,細(xì)節(jié)點詳細(xì)信息Mi等,其中/ = 1,2,3。能夠進行指紋檢索的參數(shù)必須具有平 移、旋轉(zhuǎn)和縮放不變性,所以A(A,x)和^不能用于指紋檢索。當(dāng)采集指紋的儀器相同或者 相近時,可以認(rèn)為指紋不存在伸縮,故一般算法不考慮伸縮變形。所以,我們必須從A(x,.,x) 和^這幾個參數(shù)出發(fā)構(gòu)造出具有平移、旋轉(zhuǎn)不變的參數(shù)。
細(xì)節(jié)點三角形包含的信息有三角形三條邊的長度(H/",三頂點的方向角差(用A-表 示,厶^=《—A, /,,fc = l,2,3, /<_/),三角形內(nèi)角(ai,a2,a3),三角形的左右手系(用H
表示,// = s/g (^;><^;), ^w("為符號函數(shù)),兩細(xì)節(jié)點間紋線數(shù)目(用及C表示,指兩個
細(xì)節(jié)點連線穿過的指紋紋線數(shù)目)等。這些參數(shù)具有平移和旋轉(zhuǎn)不變性。 具有平移和旋轉(zhuǎn)不變性的細(xì)節(jié)點和三角形特征總共有
仏,H厶^,厶A,厶A,"p"2,a3,丑,及C,^,^j,^,AfpM2,M3》 (1)
(l)式稱為細(xì)節(jié)點三角形特征參數(shù)組,簡稱特征參數(shù)組或特征組,特征組中的每個參數(shù)稱為特 征參數(shù)?;诩?xì)節(jié)點三角形的指紋檢索方法就是利用特征組中的部分或全部參數(shù)構(gòu)成數(shù)據(jù)庫 索引實現(xiàn)對整個系統(tǒng)的檢索。
2.2特征參數(shù)的篩選
6公式(l)的特征組中有很多特征參數(shù)是不可靠的。
由于受到按壓力度、手指表面情況和圖像質(zhì)量的影響,分叉點很容易退化成端點,而端 點也很容易與周圍脊線粘連而退化成一個分叉點,所以細(xì)節(jié)點類型y和細(xì)節(jié)點詳細(xì)信息M在 很多情況下不能準(zhǔn)確求得。特征及C很容易受到圖像質(zhì)量的影響。
圖6為端點和分叉點可能出現(xiàn)的退化情況(a)為端點,(al)到("3)為各種可能的退化情 況;(6)為分叉點,(M)到(W)為各種可能的退化情況。
圖7為真實指紋圖像,加方框處為無法準(zhǔn)確判定其屬于分叉點還是端點的情況。
在剔除了可靠性差的特征之后,特征組變?yōu)?br>
<formula>formula see original document page 7</formula> (2)
3指紋檢索系統(tǒng)的索引評價方法
3.1索引匹配錯誤概率分析
3丄1特征組量化產(chǎn)生的匹配錯誤概率
(2)式中除參數(shù)/T是離散值外,其余都是連續(xù)值,為了使用這些參數(shù)構(gòu)成索引(稱為index 或key),需要將這些參數(shù)量化成離散值。
將特征組的每個參數(shù)量化都會引起一定的匹配錯誤(錯誤的來源見3丄4節(jié)),并且這些錯 誤會產(chǎn)生累積影響。
假設(shè)我們選取公式(2)的特征組建立索引,對除了 以外的每個參數(shù)進行量化得到
<formula>formula see original document page 7</formula> (3)
于是索引值為
Aey = A^^jA^A^^^/f (4) (3)式中,如果其中任何一個參數(shù)量化引起匹配錯誤,都會導(dǎo)致(4)式的索引值匹配錯誤,也就 是說,只有(4)式中的9個參數(shù)都不引起匹配錯誤時,索引值才能得到正確的結(jié)果。將上述特 征組轉(zhuǎn)化為索引值時產(chǎn)生的匹配錯誤稱為特征組量化產(chǎn)生的匹配錯誤。
假設(shè)每個參數(shù)量化不引起匹配錯誤的概率為A, z、1,2,…,9,且相互獨立,則索引值不 發(fā)生匹配錯誤的概率為<formula>formula see original document page 7</formula>(5)
這種累積的錯誤是非常嚴(yán)重的,例如如果a-0.9, h1,2,…,9,則化,0.387,發(fā)生錯誤 的概率為l—p—=0.613。就是說如果每個參數(shù)量化不發(fā)生錯誤的概率為0.9的話,索引值不發(fā) 生錯誤的概率僅為0.387。
量化引起的索引值匹配錯誤的表現(xiàn)是特征組并不匹配的兩個三角形,它們的索引值相 等;或者反之,特征組匹配的兩個三角形,它們的索引值卻不相等。 3.1.2減少特征參數(shù)冗余以減少量化產(chǎn)生的匹配錯誤概率
為了減少量化引起的索引值匹配錯誤,我們對特征組公式(2)中的冗余信息進行進一步去 除。事實上,如果兩個三角形的三邊長在一定誤差范圍內(nèi)匹配,其三內(nèi)角匹配的可能性是很 大的。故我們將公式(2)中的三內(nèi)角去掉,以減少特征之間的冗余。特征組變?yōu)?lt;formula>formula see original document page 8</formula> (6)
這樣,索引值不發(fā)生匹配錯誤的概率變?yōu)?br>
<formula>formula see original document page 8</formula> (7)
此時,如果^=0.9, z'-l,2,…,6,貝ijp^=0.53,發(fā)生匹配錯誤的概率為1一; ^ =0.47。 3.1.3量化間隔的選擇
由于受到指紋圖像質(zhì)量的影響,指紋的細(xì)節(jié)點信息都是存在誤差的,所以三角形特征匹 配也必須允許一定的容差范圍。
假設(shè)下面兩式分別表示現(xiàn)場指紋和庫指紋的三角形特征組
<formula>formula see original document page 8</formula>如果
<formula>formula see original document page 8</formula>
則認(rèn)為這兩個三角形匹配。其中l(wèi)—為絕對值符號,7]和 ;為邊長和角度的容差范圍,上標(biāo)z表 示該特征屬于現(xiàn)場指紋,上標(biāo)d表示該特征屬于庫指紋。針對三角形特征的特性,本文選擇 ; 和t;作為邊長和角度的量化間隔。
在真實的指紋采集過程中,指紋圖像除了會有平移、旋轉(zhuǎn)形變外,還可能由于按壓力度的 不同而存在切變形變。切變形變會對三角形的邊長產(chǎn)生影響,邊長越長,切變形變對邊長的 影響會越大,因此我們選取三角形時必須剔除掉邊長過長的三角形;對于太小的邊長,可能 會受到圖像誤差的影響。因此我們選取邊長大小在一定范圍內(nèi)的三角形構(gòu)成特征。艮卩
<formula>formula see original document page 8</formula>
由于切變形變對三角形邊長的影響隨著邊長的變大而變大,故7]應(yīng)該是一個隨著邊長增大而 增大的變量。所以我們構(gòu)造了如下的邊長量化區(qū)間 定義l:取一列數(shù){~|_/ = 0,1,...,/ },描述如下
1、 5—1=rx~,其中0<"<1,常數(shù)
2、 Zn = / . , Z =/ "、"0 *min 7"加 *max
3、 b.lj、0,l,…,;^組成如下邊長/的映射區(qū)間 定義l中量化間隔(即量化區(qū)間的大小)為
即量化區(qū)間的大小是和z,.成正比的。
對邊長進行量化時,如果(6)式中的邊長/落入哪個區(qū)間,就以該區(qū)間的編號作為其量化后 的值。
對于三角形的角度特征來說,由于切變形變對角度造成的影響不隨角度的變大而變大,所以我們將角度的映射區(qū)間大小設(shè)定為固定值。
定義2:取一列數(shù){《|!' = 0,1,2,",0,描述如下
1、
2、 {《|/ = 0,1,2,-,0組成角度的映射區(qū)間 其中《=^ =0,《=^^=2",』=;
和對邊長進行量化一樣,如果(6)式中的角度a-落入哪個區(qū)間,就以該區(qū)間的編號作為其 量化后的值。
3.1.4量化引起匹配錯誤的原因
量化引起的匹配錯誤來源于兩種情況(1)圖像獲取階段、預(yù)處理階段等前期累計誤差 對量化結(jié)果影響產(chǎn)生的匹配錯誤。(2)位于量化區(qū)間邊界附近的值的匹配錯誤。 以角度參數(shù)量化為例說明量化引起匹配錯誤的兩種情況
第一種情況,如圖8所示,—本來位于[《,《]區(qū)間,但是由于前期累計誤差的影響,計 算得到的a-變成了a^,從而被劃分到了[《,《]區(qū)間。
前期累計誤差會影響到匹配結(jié)果,如圖9所示,a一本來應(yīng)該屬于[《,《]區(qū)間,應(yīng)該和a《
量化值相等,但是由于前期累計誤差的影響使計算得到的a,為a,',從而被劃分到[《,《]區(qū) 間,這樣就和本來不在同一區(qū)間的a(^量化值相等,從而造成虛假匹配。
對于第二種情況,如圖10所示,a,和a^分別為現(xiàn)場指紋和庫指紋的特征參數(shù),
a,-a^ t;,但是由于a,和一d位于量化區(qū)間邊界《的兩側(cè),它們將被量化到兩個區(qū)間,
因此量化后的數(shù)值會不相等,導(dǎo)致拒真錯誤。
3.2基于索引匹配錯誤概率的索引評價方法 3.2.1基于索引匹配錯誤概率的索引評價準(zhǔn)則
本發(fā)明構(gòu)造的基于索引匹配錯誤概率的索引評價準(zhǔn)則描述如下
1、 索引匹配錯誤概率的定義特征組轉(zhuǎn)化為索引值時產(chǎn)生匹配錯誤的概率。
2、 不漏真前提量化引起的索引匹配錯誤必須在一定范圍之內(nèi),必須不能使索引結(jié)果遺 漏與現(xiàn)場指紋真正匹配的庫指紋。如果檢索系統(tǒng)遺漏了與現(xiàn)場指紋真正匹配的庫指紋,那么 整個系統(tǒng)最終將無法找到這枚與現(xiàn)場指紋真正匹配的庫指紋。
3、 容錯原則系統(tǒng)容許一定范圍內(nèi)的量化引起的索引匹配錯誤。指紋檢索系統(tǒng)是對指紋 庫進行粗篩選的,可以容忍一定的匹配錯誤。在圖像質(zhì)量較好時,即使存在一定的匹配錯誤, 與現(xiàn)場指紋真正匹配的庫指紋的檢索分?jǐn)?shù)也會大于閾值,不會被篩除。
4、 索引速度優(yōu)先原則在滿足不漏真的前提下,指紋檢索系統(tǒng)可以利用容錯原則,在可 以容錯的范圍內(nèi)達到最快的檢索速度。因為設(shè)計指紋檢索系統(tǒng)的目的是加快指紋辨識的速度, 所以如何有效利用容錯原則,提高指紋檢索系統(tǒng)的速度,是整個系統(tǒng)設(shè)計的關(guān)鍵。
3.2.2特征值索引及特征值檢索法的索引匹配錯誤概率分析對于(6)式的特征組仏,/2,/3,4,—2,—3,/f},我們對所有參數(shù)都不進行量化而使用下式 |/f-/f|《7;, |厶<-《卜7;, z. = l,2,3, //"W
直接進行比對的方法稱為特征值檢索法。此時的計算誤差僅為前期累計誤差,并無量化匹配 錯誤,但是特征值檢索法的計算量很大。
3.2.3哈希索引及哈希檢索法的索引匹配錯誤概率分析
對于(6)式的特征組,我們對6個參數(shù)都進行量化得到索引值key:
索引值不發(fā)生錯誤的概率如(7)式所示,將(7)式重寫如下
6
<formula>formula see original document page 10</formula>(7)
當(dāng)在線檢索時只需計算一下現(xiàn)場和庫三角形的索引值是否相等,即只需判斷
是否成立就可以判斷兩個三角形是否匹配。因為該方法的計算量僅為1次等于比較,這種方 法在線檢索所需時間最短,得到索引結(jié)果速度最快。但是,我們從(7)式可以看到,該方法發(fā) 生匹配錯誤的概率也最大。
3.2.4分層深度索引及分層深度檢索法的索引匹配錯誤,概率分析 基于分層深度索引的檢索方法描述如下 我們將(6)式的特征組分為兩部分<formula>formula see original document page 10</formula>,(8)
{厶^,《厶^} (9) 將(8)式進行量化,作為第一層。得到
量化不引起索引值匹配錯誤的概率變?yōu)?br>
此時,如果凡=0.9, / = 1,2,3,則;7%=0.729,量化引起匹配錯誤的概率為l — ;^ =0.271 。 將(9)式作為第二層,不進行量化。
假設(shè)指紋有"個三角形,^表示fe力^的數(shù)目, 表示^>^ 相同的每個組內(nèi)三角形的數(shù) 目。如圖11所示,這"個三角形將被劃分為A個組,每個組中包含所有fe;;力f值相同的 個 三角形。"2是個變化的量,每個組的 大小可能不同。
這樣,指紋檢索過程將變?yōu)閮刹?br>
第一步比較現(xiàn)場指紋三角形和庫指紋三角形的fe^^值是否相等
<formula>formula see original document page 10</formula>(10)
如果第一層索引值fe"M相等則進入第二步,否則判定所比較的兩個三角形不匹配。
第二步在每個組內(nèi)使用下式比較角度是否相等《-《卜 ;, / = 1,2,3 (11) 即如果現(xiàn)場指紋三角形和庫指紋三角形同時滿足(10)和(11)式,則認(rèn)為這兩個三角形匹配,否
則判定所比較的兩個三角形不匹配。
3.2.5依據(jù)索引匹配錯誤概率的索引評價方法選擇檢索方式
根據(jù)本發(fā)明提出的基于索引匹配錯誤概率的索引評價準(zhǔn)則和前文對三種索引方式索引匹
配錯誤概率的分析,本發(fā)明提出了基于索引匹配錯誤概率的索引評價方法
第一步依據(jù)圖像預(yù)處理過程得到的信息將指紋圖像質(zhì)量劃分為三個等級好、中等、
差;
第二步圖像質(zhì)量好的指紋,對索引匹配錯誤的容錯范圍大,不易漏真,可以最大限度 地利用容錯范圍得到盡量快的檢索速度,選擇用哈希檢索法檢索哈希索引數(shù)據(jù)庫;
第三步圖像質(zhì)量差的指紋,對索引匹配錯誤的容錯范圍小,易漏真,為了滿足不漏真 前提,只能使用速度最慢但精度最高的檢索方式,選擇用特征值檢索法檢索特征值索引數(shù)據(jù) 庫;
第四步圖像質(zhì)量中等的指紋,對索引匹配錯誤的容錯范圍中等,為了有效利用這些容 差范圍,提高系統(tǒng)的檢索速度,選擇用分層深度檢索法檢索分層深度索引數(shù)據(jù)庫。
在大型指紋庫的應(yīng)用中,大部分現(xiàn)場指紋屬于圖像質(zhì)量中等的情況,分層深度檢索法兼 具了哈希檢索法和特征值檢索法的優(yōu)點,同時在一定程度上克服了二者的缺點,具有最佳的 實用價值。
4指紋檢索系統(tǒng)的檢索評價方法 4.1指紋檢索系統(tǒng)的檢索效率
由圖2、圖4可以看到,在對索引數(shù)據(jù)庫檢索得到檢索結(jié)果之后需要利用檢索評價方法對 檢索結(jié)果進行打分,然后將分?jǐn)?shù)和設(shè)定的閾值進行比較判斷,將分?jǐn)?shù)大于閾值的那些庫指紋 送入細(xì)比對環(huán)節(jié),其它庫指紋則從比對序列中篩除。
設(shè)指紋庫中有i^枚庫指紋,決表示閾值,",e表示打分大于決的庫指紋數(shù)目,及力^表示
指紋檢索系統(tǒng)的篩選率。 則篩選率定義為
從(12)式可以看到,在不遺漏真正匹配的庫指紋的前提下,指紋檢索系統(tǒng)的篩選率i 力b越高, 則需要進行細(xì)比對的指紋數(shù)目 越少,從而完成整個辨識過程(檢索和細(xì)比對)的速度越快。
提高篩選率的途徑為增大闞值決,但是,前提是不能遺漏與現(xiàn)場指紋真正匹配的庫指紋。 設(shè)與現(xiàn)場指紋真正匹配的庫指紋的檢索分?jǐn)?shù)為&。,,則檢索系統(tǒng)必須滿足
S咖^ (13)
如果系統(tǒng)的篩選率非常高,但是卻不滿足(13)式,即遺漏了與現(xiàn)場指紋真正匹配的庫指紋, 那么整個系統(tǒng)最終將無法找到這枚與現(xiàn)場指紋真正匹配的庫指紋。
所以,指紋檢索系統(tǒng)的評價方法必須足夠精確,如果一個檢索評分方法能夠充分利用已
11得到的檢索信息對指紋的相似程度進行準(zhǔn)確的評價,那么&。,就會很大,(13)式得到滿足的可 能性就會很大,從而得到高篩選率的可能性也會越大,進而可能有效的提高檢索系統(tǒng)的效率。 因此,構(gòu)造指紋檢索系統(tǒng)的評價方法是整個系統(tǒng)性能和效率能否提高的核心環(huán)節(jié)之一。 4.2特征組的精選
假設(shè)指紋有"個細(xì)節(jié)點,將細(xì)節(jié)點組合獲取平移旋轉(zhuǎn)不變的參數(shù)的方法有二元組(線 段)、三元組(三角形)、四元組(四邊形)、……、f元組(/邊形)、……。Z越大,代表的 指紋結(jié)構(gòu)信息越豐富,但同時匹配上的困難性就越大。在/《w的情況下,/越大,/元組的數(shù) 量會越多。比如二元組有《個,三元組有《個,四元組有《個等。
二元組雖然數(shù)量少,但是其區(qū)分能力差。三元組已經(jīng)具有了較好的區(qū)別能力。但是三元 組代表的指紋結(jié)構(gòu)信息仍然不夠豐富,仍然有很多的誤判,同時三元組的數(shù)目《已經(jīng)是非常
龐大到必須進行精選的程度。比如Cl。 =82160,《5。 =551300。
如果將這么多三角形全部存儲起來作為索引,將會使存儲量大大增加,檢索系統(tǒng)從硬盤 讀取數(shù)據(jù)花費的時間就會越多,檢索時間會大大增加,這樣就沒有起到加速AFIS的作用。所 以特征組的精選方法是影響指紋檢索系統(tǒng)效率的另一個重要因素。 4.3基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法
對索引數(shù)據(jù)庫檢索得到的檢索結(jié)果除了含有匹配的三角形數(shù)目之外,還包含很多有用的 信息。例如使用細(xì)節(jié)點三角形進行檢索時存在如圖12所示的現(xiàn)象。圖12中左圖是現(xiàn)場指紋, 右圖是庫指紋。現(xiàn)場指紋的兩個三角形分別和庫指紋的兩個三角形匹配,同一枚指紋中的兩 個三角形共用一條邊。對于這樣的情形,我們定義為一邊二次匹配。如果這樣的兩對三角形 匹配,說明這兩枚指紋在結(jié)構(gòu)上更為相似,所以其匹配的可能性就更高。同理可推廣到一邊 三次匹配、 一邊四次匹配等等。因此我們用以下公式作為評分方法
S-m+^W (14)
其中,S為兩枚指紋的匹配總分?jǐn)?shù),Ww為匹配三角形數(shù)目,iV2,iV3,iV4表示具有一邊2,3,4
次匹配的三角形數(shù)目,巧^^,^表示加權(quán)系數(shù)。我們將采用(14)式評分方法的指紋檢索評價方
法稱為基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法,并將(14)式稱為基于一邊多次匹配結(jié)構(gòu) 特征的檢索評價公式。
我們對公式(14)進行如下分析
從4.2的分析可知,由于特征組的數(shù)量非常龐大,所以必須對指紋的特征組進行精選。 精選必須遵循兩個原則(1)減少特征組的數(shù)量;(2)不能明顯降低指紋的識別精度,即必
須從大量特征組中選取可靠性和代表性好的特征組。
表1和表2所示為細(xì)節(jié)點數(shù)目"=80和w = 150時,《的數(shù)值。從表中可以看到,w = 80時, C84?!稢83。,而很多指紋庫中,"多達150甚至更多。這樣我們就面臨著一個矛盾為了提高 檢索速度,必須對指紋特征組進行精選,而對三元特征組進行精選已經(jīng)非常困難,如果為了 提高檢索精度而選取四元組或者更高結(jié)構(gòu)將會使這一矛盾更加突出。
我們采用了將易于形變的三角形剔除和將三角形限制在一定局部范圍的方法對三角形進
12行精選,該方法對三元組的精選是有效的。但是,由于(: 3 (: 4,這些方法對四元組的精選
是無效的,因為使用這些方法篩選后剩下的四元組數(shù)量仍然是龐大的。
表i《。~<:86。的數(shù)值
匕80ho廣
80316082160158158024040016300500200
表2 C^《o的數(shù)值
、50
1501117555130020260275591600030
本發(fā)明提出的基于一邊多次匹IB結(jié)構(gòu)特征的相似性評價方法可以有效解決高維特征組的 精選問題。圖12所示一邊二次匹配的同一枚指紋的兩個三角形的四個頂點能夠組成一個四元
組,即兩對三角形具有一邊二次匹配特性時,事實上就相當(dāng)于匹配上了一對四元組。只要我
們統(tǒng)計一邊二次匹配的三角形數(shù)目就可以得到兩枚指紋匹配的四元組數(shù)目,即(14)式中的i^ 相當(dāng)于是兩枚指紋匹配的四元組的數(shù)目。
這樣我們用三元組的存儲量完成了比對四元組任務(wù),即利用三元組巧妙地實現(xiàn)了四元組 的比對。因為我們使用一邊二次匹配方法得到的四元組是用已經(jīng)匹配上的三元組的頂點得到 的,事實上這些四元組正好就是我們需要從四元組總數(shù)據(jù)量C"4中精選出來的那些可以匹配的 四元組,這樣我們通過這種方法實現(xiàn)了對四元組進行精選的目的,符合精選必須遵循的兩個 原貝U。所以, 一邊二次匹配方法用遠小于《的數(shù)據(jù)量同時達到了對四元組精選和匹配的雙重
目的。具體帶來了以下好處
(a) 特征組的存儲量i^^^《C:,節(jié)省了存儲空間,從而減少了從硬盤讀取數(shù)據(jù)和比對
的時間,提高了檢索速度。A^表示精選后的三角形數(shù)量。
(b) 通過可匹配的三元組組合得到四元組,實現(xiàn)了對四元組數(shù)量的精選,而且得到的四 元組正好是兩枚指紋匹配的四元組,保證了比對效果。
(c) 公式(14)的打分更注重指紋結(jié)構(gòu)上的相似性,所以更精確,從而提高了檢索精度。 從公式(14)可以看到,通過三角形一邊多次匹配參數(shù)不僅可以得到四元組匹配的數(shù)目W2 ,
而且可以得到五元組、六元組及其更高組合的匹配數(shù)目i^,i^,…iV,.…,原因是三對三角形一
邊三次匹配就相當(dāng)于匹配上了一個五元組,同理可推廣到一邊四次匹配以上。公式(14)選擇 的一邊多次匹配是一邊二次匹配、 一邊三次匹配、 一邊四次匹配,選擇的多元組是四元組、 五元組、六元組。
從上述分析我們可以得到基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法的評價步驟-第一步獲取檢索信息;
第二步從檢索信息中提取匹配三角形數(shù)目信息;
第三步從檢索信息中提取三角形一邊多次匹配信息得到相應(yīng)的多元組匹配信息;第四步使用基于一邊多次匹配結(jié)構(gòu)特征的檢索評價公式對現(xiàn)場指紋和庫指紋進行相似性打分。
基于一邊多次匹配結(jié)構(gòu)特征的指紋檢索評價方法不以匹配三角形數(shù)目作為唯一 的評分方法,而是通過三元組匹配信息有效地獲取了多元組結(jié)構(gòu)的匹配數(shù)目,使得評分結(jié)果更真實更能體現(xiàn)指紋的相似性,從而能夠使與現(xiàn)場指紋真正匹配的庫指紋得到更高的打分,減少了漏真的可能性;而且,該評分方法在提高了檢索精度的同時,指紋特征參數(shù)組的存儲量卻依然為精選后的三元組的數(shù)量,有效提高了指紋檢索的效率。
權(quán)利要求
1. 一種超大型指紋庫檢索系統(tǒng)的構(gòu)造方法,該方法包括第一步提取指紋細(xì)節(jié)點三角形具有平移和旋轉(zhuǎn)畸變不變性的參數(shù)構(gòu)成特征參數(shù)組,剔除特征參數(shù)組中可靠性差和冗余的特征參數(shù);第二步依據(jù)基于索引匹配錯誤概率的索引評價方法對庫指紋構(gòu)建哈希索引、分層深度索引、特征值索引三個功能互補的索引器;第三步將三個索引器分別寫入數(shù)據(jù)庫,構(gòu)建三個功能互補的索引數(shù)據(jù)庫;第四步依據(jù)基于索引匹配錯誤概率的索引評價方法和基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法構(gòu)建檢索器。
2. 如權(quán)利要求1所述的構(gòu)造方法,其中所述索引器的構(gòu)建包括哈希索引器的構(gòu)造三角形特征參數(shù)組的全部特征量化構(gòu)造哈希索引器; 分層深度索引器的構(gòu)造按照基于分層深度索引的指紋檢索方法構(gòu)造分層深度索引器; 特征值索引器的構(gòu)造三角形特征參數(shù)組的全部特征不量化構(gòu)造特征值索引器。
3. 如權(quán)利要求1所述的構(gòu)造方法,其中所述檢索器的構(gòu)建包括自適應(yīng)選擇檢索方式模塊的構(gòu)造依據(jù)基于索引匹配錯誤概率的索引評價方法構(gòu)建該自 適應(yīng)選擇檢索方式模塊,用于根據(jù)用戶輸入的現(xiàn)場指紋圖像質(zhì)量選擇相適應(yīng)的檢索方式;檢索模塊的構(gòu)造對應(yīng)于哈希索引、分層深度索引、特征值索引三種索引方式構(gòu)建哈希 檢索、分層深度檢索、特征值檢索三個檢索模塊,用于檢索索引數(shù)據(jù)庫;檢索結(jié)果打分模塊的構(gòu)造依據(jù)基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法構(gòu)造檢索結(jié) 果打分模塊;判決模塊的構(gòu)造依據(jù)打分結(jié)果判決所檢索的庫指紋是否應(yīng)被篩除。
4. 一種基于索引匹配錯誤概率的索引評價方法,該方法包括第一步依據(jù)圖像預(yù)處理過程得到的信息將指紋圖像質(zhì)量劃分為三個等級好、中等、差;第二步圖像質(zhì)量好的指紋,對索引匹配錯誤的容錯范圍大,不易漏真,可以最大限度 地利用容錯范圍得到盡量快的檢索速度,選擇用哈希檢索法檢索哈希索引數(shù)據(jù)庫;第三步圖像質(zhì)量差的指紋,對索引匹配錯誤的容錯范圍小,易漏真,為了滿足不漏真 前提,只能使用速度最慢但精度最高的檢索方式,選擇用特征值檢索法檢索特征值索引數(shù)據(jù) 庫;第四步圖像質(zhì)量中等的指紋,對索引匹配錯誤的容錯范圍中等,為了有效利用這些容 差范圍,提高系統(tǒng)的檢索速度,選擇用分層深度檢索法檢索分層深度索引數(shù)據(jù)庫。
5. 如權(quán)利要求4所述的基于索引匹配錯誤概率的索引評價方法,其中所述哈希檢索法是指 比較現(xiàn)場指紋三角形的哈希值是否與庫指紋三角形的哈希值相等,如果相等則判定所比較的 兩個三角形匹配,否則判定為不匹配。
6. 如權(quán)利要求4所述的基于索引匹配錯誤概率的索引評價方法,其中所述特征值檢索法是 指計算現(xiàn)場指紋三角形特征參數(shù)組中的特征參數(shù)與庫指紋三角形特征參數(shù)組中的特征參數(shù)的 差值是否在設(shè)定的閾值范圍之內(nèi),如果差值都在閾值范圍之內(nèi),則判定所比較的兩個三角形 匹配,否則判定為不匹配。
7. 如權(quán)利要求4所述的基于索引匹配錯誤概率的索引評價方法,其中所述分層深度檢索法 分為兩步第一步比較現(xiàn)場指紋三角形分層深度索引第 -層的索引值與庫指紋三角形分層深度索 引第層的索引值是否相等,如果第一層索引值相等則進入第二步,否則判定所比較的兩個 三角形不匹配;第二步計算現(xiàn)場指紋三角形深度索引第二層的特征參數(shù)與庫指紋三角形深度索引第二 層的特征參數(shù)的差值是否在設(shè)定的閾值范圍之內(nèi),如果現(xiàn)場指紋三角形和庫指紋三角形的第 一.層索引值相等,并且第二層特征參數(shù)的差值都在設(shè)定的閾值范圍之內(nèi),則判定所比較的兩 個三角形匹配,否則判定為不匹配。
8. —種基于分層深度索引的指紋檢索方法,該方法包括第一步依據(jù)指紋三角形特征參數(shù)組中的每個特征參數(shù)的特性將指紋三角形特征參數(shù)組 分為兩部分;第二步將三角形特征參數(shù)組的第一部分量化構(gòu)造分層深度索弓1的第一層;第三步將三角形特征參數(shù)組的第二部分不量化構(gòu)造分層深度索弓I的第二層;第四步比較現(xiàn)場指紋三角形和庫指紋三角形的第一層索引值是否相等,如果第一層索引值相等則進入第二步,否則判定所比較的兩個三角形不匹配;第五步計算現(xiàn)場指紋三角形第二層的特征參數(shù)與庫指紋三角形第二層的特征參數(shù)的差值是否都在設(shè)定的閾值范圍之內(nèi);第六步如果現(xiàn)場指紋三角形和庫指紋三角形的第一層索引值相等,第二層特征參數(shù)的差值都在設(shè)定的閾值范圍之內(nèi),則判定所比較的兩個三角形匹配,否則判定為不匹配。
9. 一種基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法,該方法包括 第一步獲取檢索信息;第二步從檢索信息中提取匹配三角形數(shù)目信息;第三步從檢索信息中提取三角形一邊多次匹配信息獲取相應(yīng)的多元組匹配信息; 第四步使用基于一邊多次匹配結(jié)構(gòu)特征的檢索評價公式對現(xiàn)場指紋和庫指紋進行相似性打分,其中S為兩枚指紋的匹配總分?jǐn)?shù),為匹配三角形數(shù) 目,AT2、 W3、 A^表示具有一邊2、3、4次匹配的三角形數(shù)目,^、 r2、 r3、 ^表示加權(quán)系數(shù)。
10. 如權(quán)利要求9所述的基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法,其中,所述一邊多次 匹配是一邊二次匹配、-邊三次匹配、 一邊四次匹配;所述多元組是四元組、五元組、六元組。
全文摘要
本發(fā)明用于超大型指紋數(shù)據(jù)庫的指紋檢索,提出了超大型指紋庫的索引結(jié)構(gòu)和檢索方法。本發(fā)明屬于計算機識別領(lǐng)域,具體涉及到指紋識別、數(shù)據(jù)庫、數(shù)據(jù)檢索和圖像處理等領(lǐng)域。本發(fā)明提出了一種超大型指紋庫檢索系統(tǒng)結(jié)構(gòu)的構(gòu)造方法、基于索引匹配錯誤概率的索引評價方法、基于分層深度索引的指紋檢索方法以及基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法來加速超大型指紋庫的檢索,具有實用價值和普遍的適用性。在離線建庫階段依據(jù)基于索引匹配錯誤概率的索引評價方法對庫指紋構(gòu)建哈希索引、分層深度索引、特征值索引三個功能互補的索引器;在在線檢索階段依據(jù)基于索引匹配錯誤概率的索引評價方法和基于一邊多次匹配結(jié)構(gòu)特征的檢索評價方法構(gòu)建檢索器。
文檔編號G06F17/30GK101477523SQ20081018009
公開日2009年7月8日 申請日期2008年11月24日 優(yōu)先權(quán)日2008年11月24日
發(fā)明者菲 蘇, 蔡安妮, 袁寶璽 申請人:北京郵電大學(xué)