基于最大位平均熵的sift描述子二值化及相似度匹配方法
【專利摘要】基于最大位平均熵的SIFT描述子二值化及相似度匹配方法涉及圖像匹配領(lǐng)域。SIFT算子匹配能力較強,但是SIFT算子帶來的數(shù)據(jù)量是巨大的。所以要對SIFT算子進行二值化,如果對所有算子進行統(tǒng)一二值化,勢必也會導致存在數(shù)據(jù)冗余或者信息丟失。本發(fā)明通過對SIFT算子進行二值化,然后對各層二值化結(jié)果進行位平均熵的計算,來自適應的選擇不同的二值化層數(shù),提取出新的二值化描述子,然后用漢明距離代替歐式距離計算兩個描述子之間的距離,將其跟設定閾值進行比較。本發(fā)明保留了原始特征的信息并大大減少了數(shù)據(jù)存儲量,降低了計算的復雜度,可更好實現(xiàn)實時性的要求。并且可以取得等同于原始SIFT描述子的匹配結(jié)果,遠優(yōu)于統(tǒng)一二值化進行匹配的結(jié)果。
【專利說明】基于最大位平均熵的SIFT描述子二值化及相似度匹配方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像匹配【技術(shù)領(lǐng)域】,具體涉及一種基于最大位平均熵的SIFT描述子二值化方法及其相似度匹配方案。
【背景技術(shù)】
[0002]隨著現(xiàn)代計算機技術(shù)的發(fā)展,人臉識別技術(shù)在安全認證、人機交流、公安系統(tǒng)等方面得到了廣泛的使用,并且在視頻會議、檔案管理、醫(yī)學醫(yī)療等方面也發(fā)揮著很大的作用。在美國911恐怖襲擊事件以及網(wǎng)絡CSDN用戶信息遭泄露事件發(fā)生之后,生物特征識別技術(shù)更加受到大家關(guān)注,而人臉生物特征的識別一直是生物特征識別領(lǐng)域研究的熱點,人臉識別在可控的情況下可以獲得很好的識別性能,但在實際應用中,人臉識別往往受到很多因素影響,當人臉姿態(tài)發(fā)生變化,表情發(fā)生變化,外界光照發(fā)生變化,人臉存在遮擋(戴圍巾,墨鏡)等情況時,人臉識別的性能將會下降很多,這就制約了人臉識別在實際中的應用。因此,很多的研究學者致力于人臉識別方法的研究,各種人臉識別方法層出不窮。
[0003]SIFT (Scale-1nvariant Feature Transform)特征匹配算法是目前國內(nèi)外特征點匹配算法研究的熱點與難點,它是在1999年由加拿大的David G.Lowe提出初步思想的局部特征描述子,并于2004年在原基礎上進行了更深入的發(fā)展并加以完善。SIFT描述子是一種圖像的局部描述子,具有尺度、旋轉(zhuǎn)、平移的不變性,而且對光照變化、仿射變換和3維投影變換具有一定的魯棒性。在Mikolajczyk對包括SIFT描述子在內(nèi)的十種局部描述子所做的不變性對比實驗中,SIFT及其擴展算法已被證實在同類描述子中具有最強的健壯性。SIFT描述子匹配能力較強,對大多數(shù)圖像變換具備很強的不變性,特別適合于處理兩幅圖像間發(fā)生平移、旋轉(zhuǎn)、仿射變換時的匹配問題,其穩(wěn)定的特征匹配能力甚至可對任意角度拍攝的圖像應用。SIFT特征還具有很好的獨特性,適于在海量特征數(shù)據(jù)庫中進行比較快速、準確的匹配。但是,用SIFT來表示人臉圖像的數(shù)據(jù)量是很巨大的。一般一幅人臉圖像有3000個SIFT點,每個SIFT由128個描述子構(gòu)成,每個描述子由8比特表示,總的數(shù)據(jù)量為3072000比特。Wang等人提出了二值化SIFT描述子的思想。本發(fā)明是在對SIFT描述子進行二值化的時候,以最大位平均熵為準則來確定二值化的層數(shù),形成新的二值化描述子,然后用漢明距離代替歐式距離計算兩個描述子之間的距離,將其跟設定閾值進行比較,最終得到匹配結(jié)果。這樣極大的減少了數(shù)據(jù)量,降低了計算的復雜度,可以更好實現(xiàn)實時性的要求。并且二值化后的描述子在進行匹配運算時可以得到原始SIFT描述子基本一致的匹配結(jié)果,遠遠優(yōu)于將SIFT描述子進行統(tǒng)一二值化進行匹配的結(jié)果。本發(fā)明提出了一種基于最大位平均熵的SIFT描述子二值化方法及相似度匹配方案。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供了一種基于最大位平均熵準則的SIFT描述子二值化方法及相似度匹配方案,該方法可以利用位平均熵最大來有效的確定二值化進行的層數(shù),形成新的二值化描述子,然后用漢明距離代替歐式距離計算兩個描述子之間的距離,將其跟設定閾值進行比較,最終得到匹配結(jié)果??梢员A舸罅吭糞IFT描述子信息,在很大程度上減少數(shù)據(jù)量,降低了計算的復雜度,可以更好實現(xiàn)實時性的要求。并且可以保證匹配結(jié)果和使用原始SIFT描述子得到的匹配結(jié)果基本一致,遠遠優(yōu)于將SIFT描述子進行統(tǒng)一二值化進行匹配的結(jié)果。
[0005]對SIFT描述子進行二值化,如果僅僅進行一層二值化,那么會丟失很多信息,保留原特征的信息量會很少。在進行多層二值化時,包含四種二值化策略:(I)在做完第一層二值化之后,得到O和1,然后一直對O部分進行二值化。(2)在做完第一層二值化之后,得到O和1,選擇O部分進行二值化得到O和1,然后一直對I部分進行二值化。(3)在做完第一層二值化之后,得到O和1,選擇I部分進行二值化得到O和I,然后一直對O部分進行二值化。(4)在做完第一層二值化之后,得到O和1,然后一直對I部分進行二值化。因為SIFT描述子中包含很多個O,對于每一層二值化結(jié)果,一直對I進行二值化的策略信息熵總是最大的,所以采取第四種策略進行多層二值化。熵可以用來度量信息量的大小。SIFT描述子進行二值化層數(shù)增加,信息熵會隨之增大。但是,與之相隨的是數(shù)據(jù)量的大大增加。而且,如果對提取的所有SIFT描述子進行統(tǒng)一層數(shù)的二值化,那么會包含下面兩種情況:(I)本身不需要二值化進行到指定層數(shù),位平均熵已經(jīng)達到最大。比如做兩層二值化后的位平均熵是最大的,則只需要保留兩層的結(jié)果。如果做三層或更多層,會增大數(shù)據(jù)冗余,冗余的數(shù)據(jù)可能會引起匹配的錯誤;(2)在做完指定層數(shù)的二值化后,位平均熵還未達到最大,這樣會導致二值化后的描述子不能充分的保留原始SIFT描述子攜帶的信息,會導致誤匹配度的增加。但是,從數(shù)據(jù)量上來考慮,最多保留四層二值化結(jié)果。本發(fā)明提出了基于最大位平均熵的二值化SIFT描述子方法及相似度匹配方案,通過對每一個描述子進行位平均熵的計算,來自適應的選擇不同的二值化層數(shù),形成新的二值化描述子,然后用漢明距離代替歐式距離計算兩個描述子之間的距離,將其跟設定閾值進行比較,最終得到匹配結(jié)果。本發(fā)明提出的算法在很大程度上保留了原始特征的信息并大大減少了數(shù)據(jù)存儲量,降低了計算的復雜度,可以更好實現(xiàn)實時性的要求。并且可以取得等同于原始SIFT描述子的匹配結(jié)果,遠遠優(yōu)于將SIFT描述子進行統(tǒng)一二值化進行匹配的結(jié)果。因此,本發(fā)明具有一定的應用價值和意義。
[0006]為了實現(xiàn)上述問題,本發(fā)明提出了一種基于最大位平均熵的SIFT描述子二值化的方法及相似度匹配方案,該方法具體包括:
[0007]A、二值化階段,對于每一幅人臉圖像,首先提取SIFT特征描述子,然后對SIFT描述子進行多層二值化,求得各個層次的信息熵,根據(jù)各層O和I出現(xiàn)的概率和保留的總比特數(shù),求得位平均熵,然后找出最大位平均熵對應的二值化層數(shù),保留這幾層二值化結(jié)果,形成新的二值化特征描述子。
[0008]B、匹配階段,對于任意兩幅人臉圖像,分別提取其新的二值化特征描述子之后,然后用漢明距離代替歐式距離計算兩個描述子之間的距離,將其跟設定閾值進行比較,如果漢明距離小于等于設定閾值,則認為匹配成功;否則,則認為匹配不成功。對于提取的不同層次的二值化特征描述子,需要選擇不同的閾值。
[0009]所述步驟A具體包括:
[0010]Al、對于每一幅人臉圖像,首先提取SIFT特征描述子;[0011]A2、對于每一幅人臉圖像的每一個SIFT描述子進行二值化;
[0012]A3、統(tǒng)計O和I的個數(shù),分別為n10和nn ;
[0013]Α4、標記為I的那些字節(jié)對應的描述子,繼續(xù)進行二值化,統(tǒng)計此時O和I的個數(shù),分別為η2(ι和n21,繼續(xù)進行上述二值化過程,依次得到n3(l和n31,n40和n41
[0014]A5、分別計算做一層、二層、三層、四層二值化的信息熵;
[0015]A6、根據(jù)二值化后保留的總比特數(shù),位平均熵可以由信息熵除以比特數(shù)得到;
[0016]A7、求得最大位平均熵所對應的層數(shù),保留對應層數(shù)的二值化結(jié)果,形成新的二值化描述子。
[0017]所述步驟B具體包括:
[0018]B1、對于任意兩幅人臉圖像,提取其新的二值化描述子;
[0019]B2、對于每兩個描述子,計算其漢明距離disH ;
[0020]B3、提取不同層次的二值化描述子,選擇的閾值T也不相同,做一層、二層、三層和四層二值化的閾值分別為:!\,T2, T3, T4
[0021]B4、如果disH小于等于閾值,則認為匹配成功;否則,認為匹配不成功。本發(fā)明與現(xiàn)有技術(shù)相比,具有以下明顯的優(yōu)勢和有益效果:
[0022](I)本發(fā)明對SIFT描述子進行二值化,是根據(jù)最大位平均熵原則來自適應的根據(jù)每一個描述子來確定二值化層數(shù),與進行統(tǒng)一二值化相比,不僅減少了數(shù)據(jù)冗余,而且在很大程度上保留原始SIFT描述子攜帶的信息。
[0023](2)本發(fā)明自適應得到新的二值化描述子,通過漢明距離來進行匹配,計算簡單快捷,復雜度降低,可以更好的滿足實時性的要求。
[0024](3)本發(fā)明通過最大位平均熵得到的二值化SIFT描述子來進行匹配,經(jīng)實驗分析,匹配結(jié)果等同于原始SIFT描述子的匹配結(jié)果,遠遠優(yōu)于將SIFT描述子進行統(tǒng)一二值化進行匹配得到的結(jié)果。
【專利附圖】
【附圖說明】:
[0025]圖1是技術(shù)方案的整體流程圖。
[0026]圖2 (a)是二值化策略I (左左)
[0027]圖2 (b)是二值化策略I (左右)
[0028]圖2 (C)是二值化策略I (右左)
[0029]圖2 (d)是二值化策略I (右右)
[0030]圖3是相似度匹配結(jié)果比較圖。
【具體實施方式】:
[0031]本發(fā)明技術(shù)方案的整體流程如說明書附圖1所示。我們的方法大大減少了數(shù)據(jù)存儲量,降低了計算的復雜度,可以更好實現(xiàn)實時性的要求。并且可以取得等同于原始SIFT描述子的匹配結(jié)果,遠遠優(yōu)于將SIFT描述子進行統(tǒng)一二值化進行匹配的結(jié)果。
[0032]A、對于每一幅人臉圖像,首先提取SIFT特征描述子,然后對SIFT描述子進行二值化,求得各個層次的信息熵,根據(jù)各層O和I出現(xiàn)的概率和保留的總比特數(shù),求得位平均熵,然后找出最大位平均熵對應的二值化層數(shù),保留這幾層二值化結(jié)果,最終形成新的二值化描述子。具體步驟包括:
[0033]Al、對于每一幅人臉圖像,首先提取SIFT特征描述子
[0034]
【權(quán)利要求】
1.一種基于最大位平均熵的SIFT描述子二值化方法及相似度匹配方案,包括以下步驟: A、二值化階段,對于每一幅人臉圖像,首先提取SIFT特征描述子,然后對SIFT描述子進行多層二值化,求得各個層次的信息熵,根據(jù)各層O和I出現(xiàn)的概率和保留的總比特數(shù),求得位平均熵,然后找出最大位平均熵對應的二值化層數(shù),保留這幾層二值化結(jié)果,形成新的二值化特征描述子; 所述步驟A具體包括: Al、對于每一幅人臉圖像,首先提取SIFT特征描述子
【文檔編號】G06K9/00GK103617431SQ201310539961
【公開日】2014年3月5日 申請日期:2013年11月5日 優(yōu)先權(quán)日:2013年11月5日
【發(fā)明者】毋立芳, 侯亞希, 周鵬, 許曉, 曹航明, 顏鳳輝, 曹瑜, 漆薇 申請人:北京工業(yè)大學