專利名稱:一種基于Hadoop云計算框架的海量人臉識別搜索引擎設(shè)計方法
技術(shù)領(lǐng)域:
本發(fā)明屬于云計算和模式識別領(lǐng)域,具體涉及一種基于Hadoop云計算框架的海量人臉識別搜索引擎設(shè)計方法。
背景技術(shù):
現(xiàn)代社會中,視頻監(jiān)控是實現(xiàn)社會公共安全防控的主要監(jiān)控系統(tǒng)。遍布城市各處的視頻信息采集點將海量的視頻信息匯集到監(jiān)控中心,為城市的公共安全防控提供了海量的信息。但是,由于缺乏智能的海量視頻分析技術(shù),這些信息的利用率極低。為了充分利用這些信息,保障社會安全,人們嘗試將人臉識別技術(shù)應(yīng)用于智能視頻分析中,實現(xiàn)犯罪嫌疑人身份的快速確認(rèn)。然而,面對海量的人臉圖像信息,人臉識別的搜索速度則完全無法滿足安全部門的應(yīng)用需求,迫切需要一種快速的海量人臉圖像搜索比對方法。目前,提升人臉圖像搜索速度的主要途徑是使用高性能的工作站代替一般計算機,這種方案不僅價格昂貴,而且可擴展性差。云計算技術(shù)的迅速發(fā)展為解決人臉圖像的快速搜索提供了條件,已經(jīng)有一些基于云計算的解決方案被提了出來。例如:中國專利文獻公開號:CN202433901U,名稱為:分布式智能人臉視頻檢索系統(tǒng),其是一種包括工作終端、WEB服務(wù)器、任務(wù)調(diào)度服務(wù)器和監(jiān)控終端的分布式智能人臉視頻檢索系統(tǒng),實現(xiàn)實時檢索并降低系統(tǒng)搭建成本;中國專利文獻公開號:CN102360355A,名稱為:基于云計算環(huán)境的人臉識別搜索比對引擎,其針對云計算環(huán)境人臉識別搜索比對引擎的接口兼容、授權(quán)處理、資源調(diào)度及分配等問題給出了解決方案。然而,這些方法或系統(tǒng)很少提及云計算技術(shù)的具體實現(xiàn),同時,這些方法使用自建的分布式體系,穩(wěn)定性差。云計算技術(shù)的實現(xiàn)是一項較為復(fù)雜且綜合度高的工作,對面向海量人臉圖像信息的搜索引擎而言,使用未經(jīng)實踐檢驗的未成熟云計算框架所構(gòu)建的系統(tǒng),實際引擎的架設(shè)與維護成本難以控制,且穩(wěn)定性差,無法滿足公共安全部門的實際使用需求。近年來,由Apache基金會支持的Hadoop云計算框架(是一個分布式系統(tǒng)基礎(chǔ)架構(gòu))已被Facebook、Google等國際頂尖互聯(lián)網(wǎng)公司所采用,且已經(jīng)在海量信息檢索方面獲得了成功,這為構(gòu)建高效、易于維護與擴展的云計算人臉識別搜索引擎提供了條件。
發(fā)明內(nèi)容
為了解決基于云計算的海量人臉識別搜索引擎開發(fā)難度高、穩(wěn)定性差、難于維護的缺點,本發(fā)明提出一種基于Hadoop框架的人臉識別搜索引擎設(shè)計方法,以成熟的Hadoop云計算框架為基礎(chǔ),實現(xiàn)穩(wěn)定高效的海量人臉識別。本發(fā)明首先提出一種建立高效人臉特征向量數(shù)據(jù)索引表的方法,保證該人臉識別搜索引擎的空間索引實時性與可靠性。該方法以包 含內(nèi)層、中間層和外層的三層結(jié)構(gòu)的云計算框架為基礎(chǔ),其中,內(nèi)層由分布式的人臉身份信息數(shù)據(jù)表構(gòu)成,用于存放海量的人臉圖像、人臉特征向量以及對應(yīng)的身份信息;中間層由人臉特征向量聚類索引表與聚類名單表構(gòu)成,用于信息索引表的建立與維護;外層用于接收任務(wù)、人臉特征向量計算與任務(wù)分配。所述方法將利用人臉特征提取方法計算得到的海量人臉圖像的人臉特征向量儲存在非結(jié)構(gòu)化的HBase數(shù)據(jù)庫中,得到人臉身份信息數(shù)據(jù)表,利用K均值聚類算法對該表中人臉特征向量的每一維特征分別進行聚類分析后建立信息索引表,包括人臉特征向量聚類索引表和若干張聚類名單表。基于以上方法,本發(fā)明進一步提出一種基于Hadoop的海量人臉識別搜索引擎設(shè)計方法,所述方法是將海量人臉識別過程分解為海量數(shù)據(jù)組織和人臉特征搜索比對兩個階段。海量數(shù)據(jù)組織階段即是建立高效人臉特征向量數(shù)據(jù)索引表的階段,在此階段將利用特征提取方法計算得到的海量人臉圖像的特征向量儲存在非結(jié)構(gòu)化的HBase數(shù)據(jù)庫中,得到人臉身份信息數(shù)據(jù)表,利用K均值聚類算法對該表中人臉特征向量的每一維特征分別進行聚類分析后建立信息索引表(包括一張人臉特征向量聚類索引表和若干張聚類名單表);在人臉特征搜索比對階段,利用待比對人臉圖像的特征向量的每一維特征在信息索引表中進行檢索,合并檢索得到的結(jié)果信息,以大大縮小需要比對的人臉數(shù)據(jù)范圍,然后利用Hadoop框架中的MapReduce并行計算進行人臉特征向量對比計算,提高計算效率與均衡載荷。本發(fā)明構(gòu)建了一種包含內(nèi)層、中間層和外層的三層結(jié)構(gòu)云計算框架來實現(xiàn)海量數(shù)據(jù)組織和人臉特征搜索比對。內(nèi)層由分布式的人臉身份信息數(shù)據(jù)表構(gòu)成,用于存放海量的人臉圖像、人臉特征向量以及對應(yīng)的身份信息;中間層由人臉特征向量聚類索引表與聚類名單表構(gòu)成,用于搜索引擎的信息索引表的建立與維護;外層用于接收任務(wù)、人臉特征向量計算與任務(wù)分配。基于以上所述的三層結(jié)構(gòu)云計算框架,本發(fā)明的海量人臉識別搜索引擎的實現(xiàn)包括以下步驟:1、海量數(shù)據(jù)組織。首先,利用Hadoop框架中的數(shù)據(jù)庫HBase對內(nèi)層數(shù)據(jù)進行組織,以鍵值對的形式存儲人臉的圖像、人臉特征向量以及對應(yīng)的身份信息,實現(xiàn)人臉身份信息數(shù)據(jù)表的分布式存儲。然后,在中間層使用K均值聚類算法對人臉身份信息數(shù)據(jù)表中的人臉特征向量進行聚類分析,建立由單個人臉特征向量聚類索引表和多個聚類名單數(shù)據(jù)表構(gòu)成的信息索引表,將人臉身份信`息數(shù)據(jù)表中人臉特征向量的每一維特征值聚為N類,并建立一個含有人臉特征向量維度編號、聚類分類編號、聚類分類中心值及聚類名單表編號屬性的人臉特征向量聚類索引表,同時建立多個含有人臉身份信息唯一 ID的聚類名單表。這兩類表也采用HBase的鍵值對形式進行組織。2、人臉特征搜索比對。當(dāng)外層接收到人臉識別任務(wù)時,首先通過Hadoop框架中的MapReduce方式(是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運算)計算待識別人臉圖像的人臉特征向量;然后將人臉特征向量傳入中間層,由中間層利用信息索引表進行索引后得到若干聚類名單表,并通過MapReduce方式將聚類名單表合并形成待比對的索引名單表;最后,內(nèi)層根據(jù)索引名單表查詢待比對的人臉特征向量,并通過MapReduce方式計算待識別人臉圖像特征向量與待比對的人臉特征向量的距離得到一張人臉特征向量距離表,對該表按距離從小到大排序后輸出搜索結(jié)果。本發(fā)明采用上述技術(shù)方案,具有以下有益效果:本發(fā)明應(yīng)對構(gòu)建海量人臉識別搜索引擎不需要采用昂貴的高性能工作站,并且采用經(jīng)過大量實踐證明的Hadoop云計算框架為基礎(chǔ)實現(xiàn),具有良好的穩(wěn)定性,方法簡單,易于實施。本發(fā)明還提供了一種高效的人臉特征向量組數(shù)據(jù)索引表方法,保證了該人臉圖像識別搜索引擎的空間索引實時性與可靠性。
圖1:基于Hadoop的海量人臉識別搜索引擎的架構(gòu)圖;圖2:海量數(shù)據(jù)組織即建立高效人臉特征向量數(shù)據(jù)索引表的流程圖;圖3:人臉識別搜索查詢流程圖。
具體實施例方式下面結(jié)合流程圖和實例進一步說明本發(fā)明實施方式。應(yīng)當(dāng)理解,此處描述的具體實施例僅用以解釋本發(fā)明,并不用于限制本發(fā)明。如圖1所示,為本發(fā)明所提出的人臉識別搜索引擎的架構(gòu)圖。該搜索引擎包含內(nèi)層、中間層和外層三層。其中,內(nèi)層由人臉身份信息數(shù)據(jù)表與人臉特征向量分布式對比計算節(jié)點1、計算節(jié)點2、計算節(jié)點3……計算節(jié)點M組成;中間層由人臉特征向量聚類索引表及若干聚類名單表數(shù)據(jù)集1、2、3……η組成,每個數(shù)據(jù)集對應(yīng)I維特征;外層由人機交互查詢接口與人臉特征向量計算節(jié)點1、2、3……M組成。如圖2所示,為本發(fā)明的數(shù)據(jù)組織流程圖。主要步驟分為人臉身份信息數(shù)據(jù)表的初始化、人臉特征向量聚類分析、聚類名單表的建立、人臉特征向量聚類索引表的建立及信息索引表構(gòu)建。具體實施過程如下:1.人臉身份信息數(shù) 據(jù)表的建立(I)以身份信息的唯一 ID為主鍵,以人臉圖像、人臉特征向量、身份信息(包括:姓名、性別、出生日期、住址、常用聯(lián)系電話等)為“鍵”在內(nèi)層的HBase中建立一張人臉身份信息數(shù)據(jù)表;(2)從輸入的人臉身份信息數(shù)據(jù)中提取人臉圖像,使用外層分布式計算節(jié)點通過MapReduce方式計算其人臉特征向量,并將人臉特征向量及對應(yīng)的人臉圖像、身份信息插入到人臉身份信息數(shù)據(jù)表中,這個過程循環(huán)至所有輸入的人臉身份信息數(shù)據(jù)都添加到人臉身份信息數(shù)據(jù)表中為止;2.人臉特征向量聚類分析使用K均值聚類算法以人臉特征向量的每一維特征為分析對象對步驟I所生成的人臉身份信息數(shù)據(jù)表進行聚類分析,將人臉特征向量每一維特征聚為N個分類(N為自然數(shù),其取值可根據(jù)人臉數(shù)據(jù)規(guī)模確定);3.聚類名單表的建立由步驟2可獲得人臉特征向量每一維特征聚類分析結(jié)果,將該結(jié)果中的每一個分類在中間層中單獨創(chuàng)建一張以人臉身份信息唯一 ID為“鍵”,人名為“值”的聚類名單表,以HBase方式儲存。4.人臉特征向量聚類索引表的建立在中間層中建立一個以自增自然數(shù)為主鍵,以人臉特征向量維度編號、聚類分類編號、聚類分類中心值及聚類名單表編號為屬性的人臉特征向量聚類索引表;5.信息索引表構(gòu)建
將步驟2所得聚類分析結(jié)果與步驟3所建立的每一個聚類名單表編號信息一起插入到步驟4所建立的人臉特征向量聚類索引表中,該人臉特征向量聚類索引表與所有聚類名單表一起構(gòu)成信息索引表;經(jīng)過以上步驟,本發(fā)明的數(shù)據(jù)組織階段完成。如圖3所示,為本發(fā)明執(zhí)行人臉識別搜索查詢流程圖。以下將結(jié)合圖3說明本發(fā)明如何在數(shù)據(jù)組織完成的基礎(chǔ)上進行快速人臉識別檢索。在過程的執(zhí)行中,使用MapReduce計算出待識別人臉圖像的人臉特征向量后,將該人臉特征向量每一維特征分別與人臉特征向量聚類索引表中的對應(yīng)人臉特征向量維度的每一個分類中心值進行對比計算,記錄人臉特征向量每一維特征與分類中心值差值絕對值最小的聚類分類,將這些聚類分類對應(yīng)聚類名單表進行對比,去掉重合信息,合并為一張索引名單表,再根據(jù)該索引名單表中的人臉身份信息唯一 ID在人臉身份信息數(shù)據(jù)表中進行查詢,構(gòu)建待比對人臉特征向量,最后待識別的人臉特征向量與待比對人臉特征向量進行對比計算,根據(jù)人臉特征向量距離排序后得到最終的結(jié)果,返回給用戶。具體實施步驟如下:1.人臉特征向量計算將待識別 的人臉圖像使用外層分布式計算節(jié)點以MapReduce方式進行計算,得到對應(yīng)的d維人臉特征向量(d的值由具體的人臉特征提取方法確定),將其傳入中間層。2.索引名單表的構(gòu)建中間層中的信息索引表是整個人臉識別搜索引擎的核心,其原理是計算出待識別人臉特征向量各維度特征與聚類分類中心值差值絕對值最小的聚類分類,將這些聚類分類所對應(yīng)的聚類名單表加以合并以提供索引,與輸入人臉圖像的人臉特征向量距離較近的人臉?biāo)鶎買D都會出現(xiàn)在該名單中,這樣將極大縮小需要對比計算人臉特征向量的范圍以達到快速檢索的目的,具體實施過程如下:(I)將步驟I所得d維人臉特征向量的每一維特征分別與人臉特征向量聚類索引表中對應(yīng)人臉特征向量維度的每一個分類中心值使用內(nèi)層分布式計算節(jié)點進行對比計算,得到一個以聚類分類編號為“鍵”,差值絕對值為“值”的鍵值對Ai ;(2)對Ai進行“值”升序排序,得到“值”最小的聚類分類編號Ni ;(3)通過聚類分類編號Ni在HBase數(shù)據(jù)庫中定位一張聚類名單表Si ;(4)對于人臉特征向量中的每一維特征都執(zhí)行(I) (3)的步驟,得到一系列聚類名單表=S11Sz^Sdt5(5)將步驟(4)中得到的S1, S2,…,Sd中的所有“鍵”使用內(nèi)層分布式計算節(jié)點通過MapReduce方式進行交叉信息對比,去掉重合信息,合并為一張索引名單表;(6)將索引名單表傳入內(nèi)層進行進一步操作。3.獲取相似度較高的人臉圖像利用步驟2中所得到的索引名單表中的人臉身份信息在人臉身份信息數(shù)據(jù)表中執(zhí)行查詢操作,獲取對應(yīng)的待比對人臉特征向量,并依次與待識別人臉圖像的人臉特征向量進行距離計算,獲取人臉特征向量距離表;最后使用內(nèi)層中的分布式計算節(jié)點以MapReduce方式對人臉特征向量距離表進行降序排序后,輸出前m個人臉身份信息(m的取值根據(jù)人臉身份信息數(shù)據(jù)表規(guī)模與實際應(yīng)用環(huán)境確定),即為相似度較高的人臉圖像。本發(fā)明中所涉及的距離計算方法可采用歐氏距離、曼哈頓距離及冪距離計算方法等方法得到。具體的計算公式為: 歐氏距離:
權(quán)利要求
1.一種基于Hadoop的海量人臉識別搜索引擎的人臉特征向量數(shù)據(jù)索引表的建立方法,其特征在于:所述方法以包含內(nèi)層、中間層和外層的三層結(jié)構(gòu)的云計算框架為基礎(chǔ),其中,內(nèi)層由分布式的人臉身份信息數(shù)據(jù)表構(gòu)成,用于存放海量的人臉圖像、人臉特征向量以及對應(yīng)的身份信息;中間層由人臉特征向量聚類索引表與聚類名單表構(gòu)成,用于信息索引表的建立與維護;外層用于接收任務(wù)、人臉特征向量計算與任務(wù)分配; 所述方法將利用人臉特征提取方法計算得到的海量人臉圖像的人臉特征向量儲存在非結(jié)構(gòu)化的HBase數(shù)據(jù)庫中,得到人臉身份信息數(shù)據(jù)表,利用K均值聚類算法對該表中人臉特征向量的每一維特征分別進行聚類分析后建立信息索引表,包括人臉特征向量聚類索引表和若干張聚類名單表。
2.根據(jù)權(quán)利要求1所述的人臉特征向量數(shù)據(jù)索引表的建立方法,其特征在于所述方法的具體步驟包括: (1)以身份信息的唯一 ID為主鍵,以人臉圖像、人臉特征向量、身份信息為“鍵”在內(nèi)層的HBase中建立一張人臉身份信息數(shù)據(jù)表;從輸入的人臉身份信息數(shù)據(jù)中提取人臉圖像,使用外層分布式計算節(jié)點通過MapReduce方式計算其人臉特征向量,并將人臉特征向量及對應(yīng)的人臉圖像、身份信息插入到人臉身份信息數(shù)據(jù)表中,這個過程循環(huán)至所有輸入的人臉身份信息數(shù)據(jù)都添加到人臉身份信息數(shù)據(jù)表中為止; (2)使用K均值聚類算法以人臉特征向量的每一維特征為分析對象對步驟(I)所生成的人臉身份信息數(shù)據(jù)表進行聚類分析,將人臉特征向量每一維特征聚為N個分類,N為自然數(shù),其取值根據(jù)輸入人臉信息數(shù)據(jù)的規(guī)模確定; (3)由步驟(2)可獲得人臉特征向量每一維特征聚類分析結(jié)果,將該結(jié)果中的每一個分類在中間層中單獨創(chuàng)建一張以人臉身份信息唯一 ID為“鍵”,人名為“值”的聚類名單表,以HBase方式儲存; (4)在中間層中建立一個以自增自然數(shù)為主鍵,以人臉特征向量維度編號、聚類分類編號、聚類分類中心值及聚類名單表編號為屬性的人臉特征向量聚類索引表; (5)將步驟(2)所得聚類分析結(jié)果與步驟(3)所建立的每一張聚類名單表編號信息一起插入到步驟(4)所建立的人臉特征向量聚類索引表中,該人臉特征向量聚類索引表與所有聚類名單表一起構(gòu)成信息索引表。
3.根據(jù)權(quán)利要求2所述的人臉特征向量數(shù)據(jù)索引表的建立方法,其特征在于所述身份信息包括:姓名、性別、出生日期、住址、常用聯(lián)系電話等。
4.一種基于Hadoop的海量人臉識別搜索引擎設(shè)計方法,其特征在于:所述方法將海量人臉識別過程分解為人臉特征向量數(shù)據(jù)索引表建立即海量數(shù)據(jù)組織和人臉特征搜索比對兩個階段;在海量數(shù)據(jù)組織階段,將利用特征提取方法計算得到的海量人臉圖像的人臉特征向量儲存在非結(jié)構(gòu)化的HBase數(shù)據(jù)庫中,得到人臉身份信息數(shù)據(jù)表,利用K均值聚類算法對該表中人臉特征向量的每一維特征分別進行聚類分析后建立信息索引表,包括人臉特征向量聚類索引表和若干張聚類名單表;在人臉特征搜索比對階段,利用待比對人臉圖像的人臉特征向量的每一維特征在信息索引表中進行檢索,合并檢索得到的結(jié)果信息,以大大縮小需要比對的人臉數(shù)據(jù)范圍,然后利用Hadoop框架中的MapReduce并行計算進行人臉特征向量對比計算,提高計算效率與均衡載荷; 所述方法以包含內(nèi)層、中間層和外層的三層結(jié)構(gòu)的云計算框架為基礎(chǔ),其中,內(nèi)層由分布式的人臉身份信息數(shù)據(jù)表構(gòu)成,用于存放海量的人臉圖像、人臉特征向量以及對應(yīng)的身份信息;中間層由人臉特征向量聚類索引表與聚類名單表構(gòu)成,用于搜索引擎的信息索引表的建立與維護;外層用于接收任務(wù)、人臉特征向量計算與任務(wù)分配。
5.根據(jù)權(quán)利要求4所述基于Hadoop的海量人臉識別搜索引擎設(shè)計方法,其特征在于所述海量數(shù)據(jù)組織的具體步驟包括: (1)以身份信息的唯一ID為主鍵,以人臉圖像、人臉特征向量、身份信息為“鍵”在內(nèi)層的HBase中建立一張人臉身份信息數(shù)據(jù)表;從輸入的人臉身份信息數(shù)據(jù)中提取人臉圖像,使用外層分布式計算節(jié)點通過MapReduce方式計算其人臉特征向量,并將人臉特征向量及對應(yīng)的人臉圖像、人臉身份信息插入到人臉身份信息數(shù)據(jù)表中,這個過程循環(huán)至所有輸入的人臉身份信息數(shù)據(jù)都添加到人臉身份信息數(shù)據(jù)表中為止; (2)使用K均值聚類算法以人臉特征向量的每一維特征為分析對象對步驟(I)所生成的人臉身份信息數(shù)據(jù)表進行聚類分析,將人臉特征向量每一維特征聚為N個分類,N為自然數(shù),其取值根據(jù)輸入人臉信息數(shù)據(jù)的規(guī)模確定; (3)由步驟(2)可獲得人臉特征向量每一維特征聚類分析結(jié)果,將該結(jié)果中的每一個分類在中間層中單獨創(chuàng)建一張以人臉身份信息唯一 ID為“鍵”,人名為“值”的聚類名單表,以HBase方式儲存; (4)在中間層中 建立一個以自增自然數(shù)為主鍵,以人臉特征向量維度編號、聚類分類編號、聚類分類中心值及聚類名單表編號為屬性的人臉特征向量聚類索引表; (5)將步驟(2)所得聚類分析結(jié)果與步驟(3)所建立的每一張聚類名單表編號信息一起插入到步驟(4)所建立的人臉特征向量聚類索引表中,該人臉特征向量聚類索引表與所有聚類名單表一起構(gòu)成信息索引表。
6.根據(jù)權(quán)利要求4或5所述基于Hadoop的海量人臉識別搜索引擎設(shè)計方法,其特征在于所述人臉識別特征搜索比對按照以下步驟進行: (O將待識別的人臉圖像使用外層分布式計算節(jié)點以MapReduce方式進行計算,得到對應(yīng)的d維人臉特征向量,d的值由具體的人臉特征提取方法確定,將其傳入中間層; (2)將步驟(I)所得d維人臉特征向量的每一維特征分別與人臉特征向量聚類索引表中對應(yīng)人臉特征向量維度的每一個分類中心值使用內(nèi)層分布式計算節(jié)點進行對比計算,得到一個以聚類分類編號為“鍵”,差值絕對值為“值”的鍵值對Ai ; (3)對Ai進行“值”升序排序,得到“值”最小的聚類分類編號Ni; (4)通過聚類分類編號Ni在HBase數(shù)據(jù)庫中定位一張聚類名單表Si; (5)對于人臉特征向量中的每一維特征都執(zhí)行(2) (4)的步驟,得到一系列聚類名單表 J1, S2,…,Sd ; (6)將步驟(5)中得到的5”S2,…,Sd中的所有“鍵”使用內(nèi)層分布式計算節(jié)點通過MapReduce方式進行交叉信息對比,去掉重合信息,合并為一張索引名單表; (7)將步驟(6)中所得到的索引名單表中的人臉身份信息在人臉身份信息數(shù)據(jù)表中執(zhí)行查詢操作,獲取對應(yīng)的待比對人臉特征向量,并依次與待識別人臉圖像的人臉特征向量進行對比計算,獲取人臉特征向量距離表;最后使用內(nèi)層中的分布式計算節(jié)點以MapReduce方式對人臉特征向量距離表進行降序排序后,輸出前m個人臉身份信息,m的取值根據(jù)人臉身份信息數(shù)據(jù)表規(guī)模與實際應(yīng)用環(huán)境確定,即為相似度較高的人臉圖像。
7.根據(jù)權(quán)利要求6所述的人臉特征向量數(shù)據(jù)索引表的建立方法,其特征在于所述身份信息包括:姓名、性別、出 生日期、住址、常用聯(lián)系電話等。
全文摘要
一種基于Hadoop云計算框架的海量人臉識別搜索引擎設(shè)計方法,屬于云計算和模式識別領(lǐng)域。以Hadoop云計算框架為基礎(chǔ),由內(nèi)層、中間層和外層三層構(gòu)成。內(nèi)層用于存放海量的人臉圖像及身份信息與提供分布式計算資源,中間層用于搜索引擎的索引表的建立與維護,外層用于接收任務(wù)與分配任務(wù)。為了在保證精度的同時提高人臉圖像在數(shù)據(jù)庫中的搜索速度,本方法采用在中間層使用K均值聚類算法建立人臉特征向量聚類索引表與聚類名單表相結(jié)合的方法。本方法可以使用廉價的普通服務(wù)器組構(gòu)建海量人臉識別搜索引擎,并且采用經(jīng)過大量實踐證明的Hadoop云計算框架為基礎(chǔ)實現(xiàn),具有良好的穩(wěn)定性,方法簡單,易于實施。
文檔編號G06F17/30GK103235825SQ201310166729
公開日2013年8月7日 申請日期2013年5月8日 優(yōu)先權(quán)日2013年5月8日
發(fā)明者楊利平, 李力, 龔衛(wèi)國, 李偉紅, 李正浩, 王立 申請人:重慶大學(xué)