欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種遠程身份認證的系統(tǒng)、終端、服務器和方法

文檔序號:7961248閱讀:218來源:國知局
專利名稱:一種遠程身份認證的系統(tǒng)、終端、服務器和方法
技術領域
本發(fā)明涉及在通信網絡中認證身份的技術,特別涉及一種在通信網絡中遠程身份認證的系統(tǒng)、終端、服務器和方法。
背景技術
隨著通信網絡的迅猛發(fā)展,各種服務也日益增多,在通信網絡中如何進行遠程身份認證顯得日益重要,遠程身份認證已經成為網絡服務提供商提供各種服務的前提和重要組成部分。傳統(tǒng)的遠程身份認證采用文本密碼的方式,即終端將文本密碼發(fā)送給通信網絡的認證服務器進行認證,該方式不僅要求用戶記住各種煩瑣的文本密碼,而且文本密碼還容易丟失和被盜用。
為了使遠程身份認證過程高效、新型和方便,目前可以利用人體固有的生理特征或行為特征來進行遠程的身份認證,即遠程身份認證可以采用生物特征識別技術。在眾多的生物特征識別技術中,人臉認證和語音認證占有重要的地位且在一些專用領域中已經得到了應用。其中,人臉認證是根據人臉圖像進行遠程身份認證,包括人臉的檢測和人臉圖像的識別;語音認證是根據人的語音信息進行遠程身份認證,包括語音的獲取和語音數(shù)據的識別。
采用人臉認證和語音認證方式進行遠程身份認證的過程為在通信網絡的終端中設置攝像頭和麥克風,終端采用攝像頭檢測到人臉圖像,采用麥克風獲取人的語音并生成語音數(shù)據后發(fā)送給通信網絡的網絡側,通信網絡的網絡側對接收到的人臉圖像和語音數(shù)據分別進行認證。
在申請?zhí)枮镃N200310120624.9,發(fā)明名稱為“移動計算環(huán)境下分步式的人臉檢測與識別方法”的專利申請中,公開了人臉檢測與識別的方法,該方法包括首先,檢測標定,從移動設備上的攝像頭獲得圖像,對圖像進行簡單有效地光線矯正,并采用快速人臉檢測算法進行人臉檢測和標定;其次,加密傳輸,將標定出的人臉范圍進行數(shù)字水印加密后通過無線通信網絡發(fā)送到服務器端,服務器端對人臉范圍中嵌入的數(shù)字水印進行驗證,判斷圖像的完整性與正確性;最后,采用基于嵌入式隱馬爾可夫模型(HMM)的人臉識別訓練算法進行人臉識別并將認證結果返回給移動設備。
但是,這種采用人臉認證方式進行遠程身份認證存在著缺點第一,由于目前最好的只基于人臉的單模態(tài)生物特征識別系統(tǒng)在環(huán)境比較復雜的條件下,仍然面臨著識別率不高的問題,這種遠程身份認證是基于無線通信網絡的移動環(huán)境的,所以也存在識別率不高的問題;第二,在檢測到的人臉圖像中嵌入數(shù)字水印,只是用來判斷人臉圖像的完整性和正確性,不影響此后的人臉圖像識別,但是如果數(shù)字水印采用一般加密方式,密鑰由終端和服務器端約定,如果人臉圖像被他人截獲并對數(shù)字水印進行解密,破解的可能性比較大,破解數(shù)字水印后就可以得到人臉圖像并將解密得到的密鑰對人臉圖像重新進行數(shù)字水印加密后冒充到服務器端進行認證,使遠程身份認證的安全性不高。

發(fā)明內容
有鑒于此,本發(fā)明的主要目的在于提供一種遠程身份認證的系統(tǒng),該系統(tǒng)提高了遠程身份認證的識別率和安全性。
本發(fā)明還提供一種遠程身份認證的終端,該終端能夠檢測到多模態(tài)生物特征并發(fā)送給服務器進行身份認證。
本發(fā)明還提供一種遠程身份認證的服務器,該服務器能夠對終端發(fā)送的多模態(tài)生物特征進行身份認證。
本發(fā)明還提供一種遠程身份認證的方法,該方法提高了遠程身份認證的識別率和安全性。
根據上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的一種遠程身份認證的系統(tǒng),該系統(tǒng)包括具有檢測人臉圖像和獲取語音數(shù)據功能的終端、通信網絡和身份識別服務器(102),其中,具有檢測人臉圖像和獲取語音數(shù)據功能的終端將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后通過通信網絡發(fā)送給身份識別服務器(102),身份認證服務器(102)對接收到的嵌入有語音數(shù)據的人臉圖像進行分離,對分離得到的人臉圖像和語音數(shù)據分別進行認證后融合,得到最終是否通過認證的認證結果,發(fā)送給終端。
所述具有檢測人臉圖像和獲取語音數(shù)據功能的終端還包括身份識別模塊(100a)和與其連接的數(shù)據發(fā)送/接收模塊(100b),其中,身份識別模塊(100a)將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后發(fā)送給數(shù)據發(fā)送/接收模塊(100b),由數(shù)據發(fā)送/接收模塊(100b)通過通信網絡發(fā)送給身份認證服務器(102);或者數(shù)據發(fā)送/接收模塊(100b)通過通信網絡接收身份認證服務器(102)發(fā)送的最終是否通過認證的認證結果。
所述身份識別模塊(100a)還包括生物特征獲取模塊(100a1)和生物特征數(shù)據預處理模塊(100a2),其中,生物特征獲取模塊(100a1)通過攝像頭拍攝圖像且通過麥克風獲取語音數(shù)據后,發(fā)送給生物特征數(shù)據預處理模塊(100a2);生物特征數(shù)據預處理模塊(100a2)對接收到的圖像進行檢測和標定,檢測到人臉圖像,對接收到的語音數(shù)據進行壓縮和加密,采用水印方式將壓縮和加密的語音數(shù)據嵌入到檢測到的人臉圖像中后,發(fā)送給數(shù)據發(fā)送/接收模塊(100b)。
所述身份認證服務器(102)還包括人臉圖像數(shù)據庫(103)、語音數(shù)據庫(104)、多模態(tài)生物特征數(shù)據分離模塊(105)、人臉圖像識別模塊(106)、語音數(shù)據識別模塊(107)、數(shù)據融合模塊(108)和認證結果發(fā)送模塊(109),其中,多模態(tài)生物特征數(shù)據分離模塊(105)用于將通過通信網絡接收到嵌入有語音數(shù)據的人臉圖像進行分離,得到語音數(shù)據和人臉圖像后分別發(fā)送給語音數(shù)據識別模塊(107)和人臉圖像識別模塊(106);語音數(shù)據識別模塊(107)用于根據語音數(shù)據庫(104)中存儲的注冊用戶的語音數(shù)據對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的語音數(shù)據進行認證,將語音數(shù)據的認證結果發(fā)送給數(shù)據融合模塊(108);人臉圖像識別模塊(106)用于根據人臉圖像數(shù)據庫(103)中存儲的注冊用戶的人臉圖像對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的人臉圖像進行認證,將人臉圖像認證結果發(fā)送給數(shù)據融合模塊(108);數(shù)據融合模塊(108)用于將從語音數(shù)據識別模塊(107)接收到的語音數(shù)據認證結果和從人臉圖像識別模塊(106)接收到的人臉圖像認證結果進行融合,得到最終是否通過認證的認證結果發(fā)送給認證結果發(fā)送模塊(109);認證結果發(fā)送模塊(109)用于將從數(shù)據融合模塊(108)接收到的最終是否通過認證的認證結果通過通信網絡發(fā)送給具有檢測人臉圖像和獲取語音數(shù)據功能的終端。
所述語音數(shù)據庫(104)還包括注冊用戶聲音數(shù)據模塊(104a)和聲音嵌入式隱馬爾可夫模型HMM數(shù)據庫(104b),其中,注冊用戶聲音數(shù)據模塊(104a)用于注冊用戶聲音的提取,將注冊用戶聲音中的Mel頻率倒普參數(shù)MFCC作為語音的特征參數(shù)發(fā)送給聲音HMM數(shù)據庫(104b);聲音HMM模型數(shù)據庫(104b)用于采用HMM對接收到的語音的特征參數(shù)進行訓練,得到注冊用戶的語音數(shù)據。
所述人臉圖像數(shù)據庫(103)還包括注冊用戶人臉特征數(shù)據模塊(103a)和人臉特征數(shù)據庫(103b),其中,注冊用戶人臉特征數(shù)據模塊(103a)用于人臉特征數(shù)據的提取,得到注冊用戶的人臉特征數(shù)據發(fā)送給人臉特征數(shù)據庫(103b);人臉特征數(shù)據庫(103b)用于將從人臉特征數(shù)據庫(103b)接收到的注冊用戶的人臉特征數(shù)據取優(yōu),得到注冊用戶的人臉圖像。
所述的終端為移動終端(100);所述的通信網絡為無線通信網絡(101)。
一種遠程身份認證的終端,該終端包括身份識別模塊(100a)和與其連接的數(shù)據發(fā)送/接收模塊(100b),其中,
身份識別模塊(100a)將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后發(fā)送給數(shù)據發(fā)送/接收模塊(100b),由數(shù)據發(fā)送/接收模塊(100b)通過通信網絡發(fā)送給身份認證服務器(102);或者數(shù)據發(fā)送/接收模塊(100b)通過通信網絡接收身份認證服務器(102)發(fā)送的最終是否通過認證的認證結果。
所述身份識別模塊(100a)還包括生物特征獲取模塊(100a1)和生物特征數(shù)據預處理模塊(100a2),其中,生物特征獲取模塊(100a1)通過攝像頭拍攝圖像且通過麥克風獲取語音數(shù)據后,發(fā)送給生物特征數(shù)據預處理模塊(100a2);生物特征數(shù)據預處理模塊(100a2)對接收到的圖像進行檢測和標定,檢測到人臉圖像,對接收到的語音數(shù)據進行壓縮和加密,采用水印方式將壓縮和加密的語音數(shù)據嵌入到檢測到的人臉圖像中后,發(fā)送給數(shù)據發(fā)送/接收模塊(100b)。
一種遠程身份認證的服務器,包括人臉圖像數(shù)據庫(103)、語音數(shù)據庫(104)、多模態(tài)生物特征數(shù)據分離模塊(105)、人臉圖像識別模塊(106)、語音數(shù)據識別模塊(107)、數(shù)據融合模塊(108)和認證結果發(fā)送模塊(109),其中,多模態(tài)生物特征數(shù)據分離模塊(105)用于將通過通信網絡接收到嵌入有語音數(shù)據的人臉圖像進行分離,得到語音數(shù)據和人臉圖像后分別發(fā)送給語音數(shù)據識別模塊(107)和人臉圖像識別模塊(106);語音數(shù)據識別模塊(107)用于根據語音數(shù)據庫(104)中存儲的注冊用戶的語音數(shù)據對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的語音數(shù)據進行認證,將語音數(shù)據的認證結果發(fā)送給數(shù)據融合模塊(108);人臉圖像識別模塊(106)用于根據人臉圖像數(shù)據庫(103)中存儲的注冊用戶的人臉圖像對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的人臉圖像進行認證,將人臉圖像認證結果發(fā)送給數(shù)據融合模塊(108);數(shù)據融合模塊(108)用于將從語音數(shù)據識別模塊(107)接收到的語音數(shù)據認證結果和從人臉圖像識別模塊(106)接收到的人臉圖像認證結果進行融合,得到最終是否通過認證的認證結果發(fā)送給認證結果發(fā)送模塊(109);認證結果發(fā)送模塊(109)用于將從數(shù)據融合模塊(108)接收到的最終是否通過認證的認證結果通過通信網絡發(fā)送給具有檢測人臉圖像和獲取語音數(shù)據功能的終端。
所述語音數(shù)據庫(104)還包括注冊用戶聲音數(shù)據模塊(104a)和聲音嵌入式隱馬爾可夫模型HMM數(shù)據庫(104b),其中,注冊用戶聲音數(shù)據模塊(104a)用于注冊用戶聲音的提取,將注冊用戶聲音中的Mel頻率倒普參數(shù)MFCC作為語音的特征參數(shù)發(fā)送給聲音HMM數(shù)據庫(104b);聲音HMM模型數(shù)據庫(104b)用于采用HMM對接收到的語音的特征參數(shù)進行訓練,得到注冊用戶的語音數(shù)據。
所述人臉圖像數(shù)據庫(103)還包括注冊用戶人臉特征數(shù)據模塊(103a)和人臉特征數(shù)據庫(103b),其中,注冊用戶人臉特征數(shù)據模塊(103a)用于人臉特征數(shù)據的提取,得到注冊用戶的人臉特征數(shù)據發(fā)送給人臉特征數(shù)據庫(103b);人臉特征數(shù)據庫(103b)用于將從人臉特征數(shù)據庫(103b)接收到的注冊用戶的人臉特征數(shù)據取優(yōu),得到注冊用戶的人臉圖像。
一種遠程身份認證的方法,該方法包括A、終端獲取進行認證的用戶的人臉圖像和語音數(shù)據后,采用水印方式將語音數(shù)據嵌入到人臉圖像中發(fā)送給身份識別服務器;B、身份識別服務器將接收到的嵌入有語音數(shù)據的人臉圖像進行分離,分離得到語音數(shù)據和人臉圖像,語音數(shù)據認證轉入C,人臉圖像認證轉入D;C、身份識別服務器確定得到的語音數(shù)據為存儲的其中一個注冊用戶的語音數(shù)據,得到語音數(shù)據認證通過的用戶信息和語音數(shù)據相似程度值,轉入步驟E;D、身份識別服務器確定得到的人臉圖像為存儲的其中一個注冊用戶的人臉圖像,得到人臉圖像認證通過的用戶信息和人臉圖像相似程度值,轉入步驟E;E、身份識別服務器將得到的語音數(shù)據認證通過的用戶信息和語音數(shù)據的相似度值,以及得到的人臉圖像認證通過的用戶信息和人臉圖像的相似度值進行融合,得到最終是否通過認證的認證結果發(fā)送給終端。
步驟A所述終端獲取需要進行認證的用戶的人臉圖像和語音數(shù)據的過程為采用攝像頭拍攝進行認證的用戶的圖像,對所拍攝的圖像進行檢測和標定,得到人臉圖像;采用麥克風獲取進行認證的用戶的語音數(shù)據,對語音數(shù)據進行壓縮和加密。
所述對所拍攝的圖像進行檢測和標定,得到人臉圖像的過程為對所拍攝的圖像進行人臉檢測后,將檢測到的人臉在獲取到的圖像中標定出來并切割出人臉圖標。
步驟B所述分離得到語音數(shù)據的過程為對語音數(shù)據進行解碼和解壓縮后,分離得到語音數(shù)據。
步驟C所述語音數(shù)據相似程度值為概率最大的輸出概率值;步驟C所述得到語音數(shù)據認證通過的用戶信息和語音數(shù)據相似程度值的過程為將接收到的語音數(shù)據作為輸入,采用維比特算法計算出與所存儲的每個注冊用戶之間的輸出概率,所存儲的輸出概率最大的語音數(shù)據對應的注冊用戶為語音數(shù)據認真通過的用戶,得到該用戶信息和輸出概率最大的數(shù)據概率值。
步驟D所述人臉圖像相似程度值為漢明距最小的漢明距值,步驟D所述的得到人臉圖像認證通過的用戶信息和人臉圖像相似程度值的過程為將接收到的人臉圖像提取特征與所存儲的每個注冊用戶的人臉圖像的特征進行比較,將所存儲的與接收到人臉圖像提取的特征之間漢明距最小的人臉圖像對應的注冊用戶,作為人臉圖像認證通過的用戶,得到該用戶信息和漢明距最小的漢明距值。
步驟E所述的融合是通過多層感知機MLP進行的。
從上述方案可以看出,本發(fā)明將人臉認證和語音認證結合起來進行遠程身份認證在終端上檢測出人臉圖像和獲取到語音數(shù)據后,將檢測出的人臉圖像嵌入獲取到的語音數(shù)據,通過通信網絡傳送到服務器,由服務器分別對接收到的人臉圖像和語音數(shù)據分別進行認證后,再將最終是否通過認證的認證結果返回給終端。由于采用多模態(tài)生物特征融合的方式可以提高遠程身份認證的識別率且本發(fā)明不像現(xiàn)有技術那樣采用數(shù)字水印進行遠程身份認證,從而提高了遠程身份認證的識別率和安全性。


圖1為本發(fā)明進行遠程身份認證的系統(tǒng)示意圖;圖2為本發(fā)明進行遠程身份認證的移動終端示意圖;圖3為本發(fā)明進行遠程身份認證的身份識別服務器示意圖;圖4為本發(fā)明遠程身份認證的方法流程圖;圖5為在移動終端檢測人臉圖像和獲取語音數(shù)據后,將嵌入有語音數(shù)據的人臉圖像發(fā)送的過程示意圖;圖6為在身份識別服務器接收到嵌入有語音數(shù)據的人臉圖像后,對移動終端持有用戶進行遠程身份認證的過程示意圖。
具體實施例方式
為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下舉具體實施例并參照附圖,對本發(fā)明進行進一步詳細的說明。
由于采用多模態(tài)生物特征融合的方式可以提高遠程身份認證的識別率,所以在通信網絡中,特別是在無線通信網絡中,本發(fā)明將人臉認證和語音認證互相融合的方式,即將語音數(shù)據作為水印嵌入到人臉圖像中的方式作為遠程身份認證方式。由于采用數(shù)字水印進行遠程身份認證易被他人截獲解密得到人臉圖像并將解密得到的密鑰對人臉圖像重新進行數(shù)字水印加密后冒充到服務器進行認證,本發(fā)明將人的語音數(shù)據作為人臉圖像的水印,使得水印直接與最終的認證相聯(lián)系,而不僅僅只用于判斷人臉圖像的完整性與正確性,這樣,既使人的語音數(shù)據被截獲解密,由于不同人的語音差別比較大,所以冒充人的語音重新嵌入到人臉圖像后到服務器進行認證成功的可能性比較小,從而提高了遠程身份認證的安全性。
本發(fā)明將人臉認證和語音認證結合起來進行遠程身份認證的過程為在終端上快速地、魯棒地檢測出人臉圖像和獲取到語音數(shù)據后,將檢測出的人臉圖像嵌入有獲取到的語音數(shù)據,通過通信網絡傳送到服務器,由服務器分別對接收到的人臉圖像和語音數(shù)據分別進行認證后,再將最終是否通過認證的認證結果返回給終端。
以下以在無線通信網絡中進行遠程身份認證說明本發(fā)明。
圖1為本發(fā)明進行遠程身份認證的系統(tǒng)示意圖,該系統(tǒng)包括具有檢測人臉圖像和獲取語音數(shù)據功能的移動終端100、無線通信網絡101和無線通信網絡的網絡側的身份識別服務器102,該身份識別服務器102還具有人臉圖像數(shù)據庫103和語音數(shù)據庫104,分別存儲有注冊用戶的人臉圖像和語音數(shù)據。
當進行遠程身份認證時,具有檢測人臉圖像和獲取語音數(shù)據功能的移動終端100將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后通過無線通信網絡101發(fā)送給身份識別服務器102,身份認證服務器102對接收到的嵌入有語音數(shù)據的人臉圖像進行分離,得到人臉圖像和語音數(shù)據后,判斷人臉圖像是否在人臉圖像數(shù)據庫103中且語音數(shù)據是否在語音數(shù)據庫104中且為同一個注冊用戶的人臉圖像和語音數(shù)據,如果是,則認證通過,通過無線通信網絡101向具有檢測人臉圖像和獲取語音數(shù)據功能的移動終端100發(fā)送包括認證通過信息和認證通過的用戶信息的認證結果;如果不是,則認證未通過,通過無線通信網絡101向具有檢測人臉圖像和獲取語音數(shù)據功能的移動終端100發(fā)送包括認證未通過信息的認證結果。
圖2為本發(fā)明進行遠程身份認證的移動終端示意圖,該具有檢測人臉圖像和獲取語音數(shù)據功能的移動終端100包括身份識別模塊100a和與其連接的現(xiàn)有的數(shù)據發(fā)送/接收模塊100b。其中,現(xiàn)有的數(shù)據發(fā)送/接收模塊100b還通過無線通信網絡101與身份識別服務器102進行嵌入有語音數(shù)據的人臉圖像或最終是否通過認證的認證結果的傳送;身份識別模塊100a還包括用于獲取圖像和語音的生物特征獲取模塊100a1以及用于對所獲取的圖像和語音進行預處理,從而得到人臉圖像和語音數(shù)據的生物特征數(shù)據預處理模塊100a2。
生物特征獲取模塊100a1通過攝像頭拍攝圖像,通過麥克風獲取語音數(shù)據,如指定文本的語音,該語音長度不超過1秒,從而獲取到圖像和語音數(shù)據。
生物特征數(shù)據預處理模塊100a2首先對獲取到的圖像進行檢測和標定,檢測到人臉圖像,進行檢測和標定的過程為對獲取到的圖像進行人臉檢測后,將檢測到的人臉在獲取到的圖像中標定出來并切割出人臉圖標;生物特征數(shù)據預處理模塊100a2其次對獲取到的語音數(shù)據進行壓縮和加密后,采用水印方式將壓縮和加密的語音數(shù)據嵌入到檢測到的人臉圖像中;生物特征數(shù)據預處理模塊100a2最后將嵌入有語音數(shù)據的人臉圖像發(fā)送給數(shù)據發(fā)送/接收模塊100b。
數(shù)據發(fā)送/接收模塊100b用于將從生物特征數(shù)據預處理模塊100a2接收到的嵌入有語音數(shù)據的人臉圖像通過無線通信網絡101發(fā)送給身份識別服務器102,接收身份識別服務器通過無線通信網絡101發(fā)送的最終是否通過認證的認證結果。
圖3為本發(fā)明進行遠程身份認證的身份識別服務器示意圖,該身份識別服務器102包括人臉圖像數(shù)據庫103、語音數(shù)據庫104、多模態(tài)生物特征數(shù)據分離模塊105、人臉圖像識別模塊106、語音數(shù)據識別模塊107、數(shù)據融合模塊108和認證結果發(fā)送模塊109。
多模態(tài)生物特征數(shù)據分離模塊105用于將通過無線通信網絡101接收到嵌入有語音數(shù)據的人臉圖像進行分離,得到語音數(shù)據和人臉圖像后分別發(fā)送給語音數(shù)據識別模塊107和人臉圖像識別模塊106。得到語音數(shù)據的過程為將已經壓縮和加密的語音數(shù)據采用與移動終端100相同的壓縮和加密算法的逆過程進行解碼和解壓縮,得到語音數(shù)據。
語音數(shù)據識別模塊107用于根據語音數(shù)據庫104中的語音數(shù)據對從多模態(tài)生物特征數(shù)據分離模塊105接收到的語音數(shù)據進行認證,將語音數(shù)據的認證結果發(fā)送給數(shù)據融合模塊108。
語音數(shù)據識別模塊107的識別語音數(shù)據的過程為將從多模態(tài)生物特征數(shù)據分離模塊105接收到的語音數(shù)據作為輸入,采用維特比算法分別計算在語音數(shù)據庫104中所有的語音數(shù)據的輸出概率,概率最大語音數(shù)據對應的注冊用戶為通過語音數(shù)據認證的用戶。在此處,語音數(shù)據認證結果可以為概率最大語音數(shù)據的輸出概率值和通過認證的用戶信息。
人臉圖像識別模塊106用于根據人臉圖像數(shù)據庫103中的人臉圖像對從多模態(tài)生物特征數(shù)據分離模塊105接收到的人臉圖像進行認證,將人臉圖像認證結果發(fā)送給數(shù)據融合模塊108。
人臉圖像識別模塊106的識別人臉圖像的過程為對從多模態(tài)生物特征數(shù)據分離模塊105接收到的人臉圖像提取出特征,分別計算所提取的特征和人臉圖像數(shù)據庫103中的所有人臉圖像的特征之間的漢明距,漢明距最小的人臉圖像對應的注冊用戶為通過人臉圖像認證的用戶。在此處,人臉圖像認證結果可以為漢明距最小的漢明距值和通過認證的用戶信息。
數(shù)據融合模塊108用于將從語音數(shù)據識別模塊107接收到的語音數(shù)據認證結果和從人臉圖像識別模塊106接收到的人臉圖像認證結果進行融合,得到最終是否通過認證的認證結果發(fā)送給認證結果發(fā)送模塊109。
數(shù)據融合模塊108進行融合的過程為采用多層感知機(MLP)對從語音數(shù)據識別模塊107接收到的語音數(shù)據認證結果和從人臉圖像識別模塊106接收到的人臉圖像認證結果進行融合,用訓練的方法來確定人臉圖像認證結果和語音數(shù)據認證結果各自的權重,由MLP輸出最終是否通過認證的認證結果。在本發(fā)明中,在數(shù)據融合模塊108中建立MLP模型數(shù)據庫,在MLP模型數(shù)據庫中為每個注冊用戶建立一個單隱層,單輸出節(jié)點為MLP,訓練樣本為注冊用戶的語音數(shù)據和人臉圖像的優(yōu)選特征。對于每一個注冊用戶,自己語音數(shù)據之間和人臉圖像之間的相似度值,即語音數(shù)據的輸出概率和人臉圖像的漢明距作為正樣本;其他用戶作為冒認者,他們的語音數(shù)據與注冊用戶的語音數(shù)據以及他們的人臉圖像與注冊用戶的人臉圖像之間的相似度值作為負樣本,采用反向傳播算法(Back-Propagation)訓練得到每一個注冊用戶的MLP,將訓練得到的每一個注冊用戶的MLP存儲在所建立的MLP模型數(shù)據庫中。
在融合時,如果語音數(shù)據認證結果中通過認證的用戶信息與人臉圖像認證結果中通過認證的用戶信息不相同,假設前者為甲,后者為乙,則數(shù)據融合模塊108將甲對應的語音數(shù)據的輸出概率值和乙對應的語音數(shù)據的輸出概率值以及甲與乙的人臉圖像之間的漢明距值作為輸入,分別輸入到甲的MLP和乙的MLP,得到最終的是否通過認證的認證結果為1)如果甲的MLP輸出結果為1,乙的MLP輸出結果為0,則最終的是否通過認證的認證結果為甲通過身份認證;2)如果甲的MLP輸出結果為0,乙的MLP輸出結果為1,則最終的是否通過認證的認證結果為乙通過身份認證;3)甲和乙的MLP輸出結果相同,則最終的是否通過認證的認證結果為未通過認證。
在融合時,如果語音數(shù)據認證結果中通過認證的用戶信息與人臉圖像認證結果中通過認證的用戶信息相同,則將語音數(shù)據的輸出概率值和人臉圖像的漢明距值作為輸入,輸入到通過認證的用戶的MLP,如果MLP的輸出結果為1,則最終的是否通過認證的認證結果為用戶通過身份認證;如果MLP的輸出結果為0,則最終的是否通過認證的認證結果為用戶未通過身份認證。
認證結果發(fā)送模塊109用于將從數(shù)據融合模塊108接收到的最終是否通過認證的認證結果通過無線通信網絡101發(fā)送給具有檢測人臉圖像和獲取語音數(shù)據功能的移動終端100,即發(fā)送給該移動終端100的數(shù)據發(fā)送/接收模塊100b。
在本發(fā)明中,語音數(shù)據庫104還包括注冊用戶聲音數(shù)據模塊104a和聲音HMM數(shù)據庫104b。其中,注冊用戶聲音數(shù)據模塊104a用于注冊用戶聲音的提取,將注冊用戶聲音中的Mel頻率倒普參數(shù)(MFCC)作為語音的特征參數(shù)發(fā)送給聲音HMM數(shù)據庫104b;聲音HMM模型數(shù)據庫104b用于采用HMM對接收到的語音的特征參數(shù)進行訓練,得到HMM的參數(shù),即注冊用戶的語音數(shù)據。當然,在注冊用戶聲音數(shù)據模塊104a提取注冊用戶的語音時,也可以讓用戶讀指定文本,獲取指定文本的一段語音。
人臉圖像數(shù)據庫103還包括注冊用戶人臉特征數(shù)據模塊103a和人臉特征數(shù)據庫103b。其中,注冊用戶人臉特征數(shù)據模塊103a用于人臉特征數(shù)據的提取,即將注冊用戶的人臉圖像分成許多子塊,在每個子塊中采用局部二進制模式(LBP)算法提取紋理特征,統(tǒng)計這些紋理特征LBP直方圖,得到注冊用戶的人臉特征數(shù)據發(fā)送給人臉特征數(shù)據庫103b;人臉特征數(shù)據庫103b,用于將從人臉特征數(shù)據庫103b接收到的注冊用戶的人臉特征數(shù)據取優(yōu),即對LBP直方圖進行取優(yōu),得到人臉圖像。
在人臉特征數(shù)據庫103b對注冊用戶的人臉特征數(shù)據取優(yōu)時,可以采用基于壓縮遺傳算法(CGA)的特征選取算法。從注冊用戶人臉特征數(shù)據模塊103a接收到的注冊用戶的人臉特征數(shù)據可以是一張人臉的7000多個特征,本發(fā)明采用特征選取算法優(yōu)選出一小部分對遠程身份認證比較重要的特征,將這些特征作為進行遠程身份認證的人臉圖像。
優(yōu)選的具體過程如下所示。
在本發(fā)明中用1表示人臉特征數(shù)據中的某個特征被選中,0表示沒有被選中。假設人臉特征數(shù)據的總特征數(shù)為N,則可用N個比特對這些特征進行編碼,定義一個個體為含有N個比特的向量,具體的步驟為(1)初始化概率向量 p[i]=0.5,i=0,...,N。
(2)根據 產生s個個體,將其保存在S中,即S[i]=generate(p);產生一個個體的過程為按順序隨機產生N個在0和1之間的數(shù)fi,i=0,...,N,如果fi>p[i],則個體的第i個比特為1,否則為0。
(3)從這s個個體中挑出分類效果最好的一個個體,將它放在S[1]中。
(4)讓S[1]中的個體和其它個體競爭,競爭即是比分類效果的好壞For j=2:swinner,loser=compete(S[1],S[j])For i=1:NIf winner[i]≠loser[i]thenIf winner[i]=1 then p[i]=p[i]+1/Nelse p[i]=p[i]-1/N(5)檢查概率向量是否收斂For i=1:Nif p[i]>0&& p[i]<1則返回到步驟(2)。
(6) 為最后挑選出的特征,其中1表示特征最后被選中,0表示沒選中。
本發(fā)明還提供一種遠程身份認證的方法,該方法同樣同時采用人臉圖像識別和語音數(shù)據識別方式進行遠程身份認證。
圖4為本發(fā)明遠程身份認證的方法流程圖,其具體步驟為步驟400、移動終端獲取需要進行認證的用戶的人臉圖像和語音數(shù)據。
在獲取人臉圖像時,可以采用攝像頭拍攝用戶的圖像,再對所拍攝的圖像進行檢測和標定,得到人臉圖像。
在獲取語音數(shù)據時,可以采用麥克風獲取進行認證的用戶的語音數(shù)據,對語音數(shù)據進行壓縮和加密后得到最終要獲取的語音數(shù)據。
在本發(fā)明中,也可以對語音數(shù)據不進行壓縮和加密,直接得到最終要獲取的語音數(shù)據。
步驟401、移動終端采用水印的方式將語音數(shù)據嵌入到人臉圖像中通過無線通信網絡發(fā)送給身份識別服務器。
步驟402、身份識別服務器將接收到的嵌入有語音數(shù)據的人臉圖像進行分離,得到語音數(shù)據和人臉圖像。
步驟403、身份識別服務器確定得到的語音數(shù)據為預先存儲的其中一個注冊用戶的語音數(shù)據,得到語音數(shù)據認證通過的用戶信息和語音數(shù)據相似程度值,轉入步驟405。
在確定時,是根據得到語音數(shù)據與所存儲的每個注冊用戶的語音數(shù)據的相似程度進行判斷的,即將所存儲的與得到語音數(shù)據的相似程度最大的語音數(shù)據對應的注冊用戶,作為語音數(shù)據認證通過的用戶。
在確定時,可以將得到的語音數(shù)據作為輸入,采用維比特算法計算出與所存儲的每個注冊用戶之間的輸出概率,輸出概率最大語音數(shù)據為相似程度最大的語音數(shù)據。
在本發(fā)明中,語音數(shù)據相似程度值可以為概率最大的輸出概率值。
步驟404、身份識別服務器確定得到的人臉圖像為預先存儲的其中一個注冊用戶的人臉圖像,得到人臉圖像認證通過的用戶信息和人臉圖像相似程度值,轉入步驟405。
在確定時,是根據得到人臉圖像與所存儲的每個注冊用戶的人臉圖像的相似程度進行判斷的,即將所存儲的與得到人臉圖像的相似程度最大的人臉圖像對應的注冊用戶,作為人臉圖像認證通過的用戶。
在確定時,可以從得到的人臉圖像提取特征與所存儲的每個注冊用戶的人臉圖像的特征進行比較,將所存儲的與得到人臉圖像提取的特征之間漢明距最小的人臉圖像對應的注冊用戶,作為人臉圖像認證通過的用戶。
在本發(fā)明中,人臉圖像相似度值可以為漢明距最小的漢明距值。
步驟403和步驟404可以并行進行,也可以倒換順序進行。
步驟405、身份識別服務器將得到的語音數(shù)據認證通過的用戶信息和語音數(shù)據的相似度值,以及得到的人臉圖像認證通過的用戶信息和人臉圖像的相似度值采用MLP進行融合,得到最終是否通過認證的認證結果發(fā)送給移動終端,該最終是否通過認證的認證結果為是否通過認證的信息以及當通過認證時還包括通過認證的用戶信息。
以下舉一個具體實施例說明本發(fā)明。
假設有一款帶有攝像頭和麥克風的移動終端,移動終端的使用密碼為移動終端持有用戶的語音和人臉。
圖5為在移動終端檢測人臉圖像和獲取語音數(shù)據后,將嵌入有語音數(shù)據的人臉圖像發(fā)送的過程示意圖,包括以下步驟步驟501、移動終端通過攝像頭拍攝移動終端持有用戶的圖像,其大小為320毫米(mm)×240mm。
步驟502、移動終端對拍攝的圖像進行檢測和標定,得到人臉的大小和位置,在拍攝的圖像中將人臉圖像標定出來。
步驟503、移動終端切割人臉圖像,將人臉圖像縮放到統(tǒng)一大小128mm×128mm。
步驟504、移動終端通過麥克風獲取移動終端持有用戶讀出的一段指定文本的語音,如指定文本為開機,語音長度為0.9秒且以WAV文件格式保存。
步驟505、移動終端根據G723.1標準對所保存的WAV文件格式的語音數(shù)據進行壓縮,得到壓縮后的語音數(shù)據。
步驟506、移動終端采用RSA加密算法對壓縮后的語音數(shù)據進行加密。
在本發(fā)明中,步驟501~503和步驟504~505可以并行進行,也可以先進行步驟504~506,再進行步驟501~503。
步驟507、移動終端將步驟506得到的語音數(shù)據嵌入到步驟503得到的人臉圖像中。
在嵌入過程中,可以采用基于離散余弦變換的擴展譜通信(SpreedSpectrum Communication)方法。假設人臉圖像為A,語音數(shù)據的長度為k,記為W={wi},i=1,...,k,則具體過程為第一個步驟,計算A的離散余弦變換,取出DCT域中幅值最大的前k個分量{di},i=1,...,k;第二個步驟,語音數(shù)據的嵌入算法為d~i=di(1+awi),]]>其中常數(shù)a為尺度因子,控制水印添加的強度;第三個步驟。用在第二個步驟中得到的DCT域作離散余弦反變換得到嵌入語音數(shù)據的人臉圖像。
步驟508、移動終端將嵌入有語音數(shù)據的人臉圖像通過無線通信網絡的無線傳輸給服務器。
圖6為在身份識別服務器接收到嵌入有語音數(shù)據的人臉圖像后,對移動終端持有用戶進行遠程身份認證的過程示意圖,包括以下步驟步驟601、身份識別服務器按照人臉圖像嵌入語音數(shù)據的逆過程,從嵌入有語音數(shù)據的人臉圖像中提取出壓縮和加密后的語音數(shù)據,將人臉圖像以及壓縮和加密后的語音數(shù)據相分離,按照加密和壓縮語音數(shù)據的逆過程對語音數(shù)據進行解密和解壓縮,得到語音數(shù)據。
人臉圖像認證步驟602、身份識別服務器從人臉圖像中提取LBP直方圖,把所得到的LBP直方圖拉成一個向量Ht。
步驟603、身份識別服務器分別計算向量Ht和所存儲的所有注冊用戶的人臉圖像的特征向量之間漢明距,漢明距最小的人臉圖像對應的注冊用戶為人臉圖像認證通過的用戶,將人臉圖像認證通過的用戶信息和最小漢明距值作為人臉圖像的認證結果。
語音數(shù)據認證步驟604、身份識別服務器從分離出的經過解密和解壓縮的語音數(shù)據提取出MFCC。
步驟605、身份識別服務器將提取出的MFCC作為分別計算出所存儲的所有注冊用戶的HMM的輸出概率,輸出概率值最大的語音數(shù)據對應的注冊用戶為語音數(shù)據認證通過的用戶,將語音數(shù)據認證通過的用戶信息和最大輸出概率值作為語音數(shù)據的認證結果。
在本發(fā)明中,步驟602~步驟603和步驟604~步驟605可以并行進行,也可以先進行步驟604~步驟605,再進行步驟602~步驟603。
步驟606、身份識別服務器對人臉圖像的認證結果和語音數(shù)據的認證結果進行融合,得到最終是否通過認證的認證結果。
步驟607、身份識別服務器將最終是否通過認證的認證結果通過無線通信網絡無線傳輸給移動終端。
這樣,當移動終端接收到最終是否通過認證的認證結果后,就可以根據該最終是否通過認證的認證結果確定是否讓移動終端持有人使用移動終端。
在本發(fā)明中,將多模態(tài)生物特征融合識別的方式作為遠程身份認證的方式對遠程身份進行認證,克服了采用單模態(tài)生物特征識別方式進行身份認證時的信息有限的缺陷,得到更加完備和更加準確的信息。本發(fā)明對多模態(tài)生物特征采用多種不同的識別方法,從而增加了識別信息的維數(shù),提高了遠程身份認證的識別率。本發(fā)明提供的終端可以具有多個信息采集設備,可以采集的生物特征大大增加,使有效的特征信息大大提高。本發(fā)明將語音數(shù)據嵌入到人臉圖像中,提高了傳輸過程的安全性。本發(fā)明在終端上先對語音數(shù)據和人臉圖像進行預處理,提高了進行遠程身份認證的速度。
綜上所述,本發(fā)明采用多模態(tài)生物特征融合識別的方式進行遠程身份認證,可以充分利用多模態(tài)生物特征的優(yōu)點和特征,提升遠程身份認證系統(tǒng)的性能,改進遠程身份認證系統(tǒng)的總體決策和準確性,解決通信系統(tǒng),特別是無線通信系統(tǒng)環(huán)境復雜對遠程身份認證制造的困難。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內所做的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內。
權利要求
1.一種遠程身份認證的系統(tǒng),其特征在于,該系統(tǒng)包括具有檢測人臉圖像和獲取語音數(shù)據功能的終端、通信網絡和身份識別服務器(102),其中,具有檢測人臉圖像和獲取語音數(shù)據功能的終端將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后通過通信網絡發(fā)送給身份識別服務器(102),身份認證服務器(102)對接收到的嵌入有語音數(shù)據的人臉圖像進行分離,對分離得到的人臉圖像和語音數(shù)據分別進行認證后融合,得到最終是否通過認證的認證結果,發(fā)送給終端。
2.如權利要求1所述的系統(tǒng),其特征在于,所述具有檢測人臉圖像和獲取語音數(shù)據功能的終端還包括身份識別模塊(100a)和與其連接的數(shù)據發(fā)送/接收模塊(100b),其中,身份識別模塊(100a)將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后發(fā)送給數(shù)據發(fā)送/接收模塊(100b),由數(shù)據發(fā)送/接收模塊(100b)通過通信網絡發(fā)送給身份認證服務器(102);或者數(shù)據發(fā)送/接收模塊(100b)通過通信網絡接收身份認證服務器(102)發(fā)送的最終是否通過認證的認證結果。
3.如權利要求2述的系統(tǒng),其特征在于,所述身份識別模塊(100a)還包括生物特征獲取模塊(100a1)和生物特征數(shù)據預處理模塊(100a2),其中,生物特征獲取模塊(100a1)通過攝像頭拍攝圖像且通過麥克風獲取語音數(shù)據后,發(fā)送給生物特征數(shù)據預處理模塊(100a2);生物特征數(shù)據預處理模塊(100a2)對接收到的圖像進行檢測和標定,檢測到人臉圖像,對接收到的語音數(shù)據進行壓縮和加密,采用水印方式將壓縮和加密的語音數(shù)據嵌入到檢測到的人臉圖像中后,發(fā)送給數(shù)據發(fā)送/接收模塊(100b)。
4.如權利要求1所述的系統(tǒng),其特征在于,所述身份認證服務器(102)還包括人臉圖像數(shù)據庫(103)、語音數(shù)據庫(104)、多模態(tài)生物特征數(shù)據分離模塊(105)、人臉圖像識別模塊(106)、語音數(shù)據識別模塊(107)、數(shù)據融合模塊(108)和認證結果發(fā)送模塊(109),其中,多模態(tài)生物特征數(shù)據分離模塊(105)用于將通過通信網絡接收到嵌入有語音數(shù)據的人臉圖像進行分離,得到語音數(shù)據和人臉圖像后分別發(fā)送給語音數(shù)據識別模塊(107)和人臉圖像識別模塊(106);語音數(shù)據識別模塊(107)用于根據語音數(shù)據庫(104)中存儲的注冊用戶的語音數(shù)據對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的語音數(shù)據進行認證,將語音數(shù)據的認證結果發(fā)送給數(shù)據融合模塊(108);人臉圖像識別模塊(106)用于根據人臉圖像數(shù)據庫(103)中存儲的注冊用戶的人臉圖像對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的人臉圖像進行認證,將人臉圖像認證結果發(fā)送給數(shù)據融合模塊(108);數(shù)據融合模塊(108)用于將從語音數(shù)據識別模塊(107)接收到的語音數(shù)據認證結果和從人臉圖像識別模塊(106)接收到的人臉圖像認證結果進行融合,得到最終是否通過認證的認證結果發(fā)送給認證結果發(fā)送模塊(109);認證結果發(fā)送模塊(109)用于將從數(shù)據融合模塊(108)接收到的最終是否通過認證的認證結果通過通信網絡發(fā)送給具有檢測人臉圖像和獲取語音數(shù)據功能的終端。
5.如權利要求4所述的系統(tǒng),其特征在于,所述語音數(shù)據庫(104)還包括注冊用戶聲音數(shù)據模塊(104a)和聲音嵌入式隱馬爾可夫模型HMM數(shù)據庫(104b),其中,注冊用戶聲音數(shù)據模塊(104a)用于注冊用戶聲音的提取,將注冊用戶聲音中的Me1頻率倒普參數(shù)MFCC作為語音的特征參數(shù)發(fā)送給聲音HMM數(shù)據庫(104b);聲音HMM模型數(shù)據庫(104b)用于采用HMM對接收到的語音的特征參數(shù)進行訓練,得到注冊用戶的語音數(shù)據。
6.如權利要求4所述的系統(tǒng),其特征在于,所述人臉圖像數(shù)據庫(103)還包括注冊用戶人臉特征數(shù)據模塊(103a)和人臉特征數(shù)據庫(103b),其中,注冊用戶人臉特征數(shù)據模塊(103a)用于人臉特征數(shù)據的提取,得到注冊用戶的人臉特征數(shù)據發(fā)送給人臉特征數(shù)據庫(103b);人臉特征數(shù)據庫(103b)用于將從人臉特征數(shù)據庫(103b)接收到的注冊用戶的人臉特征數(shù)據取優(yōu),得到注冊用戶的人臉圖像。
7.如權利要求1、2或4所述的系統(tǒng),其特征在于,所述的終端為移動終端(100);所述的通信網絡為無線通信網絡(101)。
8.一種遠程身份認證的終端,其特征在于,該終端包括身份識別模塊(100a)和與其連接的數(shù)據發(fā)送/接收模塊(100b),其中,身份識別模塊(100a)將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后發(fā)送給數(shù)據發(fā)送/接收模塊(100b),由數(shù)據發(fā)送/接收模塊(100b)通過通信網絡發(fā)送給身份認證服務器(102);或者數(shù)據發(fā)送/接收模塊(100b)通過通信網絡接收身份認證服務器(102)發(fā)送的最終是否通過認證的認證結果。
9.如權利要求8述的終端,其特征在于,所述身份識別模塊(100a)還包括生物特征獲取模塊(100a1)和生物特征數(shù)據預處理模塊(100a2),其中,生物特征獲取模塊(100a1)通過攝像頭拍攝圖像且通過麥克風獲取語音數(shù)據后,發(fā)送給生物特征數(shù)據預處理模塊(100a2);生物特征數(shù)據預處理模塊(100a2)對接收到的圖像進行檢測和標定,檢測到人臉圖像,對接收到的語音數(shù)據進行壓縮和加密,采用水印方式將壓縮和加密的語音數(shù)據嵌入到檢測到的人臉圖像中后,發(fā)送給數(shù)據發(fā)送/接收模塊(100b)。
10.一種遠程身份認證的服務器,其特征在于,包括人臉圖像數(shù)據庫(103)、語音數(shù)據庫(104)、多模態(tài)生物特征數(shù)據分離模塊(105)、人臉圖像識別模塊(106)、語音數(shù)據識別模塊(107)、數(shù)據融合模塊(108)和認證結果發(fā)送模塊(109),其中,多模態(tài)生物特征數(shù)據分離模塊(105)用于將通過通信網絡接收到嵌入有語音數(shù)據的人臉圖像進行分離,得到語音數(shù)據和人臉圖像后分別發(fā)送給語音數(shù)據識別模塊(107)和人臉圖像識別模塊(106);語音數(shù)據識別模塊(107)用于根據語音數(shù)據庫(104)中存儲的注冊用戶的語音數(shù)據對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的語音數(shù)據進行認證,將語音數(shù)據的認證結果發(fā)送給數(shù)據融合模塊(108);人臉圖像識別模塊(106)用于根據人臉圖像數(shù)據庫(103)中存儲的注冊用戶的人臉圖像對從多模態(tài)生物特征數(shù)據分離模塊(105)接收到的人臉圖像進行認證,將人臉圖像認證結果發(fā)送給數(shù)據融合模塊(108);數(shù)據融合模塊(108)用于將從語音數(shù)據識別模塊(107)接收到的語音數(shù)據認證結果和從人臉圖像識別模塊(106)接收到的人臉圖像認證結果進行融合,得到最終是否通過認證的認證結果發(fā)送給認證結果發(fā)送模塊(109);認證結果發(fā)送模塊(109)用于將從數(shù)據融合模塊(108)接收到的最終是否通過認證的認證結果通過通信網絡發(fā)送給具有檢測人臉圖像和獲取語音數(shù)據功能的終端。
11.如權利要求10所述的服務器,其特征在于,所述語音數(shù)據庫(104)還包括注冊用戶聲音數(shù)據模塊(104a)和聲音嵌入式隱馬爾可夫模型HMM數(shù)據庫(104b),其中,注冊用戶聲音數(shù)據模塊(104a)用于注冊用戶聲音的提取,將注冊用戶聲音中的Me1頻率倒普參數(shù)MFCC作為語音的特征參數(shù)發(fā)送給聲音HMM數(shù)據庫(104b);聲音HMM模型數(shù)據庫(104b)用于采用HMM對接收到的語音的特征參數(shù)進行訓練,得到注冊用戶的語音數(shù)據。
12.如權利要求10所述的服務器,其特征在于,所述人臉圖像數(shù)據庫(103)還包括注冊用戶人臉特征數(shù)據模塊(103a)和人臉特征數(shù)據庫(103b),其中,注冊用戶人臉特征數(shù)據模塊(103a)用于人臉特征數(shù)據的提取,得到注冊用戶的人臉特征數(shù)據發(fā)送給人臉特征數(shù)據庫(103b);人臉特征數(shù)據庫(103b)用于將從人臉特征數(shù)據庫(103b)接收到的注冊用戶的人臉特征數(shù)據取優(yōu),得到注冊用戶的人臉圖像。
13.一種遠程身份認證的方法,其特征在于,該方法包括A、終端獲取進行認證的用戶的人臉圖像和語音數(shù)據后,采用水印方式將語音數(shù)據嵌入到人臉圖像中發(fā)送給身份識別服務器;B、身份識別服務器將接收到的嵌入有語音數(shù)據的人臉圖像進行分離,分離得到語音數(shù)據和人臉圖像,語音數(shù)據認證轉入C,人臉圖像認證轉入D;C、身份識別服務器確定得到的語音數(shù)據為存儲的其中一個注冊用戶的語音數(shù)據,得到語音數(shù)據認證通過的用戶信息和語音數(shù)據相似程度值,轉入步驟E;D、身份識別服務器確定得到的人臉圖像為存儲的其中一個注冊用戶的人臉圖像,得到人臉圖像認證通過的用戶信息和人臉圖像相似程度值,轉入步驟E;E、身份識別服務器將得到的語音數(shù)據認證通過的用戶信息和語音數(shù)據的相似度值,以及得到的人臉圖像認證通過的用戶信息和人臉圖像的相似度值進行融合,得到最終是否通過認證的認證結果發(fā)送給終端。
14.如權利要求13所述的方法,其特征在于,步驟A所述終端獲取需要進行認證的用戶的人臉圖像和語音數(shù)據的過程為采用攝像頭拍攝進行認證的用戶的圖像,對所拍攝的圖像進行檢測和標定,得到人臉圖像;采用麥克風獲取進行認證的用戶的語音數(shù)據,對語音數(shù)據進行壓縮和加密。
15.如權利要求14所述的方法,其特征在于,所述對所拍攝的圖像進行檢測和標定,得到人臉圖像的過程為對所拍攝的圖像進行人臉檢測后,將檢測到的人臉在獲取到的圖像中標定出來并切割出人臉圖標。
16.如權利要求13所述的方法,其特征在于,步驟B所述分離得到語音數(shù)據的過程為對語音數(shù)據進行解碼和解壓縮后,分離得到語音數(shù)據。
17.如權利要求13所述的方法,其特征在于,步驟C所述語音數(shù)據相似程度值為概率最大的輸出概率值;步驟C所述得到語音數(shù)據認證通過的用戶信息和語音數(shù)據相似程度值的過程為將接收到的語音數(shù)據作為輸入,采用維比特算法計算出與所存儲的每個注冊用戶之間的輸出概率,所存儲的輸出概率最大的語音數(shù)據對應的注冊用戶為語音數(shù)據認真通過的用戶,得到該用戶信息和輸出概率最大的數(shù)據概率值。
18.如權利要求13所述的方法,其特征在于,步驟D所述人臉圖像相似程度值為漢明距最小的漢明距值,步驟D所述的得到人臉圖像認證通過的用戶信息和人臉圖像相似程度值的過程為將接收到的人臉圖像提取特征與所存儲的每個注冊用戶的人臉圖像的特征進行比較,將所存儲的與接收到人臉圖像提取的特征之間漢明距最小的人臉圖像對應的注冊用戶,作為人臉圖像認證通過的用戶,得到該用戶信息和漢明距最小的漢明距值。
19.如權利要求13所述的方法,其特征在于,步驟E所述的融合是通過多層感知機MLP進行的。
全文摘要
本發(fā)明公開了一種遠程身份認證的系統(tǒng)、終端、服務器和方法,該系統(tǒng)包括具有檢測人臉圖像和獲取語音數(shù)據功能的終端、通信網絡和身份識別服務器(102),其中,具有檢測人臉圖像和獲取語音數(shù)據功能的終端將獲取到的語音數(shù)據嵌入到檢測到的人臉圖像后通過通信網絡發(fā)送給身份識別服務器(102),身份認證服務器(102)對接收到的嵌入有語音數(shù)據的人臉圖像進行分離,對分離得到的人臉圖像和語音數(shù)據分別進行認證后融合,得到最終是否通過認證的認證結果,發(fā)送給終端。本發(fā)明提高了遠程身份認證的識別率和安全性。
文檔編號H04L9/00GK101075868SQ20061008102
公開日2007年11月21日 申請日期2006年5月19日 優(yōu)先權日2006年5月19日
發(fā)明者何江水, 莊鎮(zhèn)泉, 王先基, 李斌, 王睿斌 申請人:華為技術有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
疏勒县| 富蕴县| 和静县| 广南县| 临高县| 莎车县| 老河口市| 临沂市| 平陆县| 砚山县| 巴塘县| 自贡市| 镇原县| 皮山县| 五寨县| 保亭| 江孜县| 天全县| 肥城市| 南城县| 抚顺县| 西畴县| 汉阴县| 延吉市| 黎城县| 东乡县| 皋兰县| 博兴县| 东安县| 房产| 崇仁县| 屯门区| 东莞市| 莱阳市| 阿尔山市| 丽江市| 墨玉县| 曲阜市| 松阳县| 田东县| 东明县|