語音多級身份驗證方法
【技術領域】
[0001] 本發(fā)明涉及一種身份驗證方法,特別是一種語音多級身份驗證方法。
【背景技術】
[0002] 隨著通訊技術和計算機網(wǎng)絡的飛速發(fā)展,顧客可以用電話或網(wǎng)絡接受金融、購物、 查詢等日常服務。銀行等機構(gòu)在提供服務前需鑒定顧客的身份,以便防止假冒者入侵。用戶 名和密碼等身份驗證信息容易泄漏,造成安全隱患?;谌说纳砗托袨樘卣鞯纳锷矸?鑒別認證技術,是近年來發(fā)展起來的一門高新技術,它是利用與生倶來的生理和行為特征 來鑒別每個人的真實身份,可杜絕信息泄漏,大大降低假冒或者惡意攻擊的侵入危險。與傳 統(tǒng)的以"物"(密碼、鑰匙、磁卡等)進行身識別技術相比,這種技術具有更好的安全性和準 確性,能克服傳統(tǒng)方法中的丟失、盜用、復制等缺點,隨著計算機技術和信息化社會的發(fā)展, 說話人識別技術憑借其簡單、方便、經(jīng)濟及可擴展性等良好的優(yōu)勢,將會有更加廣闊的市場 應用前景。
[0003] 具體來說,說話人辨識就是判定待測說話人的語音屬于多個參考說話人之中的某 一個,每一次辨識需要將待測語音去匹配所有說話人的參考模型,找出最相近模型所對應 的說話人作為辨識結(jié)果,這樣必然導致注冊人數(shù)越多,花費時間越長,當注冊人數(shù)達到一定 數(shù)量后,系統(tǒng)很難做到實時響應。對此一些學者提出了自己的解決方案,例如利用模型距離 定義類模型,識別時先進行類模型識別,然后在對應的類模型中尋找目標說話人。例如用 GMM模型的KL距離,把相似的說話人聚在一起等等方法。這些方法共同特點是利用GMM 模型定義距離,其缺點是首先要訓練每個說話人的GMM模型,且GMM模型是一種概率統(tǒng)計模 型,隨著注冊說話人的增多,提取的語音特征矢量之間重疊較為嚴重,用GMM模型進行識別 時,識別率下降很快。而PCA分類器不需要訓練,直接可由語音特征矢量求得,實現(xiàn)比較快 速、簡單。且SVM是一種基于結(jié)構(gòu)風險最小化原則的模式分類方法,在處理樣本中非線性、 高維數(shù)問題時有很大的優(yōu)勢,應用在基于語音特征樣本的說話人識別上有良好的效果,不 會隨著注冊說話人的增多而識別率下降。
【發(fā)明內(nèi)容】
[0004] 為了克服現(xiàn)有技術的不足,本發(fā)明提供一種語音多級身份驗證方法。
[0005] 本發(fā)明解決其技術問題所采用的技術方案是:
[0006] -種語音多級身份驗證方法,其特征在于:包括,
[0007] 步驟一,首先建立[nX (n_l)]/2個一對一的一級注冊說話人模型,
[0008] 步驟二,用PCA分類方式對待測語音進行粗分類,取采用PCA分類方式粗判決得 出的M個說話人作為進一步的目標說話人,
[0009] 步驟三,然后從建立好的一級說話人模型中的數(shù)據(jù)庫中提取此M個說話人再次構(gòu) 建[MX (M_l)]/2個二級注冊說話人模型,在這些模型中做出最終的判決。
[0010] 所述步驟二中采用PCA分類方式對待測語音進行粗分類的所用公式在于: CN 105118510 A 說明書 2/3 頁
[0012] 上述公式中,WsR表模型空間,s = 1,2,…,η,η為注冊的說話人人數(shù),λ為原向 量向其投影后保留的方差總和,通過上述計算,并提取特征矢量X,計算在子空間的投影方 差:
[0013] λ3= Il (Ws)T(X_ms) ||2,取方差最大的前M個說話人作為預選的目標說話人。
[0014] 本發(fā)明的有益效果是:傳統(tǒng)的識別方法是將待測語音輸入到建立的模型中,需 要判決[nX(n-l)]/2個建立的模型,而本申請?zhí)岢龅谋孀R方法,根據(jù)預判決只需判決 [MX (M-l)]/2個二級注冊說話人模型,大大減少了預判決的二級注冊說話人模型個數(shù),從 而大大提高了辨識速度。
【附圖說明】
[0015] 下面結(jié)合附圖和實施例對本發(fā)明進一步說明。
[0016] 圖1是PCA分類方式的流程示意框圖。
【具體實施方式】
[0017] 本文提出的多級說話人辨識方法有效地解決了辨識速度低的問題,按如下步驟:
[0018] 步驟一,首先建立[nX (n_l)]/2個一對一的一級注冊說話人模型,
[0019] 步驟二,用PCA分類方式對待測語音進行粗分類,取采用PCA分類方式粗判決得 出的M個說話人作為進一步的目標說話人,
[0020] 步驟三,然后從建立好的一級說話人模型中的數(shù)據(jù)庫中提取此M個說話人再次構(gòu) 建[MX (M_l)]/2個二級注冊說話人模型,在這些模型中做出最終的判決。
[0021] 結(jié)合附圖1的說明,PCA分類方式具體為:對每一個注冊的說話人,在上述的PCA 降維中,得到了 ?〇4的1;3(8 = 1,2,…,n,n為注冊的說話人人數(shù)),在此組成分子空間,使 得原向量向其投影后保留的方差總和最大,保留的方差總和為
[0023] 對于一段待判決的語音信號,用PCA作為粗分類,首先對其預處理,并提取特征 矢量X,計算在子空間的投影方差:λ3= Il (Ws)T(X-ms) ||2,根據(jù)PCA的分類依據(jù),X在正 確子空間的投影應該比在別的子空間上的投影方差大,為了減少識別誤差,取方差最大的 前M個說話人作為預選的目標說話人。
[0024] 根據(jù)預判決的結(jié)果,從訓練好的二級注冊說話人庫中,提取此M個說話人之間的 二級注冊說話人模型,再用待測語音的特征參數(shù)作為二級注冊說話人的輸入,用投票法做 出最終的判決。
[0025] 以上對本發(fā)明實施例所提供的一種語音多級身份驗證方法,進行了詳細介紹,本 文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于 幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本發(fā)明的思 想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應理解為對 本發(fā)明的限制。
【主權(quán)項】
1. 一種語音多級身份驗證方法,其特征在于:包括, 步驟一,首先建立[nX(n-l)]/2個一對一的一級注冊說話人模型, 步驟二,用PCA分類方式對待測語音進行粗分類,取采用PCA分類方式粗判決得出的M個說話人作為進一步的目標說話人, 步驟三,然后從建立好的一級說話人模型中的數(shù)據(jù)庫中提取此M個說話人再次構(gòu)建[MX(M-l)]/2個二級注冊說話人模型,在這些模型中做出最終的判決。2. 根據(jù)權(quán)利要求1所述的語音多級身份驗證方法,其特征在于:所述步驟二中采用PCA 分類方式對待測語音進行粗分類的所用公式在于:A. = 入即:上述公式中,Ws代表模型空間,s= 1,2,…,n,n為注冊的說話人人數(shù),A為原向量向 其投影后保留的方差總和,通過上述計算,并提取特征矢量X,計算在子空間的投影方差: 入s= !! (ws)T(x_ms) ||2,取方差最大的前m個說話人作為預選的目標說話人。
【專利摘要】本發(fā)明公開了一種語音多級身份驗證方法,傳統(tǒng)的識別方法是將待測語音輸入到建立的模型中,需要判決[n×(n-1)]/2個建立的模型,而本申請?zhí)岢龅谋孀R方法,根據(jù)預判決只需判決[M×(M?-1)]/2個二級注冊說話人模型,大大減少了預判決的二級注冊說話人模型個數(shù),從而大大提高了辨識速度。
【IPC分類】H04L29/06, G10L17/02
【公開號】CN105118510
【申請?zhí)枴緾N201510439438
【發(fā)明人】劉雪燕, 袁寶玲
【申請人】中山火炬職業(yè)技術學院
【公開日】2015年12月2日
【申請日】2015年7月23日