1.一種基于DBSCAN算法的聲紋識別方法,其特征在于,包括如下步驟:
步驟1,獲取檢驗語音和某說話人的訓練集語音,訓練集語音包含預設的偶數個訓練語音,利用mel倒譜系數分別對訓練集語音和檢驗語音進行語音特征提取,得到各自對應的語音特征向量;
步驟2,對步驟1得到的訓練集語音的語音特征向量,利用基于余弦相似度的分組篩選方法進行篩選,當經過篩選后得到的語音特征向量的個數少于步驟1的預設值時,繼續(xù)獲取訓練語音,并進行語音特征提取和篩選,直至最后得到的語音特征向量的個數滿足步驟1的預設值;
步驟3,利用改進的DBSCAN算法對檢驗語音進行識別,在改進的DBSCAN算法中,利用距離參數計算檢驗語音與訓練語音是否相似的閾值時,定義距離參數為利用區(qū)間估計計算該閾值時的置信區(qū)間的大小。
2.根據權利要求1所述基于DBSCAN算法的聲紋識別方法,其特征在于,所述步驟1的具體過程為:根據奈奎斯特采樣定律對訓練語音進行依次采樣并存儲,得到訓練集語音;利用mel倒譜系數分別對訓練集語音和檢驗語音進行語音特征提取,得到各自對應的特征系數,將特征系數矢量化,從而得到各自對應的語音特征向量。
3.根據權利要求1所述基于DBSCAN算法的聲紋識別方法,其特征在于,步驟2所述對步驟1得到的訓練集語音的語音特征向量,利用基于余弦相似度的分組篩選方法進行篩選的具體過程為:將步驟1得到的訓練集語音的語音特征向量按順序標號,并以標號的奇偶分為兩組,計算每組中各語音特征向量與其他語音特征向量的余弦相似度,并將余弦相似度轉化為角度值,判斷每組中各角度值與其他角度值之間的差值,當差值小于等于固定閾值時,則將該角度值對應的語音特征向量保留;否則,不保留。
4.根據權利要求1所述基于DBSCAN算法的聲紋識別方法,其特征在于,所述步驟3的具體過程為:利用檢驗語音的語音特征向量與步驟2得到的各訓練語音的語音特征向量,計算檢驗語音與各訓練語音的余弦相似度,并將余弦相似度轉化為角度值;當判斷檢驗語音與其中一條訓練語音是否相似時,利用距離參數計算檢驗語音與該訓練語音是否相似的閾值,該閾值表示為其中,Y表示閾值,a表示距離參數對應于標準正態(tài)分布的橫坐標,μ、σ分別表示該訓練語音與其他訓練語音之間的余弦相似度對應的角度值的平均值和標準差,判斷檢驗語音與該訓練語音的余弦相似度對應的角度值是否小于等于該訓練語音對應的閾值,如果是,則認為檢驗語音與該訓練語音相似,否則不相似;當相似的訓練語音個數大于等于設定閾值時,認為檢驗語音與訓練語音的說話人匹配,否則不匹配。
5.根據權利要求1或4所述基于DBSCAN算法的聲紋識別方法,其特征在于,所述余弦相似度的計算公式為:
其中,Ai表示第一個語音特征向量第i維的數值,Bi表示第二個語音特征向量第i維的數值,θ表示要計算的兩條語音之間的余弦相似度對應的角度值,m表示各語音特征向量的維度。