欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

訓(xùn)練聲紋識(shí)別系統(tǒng)的方法和裝置與流程

文檔序號(hào):12368777閱讀:401來(lái)源:國(guó)知局
訓(xùn)練聲紋識(shí)別系統(tǒng)的方法和裝置與流程

本發(fā)明涉及聲紋識(shí)別技術(shù)領(lǐng)域,特別涉及一種訓(xùn)練聲紋識(shí)別系統(tǒng)的方法和裝置。



背景技術(shù):

聲紋識(shí)別是生物識(shí)別技術(shù)的一種,通過(guò)對(duì)語(yǔ)音進(jìn)行處理可生成用于指示該語(yǔ)音輸入者身份信息的身份向量,可通過(guò)計(jì)算兩段語(yǔ)音的身份向量之間的相似度來(lái)確定這兩段語(yǔ)音的輸入者是否為同一用戶。

語(yǔ)音易受到信道易變性和環(huán)境易變性的干擾導(dǎo)致其身份向量畸變。相關(guān)技術(shù)中,假設(shè)同一用戶的若干段語(yǔ)音在空間中的分布為多維高斯分布,利用線性區(qū)分分析(英文:linear discriminant analysis,LDA)對(duì)身份向量進(jìn)行處理,補(bǔ)償身份向量的畸變進(jìn)而提高聲紋識(shí)別的準(zhǔn)確率。

然而,在實(shí)際實(shí)現(xiàn)時(shí),同一用戶的若干段語(yǔ)音在空間中的分布難以呈現(xiàn)理想的多維高斯分布,因此利用經(jīng)過(guò)LDA處理后的身份向量進(jìn)行聲紋識(shí)別準(zhǔn)確率的提高程度低。



技術(shù)實(shí)現(xiàn)要素:

為了解決現(xiàn)有技術(shù)中利用經(jīng)過(guò)LDA處理后的身份向量進(jìn)行聲紋識(shí)別準(zhǔn)確率的提高程度低的問(wèn)題,本發(fā)明實(shí)施例提供了一種訓(xùn)練聲紋識(shí)別系統(tǒng)的方法和裝置。所述技術(shù)方案如下:

第一方面,提供了一種訓(xùn)練聲紋識(shí)別系統(tǒng)的方法,所述方法包括:計(jì)算機(jī)系統(tǒng)確定出語(yǔ)音訓(xùn)練集合中每段語(yǔ)音的身份向量,將所述確定出的身份向量中同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別;所述計(jì)算機(jī)系統(tǒng)建立用于計(jì)算與每一類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù),所述第一數(shù)值為對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的第一身份向量與所述對(duì)應(yīng)類別內(nèi)利用所述規(guī)整矩陣規(guī)整后的其他身份向量之間相似度的總和,所述第一函數(shù)的隨機(jī)變量為所述規(guī)整矩陣,所述規(guī)整矩陣被用于左乘身份向量來(lái)規(guī)整所述身份向量;所述計(jì)算機(jī)系統(tǒng)確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣;所述計(jì)算機(jī)系統(tǒng)利用確定出的規(guī)整矩陣規(guī)整聲紋識(shí)別系統(tǒng)中獲取的語(yǔ)音的身份向量。

由于計(jì)算機(jī)系統(tǒng)確定出的規(guī)整矩陣使各個(gè)類別的第一數(shù)值的總和最大化,同一個(gè)用戶的不同段的語(yǔ)音的身份向量在利用規(guī)整矩陣進(jìn)行規(guī)整后相似度提高,解決了相關(guān)技術(shù)中利用經(jīng)過(guò)LDA處理后的身份向量進(jìn)行聲紋識(shí)別準(zhǔn)確率的提高程度低的問(wèn)題,提高了聲紋識(shí)別的準(zhǔn)確率。

第二方面,提供了一種訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置,所述裝置包括:分類模塊,用于確定出語(yǔ)音訓(xùn)練集合中每段語(yǔ)音的身份向量,將所述確定出的身份向量中同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別;建立模塊,用于建立用于計(jì)算與每一類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù),所述第一數(shù)值為對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的第一身份向量與所述對(duì)應(yīng)類別內(nèi)利用所述規(guī)整矩陣規(guī)整后的其他身份向量之間相似度的總和,所述第一函數(shù)的隨機(jī)變量為所述規(guī)整矩陣,所述規(guī)整矩陣被用于左乘身份向量來(lái)規(guī)整所述身份向量;確定模塊,用于確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣;規(guī)整模塊,用于利用所述確定模塊確定出的規(guī)整矩陣規(guī)整聲紋識(shí)別系統(tǒng)中獲取的語(yǔ)音的身份向量。

附圖說(shuō)明

為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明一個(gè)實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的方法流程圖;

圖2A是本發(fā)明另一個(gè)實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的方法流程圖;

圖2B是本發(fā)明另一個(gè)實(shí)施例中提供的建立第一函數(shù)的流程圖;

圖2C是本發(fā)明另一個(gè)實(shí)施例中提供的確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣的流程圖;

圖2D是本發(fā)明另一個(gè)實(shí)施例中提供的利用聲紋識(shí)別系統(tǒng)對(duì)語(yǔ)音的輸入者的身份進(jìn)行識(shí)別的流程圖;

圖2E是本發(fā)明另一個(gè)實(shí)施例中提供的聲紋識(shí)別系統(tǒng)的使用階段示意圖;

圖3是本發(fā)明一個(gè)實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置的框圖;

圖4是本發(fā)明一個(gè)實(shí)施例提供的聲紋識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。

語(yǔ)音易受到信道易變性和環(huán)境易變性的干擾,導(dǎo)致聲紋識(shí)別系統(tǒng)為其生成的身份向量畸變,降低了聲紋識(shí)別系統(tǒng)的識(shí)別準(zhǔn)確率。本發(fā)明實(shí)施例一和實(shí)施例二提供了訓(xùn)練聲紋識(shí)別系統(tǒng)的方法,為聲紋識(shí)別系統(tǒng)訓(xùn)練出規(guī)整矩陣。聲紋識(shí)別系統(tǒng)可利用訓(xùn)練出的規(guī)整矩陣對(duì)身份向量進(jìn)行規(guī)整,來(lái)補(bǔ)償身份向量的畸變。

實(shí)施例一

圖1是本發(fā)明一個(gè)實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的方法流程圖,如圖1所示,該訓(xùn)練聲紋識(shí)別系統(tǒng)的方法可以包括如下幾個(gè)步驟:

步驟101,計(jì)算機(jī)系統(tǒng)確定出語(yǔ)音訓(xùn)練集合中每段語(yǔ)音的身份向量,將確定出的身份向量中同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別。

步驟102,計(jì)算機(jī)系統(tǒng)建立用于計(jì)算與每一類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù),第一數(shù)值為對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的第一身份向量與該對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的其他身份向量之間相似度的總和,第一函數(shù)的隨機(jī)變量為規(guī)整矩陣,規(guī)整矩陣被用于左乘身份向量來(lái)規(guī)整該身份向量。

步驟103,計(jì)算機(jī)系統(tǒng)確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣。

步驟104,計(jì)算機(jī)系統(tǒng)在聲紋識(shí)別系統(tǒng)中利用確定出的規(guī)整矩陣規(guī)整每段語(yǔ)音的身份向量。

綜上所述,本實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的方法,通過(guò)將同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別,建立用于計(jì)算一個(gè)類別內(nèi)規(guī)整后的第一身份向量與該類別內(nèi)的規(guī)整后的其他身份向量之間相似度的總和的第一函數(shù),第一函數(shù)的函數(shù)值為第一數(shù)值,確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣,完成了聲紋識(shí)別系統(tǒng)的訓(xùn)練。由于確定出的規(guī)整矩陣使各個(gè)類別的第一數(shù)值的總和最大化,同一個(gè)用戶的不同段的語(yǔ)音的身份向量在利用規(guī)整矩陣進(jìn)行規(guī)整后相似度提高,解決了相關(guān)技術(shù)中利用經(jīng)過(guò)LDA處理后的身份向量進(jìn)行聲紋識(shí)別準(zhǔn)確率的提高程度低的問(wèn)題,提高了聲紋識(shí)別的準(zhǔn)確率。

實(shí)施例二

圖2A是本發(fā)明另一個(gè)實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的方法流程圖,如圖2A所示,該訓(xùn)練聲紋識(shí)別系統(tǒng)的方法可以包括如下幾個(gè)步驟:

步驟201,計(jì)算機(jī)系統(tǒng)確定出語(yǔ)音訓(xùn)練集合中每段語(yǔ)音的身份向量,將確定出的身份向量中同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別。

一般來(lái)講,對(duì)于一個(gè)用戶,記錄或收集該用戶的至少兩段語(yǔ)音,并將這些記錄到或收集到的語(yǔ)音添加至語(yǔ)音訓(xùn)練集合中,該語(yǔ)音訓(xùn)練集合中至少包含兩個(gè)用戶的語(yǔ)音。

進(jìn)一步的,計(jì)算機(jī)系統(tǒng)對(duì)語(yǔ)音訓(xùn)練集合中的每段語(yǔ)音進(jìn)行處理,生成用于指示該段語(yǔ)音輸入者身份信息的身份向量,并將語(yǔ)音訓(xùn)練集合中同一個(gè)用戶的語(yǔ)音的身份向量劃分為一個(gè)類別。

計(jì)算機(jī)系統(tǒng)從語(yǔ)音中提取特征,根據(jù)提取出的特征生成身份向量可通過(guò)多種方式實(shí)現(xiàn),并且為本領(lǐng)域普通技術(shù)人員所能實(shí)現(xiàn)的,本實(shí)施對(duì)此不再贅述。

舉例來(lái)講,語(yǔ)音訓(xùn)練集合由m個(gè)用戶的語(yǔ)音組成,這m個(gè)用戶可以分別利用用戶1、用戶2…用戶m-1以及用戶m來(lái)表示。計(jì)算機(jī)系統(tǒng)將用戶1的各段語(yǔ)音所對(duì)應(yīng)的身份向量劃分至類別1,并利用C1表示類別1內(nèi)的身份向量的集合;計(jì)算機(jī)系統(tǒng)將用戶2的各段語(yǔ)音所對(duì)應(yīng)的身份向量劃分至類別2,并利用C2表示類別2內(nèi)的身份向量的集合;計(jì)算機(jī)系統(tǒng)將用戶m的各段語(yǔ)音所對(duì)應(yīng)的身份向量劃分至類別m,利用Cm表示類別m內(nèi)的身份向量的集合,其他用戶依次類推。

步驟202,計(jì)算機(jī)系統(tǒng)建立用于計(jì)算與每一類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù),第一數(shù)值為對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的第一身份向量與該對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的其他身份向量之間相似度的總和,該第一函數(shù)的隨機(jī)變量為規(guī)整矩陣。

對(duì)于任一類別,計(jì)算機(jī)系統(tǒng)需要為該類別建立用于計(jì)算該類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù)。舉例來(lái)講,對(duì)于類別1,需要建立用于計(jì)算類別1對(duì)應(yīng)的第一數(shù)值的第一函數(shù),類別1對(duì)應(yīng)的第一數(shù)值為用戶1內(nèi)的第一身份向量與用戶1內(nèi)的其他身份向量之間的相似度的總和;再舉例來(lái)講,對(duì)于類別2,需要建立用于計(jì)算類別2對(duì)應(yīng)的第一數(shù)值的第一函數(shù),類別2對(duì)應(yīng)的第一數(shù)值為用戶2內(nèi)的第一身份向量與用戶2內(nèi)的其他身份向量之間的相似度的總和,其他類別的對(duì)應(yīng)的第一函數(shù)依次類推。

進(jìn)一步的,計(jì)算機(jī)系統(tǒng)在建立某一個(gè)類別對(duì)應(yīng)的第一函數(shù)時(shí),從該類別的身份向量中隨機(jī)確定出一個(gè)身份向量作為第一身份向量,建立用于計(jì)算規(guī)整后的第一身份向量與該類別內(nèi)規(guī)整后的其他身份向量之間的相似度總和的第一函數(shù)。

這里所講的其他身份向量通常為該類別內(nèi)與第一身份向量不相同的身份向量。

舉例來(lái)講,類別1內(nèi)的身份向量包括w1、w2、…w6,當(dāng)計(jì)算機(jī)系統(tǒng)從類別1內(nèi)選擇身份向量w3作為第一身份向量時(shí),這里所講的其他身份向量包括身份向量w1、身份向量w2、身份向量w4、身份向量w5和身份向量w6。

對(duì)應(yīng)的,在建立類別1對(duì)應(yīng)的第一函數(shù)時(shí),在隨機(jī)選擇的結(jié)果為身份向量w3的情況下,建立用于計(jì)算規(guī)整后的w1與規(guī)整后的w3之間相似度、規(guī)整后的w2與規(guī)整后的w3之間相似度、規(guī)整后的w3與規(guī)整后的w4之間相似度、規(guī)整后的w3與規(guī)整后的w5之間相似度以及規(guī)整后的w3與規(guī)整后的w6之間相似度的總和的第一函數(shù)。

圖2B是本發(fā)明提供的建立第一函數(shù)的流程圖??蛇x的,本步驟可以通過(guò)如圖2B所示的幾個(gè)子步驟實(shí)現(xiàn)。

步驟202a,對(duì)于任一類別,計(jì)算機(jī)系統(tǒng)從該類別內(nèi)的其他身份向量中確定出至少一個(gè)第二身份向量,利用該類別內(nèi)規(guī)整后的第一身份向量減去該類別內(nèi)規(guī)整后的第二身份向量得到第一向量差,將該第一向量差的模的平方的相反數(shù)確定為第一指數(shù)函數(shù)的指數(shù)。

計(jì)算機(jī)系統(tǒng)利用規(guī)整矩陣對(duì)身份向量進(jìn)行規(guī)整。具體的,計(jì)算機(jī)系統(tǒng)利用規(guī)整矩陣左乘身份向量完成對(duì)該身份向量的規(guī)整。

利用矩陣A表示規(guī)整矩陣,利用Cm表示類別m內(nèi)的身份向量的集合,利用wi表示類別m內(nèi)的第一身份向量,利用wj表示類別m內(nèi)的第二身份向量,則第一身份向量wi∈Cm,第二身份向量wj∈Cm,規(guī)整后的第一身份向量為Awi,規(guī)整后的第二身份向量為Awj,利用規(guī)整后的第一身份向量Awi減去規(guī)整后的第二身份向量Awj得到第一向量差為Awi-Awj,則第一指數(shù)函數(shù)為

舉例來(lái)講,將類別1的身份向量w1確定為第二身份向量,則第二身份向量w1對(duì)應(yīng)的第一指數(shù)函數(shù)為再舉例來(lái)講,將用戶內(nèi)的身份向量w2確定為第二身份向量,則第二身份向量w2對(duì)應(yīng)的第一指數(shù)函數(shù)為

步驟202b,上述確定出的身份向量中與第二身份向量不同的身份向量確定為第三身份向量,對(duì)于每個(gè)確定出的第三身份向量,計(jì)算機(jī)系統(tǒng)利用該類別內(nèi)規(guī)整后的第一身份向量減去該類別內(nèi)規(guī)整后的第三身份向量得到第二向量差,將該第二向量差的模的平方的相反數(shù)確定為第二指數(shù)函數(shù)的指數(shù)。

這里所講的第三身份向量是與第二身份向量不同的身份向量。舉例來(lái)講,語(yǔ)音訓(xùn)練集合中包含k段語(yǔ)音,則從中確定出k個(gè)語(yǔ)音向量。在類別1中的第一身份向量為w3、類別1中的第二身份向量為w2的情況下,將上述k個(gè)身份向量中與第二身份向量為w2不同的身份向量確定為第三身份向量。

在利用wk表示第三身份向量時(shí),規(guī)整后的第三身份向量為Awk,第二向量差為Awi-Awk,第二指數(shù)函數(shù)為舉例來(lái)講,將用戶2內(nèi)的身份向量w7確定為第三身份向量,則第三身份向量w7對(duì)應(yīng)的第二指數(shù)函數(shù)為再舉例來(lái)講,將將用戶1內(nèi)的身份向量w4確定為第三身份向量,則第三身份向量w4對(duì)應(yīng)的第二指數(shù)函數(shù)為

步驟202c,計(jì)算機(jī)系統(tǒng)將第一指數(shù)函數(shù)確定為該第二身份向量對(duì)應(yīng)的第二函數(shù)的分子,利用各個(gè)上述確定出的第三身份向量所對(duì)應(yīng)的第二指數(shù)函數(shù)相加得到第二函數(shù)的分母。

其中,第二函數(shù)是用于計(jì)算規(guī)整后的第一身份向量和規(guī)整后的第二身份向量的相似度的函數(shù)。計(jì)算機(jī)系統(tǒng)可從該類別內(nèi)與第一身份向量不同的身份向量中確定出多個(gè)第二身份向量,建立與每個(gè)第二身份向量相對(duì)應(yīng)的第二函數(shù),該第二身份向量對(duì)應(yīng)的第二函數(shù)的分子為該第二身份向量對(duì)應(yīng)的第一指數(shù)函數(shù)。

另外,第二函數(shù)的分母是利用確定出的每個(gè)第三身份向量對(duì)應(yīng)的第二指數(shù)函數(shù)相加得到的,則第二函數(shù)可以表示為也就是說(shuō)各個(gè)第二身份向量對(duì)應(yīng)的第二函數(shù)的分母均可以表示為

舉例來(lái)講,當(dāng)?shù)诙矸菹蛄繛閣1時(shí),第二身份向量為w1對(duì)應(yīng)的第二函數(shù)為當(dāng)?shù)诙矸菹蛄繛閣2時(shí),第二身份向量為w2對(duì)應(yīng)的第二函數(shù)為當(dāng)?shù)诙矸菹蛄繛閣j時(shí),第二身份向量wj對(duì)應(yīng)的第二函數(shù)為其他第二身份向量依次類推。

當(dāng)利用f2(A)表示第二函數(shù)時(shí),類別m的第二函數(shù)可以表示為其中,wi表示類別m內(nèi)的第一身份向量,wj表示類別m內(nèi)的第二身份向量,wk表示第三身份向量,Pij用于表示第一身份向量和第二身份向量的相似度。

步驟202d,計(jì)算機(jī)系統(tǒng)將各個(gè)第二身份向量對(duì)應(yīng)的第二函數(shù)相加得到第一函數(shù)。

利用f1(A)表示第一函數(shù),利用Cm表示類別m內(nèi)的身份向量的集合,則類別m的第一函數(shù)可以表示為Pi用于表示類別m的第一函數(shù)。

其中,第一函數(shù)的第一數(shù)值越高,表明該類別內(nèi)的身份向量在空間中的位置的聚集程度更高。

步驟203,計(jì)算機(jī)系統(tǒng)利用各個(gè)類別對(duì)應(yīng)的第一函數(shù)相加得到第三函數(shù),確定出第三函數(shù)的導(dǎo)函數(shù),將導(dǎo)函數(shù)的數(shù)值確定為第二數(shù)值。

利用f3(A)表示第三函數(shù),則本領(lǐng)域普通技術(shù)人員可利用第一函數(shù)推導(dǎo)出第三函數(shù)的導(dǎo)函數(shù)表示為其中wik=wi-wk,wij=wi-wj

需要說(shuō)明的一點(diǎn)是,利用第一函數(shù)的表達(dá)式推導(dǎo)出第三函數(shù)的導(dǎo)函數(shù)的表達(dá)式是本領(lǐng)域普通技術(shù)人員所能實(shí)現(xiàn)的,本實(shí)施例不再對(duì)利用第一函數(shù)推導(dǎo)出第三函數(shù)的導(dǎo)函數(shù)的推導(dǎo)過(guò)程進(jìn)行贅述。

步驟204,計(jì)算機(jī)系統(tǒng)初始化規(guī)整矩陣,利用初始化的規(guī)整矩陣計(jì)算第一數(shù)值的初始值以及第二數(shù)值的初始值。

一般來(lái)講,規(guī)整矩陣為列矩陣,且規(guī)整矩陣的行數(shù)與身份向量的列數(shù)相同。

進(jìn)一步的,利用計(jì)算機(jī)系統(tǒng)初始化規(guī)整矩陣,計(jì)算機(jī)系統(tǒng)從語(yǔ)音訓(xùn)練集合對(duì)應(yīng)的身份向量確定出第1個(gè)子訓(xùn)練集合,利用第1個(gè)子訓(xùn)練集合中的身份向量和初始化的規(guī)整矩陣,計(jì)算第一數(shù)值的初始值以及第二數(shù)值的初始值。

舉例來(lái)講,將第1個(gè)子訓(xùn)練集合中的身份向量和初始化規(guī)整矩陣A1帶入第三函數(shù),得到第三函數(shù)的第一數(shù)值的初始值f3(A1),將初始化規(guī)整矩陣A1帶入第三函數(shù)的導(dǎo)函數(shù),得到導(dǎo)函數(shù)的第二數(shù)值的初始值

步驟205,計(jì)算機(jī)系統(tǒng)利用第二數(shù)值更新規(guī)整矩陣,利用更新后的規(guī)整矩陣迭代更新第一數(shù)值和第二數(shù)值,利用更新后的規(guī)整矩陣和更新后的第二數(shù)值進(jìn)行下一次迭代,直到在預(yù)定個(gè)連續(xù)迭代更新的過(guò)程中,每次迭代得到的第一數(shù)值的變化數(shù)值均小于第一預(yù)定閾值時(shí),將該過(guò)程中任意一次迭代更新所使用的規(guī)整矩陣確定為使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣。

可選的,計(jì)算機(jī)系統(tǒng)利用上一次迭代更新過(guò)程中更新后的規(guī)整矩陣與上一次迭代更新過(guò)程中得到的更新后的第二數(shù)值相加得到更新后的規(guī)整矩陣。

可選的,計(jì)算機(jī)系統(tǒng)將上一次迭代更新過(guò)程中得到的更新后的第二數(shù)值乘以預(yù)定系數(shù)的乘積,與上一次迭代更新過(guò)程中更新后的規(guī)整矩陣相加得到此次迭代更新后的規(guī)整矩陣。這里所講的預(yù)定系統(tǒng)通常為系統(tǒng)開(kāi)發(fā)人員設(shè)定的數(shù)值,用于控制規(guī)整矩陣的調(diào)整幅度。

圖2C是本發(fā)明提供的確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣的流程圖可選的,本步驟可以通過(guò)如圖2C所示的幾個(gè)子步驟實(shí)現(xiàn)。

步驟205a,計(jì)算機(jī)系統(tǒng)利用第n-2次更新得到的第二數(shù)值更新規(guī)整矩陣,得到第n-1次更新后的規(guī)整矩陣。

步驟205b,計(jì)算機(jī)系統(tǒng)利用確定出的身份向量中第n個(gè)子訓(xùn)練集合和第n-1次更新后的規(guī)整矩陣,計(jì)算出第n-1次更新后的第一數(shù)值和第n-1次更新后的第二數(shù)值,n≥2。

其中,當(dāng)n=2是,n-2次更新是指計(jì)算機(jī)系統(tǒng)的初始化。

舉例來(lái)講,在完成第一數(shù)值的初始化和第二數(shù)值的初始化后,利用第二數(shù)值的初始值與初始化的矩陣A1相加得到第1次更新后的規(guī)整矩陣A2。從語(yǔ)音訓(xùn)練集合對(duì)應(yīng)的身份向量確定出第2個(gè)子訓(xùn)練集合,第2個(gè)子訓(xùn)練集合與第1個(gè)子訓(xùn)練集合內(nèi)的身份向量不完全相同,利用第2個(gè)子訓(xùn)練集合內(nèi)的身份向量和第1次更新后的規(guī)整矩陣A2計(jì)算第一數(shù)值得到第1次更新后的第一數(shù)值f3(A2),利用第2個(gè)子訓(xùn)練集合內(nèi)的身份向量和第1次更新后的規(guī)整矩陣A2計(jì)算第二數(shù)值得到第1次更新后的第二數(shù)值

再舉例來(lái)講,第n-2次更新得到的第二數(shù)值為與第n-2次更新后的An-1相加得到n-1次更新后的規(guī)整矩陣An。從語(yǔ)音訓(xùn)練集合對(duì)應(yīng)的身份向量確定出第n個(gè)子訓(xùn)練集合,第n個(gè)子訓(xùn)練集合與前n-1個(gè)子訓(xùn)練集合中的任意一個(gè)集合的身份向量不完全相同。利用第n個(gè)子訓(xùn)練集合的身份向量和第n-1次更新后的規(guī)整矩陣An,計(jì)算出第n-1次更新后的第一數(shù)值f3(An)和第n-1次更新后的第二數(shù)值

另外,在每次迭代更新的過(guò)程中,計(jì)算更新后的第一數(shù)值和更新前的第一數(shù)值的差值。當(dāng)在預(yù)定個(gè)連續(xù)迭代更新的過(guò)程中,每次迭代得到的第一數(shù)值的變化數(shù)值均小于第一預(yù)定閾值時(shí),認(rèn)為在預(yù)定個(gè)連續(xù)迭代更新的過(guò)程中第一數(shù)值的總和(也即,第三函數(shù)的數(shù)值)達(dá)到最大化,此時(shí)可將該過(guò)程中任意一次迭代更新所使用的規(guī)整矩陣確定為使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣。

一般來(lái)講,預(yù)定個(gè)的具體數(shù)值和第一預(yù)定閾值由系統(tǒng)開(kāi)發(fā)人員設(shè)定。在預(yù)定個(gè)連續(xù)迭代更新的過(guò)程中,在任意一次迭代過(guò)程中第一數(shù)值的變化數(shù)值大于第一預(yù)定閾值的情況下,利用最后一次迭代更新過(guò)程中的得到規(guī)整矩陣和第二數(shù)值進(jìn)行下一次迭代更新。

步驟206,計(jì)算機(jī)系統(tǒng)在聲紋識(shí)別系統(tǒng)中利用確定出的規(guī)整矩陣規(guī)整每段語(yǔ)音的身份向量。

通過(guò)步驟201至步驟205完成了聲紋識(shí)別系統(tǒng)的訓(xùn)練,確定出聲紋識(shí)系統(tǒng)在實(shí)際使用過(guò)程中用于規(guī)整身份向量的規(guī)整矩陣。在實(shí)際使用時(shí),利用確定出的規(guī)整矩陣左乘每段語(yǔ)音的身份向量,完成該身份向量的規(guī)整。

需要說(shuō)明的一點(diǎn)是,本實(shí)施例中在建立第一函數(shù)時(shí)采用了近鄰成分分析(英文:neighborhood components analysis,NCA)算法,利用第一指數(shù)函數(shù)計(jì)算規(guī)整后的第一身份向量和規(guī)整后的第二身份向量之間的距離,利用第二指數(shù)函數(shù)計(jì)算規(guī)整后的第一身份向量和規(guī)整后的第三身份向量之間的距離,利用第二函數(shù)表征第一身份向量和第二身份向量之間的相似度,第一函數(shù)用于表征第一身份向量與該類別內(nèi)的其他身份向量之間的相似度的總和。

實(shí)驗(yàn)數(shù)據(jù)表明,以等錯(cuò)概率(英文:equal error rate,EER)作為衡量指標(biāo),聲紋識(shí)別系統(tǒng)利用未被規(guī)整的身份向量進(jìn)行識(shí)別,EER為5.48%;聲紋識(shí)別系統(tǒng)利用LDA對(duì)身份向量進(jìn)行規(guī)整,EER可以降低到5.37%;聲紋識(shí)別系統(tǒng)利用近鄰區(qū)分性分析(英文:neighborhood discriminant analysis,NDA)對(duì)身份向量進(jìn)行規(guī)整,EER可以降低到5.19%;利用NCA確定出的規(guī)整矩陣對(duì)身份向量進(jìn)行規(guī)整,EER可以降低到4.9%。

綜上所述,本實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的方法,通過(guò)將同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別,建立用于計(jì)算一個(gè)類別內(nèi)規(guī)整后的第一身份向量與該類別內(nèi)的規(guī)整后的其他身份向量之間相似度的總和的第一函數(shù),第一函數(shù)的函數(shù)值為第一數(shù)值,確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣,完成了聲紋識(shí)別系統(tǒng)的訓(xùn)練。由于確定出的規(guī)整矩陣使各個(gè)類別的第一數(shù)值的總和最大化,同一個(gè)用戶的不同段的語(yǔ)音的身份向量在利用規(guī)整矩陣進(jìn)行規(guī)整后相似度提高,解決了相關(guān)技術(shù)中利用經(jīng)過(guò)LDA處理后的身份向量進(jìn)行聲紋識(shí)別準(zhǔn)確率的提高程度低的問(wèn)題,提高了聲紋識(shí)別的準(zhǔn)確率。

另外,在完成聲紋識(shí)別系統(tǒng)的訓(xùn)練后,可利用該聲紋識(shí)別系統(tǒng)對(duì)語(yǔ)音的輸入者的身份進(jìn)行識(shí)別,可通過(guò)如圖2D所示的幾個(gè)步驟實(shí)現(xiàn)。圖2D是本發(fā)明提供的利用聲紋識(shí)別系統(tǒng)對(duì)語(yǔ)音的輸入者的身份進(jìn)行識(shí)別的流程圖。

步驟207,計(jì)算機(jī)系統(tǒng)獲取在用戶進(jìn)行身份注冊(cè)過(guò)程中記錄的語(yǔ)音的初始身份向量,利用確定出的規(guī)整矩陣規(guī)整該初始身份向量。

圖2E是本發(fā)明提供的聲紋識(shí)別系統(tǒng)的使用階段示意圖,如圖2E所示,聲紋識(shí)別系統(tǒng)的使用分為身份注冊(cè)階段和身份驗(yàn)證階段。

一般來(lái)講,當(dāng)用戶首次使用該聲紋識(shí)別系統(tǒng)時(shí),需要在該聲紋識(shí)別系統(tǒng)中進(jìn)行身份注冊(cè)。

在用戶進(jìn)行身份注冊(cè)的過(guò)程中,聲紋識(shí)別系統(tǒng)處于身份注冊(cè)階段。聲紋識(shí)別系統(tǒng)獲取用于進(jìn)行身份注冊(cè)的語(yǔ)音,對(duì)該語(yǔ)音進(jìn)行處理生成該語(yǔ)音的身份向量,并將該語(yǔ)音的身份向量確定為該用戶的初始身份向量。利用確定出的規(guī)整矩陣左乘該初始身份向量完成對(duì)該初始身份向量規(guī)整,存儲(chǔ)規(guī)整后的初始身份向量完成身份注冊(cè)。

步驟208,計(jì)算機(jī)系統(tǒng)獲取在進(jìn)行身份驗(yàn)證過(guò)程中發(fā)送的待驗(yàn)證語(yǔ)音的身份向量,利用確定出的規(guī)整矩陣規(guī)整待驗(yàn)證語(yǔ)音的身份向量。

在用戶進(jìn)行身份驗(yàn)證的過(guò)程中,聲紋識(shí)別系統(tǒng)處于身份驗(yàn)證階段。聲紋識(shí)別系統(tǒng)獲取用于身份驗(yàn)證的待驗(yàn)證語(yǔ)音,確定出待驗(yàn)證語(yǔ)音的身份向量。利用聲紋識(shí)別系統(tǒng)的規(guī)整矩陣左乘該待驗(yàn)證語(yǔ)音的身份向量,完成待驗(yàn)證語(yǔ)音的身份向量的規(guī)整。

步驟209,當(dāng)規(guī)整后的待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的初始身份向量的相似度大于第二預(yù)定閾值時(shí),則判定待驗(yàn)證語(yǔ)音的輸入者的身份與用戶的身份相同。

一般來(lái)講,第二預(yù)定閾值通常由系統(tǒng)開(kāi)發(fā)人員設(shè)定。另外,計(jì)算規(guī)整后的待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的初始身份向量的相似度為本領(lǐng)域普通技術(shù)人員所能實(shí)現(xiàn)的,本實(shí)施例不再贅述。

當(dāng)規(guī)整后的待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的初始身份向量的相似度大于第二預(yù)定閾值時(shí),判定待驗(yàn)證語(yǔ)音的輸入者的身份與用戶的身份相同。

當(dāng)規(guī)整后的待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的初始身份向量的相似度小于第二預(yù)定閾值時(shí),判定待驗(yàn)證語(yǔ)音的輸入者的身份與用戶的身份不相同。

在聲紋識(shí)別系統(tǒng)的實(shí)際使用過(guò)程中,通過(guò)判定規(guī)整后的待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的初始身份向量的相似度是否第二預(yù)定閾值,實(shí)現(xiàn)了對(duì)待驗(yàn)證語(yǔ)音的輸入者的身份的驗(yàn)證。

圖3是本發(fā)明一個(gè)實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置的框圖,如圖3所示,該訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置包括:分類模塊310、建立模塊320、確定模塊330和規(guī)整模塊340。

分類模塊310,用于確定出語(yǔ)音訓(xùn)練集合中每段語(yǔ)音的身份向量,將確定出的身份向量中同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別。

建立模塊320,用于建立用于計(jì)算與每一類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù),第一數(shù)值為對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的第一身份向量與該對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的其他身份向量之間相似度的總和,第一函數(shù)的隨機(jī)變量為規(guī)整矩陣,規(guī)整矩陣被用于左乘身份向量來(lái)規(guī)整該身份向量。

確定模塊330,用于確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣。

規(guī)整模塊340,用于利用確定模塊330確定出的規(guī)整矩陣規(guī)整聲紋識(shí)別系統(tǒng)中獲取的語(yǔ)音的身份向量。

在一種可選的實(shí)現(xiàn)方式中,建立模塊320,包括:第一確定單元、第二確定單元、第三確定單元、第四確定單元和第五確定單元。

第一確定單元,用于對(duì)于任一類別,從該類別內(nèi)其他身份向量中確定出至少一個(gè)第二身份向量,利用該類別內(nèi)規(guī)整后的第一身份向量減去該類別內(nèi)規(guī)整后的第二身份向量得到第一向量差,將第一向量差的模的平方的相反數(shù)確定為第一指數(shù)函數(shù)的指數(shù)。

第二確定單元,用于將第一確定單元確定出的第一指數(shù)函數(shù)確定為該第二身份向量對(duì)應(yīng)的第二函數(shù)的分子,第二函數(shù)用于計(jì)算規(guī)整后的第一身份向量和規(guī)整后的第二身份向量的相似度的函數(shù)。

第三確定單元,用于將確定出的身份向量中與第二身份向量不同的身份向量確定為第三身份向量。

第四確定單元,用于對(duì)于第三確定單元確定出的每個(gè)第三身份向量,利用該類別內(nèi)規(guī)整后的第一身份向量減去規(guī)整后的第三身份向量得到第二向量差,將第二向量差的模的平方的相反數(shù)確定為第二指數(shù)函數(shù)的指數(shù)。

第五確定單元,用于利用各個(gè)確定出的第三身份向量所對(duì)應(yīng)的第二指數(shù)函數(shù)相加得到第二函數(shù)的分母,將各個(gè)第二身份向量對(duì)應(yīng)的第二函數(shù)相加得到第一函數(shù)。

在一種可選的實(shí)現(xiàn)方式中,確定模塊330,包括:第六確定單元、初始化單元和更新單元。

第六確定單元,用于利用各個(gè)類別對(duì)應(yīng)的第一函數(shù)相加得到第三函數(shù),確定出第三函數(shù)的導(dǎo)函數(shù),將導(dǎo)函數(shù)的數(shù)值確定為第二數(shù)值。

初始化單元,用于初始化規(guī)整矩陣,利用初始化的規(guī)整矩陣計(jì)算第一數(shù)值的初始值以及第二數(shù)值的初始值。

更新單元,用于利用第二數(shù)值更新規(guī)整矩陣,利用更新后的規(guī)整矩陣迭代更新第一數(shù)值和第二數(shù)值,利用更新后的規(guī)整矩陣和更新后的第二數(shù)值進(jìn)行下一次迭代,直到在預(yù)定個(gè)連續(xù)迭代更新的過(guò)程中,每次迭代得到的第一數(shù)值的變化數(shù)值均小于第一預(yù)定閾值時(shí),將該過(guò)程中任意一次迭代更新所使用的規(guī)整矩陣確定為使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣。

在一種可選的實(shí)現(xiàn)方式中,初始化單元,還用于利用分類模塊確定出的身份向量中第1個(gè)子訓(xùn)練集合和初始化的規(guī)整矩陣,計(jì)算第一數(shù)值的初始值以及第二數(shù)值的初始值。

在一種可選的實(shí)現(xiàn)方式中,更新單元,包括:第一更新子單元和第二更新子單元。

第一更新子單元,用于利用第n-2次更新得到的第二數(shù)值更新規(guī)整矩陣,得到第n-1次更新后的規(guī)整矩陣。

第二更新子單元,用于利用分類模塊確定出的身份向量中第n個(gè)子訓(xùn)練集合和所述第n-1次更新后的規(guī)整矩陣,計(jì)算出第n-1次更新后的第一數(shù)值和第n-1次更新后的第二數(shù)值,n≥2。

在一種可選的實(shí)現(xiàn)方式中,該規(guī)整模塊340,還包括:第一規(guī)整單元和第二規(guī)整單元。

第一規(guī)整單元,用于獲取在用戶進(jìn)行身份注冊(cè)過(guò)程中記錄的語(yǔ)音的初始身份向量,利用確定模塊確定出的規(guī)整矩陣規(guī)整初始身份向量。

第二規(guī)整單元,用于獲取在進(jìn)行身份驗(yàn)證過(guò)程中發(fā)送的待驗(yàn)證語(yǔ)音的身份向量,利用確定模塊確定出的規(guī)整矩陣規(guī)整待驗(yàn)證語(yǔ)音的身份向量。

該訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置,還包括:

判定模塊,用于當(dāng)規(guī)整后的待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的初始身份向量的相似度大于第二預(yù)定閾值時(shí),判定該待驗(yàn)證語(yǔ)音的輸入者的身份與該用戶的身份相同。

綜上所述,本實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置,通過(guò)將同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別,建立用于計(jì)算一個(gè)類別內(nèi)規(guī)整后的第一身份向量與該類別內(nèi)的規(guī)整后的其他身份向量之間相似度的總和的第一函數(shù),第一函數(shù)的函數(shù)值為第一數(shù)值,確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣,完成了聲紋識(shí)別系統(tǒng)的訓(xùn)練。由于確定出的規(guī)整矩陣使各個(gè)類別的第一數(shù)值的總和最大化,同一個(gè)用戶的不同段的語(yǔ)音的身份向量在利用規(guī)整矩陣進(jìn)行規(guī)整后相似度提高,解決了相關(guān)技術(shù)中利用經(jīng)過(guò)LDA處理后的身份向量進(jìn)行聲紋識(shí)別準(zhǔn)確率的提高程度低的問(wèn)題,提高了聲紋識(shí)別的準(zhǔn)確率。

需要說(shuō)明的是:上述實(shí)施例中提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置在訓(xùn)練聲紋識(shí)別系統(tǒng)時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說(shuō)明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將電子設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的訓(xùn)練聲紋識(shí)別系統(tǒng)的裝置與訓(xùn)練聲紋識(shí)別系統(tǒng)的方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過(guò)程詳見(jiàn)方法實(shí)施例,這里不再贅述。

圖4是本發(fā)明一個(gè)實(shí)施例提供的聲紋識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。具體來(lái)講:

服務(wù)器400包括中央處理單元(英文:central processing unit,CPU)401、包括隨機(jī)存取存儲(chǔ)器(英文:random-access memory,RAM)402和只讀存儲(chǔ)器(英文:read-only memory,ROM)403的系統(tǒng)存儲(chǔ)器404,以及連接系統(tǒng)存儲(chǔ)器404和中央處理單元401的系統(tǒng)總線405。服務(wù)器400還包括幫助計(jì)算機(jī)內(nèi)的各個(gè)器件之間傳輸信息的基本輸入/輸出(英文:input/output,I/O)系統(tǒng)406,和用于存儲(chǔ)操作系統(tǒng)413、應(yīng)用程序414和其他程序模塊415的大容量存儲(chǔ)設(shè)備407。

基本輸入/輸出系統(tǒng)406包括有用于顯示信息的顯示器408和用于用戶輸入信息的諸如鼠標(biāo)、鍵盤之類的輸入設(shè)備409。其中顯示器408和輸入設(shè)備409都通過(guò)連接到系統(tǒng)總線405的輸入輸出控制器410連接到中央處理單元401?;据斎?輸出系統(tǒng)406還可以包括輸入/輸出控制器410以用于接收和處理來(lái)自鍵盤、鼠標(biāo)、或電子觸控筆等多個(gè)其他設(shè)備的輸入。類似地,輸入/輸出控制器410還提供輸出到顯示屏、打印機(jī)或其他類型的輸出設(shè)備。

大容量存儲(chǔ)設(shè)備407通過(guò)連接到系統(tǒng)總線405的大容量存儲(chǔ)控制器(未示出)連接到中央處理單元401。大容量存儲(chǔ)設(shè)備407及其相關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)為服務(wù)器400提供非易失性存儲(chǔ)。也就是說(shuō),大容量存儲(chǔ)設(shè)備407可以包括諸如硬盤或者CD-ROM驅(qū)動(dòng)器之類的計(jì)算機(jī)可讀介質(zhì)(未示出)。

不失一般性,計(jì)算機(jī)可讀介質(zhì)可以包括計(jì)算機(jī)存儲(chǔ)介質(zhì)和通信介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以用于存儲(chǔ)諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)等信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移動(dòng)和不可移動(dòng)介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括靜態(tài)隨機(jī)存取存儲(chǔ)器(英文:static random access memory,SRAM),電可擦除可編程只讀存儲(chǔ)器(英文:electrically erasable programmable read-only memory,EEPROM),可擦除可編程只讀存儲(chǔ)器(英文:erasable programmable read only memory,EPROM),可編程只讀存儲(chǔ)器(英文:programmable read only memory,PROM)、RAM、ROM、閃存或其他固態(tài)存儲(chǔ)其技術(shù),CD-ROM、數(shù)字通用光盤(英文:digital versatile disc,DVD)或其他光學(xué)存儲(chǔ)、磁帶盒、磁帶、磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備。當(dāng)然,本領(lǐng)域技術(shù)人員可知計(jì)算機(jī)存儲(chǔ)介質(zhì)不局限于上述幾種。上述的系統(tǒng)存儲(chǔ)器404和大容量存儲(chǔ)設(shè)備407可以統(tǒng)稱為存儲(chǔ)器。

根據(jù)本發(fā)明的各種實(shí)施例,服務(wù)器400還可以通過(guò)諸如因特網(wǎng)等網(wǎng)絡(luò)連接到網(wǎng)絡(luò)上的遠(yuǎn)程計(jì)算機(jī)運(yùn)行。也即服務(wù)器400可以通過(guò)連接在系統(tǒng)總線405上的網(wǎng)絡(luò)接口單元411連接到網(wǎng)絡(luò)412,或者說(shuō),也可以使用網(wǎng)絡(luò)接口單元411來(lái)連接到其他類型的網(wǎng)絡(luò)或遠(yuǎn)程計(jì)算機(jī)系統(tǒng)(未示出)。

上述存儲(chǔ)器還包括一個(gè)或者一個(gè)以上的程序,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行述一個(gè)或者一個(gè)以上程序包含用于進(jìn)行以下操作的指令:

確定出語(yǔ)音訓(xùn)練集合中每段語(yǔ)音的身份向量,將所述確定出的身份向量中同一用戶的語(yǔ)音的身份向量劃分為一個(gè)類別;

建立用于計(jì)算與每一類別對(duì)應(yīng)的第一數(shù)值的第一函數(shù),所述第一數(shù)值為對(duì)應(yīng)類別內(nèi)利用規(guī)整矩陣規(guī)整后的第一身份向量與所述對(duì)應(yīng)類別內(nèi)利用所述規(guī)整矩陣規(guī)整后的其他身份向量之間相似度的總和,所述第一函數(shù)的隨機(jī)變量為所述規(guī)整矩陣,所述規(guī)整矩陣被用于左乘身份向量來(lái)規(guī)整所述身份向量;

確定出使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣;

利用確定出的規(guī)整矩陣規(guī)整聲紋識(shí)別系統(tǒng)中獲取的語(yǔ)音的身份向量。

可選的,所述一個(gè)或多個(gè)程序還包含用于進(jìn)行以下操作的指令:

對(duì)于任一類別,從所述類別內(nèi)所述其他身份向量中確定出至少一個(gè)第二身份向量,利用所述類別內(nèi)規(guī)整后的第一身份向量減去所述類別內(nèi)規(guī)整后的第二身份向量得到第一向量差,將所述第一向量差的模的平方的相反數(shù)確定為第一指數(shù)函數(shù)的指數(shù);

將所述第一指數(shù)函數(shù)確定為所述第二身份向量對(duì)應(yīng)的第二函數(shù)的分子,所述第二函數(shù)用于計(jì)算所述規(guī)整后的第一身份向量和所述規(guī)整后的第二身份向量的相似度的函數(shù);

將所述確定出的身份向量中與所述第二身份向量不同的身份向量確定為第三身份向量;

對(duì)于每個(gè)第三身份向量,利用所述類別內(nèi)規(guī)整后的第一身份向量減去規(guī)整后的所述第三身份向量得到第二向量差,將所述第二向量差的模的平方的相反數(shù)確定為第二指數(shù)函數(shù)的指數(shù);

利用各個(gè)所述確定出的第三身份向量所對(duì)應(yīng)的第二指數(shù)函數(shù)相加得到所述第二函數(shù)的分母,將各個(gè)第二身份向量對(duì)應(yīng)的第二函數(shù)相加得到所述第一函數(shù)。

可選的,所述一個(gè)或多個(gè)程序還包含用于進(jìn)行以下操作的指令:

利用各個(gè)類別對(duì)應(yīng)的第一函數(shù)相加得到第三函數(shù),確定出所述第三函數(shù)的導(dǎo)函數(shù),將所述導(dǎo)函數(shù)的數(shù)值確定為第二數(shù)值;

初始化規(guī)整矩陣,利用所述初始化的規(guī)整矩陣計(jì)算所述第一數(shù)值的初始值以及第二數(shù)值的初始值;

利用第二數(shù)值更新所述規(guī)整矩陣,利用更新后的規(guī)整矩陣迭代更新所述第一數(shù)值和所述第二數(shù)值,利用更新后的規(guī)整矩陣和更新后的第二數(shù)值進(jìn)行下一次迭代,直到在預(yù)定個(gè)連續(xù)迭代更新的過(guò)程中,每次迭代得到的第一數(shù)值的變化數(shù)值均小于第一預(yù)定閾值時(shí),將所述過(guò)程中任意一次迭代更新所使用的規(guī)整矩陣確定為使各個(gè)類別的第一數(shù)值的總和最大化的規(guī)整矩陣。

可選的,所述一個(gè)或多個(gè)程序還包含用于進(jìn)行以下操作的指令:

利用所述確定出的身份向量中第1個(gè)子訓(xùn)練集合和所述初始化的規(guī)整矩陣,計(jì)算所述第一數(shù)值的初始值以及第二數(shù)值的初始值。

可選的,所述一個(gè)或多個(gè)程序還包含用于進(jìn)行以下操作的指令:

利用第n-2次更新得到的第二數(shù)值更新所述規(guī)整矩陣,得到第n-1次更新后的規(guī)整矩陣;

利用所述確定出的身份向量中第n個(gè)子訓(xùn)練集合和所述第n-1次更新后的規(guī)整矩陣,計(jì)算出第n-1次更新后的第一數(shù)值和第n-1次更新后的第二數(shù)值,n≥2。

可選的,所述一個(gè)或多個(gè)程序還包含用于進(jìn)行以下操作的指令:

獲取在用戶進(jìn)行身份注冊(cè)過(guò)程中記錄的語(yǔ)音的初始身份向量,利用所述確定出的規(guī)整矩陣規(guī)整所述初始身份向量;

獲取在進(jìn)行身份驗(yàn)證過(guò)程中發(fā)送的待驗(yàn)證語(yǔ)音的身份向量,利用所述確定出的規(guī)整矩陣規(guī)整所述待驗(yàn)證語(yǔ)音的身份向量;

當(dāng)規(guī)整后的所述待驗(yàn)證語(yǔ)音的身份向量與規(guī)整后的所述初始身份向量的相似度大于第二預(yù)定閾值時(shí),判定所述待驗(yàn)證語(yǔ)音的輸入者的身份與所述用戶的身份相同。

在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器,上述指令可由移動(dòng)終端的處理器執(zhí)行以完成上述彈幕發(fā)布方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。

術(shù)語(yǔ)“第一”、“第二”和“第三”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或隱含所指示的技術(shù)特征的數(shù)量。由此,限定的“第一”、“第二”“第三”的特征可以明示或隱含地包括一個(gè)或者更多個(gè)該特征。在本發(fā)明的描述中,除非另有說(shuō)明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。

上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。

以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
东乡县| 苍山县| 邵阳县| 鱼台县| 华安县| 承德市| 古交市| 吉首市| 虞城县| 沁阳市| 丰城市| 磐安县| 泰顺县| 丹棱县| 长宁区| 越西县| 内丘县| 顺义区| 淮南市| 青州市| 东台市| 双桥区| 武陟县| 花莲市| 崇左市| 安阳县| 西宁市| 莱芜市| 汝州市| 章丘市| 徐汇区| 明水县| 吴桥县| 张家川| 盈江县| 青田县| 鄢陵县| 博客| 东山县| 滦平县| 扶余县|