本發(fā)明涉及聲紋識別技術(shù)領(lǐng)域,具體而言,涉及一種具有優(yōu)先級的聲紋識別方法和系統(tǒng)。
背景技術(shù):
伴隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,人們對身份識別要求越來越高,基于傳統(tǒng)密碼認(rèn)證的身份識別技術(shù)在實際信息網(wǎng)絡(luò)應(yīng)用過程中已經(jīng)暴露出越來越多的不足之處,而基于生物識別中的聲紋識別技術(shù)是一種更有效的身份識別技術(shù),聲紋識別(voiceprintrecognition,vpr),也稱為說話人識別(speakerrecognition),聲紋識別分為兩類,即說話人辨認(rèn)(speakeridentification)和說話人確認(rèn)(speakerverification)。前者用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;而后者用以確認(rèn)某段語音是否是指定的某個人所說的,是“一對一判別”問題。
而在聲紋識別過程中,需要在對多個語音中及時的識別出使用者的身份時,現(xiàn)有的聲紋識別系統(tǒng)均采用是對多個語音進(jìn)行逐個識別,這樣不僅影響了識別的效率,而且使得識別的過程變得復(fù)雜。
技術(shù)實現(xiàn)要素:
根據(jù)現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種具有優(yōu)先級的聲紋識別方法和系統(tǒng)的技術(shù)方案,具體包括:
一種具有優(yōu)先級的聲紋識別方法,其中,包括:
采集語音片源,并識別出語音片源中所存在的未識別聲紋;
對每次識別的未識別聲紋進(jìn)行統(tǒng)計,并形成統(tǒng)計結(jié)果;
根據(jù)統(tǒng)計結(jié)果對所述未識別聲紋進(jìn)行優(yōu)先識別排序;
按照優(yōu)先排序獲取每個所述未識別聲紋中的未識別聲紋特征,其中,所述未識別聲紋特征中至少包括所述未識別聲紋的小波元素;
至少分別根據(jù)每個所述未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理得到對應(yīng)于每個所述未識別聲紋的辨別度;
分別判斷每個所述辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留所述辨別度大于所述標(biāo)準(zhǔn)閾值的所述未識別聲紋;
于被保留的所述未識別聲紋中,選擇所述辨別度最大的所述未識別聲紋并識別為被鎖定聲紋;
所述小波元素包括實小波元素和/或復(fù)小波元素,其中,所述獲取未識別聲紋中的未識別聲紋特征包括:
檢測所述未識別聲紋中的濁音區(qū)間;
在每個所述濁音區(qū)間中檢測基音區(qū)間,并在每個所述基音區(qū)間中獲取所述聲紋特征的所述實小波元素和/或所述復(fù)小波元素。
優(yōu)選的,該具有優(yōu)先級的聲紋識別方法,其中,在所述提取未識別聲紋中的未識別聲紋特征之前,還包括:
采集所述未識別聲紋;
至少根據(jù)所述未識別聲紋特征中的未識別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識別模型中與所述未識別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與所述未識別聲紋相適應(yīng)的所述聲紋識別模型中的所述標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。
優(yōu)選的,該具有優(yōu)先級的聲紋識別方法,其中,所述未識別聲紋特征中包括多個所述未識別聲紋特征向量,所述標(biāo)準(zhǔn)聲紋特征中包括多個所述標(biāo)準(zhǔn)聲紋特征向量,其中,所述至少根據(jù)所述未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理得到所述未識別聲紋的辨別度包括:
處理得到所述未識別聲紋特征中的每個所述未識別聲紋特征向量與所述標(biāo)準(zhǔn)聲紋特征中每個與所述未識別聲紋特征向量相對應(yīng)的所述標(biāo)準(zhǔn)聲紋特征向量的向量距離;
根據(jù)處理得到的多個所述向量距離處理得到所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;
至少利用所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離處理得到所述未識別聲紋的辨別度。
優(yōu)選的,該具有優(yōu)先級的聲紋識別方法,其中,在采集所述未識別聲紋之 前,還包括:
采集多個聲紋并獲取所述多個聲紋中每個聲紋的背景聲紋特征,以構(gòu)建多個與所述聲紋相對應(yīng)的背景識別模型,其中,所述背景聲紋特征中包括多個背景聲紋特征向量;
根據(jù)所述背景識別模型構(gòu)建所述標(biāo)準(zhǔn)識別模型。
優(yōu)選的,該提具有優(yōu)先級的聲紋識別方法,其中,所述至少利用所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的距離處理得到所述未識別聲紋的辨別度包括:
處理得到所述未識別聲紋特征分別與多個所述背景識別模型對應(yīng)的每個所述聲紋的所述背景聲紋特征的背景距離;
根據(jù)多個所述背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;
處理得到所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離與所述距離平均值的差值;
處理得到所述差值與所述距離標(biāo)準(zhǔn)差的比值,將所述比值作為所述未識別聲紋的所述辨別度。
優(yōu)選的,該具有優(yōu)先級的聲紋識別方法,其中,所述在每個所述基音區(qū)間中獲取所述聲紋特征的所述實小波元素和/或所述復(fù)小波元素包括:
在每個所述基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個所述基音區(qū)間中的所述特征向量劃分為預(yù)定長度的樣本向量,并將所述預(yù)定長度的樣本向量歸一化;
對歸一化后的所述預(yù)定長度的樣本向量執(zhí)行以下至少一種小波變換:
對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行實小波變換,以得到第一預(yù)定頻帶的實部系數(shù),并在所述第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識別聲紋特征中的所述實小波元素;
對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實部系數(shù)和虛部系數(shù),并在所述第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識別聲紋特征中的所述復(fù)小波元素。
優(yōu)選的,該具有優(yōu)先級的聲紋識別方法,其中,在檢測所述未識別聲紋中的濁音區(qū)間之后,所述獲取未識別聲紋中的未識別聲紋特征還包括:
獲取所述未識別聲紋中每一幀的梅爾倒譜系數(shù),以得到所述未識別聲紋特 征中的所述梅爾倒譜系數(shù)特征;
根據(jù)所述梅爾倒譜系數(shù)處理得到所述未識別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到所述未識別聲紋特征中的所述差分梅爾倒譜系數(shù)特征。
一種提升聲紋識別準(zhǔn)確度的系統(tǒng),包括:
第一采集單元,用以采集一語音片源;
識別單元,與所述第一采集單元連接,用以識別出語音片源中存在的未識別聲紋;
統(tǒng)計單元,與所述識別單元連接,用以對所述未識別聲紋進(jìn)行統(tǒng)計,并形成統(tǒng)計結(jié)果;
第一處理單元,根據(jù)所述統(tǒng)計結(jié)果,對所述未識別聲紋進(jìn)行優(yōu)先排序;
獲取單元,與所述第一處理單元連接,用于獲取優(yōu)先排序的未識別聲紋中的未識別聲紋特征,其中,所述未識別聲紋特征中至少包括所述未識別聲紋的小波元素;
第二處理單元,連接所述獲取單元,用于至少根據(jù)所述未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理所述未識別聲紋的辨別度;
判斷單元,連接所述第二處理單元,用于判斷所述辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留所述辨別度大于所述標(biāo)準(zhǔn)閾值的所述未識別聲紋;
識別單元,連接所述判斷單元,用于在所述被保留的未識別聲紋中選擇所述辨別度最高的所述未識別聲紋,并識別為被鎖定聲紋;
所述小波元素包括實小波元素和/或復(fù)小波元素,所述獲取單元包括:
檢測模塊,用于檢測所述未識別聲紋中的濁音區(qū)間;
第一獲取模塊,連接所述檢測模塊,用于在每個所述濁音區(qū)間中檢測基音區(qū)間,并在每個所述基音區(qū)間中獲取所述聲紋特征的所述實小波元素和/或所述復(fù)小波元素。
優(yōu)選的,該具有優(yōu)先級的聲紋識別系統(tǒng),還包括:
調(diào)整單元,連接所述第一采集單元,用于至少根據(jù)所述未識別聲紋特征中的未識別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識別模型中與所述未識別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與所述未識別聲紋相適應(yīng)的所述聲紋識別模型中的所述標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。
優(yōu)選的,該具有優(yōu)先級的聲紋識別系統(tǒng),,所述未識別聲紋特征中包括多 個所述未識別聲紋特征向量,所述標(biāo)準(zhǔn)聲紋特征中包括多個所述標(biāo)準(zhǔn)聲紋特征向量,所述處理單元包括:
第一處理模塊,用于處理得到所述未識別聲紋特征中的每個所述未識別聲紋特征向量與所述標(biāo)準(zhǔn)聲紋特征中每個與所述未識別聲紋特征向量相對應(yīng)的所述標(biāo)準(zhǔn)聲紋特征向量的向量距離;
第二處理模塊,連接所述第一處理模塊,用于根據(jù)處理得到的多個所述向量距離處理得到所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;
第三處理模塊,連接所述第二處理模塊,用于至少利用所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離處理得到所述未識別聲紋的辨別度。
優(yōu)選的,該具有優(yōu)先級的聲紋識別系統(tǒng),,還包括:
第二采集單元,用于采集多個聲紋并獲取所述多個聲紋中每個聲紋的背景聲紋特征,以構(gòu)建多個與所述聲紋相對應(yīng)的背景識別模型,其中,所述背景聲紋特征中包括多個背景聲紋特征向量;
構(gòu)建單元,連接所述第二采集單元,用于根據(jù)所述背景識別模型構(gòu)建所述標(biāo)準(zhǔn)識別模型。
優(yōu)選的,該具有優(yōu)先級的聲紋識別系統(tǒng),,所述第三處理模塊包括:
第一處理子模塊,用于處理得到所述未識別聲紋特征分別與多個所述背景識別模型對應(yīng)的每個所述聲紋的所述背景聲紋特征的背景距離;
第二處理子模塊,連接所述第一處理子模塊,用于根據(jù)多個所述背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;
第三處理子模塊,連接所述第二處理子模塊,用于處理得到所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離與所述距離平均值的差值;
第四處理子模塊,分別連接所述第二處理子模塊和所述第三處理子模塊,用于處理得到所述差值與所述距離標(biāo)準(zhǔn)差的比值,將所述比值作為所述未識別聲紋的所述辨別度。
優(yōu)選的,該具有優(yōu)先級的聲紋識別系統(tǒng),,所述第一獲取模塊包括:
第一獲取子模塊,用于在每個所述基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個所述基音區(qū)間中的所述特征向量劃分為預(yù)定長度的樣本向量,并將所述預(yù)定長度的樣本向量歸一化;
變換子模塊,連接所述第一獲取子模塊,用于對歸一化后的所述預(yù)定長度 的樣本向量執(zhí)行以下至少一種小波變換:
對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行實小波變換,以得到第一預(yù)定頻帶的實部系數(shù),并在所述第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識別聲紋特征中的所述實小波元素;
對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實部系數(shù)和虛部系數(shù),并在所述第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識別聲紋特征中的所述復(fù)小波元素。
優(yōu)選的,該具有優(yōu)先級的聲紋識別系統(tǒng),,所述獲取單元還包括:
第二獲取模塊,用于在檢測所述未識別聲紋中的濁音區(qū)間之后,獲取所述未識別聲紋中每一幀的梅爾倒譜系數(shù),以得到所述未識別聲紋特征中的所述梅爾倒譜系數(shù)特征;
第四處理模塊,連接所述第二獲取模塊,用于根據(jù)所述梅爾倒譜系數(shù)處理得到所述未識別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到所述未識別聲紋特征中的所述差分梅爾倒譜系數(shù)特征。
上述技術(shù)方案的有益效果是:對需要識別的語音預(yù)先進(jìn)行處理,從而可對識別頻率較高的語音優(yōu)先通過聲紋識別,提高了識別效率。
附圖說明
圖1是本發(fā)明的優(yōu)選的實施例中,一種具有優(yōu)先級的聲紋識別方法的總體流程圖;
圖2是本發(fā)明的優(yōu)選的實施例中,構(gòu)造標(biāo)準(zhǔn)聲紋特征向量的流程圖;
圖3是本發(fā)明的一個優(yōu)選的實施例中,處理得到辨別度的流程圖;
圖4是本發(fā)明的優(yōu)選的實施例中,處理得到標(biāo)準(zhǔn)識別模型的流程圖;
圖5是本發(fā)明的一個優(yōu)選的實施例中,處理得到辨別度的流程圖;
圖6是本發(fā)明的優(yōu)選的實施例中,提取未識別聲紋特征的流程圖;
圖7是本發(fā)明的優(yōu)選的實施例中,在每個基音區(qū)間內(nèi)提取小波元素的流程圖;
圖8是本發(fā)明的優(yōu)選的實施例中,獲得差分梅爾倒譜系數(shù)特征的流程圖;
圖9是本發(fā)明的優(yōu)選的實施例中,檢測濁音區(qū)間后獲取未識別聲紋特征的流程圖;
圖10為本發(fā)明的優(yōu)選的實施例中,一種具有優(yōu)先級的聲紋識別系統(tǒng)的結(jié)構(gòu)圖;
圖11是本發(fā)明的優(yōu)選的實施例中,系統(tǒng)中的處理單元的結(jié)構(gòu)圖;
圖12是本發(fā)明的優(yōu)選的實施例中,處理單元中的第三處理模塊的結(jié)構(gòu)圖
圖13是本發(fā)明的優(yōu)選的實施例中,獲取單元中的第一獲取模塊的結(jié)構(gòu)圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
需要說明的是,在不沖突的情況下,本發(fā)明中的實施例及實施例中的特征可以相互組合。
下面結(jié)合附圖和具體實施例對本發(fā)明作進(jìn)一步說明,但不作為本發(fā)明的限定。
需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實施例。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
本發(fā)明的優(yōu)選的實施例中,提供了一種具有優(yōu)先級的聲紋識別方法,如圖1所示,該方法包括:
步驟s1、采集語音片源,并分析出語音片源中所存在的未識別聲紋;
步驟s2、對每次識別的未識別聲紋進(jìn)行統(tǒng)計,并形成統(tǒng)計結(jié)果;
步驟s3、根據(jù)統(tǒng)計結(jié)果對采集的所述未識別聲紋進(jìn)行優(yōu)先識別排序;
步驟s4、按照優(yōu)先排序獲取每個所述未識別聲紋中的未識別聲紋特征,其中,所述未識別聲紋特征中至少包括所述未識別聲紋的小波元素;
步驟s5,至少分別根據(jù)每個未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理得到對應(yīng)于每個未識別聲紋的辨別度;
步驟s6,分別判斷每個辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留辨別度大于標(biāo)準(zhǔn)閾值的未識別聲紋;
步驟s7,于被保留的未識別聲紋中,選擇辨別度最大的未識別聲紋并識別為被鎖定聲紋。
上述技術(shù)方案中,在采集的語音片源中,識別出語音片源中存在的未識別聲紋,并對每次識別未識別聲紋進(jìn)行統(tǒng)計并形成統(tǒng)計結(jié)果,根據(jù)統(tǒng)計結(jié)果對未識別聲紋進(jìn)行優(yōu)先排序,從而對識別頻率較高的未識別聲紋優(yōu)先識別,有效的提高了識別的效率。本發(fā)明的優(yōu)選的實施例中,上述具有優(yōu)先級的聲紋識別方法可以但不限于應(yīng)用于擺放在私密的個人空間中的智能設(shè)備上對有限的幾個使用者的聲紋進(jìn)行識別,還可以應(yīng)用于將該智能設(shè)備擺放在相對開放的空間中,同樣供有限的幾個使用者的聲紋進(jìn)行識別。在上述應(yīng)用環(huán)境中,可能存在多個未識別聲紋進(jìn)行識別,同樣地可能存在多個辨別度大于上述標(biāo)準(zhǔn)閾值的未識別聲紋(即通??梢宰鳛楸绘i定聲紋進(jìn)行識別)。然而對于一臺智能設(shè)備而言,最佳的狀況為在同一時間僅根據(jù)一位使用者的語音指令進(jìn)行操作,否則可能會對使用者的使用體驗造成不好的影響。因此在上述存在多個符合規(guī)則(辨別度大于標(biāo)準(zhǔn)閾值)的未識別聲紋時,保留所有這些未識別聲紋,并且選擇其中辨別度最高的未識別聲紋并將其識別為被鎖定聲紋,隨后根據(jù)該被鎖定聲紋,具有聲紋識別功能的智能設(shè)備可以進(jìn)行相應(yīng)的后續(xù)操作。本發(fā)明的優(yōu)選的實施例中,上述未識別聲紋特征中包括小波元素,也就是說,在原有特征的基礎(chǔ)上結(jié)合聲紋的小波元素,從而提高具有優(yōu)先級的聲紋識別系統(tǒng)的精確性和穩(wěn)定性。進(jìn)而克服了現(xiàn)有的聲紋識別方式的識別結(jié)果因容易受各種因素干擾而造成識別不準(zhǔn)確的問題。進(jìn)一步,通過直接與聲紋識別模型進(jìn)行比較,減小了模型構(gòu)建的復(fù)雜度和構(gòu)建周期,從而提高了聲紋識別的穩(wěn)定性和識別效率。關(guān)于上述小波元素在下文中詳述。
本發(fā)明的優(yōu)選的實施例中,上述未識別聲紋中的未識別聲紋特征可以包括多個未識別聲紋特征向量。相應(yīng)地,上述標(biāo)準(zhǔn)聲紋特征中也可以包括多個標(biāo)準(zhǔn)聲紋特征向量。
更進(jìn)一步地,在本實施例中,上述未識別聲紋特征可以包括下文中所述 的內(nèi)容,但其組成并不限于下文中所述的內(nèi)容:
4個實小波元素、4個雙樹復(fù)小波元素、梅爾倒譜系數(shù)特征以及差分梅爾倒譜系數(shù)特征。
其中,上述小波元素中包括實小波和復(fù)小波中的至少一種。
本發(fā)明的優(yōu)選的實施例中,上述聲紋識別模型可以包括下文中所述的內(nèi)容:
根據(jù)未識別聲紋中的多個聲紋特征向量(未識別聲紋特征向量)對標(biāo)準(zhǔn)識別模型進(jìn)行調(diào)整后,得到與未識別聲紋相適應(yīng)的用于識別上述未識別聲紋的標(biāo)準(zhǔn)識別模型。
上述標(biāo)準(zhǔn)識別模型可以包括:采集關(guān)聯(lián)于多人的不同的聲紋,并從每個人的聲紋中獲取相應(yīng)的聲紋特征。隨后根據(jù)不同的聲紋特征分別構(gòu)建與每個人的聲紋相對應(yīng)的背景識別模型,再對上述多個背景識別模型中的背景聲紋特征進(jìn)行聚類,進(jìn)而構(gòu)建標(biāo)準(zhǔn)識別模型,例如通用背景模型(universalbackgroundmode,ubm)。
本發(fā)明的一個優(yōu)選的實施例中,例如,一個聲紋特征中包括10個聲紋特征向量(即10類特征),則采集多人的聲紋后,從每個人的聲紋中獲取上述10類特征,然后對每類特征進(jìn)行聚類(例如,包括32個中心)。隨后,根據(jù)聚類得到的結(jié)果獲得包含32碼字的10個碼本(即10個聲紋特征向量對應(yīng)的聲紋特征參數(shù))的ubm模型。進(jìn)一步,每個說話人還可根據(jù)自身的聲紋特征構(gòu)建相應(yīng)的背景識別模型。
本發(fā)明的優(yōu)選的實施例中,在獲取未識別聲紋中的未識別聲紋特征之前,還包括如圖2所示的下述步驟:
步驟a1,采集未識別聲紋;
步驟a2,至少根據(jù)未識別聲紋特征中的未識別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識別模型中與未識別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與未識別聲紋相適應(yīng)的聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。
本發(fā)明的優(yōu)選的實施例中,上述采集未識別聲紋的方式可以包括下述幾種方式:采用聲音采集裝置(例如麥克風(fēng))采集具有預(yù)設(shè)時長的待識別人聲(例如采集持續(xù)5秒的人聲),其中,采用的音頻的格式是采樣率16khz、 量化深度16位,且為單聲道。
本發(fā)明的優(yōu)選的實施例中,上述未識別聲紋特征中可以包括多個未識別聲紋特征向量,同樣地,上述標(biāo)準(zhǔn)聲紋特征中可以包括多個標(biāo)準(zhǔn)聲紋特征向量。例如,每個未識別聲紋特征中包括10個vq碼本,也就是說,每個未識別聲紋特征向量對應(yīng)一個vq碼本,其中,每個vq碼本對應(yīng)一組特征集。同樣地,每個標(biāo)準(zhǔn)聲紋特征中也可以包括10個vq碼本,每個標(biāo)準(zhǔn)聲紋特征向量對應(yīng)一個vq碼本。
則本發(fā)明的優(yōu)選的實施例中,可以根據(jù)上述未識別聲紋特征中的多個未識別聲紋特征向量調(diào)整標(biāo)準(zhǔn)識別模型,以得到與未識別聲紋相適應(yīng)的聲紋識別模型,從而便于利用上述聲紋識別模型實現(xiàn)對之后采集的聲紋進(jìn)行識別。
通過本發(fā)明的優(yōu)選的實施例,在獲取未識別聲紋中的未識別聲紋特征之前,通過調(diào)整上述標(biāo)準(zhǔn)識別模型來得到與未識別聲紋相適應(yīng)的聲紋識別模型,實現(xiàn)對未識別聲紋的預(yù)先注冊,從而使得在聲紋識別時可以根據(jù)預(yù)先注冊的聲紋識別模型直接進(jìn)行準(zhǔn)確識別,減小了模型構(gòu)建的復(fù)雜度和構(gòu)建周期,進(jìn)而提高了聲紋識別的可靠性及效率。
本發(fā)明的優(yōu)選的實施例中,未識別聲紋特征中包括多個未識別聲紋特征向量,標(biāo)準(zhǔn)聲紋特征中包括多個標(biāo)準(zhǔn)聲紋特征向量,其中,至少根據(jù)未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理得到未識別聲紋的辨別度如圖3所示,包括:
步驟b1,處理得到未識別聲紋特征中的每個未識別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征中每個與未識別聲紋特征向量相對應(yīng)的標(biāo)準(zhǔn)聲紋特征向量的向量相似度;
步驟b2,根據(jù)處理得到的多個向量相似度處理得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;
步驟b3,至少利用未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離處理得到未識別聲紋的辨別度。
本發(fā)明的優(yōu)選的實施例中,上述處理得到未識別聲紋特征中的未識別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量的向量相似度包括:處理得到未識別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征向量之間的距離。
具體地,例如,未識別聲紋的未識別聲紋特征中的未識別聲紋特征向量 與聲紋識別模型的標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量之間的向量距離為a,對多個向量距離進(jìn)行歸一化處理,并加權(quán)求和得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離s。至少根據(jù)上述到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離s處理得到未識別聲紋特征的辨別度。本發(fā)明的優(yōu)選的實施例中,上述權(quán)重可以根據(jù)不同特征向量的重要程度預(yù)先設(shè)置,本發(fā)明的其他實施例中,上述權(quán)重可以采用其他適宜的方式設(shè)置或者處理得到。
本發(fā)明的優(yōu)選的實施例中,通過處理得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征中多個聲紋特征向量的向量距離,對多個向量距離進(jìn)行加權(quán)求和后準(zhǔn)確處理得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離,進(jìn)而保證了聲紋辨別度的準(zhǔn)確性。
本發(fā)明的較佳的實施例中,,在采集未識別聲紋之前,還包括如圖4所示的下述步驟:
步驟c1,采集多個聲紋并獲取多個聲紋中每個聲紋的背景聲紋特征,以構(gòu)建多個與聲紋相對應(yīng)的背景識別模型,其中,背景聲紋特征中包括多個背景聲紋特征向量;
步驟c2,根據(jù)背景識別模型構(gòu)建標(biāo)準(zhǔn)識別模型。
具體地,本發(fā)明的優(yōu)選的實施例中,采集多個使用者說話時的聲紋,并以此構(gòu)建多個背景識別模型,從而實現(xiàn)根據(jù)背景識別模型構(gòu)建包含多人聲紋特征的標(biāo)準(zhǔn)識別模型,以便于預(yù)先構(gòu)建用于聲紋識別的聲紋識別模型,進(jìn)而達(dá)到了縮短模型構(gòu)建周期,提高聲紋識別效率的目的。
本發(fā)明的優(yōu)選的實施例中,可以利用未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的距離處理得到未識別聲紋的辨別度,其步驟如圖5所示,包括:
步驟d1,處理得到未識別聲紋特征分別與多個背景識別模型對應(yīng)的每個聲紋的背景聲紋特征的背景距離;
步驟d2,根據(jù)多個背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;
步驟d3,處理得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離與距離平均值的差值;
步驟d4,處理得到差值與距離標(biāo)準(zhǔn)差的比值,將比值作為未識別聲紋的辨別度。
本發(fā)明的優(yōu)選的實施例中,假設(shè)未識別聲紋的未識別聲紋特征與標(biāo)準(zhǔn)聲 紋特征的目標(biāo)距離用s標(biāo)識,共采集i個聲紋構(gòu)建i個背景識別模型,其中,未識別聲紋特征與i個聲紋對應(yīng)的i個背景聲紋特征的背景距離分別是d1,d2,d3,…di,進(jìn)一步,通過處理得到得到上述多個背景距離的距離平均值為u,距離標(biāo)準(zhǔn)差為σ。則通過以下公式處理得到未識別聲紋的辨別度:
s’=(s-u)/σ(1)
進(jìn)一步,判斷上述識別聲紋的辨別度s’與預(yù)設(shè)的標(biāo)準(zhǔn)閾值的大小關(guān)系,若判斷出大于標(biāo)準(zhǔn)閾值,則認(rèn)為未識別聲紋為被鎖定聲紋。
需要說明的是,由于采集未識別聲紋與構(gòu)建聲紋識別模型的硬件環(huán)境與條件可能發(fā)生變化,例如,采用的麥克風(fēng)設(shè)備的型號發(fā)生變化,則可能導(dǎo)致未識別聲紋的未識別聲紋特征與聲紋識別模型的標(biāo)準(zhǔn)聲紋特征之間產(chǎn)生較大變化,進(jìn)而影響對未識別聲紋的判斷,因而,進(jìn)一步結(jié)合背景識別模型中的聲紋特征處理得到未識別聲紋的辨別度,進(jìn)一步保證了未識別聲紋的辨別度的準(zhǔn)確性。
具體如本發(fā)明的一個優(yōu)選的實施例中所述,如果采用與構(gòu)建背景識別模型相同的聲卡、麥克風(fēng)等設(shè)備進(jìn)行錄音采集,此時錄音后獲取的未識別聲紋的聲紋特征與聲紋識別模型的距離較近,與背景識別模型的距離也較近,而如果采用與構(gòu)建背景識別模型不同的聲卡、麥克風(fēng)等設(shè)備進(jìn)行錄音采集,錄音后獲取特征的未識別聲紋與聲紋識別模型的距離則較遠(yuǎn),與背景識別模型的距離也較遠(yuǎn),然而,雖然距離都較遠(yuǎn),但是與聲紋識別模型的距離相比較來說未識別聲紋與背景識別模型的距離還是更接近。
本發(fā)明的優(yōu)選的實施例中,通過結(jié)合預(yù)先訓(xùn)練的聲紋識別模型與背景識別模型處理得到未識別聲紋的辨別度,從而克服了由于采集未識別聲紋的環(huán)境與條件發(fā)生變化所導(dǎo)致的未識別聲紋的辨別度計算不準(zhǔn)確的問題。
本發(fā)明的優(yōu)選的實施例中,如上文中所述,上述小波元素包括實小波元素和/或復(fù)小波元素,則獲取未識別聲紋中的未識別聲紋特征的步驟如圖6所示,包括:
步驟e1,檢測未識別聲紋中的濁音區(qū)間;
步驟e2,在每個濁音區(qū)間中檢測基音區(qū)間,并在每個基音區(qū)間中獲取聲紋特征的實小波元素和/或復(fù)小波元素。
進(jìn)一步地,在該實施例中,上述在每個基音區(qū)間中獲取聲紋特征的實小波元素和/或復(fù)小波元素的步驟具體如圖7所示,包括:
步驟e21,在每個基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個基音區(qū)間中的特征向量劃分為預(yù)定長度的樣本向量,并將預(yù)定長度的樣本向量歸一化;
步驟e22,對歸一化后的預(yù)定長度的樣本向量執(zhí)行小波變換;
具體地,上述步驟e22中,采用下文中所述的方式執(zhí)行小波變換:
1)對歸一化后的預(yù)定長度的樣本向量進(jìn)行實小波變換,以得到第一預(yù)定頻帶的實部系數(shù),并在第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到未識別聲紋特征中的實小波元素;
2)對歸一化后的預(yù)定長度的樣本向量進(jìn)行雙樹的復(fù)小波變換,以得到第二預(yù)定頻帶的實部系數(shù)和虛部系數(shù),并在第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到未識別聲紋特征中的復(fù)小波元素。
本發(fā)明的優(yōu)選的實施例中,可以根據(jù)所采用的小波濾波器的長度確定上述樣本向量。
本發(fā)明的優(yōu)選的實施例中,在檢測未識別聲紋中的濁音區(qū)間之后,上述獲取未識別聲紋中的未識別聲紋特征的步驟如圖8所示,還包括:
步驟f1,獲取未識別聲紋中每一幀的梅爾倒譜系數(shù),以得到未識別聲紋特征中的梅爾倒譜系數(shù)特征;
步驟f2,根據(jù)梅爾倒譜系數(shù)處理得到未識別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到未識別聲紋特征中的差分梅爾倒譜系數(shù)特征。
本發(fā)明的一個優(yōu)選的實施例中,例如上文中所述的,對未識別聲紋進(jìn)行濁音區(qū)間檢測,然后進(jìn)行預(yù)加重處理。所謂預(yù)加重處理,其實是利用一種高通濾波器進(jìn)行的處理,其具體的公式如下文中所述:
y(n)=x(n)-0.9375*x(n-1)(2)
則如上文中所述,對預(yù)加重處理后的聲紋進(jìn)行特征提取,在進(jìn)行3階實小波變換、3階雙數(shù)復(fù)小波變換、獲取梅爾倒譜系數(shù),根據(jù)梅爾倒譜系數(shù)進(jìn)行處理等多個處理步驟之后處理得到差分梅爾倒譜系數(shù),進(jìn)而得到10組20維的聲紋特征向量。
本發(fā)明的優(yōu)選的實施例中,通過獲取聲紋特征中的小波元素,實現(xiàn)在原有特征的基礎(chǔ)上結(jié)合小波元素構(gòu)成新特征,由于小波元素能夠反映原有特征不能使用的語音特征,因此實現(xiàn)提高了具有優(yōu)先級的聲紋識別系統(tǒng)的精確性和穩(wěn)定性。
具體地,以聲紋識別模型中的聲紋特征中包括10個聲紋特征向量為示例進(jìn)行下文中的描述:
例如,從數(shù)十個說話人的語音數(shù)據(jù)中獲取的特征分別構(gòu)建背景識別模型,其中,背景識別模型中包括10個vq碼本,每個vq碼本中10個特征,如美爾倒譜、差分美爾倒譜和4個實小波元素、4個復(fù)小波元素,每個特征為20維向量。進(jìn)一步根據(jù)背景識別模型構(gòu)建ubm模型。進(jìn)一步,對未識別聲紋進(jìn)行注冊,采集未識別聲紋并從中獲取特征,通過ubm模型的vq碼本適應(yīng)每個特征組,進(jìn)而構(gòu)造出聲紋識別模型中的vq碼本(即標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量)。
進(jìn)一步,獲取每個碼本中的梅爾倒譜系數(shù)、差分梅爾倒譜系數(shù)和8個小波元素(4個實小波和4個復(fù)合小波)。
具體而言,在輸入信號{s(i):i=0,...,n-1}中檢測濁音區(qū)間;使用能量,如低、高頻帶的能量比,過零率來檢測濁音區(qū)間。再對輸入信號進(jìn)行預(yù)加重處理。
s′(i)=s(i)-0.9375*s(i-1),i=1,...,n-1;
然后對預(yù)加重處理后的聲紋執(zhí)行如圖9所示的下述操作:
步驟g1,處理得到每幀的美爾倒譜系數(shù),每幀有360個樣本,幀間隔為180個樣本。
處理得到出來的美爾倒譜向量的維度是20。
{mfcci,i=0,...,nm-1};
{mfcci={mfcci(k)};k=0,...,19};
步驟g2,對于每幀,處理得到美爾倒譜向量的差分構(gòu)成差分美爾倒譜向量。
dmfcci=mfcci+2-mfcci-2;
步驟g3,在每個濁音區(qū)間都要檢測基音區(qū)間,對獲得的每個基音區(qū)間,處理得到基音同步的實小波和復(fù)小波元素。
其中,在輸入語音信號{s(i):i=0,...,n-1}中檢測到的基音區(qū)間和最大峰值。其中n是語音區(qū)間的長度,np是基音區(qū)間的數(shù)量,每個基音區(qū)間的起始位置和長度如下:
{pit_st(i):i=0,...,np-1};
{pit_ln(i):i=0,...,np-1};
進(jìn)一步,實小波的處理方式如下:
對每個基音區(qū)間獲取4個20維的特征向量,對于每個基音區(qū)間,裁剪出包含那個區(qū)間和其之前和之后的兩組一定數(shù)量的樣本的區(qū)間,得到如下向量:
{s(pit_st(i)-l1),...,s(pit_st(i)+(pit_ln(i)+l1},i=0,...,np-1;
然后,將該向量歸一化使其范數(shù)為1。
對于上述向量,進(jìn)行一個三階段實小波(例如daubechies小波)包變換得到八個系數(shù)序列:
{rwi0},i=1,...,8;
{rwi0}={rwi0(k)},k=1,...,m;
每個對應(yīng)一個特定的頻帶,每個系數(shù)序列長度相同,且長度相當(dāng)于1/8的基音區(qū)間長度。
在上述得到的8個序列中,對應(yīng)于低頻帶的4個序列進(jìn)行重采樣,產(chǎn)生4個20維的向量:
{rwi},i=1,...,4;
rwi={rwi(k)}k=1,...,20;
進(jìn)一步,復(fù)小波的處理得到方式如下:
對每個基音區(qū)間獲取4個20維特征向量,對于每個基音區(qū)間,裁剪除包含那個區(qū)間和其之前和之后的兩組一定數(shù)量的樣本的區(qū)間,得到的向量歸一化使其范數(shù)為1。
對于上述區(qū)間,做一個三階段的雙樹復(fù)小波包變換(dt-cwpt),以得到對應(yīng)于8個頻帶的系數(shù),每個頻帶有實部系數(shù)和虛部系數(shù),其中,每個系數(shù)序列長度相同,且長度相當(dāng)于1/8的基音區(qū)間長度。對于每個頻帶,由實部和虛部序列得到一個絕對值序列。
在上述得到的8個序列中,對應(yīng)于低頻帶的4個序列進(jìn)行重采樣,產(chǎn)生4個20維的向量:
{cwi},i=1,...,4;
cwi={cw(k)i}k=1,...,20;
步驟g4,根據(jù)上述獲取出的10組特征集,采用測試標(biāo)準(zhǔn)方法進(jìn)行歸一化處理,已得到未識別聲紋與聲紋識別模型的相似度,當(dāng)判斷出相似度大于標(biāo)準(zhǔn)閾值時,則可識別出為同一聲紋,即待識別的說話人與所構(gòu)建的聲紋識別模型中的是同一人。
本發(fā)明的優(yōu)選的實施例中,基于上文中所述的具有優(yōu)先級的聲紋識別方法,還提供一種具有優(yōu)先級的聲紋識別系統(tǒng)a,其結(jié)構(gòu)具體如圖9所示,包括:
第一采集單元1,用以采集一語音片源;
分析單元2,與所述第一采集單元連接,用以分析出語音片源中存在的未識別聲紋;
統(tǒng)計單元3,與所述識別單元連接,用以對所述未識別聲紋進(jìn)行統(tǒng)計,并形成統(tǒng)計結(jié)果;
第一處理單元4,根據(jù)所述統(tǒng)計結(jié)果,對所述未識別聲紋進(jìn)行優(yōu)先排序;
獲取單元5,與所述第一處理單元連接,用于獲取優(yōu)先排序的未識別聲紋中的未識別聲紋特征,其中,所述未識別聲紋特征中至少包括所述未識別聲紋的小波元素;
第二處理單元6,連接獲取單元1,用于至少根據(jù)未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理未識別聲紋的辨別度;
判斷單元7,連接第二處理單元6,用于判斷辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留辨別度大于標(biāo)準(zhǔn)閾值的未識別聲紋;
識別單元8,連接判斷單元,用于在被保留的未識別聲紋中選擇辨別度最高的未識別聲紋,并識別為被鎖定聲紋;
小波元素包括實小波元素和/或復(fù)小波元素,獲取單元5進(jìn)一步包括:
檢測模塊51,用于檢測未識別聲紋中的濁音區(qū)間;
第一獲取模塊52,連接檢測模塊51,用于在每個濁音區(qū)間中檢測基音區(qū)間,并在每個基音區(qū)間中獲取聲紋特征的實小波元素和/或復(fù)小波元素。
本發(fā)明的優(yōu)選的實施例中,仍然如圖9所示,上述系統(tǒng)a還包括:
調(diào)整單元9,連接第一采集采集單元1,用于至少根據(jù)未識別聲紋特征中 的未識別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識別模型中與未識別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與未識別聲紋相適應(yīng)的聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。
本發(fā)明的優(yōu)選的實施例中,未識別聲紋特征中包括多個未識別聲紋特征向量,標(biāo)準(zhǔn)聲紋特征中包括多個標(biāo)準(zhǔn)聲紋特征向量。
則上述第二處理單元6如圖10所示,具體包括:
第一處理模塊61,用于處理得到未識別聲紋特征中的每個未識別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征中每個與未識別聲紋特征向量相對應(yīng)的標(biāo)準(zhǔn)聲紋特征向量的向量距離;
第二處理模塊62,連接第一處理模塊61,用于根據(jù)處理得到的多個向量距離處理得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;
第三處理模塊63,連接第二處理模塊62,用于至少利用未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離處理得到未識別聲紋的辨別度。
本發(fā)明的優(yōu)選的實施例中,仍然如圖9所示,上述系統(tǒng)中還包括:
第二采集單元9,用于采集多個聲紋并獲取多個聲紋中每個聲紋的背景聲紋特征,以構(gòu)建多個與聲紋相對應(yīng)的背景識別模型,其中,背景聲紋特征中包括多個背景聲紋特征向量;
構(gòu)建單元11,連接第二采集單元10,用于根據(jù)背景識別模型構(gòu)建標(biāo)準(zhǔn)識別模型。
進(jìn)一步地,本發(fā)明的優(yōu)選的實施例中,如圖11所示,上述第三處理模塊63包括:
第一處理子模塊631,用于處理得到未識別聲紋特征分別與多個背景識別模型對應(yīng)的每個聲紋的背景聲紋特征的背景距離;
第二處理子模塊632,連接第一處理子模塊631,用于根據(jù)多個背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;
第三處理子模塊633,連接第二處理子模塊632,用于處理得到未識別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離與距離平均值的差值;
第四處理子模塊634,分別連接第二處理子模塊632和第三處理子模塊633,用于處理得到差值與距離標(biāo)準(zhǔn)差的比值,將比值作為未識別聲紋的辨別度。
本發(fā)明的優(yōu)選的實施例中,如圖12所示,上文中的第一獲取模塊52包括:
第一獲取子模塊521,用于在每個基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個基音區(qū)間中的特征向量劃分為預(yù)定長度的樣本向量,并將預(yù)定長度的樣本向量歸一化;
變換子模塊522,連接第一獲取子模塊521,用于對歸一化后的預(yù)定長度的樣本向量執(zhí)行以下至少一種小波變換:
對歸一化后的預(yù)定長度的樣本向量進(jìn)行實小波變換,以得到第一預(yù)定頻帶的實部系數(shù),并在第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到未識別聲紋特征中的實小波元素;
對歸一化后的預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實部系數(shù)和虛部系數(shù),并在第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到未識別聲紋特征中的復(fù)小波元素。
本發(fā)明的優(yōu)選的實施例中,仍然如圖9所示,上文中所述的獲取單元5還包括:
第二獲取模塊53,用于在檢測未識別聲紋中的濁音區(qū)間之后,獲取未識別聲紋中每一幀的梅爾倒譜系數(shù),以得到未識別聲紋特征中的梅爾倒譜系數(shù)特征;
第四處理模塊54,連接第二獲取模塊53,用于根據(jù)梅爾倒譜系數(shù)處理得到未識別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到未識別聲紋特征中的差分梅爾倒譜系數(shù)特征。上述本發(fā)明優(yōu)選的實施例僅僅為了描述,不代表實施例的優(yōu)劣。
需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。
在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng),可通過 其它的方式實現(xiàn)。例如,以上所描述的系統(tǒng)實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,系統(tǒng)或單元的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可為個人計算機、移動終端、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
上述技術(shù)方案的有益效果是:對需要識別的語音預(yù)先進(jìn)行處理,從而可對識別頻率較高的語音優(yōu)先通過聲紋識別,提高了識別效率。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和 原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
以上所述僅為本發(fā)明較佳的實施例,并非因此限制本發(fā)明的實施方式及保護(hù)范圍,對于本領(lǐng)域技術(shù)人員而言,應(yīng)當(dāng)能夠意識到凡運用本發(fā)明說明書及圖示內(nèi)容所作出的等同替換和顯而易見的變化所得到的方案,均應(yīng)當(dāng)包含在本發(fā)明的保護(hù)范圍內(nèi)。