欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)的制作方法

文檔序號(hào):6546698閱讀:294來源:國知局
微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)的制作方法
【專利摘要】微軟語音識(shí)別配置文件的自動(dòng)切換方法,創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的所有用戶的身份信息和配置文件對應(yīng)表;用戶對著麥克風(fēng)發(fā)聲,電腦就可以對說話人的聲音音色進(jìn)行身份識(shí)別,并輸出該用戶的身份信息;從對應(yīng)表文件,根據(jù)該用戶的身份信息查詢到對應(yīng)的配置文件;自動(dòng)切換到該用戶的配置文件。本發(fā)明還提供一種微軟語音識(shí)別配置文件的自動(dòng)切換系統(tǒng)。
【專利說明】微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)語音識(shí)別配置文件的自動(dòng)切換,具體而言,涉及一種微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)。
【背景技術(shù)】
[0002]目前,業(yè)內(nèi)主流的語音識(shí)別引擎有微軟、科大訊飛和谷歌等,其中微軟的識(shí)別引擎是基于windows平臺(tái)的本地安裝的訓(xùn)練數(shù)據(jù)庫進(jìn)行工作,這就決定了它的學(xué)習(xí)樣本集不像科大訊飛、谷歌的部署在云端的語音識(shí)別引擎的數(shù)據(jù)庫那么龐大。一般來說,微軟的引擎需要用戶進(jìn)行發(fā)聲訓(xùn)練形成存放在本地的適用于該用戶的配置文件。當(dāng)設(shè)置了經(jīng)用戶本人訓(xùn)練的配置文件的默認(rèn)支持后,微軟的引擎語音識(shí)別精度可以達(dá)到令人滿意的程度。
[0003]但是當(dāng)有若干用戶使用同一臺(tái)電腦做語音識(shí)別時(shí)就需要在不同的配置文件之間進(jìn)行切換,當(dāng)前這樣的切換必須完全依賴手動(dòng)操作進(jìn)行。由于配置文件切換的動(dòng)作比較繁瑣:例如在win8系統(tǒng)里,用戶首先要鼠標(biāo)右鍵點(diǎn)中揚(yáng)聲器圖標(biāo)_>選擇錄音設(shè)備_>在彈出的窗口里繼續(xù)用鼠標(biāo)右鍵選中麥克風(fēng)圖標(biāo)_>選中“配置語音識(shí)別”菜單_>在彈出的控制面板里選中左上方的“高級(jí)語音選項(xiàng)”_>在彈出的語音屬性窗口里勾選用戶對應(yīng)的配置文件_>按確定退出,一共7個(gè)步驟實(shí)現(xiàn)配置文件的切換。在win8系統(tǒng)里如果通過控制面板打開麥克風(fēng)來設(shè)置配置文件的切換則需要10個(gè)步驟。這些操作對于一般的通過口述編寫文檔的辦公人員等不熟悉windows系統(tǒng)的用戶是一個(gè)沉重的負(fù)擔(dān),本發(fā)明提出了一種自動(dòng)切換配置文件的一步操作方法。

【發(fā)明內(nèi)容】

[0004]本發(fā)明要解決現(xiàn)有技術(shù)依賴手動(dòng)操作的缺點(diǎn),提供一種微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)。
[0005]一種配置文件的自動(dòng)切換方法,其特征在于,包括:
[0006]步驟1、在系統(tǒng)初始化階段創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的用戶的身份信息和配置文件的對應(yīng)表;
[0007]步驟2、在每一個(gè)人使用語音識(shí)別之前用戶開啟麥克風(fēng)并對著麥克風(fēng)發(fā)聲,電腦對說話人的語音身份進(jìn)行識(shí)別,并輸出該用戶的身份信息;
[0008]步驟3、然后系統(tǒng)從對應(yīng)表文件,根據(jù)該用戶的身份信息查詢到該用戶對應(yīng)的配置文件名;
[0009]步驟4、系統(tǒng)根據(jù)上一步得到的配置文件名將默認(rèn)配置文件切換到該用戶的配置文件,然后開始進(jìn)入語音識(shí)別的工作。
[0010]進(jìn)一步,步驟2中電腦對說話人的身份識(shí)別,其具體方式是:開啟麥克風(fēng)根據(jù)輸入音頻的特征分析來進(jìn)行。步驟3中有與語音識(shí)別配置文件列表一一對應(yīng)的同名字符串表示的配置文件的說話人身份配置文件對應(yīng)表。
[0011]一種微軟語音識(shí)別配置文件的自動(dòng)切換系統(tǒng),包括麥克風(fēng)錄音模塊、說話人識(shí)別模塊、說話人身份配置文件對應(yīng)表、微軟語音識(shí)別引擎配置文件列表、微軟SAPI庫Helper函數(shù)和自動(dòng)切換模塊;
[0012]麥克風(fēng)錄音模塊是開啟麥克風(fēng)采集用戶環(huán)境的聲學(xué)信號(hào),向說話人識(shí)別模塊輸出;
[0013]說話人識(shí)別模塊根據(jù)采集的聲音信號(hào)分析說話人的聲音音色,向自動(dòng)切換模塊輸出的說話人的身份信息;
[0014]自動(dòng)切換模塊用于自動(dòng)修改默認(rèn)配置文件為該用戶的配置,不需要經(jīng)過繁瑣的手動(dòng)操作;
[0015]說話人身份配置文件對應(yīng)表用于給自動(dòng)切換模塊提供查詢,以便自動(dòng)切換模塊獲得該說話人所對應(yīng)的配置文件名;
[0016]微軟語音識(shí)別引擎的微配置文件列表是微軟語音識(shí)別引擎部署在本地的各個(gè)用戶的語音訓(xùn)練特征數(shù)據(jù)的文件名,該列表在切換模塊設(shè)置默認(rèn)配置文件時(shí)遍歷所用;
[0017]微軟SAPI庫Helper函數(shù)為切換模塊提供了關(guān)于修改默認(rèn)配置文件的接口 API。
[0018]本發(fā)明的優(yōu)點(diǎn)是 :可以在微軟語音識(shí)別引擎的基礎(chǔ)上實(shí)現(xiàn)自動(dòng)切換不同的配置文件,無需手動(dòng)操作。
【專利附圖】

【附圖說明】
[0019]圖1是本發(fā)明實(shí)施例配置文件自動(dòng)切換方法的實(shí)現(xiàn)邏輯示意圖,圖中語音識(shí)別配置文件列表中加粗的配置文件k表示是當(dāng)前用戶的默認(rèn)配置文件。
[0020]圖2是本發(fā)明實(shí)施例的系統(tǒng)功能運(yùn)行邏輯次序圖。
[0021]圖3是本發(fā)明實(shí)施例的系統(tǒng)組件圖,圖中的----?表示的是“依賴于”。
【具體實(shí)施方式】
[0022]參照附圖:
[0023]一種配置文件的自動(dòng)切換方法,其特征在于,包括:
[0024]步驟1、在系統(tǒng)初始化階段創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的用戶的身份信息和配置文件的對應(yīng)表;
[0025]步驟2、在每一個(gè)人使用語音識(shí)別之前用戶開啟麥克風(fēng)并對著麥克風(fēng)發(fā)聲,電腦對說話人的語音身份進(jìn)行識(shí)別,并輸出該用戶的身份信息;
[0026]步驟3、然后系統(tǒng)從對應(yīng)表文件,根據(jù)該用戶的身份信息查詢到該用戶對應(yīng)的配置文件名;
[0027]步驟4、系統(tǒng)根據(jù)上一步得到的配置文件名將默認(rèn)配置文件切換到該用戶的配置文件,然后開始進(jìn)入語音識(shí)別的工作。
[0028]步驟2中電腦對說話人的身份識(shí)別,其具體方式是:開啟麥克風(fēng)根據(jù)輸入音頻的特征分析來進(jìn)行。步驟3中有與語音識(shí)別配置文件列表一一對應(yīng)的同名字符串表示的配置文件的說話人身份配置文件對應(yīng)表。
[0029]下面請參考圖1,該圖是配置文件自動(dòng)切換方法的實(shí)現(xiàn)邏輯示意圖,具體描述如下:
[0030]創(chuàng)建使用同一臺(tái)電腦的所有用戶的身份信息和配置文件的對應(yīng)表文件;當(dāng)麥克風(fēng)有語音輸入時(shí),電腦對說話人的語音身份進(jìn)行識(shí)別,并輸出該說話人的身份信息;再從對應(yīng)表文件,即說話人的身份信息查詢到其對應(yīng)的配置文件,并自動(dòng)切換配置文件。
[0031]圖中語音識(shí)別配置文件列表里的多個(gè)元素表示目前在語音識(shí)別系統(tǒng)中已經(jīng)訓(xùn)練了多個(gè)配置文件,且默認(rèn)的配置文件只有一個(gè);當(dāng)自動(dòng)切換指向語音識(shí)別配置文件列表時(shí),則表示查看默認(rèn)配置文件是否就是當(dāng)前的用戶配置,若不是則自動(dòng)修改默認(rèn)配置文件為當(dāng)前用戶的配置,圖中就是將用戶k的配置文件設(shè)為默認(rèn)配置文件。
[0032]下面請參考圖2,該圖是系統(tǒng)功能運(yùn)行邏輯次序圖,具體的流程如下:
[0033]創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的所有用戶的身份信息和配置文件對應(yīng)表文件。
[0034]I)用戶對著麥克風(fēng)發(fā)聲;
[0035]2)對說話人的發(fā)聲音色進(jìn)行識(shí)別,并輸出該說話人的身份信息;
[0036]3)根據(jù)識(shí)別后輸出的說話人身份信息去匹配該說話人的配置文件名;
[0037]4)匹配配置文件名后自動(dòng)切換配置文件;
[0038]5)用戶繼續(xù)對著麥克風(fēng)說話;
[0039]6)持續(xù)進(jìn)行語音識(shí)別。
[0040]相應(yīng)地,本發(fā)明一種微軟語音識(shí)別配置文件的自動(dòng)切換系統(tǒng),包括麥克風(fēng)錄音模塊、說話人識(shí)別模塊、說話人身份配置文件對應(yīng)表、微軟語音識(shí)別引擎配置文件列表、微軟SAPI庫Helper函數(shù)和自動(dòng)切換模塊;
[0041]麥克風(fēng)錄音模塊是開啟麥克風(fēng)采集用戶環(huán)境的聲學(xué)信號(hào),向說話人識(shí)別模塊輸出;
[0042]說話人識(shí)別模塊根據(jù)采集的聲音信號(hào)分析說話人的聲音音色,向自動(dòng)切換模塊輸出說話人的身份信息;
[0043]自動(dòng)切換模塊用于自動(dòng)修改默認(rèn)配置文件為該用戶的配置,不需要經(jīng)過繁瑣的手動(dòng)操作;
[0044]說話人身份配置文件對應(yīng)表用于給自動(dòng)切換模塊提供查詢,以便自動(dòng)切換模塊獲得該說話人所對應(yīng)的配置文件名;
[0045]微軟語音識(shí)別引擎的配置文件列表是微軟語音識(shí)別引擎部署在本地的各個(gè)用戶的語音訓(xùn)練特征數(shù)據(jù)的文件名,該列表用于切換模塊設(shè)置默認(rèn)配置文件時(shí)遍歷所用;
[0046]微軟SAPI庫Helper函數(shù)為切換模塊提供了關(guān)于修改默認(rèn)配置文件的接口 API。
[0047]說話人識(shí)別模塊是根據(jù)語音基頻、共振峰等頻譜特征建立人員音色特征庫,實(shí)現(xiàn)說話人識(shí)別,并準(zhǔn)確查找說話人的配置文件。
[0048]說話人身份識(shí)別(Speaker Recognition)的性能精度誤差雖然影響說話人身份的識(shí)別輸出的準(zhǔn)確性,但由此導(dǎo)致的設(shè)置錯(cuò)誤的配置文件不會(huì)造成語音識(shí)別精度的降低,這是因?yàn)檎f話人識(shí)別出現(xiàn)錯(cuò)誤,意味著這兩人的音色特征比較相似,于是他們的配置文件也比較近似,從而導(dǎo)致他們可以互用對方的配置文件而不會(huì)造成語音識(shí)別精度的降低。
[0049]自動(dòng)切換模塊是用于自動(dòng)修改默認(rèn)配置文件為當(dāng)前用戶的配置,不需要經(jīng)過繁瑣的手動(dòng)操作。
[0050]自動(dòng)切換的實(shí)現(xiàn)邏輯是根據(jù)說話人識(shí)別模塊輸出的“用戶”信息,從對應(yīng)表文件查詢到“用戶”對應(yīng)的“配置文件”名,使用微軟提供的SAPI庫的Helper部分的接口函數(shù)實(shí)現(xiàn)默認(rèn)配置文件的更改,從而實(shí)現(xiàn)不同配置文件之間的切換。其中設(shè)置默認(rèn)配置文件的SAPI接口的調(diào)用方式為
[0051]//枚舉配置文件列表里的所有配置文件
[0052]
for(int i=0; i<count;i++)
{
cpObjectToken.Release (); //獲取第i個(gè)配置文件的文件名 cpEnum->Item(i, &cp0bjectToken);
hr 二 cpObjectToken->GetStringValue(NULL, &pwszRecoProfileName);
//如果和說話人識(shí)別輸出的說話人對應(yīng)的配置文件inprof同名 if(!wcscmp(pwszRecoProfileName, inprof))

{
//進(jìn)行默認(rèn)配置文件的設(shè)置 hr =SpSetDefaultTokenForCategoryId(SPCAT REC0PR0FILES, cpObjectToken );

}
}
[0053]下面請參考圖3,該圖是系統(tǒng)組件圖,具體內(nèi)容包括:
[0054]系統(tǒng)要實(shí)現(xiàn)自動(dòng)切換配置文件需要依賴于用戶、配置文件名對應(yīng)表,微軟SAPI庫Helper接口函數(shù)和第三方說話人識(shí)別引擎。
[0055]用戶、配置文件名對應(yīng)表是根據(jù)用戶身份信息來查找相對應(yīng)的配置文件的;
[0056]微軟SAPI庫Helper接口函數(shù)是用來實(shí)現(xiàn)默認(rèn)配置文件的更改的;
[0057]第三方說話人識(shí)別引擎依賴于麥克風(fēng)錄音,這是因?yàn)榈谌秸f話人識(shí)別引擎是用語音音色識(shí)別說話人身份的,需要有麥克風(fēng)錄音的輸入才能進(jìn)行身份識(shí)別。
【權(quán)利要求】
1.微軟語音識(shí)別配置文件的自動(dòng)切換方法,其特征在于,包括: 步驟1、在系統(tǒng)初始化階段創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的用戶的身份信息和配置文件的對應(yīng)表; 步驟2、在每一個(gè)人使用語音識(shí)別之前用戶開啟麥克風(fēng)并對著麥克風(fēng)發(fā)聲,電腦對說話人的語音身份進(jìn)行識(shí)別,并輸出該用戶的身份信息; 步驟3、然后系統(tǒng)從對應(yīng)表文件,根據(jù)該用戶的身份信息查詢到該用戶對應(yīng)的配置文件名; 步驟4、系統(tǒng)根據(jù)上一步得到的配置文件名將默認(rèn)配置文件切換到該用戶的配置文件,然后開始進(jìn)入語音識(shí)別的工作。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟2中電腦對說話人的身份識(shí)別,其具體方式是:開啟麥克風(fēng)根據(jù)輸入音頻的特征分析來進(jìn)行。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟3中有與語音識(shí)別配置文件列表一一對應(yīng)的同名字符串表示的配置文件的說話人身份配置文件對應(yīng)表。
4.一種使用權(quán)利要求1所述的方法的系統(tǒng),其特征在于:包括麥克風(fēng)錄音模塊、說話人識(shí)別模塊、說話人身份配置文件對應(yīng)表、微軟語音識(shí)別引擎配置文件列表、微軟SAPI庫Helper函數(shù)和自動(dòng)切換模塊; 麥克風(fēng)錄音模塊是開啟麥克風(fēng)采集用戶環(huán)境的聲學(xué)信號(hào),向說話人識(shí)別模塊輸出;說話人識(shí)別模塊根據(jù)采集的聲音信號(hào)分析說話人的聲音音色,向自動(dòng)切換模塊輸出的說話人的身份信息; 自動(dòng)切換模塊用于自動(dòng)修改默認(rèn)配置文件為該用戶的配置,不需要經(jīng)過繁瑣的手動(dòng)操作; 說話人身份配置文件對應(yīng)表用于給自動(dòng)切換模塊提供查詢,以便自動(dòng)切換模塊獲得該說話人所對應(yīng)的配置文件名; 微軟語音識(shí)別引擎的配置文件列表是微軟語音識(shí)別引擎部署在本地的各個(gè)用戶的語音訓(xùn)練特征數(shù)據(jù)的文件名,該列表用于切換模塊設(shè)置默認(rèn)配置文件時(shí)遍歷所用; 微軟SAPI庫Helper函數(shù)為切換模塊提供了關(guān)于修改默認(rèn)配置文件的接口 API。
【文檔編號(hào)】G06F17/30GK104021146SQ201410207282
【公開日】2014年9月3日 申請日期:2014年5月15日 優(yōu)先權(quán)日:2014年5月15日
【發(fā)明者】陸成剛, 俞珊珊 申請人:浙江工業(yè)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
阜阳市| 阳泉市| 岳阳县| 天台县| 沅陵县| 桂阳县| 海门市| 宜兰县| 英山县| 佛冈县| 景洪市| 锡林浩特市| 彭泽县| 清河县| 长白| 涿州市| 图们市| 芮城县| 积石山| 成安县| 即墨市| 祁阳县| 山东省| 吴堡县| 海阳市| 梅州市| 丰都县| 广元市| 平乐县| 林口县| 通许县| 平潭县| 托克逊县| 三河市| 遂溪县| 本溪市| 永兴县| 新建县| 庆云县| 衢州市| 酒泉市|