欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音識別的后處理方法及裝置和語音識別系統(tǒng)的制作方法

文檔序號:9454220閱讀:761來源:國知局
一種語音識別的后處理方法及裝置和語音識別系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音技術(shù)領(lǐng)域,特別涉及一種語音識別的后處理方法及裝置和語音識別系統(tǒng)。
【背景技術(shù)】
[0002]當(dāng)用戶在進(jìn)行搜索操作時,常常會利用語音識別來進(jìn)行。例如,在視頻搜索服務(wù)中,用戶可以在搜索欄中輸入語音命令來搜索需要的電視劇或電影片名。其具體過程是,用戶發(fā)出語音命令,語音識別引擎接收該語音命令,并根據(jù)語音識別引擎內(nèi)部的語言模型來識別語音命令,從而給出識別結(jié)果。但是,由于所搜索的內(nèi)容不一定符合自然語言的語法,并且語音識別引擎中的語言模型不一定能及時地擴(kuò)充詞匯,因此,由于發(fā)音的相似性,用戶搜索的內(nèi)容可能會被識別成另外的詞,導(dǎo)致搜索結(jié)果出現(xiàn)錯誤,識別精度不高。例如,搜索電影名《左耳》、電視劇名《花千骨》,搜索結(jié)果可能分別出現(xiàn)“卓爾”、“花千古”的錯誤。
[0003]現(xiàn)有技術(shù)中,為了提高語音識別的精度,通常是修改語音識別引擎內(nèi)部的語言模型。
[0004]但是,通過修改語音識別引擎內(nèi)部的語言模型來提高識別精度,其時效性差。對于調(diào)用第三方語音識別引擎的情況,由于無法修改識別引擎內(nèi)部的語言模型,因此很難提高識別精度。

【發(fā)明內(nèi)容】

[0005]本發(fā)明實(shí)施例的目的在于提供一種語音識別的后處理方法及裝置和語音識別系統(tǒng),無需修改語音識別引擎內(nèi)部的語言模型,提高語音識別的精度。
[0006]為達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種語音識別的后處理方法,包括步驟:
[0007]獲得語音識別引擎識別出的漢字短語;
[0008]根據(jù)預(yù)存的漢字與拼音的對應(yīng)關(guān)系,將所述識別出的漢字短語轉(zhuǎn)化為第一拼音序列;
[0009]計算所述第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列的各個編輯距離;所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中存儲有漢字短語及與其對應(yīng)的拼音序列;
[0010]獲得關(guān)鍵詞數(shù)據(jù)庫中與所述第一拼音序列的編輯距離最近的第二拼音序列;
[0011]將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的漢字短語確定為語音識別結(jié)果。
[0012]較佳的,所述計算所述第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列的各個編輯距離,為:
[0013]計算將所述第一拼音序列轉(zhuǎn)化成所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列時所需的各個最少編輯操作次數(shù),得到各個編輯距離。
[0014]較佳的,所述獲得關(guān)鍵詞數(shù)據(jù)庫中與所述第一拼音序列的編輯距離最近的第二拼首序列,為:
[0015]對所述各個編輯距離進(jìn)行排序,將編輯距離最小的拼音序列確定為第二拼音序列。
[0016]較佳的,所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中存儲的漢字短語包括:影視片名、音樂片名、節(jié)目片名和/或視頻類別名;
[0017]所述獲得語音識別引擎識別出的漢字短語,包括:獲得語音識別引擎針對視頻語音命令識別出的漢字短語;
[0018]所述將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的漢字短語確定為語音識別結(jié)果,為:將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的影視片名或音樂片名或節(jié)目片名或視頻類別名,確定為語音識別結(jié)果。
[0019]為達(dá)到上述目的,本發(fā)明實(shí)施例還公開了一種語音識別的后處理裝置,包括:
[0020]漢字短語識別模塊,用于獲得語音識別引擎識別出的漢字短語;
[0021]第一拼音序列轉(zhuǎn)化模塊,用于根據(jù)預(yù)存的漢字與拼音的對應(yīng)關(guān)系,將所述識別出的漢字短語轉(zhuǎn)化為第一拼音序列;
[0022]編輯距離計算模塊,用于計算所述第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列的各個編輯距離;所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中存儲有漢字短語及與其對應(yīng)的拼音序列;
[0023]第二拼音序列獲得模塊,用于獲得關(guān)鍵詞數(shù)據(jù)庫中與所述第一拼音序列的編輯距離最近的第二拼音序列;
[0024]語音識別結(jié)果確定模塊,用于將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的漢字短語確定為語音識別結(jié)果。
[0025]較佳的,所述編輯距離計算模塊具體用于:
[0026]計算將所述第一拼音序列轉(zhuǎn)化成所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列時所需的各個最少編輯操作次數(shù),得到各個編輯距離。
[0027]較佳的,所述第二拼音序列獲得模塊具體用于:
[0028]對所述各個編輯距離進(jìn)行排序,將編輯距離最小的拼音序列確定為第二拼音序列。
[0029]較佳的,所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中存儲的漢字短語包括:影視片名、音樂片名、節(jié)目片名和/或視頻類別名;
[0030]所述漢字短語識別模塊,具體用于:獲得語音識別引擎針對視頻語音命令識別出的漢字短語;
[0031]所述語音識別結(jié)果確定模塊,具體用于:將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的影視片名或音樂片名或節(jié)目片名或視頻類別名,確定為語音識別結(jié)果。
[0032]為達(dá)到上述目的,本發(fā)明實(shí)施例還公開了一種語音識別系統(tǒng),包括:
[0033]客戶端、語音識別云服務(wù)器、語音識別引擎和關(guān)鍵詞數(shù)據(jù)庫;
[0034]所述的客戶端,用于接收語音;
[0035]所述的語音識別引擎,用于將語音識別為漢字短語;
[0036]所述的關(guān)鍵詞數(shù)據(jù)庫,用于存儲漢字短語及與其對應(yīng)的拼音序列;
[0037]所述的語音識別云服務(wù)器,用于將從客戶端接收的語音發(fā)送至語音識別引擎,獲得語音識別引擎識別出的漢字短語;根據(jù)預(yù)存的漢字與拼音的對應(yīng)關(guān)系,將所述識別出的漢字短語轉(zhuǎn)化為第一拼音序列;計算所述第一拼音序列與存儲在關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列的各個編輯距離;獲得關(guān)鍵詞數(shù)據(jù)庫中與所述第一拼音序列的編輯距離最近的第二拼音序列;將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的漢字短語確定為語音識別結(jié)果。
[0038]較佳的,所述關(guān)鍵詞數(shù)據(jù)庫中存儲的漢字短語包括:影視片名、音樂片名、節(jié)目片名和/或視頻類別名;
[0039]所述的語音識別云服務(wù)器,將從客戶端接收的視頻語音命令發(fā)送至語音識別引擎,獲得語音識別引擎針對視頻語音命令識別出的漢字短語;將關(guān)鍵詞數(shù)據(jù)庫中與所述第二拼音序列對應(yīng)的影視片名或音樂片名或節(jié)目片名或視頻類別名,確定為語音識別結(jié)果。
[0040]由上述技術(shù)方案可見,本發(fā)明實(shí)施例是在獲得語音識別引擎識別出的漢字短語之后,根據(jù)預(yù)存的漢字與拼音的對應(yīng)關(guān)系,將所述識別出的漢字短語轉(zhuǎn)化為第一拼音序列,然后計算第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中所有拼音序列的各個編輯距離。所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫中存儲有漢字短語及與其對應(yīng)的拼音序列。最后,將關(guān)鍵詞數(shù)據(jù)庫中與所計算出的編輯距離中最近的第二拼音序列所對應(yīng)的漢字短語確定為語音識別結(jié)果。
[0041]也就是說,本發(fā)明實(shí)施例能夠在語音識別引擎識別出漢字短語之后,根據(jù)拼音之間的編輯距離,將關(guān)鍵詞數(shù)據(jù)庫中的對應(yīng)漢字短語確定為語音識別結(jié)果,無需修改語音識別引擎內(nèi)部的語言模型,從而提高了語音識別的精度。當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品或方法并不一定需要同時達(dá)到以上所述的所有優(yōu)點(diǎn)。
【附圖說明】
[0042]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單的介紹。顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0043]圖1為本發(fā)明實(shí)施例提供的一種語音識別的后處理方法的流程圖;
[0044]圖2為本發(fā)明實(shí)施例提供的一種語音識別的后處理裝置的結(jié)構(gòu)示意圖;
[0045]圖3為本發(fā)明實(shí)施例提供的一種語音識別系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0046]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述。顯然,所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0047]本發(fā)明實(shí)
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
拉萨市| 常山县| 南投市| 库尔勒市| 永康市| 克什克腾旗| 若尔盖县| 凌源市| 南宫市| 涞源县| 宾阳县| 双桥区| 监利县| 兰考县| 黑山县| 雷波县| 斗六市| 综艺| 驻马店市| 从江县| 炎陵县| 观塘区| 山阴县| 津市市| 子长县| 吉隆县| 中卫市| 勐海县| 会东县| 临朐县| 周口市| 阿鲁科尔沁旗| 江孜县| 金寨县| 花莲县| 古蔺县| 永新县| 贵溪市| 壤塘县| 时尚| 宜宾市|