欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語(yǔ)音識(shí)別的后處理方法及裝置和語(yǔ)音識(shí)別系統(tǒng)的制作方法_2

文檔序號(hào):9454220閱讀:來(lái)源:國(guó)知局
施例提供了一種語(yǔ)音識(shí)別的后處理方法及裝置和語(yǔ)音識(shí)別系統(tǒng)。在該方案中,首先需要獲得語(yǔ)音識(shí)別引擎識(shí)別出的漢字短語(yǔ)。其次,根據(jù)預(yù)存的漢字與拼音的對(duì)應(yīng)關(guān)系,將所述識(shí)別出的漢字短語(yǔ)轉(zhuǎn)化為第一拼音序列。再次,計(jì)算所述第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中所有拼音序列的各個(gè)編輯距離;所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)有漢字短語(yǔ)及與其對(duì)應(yīng)的拼音序列。然后,獲得關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第一拼音序列的編輯距離最近的第二拼音序列。最后,將關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第二拼音序列對(duì)應(yīng)的漢字短語(yǔ)確定為語(yǔ)音識(shí)別結(jié)果。
[0048]下面通過(guò)具體實(shí)施例,對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。
[0049]圖1為本發(fā)明實(shí)施例提供的一種語(yǔ)音識(shí)別的后處理方法的流程圖,包括如下步驟:
[0050]步驟SlOl:獲得語(yǔ)音識(shí)別引擎識(shí)別出的漢字短語(yǔ)。
[0051 ] 具體地,所述獲得語(yǔ)音識(shí)別引擎識(shí)別出的漢字短語(yǔ),可以包括:獲得語(yǔ)音識(shí)別引擎針對(duì)視頻語(yǔ)音命令識(shí)別出的漢字短語(yǔ)。
[0052]實(shí)際應(yīng)用中,語(yǔ)音識(shí)別引擎可以是現(xiàn)有技術(shù)中常見(jiàn)的語(yǔ)音識(shí)別應(yīng)用程序。這里不再詳述。
[0053]本發(fā)明實(shí)施例可以應(yīng)用于多種網(wǎng)絡(luò)系統(tǒng),例如:將本發(fā)明實(shí)施例應(yīng)用于視頻網(wǎng)絡(luò)系統(tǒng)中,本步驟獲得的是語(yǔ)音識(shí)別引擎針對(duì)視頻語(yǔ)音命令識(shí)別出的漢字短語(yǔ)。
[0054]例如:語(yǔ)音識(shí)別引擎識(shí)別出的漢字短語(yǔ)為:
[0055]卓爾(左耳)
[0056]—枚道人(一眉道人)
[0057]出了貓大(虎媽貓爸)
[0058]何李勝飄落(何以笙簫默)
[0059]其中,括號(hào)前是語(yǔ)音識(shí)別引擎識(shí)別出的漢字短語(yǔ),括號(hào)中的內(nèi)容為應(yīng)該識(shí)別出的正確識(shí)別結(jié)果??梢?jiàn),僅采用語(yǔ)音識(shí)別引擎識(shí)別出的漢字短語(yǔ)并不準(zhǔn)確。
[0060]步驟S102:根據(jù)預(yù)存的漢字與拼音的對(duì)應(yīng)關(guān)系,將所述識(shí)別出的漢字短語(yǔ)轉(zhuǎn)化為第一拼音序列。
[0061]在實(shí)際應(yīng)用中,可以利用發(fā)音字典將所述識(shí)別出的漢字短語(yǔ)轉(zhuǎn)化為第一拼音序列。其中,發(fā)音字典中存儲(chǔ)了所有漢字與拼音的對(duì)應(yīng)關(guān)系。
[0062]例如,將步驟SlOl中識(shí)別出的漢字短語(yǔ)轉(zhuǎn)化為第一拼音序列,為:
[0063]卓爾一>zhuoer
[0064]一枚道人一>yimeidaoren
[0065]出了貓大一>chulemaoda
[0066]何李勝飄落一>he I i shengp i aoluo
[0067]步驟S103:計(jì)算所述第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中所有拼音序列的各個(gè)編輯距離。
[0068]需要說(shuō)明的是,所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)有漢字短語(yǔ)及與其對(duì)應(yīng)的拼音序列。在應(yīng)用于視頻網(wǎng)絡(luò)系統(tǒng)中時(shí),該關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)的漢字短語(yǔ)可以包括:影視片名、音樂(lè)片名、節(jié)目片名和/或視頻類別名。本領(lǐng)域技術(shù)人員可以理解,在預(yù)設(shè)關(guān)鍵詞數(shù)據(jù)庫(kù)時(shí)根據(jù)應(yīng)用的系統(tǒng)來(lái)設(shè)置,例如:上述的應(yīng)用在視頻網(wǎng)絡(luò)系統(tǒng)中時(shí),關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)的漢字短語(yǔ)可以包括:影視片名、音樂(lè)片名、節(jié)目片名和/或視頻類別名;再例如應(yīng)用于科技信息檢索的系統(tǒng)中時(shí),該關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)的漢字短語(yǔ)可以包括:各個(gè)技術(shù)領(lǐng)域的科技詞匯等等。
[0069]具體地,本步驟中可以計(jì)算將所述第一拼音序列轉(zhuǎn)化成所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中所有拼音序列時(shí)所需的各個(gè)最少編輯操作次數(shù),得到各個(gè)編輯距離。
[0070]以影視片名關(guān)鍵詞數(shù)據(jù)庫(kù)為例,該關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)的漢字短語(yǔ)及對(duì)應(yīng)的拼音序列包括:zuoer—左耳;yimeidaoren— 一眉道人;humamaoba—虎媽貓爸;heyishengxiaomo一何以璽簫默。
[0071]以第一拼音序列zhuoer為例,計(jì)算它與其他拼音序列的絕對(duì)編輯距離,為:與yimeidaoren的編輯距離為9,與humamaoba的編輯距離為7,與huaqiangu的編輯距離為8,與zuoer的編輯距離為1,等等。
[0072]如果采用長(zhǎng)度歸一化,則歸一化編輯距離為??與yimeidaoren的編輯距離為0.82,與humamaoba的編輯距離為0.78,與huaqiangu的編輯距離為0.89,與zuoer的編輯距離為0.17,等等。
[0073]步驟S104:獲得關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第一拼音序列的編輯距離最近的第二拼首序列。
[0074]具體地,可以對(duì)所述各個(gè)編輯距離進(jìn)行排序,將編輯距離最小的拼音序列確定為第二拼音序列。
[0075]例如,將步驟S103中計(jì)算得到的各個(gè)編輯距離進(jìn)行排序,可知zuoer是與第一拼音序列zhuoer編輯距離最小的拼音序列,因此將zuoer確定為第二拼音序列。
[0076]步驟S105:將關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第二拼音序列對(duì)應(yīng)的漢字短語(yǔ)確定為語(yǔ)音識(shí)別結(jié)果。
[0077]具體地,所述將關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第二拼音序列對(duì)應(yīng)的漢字短語(yǔ)確定為語(yǔ)音識(shí)別結(jié)果,可以為:將關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第二拼音序列對(duì)應(yīng)的影視片名或音樂(lè)片名或節(jié)目片名或視頻類別名,確定為語(yǔ)音識(shí)別結(jié)果。
[0078]例如,將影視片名關(guān)鍵詞數(shù)據(jù)庫(kù)中與步驟S104中所確定的第二拼音序列zuoer相對(duì)應(yīng)的“左耳”確定為語(yǔ)音識(shí)別結(jié)果。
[0079]由上述的實(shí)施例可見(jiàn),本發(fā)明實(shí)施例能夠在語(yǔ)音識(shí)別引擎識(shí)別出漢字短語(yǔ)之后,根據(jù)拼音之間的編輯距離,將關(guān)鍵詞數(shù)據(jù)庫(kù)中的對(duì)應(yīng)漢字短語(yǔ)確定為語(yǔ)音識(shí)別結(jié)果,無(wú)需修改語(yǔ)音識(shí)別引擎內(nèi)部的語(yǔ)言模型,從而提高了語(yǔ)音識(shí)別的精度。
[0080]圖2為本發(fā)明實(shí)施例提供的一種語(yǔ)音識(shí)別的后處理裝置的結(jié)構(gòu)示意圖,所述裝置包括:漢字短語(yǔ)識(shí)別模塊201、第一拼音序列轉(zhuǎn)化模塊202、編輯距離計(jì)算模塊203、第二拼音序列獲得模塊204和語(yǔ)音識(shí)別結(jié)果確定模塊205。
[0081 ] 其中,漢字短語(yǔ)識(shí)別模塊201,用于獲得語(yǔ)音識(shí)別弓I擎識(shí)別出的漢字短語(yǔ)。
[0082]本實(shí)施例中的漢字短語(yǔ)識(shí)別模塊201,具體可以包括:獲得語(yǔ)音識(shí)別引擎針對(duì)視頻語(yǔ)音命令識(shí)別出的漢字短語(yǔ)。
[0083]第一拼音序列轉(zhuǎn)化模塊202,用于根據(jù)預(yù)存的漢字與拼音的對(duì)應(yīng)關(guān)系,將所述識(shí)別出的漢字短語(yǔ)轉(zhuǎn)化為第一拼音序列。
[0084]編輯距離計(jì)算模塊203,用于計(jì)算所述第一拼音序列與預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中所有拼音序列的各個(gè)編輯距離。
[0085]需要說(shuō)明的是,所述預(yù)先設(shè)置的關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)有漢字短語(yǔ)及與其對(duì)應(yīng)的拼音序列。在實(shí)際應(yīng)用中,該關(guān)鍵詞數(shù)據(jù)庫(kù)中存儲(chǔ)的漢字短語(yǔ)可以包括:影視片名、音樂(lè)片名、節(jié)目片名和/或視頻類別名。
[0086]本實(shí)施例中的編輯距離計(jì)算模塊203,具體可以用于:
[0087]計(jì)算將所述第一拼音序列轉(zhuǎn)化成所述預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)中所有拼音序列時(shí)所需的各個(gè)最少編輯操作次數(shù),得到各個(gè)編輯距離。
[0088]第二拼音序列獲得模塊204,用于獲得關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第一拼音序列的編輯距離最近的第二拼音序列。
[0089]本實(shí)施例中的第二拼音序列獲得模塊204,具體可以用于:
[0090]對(duì)所述各個(gè)編輯距離進(jìn)行排序,將編輯距離最小的拼音序列確定為第二拼音序列。
[0091]語(yǔ)音識(shí)別結(jié)果確定模塊205,用于將關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第二拼音序列對(duì)應(yīng)的漢字短語(yǔ)確定為語(yǔ)音識(shí)別結(jié)果。
[0092]本實(shí)施例中的語(yǔ)音識(shí)別結(jié)果確定模塊205,具體可以用于:將關(guān)鍵詞數(shù)據(jù)庫(kù)中與所述第二拼音序列對(duì)應(yīng)的影視片名或音樂(lè)片名或節(jié)目片名或視頻類別名,確定為語(yǔ)音識(shí)別結(jié)果。
[0093]由上述的實(shí)施例可見(jiàn),本發(fā)明實(shí)施例能夠在語(yǔ)音識(shí)別引擎識(shí)別出漢字短語(yǔ)之后,根據(jù)拼音之間的編輯距離,將關(guān)鍵詞數(shù)據(jù)庫(kù)中的對(duì)應(yīng)漢字短語(yǔ)確定為語(yǔ)音識(shí)別結(jié)果,無(wú)需修改語(yǔ)音識(shí)別引擎內(nèi)部的語(yǔ)言模型,從而提高了語(yǔ)音識(shí)別的精度。
[0094]結(jié)合本發(fā)明的實(shí)際應(yīng)用場(chǎng)景,在本發(fā)明的一種實(shí)施方式中,還提供一種語(yǔ)音識(shí)別系統(tǒng)。
[0095]圖3為本發(fā)明實(shí)施例提供的一種語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖,所述系統(tǒng)包括??客戶端301、語(yǔ)音識(shí)別云服務(wù)器302、語(yǔ)音識(shí)別引擎303和關(guān)鍵詞數(shù)據(jù)庫(kù)304。
[0096
當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
阿克苏市| 依兰县| 屏边| 木里| 庄河市| 平定县| 金川县| 南汇区| 湟源县| 丹巴县| 黔西县| 佛山市| 密山市| 勃利县| 曲阳县| 遂溪县| 邹城市| 关岭| 白河县| 屏东市| 永济市| 通江县| 宁波市| 盐山县| 泰来县| 两当县| 渭南市| 九江县| 凤城市| 孝昌县| 台安县| 北安市| 沈丘县| 潞西市| 绍兴市| 邢台市| 礼泉县| 浙江省| 神农架林区| 剑阁县| 革吉县|