對(duì)應(yīng)語音數(shù)據(jù)的聲學(xué)特 征;
[0176] 模型生成單元84,用于利用提取的錯(cuò)詞對(duì)的標(biāo)注信息、語義特征及聲學(xué)特征,構(gòu)建 錯(cuò)詞檢測(cè)模型。
[0177] 所述錯(cuò)詞檢測(cè)模型可以采用統(tǒng)計(jì)學(xué)中常用的分類模型,如支持向量機(jī)模型、神經(jīng) 網(wǎng)絡(luò)模型等。模型的輸入為當(dāng)前詞對(duì)的標(biāo)注信息、語義特征及聲學(xué)特征,其中標(biāo)注信息可以 作為錯(cuò)詞檢測(cè)模型的分類標(biāo)簽;模型的輸出為當(dāng)前詞對(duì)為正確詞對(duì)的概率。
[0178] 進(jìn)一步地,當(dāng)前詞對(duì)的語義特征還可以包括詞對(duì)中非識(shí)別結(jié)果中詞的識(shí)別語義向 量和通用語義向量,所述識(shí)別語義向量和通用語義向量在前面已有詳細(xì)說明,在此不再贅 述。
[0179] 本發(fā)明實(shí)施例提供的語音識(shí)別后處理系統(tǒng),預(yù)先利用語音識(shí)別容易出錯(cuò)的詞對(duì)構(gòu) 建錯(cuò)詞檢測(cè)模型,也就是說,將語音識(shí)別中的錯(cuò)誤聚集到一起,從錯(cuò)誤中自動(dòng)學(xué)習(xí)到其中識(shí) 別錯(cuò)誤的規(guī)律性,在對(duì)待識(shí)別語音數(shù)據(jù)進(jìn)行語音識(shí)別后,將得到的識(shí)別文本利用該錯(cuò)詞檢 測(cè)模型對(duì)其進(jìn)行修正,也就是說,利用這種識(shí)別錯(cuò)誤的規(guī)律性,"反向"發(fā)現(xiàn)識(shí)別中的錯(cuò)誤, 從而可以提高語音識(shí)別結(jié)果后處理效果,準(zhǔn)確修正語音識(shí)別結(jié)果中錯(cuò)誤詞,提升用戶體驗(yàn) 度。
[0180] 進(jìn)一步地,由于錯(cuò)詞檢測(cè)模型的構(gòu)建是通過預(yù)先收集大量語音數(shù)據(jù),并進(jìn)行語音 識(shí)別,根據(jù)識(shí)別結(jié)果發(fā)現(xiàn)語音識(shí)別容易出錯(cuò)的詞,得到錯(cuò)詞集合,然后根據(jù)該錯(cuò)詞集合中的 各詞與語音識(shí)別相關(guān)的一些特征來構(gòu)建的,從而使后續(xù)對(duì)語音識(shí)別結(jié)果進(jìn)行后處理的過程 不依賴于由專家構(gòu)建的語義知識(shí)庫,有效地避免了語音識(shí)別后處理過程受人為因素的影 響,進(jìn)一步提高了處理效果。
[0181] 本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部 分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí) 施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例 的部分說明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明 的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是 物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要 選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出 創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
[0182] 以上對(duì)本發(fā)明實(shí)施例進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行 了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及系統(tǒng);同時(shí),對(duì)于本領(lǐng)域的 一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所 述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【主權(quán)項(xiàng)】
1. 一種語音識(shí)別后處理方法,其特征在于,包括: 預(yù)先利用語音識(shí)別容易出錯(cuò)的詞對(duì)構(gòu)建錯(cuò)詞檢測(cè)模型; 在接收到待識(shí)別語音數(shù)據(jù)后,對(duì)所述語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到識(shí)別結(jié)果; 依次將所述識(shí)別結(jié)果中的各詞與通用詞典中的每個(gè)詞組成詞對(duì),并提取詞對(duì)中所述識(shí) 別結(jié)果中各詞的語義特征及聲學(xué)特征,以及詞典詞的聲學(xué)特征; 利用所述詞對(duì)的語義特征和聲學(xué)特征、以及所述錯(cuò)詞檢測(cè)模型,依次檢測(cè)所述識(shí)別結(jié) 果中的各詞,并且如果檢測(cè)得到的對(duì)應(yīng)當(dāng)前詞的詞對(duì)為正確詞對(duì)的概率大于設(shè)定閾值,則 將所述詞對(duì)中的詞典詞替換所述當(dāng)前詞; 檢測(cè)完成后,輸出修正后的識(shí)別結(jié)果。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用語音識(shí)別容易出錯(cuò)的詞對(duì)構(gòu)建 錯(cuò)詞檢測(cè)模型包括: 通過聚類方式確定語音識(shí)別容易出錯(cuò)的詞對(duì),得到錯(cuò)詞對(duì)集合; 利用所述錯(cuò)詞對(duì)集合構(gòu)建錯(cuò)詞檢測(cè)模型。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過聚類方式確定語音識(shí)別容易出 錯(cuò)的詞對(duì),得到錯(cuò)詞對(duì)集合包括: 獲取訓(xùn)練語音數(shù)據(jù); 對(duì)所述訓(xùn)練語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到識(shí)別文本; 獲取包含所述識(shí)別文本中各詞的通用文本; 利用所述識(shí)別文本訓(xùn)練得到所述識(shí)別文本中各詞的詞向量,并將其作為所述詞的識(shí)別 詞向量,并利用所述通用文本訓(xùn)練得到所述通用文本中各詞的詞向量,并將其作為所述詞 的通用詞向量; 對(duì)所述識(shí)別文本中各詞的識(shí)別詞向量進(jìn)行聚類,得到各詞的類別; 根據(jù)所述通用詞向量計(jì)算每個(gè)類別中兩個(gè)詞之間的通用語義相似度; 計(jì)算每個(gè)類別中兩個(gè)詞之間的聲學(xué)相似度; 如果計(jì)算得到的兩個(gè)詞的通用語義相似度低于設(shè)定的第一閾值,并且聲學(xué)相似度高于 設(shè)定的第二閾值,則將所述兩個(gè)詞作為錯(cuò)詞對(duì)加入到錯(cuò)詞對(duì)集合中。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述利用所述識(shí)別文本訓(xùn)練得到所述識(shí) 別文本中各詞的詞向量包括: 對(duì)所述識(shí)別文本中的各詞進(jìn)行向量初始化,得到各詞的初始詞向量; 利用神經(jīng)網(wǎng)絡(luò)對(duì)各詞的初始詞向量進(jìn)行訓(xùn)練,得到所述識(shí)別文本中各詞的詞向量。5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述通用詞向量計(jì)算每個(gè)類別 中兩個(gè)詞之間的通用語義相似度包括: 計(jì)算每個(gè)類別中兩個(gè)詞的通用詞向量之間的距離; 根據(jù)計(jì)算得到的兩個(gè)詞的通用詞向量之間的距離確定所述兩個(gè)詞之間的通用語義相 似度。6. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述計(jì)算每個(gè)類別中兩個(gè)詞之間的聲學(xué) 相似度包括: 計(jì)算每個(gè)類別中兩個(gè)詞的聲學(xué)距離; 根據(jù)計(jì)算得到的兩個(gè)詞的聲學(xué)距離確定所述兩個(gè)詞之間的聲學(xué)相似度。7. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用所述錯(cuò)詞對(duì)集合構(gòu)建錯(cuò)詞檢測(cè) 模型包括: 提取所述錯(cuò)詞對(duì)集合中每個(gè)錯(cuò)詞對(duì)的標(biāo)注信息,所述標(biāo)注信息用于表示所述錯(cuò)詞對(duì)中 其中一個(gè)詞是否應(yīng)該識(shí)別為其中另一個(gè)詞; 提取所述錯(cuò)詞對(duì)集合中識(shí)別錯(cuò)誤詞的語義特征,所述語義特征包括;錯(cuò)詞的上下文相 關(guān)環(huán)境特征、錯(cuò)詞的識(shí)別詞向量、錯(cuò)詞的通用詞向量; 提取所述錯(cuò)詞對(duì)集合中每個(gè)詞所對(duì)應(yīng)語音數(shù)據(jù)的聲學(xué)特征; 利用提取的錯(cuò)詞對(duì)的標(biāo)注信息、語義特征及聲學(xué)特征,構(gòu)建錯(cuò)詞檢測(cè)模型。8. -種語音識(shí)別后處理系統(tǒng),其特征在于,包括: 檢測(cè)模型構(gòu)建模塊,用于預(yù)先利用語音識(shí)別容易出錯(cuò)的詞對(duì)構(gòu)建錯(cuò)詞檢測(cè)模型; 接收模塊,用于接收待識(shí)別語音數(shù)據(jù); 語音識(shí)別模塊,用于對(duì)所述接收模塊接收的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到識(shí)別結(jié)果; 特征提取模塊,用于依次將所述識(shí)別結(jié)果中的各詞與通用詞典中的每個(gè)詞組成詞對(duì), 并提取詞對(duì)中所述識(shí)別結(jié)果中各詞的語義特征及聲學(xué)特征,以及詞典詞的聲學(xué)特征; 修正模塊,用于利用所述詞對(duì)的語義特征和聲學(xué)特征、以及所述錯(cuò)詞檢測(cè)模型,依次檢 測(cè)所述識(shí)別結(jié)果中的各詞,并且如果檢測(cè)得到的對(duì)應(yīng)當(dāng)前詞的詞對(duì)為正確詞對(duì)的概率大于 設(shè)定閾值,則將所述詞對(duì)中的詞典詞替換所述當(dāng)前詞; 輸出模塊,用于在所述修正模塊對(duì)所述識(shí)別結(jié)果中的各詞檢測(cè)完成后,輸出修正后的 識(shí)別結(jié)果。9. 根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述檢測(cè)模型構(gòu)建模塊包括: 錯(cuò)詞對(duì)集合生成模塊,用于通過聚類方式確定語音識(shí)別容易出錯(cuò)的詞對(duì),得到錯(cuò)詞對(duì) 集合; 模型構(gòu)建模塊,用于利用所述錯(cuò)詞對(duì)集合構(gòu)建錯(cuò)詞檢測(cè)模型。10. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述錯(cuò)詞對(duì)集合生成模塊包括: 訓(xùn)練數(shù)據(jù)獲取單元,用于獲取訓(xùn)練語音數(shù)據(jù); 識(shí)別文本獲取單元,用于調(diào)用所述語音識(shí)別模塊對(duì)所述訓(xùn)練語音數(shù)據(jù)進(jìn)行語音識(shí)別, 得到識(shí)別文本; 通用文本獲取單元,用于獲取包含所述識(shí)別文本中各詞的通用文本; 詞向量訓(xùn)練單元,用于利用所述識(shí)別文本訓(xùn)練得到所述識(shí)別文本中各詞的詞向量,并 將其作為所述詞的識(shí)別詞向量,并利用所述通用文本訓(xùn)練得到所述通用文本中各詞的詞向 量,并將其作為所述詞的通用詞向量; 聚類單元,用于對(duì)所述識(shí)別文本中各詞的識(shí)別詞向量進(jìn)行聚類,得到各詞的類別; 通用語義相似度計(jì)算單元,用于根據(jù)所述通用詞向量計(jì)算每個(gè)類別中兩個(gè)詞之間的通 用語義相似度; 聲學(xué)相似度計(jì)算單元,用于計(jì)算每個(gè)類別中兩個(gè)詞之間的聲學(xué)相似度; 判斷單元,用于判斷每個(gè)類別中兩個(gè)詞的通用語義相似度是否低于設(shè)定的第一閾值, 并且所述兩個(gè)詞的聲學(xué)相似度是否高于設(shè)定的第二閾值,如果是,則將所述兩個(gè)詞作為錯(cuò) 詞對(duì)加入到錯(cuò)詞對(duì)集合中。11. 根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于, 所述通用語義相似度計(jì)算單元,具體用于計(jì)算每個(gè)類別中兩個(gè)詞的通用詞向量之間的 距離,并根據(jù)計(jì)算得到兩個(gè)詞的通用詞向量之間的距離確定所述兩個(gè)詞之間的通用語義相 似度。12. 根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于, 所述聲學(xué)相似度計(jì)算單元,具體用于計(jì)算每個(gè)類別中兩個(gè)詞的聲學(xué)距離,并根據(jù)計(jì)算 得到的兩個(gè)詞的聲學(xué)距離確定所述兩個(gè)詞之間的聲學(xué)相似度。13. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述模型構(gòu)建模塊包括: 標(biāo)注信息提取單元,用于提取所述錯(cuò)詞對(duì)集合中每個(gè)錯(cuò)詞對(duì)的標(biāo)注信息,所述標(biāo)注信 息用于表示所述錯(cuò)詞對(duì)中其中一個(gè)詞是否應(yīng)該識(shí)別為其中另一個(gè)詞; 語義特征提取單元,用于提取所述錯(cuò)詞對(duì)集合中識(shí)別錯(cuò)誤詞的語義特征,所述語義特 征包括;錯(cuò)詞的上下文相關(guān)環(huán)境特征、錯(cuò)詞的識(shí)別詞向量、錯(cuò)詞的通用詞向量; 聲學(xué)特征提取單元,用于提取所述錯(cuò)詞對(duì)集合中每個(gè)詞所對(duì)應(yīng)語音數(shù)據(jù)的聲學(xué)特征; 模型生成單元,用于利用提取的錯(cuò)詞對(duì)的標(biāo)注信息、語義特征及聲學(xué)特征,構(gòu)建錯(cuò)詞檢 測(cè)模型。
【專利摘要】本發(fā)明公開了一種語音識(shí)別后處理方法及系統(tǒng),該方法包括:預(yù)先利用語音識(shí)別容易出錯(cuò)的詞對(duì)構(gòu)建錯(cuò)詞檢測(cè)模型;在接收到待識(shí)別語音數(shù)據(jù)后,對(duì)所述語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到識(shí)別結(jié)果;依次將所述識(shí)別結(jié)果中的各詞與通用詞典中的每個(gè)詞組成詞對(duì),并提取詞對(duì)中所述識(shí)別結(jié)果中各詞的語義特征及聲學(xué)特征,以及詞典詞的聲學(xué)特征;利用所述詞對(duì)的語義特征和聲學(xué)特征、以及所述錯(cuò)詞檢測(cè)模型,依次檢測(cè)所述識(shí)別結(jié)果中的各詞,得到修正后的識(shí)別結(jié)果。利用本發(fā)明,可以提高語音識(shí)別結(jié)果后處理的效果,準(zhǔn)確修正識(shí)別結(jié)果中錯(cuò)誤詞。
【IPC分類】G10L15/26, G10L15/06
【公開號(hào)】CN105244029
【申請(qǐng)?zhí)枴緾N201510560841
【發(fā)明人】金重九, 胡加學(xué), 趙乾, 王道廣, 于振華, 孫昌年
【申請(qǐng)人】科大訊飛股份有限公司
【公開日】2016年1月13日
【申請(qǐng)日】2015年8月28日