一種語音即時(shí)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語音即時(shí)識(shí)別方法。
【背景技術(shù)】
[0002]隨著電子設(shè)備的快速發(fā)展與普及,對(duì)電子設(shè)備的智能化應(yīng)用程度也有了更高的要求。目前,語音識(shí)別技術(shù)為用戶提供了人機(jī)語音交互模式來控制電子設(shè)備的快捷途徑。用戶可以通過特定的語音喚醒應(yīng)用程序,說出設(shè)定的語音喚醒短語即可喚醒電子設(shè)備,并可根據(jù)語音提示的指令方便地進(jìn)行撥號(hào)、瀏覽網(wǎng)頁等進(jìn)一步操作。
[0003]另外,聲紋識(shí)別是一種利用人的聲音實(shí)現(xiàn)的語音識(shí)別技術(shù),由于人在講話時(shí)使用的發(fā)聲器官存在一定的差異性,任何兩個(gè)人聲音的聲紋圖譜都有差異,因此,聲紋可以作為表征個(gè)體差異的生物特征,也即可以通過建立聲紋特征模型來表征不同的個(gè)體,進(jìn)而利用該聲紋特征模塊進(jìn)行識(shí)別不同的個(gè)體。
[0004]本申請(qǐng)的發(fā)明人在實(shí)現(xiàn)本申請(qǐng)的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在如下技術(shù)缺陷:當(dāng)前已實(shí)現(xiàn)的語音識(shí)別方案中,聲紋識(shí)別和語音喚醒是分別獨(dú)立應(yīng)用的,例如,用戶需要啟用語音喚醒時(shí),電子設(shè)備中的語音喚醒應(yīng)用程序根據(jù)用戶輸入的語音數(shù)據(jù),與預(yù)設(shè)的喚醒短語如“語音小助手”或者“語音小秘書”等進(jìn)行匹配,如果用戶輸入的語音數(shù)據(jù)能夠與預(yù)設(shè)的喚醒短語相匹配,則執(zhí)行喚醒功能;否則,拒絕執(zhí)行喚醒功能;之后,用戶需要通過語音控制電子設(shè)備實(shí)現(xiàn)特定的操作時(shí),需要再次輸入相關(guān)的語音指令或語音信息,再通過電子設(shè)備中的聲紋確認(rèn)應(yīng)用程序?qū)τ脩糨斎氲恼Z音數(shù)據(jù)進(jìn)行文本相關(guān)或者文本無關(guān)的聲紋確認(rèn),如果聲紋確認(rèn)通過,則執(zhí)行相應(yīng)的指令操作,如果聲紋確認(rèn)未通過,則拒絕執(zhí)行相應(yīng)的指令操作。因此,上述的語音識(shí)別方案,存在用戶交互效率低下,響應(yīng)速度慢等缺陷或不足。
【發(fā)明內(nèi)容】
[0005]本申請(qǐng)所要解決的技術(shù)問題是克服現(xiàn)有技術(shù)中語音識(shí)別時(shí)交互效率低下的缺陷。
[0006]為了解決上述技術(shù)問題,本申請(qǐng)?zhí)峁┝艘环N語音即時(shí)識(shí)別方法,應(yīng)用于包括語音輸入模塊的語音即時(shí)識(shí)別系統(tǒng),所述方法包括:
[0007]所述語音輸入模塊接收語音數(shù)據(jù);
[0008]對(duì)接收到的所述語音數(shù)據(jù)進(jìn)行第一模式語音識(shí)別,所述第一模式語音識(shí)別包括識(shí)別所述語音數(shù)據(jù)中是否包含第一語音識(shí)別信息;
[0009]當(dāng)識(shí)別出所述語音數(shù)據(jù)中包含所述第一語音識(shí)別信息時(shí),依據(jù)所述語音數(shù)據(jù)進(jìn)行第二模式語音識(shí)別;
[0010]依據(jù)所述第二模式語音識(shí)別的結(jié)果,執(zhí)行或者拒絕執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作。
[0011]優(yōu)化的,所述第二模式語音識(shí)別包括:依據(jù)所述語音數(shù)據(jù)進(jìn)行預(yù)設(shè)命令相關(guān)的聲紋確認(rèn);
[0012]所述依據(jù)所述第二模式語音識(shí)別的結(jié)果,執(zhí)行或者拒絕執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作包括:如果所述預(yù)設(shè)命令相關(guān)的聲紋確認(rèn)的結(jié)果為通過,則執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作;如果所述預(yù)設(shè)命令相關(guān)的聲紋確認(rèn)的結(jié)果為未通過,則拒絕執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作。
[0013]優(yōu)化的,當(dāng)識(shí)別出所述語音數(shù)據(jù)中還包含所述第一語音識(shí)別信息以外的第二語音識(shí)別信息時(shí),執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作前還包括:依據(jù)所述第二語音識(shí)別信息進(jìn)行第三模式語音識(shí)別;依據(jù)所述第三模式語音識(shí)別的結(jié)果,執(zhí)行或者拒絕執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作及所述第二語音識(shí)別信息對(duì)應(yīng)的操作。
[0014]優(yōu)化的,所述第三模式語音識(shí)別包括:預(yù)設(shè)命令無關(guān)的聲紋確認(rèn);所述依據(jù)所述第三模式語音識(shí)別的結(jié)果,執(zhí)行或者拒絕執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作及所述第二語音識(shí)別信息對(duì)應(yīng)的操作包括:如果所述預(yù)設(shè)命令無關(guān)的聲紋確認(rèn)的結(jié)果為通過,則執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作及所述第二語音識(shí)別信息對(duì)應(yīng)的操作;如果所述預(yù)設(shè)命令無關(guān)的聲紋確認(rèn)的結(jié)果為未通過,則拒絕執(zhí)行所述第一語音識(shí)別信息對(duì)應(yīng)的操作及所述第二語音識(shí)別信息對(duì)應(yīng)的操作。
[0015]優(yōu)化的,所述的方法還包括:依據(jù)特定場(chǎng)景的語音數(shù)據(jù),對(duì)進(jìn)行所述預(yù)設(shè)命令無關(guān)的聲紋確認(rèn)所采用的模型進(jìn)行優(yōu)化訓(xùn)練。
[0016]優(yōu)化的,所述的方法還包括:根據(jù)第一指令設(shè)置或修改所述第一語音識(shí)別信息的集合,或者根據(jù)所述第一指令設(shè)置或修改所述第一語音識(shí)別信息與操作之間的對(duì)應(yīng)關(guān)系。
[0017]本發(fā)明的優(yōu)點(diǎn)在于:用戶通過語音識(shí)別信息進(jìn)行預(yù)設(shè)命令相關(guān)的聲紋確認(rèn)和綜合聲紋確認(rèn),以保證只有特定用戶的命令得到執(zhí)行,從而避免獨(dú)立的聲紋確認(rèn)步驟而產(chǎn)生的冗余交互,提高了交互效率;通過聲紋確認(rèn)匹配度的優(yōu)化訓(xùn)練,提高了聲紋確認(rèn)的性能和準(zhǔn)確性。
【附圖說明】
[0018]圖1是本發(fā)明的語音即時(shí)識(shí)別方法的示意圖;
[0019]圖2是實(shí)施例中使用本發(fā)明方法的語音即時(shí)識(shí)別系統(tǒng)的組成示意圖。
【具體實(shí)施方式】
[0020]本實(shí)施例涉及一種語音即時(shí)識(shí)別方法,該方法可應(yīng)用于智能移動(dòng)終端、平板電腦及其他任何具有語音識(shí)別功能的電子設(shè)備中。
[0021 ]本實(shí)施例中,所述第一語音識(shí)別信息為喚醒語音。
[0022]如圖1所示,本實(shí)施例方法具體包括如下主要步驟:
[0023]步驟S21,電子設(shè)備中的語音喚醒應(yīng)用程序識(shí)別用戶輸入的語音數(shù)據(jù),包括識(shí)別所述語音數(shù)據(jù)是否包含喚醒語音,以及所述語音數(shù)據(jù)是否僅包含喚醒語音;
[0024]步驟S22,如果所述語音數(shù)據(jù)僅包含喚醒語音,即所述語音數(shù)據(jù)為獨(dú)立的喚醒語音,則進(jìn)行預(yù)設(shè)命令相關(guān)的聲紋確認(rèn),如果通過聲紋確認(rèn),則執(zhí)行語音喚醒;否則拒絕執(zhí)行語音喚醒;
[0025]步驟S23,如果所述語音數(shù)據(jù)既包含喚醒語音,還包含喚醒語音以外的其他語音輸入(第二語音識(shí)別信息),則可以按照如下方式進(jìn)行聲紋確認(rèn):
[0026]方式一,利用喚醒語音進(jìn)行預(yù)設(shè)命令相關(guān)的聲紋確認(rèn),如果通過聲紋確認(rèn),則執(zhí)行語音喚醒;否則拒絕執(zhí)行語音喚醒;
[0027]方式二,利用喚醒語音以外的其他語音輸入進(jìn)行預(yù)設(shè)命令無關(guān)的聲紋確認(rèn),如果通過聲紋確認(rèn),則執(zhí)行語音喚醒和相應(yīng)的語音輸入對(duì)應(yīng)動(dòng)作;否則,拒絕執(zhí)行語音喚醒和相應(yīng)的語音輸入對(duì)應(yīng)動(dòng)作;
[0028]方式三,利用喚醒語音進(jìn)行預(yù)設(shè)命令相關(guān)的聲紋確認(rèn),同時(shí),利用喚醒語音以外的其他語音輸入進(jìn)行預(yù)設(shè)命令無關(guān)的聲紋確認(rèn),如果通過聲紋確認(rèn),則執(zhí)行語音喚醒和相應(yīng)的語音輸入對(duì)應(yīng)動(dòng)作;否則,拒絕執(zhí)行語音喚醒和相應(yīng)的語音輸入對(duì)應(yīng)動(dòng)作。
[0029]步驟S24,如果所述語音數(shù)據(jù)不包含喚醒語音,即所述語音數(shù)據(jù)為非喚醒語音,則拒絕執(zhí)行語音喚醒。
[0030]其中,上述步驟S21和S22可并行處理,語音喚醒和聲紋確認(rèn)都通過才執(zhí)行語音喚醒,否則繼續(xù)監(jiān)測(cè)用戶輸入的語音數(shù)據(jù)。
[0031]此外,上述步驟S21和S2