本發(fā)明涉及人機(jī)交互,具體地說(shuō)是一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)。
背景技術(shù):
1、目前,智能設(shè)備的操作大多依賴于觸控界面,這在用戶雙手忙碌或在特定環(huán)境下顯得不夠便捷。雖然市場(chǎng)上存在一些基于語(yǔ)音的控制系統(tǒng),但通常只能處理簡(jiǎn)單的命令,對(duì)于復(fù)雜的功能頁(yè)面調(diào)度存在局限性,無(wú)法滿足用戶對(duì)智能設(shè)備操作的高效性和個(gè)性化需求。
2、故如何能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令,并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面,提高操作的便捷性和用戶體驗(yàn)是目前亟待解決的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的技術(shù)任務(wù)是提供一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì),來(lái)解決如何能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令,并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面,提高操作的便捷性和用戶體驗(yàn)的問(wèn)題。
2、本發(fā)明的技術(shù)任務(wù)是按以下方式實(shí)現(xiàn)的,一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法,該方法是通過(guò)語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)對(duì)用戶語(yǔ)音指令的準(zhǔn)確捕捉和解析,進(jìn)而智能調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面;具體如下:
3、語(yǔ)音采集:收集用戶的語(yǔ)音指令,獲取語(yǔ)音信號(hào);
4、語(yǔ)音信號(hào)預(yù)處理:對(duì)采集的語(yǔ)音信號(hào)進(jìn)行降噪及增強(qiáng)的預(yù)處理操作;
5、語(yǔ)音識(shí)別:采用循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)構(gòu)建深度學(xué)習(xí)模型,經(jīng)過(guò)訓(xùn)練后,對(duì)語(yǔ)音信號(hào)進(jìn)行界面,并將聲學(xué)特征轉(zhuǎn)換為文本序列,再將文本序列進(jìn)行語(yǔ)法及標(biāo)點(diǎn)的修正,并輸出識(shí)別后的文本數(shù)據(jù);
6、自然語(yǔ)言理解:解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容,并采用分類方法提取用戶意圖;
7、意圖映射:對(duì)被語(yǔ)音操控的系統(tǒng)建立關(guān)鍵詞或短語(yǔ)庫(kù),對(duì)語(yǔ)音內(nèi)容進(jìn)行分析及捕捉,將用戶意圖映射到具體的系統(tǒng)功能頁(yè)面;
8、頁(yè)面調(diào)度:根據(jù)語(yǔ)音映射結(jié)果,調(diào)度并打開(kāi)相應(yīng)的系統(tǒng)功能頁(yè)面。
9、作為優(yōu)選,語(yǔ)音指令采用硬件設(shè)備采集,硬件設(shè)備包括麥克風(fēng)。
10、作為優(yōu)選,降噪采用維納濾波法,具體為:通過(guò)一個(gè)線性濾波器對(duì)不同的頻段進(jìn)行不同程度的抑制,達(dá)到降噪的目的。
11、作為優(yōu)選,增強(qiáng)采用預(yù)加重處理,具體為:一階采用fir高通濾波器實(shí)現(xiàn),預(yù)加重系數(shù)在0.9到1.0之間;并在語(yǔ)音信號(hào)中提取聲學(xué)特征;
12、其中,聲學(xué)特征包括梅爾倒譜系數(shù)(mfcc)及線性預(yù)測(cè)倒譜系數(shù)(lpcc);
13、梅爾倒譜系數(shù)提取過(guò)程具體如下:
14、分幀;
15、功率譜的周期圖估計(jì);
16、mel濾波器組應(yīng)用;
17、對(duì)數(shù)濾波器組能量;
18、離散余弦變換(dct)。
19、更優(yōu)地,解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容具體如下:
20、對(duì)文本數(shù)據(jù)進(jìn)行分詞、標(biāo)注、語(yǔ)法分析及實(shí)體識(shí)別的預(yù)處理(除文本中的標(biāo)點(diǎn)符號(hào)、數(shù)字、特殊字符等的非語(yǔ)言元素,并轉(zhuǎn)換為小寫(xiě)),獲取預(yù)處理后的文本數(shù)據(jù);
21、對(duì)預(yù)處理后的文本數(shù)據(jù)進(jìn)行依存關(guān)系分析。
22、一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng),該系統(tǒng)包括:
23、語(yǔ)音采集模塊,用于收集用戶的語(yǔ)音指令,獲取語(yǔ)音信號(hào);
24、語(yǔ)音信號(hào)預(yù)處理模塊,用于對(duì)采集的語(yǔ)音信號(hào)進(jìn)行降噪及增強(qiáng)的預(yù)處理操作;
25、語(yǔ)音識(shí)別模塊,用于采用循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)構(gòu)建深度學(xué)習(xí)模型,經(jīng)過(guò)訓(xùn)練后,對(duì)語(yǔ)音信號(hào)進(jìn)行界面,并將聲學(xué)特征轉(zhuǎn)換為文本序列,再將文本序列進(jìn)行語(yǔ)法及標(biāo)點(diǎn)的修正,并輸出識(shí)別后的文本數(shù)據(jù);
26、自然語(yǔ)言理解模塊,用于解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容,并采用分類方法提取用戶意圖;
27、意圖映射模塊,用于對(duì)被語(yǔ)音操控的系統(tǒng)建立關(guān)鍵詞或短語(yǔ)庫(kù),對(duì)語(yǔ)音內(nèi)容進(jìn)行分析及捕捉,將用戶意圖映射到具體的系統(tǒng)功能頁(yè)面;
28、頁(yè)面調(diào)度模塊,用于根據(jù)語(yǔ)音映射結(jié)果,調(diào)度并打開(kāi)相應(yīng)的系統(tǒng)功能頁(yè)面。
29、作為優(yōu)選,語(yǔ)音信號(hào)預(yù)處理模塊包括:
30、降噪子模塊,用于對(duì)語(yǔ)音信號(hào)進(jìn)行降噪處理,降噪采用維納濾波法,具體為:通過(guò)一個(gè)線性濾波器對(duì)不同的頻段進(jìn)行不同程度的抑制,達(dá)到降噪的目的;
31、增強(qiáng)子模塊,用于對(duì)語(yǔ)音信號(hào)進(jìn)行增強(qiáng)處理,增強(qiáng)采用預(yù)加重處理,具體為:一階采用fir高通濾波器實(shí)現(xiàn),預(yù)加重系數(shù)在0.9到1.0之間;并在語(yǔ)音信號(hào)中提取聲學(xué)特征;
32、其中,聲學(xué)特征包括梅爾倒譜系數(shù)(mfcc)及線性預(yù)測(cè)倒譜系數(shù)(lpcc);
33、梅爾倒譜系數(shù)提取過(guò)程具體如下:
34、①分幀;
35、②功率譜的周期圖估計(jì);
36、③mel濾波器組應(yīng)用;
37、④對(duì)數(shù)濾波器組能量;
38、⑤離散余弦變換(dct)。
39、更優(yōu)地,自然語(yǔ)言理解模塊包括:
40、文本預(yù)處理子模塊,用于對(duì)文本數(shù)據(jù)進(jìn)行分詞、標(biāo)注、語(yǔ)法分析及實(shí)體識(shí)別的預(yù)處理(除文本中的標(biāo)點(diǎn)符號(hào)、數(shù)字、特殊字符等的非語(yǔ)言元素,并轉(zhuǎn)換為小寫(xiě)),獲取預(yù)處理后的文本數(shù)據(jù);
41、依存關(guān)系分析子模塊,用于對(duì)預(yù)處理后的文本數(shù)據(jù)進(jìn)行依存關(guān)系分析。
42、一種電子設(shè)備,包括:存儲(chǔ)器和至少一個(gè)處理器;
43、其中,所述存儲(chǔ)器上存儲(chǔ)有計(jì)算機(jī)程序;
44、所述至少一個(gè)處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,使得所述至少一個(gè)處理器執(zhí)行如上述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法。
45、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序可被處理器執(zhí)行以實(shí)現(xiàn)如上述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法。
46、本發(fā)明的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)具有以下優(yōu)點(diǎn):
47、(一)本發(fā)明利用深度學(xué)習(xí)算法提高語(yǔ)音識(shí)別的準(zhǔn)確率,通過(guò)自然語(yǔ)言處理技術(shù)理解用戶的自然語(yǔ)言指令,能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令,并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面,以提高操作的便捷性和用戶體驗(yàn);
48、(二)本發(fā)明采用端到端的深度學(xué)習(xí)算法,提高了語(yǔ)音識(shí)別的準(zhǔn)確率和響應(yīng)速度;
49、(三)本發(fā)明利用自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)對(duì)復(fù)雜指令的理解和解析;
50、(四)本發(fā)明設(shè)計(jì)智能上下文理解機(jī)制,能夠根據(jù)用戶的歷史操作和當(dāng)前環(huán)境智能預(yù)測(cè)用戶意圖;
51、(五)本發(fā)明實(shí)現(xiàn)多輪對(duì)話管理,支持用戶在復(fù)雜任務(wù)中的連續(xù)交互;
52、(六)本發(fā)明實(shí)現(xiàn)了對(duì)復(fù)雜語(yǔ)音指令的高準(zhǔn)確度識(shí)別,提升了系統(tǒng)的智能性和用戶體驗(yàn);
53、(七)本發(fā)明通過(guò)自然語(yǔ)言理解,用戶可以用自然語(yǔ)言與設(shè)備交互,無(wú)需記憶特定命令;
54、(八)本發(fā)明智能上下文理解機(jī)制,根據(jù)用戶的歷史操作和當(dāng)前環(huán)境智能預(yù)測(cè)用戶意圖,能夠提供個(gè)性化的服務(wù),提高了用戶滿意度;
55、(九)本發(fā)明對(duì)多輪對(duì)話管理,支持用戶在復(fù)雜任務(wù)中的連續(xù)交互,使得用戶在執(zhí)行復(fù)雜任務(wù)時(shí)更加流暢,減少了操作步驟。
1.一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法,其特征在于,該方法是通過(guò)語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)對(duì)用戶語(yǔ)音指令的準(zhǔn)確捕捉和解析,進(jìn)而智能調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面;具體如下:
2.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法,其特征在于,語(yǔ)音指令采用硬件設(shè)備采集,硬件設(shè)備包括麥克風(fēng)。
3.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法,其特征在于,降噪采用維納濾波法,具體為:通過(guò)一個(gè)線性濾波器對(duì)不同的頻段進(jìn)行不同程度的抑制,達(dá)到降噪的目的。
4.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法,其特征在于,增強(qiáng)采用預(yù)加重處理,具體為:一階采用fir高通濾波器實(shí)現(xiàn),預(yù)加重系數(shù)在0.9到1.0之間;并在語(yǔ)音信號(hào)中提取聲學(xué)特征;
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法,其特征在于,解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容具體如下:
6.一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng),其特征在于,該系統(tǒng)包括:
7.根據(jù)權(quán)利要求6所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng),其特征在于,語(yǔ)音信號(hào)預(yù)處理模塊包括:
8.根據(jù)權(quán)利要求6或7所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng),其特征在于,自然語(yǔ)言理解模塊包括:
9.一種電子設(shè)備,其特征在于,包括:存儲(chǔ)器和至少一個(gè)處理器;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序可被處理器執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至5中任一項(xiàng)所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法。