基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)與流程

文檔序號(hào)：40412807發(fā)布日期：2024-12-24 14:45閱讀：16來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)與流程

本發(fā)明涉及人機(jī)交互，具體地說(shuō)是一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)。

背景技術(shù)：

1、目前，智能設(shè)備的操作大多依賴于觸控界面，這在用戶雙手忙碌或在特定環(huán)境下顯得不夠便捷。雖然市場(chǎng)上存在一些基于語(yǔ)音的控制系統(tǒng)，但通常只能處理簡(jiǎn)單的命令，對(duì)于復(fù)雜的功能頁(yè)面調(diào)度存在局限性，無(wú)法滿足用戶對(duì)智能設(shè)備操作的高效性和個(gè)性化需求。

2、故如何能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令，并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面，提高操作的便捷性和用戶體驗(yàn)是目前亟待解決的技術(shù)問(wèn)題。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的技術(shù)任務(wù)是提供一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)，來(lái)解決如何能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令，并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面，提高操作的便捷性和用戶體驗(yàn)的問(wèn)題。

2、本發(fā)明的技術(shù)任務(wù)是按以下方式實(shí)現(xiàn)的，一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法，該方法是通過(guò)語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)對(duì)用戶語(yǔ)音指令的準(zhǔn)確捕捉和解析，進(jìn)而智能調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面；具體如下：

3、語(yǔ)音采集：收集用戶的語(yǔ)音指令，獲取語(yǔ)音信號(hào)；

4、語(yǔ)音信號(hào)預(yù)處理：對(duì)采集的語(yǔ)音信號(hào)進(jìn)行降噪及增強(qiáng)的預(yù)處理操作；

5、語(yǔ)音識(shí)別：采用循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)構(gòu)建深度學(xué)習(xí)模型，經(jīng)過(guò)訓(xùn)練后，對(duì)語(yǔ)音信號(hào)進(jìn)行界面，并將聲學(xué)特征轉(zhuǎn)換為文本序列，再將文本序列進(jìn)行語(yǔ)法及標(biāo)點(diǎn)的修正，并輸出識(shí)別后的文本數(shù)據(jù)；

6、自然語(yǔ)言理解：解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容，并采用分類方法提取用戶意圖；

7、意圖映射：對(duì)被語(yǔ)音操控的系統(tǒng)建立關(guān)鍵詞或短語(yǔ)庫(kù)，對(duì)語(yǔ)音內(nèi)容進(jìn)行分析及捕捉，將用戶意圖映射到具體的系統(tǒng)功能頁(yè)面；

8、頁(yè)面調(diào)度：根據(jù)語(yǔ)音映射結(jié)果，調(diào)度并打開(kāi)相應(yīng)的系統(tǒng)功能頁(yè)面。

9、作為優(yōu)選，語(yǔ)音指令采用硬件設(shè)備采集，硬件設(shè)備包括麥克風(fēng)。

10、作為優(yōu)選，降噪采用維納濾波法，具體為：通過(guò)一個(gè)線性濾波器對(duì)不同的頻段進(jìn)行不同程度的抑制，達(dá)到降噪的目的。

11、作為優(yōu)選，增強(qiáng)采用預(yù)加重處理，具體為：一階采用fir高通濾波器實(shí)現(xiàn)，預(yù)加重系數(shù)在0.9到1.0之間；并在語(yǔ)音信號(hào)中提取聲學(xué)特征；

12、其中，聲學(xué)特征包括梅爾倒譜系數(shù)(mfcc)及線性預(yù)測(cè)倒譜系數(shù)(lpcc)；

13、梅爾倒譜系數(shù)提取過(guò)程具體如下：

14、分幀；

15、功率譜的周期圖估計(jì)；

16、mel濾波器組應(yīng)用；

17、對(duì)數(shù)濾波器組能量；

18、離散余弦變換(dct)。

19、更優(yōu)地，解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容具體如下：

20、對(duì)文本數(shù)據(jù)進(jìn)行分詞、標(biāo)注、語(yǔ)法分析及實(shí)體識(shí)別的預(yù)處理(除文本中的標(biāo)點(diǎn)符號(hào)、數(shù)字、特殊字符等的非語(yǔ)言元素，并轉(zhuǎn)換為小寫(xiě))，獲取預(yù)處理后的文本數(shù)據(jù)；

21、對(duì)預(yù)處理后的文本數(shù)據(jù)進(jìn)行依存關(guān)系分析。

22、一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng)，該系統(tǒng)包括：

23、語(yǔ)音采集模塊，用于收集用戶的語(yǔ)音指令，獲取語(yǔ)音信號(hào)；

24、語(yǔ)音信號(hào)預(yù)處理模塊，用于對(duì)采集的語(yǔ)音信號(hào)進(jìn)行降噪及增強(qiáng)的預(yù)處理操作；

25、語(yǔ)音識(shí)別模塊，用于采用循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)構(gòu)建深度學(xué)習(xí)模型，經(jīng)過(guò)訓(xùn)練后，對(duì)語(yǔ)音信號(hào)進(jìn)行界面，并將聲學(xué)特征轉(zhuǎn)換為文本序列，再將文本序列進(jìn)行語(yǔ)法及標(biāo)點(diǎn)的修正，并輸出識(shí)別后的文本數(shù)據(jù)；

26、自然語(yǔ)言理解模塊，用于解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容，并采用分類方法提取用戶意圖；

27、意圖映射模塊，用于對(duì)被語(yǔ)音操控的系統(tǒng)建立關(guān)鍵詞或短語(yǔ)庫(kù)，對(duì)語(yǔ)音內(nèi)容進(jìn)行分析及捕捉，將用戶意圖映射到具體的系統(tǒng)功能頁(yè)面；

28、頁(yè)面調(diào)度模塊，用于根據(jù)語(yǔ)音映射結(jié)果，調(diào)度并打開(kāi)相應(yīng)的系統(tǒng)功能頁(yè)面。

29、作為優(yōu)選，語(yǔ)音信號(hào)預(yù)處理模塊包括：

30、降噪子模塊，用于對(duì)語(yǔ)音信號(hào)進(jìn)行降噪處理，降噪采用維納濾波法，具體為：通過(guò)一個(gè)線性濾波器對(duì)不同的頻段進(jìn)行不同程度的抑制，達(dá)到降噪的目的；

31、增強(qiáng)子模塊，用于對(duì)語(yǔ)音信號(hào)進(jìn)行增強(qiáng)處理，增強(qiáng)采用預(yù)加重處理，具體為：一階采用fir高通濾波器實(shí)現(xiàn)，預(yù)加重系數(shù)在0.9到1.0之間；并在語(yǔ)音信號(hào)中提取聲學(xué)特征；

32、其中，聲學(xué)特征包括梅爾倒譜系數(shù)(mfcc)及線性預(yù)測(cè)倒譜系數(shù)(lpcc)；

33、梅爾倒譜系數(shù)提取過(guò)程具體如下：

34、①分幀；

35、②功率譜的周期圖估計(jì)；

36、③mel濾波器組應(yīng)用；

37、④對(duì)數(shù)濾波器組能量；

38、⑤離散余弦變換(dct)。

39、更優(yōu)地，自然語(yǔ)言理解模塊包括：

40、文本預(yù)處理子模塊，用于對(duì)文本數(shù)據(jù)進(jìn)行分詞、標(biāo)注、語(yǔ)法分析及實(shí)體識(shí)別的預(yù)處理(除文本中的標(biāo)點(diǎn)符號(hào)、數(shù)字、特殊字符等的非語(yǔ)言元素，并轉(zhuǎn)換為小寫(xiě))，獲取預(yù)處理后的文本數(shù)據(jù)；

41、依存關(guān)系分析子模塊，用于對(duì)預(yù)處理后的文本數(shù)據(jù)進(jìn)行依存關(guān)系分析。

42、一種電子設(shè)備，包括：存儲(chǔ)器和至少一個(gè)處理器；

43、其中，所述存儲(chǔ)器上存儲(chǔ)有計(jì)算機(jī)程序；

44、所述至少一個(gè)處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序，使得所述至少一個(gè)處理器執(zhí)行如上述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法。

45、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序可被處理器執(zhí)行以實(shí)現(xiàn)如上述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法。

46、本發(fā)明的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)具有以下優(yōu)點(diǎn)：

47、(一)本發(fā)明利用深度學(xué)習(xí)算法提高語(yǔ)音識(shí)別的準(zhǔn)確率，通過(guò)自然語(yǔ)言處理技術(shù)理解用戶的自然語(yǔ)言指令，能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令，并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面，以提高操作的便捷性和用戶體驗(yàn)；

48、(二)本發(fā)明采用端到端的深度學(xué)習(xí)算法，提高了語(yǔ)音識(shí)別的準(zhǔn)確率和響應(yīng)速度；

49、(三)本發(fā)明利用自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)對(duì)復(fù)雜指令的理解和解析；

50、(四)本發(fā)明設(shè)計(jì)智能上下文理解機(jī)制，能夠根據(jù)用戶的歷史操作和當(dāng)前環(huán)境智能預(yù)測(cè)用戶意圖；

51、(五)本發(fā)明實(shí)現(xiàn)多輪對(duì)話管理，支持用戶在復(fù)雜任務(wù)中的連續(xù)交互；

52、(六)本發(fā)明實(shí)現(xiàn)了對(duì)復(fù)雜語(yǔ)音指令的高準(zhǔn)確度識(shí)別，提升了系統(tǒng)的智能性和用戶體驗(yàn)；

53、(七)本發(fā)明通過(guò)自然語(yǔ)言理解，用戶可以用自然語(yǔ)言與設(shè)備交互，無(wú)需記憶特定命令；

54、(八)本發(fā)明智能上下文理解機(jī)制，根據(jù)用戶的歷史操作和當(dāng)前環(huán)境智能預(yù)測(cè)用戶意圖，能夠提供個(gè)性化的服務(wù)，提高了用戶滿意度；

55、(九)本發(fā)明對(duì)多輪對(duì)話管理，支持用戶在復(fù)雜任務(wù)中的連續(xù)交互，使得用戶在執(zhí)行復(fù)雜任務(wù)時(shí)更加流暢，減少了操作步驟。

技術(shù)特征：

1.一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法，其特征在于，該方法是通過(guò)語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)對(duì)用戶語(yǔ)音指令的準(zhǔn)確捕捉和解析，進(jìn)而智能調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面；具體如下：

2.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法，其特征在于，語(yǔ)音指令采用硬件設(shè)備采集，硬件設(shè)備包括麥克風(fēng)。

3.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法，其特征在于，降噪采用維納濾波法，具體為：通過(guò)一個(gè)線性濾波器對(duì)不同的頻段進(jìn)行不同程度的抑制，達(dá)到降噪的目的。

4.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法，其特征在于，增強(qiáng)采用預(yù)加重處理，具體為：一階采用fir高通濾波器實(shí)現(xiàn)，預(yù)加重系數(shù)在0.9到1.0之間；并在語(yǔ)音信號(hào)中提取聲學(xué)特征；

5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法，其特征在于，解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容具體如下：

6.一種基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng)，其特征在于，該系統(tǒng)包括：

7.根據(jù)權(quán)利要求6所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng)，其特征在于，語(yǔ)音信號(hào)預(yù)處理模塊包括：

8.根據(jù)權(quán)利要求6或7所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度系統(tǒng)，其特征在于，自然語(yǔ)言理解模塊包括：

9.一種電子設(shè)備，其特征在于，包括：存儲(chǔ)器和至少一個(gè)處理器；

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序可被處理器執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至5中任一項(xiàng)所述的基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法。

技術(shù)總結(jié)
本發(fā)明公開(kāi)了基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)，屬于人機(jī)交互技術(shù)領(lǐng)域，本發(fā)明要解決的技術(shù)問(wèn)題為如何能夠準(zhǔn)確識(shí)別用戶的語(yǔ)音指令，并智能地調(diào)度相應(yīng)的系統(tǒng)功能頁(yè)面，提高操作的便捷性和用戶體驗(yàn)，采用的技術(shù)方案為：語(yǔ)音采集：收集用戶的語(yǔ)音指令，獲取語(yǔ)音信號(hào)；語(yǔ)音信號(hào)預(yù)處理：對(duì)采集的語(yǔ)音信號(hào)進(jìn)行降噪及增強(qiáng)的預(yù)處理操作；語(yǔ)音識(shí)別：采用循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建深度學(xué)習(xí)模型，經(jīng)過(guò)訓(xùn)練后，對(duì)語(yǔ)音信號(hào)進(jìn)行界面，并將聲學(xué)特征轉(zhuǎn)換為文本序列，再將文本序列進(jìn)行語(yǔ)法及標(biāo)點(diǎn)的修正，并輸出識(shí)別后的文本數(shù)據(jù)；自然語(yǔ)言理解：解析文本數(shù)據(jù)中的語(yǔ)義內(nèi)容，并采用分類方法提取用戶意圖；意圖映射；頁(yè)面調(diào)度。

技術(shù)研發(fā)人員：李福民,譚欣,公茂強(qiáng),劉音,鐘偉
受保護(hù)的技術(shù)使用者：浪潮軟件科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/23

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李福民,譚欣,公茂強(qiáng),劉音,鐘偉
技術(shù)所有人：浪潮軟件科技有限公司
我是此專利的發(fā)明人

上一篇：一種翻轉(zhuǎn)置物凳
上一篇：一種船舶傾角檢測(cè)裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)與流程

基于語(yǔ)音識(shí)別的系統(tǒng)功能頁(yè)面智能調(diào)度方法、系統(tǒng)、設(shè)備及介質(zhì)與流程