語音處理方法、裝置、電子設備和存儲介質與流程

文檔序號：40590628發(fā)布日期：2025-01-07 20:30閱讀：7來源：國知局

本技術涉及語音處理領域，并且更具體地，涉及語音處理領域中一種語音處理方法、裝置、電子設備和存儲介質。

背景技術：

1、隨著信息技術的發(fā)展，用戶可以利用電子設備進行各種活動，用戶可以通過電子設備安裝的語音助手實現(xiàn)打電話、點播音樂、報時與查詢天氣等功能。在使用的過程中，由于語音采集設備或者環(huán)境等原因，用戶輸入的語音信息有時會存在缺失，導致電子設備無法執(zhí)行對應的控制操作。

2、在相關技術方案中，可通過發(fā)出提示信息提示用戶重新輸入語音信息，獲取到完整的語音信息，進而根據(jù)完整的語音信息控制電子設備執(zhí)行對應的控制操作，通過這種方式控制電子設備，存在重復獲取語音信息的情況。

技術實現(xiàn)思路

1、本技術提供了一種語音處理方法、裝置、電子設備和存儲介質，該方法能夠不需要重復獲取語音，即可對第一語音信號缺失的內容進行補充，提高了語音交互的準確性。

2、第一方面，提供了一種語音處理方法，該方法包括：接收第一語音信號，獲取第一語音信號對應的第一文本內容；若第一文本內容存在賓語缺失，則獲取多模輸入數(shù)據(jù)，多模輸入數(shù)據(jù)為通過至少一種輸入方式采集到的數(shù)據(jù)；基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容；基于賓語內容和第一文本內容確定第二文本內容，執(zhí)行第二文本內容對應的指令。

3、采用上述方案，在確定接收到的第一語音信號對應的第一文本內容存在賓語缺失時，能夠獲取通過不同輸入方式采集到的多模輸入數(shù)據(jù)，進而通過多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容，最后通過賓語內容和第一文本內容確定第二文本內容，執(zhí)行第二文本內容對應的指令。由于使用通過不同輸入方式采集到的多模輸入數(shù)據(jù)確定第一語音信號對應的第一文本內容缺失的賓語內容，對第一文本內容進行補充得到第二文本內容，執(zhí)行第二文本內容對應的指令，由此不需要重復獲取第一語音信號，也可執(zhí)行對應的指令，能夠提高語音交互過程中的便捷性。

4、結合第一方面，在某些可能的實現(xiàn)方式中，多模輸入數(shù)據(jù)包括圖像數(shù)據(jù)、觸摸數(shù)據(jù)、以及與第一語音信號的接收順序相鄰的第二語音信號，基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容，包括：將第二語音信號轉換為第三文本內容，識別第三文本內容中包含的參數(shù)項，確定參數(shù)項為第一文本內容缺失的賓語內容；和/或，基于圖像數(shù)據(jù)確定發(fā)出第一語音信號的人物的注視區(qū)域，識別注視區(qū)域的物體信息，確定物體信息為第一文本內容缺失的賓語內容；和/或，基于觸摸數(shù)據(jù)確定人物在觸摸屏幕所觸發(fā)的應用程序，確定應用程序的程序參數(shù)，基于程序參數(shù)確定第一文本內容缺失的賓語內容。

5、采用上述方案，基于通過不同的輸入方式獲取到的多模輸入數(shù)據(jù)確定第一語音信號缺失的賓語內容，提高獲取到第一語音信號缺失的賓語內容的豐富性，并且通過多模輸入數(shù)據(jù)確定第一內容缺失的賓語內容，賓語內容與第一語音信號關聯(lián)，在一定程度上能夠提高通過多模輸入數(shù)據(jù)對第一文本內容進行補充的準確性。

6、結合第一方面，在某些可能的實現(xiàn)方式中，基于賓語內容和第一文本內容確定第二文本內容，執(zhí)行第二文本內容對應的指令，包括：若第二文本內容存在多個，則判斷執(zhí)行基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容的步驟是否為初次執(zhí)行；基于判斷結果在多個第二文本內容中確定第四文本內容，執(zhí)行第四文本內容對應的指令。

7、結合第一方面，在某些可能的實現(xiàn)方式中，基于判斷結果在多個第二文本內容中確定第四文本內容，包括：若判斷結果為初次執(zhí)行，則確定通過參數(shù)項為賓語內容得到的第二文本內容為第四文本內容；若判斷結果為非初次執(zhí)行，則確定執(zhí)行前續(xù)指令中第一語音信號缺失的賓語內容對應的輸入方式，確定以輸入方式得到的第二文本內容為第四文本內容。

8、采用上述方案，得到對第一語音信號進行補充的第二文本內容后，在第二文本內容存在多個時，根據(jù)判斷執(zhí)行基于多模輸入數(shù)據(jù)確定第一語音信號缺失的賓語內容的步驟是否為初次執(zhí)行的判斷結果，在多個第二文本內容中確定第四文本內容，能夠在第二文本內容中準確確定第四文本內容。

9、結合第一方面，在某些可能的實現(xiàn)方式中，基于判斷結果在多個第二文本內容中確定第四文本內容，執(zhí)行第四文本內容對應的指令，包括：將第四文本內容轉換為第三語音信號，播報第三語音信號；若接收到人物基于第三語音信號觸發(fā)的執(zhí)行指令，則執(zhí)行第三語音信號對應的指令；若接收到人物基于第三語音信號觸發(fā)的不執(zhí)行指令，則在多個第二文本內容中重新確定第四文本內容，將第四文本內容轉換為第三語音信號，并播報第三語音信號，直至滿足預設條件，預設條件為接收到基于第三語音信號觸發(fā)的執(zhí)行指令，執(zhí)行第三語音信號對應的指令，或者更新完成第四文本內容，未接收到基于第四文本內容轉換的第三語音信號觸發(fā)的執(zhí)行指令。

10、采用上述方案，在播報第三語音信號后，根據(jù)接收到的基于第三語音信號觸發(fā)的執(zhí)行指令，確定是否執(zhí)行第三語音信號，或者重新確定生成轉換為第三語音信號的第四文本內容，進而得到新的第三語音信號，能夠根據(jù)接收到的指令更新第三語音信號，提高了第三語音信號更新的便捷性。

11、結合第一方面，在某些可能的實現(xiàn)方式中，基于賓語內容和第一文本內容確定第二文本內容，執(zhí)行第二文本內容對應的指令，包括：將第二文本內容輸入至語義模型；若語義模型的輸出結果為第二文本內容語義完整，則執(zhí)行第二文本內容對應的指令。

12、采用上述方案，通過將第二文本內容輸入至語義模型，進而在語義模型的輸出及誒過為第二文本內容語義完整時，執(zhí)行第二文本內容對應的指令，避免輸入語義不完整的第二文本內容，導致無法執(zhí)行對應的指令。

13、結合第一方面，在某些可能的實現(xiàn)方式中，獲取第一語音信號對應的第一文本內容之后，還包括：劃分第一文本內容所包含的詞語；基于詞語之間的語法關系確定第一文本內容是否存在賓語缺失。

14、采用上述方案，通過劃分第一文本內容所包含的詞語，確定詞語之間的語法關系，實現(xiàn)了確定第一文本內容是否存在賓語缺失，為后續(xù)是否執(zhí)行基于多模輸入數(shù)據(jù)對第一文本內容進行補充提供了判斷依據(jù)。

15、第二方面，提供了一種語音處理裝置，該裝置包括：

16、接收單元，用于接收第一語音信號，獲取第一語音信號對應的第一文本內容；

17、獲取單元，用于若第一文本內容存在賓語缺失，則獲取多模輸入數(shù)據(jù)，多模輸入數(shù)據(jù)為通過至少一種輸入方式采集到的數(shù)據(jù)；

18、確定單元，用于基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容；

19、執(zhí)行單元，用于基于賓語內容和第一文本內容確定第二文本內容，執(zhí)行第二文本內容對應的指令。

20、第三方面，提供一種電子設備，包括：存儲器，用于存儲可執(zhí)行程序代碼；處理器，用于從存儲器中調用并運行可執(zhí)行程序代碼，使得電子設備執(zhí)行上述第一方面或第一方面任意一種可能的實現(xiàn)方式中的方法。

21、第四方面，提供了一種計算機程序產(chǎn)品，該計算機程序產(chǎn)品包括：計算機程序代碼，當該計算機程序代碼在計算機上運行時，使得該計算機執(zhí)行上述第一方面或第一方面任意一種可能的實現(xiàn)方式中的方法。

22、第五方面，提供了一種計算機可讀存儲介質，該計算機可讀存儲介質存儲有計算機程序代碼，當該計算機程序代碼在計算機上運行時，使得該計算機執(zhí)行上述第一方面或第一方面任意一種可能的實現(xiàn)方式中的方法。

完整全部詳細技術資料下載

當前第1頁1 2

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：高嶺士
技術所有人：長城汽車股份有限公司
我是此專利的發(fā)明人

上一篇：一種建筑鋁模板支撐連接組件的制作方法
上一篇：一種大噸位感應爐用IGBT中頻電源裝置的制作方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音處理方法、裝置、電子設備和存儲介質與流程

語音處理方法、裝置、電子設備和存儲介質與流程