欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音處理方法、裝置、電子設備和存儲介質與流程

文檔序號:40590628發(fā)布日期:2025-01-07 20:30閱讀:7來源:國知局
語音處理方法、裝置、電子設備和存儲介質與流程

本技術涉及語音處理領域,并且更具體地,涉及語音處理領域中一種語音處理方法、裝置、電子設備和存儲介質。


背景技術:

1、隨著信息技術的發(fā)展,用戶可以利用電子設備進行各種活動,用戶可以通過電子設備安裝的語音助手實現(xiàn)打電話、點播音樂、報時與查詢天氣等功能。在使用的過程中,由于語音采集設備或者環(huán)境等原因,用戶輸入的語音信息有時會存在缺失,導致電子設備無法執(zhí)行對應的控制操作。

2、在相關技術方案中,可通過發(fā)出提示信息提示用戶重新輸入語音信息,獲取到完整的語音信息,進而根據(jù)完整的語音信息控制電子設備執(zhí)行對應的控制操作,通過這種方式控制電子設備,存在重復獲取語音信息的情況。


技術實現(xiàn)思路

1、本技術提供了一種語音處理方法、裝置、電子設備和存儲介質,該方法能夠不需要重復獲取語音,即可對第一語音信號缺失的內容進行補充,提高了語音交互的準確性。

2、第一方面,提供了一種語音處理方法,該方法包括:接收第一語音信號,獲取第一語音信號對應的第一文本內容;若第一文本內容存在賓語缺失,則獲取多模輸入數(shù)據(jù),多模輸入數(shù)據(jù)為通過至少一種輸入方式采集到的數(shù)據(jù);基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容;基于賓語內容和第一文本內容確定第二文本內容,執(zhí)行第二文本內容對應的指令。

3、采用上述方案,在確定接收到的第一語音信號對應的第一文本內容存在賓語缺失時,能夠獲取通過不同輸入方式采集到的多模輸入數(shù)據(jù),進而通過多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容,最后通過賓語內容和第一文本內容確定第二文本內容,執(zhí)行第二文本內容對應的指令。由于使用通過不同輸入方式采集到的多模輸入數(shù)據(jù)確定第一語音信號對應的第一文本內容缺失的賓語內容,對第一文本內容進行補充得到第二文本內容,執(zhí)行第二文本內容對應的指令,由此不需要重復獲取第一語音信號,也可執(zhí)行對應的指令,能夠提高語音交互過程中的便捷性。

4、結合第一方面,在某些可能的實現(xiàn)方式中,多模輸入數(shù)據(jù)包括圖像數(shù)據(jù)、觸摸數(shù)據(jù)、以及與第一語音信號的接收順序相鄰的第二語音信號,基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容,包括:將第二語音信號轉換為第三文本內容,識別第三文本內容中包含的參數(shù)項,確定參數(shù)項為第一文本內容缺失的賓語內容;和/或,基于圖像數(shù)據(jù)確定發(fā)出第一語音信號的人物的注視區(qū)域,識別注視區(qū)域的物體信息,確定物體信息為第一文本內容缺失的賓語內容;和/或,基于觸摸數(shù)據(jù)確定人物在觸摸屏幕所觸發(fā)的應用程序,確定應用程序的程序參數(shù),基于程序參數(shù)確定第一文本內容缺失的賓語內容。

5、采用上述方案,基于通過不同的輸入方式獲取到的多模輸入數(shù)據(jù)確定第一語音信號缺失的賓語內容,提高獲取到第一語音信號缺失的賓語內容的豐富性,并且通過多模輸入數(shù)據(jù)確定第一內容缺失的賓語內容,賓語內容與第一語音信號關聯(lián),在一定程度上能夠提高通過多模輸入數(shù)據(jù)對第一文本內容進行補充的準確性。

6、結合第一方面,在某些可能的實現(xiàn)方式中,基于賓語內容和第一文本內容確定第二文本內容,執(zhí)行第二文本內容對應的指令,包括:若第二文本內容存在多個,則判斷執(zhí)行基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容的步驟是否為初次執(zhí)行;基于判斷結果在多個第二文本內容中確定第四文本內容,執(zhí)行第四文本內容對應的指令。

7、結合第一方面,在某些可能的實現(xiàn)方式中,基于判斷結果在多個第二文本內容中確定第四文本內容,包括:若判斷結果為初次執(zhí)行,則確定通過參數(shù)項為賓語內容得到的第二文本內容為第四文本內容;若判斷結果為非初次執(zhí)行,則確定執(zhí)行前續(xù)指令中第一語音信號缺失的賓語內容對應的輸入方式,確定以輸入方式得到的第二文本內容為第四文本內容。

8、采用上述方案,得到對第一語音信號進行補充的第二文本內容后,在第二文本內容存在多個時,根據(jù)判斷執(zhí)行基于多模輸入數(shù)據(jù)確定第一語音信號缺失的賓語內容的步驟是否為初次執(zhí)行的判斷結果,在多個第二文本內容中確定第四文本內容,能夠在第二文本內容中準確確定第四文本內容。

9、結合第一方面,在某些可能的實現(xiàn)方式中,基于判斷結果在多個第二文本內容中確定第四文本內容,執(zhí)行第四文本內容對應的指令,包括:將第四文本內容轉換為第三語音信號,播報第三語音信號;若接收到人物基于第三語音信號觸發(fā)的執(zhí)行指令,則執(zhí)行第三語音信號對應的指令;若接收到人物基于第三語音信號觸發(fā)的不執(zhí)行指令,則在多個第二文本內容中重新確定第四文本內容,將第四文本內容轉換為第三語音信號,并播報第三語音信號,直至滿足預設條件,預設條件為接收到基于第三語音信號觸發(fā)的執(zhí)行指令,執(zhí)行第三語音信號對應的指令,或者更新完成第四文本內容,未接收到基于第四文本內容轉換的第三語音信號觸發(fā)的執(zhí)行指令。

10、采用上述方案,在播報第三語音信號后,根據(jù)接收到的基于第三語音信號觸發(fā)的執(zhí)行指令,確定是否執(zhí)行第三語音信號,或者重新確定生成轉換為第三語音信號的第四文本內容,進而得到新的第三語音信號,能夠根據(jù)接收到的指令更新第三語音信號,提高了第三語音信號更新的便捷性。

11、結合第一方面,在某些可能的實現(xiàn)方式中,基于賓語內容和第一文本內容確定第二文本內容,執(zhí)行第二文本內容對應的指令,包括:將第二文本內容輸入至語義模型;若語義模型的輸出結果為第二文本內容語義完整,則執(zhí)行第二文本內容對應的指令。

12、采用上述方案,通過將第二文本內容輸入至語義模型,進而在語義模型的輸出及誒過為第二文本內容語義完整時,執(zhí)行第二文本內容對應的指令,避免輸入語義不完整的第二文本內容,導致無法執(zhí)行對應的指令。

13、結合第一方面,在某些可能的實現(xiàn)方式中,獲取第一語音信號對應的第一文本內容之后,還包括:劃分第一文本內容所包含的詞語;基于詞語之間的語法關系確定第一文本內容是否存在賓語缺失。

14、采用上述方案,通過劃分第一文本內容所包含的詞語,確定詞語之間的語法關系,實現(xiàn)了確定第一文本內容是否存在賓語缺失,為后續(xù)是否執(zhí)行基于多模輸入數(shù)據(jù)對第一文本內容進行補充提供了判斷依據(jù)。

15、第二方面,提供了一種語音處理裝置,該裝置包括:

16、接收單元,用于接收第一語音信號,獲取第一語音信號對應的第一文本內容;

17、獲取單元,用于若第一文本內容存在賓語缺失,則獲取多模輸入數(shù)據(jù),多模輸入數(shù)據(jù)為通過至少一種輸入方式采集到的數(shù)據(jù);

18、確定單元,用于基于多模輸入數(shù)據(jù)確定第一文本內容缺失的賓語內容;

19、執(zhí)行單元,用于基于賓語內容和第一文本內容確定第二文本內容,執(zhí)行第二文本內容對應的指令。

20、第三方面,提供一種電子設備,包括:存儲器,用于存儲可執(zhí)行程序代碼;處理器,用于從存儲器中調用并運行可執(zhí)行程序代碼,使得電子設備執(zhí)行上述第一方面或第一方面任意一種可能的實現(xiàn)方式中的方法。

21、第四方面,提供了一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括:計算機程序代碼,當該計算機程序代碼在計算機上運行時,使得該計算機執(zhí)行上述第一方面或第一方面任意一種可能的實現(xiàn)方式中的方法。

22、第五方面,提供了一種計算機可讀存儲介質,該計算機可讀存儲介質存儲有計算機程序代碼,當該計算機程序代碼在計算機上運行時,使得該計算機執(zhí)行上述第一方面或第一方面任意一種可能的實現(xiàn)方式中的方法。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
庆阳市| 定西市| 华亭县| 木里| 东安县| 许昌县| 合山市| 德清县| 固安县| 梅州市| 德令哈市| 洞口县| 伊吾县| 乌兰察布市| 商都县| 静海县| 北川| 贡觉县| 大足县| 南皮县| 平顺县| 崇州市| 碌曲县| 正镶白旗| 合山市| 册亨县| 青铜峡市| 镇康县| 尼勒克县| 潢川县| 长泰县| 兴安盟| 曲麻莱县| 凤凰县| 衡阳县| 宜宾县| 宿州市| 宝清县| 永嘉县| 江源县| 明水县|