語音控制方法、裝置、介質(zhì)及設(shè)備與流程

文檔序號：40443535發(fā)布日期：2024-12-24 15:17閱讀：27來源：國知局

本申請涉及聲控，尤其涉及一種語音控制，特別涉及一種語音控制方法、裝置、介質(zhì)及設(shè)備。

背景技術(shù)：

1、聲控技術(shù)是一種可以將語音數(shù)據(jù)轉(zhuǎn)換成輸入指令，以控制智能設(shè)備運行的控制技術(shù)。為了讓智能設(shè)備能夠準確地按照用戶的實際需求執(zhí)行指定指令，通常需要用戶給出詳細且具體的控制指令，例如當用戶希望控制空調(diào)開啟并保持在25℃時，需要向空調(diào)發(fā)出一條明確的語音數(shù)據(jù)，即“請開啟空調(diào)，并保持在25℃“。

2、對于簡單的指令，用戶通?？梢宰龅骄唧w化描述控制智能設(shè)備的內(nèi)容，但是對于較為復雜的指令，當同樣需要用戶具體化描述控制智能設(shè)備的內(nèi)容并以語音形式發(fā)出時，往往會給用戶一種不夠智能的感受，導致用戶體驗度下降，且較為復雜的指令可能還會影響智能設(shè)備對指令的理解，進而影響智能設(shè)備對指令的識別準確率。

技術(shù)實現(xiàn)思路

1、本申請實施例提供一種語音控制方法、裝置、介質(zhì)及設(shè)備。利用本申請實施例提供的語音控制方法，以解決現(xiàn)有的語音控制方法存在智能化低、準確性差的問題。

2、本申請實施例一方面提供了一種語音控制方法，包括：

3、接收用戶發(fā)起的語音控制請求，根據(jù)所述語音控制請求獲取語音數(shù)據(jù)；

4、從所述語音數(shù)據(jù)中提取關(guān)鍵詞語；

5、從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語；

6、基于所述當前使用場景，構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù)，將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令；

7、執(zhí)行與所述目標控制指令對應的操作。

8、在本申請實施例所述的語音控制方法中，所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語，包括：

9、將所述語音數(shù)據(jù)轉(zhuǎn)換成包含至少一個文本數(shù)據(jù)的文檔集；

10、對所述文本數(shù)據(jù)進行分詞處理，得到若干個文本詞語；

11、計算所述若干個文本詞語中的任意兩個文本詞語之間的相似度；

12、將相似度大于或等于第一預設(shè)閾值的文本詞語歸類為一個詞語分組，從而形成若干個詞語分組；

13、從所述若干個詞語分組中選取包含文本詞語總數(shù)靠前的n個目標詞語分組，同時每個所述目標詞語分組僅保留其中一個目標文本詞語，將所述目標詞語分組中保留的目標文本詞語作為關(guān)鍵詞語。

14、在本申請實施例所述的語音控制方法中，所述從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語，包括：

15、基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值；

16、根據(jù)所述tf-idf值的大小對所述目標關(guān)鍵詞語進行排序，并根據(jù)排序結(jié)果選擇與所述用戶使用場景關(guān)聯(lián)的目標關(guān)鍵詞語。

17、在本申請實施例所述的語音控制方法中，所述基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值，包括：

18、分別計算各個所述關(guān)鍵詞語的詞頻tf和反向文檔頻率idf；

19、其中，詞頻tf＝關(guān)鍵詞語在文本數(shù)據(jù)中出現(xiàn)的總次數(shù)/文本數(shù)據(jù)中總的詞語數(shù)目；反向文檔頻率idf＝log[文檔集合中文本數(shù)據(jù)的第一總文檔數(shù)/(包含關(guān)鍵詞語的文本數(shù)據(jù)的第二總文檔數(shù)+1)]；

20、將所述詞頻tf和反向文檔頻率idf的乘積作為所述關(guān)鍵詞語的tf-idf值。

21、在本申請實施例所述的語音控制方法中，所述基于所述當前使用場景，構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù)，將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令，包括：

22、獲取與所述當前使用場景對應的環(huán)境參數(shù)及用戶體征參數(shù)；

23、將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù)，并輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令。

24、在本申請實施例所述的語音控制方法中，所述將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù)，并輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令，包括：

25、將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù)，并輸入預訓練的控制指令預測模型進行指令預測操作，輸出一個概率分布，這個分布表示輸入文本屬于每個類別的概率，顯示哪個類別最有可能包含該文本，得到與所述語音控制請求匹配的目標控制指令。

26、在本申請實施例所述的語音控制方法中，在所述根據(jù)所述語音控制請求獲取語音數(shù)據(jù)之后，所述方法還包括：

27、判斷在預設(shè)時間段內(nèi)是否接收到與所述語音數(shù)據(jù)重復、且重復次數(shù)超過預設(shè)次數(shù)的重復語音數(shù)據(jù)；

28、若是，則從語料庫中查找與所述重復語音數(shù)據(jù)相似度大于或等于第二預設(shè)閾值的相似語音數(shù)據(jù)；

29、將所述相似語音數(shù)據(jù)替換所述重復語音數(shù)據(jù)，并返回執(zhí)行所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語的步驟。

30、相應的，本申請實施例另一方面還提供了一種語音控制裝置，所述語音控制裝置包括：

31、數(shù)據(jù)接收模塊，用于接收用戶發(fā)起的語音控制請求，根據(jù)所述語音控制請求獲取語音數(shù)據(jù)；

32、數(shù)據(jù)提取模塊，用于從所述語音數(shù)據(jù)中提取關(guān)鍵詞語；

33、數(shù)據(jù)確定模塊，用于從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語；

34、數(shù)據(jù)預測模塊，用于基于所述當前使用場景，構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù)，將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令；

35、指令執(zhí)行模塊，用于執(zhí)行與所述目標控制指令對應的操作。

36、相應的，本申請實施例另一方面還提供了一種存儲介質(zhì)，所述存儲介質(zhì)存儲有多條指令，所述指令適于處理器進行加載，以執(zhí)行如上所述的語音控制方法。

37、相應的，本申請實施例另一方面還提供了一種電子設(shè)備，包括處理器和存儲器，所述存儲器存儲有多條指令，所述處理器加載所述指令以執(zhí)行如上所述的語音控制方法。

38、本申請實施例提供了一種語音控制方法、裝置、介質(zhì)及設(shè)備，該方法通過接收用戶發(fā)起的語音控制請求，根據(jù)語音控制請求獲取語音數(shù)據(jù)；從語音數(shù)據(jù)中提取關(guān)鍵詞語；從關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語；基于當前使用場景，將目標關(guān)鍵詞語輸入預訓練的控制指令預測模型進行指令預測操作，得到與語音控制請求匹配的目標控制指令；執(zhí)行與目標控制指令對應的操作。利用本申請實施例提供的語音控制方法，能夠從用戶提供的語音數(shù)據(jù)中識別出與用戶的當前使用場景相關(guān)的關(guān)鍵詞語，并基于關(guān)鍵詞語生成符合用戶實際需求的控制指令，不僅能夠提升語義識別的準確率，而且能夠有效預測用戶的實際需求，進而改善用戶體驗感。

技術(shù)特征：

1.一種語音控制方法，其特征在于，包括：

2.如權(quán)利要求1所述的語音控制方法，其特征在于，所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語，包括：

3.如權(quán)利要求1所述的語音控制方法，其特征在于，所述從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語，包括：

4.如權(quán)利要求3所述的語音控制方法，其特征在于，所述基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值，包括：

5.如權(quán)利要求1所述的語音控制方法，其特征在于，所述基于所述當前使用場景，構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù)，將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令，包括：

6.如權(quán)利要求5所述的語音控制方法，其特征在于，所述將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù)，并輸入預訓練的控制指令預測模型進行指令預測操作，得到與所述語音控制請求匹配的目標控制指令，包括：

7.如權(quán)利要求1所述的語音控制方法，其特征在于，在所述根據(jù)所述語音控制請求獲取語音數(shù)據(jù)之后，所述方法還包括：

8.一種語音控制裝置，其特征在于，所述語音控制裝置包括：

9.一種計算機可讀存儲介質(zhì)，其特征在于，所述計算機可讀存儲介質(zhì)存儲有多條指令，所述指令適于處理器進行加載，以執(zhí)行權(quán)利要求1至7任一項所述的語音控制方法。

10.一種電子設(shè)備，其特征在于，包括處理器和存儲器，所述存儲器存儲有多條指令，所述處理器加載所述指令以執(zhí)行權(quán)利要求1至7任一項所述的語音控制方法。

技術(shù)總結(jié)
本申請實施例提供一種語音控制方法、裝置、介質(zhì)及設(shè)備，該方法包括：接收用戶發(fā)起的語音控制請求，根據(jù)語音控制請求獲取語音數(shù)據(jù)；從語音數(shù)據(jù)中提取關(guān)鍵詞語；從關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語；基于當前使用場景，將目標關(guān)鍵詞語輸入預訓練的控制指令預測模型進行指令預測操作，得到與語音控制請求匹配的目標控制指令；執(zhí)行與目標控制指令對應的操作。利用本申請實施例提供的語音控制方法，能夠從用戶提供的語音數(shù)據(jù)中識別出與用戶的當前使用場景相關(guān)的關(guān)鍵詞語，并基于關(guān)鍵詞語生成符合用戶意圖的控制指令，不僅能夠提升語義識別的準確率，而且能夠有效預測用戶的實際需求，進而改善用戶體驗感。

技術(shù)研發(fā)人員：王芳
受保護的技術(shù)使用者：TCL空調(diào)器（中山）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/23

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王芳
技術(shù)所有人：TCL空調(diào)器（中山）有限公司
我是此專利的發(fā)明人

上一篇：一種防飛濺的綠色施工用噴漆裝置的制作方法
上一篇：一種管道切割裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音控制方法、裝置、介質(zhì)及設(shè)備與流程

語音控制方法、裝置、介質(zhì)及設(shè)備與流程