欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音控制方法、裝置、介質(zhì)及設(shè)備與流程

文檔序號:40443535發(fā)布日期:2024-12-24 15:17閱讀:27來源:國知局
語音控制方法、裝置、介質(zhì)及設(shè)備與流程

本申請涉及聲控,尤其涉及一種語音控制,特別涉及一種語音控制方法、裝置、介質(zhì)及設(shè)備。


背景技術(shù):

1、聲控技術(shù)是一種可以將語音數(shù)據(jù)轉(zhuǎn)換成輸入指令,以控制智能設(shè)備運行的控制技術(shù)。為了讓智能設(shè)備能夠準確地按照用戶的實際需求執(zhí)行指定指令,通常需要用戶給出詳細且具體的控制指令,例如當用戶希望控制空調(diào)開啟并保持在25℃時,需要向空調(diào)發(fā)出一條明確的語音數(shù)據(jù),即“請開啟空調(diào),并保持在25℃“。

2、對于簡單的指令,用戶通??梢宰龅骄唧w化描述控制智能設(shè)備的內(nèi)容,但是對于較為復雜的指令,當同樣需要用戶具體化描述控制智能設(shè)備的內(nèi)容并以語音形式發(fā)出時,往往會給用戶一種不夠智能的感受,導致用戶體驗度下降,且較為復雜的指令可能還會影響智能設(shè)備對指令的理解,進而影響智能設(shè)備對指令的識別準確率。


技術(shù)實現(xiàn)思路

1、本申請實施例提供一種語音控制方法、裝置、介質(zhì)及設(shè)備。利用本申請實施例提供的語音控制方法,以解決現(xiàn)有的語音控制方法存在智能化低、準確性差的問題。

2、本申請實施例一方面提供了一種語音控制方法,包括:

3、接收用戶發(fā)起的語音控制請求,根據(jù)所述語音控制請求獲取語音數(shù)據(jù);

4、從所述語音數(shù)據(jù)中提取關(guān)鍵詞語;

5、從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;

6、基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令;

7、執(zhí)行與所述目標控制指令對應的操作。

8、在本申請實施例所述的語音控制方法中,所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語,包括:

9、將所述語音數(shù)據(jù)轉(zhuǎn)換成包含至少一個文本數(shù)據(jù)的文檔集;

10、對所述文本數(shù)據(jù)進行分詞處理,得到若干個文本詞語;

11、計算所述若干個文本詞語中的任意兩個文本詞語之間的相似度;

12、將相似度大于或等于第一預設(shè)閾值的文本詞語歸類為一個詞語分組,從而形成若干個詞語分組;

13、從所述若干個詞語分組中選取包含文本詞語總數(shù)靠前的n個目標詞語分組,同時每個所述目標詞語分組僅保留其中一個目標文本詞語,將所述目標詞語分組中保留的目標文本詞語作為關(guān)鍵詞語。

14、在本申請實施例所述的語音控制方法中,所述從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語,包括:

15、基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值;

16、根據(jù)所述tf-idf值的大小對所述目標關(guān)鍵詞語進行排序,并根據(jù)排序結(jié)果選擇與所述用戶使用場景關(guān)聯(lián)的目標關(guān)鍵詞語。

17、在本申請實施例所述的語音控制方法中,所述基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值,包括:

18、分別計算各個所述關(guān)鍵詞語的詞頻tf和反向文檔頻率idf;

19、其中,詞頻tf=關(guān)鍵詞語在文本數(shù)據(jù)中出現(xiàn)的總次數(shù)/文本數(shù)據(jù)中總的詞語數(shù)目;反向文檔頻率idf=log[文檔集合中文本數(shù)據(jù)的第一總文檔數(shù)/(包含關(guān)鍵詞語的文本數(shù)據(jù)的第二總文檔數(shù)+1)];

20、將所述詞頻tf和反向文檔頻率idf的乘積作為所述關(guān)鍵詞語的tf-idf值。

21、在本申請實施例所述的語音控制方法中,所述基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:

22、獲取與所述當前使用場景對應的環(huán)境參數(shù)及用戶體征參數(shù);

23、將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令。

24、在本申請實施例所述的語音控制方法中,所述將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:

25、將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,輸出一個概率分布,這個分布表示輸入文本屬于每個類別的概率,顯示哪個類別最有可能包含該文本,得到與所述語音控制請求匹配的目標控制指令。

26、在本申請實施例所述的語音控制方法中,在所述根據(jù)所述語音控制請求獲取語音數(shù)據(jù)之后,所述方法還包括:

27、判斷在預設(shè)時間段內(nèi)是否接收到與所述語音數(shù)據(jù)重復、且重復次數(shù)超過預設(shè)次數(shù)的重復語音數(shù)據(jù);

28、若是,則從語料庫中查找與所述重復語音數(shù)據(jù)相似度大于或等于第二預設(shè)閾值的相似語音數(shù)據(jù);

29、將所述相似語音數(shù)據(jù)替換所述重復語音數(shù)據(jù),并返回執(zhí)行所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語的步驟。

30、相應的,本申請實施例另一方面還提供了一種語音控制裝置,所述語音控制裝置包括:

31、數(shù)據(jù)接收模塊,用于接收用戶發(fā)起的語音控制請求,根據(jù)所述語音控制請求獲取語音數(shù)據(jù);

32、數(shù)據(jù)提取模塊,用于從所述語音數(shù)據(jù)中提取關(guān)鍵詞語;

33、數(shù)據(jù)確定模塊,用于從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;

34、數(shù)據(jù)預測模塊,用于基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令;

35、指令執(zhí)行模塊,用于執(zhí)行與所述目標控制指令對應的操作。

36、相應的,本申請實施例另一方面還提供了一種存儲介質(zhì),所述存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行如上所述的語音控制方法。

37、相應的,本申請實施例另一方面還提供了一種電子設(shè)備,包括處理器和存儲器,所述存儲器存儲有多條指令,所述處理器加載所述指令以執(zhí)行如上所述的語音控制方法。

38、本申請實施例提供了一種語音控制方法、裝置、介質(zhì)及設(shè)備,該方法通過接收用戶發(fā)起的語音控制請求,根據(jù)語音控制請求獲取語音數(shù)據(jù);從語音數(shù)據(jù)中提取關(guān)鍵詞語;從關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;基于當前使用場景,將目標關(guān)鍵詞語輸入預訓練的控制指令預測模型進行指令預測操作,得到與語音控制請求匹配的目標控制指令;執(zhí)行與目標控制指令對應的操作。利用本申請實施例提供的語音控制方法,能夠從用戶提供的語音數(shù)據(jù)中識別出與用戶的當前使用場景相關(guān)的關(guān)鍵詞語,并基于關(guān)鍵詞語生成符合用戶實際需求的控制指令,不僅能夠提升語義識別的準確率,而且能夠有效預測用戶的實際需求,進而改善用戶體驗感。



技術(shù)特征:

1.一種語音控制方法,其特征在于,包括:

2.如權(quán)利要求1所述的語音控制方法,其特征在于,所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語,包括:

3.如權(quán)利要求1所述的語音控制方法,其特征在于,所述從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語,包括:

4.如權(quán)利要求3所述的語音控制方法,其特征在于,所述基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值,包括:

5.如權(quán)利要求1所述的語音控制方法,其特征在于,所述基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:

6.如權(quán)利要求5所述的語音控制方法,其特征在于,所述將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:

7.如權(quán)利要求1所述的語音控制方法,其特征在于,在所述根據(jù)所述語音控制請求獲取語音數(shù)據(jù)之后,所述方法還包括:

8.一種語音控制裝置,其特征在于,所述語音控制裝置包括:

9.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行權(quán)利要求1至7任一項所述的語音控制方法。

10.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述存儲器存儲有多條指令,所述處理器加載所述指令以執(zhí)行權(quán)利要求1至7任一項所述的語音控制方法。


技術(shù)總結(jié)
本申請實施例提供一種語音控制方法、裝置、介質(zhì)及設(shè)備,該方法包括:接收用戶發(fā)起的語音控制請求,根據(jù)語音控制請求獲取語音數(shù)據(jù);從語音數(shù)據(jù)中提取關(guān)鍵詞語;從關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;基于當前使用場景,將目標關(guān)鍵詞語輸入預訓練的控制指令預測模型進行指令預測操作,得到與語音控制請求匹配的目標控制指令;執(zhí)行與目標控制指令對應的操作。利用本申請實施例提供的語音控制方法,能夠從用戶提供的語音數(shù)據(jù)中識別出與用戶的當前使用場景相關(guān)的關(guān)鍵詞語,并基于關(guān)鍵詞語生成符合用戶意圖的控制指令,不僅能夠提升語義識別的準確率,而且能夠有效預測用戶的實際需求,進而改善用戶體驗感。

技術(shù)研發(fā)人員:王芳
受保護的技術(shù)使用者:TCL空調(diào)器(中山)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/23
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
郧西县| 财经| 枣阳市| 云南省| 南城县| 鄂托克旗| 页游| 准格尔旗| 丰原市| 荔波县| 霸州市| 济源市| 曲麻莱县| 天祝| 吉木萨尔县| 仪征市| 新民市| 清水河县| 惠水县| 阳城县| 高台县| 呼和浩特市| 绩溪县| 米易县| 建昌县| 巴林左旗| 鹤壁市| 延长县| 南充市| 蓬莱市| 庆云县| 开化县| 红安县| 舞钢市| 大邑县| 鹤山市| 福泉市| 江油市| 萍乡市| 三门县| 平泉县|