本申請涉及聲控,尤其涉及一種語音控制,特別涉及一種語音控制方法、裝置、介質(zhì)及設(shè)備。
背景技術(shù):
1、聲控技術(shù)是一種可以將語音數(shù)據(jù)轉(zhuǎn)換成輸入指令,以控制智能設(shè)備運行的控制技術(shù)。為了讓智能設(shè)備能夠準確地按照用戶的實際需求執(zhí)行指定指令,通常需要用戶給出詳細且具體的控制指令,例如當用戶希望控制空調(diào)開啟并保持在25℃時,需要向空調(diào)發(fā)出一條明確的語音數(shù)據(jù),即“請開啟空調(diào),并保持在25℃“。
2、對于簡單的指令,用戶通??梢宰龅骄唧w化描述控制智能設(shè)備的內(nèi)容,但是對于較為復雜的指令,當同樣需要用戶具體化描述控制智能設(shè)備的內(nèi)容并以語音形式發(fā)出時,往往會給用戶一種不夠智能的感受,導致用戶體驗度下降,且較為復雜的指令可能還會影響智能設(shè)備對指令的理解,進而影響智能設(shè)備對指令的識別準確率。
技術(shù)實現(xiàn)思路
1、本申請實施例提供一種語音控制方法、裝置、介質(zhì)及設(shè)備。利用本申請實施例提供的語音控制方法,以解決現(xiàn)有的語音控制方法存在智能化低、準確性差的問題。
2、本申請實施例一方面提供了一種語音控制方法,包括:
3、接收用戶發(fā)起的語音控制請求,根據(jù)所述語音控制請求獲取語音數(shù)據(jù);
4、從所述語音數(shù)據(jù)中提取關(guān)鍵詞語;
5、從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;
6、基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令;
7、執(zhí)行與所述目標控制指令對應的操作。
8、在本申請實施例所述的語音控制方法中,所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語,包括:
9、將所述語音數(shù)據(jù)轉(zhuǎn)換成包含至少一個文本數(shù)據(jù)的文檔集;
10、對所述文本數(shù)據(jù)進行分詞處理,得到若干個文本詞語;
11、計算所述若干個文本詞語中的任意兩個文本詞語之間的相似度;
12、將相似度大于或等于第一預設(shè)閾值的文本詞語歸類為一個詞語分組,從而形成若干個詞語分組;
13、從所述若干個詞語分組中選取包含文本詞語總數(shù)靠前的n個目標詞語分組,同時每個所述目標詞語分組僅保留其中一個目標文本詞語,將所述目標詞語分組中保留的目標文本詞語作為關(guān)鍵詞語。
14、在本申請實施例所述的語音控制方法中,所述從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語,包括:
15、基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值;
16、根據(jù)所述tf-idf值的大小對所述目標關(guān)鍵詞語進行排序,并根據(jù)排序結(jié)果選擇與所述用戶使用場景關(guān)聯(lián)的目標關(guān)鍵詞語。
17、在本申請實施例所述的語音控制方法中,所述基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值,包括:
18、分別計算各個所述關(guān)鍵詞語的詞頻tf和反向文檔頻率idf;
19、其中,詞頻tf=關(guān)鍵詞語在文本數(shù)據(jù)中出現(xiàn)的總次數(shù)/文本數(shù)據(jù)中總的詞語數(shù)目;反向文檔頻率idf=log[文檔集合中文本數(shù)據(jù)的第一總文檔數(shù)/(包含關(guān)鍵詞語的文本數(shù)據(jù)的第二總文檔數(shù)+1)];
20、將所述詞頻tf和反向文檔頻率idf的乘積作為所述關(guān)鍵詞語的tf-idf值。
21、在本申請實施例所述的語音控制方法中,所述基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:
22、獲取與所述當前使用場景對應的環(huán)境參數(shù)及用戶體征參數(shù);
23、將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令。
24、在本申請實施例所述的語音控制方法中,所述將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:
25、將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,輸出一個概率分布,這個分布表示輸入文本屬于每個類別的概率,顯示哪個類別最有可能包含該文本,得到與所述語音控制請求匹配的目標控制指令。
26、在本申請實施例所述的語音控制方法中,在所述根據(jù)所述語音控制請求獲取語音數(shù)據(jù)之后,所述方法還包括:
27、判斷在預設(shè)時間段內(nèi)是否接收到與所述語音數(shù)據(jù)重復、且重復次數(shù)超過預設(shè)次數(shù)的重復語音數(shù)據(jù);
28、若是,則從語料庫中查找與所述重復語音數(shù)據(jù)相似度大于或等于第二預設(shè)閾值的相似語音數(shù)據(jù);
29、將所述相似語音數(shù)據(jù)替換所述重復語音數(shù)據(jù),并返回執(zhí)行所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語的步驟。
30、相應的,本申請實施例另一方面還提供了一種語音控制裝置,所述語音控制裝置包括:
31、數(shù)據(jù)接收模塊,用于接收用戶發(fā)起的語音控制請求,根據(jù)所述語音控制請求獲取語音數(shù)據(jù);
32、數(shù)據(jù)提取模塊,用于從所述語音數(shù)據(jù)中提取關(guān)鍵詞語;
33、數(shù)據(jù)確定模塊,用于從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;
34、數(shù)據(jù)預測模塊,用于基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令;
35、指令執(zhí)行模塊,用于執(zhí)行與所述目標控制指令對應的操作。
36、相應的,本申請實施例另一方面還提供了一種存儲介質(zhì),所述存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行如上所述的語音控制方法。
37、相應的,本申請實施例另一方面還提供了一種電子設(shè)備,包括處理器和存儲器,所述存儲器存儲有多條指令,所述處理器加載所述指令以執(zhí)行如上所述的語音控制方法。
38、本申請實施例提供了一種語音控制方法、裝置、介質(zhì)及設(shè)備,該方法通過接收用戶發(fā)起的語音控制請求,根據(jù)語音控制請求獲取語音數(shù)據(jù);從語音數(shù)據(jù)中提取關(guān)鍵詞語;從關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語;基于當前使用場景,將目標關(guān)鍵詞語輸入預訓練的控制指令預測模型進行指令預測操作,得到與語音控制請求匹配的目標控制指令;執(zhí)行與目標控制指令對應的操作。利用本申請實施例提供的語音控制方法,能夠從用戶提供的語音數(shù)據(jù)中識別出與用戶的當前使用場景相關(guān)的關(guān)鍵詞語,并基于關(guān)鍵詞語生成符合用戶實際需求的控制指令,不僅能夠提升語義識別的準確率,而且能夠有效預測用戶的實際需求,進而改善用戶體驗感。
1.一種語音控制方法,其特征在于,包括:
2.如權(quán)利要求1所述的語音控制方法,其特征在于,所述從所述語音數(shù)據(jù)中提取關(guān)鍵詞語,包括:
3.如權(quán)利要求1所述的語音控制方法,其特征在于,所述從所述關(guān)鍵詞語中確定與用戶的當前使用場景關(guān)聯(lián)的目標關(guān)鍵詞語,包括:
4.如權(quán)利要求3所述的語音控制方法,其特征在于,所述基于tf-idf算法分別計算各個所述關(guān)鍵詞語的tf-idf值,包括:
5.如權(quán)利要求1所述的語音控制方法,其特征在于,所述基于所述當前使用場景,構(gòu)建包含所述目標關(guān)鍵詞語的輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:
6.如權(quán)利要求5所述的語音控制方法,其特征在于,所述將所述目標關(guān)鍵詞語、環(huán)境參數(shù)及用戶體征參數(shù)作為輸入數(shù)據(jù),并輸入預訓練的控制指令預測模型進行指令預測操作,得到與所述語音控制請求匹配的目標控制指令,包括:
7.如權(quán)利要求1所述的語音控制方法,其特征在于,在所述根據(jù)所述語音控制請求獲取語音數(shù)據(jù)之后,所述方法還包括:
8.一種語音控制裝置,其特征在于,所述語音控制裝置包括:
9.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行權(quán)利要求1至7任一項所述的語音控制方法。
10.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述存儲器存儲有多條指令,所述處理器加載所述指令以執(zhí)行權(quán)利要求1至7任一項所述的語音控制方法。