本發(fā)明涉及機器人控制,特別是一種人工智能機器人的控制方法及系統(tǒng)。
背景技術(shù):
1、機器人控制方法是指通過各種技術(shù)和算法來指導和管理機器人行為的一系列過程和策略。這些方法通常涉及感知環(huán)境、處理信息、做出決策和執(zhí)行動作等步驟。先進的機器人控制系統(tǒng)旨在使機器人能夠適應復雜多變的環(huán)境,理解和響應用戶需求,并高效完成各種任務(wù)。這些系統(tǒng)通常結(jié)合了傳感器數(shù)據(jù)處理、機器學習算法、決策模型和執(zhí)行機制,以實現(xiàn)智能化和自主化的機器人行為。
2、然而,現(xiàn)有的機器人控制方法存在一些顯著的缺點:
3、任務(wù)關(guān)聯(lián)分析不足:大多數(shù)現(xiàn)有方法缺乏有效的機制來分析和識別任務(wù)之間的關(guān)聯(lián)性。它們通常只關(guān)注當前任務(wù)的執(zhí)行,而忽視了任務(wù)之間可能存在的時間和邏輯關(guān)系,導致機器人無法主動提供相關(guān)任務(wù)建議或優(yōu)化任務(wù)執(zhí)行順序。
4、歷史數(shù)據(jù)利用不充分:現(xiàn)有系統(tǒng)往往未能充分利用歷史任務(wù)數(shù)據(jù)來學習用戶行為模式和任務(wù)執(zhí)行規(guī)律,這限制了機器人預測用戶需求和相關(guān)任務(wù)的能力,使得控制系統(tǒng)缺乏前瞻性和智能性。
技術(shù)實現(xiàn)思路
1、鑒于現(xiàn)有的人工智能機器人的控制及系統(tǒng)中存在的問題,提出了本發(fā)明。
2、因此,本發(fā)明所要解決的問題在于:任務(wù)關(guān)聯(lián)度不夠與歷史數(shù)據(jù)利用不充分。
3、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
4、第一方面,本發(fā)明實施例提供了一種人工智能機器人的控制方法,其包括以下步驟,
5、獲取機器人周圍環(huán)境的動態(tài)數(shù)據(jù)和用戶行為數(shù)據(jù),分析總結(jié)出第一分析模型,通過所述第一分析模型對所述動態(tài)數(shù)據(jù)和用戶行為數(shù)據(jù)進行第一分析,得到第一控制指令;
6、獲取機器人的靜態(tài)數(shù)據(jù)和歷史任務(wù)數(shù)據(jù),分析總結(jié)出第二分析模型,通過所述第二分析模型對所述靜態(tài)數(shù)據(jù)和歷史任務(wù)數(shù)據(jù)進行第二分析,得到第二控制指令;
7、結(jié)合所述第一控制指令和所述第二控制指令得到最終控制指令,完成智能機器人的控制和任務(wù)預測。
8、作為本發(fā)明所述人工智能機器人的控制方法的一種優(yōu)選方案,其中:所述動態(tài)數(shù)據(jù)包括實時環(huán)境圖像、聲音信號、距離傳感器數(shù)據(jù)、時間、特殊事件標記,以及機器人當前狀態(tài);
9、所述用戶行為數(shù)據(jù)包括用戶指令、指令時間,以及指令頻率;
10、所述靜態(tài)數(shù)據(jù)包括機器人硬件參數(shù)、機械結(jié)構(gòu)信息、預設(shè)任務(wù)目標,以及操作限制條件;
11、所述歷史任務(wù)數(shù)據(jù)包括過去執(zhí)行的任務(wù)序列、任務(wù)時間、任務(wù)頻率。
12、作為本發(fā)明所述人工智能機器人的控制方法的一種優(yōu)選方案,其中:所述第一分析模型是基于循環(huán)神經(jīng)網(wǎng)絡(luò)對用戶行為數(shù)據(jù)和動態(tài)數(shù)據(jù)的綜合分析,具體為:
13、基于循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出對用戶行為數(shù)據(jù)進行分析,得到初步的任務(wù)預測tt1;結(jié)合動態(tài)數(shù)據(jù)中的環(huán)境信息et和機器人當前的狀態(tài)數(shù)據(jù)st,對初步任務(wù)預測進行調(diào)整,得到修正的任務(wù)預測tt2;
14、通過修正的任務(wù)預測tt2,生成第一控制指令ct。
15、作為本發(fā)明所述人工智能機器人的控制方法的一種優(yōu)選方案,其中:所述初步的任務(wù)預測tt1通過公式表示為:
16、tt1=rnn(ut,ht-1);
17、式中,ut表示為用戶行為數(shù)據(jù),ht-1表示為先前的隱藏狀態(tài),公式整體表示使用循環(huán)神經(jīng)網(wǎng)絡(luò)根據(jù)當前的用戶行為數(shù)據(jù)和先前的隱藏狀態(tài)生成初步的任務(wù)預測結(jié)果;
18、所述修正的任務(wù)預測tt2通過公式表示為:
19、tt2=tt1·(1+α·et)+β·(st-sref);
20、式中,α和β均表示為權(quán)重因子,分別控制環(huán)境數(shù)據(jù)和狀態(tài)數(shù)據(jù)對修正任務(wù)預測的影響,sref表示為參考狀態(tài),公式整體表示將初步任務(wù)預測與當前環(huán)境數(shù)據(jù)和機器人當前狀態(tài)結(jié)合,生成修正后的任務(wù)預測結(jié)果;
21、所述第一控制指令ct通過公式表示為:
22、ct=f(tt2,et);
23、式中,函數(shù)f代表將任務(wù)預測和環(huán)境數(shù)據(jù)轉(zhuǎn)換為控制指令的過程,公式整體表示將修正后的任務(wù)預測和當前環(huán)境數(shù)據(jù)結(jié)合,生成第一控制指令。
24、作為本發(fā)明所述人工智能機器人的控制方法的一種優(yōu)選方案,其中:所述第二分析模型在生成控制指令時考慮動態(tài)數(shù)據(jù)的影響,具體為:
25、根據(jù)歷史任務(wù)數(shù)據(jù)d和預設(shè)任務(wù)目標g得到任務(wù)概率分布pt;
26、通過所述任務(wù)概率分布pt和所述機器人硬件參數(shù),得到考慮硬件限制后的任務(wù)序列s1;
27、結(jié)合動態(tài)數(shù)據(jù)中的環(huán)境信息et和機器人當前的狀態(tài)數(shù)據(jù)st,對任務(wù)序列進行調(diào)整,得到修正后的任務(wù)序列s2;
28、基于修正后的任務(wù)序列s2和所述機器人的操作限制條件,得到第二控制指令cw。
29、作為本發(fā)明所述人工智能機器人的控制方法的一種優(yōu)選方案,其中:所述任務(wù)概率分布pt通過公式表示為:
30、pt=g(d,g);
31、式中,函數(shù)g表示為將歷史數(shù)據(jù)和任務(wù)目標轉(zhuǎn)換為任務(wù)概率分布的過程,公式整體表示為根據(jù)歷史任務(wù)數(shù)據(jù)和預設(shè)任務(wù)目標計算任務(wù)概率分布;
32、所述考慮硬件限制后的任務(wù)序列s1通過公式表示為:
33、s1=h(pt,h);
34、式中,函數(shù)h表示為在考慮硬件限制后,生成任務(wù)序列的過程,公式整體表示為根據(jù)任務(wù)概率分布和機器人硬件參數(shù)生成初步的任務(wù)序列;
35、所述修正后的任務(wù)序列s2通過公式表示為:
36、s2=s1+γ·(et-eref)+δ·(st-sref);
37、式中,γ和δ均表示為權(quán)重系數(shù),分別控制環(huán)境數(shù)據(jù)和狀態(tài)數(shù)據(jù)對任務(wù)序列的修正作用,eref表示為參考環(huán)境數(shù)據(jù),用于衡量與當前環(huán)境和狀態(tài)的差異,公式整體表示為將初步任務(wù)序列與當前環(huán)境數(shù)據(jù)和機器人當前的狀態(tài)數(shù)據(jù)結(jié)合,生成修正后的任務(wù)序列;
38、所述第二控制指令cw通過公式表示為:
39、cw=k(s2,l,et);
40、式中,l表示為操作限制條件,函數(shù)k表示為將修正任務(wù)序列和限制條件轉(zhuǎn)換為控制指令的過程,整體公式表示為將修正后的任務(wù)序列、操作限制條件以及當前環(huán)境數(shù)據(jù)結(jié)合,生成第二控制指令。
41、作為本發(fā)明所述人工智能機器人的控制方法的一種優(yōu)選方案,其中:所述最終控制指令cz獲得公式為,
42、cz=ω·ct+(1-ω)·cw;
43、式中,ω表示為動態(tài)權(quán)重因子,取值范圍為0≤ω≤1;
44、當確定最終控制指令cz后,根據(jù)歷史任務(wù)數(shù)據(jù)判斷是否有關(guān)聯(lián)任務(wù),當判斷結(jié)果為有時,則主動詢問用戶是否執(zhí)行關(guān)聯(lián)任務(wù),當判斷結(jié)果為沒有時,則無作為;
45、其中,關(guān)聯(lián)任務(wù)的判斷方式包括:
46、收集用戶歷史任務(wù)數(shù)據(jù),具體包括任務(wù)類型、執(zhí)行順序,以及時間間隔信息;
47、識別同時出現(xiàn)或者按特定順序執(zhí)行的任務(wù)對(r1,r2);
48、計算任務(wù)對(r1,r2)的關(guān)聯(lián)概率p(r1,r2),當關(guān)聯(lián)概率p(r1,r2)大于概率設(shè)定值時,則將任務(wù)對進行關(guān)聯(lián),并進行時間關(guān)聯(lián)計算,反之則不進行關(guān)聯(lián);
49、所述時間關(guān)聯(lián)計算包括計算任務(wù)對(r1,r2)的時間差,并獲得時間差小于標準值的次數(shù),當次數(shù)大于時間設(shè)定值時,則將任務(wù)對(r1,r2)進行關(guān)聯(lián),反之則取消關(guān)聯(lián);
50、最后獲得關(guān)聯(lián)度,其計算公式表示為:
51、g(r1,r2)=μ1·p(r1,r2)+μ2·η(r1,r2);
52、式中,g(r1,r2)表示為關(guān)聯(lián)度,μ1和μ2表示為權(quán)重系數(shù),η(r1,r2)表示為時間相關(guān)度;
53、當關(guān)聯(lián)度g(r1,r2)大于閾值θ時,則判斷任務(wù)r2為任務(wù)r1的關(guān)聯(lián)任務(wù),反之則不為關(guān)聯(lián)任務(wù)。
54、第二方面,本發(fā)明實施例提供了一種人工智能機器人的控制系統(tǒng),其包括數(shù)據(jù)采集模塊、數(shù)據(jù)計算模塊,以及指令輸出模塊;
55、所述數(shù)據(jù)采集模塊用于獲取機器人周圍環(huán)境的動態(tài)數(shù)據(jù)和用戶行為數(shù)據(jù),并獲得機器人的靜態(tài)數(shù)據(jù)和歷史任務(wù)數(shù)據(jù);
56、所述數(shù)據(jù)計算模塊用于生成第一分析模型和第二分析模型;
57、所述指令輸出模塊用于得到第一控制指令和第二控制指令,并對兩個控制指令融合,得到最終控制指令。
58、第三方面,本發(fā)明實施例提供了一種計算機設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其中:所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述的人工智能機器人的控制方法的任一步驟。
59、第四方面,本發(fā)明實施例提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其中:所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的人工智能機器人的控制方法的任一步驟。
60、本發(fā)明有益效果為:通過創(chuàng)新的任務(wù)關(guān)聯(lián)分析機制和全面的歷史數(shù)據(jù)利用策略,有效解決了現(xiàn)有技術(shù)中任務(wù)關(guān)聯(lián)分析不足和歷史數(shù)據(jù)利用不充分的問題。
61、在任務(wù)關(guān)聯(lián)分析方面,本方法引入了一種綜合考慮任務(wù)類型、執(zhí)行順序和時間間隔的識別機制,通過計算任務(wù)對的關(guān)聯(lián)概率和時間相關(guān)度,顯著提高了關(guān)聯(lián)任務(wù)識別的準確性和全面性,這使得系統(tǒng)能夠更智能地提供相關(guān)任務(wù)建議,優(yōu)化任務(wù)執(zhí)行順序,從而提升用戶體驗和工作效率。
62、在歷史數(shù)據(jù)利用方面,本方法在多個層面充分利用了歷史任務(wù)數(shù)據(jù),包括生成任務(wù)概率分布、考慮硬件限制的任務(wù)序列生成,以及將歷史數(shù)據(jù)分析結(jié)果與當前環(huán)境和狀態(tài)信息動態(tài)結(jié)合,這種多層次、多角度的歷史數(shù)據(jù)利用方法,大大提高了系統(tǒng)對用戶需求的預測能力和環(huán)境適應性,通過融合短期動態(tài)數(shù)據(jù)和長期歷史數(shù)據(jù),本方法實現(xiàn)了對復雜環(huán)境的快速響應和長期穩(wěn)定性的平衡,顯著提升了機器人控制系統(tǒng)的智能性、效率和魯棒性,這不僅為用戶提供了更智能、更貼心的服務(wù)體驗,也為實現(xiàn)更高級的人機協(xié)作奠定了堅實基礎(chǔ)。