本申請涉及挖掘機,尤其涉及一種面向非結(jié)構(gòu)工況的挖掘機控制方法和控制系統(tǒng)。
背景技術(shù):
1、現(xiàn)有自動化作業(yè)方法大都是在對環(huán)境做出結(jié)構(gòu)化假設(shè)的前提下對任務(wù)進行逐級分解的。但是,在實際作業(yè),工況往往表現(xiàn)出非結(jié)構(gòu)化特性。例如,在連續(xù)土方挖掘環(huán)節(jié),在鏟斗與環(huán)境可塑性交互過程中,土方所表現(xiàn)出的動態(tài)重塑特性,其形貌往往不會按照理想情況進行改變,這樣,一方面可能導(dǎo)致挖掘成型面精度下降;另一方面,在挖掘過程中,難以精確控制鏟斗的裝滿程度,進一步的,對滿斗率控制的不準(zhǔn)確性會導(dǎo)致挖掘能耗增加,導(dǎo)致任務(wù)自主作業(yè)效果變差。
技術(shù)實現(xiàn)思路
1、有鑒于此,本申請?zhí)峁┮环N面向非結(jié)構(gòu)工況的挖掘機控制方法和控制系統(tǒng),用以解決土方的動態(tài)重塑特性導(dǎo)致的挖掘成型面精度下降和挖掘能耗增大的問題,提升任務(wù)自主作業(yè)效果,提高作業(yè)效率,降低作業(yè)成本。
2、具體地,本申請是通過如下技術(shù)方案實現(xiàn)的:
3、本申請第一方面提供一種挖掘機控制方法,所述方法包括:
4、所述感知設(shè)備實時采集所述挖掘機的作業(yè)區(qū)域的環(huán)境狀態(tài)、以及所述挖掘機的自身狀態(tài),并將所述環(huán)境狀態(tài)和所述自身狀態(tài)反饋給所述客戶端;
5、所述客戶端基于所述環(huán)境狀態(tài)和所述自身狀態(tài)對所述挖掘機和所述作業(yè)區(qū)域進行建模,并將得到的建模結(jié)果展示給用戶;
6、所述客戶端響應(yīng)于所述用戶基于所述建模結(jié)果設(shè)置作業(yè)任務(wù)的操作,將所述作業(yè)任務(wù)反饋給所述控制設(shè)備;
7、所述控制設(shè)備在接收到所述作業(yè)任務(wù)時,從所述感知設(shè)備獲取所述作業(yè)區(qū)域當(dāng)前的稠密點云數(shù)據(jù);
8、所述控制設(shè)備將所述稠密點云數(shù)據(jù)和上一時刻的挖掘動作軌跡輸入到土方狀態(tài)獲取模型中,以由所述土方狀態(tài)獲取模型根據(jù)該稠密點云數(shù)據(jù)和該挖掘動作軌跡確定當(dāng)前土方狀態(tài);其中,所述當(dāng)前土方狀態(tài)包括對土方的狀態(tài)及其轉(zhuǎn)移的描述;
9、所述控制設(shè)備將所述當(dāng)前土方狀態(tài)輸入到挖掘動作規(guī)劃模型中,以由所述挖掘動作規(guī)劃模型規(guī)劃當(dāng)前土方狀態(tài)下的挖掘動作軌跡;
10、所述控制設(shè)備按照所述挖掘動作軌跡控制所述挖掘機作業(yè),并在作業(yè)結(jié)束后,再次執(zhí)行從所述感知設(shè)備獲取所述作業(yè)區(qū)域當(dāng)前的稠密點云數(shù)據(jù)的步驟,直至所述作業(yè)任務(wù)執(zhí)行完畢。
11、本申請第二方面提供一種控制系統(tǒng),所述控制系統(tǒng)用于對面向非結(jié)構(gòu)工況的挖掘機進行控制,所述控制系統(tǒng)包括客戶端、設(shè)置在挖掘機上的感知設(shè)備和設(shè)置在挖掘機上的控制設(shè)備;其中,
12、所述感知設(shè)備,用于實時采集所述挖掘機的作業(yè)區(qū)域的環(huán)境狀態(tài)、以及所述挖掘機的自身狀態(tài),并將所述環(huán)境狀態(tài)和所述自身狀態(tài)反饋給所述客戶端;
13、所述客戶端,用于基于所述環(huán)境狀態(tài)和所述自身狀態(tài)對所述挖掘機和所述作業(yè)區(qū)域進行建模,并將得到的建模結(jié)果展示給用戶;
14、所述客戶端,用于響應(yīng)于所述用戶基于所述建模結(jié)果設(shè)置作業(yè)任務(wù)的操作,將所述作業(yè)任務(wù)反饋給所述控制設(shè)備;
15、所述控制設(shè)備,用于在接收到所述作業(yè)任務(wù)時,從所述感知設(shè)備獲取所述作業(yè)區(qū)域當(dāng)前的稠密點云數(shù)據(jù);
16、所述控制設(shè)備,用于將所述稠密點云數(shù)據(jù)和上一時刻的挖掘動作軌跡輸入到土方狀態(tài)獲取模型中,以由所述土方狀態(tài)獲取模型根據(jù)該稠密點云數(shù)據(jù)和該挖掘動作軌跡確定當(dāng)前土方狀態(tài);其中,所述當(dāng)前土方狀態(tài)包括對土方的狀態(tài)及其轉(zhuǎn)移的描述;
17、所述控制設(shè)備,用于將所述當(dāng)前土方狀態(tài)輸入到挖掘動作規(guī)劃模型中,以由所述挖掘動作規(guī)劃模型規(guī)劃當(dāng)前土方狀態(tài)下的挖掘動作軌跡;
18、所述控制設(shè)備,用于按照所述挖掘動作軌跡控制所述挖掘機作業(yè),并在作業(yè)結(jié)束后,再次執(zhí)行從所述感知設(shè)備獲取所述作業(yè)區(qū)域當(dāng)前的稠密點云數(shù)據(jù)的步驟,直至所述作業(yè)任務(wù)執(zhí)行完畢。
19、本申請?zhí)峁┑拿嫦蚍墙Y(jié)構(gòu)工況的挖掘機控制方法和控制系統(tǒng),第一方面,針對挖掘過程中土方的動態(tài)重塑特性,通過土方狀態(tài)獲取模型和挖掘動作規(guī)劃模型來規(guī)劃挖掘動作軌跡,能夠適應(yīng)非結(jié)構(gòu)化的工況,確保作業(yè)效果穩(wěn)定;第二方面,通過實時感知和數(shù)據(jù)反饋,能夠在作業(yè)過程中實時調(diào)整挖掘動作軌跡,并根據(jù)土方狀態(tài)進行優(yōu)化,可以提高作業(yè)的靈活性和效果;第三方面,通過自主規(guī)劃挖掘動作軌跡,能夠減少對人工操作員的依賴,降低了人工干預(yù)的需求,提高了自主作業(yè)的能力;第四方面,通過挖掘動作規(guī)劃模型來優(yōu)化挖掘動作軌跡,能夠降低挖掘過程中的能耗,提高作業(yè)效率,降低作業(yè)成本。
20、進一步的,本申請?zhí)峁┑拿嫦蚍墙Y(jié)構(gòu)工況的挖掘機控制方法和控制系統(tǒng),第一方面,通過建立第一經(jīng)驗知識庫,可基于第一經(jīng)驗知識庫來訓(xùn)練策略評估模型,以使得策略評估模型能夠準(zhǔn)確的評估挖掘動作價值。
21、第二方面,通過訓(xùn)練好的策略評估模型,可以準(zhǔn)確的獲取由土方狀態(tài)和挖掘動作軌跡構(gòu)成的數(shù)據(jù)對的挖掘動作價值,進而基于此來構(gòu)建第二經(jīng)驗知識庫,以使得第二經(jīng)驗知識庫能夠積累的大量經(jīng)驗數(shù)據(jù),以覆蓋各種不同的挖掘工況,這樣,后續(xù)來基于第二經(jīng)驗數(shù)據(jù)庫來訓(xùn)練挖掘動作規(guī)劃模型,不僅可以增強模型的泛化能力,使其能在不同的環(huán)境和條件下有效作業(yè),還能夠使得模型可以基于第二經(jīng)驗知識庫進行自主學(xué)習(xí)和進化,逐步提高決策和控制的精度,使得挖掘動作規(guī)劃模型可以在未來的挖掘作業(yè)中更精確地規(guī)劃動作軌跡,提高整體作業(yè)精度和效果。
22、第三方面,通過建立第二經(jīng)驗知識庫,后續(xù)在訓(xùn)練挖掘動作規(guī)劃模型時,可以利用挖掘動作價值作為監(jiān)督信號來訓(xùn)練挖掘動作規(guī)劃模型,不僅能夠使挖掘動作規(guī)劃模型能夠快速識別和學(xué)習(xí)最優(yōu)挖掘動作軌跡,減少訓(xùn)練時間,提高學(xué)習(xí)效率,還能夠通過監(jiān)督信號指導(dǎo)模型訓(xùn)練,優(yōu)化挖掘機的作業(yè)路徑,提升整體作業(yè)效果和效率。此外,通過持續(xù)的反饋和優(yōu)化,模型可以不斷改進挖掘動作規(guī)劃的能力,降低對人工干預(yù)的依賴,提升挖掘機的自主作業(yè)水平。
1.一種面向非結(jié)構(gòu)工況的挖掘機控制方法,其特征在于,所述方法面向非結(jié)構(gòu)工況的挖掘機控制方法應(yīng)用于控制系統(tǒng);所述控制系統(tǒng)包括客戶端、設(shè)置在挖掘機上的感知設(shè)備和設(shè)置在挖掘機上的控制設(shè)備;所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)該稠密點云數(shù)據(jù)和該挖掘動作軌跡確定當(dāng)前土方狀態(tài),包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述作業(yè)任務(wù)定義二維軌跡矩陣,并將該挖掘動作軌跡中的各個軌跡點映射到所述二維軌跡矩陣中,得到所述挖掘動作軌跡動作的目標(biāo)二維軌跡矩陣,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述土方狀態(tài)矩陣和所述軌跡矩陣序列確定當(dāng)前土方狀態(tài),包括:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述效果參數(shù)包括作業(yè)時間、能量損耗、工作臂系統(tǒng)摩擦損耗和滿斗率;所述根據(jù)所述效果參數(shù),評估所述挖掘動作軌跡的獎勵反饋值,包括:
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述策略評估模型包括編碼器、雙評價網(wǎng)絡(luò)和雙目標(biāo)評價網(wǎng)絡(luò);其中,
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述利用所述第一經(jīng)驗知識庫中的經(jīng)驗訓(xùn)練策略評估模型,得到訓(xùn)練好的策略評估模型,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)該條經(jīng)驗的td誤差和策略臨近系數(shù)計算該條經(jīng)驗的權(quán)重,包括:
10.一種控制系統(tǒng),其特征在于,所述控制系統(tǒng)用于對面向非結(jié)構(gòu)工況的挖掘機進行控制,所述控制系統(tǒng)包括客戶端、設(shè)置在挖掘機上的感知設(shè)備和設(shè)置在挖掘機上的控制設(shè)備;其中,