本公開涉及路徑規(guī)劃相關(guān),具體地說,是涉及一種基于坐標(biāo)感知可學(xué)習(xí)通信圖的機(jī)器人路徑規(guī)劃方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本公開相關(guān)的背景技術(shù)信息,并不必然構(gòu)成在先技術(shù)。
2、隨著機(jī)器人技術(shù)和人工智能的快速發(fā)展,多機(jī)器人系統(tǒng)在各類復(fù)雜環(huán)境中的應(yīng)用日益廣泛,特別是在倉庫、海港和機(jī)場等人造結(jié)構(gòu)中,用于協(xié)助貨物和人員的運(yùn)輸任務(wù)。多機(jī)器人系統(tǒng)的高效協(xié)同工作極大地提高了作業(yè)效率,而在這種多機(jī)器人協(xié)作的場景下,多機(jī)器人路徑規(guī)劃(multi-agent?path?finding,mapf)成為一個(gè)核心的研究問題。mapf的任務(wù)是為多個(gè)機(jī)器人規(guī)劃出一條從起始位置到達(dá)目標(biāo)位置的無沖突路徑,確保每個(gè)機(jī)器人在不發(fā)生碰撞的情況下完成任務(wù)。這一問題的解決在多機(jī)器人系統(tǒng)的應(yīng)用中至關(guān)重要。
3、在傳統(tǒng)的多機(jī)器人路徑規(guī)劃方法中,規(guī)劃器通??梢栽L問全局狀態(tài)信息,并基于此生成一條完整的路徑。然而,近年來基于學(xué)習(xí)的方法逐漸受到關(guān)注,例如mapper和g2rl等,這些方法通常依賴于有限的視場(field?of?view,fov)來進(jìn)行局部路徑規(guī)劃。在此類方法中,機(jī)器人只能感知自身fov范圍內(nèi)的環(huán)境信息,無法全面感知全局環(huán)境。這導(dǎo)致了機(jī)器人在復(fù)雜場景中可能出現(xiàn)“短視”問題,即由于缺乏fov之外的信息,機(jī)器人無法做出全局最優(yōu)的決策。
4、為了彌補(bǔ)fov帶來的局限性,目前一些研究方法嘗試通過在fov范圍內(nèi)引入部分專家路徑或通過機(jī)器人間通信來共享信息。然而,這些方法各自存在局限性:1)在有限視場內(nèi)使用部分專家路徑,雖然可以為機(jī)器人提供一定的規(guī)劃參考,但由于專家路徑通常只能解決局部問題,缺乏全局視角的路徑規(guī)劃很難在復(fù)雜場景下保持最優(yōu)性。2)依賴機(jī)器人間通信:在多機(jī)器人路徑規(guī)劃中,依賴機(jī)器人間的信息共享以彌補(bǔ)fov的限制是一種常見方法,機(jī)器人通過彼此的通信共享路徑和環(huán)境信息,以期提高整體規(guī)劃效果。然而,當(dāng)系統(tǒng)中機(jī)器人數(shù)量增加時(shí),基于全局?jǐn)?shù)據(jù)的信息共享會導(dǎo)致信息過載,機(jī)器人難以從大量共享數(shù)據(jù)中提取有價(jià)值的信息。此時(shí),通信雖然提供了信息共享的渠道,但卻可能因過多無關(guān)信息的干擾,限制了多機(jī)器人系統(tǒng)的學(xué)習(xí)能力和協(xié)作效率。此外,手動預(yù)定義的通信結(jié)構(gòu)也可能會帶來較大的差異性,設(shè)計(jì)不當(dāng)?shù)耐ㄐ沤Y(jié)構(gòu)會無意中阻礙機(jī)器人之間的合作,最終導(dǎo)致整體性能下降。
技術(shù)實(shí)現(xiàn)思路
1、本公開為了解決上述問題,提出了一種基于坐標(biāo)感知可學(xué)習(xí)通信圖的機(jī)器人路徑規(guī)劃方法及系統(tǒng),通過引入scdcn網(wǎng)絡(luò)減少信息冗余、增強(qiáng)特征提取能力,有效提升了路徑規(guī)劃效率;同時(shí),通過可學(xué)習(xí)的通信圖優(yōu)化機(jī)器人間的通信結(jié)構(gòu),降低通信冗余,提高整體協(xié)調(diào)性與路徑規(guī)劃成功率。
2、為了實(shí)現(xiàn)上述目的,本公開采用如下技術(shù)方案:
3、一個(gè)或多個(gè)實(shí)施例提供了基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,包括如下步驟:
4、獲取機(jī)器人觀測的特征,處理特征之間的空間和通道冗余,進(jìn)行特征提??;
5、根據(jù)獲取的機(jī)器人的當(dāng)前坐標(biāo)信息,采用改進(jìn)的注意力機(jī)制對提取的特征進(jìn)行增強(qiáng);
6、將機(jī)器人之間的通信架構(gòu)構(gòu)建為可學(xué)習(xí)通信圖,每個(gè)機(jī)器人作為一個(gè)節(jié)點(diǎn),基于增強(qiáng)后的特征,計(jì)算每個(gè)節(jié)點(diǎn)i與其鄰居機(jī)器人j之間的相關(guān)性分?jǐn)?shù),更新通信圖;
7、根據(jù)更新后的通信圖,對相鄰機(jī)器人的信息進(jìn)行接收并聚合,預(yù)測節(jié)點(diǎn)i所有可能采取的動作,確定每個(gè)機(jī)器人從起點(diǎn)到目標(biāo)點(diǎn)的無碰撞路徑。
8、一個(gè)或多個(gè)實(shí)施例提供了基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃系統(tǒng),包括:
9、特征提取模塊:被配置為獲取機(jī)器人觀測的特征,處理特征之間的空間和通道冗余,進(jìn)行特征提??;
10、注意力模塊:被配置為根據(jù)獲取的機(jī)器人的當(dāng)前坐標(biāo)信息,采用改進(jìn)的注意力機(jī)制對提取的特征進(jìn)行增強(qiáng);
11、可學(xué)習(xí)通信圖模塊:被配置為將機(jī)器人之間的通信架構(gòu)構(gòu)建為可學(xué)習(xí)通信圖,每個(gè)機(jī)器人作為一個(gè)節(jié)點(diǎn),基于增強(qiáng)后的特征,計(jì)算每個(gè)節(jié)點(diǎn)i與其鄰居機(jī)器人j之間的相關(guān)性分?jǐn)?shù),更新通信圖;
12、路徑規(guī)劃模塊:被配置為根據(jù)更新后的通信圖對相鄰機(jī)器人的信息進(jìn)行接收并聚合,預(yù)測節(jié)點(diǎn)i所有可能采取的動作,確定每個(gè)機(jī)器人從起點(diǎn)到目標(biāo)點(diǎn)的無碰撞路徑。
13、一種電子設(shè)備,包括存儲器和處理器以及存儲在存儲器上并在處理器上運(yùn)行的計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器運(yùn)行時(shí),完成上述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法中的步驟。
14、一種計(jì)算機(jī)可讀存儲介質(zhì),用于存儲計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí),完成上述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法中的步驟。
15、與現(xiàn)有技術(shù)相比,本公開的有益效果為:
16、(1)本公開對機(jī)器人觀測特征進(jìn)行提取并處理特征之間的空間和通道冗余,減少信息特征的冗余,增強(qiáng)網(wǎng)絡(luò)的表現(xiàn)力,提高路徑規(guī)劃效率;
17、(2)本公開基于改進(jìn)后的注意力機(jī)制從不同方向不同空間去捕獲特征圖的遠(yuǎn)程依賴關(guān)系,強(qiáng)調(diào)對機(jī)器人觀測特征中坐標(biāo)注意區(qū)域的表示,更好地協(xié)調(diào)各機(jī)器人避免碰撞,提升路徑規(guī)劃成功率;
18、(3)本公開將機(jī)器人之間的通信架構(gòu)概念化為一個(gè)可學(xué)習(xí)的通信圖,并有效地優(yōu)化該通信圖,以減少機(jī)器人間的通信冗余,提高路徑規(guī)劃效率。
19、本公開的優(yōu)點(diǎn)以及附加方面的優(yōu)點(diǎn)將在下面的具體實(shí)施例中進(jìn)行詳細(xì)說明。
1.基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于,包括如下步驟:
2.如權(quán)利要求1所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于:利用scdcn提取機(jī)器人觀測特征,包括精細(xì)特征映射提取方法和精細(xì)特征映射去冗余處理方法,精細(xì)特征映射提取方法包括如下步驟:
3.如權(quán)利要求2所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于,對精細(xì)特征映射進(jìn)行去冗余處理,包括如下步驟:
4.如權(quán)利要求1所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于:采用改進(jìn)的注意力機(jī)制對提取的特征進(jìn)行增強(qiáng),采用sca注意力機(jī)制,sca注意力機(jī)制在coordinate?attention基礎(chǔ)上進(jìn)行改進(jìn),包括1×1卷積分支和3×3卷積分支;
5.如權(quán)利要求1所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于:
6.如權(quán)利要求1所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于,在分布式機(jī)器人鄰接矩陣的基礎(chǔ)上,將機(jī)器人之間的通信架構(gòu)概念化為一個(gè)可學(xué)習(xí)的通信圖,每個(gè)機(jī)器人作為一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)之間的連線表示通信連接;
7.如權(quán)利要求6所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法,其特征在于:針對更新后的通信圖,基于sdpgat模塊進(jìn)行對學(xué)習(xí)完成之后更新的通信圖分配權(quán)重;根據(jù)更新后的通信圖及其權(quán)重,對相鄰機(jī)器人的信息進(jìn)行接收并聚合,最終將聚合的信息傳遞到多層感知器,多層感知器采用概率分布的隨機(jī)動作策略,為每個(gè)機(jī)器人i解碼預(yù)測所有可能采取的動作,然后綜合給出一個(gè)當(dāng)前最優(yōu)動作序列,從而確定一條從起點(diǎn)到目標(biāo)點(diǎn)的無碰撞路徑。
8.基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃系統(tǒng),其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括存儲器和處理器以及存儲在存儲器上并在處理器上運(yùn)行的計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器運(yùn)行時(shí),完成權(quán)利要求1-7任一項(xiàng)所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法中的步驟。
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,用于存儲計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí),完成權(quán)利要求1-7任一項(xiàng)所述的基于坐標(biāo)感知可學(xué)習(xí)通信圖的多機(jī)器人路徑規(guī)劃方法中的步驟。