一種建筑機(jī)器人路徑規(guī)劃方法及相關(guān)裝置

文檔序號(hào)：40531262發(fā)布日期：2024-12-31 13:45閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>測(cè)量裝置的制造及其應(yīng)用技術(shù)>一種建筑機(jī)器人路徑規(guī)劃方法及相關(guān)裝置

技術(shù)特征：

1.一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，所述改進(jìn)的雙延遲深度確定性策略梯度模型包括actor網(wǎng)絡(luò)模塊和critic網(wǎng)絡(luò)模塊；

3.根據(jù)權(quán)利要求2所述的一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，基于采樣優(yōu)先級(jí)經(jīng)驗(yàn)回放機(jī)制從經(jīng)驗(yàn)池中采樣，并對(duì)所述改進(jìn)的雙延遲深度確定性策略梯度模型進(jìn)行訓(xùn)練，獲得路徑規(guī)劃模型的過(guò)程中，通過(guò)引入軟更新機(jī)制的延遲更新策略，對(duì)actor網(wǎng)絡(luò)模塊的網(wǎng)絡(luò)參數(shù)和critic網(wǎng)絡(luò)模塊的網(wǎng)絡(luò)參數(shù)進(jìn)行更新。

4.根據(jù)權(quán)利要求2所述的一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，在所述actor目標(biāo)網(wǎng)絡(luò)中加入有隨機(jī)噪聲；其中，所述隨機(jī)噪聲，具體為：

5.根據(jù)權(quán)利要求1所述的一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，建筑機(jī)器人的當(dāng)前狀態(tài)的狀態(tài)空間包括運(yùn)動(dòng)狀態(tài)、碰撞狀態(tài)及成功到達(dá)目標(biāo)狀態(tài)；其中，建筑機(jī)器人的當(dāng)前狀態(tài)的狀態(tài)空間，具體為：

6.根據(jù)權(quán)利要求1所述的一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，執(zhí)行規(guī)劃動(dòng)作獲取下一時(shí)刻的狀態(tài)并獲得計(jì)算規(guī)劃動(dòng)作的獎(jiǎng)勵(lì)的過(guò)程中，利用強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)函數(shù)計(jì)算規(guī)劃動(dòng)作的獎(jiǎng)勵(lì)；

7.根據(jù)權(quán)利要求1所述的一種建筑機(jī)器人路徑規(guī)劃方法，其特征在于，所述采樣優(yōu)先級(jí)經(jīng)驗(yàn)回放機(jī)制中采樣概率為：

8.一種建筑機(jī)器人路徑規(guī)劃系統(tǒng)，其特征在于，包括：

9.一種建筑機(jī)器人路徑規(guī)劃設(shè)備，其特征在于，包括：

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的建筑機(jī)器人路徑規(guī)劃方法的步驟。

技術(shù)總結(jié)
本發(fā)明屬于機(jī)器人路徑規(guī)劃技術(shù)領(lǐng)域，公開(kāi)了一種建筑機(jī)器人路徑規(guī)劃方法及相關(guān)裝置，包括：將建筑機(jī)器人的當(dāng)前狀態(tài)輸入至所述改進(jìn)的雙延遲深度確定性策略梯度模型中獲得規(guī)劃動(dòng)作，執(zhí)行規(guī)劃動(dòng)作獲取下一時(shí)刻的狀態(tài)并獲得計(jì)算規(guī)劃動(dòng)作的獎(jiǎng)勵(lì)；基于當(dāng)前時(shí)刻的狀態(tài)、獎(jiǎng)勵(lì)和動(dòng)作以及下一時(shí)刻的狀態(tài)，通過(guò)采樣優(yōu)先級(jí)經(jīng)驗(yàn)回放機(jī)制形成經(jīng)驗(yàn)數(shù)據(jù)并存儲(chǔ)至經(jīng)驗(yàn)池；基于采樣優(yōu)先級(jí)經(jīng)驗(yàn)回放機(jī)制從經(jīng)驗(yàn)池中采樣，并對(duì)所述改進(jìn)的雙延遲深度確定性策略梯度模型進(jìn)行訓(xùn)練，獲得路徑規(guī)劃模型；利用所述路徑規(guī)劃模型進(jìn)行路徑規(guī)劃，得到建筑機(jī)器人路徑規(guī)劃結(jié)果；本發(fā)明有效解決RNN等傳統(tǒng)模型梯度消失和梯度爆炸問(wèn)題，大大降低了模型訓(xùn)練時(shí)間，提高了收斂速度。

技術(shù)研發(fā)人員：于軍琪,陳易圣,馮春勇,郭聚剛,王凱,李經(jīng)丹
受保護(hù)的技術(shù)使用者：西安建筑科技大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/30

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種建筑機(jī)器人路徑規(guī)劃方法及相關(guān)裝置