一種基于QMIX算法的自動(dòng)化倉庫多AGV多周期路徑規(guī)劃方法

文檔序號(hào)：40644415發(fā)布日期：2025-01-10 18:50閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)>一種基于QMIX算法的自動(dòng)化倉庫多AGV多周期路徑規(guī)劃方法

技術(shù)特征：

1.一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述步驟s1中agv的部分觀測(cè)信息具體為：

3.根據(jù)權(quán)利要求2所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述狀態(tài)空間具體為：s＝(s小車，s目的地，s障礙物)其中，agv的狀態(tài)即位置坐標(biāo)由表示，它由n個(gè)位置坐標(biāo)元組構(gòu)成，n為agv的數(shù)量；

4.根據(jù)權(quán)利要求2所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述觀測(cè)空間具體為：o＝(o障礙物，o小車，o目的地)，將其分解為三個(gè)矩陣，即障礙矩陣、其他agv矩陣以及目標(biāo)投影矩陣，障礙矩陣o障礙物包含了agv可觀測(cè)距離內(nèi)的障礙物信息，當(dāng)觀測(cè)范圍內(nèi)有障礙物時(shí)，矩陣中該部分會(huì)被置1，否則為0；

5.根據(jù)權(quán)利要求2所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述步驟s2中路徑規(guī)劃模型包括多個(gè)rnn神經(jīng)網(wǎng)絡(luò)，多個(gè)rnn神經(jīng)網(wǎng)絡(luò)分別連接至混合網(wǎng)絡(luò)，多個(gè)rnn神經(jīng)網(wǎng)絡(luò)分別對(duì)應(yīng)于不同的agv，各rnn神經(jīng)網(wǎng)絡(luò)均包括輸入層mlp、中間層gru和輸出層mlp，所述rnn神經(jīng)網(wǎng)絡(luò)的輸入為每輛agv的觀測(cè)空間、agv的動(dòng)作編碼以及agv的id，輸出為該agv的q值；

6.根據(jù)權(quán)利要求5所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述步驟s3中rnn神經(jīng)網(wǎng)絡(luò)的工作過程包括：將每個(gè)agv的當(dāng)前觀測(cè)值、上一步的動(dòng)作、以向量形式表示的每個(gè)agv的id的one-hot編碼輸入給輸入層mlp、通過中間層gru接受第一層的輸入和隱藏的歷史信息，通過輸出層mlp輸出預(yù)測(cè)的q值。

7.根據(jù)權(quán)利要求5所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述步驟s3中ε-greedy策略的計(jì)算公式為：

8.根據(jù)權(quán)利要求5所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述步驟s4中agv的獎(jiǎng)勵(lì)值通過獎(jiǎng)勵(lì)函數(shù)計(jì)算得到：

9.根據(jù)權(quán)利要求8所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述沖突包括節(jié)點(diǎn)沖突、跟隨沖突、換位沖突和循環(huán)沖突。

10.根據(jù)權(quán)利要求9所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法，其特征在于，所述節(jié)點(diǎn)沖突具體是指：agv計(jì)劃在同一時(shí)間步長占據(jù)同一節(jié)點(diǎn)；

技術(shù)總結(jié)
本發(fā)明涉及一種基于QMIX算法的自動(dòng)化倉庫多AGV多周期路徑規(guī)劃方法，包括：根據(jù)倉庫布局建立倉庫節(jié)點(diǎn)圖，獲取AGV的部分觀測(cè)信息，確定AGV初始起點(diǎn)、終點(diǎn)以及障礙物信息；若當(dāng)前已有訓(xùn)練好的路徑規(guī)劃模型，則將AGV初始起點(diǎn)、終點(diǎn)以及障礙物信息，結(jié)合AGV前一個(gè)動(dòng)作與AGV的ID信息，共同輸入路徑規(guī)劃模型，輸出得到AGV對(duì)應(yīng)行駛路徑；否則構(gòu)建強(qiáng)化學(xué)習(xí)環(huán)境，將AGV的局部觀測(cè)信息作為輸入將其轉(zhuǎn)化為觀測(cè)矩陣，將觀測(cè)矩陣輸入深度神經(jīng)網(wǎng)絡(luò)，輸出每個(gè)AGV的Q值，再通過參數(shù)網(wǎng)絡(luò)接受全局信息生成參數(shù)，最后推理網(wǎng)絡(luò)讀取每輛AGV的Q值與參數(shù)網(wǎng)絡(luò)的參數(shù)輸出整體Q值。與現(xiàn)有技術(shù)相比，本發(fā)明針對(duì)多AGV進(jìn)行多周期的路徑規(guī)劃，能夠提高多AGV在復(fù)雜環(huán)境中的工作效率和準(zhǔn)確性。

技術(shù)研發(fā)人員：胡鴻韜,林偉,王翥
受保護(hù)的技術(shù)使用者：上海海事大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于QMIX算法的自動(dòng)化倉庫多AGV多周期路徑規(guī)劃方法