欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于QMIX算法的自動(dòng)化倉庫多AGV多周期路徑規(guī)劃方法

文檔序號(hào):40644415發(fā)布日期:2025-01-10 18:50閱讀:來源:國知局

技術(shù)特征:

1.一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,包括以下步驟:

2.根據(jù)權(quán)利要求1所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述步驟s1中agv的部分觀測(cè)信息具體為:

3.根據(jù)權(quán)利要求2所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述狀態(tài)空間具體為:s=(s小車,s目的地,s障礙物)其中,agv的狀態(tài)即位置坐標(biāo)由表示,它由n個(gè)位置坐標(biāo)元組構(gòu)成,n為agv的數(shù)量;

4.根據(jù)權(quán)利要求2所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述觀測(cè)空間具體為:o=(o障礙物,o小車,o目的地),將其分解為三個(gè)矩陣,即障礙矩陣、其他agv矩陣以及目標(biāo)投影矩陣,障礙矩陣o障礙物包含了agv可觀測(cè)距離內(nèi)的障礙物信息,當(dāng)觀測(cè)范圍內(nèi)有障礙物時(shí),矩陣中該部分會(huì)被置1,否則為0;

5.根據(jù)權(quán)利要求2所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述步驟s2中路徑規(guī)劃模型包括多個(gè)rnn神經(jīng)網(wǎng)絡(luò),多個(gè)rnn神經(jīng)網(wǎng)絡(luò)分別連接至混合網(wǎng)絡(luò),多個(gè)rnn神經(jīng)網(wǎng)絡(luò)分別對(duì)應(yīng)于不同的agv,各rnn神經(jīng)網(wǎng)絡(luò)均包括輸入層mlp、中間層gru和輸出層mlp,所述rnn神經(jīng)網(wǎng)絡(luò)的輸入為每輛agv的觀測(cè)空間、agv的動(dòng)作編碼以及agv的id,輸出為該agv的q值;

6.根據(jù)權(quán)利要求5所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述步驟s3中rnn神經(jīng)網(wǎng)絡(luò)的工作過程包括:將每個(gè)agv的當(dāng)前觀測(cè)值、上一步的動(dòng)作、以向量形式表示的每個(gè)agv的id的one-hot編碼輸入給輸入層mlp、通過中間層gru接受第一層的輸入和隱藏的歷史信息,通過輸出層mlp輸出預(yù)測(cè)的q值。

7.根據(jù)權(quán)利要求5所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述步驟s3中ε-greedy策略的計(jì)算公式為:

8.根據(jù)權(quán)利要求5所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述步驟s4中agv的獎(jiǎng)勵(lì)值通過獎(jiǎng)勵(lì)函數(shù)計(jì)算得到:

9.根據(jù)權(quán)利要求8所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述沖突包括節(jié)點(diǎn)沖突、跟隨沖突、換位沖突和循環(huán)沖突。

10.根據(jù)權(quán)利要求9所述的一種基于qmix算法的自動(dòng)化倉庫多agv多周期路徑規(guī)劃方法,其特征在于,所述節(jié)點(diǎn)沖突具體是指:agv計(jì)劃在同一時(shí)間步長占據(jù)同一節(jié)點(diǎn);


技術(shù)總結(jié)
本發(fā)明涉及一種基于QMIX算法的自動(dòng)化倉庫多AGV多周期路徑規(guī)劃方法,包括:根據(jù)倉庫布局建立倉庫節(jié)點(diǎn)圖,獲取AGV的部分觀測(cè)信息,確定AGV初始起點(diǎn)、終點(diǎn)以及障礙物信息;若當(dāng)前已有訓(xùn)練好的路徑規(guī)劃模型,則將AGV初始起點(diǎn)、終點(diǎn)以及障礙物信息,結(jié)合AGV前一個(gè)動(dòng)作與AGV的ID信息,共同輸入路徑規(guī)劃模型,輸出得到AGV對(duì)應(yīng)行駛路徑;否則構(gòu)建強(qiáng)化學(xué)習(xí)環(huán)境,將AGV的局部觀測(cè)信息作為輸入將其轉(zhuǎn)化為觀測(cè)矩陣,將觀測(cè)矩陣輸入深度神經(jīng)網(wǎng)絡(luò),輸出每個(gè)AGV的Q值,再通過參數(shù)網(wǎng)絡(luò)接受全局信息生成參數(shù),最后推理網(wǎng)絡(luò)讀取每輛AGV的Q值與參數(shù)網(wǎng)絡(luò)的參數(shù)輸出整體Q值。與現(xiàn)有技術(shù)相比,本發(fā)明針對(duì)多AGV進(jìn)行多周期的路徑規(guī)劃,能夠提高多AGV在復(fù)雜環(huán)境中的工作效率和準(zhǔn)確性。

技術(shù)研發(fā)人員:胡鴻韜,林偉,王翥
受保護(hù)的技術(shù)使用者:上海海事大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
墨竹工卡县| 喀喇| 沙雅县| 大城县| 吕梁市| 资阳市| 南平市| 个旧市| 阿拉尔市| 化州市| 台江县| 高碑店市| 固阳县| 河东区| 安徽省| 南丹县| 巴彦县| 隆德县| 宜川县| 静海县| 孙吴县| 平凉市| 神木县| 万宁市| 凉城县| 镇巴县| 从化市| 上高县| 广丰县| 隆子县| 乐平市| 山阳县| 东光县| 错那县| 迁西县| 新余市| 景宁| 涞源县| 社旗县| 安国市| 浏阳市|