本發(fā)明涉及機(jī)器人,具體涉及一種激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著移動(dòng)機(jī)器人應(yīng)用的普及,公共場合中移動(dòng)機(jī)器人的密度越來越高,機(jī)器人在導(dǎo)航過程中與人相遇或與其他機(jī)器人相遇的情況越來越頻繁。現(xiàn)有技術(shù),機(jī)器人導(dǎo)航時(shí)碰到對(duì)向的障礙物(行人或其他機(jī)器人),通常從隨機(jī)方向繞過障礙物,可能從左邊繞過也可能從右邊繞過。這種不遵守人類靠右行的約定的導(dǎo)航行為帶來的不確定性,不但會(huì)影響人們的通行效率,而且當(dāng)多個(gè)機(jī)器人在窄走廊對(duì)向相遇時(shí)可能互不相讓,最終堵死走廊,使整個(gè)多機(jī)器人系統(tǒng)停擺。
2、mppi控制器全稱:模型預(yù)測路徑積分控制器。mppi控制器是一個(gè)預(yù)測控制器,是teb和純路徑跟蹤mpc控制器的繼任者。它使用基于采樣的方法來選擇最優(yōu)軌跡,在連續(xù)迭代中進(jìn)行優(yōu)化。它包含基于插件的代價(jià)函數(shù),便于定制和擴(kuò)展以適應(yīng)各種行為和行為屬性。該控制器目前適用于差分、全向和阿克曼型機(jī)器人。
3、mppi算法是mpc的一種變體,通過迭代方法為機(jī)器人找到控制速度。利用上一個(gè)時(shí)間步的最優(yōu)控制序列和機(jī)器人的當(dāng)前狀態(tài),施加一組來自高斯分布的隨機(jī)擾動(dòng)?;跈C(jī)器人運(yùn)動(dòng)模型,這些帶噪聲的控制信號(hào)通過前向仿真生成一組軌跡。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明針對(duì)現(xiàn)有技術(shù)中的不足,提供一種激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
3、一種激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法,使用mppi控制器生成多條導(dǎo)航軌跡,建立激勵(lì)機(jī)器人靠右繞障的代價(jià)函數(shù),基于所述代價(jià)函數(shù)評(píng)價(jià)每一條導(dǎo)航軌跡的總代價(jià)值,驅(qū)動(dòng)機(jī)器人沿總代價(jià)值最小的導(dǎo)航軌跡繞障。
4、為優(yōu)化上述技術(shù)方案,采取的具體措施還包括:
5、進(jìn)一步地,所述建立激勵(lì)機(jī)器人靠右繞障的代價(jià)函數(shù)具體為:
6、設(shè)參考路徑與動(dòng)態(tài)障礙物相交的第一個(gè)點(diǎn)為路徑點(diǎn)p(x0,y0,θ0),x0?為路徑點(diǎn)p的橫坐標(biāo),y0為路徑點(diǎn)p的縱坐標(biāo),θ0是路徑點(diǎn)p處的方向向量的方向角;
7、計(jì)算導(dǎo)航軌跡末端點(diǎn)t(x1,y1)到路徑點(diǎn)p(x0,y0,θ0)所在直線的距離l1;x1為導(dǎo)航軌跡末端點(diǎn)t的橫坐標(biāo),y1為導(dǎo)航軌跡末端點(diǎn)t的縱坐標(biāo);
8、計(jì)算導(dǎo)航軌跡末端點(diǎn)t(x1,y1)到前視點(diǎn)f(x2,y2)的歐式距離l2,計(jì)算公式如下:
9、
10、式中,x2表示前視點(diǎn)的橫坐標(biāo),y2表示前視點(diǎn)的縱坐標(biāo);
11、將導(dǎo)航軌跡末端點(diǎn)到路徑點(diǎn)所在直線的距離l1轉(zhuǎn)換為第一代價(jià)函數(shù):
12、
13、式中,cost1表示第一代價(jià)函數(shù),w表示權(quán)重系數(shù),a表示第一衰減系數(shù),b表示第二衰減系數(shù);
14、將導(dǎo)航軌跡末端點(diǎn)到前視點(diǎn)的歐式距離l2轉(zhuǎn)換為第二代價(jià)函數(shù):
15、
16、式中,cost2為第二代價(jià)函數(shù);
17、計(jì)算總代價(jià)函數(shù):
18、
19、式中,cost為總代價(jià)函數(shù),由總代價(jià)函數(shù)計(jì)算得到導(dǎo)航軌跡的總代價(jià)值。
20、進(jìn)一步地,所述計(jì)算導(dǎo)航軌跡末端點(diǎn)t(x1,y1)到路徑點(diǎn)p(x0,y0,θ0)所在直線的距離l1為:
21、路徑點(diǎn)p處的方向向量表示為:
22、
23、從路徑點(diǎn)p(x0,y0,θ0)到導(dǎo)航軌跡末端點(diǎn)t(x1,y1)的向量表示為:
24、
25、式中,x1為導(dǎo)航軌跡末端點(diǎn)t的橫坐標(biāo),y1為導(dǎo)航軌跡末端點(diǎn)t的縱坐標(biāo);
26、距離l1的計(jì)算公式如下:
27、
28、因?yàn)椋宰罱K的距離公式為。
29、本發(fā)明還提出一種激勵(lì)機(jī)器人靠右繞障的導(dǎo)航系統(tǒng),包括:
30、mppi控制器,用于生成多條導(dǎo)航軌跡;
31、代價(jià)函數(shù)建立模塊,用于建立激勵(lì)機(jī)器人靠右繞障的代價(jià)函數(shù);
32、軌跡選擇模塊,用于基于所述代價(jià)函數(shù)評(píng)價(jià)每一條導(dǎo)航軌跡的總代價(jià)值,驅(qū)動(dòng)機(jī)器人沿總代價(jià)值最小的導(dǎo)航軌跡繞障。
33、本發(fā)明還提出一種電子設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行計(jì)算機(jī)程序時(shí),實(shí)現(xiàn)如上所述的激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法。
34、本發(fā)明還提出一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序使計(jì)算機(jī)執(zhí)行如上所述的激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法。
35、本發(fā)明的有益效果是:當(dāng)參考路徑從障礙物中間穿過,右側(cè)穿過,或中間偏左一點(diǎn)穿過時(shí),從右側(cè)繞障。當(dāng)參考路徑從障礙物非常偏左的地方穿過時(shí)才從左側(cè)繞障。當(dāng)障礙物尺寸很大時(shí),機(jī)器人不會(huì)無限制的繞障,當(dāng)達(dá)到最大繞障距離后,會(huì)停止繞障,并上報(bào),等待新的參考路徑。本發(fā)明提高人機(jī)交互、機(jī)器人之間交互的效率和智能化程度。
1.一種激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法,使用mppi控制器生成多條導(dǎo)航軌跡,其特征在于,建立激勵(lì)機(jī)器人靠右繞障的代價(jià)函數(shù),基于所述代價(jià)函數(shù)評(píng)價(jià)每一條導(dǎo)航軌跡的總代價(jià)值,驅(qū)動(dòng)機(jī)器人沿總代價(jià)值最小的導(dǎo)航軌跡繞障。
2.如權(quán)利要求1所述的激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法,其特征在于,所述建立激勵(lì)機(jī)器人靠右繞障的代價(jià)函數(shù)具體為:
3.如權(quán)利要求2所述的激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法,其特征在于,所述計(jì)算導(dǎo)航軌跡末端點(diǎn)t(x1,y1)到路徑點(diǎn)p(x0,y0,θ0)所在直線的距離l1的計(jì)算方法如下:
4.一種激勵(lì)機(jī)器人靠右繞障的導(dǎo)航系統(tǒng),其特征在于,包括:
5.一種電子設(shè)備,其特征在于,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行計(jì)算機(jī)程序時(shí),實(shí)現(xiàn)如權(quán)利要求1-3任一項(xiàng)所述的激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法。
6.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序使計(jì)算機(jī)執(zhí)行如權(quán)利要求1-3任一項(xiàng)所述的激勵(lì)機(jī)器人靠右繞障的導(dǎo)航方法。