本發(fā)明涉及無人機的智能化避障,具體涉及一種基于仿生成長優(yōu)化過程的無人機路徑優(yōu)化方法。該包括但不限于人工智能、機器學(xué)習(xí)、認(rèn)知計算、機器人自主導(dǎo)航、以及無人機的感知與決策系統(tǒng)。具體來說,本發(fā)明結(jié)合了人類行為學(xué)、神經(jīng)科學(xué)和機器人工程,旨在提升無人機在復(fù)雜環(huán)境中的自主避障能力和任務(wù)執(zhí)行效率。
背景技術(shù):
1、無人機在現(xiàn)代軍事和民用領(lǐng)域得到廣泛應(yīng)用,包括但不限于偵察、監(jiān)視、物流、農(nóng)業(yè)和搜索救援等任務(wù)。然而,無人機在執(zhí)行任務(wù)時面臨復(fù)雜多變的環(huán)境,如何有效避免碰撞、規(guī)劃最優(yōu)路徑成為關(guān)鍵技術(shù)問題。
2、傳統(tǒng)路徑規(guī)劃方法,如基于幾何的方法、圖搜索算法等,通常依賴于環(huán)境的先驗知識,且在動態(tài)環(huán)境中的適應(yīng)性較差。隨著人工智能技術(shù)的發(fā)展,基于機器學(xué)習(xí)的路徑規(guī)劃方法逐漸成為研究熱點,這些方法能夠通過學(xué)習(xí)歷史數(shù)據(jù)來優(yōu)化路徑規(guī)劃。
3、然而,現(xiàn)有技術(shù)在模擬人類大腦處理復(fù)雜環(huán)境的能力方面仍存在局限。人類在成長過程中,通過感知、學(xué)習(xí)、記憶和決策等認(rèn)知功能,逐漸形成對復(fù)雜環(huán)境的適應(yīng)能力。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)方法存在的不足,本發(fā)明提出一種創(chuàng)新的基于仿生成長優(yōu)化過程的無人機路徑優(yōu)化方法,具體包括下列步驟:
2、步驟一:無人機感知模型建立;
3、無人機被假設(shè)為具有一定感知半徑,感知范圍為球形區(qū)域,無人機能夠在這個范圍內(nèi)識別所有障礙信息;
4、任務(wù)初始階段無人機需要感知周圍的障礙信息以及自身狀態(tài)信息,無人機感知模型為:假設(shè)無人機的感知范圍是以自身為原點在立體坐標(biāo)系下的球形區(qū)域,其中立體坐標(biāo)系的x軸為地理坐標(biāo)軸的朝北方向,y軸為地理坐標(biāo)軸的朝東方向,z軸為朝上方向,定義無人機的感知半徑為dsafe,無人機當(dāng)前在空間中的位置為[xuav,yuav,zuav],無人機能夠感知到半徑區(qū)域dsafe內(nèi)的所有障礙信息[xo,yo,zo]為:
5、
6、步驟二:無人機控制模型建立;
7、假設(shè)無人機在空中飛行時只需考慮二維平面內(nèi)的障礙;無人機能夠選擇八個基本方向進行飛行動作,形成避障策略的安全路徑;
8、假設(shè)無人機在空中飛行時,從無人機當(dāng)前所處高度截取水平面,無人機僅需要避開二維平面中的所有障礙即能完成安全飛行;假設(shè)無人機為質(zhì)點控制模型,在每次飛行方向選擇時,無人機的飛行動作行為act共有8個方向能夠進行選擇:
9、act={ul,u,ur,l,r,dl,d,dr}?(2)
10、其中:ul,u,ur,l,r,dl,d,dr分別為表示以當(dāng)前無人機為原點在二維平面上的8個方向,即左上、上、右上、左、右、左下、下、右下;
11、在無人機的飛行過程中,通過將這些基本飛行動作的序列組合起來,獲得一套避障策略的安全路徑;即,無人機防碰撞策略獲得的安全飛行路徑是無人機的飛行動作行為act在時間軸上的序列a:
12、a={act1,act2,...,actn}?(3)
13、其中:act1,act2,...,actn為在時間軸的1到n時刻上所采取的無人機飛行動作;
14、在規(guī)劃好無人機的路徑之后,無人機需要按照既定軌跡進行飛行;
15、步驟三:基于仿生成長優(yōu)化過程的無人機路徑規(guī)劃;
16、具體如下:
17、step?1:無人機路徑規(guī)劃;
18、假設(shè)無人機在飛行過程中實時感知到周圍的障礙信息為靜態(tài)障礙的最近坐標(biāo)點so=[xso,yso,zso]與動態(tài)障礙的最近坐標(biāo)點mo=[xmo,ymo,zmo],假設(shè)無人機執(zhí)行任務(wù)的目標(biāo)坐標(biāo)點為ptar=[xp,yp,zp],則定義人工勢場的目標(biāo)吸引力ua與障礙排斥力ur分別為:
19、ua=-ka·[(xp-xuav)2+(yp-yuav)2+(zp-zuav)2]?(4)
20、
21、其中:ka為目標(biāo)吸引力的權(quán)值系數(shù),kr1和kr2分別為靜態(tài)障礙so與動態(tài)障礙mo排斥力權(quán)值系數(shù),σr1和σr2分別為靜態(tài)障礙so與動態(tài)障礙mo的排斥系數(shù),exp為冪函數(shù);
22、設(shè)定||ptar-[xuav,yuav,zuav]||=[(xp-xuav)2+(yp-yuav)2+(zp-zuav)2],||mo-[xuav,yuav,zuav]||=[(xmo-xuav)2+(ymo-yuav)2+(zmo-zuav)2],||so-[xuav,yuav,zuav]||=[(xso-xuav)2+(yso-yuav)2+(zso-zuav)2],由此計算出勢場的吸引力梯度與排斥力梯度函數(shù)分別為:
23、
24、其中:表示梯度符號;
25、由此得到控制無人機的導(dǎo)航向量為勢場梯度的函數(shù)之和:
26、
27、其中:i為無人機感知區(qū)域范圍內(nèi)的障礙個數(shù),表示對無人機感知范圍內(nèi)所有排斥力梯度函數(shù)進行疊加求和,為第i個障礙的排斥力梯度函數(shù);
28、在前面所計算的引力梯度函數(shù)與斥力梯度函數(shù)的基礎(chǔ)上,根據(jù)步驟一得出時間軸上的動作序列a,無人機根據(jù)動作序列a執(zhí)行飛行動作,則可以得出在障礙環(huán)境中的防碰撞策略l。
29、step?2:障礙模式與防碰撞策略映射匹配;
30、無人機在構(gòu)建傳統(tǒng)防碰撞算法中的映射關(guān)系時,障礙模式與防碰撞策略之間存在一對一的映射關(guān)系;對于任何障礙模式ms=[so,mo],都有一種獨特的防碰撞策略l;
31、無人機初始在障礙環(huán)境中進行路徑規(guī)劃,由于對環(huán)境障礙信息的不熟悉,采用“發(fā)現(xiàn)障礙——算法計算——合理規(guī)避”的防碰撞路徑規(guī)劃算法,此時能夠根據(jù)路徑代價函數(shù)挑選最優(yōu)的路徑,無人機按照路徑進行飛行;
32、當(dāng)無人機在環(huán)境中不斷訓(xùn)練,得到多種障礙模式ms和防碰撞策略的映射關(guān)系知識積累后,采用“發(fā)現(xiàn)障礙——合理規(guī)避”的方法,直接快速得到安全路徑l,從而控制無人機的飛行,具體如下:
33、在無人機的感知范圍內(nèi),“發(fā)現(xiàn)障礙——合理規(guī)避”的方式是一個匹配選擇機制,根據(jù)威脅模式ms=[so,mo],通過映射關(guān)系f,在之前所選擇的防碰撞策略l基礎(chǔ)之上,根據(jù)當(dāng)前障礙模式ms所得出的較為優(yōu)化的路徑l';
34、l'=f(ms,l,kb(ms),kb(l),kb(f)),ms∈ω,l∈ω?(9)
35、其中:kb(ms),kb(l),kb(f)分別表示障礙模式知識庫、防碰撞策略知識庫,以及映射關(guān)系知識庫,為無人機在環(huán)境中不斷訓(xùn)練過程中所得到多種障礙模式、防碰撞策略以及兩者之間映射關(guān)系的逐漸積累記錄過程,ω表示無人知范圍,f(·)表示映射關(guān)系;
36、當(dāng)知識庫豐富到一定程度,當(dāng)前無人機有較大幾率能夠遇見與威脅模式知識庫中的威脅模式ms相同或者相似的威脅模式ms′,則能夠不通過長時間的算法計算,而是直接根據(jù)當(dāng)前障礙模式ms所得出的較為優(yōu)化的路徑l',即式(9)所示的“發(fā)現(xiàn)障礙——合理規(guī)避”的方法,直接通過映射生成防碰撞策略,即安全飛行的路徑;
37、step?3:仿生成長優(yōu)化路徑認(rèn)知發(fā)育;
38、引入一個反饋機制,以逐步擴展無人機的知識庫,具體如下:
39、式(10)所示為仿生成長優(yōu)化路徑發(fā)育的數(shù)學(xué)模型,無人機根據(jù)當(dāng)前威脅模式ms,通過映射關(guān)系f,在之前所選擇的安全路徑l基礎(chǔ)上得到較為優(yōu)化的路徑l',在此過程中,每次將新的威脅模式增量δkbn(ms)、路徑增量δkbn(l)、以及映射關(guān)系增量δkbn(f)分別增量式地添加到知識庫kbn(ms),kbn(l),kbn(f)中,從而擴充為更為豐富的知識庫kbn+1(ms),kbn+1(l),kbn+1(f)
40、
41、其中:l'根據(jù)當(dāng)前障礙模式ms所得出的較為優(yōu)化的路徑,kbn(ms),kbn(l),kbn(f)分別表示障礙模式知識庫增量、防碰撞策略知識庫增量,以及映射關(guān)系知識庫增量,δkbn(ms),δkbn(l),δkbn(f)分別表示當(dāng)前的威脅模式增量、路徑增量以及映射關(guān)系增量;在增量的擴充之下,知識庫進行逐次更新進行豐富,得到kbn+1(ms),kbn+1(l),kbn+1(f)。
42、在本發(fā)明一個實施例的步驟三step2中,無人機在障礙環(huán)境中,當(dāng)前面對的威脅模式為ms=[so,mo],此時無人機通過step1的無人機路徑規(guī)劃方法,計算得出防碰撞策略l,則威脅模式ms與安全路徑l之間形成映射關(guān)系f(·);分別將障礙模式、防碰撞策略l以及映射關(guān)系f(·)存儲到所對應(yīng)的障礙模式知識庫kb(ms)、防碰撞策略知識庫kb(l),以及映射關(guān)系知識庫kb(f)中,在障礙環(huán)境中不斷重復(fù)上述步驟,則可以不斷增量式地豐富三種知識庫,逐漸積累三種關(guān)系知識
43、本發(fā)明基于仿生成長優(yōu)化過程,模仿人類大腦事件相關(guān)電位(erp)環(huán)路的發(fā)育模式,以實現(xiàn)無人機在復(fù)雜環(huán)境中的高效和智能導(dǎo)航。
44、為解決現(xiàn)有技術(shù)中的局限性,本發(fā)明通過無人機感知模型建立、無人機控制模型建立,以及基于仿生成長優(yōu)化過程的無人機路徑規(guī)劃,這三個關(guān)鍵技術(shù)步驟實現(xiàn):
45、這些步驟共同構(gòu)成了本發(fā)明的核心,旨在通過模擬人類大腦的發(fā)育模式,提升無人機在復(fù)雜環(huán)境中的自主避障能力和任務(wù)執(zhí)行效率。與現(xiàn)有技術(shù)相比,本發(fā)明的無人機路徑優(yōu)化方法具有更高的智能性、適應(yīng)性和效率,能夠顯著提升無人機在復(fù)雜環(huán)境中的作業(yè)能力。