1.一種應急救援任務下的無人機集群拓撲重構方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述代理網(wǎng)絡根據(jù)無人機的動作被劃分為移動子代理網(wǎng)絡和傳輸子代理網(wǎng)絡,分別用于選擇無人機的移動方向和數(shù)據(jù)包下一跳傳輸節(jié)點;所述移動方向包括:向東、向南、向西、向北和懸停,所述數(shù)據(jù)包下一跳傳輸節(jié)點是無人機通信范圍內(nèi)的鄰居節(jié)點。
3.根據(jù)權利要求2所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述移動子代理網(wǎng)絡和傳輸子代理網(wǎng)絡輸出兩個動作函數(shù)值,同時傳入對應的無人機的局部混合網(wǎng)絡中,輸出無人機的局部聯(lián)合動作值;局部混合網(wǎng)絡的網(wǎng)絡參數(shù)是由以無人機的局部狀態(tài)信息作為輸入的超網(wǎng)絡產(chǎn)生。
4.根據(jù)權利要求1所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述全局混合網(wǎng)絡的網(wǎng)絡參數(shù)是由以無人機集群的全局狀態(tài)信息作為輸入的超網(wǎng)絡產(chǎn)生。
5.根據(jù)權利要求2所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,各無人機的移動子代理網(wǎng)絡和傳輸子代理網(wǎng)絡均具有相同的獎勵函數(shù),用于計算各無人機執(zhí)行動作后獲得的獎勵值;所述獎勵值包括:數(shù)據(jù)包傳輸獎勵值、約束條件獎勵值、重構代價獎勵值和傳輸結束獎勵值。
6.根據(jù)權利要求5所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述數(shù)據(jù)包傳輸獎勵值是每一跳數(shù)據(jù)包傳輸時間的相反數(shù),所述約束條件獎勵值是違反的約束條件對應的預置負獎勵值,所述重構代價獎勵值是選擇的移動方向?qū)念A置負獎勵值,所述傳輸結束獎勵值是數(shù)據(jù)包傳輸至地面基站的預置正獎勵值。
7.根據(jù)權利要求6所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述數(shù)據(jù)包傳輸時間是以最小化數(shù)據(jù)包傳輸時間為優(yōu)化目標,表示如下:
8.根據(jù)權利要求7所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述數(shù)據(jù)包傳輸還滿足以下約束條件:無人機在相鄰時刻間的位置間距為飛行速度和時間間隔的乘積;數(shù)據(jù)包下一跳傳輸節(jié)點在無人機通信范圍內(nèi);數(shù)據(jù)包下一跳傳輸節(jié)點的剩余隊列容量大于等于數(shù)據(jù)包的大小;無人機在時間段內(nèi)各時刻執(zhí)行動作消耗的能量之和小于等于無人機的總能量;無人機在各時刻的位置在預置飛行區(qū)域范圍內(nèi)。
9.根據(jù)權利要求7所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述每一跳數(shù)據(jù)包傳輸時間通過以下步驟計算:
10.根據(jù)權利要求9所述的應急救援任務下的無人機集群拓撲重構方法,其特征在于,所述根據(jù)數(shù)據(jù)包下一跳傳輸節(jié)點類型和傳輸距離,計算出直傳鏈路的路徑損耗,包括: