本發(fā)明涉及機場資源調(diào)度,尤其涉及一種飛機機場滑行調(diào)度模型訓練方法及系統(tǒng)。
背景技術(shù):
1、民用機場通常每個飛行日至少會有幾十架飛機參與飛行,一些繁忙的國際機場可能在高峰時段有更多的航班起降,每日航班數(shù)量可能在100到500個之間,而同時在機場滑行軌道執(zhí)行起飛或降落滑行的飛行器可能超過10架,這就要求機場地面指揮中心必須高效地進行飛機滑行指揮調(diào)度,保證飛機在滑行過程中不發(fā)生路徑?jīng)_突,并且快速到達指定位置完成起飛或者降落任務(wù)。
2、然而隨著飛機數(shù)量的增加,在機場面積及調(diào)度時間受限情況下,飛機機場滑行快速調(diào)度變得越來越困難。在機場環(huán)境中,飛機會進行起飛、降落和滑行等活動,它們的位置和狀態(tài)會發(fā)生變化,而飛機的移動會導致地面交通的調(diào)整和路徑規(guī)劃的重新計算,使得機場調(diào)度變得十分復雜。
3、現(xiàn)有的飛機機場滑行調(diào)度技術(shù)大多采用改變滑行路徑的方法以達到時間成本的縮減或針對單一道口進行研究,但上述方式在實際運行情況,航空器轉(zhuǎn)彎操作較難,且航空器在后續(xù)滑行時,車輛的存在會影響飛機在滑行起飛時的路線選擇,引發(fā)潛在的沖突與延誤,導致機場整體運行的安全性較低。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種飛機機場滑行調(diào)度模型訓練方法及系統(tǒng),用于解決現(xiàn)有的飛機機場滑行調(diào)度技術(shù)導致機場整體運行的安全性較低的技術(shù)問題。
2、本發(fā)明第一方面提供的一種飛機機場滑行調(diào)度模型訓練方法,包括:
3、獲取待訓練飛機機場數(shù)據(jù)和待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),并根據(jù)所述待訓練飛機機場數(shù)據(jù)和所述待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),確定目標數(shù)字孿生模型;
4、對所述目標數(shù)字孿生模型進行仿真運算,生成目標仿真運行數(shù)據(jù);
5、采用所述目標仿真運行數(shù)據(jù)、所述待訓練飛機機場數(shù)據(jù)和所述待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),構(gòu)建機場飛機滑行模型;
6、對所述機場飛機滑行模型進行仿真運算,輸出飛機滑行運動數(shù)據(jù)集;
7、根據(jù)所述飛機滑行運動數(shù)據(jù)集、所述目標仿真運行數(shù)據(jù)和預(yù)置實際運行數(shù)據(jù)對初始飛機機場滑行調(diào)度模型進行分布式訓練,確定目標飛機機場滑行調(diào)度模型。
8、可選地,所述根據(jù)所述待訓練飛機機場數(shù)據(jù)和所述待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),確定目標數(shù)字孿生模型的步驟,包括:
9、采用所述待訓練飛機機場數(shù)據(jù)和所述待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),構(gòu)建初始數(shù)字孿生模型;
10、對所述初始數(shù)字孿生模型進行仿真運算,生成初始仿真運行數(shù)據(jù);
11、采用所述預(yù)置實際運行數(shù)據(jù)和所述初始仿真運行數(shù)據(jù)對所述初始數(shù)字孿生模型進行訓練,確定目標數(shù)字孿生模型。
12、可選地,所述根據(jù)所述飛機滑行運動數(shù)據(jù)集、所述目標仿真運行數(shù)據(jù)和預(yù)置實際運行數(shù)據(jù)對初始飛機機場滑行調(diào)度模型進行分布式訓練,確定目標飛機機場滑行調(diào)度模型的步驟,包括:
13、基于預(yù)置危險區(qū)篩選條件,根據(jù)所述目標仿真運行數(shù)據(jù)和預(yù)置實際運行數(shù)據(jù),確定多個目標位置關(guān)系;
14、采用預(yù)置多智能體強化學習算法根據(jù)所述飛機滑行運動數(shù)據(jù)集、所述目標仿真運行數(shù)據(jù)中多個仿真環(huán)境信息、所述預(yù)置實際運行數(shù)據(jù)中多個實際環(huán)境信息和各所述目標位置關(guān)系,計算各所述仿真環(huán)境信息對應(yīng)的仿真重要性程度值和各所述實際環(huán)境信息對應(yīng)的實際重要性程度值;
15、比較各所述仿真重要性程度值、各所述實際重要性程度值和預(yù)置程度閾值;
16、將任一大于所述預(yù)置程度閾值的仿真重要性程度值對應(yīng)的仿真環(huán)境信息和實際重要性程度值對應(yīng)的實際環(huán)境信息,作為目標環(huán)境信息;
17、對所述飛機滑行運動數(shù)據(jù)集進行采樣,確定多個采樣飛機滑行運動數(shù)據(jù);
18、將所述目標環(huán)境信息、多個所述采樣飛機滑行運動數(shù)據(jù)作為所述初始飛機機場滑行調(diào)度模型中的初始策略網(wǎng)絡(luò)的輸入,輸出多個待訓練飛機滑行分布式策略;
19、采用各所述待訓練飛機滑行分布式策略、所述目標仿真運行數(shù)據(jù)中多個仿真環(huán)境信息和所述預(yù)置實際運行數(shù)據(jù)中多個實際環(huán)境信息對所述初始飛機機場滑行調(diào)度模型進行訓練,確定目標飛機機場滑行調(diào)度模型。
20、可選地,所述基于預(yù)置危險區(qū)篩選條件,根據(jù)所述目標仿真運行數(shù)據(jù)和預(yù)置實際運行數(shù)據(jù),確定多個目標位置關(guān)系的步驟,包括:
21、根據(jù)所述目標仿真運行數(shù)據(jù)中多個仿真環(huán)境信息和所述預(yù)置實際運行數(shù)據(jù)中多個實際環(huán)境信息,確定多個仿真飛機位置關(guān)系和多個實際飛機位置關(guān)系;
22、基于所述預(yù)置危險區(qū)篩選條件,對各所述仿真飛機位置關(guān)系和各所述實際飛機位置關(guān)系進行篩選,確定多個目標位置關(guān)系。
23、可選地,所述初始飛機機場滑行調(diào)度模型還包括初始值函數(shù)網(wǎng)絡(luò)和初始副本網(wǎng)絡(luò);所述目標飛機機場滑行調(diào)度模型包括目標策略網(wǎng)絡(luò)、目標值函數(shù)網(wǎng)絡(luò)和目標副本網(wǎng)絡(luò);所述采用各所述待訓練飛機滑行分布式策略、所述目標仿真運行數(shù)據(jù)中多個仿真環(huán)境信息和所述預(yù)置實際運行數(shù)據(jù)中多個實際環(huán)境信息對所述初始飛機機場滑行調(diào)度模型進行訓練,確定目標飛機機場滑行調(diào)度模型的步驟,包括:
24、對各所述待訓練飛機滑行分布式策略、所述目標仿真運行數(shù)據(jù)中多個仿真環(huán)境信息和所述預(yù)置實際運行數(shù)據(jù)中多個實際環(huán)境信息進行交互,生成交互結(jié)果、多個新的仿真環(huán)境信息和多個新的實際環(huán)境信息;
25、根據(jù)所述交互結(jié)果計算獎勵函數(shù)值;
26、通過所述初始值函數(shù)網(wǎng)絡(luò)分別對各所述待訓練飛機滑行分布式策略和各所述待訓練飛機滑行分布式策略的概率分布進行打分,輸出第一打分結(jié)果和第二打分結(jié)果;
27、采用所述目標副本網(wǎng)絡(luò)對各所述待訓練飛機滑行分布式策略進行打分,輸出第三打分結(jié)果;
28、將所述獎勵函數(shù)值、所述第一打分結(jié)果、所述第二打分結(jié)果和所述第三打分結(jié)果代入預(yù)置損失函數(shù)并求導,確定模型梯度;
29、基于預(yù)置優(yōu)化器,采用所述模型梯度對所述初始策略網(wǎng)絡(luò)的模型參數(shù)、所述初始值函數(shù)網(wǎng)絡(luò)的模型參數(shù)和所述初始副本網(wǎng)絡(luò)的模型參數(shù)進行更新,確定中間策略網(wǎng)絡(luò)、中間值函數(shù)網(wǎng)絡(luò)和中間副本網(wǎng)絡(luò),并實時統(tǒng)計仿真迭代次數(shù);
30、判斷所述仿真迭代次數(shù)是否達到預(yù)置迭代閾值;
31、若所述仿真迭代次數(shù)達到所述預(yù)置迭代閾值,則將所述中間策略網(wǎng)絡(luò)作為目標策略網(wǎng)絡(luò)、將所述中間值函數(shù)網(wǎng)絡(luò)作為目標值函數(shù)網(wǎng)絡(luò)和將所述中間副本網(wǎng)絡(luò)作為目標副本網(wǎng)絡(luò)。
32、可選地,還包括:
33、獲取待調(diào)度飛機機場數(shù)據(jù)和待調(diào)度車輛拓撲結(jié)構(gòu)數(shù)據(jù),并根據(jù)所述待調(diào)度飛機機場數(shù)據(jù)和所述待調(diào)度車輛拓撲結(jié)構(gòu)數(shù)據(jù),確定待調(diào)度目標數(shù)字孿生模型;
34、對所述待調(diào)度目標數(shù)字孿生模型進行仿真運算,生成待調(diào)度目標仿真運行數(shù)據(jù);
35、采用所述待調(diào)度目標仿真運行數(shù)據(jù)、所述待調(diào)度飛機機場數(shù)據(jù)和所述待調(diào)度車輛拓撲結(jié)構(gòu)數(shù)據(jù),構(gòu)建待調(diào)度機場飛機滑行模型;
36、對所述待調(diào)度機場飛機滑行模型進行仿真運算,輸出待調(diào)度飛機滑行運動數(shù)據(jù)集;
37、基于預(yù)置危險區(qū)篩選條件和預(yù)置多智能體強化學習算法,根據(jù)所述待調(diào)度目標仿真運行數(shù)據(jù)、預(yù)置實際運行數(shù)據(jù)和所述待調(diào)度飛機滑行運動數(shù)據(jù)集,確定待調(diào)度目標環(huán)境信息;
38、將所述待調(diào)度目標環(huán)境信息、所述待調(diào)度飛機滑行運動數(shù)據(jù)集作為所述目標飛機機場滑行調(diào)度模型中目標策略網(wǎng)絡(luò)的輸入,輸出多個目標飛機滑行分布式策略。
39、本發(fā)明第二方面提供的一種飛機機場滑行調(diào)度模型訓練系統(tǒng),包括:
40、獲取模塊,用于獲取待訓練飛機機場數(shù)據(jù)和待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),并根據(jù)所述待訓練飛機機場數(shù)據(jù)和所述待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),確定目標數(shù)字孿生模型;
41、第一運算模塊,用于對所述目標數(shù)字孿生模型進行仿真運算,生成目標仿真運行數(shù)據(jù);
42、構(gòu)建模塊,用于采用所述目標仿真運行數(shù)據(jù)、所述待訓練飛機機場數(shù)據(jù)和所述待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),構(gòu)建機場飛機滑行模型;
43、第二運算模塊,用于對所述機場飛機滑行模型進行仿真運算,輸出飛機滑行運動數(shù)據(jù)集;
44、訓練模塊,用于根據(jù)所述飛機滑行運動數(shù)據(jù)集、所述目標仿真運行數(shù)據(jù)和預(yù)置實際運行數(shù)據(jù)對初始飛機機場滑行調(diào)度模型進行模型訓練,確定目標飛機機場滑行調(diào)度模型。
45、本發(fā)明第三方面提供的一種計算機設(shè)備,包括存儲器及處理器,所述存儲器中儲存有計算機程序,所述計算機程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行如上述任一項所述的飛機機場滑行調(diào)度模型訓練方法的步驟。
46、本發(fā)明第四方面提供的一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被執(zhí)行時實現(xiàn)如上述任一項所述的飛機機場滑行調(diào)度模型訓練方法的步驟。
47、本發(fā)明第五方面提供的一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括存儲在非暫態(tài)計算機可讀存儲介質(zhì)上的計算機程序,所述計算機程序包括程序指令,其中,當所述程序指令被計算機執(zhí)行時,使所述計算機執(zhí)行如上述任一項所述的飛機機場滑行調(diào)度模型訓練方法的步驟。
48、從以上技術(shù)方案可以看出,本發(fā)明具有以下優(yōu)點:
49、本發(fā)明的上述技術(shù)方案提供了一種飛機機場滑行調(diào)度模型訓練方法,首先獲取待訓練飛機機場數(shù)據(jù)和待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),并根據(jù)待訓練飛機機場數(shù)據(jù)和待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),確定目標數(shù)字孿生模型;接著,對目標數(shù)字孿生模型進行仿真運算,生成目標仿真運行數(shù)據(jù);采用目標仿真運行數(shù)據(jù)、待訓練飛機機場數(shù)據(jù)和待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),構(gòu)建機場飛機滑行模型;對機場飛機滑行模型進行仿真運算,輸出飛機滑行運動數(shù)據(jù)集;根據(jù)飛機滑行運動數(shù)據(jù)集、目標仿真運行數(shù)據(jù)和預(yù)置實際運行數(shù)據(jù)對初始飛機機場滑行調(diào)度模型進行分布式訓練,確定目標飛機機場滑行調(diào)度模型;基于上述方案,獲取待訓練飛機機場數(shù)據(jù)、待訓練車輛拓撲結(jié)構(gòu)數(shù)據(jù),確定目標數(shù)字孿生模型,再利用物理空間的實際運行數(shù)據(jù)、目標數(shù)字孿生模型生成的仿真運行數(shù)據(jù)以及生成的飛機滑行運動數(shù)據(jù)集對初始飛機機場滑行調(diào)度模型進行分布式策略學習,確定的目標飛機機場滑行調(diào)度模型,能夠有效應(yīng)對可能存在的風險區(qū)域,進一步地提高了機場整體運行的安全性。