本申請涉及飛艇模擬訓(xùn)練,特別是涉及一種飛艇飛行模擬訓(xùn)練方法、產(chǎn)品、介質(zhì)及設(shè)備。
背景技術(shù):
1、飛艇作為一種重要的航空器,在軍事、民用等領(lǐng)域具有廣泛應(yīng)用前景。然而,飛艇的實際飛行試驗往往面臨成本高、風(fēng)險大、周期長等問題。傳統(tǒng)的飛艇飛行試驗需要投入大量人力、物力和財力,且受天氣、空域等因素限制,難以進(jìn)行大量重復(fù)試驗。
2、隨著計算機技術(shù)和仿真技術(shù)的發(fā)展,數(shù)字仿真已成為航空器設(shè)計、測試和訓(xùn)練的重要手段。然而,目前針對飛艇模擬訓(xùn)練構(gòu)建的數(shù)字仿真系統(tǒng)仍存在功能單一、仿真精度不高以及交互性差等問題,難以滿足飛艇全面模擬訓(xùn)練的需求,導(dǎo)致飛艇模擬訓(xùn)練的效率不高。因此,亟需開發(fā)一種高精度、多功能且交互性強的飛艇飛行模擬訓(xùn)練方法,以提高飛艇模擬訓(xùn)練的效率。
技術(shù)實現(xiàn)思路
1、本申請的目的是提供一種飛艇飛行模擬訓(xùn)練方法、產(chǎn)品、介質(zhì)及設(shè)備,可有效提高飛艇模擬訓(xùn)練的全面性和效率。
2、為實現(xiàn)上述目的,本申請?zhí)峁┝巳缦路桨福?/p>
3、第一方面,本申請?zhí)峁┝艘环N飛艇飛行模擬訓(xùn)練方法,包括:
4、獲取平流層飛艇的飛行訓(xùn)練數(shù)據(jù);所述飛行訓(xùn)練數(shù)據(jù)包括:位置、姿態(tài)、速度、加速度以及控制輸入;
5、基于飛行訓(xùn)練數(shù)據(jù),采用動態(tài)感知方法建立飛艇的動力學(xué)數(shù)學(xué)模型;
6、基于飛行訓(xùn)練數(shù)據(jù)對第一深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并將訓(xùn)練好的第一深度神經(jīng)網(wǎng)絡(luò)作為運動模仿神經(jīng)網(wǎng)絡(luò);
7、根據(jù)動力學(xué)數(shù)學(xué)模型和運動模仿神經(jīng)網(wǎng)絡(luò)對第二深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并將訓(xùn)練好的第二深度神經(jīng)網(wǎng)絡(luò)作為控制器參數(shù)優(yōu)化網(wǎng)絡(luò);
8、對動力學(xué)數(shù)學(xué)模型、運動模仿神經(jīng)網(wǎng)絡(luò)以及控制器參數(shù)優(yōu)化網(wǎng)絡(luò)進(jìn)行閉環(huán)同步訓(xùn)練,得到飛行模擬模型;
9、采用飛行模擬模型對待訓(xùn)練的平流層飛艇進(jìn)行飛行模擬訓(xùn)練。
10、可選地,所述基于飛行訓(xùn)練數(shù)據(jù),采用動態(tài)感知方法建立飛艇的動力學(xué)數(shù)學(xué)模型,具體包括:
11、基于飛行訓(xùn)練數(shù)據(jù),采用動態(tài)感知方法建立的飛艇的動力學(xué)數(shù)學(xué)模型為其中,q為飛艇的廣義坐標(biāo)向量;表示對q進(jìn)行一階導(dǎo)運算;為飛艇的廣義加速度向量;fext為飛艇的外力向量;fcontrol為飛艇的控制力向量;m(q)為廣義質(zhì)量矩陣;為動力學(xué)數(shù)學(xué)模型的非線性項。
12、可選地,所述運動模仿神經(jīng)網(wǎng)絡(luò)以最大化獎勵函數(shù)為訓(xùn)練目標(biāo);所述獎勵函數(shù)rt為rt=ωprp,t+ωattituderattitude,t+ωtrajrtraj,t;其中,rp,t、rattitude,t以及rtraj,t分別為飛艇的位置誤差、姿態(tài)誤差以及軌跡跟蹤誤差;ωp、ωattitude以及ωtraj分別為位置誤差、姿態(tài)誤差以及軌跡跟蹤誤差對應(yīng)的權(quán)重。
13、可選地,所述控制器參數(shù)優(yōu)化網(wǎng)絡(luò)以最小化損失函數(shù)為訓(xùn)練目標(biāo);所述損失函數(shù)loss為其中,||·||表示二范數(shù)運算;為飛艇當(dāng)前狀態(tài)的二階導(dǎo)數(shù);m-1為廣義質(zhì)量矩陣的逆矩陣;fenv為環(huán)境因素修正項;u為飛艇控制器的輸出。
14、可選地,所述環(huán)境因素修正項fenv為fenv=ftemp(t)×fpress(p)×fwind(w);其中,ftemp(t)、fpress(p)以及fwind(w)分別為溫度t、氣壓p以及風(fēng)速w影響函數(shù)。
15、可選地,所述飛行模擬模型以最大化綜合獎勵函數(shù)為訓(xùn)練目標(biāo);所述綜合獎勵函數(shù)rtotal為rtotal=ω1rmodel+ω2rimitation+ω3rcontrol;其中,rmodel、rimitation和rcontrol分別為動力學(xué)數(shù)學(xué)模型、訓(xùn)練好的運動模仿神經(jīng)網(wǎng)絡(luò)以及訓(xùn)練好的控制器參數(shù)優(yōu)化網(wǎng)絡(luò)的獎勵函數(shù);ω1、ω2和ω3分別為動力學(xué)數(shù)學(xué)模型、訓(xùn)練好的運動模仿神經(jīng)網(wǎng)絡(luò)以及訓(xùn)練好的控制器參數(shù)優(yōu)化網(wǎng)絡(luò)的獎勵函數(shù)對應(yīng)的權(quán)重。
16、可選地,在所述采用飛行模擬模型對待訓(xùn)練的平流層飛艇進(jìn)行飛行模擬訓(xùn)練之后,還包括:
17、對待訓(xùn)練的平流層飛艇的控制器性能進(jìn)行軌跡跟蹤誤差、能量消耗以及穩(wěn)定性的評估,并根據(jù)評估結(jié)果對控制器的參數(shù)進(jìn)行微調(diào)。
18、第二方面,本申請?zhí)峁┝艘环N計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)所述飛艇飛行模擬訓(xùn)練方法。
19、第三方面,本申請?zhí)峁┝艘环N計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)所述飛艇飛行模擬訓(xùn)練方法。
20、第四方面,本申請?zhí)峁┝艘环N計算機設(shè)備,包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)所述飛艇飛行模擬訓(xùn)練方法。
21、根據(jù)本申請?zhí)峁┑木唧w實施例,本申請公開了以下技術(shù)效果:
22、本申請?zhí)峁┝艘环N飛艇飛行模擬訓(xùn)練方法、產(chǎn)品、介質(zhì)及設(shè)備,通過平流層飛艇的動力學(xué)數(shù)學(xué)模型、運動模仿神經(jīng)網(wǎng)絡(luò)以及控制器參數(shù)優(yōu)化網(wǎng)絡(luò)構(gòu)建了高精度的平流層數(shù)字空間,并對動力學(xué)數(shù)學(xué)模型、運動模仿神經(jīng)網(wǎng)絡(luò)以及控制器參數(shù)優(yōu)化網(wǎng)絡(luò)進(jìn)行閉環(huán)同步訓(xùn)練,采用完成訓(xùn)練后的飛行模擬模型對待訓(xùn)練的平流層飛艇進(jìn)行飛行模擬訓(xùn)練,實現(xiàn)平流層飛艇的全方位模擬飛行,有效提高飛艇模擬訓(xùn)練的全面性和效率。
1.一種飛艇飛行模擬訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的飛艇飛行模擬訓(xùn)練方法,其特征在于,所述基于飛行訓(xùn)練數(shù)據(jù),采用動態(tài)感知方法建立飛艇的動力學(xué)數(shù)學(xué)模型,具體包括:
3.根據(jù)權(quán)利要求1所述的飛艇飛行模擬訓(xùn)練方法,其特征在于,所述運動模仿神經(jīng)網(wǎng)絡(luò)以最大化獎勵函數(shù)為訓(xùn)練目標(biāo);所述獎勵函數(shù)rt為rt=ωprp,t+ωattituderattitude,t+ωtrajrtraj,t;其中,rp,t、rattitude,t以及rtraj,t分別為飛艇的位置誤差、姿態(tài)誤差以及軌跡跟蹤誤差;ωp、ωattitude以及ωtraj分別為位置誤差、姿態(tài)誤差以及軌跡跟蹤誤差對應(yīng)的權(quán)重。
4.根據(jù)權(quán)利要求2所述的飛艇飛行模擬訓(xùn)練方法,其特征在于,所述控制器參數(shù)優(yōu)化網(wǎng)絡(luò)以最小化損失函數(shù)為訓(xùn)練目標(biāo);所述損失函數(shù)loss為其中,||·||表示二范數(shù)運算;為飛艇當(dāng)前狀態(tài)的二階導(dǎo)數(shù);m-1為廣義質(zhì)量矩陣的逆矩陣;fenv為環(huán)境因素修正項;u為飛艇控制器的輸出。
5.根據(jù)權(quán)利要求2所述的飛艇飛行模擬訓(xùn)練方法,其特征在于,所述環(huán)境因素修正項fenv為fenv=ftemp(t)×fpress(p)×fwind(w);其中,ftemp(t)、fpress(p)以及fwind(w)分別為溫度t、氣壓p以及風(fēng)速w影響函數(shù)。
6.根據(jù)權(quán)利要求1所述的飛艇飛行模擬訓(xùn)練方法,其特征在于,所述飛行模擬模型以最大化綜合獎勵函數(shù)為訓(xùn)練目標(biāo);所述綜合獎勵函數(shù)rtotal為rtotal=ω1rmodel+ω2rimitation+ω3rcontrol;其中,rmodel、rimitation和rcontrol分別為動力學(xué)數(shù)學(xué)模型、訓(xùn)練好的運動模仿神經(jīng)網(wǎng)絡(luò)以及訓(xùn)練好的控制器參數(shù)優(yōu)化網(wǎng)絡(luò)的獎勵函數(shù);ω1、ω2和ω3分別為動力學(xué)數(shù)學(xué)模型、訓(xùn)練好的運動模仿神經(jīng)網(wǎng)絡(luò)以及訓(xùn)練好的控制器參數(shù)優(yōu)化網(wǎng)絡(luò)的獎勵函數(shù)對應(yīng)的權(quán)重。
7.根據(jù)權(quán)利要求1所述的飛艇飛行模擬訓(xùn)練方法,其特征在于,在所述采用飛行模擬模型對待訓(xùn)練的平流層飛艇進(jìn)行飛行模擬訓(xùn)練之后,還包括:
8.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7中任一項所述的飛艇飛行模擬訓(xùn)練方法。
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7中任一項所述的飛艇飛行模擬訓(xùn)練方法。
10.一種計算機設(shè)備,包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序以實現(xiàn)權(quán)利要求1-7中任一項所述的飛艇飛行模擬訓(xùn)練方法。