欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種空中態(tài)勢帕累托攻防策略的求解方法與流程

文檔序號:12887138閱讀:591來源:國知局
一種空中態(tài)勢帕累托攻防策略的求解方法與流程

本發(fā)明屬于多機聯(lián)合攻防控制策略求解技術(shù)領(lǐng)域,具體涉及一種空中態(tài)勢帕累托攻防策略的求解方法。



背景技術(shù):

隨著科技手段的發(fā)展、作戰(zhàn)模式的變化,與傳統(tǒng)的作戰(zhàn)方式相比,現(xiàn)代的戰(zhàn)場環(huán)境更加復(fù)雜,戰(zhàn)場雙方的戰(zhàn)術(shù)戰(zhàn)略更加多變難料。這就對戰(zhàn)場的指揮決策者提出了更嚴格的要求,其必須能夠及時地了解戰(zhàn)場的態(tài)勢變化,以實時的制定決策。在復(fù)雜的多機空戰(zhàn)環(huán)境中,傳統(tǒng)的態(tài)勢函數(shù)為空戰(zhàn)態(tài)勢的變化和威脅程度的評估提供了強有力的信息。到目前為止,無論是納什微分對策還是帕累托微分對策,都沒有結(jié)合角度優(yōu)勢和距離優(yōu)勢的特點,并將其應(yīng)用于微分對策中。

當(dāng)今,對于一般的微分對策問題,其精確解析解的獲取通常比較困難,在大多情況下,我們只能求其數(shù)值解。雖然各國的專家和學(xué)者對于求解微分對策問題進行了大量研究,并提出了各種各樣的算法,但對于微分對策問題,至今尚未找到一個通用的求解方法。最近幾年,變分法和極大值原理將微分對策問題轉(zhuǎn)化為最優(yōu)控制問題的研究有了較快的發(fā)展,譜方法的研究也日趨成熟,勒讓德(legendre)偽譜法作為優(yōu)化方法中的直接求解方法,是一種經(jīng)典的求解最優(yōu)控制問題的擬譜方法,在工程計算中,采用該方法解最優(yōu)控制問題可以得到較高的精度,這就為求解微分帕累托對策問題提供了新的思路。



技術(shù)實現(xiàn)要素:

針對上述現(xiàn)有技術(shù)存在的不足,本發(fā)明提供一種空中態(tài)勢帕累托攻防策略的求解方法。

本發(fā)明的技術(shù)方案如下:

一種空中態(tài)勢帕累托攻防策略的求解方法,包括如下步驟:

步驟1:創(chuàng)建連續(xù)可微的態(tài)勢函數(shù)

其中,αi(t)和βi(t)分別為第i架攻方pi的速度和逃方e的速度與目標視線在t時刻的夾角,αi(t),βi(t)∈(-π,π),i=1,2,..,n,n為攻方個數(shù),t∈[t0,tf],t0為博弈的初始時刻,tf為博弈的末端時刻,為距離優(yōu)勢函數(shù),d為攻方與逃方之間的最佳攻擊距離,di(t)是第i架攻方pi與逃方e在t時刻的相對距離,(xe(t),ye(t))和(xpi(t),ypi(t))分別為逃方e和第i架攻方pi在t時刻的橫縱坐標,k為常數(shù)。

步驟2:利用連續(xù)可微的態(tài)勢函數(shù)建立帕累托微分對策模型;

所述帕累托微分對策模型中逃方e的目標函數(shù)je為:

攻方目標函數(shù)jp為:

其中,(xe(tf),ye(tf))和(xpi(tf),ypi(tf))分別為逃方e和第i架攻方pi在博弈的末端時刻tf的橫縱坐標,為第i架攻方的攻擊命中概率值,αi(tf),βi(tf)∈(-π,π),αi(tf)和βi(tf)分別為第i架攻方pi的速度和逃方e的速度與目標視線在tf時刻的夾角,d為攻方與逃方之間的最佳攻擊距離,di(tf)是第i架攻方pi與逃方e在tf時刻的相對距離,k為常數(shù),ue∈ωe,upi∈ωi,ωe和ωi為控制策略集;

步驟3:利用變分法原理將帕累托微分對策模型轉(zhuǎn)化為最優(yōu)控制模型;

步驟4:利用勒讓德偽譜法將最優(yōu)控制模型轉(zhuǎn)化為非線性規(guī)劃模型;

步驟5:利用matlab軟件工具箱的tomlab中的snopt求解器求解所述非線性規(guī)劃模型,得到多機聯(lián)合攻防的控制策略。

有益效果:本發(fā)明提出一種空中態(tài)勢帕累托攻防策略的求解方法,與現(xiàn)有技術(shù)相比,具有如下優(yōu)點:

(1)提出帕累托攻防問題是求解多局中人聯(lián)合攻擊策略的理想方法,可以在逃方采取最優(yōu)逃避策略的情況下求解出多個追方最佳的聯(lián)合攻擊策略;

(2)現(xiàn)有技術(shù)只能求解該類問題在某些特定情況下的粗略解或次優(yōu)解,而無法求解該問題的最優(yōu)解,在攻防過程中必定會喪失寶貴的機會和博弈優(yōu)勢;

(3)求解的最佳聯(lián)合攻擊策略可以作為評估其他攻防策略求解技術(shù)的參照標準;

(4)求解的最佳聯(lián)合攻擊策略可以監(jiān)督人工智能求解技術(shù)的學(xué)習(xí)訓(xùn)練。

附圖說明

圖1為本發(fā)明一種實施方式的空中態(tài)勢帕累托攻防策略的求解方法流程圖;

圖2為本發(fā)明一種實施方式的攻方與逃方角度關(guān)系圖;

圖3為本發(fā)明一種實施方式的最優(yōu)控制模型轉(zhuǎn)化為非線性規(guī)劃模型過程示意圖。

具體實施方式

下面結(jié)合附圖對本發(fā)明的一種實施方式作詳細說明。

如圖1所示,本實施方式的空中態(tài)勢帕累托攻防策略的求解方法,包括:

步驟1:創(chuàng)建連續(xù)可微的態(tài)勢函數(shù):

現(xiàn)有技術(shù)中,態(tài)勢函數(shù)包括角度優(yōu)勢函數(shù)、距離優(yōu)勢函數(shù)和速度優(yōu)勢函數(shù):

角度優(yōu)勢函數(shù):

距離優(yōu)勢函數(shù):

速度優(yōu)勢函數(shù):

其中,αi(t),βi(t)∈(-π,π),αi(t)和βi(t)分別為第i架攻方pi的速度和逃方e的速度與目標視線在t時刻的的夾角,i=1,2,..,n,n為攻方個數(shù),t為微分對策時間,t∈[t0,tf],t0為博弈的初始時刻,tf為博弈的末端時刻,d為攻方與逃方之間的最佳攻擊距離,di(t)是第i架攻方pi與逃方e在t時刻的相對距離,(xe(t),ye(t))和(xpi(t),ypi(t))分別為逃方e和第i架攻方pi在t時刻的橫縱坐標,cr是常數(shù),k為表示距離量綱的常數(shù),vpi(t)為第i架攻方pi當(dāng)前的速度,bdi為第i架攻方pi的期望程度,b1i、b0i、bci和bdi有關(guān),共同決定著速度優(yōu)勢曲線的形狀。態(tài)勢函數(shù)為:

si=sr·sa+sv

根據(jù)空戰(zhàn)態(tài)勢計算出si有正有負,si值越大,表示第i架攻方pi越易于攻擊逃方e。

從現(xiàn)有的角度優(yōu)勢函數(shù)中能夠看到,函數(shù)中包括絕對值,存在奇異點,在靜態(tài)博弈問題上影響不大,但由于微分對策是連續(xù)的動態(tài)博弈問題,因此直接將現(xiàn)有的角度優(yōu)勢函數(shù)應(yīng)用到微分對策中是不可以的。

在微分對策中,為避免出現(xiàn)奇異點的問題,創(chuàng)建了新的連續(xù)可微的角度優(yōu)勢函數(shù)如下:

由圖2所示的角度關(guān)系,得到cosαi(t)和cosβi(t)為:

創(chuàng)建新的距離優(yōu)勢函數(shù)

結(jié)合新創(chuàng)建的角度優(yōu)勢函數(shù)和距離優(yōu)勢函數(shù)創(chuàng)建新型的連續(xù)可微的態(tài)勢函數(shù)

新創(chuàng)建的態(tài)勢函數(shù)就是將傳統(tǒng)的距離優(yōu)勢函數(shù)的cr定義為1,將180k定義成k,從新型的態(tài)勢函數(shù)可以看出,新型的態(tài)勢函數(shù)和現(xiàn)有態(tài)勢函數(shù)si有明顯區(qū)別,態(tài)勢函數(shù)中不包含速度優(yōu)勢函數(shù),主要是因為帕累托微分對策模型中的狀態(tài)方程中已經(jīng)將速度因素考慮在內(nèi)了。態(tài)勢函數(shù)是每架攻方飛機在t時刻的攻擊命中概率值,其值域為[0,1]。所有攻方聯(lián)合攻擊的態(tài)勢函數(shù)為:

其中,表示第i架攻方pi的攻擊不命中的概率值,表示所有攻方聯(lián)合攻擊不命中的概率值,聯(lián)合攻擊的態(tài)勢函數(shù)則表示所有攻方聯(lián)合攻擊命中的概率值,期望其值越大越好。

步驟2:利用連續(xù)可微的態(tài)勢函數(shù)建立帕累托微分對策模型:

本實施方式中,帕累托微分對策模型包括逃方狀態(tài)方程組攻方狀態(tài)方程組狀態(tài)向量x、控制向量u、逃方初始狀態(tài)、攻方初始狀態(tài)、逃方目標函數(shù)je、攻方目標函數(shù)jp和橫截條件;

所述逃方狀態(tài)方程組和攻方狀態(tài)方程組分別為:

所述狀態(tài)向量x和控制向量u分別為:

x=(xe(t)xp1(t)…xpn(t))tu=(ue(t)up1(t)…upn(t))t

其中,狀態(tài)量和控制量如下:

xe(t)=[xe(t)ye(t)ψe(t)]tue(t)=[ve(t)ωe(t)]t

xpi(t)=[xpi(t)ypi(t)ψpi(t)]tupi(t)=[vpi(t)ωpi(t)]t

所述逃方初始狀態(tài)和攻方初始狀態(tài)分別為:

其中,ve(t)和vpi(t)分別為逃方e和第i架攻方pi在t時刻的速度,ψe0和ψpi0分別為逃方e和第i架攻方pi的航向角初始值,ψe(t)和ψpi(t)分別為逃方e和第i架攻方pi在t時刻的航向角,ωe(t)和ωpi(t)分別為逃方e和第i架攻方pi在t時刻的航向角速度,(xe0,ye0)和(xpi0,ypi0)分別為逃方e和第i架攻方pi的橫縱坐標初始值。

由于攻方是聯(lián)合作戰(zhàn),看重的是集體收益而不是個人得失,所以逃方期望在有限時間內(nèi),離所有的攻方越遠越好即與所有攻方的相對距離總和越大越好,從而得到了逃方的目標函數(shù)。

所述逃方e的目標函數(shù)je為:

其中,ke為常數(shù)。

將聯(lián)合攻擊的態(tài)勢函數(shù)作為攻方的目標函數(shù),其含義是所有攻方聯(lián)合攻擊命中的概率值,在攻防對抗博弈中,攻方希望其值越大越好,值越大,表示攻方占優(yōu)勢,值越小,表示逃方占優(yōu)勢。

所述攻方目標函數(shù)jp即所有攻方聯(lián)合攻擊命中的概率值為:

其中,為第i架攻方的攻擊命中概率值,αi(tf),βi(tf)∈(-π,π),αi(tf)和βi(tf)分別為第i架攻方pi的速度和逃方e的速度與目標視線在tf時刻的夾角,d為攻方與逃方之間的最佳攻擊距離,di(tf)是第i架攻方pi與逃方e在tf時刻的相對距離,控制向量ue∈ωe,upi∈ωi,ωe和ωi為控制策略集。

步驟3:利用變分法原理將帕累托微分對策模型轉(zhuǎn)化為最優(yōu)控制模型:

求解帕累托微分對策模型,利用半直接法理論對其進行數(shù)值仿真。因為傳統(tǒng)的解析方法求解微分對策模型時,將其轉(zhuǎn)化為兩點邊值問題求解非常困難,所以本專利結(jié)合了最優(yōu)控制問題的兩種不同求解思路:間接法即變分法或極大值原理和直接法即legendre偽譜法。

在帕累托微分對策模型中,所選取的條件是控制量不受約束,末端狀態(tài)不受約束,末端時刻固定。由于控制量不受約束,因此模型轉(zhuǎn)換是基于變分理論,否則用極大值原理。通過變分法將微分對策問題轉(zhuǎn)換成單目標函數(shù)的最優(yōu)控制問題,這樣既保證模型轉(zhuǎn)換可靠性又避免了求解hamilton-jacobi方程帶來的問題復(fù)雜度。下面將具體闡述有控制約束的微分對策模型向最優(yōu)控制模型的轉(zhuǎn)化過程:

所述最優(yōu)控制模型包括狀態(tài)方程即微分方程、協(xié)態(tài)方程、初始條件和橫截條件;

根據(jù)帕累托微分對策模型中逃方e的目標函數(shù)je和逃方狀態(tài)方程組構(gòu)造逃方的哈密頓函數(shù)如下:

其中,λe(t)=[λe1(t),λe2(t),λe3(t)]t∈r3為無人機e的協(xié)態(tài)變量。根據(jù)變分法理論得到逃方e的橫截條件:

根據(jù)變分法理論,得到逃方e的協(xié)態(tài)方程為:

根據(jù)變分法理論,可得逃方e的控制方程為:

其中,控制方程求出了微分對策中逃方e的最優(yōu)控制量從而可用協(xié)態(tài)變量表示:

然后將控制方程中的表達式帶入逃方e的狀態(tài)方程替換ωe(t),整理即可得到與原帕累托微分對策模型等價的最優(yōu)控制模型如下:

攻方目標函數(shù):

所述狀態(tài)方程為:

所述初始條件為:

xpi(t0)=xpi0xe(t0)=xe0

ypi(t0)=y(tǒng)pi0ye(t0)=y(tǒng)e0

ψpi(t0)=ψpi0ψe(t0)=ψe0

所述協(xié)態(tài)方程為:

所述橫截條件為:

步驟4:利用勒讓德偽譜法將最優(yōu)控制模型轉(zhuǎn)化為非線性規(guī)劃模型;

最優(yōu)控制問題涉及協(xié)態(tài)變量,傳統(tǒng)的解析方法難以進行求解,所以選擇數(shù)值方法。利用legendre偽譜法通過在lgl點處利用lagrange-legendre多項式對連續(xù)函數(shù)進行插值離散,將復(fù)雜的連續(xù)最優(yōu)控制問題轉(zhuǎn)化為非線性規(guī)劃問題,進而利用計算機快速、高精確地求解。如圖3所示,具體步驟如下:

步驟4-1:將微分對策時間t進行區(qū)間變換:

由于legendre偽譜法的插值多項式——lagrange-legendre多項式是定義在[-1,1]上,所以首先要進行時域轉(zhuǎn)換,將最優(yōu)控制問題的原時域通過公式映射到τ∈[-1,1]:

步驟4-2:全局插值多項式與離散狀態(tài)量:

在對原最優(yōu)控制問題進行配點,創(chuàng)建n階legendre正交多項式ln(τ):

時域變換完后,對原最優(yōu)控制問題進行配點。legendre偽譜法采用lgl點為配置點。其中l(wèi)gl點的選取:τ0=-1,τn=1和legendre正交多項式一階導(dǎo)數(shù)的n-1個零點τm,m=1,2,...,n-1,legendre偽譜法共有n+1個lgl配置點,記為τi,i=0,1,2,...,n。

構(gòu)造n階的lagrange-legendre多項式如下所示:

其中,根據(jù)lagrange-legendre多項式的性質(zhì)易知:

得到lagrange-legendre多項式后,對原最優(yōu)控制問題的所有追逃方的狀態(tài)變量進行離散化。得到n+1個離散狀態(tài)變量具體表達式如下:

步驟4-3:離散狀態(tài)方程、初始條件和橫截條件:

對狀態(tài)量離散形式兩邊求導(dǎo)并考慮到區(qū)間的映射,離散的狀態(tài)方程可描述為:

其中,d=[dkj]∈r(n+1)×(n+1)是(n+1)×(n+1)的微分矩陣,表示lgl配置點處lagrange基函數(shù)的微分值。dki表示其中第(k,i)個元素(k=0,1,…n),具體表達式為:

離散的初始條件為:

xe(τ0)=xe0xpi(τ0)=xpi0

ye(τ0)=y(tǒng)e0ypi(τ0)=y(tǒng)pi0

ψe(τ0)=ψe0ψpi(τ0)=ψpi0

離散后的橫截條件為:

步驟4-4:離散追方的目標函數(shù):

離散后的追方目標函數(shù)為

至此,將最優(yōu)控制模型轉(zhuǎn)化成非線性規(guī)劃模型,包括:離散后的追方的目標函數(shù)、離散后的狀態(tài)方程、離散后的初始條件和離散后的橫截條件。

步驟5:利用matlab軟件工具箱的tomlab中的snopt求解器求解所述非線性規(guī)劃模型,得到多機聯(lián)合攻防的控制策略。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
周至县| 金乡县| 政和县| 米易县| 象山县| 三明市| 凭祥市| 开原市| 古蔺县| 马关县| 隆回县| 石屏县| 万山特区| 贵州省| 科技| 徐闻县| 武胜县| 华阴市| 思茅市| 安达市| 桂阳县| 辽宁省| 五河县| 灵璧县| 九龙坡区| 普洱| 无极县| 酒泉市| 鹤峰县| 玛纳斯县| 和硕县| 瑞丽市| 丰都县| 南和县| 南昌市| 建昌县| 屯留县| 和硕县| 定西市| 三亚市| 兴安盟|