一種無人機(jī)對(duì)抗決策評(píng)估方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于策略評(píng)估領(lǐng)域,特別涉及了一種無人機(jī)對(duì)抗策略評(píng)估方法。
【背景技術(shù)】
[0002] 上世紀(jì)20年代,無人機(jī)問世于英國,當(dāng)時(shí)無人機(jī)的作用是作為靶機(jī),供訓(xùn)練使用。 歷經(jīng)將近1個(gè)世紀(jì)的發(fā)展歷程,無人機(jī)從問世初期的簡(jiǎn)單靶機(jī)、航模逐步發(fā)展到通過無線電 遙控或預(yù)編程序控制的無人偵察機(jī)一個(gè)漫長(zhǎng)的發(fā)展歷程。早在上世紀(jì)60年代初,無人機(jī)就 已經(jīng)真正走上戰(zhàn)場(chǎng)。在90年代初期的海灣戰(zhàn)爭(zhēng)中,無人偵察機(jī)的作用十分明顯,它為多國部 隊(duì)提供了大量的軍事情報(bào)信息,并且能夠指揮地面、艦載火炮對(duì)目標(biāo)進(jìn)行軍事打擊。此后, 世界各軍事強(qiáng)國紛紛加緊對(duì)無人機(jī)的研制,軍用無人機(jī)得到前所未有的重視。
[0003]我國對(duì)無人機(jī)的研究起源于上世紀(jì)60年代,"長(zhǎng)空一號(hào)"是我國第一架自主設(shè)計(jì)研 究的無人機(jī),"長(zhǎng)空一號(hào)"是大型噴氣式高亞音速無人機(jī),它通過無線電進(jìn)行遙控,可用于防 空部隊(duì)的軍事訓(xùn)練或?qū)棿虬醒萘?xí)。"長(zhǎng)空一號(hào)"經(jīng)過適當(dāng)改裝可執(zhí)行測(cè)繪、探測(cè)、人工降 雨、地形勘察等民用任務(wù)。
[0004] 隨著無人機(jī)投入軍事使用以及作戰(zhàn)環(huán)境監(jiān)測(cè)和識(shí)別技術(shù)的不斷突破,在交戰(zhàn)雙方 信息比較清晰的情況下,當(dāng)無人戰(zhàn)斗機(jī)之間進(jìn)行空中格斗時(shí),如何在機(jī)載設(shè)備采集的信息 的指引下,快速、準(zhǔn)確的進(jìn)行空戰(zhàn)策略的選擇,必將成為決定空戰(zhàn)成敗的主要因素。而無人 機(jī)對(duì)抗博弈技術(shù)主要就是研究無人戰(zhàn)斗機(jī)在感知能力為中心的情況下,如何實(shí)時(shí)或者近實(shí) 時(shí)的進(jìn)行戰(zhàn)略、戰(zhàn)術(shù)的選擇,達(dá)到具備有人戰(zhàn)斗機(jī)的飛行員的決策能力的目的。因此,世界 上各軍事強(qiáng)國已在積極展開無人機(jī)對(duì)抗博弈方面的研究。對(duì)抗博弈策略選擇是無人戰(zhàn)斗機(jī) 的大腦和靈魂,是其具備高智能化程度、真正實(shí)現(xiàn)"無人化"的關(guān)鍵。其主要研究空戰(zhàn)戰(zhàn)術(shù)的 基本規(guī)律并將這些規(guī)律應(yīng)用到仿真、實(shí)戰(zhàn)中生成控制指令的技術(shù)方法。迄今為止,比較成熟 的決策的方法有:矩陣對(duì)策法、專家系統(tǒng)法和影響圖等。
[0005]早在四十多年前,我國就開始發(fā)展軍用仿真技術(shù)。在"七五"以來的二十多年中,由 于上級(jí)領(lǐng)導(dǎo)的重視,軍用仿真技術(shù)(包括空戰(zhàn)決策仿真)通過邊建邊用,得到了迅猛發(fā)展。據(jù) 統(tǒng)計(jì),采用仿真技術(shù)可減少導(dǎo)彈20~40%的研制周期,減少定型試驗(yàn)所需彈數(shù)總和的10~ 30%。從經(jīng)濟(jì)方面考慮,截至1995年底,我國在各種武器(飛機(jī)、導(dǎo)彈、艦船、坦克、高炮和衛(wèi) 星等)的研制過程中都采用了軍用仿真技術(shù),共創(chuàng)造了高達(dá)5億元人民幣以上的經(jīng)濟(jì)效益。 目前,國內(nèi)在空戰(zhàn)決策仿真方面的研究主要以中航研究院所,國防院校和航空航天院校為 主,并取得了一系列的研究成果。
[0006]其中,沈陽飛機(jī)設(shè)計(jì)研究所提出了一種新的無人機(jī)空戰(zhàn)仿真建模方式以及策略選 擇,首先判斷空戰(zhàn)態(tài)勢(shì),然后根據(jù)空戰(zhàn)態(tài)勢(shì),以敵我雙方可以采用的無人戰(zhàn)機(jī)機(jī)動(dòng)方法為策 略集,支付函數(shù)的選取則通過量化分析空戰(zhàn)雙方的對(duì)抗態(tài)勢(shì)來確定,這樣就建立了一個(gè)靜 態(tài)的完全信息空戰(zhàn)對(duì)策模型,通過求解該對(duì)策模型,可以得到混合策略Nash均衡解,再結(jié)合 實(shí)際空戰(zhàn)經(jīng)驗(yàn),最終可得到任務(wù)決策方法,該決策模型可用于多機(jī)協(xié)同對(duì)抗多目標(biāo)的空戰(zhàn) 對(duì)策模型。海軍航空工程學(xué)院將對(duì)策論的思想和多級(jí)影響圖相結(jié)合,繼而將二者同時(shí)用于 近距協(xié)同多機(jī)空戰(zhàn)格斗模型中。通過建立機(jī)群協(xié)同作戰(zhàn)模型將多個(gè)戰(zhàn)機(jī)分解為小規(guī)模作 戰(zhàn),然后,將小規(guī)模作戰(zhàn)問題再轉(zhuǎn)化為單機(jī)空戰(zhàn)問題,最終建立了新的機(jī)動(dòng)連續(xù)對(duì)策模型。 該模型包含了空戰(zhàn)雙方的飛機(jī)動(dòng)力學(xué)質(zhì)點(diǎn)模型和決策者喜好的,隨后給出了多級(jí)影響圖決 策的求解方法,實(shí)現(xiàn)了二對(duì)二協(xié)同空戰(zhàn),突破了傳統(tǒng)的局限于一對(duì)一空戰(zhàn)的影響圖決策方 法。
[0007]無人飛機(jī)空戰(zhàn)建模以及策略優(yōu)選無疑是一個(gè)很有潛力的研究方向,它在我國方興 未艾,在我國的研究人員的共同努力下,已取得了一定的研究成果,同時(shí)也得到了國家的大 力支持。應(yīng)用方面,軍用仿真技術(shù)堅(jiān)持邊建邊用的原則取得了顯著成果,已被國家列為可推 動(dòng)科研發(fā)展的重點(diǎn)預(yù)研項(xiàng)目。研究成果有效地應(yīng)用于武器系統(tǒng)性能的提升,新型武器的研 制以及系統(tǒng)的優(yōu)化設(shè)計(jì)等方面。采用軍用仿真技術(shù)不僅能夠減少實(shí)彈試驗(yàn)的數(shù)量和次數(shù), 提高研制型號(hào)質(zhì)量,而且能夠及時(shí)診斷并排除隱患和故障,從而達(dá)到提高武器系統(tǒng)效費(fèi)比、 節(jié)約經(jīng)費(fèi)、縮短周期的目的。而研究無人機(jī)對(duì)抗博弈模型以及最優(yōu)策略的選擇,無疑具有巨 大的現(xiàn)實(shí)意義。
【發(fā)明內(nèi)容】
[0008]本發(fā)明旨在提供一種對(duì)無人機(jī)對(duì)抗提供策略評(píng)估的方法,能夠基于無人機(jī)對(duì)抗過 程中的對(duì)抗信息,評(píng)估產(chǎn)生最優(yōu)的對(duì)抗策略。為無人機(jī)指揮及控制提供實(shí)時(shí)與可靠的策略 指導(dǎo)。
[0009] 為了實(shí)現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案為:
[0010] -種無人機(jī)對(duì)抗策略評(píng)估方法,對(duì)抗模型由N架己方無人機(jī)Pi、M個(gè)敵方攔截單元qj 組成,其中i=l,2,3,…,N;j=l,2,3,…,M,i、j分別為己方無人機(jī)編號(hào)與敵方攔截單元編 號(hào),N,M為有限自然數(shù),理論上可以無窮大;根據(jù)無人機(jī)以及攔截單元建立典型的二人零和 非合作博弈,其中無人機(jī)和攔截單元作為博弈局中人,其特征在于,包括以下幾個(gè)步驟:
[0011] 步驟(1)獲取無人機(jī)對(duì)抗價(jià)值信息,價(jià)值信息包括己方無人機(jī)與敵方攔截單元的 狀態(tài)、價(jià)值量,以及無人機(jī)對(duì)攔截單元造成損失的概率以及損失的價(jià)值,以及攔截單元對(duì)無 人機(jī)造成損失的概率以及損失的價(jià)值;
[0012] 步驟(2)基于無人機(jī)對(duì)抗價(jià)值信息確定博弈雙方的收益函數(shù);
[0013]步驟(3)基于無人機(jī)對(duì)抗策略集合以及收益函數(shù)生成支付矩陣;
[0014]步驟(4)基于區(qū)間可能度求解博弈雙方支付矩陣納什均衡值,并通過粒子群算法 得到無人機(jī)對(duì)抗最優(yōu)策略。
[0015]在步驟⑴中,無人機(jī)Pi具有的狀態(tài)有攻擊狀態(tài)、防御狀態(tài),Pi若放棄攻擊則處于防 御狀態(tài);攔截單元qj具有的狀態(tài)有反擊狀態(tài)、防御狀態(tài),qj若放棄反擊則處于防御狀態(tài);每一 架無人機(jī)的價(jià)值量為Vpi,每一個(gè)攔截單元的價(jià)值量為Vqj,己方無人機(jī)Pi對(duì)敵方攔截單元qj 進(jìn)行對(duì)抗時(shí)所損失的價(jià)值為VPi,qj,而攔截單元qj對(duì)無人機(jī)Pi進(jìn)行攔截時(shí)所損失的價(jià)值為 Vqi,pi,無人機(jī)Pi對(duì)于攔截單元qj造成損傷的概率為Ppi,qj,攔截單元qj對(duì)于無人機(jī)Pi造成損傷 的概率為Pqi,pi。
[0016]所述步驟(2)具體為:
[0017]步驟(2-1)根據(jù)無人機(jī)以及攔截單元的不同狀態(tài)分別得到不同的策略集合,其 中,Xi代表己方無人機(jī)編號(hào)為i的對(duì)抗策略,yj代表敵方編號(hào)為j的對(duì)抗策略;
[0018]步驟(2-2)根據(jù)步驟(1)得到的無人機(jī)對(duì)抗信息,建立無人機(jī)和攔截單元在整個(gè) 博弈過程中的收益函數(shù),己方無人機(jī)采用對(duì)抗策略Xl,敵方攔截單元采用對(duì)抗策略3^時(shí)的己 方的收益函數(shù)記作,敵方攔截單元的收益函數(shù)記作hXi,y,。
[0019]所述步驟(3)基于步驟(2)中無人機(jī)和攔截單元對(duì)抗策略集合中的不同對(duì)抗策略, 以及不同對(duì)抗策略下己方無人機(jī)和敵方攔截單元的收益函數(shù),構(gòu)造博弈雙方的支付矩陣; 在支付矩陣中,每一個(gè)元素對(duì)應(yīng)一收益函數(shù)值gXi.yfie[1,Ν],Μ1,Μ],且i、j分別為己方無人 機(jī)編號(hào)與敵方攔截單元編號(hào),i,j均為自然數(shù),gXi,yi?hXi,yf 越大,gxi.yi越大;越 大,gx吻越大,每一行的元素具有相同的無人機(jī)策略選擇,每一列的元素具有相同的攔截單 元策略選擇;支付矩陣G的具體表達(dá)式如下:
[0020]
[0021]在支付矩陣G中,XI,···,xn分別是無人機(jī)進(jìn)攻的策略,yi,···,yM分別是攔截單元防 御的策略。由于無人機(jī)與攔截單元博弈雙方信息的不完全性,支付矩陣G中的每一個(gè)元素都 是一個(gè)區(qū)間數(shù)。且在支付矩陣G中,元素g:Xi.yi縮寫為gij,比如縮寫為gll、gNl、glM、g麗。
[0022] 所述步驟(4)具體為:
[0023] (1)區(qū)間可能度分析:區(qū)間數(shù)gdgUgLx)優(yōu)于gr(g"ax)的可能度公式為:
[0024]
一-Bmax iJmin Bmax ?τη?η
[0026]相應(yīng)的,也可以得到優(yōu)于此£?)的可能度公式為:
[0027]
[0028]其中,01.,S2eg.Xj,yji任[1' N]., j.€[l, M],gXi>y丨OC. hXi,.yj,fXi,yj '
[0029] 和gkx分別為區(qū)間數(shù)gi的區(qū)間下限值和上限值,g|in和益《分別為區(qū)間數(shù)g2
[0030] 的區(qū)間下限值和上限值,gdPg2分別對(duì)應(yīng)于支付矩陣G中的任意一個(gè)元素,且支付 矩陣G中的任意兩個(gè)元素均可以進(jìn)行區(qū)間可能度分析,有了上述的兩個(gè)區(qū)間數(shù)的可能度公 式之后,假設(shè)無人機(jī)采取的是xf策略,那么在該條件下可以利用上述的可能度公式進(jìn)一步 的得到可能度矩陣%為:
[0031]
[0032]在本步驟中所得到的\矩陣為一個(gè)互補(bǔ)判斷矩陣,在上述矩陣之中,為 以42e 的可能度,ji,j2均為自然數(shù),Xf為X1,X2,…,XN,且當(dāng)pjlj2= 1時(shí), _《Wii絕對(duì)優(yōu)于%的_2,_iPjlj2 = 0時(shí),々*納2絕對(duì)優(yōu)于_%.紐:;:計(jì)算Pjlj2時(shí)使用前述的可能度公 式即可。在可能度矩陣~中,Pll為&m優(yōu)于#¥/#:1的可能度,PlM為優(yōu)于%.?的可能度, 優(yōu)于%A的可能度,其余元素依此類推。
[0033] (2)粒子群算法求解最優(yōu)策略:
[0034]通過區(qū)間可能度矩陣,對(duì)所選擇的策略采用粒子群算法進(jìn)行優(yōu)劣排序,將區(qū)間可 能度兩兩進(jìn)行比較,并采用基于互補(bǔ)判斷矩陣的排序方法,對(duì)區(qū)間可能度進(jìn)行排序,則將排 名第一的粒子作為全局最優(yōu)粒子,進(jìn)而得到方案集合的最優(yōu)方案。
[0035]本發(fā)明基于無人機(jī)對(duì)抗價(jià)值信息確定博弈雙方的支付函數(shù),基于無人機(jī)對(duì)抗策略 集合以及收益函數(shù)生成支付矩陣,基于區(qū)間可能度與粒子群算法得到無人機(jī)對(duì)抗最優(yōu)策 略。本方法能夠?yàn)闊o人機(jī)對(duì)抗提供策略指導(dǎo),使己方無人機(jī)對(duì)抗代價(jià)盡量小、對(duì)抗收益盡量 尚。
【附圖說明】
[0036]圖1為本發(fā)明的一種無人機(jī)對(duì)抗策略評(píng)估方法流程圖。
【具