本發(fā)明涉及無人機,具體涉及一種多無人機攻防博弈的快速求解方法和系統(tǒng)。
背景技術(shù):
1、無人機能夠在多種環(huán)境下自主的完成給定任務(wù),有效降低人力成本。相較于有人機,無人機具有無人員傷亡、機動性強、重量較輕、成本較低等特點。由于單個無人機所攜帶武器和傳感器數(shù)量及性能有限,其執(zhí)行空戰(zhàn)任務(wù)的能力受到相應(yīng)的限制,而多個無人機進行有效協(xié)同可以更好的完成空戰(zhàn)任務(wù),因此,多無人機組成編隊協(xié)同執(zhí)行任務(wù)已受到了越來越多的關(guān)注。如何為無人機編隊設(shè)定協(xié)同作戰(zhàn)的目標分配是當前一大難題。
2、現(xiàn)有技術(shù)中,通過基于博弈方法構(gòu)建的多無人機目標分配模型,專家學者大多采用博弈的方法進行求解,包括精確求解算法和啟發(fā)式求解算法。
3、由于這類問題的復雜度高,問題規(guī)模會隨著無人機數(shù)量的增加呈指數(shù)級增長。現(xiàn)有求解算法多數(shù)僅適用于中小規(guī)模問題的求解,或是不能兼得求解效率和求解時間。精確算法僅適用于小規(guī)模武器目標分配問題的求解,難以在有效時間內(nèi)求得中大規(guī)模問題的最優(yōu)解;啟發(fā)式算法能夠充分運用領(lǐng)域知識提高問題的求解效率,但是解質(zhì)量的好壞依賴于啟發(fā)式規(guī)則的設(shè)定,算法性能有一定波動性,且容易陷入局部最優(yōu),導致分配方案求解效率較低。
技術(shù)實現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種多無人機攻防博弈的快速求解方法和系統(tǒng),解決了現(xiàn)有技術(shù)獲取多無人機的目標分配方案時求解效率較低的技術(shù)問題。
3、(二)技術(shù)方案
4、為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):
5、本發(fā)明解決其技術(shù)問題所提供的一種多無人機攻防博弈的快速求解方法,快速求解方法由計算機執(zhí)行,包括以下步驟:
6、構(gòu)建零和博弈矩陣模型;所述零和博弈矩陣模型包括第一無人機編隊和第二無人機編隊的多無人機編隊信息、多無人機策略信息和收益矩陣;所述多無人機策略信息包括無人機編隊的策略組集合,策略組中包括無人機編隊的多個無人機的策略對,所述策略對用于表征攻防策略和策略目標;所述攻防策略包括攻擊策略、規(guī)避策略和干擾策略;所述多無人機編隊信息包括無人機編隊的無人機信息,所述無人機信息包括攻防策略概率;
7、基于所述零和博弈矩陣模型計算嚴格博弈矩陣,并基于所述嚴格博弈矩陣求解納什均衡解;
8、根據(jù)所述納什均衡解選取第一無人機編隊的第一初始策略組和第二無人機編隊的第二初始策略組;初始策略組為所述嚴格博弈矩陣中概率最大的策略組;
9、基于所述攻防策略概率和所述第二初始策略組求解第一無人機編隊的第一最優(yōu)策略組,基于所述攻防策略概率和所述第一初始策略組求解第二無人機編隊的第二最優(yōu)策略組;
10、如果所述第一最優(yōu)策略組和/或第二最優(yōu)策略組不在所述嚴格博弈矩陣中,則更新所述嚴格博弈矩陣,并基于更新后的嚴格博弈矩陣重新執(zhí)行基于所述嚴格博弈矩陣求解納什均衡解的步驟;
11、如果所述第一最優(yōu)策略組和第二最優(yōu)策略組均在所述嚴格博弈矩陣中,則根據(jù)所述納什均衡解設(shè)置多無人機編隊的策略組。
12、優(yōu)選的,所述收益矩陣包括:
13、
14、其中,sr表示第一無人機編隊策略組集合,sr∈sr表示第一無人機編隊的一個策略組,sb表示第二無人機編隊策略組集合,sb∈sb表示第二無人機編隊的一個策略組;
15、(sr,sb)表示第一無人機編隊采取策略組sr,第二無人機編隊采取策略組sb的策略組組合;u(sr,sb)為第一無人機編隊在策略組組合(sr,sb)下的收益;
16、u(sr,sb)=ur(sr,sb)-ub(sr,sb)
17、
18、其中,ur(sr,sb)和ub(sr,sb)分別表示一無人機編隊和第二無人機編隊的期望生存價值;
19、vi表示第一無人機編隊中無人機i的價值,vj表示第二無人機編隊中無人機j的價值;無人機j為無人機i的策略目標;m表示第一無人機編隊中無人機數(shù)量,n表示第二無人機編隊中無人機數(shù)量;
20、qi表示無人機i對第二無人機編隊的規(guī)避概率,hi表示無人機i對第二無人機編隊的規(guī)避參數(shù);qj表示無人機j對第一無人機編隊的規(guī)避概率,hj表示無人機j對第一無人機編隊的規(guī)避參數(shù);
21、tij表示無人機i對無人機j的干擾概率,lij表示無人機i對無人機j的干擾參數(shù);tji表示無人機j對無人機i的干擾概率,lji表示無人機j對無人機i的干擾參數(shù);
22、pji表示無人機j對無人機i的殺傷概率,bji表示無人機j對無人機i的攻擊參數(shù);pij表示無人機i對無人機j的殺傷概率,aij表示無人機i對無人機j的攻擊參數(shù)。
23、優(yōu)選的,基于所述零和博弈矩陣模型計算嚴格博弈矩陣,包括:
24、在第一無人機編隊策略組集合中選取p個策略組,以及在第二無人機編隊策略組集合中選取q個策略組;其中,p≥2,q≥2;
25、基于所述p個策略組和所述q個策略組生成嚴格博弈矩陣。
26、優(yōu)選的,所述基于所述嚴格博弈矩陣求解納什均衡解,包括:
27、基于預設(shè)的概率分布算法對所述嚴格博弈矩陣進行處理,以求解納什均衡解;所述納什均衡解包括所述p個策略組的第一概率分布和所述q個策略組的第二概率分布;
28、根據(jù)所述納什均衡解選取第一無人機編隊的第一初始策略組和第二無人機編隊的第二初始策略組,包括:
29、遍歷所述納什均衡解,根據(jù)所述第一概率分布獲取概率最大的策略組,并確定為第一初始策略組;根據(jù)所述第二概率分布獲取概率最大的策略組,并確定為第二初始策略組。
30、優(yōu)選的,基于所述攻防策略概率和所述第二初始策略組求解第一無人機編隊的第一最優(yōu)策略組,包括:
31、初始化第一無人機編隊的第一無人機向量;所述第一無人機向量用于表征第一無人機編隊中每個無人機的策略對狀態(tài),所述策略對狀態(tài)包括指示無人機已經(jīng)確定策略對的確定狀態(tài)和指示無人機未確定策略對的未確定狀態(tài);初始化的所述第一無人機向量中,所有無人機的策略對狀態(tài)為未確定狀態(tài);
32、計算無人機初始生存概率;基于所述第一無人機向量獲取第一無人機編隊中首個處于未確定狀態(tài)的目標無人機;在所述多無人機策略信息中獲取所述目標無人機的多個目標無人機策略對;
33、根據(jù)所述無人機初始生存概率求解所述目標無人機策略對的邊際回報值,并將邊際回報值最大的目標無人機策略對設(shè)置為所述目標無人機的目標策略對;
34、將所述第一無人機向量中所述目標無人機的策略對狀態(tài)更新為確定狀態(tài),并檢測更新后的第一無人機向量;
35、如果更新后的第一無人機向量中存在無人機處于未確定狀態(tài),則基于更新后的第一無人機向量重新執(zhí)行基于所述第一無人機向量獲取第一無人機編隊中首個處于未確定狀態(tài)的目標無人機的步驟;
36、如果更新后的第一無人機向量中所有無人機均處于確定狀態(tài),則根據(jù)所有無人機的目標策略對確定第一最優(yōu)策略組。
37、優(yōu)選的,所述計算無人機初始生存概率,包括:
38、設(shè)置第一無人機編隊的第一初始規(guī)避概率和第二無人機編隊的第二初始規(guī)避概率;計算所述第一無人機編隊中無人機的第一初始未被擊毀概率和所述第二無人機編隊中無人機的第二初始未被擊毀概率:
39、
40、其中,
41、b_uninterference[j]表示無人機j未被第一無人機編隊干擾的概率;
42、r_undes[i]表示無人機i的第一初始未被擊毀概率;
43、r_uninterference[i]表示無人機i未被第二無人機編隊干擾的概率;
44、b_undes[j]表示無人機j的第二初始未被擊毀概率;
45、根據(jù)所述第一初始規(guī)避概率和第一初始未被擊毀概率計算所述第一無人機編隊中無人機的第一無人機初始生存概率;根據(jù)所述第二初始規(guī)避概率和第二初始未被擊毀概率計算所述第二無人機編隊中無人機的第二無人機初始生存概率;包括:
46、r_survival[i]=1-(1-r_evasive[i])·(1-r_undes[i])
47、b_survival[j]=1-(1-b_evasive[j])·(1-b_undes[j])
48、其中,r_survival[i]表示無人機i的第一無人機初始生存概率,r_evasive[i]表示無人機i的第一初始規(guī)避概率,r_undes[i]表示無人機i的第一初始未被擊毀概率;
49、b_survival[j]表示無人機j的第二無人機初始生存概率,b_evasive[j]表示無人機j的第二初始規(guī)避概率。
50、優(yōu)選的,所述根據(jù)所述無人機初始生存概率求解所述目標無人機策略對的邊際回報值,包括:
51、根據(jù)所述目標無人機策略對求解攻防策略;
52、根據(jù)所述攻防策略求解無人機更新生存概率;
53、根據(jù)所述無人機更新生存概率和所述無人機初始生存概率計算所述目標無人機策略對的邊際回報值。
54、優(yōu)選的,所述根據(jù)所述攻防策略求解無人機更新生存概率,包括:
55、確定所述目標無人機策略對匹配的第一無人機和第二無人機;
56、如果所述攻防策略為攻擊策略,設(shè)置第一無人機的第一無人機更新生存概率等于所述第一無人機初始生存概率;以及,計算所述第二無人機的第二無人機更新生存概率為:
57、j_survival=1-(1-qj)·(1-δb_undes[ipj])
58、δb_undes[i,p,j]=b_undes[j]·(1-r_uninterference[i]·pij)
59、其中,j_survival表示第二無人機更新生存概率;
60、[i,p,j]表示第一無人機i和目標無人機策略對[p,j]形成的無人機三元組;qj表示第二無人機j對第一無人機編隊的規(guī)避概率;
61、如果所述攻防策略為規(guī)避策略,設(shè)置第二無人機更新生存概率等于所述第二無人機初始生存概率;以及,在所述第二初始策略組中檢測是否存在無人機采用攻擊策略攻擊所述第一無人機;若否,則設(shè)置第一無人機更新生存概率等于所述第一無人機初始生存概率,若是,則計算第一無人機更新生存概率為:
62、i_survival=1-(1-qi)·(1-r_undes[i])
63、其中,i_survival表示第一無人機更新生存概率;qi表示第一無人機i對第二無人機編隊的規(guī)避概率;
64、如果所述攻防策略為干擾策略,設(shè)置第一無人機更新生存概率等于所述第一無人機初始生存概率,設(shè)置第二無人機更新生存概率等于所述第二無人機初始生存概率;
65、根據(jù)所述第二初始策略組求解第二無人機的攻防策略;以及在攻防策略為攻擊策略時,獲取第二無人機的攻擊目標;根據(jù)所述攻擊目標計算無人機三元組的關(guān)聯(lián)概率組;所述關(guān)聯(lián)概率組包括:
66、[i,p,j]=[j_target,j_target_undes,j_target_survival]
67、
68、j_target_survival=1-(1-r_evasive[j_target])·(1-j_target_undes)
69、其中,
70、j_target表示攻擊目標,j_target_undes表示攻擊目標的第一無人機未被擊毀概率,j_target_survival表示攻擊目標的第一無人機更新生存概率;
71、所述根據(jù)所述無人機更新生存概率和所述無人機初始生存概率計算所述目標無人機策略對的邊際回報值,包括:
72、δipj=u'r-ur
73、
74、其中,δipj表示目標無人機策略對的邊際回報值;
75、表示第一無人機的價值,表示第二無人機的價值。
76、優(yōu)選的,檢測更新后的第一無人機向量之前,還包括:
77、獲取所述目標策略對的目標攻防策略、目標第一無人機和目標第二無人機;
78、根據(jù)所述目標攻防策略更新所述無人機初始生存概率,包括:
79、如果所述目標攻防策略為攻擊策略,則更新目標第二無人機的第二初始未被擊毀概率和第二無人機初始生存概率為:
80、b_undes[j*]=δb_undes[i*,p*,j*]
81、b_survival[j*]=j(luò)*_survival
82、其中,i*表示目標第一無人機,p*表示目標攻防策略,j*表示目標第二無人機;
83、如果所述目標攻防策略為規(guī)避策略,則更新目標第一無人機的第一初始規(guī)避概率和第一無人機初始生存概率為:
84、r_evasive[i*]=qi*
85、r_survival[i*]=i*_survival
86、如果所述目標攻防策略為干擾策略,則獲取所述目標第一無人機和所述目標策略對形成的無人機三元組的目標關(guān)聯(lián)概率組;獲取所述目標關(guān)聯(lián)概率組中的攻擊目標,并根據(jù)所述目標關(guān)聯(lián)概率組更新攻擊目標的第一初始未被擊毀概率和第一無人機初始生存概率。
87、本發(fā)明解決其技術(shù)問題所提供的一種多無人機攻防博弈的快速求解系統(tǒng),系統(tǒng)包括:
88、模型生成模塊,被配置為構(gòu)建零和博弈矩陣模型;零和博弈矩陣模型包括第一無人機編隊和第二無人機編隊的多無人機編隊信息、多無人機策略信息和收益矩陣;多無人機策略信息包括無人機編隊的策略組集合,策略組中包括無人機編隊的多個無人機的策略對,策略對用于表征攻防策略和策略目標;攻防策略包括攻擊策略、規(guī)避策略和干擾策略;多無人機編隊信息包括無人機編隊的無人機信息,無人機信息包括攻防策略概率;
89、嚴格博弈矩陣獲取模塊,被配置為基于零和博弈矩陣模型計算嚴格博弈矩陣,并基于嚴格博弈矩陣求解納什均衡解;
90、初始策略組模塊,被配置為根據(jù)納什均衡解選取第一無人機編隊的第一初始策略組和第二無人機編隊的第二初始策略組;初始策略組為嚴格博弈矩陣中概率最大的策略組;
91、最優(yōu)策略組模塊,被配置為基于攻防策略概率和第二初始策略組求解第一無人機編隊的第一最優(yōu)策略組,基于攻防策略概率和第一初始策略組求解第二無人機編隊的第二最優(yōu)策略組;
92、方案分配模塊,被配置為如果第一最優(yōu)策略組和/或第二最優(yōu)策略組不在嚴格博弈矩陣中,則更新嚴格博弈矩陣,并基于更新后的嚴格博弈矩陣重新執(zhí)行基于嚴格博弈矩陣求解納什均衡解的步驟;
93、如果第一最優(yōu)策略組和第二最優(yōu)策略組均在嚴格博弈矩陣中,則根據(jù)納什均衡解設(shè)置多無人機編隊的策略組。
94、(三)有益效果
95、本發(fā)明提供了一種多無人機攻防博弈的快速求解方法和系統(tǒng)。與現(xiàn)有技術(shù)相比,具備以下有益效果:
96、本發(fā)明通過零和博弈矩陣模型計算嚴格博弈矩陣,并求解納什均衡解。根據(jù)納什均衡解選取第一無人機編隊的第一初始策略組和第二無人機編隊的第二初始策略組,基于攻防策略概率和第二初始策略組求解第一無人機編隊的第一最優(yōu)策略組,基于攻防策略概率和第一初始策略組求解第二無人機編隊的第二最優(yōu)策略組。如果第一最優(yōu)策略組和/或第二最優(yōu)策略組不在嚴格博弈矩陣中,則更新嚴格博弈矩陣,重新求解納什均衡解。如果均在嚴格博弈矩陣中,則根據(jù)納什均衡解設(shè)置多無人機編隊的策略組。本發(fā)明考慮到攻防策略,提高多無人機的目標分配方案時的求解效率。