本發(fā)明涉及一種利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行威脅評(píng)估的建模方法。
背景技術(shù):
對(duì)威脅源完成快速準(zhǔn)確的威脅評(píng)估是實(shí)際作戰(zhàn)的關(guān)鍵環(huán)節(jié)。一方面,在錯(cuò)綜復(fù)雜、瞬息萬(wàn)變的作戰(zhàn)環(huán)境中,敵方干擾及傳感器性能局限等因素導(dǎo)致獲取信息量或觀測(cè)數(shù)據(jù)量不充分;另一方面,有時(shí)為了完成“先敵決策,先敵打擊”的戰(zhàn)術(shù)任務(wù),不得不在數(shù)據(jù)尚不充分時(shí)進(jìn)行威脅評(píng)估和作戰(zhàn)決策。因此,亟需一種能夠在不充分的數(shù)據(jù)條件下進(jìn)行威脅評(píng)估建模的方法,這里將不充分?jǐn)?shù)據(jù)稱為小數(shù)據(jù)集。目前威脅評(píng)估建模方法的主要思想是根據(jù)評(píng)估對(duì)象選取威脅因子,進(jìn)而將這些威脅因子進(jìn)行綜合。主要的方法有神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯網(wǎng)絡(luò)、vague集、專(zhuān)家系統(tǒng)、模糊推理、線性加權(quán)和層次分析法等。在上述的方法中,僅有貝葉斯網(wǎng)絡(luò)和支持向量機(jī)具有在小數(shù)據(jù)集條件下進(jìn)行建模的能力,與支持向量機(jī)相比,貝葉斯網(wǎng)絡(luò)具有類(lèi)似人腦的概率理論基礎(chǔ)、可解釋的知識(shí)表述方式和靈活的推理機(jī)制。余舟毅等在文獻(xiàn)《基于貝葉斯網(wǎng)絡(luò)的威脅等級(jí)評(píng)估算法研究》中研究了基于貝葉斯網(wǎng)絡(luò)的推理模型和推理算法,但是其中涉及的貝葉斯網(wǎng)絡(luò)模型是根據(jù)經(jīng)驗(yàn)主觀給出的,缺少結(jié)合數(shù)據(jù)進(jìn)行模型構(gòu)建的過(guò)程,同時(shí)并不具備處理小數(shù)據(jù)集的能力。覃征等人在文獻(xiàn)《基于模糊動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的態(tài)勢(shì)威脅評(píng)估方法》中研究了數(shù)據(jù)模糊化過(guò)程、數(shù)據(jù)提取以及威脅評(píng)估的推理過(guò)程,但是同樣未涉及小數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò)模型構(gòu)建過(guò)程。
技術(shù)實(shí)現(xiàn)要素:
為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于小數(shù)據(jù)集的威脅評(píng)估建模方法。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案包括以下步驟:
步驟1,對(duì)戰(zhàn)場(chǎng)信息中的威脅數(shù)據(jù)進(jìn)行預(yù)處理,包括目標(biāo)速度v、進(jìn)入角之和a、敵我距離dis以及目標(biāo)威脅程度t,其中,目標(biāo)速度
步驟2,將威脅數(shù)據(jù)作為節(jié)點(diǎn),利用領(lǐng)域知識(shí)獲取威脅數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)約束,改進(jìn)bic評(píng)分
步驟3,采用k2算法學(xué)習(xí)威脅評(píng)估網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),步驟如下:
步驟a,從一個(gè)包含n個(gè)節(jié)點(diǎn)變量卻沒(méi)有邊的圖出發(fā)開(kāi)始搜索;
步驟b,按照節(jié)點(diǎn)序ρ(x1,x2,...xi...,xn)進(jìn)行搜索,在節(jié)點(diǎn)xi,將排在節(jié)點(diǎn)xi之前的變量進(jìn)行組合,并從中選出節(jié)點(diǎn)xi的父節(jié)點(diǎn)集π(xi),找出使改進(jìn)bic評(píng)分達(dá)到最大的父節(jié)點(diǎn)集π(xi);
步驟c,判斷i是否等于n,如果相等,則算法結(jié)束,輸出所得網(wǎng)絡(luò)結(jié)構(gòu);否則,i值加一并返回步驟b;
步驟4,利用步驟3得到的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)獲取網(wǎng)絡(luò)參數(shù)的單調(diào)性約束,對(duì)于由n個(gè)變量x={x1,x2,...xn}組成的貝葉斯網(wǎng)g,設(shè)g中的節(jié)點(diǎn)xi有r種取值且取值狀態(tài)集合為{1,2,...,k,...r},其父節(jié)點(diǎn)集π(xi)有q個(gè)取值且取值狀態(tài)集合為{1,2,...,j,...q},令θijk=p(xi=k|π(xi)=j(luò)),則有θj1≤θij2≤......≤θijr或θij1≥θij2≥......≥θijr;
步驟5,根據(jù)參數(shù)的規(guī)范性,即父節(jié)點(diǎn)取值狀態(tài)相同而子節(jié)點(diǎn)取值不同的一組參數(shù)相加的和為1,獲取參數(shù)的取值區(qū)間
步驟6,認(rèn)為參數(shù)在步驟5給出的取值區(qū)間內(nèi)服從均勻分布,設(shè)參數(shù)θ服從u(θ1,θ2),[θ1,θ2]為參數(shù)取值范圍,用b(α1,α2)等效u(θ1,θ2),即
步驟7,利用貝葉斯估計(jì)得到參數(shù)學(xué)習(xí)的結(jié)果
本發(fā)明的有益效果是:針對(duì)小數(shù)據(jù)集條件下的威脅評(píng)估建模問(wèn)題,通過(guò)在結(jié)構(gòu)建模階段中引入貝葉斯網(wǎng)絡(luò)邊的存在約束,在參數(shù)建模階段引入?yún)?shù)單調(diào)性約束,彌補(bǔ)了小數(shù)據(jù)集所包含信息不充分導(dǎo)致建模精度差的問(wèn)題,不僅為小數(shù)據(jù)集條件下的威脅評(píng)估建模問(wèn)題提供了一條可行的解決途徑,而且也為其它領(lǐng)域中的小數(shù)據(jù)集建模問(wèn)題提供了可參考的方法,具有較為廣泛的應(yīng)用前景。
附圖說(shuō)明
圖1是無(wú)人機(jī)戰(zhàn)場(chǎng)想定圖;
圖2是貝葉斯網(wǎng)絡(luò)邊的存在約束示意圖;
圖3是本文結(jié)構(gòu)學(xué)習(xí)算法的中間結(jié)果示意圖;
圖4是20組數(shù)據(jù)量所得威脅評(píng)估bn結(jié)構(gòu)示意圖,其中,(a)是本文算法所得威脅評(píng)估bn結(jié)構(gòu),(b)是原始k2算法所得威脅評(píng)估bn結(jié)構(gòu);
圖5是k2算法5000組數(shù)據(jù)所得的威脅評(píng)估bn結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步說(shuō)明,本發(fā)明包括但不僅限于下述實(shí)施例。
本發(fā)明提供了一種基于小數(shù)據(jù)集的威脅評(píng)估建模方法,具體包含以下幾個(gè)步驟:
步驟1:威脅數(shù)據(jù)的預(yù)處理
數(shù)據(jù)預(yù)處理包含威脅因素的選取和威脅數(shù)據(jù)的離散化。選用如圖1所示的戰(zhàn)場(chǎng)想定,想定中威脅目標(biāo)包括雷達(dá)和防空陣地,我方有人機(jī)指揮無(wú)人機(jī)對(duì)敵方陣地進(jìn)行防空壓制。戰(zhàn)場(chǎng)環(huán)境的復(fù)雜性決定了與威脅相關(guān)的因素非常多,本發(fā)明選取部分威脅因素作為威脅評(píng)估建??紤]的因子,下面給出所選的威脅因素和離散化的方法。
(1)目標(biāo)速度(velocity,v):特指速度大小,無(wú)人機(jī)速度記為vu
(2)進(jìn)入角之和(angel,a):目標(biāo)速度方向與目標(biāo)線的夾角和無(wú)人機(jī)速度方向與目標(biāo)線夾角之和
(3)敵我距離(distance,dis):目標(biāo)與無(wú)人機(jī)之間的距離
(4)目標(biāo)威脅程度(threat,t),目標(biāo)對(duì)我方作戰(zhàn)單元威脅程度
步驟2:利用結(jié)構(gòu)約束改進(jìn)bic評(píng)分。
(1)根據(jù)領(lǐng)域知識(shí)獲取的貝葉斯網(wǎng)絡(luò)邊的存在約束如圖2所示。其中,虛線表示兩個(gè)節(jié)點(diǎn)之間不存在邊的概率,帶箭頭的實(shí)線表示存在邊的概率。
(2)通過(guò)圖2中給出的邊的存在約束改進(jìn)bic評(píng)分函數(shù)。結(jié)合評(píng)分函數(shù)的可分解性,將圖2中的邊的存在約束以一種類(lèi)似局部結(jié)構(gòu)先驗(yàn)的方式融入到結(jié)構(gòu)學(xué)習(xí)評(píng)分中,進(jìn)而得到改進(jìn)后的bic評(píng)分如公式(1)所示。
其中,mijk是樣本數(shù)據(jù)中滿足xi=k,其父節(jié)點(diǎn)π(xi)=j(luò)的樣本個(gè)數(shù),
步驟3:結(jié)合改進(jìn)后的bic評(píng)分,采用k2算法學(xué)習(xí)威脅評(píng)估網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。具體步驟如下:
步驟a:從一個(gè)包含n個(gè)節(jié)點(diǎn)變量卻沒(méi)有邊的圖出發(fā)開(kāi)始搜索。
步驟b:按照節(jié)點(diǎn)序ρ(x1,x2,...xi...,xn)進(jìn)行搜索,以xi為例,將排在節(jié)點(diǎn)xi之前的變量進(jìn)行組合,并從中選出xi的父節(jié)點(diǎn)集π(xi),通過(guò)計(jì)算vnew=bic((xi,π(xi))|d),找出使vnew=bic((xi,π(xi))|d)達(dá)到最大的父節(jié)點(diǎn)集π(xi),需要注意的是:x1的父節(jié)點(diǎn)集是空集。這里的評(píng)分為步驟2中的改進(jìn)bic評(píng)分。
步驟c:判斷i是否等于n,如果相等,則算法結(jié)束,輸出所得網(wǎng)絡(luò)結(jié)構(gòu)。否則,執(zhí)行i=i+1返回步驟b。
步驟4:利用步驟3得到的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)獲取網(wǎng)絡(luò)參數(shù)的單調(diào)性約束。一個(gè)由n個(gè)變量x={x1,x2,...xn}組成的貝葉斯網(wǎng)g,不失一般性,設(shè)g中的節(jié)點(diǎn)xi有r種取值且取值狀態(tài)集合為{1,2,...,k,...r},1≤k≤r,其父節(jié)點(diǎn)集π(xi)有q個(gè)取值且取值狀態(tài)集合為{1,2,...,j,...q},1≤j≤q。令θijk=p(xi=k|π(xi)=j(luò)),則有θij1≤θij2≤......≤θijr或θij1≥θij2≥......≥θijr。
步驟5:結(jié)合單調(diào)性約束和參數(shù)的規(guī)范性獲取參數(shù)的取值區(qū)間。參數(shù)的規(guī)范性的含義為:父節(jié)點(diǎn)取值狀態(tài)相同而子節(jié)點(diǎn)取值不同的一組參數(shù)相加的和為1。具體的轉(zhuǎn)化過(guò)程可參考公式(2)。
步驟6:結(jié)合步驟5中參數(shù)的取值區(qū)間獲取參數(shù)貝塔先驗(yàn)分布的超參數(shù)。公式(2)給出了參數(shù)的取值范圍,在無(wú)其它先驗(yàn)的情況下,則可認(rèn)為參數(shù)在區(qū)間內(nèi)服從均勻分布。設(shè)參數(shù)θ服從u(θ1,θ2),[θ1,θ2]為參數(shù)取值范圍。問(wèn)題轉(zhuǎn)化為如何用b(α1,α2)等效u(θ1,θ2),即:
采用矩估計(jì)求解公式(3)所描述的問(wèn)題,具體步驟如公式(4)~(6)所示。
其中,[α1,α2]為待求貝塔分布的超參數(shù),m1為貝塔分布的期望,m2為貝塔分布的二階矩,m1為均勻分布的期望,m2為均勻分布的二階矩。
步驟7:結(jié)合步驟6得到的貝塔先驗(yàn)分布的超參數(shù),利用貝葉斯估計(jì)得到參數(shù)學(xué)習(xí)的結(jié)果。具體方法可參考公式(7),式中nijk為符合父節(jié)點(diǎn)取值為j,子節(jié)點(diǎn)取值為k時(shí)的樣本數(shù),nij為父節(jié)點(diǎn)取值為j時(shí)的樣本數(shù),[αi,αj]為貝塔分布的超參數(shù)。
通過(guò)計(jì)算機(jī)仿真對(duì)本算法進(jìn)行了虛擬實(shí)施,具體實(shí)施過(guò)程如下:
步驟1通過(guò)對(duì)圖1所示的戰(zhàn)場(chǎng)任務(wù)想定進(jìn)行仿真,獲取戰(zhàn)場(chǎng)信息并進(jìn)行離散化,進(jìn)而得到威脅信息數(shù)據(jù),如表1所示。
表1經(jīng)過(guò)數(shù)據(jù)預(yù)處理后的部分威脅信息數(shù)據(jù)
步驟2利用領(lǐng)域知識(shí)獲取的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)約束如圖2所示。目標(biāo)威脅節(jié)點(diǎn)為1號(hào)節(jié)點(diǎn),目標(biāo)距離、目標(biāo)與無(wú)人機(jī)的進(jìn)入角之和以及目標(biāo)速度節(jié)點(diǎn)分別為2、3、4號(hào)節(jié)點(diǎn)。
步驟3結(jié)合步驟2中的結(jié)構(gòu)約束和公式(1)給出的改進(jìn)后的bic評(píng)分,采用k2算法學(xué)習(xí)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
步驟a:從一個(gè)包含4個(gè)節(jié)點(diǎn)變量卻沒(méi)有邊的圖出發(fā)開(kāi)始搜索。
步驟b:按照節(jié)點(diǎn)序ρ(x1,x2,x3,x4)進(jìn)行搜索,x1的父節(jié)點(diǎn)集是空集,從i=2開(kāi)始,通過(guò)計(jì)算vnew=bic((xi,π(xi))|d),找出使vnew=bic((xi,π(xi))|d)達(dá)到最大的父節(jié)點(diǎn)集π(xi),這里的評(píng)分為步驟2中的改進(jìn)bic評(píng)分,d為樣本數(shù)據(jù)。
步驟c:判斷i是否等于4,如果相等,則算法結(jié)束,返回所得網(wǎng)絡(luò)結(jié)構(gòu)。否則,執(zhí)行i=i+1返回步驟b。
圖3給出了結(jié)構(gòu)學(xué)習(xí)算法的中間結(jié)果,最終得到的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。圖4(a)給出了利用本文算法得到的威脅評(píng)估bn結(jié)構(gòu)。圖4(b)給出了經(jīng)典k2算法得到的威脅評(píng)估bn結(jié)構(gòu)。圖5給出了樣本數(shù)據(jù)為5000時(shí)經(jīng)典k2算法所得的威脅評(píng)估bn結(jié)構(gòu)。通過(guò)對(duì)比分析發(fā)現(xiàn),與經(jīng)典k2算法相比,本文算法在數(shù)據(jù)量為20時(shí)所得的威脅評(píng)估bn結(jié)構(gòu)與數(shù)據(jù)量為5000時(shí)所得的結(jié)構(gòu)更為接近,說(shuō)明本文算法能夠更好的適應(yīng)小數(shù)據(jù)集,在小數(shù)據(jù)集條件下能夠獲得較高的結(jié)構(gòu)學(xué)習(xí)精度。
步驟4結(jié)合步驟3得到的威脅評(píng)估bn結(jié)構(gòu)獲取參數(shù)的單調(diào)性約束,如公式(8)~(10)所示。
步驟5利用公式(2)并結(jié)合步驟4給出的參數(shù)單調(diào)性計(jì)算得到參數(shù)的取值范圍,具體如公式(11)所示。
步驟6利用公式(3)~(6)和步驟5中得到的參數(shù)區(qū)間求解參數(shù)貝塔先驗(yàn)的超參數(shù),具體如公式(12)~(13)所示。
步驟7利用公式(7)和步驟6中得到的參數(shù)貝塔先驗(yàn)的超參數(shù)計(jì)算威脅評(píng)估bn參數(shù),具體結(jié)果如表2~4所示。表2是數(shù)據(jù)量為5000時(shí)最大似然估計(jì)算法所得的參數(shù),表3是數(shù)據(jù)量為20時(shí)最大似然估計(jì)算法所得參數(shù),表4是數(shù)據(jù)量為20時(shí)本文算法所得參數(shù)。
表2數(shù)據(jù)量為5000時(shí)最大似然估計(jì)所得參數(shù)
表3數(shù)據(jù)量為20時(shí)最大似然估計(jì)所得參數(shù)
表4數(shù)據(jù)量為20時(shí)本文算法所得參數(shù)
通過(guò)對(duì)比分析發(fā)現(xiàn),在數(shù)據(jù)量為20時(shí),與最大似然估計(jì)算法相比,本文算法所得的參數(shù)更接近于數(shù)據(jù)量為5000時(shí)所得的參數(shù),說(shuō)明本文算法更適應(yīng)于小數(shù)據(jù)集條件下的bn參數(shù)學(xué)習(xí)問(wèn)題,具有更高的學(xué)習(xí)精度。