本發(fā)明屬于目標(biāo)跟蹤,具體涉及一種面向機會陣?yán)走_(dá)的似然改進svgd交互多模型機動目標(biāo)跟蹤方法。
背景技術(shù):
1、機會陣?yán)走_(dá)(opportunistic?array?radar,oar)是一種多功能、多模式、全時-空-頻域工作的新體制綜合智能雷達(dá)系統(tǒng),具有“單元機會布置”與“雷達(dá)機會工作”兩大特點。一方面,機會陣?yán)走_(dá)的“隨遇而布”的天線單元可以提供更多、更豐富的組陣方式,這就使得機會陣?yán)走_(dá)具有靈活的全空域波束形成能力,能夠根據(jù)目標(biāo)的運動軌跡和環(huán)境的實時變化調(diào)整波束方向和形狀,實現(xiàn)高精度、穩(wěn)定的機動目標(biāo)搜索與跟蹤;另一方面,機會陣?yán)走_(dá)本身具備對環(huán)境的感知、認(rèn)知和評估能力。通過智能學(xué)習(xí),機會陣?yán)走_(dá)可以自主發(fā)現(xiàn)有利于雷達(dá)生存的機會,并根據(jù)雷達(dá)自身的資源狀況,智能地選擇最佳的工作模式。
2、在面對對雷達(dá)自身具有高度威脅的目標(biāo)或是雷達(dá)需要保證較高的隱身性能時,機會陣?yán)走_(dá)可以實現(xiàn)“主動-被動-主動”的靈活切換,即基于隱蔽性需求的“機會性跟蹤”:當(dāng)目標(biāo)距離較遠(yuǎn)或威脅度較低時,機會陣?yán)走_(dá)會作為“主動雷達(dá)”,輻射足夠能量的電磁波對目標(biāo)進行搜索與跟蹤;當(dāng)目標(biāo)靠近或?qū)C會陣?yán)走_(dá)自身產(chǎn)生較大威脅時,為保證安全,機會陣?yán)走_(dá)能夠自適應(yīng)地轉(zhuǎn)化為“被動雷達(dá)”,降低被目標(biāo)發(fā)現(xiàn)和摧毀的可能性;待目標(biāo)遠(yuǎn)離、確保探測環(huán)境安全后,機會陣?yán)走_(dá)會再次轉(zhuǎn)化為“主動雷達(dá)”,繼續(xù)對目標(biāo)進行持續(xù)跟蹤。
3、這種在主動雷達(dá)和被動雷達(dá)間靈活切換的能力,可以有效地保證機會陣?yán)走_(dá)的隱蔽性,提高其生存能力。但是,對于單個雷達(dá)節(jié)點而言,這一舉動會導(dǎo)致雷達(dá)量測的中斷,而對機動目標(biāo)的量測中斷,尤其是在量測中斷期間目標(biāo)做了大幅度的機動動作時,往往會給跟蹤算法的重收斂帶來極大的困難,甚至導(dǎo)致濾波的發(fā)散,造成目標(biāo)的失跟。
4、在現(xiàn)代雷達(dá)機動目標(biāo)的跟蹤場景中,考慮到目標(biāo)機動變化的靈活性、機動動作的高度非線性和背景噪聲的復(fù)雜性,適用于非線性、非高斯條件下的交互式多模型粒子濾波算法(interacting?multiple?model?particle?filter,immpf)已經(jīng)被廣泛應(yīng)用。而在immpf中,導(dǎo)致上述濾波發(fā)散的主要原因,在于粒子濾波本身存在的粒子退化和粒子貧化問題:隨著算法迭代次數(shù)的增加,粒子權(quán)值的方差逐漸增大,粒子的多樣性會逐漸降低,大部分粒子都集中于目標(biāo)分布附近。此時,面對能夠進行頻繁或大幅機動的目標(biāo),量測中斷的發(fā)生往往會導(dǎo)致恢復(fù)量測后的目標(biāo)分布附近沒有足夠的有效粒子,從而嚴(yán)重影響算法的精度和濾波的收斂。
5、目前,應(yīng)對粒子退化問題的主流方法有兩種:優(yōu)化重采樣策略與引入智能優(yōu)化算法。這兩種方法本質(zhì)上都是通過增加粒子多樣性來對粒子權(quán)值進行二次分配,以降低權(quán)值的方差?,F(xiàn)有的優(yōu)化重采樣策略包括自適應(yīng)重采樣、線性優(yōu)化重采樣、分治采樣等,而比較前沿的智能優(yōu)化算法則包括蝠鲼覓食優(yōu)化算法、圍獵改進哈里斯鷹優(yōu)化算法、改進引力場優(yōu)化算法等。這兩類方法都可以很好地提高粒子多樣性,從而緩解粒子退化和粒子貧化問題。
6、然而,無論是優(yōu)化重采樣策略還是引入智能優(yōu)化算法,都僅限于緩解、而無法從根本上徹底解決粒子退化問題。此外,現(xiàn)有的方法大多沒有考慮過諸如“機會性跟蹤”中存在的量測中斷情況。在目標(biāo)量測存在暫時中斷的場景中,取決于目標(biāo)機動的方式,目標(biāo)量測重新出現(xiàn)的位置具有很大的不確定性。面對可能出現(xiàn)在不同距離、不同方位上的恢復(fù)量測,現(xiàn)有的基于特定策略的重采樣方法很難取得穩(wěn)定且良好的預(yù)期效果,而引入的智能優(yōu)化算法則往往需要進行多個參數(shù)的調(diào)優(yōu)才能得到僅針對某類恢復(fù)量測的理想結(jié)果,兩者均不具有一般性。
技術(shù)實現(xiàn)思路
1、發(fā)明目的:本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提供一種面向機會陣?yán)走_(dá)的似然改進svgd交互多模型機動目標(biāo)跟蹤方法,主要應(yīng)用于機會陣?yán)走_(dá)在基于隱蔽性需求的“機會性跟蹤”場景下對機動目標(biāo)的跟蹤問題。
2、該方法在交互式多模型粒子濾波(immpf)的框架下,引入了stein變分梯度下降(stein?variational?gradient?descent,svgd)方法,基于粒子流實現(xiàn)粒子的更新,以徹底解決粒子退化和粒子貧化問題,在提高機動目標(biāo)跟蹤的精度和魯棒性的同時,避免了進行“機會性跟蹤”時濾波算法的發(fā)散。此外,利用immpf框架下的模型似然度實現(xiàn)svgd學(xué)習(xí)率的自適應(yīng)優(yōu)化,以更好地平衡算法的收斂速度與穩(wěn)定性,并在進行“機會性跟蹤”的過程中,保證算法的快速重收斂。
3、本發(fā)明方法包括如下步驟:
4、步驟1,對機動目標(biāo)跟蹤問題進行建模,構(gòu)建運動模型集;
5、步驟2,進行輸入狀態(tài)交互:計算各運動模型的混合概率,得到初始混合估計,生成初始混合粒子;
6、步驟3,判斷機會陣?yán)走_(dá)的工作模式,進行粒子狀態(tài)的預(yù)測與更新;
7、步驟4,進行模型概率更新與狀態(tài)估計融合。
8、步驟1包括:目標(biāo)運動的狀態(tài)方程建模為:
9、,
10、其中,和分別為k時刻的目標(biāo)狀態(tài)向量和時刻的目標(biāo)狀態(tài)向量;為狀態(tài)轉(zhuǎn)移矩陣;為控制矩陣;為時刻的系統(tǒng)控制量矩陣(即系統(tǒng)輸入矩陣);為時刻的系統(tǒng)過程噪聲;
11、設(shè)定目標(biāo)在運動過程中無額外輸入量,得到:;
12、目標(biāo)運動的觀測方程建模為:
13、,
14、其中,為時刻的觀測向量;為狀態(tài)觀測矩陣;為時刻的系統(tǒng)觀測噪聲。
15、步驟2包括:混合概率的表達(dá)式為:
16、,
17、其中,為混合概率;由狀態(tài)轉(zhuǎn)移矩陣得到,表示機動目標(biāo)模型集中第個運動模型轉(zhuǎn)移至第個運動模型的轉(zhuǎn)移概率;表示在第輪濾波中,第個運動模型的更新概率;為歸一化常數(shù),用于確?;旌细怕手蜑?,。
18、步驟2中,所述初始混合估計包含混合狀態(tài)估計與對應(yīng)的誤差協(xié)方差矩陣,混合狀態(tài)估計的表達(dá)式為:
19、,
20、其中,表示在第輪濾波中,第個運動模型的混合狀態(tài)估計;?表示在第輪濾波中,第個運動模型中得到的目標(biāo)狀態(tài)估計;
21、誤差協(xié)方差矩陣的表達(dá)式為:
22、,
23、其中,表示在第輪濾波中,第個運動模型的混合狀態(tài)估計對應(yīng)的誤差協(xié)方差矩陣;表示在第輪濾波中,第個運動模型的目標(biāo)狀態(tài)估計對應(yīng)的誤差協(xié)方差矩陣;
24、采樣得到的個初始混合粒子表示為。與常規(guī)immpf及其改進算法不同的是,此處得到的初始混合粒子僅具有粒子狀態(tài)和模型標(biāo)簽,而不具有權(quán)值。
25、步驟3包括:
26、步驟3-1,在各運動模型內(nèi)部,用狀態(tài)轉(zhuǎn)移方程對初始混合粒子進行預(yù)測,得到粒子的預(yù)測狀態(tài):
27、在第個運動模型中,第個粒子的預(yù)測狀態(tài)表達(dá)式為:
28、?,
29、其中,表示在第輪濾波中,第個運動模型下的第個粒子的預(yù)測狀態(tài);表示第個運動模型對應(yīng)的狀態(tài)轉(zhuǎn)移矩陣;表示在第輪濾波中,第個運動模型下的第個初始混合粒子的粒子狀態(tài);表示系統(tǒng)過程噪聲;
30、步驟3-2,根據(jù)機會陣?yán)走_(dá)的工作狀態(tài)決定后續(xù)算法的執(zhí)行:如果此時機會陣?yán)走_(dá)處于被動模式,則基于當(dāng)前的預(yù)測粒子和模型概率進行狀態(tài)融合,并跳轉(zhuǎn)至步驟2;如果此時機會陣?yán)走_(dá)處于主動模式,則用獲取的觀測值計算每個預(yù)測粒子的似然度,并進一步計算模型似然度;
31、在第個運動模型中,第個預(yù)測粒子的粒子似然度表達(dá)式為:,
32、其中,表示第輪濾波中的系統(tǒng)觀測值;為觀測向量的維度;表示在第輪濾波中,第個預(yù)測粒子的新息;表示在第輪濾波中,第個運動模型的新息協(xié)方差;表示行列式的計算;exp是自然指數(shù)函數(shù);t表示矩陣轉(zhuǎn)置;
33、在svgd框架下,粒子沒有權(quán)值,因此不同于常規(guī)的模型似然度計算方法,對模型似然度進行修改:
34、;
35、其中為第個運動模型的模型似然度;
36、步驟3-3,用模型似然度優(yōu)化svgd算法的學(xué)習(xí)率,并在各運動模型中用svgd更新各粒子的狀態(tài):
37、在第個運動模型中,基于似然度改進的svgd學(xué)習(xí)率表達(dá)式為:,
38、其中,表示在第輪濾波中,第個運動模型的svgd學(xué)習(xí)率;表示全局學(xué)習(xí)率;表示歸一化模型似然度;為衰減因子,其中,為衰減系數(shù),表示首輪濾波時各模型似然度之和,表示第至第輪濾波中,各運動模型似然度之和的最大值;
39、最終得到的自適應(yīng)優(yōu)化方法為:用模型總和似然度進行全局學(xué)習(xí)率的調(diào)整,得到整體學(xué)習(xí)率,隨著迭代次數(shù)的增加,整體學(xué)習(xí)率逐漸下降;在每一次迭代內(nèi)部,基于歸一化的模型似然度對整體學(xué)習(xí)率進行調(diào)整,得到各個運動模型的svgd學(xué)習(xí)率。
40、在第個運動模型中,對第個粒子用svgd更新粒子狀態(tài):
41、,
42、其中,表示在第輪濾波中,第個運動模型下的第個粒子的更新狀態(tài);為粒子更新的移動方向,表達(dá)式為:
43、,
44、其中,為粒子數(shù),為rbf核函數(shù),此處采用的是高斯核函數(shù),為核寬度;表示目標(biāo)分布;表示在第輪濾波中,第個運動模型下的第個粒子的預(yù)測狀態(tài);無具體含義,僅僅用來表示公式中的自變量;表示在函數(shù)中,求解在處關(guān)于各分量的梯度;表示在函數(shù)中,求解在處關(guān)于各分量的梯度。
45、步驟4包括:
46、步驟4-1,根據(jù)模型概率轉(zhuǎn)移矩陣和當(dāng)前的模型概率,計算各運動模型的預(yù)測概率,并用模型似然度對預(yù)測的模型概率進行歸一化處理,實現(xiàn)模型概率的更新;
47、模型預(yù)測概率的計算公式為:
48、,
49、其中,表示在第輪濾波中,第個運動模型的預(yù)測概率;
50、模型概率更新的表達(dá)式為:
51、,
52、其中,表示在第輪濾波中,第個運動模型的更新概率;為模型預(yù)測概率;為歸一化常數(shù),確保更新后的模型概率之和為1,;
53、步驟4-2,計算各運動模型中的目標(biāo)狀態(tài)估計和誤差協(xié)方差矩陣,用更新后的模型概率對其進行加權(quán)融合,得到最終的濾波輸出結(jié)果;
54、第個運動模型的目標(biāo)狀態(tài)估計表達(dá)式為:
55、;
56、其中,表示在第輪濾波中,第個運動模型得到的目標(biāo)狀態(tài)估計;表示在第輪濾波中,第個運動模型下的第個粒子的更新狀態(tài);
57、誤差協(xié)方差矩陣的表達(dá)式為:
58、,
59、其中,表示在第輪濾波中,第個運動模型的目標(biāo)狀態(tài)估計對應(yīng)的誤差協(xié)方差矩陣;
60、在第輪濾波中,基于似然改進svgd交互多模型機動目標(biāo)跟蹤算法的最終輸出結(jié)果為:
61、,
62、其中,表示第輪濾波得到的目標(biāo)狀態(tài)估計。
63、本發(fā)明還提供了一種電子設(shè)備,包括處理器和存儲器,所述存儲器存儲有程序代碼,當(dāng)所述程序代碼被所述處理器執(zhí)行時,使得所述處理器執(zhí)行所述的方法的步驟。
64、本發(fā)明還提供了一種存儲介質(zhì),存儲有計算機程序或指令,當(dāng)所述計算機程序或指令在計算機上運行時,執(zhí)行所述的方法的步驟。
65、本發(fā)明具有如下有益效果:(1)將svgd應(yīng)用到immpf框架中,通過粒子流將粒子更新至高似然區(qū)域,完全回避了粒子權(quán)值的使用,從根本上解決了粒子退化和粒子貧化問題,提高了機動目標(biāo)跟蹤的精度與魯棒性,避免了基于隱蔽性需求的“機會性跟蹤”場景下濾波的發(fā)散;(2)利用模型似然度實現(xiàn)對svgd學(xué)習(xí)率的自適應(yīng)優(yōu)化,無論是在單次迭代還是在整個迭代過程中,都很好地平衡了算法的收斂速度與穩(wěn)定性,同時保證了機會陣?yán)走_(dá)執(zhí)行“機會性跟蹤”功能時算法的快速重收斂。