基于多因素不一致度量的異常行為序貫檢測方法
【專利摘要】本發(fā)明公開了一種基于多因素不一致度量的異常行為序貫檢測方法。該方法充分考慮目標的位置、速度和運動方向信息,通過在線學習和序貫異常檢測的方式,實現(xiàn)對目標異常行為的實時異常檢測,具體包括以下步驟:一、定義輸入、輸出變量;二、初始化;三、對測試樣本中的每個數(shù)據(jù)點和訓練樣本序列中的每個樣本重復進行相應(yīng)的異常檢測;四、當前測試樣本的每個數(shù)據(jù)點都異常檢測完成后,更新訓練樣本序列;五、對多因素Hausdorff距離矩陣進行更新;六、更新后的訓練樣本序列和更新后的多因素Hausdorff距離矩陣作為新的輸入變量,對下一個測試樣本進行異常檢測。該方法參數(shù)設(shè)置簡單,虛警率可控,異常檢測準確率高,工程易實現(xiàn),在預(yù)警監(jiān)視領(lǐng)域有廣闊的應(yīng)用前景。
【專利說明】
基于多因素不一致度量的異常行為序貫檢測方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘中的異常檢測技術(shù)和信息融合中的高層融合技術(shù),屬于模式 識別和智能情報處理領(lǐng)域。
【背景技術(shù)】
[0002] 隨著信息融合理論的不斷完善和信息融合技術(shù)的廣泛應(yīng)用,情報處理系統(tǒng)經(jīng)過檢 測級、位置級和屬性級融合過程,可以自動或半自動的完成對目標的檢測、跟蹤、航跡關(guān)聯(lián)、 屬性判決,形成連續(xù)穩(wěn)定的目標航跡。隨著目標種類、數(shù)量的不斷增多和預(yù)警監(jiān)視系統(tǒng)性能 的不斷提升,越來越多的目標情報數(shù)據(jù)形成并存在于各種預(yù)警監(jiān)視系統(tǒng)中。如何讓計算機 自動的發(fā)現(xiàn)目標的異常行為是智能情報處理中一項非常重要的研究內(nèi)容。國內(nèi)外很多學者 對目標的實時異常檢測問題進行了大量的研究,主要方法分為學習階段和異常檢測階段兩 步進行。學習階段有基于統(tǒng)計模型的方法、基于神經(jīng)網(wǎng)絡(luò)的方法、基于聚類的方法等,異常 檢測階段有基于統(tǒng)計檢驗的方法、基于距離的方法等。但是這些方法普遍存在參數(shù)設(shè)置復 雜、統(tǒng)計模型不夠準確,虛警率不能有效控制、在線學習效果較差等問題。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明提供了一種基于多因素不一致度量的異常行為序貫檢測方法,充分考慮目 標的位置、速度和運動方向信息,通過在線學習和序貫異常檢測的方式,實現(xiàn)對目標異常行 為的實時異常檢測。具體包括以下步驟:
[0004] 步驟一,定義輸入、輸出變量:
[0005] 輸入變量:
[0006] 1)異常閾值e;
[0007] 2)需要考慮的近鄰數(shù)量k;
[0008] 3)訓練樣本序列(zi, ? ? ?,zi),其中z,. g :/ = 1,..../ ;
[0009] 4)多因素Hausdorff距離矩陣M,其中矩陣的每個元素Mi,j:i = l, ? ? ? ,1, j = l, ? ? ?, k表示Zi到樣本序列(zi,. . . ,Zi-i,Zi+i,. . . ,zi)第j近的樣本之間的多因素Hausdorff距離; [0010] 5)空的優(yōu)先序列Q;
[0011] 6)測試樣本 zi+i={xiUx2U …Uxl},其中XiflXj=<i):i,j = l,...,LAj^i;
[0012] 輸出變量:
[0013] 1 )異常指示變量,其中?,:1對應(yīng)子集 U"'Ua)丨c 計算得出的類別,^對應(yīng){X1 u X2 U…U xl} =zi+i計算得出的類別;
[0014] 2)距離向量(mi,…,mi),其中mi:i = l, ? ? ?,1表示Z1+1到Zi的多因素Hausdorff距 i^i : ^, z^y ;
[0015] 3)距離向量(m'l,…,m'i),其中m'i:i = l, ? ? ? ,1表示Zi到zi+1 的多因素Hausdorff 距離
[0016] 步驟二,初始化:對距離mi賦零初值,并計算多因素Hausdorff距離矩陣Mi,i,? ? ?, .々-1 Mi, k-i的和,定義為v,?=£ M.
[0017] 步驟三,對測試樣本zi+i= {xiUx2U'" U xl}中的Xj: j = 1,. . .,L和訓練樣本序列 (Z1,. . .,z〇中的Zl:i = l,. . .,1重復進行如下異常檢測過程:
[0018 ] 1)通過計算多因素Haus dor f f距離對mi的取值進行更新;
[0019] 2)對Q內(nèi)的元素進行更新;
[0020] 3)通過計算多因素Hausdorff距離對m'i的取值進行更新;
[0021] 4)根據(jù)距離m'i與距離M1>k的取值大小,對不一致度量^的取值進行更新;
[0022] 5)從Q中提取當前的k個距離值,并通過對這k個距離值的求和對不一致度量a1+1的 取值進行更新;
[0023] 6)計算 pi+1 取值;
[0024] 7)進行閾值e判別,對當前測試樣本的異常情況進行檢測更新。
[0025] 步驟四,當測試樣本z1+1的每個數(shù)據(jù)點X1,X2,…,xl都異常檢測完成后,輸出異常指 示變量和距離向量,將Z1+1添加到訓練樣本序列(zi, ...,zi)中,將訓練樣本序列更新為 (Z1,? ? ?,Zl+l)〇
[0026] 步驟五,對多因素Hausdorff距離矩陣M進行更新。
[0027]步驟六,更新后的訓練樣本序列(Z1,...,z1+1)和更新后的多因素Hausdorff距離 矩陣M作為新的輸入變量,對測試樣本z1+2進行異常檢測。
[0028] 本發(fā)明的有益效果在于:本發(fā)明提供的一種基于多因素不一致度量的異常行為序 貫檢測方法,具有參數(shù)設(shè)置簡單、虛警率可控,準確率高、能夠在線學習和序貫異常檢測的 優(yōu)點,并且綜合考慮了目標的位置、速度和航向信息,對目標的位置異常、速度異常和運動 方向異常行為都能夠進行實時檢測。
【附圖說明】
[0029] 附圖1是本發(fā)明所述的基于多因素不一致度量的異常行為序貫檢測方法的整體流 程圖。
【具體實施方式】
[0030] 下面結(jié)合附圖對本發(fā)明的實施方式加以詳細說明。
[0031] 步驟一,定義輸入、輸出變量:
[0032] 輸入變量:
[0033] 1)異常閾值£;
[0034] 2)需要考慮的近鄰數(shù)量k;
[0035] 3)訓練樣本序列(zi, ? ? ?,zi),其中z, <二 /?" :/ =丨,;
[0036] 4)多因素Hausdorff距離矩陣M,其中矩陣的每個元素Mu:i = l,?…,1J = 1,…?, k表示Zi到樣本序列(zi,. . .,zi-i,zi+i,. . .,zi)第j近的樣本之間的多因素Hausdorff距離; [0037] 5)空的優(yōu)先序列Q;
[0038] 6)測試樣本2;1+1={叉1口叉2口 …Uxl},其中Xiflxj=傘:i, j = l, ? ? ?,LAj辛i;
[0039] 輸出變量:
[0040] 1 )異常指示變量辦〇<+1丨,…,也,其中>4"麵f+1,: / =丨,.?,L -1對應(yīng)子集 h c z,+1計算得出的類別,對應(yīng){xi U X2 u…U xl} =Z1+1計算得出的類別;
[0041 ] 2)距離向量(mi,…,mi),其中mi: i = 1,? ? ?,1表示zi+i到zi的多因素Hausdorff距
[0042] 3)距離向量(m'i,???,m'i),其中 m'i:i = l,...,1 表示 Zi 到 zi+i 的多因素 Hausdorff 距離:Hl)。
[0043] 步驟二,初始化:對距離mi賦零初值,并計算多因素Hausdorff距離矩陣Mi,i,..., Mi,k-1的和[風,多因素Hausdorff距離矩陣M的每個元素Mi,j:i = l,…,1,j = l,…,k 表示Zi到樣本序列(zi, . . .,Zi-i,Zi+i, . . .,Z1)第j近的樣本之間的多因素Hausdorff距離,多 因素Hausdorff距離的具體定義如下:
[0044] 1)考慮兩個目標的位置信息、速度信息和運動方向信息,兩個目標之間的多因素 距離定義為:
[0045] mfdist(a,b) =wd ? dist(a,b)+wv ? | va-vb |+we ? | 9a-9b (1)
[0046] 其中Va,Vb表示點a與點b的速度信息,0a,0 b表示點a與點b的運動方向信息,Wd表示 位置信息的權(quán)重因子,Wv表示速度信息的權(quán)重因子,^表示運動方向信息的權(quán)重因子,權(quán)重 因子的取值取決于多因素距離的應(yīng)用場景。
[0047] 2)基于多因素距離mfdist(a,b),A到B的多因素Hausdorff距離定義為:
[0048] ()'w(.4, B) = max | min (2 )
[0049] A與B為兩個樣本序列。
[0050] 步驟三,對測試樣本zi+i = {xi U X2 U…U xl}中的Xj: j = 1, . . . ,L和訓練樣本序列 (Z1,. . .,z〇中的Zl:i = l,. . .,1重復進行如下異常檢測過程:
[0051 ] 1)根據(jù)式(2)計算多因素Haus dor f f距離,對m i的取值進行更新:
[0052] m, - max > (3)
[0053] 2)對Q內(nèi)的元素進行更新:
[0054]如果Q內(nèi)的元素個數(shù)小于近鄰數(shù)量k,則將當前的nu取值插入到Q中,如果Q內(nèi)存有k 個距離值,并且當前的nu小于Q中的最大距離值,則刪除Q中的最大距離值,將當前nu取值插 入到Q中;
[0055] 3)根據(jù)式(2)計算多因素Hausdorff距離,對":的取值進行更新:
[0056]級.:1;.. = 4 (z,,{U ?. ? U 巧 j) (4)
[0057] 4)根據(jù)距離m'i與距離M1>k的取值大小,對不一致度量^的取值進行更新:
[0058] 如果:m'XMi.k,
[0059] ai = vi+m'i (5)
[0060] 否則,
[0061] ai = vi+Mi,k (6)
[0062] <^的具體定義為:給定一個樣本序列^1,。.,^ :,24#:/ = 1,.:..,《代表空間#中的 一個非空點集,樣本Zl到集合{Z1,. . .,Zn}\Zl的多因素不一致度量h可以定義為: k _+
[0063] ai =Y/M(:i、麗、zi,{zvz々}、Zi J:)) (7) M
[0064] 其中NN(Zi, {zi, . . .,zn}\zi, j) G {zi, . . .,zn}\zi 表示根據(jù)式(2)定義的多因素 Haus dor f f距離計算得出的距離z i第j近的樣本;
[0065] 5)從Q中提取當前的k個距離值,對不一致度量a1+1的取值進行更新:
[0066] al+x - sum|,m*k| (8)
[0067] 6)計算 pi+1 取值:
(9)
[0069] 【{纟=1,:..:.,/: + 1瑪&泛/+1..}』表示集合{1 = 1,...,1+1:<^彡(11+1}中元素的數(shù)量;
[0070] 7)進行閾值e判別,對當前測試樣本的異常情況進行檢測更新:
[0071] 如果 p1+1〈e,
[0072] Anomic = 1 (1.0)
[0073]否則,
[0074] Anoml, =: 0 .(.11)
[0075] 其中,=1代表檢測結(jié)果為異常行為,=0代表檢測結(jié)果為正常行 為。
[0076] 步驟四,當測試樣本Z1+1的每個數(shù)據(jù)點X1,X2,…,a都異常檢測完成后,輸出異常指 示變量和距離向量,將Z1+1添加到訓練樣本序列(zi, ...,zi)中,將訓練樣本序列更新為 (Z1,? ? ?,Zl+l)〇
[0077] 步驟五,對多因素Hausdorff距離矩陣M進行如下更新:
[0078] 1)多因素Hausdorff距離矩陣M的第1行到第1行,根據(jù)輸出的距離向量(m、,..., m'i)進行更新;
[0079] 2)將輸出的距離向量(mi,...,m〇作為最后一行增加到多因素Hausdorff距離矩陣 皿中。
[0080]步驟六,更新后的訓練樣本序列(Z1,...,Z1+1)和更新后的多因素Hausdorff距離 矩陣M作為新的輸入變量,對測試樣本z1+2進行異常檢測。
【主權(quán)項】
1. 一種基于多因素不一致度量的異常行為序貫檢測方法,其特征在于,包括以下步驟: 步驟一,定義輸入、輸出變量; 輸入變量: 1) 異常閾值ε; 2) 需要考慮的近鄰數(shù)量k; 3) 訓練樣本序列(zi, . . .,ζι),其中z,. g /Γ' :/ = 1,...,/; 4) 多因素 Hausdorff距離矩陣M,其中矩陣的每個元素 Mi,j: i = l,. . ·,1,j = l,. . ·,k表 示Zi到樣本序列(zi,. . .,zi-i,zi+i,. . .,ζι)第j近的樣本之間的多因素 Hausdorff距離; 5) 空的優(yōu)先序列Q; 6) 測試樣本zi+1= {xi U X2 U …U a},其中Xi 門 Xj = φ : i,j = 1,· · ·,LA j^i ; 輸出變量: 1 )異常指示變量』_叫;,·",也0,其中= 對應(yīng)子集 k υ···υλ·;丨C &丨計算得出的類另Ij,dn〇w,r+1』對應(yīng)(X1Ux2U…Uxl} =Z1+1計算得出的類別; 2) 距離向量(mi, . . . ,mi),其中mi: i = 1, . . · , 1表示zi+i到Zi的多因素 Hausdorff距離: (z/+l 'zi) ' 3) 距離向量(m'i,…,m'i),其中m'i:i = l,…,1表示Zi到zi+i的多因素 Hausdorff距離: 步驟二,初始化:對距離nu賦零初值,并計算多因素 Hausdorff距離矩陣Mi,i, ·…,Mi,k-1 的和,定;步驟三,對測試樣本zi + 1= {xi U X2 U…U xL}中的Xj: j = I,. . .,L和訓練樣本序列 (Z1,. . .,Z1)中的Zl:i = l,. . .,1重復進行如下異常檢測過程: 1) 通過計算多因素 HausdorfT距離對ΠΗ的取值進行更新; 2) 對Q內(nèi)的元素進行更新; 3) 通過計算多因素 Hausdorff距離對m'i的取值進行更新; 4) 根據(jù)距離V1與距離M1,k的取值大小,對不一致度量〇1的取值進行更新; 5) 從Q中提取當前的k個距離值,并通過對這k個距離值的求和對不一致度量α1+1的取值 進行更新; 6) 計算ρι+ι取值; 7) 進行閾值ε判別,對當前測試樣本的異常情況進行檢測更新; 步驟四,當測試樣本ζ1+1的每個數(shù)據(jù)點Χ1,Χ2,…,a都異常檢測完成后,輸出異常指示變 量和距離向量,將zi+i添加到訓練樣本序列(zi, . . .,ζι)中,將訓練樣本序列更新為(zi,..., Z1+1); 步驟五,對多因素 Hausdorff距離矩陣M進行更新; 步驟六,更新后的訓練樣本序列(Z1, ...,z1+1)和更新后的多因素 Hausdorff距離矩陣M 作為新的輸入變量,對測試樣本ζι+2進行異常檢測。2. 根據(jù)權(quán)利要求1所述的基于多因素不一致度量的異常行為序貫檢測方法,其特征在 于, 步驟二中多因素 Hausdorff距離的具體定義如下: 1) 考慮兩個目標的位置信息、速度信息和運動方向信息,兩個目標之間的多因素距離 定義為: mfdist(a,b) =Wd · dist(a,b)+wv · Va-Vb | +we · 0a-0b 其中va,Vb表示點a與點b的速度信息,0a,0b表示點a與點b的運動方向信息,Wd表示位置 信息的權(quán)重因子,Wv表示速度信息的權(quán)重因子,訓表示運動方向信息的權(quán)重因子,權(quán)重因子 的取值取決于多因素距離的應(yīng)用場景; 2) 基于多因素距離mfdist(a,b),A到B的多因素 Hausdorff距離定義為:A與B為兩個樣本序列。3.根據(jù)權(quán)利要求1所述的基于多因素不一致度量的異常行為序貫檢測方法,其特征在 于, 步驟三具體為: 1) 根據(jù)多因素 Hausdorff?距離的定義,對Hi1的取值進行更新:2) 對Q內(nèi)的元素進行更新: 如果Q內(nèi)的元素個數(shù)小于近鄰數(shù)量k,則將當前的m取值插入到Q中,如果Q內(nèi)存有k個距 離值,并且當前的πη小于Q中的最大距離值,則刪除Q中的最大距離值,將當前Hi1取值插入到Q 中; 3) 根據(jù)多因素 Hausdorff?距離的定義,對!!^的取值進行更新:4) 根據(jù)距離V1與距離M1,k的取值大小,對不一致度量〇1的取值進行更新: 如果:m'i〈Mi,k, ai = Vi+m,i 否則, ai = vi+Mi,k cii的具體定義為:給定一個樣本序列{ζι, . . . ,zn} ,Z1 :〗=1.,....,、《_代表空間1?(1中的一 個非空點集,樣本Z1到集合{Z1,...,Zn}\Zl的多因素不一致度量Ct 1可以定義為:其中NN(Zi, {zi, . . .,zn}\zi, j) e {zi, . . .,zn}\zi表示根據(jù)定義的多因素 Hausdorff距離 計算得出的距離21第」近的樣本; 5) 從Q中提取當前的k個距離值,對不一致度量α1+1的取值進行更新: 6) 計算ρι+ι取值:[[{i = l, · · ·,1+1:α0α1+1}]]表示集合{i = l, · · ·,1+1:α0α1+1}中元素的數(shù)量; 7)進行閾值ε判別,對當前測試樣本的異常情況進行檢測更新: 如果ρι+ι〈ε, 否則,其中,= 1代表檢測結(jié)果為異常行為,= O代表檢測結(jié)果為正常行為。4.根據(jù)權(quán)利要求1所述的基于多因素不一致度量的異常行為序貫檢測方法,其特征在 于,步驟五具體為: 1) 多因素 Hausdorff距離矩陣M的第1行到第1行,根據(jù)輸出的距離向量(m、,...,m'〇進 行更新; 2) 將輸出的距離向量(im,...,πη)作為最后一行增加到多因素 Hausdorff距離矩陣M中。
【文檔編號】G06K9/62GK105894014SQ201610186905
【公開日】2016年8月24日
【申請日】2016年3月29日
【發(fā)明人】潘新龍, 王海鵬, 何友, 夏沭濤, 彭煊, 周偉
【申請人】中國人民解放軍海軍航空工程學院