本發(fā)明實施例涉及動態(tài)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種演化異常子圖檢測方法及裝置。
背景技術(shù):
動態(tài)網(wǎng)絡(luò)結(jié)構(gòu)形象的展示了網(wǎng)絡(luò)中對象之間的關(guān)系及事件的演化狀態(tài),如社交網(wǎng)絡(luò)中用戶之間的關(guān)系,電網(wǎng)連接在地理上的分布地區(qū),全球金融系統(tǒng)連接世界各地的銀行等。動態(tài)網(wǎng)絡(luò)較靜態(tài)網(wǎng)絡(luò)主要的不同之處在于,動態(tài)網(wǎng)絡(luò)的結(jié)構(gòu)和節(jié)點屬性是一直變化的。
異常子圖檢測是動態(tài)網(wǎng)絡(luò)中的一個關(guān)鍵的問題。近年來,異常子圖檢測已被廣泛應(yīng)用到各個重要的領(lǐng)域,例如事件檢測,交通擁堵檢測,霧霾檢測,水污染檢測等?,F(xiàn)有技術(shù)中主要于參數(shù)的方法假設(shè)網(wǎng)絡(luò)結(jié)構(gòu)中的節(jié)點(包含異常和非異常的節(jié)點),并且將異常檢測形式化為假設(shè)檢驗問題,該方法的一個常用的建模方式是將頂點之間連接頻率建模為一個計數(shù)過程,并將掃描統(tǒng)計與隱馬爾科夫模型結(jié)合到一起來實現(xiàn)異常子圖的檢測。但是該方法具有其局限性,即不適用于包含非傳統(tǒng)數(shù)據(jù)資源的演化異常子圖檢測。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種演化異常子圖檢測方法及裝置,用以實現(xiàn)基于非參數(shù)掃描統(tǒng)計模型的演化異常子圖檢測。
本發(fā)明實施例第一方面提供一種演化異常子圖檢測方法,該方法包括:
獲取動態(tài)網(wǎng)絡(luò)的非參數(shù)掃描統(tǒng)計模型;
將所述非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的子問題;
根據(jù)預(yù)設(shè)的策略,確定所述多個子問題中每個子問題的最優(yōu)解,以完成所述動態(tài)網(wǎng)絡(luò)中演化異常子圖的檢測,其中,所述演化異常子圖為在時間上具有演化關(guān)系的異常子圖。
本發(fā)明實施例第二方面提供一種演化異常子圖檢測裝置,該裝置包括:
獲取模塊,獲取動態(tài)網(wǎng)絡(luò)的非參數(shù)掃描統(tǒng)計模型;
重構(gòu)模塊,將所述非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的子問題;
檢測模塊,根據(jù)預(yù)設(shè)的策略,確定所述多個子問題中每個子問題的最優(yōu)解,以完成所述動態(tài)網(wǎng)絡(luò)中演化異常子圖的檢測,其中,所述演化異常子圖為在時間上具有演化關(guān)系的異常子圖。
本發(fā)明實施例,通過將獲取到的非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的便于解決的子問題,再根據(jù)預(yù)設(shè)的策略分別求取每個子問題的最優(yōu)解,從而實現(xiàn)基于非參數(shù)掃描統(tǒng)計模型的演化異常子圖檢測。本發(fā)明實施例在非參數(shù)掃描統(tǒng)計模型的基礎(chǔ)上對動態(tài)網(wǎng)絡(luò)的演化異常子圖進行檢測,具有較高的準確性,另外,由于本發(fā)明實施例中是將非參數(shù)掃描統(tǒng)計模型的NP-Hard問題重構(gòu)為多個等價的便于解決的子問題,再根據(jù)預(yù)設(shè)的策略分別求取每個子問題的最優(yōu)解,從而大大縮短了檢測時間,提高了檢測效率。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實施例提供的演化異常子圖檢測方法的流程示意圖;
圖2為本發(fā)明一實施例提供的步驟102的執(zhí)行方法流程圖;
圖3為本發(fā)明一實施例提供的演化異常子圖檢測裝置的結(jié)構(gòu)示意圖;
圖4為本發(fā)明一實施例提供的重構(gòu)模塊12的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明的說明書和權(quán)利要求書的術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟的過程或結(jié)構(gòu)的裝置不必限于清楚地列出的那些結(jié)構(gòu)或步驟而是可包括沒有清楚地列出的或?qū)τ谶@些過程或裝置固有的其它步驟或結(jié)構(gòu)。
圖1為本發(fā)明一實施例提供的演化異常子圖檢測方法的流程示意圖,該方法能夠由一演化異常子圖檢測裝置來執(zhí)行,該裝置可以是獨立的硬件實體,也可以是安裝在獨立硬件實體中的可執(zhí)行程序。如圖1所示,該方法包括如下步驟:
步驟101、獲取動態(tài)網(wǎng)絡(luò)對應(yīng)的非參數(shù)掃描統(tǒng)計模型。
可選的,本實施例中所稱的非參數(shù)掃描統(tǒng)計模型可以是預(yù)先存儲在數(shù)據(jù)庫等存儲空間中的,也可以是用戶通過人機交互界面輸入的。當進行演化異常子圖檢測時演化異常子圖檢測裝置從指定的存儲空間或人機交互界面上獲取用于檢測的非參數(shù)掃描統(tǒng)計模型,這里需要說明的是,本實施例中所涉及的演化異常子圖是在時間上具有演化關(guān)系的異常子圖,比如,在預(yù)設(shè)時間長度內(nèi)的每一時刻上都獲取一個異常子圖,則這些在時間上具有關(guān)聯(lián)性的異常子圖稱為演化異常子圖。
可選的,為了對動態(tài)網(wǎng)絡(luò)中的演化異常子圖進行高效的檢測,并確定最異常子圖,本實施例中可將非參數(shù)掃描統(tǒng)計模型的表達式定義為:
且該表達式滿足條件:
θ(Ω)≤A,N(Ω)≤K
其中,θ(Ω)為相鄰時刻演化異常子圖Ω的變化次數(shù),A為預(yù)設(shè)的所述變化次數(shù)的上限值,K為演化異常子圖中節(jié)點基數(shù)的上限值,N(Ω)為所述演化異常子圖中實際的節(jié)點數(shù),Nα(Ω)為在置信水平α的前提下所述演化異常子圖中異常節(jié)點的個數(shù)。
在圖1中,還包括步驟102、將所述非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的子問題。
圖2為本發(fā)明一實施例提供的步驟102的執(zhí)行方法流程圖,如圖2所示,步驟102包括如下子步驟:
步驟201、將所述非參數(shù)掃描統(tǒng)計模型形式化為對應(yīng)的演化異常子圖檢測模型。
可選的,本實施例中可以將上述非參數(shù)掃描統(tǒng)計模型的表達式形式化為表達形式為:
的演化異常子圖檢測模型,且所述演化異常子圖檢測模型滿足條件:
θ(Ω)≤A,N(Ω)≤K
其中,U(V#,αmax)為V#中假定值小于置信水平最大值αmax的α的集合。V#為所述演化異常子圖中所有節(jié)點的集合。
在圖2中,還包括步驟202、根據(jù)所述演化異常子圖檢測模型,將所述非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的子問題。
實際應(yīng)用中,動態(tài)網(wǎng)絡(luò)中非參數(shù)掃描統(tǒng)計的分析是極為復(fù)雜的,因為其包括一個非線性目標函數(shù),并存在不可避免的NP-hard問題等。鑒于此,可選的,本實施例將該優(yōu)化問題重構(gòu)為一系列的M-預(yù)算子問題:
令上述演化異常子圖檢測模型可以被重構(gòu)為:
且重構(gòu)后的表達式滿足條件:
特別的,該M-預(yù)算子問題可以定義為:
且滿足條件:
θ(Ω)≤A,N(Ω)≤K
其中,為M-預(yù)算子問題待求的最優(yōu)解。
在圖1中,還包括步驟103、根據(jù)預(yù)設(shè)的策略,確定所述多個子問題中每個子問題的最優(yōu)解,以完成所述動態(tài)網(wǎng)絡(luò)中演化異常子圖的檢測。
可選的,本實施例中分別對每個子問題進行拉格朗日松弛、樹形先驗近似以及動態(tài)規(guī)劃處理,從而根據(jù)所述處理的結(jié)果,確定每個子問題的最優(yōu)解。
其中,本實施例中所涉及的拉格朗日松弛處理方法、樹形先驗近似方法以及動態(tài)規(guī)劃方法均與現(xiàn)有技術(shù)類似,在這里不再贅述。
本實施例,通過將獲取到的非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的便于解決的子問題,再根據(jù)預(yù)設(shè)的策略分別求取每個子問題的最優(yōu)解,從而實現(xiàn)基于非參數(shù)掃描統(tǒng)計模型的演化異常子圖檢測。本實施例在非參數(shù)掃描統(tǒng)計模型的基礎(chǔ)上對動態(tài)網(wǎng)絡(luò)的演化異常子圖進行檢測,具有較高的準確性,另外,由于本發(fā)明實施例中是將非參數(shù)掃描統(tǒng)計模型的NP-Hard問題重構(gòu)為多個等價的便于解決的子問題,再根據(jù)預(yù)設(shè)的策略分別求取每個子問題的最優(yōu)解,從而大大縮短了檢測時間,提高了檢測效率。
圖3為本發(fā)明一實施例提供的演化異常子圖檢測裝置的結(jié)構(gòu)示意圖,如圖3所示,該裝置包括:
獲取模塊11,獲取動態(tài)網(wǎng)絡(luò)的非參數(shù)掃描統(tǒng)計模型;
重構(gòu)模塊12,將所述非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的子問題;
檢測模塊13,根據(jù)預(yù)設(shè)的策略,確定所述多個子問題中每個子問題的最優(yōu)解,以完成所述動態(tài)網(wǎng)絡(luò)中演化異常子圖的檢測,其中,所述演化異常子圖為在時間上具有演化關(guān)系的異常子圖。
可選的,所述非參數(shù)掃描統(tǒng)計模型的表達式為:
且表達式滿足條件:
θ(Ω)≤A,N(Ω)≤K
其中,θ(Ω)為相鄰時刻演化異常子圖的變化次數(shù),A為預(yù)設(shè)的所述變化次數(shù)的上限值,K為演化異常子圖中節(jié)點基數(shù)的上限值,N(Ω)為所述演化異常子圖中實際的節(jié)點數(shù),Nα(Ω)為在置信水平α的前提下所述演化異常子圖中異常節(jié)點的個數(shù)。
可選的,所述檢測模塊13,對每個子問題進行拉格朗日松弛、樹形先驗近似以及動態(tài)規(guī)劃處理,從而根據(jù)所述處理的結(jié)果,確定每個子問題的最優(yōu)解。
本實施例提供的裝置能夠用于執(zhí)行圖1所示的技術(shù)方案,其執(zhí)行方式和有益效果類似,在這里不再贅述。
圖4為本發(fā)明一實施例提供的重構(gòu)模塊12的結(jié)構(gòu)示意圖,如圖4所示,在圖3的基礎(chǔ)上,重構(gòu)模塊12包括:
形式化子模塊121,將所述非參數(shù)掃描統(tǒng)計模型形式化為對應(yīng)的演化異常子圖檢測模型;
重構(gòu)子模塊122,根據(jù)所述演化異常子圖檢測模型,將所述非參數(shù)掃描統(tǒng)計模型的NP-Hard問題,重構(gòu)為多個等價的子問題。
可選的,所述形式化子模塊121,將所述非參數(shù)掃描統(tǒng)計模型形式化為表達形式為:
的演化異常子圖檢測模型,且所述演化異常子圖檢測模型滿足條件:
θ(Ω)≤A,N(Ω)≤K
其中,U(V#,αmax)為V#中假定值小于置信水平最大值αmax的α的集合。V#為所述演化異常子圖中所有節(jié)點的集合。
本實施例提供的裝置能夠用于執(zhí)行圖2所示的技術(shù)方案,其執(zhí)行方式和有益效果類似,在這里不再贅述。
最后需要說明的是,本領(lǐng)域普通技術(shù)人員可以理解上述實施例方法中的全部或者部分流程,是可以通過計算機程序來指令相關(guān)的硬件完成,所述的程序可存儲于一計算機可讀存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可以為磁盤、光盤、只讀存儲記憶體(ROM)或隨機存儲記憶體(RAM)等。
本發(fā)明實施例中的各個功能單元可以集成在一個處理模塊中,也可以是各個單元單獨的物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn),并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀存儲介質(zhì)中。上述提到的存儲介質(zhì)可以是只讀存儲器、磁盤或光盤等。
以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分或者全部技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。