時(shí)間序列上事件檢測(cè)方法和裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種時(shí)間序列上事件檢測(cè)方法和裝置,涉及智能管道領(lǐng)域。通過(guò)將事件長(zhǎng)度的搜索區(qū)間L分段,對(duì)于每一分段(p,q),計(jì)算sp、sq和s(p...q),如果其中一段的s(p...q)小于其他任一段的sp或sq,將該段剪除,將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除,直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件,整個(gè)事件檢測(cè)過(guò)程中不需要先驗(yàn)知識(shí),實(shí)現(xiàn)了事件窗口寬度的自動(dòng)適配,可以避免由此導(dǎo)致的錯(cuò)認(rèn)或丟失事件,剪除一些分段,縮減事件搜索區(qū)間,降低了檢測(cè)算法的復(fù)雜度。
【專(zhuān)利說(shuō)明】時(shí)間序列上事件檢測(cè)方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能管道領(lǐng)域,特別涉及一種時(shí)間序列上事件檢測(cè)方法和裝置。
【背景技術(shù)】
[0002]時(shí)間序列是對(duì)某一對(duì)象的某一屬性按統(tǒng)一的時(shí)間間隔不斷采樣形成的序列。例如:某網(wǎng)絡(luò)端口每天正午的瞬時(shí)流量構(gòu)成時(shí)間序列。
[0003]非正式的說(shuō),時(shí)間序列上的事件檢測(cè)是指檢測(cè)出時(shí)間序列上的“波峰”,“波峰”稱(chēng)為“事件”,“波峰”說(shuō)明在這一時(shí)間段的序列值明顯高于正常,通常是某些特殊事件導(dǎo)致的。例如:網(wǎng)絡(luò)流量序列上的事件可能源自洪泛攻擊。
[0004]為了在檢測(cè)事件時(shí)排除噪音(如孤立點(diǎn))的影響,目前主要采用分段求和或定寬的窗口平滑技術(shù)。這兩種技術(shù)有以下問(wèn)題,可能造成錯(cuò)認(rèn)或丟失事件:1)分段或窗口的長(zhǎng)度設(shè)定需要先驗(yàn)知識(shí);2)閾值的設(shè)定需要先驗(yàn)知識(shí);3)不同長(zhǎng)度的事件間缺乏統(tǒng)一的比較標(biāo)準(zhǔn);4 )滑動(dòng)窗口法會(huì)模糊事件的邊界。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例所要解決的一個(gè)技術(shù)問(wèn)題是:解決傳統(tǒng)事件檢測(cè)技術(shù)需要先驗(yàn)知識(shí),以及由于先驗(yàn)知識(shí)偏差所造成的錯(cuò)認(rèn)事件或丟失事件的問(wèn)題。
[0006]本發(fā)明實(shí)施例所要解決的另一個(gè)技術(shù)問(wèn)題是:解決不同長(zhǎng)度的事件間缺乏統(tǒng)一的比較標(biāo)準(zhǔn)的問(wèn)題。
[0007]本發(fā)明實(shí)施例的一個(gè)方面提供了一種時(shí)間序列上事件檢測(cè)方法,包括:將事件長(zhǎng)度的搜索區(qū)間L分段,其中,L = (P,P + 1,P + 2,…,Q),P表示事件長(zhǎng)度的最小值,Q表示事件長(zhǎng)度的最大值;對(duì)于分段得到的每一段(P,q),計(jì)算sp、s,和S(p...q),其中,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度,s,表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度,S(p...q)表示分段(P,q)對(duì)應(yīng)的最大的重要程度;如果其中一段的S(p...q)小于其他任一段的Sp或S,,將該段剪除;將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除;直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件Ds。
[0008]所述對(duì)于分段得到的每一段(p,q),計(jì)算Sp包括:分別計(jì)算長(zhǎng)度為ρ的所有子序列的和,長(zhǎng)度為P的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為P的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的
標(biāo)準(zhǔn)差;根據(jù)公式& =(d; -&)/&計(jì)算Sp,其中表示長(zhǎng)度為P的子序列中和的最大值,
μ ρ表示長(zhǎng)度為P的子序列的正態(tài)分布的均值,σ ρ表示長(zhǎng)度為ρ的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度。
[0009] 所述對(duì)于分段得到的每一段(p,q),計(jì)算Sq包括:分別計(jì)算長(zhǎng)度為q的所有子序列的和,長(zhǎng)度為q的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為q的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的
標(biāo)準(zhǔn)差;根據(jù)公式&計(jì)算V其中JJ表示長(zhǎng)度為q的子序列中和的最大值,
μ q表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度。
[0010]所述對(duì)于分段得到的每一段(P,q),計(jì)算Sn包括:根據(jù)公式
Sip 9) = (^-十算:S(p...q),其中,%表示長(zhǎng)度為q的子序列中和的最大值,Uq表示長(zhǎng)
度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,s(p...q)表示分段(P,q)對(duì)應(yīng)的最大的重要程度。
[0011]所述記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度包括:對(duì)于事件長(zhǎng)度為k的點(diǎn),分別計(jì)算長(zhǎng)度為k的所有子序列的和,將長(zhǎng)度為k的所有子序列的和的最大值作為重要事件長(zhǎng)度為k的子序列的和符合正態(tài)分布,選擇部分長(zhǎng)度為k的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式4 =(/?計(jì)算Sk,其中,D/表示長(zhǎng)度為k的子序列中和的最大值,μ k表示長(zhǎng)度為k的子序列的正態(tài)分布的均值,O k表示長(zhǎng)度為k的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sk表示長(zhǎng)度為k的子序列中重要事件£?〖的重要程度。
[0012]時(shí)間序列上事件檢測(cè)方法還包括:將全局重要事件Ds對(duì)應(yīng)的點(diǎn)從原始時(shí)間序列中剪除,在剩余的時(shí)間序列上采用全局重要事件Ds的檢測(cè)方法檢出第二個(gè)全局重要事件,直到所有的全局重要事件都被檢出。
[0013]本發(fā)明實(shí)施例的另一個(gè)方面提供了一種時(shí)間序列上事件檢測(cè)裝置,包括:分段單元,用于將事件長(zhǎng)度的搜索區(qū)間L分段,其中,L = (P,P + 1,P + 2,…,Q),P表示事件長(zhǎng)度的最小值,Q表示事件長(zhǎng)度的最大值;重要性確定單元,用于對(duì)于分段得到的每一段(P,q),計(jì)算sp、s,和S(p...q),其中,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度,s(p...q)表示分段(p,q)對(duì)應(yīng)的最大的重要程度;剪除單元,用于如果其中一段的s(p...q)小于其他任一段的Sp或s,,將該段剪除;遞歸單元,用于將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除;檢測(cè)單元,用于直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件Ds。
[0014]所述重要性確定單元包括用于計(jì)算Sp的第一確定子單元,用于分別計(jì)算長(zhǎng)度為P的所有子序列的和,長(zhǎng)度為P的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為P的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為
正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式\ =計(jì)算Sp,其中,D-表不長(zhǎng)度為P的子序列中和
的最大值,μ ρ表示長(zhǎng)度為P的子序列的正態(tài)分布的均值,σ ρ表示長(zhǎng)度為ρ的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度。
[0015] 所述重要性確定單元包括用于計(jì)算Sq的第二確定子單元,用于分別計(jì)算長(zhǎng)度為q的所有子序列的和,長(zhǎng)度為q的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為q的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式\ =(ζ);計(jì)算S,,其中,Dg表示長(zhǎng)度為q的子序列中和
的最大值,μ q表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度。
[0016]所述重要性確定單元包括用于計(jì)算s(p...q)的第三確定子單元,用于根據(jù)公式
-&)/%計(jì)算s(p...q),其中,%表示長(zhǎng)度為q的子序列中和的最大值,μ ,表示長(zhǎng)
度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,s(p...q)表示分段(P,q)對(duì)應(yīng)的最大的重要程度。
[0017]所述檢測(cè)單元,具體用于對(duì)于事件長(zhǎng)度為k的點(diǎn),分別計(jì)算長(zhǎng)度為k的所有子序列的和,將長(zhǎng)度為k的所有子序列的和的最大值作為重要事件£>:;長(zhǎng)度為k的子序列的和符合正態(tài)分布,選擇部分長(zhǎng)度為k的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式4=(/?-%)/%計(jì)算Sk,其中A表示長(zhǎng)度為k的子序列中和的最大值,μ,表示長(zhǎng)度為k的子序列的正態(tài)分布的均值,σ k表示長(zhǎng)度為k的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sk表示長(zhǎng)度為k的子序列中重要事件£>|的重要程度。
[0018]所述檢測(cè)單元還用于:將全局重要事件Ds對(duì)應(yīng)的點(diǎn)從原始時(shí)間序列中剪除,在剩余的時(shí)間序列上采用全局重要事件Ds的檢測(cè)方法檢出第二個(gè)全局重要事件,直到所有的全局重要事件都被檢出。
[0019]本發(fā)明通過(guò)將事件長(zhǎng)度的搜索區(qū)間L分段,對(duì)于分段得到的每一段(p,q),計(jì)算sp、sq和S(p...q),如果其中一段的S(p...q)小于其他任一段的\或\,將該段剪除,將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除,直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件,整個(gè)事件檢測(cè)過(guò)程中不需要先驗(yàn)知識(shí),實(shí)現(xiàn)了事件窗口寬度的自動(dòng)適配,可以避免由此導(dǎo)致的錯(cuò)認(rèn)事件或丟失事件;并且剪除一些不可能包含全局重要事件的段,縮減事件長(zhǎng)度的搜索區(qū)間,在提高精確度的同時(shí)降低了檢測(cè)算法的復(fù)雜度,在最好情況下能將檢出最重要事件的算法復(fù)雜度從常數(shù)級(jí)降到對(duì)數(shù)級(jí)。另外,用偏離均值的程度做不同長(zhǎng)度事件之間統(tǒng)一的重要性評(píng)價(jià)標(biāo)準(zhǔn),從而統(tǒng)一了事件重要性的量化標(biāo)準(zhǔn)。
[0020]通過(guò)以下參照附圖對(duì)本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其優(yōu)點(diǎn)將會(huì)變得清楚。
【專(zhuān)利附圖】
【附圖說(shuō)明】[0021]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0022]圖1為本發(fā)明時(shí)間序列上事件檢測(cè)方法一個(gè)實(shí)施例的流程示意圖。
[0023]圖2為本發(fā)明時(shí)間序列上事件檢測(cè)方法一個(gè)實(shí)例的示意圖。
[0024]圖3為本發(fā)明時(shí)間序列上事件檢測(cè)裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。[0025]圖4為本發(fā)明時(shí)間序列上事件檢測(cè)裝置另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0026]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說(shuō)明性的,決不作為對(duì)本發(fā)明及其應(yīng)用或使用的任何限制?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0027]除非另外具體說(shuō)明,否則在這些實(shí)施例中闡述的部件和步驟的相對(duì)布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。
[0028]同時(shí),應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個(gè)部分的尺寸并不是按照實(shí)際的比例關(guān)系繪制的。
[0029]對(duì)于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說(shuō)明書(shū)的一部分。
[0030]在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它示例可以具有不同的值。
[0031]應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類(lèi)似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步討論。 [0032]下面對(duì)本發(fā)明所涉及的基本概念、所依據(jù)的基本原理進(jìn)行介紹。
[0033]時(shí)間序列是對(duì)某一對(duì)象的某一屬性按統(tǒng)一的時(shí)間間隔不斷采樣形成的序列。例如:某網(wǎng)絡(luò)端口每天正午的瞬時(shí)流量構(gòu)成時(shí)間序列。
[0034]時(shí)間序列上的事件檢測(cè)是指檢測(cè)出時(shí)間序列上的“波峰”,“波峰”稱(chēng)為“事件”,“波峰”說(shuō)明在這一時(shí)間段的序列值明顯高于正常,通常是某些特殊事件導(dǎo)致的。例如:網(wǎng)絡(luò)流量序列上的事件可能源自洪泛攻擊。
[0035]假設(shè)時(shí)間序列為(屯,d2, d3,...,dn),這個(gè)序列中從m開(kāi)始長(zhǎng)度為k的子序列的和稱(chēng)為Dm, k。對(duì)于給定的長(zhǎng)度k,長(zhǎng)度為k的子序列的和符合正態(tài)分布,該結(jié)論可以根據(jù)獨(dú)立假設(shè)和中心極限定理得到,下面詳細(xì)說(shuō)明。
[0036]根據(jù)中心極限定理(Lindeberg定理),設(shè)有一個(gè)獨(dú)立隨機(jī)變量序列,每個(gè)變量的數(shù)學(xué)期望和方差有限,則這個(gè)序列的和的極限是一個(gè)正態(tài)分布。在實(shí)際應(yīng)用中,數(shù)學(xué)期望和方差有限這件事情顯然成立(無(wú)限只有數(shù)學(xué)上的意義),因此,長(zhǎng)度為k的子序列,上面每個(gè)采樣點(diǎn)都是獨(dú)立的,就是一個(gè)獨(dú)立隨機(jī)變量序列,如果k足夠大,它的和就是正態(tài)分布。因此,由獨(dú)立假設(shè)和中心極限定理可以得出結(jié)論:對(duì)于給定的長(zhǎng)度k,長(zhǎng)度為k的子序列的和Dk符合正態(tài)分布。
[0037]通過(guò)參數(shù)估計(jì)可以獲得該正態(tài)分布的具體參數(shù),具體地,選擇若干個(gè)長(zhǎng)度為k的子序列作為采樣,采樣的均值是該正態(tài)分布的均值μ,采樣的標(biāo)準(zhǔn)差是該正態(tài)分布的標(biāo)準(zhǔn)
差σ ο
[0038]對(duì)于特定的,k,可以算出其偏離均值的程度為S1 k = (D?j k- μ ) σ。與均值偏離越大的子序列,則作為事件越重要。偏離均值的程度可以作為不同長(zhǎng)度事件之間統(tǒng)一的重要性評(píng)價(jià)標(biāo)準(zhǔn)。[0039]限定時(shí)間段長(zhǎng)度為k,則重要事件顯然是D?,k中最大的那個(gè)。為了檢測(cè)出全局重要事件,可以遍歷所有k,記錄每個(gè)k對(duì)應(yīng)的重要事件/^及其重要程度S,所有的/?中最重要的那個(gè)即為全局重要事件Ds。這種方法需要遍歷所有的時(shí)間段長(zhǎng)度,效率顯然不夠高,由此,本發(fā)明提出一種能夠快速地找出全局重要事件Ds的方法,下面詳細(xì)說(shuō)明。
[0040]圖1示出本發(fā)明時(shí)間序列上事件檢測(cè)方法一個(gè)實(shí)施例的流程示意圖。如圖1所示,該實(shí)施例的事件檢測(cè)方法包括:
[0041]步驟101,將事件長(zhǎng)度的搜索區(qū)間L分段。
[0042]其中,L = (P,P + 1,P + 2,…,Q),P表示事件長(zhǎng)度的最小值,Q表示事件長(zhǎng)度的
最大值。
[0043]分段的數(shù)量可以根據(jù)需要設(shè)定,這里不做限制。另外,根據(jù)搜索區(qū)間的范圍和分段的數(shù)量,可以將搜索區(qū)間平均分為若干段,如果不能平均分段,可以將搜索區(qū)間分成長(zhǎng)度大致相等的若干段即可。
[0044]步驟102,對(duì)于分段得到的每一段(p, q),計(jì)算Sp、Sq和s(p...q)。
[0045]其中,Sp表示長(zhǎng)度為ρ的子序列中和最大的子序列的重要程度,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度,S(p...q)表示分段(P,q)對(duì)應(yīng)的最大的重要程度。下面分別說(shuō)明sp、sq和s(p...q)的計(jì)算方法。
[0046]對(duì)于分段(p,q), Sp計(jì)算方法包括:
[0047]分別計(jì)算長(zhǎng)度為ρ的所有子序列的和,根據(jù)獨(dú)立假設(shè)和中心極限定理,長(zhǎng)度為ρ的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為P的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值P p,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差σρ;根
據(jù)公式\,計(jì)算V其中,I)-表示長(zhǎng)度為P的子序列中和的最大值,Up表示長(zhǎng)
度為P的子序列的正態(tài)分布的均值,σ ρ表示長(zhǎng)度為ρ的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度。
[0048]對(duì)于分段(p,q), Sq計(jì)算方法包括:
[0049]分別計(jì)算長(zhǎng)度為q的所有子序列的和,根據(jù)獨(dú)立假設(shè)和中心極限定理,長(zhǎng)度為q的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為q的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值μ,,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差σ?;根
據(jù)公式' =(/?十算V其中,/?表示長(zhǎng)度為q的子序列中和的最大值,P ,表示長(zhǎng)
度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度。
[0050]對(duì)于分段(p,q), s(p...q)計(jì)算方法包括:
[0051]根據(jù)公式%^ = @-仏)/\計(jì)算S(p...q),其中,表示長(zhǎng)度為q的子序列中和的
最大值,μ q表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,O q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,s(p...q)表示分段(p,q)對(duì)應(yīng)的最大的重要程度。
[0052]步驟103,如果其中一段的s(p...q)小于其他任一段的Sp或S,,將該段剪除。
[0053]步驟104,遞歸地將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除,即繼續(xù)分段之后,執(zhí)行步驟102和步驟103。
[0054] 步驟105,直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件Ds。
[0055]其中,搜索區(qū)間小到符合預(yù)設(shè)值,例如可以是搜索區(qū)間包括幾個(gè)或幾十個(gè)點(diǎn),則可以認(rèn)為搜索區(qū)間已經(jīng)足夠小,無(wú)須再繼續(xù)分段。該預(yù)設(shè)值可以自主設(shè)定。
[0056]其中,記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度包括:
[0057]對(duì)于事件長(zhǎng)度為k的點(diǎn),分別計(jì)算長(zhǎng)度為k的所有子序列的和,將長(zhǎng)度為k的所有子序列的和的最大值作為重要事件長(zhǎng)度為k的子序列的和符合正態(tài)分布,選擇部分長(zhǎng)度為k的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式& =(A: -Α)/σ,計(jì)算sk,其中A表示長(zhǎng)度為k的子序列中和的最大值,μ k表示長(zhǎng)度為k的子序列的正態(tài)分布的均值,σ ,表示長(zhǎng)度為k的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sk表示長(zhǎng)度為k的子序列中重要事件1?的重要程度。
[0058]如果全局重要事件不止一個(gè),則還可以執(zhí)行步驟106,檢出其他全局重要事件。
[0059]步驟106,將全局重要事件Ds對(duì)應(yīng)的點(diǎn)從原始時(shí)間序列中剪除,在剩余的時(shí)間序列上采用全局重要事件Ds的檢測(cè)方法檢出第二個(gè)全局重要事件,直到所有的全局重要事件都被檢出。
[0060]下面結(jié)合一個(gè)具體實(shí)例來(lái)說(shuō)明本發(fā)明的事件檢測(cè)方法。圖2示出本發(fā)明時(shí)間序列上事件檢測(cè)方法一個(gè)實(shí)例的示意圖。
[0061]如圖2所示,事件長(zhǎng)度的搜索區(qū)間L = (p,…,q5),將搜索區(qū)間L分為5段,分別為(P,...,ql)、(ql,...,q2)、(q2,...,q3)、(q3,...,q4)、(q4,…,q5)。對(duì)于這 5 段分另1J計(jì)算 sp、sq 和 s(p...q),以(q3,..., q4)為例,計(jì)算 sq3、St^P s(q3...q4)。在圖 2 中,每一分段都對(duì)應(yīng)一個(gè)重要程度“箭頭”,該“箭頭”的下限表示分段兩端點(diǎn)的重要事件的重要程度中的較大值,該“箭頭”的下限表示s(p...q),仍以(q3,…,q4)為例,“箭頭”的下限表示Sq3和Sq4中的較大值,“箭頭”的下限表示S(q3...,4)。在圖2中,虛線表示這5段中“箭頭”下限最大的那個(gè),即(q2,…,q3)段重要事件的下限。如圖2所示,(p,...,ql)、(ql,…,q2)和(q4,…,q5)這3個(gè)分段的s(p...q)小于(q2,…,q3)的Sq3或Sq3 (即“箭頭”下限),因此,將這3段剪除,僅在剩余的(q2,…,q3)和(q3,…,q4)這兩段進(jìn)行全局重要事件的檢測(cè)。如果剩余的搜索區(qū)間已經(jīng)足夠小,則可以遍歷(q2,…,q4 )之間的點(diǎn),檢出全局重要事件,如果剩余的搜索區(qū)間不足夠小,則可以繼續(xù)分段,并進(jìn)行剪除的操作,這里不再贅述。
[0062] 在上述實(shí)施例中,通過(guò)將事件長(zhǎng)度的搜索區(qū)間L分段,對(duì)于分段得到的每一段(P,q),計(jì)算sp、s,和S(p...q),如果其中一段的S(p...q)小于其他任一段的Sp或s,,將該段剪除,將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除,直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件,整個(gè)事件檢測(cè)過(guò)程中不需要先驗(yàn)知識(shí),實(shí)現(xiàn)了事件窗口寬度的自動(dòng)適配,可以避免由此導(dǎo)致的錯(cuò)認(rèn)事件或丟失事件;并且剪除一些不可能包含全局重要事件的段,縮減事件長(zhǎng)度的搜索區(qū)間,在提高精確度的同時(shí)降低了檢測(cè)算法的復(fù)雜度,在最好情況下能將檢出最重要事件的算法復(fù)雜度從常數(shù)級(jí)降到對(duì)數(shù)級(jí)。另外,用偏離均值的程度做不同長(zhǎng)度事件之間統(tǒng)一的重要性評(píng)價(jià)標(biāo)準(zhǔn),從而統(tǒng)一了事件重要性的量化標(biāo)準(zhǔn)。[0063]圖3示出本發(fā)明時(shí)間序列上事件檢測(cè)裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
[0064]如圖3所示,該事件檢測(cè)裝置包括:
[0065]分段單元301,用于將事件長(zhǎng)度的搜索區(qū)間L分段,其中,L = (P,P+ 1,P +2,…,Q), P表示事件長(zhǎng)度的最小值,Q表示事件長(zhǎng)度的最大值;
[0066]重要性確定單元302,用于對(duì)于分段得到的每一段(p,q),計(jì)算sp、s,和S(p...q),其中,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度,s(p...q)表示分段(p,q)對(duì)應(yīng)的最大的重要程度;
[0067]剪除單元303,用于如果其中一段的s(p...q)小于其他任一段的Sp或S,,將該段剪除;
[0068]遞歸單元304,用于將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除;
[0069]檢測(cè)單元305,用于直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件Ds。
[0070]圖4示出本發(fā)明時(shí)間序列上事件檢測(cè)裝置另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。 [0071]如圖4所示,重要性確定單元302包括用于計(jì)算Sp的第一確定子單元3021,用于分別計(jì)算長(zhǎng)度為P的所有子序列的和,長(zhǎng)度為P的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為P的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將
采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式&計(jì)算Sp,其中,Z^表示長(zhǎng)
度為P的子序列中和的最大值,μ p表示長(zhǎng)度為P的子序列的正態(tài)分布的均值,σρ表示長(zhǎng)度為P的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度。
[0072]如圖4所示,重要性確定單元302包括用于計(jì)算Sq的第二確定子單元3022,用于分別計(jì)算長(zhǎng)度為q的所有子序列的和,長(zhǎng)度為q的子序列的和符合正態(tài)分布;選擇部分長(zhǎng)度為q的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將
采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式&計(jì)算V其中,Df表示長(zhǎng)
度為q的子序列中和的最大值,P,表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,Oq表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度。
[0073]如圖4所示,重要性確定單元302包括用于計(jì)算s (p...的第三確定子單元3023,用
于根據(jù)公式%1) = (ρ:計(jì)算s(p...,其中,g表示長(zhǎng)度為q的子序列中和的最大值,
μ q表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,s(,..q)表示分段(P,q)對(duì)應(yīng)的最大的重要程度。
[0074]檢測(cè)單元305,具體用于對(duì)于事件長(zhǎng)度為k的點(diǎn),分別計(jì)算長(zhǎng)度為k的所有子序列的和,將長(zhǎng)度為k的所有子序列的和的最大值作為重要事件從,長(zhǎng)度為k的子序列的和符合正態(tài)分布,選擇部分長(zhǎng)度為k的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式% =?'/),.:計(jì)算Sk,其中,2?表示長(zhǎng)度為k的子序列中和的最大值,Uk表示長(zhǎng)度為k的子序列的正態(tài)分布的均值,σ k表示長(zhǎng)度為k的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sk表示長(zhǎng)度為k的子序列中重要事件的重要程度。
[0075]檢測(cè)單元305還用于:將全局重要事件Ds對(duì)應(yīng)的點(diǎn)從原始時(shí)間序列中剪除,在剩余的時(shí)間序列上采用全局重要事件Ds的檢測(cè)方法檢出第二個(gè)全局重要事件,直到所有的全局重要事件都被檢出。
[0076]在上述實(shí)施例中,通過(guò)將事件長(zhǎng)度的搜索區(qū)間L分段,對(duì)于分段得到的每一段(P,q),計(jì)算sp、s,和S(p...q),如果其中一段的S(p...q)小于其他任一段的Sp或s,,將該段剪除,將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除,直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件,整個(gè)事件檢測(cè)過(guò)程中不需要先驗(yàn)知識(shí),實(shí)現(xiàn)了事件窗口寬度的自動(dòng)適配,可以避免由此導(dǎo)致的錯(cuò)認(rèn)事件或丟失事件;并且剪除一些不可能包含全局重要事件的段,縮減事件長(zhǎng)度的搜索區(qū)間,在提高精確度的同時(shí)降低了檢測(cè)算法的復(fù)雜度,在最好情況下能將檢出最重要事件的算法復(fù)雜度從常數(shù)級(jí)降到對(duì)數(shù)級(jí)。另外,用偏離均值的程度做不同長(zhǎng)度事件之間統(tǒng)一的重要性評(píng)價(jià)標(biāo)準(zhǔn),從而統(tǒng)一了事件重要性的量化標(biāo)準(zhǔn)。
[0077]本發(fā)明適用于所有時(shí)間序列上的事件檢測(cè)應(yīng)用,如網(wǎng)絡(luò)流量實(shí)時(shí)監(jiān)測(cè),網(wǎng)絡(luò)攻擊告警等,也可應(yīng)用于時(shí)間序列歷史數(shù)據(jù)的分析,如IPTV傳輸服務(wù)質(zhì)量分析,網(wǎng)絡(luò)輿情分析等。以網(wǎng)絡(luò)輿情分析為例,通過(guò)統(tǒng)計(jì)某個(gè)關(guān)鍵詞每小時(shí)/每天被搜索的次數(shù),形成一個(gè)時(shí)間序列,判斷這個(gè)序列上有沒(méi)有足夠重要的事件,由此判斷這個(gè)關(guān)鍵詞描述的問(wèn)題是否構(gòu)成一個(gè)熱點(diǎn)。設(shè)有兩個(gè)已知是熱點(diǎn)的關(guān)鍵詞,例如“營(yíng)養(yǎng)午餐”和“經(jīng)濟(jì)危機(jī)”,前者在高峰時(shí)期每日被搜索百萬(wàn)次 ,但只持續(xù)了三個(gè)月,而后者雖然峰值時(shí)也只有十萬(wàn)次級(jí)別的搜索,但持續(xù)了數(shù)年,本發(fā)明可以判斷出兩者哪個(gè)在統(tǒng)計(jì)意義上更加重要,并能量化兩者的重要性差異。
[0078]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
[0079]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種時(shí)間序列上事件檢測(cè)方法,包括: 將事件長(zhǎng)度的搜索區(qū)間L分段,其中,L =(P,P + Ι,Ρ + 2,…,Q),P表示事件長(zhǎng)度的最小值,Q表示事件長(zhǎng)度的最大值; 對(duì)于分段得到的每一段(P,q),計(jì)算sp、s,和S(p...q),其中,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度,s(p...q)表示分段(P,q)對(duì)應(yīng)的最大的重要程度; 如果其中一段的S(p...q)小于其他任一段的Sp或S,,將該段剪除; 將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除; 直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件Ds。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)于分段得到的每一段(P,q),計(jì)算Sp包括: 分別計(jì)算長(zhǎng)度為P的所有子序列的和,長(zhǎng)度為P的子序列的和符合正態(tài)分布; 選擇部分長(zhǎng)度為P的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差; 根據(jù)公式&計(jì)算Sp,其中D表示長(zhǎng)度為P的子序列中和的最大值,μρ表示長(zhǎng)度為P的子序列的正態(tài)分布的均值,σ ρ表示長(zhǎng)度為P的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)于分段得到的每一段(P,q),計(jì)算Sq包括: 分別計(jì)算長(zhǎng)度為q的所有子序列的和,長(zhǎng)度為q的子序列的和符合正態(tài)分布; 選擇部分長(zhǎng)度為q的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差; 根據(jù)公式Sq 二 (D; -&)/%計(jì)算S,,其中,/?表示長(zhǎng)度為q的子序列中和的最大值,μ ,表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)于分段得到的每一段(P,q),計(jì)算S(P...q)包括: 根據(jù)公式1.9) = (/^-計(jì)算s(p...q),其中,q表示長(zhǎng)度為q的子序列中和的最大值,μ q表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,O q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,s(p...q)表示分段(p,q)對(duì)應(yīng)的最大的重要程度。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度包括: 對(duì)于事件長(zhǎng)度為k的點(diǎn),分別計(jì)算長(zhǎng)度為k的所有子序列的和,將長(zhǎng)度為k的所有子序列的和的最大值作為重要事件^^ ;長(zhǎng)度為k的子序列的和符合正態(tài)分布,選擇部分長(zhǎng)度為k的子序列作為米樣,計(jì)算米樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差; 根據(jù)公式\ =(das-/UM.計(jì)算sk,其中,D丨表示長(zhǎng)度為k的子序列中和的最大值,μ#示長(zhǎng)度為k的子序列的正態(tài)分布的均值,σ k表示長(zhǎng)度為k的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sk表示長(zhǎng)度為k的子序列中重要事件馬的重要程度。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 將全局重 要事件Ds對(duì)應(yīng)的點(diǎn)從原始時(shí)間序列中剪除,在剩余的時(shí)間序列上采用全局重要事件Ds的檢測(cè)方法檢出第二個(gè)全局重要事件,直到所有的全局重要事件都被檢出。
7.一種時(shí)間序列上事件檢測(cè)裝置,包括: 分段單元,用于將事件長(zhǎng)度的搜索區(qū)間L分段,其中,L = (P,P + 1,P + 2,…,Q),P表示事件長(zhǎng)度的最小值,Q表示事件長(zhǎng)度的最大值; 重要性確定單元,用于對(duì)于分段得到的每一段(P,q),計(jì)算sp、Sq和S(p...q),其中,\表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度,s(p...q)表示分段(p,q)對(duì)應(yīng)的最大的重要程度; 剪除單元,用于如果其中一段的s(p...q)小于其他任一段的Sp或s,,將該段剪除; 遞歸單元,用于將剩余的每個(gè)段再繼續(xù)分段,將繼續(xù)分段得到的每一子段采用上述分段的方法繼續(xù)進(jìn)行剪除; 檢測(cè)單元,用于直到事件長(zhǎng)度的剩余搜索區(qū)間小到符合預(yù)設(shè)值,停止分段和剪除的操作,遍歷事件長(zhǎng)度的剩余搜索區(qū)間上的點(diǎn),記錄每一個(gè)點(diǎn)對(duì)應(yīng)的重要事件及其重要程度,所有重要事件中重要程度最大的事件作為全局重要事件Ds。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述重要性確定單元包括用于計(jì)算Sp的第一確定子單兀,用于 分別計(jì)算長(zhǎng)度為P的所有子序列的和,長(zhǎng)度為P的子序列的和符合正態(tài)分布; 選擇部分長(zhǎng)度為P的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差; 根據(jù)公式& =(/?計(jì)算Sp,其中,g表示長(zhǎng)度為P的子序列中和的最大值,μρ表示長(zhǎng)度為P的子序列的正態(tài)分布的均值,σ ρ表示長(zhǎng)度為ρ的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sp表示長(zhǎng)度為P的子序列中和最大的子序列的重要程度。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述重要性確定單元包括用于計(jì)算s,的第二確定子單元,用于 分別計(jì)算長(zhǎng)度為q的所有子序列的和,長(zhǎng)度為q的子序列的和符合正態(tài)分布; 選擇部分長(zhǎng)度為q的子序列作為采樣,計(jì)算采樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式計(jì)算V其中D表示長(zhǎng)度為q的子序列中和的最大值,P,表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sq表示長(zhǎng)度為q的子序列中和最大的子序列的重要程度。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述重要性確定單元包括用于計(jì)算S(p...q)的第三確定子單元,用于根據(jù)公式I =計(jì)算S(p...q),其中A表示長(zhǎng)度為q的子序列中和的最大值,μ q表示長(zhǎng)度為q的子序列的正態(tài)分布的均值,σ q表示長(zhǎng)度為q的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,s(p...q)表示分段(p,q)對(duì)應(yīng)的最大的重要程度。
11.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述檢測(cè)單元,具體用于 對(duì)于事件長(zhǎng)度為k的點(diǎn),分別計(jì)算長(zhǎng)度為k的所有子序列的和,將長(zhǎng)度為k的所有子序列的和的最大值作為重要事件; 長(zhǎng)度為k的子序列的和符合正態(tài)分布,選擇部分長(zhǎng)度為k的子序列作為米樣,計(jì)算米樣的均值和標(biāo)準(zhǔn)差,將采樣的均值作為正態(tài)分布的均值,將采樣的標(biāo)準(zhǔn)差作為正態(tài)分布的標(biāo)準(zhǔn)差;根據(jù)公式\ =(/?-%)/%計(jì)算sk,其中,£)丨表示長(zhǎng)度為k的子序列中和的最大值,4,表示長(zhǎng)度為k的子序列的正態(tài)分布的均值,σ k表示長(zhǎng)度為k的子序列的正態(tài)分布的標(biāo)準(zhǔn)差,Sk表示長(zhǎng)度為k的子序列中重要事件1?的重要程度。
12.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述檢測(cè)單元還用于: 將全局重要事件Ds對(duì)應(yīng)的點(diǎn)從原始時(shí)間序列中剪除,在剩余的時(shí)間序列上采用全局重要事件Ds的檢測(cè)方法檢 出第二個(gè)全局重要事件,直到所有的全局重要事件都被檢出。
【文檔編號(hào)】G06F17/30GK103995808SQ201310051659
【公開(kāi)日】2014年8月20日 申請(qǐng)日期:2013年2月17日 優(yōu)先權(quán)日:2013年2月17日
【發(fā)明者】郁抒思, 姚良, 李一明, 何葉 申請(qǐng)人:中國(guó)電信股份有限公司