欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)分析方法與裝置與流程

文檔序號:11829893閱讀:298來源:國知局
數(shù)據(jù)分析方法與裝置與流程

本發(fā)明涉及無線通信領域,特別是一種數(shù)據(jù)分析方法與裝置。



背景技術:

隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,大數(shù)據(jù)已經(jīng)成為不可逆轉(zhuǎn)的時代潮流。隨著數(shù)據(jù)存儲設備成本的不斷降低,以及數(shù)據(jù)采集方式和渠道的多樣化,越來越多的公司和組織構(gòu)建了自己的數(shù)據(jù)庫,用于存儲海量的用戶數(shù)據(jù)。然而,數(shù)據(jù)的快速積累帶來了信息超載的問題,企業(yè)和用戶真正感興趣的信息被湮沒在大量紛繁復雜的數(shù)據(jù)當中,有用的信息難以被有效的挖掘。數(shù)據(jù)挖掘技術則被認為是當前解決信息超載問題的有效工具之一。通過對海量數(shù)據(jù)的分析和挖掘,可以從中獲取大量有價值的信息,使大數(shù)據(jù)更好的為用戶服務。

目前,序列模式挖掘做為一種對數(shù)據(jù)分析的方式,已經(jīng)逐漸被廣泛應用。序列模式挖掘目的在于尋找海量數(shù)據(jù)庫中頻繁出現(xiàn)的序列模式?,F(xiàn)有的技術需求中,需要對大量的網(wǎng)絡傳輸數(shù)據(jù)報文進行分類,以標記各個傳輸數(shù)據(jù)流對應的網(wǎng)絡協(xié)議。而采用同一協(xié)議傳輸?shù)臄?shù)據(jù),其在數(shù)據(jù)的特定位置會出現(xiàn)相同的特征值。當前對于特定位置和特征值的尋找主要依靠人工專家判定的方式,這樣會花費大量的人力物力。



技術實現(xiàn)要素:

有鑒于此,本發(fā)明提出了一種數(shù)據(jù)分析方法與裝置,用以避免人工對網(wǎng)絡傳輸數(shù)據(jù)進行分類所花費的大量的人力物力。

本發(fā)明一個方面提供一種數(shù)據(jù)分析方法。該方法包括:根據(jù)各原始序列獲取第一序列組,所述第一序列組中包括第一長度的各個第一匹配特征以及各所述第一匹配特征在相應待確定序列中的第一位置,所述第一特征匹配特征對應的支持度大于或等于第一預設支持度,所述待確定序列為在所述第一位置具有所述第一特征匹配特征的原始序列(S1),所述原始序列是采用預設協(xié)議的多個序列,所述原始序列包含多個匹配特征, 各匹配特征對應的支持度為所述匹配特征在所述多個原始序列的同一位置出現(xiàn)的次數(shù);

根據(jù)所述第一序列組獲取第二序列組,所述第二序列組中包括第二長度的各個第二匹配特征以及所述第二匹配特征在相應所述待確定序列中的第二位置,所述第二匹配特征是通過組合所述第一匹配特征獲取的,且所述第二匹配特征對應的支持度大于或等于第二預設支持度(S2);

根據(jù)第二序列組從所述待確定序列中獲取包含所述第二匹配特征的各第三序列,并依次從各所述第三序列中去除相應的第二匹配特征以及第二匹配特征之前的各匹配特征,形成第四序列,將所述原始序列更新為第四序列,返回重復執(zhí)行前述步驟,直至執(zhí)行次數(shù)達到預設次數(shù)(S3);

根據(jù)所獲取的各所述第一序列組和各所述第二序列組獲取投影數(shù)據(jù)庫(S4);和

根據(jù)所述投影數(shù)據(jù)庫獲取所述預設協(xié)議的協(xié)議特征(S5)。

如上所述的數(shù)據(jù)分析方法,可選地,所述根據(jù)所述第一序列組獲取第二序列組包括:根據(jù)所述第一序列組中的各第一匹配特征獲取第二匹配特征,各所述第二匹配特征包括多個第一匹配特征的組合;和根據(jù)所述第二匹配特征值和所述第二位置確定第二序列組。

如上所述的數(shù)據(jù)分析方法,可選地,所述依次從各所述第三序列中去除相應的第二匹配特征以及第二匹配特征之前的各匹配特征,進一步包括:步驟a:獲取未遍歷的一個第三序列;步驟b:遍歷步驟a中獲取的第三序列,若獲取到所述第二匹配特征,則去除所獲取的第二匹配特征以及所獲取的第二匹配特征之前的各匹配特征,并繼續(xù)遍歷操作,直至完成遍歷所述步驟a中獲取的第三序列的操作;步驟c:將所述步驟b中的第三序列中未去除的各匹配特征組成的序列作為第四序列,返回執(zhí)行步驟a。

如上所述的數(shù)據(jù)分析方法,可選地,所述根據(jù)所獲取的各所述第一序列組和各所述第二序列組獲取投影數(shù)據(jù)庫包括:將獲取到的第一匹配特征和第二匹配特征與最新生成的長度最長的整合匹配特征組合生成新的整合匹配特征,初始的整合匹配特征是初次獲取的各第二匹配特征分別與第二次獲取的第一匹配特征和第二匹配特征組合生成的;和根據(jù)各第一序列組、各第二序列組和各整合匹配特征獲取所述投影數(shù)據(jù)庫。

如上所述的數(shù)據(jù)分析方法,可選地,在所述根據(jù)所獲取的各所述第一序列組和各所述第二序列組獲取獲取所述預設協(xié)議的協(xié)議特征之后,還包括:獲取待分析序列;和將所述待分析序列與所述協(xié)議特征進行匹配,若兩者匹配,則確定所述待分析序列是所述預設協(xié)議進行傳輸?shù)摹?/p>

如上所述的數(shù)據(jù)分析方法,可選地,所述第一長度為1,所述第二長度為2。

如上所述的數(shù)據(jù)分析方法,可選地,直至執(zhí)行根據(jù)各所述原始序列獲取長度為1的第一序列組的步驟的次數(shù)達到預設次數(shù)包括:直至不能獲取到第二序列組。

本發(fā)明另一個方面提供一種數(shù)據(jù)分析裝置,包括:

第一獲取模塊,用于根據(jù)各原始序列獲取第一序列組,所述第一序列組中包括第一長度的各個第一匹配特征以及各所述第一匹配特征在相應待確定序列中的第一位置,所述第一特征匹配特征對應的支持度大于或等于第一預設支持度,所述待確定序列為在所述第一位置具有所述第一特征匹配特征的原始序列,所述原始序列是采用預設協(xié)議的多個序列,所述原始序列包含多個匹配特征,各匹配特征對應的支持度為所述匹配特征在所述多個原始序列的同一位置出現(xiàn)的次數(shù);

第二獲取模塊,用于根據(jù)所述第一序列組獲取第二序列組,所述第二序列組中包括第二長度的各個第二匹配特征以及所述第二匹配特征在相應所述待確定序列中的第二位置,所述第二匹配特征是通過組合所述第一匹配特征獲取的,且所述第二匹配特征對應的支持度大于或等于第二預設支持度;

去除模塊,用于根據(jù)第二序列組從所述待確定序列中獲取包含所述第二匹配特征的各第三序列,并依次從各所述第三序列中去除相應的第二匹配特征以及第二匹配特征之前的各匹配特征,形成第四序列,將所述原始序列更新為第四序列,觸發(fā)所述第一獲取模塊,直至觸發(fā)所述第一獲取模塊達到預設次數(shù);

第三獲取模塊,用于根據(jù)所獲取的各所述第一序列組和各所述第二序列組獲取投影數(shù)據(jù)庫;

第四獲取模塊,用于根據(jù)所述投影數(shù)據(jù)庫獲取所述預設協(xié)議的協(xié)議特征。

如上所述的數(shù)據(jù)分析裝置,可選地,所述第一獲取模塊具體用于:

根據(jù)所述第一序列組中的各第一匹配特征獲取第二匹配特征,各所述第二匹配特征包括多個第一匹配特征的組合;

根據(jù)所述第二匹配特征值和所述第二位置確定第二序列組。

如上所述的數(shù)據(jù)分析裝置,可選地,所述去除模塊具體用于執(zhí)行下述步驟:

步驟a:獲取未遍歷的一個第三序列;

步驟b:遍歷步驟a中獲取的第三序列,若獲取到所述第二匹配特征,則去除所獲取的第二匹配特征以及所獲取的第二匹配特征之前的各匹配特征,并繼續(xù)遍歷操作,直至完成遍歷所述步驟a中獲取的第三序列的操作;

步驟c:將所述步驟b中的第三序列中未去除的各匹配特征組成的序列作為第四序 列,返回執(zhí)行步驟a。

如上所述的數(shù)據(jù)分析裝置,可選地,所述第三獲取模塊具體用于:

將獲取到的第一匹配特征和第二匹配特征與最新生成的長度最長的整合匹配特征組合生成新的整合匹配特征,初始的整合匹配特征是初次獲取的各第二匹配特征分別與第二次獲取的第一匹配特征和第二匹配特征組合生成的;

根據(jù)各第一序列組、各第二序列組和各整合匹配特征獲取所述投影數(shù)據(jù)庫。

如上所述的數(shù)據(jù)分析裝置,可選地,還包括:

匹配模塊,用于獲取待分析序列,并將所述待分析序列與所述協(xié)議特征進行匹配,若兩者匹配,則確定所述待分析序列是所述預設協(xié)議進行傳輸?shù)摹?/p>

如上所述的數(shù)據(jù)分析裝置,可選地,所述第一長度為1,所述第二長度為2。

如上所述的數(shù)據(jù)分析裝置,可選地,所述去除模塊用于直至觸發(fā)所述第一獲取模塊達到預設次數(shù)時,具體包括:

直至不能獲取到第二序列組。

從上述方案中可以看出,由于本發(fā)明在獲取各匹配特征時記錄了位置這一屬性,可以排除掉未在同一位置出現(xiàn)次數(shù)超過門限值的匹配特征,因此建立投影特征庫的運算過程較簡單,所耗費的時間較短,進而能夠較快的對數(shù)據(jù)進行分析。

附圖說明

下面將通過參照附圖詳細描述本發(fā)明的優(yōu)選實施例,使本領域的普通技術人員更清楚本發(fā)明的上述及其它特征和優(yōu)點,附圖中:

圖1為根據(jù)本發(fā)明一實施例的數(shù)據(jù)分析方法的流程示意圖。

圖2為根據(jù)本發(fā)明另一實施例的數(shù)據(jù)分析方法的流程示意圖。

圖3為根據(jù)本發(fā)明再一實施例的數(shù)據(jù)分析裝置的結(jié)構(gòu)示意圖;

圖4為根據(jù)本發(fā)明又一實施例的數(shù)據(jù)分析裝置的結(jié)構(gòu)示意圖。

具體實施方式

為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,以下舉實施例對本發(fā)明進一步詳細說明。

實施例一

本實施例提供一種數(shù)據(jù)分析方法,用于對網(wǎng)絡中傳輸?shù)臄?shù)據(jù)進行分析。本實施例的執(zhí)行主體是數(shù)據(jù)分析裝置。如圖1所示,為根據(jù)本實施例的數(shù)據(jù)分析方法的流程示意圖。

步驟101,根據(jù)各原始序列獲取的第一序列組,第一序列組中包括各第一長度的各個第一匹配特征以及各第一匹配特征在相應待確定序列中的第一位置,第一特征匹配特征對應的支持度大于或等于第一預設支持度,待確定序列為在第一位置具有第一特征匹配特征的原始序列,原始序列是采用預設協(xié)議的多個序列,原始序列包含多個匹配特征,各匹配特征對應的支持度為匹配特征在多個原始序列的同一位置出現(xiàn)的次數(shù)。

獲取采用預設協(xié)議的多個初始的原始序列,原始序列包含多個匹配特征,各匹配特征對應的支持度為匹配特征在不同原始序列的同一位置出現(xiàn)的次數(shù)。

本實施例中,數(shù)據(jù)分析裝置先獲取網(wǎng)絡中采用已知的某一種協(xié)議進行傳輸?shù)臄?shù)據(jù),由于數(shù)據(jù)都是以多個長度為1字節(jié)的二進制數(shù)據(jù)進行傳輸,這些長度為1字節(jié)的二進制數(shù)據(jù)即為匹配特征,每匹配特征在原始序列中的位置,可以采用編號來表示。例如,原始序列依次包括的長度為1的各匹配特征分別是00、01、06、75,則00的位置為1,01的位置為2,06的位置為3,75的位置為4,長度為2的各匹配特征為0001、0106和0675,其中,0001的位置為1,0106的位置為2,0675的位置為3。長度為2或者更長的各匹配特征的位置,是按照第一個字節(jié)的位置進行定位的。一個報文所對應的數(shù)據(jù)可以為一個原始序列。本實施例中將根據(jù)報文攜帶的數(shù)據(jù)獲取的數(shù)列作為原始序列,即需要進行分析的序列。

支持度即在不同原始序列中同一位置出現(xiàn)的次數(shù)。對于支持度的計算,舉例來說,例如,某一匹配特征在不同序列中的位置5出現(xiàn)了30次,則該匹配特征對應的支持度為30,或者某一匹配特征在不同序列中的位置1出現(xiàn)了5次,則該匹配特征對應的支持度為5。

第一序列組中的各匹配特征的長度為第一長度。該第一長度可以根據(jù)實際需要進行設定,例如1。

該步驟可以包括:

根據(jù)第一序列組中的各第一匹配特征獲取第二匹配特征,各第二匹配特征包括多個第一匹配特征的組合;

根據(jù)第二匹配特征值和第二位置確定第二序列組。

步驟102,根據(jù)第一序列組獲取的第二序列組,第二序列組中包括各第二長度的各個第二匹配特征以及第二匹配特征在相應待確定序列中的第二位置,第二匹配特征是通過組合第一匹配特征獲取的且第二匹配特征對應的支持度大于或等于第二預設支持度。

本實施例的第二匹配特征可以包括任意幾個第一匹配特征的組合,需指出的是,多個第一長度的第一匹配特征組合后的長度為第二長度,例如,兩個長度為1的第一匹配特征組合成長度為2的第二匹配特征。多個第一匹配特征的組合順序并不限定。第二匹配特征對應的支持度大于或等于第二預設支持度表示的是,即該第二匹配特征在不同待確定序列中同一位置出現(xiàn)的次數(shù)大于或等于第二預設支持度。

步驟103,根據(jù)第二序列組從待確定序列中獲取包含第二匹配特征的各第三序列,并依次從各第三序列中去除相應的第二匹配特征以及第二匹配特征之前的各匹配特征,形成第四序列,將原始序列更新為第四序列,返回重復執(zhí)行前述步驟,直至重復次數(shù)達到預設次數(shù)。

若獲取到第二匹配特征,則可以遍歷待確定序列,并根據(jù)第二序列組從待確定序列中獲取包含第二匹配特征的待確定序列作為第三序列,即,第三序列中的第二匹配特征的位置是記錄在第二序列組中的位置。將第三序列的第二匹配特征以及第二匹配特征之前的各匹配特征去掉之后,獲取相應的第四序列。將第四序列作為新的原始序列,并重復步驟101至步驟103,直至不能再獲取到相應的第二序列組。

具體地:步驟a:獲取未遍歷的一個第三序列;

步驟b:遍歷步驟a中獲取的第三序列,若獲取到第二匹配特征,則去除所獲取的第二匹配特征以及所獲取的第二匹配特征之前的各匹配特征,并繼續(xù)遍歷操作,直至完成遍歷步驟a中獲取的第三序列的操作;

步驟c:將步驟b中的第三序列中未去除的各匹配特征組成的序列作為第四序列,返回執(zhí)行步驟a。

可選地,對于上述步驟a至步驟c,直至所有的第三序列均被遍歷完成,當然,也可以根據(jù)實際需要遍歷預設個數(shù)的第三序列,以減少遍歷時間,進而減少分析數(shù)據(jù)的時間。

本實施例的直至執(zhí)行根據(jù)各原始序列獲取長度為1的第一序列組的步驟的次數(shù)達到預設次數(shù)包括:

直至不能獲取到第二序列組。

需指出的是,這里不能獲取到第二序列組至少包含以下情況:

第一種情況:無法獲取到第一序列組。即最新的原始序列中不包括所對應的支持度 大于或等于第一預設支持度的第一匹配特征,由于不能獲取到第一序列組,相應地也不能獲取到第二序列組。

第二種情況:無法獲取到第二序列組。即第二序列組中沒有對應的支持度大于或等于第二預設支持度的第二匹配特征。

步驟104,根據(jù)所獲取的各第一序列組和各第二序列組獲取投影數(shù)據(jù)庫。

在重復執(zhí)行步驟101-步驟103的過程中,能夠獲取多個第一序列組和第二序列組,根據(jù)各第一序列組和第二序列組獲取預設協(xié)議的協(xié)議特征。

該步驟的具體實現(xiàn)方式有很多種,例如,投影數(shù)據(jù)庫中包括全部的第一序列組和第二序列組;或者

將第一序列組和第二序列組中的各匹配特征進行整合,進而投影數(shù)據(jù)庫中的各匹配特征還包括根據(jù)第一序列組和第二序列組進行整合的匹配特征,具體地:該步驟可以包括:

將獲取到的第一匹配特征和第二匹配特征與最新生成的長度最長的整合匹配特征組合生成新的整合匹配特征,初始的整合匹配特征是初次獲取的各第一匹配特征、第二匹配特征分別與第二次獲取的第一匹配特征和第二匹配特征組合生成的;

根據(jù)各第一序列組、各第二序列組和各整合匹配特征獲取投影數(shù)據(jù)庫。

每次生成的整合匹配特征可能有多個,獲取其中長度最長的整合匹配特征用于再次生成整合匹配特征時。

將各第一匹配特征和第二匹配特征進行組合生成各整合匹配特征,并根據(jù)各第一序列組、各第二序列組和各整合匹配特征獲取投影數(shù)據(jù)庫。整合匹配特征可包括多個第一匹配特征、第二匹配特征的組合。需指出的是,該整合匹配特征可以包括按照順序依次組合的最新生成的長度最長的整合匹配特征和最新獲取到的第一匹配特征、以及最新生成的長度最長的整合匹配特征和最新獲取到的第二匹配特征,例如,初次獲取的第一匹配特征包括06、08和10,第二匹配特征包括0610,第二次獲取的第一匹配特征為01,第二次獲取的第二匹配特征為23ef,則整合匹配包括061001和0610323ef。

需指出的是,整合匹配特征的位置時按照第一個字節(jié)的位置確定的。

步驟105,根據(jù)投影數(shù)據(jù)庫獲取預設協(xié)議的協(xié)議特征。

投影數(shù)據(jù)庫中包括多個匹配特征,從中選擇出一個或多個匹配特征作為預設協(xié)議的協(xié)議特征。例如,可以通過人工選擇出其中一個作為協(xié)議特征,或者從中選擇出符合預定長度的匹配特征作為協(xié)議特征,具體可以根據(jù)實際需要設定,在此不再贅述。

可選地,在步驟105之后,本實施例中還包括:

將待分析序列與協(xié)議特征進行匹配,若兩者匹配,則確定待分析序列是預設協(xié)議進行傳輸?shù)摹?/p>

本實施例中的第一長度為可以1,相應地第二長度可以為2,采用這樣的組合可以獲取長度較完整的投影數(shù)據(jù)庫。

根據(jù)本實施例的數(shù)據(jù)分析方法,由于在獲取各匹配特征時記錄了位置這一屬性,可以排除掉未在同一位置出現(xiàn)次數(shù)超過門限值的匹配特征,因此建立投影特征庫的運算過程較簡單,所耗費的時間較短,進而能夠較快的對數(shù)據(jù)進行分析。

實施例二

本實施例對實施例一的數(shù)據(jù)分析方法做進一步補充說明。如圖2所示,為根據(jù)本實施例的數(shù)據(jù)分析方法的流程示意圖。本實施例以第一長度為1,第二長度為2為例進行說明。

步驟201,獲取采用預設協(xié)議的多個初始的原始序列。

本實施例中,可以采用I={i1,i2,i3,…,in}來表示包括各原始序列的原始序列組,其中,in表示各原始序列,n為正整數(shù)。本實施例的各原始序列是均采用同一個已知協(xié)議進行傳輸?shù)摹?/p>

舉例來說,根據(jù)數(shù)據(jù)所獲取到的多個原始序列為:

原始序列1:{00 E7 89 7E 00 a1 E7 a1}

原始序列2:{a1 7E E7 00 E7 we 81 82}

原始序列3:{00 E7 E7 81 82 a1 08 00}

原始序列4:{00 E7 22 81 82 a1 63 22}

需指出的是,各原始序列的長度可以相等,也可以不相等,長度可以是任何長度,本實施例僅示出長度為8的且長度相等的四個原始序列,即各原始序列中包括8個長度為1的匹配特征。

步驟202,遍歷原始序列,并獲取在不同的原始序列中出現(xiàn)次數(shù)大于或等于最小預設閾值的待確定第一匹配特征,待確定第一匹配特征的長度為1。

首先,從原始序列中挑選出在不同原始序列中出現(xiàn)次數(shù)大于或等于最小預設閾值的待確定第一匹配特征。需指出的是,同一匹配特征在同一原始序列中出現(xiàn)多次,也僅記為在該原始序列中出現(xiàn)一次。

步驟203,從待確定第一匹配特征中選取在不同序列中同一位置出現(xiàn)的次數(shù)大于或等于第一預設支持度的第一匹配特征,第一序列組中包括第一長度的各個第一匹配特征,該同一位置即第一匹配特征對應的第一位置。

舉例來說,對于原始序列1中的匹配特征00,即使該匹配特征00在原始序列1中出現(xiàn)兩次,針對原始序列1記錄該匹配特征00對應的出現(xiàn)次數(shù)也僅為1,同時記錄該匹配特征00在原始序列1中的位置1和7;遍歷原始序列2,也有匹配特征00,則匹配特征00對應的次數(shù)加1,變?yōu)?,同時記錄該匹配特征00在原始序列2中的位置4,遍歷原始序列3,即使匹配特征00出現(xiàn)兩次,也僅記錄1次,即該匹配特征00對應的次數(shù)加1,變?yōu)?,同時記錄該匹配特征00在原始序列1中的位置1和8;遍歷原始序列4,也有匹配特征00,則匹配特征00對應的次數(shù)加1,變?yōu)?,同時記錄該匹配特征00在原始序列4中的位置1。

其它各匹配特征依次類推,獲取各匹配特征在不同原始序列中出現(xiàn)的次數(shù)。

對于上述原始序列,假設最小預設閾值為2,獲取在不同序列中出現(xiàn)的次數(shù)大于或等于該預設閾值的匹配特征作為待確定第一匹配特征,本實施例中,從上述四個原始序列中確定出的待確定第一匹配特征包括:00、a1、E7、7E、81和82。

第一序列組可以采用以下公式表示:

Q1={<E1,T1>,<E2,T2>,…,<Ep,Tp>},其中Q1代表第一序列組,Ep代表第一匹配特征,Tp代表第一匹配特征在序列中出現(xiàn)的位置。其中p≤n且p為正整數(shù)。

假設,第一預設支持度為3,則上述原始序列中的第一匹配特征為00、E7和a1。

包含對應的支持度大于或等于第一預設支持度的各第一匹配特征的待確定序列為原始序列1、原始序列3和原始序列4。第一序列組Q1={<00,1>,<E7,2>,<a1,6>}。

實施例一中的步驟102可以包括本實施例的步驟201和202。

步驟204,根據(jù)第一序列組中各第一匹配特征獲取待確定第二匹配特征。

其中,第二匹配特征的長度為2,由兩個第一匹配特征進行組合而成。各待確定第二匹配特征包括多個第一匹配特征的組合。根據(jù)原始序列1、原始序列2、原始序列3和原始序列4,第一匹配特征為00、E7和a1,則待確定第二匹配特征包括0000、00E7、00a1、E700、E7E7、E7a1、a100、a1E7以及a1a1。

遍歷待確定序列,即原始序列1、原始序列3和原始序列4,獲取對應的支持度大于或等于第二預設支持度的第二匹配特征。

步驟205,根據(jù)第二匹配特征值和第二位置確定第二序列組。

第二序列組Q2={P1,P2,…,Pr},其中Pr代表第二匹配特征,即Pr={<Tt,<EiEj>>},其中1≤t≤r,Ei∈O1,Ej∈O1。

假設,本實施例中的第二預設支持度為2,則可以獲取到最終的第二匹配特征為00E7,第二序列組Q2為{<00E7,1>}。

步驟206,根據(jù)第二序列組從待確定序列中獲取包含第二匹配特征的各第三序列。

根據(jù)第二序列組Q2為{<00E7,1>},第三序列為原始序列1、原始序列3和原始序列4。

步驟207,依次從各第三序列中去除相應的第二匹配特征以及第二匹配特征之前的各匹配特征,根據(jù)去除第二匹配特征后的各第三序列獲取第四序列,將原始序列更新為第四序列,返回執(zhí)行步驟202,直至未獲取到第二序列組。

該步驟包括以下步驟:

步驟a:獲取未遍歷的一個第三序列;

步驟b:遍歷步驟a中獲取的第三序列,若獲取到第二匹配特征,則去除所獲取的第二匹配特征以及所獲取的第二匹配特征之前的各匹配特征,并繼續(xù)遍歷操作,直至完成遍歷步驟a中獲取的第三序列的操作;

步驟c:將步驟b中的第三序列中未去除的各匹配特征組成的序列作為第四序列,返回執(zhí)行步驟a。

假設,獲取的第三序列為原始序列1,首先獲取到位置為1的第二匹配特征00E7,去除位置為1的第二匹配特征00E7,接下來,獲取到位置為4的第二匹配特征00E7,去除該位置為4的第二匹配特征00E7,原始序列1遍歷完畢。根據(jù)原始序列1未獲取到第四序列。

接下來,獲取的第三序列為原始序列3,首先獲取到位置為1的第二匹配特征00E7,去除位置為1的第二匹配特征00E7,接下來,未遍歷到第二匹配特征,則根據(jù)原始序列3獲取到的第四序列1為:{E7 81 82 a1 08 00}。

接下來,獲取的第三序列為原始序列4,首先獲取到位置為1的第二匹配特征00E7,去除位置為1的第二匹配特征00E7,接下來,未遍歷到第二匹配特征,則根據(jù)原始序列4獲取到的第四序列2為:{22 81 82 a1 63 22}。

需注意的是,各第四序列中的各匹配特征的位置發(fā)生改變,第四序列1為:{E7, 81,82,a1,08,00}中的匹配特征E7,在初始的原始序列中的位置為3,在第四序列中的位置為1。

接著,由于第四序列僅為2個,一定獲取不到對應的支持度大于或等于第一預設支持度的第一匹配特征,接著,繼續(xù)執(zhí)行步驟208。

步驟208,根據(jù)獲取的各第一序列組和各第二序列組獲取投影數(shù)據(jù)庫。

該步驟包括:將獲取到的第一匹配特征和第二匹配特征與最新生成的長度最長的整合匹配特征組合生成新的整合匹配特征,初始的整合匹配特征是初次獲取的各第二匹配特征分別與第二次獲取的第一匹配特征和第二匹配特征組合生成的;

根據(jù)各第一序列組、各第二序列組和各整合匹配特征獲取投影數(shù)據(jù)庫。

步驟209,根據(jù)投影數(shù)據(jù)庫中確定出預設協(xié)議的協(xié)議特征。

如何確定該協(xié)議特征可以根據(jù)實際需要設定,例如采用人工根據(jù)經(jīng)驗選擇的方式,在此不再贅述。

步驟210,獲取待分析序列,并將待分析序列與協(xié)議特征進行匹配,若兩者匹配,則確定待分析序列是預設協(xié)議進行傳輸?shù)摹?/p>

獲取某一待分析序列,根據(jù)預先獲取的協(xié)議特征進行匹配,若在該待分析序列中在與協(xié)議特征相應的位置匹配到該協(xié)議特征時,則說明該待分析序列就是采用該預設協(xié)議進行分析的。各協(xié)議特征以及對應的位置均可以記錄在協(xié)議特征庫中。例如,協(xié)議特征庫中有<00E7,1>,其中,協(xié)議特征為00E7,1表示該匹配特征00E7在序列中的位置。本實施例獲取到的特征數(shù)據(jù)庫中包括該<00E7,1>,則表示該特征數(shù)據(jù)庫采用的是第一協(xié)議。

根據(jù)檢測,本實施例的數(shù)據(jù)分析方法最終的分析數(shù)據(jù)如表1所示:

表1

該表1中的偏移表示匹配特征的位置,長度即為協(xié)議的序列的長度。從表1中可以看出,本實施例的數(shù)據(jù)分析方法錯判率為不超過4%,誤判率不超過3%,可靠率非常高。這表明本實施例的數(shù)據(jù)分析方法的結(jié)果非常準確。本實施例的誤判率為將某一協(xié)議錯誤的判斷成另外一協(xié)議的概率,漏判率為遺漏了某組數(shù)據(jù)沒有判斷出來。

根據(jù)本實施例,獲取投影特征庫的過程計算比較簡單,耗費時間短,因此能夠很快的對數(shù)據(jù)進行分析,進而能夠較快地得到結(jié)論。

實施例三

本實施例提供一種數(shù)據(jù)分析裝置,用于執(zhí)行上述實施例中的數(shù)據(jù)分析方法。本實施例的數(shù)據(jù)分析裝置可以是任一終端,例如手機、電腦、服務器等。

如圖3所示,為根據(jù)本實施例的數(shù)據(jù)分析裝置的結(jié)構(gòu)示意圖。本實施例的數(shù)據(jù)分析裝置包括:第一獲取模塊301、第二獲取模塊302、去除模塊303、第三獲取模塊304和分析模塊305。

其中,第一獲取模塊301用于根據(jù)各原始序列獲取第一序列組,第一序列組中包括第一長度的各個第一匹配特征以及各第一匹配特征在相應待確定序列中的第一位置,第一特征匹配特征對應的支持度大于或等于第一預設支持度,待確定序列為在第一位置具有第一特征匹配特征的原始序列,原始序列是采用預設協(xié)議的多個序列,原始序列包含多個匹配特征,各匹配特征對應的支持度為匹配特征在多個原始序列的同一位置出現(xiàn)的次數(shù);第二獲取模塊302用于根據(jù)第一序列組獲取第二序列組,第二序列組中包括第二長度的各個第二匹配特征以及第二匹配特征在相應待確定序列中的第二位置,第二匹配特征是通過組合第一匹配特征獲取的,且第二匹配特征對應的支持度大于或等于第二預設支持度;去除模塊303用于根據(jù)第二序列組從待確定序列中獲取包含第二匹配特征的各第三序列,并依次從各第三序列中去除相應的第二匹配特征以及第二匹配特征之前的各匹配特征,形成第四序列,將原始序列更新為第四序列,觸發(fā)第一獲取模塊301,直至觸發(fā)第一獲取模塊301達到預設次數(shù);第三獲取模塊304用于根據(jù)所獲取的各第一序列組和各第二序列組獲取投影數(shù)據(jù)庫;第四獲取模塊305用于根據(jù)投影數(shù)據(jù)庫獲取預設協(xié)議的協(xié)議特征。

本實施例的數(shù)據(jù)分析裝置的操作方法與實施例一一致,在此不再贅述。

根據(jù)本實施例的數(shù)據(jù)分析裝置,由于在獲取各匹配特征時記錄了位置這一屬性,可以排除掉未在同一位置出現(xiàn)多次的匹配特征,因此建立投影特征庫的運算過程較簡單,所耗費的時間較短,進而能夠較快的對數(shù)據(jù)進行分析。

實施例四

本實施例對上述實施例的數(shù)據(jù)分析裝置做進一步補充說明。

如圖4所示,本實施例的數(shù)據(jù)分析裝置的第一獲取模塊301具體用于:

根據(jù)第一序列組中的各第一匹配特征獲取第二匹配特征,各第二匹配特征包括多個第一匹配特征的組合;

根據(jù)第二匹配特征值和第二位置確定第二序列組。

可選地,本實施例的去除模塊303具體用于執(zhí)行下述步驟:

步驟a:獲取未遍歷的一個第三序列;

步驟b:遍歷步驟a中獲取的第三序列,若獲取到第二匹配特征,則去除所獲取的第二匹配特征以及所獲取的第二匹配特征之前的各匹配特征,并繼續(xù)遍歷操作,直至完成遍歷步驟a中獲取的第三序列的操作;

步驟c:將步驟b中的第三序列中未去除的各匹配特征組成的序列作為第四序列,返回執(zhí)行步驟a。

可選地,本實施例的第三獲取模塊304具體用于:

將獲取到的第一匹配特征和第二匹配特征與最新生成的長度最長的整合匹配特征組合生成新的整合匹配特征,初始的整合匹配特征是初次獲取的各第二匹配特征分別與第二次獲取的第一匹配特征和第二匹配特征組合生成的;

根據(jù)各第一序列組、各第二序列組和各整合匹配特征獲取投影數(shù)據(jù)庫。

可選地,如圖4所示,本實施例的數(shù)據(jù)分析裝置還包括匹配模塊401。該匹配模塊401用于獲取待分析序列,并將待分析序列與協(xié)議特征進行匹配,若兩者匹配,則確定待分析序列是預設協(xié)議進行傳輸?shù)摹?/p>

可選地,本實施例的第一長度為1,第二長度為2。

可選地,本實施例的去除模塊303用于直至觸發(fā)第一獲取模塊301達到預設次數(shù)時,具體包括:

直至不能獲取到第二序列組。

本實施例的數(shù)據(jù)分析裝置的具體操作方式與上述實施例一致,在此不再贅述。

根據(jù)本實施例,獲取投影特征庫的過程計算比較簡單,耗費時間短,因此能夠很快的對數(shù)據(jù)進行分析,進而能夠較快地得到結(jié)論。

以上僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
乌兰察布市| 淮南市| 桃园市| 中方县| 堆龙德庆县| 杭锦旗| 宿州市| 马龙县| 花莲市| 德兴市| 彭泽县| 白山市| 元氏县| 六盘水市| 屯门区| 乐至县| 盖州市| 夹江县| 和林格尔县| 巴彦淖尔市| 凉城县| 讷河市| 黎川县| 沧州市| 东山县| 章丘市| 咸宁市| 宜阳县| 垣曲县| 盈江县| 长宁县| 浙江省| 巩义市| 岐山县| 二连浩特市| 浦北县| 容城县| 五台县| 潜江市| 张家川| 东兰县|