專利名稱:Ip數(shù)據(jù)包識別方法及網(wǎng)關(guān)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種IP數(shù)據(jù)包識別方法及網(wǎng)關(guān)。
背景技術(shù):
如圖I所示,IP數(shù)據(jù)包分為IP數(shù)據(jù)頭以及應(yīng)用層數(shù)據(jù)。其中IP數(shù)據(jù)頭存儲的內(nèi)容包括源IP地址,目的IP地址、源端口號,目的端口號以及通信協(xié)議等信息。通信協(xié)議通常包括TCP傳輸控制協(xié)議以及UDP用戶數(shù)據(jù)協(xié)議。應(yīng)用層數(shù)據(jù)為IP數(shù)據(jù)包所要傳輸?shù)木唧w內(nèi)容。如IEEE無線通信與網(wǎng)絡(luò)會議中公開的英文文獻《Maximum Entropy BasedIP-Traffic Classification in Mobile Communication Network》中,所描述的根據(jù)應(yīng)用
層數(shù)據(jù)來識別IP數(shù)據(jù)包類型的方法包括以下步驟步驟I :根據(jù)端口號將接收到的η個IP數(shù)據(jù)包進行分組;步驟2 :提取同一組中每一個IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前m個字節(jié);步驟3 :將所述提取的每個字節(jié)均分解成8位的二進制由O和/或I組成的二進制串;步驟4 :統(tǒng)計這η個IP數(shù)據(jù)包所對應(yīng)的二進制串對應(yīng)位上O或I的個數(shù);步驟5 :根據(jù)統(tǒng)計的結(jié)果以及定義的熵計算公式得到這η個數(shù)據(jù)包的熵值,所述熵值為提取到的IP數(shù)據(jù)包的特征;步驟6 :利用機器學(xué)習算法對這些數(shù)據(jù)包進行分類;步驟7 :對進行了步驟6的IP數(shù)據(jù)包進行分類標記。上述方法較更加原始的方法在準確度上有所提升,但是仍然存在以下缺點I :通過端口號將數(shù)據(jù)包分組,由于端口號分類的不準確性,從而分組后同一組內(nèi)的數(shù)據(jù)包不一定屬于同一個應(yīng)用類型,所以降低了整體的識別準確度;2 :提取應(yīng)用數(shù)據(jù)特征時,使用的方法很復(fù)雜,增加了計算量,IP數(shù)據(jù)包的識別效率低下,尤其是不適用于廣泛使用的實時數(shù)據(jù)的傳輸中;3:由于算法中包含了比較、對比以及自定義熵值運算等多種運算,只能同時對一組IP數(shù)據(jù)包進行計算和類型判斷,則必須等待接收到η個數(shù)據(jù)包,才能進行識別,對于先到的數(shù)據(jù)包等待的時間長,增加了網(wǎng)絡(luò)延遲。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明提供一種準確率高,實時識別的高效率的IP數(shù)據(jù)包識別方法以及網(wǎng)關(guān)。為達上述目的,本發(fā)明IP數(shù)據(jù)包識別方法包括以下步驟提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié);對提取的N個字節(jié)進行傅里葉變換,得到所述N個字節(jié)頻域的特征串;利用機器學(xué)習算法根據(jù)所述特征串進行分類識別IP數(shù)據(jù)包的類型。
優(yōu)選地,所述IP數(shù)據(jù)包識別方法還包括在完成分類的IP數(shù)據(jù)包添加類型標記。優(yōu)選地,所述傅里葉變換為離散傅里葉變換或快速傅里葉變換。優(yōu)選地,所述4彡N彡16。優(yōu)選地,所述機器學(xué)習算法為SVM算法或PART算法或NB算法。為達上述目的,本發(fā)明網(wǎng)關(guān),至少包括識別單元;所述識別單元包括提取模塊,用以提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié);傅里葉變換模塊,用以接收所述提取模塊提取的N個字節(jié),并將所述N個字節(jié)進行傅里葉變換,得到頻域所述N個字節(jié)頻域的特征串;分類模塊,用以接收所述傅里葉變換模塊輸出的特征串,并根據(jù)機器學(xué)習算法以及所述特征串對IP數(shù)據(jù)包進行分類。進一步地,所述網(wǎng)關(guān)還包括標記模塊,根據(jù)所述分類模塊對IP數(shù)據(jù)包的分類添加類型標記。 進一步地,所述傅里葉變換模塊為DSP模塊。進一步地,所述網(wǎng)關(guān)為應(yīng)用在住宅、學(xué)?;蚱髽I(yè)網(wǎng)絡(luò)環(huán)境中的家庭基站。本實用IP數(shù)據(jù)包識別方法及網(wǎng)關(guān)的有益效果I、本發(fā)明IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),直接從應(yīng)用層數(shù)據(jù)提取前N個字節(jié)作為提取特征串的數(shù)據(jù)源,再根據(jù)特征串進行IP數(shù)據(jù)包類型的分類,準確度高。2、本發(fā)明IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),通過大量的實驗以及實踐,發(fā)現(xiàn)不同類型IP數(shù)據(jù)包的應(yīng)用層數(shù)據(jù)在時域的特征差異小,在頻域的特征差異大,通過傅里葉變換將提取的N個字節(jié)通過傅里葉變換轉(zhuǎn)換到頻域,再提取特征串,不僅準確度高,而且效率高。3、本發(fā)明IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),當接收到一個IP數(shù)據(jù)包后立即進行識別分類,實現(xiàn)了網(wǎng)絡(luò)延遲最小化,適合數(shù)據(jù)實時傳輸。4、本發(fā)明IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),將N的值的范圍設(shè)計為4彡N彡16,在保證分類的準確度的同時,減小了運算量,減少計算資源的消耗,縮短運算時間以及網(wǎng)絡(luò)延遲小。5、本發(fā)明IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),既可以應(yīng)用于有線IP數(shù)據(jù)包的傳輸也可以應(yīng)用于無線IP數(shù)據(jù)包的傳輸;而本發(fā)明IP數(shù)據(jù)包識別方法及網(wǎng)關(guān)沒有采用數(shù)據(jù)包的大小、到達時間間隔等這些不穩(wěn)定特征來進行分類識別,而直接從應(yīng)用數(shù)據(jù)中提取數(shù)據(jù)作為提取特征的原始數(shù)據(jù),具有實現(xiàn)簡單,快速高效、準確率高等特點。
圖I是IP數(shù)據(jù)包的結(jié)構(gòu)示意圖;圖2是本發(fā)明實施例一所述的IP數(shù)據(jù)包識別方法流程圖;圖3是本發(fā)明實施例二所述的IP數(shù)據(jù)包識別方法流程圖;圖4是本發(fā)明實施例四所述識別單元結(jié)構(gòu)示意圖;圖5是本發(fā)明實施例五所述網(wǎng)關(guān)應(yīng)用的網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖;圖6是本發(fā)明實施例六所述網(wǎng)關(guān)的結(jié)構(gòu)示意圖。
具體實施方式
下面結(jié)合說明書附圖對本發(fā)明做進一步的描述。傳統(tǒng)的有線傳輸中,IP數(shù)據(jù)包的識別方法利用了數(shù)據(jù)包的大小、到達的時間間隔等特征。這些特征在有線網(wǎng)絡(luò)較為穩(wěn)定時,特征表現(xiàn)穩(wěn)定,因而IP數(shù)據(jù)包的應(yīng)用類型的識別準確率以及效率均較高,但是網(wǎng)絡(luò)環(huán)境不穩(wěn)定的無線網(wǎng)絡(luò)以及有線網(wǎng)絡(luò)環(huán)境惡劣的狀況下,準確率和效率均低下。與此同時,在大量的分析、觀察以及試驗后發(fā)現(xiàn)變換到頻域之前,不同的類型IP數(shù)據(jù)包的波形圖無明顯特點;變換到頻域之后,不同類型的IP數(shù)據(jù)包的波形圖聚合到不同的區(qū)域,不同的類型
具有不同的聚合圖形,不管是人為觀察或用于與機器學(xué)習算法的的識別,區(qū)別都很明顯。因而根據(jù)上述發(fā)現(xiàn),本發(fā)明提供了一種分類準確,識別速度快的IP數(shù)據(jù)包識別方法以及網(wǎng)關(guān)。實施例一如圖2所示,本實施例IP數(shù)據(jù)包識別方法包括以下步驟步驟I :提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前8個字節(jié);所述8個字節(jié)依次為71. 00、69. 00,84. 00.、32· 00,47. 00,112. 00,114. 00 以及 110. 00步驟2 :將提取的8個字節(jié)進行快速傅里葉變換,得到該8個字節(jié)頻域的特征串;所述的特征串,是由提取的8個字節(jié)通過快速傅里葉變換得到的對應(yīng)的8個字節(jié)組成的;對應(yīng)上述8個字節(jié)得到了頻率的對應(yīng)的8個字節(jié)為640. 00,49. 45+116. 27i、_80. 00-38. OOi、-I. 45+56. 26i、-8. 00,-1. 45-56. 26i、_80. 00+38. 00i、49. 45-116. 26i。上述 8 個頻域的字節(jié)組成了特征串。步驟3 :利用SVM(Support Vector Machine)算法對上述特征串進行分類,識別IP數(shù)據(jù)包的類型;通過SVM算法的計算、分析、比較得到本實施例中所述的IP數(shù)據(jù)包為HTTP應(yīng)用類型的數(shù)據(jù)包IP數(shù)據(jù)包的分類可以依據(jù)IP數(shù)據(jù)包的應(yīng)用類型,也可以依據(jù)IP數(shù)據(jù)包中應(yīng)用層數(shù)據(jù)的特定信息,如加載的指紋信息、加擾碼等可識別信息。其中應(yīng)用類型是根據(jù)IP數(shù)據(jù)包所對應(yīng)的傳輸協(xié)議來區(qū)分的主要包括RTP(Real-Time-Transport Protocal)實時傳輸協(xié)議、RTSP(Real-Time-StreamingProtocal)實時流傳輸協(xié)議、FTP (File-Transfer Protocal)文件傳輸協(xié)議、P2P (Peer ToPeer)點對點傳輸以及HTTP (Hypertext-Ttransport Protocol)超文本傳輸協(xié)議等等,應(yīng)用以上5種協(xié)議傳輸?shù)腎P數(shù)據(jù)包在日常的通信應(yīng)用中超過80%以上;本實施例IP數(shù)據(jù)包識別方法,首先,直接從IP數(shù)據(jù)包中的應(yīng)用層數(shù)據(jù)中提取前8個字節(jié),因為這8個字節(jié)直接對應(yīng)的是IP數(shù)據(jù)包所存儲的信息內(nèi)容即可根據(jù)信息內(nèi)容準確的提取所應(yīng)用的數(shù)據(jù)類型,準確率高;其次,根據(jù)實踐發(fā)現(xiàn),不同應(yīng)用數(shù)據(jù)在時域特征區(qū)別不大,然而轉(zhuǎn)換到頻域特征區(qū)別差異大的規(guī)律,將提取的8個字節(jié)進行快速傅里葉變換,得到這個8個字節(jié)所對應(yīng)的頻率的特征串,進一步提聞了準確度;再次,采用快速傅里葉算法,大大節(jié)省了運算量,效率高,時延?。蛔詈?,對每一個接收到的IP數(shù)據(jù)包單獨進行數(shù)據(jù)包的識別,相對于傳統(tǒng)方法中執(zhí)行一次IP數(shù)據(jù)包的識別的對一組中幾個到幾十個不等的數(shù)據(jù)包的識別,實現(xiàn)小,具備實時性,適用于實時數(shù)據(jù)傳輸。實施例二如圖3所示,本實施例IP數(shù)據(jù)包識別方法包括以下步驟第一提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前6個字節(jié);所述6個字節(jié)所依次為128. 00、107. 00,25. 00,212. 00,0. 00,29. 00 ;第二 通過離散傅里葉變換將從時域信號中提取的6個字節(jié)的變換成頻域信號中所對應(yīng)的 6個字節(jié);所述6 個字節(jié)依次為 501. 00,-28. 00-89. 20i、259. 00-15. 90i、_195. 00、259. 50+45. 90i、-28. 00+89. 20i。頻域中6個字節(jié)組成了頻域中的特征串;計算得到頻率的特征串,還可以通過快速傅里葉變換計算得到;快速傅里葉變換是離散傅里葉變換的一種快速算法,具有運算量小,高效準確的特點;第三利用NB(Naive Bayes)貝葉斯分類算法根據(jù)上述頻率的特征串進行分類,識別IP數(shù)據(jù)包的類型;通過識別本實施例所述的IP數(shù)據(jù)包為RTP應(yīng)用類型的數(shù)據(jù)包。第四根據(jù)在第三步中對IP數(shù)據(jù)包的分類,在完成分類的IP數(shù)據(jù)包添加類型標記,不同IP數(shù)據(jù)包類型所對應(yīng)的類型標記不同。根據(jù)實踐運算得知,提取6個字節(jié)的用于特征串的計算,HTTP協(xié)議類型的IP數(shù)據(jù)包的識別準確率為O. 93 ;P2P協(xié)議類型的IP數(shù)據(jù)包識別準確率為O. 92 ;FTP協(xié)議類型的IP數(shù)據(jù)包識別準確率為O. 99 ;RTSP協(xié)議類型的IP數(shù)據(jù)包識別準確率為O. 95 ;RTP協(xié)議類型的IP數(shù)據(jù)包識別準確率為O. 99。由上述數(shù)據(jù)可知常見應(yīng)用類型IP數(shù)據(jù)包的準確率均在O. 92以上,足以滿足傳輸?shù)男枨?,且?yīng)用于快速傅里葉變換以及分類的時間平均為O. 000082秒;采用8個字節(jié)時應(yīng)用與快速傅里葉變換以及分類所需的平均時間為O. 000130秒。綜合上述可知,本實施例IP數(shù)據(jù)包識別方法識別的準確度高,速度快,離散傅里葉變換可以實現(xiàn)時域信號到頻域信號的轉(zhuǎn)換,應(yīng)用此方法較傳統(tǒng)方法速度依然較快,但是相對于快速傅里葉變換,運算量更小,速度更快,系統(tǒng)所耗資源更小,進一步降低了 IP數(shù)據(jù)包傳輸?shù)臅r延。而采用應(yīng)用層數(shù)據(jù)6個字節(jié)作為特征串的原始數(shù)據(jù),既可以達到準確率高的目的,同時運算量小,從而具有速度快,系統(tǒng)資源節(jié)省的特點。實施例三本實施例IP數(shù)據(jù)包識別方法為提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前4個字節(jié);所述的4個字節(jié)依次為36. 00,2. 00、
2.00,43. 00將提取的4個字節(jié)進行快速傅里葉變換,得到該4個字節(jié)相對應(yīng)的頻域的4個字節(jié)依次為83. 00,34. 00+41. OOi,-7. 00,34. 00-41. 00i,所述4個字節(jié)轉(zhuǎn)換成頻域信號,得到頻域的特征串;利用RART(Partial Decision Tree)部分決策樹算法對上述特征串進行分類,識別IP數(shù)據(jù)包的類型;本實施例所述的IP數(shù)據(jù)包屬于RTSP應(yīng)用類型的數(shù)據(jù)包。根據(jù)IP數(shù)據(jù)包的分類,在完成分類的IP數(shù)據(jù)包添加類型標記,每一種應(yīng)用類型所對應(yīng)的類型標記不同。采用4個字節(jié)對作為提取特征串的原始數(shù)據(jù),由于提取的數(shù)據(jù)較少,相對于采用6個字節(jié)、8個字節(jié)作為原始數(shù)據(jù)提取的特征串的準確率有所降低,但是相對于傳統(tǒng)的方法依然具有較高的準確率,但是本實施例所用的時間,較實施例一、實施例二所用時間短。綜合實施一至實施例三可知I、應(yīng)用于本發(fā)明IP數(shù)據(jù)包識別方法的特征串提取的算法包括快速傅里葉變換以及離散傅里葉變換;
2、應(yīng)用于特征串的分類的機器學(xué)習算法至少包括SVM算法、PART算法以及NB算法;3、N值的大小與運算量成反比,N值越大,運算量越大,運算消耗的系統(tǒng)資源越多,故在不影響準確率的前提下,優(yōu)選N值的范圍為4-16個字節(jié)。實施例四本實施例網(wǎng)關(guān)至少包括識別單元;如圖4所示,所述識別單元包括依次連接的提取模塊、傅里葉變換模塊以及分類模塊;提取模塊,用以提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié);N大于等于4,為提取模塊的預(yù)設(shè)值。N值的大小,即提取的字節(jié)的多寡,根據(jù)實際應(yīng)用的需要以及分類要求而確定,
通常4個字節(jié)就可以用于準確的實現(xiàn)分類; 傅里葉變換模塊,用以接收所述提取模塊提取的N個字節(jié),并將所述N個字節(jié)進行傅里葉變換,得到頻域所述N個字節(jié)頻域的特征串#個時域內(nèi)的字節(jié)通過傅里葉變換后將得到頻域內(nèi)所對應(yīng)的N個字節(jié),頻域內(nèi)的N個字節(jié)組成了特征串,并且作為分類模塊的輸入,用于后續(xù)機器學(xué)習算法的計算;分類模塊,用以接收所述傅里葉變換模塊輸出的特征串,并根據(jù)機器學(xué)習算法以及所述特征串對IP數(shù)據(jù)包進行分類;機器學(xué)習算法至少包括SVM算法、PART算法以及NB算法。其中所述傅里葉變換可以是離散傅里葉變化也可以是快速傅里葉變換,快速傅里葉變換較離散傅里葉變換運算量更小,運算速度更快。本實施例網(wǎng)關(guān),打破了傳統(tǒng)網(wǎng)關(guān)在時域提取IP數(shù)據(jù)包特征串來進行應(yīng)用類型分類和識別的方法,通過離散傅里葉變換或快速傅里葉變換在頻域提取特征串,準確度更高,速度更快;且單獨對每一個輸入的IP數(shù)據(jù)包進行識別、分類,解決了傳統(tǒng)技術(shù)中需要等待若干個數(shù)據(jù)包足夠組成一個運算對比組進行IP數(shù)據(jù)包的解析、分類以及識別具有延時小,效率高的特點;此外采取傅里葉算法直接對提取的N個數(shù)據(jù)進行時域信號到頻域信號的變換,取代了傳統(tǒng)網(wǎng)關(guān)中通過預(yù)設(shè)的自定義熵計算方法來實現(xiàn)特征串的提取,具有實現(xiàn)更加簡單,聞效等優(yōu)點。實施例五如圖5所示,在實施例四的基礎(chǔ)上,本實施例網(wǎng)關(guān)為應(yīng)用在住宅、學(xué)校或企業(yè)網(wǎng)絡(luò)環(huán)境中的家庭基站HNB。由于無線網(wǎng)絡(luò)經(jīng)常性的具有高延時、高誤碼率、臨時斷開等特點,傳統(tǒng)應(yīng)用利用數(shù)據(jù)包大小、數(shù)據(jù)包達到間隔等特征來識別的方法直接應(yīng)用與無線網(wǎng)絡(luò)中,準確率低,效率低。家庭基站(femtocell)是一種毫微微米蜂窩基站,面向住宅或企業(yè)環(huán)境,傳輸距離小于200m,一般支持4-16個用戶的網(wǎng)關(guān)。手機或上網(wǎng)卡等用戶終端注冊到家庭基站上,提出業(yè)務(wù)需求,家庭基站中的接收單元利用天線接收IP數(shù)據(jù)包,在交給本實施例中識別單元中提取模塊,傅里葉變變換模塊、分類模塊以及標記模塊進行分類識別后,再由傳輸單兀根據(jù)識別模塊的標記選擇以卸載模式傳輸還是不卸載模式傳輸本實施例所述的家庭基站HNB,根據(jù)無線網(wǎng)絡(luò)的高時延、高誤碼率、臨時斷開的特點,由識別單元采用提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)中的前N個,在通過傅里葉變換提取該前N個數(shù)據(jù)的頻率的特征串,完全不依賴無線網(wǎng)絡(luò)的網(wǎng)絡(luò)狀況,分類準確,效率高。
實施例六如圖6所示,本實施例網(wǎng)關(guān)包括依次連接的接收單元,識別單元以及傳輸單元,所述接收單元接收輸入的IP數(shù)據(jù)包;所述接收單元,用以接收輸入的IP數(shù)據(jù)包,并將接收到的IP數(shù)據(jù)包輸入到所述識別單元;所述識別單元包括提取模塊,用以提取所述接收單元所接收的IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié);本實施例所述提取的字節(jié)的個數(shù)為7 ;且所述7個字節(jié)依次為3. 00,3. 00、155. 00,80. 00、O. 00、0· 00、0· 00 ;傅里葉變換模塊,為DSP (Digital Signal Processing)數(shù)字信號處理模塊,用以接收所述提取模塊提取的I個字節(jié),并將所述I個字節(jié)進行傅里葉變換,得到頻域所述I個字節(jié)頻域的特征串;上述7個字節(jié)經(jīng)傅里葉變換后得到的頻域內(nèi)的7個字節(jié)依次為為241.00,-101. 70-188. 17i、-87. 14+41. 89i、79. 14-41. 89i、_87. 44-101. 70i、_101. 70+188. 17i ;所述DSP模塊用于進行快速傅里葉變換或離散傅里葉變換.DSP數(shù)字信號處理具有處理信息量大、處理速度快、易于存儲、可編程等特點,在使用DSP模塊進行傅里葉變換進一步提高了網(wǎng)關(guān)對IP數(shù)據(jù)包識別分類的速率,進一步減小了延時;分類模塊,用以接收所述傅里葉變換模塊輸出的特征串,并根據(jù)機器學(xué)習算法以及所述特征串對IP數(shù)據(jù)包進行分類;通過機器學(xué)習算法的分析、計算、比較等處理,得出本實施例所述的IP數(shù)據(jù)包為P2P應(yīng)用類型的數(shù)據(jù)包。標記模塊,根據(jù)所述分類模塊對IP數(shù)據(jù)包的分類添加類型標記;所述傳輸單元,根據(jù)類型標記選擇卸載傳輸或不卸載傳輸模式傳輸所述IP數(shù)據(jù)包。本實施例網(wǎng)關(guān),可應(yīng)用于無線網(wǎng)絡(luò)也可以應(yīng)用于有線網(wǎng)絡(luò),在進行IP數(shù)據(jù)包解析、識別、分類的過程中具有準確率高、效率高的特點。以上,僅為本發(fā)明的較佳實施例,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)該以權(quán)利要求所界定的保護范圍為準。
權(quán)利要求
1.一種IP數(shù)據(jù)包識別方法,其特征在于,所述IP數(shù)據(jù)包識別方法包括以下步驟 提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié); 對提取的N個字節(jié)進行傅里葉變換,得到所述N個字節(jié)頻域的特征串; 利用機器學(xué)習算法根據(jù)所述特征串進行分類識別IP數(shù)據(jù)包的類型。
2.根據(jù)權(quán)利要求I所述的IP數(shù)據(jù)包識別方法,其特征在于,所述IP數(shù)據(jù)包識別方法還包括在完成分類的IP數(shù)據(jù)包添加類型標記。
3.根據(jù)權(quán)利要求I所述的IP數(shù)據(jù)包識別方法,其特征在于,所述傅里葉變換為離散傅里葉變換或快速傅里葉變換。
4.根據(jù)權(quán)利要求I所述的IP數(shù)據(jù)包識別方法,其特征在于,所述4< N < 16。
5.根據(jù)權(quán)利要求I所述的IP數(shù)據(jù)包識別方法,其特征在于,所述機器學(xué)習算法為SVM算法或PART算法或NB算法。
6.一種網(wǎng)關(guān),至少包括識別單元,其特征在于,所述識別單元包括 提取模塊,用以提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié); 傅里葉變換模塊,用以接收所述提取模塊提取的N個字節(jié),并將所述N個字節(jié)進行傅里葉變換,得到所述N個字節(jié)頻域的特征串; 分類模塊,用以接收所述傅里葉變換模塊輸出的特征串,并根據(jù)機器學(xué)習算法以及所述特征串對IP數(shù)據(jù)包進行分類。
7.根據(jù)權(quán)利要求6所述的網(wǎng)關(guān),其特征在于,所述識別單元還包括 標記模塊,根據(jù)所述分類模塊對IP數(shù)據(jù)包的分類添加類型標記。
8.根據(jù)權(quán)利要求6所述的網(wǎng)關(guān),其特征在于,所述傅里葉變換模塊為DSP模塊。
9.根據(jù)權(quán)利要求6所述的網(wǎng)關(guān),其特征在于,所述網(wǎng)關(guān)為應(yīng)用在住宅、學(xué)?;蚱髽I(yè)網(wǎng)絡(luò)環(huán)境中的家庭基站。
全文摘要
本發(fā)明公開了一種IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),為解決現(xiàn)有的IP數(shù)據(jù)包識別方法及網(wǎng)關(guān),準確率低、效率低、時延大等問題而設(shè)計。本發(fā)明IP數(shù)據(jù)包識別方法,通過提取IP數(shù)據(jù)包應(yīng)用層數(shù)據(jù)的前N個字節(jié),并將提取的字節(jié)通過傅里葉變換轉(zhuǎn)成頻域信號,得到頻域的特征串,以機器學(xué)習算法根據(jù)特征串對IP數(shù)據(jù)包進行分類。本發(fā)明網(wǎng)關(guān)至少包括識別單元;所述識別單元包括依次連接的提取模塊、傅里葉變換模塊以及分類模塊。本發(fā)明IP數(shù)據(jù)包識別方法以及網(wǎng)關(guān)對IP數(shù)據(jù)包的識別分類具有準確率高、效率高、實現(xiàn)簡單等優(yōu)點。
文檔編號H04L29/06GK102821101SQ201210265269
公開日2012年12月12日 申請日期2012年7月27日 優(yōu)先權(quán)日2012年7月27日
發(fā)明者石晶林, 胡金龍, 韓雪, 韓霖 申請人:北京中科晶上科技有限公司