本技術(shù)涉及網(wǎng)絡(luò)安全,特別是涉及一種入侵流量檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、入侵檢測(cè)系統(tǒng)(intrusion?detection?system,ids)是一種專門用于檢測(cè)、識(shí)別和應(yīng)對(duì)未經(jīng)授權(quán)的網(wǎng)絡(luò)訪問、惡意活動(dòng)以及其他可能對(duì)系統(tǒng)和網(wǎng)絡(luò)安全構(gòu)成威脅的行為的網(wǎng)絡(luò)安全設(shè)備或軟件。隨著第五代移動(dòng)通信技術(shù)(5th?generation?mobile?networks,5g)核心網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)環(huán)境的復(fù)雜性和流量的急劇增加給ids帶來了前所未有的挑戰(zhàn)。
2、傳統(tǒng)的ids通常采用模式匹配算法來檢測(cè)網(wǎng)絡(luò)攻擊。然而,隨著網(wǎng)絡(luò)流量的增大和攻擊類型的多樣化,模式匹配算法的計(jì)算復(fù)雜度也隨之增加,導(dǎo)致檢測(cè)速度下降,故,亟需改進(jìn)。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問題,提供一種能夠提高入侵流量檢測(cè)方法速度的入侵流量檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì)。
2、第一方面,本技術(shù)提供了一種入侵流量檢測(cè)方法,該方法包括:
3、獲取待檢測(cè)流量,并提取待檢測(cè)流量的流量特征;
4、將流量特征輸入至檢測(cè)模型中,得到檢測(cè)模型輸出的入侵檢測(cè)結(jié)果;
5、其中,檢測(cè)模型基于訓(xùn)練數(shù)據(jù)集訓(xùn)練得到;其中,訓(xùn)練數(shù)據(jù)集包含從原始數(shù)據(jù)集中篩選得到的各流量標(biāo)簽下的訓(xùn)練流量樣本,每一流量標(biāo)簽下不同訓(xùn)練流量樣本之間的流量樣本差異值大于差異閾值。
6、在其中一個(gè)實(shí)施例中,訓(xùn)練數(shù)據(jù)集采用以下方式得到:
7、根據(jù)原始數(shù)據(jù)集中各原始流量樣本的流量特征,確定各原始流量樣本之間的流量樣本差異值;
8、根據(jù)各原始流量樣本之間的流量樣本差異值和各原始流量樣本的流量標(biāo)簽,對(duì)原始數(shù)據(jù)集進(jìn)行篩選,得到訓(xùn)練數(shù)據(jù)集。
9、在其中一個(gè)實(shí)施例中,根據(jù)各原始流量樣本之間的流量樣本差異值和各原始流量樣本的流量標(biāo)簽,對(duì)原始數(shù)據(jù)集進(jìn)行篩選,得到訓(xùn)練數(shù)據(jù)集,包括:
10、從原始數(shù)據(jù)集中未標(biāo)記的原始流量樣本中選擇一個(gè)目標(biāo)流量樣本,并將未標(biāo)記的原始流量中除目標(biāo)流量樣本之外的各原始流量樣本均作為其他流量樣本;
11、根據(jù)目標(biāo)流量樣本和各其他流量樣本之間的流量樣本差異值,從各其他流量樣本中,確定目標(biāo)流量樣本的鄰近流量樣本;其中,目標(biāo)流量樣本與目標(biāo)流量樣本對(duì)應(yīng)的鄰近流量樣本與之間的流量樣本差異值小于或等于差異閾值;
12、根據(jù)目標(biāo)流量樣本的流量標(biāo)簽和鄰近流量樣本的流量標(biāo)簽,從目標(biāo)流量樣本和鄰近流量樣本中,選擇待標(biāo)記樣本和待剔除樣本;
13、根據(jù)待標(biāo)記樣本和待剔除樣本,對(duì)原始數(shù)據(jù)集進(jìn)行更新;
14、若更新后的原始數(shù)據(jù)集中僅包含被標(biāo)記的流量樣本或存在一個(gè)未標(biāo)記的原始流量樣本,則將更新后的原始數(shù)據(jù)集,作為訓(xùn)練數(shù)據(jù)集。
15、在其中一個(gè)實(shí)施例中,根據(jù)目標(biāo)流量樣本的流量標(biāo)簽和鄰近流量樣本的流量標(biāo)簽,從目標(biāo)流量樣本和鄰近流量樣本中,選擇待標(biāo)記樣本和待剔除樣本,包括:
16、若原始數(shù)據(jù)集中目標(biāo)流量樣本的流量標(biāo)簽和鄰近流量樣本的流量標(biāo)簽一致,則將目標(biāo)流量樣本作為待標(biāo)記樣本,并將鄰近流量樣本作為待剔除樣本;
17、若原始數(shù)據(jù)集中目標(biāo)流量樣本的流量標(biāo)簽和鄰近流量樣本的流量標(biāo)簽不一致,則將目標(biāo)流量樣本作為待標(biāo)記樣本。
18、在其中一個(gè)實(shí)施例中,根據(jù)待標(biāo)記樣本和待剔除樣本,對(duì)原始數(shù)據(jù)集進(jìn)行更新,包括:
19、在原始數(shù)據(jù)集中,對(duì)待標(biāo)記樣本進(jìn)行標(biāo)記處理,并對(duì)待剔除樣本進(jìn)行剔除處理,得到更新后的原始數(shù)據(jù)集。
20、在其中一個(gè)實(shí)施例中,該方法還包括:
21、若更新后的原始數(shù)據(jù)集中存在至少兩個(gè)未標(biāo)記的原始流量樣本,則基于更新后的原始數(shù)據(jù)集,返回執(zhí)行從原始數(shù)據(jù)集中未標(biāo)記的原始流量樣本中選擇一個(gè)目標(biāo)流量樣本的步驟。
22、在其中一個(gè)實(shí)施例中,原始流量樣本的流量特征至少包括流量包的平均包長、包長的方差、平均包到達(dá)時(shí)間、包到達(dá)時(shí)間的標(biāo)準(zhǔn)差、每秒到達(dá)的包的數(shù)量和流的持續(xù)時(shí)間。
23、第二方面,本技術(shù)還提供了一種入侵流量檢測(cè)方法裝置,該裝置包括:
24、獲取模塊,用于獲取待檢測(cè)流量,并提取待檢測(cè)流量的流量特征;
25、檢測(cè)模塊,用于將流量特征輸入至檢測(cè)模型中,得到檢測(cè)模型輸出的入侵檢測(cè)結(jié)果;
26、其中,檢測(cè)模型基于訓(xùn)練數(shù)據(jù)集訓(xùn)練得到;其中,訓(xùn)練數(shù)據(jù)集包含從原始數(shù)據(jù)集中篩選得到的各流量標(biāo)簽下的訓(xùn)練流量樣本,每一流量標(biāo)簽下不同訓(xùn)練流量樣本之間的流量樣本差異值大于差異閾值。
27、第三方面,本技術(shù)還提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)以下步驟:
28、獲取待檢測(cè)流量,并提取待檢測(cè)流量的流量特征;
29、將流量特征輸入至檢測(cè)模型中,得到檢測(cè)模型輸出的入侵檢測(cè)結(jié)果;
30、其中,檢測(cè)模型基于訓(xùn)練數(shù)據(jù)集訓(xùn)練得到;其中,訓(xùn)練數(shù)據(jù)集包含從原始數(shù)據(jù)集中篩選得到的各流量標(biāo)簽下的訓(xùn)練流量樣本,每一流量標(biāo)簽下不同訓(xùn)練流量樣本之間的流量樣本差異值大于差異閾值。
31、第四方面,本技術(shù)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:
32、獲取待檢測(cè)流量,并提取待檢測(cè)流量的流量特征;
33、將流量特征輸入至檢測(cè)模型中,得到檢測(cè)模型輸出的入侵檢測(cè)結(jié)果;
34、其中,檢測(cè)模型基于訓(xùn)練數(shù)據(jù)集訓(xùn)練得到;其中,訓(xùn)練數(shù)據(jù)集包含從原始數(shù)據(jù)集中篩選得到的各流量標(biāo)簽下的訓(xùn)練流量樣本,每一流量標(biāo)簽下不同訓(xùn)練流量樣本之間的流量樣本差異值大于差異閾值。
35、第五方面,本技術(shù)還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:
36、獲取待檢測(cè)流量,并提取待檢測(cè)流量的流量特征;
37、將流量特征輸入至檢測(cè)模型中,得到檢測(cè)模型輸出的入侵檢測(cè)結(jié)果;
38、其中,檢測(cè)模型基于訓(xùn)練數(shù)據(jù)集訓(xùn)練得到;其中,訓(xùn)練數(shù)據(jù)集包含從原始數(shù)據(jù)集中篩選得到的各流量標(biāo)簽下的訓(xùn)練流量樣本,每一流量標(biāo)簽下不同訓(xùn)練流量樣本之間的流量樣本差異值大于差異閾值。
39、上述入侵流量檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì),在構(gòu)建訓(xùn)練數(shù)據(jù)集時(shí),從原始數(shù)據(jù)集中篩選出各流量標(biāo)簽下的訓(xùn)練流量樣本,并確保每個(gè)樣本之間的差異值大于預(yù)設(shè)的差異閾值。通過這種方法,可以減少相似度較高的樣本數(shù)量,避免模型在訓(xùn)練過程中受到冗余信息的干擾。確保訓(xùn)練數(shù)據(jù)集中包含多樣化的樣本,涵蓋不同流量標(biāo)簽下的各種情況。加大不同類別之間樣本的差異,有助于模型更好地學(xué)習(xí)和區(qū)分不同的流量類型,特別是入侵流量與正常流量之間的差異。基于此,檢測(cè)模型基于優(yōu)化后的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,通過自主學(xué)習(xí)能力,模型能夠?qū)W習(xí)到不同流量類型的特征。
40、在訓(xùn)練過程中,模型不斷調(diào)整其參數(shù),以最小化預(yù)測(cè)錯(cuò)誤,并提高對(duì)入侵流量的識(shí)別準(zhǔn)確性。由于檢測(cè)模型已經(jīng)通過優(yōu)化后的訓(xùn)練數(shù)據(jù)集進(jìn)行了充分訓(xùn)練,因此在實(shí)際應(yīng)用中,僅需將待檢測(cè)流量的特征輸入到模型中,即可快速得到入侵檢測(cè)結(jié)果。這種方法簡(jiǎn)化了入侵流量的檢測(cè)過程,減少了人工分析和干預(yù)的需求,提高了檢測(cè)效率。檢測(cè)模型在訓(xùn)練過程中充分學(xué)習(xí)了不同流量類型的特征,因此在實(shí)際應(yīng)用中能夠更準(zhǔn)確地識(shí)別入侵流量。