本發(fā)明屬于網(wǎng)絡流量遙感,具體涉及一種網(wǎng)內(nèi)緩存驅(qū)動的主動網(wǎng)絡遙測方法。
背景技術:
1、隨著網(wǎng)絡技術的飛速發(fā)展,現(xiàn)代網(wǎng)絡規(guī)模日益龐大且復雜,網(wǎng)絡管理變得尤為重要。網(wǎng)絡管理系統(tǒng)需要實時監(jiān)控網(wǎng)絡狀態(tài),以便及時發(fā)現(xiàn)并解決潛在問題,確保網(wǎng)絡的穩(wěn)定與高效運行。網(wǎng)絡遙測(network?telemetry)作為一種關鍵技術,通過在網(wǎng)絡中嵌入探測器來收集網(wǎng)絡狀態(tài)信息,為網(wǎng)絡管理者提供了深入了解網(wǎng)絡行為的能力。然而,隨著網(wǎng)絡規(guī)模的擴大和流量的激增,傳統(tǒng)的網(wǎng)絡遙測方法面臨著巨大的挑戰(zhàn),尤其是從數(shù)據(jù)平面(dataplane)向控制平面(control?plane)傳輸?shù)倪b測數(shù)據(jù)量急劇增加,這不僅增加了網(wǎng)絡帶寬的消耗,還可能導致控制平面的處理負擔加重,進而影響整個網(wǎng)絡的性能和響應速度。
2、特別地,在網(wǎng)絡遙測系統(tǒng)中,基于帶內(nèi)網(wǎng)絡遙測(int)的技術因其能夠直接在數(shù)據(jù)包中嵌入遙測信息而備受關注。int技術允許在數(shù)據(jù)包傳輸過程中,沿途的節(jié)點(如路由器)將其處理數(shù)據(jù)包時的狀態(tài)信息(如延遲、丟包率等)添加到數(shù)據(jù)包頭中,從而無需額外的網(wǎng)絡資源即可實現(xiàn)網(wǎng)絡狀態(tài)的全面監(jiān)測。然而,這種方法也面臨著數(shù)據(jù)冗余和不必要信息傳輸?shù)膯栴},因為多個數(shù)據(jù)包可能包含重復或相似的遙測信息,這些信息對于控制器的決策來說可能是冗余的。
3、此外,如何有效地規(guī)劃探測路徑,以最大化遙測數(shù)據(jù)的收集效率并最小化對正常網(wǎng)絡流量的影響,也是網(wǎng)絡遙測系統(tǒng)需要解決的關鍵問題之一。傳統(tǒng)的路徑規(guī)劃方法往往基于靜態(tài)的網(wǎng)絡拓撲和預設的規(guī)則,難以適應動態(tài)變化的網(wǎng)絡環(huán)境。
4、鑒于上述挑戰(zhàn),如何設計一種能夠有效減少冗余和不必要遙測數(shù)據(jù)量,同時提高探測路徑規(guī)劃效率的網(wǎng)絡遙測系統(tǒng),成為了當前網(wǎng)絡管理領域的研究熱點。本發(fā)明正是針對這一問題所做出的創(chuàng)新嘗試,通過引入緩存機制和增量傳輸技術,以及基于深度強化學習(drl)的探測路徑規(guī)劃算法,旨在顯著提升網(wǎng)絡遙測系統(tǒng)的效率和性能。
技術實現(xiàn)思路
1、本發(fā)明的目的在于減少從數(shù)據(jù)平面到控制器的冗余和不必要遙測數(shù)據(jù)量,同時提高了探測效率并適應了動態(tài)網(wǎng)絡環(huán)境,提供一種網(wǎng)內(nèi)緩存驅(qū)動的主動網(wǎng)絡遙測方法;
2、為了實現(xiàn)上述目的,本發(fā)明采用以下技術方案:一種網(wǎng)內(nèi)緩存驅(qū)動的主動網(wǎng)絡遙測方法,包括:
3、步驟s1:控制器根據(jù)基于深度強化學習和注意力機制的探測路徑規(guī)劃算法生成規(guī)劃后的遙測路徑,接著控制器按照規(guī)劃后的遙測路徑向探測網(wǎng)絡中發(fā)送探針;
4、步驟s2:步驟s1中探針在各節(jié)點記錄所需要探測的相關信息,然后探針再將搜集到的信息在緩存節(jié)點緩存,并緩存節(jié)點通過預設的緩存策略對緩存的信息進行存儲、更新和檢索;
5、步驟s3:緩存節(jié)點采用增量傳輸技術將緩存節(jié)點中存儲的信息傳輸回控制器。
6、進一步地,所述步驟s1中基于深度強化學習和注意力機制的探測路徑規(guī)劃算法具體包括:
7、步驟s11:設置具體探測路徑規(guī)劃目標,將其表示為一個帶約束優(yōu)化問題,其數(shù)學表達式為:
8、min?c
9、
10、
11、l=e,
12、t≤tmax,
13、|pk|≤lth,k=1,…,k.
14、其中,優(yōu)化目標是最小化遙測系統(tǒng)的控制開銷c,約束條件為探針在收集完所有網(wǎng)絡信息后必須在緩存節(jié)點上存儲信息,為第k條遙測路徑經(jīng)過的第nk個節(jié)點;為第i個路由器的緩存容量限制,sk為第k個探針需要占用的緩存空間,是一個指示函數(shù),當時取值為1,否則為0;l=e表示探針需要探測網(wǎng)絡中所有的物理路徑,l為所有探測路徑的物理鏈路的集合,e為網(wǎng)絡節(jié)點直接物理鏈路的集合;t≤tmax為遙測延遲約束,t為遙測系統(tǒng)實際的最大遙測延遲,tmax為控制平面允許的最大遙測延遲;|pk|<lth表示端口信息的長度有上限,|pk|為第k條遙測路徑的長度,lth表示輔助探頭路徑的長度閾值;
15、步驟s12:將高負載網(wǎng)絡圖映射到向量空間,輸入其中是在時隙t時刻,包含第i個節(jié)點和其他節(jié)點連接狀態(tài)以及時延信息的一個元組,并用一維卷積來對進行嵌入,得到
16、步驟s13:使用基于內(nèi)容的注意機制來從解碼器中獲取ht,再結(jié)合步驟s12得到計算變長度對齊向量變長度對齊向量的計算公式為:其中ht∈rd表示rnn單元在解碼時的t時刻記憶狀態(tài),符號“;”表示兩個向量的連接,變量和是可訓練變量;
17、步驟s14:利用步驟s12得到再結(jié)合步驟s13得到變長度對齊向量計算上下文向量ct,上下文向量ct的計算公式為:其中m為輸入長度,與輸入長度相等,用softmax函數(shù)進行歸一化得到條件概率條件概率為:其中變量vc和wc為可訓練變量;
18、步驟s15:使用貪心解碼器根據(jù)步驟s14得到條件概率來選擇動作,并根據(jù)選擇的動作對更新遙測路徑規(guī)劃方案,同時對輸入進行更新,得到更新后的輸入和遙測路徑,直到滿足步驟s11中具體探測路徑規(guī)劃目標,其中其中f為狀態(tài)轉(zhuǎn)換函數(shù)。
19、進一步地,對所述基于深度強化學習和注意力機制的探測路徑規(guī)劃算法中的深度強化學習神經(jīng)網(wǎng)絡的訓練步驟具體包括:
20、步驟s101:輸入中,每個是在時隙t時刻,包含第i個節(jié)點和其他節(jié)點連接狀態(tài),時延信息的一個元組,用一維卷積來進行嵌入,輸入經(jīng)過嵌入后表示為得到數(shù)據(jù)集;
21、步驟s102:用隨機權(quán)重θ和δ初始化行動網(wǎng)絡和評價網(wǎng)絡,然后設置迭代周期數(shù),其中在每個迭代周期內(nèi),首先重置梯度dθ←0,dδ←0,再從步驟s101中得到數(shù)據(jù)集中選出用于訓練的樣本集m,樣本數(shù)記為batch,接著對m中的每個樣本,都從時隙t=0開始,計算條件概率得到新狀態(tài)然后將t更新為t+1,重復計算條件概率并得到新狀態(tài),直到滿足具體探測路徑規(guī)劃目標,計算完畢后,根據(jù)生成的策略計算獎勵rm,并當m中的每個樣本的都完成策略生成和獎勵計算后,根據(jù)獎勵計算梯度dθ和dδ:
22、
23、
24、再根據(jù)計算的梯度更新θ和δ,完成一次迭代周期的訓練,當完成設置的迭代周期數(shù)時深度強化學習神經(jīng)網(wǎng)絡訓練完成。
25、進一步地,所述步驟s2中預設的緩存策略具體包括:
26、步驟s21:緩存對象分類:將緩存的信息分為時變數(shù)據(jù)和靜態(tài)數(shù)據(jù);
27、步驟s22:緩存密鑰設計:每個緩存項對應與特定時間戳綁定的相同緩存的信息,且每個緩存項的緩存鍵是根據(jù)數(shù)據(jù)類型及其相關的時間戳制定的;
28、步驟s23:緩存更新策略設計:對于時變數(shù)據(jù),在收到新探測時更新緩存內(nèi)容和鍵,確保緩存始終反映最新的網(wǎng)絡狀態(tài),當達到容量限制時,將優(yōu)先清除相同類型的最小新鮮項,對于靜態(tài)數(shù)據(jù),只緩存最新的緩存的信息,并在接收到新的探測時直接更新它們,從而最大限度地減少不必要的緩存操作;
29、步驟s24:緩存失效機制設計:設置全局緩存失效時間,且全局緩存失效時間根據(jù)網(wǎng)絡環(huán)境動態(tài)調(diào)整,對于時變數(shù)據(jù),超過全局緩存失效時間的緩存項將被自動刪除,以保證緩存數(shù)據(jù)的及時性和準確性,對于靜態(tài)數(shù)據(jù),將其設置為永不失敗,以減少不必要的緩存操作;
30、步驟s25:緩存訪問機制設計:基于緩存鍵的查找方法,查詢緩存時,系統(tǒng)根據(jù)緩存鍵快速查找對應的緩存項,找到匹配的緩存項,則返回緩存的網(wǎng)絡信息,否則,返回“緩存丟失”狀態(tài)。
31、進一步地,所述步驟s3中增量傳輸技術具體包括:
32、步驟s31:將緩存節(jié)點中存儲的信息根據(jù)探頭劃分為多個數(shù)據(jù)塊;
33、步驟s32:使用哈希函數(shù)計算所有數(shù)據(jù)塊的唯一哈希值,系統(tǒng)地存儲在專用的哈希庫中,供后續(xù)比較和分析,每當系統(tǒng)接收到一個新的探測時,網(wǎng)絡遙測系統(tǒng)都會根據(jù)新的數(shù)據(jù)塊計算一個新的哈希值,并將其與哈希庫中的現(xiàn)有哈希值進行比較;
34、步驟s33:相應地更新哈希庫,其中,對于靜態(tài)數(shù)據(jù),只要它的哈希值發(fā)生變化,網(wǎng)絡遙測系統(tǒng)就會立即生成一個增量文件,對于時變數(shù)據(jù),在檢查哈希值是否發(fā)生變化后,需要評估數(shù)據(jù)變化幅度是否突破預設閾值,當數(shù)據(jù)變化超過這個閾值時,網(wǎng)絡遙測系統(tǒng)才生成增量文件;
35、步驟s34:增量文件生成后,立即下發(fā)到控制器,控制器接收到文件后,計算并比較哈希值,若比較結(jié)果為正確的散列,則表明數(shù)據(jù)未被篡改,并將控制器接收到緩存節(jié)點中存儲的信息用于本地數(shù)據(jù)庫和網(wǎng)絡管理應用程序,最后,控制器更新本地哈希數(shù)據(jù)庫,便于后續(xù)數(shù)據(jù)同步和驗證。
36、有益效果:本發(fā)明通過集成高效的緩存策略、增量傳輸技術,以及基于深度強化學習的智能探測路徑規(guī)劃算法,成功解決了現(xiàn)代網(wǎng)絡管理中數(shù)據(jù)冗余和傳輸量過大的難題。該系統(tǒng)能夠智能地存儲并復用關鍵網(wǎng)絡信息,僅傳輸必要的變化數(shù)據(jù),從而顯著降低了網(wǎng)絡帶寬的消耗和控制平面的處理負擔。同時,其靈活的緩存路由器升級方案和智能路徑規(guī)劃能力,確保了網(wǎng)絡遙測的全面性和高效性,為現(xiàn)代網(wǎng)絡管理帶來了前所未有的便捷與性能提升。