一種基于分段的sbr多屬性數(shù)據(jù)壓縮方法
【專利摘要】本發(fā)明提供了一種基于分段的SBR多屬性數(shù)據(jù)壓縮算法。其主要包括:對于采集來的多種屬性的性能數(shù)據(jù),通過相關(guān)系數(shù)矩陣將屬性分為基信號和非基信號;用基信號回歸表示非基信號并得出回歸參數(shù),若由回歸參數(shù)表示的預(yù)測值與實際值的誤差大于閾值,則將屬性進行分段,再進行回歸表示,直到誤差小于閾值;最后只需傳送基信號和回歸參數(shù)。本發(fā)明提出的方法在滿足一定誤差要求的前提下,能夠壓縮待傳輸?shù)男阅軘?shù)據(jù),節(jié)省了帶寬,提高了性能數(shù)據(jù)的傳輸效率。
【專利說明】—種基于分段的SBR多屬性數(shù)據(jù)壓縮方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于分段的SBR多屬性數(shù)據(jù)壓縮方法。本發(fā)明屬于異構(gòu)網(wǎng)絡(luò)領(lǐng)域,涉及異構(gòu)網(wǎng)絡(luò)性能管理中對性能數(shù)據(jù)進行壓縮處理的方法。
【背景技術(shù)】
[0002]隨著無線網(wǎng)絡(luò)技術(shù)(蜂窩網(wǎng)絡(luò)、衛(wèi)星網(wǎng)絡(luò)、移動自組網(wǎng)、傳感器網(wǎng)絡(luò)等)的發(fā)展,計算機網(wǎng)絡(luò)已經(jīng)不再局限于有線、單一同構(gòu)網(wǎng)絡(luò)了,而是呈現(xiàn)高度異構(gòu)化的趨勢即向異構(gòu)網(wǎng)絡(luò)方向發(fā)展。異構(gòu)網(wǎng)絡(luò)不是一個新興的網(wǎng)絡(luò),而是將原有的網(wǎng)絡(luò)(例如高速有線網(wǎng)絡(luò)、低速移動無線網(wǎng)絡(luò)和衛(wèi)星通信網(wǎng)絡(luò)等)中不同的網(wǎng)絡(luò)設(shè)備,不同通信技術(shù)和不同網(wǎng)絡(luò)協(xié)議相互連接而形成的網(wǎng)絡(luò)形態(tài)。
[0003]異構(gòu)網(wǎng)絡(luò)不是一個新興的網(wǎng)絡(luò),它是將現(xiàn)有的多種網(wǎng)絡(luò)協(xié)同組合成一個整體的混合網(wǎng)絡(luò)。由于包含的網(wǎng)絡(luò)設(shè)備數(shù)量龐大、種類繁多、功能迥異、結(jié)構(gòu)多樣,而且隨著網(wǎng)絡(luò)規(guī)模不斷擴大,網(wǎng)絡(luò)的復(fù)雜程度不斷的增加,當(dāng)多個異構(gòu)網(wǎng)連在一起時,經(jīng)常出現(xiàn)無法預(yù)知的交互作用,這種復(fù)雜性經(jīng)常會導(dǎo)致性能下降,迫切需要對異構(gòu)網(wǎng)絡(luò)進行管理和監(jiān)控。
[0004]異構(gòu)網(wǎng)絡(luò)包含多個網(wǎng)絡(luò)的不同設(shè)備,為了保證不同設(shè)備的正常運行,網(wǎng)絡(luò)管理系統(tǒng)需要實時監(jiān)測異構(gòu)網(wǎng)絡(luò)中的網(wǎng)絡(luò)參數(shù)和設(shè)備參數(shù),設(shè)備種類的繁多造成海量性能數(shù)據(jù),其在傳輸?shù)倪^程中不僅占據(jù)大量帶寬,而且影響性能數(shù)據(jù)的傳輸?shù)男省S捎谛阅軘?shù)據(jù)間具有相關(guān)性,如何在保證性能數(shù)據(jù)傳輸不失真的情況下,減少大量的性能數(shù)據(jù),是目前急需解決的問題。
【發(fā)明內(nèi)容】
[0005]技術(shù)問題:本發(fā)明針對異構(gòu)網(wǎng)絡(luò)中海量性能數(shù)據(jù)占據(jù)大量帶寬,影響傳輸效率問題,提供一種基于分段的SBR多屬性數(shù)據(jù)壓縮方法,用來去除屬性間的冗余性,減少待傳輸?shù)男阅軘?shù)據(jù)量,節(jié)省帶寬資源,提高數(shù)據(jù)傳輸效率。
[0006]技術(shù)方案:本發(fā)明的基于分段的SBR多屬性數(shù)據(jù)壓縮方法,包括如下步驟:
[0007]I)對于采集來的性能數(shù)據(jù),根據(jù)屬性間的相關(guān)性,計算相關(guān)系數(shù)矩陣,規(guī)范化誤差和收:EifL界;
[0008]2)建立基集合BaseSet和候選集合CandSet,把所有屬性初始化為候選集合;
[0009]3)計算相關(guān)系數(shù)矩陣中每行相關(guān)系數(shù)的絕對值之和,并把值最大的那個屬性劃歸到基集合中,作為第一個基信號;
[0010]4)計算剩余屬性的期望收益;
[0011]5)若期望收益大于收益界,則把相對應(yīng)的屬性劃歸到基集合中作為基信號,并執(zhí)行4);若期望收益小于收益界,則相對應(yīng)的屬性保留在候選屬性中作為非基信號;
[0012]6)用基信號線性表示非基信號,并得出回歸參數(shù);
[0013]7)利用基于分段的SBR算法計算預(yù)測值與實際值之間的誤差平方和,若誤差平方和大于閾值,則對屬性數(shù)據(jù)進行分段,并執(zhí)行6);若誤差平方和小于閾值,則線性表示結(jié)束,傳輸基信號,對于非基信號,只需傳輸相對應(yīng)的回歸參數(shù)即可。
[0014]收益界的選取決定了基信號的個數(shù),收益界越大,基信號越少,誤差越大,數(shù)據(jù)壓縮效率越高。因此誤差平方和進行判決的閾值采用收益界值。
【專利附圖】
【附圖說明】
[0015]圖1是本發(fā)明的異構(gòu)網(wǎng)絡(luò)性能管理架構(gòu)圖。
[0016]圖2基于本發(fā)明的異構(gòu)網(wǎng)絡(luò)性能數(shù)據(jù)處理流程。
[0017]圖3是本發(fā)明的基于分段的SBR算法流程圖。
【具體實施方式】
[0018]下面結(jié)合附表和附圖與【具體實施方式】對本發(fā)明作進一步詳細描述。
[0019]圖1是本發(fā)明的異構(gòu)網(wǎng)絡(luò)性能管理架構(gòu)圖,性能數(shù)據(jù)在異構(gòu)網(wǎng)絡(luò)中的處理流程為:
[0020](I)數(shù)據(jù)采集器以周期輪訓(xùn)的方式采集異構(gòu)網(wǎng)絡(luò)中的用戶設(shè)備和網(wǎng)絡(luò)設(shè)備的性能數(shù)據(jù),如流量、負載、丟包、設(shè)備溫度、CPU利用率、網(wǎng)絡(luò)延遲,性能數(shù)據(jù)通過傳輸設(shè)備(路由器或交換機)進行傳輸,然后存儲在局部數(shù)據(jù)庫中;
[0021](2)網(wǎng)管軟件從局部數(shù)據(jù)庫提取實時性能數(shù)據(jù)和當(dāng)前歷史性能數(shù)據(jù),通過對性能數(shù)據(jù)分析、統(tǒng)計、整理 ,生成性能報告、發(fā)出相應(yīng)的性能配置指令,并把有關(guān)的性能數(shù)據(jù)存儲在全局數(shù)據(jù)庫中。
[0022]考慮到異構(gòu)網(wǎng)絡(luò)是一個混合的網(wǎng)絡(luò),包含多個網(wǎng)絡(luò)的不同設(shè)備,設(shè)備種類的繁多造成海量性能數(shù)據(jù),其在傳輸?shù)倪^程中不僅占據(jù)大量帶寬,而且影響性能數(shù)據(jù)的傳輸?shù)男省S捎谛阅軘?shù)據(jù)具有相關(guān)性,因此本發(fā)明提供一種基于分段的SBR算法,以收益界做為判決門限,并采用分段近似回歸的方法處理處理屬性間的相關(guān)性。該方法作用在傳輸設(shè)備中(如路由器或交換機),用于去除性能數(shù)據(jù)間的冗余性,減少性能數(shù)據(jù)的傳輸量,達到節(jié)省帶寬,提高性能數(shù)據(jù)傳輸效率的目的。圖2為基于本發(fā)明的異構(gòu)網(wǎng)絡(luò)性能數(shù)據(jù)處理流程。
[0023]下面給出本發(fā)明的具體實施案例:
[0024](I)設(shè)路由器或交換機中存儲了 N個時刻采集的某一設(shè)備M種屬性的性能數(shù)據(jù),用矩陣表示為:
-^0,0λυ I…λυ I
「^「1 C0 Xl,l …氣況-1
[0025]S = , =...*隹拿.,,*
**..xM-U …XM-hN-\ _
[0026]其中,Xi表示設(shè)備的第i種屬性,Xijj表示第i種屬性的第j個釆樣值。
COV(ZJ)|[(z,_ 聯(lián)朋)]
[0027]根據(jù)相關(guān)系數(shù)公式,丨'。二 j I =卜|V_,,計算屬性
V VΣ(ζ,-£(Ζ))2 [(.V,-£(},)):
V /-οV /-ο間的相關(guān)系數(shù)矩陣為
【權(quán)利要求】
1.一種基于分段的SBR多屬性數(shù)據(jù)壓縮方法,其特征在于包含以下步驟: 1)根據(jù)屬性間的相關(guān)性,計算相關(guān)系數(shù)矩陣,規(guī)范化誤差和收益界; 2)建立基集合BaseSet和候選集合CandSet,把所有屬性初始化為候選集合; 3)計算相關(guān)系數(shù)矩陣中每行相關(guān)系數(shù)的絕對值之和,并把值最大的那個屬性劃歸到基集合中,作為第一個基信號; 4)計算剩余屬性的期望收益; 5)若期望收益大于收益界,則把相對應(yīng)的屬性劃歸到基集合中作為基信號,并執(zhí)行4);若期望收益小于收益界,則相對應(yīng)的屬性保留在候選屬性中作為非基信號; 6)用基信號線性表示非基信號,并得出回歸參數(shù); 7)利用基于分段的SBR算法計算預(yù)測值與實際值之間的誤差平方和,若誤差平方和大于閾值,則對屬性數(shù)據(jù)進行分段,并執(zhí)行6);若誤差平方和小于閾值,則線性表不結(jié)束,傳輸基信號,對于非基信號,只需傳輸相對應(yīng)的回歸參數(shù)即可。
2.根據(jù)權(quán)利要求1所述的一種基于分段的SBR多屬性數(shù)據(jù)壓縮方法,其特征在于步驟O中,按照下式計算收益界值:
3.根據(jù)權(quán)利要求1所述的一種基于分段的SBR多屬性數(shù)據(jù)壓縮方法,其特征在于步驟7)中,按照下式計算預(yù)測值與實際值之間的誤差平方和:
【文檔編號】H03M7/30GK103795420SQ201410046933
【公開日】2014年5月14日 申請日期:2014年2月10日 優(yōu)先權(quán)日:2014年2月10日
【發(fā)明者】張登銀, 李秀云 申請人:南京郵電大學(xué)