專利名稱:自適應的差分自回歸移動平均模型的流量預測方法和系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及機房流量的實時監(jiān)控技術,尤其是利用差分自回歸移動平均模型 (Auto Regressive Integrated Moving Average Model,簡記為 ARIMA 模型)對流量進行預測的方法和系統(tǒng)。
背景技術:
ARIMA模型的基本思想是將預測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預測未來值。ARIMA模型預測的基本程序如圖1所示1.根據(jù)時間序列的散點圖、自相關函數(shù)和偏自相關函數(shù)圖以ACF單位根檢驗其方差、趨勢及其季節(jié)性變化規(guī)律,對序列的平穩(wěn)性進行識別。一般來講,機房流量的時間序列都不是平穩(wěn)序列。2.對非平穩(wěn)序列進行平穩(wěn)化處理。如果數(shù)據(jù)序列是非平穩(wěn)的,并存在一定的增長或下降趨勢,則需要對數(shù)據(jù)進行差分處理,如果數(shù)據(jù)存在異方差,則需對數(shù)據(jù)進行技術處理,直到處理后的數(shù)據(jù)的自相關函數(shù)值和偏相關函數(shù)值無顯著地異于零。3.根據(jù)時間序列模型的識別規(guī)則,建立相應的模型。若平穩(wěn)序列的偏相關函數(shù)是截尾的,而自相關函數(shù)是拖尾的,可斷定序列適合AR模型;若平穩(wěn)序列的偏相關函數(shù)是拖尾的,而自相關函數(shù)是截尾的,則可斷定序列適合MA模型;若平穩(wěn)序列的偏相關函數(shù)和自相關函數(shù)均是拖尾的,則序列適合ARIMA模型。4.進行參數(shù)估計,檢驗是否具有統(tǒng)計意義。5.進行假設檢驗,診斷殘差序列是否為白噪聲。6.利用已通過檢驗的模型進行預測分析。在監(jiān)控機房流量并進行實時預測時,單純地尋找一固定模型來進行預測并監(jiān)控存在兩個弊端一是隨著時間的推移,數(shù)據(jù)的分布可能由于外在因素發(fā)生改變,故此時模型將不再適用;二是當模型監(jiān)控到發(fā)生異常時,對于當前的異常數(shù)據(jù)屬于臟數(shù)據(jù)不能帶入模型進行擬合,此時也就不能進行預測分析下一時間段的流量值。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題,提供了一種自適應的差分自回歸移動平均模型的流量預測方法,一方面對模型進行改進,通過數(shù)據(jù)本身的特點進行實時的模型修正,可使得模型能夠吻合當前的數(shù)據(jù)特性;另一方面,可通過啟動備選方案根據(jù)數(shù)據(jù)本身的特點進行預測分析,監(jiān)控流量的情況,待數(shù)據(jù)正常時,再次啟動ARIMA模型進行預測分析并監(jiān)控流量。本發(fā)明的另一目的在于提供了一種自適應的差分自回歸移動平均模型的流量預測系統(tǒng),一方面對模型進行改進,通過數(shù)據(jù)本身的特點進行實時的模型修正,可使得模型能夠吻合當前的數(shù)據(jù)特性;另一方面,可通過啟動備選方案根據(jù)數(shù)據(jù)本身的特點進行預測分析,監(jiān)控流量的情況,待數(shù)據(jù)正常時,再次啟動ARIMA模型進行預測分析并監(jiān)控流量。本發(fā)明的技術方案為本發(fā)明揭示了一種自適應的差分自回歸移動平均模型的流量預測方法,包括步驟1 通過歷史數(shù)據(jù)的學習,獲得初始的差分自回歸移動平均ARIMA模型;步驟2 將當前時刻的前m個數(shù)據(jù)點代入所述ARIMA模型中進行計算,預測出下η 個時刻的流量值及其置信區(qū)間,其中m和η均為自然數(shù)且!11 > η ;步驟3 判斷實際的流量值是否位于預測的所述置信區(qū)間內(nèi),如果不在所述置信區(qū)間內(nèi),則進行步驟4,如果位于所述置信區(qū)間內(nèi),則進行步驟5 ;步驟4:啟動備選方案替代所述ARIMA模型,判別當前時刻的實際的流量值與前一時刻的流量值之差的絕對值是否超過一臨界值,若超過則報警;步驟5 利用當前時刻的預測值與前一時刻實際的流量值進行比較,若兩者之差的絕對值大于所述臨界值,則啟動所述ARIMA模型的再學習以修改所述ARIMA模型的參數(shù)。根據(jù)本發(fā)明的自適應的差分自回歸移動平均模型的流量預測方法的一實施例,在步驟4中,若當前時刻的實際的流量值與前一時刻的流量值之差的絕對值未超過所述預設的臨界值,則記錄無報警的次數(shù),待連續(xù)m個時間點無報警時,提示是否繼續(xù)進行所述 ARIMA模型的預測。根據(jù)本發(fā)明的自適應的差分自回歸移動平均模型的流量預測方法的一實施例,在步驟4中,在啟動備選方案后,將m個時間點的位于所述置信區(qū)間內(nèi)的流量值導入,根據(jù)所導入的所述流量值,基于其差分后的數(shù)據(jù)滿足正態(tài)分布,計算其均值和標準差,計算出發(fā)生小概率事件ρ的所述臨界值,其中參數(shù)ρ是指事件發(fā)生的概率。本發(fā)明還揭示了一種自適應的差分自回歸移動平均模型的流量預測系統(tǒng),包括初始模型獲取裝置,通過歷史數(shù)據(jù)的學習,獲得初始的差分自回歸移動平均ARIMA 模型;置信區(qū)間預測裝置,將當前時刻的前m個數(shù)據(jù)點代入所述ARIMA模型中進行計算, 預測出下η個時刻的流量值及其置信區(qū)間,其中m和η均為自然數(shù)且m > η ;偏離檢測裝置,判斷實際的流量值是否位于預測的所述置信區(qū)間內(nèi),如果不在所述置信區(qū)間內(nèi),則進入備選方案運行裝置,如果位于所述置信區(qū)間內(nèi),則進入模型參數(shù)校驗
裝置;備選方案運行裝置,啟動備選方案替代所述ARIMA模型,判別當前時刻的實際的流量值與前一時刻的流量值之差的絕對值是否超過一臨界值,若超過則報警;模型參數(shù)校驗裝置,利用當前時刻的預測值與前一時刻實際的流量值進行比較, 若兩者之差的絕對值大于所述臨界值,則啟動所述ARIMA模型的再學習以修改所述ARIMA 模型的參數(shù)。根據(jù)本發(fā)明的自適應的差分自回歸移動平均模型的流量預測系統(tǒng)的一實施例,在備選方案運行裝置中,若當前時刻的實際的流量值與前一時刻的流量值之差的絕對值未超過所述預設的臨界值,則記錄無報警的次數(shù),待連續(xù)m個時間點無報警時,提示是否繼續(xù)進行所述ARIMA模型的預測。根據(jù)本發(fā)明的自適應的差分自回歸移動平均模型的流量預測系統(tǒng)的一實施例,在備選方案運行裝置中,在啟動備選方案后,將m個時間點的位于所述置信區(qū)間內(nèi)的流量值導入,根據(jù)所導入的所述流量值,基于其差分后的數(shù)據(jù)滿足正態(tài)分布,計算其均值和標準差,計算出發(fā)生小概率事件P的所述臨界值,其中參數(shù)P是指事件發(fā)生的概率。本發(fā)明對比現(xiàn)有技術有如下的有益效果本發(fā)明的方案是利用ARIMA模型對流量進行預測,當實際值偏離預測的置信區(qū)間時,產(chǎn)生報警;產(chǎn)生報警的同時,啟動備選方案來進行監(jiān)控流量數(shù)據(jù),用以防止異常數(shù)據(jù)進入ARIMA模型預測;在ARIMA模型正常運作時,實時判別ARIMA模型的參數(shù)是否還適用,若發(fā)現(xiàn)不再適用時,自動進行再學習,通過再學習獲得新的模型參數(shù),以此提高模型預測的準確性。對比現(xiàn)有技術,本發(fā)明是針對傳統(tǒng)的ARIMA 模型存在的兩個弊端進行的模型無法實時進行學習及無法自動排除臟數(shù)據(jù),改進后自適應的差分自回歸移動平均模型的流量預測方法主要是通過實時的模型自學習,讓模型更加的吻合當前流量的數(shù)據(jù)走勢,同時,當出現(xiàn)異常時,可根據(jù)數(shù)據(jù)本身的特性,替代ARIMA模型進行流量監(jiān)控,從而不將異常數(shù)據(jù)放入ARIMA模型中進行數(shù)據(jù)擬合。對比傳統(tǒng)的模型,本發(fā)明可以做到實時自學習,可以在盡可能不增加機器負載的情況下,當模型出現(xiàn)偏差時,立即啟動自學習,使得模型更好地擬合當前的數(shù)據(jù)走勢。備選方案是在模型監(jiān)控到異常數(shù)據(jù)時,可通過啟動備選方案代替模型進行監(jiān)控,此時異常數(shù)據(jù)也就不進入模型,待數(shù)據(jù)回復正常時,正常數(shù)據(jù)帶入模型繼續(xù)進行預測并監(jiān)控流量。
圖1示出了用ARIMA模型進行預測的流程圖。圖2示出了本發(fā)明的自適應的差分自回歸移動平均模型的流量預測方法的實施例的流程圖。圖3示出了本發(fā)明的啟動備選方案后的流程示意圖。圖4示出了本發(fā)明的自適應的差分自回歸移動平均模型的流量預測系統(tǒng)的實施例的原理圖。
具體實施例方式下面結(jié)合附圖和實施例對本發(fā)明作進一步的描述。自i舌應的差分自回15 云力平均樽型的流予頁測丨方法的實施例圖2示出了本發(fā)明的自適應的差分自回歸移動平均模型的流量預測方法的實施例的流程。請參見圖2,下面是對本實施例的方法中的各個步驟的詳細描述。步驟SlOO 通過歷史數(shù)據(jù)的學習,獲得初始的差分自回歸移動平均ARIMA模型。ARIMA是一種典型的時間序列分析算法,通過歷史數(shù)據(jù)帶入模型進行學習,確定模型的參數(shù)。對歷史數(shù)據(jù)進行學習是為了確定模型的參數(shù)以便于后續(xù)實時數(shù)據(jù)可直接帶入有確定參數(shù)的ARIMA直接計算,而不需再次去擬合數(shù)據(jù)計算及確認參數(shù)。獲得初始ARIMA模型的過程是現(xiàn)有技術,在此不在贅述。步驟SlOl 將當前時刻的前m個數(shù)據(jù)點代入ARIMA模型中進行計算,其中m為自然數(shù)。步驟S102 預測出下η個時刻的流量值及其置信區(qū)間,其中η為自然數(shù)且111 > η。步驟S103 判斷實際的流量值是否位于預測的所述置信區(qū)間內(nèi),如果不在置信區(qū)間內(nèi),則判斷為異常點,進行步驟S106,如果位于置信區(qū)間內(nèi),則進行步驟S104。步驟S104 判斷當前時刻的預測值與前一時刻實際的流量值的差的絕對值是否超過臨界值,如果超過則進入步驟S105。對歷史流量作差分,得到一差分序列,發(fā)現(xiàn)其滿足均值為0的正態(tài)分布,故計算其 95%的置信區(qū)間(這里可假設95%的置信區(qū)間為[_b,b]),從而得到這一臨界值b。步驟S105 啟動ARIMA模型的再學習,修改ARIMA模型的參數(shù)。步驟S106 啟動備選方案代替ARIMA模型。備選方案的主要思想是通過對數(shù)據(jù)特性的分析,發(fā)現(xiàn)對機房流量數(shù)據(jù)做差分后, 其差分后的數(shù)據(jù)分布近似于正態(tài)分布,此時可根據(jù)概率論,進行步驟S107。啟動備選方案的過程如圖3所示,先將m個時間點的位于置信區(qū)間內(nèi)的流量值導入,根據(jù)所導入的流量值,基于其差分后的數(shù)據(jù)滿足正態(tài)分布,計算其均值和標準差,計算出發(fā)生小概率事件P的臨界值,其中參數(shù)P是指事件發(fā)生的概率,一般設置為0. 1,0. 05或 0. 01。步驟S107 判別當前時刻的實際的流量值與前一時刻的流量值之差的絕對值是否大于臨界值,若超過則進入步驟S108,如果沒有超過則進入步驟S109??磪?shù)是否合理,主要是通過觀察其預測值和前一刻的實際值相減的絕對值是否超過了臨界值b (也就是用了備選方案里面的臨界值來檢驗模型參數(shù)的合理性),備選方案的精確性沒有ARIMA高,其不能體現(xiàn)數(shù)據(jù)的周期性,波動性,趨勢性。若大于臨界值說明其發(fā)生了小概率事件,也就是說這一情況發(fā)生的概率小于概率P。步驟S108 報警,流程結(jié)束。步驟S109 記錄無報警的次數(shù),進入步驟S110。步驟SllO 待連續(xù)m個時間點無報警時,提示用戶是否繼續(xù)進行所述ARIMA模型的預測。如果用戶選擇繼續(xù)預測則返回至步驟S100。自i舌應的差分圖4示出了本發(fā)明的自適應的差分自回歸移動平均模型的流量預測系統(tǒng)的實施例的原理。請參見圖4,本實施例的系統(tǒng)包括初始模型獲取裝置10、置信區(qū)間預測裝置11、 偏離預測裝置12、備選方案運行裝置13以及模型參數(shù)校驗裝置14。初始模型獲取裝置10通過歷史數(shù)據(jù)的學習,獲得初始的差分自回歸移動平均 ARIMA模型。置信區(qū)間預測裝置11將當前時刻的前m個數(shù)據(jù)點代入ARIMA模型中進行計算,預測出下η個時刻的流量值及其置信區(qū)間,其中m和η均為自然數(shù)且m > η。偏離檢測裝置12判斷實際的流量值是否位于預測的置信區(qū)間內(nèi),如果不在置信區(qū)間內(nèi),則進入備選方案運行裝置13,如果位于置信區(qū)間內(nèi),則進入模型參數(shù)校驗裝置14。備選方案運行裝置13啟動備選方案替代所述ARIMA模型,判別當前時刻的實際的流量值與前一時刻的流量值之差的絕對值是否超過一臨界值,若超過則報警。在備選方案運行裝置13中,在啟動備選方案后,將m個時間點的位于所述置信區(qū)間內(nèi)的流量值導入,根據(jù)所導入的所述流量值,基于其差分后的數(shù)據(jù)滿足正態(tài)分布,計算其均值和標準差,計算出發(fā)生小概率事件P的臨界值,其中參數(shù)P是指事件發(fā)生的概率。若當前時刻的實際的流量值與前一時刻的流量值之差的絕對值未超過預設的臨界值,則記錄無報警的次數(shù),待連續(xù)m個時間點無報警時,提示是否繼續(xù)進行所述ARIMA模型的預測。模型參數(shù)校驗裝置14檢查ARIMA模型的參數(shù)是否合理,是否吻合當前的數(shù)據(jù)特性。即,利用當前時刻的預測值與前一時刻實際的流量值進行比較,若兩者之差的絕對值大于臨界值,則啟動ARIMA模型的再學習,修改ARIMA模型的參數(shù)。上述實施例是提供給本領域普通技術人員來實現(xiàn)和使用本發(fā)明的,本領域普通技術人員可在不脫離本發(fā)明的發(fā)明思想的情況下,對上述實施例做出種種修改或變化,因而本發(fā)明的發(fā)明范圍并不被上述實施例所限,而應該是符合權(quán)利要求書所提到的創(chuàng)新性特征的最大范圍。
權(quán)利要求
1.一種自適應的差分自回歸移動平均模型的流量預測方法,包括步驟1 通過歷史數(shù)據(jù)的學習,獲得初始的差分自回歸移動平均ARIMA模型;步驟2 將當前時刻的前m個數(shù)據(jù)點代入所述ARIMA模型中進行計算,預測出下η個時刻的流量值及其置信區(qū)間,其中m和η均為自然數(shù)且m > η ;步驟3 判斷實際的流量值是否位于預測的所述置信區(qū)間內(nèi),如果不在所述置信區(qū)間內(nèi),則進行步驟4,如果位于所述置信區(qū)間內(nèi),則進行步驟5 ;步驟4 啟動備選方案替代所述ARIMA模型,判別當前時刻的實際的流量值與前一時刻的流量值之差的絕對值是否超過一臨界值,若超過則報警;步驟5:利用當前時刻的預測值與前一時刻實際的流量值進行比較,若兩者之差的絕對值大于所述臨界值,則啟動所述ARIMA模型的再學習以修改所述ARIMA模型的參數(shù)。
2.根據(jù)權(quán)利要求1所述的自適應的差分自回歸移動平均模型的流量預測方法,其特征在于,在步驟4中,若當前時刻的實際的流量值與前一時刻的流量值之差的絕對值未超過所述預設的臨界值,則記錄無報警的次數(shù),待連續(xù)m個時間點無報警時,提示是否繼續(xù)進行所述ARIMA模型的預測。
3.根據(jù)權(quán)利要求1所述的自適應的差分自回歸移動平均模型的流量預測方法,其特征在于,在步驟4中,在啟動備選方案后,將m個時間點的位于所述置信區(qū)間內(nèi)的流量值導入, 根據(jù)所導入的所述流量值,基于其差分后的數(shù)據(jù)滿足正態(tài)分布,計算其均值和標準差,計算出發(fā)生小概率事件P的所述臨界值,其中參數(shù)P是指事件發(fā)生的概率。
4.一種自適應的差分自回歸移動平均模型的流量預測系統(tǒng),包括初始模型獲取裝置,通過歷史數(shù)據(jù)的學習,獲得初始的差分自回歸移動平均ARIMA模型;置信區(qū)間預測裝置,將當前時刻的前m個數(shù)據(jù)點代入所述ARIMA模型中進行計算,預測出下η個時刻的流量值及其置信區(qū)間,其中m和η均為自然數(shù)且m > η ;偏離檢測裝置,判斷實際的流量值是否位于預測的所述置信區(qū)間內(nèi),如果不在所述置信區(qū)間內(nèi),則進入備選方案運行裝置,如果位于所述置信區(qū)間內(nèi),則進入模型參數(shù)校驗裝置;備選方案運行裝置,啟動備選方案替代所述ARIMA模型,判別當前時刻的實際的流量值與前一時刻的流量值之差的絕對值是否超過一臨界值,若超過則報警;模型參數(shù)校驗裝置,利用當前時刻的預測值與前一時刻實際的流量值進行比較,若兩者之差的絕對值大于所述臨界值,則啟動所述ARIMA模型的再學習以修改所述ARIMA模型的參數(shù)。
5.根據(jù)權(quán)利要求4所述的自適應的差分自回歸移動平均模型的流量預測系統(tǒng),其特征在于,在備選方案運行裝置中,若當前時刻的實際的流量值與前一時刻的流量值之差的絕對值未超過所述預設的臨界值,則記錄無報警的次數(shù),待連續(xù)m個時間點無報警時,提示是否繼續(xù)進行所述ARIMA模型的預測。
6.根據(jù)權(quán)利要求4所述的自適應的差分自回歸移動平均模型的流量預測系統(tǒng),其特征在于,在備選方案運行裝置中,在啟動備選方案后,將m個時間點的位于所述置信區(qū)間內(nèi)的流量值導入,根據(jù)所導入的所述流量值,基于其差分后的數(shù)據(jù)滿足正態(tài)分布,計算其均值和標準差,計算出發(fā)生小概率事件P的所述臨界值,其中參數(shù)P是指事件發(fā)生的概率。
全文摘要
本發(fā)明公開了自適應的差分自回歸移動平均模型的流量預測方法和系統(tǒng),讓模型更加的吻合當前流量的數(shù)據(jù)走勢。其技術方案為利用ARIMA模型對流量進行預測,當實際值偏離預測的置信區(qū)間時,產(chǎn)生報警;產(chǎn)生報警的同時,啟動備選方案來進行監(jiān)控流量數(shù)據(jù),用以防止異常數(shù)據(jù)進入ARIMA模型預測;在ARIMA模型正常運作時,實時判別ARIMA模型的參數(shù)是否還適用,若發(fā)現(xiàn)不再適用時,自動進行再學習,通過再學習獲得新的模型參數(shù),以此提高模型預測的準確性。
文檔編號H04L12/26GK102355381SQ20111023761
公開日2012年2月15日 申請日期2011年8月18日 優(yōu)先權(quán)日2011年8月18日
發(fā)明者劉成彥, 洪珂, 洪遠芳 申請人:網(wǎng)宿科技股份有限公司