一種基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于信息技術(shù)領(lǐng)域,涉及一種電網(wǎng)信息運(yùn)維的預(yù)警方法,具體涉及一種基 于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法。
【背景技術(shù)】
[0002] 近年來,隨著信息化建設(shè)的快速發(fā)展,電網(wǎng)公司信息系統(tǒng)數(shù)量不斷增加,對日常運(yùn) 維提出了更高的標(biāo)準(zhǔn)和需求。目前主要采取在故障發(fā)生之后進(jìn)行告警和搶修的被動(dòng)運(yùn)維模 式,這種模式導(dǎo)致運(yùn)維人員將日常大部分時(shí)間和精力都花在處理簡單且重復(fù)的"被動(dòng)救火" 問題上,不但事倍功半而且常會(huì)出現(xiàn)惡性連鎖反應(yīng)。缺乏在故障發(fā)生之前對信息運(yùn)維體系 進(jìn)行提前預(yù)警的能力,缺乏對運(yùn)維隱患進(jìn)行定位和分析的能力,亟需實(shí)現(xiàn)以預(yù)防為主的主 動(dòng)運(yùn)維模式。
[0003] 通過對試點(diǎn)單位信息運(yùn)維故障的統(tǒng)計(jì)情況分析發(fā)現(xiàn),內(nèi)存泄漏問題、歸檔日志問 題以及數(shù)據(jù)庫連接問題等絕大部分信息運(yùn)維故障可在發(fā)生前獲取相關(guān)信息,通過風(fēng)險(xiǎn)評(píng)估 可以對信息運(yùn)維體系進(jìn)行預(yù)警,阻止故障發(fā)生。此外,隨著信息運(yùn)維業(yè)務(wù)的發(fā)展,大量數(shù)據(jù) 不斷生成和積累,但目前對只有一些最基礎(chǔ)的分析手段,未能實(shí)現(xiàn)信息運(yùn)維數(shù)據(jù)價(jià)值。實(shí)現(xiàn) 基于大數(shù)據(jù)的信息運(yùn)維主動(dòng)預(yù)警,可以對信息運(yùn)維數(shù)據(jù)進(jìn)行有效分析挖掘,在故障發(fā)生之 前實(shí)現(xiàn)故障定位、故障分析及故障預(yù)警,提升公司信息運(yùn)維效率,促進(jìn)公司業(yè)務(wù)發(fā)展。
[0004] 目前在信息運(yùn)維主動(dòng)預(yù)警方面還存在著以下不足:
[0005] -、目前公司的信息運(yùn)維體系實(shí)現(xiàn)了事后報(bào)警,并初步實(shí)現(xiàn)了實(shí)時(shí)告警,但并未實(shí) 現(xiàn)主動(dòng)預(yù)警,缺乏在信息運(yùn)維體系出現(xiàn)隱患和異常時(shí)就對其進(jìn)行預(yù)警的能力,缺乏解決隱 患的能力,缺乏配套的管理體制;
[0006] 二、未能建立信息運(yùn)維主動(dòng)預(yù)警方法體系,缺乏信息運(yùn)維主動(dòng)預(yù)警的理論支持和 實(shí)現(xiàn)手段;
[0007] 三、未能利用大數(shù)據(jù)技術(shù)對信息運(yùn)維數(shù)據(jù)進(jìn)行有效管理,未能建立科學(xué)合理的運(yùn) 行數(shù)據(jù)分析體系和業(yè)務(wù)事項(xiàng)分析體系,亟需提升數(shù)據(jù)分析手段,實(shí)現(xiàn)運(yùn)維數(shù)據(jù)價(jià)值。
【發(fā)明內(nèi)容】
[0008] 發(fā)明目的:本發(fā)明的目的是為了解決以上現(xiàn)有技術(shù)中信息運(yùn)維電網(wǎng)系統(tǒng)無主動(dòng)預(yù) 警的不足,提供一種基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法,從而為電網(wǎng)系統(tǒng)的安全運(yùn) tx提供有力保障。
[0009] 技術(shù)方案:本發(fā)明所述的基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法,其目的是這 樣實(shí)現(xiàn)的,
[0010] -種基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法,其特征在于,包括如下步驟:
[0011] M01 :狀態(tài)預(yù)警,通過對電網(wǎng)節(jié)點(diǎn)之間的信息資源進(jìn)行探測并獲取結(jié)果,將信息資 源狀態(tài)分為正常狀態(tài)、失聯(lián)狀態(tài)和不穩(wěn)定狀態(tài)三類;
[0012] 如果信息資源處于失聯(lián)狀態(tài),需要進(jìn)行告警;如果信息資源處于不穩(wěn)定狀態(tài),需要 進(jìn)行狀態(tài)預(yù)警;
[0013] M02:閾值預(yù)警,通過對電網(wǎng)節(jié)點(diǎn)的信息資源的數(shù)值與預(yù)先設(shè)定的閾值進(jìn)行比較, 若超出閾值,則進(jìn)行預(yù)警或告警;
[0014] M03 :快變預(yù)警,包括橫向預(yù)警和縱向預(yù)警;
[0015] 橫向預(yù)警為任一電網(wǎng)節(jié)點(diǎn)的信息資源的數(shù)值與和該節(jié)點(diǎn)并列的同類節(jié)點(diǎn)的數(shù)值 進(jìn)行比較,超出一定的閾值則進(jìn)行預(yù)警,建立兩個(gè)電網(wǎng)節(jié)點(diǎn)信息資源數(shù)值比較的數(shù)學(xué)模 型:
[0017] 式中,31<表不第k臺(tái)設(shè)備的負(fù)載,S ;表不第i臺(tái)設(shè)備的負(fù)載,η為總設(shè)備數(shù)量,η為 大于1的自然數(shù),α為快變閾值,由用戶配置;
[0018] 縱向預(yù)警為任一電網(wǎng)節(jié)點(diǎn)的信息資源的數(shù)值與該節(jié)點(diǎn)自身的歷史數(shù)據(jù)進(jìn)行比較, 超出一定的閾值則進(jìn)行預(yù)警,通過對該節(jié)點(diǎn)信息資源的歷史運(yùn)行數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,限制 該節(jié)點(diǎn)合理的運(yùn)行范圍,建立該運(yùn)行范圍的數(shù)學(xué)模型:
[0020] 式中,1_和Τ_分別為該電網(wǎng)節(jié)點(diǎn)的上閾值和下閾值,1?_和R_分別為經(jīng)過數(shù)據(jù) 清洗的歷史運(yùn)行數(shù)據(jù)最大值和最小值,A為歷史數(shù)據(jù)的平均值,L代表該電網(wǎng)節(jié)點(diǎn)的合理運(yùn) 行范圍;
[0021] M04:趨勢預(yù)警,對電網(wǎng)節(jié)點(diǎn)的信息資源進(jìn)行連續(xù)監(jiān)控,通過電網(wǎng)節(jié)點(diǎn)的預(yù)警閾值、 預(yù)警觸發(fā)閾值、指標(biāo)當(dāng)前值與預(yù)警閾值之間的差值、指標(biāo)增長率這四個(gè)指標(biāo)建立數(shù)學(xué)模型, 判斷當(dāng)前電網(wǎng)節(jié)點(diǎn)運(yùn)行狀態(tài),該數(shù)學(xué)模型如下:
[0023] 式中,V為該電網(wǎng)節(jié)點(diǎn)的當(dāng)前數(shù)值,V。為該電網(wǎng)節(jié)點(diǎn)在一個(gè)采集時(shí)差t之前的數(shù) 值,α、β為修正值,Z為趨勢預(yù)警閾值,其中,α、β和Z均由用戶配置,Tw為預(yù)警閾值,N 為預(yù)警觸發(fā)閾值;
[0024] M05 :評(píng)價(jià)預(yù)警,對電網(wǎng)節(jié)點(diǎn)的信息資源進(jìn)行實(shí)時(shí)監(jiān)測,并建立該電網(wǎng)節(jié)點(diǎn)評(píng)分的 數(shù)學(xué)模型:
[0026] 式中,S。為可由用戶自定義設(shè)置的初始得分,m、n、p分別為運(yùn)維監(jiān)測周期內(nèi)的告 警事件級(jí)別數(shù)量、預(yù)警事件級(jí)別數(shù)量、檢修事件級(jí)別數(shù)量,α和f分別為各級(jí)事件的權(quán)重和 次數(shù),S為最終評(píng)價(jià)得分,由用戶自定義設(shè)置閾值,實(shí)現(xiàn)評(píng)價(jià)預(yù)警;
[0027] M06 :關(guān)聯(lián)預(yù)警,對各電網(wǎng)節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘算法,以Apriori算 法為基礎(chǔ),構(gòu)建布爾矩陣,并通過分支篩選優(yōu)化,對Apriori算法中占用計(jì)算資源最多的二 項(xiàng)頻繁集計(jì)算任務(wù)進(jìn)行剪枝以提高算法效率,通過數(shù)據(jù)分析電網(wǎng)節(jié)點(diǎn)之間的關(guān)聯(lián)性,并進(jìn) 行監(jiān)控。
[0028] 如上所述的一種基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法,其特征在于,至少包 括步驟M01~M06中的任意兩項(xiàng)。
[0029] 有益效果:本發(fā)明的有益效果是:
[0030] -、設(shè)計(jì)了信息運(yùn)維主動(dòng)預(yù)警方法體系:本發(fā)明方法設(shè)計(jì)的信息運(yùn)維主動(dòng)預(yù)警方 法體系包括狀態(tài)預(yù)警、閾值預(yù)警、快變預(yù)警、趨勢預(yù)警、評(píng)價(jià)預(yù)警和關(guān)聯(lián)預(yù)警六大方法。其中 快變預(yù)警包括橫向預(yù)警和縱向預(yù)警。
[0031] 二、實(shí)現(xiàn)了信息運(yùn)維主動(dòng)預(yù)警方法與信息運(yùn)維體系的有效結(jié)合:信息運(yùn)維體系的 預(yù)警級(jí)別從低到高分別為:指標(biāo)級(jí)、頁面級(jí)、基礎(chǔ)設(shè)施級(jí)和信息系統(tǒng)級(jí)。指標(biāo)級(jí)別的主動(dòng)預(yù) 警基于狀態(tài)預(yù)警、閾值預(yù)警、快變預(yù)警、趨勢預(yù)警、評(píng)價(jià)預(yù)警和關(guān)聯(lián)預(yù)警;頁面級(jí)別的主動(dòng)預(yù) 警基于狀態(tài)預(yù)警、閾值預(yù)警、評(píng)價(jià)預(yù)警;基礎(chǔ)設(shè)施級(jí)別的主動(dòng)預(yù)警基于狀態(tài)預(yù)警、評(píng)價(jià)預(yù)警 和關(guān)聯(lián)預(yù)警;信息系統(tǒng)級(jí)別的主動(dòng)預(yù)警基于評(píng)價(jià)預(yù)警和關(guān)聯(lián)預(yù)警。
[0032] 三、實(shí)現(xiàn)大數(shù)據(jù)技術(shù)在國家電網(wǎng)信息運(yùn)維領(lǐng)域的推廣應(yīng)用:基于大數(shù)據(jù)技術(shù),實(shí)現(xiàn) 了信息運(yùn)維數(shù)據(jù)的高效統(tǒng)計(jì)分析、挖掘分析和實(shí)時(shí)流處理,有效挖掘數(shù)據(jù)價(jià)值,實(shí)現(xiàn)主動(dòng)預(yù) 警,提升信息運(yùn)維的效率。
[0033] 本發(fā)明創(chuàng)新的將大數(shù)據(jù)技術(shù)應(yīng)用于信息運(yùn)維主動(dòng)預(yù)警中,設(shè)計(jì)了包括狀態(tài)預(yù)警、 閾值預(yù)警、快變預(yù)警、趨勢預(yù)警、評(píng)價(jià)預(yù)警和關(guān)聯(lián)預(yù)警六大方法的信息運(yùn)維主動(dòng)預(yù)警方法體 系,通過對信息運(yùn)維體系的有效監(jiān)測和數(shù)據(jù)采集,在故障發(fā)生之前實(shí)現(xiàn)主動(dòng)預(yù)警和故障高 效解決,提升信息運(yùn)維的效率,降低運(yùn)維成本,促進(jìn)運(yùn)維業(yè)務(wù)發(fā)展。
【附圖說明】
[0034] 圖1是本發(fā)明一種基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法體系架構(gòu)圖。
【具體實(shí)施方式】
[0035] 為了加深對本發(fā)明的理解,下面將結(jié)合實(shí)施例和附圖對本發(fā)明作進(jìn)一步詳述,該 實(shí)施例僅用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明保護(hù)范圍的限定。
[0036] -種基于大數(shù)據(jù)的電網(wǎng)信息運(yùn)維主動(dòng)預(yù)警方法,如圖1所示,包括狀態(tài)預(yù)警、閾值 預(yù)警、快變預(yù)警、趨勢預(yù)警、評(píng)價(jià)預(yù)警和關(guān)聯(lián)預(yù)警六類子方法,以下分別進(jìn)行說明:
[0037] M01 :狀態(tài)預(yù)警
[0038] 狀態(tài)預(yù)警是通過硬件或者服務(wù)是否可達(dá)來判斷信息資源的狀態(tài),通過對其狀態(tài)的 監(jiān)控實(shí)現(xiàn)預(yù)警。
[0039] 實(shí)現(xiàn)狀態(tài)預(yù)警,首先要判斷信息資源是否可達(dá),通過對電網(wǎng)節(jié)點(diǎn)之間的信息資源 進(jìn)行探測并獲取結(jié)果,目前系統(tǒng)每五分鐘探測一次,確定信息資源是否響應(yīng)。如果接收到信 息資源的應(yīng)答數(shù)據(jù),則認(rèn)為其可達(dá),否則,如果等待應(yīng)答超時(shí),則判定其不可達(dá)。
[0040] 在確定信息資源是否可達(dá)的前提下,將其狀態(tài)分為三種:正常狀態(tài)、失聯(lián)狀態(tài)和不 穩(wěn)定狀態(tài)。正常狀態(tài)表示信息資源每次都可達(dá),失聯(lián)狀態(tài)表示信息資源連續(xù)兩次不可達(dá),不 穩(wěn)定狀態(tài)表示信息資源經(jīng)常不可達(dá),但是達(dá)不到失聯(lián)標(biāo)準(zhǔn)。目前的不穩(wěn)定狀態(tài)判斷原則是: 因?yàn)槊课宸昼妼π畔①Y源探測一次,一個(gè)工作日以內(nèi)可以探測288次,如果這288次中至少 有3次不可達(dá),且不連續(xù),則認(rèn)為其處于不穩(wěn)定狀態(tài)。如果信息資源處于失聯(lián)狀態(tài),需要對 其進(jìn)行告警;如果信息資源處于不穩(wěn)定狀態(tài),需要對其進(jìn)行狀態(tài)預(yù)警。
[0041] M02:閾值預(yù)警
[0042] 通過對信息資源設(shè)置風(fēng)險(xiǎn)預(yù)警的閾值,將當(dāng)前監(jiān)測數(shù)據(jù)與預(yù)警閾值進(jìn)行比較,如 果監(jiān)測數(shù)據(jù)不在相應(yīng)的預(yù)警閾值范圍內(nèi),則認(rèn)為監(jiān)測對象符合預(yù)警條件,生成預(yù)警事件。傳 統(tǒng)的信息資源閾值是通過統(tǒng)一標(biāo)準(zhǔn)或者運(yùn)維人員憑經(jīng)驗(yàn)手動(dòng)設(shè)置的,這通常會(huì)導(dǎo)致閾值與 實(shí)際情況不符,造成大范圍的誤預(yù)警,造成在發(fā)生問題的情況下的不預(yù)警。本發(fā)明方法充分 利用大數(shù)據(jù)技術(shù),通過對歷史數(shù)據(jù)的有效分析,得到信息資源運(yùn)行范圍,并根據(jù)分析結(jié)果自 適應(yīng)設(shè)置閾值。同時(shí),系統(tǒng)提供接口供運(yùn)維人員對信息資源閾值進(jìn)行手動(dòng)修改,彌補(bǔ)系統(tǒng)的 不足。
[0043] M03 :快變預(yù)警
[0044] 信息資源監(jiān)測數(shù)據(jù)需要與同類數(shù)據(jù)進(jìn)行比較,若變化過于劇烈,差值大于一定比 例,則認(rèn)為被監(jiān)測資源可能處于較大變動(dòng)中,需要生成預(yù)警事件??熳冾A(yù)警包括橫向預(yù)警和 縱向預(yù)警兩種方式。
[0045] 橫向預(yù)警表示任一電網(wǎng)節(jié)點(diǎn)的信息資源的數(shù)值與和該節(jié)點(diǎn)并列的同類節(jié)點(diǎn)的數(shù) 值進(jìn)行比較,主要針對負(fù)載均衡集群,如果集群中某臺(tái)設(shè)備的負(fù)載遠(yuǎn)遠(yuǎn)大于其他設(shè)