專利名稱:一種告警管理方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)管理中的數(shù)據(jù)處理,尤其涉及一種告警管理方法及系統(tǒng)。
背景技術(shù):
通信網(wǎng)絡(luò)由各種網(wǎng)絡(luò)通信設(shè)備組成,各網(wǎng)絡(luò)通信設(shè)備間需要協(xié)同工作以實現(xiàn)相應(yīng)的通信業(yè)務(wù)。為保證網(wǎng)絡(luò)通信設(shè)備的正常工作,需要對其采用必要的維護手段進行維護。其中,通信設(shè)備告警便是一種重要的針對網(wǎng)絡(luò)設(shè)備的維護手段,通常由通信設(shè)備各地區(qū)管理系統(tǒng)實現(xiàn)。
所述的通信設(shè)備告警管理系統(tǒng)主要由兩大部分組成1、告警產(chǎn)生和上報設(shè)備用于產(chǎn)生并上報網(wǎng)絡(luò)通信設(shè)備的告警信息;比如GPRS(通用無線分組業(yè)務(wù))服務(wù)支持節(jié)點SGSN、通用無線分組業(yè)務(wù)GPRS網(wǎng)關(guān)支持節(jié)點GGSN等通信網(wǎng)絡(luò)設(shè)備均屬于告警產(chǎn)生設(shè)備,同時每種設(shè)備都將產(chǎn)生的告警上報到告警管理系統(tǒng)。
2、告警管理系統(tǒng)接受告警產(chǎn)生和上報設(shè)備(如各網(wǎng)元)上報的告警信息,并向用戶提供各種告警管理操作,同時,完成向各網(wǎng)元下發(fā)告警管理命令的功能。
通常,告警是通過聲光等方式及時直觀的顯示系統(tǒng)的運行情況,為用戶設(shè)備維護、網(wǎng)絡(luò)優(yōu)化、業(yè)務(wù)分析等工作提供數(shù)據(jù)依據(jù)。告警臺顯示的故障告警項用于提供給設(shè)備的維護人員,以便于維護人員進行相應(yīng)的維護操作,告警臺是網(wǎng)絡(luò)故障管理的核心組成部分;為保證所述故障告警項的高可用性,要求相應(yīng)的數(shù)據(jù)必需注重于對客戶而言的實用性。
然而,目前網(wǎng)絡(luò)通信設(shè)備的告警系統(tǒng)普遍存在告警太多、頻率過高、重點不突出等問題。因此,不利于用戶迅速有效地定位設(shè)備故障源,并針對故障進行后續(xù)診斷、維護工作。
為此,需要對告警進行精簡,以消除告警過多、重點不突出等問題。
現(xiàn)在已經(jīng)廣泛使用的消除告警過多的手段是告警屏蔽。通過配置對某類告警進行屏蔽處理,一旦系統(tǒng)中此類告警發(fā)生,則一概屏蔽掉,不上報告警給用戶。因為告警被全部屏蔽,等價于關(guān)閉了此類告警的上報功能,雖然告警數(shù)量是減少了,卻無法再反映出某類系統(tǒng)故障的特征,不利于用戶對設(shè)備的維護。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)所存在的問題,本發(fā)明的目的是提供一種告警管理方法和系統(tǒng),從而能夠有效減少告警數(shù)量、方便查找故障源而不喪失告警功能完整性告警管理方法。
本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的本發(fā)明提供了一種告警管理方法,包括如下步驟A、將網(wǎng)絡(luò)中具有相關(guān)性的各告警分別根據(jù)告警之間的因果關(guān)系設(shè)置為父告警和對應(yīng)的子告警;B、根據(jù)所述的父告警和對應(yīng)子告警的相關(guān)性,對告警信息進行處理。
所述步驟A中的父告警和對應(yīng)的子告警相關(guān)性設(shè)置保存于配置的存儲數(shù)據(jù)庫中,并提供有對其進行更新的管理接口。
所述步驟A中的父告警與子告警之間的相關(guān)性包括父告警必然會引起對應(yīng)的子告警,且所述的父告警包括組合父告警,所述組合父告警是多個同時出現(xiàn)的父告警組合構(gòu)成;當該組合父告警出現(xiàn)時必然產(chǎn)生子告警,且當該組合中缺少任何一個或多個父告警時并不必然產(chǎn)生子告警。
本發(fā)明中,當確定需要上報子告警時,如果其對應(yīng)的父告警已經(jīng)存在,則不上報該子告警。
本發(fā)明中,當父告警恢復(fù)時,如果子告警仍然沒有恢復(fù),則上報該子告警。
本發(fā)明中,當子告警恢復(fù)時,如果父告警仍然沒有恢復(fù),則不上報子告警恢復(fù)消息。
本發(fā)明中,當父告警在子告警產(chǎn)生后的預(yù)定的時間內(nèi)產(chǎn)生時,對已經(jīng)上報的子告警進行相關(guān)性恢復(fù);所述相關(guān)性恢復(fù)是指由于父告警的存在而對子告警進行屏蔽。
本發(fā)明中,當子告警進行正?;謴?fù)時如果父告警還未恢復(fù),則把子告警的相關(guān)性恢復(fù)更新為正?;謴?fù)。
本發(fā)明還提供了一種告警管理系統(tǒng),包括告警信息接收模塊、告警信息處理模塊和告警信息發(fā)送模塊,而且,在該系統(tǒng)中加入相關(guān)性處理模塊,根據(jù)預(yù)先設(shè)置的告警信息的相關(guān)性,對告警信息進行相應(yīng)的屏蔽和上報。
所述的相關(guān)性處理模塊內(nèi)置于告警信息處理模塊中。
由上述本發(fā)明提供的技術(shù)方案可以看出,本發(fā)明在對告警之間的聯(lián)系進行分析的基礎(chǔ)上設(shè)置告警之間的父子關(guān)系,即產(chǎn)生父告警時必然也產(chǎn)生子告警,并在告警上報處理時不上報子告警以減少告警數(shù)量,上報父告警以保持告警功能的完整性并有利于查找故障源,從而達到了告警精簡優(yōu)化的效果,方便故障的診斷和維護。
其中告警之間父子關(guān)系可以存儲在一個數(shù)據(jù)庫中,而且父告警可以是一種組合父告警,即該組合父告警是由多個告警的組合,因此,這個告警數(shù)據(jù)庫就能夠包含告警之間所有的父子關(guān)系即告警產(chǎn)生之間的所有必然因果關(guān)系。這樣,通過對告警相關(guān)性的分析,對有必然因果關(guān)系的多個告警,只上報父告警,減少設(shè)備上報給用戶的告警數(shù)量,幫助用戶有效的定位設(shè)備故障源,迅速找到父告警,針對父告警進行后續(xù)故障診斷、故障維護工作,提高了告警實用性和設(shè)備維護效率。
另外,通過在告警上報處理過程中的相關(guān)對應(yīng)配套措施,使得本發(fā)明的網(wǎng)絡(luò)管理告警上報處理優(yōu)化方法更加完善、方便實用。
圖1為本發(fā)明所述的方法的處理流程示意圖;圖2為本發(fā)明所述系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施例方式
本發(fā)明的核心思想是在對告警之間的聯(lián)系進行分析的基礎(chǔ)上設(shè)置告警之間的父子關(guān)系,即確定各告警之間的相關(guān)性,并在告警上報處理時,根據(jù)所述的相關(guān)性進行告警上報處理,具體為如果父告警存在時,則不上報子告警以減少上報告警數(shù)量,而僅上報父告警,以保持告警功能的完整性并有利于查找故障源,從而達到了告警精簡優(yōu)化的目的。
可以看出,為實現(xiàn)本發(fā)明的目的需要在系統(tǒng)中進行合理的告警之間的相關(guān)性設(shè)置。為對本發(fā)明有更好地理解,下面將首先對本發(fā)明中告警之間的相關(guān)性進行分析說明在通信設(shè)備中上報的告警實例并不是孤立存在的,例如,如果發(fā)生一個底層功能的故障,會導(dǎo)致上層的基于該功能的其他功能也無法正常工作,那么實際向用戶上報的告警實例便既有底層故障告警,也有上層故障告警。可以看出,這些告警之間存在因果關(guān)系,本發(fā)明中設(shè)置如A告警必然引起B(yǎng)告警,則這些告警稱為相關(guān)性告警,A告警是B告警的父告警,B告警是A告警的子告警。
在實際故障定位中,只要分析父告警的原因,并排除該故障,那么所有相關(guān)的告警都會被恢復(fù)。因此,可以由告警系統(tǒng)分析告警實例間的相關(guān)性,利用父告警屏蔽或恢復(fù)子告警,減少系統(tǒng)上報給用戶的告警數(shù)量,并且?guī)椭脩粲行У囟ㄎ辉O(shè)備故障源。
所述的告警相關(guān)性是告警實例間的關(guān)系。例如子系統(tǒng)A上的某鏈路斷鏈,會導(dǎo)致建立在該鏈路上的信道中斷,那么該子系統(tǒng)上的斷鏈告警a和信道中斷告警b是存在相關(guān)性的;如果此時子系統(tǒng)B上的信道也發(fā)生了故障,上報了信道中斷告警c,這個信道中斷告警就和斷鏈告警a沒有相關(guān)性了。
因此,判斷告警實例是否存在相關(guān)性,具體的實現(xiàn)方式包括(1)判斷告警項是否存在相關(guān)性的基礎(chǔ)如斷鏈告警和信道中斷告警存在邏輯上的關(guān)聯(lián),可以認為它們存在相關(guān)性的基礎(chǔ),對于不存在邏輯關(guān)聯(lián)的告警項就不存在相關(guān)性的基礎(chǔ);(2)判斷告警實例的關(guān)鍵屬性是否存在邏輯關(guān)聯(lián)告警實例的關(guān)鍵屬性確定了該告警實例來自于哪個故障,如果兩個告警實例對應(yīng)的告警項存在相關(guān)性基礎(chǔ),而且它們的關(guān)鍵屬性相匹配,才可以真正判斷它們之間存在相關(guān)性關(guān)系。
綜合上述分析,如果事先定義存在相關(guān)性基礎(chǔ)的告警項,并明確定義該相關(guān)性需要匹配的告警屬性,就可以在告警實例上報時,根據(jù)定義的告警相關(guān)性規(guī)則判斷出告警實例間的相關(guān)性關(guān)系,對子告警進行后續(xù)的屏蔽處理。
下面結(jié)合附圖對本發(fā)明作進一步的詳細說明。
本發(fā)明所述的方法的具體實現(xiàn)如圖1所示,包括以下步驟步驟100在數(shù)據(jù)庫中配置告警之間的父子關(guān)系,即配置父告警與子告警之間的相關(guān)性。
在數(shù)據(jù)庫中設(shè)置告警之間的父子關(guān)系,是建立在對告警相關(guān)性分析的基礎(chǔ)上的,并且可以根據(jù)情況的變化變化進行更新或者重新配置。
在配置過程中對于兩告警之間的相關(guān)性符合一個告警產(chǎn)生時必然產(chǎn)生另一個告警的情況,則可以將前一告警稱為父告警,后一告警稱為子告警。
當一個告警產(chǎn)生時必然會有多個告警產(chǎn)生,則可以建立多個父子關(guān)系;如果多個告警同時出現(xiàn)時才必然產(chǎn)生另一個告警,則只能建立一個多對一的父子關(guān)系,此時把父告警稱為組合父告警;當該組合中的一個或者多個告警沒有同時出現(xiàn)時,并不必然出現(xiàn)子告警。因此,如果一個組合父告警產(chǎn)生時必然產(chǎn)生多個告警時,可以建立多個多對一的父子關(guān)系。
這樣,經(jīng)過步驟101的配置,告警之間的各種必然因果關(guān)系都可以分解為一對一或者是多對一的父子對應(yīng)關(guān)系,并且,各對應(yīng)關(guān)系都可以用數(shù)據(jù)庫的形式方便地進行存儲配置,及修改更新。
配置好告警之間的父子關(guān)系之后,就可以把它們應(yīng)用到告警上報的優(yōu)化處理中去;步驟101等待接收新的告警/恢復(fù)消息;步驟102當收到新的告警/恢復(fù)消息后,首先要進行判斷收到的是新的告警還是恢復(fù)消息,如果收到的是新的告警,則執(zhí)行步驟103,否則,執(zhí)行步驟107步驟103進一步判斷是否存在未被恢復(fù)的父告警,如果存在,則執(zhí)行步驟105,否則,執(zhí)行步驟104;步驟104正常上報該告警信息,并執(zhí)行步驟105;步驟105判斷是否存在此前10秒內(nèi)(或者其它可以認為父告警與子告警同時產(chǎn)生甚至更早產(chǎn)生的時間范圍,且該10秒時間也可以根據(jù)實際需要進行調(diào)整,即并不固定為10秒)產(chǎn)生且未被恢復(fù)的子告警,如果是,則執(zhí)行步驟106,否則,過程結(jié)束,并重新執(zhí)行步驟101。
此處,需要說明的是步驟103和步驟105所描述的兩個判斷執(zhí)行的先后順序是可以調(diào)換的,當然,其相應(yīng)的處理措施也同時調(diào)換順序。總之,如果存在未被恢復(fù)的父告警,則不上報新告警;如果不存在未被恢復(fù)的父告警,則正常上報新告警。如果存在此前10秒內(nèi)未被恢復(fù)的子告警,則執(zhí)行步驟106;否則,不需要特別處理;步驟106對該子告警進行相關(guān)性恢復(fù),過程結(jié)束,等待重新收到新的告警/恢復(fù)消息后執(zhí)行步驟101;所述的相關(guān)性恢復(fù)是指由于父告警的存在而對子告警進行屏蔽。
步驟107如果步驟104中判斷收到的不是新的告警,而是告警的恢復(fù)消息,則還要判斷該恢復(fù)消息對應(yīng)的告警是否已經(jīng)上報,如果是,則執(zhí)行步驟108,否則,執(zhí)行步驟111;步驟108判斷已上報的對應(yīng)告警是否處于相關(guān)性恢復(fù)的狀態(tài),如果是,則表明對應(yīng)告警的父告警在采用相關(guān)性恢復(fù)措施后父告警仍未恢復(fù),需要執(zhí)行步驟109,否則,執(zhí)行步驟110;步驟109將對應(yīng)故障的相關(guān)性恢復(fù)更新為正?;謴?fù),并執(zhí)行步驟111;步驟110正常上報恢復(fù)消息,并執(zhí)行步驟111;步驟111判斷對應(yīng)告警的子告警是否未恢復(fù),如果是,則執(zhí)行步驟112,否則,過程結(jié)束,并重新執(zhí)行步驟101;此處,需要說明的是步驟107和步驟111所述的兩個判斷處理過程的先后順序也是可以調(diào)換的,當然,其相應(yīng)的處理措施也同時調(diào)換順序。
步驟112判斷對應(yīng)告警的子告警仍然未恢復(fù),則激活此子告警,重新上報此子告警。
本發(fā)明還提供了一種告警管理系統(tǒng),圖2所示,包括用于接收告警信息的告警信息接收模塊、用于對告警信息進行處理的告警信息處理模塊和用于上報告警信息的告警信息發(fā)送模塊,同時,在該系統(tǒng)中加入相關(guān)性處理模塊,具體為在所述的告警信息處理模塊中增加設(shè)置相關(guān)性處理模塊,用于根據(jù)預(yù)先設(shè)置的告警信息的相關(guān)性,對告警信息進行相應(yīng)的屏蔽和上報,具體的屏蔽和上報處理方式前面已經(jīng)描述,故此處不再詳述。
綜上所述,本發(fā)明通過針對各告警相關(guān)性的分析,從而有效簡化了網(wǎng)管過程中上報的告警量,并可以保證告警功能的可靠實現(xiàn),因此,本發(fā)明的實現(xiàn)可以提高告警實用性及設(shè)備的可維護性。
以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)該以權(quán)利要求的保護范圍為準。
權(quán)利要求
1.一種告警管理方法,其特征在于,包括如下步驟A、將網(wǎng)絡(luò)中各具有相關(guān)性的告警分別根據(jù)告警間的因果關(guān)系設(shè)置為父告警和對應(yīng)的子告警;B、根據(jù)所述父告警和對應(yīng)的子告警的相關(guān)性,對告警信息進行處理。
2.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,所述步驟A中的父告警和對應(yīng)的子告警相關(guān)性設(shè)置保存于配置的存儲數(shù)據(jù)庫中,并提供有對其進行更新的管理接口。
3.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,所述步驟A中的父告警與子告警之間的相關(guān)性包括父告警必然會引起對應(yīng)的子告警,且所述的父告警包括組合父告警,所述組合父告警是多個同時出現(xiàn)的父告警組合構(gòu)成;當該組合父告警出現(xiàn)時必然產(chǎn)生子告警,且當該組合中缺少任何一個或多個父告警時并不必然產(chǎn)生子告警。
4.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,當確定需要上報子告警時,如果其對應(yīng)的父告警已經(jīng)存在,則不上報該子告警。
5.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,當父告警恢復(fù)時,如果子告警仍然沒有恢復(fù),則上報該子告警。
6.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,當子告警恢復(fù)時,如果父告警仍然沒有恢復(fù),則不上報子告警恢復(fù)消息。
7.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,當父告警在子告警產(chǎn)生后的預(yù)定的時間內(nèi)產(chǎn)生時,對已經(jīng)上報的子告警進行相關(guān)性恢復(fù);所述相關(guān)性恢復(fù)是指由于父告警的存在而對子告警進行屏蔽。
8.根據(jù)權(quán)利要求1所述的告警管理方法,其特征在于,當子告警進行正?;謴?fù)時如果父告警還未恢復(fù),則把子告警的相關(guān)性恢復(fù)更新為正?;謴?fù)。
9.一種告警管理系統(tǒng),包括告警信息接收模塊、告警信息處理模塊和告警信息發(fā)送模塊,其特征在于,在該系統(tǒng)中加入相關(guān)性處理模塊,根據(jù)預(yù)先設(shè)置的告警信息的相關(guān)性,對告警信息進行相應(yīng)的屏蔽和上報。
10.根據(jù)權(quán)利要求9所述的告警管理系統(tǒng),其特征在于,所述的相關(guān)性處理模塊內(nèi)置于告警信息處理模塊中。
全文摘要
本發(fā)明公開了一種告警管理方法及系統(tǒng),本發(fā)明是在對告警之間的聯(lián)系進行分析的基礎(chǔ)上設(shè)置告警之間的父子關(guān)系,并在告警上報處理時,如果存在父告警,則不上報對應(yīng)的子告警。因此,本發(fā)明的實現(xiàn)可以有效減少告警數(shù)量,上報父告警以保持告警功能的完整性并有利于查找故障源,從而達到了告警精簡優(yōu)化的效果,方便故障的診斷和維護。
文檔編號H04L12/24GK1863080SQ20051010928
公開日2006年11月15日 申請日期2005年10月20日 優(yōu)先權(quán)日2005年10月20日
發(fā)明者朱冬梅, 邱國賢, 高建華 申請人:華為技術(shù)有限公司