欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng)的制作方法

文檔序號(hào):11138339閱讀:1299來(lái)源:國(guó)知局
一種IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng)的制造方法與工藝
本發(fā)明涉及一種IT運(yùn)維監(jiān)控系統(tǒng),尤其涉及一種IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng)。
背景技術(shù)
:隨著企業(yè)信息化的不斷發(fā)展和深入,IT監(jiān)控告警系統(tǒng)的建設(shè),綜合了多種信息設(shè)備、多層次業(yè)務(wù)的監(jiān)控。隨著業(yè)務(wù)的發(fā)展,進(jìn)入監(jiān)控系統(tǒng)的告警信息日趨龐大且復(fù)雜。為及時(shí)發(fā)現(xiàn)系統(tǒng)故障、識(shí)別潛在風(fēng)險(xiǎn)及安全隱患,企業(yè)內(nèi)部通常設(shè)定專門的運(yùn)維部門和運(yùn)維人員監(jiān)管企業(yè)的IT系統(tǒng),維護(hù)企業(yè)IT系統(tǒng)正常、穩(wěn)定運(yùn)行,保障企業(yè)業(yè)務(wù)正常開(kāi)展和運(yùn)營(yíng)。傳統(tǒng)IT監(jiān)控系統(tǒng)的監(jiān)控方法通常為:信息技術(shù)部門提出系統(tǒng)運(yùn)行目標(biāo),運(yùn)維部門將系統(tǒng)運(yùn)行目標(biāo)轉(zhuǎn)化為系統(tǒng)監(jiān)控指標(biāo),并在IT監(jiān)控系統(tǒng)中通過(guò)定義監(jiān)控指標(biāo)、設(shè)定監(jiān)控?cái)?shù)據(jù)源、配置監(jiān)控校驗(yàn)規(guī)則、部署監(jiān)控調(diào)度作業(yè)實(shí)現(xiàn)系統(tǒng)監(jiān)控,其中監(jiān)控校驗(yàn)規(guī)則配置采用最小值、最大值的值域配置或采用百分比的波動(dòng)配置等方式。當(dāng)系統(tǒng)的某個(gè)部件運(yùn)行狀況超出預(yù)設(shè)閾值時(shí),監(jiān)控系統(tǒng)識(shí)別告警并發(fā)送相關(guān)的告警通知。這種告警識(shí)別機(jī)制通常無(wú)法做到趨勢(shì)的預(yù)警以及告警間的相互關(guān)聯(lián)?,F(xiàn)有技術(shù)具有以下缺點(diǎn):一、傳統(tǒng)監(jiān)控系統(tǒng)通常以告警為驅(qū)動(dòng),當(dāng)有告警時(shí)才會(huì)介入處理,并且需要人為登錄到系統(tǒng)中,根據(jù)告警相關(guān)信息查詢系統(tǒng)情況并處理,而且判斷與確認(rèn)的時(shí)間會(huì)增加告警處理時(shí)長(zhǎng)。二、傳統(tǒng)監(jiān)控系統(tǒng)只單獨(dú)監(jiān)控各網(wǎng)元各個(gè)指標(biāo)的告警信息,沒(méi)有對(duì)同一網(wǎng)元引起的多條相關(guān)告警做關(guān)聯(lián)分析。這種監(jiān)控技術(shù)降低了多維告警的質(zhì)量,弱化了故障定位能力,增加了故障分析難度。三、傳統(tǒng)的監(jiān)控系統(tǒng)在監(jiān)控成百上千個(gè)網(wǎng)元時(shí),只有當(dāng)告警出現(xiàn)時(shí)才會(huì)被動(dòng)接收告警,而不能通過(guò)某種界面或者工具簡(jiǎn)單直觀的看到被監(jiān)控網(wǎng)元的運(yùn)行情況。由上可見(jiàn),以上設(shè)計(jì)缺陷使告警信息較難管理,告警事件較難追述,在處理告警時(shí)對(duì)問(wèn)題與故障根源分析時(shí)間花費(fèi)較長(zhǎng),不能及時(shí)響應(yīng)與解決故障,從而導(dǎo)致用戶體驗(yàn)不佳,同時(shí)在多網(wǎng)元多告警指標(biāo)監(jiān)控時(shí),無(wú)法做到關(guān)聯(lián),同時(shí)也沒(méi)有統(tǒng)一、簡(jiǎn)潔的視圖縱觀整個(gè)系統(tǒng)運(yùn)行現(xiàn)狀。技術(shù)實(shí)現(xiàn)要素:本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),能夠靈活調(diào)整監(jiān)控規(guī)則,并根據(jù)配置引擎中的規(guī)則自動(dòng)關(guān)聯(lián)告警關(guān)系;不僅能根據(jù)業(yè)務(wù)規(guī)則精準(zhǔn)定位故障根源,并能預(yù)處理客戶非感知故障而避免感知故障發(fā)生,使IT監(jiān)控系統(tǒng)更好地適應(yīng)用戶的不同需求。本發(fā)明為解決上述技術(shù)問(wèn)題而采用的技術(shù)方案是提供一種IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),包括規(guī)則引擎:維護(hù)系統(tǒng)所有的配置數(shù)據(jù),包括被采集網(wǎng)元的配置數(shù)據(jù)、計(jì)算引擎評(píng)分時(shí)所需的規(guī)則數(shù)據(jù)、展示引擎顯示數(shù)據(jù)時(shí)業(yè)務(wù)與平臺(tái)網(wǎng)元的對(duì)應(yīng)關(guān)系以及網(wǎng)元與指標(biāo)的對(duì)應(yīng)關(guān)系;采集引擎:通過(guò)規(guī)則引擎的配置數(shù)據(jù)采集被監(jiān)控網(wǎng)元的運(yùn)行狀態(tài)數(shù)據(jù);計(jì)算引擎:根據(jù)網(wǎng)元多個(gè)指標(biāo)計(jì)算出單個(gè)網(wǎng)元的健康度得分,并且生成相關(guān)事件;展示引擎:按照規(guī)則引擎中配置的業(yè)務(wù)域關(guān)系對(duì)外顯示。上述的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),其中,所述規(guī)則引擎通過(guò)在前臺(tái)頁(yè)面增加、修改、刪除規(guī)則維護(hù)系統(tǒng)所有的配置數(shù)據(jù),并且保存計(jì)算引擎所產(chǎn)生的動(dòng)態(tài)評(píng)分規(guī)則用以下次評(píng)分時(shí)作為參照。上述的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),其中,所述采集引擎包括采集模塊和規(guī)整模塊,所述采集模塊從規(guī)則引擎中讀取被監(jiān)控網(wǎng)元的配置信息與所需采集的指標(biāo)信息,根據(jù)配置規(guī)則周期性地從被監(jiān)控網(wǎng)元側(cè)采集運(yùn)行數(shù)據(jù);所述規(guī)整模塊將采集模塊所采集的數(shù)據(jù)合并到同一個(gè)時(shí)間版本內(nèi),并且對(duì)所采集的數(shù)據(jù)進(jìn)行有效性檢查,如果存在數(shù)據(jù)未采集到則通知采集模塊再次發(fā)起采集,在預(yù)設(shè)次數(shù)內(nèi)未采集到有效數(shù)據(jù),則采用默認(rèn)值合并,保證數(shù)據(jù)時(shí)間版本的統(tǒng)一。上述的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),其中,所述采集引擎首先讀取配置引擎中被監(jiān)控網(wǎng)元列表,獲取有效被監(jiān)控網(wǎng)元類型ID與網(wǎng)元地址、網(wǎng)元數(shù)據(jù)庫(kù)連接串,通過(guò)多線程方式對(duì)被采集網(wǎng)元進(jìn)行批量處理;每個(gè)采集線程根據(jù)被采集網(wǎng)元ID與網(wǎng)元類型ID讀取規(guī)則引擎中的預(yù)設(shè)指標(biāo),所述預(yù)設(shè)指標(biāo)包括指標(biāo)ID、指標(biāo)名稱、指標(biāo)說(shuō)明和采集周期;每個(gè)采集線程判斷是否滿足采集周期,如是則連接被采集網(wǎng)元進(jìn)行相關(guān)數(shù)據(jù)的采集,通過(guò)規(guī)整模塊將數(shù)據(jù)按照時(shí)間標(biāo)簽整理完畢后發(fā)送給消息模塊并入庫(kù);所述消息模塊提供一個(gè)數(shù)據(jù)流的通道,并供訂閱相關(guān)消息的模塊讀取消費(fèi)。上述的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),其中,所述計(jì)算引擎包括:評(píng)分模塊:將規(guī)整模塊整理后的網(wǎng)元運(yùn)行數(shù)據(jù)與規(guī)則引擎中的配置進(jìn)行匹配,并按100分制給每個(gè)網(wǎng)元的運(yùn)行健康度打分;事件模塊:根據(jù)配置引擎中的規(guī)則,對(duì)評(píng)分模塊產(chǎn)生的分?jǐn)?shù)匹配生成事件,當(dāng)?shù)陀?0分時(shí)產(chǎn)生預(yù)警事件,當(dāng)?shù)陀?0分時(shí)產(chǎn)生告警事件;下鉆模塊:根據(jù)事件模塊產(chǎn)生的事件匹配規(guī)則引擎中配置的規(guī)則對(duì)相關(guān)指標(biāo)進(jìn)行下鉆數(shù)據(jù)抓取,下鉆所要采集的數(shù)據(jù)以及格式均通過(guò)場(chǎng)景化設(shè)計(jì)產(chǎn)生,當(dāng)未有事件產(chǎn)生時(shí),每個(gè)指標(biāo)周期性會(huì)進(jìn)行一次常規(guī)下鉆,用以與異常事件進(jìn)行對(duì)比分析;診斷模塊:根據(jù)下鉆模塊中采集的信息與正常時(shí)間點(diǎn)采集的下鉆數(shù)據(jù)進(jìn)行對(duì)比,自動(dòng)分析診斷引起指標(biāo)事件產(chǎn)生的原因;自動(dòng)處理模塊:當(dāng)診斷模塊確認(rèn)事件原因后通知自動(dòng)處理模塊,所述自動(dòng)處理模塊根據(jù)事件原因匹配調(diào)用引擎中預(yù)先配置的相關(guān)自動(dòng)處理腳本。上述的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),其中,對(duì)于系統(tǒng)性能問(wèn)題引起的事件,所述診斷模塊查找得出需要被KILL的進(jìn)程列表或者重啟操作命令,所述自動(dòng)處理模塊通過(guò)調(diào)用KILL或者重啟命令解決性能問(wèn)題;對(duì)于主機(jī)文件系統(tǒng)和數(shù)據(jù)表空間異常引起的事件,所述自動(dòng)處理模塊通過(guò)調(diào)用預(yù)設(shè)方案進(jìn)行恢復(fù),所述預(yù)設(shè)方案為根據(jù)被監(jiān)控網(wǎng)元與指標(biāo)名稱以及系統(tǒng)運(yùn)行情況設(shè)置的可恢復(fù)異常情況的腳本或者命令。上述的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),其中,所述展示引擎包括:業(yè)務(wù)域展示模塊:展示業(yè)務(wù)網(wǎng)元和平臺(tái)網(wǎng)元,每個(gè)業(yè)務(wù)網(wǎng)元設(shè)置有需要展示的指標(biāo),所有的業(yè)務(wù)網(wǎng)元均在同一塊區(qū)域中展示,并通過(guò)不同顏色突出顯示的策略進(jìn)行滾動(dòng)展示;所述平臺(tái)網(wǎng)元按照設(shè)備類型劃分為主機(jī)、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)路和負(fù)載均衡,同時(shí)平臺(tái)網(wǎng)元展示還包含了該業(yè)務(wù)域所包含的所有網(wǎng)元所觸發(fā)的事件,所有事件按照事件發(fā)生先后進(jìn)行排序;當(dāng)業(yè)務(wù)網(wǎng)元展示區(qū)域選擇事件范圍和時(shí)間點(diǎn)后,默認(rèn)平臺(tái)網(wǎng)元數(shù)據(jù)展示為選中時(shí)間點(diǎn)的鏡像數(shù)據(jù);平臺(tái)域展示模塊:將平臺(tái)網(wǎng)元按照設(shè)備類型進(jìn)行展示,每一種設(shè)備類型均包含了所有被監(jiān)控網(wǎng)元下同類型的網(wǎng)元組件,并可在頁(yè)面上搜索網(wǎng)元名稱找到被監(jiān)控網(wǎng)元;網(wǎng)元展示模塊:展示單個(gè)網(wǎng)元的運(yùn)行情況,根據(jù)網(wǎng)元類型定義多種指標(biāo)反映網(wǎng)元的運(yùn)行狀態(tài),顯示各指標(biāo)項(xiàng)得分及扣分情況,同時(shí)根據(jù)扣分情況生成相關(guān)事件;下鉆展示模塊:通過(guò)業(yè)務(wù)域展示模塊中的事件列表或者網(wǎng)元展示模塊中事件列表進(jìn)入,主要展示計(jì)算引擎中下鉆模塊所采集的數(shù)據(jù)與診斷模塊所分析的結(jié)論,通過(guò)場(chǎng)景化的數(shù)據(jù)采集與展示,在頁(yè)面上直觀顯示系統(tǒng)存在的問(wèn)題、問(wèn)題導(dǎo)致的原因、問(wèn)題時(shí)間點(diǎn)與之前時(shí)間點(diǎn)運(yùn)行狀態(tài)的對(duì)比,以及系統(tǒng)故障的定位方向。本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明提供的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng),采用基于健康度的監(jiān)控系統(tǒng)分析方法,以客戶的業(yè)務(wù)需求、網(wǎng)元為管理對(duì)象,根據(jù)對(duì)網(wǎng)元指標(biāo)的監(jiān)控與關(guān)聯(lián)計(jì)算出該網(wǎng)元的健康運(yùn)行情況,并將告警規(guī)則引擎從監(jiān)控邏輯中解耦出來(lái),使監(jiān)控人員也能參與監(jiān)控規(guī)則的修改和管理,實(shí)現(xiàn)前臺(tái)動(dòng)態(tài)修改監(jiān)控規(guī)則,以快速響應(yīng)監(jiān)控需求的變化;同時(shí)加入了統(tǒng)一視圖與監(jiān)控域,將同一業(yè)務(wù)的相關(guān)的監(jiān)控網(wǎng)元集成到同一視窗中,以提高故障排除的效率和提升用戶的滿意度。附圖說(shuō)明圖1為本發(fā)明IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng)架構(gòu)示意圖;圖2為本發(fā)明IT軟硬件運(yùn)行狀態(tài)監(jiān)控流程圖。具體實(shí)施方式下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述。圖1為本發(fā)明IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng)架構(gòu)示意圖。請(qǐng)參見(jiàn)圖1,本發(fā)明提供的IT軟硬件運(yùn)行狀態(tài)監(jiān)控系統(tǒng)包括采集引擎、規(guī)則引擎、計(jì)算引擎、展示引擎,最終在統(tǒng)一界面中以評(píng)分的簡(jiǎn)潔方式展示該網(wǎng)元的運(yùn)行狀態(tài)。本發(fā)明的計(jì)算引擎中的評(píng)分模塊,它與計(jì)算邏輯松耦合,并且該引擎可以直接通過(guò)前臺(tái)頁(yè)面進(jìn)行編輯和維護(hù)。評(píng)分模塊不僅能根據(jù)既定匹配規(guī)則存放于資料庫(kù)中,準(zhǔn)確高效地匹配到可能引起事件的指標(biāo)異常,而且還能根據(jù)實(shí)際需求在前臺(tái)頁(yè)面動(dòng)態(tài)修改,挖掘監(jiān)控系統(tǒng)中最優(yōu)的評(píng)分規(guī)則并保存于資料庫(kù),以便今后使用。評(píng)分引擎有利于高效評(píng)估被監(jiān)控設(shè)備的運(yùn)行健康狀態(tài),并輔助計(jì)算引擎中事件模塊、下鉆模塊、診斷模塊以及自動(dòng)化模塊自動(dòng)定位故障原因,協(xié)助技術(shù)人員或自動(dòng)及時(shí)處理問(wèn)題并將可能出現(xiàn)的問(wèn)題扼殺于襁褓中,提高客戶滿意度。本發(fā)明只需在一個(gè)電腦屏幕中即可管理上千臺(tái)網(wǎng)元,通過(guò)可以在業(yè)務(wù)視角窗口與平臺(tái)視角窗口隨意切換,同時(shí)可視化展示、自動(dòng)化分析與處理幫助維護(hù)人員在前臺(tái)頁(yè)面即快速的定位甚至解決問(wèn)題。本發(fā)明顛覆了傳統(tǒng)監(jiān)控單網(wǎng)元、單指標(biāo)的監(jiān)控方式,通過(guò)靈活的計(jì)算引擎與可配置的展示引擎,實(shí)現(xiàn)了在業(yè)務(wù)視角統(tǒng)一展示所涉及的網(wǎng)元設(shè)備運(yùn)行健康情況,并且通過(guò)計(jì)算模型實(shí)現(xiàn)了事件預(yù)警、動(dòng)態(tài)規(guī)則、指標(biāo)、網(wǎng)元關(guān)聯(lián)、前臺(tái)可調(diào)整的能力,通過(guò)采集引擎將原始數(shù)據(jù)清洗后送入計(jì)算引擎,匹配規(guī)則調(diào)用算法計(jì)算該網(wǎng)元指標(biāo)的健康情況,綜合評(píng)估網(wǎng)元多個(gè)指標(biāo)后計(jì)算出該網(wǎng)元的健康度情況,并且生成相關(guān)事件、甚至調(diào)用下鉆、自動(dòng)化處理模塊介入處理。最終通過(guò)展示引擎根據(jù)配置的規(guī)則可從業(yè)務(wù)視角、平臺(tái)視角對(duì)監(jiān)控的網(wǎng)元進(jìn)行統(tǒng)一管理。下面給出本發(fā)明各模塊的功能及實(shí)現(xiàn)過(guò)程。一、規(guī)則引擎本引擎管理了采集引擎、計(jì)算引擎、展示引擎所依賴的規(guī)則數(shù)據(jù),包括被采集網(wǎng)元的配置數(shù)據(jù)、計(jì)算引擎評(píng)分時(shí)所需的規(guī)則數(shù)據(jù)、展示引擎顯示數(shù)據(jù)時(shí)業(yè)務(wù)與平臺(tái)網(wǎng)元的對(duì)應(yīng)關(guān)系以及網(wǎng)元與指標(biāo)的對(duì)應(yīng)關(guān)系等等。規(guī)則引擎維護(hù)了本發(fā)明所有的配置數(shù)據(jù),可以在前臺(tái)增加、修改、刪除規(guī)則,并且規(guī)則引擎也將保存計(jì)算引擎所產(chǎn)生的動(dòng)態(tài)評(píng)分規(guī)則用以下次評(píng)分時(shí)作為參照。二、采集引擎本引擎主要通過(guò)規(guī)則引擎采集被監(jiān)控網(wǎng)元的運(yùn)行狀態(tài)數(shù)據(jù)。本引擎分為兩個(gè)模塊:1)采集模塊,本模塊負(fù)責(zé)從規(guī)則引擎中讀取被監(jiān)控網(wǎng)元的配置信息與所需采集的指標(biāo)信息,根據(jù)配置規(guī)則周期性的從被監(jiān)控網(wǎng)元側(cè)采集運(yùn)行數(shù)據(jù);2)規(guī)整模塊,本模塊負(fù)責(zé)將采集模塊所采集的數(shù)據(jù)合并到同一個(gè)時(shí)間版本內(nèi),并且對(duì)所采集的數(shù)據(jù)進(jìn)行規(guī)則稽核,如果存在數(shù)據(jù)未采集到則通知采集模塊再次發(fā)起采集,在多次未采集到時(shí)采取默認(rèn)值合并,保證數(shù)據(jù)時(shí)間版本的統(tǒng)一。三、計(jì)算引擎本引擎是本發(fā)明中最為重要的引擎,負(fù)責(zé)網(wǎng)元運(yùn)行健康度的計(jì)算與問(wèn)題的診斷,主要包括1)評(píng)分模塊,本模塊主要負(fù)責(zé)將規(guī)整模塊整理后的網(wǎng)元運(yùn)行數(shù)據(jù)與規(guī)則引擎中的配置進(jìn)行匹配,并且根據(jù)本發(fā)明的核心健康度算法計(jì)算該網(wǎng)元的運(yùn)行健康度得分;2)事件模塊,本模塊根據(jù)配置引擎中的規(guī)則,對(duì)評(píng)分模塊產(chǎn)生的分?jǐn)?shù)匹配生成事件,當(dāng)?shù)陀?0分時(shí)產(chǎn)生預(yù)警事件,當(dāng)?shù)陀?0分時(shí)產(chǎn)生告警事件;3)下鉆模塊,本模塊根據(jù)事件模塊產(chǎn)生的事件匹配規(guī)則引擎中配置的規(guī)則對(duì)相關(guān)指標(biāo)進(jìn)行下鉆數(shù)據(jù)抓取,下鉆所要采集的數(shù)據(jù)以及格式均是通過(guò)場(chǎng)景化設(shè)計(jì)產(chǎn)生,當(dāng)未有事件產(chǎn)生時(shí)每個(gè)指標(biāo)周期性會(huì)進(jìn)行一次常規(guī)下鉆,用以與異常事件進(jìn)行對(duì)比分析;4)診斷模塊,本模塊根據(jù)下鉆模塊中采集的信息與正常時(shí)間點(diǎn)采集的下鉆數(shù)據(jù)進(jìn)行對(duì)比,自動(dòng)分析診斷可能引起指標(biāo)事件產(chǎn)生的原因;5)自動(dòng)處理模塊,本模塊作用是調(diào)用自動(dòng)化處理腳本,當(dāng)診斷模塊確認(rèn)事件原因會(huì)通知本模塊,本模塊根據(jù)配置引擎中的自動(dòng)化腳本自動(dòng)調(diào)用處理。四、展示引擎本引擎主要負(fù)責(zé)按照規(guī)則引擎中配置的業(yè)務(wù)域關(guān)系進(jìn)行對(duì)外展示。1)業(yè)務(wù)角度展示業(yè)務(wù)所屬網(wǎng)元的運(yùn)行健康度;2)以平臺(tái)角度展示平臺(tái)包含網(wǎng)元的運(yùn)行健康度;3)以網(wǎng)元角度展示網(wǎng)元包含指標(biāo)的運(yùn)行健康度;4)以指標(biāo)維度展示當(dāng)指標(biāo)異常時(shí)產(chǎn)生事件并伴隨下鉆模塊收集異常指標(biāo)產(chǎn)生的相關(guān)信息。本發(fā)明所包含的四大引擎主要涉及3個(gè)流程,采集流程對(duì)應(yīng)采集引擎,計(jì)算流程對(duì)應(yīng)計(jì)算引擎,展示流程對(duì)應(yīng)展示引擎,下面對(duì)本發(fā)明的三大流程進(jìn)行詳細(xì)說(shuō)明:1、采集流程本流程首先讀取配置引擎中被監(jiān)控網(wǎng)元列表,根據(jù)是否有效等于是拉取被監(jiān)控網(wǎng)元類型ID與網(wǎng)元地址、網(wǎng)元數(shù)據(jù)庫(kù)連接串,將此信息保存在程序中,通過(guò)多線程方式對(duì)采集網(wǎng)元進(jìn)行批量處理。網(wǎng)元ID網(wǎng)元類型ID網(wǎng)元名稱網(wǎng)元地址網(wǎng)元數(shù)據(jù)庫(kù)連接串是否有效隨后該線程根據(jù)被采集網(wǎng)元ID與網(wǎng)元類型ID讀取規(guī)則引擎中的指標(biāo)相關(guān)是否有效為是的配置數(shù)據(jù):指標(biāo)ID、指標(biāo)名稱、指標(biāo)說(shuō)明、采集周期。網(wǎng)元類型ID指標(biāo)ID是否有效指標(biāo)ID指標(biāo)名稱指標(biāo)說(shuō)明采集周期是否有效采集線程判斷是否滿足采集周期,如是則連接被采集網(wǎng)元進(jìn)行相關(guān)數(shù)據(jù)的采集,通過(guò)規(guī)整模塊將數(shù)據(jù)按照時(shí)間標(biāo)簽整理完畢后發(fā)送給消息模塊并入庫(kù)。消息模塊是一個(gè)數(shù)據(jù)流的通道,在數(shù)據(jù)推送到消息模塊后可以被任意訂閱消息的模塊讀取消費(fèi)。2、計(jì)算流程關(guān)鍵術(shù)語(yǔ)說(shuō)明:T_Score:?jiǎn)蝹€(gè)網(wǎng)元總分即100分。N_Score:網(wǎng)元評(píng)分得分,即滿分100扣除所有指標(biāo)扣分后的得分。L_Affect_Total_Score:標(biāo)簽影響網(wǎng)元總分,在最終計(jì)算評(píng)分得分時(shí),網(wǎng)元總分會(huì)取此值與T_Score中較小的一個(gè)。L_Lost_Score:標(biāo)簽扣分值。L_Group_Ratio:網(wǎng)元對(duì)應(yīng)的組件類型分為多個(gè)指標(biāo)組,此名詞代表該指標(biāo)組所占所有指標(biāo)組的比重,同一網(wǎng)元所有值之和等于1。L_Ratio:指標(biāo)所占指標(biāo)組的比重,同一組內(nèi)所有指標(biāo)該值之和等于1。L_Lost_Score_Ratio:指標(biāo)扣分比率,該值在0-1之間,小數(shù)點(diǎn)后2位,在指標(biāo)值越健康時(shí)越接近于0。L_Base_Value:指標(biāo)基準(zhǔn)值,當(dāng)算法計(jì)算時(shí)先與該值匹配獲得當(dāng)前L_Affect_Total_Score與Score_Ratio。3、評(píng)分模塊本模塊通過(guò)多進(jìn)程處理,讀取采集流程中寫(xiě)入消息模塊的被監(jiān)控網(wǎng)元狀態(tài)數(shù)據(jù):網(wǎng)元ID指標(biāo)ID狀態(tài)數(shù)值采集時(shí)間通過(guò)與規(guī)則引擎中的配置數(shù)據(jù)進(jìn)行匹配,并且結(jié)合本發(fā)明最核心的評(píng)分算法進(jìn)行打分:指標(biāo)ID指標(biāo)名稱L_Base_ValueScore_RatioL_Affect_Total_ScoreC0001CPU使用率700.5380C0001CPU使用率800.6860C0001CPU使用率900.7630C0001CPU使用率980.9310以CPU使用率為例當(dāng)前狀態(tài)數(shù)值為71,對(duì)應(yīng)匹配到L_Base_Value為70,Score_Ratio為0.73,L_Affect_Total_Score為80。此時(shí)該指標(biāo)扣分值:L_Lost_Score(cpu)=L_Group_Ratio(res)*L_Ratio(cpu)*L_Lost_Score_Ratio(cpu)*min(L_Affect_Total_Score(cpu),L_Affect_Total_Score(…))+((100-L_Affect_Total_Score(cpu))/(L_Affect_Total_Score(cpu)+L_Affect_Total_Score(…)))*(100-min(L_Affect_Total_Score(cpu),L_Affect_Total_Score(…))網(wǎng)元得分:N_Score=min(T_Score,min(L_Affect_Total_Score(cpu),L_Affect_Total_Score(…)))-sum(L_Lost_Score(cpu),L_Lost_Score(…))4、事件模塊本模塊根據(jù)評(píng)分模塊計(jì)算的得分與配置引擎中的規(guī)則進(jìn)行匹配產(chǎn)生,如果匹配成功則產(chǎn)生一例事件,事件是被監(jiān)控網(wǎng)元狀態(tài)異常的記錄標(biāo)簽,也是下鉆模塊的入口,本發(fā)明中事件有三個(gè)等級(jí):一級(jí)事件:存在對(duì)被監(jiān)控網(wǎng)元產(chǎn)生致命威脅的異常情況,則生成為一級(jí)事件,通常情況下此時(shí)N_Score<=40。二級(jí)事件:存在有可能會(huì)對(duì)被監(jiān)控網(wǎng)元產(chǎn)生威脅的異常情況,則生成為二級(jí)事件,通常情況下此時(shí)N_Score<=60&N_Score>40。三級(jí)事件:存在對(duì)被監(jiān)控網(wǎng)元產(chǎn)生輕微影響的情況,則生成為三級(jí)事件,通常情況下此時(shí)N_Score<=80&N_Score>60事件等級(jí)指標(biāo)ID事件內(nèi)容生成時(shí)間一級(jí)事件C0001N_Score=21,L_Lost_Score=78,CPU使用率>95%10:28二級(jí)事件C0001N_Score=56,L_Lost_Score=42,CPU使用率>81%13:26三級(jí)事件C0001N_Score=78,L_Lost_Score=22,CPU使用率>95%02:07一級(jí)事件需要立即處理,二級(jí)事件需要持續(xù)關(guān)注,三級(jí)事件主要用于提醒作用。5、下鉆模塊本模塊根據(jù)預(yù)設(shè)方案進(jìn)行下鉆數(shù)據(jù)抓取,抓取時(shí)間分為兩種:1)間隔N分鐘(預(yù)設(shè)10分鐘);2)事件觸發(fā)。預(yù)設(shè)方案根據(jù)網(wǎng)元類型與指標(biāo)名稱進(jìn)行設(shè)定,預(yù)設(shè)方案設(shè)定了根據(jù)特定指標(biāo)診斷所需的明細(xì)數(shù)據(jù),因此網(wǎng)元類型或指標(biāo)名稱的差異所需的明細(xì)數(shù)據(jù)也不盡相同,下鉆模塊預(yù)設(shè)方案所抓取的明細(xì)數(shù)據(jù)除了用于問(wèn)題診斷分析,還可以用于趨勢(shì)分析與展示,通過(guò)展示引擎在前臺(tái)直觀的展示網(wǎng)元運(yùn)行歷史狀態(tài)。6、診斷模塊本模塊的用途為根據(jù)事件模塊的事件產(chǎn)生自動(dòng)診斷信號(hào),結(jié)合下鉆模塊根據(jù)預(yù)設(shè)方案所采集的信息進(jìn)行自動(dòng)診斷分析。診斷模塊主要通過(guò)對(duì)比異常事件產(chǎn)生時(shí)收集的下鉆數(shù)據(jù)與前一時(shí)刻(N分鐘間隔)的正常數(shù)據(jù),對(duì)比兩份數(shù)據(jù)之間的差異并且結(jié)合事件發(fā)生的時(shí)間、規(guī)則引擎中配置的事件關(guān)系自動(dòng)的診斷出可能導(dǎo)致問(wèn)題產(chǎn)生的方向與原因,并給出該因素產(chǎn)生的概率百分比。例如:當(dāng)數(shù)據(jù)庫(kù)運(yùn)行的主機(jī)CPU使用率從50%升高導(dǎo)80%時(shí)產(chǎn)生一個(gè)事件,同時(shí)也會(huì)采集數(shù)據(jù)庫(kù)中SQL預(yù)計(jì)運(yùn)行的CPU時(shí)間,發(fā)現(xiàn)該時(shí)間也上升30%左右,并且該資源消耗主要集中在一條新載入的SQL上,因此診斷模塊給出的結(jié)論為XXX主機(jī)CPU使用率由50%上升到80%主要原因?yàn)閿?shù)據(jù)庫(kù)中XXXSQL執(zhí)行計(jì)劃不合理導(dǎo)致,確定性為93%。同時(shí)當(dāng)問(wèn)題診斷確定性為90%以上時(shí),且出現(xiàn)問(wèn)題的指標(biāo)存在相應(yīng)的自動(dòng)處理預(yù)案,此時(shí)診斷模塊將調(diào)用該預(yù)案嘗試恢復(fù)事件。7、自動(dòng)處理模塊自動(dòng)處理模塊包含兩部分:性能問(wèn)題:性能問(wèn)題自動(dòng)處理主要通過(guò)KILL相關(guān)進(jìn)程與重啟處理,模塊診斷根據(jù)評(píng)估計(jì)算得出需要被KILL的進(jìn)程列表或者重啟操作命令,自動(dòng)處理模塊通過(guò)調(diào)用KILL或者重啟命令解決性能問(wèn)題。非性能問(wèn)題:非性能問(wèn)題主要指:主機(jī)文件系統(tǒng)、數(shù)據(jù)表空間等類似情況的處理,通過(guò)調(diào)用預(yù)設(shè)方案進(jìn)行恢復(fù)。這里所指預(yù)設(shè)方案是根據(jù)被監(jiān)控網(wǎng)元與指標(biāo)名稱以及系統(tǒng)運(yùn)行情況設(shè)置的可以恢復(fù)異常情況的腳本或者命令,通常情況下是由維護(hù)人員根據(jù)維護(hù)經(jīng)驗(yàn)總結(jié)出來(lái)的一套方法。8、展示流程本流程的主要作用是將采集引擎與計(jì)算引擎中相關(guān)的數(shù)據(jù)根據(jù)配置引擎中定義的規(guī)則按照使用者易于理解與使用的方式進(jìn)行展示。本流程一共分為四大模塊,以下逐一說(shuō)明:I、業(yè)務(wù)域展示模塊本模塊以業(yè)務(wù)域角度展示系統(tǒng)的運(yùn)行情況,其中此處定義的業(yè)務(wù)域?yàn)橥愋蜆I(yè)務(wù)的最大集合,此類業(yè)務(wù)均運(yùn)行在相同的集群、數(shù)據(jù)庫(kù)、存儲(chǔ)、中間件等組件之上。本模塊包含了兩部分內(nèi)容:1)業(yè)務(wù)網(wǎng)元展示,每個(gè)業(yè)務(wù)網(wǎng)元都可以定義需要展示的指標(biāo),例如:業(yè)務(wù)量、成功率、失敗率等等,所有業(yè)務(wù)網(wǎng)元均在同一塊區(qū)域中展示,通過(guò)高分綠色,低分紅色顏色突出顯示的策略進(jìn)行滾動(dòng)展示。2)平臺(tái)網(wǎng)元展示,平臺(tái)網(wǎng)元按照設(shè)備類型分為主機(jī)、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)路、負(fù)載均衡等類型,該類型展示的區(qū)域聚合了所包含網(wǎng)元的健康度評(píng)分?jǐn)?shù)值,點(diǎn)擊該區(qū)域后下方顯示包含網(wǎng)元的信息,同時(shí)平臺(tái)網(wǎng)元展示還包含了該業(yè)務(wù)域所包含的所有網(wǎng)元(包括業(yè)務(wù)與平臺(tái))所觸發(fā)的事件,所有事件按照事件發(fā)生先后進(jìn)行排序。當(dāng)業(yè)務(wù)網(wǎng)元展示區(qū)域選擇事件范圍和時(shí)間點(diǎn)后,默認(rèn)平臺(tái)網(wǎng)元數(shù)據(jù)展示為選中時(shí)間點(diǎn)的鏡像數(shù)據(jù),事件展示該時(shí)間點(diǎn)開(kāi)始1小時(shí)內(nèi)的事件數(shù)據(jù)。II、平臺(tái)域展示模塊本模塊以平臺(tái)域角度展示系統(tǒng)運(yùn)行情況,其中此處定義的平臺(tái)域即業(yè)務(wù)域展示模塊中提到的“平臺(tái)網(wǎng)元展示”,平臺(tái)網(wǎng)元按照設(shè)備類型分為主機(jī)、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)路、負(fù)載均衡等類型。平臺(tái)域展示模塊中任意一種設(shè)備類型均包含了所有被監(jiān)控網(wǎng)元下同類型的網(wǎng)元組件,可以在頁(yè)面上搜索所尋找的網(wǎng)元名稱,更加直觀有效的找到被監(jiān)控網(wǎng)元。III、網(wǎng)元展示模塊本模塊展示了單個(gè)網(wǎng)元的運(yùn)行情況,根據(jù)網(wǎng)元類型可以定義多種指標(biāo)體現(xiàn)網(wǎng)元的運(yùn)行狀態(tài),計(jì)算引擎將采集引擎采集的網(wǎng)元指標(biāo)數(shù)據(jù)與配置引擎中定義的規(guī)則進(jìn)行匹配,并結(jié)合本發(fā)明的健康度算法給網(wǎng)元指標(biāo)進(jìn)行打分,并顯示在指標(biāo)項(xiàng)之后,通過(guò)該方法可以直觀的顯示引起網(wǎng)元扣分的指標(biāo)是什么,同時(shí)指標(biāo)扣分后也會(huì)根據(jù)扣分情況生成相關(guān)事件。IV、下鉆展示模塊本模塊通過(guò)業(yè)務(wù)域展示模塊中的事件列表或者網(wǎng)元展示模塊中事件列表進(jìn)入,本模塊主要展示計(jì)算引擎中下鉆模塊所采集的數(shù)據(jù)與診斷模塊所分析的結(jié)論,通過(guò)場(chǎng)景化的數(shù)據(jù)采集與展示,用戶可以直觀的在頁(yè)面上看到系統(tǒng)存在的問(wèn)題、問(wèn)題可能導(dǎo)致的原因、問(wèn)題時(shí)間點(diǎn)與之前時(shí)間點(diǎn)運(yùn)行狀態(tài)的對(duì)比,以及系統(tǒng)診斷的問(wèn)題方向。本模塊大大的節(jié)省了使用者對(duì)故障問(wèn)題的分析定位,甚至可以自動(dòng)恢復(fù)故障。現(xiàn)有技術(shù)方案中采用定義監(jiān)控指標(biāo)、設(shè)定監(jiān)控?cái)?shù)據(jù)源、配置監(jiān)控校驗(yàn)規(guī)則、部署監(jiān)控調(diào)度作業(yè)實(shí)現(xiàn)系統(tǒng)監(jiān)控,其中監(jiān)控校驗(yàn)規(guī)則配置采用最小值、最大值的值域配置或采用百分比的波動(dòng)配置等方式。當(dāng)系統(tǒng)的某個(gè)部件運(yùn)行狀況超出預(yù)設(shè)閾值時(shí),監(jiān)控系統(tǒng)識(shí)別告警并發(fā)送相關(guān)的告警通知的方式來(lái)進(jìn)行網(wǎng)元的監(jiān)控。本發(fā)明通過(guò)采集引擎的采集模塊從各個(gè)網(wǎng)元中采集相關(guān)的指標(biāo)數(shù)據(jù),規(guī)整模塊將數(shù)據(jù)整理完畢后送入計(jì)算引擎中,計(jì)算引擎訪問(wèn)配置引擎,讀取相關(guān)規(guī)則將指標(biāo)數(shù)據(jù)進(jìn)行處理生成評(píng)分與事件,事件根據(jù)等級(jí)可以觸發(fā)下鉆與自動(dòng)化處理模塊,最終由展示引擎展示讀取配置引擎中的規(guī)則進(jìn)行展示。由于本發(fā)明的計(jì)算引擎與展示引擎解耦合于監(jiān)控邏輯,使IT監(jiān)控系統(tǒng)能完全適應(yīng)用戶的不同需求,靈活調(diào)整監(jiān)控規(guī)則,并根據(jù)配置引擎中的規(guī)則自動(dòng)關(guān)聯(lián)告警關(guān)系。不僅能根據(jù)業(yè)務(wù)規(guī)則精準(zhǔn)定位故障根源,并能預(yù)處理客戶非感知故障而避免感知故障發(fā)生。同時(shí),展示引擎對(duì)計(jì)算引擎輸出的分析結(jié)論進(jìn)行場(chǎng)景化展示,按照業(yè)務(wù)類型包含的系統(tǒng)平臺(tái)組件進(jìn)行分組并進(jìn)行統(tǒng)一展示,提高了故障排除的效率和提升了客戶的滿意度。雖然本發(fā)明已以較佳實(shí)施例揭示如上,然其并非用以限定本發(fā)明,任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許的修改和完善,因此本發(fā)明的保護(hù)范圍當(dāng)以權(quán)利要求書(shū)所界定的為準(zhǔn)。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
张家港市| 沾化县| 五指山市| 库伦旗| 甘谷县| 册亨县| 霍州市| 南岸区| 屏边| 藁城市| 漳平市| 故城县| 拉萨市| 民县| 繁峙县| 和硕县| 天门市| 遵化市| 克什克腾旗| 宁强县| 大城县| 凌云县| 双江| 奈曼旗| 苗栗市| 义马市| 乐至县| 隆化县| 梅河口市| 成武县| 黔南| 砚山县| 西充县| 灵丘县| 安远县| 个旧市| 五莲县| 平乐县| 永兴县| 安吉县| 石林|