監(jiān)控方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息監(jiān)控技術(shù)領(lǐng)域,尤其涉及一種監(jiān)控方法及系統(tǒng)。
【背景技術(shù)】
[0002] 監(jiān)控系統(tǒng)作為了解和掌控信息科技系統(tǒng)運(yùn)行狀況的輔助工具,正發(fā)揮著越來越重 要的作用。
[0003] 傳統(tǒng)監(jiān)控工具通過在各應(yīng)用系統(tǒng)上安裝監(jiān)控代理,配置各種不同的監(jiān)控指標(biāo),采 集數(shù)據(jù)并上送后進(jìn)行集中展現(xiàn)。圖1是現(xiàn)有的監(jiān)控工具故障定位的示意圖,如圖1所示,監(jiān) 控對(duì)象包括:應(yīng)用1、系統(tǒng)2、網(wǎng)絡(luò)3、……、組件N,每個(gè)監(jiān)控對(duì)象均安裝有監(jiān)控代理,監(jiān)控服 務(wù)器實(shí)時(shí)從監(jiān)控代理處采集信息,并在顯示界面上展示告警信息,在圖1中,除了應(yīng)用1之 外,其余監(jiān)控對(duì)象均發(fā)生告警("X"代表故障)。
[0004] 由于各應(yīng)用系統(tǒng)或組件的監(jiān)控?cái)?shù)據(jù)采集是孤立的,當(dāng)它們發(fā)生告警時(shí),這些告警 事件會(huì)逐條展示在監(jiān)控視圖上。而運(yùn)維管理人員看到告警后,將會(huì)處理每條告警事件,針對(duì) 發(fā)生告警的每個(gè)應(yīng)用系統(tǒng)或組件一一進(jìn)行問題排查。但實(shí)際上,由于不同應(yīng)用系統(tǒng)或組件 之間存在關(guān)聯(lián)性,產(chǎn)生不同告警事件的本質(zhì)原因可能是同一個(gè),也就是說,使用現(xiàn)有的監(jiān)控 工具進(jìn)行問題排查往往付出了很大的精力卻達(dá)不到快速定位的效果。
[0005] 綜上,現(xiàn)有的監(jiān)控工具主要存在以下問題:
[0006] (1)現(xiàn)有的監(jiān)控工具展示的告警信息孤立、不全面,增加了故障定位的難度;
[0007] (2)當(dāng)大量的問題單和客戶投訴電話轉(zhuǎn)至運(yùn)維管理部門時(shí),在傳統(tǒng)的問題應(yīng)急處 理流程中,一般是對(duì)發(fā)生故障業(yè)務(wù)的相關(guān)系統(tǒng)進(jìn)行同步分頭排查,往往付出了大量的人力、 物力卻很難快速找到問題的根源,故障定位和排查問題的效率較低。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明提供了一種監(jiān)控方法及系統(tǒng),以至少解決現(xiàn)有的監(jiān)控工具展示的告警信息 孤立,增加了故障定位的難度,且故障定位和排查問題的效率較低的問題。
[0009] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種監(jiān)控方法,包括:根據(jù)待監(jiān)控系統(tǒng)的業(yè)務(wù)數(shù)據(jù) 流特點(diǎn)將所述待監(jiān)控系統(tǒng)劃分為存在依賴關(guān)系的至少一個(gè)端點(diǎn),并根據(jù)所述至少一個(gè)端點(diǎn) 以及端點(diǎn)間的依賴關(guān)系生成配置文件;獲取各端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù),其中,每個(gè)端點(diǎn)均部署 監(jiān)控代理;對(duì)所述監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,得到第一格式的監(jiān)控指標(biāo)數(shù)據(jù);根據(jù)所述 第一格式的監(jiān)控指標(biāo)數(shù)據(jù)及所述配置文件填充顯示界面的頁面數(shù)據(jù),按照所述第一格式在 所述顯示界面上顯示各端點(diǎn)的端點(diǎn)信息,其中,所述端點(diǎn)信息包括:端點(diǎn)狀態(tài)、端點(diǎn)間的依 賴關(guān)系和端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù)。
[0010] 在一個(gè)實(shí)施例中,獲取各端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù),包括:從各端點(diǎn)的監(jiān)控代理處采集 共性指標(biāo)數(shù)據(jù);接收各端點(diǎn)的監(jiān)控代理發(fā)送的個(gè)性指標(biāo)數(shù)據(jù)。
[0011] 在一個(gè)實(shí)施例中,在對(duì)所述監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換之前,所述方法還包括:存 儲(chǔ)所述監(jiān)控指標(biāo)數(shù)據(jù);按照預(yù)設(shè)的時(shí)間間隔對(duì)存儲(chǔ)的監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行計(jì)算,并利用計(jì)算 結(jié)果對(duì)所述存儲(chǔ)的監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行更新;對(duì)所述監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,包括:讀 取更新后的監(jiān)控指標(biāo)數(shù)據(jù),并對(duì)所述更新后的監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換。
[0012] 在一個(gè)實(shí)施例中,存儲(chǔ)所述監(jiān)控指標(biāo)數(shù)據(jù),包括:根據(jù)預(yù)先存儲(chǔ)的端點(diǎn)的配置信息 對(duì)所述監(jiān)控指標(biāo)數(shù)據(jù)中的個(gè)性指標(biāo)數(shù)據(jù)進(jìn)行分類存儲(chǔ),其中,所述配置信息包括:端點(diǎn)的應(yīng) 用名稱、IP地址、機(jī)構(gòu)名稱和機(jī)構(gòu)編碼。
[0013] 在一個(gè)實(shí)施例中,在按照所述第一格式在所述顯示界面上顯示各端點(diǎn)的端點(diǎn)信息 之后,所述方法還包括:根據(jù)預(yù)設(shè)規(guī)則和各端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù)生成各端點(diǎn)的端點(diǎn)狀態(tài); 利用生成的端點(diǎn)狀態(tài)更新所述顯示界面上當(dāng)前顯示的端點(diǎn)狀態(tài)。
[0014] 在一個(gè)實(shí)施例中,所述端點(diǎn)狀態(tài)包括:所述端點(diǎn)是否可以正常服務(wù)以及服務(wù)的能 力。
[0015] 根據(jù)本發(fā)明的另一個(gè)方面,提供了一種監(jiān)控系統(tǒng),包括:劃分單元,用于根據(jù)待監(jiān) 控系統(tǒng)的業(yè)務(wù)數(shù)據(jù)流特點(diǎn)將所述待監(jiān)控系統(tǒng)劃分為存在依賴關(guān)系的至少一個(gè)端點(diǎn);第一生 成單元,用于根據(jù)所述至少一個(gè)端點(diǎn)以及端點(diǎn)間的依賴關(guān)系生成配置文件;獲取單元,用于 獲取各端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù),其中,每個(gè)端點(diǎn)均部署監(jiān)控代理;格式轉(zhuǎn)換單元,用于對(duì)所述 監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,得到第一格式的監(jiān)控指標(biāo)數(shù)據(jù);顯示單元,用于根據(jù)所述第一 格式的監(jiān)控指標(biāo)數(shù)據(jù)及所述配置文件填充顯示界面的頁面數(shù)據(jù),按照所述第一格式在所述 顯示界面上顯示各端點(diǎn)的端點(diǎn)信息,其中,所述端點(diǎn)信息包括:端點(diǎn)狀態(tài)、端點(diǎn)間的依賴關(guān) 系和端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù)。
[0016] 在一個(gè)實(shí)施例中,所述獲取單元包括:采集模塊,用于從各端點(diǎn)的監(jiān)控代理處采集 共性指標(biāo)數(shù)據(jù);接收模塊,用于接收各端點(diǎn)的監(jiān)控代理發(fā)送的個(gè)性指標(biāo)數(shù)據(jù)。
[0017] 在一個(gè)實(shí)施例中,所述監(jiān)控系統(tǒng)還包括:存儲(chǔ)單元,用于存儲(chǔ)所述監(jiān)控指標(biāo)數(shù)據(jù); 計(jì)算單元,用于按照預(yù)設(shè)的時(shí)間間隔對(duì)存儲(chǔ)的監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行計(jì)算;第一更新單元,用于 利用計(jì)算結(jié)果對(duì)所述存儲(chǔ)的監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行更新;所述格式轉(zhuǎn)換單元包括:讀取模塊, 用于讀取更新后的監(jiān)控指標(biāo)數(shù)據(jù);格式轉(zhuǎn)換模塊,用于對(duì)所述更新后的監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行 格式轉(zhuǎn)換。
[0018] 在一個(gè)實(shí)施例中,所述監(jiān)控系統(tǒng)還包括:第二生成單元,用于在按照所述第一格式 在所述顯示界面上顯示各端點(diǎn)的端點(diǎn)信息之后,根據(jù)預(yù)設(shè)規(guī)則和各端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù)生 成各端點(diǎn)的端點(diǎn)狀態(tài);第二更新單元,用于利用生成的端點(diǎn)狀態(tài)更新所述顯示界面上當(dāng)前 顯示的端點(diǎn)狀態(tài)。
[0019] 通過本發(fā)明的監(jiān)控方法及系統(tǒng),分析待監(jiān)控系統(tǒng)的業(yè)務(wù)特點(diǎn),將待監(jiān)控系統(tǒng)包含 的信息科技組件抽象為按照組件間的依賴關(guān)系相互連接的一組端點(diǎn),采集各端點(diǎn)的監(jiān)控指 標(biāo)數(shù)據(jù),對(duì)監(jiān)控指標(biāo)數(shù)據(jù)進(jìn)行豐富和加工處理,處理后的數(shù)據(jù)按照各端點(diǎn)的連接順序進(jìn)行 匯聚、展現(xiàn)以及告警,從而實(shí)現(xiàn)業(yè)務(wù)全流程中所涉及的所有組件(即端點(diǎn))的全貌展示和監(jiān) 控。當(dāng)發(fā)生故障時(shí),可清晰地展示發(fā)生故障的一系列端點(diǎn)及其依賴關(guān)系,信息科技組件之間 的告警信息是不孤立的,降低了故障定位的難度,使得應(yīng)急處理人員能夠快速定位故障模 塊,縮短問題排查區(qū)間,提高問題排查效率,減輕應(yīng)急處理人員的壓力。
【附圖說明】
[0020] 此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā) 明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限定。在附圖中:
[0021] 圖1是現(xiàn)有的監(jiān)控工具故障定位的示意圖;
[0022] 圖2是本發(fā)明實(shí)施例的監(jiān)控方法的流程圖;
[0023] 圖3是本發(fā)明實(shí)施例的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖一;
[0024] 圖4是本發(fā)明實(shí)施例的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖二;
[0025] 圖5是本發(fā)明實(shí)施例的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖三;
[0026] 圖6是本發(fā)明具體實(shí)施例的監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;
[0027] 圖7是本發(fā)明具體實(shí)施例的監(jiān)控方法的詳細(xì)流程圖;
[0028] 圖8是本發(fā)明具體實(shí)施例的監(jiān)控方法的故障定位示意圖;
[0029] 圖9是本發(fā)明具體實(shí)施例的監(jiān)控系統(tǒng)的物理部署圖。
【具體實(shí)施方式】
[0030] 下面結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整 地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒?發(fā)明的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施 例,都屬于本發(fā)明的保護(hù)范圍。
[0031] 本發(fā)明實(shí)施例提供了一種監(jiān)控方法,圖2是本發(fā)明實(shí)施例的監(jiān)控方法的流程圖。 如圖2所示,該方法包括如下步驟:
[0032] 步驟S201,根據(jù)待監(jiān)控系統(tǒng)的業(yè)務(wù)數(shù)據(jù)流特點(diǎn)將待監(jiān)控系統(tǒng)劃分為存在依賴關(guān)系 的至少一個(gè)端點(diǎn),并根據(jù)至少一個(gè)端點(diǎn)以及端點(diǎn)間的依賴關(guān)系生成配置文件。
[0033] 其中,待監(jiān)控系統(tǒng)可以是信息系統(tǒng),例如,銀行的某應(yīng)用系統(tǒng)。可選的,可以根據(jù)應(yīng) 用系統(tǒng)版本說明書梳理出業(yè)務(wù)數(shù)據(jù)流圖,進(jìn)而根據(jù)業(yè)務(wù)數(shù)據(jù)流圖抽象出不同的端點(diǎn)以及端 點(diǎn)之間的依賴關(guān)系。
[0034] 步驟S202,獲取各端點(diǎn)的監(jiān)控指標(biāo)數(shù)據(jù),其中,每個(gè)端點(diǎn)均部署監(jiān)控代理。
[0035] 監(jiān)控指標(biāo)數(shù)據(jù)能夠體現(xiàn)端點(diǎn)的健康狀況和可用性狀態(tài),其中,端點(diǎn)的健康狀況表 示其對(duì)外服務(wù)的能力水平(例如CPU、內(nèi)存等),端點(diǎn)的可用性狀態(tài)表示其是否可以對(duì)外正 常服務(wù)(例