欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種系統(tǒng)監(jiān)控方法及裝置與流程

文檔序號(hào):12889883閱讀:222來(lái)源:國(guó)知局
一種系統(tǒng)監(jiān)控方法及裝置與流程

本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種系統(tǒng)監(jiān)控方法及裝置。



背景技術(shù):

基于大數(shù)據(jù)的業(yè)務(wù)處理系統(tǒng),已被廣泛應(yīng)用在電子商務(wù)平臺(tái)、信息管理中心等應(yīng)用場(chǎng)景,這類(lèi)業(yè)務(wù)處理系統(tǒng)具有實(shí)時(shí)處理數(shù)據(jù)量大,處理速度快的特點(diǎn)。在業(yè)務(wù)數(shù)據(jù)的處理過(guò)程中,為了維護(hù)業(yè)務(wù)系統(tǒng)的穩(wěn)定,需要實(shí)時(shí)監(jiān)控業(yè)務(wù)數(shù)據(jù),并在出現(xiàn)異常數(shù)據(jù)時(shí)進(jìn)行告警。

目前,進(jìn)行異常數(shù)據(jù)分析和告警的方式,主要還是對(duì)業(yè)務(wù)日志進(jìn)行分析,對(duì)基于大數(shù)據(jù)的業(yè)務(wù)處理系統(tǒng)的異常或故障進(jìn)行回溯,并向技術(shù)人員發(fā)送告警信息并通報(bào)異常點(diǎn)。但是,隨著近幾年互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,業(yè)務(wù)處理系統(tǒng)愈發(fā)復(fù)雜,實(shí)時(shí)刷新的業(yè)務(wù)日志的數(shù)據(jù)量龐大,導(dǎo)致了業(yè)務(wù)日志越來(lái)越動(dòng)態(tài)化,現(xiàn)有的對(duì)業(yè)務(wù)日志進(jìn)行分析的方案已經(jīng)難以滿(mǎn)足數(shù)據(jù)量龐大的業(yè)務(wù)日志,導(dǎo)致異常點(diǎn)排查效率降低,技術(shù)人員難以及時(shí)獲取告警信息。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的實(shí)施例提供一種系統(tǒng)監(jiān)控方法及裝置,能夠提高業(yè)務(wù)系統(tǒng)中的異常點(diǎn)的排查效率。

為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:

第一方面,本發(fā)明的實(shí)施例提供一種系統(tǒng)監(jiān)控方法,包括:

根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息,所述日志狀態(tài)信息包括:時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息,所述日志狀態(tài)信息與所述日志狀態(tài)信息關(guān)聯(lián)的日志數(shù)據(jù)對(duì)應(yīng)相同的日志跟蹤號(hào),所述監(jiān)控消息用于記錄設(shè)置 在所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)的位置;

當(dāng)所述業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并確定對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息的監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置;

根據(jù)所述監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置,確定所述業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。

結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息,包括:

根據(jù)所述業(yè)務(wù)系統(tǒng)各個(gè)運(yùn)行環(huán)節(jié)上的運(yùn)行數(shù)據(jù),提取各監(jiān)控點(diǎn)所在環(huán)節(jié)的線(xiàn)程信息和監(jiān)控消息,并依照當(dāng)前時(shí)間生成日志狀態(tài)信息對(duì)應(yīng)的時(shí)間信息和日志跟蹤號(hào),所述線(xiàn)程信息包括監(jiān)控點(diǎn)的線(xiàn)程名稱(chēng),所述監(jiān)控消息包括:前綴信息和業(yè)務(wù)監(jiān)控內(nèi)容,所述前綴信息用于表示所述日志數(shù)據(jù)在所述業(yè)務(wù)系統(tǒng)中的索引,一種日志數(shù)據(jù)的格式對(duì)應(yīng)一個(gè)前綴信息。

結(jié)合第一方面,在第一方面的第二種可能的實(shí)現(xiàn)方式中,在根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息之后,還包括:

將生成的日志狀態(tài)信息以key和value形式存入hbase集群,其中,key的規(guī)則內(nèi)容包括:計(jì)算周期、監(jiān)控編號(hào)、路由列和時(shí)間戳;

所述計(jì)算周期的設(shè)定范圍包括:秒級(jí)、分鐘級(jí)或5分鐘級(jí),所述監(jiān)控編號(hào)用于表示監(jiān)控點(diǎn)所在數(shù)據(jù)庫(kù)記錄的主鍵編號(hào),所述路由列用于表示對(duì)應(yīng)于監(jiān)控點(diǎn)的發(fā)送日志數(shù)據(jù)所通過(guò)的路由設(shè)備,其中,同一種日志數(shù)據(jù)通過(guò)相同的路由設(shè)備發(fā)送至計(jì)算設(shè)備,所述時(shí)間戳用于表示按照指定規(guī)則排序的時(shí)間點(diǎn)。

結(jié)合第一方面,在第一方面的第三種可能的實(shí)現(xiàn)方式中,所述提取對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,包括:

獲取所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)類(lèi)型信息,并確定對(duì)應(yīng)所述業(yè)務(wù)類(lèi)型信息預(yù)設(shè)順序;

按照所述預(yù)設(shè)順序讀取所述日志狀態(tài)信息中的時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息。

結(jié)合第一方面,在第一方面的第四種可能的實(shí)現(xiàn)方式中,還包括:

獲取對(duì)應(yīng)所述業(yè)務(wù)系統(tǒng)的配置模板,所述配置模板用于表示各個(gè)監(jiān)控點(diǎn)的配置位置;

根據(jù)所述配置模板更新或配置所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)。

第二方面,本發(fā)明的實(shí)施例提供一種系統(tǒng)監(jiān)控裝置,包括:

日志處理模塊,用于根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息,所述日志狀態(tài)信息包括:時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息,所述日志狀態(tài)信息與所述日志狀態(tài)信息關(guān)聯(lián)的日志數(shù)據(jù)對(duì)應(yīng)相同的日志跟蹤號(hào),所述監(jiān)控消息用于記錄設(shè)置在所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)的位置;

監(jiān)控模塊,用于當(dāng)所述業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并確定對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息的監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置;

定位模塊,用于根據(jù)所述監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置,確定所述業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。

結(jié)合第二方面,在第二方面的第一種可能的實(shí)現(xiàn)方式中,所述日志處理模塊,具體用于根據(jù)所述業(yè)務(wù)系統(tǒng)各個(gè)運(yùn)行環(huán)節(jié)上的運(yùn)行數(shù)據(jù),提取各監(jiān)控點(diǎn)所在環(huán)節(jié)的線(xiàn)程信息和監(jiān)控消息,并依照當(dāng)前時(shí)間生成日志狀態(tài)信息對(duì)應(yīng)的時(shí)間信息和日志跟蹤號(hào),所述線(xiàn)程信息包括監(jiān)控點(diǎn)的線(xiàn)程名稱(chēng),所述監(jiān)控消息包括: 前綴信息和業(yè)務(wù)監(jiān)控內(nèi)容,所述前綴信息用于表示所述日志數(shù)據(jù)在所述業(yè)務(wù)系統(tǒng)中的索引,一種日志數(shù)據(jù)的格式對(duì)應(yīng)一個(gè)前綴信息。

結(jié)合第二方面,在第二方面的第二種可能的實(shí)現(xiàn)方式中,還包括:存儲(chǔ)管理模塊,用于在根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息之后,將生成的日志狀態(tài)信息以key和value形式存入hbase集群,其中,key的規(guī)則內(nèi)容包括:計(jì)算周期、監(jiān)控編號(hào)、路由列和時(shí)間戳;

所述計(jì)算周期的設(shè)定范圍包括:秒級(jí)、分鐘級(jí)或5分鐘級(jí),所述監(jiān)控編號(hào)用于表示監(jiān)控點(diǎn)所在數(shù)據(jù)庫(kù)記錄的主鍵編號(hào),所述路由列用于表示對(duì)應(yīng)于監(jiān)控點(diǎn)的發(fā)送日志數(shù)據(jù)所通過(guò)的路由設(shè)備,其中,同一種日志數(shù)據(jù)通過(guò)相同的路由設(shè)備發(fā)送至計(jì)算設(shè)備,所述時(shí)間戳用于表示按照指定規(guī)則排序的時(shí)間點(diǎn)。

結(jié)合第二方面,在第二方面的第三種可能的實(shí)現(xiàn)方式中,所述監(jiān)控模塊,具體用于獲取所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)類(lèi)型信息,并確定對(duì)應(yīng)所述業(yè)務(wù)類(lèi)型信息預(yù)設(shè)順序;并按照所述預(yù)設(shè)順序讀取所述日志狀態(tài)信息中的時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息。

結(jié)合第二方面,在第二方面的第四種可能的實(shí)現(xiàn)方式中,還包括:配置模塊,用于獲取對(duì)應(yīng)所述業(yè)務(wù)系統(tǒng)的配置模板,所述配置模板用于表示各個(gè)監(jiān)控點(diǎn)的配置位置;并根據(jù)所述配置模板更新或配置所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)。

本發(fā)明實(shí)施例提供的系統(tǒng)監(jiān)控方法及裝置,根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)實(shí)時(shí)生成相應(yīng)的日志狀態(tài)信息,并在業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并依據(jù)日志狀態(tài)信息確定監(jiān)控點(diǎn)在業(yè)務(wù)系統(tǒng)中的位置,從而根據(jù)監(jiān)控點(diǎn)在業(yè)務(wù)系統(tǒng)中的位置,確定業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。相對(duì)于現(xiàn)有技術(shù)中直接分析業(yè)務(wù)系統(tǒng)的業(yè)務(wù)日志進(jìn)行異常排查進(jìn)行告警的方式,由于日志狀態(tài)信息的數(shù)據(jù)量極小且能夠快速指向監(jiān)控點(diǎn),實(shí)現(xiàn)了在基于大 數(shù)據(jù)的業(yè)務(wù)處理系統(tǒng)中,對(duì)發(fā)生異常業(yè)務(wù)數(shù)據(jù)進(jìn)行回溯并快速定位異常點(diǎn),從而提高異常點(diǎn)排查效率并能夠及時(shí)發(fā)出告警信息。

附圖說(shuō)明

為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其它的附圖。

圖1為本發(fā)明實(shí)施例提供的一種系統(tǒng)架構(gòu)示意圖;

圖2為本發(fā)明實(shí)施例提供的另一種系統(tǒng)架構(gòu)示意圖;

圖3為本發(fā)明實(shí)施例提供的系統(tǒng)監(jiān)控方法的流程示意圖;

圖4、圖5、圖6為本發(fā)明實(shí)施例提供的系統(tǒng)監(jiān)控裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。下文中將詳細(xì)描述本發(fā)明的實(shí)施方式,所述實(shí)施方式的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施方式是示例性的,僅用于解釋本發(fā)明,而不能解釋為對(duì)本發(fā)明的限制。本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個(gè)”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進(jìn)一步理解的是,本發(fā)明的說(shuō)明書(shū)中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應(yīng)該理解,當(dāng)我們稱(chēng)元件被“連接”或“耦接”到另一元件時(shí),它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接” 或“耦接”可以包括無(wú)線(xiàn)連接或耦接。這里使用的措辭“和/或”包括一個(gè)或更多個(gè)相關(guān)聯(lián)的列出項(xiàng)的任一單元和全部組合。本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(yǔ)(包括技術(shù)術(shù)語(yǔ)和科學(xué)術(shù)語(yǔ))具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語(yǔ)應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣定義,不會(huì)用理想化或過(guò)于正式的含義來(lái)解釋。

本實(shí)施例的執(zhí)行過(guò)程,具體可以運(yùn)行在一種如圖1所示的監(jiān)控系統(tǒng)中,其中用于業(yè)務(wù)監(jiān)控的服務(wù)器集群與storm計(jì)算集群向量;并通過(guò)kafka(一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng))集群連接業(yè)務(wù)系統(tǒng)并進(jìn)行數(shù)據(jù)交互??蛇x的,本實(shí)施例中,由運(yùn)行在業(yè)務(wù)系統(tǒng)上的日志采集客戶(hù)端實(shí)時(shí)采集并通過(guò)kafka集群向業(yè)務(wù)監(jiān)控的服務(wù)器集群上報(bào)運(yùn)行數(shù)據(jù)(在本實(shí)施例中,日志數(shù)據(jù)可以理解為運(yùn)行數(shù)據(jù)的一部分,或者運(yùn)行數(shù)據(jù)與日志數(shù)據(jù)也可以分別上報(bào)),并由用于業(yè)務(wù)監(jiān)控的服務(wù)器集群執(zhí)行本實(shí)施例提供的方法流程或是運(yùn)行本實(shí)施例提供的裝置模塊。其中,如圖2所示的,用于業(yè)務(wù)監(jiān)控的服務(wù)器集群中可以包括:redis集群、mysql集群、hbase/hadoop集群和配置展現(xiàn)系統(tǒng)。運(yùn)維/監(jiān)控人員可以通過(guò)配置展現(xiàn)系統(tǒng)查詢(xún)用于業(yè)務(wù)監(jiān)控的服務(wù)器集群中的數(shù)據(jù),尤其是日志狀態(tài)信息和業(yè)務(wù)系統(tǒng)向用于業(yè)務(wù)監(jiān)控的服務(wù)器集群上報(bào)的數(shù)據(jù)。具體的,redis集群用于存儲(chǔ)實(shí)時(shí)數(shù)據(jù),比如實(shí)時(shí)記錄的業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)、刷新速率較快的數(shù)據(jù);mysql集群用于存儲(chǔ)歷史數(shù)據(jù),比如:日志狀態(tài)信息和業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)中需要保留一定時(shí)間的數(shù)據(jù);hbase/hadoop集群用于存儲(chǔ)歷史數(shù)據(jù),比如:日志狀態(tài)信息和業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)中需要保留一定時(shí)間的數(shù)據(jù);mysql集群用于存儲(chǔ)配置數(shù)據(jù),比如:配置模板。

本發(fā)明實(shí)施例提供一種系統(tǒng)監(jiān)控方法,如圖3所示,包括:

s1、根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息。

其中,所述日志狀態(tài)信息包括:時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息,與所述日志狀態(tài)信息關(guān)聯(lián)的日志數(shù)據(jù)對(duì)應(yīng)相同的日志跟蹤號(hào),所述監(jiān)控消息用于記錄設(shè)置在所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)的位置。

s2、當(dāng)所述業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并確定對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息的監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置。

其中,可以由業(yè)務(wù)系統(tǒng)檢測(cè)到業(yè)務(wù)異常時(shí),判定出現(xiàn)異常業(yè)務(wù)數(shù)據(jù);或者由用于業(yè)務(wù)監(jiān)控的服務(wù)器集群實(shí)時(shí)監(jiān)控業(yè)務(wù)系統(tǒng),并在檢測(cè)到業(yè)務(wù)異常時(shí),判定出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)。

在本實(shí)施例中,異常業(yè)務(wù)數(shù)據(jù)可以包括:業(yè)務(wù)系統(tǒng)在發(fā)生業(yè)務(wù)異常時(shí)所記錄的日志數(shù)據(jù)、狀態(tài)信息等運(yùn)行數(shù)據(jù)。在業(yè)務(wù)系統(tǒng)上報(bào)運(yùn)行數(shù)據(jù)的過(guò)程中,用于業(yè)務(wù)監(jiān)控的服務(wù)器集群實(shí)時(shí)生成對(duì)應(yīng)業(yè)務(wù)系統(tǒng)所上報(bào)的運(yùn)行數(shù)據(jù)的日志狀態(tài)信息。

s3、根據(jù)所述監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置,確定所述業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。

在本實(shí)施例中,當(dāng)確定所述業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)后,用于業(yè)務(wù)監(jiān)控的服務(wù)器集群可以執(zhí)行告警流程。其中,告警規(guī)則可以基于存儲(chǔ)的key值進(jìn)行告警檢查,告警檢查統(tǒng)一使用帶有一個(gè)變量a的告警表達(dá)式:如:a<0.6,1000<a<2000;并以存儲(chǔ)的key確定告警路徑,且可以采用模糊匹配的方式,比如:1#1#cmb#*。當(dāng)實(shí)時(shí)檢查到滿(mǎn)足告警表達(dá)式后即觸發(fā)告警。告警頻率可以設(shè)置間隔時(shí)間來(lái)調(diào)整,如:30分鐘內(nèi)某個(gè)監(jiān)控點(diǎn)只告警一次;或者,可以記錄連續(xù)滿(mǎn)足表達(dá)式的次數(shù),次數(shù)達(dá)到預(yù)設(shè)值則進(jìn)行告警;或者,可以記錄累計(jì)滿(mǎn) 足表達(dá)式的次數(shù),次數(shù)達(dá)到預(yù)設(shè)門(mén)限則進(jìn)行告警。

本發(fā)明實(shí)施例提供的系統(tǒng)監(jiān)控方法,根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)實(shí)時(shí)生成相應(yīng)的日志狀態(tài)信息,并在業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并依據(jù)日志狀態(tài)信息確定監(jiān)控點(diǎn)在業(yè)務(wù)系統(tǒng)中的位置,從而根據(jù)監(jiān)控點(diǎn)在業(yè)務(wù)系統(tǒng)中的位置,確定業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。相對(duì)于現(xiàn)有技術(shù)中直接分析業(yè)務(wù)系統(tǒng)的業(yè)務(wù)日志進(jìn)行異常排查進(jìn)行告警的方式,由于日志狀態(tài)信息的數(shù)據(jù)量極小且能夠快速指向監(jiān)控點(diǎn),實(shí)現(xiàn)了在基于大數(shù)據(jù)的業(yè)務(wù)處理系統(tǒng)中,對(duì)發(fā)生異常業(yè)務(wù)數(shù)據(jù)進(jìn)行回溯并快速定位異常點(diǎn),從而提高異常點(diǎn)排查效率并能夠及時(shí)發(fā)出告警信息。

在本實(shí)施例中,所述根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息,包括:

根據(jù)所述業(yè)務(wù)系統(tǒng)各個(gè)運(yùn)行環(huán)節(jié)上的運(yùn)行數(shù)據(jù),提取各監(jiān)控點(diǎn)所在環(huán)節(jié)的線(xiàn)程信息和監(jiān)控消息,并依照當(dāng)前時(shí)間生成日志狀態(tài)信息對(duì)應(yīng)的時(shí)間信息和日志跟蹤號(hào),所述線(xiàn)程信息包括監(jiān)控點(diǎn)的線(xiàn)程名稱(chēng),所述監(jiān)控消息包括:前綴信息和業(yè)務(wù)監(jiān)控內(nèi)容,所述前綴信息用于表示所述日志數(shù)據(jù)在所述業(yè)務(wù)系統(tǒng)中的索引,一種日志數(shù)據(jù)的格式對(duì)應(yīng)一個(gè)前綴信息。例如:在本實(shí)施例中,在業(yè)務(wù)系統(tǒng)告知異常后,用于業(yè)務(wù)監(jiān)控的服務(wù)器集群調(diào)用由運(yùn)行數(shù)據(jù)生成得到的日志狀態(tài)信息,對(duì)于日志狀態(tài)信息的格式設(shè)計(jì)包括如下內(nèi)容:

日志狀態(tài)信息的格式:時(shí)間|線(xiàn)程名|日志跟蹤號(hào)|監(jiān)控消息,樣例如下:

2015-07-2015:12:13,559|thread-192|traclecode|prefix=bank{“bankcode”:“cmb”,“bizcode”:“refund”,“respcode”:“success”}

2015-07-2015:12:16,559|thread-191|traclecode|prefix=bank{“bankcode”:“cmb”,“bizcode”:“refund”,“respcode”:“fail”}

2015-07-2015:12:32,559|thread-102|traclecode|prefix=bank{“bankcode”:“cmb”,“bizcode”:“refund”,“respcode”:“success”}

2015-07-2015:12:45,559|thread-143|traclecode|prefix=bank{“bankcode”:“cmb”,“bizcode”:“refund”,“respcode”:“fail”}

其中,時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息等信息可以存儲(chǔ)為日志項(xiàng),日志項(xiàng)之間通過(guò)字符"|"分隔;時(shí)間信息記錄為【yyyy-mm-ddhh:mm:ss,sss】,日志時(shí)間可以記錄在日志狀態(tài)信息中的第一個(gè)位置;線(xiàn)程信息用于表示輸出當(dāng)前日志的線(xiàn)程名稱(chēng);日志跟蹤號(hào),用于與其他業(yè)務(wù)日志中的日志關(guān)聯(lián)起來(lái),以便異常點(diǎn)的定位。

監(jiān)控消息具體可以包括:前綴和監(jiān)控內(nèi)容(監(jiān)控內(nèi)容具體可以采用json格式)。其中,前綴可以如樣例中的內(nèi)容【prefix=bank】,其中bank表示日志監(jiān)控前綴信息,監(jiān)控消息中的前綴在系統(tǒng)中可以作為唯一索引,一般同一種日志格式的,只需要配置一個(gè)監(jiān)控前綴即可。監(jiān)控內(nèi)容可以如樣例中的內(nèi)容:

{“bankcode”:“cmb”,“bizcode”:“refund”,“responsecode”:“fail”}。

在本實(shí)施例中,還可以將全量數(shù)據(jù)以key和value形式存入hbase集群,包括:在根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)生成日志狀態(tài)信息之后,將生成的日志狀態(tài)信息以key和value形式存入hbase集群其中,key表示在目前的hbase集群的存儲(chǔ)過(guò)程中使用的關(guān)鍵字,value表示在目前的hbase集群的存儲(chǔ)過(guò)程中使用的值。

其中,key的規(guī)則內(nèi)容包括:計(jì)算周期、監(jiān)控編號(hào)、路由列和時(shí)間戳。所述計(jì)算周期的設(shè)定范圍包括:秒級(jí)、分鐘級(jí)或5分鐘級(jí),例如:如表1所示,key的規(guī)則:計(jì)算周期#監(jiān)控編號(hào)#路由列1#路由列2#......+時(shí)間戳;計(jì)算周期的設(shè)定:0是秒級(jí),1是分鐘級(jí),5是5分鐘級(jí)。所述監(jiān)控編號(hào)用于表示監(jiān)控點(diǎn)所在數(shù)據(jù)庫(kù)記錄的主鍵編號(hào),所述路由列用于表示對(duì)應(yīng)于監(jiān)控點(diǎn)的發(fā)送日志數(shù)據(jù)所通過(guò)的路由設(shè)備,其中,同一種日志數(shù)據(jù)通過(guò)相同的路由設(shè)備發(fā)送至計(jì)算設(shè)備,所述時(shí)間戳用于表示按照指定規(guī)則排序的時(shí)間點(diǎn)。例如:如表1所示,監(jiān)控編號(hào)為監(jiān)控點(diǎn)所在數(shù)據(jù)庫(kù)記錄的主鍵編號(hào);路由列為根據(jù)監(jiān)控點(diǎn)需要,將一類(lèi)日志發(fā)送 到同一機(jī)器中進(jìn)行計(jì)算;時(shí)間戳為當(dāng)前計(jì)算周期的時(shí)間,比如5分鐘是1-5分鐘計(jì)算到5,6-10計(jì)算到10,比如:12:01,12:02,12:03,12:04,12:05計(jì)算值對(duì)應(yīng)的時(shí)間戳是12:05,再比如:12:16,12:17,12:18,12:19,12:20計(jì)算值對(duì)應(yīng)的時(shí)間戳是12:20。

表1

在本實(shí)施例中,所述提取對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息的具體方式,可以包括:

獲取所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)類(lèi)型信息,并確定對(duì)應(yīng)所述業(yè)務(wù)類(lèi)型信息預(yù)設(shè)順序。并按照所述預(yù)設(shè)順序讀取所述日志狀態(tài)信息中的時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息。

在本實(shí)施例中,日志狀態(tài)信息的格式可以為:時(shí)間|線(xiàn)程名|日志跟蹤號(hào)|監(jiān)控消息,用于業(yè)務(wù)監(jiān)控的服務(wù)器集群可以按照日志狀態(tài)信息的字符排列順序依次讀取日志狀態(tài)信息中的時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息等信息,可以按照預(yù)設(shè)順序讀取日志狀態(tài)信息中的時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息等信息。

其中,預(yù)設(shè)順序?qū)?yīng)業(yè)務(wù)系統(tǒng)的業(yè)務(wù)類(lèi)型,并將業(yè)務(wù)類(lèi)型記錄為業(yè)務(wù)類(lèi)型信息。例如:業(yè)務(wù)類(lèi)型為短時(shí)間搶購(gòu),則預(yù)設(shè)順序中優(yōu)選讀取時(shí)間信息;再例如:業(yè)務(wù)類(lèi)型為需要占用較多線(xiàn)程進(jìn)行并行處理的業(yè)務(wù),則預(yù)設(shè)順序中優(yōu)選讀取線(xiàn)程信息;再例如:業(yè)務(wù)類(lèi)型為日志數(shù)據(jù)量較大的業(yè)務(wù),則,則預(yù)設(shè)順序中 優(yōu)選讀取日志跟蹤號(hào);再例如:業(yè)務(wù)類(lèi)型為業(yè)務(wù)環(huán)節(jié)較多或者較為復(fù)雜的業(yè)務(wù),則預(yù)設(shè)順序中優(yōu)選讀取監(jiān)控消息。

在本實(shí)施例中,針對(duì)不同的業(yè)務(wù)類(lèi)型,可以在業(yè)務(wù)系統(tǒng)上線(xiàn)且加載該業(yè)務(wù)時(shí)自動(dòng)根據(jù)配置模板在業(yè)務(wù)系統(tǒng)中的配置監(jiān)控點(diǎn),即本實(shí)施例中還可以還包括以下流程:獲取對(duì)應(yīng)所述業(yè)務(wù)系統(tǒng)的配置模板,所述配置模板用于表示各個(gè)監(jiān)控點(diǎn)的配置位置。并根據(jù)所述配置模板更新或配置所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)。

具體的,日志狀態(tài)信息基于監(jiān)控點(diǎn)生成,設(shè)置監(jiān)控點(diǎn)在各個(gè)業(yè)務(wù)系統(tǒng),每一個(gè)業(yè)務(wù)系統(tǒng)中的各個(gè)業(yè)務(wù)環(huán)節(jié)可以進(jìn)一步設(shè)置子監(jiān)控點(diǎn),以便于用于業(yè)務(wù)監(jiān)控的服務(wù)器集群根據(jù)日志狀態(tài)信息查找監(jiān)控點(diǎn)所設(shè)置在的環(huán)節(jié),從而找到出現(xiàn)異常或是存在問(wèn)題的環(huán)節(jié)。

本發(fā)明實(shí)施例還提供一種系統(tǒng)監(jiān)控裝置,如圖4所示,包括:

日志處理模塊,用于根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息,所述日志狀態(tài)信息包括:時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息,所述日志狀態(tài)信息與所述日志狀態(tài)信息關(guān)聯(lián)的日志數(shù)據(jù)對(duì)應(yīng)相同的日志跟蹤號(hào),所述監(jiān)控消息用于記錄設(shè)置在所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)的位置。

監(jiān)控模塊,用于當(dāng)所述業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并確定對(duì)應(yīng)所述異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息的監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置。

定位模塊,用于根據(jù)所述監(jiān)控點(diǎn)在所述業(yè)務(wù)系統(tǒng)中的位置,確定所述業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。

在本實(shí)施例中,所述日志處理模塊,具體用于根據(jù)所述業(yè)務(wù)系統(tǒng)各個(gè)運(yùn)行環(huán)節(jié)上的運(yùn)行數(shù)據(jù),提取各監(jiān)控點(diǎn)所在環(huán)節(jié)的線(xiàn)程信息和監(jiān)控消息,并依照當(dāng)前時(shí)間生成日志狀態(tài)信息對(duì)應(yīng)的時(shí)間信息和日志跟蹤號(hào),所述線(xiàn)程信息包括監(jiān) 控點(diǎn)的線(xiàn)程名稱(chēng),所述監(jiān)控消息包括:前綴信息和業(yè)務(wù)監(jiān)控內(nèi)容,所述前綴信息用于表示所述日志數(shù)據(jù)在所述業(yè)務(wù)系統(tǒng)中的索引,一種日志數(shù)據(jù)的格式對(duì)應(yīng)一個(gè)前綴信息。

在本實(shí)施例中,如圖5所示,還包括:存儲(chǔ)管理模塊,用于在根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),生成日志狀態(tài)信息之后,將生成的日志狀態(tài)信息以key和value形式存入hbase集群,其中,key的規(guī)則內(nèi)容包括:計(jì)算周期、監(jiān)控編號(hào)、路由列和時(shí)間戳。

所述計(jì)算周期的設(shè)定范圍包括:秒級(jí)、分鐘級(jí)或5分鐘級(jí),所述監(jiān)控編號(hào)用于表示監(jiān)控點(diǎn)所在數(shù)據(jù)庫(kù)記錄的主鍵編號(hào),所述路由列用于表示對(duì)應(yīng)于監(jiān)控點(diǎn)的發(fā)送日志數(shù)據(jù)所通過(guò)的路由設(shè)備,其中,同一種日志數(shù)據(jù)通過(guò)相同的路由設(shè)備發(fā)送至計(jì)算設(shè)備,所述時(shí)間戳用于表示按照指定規(guī)則排序的時(shí)間點(diǎn)。

在本實(shí)施例中,所述監(jiān)控模塊,具體用于獲取所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)類(lèi)型信息,并確定對(duì)應(yīng)所述業(yè)務(wù)類(lèi)型信息預(yù)設(shè)順序。并按照所述預(yù)設(shè)順序讀取所述日志狀態(tài)信息中的時(shí)間信息、線(xiàn)程信息、日志跟蹤號(hào)和監(jiān)控消息。

在本實(shí)施例中,如圖6所示,還包括:配置模塊,用于獲取對(duì)應(yīng)所述業(yè)務(wù)系統(tǒng)的配置模板,所述配置模板用于表示各個(gè)監(jiān)控點(diǎn)的配置位置。并根據(jù)所述配置模板更新或配置所述業(yè)務(wù)系統(tǒng)中的監(jiān)控點(diǎn)。

本發(fā)明實(shí)施例提供的系統(tǒng)監(jiān)控裝置,根據(jù)業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù)實(shí)時(shí)生成相應(yīng)的日志狀態(tài)信息,并在業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)數(shù)據(jù)時(shí),提取對(duì)應(yīng)異常業(yè)務(wù)數(shù)據(jù)的日志狀態(tài)信息,并依據(jù)日志狀態(tài)信息確定監(jiān)控點(diǎn)在業(yè)務(wù)系統(tǒng)中的位置,從而根據(jù)監(jiān)控點(diǎn)在業(yè)務(wù)系統(tǒng)中的位置,確定業(yè)務(wù)系統(tǒng)中的發(fā)生異常的環(huán)節(jié)。相對(duì)于現(xiàn)有技術(shù)中直接分析業(yè)務(wù)系統(tǒng)的業(yè)務(wù)日志進(jìn)行異常排查進(jìn)行告警的方式,由于日志狀態(tài)信息的數(shù)據(jù)量極小且能夠快速指向監(jiān)控點(diǎn),實(shí)現(xiàn)了在基于大數(shù)據(jù)的 業(yè)務(wù)處理系統(tǒng)中,對(duì)發(fā)生異常業(yè)務(wù)數(shù)據(jù)進(jìn)行回溯并快速定位異常點(diǎn),從而提高異常點(diǎn)排查效率并能夠及時(shí)發(fā)出告警信息。

本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于設(shè)備實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤(pán)、只讀存儲(chǔ)記憶體(read-onlymemory,rom)或隨機(jī)存儲(chǔ)記憶體(randomaccessmemory,ram)等。以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
神木县| 龙州县| 宜君县| 米易县| 锡林郭勒盟| 新泰市| 嵊泗县| 乌拉特中旗| 高安市| 突泉县| 富蕴县| 长乐市| 陆良县| 扎兰屯市| 泌阳县| 新龙县| 福泉市| 博白县| 铜山县| 平乡县| 南丹县| 绍兴县| 琼结县| 抚州市| 吉安市| 团风县| 天全县| 华坪县| 二连浩特市| 盘山县| 杭锦后旗| 丰宁| 哈巴河县| 宝鸡市| 乐昌市| 方山县| 瓮安县| 广西| 巩留县| 宣化县| 德格县|