本發(fā)明涉及智能運(yùn)維技術(shù)領(lǐng)域,具體涉及一種it信息機(jī)房智能運(yùn)維系統(tǒng)及方法。
背景技術(shù):
隨著it建設(shè)的不斷深入和完善,計(jì)算機(jī)硬軟件系統(tǒng)的運(yùn)行維護(hù)已經(jīng)成為了各行各業(yè)各單位領(lǐng)導(dǎo)和信息服務(wù)部門普遍關(guān)注和不堪重負(fù)的問題。所謂it運(yùn)維管理,是指單位it部門采用相關(guān)的方法、手段、技術(shù)、制度、流程和文檔等,對(duì)it如硬運(yùn)行環(huán)境(軟件環(huán)境、網(wǎng)絡(luò)環(huán)境等)、it業(yè)務(wù)系統(tǒng)和it運(yùn)維人員進(jìn)行的綜合管理。
傳統(tǒng)的it運(yùn)維仍然是等到故障出現(xiàn)后再由運(yùn)維人員采取相應(yīng)的補(bǔ)救措施。
這種被動(dòng)、孤立、半自動(dòng)式的it運(yùn)維管理模式經(jīng)常讓it部門疲憊不堪,主要表現(xiàn)在以下三個(gè)方面:(1)運(yùn)維人員被動(dòng)、效率低。在it運(yùn)維過程中,只有當(dāng)事件已經(jīng)發(fā)生并已造成業(yè)務(wù)影響時(shí)才能發(fā)現(xiàn)和著手處理,這種被動(dòng)“救火”不但使it運(yùn)維人員終日忙碌,也使it運(yùn)維本身質(zhì)量很難提高,導(dǎo)致it部門和業(yè)務(wù)部門對(duì)it運(yùn)維的服務(wù)滿意度都不高。(2)缺乏一套高效的it運(yùn)維機(jī)制。目前許多企業(yè)在it運(yùn)維管理過程中缺少自動(dòng)化的運(yùn)維管理模式,也沒有明確的角色定義和責(zé)任劃分,使到問題出現(xiàn)后很難快速、準(zhǔn)確地找到根本原因,無法及時(shí)地找到相應(yīng)的人員進(jìn)行修復(fù)和處理,或者是在問題找到后缺乏流程化的故障處理機(jī)制,而在處理問題時(shí)不但欠缺規(guī)范化的解決方案,也缺乏全面的跟蹤記錄。(3)缺乏高效的it運(yùn)維技術(shù)工具。隨著信息化建設(shè)的深入,企業(yè)it系統(tǒng)日趨復(fù)雜,林林總總的網(wǎng)絡(luò)設(shè)備、服務(wù)器、中間件、業(yè)務(wù)系統(tǒng)等讓it運(yùn)維人員難以從容應(yīng)對(duì),即使加班加點(diǎn)地維護(hù)、部署、管理也經(jīng)常會(huì)因設(shè)備出現(xiàn)故障而導(dǎo)致業(yè)務(wù)的中斷,嚴(yán)重影響企業(yè)的正常運(yùn)轉(zhuǎn)。出現(xiàn)這些問題部分原因是企業(yè)缺乏事件監(jiān)控和診斷工具等it運(yùn)維技術(shù)工具,因?yàn)樵跊]有高效的技術(shù)工具的支持下故障事件很難得到主動(dòng)、快速的處理。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種it信息機(jī)房智能運(yùn)維系統(tǒng)及方法,能夠?qū)崿F(xiàn)讓計(jì)算機(jī)軟件系統(tǒng)代替人工對(duì)it信息系統(tǒng)的軟件、設(shè)備、環(huán)境的運(yùn)行進(jìn)行連續(xù)監(jiān)控、定制分析、異常告警、信息發(fā)布、智能部署及修復(fù)等,大大提高了it運(yùn)維效率,減輕人員負(fù)擔(dān)。
本發(fā)明的技術(shù)方案如下:一種it信息機(jī)房智能運(yùn)維系統(tǒng),包括:
采集終端,包括傳感設(shè)備和軟件探針;所述傳感設(shè)備用于收集機(jī)房環(huán)境特征值和機(jī)房硬件設(shè)備信息,所述軟件探針用于收集設(shè)備操作系統(tǒng)運(yùn)行狀態(tài)信息及應(yīng)用軟件運(yùn)行狀態(tài)信息;
信息分析處理系統(tǒng),包括分析處理軟件和基礎(chǔ)數(shù)據(jù)庫;所述分析處理軟件用于將采集終端采集的數(shù)據(jù)存入基礎(chǔ)數(shù)據(jù)庫、對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行集中展現(xiàn)、對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行分類展現(xiàn)、對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行查詢分析和導(dǎo)出、高級(jí)部署以及問題處理,所述基礎(chǔ)數(shù)據(jù)庫用于存儲(chǔ)采集終端采集的數(shù)據(jù);
移動(dòng)客戶端,用于人工通過手機(jī)app進(jìn)行數(shù)據(jù)發(fā)布和查詢。
其中,所述傳感設(shè)備包括溫度傳感器、濕度傳感器、電壓互感器、電流互感器、光敏傳感器;
其中,所述機(jī)房環(huán)境特征值包括機(jī)房溫度、機(jī)房濕度、機(jī)房光照條件和機(jī)房電源總負(fù)載;所述機(jī)房硬件設(shè)備信息包括機(jī)柜溫度、機(jī)柜濕度、設(shè)備溫度、機(jī)柜電源負(fù)載、設(shè)備硬件部件狀態(tài)和設(shè)備報(bào)警狀態(tài);所述設(shè)備操作系統(tǒng)運(yùn)行狀態(tài)信息包括各部件邏輯使用負(fù)載、各種系統(tǒng)日志、系統(tǒng)基礎(chǔ)配置信息;所述應(yīng)用軟件運(yùn)行狀態(tài)信息包括應(yīng)用軟件基礎(chǔ)配置信息、各種運(yùn)行日志、應(yīng)用軟件使用的系統(tǒng)負(fù)載情況。
其中,所述分析處理軟件可以按照時(shí)間、設(shè)備分類、應(yīng)用分類等分類標(biāo)準(zhǔn)對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行分類展現(xiàn)。
其中,所述基礎(chǔ)數(shù)據(jù)庫存儲(chǔ)數(shù)據(jù)的方式為實(shí)時(shí)數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫相結(jié)合;所述基礎(chǔ)數(shù)據(jù)庫還具有歷史數(shù)據(jù)壓縮及備份功能。
本發(fā)明還提供一種it信息機(jī)房智能運(yùn)維方法,包含如下步驟:
步驟一、傳感設(shè)備采集機(jī)房環(huán)境特征值及機(jī)房設(shè)備硬件信息并將數(shù)據(jù)傳輸?shù)叫畔⒎治鎏幚硐到y(tǒng);軟件探針偵測(cè)設(shè)備操作系統(tǒng)運(yùn)行狀態(tài)信息及應(yīng)用軟件運(yùn)行狀態(tài)信息并將數(shù)據(jù)傳輸?shù)叫畔⒎治鎏幚硐到y(tǒng);
步驟二、信息分析處理系統(tǒng)中的分析處理軟件根據(jù)預(yù)設(shè)的運(yùn)行指標(biāo)及運(yùn)行告警條件對(duì)采集數(shù)據(jù)進(jìn)行分析比對(duì),并判定是否存在異?!绻淮嬖诋惓?,則執(zhí)行步驟三;如果存在異常,則執(zhí)行步驟四;
步驟三、分析處理軟件將采集數(shù)據(jù)存入基礎(chǔ)數(shù)據(jù)庫中,并對(duì)采集數(shù)據(jù)進(jìn)行集中或分類展現(xiàn);
步驟四、分析處理軟件分析各種修復(fù)條件,并判定異常狀態(tài)是否滿足修復(fù)條件;如果滿足,則執(zhí)行步驟五;如果不滿足,則執(zhí)行步驟六;
步驟五、分析處理軟件判斷是軟件故障還是硬件故障,如果是軟件故障,則控制計(jì)算機(jī)進(jìn)行系統(tǒng)問題修復(fù);如果是硬件故障,則執(zhí)行步驟六;
步驟六、分析處理軟件進(jìn)行信息發(fā)布和安裝部署,等待人工處理。
本發(fā)明的it信息機(jī)房智能運(yùn)維系統(tǒng)具有智能采集、智能存儲(chǔ)、智能分析比對(duì)、智能判定以及智能修復(fù)的功能,在不能自動(dòng)修復(fù)的極限情況下,本發(fā)明的it信息機(jī)房智能運(yùn)維系統(tǒng)還可以智能發(fā)布信息并進(jìn)行安裝部署,減輕人工處理的工作量,能夠大大提升it運(yùn)維效率,減輕人員負(fù)擔(dān),降低人工成本。
附圖說明
圖1是本發(fā)明的一個(gè)實(shí)施例的it信息機(jī)房智能運(yùn)維系統(tǒng)的模塊組成圖;
圖2是本發(fā)明的一個(gè)實(shí)施例的it信息機(jī)房智能運(yùn)維方法流程圖。
具體實(shí)施方式
下面將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述。
實(shí)施例1:
本實(shí)施例是依據(jù)本發(fā)明的技術(shù)方案的一種it信息機(jī)房智能運(yùn)維系統(tǒng),附圖1是本實(shí)施例智能運(yùn)維系統(tǒng)的模塊組成圖,由附圖可以看出,本實(shí)施例的一種it信息機(jī)房智能運(yùn)維系統(tǒng)包括:
采集終端1,包括傳感設(shè)備11和軟件探針12;所述傳感設(shè)備11用于收集機(jī)房環(huán)境特征值和機(jī)房硬件設(shè)備信息,所述軟件探針12用于收集設(shè)備操作系統(tǒng)運(yùn)行狀態(tài)信息及應(yīng)用軟件運(yùn)行狀態(tài)信息;
信息分析處理系統(tǒng)2,包括分析處理軟件21和基礎(chǔ)數(shù)據(jù)庫22;所述分析處理軟件21用于將采集終端1采集的數(shù)據(jù)存入基礎(chǔ)數(shù)據(jù)庫22、對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行集中展現(xiàn)、對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行分類展現(xiàn)、對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行查詢分析和導(dǎo)出、高級(jí)部署以及問題處理,所述基礎(chǔ)數(shù)據(jù)庫2用于存儲(chǔ)采集終端采集的數(shù)據(jù);
移動(dòng)客戶端3,用于人工通過手機(jī)app進(jìn)行數(shù)據(jù)發(fā)布和查詢。
其中,傳感設(shè)備11包括溫度傳感器、濕度傳感器、電壓互感器、電流互感器、光敏傳感器,用于探測(cè)溫度值、濕度值、電源負(fù)載等。本實(shí)施例中采用傳感設(shè)備能感受到被測(cè)量的信息并能將感受到的信息按一定規(guī)律變換成為電信號(hào),以滿足信息的傳輸、處理、存儲(chǔ)、顯示、記錄和控制等要求。
由于傳感器僅適用于有載體的信息源,對(duì)于軟件和操作系統(tǒng)的狀態(tài)信息則無法作用。本實(shí)施例中采用軟件探針12部署在相應(yīng)終端上,實(shí)現(xiàn)對(duì)操作系統(tǒng)和軟件操作狀態(tài)的監(jiān)控。
通過傳感設(shè)備和軟件探針,本實(shí)施例的智能運(yùn)維系統(tǒng)可實(shí)現(xiàn)對(duì)以下信息的監(jiān)測(cè):(1)機(jī)房環(huán)境特征值:包括機(jī)房溫度、機(jī)房濕度、機(jī)房光照條件和機(jī)房電源總負(fù)載等;(2)所述機(jī)房硬件設(shè)備信息:包括機(jī)柜溫度、機(jī)柜濕度、設(shè)備溫度、機(jī)柜電源負(fù)載、設(shè)備硬件部件狀態(tài)和設(shè)備報(bào)警狀態(tài)等;(3)所述設(shè)備操作系統(tǒng)運(yùn)行狀態(tài)信息:包括各部件邏輯使用負(fù)載、各種系統(tǒng)日志、系統(tǒng)基礎(chǔ)配置信息等;
(4)所述應(yīng)用軟件運(yùn)行狀態(tài)信息:包括應(yīng)用軟件基礎(chǔ)配置信息、各種運(yùn)行日志、應(yīng)用軟件使用的系統(tǒng)負(fù)載情況等。
本實(shí)施例中的分析處理軟件(21)主要負(fù)責(zé)將采集終端(1)采集的數(shù)據(jù)存入基礎(chǔ)數(shù)據(jù)庫(22)中;分析處理軟件(21)還會(huì)按照時(shí)間、設(shè)備分類、應(yīng)用分類等一系列條件對(duì)采集數(shù)據(jù)進(jìn)行集中或分類展現(xiàn);分析處理軟件(21)還可以實(shí)現(xiàn)人機(jī)交互,具有高級(jí)部署和問題處理功能;分析處理軟件(21)還可以提供條件查詢分析和數(shù)據(jù)導(dǎo)出功能,為信息運(yùn)維輔助分析、決策提供數(shù)據(jù)支撐。
本實(shí)施例中的基礎(chǔ)數(shù)據(jù)庫(22)存儲(chǔ)基礎(chǔ)信息數(shù)據(jù),由于基礎(chǔ)信息數(shù)據(jù)量非常大而且復(fù)雜,數(shù)據(jù)存儲(chǔ)采用實(shí)時(shí)數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫相結(jié)合的方式,保證數(shù)據(jù)存儲(chǔ)及高效查詢;此外,為保障無限增長(zhǎng)的數(shù)據(jù),基礎(chǔ)信息數(shù)據(jù)庫還具備歷史數(shù)據(jù)壓縮及備份功能。
本實(shí)施例中的移動(dòng)客戶端主要是應(yīng)用于信息運(yùn)維人員的移動(dòng)辦公,實(shí)現(xiàn)通過手機(jī)app進(jìn)行數(shù)據(jù)發(fā)布和查詢。
實(shí)施例2:
本實(shí)施例是本發(fā)明的一個(gè)實(shí)施例的it信息機(jī)房智能運(yùn)維方法的流程圖,附圖2是本實(shí)施例智能運(yùn)維方法的流程圖,由附圖可以看出,本實(shí)施例的一種it信息機(jī)房智能運(yùn)維方法包括如下步驟:
步驟一、傳感設(shè)備11采集機(jī)房環(huán)境特征值及機(jī)房設(shè)備硬件信息并將數(shù)據(jù)傳輸?shù)叫畔⒎治鎏幚硐到y(tǒng)2;軟件探針12偵測(cè)設(shè)備操作系統(tǒng)運(yùn)行狀態(tài)信息及應(yīng)用軟件運(yùn)行狀態(tài)信息并將數(shù)據(jù)傳輸?shù)叫畔⒎治鎏幚硐到y(tǒng)2;
步驟二、信息分析處理系統(tǒng)2中的分析處理軟件21根據(jù)預(yù)設(shè)的運(yùn)行指標(biāo)及運(yùn)行告警條件對(duì)采集數(shù)據(jù)進(jìn)行分析比對(duì),并判定是否存在異?!绻淮嬖诋惓?,則執(zhí)行步驟三;如果存在異常,則執(zhí)行步驟四;
步驟三、分析處理軟件21將采集數(shù)據(jù)存入基礎(chǔ)數(shù)據(jù)庫22中,并對(duì)采集數(shù)據(jù)進(jìn)行集中或分類展現(xiàn);
步驟四、分析處理軟件21分析各種修復(fù)條件,并判定異常狀態(tài)是否滿足修復(fù)條件;如果滿足,則執(zhí)行步驟五;如果不滿足,則執(zhí)行步驟六;
步驟五、分析處理軟件22判斷是軟件故障還是硬件故障,如果是軟件故障,則控制計(jì)算機(jī)進(jìn)行系統(tǒng)問題修復(fù);如果是硬件故障,則執(zhí)行步驟六;
步驟六、分析處理軟件22進(jìn)行信息發(fā)布和安裝部署,等待人工處理。
其中,步驟二中分析處理軟件21進(jìn)行數(shù)據(jù)分析比對(duì)時(shí)作為參考的預(yù)設(shè)運(yùn)行指標(biāo)及運(yùn)行告警條件是根據(jù)已有的運(yùn)維經(jīng)驗(yàn)將it信息系統(tǒng)運(yùn)維的日常工作進(jìn)行分類、梳理,將各種硬件、軟件的部署、優(yōu)化、故障判斷及處理、配置變更等利用命令、腳本、服務(wù)協(xié)議等計(jì)算機(jī)技術(shù)手段實(shí)現(xiàn),并明確各種問題判斷的方法及條件。
在進(jìn)行數(shù)據(jù)分析比對(duì)后,分析處理軟件21會(huì)按要求發(fā)布這些信息;對(duì)于常規(guī)的系統(tǒng)問題修復(fù)工作,分析處理軟件21可以自動(dòng)分析各種修復(fù)條件,當(dāng)滿足修復(fù)條件時(shí),分析處理軟件21將自動(dòng)控制計(jì)算機(jī)進(jìn)行系統(tǒng)問題修復(fù);當(dāng)然分析處理軟件21也可以通過各種定制化的條件組合分析,對(duì)設(shè)備和軟件系統(tǒng)的運(yùn)行狀態(tài)進(jìn)行發(fā)布、安裝部署和人工交互處理等。需要注意的是,分析處理軟件21對(duì)軟件類故障的處理修復(fù)能力較強(qiáng),對(duì)于硬件類故障則可能要依賴于人工處理。
步驟六中分析處理軟件22進(jìn)行信息發(fā)布包括推送待修復(fù)問題到移動(dòng)客戶端,此時(shí)運(yùn)維人員通過手機(jī)app獲取相關(guān)信息后可以及時(shí)解決問題;在等待問題解決的時(shí)段內(nèi),分析處理軟件22自動(dòng)進(jìn)行一些安裝部署,如停止程序、自動(dòng)調(diào)試、生成錯(cuò)誤日志等操作,為人工處理提供參考依據(jù)。
以上實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。同時(shí),以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想,對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。