一種網站系統(tǒng)的故障預警方法和裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及互聯網云監(jiān)控領域,具體涉及一種網站系統(tǒng)的故障預警方法和裝置。
【背景技術】
[0002]隨著互聯網技術的不斷發(fā)展,網絡與人們的工作、生活和娛樂的關系日益密切,人們對網絡的依賴程度日益上升,網站系統(tǒng)發(fā)生故障,將會給人們帶來極大的不便。
[0003]然而在現有技術中,網站系統(tǒng)的管理者在運營維護的過程中,往往無法及時有效地獲知關于該網站系統(tǒng)可能發(fā)生某種故障的預警信息,進而無法提前指定相應的故障解決應對策略,只能在網站系統(tǒng)確實發(fā)生故障時才開始進行故障解決,時間長、效率低,不可避免地對管理者和使用者均造成一定的損失和影響,不符合用戶需求。
【發(fā)明內容】
[0004]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種網站系統(tǒng)的故障預警方法和裝置。
[0005]依據本發(fā)明的一個方面,提供了一種網站系統(tǒng)的故障預警方法,該方法包括:
[0006]對網站系統(tǒng)進行實時監(jiān)控,獲得監(jiān)控數據并保存到監(jiān)控數據庫中;
[0007]對監(jiān)控數據庫中的監(jiān)控數據進行分析,根據所述網站系統(tǒng)發(fā)生指定故障時的監(jiān)控數據以及發(fā)生指定故障前的第一預設長度時間段內的監(jiān)控數據,建立指定故障的預判模型;
[0008]根據所述指定故障的預判模型以及實時監(jiān)控得到的監(jiān)控數據,對所述網站系統(tǒng)的同類故障進行預警。
[0009]可選地,所述根據所述指定故障的預判模型以及實時監(jiān)控得到的監(jiān)控數據,對所述網站系統(tǒng)的同類故障進行預警包括:
[0010]將實時監(jiān)控得到的監(jiān)控數據與所述指定故障的預判模型進行對比,如果在第二預設時間長度內實時監(jiān)控得到的監(jiān)控數據與所述指定故障的預判模型的匹配度達到預設條件,則確定所述網站系統(tǒng)將要發(fā)生所述指定故障,發(fā)送預警信號。
[0011]可選地,根據所述網站系統(tǒng)發(fā)生指定故障時的監(jiān)控數據以及發(fā)生指定故障前的第一預設長度時間段內的監(jiān)控數據,建立指定故障的預判模型包括:
[0012]根據所述網站系統(tǒng)發(fā)生的多次指定故障時的監(jiān)控數據,以及每次發(fā)生指定故障前的第一預設長度時間段內的監(jiān)控數據,建立指定故障的預判模型。
[0013]可選地,所述對網站系統(tǒng)進行實時監(jiān)控,獲得監(jiān)控數據并保存到監(jiān)控數據庫中包括:
[0014]對所述網站系統(tǒng)的Web服務性能監(jiān)控,獲得網站系統(tǒng)的Web服務性能監(jiān)控數據;
[0015]和/ 或,
[0016]對所述網站系統(tǒng)的服務器資源進行監(jiān)控,獲取網站系統(tǒng)的服務器資源的監(jiān)控數據。
[0017]可選地,所述服務器資源包括如下中的一種或多種:CPU、硬盤、內存、網卡。
[0018]可選地,所述對所述網站系統(tǒng)的Web服務性能監(jiān)控,獲得網站系統(tǒng)的Web服務性能監(jiān)控數據包括:模擬用戶行為向所述網站系統(tǒng)發(fā)起訪問請求,根據訪問結果數據獲得網站系統(tǒng)的Web服務性能監(jiān)控數據;
[0019]所述對所述網站系統(tǒng)的服務器資源進行監(jiān)控,獲取網站系統(tǒng)的服務器資源的監(jiān)控數據包括:對互聯網數據中心IDC機房中的所述網站系統(tǒng)的服務器資源進行監(jiān)控,獲取網站系統(tǒng)的服務器資源的監(jiān)控數據。
[0020]可選地,所述模擬用戶行為向所述網站系統(tǒng)發(fā)起訪問請求,根據訪問結果數據獲得網站系統(tǒng)的Web服務性能監(jiān)控數據包括:
[0021]從分布在不同地理位置的多個監(jiān)控節(jié)點中選擇指定個數的客戶端作為監(jiān)控機;
[0022]向各監(jiān)控機下發(fā)訪問所述網站系統(tǒng)的任務,并接收各監(jiān)控機返回的訪問結果數據;
[0023]根據各監(jiān)控機返回的訪問結果數據分析得到所述網站系統(tǒng)的Web服務性能監(jiān)控數據。
[0024]依據本發(fā)明的另一個方面,提供了一種網站系統(tǒng)的故障預警裝置,該裝置包括:
[0025]監(jiān)控單元,適于對網站系統(tǒng)進行實時監(jiān)控,獲得監(jiān)控數據并保存到監(jiān)控數據庫中;
[0026]存儲單元,適于存儲監(jiān)控數據庫;
[0027]模型分析單元,適于對監(jiān)控數據庫中的監(jiān)控數據進行分析,根據所述網站系統(tǒng)發(fā)生指定故障時的監(jiān)控數據以及發(fā)生指定故障前的第一預設長度時間段內的監(jiān)控數據,建立指定故障的預判模型;
[0028]故障預警單元,根據所述指定故障的預判模型以及實時監(jiān)控得到的監(jiān)控數據,對所述網站系統(tǒng)的同類故障進行預警。
[0029]可選地,所述故障預警單元,適于將實時監(jiān)控得到的監(jiān)控數據與所述指定故障的預判模型進行對比,如果在第二預設時間長度內實時監(jiān)控得到的監(jiān)控數據與所述指定故障的預判模型的匹配度達到預設條件,則確定所述網站系統(tǒng)將要發(fā)生所述指定故障,發(fā)送預警信號。
[0030]可選地,所述模型分析單元,適于根據所述網站系統(tǒng)發(fā)生的多次指定故障時的監(jiān)控數據,以及每次發(fā)生指定故障前的第一預設長度時間段內的監(jiān)控數據,建立指定故障的預判模型。
[0031]可選地,所述監(jiān)控單元,適于對所述網站系統(tǒng)的Web服務性能監(jiān)控,獲得網站系統(tǒng)的Web服務性能監(jiān)控數據;和/或,適于對所述網站系統(tǒng)的服務器資源進行監(jiān)控,獲取網站系統(tǒng)的服務器資源的監(jiān)控數據。
[0032]可選地,所述監(jiān)控單元監(jiān)控的所述服務器資源包括如下中的一種或多種:CPU、硬盤、內存、網卡。
[0033]可選地,所述監(jiān)控單元,適于通過模擬用戶行為向所述網站系統(tǒng)發(fā)起訪問請求,根據訪問結果數據獲得網站系統(tǒng)的Web服務性能監(jiān)控數據;和/或,適于對互聯網數據中心IDC機房中的所述網站系統(tǒng)的服務器資源進行監(jiān)控,獲取網站系統(tǒng)的服務器資源的監(jiān)控數據。
[0034]可選地,所述監(jiān)控單元,適于從分布在不同地理位置的多個監(jiān)控節(jié)點中選擇指定個數的客戶端作為監(jiān)控機,向各監(jiān)控機下發(fā)訪問所述網站系統(tǒng)的任務,并接收各監(jiān)控機返回的訪問結果數據,根據各監(jiān)控機返回的訪問結果數據分析得到所述網站系統(tǒng)的Web服務性能監(jiān)控數據。
[0035]由上述可知,本發(fā)明提供的技術方案通過對網站系統(tǒng)的實時監(jiān)控,在監(jiān)控數據庫中保存了詳盡的監(jiān)控數據;在指定故障發(fā)生時,基于在發(fā)生指定故障前的一段時間內的監(jiān)控數據進行指定故障的關聯回溯,能夠重現指定故障從未發(fā)生到發(fā)生的整個過程鏈,即建立起指定故障的預判模型;以該指定故障的預判模型為參照,在對網站系統(tǒng)進行監(jiān)控的過程中,當網站系統(tǒng)的監(jiān)控數據的變化符合指定故障的預判模型時,則可以預判按照當前狀態(tài)發(fā)展下去網站系統(tǒng)將發(fā)生指定故障,即對網站系統(tǒng)的同類故障進行預警。本方案通過對指定故障發(fā)生的回溯,獲知指定故障發(fā)生前的監(jiān)控數據的變化規(guī)律,將當前的監(jiān)控數據的變化規(guī)律與指定故障發(fā)生前的監(jiān)控數據的變化規(guī)律進行對比,進而能夠對網站系統(tǒng)發(fā)生指定故障進行預判,對用戶進行預警,使得用戶能夠及時制定故障應對決策,減少故障對網站系統(tǒng)的管理者和使用者造成的損失和影響,符合用戶需求。
[0036]上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【附圖說明】
[0037]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0038]圖1A示出了根據本發(fā)明一個實施例的公有云監(jiān)控部署的示意圖;
[0039]圖1B示出了根據本發(fā)明一個實施例的私有云監(jiān)控部署的示意圖;
[0040]圖1C示出了根據本發(fā)明一個實施例的混合云監(jiān)控部署的示意圖;
[0041]圖2示出了根據本發(fā)明一個實施例的一種網站系統(tǒng)的故障預警方法的流程圖;
[0042]圖3示出了根據本發(fā)明一個實施例的一種網站系統(tǒng)的故障預警裝置的示意圖。
【具體實施方式】
[0043]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
[0044]隨著互聯網的不斷發(fā)展,互聯網數據中心(IDC, Internet Data Center)應運而生,成為新世紀互聯網產業(yè)中不可或缺的重要一環(huán)。IDC為互聯網內容供應商、企業(yè)、媒體和