欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

識別服務器系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)的制作方法

文檔序號:7981774閱讀:228來源:國知局
識別服務器系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)的制作方法
【專利摘要】本發(fā)明的實施方式涉及用于識別服務器系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)。具體地,提供一種用于識別服務器系統(tǒng)中的熱點和可能故障的方法。該方法包括:收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據;基于所收集的運行負載數據計算運行負載數據的分布;根據所計算的分布建立識別模式;以及使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。利用本發(fā)明的實施方式,可以更為有效地識別服務器系統(tǒng)中的熱點和可能故障。
【專利說明】識別服務器系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)
【技術領域】
[0001]本發(fā)明的實施方式總體上涉及網絡信息【技術領域】,更具體地,涉及以動態(tài)模式方式識別系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)。
【背景技術】
[0002]在信息【技術領域】,特別是隨著網絡技術的發(fā)展,越來越多的計算設備以服務器的形式出現,這些服務器通過其上運行的應用來為其他設備(稱為客戶端設備)提供相應的服務和/或數據。作為示例,常見的服務器包括但不限于:游戲服務器、電子郵件(email)服務器、消息收發(fā)服務器、文件服務器、應用服務器、數據庫服務器,等等。應當理解,在此使用的術語“服務器”意在表示能夠通過網絡向其他設備提供數據、信息、服務等的任何適當的計算設備,包括但不限于:主機計算機、個人計算機、膝上型計算機、移動計算設備、個人數字助理(PDA),等等。而且,還應理解,在此提及的“服務器”和“客戶端”是相對的。特定的計算設備可能在某些情況下充當服務器,而在另一些情況下充當客戶端。而且,計算設備同時充當服務器和客戶端也是可能的。
[0003]在實際應用中,為了改善單個服務器的性能,通常將集群技術用于服務器中。因此,在某些情況下,往往將多個服務器組織起來進行協(xié)同工作,以模擬功能更強大解決問題的單個服務器。這種技術成為集群技術。將該集群(即計算機系統(tǒng))中的每個計算機稱為節(jié)點。這樣,多個服務器以群集的方式組合成服務器集群(即服務器系統(tǒng)),并且相互協(xié)作以完成具體服務器的功能。例如,5個服務器以集群方式組合成服務器系統(tǒng),以實現游戲服務器的功能。在實際應用中,可能存在如下情況,即服務器系統(tǒng)中的僅某一節(jié)點很繁忙,而其他節(jié)點不繁忙。則這一繁忙的節(jié)點可能為系統(tǒng)中的熱點或者可能出現了故障。因此,識別該服務器系統(tǒng)中的熱點和可能故障對于維持正常的網絡服務和通信而言至關重要。
[0004]在現有技術中,監(jiān)控設備使用固定的規(guī)則來識別系統(tǒng)中的熱點和可能故障。例如,通過設置服務閾值,并且監(jiān)控系統(tǒng)中的每個節(jié)點的負載(諸如CPU利用率、硬盤占用率、響應時間(即探測請求)等)是否超過該服務閾值,以判斷在該節(jié)點的服務是否緊張、繁忙、是否需要擴展,即該節(jié)點是否為系統(tǒng)中的熱點和可能故障。如果某一節(jié)點的負載超過閾值,則發(fā)出警示。例如,如果持續(xù)一段時間某一節(jié)點的CPU利用率超過90 %、硬盤占用率超過80%或者響應時間超過300ms,則可以確定該節(jié)點的服務較繁忙,其可能為系統(tǒng)中的熱點或者可能故障。然后可以通過增加節(jié)點(即服務器)來擴展該系統(tǒng),或者在節(jié)點之間重新分配負載以使負載平衡來緩解服務繁忙狀況,確保服務器系統(tǒng)的正常運行。
[0005]然而,現有技術的此類方案存在明顯的缺陷。通過此類方案,只能確定節(jié)點的當前負載高于固定的閾值。但是,節(jié)點的當前負載超過閾值并不一定表明該節(jié)點為系統(tǒng)中的熱點,也不能表明該服務器發(fā)生了故障。例如,節(jié)點的負載狀況可能跟時間有關,例如在白天(例如,下午6-7點),系統(tǒng)中的節(jié)點由于大量的業(yè)務量都處于很繁忙的狀態(tài)。因此,某一節(jié)點的負載超過閾值并不表明該節(jié)點為系統(tǒng)中的熱點或者該節(jié)點處于故障狀態(tài)。此外,在晚上,負載本該很低,但是某節(jié)點的負載明顯高于其他節(jié)點的負載(但是可能還未超過所設置的閾值),則該節(jié)點可能已經出現故障。如果這種情況得不到及時有效地處理,則可能在某一時間,由于總體業(yè)務量較大,系統(tǒng)中的服務很繁忙,系統(tǒng)將在節(jié)點未出現故障的情況下不斷發(fā)出警示。因此,服務器系統(tǒng)維護人員將需要查看服務器系統(tǒng)的運行日志來評估可能的熱點或者故障,并采取相應的措施。這不利于快速、及時地識別系統(tǒng)中的熱點和可能故障,并且將耗費可觀的人力和物力成本。而在系統(tǒng)處于不繁忙狀態(tài)時,某一節(jié)點的負載明顯高于其他節(jié)點的負載(但是可能還未超過閾值),則也不能有效地將該節(jié)點識別為可能的熱點和故障。此外,在某些情況下,系統(tǒng)中的服務器數目固定。因此,在多個服務器都繁忙的情況下,不可能通過增加節(jié)點數目而擴展服務器系統(tǒng)或者通過在節(jié)點之間重新分配負載來使負載均衡。因此,在這種情況下的警示是不必要的。
[0006]由此,本領域中需要一種動態(tài)的、更為有效、快速和準確的方式來識別系統(tǒng)中的熱點和可能故障的方法和設備。

【發(fā)明內容】

[0007]為了克服現有技術中的上述缺陷,本發(fā)明的實施方式提供用于識別服務器系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)。
[0008]在本發(fā)明的一個方面,提供一種用于識別服務器系統(tǒng)中的熱點和可能故障的方法。該方法包括:收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據;基于所收集的運行負載數據計算運行負載數據的分布;根據所計算的分布建立識別模式;以及使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
[0009]根據本發(fā)明的某些實施方式,該方法還包括針對不符合模式的節(jié)點發(fā)出警示。根據本發(fā)明的某些實施方式,其中通過分布式信息收集系統(tǒng)收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據。根據本發(fā)明的某些實施方式,其中基于所收集的運行負載數據計算所述運行負載數據的分布包括計算所述運行負載數據的平均值。根據本發(fā)明的某些實施方式,其中基于所收集的運行負載數據計算所述運行負載數據的分布包括計算所述運行負載數據的方差。根據本發(fā)明的某些實施方式,其中根據所計算的分布建立識別模式包括建立每個節(jié)點的運行負載關于時間的模式。根據本發(fā)明的某些實施方式,其中根據所計算的分布建立識別模式包括建立所述服務器系統(tǒng)中的所有節(jié)點的平均運行負載關于時間的模式。根據本發(fā)明的某些實施方式,其中使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障包括將當前負載值超過所述模式的對應點處的值一定百分比的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。在該實施方式中,該一定百分比為20%或者30%。根據本發(fā)明的某些實施方式,其中使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障包括將當前負載曲線在當前點處的導數超過所述模式的對應點處的導數一定百分比的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。在該實施方式中,該一定百分比為20%或者30%。根據本發(fā)明的某些實施方式,其中服務器系統(tǒng)包括以下的一個或多個:游戲服務器、電子郵件服務器、消息收發(fā)服務器、文件服務器、應用服務器、數據庫服務器。
[0010]在本發(fā)明的另一方面,提供一種用于識別服務器系統(tǒng)中的熱點和可能故障的設備,所述設備包括:收集裝置,配置用于收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據;分布計算裝置,配置用于基于所收集的運行負載數據計算運行負載數據的分布;模式建立裝置,配置用于根據所計算的分布建立識別模式;以及識別裝置,配置用于使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
[0011]在本發(fā)明的又一方面,提供一種系統(tǒng)。該系統(tǒng),包括:服務器系統(tǒng),其包括多個節(jié)點;存儲庫,其耦合至所述服務器系統(tǒng),配置為用于存儲從所述服務器系統(tǒng)的每個節(jié)點收集的運行負載數據;以及監(jiān)控設備,其耦合至所述存儲庫,配置為用于識別所述識別服務器系統(tǒng)中的熱點和可能故障,其中所述監(jiān)控設備包括如上文所述的設備。
[0012]通過上述實施方式,可以以動態(tài)的、更為有效、快速和準確的方式來識別系統(tǒng)中的熱點和可能故障。
【專利附圖】

【附圖說明】
[0013]通過參考附圖閱讀下文的詳細描述,本發(fā)明實施方式的上述以及其他目的、特征和優(yōu)點將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若干實施方式,其中:
[0014]圖1示出了根據本發(fā)明的實施方式可在其中實現的網絡環(huán)境100的示意圖;
[0015]圖2示出了根據本發(fā)明的實施方式用于識別系統(tǒng)中的熱點和可能故障的方法200的流程圖;
[0016]圖3示出了根據本發(fā)明的實施方式用于識別系統(tǒng)中的熱點和可能故障的設備301的框圖;以及
[0017]圖4示出了適合用來實踐本發(fā)明實施方式的計算機系統(tǒng)400的框圖。
[0018]在附圖中,相同或對應的標號表不相同或對應的部分。
【具體實施方式】
[0019]下面將參考若干示例性實施方式來描述本發(fā)明的原理和精神。應當理解,給出這些實施方式僅僅是為了使本領域技術人員能夠更好地理解進而實現本發(fā)明,而并非以任何方式限制本發(fā)明的范圍。
[0020]總體上,本發(fā)明的實施方式涉及用于識別服務器系統(tǒng)中的熱點和可能故障的方法、設備和系統(tǒng)。通過下文詳細描述將會理解,可以通過收集服務器系統(tǒng)的每個節(jié)點處的運行負載數據;基于所收集的運行負載數據計算運行負載數據的分布;根據所計算的分布建立識別模式;以及使用所建立的識別模式來將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。以此方式,可以改進識別服務器系統(tǒng)中的熱點和可能故障的機制。下面將詳細描述本發(fā)明的各種實施方式。
[0021]首先參考圖1,其示出了根據本發(fā)明的實施方式可在其中實現的網絡環(huán)境100的示意圖。如圖所示,根據本發(fā)明的實施方式,網絡環(huán)境100可以包括:監(jiān)控設備101,服務器系統(tǒng)102,以及存儲庫103。
[0022]根據本發(fā)明的實施方式,監(jiān)控設備101可配置為用于識別服務器系統(tǒng)102中的熱點和可能故障,其可以與服務器系統(tǒng)102和/或存儲庫103通信。關于監(jiān)控設備101的詳細描述將在下文給出。
[0023]服務器系統(tǒng)102是通過網絡向被稱作客戶端的其他設備(圖1中未示出)提供服務的多個服務器(102-1、102-2到102-N)的集群。服務器系統(tǒng)102可以包括目前已知或者將來開發(fā)的任何類型的網絡服務器,包括但不限于:游戲服務器、電子郵件(email)服務器、消息收發(fā)服務器、文件服務器、應用服務器、數據庫服務器,等等。此外,服務器102-1、102-2到102-N可以通過任何適當的設備來實現,包括但不限于:主機計算機、個人計算機、膝上型計算機、移動計算設備、個人數字助理(PDA),等等。應當理解,上文列舉的示例僅僅出于說明而非限制的目的,本發(fā)明的范圍在此方面不受限制。在本發(fā)明中,多個服務器(102-1、102-2到102-N)以群集的方式組合成服務器系統(tǒng)102,以共同為客戶端提供各種功能,諸如游戲、電子郵件、消息收發(fā)、文件、應用、數據庫,等等。
[0024]服務器系統(tǒng)102上可以運行有至少一個應用。取決于服務器系統(tǒng)102的所提供的功能和服務,這些應用可以是任何適當類型的應用。當這些應用在服務器系統(tǒng)102上運行時,其實現服務器系統(tǒng)102所要提供的部分或者全部功能。
[0025]在服務器系統(tǒng)102的運行期間,通過分布式系統(tǒng)(未示出)收集每個服務器即節(jié)點(102-1、102-2到102-N)處的運行負載數據。在現有技術中,所收集的運行負載數據被存儲在服務器系統(tǒng)102本地的系統(tǒng)運行日志(未示出)中。
[0026]根據本發(fā)明的實施方式,除了將應用產生的運行負載數據存儲于系統(tǒng)運行日志,或者作為替代,這些運行負載數據還可以被保存于存儲庫103。存儲庫103可以是用于存儲信息的任何適當介質,并且其可以通過任何適當的數據結構來保存信息,包括但不限于:列表、隊列、棧、堆、數據庫的表、文件,等等。根據本發(fā)明的實施方式103,存儲庫103可與監(jiān)控設備101和/或服務器系統(tǒng)102通信,并且是這二者可訪問的。
[0027]應當注意,盡管在圖2中將監(jiān)控設備101、服務器系統(tǒng)102以及存儲庫103示為獨立的設備,但這僅僅是為了說明目的而進行的邏輯劃分。在實踐中,設備101-103可以根據需要具有不同的實現方式。例如,盡管在圖2中存儲庫103處于監(jiān)控設備101和服務器系統(tǒng)102 二者的外部,但是在備選實施方式中,存儲庫103可以包含在監(jiān)控設備101和服務器系統(tǒng)102之一中。實際上,在某些實施方式中,監(jiān)控設備101本身也可以與服務器系統(tǒng)102定位在同一物理計算設備上,這將在下文詳述。
[0028]在監(jiān)控設備101、服務器系統(tǒng)102和/或存儲庫103彼此獨立的實施方式中,它們之間的通信可以通過網絡來實現。網絡可以包括有線網絡、無線網絡或其組合,包括但不限于:蜂窩電話網絡,以太網,基于IEEE802.11,802.16,802.20等的無線局域網(WLAN),和/或全球微波接入互操作性(WiMAX)網絡。此外,網絡可以是公共網絡(諸如,因特網)、專用網絡(諸如,企業(yè)內部網)或其組合。在分層式網絡通信架構下,網絡的傳輸層可以按照傳輸控制協(xié)議(TCP)、實時傳輸協(xié)議(RTP)或其他傳輸邏輯進行操作。網絡層可以基于網際協(xié)議v4、v6(即,IPv4或IPv6)或其他網絡層協(xié)議來路由信息。數據鏈路層可以包括有線或無線鏈路,如異步傳輸模式(ATM)、光纖分布式數據接口(FDDI)、光纖、同軸電纜、雙絞線或其他物理層上的其他數據鏈路層。
[0029]本領域技術人員將會理解,圖1中僅僅示出了網絡環(huán)境中與本發(fā)明的主題有關的設備和元件。網絡環(huán)境還可以包括諸如接入點、路由器、防火墻等各種網元。
[0030]下面將參考圖2詳細描述根據本發(fā)明實施方式的用于識別服務器系統(tǒng)中的熱點和可能故障的方法200的流程圖。出于說明目的,下文將主要結合圖1中示出的環(huán)境100來描述方法200的實施方式。特別地,根據本發(fā)明的實施方式,方法200例如可以由參考圖1描述的網絡環(huán)境100中的監(jiān)控設備101來實現。然而,應當理解,方法200也可以在其他環(huán)境中和/或由其他設備來實現。
[0031]方法200開始之后,在步驟S202,動態(tài)地收集服務器系統(tǒng)中的在每個節(jié)點處的運行負載數據。
[0032]根據本發(fā)明的實施方式,這些運行負載數據除了被寫入服務器系統(tǒng)102的本地系統(tǒng)運行日志之外,還可以被保存在特定的存儲庫(例如,圖1中的存儲庫103)。根據本發(fā)明的實施方式,來自服務器系統(tǒng)102的運行負載數據例如可以被保存在存儲庫103處的消息隊列(MQ)中。注意,這僅僅是示例性的,本發(fā)明的實施方式在此不受限制。
[0033]在運行負載數據被保存在存儲庫103中的情況下,在步驟S202中,這些運行負載數據例如可由負責識別服務器系統(tǒng)102中的熱點和可能故障的監(jiān)控設備(例如,圖1中的監(jiān)控設備101)從其收集。根據本發(fā)明的實施方式,監(jiān)控設備101可以通過各種模式從存儲庫103收集這些運行負載數據。例如,從監(jiān)控設備101的角度考慮,運行負載數據可以按照推送(push)模式被收集。在這種實施方式中,運行負載數據由存儲庫103主動向監(jiān)控設備101發(fā)送。又如,根據本發(fā)明的另一些實施方式,運行負載數據可以按照拉取(pull)模式被收集。換言之,在這種實施方式中,監(jiān)控設備101主動地訪問存儲庫103以獲取其中保存的運行負載數據。
[0034]應當注意,不論是按照推送還是拉取模式來收集運行負載數據,步驟S202中的收集可以被周期性地執(zhí)行。具體而言,在推送模式下,存儲庫103可以按照預定的時間間隔向監(jiān)控設備101發(fā)送運行負載數據。類似地,在拉取模式下,監(jiān)控設備101可以按照預定的時間間隔訪問存儲庫103并且取回運行負載數據。可以理解,從監(jiān)控設備101的角度考慮,定期拉取存儲庫103中保存的運行負載數據可被理解為一種輪詢。
[0035]如上文所述,為了收集運行負載數據,監(jiān)控設備101需要與存儲庫103進行通信。然而應當注意,如上文所述,存儲庫103可以位于服務器系統(tǒng)102外部,也可以與服務器系統(tǒng)102處于同一物理機器上。在后一種情況下,監(jiān)控設備101可以通過直接與服務器系統(tǒng)102通信來收集運行負載數據。甚至在某些情況下,監(jiān)控設備101本身也可以與服務器系統(tǒng)102位于相同的物理機器上。此時,二者之間的通信例如可以是模塊間或進程間通信。本發(fā)明的范圍在此方面不受限制。
[0036]此外,應當理解,上文描述的僅僅是收集運行負載數據的幾個示例性實施方式?;谠诖私o出的教導和啟示,本領域的技術人員可以想到任何適當的技術手段來實現步驟S202處的收集。
[0037]接下來,方法200進行到步驟S204,在此基于收集的運行負載數據計算運行負載數據的分布。根據本發(fā)明的實施方式,可以計算服務器系統(tǒng)102的運行負載數據的平均值、最大值、中位數或者方差。例如,可以計算每個節(jié)點的運行負載數據的平均值。例如,通過在步驟S202中收集的數據,計算節(jié)點102在早上8點的運行負載數據的平均值、最大值、中位數、方差等?;蛘呖梢愿鶕诓襟ES202中收集的數據,計算服務器系統(tǒng)102在某一時間(例如早上8點)在所有節(jié)點的運行負載數據的最大值、平均值、中位數以及方差等。注意,這僅僅示例性的,本領域技術人員可以根據具體情況為服務器系統(tǒng)102計算運行負載數據的分布的其他參數。
[0038]接著,根據本發(fā)明的某些實施方式,在步驟S206處,可以根據所計算的分布建立識別模式。例如,可以基于步驟S204中計算的分布來建立識別模式。例如,可以根據在步驟S204中的平均值,建立在近一個月以來,服務器系統(tǒng)102在所有節(jié)點處運行負載數據的平均值或者其每個節(jié)點處的運行負載數據的平均值相對于一天中的時間的模式,即負載曲線。注意,這僅僅示例性的,本領域技術人員可以根據具體情況,根據服務器系統(tǒng)102或者其每個節(jié)點建立其近某一時間維度(例如,一個月、兩個月、一個季度)以來的運行負載數據的最大值、中位數、方差等來建立識別模式。
[0039]然后,在步驟208處,使用所建立的識別模式將不符合所述模式的節(jié)點識別為服務器系統(tǒng)102中的熱點和可能故障。例如,如果服務器102-1的當前負載值超過負載曲線的對應點處的值20%,則將服務器102-1識別為服務器系統(tǒng)102中的熱點和可能故障?;蛘?,例如如果服務器102-3的負載曲線在當前點處的導數超過所建立的負載曲線在對應點處的導數20%或者30%,則將服務器102-3識別為服務器系統(tǒng)102中的熱點和可能故障。該負載曲線可能是(I)該節(jié)點關于時間的負載曲線,或者(2)該服務器系統(tǒng)102的所有節(jié)點關于時間的平均負載曲線。其中,在負載曲線是⑴的情況下,表明該服務器比它自身在過去的相同時間段忙很多,因此,該服務器可能為系統(tǒng)中的熱點或者已經出現了故障。而在負載曲線是(2)的情況下,表明該服務器比系統(tǒng)中的其他服務器忙很多,因此,該服務器可能為系統(tǒng)中的熱點或者已經出現了故障。應當理解,這些具體數字20%或者30%僅僅是示例性的,本發(fā)明的范圍在此方面不受限制。
[0040]備選地或附加地,在步驟S210處,還可以基于在步驟S208中識別的節(jié)點,針對該節(jié)點發(fā)出警示。
[0041]現在參考圖3,其示出了根據本發(fā)明的實施方式用于識別服務器系統(tǒng)中的熱點和可能故障的設備301的框圖。根據本發(fā)明的實施方式,設備301可以對應于上文參考圖1描述的監(jiān)控設備101,或者作為部分被包括在監(jiān)控設備101中。
[0042]如圖3所示,設備301可以包括收集裝置302、分布計算裝置304、模式建立裝置306以及識別裝置308。收集裝置302可配置用于從該服務器系統(tǒng)收集運行負載數據。分布計算裝置304可配置為用于基于所收集的運行負載數據計算運行負載數據的分布。
[0043]根據本發(fā)明的某些實施方式,運行負載數據被所述服務器存儲在存儲庫中,并且收集裝置302可配置為用于從該存儲庫收集運行負載數據。備選地或附加地,收集裝置302可配置為用于以推送或者拉取模式從該服務器收集該運行負載數據。此外,收集裝置302可配置為用于定期收集該運行負載數據。
[0044]根據本發(fā)明的某些實施方式,模式建立裝置306可配置用于根據所計算的分布建立識別模式。
[0045]在這種實施方式中,設備301還可以包括識別裝置308,其可配置用于使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
[0046]此外,設備300還可以包括警示裝置。例如,警示裝置310可配置為用于通過以下一個或多個來發(fā)送該警示消息:電子郵件,短消息服務SMS消息,以及多媒體消息MMS。
[0047]為清晰起見,在圖3中并未示出各個裝置所包含的子裝置。然而,應當理解,設備301中記載的裝置302-308及其子裝置分別與參考圖2描述的方法200中的步驟相對應。由此,上文針對圖2中的方法200描述的操作和特征同樣適用于設備301及其中包含的裝置和子裝置,在此不再贅述。
[0048]還應當理解,設備301可以利用各種方式來實現。例如,在某些實施方式中,設備301可以利用軟件和/或固件模塊來實現。此外,設備301也可以利用硬件模塊來實現。例如,設備301可以實現為集成電路(IC)芯片或專用集成電路(ASIC)。設備301也可以實現為片上系統(tǒng)(SOC)?,F在已知或者將來開發(fā)的其他方式也是可行的,本發(fā)明的范圍在此方面不受限制。
[0049]圖4示出了適于用來實踐本發(fā)明實施方式的計算機系統(tǒng)的示意性框圖。圖4示出了適于用來實踐本發(fā)明實施方式的計算機系統(tǒng)的示意性框圖。如圖4所示,計算機系統(tǒng)可以包括:CPU(中央處理單元)401、RAM(隨機存取存儲器)402、R0M(只讀存儲器)403、系統(tǒng)總線404、硬盤控制器405、鍵盤控制器406、串行接口控制器407、并行接口控制器408、顯示控制器409、硬盤410、鍵盤411、串行外部設備412、并行外部設備413和顯示器414。在這些設備中,與系統(tǒng)總線404耦合的有CPU401、RAM402、R0M403、硬盤控制器405、鍵盤控制器406、串行控制器407、并行控制器408和顯示控制器409。硬盤410與硬盤控制器405耦合,鍵盤411與鍵盤控制器406耦合,串行外部設備412與串行接口控制器407耦合,并行外部設備413與并行接口控制器408耦合,以及顯示器414與顯示控制器409耦合。應當理解,圖4所述的結構框圖僅僅為了示例的目的而示出的,而不是對本發(fā)明范圍的限制。在某些情況下,可以根據具體情況而增加或者減少某些設備。
[0050]應當理解,圖4所述的結構框圖僅僅為了示例的目的而示出的,而不是對本發(fā)明范圍的限制。在某些情況下,可以根據具體情況而增加或者減少某些設備。
[0051]特別地,除硬件實施方式之外,本發(fā)明的實施方式可以通過計算機程序產品的形式實現。例如,參考圖2描述的方法200可以通過計算機程序產品來實現。該計算機程序產品可以存儲在例如圖4所示的RAM404、R0M404、硬盤410和/或任何適當的存儲介質中,或者通過網絡從適當的位置下載到計算機系統(tǒng)400上。計算機程序產品可以包括計算機代碼部分,其包括可由適當的處理設備(例如,圖4中示出的CPU401)執(zhí)行的程序指令。該計算機程序產品可用于識別服務器系統(tǒng)中的熱點和可能故障。根據本發(fā)明的實施方式,計算機程序產品中包含的程序指令至少可以包括:用于收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據的指令;用于基于所收集的運行負載數據計算運行負載數據的分布的指令;用于根據所計算的分布建立識別模式的指令;以及用于使用所建立的識別模式來將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障的指令。
[0052]上文已經結合若干【具體實施方式】闡釋了本發(fā)明的精神和原理。通過下文詳細描述將會理解,可以通過收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據;基于所收集的運行負載數據計算運行負載數據的分布;根據所計算的分布建立識別模式;以及使用所建立的識別模式來將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。以此方式,可以改進識別服務器系統(tǒng)中的熱點和可能故障的機制。下面將詳細描述本發(fā)明的各種實施方式。
[0053]應當注意,本發(fā)明的實施方式可以通過硬件、軟件或者軟件和硬件的結合來實現。硬件部分可以利用專用邏輯來實現;軟件部分可以存儲在存儲器中,由適當的指令執(zhí)行系統(tǒng),例如微處理器或者專用設計硬件來執(zhí)行。本領域的普通技術人員可以理解上述的設備和方法可以使用計算機可執(zhí)行指令和/或包含在處理器控制代碼中來實現,例如在諸如磁盤、CD或DVD-ROM的載體介質、諸如只讀存儲器(固件)的可編程的存儲器或者諸如光學或電子信號載體的數據載體上提供了這樣的代碼。本發(fā)明的設備及其模塊可以由諸如超大規(guī)模集成電路或門陣列、諸如邏輯芯片、晶體管等的半導體、或者諸如現場可編程門陣列、可編程邏輯設備等的可編程硬件設備的硬件電路實現,也可以用由各種類型的處理器執(zhí)行的軟件實現,也可以由上述硬件電路和軟件的結合例如固件來實現。
[0054]說明書中提及的通信網絡可以包括各類網絡,包括但不限于局域網(“LAN”),廣域網(“WAN”),根據IP協(xié)議的網絡(例如,因特網)以及端對端網絡(例如,ad hoc對等網絡)。
[0055]應當注意,盡管在上文詳細描述中提及了設備的若干裝置或子裝置,但是這種劃分僅僅并非強制性的。實際上,根據本發(fā)明的實施方式,上文描述的兩個或更多裝置的特征和功能可以在一個裝置中具體化。反之,上文描述的一個裝置的特征和功能可以進一步劃分為由多個裝置來具體化。
[0056]此外,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實現期望的結果。相反,流程圖中描繪的步驟可以改變執(zhí)行順頁序。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,和/或將一個步驟分解為多個步驟執(zhí)行。
[0057]雖然已經參考若干【具體實施方式】描述了本發(fā)明,但是應該理解,本發(fā)明并不限于所公開的【具體實施方式】。本發(fā)明旨在涵蓋所附權利要求的精神和范圍內所包括的各種修改和等同布置。所附權利要求的范圍符合最寬泛的解釋,從而包含所有這樣的修改及等同結構和功能。
【權利要求】
1.一種用于識別服務器系統(tǒng)中的熱點和可能故障的方法,所述方法包括: 收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據; 基于所收集的運行負載數據計算運行負載數據的分布; 根據所計算的分布建立識別模式;以及 使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
2.根據權利要求1所述的方法,還包括針對不符合所述模式的節(jié)點發(fā)出警示。
3.根據權利要求1所述的方法,其中通過分布式信息收集系統(tǒng)收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據。
4.根據權利要求1所述的方法,其中基于所收集的運行負載數據計算所述運行負載數據的分布包括計算所述運行負載數據的平均值、最大值、中位數。
5.根據權利要求1所述的方法,其中基于所收集的運行負載數據計算所述運行負載數據的分布包括計算所述運行負載數據的方差。
6.根據權利要求1所述的方法,其中根據所計算的分布建立識別模式包括建立每個節(jié)點的運行負載關于時間的模式。
7.根據權利要求1所述的方法,其中根據所計算的分布建立識別模式包括建立所述服務器系統(tǒng)中的所有節(jié)點的平均運行負載關于時間的模式。
8.根據權利要求1所述的方法,其中使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障包括將當前負載值超過所述模式的對應點處的值一定百分比的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
9.根據權利要求8所述的方法,其中所述一定百分比為20%或者30%。
10.根據權利要求1所述的方法,其中使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障包括將當前負載曲線在當前點處的導數超過所述模式的對應點處的導數一定百分比的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
11.根據權利要求10所述的方法,其中所述一定百分比為20%或者30%。
12.根據權利要求1所述的方法,其中所述服務器系統(tǒng)包括以下的一個或多個:游戲服務器、電子郵件服務器、消息收發(fā)服務器、文件服務器、應用服務器、數據庫服務器。
13.一種用于識別服務器系統(tǒng)中的熱點和可能故障的設備,所述設備包括: 收集裝置,配置用于收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據; 分布計算裝置,配置用于基于所收集的運行負載數據計算運行負載數據的分布; 模式建立裝置,配置用于根據所計算的分布建立識別模式;以及 識別裝置,配置用于使用所建立的識別模式將不符合所述模式的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
14.根據權利要求13所述的設備,還包括警示裝置,配置用于針對不符合所述模式的節(jié)點發(fā)出警示。
15.根據權利要求13所述的設備,其中所述收集裝置配置用于通過分布式信息收集系統(tǒng)收集所述服務器系統(tǒng)的每個節(jié)點處的運行負載數據。
16.根據權利要求13所述的設備,其中所述分布計算裝置配置用于計算所述運行負載數據的平均值、最大值、中位數。
17.根據權利要求13所述的設備,其中所述分布計算裝置配置用于計算所述運行負載數據的方差。
18.根據權利要求13所述的設備,其中所述分布建立裝置配置用于建立每個節(jié)點的運行負載關于時間的模式。
19.根據權利要求13所述的設備,其中所述分布建立裝置配置用于建立所述服務器系統(tǒng)中的所有節(jié)點的平均運行負載關于時間的模式。
20.根據權利要求13所述的設備,其中所述識別裝置配置用于將當前負載值超過所述模式的對應點處的值一定百分比的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
21.根據權利要求20所述的設備,其中所述一定百分比為20%或者30%。
22.根據權利要求13所述的設備,其中所述識別裝置配置用于將當前負載曲線在當前點處的導數超過所述模式的對應點處的導數一定百分比的節(jié)點識別為所述服務器系統(tǒng)中的熱點和可能故障。
23.根據權利要求22所述的設備,其中所述一定百分比為20%或者30%。
24.根據權利要求13所述的設備,其中所述服務器系統(tǒng)包括以下的一個或多個:游戲服務器、電子郵件服務器、消息收發(fā)服務器、文件服務器、應用服務器、數據庫服務器。
25.—種系統(tǒng),包括: 服務器系統(tǒng),其包括多個節(jié)點; 存儲庫,其耦合至所述服務器系統(tǒng),配置為用于存儲從所述服務器系統(tǒng)的每個節(jié)點收集的運行負載數據;以及 監(jiān)控設備,其耦合至所述存儲庫,配置為用于識別所述服務器系統(tǒng)中的熱點和可能故障,其中所述監(jiān)控設備包括根據權利要求13-24任一項所述的設備。
【文檔編號】H04L12/24GK103580903SQ201210279582
【公開日】2014年2月12日 申請日期:2012年8月2日 優(yōu)先權日:2012年8月2日
【發(fā)明者】于昕 申請人:人人游戲網絡科技發(fā)展(上海)有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
名山县| 星座| 新竹市| 兴宁市| 平谷区| 淮滨县| 彭阳县| 镇沅| 陵川县| 上犹县| 廊坊市| 大方县| 广饶县| 灯塔市| 朔州市| 运城市| 富民县| 抚松县| 遂平县| 灌阳县| 阳高县| 越西县| 吴川市| 乐业县| 渑池县| 永嘉县| 青浦区| 泉州市| 汶上县| 西安市| 三明市| 中卫市| 阜宁县| 贵港市| 江川县| 河北区| 嘉黎县| 阿巴嘎旗| 遵化市| 东阳市| 红桥区|