欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法與流程

文檔序號:12729333閱讀:244來源:國知局

本發(fā)明屬于云計算技術領域;具體涉及一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法。



背景技術:

云資源監(jiān)控系統(tǒng)是保證云平臺正常運轉的關鍵,旨在收集資源負載信息,是作業(yè)調度、負載均衡、事件預測、故障檢測及恢復等的前提。

對云平臺上動態(tài)、復雜的虛擬資源進行實時、有效的監(jiān)控和管理是保證云平臺可用性的關鍵。

現有云監(jiān)控系統(tǒng)中,為實時反映云平臺中的資源負載情況,監(jiān)控組件需要大量收集資源負載信息,監(jiān)控組件與被監(jiān)控資源間存在頻繁的數據傳輸,造成較大的通信開銷,容易導致網絡擁堵,很難做到監(jiān)控信息的實時同步和監(jiān)控系統(tǒng)的穩(wěn)定可靠,并對云平臺的運轉造成干擾,影響云平臺的正常使用,降低服務質量。此為現有技術的不足之處。

因此,針對現有技術中的上述缺陷,提供設計一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法;以解決上述技術問題,是非常有必要的。



技術實現要素:

本發(fā)明的目的在于,針對上述現有技術存在的缺陷,提供設計一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法,以解決上述技術問題。

為實現上述目的,本發(fā)明給出以下技術方案:

一種高可用的云監(jiān)控系統(tǒng),它包括設置于各個待檢測節(jié)點的agent模塊;其特征在于,各agent模塊將采集到的待檢測節(jié)點的狀態(tài)信息發(fā)送到agentCluster節(jié)點,agentCluster節(jié)點將采集到的數據發(fā)送至SERVER服務端;

所述的待檢測節(jié)點包括物理主機和虛擬機。

優(yōu)選地,各agent模塊之間定期相互發(fā)送心跳信息。

本發(fā)明還給出一種高可用的云監(jiān)控方法,包括以下步驟:

步驟1):在待監(jiān)控主機中設置智能agent模塊,并通過Server服務端以文件的形式將監(jiān)控任務發(fā)送到待監(jiān)控主機中;待監(jiān)控主機包括物理主機以及虛擬機;

步驟2):將監(jiān)控腳本(BAT或是SHELL形式)通過Server服務端傳送到待監(jiān)控物理主機以及虛擬機中;腳本傳輸完結束后向agent模塊傳送監(jiān)控命令,agent模塊收到命令后運行對應的腳本文件,采集監(jiān)控數據;

步驟3):以物理主機中的agent模塊作為agentCluster節(jié)點,虛擬機中的agent作為Cluster群集合的成員;Cluster群集合成員中的各agent模塊之間以固定時間Theartbeating發(fā)送心跳數據報文,作為各agent模塊存活的標志;

步驟4):各agent模塊依據任務列表讀取任務腳本,發(fā)送采集到的數據給agentCluster節(jié)點;初始監(jiān)控周期為default_monitor_time(i),同時設置監(jiān)控周期變化步長,采樣的時間間隔的調整大小為原子時間atomic_time(i)的整數倍;

步驟5):agent分別為不同的監(jiān)控指標建立對應的存儲隊列,并計算數據緩沖隊列中的數據的偏差情況,其計算使用如下模型:

其中δ表示樣本數據的標準差,Xi為采集到的第i個數據的狀態(tài)信息;

步驟6):在步驟5)的基礎上,定義第i個監(jiān)控指標的數據偏差的上限為threshold(i);如果采集到的數據的變化趨勢較為平穩(wěn)即δ<threshold(i),則增大數據監(jiān)控采樣周期,如果監(jiān)控采集到的數據的變化趨勢較大,即δ>=threshold(i),則縮小數據監(jiān)控采樣周期的大??;

步驟7):agentCluster節(jié)點接收到數據之后,將監(jiān)控數據通過消息隊列發(fā)送給監(jiān)控平臺的Server服務端。

作為優(yōu)選,所述步驟1)中,監(jiān)控任務包括監(jiān)控指標(cpu,內存,存儲等)以及監(jiān)控腳本的存放路徑。

作為優(yōu)選,所述步驟3)中還包括以下步驟:

當agent超過時間Theartbeating,沒有發(fā)送心跳數據,則認為該agent已關閉;agentCluster節(jié)點負責定時報告成員agent的運行狀態(tài);當cluster群集合成員發(fā)現agentCluster關閉,則啟動分布式選舉算法Paxos,重新選擇agentCluster節(jié)點。

作為優(yōu)選,所述步驟6)中,增大數據監(jiān)控采樣周期的計算模型為:

monitor_time(i)=default_monitor_time(i)①

monitor_time(i)=monitor_time(i)+atomic_time(i)*f(δ,threshold(i))②

其中公式①表示監(jiān)控指標i的采樣周期的初始化設置;公式②表示監(jiān)控指標i的采樣周期的動態(tài)調整,其中f(δ,threshold(i))表示數據偏差值δ與閾值threshold(i)的對應函數關系;

縮小數據監(jiān)控采樣周期的計算模型為:

monitor_time(i)=max(monitor_time(i)/2,atomic_time(i))。

本發(fā)明的有益效果在于,動態(tài)調整agent采集數據的周期,減少監(jiān)控系統(tǒng)冗余數據的傳輸,保證云監(jiān)控系統(tǒng)的高效穩(wěn)定。同時節(jié)點定時報告自己的運行狀態(tài),并通過選舉算法避免了單節(jié)點失效問題的發(fā)生。此外,本發(fā)明設計原理可靠,結構簡單,具有非常廣泛的應用前景。

由此可見,本發(fā)明與現有技術相比,具有突出的實質性特點和顯著地進步,其實施的有益效果也是顯而易見的。

附圖說明

圖1是本發(fā)明提供的一種高可用的云監(jiān)控系統(tǒng)的原理框圖。

其中,1-agent模塊,2-agentCluster,3-虛擬機,4-物理主機,5-Server服務端,6-消息隊列。

具體實施方式

下面結合附圖并通過具體實施例對本發(fā)明進行詳細闡述,以下實施例是對本發(fā)明的解釋,而本發(fā)明并不局限于以下實施方式。

如圖1所示,本發(fā)明提供的一種高可用的云監(jiān)控系統(tǒng),它包括設置于各個待檢測節(jié)點的agent模塊;其特征在于,各agent模塊將采集到的待檢測節(jié)點的狀態(tài)信息發(fā)送到agentCluster節(jié)點,agentCluster節(jié)點將采集到的數據發(fā)送至Server服務端;

所述的待檢測節(jié)點包括物理主機和虛擬機。

本實施例中,各agent模塊之間定期相互發(fā)送心跳信息。

本發(fā)明還給出一種高可用的云監(jiān)控方法,包括以下步驟:

步驟1):在待監(jiān)控主機中設置智能agent模塊,并通過Server服務端以文件的形式將監(jiān)控任務發(fā)送到待監(jiān)控主機中;待監(jiān)控主機包括物理主機以及虛擬機;

步驟2):將監(jiān)控腳本(BAT或是SHELL形式)通過Server服務端傳送到待監(jiān)控物理主機以及虛擬機中;腳本傳輸完結束后向agent模塊傳送監(jiān)控命令,agent模塊收到命令后運行對應的腳本文件,采集監(jiān)控數據;

步驟3):以物理主機中的agent模塊作為agentCluster節(jié)點,虛擬機中的agent作為Cluster群集合的成員;Cluster群集合成員中的各agent模塊之間以固定時間Theartbeating發(fā)送心跳數據報文,作為各agent模塊存活的標志;

步驟4):各agent模塊依據任務列表讀取任務腳本,發(fā)送采集到的數據給agentCluster節(jié)點;初始監(jiān)控周期為default_monitor_time(i),同時設置監(jiān)控周期變化步長,采樣的時間間隔的調整大小為原子時間atomic_time(i)的整數倍;

步驟5):agent分別為不同的監(jiān)控指標建立對應的存儲隊列,并計算數據緩沖隊列中的數據的偏差情況,其計算使用如下模型:

其中δ表示樣本數據的標準差,Xi為采集到的第i個數據的狀態(tài)信息;

步驟6):在步驟5)的基礎上,定義第i個監(jiān)控指標的數據偏差的上限為threshold(i);如果采集到的數據的變化趨勢較為平穩(wěn)即δ<threshold(i),則增大數據監(jiān)控采樣周期,如果監(jiān)控采集到的數據的變化趨勢較大,即δ>=threshold(i),則縮小數據監(jiān)控采樣周期的大小;

步驟7):agentCluster節(jié)點接收到數據之后,將監(jiān)控數據通過消息隊列發(fā)送給監(jiān)控平臺的SERVER服務端。

本實施例中,所述步驟1)中,監(jiān)控任務包括監(jiān)控指標(cpu,內存,存儲等)以及監(jiān)控腳本的存放路徑。

所述步驟3)中還包括以下步驟:

當agent超過時間Theartbeating,沒有發(fā)送心跳數據,則認為該agent已關閉;agentCluster節(jié)點負責定時報告成員agent的運行狀態(tài);當cluster群集合成員發(fā)現agentCluster關閉,則啟動分布式選舉算法Paxos,重新選擇agentCluster節(jié)點。

所述步驟6)中,增大數據監(jiān)控采樣周期的計算模型為:

monitor_time(i)=default_monitor_time(i) ①

monitor_time(i)=monitor_time(i)+atomic_time(i)*f(δ,threshold(i)) ②

其中公式①表示監(jiān)控指標i的采樣周期的初始化設置;公式②表示監(jiān)控指標i的采樣周期的動態(tài)調整,其中f(δ,threshold(i))表示數據偏差值δ與閾值threshold(i)的對應函數關系;

縮小數據監(jiān)控采樣周期的計算模型為:

monitor_time(i)=max(monitor_time(i)/2,atomic_time(i))。

以上公開的僅為本發(fā)明的優(yōu)選實施方式,但本發(fā)明并非局限于此,任何本領域的技術人員能思之的沒有創(chuàng)造性的變化,以及在不脫離本發(fā)明原理前提下所作的若干改進和潤飾,都應落在本發(fā)明的保護范圍內。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
资兴市| 原平市| 吴江市| 嘉义市| 久治县| 福鼎市| 横山县| 紫金县| 杭锦后旗| 宁晋县| 永定县| 随州市| 甘孜县| 贵州省| 昭平县| 湘潭县| 巴东县| 台安县| 林周县| 徐汇区| 大港区| 平江县| 巴彦县| 沐川县| 额尔古纳市| 环江| 栾川县| 呼图壁县| 清丰县| 娄烦县| 恩施市| 突泉县| 桃园县| 沂源县| 慈溪市| 蓝田县| 阿图什市| 广东省| 漾濞| 乌海市| 绍兴县|