本發(fā)明涉及資源監(jiān)控管理領(lǐng)域,特別是涉及一種基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng)。
背景技術(shù):
當(dāng)前的計算機應(yīng)用越來越普遍,計算機在使用過程中遇到的設(shè)備問題也越來越多,而且計算機的數(shù)量也隨著時間在亟需增加,與以前的計算機維護相比,維護的成本越來越高。如何更加全面的保護用戶的計算機,在用戶的服務(wù)器出現(xiàn)問題后,通過服務(wù)器自身的調(diào)整,能夠在不利的情況下使用更長的時間,在硬件告警的情況下能夠最大化的發(fā)揮服務(wù)器的容錯兼容性,確保在實施維修之前,軟件可以最大化的利用。這對我們的計算機監(jiān)控管理提出了更高的要求。
如何在現(xiàn)有的復(fù)雜設(shè)備集群環(huán)境中,實現(xiàn)計算機設(shè)備硬件故障的自動化管理,從軟件層面減輕在出現(xiàn)設(shè)備輕微故障時對服務(wù)器的壓力影響,最大化的利用設(shè)備的價值,降低設(shè)備整體的運維費用,也就成了計算機資源管理領(lǐng)域人員關(guān)注的問題。
當(dāng)前計算機廠商故障監(jiān)控管理的解決方案,在服務(wù)器硬件出現(xiàn)問題需要更換時,首先會進行硬件配置的記錄,之后會對服務(wù)器進行關(guān)機操作,在完成服務(wù)器新硬件的更新后,重新使用。這種方式在執(zhí)行的計算資源越來越寶貴的今天,無疑是一種資源的浪費。如何在計算機的故障管理上,對部分可以通過調(diào)整軟件繼續(xù)使用的設(shè)備進行利用,為我們的客戶提供一個更加全面的資源使用環(huán)境也就成了我們關(guān)系的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng),使服務(wù)器在硬件告警的情況下可以運行更長的時間,方便數(shù)據(jù)中心的設(shè)備管理員在服務(wù)器宕機之前對硬件問題進行排查、解決,有效的減少服務(wù)器直接宕機風(fēng)險,在最大程度上達到故障資源利用,實現(xiàn)精細化監(jiān)控管理的目的。
為解決上述技術(shù)問題,本發(fā)明實施例提供了一種基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng),包括相互連接的硬件監(jiān)控單元和css加載控制單元,所述硬件監(jiān)控單元與服務(wù)器連接,用于監(jiān)控所述服務(wù)器的硬件告警信息,并在監(jiān)控到所述服務(wù)器的硬件發(fā)生故障時,將所述服務(wù)器的所述硬件告警信息發(fā)送到所述css加載控制單元,所述css加載控制單元用于在收到所述硬件告警信息時,調(diào)用對cpu、內(nèi)測占用較小的css。
其中,還包括與所述硬件監(jiān)控單元、所述css加載控制單元連接的告警通知單元,用于在所述css調(diào)整完畢后,在所述硬件告警信息超出閾值時,將所述服務(wù)器的硬件告警信息發(fā)送到管理人員。
其中,還包括配置對比單元,用于接收所述硬件監(jiān)測單元發(fā)送的所述服務(wù)器的硬件發(fā)生故障時的硬件告警信息。
其中,還包括與所述告警通知單元連接的警報單元,用于在所述css調(diào)整完畢后,根據(jù)所述硬件告警信息的內(nèi)容對外發(fā)送不同類型的警報。
除此之外,本發(fā)明實施例還提供了一種基于服務(wù)器硬件告警的動態(tài)css控制方法,包括:
步驟1,監(jiān)測所述服務(wù)器的硬件告警信息,在所述服務(wù)器發(fā)生故障時發(fā)出當(dāng)前的所述硬件告警信息;
步驟2,接收所述硬件告警信息,調(diào)用對cpu、內(nèi)存占用較小的css。
其中,在所述步驟2之后,還包括:
步驟3,判斷在調(diào)用所述css后的所述硬件告警信息是否超出閾值,若是,將所述服務(wù)器的硬件告警信息發(fā)送到管理人員。
其中,在所述步驟3之后,還包括:
步驟4,在所述調(diào)用所述css后的所述硬件告警信息超出閾值后,根據(jù)所述css硬件告警信息發(fā)出不同類型的警報。
其中,在所述步驟4之后,還包括:
步驟5,重置當(dāng)前的硬件配置信息。
本發(fā)明實施例所提供的基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng)統(tǒng),與現(xiàn)有技術(shù)相比,具有以下優(yōu)點:
本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng),包括相互連接的硬件監(jiān)控單元和css加載控制單元,所述硬件監(jiān)控單元與服務(wù)器連接,用于監(jiān)控所述服務(wù)器的硬件告警信息,并在監(jiān)控到所述服務(wù)器的硬件發(fā)生故障時,將所述服務(wù)器的所述硬件告警信息發(fā)送到所述css加載控制單元,所述css加載控制單元用于在收到所述硬件告警信息時,調(diào)用對cpu、內(nèi)測占用較小的css。
本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法,包括:
步驟1,監(jiān)測所述服務(wù)器的硬件告警信息,在所述服務(wù)器發(fā)生故障時發(fā)出當(dāng)前的所述硬件告警信息;
步驟2,接收所述硬件告警信息,調(diào)用對cpu、內(nèi)存占用較小的css。
所述基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng),通過在監(jiān)控到所述服務(wù)器的硬件發(fā)生故障時,調(diào)用對cpu、內(nèi)測占用較小的css,降低對服務(wù)器硬件的影響,使服務(wù)器在硬件告警的情況下可以運行更長的時間,方便數(shù)據(jù)中心的設(shè)備管理員在服務(wù)器宕機之前對硬件問題進行排查、解決,有效的減少服務(wù)器直接宕機風(fēng)險,解決了數(shù)據(jù)中心在硬件告警時因資源高占用而造成的設(shè)備宕機的難題。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng)一種具體實施方式的結(jié)構(gòu)示意圖;
圖2為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng)另一種具體實施方式的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第一種具體實施方式的步驟流程示意圖;
圖4為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第二種具體實施方式的步驟流程示意圖;
圖5為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第三種具體實施方式的步驟流程示意圖;
圖6為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第四種具體實施方式的步驟流程示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
請參考圖1~6,圖1為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng)一種具體實施方式的結(jié)構(gòu)示意圖;圖2為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng)另一種具體實施方式的結(jié)構(gòu)示意圖;圖3為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第一種具體實施方式的步驟流程示意圖;圖4為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第二種具體實施方式的步驟流程示意圖;圖5為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第三種具體實施方式的步驟流程示意圖;圖6為本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法的第四種具體實施方式的步驟流程示意圖。
在一種具體實施方式中,所述基于服務(wù)器硬件告警的動態(tài)css控制系統(tǒng),如圖1和圖2所示,包括相互連接的硬件監(jiān)控單元20和css加載控制單元30,所述硬件監(jiān)控單元20與服務(wù)器10連接,用于監(jiān)控所述服務(wù)器10的硬件告警信息,并在監(jiān)控到所述服務(wù)器10的硬件發(fā)生故障時,將所述服務(wù)器10的所述硬件告警信息發(fā)送到所述css加載控制單元30,所述css加載控制單元30用于在收到所述硬件告警信息時,調(diào)用對cpu、內(nèi)測占用較小的css。
通過在監(jiān)控到所述服務(wù)器10的硬件發(fā)生故障時,調(diào)用對cpu、內(nèi)測占用較小的css,降低對服務(wù)器10硬件的影響,使服務(wù)器10在硬件告警的情況下可以運行更長的時間,方便數(shù)據(jù)中心的設(shè)備管理員在服務(wù)器10宕機之前對硬件問題進行排查、解決,有效的減少服務(wù)器10直接宕機風(fēng)險,解決了數(shù)據(jù)中心在硬件告警時因資源高占用而造成的設(shè)備宕機的難題。
在一實施例中,風(fēng)扇發(fā)生故障,為了防止機箱的溫度過高,需要調(diào)整軟件對cpu、內(nèi)存的占用,降低cpu、內(nèi)存的散熱量,為此,通過對ui功能的css進行調(diào)整,在保證基本功能的前提下,不再調(diào)用渲染、動畫等比較耗費資源的效果,從而達到降低機箱溫度的效果。同時由于ui風(fēng)格的變化,更加有利于管理員發(fā)現(xiàn)故障服務(wù)器10,今早對服務(wù)器10進行修復(fù)。
調(diào)用對cpu、內(nèi)測占用較小的css,減少了系統(tǒng)資源的消耗,從側(cè)面影響cpu、內(nèi)存等硬件的發(fā)熱,但是不一定具有直接的效果,甚至于可能由于不是單一硬件故障就沒有什么好的效果。例如,服務(wù)器10風(fēng)扇發(fā)生故障,硬件監(jiān)測單元在監(jiān)測到之后,通知css加載控制單元30,css加載控制單元30通過調(diào)整軟件對cpu、內(nèi)存的占用,降低cpu、內(nèi)存的散熱量,使得對溫度的控制有兩個結(jié)果,一個是達到預(yù)期的效果,可以繼續(xù)使用,另一個是沒有達到預(yù)期的效果,需要告警維修。因此,基于服務(wù)器10硬件告警的動態(tài)css控制系統(tǒng)還包括與所述硬件監(jiān)控單元20、所述css加載控制單元30連接的告警通知單元,用于在所述css調(diào)整完畢后,在所述硬件告警信息超出閾值時,將所述服務(wù)器10的硬件告警信息發(fā)送到管理人員。在所述css調(diào)整完畢后,服務(wù)器10的硬件設(shè)備的告警狀態(tài)沒有發(fā)生變化,還是像調(diào)整前一樣,超出閾值,即超出預(yù)定的正常工作范圍時,需要給服務(wù)器10設(shè)備的管理人員發(fā)送告警信息,通知維修。
服務(wù)器10發(fā)生故障,例如風(fēng)扇發(fā)生故障,在管理人員維修過程中,如果能夠直接獲得發(fā)生故障的硬件,即可快速進行維修,減少了故障排查需要的時間,提高了維修效率,提高了服務(wù)器10的正常運行時間。為此所述基于服務(wù)器10硬件告警的動態(tài)css控制系統(tǒng)還包括配置對比單元40,用于接收所述硬件監(jiān)測單元發(fā)送的所述服務(wù)器10的硬件發(fā)生故障時的硬件告警信息。通過配置對比單元40對硬件故障前后的硬件配置進行對此,可以直接獲得服務(wù)器10發(fā)生故障的部件,維修人員可以直接對此進行維修,提高了工作效率,降低了工作強度。
為了更進一步盡早獲得發(fā)生故障的硬件信息,在到達服務(wù)器10之間就直奔故障硬件,所述基于服務(wù)器10硬件告警的動態(tài)css控制系統(tǒng)還包括與所述告警通知單元連接的警報單元,用于在所述css調(diào)整完畢后,根據(jù)所述硬件告警信息的內(nèi)容對外發(fā)送不同類型的警報。通過對根據(jù)所述硬件告警信息的內(nèi)容對外發(fā)送不同類型的警報,如一個部件發(fā)生故障時是一種警報方式,另一個部件或另一種部件發(fā)生故障時,警報單元發(fā)送另一種警報方式,使得管理人員在達到維修點之前就有了維修方案,提高了工作效率。本發(fā)明對警報單元的警報方式不作具體限定,可以使聲光電等報警方式,也可以是通過發(fā)送短信的報警方式。
除此之外,本發(fā)明實施例還提供了一種基于服務(wù)器硬件告警的動態(tài)css控制方法,如圖3~圖6所示,包括:
步驟1,監(jiān)測所述服務(wù)器的硬件告警信息,在所述服務(wù)器發(fā)生故障時發(fā)出當(dāng)前的所述硬件告警信息;
步驟2,接收所述硬件告警信息,調(diào)用對cpu、內(nèi)存占用較小的css。
調(diào)用對cpu、內(nèi)測占用較小的css,減少了系統(tǒng)資源的消耗,從側(cè)面影響cpu、內(nèi)存等硬件的發(fā)熱,但是不一定具有直接的效果,甚至于可能由于不是單一硬件故障就沒有什么好的效果。例如,服務(wù)器風(fēng)扇發(fā)生故障,硬件監(jiān)測單元在監(jiān)測到之后,通知css加載控制單元,css加載控制單元通過調(diào)整軟件對cpu、內(nèi)存的占用,降低cpu、內(nèi)存的散熱量,使得對溫度的控制有兩個結(jié)果,一個是達到預(yù)期的效果,可以繼續(xù)使用,另一個是沒有達到預(yù)期的效果,需要告警維修。因此,在所述步驟2之后,還包括:
步驟3,判斷在調(diào)用所述css后的所述硬件告警信息是否超出閾值,若是,步驟4,將所述服務(wù)器的硬件告警信息發(fā)送到管理人員。
當(dāng)然,在調(diào)用所述css后的所述css硬件告警信息沒有超出閾值,也可以繼續(xù)將述服務(wù)器的硬件告警信息發(fā)送到管理人員,在服務(wù)器正常運行的同時,管理人員可以對其進行必要的檢修。
為了更進一步盡早獲得發(fā)生故障的硬件信息,在到達服務(wù)器之間就直奔故障硬件,在所述步驟4之后,還包括:
步驟5,在所述調(diào)用所述css后的所述硬件告警信息超出閾值后,根據(jù)所述css硬件告警信息發(fā)出不同類型的警報。本發(fā)明對警報單元的警報方式不作具體限定,可以使聲光電等報警方式,也可以是通過發(fā)送短信的報警方式。
服務(wù)器發(fā)生故障,例如風(fēng)扇發(fā)生故障,在管理人員維修過程中,如果能夠直接獲得發(fā)生故障的硬件,即可快速進行維修,減少了故障排查需要的時間,提高了維修效率,提高了服務(wù)器的正常運行時間。因此,在所述步驟5之后,還包括:
步驟6,重置當(dāng)前的硬件配置信息。通過配置對比單元對硬件故障前后的硬件配置進行對此,可以直接獲得服務(wù)器發(fā)生故障的部件,維修人員可以直接對此進行維修,提高了工作效率,降低了工作強度。
需要說明的是,在本發(fā)明中的基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng),對于調(diào)用對cpu、內(nèi)測占用較小的css,降低對服務(wù)器硬件的影響,可以是一次性調(diào)用對cpu、內(nèi)測占用最小的css,也可以是逐步進行,每次都調(diào)用比上次對cpu、內(nèi)測占用較小的css,本發(fā)明對此不作具體限定,例如,在風(fēng)扇發(fā)生故障時,對于渲染和動畫等比較耗費資源的效果,可以一次取消調(diào)用其中的一個,也可以是多個,甚至是一次性直接將所有的耗費資源的效果全部取消調(diào)用。
綜上所述,本發(fā)明實施例提供的基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng),通過在監(jiān)控到所述服務(wù)器的硬件發(fā)生故障時,調(diào)用對cpu、內(nèi)測占用較小的css,降低對服務(wù)器硬件的影響,使服務(wù)器在硬件告警的情況下可以運行更長的時間,方便數(shù)據(jù)中心的設(shè)備管理員在服務(wù)器宕機之前對硬件問題進行排查、解決,有效的減少服務(wù)器直接宕機風(fēng)險,解決了數(shù)據(jù)中心在硬件告警時因資源高占用而造成的設(shè)備宕機的難題。
以上對本發(fā)明所提供的基于服務(wù)器硬件告警的動態(tài)css控制方法和控制系統(tǒng)進行了詳細介紹。本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進行若干改進和修飾,這些改進和修飾也落入本發(fā)明權(quán)利要求的保護范圍內(nèi)。