本發(fā)明公開一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,涉及服務(wù)器管理。
背景技術(shù):
1、lrm是系統(tǒng)安裝結(jié)構(gòu)上和功能上相對獨立的單元,故障定位可以達到lrm一級,通過更換lrm而排除故障。近幾年,lrm架構(gòu)以其抗惡劣環(huán)境好的優(yōu)勢飛速發(fā)展,成為主流加固服務(wù)器的架構(gòu)形式之一。
2、我國服務(wù)器國產(chǎn)化要求日益迫切,并且由于服務(wù)器工作環(huán)境復(fù)雜,除工作中難以檢測狀態(tài)外,如果遇到系統(tǒng)問題,則需要人員到達現(xiàn)場,浪費人力及時間,有待進一步的改進。
技術(shù)實現(xiàn)思路
1、本發(fā)明針對現(xiàn)有技術(shù)的問題,提供一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,可以根據(jù)實際需求,動態(tài)地調(diào)整資源分配,實現(xiàn)資源的最優(yōu)利用和負載均衡,提高了服務(wù)器的性能和可靠性的同時,也可以減少對硬件資源的浪費。
2、本發(fā)明提出的具體方案是:
3、本發(fā)明提供一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,包括:基于lrm架構(gòu),進行多層次動態(tài)告警資源的調(diào)整分配:
4、部署lrm架構(gòu)內(nèi)多單元服務(wù)器,多單元服務(wù)器中包含多個服務(wù)刀片單元,每個服務(wù)刀片單元上部署小告警處理系統(tǒng),通過小告警系統(tǒng)與整機背板互聯(lián),
5、通過整機背板部署多層次告警系統(tǒng),通過多層次告警系統(tǒng)實時監(jiān)控各個服務(wù)刀片中的數(shù)據(jù),并匯總各個小告警處理系統(tǒng)上報的信息,根據(jù)監(jiān)控的數(shù)據(jù)和上報的信息判斷當(dāng)前各個服務(wù)刀片單元是否存在問題,是則根據(jù)對整機運行狀態(tài)影響的嚴重程度自動判斷問題告警等級,根據(jù)問題告警等級判斷是否需要調(diào)整資源分配。
6、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法中所述部署小告警處理系統(tǒng),包括:
7、部署小告警處理系統(tǒng)的嵌入式芯片組和嵌入式軟件,通過嵌入式芯片組采集檢測所在服務(wù)刀片單元主板的硬件基本數(shù)據(jù),硬件基本數(shù)據(jù)包括主板電壓、電流、溫度;通過嵌入式軟件實時檢測所在服務(wù)刀片單元系統(tǒng)負載使用率和內(nèi)存使用情況。
8、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法中所述部署多層次告警系統(tǒng),包括:部署多層次告警系統(tǒng)的嵌入式芯片組和嵌入式軟件,通過嵌入式芯片組采集整機的硬件基本數(shù)據(jù)并實時監(jiān)控各個服務(wù)刀片中的數(shù)據(jù);通過嵌入式軟件實時匯總各個服務(wù)刀片單元的小告警處理系統(tǒng)上報的信息,根據(jù)監(jiān)控的數(shù)據(jù)和上報的信息判斷當(dāng)前各個服務(wù)刀片單元是否存在問題。
9、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法中所述根據(jù)對整機運行狀態(tài)影響的嚴重程度自動判斷問題告警等級,包括:將等級化分為四種,依次為危險、重要、一般、提示,危險等級表示問題為嚴重故障,服務(wù)器出現(xiàn)不可恢復(fù)的問題;重要等級表示問題相對嚴重,影響服務(wù)器的正常使用;一般等級表示問題不嚴重,有可能影響服務(wù)器正常使用;提示等級表示目前存在的潛在問題,有可能影響服務(wù)器正常使用。
10、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法中所述根據(jù)問題告警等級判斷是否需要調(diào)整資源分配,包括:
11、如果存在危險等級,則立刻上報;
12、如果出現(xiàn)重要等級和一般等級,則通過多層次告警系統(tǒng)根據(jù)各個服務(wù)刀片單元上報的信息確定問題來源,清理僵尸資源,動態(tài)調(diào)整優(yōu)先級將進程或者線程調(diào)整到其他負載空閑的服務(wù)刀片單元上,直到告警消除;
13、如果存在提示等級,則通過小告警系統(tǒng)定期發(fā)送異常指示,等待多層次告警系統(tǒng)處理。
14、本發(fā)明還提供一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置,基于lrm架構(gòu),進行多層次動態(tài)告警資源的調(diào)整分配,包括部署模塊、小告警系統(tǒng)和多層次告警系統(tǒng),
15、部署模塊部署lrm架構(gòu)內(nèi)多單元服務(wù)器,多單元服務(wù)器中包含多個服務(wù)刀片單元,每個服務(wù)刀片單元上部署小告警處理系統(tǒng),通過小告警系統(tǒng)與整機背板互聯(lián),
16、部署模塊通過整機背板部署多層次告警系統(tǒng),通過多層次告警系統(tǒng)實時監(jiān)控各個服務(wù)刀片中的數(shù)據(jù),并匯總各個小告警處理系統(tǒng)上報的信息,根據(jù)監(jiān)控的數(shù)據(jù)和上報的信息判斷當(dāng)前各個服務(wù)刀片單元是否存在問題,是則根據(jù)對整機運行狀態(tài)影響的嚴重程度自動判斷問題告警等級,根據(jù)問題告警等級判斷是否需要調(diào)整資源分配。
17、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置的所述部署模塊部署小告警處理系統(tǒng),包括:
18、部署小告警處理系統(tǒng)的嵌入式芯片組和嵌入式軟件,通過嵌入式芯片組采集檢測所在服務(wù)刀片單元主板的硬件基本數(shù)據(jù),硬件基本數(shù)據(jù)包括主板電壓、電流、溫度;通過嵌入式軟件實時檢測所在服務(wù)刀片單元系統(tǒng)負載使用率和內(nèi)存使用情況。
19、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置的所述部署模塊部署多層次告警系統(tǒng),包括:部署多層次告警系統(tǒng)的嵌入式芯片組和嵌入式軟件,通過嵌入式芯片組采集整機的硬件基本數(shù)據(jù)并實時監(jiān)控各個服務(wù)刀片中的數(shù)據(jù);通過嵌入式軟件實時匯總各個服務(wù)刀片單元的小告警處理系統(tǒng)上報的信息,根據(jù)監(jiān)控的數(shù)據(jù)和上報的信息判斷當(dāng)前各個服務(wù)刀片單元是否存在問題。
20、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置的所述多層次告警系統(tǒng)根據(jù)對整機運行狀態(tài)影響的嚴重程度自動判斷問題告警等級,包括:將等級化分為四種,依次為危險、重要、一般、提示,危險等級表示問題為嚴重故障,服務(wù)器出現(xiàn)不可恢復(fù)的問題;重要等級表示問題相對嚴重,影響服務(wù)器的正常使用;一般等級表示問題不嚴重,有可能影響服務(wù)器正常使用;提示等級表示目前存在的潛在問題,有可能影響服務(wù)器正常使用。
21、進一步,所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置的所述多層次告警系統(tǒng)根據(jù)問題告警等級判斷是否需要調(diào)整資源分配,包括:
22、如果存在危險等級,則立刻上報;
23、如果出現(xiàn)重要等級和一般等級,則多層次告警系統(tǒng)根據(jù)各個服務(wù)刀片單元上報的信息確定問題來源,清理僵尸資源,動態(tài)調(diào)整優(yōu)先級將進程或者線程調(diào)整到其他負載空閑的服務(wù)刀片單元上,直到告警消除;
24、如果存在提示等級,則小告警系統(tǒng)定期發(fā)送異常指示,等待多層次告警系統(tǒng)處理。
25、本發(fā)明的有益之處是:
26、本發(fā)明方法可以根據(jù)實際需求,動態(tài)地調(diào)整資源分配,實現(xiàn)資源的最優(yōu)利用和負載均衡。提高了服務(wù)器的性能和可靠性的同時,也可以減少對硬件資源的浪費。同時可以定位故障問題,可起到遠程狀態(tài)檢測的作用,也可遠程問題排查,節(jié)省人力及時間,具有良好的推廣應(yīng)用價值。
1.一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,其特征是包括:基于lrm架構(gòu),進行多層次動態(tài)告警資源的調(diào)整分配:
2.根據(jù)權(quán)利要求1所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,其特征是所述部署小告警處理系統(tǒng),包括:
3.根據(jù)權(quán)利要求1所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,其特征是所述部署多層次告警系統(tǒng),包括:部署多層次告警系統(tǒng)的嵌入式芯片組和嵌入式軟件,通過嵌入式芯片組采集整機的硬件基本數(shù)據(jù)并實時監(jiān)控各個服務(wù)刀片中的數(shù)據(jù);通過嵌入式軟件實時匯總各個服務(wù)刀片單元的小告警處理系統(tǒng)上報的信息,根據(jù)監(jiān)控的數(shù)據(jù)和上報的信息判斷當(dāng)前各個服務(wù)刀片單元是否存在問題。
4.根據(jù)權(quán)利要求1所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,其特征是所述根據(jù)對整機運行狀態(tài)影響的嚴重程度自動判斷問題告警等級,包括:將等級化分為四種,依次為危險、重要、一般、提示,危險等級表示問題為嚴重故障,服務(wù)器出現(xiàn)不可恢復(fù)的問題;重要等級表示問題相對嚴重,影響服務(wù)器的正常使用;一般等級表示問題不嚴重,有可能影響服務(wù)器正常使用;提示等級表示目前存在的潛在問題,有可能影響服務(wù)器正常使用。
5.根據(jù)權(quán)利要求1所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制方法,其特征是所述根據(jù)問題告警等級判斷是否需要調(diào)整資源分配,包括:
6.一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置,基于lrm架構(gòu),進行多層次動態(tài)告警資源的調(diào)整分配,其特征是包括部署模塊、小告警系統(tǒng)和多層次告警系統(tǒng),
7.根據(jù)權(quán)利要求6所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置,其特征是所述部署模塊部署小告警處理系統(tǒng),包括:
8.根據(jù)權(quán)利要求6所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置,其特征是所述部署模塊部署多層次告警系統(tǒng),包括:部署多層次告警系統(tǒng)的嵌入式芯片組和嵌入式軟件,通過嵌入式芯片組采集整機的硬件基本數(shù)據(jù)并實時監(jiān)控各個服務(wù)刀片中的數(shù)據(jù);通過嵌入式軟件實時匯總各個服務(wù)刀片單元的小告警處理系統(tǒng)上報的信息,根據(jù)監(jiān)控的數(shù)據(jù)和上報的信息判斷當(dāng)前各個服務(wù)刀片單元是否存在問題。
9.根據(jù)權(quán)利要求6所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置,其特征是所述多層次告警系統(tǒng)根據(jù)對整機運行狀態(tài)影響的嚴重程度自動判斷問題告警等級,包括:將等級化分為四種,依次為危險、重要、一般、提示,危險等級表示問題為嚴重故障,服務(wù)器出現(xiàn)不可恢復(fù)的問題;重要等級表示問題相對嚴重,影響服務(wù)器的正常使用;一般等級表示問題不嚴重,有可能影響服務(wù)器正常使用;提示等級表示目前存在的潛在問題,有可能影響服務(wù)器正常使用。
10.根據(jù)權(quán)利要求6所述的一種基于lrm架構(gòu)的加固多單元服務(wù)器的管理控制裝置,其特征是所述多層次告警系統(tǒng)根據(jù)問題告警等級判斷是否需要調(diào)整資源分配,包括: