本技術(shù)涉及服務器,尤其涉及一種集群功率封頂值的配置方法和計算設備。
背景技術(shù):
1、服務器集群因其較高的運算速度,在處理大規(guī)??茖W問題和龐大的數(shù)據(jù)集方面發(fā)揮著重要作用。隨著計算機技術(shù)的進步,服務器集群的計算密度隨之增加,服務器集群的功率消耗也隨之增長。
2、相關技術(shù)中,通過對服務器集群的功率封頂值進行限制,降低服務器集群的整體功率損耗。然而,對服務器集群的功率封頂值進行限制的方式,導致服務器集群內(nèi)計算節(jié)點的功率封頂值配置不合理,進而影響計算節(jié)點的運行效率。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供一種集群功率封頂值的配置方法和計算設備,通過對集群間的各個計算節(jié)點的功率封頂值進行配置,合理配置集群內(nèi)各計算節(jié)點的功率封頂值,提高計算節(jié)點的運行效率。
2、第一方面,本技術(shù)實施例提供一種集群功率封頂值的配置方法,獲取多個集群分別對應的功率封頂值;在多個集群分別對應的功率封頂值之和大于電源的最大輸出功率的情況下,降低一個或多個集群對應的功率封頂值;其中,集群降低后的功率封頂值大于或等于對應的集群中各計算節(jié)點的最小運行功率之和;針對多個集群中的各集群,分別根據(jù)集群最新的功率封頂值和集群中各計算節(jié)點運行的cpu核數(shù),配置相應計算節(jié)點的功率封頂值;其中,各計算節(jié)點的功率封頂值均大于或等于各自對應的最小運行功率。
3、本技術(shù)實施例中,當集群的功率封頂值之和大于電源的最大輸出功率時,降低一個或多個集群的功率封頂值,使得集群的功率封頂值之和小于或等于電源的最大輸出功率,進而使得各個集群正常運行。除此之外,本技術(shù)實施例在降低集群的功率封頂值時,考慮集群內(nèi)各計算節(jié)點的最小運行功率,在保障集群內(nèi)各個計算節(jié)點的運行的情況下,進一步通過集群內(nèi)各計算節(jié)點運行的cpu核數(shù),即計算節(jié)點的運行情況對計算節(jié)點的功率封頂值進行合理配置,提高各計算節(jié)點的運行效率。
4、可選地,按照各集群的優(yōu)先級從低到高的順序,降低一個或多個集群對應的功率封頂值;其中,集群的優(yōu)先級為基于集群所承擔的業(yè)務的重要性確定的。
5、本技術(shù)實施例中,優(yōu)先降低優(yōu)先級較低的集群的功率封頂值,盡量保持優(yōu)先級較高的集群的功率封頂值,使得優(yōu)先級較高的集群中的重要業(yè)務可以被順利執(zhí)行。
6、可選地,查詢多個集群分別對應的功率封頂值數(shù)據(jù)表,獲取當前時段各集群對應的功率封頂值;其中,功率封頂值數(shù)據(jù)表包括對應的集群在各個時段的功率封頂值。
7、本技術(shù)實施例中,可以分別為各個時段的設置不同功率封頂值。例如,用電高峰時段在保證各個集群正常運行的情況下為各個集群設置相對較低的功率封頂值,降低各集群的運行成本。
8、可選地,獲取各集群各自對應的平均運行功率,并分別將各平均運行功率作為對應的集群的功率封頂值。
9、本技術(shù)實施例中,通過將集群的平均運行功率作為集群的功率封頂值,在滿足集群內(nèi)計算節(jié)點以最小運行功率的前提下,可以提高集群內(nèi)計算節(jié)點的運行效率。
10、可選地,按照集群中各計算節(jié)點對應的最小運行功率,為對應的計算節(jié)點設置功率封頂值初始值;在集群的功率封頂值大于各計算節(jié)點的最小運行功率總和的情況下,根據(jù)各計算節(jié)點運行的cpu核數(shù)和剩余的功率指標,調(diào)整各計算節(jié)點的功率封頂值初始值;其中,剩余的功率指標為集群的功率封頂值超過各計算節(jié)點的最小運行功率總和的部分。
11、本技術(shù)實施例中,首先按照計算節(jié)點的最小運行功率將集群的功率封頂值分配給各個計算節(jié)點,保障個計算節(jié)點可以正常運行;然后,將未被分配的集群的功率指標按照各個計算節(jié)點運行的cpu核數(shù),即計算節(jié)點的運行情況為各個計算節(jié)點動態(tài)分配功率封頂值,保障各個計算節(jié)點的性能。
12、可選地,獲取各集群可借出的功率指標或需借入的功率指標;其中,可借入出功率指標的集群作為第一類集群,需借入功率指標的集群作為第二類集群;將各第一類集群可借出的功率指標總和分配給各第二類集群。
13、本技術(shù)實施例中,通過在集群間進行功率指標的借調(diào),對于第一類集群,在保障本集群正常運行的情況下,將多余的功率指標借出給第二類集群,可以提高功率的利用率;對于第二類集群,通過借入功率指標,可以提高第二類集群的性能。
14、可選地,獲取各集群中正在運行的計算節(jié)點可借出的功率指標或需借入的功率指標;其中,計算節(jié)點可借出的功率指標為計算節(jié)點的功率封頂值超過計算節(jié)點的最大運行功率的部分,可借入出功率指標的計算節(jié)點作為第一類計算節(jié)點;計算節(jié)點需借入的功率指標為計算節(jié)點的平均運行功率超過計算節(jié)點的功率封頂值的部分,需借入功率指標的計算節(jié)點作為第二類計算節(jié)點;針對任一集群,根據(jù)集群中所有第一類計算節(jié)點可借出的功率指標總和,以及所有第二類計算節(jié)點需借入的功率指標總和,得到集群可借出的功率指標;其中,集群可借出的功率指標為所有第一類計算節(jié)點可借出的功率指標總和超過所有第二類計算節(jié)點需借入的功率指標總和的部分。
15、可選地,獲取各集群中正在運行的計算節(jié)點可借出的功率指標或需借入的功率指標;其中,計算節(jié)點可借出的功率指標為計算節(jié)點的功率封頂值超過計算節(jié)點的最大運行功率的部分,可借入出功率指標的計算節(jié)點作為第一類計算節(jié)點;計算節(jié)點需借入的功率指標為計算節(jié)點的平均運行功率超過計算節(jié)點的功率封頂值的部分,需借入功率指標的計算節(jié)點作為第二類計算節(jié)點;針對任一集群,根據(jù)集群中所有第一類計算節(jié)點可借出的功率指標總和,以及所有第二類計算節(jié)點需借入的功率指標總和,得到集群需借入的功率指標;其中,集群需借入的功率指標為各所有第二類計算節(jié)點需借入的功率指標總和超過所有第一類計算節(jié)點可借出的功率指標總和的部分。
16、可選地,按照各第二類集群的優(yōu)先級從高到低的順序,將各第一類集群可借出的功率指標總和分配給一個或多個第二類集群。
17、本技術(shù)實施例中,優(yōu)先級較高的第二類集群可以優(yōu)先得到其所需借入的功率指標,保障集群內(nèi)的重要業(yè)務被順利執(zhí)行。
18、可選地,根據(jù)第二類集群分配到的功率指標和正在運行的各計算節(jié)點的平均運行功率,調(diào)整對應的各計算節(jié)點的功率封頂值。
19、本技術(shù)實施例中,對于功率封頂值小于平均運行功率的計算節(jié)點,通過將功率封頂值調(diào)整為平均運行功率,提高計算節(jié)點的運行效率以及計算節(jié)點的可靠性。
20、可選地,根據(jù)正在運行的各計算節(jié)點的平均運行功率,調(diào)整對應的各計算節(jié)點的功率封頂值。
21、第二方面,本技術(shù)實施例提供一種集群功率封頂值的配置裝置,包括獲取模塊、削減模塊和配置模塊;其中,獲取模塊,用于獲取多個集群分別對應的功率封頂值;削減模塊,用于在多個集群分別對應的功率封頂值之和大于電源的最大輸出功率的情況下,降低一個或多個集群對應的功率封頂值;其中,集群降低后的功率封頂值大于或等于對應的集群中各計算節(jié)點的最小運行功率之和;配置模塊,用于針對多個集群中的各集群,分別根據(jù)集群最新的功率封頂值和集群中各計算節(jié)點運行的cpu核數(shù),配置相應計算節(jié)點的功率封頂值;其中,各計算節(jié)點的功率封頂值均大于或等于各自對應的最小運行功率。
22、第三方面,本技術(shù)實施例提供一種計算設備,包括:至少一個存儲器,用于存儲程序;至少一個處理器,用于執(zhí)行存儲器存儲的程序;其中,當存儲器存儲的程序被執(zhí)行時,處理器用于執(zhí)行如第一方面任一實施例所述的集群功率封頂值的配置方法。
23、第四方面,本技術(shù)實施例提供一種數(shù)據(jù)中心,包括多個集群和管理節(jié)點;管理節(jié)點,用于執(zhí)行第一方面任一實施例所述的集群功率封頂值的配置方法。
24、第五方面,本技術(shù)實施例提供一種數(shù)據(jù)中心,包括多個集群,每個集群均包括多個計算節(jié)點,其中的一個計算節(jié)點作為管理節(jié)點;管理節(jié)點,用于執(zhí)行第一方面任一實施例所述的集群功率封頂值的配置方法。
25、第六方面,本技術(shù)實施例提供一種計算機程序產(chǎn)品,當其在計算設備上運行時,執(zhí)行如第一方面任一實施例所述的集群功率封頂值的配置方法。