本申請(qǐng)涉及計(jì)算機(jī),尤其涉及一種設(shè)備配置回歸方法及相關(guān)裝置。
背景技術(shù):
1、隨著人工智能(artificial?intelligence,ai)技術(shù)的不斷發(fā)展,ai模型在很多業(yè)務(wù)中被廣泛應(yīng)用;并且隨著業(yè)務(wù)對(duì)相關(guān)服務(wù)的要求的提高,參數(shù)量大、性能優(yōu)良的ai大模型逐漸興起。由于ai大模型的訓(xùn)練參數(shù)量大,并且訓(xùn)練過程中交換數(shù)據(jù)的規(guī)模量高,因此需要使用算力規(guī)模大的計(jì)算設(shè)備執(zhí)行此類訓(xùn)練任務(wù),此類計(jì)算設(shè)備的單機(jī)配置普遍較高,且使用成本較高。
2、為了使上述計(jì)算設(shè)備的算力資源得到充分利用,避免因算力空閑而產(chǎn)生成本浪費(fèi),往往需要在此類計(jì)算設(shè)備上實(shí)現(xiàn)算力資源的共享流轉(zhuǎn),即在利用計(jì)算設(shè)備完成對(duì)于某ai模型的訓(xùn)練任務(wù)后,繼續(xù)利用該計(jì)算設(shè)備的算力資源執(zhí)行其它的ai模型的訓(xùn)練任務(wù)。
3、然而,訓(xùn)練不同ai模型時(shí)依賴的基礎(chǔ)環(huán)境配置可能不同,且不同的基礎(chǔ)環(huán)境配置可能會(huì)干擾其它ai模型的正常訓(xùn)練。因此,如何在實(shí)現(xiàn)計(jì)算設(shè)備的算力資源的共享流轉(zhuǎn)時(shí),避免使之前訓(xùn)練ai模型時(shí)的基礎(chǔ)環(huán)境配置對(duì)之后將要執(zhí)行的ai模型訓(xùn)練任務(wù)產(chǎn)生影響,是目前亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供了一種設(shè)備配置回歸方法及相關(guān)裝置,能夠在實(shí)現(xiàn)計(jì)算設(shè)備的算力資源的共享流轉(zhuǎn)時(shí),避免使之前訓(xùn)練ai模型時(shí)的基礎(chǔ)環(huán)境配置對(duì)之后將要執(zhí)行的ai模型訓(xùn)練任務(wù)產(chǎn)生影響。
2、本申請(qǐng)第一方面提供了一種設(shè)備配置回歸方法,所述方法包括:
3、獲取基礎(chǔ)容器配置信息、基礎(chǔ)系統(tǒng)配置信息和參考網(wǎng)絡(luò)配置信息;所述基礎(chǔ)容器配置信息是原始的容器環(huán)境的配置信息,所述基礎(chǔ)系統(tǒng)配置信息是原始的系統(tǒng)參數(shù)的配置信息,所述參考網(wǎng)絡(luò)配置信息是在原始的網(wǎng)絡(luò)參數(shù)的配置信息的基礎(chǔ)上確定的;
4、針對(duì)待共享算力資源的目標(biāo)計(jì)算設(shè)備,將所述目標(biāo)計(jì)算設(shè)備中目標(biāo)容器對(duì)應(yīng)的目標(biāo)容器配置信息和所述基礎(chǔ)容器配置信息進(jìn)行對(duì)比,根據(jù)對(duì)比結(jié)果,對(duì)所述目標(biāo)容器進(jìn)行容器配置回歸處理;
5、基于所述基礎(chǔ)系統(tǒng)配置信息,對(duì)所述目標(biāo)計(jì)算設(shè)備的系統(tǒng)參數(shù)配置進(jìn)行系統(tǒng)配置回歸處理;
6、基于所述參考網(wǎng)絡(luò)配置信息,對(duì)所述目標(biāo)計(jì)算設(shè)備的網(wǎng)絡(luò)參數(shù)配置進(jìn)行網(wǎng)絡(luò)配置回歸處理。
7、本申請(qǐng)第二方面提供了一種設(shè)備配置回歸裝置,所述裝置包括:
8、基礎(chǔ)信息獲取模塊,用于獲取基礎(chǔ)容器配置信息、基礎(chǔ)系統(tǒng)配置信息和參考網(wǎng)絡(luò)配置信息;所述基礎(chǔ)容器配置信息是原始的容器環(huán)境的配置信息,所述基礎(chǔ)系統(tǒng)配置信息是原始的系統(tǒng)參數(shù)的配置信息,所述參考網(wǎng)絡(luò)配置信息是在原始的網(wǎng)絡(luò)參數(shù)的配置信息的基礎(chǔ)上確定的;
9、容器回歸模塊,用于針對(duì)待共享算力資源的目標(biāo)計(jì)算設(shè)備,將所述目標(biāo)計(jì)算設(shè)備中目標(biāo)容器對(duì)應(yīng)的目標(biāo)容器配置信息和所述基礎(chǔ)容器配置信息進(jìn)行對(duì)比,根據(jù)對(duì)比結(jié)果,對(duì)所述目標(biāo)容器進(jìn)行容器配置回歸處理;
10、系統(tǒng)參數(shù)回歸模塊,用于基于所述基礎(chǔ)系統(tǒng)配置信息,對(duì)所述目標(biāo)計(jì)算設(shè)備的系統(tǒng)參數(shù)配置進(jìn)行系統(tǒng)配置回歸處理;
11、網(wǎng)絡(luò)參數(shù)回歸模塊,用于基于所述參考網(wǎng)絡(luò)配置信息,對(duì)所述目標(biāo)計(jì)算設(shè)備的網(wǎng)絡(luò)參數(shù)配置進(jìn)行網(wǎng)絡(luò)配置回歸處理。
12、本申請(qǐng)第三方面提供了一種計(jì)算機(jī)設(shè)備,所述設(shè)備包括處理器和存儲(chǔ)器:
13、所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序;
14、所述處理器用于根據(jù)所述計(jì)算機(jī)程序,執(zhí)行如上述第一方面所述的設(shè)備配置回歸方法的步驟。
15、本申請(qǐng)第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行上述第一方面所述的設(shè)備配置回歸方法的步驟。
16、本申請(qǐng)第五方面提供了一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令,處理器執(zhí)行該計(jì)算機(jī)指令,使得該計(jì)算機(jī)設(shè)備執(zhí)行上述第一方面所述的設(shè)備配置回歸方法的步驟。
17、從以上技術(shù)方案可以看出,本申請(qǐng)實(shí)施例具有以下優(yōu)點(diǎn):
18、在本申請(qǐng)實(shí)施例提供的設(shè)備配置回歸方法中,在目標(biāo)計(jì)算設(shè)備進(jìn)行算力共享流轉(zhuǎn)前,基于相應(yīng)的配置信息,對(duì)該目標(biāo)計(jì)算設(shè)備進(jìn)行配置回歸處理。具體的,在該方法中,可以先獲取基礎(chǔ)容器配置信息、基礎(chǔ)系統(tǒng)配置信息和參考網(wǎng)絡(luò)配置信息,其中,基礎(chǔ)容器配置信息是原始的容器環(huán)境的配置信息,基礎(chǔ)系統(tǒng)配置信息是原始的系統(tǒng)參數(shù)的配置信息,參考網(wǎng)絡(luò)配置信息是在原始的網(wǎng)絡(luò)參數(shù)的配置信息的基礎(chǔ)上確定的;然后,基于基礎(chǔ)容器配置信息,對(duì)目標(biāo)計(jì)算設(shè)備中的目標(biāo)容器進(jìn)行容器配置回歸處理,基于基礎(chǔ)系統(tǒng)配置信息,對(duì)目標(biāo)計(jì)算設(shè)備的系統(tǒng)參數(shù)配置進(jìn)行系統(tǒng)配置回歸處理,基于參考網(wǎng)絡(luò)配置信息,對(duì)目標(biāo)計(jì)算設(shè)備的網(wǎng)絡(luò)參數(shù)配置進(jìn)行網(wǎng)絡(luò)配置回歸處理。如此,在目標(biāo)計(jì)算設(shè)備進(jìn)行算力共享流轉(zhuǎn)前,基于上述基礎(chǔ)容器配置信息、基礎(chǔ)系統(tǒng)配置信息和參考網(wǎng)絡(luò)配置信息,將目標(biāo)計(jì)算設(shè)備的容器環(huán)境配置、系統(tǒng)參數(shù)配置和網(wǎng)絡(luò)參數(shù)配置均回歸至對(duì)應(yīng)的初始狀態(tài),從而避免此前在目標(biāo)計(jì)算設(shè)備上執(zhí)行的ai訓(xùn)練任務(wù)的基礎(chǔ)環(huán)境配置對(duì)此后執(zhí)行的ai訓(xùn)練任務(wù)產(chǎn)生干擾;此外,基于相應(yīng)的配置信息對(duì)目標(biāo)計(jì)算設(shè)備進(jìn)行配置回歸處理,可以更高效地還原目標(biāo)計(jì)算設(shè)備的相關(guān)配置,減少算力資源的損失。
1.一種設(shè)備配置回歸方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述參考網(wǎng)絡(luò)配置信息是根據(jù)基于所述原始的網(wǎng)絡(luò)參數(shù)的配置信息執(zhí)行的網(wǎng)絡(luò)調(diào)優(yōu)操作確定的,所述參考網(wǎng)絡(luò)配置信息包括各個(gè)網(wǎng)絡(luò)配置項(xiàng)各自對(duì)應(yīng)的固化配置信息、以及至少一個(gè)網(wǎng)絡(luò)配置項(xiàng)對(duì)應(yīng)的暫存配置信息,所述暫存配置信息是通過歷史的所述網(wǎng)絡(luò)調(diào)優(yōu)操作確定的能夠優(yōu)化網(wǎng)絡(luò)性能的配置信息;
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述將所述目標(biāo)計(jì)算設(shè)備中目標(biāo)容器對(duì)應(yīng)的目標(biāo)容器配置信息和所述基礎(chǔ)容器配置信息進(jìn)行對(duì)比前,所述方法還包括:
5.根據(jù)權(quán)利要求1或4所述的方法,其特征在于,所述將所述目標(biāo)計(jì)算設(shè)備中目標(biāo)容器對(duì)應(yīng)的目標(biāo)容器配置信息和所述基礎(chǔ)容器配置信息進(jìn)行對(duì)比,根據(jù)對(duì)比結(jié)果,對(duì)所述目標(biāo)容器進(jìn)行容器配置回歸處理,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述基礎(chǔ)系統(tǒng)配置信息,對(duì)所述目標(biāo)計(jì)算設(shè)備的系統(tǒng)參數(shù)配置進(jìn)行系統(tǒng)配置回歸處理,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
8.一種設(shè)備配置回歸裝置,其特征在于,所述裝置包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括處理器及存儲(chǔ)器;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行權(quán)利要求1至7中任一項(xiàng)所述的設(shè)備配置回歸方法。