一種存儲資源調(diào)度方法、裝置、存儲介質(zhì)及電子設(shè)備與流程

文檔序號：40451921發(fā)布日期：2024-12-27 09:16閱讀：10來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種存儲資源調(diào)度方法、裝置、存儲介質(zhì)及電子設(shè)備與流程

本說明書涉及計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)，尤其涉及一種存儲資源調(diào)度方法、裝置、存儲介質(zhì)及電子設(shè)備。

背景技術(shù)：

1、在人工智能（artificial?intelligence，ai）領(lǐng)域中，大模型已經(jīng)成為焦點(diǎn)技術(shù)和產(chǎn)業(yè)革命的重要驅(qū)動力量，然而，大模型的性能主要依賴于龐大的大模型參數(shù)量和訓(xùn)練數(shù)據(jù)集規(guī)模，而隨著大模型參數(shù)量和訓(xùn)練數(shù)據(jù)集規(guī)模的不斷增長，大模型訓(xùn)練對存儲資源的要求也顯著增加。

2、但是，由于目前所采用的面向云計(jì)算、高性能計(jì)算等場景設(shè)計(jì)的存儲技術(shù)并未針對大模型訓(xùn)練的特點(diǎn)進(jìn)行優(yōu)化設(shè)計(jì)，導(dǎo)致無法在大模型的訓(xùn)練過程中充分協(xié)調(diào)軟硬件資源，從而使得模型訓(xùn)練的效率降低，進(jìn)而使得模型訓(xùn)練存在時(shí)間長、能耗高、成本高等問題。

3、因此，如何能夠提升模型訓(xùn)練的效率，則是一個(gè)亟待解決的問題。

技術(shù)實(shí)現(xiàn)思路

1、本說明書提供一種存儲資源調(diào)度方法、裝置、存儲介質(zhì)及電子設(shè)備，以部分的解決現(xiàn)有技術(shù)存在的上述問題。

2、本說明書采用下述技術(shù)方案：

3、一種存儲資源調(diào)度方法，所述方法應(yīng)用于數(shù)據(jù)存儲系統(tǒng)，所述數(shù)據(jù)存儲系統(tǒng)中包含有各異構(gòu)存儲資源，所述各異構(gòu)存儲資源包括：設(shè)置于計(jì)算節(jié)點(diǎn)中的分布式內(nèi)存緩存模塊、持久性緩存模塊，設(shè)置于存儲節(jié)點(diǎn)中的并行文件系統(tǒng)；

4、在執(zhí)行針對目標(biāo)模型的訓(xùn)練任務(wù)的過程中，獲取目標(biāo)模型在當(dāng)前訓(xùn)練周期的狀態(tài)參數(shù)，并確定預(yù)設(shè)的每種異構(gòu)存儲資源的性能參數(shù)，作為各參考性能參數(shù)；

5、根據(jù)預(yù)設(shè)的處于不同狀態(tài)參數(shù)下的目標(biāo)模型和數(shù)據(jù)質(zhì)量參數(shù)不同的訓(xùn)練樣本數(shù)據(jù)之間的需求關(guān)系，以及所述目標(biāo)模型在當(dāng)前訓(xùn)練周期的狀態(tài)參數(shù)、所述目標(biāo)模型對應(yīng)的訓(xùn)練樣本集中未使用的訓(xùn)練樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量參數(shù)，確定所述目標(biāo)模型在下一訓(xùn)練周期所需的各訓(xùn)練樣本數(shù)據(jù)，作為各目標(biāo)訓(xùn)練樣本數(shù)據(jù)；

6、根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系，并確定按照所述存儲關(guān)系對所述各異構(gòu)存儲資源進(jìn)行調(diào)度后所述目標(biāo)模型的預(yù)估剩余訓(xùn)練時(shí)間；

7、以最小化所述預(yù)估剩余訓(xùn)練時(shí)間為優(yōu)化目標(biāo)，對所述存儲關(guān)系進(jìn)行調(diào)整，得到調(diào)整后的存儲關(guān)系，并按照所述調(diào)整后的存儲關(guān)系對所述各異構(gòu)存儲資源進(jìn)行調(diào)度，以通過調(diào)度后的數(shù)據(jù)存儲系統(tǒng)繼續(xù)執(zhí)行所述訓(xùn)練任務(wù)。

8、可選地，所述數(shù)據(jù)存儲系統(tǒng)中設(shè)置有各計(jì)算節(jié)點(diǎn)，所述針對目標(biāo)模型的訓(xùn)練任務(wù)包括：各子訓(xùn)練任務(wù)；

9、根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系，具體包括：

10、針對每個(gè)計(jì)算節(jié)點(diǎn)，確定所述各子訓(xùn)練任務(wù)中分配到該計(jì)算節(jié)點(diǎn)執(zhí)行的子訓(xùn)練任務(wù)，作為目標(biāo)子訓(xùn)練任務(wù)；

11、確定在所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)中包含的執(zhí)行所述目標(biāo)子訓(xùn)練任務(wù)所需的目標(biāo)訓(xùn)練樣本數(shù)據(jù)，作為該計(jì)算節(jié)點(diǎn)對應(yīng)的目標(biāo)訓(xùn)練樣本數(shù)據(jù)；

12、根據(jù)每個(gè)計(jì)算節(jié)點(diǎn)對應(yīng)的目標(biāo)訓(xùn)練樣本數(shù)據(jù)，以及所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每個(gè)計(jì)算節(jié)點(diǎn)中設(shè)置的每種異構(gòu)存儲資源中的存儲關(guān)系。

13、可選地，根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系，具體包括：

14、針對每個(gè)目標(biāo)訓(xùn)練樣本數(shù)據(jù)，確定該目標(biāo)訓(xùn)練樣本數(shù)據(jù)與其他目標(biāo)訓(xùn)練樣本數(shù)據(jù)之間的相似度；

15、根據(jù)每個(gè)目標(biāo)訓(xùn)練樣本數(shù)據(jù)與其他目標(biāo)訓(xùn)練樣本數(shù)據(jù)之間的相似度，將所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)劃分為各目標(biāo)訓(xùn)練樣本數(shù)據(jù)集，其中，針對每個(gè)目標(biāo)訓(xùn)練樣本數(shù)據(jù)集，該目標(biāo)訓(xùn)練樣本數(shù)據(jù)集中包含的各目標(biāo)訓(xùn)練樣本數(shù)據(jù)之間的相似度高于預(yù)設(shè)閾值；

16、根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)集在每種異構(gòu)存儲資源中的存儲關(guān)系。

17、可選地，所述分布式內(nèi)存緩存模塊包含有至少一種高性能存儲器件，其中，當(dāng)所述分布式內(nèi)存緩存模塊中包含的高性能存儲器件超過一種時(shí)，所述分布式內(nèi)存緩存模塊中的各高性能存儲器件之間高速互聯(lián)，所述持久性緩存模塊包含有至少一種非易失性存儲器件，所述并行文件系統(tǒng)包含有至少一種大容量存儲器件；

18、確定預(yù)設(shè)的每種異構(gòu)存儲資源的性能參數(shù)，作為各參考性能參數(shù)，具體包括：

19、確定所述高性能存儲器件的性能參數(shù)、確定所述非易失性存儲器件的性能參數(shù)以及確定所述大容量存儲器件的性能參數(shù)，作為各參考性能參數(shù)。

20、可選地，根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系，并確定按照所述存儲關(guān)系對所述各異構(gòu)存儲資源進(jìn)行調(diào)度后所述目標(biāo)模型的預(yù)估剩余訓(xùn)練時(shí)間，具體包括：

21、根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系；以及

22、根據(jù)所述各參考性能參數(shù)和預(yù)設(shè)的在不同的訓(xùn)練周期中所述目標(biāo)模型的各模型參數(shù)之間的依賴關(guān)系，確定所述目標(biāo)模型的模型參數(shù)在每種異構(gòu)存儲資源中的存儲關(guān)系；

23、確定根據(jù)所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系以及所述目標(biāo)模型的模型參數(shù)在每種異構(gòu)存儲資源中的存儲關(guān)系對所述各異構(gòu)存儲資源進(jìn)行調(diào)度后，所述目標(biāo)模型的預(yù)估剩余訓(xùn)練時(shí)間。

24、可選地，按照所述調(diào)整后的存儲關(guān)系對所述各異構(gòu)存儲資源進(jìn)行調(diào)度，具體包括：

25、根據(jù)所述調(diào)整后的存儲關(guān)系，確定每種異構(gòu)存儲資源的配置參數(shù)；

26、針對每種異構(gòu)存儲資源，根據(jù)該異構(gòu)存儲資源的配置參數(shù)，對該異構(gòu)存儲資源進(jìn)行配置，得到該異構(gòu)存儲資源對應(yīng)的配置后異構(gòu)存儲資源，并根據(jù)所述調(diào)整后存儲關(guān)系，將該異構(gòu)存儲資源中的數(shù)據(jù)卸載到其他異構(gòu)存儲資源中或從其他異構(gòu)存儲資源中讀取數(shù)據(jù)到該異構(gòu)存儲資源中。

27、可選地，所述持久性緩存模塊中還設(shè)有數(shù)據(jù)生成模型；

28、通過所述調(diào)度后的數(shù)據(jù)存儲系統(tǒng)繼續(xù)執(zhí)行所述訓(xùn)練任務(wù)，具體包括：

29、在通過所述調(diào)度后的數(shù)據(jù)存儲系統(tǒng)繼續(xù)執(zhí)行所述訓(xùn)練任務(wù)的過程中，若確定所述目標(biāo)模型的迭代次數(shù)未超過預(yù)設(shè)的次數(shù)閾值時(shí)，則獲取所述目標(biāo)模型對應(yīng)的訓(xùn)練樣本集中已使用的訓(xùn)練樣本數(shù)據(jù)，并根據(jù)所述已使用的訓(xùn)練樣本數(shù)據(jù)對所述數(shù)據(jù)生成模型的模型參數(shù)進(jìn)行調(diào)整，得到調(diào)整后的數(shù)據(jù)生成模型；

30、若確定所述目標(biāo)模型的迭代次數(shù)超過預(yù)設(shè)的次數(shù)閾值時(shí)，則在響應(yīng)于計(jì)算節(jié)點(diǎn)發(fā)送的訓(xùn)練樣本數(shù)據(jù)獲取請求的過程中，若確定所述分布式內(nèi)存緩存模塊以及所述持久性緩存模塊中不存在與所述訓(xùn)練樣本數(shù)據(jù)獲取請求相匹配的數(shù)據(jù)，則將所述訓(xùn)練樣本數(shù)據(jù)獲取請求輸入到所述調(diào)整后的數(shù)據(jù)生成模型中，以通過所述調(diào)整后的數(shù)據(jù)生成模型生成補(bǔ)充訓(xùn)練樣本數(shù)據(jù)，并根據(jù)所述補(bǔ)充訓(xùn)練樣本數(shù)據(jù)執(zhí)行針對所述目標(biāo)模型的訓(xùn)練任務(wù)。

31、本說明書提供了一種數(shù)據(jù)存儲裝置，所述裝置包括：

32、獲取模塊，用于在執(zhí)行針對目標(biāo)模型的訓(xùn)練任務(wù)的過程中，獲取目標(biāo)模型在當(dāng)前訓(xùn)練周期的狀態(tài)參數(shù)，確定預(yù)設(shè)的每種異構(gòu)存儲資源的性能參數(shù)，作為各參考性能參數(shù)；

33、第一確定模塊，用于根據(jù)預(yù)設(shè)的處于不同狀態(tài)參數(shù)下的目標(biāo)模型和數(shù)據(jù)質(zhì)量參數(shù)不同的訓(xùn)練樣本數(shù)據(jù)之間的需求關(guān)系，以及所述目標(biāo)模型在當(dāng)前訓(xùn)練周期的狀態(tài)參數(shù)、所述目標(biāo)模型對應(yīng)的訓(xùn)練樣本集中未使用的訓(xùn)練樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量參數(shù)，確定所述目標(biāo)模型在下一訓(xùn)練周期所需的各訓(xùn)練樣本數(shù)據(jù)，作為各目標(biāo)訓(xùn)練樣本數(shù)據(jù)；

34、第二確定模塊，用于根據(jù)所述各參考性能參數(shù)，確定所述各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系，并確定按照所述存儲關(guān)系對各異構(gòu)存儲資源進(jìn)行調(diào)度后所述目標(biāo)模型的預(yù)估剩余訓(xùn)練時(shí)間；

35、調(diào)整模塊，用于以最小化所述預(yù)估剩余訓(xùn)練時(shí)間為優(yōu)化目標(biāo)，對所述存儲關(guān)系進(jìn)行調(diào)整，得到調(diào)整后的存儲關(guān)系，并按照所述調(diào)整后的存儲關(guān)系對所述各異構(gòu)存儲資源進(jìn)行調(diào)度，以通過調(diào)度后的數(shù)據(jù)存儲系統(tǒng)繼續(xù)執(zhí)行所述訓(xùn)練任務(wù)。

36、本說明書提供了一種計(jì)算機(jī)可讀存儲介質(zhì)，所述存儲介質(zhì)存儲有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述存儲資源調(diào)度方法。

37、本說明書提供了一種電子設(shè)備，包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)上述存儲資源調(diào)度方法。

38、本說明書采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果：

39、在本說明書提供的方法中，在執(zhí)行針對目標(biāo)模型的訓(xùn)練任務(wù)的過程中，獲取目標(biāo)模型在當(dāng)前訓(xùn)練周期的狀態(tài)參數(shù)，并確定預(yù)設(shè)的每種異構(gòu)存儲資源的性能參數(shù)，作為各參考性能參數(shù)，根據(jù)預(yù)設(shè)的處于不同狀態(tài)參數(shù)下的目標(biāo)模型和數(shù)據(jù)質(zhì)量參數(shù)不同的訓(xùn)練樣本數(shù)據(jù)之間的需求關(guān)系，以及目標(biāo)模型在當(dāng)前訓(xùn)練周期的狀態(tài)參數(shù)，目標(biāo)模型對應(yīng)的訓(xùn)練樣本集中未使用的訓(xùn)練樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量參數(shù)，確定目標(biāo)模型在下一訓(xùn)練周期所需的各訓(xùn)練樣本數(shù)據(jù)，作為各目標(biāo)訓(xùn)練樣本數(shù)據(jù)，根據(jù)各參考性能參數(shù)，確定各目標(biāo)訓(xùn)練樣本數(shù)據(jù)在每種異構(gòu)存儲資源中的存儲關(guān)系，并確定按照存儲關(guān)系對各異構(gòu)存儲資源進(jìn)行調(diào)度后目標(biāo)模型的預(yù)估剩余訓(xùn)練時(shí)間，以最小化預(yù)估剩余訓(xùn)練時(shí)間為優(yōu)化目標(biāo)，對存儲關(guān)系進(jìn)行調(diào)整，得到調(diào)整后的存儲關(guān)系，并按照調(diào)整后的存儲關(guān)系對各異構(gòu)存儲資源進(jìn)行調(diào)度。

40、從上述方法可以看出，可以通過預(yù)先構(gòu)建的包含有多級分層的數(shù)據(jù)存儲系統(tǒng)，執(zhí)行針對目標(biāo)模型的訓(xùn)練任務(wù)，并在執(zhí)行針對目標(biāo)模型的訓(xùn)練任務(wù)的過程中，可以基于預(yù)先確定的不同訓(xùn)練樣本的數(shù)據(jù)質(zhì)量參數(shù)，以及目標(biāo)模型在不同的訓(xùn)練周期的不同的狀態(tài)參數(shù)下對數(shù)據(jù)質(zhì)量不同的訓(xùn)練樣本數(shù)據(jù)的需求，對設(shè)置于不同分層中的不同異構(gòu)存儲資源進(jìn)行調(diào)度管理，以提升水平方向的數(shù)據(jù)存取效率，從而可以從橫縱兩方面全面提升數(shù)據(jù)的存取效率，進(jìn)而可以提升模型的訓(xùn)練效率。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：程穩(wěn),楊弢,梅飛,何水兵,朱曉明,曾令仿
技術(shù)所有人：之江實(shí)驗(yàn)室
我是此專利的發(fā)明人

上一篇：一種教學(xué)詞匯展示裝置的制作方法
上一篇：一種車輛閘機(jī)布線裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種存儲資源調(diào)度方法、裝置、存儲介質(zhì)及電子設(shè)備與流程

一種存儲資源調(diào)度方法、裝置、存儲介質(zhì)及電子設(shè)備與流程