一種基于張量并行的聚合通信方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號(hào)：40625307發(fā)布日期：2025-01-10 18:31閱讀：2來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及數(shù)據(jù)處理，尤其涉及一種基于張量并行的聚合通信方法、裝置、設(shè)備及介質(zhì)。

背景技術(shù)：

1、隨著大型語(yǔ)言模型(language?model?with?lattice，llm)的廣泛應(yīng)用和發(fā)展，模型的規(guī)模越來越大，使得通過分布式系統(tǒng)構(gòu)建llm成為目前常用的做法。但是，若使用分布式系統(tǒng)構(gòu)建llm，需要在算法層面采用不同的并行拆分策略，特別是集合通信中耗時(shí)比較久的張量并行。

2、現(xiàn)有技術(shù)在生成張量并行的并行拆分策略時(shí)，通常集中在小模型的并行拆分策略。但是，隨著llm的增大，不同模型的取值不同，比如4卡、8卡、16卡或者32卡。若針對(duì)不同的模型均使用小模型的并行拆分策略，無法兼顧不同模型的需求，極大地降低了通信效率。因此，如何根據(jù)不同尺寸的模型對(duì)并行拆分的不同需求，實(shí)現(xiàn)張量并行的聚合通信，提高聚合通信的效率，是目前亟待解決的問題。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提供了一種基于張量并行的聚合通信方法、裝置、設(shè)備及介質(zhì)，可以解決張量并行的聚合通信效率較低的問題。

2、根據(jù)本發(fā)明的一方面，提供了一種基于張量并行的聚合通信方法，包括：

3、獲取目標(biāo)模型對(duì)應(yīng)的計(jì)算卡分布信息、并行輸出張量規(guī)模及全量并行輸出張量；其中，各個(gè)并行輸出張量分別存儲(chǔ)于目標(biāo)模型對(duì)應(yīng)的各個(gè)計(jì)算卡上；

4、基于所述并行輸出張量規(guī)模及預(yù)設(shè)規(guī)模閾值確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)拓?fù)溥壿嫞?/p>

5、基于所述目標(biāo)拓?fù)溥壿嫾八鲇?jì)算卡分布信息確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)主計(jì)算卡及目標(biāo)副計(jì)算卡；

6、基于所述目標(biāo)主計(jì)算卡的當(dāng)前編號(hào)確定全量并行輸出張量中目標(biāo)主計(jì)算卡上的第一張量分片及目標(biāo)副計(jì)算卡上的第二張量分片；

7、基于預(yù)設(shè)規(guī)約邏輯生成第一張量分片與各個(gè)第二張量分片間的目標(biāo)全規(guī)約鏈路，以使目標(biāo)主計(jì)算卡依據(jù)所述目標(biāo)全規(guī)約鏈路實(shí)現(xiàn)與目標(biāo)副計(jì)算卡間的聚合通信。

8、根據(jù)本發(fā)明的另一方面，提供了一種基于張量并行的聚合通信裝置，包括：

9、數(shù)據(jù)獲取模塊，用于獲取目標(biāo)模型對(duì)應(yīng)的計(jì)算卡分布信息、并行輸出張量規(guī)模及全量并行輸出張量；其中，各個(gè)并行輸出張量分別存儲(chǔ)于目標(biāo)模型對(duì)應(yīng)的各個(gè)計(jì)算卡上；

10、第一確定模塊，用于基于所述并行輸出張量規(guī)模及預(yù)設(shè)規(guī)模閾值確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)拓?fù)溥壿嫞?/p>

11、第二確定模塊，用于基于所述目標(biāo)拓?fù)溥壿嫾八鲇?jì)算卡分布信息確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)主計(jì)算卡及目標(biāo)副計(jì)算卡；

12、第三確定模塊，用于基于所述目標(biāo)主計(jì)算卡的當(dāng)前編號(hào)確定全量并行輸出張量中目標(biāo)主計(jì)算卡上的第一張量分片及目標(biāo)副計(jì)算卡上的第二張量分片；

13、聚合通信模塊，用于基于預(yù)設(shè)規(guī)約邏輯生成第一張量分片與各個(gè)第二張量分片間的目標(biāo)全規(guī)約鏈路，以使目標(biāo)主計(jì)算卡依據(jù)所述目標(biāo)全規(guī)約鏈路實(shí)現(xiàn)與目標(biāo)副計(jì)算卡間的聚合通信。

14、根據(jù)本發(fā)明的另一方面，提供了一種電子設(shè)備，所述電子設(shè)備包括：

15、至少一個(gè)處理器；以及

16、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器；其中，

17、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行，以使所述至少一個(gè)處理器能夠執(zhí)行本發(fā)明任一實(shí)施例所述的基于張量并行的聚合通信方法。

18、根據(jù)本發(fā)明的另一方面，提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令，所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明任一實(shí)施例所述的基于張量并行的聚合通信方法。

19、根據(jù)本發(fā)明的另一方面，提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明任一實(shí)施例所述的基于張量并行的聚合通信方法。

20、本發(fā)明實(shí)施例的技術(shù)方案，通過目標(biāo)模型對(duì)應(yīng)的并行輸出張量規(guī)模及預(yù)設(shè)規(guī)模閾值確定目標(biāo)拓?fù)溥壿?；進(jìn)而，基于目標(biāo)拓?fù)溥壿嫾澳繕?biāo)模型對(duì)應(yīng)的計(jì)算卡分布信息確定目標(biāo)主計(jì)算卡及目標(biāo)副計(jì)算卡，并基于目標(biāo)主計(jì)算卡的當(dāng)前編號(hào)確定目標(biāo)模型對(duì)應(yīng)的全量并行輸出張量中目標(biāo)主計(jì)算卡上的第一張量分片及目標(biāo)副計(jì)算卡上的第二張量分片；最后，基于預(yù)設(shè)規(guī)約邏輯生成第一張量分片與各個(gè)第二張量分片間的目標(biāo)全規(guī)約鏈路，以使目標(biāo)主計(jì)算卡依據(jù)目標(biāo)全規(guī)約鏈路實(shí)現(xiàn)與目標(biāo)副計(jì)算卡間的聚合通信。由于根據(jù)不同尺寸的模型對(duì)并行拆分的不同需求，可以針對(duì)聚合通信的通信范圍不同，采用不同的拓?fù)溥壿嫛Ｒ虼?，解決了張量并行的聚合通信效率較低的問題，能夠?qū)崿F(xiàn)張量并行的聚合通信，提高了聚合通信的效率。

21、應(yīng)當(dāng)理解，本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本發(fā)明的實(shí)施例的關(guān)鍵或重要特征，也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。

技術(shù)特征：

1.一種基于張量并行的聚合通信方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于所述并行輸出張量規(guī)模及預(yù)設(shè)規(guī)模閾值確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)拓?fù)溥壿?，包括?/p>

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，若目標(biāo)拓?fù)溥壿嫗闄C(jī)內(nèi)全規(guī)約邏輯，所述基于所述目標(biāo)拓?fù)溥壿嫾八鲇?jì)算卡分布信息確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)主計(jì)算卡及目標(biāo)副計(jì)算卡，包括：

4.根據(jù)權(quán)利要求2所述的方法，其特征在于，若目標(biāo)拓?fù)溥壿嫗闄C(jī)內(nèi)全規(guī)約邏輯，所述基于預(yù)設(shè)規(guī)約邏輯生成第一張量分片與各個(gè)第二張量分片間的目標(biāo)全規(guī)約鏈路，包括：

5.根據(jù)權(quán)利要求2所述的方法，其特征在于，若目標(biāo)拓?fù)溥壿嫗闄C(jī)間全規(guī)約邏輯，所述基于所述目標(biāo)拓?fù)溥壿嫾八鲇?jì)算卡分布信息確定所述目標(biāo)模型對(duì)應(yīng)的目標(biāo)主計(jì)算卡及目標(biāo)副計(jì)算卡，包括：

6.根據(jù)權(quán)利要求2所述的方法，其特征在于，若目標(biāo)拓?fù)溥壿嫗闄C(jī)間全規(guī)約邏輯，所述基于預(yù)設(shè)規(guī)約邏輯生成第一張量分片與各個(gè)第二張量分片間的目標(biāo)全規(guī)約鏈路，包括：

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，目標(biāo)主計(jì)算卡的端口組數(shù)及目標(biāo)副計(jì)算卡的端口組數(shù)均與所述計(jì)算卡分布信息中同一服務(wù)器內(nèi)的計(jì)算卡基礎(chǔ)數(shù)量存在預(yù)設(shè)關(guān)聯(lián)關(guān)系。

8.一種基于張量并行的聚合通信裝置，其特征在于，包括：

9.一種電子設(shè)備，其特征在于，所述電子設(shè)備包括：

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令，所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的基于張量并行的聚合通信方法。

技術(shù)總結(jié)
本發(fā)明公開了一種基于張量并行的聚合通信方法、裝置、設(shè)備及介質(zhì)。該方法包括：基于目標(biāo)模型對(duì)應(yīng)的并行輸出張量規(guī)模及預(yù)設(shè)規(guī)模閾值確定目標(biāo)拓?fù)溥壿?；基于目?biāo)拓?fù)溥壿嫾澳繕?biāo)模型對(duì)應(yīng)的計(jì)算卡分布信息確定目標(biāo)主計(jì)算卡及目標(biāo)副計(jì)算卡；基于目標(biāo)主計(jì)算卡的當(dāng)前編號(hào)確定目標(biāo)模型對(duì)應(yīng)的全量并行輸出張量中目標(biāo)主計(jì)算卡上的第一張量分片及目標(biāo)副計(jì)算卡上的第二張量分片；基于預(yù)設(shè)規(guī)約邏輯生成第一張量分片與各個(gè)第二張量分片間的目標(biāo)全規(guī)約鏈路，以使目標(biāo)主計(jì)算卡依據(jù)目標(biāo)全規(guī)約鏈路實(shí)現(xiàn)與目標(biāo)副計(jì)算卡間的聚合通信。通過本發(fā)明的技術(shù)方案，能夠根據(jù)不同尺寸的模型對(duì)并行拆分的不同需求，實(shí)現(xiàn)聚合通信，提高了聚合通信的效率。

技術(shù)研發(fā)人員：孟玉,劉彥,劉邦嵐,郭敬明,胡僑娟,李碩,胡淮
受保護(hù)的技術(shù)使用者：燧原智能科技（成都）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孟玉,劉彥,劉邦嵐,郭敬明,胡僑娟,李碩,胡淮
技術(shù)所有人：燧原智能科技（成都）有限公司
我是此專利的發(fā)明人

上一篇：一種新型螺母生產(chǎn)用冷鐓機(jī)的制作方法
上一篇：一種棉柔巾加工用包裝裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于張量并行的聚合通信方法、裝置、設(shè)備及介質(zhì)與流程

一種基于張量并行的聚合通信方法、裝置、設(shè)備及介質(zhì)與流程