欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于可擴(kuò)展分塊交叉開關(guān)的方法與流程

文檔序號(hào):40584772發(fā)布日期:2025-01-07 20:24閱讀:6來源:國知局
用于可擴(kuò)展分塊交叉開關(guān)的方法與流程

本申請(qǐng)涉及交叉開關(guān),例如涉及一種用于可擴(kuò)展分塊交叉開關(guān)的方法。


背景技術(shù):

1、gpgpu憑借其強(qiáng)大的計(jì)算能力、超高并行數(shù)據(jù)處理效率和巨大的數(shù)據(jù)吞吐量,在處理高數(shù)據(jù)量、計(jì)算密集型的任務(wù)中表現(xiàn)出色。其核心架構(gòu)包括以陣列方式排布的多個(gè)流多處理器(sm),這些處理器通過高效的片上互聯(lián)網(wǎng)絡(luò)與l2高速緩存進(jìn)行數(shù)據(jù)交互,確保了計(jì)算任務(wù)的流暢執(zhí)行。

2、考慮到gpgpu的計(jì)算單元間獨(dú)立性高,數(shù)據(jù)交互少,其互聯(lián)網(wǎng)絡(luò)的設(shè)計(jì)主要聚焦于優(yōu)化計(jì)算單元與共享l2高速緩存之間的連接效率。在此背景下,交叉開關(guān)作為一種無阻塞的拓?fù)浣Y(jié)構(gòu)被廣泛采用,以提高數(shù)據(jù)傳輸效率。

3、然而,傳統(tǒng)的交叉開關(guān)設(shè)計(jì)受限于vlsi的可擴(kuò)展性問題,特別是引腳數(shù)量和布線面積的限制,這在gpgpu中,尤其是在擁有大量sm核和較大l2存儲(chǔ)空間時(shí),成為一個(gè)顯著的挑戰(zhàn)。

4、需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強(qiáng)對(duì)本申請(qǐng)的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。


技術(shù)實(shí)現(xiàn)思路

1、為了對(duì)披露的實(shí)施例的一些方面有基本的理解,下面給出了簡(jiǎn)單的概括。所述概括不是泛泛評(píng)述,也不是要確定關(guān)鍵/重要組成元素或描繪這些實(shí)施例的保護(hù)范圍,而是作為后面的詳細(xì)說明的序言。

2、本公開實(shí)施例提供了一種用于可擴(kuò)展分塊交叉開關(guān)的方法,提高了gpgpu的性能。

3、在一些實(shí)施例中,所述方法包括:

4、分組與映射實(shí)施:根據(jù)gpgpu中sm核的數(shù)量和布局,確定分組參數(shù),并進(jìn)行sm核與l2緩存組的映射;

5、互聯(lián)網(wǎng)絡(luò)構(gòu)建實(shí)施:設(shè)計(jì)并構(gòu)建多個(gè)子互聯(lián)網(wǎng)絡(luò),每個(gè)子互聯(lián)網(wǎng)絡(luò)包含適當(dāng)數(shù)量的數(shù)據(jù)鏈路和交叉開關(guān)配置,在sm側(cè)和l2緩存?zhèn)确謩e部署網(wǎng)外計(jì)算節(jié)點(diǎn)和網(wǎng)外存儲(chǔ)節(jié)點(diǎn),確保數(shù)據(jù)的順暢傳輸;

6、優(yōu)化與測(cè)試實(shí)施:對(duì)互聯(lián)網(wǎng)絡(luò)進(jìn)行仿真測(cè)試,根據(jù)測(cè)試結(jié)果對(duì)分組參數(shù)、交叉開關(guān)配置進(jìn)行優(yōu)化調(diào)整。

7、可選地,所述分組與映射實(shí)施包括分組管理,所述分組管理包括:

8、對(duì)于gpgpu中共計(jì)k個(gè)sm核,每相鄰k個(gè)sm核被分為一個(gè)sm組,共分為m組,其中k×m=k;

9、相應(yīng)地,整個(gè)l2緩存地址空間基于其物理位置也被劃分m組,以保證對(duì)于第i個(gè)sm組,i∈[0,m],與其對(duì)應(yīng)的第i個(gè)l2緩存組在所有緩存組中與其物理距離最近,通信成本最低。

10、可選地,第i個(gè)sm組所涉及的數(shù)據(jù)和指令資料中的主要存儲(chǔ)在第i個(gè)l2緩存組中,以使sm組與l2緩存之間的數(shù)據(jù)交互主要在最短的數(shù)據(jù)鏈路上完成。

11、可選地,基于交叉開關(guān)串聯(lián)形成間接數(shù)據(jù)鏈路。

12、可選地,去除非對(duì)應(yīng)組間的直接數(shù)據(jù)鏈路,非對(duì)應(yīng)組間通過間接數(shù)據(jù)鏈路進(jìn)行數(shù)據(jù)交互。

13、可選地,所述互聯(lián)網(wǎng)絡(luò)構(gòu)建實(shí)施包括:

14、將整個(gè)互聯(lián)網(wǎng)絡(luò)劃分為m個(gè)子互聯(lián)網(wǎng)絡(luò);

15、每個(gè)子網(wǎng)絡(luò)都采用交叉開關(guān)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并包含n個(gè)數(shù)據(jù)鏈路,每個(gè)數(shù)據(jù)鏈路對(duì)應(yīng)l2緩存組的部分地址空間,其中,n<m。

16、可選地,所述sm組共有n個(gè)節(jié)點(diǎn)接入互聯(lián)網(wǎng)絡(luò);n個(gè)sm組側(cè)節(jié)點(diǎn)被進(jìn)一步分組,每組兩個(gè)節(jié)點(diǎn);組節(jié)點(diǎn)僅可以對(duì)對(duì)應(yīng)的兩個(gè)緩存組節(jié)點(diǎn)發(fā)起訪存請(qǐng)求;m個(gè)sm核和n個(gè)節(jié)點(diǎn)的映射關(guān)系通過組內(nèi)網(wǎng)絡(luò)及仲裁器決定。

17、可選地,在sm側(cè),子互聯(lián)網(wǎng)絡(luò)還包含一個(gè)網(wǎng)外計(jì)算節(jié)點(diǎn),用以發(fā)起一個(gè)來自其他sm組的訪存請(qǐng)求,子互聯(lián)網(wǎng)絡(luò)控制器被配置為網(wǎng)外計(jì)算節(jié)點(diǎn)和其他n個(gè)端口節(jié)點(diǎn)彼此等價(jià),優(yōu)先級(jí)相同;在l2緩存?zhèn)?,包括?dāng)前緩存組的n個(gè)端口節(jié)點(diǎn)和一個(gè)網(wǎng)外存儲(chǔ)節(jié)點(diǎn),網(wǎng)外存儲(chǔ)節(jié)點(diǎn)用以處理向其他緩存組提起的訪存請(qǐng)求;對(duì)于目標(biāo)緩存組位于子互聯(lián)網(wǎng)絡(luò)外的所有訪存任務(wù),請(qǐng)求數(shù)據(jù)均通過網(wǎng)外存儲(chǔ)節(jié)點(diǎn)離開子互聯(lián)網(wǎng)絡(luò),該端口節(jié)點(diǎn)等價(jià)于其他存儲(chǔ)側(cè)端口節(jié)點(diǎn)。

18、可選地,每個(gè)互聯(lián)網(wǎng)絡(luò)承擔(dān)(n+1)×(n+1)的數(shù)據(jù)通信任務(wù)。

19、可選地,交叉開關(guān)包括2×3交叉開關(guān)和1×(n+1)交叉開關(guān);2×3交叉開關(guān)用于承擔(dān)每組節(jié)點(diǎn)與對(duì)應(yīng)緩存組節(jié)點(diǎn)間的互聯(lián)任務(wù);1×(n+1)交叉開關(guān)用于網(wǎng)外計(jì)算節(jié)點(diǎn)與任一緩存組節(jié)點(diǎn)或下一個(gè)子互聯(lián)網(wǎng)絡(luò)的互聯(lián)。

20、本公開實(shí)施例提供的用于可擴(kuò)展分塊交叉開關(guān)的方法,可以實(shí)現(xiàn)以下技術(shù)效果:

21、本發(fā)明基于gpgpu中sm核的數(shù)量和布局,確定分組參數(shù),并進(jìn)行sm核與l2緩存組的映射,創(chuàng)新性地提出了一種位置感知的存儲(chǔ)方案,并基于此設(shè)計(jì)了可擴(kuò)展的分塊交叉開關(guān)。

22、通過在靠近存儲(chǔ)空間附近執(zhí)行運(yùn)算,降低了數(shù)據(jù)緩存和傳輸過程中的資源消耗,進(jìn)一步優(yōu)化了gpgpu的性能。隨著sm核數(shù)量的增加,全連接的互聯(lián)網(wǎng)絡(luò)模式會(huì)帶來巨大的資源消耗和網(wǎng)絡(luò)復(fù)雜度。而本方案通過優(yōu)化的存儲(chǔ)設(shè)計(jì)和可擴(kuò)展的分塊交叉開關(guān),有效緩解了l2緩存和sm核間互聯(lián)網(wǎng)絡(luò)的壓力。

23、值得一提的是,即使在全連接的交叉開關(guān)網(wǎng)絡(luò)中,物理位置相距較遠(yuǎn)的sm核與l2緩存地址之間的通信也需要經(jīng)過長距離、高損耗、高延遲的數(shù)據(jù)鏈路。而本方案通過位置感知的存儲(chǔ)策略,減少了這類長距離通信的需求,進(jìn)一步提升了gpgpu的運(yùn)算效率和響應(yīng)速度。這一創(chuàng)新設(shè)計(jì)不僅提升了gpgpu的性能,也展示了其在處理大數(shù)據(jù)量、計(jì)算密集型任務(wù)中的實(shí)用性和行業(yè)優(yōu)勢(shì)。

24、以上的總體描述和下文中的描述僅是示例性和解釋性的,不用于限制本申請(qǐng)。



技術(shù)特征:

1.一種用于可擴(kuò)展分塊交叉開關(guān)的方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分組與映射實(shí)施包括分組管理,所述分組管理包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,

6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述互聯(lián)網(wǎng)絡(luò)構(gòu)建實(shí)施包括:

7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述sm組共有n個(gè)節(jié)點(diǎn)接入互聯(lián)網(wǎng)絡(luò);

8.根據(jù)權(quán)利要求7所述的方法,其特征在于,

9.根據(jù)權(quán)利要求7所述的方法,其特征在于,

10.根據(jù)權(quán)利要求7所述的方法,其特征在于,


技術(shù)總結(jié)
本申請(qǐng)涉及交叉開關(guān)技術(shù)領(lǐng)域,公開一種用于可擴(kuò)展分塊交叉開關(guān)的方法,基于GPGPU的SM核數(shù)量和布局進(jìn)行分組與映射,并構(gòu)建多個(gè)子互聯(lián)網(wǎng)絡(luò)以確保數(shù)據(jù)順暢傳輸。通過優(yōu)化與測(cè)試實(shí)施,調(diào)整參數(shù)以提升性能。該方法采用位置感知存儲(chǔ)方案,降低數(shù)據(jù)緩存和傳輸消耗,減少長距離通信需求,大幅優(yōu)化了GPGPU的性能,提升了其運(yùn)算效率和響應(yīng)速度。通過本方法,我們能夠更有效地應(yīng)對(duì)GPGPU中SM核與L2緩存之間的互聯(lián)挑戰(zhàn),推動(dòng)相關(guān)技術(shù)的持續(xù)發(fā)展。

技術(shù)研發(fā)人員:董俊逸,姜?jiǎng)P,趙鑫鑫
受保護(hù)的技術(shù)使用者:山東浪潮科學(xué)研究院有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
象山县| 镇原县| 西乡县| 浮山县| 周宁县| 灵台县| 鹤庆县| 咸阳市| 罗平县| 南澳县| 霞浦县| 巴中市| 宁都县| 通州市| 神农架林区| 铅山县| 珠海市| 十堰市| 大田县| 临泽县| 富川| 五莲县| 多伦县| 福州市| 天祝| 开原市| 怀来县| 平乐县| 万宁市| 稻城县| 裕民县| 嘉祥县| 阿鲁科尔沁旗| 正镶白旗| 澄城县| 扶沟县| 色达县| 临沧市| 兰州市| 武宣县| 同德县|