本申請(qǐng)涉及交叉開關(guān),例如涉及一種用于可擴(kuò)展分塊交叉開關(guān)的方法。
背景技術(shù):
1、gpgpu憑借其強(qiáng)大的計(jì)算能力、超高并行數(shù)據(jù)處理效率和巨大的數(shù)據(jù)吞吐量,在處理高數(shù)據(jù)量、計(jì)算密集型的任務(wù)中表現(xiàn)出色。其核心架構(gòu)包括以陣列方式排布的多個(gè)流多處理器(sm),這些處理器通過高效的片上互聯(lián)網(wǎng)絡(luò)與l2高速緩存進(jìn)行數(shù)據(jù)交互,確保了計(jì)算任務(wù)的流暢執(zhí)行。
2、考慮到gpgpu的計(jì)算單元間獨(dú)立性高,數(shù)據(jù)交互少,其互聯(lián)網(wǎng)絡(luò)的設(shè)計(jì)主要聚焦于優(yōu)化計(jì)算單元與共享l2高速緩存之間的連接效率。在此背景下,交叉開關(guān)作為一種無阻塞的拓?fù)浣Y(jié)構(gòu)被廣泛采用,以提高數(shù)據(jù)傳輸效率。
3、然而,傳統(tǒng)的交叉開關(guān)設(shè)計(jì)受限于vlsi的可擴(kuò)展性問題,特別是引腳數(shù)量和布線面積的限制,這在gpgpu中,尤其是在擁有大量sm核和較大l2存儲(chǔ)空間時(shí),成為一個(gè)顯著的挑戰(zhàn)。
4、需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強(qiáng)對(duì)本申請(qǐng)的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實(shí)現(xiàn)思路
1、為了對(duì)披露的實(shí)施例的一些方面有基本的理解,下面給出了簡(jiǎn)單的概括。所述概括不是泛泛評(píng)述,也不是要確定關(guān)鍵/重要組成元素或描繪這些實(shí)施例的保護(hù)范圍,而是作為后面的詳細(xì)說明的序言。
2、本公開實(shí)施例提供了一種用于可擴(kuò)展分塊交叉開關(guān)的方法,提高了gpgpu的性能。
3、在一些實(shí)施例中,所述方法包括:
4、分組與映射實(shí)施:根據(jù)gpgpu中sm核的數(shù)量和布局,確定分組參數(shù),并進(jìn)行sm核與l2緩存組的映射;
5、互聯(lián)網(wǎng)絡(luò)構(gòu)建實(shí)施:設(shè)計(jì)并構(gòu)建多個(gè)子互聯(lián)網(wǎng)絡(luò),每個(gè)子互聯(lián)網(wǎng)絡(luò)包含適當(dāng)數(shù)量的數(shù)據(jù)鏈路和交叉開關(guān)配置,在sm側(cè)和l2緩存?zhèn)确謩e部署網(wǎng)外計(jì)算節(jié)點(diǎn)和網(wǎng)外存儲(chǔ)節(jié)點(diǎn),確保數(shù)據(jù)的順暢傳輸;
6、優(yōu)化與測(cè)試實(shí)施:對(duì)互聯(lián)網(wǎng)絡(luò)進(jìn)行仿真測(cè)試,根據(jù)測(cè)試結(jié)果對(duì)分組參數(shù)、交叉開關(guān)配置進(jìn)行優(yōu)化調(diào)整。
7、可選地,所述分組與映射實(shí)施包括分組管理,所述分組管理包括:
8、對(duì)于gpgpu中共計(jì)k個(gè)sm核,每相鄰k個(gè)sm核被分為一個(gè)sm組,共分為m組,其中k×m=k;
9、相應(yīng)地,整個(gè)l2緩存地址空間基于其物理位置也被劃分m組,以保證對(duì)于第i個(gè)sm組,i∈[0,m],與其對(duì)應(yīng)的第i個(gè)l2緩存組在所有緩存組中與其物理距離最近,通信成本最低。
10、可選地,第i個(gè)sm組所涉及的數(shù)據(jù)和指令資料中的主要存儲(chǔ)在第i個(gè)l2緩存組中,以使sm組與l2緩存之間的數(shù)據(jù)交互主要在最短的數(shù)據(jù)鏈路上完成。
11、可選地,基于交叉開關(guān)串聯(lián)形成間接數(shù)據(jù)鏈路。
12、可選地,去除非對(duì)應(yīng)組間的直接數(shù)據(jù)鏈路,非對(duì)應(yīng)組間通過間接數(shù)據(jù)鏈路進(jìn)行數(shù)據(jù)交互。
13、可選地,所述互聯(lián)網(wǎng)絡(luò)構(gòu)建實(shí)施包括:
14、將整個(gè)互聯(lián)網(wǎng)絡(luò)劃分為m個(gè)子互聯(lián)網(wǎng)絡(luò);
15、每個(gè)子網(wǎng)絡(luò)都采用交叉開關(guān)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并包含n個(gè)數(shù)據(jù)鏈路,每個(gè)數(shù)據(jù)鏈路對(duì)應(yīng)l2緩存組的部分地址空間,其中,n<m。
16、可選地,所述sm組共有n個(gè)節(jié)點(diǎn)接入互聯(lián)網(wǎng)絡(luò);n個(gè)sm組側(cè)節(jié)點(diǎn)被進(jìn)一步分組,每組兩個(gè)節(jié)點(diǎn);組節(jié)點(diǎn)僅可以對(duì)對(duì)應(yīng)的兩個(gè)緩存組節(jié)點(diǎn)發(fā)起訪存請(qǐng)求;m個(gè)sm核和n個(gè)節(jié)點(diǎn)的映射關(guān)系通過組內(nèi)網(wǎng)絡(luò)及仲裁器決定。
17、可選地,在sm側(cè),子互聯(lián)網(wǎng)絡(luò)還包含一個(gè)網(wǎng)外計(jì)算節(jié)點(diǎn),用以發(fā)起一個(gè)來自其他sm組的訪存請(qǐng)求,子互聯(lián)網(wǎng)絡(luò)控制器被配置為網(wǎng)外計(jì)算節(jié)點(diǎn)和其他n個(gè)端口節(jié)點(diǎn)彼此等價(jià),優(yōu)先級(jí)相同;在l2緩存?zhèn)?,包括?dāng)前緩存組的n個(gè)端口節(jié)點(diǎn)和一個(gè)網(wǎng)外存儲(chǔ)節(jié)點(diǎn),網(wǎng)外存儲(chǔ)節(jié)點(diǎn)用以處理向其他緩存組提起的訪存請(qǐng)求;對(duì)于目標(biāo)緩存組位于子互聯(lián)網(wǎng)絡(luò)外的所有訪存任務(wù),請(qǐng)求數(shù)據(jù)均通過網(wǎng)外存儲(chǔ)節(jié)點(diǎn)離開子互聯(lián)網(wǎng)絡(luò),該端口節(jié)點(diǎn)等價(jià)于其他存儲(chǔ)側(cè)端口節(jié)點(diǎn)。
18、可選地,每個(gè)互聯(lián)網(wǎng)絡(luò)承擔(dān)(n+1)×(n+1)的數(shù)據(jù)通信任務(wù)。
19、可選地,交叉開關(guān)包括2×3交叉開關(guān)和1×(n+1)交叉開關(guān);2×3交叉開關(guān)用于承擔(dān)每組節(jié)點(diǎn)與對(duì)應(yīng)緩存組節(jié)點(diǎn)間的互聯(lián)任務(wù);1×(n+1)交叉開關(guān)用于網(wǎng)外計(jì)算節(jié)點(diǎn)與任一緩存組節(jié)點(diǎn)或下一個(gè)子互聯(lián)網(wǎng)絡(luò)的互聯(lián)。
20、本公開實(shí)施例提供的用于可擴(kuò)展分塊交叉開關(guān)的方法,可以實(shí)現(xiàn)以下技術(shù)效果:
21、本發(fā)明基于gpgpu中sm核的數(shù)量和布局,確定分組參數(shù),并進(jìn)行sm核與l2緩存組的映射,創(chuàng)新性地提出了一種位置感知的存儲(chǔ)方案,并基于此設(shè)計(jì)了可擴(kuò)展的分塊交叉開關(guān)。
22、通過在靠近存儲(chǔ)空間附近執(zhí)行運(yùn)算,降低了數(shù)據(jù)緩存和傳輸過程中的資源消耗,進(jìn)一步優(yōu)化了gpgpu的性能。隨著sm核數(shù)量的增加,全連接的互聯(lián)網(wǎng)絡(luò)模式會(huì)帶來巨大的資源消耗和網(wǎng)絡(luò)復(fù)雜度。而本方案通過優(yōu)化的存儲(chǔ)設(shè)計(jì)和可擴(kuò)展的分塊交叉開關(guān),有效緩解了l2緩存和sm核間互聯(lián)網(wǎng)絡(luò)的壓力。
23、值得一提的是,即使在全連接的交叉開關(guān)網(wǎng)絡(luò)中,物理位置相距較遠(yuǎn)的sm核與l2緩存地址之間的通信也需要經(jīng)過長距離、高損耗、高延遲的數(shù)據(jù)鏈路。而本方案通過位置感知的存儲(chǔ)策略,減少了這類長距離通信的需求,進(jìn)一步提升了gpgpu的運(yùn)算效率和響應(yīng)速度。這一創(chuàng)新設(shè)計(jì)不僅提升了gpgpu的性能,也展示了其在處理大數(shù)據(jù)量、計(jì)算密集型任務(wù)中的實(shí)用性和行業(yè)優(yōu)勢(shì)。
24、以上的總體描述和下文中的描述僅是示例性和解釋性的,不用于限制本申請(qǐng)。
1.一種用于可擴(kuò)展分塊交叉開關(guān)的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分組與映射實(shí)施包括分組管理,所述分組管理包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述互聯(lián)網(wǎng)絡(luò)構(gòu)建實(shí)施包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述sm組共有n個(gè)節(jié)點(diǎn)接入互聯(lián)網(wǎng)絡(luò);
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,
10.根據(jù)權(quán)利要求7所述的方法,其特征在于,