芯片的使用,GPU卡的數(shù)量則可以增多。
[0056]為了更大程度地?cái)U(kuò)展GPU卡的數(shù)量,在本發(fā)明一個(gè)實(shí)施例中,在GPU機(jī)箱內(nèi)部,PCIe芯片的個(gè)數(shù)可以為多個(gè),并分成兩級(jí)設(shè)計(jì),具體可以包括:第一級(jí)PCIe芯片和第二級(jí)PCIe芯片;
[0057]所述第一級(jí)PCIe芯片包括至少一個(gè)PCIe芯片,所述第二級(jí)PCIe芯片包括至少兩個(gè)PCIe芯片;所述第一級(jí)PCIe芯片中的每一個(gè)PCIe芯片與所述第二級(jí)PCIe芯片中的每一個(gè)PCIe芯片均相連;所述第二級(jí)PCIe芯片中的每一個(gè)PCIe芯片還與至少一個(gè)GPU卡相連;
[0058]所述第二級(jí)PCIe芯片中的每一個(gè)PCIe芯片,用于將相連GPU卡發(fā)來的數(shù)據(jù)通過PCIe信號(hào)線發(fā)送給相連的第一級(jí)PCIe芯片;
[0059]所述第一級(jí)PCIe芯片中的每一個(gè)PCIe芯片,用于相連的各第二級(jí)PCIe芯片發(fā)來的數(shù)據(jù)進(jìn)行整合,然后向外發(fā)送。
[0060]此種兩級(jí)PCIe芯片連接GPU卡的方式,由于可以通過第一級(jí)PCIe芯片進(jìn)行數(shù)據(jù)整合處理,通過第二級(jí)PCIe芯片進(jìn)行GPU卡的數(shù)據(jù)傳輸處理,因此,可以允許在GPU機(jī)箱內(nèi)部設(shè)置更多的GPU卡。
[0061]在本發(fā)明一個(gè)實(shí)施例中,所述第一級(jí)PCIe芯片中包括兩個(gè)PCIe芯片;所述第二級(jí)PCIe芯片中包括四個(gè)PCIe芯片。當(dāng)然,每級(jí)PCIe芯片中包括的PCIe芯片的數(shù)量可以根據(jù)需要設(shè)置為其他個(gè)數(shù)。
[0062]在本發(fā)明一個(gè)實(shí)施例中,GPU卡的數(shù)量可以為16。
[0063]在本發(fā)明一個(gè)實(shí)施例中,所述GPU機(jī)箱為4U機(jī)箱結(jié)構(gòu)。
[0064]圖2示出了在本發(fā)明一個(gè)實(shí)施例中4U結(jié)構(gòu)的GPU機(jī)箱的一種示意圖。4U結(jié)構(gòu)的GI3U機(jī)箱內(nèi)包括兩級(jí)PCIe芯片。第一級(jí)PCIe芯片中包括2個(gè)PCIe芯片即圖中的PCIEX,第二級(jí)PCIe芯片中包括4個(gè)PCIe芯片即圖中的PCIEX,第二級(jí)中每個(gè)PCIe芯片即PCIEX通過PCIe信號(hào)線連接4個(gè)GPU卡。
[0065]在GPU機(jī)箱內(nèi)部,任意兩個(gè)PCIe芯片之間,以及PCIe芯片與GPU卡之間均可以通過PCIe X 16數(shù)據(jù)鏈路相連,從而提供更高的數(shù)據(jù)傳輸帶寬。當(dāng)然,在本發(fā)明一些實(shí)施例中,PCIeX 16數(shù)據(jù)鏈路也可以替換為其他的數(shù)據(jù)鏈路,比如PCIe X 8數(shù)據(jù)鏈路或者PCIe X 4數(shù)據(jù)鏈路,在此種情況下,則可以在第二級(jí)的每個(gè)PCIe芯片下掛接更多的GPU卡。
[0066]圖2只是本發(fā)明一個(gè)實(shí)施例中GPU機(jī)箱的結(jié)構(gòu)示意圖。在本發(fā)明的其他實(shí)施例中,上述GPU機(jī)箱的各種結(jié)構(gòu)和實(shí)施例可以根據(jù)需要靈活進(jìn)行組合。
[0067]在本發(fā)明一個(gè)實(shí)施例中,由于GPU機(jī)箱內(nèi)部可以設(shè)置更多的GPU卡,比如可以設(shè)置16個(gè)GPU卡,為了進(jìn)一步保證GPU機(jī)箱內(nèi)的散熱效果,參見圖3,GPU機(jī)箱可以進(jìn)一步包括:位于所述GPU機(jī)箱前部的背板301、位于所述GPU機(jī)箱后部的背板302以及位于所述GPU機(jī)箱后部的風(fēng)扇303 ;其中
[0068]位于后部的背板302為橋狀結(jié)構(gòu),位于后部的背板302的高度高于位于前部的背板301的高度;
[0069]所述GPU機(jī)箱包括至少兩個(gè)GPU卡304 ;所述至少兩個(gè)GPU卡304被分別置放在所述背板301以及第二背板302上;
[0070]所述風(fēng)扇303,用于從所述GPU機(jī)箱后部吹風(fēng),以使風(fēng)流動(dòng)到背板302的GPU卡304,對(duì)背板302的GPU卡進(jìn)行散熱,并且使所述風(fēng)穿過橋狀結(jié)構(gòu)的所述背板302到達(dá)背板301,對(duì)背板301上的GPU卡304進(jìn)行散熱。
[0071]參見圖3,由于位于后部的背板302下部有類似“橋洞”的空間,該空間是為了使得后部的風(fēng)扇303吹出的風(fēng),能夠通過該“橋洞”吹到位于前部的背板301處,同時(shí),位于后部的背板302的高度高于位于前部的背板301的高度,此種高度設(shè)計(jì)也是為了使得從“橋洞”通過的風(fēng)能夠吹到位于前部的背板301的GPU卡304,從而提高了散熱效果。
[0072]在本發(fā)明一個(gè)實(shí)施例中,提供了在GPU機(jī)箱內(nèi)部設(shè)置16個(gè)GPU卡的結(jié)構(gòu),此時(shí),GI3U機(jī)箱可以進(jìn)一步包括:交換板;并且,
[0073]所述交換板與位于GPU前部的第一背板和位于GPU機(jī)箱后部的第二背板均相連;
[0074]所述至少一個(gè)PCIe芯片被放置在所述交換板上,
[0075]所述GPU卡的數(shù)量為16 ;
[0076]16個(gè)GPU卡分為四組,其中兩組位于GPU機(jī)箱后部的第二背板上,另外兩組位于GI3U機(jī)箱前部的第一背板上;
[0077]所述交換板將第一背板上的兩組GPU卡分隔開,以及將第二背板上的兩組GPU卡分隔開。
[0078]本發(fā)明一個(gè)實(shí)施例還提出一種PCIe交換裝置,參見圖4,包括:
[0079]至少一個(gè)PCIe芯片401以及處理單元402 ;
[0080]每一個(gè)所述PCIe芯片401與處理單元402相連,以及與外部至少一個(gè)GPU機(jī)箱中的PCIe芯片相連;
[0081]所述處理單元402還與外部至少一個(gè)GPU機(jī)箱中的PCIe芯片相連;
[0082]每一個(gè)所述PCIe芯片401,用于接收外部GPU機(jī)箱中的PCIe芯片發(fā)來的數(shù)據(jù),并發(fā)送給外部的服務(wù)器;
[0083]所述處理單元402,用于對(duì)所述至少一個(gè)PCIe芯片401以及外部至少一個(gè)GPU機(jī)箱中的PCIe芯片進(jìn)行管理。
[0084]可見,本發(fā)明實(shí)施例提出的PCIe交換裝置在服務(wù)器與外設(shè)GPU機(jī)箱之間完成了數(shù)據(jù)交換功能,由于PCIe交換裝置能夠連接多個(gè)GPU機(jī)箱,服務(wù)器則可以與更多的GPU機(jī)箱內(nèi)部的GPU卡進(jìn)行通信,提高了數(shù)據(jù)處理的能力。
[0085]為了更大程度地?cái)U(kuò)展與服務(wù)器配合使用的GPU卡的數(shù)量,在本發(fā)明一個(gè)實(shí)施例中,在與GPU機(jī)箱相連的PCIe交換裝置內(nèi)部,PCIe芯片的個(gè)數(shù)可以為多個(gè),并分成兩層設(shè)計(jì),具體可以包括:包括:第一層PCIe芯片和第二層PCIe芯片;
[0086]所述第一層PCIe芯片包括至少一個(gè)PCIe芯片,所述第二層PCIe芯片包括至少兩個(gè)PCIe芯片;所述第一層PCIe芯片中的每一個(gè)PCIe芯片與所述第二層PCIe芯片中的每一個(gè)PCIe芯片均相連;所述第二層PCIe芯片中的每一個(gè)PCIe芯片還與外部GPU機(jī)箱中的至少一個(gè)PCIe芯片相連;
[0087]所述第二層PCIe芯片中的每一個(gè)PCIe芯片,用于將外部GPU機(jī)箱中的至少一個(gè)PCIe芯片發(fā)來的數(shù)據(jù)通過PCIe信號(hào)線發(fā)送給第一層PCIe芯片;
[0088]所述第一層PCIe芯片中的每一個(gè)PCIe芯片,用于將相連的各第二層PCIe芯片發(fā)來的數(shù)據(jù)進(jìn)行整合,然后向外發(fā)送。
[0089]此種兩層PCIe芯片作為PCIe交換裝置,以連接下游GPU機(jī)箱以及上游服務(wù)器的方式,由于可以通過第一層PCIe芯片進(jìn)行數(shù)據(jù)整合處理,通過第二層PCIe芯片接收GPU機(jī)箱發(fā)來的數(shù)據(jù),因此,可以允許PCIe交換裝置雖然外連數(shù)量眾多的GPU機(jī)箱,但是通過數(shù)據(jù)整合后,仍然可以外接一個(gè)服務(wù)器。
[0090]在本發(fā)明一個(gè)實(shí)施例中,所述第一層PCIe芯片中包括兩個(gè)PCIe芯片;所述第二層PCIe芯片中包括四個(gè)PCIe芯片。當(dāng)然,每層PCIe芯片中包括的PCIe芯片的數(shù)量可以根據(jù)需要設(shè)置為其他個(gè)數(shù)。
[0091]在本發(fā)明一個(gè)實(shí)施例中,所述PCIe交互裝置為2U機(jī)箱結(jié)構(gòu)。
[0092]圖5示出了在本發(fā)明一個(gè)實(shí)施例中2U結(jié)構(gòu)的PCIe交換裝置的一種示意圖。2U結(jié)構(gòu)的PCIe交換裝置內(nèi)包括作為處理單元的MCPU以及兩層PCIe芯片,第一層PCIe芯片中包括2個(gè)PCIe芯片,第二層PCIe芯片中包括4個(gè)PCIe芯片,第二層中每個(gè)PCIe芯片通過PCIe信號(hào)線連接外部的GPU機(jī)箱。
[0093]在PCIe交換裝置內(nèi)部,任意兩個(gè)PCIe芯片之間,以及PCIe芯片與外部GPU機(jī)箱之間均可以通過PCIeX 16數(shù)據(jù)鏈路相連,從而提供更高的數(shù)據(jù)傳輸帶寬。當(dāng)然,在本發(fā)明一些實(shí)施例中,PCIe X 16數(shù)據(jù)鏈路也可以替換為其他的數(shù)據(jù)鏈路,比如PCIe X 8數(shù)據(jù)鏈路或者PCIeX4數(shù)據(jù)鏈路,在此種情況下,則可以在第二層的每個(gè)PCIe芯片下掛接更多的GPU卡。
[0094]在本發(fā)明一個(gè)實(shí)施例中,PCIe交換裝置中的處理單元由于只需要與PCIe芯片傳輸一種管理數(shù)據(jù),因此,處理單元可以通過PCIeX I數(shù)據(jù)鏈路與PCIe交換裝置內(nèi)部的PCIe芯片以及與GPU機(jī)箱內(nèi)的PCIe芯片相連,以傳輸管理數(shù)據(jù)。
[0095]本發(fā)明一個(gè)實(shí)施例還提出一種服務(wù)器系統(tǒng),參見圖6,包括:至少一個(gè)服務(wù)器601,至少一個(gè)上述任意一種GPU機(jī)箱602,以及至少一個(gè)上述任意一種PCIe交換裝置603 ;其中,
[0096]每一個(gè)所述服務(wù)器601,