本實用新型實施例涉及數(shù)據(jù)處理領(lǐng)域,特別涉及一種異構(gòu)計算系統(tǒng)。
背景技術(shù):
異構(gòu)計算系統(tǒng)是指將使用不同類型的指令集和體系架構(gòu)的計算單元組成計算系統(tǒng)的計算方式。常見的異構(gòu)系統(tǒng)包括中央處理器(Central Processing Unit,CPU)類計算設(shè)備、圖形處理器(Graphics Processing Unit,GPU)類計算設(shè)備和現(xiàn)場可編程門陣列(Field Programmable Gate Array,F(xiàn)PGA)計算設(shè)備。
然而,異構(gòu)計算系統(tǒng)中包括的各類計算設(shè)備通常屬于集中式運(yùn)算集群,當(dāng)數(shù)據(jù)處理任務(wù)較多且集中式運(yùn)算集群中的計算設(shè)備都處于忙碌狀態(tài)時,新的數(shù)據(jù)處理任務(wù)需要等待集中式運(yùn)算集群中的計算設(shè)備空閑時才能夠被處理,導(dǎo)致異構(gòu)計算系統(tǒng)的運(yùn)算效率不高。
技術(shù)實現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問題,本實用新型實施例提供了一種異構(gòu)計算系統(tǒng)。該技術(shù)方案如下:
第一方面,提供了一種異構(gòu)計算系統(tǒng),該系統(tǒng)包括管理服務(wù)器、HUB、集中式運(yùn)算集群和分布式運(yùn)算集群;
所述分布式運(yùn)算集群包括若干個普通計算機(jī),所述集中式運(yùn)算集群包括若干個服務(wù)器;
所述分布式運(yùn)算集群包括n種計算卡,每個所述普通計算機(jī)包括至少一種計算卡,n為大于等于2的整數(shù);
所述集中式運(yùn)算集群中包括n種計算卡,每個所述服務(wù)器包括至少一種計算卡,n為大于等于2的整數(shù);
所述管理服務(wù)器通過所述HUB與所述分布式運(yùn)算集群中的各個所述普通計算機(jī)建立間歇性通信連接;
所述管理服務(wù)器通過所述HUB與所述集中式運(yùn)算集群中的各個所述服務(wù)器建立持續(xù)性通信連接。
可選的,所述管理服務(wù)器包括網(wǎng)絡(luò)接口,每個所述普通計算機(jī)包括網(wǎng)絡(luò)接口,每個所述服務(wù)器包括網(wǎng)絡(luò)接口;
所述管理服務(wù)器的網(wǎng)絡(luò)接口通過所述HUB與各個所述普通計算機(jī)的網(wǎng)絡(luò)接口連接;
所述管理服務(wù)器的網(wǎng)絡(luò)接口通過所述HUB與各個所述服務(wù)器的網(wǎng)絡(luò)接口連接。
可選的,所述至少一種計算卡包括中央處理器CPU類計算卡、圖像處理器GPU類計算卡、可編程門陣列FPGA類計算卡和數(shù)字信號處理DSP類計算卡中的至少一種。
本實用新型實施例提供的技術(shù)方案帶來的有益效果是:
包括管理服務(wù)器、HUB、分布式運(yùn)算集群和集中式運(yùn)算集群,管理服務(wù)器通過HUB與分布式運(yùn)算集群中的各個普通計算機(jī)建立間歇性通信連接,管理服務(wù)器通過HUB與集中式運(yùn)算集群中的各個服務(wù)器建立持續(xù)性連接,解決了當(dāng)集中式運(yùn)算集群中的服務(wù)器都處于忙碌狀態(tài),新的數(shù)據(jù)處理任務(wù)需要等待才能被執(zhí)行時異構(gòu)計算系統(tǒng)計算效率低的問題;達(dá)到了無需增加集中式運(yùn)算集群中的服務(wù)器的數(shù)量,整合了分布式運(yùn)算資源,提高異構(gòu)計算系統(tǒng)的運(yùn)算效率和計算能力,降低異構(gòu)計算系統(tǒng)的運(yùn)維成本的效果。
附圖說明
為了更清楚地說明本實用新型實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本實用新型的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是根據(jù)一示例性實施例示出的一種異構(gòu)計算系統(tǒng)的結(jié)構(gòu)示意圖;
圖2是根據(jù)一示例性實施例示出的一種管理服務(wù)器的結(jié)構(gòu)示意圖;
圖3是根據(jù)一示例性實施例示出的一種集中式運(yùn)算集群中包括的服務(wù)器的結(jié)構(gòu)示意圖;
圖4是根據(jù)一示例性實施例示出的一種分布式運(yùn)算集群中包括的普通計算機(jī)的結(jié)構(gòu)示意圖;
圖5是根據(jù)一示例性實施例示出的一種計算卡的結(jié)構(gòu)示意圖。
具體實施方式
為使本實用新型的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本實用新型實施方式作進(jìn)一步地詳細(xì)描述。
圖1是根據(jù)一示例性實施例示出的一種異構(gòu)計算系統(tǒng)的結(jié)構(gòu)示意圖。如圖1所示,該異構(gòu)計算系統(tǒng)至少包括管理服務(wù)器100、集中式運(yùn)算集群200、分布式運(yùn)算集群300和HUB400。
集中式運(yùn)算集群200中包括若干個服務(wù)器,集中式運(yùn)算集群200至少包括n種計算卡,每個服務(wù)器包括至少一種計算卡,n為大于等于2的整數(shù)。
分布式運(yùn)算集群300中包括若干個普通計算機(jī),分布式運(yùn)算集群200至少包括n種計算卡,每個普通計算機(jī)包括至少一種計算卡,n為大于等于2的整數(shù)。
需要說明的是,集中式運(yùn)算集群中服務(wù)器的數(shù)量和分布式運(yùn)算集群中普通計算機(jī)的數(shù)量根據(jù)實際需求確定??蛇x的,集中式運(yùn)算集群中服務(wù)器的數(shù)量為5個,分布式運(yùn)算集群中普通計算機(jī)的數(shù)量為5個。
管理服務(wù)器100通過HUB400與分布式運(yùn)算集群300中的各個普通計算機(jī)建立間歇性通信連接。
管理服務(wù)器100與普通計算機(jī)建立間歇性通信連接,是指當(dāng)管理服務(wù)器100需要調(diào)用普通計算機(jī)時,將普通計算機(jī)與管理服務(wù)器100連接,管理服務(wù)器100與普通計算機(jī)進(jìn)行數(shù)據(jù)傳輸;當(dāng)管理服務(wù)器100不需要調(diào)用普通計算機(jī)時,將與管理服務(wù)器100連接的普通計算機(jī)斷開,管理服務(wù)器100與普通計算機(jī)之間不進(jìn)行數(shù)據(jù)傳輸。
管理服務(wù)器100與集中式運(yùn)算集群200中的各個服務(wù)器建立持續(xù)性通信連接。
管理服務(wù)器100與服務(wù)器建立持續(xù)性通信連接,是指管理服務(wù)器100在需要調(diào)用服務(wù)器或不需要調(diào)用服務(wù)器時都100與服務(wù)器連接,管理服務(wù)器100可在任意時間與服務(wù)器進(jìn)行數(shù)據(jù)傳輸。
綜上所述,本實用新型實施例提供的異構(gòu)計算系統(tǒng),包括管理服務(wù)器、HUB、分布式運(yùn)算集群和集中式運(yùn)算集群,管理服務(wù)器通過HUB與分布式運(yùn)算集群中的各個普通計算機(jī)建立間歇性通信連接,管理服務(wù)器通過HUB與集中式運(yùn)算集群中的各個服務(wù)器建立持續(xù)性連接,解決了當(dāng)集中式運(yùn)算集群中的服務(wù)器都處于忙碌狀態(tài),新的數(shù)據(jù)處理任務(wù)需要等待才能被執(zhí)行時異構(gòu)計算系統(tǒng)計算效率低的問題;達(dá)到了無需增加集中式運(yùn)算集群中的服務(wù)器的數(shù)量,整合了分布式運(yùn)算資源,提高異構(gòu)計算系統(tǒng)的運(yùn)算效率和計算能力,降低異構(gòu)計算系統(tǒng)的運(yùn)維成本的效果。
可選的,計算卡包括CPU(Central Processing Unit,中央處理器)計算卡、GPU(Graphics Processing Unit,圖像處理器)計算卡、FPGA(Field-Programmable Gate Array,可編程門陣列)計算卡和DSP(Digital Signal Processing,數(shù)字信號處理)計算卡中的至少兩種。
可選的,計算卡還包括嵌入式CPU、嵌入式GPU、CPLD((Complex Programmable Logic Device,復(fù)雜可編程邏輯器件)和ASCI chip中的至少一種。
圖2示出了本實用新型一個示例性實施例提供的管理服務(wù)器100的結(jié)構(gòu)示意圖。該管理服務(wù)器100包括處理器110、電源120、存儲器130、網(wǎng)絡(luò)接口140和總線150。
處理器110包括一個或者一個以上處理核心,處理器110通過運(yùn)行軟件程序及模塊,執(zhí)行各種功能應(yīng)用預(yù)計數(shù)據(jù)處理。
網(wǎng)絡(luò)接口140可以為多個,其中一部分網(wǎng)絡(luò)接口140用于管理服務(wù)器與HUB連接,與集中式運(yùn)算集群中的服務(wù)器和/或分布式運(yùn)算集群中的普通計算機(jī)進(jìn)行通信。
網(wǎng)絡(luò)接口140和存儲器130分別通過總線150與處理器110連接。
電源120通過總線150分半與處理器110、存儲器130、網(wǎng)絡(luò)接口140連接。
存儲器130用于存儲軟件以及模塊。存儲器130可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序模塊。操作系統(tǒng)可以是RTX(Real Time Xecutive,實時操作系統(tǒng))、LINUX、UNIX、WINDOWS或OS X之類的操作系統(tǒng)。
此外,存儲器130可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。相應(yīng)地。
可選的,管理服務(wù)器100還包括高速緩存器。
本領(lǐng)域技術(shù)人員可以理解,圖2中所示出的管理服務(wù)器100結(jié)構(gòu)并不構(gòu)成對管理服務(wù)器100的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
圖1所示的集中式運(yùn)算集群中包括若干個服務(wù)器,圖3示出了本實用新型一個示例性實施例提供的如圖1所示的集中式運(yùn)算集群中包括的服務(wù)器210的結(jié)構(gòu)示意圖。
服務(wù)器210包括處理器211、電源212、存儲器213、網(wǎng)絡(luò)接口214、總線215和計算卡216。
可選的,計算卡為CPU類計算卡或GPU類計算卡或FPGA類計算卡或DSP類計算卡,或者,計算卡為CPU+GPU類計算卡,或計算卡為GPU+FPGA類計算卡。
處理器211包括一個或者一個以上處理核心,處理器211通過運(yùn)行軟件程序及模塊,執(zhí)行各種功能應(yīng)用預(yù)計數(shù)據(jù)處理。
網(wǎng)絡(luò)接口214可以為多個,其中一部分網(wǎng)絡(luò)接口214用于服務(wù)器210與HUB連接。
網(wǎng)絡(luò)接口214和存儲器213分別通過總線215與處理器211連接。
電源212通過總線215分半與處理器211、存儲器213、網(wǎng)絡(luò)接口214連接。
存儲器213用于存儲軟件以及模塊。存儲器213可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序模塊。操作系統(tǒng)可以是RTX、LINUX、UNIX、WINDOWS或OS X之類的操作系統(tǒng)。
此外,存儲器213可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。相應(yīng)地。
可選的,服務(wù)器210還包括高速緩存器。
本領(lǐng)域技術(shù)人員可以理解,圖2中所示出的服務(wù)器210結(jié)構(gòu)并不構(gòu)成對服務(wù)器210的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
本領(lǐng)域技術(shù)人員還可以理解,服務(wù)器220、服務(wù)器230等圖1所示的集中式運(yùn)算集群200中的服務(wù)器具有與圖2中所示出的服務(wù)器210相同或者相似的結(jié)構(gòu)。
管理服務(wù)器的網(wǎng)絡(luò)接口通過HUB與各個服務(wù)器的網(wǎng)絡(luò)接口連接。
圖1所示的分布式運(yùn)算集群中包括若干個普通計算機(jī),圖4示出了本實用新型一個示例性實施例提供的如圖1所示的分布式運(yùn)算集群中包括的普通計算機(jī)310的結(jié)構(gòu)示意圖。
普通計算機(jī)310包括處理器311、電源312、存儲器313、網(wǎng)絡(luò)接口314、總線315和計算卡316。
可選的,計算卡為CPU類計算卡或GPU類計算卡或FPGA類計算卡或DSP類計算卡,或者,計算卡為CPU+GPU類計算卡,或計算卡為GPU+FPGA類計算卡。
處理器311包括一個或者一個以上處理核心,處理器311通過運(yùn)行軟件程序及模塊,執(zhí)行各種功能應(yīng)用預(yù)計數(shù)據(jù)處理。
網(wǎng)絡(luò)接口314可以為多個,其中一部分網(wǎng)絡(luò)接口314用于普通計算機(jī)310與HUB連接。
網(wǎng)絡(luò)接口314和存儲器313分別通過總線315與處理器311連接。
電源312通過總線315分半與處理器311、存儲器313、網(wǎng)絡(luò)接口314連接。
存儲器313用于存儲軟件以及模塊。存儲器313可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序模塊。操作系統(tǒng)可以是RTX、LINUX、UNIX、WINDOWS或OS X之類的操作系統(tǒng)。
此外,存儲器313可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。相應(yīng)地。
可選的,普通計算機(jī)310還包括高速緩存器。
本領(lǐng)域技術(shù)人員可以理解,圖4中所示出的普通計算機(jī)310結(jié)構(gòu)并不構(gòu)成對普通計算機(jī)310的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
本領(lǐng)域技術(shù)人員還可以理解,普通計算機(jī)320、普通計算機(jī)330等圖1所示的分布式運(yùn)算集群300中的普通計算機(jī)具有與圖4中所示出的普通計算機(jī)310相同或者相似的結(jié)構(gòu)。
管理服務(wù)器的網(wǎng)絡(luò)接口通過HUB與各個普通計算機(jī)的網(wǎng)絡(luò)接口連接。
在如圖3所示的服務(wù)器或如圖4所示的普通計算機(jī)中包括的計算卡的結(jié)構(gòu)示意圖如圖5所示,計算卡包括供電系統(tǒng)510、散熱系統(tǒng)520、擬態(tài)管理系統(tǒng)530、存儲管理系統(tǒng)540、外接口通信系統(tǒng)550、擬態(tài)計算系統(tǒng)560。
擬態(tài)管理系統(tǒng)550與擬態(tài)計算系統(tǒng)560連接,擬態(tài)管理系統(tǒng)550與存儲管理系統(tǒng)540連接,外接口通信系統(tǒng)550與擬態(tài)計算系統(tǒng)560連接。
外接口通信系統(tǒng)550用于將外接口及時序轉(zhuǎn)換為統(tǒng)一的局部總線接口及統(tǒng)一的時序。
擬態(tài)計算系統(tǒng)560用于將需要運(yùn)算的數(shù)據(jù)通過相應(yīng)的算法轉(zhuǎn)化為數(shù)據(jù)結(jié)果,并進(jìn)行處理。
擬態(tài)管理系統(tǒng)530有多片功能完全相同的計算節(jié)點。
存儲管理系統(tǒng)540采用多片計算資源及高性能存儲器,每片計算節(jié)點連接多片功能完全相同的存儲芯片,存儲芯片中可存儲大量數(shù)據(jù)。
供電系統(tǒng)510用于對計算卡上的所有系統(tǒng)進(jìn)行供電。
散熱系統(tǒng)520用于對計算卡上的所有系統(tǒng)進(jìn)行散熱,減少熱量,防止計算卡過熱導(dǎo)致計算卡的功能出現(xiàn)異常。
可選的,外接口通信系統(tǒng)550連接服務(wù)器或者普通計算機(jī)的PCl-e插槽、RJ45網(wǎng)口、PCI插槽、ATCA、RS232或RS485等串口總線。
本實用新型實施例提供的異構(gòu)計算系統(tǒng)的工作原理如下:
管理服務(wù)器接收用戶端發(fā)送的數(shù)據(jù)處理任務(wù);管理服務(wù)器獲取數(shù)據(jù)處理任務(wù)對應(yīng)的處理算法;管理服務(wù)器解析獲取到的處理算法包括的處理算核,一個處理算法至少包括兩個處理算核;針對解析出的每個處理算核,管理服務(wù)器根據(jù)功效比和能效比確定出處理算核對應(yīng)的處理設(shè)備,處理設(shè)備是集中式運(yùn)算集群中的至少一個服務(wù)器和/或分布式運(yùn)算集群中的至少一個普通計算機(jī);管理服務(wù)器根據(jù)處理算核將數(shù)據(jù)處理任務(wù)劃分為多個計算任務(wù);管理服務(wù)器將各個計算任務(wù)下發(fā)至確定出的處理設(shè)備;處理設(shè)備接收計算任務(wù),并根據(jù)計算任務(wù)進(jìn)行計算得到計算結(jié)果;各個處理設(shè)備將計算結(jié)果發(fā)送至管理服務(wù)器;管理服務(wù)器組合計算結(jié)果,得到最后數(shù)據(jù)處理任務(wù)對應(yīng)的計算結(jié)果。管理服務(wù)器將計算結(jié)果反饋給用戶端。
上述本實用新型實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
以上所述僅為本實用新型的較佳實施例,并不用以限制本實用新型,凡在本實用新型的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本實用新型的保護(hù)范圍之內(nèi)。