專利名稱:超級計(jì)算機(jī)系統(tǒng)及其構(gòu)建和任務(wù)調(diào)度方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地說,涉及一種超級計(jì)算機(jī)系統(tǒng)及其 構(gòu)建和任務(wù)調(diào)度方法。
背景技術(shù):
超級計(jì)算機(jī),是指多個(gè)計(jì)算節(jié)點(diǎn)組合起來的能平行進(jìn)行大規(guī)模計(jì)算和數(shù)據(jù) 處理的計(jì)算機(jī),稱為高性能計(jì)算機(jī)或并行計(jì)算機(jī)。現(xiàn)有的超級計(jì)算機(jī)系統(tǒng)分為
專用機(jī)和通用機(jī)兩種類型,其中專用機(jī)是指為某類特定用戶服務(wù)的超級計(jì)算 機(jī)系統(tǒng)。例如針對氣象數(shù)據(jù)處理的用戶,由于其對數(shù)據(jù)計(jì)算能力的要求比較高, 則用于氣象數(shù)據(jù)處理的專用機(jī)的中央處理器(Central Process Unit,簡稱"CPU") 配置較高;而針對基因數(shù)據(jù)處理的用戶,由于其對數(shù)據(jù)存儲能力的要求比較高, 則用于基因數(shù)據(jù)處理的專用機(jī)的內(nèi)存容量較高。而通用機(jī)是指可為各種用戶服 務(wù)的超級計(jì)算機(jī)系統(tǒng),針對某類特定用戶通用機(jī)的性能會比專用機(jī)低,但由于 其配置比較均衡,可為各類用戶服務(wù)。然而,由于專用機(jī)只能月良務(wù)某類特定用 戶,而通用機(jī)又不能充分滿足特定用戶的需求,因此現(xiàn)有的超級計(jì)算機(jī)系統(tǒng)利 用率不高,且運(yùn)行效率低。
發(fā)明內(nèi)容
基于此,有必要提供一種利用率高的超級計(jì)算機(jī)系統(tǒng)。
此外,還有必要提供一種能提高利用率的超級計(jì)算機(jī)構(gòu)建方法。
另外,還有必要提供一種能提高運(yùn)行效率的超級計(jì)算機(jī)系統(tǒng)的任務(wù)調(diào)度方法。
所述超級計(jì)算機(jī)系統(tǒng)包括通用單元及與其相連的至少一個(gè)專用單元,所述 通用單元和專用單元分別包括至少一個(gè)計(jì)算節(jié)點(diǎn)。優(yōu)選地,所述專用單元包括以下單元的一種或多種計(jì)算密集型單元、存 儲密集型單元和通信密集型單元。
所述構(gòu)建超級計(jì)算機(jī)系統(tǒng)的方法包括分析任務(wù)的應(yīng)用特性,根據(jù)所述應(yīng) 用特性構(gòu)建與所述任務(wù)的應(yīng)用特性對應(yīng)的包括至少一個(gè)計(jì)算節(jié)點(diǎn)的專用單元; 構(gòu)建與所述專用單元相連、包括至少一個(gè)計(jì)算節(jié)點(diǎn)的通用單元。
優(yōu)選地,所述專用單元包括以下單元的一種或多種計(jì)算密集型單元、存 儲密集型單元和通信密集型單元。
所述超級計(jì)算機(jī)系統(tǒng)中的任務(wù)調(diào)度方法包括分析任務(wù)的應(yīng)用特性,根據(jù) 所述應(yīng)用特性查找與所述任務(wù)的應(yīng)用特性對應(yīng)的專用單元,并將所述任務(wù)調(diào)度 到該專用單元;當(dāng)所述專用單元的剩余資源不夠運(yùn)行所述任務(wù)時(shí),將任務(wù)調(diào)度 到通用單元。
優(yōu)選地,所述方法還包括當(dāng)所述通用單元的剩余資源不夠運(yùn)行所述任務(wù) 時(shí),將所述任務(wù)調(diào)度到剩余資源足夠的專用單元。
所述方法包括分析任務(wù)的應(yīng)用特性,當(dāng)查找不到與所述應(yīng)用特性對應(yīng)的 專用單元時(shí),將所述任務(wù)調(diào)度到所述通用單元。
優(yōu)選地,所述專用單元包括以下單元的一種或多種計(jì)算密集型單元、存 儲密集型單元和通信密集型單元。
上述超級計(jì)算機(jī)系統(tǒng)包括針對特定用戶服務(wù)的專用單元以及可服務(wù)各類用 戶的通用單元,根據(jù)任務(wù)的不同特性,將任務(wù)優(yōu)先調(diào)度到專用單元,在專用單 元沒有空閑資源時(shí)將任務(wù)調(diào)度到通用單元,這樣使得超級計(jì)算機(jī)系統(tǒng)的利用率 高,且運(yùn)行效率高。
圖l是一個(gè)實(shí)施例中超級計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖; 圖2是一個(gè)實(shí)施例中構(gòu)建超級計(jì)算機(jī)系統(tǒng)的方法流程圖; 圖3是一個(gè)實(shí)施例中超級計(jì)算機(jī)系統(tǒng)的任務(wù)調(diào)度方法流程4圖4是另 一個(gè)實(shí)施例中超級計(jì)算機(jī)系統(tǒng)的任務(wù)調(diào)度方法流程圖。
具體實(shí)施例方式
圖1示出了一個(gè)實(shí)施例中的超級計(jì)算機(jī)系統(tǒng),該系統(tǒng)包4舌通用單元100及 與通用單元100相連的多個(gè)專用單元200。其中,通用單元IOO可包含多個(gè)計(jì)算 節(jié)點(diǎn),采用通用的硬件配置,通用單元100可運(yùn)行各類特性的任務(wù),例如氣象 數(shù)據(jù)處理、基因數(shù)據(jù)處理、網(wǎng)絡(luò)游戲數(shù)據(jù)處理等等。專用單元100也可包含多
個(gè)計(jì)算節(jié)點(diǎn),4十對不同的應(yīng)用可釆用特定的硬zf牛配置。
在一個(gè)實(shí)施方式中,專用單元100包括以下單元的一種或多種計(jì)算密集 型單元、存儲密集型單元和通信密集型單元。其中,各單元還可以根據(jù)其密集 程度和特性進(jìn)行進(jìn)一步劃分。計(jì)算密集型單元是指能夠進(jìn)行大量數(shù)據(jù)計(jì)算、其 CPU總體峰值比較高的專用單元;存儲密集型單元是指能存儲大量數(shù)據(jù)、其總 體內(nèi)存容量和磁盤容量比較大的專用單元;而通信密集型單元是指能進(jìn)行大量 數(shù)據(jù)傳輸?shù)?、其總體帶寬較大、網(wǎng)絡(luò)傳輸速度比較快的專用單元。
不同類型的專用單元100可用于處理不同應(yīng)用特性的任務(wù)。例如,氣象數(shù) 據(jù)處理對超級計(jì)算機(jī)的計(jì)算能力要求比較高,則應(yīng)采用計(jì)算密集型單元運(yùn)行; 基因數(shù)據(jù)處理由于需要存儲大量的數(shù)據(jù),因此對超級計(jì)算機(jī)的存儲能力要求比 較高,則應(yīng)采用存儲密集型單元運(yùn)行;而對于網(wǎng)絡(luò)游戲的數(shù)據(jù)處理,其會產(chǎn)生 大量的數(shù)據(jù)傳輸,則對超級計(jì)算機(jī)的網(wǎng)絡(luò)傳輸能力要求比較高,應(yīng)采用通信密 集型單元運(yùn)行。
圖2示出了一個(gè)實(shí)施例中構(gòu)建超級計(jì)算機(jī)系統(tǒng)的方法流程,具體過程如下 在步驟S201中,分析任務(wù)的應(yīng)用特性,根據(jù)應(yīng)用特性構(gòu)建與其對應(yīng)的包括
至少一個(gè)計(jì)算節(jié)點(diǎn)的專用單元200。
在步驟S202中,構(gòu)建與所述專用單元200相連,包括至少一個(gè)計(jì)算節(jié)點(diǎn)的
通用單元100。在一個(gè)實(shí)施方式中,針對不同用戶所要執(zhí)行的任務(wù)的應(yīng)用特性構(gòu)建不同類
型的專用單元200。例如,氣象數(shù)據(jù)處理對超級計(jì)算機(jī)的計(jì)算能力要求比較高, 則針對處理氣象數(shù)據(jù)的用戶構(gòu)建計(jì)算密集型單元,即構(gòu)建CPU配置較好的專用 單元200用于執(zhí)行氣象數(shù)據(jù)處理;基因數(shù)據(jù)處理由于需要存儲大量的數(shù)據(jù),因 此對超級計(jì)算機(jī)的存儲能力要求比較高,則針對處理基因數(shù)據(jù)的用戶構(gòu)建存儲 密集型單元,即構(gòu)建總體內(nèi)存容量和磁盤容量比較大的專用單元200用于執(zhí)行 基因數(shù)據(jù)處理;而對于網(wǎng)絡(luò)游戲的數(shù)據(jù)處理,其會產(chǎn)生大量的數(shù)據(jù)傳輸,則對 超級計(jì)算機(jī)的網(wǎng)絡(luò)傳輸能力要求比較高,針對網(wǎng)絡(luò)游戲用戶可構(gòu)建通信密集型 單元,即構(gòu)建總體帶寬較大、網(wǎng)絡(luò)傳輸速度較快的專用單元200用于執(zhí)行網(wǎng)絡(luò) 游戲數(shù)據(jù)處理。
圖3示出了一個(gè)實(shí)施例中超級計(jì)算機(jī)系統(tǒng)中的任務(wù)調(diào)度方法流程,具體過 程如下
在步驟S301中,分析任務(wù)的應(yīng)用特性,根據(jù)所述應(yīng)用特性查找與其對應(yīng)的 專用單元200,將任務(wù)調(diào)度到該專用單元200。
在步驟S302中,當(dāng)專用單元200的剩余資源不夠運(yùn)行該任務(wù)時(shí),將任務(wù)調(diào) 度到通用單元IOO。
上述專用單元200包括以下單元的一種或多種計(jì)算密集型單元、存儲密 集型單元和通信密集型單元。在一個(gè)實(shí)施方式中,當(dāng)分析到4壬務(wù)需要執(zhí)行大量 的數(shù)據(jù)計(jì)算,則將任務(wù)調(diào)度到計(jì)算密集型單元;當(dāng)分析到任務(wù)需要存儲大量的 數(shù)據(jù),則可將任務(wù)調(diào)度到存儲密集型單元;而當(dāng)分析到任務(wù)需要進(jìn)行大量的網(wǎng) 絡(luò)數(shù)據(jù)傳輸時(shí),則可將任務(wù)調(diào)度到通信密集型單元。上述專用單元200的剩余 資源是指專用單元200可執(zhí)行任務(wù)的剩余能力,包括剩余的計(jì)算能力(例如浮 點(diǎn)運(yùn)算次數(shù))、剩余的存儲能力(例如剩余的內(nèi)存大小)和剩余的網(wǎng)絡(luò)傳輸能力 (例如剩余的網(wǎng)路帶寬)等等。
在一個(gè)實(shí)施例中,當(dāng)與任務(wù)應(yīng)用特性對應(yīng)的專用單元200的剩余資源不夠運(yùn)行該任務(wù)時(shí),即該專用單元200的剩余能力已不能執(zhí)行該任務(wù),則將任務(wù)調(diào) 度到通用單元100。例如,氣象數(shù)據(jù)處理任務(wù)應(yīng)調(diào)度到計(jì)算密集型單元,但檢測 到該計(jì)算密集型單元的剩余計(jì)算能力已不能執(zhí)行氣象數(shù)據(jù)處理任務(wù)(例如CPU 的浮點(diǎn)運(yùn)算次數(shù)不夠)時(shí),則可將該任務(wù)調(diào)度到通用單元100。
圖4示出了另一個(gè)實(shí)施例中超級計(jì)算機(jī)系統(tǒng)的任務(wù)調(diào)度方法,具體過程如
下
在步驟S401中,分析任務(wù)的應(yīng)用特性,根據(jù)應(yīng)用特性查找與其對應(yīng)的專用 單元IOO。在一個(gè)實(shí)施例中,當(dāng)查找不到與任務(wù)對應(yīng)的專用單元100時(shí),表明超 級計(jì)算機(jī)系統(tǒng)并未構(gòu)建相應(yīng)專用單元200,此時(shí)可直接將任務(wù)調(diào)用到通用單元 100。
在步驟S402中,檢測該專用單元200的剩余資源是否足夠,若是,則ii^ 步驟S403,否則,進(jìn)入步驟S404。
在步驟S403中,將任務(wù)調(diào)度到該專用單元200。在一個(gè)實(shí)施例中,任務(wù)是 處理網(wǎng)絡(luò)游戲數(shù)據(jù),則查找通信密集型單元,當(dāng)查找到通信密集型單元的剩余 資源可以處理該網(wǎng)絡(luò)游戲數(shù)據(jù)時(shí),則將該任務(wù)調(diào)度到該通信密集型單元。
在步驟S404中,檢測通用單元100的剩余資源是否足夠,若是,則進(jìn)入步 驟S405,否則進(jìn)入步驟S406。
在步驟S405中,將任務(wù)調(diào)度到通用單元100。
在步驟S406中,將任務(wù)調(diào)度到其它專用單元200。在一個(gè)實(shí)施例中,當(dāng)檢 測到與任務(wù)應(yīng)用特性對應(yīng)的專用單元200的剩余資源不夠,且通用單元100的 剩余資源也不足以運(yùn)行該任務(wù)時(shí),則將該任務(wù)調(diào)度到其它剩余資源足夠的專用 單元200。
由于上述超級計(jì)算機(jī)系統(tǒng)既包括用于處理特定類型任務(wù)的專用單元200,又 包括能處理各種類型任務(wù)的通用單元IOO,因此可充分滿足不同用戶的需要,提高了超級計(jì)算機(jī)系統(tǒng)的利用率。且在任務(wù)調(diào)度時(shí),^"對特定類型的任務(wù)則優(yōu)先
調(diào)度到專用單元200,僅在專用單元200的剩余資源不夠時(shí)才調(diào)度到通用單元 100,提高了超級計(jì)算機(jī)系統(tǒng)的運(yùn)行效率。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā) 明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明 的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種超級計(jì)算機(jī)系統(tǒng),其特征在于,所述系統(tǒng)包括通用單元及與其相連的至少一個(gè)專用單元,所述通用單元和專用單元分別包括至少一個(gè)計(jì)算節(jié)點(diǎn)。
2、 根據(jù)權(quán)利要求1所述的超級計(jì)算機(jī)系統(tǒng),其特征在于,所述專用單元包 括以下單元的一種或多種計(jì)算密集型單元、存儲密集型單元和通信密集型單 元。
3、 一種構(gòu)建權(quán)利要求1的超級計(jì)算機(jī)系統(tǒng)的方法,其特征在于,所述方法 包括分析任務(wù)的應(yīng)用特性,根據(jù)所述應(yīng)用特性構(gòu)建與所述任務(wù)的應(yīng)用特性對應(yīng)的包括至少一個(gè)計(jì)算節(jié)點(diǎn)的專用單元;構(gòu)建與所述專用單元相連、包括至少一個(gè)計(jì)算節(jié)點(diǎn)的通用單元。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述專用單元包括以下單元 的一種或多種計(jì)算密集型單元、存儲密集型單元和通信密集型單元。
5、 一種權(quán)利要求1的超級計(jì)算機(jī)系統(tǒng)中的任務(wù)調(diào)度方法,其特征在于,所 述方法包括分析任務(wù)的應(yīng)用特性,才艮據(jù)所述應(yīng)用特性查找與所述任務(wù)的應(yīng)用特性對應(yīng) 的專用單元,并將所述任務(wù)調(diào)度到該專用單元;當(dāng)所述專用單元的剩余資源不夠運(yùn)行所述任務(wù)時(shí),將任務(wù)調(diào)度到通用單元。
6、 根據(jù)權(quán)利要求5所述的任務(wù)調(diào)度方法,其特征在于,所述方法還包括 當(dāng)所述通用單元的剩余資源不夠運(yùn)行所述任務(wù)時(shí),將所述任務(wù)調(diào)度到剩余資源足夠的專用單元。
7、 根據(jù)權(quán)利要求5所述的任務(wù)調(diào)度方法,其特征在于,所述方法包括 分析任務(wù)的應(yīng)用特性,當(dāng)查找不到與所述應(yīng)用特性對應(yīng)的專用單元時(shí),將所述任務(wù)調(diào)度到所述通用單元。
8、 根據(jù)權(quán)利要求5所述的任務(wù)調(diào)度方法,其特征在于,所述專用單元包括 以下單元的一種或多種計(jì)算密集型單元、存儲密集型單元和通信密集型單元。
全文摘要
本發(fā)明提供了一種超級計(jì)算機(jī)系統(tǒng)及其構(gòu)建和任務(wù)調(diào)度方法,所述系統(tǒng)包括通用單元及與其相連的至少一個(gè)專用單元,所述通用單元和專用單元分別包括至少一個(gè)計(jì)算節(jié)點(diǎn)。所述專用單元可包括以下單元的一種或多種計(jì)算密集型單元、存儲密集型單元和通信密集型單元。采用本發(fā)明,使超級計(jì)算機(jī)系統(tǒng)的利用率高,也提高了其運(yùn)算效率。
文檔編號G06F9/50GK101604260SQ200910108709
公開日2009年12月16日 申請日期2009年7月8日 優(yōu)先權(quán)日2009年7月8日
發(fā)明者朱定局 申請人:深圳先進(jìn)技術(shù)研究院