信息處理系統(tǒng)、控制設(shè)備和控制信息處理系統(tǒng)的方法
【專(zhuān)利摘要】本發(fā)明涉及一種信息處理系統(tǒng)、控制設(shè)備和控制信息處理系統(tǒng)的方法。并行計(jì)算機(jī)包括經(jīng)由傳輸路徑彼此連接的多個(gè)處理器。作業(yè)管理服務(wù)器確定經(jīng)過(guò)使處理器當(dāng)中的與要輸入的作業(yè)相對(duì)應(yīng)的特定數(shù)量的處理器相連接的傳輸路徑的通信路徑,并且將這些作業(yè)輸入至經(jīng)由所確定的通信路徑相連接的特定數(shù)量的處理器。鏈路控制服務(wù)器控制經(jīng)由連接處理器的傳輸路徑當(dāng)中的沒(méi)有包括在通信路徑中的傳輸路徑所連接的處理器的發(fā)送/接收電路。
【專(zhuān)利說(shuō)明】信息處理系統(tǒng)、控制設(shè)備和控制信息處理系統(tǒng)的方法
【技術(shù)領(lǐng)域】
[0001] 這里公開(kāi)的實(shí)施例涉及信息處理系統(tǒng)、控制設(shè)備和控制信息處理系統(tǒng)的方法。
【背景技術(shù)】
[0002] 傳統(tǒng)上,已知有具有多個(gè)計(jì)算節(jié)點(diǎn)的并行計(jì)算機(jī)通過(guò)數(shù)值計(jì)算來(lái)進(jìn)行模擬的技 術(shù)。這種技術(shù)的已知示例包括將作為模擬的對(duì)象的計(jì)算空間分割成多個(gè)區(qū)域并且使不同的 計(jì)算節(jié)點(diǎn)執(zhí)行對(duì)不同分割區(qū)域的模擬的并行計(jì)算機(jī)系統(tǒng)。
[0003] 并行計(jì)算機(jī)系統(tǒng)將計(jì)算空間分割成多個(gè)區(qū)域并且將這些分割區(qū)域規(guī)則地映射到 計(jì)算節(jié)點(diǎn)。也就是說(shuō),并行計(jì)算機(jī)系統(tǒng)將每個(gè)分割區(qū)域映射到具有與分割區(qū)域的位置關(guān)系 相同的位置關(guān)系的計(jì)算節(jié)點(diǎn)。然后,并行計(jì)算機(jī)系統(tǒng)使每個(gè)計(jì)算節(jié)點(diǎn)進(jìn)行對(duì)映射到該計(jì)算 節(jié)點(diǎn)的區(qū)域的模擬,由此進(jìn)行整個(gè)計(jì)算空間的模擬。
[0004] 這里,例如當(dāng)進(jìn)行諸如海嘯的三維空間中的現(xiàn)象的模擬時(shí),三維空間的分割區(qū)域 受到相鄰區(qū)域顯著影響。在隨著各區(qū)域之間的距離變短而各區(qū)域之間的相關(guān)性變強(qiáng)的模 擬中,隨著進(jìn)行通信的計(jì)算節(jié)點(diǎn)之間的距離變短,通信量增加。因此,在三維空間中的現(xiàn)象 的模擬中,每個(gè)計(jì)算節(jié)點(diǎn)與其相鄰的計(jì)算節(jié)點(diǎn)的通信同與其它計(jì)算節(jié)點(diǎn)的通信相比大大增 力口。因此,例如,并行計(jì)算機(jī)系統(tǒng)使用經(jīng)由具有多維正交坐標(biāo)的拓?fù)涞闹苯踊ミB網(wǎng)絡(luò)所連接 的多個(gè)計(jì)算節(jié)點(diǎn)來(lái)高效地執(zhí)行模擬。
[0005] 此外,一些并行計(jì)算機(jī)系統(tǒng)包括計(jì)算節(jié)點(diǎn)經(jīng)由具有環(huán)狀(環(huán)形)拓?fù)涞闹苯踊ミB網(wǎng) 絡(luò)相連接的網(wǎng)絡(luò)。在該示例中,多個(gè)計(jì)算節(jié)點(diǎn)當(dāng)中的彼此相鄰的計(jì)算節(jié)點(diǎn)經(jīng)由鏈路直接相 連接,并且位于網(wǎng)絡(luò)的兩端的計(jì)算節(jié)點(diǎn)經(jīng)由鏈路直接相連接。與具有網(wǎng)狀拓?fù)涞闹苯踊ミB 網(wǎng)絡(luò)的情況相比,甚至包括在兩端處的計(jì)算節(jié)點(diǎn)的以這種方式連接的計(jì)算節(jié)點(diǎn)可以以較高 的速度進(jìn)行通信。因此,即使當(dāng)諸如在使用周期邊界條件的模擬中在計(jì)算節(jié)點(diǎn)的兩端之間 存在相關(guān)性時(shí),具有以環(huán)狀連接的節(jié)點(diǎn)的并行計(jì)算機(jī)系統(tǒng)也可以高效地執(zhí)行模擬。此外,通 信節(jié)點(diǎn)之間的通信路徑增加,因而,對(duì)分帶寬(bisection band widhth)增加,結(jié)果減少了 各計(jì)算節(jié)點(diǎn)之間的業(yè)務(wù)量(traffic)。這里,對(duì)分帶寬是當(dāng)任意分割具有經(jīng)由網(wǎng)絡(luò)所連接的 計(jì)算節(jié)點(diǎn)的并行計(jì)算機(jī)系統(tǒng)時(shí)、分割得到的計(jì)算節(jié)點(diǎn)組之間的通信帶寬。在并行計(jì)算機(jī)中, 將對(duì)分帶寬值設(shè)計(jì)成不等于或小于特定值以便確保并行計(jì)算機(jī)的整體性能很重要。
[0006] 作為用于確定并行處理器的信息通信路徑的技術(shù),存在如下傳統(tǒng)技術(shù):將信息順 序地發(fā)送至與包括傳輸目的地坐標(biāo)點(diǎn)的多邊形相對(duì)應(yīng)的節(jié)點(diǎn)當(dāng)中的、與具有給出到傳輸目 的地坐標(biāo)點(diǎn)的最短路徑的邊的多邊形相對(duì)應(yīng)的節(jié)點(diǎn)。
[0007] 專(zhuān)利文獻(xiàn)1 :日本早期公開(kāi)專(zhuān)利公布第01-156860號(hào)
[0008] 然而,在并行計(jì)算機(jī)系統(tǒng)中,確保了物理連接的節(jié)點(diǎn)之間的路徑的連接狀態(tài)相同, 而與在這些路徑上通信量是大還是小無(wú)關(guān)。因此,針對(duì)通信量小并因而僅需要小帶寬和低 傳輸速度的路徑確保了不必要的帶寬和傳輸速度,這導(dǎo)致電力消耗的浪費(fèi)。
[0009] 此外,即使利用基于包括傳輸目的地的坐標(biāo)點(diǎn)的多邊形的邊與坐標(biāo)點(diǎn)之間的距離 來(lái)確定傳輸目的地的傳統(tǒng)技術(shù),也難以降低電力消耗。
[0010] 因此,本發(fā)明的實(shí)施例的一個(gè)方面的目的是提供電力消耗降低的信息處理系統(tǒng)、 控制設(shè)備和控制信息處理系統(tǒng)的方法。
【發(fā)明內(nèi)容】
[0011] 根據(jù)本發(fā)明的一方面,一種信息處理系統(tǒng)包括:信息處理裝置,其包含經(jīng)由傳輸路 徑彼此連接的多個(gè)算術(shù)處理單元;管理裝置,確定經(jīng)過(guò)使多個(gè)算術(shù)處理單元當(dāng)中的、與要輸 入的作業(yè)相對(duì)應(yīng)的特定數(shù)量的算術(shù)處理單元相連接的傳輸路徑的通信路徑,并且將作業(yè)輸 入至經(jīng)由所確定的通信路徑連接的特定數(shù)量的算術(shù)處理單元;以及控制設(shè)備,控制經(jīng)由使 算術(shù)處理單元相連接的傳輸路徑當(dāng)中的、沒(méi)有包括在通信路徑中的傳輸路徑所連接的算術(shù) 處理單元的發(fā)送/接收電路。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0012] 圖1是示出根據(jù)實(shí)施例的信息處理系統(tǒng)的框圖;
[0013] 圖2是示出六維坐標(biāo)軸的圖;
[0014] 圖3是用于說(shuō)明處理器之間的互連路徑和服務(wù)處理器的連接的圖;
[0015] 圖4是示出邏輯坐標(biāo)軸的圖;
[0016] 圖5是示出在處理器中沒(méi)有發(fā)生故障時(shí)的邏輯連接的一個(gè)示例的圖;
[0017] 圖6是示出在處理器中發(fā)生故障時(shí)的邏輯連接的一個(gè)示例的圖;
[0018] 圖7是示出根據(jù)實(shí)施例的并行計(jì)算機(jī)的詳情的框圖;
[0019] 圖8是示出根據(jù)實(shí)施例的信息處理系統(tǒng)中使互連路徑的通道退化的處理的流程 圖;
[0020] 圖9是示出生成邏輯坐標(biāo)的處理的流程圖;
[0021] 圖10是示出根據(jù)變型例的并行計(jì)算機(jī)的詳情的框圖;
[0022] 圖11是示出作業(yè)管理服務(wù)器和鏈路控制服務(wù)器的硬件配置的一個(gè)示例的圖;以 及
[0023] 圖12是示出并行計(jì)算機(jī)中的每個(gè)節(jié)點(diǎn)的硬件配置的一個(gè)示例的圖。
【具體實(shí)施方式】
[0024] 將參照附圖來(lái)說(shuō)明本發(fā)明的優(yōu)選實(shí)施例。以下實(shí)施例不限制本申請(qǐng)的信息處理系 統(tǒng)、控制設(shè)備和控制信息處理系統(tǒng)的方法。
[0025] 圖1是示出根據(jù)實(shí)施例的信息處理系統(tǒng)的框圖。如圖1所示,本實(shí)施例的信息處 理系統(tǒng)包括并行計(jì)算機(jī)1、作業(yè)管理服務(wù)器2、鏈路控制服務(wù)器3和輸入裝置4。
[0026] 并行計(jì)算機(jī)1包括作為多個(gè)算術(shù)處理裝置的處理器11和作為系統(tǒng)控制設(shè)備的服 務(wù)處理器12。
[0027] 處理器11被布置成具有多個(gè)坐標(biāo)軸。例如,在本實(shí)施例中,如圖2所示,使用坐標(biāo) 軸X、Y、Z、A、B和C的位置來(lái)確定處理器11在六維空間內(nèi)的位置。圖2是示出六維坐標(biāo)軸 的圖。坐標(biāo)軸X、Y和Z形成三維空間。坐標(biāo)軸A、B和C分別是用于確保在X軸方向、Y軸 方向和Z軸方向上所布置的處理器11的冗余性的坐標(biāo)軸。坐標(biāo)軸X上的處理器11和坐標(biāo) 軸A上的處理器11利用三維環(huán)狀連接拓?fù)湎噙B接。坐標(biāo)軸Y上的處理器11和坐標(biāo)軸B上 的處理器11利用三維環(huán)狀連接拓?fù)湎噙B接。坐標(biāo)軸Z上的處理器11和坐標(biāo)軸C上的處理 器11利用三維環(huán)狀連接拓?fù)湎噙B接。也就是說(shuō),X-A平面上的處理器利用三維環(huán)狀連接拓 撲彼此連接。Y-B平面上的處理器利用三維環(huán)狀連接拓?fù)浔舜诉B接。Z-C平面上的處理器 利用三維環(huán)狀連接拓?fù)浔舜诉B接。例如,即使當(dāng)利用Y軸方向和B軸方向定義的Y-B平面 上的一些處理器11中發(fā)生故障時(shí),利用以Y軸和B軸定義的三維環(huán)也可以通過(guò)繞過(guò)發(fā)生故 障的處理器11來(lái)維持Y-B平面上的處理器11之間的連接。這里,盡管處理器11被布置成 使得可以在六維空間內(nèi)指定這些處理器11的位置,但坐標(biāo)軸不是固定的。也就是說(shuō),根據(jù) 要執(zhí)行的作業(yè)來(lái)動(dòng)態(tài)地分配乂、¥、23、8和(:,以使得關(guān)于處理器11的六個(gè)方向,乂軸、¥軸 和Z軸彼此垂直并且A、B和C分別與X軸、Y軸和Z軸的冗余方向相對(duì)應(yīng)。
[0028] 圖3是用于說(shuō)明處理器之間的互連路徑和服務(wù)處理器的連接的圖。在圖3中,作 為處理器11的一個(gè)示例,示出了四個(gè)處理器111至114。處理器111至114當(dāng)中的彼此相 鄰的處理器11經(jīng)由互連路徑13相連接。互連路徑13中的每一個(gè)均包括多個(gè)通道(例如,8 個(gè)通道)。當(dāng)使用所有通道來(lái)傳輸數(shù)據(jù)時(shí),互連路徑13的傳輸速率最快。在互連路徑13的 一些通道退化而停止使用之后,互連路徑113可以使用其余通道來(lái)傳輸數(shù)據(jù)。在本實(shí)施例 中,通常使用互連路徑13的所有通道來(lái)傳輸數(shù)據(jù)。
[0029] 在圖3中,處理器111連接至處理器112和113,并且進(jìn)一步連接至其它相鄰的處 理器11 (未示出)。處理器112連接至處理器111和114,并且進(jìn)一步連接至其它相鄰的處 理器11 (未示出)。處理器113連接至處理器111和114,并且進(jìn)一步連接至其它相鄰的處 理器11 (未示出)。處理器114連接至處理器112和113。經(jīng)由互連路徑13連接的處理器 可以使用互連路徑13來(lái)彼此進(jìn)行通信。
[0030] 每個(gè)處理器進(jìn)行算術(shù)處理。例如,在進(jìn)行諸如海嘯的大規(guī)模災(zāi)難的三維模擬時(shí),處 理器執(zhí)行再現(xiàn)大規(guī)模災(zāi)難中的物體的運(yùn)動(dòng)的算術(shù)處理。在三維模擬中,將三維空間的部分 區(qū)域分配至每個(gè)處理器。這些處理器在所分配的區(qū)域內(nèi)進(jìn)行對(duì)物體的運(yùn)動(dòng)的算術(shù)計(jì)算。
[0031] 針對(duì)預(yù)定數(shù)量的多個(gè)處理器設(shè)置一個(gè)服務(wù)處理器。例如,針對(duì)每102個(gè)處理器配 置一個(gè)服務(wù)處理器。服務(wù)處理器均連接至相應(yīng)的處理器中的每一個(gè)。本實(shí)施例描述了針對(duì) 每特定數(shù)量的處理器設(shè)置一個(gè)服務(wù)處理器的情況。然而,可以針對(duì)每特定數(shù)量的處理器設(shè) 置兩個(gè)服務(wù)處理器。
[0032] 服務(wù)處理器連接至鏈路控制服務(wù)器3。每個(gè)服務(wù)處理器從鏈路控制服務(wù)器3接收 用以控制處理器的指令,并且根據(jù)所接收到的控制指令來(lái)控制相應(yīng)的處理器。稍后將詳細(xì) 描述服務(wù)處理器對(duì)處理器的控制。
[0033] 返回圖1,將繼續(xù)進(jìn)行描述。作業(yè)管理服務(wù)器2包括作業(yè)管理器21、邏輯坐標(biāo)生成 單元22和資源管理單元23。
[0034] 輸入裝置4將與用于要執(zhí)行的作業(yè)的坐標(biāo)軸X、Y和Z相對(duì)應(yīng)的節(jié)點(diǎn)數(shù)輸入至作業(yè) 管理器21。以下將要執(zhí)行的作業(yè)稱(chēng)為"執(zhí)行作業(yè)"。這里,該作業(yè)實(shí)際由處理器11來(lái)執(zhí)行。 然而,在以下描述中,"節(jié)點(diǎn)"執(zhí)行這樣的作業(yè),這表示分配有該節(jié)點(diǎn)的每個(gè)處理器11均執(zhí)行 該作業(yè)。
[0035] 作業(yè)管理器21將所接收到的執(zhí)行作業(yè)在X方向、Υ方向和Ζ方向上的節(jié)點(diǎn)數(shù)發(fā)送 至邏輯坐標(biāo)生成單元22。
[0036] 之后,作業(yè)管理器21從邏輯坐標(biāo)生成單元22接收關(guān)于是否可以向處理器11分配 節(jié)點(diǎn)的確定結(jié)果。當(dāng)無(wú)法分配與要輸入的作業(yè)相對(duì)應(yīng)的節(jié)點(diǎn)時(shí),作業(yè)管理器21等待,直到 例如在完成其它作業(yè)之后處理器11被釋放為止,并且可以向所需數(shù)量的處理器分配節(jié)點(diǎn)。 在特定時(shí)間段內(nèi)等待之后,作業(yè)管理器21再次將用于輸入作業(yè)的X軸方向、Y軸方向和Z軸 方向上的節(jié)點(diǎn)數(shù)發(fā)送至邏輯坐標(biāo)生成單元22,以便針對(duì)要執(zhí)行的作業(yè)分配節(jié)點(diǎn)。
[0037] 當(dāng)將節(jié)點(diǎn)分配給處理器11時(shí),作業(yè)管理器21從邏輯坐標(biāo)生成單元22接收表示被 分配作為執(zhí)行作業(yè)的節(jié)點(diǎn)的處理器11的邏輯連接的邏輯坐標(biāo)。這里,以預(yù)先提供給處理 器的節(jié)點(diǎn)數(shù)與邏輯坐標(biāo)生成單元22確定的邏輯坐標(biāo)之間的對(duì)應(yīng)關(guān)系表示處理器的邏輯坐 標(biāo)。
[0038] 作業(yè)管理器21向資源管理單元23通知處理器11的邏輯坐標(biāo)和節(jié)點(diǎn)數(shù)。然后,作 業(yè)管理器21根據(jù)邏輯坐標(biāo)來(lái)向?qū)嶋H處理器11分配作業(yè),并且向資源管理單元23通知處理 器11執(zhí)行作業(yè)的請(qǐng)求。
[0039] 邏輯坐標(biāo)生成單元22包括存儲(chǔ)有處理器11的物理布置和連接的處理器間通信路 徑庫(kù)221。此外,邏輯坐標(biāo)生成單元22存儲(chǔ)并行計(jì)算機(jī)1的處理器11當(dāng)中的已使用的處理 器11。
[0040] 邏輯坐標(biāo)生成單元22從作業(yè)管理器21接收?qǐng)?zhí)行作業(yè)所需的X軸方向、Y軸方向 和Z軸方向上的節(jié)點(diǎn)數(shù)。邏輯坐標(biāo)生成單元22可以基于與每個(gè)坐標(biāo)軸相對(duì)應(yīng)的節(jié)點(diǎn)數(shù)來(lái) 指定執(zhí)行這些執(zhí)行作業(yè)的節(jié)點(diǎn)的連接形式。邏輯坐標(biāo)生成單元22基于存儲(chǔ)在處理器間通 信路徑庫(kù)221中的處理器11的物理布置來(lái)獲取除已使用的處理器11以外的處理器11。然 后,邏輯坐標(biāo)生成單元22搜索可以布置執(zhí)行這些執(zhí)行作業(yè)的節(jié)點(diǎn)的位置。也就是說(shuō),邏輯 坐標(biāo)生成單元22確定是否可以使用除已使用的處理器11以外的處理器11來(lái)確保與執(zhí)行 這些執(zhí)行作業(yè)的節(jié)點(diǎn)的連接形式相對(duì)應(yīng)的區(qū)域。當(dāng)確保了可以配置執(zhí)行這些執(zhí)行作業(yè)的節(jié) 點(diǎn)的位置時(shí),邏輯坐標(biāo)生成單元22將表示可以分配節(jié)點(diǎn)的通知發(fā)送至作業(yè)管理器21。
[0041] 這里,在本實(shí)施例的信息處理系統(tǒng)中,如稍后所述,布置在六維空間內(nèi)的諸如X-A 坐標(biāo)平面的每個(gè)坐標(biāo)平面上的節(jié)點(diǎn)以一筆畫(huà)(unicursal)的環(huán)形方式順序地連接,并且將 一筆畫(huà)形式的節(jié)點(diǎn)順序當(dāng)作一個(gè)坐標(biāo)軸。將坐標(biāo)平面當(dāng)作坐標(biāo)軸,由此當(dāng)坐標(biāo)軸上的節(jié)點(diǎn) 中發(fā)生故障時(shí),在避開(kāi)發(fā)生故障的節(jié)點(diǎn)的同時(shí)再次以一筆畫(huà)的環(huán)形方式連接節(jié)點(diǎn),并且維 持了朝向坐標(biāo)軸的方向的連接。在以下描述中,將諸如X-A坐標(biāo)平面的每個(gè)坐標(biāo)平面當(dāng)作 坐標(biāo)軸。
[0042] 邏輯坐標(biāo)生成單元22生成作為具有布置有執(zhí)行作業(yè)的X軸和A軸的邏輯坐標(biāo)軸 的X-A軸。邏輯坐標(biāo)生成單元22生成作為具有布置有執(zhí)行作業(yè)的Y軸和B軸的邏輯坐標(biāo) 軸的Y-B軸。邏輯坐標(biāo)生成單元22生成作為具有布置有執(zhí)行作業(yè)的Z軸和C軸的邏輯坐 標(biāo)軸的Z-C軸。如上所述,X-A軸、Y-B軸和Z-C軸均形成三維環(huán)狀并且確保了冗余性。圖 4是示出邏輯坐標(biāo)軸的圖。也就是說(shuō),邏輯坐標(biāo)生成單元22使圖2所示的六維坐標(biāo)軸中的 X軸與A軸、Y軸與B軸以及Z軸與C軸成對(duì),并且生成圖4所示的三維邏輯坐標(biāo)。
[0043] 邏輯坐標(biāo)生成單元22將物理相鄰的處理器11用于邏輯相鄰的處理器11。更具 體地,邏輯坐標(biāo)生成單元22將連續(xù)編號(hào)的物理坐標(biāo)順序地分配給物理相鄰的處理器11,由 此生成邏輯連接。也就是說(shuō),邏輯連接是由一系列邏輯坐標(biāo)表示的連接。然后,邏輯坐標(biāo)生 成單元22將邏輯坐標(biāo)軸上的處理器11相連接以生成環(huán)形邏輯連接,并且利用所生成的邏 輯連接來(lái)表示邏輯坐標(biāo)軸上的坐標(biāo)。這里,環(huán)形形式是如下形式:將邏輯坐標(biāo)的編號(hào)順序地 提供給處理器11,以使得處理器11經(jīng)由互連路徑13相互連接,并且具有最初編號(hào)的處理 器11和具有最后編號(hào)的處理器11經(jīng)由互連路徑13彼此連接。利用兩個(gè)軸來(lái)定義邏輯坐 標(biāo)軸。因而,邏輯坐標(biāo)生成單元22可以通過(guò)連接邏輯軸上的處理器11來(lái)形成環(huán)形邏輯連 接。
[0044] 這里,參照?qǐng)D5和圖6來(lái)描述邏輯連接的生成。圖5是示出在處理器中沒(méi)有發(fā)生故 障時(shí)的邏輯連接的一個(gè)示例的圖。圖6是示出在處理器中發(fā)生故障時(shí)的邏輯連接的一個(gè)示 例的圖。這里,描述了 Y-B軸的情況。圖5和圖6的Y-B軸與圖4的Y-B軸相對(duì)應(yīng)。在圖 5和圖6這兩者中,橫向方向與Y軸方向相對(duì)應(yīng),并且垂直方向與B軸方向相對(duì)應(yīng)。也就是 說(shuō),橫向布置的處理器11在Y軸方向上,并且連接橫向布置的處理器11的互連路徑13是 在Y軸方向上延伸的互連路徑。垂直布置的處理器11在B軸方向上,并且連接垂直布置的 處理器11的互連路徑13是在B軸方向上延伸的互連路徑。此外,關(guān)于圖5和圖6中的在 B軸方向上布置成一行的處理器11,頂部處理器11和底部處理器11也彼此相鄰,并且這些 處理器11經(jīng)由互連路徑13相連接。也就是說(shuō),在圖5和圖6中,連接處理器11的線(xiàn)表示 互連路徑13。
[0045] 如圖5所示,在Y-B軸方向的平面上的處理器11中沒(méi)有發(fā)生故障時(shí),邏輯坐標(biāo)生 成單元22沿著互連路徑13以一筆畫(huà)的環(huán)形形式連接所有處理器11。然后,邏輯坐標(biāo)生成 單元22在處理器11當(dāng)中選擇一個(gè)處理器11作為原點(diǎn)并且向所選擇的處理器11提供編號(hào) 0。然后,邏輯坐標(biāo)生成單元22沿著以一筆畫(huà)形式連接的路徑向每個(gè)處理器11順序地提供 邏輯坐標(biāo)。這樣,如圖5所示,邏輯坐標(biāo)生成單元22向Y-B軸方向的平面上的處理器11分 配邏輯坐標(biāo)。因而,圖5中的沿著粗線(xiàn)所示的路徑的方向是Y-B軸方向,并且提供給每個(gè)處 理器11的編號(hào)表不邏輯坐標(biāo)。
[0046] 在圖6中,在Y-B軸方向的平面上的處理器11當(dāng)中的處理器115中發(fā)生故障。在 這種情況下,邏輯坐標(biāo)生成單元22沿著互連路徑13以一筆畫(huà)的環(huán)形形式連接除處理器115 以外的所有處理器11。然后,邏輯坐標(biāo)生成單元22在除處理器115以外的處理器11當(dāng)中 選擇一個(gè)處理器11作為原點(diǎn)并且向所選擇的處理器11提供編號(hào)0。然后,邏輯坐標(biāo)生成單 元22沿著以一筆畫(huà)形式連接的路徑向每個(gè)處理器11順序地提供邏輯坐標(biāo)。這樣,即使在 處理器115中發(fā)生故障時(shí),如圖6所示,邏輯坐標(biāo)生成單元22也可以向Y-B軸方向的平面 上的處理器11提供邏輯坐標(biāo)。因而,圖6中的沿著粗線(xiàn)所示的路徑的方向是Y-B軸方向, 并且提供給處理器11的編號(hào)表示邏輯坐標(biāo)。
[0047] 然后,邏輯坐標(biāo)生成單元22存儲(chǔ)分配給所有處理器11的節(jié)點(diǎn)編號(hào)與邏輯坐標(biāo)之 間的對(duì)應(yīng)關(guān)系。
[0048] 之后,邏輯坐標(biāo)生成單元22向作業(yè)管理器21通知節(jié)點(diǎn)編號(hào)與邏輯坐標(biāo)之間的對(duì) 應(yīng)關(guān)系以及節(jié)點(diǎn)數(shù)。
[0049] 資源管理單元23預(yù)先接收操作員從輸入裝置4輸入的作業(yè)及其設(shè)置信息。作業(yè) 的設(shè)置信息例如包括將哪個(gè)作業(yè)被分配給哪個(gè)節(jié)點(diǎn)的信息。
[0050] 資源管理單元23從作業(yè)管理器21獲取節(jié)點(diǎn)編號(hào)與邏輯坐標(biāo)之間的對(duì)應(yīng)關(guān)系以及 節(jié)點(diǎn)數(shù)。另外,資源管理單元23從作業(yè)管理器21接收作業(yè)執(zhí)行請(qǐng)求。
[0051] 在接收到作業(yè)執(zhí)行請(qǐng)求的情況下,資源管理單元23使用邏輯坐標(biāo)來(lái)指定將哪個(gè) 作業(yè)分配給以一筆畫(huà)形式連接的處理器11當(dāng)中的哪個(gè)處理器組。然后,資源管理單元23 將所分配的作業(yè)輸入至并行計(jì)算機(jī)1的處理器11中的每一個(gè)。
[0052] 接下來(lái),資源管理單元23將節(jié)點(diǎn)編號(hào)與邏輯坐標(biāo)之間的對(duì)應(yīng)關(guān)系發(fā)送至鏈路控 制服務(wù)器3的坐標(biāo)轉(zhuǎn)換單元31。
[0053] 鏈路控制服務(wù)器3包括坐標(biāo)轉(zhuǎn)換單元31、子路徑(sub path)確定單元32、電力控 制單元33。
[0054] 坐標(biāo)轉(zhuǎn)換單元31存儲(chǔ)節(jié)點(diǎn)編號(hào)與作為由六維坐標(biāo)空間內(nèi)的坐標(biāo)(X,Y,Z,A,B,C) 表示的六維坐標(biāo)的物理坐標(biāo)之間的對(duì)應(yīng)關(guān)系。
[0055] 坐標(biāo)轉(zhuǎn)換單元31從資源管理單元23接收節(jié)點(diǎn)編號(hào)與邏輯坐標(biāo)之間的對(duì)應(yīng)關(guān)系。 然后,坐標(biāo)轉(zhuǎn)換單元31使用所存儲(chǔ)的節(jié)點(diǎn)編號(hào)與六維物理坐標(biāo)(X,Y,Z,A,B,C)之間的對(duì)應(yīng) 關(guān)系、基于所接收到的節(jié)點(diǎn)編號(hào)與三維邏輯坐標(biāo)(X-A,Y-B,Z-C)之間的對(duì)應(yīng)關(guān)系來(lái)將每個(gè) 處理器11的三維邏輯坐標(biāo)轉(zhuǎn)換成六維物理坐標(biāo)。
[0056] 然后,坐標(biāo)轉(zhuǎn)換單元31向子路徑確定單元32通知作為被分配有執(zhí)行作業(yè)的節(jié)點(diǎn) 的每個(gè)處理器11的邏輯坐標(biāo)和物理坐標(biāo)。
[0057] 子路徑確定單元32從坐標(biāo)轉(zhuǎn)換單元31獲取被分配有執(zhí)行該執(zhí)行作業(yè)的節(jié)點(diǎn)的每 個(gè)處理器11的邏輯坐標(biāo)和物理坐標(biāo)。
[0058] 然后,子路徑確定單元32獲取邏輯坐標(biāo)連續(xù)的兩個(gè)處理器11 (S卩,邏輯坐標(biāo)彼此 相鄰的兩個(gè)處理器11)的物理坐標(biāo),并且子路徑確定單元32將連接所獲取到的物理坐標(biāo)的 互連路徑13確定為主路徑。此外,子路徑確定單元32將除主路徑以外的互連路徑13確定 為子路徑。
[0059] 子路徑確定單元32向電力控制單元33通知子路徑的信息。這里,子路徑的信息 可以是經(jīng)由這樣的子路徑所連接的兩個(gè)處理器11的物理坐標(biāo)對(duì)。
[0060] 電力控制單元33從子路徑確定單元32獲取子路徑的信息。然后,電力控制單元 33指示對(duì)經(jīng)由作為退化對(duì)象的子路徑所連接的處理器11進(jìn)行控制的服務(wù)處理器12使連 接作為子路徑的互連路徑13上的處理器的多個(gè)通道退化。更具體地,當(dāng)處理器經(jīng)由Μ條通 道(Μ是等于或大于1的整數(shù))相連接時(shí),電力控制單元33做出用以使X條通道(X是等于 或大于1的整數(shù))退化并且經(jīng)由Ν條通道(Ν=Μ-Χ)連接這些處理器的指示。
[0061] 這里,返回至并行計(jì)算機(jī)1,描述處理器11和服務(wù)處理器12的操作。
[0062] 處理器11從資源管理單元23接收所分配的作業(yè)。然后,處理器11執(zhí)行所接收到 的作業(yè)。這里,在本實(shí)施例中,例如,在輸入作業(yè)為三維模擬時(shí),在作為模擬對(duì)象的三維空間 內(nèi)彼此接近的位置之間的相互影響相對(duì)顯著。也就是說(shuō),在處理器11執(zhí)行作業(yè)時(shí),邏輯坐 標(biāo)相鄰的節(jié)點(diǎn)之間的通信增加。例如,在諸如圖5和圖6中的邏輯坐標(biāo)的情況下,處理器11 使用粗線(xiàn)所示的主路徑來(lái)頻繁地與其它處理器進(jìn)行通信。
[0063] 控制經(jīng)由子路徑所連接的處理器11的服務(wù)處理器12從鏈路控制服務(wù)器3接收通 道退化指令以及子路徑的信息。
[0064] 然后,服務(wù)處理器12指示經(jīng)由子路徑所連接的處理器11使作為子路徑的互連路 徑13的通道退化。例如,服務(wù)處理器12指示經(jīng)由作為退化對(duì)象的子路徑所連接的處理器 11的發(fā)送/接收電路(未示出)將通道減少為一半。
[0065] 處理器11從服務(wù)處理器12接收指示,并且按指示使互連路徑13的通道退化。
[0066] 這里,參照?qǐng)D3和圖7來(lái)描述通道的退化。圖7是示出根據(jù)本實(shí)施例的并行計(jì)算 機(jī)的詳情的框圖。以下描述使圖3中的處理器112和114之間、處理器111和113之間、處 理器112和114之間以及處理器113和114之間的互連路徑13的通道退化的情況。
[0067] 服務(wù)處理器121從鏈路控制服務(wù)器3接收用以使處理器112和114之間的互連路 徑13以及處理器111和113之間的互連路徑13的通道退化的指令。然后,服務(wù)處理器121 指示處理器111將處理器111與處理器113之間的互連路徑13的通道減少為一半。服務(wù) 處理器122指示處理器112將處理器112與處理器114之間的互連路徑13的通道減少為 一半。
[0068] 服務(wù)處理器122從鏈路控制服務(wù)器3接收用以使處理器113和111之間的互連路 徑13、處理器114和112之間的互連路徑13以及處理器113和114之間的互連路徑13的 通道退化的指令。然后,服務(wù)處理器122指示處理器113將處理器113與處理器111之間的 互連路徑13的通道減少為一半。服務(wù)處理器122指示處理器114將處理器114與處理器 112之間的互連路徑13的通道減少為一半。此外,服務(wù)處理器122指示處理器113和114 將連接在這兩者之間的互連路徑13的通道減少為一半。
[0069] 處理器111從服務(wù)處理器121接收該指示并且使處理器111與處理器113之間的 互連路徑13的通道減少為一半。圖3中的虛線(xiàn)所示的箭頭表示退化的通道。處理器112 從服務(wù)處理器121接收該指示并且使處理器112與處理器114之間的互連路徑13的通道 退化為一半。
[0070] 處理器113從服務(wù)處理器122接收該指示并且使處理器113和111之間的互連路 徑13以及處理器113和114之間的互連路徑13的通道分別退化為一半。處理器114從服 務(wù)處理器122接收該指示并且使處理器114和112之間的互連路徑13以及處理器114和 113之間的互連路徑13的通道分別退化為一半。
[0071] 這里,參照?qǐng)D7來(lái)描述處理器11進(jìn)行的通道退化處理的示例。圖7僅示出并行計(jì) 算機(jī)1中的兩個(gè)處理器11以說(shuō)明處理器11的詳情。如圖1和圖3所示,并行計(jì)算機(jī)11實(shí) 際包括多個(gè)處理器11。
[0072] 并行計(jì)算機(jī)1包括在服務(wù)處理器12與處理器11之間的設(shè)置控制單元140。處理 器11包括發(fā)送/接收電路130。發(fā)送/接收電路130包括通道退化控制單元131、接收單 元132和發(fā)送單元133。
[0073] 設(shè)置控制單元140從服務(wù)處理器12接收通道退化指令。然后,設(shè)置控制單元140 向通道退化控制單元131通知作為退化對(duì)象的互連路徑的信息和退化程度的信息。
[0074] 接收單元132使用連接至其它處理器11的互連路徑的多個(gè)通道來(lái)接收數(shù)據(jù)。發(fā) 送單元133使用連接至其它處理器11的互連路徑的多個(gè)通道來(lái)發(fā)送數(shù)據(jù)。
[0075] 通道退化控制單元131從設(shè)置控制單元140接收作為退化對(duì)象的互連路徑的信息 和退化程度的信息。通道退化控制單元131在作為退化對(duì)象的互連路徑中確定要退化的通 道。然后,通道退化控制單元131切斷向被確定為退化的通道的電力供給。因而,接收單元 132和發(fā)送單元133無(wú)法使用電力供給被切斷的通道。接收單元132和發(fā)送單元133使用 被供給電力的通道來(lái)進(jìn)行通信。
[0076] 這里,為了便于說(shuō)明,圖7示出了發(fā)送/接收電路130與另一處理器11進(jìn)行通信。 然而,發(fā)送/接收電路130可以與多個(gè)處理器11進(jìn)行通信。在這種情況下,針對(duì)每個(gè)處理 器11,發(fā)送/接收電路130優(yōu)選地包括接收單元132和發(fā)送單元133。另外,可以針對(duì)進(jìn)行 通信的其它處理器11中的每一個(gè)來(lái)設(shè)置一個(gè)發(fā)送/接收電路130。
[0077] 返回圖3,將繼續(xù)進(jìn)行描述。接收到來(lái)自服務(wù)處理器12的指令的處理器11使互連 路徑13退化,由此作為子路徑的所有互連路徑13都退化。在圖5或圖6中,例如,粗線(xiàn)所 示的互連路徑13是主路徑,并且細(xì)線(xiàn)所示的互連路徑13是子路徑。在這種情況下,處理器 11使圖5或圖6中的細(xì)線(xiàn)所示的互連路徑130退化。關(guān)于退化的互連路徑的通道,驅(qū)動(dòng)路 徑的發(fā)送/接收電路的電源被切斷。因而,可以降低電力消耗。
[0078] 如上所述,在三維模擬中,例如,在相鄰節(jié)點(diǎn)之間頻繁地進(jìn)行通信,但在彼此不相 鄰的節(jié)點(diǎn)之間沒(méi)有頻繁地進(jìn)行通信。也就是說(shuō),作為除表示邏輯上彼此相鄰的節(jié)點(diǎn)的連接 的主路徑以外的子路徑的互連路徑13的通信量小。因而,即使在作為子路徑的互連路徑13 的通道退化時(shí),對(duì)模擬處理的影響也小,并且不會(huì)造成問(wèn)題。然后,可以通過(guò)這樣使互連路 徑13的通道退化來(lái)降低電力消耗。
[0079] 以下將參照?qǐng)D8來(lái)描述本實(shí)施例的信息處理系統(tǒng)中的使互連路徑13的通道退化 的處理。圖8是示出本實(shí)施例的信息處理系統(tǒng)中的使互連路徑13的通道退化的處理的流 程圖。
[0080] 作業(yè)管理服務(wù)器2根據(jù)從輸入裝置4輸入的作業(yè)輸入指令來(lái)開(kāi)始作業(yè)輸入確定 (步驟S1)。更具體地,作業(yè)管理器21從輸入裝置4接收與用于要執(zhí)行的作業(yè)的坐標(biāo)軸X、 Y和Z相對(duì)應(yīng)的節(jié)點(diǎn)數(shù)的輸入。然后,作業(yè)管理器21將與用于作業(yè)的坐標(biāo)軸X、Y和Z相對(duì) 應(yīng)的節(jié)點(diǎn)數(shù)發(fā)送至邏輯坐標(biāo)生成單元22,并且指示邏輯坐標(biāo)生成單元22生成邏輯坐標(biāo)。
[0081] 邏輯坐標(biāo)生成單元22從作業(yè)管理器21接收與用于作業(yè)的坐標(biāo)軸X、Υ和Ζ相對(duì) 應(yīng)的節(jié)點(diǎn)數(shù)。然后,邏輯坐標(biāo)生成單元22使用存儲(chǔ)在處理器間通信路徑庫(kù)221中的處理器 11的物理布置和已使用的處理器11的信息來(lái)確定是否可以分配這樣的節(jié)點(diǎn)數(shù)和邏輯坐標(biāo) (步驟S2)。在難以分配這樣的節(jié)點(diǎn)數(shù)和邏輯坐標(biāo)時(shí)(在步驟S2中為"否"),該處理返回至步 驟S1,并且邏輯坐標(biāo)生成單元22等待,直到處理器11變得可用為止。
[0082] 相反,在可以分配這樣的節(jié)點(diǎn)數(shù)和邏輯坐標(biāo)時(shí)(在步驟S2中為"是"),邏輯坐標(biāo)生 成單元22生成邏輯坐標(biāo)(步驟S3)。然后,邏輯坐標(biāo)生成單元22向作業(yè)管理器21通知所生 成的邏輯坐標(biāo)的信息。這里,邏輯坐標(biāo)的信息包括節(jié)點(diǎn)數(shù)與邏輯坐標(biāo)之間的對(duì)應(yīng)關(guān)系。例 如,以下描述生成圖5所示的邏輯坐標(biāo)的情況。這里,將節(jié)點(diǎn)0的節(jié)點(diǎn)編號(hào)分配給圖5中的 具有邏輯坐標(biāo)0的處理器11,并且節(jié)點(diǎn)編號(hào)沿著Β軸增大。假定分配節(jié)點(diǎn)編號(hào),以使得Β軸 方向上的底部處理器11之后的處理器11是Υ軸方向上的下一行上的Β軸方向上的頂部處 理器11。在這種情況下,邏輯坐標(biāo)生成單元22向作業(yè)管理器21通知以下信息。也就是說(shuō), 節(jié)點(diǎn)〇具有邏輯坐標(biāo)0。節(jié)點(diǎn)1具有邏輯坐標(biāo)19。節(jié)點(diǎn)2具有邏輯坐標(biāo)20。節(jié)點(diǎn)3具有邏 輯坐標(biāo)1。節(jié)點(diǎn)4具有邏輯坐標(biāo)18。節(jié)點(diǎn)編號(hào)和邏輯坐標(biāo)以這種方式彼此相對(duì)應(yīng),并且最 后,節(jié)點(diǎn)20具有邏輯坐標(biāo)8。邏輯坐標(biāo)生成單元22向作業(yè)管理器21通知這樣的信息。
[0083] 作業(yè)管理器21從邏輯坐標(biāo)生成單元22接收表示可以進(jìn)行分配的通知,并且獲取 邏輯坐標(biāo)生成單元22所生成的邏輯坐標(biāo)的信息。然后,作業(yè)管理器21向資源管理單元23 通知邏輯坐標(biāo)的信息,并且請(qǐng)求資源管理單元23請(qǐng)求啟動(dòng)作業(yè)(步驟S4)。
[0084] 資源管理單元23接收作業(yè)啟動(dòng)請(qǐng)求,并且將分配給與處理器11相對(duì)應(yīng)的每個(gè)節(jié) 點(diǎn)的作業(yè)輸入至分配有邏輯坐標(biāo)的處理器11中的每一個(gè),以使得處理器11執(zhí)行作業(yè)(步驟 S5)。
[0085] 資源管理單元23向鏈路控制服務(wù)器3的坐標(biāo)轉(zhuǎn)換單元31通知節(jié)點(diǎn)數(shù)和邏輯坐標(biāo) 的信息(步驟S6)。
[0086] 坐標(biāo)轉(zhuǎn)換單元31從資源管理單元23接收節(jié)點(diǎn)數(shù)和邏輯坐標(biāo)的信息。然后,坐標(biāo) 轉(zhuǎn)換單元31基于邏輯坐標(biāo)的信息來(lái)獲取具有各邏輯坐標(biāo)的處理器11的物理坐標(biāo),并且將 這些邏輯坐標(biāo)轉(zhuǎn)換成物理坐標(biāo)(步驟S7)。然后,坐標(biāo)轉(zhuǎn)換單元31向子路徑確定單元32通 知邏輯坐標(biāo)的信息和與邏輯坐標(biāo)相對(duì)應(yīng)的物理坐標(biāo)的信息。
[0087] 更具體地,對(duì)于如圖5所示的處理器11,坐標(biāo)轉(zhuǎn)換單元31存儲(chǔ)以下的節(jié)點(diǎn)數(shù)與 物理坐標(biāo)之間的對(duì)應(yīng)關(guān)系:節(jié)點(diǎn)〇=(〇,〇,〇,〇,〇,〇)(在括號(hào)內(nèi)表示坐標(biāo)(X,Y,Z,A,B,C)), 節(jié)點(diǎn) 1=(0,0,0,0,1,0),節(jié)點(diǎn) 2=(0,0,0,0,2,0),節(jié)點(diǎn) 3=(0,1,0,0,0,0),節(jié)點(diǎn) 4=(0, 1,0,0, 1,0),......,節(jié)點(diǎn)20=(0,6,0,0,2,0)。然后,坐標(biāo)轉(zhuǎn)化單元31按以下方式將 邏輯坐標(biāo)轉(zhuǎn)換成物理坐標(biāo)。也就是說(shuō),將邏輯坐標(biāo)〇轉(zhuǎn)換成物理坐標(biāo)。將邏 輯坐標(biāo)1轉(zhuǎn)換成物理坐標(biāo)(0, 1,0, 0, 0, 0)。將邏輯坐標(biāo)2轉(zhuǎn)換成物理坐標(biāo)(0, 2, 0, 0, 0, 0)。 將邏輯坐標(biāo)3轉(zhuǎn)換成物理坐標(biāo)(0, 2, 0, 0, 1,0)。以此方式,順序地轉(zhuǎn)換邏輯坐標(biāo),并且最后 將邏輯坐標(biāo)20轉(zhuǎn)換成物理坐標(biāo)(0, 0, 0, 0, 2, 0)。
[0088] 子路徑確定單元32基于所接收到的邏輯坐標(biāo)和物理坐標(biāo)的信息來(lái)將具有相鄰邏 輯坐標(biāo)的處理器11之間的互連路徑13指定為主路徑。然后,子路徑確定單元32使用所指 定的主路徑來(lái)確定哪些互連路徑13是子路徑(步驟S8)。更具體地,子路徑確定單元32將 除主路徑以外的互連路徑13指定為子路徑。然后,子路徑確定單元32向電力控制單元33 通知子路徑的信息。
[0089] 例如,子路徑確定單元32將由邏輯坐標(biāo)連續(xù)的處理器11的物理坐標(biāo)之間的差表 示的互連路徑13確定為主路徑。在圖5的情況下,例如,邏輯坐標(biāo)0和邏輯坐標(biāo)1在以物 理坐標(biāo)表示時(shí)分別為(0, 0, 0, 0, 0, 0)和(0, 1,0, 0, 0, 0)。也就是說(shuō),Y坐標(biāo)從0轉(zhuǎn)變?yōu)?。 然后,子路徑確定單元32將物理坐標(biāo)(0, 0, 0, 0, 0, 0)處的處理器11的Y坐標(biāo)從0轉(zhuǎn)變?yōu)?1所經(jīng)由的互連路徑13確定為主路徑。同樣,邏輯坐標(biāo)1和邏輯坐標(biāo)2在以物理坐標(biāo)表示 時(shí)分別為(〇, 1,〇, 〇, 〇, 〇)和(〇, 2, 0, 0, 0, 0)。也就是說(shuō),Y坐標(biāo)從1轉(zhuǎn)變?yōu)?。然后,子路 徑確定單元32將物理坐標(biāo)(0, 1,0, 0, 0, 0)處的處理器11的Y坐標(biāo)從1轉(zhuǎn)變?yōu)?所經(jīng)由的 互連路徑13確定為主路徑。以此方式,子路徑確定單元32重復(fù)主路徑的指定。然后,子路 徑確定單元32將除所指定的主路徑以外的互連路徑確定為子路徑。
[0090] 電力控制單元33從子路徑確定單元32獲取子路徑的信息。然后,電力控制單元 33指示服務(wù)處理器12使子路徑的通道退化(步驟S9)。
[0091] 服務(wù)處理器12從電力控制單元33接收用以使子路徑的通道退化的指令。然后, 服務(wù)處理器12指示經(jīng)由作為子路徑的互連路徑13所連接的處理器11使通道退化(步驟 S10)。
[0092] 處理器11使服務(wù)處理器12指定的互連路徑13的通道退化(步驟S11)。
[0093] 隨后,將參照?qǐng)D9來(lái)描述邏輯坐標(biāo)的生成。圖9是示出生成邏輯坐標(biāo)的處理的流 程圖。
[0094] 邏輯坐標(biāo)生成單元22使用表示六維的六個(gè)坐標(biāo)軸中的每?jī)蓚€(gè)坐標(biāo)軸來(lái)生成邏輯 軸。然后,邏輯坐標(biāo)生成單元22在所生成的邏輯軸當(dāng)中選擇一個(gè)邏輯軸(步驟S101)。
[0095] 邏輯坐標(biāo)生成單元22將邏輯坐標(biāo)順序地提供給所選擇的邏輯軸上的處理器11 以使得相鄰的處理器11具有連續(xù)編號(hào)的邏輯坐標(biāo),并且向這些邏輯坐標(biāo)分配節(jié)點(diǎn)(步驟 S102)。
[0096] 然后,邏輯坐標(biāo)生成單元22存儲(chǔ)邏輯坐標(biāo),由此存儲(chǔ)哪些處理器11在邏輯上彼此 相鄰(步驟S103)。
[0097] 之后,邏輯坐標(biāo)生成單元22關(guān)于作業(yè)大小的所有節(jié)點(diǎn)確定是否完成了邏輯坐標(biāo) 的分配(步驟S104)。當(dāng)尚未完成關(guān)于作業(yè)大小的所有節(jié)點(diǎn)對(duì)邏輯坐標(biāo)的分配時(shí)(在步驟 S104中為"否"),邏輯坐標(biāo)生成單元22使該處理返回至步驟S101。
[0098] 相反,當(dāng)完成了關(guān)于作業(yè)大小的所有節(jié)點(diǎn)對(duì)邏輯坐標(biāo)的分配時(shí)(在步驟S104中為 "是"),邏輯坐標(biāo)生成單元22完成邏輯坐標(biāo)的生成。
[0099] 如上所述,本實(shí)施例的信息處理系統(tǒng)使除邏輯坐標(biāo)彼此相鄰的處理器以外的處理 器之間的互連路徑退化。這樣,本實(shí)施例的信息處理系統(tǒng)可以在維持作為通信量大的互連 路徑的主路徑的帶寬的同時(shí),限制通信量小的互連路徑的帶寬。因而,本實(shí)施例的信息處理 系統(tǒng)可以在維持算術(shù)處理的性能的同時(shí)降低電力消耗。特別地,例如在三維模擬中,在彼此 相鄰的節(jié)點(diǎn)之間進(jìn)行大部分通信。因而,本實(shí)施例的信息處理系統(tǒng)使得可以在確保模擬處 理的性能的同時(shí)抑制電力消耗。
[0100] 奪型例
[0101] 在本實(shí)施例中,電力控制單元33通過(guò)使互連路徑13的通道退化來(lái)降低電力消耗。 然而,還可以應(yīng)用其它方法。例如,電力控制單元33可以通過(guò)降低數(shù)據(jù)傳送的頻率來(lái)降低 電力消耗。
[0102] 在這種情況下,電力控制單元33指示服務(wù)處理器12降低經(jīng)由作為子路徑的互連 路徑13所連接的處理器11之間的數(shù)據(jù)發(fā)送和接收的頻率。
[0103] 服務(wù)處理器12指示經(jīng)由電力控制單元33指定的子路徑所連接的處理器11中的 每一個(gè)以降低這些處理器之間的數(shù)據(jù)發(fā)送和接收的頻率。
[0104] 處理器11從服務(wù)處理器12接收用以降低將數(shù)據(jù)發(fā)送到經(jīng)由子路徑與處理器11 連接的其它處理器11以及從經(jīng)由子路徑與處理器11連接的其它處理器11接收數(shù)據(jù)的頻 率的指令。然后,處理器11在以比經(jīng)由主路徑的數(shù)據(jù)發(fā)送和接收所使用的頻率低的頻率與 經(jīng)由子路徑與處理器11連接的其它處理器11進(jìn)行通信時(shí),以最大速度經(jīng)由主路徑進(jìn)行通 信。
[0105] 圖10是示出根據(jù)變型例的并行計(jì)算機(jī)的詳情的框圖。發(fā)送/接收電路130包括 頻率控制單元134、接收單元132和發(fā)送單元133。
[0106] 設(shè)置控制單元140從服務(wù)處理器120接收通道退化指令。設(shè)置控制單元140指定 要控制的互連路徑。然后,設(shè)置控制單元140向頻率控制單元134通知所指定的互連路徑 的信息以及使用這些互連路徑的通信中所使用的頻率。這里,設(shè)置控制單元140指定的頻 率低于經(jīng)由主路徑的數(shù)據(jù)發(fā)送和接收中所使用的頻率。
[0107] 接收單元132使用頻率控制單元134指定的頻率來(lái)經(jīng)由互連路徑從其它處理器11 接收數(shù)據(jù)。發(fā)送單元133使用頻率控制單元134指定的頻率來(lái)經(jīng)由互連路徑將數(shù)據(jù)發(fā)送至 其它處理器11。
[0108] 頻率控制單元134從設(shè)置控制單元140接收要降低數(shù)據(jù)發(fā)送和接收的頻率的互連 路徑的信息和要使用的頻率的信息。頻率控制單元314向經(jīng)由所指定的互連路徑進(jìn)行通信 的接收單元132和發(fā)送單元133通知在數(shù)據(jù)發(fā)送和接收中要使用的頻率。
[0109] 這樣,與主路徑相比,在子路徑上以較低的頻率進(jìn)行數(shù)據(jù)發(fā)送和接收,由此可以降 低電力消耗。
[0110] 此外,在本實(shí)施例中,作為初始狀態(tài),使用互連路徑的所有通道,并且從這樣的狀 態(tài)開(kāi)始減少通道。然而,相反,可以減少初始狀態(tài)下所使用的通道并且增加主路徑上所使用 的通道。
[0111] 以上描述說(shuō)明了處理器六維布置在并行計(jì)算機(jī)中的示例情況。然而,維數(shù)不限于 此,只要設(shè)置具有冗余性的坐標(biāo)軸并且在這樣的坐標(biāo)軸上確定主路徑即可。例如,處理器可 以四維布置,以使得僅在三維中的一維方向上提供冗余性。在二維模擬的情況下,處理器可 以三維配置,以使得僅在一維方向上提供冗余性。
[0112] 此外,在以上描述中,如圖1所示,作業(yè)管理服務(wù)器2和鏈路控制服務(wù)器3是單獨(dú) 的服務(wù)器。因而,用于作業(yè)控制的網(wǎng)絡(luò)與用于電力控制的網(wǎng)絡(luò)分開(kāi)。然而,作業(yè)管理服務(wù)器 2和鏈路控制服務(wù)器3可以被集成為一個(gè)服務(wù)器。
[0113] 此外,作業(yè)管理服務(wù)器2可設(shè)置有鏈路控制服務(wù)器3的功能,以使得作業(yè)管理服務(wù) 器2確定子路徑并且經(jīng)由用于控制的網(wǎng)絡(luò)指示處理器11進(jìn)行退化,而接收到該指示的處理 器11使互連路徑13的通道退化。
[0114] 硬件結(jié)構(gòu)
[0115] 圖11是示出作業(yè)管理服務(wù)器和鏈路控制服務(wù)器的硬件結(jié)構(gòu)的一個(gè)示例的圖。作 業(yè)管理服務(wù)器2和鏈路控制服務(wù)器3這兩者都可以通過(guò)圖11所示的硬件配置來(lái)實(shí)現(xiàn)。
[0116] 例如,如圖11所示,作業(yè)管理服務(wù)器2和鏈路控制服務(wù)器3包括中央處理單元 (CPU) 901、存儲(chǔ)器902和硬盤(pán)903。
[0117] CPU901、存儲(chǔ)器902和硬盤(pán)903經(jīng)由總線(xiàn)904彼此連接。
[0118] 作業(yè)管理服務(wù)器2的硬盤(pán)903存儲(chǔ)各種程序,諸如實(shí)現(xiàn)在圖1中示為示例的作業(yè) 管理器21、邏輯坐標(biāo)生成單元22和資源管理單元23的功能的程序。此外,硬盤(pán)903存儲(chǔ)處 理器間通信路徑庫(kù)221。
[0119] 鏈路控制服務(wù)器3的硬盤(pán)903存儲(chǔ)諸如實(shí)現(xiàn)在圖1中示為示例的坐標(biāo)轉(zhuǎn)換單元 31、子路徑確定單元32和電力控制單元33的功能的程序的各種程序。
[0120] 作業(yè)管理服務(wù)器2的CPU901和存儲(chǔ)器902實(shí)現(xiàn)作業(yè)管理器21、邏輯坐標(biāo)生成單元 22和資源管理單元23的功能。例如,CPU901讀出硬盤(pán)903中所存儲(chǔ)的各種程序,將實(shí)現(xiàn)作 業(yè)管理器21、邏輯坐標(biāo)生成單元22和資源管理單元23的功能的處理加載到存儲(chǔ)器902,并 且執(zhí)行該處理。
[0121] 鏈路控制服務(wù)器3的CPU901和存儲(chǔ)器902實(shí)現(xiàn)坐標(biāo)轉(zhuǎn)換單元31、子路徑確定單元 32和電力控制單元33的功能。例如,CPU901讀出硬盤(pán)903中所存儲(chǔ)的各種程序,將實(shí)現(xiàn)坐 標(biāo)轉(zhuǎn)換單元31、子路徑確定單元32和電力控制單元33的功能的處理加載到存儲(chǔ)器902,并 且執(zhí)行該處理。
[0122] 此外,圖12是示出并行計(jì)算機(jī)中的每個(gè)節(jié)點(diǎn)的硬件配置的一個(gè)示例的圖。如圖12 所示,節(jié)點(diǎn)910包括CPU911、存儲(chǔ)器912和收發(fā)器913。
[0123] 存儲(chǔ)器912和收發(fā)器913經(jīng)由總線(xiàn)與CPU911相連接。
[0124] 收發(fā)器913包括接收器931和驅(qū)動(dòng)器932。例如,收發(fā)器913實(shí)現(xiàn)圖7和圖10所 示的發(fā)送/接收電路130的功能。
[0125] 驅(qū)動(dòng)器932經(jīng)由互連路徑向其它節(jié)點(diǎn)發(fā)送數(shù)據(jù)。例如,驅(qū)動(dòng)器932實(shí)現(xiàn)圖7和圖 10所示的發(fā)送單元133的功能。
[0126] 接收器931經(jīng)由互連路徑從其它節(jié)點(diǎn)接收數(shù)據(jù)。例如,接收器931實(shí)現(xiàn)圖7和圖 10所示的接收單元132的功能。
[0127] CPU911和存儲(chǔ)器913根據(jù)所分配的作業(yè)來(lái)執(zhí)行算術(shù)處理。
[0128] 本申請(qǐng)的信息處理系統(tǒng)、控制設(shè)備和控制信息處理系統(tǒng)的方法的一個(gè)方面發(fā)揮了 降低電力消耗的效果。
【權(quán)利要求】
1. 一種信息處理系統(tǒng),包括: 信息處理裝置,包括經(jīng)由傳輸路徑彼此連接的多個(gè)算術(shù)處理單元; 管理裝置,確定經(jīng)過(guò)使所述多個(gè)算術(shù)處理單元當(dāng)中的、與要輸入的作業(yè)相對(duì)應(yīng)的特定 數(shù)量的算術(shù)處理單元相連接的傳輸路徑的通信路徑,并且將所述作業(yè)輸入至經(jīng)由所確定的 通信路徑連接的所述特定數(shù)量的算術(shù)處理單元;以及 控制設(shè)備,控制經(jīng)由使所述多個(gè)算術(shù)處理單元相連接的傳輸路徑當(dāng)中的、沒(méi)有包括在 所述通信路徑中的傳輸路徑所連接的算術(shù)處理單元的發(fā)送/接收電路。
2. 根據(jù)權(quán)利要求1所述的信息處理系統(tǒng),其中,所述管理裝置確定經(jīng)過(guò)使所述特定數(shù) 量的算術(shù)處理單元相連接的傳輸路徑的通信路徑,以使得所述通信路徑為環(huán)形。
3. 根據(jù)權(quán)利要求1所述的信息處理系統(tǒng),其中,所述管理裝置確定經(jīng)過(guò)使所述特定數(shù) 量的算術(shù)處理單元相連接的傳輸路徑的通信路徑,以使得所述通信路徑為一筆畫(huà)的。
4. 根據(jù)權(quán)利要求1所述的信息處理系統(tǒng),其中, 所述算術(shù)處理單元被配置成使用多個(gè)坐標(biāo)軸的坐標(biāo)值來(lái)指定所述算術(shù)處理單元的物 理位置,以及 所述管理裝置使用與所述多個(gè)坐標(biāo)軸當(dāng)中的兩個(gè)相互不同的坐標(biāo)軸相對(duì)應(yīng)的邏輯坐 標(biāo)對(duì)來(lái)確定所述通信路徑。
5. 根據(jù)權(quán)利要求4所述的信息處理系統(tǒng),其中, 所述算術(shù)處理單元被配置成使用六個(gè)坐標(biāo)軸的坐標(biāo)值來(lái)指定所述算術(shù)處理單元的物 理位置,以及 所述管理裝置使用與所述六個(gè)坐標(biāo)軸當(dāng)中的兩個(gè)相互不同的坐標(biāo)軸相對(duì)應(yīng)的邏輯坐 標(biāo)對(duì)來(lái)確定所述通信路徑。
6. 根據(jù)權(quán)利要求1所述的信息處理系統(tǒng),其中, 每條所述傳輸路徑均包括多個(gè)通道,以及 所述控制設(shè)備控制經(jīng)由沒(méi)有包括在所述通信路徑中的每條傳輸路徑的通道所連接的 算術(shù)處理單元的發(fā)送/接收電路,以增加和減少所述通道當(dāng)中的在通信中所使用的通道數(shù) 量。
7. 根據(jù)權(quán)利要求1所述的信息處理系統(tǒng),其中,所述控制設(shè)備控制經(jīng)由沒(méi)有包括在所 述通信路徑中的傳輸路徑的通道所連接的算術(shù)處理單元的發(fā)送/接收電路,以增加和減少 沒(méi)有包括在所述通信路徑中的傳輸路徑的頻率。
8. -種控制設(shè)備,其連接至信息處理裝置,所述信息處理裝置包括:多個(gè)算術(shù)處理單 元,經(jīng)由傳輸路徑彼此連接;以及管理裝置,確定經(jīng)過(guò)使所述多個(gè)算術(shù)處理單元當(dāng)中的、與 要輸入的作業(yè)相對(duì)應(yīng)的特定數(shù)量的算術(shù)處理單元相連接的傳輸路徑的通信路徑,并且將所 述作業(yè)輸入至經(jīng)由所確定的通信路徑連接的所述特定數(shù)量的算術(shù)處理單元,其中, 所述控制設(shè)備控制經(jīng)由使所述算術(shù)處理單元相連接的傳輸路徑當(dāng)中的、沒(méi)有包括在所 述通信路徑中的傳輸路徑所連接的算術(shù)處理單元的發(fā)送/接收電路。
9. 一種控制信息處理系統(tǒng)的方法,所述信息處理系統(tǒng)包括信息處理裝置,所述信息處 理裝置包括經(jīng)由傳輸路徑彼此連接的多個(gè)算術(shù)處理單元,所述方法包括以下步驟: 由包括在所述信息處理系統(tǒng)中的管理裝置確定經(jīng)過(guò)使所述多個(gè)算術(shù)處理單元當(dāng)中的、 與要輸入的作業(yè)相對(duì)應(yīng)的特定數(shù)量的算術(shù)處理單元相連接的傳輸路徑的通信路徑,并且由 所述管理裝置將所述作業(yè)輸入至經(jīng)由所確定的通信路徑連接的所述特定數(shù)量的算術(shù)處理 單元;以及 由包括在所述信息處理系統(tǒng)中的控制設(shè)備控制經(jīng)由使所述算術(shù)處理單元相連接的傳 輸路徑當(dāng)中的、沒(méi)有包括在所述通信路徑中的傳輸路徑所連接的算術(shù)處理單元的發(fā)送/接 收電路。
【文檔編號(hào)】G06F15/16GK104111911SQ201410123639
【公開(kāi)日】2014年10月22日 申請(qǐng)日期:2014年3月28日 優(yōu)先權(quán)日:2013年4月18日
【發(fā)明者】宮崎博行 申請(qǐng)人:富士通株式會(huì)社