專利名稱:提交給網(wǎng)格環(huán)境的網(wǎng)格作業(yè)使用前的資源功能性驗(yàn)證的制作方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及改進(jìn)的網(wǎng)格計(jì)算,特別是涉及為網(wǎng)格環(huán)境之內(nèi)的各資源 進(jìn)行資源功能性的自動(dòng)驗(yàn)證。更特別地是,本發(fā)明涉及在允許提交給網(wǎng)格環(huán) 境的網(wǎng)格作業(yè)路由至各資源之前,驗(yàn)證網(wǎng)格資源功能性,使得確保處理各網(wǎng)
格作業(yè)的各資源的功能性。
背景技術(shù):
自從兩個(gè)計(jì)算機(jī)系統(tǒng)之間進(jìn)行第一次連接之后,經(jīng)由連接,在兩個(gè)計(jì)算 機(jī)系統(tǒng)之間傳輸數(shù)據(jù)、資源以及其它信息的新方法就持續(xù)發(fā)展。在典型的網(wǎng) 絡(luò)架構(gòu)中,當(dāng)兩個(gè)計(jì)算機(jī)系統(tǒng)正在經(jīng)由連接交換數(shù)據(jù)時(shí), 一個(gè)計(jì)算機(jī)系統(tǒng)被 認(rèn)為是發(fā)送請(qǐng)求的客戶端,而另一個(gè)被認(rèn)為是處理請(qǐng)求并且返回結(jié)果的服務(wù) 器。在努力提高處理請(qǐng)求的速度時(shí),服務(wù)器系統(tǒng)在尺寸和速度上持續(xù)擴(kuò)展。 進(jìn)一步,在努力處理當(dāng)每秒鐘到達(dá)多個(gè)請(qǐng)求的峰值時(shí)段時(shí),服務(wù)器系統(tǒng)經(jīng)常
結(jié)合到一起作為群(group),各請(qǐng)求在群組的(grouped)服務(wù)器中辟皮分配。 已經(jīng)開發(fā)了群組(grouping)服務(wù)器的多種方法,如集群(clustering),多系 統(tǒng)共享數(shù)據(jù)(sysplex)環(huán)境以及企業(yè)系統(tǒng)。在服務(wù)器機(jī)群(cluster)的情形, 一臺(tái)服務(wù)器典型地被指派來管理各進(jìn)入請(qǐng)求和各輸出響應(yīng)的分布。其它服務(wù) 器典型地并行操作,以處理來自各客戶端的分布的請(qǐng)求。因此,機(jī)群中的多 個(gè)服務(wù)器之一可服務(wù)客戶端請(qǐng)求,而不用客戶端檢測(cè)服務(wù)器機(jī)群正在處理該 請(qǐng)求。
典型地,各服務(wù)器或各服務(wù)器群運(yùn)行在特別的網(wǎng)絡(luò)平臺(tái)上,如Unix或 Unix的一些變形,并提供主機(jī)環(huán)境以運(yùn)行各應(yīng)用。每個(gè)網(wǎng)絡(luò)平臺(tái)可提供各功 能,范圍從數(shù)據(jù)庫集成、集群服務(wù)以及安全到工作負(fù)載管理和問題確定。每 個(gè)網(wǎng)絡(luò)平臺(tái)典型地提供不同的實(shí)現(xiàn)、語義(semantic)行為以及應(yīng)用編程接 口 (API)。
然而,僅僅群組各服務(wù)器到一起以擴(kuò)展處理能力,是改進(jìn)網(wǎng)絡(luò)中的響應(yīng)
時(shí)間的效率的有限的方法。因此在公司網(wǎng)絡(luò)內(nèi),與日俱增地,各服務(wù)器和各 服務(wù)器系統(tǒng)的群被組織為分布的資源,而不是僅僅群組各服務(wù)器。加大了努
各周期(cycle)以及改進(jìn)交互的其他方式。進(jìn)一步,加大了努力以將各非必 要組件從一個(gè)公司網(wǎng)絡(luò)外包(outsource)到服務(wù)提供商網(wǎng)絡(luò)的組件。而且, 存在如下趨勢(shì)(movement):協(xié)調(diào)未服從(subject to)同樣管理系統(tǒng)的各資 源之間的資源共享,但是仍然處理安全、策略、支付以及會(huì)員資格的問題。 例如,個(gè)人桌面上的資源,典型地未服從同樣的管理系統(tǒng),成為公司服務(wù)器 機(jī)群的資源。即使公司網(wǎng)絡(luò)內(nèi)的不同管理組也可能實(shí)現(xiàn)截然不同的管理系 統(tǒng)。
分散資源的問題已經(jīng)導(dǎo)致網(wǎng)格技術(shù)的發(fā)展,所述網(wǎng)格技術(shù)使用各公開標(biāo) 準(zhǔn)用于操作網(wǎng)格環(huán)境,所述各資源從運(yùn)行在不同網(wǎng)絡(luò)平臺(tái)的服務(wù)器和其它計(jì) 算系統(tǒng)(位于不同的區(qū)域、具有不同的安全協(xié)議,并且每一個(gè)由不同的管理 系統(tǒng)控制)可獲得。網(wǎng)格環(huán)境支持在動(dòng)態(tài)、分布式及虛擬組織中共享和協(xié)同 使用不同的資源。當(dāng)各資源的選擇被組織來處理作業(yè)請(qǐng)求時(shí),虛擬組織在網(wǎng) 格環(huán)境內(nèi)被創(chuàng)建,所述各資源來自地理上分布的各系統(tǒng),該系統(tǒng)由具有不同 的政策和管理系統(tǒng)的不同組織運(yùn)行。
盡管各機(jī)群或其它各服務(wù)器群可以在網(wǎng)格環(huán)境內(nèi)被群組,然而網(wǎng)格技術(shù) 不解決與確保性能和服務(wù)的質(zhì)量相關(guān)聯(lián)的所有問題,其中各資源的群由具有 處理網(wǎng);f各作業(yè)的不同標(biāo)準(zhǔn)的不同管理系統(tǒng)管理。特別的,網(wǎng)襠、技術(shù)的貢獻(xiàn)和 好處是,各資源在周圍被移動(dòng)到不同的虛擬結(jié)構(gòu)中,也被稱作執(zhí)行環(huán)境,以 優(yōu)化可用的資源。提交各作業(yè)到任何計(jì)算系統(tǒng)的各客戶端,期望提供來處理 網(wǎng)格作業(yè)的各資源是功能性的。然而,網(wǎng)格環(huán)境中的問題是,隨著每個(gè)資源 重新分配到新的執(zhí)行環(huán)境,然而資源的功能性不再被驗(yàn)證。例如,當(dāng)網(wǎng)絡(luò)適 配器被分配到新的執(zhí)行環(huán)境中時(shí),網(wǎng)絡(luò)適配器的連接性不再被驗(yàn)證,除非系 統(tǒng)管理者運(yùn)行測(cè)試來確保該網(wǎng)絡(luò)適配器的連接性。隨著網(wǎng)格環(huán)境中資源和資 源重新分配的數(shù)量的增加,利用系統(tǒng)管理者來為每個(gè)資源手動(dòng)地選擇和運(yùn)行 測(cè)試,將劣化性能。
鑒于前述,需要有一種計(jì)算機(jī)實(shí)現(xiàn)的方法、系統(tǒng)和程序,用于在將網(wǎng)格 作業(yè)路由至資源之前,檢測(cè)執(zhí)行環(huán)境中的各新資源、測(cè)試每個(gè)資源的功能性、 并且驗(yàn)證該資源的功能性,以確保提交到網(wǎng)格環(huán)境的每個(gè)作業(yè)的服務(wù)質(zhì)量。
發(fā)明內(nèi)容
鑒于前述,本發(fā)明通常提供改進(jìn)的網(wǎng)格計(jì)算,并且特別是為在網(wǎng)格環(huán)境 內(nèi)的各資源的資源功能性的自動(dòng)驗(yàn)證。更特別的是,本發(fā)明涉及在允許將提 交到網(wǎng)格環(huán)境的網(wǎng)格作業(yè)路由到執(zhí)行環(huán)境中的各資源之前、驗(yàn)證執(zhí)行環(huán)境內(nèi) 的各資源,使得確保處理各網(wǎng)格作業(yè)的各資源的功能性。
在 一 個(gè)實(shí)施例中,當(dāng)新的資源被分配到網(wǎng)格環(huán)境內(nèi)的特定的執(zhí)行環(huán)境 時(shí),網(wǎng)格驗(yàn)證服務(wù)在由網(wǎng)格管理系統(tǒng)的控制的新資源上自動(dòng)地選擇并運(yùn)行至 少一項(xiàng)功能性測(cè)試,所述網(wǎng)格環(huán)境由網(wǎng)格管理系統(tǒng)管理。響應(yīng)于功能性測(cè)試 的結(jié)果,網(wǎng)格驗(yàn)證系統(tǒng)在允許將該網(wǎng)格作業(yè)路由到新資源前,驗(yàn)證該結(jié)果是 否符合期望的結(jié)果,使得在允許訪問新資源之前,該新資源的功能性被自動(dòng) 地驗(yàn)證,以保持處理各網(wǎng)格作業(yè)中的服務(wù)的質(zhì)量。
當(dāng)新的資源被增加到之前已測(cè)試功能性的各資源的、存在的執(zhí)行環(huán)境
時(shí),網(wǎng)格管理系統(tǒng)可檢測(cè)到新的資源被分配到特定的執(zhí)行環(huán)境。此外,網(wǎng) 格管理系統(tǒng)可檢測(cè)到,新的資源被分配到特定的新建立的執(zhí)行環(huán)境,因此該 執(zhí)行環(huán)境中的所有資源需要測(cè)試功能性。進(jìn)一步,網(wǎng)格管理系統(tǒng)可檢測(cè)到新 的資源被分配到特定的執(zhí)行環(huán)境,以替代該執(zhí)行環(huán)境中有缺陷的資源。
當(dāng)在新資源上運(yùn)行至少一項(xiàng)功能性測(cè)試時(shí),可以根據(jù)資源的類型、以及 根據(jù)資源的類或資源品牌(brand)進(jìn)一步指定的,選擇各測(cè)試。 一類功能性 測(cè)試從網(wǎng)格管理系統(tǒng)指引測(cè)試作業(yè)到新的資源,并且收集該測(cè)試作業(yè)的測(cè)試 結(jié)果。另一類功能性測(cè)試調(diào)用允許在本地(local)測(cè)試新資源的診斷工具, 并且接收指示各測(cè)試結(jié)果的日志文件。
如果在結(jié)果中檢測(cè)到錯(cuò)誤條件,網(wǎng)格驗(yàn)證服務(wù)可嘗試解決該錯(cuò)誤。如果 該錯(cuò)誤被解決,那么網(wǎng)格驗(yàn)證服務(wù)驗(yàn)證新資源的功能性。作為替代,如果錯(cuò) 誤沒有解決,那么網(wǎng)格驗(yàn)證服務(wù)指明該錯(cuò)誤,并且網(wǎng)格管理系統(tǒng)可嘗試取代 該資源。
從第一方面來看,本發(fā)明包括一種方法,用于為網(wǎng)格環(huán)境里提交的網(wǎng)格 作業(yè)驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源,其包括在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格 環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資源,其中所述特定的執(zhí)行環(huán)境包括為 處理網(wǎng)格作業(yè)而群組的多個(gè)網(wǎng)格資源;在由所述網(wǎng)格管理系統(tǒng)控制的所述新 資源上運(yùn)行至少一項(xiàng)功能性測(cè)試;以及響應(yīng)于接收所述至少一項(xiàng)功能性測(cè)試 的結(jié)果,在允許將所述網(wǎng)格作業(yè)路由到所述新資源之前,驗(yàn)證所述結(jié)果是否
符合期望的各結(jié)果,使得在允許訪問所述新資源之前,所述新資源的功能性 被自動(dòng)地驗(yàn)證。
優(yōu)選地,本發(fā)明提供一種方法,其驗(yàn)證特定的執(zhí)行環(huán)境中的資源,其中, 在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資源,進(jìn)
一步包括檢測(cè)所述新資源,其中所述新資源被添加到所述執(zhí)行環(huán)境,所述 執(zhí)行環(huán)境包括之前測(cè)試過功能性的多個(gè)資源。
優(yōu)選地,本發(fā)明提供一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境中的資源, 其中在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資 源,進(jìn)一步包括檢測(cè)所述新資源,其中所述新資源被添加到所述執(zhí)行環(huán)境, 所述執(zhí)行環(huán)境包括要求測(cè)試功能性的多個(gè)附加的資源。
優(yōu)選地,本發(fā)明提供一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境中的資源, 其中在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資 源,進(jìn)一步包括檢測(cè)所述新資源,其中所述新資源被添加到所述執(zhí)行環(huán)境 以替代有缺陷的資源。
優(yōu)選地,本發(fā)明提供一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少 一項(xiàng)功能性測(cè)試, 進(jìn)一步包括從所述網(wǎng)格管理系統(tǒng)將測(cè)試作業(yè)導(dǎo)向所述新資源;以及接收所 述測(cè)試作業(yè)的測(cè)試結(jié)果。
優(yōu)選地,本發(fā)明包括一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng)功能性測(cè) 試,進(jìn)一步包括調(diào)用能夠在本地測(cè)試所述新資源的診斷工具;以及從指示 至少一個(gè)測(cè)試結(jié)果的所述診斷工具接收日志文件。
優(yōu)選地,本發(fā)明提供一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 進(jìn)一步包括對(duì)多個(gè)指定的錯(cuò)誤條件,分析所述結(jié)果;以及響應(yīng)于從所述多 個(gè)指定的錯(cuò)誤條件檢測(cè)至少一個(gè)錯(cuò)誤,嘗試解決所述至少一個(gè)錯(cuò)誤;以及響 應(yīng)于解決所述錯(cuò)誤,驗(yàn)證所述結(jié)果是否符合所述期望的結(jié)果。
優(yōu)選地,本發(fā)明提供一種方法,其用于檢查特定的執(zhí)行環(huán)境內(nèi)的資源, 進(jìn)一 步包括響應(yīng)于所述錯(cuò)誤保持未解決替換所述執(zhí)行環(huán)境中的所述新資 源。
優(yōu)選地,本發(fā)明提供一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 進(jìn)一步包括接收至少一項(xiàng)來自提交所述網(wǎng)格作業(yè)的客戶端的測(cè)試標(biāo)準(zhǔn);以
及響應(yīng)于允許將所述網(wǎng)格作業(yè)路由到所述新的資源,當(dāng)執(zhí)行所述網(wǎng)格作業(yè) 時(shí),按所述至少 一項(xiàng)測(cè)試標(biāo)準(zhǔn)運(yùn)行所述至少 一項(xiàng)功能性測(cè)試。
優(yōu)選地,本發(fā)明包括一種方法,其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中所述網(wǎng)格管理系統(tǒng)管理將所述網(wǎng)格環(huán)境內(nèi)的多個(gè)網(wǎng)格資源分配到多個(gè) 執(zhí)行環(huán)境。
從第二方面來看,本發(fā)明提供一種系統(tǒng),其用于為網(wǎng)格環(huán)境中提交的網(wǎng)
格作業(yè),驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源,包括網(wǎng)格環(huán)境,其包括由網(wǎng)格管 理系統(tǒng)管理的多個(gè)網(wǎng)格資源;網(wǎng)格服務(wù),其在所述網(wǎng)格環(huán)境內(nèi)由所述網(wǎng)格管 理系統(tǒng)支持;所述網(wǎng)格服務(wù)進(jìn)一步包括用于在所述網(wǎng)格環(huán)境內(nèi)檢測(cè)特定的 執(zhí)行環(huán)境中的新資源的裝置,其中所述特定的執(zhí)行環(huán)境包括為處理網(wǎng)格作業(yè) 而群組的多個(gè)網(wǎng)格資源;用于在由所述網(wǎng)格管理系統(tǒng)控制的所述新的資源上 運(yùn)行至少一項(xiàng)功能性測(cè)試的裝置;以及用于響應(yīng)于接收所述至少一項(xiàng)功能性 測(cè)試的結(jié)果、在允許將所述網(wǎng)格工作路由到所述新的資源之前、驗(yàn)證所述結(jié) 果是否符合各期望的結(jié)果的裝置。
優(yōu)選地,本發(fā)明提供一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述用于在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi)、檢測(cè)特定的執(zhí)行環(huán)境 中的新的資源的裝置,進(jìn)一步包括用于檢測(cè)所述新的資源的裝置,其中所 述新的資源被加到所述執(zhí)行環(huán)境,該執(zhí)行環(huán)境包括之前測(cè)試過功能性的多個(gè) 資源。
優(yōu)選地,本發(fā)明提供一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述用于在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi)、檢測(cè)特定的執(zhí)行環(huán)境 中的新的資源的裝置,進(jìn)一步包括用于檢測(cè)所述新的資源的裝置,其中所 述新的資源被加到所述執(zhí)行環(huán)境,該執(zhí)行環(huán)境包括需要測(cè)試功能性的多個(gè)附 力口的資源。
優(yōu)選地,本發(fā)明提供一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述用于在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi)、檢測(cè)特定的執(zhí)行環(huán)境 中的新的資源的裝置,進(jìn)一步包括用于檢測(cè)所述新的資源的裝置,其中所 述新的資源被加到所述執(zhí)行環(huán)境,以替代有缺陷的資源。
優(yōu)選地,本發(fā)明提供一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述用于由網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng)功能性測(cè) 試的裝置,進(jìn)一步包括用于將測(cè)試作業(yè)從所述網(wǎng)格管理系統(tǒng)導(dǎo)向所述新的
資源的裝置;以及用于接收所述測(cè)試作業(yè)的測(cè)試結(jié)果的裝置。
優(yōu)選地,本發(fā)明提供一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述裝置用于由網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少 一項(xiàng)功能
性測(cè)試,進(jìn)一步包括用于調(diào)用能夠在本地測(cè)試所述新資源的診斷工具的裝 置;以及用于從指示至少一項(xiàng)測(cè)試結(jié)果的所述診斷工具接收日志文件的裝置。
優(yōu)選地,本發(fā)明提供一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 所述網(wǎng)格服務(wù)進(jìn)一步包括用于對(duì)多個(gè)指定的錯(cuò)誤條件分析所述結(jié)果的裝 置;以及響應(yīng)于從所述多個(gè)指定的錯(cuò)誤條件中檢測(cè)至少一個(gè)錯(cuò)誤、用于嘗試 解決所述至少一個(gè)錯(cuò)誤的裝置;以及用于響應(yīng)于解決所述錯(cuò)誤-險(xiǎn)證所述結(jié)果 是否符合所述期望的結(jié)果的裝置。
優(yōu)選地,本發(fā)明包括一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述網(wǎng)格服務(wù)進(jìn)一步包括響應(yīng)于所述錯(cuò)誤保持未解決替換所述執(zhí)行 環(huán)境中的所述新的資源的裝置。
優(yōu)選地,本發(fā)明包括一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中,所述網(wǎng)格服務(wù)進(jìn)一步包括用于從提交所述網(wǎng)格作業(yè)的客戶端接收至 少 一項(xiàng)測(cè)試標(biāo)準(zhǔn)的裝置;以及響應(yīng)于允許將所述網(wǎng)格作業(yè)路由到所述新的資 源、用于當(dāng)執(zhí)行所述網(wǎng)格作業(yè)時(shí)、按所述至少一項(xiàng)測(cè)試標(biāo)準(zhǔn)運(yùn)行所述至少一 項(xiàng)功能性測(cè)試的裝置。
優(yōu)選地,本發(fā)明包括一種系統(tǒng),其用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源, 其中所述網(wǎng)格管理系統(tǒng)管理將所述網(wǎng)格環(huán)境內(nèi)的多個(gè)網(wǎng)格資源分配到多個(gè) 執(zhí)行環(huán)境。
從第三方面來看,本發(fā)明包括計(jì)算機(jī)程序產(chǎn)品,其可以加載到數(shù)字計(jì) 算機(jī)的內(nèi)部存儲(chǔ)器中,該計(jì)算機(jī)程序產(chǎn)品包括軟件代碼部分,當(dāng)所述產(chǎn)品在 計(jì)算機(jī)上運(yùn)行時(shí),用于執(zhí)行以實(shí)現(xiàn)如上所述的發(fā)明。
下面參照附圖,僅以示例的方式詳細(xì)描述本發(fā)明的各實(shí)施例,附圖中 圖1描述計(jì)算機(jī)系統(tǒng)的一個(gè)實(shí)施例,該計(jì)算機(jī)系統(tǒng)可以在網(wǎng)格環(huán)境中實(shí) 現(xiàn),并且本發(fā)明可以在該計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn);
圖2是圖示網(wǎng)格環(huán)境內(nèi)的 一般類型的各組件的 一個(gè)實(shí)施例的方框圖3是描述可以在網(wǎng)格環(huán)境中實(shí)現(xiàn)的架構(gòu)的 一 個(gè)示例的方框圖4是描述根據(jù)本發(fā)明的方法、系統(tǒng)和程序、管理網(wǎng)格環(huán)境中的多個(gè)執(zhí) 行環(huán)境的網(wǎng)格管理系統(tǒng)的 一個(gè)實(shí)例的方框圖;以及
圖5是描述根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、管理網(wǎng)格環(huán)境的網(wǎng)格管 理系統(tǒng)的方框圖的方框圖6是描述根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、網(wǎng)格驗(yàn)證服務(wù)的各組件 的示例的方框圖的方框圖7是描述根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、測(cè)試有效性(availability) 表格中的各項(xiàng)的圖示例的方框圖8是根據(jù)本發(fā)明的方法、系統(tǒng)和程序的過程和程序的高級(jí)邏輯流程圖, 所述過程和程序用于在網(wǎng)格作業(yè)的執(zhí)行環(huán)境中,控制網(wǎng)格作業(yè)路由至驗(yàn)證的 各資源;以及
圖9是根據(jù)本發(fā)明的方法、系統(tǒng)和程序的過程和程序的高級(jí)邏輯流程圖, 所述過程和程序用于在網(wǎng)格作業(yè)提交給各資源之前、對(duì)于加至用于網(wǎng)才各作業(yè) 的執(zhí)行環(huán)境的各資源控制資源驗(yàn)證。
具體實(shí)施例方式
現(xiàn)在參照各附圖尤其是圖1,描述計(jì)算機(jī)系統(tǒng)的一個(gè)實(shí)施例,該計(jì)算機(jī) 系統(tǒng)可以在網(wǎng)格環(huán)境中實(shí)現(xiàn),并且本發(fā)明可以在該計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)。如將 進(jìn)一步描述的,該網(wǎng)格環(huán)境包括多個(gè)計(jì)算機(jī)系統(tǒng),其被管理以提供各資源。 此外,如將進(jìn)一步描述的,本發(fā)明可以在各種計(jì)算機(jī)系統(tǒng)中執(zhí)行,包括在 網(wǎng)格環(huán)境內(nèi)管理的多個(gè)不同操作系統(tǒng)下運(yùn)行的各種電子設(shè)備、移動(dòng)系統(tǒng)以及 計(jì)算系統(tǒng)。
在一個(gè)實(shí)施例中,計(jì)算機(jī)系統(tǒng)100包括總線122,或用于在計(jì)算機(jī)系 統(tǒng)100內(nèi)通信信息的其它設(shè)備;以及至少一個(gè)處理設(shè)備,如處理器112,其 耦合至總線122以處理信息??偩€122可以包括低延遲和較高延遲的各路徑, 其由各橋和各適配器連接,并且由多個(gè)總線控制器在計(jì)算機(jī)系統(tǒng)100內(nèi)控制。 當(dāng)作為服務(wù)器系統(tǒng)實(shí)現(xiàn)時(shí),計(jì)算機(jī)系統(tǒng)IOO典型地包括多個(gè)處理器,其被設(shè) 計(jì)以改進(jìn)網(wǎng)絡(luò)服務(wù)能力。
處理器112可以是通用處理器,如IBM的PowerPC 處理器,在通常 的操作過程中,其在操作系統(tǒng)和應(yīng)用軟件的控制下處理數(shù)據(jù),該操作系統(tǒng)和應(yīng)用軟件可從動(dòng)態(tài)存儲(chǔ)器件(如隨機(jī)訪問存儲(chǔ)器(RAM) 114)和靜態(tài)存儲(chǔ) 器件(如只讀存儲(chǔ)器(ROM) 116)訪問。該操作系統(tǒng)可以提供圖形用戶接 口 (GUI)給用戶。在一個(gè)實(shí)施例中,應(yīng)用軟件包含機(jī)器可執(zhí)行的各指令, 當(dāng)其在處理器112上執(zhí)行時(shí),實(shí)現(xiàn)在圖8和圖9的流程圖中描述的各操作, 以及這里描述的其他操作。作為替代,本發(fā)明的各步驟可由特定的各硬件組 件來執(zhí)行,其包含用于執(zhí)行各步驟的硬件邏輯,或是由編程的計(jì)算機(jī)組件和 傳統(tǒng)硬件組件的任何結(jié)合來執(zhí)行。
本發(fā)明可以作為計(jì)算機(jī)程序產(chǎn)品提供,在其上存儲(chǔ)的機(jī)器可讀介質(zhì)上包 括機(jī)器可執(zhí)行的各指令,所述各指令用于編程計(jì)算機(jī)系統(tǒng)100以執(zhí)行根據(jù)本 發(fā)明的處理。這里使用的術(shù)語"機(jī)器可讀介質(zhì)"包括參與提供各指令給處 理器112、或計(jì)算機(jī)系統(tǒng)100的其它組件用于執(zhí)行的任何介質(zhì)。這樣的介質(zhì) 可以采取多種形式,包括但不僅于非易失性介質(zhì)、易失性介質(zhì)以及傳輸介 質(zhì)。非易失性介質(zhì)的通常形式包括例如軟盤、軟磁盤、硬盤、磁帶或任何其 它》茲性介質(zhì)、致密盤ROM (CD-ROM)或任何其它光介質(zhì)、穿孔卡片或任 何其它具有孔的模式的物理介質(zhì)、可編程ROM (PROM)、可擦除PROM (EPROM)、電子EPROM (EEPROM)、快閃存儲(chǔ)器、任何其它存儲(chǔ)器芯片 或磁帶盒、或計(jì)算機(jī)系統(tǒng)100可以從其讀取并且其適于存儲(chǔ)各指令的任何其 它介質(zhì)。在本實(shí)施例中,非易失性介質(zhì)的一個(gè)例子是大容量存儲(chǔ)設(shè)備118, 該大容量存儲(chǔ)設(shè)備118正如所描述的是計(jì)算機(jī)系統(tǒng)100的內(nèi)部組件,但將理 解也可以由外部設(shè)備提供。易失性介質(zhì)包括如RAM 114的動(dòng)態(tài)存儲(chǔ)器。傳 輸介質(zhì)包括同軸電纜、銅線或光纖,包括包含總線122的線。傳輸介質(zhì)也可 以采取聲波或光波的形式,如在無線頻率或紅外數(shù)據(jù)通信期間產(chǎn)生的那些 波。
此外,本發(fā)明被可以下載作為計(jì)算機(jī)程序產(chǎn)品,其中各程序指令可以通 過嵌入在載波或其它傳播介質(zhì)中的各數(shù)據(jù)信號(hào),經(jīng)由耦合至總線122的通信 接口 132的網(wǎng)絡(luò)鏈路134(例如調(diào)制解調(diào)器或網(wǎng)絡(luò)連接),從遠(yuǎn)程虛擬資源(如 虛擬資源160)傳送到請(qǐng)求計(jì)算機(jī)系統(tǒng)100。虛擬資源160可以包括各資源 的虛擬表示,所述各資源可從單個(gè)系統(tǒng)或多個(gè)系統(tǒng)訪問,其中所述多個(gè)系統(tǒng) 每個(gè)都可以被認(rèn)為是在各獨(dú)立平臺(tái)上操作的各資源的各離散集,但是通過網(wǎng) 格管理器協(xié)同作為虛擬資源。通信接口 132提供雙向的數(shù)據(jù)通信,其耦合到 可被連接的網(wǎng)絡(luò)鏈路134,例如至局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)或提供
至網(wǎng)絡(luò)102的訪問的網(wǎng)絡(luò)服務(wù)提供商(ISP)。特別地,網(wǎng)絡(luò)鏈路134可以提 供有線和/或無線網(wǎng)絡(luò)通信到一個(gè)或多個(gè)網(wǎng)絡(luò),如網(wǎng)絡(luò)102,通過網(wǎng)絡(luò)鏈路 134,如在網(wǎng)格環(huán)境150內(nèi)提供的,各虛擬資源(如虛擬資源160)可以訪問。 網(wǎng)格環(huán)境150可以是多種類型的網(wǎng)絡(luò)的部分,包括點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò),或者可以是 單個(gè)計(jì)算機(jī)系統(tǒng)的部分,如計(jì)算機(jī)系統(tǒng)100。
作為一個(gè)例子,網(wǎng)絡(luò)102可以指全世界的網(wǎng)絡(luò)和網(wǎng)關(guān)的集合,其使用特 定的協(xié)議,如傳輸控制協(xié)議(TCP )和互聯(lián)網(wǎng)協(xié)議(IP )相互通信。網(wǎng)絡(luò)102 使用攜帶數(shù)字?jǐn)?shù)據(jù)流的電子、電磁或光信號(hào)。通過各種網(wǎng)絡(luò)的各信號(hào)和網(wǎng)絡(luò) 鏈路D4上并通過通信接口 132的各信號(hào),是傳輸信息的各載波的示例性形 式,該通信接口 132傳送數(shù)字?jǐn)?shù)據(jù)來往計(jì)算機(jī)系統(tǒng)100。將會(huì)理解,可以實(shí) 現(xiàn)可替換的網(wǎng)絡(luò)的類型、網(wǎng)絡(luò)的組合以及網(wǎng)絡(luò)的基礎(chǔ)架構(gòu)(infrastructure )。
當(dāng)被實(shí)施為服務(wù)器系統(tǒng)時(shí),計(jì)算機(jī)系統(tǒng)IOO典型地包括多個(gè)通信接口, 所述多個(gè)通信接口經(jīng)由多個(gè)外圍組件互連(PCI)總線橋可訪問,所述多個(gè) 外圍組件互連(PCI)總線橋連接到輸入/輸出控制器。在這種方式中,計(jì)算 機(jī)系統(tǒng)100允許連接到多個(gè)網(wǎng)絡(luò)計(jì)算機(jī)。
此外,盡管沒有描述,多個(gè)外圍組件以及內(nèi)部/外部設(shè)備可以添加到計(jì)算 機(jī)系統(tǒng)IOO,連接到多個(gè)控制器、適配器、以及耦合至總線122的多個(gè)層次 之一的擴(kuò)展槽。例如,顯示設(shè)備、音頻設(shè)備、鍵盤或光標(biāo)控制設(shè)備可以添加 為外圍組件。
本領(lǐng)域的普通技術(shù)人員將認(rèn)識(shí)到,圖1中描述的硬件可以變化。而且, 本領(lǐng)域中的普通技術(shù)人員將認(rèn)識(shí)到,根據(jù)本發(fā)明,描述的例子意圖不在于意 味對(duì)架構(gòu)的限制。
現(xiàn)在參照?qǐng)D2,方框示了網(wǎng)格環(huán)境內(nèi)的普通類型的各組件的一個(gè)實(shí) 施例。在本示例中,網(wǎng)格環(huán)境150的各組件包括客戶端系統(tǒng)200,其與網(wǎng) 格管理系統(tǒng)240接口,該網(wǎng)格管理系統(tǒng)240與各服務(wù)器機(jī)群222、各服務(wù)器 224、各工作站和各臺(tái)式電腦226、各數(shù)據(jù)存儲(chǔ)系統(tǒng)228以及各網(wǎng)絡(luò)230接口 。 為了說明的目的,網(wǎng)格環(huán)境150內(nèi)連接到各組件的網(wǎng)絡(luò)類型和各網(wǎng)絡(luò)的位置 不做描述。然而將要理解,網(wǎng)格環(huán)境150內(nèi)的各組件可以位于網(wǎng)絡(luò)基礎(chǔ)架構(gòu) 之上,該網(wǎng)絡(luò)基礎(chǔ)架構(gòu)可以用互相重疊的多種類型的網(wǎng)絡(luò)實(shí)現(xiàn)。網(wǎng)絡(luò)基礎(chǔ)架 構(gòu)范圍可以從多個(gè)大型企業(yè)系統(tǒng)到對(duì)單個(gè)計(jì)算機(jī)系統(tǒng)的點(diǎn)對(duì),長系統(tǒng)。進(jìn)一 步,將要理解,網(wǎng)格環(huán)境150內(nèi)的各組件僅僅代表網(wǎng)格環(huán)境150內(nèi)的這類組
件。網(wǎng)格環(huán)境可以簡(jiǎn)單地被包含在單個(gè)計(jì)算機(jī)系統(tǒng)中或可以包含多個(gè)企業(yè)系
統(tǒng)。此外,將會(huì)理解,網(wǎng)格出售者(vendor)可以提供網(wǎng)格環(huán)境150,該網(wǎng) 格出售者可以例如基于要執(zhí)行的網(wǎng)格作業(yè)需要的時(shí)間量、或使用的各資源的 實(shí)際量,計(jì)算網(wǎng)格環(huán)境150內(nèi)使用各資源的成本。
如網(wǎng)格環(huán)境150的網(wǎng)格環(huán)境的主要目的是組織和分配各資源,所述各資 源來自被視為虛擬資源160的多個(gè)離散系統(tǒng)。客戶端系統(tǒng)200、各服務(wù)器機(jī) 群222、各服務(wù)器224、各工作站和各臺(tái)式電腦226、各數(shù)據(jù)存儲(chǔ)系統(tǒng)228、 各網(wǎng)絡(luò)230以及創(chuàng)建網(wǎng)格管理系統(tǒng)240的各系統(tǒng)可以是異構(gòu)的,并且隨著各 獨(dú)立管理系統(tǒng)區(qū)域性地分布,但是通過由網(wǎng)格管理系統(tǒng)240允許的網(wǎng)格基礎(chǔ) 架構(gòu),能夠交換信息、各資源和各服務(wù)。進(jìn)一步,各服務(wù)器機(jī)群222、各服 務(wù)器224、各工作站和各臺(tái)式電腦226、各數(shù)據(jù)存儲(chǔ)系統(tǒng)228、以及各網(wǎng)絡(luò) 230,可以3爭(zhēng)越各國家和各大陸地理地分布,或者對(duì)于彼此本地可訪問。將 會(huì)理解,用于虛擬資源160內(nèi)的各網(wǎng)格資源的發(fā)現(xiàn)的機(jī)制在此沒有描述,然 而,客戶端系統(tǒng)200可以發(fā)現(xiàn)虛擬資源160內(nèi)的各資源,如從網(wǎng)格環(huán)境150 內(nèi)可獲得的局部(local)和全局目錄通告(advertise )的。
在本例中,客戶端系統(tǒng)200接口網(wǎng)格管理系統(tǒng)240??蛻舳讼到y(tǒng)200可 以代表向網(wǎng)格管理系統(tǒng)240發(fā)送請(qǐng)求的任何計(jì)算系統(tǒng)。特別是,客戶端200 可以發(fā)送各虛擬作業(yè)請(qǐng)求和各作業(yè)到網(wǎng)格管理系統(tǒng)240,并且網(wǎng)格管理系統(tǒng) 240可以用網(wǎng)格提供(offer)做出響應(yīng),并且控制各網(wǎng)格作業(yè)的處理。進(jìn)一 步,盡管在本實(shí)施例中,客戶端系統(tǒng)200被描述為用請(qǐng)求來訪問網(wǎng)格環(huán)境 150,然而在替代實(shí)施例中,客戶端200也可以在網(wǎng)格環(huán)境150內(nèi)運(yùn)行。
盡管虛擬資源160內(nèi)的各系統(tǒng)被并行地描述,然而實(shí)際上,各系統(tǒng)可以 是各系統(tǒng)的部分層次,虛擬資源160內(nèi)的一些系統(tǒng)對(duì)客戶端系統(tǒng)200來說可 以是本地的,而其它系統(tǒng)需要訪問外部網(wǎng)絡(luò)。此外,重要的是注意到,客戶 端系統(tǒng)200可以物理地包含虛擬資源160內(nèi)描述的各系統(tǒng)。進(jìn)一步,虛擬資 源160中的各系統(tǒng)可以在各資源節(jié)點(diǎn)和各執(zhí)行環(huán)境中分配,這里,資源節(jié)點(diǎn) 是能夠執(zhí)行特定的網(wǎng)格功能的各資源的群組,而執(zhí)行環(huán)境是能夠處理特定的 網(wǎng)格作業(yè)的各資源節(jié)點(diǎn)和各資源的群組。
為了實(shí)現(xiàn)網(wǎng)格環(huán)境150,網(wǎng)格管理系統(tǒng)240便利各網(wǎng)格服務(wù)。各網(wǎng)格服 務(wù)可以根據(jù)多個(gè)架構(gòu)設(shè)計(jì),包括但不限于開放網(wǎng)格服務(wù)架構(gòu)(OGSA)。特別 地,網(wǎng)格管理系統(tǒng)240指的是,通過將各計(jì)算系統(tǒng)鏈路到異構(gòu)網(wǎng)絡(luò)環(huán)境創(chuàng)建網(wǎng)格的管理環(huán)境,其中異構(gòu)網(wǎng)絡(luò)環(huán)境具有通過各網(wǎng)格服務(wù)共享各資源的特征。
在一個(gè)示例中,如將進(jìn)一步詳細(xì)介紹的,網(wǎng)格管理系統(tǒng)240可以包括網(wǎng) 格服務(wù),其將各資源和各資源節(jié)點(diǎn)分配到執(zhí)行環(huán)境,所述執(zhí)行環(huán)境適于進(jìn)入 的網(wǎng)格作業(yè),并且在執(zhí)行環(huán)境內(nèi)管理各資源和各資源節(jié)點(diǎn),以確保網(wǎng)格作業(yè) 的性能。此外,網(wǎng)格管理系統(tǒng)可以包括網(wǎng)格服務(wù),所述網(wǎng)格服務(wù)在網(wǎng)格作業(yè) 被路由至分配的資源之前,第 一測(cè)試和驗(yàn)證分配到執(zhí)行環(huán)境的各網(wǎng)格資源。 當(dāng)^r測(cè)到錯(cuò)誤時(shí),網(wǎng)格服務(wù)將嘗試解決該錯(cuò)誤或替代該資源。
現(xiàn)在參照?qǐng)D3 ,方框示了可以在網(wǎng)格環(huán)境中實(shí)現(xiàn)的架構(gòu)的 一 個(gè)示例。 如所描述的,架構(gòu)300包括多個(gè)功能性的層。如將進(jìn)一步描述的,本發(fā)明是 可以在如架構(gòu)300的架構(gòu)的一層或多層中實(shí)現(xiàn)的過程,該架構(gòu)300在如圖2 中描述的網(wǎng)格環(huán)境的網(wǎng)格環(huán)境中實(shí)現(xiàn)。重要的是注意到,架構(gòu)300僅僅是可 以在網(wǎng)格環(huán)境中實(shí)現(xiàn)、并且本發(fā)明可以在其中實(shí)現(xiàn)的架構(gòu)的一個(gè)示例。進(jìn)一 步,重要的是注意到,多個(gè)架構(gòu)可以在網(wǎng)格環(huán)境內(nèi)實(shí)現(xiàn)。
在架構(gòu)300的各層內(nèi),首先,物理和邏輯資源層330組織網(wǎng)格中的各系 統(tǒng)的各資源。各物理資源包括但不僅限于各服務(wù)器、各存儲(chǔ)介質(zhì)以及各網(wǎng)絡(luò)。 各邏輯資源虛擬化并將物理層集合成為各可用的資源,如各操作系統(tǒng)、各處 理能力、存儲(chǔ)器、I/O處理、各文件系統(tǒng)、各數(shù)據(jù)庫管理器、各目錄、各存 儲(chǔ)器管理器以及其它資源。
其次,web服務(wù)層320在網(wǎng)格服務(wù)310與物理和邏輯資源330之間提供 接口 。 web服務(wù)層320實(shí)現(xiàn)各服務(wù)接口 ,所述各服務(wù)接口包括但不限于,在 因特網(wǎng)協(xié)議(IP )或其它網(wǎng)絡(luò)傳輸層上執(zhí)行的可擴(kuò)展標(biāo)記語言(XML )、 web 服務(wù)描述語言(WSDL)、以及簡(jiǎn)單目標(biāo)訪問協(xié)議(SOAP)。進(jìn)一步,開放 網(wǎng)格服務(wù)基礎(chǔ)架構(gòu)(OGSI)標(biāo)準(zhǔn)322,通過擴(kuò)展web服務(wù)320在當(dāng)前web 服務(wù)320之上建立,以提供模型化網(wǎng)格的各資源需要的、動(dòng)態(tài)的以及可管理 的web服務(wù)的能力。特別是,通過利用web服務(wù)320實(shí)現(xiàn)OGSI標(biāo)準(zhǔn)322, 使用OGSA設(shè)計(jì)的網(wǎng)格服務(wù)310是能互操作的。在替代實(shí)施例中,其它基礎(chǔ) 架構(gòu)或附加的基礎(chǔ)架構(gòu)可以在web服務(wù)層320上實(shí)現(xiàn)。
網(wǎng)格服務(wù)層310包括多個(gè)服務(wù),該服務(wù)可以并入到網(wǎng)格管理系統(tǒng)240中。 例如,網(wǎng)格服務(wù)層310可以包括使用OGSA設(shè)計(jì)的各網(wǎng)格服務(wù),使得在創(chuàng)建 各網(wǎng)格服務(wù)中實(shí)現(xiàn)統(tǒng)一的標(biāo)準(zhǔn)。作為替代,各網(wǎng)格服務(wù)可在多個(gè)基礎(chǔ)架構(gòu)下
設(shè)計(jì)。各網(wǎng)格服務(wù)可以群組為四個(gè)主要功能。然而將會(huì)理解,其它功能可以 由各網(wǎng)格服務(wù)執(zhí)行。
第一,資源管理服務(wù)302管理物理和邏輯資源的使用。各資源可以包括 但不僅限于各處理資源、各存儲(chǔ)器資源以及各存儲(chǔ)資源。這些資源的管理包
括調(diào)度各作業(yè)、分配各作業(yè)以及管理各作業(yè)的結(jié)果的檢索(retrieval )。資源 管理服務(wù)302監(jiān)視各資源加載并將各作業(yè)分配到網(wǎng)格的不太忙的部分,以平 衡各資源負(fù)載并吸收不期望的活動(dòng)峰值。特別是,用戶可以指定優(yōu)選的性能 級(jí)別,使得資源管理服務(wù)302分配各作業(yè),以在網(wǎng)格內(nèi)維持優(yōu)選的性能級(jí)別。
第二,信息服務(wù)304管理網(wǎng)格內(nèi)的各計(jì)算系統(tǒng)之間的通信和信息傳輸。 由于可以實(shí)現(xiàn)多個(gè)通信協(xié)議,信息服務(wù)304利用多種類型的通信協(xié)議,管理 跨越多個(gè)網(wǎng)絡(luò)的通信。
第三,數(shù)據(jù)管理服務(wù)306管理網(wǎng)格內(nèi)的數(shù)據(jù)傳輸和存儲(chǔ)。特別是,數(shù)據(jù) 管理服務(wù)306可以在網(wǎng)格內(nèi)移動(dòng)數(shù)據(jù)到各節(jié)點(diǎn),請(qǐng)求數(shù)據(jù)的作業(yè)將在該網(wǎng)格 執(zhí)行。特定類型的傳輸協(xié)議,如網(wǎng)格文件傳輸協(xié)議(GridFTP)將被實(shí)現(xiàn)。
最后,安全服務(wù)308應(yīng)用安全協(xié)議,用于在網(wǎng)格內(nèi)操作的每個(gè)系統(tǒng)的各 連接層的安全。安全服務(wù)308可以實(shí)現(xiàn)各安全協(xié)議,如開放安全套接層(SSL ) 以提供安全傳輸。進(jìn)一步,安全服務(wù)308可以提供單個(gè)登陸機(jī)制,使得一旦 用戶被授權(quán),當(dāng)在網(wǎng)格內(nèi)為用戶執(zhí)行動(dòng)作時(shí),就創(chuàng)建和使用代理證書。
多個(gè)服務(wù)可以工作在一起,以提供網(wǎng)格計(jì)算系統(tǒng)的若干關(guān)鍵功能。在第 一示例中,各計(jì)算的任務(wù)在網(wǎng)格內(nèi)分配。數(shù)據(jù)管理服務(wù)306可以把計(jì)算任務(wù) 分割成各數(shù)據(jù)分組的單獨(dú)的各網(wǎng)格服務(wù)請(qǐng)求,然后由資源管理服務(wù)302分配 和管理。各結(jié)果由數(shù)據(jù)管理系統(tǒng)收集和整理(consolidated在第二示例中, 網(wǎng)格中跨越多個(gè)計(jì)算系統(tǒng)的各存儲(chǔ)資源被視為單個(gè)虛擬的數(shù)據(jù)存儲(chǔ)系統(tǒng),由 數(shù)據(jù)管理服務(wù)306管理并由資源管理服務(wù)302監(jiān)視。
應(yīng)用層340包括各應(yīng)用程序,該應(yīng)用程序使用網(wǎng)格服務(wù)層310中可得到 的一個(gè)或多個(gè)網(wǎng)格服務(wù)。有利的是,應(yīng)用程序經(jīng)由網(wǎng)格服務(wù)層310和web服 務(wù)320,與物理和邏輯資源330接口,使得多個(gè)異構(gòu)系統(tǒng)可以交互和互操作。
現(xiàn)在參照?qǐng)D4,描述了根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、管理網(wǎng)格環(huán) 境內(nèi)的多個(gè)執(zhí)行環(huán)境的網(wǎng)格管理系統(tǒng)的示例的方框圖。如所描述的,網(wǎng)格管 理系統(tǒng)(GMS ) 240管理多個(gè)執(zhí)行環(huán)境402和410。在該示例中,每個(gè)執(zhí)行 環(huán)境402和410包括多個(gè)資源,該資源分配用來處理特定的網(wǎng)4各作業(yè)或一批
網(wǎng)格作業(yè)。將會(huì)理解,GMS 240可以物理地包括提供GMS 240的功能的多 個(gè)實(shí)例。此外,GMS 240可以被分配遍布網(wǎng)格環(huán)境150內(nèi)的多個(gè)物理系統(tǒng), 并且可以結(jié)合多個(gè)網(wǎng)格服務(wù)。
根據(jù)一個(gè)實(shí)施例,GMS240建立各網(wǎng)格資源的各執(zhí)行環(huán)境,所述各網(wǎng)格 資源能夠處理各網(wǎng)格作業(yè),并且為各網(wǎng)格作業(yè)提供特定級(jí)別的服務(wù)質(zhì)量。 GMS 240可以建立所有新資源的執(zhí)行環(huán)境,所述新資源是之前還沒有被包含 在特定的執(zhí)行環(huán)境中的資源。此外,GMS240可以建立執(zhí)行環(huán)境,然后當(dāng)需 要附加的資源時(shí)或故障資源需要替換時(shí),添加新的資源。此外,GMS240可 以為來自多個(gè)不同的客戶端的多個(gè)網(wǎng)格作業(yè),重新使用執(zhí)行環(huán)境,只要該執(zhí) 行環(huán)境符合為每個(gè)網(wǎng)格作業(yè)的性能和其它要求經(jīng)協(xié)議的規(guī)范。
在執(zhí)行環(huán)境內(nèi),每個(gè)資源可以由本地管理系統(tǒng)控制,該本地管理系統(tǒng)經(jīng) 由網(wǎng)格基礎(chǔ)架構(gòu)與GMS 240接口。此外,在執(zhí)行環(huán)境內(nèi),各群資源可以由 硬件級(jí)別管理系統(tǒng)控制,如基于機(jī)群的管理系統(tǒng),其管理遍布群組在機(jī)群中 的多個(gè)服務(wù)器系統(tǒng)的負(fù)載。將會(huì)理解,除了為示例目的描述的各配置之外的 各資源的額外配置,可以實(shí)現(xiàn)本發(fā)明。
在一個(gè)示例中,執(zhí)行環(huán)境402包括多個(gè)網(wǎng)格資源,該網(wǎng)絡(luò)資源當(dāng)被單獨(dú) 來看時(shí),包括硬件平臺(tái)404、網(wǎng)絡(luò)適配器406以及操作系統(tǒng)軟件408。這些 單獨(dú)的資源可以在多個(gè)物理地不同的地點(diǎn)中分配。進(jìn)一步,這些單獨(dú)的資源 可以是由機(jī)群管理工具管理的部分服務(wù)器系統(tǒng)的機(jī)群。
GMS 240也可以管理執(zhí)行環(huán)境410。執(zhí)行環(huán)境410包括石更件平臺(tái)412、 網(wǎng)絡(luò)適配器414以及操作系統(tǒng)軟件416。此夕卜,GMS 240將硬件平臺(tái)404從 執(zhí)行環(huán)境402移到執(zhí)行環(huán)境410。
為了說明本發(fā)明的優(yōu)點(diǎn),當(dāng)GMS 240將硬件平臺(tái)404分配到執(zhí)行環(huán)境 410時(shí),硬件平臺(tái)404被認(rèn)為是新的資源,其在允許任何網(wǎng)格作業(yè)路由到執(zhí) 行環(huán)境410以在硬件平臺(tái)404上執(zhí)行之前,需要功能性驗(yàn)證。在一個(gè)示例中, GMS 240調(diào)用操作系統(tǒng)軟件416的硬件測(cè)試診斷工具430,以請(qǐng)求硬件測(cè)試 診斷工具430執(zhí)行硬件平臺(tái)404的功能性診斷測(cè)試。此外,在硬件平臺(tái)404 上執(zhí)行的操作系統(tǒng)資源可被調(diào)用以執(zhí)行診斷測(cè)試。硬件診斷測(cè)試工具430可 返回日志文件,所述日志文件指示在測(cè)試期間發(fā)現(xiàn)的任何錯(cuò)誤。在另一示例 中,GMS240可將測(cè)試方程或測(cè)試操作導(dǎo)向硬件平臺(tái)404,并且接收各測(cè)試 結(jié)果,所述各測(cè)試結(jié)果可與期望的各結(jié)果比較,以確定是否存在任何功能性
錯(cuò)誤。如果檢測(cè)到功能性錯(cuò)誤,那么GMS 240可移除該新的資源,并且嘗 試在執(zhí)行環(huán)境410內(nèi)替換該資源。
在該示例中,硬件測(cè)試診斷工具430被描述為本地的(local)或固有的 (native)診斷工具的示例,其可以被調(diào)用以在資源級(jí)別執(zhí)行功能性測(cè)試, 而不是從GMS 240執(zhí)行的測(cè)試作業(yè)。將會(huì)理解,每種類型的資源可以包括 本地的、固有的或板上的診斷工具或命令,其可以被調(diào)用以在資源級(jí)別執(zhí)行 功能性測(cè)試。此外,將會(huì)理解,操作系統(tǒng)或應(yīng)用軟件可以包括各診斷工具或 命令,其可以被調(diào)用以在資源級(jí)別上執(zhí)行其它資源的功能性測(cè)試。
現(xiàn)在參照?qǐng)D5,描述了根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、用于管理網(wǎng) 格環(huán)境的網(wǎng)格管理系統(tǒng)的方框圖。在該示例中,GMS 240包括多個(gè)網(wǎng)格模塊, 其提供網(wǎng)格服務(wù)并存儲(chǔ)數(shù)據(jù)用于遍布網(wǎng)格環(huán)境150訪問。重要的是注意到, GMS 240中描述的各網(wǎng)格模塊,可以在網(wǎng)格環(huán)境150內(nèi)的多個(gè)網(wǎng)格管理器中 分配,并且可以與各資源級(jí)別管理工具相互作用。
如所描述的,GMS240包括網(wǎng)格調(diào)度器501,用于在網(wǎng)格環(huán)境150內(nèi)檢 測(cè)各進(jìn)入的作業(yè)并調(diào)度各進(jìn)入的作業(yè)的執(zhí)行。特別是,當(dāng)網(wǎng)格調(diào)度器501檢 測(cè)到進(jìn)入的網(wǎng)格作業(yè)時(shí),網(wǎng)格調(diào)度器501傳遞該進(jìn)入的網(wǎng)格作業(yè)給網(wǎng)格分配 服務(wù)502。
網(wǎng)格分配服務(wù)502控制執(zhí)行環(huán)境內(nèi)的各資源的分配。網(wǎng)格分配服務(wù)502 可以維持可用的執(zhí)行環(huán)境,可以在各執(zhí)行環(huán)境中移動(dòng)各資源,還可以建立新 的執(zhí)行環(huán)境。在一個(gè)實(shí)施例中,網(wǎng)格分配服務(wù)502可以建立支持一類工作需 要的各資源的各資源節(jié)點(diǎn),然后在各執(zhí)行環(huán)境中移動(dòng)整體資源節(jié)點(diǎn)。例如, 網(wǎng)格分配服務(wù)502可以用支持基于數(shù)據(jù)庫的作業(yè)需要的硬件平臺(tái)、各操作系 統(tǒng)資源、各網(wǎng)絡(luò)連接器資源、各存儲(chǔ)子系統(tǒng)以及應(yīng)用軟件,建立資源節(jié)點(diǎn)。 此外,網(wǎng)格分配服務(wù)502可以為其它的網(wǎng)格環(huán)境與各網(wǎng)格管理系統(tǒng)通信,以 控制來自外部網(wǎng)格環(huán)境的另外的資源的訪問。
當(dāng)網(wǎng)格分配服務(wù)502在執(zhí)行環(huán)境內(nèi)分配新的資源時(shí),網(wǎng)格分配服務(wù)502 在允許作業(yè)路由器504將網(wǎng)格作業(yè)路由到該新的資源之前,可調(diào)用網(wǎng)格驗(yàn)證 服務(wù)506。在另一實(shí)施例中,網(wǎng)格分配服務(wù)502在當(dāng)前網(wǎng)格作業(yè)結(jié)束時(shí),而 在分配該新的資源到新的執(zhí)行環(huán)境之前,可調(diào)用網(wǎng)格驗(yàn)證服務(wù)506以測(cè)試該 資源。進(jìn)一步,在另一實(shí)施例中,在網(wǎng)格作業(yè)在執(zhí)行環(huán)境中開始后,網(wǎng)格驗(yàn) 證服務(wù)506可繼續(xù)測(cè)試和驗(yàn)證資源,尤其是,可使用客戶端提供的測(cè)試標(biāo)準(zhǔn)
測(cè)試驗(yàn)證該資源。
網(wǎng)格驗(yàn)證服務(wù)506確定哪些測(cè)試應(yīng)該在新資源上運(yùn)行以驗(yàn)證功能性,在
新的資源上運(yùn)行各測(cè)試以及分析各測(cè)試結(jié)果。網(wǎng)4各驗(yàn)證服務(wù)506返回報(bào)告給 網(wǎng)格分配服務(wù)502,或指出該新資源的已驗(yàn)證的功能性,或指出該新資源內(nèi) 未解決的錯(cuò)誤情況。
根據(jù)一個(gè)實(shí)施例,如果網(wǎng)格驗(yàn)證服務(wù)506檢測(cè)到新資源的一個(gè)功能性錯(cuò) 誤,則網(wǎng)格驗(yàn)證服務(wù)506利用錯(cuò)誤解決的請(qǐng)求,調(diào)用網(wǎng)格退化防止服務(wù)508。 網(wǎng)格退化防止服務(wù)508可通過與對(duì)新資源本地的^"誤解決工具通信,或通過 執(zhí)行錯(cuò)誤解決安排,嘗試解決該新資源中的錯(cuò)誤。在一個(gè)示例中,如果網(wǎng)格 驗(yàn)證服務(wù)506檢測(cè)到CPU的平均利用率超過90 % ,那么網(wǎng)格驗(yàn)證服務(wù)506 可調(diào)用網(wǎng)格退化防止服務(wù)508,因?yàn)镃PU平均利用率超過90%被認(rèn)為是錯(cuò) 誤。然后網(wǎng)格退化防止服務(wù)508可啟動(dòng)另 一個(gè)CPU或激活另 一個(gè)邏輯劃分, 以防止性能的進(jìn)一步惡化。
除了執(zhí)行各測(cè)試以^r測(cè)錯(cuò)誤之外,網(wǎng)格驗(yàn)證服務(wù)506可從網(wǎng)格錯(cuò)誤監(jiān)視 服務(wù)510接收錯(cuò)誤指示符。網(wǎng)格錯(cuò)誤監(jiān)視服務(wù)510為可以指示環(huán)境中的錯(cuò)誤 的情況,監(jiān)視網(wǎng)格環(huán)境150內(nèi)的每個(gè)執(zhí)行環(huán)境。由網(wǎng)格錯(cuò)誤監(jiān)視服務(wù)510報(bào) 告的錯(cuò)誤可以是以錯(cuò)誤消息或錯(cuò)誤日志的形式。
將會(huì)理解,盡管這里描述的服務(wù)為網(wǎng)格作業(yè)提供自動(dòng)處理,然而任何描 述為網(wǎng)格管理系統(tǒng)240的部分的網(wǎng)格服務(wù),可以由系統(tǒng)管理者通過人為干涉 來執(zhí)行。此外將會(huì)理解,網(wǎng)格管理系統(tǒng)240可包括額外的網(wǎng)格服務(wù)、作業(yè)隊(duì) 列以及存儲(chǔ)系統(tǒng),用于改進(jìn)處理單獨(dú)的網(wǎng)格作業(yè)的網(wǎng)格管理系統(tǒng)240的效率 以及整個(gè)網(wǎng)格環(huán)境150的效率。
現(xiàn)在參照?qǐng)D6,描述了根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、網(wǎng)格驗(yàn)證服 務(wù)的各組件的示例的方框圖。如所圖示的,網(wǎng)格驗(yàn)證服務(wù)506包括測(cè)試控制 器602。測(cè)試控制器602在新資源被加入到執(zhí)行環(huán)境時(shí)被初始化。此外,將 會(huì)理解,測(cè)試控制器602響應(yīng)于網(wǎng)格環(huán)境內(nèi)的其它事件可被初始化。
當(dāng)測(cè)試控制器602初始化時(shí),測(cè)試控制器602為新資源的應(yīng)用測(cè)試搜索 可用的測(cè)試表格604。如將參照?qǐng)D7進(jìn)一步詳細(xì)描述的,可用的測(cè)試表格604 包括根據(jù)資源類型以及由資源類進(jìn)一步指定的各測(cè)試。此外,可用的測(cè)試表 格604既包括調(diào)用各本地資源測(cè)試的各測(cè)試,又包括要由測(cè)試控制器602運(yùn) 行的各測(cè)試作業(yè)。除了訪問可用的測(cè)試表格604之外,測(cè)試控制器602可詢
測(cè)試控制器602在測(cè)試結(jié)果表格606中收集各測(cè)試結(jié)果。測(cè)試結(jié)果表格 606可包括日志文件數(shù)據(jù)和直接測(cè)試結(jié)果,根據(jù)新資源組織。
一旦測(cè)試控制器602完成新資源的測(cè)試,錯(cuò)誤檢測(cè)器610就分析測(cè)試結(jié) 果表格606以發(fā)現(xiàn)錯(cuò)誤。特別是,錯(cuò)誤檢測(cè)器610可為錯(cuò)誤條件搜索各日志 文件。此外,錯(cuò)誤檢測(cè)器610可比較來自測(cè)試控制器601執(zhí)行的各測(cè)試的測(cè) 試結(jié)果和期望的各結(jié)果,并且檢測(cè)其結(jié)果不符合期望的錯(cuò)誤。
然后,當(dāng)確定如何響應(yīng)已檢測(cè)的錯(cuò)誤時(shí),錯(cuò)誤檢測(cè)器610訪問可接受的 錯(cuò)誤表格608??山邮艿腻e(cuò)誤表格608包括錯(cuò)誤的條件,其在特定的執(zhí)行環(huán) 境內(nèi)或網(wǎng)格環(huán)境內(nèi)是可以接受的。例如,檢測(cè)的磁盤子系統(tǒng)的日志文件可指 示各壞的塊的重分配,然而,,茲盤子系統(tǒng)上各壞的塊的重分配在可接受的錯(cuò)
誤表格608中被指明,作為磁盤控制器的普通功能。
錯(cuò)誤檢測(cè)器610可以利用用于網(wǎng)格退化防止服務(wù)508的請(qǐng)求來調(diào)用網(wǎng)格 退化防止服務(wù)508,以嘗試解決檢測(cè)到的錯(cuò)誤,。在一個(gè)示例中,網(wǎng)格退化防 止服務(wù)508能夠解決檢測(cè)到的錯(cuò)誤,并返回錯(cuò)誤解決報(bào)告給錯(cuò)誤檢測(cè)器610。 在另一個(gè)示例中,網(wǎng)格退化防止服務(wù)508未能解決檢測(cè)到的錯(cuò)誤,并返回錯(cuò) 誤沒有解決的指示符。然后錯(cuò)誤檢測(cè)器610通知網(wǎng)格分配服務(wù)502,是否存 在任何未解決的錯(cuò)誤或是否所有新資源已驗(yàn)證。
現(xiàn)在參照?qǐng)D7,圖示了根據(jù)本發(fā)明的方法、系統(tǒng)和程序的、測(cè)試可靠性 表格中的各條目的圖例。如所描述的,可用的測(cè)試表格604包括根據(jù)普通類 型的資源、以及根據(jù)各資源的類進(jìn)一步指定的各測(cè)試。此外,各測(cè)試可以通 過資源名稱來為每個(gè)特定的資源指定。將會(huì)理解,可用的測(cè)試表格604中描 述的各測(cè)試是各測(cè)試類型的示例,該測(cè)試可被執(zhí)行以及調(diào)用,并且實(shí)際的測(cè) 試順序,可根據(jù)驗(yàn)證網(wǎng)格資源的功能性所需要的測(cè)試的準(zhǔn)確度來調(diào)整。
當(dāng)資源是處理器時(shí),可用的測(cè)試表才各604指定多個(gè)可用的測(cè)試和預(yù)期的 結(jié)果類型,如參考標(biāo)號(hào)702所圖示的。在第一示例中,處理器可通過調(diào)用本 地的處理器診斷來測(cè)試,該本地處理器診斷可從操作系統(tǒng)調(diào)用;可用的測(cè)試 表格604可包括用于基于多類操作系統(tǒng)的處理器診斷的調(diào)用引用。本地處理 器診斷可返回日志文件。在第二個(gè)示例中,處理器可通過用測(cè)試方程的集合 運(yùn)行測(cè)試作業(yè)并且收集各測(cè)試結(jié)果來測(cè)試。多個(gè)測(cè)試方程的集合可以根據(jù)處
理器或各處理器的類型可得到并且被指定。在任一示例中,包括總線和底板 的各處理器可被測(cè)試,并且驗(yàn)證各結(jié)果。
當(dāng)資源是存儲(chǔ)器時(shí),可用的測(cè)試表格604指明多個(gè)可用的測(cè)試和期望的 結(jié)果類型,如參考標(biāo)號(hào)704所圖示的。在第一示例中,存儲(chǔ)器可通過調(diào)用基 于本地的操作系統(tǒng)的存儲(chǔ)器診斷工具來測(cè)試;可用的測(cè)試表格604可包括命 令引用,用于基于多種類型操作系統(tǒng)的存儲(chǔ)器診斷。在第二示例中,存儲(chǔ)器 可通過在存儲(chǔ)器上運(yùn)行位檢查測(cè)試的測(cè)試作業(yè)來測(cè)試;收集各測(cè)試結(jié)果用于 與期望的位模式比較。在第三示例中,存儲(chǔ)器可通過運(yùn)行完整模式的讀寫測(cè) 試來測(cè)試,所述完整模式的讀寫測(cè)試設(shè)計(jì)用來驗(yàn)證存儲(chǔ)器功能;收集各測(cè)試 結(jié)果,用于確定是否讀寫被正確執(zhí)行。在一個(gè)示例中,測(cè)試控制器602可為 較快的存儲(chǔ)器資源選擇完整模式讀寫測(cè)試,而為較慢的存儲(chǔ)器資源選擇位檢 查測(cè)試。
當(dāng)資源是網(wǎng)絡(luò)適配器時(shí),可用的測(cè)試表格604使得多個(gè)測(cè)試可用并且按 網(wǎng)絡(luò)適配器的類存儲(chǔ),如參考標(biāo)號(hào)706所圖示的。網(wǎng)絡(luò)適配器的各類可以包 括但不限于SAN適配器和IP適配器。對(duì)每類網(wǎng)絡(luò)適配器可以執(zhí)行一系列的 測(cè)試。第一,在該系列中,測(cè)試控制器602貫注于調(diào)用板上回送測(cè)試。特別 是,網(wǎng)絡(luò)適配器可以包括板上診斷,其可以被其它系統(tǒng)通過命令調(diào)用來調(diào)用。 第二,在該系列中,測(cè)試控制器602貫注于運(yùn)行連接性測(cè)試。在一個(gè)示例中, 如ping(因特網(wǎng)探測(cè)分組)測(cè)試的連接性測(cè)試可被使用,其中結(jié)果的"ping" 是期望的。將會(huì)理解,可指定額外的各測(cè)試,以測(cè)試單獨(dú)的網(wǎng)絡(luò)適配器和各 類的網(wǎng)絡(luò)適配器的功能性。
當(dāng)資源是設(shè)備控制器(如SCSI設(shè)備控制器)時(shí),可用的測(cè)試表格604 使得多種測(cè)試可用并按設(shè)備控制器的類存儲(chǔ),如參考標(biāo)號(hào)708所圖示的。對(duì) 每類設(shè)備控制器可執(zhí)行一系列的測(cè)試。第一,在該系列中,測(cè)試控制器602 貫注于調(diào)用板上回送測(cè)試以測(cè)試本地硬件。第二,在該系列中,測(cè)試控制器 602貫注于執(zhí)行測(cè)試硬件訪問的測(cè)試作業(yè)。測(cè)試訪問通常包括各指令,其啟 用設(shè)備控制器的讀寫能力、各適配器、以及各路徑的驗(yàn)證。例如,如果設(shè)備 控制器是磁盤子系統(tǒng),則該測(cè)試訪問可包括各指令,以用預(yù)定的數(shù)據(jù)模式在 每個(gè)磁盤上寫文件,讀回每個(gè)文件,然后刪除每個(gè)文件。
當(dāng)資源是存儲(chǔ)子系統(tǒng)(如磁盤或磁帶)時(shí),可用的測(cè)試表格604使得多 個(gè)測(cè)試可用并按存儲(chǔ)子系統(tǒng)的類存儲(chǔ),如參考標(biāo)號(hào)710所圖示的。對(duì)于每一
類存儲(chǔ)子系統(tǒng),可執(zhí)行特定的測(cè)試訪問。在介質(zhì)是不可移動(dòng)的情況下,該測(cè) 試可以包括各指令,以驗(yàn)證該存儲(chǔ)子系統(tǒng)的每個(gè)部分。作為替代,在介質(zhì)是 可以移動(dòng)的情況下,該測(cè)試可包括各指令,以驗(yàn)證整個(gè)存儲(chǔ)子系統(tǒng)的讀寫能 力和各路徑。進(jìn)一步,如果存儲(chǔ)子系統(tǒng)包括板上診斷工具,則可用的測(cè)試表
格604可以包括用于板上診斷工具的調(diào)用操作。
當(dāng)資源是操作系統(tǒng)軟件時(shí),可用的測(cè)試表格604根據(jù)操作系統(tǒng)的類型, 使得多個(gè)測(cè)試可用,如參考標(biāo)號(hào)712所圖示的。對(duì)于每種類型的操作系統(tǒng), 該測(cè)試包括調(diào)用操作系統(tǒng)工具的各指令,用于參數(shù)測(cè)試和準(zhǔn)備就緒測(cè)試。特 別是,每種操作系統(tǒng)可以包括各診斷工具,其可以被調(diào)用以驗(yàn)證該操作系統(tǒng)。 在一個(gè)示例中,該測(cè)試可以包括各指令,以在AIX操作系統(tǒng)(AIX是國際 商用機(jī)器公司的注冊(cè)商標(biāo))內(nèi)調(diào)用各工具。特別是,參照AIX操作系統(tǒng),
"lppchk -v"指令可以被調(diào)用來測(cè)試以確保沒有軟件部分矛盾存在;"oslevel -r,,指令可以被調(diào)用以請(qǐng)求操作系統(tǒng)發(fā)布(release)級(jí)別以及維護(hù)級(jí)別;
"instfix -ik"指令可以被調(diào)用以驗(yàn)證所有的文件組已展現(xiàn)給當(dāng)前發(fā)布和維 護(hù)級(jí)別;"lslpp-L"指令可以被調(diào)用并與過濾器(filter)—起使用,所述過濾 器指定請(qǐng)求哪個(gè)結(jié)果,以確定任何特定的操作系統(tǒng)文件組或設(shè)備驅(qū)動(dòng)器的存 在和狀態(tài);以及"set"指令可以被調(diào)用并與過濾器一起使用,以確定需要的 各環(huán)境變量的存在和值。將會(huì)理解,額外的各AIX操作系統(tǒng)指令可以被調(diào)用 以測(cè)試AIX操作系統(tǒng)的各參數(shù)和準(zhǔn)備就緒。此外,將會(huì)理解,其它類型的指 令可以被指定,以為其它搡作系統(tǒng)調(diào)用。
當(dāng)資源是應(yīng)用軟件時(shí),可用的測(cè)試表格604根據(jù)軟件的類型使得多個(gè)測(cè) 試可用,如參考標(biāo)號(hào)714所圖示的。如果應(yīng)用軟件包括自驗(yàn)證安排,可用的 測(cè)試表格604可以包括特定的調(diào)用用于自驗(yàn)證安排。作為替代,可用的測(cè)試 表格604可以包括指令,以為當(dāng)前應(yīng)用的特定類運(yùn)行功能性測(cè)試作業(yè)。在一 個(gè)示例中,該應(yīng)用軟件資源是DB2數(shù)據(jù)庫軟件(DB2是國際商用機(jī)器公司 的注冊(cè)商標(biāo)),其在數(shù)據(jù)庫軟件類中。數(shù)據(jù)庫類功能性測(cè)試作業(yè)將需要以下 操作的性能(l)驗(yàn)證正確的后臺(tái)程序和過程正在進(jìn)行;(2)連接至數(shù)據(jù)庫 并驗(yàn)證與數(shù)據(jù)庫的連接;(3)在數(shù)據(jù)庫中創(chuàng)建測(cè)試表格;(4 )組裝(populate) 測(cè)試數(shù)據(jù)到表格中;(5)針對(duì)該表格用已知的各結(jié)果執(zhí)行詢問,并驗(yàn)證各結(jié) 果;(6)刪除測(cè)試表格;(7)從數(shù)據(jù)庫斷開連接;以及(8)移除數(shù)據(jù)庫別 名。將會(huì)理解,可調(diào)用測(cè)試和驗(yàn)證數(shù)據(jù)庫軟件的額外搡作。此外將會(huì)理解,
可用的測(cè)試表格604用各結(jié)果和各結(jié)果類型圖示了示例測(cè)試情形,然而,本
領(lǐng)域的技術(shù)人員可將這些示例測(cè)試情形擴(kuò)展到額外的或更合適的平臺(tái)和應(yīng)用。
現(xiàn)在參照?qǐng)D8,描述了根據(jù)本發(fā)明的方法、系統(tǒng)和程序的流程和程序的 高層邏輯流程圖,所述流程和程序用于為所述網(wǎng)格作業(yè)控制將網(wǎng)格作業(yè)路由 到執(zhí)行環(huán)境中驗(yàn)證過的各資源。如圖示的,流程開始于塊800,接下來進(jìn)行 到塊802。塊802描述了接收新網(wǎng)格作業(yè)的網(wǎng)格調(diào)度器。接下來,塊804描 述網(wǎng)格調(diào)度器,其通知網(wǎng)格分配服務(wù)關(guān)于該新網(wǎng)格作業(yè)。之后,塊806描述 網(wǎng)格分配服務(wù),其將為該新網(wǎng)格作業(yè)需要的各資源組合到為新的網(wǎng)格作業(yè)的 執(zhí)行環(huán)境中。接下來,塊808描述網(wǎng)格分配服務(wù),其初始化該網(wǎng)格驗(yàn)證服務(wù), 以在執(zhí)行環(huán)境中驗(yàn)證各新資源,并且流程傳遞到塊810。
塊810描述判斷網(wǎng)格分配服務(wù)是否接收到資源功能性已被驗(yàn)證的指示 符。如果該資源功能性已被驗(yàn)證,則流程傳遞到塊812。塊812描述網(wǎng)格分 配服務(wù),其通知網(wǎng)格工作路由器,將該作業(yè)路由到該執(zhí)行環(huán)境內(nèi)的各資源或 替代資源,并且過程結(jié)束。否則在塊810,如果資源功能性沒有被驗(yàn)證,那 么過程傳遞到塊814。塊814描述網(wǎng)格分配服務(wù)位置替換資源,并在執(zhí)行環(huán) 境內(nèi)替換非功能性資源;然后過程返回到塊808。
現(xiàn)在參照?qǐng)D9,描述了根據(jù)本發(fā)明的方法、系統(tǒng)和程序的過程和程序的 高層邏輯流程圖,用于在網(wǎng)格作業(yè)提交給各資源之前、為各資源控制資源驗(yàn) 證,所述各資源為網(wǎng)格作業(yè)添加到執(zhí)行環(huán)境。如圖示的,過程開始于塊900, 接下來進(jìn)行到塊902。塊902描述判斷網(wǎng)格驗(yàn)證服務(wù)是否接收到來自網(wǎng)格 分配服務(wù)的驗(yàn)證新資源的請(qǐng)求。如果接收到驗(yàn)證新資源的請(qǐng)求,那么過程傳 遞到塊904。塊904描述為來自測(cè)試可用性表格的各新資源選4奪各測(cè)試。接 下來,塊906描述在新資源上運(yùn)行選擇的各測(cè)試,并且過程傳遞到塊908。
塊卯8描述為每個(gè)新資源收集測(cè)試結(jié)果表格里的各測(cè)試結(jié)果。塊910描 述判斷是否響應(yīng)所有運(yùn)行測(cè)試接收各結(jié)果。如果所有的結(jié)果仍未被接收, 那么過程返回到塊908。 一旦所有的結(jié)果被接收,那么過程傳遞到塊912。
塊912描述判斷在各結(jié)果中是否檢測(cè)到任何錯(cuò)誤。如果沒有檢測(cè)到錯(cuò) 誤,那么該過程傳遞到塊920。塊920描述通知網(wǎng)格分配服務(wù)資源的功能 性被驗(yàn)證,然后過程結(jié)束。否則,在塊918如果檢測(cè)到錯(cuò)誤,那么過程傳遞 到塊916。
塊916描述提交該錯(cuò)誤到資源退化防止服務(wù)。資源退化防止服務(wù)嘗試解
決該錯(cuò)誤。如果資源退化防止服務(wù)不能解決該錯(cuò)誤,那么過程傳遞到塊922。 塊922描述通知網(wǎng)格分配服務(wù)關(guān)于該資源錯(cuò)誤,并且過程結(jié)束。否則,在塊 918,如果資源退化防止服務(wù)能夠解決該錯(cuò)誤,那么過程傳遞到塊920。
權(quán)利要求
1.一種方法,用于為網(wǎng)格環(huán)境里提交的網(wǎng)格作業(yè),驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源,其包括在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資源,其中所述特定的執(zhí)行環(huán)境包括為處理網(wǎng)格作業(yè)而群組的多個(gè)網(wǎng)格資源;在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng)功能性測(cè)試;以及響應(yīng)于接收所述至少一項(xiàng)功能性測(cè)試的結(jié)果,在允許將所述網(wǎng)格作業(yè)路由到所述新資源之前,驗(yàn)證所述結(jié)果是否符合各期望的結(jié)果,使得在允許訪問所述新資源之前,所述新資源的功能性被自動(dòng)地驗(yàn)證。
2. 根據(jù)權(quán)利要求l所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 其中在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資 源,進(jìn)一步包括檢測(cè)所述新資源,其中所述新資源被添加到所述執(zhí)行環(huán)境,所述執(zhí)行環(huán) 境包括之前測(cè)試過功能性的多個(gè)資源。
3. 根據(jù)權(quán)利要求l所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 其中在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資 源,進(jìn)一步包括檢測(cè)所述新資源,其中所述新資源被添加到所述執(zhí)行環(huán)境,所述執(zhí)行環(huán) 境包括需要測(cè)試功能性的多個(gè)附加的資源。
4. 根據(jù)權(quán)利要求l所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 其中在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi),檢測(cè)特定的執(zhí)行環(huán)境中的新資 源,進(jìn)一步包括檢測(cè)所述新資源,其中所述新資源被添加到所述執(zhí)行環(huán)境以替代有缺陷 的資源。
5. 根據(jù)權(quán)利要求l所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 其中在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng)功能性測(cè)試, 進(jìn)一步包括從所述網(wǎng)格管理系統(tǒng)將測(cè)試作業(yè)導(dǎo)向所述新資源;以及 接收所述測(cè)試作業(yè)的測(cè)試結(jié)果。
6. 根據(jù)權(quán)利要求l所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 其中在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng)功能性測(cè)試,進(jìn)一步包括調(diào)用:^斷工具,其能夠在本地測(cè)試所述新資源;以及 從所述診斷工具接收日志文件,其指示至少一項(xiàng)測(cè)試結(jié)果。
7. 根據(jù)權(quán)利要求l所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 進(jìn)一步包括為多個(gè)指定的錯(cuò)誤條件分析所述結(jié)果;以及響應(yīng)于從所述多個(gè)指定的錯(cuò)誤條件中檢測(cè)至少 一個(gè)錯(cuò)誤,嘗試解決所述 至少一個(gè)錯(cuò)誤;以及響應(yīng)于解決所述錯(cuò)誤,驗(yàn)證所述結(jié)果是否符合所述期望的結(jié)果。
8. 根據(jù)權(quán)利要求7所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 進(jìn)一步包括響應(yīng)于所述錯(cuò)誤保持未解決,替換所述執(zhí)行環(huán)境內(nèi)的所述新資源。
9. 根據(jù)權(quán)利要求7所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 進(jìn)一步包括從提交所述網(wǎng)格作業(yè)的客戶端,接收至少一項(xiàng)測(cè)試標(biāo)準(zhǔn);以及 響應(yīng)于允許將所述網(wǎng)格作業(yè)路由到所述新資源,在所迷網(wǎng)格作業(yè)執(zhí)行 時(shí),用所述至少一項(xiàng)測(cè)試標(biāo)準(zhǔn)運(yùn)行所述至少 一項(xiàng)功能性測(cè)試。
10. 根據(jù)權(quán)利要求1所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的方法, 其中所述網(wǎng)格管理系統(tǒng)管理將所述網(wǎng)格環(huán)境內(nèi)的多個(gè)網(wǎng)格資源分配到多個(gè) 執(zhí)行環(huán)境。
11. 一種系統(tǒng),用于為網(wǎng)格環(huán)境中提交的網(wǎng)格作業(yè),驗(yàn)證特定的執(zhí)行環(huán) 境內(nèi)的資源,其包括網(wǎng)格環(huán)境,其包括由網(wǎng)格管理系統(tǒng)管理的多個(gè)網(wǎng)格資源; 網(wǎng)格服務(wù),其在所述網(wǎng)格環(huán)境內(nèi)由所述網(wǎng)格管理系統(tǒng)支持; 所述網(wǎng)4各服務(wù)進(jìn)一步包括用于在所述網(wǎng)格環(huán)境中檢測(cè)特定的執(zhí)行環(huán)境內(nèi)的新資源的裝置,其中所 述特定的執(zhí)行環(huán)境包括為處理網(wǎng)格作業(yè)而群組的多個(gè)網(wǎng)格資源;用于在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng)功能性 測(cè)試的裝置;以及 用于響應(yīng)于接收所述至少一項(xiàng)功能性測(cè)試的結(jié)果、在允許將所述網(wǎng)格作 業(yè)路由到所述新資源之前、驗(yàn)證所述結(jié)果是否符合各期望的結(jié)果的裝置。
12. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),其中所述用于在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi)、檢測(cè)特定的執(zhí)行環(huán)境中的新資源的裝置,進(jìn)一步包括用于^r測(cè)所述新資源的裝置,其中所述新資源被添加到所述執(zhí)行環(huán)境, 所述執(zhí)行環(huán)境包括之前測(cè)試過功能性的多個(gè)資源。
13. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),其中所述用于在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi)、檢測(cè)特定的執(zhí)行環(huán) 境中的新資源的裝置,進(jìn)一步包括用于檢測(cè)所述新資源的裝置,其中所述新資源被添加到所述執(zhí)行環(huán)境, 所述執(zhí)行環(huán)境包括需要測(cè)試功能性的多個(gè)附加的資源。
14. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),其中所述用于在由網(wǎng)格管理系統(tǒng)管理的網(wǎng)格環(huán)境內(nèi)、檢測(cè)特定的執(zhí)行環(huán) 境中的資源的裝置,進(jìn)一步包括用于檢測(cè)所述新資源的裝置,其中所述新資源被添加到所述執(zhí)行環(huán)境以 替代有缺陷的資源。
15. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),其中所述用于在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng) 功能性測(cè)試的裝置,進(jìn)一步包括用于從所述網(wǎng)格管理系統(tǒng)將測(cè)試作業(yè)導(dǎo)向所述新資源的裝置;以及 用于接收所述測(cè)試作業(yè)的測(cè)試結(jié)果的裝置。
16. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),其中所述用于在由所述網(wǎng)格管理系統(tǒng)控制的所述新資源上運(yùn)行至少一項(xiàng) 功能性測(cè)試的裝置,進(jìn)一步包括用于調(diào)用能夠在本地測(cè)試所述新資源的診斷工具的裝置;以及用于從指示至少 一項(xiàng)測(cè)試結(jié)果的所述診斷工具接收日志文件的裝置。
17. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),所述網(wǎng)格服務(wù)進(jìn)一步包括用于對(duì)多個(gè)指定的錯(cuò)誤條件分析所述結(jié)杲的裝置;以及用于響應(yīng)于從所述多個(gè)指定的錯(cuò)誤條件中檢測(cè)至少一個(gè)錯(cuò)誤、嘗試解決 所述至少一個(gè)錯(cuò)誤的裝置;以及用于響應(yīng)于解決所述錯(cuò)誤驗(yàn)證所述結(jié)果是否符合所述期望的結(jié)果的裝置。
18. 根據(jù)權(quán)利要求17所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),所述網(wǎng)格服務(wù)進(jìn)一步包括用于響應(yīng)于所述錯(cuò)誤保持未解決替換所述執(zhí)行環(huán)境里的所述新資源的裝置。
19. 根據(jù)權(quán)利要求17所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),所述網(wǎng)格服務(wù)進(jìn)一步包括用于從提交所述網(wǎng)格作業(yè)的客戶端接收至少 一項(xiàng)測(cè)試標(biāo)準(zhǔn)的裝置;以及 用于響應(yīng)于允許將所述網(wǎng)格作業(yè)路由到所述新資源、在所述網(wǎng)格作業(yè)執(zhí) 行時(shí)、用所述至少一項(xiàng)測(cè)試標(biāo)準(zhǔn)運(yùn)行所述至少 一項(xiàng)功能性測(cè)試的裝置。
20. 根據(jù)權(quán)利要求11所述的、用于驗(yàn)證特定的執(zhí)行環(huán)境內(nèi)的資源的系 統(tǒng),其中所述網(wǎng)格管理系統(tǒng)管理將所述網(wǎng)格環(huán)境內(nèi)的多個(gè)網(wǎng)格資源分配到多 個(gè)執(zhí)行環(huán)境。
21. —種計(jì)算機(jī)程序產(chǎn)品,其可以加載到數(shù)字計(jì)算機(jī)的內(nèi)部存儲(chǔ)器中, 包括軟件代碼部分,當(dāng)所述產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí),用于執(zhí)行以實(shí)現(xiàn)根據(jù)權(quán) 利要求1到權(quán)利要求11所述的發(fā)明。
全文摘要
提供了一種方法、系統(tǒng)和程序,用于在由提交給網(wǎng)格環(huán)境的網(wǎng)格作業(yè)使用之前,驗(yàn)證資源功能性。當(dāng)新的資源被分配到由網(wǎng)格管理系統(tǒng)管理的、網(wǎng)格環(huán)境內(nèi)的特定的執(zhí)行環(huán)境時(shí),網(wǎng)格驗(yàn)證服務(wù)在由網(wǎng)格管理系統(tǒng)控制的新資源上,自動(dòng)地選擇并運(yùn)行至少一項(xiàng)功能性測(cè)試。響應(yīng)于功能性測(cè)試的結(jié)果,在允許將該網(wǎng)格作業(yè)路由到新資源之前,該網(wǎng)格驗(yàn)證系統(tǒng)驗(yàn)證該測(cè)試結(jié)果是否符合期望的結(jié)果,使得在允許訪問新資源之前,該新資源的功能性被自動(dòng)地驗(yàn)證,以保持處理各網(wǎng)格作業(yè)中的服務(wù)的質(zhì)量。
文檔編號(hào)G06F9/46GK101099132SQ200580046126
公開日2008年1月2日 申請(qǐng)日期2005年12月19日 優(yōu)先權(quán)日2005年1月6日
發(fā)明者喬西·約瑟夫, 克雷格·W·費(fèi)倫斯坦, 詹姆斯·西曼, 里克·A·漢密爾頓第二 申請(qǐng)人:國際商業(yè)機(jī)器公司