專利名稱:產(chǎn)生高可用性偽克隆備用服務(wù)器的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在網(wǎng)絡(luò)計(jì)算環(huán)境中為快速故障轉(zhuǎn)移供應(yīng)(rapidfailover provisioning)而產(chǎn)生備用服務(wù)器和準(zhǔn)克隆(near clone)。
背景技術(shù):
隨著商業(yè)需求的增加,應(yīng)對(duì)多處理的技術(shù)改進(jìn)及其智能的深度變得非常需要和關(guān)鍵。在任何企業(yè)經(jīng)營(yíng)活動(dòng)中,難以在最大化資源利用的同時(shí)有效地管理不斷波動(dòng)的可用資源。
事實(shí)上,當(dāng)保持足夠的資源以滿足峰值要求時(shí),信息技術(shù)(″IT″)花費(fèi)可以變得非常昂貴。更進(jìn)一步地,通常要求用戶輸入以利于這樣的處理,其引起在時(shí)間和人力資源雙方面的額外費(fèi)用。
為解決這些需要,企業(yè)計(jì)算系統(tǒng)的許多大供應(yīng)商,諸如國(guó)際商用機(jī)器公司(″IBM″)、微軟公司、及Sun微系統(tǒng)公司(″Sun″)已開始開發(fā)和部署自我管理和自愈的基礎(chǔ)設(shè)施技術(shù)。HP的自我管理計(jì)算結(jié)構(gòu)被稱為″公用計(jì)算″或″公用數(shù)據(jù)中心″,而Sun已將其創(chuàng)新起名為″N1″。IBM已將諸如″自主計(jì)算″、″網(wǎng)格計(jì)算″、及″隨需應(yīng)變計(jì)算″的術(shù)語(yǔ)應(yīng)用于這一領(lǐng)域中其各種體系結(jié)構(gòu)和研究項(xiàng)目。雖然每個(gè)供應(yīng)商已宣布其方案和體系結(jié)構(gòu)中的區(qū)別,然而均共有提供某種程度上自我管理和自愈的大規(guī)模計(jì)算系統(tǒng)的目標(biāo)。
例如,IBM的自主計(jì)算是一個(gè)以人體的自主神經(jīng)系統(tǒng)為模式的自我管理計(jì)算模型,其在沒有用戶輸入的情況下控制計(jì)算環(huán)境的應(yīng)用程序和平臺(tái),類似于在沒有有意識(shí)的判斷的情況下人類的自主神經(jīng)系統(tǒng)調(diào)節(jié)某些身體機(jī)能的方式。
此外,IBM已將其隨需應(yīng)變計(jì)算技術(shù)定義為一個(gè)企業(yè),其集成有整個(gè)公司端到端并且與關(guān)鍵合伙人、供應(yīng)商和客戶集成起來的業(yè)務(wù)過程可以快速地響應(yīng)任何客戶要求、市場(chǎng)機(jī)會(huì)或外部威脅。
″供應(yīng)″是用于描述管理計(jì)算環(huán)境的各個(gè)方面的術(shù)語(yǔ),并且其常常暗指對(duì)于不同方面的不同事情。在整個(gè)公開內(nèi)容中,我們將使用術(shù)語(yǔ)″供應(yīng)″來表示實(shí)現(xiàn)一個(gè)計(jì)算環(huán)境以滿足特定的需要和要求而需要以特定順序發(fā)生的活動(dòng)序列。該活動(dòng)依賴于以前的活動(dòng),并且一般地包含(a)針對(duì)要求恰當(dāng)?shù)剡x擇有能力的硬件,包含處理器速度、存儲(chǔ)器、盤存儲(chǔ)器等等;(b)安裝操作系統(tǒng);(c)遠(yuǎn)程引導(dǎo)網(wǎng)絡(luò);(d)配置諸如虛擬專用網(wǎng)(″VPN″)的網(wǎng)絡(luò)以及類似存儲(chǔ)區(qū)域網(wǎng)(″SAN″)或網(wǎng)絡(luò)連接存儲(chǔ)(″NAS″)的存儲(chǔ)環(huán)境;以及(e)取消供應(yīng)不再需要的資源回到可用池。
大規(guī)模數(shù)據(jù)中心中的操作環(huán)境已變得愈加復(fù)雜。這些數(shù)據(jù)中心通常要求很長(zhǎng)時(shí)間來修改其環(huán)境,因此針對(duì)最壞情況,大多數(shù)供應(yīng)所配置的硬件常常比在經(jīng)歷峰值需要的情況下所需要的硬件更多。因而,大部分硬件和軟件資源使用不足,顯著地增大了系統(tǒng)的花費(fèi)。更進(jìn)一步地,超出已被供應(yīng)的量的浪涌問題仍無法解決(舉例來說,超過預(yù)期峰值負(fù)荷的峰值要求)。
事實(shí)上,供應(yīng)通常是由數(shù)以百計(jì)獨(dú)特且復(fù)雜的步驟所組成的耗費(fèi)時(shí)間和勞動(dòng)力的過程,并且要求非常熟練的系統(tǒng)和網(wǎng)絡(luò)管理員。例如,服務(wù)器供應(yīng)是使服務(wù)器從″裸金屬″到運(yùn)行實(shí)際業(yè)務(wù)事務(wù)的狀態(tài)的過程。在這一供應(yīng)過程期間,許多問題可能出現(xiàn),諸如資源費(fèi)用的增加以及性能水平的下降,其可以導(dǎo)致顧客不滿及服務(wù)不可用。
因?yàn)檫@些是可預(yù)測(cè)的問題,可以采用自動(dòng)化來管理這些問題。由主要供應(yīng)商提供的各種自我管理計(jì)算系統(tǒng)的一個(gè)目標(biāo)是使這些供應(yīng)活動(dòng)盡可能最大程度地自動(dòng)化,并且尤其允許在很少或沒有人類管理員介入下對(duì)系統(tǒng)需求及要求變化的準(zhǔn)實(shí)時(shí)反應(yīng)。例如,IBM的Tivoli[TM]供應(yīng)管理器(″TPM″)快速供應(yīng)是IBM Tivoli IntelligentOrchestrator產(chǎn)品的工作流程和腳本的模塊化和靈活集合。設(shè)法加速其供應(yīng)進(jìn)程的客戶已對(duì)工作流程進(jìn)行概括和封裝以便進(jìn)行定制。在使其服務(wù)器供應(yīng)過程和其他IT過程自動(dòng)化中,它們能被用作為組織的起點(diǎn)。
目前由主要供應(yīng)商所提供的其他產(chǎn)品包括利用Radia(其為用于各種操作系統(tǒng)的基于策略的供應(yīng)和工作自動(dòng)化管理工具)的HP的OpenView操作系統(tǒng)管理器,并且Sun的N1網(wǎng)格服務(wù)供應(yīng)系統(tǒng)在某種程度上使應(yīng)用的供應(yīng)自動(dòng)化。
″災(zāi)難恢復(fù)″是一個(gè)用于信息技術(shù)的廣義的術(shù)語(yǔ),意指在現(xiàn)有系統(tǒng)發(fā)生故障后使計(jì)算資源恢復(fù)聯(lián)機(jī)所需的活動(dòng),不論其為諸如許多服務(wù)器當(dāng)中單個(gè)重負(fù)荷服務(wù)器故障的小故障,還是諸如涉及整個(gè)電子計(jì)算中心掉電或通信中斷的大故障均是如此。這類災(zāi)難可由組成部分的故障率(舉例來說,硬件和軟件故障)引起,也可由諸如自然災(zāi)害(舉例來說,龍卷風(fēng)、颶風(fēng)、地震、洪水等等)的非計(jì)算因素及其他技術(shù)災(zāi)難(舉例來說,斷電、病毒攻擊等等)引起。
為從災(zāi)難中恢復(fù),計(jì)算中心必須再供應(yīng)新服務(wù)器和系統(tǒng)以替代由以前的系統(tǒng)正執(zhí)行的處理。常常地,在不同的地理區(qū)域中執(zhí)行恢復(fù),但是有時(shí)在相同的物理或地理位置執(zhí)行恢復(fù),其取決于災(zāi)難或故障的性質(zhì)。
許多采用或依賴企業(yè)計(jì)算的企業(yè)都建立災(zāi)難恢復(fù)計(jì)劃以便當(dāng)情況出現(xiàn)時(shí)做較好的準(zhǔn)備。然而,當(dāng)前技術(shù)僅允許實(shí)現(xiàn)專用服務(wù)器。每一服務(wù)器通常都被指定用于一個(gè)目的或應(yīng)用(舉例來說,一種″解決方案″),不論其將滿足新顧客需求(舉例來說,″生產(chǎn)系統(tǒng)″),還是將被單獨(dú)地用作在不久的將來可能崩潰的現(xiàn)存服務(wù)器的備份服務(wù)器。當(dāng)這些專用服務(wù)器未使用時(shí),總的IT維護(hù)費(fèi)用會(huì)增加,而過剩資源保持閑置和未使用。重要的是要注意到為了在恢復(fù)期間節(jié)省關(guān)鍵時(shí)間,當(dāng)服務(wù)器被配置為生產(chǎn)服務(wù)器的備份時(shí),該備份服務(wù)器的配置通常與生產(chǎn)服務(wù)器的配置匹配,以使將備份服務(wù)器聯(lián)機(jī)和運(yùn)行不需要供應(yīng)時(shí)間。
即使有組織的供應(yīng)允許實(shí)現(xiàn)不依賴于諸如IBM的z/OS主機(jī)操作系統(tǒng)、集群和地址的高可用性操作環(huán)境的新方法,災(zāi)難恢復(fù)的實(shí)現(xiàn)仍具有挑戰(zhàn)性。當(dāng)災(zāi)難發(fā)生時(shí),該服務(wù)器將或者被重新安裝,或者一旦其達(dá)到使用壽命的結(jié)束,其將被具有更多特性和更高可靠性的更新版本代替。
在恢復(fù)和聯(lián)機(jī)備份服務(wù)器的過程期間,當(dāng)一個(gè)降級(jí)的或部分運(yùn)行的生產(chǎn)服務(wù)器和一個(gè)新啟動(dòng)的備份服務(wù)器同時(shí)運(yùn)行的期間內(nèi),常常出現(xiàn)網(wǎng)絡(luò)問題,諸如網(wǎng)絡(luò)協(xié)議(″IP″)地址沖突。
進(jìn)一步地,從一個(gè)故障的或降級(jí)的生產(chǎn)服務(wù)器中轉(zhuǎn)移靜態(tài)配置數(shù)據(jù)或動(dòng)態(tài)狀態(tài)數(shù)據(jù)到備份服務(wù)器也仍然是一個(gè)復(fù)雜和困難的過程。
因而,一旦在生產(chǎn)環(huán)境中已部署了生產(chǎn)服務(wù)器,其通常被一直使用直到災(zāi)難發(fā)生,其再次重復(fù)供應(yīng)過程,而其舊的實(shí)現(xiàn)中的問題仍未解決。
轉(zhuǎn)到圖3,其中示出有關(guān)一個(gè)可用供應(yīng)管理器如何管理應(yīng)用集群(30)的邏輯視圖。管理服務(wù)器(36)收集有關(guān)資源的信息,然后管理服務(wù)(37,37’,37′”)監(jiān)視當(dāng)前所運(yùn)行或執(zhí)行的任何過程。網(wǎng)絡(luò)池(31)包括網(wǎng)絡(luò)環(huán)境的諸如路由器、交換機(jī)、交換網(wǎng)和負(fù)載平衡器的構(gòu)件。該應(yīng)用池(32)典型地包括在該服務(wù)器上運(yùn)行的第一層應(yīng)用,例如數(shù)據(jù)庫(kù)(舉例來說,IBM DB2,Oracle等等),其在服務(wù)器平臺(tái)套件(舉例來說,IBM WebSphere或等效軟件)的頂層上運(yùn)行。
應(yīng)用資源池(33)是一組可以被供應(yīng)(38)到活動(dòng)應(yīng)用池中的可用的、未被分配的、未被供應(yīng)的服務(wù)器。后端資源池(34)包含應(yīng)用池(32)所必需的任何備份服務(wù)器,例如另一個(gè)數(shù)據(jù)庫(kù)服務(wù)器或網(wǎng)絡(luò)服務(wù)器集合。后端池(35)用作已從后端資源池(34)供應(yīng)(38′)的可用服務(wù)器的集合或組。
因而,在災(zāi)難恢復(fù)期間,為了重建企業(yè),也許不得不執(zhí)行上述乏味和繁重的供應(yīng)活動(dòng)以實(shí)現(xiàn)從若干池中所選擇出來的眾多服務(wù)器和眾多配置。
業(yè)界中的另一個(gè)增長(zhǎng)業(yè)務(wù)趨勢(shì)是“子容量定價(jià)(sub-capacitypricing)”。子容量許可容許客戶給在小于由計(jì)算平臺(tái)的處理器數(shù)目所確定的總?cè)萘康乃绞褂玫漠a(chǎn)品發(fā)出許可證。例如,利用諸如IBMiSeries和AS/400硬件,運(yùn)行OS/400 V4R4或之后版本的平臺(tái)的某些IBM產(chǎn)品,利用IBM提供的工具將系統(tǒng)隔離成邏輯分區(qū)。利用子容量定價(jià),需要被發(fā)給許可證的處理器的數(shù)量是單個(gè)機(jī)器(其中程序被定義)的全部區(qū)分上的所有處理器的聚集,包括處理器的部分共享,其被四舍五入到下一個(gè)最高總數(shù)量。因此,如果平臺(tái)支持,客戶可以通過授予分許可得到可觀的成本節(jié)省。然而,這提出了配置備份服務(wù)器和替換服務(wù)器的特定的挑戰(zhàn),尤其在其中配置時(shí)間非常關(guān)鍵的情況下。
此外,服務(wù)器的一些池可受總許可限制的制約,例如有關(guān)特定程序的多少拷貝可在該池中的多個(gè)服務(wù)器上同時(shí)運(yùn)行的約束。考慮這些限制也可以提出快速地配置替換或備份服務(wù)器的值得注意的挑戰(zhàn)。
發(fā)明內(nèi)容
本發(fā)明提供了一個(gè)提供″部分解″,舉例來說,被部分地供應(yīng)的服務(wù)器的系統(tǒng)和方法,可以用來滿足必要時(shí)對(duì)諸如災(zāi)難恢復(fù)的活動(dòng)的任何期望。每個(gè)部分解或″偽克隆(pseudo-clone)″都采用若干特定配置和供應(yīng)的生產(chǎn)服務(wù)器上的最高水平的公共構(gòu)件組成(舉例來說,軟件,硬件等等),以允許執(zhí)行最終供應(yīng)活動(dòng)的最小化集,從而容許偽克隆承擔(dān)特定配置的生產(chǎn)服務(wù)器之一的處理活動(dòng)。
根據(jù)本發(fā)明,確定一組特定生產(chǎn)服務(wù)器的″最大公分母(highestcommon denominator)″,繼而配置一個(gè)或多個(gè)偽克隆以作為所識(shí)別的任何特定生產(chǎn)服務(wù)器的潛在替換。進(jìn)一步地,根據(jù)本發(fā)明,當(dāng)目標(biāo)生產(chǎn)服務(wù)器之一需要被替代或停止使用時(shí),適當(dāng)?shù)膫慰寺∠到y(tǒng)被快速地供應(yīng)以承擔(dān)該被停止使用的服務(wù)器的任務(wù)。
結(jié)合此處所提供的附圖的下面的具體實(shí)施方式
給出本發(fā)明的完整的說明。
圖1描述了一個(gè)通用的計(jì)算平臺(tái)結(jié)構(gòu),適用于本發(fā)明的實(shí)現(xiàn)。
圖2示出了一個(gè)與圖1的通用結(jié)構(gòu)有關(guān)的軟件和固件的通用體系結(jié)構(gòu)。
圖3圖解了典型供應(yīng)管理系統(tǒng)的組成部分和活動(dòng)。
圖4圖解了根據(jù)本發(fā)明的偽克隆配置和部署過程的構(gòu)件和活動(dòng)。
圖5列出了根據(jù)本發(fā)明的一個(gè)邏輯過程。
具體實(shí)施例方式
本發(fā)明的一個(gè)可用實(shí)施例是將本發(fā)明實(shí)現(xiàn)為針對(duì)諸如先前所揭示的系統(tǒng)的現(xiàn)存供應(yīng)管理系統(tǒng)的軟件和硬件構(gòu)件的擴(kuò)展或補(bǔ)充。本揭示為了說明目的利用先前所描述的IBM TPM系統(tǒng),但是本領(lǐng)域技術(shù)人員將容易地認(rèn)識(shí)到本發(fā)明可被用于多種計(jì)算環(huán)境。
最大公分母配置的確定本發(fā)明的方法的第一方面確定生產(chǎn)服務(wù)器的若干配置中的最大量的公共構(gòu)件成分(common componentry)。例如,一個(gè)企業(yè)中的三個(gè)服務(wù)器類型,服務(wù)器1、服務(wù)器2和服務(wù)器N,如圖4中所示的例子(41,42和43)。該例子中,所有三個(gè)服務(wù)器包括計(jì)算平臺(tái)和操作系統(tǒng),并且為了該例子,我們將假定它們?nèi)齻€(gè)全部使用相同的硬件平臺(tái)和操作系統(tǒng)。然而,實(shí)際上,硬件平臺(tái)細(xì)節(jié)(例如,處理器類型,RAM的量,盤空間,盤速度,通信帶寬等等)以及操作系統(tǒng)(例如,包括修改版本和服務(wù)更新版本的操作系統(tǒng)種類和型號(hào))是確定最大公分母的因素。
該企業(yè)(40)則由這三個(gè)服務(wù)器類別(41,42,43)組成,所有的服務(wù)器包括相同的硬件平臺(tái),操作系統(tǒng)和輕量目錄訪問協(xié)議(″LDAP″)服務(wù)器程序。因而,全部三個(gè)服務(wù)器的最大公分母是該構(gòu)件組合。根據(jù)本發(fā)明,最適合于用作這三個(gè)系統(tǒng)的任何系統(tǒng)的準(zhǔn)備用系統(tǒng)的偽克隆,例如″低優(yōu)先級(jí)″偽克隆(49),被預(yù)配置(48)為僅包括這些構(gòu)件。
因此,利用該偽克隆預(yù)配置(49),在特定目標(biāo)服務(wù)器發(fā)生故障的情況下,只有下面的完成供應(yīng)步驟(400)會(huì)是必要的(a)如果服務(wù)器1出故障,該偽克隆系統(tǒng)將被供應(yīng)(400)以1.WebSphere應(yīng)用服務(wù)器許可;2.DB2通用數(shù)據(jù)庫(kù)許可;以及3.Netview許可;(b)如果服務(wù)器2出故障,該偽克隆系統(tǒng)將被供應(yīng)(400)以
1.WebSphere應(yīng)用服務(wù)器許可;2.Oracle 9i數(shù)據(jù)庫(kù)許可;以及3.Netview許可;或者,(c)如果服務(wù)器N出故障,該偽克隆系統(tǒng)將被直接投入服務(wù)(400),因?yàn)槠湟呀?jīng)包含替代服務(wù)器N的功能的所有必要構(gòu)件。
在這些情況的每個(gè)情況中,完成或最終供應(yīng)(400)的工作量以及時(shí)間被降低,使得下面的步驟不必在故障之后執(zhí)行(1)配置硬件平臺(tái);(2)安裝操作系統(tǒng)、升級(jí)包以及服務(wù)包;(3)以及安裝LDAP服務(wù)器程序。
通過將該偽克隆(49″)“預(yù)配置”為已經(jīng)具有全部三個(gè)服務(wù)器的最大公分母構(gòu)件成分,在三個(gè)服務(wù)器(41,42,43)中任何服務(wù)器出現(xiàn)故障時(shí),其容許用最少的步驟、最少的時(shí)間以及最小的風(fēng)險(xiǎn)“完成”對(duì)特定服務(wù)器配置的配置(400)。
然而,如果目標(biāo)資源池被簡(jiǎn)化為只有服務(wù)器1和2(41,42),則最大公分母將被確定為硬件平臺(tái)和操作系統(tǒng),LDAP服務(wù)器,加上Netview許可和WebSphere應(yīng)用服務(wù)器套件。因而,具有服務(wù)器1和2(41,42)但不包含服務(wù)器N的池的″高優(yōu)先級(jí)″偽克隆(49)可被定義和配置(48),其在故障轉(zhuǎn)移或?yàn)?zāi)難恢復(fù)情況中將甚至更快地最終供應(yīng)(400)以承擔(dān)服務(wù)器1或服務(wù)器2的配置和任務(wù)。
因此,利用僅以服務(wù)器1和2作為目標(biāo)的該更高等級(jí)的偽克隆(49′)預(yù)配置,在特定目標(biāo)服務(wù)器出現(xiàn)故障的情況下,只有下面的完成或“結(jié)束”供應(yīng)步驟(400)會(huì)是必要的(a)如果服務(wù)器1出故障,該偽克隆系統(tǒng)將被供應(yīng)(400)以DB2數(shù)據(jù)庫(kù)許可;或(b)如果服務(wù)器2出故障,該偽克隆系統(tǒng)將被供應(yīng)(400)以O(shè)racle9i數(shù)據(jù)庫(kù)許可;在這些情況的每個(gè)情況中,供應(yīng)工作量以及時(shí)間被降低,使得下面的步驟(48)不必繼出現(xiàn)故障之后被執(zhí)行(1)配置硬件平臺(tái);(2)安裝操作系統(tǒng)、升級(jí)包以及服務(wù)包;(3)安裝LDAP服務(wù)器程序;(4)安裝Websphere應(yīng)用服務(wù)器;以及(5)安裝Netview程序。
通過將該高等級(jí)偽克隆″預(yù)配置″(48)為已經(jīng)具有所有少量服務(wù)器(例如只有服務(wù)器1和2而沒有N)的最大公分母構(gòu)件成分,其容許在目標(biāo)服務(wù)器(41,42)中的任何服務(wù)器出現(xiàn)故障時(shí)用最少的步驟、最少的時(shí)間以及最小的風(fēng)險(xiǎn)更快地對(duì)特定服務(wù)器配置″結(jié)束″配置。然而,如果服務(wù)器N出故障,重新配置偽克隆以執(zhí)行服務(wù)器N的功能會(huì)是次最優(yōu)的(例如,某些構(gòu)件不得不被取消供應(yīng)或卸載)。
當(dāng)然,其它等級(jí)的預(yù)配置服務(wù)器(49″)是可能的,這取決于部署在該生產(chǎn)環(huán)境中的配置選項(xiàng)和配置的數(shù)量。
例如,圖4中,如果我們?nèi)缦路峙渥兞拷o服務(wù)器構(gòu)件A=操作系統(tǒng)″XYZ″,修改版本XXB=計(jì)算平臺(tái)″LMNOP″C=LDAP服務(wù)器程序或許可D=WebSphere應(yīng)用服務(wù)器程序或許可E=Oracle 9i數(shù)據(jù)庫(kù)應(yīng)用程序或許可F=DB2通用數(shù)據(jù)庫(kù)應(yīng)用程序或許可G=Netview應(yīng)用程序或許可則,用布爾項(xiàng)表示每個(gè)服務(wù)器的配置,其中″*″表示邏輯″與″,而″+″表示邏輯″或″SVR(1)=A*B*C*D*F*GSVR(2)=A*B*C*D*E*G;以及SVR(N)=A*B*C在該表示中,適于作為所有三個(gè)服務(wù)器1,2和N的快速替換的第一等級(jí)偽克隆將具有最大公分母配置
PS-CLONE(1+2+N)=A*B*C只針對(duì)服務(wù)器1和2,而不針對(duì)服務(wù)器N的更高等級(jí)的另一個(gè)偽克隆將具有配置PS-CLONE(1+2)=A*B*C*D*G圖4的例子相對(duì)簡(jiǎn)單,僅有三個(gè)不同的服務(wù)器配置,以及七個(gè)不同的構(gòu)件選項(xiàng)。因而,可能誤使假定實(shí)際對(duì)于這樣的系統(tǒng)可幾乎確定最大公分母,而實(shí)際上,為了確定最大公分母?jìng)慰寺☆A(yù)配置所必須考慮的配置選擇或特性的數(shù)量是非常大且非常復(fù)雜的,包括但不限于下面的選項(xiàng)(1)硬件平臺(tái),包括存儲(chǔ)器量,盤容量及速度,通信帶寬及類型,以及任何專用硬件(例如,視頻處理器,音頻處理器等等);(2)操作系統(tǒng)種類及型號(hào)(例如,IBM AIX[TM],MicrosoftWindows XP Professional[TM],Unix,Linux,等等),包括任何可用修改版本,更新版本及服務(wù)包;(3)應(yīng)用程序及套件,包括但不限于web服務(wù)器,web資源處理器(例如,流視頻服務(wù)器,Macromedia FLASH服務(wù)器,加密服務(wù)器,信用卡處理客戶端等等),數(shù)據(jù)庫(kù)程序,以及任何專用程序(例如,程序,Java Bean,servlet等等),包括每個(gè)的修改版本;以及(4)每個(gè)應(yīng)用程序所需的任何中間件或驅(qū)動(dòng)程序。
為此,本發(fā)明可以針對(duì)簡(jiǎn)單應(yīng)用及企業(yè)配置采用相對(duì)簡(jiǎn)單的邏輯,或可采用基于公理集合論的本體論處理,例如采用歐幾里得算法,擴(kuò)展歐幾里得算法,或Ferguson-Forcade算法的變形的處理,其被用來尋找其中每個(gè)服務(wù)器配置被視為構(gòu)件集的最大公分母。本領(lǐng)域技術(shù)人員明白,可采用其他邏輯處理來尋找給定集的公共集及子集。
利用服務(wù)器日志來預(yù)測(cè)配置需求根據(jù)本發(fā)明的一個(gè)增強(qiáng)實(shí)施例,從各種服務(wù)器收集服務(wù)器日志(45)以用于確定哪些構(gòu)件可能出故障,以及出故障的預(yù)期時(shí)間。硬件并且甚至軟件構(gòu)件均具有故障率,平均無故障時(shí)間等等,其可以成為確定哪些偽克隆預(yù)配置將支持哪些生產(chǎn)服務(wù)器子集,以及哪些生產(chǎn)服務(wù)器可能最早出故障的分析所考慮的因素,使得那些具有較高故障率的生產(chǎn)服務(wù)器的更多偽克隆可針對(duì)故障被預(yù)配置并及時(shí)準(zhǔn)備好。
根據(jù)本發(fā)明另一增強(qiáng)實(shí)施例,出現(xiàn)故障的預(yù)期時(shí)間和預(yù)期故障率被用于偽克隆配置以確定將來每個(gè)偽克隆應(yīng)實(shí)際建立和準(zhǔn)備好的時(shí)間。
如在圖4的上述例子中那樣,利用每個(gè)構(gòu)件的第一次故障預(yù)期時(shí)間EFF的PS-CLONE(1+2+N)可靠性預(yù)測(cè)可計(jì)算為EFF-PS(1+2+N)=(EFF-A+EFF-B+EFF-C+EFF-D+EFF-E+EFF-G)的最早時(shí)間其中EFF-X是構(gòu)件X的第一次故障的單獨(dú)預(yù)期時(shí)間。
在PS-CLONE(1+2+N)的構(gòu)件中的任何構(gòu)件的最早故障預(yù)期時(shí)間EFF-PS(1+2+N)可在偽克隆池中配置并準(zhǔn)備好偽克隆系統(tǒng)。否則,到該時(shí)間時(shí),將被該偽克隆消耗的資源可能用于其他目的。
還應(yīng)該注意到,不同于為偽克隆的預(yù)配置確定最大公分母,評(píng)估具有不同構(gòu)件的服務(wù)器組的第一次故障的最早時(shí)間的邏輯處理必須包括構(gòu)件的全部(例如,最大超集),這些構(gòu)件存在于任何目標(biāo)服務(wù)器中,不僅僅是公共構(gòu)件或偽克隆構(gòu)件。這是因?yàn)樵谀繕?biāo)服務(wù)器中的構(gòu)件出故障時(shí),甚至當(dāng)該構(gòu)件是在完成步驟(400)中將被配置到偽克隆中的構(gòu)件時(shí),可能需要偽克隆。
將偽克隆集成到供應(yīng)管理器系統(tǒng)利用供應(yīng)管理系統(tǒng)的擴(kuò)展,利用故障轉(zhuǎn)移工作流程定義將備份客戶端與每個(gè)服務(wù)器集成起來。這建立了具有為每個(gè)服務(wù)器建立偽克隆的指定的備用服務(wù)器的故障轉(zhuǎn)移池,其中每個(gè)偽克隆適合于多個(gè)目標(biāo)生產(chǎn)服務(wù)器。
當(dāng)故障轉(zhuǎn)移情況發(fā)生時(shí),使用故障轉(zhuǎn)移工作流程供應(yīng)過程,其為管理員提供了更多的管理能力,減少了先前所需要的人工步驟。然后出故障的服務(wù)器被停止在生產(chǎn)池中使用,并為進(jìn)一步的修理或恢復(fù)而返回到維護(hù)方式。IT管理員具有必要時(shí)經(jīng)常配置備份,以及通過利用組織所定義的監(jiān)視工作流程來監(jiān)視每個(gè)解決方案的能力。因此,來自生產(chǎn)服務(wù)器的備份被存儲(chǔ)在備份(或偽克隆)服務(wù)器池中。
根據(jù)本發(fā)明的一個(gè)可用實(shí)施例的一個(gè)方面,結(jié)合映像技術(shù)、盤分區(qū)、引導(dǎo)控制以及驅(qū)動(dòng)應(yīng)用程序和使能自動(dòng)化能力的備份的自動(dòng)化邏輯,采用基于每個(gè)所供應(yīng)的服務(wù)器的作用而使應(yīng)用程序的卸載或安裝自動(dòng)化的能力。
本發(fā)明的邏輯過程轉(zhuǎn)到圖5,示出了關(guān)于建立偽克隆系統(tǒng)的本發(fā)明的邏輯過程的高層表示,包括如前所述的一些可選的或增強(qiáng)的方面。
基于來自服務(wù)器日志的數(shù)據(jù)(53),為每個(gè)將被克隆的生產(chǎn)服務(wù)器建立初始服務(wù)器活動(dòng)及歷史記錄(51)。基于服務(wù)器日志及新需求信息,本發(fā)明可選地繼續(xù)監(jiān)視任何服務(wù)器或需求變化(53)。如果沒有變化(54),則監(jiān)視繼續(xù)。如果發(fā)生變化,或在初始偽克隆預(yù)配置時(shí),本發(fā)明檢查從諸如供應(yīng)管理器文件(55)及其他歷史計(jì)量數(shù)據(jù)(56)的源處收集的全部信息。
做出有關(guān)諸如需要、優(yōu)先等級(jí)和可用資源的每個(gè)系統(tǒng)構(gòu)件的因素的預(yù)測(cè)。然后計(jì)算最大公分母構(gòu)件成分(58),并確定適當(dāng)?shù)念A(yù)配置和結(jié)束配置工作流程(59)。
為調(diào)度偽克隆的實(shí)現(xiàn),這些用于偽克隆(500)的預(yù)配置和結(jié)束配置(30)的工作流程被輸出給供應(yīng)管理系統(tǒng)(30)。
可選地,為了改進(jìn)預(yù)測(cè)及期望,以及偽克隆可用性,象真實(shí)事件發(fā)生那樣隨時(shí)間對(duì)目標(biāo)服務(wù)器的活動(dòng)進(jìn)行跟蹤(53)并且更新統(tǒng)計(jì)數(shù)據(jù)(56)。
本發(fā)明的增強(qiáng)實(shí)施例及應(yīng)用存在本發(fā)明的增強(qiáng)及可選實(shí)施例的許多方面,包括通過本發(fā)明某些方面實(shí)現(xiàn)的大量業(yè)務(wù)處理。
系統(tǒng)升級(jí)及補(bǔ)丁安裝根據(jù)一個(gè)可用實(shí)施例中的一個(gè)選項(xiàng)的一方面,本發(fā)明可在系統(tǒng)升級(jí)或補(bǔ)丁安裝期間用于受控故障轉(zhuǎn)移。在這種情況中,管理員將在那些活動(dòng)開始之前計(jì)劃何時(shí)生產(chǎn)服務(wù)器將被升級(jí)或修補(bǔ),以及何時(shí)將實(shí)現(xiàn)偽克隆。然后,為使不能工作的目標(biāo)系統(tǒng)發(fā)生適當(dāng)?shù)霓D(zhuǎn)換,管理員可啟動(dòng)目標(biāo)系統(tǒng)的模擬故障,其將導(dǎo)致供應(yīng)管理系統(tǒng)將偽克隆投入聯(lián)機(jī)來代替目標(biāo)系統(tǒng)。
被感染的及被隔離的系統(tǒng)根據(jù)本發(fā)明的另一個(gè)方面,被診斷為感染病毒或其他惡意代碼的系統(tǒng)也可以被隔離,其實(shí)際上在供應(yīng)管理系統(tǒng)看來是系統(tǒng)故障,并且其將導(dǎo)致偽克隆系統(tǒng)最終被配置并被投入聯(lián)機(jī)。
子許可系統(tǒng)根據(jù)本發(fā)明的一個(gè)增強(qiáng)實(shí)施例的另一方面,隨著對(duì)子許可配置需求特別關(guān)注,偽克隆可被建立,包括實(shí)現(xiàn)那些偽克隆的工作流程。在該實(shí)施例中,不僅整個(gè)偽克隆服務(wù)器以某個(gè)方式進(jìn)行配置以與一組目標(biāo)服務(wù)器的最大構(gòu)件公分母匹配,而且根據(jù)任何目標(biāo)服務(wù)器的任何子許可限制在子服務(wù)器層次執(zhí)行公分母分析(58)。例如,如果三個(gè)目標(biāo)服務(wù)器之一被子許可為只容許數(shù)據(jù)庫(kù)應(yīng)用程序在服務(wù)器之一中的4個(gè)處理器的3個(gè)上運(yùn)行,但所有其他目標(biāo)服務(wù)器需要數(shù)據(jù)庫(kù)應(yīng)用程序在所有可用處理器上運(yùn)行,則所有目標(biāo)服務(wù)器的最大公分母將為數(shù)據(jù)庫(kù)應(yīng)用程序的3個(gè)處理器的子許可,并且因此偽克隆將被部分地配置(48)為僅包括3處理器數(shù)據(jù)庫(kù)許可。如果該偽克隆之后將被完成供應(yīng)(400)以替代全許可服務(wù)器之一,則對(duì)該偽克隆的許可將因此隨著一組完成供應(yīng)而被升級(jí)。
超級(jí)許可系統(tǒng)在本發(fā)明的子許可方面的一個(gè)變化中,當(dāng)建立以在組層次許可的約束下的一個(gè)或多個(gè)服務(wù)器為目標(biāo)的偽克隆時(shí),可考慮許可約束。代替子許可地,這可被看作″超級(jí)許可″,其中在構(gòu)件的多少拷貝可被同時(shí)執(zhí)行方面約束一組服務(wù)器。在這樣的情況下,偽克隆配置工作流程可選地或者從偽克隆配置中省略超級(jí)許可的構(gòu)件,或者將超級(jí)許可構(gòu)件標(biāo)記為特殊考慮,以便在完成供應(yīng)期間恰好在最后確定的替換服務(wù)器聯(lián)機(jī)之前取消供應(yīng)。
在第一個(gè)可選過程中,本發(fā)明確定(58)最大公分母構(gòu)件集的構(gòu)件是否服從任何目標(biāo)服務(wù)器上的超級(jí)許可約束。如果是這樣的話,其不包括在用于建立(48)偽克隆的偽克隆工作流程內(nèi),并且因此當(dāng)恰好在將替換服務(wù)器投入聯(lián)機(jī)之前能夠驗(yàn)證超級(jí)許可期限時(shí),該超級(jí)許可構(gòu)件被留下以用于完成供應(yīng)(400)期間的安裝或配置。
在第二可選過程中,如同第一可選過程中那樣執(zhí)行相同的超級(jí)許可分析(400),但該超級(jí)許可構(gòu)件被配置(48)到偽克隆中(而不是被省略)。然而,該超級(jí)許可構(gòu)件被標(biāo)記為以后在完成供應(yīng)期間考慮的超級(jí)許可構(gòu)件。在完成供應(yīng)(400)期間,工作流程被定義為檢查超級(jí)許可的限期及許可構(gòu)件的使用的實(shí)時(shí)狀態(tài),并且如果其余聯(lián)機(jī)服務(wù)器已滿足或超出許可有效期,完成工作流程在將替換服務(wù)器投入聯(lián)機(jī)之前取消供應(yīng)該超級(jí)許可構(gòu)件。
高可用性預(yù)測(cè)根據(jù)本發(fā)明的一個(gè)增強(qiáng)實(shí)施例的另一個(gè)方面,故障預(yù)測(cè)器(57)不僅應(yīng)用于目標(biāo)計(jì)算系統(tǒng)的構(gòu)件,而且還應(yīng)用于(501)偽克隆本身的構(gòu)件。通過分析由最大公分母(58)配置所定義的偽克隆本身的故障率,可定義(59)用于實(shí)現(xiàn)偽克隆及完成供應(yīng)的工作流程,其產(chǎn)生(60)一個(gè)可能不會(huì)出故障的備用服務(wù)器,其作為備用服務(wù)器而被依賴(例如,備用服務(wù)器將具有等于或大于其所保護(hù)的服務(wù)器的故障預(yù)期時(shí)間的故障預(yù)期時(shí)間)。
按高可用性特性分組服務(wù)器某些平臺(tái)適合于″高可用性″操作,比如每日24小時(shí),每周7天,每年365天的操作。例如,這些平臺(tái)一般運(yùn)行諸如IBM的z/OS的操作系統(tǒng),其特別地為不用重新引導(dǎo)或重新啟動(dòng)操作系統(tǒng)的長(zhǎng)期操作而設(shè)計(jì)。低可用性平臺(tái)可運(yùn)行其他的操作系統(tǒng),其不仔細(xì)管理其資源,而且不自動(dòng)執(zhí)行長(zhǎng)期維護(hù)活動(dòng),因而它們?cè)谥匦乱龑?dǎo)或重新啟動(dòng)之間運(yùn)行日,周或年的部分時(shí)間。
根據(jù)本發(fā)明的另一個(gè)可選增強(qiáng)方面,故障預(yù)測(cè)器(57)被配置為對(duì)目標(biāo)服務(wù)器組中的每個(gè)服務(wù)器執(zhí)行故障預(yù)測(cè)分析,并且按照其可用性等級(jí)確定其特征,使得偽克隆的最大公分母可被確定以達(dá)到目標(biāo)服務(wù)器的子組的可用性目標(biāo)。常常地,這將某種程度上隨著本發(fā)明自動(dòng)地發(fā)生,因?yàn)榉?wù)器的可用性等級(jí)往往與服務(wù)器的操作系統(tǒng)有關(guān)系,并且在一個(gè)必須配置的服務(wù)器,甚至偽克隆中,操作系統(tǒng)一般是一個(gè)″必有″構(gòu)件。例如,考慮一個(gè)具有五個(gè)服務(wù)器的目標(biāo)組,其中3個(gè)服務(wù)器是運(yùn)行IBM的z/OS的高可用性服務(wù)器,而2個(gè)服務(wù)器是運(yùn)行另一個(gè)可靠性較低的操作系統(tǒng)的中可用性服務(wù)器。最大公分母不會(huì)包括操作系統(tǒng),并且因此非運(yùn)行的偽克隆將在沒有操作系統(tǒng)的情況被配置,因此要求按照操作系統(tǒng)產(chǎn)品線將該5個(gè)服務(wù)器分組成兩個(gè)組。
但是,在服務(wù)器的其他配置中,這樣的關(guān)鍵構(gòu)件可以是共有的,但其他非關(guān)鍵構(gòu)件可決定平臺(tái)是否是高、中或低可用性的。在這些情況中,本發(fā)明的增強(qiáng)實(shí)施例將是有用的。
恢復(fù)時(shí)間目標(biāo)支持計(jì)算平臺(tái)提供商/運(yùn)營(yíng)商和客戶之間的許多服務(wù)等級(jí)協(xié)定中所指定的要求之一是從故障恢復(fù)的時(shí)間目標(biāo)(例如,最短的停機(jī)時(shí)間或最長(zhǎng)修復(fù)時(shí)間等等)。在這樣的商業(yè)情況中,期望預(yù)測(cè)最后確定偽克隆的配置并將其投入服務(wù)所需的時(shí)間。根據(jù)本發(fā)明的一個(gè)可選實(shí)施例的另一個(gè)方面,本發(fā)明的邏輯過程分析了每一步驟(例如,安裝步驟、配置步驟、啟動(dòng)時(shí)間等等)的工作流程和時(shí)間估計(jì),并確定偽克隆是否可在給定實(shí)現(xiàn)時(shí)間或恢復(fù)時(shí)間內(nèi)針對(duì)每個(gè)目標(biāo)服務(wù)器完成供應(yīng)(502,503)。如果不是,則向管理員通知(504)不能建立最大公分母(例如,最接近可用的偽克隆),其可在所需的量的恢復(fù)時(shí)間內(nèi)被最后確定。作為響應(yīng),管理員可以與客戶協(xié)商要求的變更,或者重新定義目標(biāo)服務(wù)器組以在每組中具有更高程度的共性,從而最小化完成供應(yīng)時(shí)間。
在該分析中,可使用每個(gè)供應(yīng)步驟的時(shí)間估計(jì),或可使用在先前實(shí)際系統(tǒng)配置活動(dòng)期間所收集的每一步驟的實(shí)際測(cè)量時(shí)間值??蛇x地,可執(zhí)行″消防演習(xí)″的練習(xí)來收集實(shí)際配置時(shí)間,其中在該時(shí)間期間預(yù)先配置偽克隆,模擬目標(biāo)系統(tǒng)的故障,并從偽克隆完成供應(yīng)替換系統(tǒng),仿佛其將要被投入服務(wù)一樣。在消防演習(xí)期間,每一配置步驟可被測(cè)量出需要多長(zhǎng)時(shí)間完成該步驟,然后這些時(shí)間可被用于每個(gè)偽克隆和每個(gè)完成工作流程的預(yù)期恢復(fù)時(shí)間特征的后續(xù)分析中。
一般計(jì)算平臺(tái)本發(fā)明優(yōu)選地實(shí)現(xiàn)為對(duì)出現(xiàn)在諸如個(gè)人計(jì)算機(jī)、網(wǎng)絡(luò)服務(wù)器及瀏覽器,尤其諸如那些已經(jīng)討論過的供應(yīng)管理和隨需應(yīng)變計(jì)算系統(tǒng)的眾所周知的計(jì)算平臺(tái)上的已知軟件的擴(kuò)展或補(bǔ)充。
這些公共計(jì)算平臺(tái)可包括個(gè)人計(jì)算機(jī)和企業(yè)級(jí)服務(wù)器,還可能包括便攜式計(jì)算平臺(tái),例如個(gè)人數(shù)字助理(″PDA″),支持web的無線電話,及其它類型的個(gè)人信息管理(″PIM″)設(shè)備。
因此,觀察一個(gè)計(jì)算平臺(tái)的一般化結(jié)構(gòu)是有用的,該計(jì)算平臺(tái)可覆蓋實(shí)現(xiàn)的范圍,從高端web或企業(yè)服務(wù)器平臺(tái)到個(gè)人計(jì)算機(jī),到便攜式PDA或支持web的無線電話。
轉(zhuǎn)到圖1,提供了包括中央處理單元(1)(″CPU″)的一般化結(jié)構(gòu),其典型地由與隨機(jī)存取存儲(chǔ)器(″RAM″)(4)和只讀存儲(chǔ)器(″ROM″)(5)相聯(lián)系的微處理器組成。經(jīng)常地,CPU(1)還具有超高速緩沖存儲(chǔ)器(3)和可編程快擦寫ROM(6)。微處理器(2)和各種類型CPU存儲(chǔ)器之間的接口(7)常被稱為“本地總線”,但也可能是更一般的或工業(yè)標(biāo)準(zhǔn)總線。
許多計(jì)算平臺(tái)還具有一個(gè)或多個(gè)存儲(chǔ)驅(qū)動(dòng)器(9),例如硬盤驅(qū)動(dòng)器(″HDD″),軟盤驅(qū)動(dòng)器,光盤驅(qū)動(dòng)器(CD,CD-R,CD-RW,DVD,DVD-R,等等),以及專用的磁盤和磁帶驅(qū)動(dòng)器(例如,Iomega Zip[TM]和Jaz[TM],Addonics SuperDisk[TM],等等)。此外一些存儲(chǔ)驅(qū)動(dòng)器可通過計(jì)算機(jī)網(wǎng)絡(luò)訪問。
根據(jù)計(jì)算平臺(tái)的預(yù)定功能,許多計(jì)算平臺(tái)具備一個(gè)或多個(gè)通信接口(10)。例如,個(gè)人計(jì)算機(jī)常具有高速串行端口(RS-232,RS-422,等),增強(qiáng)并行端口(″EPP″),以及一個(gè)或多個(gè)通用串行總線(″USB″)端口。計(jì)算平臺(tái)還可具備局域網(wǎng)(″LAN″)接口,例如以太網(wǎng)卡,及其他諸如高性能串行總線IEEE-1394的高速接口。
諸如無線電話和無線網(wǎng)絡(luò)PDA的計(jì)算平臺(tái)也可具備帶有天線的射頻(″RF″)接口。有時(shí),計(jì)算平臺(tái)也可具備紅外線數(shù)據(jù)布局(IrDA)接口。
計(jì)算平臺(tái)經(jīng)常配備有一個(gè)或多個(gè)內(nèi)部擴(kuò)展槽(11),諸如,工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(″ISA″),擴(kuò)展工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(″EISA″),外圍部件互連(″PCI″),或?qū)S玫挠糜诟郊悠渌布T如聲卡,存儲(chǔ)器板,和圖形加速器的接口槽。
此外,諸如便攜式計(jì)算機(jī)和個(gè)人數(shù)字助理的許多單元具備一個(gè)或多個(gè)外部擴(kuò)充插槽(12),其容許用戶能夠容易地安裝和移去硬件擴(kuò)展設(shè)備,例如PCMCIA卡,SmartMedia卡,以及諸如移動(dòng)硬盤、CD驅(qū)動(dòng)器和軟盤驅(qū)動(dòng)器的各種專用模塊。
經(jīng)常地,存儲(chǔ)驅(qū)動(dòng)器(9)、通信接口(10)、內(nèi)部擴(kuò)展槽(11)和外部擴(kuò)充插槽(12)經(jīng)由標(biāo)準(zhǔn)或工業(yè)開放總線結(jié)構(gòu)(8),例如ISA、EISA、或PCI與CPU(1)互連。多數(shù)情況下,該總線(8)可具有專用的設(shè)計(jì)。
計(jì)算平臺(tái)通常具有一個(gè)或多個(gè)用戶輸入裝置,例如鍵盤或小鍵盤(16),和鼠標(biāo)器或指針設(shè)備(17),及/或屏幕顯示(18)。就個(gè)人計(jì)算機(jī)而言,常提供全尺寸鍵盤以及鼠標(biāo)器或指針設(shè)備,例如跟蹤球或TrackPoint[TM]。就一種支持web的無線電話而言,一種簡(jiǎn)單的小鍵盤可具有一個(gè)或多個(gè)功能特定的鍵。就PDA而言,通常提供觸摸屏(18),其常具有手寫體識(shí)別能力。
此外,麥克風(fēng)(19),例如支持web的無線電話的麥克風(fēng)或個(gè)人計(jì)算機(jī)的麥克風(fēng),由計(jì)算平臺(tái)提供。該麥克風(fēng)可用于簡(jiǎn)單地報(bào)告音頻和語(yǔ)音信號(hào),并且利用聲音識(shí)別能力,其還可用于輸入用戶選擇,例如網(wǎng)站的語(yǔ)音導(dǎo)航或自動(dòng)撥打電話號(hào)。
許多計(jì)算平臺(tái)還裝有照相機(jī)設(shè)備(100),例如靜止圖像數(shù)字照相機(jī)或全運(yùn)動(dòng)視頻數(shù)字?jǐn)z象機(jī)。
大多數(shù)計(jì)算平臺(tái)具有一個(gè)或多個(gè)用戶輸出裝置,例如顯示器(13)。顯示器(13)可采用許多形式,包括陰極射線管(″CRT″),薄膜晶體管(″TFT″)陣列,或發(fā)光二極管(″LED″)的簡(jiǎn)單集合或液晶顯示器(″LCD″)指示器。
一個(gè)或多個(gè)揚(yáng)聲器(14)及/或信號(hào)器(15)也經(jīng)常與計(jì)算平臺(tái)相聯(lián)。揚(yáng)聲器(14)可被用來再現(xiàn)音頻和音樂,例如無線電話的揚(yáng)聲器或個(gè)人計(jì)算機(jī)的揚(yáng)聲器。信號(hào)器(15)可采用簡(jiǎn)單高頻笛音發(fā)射器或蜂鳴器的形式,通常在某些設(shè)備,例如PDA和PIM上出現(xiàn)。
這些用戶輸入輸出裝置可經(jīng)由專用的總線結(jié)構(gòu)及/或接口直接互連(8′,8″)到CPU(1),或者通過諸如ISA、EISA、PCI等的一個(gè)或多個(gè)工業(yè)開放總線互連。計(jì)算平臺(tái)還具有一個(gè)或多個(gè)軟件和固件(101)程序來實(shí)現(xiàn)計(jì)算平臺(tái)所期望的功能。
現(xiàn)在轉(zhuǎn)到圖2,給出了在該范圍的計(jì)算平臺(tái)上軟件和固件(101)的一般化結(jié)構(gòu)的更多細(xì)節(jié)。可在計(jì)算平臺(tái)上提供一個(gè)或多個(gè)操作系統(tǒng)(″OS″)本地應(yīng)用程序(23),例如文字處理軟件、電子數(shù)據(jù)表、聯(lián)系管理實(shí)用程序、通訊錄、日歷、電子郵件客戶程序、演示軟件、財(cái)務(wù)和簿記程序。
此外,可提供一個(gè)或多個(gè)″便攜式″或設(shè)備無關(guān)程序(24),其必須由OS本地平臺(tái)專用解釋器(25),例如Java[TM]腳本和程序來解釋。
計(jì)算平臺(tái)還經(jīng)常擁有一種形式的web瀏覽器或微瀏覽器(26),其還可包括一個(gè)或多個(gè)對(duì)瀏覽器的擴(kuò)展,例如瀏覽器插件(27)。
計(jì)算裝置常擁有一個(gè)操作系統(tǒng)(20),例如Microsoft Windows[TM]、UNIX、IBM OS/2[TM]、LINUX、MAC OS[TM]或其他平臺(tái)專用操作系統(tǒng)。諸如PDA和無線電話的較小的設(shè)備可安裝有其他形式操作系統(tǒng),例如實(shí)時(shí)操作系統(tǒng)(″RTOS″)或掌上計(jì)算PalmOS[TM]。
常提供一組基本輸入與輸出功能(″BIOS″)和硬件設(shè)備驅(qū)動(dòng)程序(21)來容許操作系統(tǒng)(20)和程序接口并控制由計(jì)算平臺(tái)提供的特定硬件功能。
此外,許多計(jì)算平臺(tái)通常提供一個(gè)或多個(gè)嵌入式固件程序(22),其由作為外部設(shè)備的一部分的板上或″嵌入″微處理器來執(zhí)行,例如微控制器或硬盤驅(qū)動(dòng)器、通信處理器、網(wǎng)絡(luò)接口卡、或聲音或圖形卡。
因而,圖1和2在一般意義上描述了計(jì)算平臺(tái)的各種不同的硬件元件、軟件和固件程序。本領(lǐng)域技術(shù)人員很容易地認(rèn)識(shí)到在沒有背離本發(fā)明的精神和范圍的情況下,下面的方法和過程可選地部分或全部地實(shí)現(xiàn)為硬件功能。
結(jié)論為促進(jìn)本發(fā)明的理解,描述并圖解了若干示例性實(shí)施例以及實(shí)施例的可選方面。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,這些例子不代表本發(fā)明的范圍,在沒有背離本發(fā)明的精神的情況下可產(chǎn)生某些可選的實(shí)施例細(xì)節(jié)。例如,在一些實(shí)施例中,為實(shí)現(xiàn)替換服務(wù)器的偽克隆或完成供應(yīng),圖像服務(wù)器可被用于一些或所有工作流程執(zhí)行。因此,本發(fā)明的范圍應(yīng)該由下面的權(quán)利要求來確定。
權(quán)利要求
1.一種用于提供多個(gè)目標(biāo)計(jì)算系統(tǒng)配置的準(zhǔn)克隆的方法,包括步驟評(píng)價(jià)一組目標(biāo)計(jì)算系統(tǒng)的每個(gè)的構(gòu)件成分以確定所述組的目標(biāo)計(jì)算系統(tǒng)中的最大公分母構(gòu)件集;產(chǎn)生具有所述最大公分母構(gòu)件集的偽克隆配置定義;以及將所述偽克隆配置定義輸出給供應(yīng)管理系統(tǒng),以用于隨后偽克隆備份計(jì)算系統(tǒng)的實(shí)現(xiàn)。
2.根據(jù)權(quán)利要求1的方法,進(jìn)一步地包括通過根據(jù)所述偽克隆配置定義配置計(jì)算系統(tǒng)來實(shí)現(xiàn)偽克隆備份計(jì)算系統(tǒng)的步驟。
3.根據(jù)權(quán)利要求2的方法,進(jìn)一步地包括步驟確定所述偽克隆配置定義和所述計(jì)算系統(tǒng)組中目標(biāo)計(jì)算系統(tǒng)的實(shí)際構(gòu)件成分配置之間的差異配置;通過根據(jù)所述差異配置進(jìn)一步地配置所述偽克隆備份計(jì)算系統(tǒng)來實(shí)現(xiàn)替換計(jì)算系統(tǒng);以及將計(jì)算任務(wù)從所述目標(biāo)計(jì)算系統(tǒng)轉(zhuǎn)移到所述替換計(jì)算系統(tǒng),從而減輕所述目標(biāo)計(jì)算系統(tǒng)的計(jì)算任務(wù)。
4.根據(jù)權(quán)利要求3的方法,其中響應(yīng)從包含以下事件的組中選擇的事件來執(zhí)行所述確定差異配置、實(shí)現(xiàn)替換計(jì)算系統(tǒng)以及轉(zhuǎn)移計(jì)算任務(wù)的步驟所述目標(biāo)計(jì)算系統(tǒng)的故障,所述目標(biāo)計(jì)算系統(tǒng)的按計(jì)劃的停用,以及對(duì)所述目標(biāo)計(jì)算系統(tǒng)的隔離活動(dòng)。
5.根據(jù)權(quán)利要求2的方法,進(jìn)一步地包括步驟在執(zhí)行所述實(shí)現(xiàn)偽克隆備份計(jì)算系統(tǒng)的步驟之前,對(duì)所述目標(biāo)計(jì)算系統(tǒng)的所述構(gòu)件成分執(zhí)行故障預(yù)測(cè)分析,以確定第一次故障的預(yù)期時(shí)間;以及將所述實(shí)現(xiàn)所述偽克隆備份計(jì)算系統(tǒng)的步驟延遲至被投入服務(wù)的目標(biāo)計(jì)算系統(tǒng)的最早時(shí)間開始的一個(gè)時(shí)間,該時(shí)間接近所述第一次故障的時(shí)間。
6.根據(jù)權(quán)利要求5的方法,進(jìn)一步地包括步驟監(jiān)視所述目標(biāo)計(jì)算系統(tǒng)的所述構(gòu)件成分的實(shí)際故障率;維護(hù)所述故障的歷史記錄;以及修改所述故障分析以將所述第一次故障預(yù)期時(shí)間校正為接近所述實(shí)際故障率,使得所述延遲步驟更接近地代表所述構(gòu)件成分的歷史故障特性。
7.根據(jù)權(quán)利要求5的方法,其中所述執(zhí)行故障預(yù)測(cè)分析的步驟包括根據(jù)所述目標(biāo)服務(wù)器的高可用性、低停機(jī)時(shí)間特性將所述目標(biāo)服務(wù)器分組為子組,并且包括對(duì)每組具有類似特性的目標(biāo)服務(wù)器執(zhí)行故障預(yù)測(cè)分析。
8.根據(jù)權(quán)利要求2的方法,進(jìn)一步地包括步驟在執(zhí)行所述產(chǎn)生偽克隆配置定義的步驟之前,對(duì)所述偽克隆配置的所述構(gòu)件成分執(zhí)行故障分析,以確定一潛在偽克隆系統(tǒng)的第一次故障的預(yù)期時(shí)間;以及如果所述第一次故障的預(yù)期時(shí)間小于作為備用服務(wù)器的偽克隆的目標(biāo)操作持續(xù)時(shí)間,則修正所述偽克隆配置。
9.根據(jù)權(quán)利要求1的方法,進(jìn)一步地包括步驟確定一個(gè)或多個(gè)子集的目標(biāo)計(jì)算系統(tǒng),其比所述組的所有目標(biāo)計(jì)算系統(tǒng)的所述最大公分母構(gòu)件集具有更高程度的構(gòu)件成分共同性;針對(duì)所述子集產(chǎn)生具有最大公分母構(gòu)件集的一個(gè)或多個(gè)更高優(yōu)先級(jí)偽克隆配置定義;以及將所述更高優(yōu)先級(jí)偽克隆配置定義輸出給供應(yīng)管理系統(tǒng),以用于隨后一個(gè)或多個(gè)偽克隆備份計(jì)算系統(tǒng)的實(shí)現(xiàn)。
10.根據(jù)權(quán)利要求3的方法,其中所述評(píng)價(jià)每組目標(biāo)計(jì)算系統(tǒng)的構(gòu)件成分的步驟進(jìn)一步地包括評(píng)價(jià)所述構(gòu)件成分的子許可條件,其中所述產(chǎn)生偽克隆配置定義的步驟包括省略不在所有所述目標(biāo)計(jì)算系統(tǒng)上共享的非許可構(gòu)件,以及其中所述確定差異配置的步驟包括確定所述偽克隆中是否有任何子許可構(gòu)件將被升級(jí)到更高級(jí)子許可或全許可。
11.根據(jù)權(quán)利要求3的方法,其中所述評(píng)價(jià)每組目標(biāo)計(jì)算系統(tǒng)的構(gòu)件成分的步驟進(jìn)一步地包括評(píng)價(jià)所述構(gòu)件成分的超級(jí)許可條件,其中所述產(chǎn)生偽克隆配置定義的步驟包括省略在任何目標(biāo)計(jì)算系統(tǒng)上得到超級(jí)許可的構(gòu)件,以及其中所述確定差異配置的步驟包括根據(jù)超級(jí)許可約束確定所述目標(biāo)計(jì)算系統(tǒng)中任何超級(jí)許可的構(gòu)件是否要在所述替換計(jì)算系統(tǒng)中實(shí)現(xiàn)。
12.根據(jù)權(quán)利要求3的方法,其中所述評(píng)價(jià)每組目標(biāo)計(jì)算系統(tǒng)的構(gòu)件成分的步驟進(jìn)一步地包括評(píng)價(jià)所述構(gòu)件成分的超級(jí)許可條件,其中所述產(chǎn)生偽克隆配置定義的步驟包括包含和指示在任何目標(biāo)計(jì)算系統(tǒng)上得到超級(jí)許可的構(gòu)件,以及其中所述確定差異配置的步驟包括根據(jù)超級(jí)許可約束確定所述偽克隆系統(tǒng)中的任何超級(jí)許可的構(gòu)件是否將被取消供應(yīng)。
13.根據(jù)權(quán)利要求3的方法,進(jìn)一步地包括在所述實(shí)現(xiàn)替換計(jì)算系統(tǒng)的步驟之前,執(zhí)行所述差異配置所需的步驟的分析以確定根據(jù)偽克隆定義及差異配置實(shí)現(xiàn)替換計(jì)算系統(tǒng)的預(yù)期時(shí)間;將所述實(shí)現(xiàn)替換計(jì)算系統(tǒng)的預(yù)期時(shí)間與目標(biāo)實(shí)現(xiàn)時(shí)間值比較;以及響應(yīng)于所述預(yù)期時(shí)間超過所述目標(biāo)實(shí)現(xiàn)時(shí)間,向管理員報(bào)告所述超過目標(biāo)。
14.根據(jù)權(quán)利要求13的方法,其中所述差異配置所需的步驟的所述分析包括采用在一個(gè)或多個(gè)先前實(shí)際系統(tǒng)的配置和供應(yīng)期間所測(cè)量的工作流程步驟時(shí)間。
15.根據(jù)權(quán)利要求14的方法,其中所述工作流程步驟時(shí)間是在一個(gè)或多個(gè)實(shí)際恢復(fù)操作期間收集的,該操作中實(shí)現(xiàn)實(shí)際的偽克隆,模擬故障,并且根據(jù)所述差異配置重新配置所述偽克隆。
16.一種編碼有用于提供多個(gè)目標(biāo)計(jì)算系統(tǒng)配置的準(zhǔn)克隆的軟件的計(jì)算機(jī)可讀介質(zhì),當(dāng)由計(jì)算機(jī)執(zhí)行時(shí),所述軟件執(zhí)行包括以下的步驟評(píng)價(jià)一組目標(biāo)計(jì)算系統(tǒng)的每個(gè)的構(gòu)件成分以確定所述組的目標(biāo)計(jì)算系統(tǒng)中的最大公分母構(gòu)件集;產(chǎn)生具有所述最大公分母構(gòu)件集的偽克隆配置定義;以及將所述偽克隆配置定義輸出給供應(yīng)管理系統(tǒng),以用于隨后偽克隆備份計(jì)算系統(tǒng)的實(shí)現(xiàn)。
17.一種用于提供多個(gè)目標(biāo)計(jì)算系統(tǒng)配置的準(zhǔn)克隆的系統(tǒng),包括構(gòu)件成分共同性分析器,其被配置為評(píng)價(jià)一組目標(biāo)計(jì)算系統(tǒng)的每個(gè)的構(gòu)件成分以確定所述組的目標(biāo)計(jì)算系統(tǒng)中的最大公分母構(gòu)件集;配置產(chǎn)生器,其適于產(chǎn)生具有所述最大公分母構(gòu)件集的偽克隆配置定義;以及用于將所述偽克隆配置定義輸出給供應(yīng)管理系統(tǒng),以用于隨后偽克隆備份計(jì)算系統(tǒng)的實(shí)現(xiàn)的輸出裝置。
全文摘要
通過確定計(jì)算系統(tǒng)間最大公分母構(gòu)件集,產(chǎn)生偽克隆配置定義,以及實(shí)現(xiàn)部分配置為目標(biāo)計(jì)算系統(tǒng)的備份的一個(gè)或多個(gè)偽克隆計(jì)算系統(tǒng)來提供一個(gè)目標(biāo)計(jì)算系統(tǒng)集的準(zhǔn)克隆。當(dāng)發(fā)生計(jì)劃的故障轉(zhuǎn)移、實(shí)際的故障、或?qū)δ繕?biāo)計(jì)算系統(tǒng)的隔離活動(dòng)時(shí),確定差異配置以完成偽克隆系統(tǒng)的供應(yīng)以作為故障或被隔離系統(tǒng)的替換系統(tǒng)。故障預(yù)測(cè)可被用來恰好在任何目標(biāo)系統(tǒng)的預(yù)期第一次故障之前實(shí)現(xiàn)偽克隆。按照需要,該系統(tǒng)還可以接口到一個(gè)隨需應(yīng)變供應(yīng)管理系統(tǒng),以使自動(dòng)化工作流程自動(dòng)地實(shí)現(xiàn)偽克隆和替換系統(tǒng)。
文檔編號(hào)G06F11/00GK1821969SQ20061000902
公開日2006年8月23日 申請(qǐng)日期2006年2月16日 優(yōu)先權(quán)日2005年2月17日
發(fā)明者勞林·E·烏爾曼, 維杰伊·K·阿加沃爾, 普?qǐng)D考德·G·拉馬昌德拉, 克里斯多夫·A·皮特斯, 克萊格·M·勞頓, 約翰·P·懷特菲爾德 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司