欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于自動(dòng)管理計(jì)算環(huán)境的復(fù)制數(shù)據(jù)的狀態(tài)的方法和系統(tǒng)的制作方法

文檔序號(hào):6649955閱讀:212來源:國知局
專利名稱:用于自動(dòng)管理計(jì)算環(huán)境的復(fù)制數(shù)據(jù)的狀態(tài)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般地涉及數(shù)據(jù)管理,并且具體地涉及自動(dòng)管理通信環(huán)境的數(shù)據(jù)的狀態(tài)。
背景技術(shù)
數(shù)據(jù)管理是計(jì)算環(huán)境的全面管理的重要方面。在支持復(fù)制數(shù)據(jù)的那些環(huán)境中這是尤其真實(shí)的。
復(fù)制數(shù)據(jù)使環(huán)境能被配置用于災(zāi)難恢復(fù)。在這種配置中,將主站點(diǎn)上的數(shù)據(jù)復(fù)制到輔助站點(diǎn),并在萬一主站點(diǎn)變?yōu)椴豢捎脮r(shí),該數(shù)據(jù)可以使用。
為能夠使用輔助站點(diǎn),該站點(diǎn)上的數(shù)據(jù)必須適合于應(yīng)用訪問。當(dāng)前,存在用于管理復(fù)制站點(diǎn)的數(shù)據(jù)的各種工具,包括由紐約Armonk的國際商業(yè)機(jī)器公司所提供的對等遠(yuǎn)程復(fù)制(PPRC)和企業(yè)遠(yuǎn)程復(fù)制管理工具(eRCMF)。不過,這些工具需要大量的人工干預(yù)。因此,它們無法滿足許多現(xiàn)代商業(yè)企業(yè)嚴(yán)格的恢復(fù)時(shí)間的目標(biāo)。
根據(jù)前述討論,存在對于自動(dòng)化的數(shù)據(jù)管理工具的需求。在一個(gè)特定示例中,存在對于能夠自動(dòng)管理復(fù)制存儲(chǔ)介質(zhì)的數(shù)據(jù)管理工具的需求。

發(fā)明內(nèi)容
通過提供管理通信環(huán)境的數(shù)據(jù)的方法,克服了現(xiàn)有技術(shù)的缺點(diǎn)并提供了額外的優(yōu)點(diǎn)。該方法包括例如自動(dòng)獲得通信環(huán)境的至少一部分?jǐn)?shù)據(jù)的狀態(tài);以及至少基于所述至少一部分?jǐn)?shù)據(jù)的所獲得狀態(tài)而自動(dòng)將所述的至少一部分?jǐn)?shù)據(jù)安置于適當(dāng)狀態(tài)。
在本發(fā)明的再一方面中,提供了管理通信環(huán)境的復(fù)制存儲(chǔ)介質(zhì)的方法。該方法包括例如由通信環(huán)境的實(shí)體獲得控制,以確定復(fù)制存儲(chǔ)介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)介質(zhì)是否處于適當(dāng)狀態(tài),以便允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的至少一個(gè);由該實(shí)體自動(dòng)獲得一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài);以及自動(dòng)將該一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于適當(dāng)狀態(tài),以便允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的至少一個(gè),所述自動(dòng)安置步驟至少使用了一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的所獲得狀態(tài)。
此處也描述并要求了對應(yīng)于以上概述的方法的系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品。
通過本發(fā)明的技術(shù)實(shí)現(xiàn)了額外的特征和優(yōu)點(diǎn)。此處詳細(xì)描述了本發(fā)明的其他實(shí)施例和方面,并且它們被認(rèn)為是所要求的發(fā)明的一部分。


位于本說明書結(jié)尾處的權(quán)利要求具體指出并明確要求了被認(rèn)為是本發(fā)明的主題。通過以下的詳細(xì)描述并結(jié)合附圖,本發(fā)明的前述的和其他的目的、特征和優(yōu)點(diǎn)將變得明顯,在附圖中圖1描述了結(jié)合及使用本發(fā)明的一個(gè)或多個(gè)方面的通信環(huán)境的一個(gè)實(shí)施例;圖2描述了根據(jù)本發(fā)明的一個(gè)方面的圖1的生產(chǎn)力中心機(jī)器(Productivity Center Machine)的進(jìn)一步細(xì)節(jié)的一個(gè)示例;圖3描述了根據(jù)本發(fā)明的一個(gè)或多個(gè)方面與自動(dòng)管理數(shù)據(jù)狀態(tài)相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例;圖4描述了根據(jù)本發(fā)明的一個(gè)方面在廣域群集基礎(chǔ)設(shè)施中的自動(dòng)化管理接口的體系結(jié)構(gòu)概觀的一個(gè)示例;圖5描述了根據(jù)本發(fā)明的一個(gè)方面用于使資源組變?yōu)槁?lián)機(jī)或脫機(jī)的各實(shí)體的交互的概觀;圖6描述了根據(jù)本發(fā)明的一個(gè)方面與資源組聯(lián)機(jī)處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例;圖7描述了根據(jù)本發(fā)明的一個(gè)方面的同步卷集狀態(tài)圖的一個(gè)示例;圖8描述了根據(jù)本發(fā)明的一個(gè)方面的擴(kuò)展距離卷集狀態(tài)圖的一個(gè)示例;圖9描述了根據(jù)本發(fā)明的一個(gè)方面與資源組脫機(jī)處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例;圖10描述了根據(jù)本發(fā)明的一個(gè)方面與用于同步卷集的故障轉(zhuǎn)移(failover)處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例;圖11描述了根據(jù)本發(fā)明的一個(gè)方面的卷集的無閃速復(fù)制(flash copy)故障轉(zhuǎn)移/退回循環(huán)的一個(gè)示例;圖12描述了根據(jù)本發(fā)明的一個(gè)方面與用于同步卷集的故障回復(fù)(failback)處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例;圖13描述了根據(jù)本發(fā)明的一個(gè)方面與用于非同步卷集的故障轉(zhuǎn)移處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例;圖14描述了根據(jù)本發(fā)明的一個(gè)方面的卷集的閃速復(fù)制故障轉(zhuǎn)移/故障回復(fù)循環(huán)的一個(gè)示例;以及圖15描述了根據(jù)本發(fā)明的一個(gè)方面與用于非同步卷集的故障回復(fù)處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。
具體實(shí)施例方式
根據(jù)本發(fā)明的一個(gè)方面,提供了用于自動(dòng)管理數(shù)據(jù)狀態(tài)的能力。作為一個(gè)特定示例,提供了用于自動(dòng)管理在例如鏡像盤卷的復(fù)制存儲(chǔ)介質(zhì)上維護(hù)的鏡像數(shù)據(jù)的狀態(tài)的能力。
能夠在包括例如廣域群集環(huán)境的許多通信環(huán)境中使用本發(fā)明的一個(gè)或多個(gè)方面的管理能力。盡管此處描述了廣域群集環(huán)境,但本發(fā)明的一個(gè)或多個(gè)方面并非局限于這樣的環(huán)境,而是能夠被結(jié)合并使用于包括非群集環(huán)境的許多類型的環(huán)境中。
通過參考圖1描述了結(jié)合和使用本發(fā)明的一個(gè)或多個(gè)方面的通信環(huán)境的一個(gè)實(shí)施例。在此示例中,通信環(huán)境是廣域群集環(huán)境100,其通過具有例如經(jīng)由廣域網(wǎng)(WAN)106連接的生產(chǎn)站點(diǎn)102和恢復(fù)站點(diǎn)104而提供災(zāi)難恢復(fù)。在一個(gè)實(shí)施例中,生產(chǎn)站點(diǎn)102包括經(jīng)由WAN 106連接于恢復(fù)站點(diǎn)的路由器108b的路由器108a。路由器108a還連接于便利例如服務(wù)器A和服務(wù)器B的多個(gè)服務(wù)器112a的連接的局域網(wǎng)110a。服務(wù)器112a是高可用的服務(wù)器,并可包括基于Intel的服務(wù)器、基于UNIX的服務(wù)器和/或由紐約Armonk的國際商業(yè)機(jī)器公司所提供的zSeries和iSeries服務(wù)器,等等。這些服務(wù)器可以是彼此同類的和/或異類的,并且可在生產(chǎn)站點(diǎn)中包括多于或少于兩個(gè)服務(wù)器。
服務(wù)器112a經(jīng)由例如光纖通道或SCSI(小型計(jì)算機(jī)系統(tǒng)接口)連接的連接116a與存儲(chǔ)子系統(tǒng)114a連接(如直接連接)。在此特定實(shí)施例中,服務(wù)器(如本地節(jié)點(diǎn))與本地存儲(chǔ)子系統(tǒng)連接,并且無法訪問地理上分離的遠(yuǎn)程存儲(chǔ)子系統(tǒng)。
存儲(chǔ)子系統(tǒng)114a的一個(gè)示例是由紐約Armonk的國際商業(yè)機(jī)器公司提供的企業(yè)存儲(chǔ)服務(wù)器(Enterprise Storage Server,ESS),在2004年7月的IBM出版號(hào)為SG24-5757-04的“在開放環(huán)境中實(shí)現(xiàn)ESS復(fù)制服務(wù)的IBM TotalStorage企業(yè)存儲(chǔ)服務(wù)器”(IBM TotalStorage EnterpriseStorage Server Implementing ESS Copy Services In Open Environments)中描述了所述ESS的實(shí)施例,在此將該文獻(xiàn)整體并入本文作為參考。由于此存儲(chǔ)子系統(tǒng)在環(huán)境的生產(chǎn)站點(diǎn)內(nèi),它被認(rèn)為是主存儲(chǔ)子系統(tǒng)。(IBM、zSeries、iSeries和Enterprise Storage Server是紐約Armonk的國際商業(yè)機(jī)器公司的注冊商標(biāo)或商標(biāo)。此處所用的其他名字是國際商業(yè)機(jī)器公司或其他實(shí)體的注冊商標(biāo)或商標(biāo)。)類似地,恢復(fù)站點(diǎn)104包括與路由器108b和例如服務(wù)器C和服務(wù)器D的多個(gè)服務(wù)器112b連接的局域網(wǎng)110b。再次地,在此示例中,服務(wù)器112b是高可用的同類的和/或異類的服務(wù)器,并且恢復(fù)站點(diǎn)可包括多于或少于兩個(gè)服務(wù)器。這些服務(wù)器經(jīng)由連接116b(如光纖通道或SCSI連接)連接于存儲(chǔ)子系統(tǒng)114b(如企業(yè)存儲(chǔ)服務(wù)器)。由于此存儲(chǔ)子系統(tǒng)位于恢復(fù)站點(diǎn),它被認(rèn)為是輔助存儲(chǔ)子系統(tǒng)。
每一存儲(chǔ)子系統(tǒng)分別包括一個(gè)或多個(gè)存儲(chǔ)介質(zhì)120a、120b。在此特定示例中,每一存儲(chǔ)子系統(tǒng)包括多個(gè)盤卷,并且將來自存儲(chǔ)子系統(tǒng)114a的盤卷與來自存儲(chǔ)子系統(tǒng)114b的盤卷邏輯地結(jié)合,以提供一個(gè)或多個(gè)卷集。卷集是將以單一方式管理的一組卷,并且每一卷集包括來自主存儲(chǔ)子系統(tǒng)的一個(gè)或多個(gè)卷和來自輔助存儲(chǔ)子系統(tǒng)的一個(gè)或多個(gè)卷。卷集中的每一卷屬于同一類型,包括例如無閃速復(fù)制(NOFCPY),表示在每一站點(diǎn)上存在主卷(host volume)(應(yīng)用能夠直接訪問的卷),但不存在影子卷(shadowvolume)(應(yīng)用無法訪問的卷一它是數(shù)據(jù)的備份副本);閃速復(fù)制(ALLPCPY),表示在每一站點(diǎn)上存在主卷和影子卷;無閃速復(fù)制的擴(kuò)展距離(XDNOFCPY),表示卷能夠支持長距離操作,但不支持閃速復(fù)制;具有閃速復(fù)制的擴(kuò)展距離(XDALLFCPY),表示卷能夠支持長距離操作并且支持閃速復(fù)制;在任何站點(diǎn)上無閃速復(fù)制的級聯(lián)卷(CASNOFCPY),表示卷能夠在一個(gè)關(guān)系中用作輔助卷而在另一關(guān)系中用作主卷,但不支持閃速復(fù)制;或者在指定站點(diǎn)上具有閃速復(fù)制的級聯(lián)卷(CASSITE{sitex…sitey}FCPY),表示卷能夠在一種關(guān)系中用作輔助卷而在另一關(guān)系中用作主卷,而且支持閃速復(fù)制。在此示例中,兩個(gè)卷集122支持閃速復(fù)制,而一個(gè)卷集124不支持閃速復(fù)制。
在每一存儲(chǔ)子系統(tǒng)內(nèi)執(zhí)行的是對等遠(yuǎn)程復(fù)制(PPRC)功能128a、128b,其是允許將來自一個(gè)地理站點(diǎn)的盤卷的數(shù)據(jù)鏡像到第二地理站點(diǎn)的盤卷的硬件鏡像功能。由應(yīng)用服務(wù)器寫到一個(gè)站點(diǎn)的卷(源卷)的數(shù)據(jù)經(jīng)由鏈路126(例如,作為示例的ESCON或光纖通道鏈路)被鏡像到另一站點(diǎn)的卷(目標(biāo)卷)。在正常運(yùn)行期間,目標(biāo)卷對于該站點(diǎn)的服務(wù)器是不可訪問的,以防止無意的數(shù)據(jù)破壞。在生產(chǎn)站點(diǎn)發(fā)生故障的情況下,PPRC中止鏡像并使目標(biāo)卷可用于讀/寫訪問。當(dāng)中止鏡像時(shí),PPRC跟蹤新的寫入,并當(dāng)能夠安全地重新建立鏡像時(shí)重新同步已改變的數(shù)據(jù)。在以下美國專利中進(jìn)一步描述了PPRCWest等人的美國專利No.6,131,148,其標(biāo)題為“PPRC對的輔助卷的快照復(fù)制”(Snapshot Copy Of A Secondary Volume Of APPRC Pair),頒布日為2000年10月10日;Micka等人的美國專利No.6,189,079 B1,其標(biāo)題為“對等控制器之間的數(shù)據(jù)復(fù)制”(Data CopyBetween Peer-To-Peer Controllers),頒布日為2001年2月13日;以及Burton等人的美國專利No.6,526,419 B1,其標(biāo)題為“用于開放系統(tǒng)環(huán)境中的遠(yuǎn)程復(fù)制的方法、系統(tǒng)和程序”(Method,System And Program ForRemote Copy In An Open Systems Environment),頒布日為2003年2月25日,在此將以上每一專利整體并入本文作為參考。
在一個(gè)實(shí)施例中,為在開放系統(tǒng)環(huán)境中管理和控制PPRC,企業(yè)存儲(chǔ)服務(wù)器提供ESS復(fù)制服務(wù)web用戶接口和ESS命令行接口。以下進(jìn)一步描述復(fù)制服務(wù)。
存儲(chǔ)子系統(tǒng)114a也連接于專用服務(wù)器118a,在此處將其稱為生產(chǎn)力中心機(jī)器(PCM)。同樣地,存儲(chǔ)子系統(tǒng)114b連接于專用服務(wù)器118b,將其稱為生產(chǎn)力中心機(jī)器(PCM)。(此處將服務(wù)器118a、118b普遍指示為118。)參考圖2描述服務(wù)器118的一個(gè)實(shí)施例。
例如,服務(wù)器118是專用物理服務(wù)器(或邏輯分區(qū)的服務(wù)器-LPAR),例如由紐約Armonk的國際商業(yè)機(jī)器公司提供的RS/6000或pSeries服務(wù)器。服務(wù)器118運(yùn)行操作系統(tǒng)200(圖2)(如AIX),以及在一示例中運(yùn)行被用于運(yùn)行在復(fù)制數(shù)據(jù)時(shí)所使用的各種工具的WebSphere軟件平臺(tái)202。這些工具包括由紐約Armonk的國際商業(yè)機(jī)器公司提供的企業(yè)遠(yuǎn)程復(fù)制管理工具(eRMCF)204和復(fù)制服務(wù)功能206。在可連同WebSphere得到的2002年的“IBM WebSphere應(yīng)用服務(wù)器,版本5,服務(wù)器”(IBMWebSphere Application Server,Version 5,Servers)中描述了WebSphere的一個(gè)示例,在此將其整體并入本文作為參考。此外,在Thomas Luther的2003年1月14日的“eRCMF V2用戶指南”(eRCMF V2 User Guide)的版本0.1和Thomas Luther的2004年1月13日的“eRCMF V2實(shí)現(xiàn)指南(eRCMF V2 Implementation Guide)”的版本0.6中描述了eRCMF的一個(gè)示例,二者均可連同eRCMF得到,而在2004年7月的IBM出版號(hào)為SG24-5757-04的“在開放環(huán)境中實(shí)現(xiàn)ESS復(fù)制服務(wù)的IBMTotalStorage企業(yè)存儲(chǔ)服務(wù)器”(IBM TotalStorage Enterprise StorageServer Implementing ESS Copy Services In Open Environments)中描述了復(fù)制服務(wù)的一個(gè)示例,在此將以上每一文檔整體并入本文作為參考。
作為一個(gè)示例,企業(yè)遠(yuǎn)程復(fù)制管理工具包括與復(fù)制服務(wù)服務(wù)器206進(jìn)行通信以管理復(fù)制服務(wù)(如復(fù)制或鏡像數(shù)據(jù))的軟件。eRCMF被設(shè)置為例如用于開放系統(tǒng)的多站點(diǎn)的災(zāi)難恢復(fù)解決方案,并提供用于修復(fù)不一致的PPRC對(例如不一致的卷對)的自動(dòng)化。它是可伸縮的、靈活的開放系統(tǒng)ESS解決方案,其保護(hù)業(yè)務(wù)(數(shù)據(jù))并能被用于計(jì)劃停機(jī)(硬件和軟件更新)以及非計(jì)劃停機(jī)(災(zāi)難恢復(fù)、測試災(zāi)難)。它簡化了災(zāi)難恢復(fù)的實(shí)現(xiàn)和概念。一旦在客戶環(huán)境中配置了eRCMF,它就監(jiān)視所指定卷的PPRC狀態(tài)。eRCMF運(yùn)行于兩個(gè)專用生產(chǎn)力中心機(jī)器(PCM)上,而每一PCM在每一站點(diǎn)運(yùn)行eRCMF的一實(shí)例。在主PPRC復(fù)制服務(wù)服務(wù)器處的機(jī)器上運(yùn)行的實(shí)例是活動(dòng)eRCMF,而在備份復(fù)制服務(wù)服務(wù)器處的PCM機(jī)器上運(yùn)行的實(shí)例是備份eRCMF。在活動(dòng)PCM上運(yùn)行的主進(jìn)程是到eRCMF的接口,用于處理來自命令行或套接字(來自本地進(jìn)程)接口的命令和查詢。它也處理來自備份eRCMF進(jìn)程(從屬進(jìn)程)的命令和查詢。備份eRCMF的目的是記錄和保存來自主進(jìn)程的狀態(tài)信息,以便它能夠接管主進(jìn)程。如果活動(dòng)PCM發(fā)生故障,則將主進(jìn)程切換到備份PCM。
通過使執(zhí)行PPRC任務(wù)和監(jiān)視卷對的狀態(tài)成為可能從而排除了從ESSweb接口定義PPRC狀態(tài)的手動(dòng)PPRC過程,企業(yè)遠(yuǎn)程復(fù)制管理工具便利了配置。不過,其操作需要大量的人工參與。當(dāng)與PPRC一起使用時(shí),企業(yè)遠(yuǎn)程復(fù)制管理工具構(gòu)成層4和層6的災(zāi)難恢復(fù)解決方案。然而,它無法滿足例如金融、貿(mào)易、庫存管理等等的大多數(shù)現(xiàn)代企業(yè)的日益嚴(yán)格的恢復(fù)時(shí)間的目標(biāo)。這樣的商業(yè)環(huán)境需要提供了層7解決方案—應(yīng)用可用性—的完全自動(dòng)化的恢復(fù)能力。出現(xiàn)了企業(yè)遠(yuǎn)程復(fù)制管理工具的局限性,因?yàn)楸M管eRCMF維護(hù)卷對的狀態(tài),但它不知道在服務(wù)器級別發(fā)生了什么。
為了克服eRCMF的缺陷,提供了此處稱為自動(dòng)化管理接口(AMI)的工具,其使能管理數(shù)據(jù)狀態(tài),包括獲得數(shù)據(jù)狀態(tài)(例如當(dāng)前狀態(tài))和基于所獲得的狀態(tài)信息將數(shù)據(jù)安置于適當(dāng)狀態(tài)的自動(dòng)化。自動(dòng)化管理接口包括被用于確保數(shù)據(jù)狀態(tài)(例如鏡像的盤卷)匹配想要使用該數(shù)據(jù)的應(yīng)用的狀態(tài)的多個(gè)應(yīng)用編程接口(API)。即,AMI確保當(dāng)運(yùn)行于任一站點(diǎn)的應(yīng)用需要訪問數(shù)據(jù)時(shí)該數(shù)據(jù)是可用的。
參考圖3描述了與自動(dòng)化管理接口相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。首先,在步驟300,自動(dòng)化管理接口從通信環(huán)境的另一實(shí)體獲得控制。響應(yīng)于接收到控制,在步驟302,自動(dòng)化管理接口獲得所選擇數(shù)據(jù)的狀態(tài)。在一個(gè)示例中,這是通過執(zhí)行查詢命令完成的。在步驟304,基于所獲得的數(shù)據(jù)狀態(tài),自動(dòng)化管理接口將數(shù)據(jù)安置于適當(dāng)狀態(tài)(即,例如,使能使用該數(shù)據(jù)執(zhí)行例如訪問或鏡像的操作的狀態(tài))。例如,運(yùn)行AMI狀態(tài)機(jī)以基于所獲得的狀態(tài)調(diào)用一個(gè)或多個(gè)適當(dāng)?shù)拿钜詫?shù)據(jù)安置于適當(dāng)狀態(tài)。對于給定條件的適當(dāng)狀態(tài)存儲(chǔ)于AMI的邏輯中。在調(diào)用一個(gè)或多個(gè)命令之后以及在返回控制之前,AMI確定數(shù)據(jù)目前是否處于適當(dāng)狀態(tài)。如果否,它調(diào)用一個(gè)或多個(gè)額外的命令以確保數(shù)據(jù)被安置于適當(dāng)狀態(tài)。此后,在步驟306,自動(dòng)化管理接口將控制返回它從中獲得控制的實(shí)體。
自動(dòng)化管理接口可被用于許多環(huán)境,包括但不限于此處所述的廣域網(wǎng)群集環(huán)境中。在此環(huán)境中,自動(dòng)化管理接口是群集軟件和eRCMF之間的層。例如,如圖4中所描述的,自動(dòng)化管理接口的實(shí)例400a是群集資源管理器402a和企業(yè)遠(yuǎn)程復(fù)制管理工具404a的實(shí)例之間的層。在此特定示例中,群集資源管理器和自動(dòng)化管理接口執(zhí)行于例如生產(chǎn)站點(diǎn)的服務(wù)器A和/或服務(wù)器B(圖1)的服務(wù)器中,而eRCMF執(zhí)行于生產(chǎn)力中心機(jī)器118a(圖1)中。
群集資源管理器402a還經(jīng)由廣域網(wǎng)406連接于恢復(fù)站點(diǎn)的另一群集資源管理器402b。群集資源管理器402b也連接于自動(dòng)化管理接口的實(shí)例400b,二者均運(yùn)行于恢復(fù)站點(diǎn)的服務(wù)器上。此外,自動(dòng)化管理接口400b連接于企業(yè)遠(yuǎn)程復(fù)制管理工具的實(shí)例404b,該實(shí)例運(yùn)行于連接到服務(wù)器的PCM中。
圖4中也示出了在圖1的主存儲(chǔ)服務(wù)器114a中維護(hù)的盤控制部件408a以及在圖1的輔助存儲(chǔ)服務(wù)器114b中維護(hù)的盤控制部件408b。作為一個(gè)示例,盤控制部件408a和408b經(jīng)由一個(gè)或多個(gè)鏈路410相互連接,以使能對數(shù)據(jù)的鏡像。
在此群集環(huán)境中,AMI進(jìn)程對群集軟件是完全透明的,并運(yùn)行于卷管理層之下。作為一個(gè)示例,當(dāng)在恢復(fù)站點(diǎn)上重新啟動(dòng)應(yīng)用之前,由群集軟件調(diào)用AMI來確保備份盤卷處于適當(dāng)狀態(tài)以允許應(yīng)用訪問,在此語境中所述應(yīng)用不僅包括最終用戶與其交互的應(yīng)用,也包括從屬的數(shù)據(jù)庫軟件或其他中間件。此外,AMI使用eRCMF來識(shí)別主站點(diǎn)的存儲(chǔ)服務(wù)器的狀態(tài),并指引備份站點(diǎn)的PPRC的實(shí)例或者當(dāng)主存儲(chǔ)服務(wù)器不可用時(shí)跟蹤改變,或者當(dāng)主存儲(chǔ)服務(wù)器可用時(shí)將所述改變反映回去。
自動(dòng)化管理接口的一個(gè)職責(zé)是將底層的eRCMF盤存儲(chǔ)管理部件呈現(xiàn)給上層的群集層作為復(fù)制資源。復(fù)制資源是這樣一種資源類型,其具有對應(yīng)于跨兩個(gè)位置復(fù)制的數(shù)據(jù)副本的源和目標(biāo)的主實(shí)例和輔助實(shí)例。此類的資源包括IBM GeoRM或ESS PPRC數(shù)據(jù)復(fù)制技術(shù)。通常將由群集軟件管理的資源例如文件系統(tǒng)、IP地址或應(yīng)用服務(wù)器分組到所稱的資源組中。為使能由群集對復(fù)制資源的管理,也將復(fù)制資源包括于資源組中。當(dāng)將eRCMF卷對包括于群集資源組定義中時(shí),資源組成員被認(rèn)為是從屬資源。
群集軟件將把資源組的狀態(tài)呈現(xiàn)為主或輔助,以指示所述資源組當(dāng)前在其上是激活的站點(diǎn)。eRCMF復(fù)制資源在包括該資源的資源組當(dāng)前為聯(lián)機(jī)的站點(diǎn)上是激活的。群集軟件的資源組策略處理部件或資源管理器管理關(guān)于啟動(dòng)、停止或移動(dòng)資源組的資源策略。即,它做出關(guān)于在哪里特定資源組將被激活或去激活的決策。此上層群集事件管理器向群集eRCMF接口(即AMI)提供具有被定義為資源組的成員的復(fù)制資源的資源組的列表,以對其進(jìn)行操作。對于每一復(fù)制資源定義,資源組策略應(yīng)用指定的站點(diǎn)間策略以確定哪一節(jié)點(diǎn)或站點(diǎn)將使指定的從屬資源聯(lián)機(jī)。AMI的決策層狀態(tài)機(jī)使用此信息來決定在底層的eRCMF所保護(hù)的盤卷上采取什么操作。在處理eRCMF復(fù)制資源之后,接著將結(jié)果傳送回群集軟件,接著群集軟件采取適當(dāng)?shù)牟僮?。由自?dòng)化管理接口代表群集軟件所采取的操作取決于例如eRCMF呈現(xiàn)給所述接口的盤卷的狀態(tài)。
eRCMF所保護(hù)的盤卷的狀態(tài)定義每一卷集的當(dāng)前狀況,并由生產(chǎn)站點(diǎn)的位置和PPRC對的狀態(tài)定義。(卷集包括一對或多對卷,而卷對典型地包括來自生產(chǎn)站點(diǎn)的一個(gè)卷和來自備份站點(diǎn)的另一個(gè)卷。)卷集可以處于的內(nèi)部狀態(tài)的示例包括以下狀態(tài)InSyncPPRC對是InSync。這是可處于的優(yōu)選狀態(tài);SplitSite PPRC對在它們本身之中一致,但不一定相互一致。
在站點(diǎn)拆分之后達(dá)到此狀態(tài);OutOfSync 各站點(diǎn)相互不一致。備份站點(diǎn)在其內(nèi)部不一致??赡苷谶M(jìn)行重新同步各站點(diǎn)的操作;OutOfSync-Freeze 當(dāng)嘗試凍結(jié)時(shí)出現(xiàn)錯(cuò)誤。eRCMF不能確定拆分是否已成功。實(shí)際的狀態(tài)可以是OutOfSync或SplitSite;RecoverySiteActive各站點(diǎn)相互不一致。已調(diào)用恢復(fù)。尚未做出重新同步各站點(diǎn)的嘗試;Swapping 這是當(dāng)服務(wù)器停機(jī)時(shí)用于交換來自InSync狀態(tài)的生產(chǎn)和備份站點(diǎn)的瞬時(shí)狀態(tài);XDMode正使用擴(kuò)展距離復(fù)制(PPRC-XD);Splitting PPRC-XD已被轉(zhuǎn)換為Full Sync,一旦同步,PPRC對將中止。這在XD類型的卷集中有效;ForceRecover 當(dāng)服務(wù)器發(fā)生故障時(shí)被設(shè)置用于不同步向回復(fù)制的特殊PPRC模式。對于類型為NOFCPY、XDNOFCPY或CASNOFCPY的卷集有效;RecoverSite-ForceSwap 當(dāng)服務(wù)器發(fā)生故障時(shí)被設(shè)置用于不同步向回復(fù)制的特殊PPRC模式。對于類型為NOFCPY、XDNOFCPY或CASNOFCPY的卷集有效;XDMode-OutOfSync XDMode,不過至少一個(gè)PPRC對被中止或未配對。
響應(yīng)于AMI查詢,由eRCMF向AMI提供上述狀態(tài),但群集軟件不了解這些狀態(tài)。
一般而言,包括了一個(gè)或多個(gè)卷對的群集資源組在任何時(shí)間在群集節(jié)點(diǎn)(例如服務(wù)器)上可以處于兩種狀態(tài)之一。這兩種狀態(tài)包括指定了在該節(jié)點(diǎn)上資源組是激活的聯(lián)機(jī)狀態(tài),以及指明了在該節(jié)點(diǎn)上資源組以備份地位發(fā)揮作用的脫機(jī)狀態(tài)。在圖5中描述了用于資源組的聯(lián)機(jī)和脫機(jī)處理的概觀。當(dāng)要使資源組聯(lián)機(jī)500時(shí),群集軟件(例如群集資源管理器)調(diào)用自動(dòng)化管理接口502(此處也被稱為群集eRCMF接口),該接口聯(lián)系eRCMF 504以確定數(shù)據(jù)506的狀態(tài),并使用此信息將數(shù)據(jù)安置于適當(dāng)狀態(tài)(例如,調(diào)用適當(dāng)?shù)拿?。在此步驟完成后,AMI將控制返回到群集軟件,接著群集軟件可確保hdisk/vapath是可用的508,啟用(vary on)卷組510(例如,操作系統(tǒng)將其作為連續(xù)的、可尋址的盤區(qū)域的一組物理卷,其中一物理卷是單個(gè)物理盤),安裝文件系統(tǒng)512,并啟動(dòng)一個(gè)或多個(gè)應(yīng)用514。
類似地,當(dāng)資源組要被改為脫機(jī)520時(shí),群集軟件調(diào)用自動(dòng)化管理接口522,該接口聯(lián)系eRCMF 524以確定數(shù)據(jù)526的狀態(tài)?;跀?shù)據(jù)的狀態(tài),AMI將數(shù)據(jù)安置于適當(dāng)狀態(tài),并接著將控制返回到群集。接著群集能夠停止一個(gè)或多個(gè)應(yīng)用528,卸下文件系統(tǒng)530,停用(vary off)卷組532,并使盤成為不可用534。
參考圖6描述了關(guān)于聯(lián)機(jī)處理的進(jìn)一步細(xì)節(jié)。在此特定示例中,參考節(jié)點(diǎn)加入群集描述了聯(lián)機(jī)處理。在節(jié)點(diǎn)加入群集時(shí),將獲得資源組的所有權(quán)的群集中的節(jié)點(diǎn)運(yùn)行聯(lián)機(jī)處理。不過,無論何時(shí)要將資源組變?yōu)槁?lián)機(jī),也都調(diào)用聯(lián)機(jī)處理。
參考圖6,首先,在詢問600處,做出關(guān)于是否在此節(jié)點(diǎn)上使所選的資源組聯(lián)機(jī)的確定。如果在此節(jié)點(diǎn)上將不使所述資源組聯(lián)機(jī),則在詢問602處,做出關(guān)于是否存在將處理的更多資源組的進(jìn)一步確定。如果否,則在步驟604,完成處理。然而,如果存在將處理的更多資源組,則處理繼續(xù)到查詢600。如果要使所選的資源組聯(lián)機(jī),則在詢問606處,做出關(guān)于資源組是否包括eRCMF管理的盤卷的進(jìn)一步確定。在一個(gè)示例中,通過查詢資源組的定義做出此確定。如果資源組包括eRCMF管理的盤卷,則在步驟608,群集資源管理器調(diào)用自動(dòng)化管理接口以便利管理數(shù)據(jù)(例如盤)的狀態(tài)。如一個(gè)特定示例,調(diào)用被稱為clgetERCMFdisks的、自動(dòng)化管理接口的應(yīng)用編程接口(API)。
使用clgetERCMFdisks API確定與此資源組相關(guān)聯(lián)的一個(gè)或多個(gè)卷集的狀態(tài),并將一個(gè)或多個(gè)卷集安置于適當(dāng)狀態(tài)以便使資源組聯(lián)機(jī)。clgetERCMFdisks API的語法的一個(gè)實(shí)施例如下clgetERCMFdisks<卷集列表><本地群集站點(diǎn)><遠(yuǎn)程群集的狀態(tài)>
卷集列表— 將由AMI處理的卷集的列表;本地群集站點(diǎn)— 在其處資源組即將聯(lián)機(jī)的群集站點(diǎn)的名;遠(yuǎn)程群集的狀態(tài)— 指明遠(yuǎn)程群集是正常或停機(jī)。
通過clgetERCMFdisks API,提供了卷集名,并且獲得了鏡像的優(yōu)選方向,以便通知eRCMF當(dāng)群集節(jié)點(diǎn)聯(lián)機(jī)時(shí)使哪些盤對該群集可訪問。AMI確保所鏡像的盤卷處于適當(dāng)狀態(tài),以便群集軟件開始在盤上啟用卷組。此過程對于群集軟件是透明的,并在卷組之下進(jìn)行。
自動(dòng)化管理接口運(yùn)行一狀態(tài)機(jī)以將盤安置于適當(dāng)狀態(tài)。以下提供了由自動(dòng)化管理接口在clgetERCMFdisks API中執(zhí)行的狀態(tài)機(jī)的偽碼的一個(gè)示例{將查詢提交到在eRCMF服務(wù)器機(jī)器上運(yùn)行的eRCMF守護(hù)程序。從所述守護(hù)程序請求的信息為 1)卷集的狀態(tài);2)生產(chǎn)站點(diǎn)(卷集的源);3)恢復(fù)站點(diǎn)(卷集的目標(biāo))。if(ProductionSite=LOCALSITENAME){switch(VolumeSet State){case InSync 如果VolumeSet屬于擴(kuò)展距離類型,則運(yùn)行async命令,否則不做任何事case OutOfSync 運(yùn)行resync命令
case XDMode不做任何事case SplitSite 運(yùn)行resync VolumeSet命令case RecoverySiteActive如果遠(yuǎn)程群集正常則運(yùn)行sync命令,否則不做任何事case Swapping 運(yùn)行resync VolumeSet命令…Default帶著錯(cuò)誤退出}{else{switch(VolumeSet State){case InSync如果遠(yuǎn)程站點(diǎn)服務(wù)器停機(jī),則執(zhí)行forceSwap,否則執(zhí)行交換case OutOfSync 恢復(fù)VolumeSetcase XDMode恢復(fù)VolumeSetcase SplitSite 恢復(fù)VolumeSetcase RecoverySiteActive帶著錯(cuò)誤退出…Default帶著錯(cuò)誤退出}}使用以上偽碼,AMI提交查詢到eRCMF,以確定卷集的狀態(tài)以及卷集的源和目標(biāo)。接著,基于所提供的狀態(tài)調(diào)用各種處理。例如,如果生產(chǎn)站點(diǎn)是本地站點(diǎn)名(即,使資源組聯(lián)機(jī)之處)而卷集狀態(tài)是InSync,則不做任何事,除非卷集屬于擴(kuò)展距離類型。如果卷集屬于擴(kuò)展距離類型,則執(zhí)行async命令。這包括AMI指令eRCMF運(yùn)行eRCMF理解的async命令。在Thomas Luther的2003年1月14日的“eRCMF V2用戶指南”(eRCMF V2 User Guide)的版本0.1和Thomas Luther的2004年1月13日的“eRCMF V2實(shí)現(xiàn)指南”(eRCMF V2 Implementation Guide)的版本0.6中描述了由eRCMF運(yùn)行的各種命令的示例,以上二者均連同eRCMF提供,在此將以上每一文檔整體并入本文作為參考。
為便利將卷集安置于適當(dāng)狀態(tài),在由AMI調(diào)用后,eRCMF使用如圖7或圖8中所描述的狀態(tài)圖的邏輯。作為示例,圖7描述了用于同步卷集的狀態(tài)圖,而圖8描述了對于擴(kuò)展距離卷集的狀態(tài)圖。在這些圖的每一個(gè)中,“*”指示eRCMF狀態(tài);“+”指示eRCMF命令;圓括號(hào)中的詞語指示條件;并且?guī)в兄赶蚱涞募^的圓指示生產(chǎn)變化。
當(dāng)AMI調(diào)用命令時(shí),由eRCMF在內(nèi)部使用狀態(tài)圖的邏輯。例如,如果AMI接收了對卷集的當(dāng)前狀態(tài)為SplitSite的指示,則它指令eRCMF運(yùn)行resync。當(dāng)eRCMF運(yùn)行resync時(shí),在某一時(shí)刻,狀態(tài)由SplitSite轉(zhuǎn)變到XDMode(參見圖7),然后從XDMode轉(zhuǎn)變到OutOfSync,并最終到Insync。
在eRCMF結(jié)束執(zhí)行resync命令時(shí)和/或在執(zhí)行該命令期間,AMI確保卷集的狀態(tài)是適當(dāng)狀態(tài),在此示例中該狀態(tài)為Insync。如果卷集的狀態(tài)是適當(dāng)狀態(tài),則將控制返回群集軟件。
回到圖6,在運(yùn)行AMI API并將數(shù)據(jù)安置于適當(dāng)狀態(tài)之后,或者如果資源組不包括eRCMF管理的盤卷,則在步驟610將卷組改變?yōu)槁?lián)機(jī),在步驟612安裝文件系統(tǒng),在步驟614啟動(dòng)一個(gè)或多個(gè)應(yīng)用。此后,處理繼續(xù)到詢問602。
除了聯(lián)機(jī)處理之外,在脫機(jī)處理中也可涉及資源組。用于聯(lián)機(jī)處理的狀態(tài)圖也被用于脫機(jī)處理和其他處理。
當(dāng)當(dāng)前具有資源組的所有權(quán)的節(jié)點(diǎn)脫離群集時(shí),此節(jié)點(diǎn)運(yùn)行脫機(jī)處理。此外,每當(dāng)一資源組要被改變?yōu)槊摍C(jī)時(shí),均運(yùn)行脫機(jī)處理。根據(jù)本發(fā)明的一方面,在定義于eRCMF管理的卷盤之上的卷組被改變?yōu)槊摍C(jī)之后,調(diào)用自動(dòng)化管理接口。這確保了在能夠在遠(yuǎn)程站點(diǎn)上啟用資源組之前數(shù)據(jù)處于適當(dāng)狀態(tài)。
參考圖9描述了與脫機(jī)處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。首先,在詢問900處,做出關(guān)于是否應(yīng)在該節(jié)點(diǎn)上使資源組脫機(jī)的確定。如果在該節(jié)點(diǎn)上將不使資源組脫機(jī),則在詢問902處,做出關(guān)于是否存在要被考慮的更多資源組的進(jìn)一步確定。如果不存在要被考慮的更多資源組,則在步驟904完成處理。然而,如果存在要被處理的更多資源組,則處理繼續(xù)到詢問900。
如果要使資源組脫機(jī),則在步驟906停止一個(gè)或多個(gè)應(yīng)用。進(jìn)一步地,在步驟908卸下文件系統(tǒng),并在步驟910停用卷組。此后,在詢問912處,做出關(guān)于資源組是否包括eRCMF管理的盤卷的確定。如果資源組的確包括這種盤卷,則在詢問914處,做出關(guān)于資源組是否跨站點(diǎn)移動(dòng)的進(jìn)一步確定。如果資源組不跨站點(diǎn)移動(dòng)或資源組不包括eRCMF管理的盤卷,則處理繼續(xù)到詢問902。然而,如果資源組包括跨站點(diǎn)移動(dòng)的、eRCMF管理的盤卷,則在步驟916,調(diào)用被稱為clreleaseERCMFdisks的eRCMF AMIAPI。
使用clreleaseERCMFdisks API確定與將被移動(dòng)的資源組關(guān)聯(lián)的一個(gè)或多個(gè)卷集的狀態(tài),并將所述一個(gè)或多個(gè)卷集安置于適當(dāng)狀態(tài)以便移動(dòng)。此外,clreleaseERCMFdisks API指引eRCMF停止鏡像或轉(zhuǎn)變對盤卷進(jìn)行鏡像的方向。以下是clreleaseERCMFdisks API的語法的一個(gè)實(shí)施例clreleaseERCMFdisks<卷集列表><本地群集站點(diǎn)><遠(yuǎn)程群集的狀態(tài)>
卷集列表- 將由AMI處理的卷集的列表;本地群集站點(diǎn)- 在其處資源組即將聯(lián)機(jī)的群集站點(diǎn)的名;遠(yuǎn)程群集的狀態(tài)-指明遠(yuǎn)程群集是正常或停機(jī)。
以下是由自動(dòng)化管理接口在clreleaseERCMFdisks API中執(zhí)行的狀態(tài)機(jī)的偽碼的一個(gè)實(shí)施例{將查詢提交到在eRCMF服務(wù)器機(jī)器上運(yùn)行的eRCMF守護(hù)程序。從所述守護(hù)程序請求的信息為 1)卷集的狀態(tài);2)生產(chǎn)站點(diǎn)(卷集的源);3)恢復(fù)站點(diǎn)(卷集的目標(biāo))。if(Volume setProductionSite=TARGETSITENAME){switch(VolumeSetState){case InSync如果LocalSet=EventSite則不做任何事,否則交換VolumeSetcase OutOfSync 同步VolumeSetcase XDMode如果EventSite=LocalSet則同步VolumeSet,否則交換VolumeSetcase SplitSite 不做任何事case RecoverySiteActive不做任何事…Default帶著錯(cuò)誤退出}{else{不做任何事}}在執(zhí)行AMI API并將數(shù)據(jù)安置于適當(dāng)狀態(tài)之后,處理繼續(xù)到詢問902。
其他處理也可調(diào)用AMI API。例如,當(dāng)在遠(yuǎn)程群集停機(jī)期間已運(yùn)行forceSwap命令之后遠(yuǎn)程節(jié)點(diǎn)加入群集時(shí),調(diào)用被稱為cljoinERCMFcleanup的API。具體地,如果遠(yuǎn)程群集節(jié)點(diǎn)脫離群集而并未停用卷組,則當(dāng)該節(jié)點(diǎn)停機(jī)時(shí)在盤上留下持久保留。在備份站點(diǎn)獲得該資源組的節(jié)點(diǎn)啟動(dòng)PPRC故障轉(zhuǎn)移操作(即,由PPRC執(zhí)行的故障轉(zhuǎn)移),以便具有對備份盤的寫訪問。在執(zhí)行PPRC故障轉(zhuǎn)移操作之后,卷集的狀態(tài)轉(zhuǎn)變?yōu)镽ecoverySite-ForceSwap。當(dāng)原始節(jié)點(diǎn)重新加入群集時(shí),啟動(dòng)PPRC故障回復(fù)過程以重新同步盤對。此故障回復(fù)過程調(diào)用此API。
以下是與cljoinERCMFcleanup API關(guān)聯(lián)的語法的一個(gè)實(shí)施例。cljoinERCMFcleanup<卷集列表><加入節(jié)點(diǎn)的群集站點(diǎn)>
卷集列表—將由AMI處理的卷集的列表加入節(jié)點(diǎn)的群集站點(diǎn)— 在其處資源組即將聯(lián)機(jī)的群集站點(diǎn)的名以下是由自動(dòng)化管理接口在cljoinERCMFcleanup中執(zhí)行的狀態(tài)機(jī)的偽碼的一個(gè)實(shí)施例cljoinERCMFcleanup{如果遠(yuǎn)程節(jié)點(diǎn)加入群集(本地節(jié)點(diǎn)查詢它所擁有的VolumeSet的狀態(tài)如果VolumeSet的狀態(tài)是RecoverySite-ForceSwap,則檢查是否存在由遠(yuǎn)程節(jié)點(diǎn)保持的持久盤保留。如果存在,則AMI通過發(fā)送命令到遠(yuǎn)程節(jié)點(diǎn)而中斷此盤保留。
AMI向ercmf提交resync命令)}如以上偽碼所指明的,如果遠(yuǎn)程節(jié)點(diǎn)加入群集,則本地節(jié)點(diǎn)(如AMI)查詢它所擁有的卷集的狀態(tài)。如果卷集的狀態(tài)是RecoverySite-ForceSwap,則AMI指令eRCMF執(zhí)行resync命令。
除上述之外,還存在使用本發(fā)明的一個(gè)或多個(gè)方面的自動(dòng)化管理接口的各種廣域群集事件。以下描述各種的這些事件。這些事件是相對于所使用的操作的類型描述的,因?yàn)閷τ诓煌愋偷牟僮鳎幚硎遣煌?。一類操作是同步操?NOFCPY),其中在應(yīng)用站點(diǎn)主卷上執(zhí)行的更新被同步投影于恢復(fù)站點(diǎn)的輔助卷上。因?yàn)檫@是同步操作,只有在兩個(gè)副本中都確保了寫更新之后,才會(huì)認(rèn)為寫對于應(yīng)用已完成。將描述的用于同步卷集的一類事件是群集故障轉(zhuǎn)移事件。參考圖10描述了與此事件相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。
在正常生產(chǎn)模式中,即步驟1000,同步卷集處于PPRC全雙工模式,并且在eRCMF中應(yīng)該提供自動(dòng)站點(diǎn)拆分(即,指明將在某些情況下調(diào)用freeze命令)。eRCMF管理的PPRC關(guān)系處于默認(rèn)的InSync狀態(tài)。在步驟1002,應(yīng)用輸入/輸出(I/O)在服務(wù)器A上進(jìn)行。進(jìn)一步地,在步驟1004,eRCMF管理的PPRC從主卷Hi鏡像到Hj。在圖11中的標(biāo)號(hào)1100圖示說明了此鏡像。
回到圖10,如果在詢問1106處存在生產(chǎn)站點(diǎn)故障,則在步驟1108,eRCMF調(diào)用凍結(jié)過程。例如,主eRCMF服務(wù)器和備份eRCMF服務(wù)器均調(diào)用凍結(jié)處理。此后,在步驟1010,自動(dòng)化管理接口執(zhí)行各種操作。這些操作包括例如使備份站點(diǎn)上的eRCMF服務(wù)器成為活動(dòng)eRCMF服務(wù)器;發(fā)出提供自動(dòng)站點(diǎn)拆分以及接著的freeze命令;以及向eRCMF發(fā)出恢復(fù)站點(diǎn)(主站點(diǎn)名)命令。這使得eRCMF查詢卷集以確定狀態(tài),并恢復(fù)在主站點(diǎn)上具有生產(chǎn)的卷集。這將數(shù)據(jù)和/或其他部件安置于系統(tǒng)能夠啟動(dòng)和恢復(fù)的狀態(tài)。
返回詢問1006,如果不存在生產(chǎn)站點(diǎn)故障,則在查詢1012處做出關(guān)于服務(wù)器A是否發(fā)生故障的進(jìn)一步確定。在此示例中,服務(wù)器A是執(zhí)行應(yīng)用I/O的主服務(wù)器。如果服務(wù)器A沒有發(fā)生故障,則處理在正常生產(chǎn)模式中繼續(xù)。然而,如果服務(wù)器A已發(fā)生故障,則在步驟1014,由服務(wù)器A擁有的資源轉(zhuǎn)移到服務(wù)器B。在此示例中,不需要eRCMF操作,因?yàn)橘Y源沒有跨站點(diǎn)移動(dòng)。應(yīng)用I/O進(jìn)行到服務(wù)器B上。
如果在詢問1016處服務(wù)器B沒有發(fā)生故障,則在步驟1017,處理在服務(wù)器B上繼續(xù),除非采取了其他某種操作將所述處理從服務(wù)器B移開。然而,如果做出了服務(wù)器B已發(fā)生故障的確定,則在詢問1018處,做出關(guān)于服務(wù)器A是否已重新加入群集的進(jìn)一步確定。如果服務(wù)器A已重新加入群集,則在步驟1020,由服務(wù)器B擁有的資源轉(zhuǎn)移回到服務(wù)器A。再次地,不需要eRCMF操作,因?yàn)橘Y源沒有跨站點(diǎn)移動(dòng)。接著處理在正常生產(chǎn)模式中繼續(xù)。
然而,如果服務(wù)器B已發(fā)生故障,并且服務(wù)器A沒有重新加入群集,則在步驟1022,由群集啟動(dòng)資源到備份站點(diǎn)的站點(diǎn)轉(zhuǎn)移。例如,在步驟1024,群集發(fā)送控制到AMI,而AMI啟動(dòng)eRCMF操作以代表群集來交換站點(diǎn)。這涉及例如查詢生產(chǎn)站點(diǎn)上的一個(gè)或多個(gè)資源組中的卷集的狀態(tài),并接著基于卷集的狀態(tài)提交適當(dāng)?shù)拿钜詫⒕砑仓糜贗nSync狀態(tài),以及提交swap命令到eRCMF以交換卷集鏡像方向。
響應(yīng)于接收到swap命令,在步驟1026,eRCMF交換生產(chǎn)站點(diǎn)和備份站點(diǎn)。接著在步驟1028,群集在服務(wù)器C或D上重新啟動(dòng)到Hj的I/O。在步驟1030,eRCMF管理的PPRC現(xiàn)在從主卷Hj到主機(jī)Hi進(jìn)行鏡像。在圖11中的1102描述了鏡像方向的圖示說明。這完成了群集故障轉(zhuǎn)移事件的處理。
用于同步卷集的另一廣域群集事件是群集故障回復(fù)事件。在此事件中,資源組退回生產(chǎn)站點(diǎn)上的服務(wù)器。參考圖12描述了與此處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。在步驟1200,群集啟動(dòng)資源組退回事件。這包括例如停止一個(gè)或多個(gè)應(yīng)用的I/O,卸下文件系統(tǒng),使卷組變?yōu)槊摍C(jī),以及通知AMI交換站點(diǎn)。響應(yīng)于接收此指示,在步驟1202,AMI啟動(dòng)交換過程。這包括例如檢查在一個(gè)或多個(gè)資源組中的卷集的狀態(tài),并向eRCMF提交返回初始站點(diǎn)的resync命令。
當(dāng)eRCMF接收到resync命令時(shí),在步驟1204,eRCMF執(zhí)行換回過程。換回過程包括執(zhí)行resync操作,其中建立邏輯路徑并執(zhí)行PPRC完全復(fù)制。在執(zhí)行此操作之后,AMI再次接收控制并查詢狀態(tài)。一旦狀態(tài)指示為InSync,則在步驟1206,AMI提交swap命令到eRCMF,以將卷集的生產(chǎn)站點(diǎn)交換回初始站點(diǎn)。
響應(yīng)于接收到swap命令,在步驟1208,eRCMF執(zhí)行交換。這包括例如終止PPRC對,并在初始的方向上以無復(fù)制重新建立PPRC對。
此后,當(dāng)再次為如AMI所確定的InSync時(shí),在步驟1210,群集在初始站點(diǎn)上重新啟動(dòng)應(yīng)用I/O。這完成故障回復(fù)處理。
另一類操作是PPRC擴(kuò)展距離類型的操作。在PPRC擴(kuò)展距離(XDALLFCPY)的操作中,當(dāng)應(yīng)用運(yùn)行時(shí),PPRC以非同步方式將主卷的更新鏡像到輔助卷上。這樣,當(dāng)在PPRC擴(kuò)展距離中時(shí),應(yīng)用的寫操作沒有典型的象同步那樣的開銷。盡管在此操作中可能產(chǎn)生各種事件。一種這樣的事件是用于非同步卷集的群集故障轉(zhuǎn)移事件。
參考圖13描述了與處理用于非同步卷集的群集故障轉(zhuǎn)移事件相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。在正常生產(chǎn)模式中,即步驟1300,擴(kuò)展距離卷集處于PPRC XD模式,并且將在eRCMF中提供自動(dòng)站點(diǎn)拆分。eRCMF管理的PPRC關(guān)系處于默認(rèn)的XD-Mode狀態(tài)。在步驟1302,應(yīng)用I/O在服務(wù)器A上進(jìn)行,并且在步驟1304,eRCMF管理的PPRC從主卷Hi鏡像到Sj。圖14中的標(biāo)號(hào)1400描述了此鏡像的圖示說明。
回到圖13,如果在詢問1306處生產(chǎn)站點(diǎn)不存在災(zāi)難,則處理以正常生產(chǎn)模式繼續(xù),即步驟1300。另一方面,如果在詢問1306處生產(chǎn)站點(diǎn)存在災(zāi)難,則群集啟動(dòng)站點(diǎn)故障轉(zhuǎn)移。例如,在步驟1307,eRCMF通過中止PPRC卷對而拆分站點(diǎn)。處于XD-Mode中的卷集轉(zhuǎn)到XD-ModeOutOfSync。進(jìn)一步地,在步驟1308,由服務(wù)器A擁有的資源轉(zhuǎn)移到備份站點(diǎn)的服務(wù)器(例如服務(wù)器C或服務(wù)器D)。資源轉(zhuǎn)移到其中的特定服務(wù)器取決于用戶定義的群集策略。
此后,eRCMF執(zhí)行站點(diǎn)災(zāi)難(凍結(jié))處理,其中,例如,在步驟1310,群集停頓(quiesce)應(yīng)用(數(shù)據(jù)庫)以避免在主站點(diǎn)上的更新。
隨后,在詢問1314處,做出關(guān)于在Hj上可用的PIT(時(shí)間點(diǎn))副本是否一致的確定。如果在Hj上的PIT副本是一致的,則AMI通過執(zhí)行以下操作而調(diào)整eRCMF狀態(tài)機(jī)(步驟1316)1.執(zhí)行forestate<RecoverySiteActive>命令,以迫使VolumeSet的狀態(tài)為RecoverySiteActive2.執(zhí)行forcesite<site2>命令,以將該VolumeSet的生產(chǎn)站點(diǎn)改變?yōu)樵搨浞菡军c(diǎn)進(jìn)一步地,在詢問1318處,做出關(guān)于是否將使用Sj上的可疑數(shù)據(jù)的確定。如果將使用可疑數(shù)據(jù),則在步驟1320,AMI啟動(dòng)卷集的恢復(fù)(例如,恢復(fù)VolumeSet)。eRCMF通過將可疑數(shù)據(jù)從Sj閃速復(fù)制到Hj而恢復(fù)數(shù)據(jù)。在Hj上的任何現(xiàn)有PIT將被蓋寫。接著在步驟1322,由群集基于群集故障轉(zhuǎn)移策略在備份站點(diǎn)的服務(wù)器上重新啟動(dòng)應(yīng)用。
回到詢問1318處,如果將不使用Sj上的數(shù)據(jù),則AMI建議群集不使資源組聯(lián)機(jī),并從而不在恢復(fù)站點(diǎn)重新啟動(dòng)應(yīng)用。
返回詢問1314,另一方面,如果PIT副本是不一致的,則出于潛在數(shù)據(jù)損失的原因而提供一錯(cuò)誤。這完成了群集故障轉(zhuǎn)移事件的處理。
將對非同步卷集處理的另一事件是故障回復(fù)事件處理。參考圖15描述了與此處理相關(guān)聯(lián)的邏輯的一個(gè)實(shí)施例。當(dāng)資源組要退回生產(chǎn)站點(diǎn)時(shí),在步驟1500,群集啟動(dòng)資源組退回事件。這包括例如停止應(yīng)用I/O,卸下文件系統(tǒng),使卷組變?yōu)槊摍C(jī),以及向AMI提供控制。響應(yīng)于接收到控制,在步驟1502,AMI啟動(dòng)eRCMF站點(diǎn)交換處理。作為此交換處理的一部分,AMI確定卷集的狀態(tài),并調(diào)用eRCMF以在步驟1504執(zhí)行換回過程。
在換回過程中,AMI再次接收到控制,確定狀態(tài),并且在步驟1506啟動(dòng)回到初始站點(diǎn)的eRCMF同步。響應(yīng)于從AMI接收到此命令,在步驟1508,eRCMF建立邏輯路徑并執(zhí)行Hj到Si的PPRC完全復(fù)制。此后,在步驟1510,AMI發(fā)出另一查詢,并啟動(dòng)使生產(chǎn)回到初始站點(diǎn)的交換。特別地,當(dāng)再次處于InSync狀態(tài)時(shí),AMI啟動(dòng)使生產(chǎn)回到初始站點(diǎn)的eRCMF交換。當(dāng)eRCMF接收到此命令時(shí),在步驟1512,發(fā)生交換。在一個(gè)示例中,這包括終止PPRC對,如果路徑為單向則使其反轉(zhuǎn);執(zhí)行從Hj到Sj的閃速復(fù)制1402(圖14)以及從Si到Hi的閃速復(fù)制1404;在初始方向(Hi到Sj)上以無復(fù)制重新建立PPRC對;以及一旦再次處于InSync則由eRCMF將生產(chǎn)交換回初始站點(diǎn)。
此后,在步驟1514,AMI啟動(dòng)async VolumeSet,以使擴(kuò)展的卷集回到默認(rèn)模式,并響應(yīng)于此啟動(dòng)操作,在步驟1516,eRCMF執(zhí)行async。隨后,在步驟1518,群集在初始站點(diǎn)上重新啟動(dòng)應(yīng)用I/O。這完成了用于非同步卷集的退回事件處理。
根據(jù)本發(fā)明的一個(gè)方面,為了便能群集軟件和AMI之間的通信,修改群集軟件以使用AMI API。例如,在軟件棧的盤處理部分中包括了clgetERCMFdisks、clfreleaseERCMFdisks和cljoinERCMFcleanup API。這允許群集軟件調(diào)用AMI。
此外,為了使能自動(dòng)化管理接口和eRCMF軟件之間的通信,提供了被稱為clrunERCMFcmd的包裝。此包裝通過eRCMF命令行接口提交調(diào)用到eRCMF服務(wù)器。clrunERCMFcmd采取eRCMF操作并調(diào)用eRCMF客戶端執(zhí)行。在一個(gè)示例中,它是用于eRCMF RepMgrCommand CLI的包裝。
以下是clrunERCMFcmd的語法的一個(gè)示例clrunERCMFcmd<命令><VolumeSet名>
<命令>可以是以下任一個(gè),包括了由eRCMF狀態(tài)機(jī)基于狀態(tài)響應(yīng)于命令而采取的操作。
check 檢查卷集的一致性。
display 顯示卷集的當(dāng)前狀況和卷。
getstate顯示卷集的狀態(tài)。
sync重新同步站點(diǎn),F(xiàn)orce Sync模式PPRC。
resync 重新同步站點(diǎn)。
recover 在備份站點(diǎn)進(jìn)行恢復(fù)。
swap交換生產(chǎn)站點(diǎn)和備份站點(diǎn)。
split 拆分站點(diǎn)。
flash 用于利用FlashCopy的實(shí)用程序。
forceswap 為群集故障交換站點(diǎn)。
<VolumnSet名>針對其執(zhí)行命令的VolumeSet的名。
此包裝便利了AMI對將由eRCMF執(zhí)行的命令的調(diào)用。例如,作為一個(gè)示例,AMI執(zhí)行clrunERCMFcmd,其執(zhí)行以下操作它調(diào)用clgetERCMFpcminfo(在下面描述)以確定活動(dòng)的eRCMF服務(wù)器;它建立與執(zhí)行活動(dòng)的eRCMF服務(wù)器的PCM的TCP/IP連接;它利用存儲(chǔ)于操作系統(tǒng)的注冊表中的eRCMF信息而確定eRCMFRepMgrCommand CLI所需的參數(shù)。作為一個(gè)示例,使用提供給clrunERCMFcmd的卷集名來從注冊表獲得參數(shù);它使用這些參數(shù)和與clrunERCMFcmd一起提供的命令來運(yùn)行eRCMF RepMgrCommand。
以下是RepMgrCommand的語法的一個(gè)示例RepMgrCommand<參數(shù)>Command;-?,-h[elp] 打印此消息。
-host host name指定eRCMF運(yùn)行于其上的主機(jī)的名,默認(rèn)為本地主機(jī)。
-p[assword]pswd指定對于用戶id的口令。
-port port number 指定所連接的端口。
-s[ession]VSname 指定將針對其執(zhí)行該命令的VolumeSet。
-u[ser]userid 指定執(zhí)行該命令的用戶id。
-v on|off|text 設(shè)定開啟詳細(xì)顯示(顯示所返回值而沒有文本轉(zhuǎn)換),off(什么都不顯示。)text (將消息轉(zhuǎn)換為文本),默認(rèn)為開啟。Command是將被執(zhí)行的eRCMF命令。
如上所述,自動(dòng)化管理接口使用被稱為clgetERCMFpcminfo的實(shí)用程序查詢eRCMF生產(chǎn)力中心機(jī)器,以確定eRCMF守護(hù)程序是否為活動(dòng)的。不向此實(shí)用程序提供參數(shù)。此實(shí)用程序查詢主PCM的IP地址。如果此IP地址存在,則它執(zhí)行eRCMF查詢命令。成功運(yùn)行該查詢命令會(huì)返回主PCM的IP地址作為活動(dòng)IP地址。如果命令失敗,則它查詢輔助PCM的IP地址。如果此運(yùn)行成功,它返回輔助PCM的IP地址作為活動(dòng)IP地址;否則,它失敗。接著可由需要該活動(dòng)IP地址的任何邏輯使用該IP地址。
在執(zhí)行了eRCMF操作之后,AMI也可使用clwait4ERMCFstate以等待所期望的eRCMF狀態(tài)到達(dá)。以下是與clwait4ERMCFstate相關(guān)聯(lián)的語法的一個(gè)示例clwait4ERMCFstate<VolumnSet><狀態(tài)>
其中所述狀態(tài)是在執(zhí)行eRCMF命令之后所期望的eRCMFVolumeSet狀態(tài)。
此實(shí)用程序查詢卷集的狀態(tài),將所獲得的狀態(tài)與作為所期望狀態(tài)并作為命令的參數(shù)提供的狀態(tài)進(jìn)行比較,并且如果兩狀態(tài)相等,則它返回指示成功的代碼。如果兩狀態(tài)不等,則它繼續(xù)查詢直到例如兩狀態(tài)相等為止。
在本發(fā)明的另一方面,在具有由紐約Armonk的國際商業(yè)機(jī)器公司提供的HACMP群集軟件的AIX環(huán)境中使用自動(dòng)化管理接口。在這樣的環(huán)境中,使用群集驗(yàn)證和同步。例如,使用群集驗(yàn)證工具clverifyERCMFconfig來處理對群集配置中的eRCMF配置信息的驗(yàn)證。通過發(fā)出clverifyERCMFconfig(不提供參數(shù)),驗(yàn)證在此處被稱為AIXODM注冊表的AIX注冊表中存儲(chǔ)的eRCMF定義。
除了上述之外,也提供一組命令,用于將用于AIX環(huán)境中的群集管理的eRCMF配置定義到ODM中。以下是這些命令的示例
1.claddercmf將eRCMF管理的PPRC復(fù)制資源添加到HACMP,并在例如HACMPercmf的數(shù)據(jù)集中存儲(chǔ)數(shù)據(jù)。以下是claddercmf的語法的一個(gè)示例claddercmf-n<name>-t<volume_type>-p<production_site>
name 卷集名(最多20個(gè)字符)。
volume_type模式NOFCPY(兩站點(diǎn)上均沒有閃速復(fù)制)或ALLFCPY(兩站點(diǎn)均具有已定義的閃速復(fù)制卷)、XDNOFCPY、XDALLFCPY。
production_site此卷集的初始生產(chǎn)站點(diǎn)。
2.clchercmf改變eRCMF PPRC復(fù)制資源的定義。以下是clchercmf的語法的一個(gè)示例clchercmf-n<name>-N<new_name>-t<volume_type>-p<production_site>
name 卷集名(最多20個(gè)字符)。
new_name 卷集的新ercmf復(fù)制資源名(最多20個(gè)字符)。
volume_type 卷集模式NOFCPY(兩站點(diǎn)上均沒有閃速復(fù)制)或ALLFCPY(兩站點(diǎn)均具有已定義的閃速復(fù)制卷)、XDNOFCPY、XDALLFCPY。
production_site 此卷集的初始生產(chǎn)站點(diǎn)。
3.cllsercmf列出被稱為HACMPercmf的數(shù)據(jù)集中已定義的eRCMF管理的卷集。以下是cllsercmf的語法的一個(gè)示例cllsercmf[-n<name>][-c][-a][-h]如果未指定VolumeSet名,則將列出所定義的所有eRCMF管理的PPRC VolumeSet的名。如果提供了-a標(biāo)志,則顯示關(guān)于所有VolumeSet的完整信息。如果通過-n標(biāo)志提供了特定的VolumeSet,則將僅顯示關(guān)于此VolumeSet的信息。-c標(biāo)志以冒號(hào)分隔的格式顯示信息。-h標(biāo)志關(guān)掉對列的頭部的顯示。
4.clrmercmf從HACMP配置中刪除已定義的eRCMF管理的卷集。以下是clrmercmf的語法的一個(gè)示例clrmercmf-n<name>
name 提供將被刪除的資源的名。
5.cldefercmfglobals定義eRCMF全局屬性到HACMF。以下是cldefercmfglobals的語法的一個(gè)示例cldefercmfglobals-a<split_policy>-l<link_type>-f<pri_css>-s<sec_ess>-u<ercmf_user>-p<ercmf_password>
split_policy 當(dāng)發(fā)生站點(diǎn)拆分時(shí)由eRCMF采取的操作。
link_type 指明PPRC是以單向還是以雙向進(jìn)行鏡像。它具有如下值One WayPPRC僅以單向進(jìn)行鏡像。
Two WayPPRC以雙向進(jìn)行鏡像。
pri_css 輸入主復(fù)制服務(wù)服務(wù)器的名。
see_css 輸入輔助復(fù)制服務(wù)服務(wù)器的名。
ercmf_user在eRCMF服務(wù)器上輸入用戶認(rèn)證id。此id應(yīng)該已被配置于eRCMF復(fù)制服務(wù)服務(wù)器上。
ercmf_password在eRCMF服務(wù)器上輸入用戶認(rèn)證口令。此口令應(yīng)該已被配置于eRCMF復(fù)制服務(wù)服務(wù)器上。
6.clchercmfglobals對定義到HACMP的eRCMF全局屬性做出改變。以下是clchercmfglobals的語法的一個(gè)示例。clchercmfglobals-a<split_policy>-l<link_type>-f<pri_css>-s<sec_css>-u<ercmf_user>-p<ercmf_password>
能夠修改以上任何條目。
7.cllsercmfglobals列出到HACMF的eRCMF全局屬性。
不提供參數(shù)。
8.clrmercmfglobals從HACMF配置中刪除ercmf全局屬性定義。
不提供參數(shù)。
上述命令便利了在AIX環(huán)境中定義和維護(hù)eRCMF配置。它們被用于在操作系統(tǒng)注冊表中存儲(chǔ)eRCMF信息以便由AMI訪問。
以上詳細(xì)描述的是用于自動(dòng)確定數(shù)據(jù)狀態(tài)和自動(dòng)將數(shù)據(jù)安置于適當(dāng)狀態(tài)的能力。在一個(gè)特定示例中,此能力使能控制eRCMF以支持層7的災(zāi)難恢復(fù)解決方案。例如,當(dāng)出現(xiàn)整個(gè)站點(diǎn)故障時(shí),在遠(yuǎn)程站點(diǎn)的備份服務(wù)器上重新啟動(dòng)應(yīng)用。在重新啟動(dòng)該應(yīng)用(在本語境中所述應(yīng)用包括最終用戶與其交互的應(yīng)用,以及從屬數(shù)據(jù)庫軟件或其他中間件)之前,由群集軟件調(diào)用本發(fā)明的一個(gè)或多個(gè)方面的自動(dòng)化管理接口,以確保備份盤卷處于適當(dāng)狀態(tài)中以允許應(yīng)用訪問。AMI使用eRCMF識(shí)別主站點(diǎn)的ESS的狀態(tài),并指引備份站點(diǎn)的PPRC實(shí)例跟蹤改變(如果主ESS不可用)或者將所述改變反映回去(如果主ESS可用)。在后一種情況下,主站點(diǎn)和輔助站點(diǎn)的角色實(shí)際上已被顛倒。如果在后來的某時(shí)間主站點(diǎn)返回服務(wù),并在主站點(diǎn)上重新啟動(dòng)應(yīng)用,則再次調(diào)用AMI。如果如上所述顛倒了主站點(diǎn)和輔助站點(diǎn)的角色,則恢復(fù)它們。如果主ESS曾經(jīng)不可用,則當(dāng)它成為可用時(shí)向它寫入增量改變。在任一情況下,一旦AMI將控制返回到群集管理軟件,則數(shù)據(jù)的最新副本可用于應(yīng)用訪問??赏ㄟ^使用AMI使這種恢復(fù)過程完全自動(dòng)化-無需手動(dòng)干預(yù)或延遲,如當(dāng)使用eRCMF時(shí)的通常情況那樣。
可在包括各種群集和非群集環(huán)境的許多環(huán)境中包括本發(fā)明的能力。在一個(gè)實(shí)施例中,AMI被包括于假定存在例如IBM eRCMF、用于AIX的IBM HACMP或Veritas Cluster Server軟件解決方案的高可用性的群集軟件的環(huán)境中。期望群集軟件提供通過允許在一主機(jī)服務(wù)器上運(yùn)行的工作負(fù)荷被另一主機(jī)服務(wù)器接管而使應(yīng)用服務(wù)的快速恢復(fù)自動(dòng)化的方法。在單站點(diǎn)群集環(huán)境中,共享卷組的群集節(jié)點(diǎn)具有到相同的一組盤的物理連接。在廣域環(huán)境中,群集節(jié)點(diǎn)訪問相同的共享卷組,但每一站點(diǎn)上的節(jié)點(diǎn)從不同的物理卷訪問它們。使用數(shù)據(jù)復(fù)制技術(shù)來維護(hù)在兩個(gè)分離的盤子系統(tǒng)上的、應(yīng)用數(shù)據(jù)的分離的相同本地副本。當(dāng)應(yīng)用在主服務(wù)器上為活動(dòng)的時(shí),對應(yīng)用數(shù)據(jù)的更新被自動(dòng)復(fù)制到備份盤子系統(tǒng)。當(dāng)出現(xiàn)故障以及將應(yīng)用移動(dòng)到備份服務(wù)器時(shí),它使用駐留于備份盤系統(tǒng)上的鏡像數(shù)據(jù)繼續(xù)其操作。如果主服務(wù)器返回服務(wù),則可反轉(zhuǎn)數(shù)據(jù)復(fù)制的方向,從而在以當(dāng)主服務(wù)器不可用時(shí)可能發(fā)生的任何數(shù)據(jù)改變來將主服務(wù)器保持為最新的初始重新同步過程之后,將備份盤上的數(shù)據(jù)更新復(fù)制到主站點(diǎn)的盤。
有利地,能夠?qū)⒈景l(fā)明的一個(gè)或多個(gè)方面的自動(dòng)化管理接口集成到群集解決方案中,并將其設(shè)計(jì)和開發(fā)為用于自動(dòng)化用于盤卷(例如,ESS盤卷)的復(fù)制處理的管理的對eRCMF的控制;協(xié)調(diào)群集工作負(fù)荷管理與存儲(chǔ)遠(yuǎn)程鏡像事件;使本地群集能夠容易地被擴(kuò)展到地理上分離的位置;使群集軟件能夠基于企業(yè)存儲(chǔ)服務(wù)器或者其他存儲(chǔ)子系統(tǒng)支持層7的災(zāi)難恢復(fù)解決方案;自動(dòng)化站點(diǎn)內(nèi)的節(jié)點(diǎn)之間的PPRC保護(hù)的卷對的故障轉(zhuǎn)移;管理eRCMF以便自動(dòng)化站點(diǎn)之間的PPRC保護(hù)的卷對的故障轉(zhuǎn)移;自動(dòng)化附連于站點(diǎn)內(nèi)和站點(diǎn)之間的PPRC保護(hù)的盤卷對的服務(wù)器節(jié)點(diǎn)的故障轉(zhuǎn)移/重新集成;提供一組命令行接口,用于當(dāng)此接口用于例如AIX的特定環(huán)境中時(shí)定義eRCMF信息到例如AIX ODM注冊表的注冊表中;當(dāng)與例如IBM AIX HACMP群集軟件一起使用時(shí)提供群集驗(yàn)證和同步;消除對于管理eRCMF的用戶參與的需要;以及將eRCMF的直接管理與群集管理相分離。
盡管此處描述了各種實(shí)施例和示例,但許多其他實(shí)施例和示例也可以包含和/或使用本發(fā)明的一個(gè)或多個(gè)方面。例如,可在非群集環(huán)境中使用本發(fā)明的一個(gè)或多個(gè)方面。在進(jìn)一步的示例中,此處描述的群集環(huán)境僅是一個(gè)示例。其配置和/或其配置的部件可以不同??膳c其他的群集環(huán)境一起使用本發(fā)明的一個(gè)或多個(gè)方面。此外,ESS、eRCMF和PPRC僅僅是示例??梢允褂闷渌愃萍夹g(shù)。此外,根據(jù)本發(fā)明的一個(gè)或多個(gè)方面,可確定或管理不是盤或卷集上的數(shù)據(jù)的數(shù)據(jù)的狀態(tài)。存在許多其他變化,并且所述變化均包括在本發(fā)明的范圍之中。
可以軟件、固件、硬件或它們的某種組合的形式實(shí)現(xiàn)本發(fā)明的一個(gè)或多個(gè)方面的能力。
本發(fā)明的一個(gè)或多個(gè)方面可被包括在具有例如計(jì)算機(jī)可用介質(zhì)的制造物品(例如,一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品)中。所述介質(zhì)在其中具有例如計(jì)算機(jī)可讀程序代碼手段或邏輯(例如,指令、代碼、命令等等),以提供和便利本發(fā)明的能力??蓪⑺鲋圃煳锲钒ㄗ鳛橛?jì)算機(jī)系統(tǒng)的一部分或單獨(dú)出售。
此外,可提供可由機(jī)器讀的至少一個(gè)程序存儲(chǔ)設(shè)備,其包含可由該機(jī)器執(zhí)行以執(zhí)行本發(fā)明的能力的至少一個(gè)指令程序。
此處描述的流程圖僅是示例??纱嬖趯Υ颂幟枋龅倪@些圖或步驟(或操作)的許多變化而無需背離本發(fā)明的精神。例如,可以用不同的順序執(zhí)行這些步驟,或者可以添加、刪除或修改步驟。所有這些變化均被認(rèn)為是所要求的發(fā)明的一部分。
盡管此處已詳細(xì)描寫和描述了優(yōu)選的實(shí)施例,但對于相關(guān)領(lǐng)域的技術(shù)人員來說,很顯然能夠不背離本發(fā)明的精神而做出各種修改、添加、替換等等,并因此認(rèn)為以上所述情況均處于如以下權(quán)利要求所定義的本發(fā)明的范圍之內(nèi)。
權(quán)利要求
1.一種管理通信環(huán)境的數(shù)據(jù)的方法,所述方法包括自動(dòng)獲得所述通信環(huán)境的至少一部分?jǐn)?shù)據(jù)的狀態(tài);以及至少基于所述至少一部分?jǐn)?shù)據(jù)的所獲得狀態(tài)而自動(dòng)將所述至少一部分?jǐn)?shù)據(jù)安置于適當(dāng)狀態(tài)。
2.權(quán)利要求1的方法,其中所述至少一部分?jǐn)?shù)據(jù)包括復(fù)制數(shù)據(jù)。
3.權(quán)利要求2的方法,其中在復(fù)制存儲(chǔ)介質(zhì)上維護(hù)所述復(fù)制數(shù)據(jù)。
4.權(quán)利要求1的方法,其中所述自動(dòng)獲得步驟和至少一部分所述自動(dòng)安置步驟由所述通信環(huán)境的實(shí)體執(zhí)行,該實(shí)體連接于所述通信環(huán)境的資源管理器以及所述通信環(huán)境的復(fù)制管理工具。
5.權(quán)利要求4的方法,其中所述實(shí)體和所述資源管理器運(yùn)行于所述通信環(huán)境的服務(wù)器之上,并且所述復(fù)制管理工具運(yùn)行于該通信環(huán)境的另一服務(wù)器之上,并且其中所述服務(wù)器和所述另一服務(wù)器經(jīng)由存儲(chǔ)子系統(tǒng)相互連接,所述存儲(chǔ)子系統(tǒng)維護(hù)所述至少一部分?jǐn)?shù)據(jù)。
6.權(quán)利要求5的方法,其中所述實(shí)體從所述資源管理器獲得控制。
7.權(quán)利要求1的方法,其中所述自動(dòng)獲得步驟包括查詢所述通信環(huán)境的工具以獲得所述至少一部分?jǐn)?shù)據(jù)的狀態(tài)。
8.權(quán)利要求7的方法,其中所述工具包括復(fù)制管理工具。
9.權(quán)利要求1的方法,其中所述自動(dòng)安置步驟包括調(diào)用將被執(zhí)行以將所述至少一部分?jǐn)?shù)據(jù)安置于所述適當(dāng)狀態(tài)的至少一個(gè)命令,所述調(diào)用步驟至少部分基于所獲得的狀態(tài);以及確保所述至少一部分?jǐn)?shù)據(jù)已被安置于所述適當(dāng)狀態(tài)。
10.權(quán)利要求9的方法,其中所述確保步驟包括響應(yīng)于所述至少一個(gè)命令中的一個(gè)或多個(gè)命令的執(zhí)行,查詢狀態(tài)以確定響應(yīng)于執(zhí)行的狀態(tài);以及如果所述查詢步驟指示所查詢的狀態(tài)不是所述適當(dāng)狀態(tài),則執(zhí)行一個(gè)或多個(gè)命令。
11.權(quán)利要求9的方法,還包括使用狀態(tài)機(jī)來執(zhí)行所述至少一個(gè)命令。
12.權(quán)利要求9的方法,其中所述調(diào)用和確保步驟由所述通信環(huán)境的實(shí)體執(zhí)行,并且所述至少一個(gè)命令將由與所述實(shí)體連接的復(fù)制管理工具執(zhí)行。
13.一種管理通信環(huán)境的復(fù)制存儲(chǔ)介質(zhì)的方法,所述方法包括由通信環(huán)境的實(shí)體獲得控制,以確定所述復(fù)制存儲(chǔ)介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)介質(zhì)是否處于適當(dāng)狀態(tài),以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的至少一個(gè)。由所述實(shí)體自動(dòng)獲得所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài);以及自動(dòng)將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài),以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的所述至少一個(gè),所述自動(dòng)安置步驟至少使用所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的所獲得的狀態(tài)。
14.權(quán)利要求13的方法,其中所述自動(dòng)獲得狀態(tài)的步驟包括在另一實(shí)體中查詢所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài)。
15.權(quán)利要求14的方法,其中所述自動(dòng)安置步驟包括調(diào)用將被執(zhí)行以將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài)的至少一個(gè)命令,所述調(diào)用步驟至少部分基于所獲得的狀態(tài);以及確保所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)已被安置于所述適當(dāng)狀態(tài)。
16.權(quán)利要求15的方法,其中所述確保步驟包括響應(yīng)于所述至少一個(gè)命令中的一個(gè)或多個(gè)命令的執(zhí)行,查詢狀態(tài)以確定響應(yīng)于執(zhí)行的狀態(tài);以及如果所述查詢步驟指示所查詢的狀態(tài)不是所述適當(dāng)狀態(tài),則執(zhí)行一個(gè)或多個(gè)命令。
17.權(quán)利要求16的方法,其中所述實(shí)體包括接口,而所述另一實(shí)體包括與所述接口連接的復(fù)制管理工具。
18.權(quán)利要求17的方法,其中所述接口從與該接口連接的資源管理器獲得控制。
19.權(quán)利要求18的方法,其中所述接口響應(yīng)于所述通信環(huán)境中的故障而獲得控制。
20.權(quán)利要求19的方法,其中所述通信環(huán)境包括廣域群集環(huán)境。
21.一種管理通信環(huán)境的數(shù)據(jù)的系統(tǒng),所述系統(tǒng)包括用于自動(dòng)獲得所述通信環(huán)境的至少一部分?jǐn)?shù)據(jù)的狀態(tài)的裝置;以及用于至少基于所述至少一部分?jǐn)?shù)據(jù)的所獲得狀態(tài)而自動(dòng)將所述至少一部分?jǐn)?shù)據(jù)安置于適當(dāng)狀態(tài)的裝置。
22.權(quán)利要求21的系統(tǒng),其中所述用于自動(dòng)獲得的裝置和至少一部分所述用于自動(dòng)安置的裝置包括所述通信環(huán)境的實(shí)體,該實(shí)體連接于所述通信環(huán)境的資源管理器以及所述通信環(huán)境的復(fù)制管理工具。
23.權(quán)利要求22的系統(tǒng),其中所述實(shí)體和資源管理器運(yùn)行于所述通信環(huán)境的服務(wù)器之上,而所述復(fù)制管理工具運(yùn)行于所述通信環(huán)境的另一服務(wù)器之上,并且其中所述服務(wù)器和所述另一服務(wù)器經(jīng)由存儲(chǔ)子系統(tǒng)相互連接,所述存儲(chǔ)子系統(tǒng)維護(hù)所述至少一部分?jǐn)?shù)據(jù)。
24.權(quán)利要求23的系統(tǒng),其中所述實(shí)體從所述資源管理器獲得控制。
25.權(quán)利要求21的系統(tǒng),其中所述用于自動(dòng)獲得的裝置包括用于查詢所述通信環(huán)境的工具以獲得所述至少一部分?jǐn)?shù)據(jù)的狀態(tài)的裝置。
26.權(quán)利要求21的系統(tǒng),其中所述用于自動(dòng)安置的裝置包括用于調(diào)用將被執(zhí)行以將所述至少一部分?jǐn)?shù)據(jù)安置于所述適當(dāng)狀態(tài)的至少一個(gè)命令的裝置,所述調(diào)用操作至少部分基于所獲得的狀態(tài);以及用于確保所述至少一部分?jǐn)?shù)據(jù)已被安置于所述適當(dāng)狀態(tài)的裝置。
27.權(quán)利要求26的系統(tǒng),其中所述用于確保的裝置包括用于響應(yīng)于所述至少一個(gè)命令中的一個(gè)或多個(gè)命令的執(zhí)行而查詢狀態(tài)以確定響應(yīng)于執(zhí)行的狀態(tài)的裝置;以及用于如果所述查詢指示所查詢的狀態(tài)不是所述適當(dāng)狀態(tài)則執(zhí)行一個(gè)或多個(gè)命令的裝置。
28.權(quán)利要求26的系統(tǒng),還包括執(zhí)行所述至少一個(gè)命令的狀態(tài)機(jī)。
29.權(quán)利要求26的系統(tǒng),其中所述用于調(diào)用的裝置和所述用于確保的裝置包括所述通信環(huán)境的實(shí)體,并且所述至少一個(gè)命令將由與所述實(shí)體連接的復(fù)制管理工具執(zhí)行。
30.一種管理通信環(huán)境的復(fù)制存儲(chǔ)介質(zhì)的系統(tǒng),所述系統(tǒng)包括用于由所述通信環(huán)境的實(shí)體獲得控制以確定所述復(fù)制存儲(chǔ)介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)介質(zhì)是否處于適當(dāng)狀態(tài)以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的至少一個(gè)的裝置;用于由所述實(shí)體自動(dòng)獲得所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài)的裝置;以及用于自動(dòng)將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài)以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的所述至少一個(gè)的裝置,所述用于自動(dòng)安置的裝置至少使用所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的所獲得的狀態(tài)。
31.權(quán)利要求30的系統(tǒng),其中所述用于自動(dòng)獲得狀態(tài)的裝置包括用于在另一實(shí)體中查詢所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài)的裝置。
32.權(quán)利要求31的系統(tǒng),其中所述用于自動(dòng)安置的裝置包括用于調(diào)用將被執(zhí)行以將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài)的至少一個(gè)命令的裝置,所述調(diào)用操作至少部分基于所獲得的狀態(tài);以及用于確保所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)已被安置于所述適當(dāng)狀態(tài)的裝置。
33.權(quán)利要求32的系統(tǒng),其中所述用于確保的裝置包括用于響應(yīng)于所述至少一個(gè)命令中的一個(gè)或多個(gè)命令的執(zhí)行而查詢狀態(tài)以確定響應(yīng)于執(zhí)行的狀態(tài)的裝置;以及用于如果所述查詢指示所查詢的狀態(tài)不是所述適當(dāng)狀態(tài)則執(zhí)行一個(gè)或多個(gè)命令的裝置。
34.權(quán)利要求33的系統(tǒng),其中所述實(shí)體包括接口,而所述另一實(shí)體包括與所述接口連接的復(fù)制管理工具。
35.權(quán)利要求34的系統(tǒng),其中所述接口從與該接口連接的資源管理器獲得控制。
36.權(quán)利要求35的系統(tǒng),其中所述接口響應(yīng)于所述通信環(huán)境中的故障而獲得控制。
37.權(quán)利要求36的系統(tǒng),其中所述通信環(huán)境包括廣域群集環(huán)境。
38.一種管理通信環(huán)境的數(shù)據(jù)的系統(tǒng),所述系統(tǒng)包括用于獲得所述通信環(huán)境的至少一部分?jǐn)?shù)據(jù)的狀態(tài)的實(shí)體;以及用于至少基于所述至少一部分?jǐn)?shù)據(jù)的所獲得狀態(tài)而自動(dòng)將所述至少一部分?jǐn)?shù)據(jù)安置于適當(dāng)狀態(tài)的實(shí)體。
39.一種制造物品,包括具有管理通信環(huán)境中的數(shù)據(jù)的計(jì)算機(jī)可讀程序代碼邏輯的至少一種計(jì)算機(jī)可用介質(zhì),所述計(jì)算機(jī)可讀程序代碼邏輯包括用于自動(dòng)獲得所述通信環(huán)境的至少一部分?jǐn)?shù)據(jù)的狀態(tài)的獲得邏輯;以及所述至少基于所述至少一部分?jǐn)?shù)據(jù)的所獲得狀態(tài)而自動(dòng)將所述至少一部分?jǐn)?shù)據(jù)安置于適當(dāng)狀態(tài)的安置邏輯。
40.權(quán)利要求39的制造物品,其中所述獲得邏輯和至少一部分所述安置邏輯由所述通信環(huán)境的實(shí)體執(zhí)行,該實(shí)體連接于所述通信環(huán)境的資源管理器以及所述通信環(huán)境的復(fù)制管理工具。
41.權(quán)利要求40的制造物品,其中所述實(shí)體和所述資源管理器運(yùn)行于所述通信環(huán)境的服務(wù)器之上,而所述復(fù)制管理工具運(yùn)行于所述通信環(huán)境的另一服務(wù)器之上,并且其中所述服務(wù)器和所述另一服務(wù)器經(jīng)由存儲(chǔ)子系統(tǒng)相互連接,所述存儲(chǔ)子系統(tǒng)維護(hù)所述至少一部分?jǐn)?shù)據(jù)。
42.權(quán)利要求41的制造物品,其中所述實(shí)體從所述資源管理器獲得控制。
43.權(quán)利要求39的制造物品,其中所述獲得邏輯包括用于查詢所述通信環(huán)境的工具以獲得所述至少一部分?jǐn)?shù)據(jù)的狀態(tài)的查詢邏輯。
44.權(quán)利要求39的制造物品,其中所述安置邏輯包括用于調(diào)用將被執(zhí)行以將所述至少一部分?jǐn)?shù)據(jù)安置于所述適當(dāng)狀態(tài)的至少一個(gè)命令的調(diào)用邏輯,所述調(diào)用操作至少部分基于所獲得的狀態(tài);以及用于確保所述至少一部分?jǐn)?shù)據(jù)已被安置于所述適當(dāng)狀態(tài)的確保邏輯。
45.權(quán)利要求44的制造物品,其中所述確保邏輯包括用于響應(yīng)于所述至少一個(gè)命令中的一個(gè)或多個(gè)命令的執(zhí)行而查詢狀態(tài)以確定響應(yīng)于執(zhí)行的狀態(tài)的查詢邏輯;以及用于如果所述查詢指示所查詢的狀態(tài)不是所述適當(dāng)狀態(tài)則執(zhí)行一個(gè)或多個(gè)命令的執(zhí)行邏輯。
46.權(quán)利要求44的制造物品,還包括用于使用狀態(tài)機(jī)來執(zhí)行所述至少一個(gè)命令的使用邏輯。
47.權(quán)利要求44的制造物品,其中所述調(diào)用邏輯和所述確保邏輯由所述通信環(huán)境的實(shí)體執(zhí)行,并且所述至少一個(gè)命令將由與所述實(shí)體連接的復(fù)制管理工具執(zhí)行。
48.一種制造物品,包括具有管理通信環(huán)境的復(fù)制存儲(chǔ)介質(zhì)的計(jì)算機(jī)可讀程序代碼邏輯的至少一種計(jì)算機(jī)可用介質(zhì),所述計(jì)算機(jī)可讀程序代碼邏輯包括用于由所述通信環(huán)境的實(shí)體獲得控制以確定所述復(fù)制存儲(chǔ)介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)介質(zhì)是否處于適當(dāng)狀態(tài)以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的至少一個(gè)的獲得邏輯;用于由所述實(shí)體自動(dòng)獲得所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài)的獲得邏輯;以及用于自動(dòng)將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài)以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的所述至少一個(gè)的安置邏輯,所述安置邏輯至少使用所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的所獲得的狀態(tài)。
49.權(quán)利要求48的制造物品,其中所述獲得邏輯包括用于在另一實(shí)體中查詢所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài)的查詢邏輯。
50.權(quán)利要求49的制造物品,其中所述安置邏輯包括用于調(diào)用將被執(zhí)行以將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài)的至少一個(gè)命令的調(diào)用邏輯,所述調(diào)用操作至少部分基于所獲得的狀態(tài);以及用于確保所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)已被安置于所述適當(dāng)狀態(tài)的確保邏輯。
51.權(quán)利要求50的制造物品,其中所述確保邏輯包括用于響應(yīng)于所述至少一個(gè)命令中的一個(gè)或多個(gè)命令的執(zhí)行而查詢狀態(tài)以確定響應(yīng)于執(zhí)行的狀態(tài)的查詢邏輯;以及用于如果所述查詢指示所查詢的狀態(tài)不是所述適當(dāng)狀態(tài)則執(zhí)行一個(gè)或多個(gè)命令的執(zhí)行邏輯。
52.權(quán)利要求51的制造物品,其中所述實(shí)體包括接口,而所述另一實(shí)體包括與所述接口連接的復(fù)制管理工具。
53.權(quán)利要求52的制造物品,其中所述接口從與該接口連接的資源管理器獲得控制。
54.權(quán)利要求53的制造物品,其中所述接口響應(yīng)于所述通信環(huán)境中的故障而獲得控制。
55.權(quán)利要求54的制造物品,其中所述通信環(huán)境包括廣域群集環(huán)境。
56.一種管理通信環(huán)境的復(fù)制存儲(chǔ)介質(zhì)的系統(tǒng),所述系統(tǒng)包括所述通信環(huán)境中的用于獲得控制以確定所述復(fù)制存儲(chǔ)介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)介質(zhì)是否處于適當(dāng)狀態(tài)以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的至少一個(gè)的實(shí)體;用于自動(dòng)獲得所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的狀態(tài)的實(shí)體;以及用于自動(dòng)將所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)安置于所述適當(dāng)狀態(tài)以允許應(yīng)用訪問和數(shù)據(jù)復(fù)制中的所述至少一個(gè)的實(shí)體,該實(shí)體至少使用所述一個(gè)或多個(gè)存儲(chǔ)介質(zhì)的所獲得的狀態(tài)。
全文摘要
自動(dòng)管理通信環(huán)境的數(shù)據(jù)的狀態(tài)。經(jīng)由一種工具提供了所述自動(dòng)管理,所述工具自動(dòng)獲得數(shù)據(jù)的當(dāng)前狀態(tài)并使用該信息將數(shù)據(jù)安置于適當(dāng)狀態(tài),以便處理所選擇的事件。例如,在復(fù)制存儲(chǔ)介質(zhì)上維護(hù)數(shù)據(jù)。
文檔編號(hào)G06F11/20GK1779650SQ20051011498
公開日2006年5月31日 申請日期2005年11月16日 優(yōu)先權(quán)日2004年11月24日
發(fā)明者P·A·布阿, T·V·韋弗 申請人:國際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
嫩江县| 土默特左旗| 牟定县| 玛多县| 大埔县| 包头市| 和田市| 建湖县| 石家庄市| 宁阳县| 通城县| 安塞县| 班戈县| 盐源县| 湘潭县| 汉寿县| 新龙县| 丰顺县| 洮南市| 新竹市| 五莲县| 平罗县| 神农架林区| 安多县| 运城市| 揭东县| 游戏| 昌乐县| 保山市| 三都| 柏乡县| 隆尧县| 福贡县| 修文县| 怀来县| 靖安县| 锦州市| 绿春县| 姜堰市| 城市| 东兰县|