欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于使存儲管理便于進(jìn)行的設(shè)備、系統(tǒng)和方法

文檔序號:6656816閱讀:391來源:國知局
專利名稱:用于使存儲管理便于進(jìn)行的設(shè)備、系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)存儲計算機(jī)系統(tǒng)。具體來說,本發(fā)明涉及用于通過組織存儲資源來使存儲管理便于進(jìn)行的設(shè)備、系統(tǒng)和方法。
背景技術(shù)
計算機(jī)和信息技術(shù)在其能力和復(fù)雜性方面繼續(xù)前進(jìn)并發(fā)展。特別是,數(shù)據(jù)存儲系統(tǒng)繼續(xù)發(fā)展,以滿足對物理數(shù)據(jù)存儲系統(tǒng)的可靠性、可用性和可服務(wù)性(serviceability)及其硬件、軟件和各個其它組件的日益增長的需要。數(shù)據(jù)存儲系統(tǒng)常常處理任務(wù)關(guān)鍵數(shù)據(jù)。因此,依照24/7調(diào)度,期望數(shù)據(jù)存儲系統(tǒng)保持是聯(lián)機(jī)且可用的。此外,在不顯著地?fù)p害處理來自主機(jī)的數(shù)據(jù)輸入/輸出(I/O)的可靠性和可用性的情況下,期望數(shù)據(jù)存儲系統(tǒng)處理功率和服務(wù)停機(jī)、硬件和軟件故障、甚至是例程系統(tǒng)維護(hù)。
圖1圖示了常規(guī)的數(shù)據(jù)存儲系統(tǒng)100。系統(tǒng)100包括通過諸如存儲區(qū)域網(wǎng)絡(luò)(Storage Area Network,SAN)106連接到存儲子系統(tǒng)104的一個或多個主機(jī)102。主機(jī)102向存儲子系統(tǒng)104傳送數(shù)據(jù)I/O。主機(jī)102在本領(lǐng)域中是公知的,并且包括被配置為向存儲子系統(tǒng)104傳送數(shù)據(jù)I/O的任何計算機(jī)系統(tǒng)。
適于與本發(fā)明一起使用的存儲子系統(tǒng)104的一個例子是可從紐約Armonk的國際商業(yè)機(jī)器公司(IBM)處獲得的IBM EnterpriseStorage Server(企業(yè)存儲服務(wù)器)。為了提供可靠性、可用性和冗余性,存儲子系統(tǒng)104包括經(jīng)由獨立信道連接到SAN106的多個主機(jī)適配器(未示出)。主機(jī)適配器108可以支持諸如光纖信道(FibreChannel)之類的高速通信協(xié)議。當(dāng)然,可以使用其它各種主機(jī)適配器108來支持其它協(xié)議,其中包括但不限于因特網(wǎng)小型計算機(jī)接口(Internet Small Computer Interface,iSCSI)、基于IP的光纖信道(Fibre Channel over IP,F(xiàn)CIP)、企業(yè)系統(tǒng)連接(Enterprise SystemsConnection,ESCON)、InfiniBand和以太網(wǎng)。存儲子系統(tǒng)104使用一個或多個海量存儲設(shè)備108來存儲并獲取數(shù)據(jù),所述海量存儲設(shè)備108諸如為但不局限于直接存取存儲設(shè)備、磁帶存儲設(shè)備等。
隨著硬件成本下降,由于包括冗余的硬件和硬件子系統(tǒng),所以數(shù)據(jù)存儲系統(tǒng)100變得更加復(fù)雜了。通常,硬件組件對故障很敏感。因此,存儲子系統(tǒng)104可以包括一個或多個處理器、電子存儲器設(shè)備、主機(jī)適配器等。
典型情況下,為了最高產(chǎn)地使用冗余硬件,特別地在多個邏輯節(jié)點110之間分配或共享硬件。邏輯節(jié)點110表示分配存儲子系統(tǒng)104的計算硬件資源,使得每個邏輯節(jié)點110能夠獨立于另一邏輯節(jié)點110來執(zhí)行操作系統(tǒng)(OS)112。另外,每個邏輯節(jié)點110操作獨立的應(yīng)用集114。邏輯節(jié)點110在主機(jī)102看來是獨立的物理計算系統(tǒng)。
也被稱為管理程序(Hypervisor,PHYP)116的協(xié)調(diào)模塊116在兩個或更多個定義的邏輯節(jié)點110之間協(xié)調(diào)對專用和共享的硬件資源的使用??梢栽趯S锰幚砥魃嫌霉碳韺崿F(xiàn)PHYP 116。典型情況下,邏輯節(jié)點110共享存儲器。PHYP 116可以確保邏輯節(jié)點110不會訪問存儲器的不適當(dāng)扇區(qū)。
把存儲子系統(tǒng)104分離為多個邏輯節(jié)點110提供了更高的可靠性。如果一個邏輯節(jié)點110由于軟件或硬件問題而導(dǎo)致崩潰/失敗,一個或多個其它邏輯節(jié)點110可以用來繼續(xù)或重新開始正由崩潰的邏輯節(jié)點110所執(zhí)行的任務(wù)。
管理、控制和服務(wù)于多個邏輯節(jié)點110是一個挑戰(zhàn)。任何管理、控制、維護(hù)、監(jiān)視、故障檢修或服務(wù)操作都應(yīng)當(dāng)與恒定的I/O處理相協(xié)調(diào),從而使得不會損害存儲子系統(tǒng)104的24/7可用性。典型情況下,管理控制臺118經(jīng)由與I/O信道分離的控制通信(這里被稱作“帶外(out-of-band)通信”)來管理存儲子系統(tǒng)104。
存儲子系統(tǒng)104可以包括諸如以太網(wǎng)卡之類的網(wǎng)絡(luò)適配器,以用于進(jìn)行帶外通信。管理控制臺118可以包括獨立的計算機(jī)系統(tǒng),諸如用于執(zhí)行獨立的OS和管理應(yīng)用集的工作站。管理控制臺118允許管理員與PHYP116對接以便開始(創(chuàng)建)、停止并配置邏輯節(jié)點110。
不幸地是,管理控制臺118的管理能力受到嚴(yán)重限制。特別地,邏輯節(jié)點110是完全獨立且無關(guān)的。因此,為了管理多個邏輯節(jié)點110,例如,為了設(shè)置存儲空間定額,管理員必須單獨地登錄到每個節(jié)點110,做出修改并繼而注銷。此處理過程非常乏味,并且隨著操作中所涉及的邏輯節(jié)點110的數(shù)目增加,可能會導(dǎo)致錯誤。當(dāng)前,無法同時管理兩個或多個邏輯節(jié)點110。順序地一次一個地管理節(jié)點110。
由于可靠性和可用性優(yōu)點的原因,希望關(guān)聯(lián)兩個或多個邏輯節(jié)點110以使得每個節(jié)點110主動地鏡像其它節(jié)點的所有操作。依照這種方式,如果一個節(jié)點110出故障/崩潰了,那么其它節(jié)點可以接管并繼續(xù)服務(wù)于I/O請求。還希望從單個管理節(jié)點根據(jù)需要將相關(guān)聯(lián)的邏輯節(jié)點110一起作為單個實體來管理或分別地對其進(jìn)行管理。然而,當(dāng)前在邏輯節(jié)點110之間不存在關(guān)系,并且無法一次同時管理一個以上的邏輯節(jié)點110。
在存儲子系統(tǒng)104中加劇了管理和服務(wù)改變的重復(fù)性質(zhì),其中節(jié)點110可以是高度統(tǒng)一的,并且可能在配置方面只是如小到名稱這樣的屬性不同。存儲設(shè)備還可能希望向一個或多個通常配置的節(jié)點110應(yīng)用策略、屬性或約束的各種組合。當(dāng)前,為了這樣做,管理員必須分別跟蹤節(jié)點110之間的異同之處,以便可以實現(xiàn)并維護(hù)策略。實現(xiàn)并維護(hù)應(yīng)用于節(jié)點110的子集上的任何策略是困難且費時的。
即便節(jié)點110是相關(guān)的,管理員也必須分別地登錄到每個節(jié)點110,并且可能必須物理地移動到不同的管理控制臺118的機(jī)器以便完成管理操作。相關(guān)的節(jié)點110可以提供冗余的I/O操作。但是,管理相關(guān)的節(jié)點110是一種挑戰(zhàn)且是費時的。每個均必須被分別管理的節(jié)點110的大量數(shù)目限制了管理員的效率。

發(fā)明內(nèi)容
因此,本發(fā)明提供了一種用于通過單個管理模塊使對邏輯節(jié)點的管理便于進(jìn)行的設(shè)備、系統(tǒng)和方法,其克服了本領(lǐng)域中的許多或所有上述缺點。
依照本發(fā)明的一個方面的設(shè)備包括配置模塊、信息模塊和尋址(address)模塊。配置模塊配置第一邏輯實體和第二邏輯實體以便在對等域中相互交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信。
對等域可以包括相關(guān)的兩個或多個邏輯實體,使得由一個實體所執(zhí)行的I/O和管理操作由其它實體自動地執(zhí)行。兩個或多個邏輯實體可以是相關(guān)的,以便提供專用于每個邏輯實體的硬件的冗余。邏輯實體可以對應(yīng)于邏輯節(jié)點、虛擬機(jī)、邏輯分區(qū)(Logical Partitions,LPAR)、存儲設(shè)備映像(Storage Facility Image,SFI)、存儲應(yīng)用映像(Storage Application Image,SAI)等。對等域中的邏輯實體均可以包括基本上相等的權(quán)限以彼此監(jiān)視并管理。在一個實施例中,對等域中的第一邏輯實體和第二邏輯實體被配置為,響應(yīng)于邏輯實體之一出現(xiàn)故障,而接管另一邏輯實體的操作。操作的邏輯實體可以記錄自從出故障的邏輯實體脫機(jī)以來的改變的集合,并且響應(yīng)于出故障的邏輯實體變?yōu)槁?lián)機(jī),而恢復(fù)該改變集合。
信息模塊向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源。本地資源被揭示,使得第一邏輯實體和第二邏輯實體的本地資源可用作來自管理節(jié)點的管理命令的目標(biāo)資源。信息模塊可以向管理節(jié)點廣播第一邏輯實體的本地資源和第二邏輯實體的本地資源。作為選擇,信息模塊可以把第一邏輯實體的本地資源和第二邏輯實體的本地資源登記在可由管理節(jié)點存取的中央儲存庫中。
管理節(jié)點可以與第一邏輯實體和第二邏輯實體處于管理關(guān)系。管理關(guān)系定義了允許管理節(jié)點管理并監(jiān)視邏輯實體的管理域。然而,邏輯實體不能管理或監(jiān)視管理節(jié)點。
在某些實施例中,管理域包括彼此在對等域中的第一組邏輯實體和彼此在對等域中的第二組邏輯實體。每個邏輯實體的本地資源可以被揭示給管理節(jié)點,以便用作管理命令的目標(biāo)資源。此外,每組的邏輯實體可能不能與其它組的邏輯實體進(jìn)行通信。管理命令可以是以兩組邏輯實體、一組邏輯實體、或任一組或兩組中的個別邏輯實體為目標(biāo)的。
在另一實施例中,管理域包括被配置為與在管理對等域中的管理節(jié)點相交互的第二管理節(jié)點。管理對等域允許任一管理節(jié)點響應(yīng)于管理節(jié)點之一的故障而監(jiān)視并接管管理操作。
在某些實施例中,同步模塊響應(yīng)于由第一邏輯實體或第二邏輯實體對本地資源所進(jìn)行的修改,使用于表示第一邏輯實體和第二邏輯實體的本地資源的資源定義同步。
第一邏輯實體和第二邏輯實體可以包括通用硬件平臺的邏輯分區(qū)(LPAR)。LPAR可以被配置為使得每個LPAR在通用硬件平臺的獨立中央電子設(shè)備復(fù)合體(Central Electronics Complex,CEC)上執(zhí)行。第一邏輯實體和第二邏輯實體可以定義可獨立管理的存儲設(shè)備映像(SFI)。管理模塊可以被配置為向管理域內(nèi)的多個SFI發(fā)送管理命令。作為選擇,或者另外地,在可獨立管理的存儲應(yīng)用映像(SAI)中定義了邏輯實體對。
還給出了本發(fā)明的信號承載介質(zhì),其包括被配置為執(zhí)行用于通過組織存儲資源而使存儲管理便于進(jìn)行的操作的計算機(jī)可讀指令。在一個實施例中,所述操作包括用于配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信的操作。另一操作向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源,使得所述第一邏輯實體和第二邏輯實體的本地資源可用作來自管理節(jié)點的管理命令的目標(biāo)資源。最后,執(zhí)行一個操作,以便有選擇地從管理節(jié)點向第一邏輯實體的本地資源和第二邏輯實體的本地資源尋址(address)管理命令。
本發(fā)明還包括被設(shè)置為下述系統(tǒng)、方法和設(shè)備的實施例,該系統(tǒng)、方法和設(shè)備包括與上面針對所述設(shè)備和方法所描述的組件和步驟基本上相同的功能。
因此,在本發(fā)明的實施例中,提供了一種用于使存儲管理便于進(jìn)行的設(shè)備、系統(tǒng)和方法。有利的是,這種設(shè)備、系統(tǒng)和方法根據(jù)需要自動地把兩個或多個相關(guān)節(jié)點作為單個實體管理或分別地加以管理。類似地,所述設(shè)備、系統(tǒng)和方法支持對相關(guān)節(jié)點的組的管理,使得在所述組之間維護(hù)了安全性,但是可以容易地實現(xiàn)并維護(hù)不同的策略。此外,所述設(shè)備、系統(tǒng)和方法支持對多個硬件平臺、諸如例如存儲子系統(tǒng)的管理,以用于節(jié)點的不同分組(grouping)。所述設(shè)備、系統(tǒng)和方法允許冗余管理節(jié)點主動地管理多個相關(guān)和/或無關(guān)的節(jié)點。


現(xiàn)在參考附圖僅以舉例形式來描述本發(fā)明的實施例,其中圖1是圖示了用于管理多個無關(guān)的、獨立的邏輯節(jié)點的常規(guī)系統(tǒng)的框圖;圖2是依照本發(fā)明的實施例圖示了通過組織存儲資源來使存儲管理便于進(jìn)行的實體組織結(jié)構(gòu)的邏輯框圖;圖3是依照本發(fā)明的任何實施例圖示了通過組織存儲資源來使存儲管理便于進(jìn)行的設(shè)備的一個實施例的邏輯框圖;圖4是圖示了適于實現(xiàn)本發(fā)明的某些實施例的代表性系統(tǒng)的示意性框圖;圖5是依照本發(fā)明的一個實施例圖示了利用在圖4中所圖示的系統(tǒng)組件的實體的邏輯表示的示意性框圖;和圖6是圖示了通過組織存儲資源來使存儲管理便于進(jìn)行的方法的示意性流程圖。
具體實施例方式
通過參考附圖最好地理解了本發(fā)明所圖示的實施例,其中在所有附圖中同樣的部分由同樣的數(shù)字來表示。以下的描述僅僅意在舉例,并且簡單地圖示了與這里所要求的本發(fā)明一致的設(shè)備、系統(tǒng)和處理過程的某些選擇的實施例。
圖2圖示了用于使存儲管理便于進(jìn)行的管理結(jié)構(gòu)200的邏輯表示。在某些實施例中,第一邏輯實體202和第二邏輯實體204共享對等關(guān)系206。如這里所用,“邏輯實體”指的是用于表示共享一個關(guān)系的兩個或多個事物(邏輯或物理的)的任何邏輯構(gòu)造。據(jù)此,在整個說明書中所使用的邏輯實體可以包括邏輯節(jié)點、虛擬機(jī)、邏輯分區(qū)(LPAR)、存儲設(shè)備映像(SFI,下面將更詳細(xì)地論述)、存儲應(yīng)用映像(SAI,下面將更詳細(xì)地論述)等。
由對等關(guān)系206相關(guān)的一對邏輯實體202、204是有益的。在一個實施例中,邏輯實體202、204可以充當(dāng)用于定義可由主機(jī)102訪問的多個邏輯存儲設(shè)備的存儲實體。換句話說,存儲設(shè)備上的存儲空間可以被分配給每個邏輯設(shè)備,并且被配置為給出邏輯存儲設(shè)備以供主機(jī)102使用。
優(yōu)選地,第一邏輯實體202被配置為基本上與第二邏輯實體204相同。每個邏輯實體202、204可以主動地服務(wù)于I/O通信,從而使得如果一個實體202、204出故障,那么另一實體202、204可以繼續(xù)服務(wù)于進(jìn)一步的I/O通信而沒有任何中斷。邏輯實體202、204互相充當(dāng)彼此的“熱(hot)”(主動)備份。當(dāng)一個邏輯實體202、204出故障時,在使用一個邏輯實體202、204或另一個邏輯實體的過程中不存在延遲。因為希望一個邏輯實體202、204的故障不為主機(jī)102所注意,所以利用相同的大小、參數(shù)及其它屬性來配置所述邏輯實體202、204。
還應(yīng)當(dāng)使用相同的命令來管理類似配置的邏輯實體202、204,使得實體202、204在其配置方面保持與另一實體202、204同步。本發(fā)明把邏輯實體202、204組織到對等域208中。對等域208表示一個或多個實體202、204的邏輯分組。每個邏輯實體202、204與另一邏輯實體202、204通信,使得在一個實體202、204上所執(zhí)行的操作也在另一實體202、204上自動執(zhí)行。還可以定義第二對等域210,其具有處于對等關(guān)系206中的第三邏輯實體212和第四邏輯實體214。優(yōu)選的是,阻止第一對等域208中的成員與第二對等域210中的成員進(jìn)行通信或?qū)ζ溥M(jìn)行監(jiān)視或控制,并且反之亦然?,F(xiàn)在描述對等域208和邏輯實體202、204。本領(lǐng)域技術(shù)人員將會認(rèn)識到,還可以容易地向?qū)Φ扔?10和第三邏輯實體212以及第四邏輯實體214應(yīng)用該描述。
優(yōu)選的是,對等域208在對等域208的邏輯實體202、204之間提供了直接通信(沒有中介物)。當(dāng)然,對等域208可以包括兩個以上的邏輯實體202、204。
典型情況下,把兩個或多個邏輯實體202、204置于對等域208中,提供了可從邏輯實體202、204中所獲得的資源的較高可用性。如果一個實體202、204出故障,那么另一實體繼續(xù)操作。然而,如上所述,如果要求管理節(jié)點216分別連接到并管理每個邏輯實體202、204,那么邏輯實體202、204的常規(guī)管理可能遭到挑戰(zhàn)。
在本發(fā)明中,對等域208的分組確保了由一個實體202、204所執(zhí)行的I/O操作和管理操作被鏡像到另一實體202、204上。在某些實施例中,對等域208的第一成員(即,將要聯(lián)機(jī)的第一個成員)變?yōu)閷Φ润w領(lǐng)導(dǎo)者(peer leader)。管理節(jié)點216可以向?qū)Φ扔?08的任何成員或直接向?qū)Φ润w領(lǐng)導(dǎo)者傳送(218)管理命令。如果實體202、204不是對等體領(lǐng)導(dǎo)者,那么所述命令可以被轉(zhuǎn)發(fā)到所述對等體領(lǐng)導(dǎo)者。對等體領(lǐng)導(dǎo)者解釋所述命令。如果命令可適用于對等域208的所有成員,那么在所有成員之間鏡像該命令。依照這種方式,單個管理命令可以被發(fā)布到對等域208的單個實體202、204,并且對所述對等域208的所有成員進(jìn)行改變。同樣地,第二對等域210依照類似方式操作。
把實體202、204組織到對等域208中,允許管理員分組同樣的實體,諸如,互相充當(dāng)彼此的冗余自動備份的存儲實體。雖然管理節(jié)點216可以根據(jù)需要與每個實體202、204進(jìn)行通信(218),但是管理節(jié)點216還可以向作為單個實體208的對等域208傳達(dá)單個管理命令。依照這種方式,降低了管理負(fù)擔(dān)/開銷。
管理節(jié)點216是用于監(jiān)視并管理一個或多個實體202、204、212、214的操作的物理或邏輯計算設(shè)備。優(yōu)選的是,管理節(jié)點216使用帶外通信信道218,以便與實體202、204、212、214相交互并監(jiān)視它們。與管理節(jié)點216進(jìn)行通信(218)的實體202、204、212、214定義了管理域220。
管理域220包括至少一個管理節(jié)點216和至少一個管理實體。管理節(jié)點216向所管理的實體202、204、212、214發(fā)送諸如狀態(tài)查詢或配置改變之類的管理命令。
某些監(jiān)視和管理命令要求管理節(jié)點216可以訪問為每個202、204所定義的資源222、223。如這里所用,“資源”指的是被物理地分配給邏輯實體202、204、212、214的或在邏輯上為所述邏輯實體202、204、212、214定義的固件、軟件、硬件和邏輯實體。資源的例子包括物理和邏輯存儲設(shè)備、存儲設(shè)備控制器、I/O設(shè)備、I/O設(shè)備驅(qū)動器、存儲器設(shè)備、存儲器控制器、處理器、對稱多處理器控制器、固件設(shè)備、固件可執(zhí)行代碼、操作系統(tǒng)、應(yīng)用、進(jìn)程、線程、操作系統(tǒng)服務(wù)等。
對等域208中的每個實體202、204的資源222、223可以是相同的。作為選擇,不考慮域208、210,在所有實體202、204、212、214上的資源222、223可以是相同或不同的。如關(guān)于圖3更詳細(xì)地解釋得那樣,本發(fā)明揭示管理域220中的所有實體202、204、212、214的資源222、223。管理節(jié)點216使用關(guān)于資源222、223的信息,以便使管理命令以特定的資源222、223(也被稱為是目標(biāo)資源222、223)為目標(biāo)。典型情況下,目標(biāo)資源是管理命令的對象,并且可以包括整個實體202。
圖2圖示了在管理域220中將實體202、204、212、214設(shè)置在對等域208、210中的一種潛在方案。當(dāng)然,其它配置也是可以的。例如,第三邏輯實體212可以位于對等域208內(nèi),并且與第一實體202和第二實體204具有直接對等關(guān)系206。把實體分組到管理域220內(nèi)的對等域208、210中,允許將成對的同構(gòu)邏輯實體202、204作為單個實體(對等域208)來管理。此外,組織結(jié)構(gòu)可以依照包括實體202、204的目的、功能或地理位置在內(nèi)的各種因素來分組所述實體202、204。對等域208、210可以為了安全和保密目的而分離,但是仍然通過單個管理節(jié)點216來管理。
在一個實施例中,第一實體202和第二實體204包括第一對等域208的處于對等關(guān)系206中的第一組邏輯實體202、204。第三實體212和第四實體214包括第二對等域210的處于對等關(guān)系206中的第二組邏輯實體212、214。優(yōu)選的是,在第一組邏輯實體202、204和第二組邏輯實體212、214之間不存在通信。第一組邏輯實體202、204、第二組邏輯實體212、214和管理節(jié)點216一起形成管理域220。第一組邏輯實體202、204和第二組邏輯實體212、214的資源222、223被揭示給管理節(jié)點216,使得所述管理節(jié)點216可以發(fā)送以任何一組的資源222、223為目標(biāo)的管理命令。
依照這種方式,第一組邏輯實體202、204和第二組邏輯實體212、214彼此相分離。然而,管理節(jié)點216可以向作為單個實體的兩組之一、向單個實體、或一起向兩個組發(fā)送管理命令。這種組織結(jié)構(gòu)提供了靈活性,特別是因為一組兩個或多個實體可以作為單個單元來管理。如上所述,被發(fā)送到一組中的對等體領(lǐng)導(dǎo)者的管理命令根據(jù)需要被適當(dāng)?shù)芈酚傻皆摻M的相關(guān)實體(一個或多個)。管理節(jié)點216可以向第一組、第二組或者第一組和第二組兩者發(fā)送命令。
例如,如果在第二組邏輯實體212、214上要求服務(wù)過程,那么管理節(jié)點216可以發(fā)布單個停頓存儲命令,用于在邏輯實體212、214兩者上自動地處理排隊的I/O并且停止任何進(jìn)一步的I/O通信處理。然后服務(wù)過程可以包括諸如使邏輯實體212、214脫機(jī)(再次使用單個命令)之類的附加管理命令等。
如上所述,系統(tǒng)的物理和邏輯實體的冗余向計算系統(tǒng)提供了高的可用性、可靠性和可服務(wù)性。一個冗余實體是不可用的,而另一個冗余實體是可用的,使得冗余資源222、223的用戶在不通知不可用實體的情況下繼續(xù)使用所述資源222、223。
在一個實施例中,冗余管理節(jié)點224鏡像管理節(jié)點216的操作。管理節(jié)點216、224可以在對等關(guān)系206中相交互。管理節(jié)點216、224一起形成管理對等域226,用于允許任一管理節(jié)點216、224響應(yīng)于管理節(jié)點216、224之一的故障而監(jiān)視并接管對多個對等域208、210的管理操作。管理對等域226只包括管理節(jié)點216、224,并且允許所述管理節(jié)點216、224根據(jù)需要互相監(jiān)視并實現(xiàn)接管過程。依照這種方式,可以提供冗余管理,以便進(jìn)一步提高系統(tǒng)的可靠性、可服務(wù)性和可用性。
圖3圖示了用于使存儲管理便于進(jìn)行的設(shè)備300的一個實施例。設(shè)備300使計算機(jī)系統(tǒng)管理員能夠向在通用域306中所定義的、無組織的多個實體302和管理節(jié)點304應(yīng)用組織和次序。根據(jù)組織的需要和物理硬件,通用域306中的實體數(shù)目可以介于二和幾百之間。在沒有某種形式的組織結(jié)構(gòu)的情況下,把實體302或其資源222、223標(biāo)識為管理命令的目的地或目標(biāo),可能是困難的。如果組織希望實現(xiàn)冗余的同構(gòu)實體,那么問題會進(jìn)一步復(fù)雜化。本發(fā)明的設(shè)備300實現(xiàn)了一定的次序和組織結(jié)構(gòu),并且實施了關(guān)于中間實體通信的某些規(guī)則以使得管理便于進(jìn)行和自動化,特別是對于那些旨在彼此互相鏡像并備份的實體來說更是如此。因此,只需要較少的、被尋址到不同邏輯實體的重復(fù)的管理命令。另外,次序和組織使得便于區(qū)分兩個或多個類似配置的實體302。
設(shè)備300可以包括配置模塊308、信息模塊310和同步模塊312。配置模塊308配置第一邏輯實體314以便與對等域208中的第二邏輯實體316相交互。第一邏輯實體314與第二邏輯實體316直接通信,并且鏡像所述第二邏輯實體316的操作。換句話說,第一邏輯實體314和第二邏輯實體316具有對等關(guān)系206。
在一個實施例的對等域208中,邏輯實體314、316具有基本上相等的權(quán)限來互相監(jiān)視并管理。這允許任一邏輯實體314、316充當(dāng)對等體領(lǐng)導(dǎo)者并且向另一邏輯實體314傳遞管理命令。因此,如同在本發(fā)明的不同系統(tǒng)和子系統(tǒng)中所提供的冗余一樣,不存在單個故障點。優(yōu)選的是,每個組件具有冗余的相應(yīng)組件,從而提供了高可用性。
在一個實施例中,邏輯實體314、316包括計算機(jī)系統(tǒng)的邏輯分區(qū)(LPAR),每個LPAR被分配有獨立的計算機(jī)硬件集合(處理器、存儲器、I/O、存儲設(shè)備)。對等域208可以包括一對LPAR,以便提供冗余。
在一個實施例中,配置模塊308定義了用于控制邏輯實體314、316的通信和鏡像從而使得每個邏輯實體只鏡像并管理對等域208中的另一邏輯實體314、316的操作的邏輯。例如,一個邏輯實體314、316可以被指定為對等體領(lǐng)導(dǎo)者。被發(fā)送到對等域208的所有管理命令通過對等體領(lǐng)導(dǎo)者來路由。管理命令和I/O通信可以根據(jù)需要被鏡像到每個邏輯實體314、316上。
信息模塊310向管理節(jié)點318揭示第一邏輯實體314和第二邏輯實體316的本地資源222。在一個實施例中,信息模塊310使用每個管理節(jié)點318的預(yù)定通信地址來向管理域220中的每個管理節(jié)點318廣播用于定義本地資源222的信息。信息模塊310可以廣播用于定義本地資源222的初始信息以及對用于定義所述本地資源222的信息所進(jìn)行的修改。每個管理節(jié)點318可以接收所述信息,并且把該信息與適當(dāng)實體314、316的標(biāo)識符相關(guān)聯(lián)。
作為選擇,信息模塊310把用于邏輯實體314、316的本地資源222登記(320)到中央儲存庫322中。信息模塊310可以登記初始信息。然后,根據(jù)需要,邏輯實體可以登記對所述信息的更新。目標(biāo)資源222的中央儲存庫322可以包括數(shù)據(jù)庫,其中把目標(biāo)資源222與適當(dāng)?shù)倪壿媽嶓w314、316相關(guān)聯(lián)。作為選擇,中央儲存庫322可以包括文件或任何其它數(shù)據(jù)結(jié)構(gòu),其用于把本地資源222與邏輯實體314、316相關(guān)聯(lián),并且可由管理節(jié)點318訪問。
在某些實施例中,管理節(jié)點318使用面向?qū)ο蟮募軜?gòu)來管理邏輯實體314、316,其中管理節(jié)點和邏輯實體由包括屬性和方法的軟件對象來表示。所述屬性存儲關(guān)于對象的數(shù)據(jù)。所述方法包括被特別地配置為實現(xiàn)所述對象的某一功能的邏輯。面向?qū)ο蟮募軜?gòu)可以控制對關(guān)于資源222的信息的訪問。例如,如果管理節(jié)點318是經(jīng)授權(quán)的管理器,那么用于表示實體314、316的軟件對象可以允許訪問方法報告關(guān)于本地資源的信息。換句話說,可以使通??赡軙?gòu)成對象的私有屬性和/或方法的信息可用于用來表示管理節(jié)點318的軟件對象。
同步模塊312使用于表示本地資源222的資源定義同步。資源定義可以被存儲在中央儲存庫322中。在由邏輯實體314、316或直接由管理節(jié)點318對本地資源222進(jìn)行修改之后,同步模塊312使資源定義同步。修改可以包括資源222的配置改變、更新的版本信息、定義或刪除等。在某些實施例中,同步模塊312和/或其某些部分可以駐留在邏輯實體314、316和/或管理節(jié)點318上。
在一個實施例中,設(shè)備300包括駐留在管理節(jié)點318上的尋址模塊324。在某些實施例中,尋址模塊324和/或其某些部分可以駐留在邏輯實體314、316和/或管理節(jié)點318上。尋址模塊324從管理節(jié)點318向邏輯實體314、316的本地資源222有選擇地尋址管理命令。如上所述和如這里所用,本地資源222可以表示與邏輯實體314、316相關(guān)聯(lián)的各種物理和邏輯組件以及實體314、316本身。例如,本地資源222可以包括將邏輯實體作為根并且將各個邏輯和物理對象作為子孫后代的資源層級。
哪個本地資源222被尋址,取決于管理命令的性質(zhì)和所預(yù)期的影響。例如,假定將要在對等域208中進(jìn)行全局改變,諸如,向每個邏輯實體314、316的邏輯存儲器設(shè)備“D”分配附加的一兆字節(jié)的存儲器。管理命令可能無法為邏輯實體314、316直接尋址。作為替代,每個邏輯實體314、316的邏輯存儲器設(shè)備“D”可能需要接收管理命令。通常,單獨的命令可能會被發(fā)送到每個邏輯實體314、316的邏輯存儲器設(shè)備“D”。然而,因為邏輯實體314、316處于通用對等域208中,并且每個均具有邏輯存儲器設(shè)備“D”,所以管理節(jié)點318向?qū)Φ润w領(lǐng)導(dǎo)者發(fā)送被尋址到邏輯存儲器設(shè)備“D”的單個管理命令。然后,對等體領(lǐng)導(dǎo)者把管理命令中繼到對等域208中的其它對等體(一個或多個)。
那些本領(lǐng)域技術(shù)人員將會認(rèn)識到,可以使用各種尋址技術(shù)來發(fā)送目標(biāo)為特定資源222的管理命令。例如,可以利用包括資源222、邏輯實體316和對等域208的唯一標(biāo)識符的唯一標(biāo)識符來登記資源222。如這里所用,對以特定資源或確定了目標(biāo)的(targeted)資源為目標(biāo)的描述意味著,管理命令作用于該特定的資源222,而且所述資源222可以被列為用于執(zhí)行管理命令的自變量。在任一實例中,管理節(jié)點318應(yīng)當(dāng)能夠準(zhǔn)確地引用用于定義資源222的信息。
在一個實施例中,尋址模塊324使用面向?qū)ο蟮南魉蛠硐蚰繕?biāo)資源222尋址管理命令。尋址模塊324可以維護(hù)對等域208的清單。尋址模塊324還可以維護(hù)對等域208的成員和管理域220的成員之間的關(guān)聯(lián),從而使得可以執(zhí)行諸如用于特定邏輯實體314的特定硬件命令之類的管理命令。
尋址模塊324可以利用面向?qū)ο蟮募軜?gòu)來向所想要的邏輯實體314、316和/或本地資源222發(fā)送管理命令。特別的是,對等域208可以由軟件對象來表示,所述軟件對象在面向?qū)ο蟮募軜?gòu)中由唯一的名稱/標(biāo)識符來唯一地標(biāo)識。通過引用邏輯實體與域208的關(guān)聯(lián),尋址模塊324可以直接引用用于表示邏輯實體314的軟件對象。然后,面向?qū)ο蟮募軜?gòu)把確定了目標(biāo)的管理命令中繼到特定的邏輯實體314和/或本地資源222。這只是管理節(jié)點318可以怎樣以本地資源222為目標(biāo)的一個例子。
第一邏輯實體314和第二邏輯實體316與管理節(jié)點318具有管理關(guān)系326。管理關(guān)系326允許管理節(jié)點318(通過管理命令)監(jiān)視并管理實體314、316的操作。然而,實體314、316不能管理或監(jiān)視管理節(jié)點318(因此,單向箭頭表示管理權(quán)限)。管理節(jié)點318和包括實體314、316的對等域208一起構(gòu)成管理域220。
圖4圖示了適于實現(xiàn)用于使存儲管理便于進(jìn)行的系統(tǒng)400的系統(tǒng)硬件。如上所述,當(dāng)把不那么貴的硬件組合到單個物理外殼中時,數(shù)據(jù)處理系統(tǒng)繼續(xù)變得更為復(fù)雜。然后,所述硬件在物理上、邏輯上或依照物理和邏輯分區(qū)的組合被劃分為多個邏輯實體202、204(參見圖2)。通過包括諸如邏輯實體202、204之類的冗余子組件,使用重復(fù)的硬件提供了更高的可用性。
在適于用為存儲子系統(tǒng)的一個實施例中,系統(tǒng)400包括通過通用硬件平臺402結(jié)合的至少兩個物理上獨立的中央電子設(shè)備復(fù)合體(CEC)。通用硬件平臺402可以包括簡單的物理外殼。
CEC是連接到諸如PHYP116之類的通用協(xié)調(diào)模塊116(參見圖1)的物理計算設(shè)備的獨立集合。CEC包括組織在處理器復(fù)合體404中的多個對稱多處理器、多個電子存儲器設(shè)備406、多個直接存取存儲設(shè)備(DASD)408、諸如主機(jī)適配器410之類的多個網(wǎng)絡(luò)I/O接口設(shè)備410、以及諸如網(wǎng)絡(luò)適配器412之類的多個管理接口設(shè)備412。CEC可以包括獨立的功率耦合和功率基礎(chǔ)設(shè)施以及通風(fēng)和冷卻系統(tǒng)。每個CEC可以被獨立地循環(huán)供電。甚至某些子系統(tǒng)可以在不影響CEC的其它部分性能的情況下被循環(huán)供電。當(dāng)然,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識到,上述某些硬件設(shè)備可以被組織到子系統(tǒng)中并且包括與本發(fā)明無關(guān)的各種控制器,但是其使得CEC能夠支持多個邏輯節(jié)點206。
在一個實施例中,系統(tǒng)400包括第一CEC414和第二CEC416。優(yōu)選的是,第二CEC416包括與第一CEC414基本上相同數(shù)量、類型、品牌和配置的硬件。如果出現(xiàn)問題,那么具有通用硬件減少了在故障調(diào)試中所涉及的變數(shù)。在一個實施例中,第一CEC414和第二CEC416可以由經(jīng)由網(wǎng)絡(luò)適配器412連接的單個硬件管理控制臺(Hardware Management Console,HMC)418來管理并控制。在一個實施例中,HMC 418是諸如個人計算機(jī)之類的專用硬件管理設(shè)備,用于運行LINUX操作系統(tǒng)和適當(dāng)?shù)墓芾響?yīng)用。
應(yīng)當(dāng)注意,甚至是在單個CEC內(nèi)管理硬件的這種復(fù)雜系統(tǒng)400也可能遭遇相當(dāng)大的挑戰(zhàn)。特別是要維護(hù)24/7可用性的目標(biāo)時。因此,HMC418包括復(fù)合體服務(wù)和維護(hù)腳本與例程,以便在服務(wù)于CEC的過程中引導(dǎo)管理員,從而使得可以維護(hù)最高的可用性等級。單個錯誤可能造成驚人的后果。在某些實施例中,在多個資源管理器中實現(xiàn)管理邏輯。各個資源管理器監(jiān)視并檢查ESS的各個硬件和軟件子系統(tǒng)的健康。軟件模塊和腳本指導(dǎo)服務(wù)技術(shù)人員和系統(tǒng)管理員診斷并修復(fù)問題以及執(zhí)行預(yù)防性維護(hù)。典型情況下,這些例程適當(dāng)?shù)仃P(guān)閉(循環(huán)供電)子組件和/或系統(tǒng),而其余硬件組件保持聯(lián)機(jī)。
圖5圖示了圖4的硬件系統(tǒng)400,并且包括在所述硬件上操作的軟件和邏輯實體。系統(tǒng)400包括通用硬件平臺402內(nèi)的第一CEC414和第二CEC416。在一個實施例中,CEC414、416是完全獨立的并且在存儲子系統(tǒng)內(nèi)操作。
系統(tǒng)400包括第一邏輯分區(qū)(LPAR)502、第二LPAR504、第三LPAR506和第四LPAR508。某些系統(tǒng)400可以包括比所圖示的LPAR更多的LPAR。每個LPAR502-508包括計算資源的分配,所述計算資源包括一個或多個處理器510、一個或多個I/O信道512以及持久性和/或非持久性的存儲器514。某些計算硬件可以共享,而其它硬件則僅僅專用于特定的LPAR。如這里所用,LPAR指的是管理并分配一個或多個處理器、存儲器和I/O通信,從而使得每個LPAR能夠獨立于其它LPAR來執(zhí)行操作系統(tǒng)。通常用于描述LPAR的其它術(shù)語包括虛擬機(jī)和邏輯實體202、204(參見圖2)。
在一個實施例中,第一LPAR502和第二LPAR504是同構(gòu)的,從而使得處理器510、I/O512和存儲器514的配置是相同的。類似地,在存儲器514中執(zhí)行的軟件可以是同構(gòu)的。各自的LPAR 502、504、存儲器514可以執(zhí)行相同的OS516和資源管理器518。
優(yōu)選的是,資源管理器518包括用于處理到達(dá)特定LPAR502、504的管理命令的邏輯。資源管理器518可以包括同步模塊520。同步模塊520可以包括與就圖3所描述的同步模塊312基本上相同的邏輯。
在一個實施例中,在第一CEC414上操作的第一LPAR502依照與在第二CEC416上操作的第二LPAR504的對等關(guān)系524來操作。第一LPAR502和第二LPAR504一起定義了存儲設(shè)備映像(SFI)526。優(yōu)選的是,SFI526基本上對應(yīng)于就圖2所描述的對等域208的分組、特征和功能。在某些實施例中,SFI526可以包括對等域208的子集,這是因為,在對等域208可以具有兩個或多個LPAR502、504的情況下,在一個實施例中SFI526可以被限制為兩個LPAR502、504。
SFI526提供了冗余的邏輯資源以用于存儲并獲取數(shù)據(jù)。當(dāng)一個LPAR不可用而其余LPAR處理所有工作時,一般在LPAR502和LPAR504之間邏輯上拆分所有數(shù)據(jù)存儲處理。優(yōu)選的是,SFI526包括在物理硬件上操作的一個LPAR502,所述物理硬件完全獨立于第二LPAR504的物理硬件。因此,在優(yōu)選實施例中,SFI526包括硬件的物理分區(qū)。依照這種方式,一個CEC416可以是脫機(jī)的或在物理上被斷電,并且SFI526可以保持聯(lián)機(jī)。一旦CEC416返回到聯(lián)機(jī)狀態(tài),資源管理器518就可以使存儲器514和存儲同步,從而使得第二LPAR504再次匹配于第一LPAR502。
SFI526可以被進(jìn)一步分為邏輯存儲設(shè)備。SFI526還可以包括用于管理邏輯存儲設(shè)備的虛擬化驅(qū)動器軟件。優(yōu)選的是,SFI526只包括為存儲和取得數(shù)據(jù)所必需的軟件。例如,一個SFI526可以包括用于允許存儲和取得數(shù)據(jù)的OS中的文件系統(tǒng)。
系統(tǒng)400還可以包括存儲應(yīng)用映像(SAI)528,其包括處于對等關(guān)系524中的第三LPAR506和第四LPAR508。優(yōu)選的是,用于定義SAI528的LPAR506、508包括相同的OS516和相同的資源管理器518。在某些實施例中,SFI526的OS516和/或資源管理器518可以不同于SAI528的OS516和/或資源管理器518。在某些實施例中,SAI528基本上對應(yīng)于就圖2所描述的對等域208的分組、特征和功能。在某些實施例中,SAI528可以包括對等域208的子集,這是因為,在對等域208可以具有兩個或多個LPAR502、504的情況下,在一個實施例中SAI528可以被限制為兩個LPAR502、504。
優(yōu)選的是,保持對等域208、210互相分離。如果在多個對等域208、210的成員之間想要對等關(guān)系,那么組合多個對等域208、210以便形成單個對等域208。因此,兩個SFI526和/或SAI528可能不會彼此處于對等域208中。因為在存儲環(huán)境中存儲設(shè)備映像與存儲應(yīng)用映像服務(wù)于不同的目的,所以這可能是有益的。換句話說,在SFI526上和SAI528上所執(zhí)行的I/O和管理操作之間可能幾乎沒有或者沒有任何關(guān)系。
SAI528把存儲應(yīng)用組織到單個邏輯單元中,該邏輯單元可以獨立于SFI526的邏輯和物理存儲設(shè)備408(參見圖4)來管理。由于第三LPAR506和第四LPAR508鏡像彼此之上的數(shù)據(jù)處理,所以SAI528還包括冗余。優(yōu)選的是,SFI526包括在物理硬件上操作的第三LPAR506,所述物理硬件完全獨立于第四LPAR508的物理硬件。因此,在優(yōu)選實施例中,SAI528包括硬件的物理分區(qū)。依照這種方式,一個CEC416可以是脫機(jī)的或在物理上被斷電,并且SAI528可以保持聯(lián)機(jī)。SAI528的存儲應(yīng)用530包括特別用于管理數(shù)據(jù)的存儲和取得的應(yīng)用。存儲應(yīng)用的例子包括來自IBM的Tivoli存儲管理器、數(shù)據(jù)庫管理系統(tǒng)等。
管理模塊532被配置為有選擇地向SFI526和/或SAI528(對等域)傳送管理命令。作為選擇或者另外地,管理模塊532可以根據(jù)需要直接向各個LPAR502-508發(fā)送管理命令。LPAR502-508的所揭示的本地資源533允許管理模塊532向特定資源533發(fā)送管理命令,和/或把特定資源533自變量包括在某些管理命令中。
管理模塊532包括配置模塊534、信息模塊536和尋址模塊538,它們包括與就圖3所描述的配置模塊308、信息模塊310和尋址模塊324基本上相同的功能。特別地,信息模塊536或其組件可以廣播用于定義SFI526和/或SAI528的本地資源533的信息。作為選擇,信息模塊536或其組件可以把用于定義SFI526和/或SAI528的本地資源533的信息登記到可由管理模塊532訪問的諸如數(shù)據(jù)庫之類的中央儲存庫中。
在某些實施例中,信息模塊536通過周期性輪詢來從LPAR502-508獲取用于定義本地資源的信息。作為選擇,信息模塊536可以根據(jù)來自LPAR502-508的信號來獲取用于定義本地資源的信息。有利的是,管理模塊532提取用于表示單個SFI526的多個LPAR502、504的細(xì)節(jié),并且允許用戶向整個SFI526尋址管理命令,同時確保對每個LPAR502、504進(jìn)行特定改變。
優(yōu)選的是,管理模塊532向SFI526和SAI528傳送管理命令,并因而通過管理子系統(tǒng)540向LPAR502-508傳送管理命令,所述管理子系統(tǒng)540在邏輯上鏈接管理模塊532和LPAR502-508??梢砸勒毡景l(fā)明修改的子系統(tǒng)的一個例子是可從紐約的Armonk的國際商業(yè)機(jī)器公司(IBM)處獲得的資源監(jiān)視和控制(Resource Monitoring andControl,RMC)子系統(tǒng)。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識到,用于支持本發(fā)明的管理子系統(tǒng)540與它所源于的常規(guī)RMC子系統(tǒng)并不相同。
基于RMC的管理子系統(tǒng)540是典型情況下被并入到操作系統(tǒng)、諸如AIX中的功能模塊。當(dāng)然,可以在包括LINUX、UNIX、Windows等的其它操作系統(tǒng)中實現(xiàn)管理子系統(tǒng)540。管理子系統(tǒng)540的附贈組件可以駐留在管理模塊532和LPAR 502-508上。
管理子系統(tǒng)540監(jiān)視諸如盤空間、處理器使用、設(shè)備驅(qū)動器、適配卡狀態(tài)等之類的資源。管理子系統(tǒng)540被設(shè)計成響應(yīng)于預(yù)定義的條件來執(zhí)行動作。然而,常規(guī)的RMC不能與對等域208中的一對LPAR502-508(SFI526或SAI528)同時對接。作為替代,常規(guī)的RMC子系統(tǒng)一次與一個LPAR通信。
在本發(fā)明的某些實施例中,常規(guī)的RMC子系統(tǒng)被擴(kuò)展并修改以便創(chuàng)建修改的管理子系統(tǒng)540,其能夠允許在對等域208內(nèi)的管理和監(jiān)視并且防止LPAR管理或監(jiān)視在另一對等域208中的LPAR。所修改的管理子系統(tǒng)540還可以允許諸如管理模塊532之類的管理節(jié)點管理兩個或多個對等域208、210。
所修改的管理子系統(tǒng)540可以包括對象模型,其包括用于表示一個或多個LPAR502-508的每個可管理資源的對象。對象表示物理和邏輯資源的特征和屬性。所述對象可以存儲諸如通信地址、版本信息、特征信息、兼容性信息、操作狀態(tài)信息等之類的信息。
管理子系統(tǒng)540進(jìn)一步包括一組資源管理器518。在一個實施例中,資源管理器518包括用于解釋管理命令并把該管理命令應(yīng)用于在對象模型中所定義的資源533的邏輯。在某些實施例中,資源管理器518是在每個LPAR502-508上執(zhí)行的現(xiàn)有RMC模塊的軟件擴(kuò)展。資源管理器518可以擴(kuò)展面向?qū)ο蟮腞MC模塊或程序設(shè)計的RMC模塊。
在某些實施例中,管理模塊532充當(dāng)多個SFI526、SAI528和其中所定義的相關(guān)聯(lián)LPAR502-508的管理中央點。管理模塊532可以經(jīng)由帶外通信網(wǎng)絡(luò)耦合到多個硬件平臺542。管理模塊532優(yōu)選地被配置為向分布在多個平臺542上的SFI 526和SAI528發(fā)送一個或多個管理命令。此外,每個SFI526和/或SAI528可以包括不同的OS516和/或應(yīng)用集530??梢砸勒盏乩怼⒐餐康?、功能或其它特性把SFI526和/或SAI528組織到共同的管理域544中。應(yīng)當(dāng)注意,管理域544可以包括多個硬件平臺542。管理模塊532可以允許發(fā)布命令以便選擇對等域208、210,對等域208、210包括SFI526、SAI528或SFI526和SAI528的組合。
仍然參照圖5,管理子系統(tǒng)540和資源管理器518優(yōu)選地被配置為響應(yīng)于LPAR502、504之一的故障,第一LPAR502接管第二LPAR504的操作,并且反之亦然。對等域208通過提供通信信道使得每個LPAR502、504鏡像另一個LPAR的操作,來使其成為可能。在某些實施例中,當(dāng)對等域208的LPAR502、504之一出故障時,管理子系統(tǒng)540可以記錄自從出故障的LPAR脫機(jī)以來對未出故障的LPAR所進(jìn)行的改變的集合。另外,一旦出故障的LPAR返回到聯(lián)機(jī)狀態(tài),管理子系統(tǒng)540就可以幫助有效的LPAR的資源管理器518恢復(fù)該改變集合。
對等域208允許每個LPAR502、504監(jiān)視另一個LPAR。因此,LPAR502、504可以包括用于檢測另一LPAR何時具有諸如變得脫機(jī)之類的錯誤情況的邏輯。一旦檢測到錯誤情況,就可以開始記錄。相同的監(jiān)視器可以發(fā)信號通知何時LPAR返回到聯(lián)機(jī)狀態(tài)并且觸發(fā)恢復(fù)該改變集合。依照這種方式,提供了實時的冗余,從而使得對等域208作為整體(或SFI526或SAI528)保持可用于主機(jī)102。
圖6依照一個實施例圖示了用于通過組織存儲資源來使存儲便于進(jìn)行的方法600的流程圖。一旦管理員希望在管理域220內(nèi)把邏輯實體202、204、212、214和管理節(jié)點216、224組織到一個或多個對等域208、210(參見圖2)中,方法600就開始了(602)。例如,管理員可以把成對的LPAR組織到諸如SFI526之類的對等域208中,使得一個LPAR是用于另一LPAR的冗余有效備份。另外,管理員可能希望從單個管理節(jié)點216跨過多個硬件平臺542控制并管理多個SFI526。在管理域220內(nèi)組織一個或多個對等域208、210,允許利用單個管理命令來尋址所述對等域208、210內(nèi)的資源或所述對等域208內(nèi)的LPAR。
最初,管理員把兩個或多個邏輯實體202、204配置(604)到對等域208中,從而使得每個邏輯實體202、204鏡像另一個邏輯實體的操作。典型情況下,這意味著,在兩個或多個邏輯實體202、204之間建立了某些通信信道和協(xié)議,從而使得每個邏輯實體202、204與對等域208中的每個其它邏輯實體202、204具有直接通信。優(yōu)選的是,使用專用管理信道來在邏輯上鏈接邏輯實體202、204。
接下來,信息模塊310揭示(606)單個管理域220的一個或多個對等域208、210內(nèi)的每個邏輯實體314、314的本地資源222。如上所述,存在可用來向管理節(jié)點318通知本地資源222從而使得本地資源222可以被用作管理命令中的目標(biāo)資源322的各種技術(shù)。另外,當(dāng)本地資源222被更新和修改時,信息模塊310與其它管理子系統(tǒng)合作可以維護(hù)目標(biāo)資源322。
然后,當(dāng)管理節(jié)點318發(fā)布管理命令,尋址模塊324向與對等域208相關(guān)聯(lián)的本地資源222有選擇地尋址(608)管理命令。作為選擇,尋址模塊324向?qū)Φ扔?08的第一邏輯實體314或第二邏輯實體316尋址(608)管理命令。管理命令被發(fā)往哪個資源222部分地取決于管理命令的類型。較高級(其意味著與硬件設(shè)備不相關(guān))的管理命令可以被發(fā)送到在實體314、316之間共用的一對資源222。較低級(其意味著與硬件設(shè)備相關(guān))的管理命令可以被發(fā)送到特定實體314、316的特定資源222。可以使用各種尋址技術(shù)。
接下來,確定(610)邏輯實體314或LPAR502是否脫機(jī)。LPAR502可以被斷定為脫機(jī)以用于服務(wù)或故障調(diào)試,或者LPAR502可能由于錯誤情況而無意地脫機(jī)。如果LPAR502脫機(jī)了,那么用于定義對等域208的邏輯(即,在實體314、316上執(zhí)行的記錄模塊)可以開始記錄(612)對所述對等域208的一個或多個聯(lián)機(jī)的LPAR504所進(jìn)行的改變的集合。一旦脫機(jī)的LPAR502返回到聯(lián)機(jī)狀態(tài),所述邏輯就可以通過向LPAR502應(yīng)用該記錄的改變集合來恢復(fù)所述LPAR502。典型情況下,保持聯(lián)機(jī)的LPAR504向所恢復(fù)的LPAR502應(yīng)用更新。
如果沒有一個邏輯實體314、316或LPAR502、504脫機(jī),那么確定(614)是否有更多管理命令對于管理域220的邏輯實體314、316而言是待處理的。如果是的話,那么方法600返回到尋址(608)下一管理命令。如果不是的話,那么方法600結(jié)束(616)。
本領(lǐng)域技術(shù)人員將會很快地認(rèn)識到本發(fā)明所提供的潛在益處。分別管理SFI526和SAI528(整個對等域208)和/或各個LPAR502-508的能力為管理員節(jié)省了大量的時間,并且顯著地降低了出現(xiàn)錯誤和差錯的可能性。另外,可以在管理對等域226中使多個管理節(jié)點216、224相關(guān)。像邏輯實體202一樣,管理節(jié)點216、224可以互相監(jiān)視并管理,從而使得如果一個管理節(jié)點出故障,那么另一個管理節(jié)點可以在出故障的管理節(jié)點216停用的情況下繼續(xù)執(zhí)行管理命令集。因此,本發(fā)明在管理邏輯實體方面提供了進(jìn)步,所述邏輯實體可以是相關(guān)的以便形成SFI526和SAI528。本發(fā)明在LPAR級和管理節(jié)點級上提供了冗余。最后,本發(fā)明減輕了對邏輯實體的管理負(fù)擔(dān),所述邏輯實體在典型情況下為了冗余目的而被類似地配置。
可以在不脫離本發(fā)明的本質(zhì)特征的情況下,采用其它具體形式來實現(xiàn)本發(fā)明。所描述的實施例在各個方面都應(yīng)當(dāng)被認(rèn)為僅僅是說明性的而并非限制性的。因此,本發(fā)明的范圍應(yīng)當(dāng)由所附權(quán)利要求而不是上述描述來表明。落入權(quán)利要求的等效意義和范圍內(nèi)的所有改變都將被包含在所述權(quán)利要求的范圍內(nèi)。
在此說明書中所描述的許多功能單元已經(jīng)被標(biāo)記為模塊,以便更特別地強(qiáng)調(diào)它們的實現(xiàn)獨立性。例如,模塊可以被實現(xiàn)為硬件電路,其包括定制的VLSI電路或門陣列、諸如邏輯芯片之類的現(xiàn)成半導(dǎo)體、晶體管或其它分立元件。模塊還可以用諸如現(xiàn)場可編程門陣列、可編程陣列邏輯、可編程邏輯器件等之類的可編程硬件設(shè)備來實現(xiàn)。
模塊也可以用由各種類型的處理器所執(zhí)行的軟件來實現(xiàn)??蓤?zhí)行代碼的標(biāo)識模塊例如可以包括計算機(jī)指令的一個或多個物理或邏輯塊,所述計算機(jī)指令例如可以被組織為對象、過程、函數(shù)或其它構(gòu)造。盡管如此,所標(biāo)識模塊的可執(zhí)行部分在物理上不必位于一起,而是可以包括在不同位置中所存儲的完全不同的指令,所述指令當(dāng)在邏輯上結(jié)合在一起時構(gòu)成所述模塊并且實現(xiàn)所述模塊所聲明的目的。
實際上,可執(zhí)行代碼的模塊可以是單個指令或許多指令,并且甚至可以分布在幾個不同的代碼段上、分布在不同的程序之間、以及分布在幾個存儲器設(shè)備之上。類似地,在此可以在模塊內(nèi)標(biāo)識并圖示操作數(shù)據(jù),并且其可以依照任何適當(dāng)形式來實現(xiàn)并且被組織在任何適當(dāng)類型的數(shù)據(jù)結(jié)構(gòu)內(nèi)。操作數(shù)據(jù)可以被收集為單個數(shù)據(jù)集,或者可以分布在不同位置上,其中包括分布在不同存儲設(shè)備上,并且可以至少部分地僅僅作為系統(tǒng)或網(wǎng)絡(luò)上的電子信號存在。
在此說明書中,對“選定實施例”、“一個實施例”或“實施例”的描述意味著,結(jié)合所述實施例所描述的具體特征、結(jié)構(gòu)或特性被包括在本發(fā)明的至少一個實施例中。因此,在此說明書中的不同位置上出現(xiàn)的短語“選定實施例”、“在一個實施例中”或“在實施例中”不一定都涉及相同的實施例。
此外,可以在一個或多個實施例中以任何適當(dāng)?shù)姆绞浇M合所描述的特征、結(jié)構(gòu)或特性。在下面的描述中,提供了許多具體細(xì)節(jié),諸如編程、軟件模塊、用戶選擇、用戶接口、網(wǎng)絡(luò)事務(wù)、數(shù)據(jù)庫查詢、數(shù)據(jù)庫結(jié)構(gòu)、硬件模塊、硬件電路、硬件芯片等的例子,以便提供對本發(fā)明實施例的徹底了解。然而,相關(guān)領(lǐng)域的技術(shù)人員應(yīng)當(dāng)認(rèn)識到,可以在沒有一個或多個具體細(xì)節(jié)的情況下或者用其它方法、組件、材料等來實施本發(fā)明。在其它實例中,沒有示出或詳細(xì)描述眾所周知的結(jié)構(gòu)、材料或操作,以免模糊本發(fā)明的特征。
權(quán)利要求
1.一種用于使存儲管理便于進(jìn)行的設(shè)備,所述設(shè)備包括配置裝置,用于配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相互交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信;信息裝置,被配置為向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源,從而使得所述第一邏輯實體和第二邏輯實體的本地資源可用作來自所述管理節(jié)點的管理命令的目標(biāo)資源;和尋址裝置,被配置為有選擇地從所述管理節(jié)點向所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源尋址管理命令。
2.如權(quán)利要求1所述的設(shè)備,其中,所述配置裝置被設(shè)計成配置所述管理節(jié)點以便依照定義了管理域的管理關(guān)系與第一邏輯實體和第二邏輯實體相交互。
3.如權(quán)利要求2所述的設(shè)備,其中,所述管理域包括所述管理節(jié)點和至少一個邏輯實體,所述至少一個邏輯實體被配置為由所述管理節(jié)點管理并監(jiān)視,并且不能管理或監(jiān)視所述管理節(jié)點。
4.如權(quán)利要求2所述的設(shè)備,其中,所述管理域包括彼此處于對等域中的三個或更多邏輯實體,每個邏輯實體的本地資源被揭示給所述管理節(jié)點以用作來自所述管理節(jié)點的管理命令的目標(biāo)資源。
5.如權(quán)利要求2所述的設(shè)備,其中,所述管理域包括彼此處于對等域中的第一組邏輯實體和彼此處于對等域中的第二組邏輯實體,每個邏輯實體的本地資源被揭示給所述管理節(jié)點以用作管理命令的目標(biāo)資源,一組中的邏輯實體不能與另一組中的邏輯實體進(jìn)行通信。
6.如權(quán)利要求5所述的設(shè)備,其中,所述尋址裝置被進(jìn)一步配置為使管理命令直接以所述第一組為目標(biāo)。
7.如權(quán)利要求5所述的設(shè)備,其中,所述尋址裝置被進(jìn)一步配置為使管理命令直接以所述第一組和第二組為目標(biāo)。
8.如權(quán)利要求1所述的設(shè)備,其中,所述管理域進(jìn)一步包括第二個管理節(jié)點,其被配置為在管理對等域中與所述管理節(jié)點相交互,所述管理對等域允許任何一個管理節(jié)點響應(yīng)于管理節(jié)點之一的故障而監(jiān)視并接管管理操作。
9.如權(quán)利要求1所述的設(shè)備,其中,所述對等域包括被配置具有基本上相等的權(quán)限以便互相監(jiān)視并管理的至少兩個邏輯節(jié)點。
10.如權(quán)利要求1所述的設(shè)備,其中,對等域的第一邏輯實體和第二邏輯實體被配置為響應(yīng)于邏輯實體之一的故障而接管另一邏輯實體的操作,記錄自從出故障的邏輯實體脫機(jī)以來的改變的集合,并且響應(yīng)于出故障的邏輯實體變?yōu)槁?lián)機(jī)而恢復(fù)該改變集合。
11.如權(quán)利要求1所述的設(shè)備,其中,所述信息裝置被進(jìn)一步配置為向管理節(jié)點廣播所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源。
12.如權(quán)利要求1所述的設(shè)備,其中,所述信息裝置被進(jìn)一步配置為把所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源登記到可由所述管理節(jié)點訪問的中央儲存庫中。
13.如權(quán)利要求1所述的設(shè)備,進(jìn)一步包括同步裝置,其被配置為響應(yīng)于由所述第一邏輯實體或第二邏輯實體對本地資源所進(jìn)行的修改,而使用于表示所述第一邏輯實體和第二邏輯實體的本地資源的資源定義相同步。
14.如權(quán)利要求1所述的設(shè)備,其中,所述管理節(jié)點經(jīng)由與由所述第一邏輯實體和第二邏輯實體所使用的一個或多個輸入/輸出(I/O)信道相分離的通信信道來發(fā)送管理命令。
15.如先前權(quán)利要求中任何一個所述的設(shè)備,其中,所述第一邏輯實體和第二邏輯實體包括通用硬件平臺的邏輯分區(qū)(LPAR)。
16.如權(quán)利要求1所述的設(shè)備,其中,所述第一邏輯實體和第二邏輯實體定義了可獨立管理的存儲設(shè)備映像(SFI),并且其中所述尋址模塊被進(jìn)一步配置為向管理域內(nèi)的多個存儲設(shè)備映像發(fā)送管理命令。
17.一種用于使存儲管理便于進(jìn)行的系統(tǒng),所述系統(tǒng)包括可操作地耦合到硬件平臺的第一中央電子設(shè)備復(fù)合體(CEC),所述第一中央電子設(shè)備復(fù)合體包括被組織為第一處理器復(fù)合體的多個對稱多處理器、多個電子存儲器設(shè)備、多個直接存取存儲設(shè)備、多個網(wǎng)絡(luò)輸入/輸出(I/O)接口設(shè)備和多個管理接口設(shè)備,所述中央電子設(shè)備復(fù)合體的每個設(shè)備電耦合以便交換數(shù)據(jù)和控制信息;可操作地耦合到硬件平臺的第二中央電子設(shè)備復(fù)合體,所述第二中央電子設(shè)備復(fù)合體包括被組織為第二處理器復(fù)合體的多個對稱多處理器、多個電子存儲器設(shè)備、多個直接存取存儲設(shè)備、多個網(wǎng)絡(luò)輸入/輸出(I/O)接口設(shè)備和多個管理接口設(shè)備,所述中央電子設(shè)備復(fù)合體的每個設(shè)備電耦合以便交換數(shù)據(jù)和控制信息;至少一個存儲設(shè)備映像(SFI),其包括被定義為使用所述第一中央電子設(shè)備復(fù)合體的計算資源來操作的第一邏輯分區(qū)(LPAR)和被定義為使用所述第二中央電子設(shè)備復(fù)合體的計算資源來操作的第二邏輯分區(qū),所述第一邏輯分區(qū)和第二邏輯分區(qū)專用于存儲和獲取數(shù)據(jù);至少一個存儲應(yīng)用映像(SAI),其包括被定義為使用所述第一中央電子設(shè)備復(fù)合體的計算資源來操作的第三邏輯分區(qū)(LPAR)和被定義為使用所述第二中央電子設(shè)備復(fù)合體的計算資源來操作的第四邏輯分區(qū),所述第三邏輯分區(qū)和第四邏輯分區(qū)專用于數(shù)據(jù)存儲應(yīng)用;配置模塊,用于配置所述第一邏輯分區(qū)和第二邏輯分區(qū)以便在對等域中互相交互,從而使得每個邏輯分區(qū)鏡像另一邏輯分區(qū)的操作并與之直接通信,并且所述配置模塊進(jìn)一步配置所述第三邏輯分區(qū)和第四邏輯分區(qū)以便在對等域中互相交互,從而使得每個邏輯分區(qū)鏡像另一邏輯分區(qū)的操作并與之直接通信;信息模塊,被配置為向管理節(jié)點揭示至少一個存儲設(shè)備映像和至少一個存儲應(yīng)用映像的本地資源定義,從而使得所述至少一個存儲設(shè)備映像和至少一個存儲應(yīng)用映像的本地資源可用作來自所述管理節(jié)點的管理命令的目標(biāo)資源;和尋址模塊,被配置為有選擇地從所述管理節(jié)點向所述至少一個存儲設(shè)備映像和至少一個存儲應(yīng)用映像的本地資源尋址管理命令。
18.如權(quán)利要求17所述的系統(tǒng),進(jìn)一步包括同步模塊,其被配置為響應(yīng)于對所述至少一個存儲設(shè)備映像或至少一個存儲應(yīng)用映像的任一邏輯分區(qū)的本地資源所進(jìn)行的修改,而使用于表示所述至少一個存儲設(shè)備映像和至少一個存儲應(yīng)用映像的本地資源的資源定義相同步。
19.如權(quán)利要求17所述的系統(tǒng),其中,所述信息模塊被進(jìn)一步配置為向所述管理節(jié)點廣播所述至少一個存儲設(shè)備映像的本地資源和所述至少一個存儲應(yīng)用映像的本地資源。
20.如權(quán)利要求17所述的系統(tǒng),其中,所述信息模塊被進(jìn)一步配置為把所述至少一個存儲設(shè)備映像的本地資源和所述至少一個存儲應(yīng)用映像的本地資源登記到可由所述管理節(jié)點訪問的中央儲存庫中。
21.一種用于使存儲管理便于進(jìn)行的方法,包括配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相互交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信;向管理節(jié)點揭示所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源,從而使得所述第一邏輯實體和第二邏輯實體的本地資源可用作來自所述管理節(jié)點的管理命令的目標(biāo)資源;以及有選擇地從所述管理節(jié)點向所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源尋址管理命令。
22.如權(quán)利要求21所述的方法,進(jìn)一步包括配置所述管理節(jié)點以便依照定義了管理域的管理關(guān)系與第一邏輯實體和第二邏輯實體相交互。
23.如權(quán)利要求22所述的方法,其中,所述管理域包括彼此處于對等域中的第一組邏輯實體和彼此處于對等域中的第二組邏輯實體,每個邏輯實體的本地資源被揭示給所述管理節(jié)點以用作管理命令的目標(biāo)資源,一組中的邏輯實體不能與另一組中的邏輯實體進(jìn)行通信。
24.如權(quán)利要求23所述的方法,其中,操作進(jìn)一步包括用于使管理命令直接以所述第一組為目標(biāo)的操作。
25.如權(quán)利要求23所述的方法,其中,操作進(jìn)一步包括用于使管理命令直接以所述第一組和第二組為目標(biāo)的操作。
26.如權(quán)利要求21所述的方法,其中,揭示步驟進(jìn)一步包括向所述管理節(jié)點廣播所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源。
27.如權(quán)利要求21所述的方法,其中,揭示步驟進(jìn)一步包括把所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源登記到可由所述管理節(jié)點訪問的中央儲存庫中。
28.如權(quán)利要求21所述的方法,進(jìn)一步包括響應(yīng)于由所述第一邏輯實體或第二邏輯實體對本地資源所進(jìn)行的修改,使用于表示所述第一邏輯實體和第二邏輯實體的本地資源的資源定義相同步。
29.一種計算機(jī)程序,包括用于執(zhí)行如權(quán)利要求21到28中任何一個所述的方法的所有步驟的計算機(jī)可執(zhí)行指令。
全文摘要
提供了一種用于通過組織存儲資源來使存儲管理便于進(jìn)行的設(shè)備、系統(tǒng)和方法。所述設(shè)備包括配置模塊,其用于配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信。信息模塊向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源,從而使得所述本地資源可用作來自所述管理節(jié)點的管理命令的目標(biāo)資源。尋址模塊從管理節(jié)點有選擇地向按照管理命令的類型所確定的第一邏輯實體的本地資源和/或第二邏輯實體的本地資源尋址管理命令。
文檔編號G06F17/30GK101019120SQ200580031026
公開日2007年8月15日 申請日期2005年9月29日 優(yōu)先權(quán)日2004年10月12日
發(fā)明者約翰·E.·??坡? 科薩瓦普拉薩斯·拉加納薩恩, 邁克爾·A.·施密特, 史蒂文·R.·范·甘迪 申請人:國際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
左云县| 冀州市| 锡林郭勒盟| 藁城市| 两当县| 泾阳县| 南阳市| 吉林市| 修文县| 江孜县| 萝北县| 拜泉县| 房山区| 阳西县| 衡东县| 屏东市| 新干县| 泾阳县| 清原| 寻乌县| 陆川县| 泸西县| 聊城市| 依兰县| 孟连| 祁门县| 永平县| 九台市| 府谷县| 乌兰察布市| 隆尧县| 色达县| 张掖市| 宕昌县| 绥芬河市| 东明县| 嘉祥县| 永顺县| 什邡市| 绥滨县| 鄢陵县|