專利名稱:保證集群系統(tǒng)中配置信息一致的方法
技術領域:
本發(fā)明涉及一種計算機集群技術,尤其是一種保證集群系統(tǒng)中配置信息一致的方法。
背景技術:
集群(Cluster)技術就是在網絡中將一組相互獨立的服務器作為單一系統(tǒng)的模式進行管理,來實現高的可用性、可管理性和優(yōu)越的可伸縮性,以實現服務的并行處理、負載均衡功能,以及系統(tǒng)的容錯、容災功能。集群是一種松散耦合的計算機節(jié)點集合,通過集群管理器(Cluster Administrator)一個圖形化的管理員工具,通過它可執(zhí)行維護、監(jiān)視和故障轉移管理,實現對群集實體(如節(jié)點、資源、資源組)和群集自身的管理。一個集群包含多臺(至少兩臺)擁有共享數據存儲空間的服務器,任何一臺服務器運行一個應用時,應用數據被存儲在共享的數據空間內,每臺服務器的操作系統(tǒng)和應用程序文件存儲在其各自的本地儲存空間上,集群內各節(jié)點服務器通過一內部局域網相互通訊。當一臺節(jié)點服務器發(fā)生故障時,這臺服務器上所運行的應用程序將在另一節(jié)點服務器上被自動接管。當一個應用服務發(fā)生故障時,應用服務將被重新啟動或被另一臺服務器接管。圖1所示為包含兩臺擁有共享數據存儲空間的服務器的集群系統(tǒng)的組網結構示意圖。主機與備機互相備份,通常情況下,由主機提供應用服務,當主機出現故障無法正常提供應用服務的時候,備機接管主機的工作,此稱為active/standby(主動/備份)模式;應用程序的一部分進程運行在主機上,另一部分進程運行在備機上,當主機出現故障不能正常提供應用服務的時候,備機接管主機的工作,反之相同,此稱為active/active(主動/主動)模式。
現有技術中,無論是在active/standby或active/active工作模式下,主機與備機均為一個單獨的個體,所有的配置信息在每一臺機器上都單獨保存,因此存在以下缺陷與不足當A節(jié)點服務器上的配置信息被更新時,作為A節(jié)點服務器的備份的B節(jié)點服務器上的配置信息卻不能被及時更新,無法保證配置信息的同步性與一致性,這樣,當提供應用服務的A節(jié)點服務器出現故障時,B節(jié)點服務器因為配置信息的滯后無法正確接管A節(jié)點服務器上的服務,可靠性低,給用戶帶來損失。
發(fā)明內容
本發(fā)明所要解決的技術問題在于針對現有的集群系統(tǒng)存在的缺陷與不足,提供一種集群系統(tǒng)及保證集群系統(tǒng)中配置信息一致的方法,以保證集群系統(tǒng)中各節(jié)點服務器上的配置信息的同步性與一致性,提高機群系統(tǒng)的可靠性。
本發(fā)明的一種保證集群系統(tǒng)中配置信息一致的方法,執(zhí)行以下步驟步驟1、集群資源備份管理模塊(Watchman Cluster Server Back,WMCSB)對集群系統(tǒng)中各節(jié)點服務器的工作情況進行監(jiān)測;步驟2、當節(jié)點服務器中的應用程序信息發(fā)生變化時,更新所述集群資源備份管理模塊中存儲的配置信息,更新該集群資源備份管理模塊中的令牌信息,所述令牌信息用于標識配置信息的更新情況;步驟3、集群資源管理模塊重新啟動后,根據所述的令牌信息更新集群資源管理模塊(Watchman Cluster Server,WMCS)或集群資源備份管理模塊中的配置信息。
上述技術方案中,所述步驟1之前還執(zhí)行以下操作在集群資源管理模塊與集群資源備份管理模塊中分別設置初始信息相同的令牌信息,該令牌信息包括令牌組標識信息與令牌更新信息。
所述步驟2中對令牌更新信息進行更新是對令牌號信息進行更新。
所述步驟3包括步驟301、集群資源管理模塊重新啟動后,與集群資源備份管理模塊建立連接,并與該集群資源備份管理模塊相互獲取令牌信息;步驟302、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌號是否與自己保存的令牌信息中的令牌號相等,若相等,執(zhí)行步驟303;否則,執(zhí)行步驟305;步驟303、向所述管理工具發(fā)出報警信息;步驟304、用戶制訂數據源并利用該數據源對所述集群資源管理模塊與所述集群資源備份管理模塊中的配置信息進行更新,然后執(zhí)行步驟306;步驟305、根據預先設定的參數,由令牌號大的或者小的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新;步驟306、結束。
其中,在步驟301與步驟302之間包括所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的令牌組標識信息進行分析,判斷該令牌組標識信息中的令牌組標識是否與自己保存的令牌信息中的令牌組標識相等,是,則相應執(zhí)行步驟302;否則,執(zhí)行步驟306。所述步驟305中對對方的配置信息進行更新包括所述集群資源管理模塊或所述集群資源備份管理模塊向對方發(fā)送配置信息及更新請求信息;所述集群資源備份管理模塊或所述集群資源管理模塊利用接收到的配置信息對自己保存的配置信息進行更新。
另外,所述步驟2中對令牌更新信息進行更新是對令牌更新時間信息進行更新。相應的,所述步驟3包括步驟311、集群資源管理模塊重新啟動后,與集群資源備份管理模塊建立連接,并與該集群資源備份管理模塊相互獲取令牌信息;步驟312、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌更新時間與自己保存的令牌信息中的令牌更新時間的大小是否相等,或者二者的差值是否小于預先規(guī)定的數值,是,執(zhí)行步驟313;否則,執(zhí)行步驟315;步驟313、向所述管理工具發(fā)出報警信息;步驟314、用戶制訂數據源并利用該數據源對所述集群資源管理模塊與所述集群資源備份管理模塊中的配置信息進行更新,然后執(zhí)行步驟316;步驟315、由令牌更新時間晚的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新;步驟316、結束。
在步驟311與步驟312之間包括所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的令牌組標識信息進行分析,判斷該令牌組標識信息中的令牌組標識是否與自己保存的令牌信息中的令牌組標識相等,是,則相應執(zhí)行步驟312;否則,執(zhí)行步驟316。
同時,所述步驟2中對令牌更新信息進行更新是同時對令牌號信息與令牌更新時間信息進行更新。相應的,所述步驟3包括步驟321、集群資源管理模塊重新啟動后,與集群資源備份管理模塊建立連接,并與該集群資源備份管理模塊相互獲取令牌信息;步驟322、所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的權重信息進行分析,判斷是否由令牌號決定更新控制權,是,執(zhí)行步驟323;否則,執(zhí)行步驟325;步驟323、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌號是否與自己保存的令牌信息中的令牌號相等,若不相等,執(zhí)行步驟324;否則,執(zhí)行步驟327;步驟324、根據預先設定的參數,由令牌號大的或者小的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新,然后執(zhí)行步驟329;步驟325、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌更新時間與自己保存的令牌信息中的令牌更新時間的大小是否相等,或者二者的差值是否小于預先規(guī)定的數值,否,執(zhí)行步驟326;是,執(zhí)行步驟327;步驟326、由令牌更新時間晚的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新,然后執(zhí)行步驟329;步驟327、向所述管理工具發(fā)出報警信息;步驟328、用戶制訂數據源并利用該數據源對所述集群資源管理模塊與所述集群資源備份管理模塊中的配置信息進行更新;在步驟321與步驟322之間包括所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的令牌組標識信息進行分析,判斷該令牌組標識信息中的令牌組標識是否與自己保存的令牌信息中的令牌組標識相等,是,則相應執(zhí)行步驟322;否則,執(zhí)行步驟329。
在上述任意一項方法中,所述步驟2中更新所述集群資源備份管理模塊中存儲的配置信息具體為所述集群資源備份管理模塊利用變化后的應用程序更新信息更新所述集群資源備份管理模塊中存儲的配置信息。
另外,在上述任意一項方法中,還包括更新集群管理代理模塊(WatchmanC1uster Agent,WMCA)中的配置信息的操作。更新集群管理代理模塊中的配置信息的操作具體為集群資源備份管理模塊接收到集群管理代理模塊發(fā)送的連接請求信息時,從該連接請求信息中獲取所述集群管理代理模塊的地址信息,從該集群資源備份管理模塊中存儲的配置信息中提取出與所述地址信息對應的信息,并利用該信息更新所述集群管理代理模塊中的配置信息。
基于上述技術方案,本發(fā)明采用令牌信息保持WMCS與WMCSB中的配置信息的一致性,從而保證了集群系統(tǒng)中的所有WMCA、WMCS與WMCSB中配置信息的一致性與自動同步,提高了配置信息在災難情況下的生存性與可恢復性,增強了系統(tǒng)的可靠性。
下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。
圖1為現有技術集群系統(tǒng)的組網結構示意圖;圖2為實現本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的一集群系統(tǒng)的物理分布示意圖;圖3為實現本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的集群系統(tǒng)的另一物理分布示意圖;圖4為本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的一流程圖;
圖5為本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的另一流程圖;圖6為本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的又一流程圖;圖7為本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的再一流程圖。
具體實施例方式
由于集群系統(tǒng)中的各個節(jié)點服務器上分別設置對所在的節(jié)點服務器上的本地資源進行管理的WMCA,在其中的一個節(jié)點服務器上設置對集群系統(tǒng)的資源進行管理的WMCS,在另一個節(jié)點服務器上設置對集群系統(tǒng)的資源進行備份管理的WMCSB。正常情況下,本發(fā)明由WMCS對集群系統(tǒng)的資源進行管理,當集群系統(tǒng)中一個節(jié)點服務器上的應用程序信息發(fā)生變化時,例如用戶通過WMCS在一個節(jié)點服務器中添加了進程、刪除了進程或修改了進程屬性信息,WMCS便更新該節(jié)點服務器上的WMCA以及WMCSB中的配置信息。當WMCS出現故障時,由WMCSB代替WMCS對集群系統(tǒng)中所有節(jié)點服務器的資源進行管理。當WMCA因故障重啟并與WMCS建立連接后,WMCS便重新配置WMCA中的配置信息,消除WMCA因為離線后導致的配置信息的差異性。
參見圖2,圖2所示為實現本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的一集群系統(tǒng)的物理分布示意圖,該集群系統(tǒng)包括n(n為大于1的整數)個節(jié)點服務器(圖中未標出),在各節(jié)點服務器中分別設有對所在的節(jié)點服務器上的資源進行管理的WMCA10、WMCA20、……WMCAn0(n為大于1的整數),在其中的兩個節(jié)點服務器例如節(jié)點服務器1與節(jié)點服務器2中分別設有對集群中所有節(jié)點服務器上的資源進行管理的WMCS11,以及當集群資源管理模塊發(fā)生故障時,對集群中所有節(jié)點服務器上的資源進行備份管理的WMCSB21,WMCS11與WMCSB21相互通信連接,并且均與WMCA10、WMCA20、……WMCAn0通信連接。正常情況下,集群系統(tǒng)中配置信息保存在WMCS11中,WMCSB21對WMCS11中的配置信息進行實時的同步備份。具體的,WMCS11與WMCSB21之間及WMCS11、WMCSB21與WMCA10、WMCA20、……WMCAn0之間通過TCP/IP通信連接。
WMCA10、WMCA20、……WMCAn0與WMCS11以及WMCSB21之間都建立了連接,并且WMCSB21對WMCS11中的配置信息進行實時的同步備份,二者具有相同的配置信息,這樣,當WMCSB21與WMCS11中的之一發(fā)生故障例如由于網卡等物理故障導致的通訊故障時,還可通過未發(fā)生故障的WMCSB21或WMCS11實現對集群系統(tǒng)的資源管理;而當任何一個WMCA發(fā)生故障時,因其與WMCSB21及WMCS11都連接,而WMCSB21與WMCS11同時發(fā)生故障的概率很低,因此,當WMCA故障恢復以后,可被WMCSB21或WMCS11及時更新配置信息,保證了集群系統(tǒng)中的WMCA10、WMCA20、……WMCAn0與WMCS11以及WMCSB21中配置信息的一致性與自動同步,提高了集群系統(tǒng)的安全性與可靠性,有效避免了因節(jié)點服務器的故障導致的WMCS、WMCSB與WMCA之間的配置信息差異。
圖3所示為實現本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的另一集群系統(tǒng)的物理分布示意圖,該集群系統(tǒng)在圖2所示的集群系統(tǒng)的基礎上,還增設了一個可視化的管理裝置(Cluster Administrator,CA)0,該CA0分別與WMCS11及WMCSB21連接,用于對WMCS11與WMCSB21進行管理,尤其是當WMCS11與WMCSB21的配置信息發(fā)生沖突時,可通過CA0對WMCS11與WMCSB21進行強制管理,提高了集群系統(tǒng)的安全性、可靠性以及對系群系統(tǒng)維護的效率。
為了明確WMCS11或者WMCSB21中配置信息較新,本發(fā)明在WMCS11與WMCSB21中設置初始信息相同的令牌信息,該令牌信息用于標識在后續(xù)的流程中,WMCS11與WMCSB21對各自的配置信息的更新情況,包括令牌組ID與令牌更新信息。由于在設置令牌信息的同一時刻,WMCS11與WMCSB21中的配置信息是相同的,因此其令牌信息相同;令牌組ID標識集群系統(tǒng),因WMCSB21用于WMCS11的備份,因此,WMCS11與WMCSB21應該屬于同一集群系統(tǒng),其令牌組ID相同,并且一旦設定,不會因為配置信息的更新發(fā)生變化。
另外,令牌更新信息可以是令牌號信息,也可以是令牌更新時間信息或者二者的結合。當令牌更新信息為令牌號信息時,以令牌號的大小標識配置信息的更新情況,例如,設置該令牌號的初始值為0,當WMCS11或WMCSB21中的配置信息每發(fā)生一次變化,便相應的將其令牌信息中的令牌號加1,因此,通過令牌號的大小即可獲知WMCS11還是WMCSB21中的配置信息被最后更新,即配置信息最新,這樣,令牌號大的WMCS11或WMCSB21便具有對對方的配置信息更新的更新控制權。同樣,若以令牌更新時間信息表示令牌更新信息,則令牌更新時間晚的即數值大的表示其配置信息較新,相應的WMCS11或WMCSB21便具有對對方的配置信息更新的控制權。若令牌更新信息同時包括令牌號信息與令牌更新時間信息,則還需在令牌信息設置由令牌號或令牌更新時間決定更新控制權的權重信息,例如,權重信息可以為0或1,當權重信息為0時,表示由令牌號決定更新控制權,當權重信息為1時,表示由令牌更新時間決定更新控制權。
圖4所示為本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的一具體流程,其執(zhí)行以下步驟步驟1、當WMCS11發(fā)生故障時,WMCSB21便對集群系統(tǒng)中各節(jié)點服務器上的工作情況進行監(jiān)測。
正常情況下,由WMCS11對集群系統(tǒng)的資源進行管理,WMCSB21與WMCS11之間存在Socket(套接口)連接,對WMCS11中的配置信息進行實時的同步備份,并且對WMCS11的工作情況進行監(jiān)測。
步驟2、當系群系統(tǒng)中節(jié)點服務器上的應用程序信息發(fā)生變化時,WMCSB21利用變化后的應用程序更新信息更新WMCSB21上存儲的配置信息,同時,更新令牌信息中的令牌更新信息,例如,將令牌號加1,或者將令牌更新時間修改為更新WMCSB21上存儲的配置信息的時間。節(jié)點服務器上的應用程序信息發(fā)生變化,可以是該節(jié)點服務器上因增加或刪除了進程引起的進程信息的變化,也可以是進程屬性信息的變化。步驟3、當WMCS11的故障消除重新啟動后,與WMCSB21建立Socket連接,WMCS11與WMCSB21相互獲取對方的令牌信息,并對其中的令牌更新信息進行分析,根據令牌更新信息決定配置信息的更新控制權由誰掌握,獲得更新控制權的WMCS11或WMCSB21利用自己當前的配置信息更新對方的配置信息,實現配置信息的同步。
通過令牌更新信息確定配置信息更新控制權,由新配置信息代替舊的配置信息,確保了WMCSB21與WMCS11中配置信息的實時同步,因此,提高了集群系統(tǒng)的安全性與可靠性,有效避免了因節(jié)點服務器的故障導致的WMCS與WMCSB之間的配置信息差異。
在上述實施例的步驟2中,另外,若應用程序信息發(fā)生變化的節(jié)點服務器上的WMCA為WMCAn0,則WMCSB21還利用應用程序更新信息更新WMCAn0的配置信息。更新WMCAn0的配置信息的具體操作為WMCSB21將應用程序更新信息發(fā)送給WMCAn0,WMCAn0利用該應用程序更新信息更新其配置信息。
當WMCA因故障重啟后,會與WMCS21建立Socket連接,當WMCSB21監(jiān)測到WMCA與其建立Socket連接時,獲取其地址信息,WMCSB21對自己保存的配置信息進行分析,從中提取出與所述地址信息對應的配置信息,并將該配置信息發(fā)送給WMCA,重新配置WMCA上的配置信息,有效避免了WMCA因發(fā)生故障與WMCSB21產生的配置信息的差異。
當令牌信息中令牌更新信息的內容不同時,對WMCS11與WMCSB21中配置信息進行更新的具體方法也會有所不同。圖5所示為當令牌更新信息為令牌號信息時,本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的另一實施例的流程圖,該實施例中的步驟1-步驟2與圖4所示實施例相同,步驟3的操作為步驟301、當MCS11的故障被消除后,MCS11與WMCSB21建立Socket連接,之后,WMCS11與WMCSB21相互向對方發(fā)送請求信息獲取對方的令牌信息;步驟302、WMCS11與WMCSB21同時對接收到的令牌號信息進行分析,比較該信息中的令牌號是否與自己保存的令牌信息中的令牌號相等,是,執(zhí)行步驟304;否則,執(zhí)行步驟305;步驟303、WMCS11與WMCSB21向CA0發(fā)出報警信息;步驟304、用戶通過CA0制訂數據源,利用該數據源對WMCS11與WMCSB21中的配置信息進行更新,然后執(zhí)行步驟306;當通過令牌信息無法確定WMCS11與WMCSB21對配置信息的更新控制權時,可向用戶發(fā)出告警信息,由用戶制定數據源,通過直觀的、圖形化的管理工具實現對WMCS11與WMCSB21中配置信息的強制更新,提高了對集群系統(tǒng)的維護效率。
步驟305、根據預先設定的參數,由令牌號大或小的WMCS11或WMCSB21掌握配置信息的更新控制權,并向另一方發(fā)送配置信息及利用該配置信息對接收方的配置信息進行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息;步驟306、結束。
圖6所示為當令牌更新信息為令牌更新時間信息時,本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的又一實施例的流程圖,該實施例中的步驟1-步驟2與圖4所示實施例相同,步驟3的操作為步驟311、當WMCS11的故障被消除后,WMCS11與WMCSB21建立Socket連接,之后,WMCS11與WMCSB21相互向對方發(fā)送請求信息獲取對方的令牌信息;步驟312、WMCS11與WMCSB21同時對接收到的令牌更新時間信息進行分析,比較該信息中的令牌更新時間是否與自己保存的令牌更新時間信息中的令牌更新時間的大小相等,或者二者的差值是否小于預先規(guī)定的數值例如1分鐘,是,執(zhí)行步驟313;否則,執(zhí)行步驟315;步驟313、WMCS11與WMCSB21向CA0發(fā)出報警信息;步驟314、用戶通過CA0制訂數據源,利用該數據源對WMCS11與WMCSB21中的配置信息進行更新,然后執(zhí)行步驟316;步驟315、根據預先設定的參數,由令牌更新時間晚的即表示該時間的數據大的WMCS11或WMCSB21掌握配置信息的更新控制權,并向另一方發(fā)送配置信息及利用該配置信息對接收方的配置信息進行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息,然后執(zhí)行步驟316;步驟316、結束。
圖7所示為當令牌更新信息包括令牌號信息與令牌更新時間信息時,本發(fā)明保證集群系統(tǒng)中配置信息一致的方法的再一實施例的流程圖,該實施例中的步驟1一步驟3與圖4所示實施例相同,步驟3的操作為步驟321、當WMCS11的故障被消除后,WMCS11與WMCSB21建立Socket連接,之后,WMCS11與WMCSB21相互向對方發(fā)送請求信息獲取對方的令牌信息;步驟322、WMCS11與WMCSB21同時對接收到的令牌更新信息中的權重信息進行分析,判斷是否由令牌號決定更新控制權,是,執(zhí)行步驟323;否則,執(zhí)行步驟325。例如,若事先預定該權重信息為1時,由令牌號決定更新控制權,該權重信息為0時,由令牌更新時間決定更新控制權,則WMCS11與WMCSB21需要判斷權重信息是否為1;步驟323、WMCS11與WMCSB21進一步對接收到的令牌號信息進行分析,比較該信息中的令牌號是否與自己保存的令牌信息中的令牌號相等,否,執(zhí)行步驟324;是,執(zhí)行步驟327;步驟324、根據預先設定的參數,由令牌號大或小的WMCS11或WMCSB21掌握配置信息的更新控制權,并向另一方發(fā)送配置信息及利用該配置信息對接收方的配置信息進行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息,然后執(zhí)行步驟329;步驟325、WMCS11與WMCSB21進一步對接收到的令牌更新時間信息進行分析,比較該信息中的令牌更新時間是否與自己保存的令牌更新時間信息中的令牌更新時間的大小相等,或者二者的差值是否小于預先規(guī)定的數值例如1分鐘,否,執(zhí)行步驟326;是,執(zhí)行步驟327;步驟326、根據預先設定的參數,由令牌更新時間晚的即表示該時間的數據大的WMCS11或WMCSB21掌握配置信息的更新控制權,并向另一方發(fā)送配置信息及利用該配置信息對接收方的配置信息進行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息,然后執(zhí)行步驟329;步驟327、WMCS11與WMCSB21向CA0發(fā)出報警信息;步驟328、用戶通過CA0制訂數據源,利用該數據源對WMCS11與WMCSB21中的配置信息進行更新;步驟329、結束。
在上述各實施例中,通過令牌信息有效確定了配置信息更新控制權,由掌握更新控制權的一方對另一方的配置信息進行更新,進一步保證了配置信息更新的準確性。
另外,為了確保集群系統(tǒng)中配置信息更新的準確性,在圖5-圖7所示的各實施例中WMCS11與WMCSB21對接收到的令牌更新信息進行分析之前,即在步驟301與步驟302之間,或者步驟311與步驟312之間,或者步驟321與步驟322之間,還可以先分析接收到的令牌信息中的令牌組ID是否與自己保存的令牌信息中的令牌組ID相同,在步驟301與步驟302之間該操作具體為WMCS11與WMCSB21對接收到的令牌信息進行分析,比較該信息中的令牌組ID是否與自己保存的令牌信息中的令牌組ID相同,是,則相應執(zhí)行步驟302;否則,執(zhí)行步驟306。在步驟311與步驟312之間,以及步驟321與步驟322之間的操作相同,不再贅述。
通過上述實施例可知,本發(fā)明采用令牌信息保持WMCS與WMCSB中的配置信息的一致性,從而保證了集群系統(tǒng)中的所有WMCA、WMCS與WMCSB中配置信息的一致性與自動同步,提高了配置信息在災難情況下的生存性與可恢復性,增強了系統(tǒng)的可靠性。
最后所應說明的是,以上實施例僅用以說明本發(fā)明的技術方案而非限制,盡管參照較佳實施例對本發(fā)明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發(fā)明的技術方案進行修改或者等同替換,而不脫離本發(fā)明技術方案的精神和范圍。
權利要求
1.一種保證集群系統(tǒng)中配置信息一致的方法,其特征在于,執(zhí)行以下步驟步驟1、集群資源備份管理模塊對集群系統(tǒng)中各節(jié)點服務器的工作情況進行監(jiān)測;步驟2、當節(jié)點服務器中的應用程序信息發(fā)生變化時,更新所述集群資源備份管理模塊中存儲的配置信息,更新該集群資源備份管理模塊中的令牌信息,所述令牌信息用于標識配置信息的更新情況;步驟3、集群資源管理模塊重新啟動后,根據所述的令牌信息更新集群資源管理模塊或集群資源備份管理模塊中的配置信息。
2.根據權利要求1所述的方法,其特征在于,所述步驟1之前還執(zhí)行以下操作在集群資源管理模塊與集群資源備份管理模塊中分別設置初始信息相同的令牌信息,該令牌信息包括令牌組標識信息與令牌更新信息。
3.根據權利要求2所述的方法,其特征在于,所述步驟2中對令牌更新信息進行更新是對令牌號信息進行更新。
4.根據權利要求3所述的方法,其特征在于,所述步驟3包括步驟301、集群資源管理模塊重新啟動后,與集群資源備份管理模塊建立連接,并與該集群資源備份管理模塊相互獲取令牌信息;步驟302、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌號是否與自己保存的令牌信息中的令牌號相等,若相等,執(zhí)行步驟303;否則,執(zhí)行步驟305;步驟303、向所述管理工具發(fā)出報警信息;步驟304、用戶制訂數據源并利用該數據源對所述集群資源管理模塊與所述集群資源備份管理模塊中的配置信息進行更新,然后執(zhí)行步驟306;步驟305、根據預先設定的參數,由令牌號大的或者小的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新;步驟306、結束。
5.根據權利要求4所述的方法,其特征在于,在步驟301與步驟302之間還包括所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的令牌組標識信息進行分析,判斷該令牌組標識信息中的令牌組標識是否與自己保存的令牌信息中的令牌組標識相等,是,則相應執(zhí)行步驟302;否則,執(zhí)行步驟306。
6.根據權利要求4所述的方法,其特征在于,所述步驟305中對對方的配置信息進行更新包括所述集群資源管理模塊或所述集群資源備份管理模塊向對方發(fā)送配置信息及更新請求信息;所述集群資源備份管理模塊或所述集群資源管理模塊利用接收到的配置信息對自己保存的配置信息進行更新。
7.根據權利要求1所述的方法,其特征在于,所述步驟2中對令牌更新信息進行更新是對令牌更新時間信息進行更新。
8.根據權利要求7所述的方法,其特征在于,所述步驟3包括步驟311、集群資源管理模塊重新啟動后,與集群資源備份管理模塊建立連接,并與該集群資源備份管理模塊相互獲取令牌信息;步驟312、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌更新時間與自己保存的令牌信息中的令牌更新時間的大小是否相等,或者二者的差值是否小于預先規(guī)定的數值,是,執(zhí)行步驟313;否則,執(zhí)行步驟315;步驟313、向所述管理工具發(fā)出報警信息;步驟314、用戶制訂數據源并利用該數據源對所述集群資源管理模塊與所述集群資源備份管理模塊中的配置信息進行更新,然后執(zhí)行步驟316;步驟315、由令牌更新時間晚的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新;步驟316、結束。
9.根據權利要求8所述的方法,其特征在于,在步驟311與步驟312之間還包括所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的令牌組標識信息進行分析,判斷該令牌組標識信息中的令牌組標識是否與自己保存的令牌信息中的令牌組標識相等,是,則相應執(zhí)行步驟312;否則,執(zhí)行步驟316。
10.根據權利要求1所述的方法,其特征在于,所述步驟2中對令牌更新信息進行更新是同時對令牌號信息與令牌更新時間信息進行更新。
11.根據權利要求10所述的方法,其特征在于,所述步驟3包括步驟321、集群資源管理模塊重新啟動后,與集群資源備份管理模塊建立連接,并與該集群資源備份管理模塊相互獲取令牌信息;步驟322、所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的權重信息進行分析,判斷是否由令牌號決定更新控制權,是,執(zhí)行步驟323;否則,執(zhí)行步驟325;步驟323、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌號是否與自己保存的令牌信息中的令牌號相等,若不相等,執(zhí)行步驟324;否則,執(zhí)行步驟327;步驟324、根據預先設定的參數,由令牌號大的或者小的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新,然后執(zhí)行步驟329;步驟325、所述集群資源管理模塊與所述集群資源備份管理模塊比較接收到的令牌信息中的令牌更新時間與自己保存的令牌信息中的令牌更新時間的大小是否相等,或者二者的差值是否小于預先規(guī)定的數值,否,執(zhí)行步驟326;是,執(zhí)行步驟327;步驟326、由令牌更新時間晚的集群資源管理模塊或集群資源備份管理模塊對對方的配置信息進行更新,然后執(zhí)行步驟329;步驟327、向所述管理工具發(fā)出報警信息;步驟328、用戶制訂數據源并利用該數據源對所述集群資源管理模塊與所述集群資源備份管理模塊中的配置信息進行更新;步驟329、結束。
12.根據權利要求11所述的方法,其特征在于,在步驟321與步驟322之間還包括所述集群資源管理模塊與所述集群資源備份管理模塊對接收到的令牌信息中的令牌組標識信息進行分析,判斷該令牌組標識信息中的令牌組標識是否與自己保存的令牌信息中的令牌組標識相等,是,則相應執(zhí)行步驟322;否則,執(zhí)行步驟329。
13.根據權利要求1至12中任意一項所述的方法,其特征在于,所述步驟2中更新所述集群資源備份管理模塊中存儲的配置信息具體為所述集群資源備份管理模塊利用變化后的應用程序更新信息更新所述集群資源備份管理模塊中存儲的配置信息。
14.根據權利要求1至12中任意一項所述的方法,其特征在于,還包括更新集群管理代理模塊中的配置信息的操作。
15.根據權利要求14所述的方法,其特征在于,更新集群管理代理模塊中的配置信息的操作具體為集群資源備份管理模塊接收到集群管理代理模塊發(fā)送的連接請求信息時,從該連接請求信息中獲取所述集群管理代理模塊的地址信息,從該集群資源備份管理模塊中存儲的配置信息中提取出與所述地址信息對應的信息,并利用該信息更新所述集群管理代理模塊中的配置信息。
全文摘要
本發(fā)明提供了保證集群系統(tǒng)中配置信息一致的方法,包括集群資源備份管理模塊對集群系統(tǒng)中各節(jié)點服務器的工作情況進行監(jiān)測;當節(jié)點服務器中的應用程序信息發(fā)生變化時,更新所述集群資源備份管理模塊中存儲的配置信息,更新該集群資源備份管理模塊中的令牌信息,所述令牌信息用于標識配置信息的更新情況;集群資源管理模塊重新啟動后,根據所述的令牌信息更新集群資源管理模塊或集群資源備份管理模塊中的配置信息。采用本發(fā)明提供的方法,有效保證了集群系統(tǒng)中各節(jié)點服務器上配置信息的一致性,提高了配置信息在災難情況下的生存性與可恢復性,增強了集群系統(tǒng)的可靠性。
文檔編號G06F11/00GK1874267SQ20061006515
公開日2006年12月6日 申請日期2006年3月21日 優(yōu)先權日2006年3月21日
發(fā)明者黃西華 申請人:華為技術有限公司