t;/CI>
[0095]<CI>Solut1n->Server->SAN Switch</CI>
[0096]<CI>Solut1n->Server->Database->Server->LUN->Storage->SAN
[0097]Switch</CI>
[0098]〈/DependsOn〉
[0099]〈/CIType〉
[0100]根據(jù)上面示例的預(yù)設(shè)關(guān)系設(shè)定,通過遍歷節(jié)點(diǎn)信息存儲(chǔ)模塊中存儲(chǔ)的硬件節(jié)點(diǎn)信息,生成樹形節(jié)點(diǎn)信息數(shù)據(jù)鏈,保存在XML文件中。參照?qǐng)D4,為一種樹形節(jié)點(diǎn)信息數(shù)據(jù)鏈的XML文件示例,系統(tǒng)硬件架構(gòu)圖動(dòng)態(tài)生成模塊將處理好的XML文件,傳入到圖形生成單元中,圖形生成單元根據(jù)傳入的XML文件中列出的節(jié)點(diǎn)信息,生成最終的硬件架構(gòu)圖。
[0101]圖5為依據(jù)圖4的XML文件生成的系統(tǒng)硬件架構(gòu)圖示例。其中,
[0102]節(jié)點(diǎn)MES的平臺(tái)類型為業(yè)務(wù)流程(business-process);節(jié)點(diǎn)FactoryWorks和節(jié)點(diǎn)Tuxedo分別表示業(yè)務(wù)應(yīng)用系統(tǒng),其平臺(tái)類型為解決方案(Solut1n);節(jié)點(diǎn)mes7app0、節(jié)點(diǎn)mes7appl、節(jié)點(diǎn)cim7tuxl、節(jié)點(diǎn)cim7tux2、節(jié)點(diǎn)mes7pdb3的平臺(tái)類型為服務(wù)器(Server);節(jié)點(diǎn)fab7_switchl和節(jié)點(diǎn)fab7_switch2的平臺(tái)類型為以太網(wǎng)交換機(jī)(NetworkSwitch);節(jié)點(diǎn)fab7_sanl和節(jié)點(diǎn)fab7_san2的平臺(tái)類型為SAN交換機(jī)(SAN Switch);節(jié)點(diǎn)uspvm-1和節(jié)點(diǎn)uspvm-2的平臺(tái)類型為存儲(chǔ)設(shè)備(Storage);節(jié)點(diǎn)uspvm-Ι:1和節(jié)點(diǎn)uspvm-1:2分別表示存節(jié)點(diǎn)uspvm-1劃分給主機(jī)的第一邏輯磁盤和第二邏輯磁盤,節(jié)點(diǎn)uspvm-2:1和節(jié)點(diǎn)uspvm-2:2分別表示節(jié)點(diǎn)uspvm-2劃分給主機(jī)的第一邏輯磁盤和第二邏輯磁盤,其平臺(tái)類型為邏輯磁盤(Logical Unit Number, LUN)。節(jié)點(diǎn)mes7db的平臺(tái)類型為數(shù)據(jù)庫(Database);具體應(yīng)用時(shí),冗余信息分析模塊通過依據(jù)對(duì)應(yīng)的檢測策略對(duì)各節(jié)點(diǎn)逐個(gè)進(jìn)行冗余分析,其中,在檢測節(jié)點(diǎn)mes7db時(shí),參照?qǐng)D5,由于節(jié)點(diǎn)mes7db只運(yùn)行在節(jié)點(diǎn)mes7pdb3 一個(gè)主機(jī)上,不滿足數(shù)據(jù)庫冗余檢查的檢測規(guī)則,即數(shù)據(jù)庫是否可以運(yùn)行在兩個(gè)或多個(gè)主機(jī)上,因而判斷存在單點(diǎn)風(fēng)險(xiǎn),需要系統(tǒng)管理員進(jìn)行修復(fù)。
[0103]以上所述僅為本發(fā)明較佳的實(shí)施例,并非因此限制本發(fā)明的實(shí)施方式及保護(hù)范圍,對(duì)于本領(lǐng)域技術(shù)人員而言,應(yīng)當(dāng)能夠意識(shí)到凡運(yùn)用本發(fā)明說明書及圖示內(nèi)容所作出的等同替換和顯而易見的變化所得到的方案,均應(yīng)當(dāng)包含在本發(fā)明的保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,包括以下步驟: 步驟Si,獲取計(jì)算機(jī)集群中的所有節(jié)點(diǎn)信息; 步驟s2,存儲(chǔ)所述節(jié)點(diǎn)信息; 步驟s3,從存儲(chǔ)的所述節(jié)點(diǎn)信息中獲取未檢測的節(jié)點(diǎn),依據(jù)相應(yīng)的檢測策略對(duì)所述節(jié)點(diǎn)進(jìn)行冗余分析并生成一分析結(jié)果; 步驟s4,循環(huán)所述步驟s3直至所有節(jié)點(diǎn)完成冗余分析; 步驟s5,依據(jù)所述分析結(jié)果判斷是否有節(jié)點(diǎn)存在單點(diǎn)風(fēng)險(xiǎn),并生成一檢測結(jié)果。2.根據(jù)權(quán)利要求1所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,步驟s3具體如下: 步驟s31,獲取待檢測節(jié)點(diǎn)的平臺(tái)類型; 步驟s32,獲取與所述平臺(tái)類型對(duì)應(yīng)的檢測策略; 步驟s33,利用檢測策略對(duì)待檢測節(jié)點(diǎn)進(jìn)行冗余信息檢測,并生成分析結(jié)果。3.根據(jù)權(quán)利要求2所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,每一種平臺(tái)類型對(duì)應(yīng)一種檢測策略,每一種檢測策略包括至少一個(gè)檢測規(guī)則;步驟s5中,當(dāng)被檢測節(jié)點(diǎn)不滿足相應(yīng)的檢測策略的任意一個(gè)檢測規(guī)則時(shí),則判斷被檢測節(jié)點(diǎn)存在單點(diǎn)風(fēng)險(xiǎn)。4.根據(jù)權(quán)利要求1所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,在所述步驟s2之后所述步驟s5之前,還包括步驟s6,依據(jù)一預(yù)設(shè)的拓?fù)潢P(guān)系將所述計(jì)算機(jī)集群中的節(jié)點(diǎn)生成一節(jié)點(diǎn)信息數(shù)據(jù)鏈,所述節(jié)點(diǎn)信息數(shù)據(jù)鏈包含的節(jié)點(diǎn)信息通過一圖形生成單元生成系統(tǒng)硬件架構(gòu)圖。5.根據(jù)權(quán)利要求4所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,步驟s6具體如下: 步驟s61,獲取所述節(jié)點(diǎn)的平臺(tái)類型; 步驟s62,獲取與所述平臺(tái)類型對(duì)應(yīng)的拓?fù)潢P(guān)系; 步驟s63,依據(jù)所述拓?fù)潢P(guān)系形成一樹形結(jié)構(gòu)的節(jié)點(diǎn)信息數(shù)據(jù)鏈,保存在一設(shè)定格式的文件中; 步驟s64,所述圖形生成單元獲取所述設(shè)定格式的文件,并依據(jù)所述設(shè)定格式的文件中包含的節(jié)點(diǎn)信息動(dòng)態(tài)生成所述系統(tǒng)硬件架構(gòu)圖。6.根據(jù)權(quán)利要求2所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,所述檢測策略包括系統(tǒng)硬件冗余檢測策略,所述系統(tǒng)硬件冗余檢測策略的檢測規(guī)則包括硬件是否為雙硬盤及硬盤是否做了鏡像,和/或是否是雙電源,和/或雙電源是否連接到不同的不間斷電源。7.根據(jù)權(quán)利要求2所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,所述檢測策略包括網(wǎng)絡(luò)鏈路冗余檢測策略,所述網(wǎng)絡(luò)鏈路冗余檢測策略的檢測規(guī)則包括是否是雙網(wǎng)卡,和/或雙網(wǎng)卡是否連接到了不同網(wǎng)絡(luò)管理設(shè)備上,和/或所連接的網(wǎng)絡(luò)管理設(shè)備是否冗余。8.根據(jù)權(quán)利要求2所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,所述檢測策略包括光纖鏈路冗余檢測策略,所述光纖鏈路冗余檢測策略的檢測規(guī)則包括是否是雙主機(jī)總線適配器卡;和/或雙主機(jī)總線適配器卡是否連接到了不同的光纖管理設(shè)備上;和/或所連接的光纖管理設(shè)備是否冗余。9.根據(jù)權(quán)利要求2所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,所述檢測策略包括業(yè)務(wù)應(yīng)用系統(tǒng)冗余檢測策略,所述業(yè)務(wù)應(yīng)用系統(tǒng)冗余檢測策略的檢測規(guī)則包括核心業(yè)務(wù)應(yīng)用系統(tǒng)是否存在于至少兩個(gè)主機(jī)上。10.根據(jù)權(quán)利要求5所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,其特征在于,所述設(shè)定格式的文件采用可擴(kuò)展標(biāo)記語言格式文件,所述節(jié)點(diǎn)信息數(shù)據(jù)鏈保存在可擴(kuò)展標(biāo)記語言格式文件中。11.一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的系統(tǒng),其特征在于, 包括, 節(jié)點(diǎn)信息收集模塊,用于獲取計(jì)算機(jī)集群中的節(jié)點(diǎn)信息; 節(jié)點(diǎn)信息存儲(chǔ)模塊,與所述節(jié)點(diǎn)信息收集模塊連接,用于存儲(chǔ)所述節(jié)點(diǎn)信息收集模塊收集的節(jié)點(diǎn)信息; 冗余信息分析模塊,與所述節(jié)點(diǎn)信息存儲(chǔ)模塊連接,依據(jù)設(shè)定的檢測策略對(duì)節(jié)點(diǎn)進(jìn)行冗余分析,并生成一分析結(jié)果。12.根據(jù)權(quán)利要求11所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的系統(tǒng),其特征在于,所述冗余信息分析模塊包含一報(bào)表生成單元,用于依據(jù)所述分析結(jié)果生成一冗余信息分析報(bào)表,所述冗余信息分析報(bào)表至少包含所有檢查失敗的節(jié)點(diǎn)名稱和檢查項(xiàng)目。13.根據(jù)權(quán)利要求11所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的系統(tǒng),其特征在于,還包括,系統(tǒng)硬件架構(gòu)信息生成模塊,與所述節(jié)點(diǎn)信息存儲(chǔ)模塊連接,用于依據(jù)計(jì)算機(jī)集群節(jié)點(diǎn)之間預(yù)設(shè)的拓?fù)潢P(guān)系形成一樹形結(jié)構(gòu)的節(jié)點(diǎn)信息數(shù)據(jù)鏈。14.根據(jù)權(quán)利要求13所述的一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的系統(tǒng),其特征在于,還包含一圖形生成單元,所述圖形生成單元與所述系統(tǒng)硬件架構(gòu)信息生成模塊連接,通過獲取所述節(jié)點(diǎn)信息數(shù)據(jù)鏈包含的節(jié)點(diǎn)信息生成系統(tǒng)硬件架構(gòu)圖。
【專利摘要】本發(fā)明涉及集成電路芯片制造技術(shù)領(lǐng)域,具體涉及一種計(jì)算機(jī)集群系統(tǒng)。一種自動(dòng)收集計(jì)算機(jī)集群節(jié)點(diǎn)信息并分析的方法,步驟s1,獲取計(jì)算機(jī)集群中的所有節(jié)點(diǎn)信息;步驟s2,存儲(chǔ)節(jié)點(diǎn)信息;步驟s3,從存儲(chǔ)的節(jié)點(diǎn)信息中獲取未檢測的節(jié)點(diǎn),依據(jù)相應(yīng)的檢測策略對(duì)節(jié)點(diǎn)進(jìn)行冗余分析并生成一分析結(jié)果;步驟s4,循環(huán)步驟s3直至所有節(jié)點(diǎn)完成冗余分析;步驟s5,依據(jù)分析結(jié)果判斷是否有節(jié)點(diǎn)存在單點(diǎn)風(fēng)險(xiǎn),并生成一檢測結(jié)果。本發(fā)明可以有效的降低系統(tǒng)管理員的工作量,避免手工輸入的錯(cuò)誤和遺漏,為集群平臺(tái)的監(jiān)控分析提供數(shù)據(jù)基礎(chǔ),降低集群系統(tǒng)出現(xiàn)單點(diǎn)故障的風(fēng)險(xiǎn),提高系統(tǒng)的可靠性。
【IPC分類】H04L12/24
【公開號(hào)】CN105681070
【申請(qǐng)?zhí)枴?br>【發(fā)明人】劉曉東, 姜宇征, 陳 峰, 李中平
【申請(qǐng)人】中芯國際集成電路制造(天津)有限公司, 中芯國際集成電路制造(上海)有限公司
【公開日】2016年6月15日
【申請(qǐng)日】2014年11月21日