欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種云計(jì)算平臺(tái)故障檢測(cè)方法、裝置及解決方法、裝置制造方法

文檔序號(hào):7983784閱讀:358來(lái)源:國(guó)知局
一種云計(jì)算平臺(tái)故障檢測(cè)方法、裝置及解決方法、裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種云計(jì)算平臺(tái)故障檢測(cè)方法、裝置及解決方法、裝置以實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)和解決云計(jì)算平臺(tái)故障的目的,由于本發(fā)明將云計(jì)算平臺(tái)分為各個(gè)檢測(cè)層,通過(guò)檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,將初始檢測(cè)層運(yùn)行狀態(tài)不正常作為進(jìn)入各級(jí)檢測(cè)層的入口,逐級(jí)將下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層進(jìn)行檢測(cè)獲得當(dāng)前檢測(cè)層運(yùn)行狀態(tài),進(jìn)而尋找到運(yùn)行狀態(tài)不正常的最低級(jí)檢測(cè)層,確定最終故障所在檢測(cè)層,實(shí)現(xiàn)了自動(dòng)發(fā)現(xiàn)故障的目的;其次,在故障解決方面,本發(fā)明還通過(guò)判斷故障所在檢測(cè)層,針對(duì)各級(jí)檢測(cè)層問(wèn)題做出不同的解決機(jī)制,盡可能的減少故障時(shí)間,實(shí)現(xiàn)了快速恢復(fù)服務(wù)的目的。
【專利說(shuō)明】—種云計(jì)算平臺(tái)故障檢測(cè)方法、裝置及解決方法、裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及云計(jì)算領(lǐng)域,特別涉及一種云計(jì)算平臺(tái)故障檢測(cè)方法、裝置及解決方法、裝置。
【背景技術(shù)】
[0002]隨著云計(jì)算平臺(tái)服務(wù)器部署規(guī)模越來(lái)越大,機(jī)器數(shù)量越來(lái)越多,及時(shí)發(fā)現(xiàn)并解決虛擬機(jī)故障成為維護(hù)云計(jì)算平臺(tái)服務(wù)的重中之重。
[0003]從故障檢測(cè)方面來(lái)看,目前云計(jì)算平臺(tái)檢測(cè)虛擬機(jī)故障的方法主要以人工發(fā)現(xiàn)為主:當(dāng)用戶使用虛擬機(jī)時(shí)發(fā)現(xiàn)虛擬機(jī)的服務(wù)不成功時(shí),由用戶通知數(shù)據(jù)中心管理員,數(shù)據(jù)中心管理員判斷虛擬機(jī)運(yùn)行于哪一臺(tái)物理機(jī)上,然后檢查物理機(jī)和虛擬機(jī),確定物理機(jī)故障還是虛擬機(jī)故障,當(dāng)管理員確定為虛擬機(jī)故障時(shí),人工檢查配置,確定故障原因,當(dāng)管理員確定為物理機(jī)故障時(shí),人工檢查物理機(jī)故障位置,確定故障原因。但是,人工發(fā)現(xiàn)故障的方法,需要人為的去做故障檢測(cè),耗時(shí)較長(zhǎng),在云計(jì)算平臺(tái)的規(guī)模越來(lái)越大時(shí),會(huì)導(dǎo)致大量的人力和時(shí)間耗費(fèi)在故障的檢測(cè)中,浪費(fèi)寶貴的人力物力。
[0004]目前還有一種故障自動(dòng)檢測(cè)技術(shù),這種檢測(cè)技術(shù)只檢測(cè)服務(wù)是否正常,通過(guò)服務(wù)的檢測(cè)來(lái)獲得故障的機(jī)器并將故障信息報(bào)警至管理員,由管理員檢查故障機(jī)器,確定具體故障原因。這種檢測(cè)技術(shù)在一定程度比人工發(fā)現(xiàn)故障加快了發(fā)現(xiàn)故障的時(shí)間,但是,需要人為判斷故障原因,而在云計(jì)算平臺(tái),很多服務(wù)器故障都是有共通性的,故障的原因往往是幾種相同的問(wèn)題,這就造成很多可確定的故障仍需要人工重復(fù)工作來(lái)發(fā)現(xiàn)。
[0005]從故障解決方面來(lái)看,由于很多服務(wù)器故障都是有共通性的,故障的原因往往是幾種相同的問(wèn)題,同樣造成很多可確定的故障仍需要人工重復(fù)工作來(lái)解決。
[0006]可見(jiàn),人工發(fā)現(xiàn)和人工解決虛擬機(jī)故障處理不僅工作量巨大,也會(huì)由于人工操作時(shí)間過(guò)長(zhǎng)而導(dǎo)致服務(wù)中斷時(shí)間過(guò)長(zhǎng),無(wú)法保證服務(wù)質(zhì)量。

【發(fā)明內(nèi)容】

[0007]有鑒于此,本發(fā)明的主要目的在于提供一種云計(jì)算平臺(tái)故障檢測(cè)方法、裝置及解決方法、裝置以實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)和解決云計(jì)算平臺(tái)故障的目的。
[0008]本發(fā)明提供了一種云計(jì)算平臺(tái)故障檢測(cè)方法,該方法具體包括初始檢測(cè)步驟和下級(jí)檢測(cè)步驟:
[0009]所述初始檢測(cè)步驟包括:
[0010]檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則反饋該初始檢測(cè)層運(yùn)行狀態(tài)正常信息,并結(jié)束流程;否則,確定初始檢測(cè)層的下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層;
[0011 ] 所述下級(jí)檢測(cè)步驟包括:
[0012]獲取當(dāng)前檢測(cè)層的運(yùn)行狀態(tài),判斷當(dāng)前檢測(cè)層運(yùn)行狀態(tài)是否正常;
[0013]如果是,則返回當(dāng)前檢測(cè)層上一級(jí)檢測(cè)層故障的信息,結(jié)束流程;
[0014]如果否,將所述當(dāng)前檢測(cè)層的下一級(jí)檢測(cè)層作為所述當(dāng)前檢測(cè)層,返回所述下級(jí)檢測(cè)步驟,直至檢測(cè)到各級(jí)檢測(cè)層的最低級(jí)一層運(yùn)行狀態(tài)不正常,返回該最低級(jí)一層故障的信息。
[0015]優(yōu)選地,所述初始檢測(cè)層具體為虛擬機(jī)檢測(cè)層;
[0016]所述檢測(cè)虛擬機(jī)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)對(duì)虛擬機(jī)所在宿主物理機(jī)的xend端口訪問(wèn)虛擬機(jī)獲得所述虛擬機(jī)運(yùn)行狀態(tài)。
[0017]優(yōu)選地,所述Hypervisor檢測(cè)層為虛擬機(jī)的下一級(jí)檢測(cè)層;
[0018]所述檢測(cè)Hypervisor檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得Hypervisor檢測(cè)層運(yùn)行狀態(tài):
[0019]判斷所述虛擬機(jī)所在宿主物理機(jī)xend端口是否開(kāi)放;
[0020]如果開(kāi)放,則hypervisor檢測(cè)層運(yùn)行狀態(tài)正常;
[0021]如果不開(kāi)放,則hypervisor檢測(cè)層運(yùn)行狀態(tài)不正常。
[0022]優(yōu)選地,該方法還包括:
[0023]接收來(lái)自于所述虛擬機(jī)所在宿主物理機(jī)硬件相連的傳感器的數(shù)據(jù),如果所述數(shù)據(jù)超過(guò)預(yù)設(shè)安全數(shù)據(jù)范圍,則:
[0024]觸發(fā)所述虛擬機(jī)所在宿主物理機(jī)上的虛擬機(jī)遷移至第二物理機(jī);
[0025]并且,若所述虛擬機(jī)所在宿主物理機(jī)裝載了 Intel的NodeManager,強(qiáng)制將所述虛擬機(jī)所在宿主物理機(jī)的功耗降到最低。
[0026]優(yōu)選地,該方法還包括:
[0027]監(jiān)測(cè)所述虛擬機(jī)所在宿主物理機(jī)CPU負(fù)載,若所述虛擬機(jī)所在宿主物理機(jī)CPU處于負(fù)載超負(fù)荷狀態(tài)且負(fù)載超負(fù)荷狀態(tài)持續(xù)時(shí)間超過(guò)允許時(shí)間,則:
[0028]通過(guò)觸發(fā)所述虛擬機(jī)所在宿主物理機(jī)上的至少一個(gè)虛擬機(jī)遷移至第二物理機(jī)使所述第一物理機(jī)CPU負(fù)載在負(fù)荷范圍之內(nèi)。
[0029]本發(fā)明還提供一種云計(jì)算平臺(tái)故障檢測(cè)裝置,該裝置包括:
[0030]初始檢測(cè)單元:用于檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則反饋該初始檢測(cè)層運(yùn)行狀態(tài)正常信息,并結(jié)束流程;否則,確定初始檢測(cè)層的下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層;
[0031]下級(jí)檢測(cè)單元:用于獲取當(dāng)前檢測(cè)層的運(yùn)行狀態(tài),判斷當(dāng)前檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則返回當(dāng)前檢測(cè)層上一級(jí)檢測(cè)層故障的信息,結(jié)束流程;否則,將所述當(dāng)前檢測(cè)層的下一級(jí)檢測(cè)層作為所述當(dāng)前檢測(cè)層,返回所述下級(jí)檢測(cè)單元,直至檢測(cè)到各級(jí)檢測(cè)層的最低級(jí)一層運(yùn)行狀態(tài)不正常,返回該最低級(jí)一層故障的信息。
[0032]本發(fā)明還提供一種云計(jì)算平臺(tái)故障解決方法,包括:
[0033]獲取應(yīng)用如權(quán)利要求1所述的一種云計(jì)算平臺(tái)故障檢測(cè)方法進(jìn)行檢測(cè)返回的故
障信息;
[0034]根據(jù)所述故障信息,查詢出故障所在檢測(cè)層對(duì)應(yīng)的故障解決指令;
[0035]執(zhí)行故障解決指令。
[0036]優(yōu)選地,當(dāng)故障所在檢測(cè)層具體為虛擬機(jī)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為重新啟動(dòng)虛擬機(jī);
[0037]當(dāng)故障所在檢測(cè)層具體為hypervisor檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟;[0038]當(dāng)故障所在檢測(cè)層具體為硬件檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為通過(guò)IPMI重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)。
[0039]優(yōu)選地,還包括:
[0040]在重新啟動(dòng)虛擬機(jī)之后,通過(guò)虛擬機(jī)xend端口訪問(wèn)虛擬機(jī)判斷所述虛擬機(jī)運(yùn)行狀態(tài)是否正常,若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟虛擬機(jī)次數(shù)范圍,返回虛擬機(jī)故障需人工接入消息;若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)次數(shù)在預(yù)設(shè)允許重啟虛擬機(jī)次數(shù)范圍內(nèi),重新啟動(dòng)虛擬機(jī);
[0041]在對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟之后,通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)xend端口訪問(wèn)判斷hypervisor檢測(cè)層運(yùn)行狀態(tài),若所述hypervisor檢測(cè)層運(yùn)行狀態(tài)仍不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend的次數(shù)大于或等于預(yù)設(shè)允許重啟hypervisor層xend次數(shù)范圍,返回hypervisor層故障需人工介入消息;若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend的次數(shù)在預(yù)設(shè)允許重啟hypervisor層xend次數(shù)范圍內(nèi),對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟;
[0042]在重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)之后,通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)IPMI接口的訪問(wèn)判斷硬件檢測(cè)層運(yùn)行狀態(tài)是否正常,若所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍,返回硬件層故障需人工介入消息;若所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)在預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍內(nèi),重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)。
[0043]本發(fā)明還提供一種云計(jì)算平臺(tái)故障解決裝置,該裝置包括:
[0044]查詢單元:用于獲取應(yīng)用如權(quán)利要求1所述的一種云計(jì)算平臺(tái)故障檢測(cè)方法進(jìn)行檢測(cè)返回的故障信息,根據(jù)所述故障信息,查詢出故障所在檢測(cè)層對(duì)應(yīng)的故障解決指令;
[0045]執(zhí)行單元:用于執(zhí)行故障解決指令。
[0046]可見(jiàn)本發(fā)明具有如下有益效果:
[0047]由于本發(fā)明將云計(jì)算平臺(tái)分為各個(gè)檢測(cè)層,通過(guò)檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,將初始檢測(cè)層運(yùn)行狀態(tài)不正常作為進(jìn)入各級(jí)檢測(cè)層的入口,逐級(jí)將下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層進(jìn)行檢測(cè)獲得當(dāng)前檢測(cè)層運(yùn)行狀態(tài),進(jìn)而尋找到運(yùn)行狀態(tài)不正常的最低級(jí)檢測(cè)層,確定最終故障所在檢測(cè)層,實(shí)現(xiàn)了自動(dòng)發(fā)現(xiàn)故障的目的;
[0048]其次,在故障解決方面,本發(fā)明還通過(guò)判斷故障所在檢測(cè)層,針對(duì)各級(jí)檢測(cè)層問(wèn)題做出不同的解決機(jī)制,盡可能的減少故障時(shí)間,實(shí)現(xiàn)了快速恢復(fù)服務(wù)的目的;
[0049]而且,在故障預(yù)警方面,本發(fā)明還通過(guò)獲取虛擬機(jī)所在宿主物理機(jī)硬件相連的傳感器的數(shù)據(jù),在傳感器數(shù)據(jù)超過(guò)預(yù)設(shè)安全數(shù)據(jù)范圍時(shí),例如硬件主板溫度超過(guò)安全溫度,即散熱系統(tǒng)出現(xiàn)故障時(shí),可第一時(shí)間發(fā)現(xiàn)并降低其使用功耗,延長(zhǎng)服務(wù)時(shí)間,并將虛擬機(jī)遷移至其他物理機(jī)上以保證服務(wù)不間斷。
【專利附圖】

【附圖說(shuō)明】
[0050]圖1是本發(fā)明一種云計(jì)算平臺(tái)故障檢測(cè)方法流程圖;
[0051]圖2是本發(fā)明一種云計(jì)算平臺(tái)故障檢測(cè)裝置組成圖;[0052]圖3是本發(fā)明一種云計(jì)算平臺(tái)故障解決方法流程圖;
[0053]圖4是本發(fā)明一種云計(jì)算平臺(tái)故障解決裝置組成圖。
【具體實(shí)施方式】
[0054]為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明實(shí)施例作進(jìn)一步詳細(xì)的說(shuō)明。
[0055]參見(jiàn)圖1,為本發(fā)明提供了一種云計(jì)算平臺(tái)故障檢測(cè)方法的流程圖,該方法包括:
[0056]S101、初始檢測(cè)步驟,所述初始檢測(cè)步驟包括:檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則反饋該初始檢測(cè)層運(yùn)行狀態(tài)正常信息,并結(jié)束流程;否則,確定初始檢測(cè)層的下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層;
[0057]S102、下級(jí)檢測(cè)步驟,所述下級(jí)檢測(cè)步驟包括:獲取當(dāng)前檢測(cè)層的運(yùn)行狀態(tài),判斷當(dāng)前檢測(cè)層運(yùn)行狀態(tài)是否正常;
[0058]S103、如果是,則返回當(dāng)前檢測(cè)層上一級(jí)檢測(cè)層故障的信息,結(jié)束流程;
[0059]S104、如果否,將所述當(dāng)前檢測(cè)層的下一級(jí)檢測(cè)層作為所述當(dāng)前檢測(cè)層,返回所述下級(jí)檢測(cè)步驟S102,直至檢測(cè)到各級(jí)檢測(cè)層的最低級(jí)一層運(yùn)行狀態(tài)不正常,返回該最低級(jí)
一層故障的信息。
[0060]需要說(shuō)明的是,所述各級(jí)檢測(cè)層具體可以按照各級(jí)檢測(cè)層故障邏輯關(guān)系預(yù)先設(shè)置,下面通過(guò)預(yù)先設(shè)置的各級(jí)檢測(cè)層故障邏輯關(guān)系的幾個(gè)實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明:
[0061]實(shí)施例(一):將虛擬機(jī)作為初始檢測(cè)層:
[0062]在該實(shí)施例中,將虛擬機(jī)作為云計(jì)算平臺(tái)中預(yù)先設(shè)置的各級(jí)檢測(cè)層中的初始檢測(cè)層進(jìn)行檢測(cè);
[0063]所述檢測(cè)虛擬機(jī)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)對(duì)虛擬機(jī)所在宿主物理機(jī)的xend端口訪問(wèn)虛擬機(jī)獲得所述虛擬機(jī)運(yùn)行狀態(tài);
[0064]再具體地,通過(guò)網(wǎng)絡(luò)向虛擬機(jī)所在宿主物理機(jī)發(fā)送查詢虛擬機(jī)運(yùn)行狀態(tài)的命令,通過(guò)xend端口返回虛擬機(jī)所在宿主物理機(jī)上的虛擬機(jī)運(yùn)行狀況,可以借此判定虛擬機(jī)狀態(tài),包括運(yùn)行或者關(guān)機(jī)等狀態(tài)。
[0065]實(shí)施例(二):所述Hypervisor檢測(cè)層為虛擬機(jī)的下一級(jí)檢測(cè)層;
[0066]所述檢測(cè)Hypervisor檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得Hypervisor檢測(cè)層運(yùn)行狀態(tài):
[0067]判斷所述虛擬機(jī)所在宿主物理機(jī)xend端口是否開(kāi)放;
[0068]如果開(kāi)放,則hypervisor檢測(cè)層運(yùn)行狀態(tài)正常;
[0069]如果不開(kāi)放,則hypervisor檢測(cè)層運(yùn)行狀態(tài)不正常。
[0070]實(shí)施例(三):
[0071]在以上實(shí)施例(二)的基礎(chǔ)上,按照hypervisor檢測(cè)層的故障邏輯關(guān)系,將SSH服務(wù)檢測(cè)層做為hypervisor檢測(cè)層的下一級(jí)檢測(cè)層;
[0072]所述檢測(cè)SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài):
[0073]通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)SSH端口進(jìn)行訪問(wèn)判斷SSH服務(wù)是否可用;
[0074]若SSH服務(wù)可用,則SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)正常;[0075]若SSH服務(wù)不可用,則SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)不正常。
[0076]實(shí)施例(四):
[0077]在以上實(shí)施例(三)的基礎(chǔ)上,在SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)不正常時(shí),有可能是SSH服務(wù)本身有故障,也有可能是網(wǎng)絡(luò)故障,按照SSH服務(wù)檢測(cè)層的故障邏輯關(guān)系,在該實(shí)施例中,將網(wǎng)絡(luò)檢測(cè)層作為SSH服務(wù)檢測(cè)層的下一級(jí)檢測(cè)層;
[0078]所述檢測(cè)網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài):
[0079]通過(guò)虛擬機(jī)對(duì)目標(biāo)物理機(jī)進(jìn)行ping的詢問(wèn)判斷網(wǎng)絡(luò)是否連通;
[0080]若網(wǎng)絡(luò)連通,則網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)正常;
[0081 ] 若網(wǎng)絡(luò)不連通,則網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)不正常。
[0082]實(shí)施例(五):
[0083]在以上實(shí)施例(四)的基礎(chǔ)上,在網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)不正常時(shí),有可能是網(wǎng)絡(luò)本身有故障,也有可能是物理機(jī)硬件故障,按照故障邏輯關(guān)系,在該實(shí)施例中,將硬件檢測(cè)層作為網(wǎng)絡(luò)檢測(cè)層的下一級(jí)檢測(cè)層;
[0084]所述硬件檢測(cè)層為所述網(wǎng)絡(luò)檢測(cè)層的下一級(jí)檢測(cè)層;
[0085]所述檢測(cè)硬件檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得硬件檢測(cè)層運(yùn)行狀態(tài):
[0086]通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)IPMI接口訪問(wèn)判斷電源狀態(tài);
[0087]若電源狀態(tài)開(kāi)啟,則所述硬件檢測(cè)層運(yùn)行狀態(tài)正常;
[0088]若電源狀態(tài)關(guān)閉,則所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常。
[0089]通過(guò)以上各實(shí)施例可見(jiàn),本發(fā)明通過(guò)逐級(jí)將下一級(jí)檢測(cè)層作為當(dāng)前級(jí)檢測(cè)層進(jìn)行檢測(cè)獲得當(dāng)前級(jí)檢測(cè)層運(yùn)行狀態(tài),又通過(guò)判斷當(dāng)前級(jí)檢測(cè)層運(yùn)行狀態(tài)是否正常,最終確定故障所在檢測(cè)層,實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)故障的目的。
[0090]而且,在故障預(yù)警方面,本發(fā)明還提出以下兩個(gè)實(shí)施例以實(shí)現(xiàn)對(duì)云計(jì)算中心故障的預(yù)測(cè):
[0091]實(shí)施例(六)基于硬件傳感器的預(yù)警策略
[0092]在該實(shí)施例中,本發(fā)明方法還包括:
[0093]接收來(lái)自于所述虛擬機(jī)所在宿主物理機(jī)硬件相連的傳感器的數(shù)據(jù),如果所述數(shù)據(jù)超過(guò)預(yù)設(shè)安全數(shù)據(jù)范圍,則:
[0094]觸發(fā)所述虛擬機(jī)所在宿主物理機(jī)上的虛擬機(jī)遷移至第二物理機(jī);
[0095]并且,若所述虛擬機(jī)所在宿主物理機(jī)裝載了 Intel的NodeManager,強(qiáng)制將所述虛擬機(jī)所在宿主物理機(jī)的功耗降到最低。
[0096]實(shí)施例(七)基于CPU負(fù)載的預(yù)警策略
[0097]在該實(shí)施例中,本發(fā)明方法還包括:
[0098]監(jiān)測(cè)所述虛擬機(jī)所在宿主物理機(jī)CPU負(fù)載,若所述虛擬機(jī)所在宿主物理機(jī)CPU處于負(fù)載超負(fù)荷狀態(tài)且負(fù)載超負(fù)荷狀態(tài)持續(xù)時(shí)間超過(guò)允許時(shí)間,則:
[0099]通過(guò)觸發(fā)所述虛擬機(jī)所在宿主物理機(jī)上的至少一個(gè)虛擬機(jī)遷移至第二物理機(jī)使所述第一物理機(jī)CPU負(fù)載在負(fù)荷范圍之內(nèi)。
[0100]從以上實(shí)施例(六)、(七)可見(jiàn),本發(fā)明提出的兩種預(yù)警策略能夠在故障發(fā)生之前,及時(shí)的將虛擬機(jī)轉(zhuǎn)移至其他物理機(jī)上,保證服務(wù)的持續(xù)可用性。
[0101]本發(fā)明還提供一種云計(jì)算平臺(tái)故障檢測(cè)裝置,參見(jiàn)圖2,該裝置包括:
[0102]初始檢測(cè)單元201:用于檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則反饋該初始檢測(cè)層運(yùn)行狀態(tài)正常信息,并結(jié)束流程;否則,確定初始檢測(cè)層的下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層;
[0103]下級(jí)檢測(cè)單元202:用于獲取當(dāng)前檢測(cè)層的運(yùn)行狀態(tài),判斷當(dāng)前檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則返回當(dāng)前檢測(cè)層上一級(jí)檢測(cè)層故障的信息,結(jié)束流程;否則,將所述當(dāng)前檢測(cè)層的下一級(jí)檢測(cè)層作為所述當(dāng)前檢測(cè)層,返回所述下級(jí)檢測(cè)單元,直至檢測(cè)到各級(jí)檢測(cè)層的最低級(jí)一層運(yùn)行狀態(tài)不正常,返回該最低級(jí)一層故障的信息。
[0104]由于以上各實(shí)施例返回的故障代碼,對(duì)有針對(duì)性的故障解決提供了有效信息,本發(fā)明針對(duì)不同的故障代碼,還提出了相應(yīng)的故障解決策略,因此,本發(fā)明還提供一種云計(jì)算平臺(tái)故障解決方法,參見(jiàn)圖3,該方法包括:
[0105]S301、獲取應(yīng)用如權(quán)利要求1所述的一種云計(jì)算平臺(tái)故障檢測(cè)方法進(jìn)行檢測(cè)返回的故障信息;
[0106]S302、根據(jù)所述故障信息,查詢出故障所在檢測(cè)層對(duì)應(yīng)的故障解決指令;
[0107]S303、執(zhí)行故障解決指令。
[0108]具體通過(guò)以下幾個(gè)實(shí)施例對(duì)故障所在具體檢測(cè)層對(duì)應(yīng)的故障解決策略進(jìn)行詳細(xì)說(shuō)明:
[0109]實(shí)施例(八):該實(shí)施例采用重啟相關(guān)設(shè)備或者端口實(shí)現(xiàn)故障解決目的,包括:
[0110]當(dāng)故障所在檢測(cè)層具體為虛擬機(jī)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為重新啟動(dòng)虛擬機(jī);
[0111]當(dāng)故障所在檢測(cè)層具體為hypervisor檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟;
[0112]當(dāng)故障所在檢測(cè)層具體為硬件檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為通過(guò)IPMI重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)。
[0113]實(shí)施例(九):在以上實(shí)施例(八)重啟相關(guān)設(shè)備或者端口未解決故障時(shí),該實(shí)施例通過(guò)繼續(xù)重啟相關(guān)設(shè)備或者端口、并預(yù)設(shè)重啟次數(shù)范圍,增加故障解決的機(jī)會(huì),因此,該方法還包括:
[0114]在重新啟動(dòng)虛擬機(jī)之后,通過(guò)虛擬機(jī)xend端口訪問(wèn)虛擬機(jī)判斷所述虛擬機(jī)運(yùn)行狀態(tài)是否正常,若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟虛擬機(jī)次數(shù)范圍,返回虛擬機(jī)故障需人工接入消息;若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)次數(shù)在預(yù)設(shè)允許重啟虛擬機(jī)次數(shù)范圍內(nèi),重新啟動(dòng)虛擬機(jī);
[0115]在對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟之后,通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)xend端口訪問(wèn)判斷hypervisor檢測(cè)層運(yùn)行狀態(tài),若所述hypervisor檢測(cè)層運(yùn)行狀態(tài)仍不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend的次數(shù)大于或等于預(yù)設(shè)允許重啟hypervisor層xend次數(shù)范圍,返回hypervisor層故障需人工介入消息;若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend的次數(shù)在預(yù)設(shè)允許重啟hypervisor層xend次數(shù)范圍內(nèi),對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟;[0116]在重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)之后,通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)IPMI接口的訪問(wèn)判斷硬件檢測(cè)層運(yùn)行狀態(tài)是否正常,若所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍,返回硬件層故障需人工介入消息;若所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)在預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍內(nèi),重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)。
[0117]另外,由于通過(guò)硬件檢測(cè)層故障檢測(cè)可以確定物理機(jī)的狀態(tài),當(dāng)出現(xiàn)硬件檢測(cè)層故障時(shí),故障物理機(jī)上的虛擬機(jī)需要進(jìn)行遷移,遷移時(shí)有兩種可配置的選擇,第一種為遷移到同一服務(wù)器池中的其他物理機(jī)上,并可選擇是否在故障物理機(jī)修復(fù)后遷回;第二種為遷移到指定的備用物理機(jī)上。虛擬機(jī)的遷移順序是由虛擬機(jī)的優(yōu)先級(jí)來(lái)決定的,因此本發(fā)明還包括:
[0118]預(yù)先指定目標(biāo)物理機(jī);
[0119]預(yù)先設(shè)置虛擬機(jī)的優(yōu)先級(jí);
[0120]預(yù)先設(shè)置所述虛擬機(jī)所在宿主物理機(jī)故障修復(fù)后是否遷回;
[0121]當(dāng)所述硬件層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍時(shí),觸發(fā)所述虛擬機(jī)遷移至目標(biāo)物理機(jī),具體按照所述虛擬機(jī)的優(yōu)先級(jí)順序遷移虛擬機(jī)。
[0122]若預(yù)先設(shè)置所述虛擬機(jī)所在宿主物理機(jī)故障修復(fù)后遷回,在所述虛擬機(jī)所在宿主物理機(jī)故障修復(fù)后,將所述虛擬機(jī)由所述目標(biāo)物理機(jī)遷回所述虛擬機(jī)所在宿主物理機(jī)。
[0123]實(shí)施例(十):由于當(dāng)SSH服務(wù)層、網(wǎng)絡(luò)層故障將導(dǎo)致很多服務(wù)的實(shí)效,宿主物理機(jī)上的虛擬機(jī)均為狀態(tài)錯(cuò)誤或不可知狀態(tài),鑒于此種狀態(tài)下錯(cuò)誤有多種可能性,所以,在該實(shí)施例中不能自動(dòng)解決故障,需要向管理員發(fā)送警告,通知其人工介入解決此類(lèi)問(wèn)題,具體為:
[0124]當(dāng)故障所在檢測(cè)層具體為SSH服務(wù)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為返回SSH服務(wù)檢測(cè)層故障需人工介入消息;
[0125]當(dāng)故障所在檢測(cè)層具體為網(wǎng)絡(luò)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為返回網(wǎng)絡(luò)層故障需人工介入消息。
[0126]通過(guò)以上實(shí)施例(八)到(十)可見(jiàn),在故障解決方面,本發(fā)明還通過(guò)判斷故障代碼具體所在檢測(cè)層,針對(duì)不同檢測(cè)層的故障問(wèn)題做出不同的恢復(fù)機(jī)制,盡可能的減少故障時(shí)間,實(shí)現(xiàn)了快速恢復(fù)的目的
[0127]本發(fā)明還提供一種云計(jì)算平臺(tái)故障解決裝置,參見(jiàn)圖4,該裝置包括:
[0128]查詢單元401:用于獲取應(yīng)用如權(quán)利要求1所述的一種云計(jì)算平臺(tái)故障檢測(cè)方法進(jìn)行檢測(cè)返回的故障信息,根據(jù)所述故障信息,查詢出故障所在檢測(cè)層對(duì)應(yīng)的故障解決指令;
[0129]執(zhí)行單元402:用于執(zhí)行故障解決指令。
[0130]需要說(shuō)明的是,在本文中,諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要 素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0131] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種云計(jì)算平臺(tái)故障檢測(cè)方法,其特征在于,包括初始檢測(cè)步驟和下級(jí)檢測(cè)步驟: 所述初始檢測(cè)步驟包括: 檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則反饋該初始檢測(cè)層運(yùn)行狀態(tài)正常信息,并結(jié)束流程;否則,確定初始檢測(cè)層的下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層; 所述下級(jí)檢測(cè)步驟包括: 獲取當(dāng)前檢測(cè)層的運(yùn)行狀態(tài),判斷當(dāng)前檢測(cè)層運(yùn)行狀態(tài)是否正常; 如果是,則返回當(dāng)前檢測(cè)層上一級(jí)檢測(cè)層故障的信息,結(jié)束流程;如果否,將所述當(dāng)前檢測(cè)層的下一級(jí)檢測(cè)層作為所述當(dāng)前檢測(cè)層,返回所述下級(jí)檢測(cè)步驟,直至檢測(cè)到各級(jí)檢測(cè)層的最低級(jí)一層運(yùn)行狀態(tài)不正常,返回該最低級(jí)一層故障的信肩、O
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始檢測(cè)層具體為虛擬機(jī)檢測(cè)層; 所述檢測(cè)虛擬機(jī)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)對(duì)虛擬機(jī)所在宿主物理機(jī)的xend端口訪問(wèn)虛擬機(jī)獲得所述虛擬機(jī)運(yùn)行狀態(tài)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述Hypervisor檢測(cè)層為虛擬機(jī)的下一級(jí)檢測(cè)層; 所述檢測(cè)Hypervisor檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得Hypervisor檢測(cè)層運(yùn)行狀態(tài): 判斷所述虛擬機(jī)所在宿主物理機(jī)xend端口是否開(kāi)放; 如果開(kāi)放,則hypervisor檢測(cè)層運(yùn)行狀態(tài)正常; 如果不開(kāi)放,則hypervisor檢測(cè)層運(yùn)行狀態(tài)不正常。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述SSH服務(wù)檢測(cè)層為所述Hypervisor檢測(cè)層的下一級(jí)檢測(cè)層; 所述檢測(cè)SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)下步驟獲得SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài): 通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)SSH端口進(jìn)行訪問(wèn)判斷SSH服務(wù)是否可用; 若SSH服務(wù)可用,則SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)正常; 若SSH服務(wù)不可用,則SSH服務(wù)檢測(cè)層運(yùn)行狀態(tài)不正常。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述網(wǎng)絡(luò)檢測(cè)層為所述SSH服務(wù)檢測(cè)層的下一級(jí)檢測(cè)層; 所述檢測(cè)網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài): 通過(guò)虛擬機(jī)對(duì)目標(biāo)物理機(jī)進(jìn)行Ping的詢問(wèn)判斷網(wǎng)絡(luò)是否連通; 若網(wǎng)絡(luò)連通,則網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)正常; 若網(wǎng)絡(luò)不連通,則網(wǎng)絡(luò)檢測(cè)層運(yùn)行狀態(tài)不正常。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于, 所述硬件檢測(cè)層為所述網(wǎng)絡(luò)檢測(cè)層的下一級(jí)檢測(cè)層; 所述檢測(cè)硬件檢測(cè)層運(yùn)行狀態(tài)是否正常具體通過(guò)以下步驟獲得硬件檢測(cè)層運(yùn)行狀態(tài): 通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)IPMI接口訪問(wèn)判斷電源狀態(tài);若電源狀態(tài)開(kāi)啟,則所述硬件檢測(cè)層運(yùn)行狀態(tài)正常; 若電源狀態(tài)關(guān)閉,則所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 接收來(lái)自于所述虛擬機(jī)所在宿主物理機(jī)硬件相連的傳感器的數(shù)據(jù),如果所述數(shù)據(jù)超過(guò)預(yù)設(shè)安全數(shù)據(jù)范圍,則: 觸發(fā)所述虛擬機(jī)所在宿主物理機(jī)上的虛擬機(jī)遷移至第二物理機(jī); 并且,若所述虛擬機(jī)所在宿主物理機(jī)裝載了 Intel的NodeManager,強(qiáng)制將所述虛擬機(jī)所在宿主物理機(jī)的功耗降到最低。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 監(jiān)測(cè)所述虛擬機(jī)所在宿主物理機(jī)CPU負(fù)載,若所述虛擬機(jī)所在宿主物理機(jī)CPU處于負(fù)載超負(fù)荷狀態(tài)且負(fù)載超負(fù)荷狀態(tài)持續(xù)時(shí)間超過(guò)允許時(shí)間,則: 通過(guò)觸發(fā)所述虛擬機(jī)所在宿主物理機(jī)上的至少一個(gè)虛擬機(jī)遷移至第二物理機(jī)使所述第一物理機(jī)CPU負(fù)載在負(fù)荷范圍之內(nèi)。
9.一種云計(jì)算平臺(tái)故障檢測(cè)裝置,其特征在于,包括: 初始檢測(cè)單元:用于檢測(cè)初始檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則反饋該初始檢測(cè)層運(yùn)行狀態(tài)正常信息,并結(jié)束流程;否則,確定初始檢測(cè)層的下一級(jí)檢測(cè)層作為當(dāng)前檢測(cè)層;下級(jí)檢測(cè)單元:用于獲取當(dāng)前檢測(cè)層的運(yùn)行狀態(tài),判斷當(dāng)前檢測(cè)層運(yùn)行狀態(tài)是否正常,如果是,則返回當(dāng)前檢測(cè)層上一級(jí)檢測(cè)層故障的信息,結(jié)束流程;否則,將所述當(dāng)前檢測(cè)層的下一級(jí)檢測(cè)層作為所述當(dāng)前檢測(cè)層,返回所述下級(jí)檢測(cè)單元,直至檢測(cè)至預(yù)先設(shè)置的各級(jí)檢測(cè)層的最低級(jí)一層,返回該最低級(jí)一層故障的信息。
10.一種云計(jì)算平臺(tái)故障解決方法,其特征在于,包括: 獲取應(yīng)用如權(quán)利要求1所述的一種云計(jì)算平臺(tái)故障檢測(cè)方法進(jìn)行檢測(cè)返回的故障信息; 根據(jù)所述故障信息,查詢出故障所在檢測(cè)層對(duì)應(yīng)的故障解決指令; 執(zhí)行故障解決指令。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,包括: 當(dāng)故障所在檢測(cè)層具體為虛擬機(jī)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為重新啟動(dòng)虛擬機(jī); 當(dāng)故障所在檢測(cè)層具體為hypervisor檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟; 當(dāng)故障所在檢測(cè)層具體為硬件檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為通過(guò)IPMI重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,還包括: 在重新啟動(dòng)虛擬機(jī)之后,通過(guò)虛擬機(jī)xend端口訪問(wèn)虛擬機(jī)判斷所述虛擬機(jī)運(yùn)行狀態(tài)是否正常,若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟虛擬機(jī)次數(shù)范圍,返回虛擬機(jī)故障需人工接入消息;若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)次數(shù)在預(yù)設(shè)允許重啟虛擬機(jī)次數(shù)范圍內(nèi),重新啟動(dòng)虛擬機(jī); 在對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟之后,通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)xend端口訪問(wèn)判斷hypervisor檢測(cè)層運(yùn)行狀態(tài),若所述hypervisor檢測(cè)層運(yùn)行狀態(tài)仍不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend的次數(shù)大于或等于預(yù)設(shè)允許重啟hypervisor層xend次數(shù)范圍,返回hypervisor層故障需人工介入消息;若所述虛擬機(jī)運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend的次數(shù)在預(yù)設(shè)允許重啟hypervisor層xend次數(shù)范圍內(nèi),對(duì)所述虛擬機(jī)所在宿主物理機(jī)hypervisor層xend重啟; 在重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)之后,通過(guò)對(duì)所述虛擬機(jī)所在宿主物理機(jī)IPMI接口的訪問(wèn)判斷硬件檢測(cè)層運(yùn)行狀態(tài)是否正常,若所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍,返回硬件層故障需人工介入消息;若所述硬件檢測(cè)層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)在預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍內(nèi),重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,還包括: 預(yù)先指定目標(biāo)物理機(jī); 預(yù)先設(shè)置虛擬機(jī)的優(yōu)先級(jí); 預(yù)先設(shè)置所述虛擬機(jī)所在宿主物理機(jī)故障修復(fù)后是否遷回; 當(dāng)所述硬件層運(yùn)行狀態(tài)不正常,且重新啟動(dòng)所述虛擬機(jī)所在宿主物理機(jī)次數(shù)大于或等于預(yù)設(shè)允許重啟物理機(jī)次數(shù)范圍時(shí),觸發(fā)所述虛擬機(jī)遷移至目標(biāo)物理機(jī),具體按照所述虛擬機(jī)的優(yōu)先級(jí)順序遷移虛擬機(jī); 若預(yù)先設(shè)置所述虛擬機(jī)所在宿主物理機(jī)故障修復(fù)后遷回,在所述虛擬機(jī)所在宿主物理機(jī)故障修復(fù)后,將所述虛擬機(jī)由所述目標(biāo)物理機(jī)遷回所述虛擬機(jī)所在宿主物理機(jī)。
14.根據(jù)權(quán)利要求10所述的方法,其特征在于, 當(dāng)故障所在檢測(cè)層具體為SSH服務(wù)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為返回SSH服務(wù)檢測(cè)層故障需人工介入消息; 當(dāng)故障所在檢測(cè)層具體為網(wǎng)絡(luò)檢測(cè)層時(shí),所述查詢出的對(duì)應(yīng)的故障解決指令具體為返回網(wǎng)絡(luò)層故障需人工介入消息。
15.一種云計(jì)算平臺(tái)故障解決裝置,其特征在于,包括: 查詢單元:用于獲取應(yīng)用如權(quán)利要求1所述的一種云計(jì)算平臺(tái)故障檢測(cè)方法進(jìn)行檢測(cè)返回的故障信息,根據(jù)所 述故障信息,查詢出故障所在檢測(cè)層對(duì)應(yīng)的故障解決指令;執(zhí)行單元:用于執(zhí)行故障解決指令。
【文檔編號(hào)】H04L12/24GK103701627SQ201210370060
【公開(kāi)日】2014年4月2日 申請(qǐng)日期:2012年9月27日 優(yōu)先權(quán)日:2012年9月27日
【發(fā)明者】劉宇航 申請(qǐng)人:北京搜狐新媒體信息技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
容城县| 樟树市| 久治县| 平武县| 永登县| 广昌县| 湖北省| 子洲县| 通榆县| 松桃| 息烽县| 团风县| 丹东市| 武定县| 巨野县| 永寿县| 滦平县| 雅安市| 留坝县| 广元市| 大埔县| 古丈县| 资兴市| 肥东县| 汉沽区| 威信县| 栖霞市| 博野县| 夏邑县| 保德县| 韶山市| 海淀区| 长垣县| 普定县| 子洲县| 邵阳县| 库尔勒市| 腾冲县| 永清县| 葵青区| 丹江口市|