專利名稱:機(jī)群系統(tǒng)運(yùn)行過程監(jiān)控的方法和監(jiān)控管理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)機(jī)群監(jiān)控領(lǐng)域,具體涉及機(jī)群系統(tǒng)全過程監(jiān)控的方法和監(jiān)控管理裝置;更具體涉及監(jiān)控結(jié)點(diǎn)機(jī)POST過程,Linux啟動過程和系統(tǒng)運(yùn)行中健康信息。
在機(jī)群系統(tǒng)中,面對一兩百臺服務(wù)器,甚至上千臺服務(wù)器的情形,如何快速準(zhǔn)確的監(jiān)控結(jié)點(diǎn)的運(yùn)行狀況,是對機(jī)群系統(tǒng)進(jìn)行監(jiān)控和維護(hù)的一個重要而緊迫的問題。機(jī)群的運(yùn)行過程大致可以分為POST過程、OS啟動過程和正常運(yùn)行過程,目前業(yè)界對正常運(yùn)行過程的監(jiān)控已經(jīng)有很好的實(shí)現(xiàn),但是對POST過程和OS啟動過程卻沒有能夠很好的進(jìn)行監(jiān)控。因此,本專利提出了一種機(jī)群系統(tǒng)全過程監(jiān)控的方法和實(shí)現(xiàn),通過這種方式,用戶不但可以監(jiān)控機(jī)群系統(tǒng)正常運(yùn)行時的硬件健康信息,而且可以對機(jī)群的POST過程、OS啟動過程進(jìn)行快速準(zhǔn)確的監(jiān)控。
中國專利申請97192599.2“用于遠(yuǎn)程診斷與維修的擴(kuò)充基本輸入輸出系統(tǒng)”和美國專利5,615,331“System and method fordebugging a computing system(用于調(diào)試計算系統(tǒng)的方法和系統(tǒng))”中公開了一種開機(jī)自檢(POST)和啟動功能包括確定計算機(jī)是否啟動的代碼。當(dāng)啟動失敗時,在擴(kuò)充基本輸入輸出系統(tǒng)中直接與遠(yuǎn)程診斷與維修計算機(jī)建立通信鏈路檢測,以在修復(fù)后重啟計算機(jī)。和直接調(diào)試輸出碼到調(diào)試工具,調(diào)試工具發(fā)送輸出的碼到遠(yuǎn)方的主機(jī)的方法。這些專利申請或?qū)@簧婕坝嬎銠C(jī)POST(Power On Self Test上電自檢)的監(jiān)控和機(jī)群上對結(jié)點(diǎn)LINUX啟動過程的全程監(jiān)控。
為了使監(jiān)控系統(tǒng)能夠完整地監(jiān)控機(jī)群系統(tǒng)的所有運(yùn)行過程和運(yùn)行狀態(tài),對機(jī)群系統(tǒng)的POST過程和OS(Operating System操作系統(tǒng))啟動過程進(jìn)行監(jiān)控,使用戶可以快速及時的了解機(jī)群系統(tǒng)在各種運(yùn)行過程時的狀態(tài),及時處理運(yùn)行中的故障,從而保證機(jī)群系統(tǒng)的正常安全運(yùn)行,因此,希望能可以實(shí)現(xiàn)機(jī)群系統(tǒng)全過程監(jiān)控的方法和裝置。
本發(fā)明提供一種監(jiān)控機(jī)群系統(tǒng)運(yùn)行過程的監(jiān)控管理裝置,包括監(jiān)控主機(jī),通過安裝監(jiān)控管理軟件,實(shí)現(xiàn)人機(jī)接口和控制裝置,用于監(jiān)控所述機(jī)群系統(tǒng)的信息,實(shí)現(xiàn)故障分析、報警和機(jī)群上下電控制;采集裝置,用于采集所述機(jī)群系統(tǒng)各結(jié)點(diǎn)機(jī)的狀態(tài)信息;匯集裝置,用于通過通信網(wǎng)絡(luò)將所述采集裝置采集的狀態(tài)信息匯集,并傳送給所述監(jiān)控主機(jī);其中,所述采集裝置在獲得所述各結(jié)點(diǎn)的上電自檢(POST)的信息和/或操作系統(tǒng)(OS)信息后,將所述POST信息和OS信息通過匯集裝置發(fā)往監(jiān)控主機(jī),以監(jiān)控所述POST過程和OS啟動過程中的狀態(tài)信息。
可選地,所述通信網(wǎng)絡(luò)為485串行網(wǎng)絡(luò)。
優(yōu)選地,所述采集裝置包括存儲器,用于存儲采集的POST碼和OS碼,所述監(jiān)控主機(jī)中的控制裝置包括基本服務(wù)提供者(BSP)裝置,用于控制所述各結(jié)點(diǎn)機(jī),通過中斷獲取所述各結(jié)點(diǎn)機(jī)的所述存儲的POST碼和OS碼,并由所述匯集裝置將所述各結(jié)點(diǎn)機(jī)的所述存儲的POST碼和OS碼匯集后存儲于所述監(jiān)控主機(jī)中數(shù)據(jù)存儲裝置。
可選地,所述控制裝置還包括POST判斷裝置,用于判斷是否采集POST碼過程已完成,以在完成采集POST碼后通過所述BSP控制采集OS碼,在未完成時向所述BSP報告POST碼的狀態(tài);和OS判斷裝置,用于判斷是否采集OS碼過程已完成,完成時所述機(jī)群進(jìn)入正常工作過程,未完成時向所述BSP報告OS碼的狀態(tài)。
本發(fā)明還提供一種監(jiān)控機(jī)群系統(tǒng)運(yùn)行過程的方法,包括步驟設(shè)置是否要檢測POST過程和/或OS過程;如果要檢測POST過程上電所述機(jī)群系統(tǒng)的需要上電的結(jié)點(diǎn)機(jī),啟動所述上電的結(jié)點(diǎn)機(jī)的POST過程;采集裝置獲取所述POST過程中的狀態(tài)碼并存儲之;BSP發(fā)出收集POST命令,收集采集卡存儲的POST碼;根據(jù)所述POST碼,確定系統(tǒng)的上電過程是否正常;完成所述POST檢測過程后要檢測OS過程采集卡獲取并分析所述OS的啟動過程的狀態(tài)信息碼;BSP發(fā)出收集OS碼命令,收集采集卡存儲的OS碼;BSP根據(jù)所述OS碼,確定啟動所述OS過程是否正常;如果不要檢測POST過程和OS過程,執(zhí)行正常的開機(jī)過程。
可選地,所述獲取所述POST過程中的狀態(tài)碼的步驟還包括確定POST過程的狀態(tài),根據(jù)預(yù)定規(guī)則編碼所述狀態(tài)的狀態(tài)碼。
優(yōu)選地,所述獲取并分析所述OS的啟動過程的狀態(tài)信息碼的步驟還包括確定OS啟動所處的階段,根據(jù)預(yù)定規(guī)則編碼代表該階段的碼。
可選地,方法還包括步驟傳送各結(jié)點(diǎn)的所述獲取的OS碼或POST碼到匯集裝置,以將其在匯集裝置中匯集。
優(yōu)選地,所述獲取POST狀態(tài)碼的步驟包括采集卡收集POST狀態(tài)碼,并執(zhí)行BSP收集POST狀態(tài)碼命令,通過第一串行接口發(fā)送POST狀態(tài)碼到BSP;所述獲取OS的啟動過程的狀態(tài)信息碼的步驟包括采集卡收集OS碼,并執(zhí)行BSP收集OS碼命令,通過第一串行接口發(fā)送OS碼到BSP;
可選地,所述通過第一串行接口發(fā)送采集裝置采集的POST狀態(tài)數(shù)據(jù)的步驟包括當(dāng)BSP發(fā)出命令后,由匯集卡轉(zhuǎn)發(fā)至采集卡,采集卡收到匯集卡發(fā)送來的命令后,發(fā)出所述第一串口的中斷請求;進(jìn)入所述中斷,接收控制裝置的命令,如果是收集POST碼命令,發(fā)送POST碼;如果是收集OS碼命令,發(fā)送OS碼;如果不是收集POST碼命令和收集OS碼命令,記錄所述接收的命令,結(jié)束中斷,返回。
優(yōu)選地,所述通過第二串行接口讀取采集裝置采集的OS狀態(tài)數(shù)據(jù)的步驟包括啟動所述第二串行接口中斷,接收所述第一串口的數(shù)據(jù),以確定OS啟動碼;存儲所述OS啟動碼;結(jié)束中斷,返回。
可選地,所述確定系統(tǒng)的上電過程是否正常的步驟包括在不正常時,傳送POST碼給控制裝置;所述確定啟動所述OS過程是否正常的步驟包括在不正常時,傳送OS碼給控制裝置。
利用本發(fā)明,使監(jiān)控系統(tǒng)能夠完整地監(jiān)控機(jī)群系統(tǒng)的所有運(yùn)行過程和運(yùn)行狀態(tài),特別對機(jī)群系統(tǒng)的POST過程和OS啟動過程進(jìn)行監(jiān)控,使用戶可以快速及時的了解機(jī)群系統(tǒng)在各種運(yùn)行過程時的狀態(tài),及時處理運(yùn)行中的故障,從而保證機(jī)群系統(tǒng)的正常安全運(yùn)行。
圖2描繪了本發(fā)明實(shí)施例的機(jī)群系統(tǒng)全過程監(jiān)控方法的流程圖;圖3描繪了本發(fā)明實(shí)施例的機(jī)群系統(tǒng)全過程監(jiān)控方法中采集卡的流程圖,其中,(A)為串口2中斷處理流程圖,(B)為串口1中斷處理流程圖。
為了便于本領(lǐng)域一般技術(shù)人員理解和實(shí)現(xiàn)本發(fā)明,現(xiàn)結(jié)合附圖描繪本發(fā)明的實(shí)施例。
首先參照
圖1,圖1示出了本發(fā)明的機(jī)群監(jiān)控系統(tǒng)的原理框圖。結(jié)合該原理圖描繪實(shí)現(xiàn)監(jiān)控各運(yùn)行過程的方法機(jī)群系統(tǒng)的POST過程監(jiān)控如下。機(jī)群系統(tǒng)POST過程開始后,安裝在每個結(jié)點(diǎn)內(nèi)部的采集卡即通過80端口(未示出)實(shí)時的獲取每個結(jié)點(diǎn)的POST碼,并存放于采集卡的緩存區(qū)中,然后通過串行總線發(fā)送到機(jī)柜的監(jiān)控系統(tǒng)匯集裝置匯集卡,由匯集卡將機(jī)柜內(nèi)所有結(jié)點(diǎn)的POST信息匯總后發(fā)送給機(jī)群系統(tǒng)的控制臺??刂婆_統(tǒng)一分析處理這些POST碼,并通過進(jìn)度條的方式顯示機(jī)群系統(tǒng)中所有結(jié)點(diǎn)的POST過程進(jìn)度。如果某個結(jié)點(diǎn)的POST過程停止了,則可以通過界面看出停止前的POST碼,通過POST碼即可確定問題所在,從而提示用戶解決。
機(jī)群系統(tǒng)的OS啟動過程監(jiān)控方法如下。由于Linux OS下可以將啟動過程的輸出重定向到串口輸出,這樣置于結(jié)點(diǎn)內(nèi)的采集卡即可通過串口獲取結(jié)點(diǎn)OS啟動的信息。采集卡通過判斷獲取的POST碼為0xff可知POST過程結(jié)束,OS啟動過程開始,即通過串口獲取OS的啟動信息并進(jìn)行分析,判斷OS啟動處于哪個階段,并將階段對應(yīng)的代碼通過串行總線發(fā)送匯集卡,由匯集卡將機(jī)柜內(nèi)所有結(jié)點(diǎn)的OS啟動階段代碼匯總后發(fā)送給機(jī)群系統(tǒng)的控制臺??刂婆_統(tǒng)一分析處理這些代碼,并通過進(jìn)度條的方式顯示機(jī)群系統(tǒng)中所有結(jié)點(diǎn)的OS啟動過程進(jìn)度。
機(jī)群系統(tǒng)正常運(yùn)行后,置于每個結(jié)點(diǎn)內(nèi)的采集卡定時從主板采集結(jié)點(diǎn)的各種硬件健康信息,并通過串行總線最終發(fā)送到控制臺,控制臺將這些信息分析處理以圖形界面方式顯示。
下面以實(shí)際的一個機(jī)群系統(tǒng)為例進(jìn)行進(jìn)一步說明。
該機(jī)群系統(tǒng)有8個結(jié)點(diǎn),1個監(jiān)控主機(jī)(控制臺)都置于1個機(jī)柜中。結(jié)點(diǎn)內(nèi)部都安裝有采集卡,機(jī)柜底部安裝有電源箱,電源箱內(nèi)有匯集卡1塊。采集卡,匯集卡和監(jiān)控主機(jī)通過485串行網(wǎng)絡(luò)連接。機(jī)群系統(tǒng)POST過程、Linux啟動過程和系統(tǒng)正常運(yùn)行過程中硬件信息的監(jiān)控都是通過485串行網(wǎng)絡(luò)來實(shí)現(xiàn)的。
首先,啟動監(jiān)控主機(jī),從監(jiān)控系統(tǒng)界面中可以選擇對機(jī)群系統(tǒng)的上/下電,根據(jù)系統(tǒng)提示選擇機(jī)系統(tǒng)中需要上電的結(jié)點(diǎn),即可實(shí)現(xiàn)機(jī)群系統(tǒng)的上電。以選擇所有8個結(jié)點(diǎn)上電為例,系統(tǒng)選擇8個結(jié)點(diǎn)上電后,運(yùn)行在監(jiān)控主機(jī)端的監(jiān)控程序BSP模塊即通過485串行通信網(wǎng)絡(luò)通過通信協(xié)議和命令發(fā)送對8個結(jié)點(diǎn)機(jī)的開機(jī)命令,采集卡接收到開機(jī)命令后對結(jié)點(diǎn)機(jī)進(jìn)行開機(jī),同時從80端口(IO端口,地址為0x080)讀取POST碼進(jìn)行保存。BSP模塊執(zhí)行完開機(jī)命令后,立即執(zhí)行收集POST碼命令,采集卡即將緩沖區(qū)中保存的POST碼發(fā)送給BSP,BSP輪循各采集卡獲取POST碼并進(jìn)行分析,并插入數(shù)據(jù)庫中,GCM則訪問數(shù)據(jù)庫根據(jù)規(guī)則在界面顯示各個結(jié)點(diǎn)POST過程進(jìn)度。當(dāng)BSP分析到采集卡獲取的POST碼為0xff后,可知POST過程結(jié)束,并發(fā)命令開始收集Linux啟動過程的代碼。采集卡發(fā)現(xiàn)獲取的POST碼為0xff后,即使能采集卡與主板相連的串口,開始收集Linux啟動過程信息,并按照規(guī)則進(jìn)行分析,確定Linux啟動過程的幾個階段,形成Linux啟動過程階段代碼,并保存,當(dāng)BSP發(fā)送收集Linux啟動過程的代碼命令給采集卡后,采集卡即將啟動過程的階段代碼發(fā)送給BSP。同樣,BSP收集此代碼,并分析插入數(shù)據(jù)庫,GCM則訪問數(shù)據(jù)庫根據(jù)規(guī)則在界面顯示各個結(jié)點(diǎn)Linux啟動過程進(jìn)度。
雖然本發(fā)明的實(shí)施例中,POST碼和OS碼是不斷傳送給監(jiān)控主機(jī)的,實(shí)際上也可以在出現(xiàn)故障時才傳送POST碼或OS碼,這時,需要POST判斷裝置,用于判斷是否采集POST碼過程已完成,以在完成采集POST碼后通過BSP控制采集OS碼,在未完成時向BSP報告POST碼的狀態(tài);和OS判斷裝置,用于判斷是否采集OS碼過程已完成,完成時所述機(jī)群進(jìn)入正常工作過程,未完成時向所述BSP報告OS碼的狀態(tài)。
圖2和圖3描述了安裝在結(jié)點(diǎn)機(jī)內(nèi)部的采集卡軟件工作原理,通過描述其在獲取POST碼和Linux啟動過程的工作原理,基本就可以了解整個系統(tǒng)的工作原理。
首先,監(jiān)控主機(jī)選擇的結(jié)點(diǎn)上電,運(yùn)行在監(jiān)控主機(jī)端的監(jiān)控程序BSP模塊即通過485串行通信網(wǎng)絡(luò)通過通信協(xié)議和命令發(fā)送到結(jié)點(diǎn)機(jī)內(nèi)部的采集卡,由采集卡執(zhí)行開機(jī)命令。(未示出)在步驟210,判斷是否有監(jiān)控命令,如果沒有,在步驟215,判斷是否要獲取POST碼?如果要獲取,進(jìn)入步驟218,收集POST碼并緩存,然后,進(jìn)入步驟220,判斷是否需要搜集Linux階段碼。
如果在步驟215判斷不要獲取POST碼,直接進(jìn)入步驟220,判斷是否要獲取Linux階段碼?如果需要,進(jìn)入步驟225,啟動串口2信息采集,具體的采集過程參照圖3(A);然后,跳轉(zhuǎn)進(jìn)入201步驟。如果不需要,直接跳轉(zhuǎn)進(jìn)入201步驟。
如果在步驟210判斷有監(jiān)控命令,進(jìn)入步驟228,開始判斷是什么命令,同時執(zhí)行對應(yīng)的命令子程序。例如,如果是開機(jī)命令,則執(zhí)行結(jié)點(diǎn)機(jī)開機(jī)操作。如果不是開機(jī)命令,則判斷是否其它命令,所有的命令判斷完畢后,則跳轉(zhuǎn)到201步驟。
應(yīng)該知道,傳送POST和OS碼的步驟可以在出現(xiàn)這些碼時就傳送,不論其是否正確,也可以在POST過程或OS啟動過程中出現(xiàn)問題時才將這些碼傳送給監(jiān)控主機(jī)。因此,本發(fā)明還可包括步驟判斷POST與OS過程是否正常,及在POST過程不正常時,傳送POST碼給BSP;在OS啟動過程不正常時,傳送OS碼給BSP;在它們都正常時,系統(tǒng)不傳送POST碼和OS碼。因此,所附的權(quán)利要求包括這些變化和其等效變化。
圖3描繪了本發(fā)明實(shí)施例的機(jī)群系統(tǒng)全過程監(jiān)控方法中采集卡的流程圖,其中,(A)為串口2中斷處理流程圖,(B)為串口1中斷處理流程圖。
對于圖3(A),如果結(jié)點(diǎn)機(jī)在啟動的過程中,則需要采集Linux的啟動過程,POST碼采集完成后,即啟動串口2,開始采集Linux啟動過程。進(jìn)入串口2中斷后,先執(zhí)行步驟301,接收串口1數(shù)據(jù)并分析以確定Linux啟動碼,然后執(zhí)行步驟302,將Linux啟動碼緩存,處理結(jié)束后返回被中斷的主程序,繼續(xù)執(zhí)行主程序。
對于圖3(B),采集卡是通過串口1來收集BSP發(fā)送來的命令的,有些命令在串口1中斷服務(wù)程序中執(zhí)行,有些命令只是記錄命令碼,在主程序中執(zhí)行。其中收集POST碼命令的收集是在主程序總進(jìn)行,Linux啟動碼收集命令是在串口1中斷服務(wù)程序中執(zhí)行的。當(dāng)BSP發(fā)出命令后,由匯集卡轉(zhuǎn)發(fā)至采集卡,采集卡收到匯集卡發(fā)送來的命令后,即進(jìn)入串口1中斷后,執(zhí)行步驟401,分析并接收匯集卡發(fā)送來的命令,然后進(jìn)入步驟402,判斷是否收集POST碼命令,如果是則執(zhí)行步驟501,發(fā)送POST碼到匯集卡,如果不是,這進(jìn)入步驟403,判斷是否收集Linux啟動碼命令,如果是則執(zhí)行步驟502,發(fā)送Linux啟動碼到匯集卡,如果不是,則進(jìn)入步驟404,判斷是否其它命令,如果是則執(zhí)行步驟503,記錄命令碼(中斷跳出后在主程序中執(zhí)行這些命令),如果不是,則中斷返回。返回被中斷的主程序,繼續(xù)執(zhí)行主程序。
在一個機(jī)群中,遠(yuǎn)程控制端可以可以實(shí)現(xiàn)對任何一個結(jié)點(diǎn)機(jī)LINUX操作系統(tǒng)啟動過程進(jìn)行全部監(jiān)控,如果啟動過程中結(jié)點(diǎn)機(jī)存在問題則可以進(jìn)行方便的故障定位。
采用的方法是修改結(jié)點(diǎn)機(jī)的BIOS重定向和修改LINUX的部分內(nèi)核,使得在啟動過程中能夠?qū)有畔拇谳敵觯瑥拇诘男畔⑥D(zhuǎn)換成485通信,送到主控機(jī)。
同時可以獲取結(jié)點(diǎn)機(jī)的POST代碼進(jìn)行啟動過程和錯誤的定位。獲取結(jié)點(diǎn)機(jī)的POST配置信息存在兩種方法從PCI上讀取80H端口的POST代碼,可以通過分析代碼獲得計算機(jī)啟動自檢的進(jìn)程;另一種方法是通過計算機(jī)系統(tǒng)的BIOS設(shè)置從串口將系統(tǒng)啟動過程中的配置信息輸出。第一種方法從80H端口獲取代碼都是主板廠家公認(rèn)的業(yè)界標(biāo)準(zhǔn),第二種方法也是主板廠家BIOS設(shè)置的一項功能。
雖然通過實(shí)施例描繪了本發(fā)明,本領(lǐng)域普通技術(shù)人員知道,本發(fā)明有許多變形和變化而不脫離本發(fā)明的精神,希望所附的權(quán)利要求包括這些變形和變化而不脫離本發(fā)明的精神。
權(quán)利要求
1.一種監(jiān)控機(jī)群系統(tǒng)運(yùn)行過程的監(jiān)控管理裝置,包括監(jiān)控主機(jī),通過安裝監(jiān)控管理軟件,實(shí)現(xiàn)人機(jī)接口和控制裝置,用于監(jiān)控所述機(jī)群系統(tǒng)的信息,實(shí)現(xiàn)故障分析、報警和機(jī)群上下電控制;采集裝置,用于采集所述機(jī)群系統(tǒng)各結(jié)點(diǎn)機(jī)的狀態(tài)信息;匯集裝置,用于通過通信網(wǎng)絡(luò)將所述采集裝置采集的狀態(tài)信息匯集,并傳送給所述監(jiān)控主機(jī);其中,所述采集裝置在獲得所述各結(jié)點(diǎn)的上電自檢(POST)的信息和/或操作系統(tǒng)(OS)信息后,將所述POST信息和OS信息通過匯集裝置發(fā)往監(jiān)控主機(jī),以監(jiān)控所述POST過程和OS啟動過程中的狀態(tài)信息。
2.如權(quán)利要求1所述的裝置,其中,所述通信網(wǎng)絡(luò)為485串行網(wǎng)絡(luò)。
3.如權(quán)利要求1所述的裝置,其中,所述采集裝置包括存儲器,用于存儲采集的POST碼和OS碼,所述監(jiān)控主機(jī)中的控制裝置包括基本服務(wù)提供者(BSP)裝置,用于控制所述各結(jié)點(diǎn)機(jī),通過中斷獲取所述各結(jié)點(diǎn)機(jī)的所述存儲的POST碼和OS碼,并由所述匯集裝置將所述各結(jié)點(diǎn)機(jī)的所述存儲的POST碼和OS碼匯集后存儲于所述監(jiān)控主機(jī)中數(shù)據(jù)存儲裝置。
4.如權(quán)利要求1所述的裝置,其中,所述控制裝置還包括POST判斷裝置,用于判斷是否采集POST碼過程已完成,以在完成采集POST碼后通過所述BSP控制采集OS碼,在未完成時向所述BSP報告POST碼的狀態(tài);和OS判斷裝置,用于判斷是否采集OS碼過程已完成,完成時所述機(jī)群進(jìn)入正常工作過程,未完成時向所述BSP報告OS碼的狀態(tài)。
5.一種監(jiān)控機(jī)群系統(tǒng)運(yùn)行過程的方法,包括步驟設(shè)置是否要檢測POST過程和/或OS過程;如果要檢測POST過程上電所述機(jī)群系統(tǒng)的需要上電的結(jié)點(diǎn)機(jī),啟動所述上電的結(jié)點(diǎn)機(jī)的POST過程;采集裝置獲取所述POST過程中的狀態(tài)碼并存儲之;BSP發(fā)出收集POST命令,收集采集卡存儲的POST碼;根據(jù)所述POST碼,確定系統(tǒng)的上電過程是否正常;完成所述POST檢測過程后要檢測OS過程采集卡獲取并分析所述OS的啟動過程的狀態(tài)信息碼;BSP發(fā)出收集OS碼命令,收集采集卡存儲的OS碼;BSP根據(jù)所述OS碼,確定啟動所述OS過程是否正常;如果不要檢測POST過程和OS過程,執(zhí)行正常的開機(jī)過程。
6.如權(quán)利要求5所述的方法,其中,所述獲取所述POST過程中的狀態(tài)碼的步驟還包括確定POST過程的狀態(tài),根據(jù)預(yù)定規(guī)則編碼所述狀態(tài)的狀態(tài)碼。
7.如權(quán)利要求5所述的方法,其中,所述獲取并分析所述OS的啟動過程的狀態(tài)信息碼的步驟還包括確定OS啟動所處的階段,根據(jù)預(yù)定規(guī)則編碼代表該階段的碼。
8.如權(quán)利要求7所述的方法,其中,還包括步驟傳送各結(jié)點(diǎn)的所述獲取的OS碼或POST碼到匯集裝置,以將其在匯集裝置中匯集。
9.如權(quán)利要求5所述的方法,其中,所述獲取POST狀態(tài)碼的步驟包括采集卡收集POST狀態(tài)碼,并執(zhí)行BSP收集POST狀態(tài)碼命令,通過第一串行接口發(fā)送POST狀態(tài)碼到BSP;所述獲取OS的啟動過程的狀態(tài)信息碼的步驟包括采集卡收集OS碼,并執(zhí)行BSP收集OS碼命令,通過第一串行接口發(fā)送OS碼到BSP;
10.如權(quán)利要求9所述的方法,所述通過第一串行接口發(fā)送采集裝置采集的POST狀態(tài)數(shù)據(jù)的步驟包括當(dāng)BSP發(fā)出命令后,由匯集卡轉(zhuǎn)發(fā)至采集卡,采集卡收到匯集卡發(fā)送來的命令后,發(fā)出所述第一串口的中斷請求;進(jìn)入所述中斷,接收控制裝置的命令,如果是收集POST碼命令,發(fā)送POST碼;如果是收集OS碼命令,發(fā)送OS碼;如果不是收集POST碼命令和收集OS碼命令,記錄所述接收的命令,結(jié)束中斷,返回。
11.如權(quán)利要求10所述的方法,其中,所述通過第二串行接口讀取采集裝置采集的OS狀態(tài)數(shù)據(jù)的步驟包括啟動所述第二串行接口中斷,接收所述第一串口的數(shù)據(jù),以確定OS啟動碼;存儲所述OS啟動碼;結(jié)束中斷,返回。
12.如權(quán)利要求5所述的方法,其中,所述確定系統(tǒng)的上電過程是否正常的步驟包括在不正常時,傳送POST碼給控制裝置;所述確定啟動所述OS過程是否正常的步驟包括在不正常時,傳送OS碼給控制裝置。
全文摘要
本發(fā)明提供了一種監(jiān)控機(jī)群系統(tǒng)運(yùn)行過程的監(jiān)控管理裝置和方法。裝置包括監(jiān)控主機(jī),通過安裝監(jiān)控管理軟件,實(shí)現(xiàn)人機(jī)接口和控制裝置,用于監(jiān)控所述機(jī)群系統(tǒng)的信息,實(shí)現(xiàn)故障分析、報警和機(jī)群上下電控制;采集裝置,用于采集所述機(jī)群系統(tǒng)各結(jié)點(diǎn)機(jī)的狀態(tài)信息;匯集裝置,用于通過通信網(wǎng)絡(luò)將所述采集裝置采集的狀態(tài)信息匯集,并傳送給所述監(jiān)控主機(jī)。利用本發(fā)明,使監(jiān)控系統(tǒng)能夠完整地監(jiān)控機(jī)群系統(tǒng)的所有運(yùn)行過程和運(yùn)行狀態(tài)。
文檔編號G06F9/44GK1475911SQ0314628
公開日2004年2月18日 申請日期2003年7月8日 優(yōu)先權(quán)日2003年7月8日
發(fā)明者程菊生, 崔吉順, 彭濤, 田宏萍, 金正操, 蔣曉華 申請人:聯(lián)想(北京)有限公司