專利名稱:一種服務(wù)器內(nèi)存故障報警方法
一種服務(wù)器內(nèi)存故障報警方法
背景技術(shù):
當前服務(wù)器系統(tǒng)中,現(xiàn)有技術(shù)只通過內(nèi)存部件觸發(fā)硬件故障電路信號,通過板載的LED進行故障指示,此類設(shè)計存在以下不足
1、故障信息無法記錄,一旦系統(tǒng)斷電,本次開機發(fā)現(xiàn)的故障信息將會被清除;
2、系統(tǒng)能識別的故障種類有限僅支持內(nèi)存部件自身可檢測的簡單錯誤信息,例如內(nèi)存溫度過高、Eiror IO記錄數(shù)量過高。但對于例如內(nèi)存芯片產(chǎn)生故障、內(nèi)存安裝錯誤這類內(nèi)存部件自身無法檢測或報告的錯誤信息,服務(wù)器系統(tǒng)無法產(chǎn)生報警信息;
3、無法根據(jù)故障嚴重程度分級別進行報警。
發(fā)明內(nèi)容
通過軟件程序在服務(wù)器系統(tǒng)啟動階段識別內(nèi)存錯誤信息,將信息傳遞給內(nèi)嵌主板上的管理芯片進行分類判斷并按級別報警,系統(tǒng)包括故障信息識別單元(I)、錯誤信息數(shù)據(jù)庫(2)、報警單元(3),其中
故障信息識別單元(I)負責(zé)通過獲取系統(tǒng)中內(nèi)存部件發(fā)出的錯誤信息作為判斷內(nèi)存故障的依據(jù);
錯誤信息數(shù)據(jù)庫(2)負責(zé)收集傳遞內(nèi)存錯誤信息;
報警單元(3)負責(zé)根據(jù)不同的錯誤信息判斷選擇不同的故障報警方式;
報警流程如下
系統(tǒng)上電,檢測錯誤信息庫中是否存在歷史錯誤,并檢測故障是否仍存在,其中
1)故障存在,把錯誤信息分類為不同的故障,根據(jù)不同的故障按照故障級別以不同的方式進行報警;
2)如果故障不存在,檢測本次開機是否內(nèi)存發(fā)錯誤信息,a)內(nèi)存發(fā)錯誤信息,錯誤信息被記錄到錯誤信息數(shù)據(jù)庫,把錯誤信息分類為不同的故障,根據(jù)不同的故障進行報警;b) 不存在內(nèi)存發(fā)錯誤信息,清除錯誤信息數(shù)據(jù)庫中的歷史數(shù)據(jù)。本發(fā)明的優(yōu)異效果是報警單元以軟件進程形式包含在BMC中的監(jiān)控程序中,可根據(jù)錯誤信息數(shù)據(jù)庫記錄的錯誤數(shù)據(jù)進行故障報警分類,通過Debug數(shù)碼燈、LED燈或者蜂鳴器,根據(jù)不同級別的錯誤嚴重程度進行分類報警。在服務(wù)器系統(tǒng)中實施此類內(nèi)存故障報警方法,可很大程度上可以提高系統(tǒng)的可靠性功能,方便維護,提升產(chǎn)品的整體形象。
圖I是本發(fā)明的報警流程圖。
具體實施例方式參照附圖對本發(fā)明的報警方法做以下詳細的說明。本發(fā)明的方法是將故障信息識別單元以軟件進程形式包含在BIOS中,在系統(tǒng)啟動時查詢錯誤信息數(shù)據(jù)庫的歷史錯誤信息及本次開機時是否存在內(nèi)存錯誤信息。通過故障信息識別單元的軟件檢測,不僅可以識別出(1)內(nèi)存部件自身發(fā)出硬件故障電路信號,還可以檢測出(2)內(nèi)存芯片產(chǎn)生故障、內(nèi)存安裝錯誤此類內(nèi)存部件自身無法觸發(fā)的錯誤信息;故障信息識別單元(I)可以通過監(jiān)控通道獲得錯誤信息數(shù)據(jù)庫(2)中或者當前啟動過程中是否存在內(nèi)存錯誤信息。錯誤信息數(shù)據(jù)庫記錄在內(nèi)嵌主板上的管理芯片(BMC)內(nèi)的Flash中,當系統(tǒng)遇到斷電時,錯誤信息仍可保存在Flash中不會丟失。以供系統(tǒng)在下次開機的時候檢測上次發(fā)現(xiàn)的內(nèi)存故障。
權(quán)利要求
1.一種服務(wù)器內(nèi)存故障報警方法,其特征在于,通過軟件程序在服務(wù)器系統(tǒng)啟動階段識別內(nèi)存錯誤信息,將信息傳遞給內(nèi)嵌主板上的管理芯片進行分類判斷并按級別報警,系統(tǒng)包括故障信息識別單元、錯誤信息數(shù)據(jù)庫、報警單元,其中故障信息識別單元負責(zé)通過獲取系統(tǒng)中內(nèi)存部件發(fā)出的錯誤信息作為判斷內(nèi)存故障的依據(jù);錯誤信息數(shù)據(jù)庫負責(zé)收集傳遞內(nèi)存錯誤信息;報警單元負責(zé)根據(jù)不同的錯誤信息判斷選擇不同的故障報警方式;報警步驟如下系統(tǒng)上電,檢測錯誤信息庫中是否存在歷史錯誤,并檢測故障是否仍存在,其中1)故障存在,把錯誤信息分類為不同的故障,根據(jù)不同的故障按照故障級別以不同的方式進行報警;2)故障不存在,檢測本次開機是否內(nèi)存發(fā)錯誤信息,包括a)內(nèi)存發(fā)錯誤信息,錯誤信息被記錄到錯誤信息數(shù)據(jù)庫,把錯誤信息分類為不同的故障,根據(jù)不同的故障進行報警;b) 不存在內(nèi)存發(fā)錯誤信息,清除錯誤信息數(shù)據(jù)庫中的歷史數(shù)據(jù)。
全文摘要
本發(fā)明提供一種服務(wù)器內(nèi)存故障報警方法,通過軟件程序在服務(wù)器系統(tǒng)啟動階段識別內(nèi)存錯誤信息,將信息傳遞給內(nèi)嵌主板上的管理芯片進行分類判斷并按級別報警,系統(tǒng)包括故障信息識別單元、錯誤信息數(shù)據(jù)庫、報警單元,其中故障信息識別單元負責(zé)通過獲取系統(tǒng)中內(nèi)存部件發(fā)出的錯誤信息作為判斷內(nèi)存故障的依據(jù);錯誤信息數(shù)據(jù)庫負責(zé)收集傳遞內(nèi)存錯誤信息;報警單元負責(zé)根據(jù)不同的錯誤信息判斷選擇不同的故障報警方式。在服務(wù)器系統(tǒng)中實施本發(fā)明的內(nèi)存故障報警方法,可以很大程度上可以提高系統(tǒng)的可靠性功能,方便維護,提升產(chǎn)品的整體形象。
文檔編號G06F11/34GK102609350SQ201210033268
公開日2012年7月25日 申請日期2012年2月15日 優(yōu)先權(quán)日2012年2月15日
發(fā)明者平原 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司