本發(fā)明屬于計算機測量與控制技術領域,特別涉及一種基于WMI的故障檢測分析及狀態(tài)預測方法。
背景技術:
隨著武器裝備系統復雜性的不斷提高,對測試可靠性要求日益提高,越來越多的測試系統開始由傳統的單機模式進化為二重冗余甚至多重冗余模式。而在冗余模式下,主機與從機均需周期性的對自身的健康狀態(tài)進行檢測并分析,當主機在運行過程中出現故障,即主機健康狀態(tài)遜于從機時,則立即進行主從切換。
傳統的故障檢測方式大多通過專用的傳感器配合對應的采集模塊實現,該模式具有易于實現,邏輯簡單的優(yōu)點,但在如運載火箭地面自動化測試等測控任務需求較復雜,設備故障模式龐雜的場合下,各類故障模式間的耦合程度較高,且不便于根據故障模式進行擴展。
技術實現要素:
本發(fā)明的目的在于運載火箭地面設備故障檢測存在的上述缺陷,提出了一種基于WMI的故障檢測分析及狀態(tài)預測方法,該方法采集各設備上傳的監(jiān)測參數,并進行趨勢預測;與預設的兩級故障門限(報警門限及切換門限)進行對比,從而對每種故障模式的健康與否/嚴酷等級給出綜合判斷。
為了實現上述目的,本發(fā)明提出了一種基于WMI的故障檢測分析及狀態(tài)預測方法,所述方法包括:通過Windows系統內部的WMI接口,周期性檢測主機的各設備的監(jiān)測狀態(tài)值,并根據危害程度為每一類故障模式設置兩道檢測門限:報警門限和切換門限;當監(jiān)測狀態(tài)值大于報警門限而未超過切換門限時,利用最小二乘法對該設備的下個周期的故障趨勢進行預測;當監(jiān)測狀態(tài)值或預測值大于切換門限時,輸出主從切換信息。
上述技術方案中,所述方法具體包括:
步驟1)通過Windows系統內部的WMI接口,周期性檢測主機計算機的各設備具體參數值;
步驟2)判斷各參數值是否超過告警門限,如果存在一個及以上的參數值超過告警門限,輸出報警信息,轉入步驟3),否則,轉入步驟1);
步驟3)判斷參數值是否超過切換門限,如果存在一個及以上的參數值超過切換門限,轉入步驟7);否則,輸出報警信息,轉入步驟4);
步驟4)采集超過報警門限而未超過切換門限的設備的若干個采樣點,利用最小二乘法進行擬合出直線方程,計算出下一個時刻該設備的參數值;
步驟5)判斷預測出的參數值是否大于切換門限,如果判斷結果是肯定的,轉入步驟7);否則,轉入步驟6);
步驟6)根據擬合出的直線方程判斷是否有大于切換門限的趨勢,如果判斷結果是肯定,轉入步驟7),否則,轉入步驟1);
步驟7)輸出主從切換信息。
上述技術方案中,所述故障模式包括:CPU占用率、CPU溫度、硬盤剩余空間和硬盤溫度。
本發(fā)明的優(yōu)勢在于:
本發(fā)明公開了一種基于WMI(Windows Management Instrumentation)的故障檢測分析及狀態(tài)預測方法,通過Windows系統內部的WMI接口,周期性檢測計算機的各類常見故障模式及設備健康狀態(tài)(如CPU占用率、CPU溫度、硬盤剩余空間、硬盤溫度等),并根據危害程度的嚴重與否為每一類故障模式設置兩道檢測門限,當故障源越過第一級門限后,結合最小二乘法對未來數個周期內故障變化趨勢進行預測,以幫助用于預測故障源未來發(fā)展的趨勢結果,采取有效的安全防護措施,有效避免了因放任故障源肆意發(fā)展而對設備造成的不可挽回的損傷,且顯著降低了系統的虛警率。
附圖說明
圖1為本發(fā)明故障檢測插件與故障監(jiān)測平臺接口關系圖;
圖2為本發(fā)明的基于WMI的故障檢測分析及狀態(tài)預測方法流程圖;
圖3為本發(fā)明故障趨勢預測方法原理示意圖。
具體實施方式
下面結合附圖與具體實施方式對本發(fā)明作進一步詳細說明。
如圖1所示,每個故障檢測插件對應一種故障模式,故障監(jiān)測平臺周期性獲取監(jiān)測的具體參數值,與表1中的報警門限/切換門限進行對比:
表1
對于表1中列出的故障,當所監(jiān)測的參數超過報警門限后,系統通過網絡向后端指揮中心報警,由后端根據當前情況判斷是否需要發(fā)布手動切換命令,另一方面,故障監(jiān)測平臺會會根據該參數越過門限前后時刻的5個采樣點分析其趨勢:若判斷結果為該參數有繼續(xù)增長,進而突破切換門限的可能,則再次向后端進行報警;若判斷該參數趨于穩(wěn)定工作狀態(tài),則不報警,返回正常的監(jiān)測狀態(tài),從而通過兩級門限的機制降低虛警概率,只有當該參數已越過切換門限或者接收到后端傳來的手動切換命令后,系統才進行主從切換,其工作流程如圖2所示。
圖3為本發(fā)明故障趨勢預測方法原理示意圖,采用最小二乘法實現對嚴重故障的預測與分析,以某監(jiān)測參數為例,P0為該參數的切換門限,在T1到T2過程中,兩次故障檢測的結果,預測到T0時會超過切換門限P0,系統通過多次擬合,會在T0之前完成切換,有限降低虛警的概率,提高預測的精度。