本發(fā)明涉及一體化設(shè)備自檢,具體為一種基于ops電腦的一體化設(shè)備自檢系統(tǒng)及方法。
背景技術(shù):
1、ops電腦,是一種電腦開放式可插拔規(guī)范模塊,將電腦部分做成一個模塊化標(biāo)準(zhǔn)品,通過抽拉式設(shè)計,可以方便快捷地把電腦pc部分和液晶一體機拆分開來方便進行電腦部件的維修、更換、升級和換代。
2、但對于ops電腦的故障檢測,常常需要將電腦pc部分進行拆卸,或者需要外接輔助接口或設(shè)備工具對ops硬件相關(guān)故障進行檢修及排除,需要耗費大量的人力物力;利用人工對ops硬件相關(guān)故障進行檢修,需要依靠于檢修人員的經(jīng)驗判斷,容易造成誤判,對ops電腦的后續(xù)工作造成不良的影響,且人工檢修設(shè)備檢測效率不高。
3、所以,本發(fā)明公開一種基于ops電腦的一體化設(shè)備自檢系統(tǒng)及方法以解決上述問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于ops電腦的一體化設(shè)備自檢系統(tǒng)及方法,以解決上述背景技術(shù)中提出的問題。
2、為了解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種基于ops電腦的一體化設(shè)備自檢方法,其特征在于,該方法包括如下步驟:
3、s1:一體化設(shè)備通過網(wǎng)絡(luò)連接云平臺并將運行數(shù)據(jù)實時傳輸至云平臺,中央檢測主機從云平臺中獲取一體化設(shè)備的運行數(shù)據(jù),對運行數(shù)據(jù)按照一體化設(shè)備的硬件設(shè)備進行分類,對分類后的運行數(shù)據(jù)進行整合定義為一類曲線和二類曲線;
4、s2:對一體化設(shè)備的歷史運行數(shù)據(jù)進行預(yù)處理查找組成第一曲線段集合,將第一曲線段集合進行提取形成第二曲線段集合,根據(jù)第二曲線段集合進行參考價值計算,根據(jù)參考價值計算結(jié)果生成歷史運行參考數(shù)據(jù);
5、s3:通過歷史運行參考數(shù)據(jù)提取故障特征集合,根據(jù)設(shè)備故障檢測任務(wù)的優(yōu)先級,實時調(diào)整對實時運行數(shù)據(jù)的檢測任務(wù)調(diào)度,利用一體化設(shè)備的實時運行數(shù)據(jù)對一體化設(shè)備進行故障風(fēng)險判定;
6、s4:根據(jù)故障風(fēng)險判定對用戶進行預(yù)警以及提示。
7、在步驟s1中,將連接至云平臺的一體化設(shè)備組成集合ie={ie1,ie2,…,ien},其中n表示一體化設(shè)備的總數(shù)量,將其中第i個一體化設(shè)備記為iei,其中i∈[1,n];
8、所述運行數(shù)據(jù)包括歷史運行數(shù)據(jù)和實時運行數(shù)據(jù),所述歷史運行數(shù)據(jù)和實時運行數(shù)據(jù)都含有運行屬性數(shù)值變化曲線,所述運行屬性數(shù)值變化曲線包括中央處理器運行曲線、運行內(nèi)存運行曲線、存儲設(shè)備運行曲線、處理單元運行曲線、網(wǎng)絡(luò)接口運行曲線和電源供電器運行曲線;
9、所述中央處理器運行曲線、運行內(nèi)存運行曲線、存儲設(shè)備運行曲線、處理單元運行曲線、網(wǎng)絡(luò)接口運行曲線和電源供電器運行曲線為各項運行屬性數(shù)值隨著時間變化的曲線;
10、所述中央處理器運行曲線包括中央處理器溫度曲線和中央處理器利用率曲線;所述運行內(nèi)存運行曲線包括運行內(nèi)存利用率曲線;所述存儲設(shè)備運行曲線包括存儲設(shè)備讀取速度曲線、存儲設(shè)備寫入速度曲線和存儲設(shè)備剩余空間曲線;所述處理單元運行曲線包括處理單元溫度曲線和處理單元利用率曲線;所述網(wǎng)絡(luò)接口運行曲線包括網(wǎng)絡(luò)接口延遲曲線、網(wǎng)絡(luò)接口丟包曲線和網(wǎng)絡(luò)接口傳輸速率曲線;所述電源供電器運行曲線包括電源供電器功率曲線;
11、本技術(shù)中,中央處理器為ops電腦的cpu,處理單元為ops電腦的gpu,存儲設(shè)備包括硬盤;中央處理器利用率、運行內(nèi)存利用率、存儲設(shè)備讀取速度、存儲設(shè)備寫入速度、存儲設(shè)備剩余空間、網(wǎng)絡(luò)接口延遲、網(wǎng)絡(luò)接口丟包和網(wǎng)絡(luò)接口傳輸速率通過ops電腦內(nèi)置檢測工具獲取,中央處理器溫度和處理單元溫度通過傳感器測取,通過傳感器測量電源供電器電壓和電流,根據(jù)功率計算公式計算電源供電器功率;
12、將中央處理器溫度曲線、中央處理器利用率曲線、運行內(nèi)存利用率曲線、處理單元溫度曲線、處理單元利用率曲線、網(wǎng)絡(luò)接口延遲曲線和網(wǎng)絡(luò)接口丟包曲線定義為一類曲線;存儲設(shè)備讀取速度曲線、存儲設(shè)備寫入速度曲線、存儲設(shè)備剩余空間曲線、網(wǎng)絡(luò)接口傳輸速率曲線和電源供電器功率曲線定義為二類曲線。
13、根據(jù)一體化設(shè)備中各種硬件的具體屬性特性,其中中央處理器溫度數(shù)值、中央處理器利用率數(shù)值、運行內(nèi)存利用率數(shù)值、處理單元溫度數(shù)值、處理單元利用率數(shù)值、網(wǎng)絡(luò)接口延遲數(shù)值和網(wǎng)絡(luò)接口丟包數(shù)值在故障前往往達到區(qū)域性極大值;存儲設(shè)備讀取速度數(shù)值、存儲設(shè)備寫入速度數(shù)值、存儲設(shè)備剩余空間數(shù)值、網(wǎng)絡(luò)接口傳輸速率數(shù)值和電源供電器功率數(shù)值在故障前往往達到區(qū)域性極小值;則將上述不同的屬性曲線分類成不同的曲線組,有利于后續(xù)分析計算;
14、根據(jù)上述方案,在步驟s2中,歷史運行數(shù)據(jù)中的一條歷史運行屬性數(shù)值變化曲線對應(yīng)一個的歷史運行屬性數(shù)值變化曲線函數(shù),在同一個檢測周期內(nèi),對一體化設(shè)備iei的各項歷史運行屬性數(shù)值變化曲線函數(shù)進行求導(dǎo),將求導(dǎo)后獲得曲線函數(shù)記為歷史運行屬性數(shù)值變化率曲線函數(shù);
15、查找歷史運行屬性數(shù)值變化率曲線函數(shù)中歷史運行屬性數(shù)值變化率為零的時刻,在對應(yīng)的歷史運行屬性數(shù)值變化曲線中,以所述歷史運行屬性數(shù)值變化率為零的時刻為中心,截取系統(tǒng)預(yù)設(shè)時間長度的曲線段,組成第一曲線段集合;所述曲線段不包括歷史運行屬性數(shù)值恒為零的情況;各個歷史運行屬性數(shù)值變化曲線的系統(tǒng)預(yù)設(shè)時間長度不同;
16、在一體化設(shè)備發(fā)生故障時往往各種屬性數(shù)值達到區(qū)域性極值,對歷史運行數(shù)據(jù)進行求導(dǎo)形成歷史運行屬性數(shù)值變化率曲線函數(shù),查找歷史運行屬性數(shù)值變化率曲線函數(shù)中歷史運行屬性數(shù)值變化率為零的時刻,能夠有效地找到一體化設(shè)備發(fā)生故障的時間,提高設(shè)備故障檢測結(jié)果的準(zhǔn)確性;各個運行屬性數(shù)值變化曲線的運行屬性數(shù)值變化趨勢不同,根據(jù)不同的運行屬性數(shù)值變化曲線,系統(tǒng)截取系統(tǒng)預(yù)設(shè)時間長度不同的曲線段,進一步提高設(shè)備故障檢測結(jié)果的準(zhǔn)確性;
17、若其中任意兩個曲線段存在重疊部分,將存在重疊部分的曲線段進行整合;若其中任意兩個曲線段不存在重疊部分,則按照時刻順序排序;
18、提取第一曲線段集合中,在歷史運行屬性數(shù)值變化率為零時,歷史運行屬性數(shù)值為區(qū)域性極大值的曲線段;所述區(qū)域性極大值為歷史運行屬性數(shù)值變化率為零的時刻前,歷史運行屬性數(shù)值變化率大于零,且歷史運行屬性數(shù)值變化率為零的時刻后,歷史運行屬性數(shù)值變化率小于零的情況;將提取后曲線段組成一類曲線的第二曲線段集合csai={csa(i,1),csa(i,2),…,csa(i,ma)},其中ma為第a種一類曲線的曲線段總數(shù),將其中第a種一類曲線的第j個曲線段記為csa(i,j),其中j∈[1,ma];
19、提取第二曲線段集合中,在歷史運行屬性數(shù)值變化率為零時,歷史運行屬性數(shù)值為區(qū)域性極小值的曲線段,所述區(qū)域性極小值為歷史運行屬性數(shù)值變化率為零的時刻前,歷史運行屬性數(shù)值變化率小于零,且歷史運行屬性數(shù)值變化率為零的時刻后,歷史運行屬性數(shù)值變化率大于零的情況;將提取后曲線段組成二類曲線的第二曲線段集合csbi={csb(i,1),csb(i,2),…,csb(i,mb)},其中mb為第b種二類曲線的曲線段總數(shù),將其中第b種二類曲線的第j個曲線段記為csb(i,j),其中j∈[1,mb];
20、對一體化設(shè)備iei進行歷史運行數(shù)據(jù)的參考價值計算,其中一類曲線的總參考價值rvai具體計算公式如下:
21、rvai=∑\s\do?3(a=1)a?[αa×(∑\s\do?3(j=1)ma?rcsa(i,j)/ma)];
22、其中a表示第一曲線的總數(shù),αa表示第a種一類曲線的權(quán)重,rcsa表示曲線段csa(i,j)的歷史運行屬性數(shù)值的平均值;
23、二類曲線的總參考價值rvbi具體計算公式如下:
24、rvbi=∑\s\do?3(b=1)b?[αb×(∑\s\do?3(j=1)mb?rcsb(i,j)/mb)];
25、其中b表示第二曲線的總數(shù),αb表示第b種二類曲線的權(quán)重,rcsb表示曲線段csb(i,j)的歷史運行屬性數(shù)值的平均值;
26、設(shè)置一類曲線的總參考價值閾值為β1,設(shè)置二類曲線的總參考價值閾值為β2;
27、留取一類曲線的總參考價值大于或等于閾值β1,或者二類曲線的總參考價值小于或等于閾值β2的歷史運行數(shù)據(jù)定義為歷史運行參考數(shù)據(jù)。
28、根據(jù)上述對參考價值的計算并設(shè)置閾值,保留其中一部分歷史運行數(shù)據(jù)形成歷史運行參考數(shù)據(jù),能夠有效篩選出參考價值偏高的數(shù)據(jù),減少參考價值較小甚至無參考價值的數(shù)據(jù),減少系統(tǒng)的計算量,提高設(shè)備檢測效率。
29、根據(jù)上述方案,在步驟s3中,從歷史運行參考數(shù)據(jù)中,提取出現(xiàn)過故障的一體化設(shè)備的每一種一類曲線的參考價值,組成一類曲線故障參考價值集合;將每一種一類曲線的參考價值對比,組成一類曲線故障特征數(shù)值集合;所述一類曲線故障特征數(shù)值集合包含每一種一類曲線的參考價值最小值;
30、從歷史運行參考數(shù)據(jù)中,提取出現(xiàn)過故障的一體化設(shè)備的每一種二類曲線的參考價值,組成二類曲線故障參考價值集合;將每一種二類曲線的參考價值對比,組成二類曲線故障特征數(shù)值集合;所述二類曲線故障特征數(shù)值集合包含每一種二類曲線的參考價值最大值;
31、將一類曲線故障特征數(shù)值集合和二類曲線故障特征數(shù)值集合進行并集,組成故障特征參數(shù)集合;
32、對出現(xiàn)過故障的一體化設(shè)備進行故障特征提取,將每一種曲線的參考價值的區(qū)域性極值作為故障特征集合元素,提高設(shè)備故障檢測結(jié)果的準(zhǔn)確性。
33、對一體化設(shè)備的故障進行優(yōu)先級劃分,根據(jù)設(shè)備故障檢測任務(wù)的優(yōu)先級,實時調(diào)整對實時運行數(shù)據(jù)的檢測任務(wù)調(diào)度,優(yōu)先查找優(yōu)先級高的設(shè)備故障檢測任務(wù)中包含的運行屬性數(shù)值,對一體化設(shè)備的實時運行數(shù)據(jù)中的運行屬性數(shù)值變化曲線進行參考價值計算,并與故障特征集合相對應(yīng)的故障特征數(shù)值進行對比,滿足其中一種一類曲線的參考價值大于或等于對應(yīng)的故障特征數(shù)值,或其中一種二類曲線的參考價值小于或等于對應(yīng)的故障特征數(shù)值,則判定為一體化設(shè)備存在故障風(fēng)險。
34、根據(jù)設(shè)備故障檢測任務(wù)的優(yōu)先級,實時調(diào)整對實時運行數(shù)據(jù)的檢測任務(wù)調(diào)度,提高整體檢測效率。
35、根據(jù)上述方案,在步驟s4中,若存在故障風(fēng)險的一體化設(shè)備對用戶進行預(yù)警,并提示具體存在故障風(fēng)險的硬件設(shè)備,若一體化設(shè)備不存在故障風(fēng)險,則不做預(yù)警與提示處理。
36、本技術(shù)的另一個方面,提供了一種基于ops電腦的一體化設(shè)備自檢系統(tǒng),所述系統(tǒng)應(yīng)用于上述的一種基于ops電腦的一體化設(shè)備自檢方法實現(xiàn),其特征在于,該系統(tǒng)包括一體化設(shè)備、云平臺和中央檢測主機;
37、所述云平臺用于接收一體化設(shè)備的運行數(shù)據(jù),并將一體化設(shè)備的運行數(shù)據(jù)傳輸至中央檢測主機;
38、所述中央檢測主機包括數(shù)據(jù)分類整合模塊、參考價值分析計算模塊、故障特征提取與判定模塊和預(yù)警提示模塊;
39、所述數(shù)據(jù)分類整合模塊用于對運行數(shù)據(jù)按照一體化設(shè)備的硬件設(shè)備進行分類以及整合,定義為一類曲線和二類曲線;所述參考價值分析計算模塊用于對一體化設(shè)備的歷史運行數(shù)據(jù)進行預(yù)處理查找,對預(yù)處理查找后的歷史運行數(shù)據(jù)進行參考價值計算;所述故障特征提取與判定模塊用于提取故障特征集合,利用一體化設(shè)備的實時運行數(shù)據(jù)對一體化設(shè)備進行故障風(fēng)險判定;所述預(yù)警提示模塊根據(jù)故障風(fēng)險判定對用戶進行預(yù)警以及提示。
40、根據(jù)上述方案,所述數(shù)據(jù)分類整合模塊包括數(shù)據(jù)分類單元和數(shù)據(jù)整合單元;
41、所述數(shù)據(jù)分類單元用于將運行數(shù)據(jù)分成歷史運行數(shù)據(jù)和實時運行數(shù)據(jù),將歷史運行數(shù)據(jù)和實時運行數(shù)據(jù)中含有的運行屬性數(shù)值變化曲線分類成中央處理器運行曲線、運行內(nèi)存運行曲線、存儲設(shè)備運行曲線、處理單元運行曲線、網(wǎng)絡(luò)接口運行曲線和電源供電器運行曲線;
42、所述中央處理器運行曲線包括中央處理器溫度曲線和中央處理器利用率曲線;所述運行內(nèi)存運行曲線包括運行內(nèi)存利用率曲線;所述存儲設(shè)備運行曲線包括存儲設(shè)備讀取速度曲線、存儲設(shè)備寫入速度曲線和存儲設(shè)備剩余空間曲線;所述處理單元運行曲線包括處理單元溫度曲線和處理單元利用率曲線;所述網(wǎng)絡(luò)接口運行曲線包括網(wǎng)絡(luò)接口延遲曲線、網(wǎng)絡(luò)接口丟包曲線和網(wǎng)絡(luò)接口傳輸速率曲線;所述電源供電器運行曲線包括電源供電器功率曲線;
43、所述數(shù)據(jù)整合單元用于將中央處理器溫度曲線、中央處理器利用率曲線、運行內(nèi)存利用率曲線、處理單元溫度曲線、處理單元利用率曲線、網(wǎng)絡(luò)接口延遲曲線和網(wǎng)絡(luò)接口丟包曲線定義為一類曲線;存儲設(shè)備讀取速度曲線、存儲設(shè)備寫入速度曲線、存儲設(shè)備剩余空間曲線、網(wǎng)絡(luò)接口傳輸速率曲線和電源供電器功率曲線定義為二類曲線。
44、根據(jù)上述方案,所述參考價值分析計算模塊包括參考價值分析查找單元和參考價值計算單元;
45、所述參考價值分析查找單元用于在同一個檢測周期內(nèi),對一體化設(shè)備iei的各項歷史運行屬性數(shù)值變化曲線函數(shù)進行求導(dǎo),將求導(dǎo)后獲得曲線函數(shù)記為歷史運行屬性數(shù)值變化率曲線函數(shù);查找歷史運行屬性數(shù)值變化率曲線函數(shù)中歷史運行屬性數(shù)值變化率為零的時刻,在對應(yīng)的歷史運行屬性數(shù)值變化曲線中,以所述歷史運行屬性數(shù)值變化率為零的時刻為中心,截取系統(tǒng)預(yù)設(shè)時間長度的曲線段,組成第一曲線段集合;提取第一曲線段集合中,在歷史運行屬性數(shù)值變化率為零時,歷史運行屬性數(shù)值為區(qū)域性極值的曲線段,將提取后的組成第二曲線段集合;
46、所述參考價值計算單元用于對預(yù)處理查找后的歷史運行數(shù)據(jù)進行參考價值計算。
47、根據(jù)上述方案,所述故障特征提取與判定模塊包括故障特征提取單元和故障風(fēng)險判定模塊;
48、所述故障特征提取單元用于組成一類曲線故障特征數(shù)值集合和二類曲線故障特征數(shù)值集合,將一類曲線故障特征數(shù)值集合和二類曲線故障特征數(shù)值集合進行整合組成故障特征參數(shù)集合;
49、所述故障風(fēng)險判定模塊用于對一體化設(shè)備的實時運行數(shù)據(jù)進行參考價值計算,并與故障特征集合相對應(yīng)的故障特征數(shù)值進行對比,對一體化設(shè)備進行故障風(fēng)險判定。
50、根據(jù)上述方案,所述預(yù)警提示模塊用于對存在故障風(fēng)險的一體化設(shè)備對用戶進行預(yù)警,并提示具體存在故障風(fēng)險的硬件設(shè)備。
51、與現(xiàn)有技術(shù)相比,本發(fā)明所達到的有益效果是:根據(jù)一體化設(shè)備中各種硬件的具體屬性特性,將不同的屬性曲線分類成不同的曲線組,有利于分析計算;在一體化設(shè)備發(fā)生故障時往往各種屬性數(shù)值達到區(qū)域性極值,對歷史運行數(shù)據(jù)進行求導(dǎo)形成歷史運行屬性數(shù)值變化率曲線函數(shù),能夠有效地找到一體化設(shè)備發(fā)生故障的時間,提高設(shè)備故障檢測結(jié)果的準(zhǔn)確性;各個運行屬性數(shù)值變化曲線的運行屬性數(shù)值變化趨勢不同,根據(jù)不同的運行屬性數(shù)值變化曲線,系統(tǒng)截取系統(tǒng)預(yù)設(shè)時間長度不同的曲線段,進一步提高設(shè)備故障檢測結(jié)果的準(zhǔn)確性;對參考價值的計算并設(shè)置閾值,保留其中一部分歷史運行數(shù)據(jù)形成歷史運行參考數(shù)據(jù),能夠有效篩選數(shù)據(jù),減少系統(tǒng)的計算量,提高設(shè)備檢測效率;對出現(xiàn)過故障的一體化設(shè)備進行故障特征提取,將每一種曲線的參考價值的區(qū)域性極值作為故障特征集合元素,提高設(shè)備故障檢測結(jié)果的準(zhǔn)確性。