1.一種機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,該方法包括:
2.根據(jù)權(quán)利要求1所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,在步驟s1中,所述故障判定模型分為資源類、性能類、錯誤類;
3.根據(jù)權(quán)利要求1所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,在步驟s2中,指標(biāo)維度監(jiān)控數(shù)據(jù),用于資源類故障的判定,當(dāng)指標(biāo)監(jiān)控數(shù)據(jù)滿足資源類故障判定模型的要素時,生成告警事件及告警事件詳情;
4.根據(jù)權(quán)利要求3所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,針對性能類故障判定模型,判定要素中的閾值分固定閾值和動態(tài)閾值,固定閾值采用人工維護的方式進(jìn)行配置,動態(tài)閾值采用機器學(xué)習(xí)算法通過歷史時序數(shù)據(jù)自動計算獲得。
5.根據(jù)權(quán)利要求4所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,動態(tài)閾值的計算方法以機場日常運行中接口的性能的變化規(guī)律為基礎(chǔ),引入機器學(xué)習(xí)算法,通過回歸預(yù)測算法生成接口性能曲線,并依據(jù)此曲線判斷數(shù)據(jù)服務(wù)接口的性能狀態(tài);
6.根據(jù)權(quán)利要求3所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,資源類故障處置方式中,針對不同類型資源指標(biāo),執(zhí)行相應(yīng)的指標(biāo)下鉆查詢方法,調(diào)用prometheus的查詢api,獲取詳細(xì)數(shù)據(jù)作為故障根因。
7.根據(jù)權(quán)利要求3所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,性能類故障處置方式中,如果性能類故障發(fā)生,依托調(diào)用鏈,結(jié)合系統(tǒng)拓?fù)?,定位鏈路中高耗時節(jié)點,將高耗時節(jié)點作為起點,按錯誤類故障處置流程追溯下游拓?fù)?,并分析異常,獲取異常因果鏈路,取鏈路終點作為告警事件根因。
8.根據(jù)權(quán)利要求3所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,錯誤類故障處置方法包括:獲取事件相關(guān)資產(chǎn),匹配故障案例庫,計算知識圖譜,獲取故障事件的所有可疑路徑,從時間維度計算相關(guān)事件,篩選根因路徑,再從語義維度計算根因路徑的相關(guān)度,篩選根因路徑,最終生成根因路徑,給出處置推薦。
9.根據(jù)權(quán)利要求8所述的機場數(shù)據(jù)服務(wù)接口故障分析方法,其特征在于,錯誤類故障根因定位過程包括:
10.一種機場數(shù)據(jù)服務(wù)接口故障分析系統(tǒng),其特征在于,實施如權(quán)利要求1-9任意一項所述機場數(shù)據(jù)服務(wù)接口故障分析方法,該系統(tǒng)包括: