本發(fā)明涉及計(jì)算設(shè)備性能監(jiān)控技術(shù)領(lǐng)域,尤其涉及一種異常原因定位方法、應(yīng)用和計(jì)算設(shè)備。
背景技術(shù):
隨著信息技術(shù)的發(fā)展,各種應(yīng)用、網(wǎng)站層出不窮,對(duì)計(jì)算設(shè)備的性能提出了更高的要求。對(duì)各項(xiàng)性能指標(biāo)進(jìn)行監(jiān)控,實(shí)時(shí)獲取計(jì)算設(shè)備的運(yùn)行狀態(tài)并排查異常,是提高其計(jì)算性能的必要步驟。一般來說,監(jiān)控的性能指標(biāo)包括CPU利用率、內(nèi)存使用率、吞吐量、響應(yīng)時(shí)間,等等。在監(jiān)控時(shí),每隔一段時(shí)間對(duì)各性能指標(biāo)進(jìn)行一次采樣,因此,每個(gè)性能指標(biāo)的監(jiān)控結(jié)果呈現(xiàn)為一個(gè)由多個(gè)觀測(cè)值所構(gòu)成的時(shí)間序列。
一般來說,對(duì)于一個(gè)待測(cè)設(shè)備需要設(shè)置多個(gè)被監(jiān)控的性能指標(biāo),這些性能指標(biāo)之間可能存在聯(lián)系。當(dāng)監(jiān)控到某個(gè)性能指標(biāo)出現(xiàn)異常時(shí),需要對(duì)其他的性能指標(biāo)進(jìn)行排查,找出使該性能指標(biāo)出現(xiàn)異常的原因。在現(xiàn)有的解決方案中,往往由運(yùn)維人員來進(jìn)行異常原因的排查,在監(jiān)控的性能指標(biāo)較多的情況下,這種方式將耗費(fèi)大量的人力和時(shí)間,效率低,且結(jié)果也通常難以令人滿意?,F(xiàn)有技術(shù)中也存在一些用于檢測(cè)相關(guān)性和因果性的算法,能夠?qū)Ξ惓T虻呐挪閹硪欢ǖ膸椭?。但是,現(xiàn)有的相關(guān)性檢測(cè)算法只能判斷兩個(gè)指標(biāo)是否有關(guān)聯(lián),而無法得知一個(gè)指標(biāo)是否為另一個(gè)指標(biāo)的原因。現(xiàn)有的因果性算法僅能得出某個(gè)指標(biāo)為另一個(gè)指標(biāo)的原因的概率,而無法得出這兩個(gè)指標(biāo)之間是否相關(guān),僅采用因果檢測(cè)算法容易造成原因的誤報(bào),準(zhǔn)確率并不高。此外,現(xiàn)有的因果性檢測(cè)算法往往時(shí)間復(fù)雜度比較高,在數(shù)據(jù)量比較多時(shí),判定因果性將耗費(fèi)大量的時(shí)間,難以實(shí)現(xiàn)實(shí)時(shí)檢測(cè)。
技術(shù)實(shí)現(xiàn)要素:
為此,本發(fā)明提供一種異常原因定位方法、裝置和計(jì)算設(shè)備,以力圖解決或至少緩解上面存在的問題。
根據(jù)本發(fā)明的一個(gè)方面,提供一種異常原因定位方法,在計(jì)算設(shè)備中執(zhí)行,適于在待測(cè)設(shè)備中出現(xiàn)異常性能指標(biāo)時(shí),找出導(dǎo)致該異常性能指標(biāo)出現(xiàn)異常的原因性能指標(biāo),該方法包括:獲取異常性能指標(biāo)和多個(gè)性能指標(biāo)的觀測(cè)值的時(shí)間序列;根據(jù)時(shí)間序列分別計(jì)算每一個(gè)性能指標(biāo)與異常性能指標(biāo)的相關(guān)性,將與異常性能指標(biāo)的相關(guān)性大于第一閾值的性能指標(biāo)加入第一指標(biāo)集;分別計(jì)算第一指標(biāo)集中的每一個(gè)性能指標(biāo)與異常性能指標(biāo)的因果性,將與異常性能指標(biāo)的因果性大于第二閾值的性能指標(biāo)加入第二指標(biāo)集;根據(jù)相關(guān)性和因果性分別確定第二指標(biāo)集中的每一個(gè)性能指標(biāo)的原因分值,原因分值用于表示性能指標(biāo)為原因性能指標(biāo)的可能性;根據(jù)原因分值確定異常性能指標(biāo)的原因性能指標(biāo)。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,按照以下公式計(jì)算相關(guān)性:
其中,n為時(shí)間序列中所包括的觀測(cè)值的數(shù)目,x表示性能指標(biāo),xi為性能指標(biāo)x的時(shí)間序列中的第i個(gè)觀測(cè)值,為性能指標(biāo)x的時(shí)間序列中的觀測(cè)值的平均值,y表示異常性能指標(biāo),yi為異常性能指標(biāo)y的時(shí)間序列中的第i個(gè)觀測(cè)值,為異常性能指標(biāo)y的時(shí)間序列中的觀測(cè)值的平均值。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,按照以下步驟計(jì)算因果性:建立以下兩個(gè)回歸模型:
模型一:y1t=a0+a1yt-1+a2yt-2+…+amyt-m
模型二:y2t=b0+b1yt-1+b2yt-2+…+bmyt-m+c0+c1xt-1+c2xt-2+…+cmxt-m
其中,yt-1為異常性能指標(biāo)y在(t-1)時(shí)刻的觀測(cè)值,xt-1為性能指標(biāo)x在(t-1)時(shí)刻的觀測(cè)值,m為滯后項(xiàng)數(shù),a0~am、b0~bm、c0~cm均為待定系數(shù);根據(jù)異常性能指標(biāo)y和性能指標(biāo)x的時(shí)間序列求解上述回歸模型,確定待定系數(shù)a0~am、b0~bm、c0~cm的值;按照以下公式計(jì)算F檢驗(yàn)值:
其中,所述RSS1為模型一的殘差平方和,RSS2為模型二的殘差平方和,m為滯后項(xiàng)數(shù),n為時(shí)間序列中所包括的觀測(cè)值的數(shù)目;
RSS1、RSS2分別按照以下公式計(jì)算:
其中,yt為異常性能指標(biāo)y在t時(shí)刻的觀測(cè)值,y1t為根據(jù)模型一得到的異常性能指標(biāo)y在t時(shí)刻的預(yù)測(cè)值,y2t為根據(jù)模型二得到的異常性能指標(biāo)y在t時(shí)刻的預(yù)測(cè)值;根據(jù)F檢驗(yàn)值確定顯著性p_value;將(1-p_value)作為性能指標(biāo)x和異常性能指標(biāo)y的因果性。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,顯著性p_value可以通過查詢顯著性水平為(1-第二閾值)的F分布臨界值表得出,其中,在查詢所述F分布臨界值表時(shí),自由度為(m,n-2m-1)。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,顯著性p_value可以按照以下公式計(jì)算:
p_value=1-P(F檢驗(yàn)值)
其中,P(z)為自由度為(m,n-2m-1)的F分布的累積分布函數(shù),P(F檢驗(yàn)值)為累積分布函數(shù)P(z)在z=F檢驗(yàn)值時(shí)的取值。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,按照以下公式確定原因分值:
score=w1*相關(guān)性+w2*因果性
其中,0≤w1≤1,0≤w2≤1,w1+w2=1。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,w1=w2=0.5。
可選地,在根據(jù)本發(fā)明的異常原因定位方法中,根據(jù)原因分值確定異常性能指標(biāo)的原因性能指標(biāo)可以采用以下方式中的任一種:將第二指標(biāo)集中原因分值最大的性能指標(biāo)作為原因性能指標(biāo);將第二指標(biāo)集中原因分值大于第三閾值的性能指標(biāo)作為原因性能指標(biāo);按照原因分值從大到小的順序從第二指標(biāo)集中取出固定數(shù)量的性能指標(biāo)作為原因性能指標(biāo);將第二指標(biāo)集中的各性能指標(biāo)及其對(duì)應(yīng)的相關(guān)性、因果性、原因分值按照原因分值從大到小的順序輸出,以便用戶從中選擇原因性能指標(biāo)。
根據(jù)本發(fā)明的一個(gè)方面,提供一種異常原因定位裝置,駐留于計(jì)算設(shè)備中,適于在待測(cè)設(shè)備中出現(xiàn)異常性能指標(biāo)時(shí),找出導(dǎo)致所述異常性能指標(biāo)出現(xiàn)異常的原因性能指標(biāo),該裝置包括:數(shù)據(jù)獲取模塊,適于獲取異常性能指標(biāo)和多個(gè)性能指標(biāo)的觀測(cè)值的時(shí)間序列;第一分析模塊,適于根據(jù)所述時(shí)間序列分別計(jì)算每一個(gè)性能指標(biāo)與異常性能指標(biāo)的相關(guān)性,將與異常性能指標(biāo)的相關(guān)性大于第一閾值的性能指標(biāo)加入第一指標(biāo)集;第二分析模塊,適于分別計(jì)算第一指標(biāo)集中的每一個(gè)性能指標(biāo)與異常性能指標(biāo)的因果性,將與異常性能指標(biāo)的因果性大于第二閾值的性能指標(biāo)加入第二指標(biāo)集;原因定位模塊,適于根據(jù)所述相關(guān)性和因果性分別確定第二指標(biāo)集中的每一個(gè)性能指標(biāo)的原因分值,并根據(jù)所述原因分值確定異常性能指標(biāo)的原因性能指標(biāo)。
根據(jù)本發(fā)明的一個(gè)方面,提供一種計(jì)算設(shè)備,包括如上所述的異常原因定位裝置。
根據(jù)本發(fā)明的技術(shù)方案,首先,通過計(jì)算各性能指標(biāo)與異常性能指標(biāo)的相關(guān)性,找出與異常性能指標(biāo)相關(guān)聯(lián)的性能指標(biāo),形成第一指標(biāo)集;隨后,計(jì)算第一指標(biāo)集中的每一個(gè)性能指標(biāo)與異常性能指標(biāo)的因果性,找出與異常性能指標(biāo)之間因果關(guān)系較強(qiáng)的性能指標(biāo),形成第二指標(biāo)集;隨后,根據(jù)相關(guān)性和因果性來確定第二指標(biāo)集中每一個(gè)性能指標(biāo)的原因分值,并根據(jù)原因分值來確定異常性能指標(biāo)的原因性能指標(biāo)。
本發(fā)明的技術(shù)方案將相關(guān)性作為因果性的必要條件,分三步(相關(guān)性、因果性、原因分值)來確定原因性能指標(biāo),提高了原因定位結(jié)果的準(zhǔn)確性。此外,本發(fā)明采用兩次篩選的技術(shù)方案:第一,通過相關(guān)性檢驗(yàn)篩掉一部分與異常性能指標(biāo)無關(guān)的性能指標(biāo),將與異常性能指標(biāo)相關(guān)的指標(biāo)加入第一指標(biāo)集,該算法的時(shí)間復(fù)雜度僅為O(N);第二,通過因果性檢驗(yàn)再篩掉一部分性能指標(biāo),將與異常性能指標(biāo)具有因果關(guān)系的指標(biāo)加入第二指標(biāo)集,該算法的時(shí)間復(fù)雜度為O(N^2)。以上方案避免了直接計(jì)算每一個(gè)性能指標(biāo)與異常性能指標(biāo)之間的因果性所帶來的時(shí)間浪費(fèi)和計(jì)算資源消耗,節(jié)省了計(jì)算時(shí)間,能夠?qū)崿F(xiàn)實(shí)時(shí)的異常原因定位。當(dāng)待測(cè)性能指標(biāo)較多時(shí),本方案的優(yōu)勢(shì)會(huì)更加明顯。
附圖說明
為了實(shí)現(xiàn)上述以及相關(guān)目的,本文結(jié)合下面的描述和附圖來描述某些說明性方面,這些方面指示了可以實(shí)踐本文所公開的原理的各種方式,并且所有方面及其等效方面旨在落入所要求保護(hù)的主題的范圍內(nèi)。通過結(jié)合附圖閱讀下面的詳細(xì)描述,本公開的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯。遍及本公開,相同的附圖標(biāo)記通常指代相同的部件或元素。
圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的異常原因定位系統(tǒng)100的示意圖;
圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的計(jì)算設(shè)備200的結(jié)構(gòu)圖;
圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的異常原因定位裝置300的結(jié)構(gòu)圖;
圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的異常原因定位方法400的流程圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的異常原因定位系統(tǒng)100的示意圖。如圖1所示,異常原因定位系統(tǒng)100包括計(jì)算設(shè)備200和多個(gè)待測(cè)設(shè)備1~N。應(yīng)當(dāng)指出,圖1中所示的異常原因定位系統(tǒng)100僅是示例性的,在具體的實(shí)踐情況中,異常原因定位系統(tǒng)100中可以具有不同數(shù)量的計(jì)算設(shè)備和待測(cè)設(shè)備,計(jì)算設(shè)備和待測(cè)設(shè)備也可以駐留在多個(gè)地理位置中,本發(fā)明對(duì)異常原因定位系統(tǒng)中所包括的計(jì)算設(shè)備以及待測(cè)設(shè)備的配置方式不做限制。
計(jì)算設(shè)備200可以實(shí)現(xiàn)為服務(wù)器,例如文件服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用程序服務(wù)器和WEB服務(wù)器等,也可以實(shí)現(xiàn)為包括桌面計(jì)算機(jī)和筆記本計(jì)算機(jī)配置的個(gè)人計(jì)算機(jī)。此外,計(jì)算設(shè)備200還可以實(shí)現(xiàn)為小尺寸便攜(或者移動(dòng))電子設(shè)備的一部分,這些電子設(shè)備可以是諸如蜂窩電話、個(gè)人數(shù)字助理(PDA)、個(gè)人媒體播放器設(shè)備、無線網(wǎng)絡(luò)瀏覽設(shè)備、個(gè)人頭戴設(shè)備、應(yīng)用專用設(shè)備、或者可以包括上面任何功能的混合設(shè)備。待測(cè)設(shè)備可以是桌面電腦、筆記本電腦、平板電腦、手機(jī)等具有運(yùn)算能力的設(shè)備。
計(jì)算設(shè)備200可以與一個(gè)或多個(gè)待測(cè)設(shè)備相連,以采集各待測(cè)設(shè)備的性能指標(biāo)數(shù)據(jù),并在檢測(cè)到某個(gè)待測(cè)設(shè)備出現(xiàn)異常性能指標(biāo)時(shí),找出導(dǎo)致該異常性能指標(biāo)出現(xiàn)異常的原因性能指標(biāo)。根據(jù)一種優(yōu)選的實(shí)施例,也可以由除了計(jì)算設(shè)備200之外的其他計(jì)算設(shè)備來實(shí)現(xiàn)性能指標(biāo)數(shù)據(jù)的原始采集,并將采集到的數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)庫(kù),計(jì)算設(shè)備200從數(shù)據(jù)庫(kù)中獲取需要的信息,以找出導(dǎo)致異常性能指標(biāo)出現(xiàn)異常的原因性能指標(biāo)。
圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的計(jì)算設(shè)備200的結(jié)構(gòu)圖。在基本配置202中,計(jì)算設(shè)備200典型地包括系統(tǒng)存儲(chǔ)器206和一個(gè)或者多個(gè)處理器204。存儲(chǔ)器總線208可以用于在處理器204和系統(tǒng)存儲(chǔ)器206之間的通信。
取決于期望的配置,處理器204可以是任何類型的處理,包括但不限于:微處理器(μP)、微控制器(μC)、數(shù)字信息處理器(DSP)或者它們的任何組合。處理器204可以包括諸如一級(jí)高速緩存210和二級(jí)高速緩存212之類的一個(gè)或者多個(gè)級(jí)別的高速緩存、處理器核心214和寄存器216。示例的處理器核心214可以包括運(yùn)算邏輯單元(ALU)、浮點(diǎn)數(shù)單元(FPU)、數(shù)字信號(hào)處理核心(DSP核心)或者它們的任何組合。示例的存儲(chǔ)器控制器218可以與處理器204一起使用,或者在一些實(shí)現(xiàn)中,存儲(chǔ)器控制器218可以是處理器204的一個(gè)內(nèi)部部分。
取決于期望的配置,系統(tǒng)存儲(chǔ)器206可以是任意類型的存儲(chǔ)器,包括但不限于:易失性存儲(chǔ)器(諸如RAM)、非易失性存儲(chǔ)器(諸如ROM、閃存等)或者它們的任何組合。系統(tǒng)存儲(chǔ)器206可以包括操作系統(tǒng)220、一個(gè)或者多個(gè)應(yīng)用222以及程序數(shù)據(jù)224。在一些實(shí)施方式中,應(yīng)用222可以布置為在操作系統(tǒng)上利用程序數(shù)據(jù)224進(jìn)行操作。
計(jì)算設(shè)備200還可以包括有助于從各種接口設(shè)備(例如,輸出設(shè)備242、外設(shè)接口244和通信設(shè)備246)到基本配置102經(jīng)由總線/接口控制器230的通信的接口總線240。示例的輸出設(shè)備242包括圖形處理單元248和音頻處理單元250。它們可以被配置為有助于經(jīng)由一個(gè)或者多個(gè)A/V端口252與諸如顯示器或者揚(yáng)聲器之類的各種外部設(shè)備進(jìn)行通信。示例外設(shè)接口244可以包括串行接口控制器254和并行接口控制器256,它們可以被配置為有助于經(jīng)由一個(gè)或者多個(gè)I/O端口258和諸如輸入設(shè)備(例如,鍵盤、鼠標(biāo)、筆、語音輸入設(shè)備、觸摸輸入設(shè)備)或者其他外設(shè)(例如打印機(jī)、掃描儀等)之類的外部設(shè)備進(jìn)行通信。示例的通信設(shè)備246可以包括網(wǎng)絡(luò)控制器260,其可以被布置為便于經(jīng)由一個(gè)或者多個(gè)通信端口264與一個(gè)或者多個(gè)其他計(jì)算設(shè)備262通過網(wǎng)絡(luò)通信鏈路的通信。
網(wǎng)絡(luò)通信鏈路可以是通信介質(zhì)的一個(gè)示例。通信介質(zhì)通??梢泽w現(xiàn)為在諸如載波或者其他傳輸機(jī)制之類的調(diào)制數(shù)據(jù)信號(hào)中的計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊,并且可以包括任何信息遞送介質(zhì)。“調(diào)制數(shù)據(jù)信號(hào)”可以這樣的信號(hào),它的數(shù)據(jù)集中的一個(gè)或者多個(gè)或者它的改變可以在信號(hào)中編碼信息的方式進(jìn)行。作為非限制性的示例,通信介質(zhì)可以包括諸如有線網(wǎng)絡(luò)或者專線網(wǎng)絡(luò)之類的有線介質(zhì),以及諸如聲音、射頻(RF)、微波、紅外(IR)或者其它無線介質(zhì)在內(nèi)的各種無線介質(zhì)。這里使用的術(shù)語計(jì)算機(jī)可讀介質(zhì)可以包括存儲(chǔ)介質(zhì)和通信介質(zhì)二者。
在本發(fā)明中,計(jì)算設(shè)備200的應(yīng)用222中包括異常原因定位裝置300,使得計(jì)算設(shè)備100能夠在待測(cè)設(shè)備中出現(xiàn)異常性能指標(biāo)時(shí),找出導(dǎo)致該異常性能指標(biāo)出現(xiàn)異常的原因性能指標(biāo)。異常原因定位裝置300可以作為搜索引擎的一個(gè)插件駐留于計(jì)算設(shè)備200的瀏覽器中,或作為一個(gè)獨(dú)立的軟件安裝于計(jì)算設(shè)備200中,本發(fā)明對(duì)裝置300在計(jì)算設(shè)備200中的存在形式不做限制。
圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的異常原因定位裝置300的結(jié)構(gòu)圖。如圖3所示,異常原因定位裝置300包括數(shù)據(jù)獲取模塊310、第一分析模塊320、第二分析模塊330和原因定位模塊340。
數(shù)據(jù)獲取模塊310適于獲取異常性能指標(biāo)和多個(gè)性能指標(biāo)的觀測(cè)值的時(shí)間序列。當(dāng)然,數(shù)據(jù)獲取模塊310沒必要獲取由全部觀測(cè)值所構(gòu)成的時(shí)間序列,而僅獲取由距離當(dāng)前時(shí)刻最近的多個(gè)觀測(cè)值所構(gòu)成的時(shí)間序列即可。根據(jù)一種實(shí)施例,數(shù)據(jù)獲取模塊310適于獲取由距離當(dāng)前時(shí)刻最近的180個(gè)觀測(cè)值所構(gòu)成的時(shí)間序列,即,時(shí)間序列的長(zhǎng)度為180(時(shí)間序列的長(zhǎng)度即為該時(shí)間序列中所包括的觀測(cè)值的數(shù)目)。當(dāng)然,在其他的實(shí)施例中,時(shí)間序列的長(zhǎng)度也可以被設(shè)為其他數(shù)值,本發(fā)明對(duì)此并無限制。
數(shù)據(jù)獲取模塊310在獲取了異常性能指標(biāo)和多個(gè)性能指標(biāo)的觀測(cè)值的時(shí)間序列后,將各時(shí)間序列發(fā)送至第一分析模塊320,由第一分析模塊320來根據(jù)時(shí)間序列分別計(jì)算每一個(gè)性能指標(biāo)與異常性能指標(biāo)的相關(guān)性,并將與異常性能指標(biāo)的相關(guān)性大于第一閾值的性能指標(biāo)加入第一指標(biāo)集。
根據(jù)一種實(shí)施例,第一分析模塊適于按照以下公式計(jì)算相關(guān)性:
其中,n為時(shí)間序列中所包括的觀測(cè)值的數(shù)目,x表示性能指標(biāo),xi為性能指標(biāo)x的時(shí)間序列中的第i個(gè)觀測(cè)值,為性能指標(biāo)x的時(shí)間序列中的觀測(cè)值的平均值,y表示異常性能指標(biāo),yi為異常性能指標(biāo)y的時(shí)間序列中的第i個(gè)觀測(cè)值,為異常性能指標(biāo)y的時(shí)間序列中的觀測(cè)值的平均值。
根據(jù)一種實(shí)施例,第一閾值可以設(shè)為0.7。當(dāng)然,在另外的實(shí)施例中,也可以將第一閾值設(shè)為0.6、0.8等其他[0,1]范圍內(nèi)的數(shù)值,優(yōu)選地,為了保證準(zhǔn)確的原因定位結(jié)果,第一閾值在[0.5,1]的范圍內(nèi)取值為佳。
第一分析模塊320通過計(jì)算各性能指標(biāo)與異常性能指標(biāo)的相關(guān)性,并將與異常性能指標(biāo)的相關(guān)性大于第一閾值的性能指標(biāo)加入第一指標(biāo)集。隨后,第一分析模塊320將第一指標(biāo)集中的各性能指標(biāo)的時(shí)間序列發(fā)送至第二分析模塊330,第二分析模塊330分別計(jì)算第一指標(biāo)集中的每一個(gè)性能指標(biāo)與異常性能指標(biāo)的因果性,將與異常性能指標(biāo)的因果性大于第二閾值的性能指標(biāo)加入第二指標(biāo)集。
根據(jù)一種實(shí)施例,第二分析模塊330適于按照以下步驟計(jì)算因果性:
1)建立以下兩個(gè)回歸模型:
模型一:y1t=a0+a1yt-1+a2yt-2+…+amyt-m
模型二:y2t=b0+b1yt-1+b2yt-2+…+bmyt-m+c0+c1xt-1+c2xt-2+…+cmxt-m
其中,yt-1為異常性能指標(biāo)y在(t-1)時(shí)刻的觀測(cè)值,xt-1為性能指標(biāo)x在(t-1)時(shí)刻的觀測(cè)值,m為滯后項(xiàng)數(shù),a0~am、b0~bm、c0~cm均為待定系數(shù)。根據(jù)一種實(shí)施例,m=2,當(dāng)然,在其他的實(shí)施例中,m也可以為其他數(shù)值,本發(fā)明對(duì)此不做限制。
2)根據(jù)異常性能指標(biāo)y和性能指標(biāo)x的時(shí)間序列求解上述兩個(gè)回歸模型,確定待定系數(shù)a0~am、b0~bm、c0~cm的值。根據(jù)一種實(shí)施例,采用最小二乘法對(duì)上述兩個(gè)模型分別進(jìn)行線性回歸,得出待定系數(shù)a0~am、b0~bm、c0~cm的值。當(dāng)然,除此之外,也可以采用其他方法來求解a0~am、b0~bm、c0~cm,本發(fā)明對(duì)此不做限制。
3)按照以下公式計(jì)算F檢驗(yàn)值:
其中,m為滯后項(xiàng)數(shù),n為時(shí)間序列中所包括的觀測(cè)值的數(shù)目,根據(jù)一種實(shí)施例,m=2,n=180。RSS1為模型一的殘差平方和,RSS2為模型二的殘差平方和,有:
其中,yt為異常性能指標(biāo)y在t時(shí)刻的觀測(cè)值,y1t為根據(jù)模型一得到的異常性能指標(biāo)y在t時(shí)刻的預(yù)測(cè)值,y2t為根據(jù)模型二得到的異常性能指標(biāo)y在t時(shí)刻的預(yù)測(cè)值。
4)根據(jù)F檢驗(yàn)值確定顯著性p_value。根據(jù)一種實(shí)施例,顯著性p_value的計(jì)算方式有以下兩種:
第一種:顯著性p_value可以通過查詢顯著性水平為(1-第二閾值)的F分布臨界值表得出,其中,在查詢所述F分布臨界值表時(shí),自由度為(m,n-2m-1)。例如,當(dāng)?shù)诙撝担?.85,m=2,n-2m-1=175時(shí),在顯著性水平為0.15的F分布臨界值表中查詢自由度為(2,175)時(shí)的F臨界值,該臨界值即為p_value。
第二種:顯著性p_value可以按照以下公式計(jì)算:
p_value=1-P(F檢驗(yàn)值) (5)
其中,P(z)為自由度為(m,n-2m-1)的F分布的累積分布函數(shù),P(F檢驗(yàn)值)為累積分布函數(shù)P(z)在z=F檢驗(yàn)值時(shí)的取值。
公式(5)也可以轉(zhuǎn)化為以下形式:
其中,p(z)為自由度為(m,n-2m-1)的F分布的概率密度函數(shù)。對(duì)p(z)在區(qū)間(-∞,F檢驗(yàn)值)上求積分,相當(dāng)于求P(z)在z=F檢驗(yàn)值時(shí)的取值。
5)將(1-p_value)作為性能指標(biāo)x和異常性能指標(biāo)y的因果性。
第二分析模塊330按照以上步驟計(jì)算第一指標(biāo)集中各性能指標(biāo)與異常性能指標(biāo)的因果性,并將與異常性能指標(biāo)的因果性大于第二閾值的性能指標(biāo)加入第二指標(biāo)集。根據(jù)一種實(shí)施例,第二閾值為0.85。當(dāng)然,在其他的實(shí)施例中,第二閾值也可以設(shè)為其他數(shù)值,本發(fā)明對(duì)此不做限制。
第二分析模塊330計(jì)算得出第二指標(biāo)集后,由原因定位模塊340基于相關(guān)性和因果性分別確定第二指標(biāo)集中的每一個(gè)性能指標(biāo)的原因分值,并根據(jù)原因分值來定異常性能指標(biāo)的原因性能指標(biāo)。
根據(jù)一種實(shí)施例,原因定位模塊340按照以下公式來分別確定第二指標(biāo)集中各性能指標(biāo)的原因分值:
score=w1*相關(guān)性+w2*因果性 (7)
其中,w1、w2分別為相關(guān)性、因果性的權(quán)重,有0≤w1≤1,0≤w2≤1,w1+w2=1。w1、w2的具體取值可以由本領(lǐng)域技術(shù)人員自行設(shè)置,根據(jù)一種實(shí)施例,w1=w2=0.5。
在計(jì)算出第二指標(biāo)集中各性能指標(biāo)的原因分值之后,原因定位模塊340根據(jù)原因分值來確定異常性能指標(biāo)的原因性能指標(biāo)。根據(jù)一種實(shí)施例,原因定位模塊340可以采用以下方式中的任一種來確定原因性能指標(biāo):將第二指標(biāo)集中原因分值最大的性能指標(biāo)作為原因性能指標(biāo);將第二指標(biāo)集中原因分值大于第三閾值的性能指標(biāo)作為原因性能指標(biāo);按照原因分值從大到小的順序從第二指標(biāo)集中取出固定數(shù)量的性能指標(biāo)作為原因性能指標(biāo);將第二指標(biāo)集中的各性能指標(biāo)及其對(duì)應(yīng)的相關(guān)性、因果性、原因分值按照原因分值從大到小的順序輸出,以便用戶從中選擇原因性能指標(biāo)。當(dāng)然,根據(jù)原因分值來確定原因性能指標(biāo)的方式有很多種,并不限于上面所列的4種方式,本領(lǐng)域技術(shù)人員可以自行設(shè)置原因性能指標(biāo)的選擇方法。
圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的異常原因定位方法400的流程圖。如圖4所示,該方法始于步驟S410。
在步驟S410中,獲取異常性能指標(biāo)和多個(gè)性能指標(biāo)的觀測(cè)值的時(shí)間序列。根據(jù)一種實(shí)施例,每一個(gè)時(shí)間序列均為由距離當(dāng)前時(shí)刻最近的180個(gè)觀測(cè)值所構(gòu)成,即時(shí)間序列的長(zhǎng)度為180。
隨后,在步驟S420中,根據(jù)時(shí)間序列分別計(jì)算每一個(gè)性能指標(biāo)與異常性能指標(biāo)的相關(guān)性,將與異常性能指標(biāo)的相關(guān)性大于第一閾值的性能指標(biāo)加入第一指標(biāo)集。根據(jù)一種實(shí)施例,相關(guān)性按照前述公式(1)來計(jì)算,第一閾值設(shè)為0.7。
隨后,在步驟S430中,分別計(jì)算第一指標(biāo)集中的每一個(gè)性能指標(biāo)與異常性能指標(biāo)的因果性,將與異常性能指標(biāo)的因果性大于第二閾值的性能指標(biāo)加入第二指標(biāo)集。步驟S430的具體過程可以參考前述對(duì)第二分析模塊330的描述,此處不再贅述。
隨后,在步驟S440中,根據(jù)相關(guān)性和因果性分別確定第二指標(biāo)集中的每一個(gè)性能指標(biāo)的原因分值。根據(jù)一種實(shí)施例,原因分值可以按照公式(7)進(jìn)行計(jì)算,其中,w1=w2=0.5。
隨后,在步驟S450中,根據(jù)原因分值確定異常性能指標(biāo)的原因性能指標(biāo)。根據(jù)一種實(shí)施例,可以采用以下方式中的任意一種來確定原因性能指標(biāo):將第二指標(biāo)集中原因分值最大的性能指標(biāo)作為原因性能指標(biāo);將第二指標(biāo)集中原因分值大于第三閾值的性能指標(biāo)作為原因性能指標(biāo);按照原因分值從大到小的順序從第二指標(biāo)集中取出固定數(shù)量的性能指標(biāo)作為原因性能指標(biāo);將第二指標(biāo)集中的各性能指標(biāo)及其對(duì)應(yīng)的相關(guān)性、因果性、原因分值按照原因分值從大到小的順序輸出,以便用戶從中選擇原因性能指標(biāo)。
本發(fā)明的技術(shù)方案能夠在待測(cè)設(shè)備中出現(xiàn)異常性能指標(biāo)時(shí),找出導(dǎo)致該異常性能指標(biāo)出現(xiàn)異常的原因性能指標(biāo),即實(shí)現(xiàn)異常原因的定位。本發(fā)明將相關(guān)性作為因果性的必要條件,分三步(相關(guān)性、因果性、原因分值)來確定原因性能指標(biāo),提高了原因定位結(jié)果的準(zhǔn)確性。此外,兩次篩選的技術(shù)方案(通過相關(guān)性檢驗(yàn)篩掉一部分與異常性能指標(biāo)無關(guān)的性能指標(biāo),通過因果性檢驗(yàn)再篩掉一部分性能指標(biāo))也避免了直接排查每一個(gè)性能指標(biāo)是否為原因性能指標(biāo)所帶來的時(shí)間浪費(fèi)和計(jì)算資源消耗,節(jié)省了運(yùn)算時(shí)間。
A6:A1所述的異常原因定位方法,其中,所述原因分值按照以下公式確定:
score=w1*相關(guān)性+w2*因果性
其中,0≤w1≤1,0≤w2≤1,w1+w2=1。
A7:A6所述的異常原因定位方法,其中,w1=w2=0.5。
A8:A1所述的異常原因定位方法,其中,根據(jù)所述原因分值確定異常性能指標(biāo)的原因性能指標(biāo)可以采用以下方式中的任一種:
將第二指標(biāo)集中原因分值最大的性能指標(biāo)作為原因性能指標(biāo);
將第二指標(biāo)集中原因分值大于第三閾值的性能指標(biāo)作為原因性能指標(biāo);
按照原因分值從大到小的順序從第二指標(biāo)集中取出固定數(shù)量的性能指標(biāo)作為原因性能指標(biāo);
將第二指標(biāo)集中的各性能指標(biāo)及其對(duì)應(yīng)的相關(guān)性、因果性、原因分值按照原因分值從大到小的順序輸出,以便用戶從中選擇原因性能指標(biāo)。
B13:B11所述的異常原因定位裝置,其中,顯著性p_value可以按照以下公式計(jì)算:
p_value=1-P(F檢驗(yàn)值)
其中,P(z)為自由度為(m,n-2m-1)的F分布的累積分布函數(shù),P(F檢驗(yàn)值)為累積分布函數(shù)P(z)在z=F檢驗(yàn)值時(shí)的取值。
B14:B9所述的異常原因定位裝置,其中,所述原因定位模塊適于按照以下公式確定所述原因分值:
score=w1*相關(guān)性+w2*因果性
其中,0≤w1≤1,0≤w2≤1,w1+w2=1。
B15:B14所述的異常原因定位裝置,其中,w1=w2=0.5。
B16:B9所述的異常原因定位裝置,其中,所述原因定位模塊適于采用以下方式中的任一種來確定原因性能指標(biāo):
將第二指標(biāo)集中原因分值最大的性能指標(biāo)作為原因性能指標(biāo);
將第二指標(biāo)集中原因分值大于第三閾值的性能指標(biāo)作為原因性能指標(biāo);
按照原因分值從大到小的順序從第二指標(biāo)集中取出固定數(shù)量的性能指標(biāo)作為原因性能指標(biāo);
將第二指標(biāo)集中的各性能指標(biāo)及其對(duì)應(yīng)的相關(guān)性、因果性、原因分值按照原因分值從大到小的順序輸出,以便用戶從中選擇原因性能指標(biāo)。
在此處所提供的說明書中,算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與本發(fā)明的示例一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下被實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員應(yīng)當(dāng)理解在本文所公開的示例中的設(shè)備的模塊或單元或組件可以布置在如該實(shí)施例中所描述的設(shè)備中,或者可替換地可以定位在與該示例中的設(shè)備不同的一個(gè)或多個(gè)設(shè)備中。前述示例中的模塊可以組合為一個(gè)模塊或者此外可以分成多個(gè)子模塊。
本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
此外,所述實(shí)施例中的一些在此被描述成可以由計(jì)算機(jī)系統(tǒng)的處理器或者由執(zhí)行所述功能的其它裝置實(shí)施的方法或方法元素的組合。因此,具有用于實(shí)施所述方法或方法元素的必要指令的處理器形成用于實(shí)施該方法或方法元素的裝置。此外,裝置實(shí)施例的在此所述的元素是如下裝置的例子:該裝置用于實(shí)施由為了實(shí)施該發(fā)明的目的的元素所執(zhí)行的功能。
如在此所使用的那樣,除非另行規(guī)定,使用序數(shù)詞“第一”、“第二”、“第三”等等來描述普通對(duì)象僅僅表示涉及類似對(duì)象的不同實(shí)例,并且并不意圖暗示這樣被描述的對(duì)象必須具有時(shí)間上、空間上、排序方面或者以任意其它方式的給定順序。
盡管根據(jù)有限數(shù)量的實(shí)施例描述了本發(fā)明,但是受益于上面的描述,本技術(shù)領(lǐng)域內(nèi)的技術(shù)人員明白,在由此描述的本發(fā)明的范圍內(nèi),可以設(shè)想其它實(shí)施例。此外,應(yīng)當(dāng)注意,本說明書中使用的語言主要是為了可讀性和教導(dǎo)的目的而選擇的,而不是為了解釋或者限定本發(fā)明的主題而選擇的。因此,在不偏離所附權(quán)利要求書的范圍和精神的情況下,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說許多修改和變更都是顯而易見的。對(duì)于本發(fā)明的范圍,對(duì)本發(fā)明所做的公開是說明性的,而非限制性的,本發(fā)明的范圍由所附權(quán)利要求書限定。