本申請涉及計算機應用領(lǐng)域,尤其涉及一種基于圖像特征的業(yè)務異常檢測方法及裝置。
背景技術(shù):
隨著計算機網(wǎng)絡技術(shù)的普及率不斷提高,應用場景不斷豐富,網(wǎng)絡規(guī)模在不斷擴大,而且各種網(wǎng)絡技術(shù)也層出不窮。在網(wǎng)絡發(fā)展帶來信息爆炸式發(fā)展帶來便利的同時,也同時會面臨一些新的挑戰(zhàn),尤其是對于一些異常問題的檢測。
一方面,網(wǎng)絡越復雜,可能出現(xiàn)問題的環(huán)節(jié)也越多,網(wǎng)絡出現(xiàn)異常問題的概率也就更大;另一方面,由于網(wǎng)絡結(jié)構(gòu)錯綜復雜,快速而準確的發(fā)現(xiàn)和找到問題根源也更加困難;而且,當某一個網(wǎng)絡出現(xiàn)異常問題,該異常問題可能會向依賴該網(wǎng)絡的其它網(wǎng)絡傳播,從而導致依賴該網(wǎng)絡的其它網(wǎng)絡也會異常。因此,為了保障網(wǎng)絡的正常運行,有必要采取有效的措施對網(wǎng)絡進行監(jiān)督和管理,一旦發(fā)現(xiàn)業(yè)務異常情況,能夠及時發(fā)現(xiàn)問題,并且迅速解決。
然而,在相關(guān)技術(shù)中,對網(wǎng)絡進行業(yè)務異常檢測,通常是在后臺通過檢測網(wǎng)絡流量來完成的,而網(wǎng)絡中的流量通常并不穩(wěn)定,因此會影響異常檢測的準確度。
技術(shù)實現(xiàn)要素:
本申請?zhí)岢鲆环N基于圖像特征的業(yè)務異常檢測方法,該方法包括:
從目標頁面的頁面圖像中提取圖像特征;
將提取出的所述圖像特征輸入預設的異常檢測模型中進行計算;其中,所述異常檢測模型為基于從若干正常頁面以及異常界面中提取出的圖像特征訓練得到的機器學習模型;
基于所述異常檢測模型的計算結(jié)果針對所述目標頁面進行異常檢測。
可選的,所述方法還包括:
基于預設的若干樣本頁面的頁面圖像生成圖像樣本集合;其中,所述圖像樣本集合中的正常頁面的頁面圖像以及異常頁面的頁面圖像均被標定了對應的識別標簽;
分別提取所述圖像樣本集合中的頁面圖像的圖像特征;
將提取出的圖像特征作為訓練樣本,基于預設的機器學習算法進行訓練以得到所述異常檢測模型。
可選的,所述異常檢測模型為SVM支持向量機模型。
可選的,所述圖像特征為圖像紋理特征;其中,所述圖像紋理特征包括圖像全局紋理特征和圖像局部紋理特征。
可選的,所述圖像全局紋理特征為GLCM灰度共生矩陣特征;所述圖像局部紋理特征為LBP局部二值模式特征。
本申請還提出一種基于圖像特征的業(yè)務異常檢測裝置,該裝置包括:
提取模塊,從目標頁面的頁面圖像中提取圖像特征;
計算模塊,將提取出的所述圖像特征輸入預設的異常檢測模型中進行計算;其中,所述異常檢測模型為基于從若干正常頁面以及異常界面中提取出的圖像特征訓練得到的機器學習模型;
檢測模塊,基于所述異常檢測模型的計算結(jié)果針對所述目標頁面進行異常檢測。
可選的,所述提取模塊進一步:
基于預設的若干樣本頁面的頁面圖像生成圖像樣本集合;其中,所述圖像樣本集合中的正常頁面的頁面圖像以及異常頁面的頁面圖像均被標定了對應的識別標簽;分別提取所述圖像樣本集合中的頁面圖像的圖像特征;
所述裝置還包括:
訓練模塊,將提取出的圖像特征作為訓練樣本,基于預設的機器學習算法進行訓練以得到所述異常檢測模型。
可選的,所述異常檢測模型為SVM模型。
可選的,所述圖像特征為圖像紋理特征;其中,所述圖像紋理特征包括圖像全局紋理特征和圖像局部紋理特征。
可選的,所述圖像全局紋理特征為GLCM灰度共生矩陣特征;所述圖像局部紋理特征為LBP局部二值模式特征。
本申請中,通過從若干正常頁面以及異常界面中提取出的圖像特征訓練機器學習模型,當需要進行異常檢測時,可以從目標頁面的頁面圖像中提取圖像特征,并將提取出的圖像特征輸入異常檢測模型中進行計算,然后根據(jù)計算結(jié)果針對該目標頁面進行異常檢測;實現(xiàn)了可以完全基于從目標頁面的頁面圖像中提取出的圖像特征,在前臺完成異常檢測,而不再需要在后臺通過流量檢測來執(zhí)行異常檢測,因而可以提升異常檢測的穩(wěn)定性;同時,通過從正常頁面以及異常界面中提取出的圖像特征訓練機器學習模型,并使用機器學習模型針對目標頁面進行異常檢測,能夠提升異常檢測的準確度。
附圖說明
圖1是本申請一實施例示出的一種基于圖像特征的業(yè)務異常檢測方法的流程圖;
圖2是本申請一實施例示出的一種異常檢測模型的離線訓練以及實時使用的流程示意圖;
圖3是本申請一實施例示出的一種基于圖像特征的業(yè)務異常檢測裝置的邏輯框圖;
圖4是本申請一實施例提供的承載所述一種基于圖像特征的業(yè)務異常檢測裝置的異常檢測設備的硬件結(jié)構(gòu)圖。
具體實施方式
在相關(guān)技術(shù)中,對網(wǎng)絡進行業(yè)務異常檢測,通常是在后臺通過檢測網(wǎng)絡流量來完成的。現(xiàn)有的業(yè)務異常檢測主要有以下幾種實現(xiàn)方案:
第一種方案,基于經(jīng)驗閾值的業(yè)務異常檢測方案。
在這種方案中,通常需要網(wǎng)絡管理人員根據(jù)網(wǎng)絡管理的豐富經(jīng)驗,來確定出網(wǎng)絡性能和流量參數(shù)的閾值,當網(wǎng)絡在某個時刻的性能參數(shù)和流量超過某個閾值時,就認為此時的網(wǎng)絡出現(xiàn)了業(yè)務異常。這種方案的核心在于,確定出較為合理的閾值,如果閾值設置太小,會導致業(yè)務異常情況的誤報;當閾值設置過高,則容易導致業(yè)務異常情況的漏報。
然而,這種基于經(jīng)驗閾值的方案,通常要求網(wǎng)絡管理人員對網(wǎng)絡中的流量數(shù)據(jù)有著豐富的管理經(jīng)驗,需要耗費大量的人力和物力對于流量進行人工分析。而且,實際的網(wǎng)絡流量本身并不穩(wěn)定,不同的網(wǎng)絡結(jié)構(gòu),不同應用場景下的流量數(shù)據(jù)特征通常完全不同,因而使得閾值的設定非常困難;如果閾值設置太小,會導致異常情況的誤報;當閾值設置過高,則容易導致異常情況的漏報;并且,在某個應用中設定的閾值,在其他應用中可能完全無法適用。
第二種方案,基于統(tǒng)計學的流量異常監(jiān)測方案。
例如,可以采用GLR(Generalized Likelihood Ratio)監(jiān)測方法,這種方案通常是基于時間窗口序列,計算相鄰時間窗口序列的回歸模型參數(shù),得到似然聯(lián)合比,如果當前似然聯(lián)合比大于一定的閾值,就進行異常監(jiān)測的報警。這種方案的核心在于,通檢測網(wǎng)絡流量平均觀測值的平移或跳躍行為,從而達到異常檢測的目的。
然而,這種基于統(tǒng)計學的異常監(jiān)測,通常要求流量數(shù)據(jù)有著明顯的數(shù)據(jù)分布特征,比如符合高斯分布,泊松分布等;當數(shù)據(jù)分布較為理想,異常檢測的準確率就較高;當網(wǎng)絡流量不穩(wěn)定,造成歷史數(shù)據(jù)較少,數(shù)據(jù)可能就會不符合某種分布,使得統(tǒng)計的參數(shù)不準確,從而導致檢測準確率較低。
第三種方案,基于小波變換的流量異常檢測方案。
小波變換是一種結(jié)合時間和空間特性的數(shù)據(jù)分析方案,通過小波分析,可以把數(shù)據(jù)流量信號分解到不同的頻帶,從而得到不同頻帶的特征,對于異常檢測,檢測率較高。
然而,基于小波分析的異常檢測方案,對于數(shù)據(jù)流量微小的變動都會檢測出來,而實際的網(wǎng)絡流量本身并不穩(wěn)定,容易出現(xiàn)正常的波動,因此通過小波分析來進行異常檢測,就會出現(xiàn)較多的誤報,造成檢測不準確。
可見,在相關(guān)技術(shù)中,對網(wǎng)絡進行業(yè)務異常檢測,通常是依賴于在后臺檢測網(wǎng)絡流量來完成的,而實際的網(wǎng)絡流量通常并不穩(wěn)定,因此網(wǎng)絡流量的波動會導致異常檢測的穩(wěn)定性以及準確度較差的問題。
有鑒于此,本申請?zhí)岢鲆环N基于圖像特征的業(yè)務異常檢測方法,通過從若干正常頁面以及異常界面中提取出的圖像特征訓練機器學習模型,當需要進行異常檢測時,可以從目標頁面的頁面圖像中提取圖像特征,并將提取出的圖像特征輸入異常檢測模型中進行計算,然后根據(jù)計算結(jié)果針對該目標頁面進行異常檢測;實現(xiàn)了可以完全基于從目標頁面的頁面圖像中提取出的圖像特征,在前臺完成異常檢測,而不再需要在后臺通過流量檢測來執(zhí)行異常檢測,因而可以提升異常檢測的穩(wěn)定性;同時,通過從正常頁面以及異常界面中提取出的圖像特征訓練機器學習模型,并使用機器學習模型針對目標頁面進行異常檢測,能夠提升異常檢測的準確度。
下面通過具體實施例并結(jié)合具體的應用場景對本申請進行描述。
請參考圖1,圖1是本申請一實施例提供的基于圖像特征的業(yè)務異常檢測方法,應用于異常檢測設備,所述方法執(zhí)行以下步驟:
步驟101,從目標頁面的頁面圖像中提取圖像特征;
步驟102,將提取出的所述圖像特征輸入預設的異常檢測模型中進行計算;其中,所述異常檢測模型為基于從若干正常頁面以及異常界面中提取出的圖像特征訓練得到的機器學習模型;
步驟103,基于所述異常檢測模型的計算結(jié)果針對所述目標頁面進行異常檢測。
上述目標頁面,包括與需要進行異常檢測的目標業(yè)務對應的業(yè)務頁面,該業(yè)務頁面可以用于呈現(xiàn)目標業(yè)務的各類業(yè)務信息或者業(yè)務執(zhí)行結(jié)果。上述正常頁面,可以是指上述目標業(yè)務在未發(fā)生業(yè)務異常時的業(yè)務頁面;而上述異常頁面,可以是指上述目標頁面在發(fā)生業(yè)務異常時的業(yè)務頁面。
其中,上述業(yè)務異常,可以包括業(yè)務頁面遭受網(wǎng)絡攻擊,或者網(wǎng)絡故障,而導致的頁面訪問異常。上述目標業(yè)務,可以是任何種類的互聯(lián)網(wǎng)業(yè)務,在本例中不進行特別限定;
例如,在電商平臺的應用場景中,當需要針對電商平臺中的商戶進行業(yè)務異常監(jiān)測時,上述目標業(yè)務則可以是電商平臺中與各商戶對應的銷售業(yè)務;上述目標頁面,則可以是用于展示各商戶在電商平臺中出售的商品的銷售頁面。
在傳統(tǒng)的實現(xiàn)中,對目標業(yè)務進行業(yè)務異常檢測,通常是依賴于在后臺檢測網(wǎng)絡流量來完成的,然而由于實際的網(wǎng)絡流量通常并不穩(wěn)定,因此會導致異常檢測的穩(wěn)定性以及準確度均較差的問題。
在本例中,針對目標業(yè)務進行業(yè)務異常檢測,將不再依賴于在后臺進行網(wǎng)絡流量檢測,而是從目標業(yè)務對應的前臺業(yè)務頁面入手,通過從若干與目標業(yè)務對應的正常頁面以及異常界面中提取出的圖像特征訓練機器學習模型。當需要對目標業(yè)務進行異常檢測時,可以從該目標業(yè)務的前臺業(yè)務頁面的頁面圖像中提取圖像特征,然后將提取出的改圖像特征輸入訓練完成的異常檢測模型中進行計算,并根據(jù)計算結(jié)果完成針對該目標業(yè)務的異常檢測;從而,可以實現(xiàn)以該目標業(yè)務的前臺業(yè)務頁面中的顯示結(jié)果作為依據(jù),來完成業(yè)務異常檢測,因而可以避免由于實際的網(wǎng)絡流量并不穩(wěn)定,而導致的異常檢測的穩(wěn)定性以及準確度均較差的問題。
以下以模型以及圖像特征的選擇、模型的訓練以及模型的使用三個階段,針對本申請的技術(shù)方案進行詳細描述。
1:選擇機器學習模型以及圖像特征
在本例中,上述異常檢測模型可以采用任意形式的機器學習模型;例如,回歸模型、神經(jīng)網(wǎng)絡模型或者SVM(Support Vector Machine,支持向量機)模型等等。在實際應用中,可以基于實際的建模需求和具體場景,來選擇合適的機器學習模型。
其中,在以上示出的機器學習模型中,支持向量機模型是一種小樣本學習方法,具有不需要進行大規(guī)模樣本學習的特點。因此,在本例示出的一種實施方式中,可以采用支持向量機模型作為上述異常檢測模型。通過這種方式,可以減低建模的復雜度,以及工程上的實現(xiàn)成本。
當然,在實際應用中,也可以采用支持向量機模型以外的其它類型的機器學習模型來實施,在本例中不進行特別限定。
在本例中,上述圖像特征,通常包括圖像的灰度特征、顏色特征、紋理特征以及形狀特征等。其中,對于灰度特征和顏色特征,由于其在頁面中的分布通常非常復雜,因此并不適宜作為異常檢測的圖像特征。而上述形狀特征,在進行提取時,通常需要對頁面圖像進行圖像分割,因此會導致圖像特征的提取時間過長,造成建模算法的時間復雜度較大。
綜上所述,在本例示出的一種實施方式中,可以采用頁面圖像的紋理特征作為上述圖像特征。
其中,由于紋理特征將作為圖像特征用于異常檢測,因此為了提升異常檢測的準確度,上述紋理特征可以同時包含頁面圖像的局部紋理特征和全局紋理特征。
通過這種方式,使得作為圖像特征的紋理特征中,可以同時包含局部紋理特征和全局紋理特征,從而通過局部紋理特征和全局紋理特征相結(jié)合的方式,可以達到特征互補的效果,有助于提升異常檢測的準確度。
在本例示出的一種實施方式中,上述局部紋理特征,可以選擇LBP(Local Binary Pattern,局部二值模式)特征;上述全局紋理特征,可以選擇GLCM(Gray Level Co-occurrence Matrix,灰度共生矩陣)特征。
其中,在本例中,GLCM特征是一種通過圖像灰度變化的二階統(tǒng)計量,來描述圖像的紋理的方法,其受微小變化影響較小,具有很強的抗干擾性。
GLCM的定義:
取圖像(N×N)中任意一點(x,y)及偏離它的另一點(x+a,y+b),設該點對的灰度值為(g1,g2)。令點(x,y)在整個圖像上移動,則會得到各種(g1,g2)值,設灰度值的級數(shù)為k,則(g1,g2)的組合共有k的平方種。對于整個畫面,統(tǒng)計出每一種(g1,g2)值出現(xiàn)的次數(shù),然后排列成一個方陣,再用(g1,g2)出現(xiàn)的總次數(shù)將它們歸一化為出現(xiàn)的概率P(g1,g2),這樣的方陣稱為灰度共生矩陣。
GLCM特征的計算:
灰度共生矩陣的計算量通常包括頁面圖像的能量值(Angular Second Moment,ASM)、熵值(Entropy,ENT)、慣性矩、相關(guān)性值。在計算GLCM特征時,可以分別計算圖像的能量、熵值、慣性矩、相關(guān)性等紋理特征,構(gòu)造四個方向的共生矩陣,然后再針對該四個方向的共生矩陣的取平均值,得到各參數(shù)的均值和標準差作為最終的特征向量,此時得到的最終的特征向量Fglcm即為計算得到的GLCM紋理特征。
其中,需要說明的是,以上示出的能量、熵值、慣性矩、相關(guān)性等四種計算量的具體計算方法,在本例中不再進行詳述,本領(lǐng)域技術(shù)人員在將本例示出的技術(shù)方案付諸實施時,可以參考現(xiàn)有技術(shù)的介紹。
在本例中,LBP特征是一種用來描述圖像局部紋理特征的算子,跟GLCM特征不同的是,LBP特征屬于局部特征,而GLCM特征屬于全局紋理特征,因而LBP特征可以作為GLCM特征的一種補充,從而可以達到互補的效果。
LBP特征的定義:
原始的LBP算子定義為在一個3×3的窗口內(nèi),以窗口中心像素的灰度值為閾值,將中心像素周圍相鄰的8個像素的灰度值與中心元素一一進行比較,如果周圍像素的灰度值大于該中心像素的灰度值,則該像素點的位置被標記為1,否則為0。這樣3×3領(lǐng)域內(nèi)的8個點可產(chǎn)生8位的無符號數(shù),即得到該窗口的LBP值,該LBP值反映該區(qū)域的紋理信息。
LBP特征的計算:
LBP特征可以通過如下公式進行計算:
其中,在以上公式中,LBPP,R(Xc,Yc)表示計算出的LBP特征;gc是窗口中心位置處的像素灰度值,gp是gc鄰域的像素灰度值,P是窗口中像素的個數(shù),R是鄰域的半徑大小,一般可以采用圓形或者方形鄰域。計算完LBP特征之后,圖像變成LBP圖,然后計算LBP圖的直方圖分布特征Flbp,最終計算出的直方圖分布特征Flbp,即為最終的LBP紋理特征。
其中,需要說明的是,計算LBP圖的直方圖分布特征Flbp的具體計算方法,在本例中不再進行詳述,本領(lǐng)域技術(shù)人員在將本例示出的技術(shù)方案付諸實施時,可以參考現(xiàn)有技術(shù)的介紹。
2:異常檢測模型的訓練
以下以將支持向量機模型作為上述異常檢測模型,以及上述圖像特征為GLCM特征和LBP特征為例,對上述模型的訓練過程以及使用過程進行說明。
請參見圖2,圖2為本例示出的一種異常檢測模型的離線訓練以及實時使用的流程示意圖。
如圖2所示,在異常檢測模型的訓練階段,首先可以采集若干樣本頁面,并截取這些樣本頁面的頁面圖像。
其中,上述若干樣本頁面,可以包含若干正常頁面和若干異常頁面。在實際應用中,上述樣本頁面可以是需要進行異常檢測和監(jiān)控的業(yè)務頁面;例如,在電商平臺的應用場景中,當需要針對電商平臺中的商戶進行業(yè)務異常監(jiān)測時,可以將電商平臺中大量的商戶的銷售頁面作為上述樣本頁面。
在采集這些樣本頁面的頁面圖像時,可以由網(wǎng)絡管理人員針對各樣本頁面逐個進行手動截圖;或者,也可以由異常檢測設備,通過模擬人的行為,通過截圖軟件或者截圖程序自動進行截圖,然后對截圖得到的頁面圖像進行集中保存,并基于保存的上述若干樣本頁面的頁面圖像生成圖像樣本集合。
其中,生成的圖像樣本集合中包含的正常頁面的頁面圖像以及異常頁面的頁面圖像,還可以由網(wǎng)絡管理人員手動標定對應的識別標簽,從而通過標定識別標簽,可以將圖像樣本集合中的頁面圖像分類為正常頁面和異常頁面兩種,以便于后續(xù)的模型訓練。
例如,異常檢測設備在自動采集頁面圖像時,可以執(zhí)行以下三個步驟:
1)樣本頁面的自動訪問。首先,可以將需要監(jiān)控和檢測的樣本頁面的訪問鏈接事先準備好,隨后可以自動用一個機器人程序去打開瀏覽器,并且利用這些鏈接,自動打開相應的頁面。
2)頁面圖像的自動截圖。其次,由于需要截圖,因此要求在一個有界面的操作系統(tǒng)中操作,比如,可以通過windows的api或者web截屏控件來進行操作。機器人程序截圖完畢之后,可以將截圖得到的頁面圖像保存在本地硬盤。
3)樣本的準備。最后,保存在本地硬盤中的頁面圖像,需要由網(wǎng)絡管理人員進行人工打標;比如,正常頁面的頁面圖像的識別標簽可以設置為1,異常頁面的頁面圖像的識別標簽可以設置為-1,假設收集到的圖像樣本張數(shù)為n,最終生成的圖像樣本集合為X={x1,x2…xn},識別標簽集合為Y={y1,y2…yn},其中yn的取值為1或者-1。
請繼續(xù)參見圖2,當生成了上述圖像樣本集合后,可以針對圖像樣本集合中的頁面圖像,分別提取GLCM特征和LBP特征。
其中,在提取GLCM特征和LBP特征時,可以通過特定的特征提取工具來完成;例如,在實際應用中,可以使用諸如MATLAB等較為成熟的仿真軟件來實現(xiàn)GLCM特征和LBP特征,具體的特征提取過程,在本例中不再詳述,本領(lǐng)域技術(shù)人員可以參考現(xiàn)有技術(shù)中的記載。
當針對圖像樣本集合中的每一個頁面圖像,分別提取出了GLCM特征和LBP特征后,可以基于提取到的GLCM特征和LBP特征生成一個對應的二維特征向量。
假設GLCM特征記為Fglcm,LBP特征記為Flbp,那么生成的該二維特征向量F={Fglcm,F(xiàn)lbp}。后續(xù)該二維特征向量F將作為訓練樣本,參與支持向量機模型的訓練。
在本例中,當針對圖像樣本集合中的每一個頁面圖像生成了上述二維特征向量F后,可以將生成的該特征向量F作為訓練樣本,基于訓練支持向量機模型的機器學習算法進行模型訓練,以得到上述異常檢測模型。
上述機器學習算法,是指支持向量機模型所支持的核函數(shù)。而訓練支持向量機模型的過程,通常是通過大量訓練樣本,訓練出支持向量機模型的核函數(shù)中的各參數(shù)的過程。
其中,支持向量機模型通常支持若干中常用的核函數(shù),而支持向量機模型中核函數(shù)的選擇,則取決于具體的應用場景,在不同的應用場景下,可以選擇不同的核函數(shù)。
在本例中,出于降低建模的復雜度,以及工程上的實現(xiàn)成本的考慮,可以選擇如下核函數(shù):
Y=Sign(ω×F+ω0)
在以上核函數(shù)中,Y即為異常檢測結(jié)果;如果為異常頁面的圖像特征設置的識別標簽為1,為正常頁面的圖像特征設置的識別標簽為-1,那么Y的取值為1或者-1。Sign為上述核函數(shù)中啟用的Sign函數(shù),Sign函數(shù)用于取數(shù)字n的符號,n大于0返回1,小于0返回-1。F即為提取出的GLCM特征和LBP特征構(gòu)成的上述二維特征向量。ω和ω0即為以上核函數(shù)中需要學習的模型參數(shù)。
在本例中,可以將基于圖像樣本集合中的各頁面圖像的GLCM特征和LBP特征構(gòu)成生成的上述二維特征向量,作為訓練樣本,輸入上述核函數(shù)中進行訓練,通過不斷訓練反向求解出以上需要學習的參數(shù)ω和ω0,并對ω和ω0的取值進行不斷校正,直至以上核函數(shù)收斂時停止。當上述核函數(shù)收斂后,可以將訓練完成的ω和ω0的具體取值在模型中保存,此時上述異常檢測模型訓練完畢。
其中,需要說明的是,以上示出的核函數(shù)僅為示例性的。在實際應用中,除了以上示出的核函數(shù)以外,在訓練支持向量機模型時也可以選擇其它類型的核函數(shù),在本例中不再一一列舉。
3)異常檢測模型的使用
請繼續(xù)參見圖2,當上述異常檢測模型訓練完畢后,后續(xù)可以使用該模型,針對需要進行異常檢測的目標頁面,實時的進行異常檢測。
在實現(xiàn)時,如果需要針對目標頁面進行異常檢測,首先可以從該目標頁面中實時的提取GLCM特征Fglcm和LBP特征Flbp,并根據(jù)提取到GLCM特征Fglcm和LBP特征Flbp的生成二維特征向量F。此時該二維特征向量F={Fglcm,F(xiàn)lbp}。
當生成了上述二維特征向量F后,可以將該二維特征向量F輸入訓練完成的上述異常檢測模型中進行計算。由于模型中的參數(shù)ω和ω0已經(jīng)訓練完成,因此該二維特征向量F輸入上述異常檢測模型中進行計算,能夠正常輸出計算結(jié)果,上述異常檢測設備可以根據(jù)模型輸出的計算結(jié)果,對該目標頁面進行異常檢測。
一方面,假設上述模型輸出的計算結(jié)果輸出的計算結(jié)果為1,則表示該目標頁面為正常頁面。另一方面,假設上述模型輸出的計算結(jié)果輸出的計算結(jié)果為-1,則表示該目標頁面為異常頁面。
可見,在本例中,通過從若干正常頁面以及異常界面中提取出的圖像特征來訓練支持向量機模型,并使用該支持向量機模型,基于從目標頁面中實時提取出的圖像特征來進行異常檢測,使得整個異常檢測過程,將不再需要在后臺通過流量檢測來執(zhí)行異常檢測,完全在前臺從頁面的顯示異常結(jié)果出發(fā),跳過了在后臺復雜的通過流量分析來定位異常問題的過程,因此整個異常檢測過程,將更加直接和智能化。
同時,在本例中,在提取圖像特征時,通過采用局部紋理特征和全局紋理特征相結(jié)合的方式,既考慮了頁面圖像的局部圖像紋理,又考慮了頁面圖像的全局圖像紋理,可以充分的排除由于圖像亮度等外界因素,對提取出的圖像特征的真實度造成的影響,從而可以提升異常檢測的準確度。
與上述方法實施例相對應,本申請還提供了裝置的實施例。
請參見圖3,本申請?zhí)岢鲆环N基于圖像特征的業(yè)務異常檢測裝置30,應用于異常檢測設備;其中,該異常檢測設備具體可以是一服務器、PC主機或者其它類型的電子設備;請參見圖4,作為承載所述基于圖像特征的業(yè)務異常檢測裝置30的異常檢測設備所涉及的硬件架構(gòu)中,通常包括CPU、內(nèi)存、非易失性存儲器、網(wǎng)絡接口以及內(nèi)部總線等;以軟件實現(xiàn)為例,所述基于圖像特征的業(yè)務異常檢測裝置30通常可以理解為加載在內(nèi)存中的計算機程序,通過CPU運行之后形成的軟硬件相結(jié)合的邏輯裝置,所述裝置30包括:
提取模塊301,從目標頁面的頁面圖像中提取圖像特征;
計算模塊302,將提取出的所述圖像特征輸入預設的異常檢測模型中進行計算;其中,所述異常檢測模型為基于從若干正常頁面以及異常界面中提取出的圖像特征訓練得到的機器學習模型;
檢測模塊303,基于所述異常檢測模型的計算結(jié)果針對所述目標頁面進行異常檢測。
在本例中,所述提取模塊301進一步:
基于預設的若干樣本頁面的頁面圖像生成圖像樣本集合:其中,所述圖像樣本集合中的正常頁面的頁面圖像以及異常頁面的頁面圖像均被標定了對應的識別標簽;分別提取所述圖像樣本集合中的頁面圖像的圖像特征;
所述裝置30還包括:
訓練模塊304,將提取出的圖像特征作為訓練樣本,基于預設的機器學習算法進行訓練以得到所述異常檢測模型。
在本例中,所述異常檢測模型為SVM模型。
在本例中,所述圖像特征為圖像紋理特征;其中,所述圖像紋理特征包括圖像全局紋理特征和圖像局部紋理特征。
在本例中,所述圖像全局紋理特征為GLCM灰度共生矩陣特征;所述圖像局部紋理特征為LBP局部二值模式特征。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本申請的其它實施方案。本申請旨在涵蓋本申請的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本申請的一般性原理并包括本申請未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本申請的真正范圍和精神由下面的權(quán)利要求指出。
應當理解的是,本申請并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本申請的范圍僅由所附的權(quán)利要求來限制。
以上所述僅為本申請的較佳實施例而已,并不用以限制本申請,凡在本申請的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本申請保護的范圍之內(nèi)。