一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法
【專利摘要】本發(fā)明公開了一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法,其特征在于,包括如下步驟:S01:獲得信息系統(tǒng)的網絡拓撲架構和所有設備的動態(tài)監(jiān)控指標和靜態(tài)監(jiān)控指標;S02:通過網絡拓撲架構和設備的動、靜態(tài)監(jiān)控指標生成網絡故障樹,并通過網絡故障樹生成基本規(guī)則庫;S03:對信息系統(tǒng)的歷史數據執(zhí)行關聯規(guī)則挖掘算法,得到關聯規(guī)則庫;S04:結合基本規(guī)則庫和關聯規(guī)則庫進行推理生成擴展規(guī)則庫;其中,各規(guī)則庫的檢索優(yōu)先級是:基本規(guī)則庫>關聯規(guī)則庫>擴展規(guī)則庫。利用故障樹技術和關聯規(guī)則挖掘技術來智能生成信息系統(tǒng)運行規(guī)則庫,并采用機器學習技術來對規(guī)則進行優(yōu)化。進一步的,設計了規(guī)則的三域結構,實現了規(guī)則的自動排序和自動調整。
【專利說明】一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法
【技術領域】
[0001] 本發(fā)明涉及一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法。
【背景技術】
[0002] 為保證信息系統(tǒng)安全、穩(wěn)定、有效運行,國家電網公司在2008年啟動了覆蓋"綜合 網管、桌面管理、安全管理、運維服務"的信息運維綜合監(jiān)管系統(tǒng)(以下簡稱"頂S")的建設, 于2011年完成系統(tǒng)全網推廣,并在2012年完成了以"深化采集、設備管理、一單兩票、告警 中心、展示中心、綠色機房"六大模塊為核心的IMS系統(tǒng)的深化應用建設工作,全面覆蓋了網 絡、網絡設備、主機、數據庫、中間件、桌面終端、安全設備等IT基礎設備以及業(yè)務系統(tǒng)的實 時監(jiān)控,為全網的信息系統(tǒng)運行維護工作提供了技術支撐手段。
[0003] 但是在運行監(jiān)控規(guī)則設定與判斷方面還存在著以下不足:
[0004] 一、IT基礎設施與業(yè)務系統(tǒng)的運行性能監(jiān)控還是需要運維人員根據歷史運維經驗 和專業(yè)方向知識來設定監(jiān)控閾值規(guī)則,不能自適應IT基礎設施與業(yè)務系統(tǒng)的運行規(guī)律,在 某些時間段內固化的監(jiān)控閾值規(guī)則不符合實際運行情況,容易產生誤報、漏報;
[0005] 二、設定的運行監(jiān)控規(guī)則不能進行合理性的判斷,無法驗證設定的運行監(jiān)控規(guī)則 是否貼合IT基礎設施與業(yè)務系統(tǒng)的實際運行情況;
[0006] 三、運行監(jiān)控規(guī)則的設定沒有自學習功能,不能根據IT基礎設施與業(yè)務系統(tǒng)的歷 史運行情況自行調整優(yōu)化。
【發(fā)明內容】
[0007] 針對上述問題,本發(fā)明提供一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造 方法,利用故障樹技術和關聯規(guī)則挖掘技術來智能生成信息系統(tǒng)運行規(guī)則庫,并采用機器 學習技術來對規(guī)則進行優(yōu)化。進一步的,設計了規(guī)則的三域結構,實現了規(guī)則的自動排序和 自動調整。
[0008] 為實現上述技術目的,達到上述技術效果,本發(fā)明通過以下技術方案實現:
[0009] -種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法,其特征在于,包括如 下步驟:
[0010] SOl :獲得信息系統(tǒng)的網絡拓撲架構和所有設備的動態(tài)監(jiān)控指標和靜態(tài)監(jiān)控指 標;
[0011] S02 :通過網絡拓撲架構和設備的動、靜態(tài)監(jiān)控指標生成網絡故障樹,并通過網絡 故障樹生成基本規(guī)則庫;
[0012] S03 :對信息系統(tǒng)的歷史數據執(zhí)行關聯規(guī)則挖掘算法,得到關聯規(guī)則庫;
[0013] S04 :結合基本規(guī)則庫和關聯規(guī)則庫進行推理生成擴展規(guī)則庫;
[0014] 其中,各規(guī)則庫的檢索優(yōu)先級是:基本規(guī)則庫〉關聯規(guī)則庫〉擴展規(guī)則庫。
[0015] 優(yōu)選,基本規(guī)則庫的每個規(guī)則為三域結構,即包括,
[0016] 規(guī)則序列域:規(guī)則在實際的運行過程中執(zhí)行成功的次數,執(zhí)行失敗的次數,規(guī)則最 終計數及規(guī)則排序;
[0017] 規(guī)則標識域:用來標識該規(guī)則的從屬對象;
[0018] 規(guī)則主體域:用于對規(guī)則的詳細說明。
[0019] 優(yōu)選,系統(tǒng)實時執(zhí)行規(guī)則排序算法和規(guī)則流動算法對規(guī)則進行優(yōu)先級確定和規(guī)則 刷新。
[0020] 其中,在每個規(guī)則庫中,通過規(guī)則序列域中的規(guī)則最終計數指標來確定規(guī)則被檢 索的優(yōu)先級,其中,規(guī)則最終計數的公式為:
[0021] F = R-0. 5W
[0022] 式中,F為最終計數,R為在實際運行過程中規(guī)則執(zhí)行成功的次數,W為規(guī)則執(zhí)行失 敗的次數;如果對執(zhí)行失敗的場景進行機器學習,對相關規(guī)則經過優(yōu)化并解決相關問題,則 相應的執(zhí)行失敗的次數W減一。
[0023] 優(yōu)選,關聯規(guī)則庫的規(guī)則流動算法是:在系統(tǒng)實際運行過程中,規(guī)則只要有一次被 證明是正確的,直接移動到基本規(guī)則庫;如果該規(guī)則有兩次被證明錯誤,則刪除該規(guī)則。 [0024] 優(yōu)選,擴展規(guī)則庫的規(guī)則流動算法是:使用歷史數據來驗證所有規(guī)則,
[0025] 對于成功率在80%?100%的規(guī)則,使用歷史數據進行機器學習后直接移動到基 本規(guī)則庫;
[0026] 對于成功率在60%?80%的規(guī)則,使用歷史數據進行機器學習后,如果成功率大 于80%則移動到基本規(guī)則庫,否則繼續(xù)留在擴展規(guī)則庫,并接受運行數據的機器學習,直到 其成功率大于80% ;
[0027] 對于成功率在50%?60%的規(guī)則,使用歷史數據和運行數據進行機器學習,直到 其成功率大于80%,移動到基本規(guī)則庫,否則繼續(xù)留在擴展規(guī)則庫;
[0028] 對于成功率小于50%的規(guī)則,直接刪除。
[0029] 本發(fā)明實現信息系統(tǒng)運行規(guī)則庫動態(tài)構建和優(yōu)化,可應用于公司信息運維綜合監(jiān) 管平臺,使監(jiān)控告警規(guī)則的建立與維護更容易,規(guī)則匹配效率更高,從而迅速適應信息系統(tǒng) 對象、運行環(huán)境、運行狀態(tài)數據源的各種變化,同時滿足大規(guī)模信息系統(tǒng)規(guī)則集匹配處理實 時性要求,大大提高規(guī)則系統(tǒng)的實用性,提升信息系統(tǒng)監(jiān)控報警、安全管理、行為審計和合 規(guī)管理質量。
[0030] 本發(fā)明的有益效果是:
[0031] 一、規(guī)則庫的區(qū)域化構造:本發(fā)明方法設計的規(guī)則庫共有三個分區(qū),分別存儲基本 規(guī)則、關聯規(guī)則和擴展規(guī)則,其中基本規(guī)則的優(yōu)先級最高,關聯規(guī)則次之,擴展規(guī)則的優(yōu)先 級最低。通過規(guī)則庫的分區(qū),可以通過規(guī)則的優(yōu)先級管理確定規(guī)則檢索的優(yōu)先級順序,并且 低區(qū)域規(guī)則可以通過不斷的實時機器學習進行升級,實現規(guī)則由低向高的流動。
[0032] 二、規(guī)則的三域結構:規(guī)則的三域結構包括規(guī)則序列域,規(guī)則標識域和規(guī)則主體 域:規(guī)則序列域通過量化的手段實現規(guī)則的優(yōu)先級排序;規(guī)則標識域用來標識該規(guī)則的從 屬對象,以便于網絡拓撲架構改變時的規(guī)則庫自適應調整;規(guī)則主體域存儲了規(guī)則的主體 部分,這是對規(guī)則的詳細說明。
[0033] 三、實時的自適應閾值調整:系統(tǒng)利用性能歷史數據和運行數據,分析計算出適合 業(yè)務運行告警要求的告警閾值,提高針對信息系統(tǒng)的告警自學習能力,采用閾值規(guī)劃算法 動態(tài)調整告警閾值,做到從事件的源頭減少事件量,提高了監(jiān)控告警的質量。
[0034] 四、新增規(guī)則入庫的自動化合理性分析:新增規(guī)則可以由系統(tǒng)自動生成,也可以人 工添加。對于新增規(guī)則,采用歷史數據和實時運行數據對規(guī)則進行合理化分析,確定規(guī)則的 可用性。
[0035] 五、規(guī)則的自動調整優(yōu)化:通過實時執(zhí)行規(guī)則排序算法和規(guī)則流動算法,來對規(guī)則 進行優(yōu)先級確定和優(yōu)先級的刷新或升級,確保規(guī)則庫處于最優(yōu)狀態(tài),提高規(guī)則的檢索效率 和規(guī)則的正確率,從而提高系統(tǒng)性能。
【專利附圖】
【附圖說明】
[0036] 圖1是本發(fā)明一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法的流程 圖;
[0037] 圖2是本發(fā)明基本規(guī)則庫的規(guī)則的三域結構圖;
[0038] 圖3是本發(fā)明規(guī)則庫三區(qū)擴展規(guī)則流動算法流程圖。
【具體實施方式】
[0039] 下面結合附圖和具體的實施例對本發(fā)明技術方案作進一步的詳細描述,以使本領 域的技術人員可以更好的理解本發(fā)明并能予以實施,但所舉實施例不作為對本發(fā)明的限 定。
[0040] 一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法,如圖1所示,包括如 下步驟:
[0041] SOl :獲得信息系統(tǒng)的網絡拓撲架構和所有設備的動態(tài)監(jiān)控指標和靜態(tài)監(jiān)控指標。
[0042] 首先通過拓撲發(fā)現技術得到網絡拓撲架構,然后對拓撲架構中的每個網絡設備, 米集相應的動態(tài)監(jiān)控指標和靜態(tài)監(jiān)控指標,包括網絡指標、安全指標、王機指標、數據庫指 標、中間件指標和業(yè)務系統(tǒng)指標TK大類。
[0043] 網絡指標包括鏈路時延、網絡設備健康運行時長、網絡設備狀態(tài)、網絡設備CPU使 用率、網絡設備內存使用率、接受丟包率、發(fā)送丟包率、接收錯包率、發(fā)送錯包率、接口接收 流量、接口發(fā)送流量、接口總流量和接口帶寬利用率;安全指標包括安全事件、安全設備的 狀態(tài)(CPU、內存等)以及合規(guī)性;主機指標包括主機狀態(tài)、健康運行時長、CPU使用率、內存 使用率、磁盤空間使用率、關鍵進程數和主機配置信息。
[0044] 數據庫指標有SqlServer指標、Oracle指標和DB2指標。其中SqlServer指標 包括SGA的命中率、可用緩存大小、字典緩沖區(qū)的命中率、共享緩存區(qū)的命中率、Redo日志 緩存區(qū)的命中率、會話數量、可用會話數量、事務響應時間、表空間可用率、表空間增長率和 MTS性能;Oracle指標包括會話數量、可用會話數量、事務響應時間、表空間可用率、表空 間增長率、共享內存使用率、共享內存命中率和回滾段使用率;DB2指標包括Process可用 率、緩沖池(Bufferpool)可用率、緩沖池命中率、表空間可用率、表空間增長率、排序指數 (SortsPerTransaction)、會話數量以及可用會話數量。
[0045] 中間件指標有Weblogic指標和Websphere指標。其中Weblogic指標包括JVM內 存堆空閑量、JVM內存堆總量、JVM內存堆使用率、Servlet所有調用的執(zhí)行時長、Servlet 單個調用的最長執(zhí)行時長、Servlet平均執(zhí)行時長、Servlet執(zhí)行次數、JDBC pool最大容 量、JDBC Pool活動連接數的高水位線、JDBC Pool等待連接數的高水位線、JDBC Pool實例 化以來累計的連接數、JDBC Pool平均活動連接數、JDBC Pool平均連接時延、JDBC Pool泄 漏的連接數、JDBC pool的當前容量、JDBC Pool重新連接的失敗數、JDBC Pool最大可用連 接數、JDBC Pool最大不可用連接數、JDBC Pool LEAKED連接數、JDBC Pool中的可用連接 數、JDBC POOL中的不可用連接數、JDBC Pool利用率、當前會話數、最大會話數以及會話占 用率;Websphere指標包括JVM內存空閑量、JVM內存總量、JVM內存使用率、平均會話生存 期、當前訪問的會話總數、當前存活的會話總數、JDBC pool最大容量、JDBC Pool平均活動 連接數、JDBC Pool平均連接時延、JDBC Pool泄漏的連接數、JDBC pool的當前容量、JDBC Pool重新連接的失敗數、JDBC Pool最大可用連接數、JDBC Pool最大不可用連接數、JDBC Pool LEAKED連接數、JDBC Pool中的可用連接數、JDBC POOL中的不可用連接數以及JDBC Pool利用率。
[0046] 業(yè)務系統(tǒng)指標包括在線用戶數、日登錄用戶數、業(yè)務系統(tǒng)運行狀態(tài)、業(yè)務系統(tǒng)接口 狀態(tài)和業(yè)務系統(tǒng)健康運行時長。
[0047] S02 :通過網絡拓撲架構和設備的動、靜態(tài)監(jiān)控指標生成網絡故障樹,并通過網絡 故障樹生成基本規(guī)則庫。通過故障樹的構建可以簡潔明了的表示各個監(jiān)控指標以及各個網 絡設備之間的關系。其中,基本規(guī)則庫中的相關閾值通過對歷史數據的機器學習和執(zhí)行閾 值規(guī)劃算法來確定。
[0048] 針對基本規(guī)則,設計了規(guī)則的三域結構,如圖2所示,包括規(guī)則序列域、規(guī)則標識 域和規(guī)則主體域。
[0049] 規(guī)則序列域用來存儲規(guī)則在實際的運行過程中執(zhí)行成功的次數、執(zhí)行失敗的次 數、規(guī)則最終計數及規(guī)則排序。規(guī)則序列域存在的目的是為了便于對規(guī)則的優(yōu)先級進行排 序,提1?規(guī)則的檢索效率。
[0050] 規(guī)則標識域用來標識該規(guī)則的從屬對象,例如規(guī)則是某個網絡設備的專屬規(guī)則, 或者規(guī)則從屬于某個子網或整個網絡。規(guī)則標識域存在的目的是為了對每條規(guī)則進行標 識,在網絡拓撲結構發(fā)生改變的時候,可以通過規(guī)則的標識域識別需要刪除和修改的規(guī)則, 并且通過對變動部分的拓撲結構重新生成相應的基本規(guī)則來實現規(guī)則的增刪改,智能構造 適應新網絡架構的規(guī)則庫。
[0051] 規(guī)則主體域存儲了規(guī)則的主體部分,這是對規(guī)則的詳細說明。規(guī)則就是產生式規(guī) 貝U,是指人們思維判斷中的一種固定邏輯結構關系。一般產生式的結構可表示為自然語言 形式,事實上,在自然語言表達中,人們廣泛使用的各種"原因一-結果","條件一結論","前 提一操作","事實一進展","情況一行為"等結構,都可歸結為產生式的知識表達形式。規(guī)則 的基本形式:A -B或者IF A THENB,A是產生式的前提(前件),用于指出該產生式是否可 用的條件。B是一組結論或操作(后件),用于指出當前提A所指示的條件滿足時,應該得 出的結論或應該執(zhí)行的操作。產生式規(guī)則推理的推理方式有正向推理、逆向推理和雙向推 理三種。三種推理方式在不同情境下都有相應的優(yōu)勢,在規(guī)則推理方式選擇時綜合考慮。
[0052] S03 :對信息系統(tǒng)的歷史數據執(zhí)行關聯規(guī)則挖掘算法,得到關聯規(guī)則庫,關聯規(guī)則 是通過關聯規(guī)則挖掘生成,并通過歷史數據檢驗的規(guī)則。
[0053] 優(yōu)選,采用基于分支篩選優(yōu)化策略和數據庫單次掃描技術的改進的Apriori算法 來進行歷史數據關聯規(guī)則的挖掘。Apriori算法是一種挖掘關聯規(guī)則的頻繁項集算法,算法 分為兩個階段:尋找頻繁項集和由頻繁項集挖掘關聯規(guī)則。算法原理是從數據集中尋找滿 足最小支持度的頻繁項集,進而根據頻繁項集產生關聯規(guī)則。Apriori算法是一個很經典 的關聯規(guī)則挖掘算法,但是存在兩個弊端,在尋找頻繁項集會產生很多候選集,浪費大量計 算效率和時間,且需要多次掃描數據庫,嚴重影響算法效率。針對第一個問題,采用哈希表 和位容器對候選集進行過濾,減少算法在產生候選集上的消耗。因為經典算法的主要消耗 在(:1,11,02,12的產生上,在02的生成中過濾更多的分支,可以大大提高算法效率。針對 第二個問題,經典算法每次計算支持度均需掃描整個數據庫,而算法中計算支持度的頻率 非常高,這就需要頻繁掃描數據庫,導致算法效率不高。所以通過維護一個布爾矩陣來記錄 數據庫中所有的事務信息,只需掃描一次數據庫就可以構建布爾矩陣,這個布爾矩陣包含 了計算支持度需要的所有數據,以后就不需要再次掃描數據庫了,大大提高了算法效率。
[0054] 通過改進的Apriori算法,可以對歷史數據進行關聯規(guī)則挖掘,得到的結果在閾 值規(guī)劃算法的配合下,可以智能生成關聯規(guī)則庫。關聯規(guī)則是從歷史數據中挖掘出來的,通 過了歷史數據的檢驗,可信度比較高,但是關聯規(guī)則仍存在一些不確定性,必須通過運行數 據的檢驗才能升級為基本規(guī)則。
[0055] 關聯規(guī)則庫中的相關閾值通過對歷史數據的機器學習和執(zhí)行閾值規(guī)劃算法來確 定。
[0056] 基本規(guī)則庫和關聯規(guī)則庫在閾值的確定上,利用性能歷史數據,分析計算出適合 業(yè)務運行告警要求的告警閾值,提高針對信息系統(tǒng)的告警自學習能力,優(yōu)化告警邏輯,動態(tài) 調整告警閾值,做到從事件的源頭減少事件量,提高監(jiān)控告警的質量。
[0057] 優(yōu)選,某個指標的閾值規(guī)劃算法為:
[0058] 對指標在網絡正常運行狀況下的歷史數據進行統(tǒng)計分析,確定其最大值,最小值 和中位數,然后按以下公式來確定閾值:
[0059]
【權利要求】
1. 一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法,其特征在于,包括如下 步驟: 501 :獲得信息系統(tǒng)的網絡拓撲架構和所有設備的動態(tài)監(jiān)控指標和靜態(tài)監(jiān)控指標; 502 :通過網絡拓撲架構和設備的動、靜態(tài)監(jiān)控指標生成網絡故障樹,并通過網絡故障 樹生成基本規(guī)則庫; 503 :對信息系統(tǒng)的歷史數據執(zhí)行關聯規(guī)則挖掘算法,得到關聯規(guī)則庫; 504 :結合基本規(guī)則庫和關聯規(guī)則庫進行推理生成擴展規(guī)則庫; 其中,各規(guī)則庫的檢索優(yōu)先級是:基本規(guī)則庫〉關聯規(guī)則庫〉擴展規(guī)則庫。
2. 根據權利要求1所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,基本規(guī)則庫的每個規(guī)則為三域結構,即包括,規(guī)則序列域:規(guī)則在實際的運行 過程中執(zhí)行成功的次數,執(zhí)行失敗的次數,規(guī)則最終計數及規(guī)則排序; 規(guī)則標識域:用來標識該規(guī)則的從屬對象; 規(guī)則主體域:用于對規(guī)則的詳細說明。
3. 根據權利要求1所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,基本規(guī)則庫和關聯規(guī)則庫中的相關閾值通過對歷史數據的機器學習和執(zhí)行閾 值規(guī)劃算法來確定。
4. 根據權利要求3所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,所述閾值規(guī)劃算法為: 對指標在網絡正常運行狀況下的歷史數據進行統(tǒng)計分析,確定其最大值,最小值和中 位數,然后按以下公式來確定閾值:
式中,Ti為閾值,Di為網絡正常運行狀況下的指標最大值,Xi為網絡正常運行狀況下的 指標最小值,Mi為指標設計的最大值,Zi為網絡正常運行狀況下的指標中位數。
5. 根據權利要求1所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,系統(tǒng)實時執(zhí)行規(guī)則排序算法和規(guī)則流動算法對規(guī)則進行優(yōu)先級確定和規(guī)則刷 新。
6. 根據權利要求5所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,在每個規(guī)則庫中,通過規(guī)則序列域中的規(guī)則最終計數指標來確定規(guī)則被檢索 的優(yōu)先級,其中,規(guī)則最終計數的公式為: F = R-0. 5W 式中,F為最終計數,R為在實際運行過程中規(guī)則執(zhí)行成功的次數,W為規(guī)則執(zhí)行失敗的 次數;如果對執(zhí)行失敗的場景進行機器學習,對相關規(guī)則經過優(yōu)化并解決相關問題,則相應 的執(zhí)行失敗的次數W減一。
7. 根據權利要求5所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,關聯規(guī)則庫的規(guī)則流動算法是: 在系統(tǒng)實際運行過程中,規(guī)則只要有一次被證明是正確的,直接移動到基本規(guī)則庫;如 果該規(guī)則有兩次被證明錯誤,則刪除該規(guī)則。
8. 根據權利要求5所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方法, 其特征在于,擴展規(guī)則庫的規(guī)則流動算法是: 使用歷史數據來驗證所有規(guī)則,對于成功率在80%?100%的規(guī)則,使用歷史數據進 行機器學習后直接移動到基本規(guī)則庫;對于成功率在60%?80%的規(guī)則,使用歷史數據進 行機器學習后,如果成功率大于80%則移動到基本規(guī)則庫,否則繼續(xù)留在擴展規(guī)則庫,并接 受運行數據的機器學習,直到其成功率大于80 % ;對于成功率在50 %?60 %的規(guī)則,使用 歷史數據和運行數據進行機器學習,直到其成功率大于80%,移動到基本規(guī)則庫,否則繼續(xù) 留在擴展規(guī)則庫;對于成功率小于50%的規(guī)則,直接刪除。
9. 根據權利要求1所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方 法,其特征在于,步驟S03中,采用基于分支篩選優(yōu)化策略和數據庫單次掃描技術的改進的 Apriori算法來進行歷史數據關聯規(guī)則的挖掘;其中,所述改進的Apriori算法采用哈希表 和位容器對候選集進行過濾,減少算法在產生候選集上的消耗,且通過維護一個布爾矩陣 來記錄數據庫中所有的事務信息。
10. 根據權利要求1所述的一種基于關聯規(guī)則挖掘的信息系統(tǒng)運行規(guī)則庫的構造方 法,其特征在于,系統(tǒng)運維人員可以直接增加和刪除規(guī)則,并對已有規(guī)則的相關屬性進行修 改。
【文檔編號】G06N5/02GK104376365SQ201410708182
【公開日】2015年2月25日 申請日期:2014年11月28日 優(yōu)先權日:2014年11月28日
【發(fā)明者】陳龍, 劉嘉華, 何金陵, 康睿, 王琪, 周鎖, 盛華 申請人:國家電網公司, 南京南瑞集團公司, 南京南瑞信息通信科技有限公司, 江蘇省電力公司, 江蘇省電力公司信息通信分公司