基于日志的電力調(diào)度自動化系統(tǒng)用戶行為統(tǒng)計(jì)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電力調(diào)度自動化技術(shù),特別基于日志的電力調(diào)度自動化系統(tǒng)用戶行為統(tǒng)計(jì)方法。
【背景技術(shù)】
[0002]隨著電網(wǎng)規(guī)模越來越大、“大運(yùn)行”體系地縣調(diào)控一體化系統(tǒng)建設(shè)的推進(jìn),地區(qū)電網(wǎng)調(diào)度自動化系統(tǒng)承擔(dān)著地縣兩級電網(wǎng)調(diào)度、變電運(yùn)行監(jiān)控的多重任務(wù),系統(tǒng)結(jié)構(gòu)日益復(fù)雜,從原先的集中系統(tǒng)發(fā)展到分布分散式系統(tǒng),從單一部分集中維護(hù)發(fā)展到多單位、多部門聯(lián)合維護(hù),這就從客觀上增加了系統(tǒng)的不安全因素。而自動化系統(tǒng)一旦出現(xiàn)控制參數(shù)不一致,將直接導(dǎo)致電網(wǎng)誤操作事故;一旦發(fā)生系統(tǒng)故障,將造成地縣兩級電網(wǎng)調(diào)度指揮陷入癱瘓、35kV-220kV所有變電站失去運(yùn)行監(jiān)控,對電網(wǎng)運(yùn)行造成嚴(yán)重后果。因此在系統(tǒng)發(fā)生誤動作或故障前,如何有效實(shí)現(xiàn)系統(tǒng)維護(hù)操作安全性校核,就成為擺在自動化專業(yè)面前一個(gè)極需解決的問題。
[0003]現(xiàn)有的自動化安全校核系統(tǒng)中存在以下問題:
[0004]I)電力調(diào)度自動化安全校核系統(tǒng)主要面向發(fā)電計(jì)劃,以潮流計(jì)算、靈敏度分析、靜態(tài)安全分析、短路電流分析、暫態(tài)穩(wěn)定分析等安全分析功能為主,沒有或者很少涉及用戶操作和用戶行為的分析統(tǒng)計(jì)。安全校核系統(tǒng)一般都缺少針對特定用戶和特定行為的統(tǒng)計(jì)、分析、驗(yàn)證功能。
[0005]2)目前的電力調(diào)度自動化系統(tǒng)工作站一般運(yùn)行Linux操作系統(tǒng),用戶操作日志除了保存在數(shù)據(jù)庫中,也有部分日志以文件形式存放在工作站的文件系統(tǒng)中。如何能夠綜合數(shù)據(jù)庫操作日志和文件系統(tǒng)日志,實(shí)現(xiàn)針對特定操作的統(tǒng)計(jì)、查詢、分析,是一個(gè)工程實(shí)踐中需要解決的問題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供基于日志的電力調(diào)度自動化系統(tǒng)用戶行為統(tǒng)計(jì)方法,不僅可以提取電力調(diào)度自動化系統(tǒng)數(shù)據(jù)庫中的操作記錄,而且可以部署在電力調(diào)度自動化系統(tǒng)工作站上,進(jìn)行用戶操作日志的整理和提取,從而實(shí)現(xiàn)針對各類用戶特定操作的統(tǒng)計(jì)、查詢、分析。
[0007]為了解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:基于日志的電力調(diào)度自動化系統(tǒng)用戶行為統(tǒng)計(jì)方法,包括數(shù)據(jù)庫日志提取和文件日志提取和用戶行為分析;
[0008]1.1)所述數(shù)據(jù)庫日志提取的步驟如下:
[0009]1.1.1)配置電力調(diào)度自動化系統(tǒng)數(shù)據(jù)庫登錄用戶,以用戶登錄接口建立數(shù)據(jù)庫連接;
[0010]1.1.2)通過用戶名與時(shí)間段查詢用戶操作日志列表;
[0011]1.1.3)通過用戶名、應(yīng)用名、操作類型等條件查詢電力調(diào)度自動化系統(tǒng)的用戶操作日志列表;
[0012]1.1.4)通過日志ID取得電力調(diào)度自動化系統(tǒng)操作日志詳細(xì)內(nèi)容;
[0013]1.1.5)設(shè)置定時(shí)同步功能,通過設(shè)置特定時(shí)刻或時(shí)間間隔觸發(fā)同步程序,根據(jù)時(shí)間字段同步電力調(diào)度自動化系統(tǒng)數(shù)據(jù)庫表中數(shù)據(jù)存入本地日志分析表。
[0014]1.1.6)用戶退出操作,注銷用戶SESS1N ;
[0015]1.2)所述的文件日志提取的步驟如下:
[0016]1.2.1)配置電力調(diào)度自動化工作站,設(shè)置遠(yuǎn)程登錄用戶權(quán)限;
[0017]1.2.2)服務(wù)器同步軟件讀取配置文件,提取文件中配置參數(shù),以遠(yuǎn)程登錄接口連接到工作站;
[0018]1.2.3)根據(jù)文件同步規(guī)則,進(jìn)行圖形編輯成果文件的時(shí)間、版本、內(nèi)容的對比分析,形成操作日志;
[0019]1.2.4)利用ftp協(xié)議將文件操作日志傳回服務(wù)器,并按工作站、時(shí)間、用戶存放到數(shù)據(jù)庫中;
[0020]1.3)所述的用戶行為分析的步驟如下:
[0021]1.3.1)在日志分析服務(wù)器上,對數(shù)據(jù)庫和文件日志統(tǒng)一采用Lucene引擎建立全文索引,并采用中文分詞算法進(jìn)行關(guān)鍵詞分析;
[0022]1.3.2)通過日期范圍統(tǒng)計(jì)各個(gè)應(yīng)用使用次數(shù);
[0023]1.3.3)通過應(yīng)用ID與日期范圍取得該應(yīng)用在日期范圍內(nèi)的用戶操作數(shù)據(jù);
[0024]1.3.4)通過用戶名與日期范圍統(tǒng)計(jì)出該用戶在日期范圍內(nèi)的每個(gè)應(yīng)用的操作次數(shù);
[0025]1.3.5)通過應(yīng)用ID與月份段,統(tǒng)計(jì)出該應(yīng)用在每個(gè)月的使用次數(shù);
[0026]1.3.6)應(yīng)用使用情況統(tǒng)計(jì),統(tǒng)計(jì)各個(gè)應(yīng)用的使用次數(shù),并以餅圖顯示,點(diǎn)擊圖形可以鉆取出該應(yīng)用使用的用戶詳細(xì)情況;
[0027]1.3.7)用戶操作行為統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果以列表形式列出用戶所有的操作記錄;
[0028]1.3.8)應(yīng)用使用情況對比,統(tǒng)計(jì)結(jié)果以曲線圖顯示各個(gè)應(yīng)用在不同月份的使用率。
[0029]優(yōu)選的,所述步驟1.2.2)中提取文件中配置參數(shù)為工作站地址、用戶名、密碼和同步間隔。
[0030]與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)是:1)實(shí)現(xiàn)了電力調(diào)度自動化的用戶操作日志的收集、提取、記錄、分析;2)實(shí)現(xiàn)了數(shù)據(jù)庫型操作日志和文件型操作日志的統(tǒng)一收集;3)在日志分析過程中采用了基于中文分詞算法的全文索引技術(shù),確保結(jié)果準(zhǔn)確可信;4)具有實(shí)現(xiàn)簡單以及易于部署的特點(diǎn)。
【附圖說明】
[0031]圖1是本發(fā)明中數(shù)據(jù)庫日志收集的流程圖;
[0032]圖2是本發(fā)明中日志文件基于Lucene的全文索引算法流程圖;
[0033]圖3是本發(fā)明中數(shù)據(jù)庫日志分析的最大匹配分詞算法流程圖。
【具體實(shí)施方式】
[0034]下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。
[0035]結(jié)合圖1,為實(shí)現(xiàn)電力調(diào)度自動化系統(tǒng)的用戶操作分析,定時(shí)將電力調(diào)度自動化系統(tǒng)中以數(shù)據(jù)庫或文件形式的日志數(shù)據(jù)同步至本系統(tǒng)日志分析表中,即:
[0036]1.1)通過配置設(shè)置每天固定時(shí)間或間隔時(shí)間觸發(fā)同步程序,其步驟如下:
[0037]1.1.1)配置電力調(diào)度自動化系統(tǒng)數(shù)據(jù)庫登錄用戶,以用戶登錄接口建立數(shù)據(jù)庫連接;
[0038]1.1.2)通過用戶名與時(shí)間段查詢用戶操作日志列表;
[0039]1.1.3)通過用戶名、應(yīng)用名、操作類型等條件查詢電力調(diào)度自動化系統(tǒng)的用戶操作日志列表;
[0040]1.1.4)通過日志ID取得電力調(diào)度自動化系統(tǒng)操作日志詳細(xì)內(nèi)容;
[0041]1.1.5)用戶退出操作,注銷用戶SESS1N。
[0042]實(shí)現(xiàn)對同步數(shù)據(jù)進(jìn)行分析,格式化數(shù)據(jù)入庫,具體包括:1、對電力調(diào)度自動化系統(tǒng)數(shù)據(jù)庫中數(shù)據(jù)進(jìn)行分析,拆分為多個(gè)關(guān)鍵字存入本地分析庫中。2、對電力調(diào)度自動化系統(tǒng)中曲線定義應(yīng)用生成的配置文件內(nèi)容進(jìn)行解析、整理后存入本地分析庫中。
[0043]所述的文件日志收集分析步驟如下:
[0044]1.2)對電力調(diào)度自動化系統(tǒng)日志表中日志內(nèi)容分析,將應(yīng)用名、操作類型、被操作記錄內(nèi)容、被操作表名等信息提出,并結(jié)合電力調(diào)度自動化系統(tǒng)用戶表、應(yīng)用定義表、節(jié)點(diǎn)定義表中數(shù)據(jù)對日志記錄進(jìn)行轉(zhuǎn)換后存入本地分析庫,其步驟如下:
[0045]1.2.1)配置電力調(diào)度自動化工作站,設(shè)置遠(yuǎn)程登錄用戶權(quán)限;
[0046]1.2.2)服務(wù)器同步軟件讀取配置文件,提取文件中配置參數(shù)(工作站地址、用戶名、密碼、同步間隔等),以遠(yuǎn)程登錄接口連接到工作站;
[0047]1.2.3)根據(jù)文件同步規(guī)則,進(jìn)行圖形編輯成果文件的時(shí)間、版本、內(nèi)容的對比分析,形成操作日志;
[0048]1.2.4)利用ftp協(xié)議將文件操作日志傳回服務(wù)器,并按工作站、時(shí)間、用戶存放到數(shù)據(jù)庫中。
[0049]數(shù)據(jù)收集到本地?cái)?shù)據(jù)庫中以后,需要建立針對電力調(diào)度操作的全文索引,以實(shí)現(xiàn)精確全面的檢索。
[0050]建立索引的時(shí)候,寫入索引并能夠被用戶檢索的是一個(gè)個(gè)的詞條。所謂詞條,即通過分析器進(jìn)行分詞和相關(guān)處理后的文本。只有通過相同的分詞才能讓檢索請求被正確理解,進(jìn)而檢索出相應(yīng)內(nèi)容。比如,我們在建立索引的時(shí)候,我們將一段文本“倒閘操作”切分成“倒閘/操作”進(jìn)行索引,這樣存儲在索引中只有“倒閘”、“操作”這兩個(gè)詞條。倘若,在用戶發(fā)起檢索時(shí)使用其他的分析器把“倒閘操作”切分成了 “倒/閘操作”,即“倒”、“閘操作”兩個(gè)詞條,那么就無法在索引中找到與之匹配的詞條了,也就無法檢索出用戶的請求,顯示出了極低的查準(zhǔn)率。
[0051]通過上面的分析,我們知道漢語在建索引時(shí),對漢字序列進(jìn)行分詞是必不可少的,同時(shí),采取什么樣的分詞算法也很關(guān)鍵,不同的分詞算法可能會帶來完全不一樣的詞條,使原始語義大相徑庭。
[0052]中文分詞相對于英文分詞來說復(fù)雜的多,目前主要有三類分詞技術(shù):基于字符串匹配的分詞、基于理解的分詞和基于統(tǒng)計(jì)的分詞。
[0053]結(jié)合圖3,所采用的改進(jìn)型最大匹配分詞算法描述如下:
[0054]I)初始化兩個(gè)字符串S1、S2,SI為待切分字符串,S2為切分后的字符串,初始化匹配最大長度MaxLen ;
[0055]2)如果SI非空,就從SI的左邊開始,取出候選字符串W,W的長度不大于MaxLen。如果SI為空,則轉(zhuǎn)到4);
[0056]3)從已有的分詞詞典中查找W,如果在詞典中,把W加入到S2中,SI的指針往后移到W之后,然后轉(zhuǎn)到2)繼續(xù)執(zhí)行。如果W不在詞典庫中,則將字符串W最右端的一個(gè)字符去掉,重新執(zhí)行3);
[0057]4)執(zhí)行直到SI為空串為止,輸出分詞結(jié)果字符串S2。
[0058]對于經(jīng)典最大匹配分詞算法,我們增加了電力調(diào)度詞典庫,在利用這些