本發(fā)明涉及一種用于自動地處理技術(shù)設(shè)備、如發(fā)電廠設(shè)備的自動化系統(tǒng)的多個日志文件的方法。
背景技術(shù):
大型技術(shù)設(shè)備、如蒸汽和燃氣渦輪機設(shè)備、化學(xué)設(shè)備、鋼鐵廠、軋鋼廠是復(fù)雜的技術(shù)系統(tǒng),其具有多個(例如數(shù)百個)部件,如傳感器、執(zhí)行器、驅(qū)動器等,所述部件中的每個必要時每秒檢測和提供多個測量值,以進行繼續(xù)處理和傳輸。
為了監(jiān)視和控制技術(shù)設(shè)備的部件,如渦輪機、蒸發(fā)器、發(fā)電機、傳感器、驅(qū)動器、執(zhí)行器,處理、分析和解析由部件獲得的數(shù)據(jù)。因此可行的是,盡可能早地識別與預(yù)設(shè)的標準狀態(tài)的偏差,并且必要時防止部件、如渦輪機的損壞和/或失效。
在此,要評估的數(shù)據(jù)/測量信號的量以及數(shù)據(jù)/測量信號之間的可能的相關(guān)性的復(fù)雜度通常比由操作人員對數(shù)據(jù)/測量信號進行的有效的分析可能要大得多的。
在此,技術(shù)設(shè)備為了對設(shè)備進行控制和監(jiān)視而包括自動化系統(tǒng),所述自動化系統(tǒng)通常劃分成操作和觀測層、自動化/處理層和現(xiàn)場層,所述層經(jīng)由通信單元、尤其一個或多個數(shù)據(jù)總線系統(tǒng)彼此連接。
各個部件、如傳感器、執(zhí)行器、驅(qū)動器、渦輪機、自動化單元等的數(shù)據(jù)、如測量信號、狀態(tài)信號通常組合到日志文件中,所述日志文件描述一個或多個部件和/或部件組的一個或多個出現(xiàn)的事件,并且傳遞給技術(shù)設(shè)備的相關(guān)的部件。
在自動化的控制和/或監(jiān)視的實踐中,在技術(shù)設(shè)備中出現(xiàn)事件的情況下,例如在出現(xiàn)干擾情況時,存在生成的日志文件的數(shù)量增加的問題。對此的典型的原因例如是傳感器故障和/或設(shè)備部件故障,其提供附加的測量值進而提供附加的日志文件。這使得生成的日志文件的簡明性和可檢測性對于操作人員來說變差。此外,對于操作人員困難的是,正確地評估出現(xiàn)的事件。
此外,生成多個不同類型的日志文件,所述日志文件的內(nèi)容不兼容并且不能夠比較。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于,提供用于自動地處理技術(shù)設(shè)備的自動化系統(tǒng)的多個日志文件的簡單的方法。
該目的根據(jù)獨立權(quán)利要求的特征實現(xiàn)。優(yōu)選的實施方式尤其能夠從從屬權(quán)利要求中得出。
用于自動地處理、尤其預(yù)處理技術(shù)設(shè)備的自動化系統(tǒng)的多個生成的、尤其不同的和/或不兼容的日志文件的根據(jù)本發(fā)明的方法至少包括如下步驟:
-通過如下方式確定日志文件的每個數(shù)據(jù)組的至少一個消息部分,
-該方式將日志文件的相應(yīng)的數(shù)據(jù)組的全部的內(nèi)容鏈接,
-將全部日志文件的數(shù)據(jù)組在總文件中組合,
-在總文件中將全部日志文件的數(shù)據(jù)組以時間順序排序,
-壓縮在總文件中的每個數(shù)據(jù)組,
-通過至少一個或多個數(shù)字的代碼對在總文件中的壓縮的數(shù)據(jù)組進行編碼,
-根據(jù)確定的數(shù)字的代碼將壓縮的數(shù)據(jù)組排序和/或分配(尤其分組)至至少一個具有對應(yīng)的組碼的組,并且
-通過對分配的組的組碼進行解碼來輸出日志文件的字母數(shù)字(alphanumerisch)的消息部分,并且輸出解碼的組碼。
借助于根據(jù)本發(fā)明的方法實現(xiàn)的是,不同類型的日志文件由于通過編碼和分組將其內(nèi)容統(tǒng)一而能夠相互比較并且是兼容的。由此,不同類型的日志文件的統(tǒng)一的和分組的內(nèi)容能夠被簡單地且明顯更快地進一步處理,尤其用于進一步的自動分析。
一個實施方式提出,在壓縮數(shù)據(jù)組時,通過至少減少相應(yīng)的數(shù)據(jù)組的數(shù)據(jù)內(nèi)容和/或數(shù)據(jù)長度的方式來處理數(shù)據(jù)組。
例如,對于包含在數(shù)據(jù)組中的特殊字符或非數(shù)字的或非字母的字符而言自動地使用空白字符,其中,在由此得到兩個或更多個彼此相隨的空白字符的情況下,將數(shù)量超出一個單獨空白字符的彼此相隨的空白字符從數(shù)據(jù)組中移除。由此,將日志文件的消息部分(例如文本部分、報文部分、狀態(tài)部分)中的每個字符、例如“*”、“+”、“§”、“#”等從該消息部分中移除,進而從日志文件的系統(tǒng)部分(例如系統(tǒng)時間、版本、補丁)中提取消息部分。因此日志文件的分析被限制于內(nèi)容相關(guān)的消息部分,并因此被顯著地簡化和加速。
此外,解除相應(yīng)的數(shù)據(jù)組的內(nèi)容的鏈接,從而使得內(nèi)容再次分離。在此特別地,內(nèi)容以字來分解。具有小于四個字符的、從解除鏈接中得出的單獨的字母數(shù)字的內(nèi)容、尤其是字被移除,以降低要繼續(xù)處理的字符/數(shù)據(jù)并因此進行數(shù)據(jù)壓縮。具有小于四個字符的字在分析時可被忽略,因為所述字對于隨后的相似性計算而言僅描述“統(tǒng)計噪聲”并因此是不重要的。
一個編碼的可行的實施方式提出,通過將參考字分配給每個單獨的字母數(shù)字的內(nèi)容并且將數(shù)字的代碼分配給每個參考字的方式,分析和統(tǒng)一數(shù)據(jù)組,尤其是數(shù)據(jù)組的單獨的字母數(shù)字的內(nèi)容。替代數(shù)字的代碼,能夠應(yīng)用字母的代碼和/或字母數(shù)字的代碼。數(shù)字的代碼具有簡單和快速排序并分組日志文件的數(shù)據(jù)組的優(yōu)點。
為了進一步統(tǒng)一和壓縮不同的日志文件的數(shù)據(jù)組并且簡單和快速地分析數(shù)據(jù)組,根據(jù)確定的參考字和/或數(shù)字的代碼,將具有全部日志文件的單獨的字母數(shù)字的內(nèi)容的總文件轉(zhuǎn)換成二維的、尤其字母數(shù)字的代碼矩陣。
在一個尤其簡單的實施方式中,以時間順序和/或取決于相應(yīng)的字符長度地對二維的代碼矩陣的數(shù)字的代碼進行排序。在此,借助于相似性運算、尤其所謂的萊文斯坦距離(Levenshtein-Distanz)將代碼矩陣的相似的數(shù)字的代碼分組,尤其分配給至少一個組。在此,每個組通過對應(yīng)的組碼來描述或表示。
因此,在待考慮的數(shù)字的代碼到這些組中的一個組的萊文斯坦距離為零的情況下,將該待考慮的數(shù)字的代碼分配給這一個組,因為待考慮的數(shù)字的代碼與該組、尤其與代表該組的組碼相同。
相反,在待考慮的數(shù)字的代碼到這些組中的一個組的萊文斯坦距離為一的情況下,并且在待考慮的數(shù)字的代碼與這一個組僅在一位處不相同的情況下,將該待考慮的數(shù)字的代碼分配給這一個組。
此外,將每個新的待考慮的數(shù)字的代碼與相同長度的未分組的數(shù)字的代碼比較,或與具有長出最多一個字符的更長的長度的、未分組的數(shù)字的代碼比較。
對于新的待考慮的數(shù)字的代碼到另外的未分組的數(shù)字的代碼的萊文斯坦距離等于一的情況,就由這兩個數(shù)字的代碼通過如下的方式形成具有新的組碼的新的組,即
-在待考慮的這兩個數(shù)字的代碼的長度不同的情況下,將較短的數(shù)字的代碼作為新的組碼分配給新的組,或者
-在具有至少一個不同字符的這兩個數(shù)字的代碼的長度相同的情況下,將沒有不同字符的數(shù)字的代碼作為新的組碼分配給新的組。
附加地或替選地,當?shù)搅硗獾奈捶纸M的數(shù)字的代碼的萊文斯坦距離不等于一的、新的待考慮的數(shù)字的代碼被識別出時,將該待考慮的數(shù)字的代碼分配給另外的新的組。在此,將新的該待考慮的數(shù)字的代碼作為新的組碼分配給該另外的新的組。將在與該新的組碼比較時具有為一的萊文斯坦距離的、未來的新的待考慮的數(shù)字的代碼分配給該新的組。
因此,為了將描述事件的、相似的和/或相同的數(shù)字的代碼分組,通過添加另外的/新的日志文件的新數(shù)據(jù)組的新數(shù)字的代碼的方式,連續(xù)地擴展和補充確定的二維的代碼矩陣和具有組碼的確定的組到專家系統(tǒng)(Expertensystem)的特性中。
此外,該方法允許的是,在開始該方法時僅使用一定預(yù)設(shè)的數(shù)量的組,并且不生成新的組。由此,首先實現(xiàn)對新的待考慮的數(shù)字的代碼進行粗略分組。在繼續(xù)運行中,然后能夠允許生成新的組。
所述的方法的特征在于,對不同類型的日志文件的、原始不兼容的且不可比較的消息部分通過如下方式相對于常規(guī)的分析方法顯著更快速地進行排序和分析,即將全部組成部分以原始狀態(tài)進行鏈接并且隨后通過減少字符來壓縮該組成部分,并且對該減少的字符鏈進行編碼,以及將類似的和/或相同的編碼的字符鏈進行分組。
優(yōu)選地,將該方法應(yīng)用在技術(shù)設(shè)備、如發(fā)電廠設(shè)備的自動化系統(tǒng)中。
在一個簡單的實施方式中,在技術(shù)設(shè)備的自動化系統(tǒng)的部件中執(zhí)行根據(jù)本發(fā)明的方法,其中,自動化系統(tǒng)包括至少一個操作和觀察層、自動化/處理層和現(xiàn)場層,所述層經(jīng)由通信系統(tǒng)彼此連接。
附圖說明
本發(fā)明的上述的特性、特征和優(yōu)點以及如何實現(xiàn)其的方式和方法結(jié)合實施例的下面的描述變得更加清楚易懂,所述實施例結(jié)合附圖詳細闡明。在此示出:
圖1示意性地示出用于控制和監(jiān)視技術(shù)設(shè)備的自動化系統(tǒng)的實施例,和
圖2示意性地示出用于處理在自動化系統(tǒng)中生成的日志文件的方法的實施例。
具體實施方式
彼此對應(yīng)的部件在全部附圖中設(shè)有相同的附圖標記。
圖1示意性地示出用于技術(shù)設(shè)備、如發(fā)電廠設(shè)備或化學(xué)設(shè)備的自動化系統(tǒng)1的實施例的方框圖。
自動化系統(tǒng)1在處理層AS(也稱作自動化層)中包括多個自動化設(shè)備2,所述自動化設(shè)備經(jīng)由共同的數(shù)據(jù)總線3彼此連接和通信,并且與操作和觀察層BB中的管理單元4連接和通信。此外,自動化設(shè)備2經(jīng)由現(xiàn)場總線5與現(xiàn)場層FE中的現(xiàn)場設(shè)備6連接并彼此通信。
數(shù)據(jù)總線3例如能夠是以太網(wǎng)總線或其他適當?shù)臄?shù)據(jù)傳輸單元?,F(xiàn)場總線5例如能夠是基于以太網(wǎng)的現(xiàn)場總線5或者以無線或有線連接的方式構(gòu)成為其他適當?shù)臄?shù)據(jù)傳輸單元。數(shù)據(jù)總線3和/或現(xiàn)場總線5在此能夠形成計算機網(wǎng)絡(luò)。
自動化設(shè)備2能夠不僅由可自由編程的還由存儲器可編程的處理器、尤其是處理器單元來構(gòu)成,并且控制、調(diào)節(jié)和/或監(jiān)視技術(shù)設(shè)備的各個設(shè)備部件的相應(yīng)多個部件組7或子系統(tǒng)。特別地,技術(shù)設(shè)備的控制、調(diào)節(jié)和/或監(jiān)視也包括對數(shù)據(jù)、例如測量信號、控制信號、輸入和輸出信號、中間信號、存儲的數(shù)據(jù)、處理數(shù)據(jù)進行分析和其他的處理。
管理單元4能夠是數(shù)據(jù)處理單元、例如個人計算機或其他適當?shù)牟僮骱陀^察單元,借助于其來監(jiān)視和控制技術(shù)設(shè)備。
現(xiàn)場設(shè)備6例如能夠是緊湊的、可自由編程的或存儲器可編程的控制裝置、尤其是處理器單元和/或至少一個部分固定布線的或邏輯的電路裝置,其控制、調(diào)節(jié)和/或監(jiān)視設(shè)備構(gòu)件的各個部件8、例如測量探頭(傳感器)和/或調(diào)節(jié)機構(gòu)(執(zhí)行器),并且經(jīng)由現(xiàn)場總線5連接以與自動化設(shè)備2(也稱作控制設(shè)備)通信。
在技術(shù)設(shè)備、如發(fā)電廠設(shè)備運行時,經(jīng)由數(shù)據(jù)總線3和現(xiàn)場總線5移動以日志文件P1至Pn形式存在的大的數(shù)據(jù)量,所述日志文件包括控制命令、狀態(tài)報告和/或干擾報告,其在管理單元4中通過控制器干預(yù)來觸發(fā),或者在管理單元4的顯示屏或其他可視儀器上進行操作。在此,尤其在設(shè)備投入使用時和/或啟動/關(guān)閉時,需要大量的控制器干預(yù),所述控制器干預(yù)相應(yīng)地產(chǎn)生大量要觀察的反饋報告。這導(dǎo)致操作人員的顯著負擔。
圖2示意性地示出用于處理、尤其預(yù)處理日志文件P1至Pn的方法的實施例,所述日志文件在自動化系統(tǒng)1中生成,并且經(jīng)由數(shù)據(jù)總線3和/或現(xiàn)場總線5傳輸,并且在自動化系統(tǒng)1的單元之間、尤其在管理單元4、自動化設(shè)備2和現(xiàn)場設(shè)備6之間進行交換。
日志文件P1至Pn分別包括至少一個檢測時間戳和文本、尤其是消息、通知、狀態(tài)文本,其描述至少一個事件。附加地,日志文件P1至Pn能夠包括系統(tǒng)時間、版本/補丁號和其他信息作為文本。在此,例如多個日志文件P1至Pn描述一個或多個事件。在技術(shù)設(shè)備的自動化系統(tǒng)1中,例如產(chǎn)生和生成不同的*log-、*xml-、*txt-、*nfo-和/或*dmp-文件作為日志文件P1至Pn。
在自動化系統(tǒng)1的部件的至少一個中,特別地執(zhí)行計算機程序產(chǎn)品,所述計算機程序產(chǎn)品能直接地裝載到數(shù)字計算機、如管理單元4的存儲器中,所述計算機程序產(chǎn)品包括程序代碼部分,所述程序代碼部分適合于執(zhí)行下面描述的方法的步驟。替選地,計算機程序產(chǎn)品也能夠裝載到自動化設(shè)備2中。
替選地,能夠提出計算機可讀的程序介質(zhì),例如任意的存儲器,其包括可由計算機、如管理單元4執(zhí)行的指令(例如以程序代碼的形式),所述指令適合用于使得管理單元4執(zhí)行下面描述的方法步驟。
作為日志壓縮器9執(zhí)行的、用于對所生成的、尤其不同的或不兼容的多個日志文件P1至Pn自動地進行處理、尤其預(yù)處理的方法至少包括如下步驟:
-通過如下方式確定日志文件P1至Pn的每個數(shù)據(jù)組D1至Dn的至少一個消息部分N1至Nn,
-該方式將日志文件P1至Pn的相應(yīng)的數(shù)據(jù)組D1至Dn的全部內(nèi)容鏈接,
-將全部日志文件P1至Pn的數(shù)據(jù)組D1至Dn在總文件SD中組合,
-在數(shù)據(jù)SD中將全部日志文件P1至Pn的數(shù)據(jù)組D1至Dn以時間順序進行排序,
-壓縮在總文件SD中的每個數(shù)據(jù)組D1至Dn,
-通過至少一個或多個數(shù)字的代碼Kx對總文件SD中的壓縮的數(shù)據(jù)組kD1至kDn進行編碼,
-根據(jù)確定的數(shù)字的代碼Kx將壓縮的數(shù)據(jù)組kD1至kDn排序和/或分配、尤其分組至至少一個具有對應(yīng)的組碼KGy的組Gy,并且
-通過對所分配的組Gy的組碼KGy解碼來輸出日志文件P1至Pn的字母數(shù)字的消息部分N1至Nn,并且輸出解碼的組碼KGy。
日志文件P1至Pn的每個數(shù)據(jù)組D1至Dn的消息部分N1至Nn例如包括文本消息,如報告、狀態(tài)、文本、信息、警告等。相應(yīng)的數(shù)據(jù)組D1至Dn例如能夠具有表格或數(shù)據(jù)庫的形式或具有現(xiàn)場細分的其他適當?shù)男问健?/p>
相應(yīng)的日志文件P1至Pn的消息部分N1至Nn例如能夠包含在對應(yīng)的數(shù)據(jù)組D1至Dn的一個或多個區(qū)域中。數(shù)據(jù)組D1至Dn的其他的區(qū)域包含協(xié)議信息和/或系統(tǒng)信息、例如系統(tǒng)時間、版本號、補丁號等等。
根據(jù)本發(fā)明的方法提出,每個日志文件P1至Pn的相應(yīng)的數(shù)據(jù)組D1至Dn的區(qū)域的內(nèi)容在第一步驟中彼此鏈接,并且隨后將全部日志文件P1至Pn的全部鏈接的數(shù)據(jù)組D1至Dn在總文件SD中組合,尤其是數(shù)據(jù)庫或單獨的表格。例如,兩個日志文件P1和P2包括如下內(nèi)容或條目:
日志文件P1:
28.03.2014 ABC
21.03.2014 ZDF
日志文件P2:
27.03.2014 XYZ
01.01.2014 SAP
在將內(nèi)容鏈接和組合到總文件SD中之后,所述總文件包含如下內(nèi)容:
28.03.2014 ABC
27.03.2014 XYZ
21.03.2014 ZDF
01.01.2014 SAP。
在該特別的表格式的總文件SD中,具有鏈接的內(nèi)容的數(shù)據(jù)組D1至Dn根據(jù)分別對應(yīng)的時間戳進行排序,尤其以時間順序排序,例如以上升或下降的順序排序。
對應(yīng)的時間戳尤其能夠是用于所基于的消息的檢測時間戳,所述消息尤其描述技術(shù)設(shè)備中的事件,如“允許范圍中的環(huán)境溫度”、“激活首次啟動”、“泵失效”、“渦輪機啟動”等。替選地或附加地,數(shù)據(jù)組D1至Dn能夠根據(jù)替選的或附加的日志參數(shù)、如檢測地點、檢測類型和/或檢測時間段來排序。
在隨后壓縮具有鏈接的內(nèi)容的數(shù)據(jù)組D1至Dn時,通過至少減少相應(yīng)的數(shù)據(jù)組D1至Dn的數(shù)據(jù)長度和/或數(shù)據(jù)內(nèi)容的方式來處理數(shù)據(jù)組。
例如,對于包含在數(shù)據(jù)組D1至Dn中的特殊字符、例如“§”、“#”、“@”等或非數(shù)字的或非字母的字符、“-”、“/”等自動地使用空白字符。隨后,在相應(yīng)的數(shù)據(jù)組D1至Dn的內(nèi)容鏈中,在存在兩個或更多個彼此相隨的空白字符的情況下,通過刪除/移除數(shù)量超出一個單獨空白字符的彼此相隨的空白字符的方式,將這些空白字符減少到一個空白字符。由此,移除日志文件P1至Pn的數(shù)據(jù)組D1至Dn中的、尤其消息部分N1至Nn(例如文本部分、報告部分、狀態(tài)部分)中的、沒有詳細描述事件的字符。因此,以簡單的方式和方法從日志文件P1至Pn的系統(tǒng)部分(例如系統(tǒng)事件、版本、補丁)中提取消息部分N1至Nn,從而使得對日志文件的進一步的處理和分析限制于內(nèi)容相關(guān)的消息部分N1至Nn,并因此顯著地簡化和加速。
隨后,在另一步驟中,解除消息部分N1至Nn的內(nèi)容的鏈接,由此分開內(nèi)容、尤其字/短語。在此,內(nèi)容例如劃分成字/短語。
為了進一步對數(shù)據(jù)組D1至Dn進行數(shù)據(jù)壓縮,例如從數(shù)據(jù)組D1至Dn中移除具有小于四個、尤其小于三個字符的單獨的字/短語。例如,刪除字“是(Ist)”或“是的(Ja)”。這實現(xiàn)的是,簡單且有效地將兩個或更多個不同的條目/內(nèi)容彼此在句法上(無語義學(xué)意義)且自動地進行比較。
此外提出,對數(shù)據(jù)組D1至Dn、尤其是其單獨的字母數(shù)字的內(nèi)容、如具有尤其多于三個字符的剩余的單獨的字/短語進行分析和統(tǒng)一,通過將參考字Rx分配給每個單獨的字母數(shù)字的內(nèi)容并且將數(shù)字的代碼Kx分配給每個參考字Rx的方式。由此,為了歸檔數(shù)據(jù)組D1至Dn,顯著地降低存儲器需求,并且顯著地加速其分析。
例如,將消息內(nèi)容的字和/或短語
-“允許范圍中的環(huán)境溫度”,
-“綠色范圍中的渦輪機溫度”,
-“激活首次啟動”,
-“泵失效”,
-“啟動渦輪機”
轉(zhuǎn)換成如下參考字Rx
-“環(huán)境溫度是允許的”,
-“渦輪機溫度是允許的”,
-“激活首次啟動”,
-“泵失效”,
-“渦輪機啟動”
和/或轉(zhuǎn)換成如下的數(shù)字的代碼Kx:
-“123”,
-“423”,
-“56”,
-“7”,
-“8”。
在此,將各個字例如借助于一位的數(shù)字的代碼Kx編碼。具有多于一個字的短語例如借助于一個數(shù)字的代碼Kx編碼,所述數(shù)字的代碼具有對應(yīng)于字數(shù)量的相應(yīng)數(shù)量的位數(shù)。相同的字和/或短語借助相同的參考字Rx和相同的數(shù)字的代碼Kx編碼。具有部分一致字符和/或字的不同的數(shù)據(jù)組D1至Dn的字和/或短語利用至少在該位一致的數(shù)字的代碼K進行編碼。
替代數(shù)字的代碼Kx,能夠應(yīng)用字母的代碼和/或字母數(shù)字的代碼。借助于數(shù)字的代碼Kx對數(shù)據(jù)組D1至Dn編碼具有的優(yōu)點是,對日志文件P1至Pn的數(shù)據(jù)組D1至Dn進行簡單和快速的排列和分組。
為了繼續(xù)統(tǒng)一和壓縮不同日志文件P1至Pn的數(shù)據(jù)組D1至Dn并且簡單和快速地分析該數(shù)據(jù)組D1至Dn,根據(jù)確定的參考字Rx和/或數(shù)字的代碼Kx,將具有全部日志文件P1至Pn的單獨的字母數(shù)字的內(nèi)容的、表格形式的總文件SD轉(zhuǎn)換成二維的、尤其字母數(shù)字的代碼矩陣KM。
隨后,在二維的代碼矩陣KM中,將數(shù)字的代碼Kx以時間順序、尤其時間上升或下降地和/或取決于相應(yīng)的字符長度地進行排序。例如,將數(shù)字的代碼Kx“5632”、“543”、“64221”、“123”如下地排序:“123”、“543”、“5632”、“64221”。
附加地,在另一步驟中,借助于相似性運算、尤其所謂的萊文斯坦距離對代碼矩陣KM的相似的數(shù)字的代碼Kx進行分組,尤其分配給至少一個組Gy(=簇)。
在此,通過對應(yīng)的組碼KGy描述或表示每個組Gy。對應(yīng)的組碼KGy在此能夠從第一數(shù)據(jù)組D1至Dn的至少數(shù)字的代碼Kx中生成,所述數(shù)字的代碼分配給所述組Gy。替選地,能夠預(yù)設(shè)一個或多個組Gy的相應(yīng)的組碼KGy。
例如,在新的待考慮的數(shù)字的代碼Kx到組Gy中的一個組的萊文斯坦距離為零的情況下,將該待考慮的數(shù)字的代碼Kx分配給這一個組Gy,因為待考慮的數(shù)字的代碼Kx與組Gy相同,尤其與代表該組Gy的組碼KGy相同。
相反,在待考慮的數(shù)字的代碼Kx到組Gy中的一個組的萊文斯坦距離為一的情況下,并且在待考慮的數(shù)字的代碼Kx與該組Gy僅在一位處不相同的情況下,將該待考慮的數(shù)字的代碼Kx分配給這一個組Gy。例如,在具有對應(yīng)的子代碼KGy為“12”的組Gy中,將具有如下位“123”、“124”、“12”和/或“13”的數(shù)字的代碼Kx分配給該組Gy。
為了在對數(shù)字的代碼Kx進行隨后的分析還有分組時改進和加速查詢函數(shù),在最后的組Gy中或在最后分配有之前的數(shù)字的代碼Kx的組Gy中,啟動待考慮的數(shù)字的代碼Kx與已經(jīng)生成的組Gy的比較。
尤其是為了在分配有之前的數(shù)字的代碼Kx的組Gy中的、新的待考慮的數(shù)字的代碼Kx進行分組和分配而進行的啟動加速了分組算法,因為通常相鄰的、尤其時間上跟隨的、但是也在時間上先前的、之前以時間排序的數(shù)字的代碼Kx分配給同一事件,進而能夠分配給同一組Gy。
此外,能夠?qū)⒚總€新生成的和因此新的待考慮的數(shù)字的代碼Kx與相同長度的或具有長出最多一個字符的更長的長度的、未分組的數(shù)字的代碼Kx進行比較。
當新的待考慮的數(shù)字的代碼Kx到另一未分組的數(shù)字的代碼Kx的萊文斯坦距離等于一時,就由這兩個數(shù)字的代碼Kx通過如下的方式形成具有新的組碼KGy+1的新的組Gy+1,即
-在這兩個待考慮的數(shù)字的代碼Kx的長度不同的情況下,將較短的數(shù)字的代碼Kx作為新的組碼KGy+1分配給新的組Gy+1(例如Kx=“123”和“12”產(chǎn)生具有新的組碼KGy+1為“12”的新的組Gy),或者
-在具有至少一個不同字符的這兩個數(shù)字的代碼Kx的長度相同的情況下,將沒有不同字符的數(shù)字的代碼Kx作為新的組碼KGy+1分配給新的組Gy+1(例如,Kx=“133”和“134”產(chǎn)生具有新的組碼KGy+1為“13”的新的組Gy)。
附加地或替選地,當?shù)搅硪晃捶纸M的數(shù)字的代碼Kx的萊文斯坦距離不等于一的、新的待考慮的數(shù)字的代碼被識別出時,將該待考慮的數(shù)字的代碼Kx分配給另外的新的組Gy+1。在此,將該新的待考慮的數(shù)字的代碼Kx作為組碼KGy+1分配給該另外的新的組Gy+1。將在與該新的組碼KGy+1比較時具有為一的萊文斯坦距離的、未來的待考慮的數(shù)字的代碼Kx分配給該新的組Gy+1。
因此,二維的數(shù)字的代碼Kx示出動態(tài)的專家系統(tǒng),為了對描述事件的、相似的和/或相同的數(shù)字的代碼Kx進行分組,通過添加另外的/新的日志文件P1至Pn的新的數(shù)字的代碼Kx的方式,連續(xù)地擴展和補充具有組碼KGy、KGy+1的確定的組Gy、Gy+1到該專家系統(tǒng)中。
為了進一步處理數(shù)字的代碼Kx和/或組碼KGy、KGy+1的內(nèi)容,對其進行解碼,并且作為日志文件P1至Pn的字母數(shù)字的消息部分N1至Nn輸出,并且例如能夠存儲在存儲器10中。
替選地或附加地,將該解碼的且表示字母數(shù)字的消息部分N1至Nn的數(shù)字的代碼Kx和組碼KGy、KGy+1輸送給管理單元4,以在顯示屏上輸出并對事件進一步分析和評估。
此外,該方法允許的是,在開始該方法時僅使用預(yù)設(shè)數(shù)量的組Gy,并且不生成新的組Gy+1。由此,首先實現(xiàn)將新的待考慮的數(shù)字的代碼Kx進行粗略分組。然后在繼續(xù)運行時,能夠允許生成新的組Gy+1。
盡管通過優(yōu)選的實施例詳細闡明和描述了本發(fā)明,但是本發(fā)明不由公開的實例限制,并且本領(lǐng)域技術(shù)人員能夠由此推導(dǎo)出其他的變型方案,而沒有脫離本發(fā)明的保護范圍。特別地,日志壓縮器9在自動化系統(tǒng)1的一個部件中的適當?shù)奈惶巿?zhí)行。