一種基于決策樹的軌道交通故障診斷方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種基于決策樹的軌道交通故障診斷方法和系統(tǒng)。該方法的步驟包括:1)通過分析軌道交通設(shè)備的電路和機(jī)械結(jié)構(gòu)模型確定該設(shè)備的各種故障模式和各種監(jiān)測量;2)根據(jù)軌道交通設(shè)備的各種歷史監(jiān)測量得到標(biāo)準(zhǔn)故障樣本數(shù)據(jù),然后采用決策樹生成算法對(duì)標(biāo)準(zhǔn)故障樣本數(shù)據(jù)進(jìn)行分析,構(gòu)造得到故障的決策樹;3)采集軌道交通設(shè)備的各種實(shí)時(shí)監(jiān)測量,并采用所述決策樹作為故障模式的分類模型進(jìn)行分類,從而確定故障種類。該系統(tǒng)包括數(shù)據(jù)采集設(shè)備、數(shù)據(jù)庫單元、數(shù)據(jù)分析單元和知識(shí)庫單元。本發(fā)明解決了現(xiàn)有技術(shù)中人工診斷鐵路信號(hào)系統(tǒng)故障時(shí)工作量大、效率低下、風(fēng)險(xiǎn)性高等技術(shù)問題,提高軌道交通數(shù)據(jù)分析和故障診斷的效率和準(zhǔn)確性。
【專利說明】一種基于決策樹的軌道交通故障診斷方法和系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于信息技術(shù)和軌道交通【技術(shù)領(lǐng)域】,具體涉及一種基于決策樹的軌道交通故障診斷方法和系統(tǒng)。
【背景技術(shù)】
[0002]目前,軌道交通(國有鐵路、企業(yè)鐵路和城市軌道交通)領(lǐng)域、監(jiān)測維護(hù)產(chǎn)品主要有三類:CSM(信號(hào)集中監(jiān)測系統(tǒng))、各設(shè)備維護(hù)機(jī)、通信網(wǎng)管系統(tǒng)。為了提高我國鐵路信號(hào)系統(tǒng)設(shè)備的現(xiàn)代化維修水平,從90年代開始,先后自主研制了 TJWX-1型和TJWX-2000型等不斷升級(jí)中的信號(hào)集中監(jiān)測CSM系統(tǒng)。目前大部分車站都采用了計(jì)算機(jī)監(jiān)測系統(tǒng),實(shí)現(xiàn)了對(duì)車站信號(hào)設(shè)備狀態(tài)的實(shí)時(shí)監(jiān)測,并通過監(jiān)測與記錄信號(hào)設(shè)備的主要運(yùn)行狀態(tài),為電務(wù)部門掌握設(shè)備的當(dāng)前狀態(tài)和進(jìn)行事故分析提供了基本依據(jù),發(fā)揮了重要作用。并且,對(duì)城市軌道交通信號(hào)設(shè)備,集中監(jiān)測CSM系統(tǒng)也被廣泛部署在城軌集中站/車輛段等處,供城軌運(yùn)維使用。此外,伴隨我國高速鐵路的建設(shè)發(fā)展,高鐵特有的RBC系統(tǒng)、TSRS系統(tǒng)、ATP系統(tǒng),也面臨著納入信號(hào)集中監(jiān)測系統(tǒng)的需求,也面臨著提高其監(jiān)測能力、運(yùn)維能力,以及設(shè)備自診斷能力的需求。
[0003]面對(duì)很多復(fù)雜設(shè)備故障和行車事故原因的分析診斷方面,既有CSM系統(tǒng)尚無能為力,目前仍需依靠人工經(jīng)驗(yàn)分析判斷,很多情況下只有在出現(xiàn)重大問題時(shí)才發(fā)現(xiàn)故障,不僅導(dǎo)致了人工診斷鐵路信號(hào)系統(tǒng)故障時(shí)工作量大、故障監(jiān)測與診斷效率低下等技術(shù)問題,增加了行車的危險(xiǎn)。因此,提高各種監(jiān)測資源的利用率,保障行車安全、提高運(yùn)力,是軌道交通領(lǐng)域的迫切需求。
【發(fā)明內(nèi)容】
[0004]為了解決現(xiàn)有技術(shù)中人工診斷鐵路信號(hào)系統(tǒng)故障時(shí)工作量大、效率低下、風(fēng)險(xiǎn)性高等技術(shù)問題,本發(fā)明提供了一種基于決策樹的軌道交通故障診斷方法和系統(tǒng)。
[0005]本發(fā)明采用的技術(shù)方案如下:
[0006]一種基于決策樹的軌道交通故障診斷方法,其步驟包括:
[0007]I)通過分析軌道交通設(shè)備的電路和機(jī)械結(jié)構(gòu)模型確定該設(shè)備的各種故障模式和各種監(jiān)測量;
[0008]2)根據(jù)軌道交通設(shè)備的各種歷史監(jiān)測量得到標(biāo)準(zhǔn)故障樣本數(shù)據(jù),然后采用決策樹生成算法對(duì)標(biāo)準(zhǔn)故障樣本數(shù)據(jù)進(jìn)行分析,構(gòu)造得到故障的決策樹;
[0009]3)采集軌道交通設(shè)備的各種實(shí)時(shí)監(jiān)測量,并采用所述決策樹作為故障模式的分類模型進(jìn)行分類,從而確定故障種類。
[0010]進(jìn)一步地,步驟I)所述各種故障模式包括設(shè)備故障的部位、設(shè)備故障的類型等信息,可以看作是分類的類別屬性,作為決策樹的樹葉。
[0011]進(jìn)一步地,步驟I)所述各種監(jiān)測量包括設(shè)備運(yùn)行中的狀態(tài)參數(shù),可以看作是分類的特征屬性,作為決策書的中間結(jié)點(diǎn)。[0012]進(jìn)一步地,步驟2)采用決策樹生成算法構(gòu)造決策樹的具體實(shí)現(xiàn)過程是:
[0013]a)樹以代表訓(xùn)練樣本的單個(gè)結(jié)點(diǎn)開始。
[0014]b)如果樣本都在同一個(gè)類,則該結(jié)點(diǎn)成為樹葉,并用該類標(biāo)記。
[0015]c)否則,算法選擇最有分類能力的屬性作為決策樹的當(dāng)前結(jié)點(diǎn)。
[0016]d)根據(jù)當(dāng)前決策結(jié)點(diǎn)屬性取值的不同,將訓(xùn)練樣本數(shù)據(jù)集劃分為若干子集。每個(gè)取值形成一個(gè)分枝,有幾個(gè)取值形成幾個(gè)分枝。
[0017]e)針對(duì)上一步得到的一個(gè)子集,重復(fù)進(jìn)行先前步驟,遞歸形成每個(gè)劃分樣本上的決策樹。一旦一個(gè)屬性出現(xiàn)在一個(gè)結(jié)點(diǎn)上,就不必在該結(jié)點(diǎn)的任何后代考慮它。
[0018]f)遞歸劃分步驟僅當(dāng)下列條件之一成立時(shí)停止:
[0019]①給定結(jié)點(diǎn)的所有樣本屬于同一個(gè)類。
[0020]②沒有剩余屬性可以用來進(jìn)一步劃分樣本。在這種情況下,使用多數(shù)表決,將給定的結(jié)點(diǎn)轉(zhuǎn)換成樹葉,并以樣本中元組個(gè)數(shù)最多的類別作為類別標(biāo)記,同時(shí)也可以存放該結(jié)點(diǎn)樣本的類別分布。
[0021]③如果一個(gè)分枝沒有樣本,則以樣本的多數(shù)類創(chuàng)建一個(gè)樹葉。
[0022]進(jìn)一步地,步驟3)以IF-THEN形式的分類規(guī)則表示決策樹,從樹根開始,遍歷整棵樹,對(duì)每條從根到樹葉的路徑創(chuàng)建一個(gè)規(guī)則。
[0023]進(jìn)一步地,對(duì)于產(chǎn)生的決策樹,步驟3)沿著給定路徑上的每個(gè)“屬性-值”對(duì)形成規(guī)則前件的一個(gè)合取項(xiàng);決策樹的葉節(jié)點(diǎn)包含類預(yù)測,形成規(guī)則后件。
[0024]進(jìn)一步地,步驟3)使用成為信息增益的基于熵的度量作為啟發(fā)信息,選擇能夠最好地將樣本分類的屬性,該屬性成為該節(jié)點(diǎn)的“測試”或“判定”屬性,由根結(jié)點(diǎn)開始根據(jù)各個(gè)屬性的信息增益,逐步構(gòu)建決策樹。
[0025]一種采用上述方法的軌道交通故障診斷系統(tǒng),其包括:
[0026]數(shù)據(jù)采集設(shè)備,用于采集軌道交通信號(hào)設(shè)備的監(jiān)測數(shù)據(jù),
[0027]數(shù)據(jù)庫單元,連接所述數(shù)據(jù)采集設(shè)備,用于存儲(chǔ)采集的歷史監(jiān)測數(shù)據(jù)和實(shí)時(shí)監(jiān)測數(shù)據(jù);
[0028]數(shù)據(jù)分析單元,連接所述數(shù)據(jù)庫單元,用于對(duì)數(shù)據(jù)庫中的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,得到進(jìn)行故障診斷的決策樹,并利用數(shù)據(jù)庫中的實(shí)時(shí)數(shù)據(jù)通過決策樹對(duì)設(shè)備進(jìn)行故障診斷;
[0029]知識(shí)庫單元,連接所述數(shù)據(jù)分析單元,用于存儲(chǔ)所述進(jìn)行故障診斷的決策樹。
[0030]進(jìn)一步地,上述系統(tǒng)為設(shè)備級(jí)故障診斷系統(tǒng),所述數(shù)據(jù)采集設(shè)備與所述數(shù)據(jù)庫單元、所述數(shù)據(jù)分析單元、所述知識(shí)庫單元集成于一個(gè)工作站內(nèi),通過數(shù)據(jù)總線進(jìn)行數(shù)據(jù)傳輸;或者所述數(shù)據(jù)庫單元、所述數(shù)據(jù)分析單元、所述知識(shí)庫單元集成于一個(gè)工作站內(nèi),與所述數(shù)據(jù)采集設(shè)備通過以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸。
[0031]進(jìn)一步地,上述系統(tǒng)為運(yùn)維級(jí)故障診斷系統(tǒng),所述數(shù)據(jù)采集設(shè)備、所述數(shù)據(jù)庫單元、所述數(shù)據(jù)分析單元、所述知識(shí)庫單元部署于設(shè)備運(yùn)維平臺(tái)中,所述數(shù)據(jù)庫單元為數(shù)據(jù)庫服務(wù)器,所述數(shù)據(jù)分析單元為數(shù)據(jù)分析服務(wù)器。
[0032]本發(fā)明提供的基于決策樹的軌道交通故障診斷方法和系統(tǒng),在知識(shí)表示方面使得知識(shí)表示簡單、可讀性好、便于專家檢驗(yàn),能夠根據(jù)需要隨時(shí)添加知識(shí),且不影響已經(jīng)獲得的知識(shí);在知識(shí)獲取方法方面具有知識(shí)表示簡單、計(jì)算復(fù)雜性低、適應(yīng)性強(qiáng)的特點(diǎn),使得知識(shí)表示和知識(shí)獲取融為一體,具有較高的推理效率,可以實(shí)現(xiàn)知識(shí)的自動(dòng)獲取,從而較好地解決了知識(shí)獲取的瓶頸問題。本發(fā)明能夠解決現(xiàn)有技術(shù)中人工診斷鐵路信號(hào)系統(tǒng)故障時(shí)工作量大、效率低下、風(fēng)險(xiǎn)性高等技術(shù)問題,提高軌道交通數(shù)據(jù)分析和故障診斷的效率和準(zhǔn)確性。
【專利附圖】
【附圖說明】
[0033]圖1是實(shí)施例中ZPW-2000A無絕緣軌道電路設(shè)備的電路圖。
[0034]圖2是實(shí)施例中采用決策樹生成算法得到的故障決策樹示意圖。
[0035]圖3是實(shí)施例中數(shù)據(jù)分析工作站的結(jié)構(gòu)示意圖。
[0036]圖4是實(shí)施例中便攜式數(shù)據(jù)分析工作站的結(jié)構(gòu)示意圖。
[0037]圖5是實(shí)施例中運(yùn)維級(jí)數(shù)據(jù)分析的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0038]下面通過具體實(shí)施例和附圖,對(duì)本發(fā)明做進(jìn)一步說明。
[0039]本發(fā)明是一種基于決策樹的軌道交通監(jiān)測數(shù)據(jù)分析和故障診斷方法,可以解決現(xiàn)有技術(shù)中人工診斷鐵路信號(hào)系統(tǒng)故障時(shí)工作量大、效率低下、風(fēng)險(xiǎn)性高等技術(shù)問題。
[0040]決策樹學(xué)習(xí)算法,是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,通常用來形成分類器和預(yù)測模型,可以對(duì)未知數(shù)據(jù)進(jìn)行分類或預(yù)測、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘等。它通常包括兩部分:樹的生成和樹的剪枝。下面根據(jù)建立的數(shù)據(jù)樣本集說明決策樹的生成算法的實(shí)現(xiàn)過程。
[0041]決策樹歸納的基本算法是貪婪算法,它以自頂向下遞歸的各個(gè)擊破方式構(gòu)造決策樹。它的基本策略如下:
[0042]1.樹以代表訓(xùn)練樣本的單個(gè)節(jié)點(diǎn)開始。
[0043]2.如果樣本都在同一個(gè)類,則該節(jié)點(diǎn)成為樹葉,并用該類標(biāo)記。否則,使用稱為信息增益的基于熵的度量作為啟發(fā)信息,選擇能夠最好地將樣本分類的屬性。該屬性成為該節(jié)點(diǎn)的“測試”或“判定”屬性。在該算法中,所有的屬性必須都是離散的,即取離散值。對(duì)于值連續(xù)的屬性必須進(jìn)行離散化處理。
[0044]3.對(duì)測試屬性的每個(gè)已知的值,創(chuàng)建一個(gè)分技,并據(jù)此劃分樣本。
[0045]4.使用同樣的過程,遞歸地形成每個(gè)劃分上的樣本判定樹。一旦一個(gè)屬性出現(xiàn)在一個(gè)節(jié)點(diǎn)上,就不必再考慮該節(jié)點(diǎn)的任何后代。
[0046]5.步驟4中的遞歸劃分步驟僅當(dāng)下列條件之一成立時(shí)停止:
[0047](I)給定節(jié)點(diǎn)的所有樣本屬于同一類。
[0048](2)沒有剩余屬性可以用來進(jìn)一步劃分樣本。在此情況下,使用多數(shù)表決。這涉及將給定的結(jié)點(diǎn)轉(zhuǎn)換成樹葉,并用樣本中的多數(shù)所在的類標(biāo)記它。換一種方式,可以存放節(jié)點(diǎn)樣本的類分布。
[0049](3)分枝沒有樣本。在這種情況下,以樣本中的多數(shù)類創(chuàng)建一個(gè)樹葉。
[0050]決策樹歸納算法計(jì)算每個(gè)屬性的信息增益。其有最高信息增益的屬性選作給定全部特征屬性集合S的測試屬性。創(chuàng)建一個(gè)節(jié)點(diǎn),并以該測試屬性標(biāo)記,對(duì)屬性的每個(gè)值創(chuàng)建分枝,并據(jù)此劃分樣本。
[0051]把標(biāo)準(zhǔn)故障樣本數(shù)據(jù)用數(shù)據(jù)庫二維表格的形式存儲(chǔ),運(yùn)用構(gòu)造樹的算法,即可得到一棵故障的決策樹。在得到故障的決策樹之后,可以提取決策樹表示的知識(shí),并以IF-THEN形式的分類規(guī)則表示。從樹根開始,遍歷整棵樹,對(duì)每條從根到樹葉的路徑創(chuàng)建一個(gè)規(guī)則。
[0052]這樣,如果故障樣本齊全,選用的樣本數(shù)據(jù)能夠滿足實(shí)際設(shè)備狀態(tài)的微小波動(dòng),那么就可以得到標(biāo)準(zhǔn)故障分類規(guī)則庫。對(duì)于產(chǎn)生的決策樹,沿著給定路徑上的每個(gè)“屬性-值”對(duì)形成規(guī)則前件的一個(gè)合取項(xiàng)。決策樹的葉節(jié)點(diǎn)包含類預(yù)測,形成規(guī)則后件。當(dāng)給定的樹很大時(shí),IF-THEN規(guī)則易于理解,也便于實(shí)際應(yīng)用。而決策樹本身當(dāng)樹大的時(shí)候不太直觀,所以一般情況下,在得到?jīng)Q策樹后,都把決策樹轉(zhuǎn)化為規(guī)則的形式。
[0053]實(shí)施例1:設(shè)備級(jí)故障診斷
[0054]設(shè)備級(jí)故障診斷將本方案的數(shù)據(jù)分析方法部署于設(shè)備監(jiān)測工作站或便攜式工作站。設(shè)備的歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)都存儲(chǔ)于設(shè)備監(jiān)測工作站或便攜式工作站的本地?cái)?shù)據(jù)庫中。圖3和圖4分別是數(shù)據(jù)分析工作站和便攜式數(shù)據(jù)分析工作站的結(jié)構(gòu)框圖。可以與數(shù)據(jù)采集設(shè)備集成于一個(gè)工作站內(nèi),通過數(shù)據(jù)總線進(jìn)行數(shù)據(jù)傳輸,或者與數(shù)據(jù)采集設(shè)備分布于不同的工作站內(nèi),通過以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸。對(duì)數(shù)據(jù)庫中的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,將得到的決策樹作為故障診斷模型存儲(chǔ)于本地的知識(shí)庫中。對(duì)于數(shù)據(jù)采集的設(shè)備實(shí)時(shí)數(shù)據(jù),通過調(diào)用知識(shí)庫中決策樹完成對(duì)設(shè)備的故障診斷,并根據(jù)故障診斷的結(jié)果對(duì)知識(shí)庫中故障診斷模型進(jìn)行評(píng)估和修改。
[0055]實(shí)施例2:運(yùn)維級(jí)故障診斷
[0056]運(yùn)維級(jí)故障診斷將本方案部署于設(shè)備運(yùn)維平臺(tái)中,采用數(shù)據(jù)庫服務(wù)器進(jìn)行數(shù)據(jù)的存儲(chǔ),數(shù)據(jù)采集設(shè)備通過以太網(wǎng)將采集的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫服務(wù)器,數(shù)據(jù)分析方法部署數(shù)據(jù)分析服務(wù)器,通過以太網(wǎng)獲取數(shù)據(jù)庫服務(wù)器中的歷史數(shù)據(jù),進(jìn)行數(shù)據(jù)分析,將得到的決策樹作為故障診斷模型存儲(chǔ)于設(shè)備運(yùn)維平臺(tái)的知識(shí)庫中。對(duì)于數(shù)據(jù)采集的設(shè)備實(shí)時(shí)數(shù)據(jù),數(shù)據(jù)分析服務(wù)器通過調(diào)用知識(shí)庫中決策樹完成對(duì)設(shè)備的故障診斷,并根據(jù)故障診斷的結(jié)果對(duì)知識(shí)庫中決策樹進(jìn)行評(píng)估和修改。圖5是運(yùn)維級(jí)數(shù)據(jù)分析的結(jié)構(gòu)框圖。
[0057]以ZPW-2000A無絕緣軌道電路設(shè)備故障診斷為例:其電路圖如圖1所示,包括本軌道電路和臨軌道電路,本軌道電路包括主軌道和調(diào)諧區(qū)小軌道。圖中,G、GH為主軌道繼電器,XG、XGH為小軌道繼電器,XGJ、XGJH為小軌道檢查條件,JS為接收器,F(xiàn)S發(fā)送器。
[0058]首先通過分析確定設(shè)備的故障的模式一共有11種,如下:
[0059]①開路故障
[0060]②功出至分線盤有短路
[0061 ] ③衰耗盒至IGJ有斷線或軌道繼電器壞
[0062]④IG或3G衰耗盒至接收盒斷線
[0063]⑤小軌衰耗盒正向調(diào)整電阻有斷線或短路
[0064]⑥3G接收端鋼包銅引接線有松動(dòng)
[0065]⑦小軌區(qū)段導(dǎo)接線有斷線或接觸不良
[0066]⑧接收盒內(nèi)部有短路、衰耗盒調(diào)整封線有脫焊等
[0067]⑨IG主軌電容壞、導(dǎo)接線斷線、軌道有短路、斷軌等
[0068]⑩電纜斷線或發(fā)送端鋼包銅引接線松動(dòng)或電纜盒端子接觸不良
[0069]?發(fā)送功出經(jīng)電纜模擬網(wǎng)絡(luò)至分線盤有斷線[0070]通過軌道監(jiān)測數(shù)據(jù)采集系統(tǒng),其監(jiān)測量主要包括以下幾種:
[0071]①IGJ丨衰耗盒軌道指示a
[0072]②衰耗盒發(fā)送、接收指示b
[0073]③測衰耗盒IG的GJ塞孔電壓c
[0074]④IG軌出I電壓d
[0075]⑤3G衰耗盒軌入小軌電壓e
[0076]⑥3G衰耗盒軌出2小軌電壓f
[0077]⑦3G的軌入主軌g
[0078]⑧IG軌入電壓與歷史正常值比較是否正常h
[0079]⑨分線盤測IG發(fā)送電壓是否正常i
[0080]上述監(jiān)測量可以作為條件屬性,決策屬性為故障的代號(hào)。
[0081]監(jiān)測到的數(shù)據(jù)如表1所示:
[0082]表1.監(jiān)測數(shù)據(jù)
[0083]
【權(quán)利要求】
1.一種基于決策樹的軌道交通故障診斷方法,其步驟包括: 1)通過分析軌道交通設(shè)備的電路和機(jī)械結(jié)構(gòu)模型確定該設(shè)備的各種故障模式和各種監(jiān)測量; 2)根據(jù)軌道交通設(shè)備的各種歷史監(jiān)測量得到標(biāo)準(zhǔn)故障樣本數(shù)據(jù),然后采用決策樹生成算法對(duì)標(biāo)準(zhǔn)故障樣本數(shù)據(jù)進(jìn)行分析,構(gòu)造得到故障的決策樹; 3)采集軌道交通設(shè)備的各種實(shí)時(shí)監(jiān)測量,并采用所述決策樹作為故障模式的分類模型進(jìn)行分類,從而確定故障種類。
2.如權(quán)利要求1所述的方法,其特征在于:步驟I)所述各種故障模式包括設(shè)備故障的部位、設(shè)備故障的類型,是分類的類別屬性,作為決策樹的樹葉。
3.如權(quán)利要求1所述的方法,其特征在于:步驟I)所述各種監(jiān)測量包括設(shè)備運(yùn)行中的狀態(tài)參數(shù),是分類的特征屬性,作為決策書的中間結(jié)點(diǎn)。
4.如權(quán)利要求1所述的方法,其特征在于:步驟2)采用決策樹生成算法構(gòu)造決策樹的方法是: a)樹以代表訓(xùn)練樣本的單個(gè)結(jié)點(diǎn)開始; b)如果樣本都在同一個(gè)類,則該結(jié)點(diǎn)成為樹葉,并用該類標(biāo)記; c)否則,算法選擇最有分類能力的屬性作為決策樹的當(dāng)前結(jié)點(diǎn); d)根據(jù)當(dāng)前決策結(jié)點(diǎn)屬性取值的不同,將訓(xùn)練樣本數(shù)據(jù)集劃分為若干子集,每個(gè)取值形成一個(gè)分枝; e)針對(duì)上一步得到的一個(gè)子集,重復(fù)進(jìn)行先前步驟,遞歸形成每個(gè)劃分樣本上的決策樹,一旦一個(gè)屬性出現(xiàn)在一個(gè)結(jié)點(diǎn)上,就不必在該結(jié)點(diǎn)的任何后代考慮它; f)遞歸劃分步驟僅當(dāng)下列條件之一成立時(shí)停止: ①給定結(jié)點(diǎn)的所有樣本屬于同一個(gè)類; ②沒有剩余屬性可以用來進(jìn)一步劃分樣本,在這種情況下,使用多數(shù)表決將給定的結(jié)點(diǎn)轉(zhuǎn)換成樹葉,并以樣本中元組個(gè)數(shù)最多的類別作為類別標(biāo)記,同時(shí)存放該結(jié)點(diǎn)樣本的類別分布; ③如果一個(gè)分枝沒有樣本,則以樣本的多數(shù)類創(chuàng)建一個(gè)樹葉。
5.如權(quán)利要求1所述的方法,其特征在于:步驟3)以IF-THEN形式的分類規(guī)則表示決策樹,從樹根開始,遍歷整棵樹,對(duì)每條從根到樹葉的路徑創(chuàng)建一個(gè)規(guī)則。
6.如權(quán)利要求1所述的方法,其特征在于:對(duì)于產(chǎn)生的決策樹,步驟3)沿著給定路徑上的每個(gè)“屬性-值”對(duì)形成規(guī)則前件的一個(gè)合取項(xiàng);決策樹的葉節(jié)點(diǎn)包含類預(yù)測,形成規(guī)則后件。
7.如權(quán)利要求1所述的方法,其特征在于:步驟3)使用成為信息增益的基于熵的度量作為啟發(fā)信息,選擇能夠最好地將樣本分類的屬性,該屬性作為節(jié)點(diǎn)的測試或判定屬性,由根結(jié)點(diǎn)開始根據(jù)各個(gè)屬性的信息增益,逐步構(gòu)建決策樹。
8.一種采用權(quán)利要求1所述方法的軌道交通故障診斷系統(tǒng),其特征在于,包括: 數(shù)據(jù)采集設(shè)備,用于采集軌道交通信號(hào)設(shè)備的監(jiān)測數(shù)據(jù); 數(shù)據(jù)庫單元,連接所述數(shù)據(jù)采集設(shè)備,用于存儲(chǔ)采集的歷史監(jiān)測數(shù)據(jù)和實(shí)時(shí)監(jiān)測數(shù)據(jù); 數(shù)據(jù)分析單元,連接所述數(shù)據(jù)庫單元,用于對(duì)數(shù)據(jù)庫中的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,得到進(jìn)行故障診斷的決策樹,并利用數(shù)據(jù)庫中的實(shí)時(shí)數(shù)據(jù)通過決策樹對(duì)設(shè)備進(jìn)行故障診斷; 知識(shí)庫單元,連接所述數(shù)據(jù)分析單元,用于存儲(chǔ)所述進(jìn)行故障診斷的決策樹。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于:所述數(shù)據(jù)采集設(shè)備與所述數(shù)據(jù)庫單元、所述數(shù)據(jù)分析單元、所述知識(shí)庫單元集成于一個(gè)工作站內(nèi),通過數(shù)據(jù)總線進(jìn)行數(shù)據(jù)傳輸;或者所述數(shù)據(jù)庫單元、所述數(shù)據(jù)分析單元、所述知識(shí)庫單元集成于一個(gè)工作站內(nèi),與所述數(shù)據(jù)采集設(shè)備通過以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸。
10.如權(quán)利要求8所述的系統(tǒng),其特征在于:所述數(shù)據(jù)采集設(shè)備、所述數(shù)據(jù)庫單元、所述數(shù)據(jù)分析單元、所述知識(shí)庫單元部署于設(shè)備運(yùn)維平臺(tái)中,所述數(shù)據(jù)庫單元為數(shù)據(jù)庫服務(wù)器,所述數(shù)據(jù)分 析單元為數(shù)據(jù)分析服務(wù)器。
【文檔編號(hào)】G06K9/62GK103714348SQ201410010228
【公開日】2014年4月9日 申請日期:2014年1月9日 優(yōu)先權(quán)日:2014年1月9日
【發(fā)明者】鮑俠 申請人:北京泰樂德信息技術(shù)有限公司