1.一種基于貝葉斯網(wǎng)絡(luò)的缺陷數(shù)據(jù)自動(dòng)文摘分類方法,其特征在于,所述方法包括:
a.對(duì)每條缺陷數(shù)據(jù)中缺陷表象、缺陷部位、缺陷描述、缺陷設(shè)備、缺陷原因各象限中的文本信息進(jìn)行整合,將整合后的缺陷記錄作為一個(gè)文本分析對(duì)象;利用中文分詞系統(tǒng)對(duì)缺陷文本樣本進(jìn)行分詞;
b.利用貝葉斯分類算法,分別對(duì)缺陷樣本數(shù)據(jù)進(jìn)行設(shè)備名稱、缺陷部位、缺陷類型三個(gè)分析維度的文摘分類,得到部分缺陷維度的分類類型;
c.根據(jù)缺陷數(shù)據(jù)內(nèi)部各維度之間的關(guān)聯(lián)關(guān)系,利用已分類出的部分缺陷維度文摘構(gòu)建缺陷文摘信息的貝葉斯網(wǎng)絡(luò)模型,得到缺陷模型的學(xué)習(xí)規(guī)則;
d.對(duì)實(shí)際缺陷數(shù)據(jù)進(jìn)行自動(dòng)文摘和分類處理,從而規(guī)范缺陷數(shù)據(jù),為設(shè)備缺陷相關(guān)的分析應(yīng)用提供基礎(chǔ)數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的一種基于貝葉斯網(wǎng)絡(luò)的缺陷數(shù)據(jù)自動(dòng)文摘分類方法,其特征在于,步驟b所述分別對(duì)缺陷樣本進(jìn)行設(shè)備名稱、缺陷類型、缺陷部位維度上的貝葉斯分類處理;該過程是指通過利用貝葉斯網(wǎng)絡(luò)學(xué)習(xí)已分類好屬性類別的缺陷樣本,得到能分別識(shí)別設(shè)備名稱、缺陷部位、缺陷類型三個(gè)文摘維度的分類模型,對(duì)缺陷數(shù)據(jù)進(jìn)行初步的分類處理,得到缺陷數(shù)據(jù)的部分文摘信息;
其中,步驟b所述各維度的分類處理過程基本相同,都是在提取詞干后,利用貝葉斯網(wǎng)絡(luò)對(duì)樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),網(wǎng)絡(luò)模型由不同的各類別屬性來進(jìn)行構(gòu)建,其次將遺傳搜索算法作為貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的搜索路勁,訓(xùn)練學(xué)習(xí)得到設(shè)備名稱維度的貝葉斯模型。
3.根據(jù)權(quán)利要求1所述的一種基于貝葉斯網(wǎng)絡(luò)的缺陷數(shù)據(jù)自動(dòng)文摘分類方法,其特征在于,步驟c所述根據(jù)步驟b分類出的設(shè)備名稱、缺陷部位、缺陷類型信息,利用步驟b中已分類出的部分歷史缺陷數(shù)據(jù)摘要和歷史缺陷數(shù)據(jù)在各維度上的信息,構(gòu)建缺陷自動(dòng)文摘的貝葉斯網(wǎng)絡(luò)模型,學(xué)習(xí)訓(xùn)練得到對(duì)應(yīng)模型的學(xué)習(xí)規(guī)則;
41)設(shè)數(shù)據(jù)集
TD={[T1,SM1,SL1,QB1,QL1,QY1],...,[Tn,SMn,SLn,QBn,QLn,QYn]},數(shù)據(jù)集中,SLi,QBi,QLi,QYi分別表示Ti缺陷數(shù)據(jù)的設(shè)備類型、缺陷部位、缺陷類型、缺陷原因類別;將設(shè)備名稱、設(shè)備類型、缺陷部位、缺陷類型、缺陷原因作為貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練節(jié)點(diǎn),在步驟b中初步分類出來的設(shè)備名稱、缺陷部位、缺陷類型維度的信息基礎(chǔ)上,采用四中不同的算法用于估計(jì)網(wǎng)絡(luò)的條件概率表,可分別嘗試使用K2或TAN算法、爬山法、模擬退火、禁忌搜索和遺傳算法等不同搜索算法,得到不同搜索策略下訓(xùn)練生成的網(wǎng)絡(luò)模型,將網(wǎng)絡(luò)參數(shù)調(diào)整至最優(yōu),通過比較各學(xué)習(xí)方案中模型的自動(dòng)文摘準(zhǔn)確率、時(shí)間效率等參數(shù),來最終確定不同分析場景下、不同缺陷數(shù)據(jù)的自動(dòng)文摘分類處理模型,實(shí)現(xiàn)缺陷數(shù)據(jù)的標(biāo)準(zhǔn)化,提高缺陷分析數(shù)據(jù)的質(zhì)量。
4.根據(jù)權(quán)利要求1所述的一種基于貝葉斯網(wǎng)絡(luò)的缺陷數(shù)據(jù)自動(dòng)文摘分類方法,其特征在于,步驟d所述,是指通過訓(xùn)練歷史缺陷樣本數(shù)據(jù)得到分類模型后,根據(jù)設(shè)備所有缺陷類型的缺陷數(shù)據(jù),分別進(jìn)行分類和數(shù)據(jù)的文摘提取,得到缺陷數(shù)據(jù)的分類分析結(jié)論及規(guī)范化表述形式。