本發(fā)明涉及遷移學(xué)習(xí)的無(wú)監(jiān)督故障診斷,具體為一種結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法及系統(tǒng)。
背景技術(shù):
1、基于小數(shù)據(jù)和不平衡數(shù)據(jù)的智能故障診斷是指利用有限的機(jī)器故障樣本建立智能診斷模型,以實(shí)現(xiàn)準(zhǔn)確的故障識(shí)別,一直受到研究人員的關(guān)注。根據(jù)軸承故障診斷的三個(gè)主要階段:數(shù)據(jù)預(yù)處理、特征提取和條件分類,現(xiàn)有的研究成果可以分為以下三類:基于數(shù)據(jù)增強(qiáng)的、基于特征學(xué)習(xí)的和基于分類器設(shè)計(jì)的。其中,得益于gan等深度學(xué)習(xí)模型的出現(xiàn)和應(yīng)用,基于數(shù)據(jù)增強(qiáng)的小樣本類不平衡的故障診斷方法成為當(dāng)下的主流解決方案團(tuán)。具體而言,在數(shù)據(jù)增強(qiáng)方面,數(shù)據(jù)生成和數(shù)據(jù)過(guò)采樣模型可以有效地?cái)U(kuò)展故障數(shù)據(jù)集。基于對(duì)抗的領(lǐng)域自適應(yīng)旨在通過(guò)對(duì)抗訓(xùn)練的方式減小源域和目標(biāo)域之間的領(lǐng)域差異,獲取具有域不變性的特征,從而能夠?qū)⒃搭I(lǐng)域上訓(xùn)練的分類器應(yīng)用于目標(biāo)數(shù)據(jù)的分類。從而提高模型在目標(biāo)域上的泛化性能。這種對(duì)抗訓(xùn)練的方式起源于gan,受此影響,ganin等人們提出了域?qū)股窠?jīng)網(wǎng)絡(luò),可以對(duì)來(lái)自源域的大量標(biāo)記數(shù)據(jù)和來(lái)自目標(biāo)域的大量未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練。通過(guò)用幾個(gè)標(biāo)準(zhǔn)層和一個(gè)簡(jiǎn)單的新梯度反轉(zhuǎn)層對(duì)其進(jìn)行增強(qiáng),幾乎可以在任何前饋模型中實(shí)現(xiàn)領(lǐng)域自適應(yīng),訓(xùn)練分類器分支以最小化源數(shù)據(jù)上的分類損失。在訓(xùn)練過(guò)程中,dann通過(guò)最小化主任務(wù)的損失以及最大化域分類器的分類誤差來(lái)學(xué)習(xí)到對(duì)抗性的特征表示。這樣,模型可以在源域和目標(biāo)域之間找到一種共享的特征表示,這種極大極小博弈有效地調(diào)整了源和目標(biāo)之間的分布,從而達(dá)到領(lǐng)域自適應(yīng)的目的。偽標(biāo)簽在uda的應(yīng)用中分為兩大類:偽標(biāo)注在提高分類器識(shí)別率方面的應(yīng)用和偽標(biāo)注在類別特征對(duì)齊方面的應(yīng)用。第一類是通過(guò)在源域中進(jìn)行監(jiān)督學(xué)習(xí),在目標(biāo)域中進(jìn)行弱監(jiān)督學(xué)習(xí),得到具有高泛化能力的分類器的方法,目標(biāo)域中使用高質(zhì)量的偽標(biāo)簽進(jìn)行標(biāo)注。第二類是指使用偽標(biāo)記來(lái)促進(jìn)源域和目標(biāo)域中的類別特征對(duì)齊的方法,本方法中使用的是第二類方法。
2、本方法針對(duì)軸承故障診斷中的領(lǐng)域差異問(wèn)題,在對(duì)抗訓(xùn)練直接對(duì)齊邊緣分布的基礎(chǔ)上,引入結(jié)構(gòu)化預(yù)測(cè),以最大的條件概率選擇最自信的標(biāo)記目標(biāo)樣本的偽標(biāo)記方法,借助lpp投影的方式,通過(guò)潛在子空間對(duì)齊源域和目標(biāo)域的條件分布,縮小領(lǐng)域差距,進(jìn)而提升無(wú)監(jiān)督故障診斷識(shí)別精度。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述存在的問(wèn)題,提出了本發(fā)明。
2、因此,本發(fā)明解決的技術(shù)問(wèn)題是:本發(fā)明是解決傳統(tǒng)方案數(shù)據(jù)沒(méi)有標(biāo)簽,并且故障數(shù)據(jù)稀缺,限制了數(shù)據(jù)驅(qū)動(dòng)模型的泛化能力,現(xiàn)有技術(shù)沒(méi)有充分解決內(nèi)部結(jié)構(gòu)數(shù)據(jù),在不平衡的故障場(chǎng)景中提出了挑戰(zhàn)的問(wèn)題。
3、為解決上述技術(shù)問(wèn)題,本發(fā)明提供如下技術(shù)方案:
4、第一方面,本發(fā)明提供了一種結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法,包括:
5、獲取故障數(shù)據(jù)和真實(shí)數(shù)據(jù),將所述真實(shí)數(shù)據(jù)分成目標(biāo)域數(shù)據(jù)和真實(shí)樣本數(shù)據(jù),混合所述故障數(shù)據(jù)和真實(shí)樣本數(shù)據(jù),得到源域數(shù)據(jù);
6、利用源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)訓(xùn)練條件域?qū)股窠?jīng)網(wǎng)絡(luò),對(duì)齊所述源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù),并利用特征提取器提取所述源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的域不變特征,得到源域的特征樣本和目標(biāo)域的特征樣本;
7、分別對(duì)源域的特征樣本和目標(biāo)域的特征樣本進(jìn)行歸一化處理,得到第一源域特征樣本和第一目標(biāo)域特征樣本,利用局部保留投影算法將所述第一源域特征樣本和第一目標(biāo)域特征樣本投影到同一子空間中,進(jìn)行二次對(duì)齊;
8、對(duì)第一目標(biāo)域特征樣本分配偽標(biāo)簽學(xué)習(xí)源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的域不變子空間,并得到投影矩陣,對(duì)所述投影矩陣進(jìn)行求解,根據(jù)求解結(jié)果使用分類器對(duì)第一目標(biāo)域特征樣本進(jìn)行分類。
9、作為本發(fā)明所述的結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的一種優(yōu)選方案,其中:利用源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)訓(xùn)練條件域?qū)股窠?jīng)網(wǎng)絡(luò)包括:
10、利用特征提取器從源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)中提取特征,應(yīng)用多線性映射到特征上;
11、訓(xùn)練域鑒別器和目標(biāo)分類器,將目標(biāo)分類器與域鑒別器進(jìn)行對(duì)抗;
12、定義損失函數(shù),包括分類損失和域?qū)箵p失;
13、分類損失表示為:
14、
15、其中,為源域上的最小化分類損失,為單個(gè)樣本在源域上的分類損失,us為源域的特征,vs為源域?qū)?yīng)特征的標(biāo)簽,ε為模型的參數(shù),μ為目標(biāo)分類器的參數(shù),f為特征提取器,gμs為目標(biāo)分類器在源域上對(duì)特征進(jìn)行分類的函數(shù)。
16、作為本發(fā)明所述的結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的一種優(yōu)選方案,其中:域?qū)箵p失包括:
17、域?qū)箵p失表示為:
18、
19、其中,為最大域?qū)箵p失,為源域和目標(biāo)域上的對(duì)抗損失,ω為域鑒別器的參數(shù),為多線性映射,hω為域鑒別器,gs和gt為源域和目標(biāo)域的數(shù)據(jù)集,fs(us)和ft(ut)分別為源域和目標(biāo)域特征提取函數(shù),gs(us)和gt(ut)分別為對(duì)特征進(jìn)行進(jìn)一步處理的函數(shù);
20、利用優(yōu)化算法對(duì)損失函數(shù)進(jìn)行梯度下降,并通過(guò)反向傳播更新對(duì)抗神經(jīng)網(wǎng)絡(luò)模型參數(shù),訓(xùn)練完成后,對(duì)抗神經(jīng)網(wǎng)絡(luò)模型輸出源域的特征樣本和目標(biāo)域的特征樣本。
21、作為本發(fā)明所述的結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的一種優(yōu)選方案,其中:投影矩陣包括:
22、將源域的特征樣本和目標(biāo)域的特征樣本拼接成矩陣;
23、通過(guò)監(jiān)督局部保留投影從矩陣學(xué)習(xí)源域和目標(biāo)域的域不變子空間,求解如下公式,得到投影矩陣表示為:
24、
25、其中,m為投影矩陣,u為有標(biāo)簽的源域數(shù)據(jù)和有偽標(biāo)簽的目標(biāo)域數(shù)據(jù)的集合,n為拉普拉斯矩陣,b為度矩陣,k為學(xué)習(xí)過(guò)程中的迭代次數(shù),tr(〃)為正則化項(xiàng),i為單位矩陣。
26、作為本發(fā)明所述的結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的一種優(yōu)選方案,其中:對(duì)所述投影矩陣進(jìn)行求解包括:
27、通過(guò)廣義特征值分解求解投影矩陣,表示為:(ubuk-λunuk)m=λim,得到最優(yōu)解m=[m1,m2,...,ma],其中,λ為正則化參數(shù),m1,m2,...,ma為最大的特征值所對(duì)應(yīng)的特征向量。
28、作為本發(fā)明所述的結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的一種優(yōu)選方案,其中:對(duì)第一目標(biāo)域特征樣本分配偽標(biāo)簽包括:
29、利用投影矩陣分別計(jì)算源域的特征樣本和目標(biāo)域的特征樣本在子空間的投影,對(duì)所有投影使用平均減法,得到所有投影的平均值;
30、將所有投影的平均值利用歸一化到子空間,得到不同類別的特征樣本并確定每個(gè)類別的類原型,將類原型定為標(biāo)簽為v的投影源特征的均值向量,表示為:
31、
32、其中,為標(biāo)簽為v的投影源特征的均值向量,為第i個(gè)投影的特征向量,為指數(shù)函數(shù);
33、利用類原型和目標(biāo)域的特征樣本的投影,計(jì)算目標(biāo)域的特征樣本屬于每個(gè)類別的條件概率。
34、作為本發(fā)明所述的結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的一種優(yōu)選方案,其中:還包括:
35、利用聚類算法在目標(biāo)域的特征樣本的投影向量上進(jìn)行聚類,生成與類原型相同數(shù)量的聚類中心,將聚類中心作為目標(biāo)域的特征樣本的初始化聚類中心,并與源域的類原型聯(lián)系起來(lái);
36、通過(guò)最小化聚類中心和類原型之間所有匹配對(duì)的距離之和,將目標(biāo)域的聚類與源域的類原型進(jìn)行匹配;
37、結(jié)合最接近類原型的偽標(biāo)記方法和基于結(jié)構(gòu)化預(yù)測(cè)的方法表示為:
38、
39、得到最終的偽標(biāo)簽表示為:
40、
41、其中,為給定目標(biāo)域的特征樣本屬于類別v的條件概率,為給定條件下,類別v的條件概率,為距離函數(shù),v為所有類別組合的集合,exp(〃)為指數(shù)函數(shù);
42、使用具有真實(shí)標(biāo)簽的源域的特征樣本和帶有偽標(biāo)簽的目標(biāo)域的特征樣本,通過(guò)基于選擇性偽標(biāo)簽的迭代學(xué)習(xí)算法來(lái)更新投影矩陣和偽標(biāo)簽,在每次迭代中,選擇目標(biāo)特征及其對(duì)應(yīng)的偽標(biāo)簽進(jìn)行學(xué)習(xí);
43、在迭代學(xué)習(xí)完成后,使用更新后的投影矩陣和偽標(biāo)簽對(duì)對(duì)抗神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到故障診斷結(jié)果。
44、第二方面,本發(fā)明提供了一種結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷的系統(tǒng),包括:
45、數(shù)據(jù)混合模塊,用于獲取故障數(shù)據(jù)和真實(shí)數(shù)據(jù),將所述真實(shí)數(shù)據(jù)分成目標(biāo)域數(shù)據(jù)和真實(shí)樣本數(shù)據(jù),混合所述故障數(shù)據(jù)和真實(shí)樣本數(shù)據(jù),得到源域數(shù)據(jù);
46、特征提取模塊,用于利用源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)訓(xùn)練條件域?qū)股窠?jīng)網(wǎng)絡(luò),對(duì)齊所述源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù),并利用特征提取器提取所述源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的域不變特征,得到源域的特征樣本和目標(biāo)域的特征樣本;
47、投影模塊,用于分別對(duì)源域的特征樣本和目標(biāo)域的特征樣本進(jìn)行歸一化處理,得到第一源域特征樣本和第一目標(biāo)域特征樣本,利用局部保留投影算法將所述第一源域特征樣本和第一目標(biāo)域特征樣本投影到同一子空間中,進(jìn)行二次對(duì)齊;
48、分類模塊,用于對(duì)第一目標(biāo)域特征樣本分配偽標(biāo)簽學(xué)習(xí)源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的域不變子空間,并得到投影矩陣,對(duì)所述投影矩陣進(jìn)行求解,根據(jù)求解結(jié)果使用分類器對(duì)第一目標(biāo)域特征樣本進(jìn)行分類。
49、第三方面,本發(fā)明提供了一種計(jì)算設(shè)備,包括:
50、存儲(chǔ)器和處理器;
51、所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令,所述處理器用于執(zhí)行所述計(jì)算機(jī)可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的步驟。
52、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述結(jié)構(gòu)化預(yù)測(cè)的無(wú)監(jiān)督工業(yè)故障診斷方法的步驟。
53、本發(fā)明的有益效果:針對(duì)實(shí)際故障數(shù)據(jù)稀缺的問(wèn)題,利用合成數(shù)據(jù)生成技術(shù),可以創(chuàng)建充足的訓(xùn)練數(shù)據(jù),提高數(shù)據(jù)驅(qū)動(dòng)模型的泛化能力,結(jié)合條件領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)和局部保留投影(lpp),引入均方誤差損失,提出新的無(wú)監(jiān)督故障診斷框架,特別針對(duì)類別不平衡問(wèn)題,提高診斷精度,該框架在處理不平衡數(shù)據(jù)集時(shí)表現(xiàn)出色,同時(shí)在平衡數(shù)據(jù)集上也能保持較高的準(zhǔn)確率,顯示出強(qiáng)大的泛化能力和適應(yīng)性,用基于選擇性偽標(biāo)簽的迭代學(xué)習(xí)策略,通過(guò)不斷更新投影矩陣和偽標(biāo)簽,進(jìn)一步提升模型性能,顯著提升了工業(yè)故障診斷的準(zhǔn)確性和魯棒性。