本技術(shù)屬于計(jì)算機(jī)深度學(xué)習(xí),具體涉及一種基于多源域知識(shí)聯(lián)合遷移的設(shè)備故障診斷網(wǎng)絡(luò)模型訓(xùn)練方法。
背景技術(shù):
1、滾動(dòng)軸承是雙轉(zhuǎn)子航空發(fā)動(dòng)機(jī)系統(tǒng)中的關(guān)鍵組件。它通常在高速、嘈雜的工作環(huán)境下工作,容易發(fā)生故障,從而影響發(fā)動(dòng)機(jī)的正常工作,甚至造成嚴(yán)重事故。開展航空發(fā)動(dòng)機(jī)軸承的故障診斷研究有助于準(zhǔn)確診斷滾動(dòng)軸承故障特征,對(duì)提高航空發(fā)動(dòng)機(jī)的安全性和可靠性具有重要意義。
2、近年來,關(guān)于數(shù)據(jù)驅(qū)動(dòng)的軸承故障診斷方法的研究得到了快速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)、長(zhǎng)短期記憶網(wǎng)絡(luò)等不同的深度學(xué)習(xí)模型已被用于設(shè)備故障診斷,獲得了高效的性能。但是,大多數(shù)方法都依賴于大量的有標(biāo)簽數(shù)據(jù),假設(shè)訓(xùn)練和測(cè)試數(shù)據(jù)是獨(dú)立同分布的,并且假設(shè)目標(biāo)域樣本是存在的。然而,在實(shí)際的工業(yè)應(yīng)用場(chǎng)景中,獲取足夠的有標(biāo)簽數(shù)據(jù)是極其困難的。設(shè)備的工作條件往往具有不確定性,目標(biāo)域工況下的樣本及故障標(biāo)簽信息均難以獲取,并且可用于訓(xùn)練的數(shù)據(jù)通常采集自多個(gè)工況條件下,這往往會(huì)導(dǎo)致訓(xùn)練數(shù)據(jù)(源域)與測(cè)試數(shù)據(jù)(目標(biāo)域)的分布是不同的,存在明顯的域偏移問題,大大降低了傳統(tǒng)故障診斷模型的性能和有效性,難以獲得預(yù)期的結(jié)果。在實(shí)際運(yùn)行過程中,航空發(fā)動(dòng)機(jī)的工況會(huì)發(fā)生變化,從而導(dǎo)致數(shù)據(jù)樣本分布的不一致。并且僅使用單一源域的數(shù)據(jù)來訓(xùn)練故障診斷模型可能無法獲得理想的診斷性能,然而全面收集和標(biāo)記足夠的訓(xùn)練樣本以使故障診斷模型對(duì)所有工作條件都具有魯棒性是不現(xiàn)實(shí)的。
3、由此可見,設(shè)備的跨域故障診斷具有重要的現(xiàn)實(shí)意義,能夠?qū)W習(xí)和分類領(lǐng)域不變特征是構(gòu)建跨域故障診斷模型的關(guān)鍵。面對(duì)跨域故障診斷任務(wù)中未知領(lǐng)域所帶來的挑戰(zhàn),通常采用域自適應(yīng)方法和基于域泛化的故障診斷方法,以解決在面對(duì)未知領(lǐng)域數(shù)據(jù)時(shí)出現(xiàn)的性能衰退問題。
4、當(dāng)目標(biāo)域數(shù)據(jù)可用時(shí),域自適應(yīng)方法可以通過減小源域與目標(biāo)域之間的數(shù)據(jù)分布差異來解決域偏移問題。liu等人提出了一種用于滾動(dòng)軸承故障診斷的深度對(duì)抗域適應(yīng)模型,以解決源域和目標(biāo)域的分布不一致問題。xiao等人設(shè)計(jì)了一種嵌入聯(lián)合最大均值差異的改進(jìn)損失函數(shù),實(shí)現(xiàn)無監(jiān)督跨域場(chǎng)景下的邊緣分布和條件分布的同時(shí)對(duì)齊。但是,基于單源域的遷移學(xué)習(xí)策略由于知識(shí)遷移源單一,可能無法獲得理想的泛化性能。通過采集不同場(chǎng)景下的多源域數(shù)據(jù),并采用基于多源域的遷移學(xué)習(xí)技術(shù)可進(jìn)一步提高診斷模型的泛化性能。因此,gao等人提出了一種多源域信息融合網(wǎng)絡(luò),將對(duì)抗性遷移學(xué)習(xí)技術(shù)與多源域的細(xì)粒度信息融合相結(jié)合,實(shí)現(xiàn)源域和目標(biāo)域的特征學(xué)習(xí)和知識(shí)遷移;tian等人利用多分支網(wǎng)絡(luò)結(jié)構(gòu)分別匹配每個(gè)源域和目標(biāo)域的特征空間分布,將多源域診斷知識(shí)遷移到跨域故障診斷任務(wù)中。域自適應(yīng)方法利用已知數(shù)據(jù)集的診斷知識(shí)實(shí)現(xiàn)目標(biāo)域的故障診斷任務(wù),但是這種方法假設(shè)在模型的訓(xùn)練過程中目標(biāo)域的數(shù)據(jù)樣本是可訪問的。同時(shí),訓(xùn)練好的模型通常只能處理單一目標(biāo)域的故障診斷任務(wù),難以有效地遷移到其他目標(biāo)域,對(duì)目標(biāo)域的泛化能力有限。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中存在的問題和不足,本發(fā)明的目的旨在提供一種基于多源域知識(shí)聯(lián)合遷移的設(shè)備故障診斷網(wǎng)絡(luò)模型訓(xùn)練方法。
2、為實(shí)現(xiàn)發(fā)明目的,本發(fā)明采用的技術(shù)方案如下:
3、本發(fā)明第一方面提供了一種設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,包括以下步驟:
4、s1:采集不同工況條件下設(shè)備運(yùn)行過程中表征設(shè)備故障的信號(hào)數(shù)據(jù),根據(jù)工況條件利用信號(hào)數(shù)據(jù)構(gòu)建多個(gè)有標(biāo)簽源域數(shù)據(jù)集、無標(biāo)簽源域數(shù)據(jù)集、目標(biāo)域數(shù)據(jù)集,每個(gè)有標(biāo)簽源域數(shù)據(jù)集、無標(biāo)簽源域數(shù)據(jù)集、目標(biāo)域數(shù)據(jù)集中信號(hào)數(shù)據(jù)表征的設(shè)備故障類別均包含全部故障分類,任意兩個(gè)有標(biāo)簽源域數(shù)據(jù)集對(duì)應(yīng)工況條件不同,任意兩個(gè)無標(biāo)簽源域數(shù)據(jù)集對(duì)應(yīng)的工況條件不同;對(duì)所述有標(biāo)簽源域數(shù)據(jù)集、目標(biāo)域數(shù)據(jù)集中的每個(gè)信號(hào)數(shù)據(jù)進(jìn)行標(biāo)注,得到每個(gè)信號(hào)數(shù)據(jù)對(duì)應(yīng)的設(shè)備故障類別的真實(shí)標(biāo)簽信息;所述無標(biāo)簽源域數(shù)據(jù)集中的信號(hào)數(shù)據(jù)不進(jìn)行標(biāo)注;
5、s2:依次從所有有標(biāo)簽源域數(shù)據(jù)集和無標(biāo)簽源域數(shù)據(jù)集中抽取相同數(shù)量的故障類別相同的信號(hào)數(shù)據(jù),組成一個(gè)批次訓(xùn)練樣本,按照所述一個(gè)批次訓(xùn)練樣本的構(gòu)建方法構(gòu)建得到多個(gè)批次訓(xùn)練樣本,多個(gè)批次訓(xùn)練樣本組成訓(xùn)練樣本集;依次從所有目標(biāo)域數(shù)據(jù)集中抽取相同數(shù)量的信號(hào)數(shù)據(jù),組成一個(gè)批次驗(yàn)證樣本,按照所述一個(gè)批次驗(yàn)證樣本的構(gòu)建方法構(gòu)建得到多個(gè)批次驗(yàn)證樣本,將多個(gè)批次訓(xùn)練樣本按比例隨機(jī)劃分為驗(yàn)證集和測(cè)試集;
6、s3:利用訓(xùn)練樣本集對(duì)預(yù)先構(gòu)建的設(shè)備故障診斷網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,優(yōu)化所述設(shè)備故障診斷網(wǎng)絡(luò)模型的參數(shù),得到訓(xùn)練后的設(shè)備故障診斷網(wǎng)絡(luò)模型;
7、s4:采用驗(yàn)證集對(duì)步驟s3得到的訓(xùn)練后的設(shè)備故障診斷網(wǎng)絡(luò)模型進(jìn)行驗(yàn)證,評(píng)估訓(xùn)練后的設(shè)備故障診斷網(wǎng)絡(luò)模型的診斷性能,挑選出最優(yōu)設(shè)備故障診斷網(wǎng)絡(luò)模型;
8、s5:采用測(cè)試集對(duì)步驟s4得到的最優(yōu)設(shè)備故障診斷網(wǎng)絡(luò)模型進(jìn)行測(cè)試,評(píng)價(jià)最優(yōu)設(shè)備故障診斷網(wǎng)絡(luò)模型的性能。
9、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,所述設(shè)備故障診斷網(wǎng)絡(luò)模型由特征提取器和故障分類器組成,所述特征提取器用于提取信號(hào)數(shù)據(jù)包含的設(shè)備故障特征,所述故障分類器用于對(duì)特征提取器提取到的設(shè)備故障特征進(jìn)行學(xué)習(xí)分析,預(yù)測(cè)出信號(hào)數(shù)據(jù)對(duì)應(yīng)的設(shè)備故障類別并輸出;所述特征提取器包括依次連接的第一cov1d層、第二cov1d層、第三cov1d層、第一全連接層和第二全連接層組成。其中,所述第一cov1d層用于對(duì)輸入的數(shù)據(jù)信號(hào)樣本進(jìn)行特征提取(卷積、批標(biāo)準(zhǔn)化、最大池化),得到數(shù)據(jù)信號(hào)樣本的一級(jí)特征圖,第一cov1d層的輸入為數(shù)據(jù)信號(hào)樣本,第一cov1d層的輸出為一級(jí)特征圖;所述第二cov1d層用于對(duì)第一cov1d層輸出的一級(jí)特征圖進(jìn)行特征提取,得到二級(jí)特征圖并輸出;所述第三cov1d層用于對(duì)第二cov1d層輸出的二級(jí)特征圖進(jìn)行特征提取,得到三級(jí)特征圖并輸出;所述特征提取器的第一全連接層用于學(xué)習(xí)三級(jí)特征圖特征之間的非線性組合并整合全局信息,所述特征提取器的第一全連接層的輸入為經(jīng)展平處理的三級(jí)特征圖,所述特征提取器的第一全連接層的輸出為所述三級(jí)特征圖的一維特征向量;所述特征提取器的第二全連接層用于將第一全連接層輸出的一維特征向量映射到低維特征空間,生成特征嵌入向量。
10、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,所述特征提取器中第一cov1d層、第二cov1d層、第三cov1d層的網(wǎng)絡(luò)結(jié)構(gòu)相同,均由依次連接的卷積層、批標(biāo)準(zhǔn)化層和最大池化層組成。
11、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,所述故障分類器由依次連接的第一全連接層、第二全連接層和softmax輸出層組成。所述故障分類器的第一全連接層用于對(duì)所述特征提取器第二全連接層輸出的特征嵌入向量進(jìn)行組合和轉(zhuǎn)換,提取出更高層次的特征,所述故障分類器的第一全連接層的輸入為所述特征提取器第二全連接層輸出的特征嵌入向量,所述故障分類器的第一全連接層的輸出為低維特征向量;所述故障分類器的第二全連接層用于將所述故障分類器第一全連接層輸出的低維特征向量映射到一個(gè)低維的特征空間,得到更加精細(xì)和判別性強(qiáng)的特征表示,故障分類器的第二全連接層的輸入為故障分類器的第一全連接層輸出的低維特征向量,故障分類器的第二全連接層的輸出為故障判別特征向量;softmax輸出層是通過softmax函數(shù)將故障分類器的第二全連接層輸出的故障判別特征向量轉(zhuǎn)換為故障類別的概率分布,softmax輸出層的輸出為故障類別的概率分布向量,所述概率分布特征向量中每個(gè)元素對(duì)應(yīng)一個(gè)故障類別的概率值,故障分類器將選擇概率最高的類別作為預(yù)測(cè)故障類別并輸出,實(shí)現(xiàn)故障診斷任務(wù)。
12、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,步驟s3中,利用訓(xùn)練樣本集對(duì)預(yù)先構(gòu)建的設(shè)備故障診斷網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,優(yōu)化所述設(shè)備故障診斷網(wǎng)絡(luò)模型的參數(shù)的具體操作為:
13、s301:將訓(xùn)練樣本集中的批次訓(xùn)練樣本輸入預(yù)先構(gòu)建的設(shè)備故障診斷網(wǎng)絡(luò)模型的特征提取器中,采用特征提取器對(duì)所述批次訓(xùn)練樣本進(jìn)行特征提取,得到批次訓(xùn)練樣本中每個(gè)信號(hào)數(shù)據(jù)的設(shè)備故障特征,利用最大均值差異計(jì)算一個(gè)批次訓(xùn)練樣本中來自不同源域數(shù)據(jù)集的信號(hào)數(shù)據(jù)的設(shè)備故障特征之間的邊緣分布差異,利用最大均值差異計(jì)算訓(xùn)練樣本中來自不同有標(biāo)簽源域數(shù)據(jù)集的設(shè)備故障類別相同的信號(hào)數(shù)據(jù)樣本之間的條件分布差異,根據(jù)邊緣分布差異和條件分布差異構(gòu)建特征提取器的多源域聯(lián)合損失函數(shù)lf;
14、s302:將所述特征提取器提取的批次訓(xùn)練樣本中來自有標(biāo)簽源域數(shù)據(jù)集的信號(hào)數(shù)據(jù)樣本的設(shè)備故障特征輸入所述故障分類器中進(jìn)行檢測(cè),得到所述批次訓(xùn)練樣本中來自有標(biāo)簽源域數(shù)據(jù)集的信號(hào)數(shù)據(jù)樣本的預(yù)測(cè)設(shè)備故障類別,根據(jù)預(yù)測(cè)設(shè)備故障類別和真實(shí)標(biāo)簽之間的差異,采用交叉熵構(gòu)造所述故障分類器的監(jiān)督分類損失函數(shù)ly;然后根據(jù)多源域聯(lián)合損失函數(shù)lf和監(jiān)督分類損失函數(shù)ly構(gòu)造所述設(shè)備故障診斷網(wǎng)絡(luò)模型的總損失函數(shù)lall,總損失函數(shù)lall的計(jì)算公式如下:
15、lall=ly+λ2lf
16、式中,lall表示總損失函數(shù),ly表示監(jiān)督分類損失函數(shù),lf表示多源域聯(lián)合損失函數(shù),λ2是模型訓(xùn)練時(shí)所采用的經(jīng)驗(yàn)參數(shù);
17、s303:基于總損失函數(shù)lall通過反向傳播算法優(yōu)化更新所述特征提取器的網(wǎng)絡(luò)參數(shù),直至總損失函數(shù)lall收斂;基于監(jiān)督分類損失函數(shù)ly通過反向傳播算法優(yōu)化更新所述故障分類器的網(wǎng)絡(luò)參數(shù),直至監(jiān)督分類損失函數(shù)ly收斂,得到訓(xùn)練后的設(shè)備故障診斷網(wǎng)絡(luò)模型。
18、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,步驟s301中,所述多源域聯(lián)合損失函數(shù)lf的計(jì)算公式如下:
19、
20、式中,n是參與模型訓(xùn)練過程的源域數(shù)據(jù)集個(gè)數(shù);m是有標(biāo)簽源域數(shù)據(jù)集的個(gè)數(shù);nc是有標(biāo)簽源域中的故障類別數(shù);mmd(m)是邊緣分布差異度量,mmd(c)是第c類故障類別所對(duì)應(yīng)的條件分布差異度量;zk和zp分別表示第k個(gè)有標(biāo)簽源域或無標(biāo)簽源域和第p個(gè)有標(biāo)簽源域或無標(biāo)簽源域所對(duì)應(yīng)的深層特征分布故障特征集;和分別表示第k個(gè)有標(biāo)簽源域和第p個(gè)有標(biāo)簽源域中第c個(gè)故障類別對(duì)應(yīng)的故障類別特征集;λ1為條件分布差異度量對(duì)應(yīng)的經(jīng)驗(yàn)參數(shù);x、y分別對(duì)應(yīng)于批次訓(xùn)練樣本中不同的源域數(shù)據(jù)集,xi為源域數(shù)據(jù)集x的第i個(gè)樣本;yj為源域數(shù)據(jù)集y的第j個(gè)樣本;m表示源域數(shù)據(jù)集x中的樣本數(shù)量;n表示源域數(shù)據(jù)集y中的樣本數(shù)量;k(·,·)為核函數(shù)。
21、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,步驟s302中,所述監(jiān)督分類損失函數(shù)ly的計(jì)算公式如下:
22、
23、式中,ly表示監(jiān)督分類損失函數(shù);os表示從有標(biāo)簽源域數(shù)據(jù)樣本中提取到的設(shè)備故障特征;ys表示來自有標(biāo)簽源域數(shù)據(jù)集的信號(hào)數(shù)據(jù)樣本對(duì)應(yīng)的故障類別真實(shí)標(biāo)簽;ns表示一個(gè)批次的有標(biāo)簽源域數(shù)據(jù)集的樣本數(shù)量;c表示設(shè)備故障類別的數(shù)量;i[·]表示softmax輸出層輸出的信號(hào)數(shù)據(jù)樣本的故障類別的概率得分。
24、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,步驟s303中,優(yōu)化更新所述特征提取器的網(wǎng)絡(luò)參數(shù)θf的公式如下:
25、
26、式中,θf為特征提取器的參數(shù),ly表示監(jiān)督分類損失函數(shù),ε是網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)率,lf表示多源域聯(lián)合損失函數(shù),λ2是模型訓(xùn)練時(shí)所采用的經(jīng)驗(yàn)參數(shù)。
27、根據(jù)上述的設(shè)備故障診斷網(wǎng)絡(luò)模型的訓(xùn)練方法,優(yōu)選地,步驟s303中,優(yōu)化更新所述故障分類器的網(wǎng)絡(luò)參數(shù)θy的公式如下:
28、
29、式中,θy是故障分類器的參數(shù),ε是網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)率,ly表示監(jiān)督分類損失函數(shù)。
30、本發(fā)明第二方面提供了一種設(shè)備故障診斷方法,具體為:獲取設(shè)備運(yùn)行過程中表征設(shè)備故障的信號(hào)數(shù)據(jù),將所述信號(hào)數(shù)據(jù)輸入設(shè)備故障診斷網(wǎng)絡(luò)模型中進(jìn)行檢測(cè),得到所述設(shè)備的故障類別信息;其中,所述設(shè)備故障診斷網(wǎng)絡(luò)模型為采用上述第一方面所述訓(xùn)練方法進(jìn)行訓(xùn)練得到的設(shè)備故障診斷網(wǎng)絡(luò)模型。
31、本發(fā)明第三方面提供了一種電子設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)由計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述第一方面所述的訓(xùn)練方法,或者如上述第二方面所述的設(shè)備故障診斷方法。
32、本發(fā)明第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的訓(xùn)練方法,或者如上述第二方面所述的設(shè)備故障診斷方法。
33、與現(xiàn)有技術(shù)相比,本發(fā)明取得的積極效果如下:
34、(1)本發(fā)明基于多源域遷移學(xué)習(xí)策略,利用采集到的由若干個(gè)有標(biāo)簽源域數(shù)據(jù)集和無標(biāo)簽源域數(shù)據(jù)集組成的含少量標(biāo)記的多源域數(shù)據(jù)集對(duì)模型進(jìn)行多源域協(xié)同訓(xùn)練;而且,為了學(xué)習(xí)領(lǐng)域不變特征,設(shè)計(jì)了基于最大均值差異的多源域聯(lián)合差異損失函數(shù),減小了不同域之間的邊緣分布差異和條件分布差異,最小化域相關(guān)信息,增強(qiáng)學(xué)習(xí)特征的域不變性,有效提高了模型的域泛化性能,同時(shí)將多源域聯(lián)合差異損失與監(jiān)督分類損失相結(jié)合,在模型訓(xùn)練過程中共同更新網(wǎng)絡(luò)參數(shù);學(xué)習(xí)故障樣本中的領(lǐng)域不變特征,將共享診斷知識(shí)從標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)共同遷移到目標(biāo)領(lǐng)域中,因此訓(xùn)練后的設(shè)備故障診斷網(wǎng)絡(luò)模型不需要提前獲取目標(biāo)樣本即可完成跨域故障診斷任務(wù)。
35、(2)本發(fā)明設(shè)備故障診斷方法在面對(duì)未知工況樣本時(shí),保證了良好的診斷性能和領(lǐng)域泛化性能;而且,在一具體實(shí)施方式中,本發(fā)明利用航空發(fā)動(dòng)機(jī)軸間軸承故障數(shù)據(jù)集,建立不同跨工況場(chǎng)景下的多組實(shí)驗(yàn),通過與其他方法的比較,驗(yàn)證了本發(fā)明診斷方法在針對(duì)航空組件的跨工況故障診斷性能方面的有效性。