本發(fā)明屬于滾動(dòng)軸承故障診斷,具體涉及一種基于集成孿生神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法。
背景技術(shù):
1、隨著工業(yè)技術(shù)的快速發(fā)展,機(jī)械設(shè)備尤其是滾動(dòng)軸承的可靠性與安全性成為生產(chǎn)過程中的關(guān)鍵因素。為了保障機(jī)械設(shè)備的正常運(yùn)行,及時(shí)準(zhǔn)確地識(shí)別并診斷其潛在故障顯得尤為重要。近年來,基于深度學(xué)習(xí)的智能故障診斷方法憑借其強(qiáng)大的深層次特征提取能力和端到端的診斷特性,在理論研究領(lǐng)域取得了顯著成果。然而,這些方法在實(shí)際工業(yè)應(yīng)用中面臨著嚴(yán)峻的挑戰(zhàn),尤其是數(shù)據(jù)不平衡問題。
2、在實(shí)際工業(yè)環(huán)境中,滾動(dòng)軸承通常以正常狀態(tài)運(yùn)行,而故障狀態(tài)相對(duì)較少出現(xiàn),這導(dǎo)致故障數(shù)據(jù)與正常數(shù)據(jù)之間存在顯著的不平衡。此外,不同故障類型之間的數(shù)據(jù)也往往是不平衡的,受設(shè)備類型、工作環(huán)境等多種因素影響,某些故障可能更為罕見且難以預(yù)測。這種數(shù)據(jù)不平衡問題直接影響了智能故障診斷模型的泛化性能和故障識(shí)別準(zhǔn)確率,使得傳統(tǒng)基于數(shù)據(jù)分布近似平衡假設(shè)的模型難以直接應(yīng)用于實(shí)際場景。
3、為解決數(shù)據(jù)不平衡問題,當(dāng)前智能故障診斷領(lǐng)域主要采取了三種策略:基于數(shù)據(jù)增強(qiáng)的策略、基于分類器設(shè)計(jì)的策略和基于特征學(xué)習(xí)的策略。然而,這些方法各有其局限性。數(shù)據(jù)增強(qiáng)策略雖然能夠生成新樣本以緩解不平衡問題,但訓(xùn)練難度大、計(jì)算資源消耗高且可能引入噪聲;分類器設(shè)計(jì)策略依賴于輔助數(shù)據(jù)集的質(zhì)量,且在小規(guī)模數(shù)據(jù)集上表現(xiàn)不佳;特征學(xué)習(xí)策略則需要精細(xì)調(diào)整正則化參數(shù),以應(yīng)對(duì)不平衡數(shù)據(jù)的復(fù)雜性,調(diào)試過程繁瑣且效果不穩(wěn)定。
4、孿生神經(jīng)網(wǎng)絡(luò)(siamese?neural?network,snn)作為一種特殊類型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在度量學(xué)習(xí)領(lǐng)域展現(xiàn)了獨(dú)特的優(yōu)勢。其通過并行處理兩個(gè)輸入樣本并學(xué)習(xí)它們之間的相似度,為智能故障診斷提供了一種新的思路。然而,現(xiàn)有的snn技術(shù)在智能故障診斷領(lǐng)域的應(yīng)用仍局限于解決小樣本問題,即故障數(shù)據(jù)與正常數(shù)據(jù)之間的不平衡,且多依賴于深度卷積神經(jīng)網(wǎng)絡(luò)(dcnn)作為子網(wǎng)絡(luò),使用交叉熵?fù)p失函數(shù)進(jìn)行訓(xùn)練。這種方法在面對(duì)極度不平衡的數(shù)據(jù)集時(shí),容易出現(xiàn)過擬合和訓(xùn)練不穩(wěn)定的問題,影響了模型的診斷性能。此外,現(xiàn)有的snn技術(shù)未考慮處理不同類型故障數(shù)據(jù)之間的不平衡問題,還有待研究。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于集成孿生神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法,利用孿生神經(jīng)網(wǎng)絡(luò)技術(shù)解決滾動(dòng)軸承故障數(shù)據(jù)與正常數(shù)據(jù)之間的極度不平衡問題以及不同類型滾動(dòng)軸承故障數(shù)據(jù)之間的不平衡問題。
2、為解決上述技術(shù)問題,本發(fā)明所采取的技術(shù)方案是:一種基于集成孿生神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法,包括以下步驟:
3、步驟1:采集原始滾動(dòng)軸承振動(dòng)信號(hào)作為樣本集,將樣本集進(jìn)行切片劃分出訓(xùn)練集xtrain與測試集xtest,根據(jù)基于順序欠采樣的數(shù)據(jù)劃分策略將訓(xùn)練集xtrain劃分為n個(gè)訓(xùn)練子集
4、
5、所述基于順序欠采樣的數(shù)據(jù)劃分策略為存在樣本相對(duì)少的類別,即少數(shù)類有a類,其中每種少數(shù)類a類別的樣本數(shù)為p;樣本相對(duì)多的類別,即多數(shù)類有b類,其中每種多數(shù)類b類別的樣本數(shù)為q,其中q>p,包括以下步驟:
6、步驟1.1若q被p整除,采用整除情況的基于順序欠采樣的數(shù)據(jù)劃分策略,包括以下步驟:
7、步驟1.1.1:對(duì)樣本集中的多數(shù)類b類所有樣本進(jìn)行無放回的順序欠采樣,將多數(shù)類b類樣本被均衡分配到h個(gè)初始訓(xùn)練子集中,具體方法為:
8、設(shè)定單次的順序欠采樣大小值為u且p=u,選擇各類別的首個(gè)樣本為初始順序欠采樣點(diǎn);按照樣本在各類別中的原始順序,對(duì)多數(shù)類b類中每個(gè)類別樣本均實(shí)施無放回的順序欠采樣;此過程會(huì)重復(fù)多次,直至遍歷所有多數(shù)類b類樣本;最終,多數(shù)類b類樣本被均衡分配到h個(gè)初始訓(xùn)練子集中,其中h=q/p,h=n;
9、步驟1.1.2:將h個(gè)初始訓(xùn)練子集與所有少數(shù)類a類樣本逐一進(jìn)行合并,從而形成n個(gè)訓(xùn)練子集;
10、步驟1.2:若q不能被p整除,采用非整除情況的基于順序欠采樣的數(shù)據(jù)劃分策略,包括以下步驟:
11、步驟1.2.1:應(yīng)用無放回順序欠采樣策略將多數(shù)類b類樣本每個(gè)類別中的前q-(qmodp)-p個(gè)樣本均衡分配到l個(gè)初始訓(xùn)練子集中,其中,l=n-2=(q-(q?modp)-p)/p,并將l個(gè)初始訓(xùn)練子集與少數(shù)類a類樣本逐一進(jìn)行合并以創(chuàng)建n-2個(gè)訓(xùn)練子集;
12、步驟1.2.2:對(duì)多數(shù)類b類各類別的前p個(gè)樣本進(jìn)行有放回的順序欠采樣;隨后將采樣得到的多數(shù)類第l+1個(gè)初始訓(xùn)練子集與少數(shù)類a類樣本進(jìn)行合并以創(chuàng)建第n-1個(gè)訓(xùn)練子集;
13、步驟1.2.3:將多數(shù)類b類樣本每個(gè)類別中的第(q?modp)+1個(gè)樣本作為起始順序欠采樣點(diǎn),應(yīng)用無放回順序欠采樣策略生成第l+2個(gè)初始訓(xùn)練子集;隨后將采樣得到的多數(shù)類第l+2個(gè)初始訓(xùn)練子集與少數(shù)類a類樣本進(jìn)行合并以創(chuàng)建第n個(gè)訓(xùn)練子集;
14、步驟2:使用n個(gè)訓(xùn)練子集分別訓(xùn)練n個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型,所述n個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)相同;所述孿生神經(jīng)網(wǎng)絡(luò)模型包含孿生神經(jīng)子網(wǎng)絡(luò);所述孿生神經(jīng)子網(wǎng)絡(luò)結(jié)構(gòu)包括2個(gè)卷積層、1個(gè)最大池化層和1個(gè)全局平均池化層;第一個(gè)卷積層采用了relu激活函數(shù),并在激活函數(shù)前加入批歸一化層;第二個(gè)卷積層未使用relu激活函數(shù);通過在全局平均池化層后應(yīng)用sigmoid函數(shù),將每個(gè)特征值限制在(0.1)范圍內(nèi);
15、步驟2.1:使用第一個(gè)訓(xùn)練子集訓(xùn)練第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型;
16、步驟2.1.1:從第一個(gè)訓(xùn)練子集中隨機(jī)抽取兩個(gè)樣本,組合成樣本對(duì)(x1,x2),作為第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型的輸入;
17、步驟2.1.2:經(jīng)過第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型輸入后,得到輸出df(x1,x2),其中,df表示經(jīng)過第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型得到的樣本對(duì)(x1,x2)的距離度量值;
18、步驟2.1.3:設(shè)定對(duì)比損失函數(shù)的預(yù)設(shè)閾值,選擇對(duì)比損失函數(shù)作為第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型的損失函數(shù),并加入彈性網(wǎng)絡(luò)正則化,具體公式為:
19、
20、其中,lcontrastive(x1,x2,y)為對(duì)比損失函數(shù);和分別為l1和l2正則化;λ1和λ2分別為l1和l2正則化的系數(shù),n為樣本對(duì)的數(shù)量,df(x1,x2)為距離度量值,margin為對(duì)比損失函數(shù)預(yù)設(shè)閾值,y為樣本健康狀態(tài)標(biāo)簽,ωi是第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型的第i個(gè)參數(shù);
21、步驟2.1.4:利用均方根傳播優(yōu)化算法更新第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型的參數(shù);
22、步驟2.1.5:當(dāng)?shù)谝粋€(gè)孿生神經(jīng)網(wǎng)絡(luò)模型收斂或達(dá)到預(yù)設(shè)的迭代次數(shù)時(shí),自動(dòng)終止訓(xùn)練并保存第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型;否則,返回步驟2.1.1繼續(xù)迭代訓(xùn)練;通過監(jiān)視訓(xùn)練過程中訓(xùn)練集的準(zhǔn)確率來判定第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型是否收斂;如果連續(xù)多輪訓(xùn)練后訓(xùn)練集準(zhǔn)確率不再上升,則判定第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型已收斂;
23、步驟2.2:在獲得第一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型后,采用步驟2.1相同的方法,使用剩下的訓(xùn)練子集訓(xùn)練對(duì)應(yīng)的孿生神經(jīng)網(wǎng)絡(luò)模型,從而獲得n個(gè)訓(xùn)練完成的孿生神經(jīng)網(wǎng)絡(luò)模型;
24、步驟3:利用訓(xùn)練完成的n個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型對(duì)測試集中每個(gè)測試樣本分別進(jìn)行n次滾動(dòng)軸承故障預(yù)診斷,包括以下步驟:
25、步驟3.1:設(shè)定測試樣本總共有m種健康狀態(tài)其中m為任意整數(shù);在診斷一個(gè)健康狀態(tài)未知的測試樣本x0時(shí),首先從訓(xùn)練子集中隨機(jī)選擇每種健康狀態(tài)的一個(gè)樣本,以組成用于模型測試階段的支撐集xs:{x1,x2,...,xm},然后將測試樣本與支撐集中的每個(gè)樣本配對(duì),構(gòu)造出m個(gè)樣本對(duì){(x0,x1),(x0,x2),...,(x0,xm)};
26、步驟3.2:使用訓(xùn)練階段保存的n個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型分別來處理m個(gè)樣本對(duì),每個(gè)孿生神經(jīng)網(wǎng)絡(luò)輸出得到m個(gè)距離度量值用以衡量測試樣本x0與支撐集xs中每個(gè)樣本的差異程度;
27、步驟3.3:從m個(gè)距離度量值中選出最小的一個(gè),將對(duì)應(yīng)的支撐集中樣本的健康狀態(tài)作為一個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型對(duì)測試樣本的滾動(dòng)軸承故障預(yù)診斷結(jié)果,具體公式為:
28、
29、其中,為預(yù)測健康狀態(tài),xc為健康狀態(tài)為c的支撐集中樣本,為使得距離度量值df(x0,xc)的值達(dá)到最小值的健康狀態(tài)c;
30、步驟4:對(duì)n個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型得到的n個(gè)滾動(dòng)軸承故障預(yù)診斷結(jié)果采用多數(shù)投票策略進(jìn)行集成以獲取測試集中每個(gè)樣本的健康狀態(tài),包括以下步驟:
31、步驟4.1:統(tǒng)計(jì)每種健康狀態(tài)的得票數(shù),具體公式為:
32、
33、其中,δ(g)為指示函數(shù),為第u個(gè)孿生神經(jīng)網(wǎng)絡(luò)模型對(duì)測試樣本的預(yù)診斷結(jié)果,cj為第j種健康狀態(tài),為健康狀態(tài)cj的得票數(shù);
34、步驟4.2:選取得票最多的健康狀態(tài)作為測試樣本的故障診斷結(jié)果,具體公式為:
35、
36、其中,為使得達(dá)到最大值的健康狀態(tài)cj,為測試樣本的健康狀態(tài);
37、若出現(xiàn)平局情況,即多個(gè)健康狀態(tài)的得票數(shù)相同,將采用隨機(jī)選擇的方式來進(jìn)一步?jīng)Q策;設(shè)候選的健康狀態(tài)為c1,c2,...,ck,其中,k為平局選項(xiàng)的數(shù)量,k∈[2,m],且k為整數(shù);將根據(jù)均勻分布概率從所有候選項(xiàng)中隨機(jī)抽取一個(gè)選項(xiàng)c作為最終的健康狀態(tài)。
38、采用上述技術(shù)方案所產(chǎn)生的有益效果在于:本發(fā)明提供的一種基于集成孿生神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法,本發(fā)明提出的基于孿生神經(jīng)網(wǎng)絡(luò)的新型框架,通過引入集成思想,結(jié)合多個(gè)基孿生神經(jīng)網(wǎng)絡(luò)的診斷結(jié)果,充分發(fā)揮了每個(gè)模型的優(yōu)勢,彌補(bǔ)了單個(gè)模型可能存在的局限性和偏差,從而得到更可靠和穩(wěn)健的預(yù)測,為精準(zhǔn)預(yù)測與分析領(lǐng)域帶來了重大突破;
39、同時(shí),本發(fā)明還設(shè)計(jì)了一種基于順序欠采樣的數(shù)據(jù)劃分策略,有效構(gòu)建了平衡數(shù)據(jù)集而無需犧牲樣本量,保持了多數(shù)類數(shù)據(jù)分布的穩(wěn)定性,減少了信息丟失和過擬合風(fēng)險(xiǎn),從根本上解決了數(shù)據(jù)不平衡導(dǎo)致的診斷結(jié)果偏差問題;此外,精心設(shè)計(jì)的包含四層主結(jié)構(gòu)的孿生子網(wǎng)絡(luò),通過合理選用激活函數(shù),有效緩解了因樣本量有限而產(chǎn)生的過擬合問題,提高了模型的泛化能力;更值得一提的是,本發(fā)明采用對(duì)比損失函數(shù)作為優(yōu)化目標(biāo),并融合彈性網(wǎng)絡(luò)正則化技術(shù),極大地增強(qiáng)了模型訓(xùn)練的穩(wěn)定性與可靠性,為實(shí)際應(yīng)用中的穩(wěn)健性能提供了堅(jiān)實(shí)保障。綜上所述,本發(fā)明在提升預(yù)測精度、處理數(shù)據(jù)不平衡、減輕過擬合及增強(qiáng)模型穩(wěn)定性等方面均展現(xiàn)出顯著的有益效果。