本發(fā)明屬于故障處理,具體涉及一種基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法。
背景技術(shù):
1、近年來,隨著人工智能和大數(shù)據(jù)的不斷發(fā)展使得基于數(shù)據(jù)驅(qū)動的故障診斷模型被廣泛應用,特別是卷積神經(jīng)網(wǎng)絡模型,因其快速準確的診斷性能逐漸成為了故障診斷的主要方法之一。然而,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡模型在進行故障診斷時存在兩個明顯的局限:1、遵循閉集假設,即假設訓練集與測試集所含類別相同,不會出現(xiàn)從未見過的未知故障。但在現(xiàn)實世界中,由于難以搜集到所有故障類別信息,導致模型面臨的往往是一個既可能出現(xiàn)已知故障也可能出現(xiàn)未知故障的開放環(huán)境,在這種環(huán)境下如果仍然使用傳統(tǒng)卷積神經(jīng)網(wǎng)絡模型通常會造成未知故障被錯分為已知故障的問題。2、診斷依據(jù)單一,僅使用網(wǎng)絡提取的特征來衡量樣本之間的差異,導致網(wǎng)絡容易受到開放空間風險的影響,在開放環(huán)境下的診斷結(jié)果不準確。
2、因此,針對上述問題,本發(fā)明對卷積神經(jīng)網(wǎng)絡進行改進,首先,消除了閉集假設,用假設檢驗的方法替換了具有封閉性的softmax層。其次,加入了基于極值理論的元識別系統(tǒng),將基于距離的分類信息反饋給特征,使得診斷結(jié)果不僅僅依賴網(wǎng)絡提取的特征,還在一定程度上受到距離信息的影響,避免分類依據(jù)過于單一。改進后的模型能夠更加適應真實的開放環(huán)境,在保證已知故障識別準確率的前提下更好的拒絕未知故障,降低未知故障樣本被模型分類到已知故障的風險。
技術(shù)實現(xiàn)思路
1、對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,該方法在一定程度上克服了傳統(tǒng)卷積神經(jīng)網(wǎng)絡模型無法拒絕未知故障的問題,基本上實現(xiàn)了對所有已知故障的識別以及對大部分未知故障的拒絕,達到了讓模型適應真實開放環(huán)境,并更加符合實際應用的目的。
2、本發(fā)明的技術(shù)方案如下:
3、一種基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,包括如下步驟:
4、s1獲取故障數(shù)據(jù)并對所述故障數(shù)據(jù)進行預處理,劃分訓練集、驗證集和測試集;
5、s2建立聯(lián)合損失函數(shù),并利用聯(lián)合損失函數(shù)訓練卷積神經(jīng)網(wǎng)絡(cnn);
6、s3完成訓練后,利用cnn倒數(shù)第二個全連接層提取的特征建立元識別系統(tǒng);
7、s4利用元識別系統(tǒng)的輸出對cnn最后一個全連接層提取的特征進行校準;
8、s5對校準后的特征進行假設檢驗并作出最終決策;
9、進一步地,所述s1中預處理具體為:
10、消除所述故障數(shù)據(jù)中的無關(guān)信息,簡化數(shù)據(jù),同時將故障數(shù)據(jù)處理成二維形式。
11、進一步地,所述s2具體為:
12、s21設計網(wǎng)絡結(jié)構(gòu),所述卷積神經(jīng)網(wǎng)絡主要由卷積、激活、批標準化、池化、全連接以及softmax組成;
13、s22確定損失函數(shù),具體使用最后一個全連接層輸出的特征計算softmax損失,使用倒數(shù)第二個全連接層輸出的特征計算中心損失,再將中心損失與softmax損失相加得到聯(lián)合損失函數(shù);
14、s23確定訓練網(wǎng)絡時用到的優(yōu)化器以及其他超參數(shù);
15、s24通過上述參數(shù)對卷積神經(jīng)網(wǎng)絡進行訓練。
16、進一步地,所述s22中的聯(lián)合損失函數(shù)公式為:
17、
18、公式中的第一項為softmax損失函數(shù),其中表示第yi類的第i個深層特征,d是特征維度,表示最后一個完全連接層中的權(quán)重的第j列,是偏置項,每次迭代的批量大小為m,總類別個數(shù)為n,公式中的第二項為中心損失函數(shù),其中表示第yi類樣本深層特征的中心。
19、進一步地,所述s3具體為:
20、s31將驗證集送入訓練好的卷積神經(jīng)網(wǎng)絡中,保存被正確分類的樣本在倒數(shù)第二個全連接層中輸出的特征,計算每一類特征的均值,并將該均值當作每一類的中心;
21、s32計算每一類被正確分類的樣本到各自類中心的距離;
22、s33根據(jù)極值理論,利用每一類距離的尾部極大值擬合各自的韋布爾分布模型。韋布爾分布的公式如下:
23、
24、其中,l為隨機變量,是樣本到類中心的距離,k為形狀參數(shù),λ為縮放因子。
25、s34所有類別的韋布爾分布模型共同組成了元識別系統(tǒng)。
26、進一步地,所述s4具體為:
27、s41設元識別系統(tǒng)的輸出為pi=1-weibulli(l)
28、s42將pi與最后一個全連接層輸出的特征依次相乘從而實現(xiàn)校準。
29、進一步地,所述s5具體為:
30、首先是幾分類就建立幾個零假設和備擇假設,然后將驗證集中的樣本送入帶有元識別系統(tǒng)的卷積神經(jīng)網(wǎng)絡中保存被正確分類的樣本在經(jīng)過校準后的特征,并找到每一類對應那組特征值的α分位數(shù),將特征小于或等于分位數(shù)的部分設為拒絕域,若樣本的最大特征值落入了拒絕域則該樣本屬于未知類,否則屬于最大特征值對應的已知類。
31、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:
32、一方面,消除了傳統(tǒng)的閉集假設,使用更具開放性的假設檢驗方法替換具有封閉性的softmax層,使得模型能在一定置信度水平下合理的拒絕未知故障。另一方面,在傳統(tǒng)卷積神經(jīng)網(wǎng)絡的基礎之上加入基于極值理論的元識別系統(tǒng),可以將該系統(tǒng)得到的基于距離的分類信息反饋給最后一個全連接層輸出的特征,使得診斷結(jié)果不僅僅依賴卷積神經(jīng)網(wǎng)絡提取的特征,還在一定程度上受到距離信息的影響,充分利用了特征以及特征空間中的信息,避免了僅僅使用神經(jīng)網(wǎng)絡提取的特征進行分類,提高了開放環(huán)境下故障診斷的穩(wěn)定性以及準確率。
1.一種基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,包括如下步驟
2.根據(jù)權(quán)利要求1所述的基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,所述s1中預處理具體為:
3.根據(jù)權(quán)利要求1所述的基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,所述s2具體為:
4.根據(jù)權(quán)利要求3所述的基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,所述s22中的聯(lián)合損失函數(shù)公式為:
5.根據(jù)權(quán)利要求1所述的基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,所述s3具體為:
6.根據(jù)權(quán)利要求1所述的基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,所述s4具體為:
7.根據(jù)權(quán)利要求1所述的基于神經(jīng)網(wǎng)絡和假設檢驗的開集識別方法,其特征在于,所述s5具體為: