本發(fā)明屬于航空安全技術與飛行數據應用領域,具體涉及一種基于飛行數據的小概率航空不安全事件誘因分析和在線監(jiān)測方法及系統(tǒng)。
背景技術:
1、飛行安全始終是航空運輸事業(yè)的重中之重?;诤胶箫w行數據分析的飛行品質監(jiān)控,為航空安全起到基礎性保障作用。然而,在發(fā)生概率較低的不安全事件實時監(jiān)測和預防方面,當前的飛行品質監(jiān)控技術仍顯不足,具體表現在:
2、首先,缺少應對小樣本數據的分析手段。數據驅動的不安全事件檢測方法,通常需要大量的事件數據進行訓練。諸如飛行員嚴重操作異常、發(fā)動機空中停車等故障導致的不安全事件發(fā)生率極低,這就難以收集足量的小概率不安全事件數據進行學習訓練。
3、其次,缺少對不安全事件的定量解釋手段。不安全事件的風險定量分析能夠輔助飛行安全專家更好地理解風險模式,并采取相應的預防措施。不安全事件風險通常由多個飛行參數聯合表征,且風險發(fā)生的時刻和持續(xù)時間均具有不確定性。當前的不安全事件誘因主要依賴飛行安全專家的主觀分析,難以定量描述風險嚴重程度。
4、第三,傳統(tǒng)的航后數據分析方法難以適應實時監(jiān)測的要求,目前的在線監(jiān)測方式通過超限值檢測來確保飛行品質,但此時不安全事件已經發(fā)生。須要提前發(fā)現潛在風險,有效阻斷威脅和差錯進一步演變?yōu)椴话踩录酥溜w行事故。
技術實現思路
1、為解決上述問題,本發(fā)明提出了一種基于飛行數據的小概率航空不安全事件誘因分析和在線監(jiān)測方法及系統(tǒng),針對特定的不安全事件,從飛行品質監(jiān)控標準標記的嚴重偏差、輕度偏差事件標簽出發(fā),以小樣本數據完成弱監(jiān)督學習模型訓練,獲得不安全事件量化風險值。經統(tǒng)計分析獲得高風險時刻,并解釋高風險誘因。進一步采用蒸餾學習的方式獲得小型學生網絡,用于在線不安全事件監(jiān)測。
2、為實現上述目的,本發(fā)明提供了如下方案:一種基于飛行數據的小概率航空不安全事件誘因分析和在線監(jiān)測方法,包括以下步驟:
3、s0:通過飛機飛行品質監(jiān)控標準確定輸入參數集合,并構建基于弱監(jiān)督學習的風險識別架構??;
4、s1:基于所述風險識別架構ⅰ,獲得風險識別網絡i和量化風險值,并利用統(tǒng)計分析得到高風險的時刻點和誘因;
5、s2:利用知識蒸餾方法將風險識別網絡ⅰ辨識不安全事件風險的能力繼承至風險識別網絡ⅱ上,獲得用于在線監(jiān)測的風險識別網絡ⅱ,基于所述在線監(jiān)測的風險識別網絡ⅱ,進行在線風險檢測。
6、優(yōu)選的,所述s0中,通過飛機飛行品質監(jiān)控標準確定輸入參數集合,并構建基于弱監(jiān)督學習的風險識別架構ⅰ的方法包括:
7、s0.1:參考飛機飛行品質監(jiān)控標準,依據飛行安全專家確定輸入參數集合;
8、s0.2:建立時域卷積網絡tcn,利用時域卷積網絡tcn從航后飛行數據集中提取不安全事件特征,同時保留飛行數據中時序依賴特性;
9、s0.3:建立門控循環(huán)單元gru和注意力機制相結合的示例轉換模塊,隨后利用邏輯層和最大池化操作完成不安全事件分類,形成基于弱監(jiān)督學習的風險識別架構?。?/p>
10、其中,所述s0.1中,參考飛機飛行品質監(jiān)控標準,依據飛行安全專家確定輸入參數集合的方法包括:
11、結合飛行安全專家經驗,確定飛行員操作相關的參數集合pam、飛機飛行狀態(tài)相關的參數集合pas,以并集p={pam?upas}作為輸入參數,一共有d個參數;
12、其中,所述s0.2中,建立時域卷積tcn網絡,利用時域卷積tcn網絡從航后飛行數據集中提取不安全事件特征,同時保留飛行數據中時序依賴特性的方法包括:
13、針對第j個航段的原始參數序列利用因果膨脹卷積提取任一時刻tk之前的歷史信息,并采用殘差連接的方式降低網絡復雜度;將原始參數序列輸入時域卷積tcn網絡,經時域卷積tcn網絡處理后輸出其中代表第j個航段數據在第tk時刻內的飛行參數序列記錄,代表第i個參數在tk時刻的記錄值,q(·)代表時域卷積tcn網絡的特征提取過程;
14、其中,所述s0.3中,建立門控循環(huán)單元gru和注意力機制相結合的示例轉換模塊,隨后利用邏輯層和最大池化操作完成不安全事件分類,形成基于弱監(jiān)督學習的風險識別架構ⅰ的方法包括:
15、將時域卷積tcn網絡輸出作為門控循環(huán)單元gru的輸入,并利用自注意力層att增強模型可解釋性,得到包含局部和長時間依賴特性的特征圖輸出獲得第j次航段數據中tk時刻的示例包含t1~tk時刻的參數序列信息;隨后經過全連接層fcl得到分類任務的特征圖為第j次航段數據中tk時刻的分類示例,后接邏輯層log;采用sigmoid函數為邏輯層log的激活函數,實現示例到量化風險值的轉換,獲得隨時間變化的量化風險值其中為第j次航段數據中tk時刻的量化風險值,最后經過聚合層max,采用最大池化得到包標簽ybag,j,當時ybag,j=1,否則ybag,j=0,其中為λ0為預設閾值,通常取λ0=0.5,完成基于弱監(jiān)督學習的風險識別架構ⅰ的構建。
16、優(yōu)選的,所述s1中,基于所述風險識別架構ⅰ,獲得風險識別網絡i和量化風險值,并利用統(tǒng)計分析得到高風險的時刻點和誘因的方法包括:
17、s1.1:建立包含時間步長級的超限標簽損失、不安全航段標記損失的模型優(yōu)化目標,同時引入對特定不安全事件風險持續(xù)時長的先驗知識作為航段風險總時長的限制;
18、s1.2:采用模型無關元學習方法,在元訓練階段,利用嚴重偏差、輕度偏差和正常數據使模型獲得高泛化性能力初始參數θm,隨后在元測試階段利用嚴重偏差和正常數據使風險識別架構ⅰ迅速收斂,得到訓練好的風險識別網絡ⅰ參數θf,基于訓練好的風險識別網絡ⅰ參數θf,獲得量化風險值;
19、s1.3:采用頻數統(tǒng)計的方法對量化風險值進行分析,獲得不安全事件的高風險時刻點,隨后通過顯著性檢驗方法,獲得不安全事件數據中與正常數據具有顯著性差異的參數和時刻,得到不安全事件的誘因;
20、其中,所述s1.1中,建立包含時間步長級的超限標簽損失、不安全航段標記損失的模型優(yōu)化目標,同時引入對特定不安全事件風險持續(xù)時長的先驗知識作為航段風險總時長的限制的方法包括:
21、
22、其中,θ表示其網絡參數,ls(·)為超限損失,li(·)為分類損失,x為任一飛行參數序列,為網絡輸出的量化風險值,為tk時刻的示例概率,y為包含事件步長級超限標簽的向量,λc為限制項的權重,a為模型檢測出的風險總時長的下限,b為模型檢測出的風險總時長的上限;
23、其中,所述s1.2中,采用模型無關元學習方法,在元訓練階段,利用嚴重偏差、輕度偏差和正常數據使模型獲得高泛化性能力初始參數θm,隨后在元測試階段利用嚴重偏差和正常數據使風險識別架構ⅰ迅速收斂,得到訓練好的風險識別網絡ⅰ參數θf,基于訓練好的風險識別網絡ⅰ參數θf,獲得量化風險值的方法包括:
24、在劃分好dtrain和dtest的基礎上,其中,dtrain包含該類不安全事件的嚴重偏差數據、輕度偏差數據和正常數據,dtest僅包含不安全事件的嚴重偏差數據和正常數據;在元訓練階段首先隨機初始化模型參數θ,設定最大迭代次數iter,隨后開始循環(huán)迭代優(yōu)化,其中,第一次模型更新過程稱為內循環(huán),第二次模型更新稱為外循環(huán),模型訓練時內外循環(huán)階段交替進行,直至達到迭代次數iter或模型收斂;將元訓練過程獲得的模型最佳初始化參數稱為θm,隨后通過模型微調獲得在特定任務的模型參數θf;當模型精度符合要求后,輸出微調后的模型最優(yōu)參數θt;基于模型最優(yōu)參數θt,獲得訓練好的模型輸入m條嚴重偏差數據,以模型邏輯層輸出作為數據的量化風險值,以第j條嚴重偏差數據為例,獲得量化風險值
25、其中,所述s1.3中,采用頻數統(tǒng)計的方法對量化風險值進行分析,獲得不安全事件的高風險時刻點,隨后通過顯著性檢驗方法,獲得不安全事件數據中與正常數據具有顯著性差異的參數和時刻,得到不安全事件的誘因的方法包括:
26、對m條歷史飛行數據的量化風險值,求得各時刻點風險值大于λ1的期望值,其中任一時刻tk的期望值pk計算方式如下:
27、
28、其中i(·)為指示函數,若其中條件為真則值為1,否則為0,得到{p1,p2,...,pl},選擇期望值大于預設閾值λ2的時刻作為高風險時刻點{t1,...,tl},即有l(wèi)個高風險時刻。
29、優(yōu)選的,所述s2中,利用知識蒸餾方法將風險識別網絡ⅰ辨識不安全事件風險的能力繼承至風險識別網絡ⅱ上,獲得用于在線監(jiān)測的風險識別網絡ⅱ,基于所述在線監(jiān)測的風險識別網絡ⅱ,進行在線風險檢測的方法包括:
30、s2.1:利用固定長度的多參數飛行序列表征不安全事件航段中的風險時段,通過固定窗長的滑動窗口重新劃分多參數飛行序列,基于量化風險得分完成對窗口數據的標注;
31、s2.2:采用知識蒸餾方法,將風險識別網絡ⅰ的能力繼承至用于在線風險監(jiān)測的風險識別網絡ⅱ上,利用窗口化飛行參數序列作為風險識別網絡ⅱ的訓練數據,同時通過硬標簽損失確保模型識別不安全事件的能力,通過軟標簽損失確保模型準確量化當前的風險;
32、s2.3:以長度w的滑動窗口連續(xù)截取實時數據流并輸入風險識別網絡ii,輸出當前滑窗內誘發(fā)不安全事件的概率;
33、其中,所述s2.1中,利用固定長度的多參數飛行序列表征不安全事件航段中的風險時段,通過固定窗長的滑動窗口重新劃分多參數飛行序列,基于量化風險得分完成對窗口數據的標注的方法包括:
34、采用固定窗長為的w滑動窗切割多參數飛行序列,并基于不安全事件量化風險得分閾值λ3對窗口內的數據進行標注,當窗口內參數序列任一時刻的量化風險值超過λ3時,即max([yi,yi+1,...,yi+w])>λ3,將該序列數據[xi,j,...,xi+w,j]標注為風險序列,其中yi代表窗口起點處的量化風險值,yi+w代表窗口終點處的量化風險值;當窗口內數據量化風險值均未超過閾值,即max([yi,yi+1,...,yi+w])≤λ3,則將該序列標注為正常序列;
35、所述s2.2中,采用知識蒸餾方法,將風險識別網絡ⅰ的能力繼承至用于在線風險監(jiān)測的風險識別網絡ⅱ上,利用窗口化飛行參數序列作為風險識別網絡ⅱ的訓練數據,同時通過硬標簽損失確保模型識別不安全事件的能力,通過軟標簽損失確保模型準確量化當前的風險的方法包括:
36、損失函數為:
37、
38、其中,損失函數lkd分為硬標簽損失lhard和軟標簽損失lsoft,硬標簽損失lhard中為學生模型預測的風險標簽,y′=i([y1,...,y1+w]>λ3)為教師模型輸出的高風險時刻標簽,軟標簽損失lsoft中為教師模型輸出的第i段數據溫度修正后的logit值,為學生模型輸出的第i段數據溫度修正后的logit值。
39、本發(fā)明還提供了一種基于飛行數據的小概率航空不安全事件誘因分析和在線監(jiān)測系統(tǒng),所述系統(tǒng)用于實現所述的方法,包括:識別架構構建模塊、識別網絡構建模塊和風險檢測模塊;
40、所述識別架構構建模塊用于通過飛機飛行品質監(jiān)控標準確定輸入參數集合,并構建基于弱監(jiān)督學習的風險識別架構??;
41、所述識別網絡構建模塊用于基于所述風險識別架構ⅰ,獲得風險識別網絡i和量化風險值,并利用統(tǒng)計分析得到高風險的時刻點和誘因;
42、所述風險檢測模塊用于利用知識蒸餾方法將風險識別網絡ⅰ辨識不安全事件風險的能力繼承至風險識別網絡ⅱ上,獲得用于在線監(jiān)測的風險識別網絡ⅱ,基于所述在線監(jiān)測的風險識別網絡ⅱ,進行在線風險檢測。
43、優(yōu)選的,所述識別架構構建模塊包括:參數確定單元、特征提取單元和識別架構構建單元;
44、所述參數確定單元用于參考飛機飛行品質監(jiān)控標準,依據飛行安全專家確定輸入參數集合;
45、所述特征提取單元用于建立時域卷積網絡tcn,利用時域卷積網絡tcn從航后飛行數據集中提取不安全事件特征,同時保留飛行數據中時序依賴特性;
46、所述識別架構構建單元用于建立門控循環(huán)單元gru和注意力機制相結合的示例轉換模塊,隨后利用邏輯層和最大池化操作完成不安全事件分類,形成基于弱監(jiān)督學習的風險識別架構??;
47、其中,所述參數確定單元中,參考飛機飛行品質監(jiān)控標準,依據飛行安全專家確定輸入參數集合的過程包括:
48、結合飛行安全專家經驗,確定飛行員操作相關的參數集合pam、飛機飛行狀態(tài)相關的參數集合pas,以并集p={pam?upas}作為輸入參數,一共有d個參數;
49、其中,所述特征提取單元中,建立時域卷積tcn網絡,利用時域卷積tcn網絡從航后飛行數據集中提取不安全事件特征,同時保留飛行數據中時序依賴特性的過程包括:
50、針對第j個航段的原始參數序列利用因果膨脹卷積提取任一時刻tk之前的歷史信息,并采用殘差連接的方式降低網絡復雜度;將原始參數序列輸入時域卷積tcn網絡,經時域卷積tcn網絡處理后輸出其中代表第j個航段數據在第tk時刻內的飛行參數序列記錄,代表第i個參數在tk時刻的記錄值,q(·)代表時域卷積tcn網絡的特征提取過程;
51、其中,所述識別架構構建單元中,建立門控循環(huán)單元gru和注意力機制相結合的示例轉換模塊,隨后利用邏輯層和最大池化操作完成不安全事件分類,形成基于弱監(jiān)督學習的風險識別架構ⅰ的過程包括:
52、將時域卷積tcn網絡輸出作為門控循環(huán)單元gru的輸入,并利用自注意力層att增強模型可解釋性,得到包含局部和長時間依賴特性的特征圖輸出獲得第j次航段數據中tk時刻的示例包含t1~tk時刻的參數序列信息;隨后經過全連接層fcl得到分類任務的特征圖為第j次航段數據中tk時刻的分類示例,后接邏輯層log;采用sigmoid函數為邏輯層log的激活函數,實現示例到量化風險值的轉換,獲得隨時間變化的量化風險值其中為第j次航段數據中tk時刻的量化風險值,最后經過聚合層max,采用最大池化得到包標簽ybag,j,當時ybag,j=1,否則ybag,j=0,其中為λ0為預設閾值,通常取λ0=0.5,完成基于弱監(jiān)督學習的風險識別架構ⅰ的構建。
53、優(yōu)選的,所述識別網絡構建模塊包括:時長限制設定單元、風險值計算單元和不安全誘因計算單元;
54、所述時長限制設定單元用于建立包含時間步長級的超限標簽損失、不安全航段標記損失的模型優(yōu)化目標,同時引入對特定不安全事件風險持續(xù)時長的先驗知識作為航段風險總時長的限制;
55、所述風險值計算單元用于采用模型無關元學習方法,在元訓練階段,利用嚴重偏差、輕度偏差和正常數據使模型獲得高泛化性能力初始參數θm,隨后在元測試階段利用嚴重偏差和正常數據使風險識別架構ⅰ迅速收斂,得到訓練好的風險識別網絡ⅰ參數θf,基于訓練好的風險識別網絡ⅰ參數θf,獲得量化風險值;
56、所述不安全誘因計算單元用于采用頻數統(tǒng)計的方法對量化風險值進行分析,獲得不安全事件的高風險時刻點,隨后通過顯著性檢驗方法,獲得不安全事件數據中與正常數據具有顯著性差異的參數和時刻,得到不安全事件的誘因;
57、其中,所述時長限制設定單元中,建立包含時間步長級的超限標簽損失、不安全航段標記損失的模型優(yōu)化目標,同時引入對特定不安全事件風險持續(xù)時長的先驗知識作為航段風險總時長的限制的過程包括:
58、
59、其中,θ表示其網絡參數,ls(·)為超限損失,li(·)為分類損失,x為任一飛行參數序列,為網絡輸出的量化風險值,為tk時刻的示例概率,y為包含事件步長級超限標簽的向量,λc為限制項的權重,a為模型檢測出的風險總時長的下限,b為模型檢測出的風險總時長的上限;
60、其中,所述風險值計算單元中,采用模型無關元學習方法,在元訓練階段,利用嚴重偏差、輕度偏差和正常數據使模型獲得高泛化性能力初始參數θm,隨后在元測試階段利用嚴重偏差和正常數據使風險識別架構ⅰ迅速收斂,得到訓練好的風險識別網絡ⅰ參數θf,基于訓練好的風險識別網絡ⅰ參數θf,獲得量化風險值的過程包括:
61、在劃分好dtrain和dtest的基礎上,其中,dtrain包含該類不安全事件的嚴重偏差數據、輕度偏差數據和正常數據,dtest僅包含不安全事件的嚴重偏差數據和正常數據;在元訓練階段首先隨機初始化模型參數θ,設定最大迭代次數iter,隨后開始循環(huán)迭代優(yōu)化,其中,第一次模型更新過程稱為內循環(huán),第二次模型更新稱為外循環(huán),模型訓練時內外循環(huán)階段交替進行,直至達到迭代次數iter或模型收斂;將元訓練過程獲得的模型最佳初始化參數稱為θm,隨后通過模型微調獲得在特定任務的模型參數θf;當模型精度符合要求后,輸出微調后的模型最優(yōu)參數θt;基于模型最優(yōu)參數θt,獲得訓練好的模型輸入m條嚴重偏差數據,以模型邏輯層輸出作為數據的量化風險值,以第j條嚴重偏差數據為例,獲得量化風險值
62、其中,所述不安全誘因計算單元中,采用頻數統(tǒng)計的方法對量化風險值進行分析,獲得不安全事件的高風險時刻點,隨后通過顯著性檢驗方法,獲得不安全事件數據中與正常數據具有顯著性差異的參數和時刻,得到不安全事件的誘因的過程包括:
63、對m條歷史飛行數據的量化風險值,求得各時刻點風險值大于λ1的期望值,其中任一時刻tk的期望值pk計算方式如下:
64、
65、其中i(·)為指示函數,若其中條件為真則值為1,否則為0,得到{p1,p2,...,pl},選擇期望值大于預設閾值λ2的時刻作為高風險時刻點{t1,...,tl},即有l(wèi)個高風險時刻。
66、優(yōu)選的,所述風險檢測模塊包括:數據標注單元、風險量化單元和不安全概率計算單元;
67、所述數據標注單元用于利用固定長度的多參數飛行序列表征不安全事件航段中的風險時段,通過固定窗長的滑動窗口重新劃分多參數飛行序列,基于量化風險得分完成對窗口數據的標注;
68、所述風險量化單元用于采用知識蒸餾方法,將風險識別網絡ⅰ的能力繼承至用于在線風險監(jiān)測的風險識別網絡ⅱ上,利用窗口化飛行參數序列作為風險識別網絡ⅱ的訓練數據,同時通過硬標簽損失確保模型識別不安全事件的能力,通過軟標簽損失確保模型準確量化當前的風險;
69、所述不安全概率計算單元用于以長度w的滑動窗口連續(xù)截取實時數據流并輸入風險識別網絡ii,輸出當前滑窗內誘發(fā)不安全事件的概率;
70、其中,所述數據標注單元中,利用固定長度的多參數飛行序列表征不安全事件航段中的風險時段,通過固定窗長的滑動窗口重新劃分多參數飛行序列,基于量化風險得分完成對窗口數據的標注的過程包括:
71、采用固定窗長為的w滑動窗切割多參數飛行序列,并基于不安全事件量化風險得分閾值λ3對窗口內的數據進行標注,當窗口內參數序列任一時刻的量化風險值超過λ3時,即max([yi,yi+1,...,yi+w])>λ3,將該序列數據[xi,j,...,xi+w,j]標注為風險序列,其中yi代表窗口起點處的量化風險值,yi+w代表窗口終點處的量化風險值;當窗口內數據量化風險值均未超過閾值,即max([yi,yi+1,...,yi+w])≤λ3,則將該序列標注為正常序列;
72、所述風險量化單元中,采用知識蒸餾方法,將風險識別網絡ⅰ的能力繼承至用于在線風險監(jiān)測的風險識別網絡ⅱ上,利用窗口化飛行參數序列作為風險識別網絡ⅱ的訓練數據,同時通過硬標簽損失確保模型識別不安全事件的能力,通過軟標簽損失確保模型準確量化當前的風險的過程包括:
73、損失函數為:
74、
75、其中,損失函數lkd分為硬標簽損失lhard和軟標簽損失lsoft,硬標簽損失lhard中為學生模型預測的風險標簽,y′=i([y1,...,y1+w]>λ3)為教師模型輸出的高風險時刻標簽,軟標簽損失lsoft中為教師模型輸出的第i段數據溫度修正后的logit值,為學生模型輸出的第i段數據溫度修正后的logit值。
76、與現有技術相比,本發(fā)明的有益效果為:
77、(1)傳統(tǒng)的數據驅動不安全事件檢測模型需要大量的正常和不安全事件數據進行模型訓練。嚴重不安全事件如發(fā)動機停車、失速等在日常運行中極少發(fā)生,無法支持傳統(tǒng)數據驅動模型的訓練數據要求。本發(fā)明提出一種小概率不安全事件誘因分析和在線監(jiān)測方法,具備處理小樣本數據的能力和較好的泛化性能。
78、(2)傳統(tǒng)的不安全事件檢測方法需要飛行安全專家分析不安全事件中存在的風險。這種方法難以獲得對風險的定量描述。本發(fā)明提出一種飛機不安全事件量化風險識別方法,采用是否發(fā)生不安全事件的粗標簽作為輸入,獲得航段中可能誘發(fā)此類不安全事件的量化風險值,并結合統(tǒng)計方法進一步對高風險時刻進行誘因分析。
79、(3)傳統(tǒng)的在線檢測方法在識別到不安全事件時,不安全事件已經發(fā)生,且在線計算資源有限,無法直接應用高性能的深度模型。本發(fā)明采用高性能深度模型獲取不安全事件發(fā)生前的風險參數序列,并將該模型識別不安全事件風險的能力傳遞給小規(guī)模網絡,能適用于有限計算資源場景,在不安全事件發(fā)生前給出風險標簽。