本發(fā)明涉及一種基于注意力機制卷積神經網絡的雷暴大風識別方法和系統(tǒng),屬于天氣雷達數據處理。
背景技術:
1、雷暴大風是由雷暴引發(fā)的強烈風暴現象,常伴隨強降雨、冰雹和閃電,對人類社會、基礎設施和環(huán)境產生重大影響。雷暴大風的形成機制復雜,涉及大氣動力學、熱力學和微物理過程,因此其和識別一直是氣象學研究的難題之一。隨著氣象觀測技術和數值天氣模型的發(fā)展,雷暴大風的能力得到了顯著提高。然而,高分辨率數值模式仍存在諸多局限性,難以準確捕捉雷暴大風的發(fā)生、強度。因此,發(fā)展準確的雷暴大風識別技術具有重要的現實意義。
2、傳統(tǒng)的雷暴大風識別方法主要依賴于數值天氣模式和統(tǒng)計學方法。這些方法已經在氣象中應用多年,積累了豐富的經驗和數據,對于理解和雷暴大風等劇烈天氣現象發(fā)揮了重作用。然而,這些方法也存在一些局限性,尤其是在應對復雜的非線性天氣現象時,不足以充分捕捉雷暴大風等非線性、復雜天氣現象的細節(jié)。
技術實現思路
1、發(fā)明目的:本發(fā)明所要解決的技術問題是針對現有技術的不足,提供一種基于注意力機制卷積神經網絡的雷暴大風識別方法,該方法針對雷暴大風事件空間分布上具有高度的非線性、隨機性和突發(fā)性,能夠有效利用多尺度信息與位置信息,適用于雷暴大風發(fā)生區(qū)域識別,能夠提高雷暴大風識別準確度。
2、為了解決上述技術問題,一方面本發(fā)明公開了一種基于注意力機制卷積神經網絡的雷暴大風識別方法,包括:
3、步驟1、根據歷史天氣雷達單站基數據和雷暴大風事件發(fā)生實測記錄數據生成樣本集,所述樣本集中的一個樣本包括同一時間內待識別區(qū)域的雷達反射率圖、雷達徑向速度圖和雷暴大風真實標簽;將樣本集拆分為訓練集和驗證集;
4、步驟2、采用訓練集對識別模型進行訓練,采用驗證集驗證識別模型的泛化能力,并根據模型性能選擇最優(yōu)模型參數;所述識別模型的輸入為同一時間待識別區(qū)域的雷達反射率圖、雷達徑向速度圖,輸出為待識別區(qū)域的雷暴大風預估標簽;
5、步驟3、根據實時天氣雷達單站獲取的待識別區(qū)域的雷達反射率數據和徑向速度數據生成待識別雷達反射率圖和雷達徑向速度圖,并輸入識別模型,得到待識別區(qū)域的雷暴大風識別結果。
6、所述步驟1中,樣本集的構建步驟如下:
7、s11、對待識別區(qū)域根據經緯度進行網格化,得到二維空間網格圖;
8、s12、獲取二維空間網格圖同一時間對應的雷達反射率圖和雷達徑向速度圖;
9、s13、檢測雷達數據的風暴落區(qū),具體為:
10、對雷達反射率圖進行二值化處理,超過設定閾值的像素值設為255,其余的像素值設為0,創(chuàng)建3×3大小的形態(tài)學核,通過形態(tài)學開運算去除噪聲;
11、將處理后的圖像進行連通區(qū)域標記,過濾掉面積小于設定格點數量的連通區(qū)域,剩余的連通區(qū)域為風暴落區(qū);
12、對于每個風暴落區(qū),獲取輪廓點的經緯度坐標構成風暴落區(qū)多邊形,完成對于雷達數據風暴落區(qū)的檢測;
13、s14、根據雷暴大風事件實測記錄獲取雷暴大風真實標簽:
14、在雷暴大風事件發(fā)生實測記錄中篩選風速大于預設風速閾值的記錄,選擇與篩選出的雷暴大風事件時間差在雷達時間分辨率以內的雷達數據;
15、如果雷暴大風事件的經緯度坐標在篩選出的雷達數據對應的風暴落區(qū)輪廓多邊形內部,則該風暴落區(qū)標記為“有雷暴大風”;不包含雷暴大風事件經緯度點的風暴落區(qū)標記為“無雷暴大風”,其余區(qū)域標記為“其他”;將三類區(qū)域用數值區(qū)分類別,制作雷暴大風標簽。
16、具體地,一個樣本中的雷達反射率圖和雷達徑向速度圖根據一個體掃周期內獲取的雷達數據點構建生成;按經緯度將雷達組合反射率映射到二維空間網格中,得到雷達反射率圖;將有效徑向速度映射到二維空間網格中,得到雷達徑向速度圖;雷達組合反射率為相同經緯度對應的10個高度層中反射率最大值,即經緯度坐標為(lon,lat)處的組合反射率refc(lon,lat)為:
17、refc(lon,lat)=max(refn(lon,lat)),n=0,1,2…,9;??????????????????(1)
18、其中refn(lon,lat)為第n個高度層在經緯度坐標為(lon,lat)處的反射率;
19、有效徑向速度由相同經緯度對應的10個高度層中最低三層的徑向速度構成,經緯度坐標為(lon,lat)處的有效徑向速度dops(lon,lat)為:
20、dops(lon,lat)=(dop0(lon,lat),dop1(lon,lat),dop2(lon,lat))???????(2)
21、其中dopm(lon,lat)為第m個高度層在經緯度坐標為(lon,lat)處的徑向速度,m=0,1,2,即有效徑向速度dops(lon,lat)為一個3維向量;
22、給定經緯度信息,各高度層處的反射率和徑向速度通過插值得到。
23、具體地,各高度層處的反射率和徑向速度采用三線性插值法得到,具體步驟為:
24、a.根據經緯度和高度信息計算二維空間網格圖在各高度層以雷達站為原點的球面坐標系下的坐標;二維空間網格圖中第i個小網格的經緯度坐標為(ilat,ilon),在第n個高度層處的方位角、仰角和到雷達的距離計算如下:
25、將雷達站經緯度從度數轉為弧度數:
26、
27、利用球面三角學公式計算雷達站到目標點的球面距離,目標點的經緯度坐標為(ilat,ilon),高度為hgtn:
28、s=re×arccos(sin(latr))×sin(ilat)+cos(latr)×cos(iχlat)×cos(ilon-lonr)
29、根據目標點和雷達站的相對位置,計算目標點方位角a:
30、
31、a=arcsin(c)
32、對目標點方位角進行數值調整:
33、
34、計算目標點仰角e和距離r:
35、
36、其中l(wèi)onradar、latradar和hgtr分別代表雷達站經度、緯度、高度;re代表地球半徑;rm代表等效地球半徑;∈>0,表示防除零小值。
37、b.獲取目標點的球面坐標索引:
38、azi=az_index(ilat,ilon,hgtn)
39、eli=el_index(ilat,ilon,hgtn)
40、disti=dist_index(ilat,ilon,hgtn)
41、所述球面坐標索引為經緯度和高度與方位角、仰角和到雷達的距離之間的映射;az_index、el_index、dist_index分別表示根據經緯度和高度值獲取方位角索引azi、仰角索引eli和距離索引disti,
42、c.獲取與目標點相鄰的雷達數據點的球面坐標值:
43、e1=el(eli-1)
44、e2=el(eli+1)
45、a1=az(azi-1)
46、a2=az(azi+1)
47、r1=dist(disti-1)
48、r2=dist(dist+1)
49、el、az、dist分別表示根據仰角索引、方位角索引、距離索引獲取仰角、方位角和距離的值;以e1為仰角、a1為方位角、r1為距離的雷達數據點和以e2為仰角、a2為方位角、r2為距離的雷達數據點為目標點的兩個相鄰點;
50、d.根據目標點以及相鄰數據點的方位角、仰角和距離,計算插值權重:
51、
52、e.獲取相鄰數據點的雷達對應變量值:
53、f1=zall(disti,azi,eli)
54、f2=zall(disti+1,azi,eli)
55、f3=zall(disti,azi+1,eli)
56、f4=zall(disti+1,azi+1,eli)
57、f5=zall(disti,azi,eli+1)
58、f6=zall(disti+1,azi,eli+1)
59、f7=zall(disti,azi+1,eli+1)
60、f8=zall(disti+1,azi+1,eli+1)
61、zall()為根據球面坐標索引獲取雷達反射率或徑向速度;
62、使用三線性插值公式計算目標點的雷達對應變量值:
63、ff=we1×(wa1×(wr1×f1+wr2×f2)+wa2×(wr1×f3+wr2×f4))
64、+we2×(wa1×(wr1×f5+wr2×f6)+wa2×(wr1×f7
65、+wr2×f8))
66、所述雷達對應變量,為雷達反射率或徑向速度,根據當前要計算的變量進行選擇。
67、具體地,所述識別模型采用基于注意力機制和卷積神經網絡,包括編碼器100、解碼器200和壓縮激勵模塊300;
68、編碼器100包括三層編碼層和三層下采樣層,第1層編碼層en-conv1的輸入為雷達反射率圖和徑向速度圖拼接得到的組合數據,所述組合數據為雷達反射率圖和雷達徑向速度圖拼接得到的4通道數據;en-conv1的輸出特征圖經過壓縮激勵模塊300獲取第一通道權重s1,第一通道權重s1與進行殘差連接后由第一下采樣層進行下采樣,下采樣后的特征圖與進行殘差連接后輸入第2層編碼層en-conv2進行編碼,en-conv2的輸出特征圖經過壓縮激勵模塊300獲取第二通道權重s2,第二通道權重s2與進行殘差連接后由第二下采樣層進行下采樣,下采樣后的特征圖與進行殘差連接后輸入第3層編碼層en-conv3進行編碼,en-conv3的輸出特征圖經第三下采樣層后輸入解碼器200進行解碼;
69、每一層編碼層對輸入的特征圖進行一次3×3卷積操作,第一下采樣層、第二下采樣層、第三下采樣層均由2×2的最大池化操作實現下采樣;
70、解碼器200包括三層解碼層和三層上采樣層;第3層解碼層de-conv3的輸入為編碼器100的輸出,de-conv3的輸出經過第三上采樣層后輸入第2層解碼層de-conv2,de-conv2的輸出與第三上采樣層的輸出經過殘差連接后輸入第二上采樣層第二上采樣層的輸出輸入第1層解碼層de-conv1,de-conv1的輸出與第二上采樣層的輸出經過第一上采樣層后為雷暴大風預估標簽;
71、每一層解碼層對輸入的特征圖進行一次3×3卷積操作,第一上采樣層、第二上采樣層和第三上采樣層均由2×2的反卷積操作實現上采樣;
72、壓縮激勵模塊300作用在編碼器100每個編碼層之后,對每個通道執(zhí)行全局平均池化,輸出是通道權重,將通道權重通過殘差連接的形式作用在特征圖的每個通道數據上以實現注意力機制的作用;壓縮激勵模塊300包括依次級聯(lián)的全局平均池化層、第一全連接層、relu激活函數、第二全連接層和sigmoid函數組成;其中全局平均池化層對輸入壓縮激勵模塊(300)的特征圖x的處理表達為:
73、
74、其中xij為輸入壓縮激勵模塊300的特征圖x在(i,j)處的元素值,h、w為特征圖x的高和寬,i=1,2,…,h;j=1,2,…,w;z為全局平均池化后的特征圖;
75、z通過第一全連接層、relu激活函數、第二全連接層和sigmoid函數來學習通道間的相關性,表示為:
76、s=σ(w2·relu(w1·z))
77、其中σ表示sigmoid函數,w1和w2分別是第一全連接層和第二全連接層的權重,relu表示relu激活函數;s為輸入特征圖x通道權重,表征通道間相關性;
78、殘差連接采用通道權重對原始輸入進行重新標定:
79、y=x·s
80、由此第一下采樣層的輸入即第一通道權重s1對進行重新標定得到:
81、
82、對進行下采樣后得到特征圖
83、所述訓練集對識別模型進行訓練,訓練的損失函數lhl由多分類交叉熵損失函數和平均絕對誤差損失函數的加權和組成,即為:
84、lhl=αlmcl+lmae
85、其中l(wèi)mcl為多分類交叉熵損失函數;lmae為平均絕對誤差損失函數,α為損失分配系數,其中:
86、
87、其中:n是樣本數量;c是類別數量;yi,c是第i個樣本屬于類別c的真實標簽;pi,c是第i個樣本預測為類別c的概率。
88、
89、其中,yi是第i個樣本的雷暴大風標簽,是識別模型輸出的第i個樣本的雷暴大風預估標簽。
90、另一方面,本發(fā)明還公開了實現上述基于注意力機制卷積神經網絡的雷暴大風識別方法的識別系統(tǒng),包括:
91、樣本集生成模塊1,用于根據歷史天氣雷達單站基數據和雷暴大風事件發(fā)生實測記錄數據生成樣本集,所述樣本集中的一個樣本包括同一時間內待識別區(qū)域的雷達反射率圖、雷達徑向速度圖和雷暴大風真實標簽;將樣本集拆分為訓練集和驗證集;
92、識別模型訓練模塊2,用于采用訓練集對識別模型進行訓練,采用驗證集驗證識別模型的泛化能力,并根據模型性能選擇最優(yōu)模型參數;所述識別模型的輸入為同一時間待識別區(qū)域的雷達反射率圖、雷達徑向速度圖,輸出為待識別區(qū)域的雷暴大風預估標簽;
93、識別結果獲取模塊3,用于根據實時天氣雷達單站獲取的待識別區(qū)域的雷達反射率數據和徑向速度數據生成待識別雷達反射率圖和雷達徑向速度圖,并輸入識別模型,得到待識別區(qū)域的雷暴大風識別結果。
94、另一方面,本發(fā)明還公開了一種計算機可讀取存儲介質,其上存儲有計算機指令,所述計算機指令運行時執(zhí)行上述雷暴大風識別方法。
95、另一方面,本發(fā)明還公開了一種電子設備,包括處理器及存儲介質,所述存儲介質為計算機可讀取存儲介質;所述處理器加載并執(zhí)行所述存儲介質中的指令及數據用于實現上述雷暴大風識別方法。
96、有益效果:與現有技術相比,本發(fā)明提供的基于注意力機制卷積神經網絡的雷暴大風識別和系統(tǒng)考慮了雷暴大風事件與雷達反射率和徑向速度間的映射關系,通過在識別模型中引入卷積塊注意力機制和壓縮激勵機制,融合多尺度信息,通過學習雷達反射率和徑向速度通道間的相關性,篩選有用特征通道,提取豐富有效特征,實現對雷暴大風事件發(fā)生位置的精確識別。此外,本發(fā)明考慮了不同雷暴大風事件在樣本集中分布不均勻的情況,通過聯(lián)合多分類交叉熵損失函數和平均絕對誤差損失函數,實現在訓練過程中模型權重分配,提高模型對雷暴大風發(fā)生事件正樣本的識別能力。