本發(fā)明涉及數(shù)據(jù)處理,特別涉及一種基于機器學習的氣象實況預測方法及相關(guān)設(shè)備。
背景技術(shù):
1、為了更好地對高海拔路段進行氣象服務(wù),需要獲得沿線各個區(qū)域的氣象要素信息。目前高海拔路段地面氣象觀測站點相對較少,無法滿足服務(wù)需求。era5再分析數(shù)據(jù)具有覆蓋范圍廣,可獲取時間較長的特點,因此可以幫助解決上述問題。
2、但是era5再分析數(shù)據(jù)的空間分辨率較低,無法體現(xiàn)高原高海拔路段不同環(huán)境背景下各個站點的精細的氣象要素變化。此外,再分析數(shù)據(jù)跟實況數(shù)據(jù)之間仍然存在一定的偏差。
3、需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實現(xiàn)思路
1、本技術(shù)的目的在于提供一種基于機器學習的氣象實況預測方法及相關(guān)設(shè)備,至少在一定程度上克服現(xiàn)有技術(shù)存在的問題,根據(jù)不同的海拔高度對某個區(qū)域內(nèi)的站點進行分組,構(gòu)建不同海拔高度下的站點與era5數(shù)據(jù)的映射關(guān)系,將目標站點所處區(qū)域的era5數(shù)據(jù)輸入到氣象預測模型當中,從而獲得目標站點的實況數(shù)據(jù)。
2、本技術(shù)的其他特性和優(yōu)點將通過下面的詳細描述變得顯然,或部分地通過本發(fā)明的實踐而習得。
3、根據(jù)本技術(shù)的一個方面,提供一種基于機器學習的氣象實況預測方法,包括:獲取目標區(qū)域信息、與目標區(qū)域信息相匹配的目標事件集和訓練樣本集,其中,所述目標區(qū)域信息包括目標站點所處范圍的全球氣象數(shù)據(jù)集,所述訓練樣本集包括目標區(qū)域的全球氣象數(shù)據(jù)集和位于目標區(qū)域內(nèi)待預測站點的歷史氣象信息;對所述訓練樣本集進行預處理,生成帶有目標特征數(shù)據(jù)的訓練樣本集,其中,所述目標特征數(shù)據(jù)用于表征影響天氣現(xiàn)象變化的風險因素;獲取預設(shè)氣象預測模型,其中所述預設(shè)氣象預測模型為基于目標區(qū)域的歷史氣象信息所生成的;基于所述帶有目標特征數(shù)據(jù)的訓練樣本集對所述預設(shè)氣象預測模型進行處理,生成目標氣象預測模型;對目標事件集進行處理,生成目標區(qū)域的氣象預警信息;基于所述目標氣象預測模型對所述目標區(qū)域信息進行處理,生成目標區(qū)域的屬性信息,其中,所述目標區(qū)域的屬性信息包括目標站點所處的分組信息;基于所述目標氣象預測模型對所述目標區(qū)域的屬性信息和目標區(qū)域的氣象預警信息進行處理,生成目標站點的氣象實況信息。
4、在本技術(shù)的一個實施例中,對所述訓練樣本集進行預處理,生成帶有目標特征數(shù)據(jù)的訓練樣本集,包括:獲取預設(shè)映射表,其中,所述預設(shè)映射表用于表征目標區(qū)域的全球氣象數(shù)據(jù)集和位于目標區(qū)域內(nèi)待預測站點的歷史氣象信息二者的對應(yīng)信息;基于所述預設(shè)映射表對所述訓練樣本集進行分組處理,生成分組后的訓練樣本集,其中,所述分組后的訓練樣本集包括不同海拔高度的待預測站點;對分組后的訓練樣本集進行特征提取,確定原始特征庫;根據(jù)所述原始特征庫劃分各個特征數(shù)據(jù)集,生成訓練集和驗證集;利用分類器對原始特征庫劃分各個驗證集進行預測,確定預測結(jié)果;使用預設(shè)算法在原始特征庫劃分各個訓練集進行訓練,得到驗證集類預測結(jié)果;根據(jù)預測結(jié)果以及驗證集類預測結(jié)果,生成目標特征數(shù)據(jù),所述目標特征數(shù)據(jù)用于表征影響天氣現(xiàn)象變化的風險因素。
5、在本技術(shù)的一個實施例中,對目標事件集進行處理,生成目標區(qū)域的氣象預警信息,包括:對所述目標事件集進行處理,生成目標事件的類型信息;對所述目標事件的類型信息進行處理,生成目標區(qū)域的歷史氣象信息;對所述目標區(qū)域的歷史氣象信息進行處理,生成氣象影響因子和氣象影響因子對應(yīng)的權(quán)重信息;基于預設(shè)氣象影響特征集對所述氣象影響因子和所述氣象影響因子對應(yīng)的權(quán)重信息進行處理,生成目標特征數(shù)據(jù),其中,所述風險影響因子用于表征對目標區(qū)域的氣象信息具有較大影響的氣象因素;對所述目標特征數(shù)據(jù)進行處理,生成目標區(qū)域的氣象預警信息。
6、在本技術(shù)的一個實施例中,基于所述目標氣象預測模型對所述目標區(qū)域信息進行處理,生成目標區(qū)域的屬性信息,包括:基于所述目標氣象預測模型對所述目標區(qū)域信息進行處理,生成站點信息,其中,所述站點信息為位于目標區(qū)域內(nèi)的站點;對所述站點信息進行分組處理,生成若干分組信息,其中,分組信息包括不同海拔高度的站點信息;對分組信息進行特征提取處理,生成不同分組的特征數(shù)據(jù)集;對不同分組的特征數(shù)據(jù)集進行處理,獲取異常氣象特征和相關(guān)性共現(xiàn)頻率;對所述異常氣象特征和所述相關(guān)性共現(xiàn)頻率進行處理,生成相關(guān)性信息,其中,相關(guān)性信息用于表征不同海拔高度下的氣象特征與目標站點氣象實況的關(guān)聯(lián)性;基于所述相關(guān)性信息對不同分組的特征數(shù)據(jù)集進行處理,生成不同分組所對應(yīng)站點信息的屬性信息。
7、在本技術(shù)的一個實施例中,對所述目標用戶信息進行處理,生成目標用戶的屬性信息,還包括:所述方法包括用于計算相關(guān)性共現(xiàn)頻率的計算公式,所述計算公式為:
8、
9、其中,xi和yi是兩個變量的觀測值,和是它們的平均值,n是觀測次數(shù)。
10、在本技術(shù)的一個實施例中,基于所述目標氣象預測模型對所述目標區(qū)域的屬性信息和目標區(qū)域的氣象預警信息進行處理,生成目標站點的氣象實況信息,包括:基于所述目標氣象預測模型對所述目標區(qū)域的屬性信息進行處理,生成目標站點的屬性信息,其中,所述目標站點的屬性信息包括目標站點的分組信息;基于所述目標氣象預測模型對所述目標站點的屬性信息進行處理,生成目標站點的第一氣象預測值;基于所述目標氣象預測模型對所述目標區(qū)域的氣象預警信息進行處理,生成目標站點的第二氣象預測值;對所述目標站點的第一氣象預測值和所述目標站點的第二氣象預測值進行處理,生成目標站點的氣象預測值;基于預設(shè)氣象預測規(guī)則對所述目標站點的氣象預測值進行處理,生成目標站點的氣象實況信息。
11、在本技術(shù)的一個實施例中,基于所述目標氣象預測模型對所述目標區(qū)域的屬性信息和目標區(qū)域的氣象預警信息進行處理,生成目標站點的氣象實況信息,還包括:
12、所述目標氣象預測模型包括獲取第一氣象預測值的計算公式,所述計算公式為:
13、p1=β0+β1h+β2tavg+β3phist+∈;
14、其中,p1為第一氣象預測值,h是站點的海拔高度,tavg是站點的平均溫度,phist是站點的歷史降水量,β0、β1、β2、β3是模型參數(shù),∈是誤差項;
15、所述目標氣象預測模型包括獲取第二氣象預測值的計算公式,所述計算公式為:
16、p2=β0+β1pcurrent+β2hpressure+β3hhumidity+β4wspeed+
17、β5phistory+∈;
18、其中,p2為第二氣象預測值,pcurrent是當前的降水量,hpressure是當前的大氣壓強,hhumidity是當前的相對濕度,wspeed是當前的風速,phistory是過去一段時間內(nèi)的平均降水量,β0、β1、β2、β3、β4、β5是模型參數(shù),∈是誤差項;
19、所述目標氣象預測模型包括獲取氣象實況的計算公式,所述計算公式為:
20、pactual=ω1*p1+ω2*p2;
21、其中,ω1和ω1為氣象預測準確率權(quán)重。
22、本技術(shù)的另一個方面,一種基于機器學習的氣象實況預測裝置,其特征在于,包括:獲取模塊,用于獲取目標區(qū)域信息、與目標區(qū)域信息相匹配的目標事件集和訓練樣本集,其中,所述目標區(qū)域信息包括目標站點所處范圍的全球氣象數(shù)據(jù)集,所述訓練樣本集包括目標區(qū)域的全球氣象數(shù)據(jù)集和位于目標區(qū)域內(nèi)待預測站點的歷史氣象信息;獲取預設(shè)氣象預測模型,其中所述預設(shè)氣象預測模型為基于目標區(qū)域的歷史氣象信息所生成的;處理模塊,用于對所述訓練樣本集進行預處理,生成帶有目標特征數(shù)據(jù)的訓練樣本集,其中,所述目標特征數(shù)據(jù)用于表征影響天氣現(xiàn)象變化的風險因素;基于所述帶有目標特征數(shù)據(jù)的訓練樣本集對所述預設(shè)氣象預測模型進行處理,生成目標氣象預測模型;對目標事件集進行處理,生成目標區(qū)域的氣象預警信息;基于所述目標氣象預測模型對所述目標區(qū)域信息進行處理,生成目標區(qū)域的屬性信息,其中,所述目標區(qū)域的屬性信息包括目標站點所處的分組信息;基于所述目標氣象預測模型對所述目標區(qū)域的屬性信息和目標區(qū)域的氣象預警信息進行處理,生成目標站點的氣象實況信息。
23、根據(jù)本技術(shù)的再一個方面,一種電子設(shè)備,其特征在于,包括:第一處理器;以及存儲器,用于存儲所述第一處理器的可執(zhí)行指令;其中,所述第一處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來執(zhí)行實現(xiàn)上述的基于機器學習的氣象實況預測方法。
24、根據(jù)本技術(shù)的又一個方面,提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被第二處理器執(zhí)行時實現(xiàn)上述的基于機器學習的氣象實況預測方法。
25、根據(jù)本技術(shù)的又一個方面,提供一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被第三處理器執(zhí)行時實現(xiàn)上述的基于機器學習的氣象實況預測方法。
26、本技術(shù)所提供的一種基于機器學習的氣象實況預測方法及相關(guān)設(shè)備,由服務(wù)器通過整合全球氣象數(shù)據(jù)集和站點歷史氣象信息,進行預處理和特征提取,構(gòu)建訓練和驗證數(shù)據(jù)集。利用機器學習模型對數(shù)據(jù)進行訓練和預測,結(jié)合地理信息和歷史氣候數(shù)據(jù),生成目標站點的氣象預測值。
27、應(yīng)當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。