本發(fā)明屬于深度學(xué)習(xí),具體涉及一種基于abst-net時空預(yù)測模型的干旱災(zāi)害預(yù)測的方法。
背景技術(shù):
1、干旱災(zāi)害是世界各國面臨的共同挑戰(zhàn)。干旱災(zāi)害具有時間跨度長、變化趨勢慢的特點(diǎn),因此對其進(jìn)行精細(xì)化長期監(jiān)測與準(zhǔn)確未來預(yù)測存在相當(dāng)大的困難,對于大范圍的干旱災(zāi)害預(yù)測則更加困難,不僅需要在時間上預(yù)測干旱災(zāi)害的發(fā)展趨勢,而且需要在空間上預(yù)測干旱災(zāi)害的空間分布特征。土壤水分能夠反映干旱災(zāi)害的嚴(yán)重程度,而地表溫度、降雨量等氣象數(shù)據(jù)是導(dǎo)致干旱災(zāi)害發(fā)生的主要因素,因此對干旱區(qū)域的土壤水分與氣象數(shù)據(jù)進(jìn)行預(yù)測,能夠有效地反映干旱災(zāi)害的發(fā)展趨勢。
2、現(xiàn)有技術(shù)大多利用時空預(yù)測模型進(jìn)行干旱災(zāi)害預(yù)測。時空預(yù)測模型是一種用于預(yù)測具有時空特征數(shù)據(jù)的模型,該模型能夠理解和分析數(shù)據(jù)在時間維度和空間維度上的復(fù)雜關(guān)系。時空預(yù)測模型廣泛應(yīng)用于各種領(lǐng)域,如氣象學(xué)、環(huán)境科學(xué)、交通流量管理、公共安全、經(jīng)濟(jì)預(yù)測等,旨在通過分析過去和當(dāng)前的時空數(shù)據(jù)來預(yù)測未來的事件或狀態(tài)?;谏疃葘W(xué)習(xí)的時空預(yù)測模型是指利用深度學(xué)習(xí)方法,通過學(xué)習(xí)歷史數(shù)據(jù)的空間和時間依賴性來預(yù)測未來的狀態(tài),是近年來比較熱門的一個研究領(lǐng)域。
3、近年來的主要時空預(yù)測方法分為4類,分別為rnn-rnn-rnn、cnn-rnn-cnn、cnn-vit-cnn以及cnn-cnn-cnn。其中,cnn-cnn-cnn因其結(jié)構(gòu)易于優(yōu)化、模型設(shè)計(jì)較為靈活、且可以一次性的方式進(jìn)行預(yù)測等優(yōu)勢受到了廣泛的關(guān)注。liu等結(jié)合了卷積gru模型和3d卷積神經(jīng)網(wǎng)絡(luò)的空間-時間神經(jīng)網(wǎng)絡(luò)(stnn),采用變分貝葉斯方法來進(jìn)行風(fēng)速的概率性預(yù)測,展示了該模型在時間和空間層面能夠進(jìn)行有效預(yù)測的能力,但該模型將卷積gru和3d卷積神經(jīng)網(wǎng)絡(luò)結(jié)合在一起,增加了模型的復(fù)雜性,且3d卷積神經(jīng)網(wǎng)絡(luò)計(jì)算量較大,在處理長時間序列和大規(guī)??臻g數(shù)據(jù)時,訓(xùn)練和推理的計(jì)算成本較高。dvf模型通過cnn自編碼器學(xué)習(xí)體素流(voxel?flow),通過從附近的視頻幀借用體素來重建未來幀,但這可能會導(dǎo)致誤差在多個時間步長中累積,特別是在長時間預(yù)測中效果下降。gao等提出了一種名為simvp的簡單時空預(yù)測模型,該模型完全基于卷積網(wǎng)絡(luò)構(gòu)建,不使用遞歸架構(gòu),且無需引入任何額外的技巧和策略,就能在各種基準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)卓越的性能,雖然卷積網(wǎng)絡(luò)擅長捕捉局部特征,但在處理長時間依賴和全局特征時會出現(xiàn)表現(xiàn)不佳的情況。st-resnet模型通過多個殘差網(wǎng)絡(luò)(residual?networks)的堆疊來捕捉城市范圍內(nèi)的人群流動情況。模型使用了cnn來提取空間特征,并利用多層結(jié)構(gòu)捕捉時間上的依賴關(guān)系,但模型的性能過于依賴輸入數(shù)據(jù)的質(zhì)量和空間分辨率,低質(zhì)量的數(shù)據(jù)可能導(dǎo)致不準(zhǔn)確的預(yù)測。
4、綜上所述,如何在cnn-cnn-cnn時空預(yù)測模型的基礎(chǔ)上進(jìn)行優(yōu)化,使其能夠用于干旱災(zāi)害的預(yù)測,就成為了研究關(guān)鍵點(diǎn)。
技術(shù)實(shí)現(xiàn)思路
1、針對背景技術(shù)所存在的問題,本發(fā)明的目的在于提供一種基于abst-net時空預(yù)測模型的干旱災(zāi)害預(yù)測的方法。該方法設(shè)計(jì)了一種用于加強(qiáng)模型時空特征提取能力的模塊,根據(jù)時空預(yù)測的特點(diǎn),該模塊利用時間注意力、通道注意力與空間注意力機(jī)制分別從時間、通道、空間三種不同的維度上提取時空特征,采用多維度的注意力機(jī)制能夠更全面和精準(zhǔn)地捕捉時空特征,增強(qiáng)特征提取的準(zhǔn)確性;同時,基于該模塊設(shè)計(jì)了一種適用于時空預(yù)測的深度學(xué)習(xí)模型attention-based?spatio-temporal?prediction?network(abst-net),從而使該模型對干旱災(zāi)害的時空預(yù)測更加準(zhǔn)確。
2、為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
3、一種基于abst-net時空預(yù)測模型的干旱災(zāi)害預(yù)測的方法,包括以下步驟:
4、步驟1.基于遙感衛(wèi)星獲取某一地區(qū)在某一時間段內(nèi)的氣象數(shù)據(jù)和土壤水分?jǐn)?shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理:
5、步驟1.1.基于相關(guān)系數(shù)計(jì)算公式,計(jì)算氣象數(shù)據(jù)的各變量在該段時間內(nèi)與土壤水分的相關(guān)系數(shù)的平均值,將平均值從大到小排列,選擇前5個平均值對應(yīng)的氣象數(shù)據(jù)變量,即所選擇的氣象數(shù)據(jù)變量對土壤水分敏感性較高;
6、步驟1.2.將步驟1.1選取的5個氣象數(shù)據(jù)變量與土壤水分?jǐn)?shù)據(jù)進(jìn)行波段合并,得到多波段影像;
7、步驟2.進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,具體過程為:
8、對步驟1得到的多波段影像轉(zhuǎn)化為格式數(shù)據(jù),剔除格式數(shù)據(jù)中的經(jīng)緯度信息,只保留像素值信息,并將其按照時間順序,構(gòu)建維度為(t,c,h,w)的時空數(shù)據(jù)x,其中,t為時間維度,即當(dāng)前數(shù)據(jù)所屬的時刻;c為通道維度,即當(dāng)前數(shù)據(jù)是哪一種屬性,屬性在本數(shù)據(jù)中為土壤水分或某類氣象數(shù)據(jù)變量;h代表數(shù)據(jù)的高度,w代表數(shù)據(jù)的寬度,均由數(shù)據(jù)的空間分辨率決定,表明當(dāng)前數(shù)據(jù)所在的空間位置;
9、步驟3.構(gòu)建基于注意力的時空預(yù)測網(wǎng)絡(luò)的模型(attention-based?spatio-temporal?predict?ion?network,abst-net),所述基于注意力的時空預(yù)測網(wǎng)絡(luò)的模型包括編碼器、時空注意力模塊和解碼器;
10、所述編碼器用于將高維時空數(shù)據(jù)x轉(zhuǎn)化為語義信息更豐富的低維隱藏特征;所述時空注意力模塊將低維隱藏特征作為輸入,使用多種注意力機(jī)制,從時間、通道、空間三種不同的維度上提取時空特征;所述解碼器用于將不同維度提取到的時空特征映射回高維空間,從而得到預(yù)測結(jié)果;
11、步驟4.將步驟2得到的時空數(shù)據(jù)x劃分為訓(xùn)練集和測試集,以訓(xùn)練集中的數(shù)據(jù)為輸入,以測試集中的數(shù)據(jù)為標(biāo)簽,對所述注意力的時空預(yù)測網(wǎng)絡(luò)的模型進(jìn)行訓(xùn)練;
12、步驟5.采用訓(xùn)練好的時空預(yù)測網(wǎng)絡(luò)的模型進(jìn)行干旱災(zāi)害預(yù)測。
13、進(jìn)一步地,步驟1中所述氣象數(shù)據(jù)變量包括某一高度的空氣溫度、總降水量、地面氣壓、風(fēng)速u分量以及風(fēng)速v分量。
14、進(jìn)一步地,步驟1中,相關(guān)系數(shù)的計(jì)算公式如下:
15、
16、其中,ρp,q是變量p和q之間的相關(guān)系數(shù),cov(p,q)是p和q的協(xié)方差,σp和σq分別是p和q的標(biāo)準(zhǔn)差。
17、進(jìn)一步地,步驟2中,數(shù)據(jù)的高度和數(shù)據(jù)的寬度均由數(shù)據(jù)的空間分辨率決定,表明當(dāng)前數(shù)據(jù)所在的空間位置。
18、進(jìn)一步地,步驟3中,所述編碼器包括3個2d卷積層、1個可變形卷積層、標(biāo)準(zhǔn)化歸一化層和silu激活函數(shù)層;其中,第一2d卷積層、第二2d卷積層、第三2d卷積層和可變形卷積層級聯(lián),第一2d卷積層的輸出同時作為第二2d卷積層和第一標(biāo)準(zhǔn)化歸一化層的輸入,第二2d卷積層的輸出同時作為第三2d卷積層和第一標(biāo)準(zhǔn)化歸一化層的輸入,第三2d卷積層的輸出作為第一標(biāo)準(zhǔn)化歸一化層的輸入,第一標(biāo)準(zhǔn)化歸一化層的輸出作為第一silu激活函數(shù)層的輸入,第一silu激活函數(shù)層輸出特征圖;
19、所述可變形卷積層(deformable?convolution?networks,dcns)為偏移量加入到標(biāo)準(zhǔn)卷積中的網(wǎng)格采樣位置所得到;
20、所述第一silu激活函數(shù)的公式為:
21、
22、進(jìn)一步地,對于輸入特征圖x的某一個位置p0,使用3×3大小的卷積核,采樣的范圍為r∈{(-1,-1),(-1,0),...,(0,1),(1,1)},其中(-1,-1)代表p0位置的左下角,(1,1)代表p0位置的右上角,則該位置可變形卷積的輸出如式(3)所示。
23、
24、其中,pn為輸入特征圖第n個位置的偏移,r為調(diào)節(jié)參數(shù),δpn是某一個位置的偏移量;w(pn)表示該位置的卷積權(quán)重系數(shù),表示此位置在特征圖上的重要性,該系數(shù)將通過訓(xùn)練過程中的反向傳播進(jìn)行更新;δmk是調(diào)節(jié)參數(shù),取值為[0,1],用來區(qū)分當(dāng)前區(qū)域是否為感興趣的區(qū)域,若為感興趣區(qū)域,則置為1,否則置為0。
25、進(jìn)一步地,步驟3中,所述時空注意力模塊包括時間注意力單元、通道注意力單元和空間注意力單元;
26、所述時間注意力單元包括可變形卷積層與深度可分離卷積層,所述深度可分離卷積層由深度卷積(depthwise?convolution,dw?conv)和逐點(diǎn)卷積組成;深度可分離卷積層在每個時間通道上應(yīng)用一個獨(dú)立的卷積核,從而實(shí)現(xiàn)通道間的獨(dú)立卷積,捕捉時序數(shù)據(jù)中的局部時空模式,有助于模型學(xué)習(xí)輸入數(shù)據(jù)中的時序相關(guān)性;逐點(diǎn)卷積使用1×1的卷積核,對深度卷積的輸出進(jìn)行線性組合,調(diào)整特征圖的深度和維度,得到深度可分離卷積的輸出;
27、時間注意力ta的公式如式(4)所示,
28、ta=conv1×1(dw?conv(dcns(x)))???????????????????????(4)
29、所述通道注意力單元包括全局平均池化、全局最大池化層、多層感知機(jī)(multilayer?per?ceptron,mlp)和sigmoid函數(shù)層;從編碼器中輸出的特征圖分別輸入全局平均池化層和全局最大池化層來捕獲輸入特征圖的通道級信息;共享權(quán)重的多層感知機(jī)基于全局平均池化和全局最大池化層的輸出結(jié)果計(jì)算通道間的復(fù)雜非線性依賴,然后將輸出結(jié)果相加,以實(shí)現(xiàn)特征信息融合,并將融合結(jié)果輸入至sigmoid函數(shù)層,sigmoid函數(shù)層激活生成通道注意力圖;
30、通道注意力ca的計(jì)算公式如式(5)所示。
31、ca=σ(mlp(avgpool(x))+mlp(maxpool(x)))?????????????????(5)
32、其中,avgpool與maxpool分別表示平均池化和最大池化,mlp表示共享全連接層(共享權(quán)重的多層感知機(jī)),σ表示sigmoid激活函數(shù);
33、所述空間注意力單元包括依次級聯(lián)的flatten扁平層、transpose轉(zhuǎn)置層、第二標(biāo)準(zhǔn)化歸一化層(norm)和transformer編碼層(transformer?encoder)層組成;所述transformer編碼層由多頭自注意力機(jī)制(multi-head?self-attention,msa)、前饋神經(jīng)網(wǎng)絡(luò)(feed-forward?neural?network,ffnn)、多層感知機(jī)頭(mlp?head)組成;
34、flatten扁平層用于將輸入數(shù)據(jù)按照寬度與高度展平,數(shù)據(jù)維度從(b,t,c,h,w)變?yōu)?b,t,c,h×w),transpose轉(zhuǎn)置層將展平后的空間維度(h×w)與通道維度c交換,數(shù)據(jù)維度變?yōu)?b,t,h×w,c);norm層用于實(shí)現(xiàn)對圖像的分塊(patches),同時patches按序列排列,每個空間位置上仍然保留多個通道信息,以便每個空間位置都可以獨(dú)立地進(jìn)行自注意力計(jì)算;msa用于編碼器學(xué)習(xí)patches之間的空間位置,從而捕獲遠(yuǎn)距離的特征關(guān)聯(lián);ffnn將輸入數(shù)據(jù)通過一系列非線性變換映射到輸出空間,從而實(shí)現(xiàn)對輸入數(shù)據(jù)的復(fù)雜模式識別和特征提取,用于自注意力機(jī)制后進(jìn)一步處理每個位置的特征表示,而空間注意力作為神經(jīng)網(wǎng)絡(luò)模型的輸出層,將模型從中間表示空間映射到輸出空間,因此將mlp作為分類頭來得到最終的輸出;
35、時間注意力圖與原始輸入相乘,實(shí)現(xiàn)對特征通道的自適應(yīng)加權(quán),增強(qiáng)了模型對幀間動態(tài)信息的捕獲能力;時間注意力、通道注意力與空間注意力的輸出結(jié)果融合作為時空注意力模塊的輸出,以融合不同層次的特征;
36、融合公式如式(6)所示。
37、y=(ta(x)⊙?ca(x))⊙x+sa(x)?????????????????????????(6)
38、其中sa表示空間注意力,⊙表示hadamard積,y為最終的輸出特征圖。
39、進(jìn)一步地,基于abst-net時空預(yù)測模型的損失函數(shù)使用經(jīng)過空間歸一化的均方誤差ms?e;經(jīng)過空間歸一化的mse在計(jì)算誤差的過程中考慮了空間尺度,以減少圖像中的空間尺度變化對模型訓(xùn)練的影響;經(jīng)過空間歸一化的mse的計(jì)算公式如式(7)所示,
40、
41、其中,pred是預(yù)測值,true是真值,channel、height、width分別是時空數(shù)據(jù)x的通道數(shù)、高度以及寬度。
42、進(jìn)一步地,所述解碼器與編碼器的結(jié)構(gòu)類似,僅僅是在第一標(biāo)準(zhǔn)歸一化層之前增加像素重排層,所述像素重排層用于對每一層的卷積運(yùn)算結(jié)果進(jìn)行行像素重排(pixelshuffle),實(shí)現(xiàn)隱藏特征的上采樣,逐步重建模型輸出。
43、進(jìn)一步地,步驟4訓(xùn)練時,初始學(xué)習(xí)率(lr)可設(shè)置為0.001到0.1之間,學(xué)習(xí)率的衰減因子(lr_k_decay)設(shè)置為0.1到1.0之間,預(yù)熱階段(warm-up?stage)的學(xué)習(xí)率(warmup_lr)設(shè)置為初始學(xué)習(xí)率的1/10或者1/100,學(xué)習(xí)率調(diào)度策略使用余弦退火學(xué)習(xí)率調(diào)度器。
44、綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
45、1、本發(fā)明提出了一種適用于時空預(yù)測的深度學(xué)習(xí)模型attention-based?spatio-temporal?prediction?network(abst-net),其中attention-based是指模型中使用了時間注意力、通道注意力與空間注意力三種注意力機(jī)制來增強(qiáng)模型對數(shù)據(jù)中不同時空特征的提取能力;同時,spatio-temporal?attention?module的時間注意力使用可變形卷積與深度可分離卷積(depthwise?separable?convolutions)實(shí)現(xiàn),使得模型能夠更好地捕捉到時間特征和通道特征之間的關(guān)系以及特征圖中的細(xì)節(jié)信息。
46、2、本發(fā)明選定內(nèi)蒙古自治區(qū)作為研究區(qū)域,基于內(nèi)蒙古自治區(qū)長時序、高空間分辨率、高精度的土壤水分?jǐn)?shù)據(jù)和利用gee(google?earth?engine)將同一時間的era?5氣象數(shù)據(jù),通過分別開展單變量(土壤水分)預(yù)測與多變量(土壤水分+5個氣象變量)預(yù)測實(shí)驗(yàn),并選取同類的時空預(yù)測模型(如convlstm、simvp、predrnn等)進(jìn)行對比,對比實(shí)驗(yàn)的結(jié)果也證明本發(fā)明提出的abst-net時空預(yù)測模型在時空預(yù)測任務(wù)中的性能優(yōu)秀,能夠很好地捕捉干旱災(zāi)害的發(fā)展變化趨勢。在干旱災(zāi)害防治領(lǐng)域中,本發(fā)明方法在預(yù)測未來地區(qū)干旱程度、干旱地區(qū)長期監(jiān)測等方面可以為研究者提供更加有力的手段,對后續(xù)的研究發(fā)揮重要作用。