本發(fā)明涉及水徑流量預(yù)測(cè),具體涉及基于vmd-ceedman的多模式日徑流量預(yù)測(cè)方法及系統(tǒng)。
背景技術(shù):
1、徑流量是反映流域水文過(guò)程的重要指標(biāo),對(duì)流域徑流變化趨勢(shì)的模擬與預(yù)測(cè)是水文學(xué)研究領(lǐng)域的一個(gè)重要課題,準(zhǔn)確的徑流量預(yù)報(bào)也是保障流域水安全、防御水旱災(zāi)害和提高水資源綜合開(kāi)發(fā)利用的重要前提;目前關(guān)于徑流量預(yù)測(cè)的方法主要分為機(jī)理類與非機(jī)理類。
2、機(jī)理類預(yù)測(cè)方法往往是基于一些分布式水文模型,如swat模型、dhsvm模型等。這些模型雖然能很好的模擬某些流域水文過(guò)程,但模型構(gòu)建對(duì)流域下墊面和水文數(shù)據(jù)需求較高且參數(shù)設(shè)定過(guò)程復(fù)雜,存在參數(shù)不確定性以及模型普適性較差等問(wèn)題,而且難以適用于基礎(chǔ)資料缺乏的地區(qū)。徑流形成的過(guò)程不是簡(jiǎn)單的物理過(guò)程,也包括化學(xué)、生物過(guò)程,而且受人類活動(dòng)干擾等,機(jī)理類物理模型難以完全考慮這些因素,往往無(wú)法得到很好的預(yù)測(cè)效果。特別是近些年來(lái),各地興建了許多水利工程,導(dǎo)致河道匯流演進(jìn)規(guī)律顯著變化;疊加全球氣候變化對(duì)流域氣象水文特征的顯著改變,從而破壞了傳統(tǒng)流域徑流產(chǎn)匯流模型的連續(xù)性和適應(yīng)性,大大增加了預(yù)測(cè)結(jié)果的不確定性。
3、非機(jī)理類方法將復(fù)雜物理過(guò)程概化為黑箱模型,提高模型遷移能力。但由于水文系統(tǒng)具有非線性、突變性、多噪音等特點(diǎn),基于統(tǒng)計(jì)學(xué)及傳統(tǒng)機(jī)器學(xué)習(xí)的模型預(yù)測(cè)效果往往差強(qiáng)人意。隨著人工神經(jīng)網(wǎng)絡(luò)的發(fā)展、深度學(xué)習(xí)技術(shù)的提高,卷積神經(jīng)網(wǎng)絡(luò)(cnn)、循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)等方法表現(xiàn)出良好的非線性映射能力、強(qiáng)大的特征提取技術(shù)和自學(xué)習(xí)泛化能力,能很好適應(yīng)如徑流量這類復(fù)雜的時(shí)間序列數(shù)據(jù),因此被廣泛應(yīng)用于水文預(yù)報(bào)和環(huán)境監(jiān)測(cè)等問(wèn)題的研究。但cnn模型雖然可以對(duì)每個(gè)時(shí)間序列進(jìn)行卷積運(yùn)算,很好地提取徑流信息中的局部特征,但cnn對(duì)徑流信息的時(shí)間順序不敏感,不能單獨(dú)完成預(yù)測(cè)任務(wù);而普通rnn容易產(chǎn)生梯度膨脹和梯度消失問(wèn)題。
4、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long?and?short-term?memory,lstm)是為緩解rnn網(wǎng)絡(luò)長(zhǎng)期依賴問(wèn)題和梯度消失問(wèn)題而設(shè)計(jì)出來(lái)的一種特殊結(jié)構(gòu)循環(huán)神經(jīng)網(wǎng)絡(luò)。在處理具有較長(zhǎng)時(shí)間步長(zhǎng)及非線性序列數(shù)據(jù)方面優(yōu)勢(shì)明顯,但由于其遞歸性質(zhì),可能在處理局部特征時(shí)有所欠缺。此外,單一lstm網(wǎng)絡(luò)難以捕捉到數(shù)據(jù)的多種復(fù)雜模式,其對(duì)噪聲較為敏感,特別是在輸入數(shù)據(jù)質(zhì)量不佳的情況下,這可能影響其預(yù)測(cè)性能。有研究成果表明由多種神經(jīng)網(wǎng)絡(luò)組合而成的混合網(wǎng)絡(luò)模型有助于提高預(yù)測(cè)精度。
5、綜上所述,現(xiàn)有徑流水文預(yù)報(bào)方法存在以下問(wèn)題:第一,受流域下墊面動(dòng)態(tài)性、氣候變化和人類干擾等因素影響,水文時(shí)間序列非平穩(wěn)性增強(qiáng),傳統(tǒng)的基于機(jī)理類預(yù)測(cè)方法難以解決水文預(yù)報(bào)偏差較大和模型普適性較差等問(wèn)題。第二,人工智能算法與傳統(tǒng)方法相比,有很多優(yōu)點(diǎn),但是不同算法具有不同的特點(diǎn)和適用范圍,單獨(dú)一種算法難以滿足水文預(yù)報(bào)的精度要求。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供基于vmd-ceedman的多模式日徑流量預(yù)測(cè)方法及系統(tǒng),解決以上技術(shù)問(wèn)題。
2、本發(fā)明的目的可以通過(guò)以下技術(shù)方案實(shí)現(xiàn):
3、基于vmd-ceedman的多模式日徑流量預(yù)測(cè)方法,包括以下步驟:
4、步驟s1:采集歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括日徑流量數(shù)據(jù)和水位數(shù)據(jù);對(duì)所述歷史數(shù)據(jù)進(jìn)行預(yù)處理和時(shí)間排序,得到完整的歷史時(shí)間序列數(shù)據(jù);
5、步驟s2:對(duì)所述日徑流量數(shù)據(jù)進(jìn)行vmd分解,得到若干不同頻率的子模態(tài)分量;根據(jù)預(yù)設(shè)的顯著性水平閾值對(duì)所述子模態(tài)分量進(jìn)行平穩(wěn)性判定,將所述子模態(tài)分量劃分為平穩(wěn)子模態(tài)分量和非平穩(wěn)子模態(tài)分量,并將所述平穩(wěn)子模態(tài)分量劃分為中低頻分量和高頻分量;
6、在所述水位數(shù)據(jù)中選取出與所述日徑流量數(shù)據(jù)對(duì)應(yīng)的水位數(shù)據(jù),記為相關(guān)水位數(shù)據(jù);對(duì)所述相關(guān)水位數(shù)據(jù)進(jìn)行ceedman分解,得到若干模態(tài)分量,并將所述模態(tài)分量劃分為趨勢(shì)分量和細(xì)節(jié)分量;
7、步驟s3:獲取所述趨勢(shì)分量、細(xì)節(jié)分量和非平穩(wěn)子模態(tài)分量,均記為非平穩(wěn)分量;利用隨機(jī)森林算法分割出所述非平穩(wěn)分量的全部特征,并獲取各特征的平均重要性得分impave,所述平均重要性得分為不純度減少量的平均值;設(shè)定不純度閾值i,選取出impave<i的特征,記為重點(diǎn)特征;
8、步驟s4:根據(jù)所述重點(diǎn)特征及其對(duì)應(yīng)的歷史數(shù)據(jù),得到非平穩(wěn)輸入序列;根據(jù)所述中低頻分量對(duì)應(yīng)的日徑流量數(shù)據(jù),得到的中低頻輸入序列,并根據(jù)所述高頻分量對(duì)應(yīng)的日徑流量數(shù)據(jù)得到的高頻輸入序列;
9、對(duì)所述非平穩(wěn)輸入序列、中低頻輸入序列和高頻輸入序列分別進(jìn)行歸一化操作,得到非平穩(wěn)輸入矩陣、中低頻輸入矩陣和高頻輸入矩陣;
10、步驟s5:建立自注意力機(jī)制的bigru神經(jīng)網(wǎng)絡(luò),將所述非平穩(wěn)輸入矩陣輸入至bigru神經(jīng)網(wǎng)絡(luò)進(jìn)行多特征預(yù)測(cè);將所述中低頻輸入序列輸入至bilstm神經(jīng)網(wǎng)絡(luò)進(jìn)行單特征預(yù)測(cè),將所述高頻輸入序列輸入至tcn+bilstm混合網(wǎng)絡(luò)進(jìn)行單特征預(yù)測(cè);
11、獲取多特征預(yù)測(cè)和單特征預(yù)測(cè)的預(yù)測(cè)結(jié)果,記為子模態(tài)分量值;將各子模態(tài)分量值進(jìn)行累加后重構(gòu),得到日徑流量預(yù)測(cè)結(jié)果。
12、作為本發(fā)明進(jìn)一步的方案:在步驟s1中,對(duì)所述歷史數(shù)據(jù)進(jìn)行預(yù)處理的過(guò)程包括:
13、獲取所述歷史數(shù)據(jù)中的異常值,并對(duì)所述異常值進(jìn)行置空,得到缺失值,并對(duì)所述缺失值利用線性插值法進(jìn)行填補(bǔ)。
14、作為本發(fā)明進(jìn)一步的方案:在步驟s2中,對(duì)所述子模態(tài)分量進(jìn)行平穩(wěn)性判定的過(guò)程包括:
15、所述顯著性水平閾值ht=0.05;
16、所述平穩(wěn)性判定基于adf檢驗(yàn)法,假設(shè)所述子模態(tài)分量存在單位根,通過(guò)adf檢驗(yàn)獲得子模態(tài)分量的統(tǒng)計(jì)量sta和p值;
17、若子模態(tài)分量的p值≤ht,則在預(yù)設(shè)的顯著性水平閾值下所述子模態(tài)分量不存在單位根,即為平穩(wěn)子模態(tài)分量;若子模態(tài)分量的p值>ht,則在預(yù)設(shè)的顯著性水平閾值下所述子模態(tài)分量存在單位根,即為非平穩(wěn)子模態(tài)分量。
18、作為本發(fā)明進(jìn)一步的方案:在步驟s2中,對(duì)所述平穩(wěn)子模態(tài)分量進(jìn)行劃分的過(guò)程包括:
19、對(duì)所述平穩(wěn)子模態(tài)分量的劃分基于過(guò)零法,將所述平穩(wěn)子模態(tài)分量記為檢測(cè)信號(hào);獲取所述檢測(cè)信號(hào)穿越零點(diǎn)時(shí)的頻率,記為過(guò)零率zcr,所述零點(diǎn)為信號(hào)值從正變?yōu)樨?fù)或從負(fù)變?yōu)檎狞c(diǎn);
20、若檢測(cè)信號(hào)的過(guò)零率zcr>0.2,則該檢測(cè)信號(hào)對(duì)應(yīng)的平穩(wěn)子模態(tài)分量為高頻分量;若檢測(cè)信號(hào)的過(guò)零率zcr≤0.2,則該檢測(cè)信號(hào)對(duì)應(yīng)的平穩(wěn)子模態(tài)分量為中低頻分量。
21、作為本發(fā)明進(jìn)一步的方案:在步驟s2中,所述趨勢(shì)分量和細(xì)節(jié)分量的獲得過(guò)程包括:
22、將所述模態(tài)分量記為新檢測(cè)信號(hào),獲取新檢測(cè)信號(hào)的過(guò)零率zdr,并對(duì)新檢測(cè)信號(hào)的過(guò)零率zdr進(jìn)行判定;若新檢測(cè)信號(hào)為高頻分量,則記為細(xì)節(jié)分量;若新檢測(cè)信號(hào)為中低頻分量,則記為趨勢(shì)分量。
23、作為本發(fā)明進(jìn)一步的方案:在步驟s4中,所述歸一化操作的過(guò)程包括:
24、設(shè)定歸一范圍閾值[-1,1];將所述非平穩(wěn)輸入序列、中低頻輸入序列和高頻輸入序列均記為待歸一矩陣array;則對(duì)所述待歸一矩陣進(jìn)行歸一化操作的過(guò)程為:
25、
26、其中array′為歸一化操作后的值,min(array)為待歸一矩陣中的最小值,max(array)為待歸一矩陣中的最大值。
27、作為本發(fā)明進(jìn)一步的方案:基于vmd-ceedman的多模式日徑流量預(yù)測(cè)系統(tǒng),包括:
28、數(shù)據(jù)收集模塊:采集歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括日徑流量數(shù)據(jù)和水位數(shù)據(jù);對(duì)所述歷史數(shù)據(jù)進(jìn)行預(yù)處理和時(shí)間排序,得到完整的歷史時(shí)間序列數(shù)據(jù);
29、訓(xùn)練數(shù)據(jù)集模塊:對(duì)所述日徑流量數(shù)據(jù)進(jìn)行vmd分解,得到若干不同頻率的子模態(tài)分量;根據(jù)預(yù)設(shè)的顯著性水平閾值對(duì)所述子模態(tài)分量進(jìn)行平穩(wěn)性判定,將所述子模態(tài)分量劃分為平穩(wěn)子模態(tài)分量和非平穩(wěn)子模態(tài)分量,并將所述平穩(wěn)子模態(tài)分量劃分為中低頻分量和高頻分量;
30、在所述水位數(shù)據(jù)中選取出與所述日徑流量數(shù)據(jù)對(duì)應(yīng)的水位數(shù)據(jù),記為相關(guān)水位數(shù)據(jù);對(duì)所述相關(guān)水位數(shù)據(jù)進(jìn)行ceedman分解,得到若干模態(tài)分量,并將所述模態(tài)分量劃分為趨勢(shì)分量和細(xì)節(jié)分量;
31、獲取所述趨勢(shì)分量、細(xì)節(jié)分量和非平穩(wěn)子模態(tài)分量,均記為非平穩(wěn)分量;利用隨機(jī)森林算法分割出所述非平穩(wěn)分量的全部特征,并獲取各特征的平均重要性得分impave,所述平均重要性得分為不純度減少量的平均值;設(shè)定不純度閾值i,選取出impave<i的特征,記為重點(diǎn)特征;
32、根據(jù)所述重點(diǎn)特征及其對(duì)應(yīng)的歷史數(shù)據(jù),得到非平穩(wěn)輸入序列;根據(jù)所述中低頻分量對(duì)應(yīng)的日徑流量數(shù)據(jù),得到的中低頻輸入序列,并根據(jù)所述高頻分量對(duì)應(yīng)的日徑流量數(shù)據(jù)得到的高頻輸入序列;
33、對(duì)所述非平穩(wěn)輸入序列、中低頻輸入序列和高頻輸入序列分別進(jìn)行歸一化操作,得到非平穩(wěn)輸入矩陣、中低頻輸入矩陣和高頻輸入矩陣;
34、模型構(gòu)建模塊:建立自注意力機(jī)制的bigru神經(jīng)網(wǎng)絡(luò),將所述非平穩(wěn)輸入矩陣輸入至bigru神經(jīng)網(wǎng)絡(luò)進(jìn)行多特征預(yù)測(cè);將所述中低頻輸入序列輸入至bilstm神經(jīng)網(wǎng)絡(luò)進(jìn)行單特征預(yù)測(cè),將所述高頻輸入序列輸入至tcn+bilstm混合網(wǎng)絡(luò)進(jìn)行單特征預(yù)測(cè);
35、預(yù)測(cè)模塊:獲取多特征預(yù)測(cè)和單特征預(yù)測(cè)的預(yù)測(cè)結(jié)果,記為子模態(tài)分量值;將各子模態(tài)分量值進(jìn)行累加后重構(gòu),得到日徑流量預(yù)測(cè)結(jié)果。
36、本發(fā)明的有益效果:
37、現(xiàn)有徑流水文預(yù)報(bào)方法存在以下問(wèn)題:第一,受流域下墊面動(dòng)態(tài)性、氣候變化和人類干擾等因素影響,水文時(shí)間序列非平穩(wěn)性增強(qiáng),傳統(tǒng)的基于機(jī)理類預(yù)測(cè)方法難以解決水文預(yù)報(bào)偏差較大和模型普適性較差等問(wèn)題。第二,人工智能算法與傳統(tǒng)方法相比,有很多優(yōu)點(diǎn),但是不同算法具有不同的特點(diǎn)和適用范圍,單獨(dú)一種算法難以滿足水文預(yù)報(bào)的精度要求;針對(duì)上述情況,為克服現(xiàn)有技術(shù)的缺陷,本發(fā)明提供了一種聯(lián)合ceemdan和vmd兩種信號(hào)分解方法進(jìn)行特征提取,進(jìn)而耦合attention+bigru多特征預(yù)測(cè)、bilstm單特征預(yù)測(cè)和tcn+bilstm單特征預(yù)測(cè)算法的組合網(wǎng)絡(luò)模型進(jìn)行徑流量預(yù)測(cè)的方法,具有更高的預(yù)測(cè)準(zhǔn)確率,能夠跟蹤徑流量數(shù)據(jù)的強(qiáng)趨勢(shì)特性與強(qiáng)周期特性。
38、相較于現(xiàn)有技術(shù),本發(fā)明針對(duì)日徑流量具有的周期性和隨機(jī)性的特點(diǎn),首先采用vmd和ceemdan分別對(duì)歷史徑流量、水位數(shù)據(jù)進(jìn)行分解,提取不同頻段的信息,降低原始數(shù)據(jù)序列的復(fù)雜度,發(fā)揮不同分解算法的優(yōu)勢(shì),更完整地突顯波動(dòng)趨勢(shì);然后將分解后的日徑流量數(shù)據(jù)劃分為平穩(wěn)序列和非平穩(wěn)序列,針對(duì)不同的序列采取不同的預(yù)測(cè)模型;最后,將不同子序列的預(yù)測(cè)結(jié)果進(jìn)行重構(gòu),獲得日徑流量預(yù)測(cè)結(jié)果。
39、在仿真分析中發(fā)現(xiàn),lstm由于受深層結(jié)構(gòu)影響,容易出現(xiàn)梯度爆炸和局部最優(yōu)的問(wèn)題。本發(fā)明首先采用基于粒子群算法優(yōu)化的變分模態(tài)分解(pso-vmd)對(duì)徑流量進(jìn)行分解,得到的子信號(hào)更加趨于平穩(wěn),更利于模型進(jìn)行特征提取;然后根據(jù)子模態(tài)分量的平穩(wěn)性、頻率范圍等特性,分別采用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(bilstm)和基于時(shí)間卷積網(wǎng)絡(luò)-長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(tcn-lstm)對(duì)不同子模態(tài)分量進(jìn)行預(yù)測(cè),可以克服單一lstm運(yùn)用時(shí)存在的不足。在運(yùn)算效率方面,由于對(duì)不同信號(hào)采用不同的分解方法、對(duì)不同子模態(tài)采用不同的模型進(jìn)行預(yù)測(cè),有效加快了關(guān)鍵特征的提取,進(jìn)一步提升了模型的運(yùn)算效率。本發(fā)明在預(yù)測(cè)數(shù)值的準(zhǔn)確性、模型的高效性和運(yùn)算效率方面均有明顯的優(yōu)勢(shì),可以為水資源綜合管理和水旱災(zāi)害防御提供更及時(shí)精確的水文信息。