本發(fā)明涉及水文預(yù)報領(lǐng)域,特別是涉及一種融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測方法。
背景技術(shù):
1、獲得準確的徑流預(yù)測結(jié)果以及未來徑流的可能出現(xiàn)范圍,對于水資源管理和利用、水旱災(zāi)害防御、水利工程調(diào)度以及水生態(tài)環(huán)境保護等方面具有重要意義。
2、目前用于徑流預(yù)測的模型主要分為機理模型和數(shù)據(jù)驅(qū)動模型,在采用兩類模型進行徑流預(yù)測時,篩選對于徑流存在影響的特征會直接關(guān)系到徑流的預(yù)測精度,合適的特征選擇可以減少計算、內(nèi)存以及由此產(chǎn)生的各項成本,并提高可解釋性,降低數(shù)據(jù)收集成本,增強模型泛化能力。傳統(tǒng)的特征選擇方法如過濾法、包裝法和嵌入法等,過濾法易選擇不相關(guān)特征,包裝法計算成本高昂,嵌入法將特征選擇集成到學習過程中,因此能夠選擇相關(guān)特征,同時具有成本效益,各種技術(shù)被用來執(zhí)行嵌入式特征選擇,包括互信息、svm分類器和神經(jīng)網(wǎng)絡(luò)。基于神經(jīng)網(wǎng)絡(luò)的特征選擇近年來在監(jiān)督和無監(jiān)督設(shè)置中都引起了極大的關(guān)注。這些方法利用了神經(jīng)網(wǎng)絡(luò)在捕獲非線性依賴關(guān)系和在大型數(shù)據(jù)集上表現(xiàn)良好的優(yōu)勢。但是,許多現(xiàn)有的基于神經(jīng)網(wǎng)絡(luò)的特征選擇方法存在過度參數(shù)化的問題,導致計算成本高昂,特別是對于高維數(shù)據(jù)集。獲取合適的徑流影響特征后,實現(xiàn)快速高效的徑流預(yù)測對于水資源管理意義重大,但傳統(tǒng)的機理模型計算耗時較長,雖然數(shù)據(jù)驅(qū)動模型計算效率有所提升,但是對于特征復(fù)雜、序列長度大的流域徑流預(yù)測,其計算成本仍然相對較高,計算精度也有待進一步的提升。此外,現(xiàn)有的機理模型和數(shù)據(jù)驅(qū)動模型在進行徑流預(yù)測時主要傾向于給出未來確定性的徑流點預(yù)測結(jié)果,難以獲取未來徑流的可能出現(xiàn)范圍,無法量化預(yù)測風險。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測方法,通過基于神經(jīng)元歸因的新型特征重要性指標,采用動態(tài)稀疏訓練的稀疏神經(jīng)網(wǎng)絡(luò)來執(zhí)行高效的特征選擇,獲取優(yōu)于密集神經(jīng)網(wǎng)絡(luò)特征選擇的性能,同時顯著減少內(nèi)存和計算成本。此外,進一步融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測模型,通過量子希爾伯特空間數(shù)據(jù)編碼使得量子獨占資源增強特征映射,并提供優(yōu)于經(jīng)典映射的優(yōu)勢,基于量子計算提供的潛在加速可以實現(xiàn)更快速和更精準的徑流預(yù)測;同時,基于貝葉斯推理,量化徑流預(yù)測中的不確定性,全面地展示未來的徑流期望及其置信區(qū)間。此外,進一步使用貝葉斯優(yōu)化來優(yōu)化模型的超參數(shù),避免了梯度下降優(yōu)化算法的繁瑣性和高計算成本。
2、本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
3、一種融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測方法,包括以下步驟;
4、步驟s1:收集流域出口水文站逐日流量數(shù)據(jù)作為預(yù)報變量數(shù)據(jù),并同時收集流域出口水文站控制的上游流域雨量站、水文站的預(yù)報影響因子數(shù)據(jù),并將收集到的包含預(yù)報變量數(shù)據(jù)和預(yù)報影響因子數(shù)據(jù)的數(shù)據(jù)集劃分為訓練集和測試集;
5、步驟s2:基于稀疏神經(jīng)網(wǎng)絡(luò)的動態(tài)稀疏訓練策略,采用神經(jīng)元歸因方法對預(yù)報影響因子數(shù)據(jù)進行特征選擇,確定對于預(yù)報變量影響程度排名前50%的預(yù)報影響因子作為特征集;
6、步驟s3:構(gòu)建融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測模型,并在訓練集上采用篩選的特征集和預(yù)報變量數(shù)據(jù)進行模型訓練以及模型參數(shù)的優(yōu)化調(diào)整;
7、步驟s4:在測試集上采用融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測模型進行流域出口水文站的徑流預(yù)測,并選取評價指標評估其徑流預(yù)測效果。
8、作為本發(fā)明進一步的技術(shù)方案,步驟s1中流域出口水文站控制的上游流域雨量站、水文站的預(yù)報影響因子數(shù)據(jù)主要包括降雨、蒸發(fā)、日最高氣溫、日最低氣溫、日平均氣溫、上游水文站流量等預(yù)報影響特征數(shù)據(jù)。
9、作為本發(fā)明進一步的技術(shù)方案,步驟s2中,基于稀疏神經(jīng)網(wǎng)絡(luò)的動態(tài)稀疏訓練策略主要是在訓練過程中優(yōu)化網(wǎng)絡(luò)的稀疏連接性而無需使用密集的網(wǎng)絡(luò)矩陣,動態(tài)稀疏訓練策略首先初始化一個完整的神經(jīng)網(wǎng)絡(luò),隨后對其進行隨機的稀疏化,即創(chuàng)建一個隨機的拓撲網(wǎng)絡(luò)結(jié)構(gòu),并在訓練過程中,通過去除低重要性的神經(jīng)元連接來保持網(wǎng)絡(luò)的稀疏性,同時優(yōu)化網(wǎng)絡(luò)的權(quán)重。
10、作為本發(fā)明進一步的技術(shù)方案,步驟s2中,采用神經(jīng)元歸因方法進行特征選擇時,需要基于輸出神經(jīng)元的歸因來計算輸入神經(jīng)元的重要性,其中,第一層的每個輸入神經(jīng)元即對應(yīng)每個輸入神經(jīng)元的重要性分數(shù)如式1所示:
11、式1:;
12、其中,是第輪迭代時第 j個輸入神經(jīng)元的重要性, c是輸出神經(jīng)元的數(shù)量,m是樣本數(shù)量,是第 i個輸出神經(jīng)元對應(yīng)的第個樣本中的第 j個輸入特征的神經(jīng)元歸因值,一個輸入神經(jīng)元可以對應(yīng)多個輸出神經(jīng)元,第 j個輸入神經(jīng)元對應(yīng)于第 j個輸入特征,其中 l是網(wǎng)絡(luò)層數(shù),包含輸入層、隱藏層和輸出層的總網(wǎng)絡(luò)層數(shù)之和,層對應(yīng)于輸出層,表示輸出層的索引值,的絕對值越大,輸出神經(jīng)元 i對輸入特征的變化越敏感,在根據(jù)式1推導出各輸入特征對應(yīng)的輸入神經(jīng)元的重要性后,選擇神經(jīng)元歸因重要性排名前50%的特征作為特征集。
13、作為本發(fā)明進一步的技術(shù)方案,步驟s3中構(gòu)建融合量子核函數(shù)的量子增強徑流預(yù)測模型時,采用的模型是高斯過程回歸預(yù)測模型,其通過對數(shù)據(jù)進行回歸分析,來建立服從高斯過程先驗信息的非參數(shù)模型,假設(shè)一個含有n對相互獨立觀測數(shù)據(jù)的學習樣本,是由n個輸入向量組成的輸入集,是由 n個相對應(yīng)的一維輸出組成的輸出集,則高斯過程均值和方差表示為式2和式3:
14、式2:;
15、式3:;
16、式中,代表樣本中任意兩個隨機變量,e代表數(shù)學期望,表示預(yù)測函數(shù)。
17、作為本發(fā)明進一步的技術(shù)方案,步驟s3中基于高斯過程回歸預(yù)測模型構(gòu)建徑流預(yù)測模型時,使用瞬時量子多項式時間(iqp)特征圖將原始經(jīng)典時間序列數(shù)據(jù)轉(zhuǎn)換為量子態(tài)特征信息,表示原始時間序列中第 i個特征的時間序列數(shù)據(jù)集,表示基于稀疏神經(jīng)網(wǎng)絡(luò)最終確定的特征數(shù)量,表示原始時間序列中第個特征的時間序列數(shù)據(jù)集,該過程表示為式4:
18、式4:;
19、式中,表示將經(jīng)典時間序列數(shù)據(jù)所處的w維實數(shù)空間轉(zhuǎn)換至量子態(tài)特征信息所處的希爾伯特空間;表示使用瞬時量子多項式時間(iqp)特征圖將原始經(jīng)典時間序列數(shù)據(jù)轉(zhuǎn)換為量子態(tài)特征信息;為引入的一個可調(diào)超參數(shù);
20、通過瞬時量子多項式時間(iqp)特征圖將原始經(jīng)典時間序列數(shù)據(jù)轉(zhuǎn)換為量子態(tài)特征信息后可以非線性揭示序列x中固有的復(fù)雜時間動態(tài),不僅捕獲了單個時間貢獻,還可以捕獲它們的交互動態(tài)。
21、作為本發(fā)明進一步的技術(shù)方案,步驟s3中將原始經(jīng)典時間序列數(shù)據(jù)x映射為量子態(tài)特征信息后,通過計算任意兩個量子態(tài)特征信息和的保真度來量化對應(yīng)序列x和之間的相似度,保真度計算公式表示為式5;
22、式5:。
23、作為本發(fā)明進一步的技術(shù)方案,步驟s3中進行高斯過程模型超參數(shù)的優(yōu)化調(diào)整時,優(yōu)化算法采用貝葉斯優(yōu)化方法,以避免繁瑣的梯度下降優(yōu)化,同時還可以減少優(yōu)化迭代次數(shù),設(shè)定需要進行優(yōu)化的參數(shù)為,包括高斯過程(gp)的平均常數(shù) m、噪聲方差和帶寬,參數(shù)來自于指定的參數(shù)空間,用于進行優(yōu)化函數(shù),優(yōu)化目標為尋找最佳的參數(shù),使得當參數(shù)取值為時,最大,此時優(yōu)化后的最佳參數(shù)表示為式6;
24、式6:。
25、作為本發(fā)明進一步的技術(shù)方案,步驟s4中在測試集上采用融合稀疏神經(jīng)網(wǎng)絡(luò)和量子核函數(shù)的徑流預(yù)測模型進行徑流預(yù)測后,模型的徑流確定性點預(yù)測結(jié)果評價指標選擇平均絕對百分比誤差mape計算,mape表示為式7;
26、式7:;
27、式中,為測試期第 i個樣本的實測值,為第 i個樣本的預(yù)測值, c為測試集的樣本數(shù)量;
28、模型的徑流概率預(yù)測評價指標選取對數(shù)似然(ll)進行評定,ll可以表示為式8;
29、式8:;
30、式中,表示預(yù)測結(jié)果的方差,表示預(yù)測結(jié)果的均值。
31、本發(fā)明的有益效果是:本發(fā)明方法能夠高效選擇特征,顯著減少內(nèi)存和計算成本。并基于量子計算提供的潛在加速實現(xiàn)快速精準的徑流預(yù)測,同時量化預(yù)測不確定性,基于貝葉斯方法優(yōu)化參數(shù),避免了梯度下降優(yōu)化算法的繁瑣性和高計算成本。