本發(fā)明涉及數(shù)據(jù)驅(qū)動(dòng)的工業(yè)軟測(cè)量建模,具體涉及一種新型異常值修正的風(fēng)電功率預(yù)測(cè)算法。
背景技術(shù):
1、隨著能源需求的不斷增長(zhǎng)和實(shí)現(xiàn)碳達(dá)峰、碳中和目標(biāo)的推動(dòng)下,風(fēng)能作為一種可再生清潔能源引起了極大地關(guān)注。然而,由于風(fēng)能的隨機(jī)性和不確定性使得風(fēng)電功率難以進(jìn)行準(zhǔn)確估計(jì);大規(guī)模風(fēng)電接入電網(wǎng)后,將對(duì)電網(wǎng)造成巨大沖擊,嚴(yán)重影響電網(wǎng)安全穩(wěn)定運(yùn)行,同時(shí)也給電力部門(mén)的調(diào)度工作帶來(lái)了嚴(yán)峻的挑戰(zhàn)。因此,開(kāi)展高精度、高可靠性的風(fēng)電功率軟測(cè)量預(yù)測(cè)方法研究,具有重要的理論價(jià)值和實(shí)際意義。
2、然而,風(fēng)電功率軟測(cè)量預(yù)測(cè)方法的開(kāi)發(fā)存在以下問(wèn)題:(1)由于風(fēng)湍流影響、傳感器故障,導(dǎo)致數(shù)據(jù)集中存在大量的異常值;(2)歷史過(guò)程變量的數(shù)值具有復(fù)雜的隨機(jī)性和非平穩(wěn)性特征,難以對(duì)其變化進(jìn)行準(zhǔn)確的分析;(3)目標(biāo)變量與歷史過(guò)程變量之間存在強(qiáng)非線性和時(shí)滯性;(4)僅依賴(lài)數(shù)據(jù)驅(qū)動(dòng)模型的軟測(cè)量算法缺乏領(lǐng)域知識(shí)的約束與校正,對(duì)預(yù)測(cè)結(jié)果的準(zhǔn)確性存在一定局限;(5)軟測(cè)量算法有時(shí)會(huì)產(chǎn)生不符合物理規(guī)律的預(yù)測(cè)結(jié)果。因此,亟需開(kāi)發(fā)一種軟測(cè)量算法來(lái)實(shí)現(xiàn)異常值的檢測(cè)和處理,并將相關(guān)領(lǐng)域知識(shí)與時(shí)間序列神經(jīng)網(wǎng)絡(luò)相結(jié)合。
技術(shù)實(shí)現(xiàn)思路
1、為了解決測(cè)量數(shù)據(jù)中的異常值、過(guò)程變化趨勢(shì)難以捕獲、軟測(cè)量模型缺乏領(lǐng)域知識(shí)以及產(chǎn)生違反物理規(guī)律的預(yù)測(cè)結(jié)果的問(wèn)題,本發(fā)明提出一種新型異常值修正的風(fēng)電功率預(yù)測(cè)算法,實(shí)現(xiàn)對(duì)風(fēng)電功率快速和準(zhǔn)確地估計(jì),從而有助于電力系統(tǒng)的優(yōu)化調(diào)度和降低運(yùn)行成本。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用以下方案:一種新型異常值修正的風(fēng)電功率預(yù)測(cè)算法,包括如下步驟:
3、步驟1,收集風(fēng)速歷史數(shù)據(jù)和風(fēng)電功率歷史數(shù)據(jù)作為原始數(shù)據(jù)集,基于箱線圖法對(duì)風(fēng)速歷史數(shù)據(jù)進(jìn)行初步異常值檢測(cè)及剔除,然后使用三次樣條插值法將剔除的風(fēng)速歷史數(shù)據(jù)補(bǔ)全;
4、步驟2,針對(duì)步驟1初步處理后的原始數(shù)據(jù)集采用新的異常值檢測(cè)算法篩選出異常值后剔除,然后采用異常值修正方法重構(gòu)缺失值,所述異常值檢測(cè)算法基于k均值聚類(lèi)算法和高斯核密度估計(jì)方法,所述新的異常值修正方法基于窗口平滑法和理論功率;
5、步驟3,針對(duì)步驟2深度處理后的原始數(shù)據(jù)集,利用變分模態(tài)分解風(fēng)速和風(fēng)電功率序列,用于神經(jīng)網(wǎng)絡(luò)模型挖掘風(fēng)速歷史數(shù)據(jù)和風(fēng)電功率歷史數(shù)據(jù)中的信息;
6、步驟4,將風(fēng)電功率作為主要預(yù)測(cè)變量,風(fēng)速作為輔助預(yù)測(cè)變量構(gòu)建多輸出門(mén)控循環(huán)單元模型同步預(yù)測(cè)風(fēng)速和風(fēng)電功率;同時(shí)提出一個(gè)新的損失函數(shù),用于增強(qiáng)模型在訓(xùn)練過(guò)程中對(duì)風(fēng)電功率預(yù)測(cè)任務(wù)的關(guān)注,所述新的損失函數(shù)為:
7、(11)
8、其中,為調(diào)節(jié)因子,其取值范圍為(1,2),用于調(diào)節(jié)損失占比;為風(fēng)電功率的損失值;為風(fēng)速的損失值;為mgru模型前向傳播的損失值;
9、步驟5,基于風(fēng)力發(fā)電過(guò)程的領(lǐng)域知識(shí)開(kāi)發(fā)微調(diào)校正模塊用于約束矯正風(fēng)電功率預(yù)測(cè)值。
10、具體的,步驟1中,初步檢測(cè)及剔除風(fēng)速序列中明顯異常值的具體執(zhí)行過(guò)程包括:
11、步驟1.1,計(jì)算風(fēng)速數(shù)據(jù)的下四分位數(shù)q1、中位數(shù)q2、上四分位數(shù)q3以及四分位間距iqr,q1為數(shù)據(jù)的25%分位數(shù),q2為數(shù)據(jù)的中間值,q3為數(shù)據(jù)的75%分位數(shù),iqr為q1與q3之間的范圍,其值為q3-q1;
12、步驟1.2,計(jì)算箱線圖的上下限,位于上下限之外的點(diǎn)被視為異常值點(diǎn)并將其剔除,箱線圖的上限為q1-1.5*iqr,下限為q3+1.5*iqr。
13、具體的,步驟2中,所述數(shù)據(jù)集包括3000筆樣本,數(shù)據(jù)集的70%被用作訓(xùn)練數(shù)據(jù),剩余的30%被用作測(cè)試數(shù)據(jù)。
14、具體的,步驟2中,所述深度異常值檢測(cè)剔除和缺失值補(bǔ)全校正的具體執(zhí)行過(guò)程包括:
15、步驟2.1,使用k均值聚類(lèi)算法將風(fēng)電功率值相近的數(shù)據(jù)點(diǎn)聚為一類(lèi),將樣本點(diǎn)分成多個(gè)類(lèi)別簇;
16、步驟2.2,在各類(lèi)別簇中,使用高斯核密度估計(jì)方法針對(duì)每個(gè)樣本點(diǎn)對(duì)應(yīng)的風(fēng)速值進(jìn)行分析處理得到各樣本點(diǎn)的核密度估計(jì)值,將核密度估計(jì)值取反記為異常值得分;
17、步驟2.3,設(shè)置判定閾值,樣本異常值得分超過(guò)該閾值則被判定為異常值;
18、步驟2.4,剔除所檢測(cè)到的異常值后,分兩步補(bǔ)全缺失值:首先,采用窗口平滑法分別計(jì)算風(fēng)速序列和風(fēng)電功率序列中缺失值前后兩個(gè)樣本的均值;其次,根據(jù)風(fēng)速與風(fēng)電功率間對(duì)應(yīng)的數(shù)學(xué)表達(dá)式,計(jì)算出理論風(fēng)電功率值,用于校正相應(yīng)的風(fēng)電功率值,所述風(fēng)速與風(fēng)電功率間的數(shù)學(xué)表達(dá)式為:
19、(1)
20、其中,表示輪轂處風(fēng)速;表示切入風(fēng)速;表示額定風(fēng)速;表示切出風(fēng)速;表示額定功率;表示不同風(fēng)速條件下產(chǎn)生的風(fēng)電功率;表示風(fēng)能利用系數(shù);為風(fēng)機(jī)葉片掃風(fēng)面積;為空氣密度。
21、具體的,步驟3中,所述多輸出門(mén)控循環(huán)單元將所述風(fēng)速和風(fēng)電功率序列分別分解為12個(gè)本征模態(tài)函數(shù)分量,其具體執(zhí)行過(guò)程包括:
22、步驟3.1,初始化分解的模態(tài)數(shù)量,通過(guò)變分原理構(gòu)建優(yōu)化問(wèn)題,目標(biāo)為最小化重構(gòu)誤差和模態(tài)帶寬,約束變分表達(dá)式具體形式為:
23、(2)
24、其中,表示第個(gè)子信號(hào)的中心頻率,為狄拉克分布,表示關(guān)于時(shí)間的偏導(dǎo)數(shù);表示第個(gè)本征模態(tài)函數(shù)分量;表示原始信號(hào);表示復(fù)指數(shù)函數(shù);
25、步驟3.2,通過(guò)引入拉格朗日乘子和二次懲罰因子,將約束條件整合到優(yōu)化問(wèn)題中,構(gòu)成拉格朗日函數(shù):
26、
27、步驟3.3,通過(guò)交替方向乘子法迭代更新每個(gè)模態(tài)、和的最優(yōu)解,迭代更新表達(dá)式為:
28、
29、其中,為迭代次數(shù),、、和分別為、、和的傅里葉變換;
30、步驟3.4,對(duì)求反傅里葉變換即可得到各分量在時(shí)域的表達(dá)式,從而得到分解后的各子信號(hào)。
31、具體的,步驟4中,所述多輸出門(mén)控循環(huán)單元的工作機(jī)制包括:
32、(7)
33、(8)
34、(9)
35、(10)
36、其中,為當(dāng)前時(shí)刻輸入,為上一時(shí)刻的隱藏狀態(tài),為重置門(mén),為更新門(mén),為當(dāng)前時(shí)刻候選隱藏狀態(tài),為當(dāng)前時(shí)刻隱藏狀態(tài),為不同的權(quán)重矩陣,為不同的偏置向量,和分別表示sigmoid函數(shù)和雙曲正切函數(shù),⊙表示哈達(dá)瑪積。
37、具體的,步驟5中,所述微調(diào)校正模塊的具體執(zhí)行過(guò)程包括:
38、步驟5.1,根據(jù)風(fēng)速預(yù)測(cè)值計(jì)算出與之對(duì)應(yīng)的理論風(fēng)電功率值,將所述理論風(fēng)電功率值與初步矯正后的風(fēng)電功率預(yù)測(cè)值進(jìn)行加權(quán)重組后,約束矯正偏離真實(shí)值的風(fēng)電功率預(yù)測(cè)值,所述加權(quán)重組公式為:
39、(12)
40、其中,為權(quán)重系數(shù),其取值范圍為(0,1),用于調(diào)節(jié)取值占比;為約束矯正后的風(fēng)電功率值;為理論風(fēng)電功率值;為初步矯正后的風(fēng)電功率預(yù)測(cè)值;
41、步驟5.2,將風(fēng)電功率預(yù)測(cè)值出現(xiàn)負(fù)值結(jié)果的校正為0;
42、步驟5.3,基于風(fēng)電功率曲線特性和機(jī)理知識(shí)微調(diào)功率值:對(duì)于風(fēng)速預(yù)測(cè)值小于切入風(fēng)速可信范圍所對(duì)應(yīng)的功率值,將其置為0;對(duì)于超過(guò)額定風(fēng)速可信范圍所對(duì)應(yīng)的功率值,將其置為額定功率值。
43、具體的,所述風(fēng)電功率預(yù)測(cè)算法的性能基于均方根誤差、平均絕對(duì)誤差和決定系數(shù)進(jìn)行評(píng)估,
44、(13)
45、(14)
46、(15)
47、其中,表示測(cè)試數(shù)據(jù)集中的樣本總數(shù),和分別是第個(gè)樣本的測(cè)量值和預(yù)測(cè)值,為樣本平均值。
48、本發(fā)明具有的有益效果為:首先,本方案基于k均值聚類(lèi)算法和高斯核密度估計(jì)方法開(kāi)發(fā)了一種新的異常值檢測(cè)算法篩選出數(shù)據(jù)集的異常值,基于窗口平滑法和理論功率開(kāi)發(fā)了一種新的異常值修正方法重構(gòu)缺失值,全面評(píng)估風(fēng)速與風(fēng)電功率序列間的耦合關(guān)系,進(jìn)一步的減輕了異常值對(duì)模型的負(fù)面影響。
49、而且,在構(gòu)建多輸出門(mén)控循環(huán)單元模型同步預(yù)測(cè)風(fēng)速和風(fēng)電功率的同時(shí)提出一個(gè)新的損失函數(shù),在模型訓(xùn)練的過(guò)程中,為風(fēng)電功率損失值賦予較大的權(quán)重,從而使模型在訓(xùn)練的過(guò)程中更加側(cè)重風(fēng)電功率預(yù)測(cè)任務(wù)。
50、再者,為了提高算法估計(jì)精度,將相關(guān)領(lǐng)域知識(shí)、編碼為約束條件,對(duì)模型的預(yù)測(cè)值進(jìn)行約束校正,根據(jù)風(fēng)電領(lǐng)域知識(shí)開(kāi)發(fā)了微調(diào)校正模塊,使得預(yù)測(cè)結(jié)果更加符合實(shí)際風(fēng)電功率輸出的物理規(guī)律和運(yùn)行特性,提升了預(yù)測(cè)的準(zhǔn)確性和可靠性。
51、另外,使用mgru作為基礎(chǔ)學(xué)習(xí)器進(jìn)行風(fēng)速和風(fēng)電功率的同步預(yù)測(cè),從而更深地挖掘二者之間的非線性交互關(guān)系。
52、總之,本方案風(fēng)電功率預(yù)測(cè)算法不僅實(shí)現(xiàn)了異常值的檢測(cè)和處理,還將相關(guān)領(lǐng)域知識(shí)與時(shí)間序列神經(jīng)網(wǎng)絡(luò)相結(jié)合實(shí)現(xiàn)了對(duì)風(fēng)電功率快速和準(zhǔn)確地估計(jì),從而有助于電力系統(tǒng)的優(yōu)化調(diào)度和降低運(yùn)行成本。