本發(fā)明涉及電力系統(tǒng)的人工智能應(yīng)用領(lǐng)域,具體為一種面向不平衡數(shù)據(jù)的短期風(fēng)功率聯(lián)邦學(xué)習(xí)分布式預(yù)測方法。
背景技術(shù):
1、隨著環(huán)保意識(shí)的提升和可再生能源技術(shù)的發(fā)展,風(fēng)電、光伏等分布式能源在我國能源結(jié)構(gòu)中的比重上升。然而,風(fēng)力發(fā)電的固有特性,如風(fēng)速等氣候因素是決定風(fēng)力發(fā)電功率輸出的核心因素,其變化不僅具有時(shí)間上的時(shí)變性,還存在空間上的不均勻性,這種雙重特性導(dǎo)致風(fēng)力發(fā)電的功率輸出具有顯著的不穩(wěn)定性。因此,為提升電網(wǎng)的穩(wěn)定性和可靠性,需要運(yùn)用先進(jìn)的預(yù)測技術(shù)和方法,以實(shí)現(xiàn)對(duì)區(qū)域內(nèi)多風(fēng)電場功率輸出的準(zhǔn)確預(yù)測,從而保障電網(wǎng)的安全、穩(wěn)定和高效運(yùn)行。
2、近年來機(jī)器學(xué)習(xí)法中的深度學(xué)習(xí)逐漸受到關(guān)注?;跀?shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)算法通過訓(xùn)練大量數(shù)據(jù)來優(yōu)化預(yù)測模型,能夠自動(dòng)提取數(shù)據(jù)中的特征并學(xué)習(xí)復(fù)雜的映射關(guān)系,不僅能夠處理非線性、非平穩(wěn)的氣象數(shù)據(jù)特征,同時(shí)能夠適應(yīng)不同時(shí)間尺度和空間尺度的預(yù)測需求。文獻(xiàn)(符楊,任子旭,魏書榮,等.基于改進(jìn)lstm-tcn模型的海上風(fēng)電超短期功率預(yù)測[j].中國電機(jī)工程學(xué)報(bào),2022,42(12):4292-4303.)提出了一種融合lstm(long?short-term?memory,簡稱lstm)和時(shí)間卷積神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,充分考慮了風(fēng)電場群的空間分布特性,算例結(jié)果證明該方法在應(yīng)對(duì)海上風(fēng)速驟變工況時(shí)表現(xiàn)出色,具備較高的適應(yīng)性,可以提升海上風(fēng)電出力預(yù)測模型的準(zhǔn)確性。文獻(xiàn)(周家慷.基于深度學(xué)習(xí)的風(fēng)電集群短期功率預(yù)測方法研究[d].華北電力大學(xué)(北京),2022.)提出了一種基于卷積長短期記憶網(wǎng)絡(luò)的日前風(fēng)電場群短期功率集中式預(yù)測模型,該模型相較于分場建模模型,展現(xiàn)出了更高的預(yù)測精度。從上述文獻(xiàn)分析中可以看出,基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方法,通過輸入龐大的數(shù)據(jù)集提高了區(qū)域集中式多風(fēng)電場的功率預(yù)測精度,然而,龐大的訓(xùn)練集同樣使得數(shù)據(jù)驅(qū)動(dòng)模型存在以下兩個(gè)方面的局限性:(1)風(fēng)電數(shù)據(jù)的時(shí)空特征難以有效挖掘,需要同時(shí)考慮多個(gè)變量在時(shí)間和空間維度上的復(fù)雜交互關(guān)系,限制了模型在復(fù)雜場景中的預(yù)測能力;(2)區(qū)域多風(fēng)電場不同數(shù)據(jù)集存在non-iid(non-independent?identically?distribution,簡稱non-iid)分布和不平衡不充分現(xiàn)象,傳統(tǒng)的集中式訓(xùn)練會(huì)造成較大的預(yù)測誤差,并且多源數(shù)據(jù)集中的氣象信息和功率信息通常分布在不同的地理位置和運(yùn)營單位中,數(shù)據(jù)收集、整合和傳輸困難,造成數(shù)據(jù)驅(qū)動(dòng)模型的訓(xùn)練數(shù)據(jù)不足。
3、基于上述問題,需要一種能夠整合不平衡數(shù)據(jù),并對(duì)風(fēng)功率進(jìn)行分布式預(yù)測的方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明為了解決龐大的訓(xùn)練集同樣使得數(shù)據(jù)驅(qū)動(dòng)模型存在局限,限制了模型在復(fù)雜場景中的預(yù)測能力同時(shí)數(shù)據(jù)驅(qū)動(dòng)模型的訓(xùn)練數(shù)據(jù)不足的問題,提供了一種面向不平衡數(shù)據(jù)的短期風(fēng)功率聯(lián)邦學(xué)習(xí)分布式預(yù)測方法。
2、本發(fā)明是通過如下技術(shù)方案來實(shí)現(xiàn)的:一種面向不平衡數(shù)據(jù)的短期風(fēng)功率聯(lián)邦學(xué)習(xí)分布式預(yù)測方法,包括如下步驟:
3、階段一:對(duì)數(shù)據(jù)進(jìn)行清洗,包括異常數(shù)據(jù)刪除與缺失數(shù)據(jù)填補(bǔ),采用基于四分位法和三次樣條插值法的數(shù)據(jù)清洗方法;針對(duì)風(fēng)功率原始數(shù)據(jù)集中的異常值,首先利用四分位法對(duì)區(qū)域多風(fēng)電場數(shù)據(jù)集中的異常數(shù)據(jù)進(jìn)行刪除;然后采用三次樣條插值法根據(jù)連續(xù)數(shù)據(jù)通過對(duì)三彎矩方程組求解,計(jì)算出曲線函數(shù)組,從而對(duì)刪除的異常數(shù)據(jù)進(jìn)行填補(bǔ);具體為:
4、s1-1:異常數(shù)據(jù)刪除:對(duì)區(qū)域多風(fēng)電場數(shù)據(jù)集中的異常數(shù)據(jù)進(jìn)行刪除,利用四分位法將數(shù)據(jù)集從小到大排序后,劃分為四個(gè)等份,每份包含相同數(shù)量的數(shù)據(jù)點(diǎn);其中,下四分位數(shù)q1表示前25%的數(shù)據(jù)的界限,中位數(shù)q2是數(shù)據(jù)集的中間值,而上四分位數(shù)q3則代表后25%的數(shù)據(jù)的界限;通過計(jì)算四分位距iqr,即q3與q1的差值,從而定義了數(shù)據(jù)的正常范圍;超出此范圍的數(shù)據(jù)點(diǎn),即被視為異常值;對(duì)于原始數(shù)據(jù)樣本x=[x1,x2,…,xn],q1、q2和q3具體的計(jì)算公式如下:
5、
6、
7、式中,e=0,1,2,…;和分別代表原始數(shù)據(jù)的四分之一處和四分之三處向上取整;根據(jù)q1和q3的計(jì)算值得到四分位距位iqr為:
8、iqr=q3-q1??????????????????????????(4)
9、對(duì)于原始數(shù)據(jù)樣本的正常數(shù)據(jù)范圍為:
10、[f1,f2]=[q1-1.5iqr,q3+1.5iqr]?????????????????????(5)
11、s1-2:缺失數(shù)據(jù)填補(bǔ):步驟1)中異常數(shù)據(jù)直接剔除,會(huì)嚴(yán)重影響風(fēng)功率數(shù)據(jù)集中多變量序列的連續(xù)性,因此,基于三次樣條插值法對(duì)刪除的異常數(shù)據(jù)進(jìn)行填補(bǔ),具體的計(jì)算過程如下:
12、對(duì)于函數(shù)y=f(x),自變量區(qū)間為[a,b],被n+1個(gè)采樣點(diǎn)等分,即a=x0<x1<…xn=b,y=f(xi),i=0,1,…,n;若任一分段函數(shù)z(x)滿足下列條件,則該函數(shù)即為三次樣條插值函數(shù):
13、①在區(qū)間[a,b]上具有連續(xù)二階導(dǎo)數(shù);
14、②在每個(gè)子區(qū)間[xi,xi+1]上最高為三次多項(xiàng)式;
15、③函數(shù)滿足z(xi)=y(tǒng)i;
16、定義函數(shù)y節(jié)點(diǎn)xi處的一階和二階導(dǎo)數(shù)分別為si和si,即
17、f'(xi)=si?????????????????????(6)
18、f"(xi)=si?????????????????(7)
19、對(duì)于函數(shù)y=f(x),其二階導(dǎo)數(shù)f"(x)在區(qū)間[xi,xi+1]上為線性函數(shù),數(shù)學(xué)表達(dá)式為:
20、
21、hi=xi+1-xi????????????????????????????(9)
22、三次樣條的數(shù)學(xué)表達(dá)式即為對(duì)f"(x)二次積分:
23、
24、階段二:提出基于vmd-tpa-lstm的短期風(fēng)功率預(yù)測本地模型:首先利用變分模態(tài)分解vmd(variational?mode?decomposition,簡稱vmd)將原始數(shù)據(jù)集清洗后仍存在的少量異常值和噪聲分解到不同頻率的分量序列中,豐富模型的輸入信息;其次,利用時(shí)序模式注意力機(jī)制tpa(temporal?pattern?attention?mechanism,簡稱tpa)對(duì)vmd分量序列輸入矩陣進(jìn)行重要特征的自動(dòng)提取與權(quán)重分配;最后利用長短期記憶lstm(long?short-termmemory,簡稱lstm)網(wǎng)絡(luò)捕獲時(shí)間序列中的長期依賴關(guān)系,提取時(shí)空耦合特征,進(jìn)行短期風(fēng)功率預(yù)測;為后續(xù)聯(lián)邦學(xué)習(xí)框架下的分布式預(yù)測提供本地模型基礎(chǔ);具體為:
25、s2-1:vmd分解原始數(shù)據(jù):vmd將復(fù)雜的多分量信號(hào)分解為若干個(gè)具有不同中心頻率的模態(tài)分量;vmd能夠解決傳統(tǒng)信號(hào)分解方法中存在的一些問題,如模態(tài)混疊、端點(diǎn)效應(yīng)等。vmd將原始時(shí)間序列u0(t)分解為有限帶寬的多個(gè)分量uk(t),對(duì)每一個(gè)uk(t)進(jìn)行hilbert變換得到單側(cè)頻譜:
26、
27、式中,δ(t)為單位脈沖函數(shù);為沖激響應(yīng);各個(gè)分量與算子相乘,將所有分量調(diào)制到相應(yīng)的基頻帶:
28、
29、計(jì)算式(12)的最小平方范數(shù)l2,約束變分模型如下表示:
30、
31、式中,uk={u1,u2,…,uk}表示分解后的分量,wk={w1,w2,…,wk}表示各個(gè)分量的中心頻率,為滿足所有分量重構(gòu)后的和等于原始輸入的時(shí)間序列u0(t),約束條件為:
32、
33、利用二次懲罰項(xiàng)和拉格朗日乘數(shù)法,引入增廣拉格朗日lagrangian函數(shù)將約束問題轉(zhuǎn)化為非約束問題,既保證約束條件的嚴(yán)格,又保證高斯噪聲環(huán)境下分解序列重構(gòu)的準(zhǔn)確性,表達(dá)式為:
34、
35、式中,τ(t)為lagrangian乘子;α為二次懲罰項(xiàng)因子;使用乘法算子交替方向法(alternate?direction?method?of?multipliers,簡稱admm),連續(xù)更新每個(gè)分量和每個(gè)分量的中心頻率,最終得到原始序列分解變分問題的最優(yōu)解;分量uk(t)、中心頻率wk、拉格朗日乘子τ(t)的更新過程如下:
36、
37、式中,分別為u0(t),uk(t),τ(t)的傅里葉變換;w為頻率;n為迭代次數(shù);λ為噪聲,當(dāng)信號(hào)含有強(qiáng)噪聲時(shí),設(shè)定λ=0達(dá)到更好的去噪效果;重復(fù)計(jì)算公式(16)、(17)、(18),直到滿足精度μ后停止迭代,最終獲得k個(gè)模態(tài)分量;迭代條件為:
38、
39、s2-2:tpa-lstm提取時(shí)空耦合特征,進(jìn)行短期風(fēng)功率預(yù)測:tpa對(duì)歷史輸入序列的每個(gè)時(shí)間步驟進(jìn)行加權(quán),將重要元素的權(quán)重賦值增高,不重要元素的權(quán)重賦值降低,使lstm模型更加關(guān)注與目標(biāo)預(yù)測相關(guān)的數(shù)據(jù)特征;風(fēng)功率原始數(shù)據(jù)集為x=[x1,x2,…xn],n為輸入特征數(shù)量;利用vmd分解算法,根據(jù)預(yù)設(shè)的分解個(gè)數(shù)m對(duì)輸入層分解得到vmd分解層的輸入矩陣;在lstm迭代過程中,前向單元隱層狀態(tài)為ht,單元狀態(tài)信息為st,當(dāng)前時(shí)刻對(duì)應(yīng)各歷史時(shí)刻的時(shí)間注意力權(quán)重向量lt為:
40、lt=relu(wdht+bd)?????????????????????????(20)
41、式中,為輸入序列的時(shí)間窗口長度;wd為可訓(xùn)練權(quán)重矩陣;bd為計(jì)算時(shí)間注意力權(quán)重的偏置向量;
42、利用softmax函數(shù)進(jìn)行歸一化處理,得到時(shí)間注意力權(quán)重βt:
43、
44、式中,為第個(gè)時(shí)刻的注意力權(quán)重值,綜合時(shí)序信息狀態(tài)ct為:
45、
46、最后將綜合時(shí)序狀態(tài)輸入到全連接層,通過vmd分量重構(gòu)獲得輸出層的預(yù)測結(jié)果,最終將vmd-tpa-lstm確立為聯(lián)邦學(xué)習(xí)框架下的本地模型。
47、階段三:進(jìn)行基于橫向聯(lián)邦學(xué)習(xí)的短期風(fēng)功率分布式預(yù)測:首先,區(qū)域內(nèi)各風(fēng)電場以“本地訓(xùn)練-參數(shù)上傳”的形式完成分布式訓(xùn)練,利用差分隱私保護(hù)機(jī)制提高風(fēng)電場私有數(shù)據(jù)保留在本地的安全性,避免了各方數(shù)據(jù)源對(duì)數(shù)據(jù)隱私安全的擔(dān)憂,從而打破了數(shù)據(jù)壁壘對(duì)集中式預(yù)測的限制;其次,利用scaffold機(jī)制解決了多個(gè)數(shù)據(jù)源由于數(shù)據(jù)量不足或數(shù)據(jù)分布不均而造成的準(zhǔn)確性下降問題,提高全局模型的預(yù)測性能和魯棒性;最后利用回歸模型評(píng)價(jià)指標(biāo),驗(yàn)證所提橫向聯(lián)邦學(xué)習(xí)框架分布式訓(xùn)練的有效性。基于聯(lián)邦學(xué)習(xí)框架,各個(gè)風(fēng)電場可以利用私有數(shù)據(jù)集在本地進(jìn)行訓(xùn)練,本地訓(xùn)練完成后,各風(fēng)電場上傳模型參數(shù)至聯(lián)邦中央服務(wù)器,服務(wù)器負(fù)責(zé)聚合這些參數(shù),以更新全局的風(fēng)功率預(yù)測模型。這種方式的優(yōu)點(diǎn)在于風(fēng)電場的數(shù)據(jù)集在整個(gè)訓(xùn)練過程中都無需離開本地設(shè)備,從而確保了數(shù)據(jù)的安全性和隱私性。同時(shí),區(qū)域內(nèi)多個(gè)風(fēng)電場的數(shù)據(jù)集呈現(xiàn)非獨(dú)立同分布(non-independentidentically?distribution,簡稱non-iid)和不平衡不充分的特點(diǎn),通過聯(lián)邦分布式訓(xùn)練,全局模型能夠?qū)W習(xí)到此區(qū)域內(nèi)單個(gè)風(fēng)電場模型所無法捕捉到的數(shù)據(jù)特點(diǎn),進(jìn)而提升預(yù)測的準(zhǔn)確性和泛化能力。具體為:
48、s3-1:差分隱私保護(hù)機(jī)制:基于差分隱私拉普拉斯噪聲改進(jìn)本地模型參數(shù)傳遞機(jī)制,在風(fēng)電場訓(xùn)練本地模型時(shí)將保護(hù)噪聲注入到梯度參數(shù)中,從而實(shí)現(xiàn)所有本地模型參數(shù)傳遞到中央服務(wù)器的過程中,數(shù)據(jù)隱私信息無法被反演還原,具體原理如下:
49、拉普拉斯分布是以0為中心,以b為尺度,其概率密度分布為:
50、
51、對(duì)于p(x|b),可記為lap(b),表示隨機(jī)變量x~lap(b);對(duì)于風(fēng)功率數(shù)據(jù)集d的函數(shù)f:d→rd,對(duì)任意輸入a,拉普拉斯機(jī)制為:
52、
53、式中,ε表示隱私預(yù)算;拉普拉斯機(jī)制滿足(ε,0)-差分隱私的定義,設(shè)m∈d,n∈d',滿足||m-n||1≤1;pm表示概率密度函數(shù)h(m),pn表示給概率密度函數(shù)h(n),比較兩者任意時(shí)間點(diǎn)t的概率密度:
54、
55、式(26)表示為t的概率,k′輸出之間相互獨(dú)立,對(duì)等式進(jìn)行化簡:
56、
57、利用范數(shù)變形,并根據(jù)||f(m)i-f(n)i||1≤1得到:
58、
59、s3-2:scaffold中央服務(wù)器聚合策略的算法流程如下:
60、a:輸入:客戶端總數(shù)n;全局迭代選擇客戶端數(shù)量k;全局迭代次數(shù)t;全局更新學(xué)習(xí)率ηg;全局控制變量c;客戶端的編號(hào)k″=1,2,…,n;每個(gè)客戶端上的數(shù)據(jù)量nk″;客戶端本地更新迭代次數(shù)e;本地更新學(xué)習(xí)率ηl;控制變量ck;
61、b:輸出:全局模型參數(shù)wt;
62、b1:中央服務(wù)器端算法流程server如下:
63、1:初始化全局模型權(quán)重參數(shù)w0;
64、2:for?t=0,1,…,t-1do;
65、3:st←選取k個(gè)客戶端集合;
66、4:for?k″∈st?do;
67、5:
68、6:end?for;
69、7:
70、8:wt+1←wt+ηgδwt+1,
71、9:end?for;
72、10:return?wt;
73、b2:客戶端算法流程client:
74、1:上一輪全局參數(shù)下發(fā)更新客戶端參數(shù);
75、2:for?k″∈st?do;
76、3:for?i=0,1,…,e-1do
77、4:計(jì)算梯度;
78、5:end?for;
79、6:或
80、7:將發(fā)送給中央服務(wù)器;
81、8:
82、9:end?for;
83、10:returnck″;
84、s3-3:模型性能評(píng)估指標(biāo):采用均方根誤差rmse(root?mean?squared?error,簡稱rmse)和平均絕對(duì)誤差mae(mean?absolute?error,簡稱mae)作為回歸模型誤差度量指標(biāo);rmse和mae的計(jì)算公式如下所示:
85、
86、式中,yi代表真實(shí)值;代表預(yù)測值;n代表樣本數(shù)。
87、本發(fā)明所設(shè)計(jì)的一種面向不平衡數(shù)據(jù)的短期風(fēng)功率聯(lián)邦學(xué)習(xí)分布式預(yù)測方法,綜述如下:通過四分位法和三次樣條插值法對(duì)區(qū)域多風(fēng)電場數(shù)據(jù)集中的異常數(shù)據(jù)進(jìn)行清洗;基于vmd-tpa-lstm算法構(gòu)建聯(lián)邦學(xué)習(xí)框架下的本地模型,充分提取數(shù)據(jù)集中的時(shí)空耦合特征,提高預(yù)測精度;最后基于差分隱私保護(hù)機(jī)制優(yōu)化聯(lián)邦學(xué)習(xí)框架的本地模型參數(shù)上傳過程,基于scaffold機(jī)制優(yōu)化所有本地模型參數(shù)聚合方向,最終完成分布式訓(xùn)練,完善聯(lián)邦學(xué)習(xí)的全局模型。
88、與現(xiàn)有技術(shù)相比本發(fā)明具有以下有益效果:本發(fā)明所提供的一種面向不平衡數(shù)據(jù)的短期風(fēng)功率聯(lián)邦學(xué)習(xí)分布式預(yù)測方法,改善了以下兩方面難題:(1)區(qū)域多風(fēng)電場數(shù)據(jù)集存在non-iid和不平衡不充分的特點(diǎn),導(dǎo)致區(qū)域多風(fēng)電場的功率預(yù)測變得復(fù)雜且不準(zhǔn)確,造成了嚴(yán)重的棄風(fēng)現(xiàn)象;(2)現(xiàn)有的數(shù)據(jù)驅(qū)動(dòng)風(fēng)功率預(yù)測方法往往基于單一數(shù)據(jù)源和集中式的數(shù)據(jù)處理模式,而區(qū)域多風(fēng)電場數(shù)據(jù)集中的氣象信息和功率信息通常分布在不同的地理位置和運(yùn)營單位中,使得多源數(shù)據(jù)信息的收集、整合和傳輸存在“數(shù)據(jù)孤島”問題。