本發(fā)明涉及新型配電網(wǎng)異常檢測(cè),尤其涉及一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測(cè)及替換方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本發(fā)明相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
2、隨著光伏、電動(dòng)汽車等新型源荷設(shè)備的高比例接入,新型配電網(wǎng)中已經(jīng)呈現(xiàn)出負(fù)荷多樣化和智能化趨勢(shì),大量的電力電子設(shè)備加大了電網(wǎng)中電能流動(dòng)的復(fù)雜性和隨機(jī)性,獲取可靠的電量數(shù)據(jù)是保證配電網(wǎng)透明化的重要環(huán)節(jié)。
3、配電網(wǎng)離線電量數(shù)據(jù)主要包括三相電壓、三相電流和功率數(shù)據(jù)等,當(dāng)前配電網(wǎng)電量數(shù)據(jù)的質(zhì)量受到多方面因素的威脅。首先,部分新能源設(shè)備受到日照、天氣等因素的影響,電動(dòng)汽車等設(shè)備的數(shù)據(jù)受到用戶使用習(xí)慣的影響,部分電器負(fù)荷受到季節(jié)影響,這些因素都會(huì)造成配電網(wǎng)中電量數(shù)據(jù)的偶然性增加。此外,大量的電量數(shù)據(jù)也會(huì)加大數(shù)據(jù)在采集、傳輸過程中的面臨的壓力,造成突變、缺失、長(zhǎng)時(shí)間波動(dòng)等異常現(xiàn)象。因此,對(duì)于電量數(shù)據(jù)的異常檢測(cè)和替換,是電力系統(tǒng)中狀態(tài)估計(jì)和電力調(diào)度安排的重要功能之一,能夠保證對(duì)配電網(wǎng)運(yùn)行狀態(tài)的準(zhǔn)確辨識(shí)。
4、電力系統(tǒng)中,測(cè)量數(shù)據(jù)主要由測(cè)量值和測(cè)量誤差組成。異常數(shù)據(jù)指的是那些偏離正常測(cè)量范圍的數(shù)據(jù),可能由于測(cè)量設(shè)備故障或數(shù)據(jù)傳輸問題等多種原因產(chǎn)生。
5、基于均值、標(biāo)準(zhǔn)差等的傳統(tǒng)異常檢測(cè)方法,收到數(shù)據(jù)處理能力或效率的影響,往往會(huì)忽視冗余信息的重要性,集中于單一特征或簡(jiǎn)單統(tǒng)計(jì)量。因此,基于統(tǒng)計(jì)分析的傳統(tǒng)異常檢測(cè)方法對(duì)于冗余信息的利用明顯不足,難以應(yīng)對(duì)殘差污染、殘差淹沒等問題。
6、在數(shù)據(jù)的預(yù)測(cè)和替換方面,目前大多采用諸如拉格朗日插值替換、樣條插值法等的差值方法,但是這些方法計(jì)算量大,對(duì)于內(nèi)存的要求較高,計(jì)算速度較慢。
7、現(xiàn)有技術(shù)也公開了采用機(jī)器學(xué)習(xí)的方法(比如隨機(jī)森林和支持向量機(jī)等)對(duì)電量數(shù)據(jù)進(jìn)行預(yù)測(cè),然后對(duì)異常數(shù)據(jù)進(jìn)行替換;但是,采用隨機(jī)森林的方法不適用于數(shù)據(jù)較多的情況,采用支持向量機(jī)的方法也存在著超參數(shù)確定難、易出現(xiàn)欠擬合或過擬合等的通??;導(dǎo)致對(duì)數(shù)據(jù)的泛化能力差,預(yù)測(cè)精度不足。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述問題,本發(fā)明提出了一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測(cè)及替換方法及系統(tǒng),采用改進(jìn)極限梯度提升算法(xgboost)的時(shí)序預(yù)測(cè)模型對(duì)區(qū)域用電量序列數(shù)據(jù)進(jìn)行逐時(shí)刻預(yù)測(cè),通過改進(jìn)決策樹的確定過程,引入步長(zhǎng)因子來改進(jìn)目標(biāo)函數(shù)的計(jì)算方法,避免了傳統(tǒng)方法在制定決策樹過程中的局限性,同時(shí)避免了過擬合現(xiàn)象。最后,基于預(yù)測(cè)和真實(shí)值的殘差利用密度聚類算法(dbscan)進(jìn)行聚類,重構(gòu)了殘差數(shù)據(jù)輸入到聚類算法前的形式,檢測(cè)并替換出異常數(shù)據(jù)。
2、在一些實(shí)施方式中,采用如下技術(shù)方案:
3、一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測(cè)及替換方法,包括:
4、獲取歷史時(shí)間段配電網(wǎng)離線電量數(shù)據(jù)并進(jìn)行預(yù)處理,預(yù)處理后的數(shù)據(jù)輸入至訓(xùn)練好的數(shù)據(jù)時(shí)序預(yù)測(cè)模型,得到待測(cè)時(shí)間段內(nèi)各個(gè)時(shí)刻的配電網(wǎng)離線電量預(yù)測(cè)數(shù)據(jù);
5、獲取待測(cè)時(shí)間段的配電網(wǎng)離線電量真實(shí)數(shù)據(jù),計(jì)算每個(gè)時(shí)刻真實(shí)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的殘差項(xiàng),對(duì)得到的殘差項(xiàng)進(jìn)行聚類,識(shí)別出異常數(shù)據(jù)點(diǎn);
6、利用對(duì)應(yīng)時(shí)刻的電量預(yù)測(cè)數(shù)據(jù)對(duì)異常數(shù)據(jù)點(diǎn)進(jìn)行替換;
7、其中,所述數(shù)據(jù)時(shí)序預(yù)測(cè)模型采用改進(jìn)的xgboost算法構(gòu)建,所述改進(jìn)的xgboost算法在決策樹的每一層之間引入了步長(zhǎng)因子。
8、進(jìn)一步地,所述配電網(wǎng)離線電量數(shù)據(jù)為電壓、電流或有功功率。
9、進(jìn)一步地,所述改進(jìn)的xgboost算法中每一顆決策樹的目標(biāo)函數(shù)為損失函數(shù)和正則項(xiàng)的加和,在每次迭代中都進(jìn)行正則化。
10、進(jìn)一步地,所述改進(jìn)的xgboost算法中每一顆決策樹的目標(biāo)函數(shù)為以葉子節(jié)點(diǎn)數(shù)值wj為變量的二次函數(shù),對(duì)wj求取偏導(dǎo)后尋找目標(biāo)函數(shù)極值,能夠得到最簡(jiǎn)后的目標(biāo)函數(shù)和對(duì)應(yīng)的最佳權(quán)重形成權(quán)重向量w。
11、進(jìn)一步地,每一顆決策樹最簡(jiǎn)后的目標(biāo)函數(shù)obj(t)*和最佳權(quán)重具體為:
12、
13、其中,gj和hj均為定值,t表示經(jīng)過經(jīng)過t次迭代后的樹的葉子節(jié)點(diǎn)數(shù)目,λ表示葉子節(jié)點(diǎn)數(shù)值的懲罰參數(shù)。
14、進(jìn)一步地,以每三層為一個(gè)優(yōu)化單位,對(duì)每一層的收益進(jìn)行加權(quán)求和,確定改進(jìn)的xgboost算法中決策樹的分裂收益;
15、從樹的深度為0開始,不斷對(duì)葉子節(jié)點(diǎn)進(jìn)行劃分,當(dāng)達(dá)到k層時(shí),若分裂收益滿足設(shè)定要求,則將此時(shí)的決策樹作為最佳決策樹,得到葉子節(jié)點(diǎn)個(gè)數(shù)t和葉子節(jié)點(diǎn)的數(shù)值。
16、進(jìn)一步地,所述對(duì)得到的殘差項(xiàng)進(jìn)行聚類,具體為:
17、利用dbscan聚類算法對(duì)殘差項(xiàng)r進(jìn)行聚類分析,將這些數(shù)據(jù)劃分成若干個(gè)簇和離群點(diǎn),這些簇就是由正常的殘差項(xiàng)數(shù)據(jù)所聚合而成,而被劃分成離群點(diǎn)的就是dbscan聚類算法所識(shí)別出的異常數(shù)據(jù)。
18、在另一些實(shí)施方式中,采用如下技術(shù)方案:
19、一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測(cè)及替換系統(tǒng),包括:
20、電量數(shù)據(jù)預(yù)測(cè)模塊,用于獲取歷史時(shí)間段配電網(wǎng)離線電量數(shù)據(jù)并進(jìn)行預(yù)處理,預(yù)處理后的數(shù)據(jù)輸入至訓(xùn)練好的數(shù)據(jù)時(shí)序預(yù)測(cè)模型,得到待測(cè)時(shí)間段內(nèi)各個(gè)時(shí)刻的配電網(wǎng)離線電量預(yù)測(cè)數(shù)據(jù);
21、異常數(shù)據(jù)識(shí)別模塊,用于獲取待測(cè)時(shí)間段的配電網(wǎng)離線電量真實(shí)數(shù)據(jù),計(jì)算每個(gè)時(shí)刻真實(shí)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的殘差項(xiàng),對(duì)得到的殘差項(xiàng)進(jìn)行聚類,識(shí)別出異常數(shù)據(jù)點(diǎn);
22、異常數(shù)據(jù)替換模塊,用于利用對(duì)應(yīng)時(shí)刻的電量預(yù)測(cè)數(shù)據(jù)對(duì)異常數(shù)據(jù)點(diǎn)進(jìn)行替換;
23、其中,所述數(shù)據(jù)時(shí)序預(yù)測(cè)模型采用改進(jìn)的xgboost算法構(gòu)建,所述改進(jìn)的xgboost算法在決策樹的每一層之間引入了步長(zhǎng)因子。
24、在另一些實(shí)施方式中,采用如下技術(shù)方案:
25、一種終端設(shè)備,其包括處理器和存儲(chǔ)器,處理器用于實(shí)現(xiàn)指令;存儲(chǔ)器用于存儲(chǔ)多條指令,所述指令適于由處理器加載并執(zhí)行上述的配電網(wǎng)離線電量數(shù)據(jù)的異常檢測(cè)及替換方法。
26、在另一些實(shí)施方式中,采用如下技術(shù)方案:
27、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中存儲(chǔ)有多條指令,所述指令適于由終端設(shè)備的處理器加載并執(zhí)行上述的配電網(wǎng)離線電量數(shù)據(jù)的異常檢測(cè)及替換方法。
28、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
29、(1)本發(fā)明基于前三個(gè)月訓(xùn)練得到的預(yù)測(cè)模型,預(yù)測(cè)三個(gè)月后的時(shí)序數(shù)據(jù),構(gòu)成預(yù)測(cè)序列。利用每個(gè)時(shí)刻真實(shí)值和對(duì)應(yīng)時(shí)刻的預(yù)測(cè)值相減,得到每個(gè)時(shí)刻的殘差項(xiàng)。利用改進(jìn)dbscan聚類密度算法對(duì)真實(shí)值和預(yù)測(cè)值的殘差項(xiàng)進(jìn)行聚類分析,檢測(cè)出異常值,然后將對(duì)應(yīng)的預(yù)測(cè)值對(duì)異常值進(jìn)行替換;本發(fā)明方法重塑了殘差數(shù)據(jù)的輸入形式,能夠有效檢測(cè)和替換出異常數(shù)據(jù)。
30、(2)本發(fā)明基于改進(jìn)的xgboost算法構(gòu)建數(shù)據(jù)時(shí)序預(yù)測(cè)模型,改進(jìn)的xgboost算法在決策樹的每一層之間引入了步長(zhǎng)因子,避免了傳統(tǒng)方法在制定決策樹過程中的局限性,同時(shí)避免了過擬合現(xiàn)象;對(duì)損失函數(shù)進(jìn)行二階泰勒展開,同時(shí)將決策樹函數(shù)f定義為關(guān)于葉子節(jié)點(diǎn)數(shù)值w的函數(shù),可以對(duì)目標(biāo)函數(shù)進(jìn)行簡(jiǎn)化,減少計(jì)算量,可以適用于不同的誤差函數(shù),提高計(jì)算效率。
31、(3)本發(fā)明改進(jìn)了對(duì)分裂收益的計(jì)算方式,以三層為一個(gè)單位,對(duì)于不同層的收益進(jìn)行加權(quán)求和,確定分裂收益,避免因?yàn)榕既恍詫?dǎo)致的局部收益過大。
32、本發(fā)明的其他特征和附加方面的優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本方面的實(shí)踐了解到。