本發(fā)明涉及能碳管理,尤其是涉及一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法。
背景技術(shù):
1、目前國內(nèi)化工企業(yè)存在以下問題亟待解決:化工企業(yè)有多個(gè)工藝廠區(qū)以及各種產(chǎn)品,各個(gè)工藝產(chǎn)區(qū)之間工藝信息相互獨(dú)立,存在信息孤島;化工企業(yè)的各層級(jí)管理系統(tǒng)間存在數(shù)據(jù)交換壁壘,給企業(yè)對(duì)于能耗以及碳排的監(jiān)管以及預(yù)測(cè)帶來困難;企業(yè)內(nèi)部各自獨(dú)立的系統(tǒng)均需要單獨(dú)維護(hù),運(yùn)維成本較高,軟硬件存在重復(fù)配置現(xiàn)象;多個(gè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)流程獨(dú)立且復(fù)雜,存在大量冗余接口和重復(fù)信息流;傳統(tǒng)管理方法大量依靠人工統(tǒng)計(jì)以及計(jì)算,難以實(shí)現(xiàn)對(duì)數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)、分析以及更進(jìn)一步的預(yù)測(cè)。
2、現(xiàn)有的技術(shù)可以采用常見的gan模型進(jìn)行能源化工企業(yè)能碳數(shù)據(jù)的預(yù)測(cè),但是gan模型容易出現(xiàn)的模式崩潰、梯度消失等缺陷,且原始數(shù)據(jù)集數(shù)據(jù)稀少,擴(kuò)充的生成數(shù)據(jù)質(zhì)量不高,導(dǎo)致訓(xùn)練得到的模型的檢測(cè)效果較差。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的就是為了減少模式崩潰、梯度消失等缺陷并提高生成數(shù)據(jù)的質(zhì)量而提供的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法。
2、本發(fā)明的目的可以通過以下技術(shù)方案來實(shí)現(xiàn):
3、一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,方法包括以下步驟:
4、s1、獲取能源化工企業(yè)各產(chǎn)物產(chǎn)量的歷史數(shù)據(jù)以及耗煤量、耗電量的歷史數(shù)據(jù);
5、s2、對(duì)s1獲取的數(shù)據(jù)進(jìn)行預(yù)處理,得到預(yù)處理后的數(shù)據(jù);
6、s3、對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到特征數(shù)據(jù);
7、s4、對(duì)特征數(shù)據(jù)計(jì)算協(xié)方差矩陣;
8、s5、求解協(xié)方差矩陣的特征值和特征向量;
9、s6、根據(jù)特征值的大小,選擇前k個(gè)最大的特征值對(duì)應(yīng)的特征向量作為主成分;
10、s7、主成分合成一個(gè)投影矩陣;
11、s8、基于投影矩陣將特征數(shù)據(jù)投影到由主成分定義的新空間中,得到投影后的數(shù)據(jù);
12、s9、對(duì)投影后的數(shù)據(jù)進(jìn)行序列化處理,得到序列數(shù)據(jù);
13、s10、將序列數(shù)據(jù)轉(zhuǎn)換為張量格式;
14、s11、將張量格式的數(shù)據(jù)輸入訓(xùn)練完成的預(yù)測(cè)診斷模型,得到預(yù)測(cè)診斷結(jié)果,所述訓(xùn)練完成的預(yù)測(cè)診斷模型由改進(jìn)的wgan模型、gru模型和shap模型組成,所述改進(jìn)的wgan模型用于產(chǎn)生生成樣本實(shí)現(xiàn)數(shù)據(jù)擴(kuò)充。
15、進(jìn)一步地,所述改進(jìn)的wgan模型的訓(xùn)練過程為:
16、a1、隨機(jī)初始化wgan網(wǎng)絡(luò)的生成器g和判別器d的參數(shù)。
17、a2、從真實(shí)數(shù)據(jù)分布中抽取一批真實(shí)樣本x;
18、a3、從先驗(yàn)噪聲分布中抽取一批噪聲z,并通過生成器生成一批初始的偽樣本g’(z);
19、a4、構(gòu)建判別器的總損失以更新判別器d的參數(shù),實(shí)現(xiàn)最大化wasserstein距離;
20、a5、固定判別器d的參數(shù),更新生成器g的參數(shù);
21、a6、生成更新參數(shù)后的偽樣本g(z),基于判別器d評(píng)估偽樣本g(z),判別器d輸出為d(g(z));
22、a7、構(gòu)建生成器的損失函數(shù),更新生成器g的參數(shù),實(shí)現(xiàn)最小化-d(g(z));
23、a8、重復(fù)a2~a7,交替訓(xùn)練判別器和生成器,直至生成樣本的質(zhì)量達(dá)到預(yù)定標(biāo)準(zhǔn)或者訓(xùn)練迭代次數(shù)達(dá)到預(yù)設(shè)的上限,此時(shí)停止訓(xùn)練,得到改進(jìn)的wgan模型,所述改進(jìn)的wgan模型獲取張量格式的數(shù)據(jù)后,輸出生成樣本,所述生成樣本用于訓(xùn)練gru模型。
24、進(jìn)一步地,所述判別器的總損失為:
25、
26、其中,是真實(shí)樣本x和偽樣本g(z)之間的插值,∈是從均勻分布u(0,1)中抽取的隨機(jī)數(shù),λ是梯度懲罰的超參數(shù),e表示下標(biāo)中指定分布的數(shù)學(xué)期望。
27、進(jìn)一步地,所述生成器的損失函數(shù)為;
28、lg=-e[d(g(z))]
29、其中,e表示下標(biāo)中指定分布的數(shù)學(xué)期望。
30、進(jìn)一步地,所述改進(jìn)的wgan模型的優(yōu)化過程目標(biāo)函數(shù)為:
31、
32、其中,e為下標(biāo)中指定分布的數(shù)學(xué)期望,pdata(x)為真實(shí)樣本x的分布;pz(z)為生成數(shù)據(jù)的分布;d(x)為判別器的判別函數(shù);g(z)為生成器生成的數(shù)據(jù),也就是偽樣本。
33、進(jìn)一步地,所述對(duì)s1獲取的數(shù)據(jù)進(jìn)行預(yù)處理的具體步驟為:
34、從s1獲取的數(shù)據(jù)中抽取需要的數(shù)據(jù),包括預(yù)測(cè)目標(biāo)變量和特征變量;
35、對(duì)抽取的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲取數(shù)據(jù)統(tǒng)計(jì)量;
36、針對(duì)抽取的數(shù)據(jù)中的缺失值,使用線性回歸模型對(duì)缺失值進(jìn)行預(yù)測(cè)填充;
37、對(duì)填充后的數(shù)據(jù)中的異常值以及重復(fù)值,采用直接刪除的方法進(jìn)行處理,得到預(yù)處理后的數(shù)據(jù)。
38、進(jìn)一步地,所述協(xié)方差矩陣具體為:
39、
40、其中,∑是協(xié)方差矩陣,n是樣本數(shù)量,xstd表示特征數(shù)據(jù)。
41、進(jìn)一步地,所述投影后的數(shù)據(jù)具體為:
42、y=xstdp
43、其中,y是投影后的數(shù)據(jù),p=[v1,v2,…,vk]是投影矩陣,v1,v2,…,vk是所選的主成分特征向量,xstd表示特征數(shù)據(jù)。
44、進(jìn)一步地,所述gru模型用于預(yù)測(cè)能源化工企業(yè)各產(chǎn)物產(chǎn)量數(shù)據(jù)和耗電量數(shù)據(jù)。
45、進(jìn)一步地,所述shap模型用于分析能源化工企業(yè)各產(chǎn)物產(chǎn)量數(shù)據(jù)和耗電量數(shù)據(jù)中的異常值。
46、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
47、本發(fā)明通過改進(jìn)傳統(tǒng)的gan模型,采用改進(jìn)的wgan模型結(jié)構(gòu),改進(jìn)的wgan模型采用在真實(shí)樣本和偽樣本之間的直線上計(jì)算梯度并懲罰其與1的偏差作為損失函數(shù)的一部分,滿足wasserstein距離的lipschitz連續(xù)性約束的同時(shí),通過改進(jìn)的wgan模型引入了梯度懲罰技術(shù),判別器的梯度進(jìn)行懲罰,使得判別器的梯度保持在一定范圍內(nèi),從而提高訓(xùn)練的穩(wěn)定性,再次基礎(chǔ)上基于改進(jìn)的wgan模型生成的數(shù)據(jù)樣本與原始數(shù)據(jù)樣本具有相似的分布特征,提高生成數(shù)據(jù)的質(zhì)量。
1.一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述改進(jìn)的wgan模型的訓(xùn)練過程為:
3.根據(jù)權(quán)利要求2所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述判別器的總損失為:
4.根據(jù)權(quán)利要求3所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述生成器的損失函數(shù)為;
5.根據(jù)權(quán)利要求4所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述改進(jìn)的wgan模型的優(yōu)化過程目標(biāo)函數(shù)為:
6.根據(jù)權(quán)利要求1所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述對(duì)s1獲取的數(shù)據(jù)進(jìn)行預(yù)處理的具體步驟為:
7.根據(jù)權(quán)利要求1所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述協(xié)方差矩陣具體為:
8.根據(jù)權(quán)利要求1所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述投影后的數(shù)據(jù)具體為:
9.根據(jù)權(quán)利要求1所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述gru模型用于預(yù)測(cè)能源化工企業(yè)各產(chǎn)物產(chǎn)量數(shù)據(jù)和耗電量數(shù)據(jù)。
10.根據(jù)權(quán)利要求1所述的一種能源化工企業(yè)能碳數(shù)據(jù)預(yù)測(cè)診斷方法,其特征在于,所述shap模型用于分析能源化工企業(yè)各產(chǎn)物產(chǎn)量數(shù)據(jù)和耗電量數(shù)據(jù)中的異常值。