欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法與流程

文檔序號(hào):11262310閱讀:412來(lái)源:國(guó)知局
一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法與流程

本發(fā)明涉及電力系統(tǒng)技術(shù)領(lǐng)域,特別是指一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法。



背景技術(shù):

電力企業(yè)(例如,供電公司)電費(fèi)回收管理工作是保證電力企業(yè)電費(fèi)正常回收、實(shí)現(xiàn)企業(yè)可持續(xù)發(fā)展的一項(xiàng)重要任務(wù)。隨著電力客戶用電量快速增加和外部壞境的不斷變化,電力企業(yè)面臨的電費(fèi)回收風(fēng)險(xiǎn)和不確定性也在逐年加大。

現(xiàn)有技術(shù)中,由于欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺,難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明要解決的技術(shù)問(wèn)題是提供一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法,以解決現(xiàn)有技術(shù)所存在的欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺,難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題。

為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法,包括:

獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù);

確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò),所述對(duì)抗生成網(wǎng)絡(luò)包括:生成器和判別器;其中,所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò),所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò);

將獲取的所述真實(shí)數(shù)據(jù)輸入判別器,判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力,通過(guò)生成器生成模擬數(shù)據(jù),將生成的模擬數(shù)據(jù)輸入到判別器判別真假,并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值,直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù),結(jié)束訓(xùn)練;

利用訓(xùn)練后的生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)。

進(jìn)一步地,所述獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括:

確定欠費(fèi)度量指標(biāo)體系;

根據(jù)確定的欠費(fèi)度量指標(biāo)體系,從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)。

進(jìn)一步地,所述欠費(fèi)度量指標(biāo)體系包括:非目標(biāo)指標(biāo)和目標(biāo)指標(biāo);

所述非目標(biāo)指標(biāo)包括:供電單位、行業(yè)類別、用電類別、電壓等級(jí)、負(fù)荷重要等級(jí)、運(yùn)行容量、停電標(biāo)識(shí)、是否三方協(xié)議、1月用電量、2月用電量、3月用電量、4月用電量、5月用電量、6月用電量、7月用電量、8月用電量、9月用電量、10月用電量、11月用電量、12月用電量、1月欠費(fèi)金額、2月欠費(fèi)金額、3月欠費(fèi)金額、4月欠費(fèi)金額、5月欠費(fèi)金額、6月欠費(fèi)金額、7月欠費(fèi)金額、8月欠費(fèi)金額、9月欠費(fèi)金額、10月欠費(fèi)金額、11月欠費(fèi)金額、12月欠費(fèi)金額;

所述目標(biāo)指標(biāo)包括:欠費(fèi)月個(gè)數(shù)。

進(jìn)一步地,所述根據(jù)確定的欠費(fèi)度量指標(biāo)體系,從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括:

根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的指標(biāo),從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù),得到每個(gè)指標(biāo)對(duì)應(yīng)的指標(biāo)值;

判斷每個(gè)指標(biāo)值是否有錯(cuò)誤,若某個(gè)指標(biāo)值有錯(cuò)誤,則刪除有錯(cuò)誤的指標(biāo)值;

判斷每個(gè)指標(biāo)值是否空缺,若某個(gè)指標(biāo)值空缺,則以當(dāng)前指標(biāo)對(duì)應(yīng)的所有指標(biāo)值的平均數(shù)補(bǔ)足。

進(jìn)一步地,在通過(guò)生成器生成模擬數(shù)據(jù),將生成的模擬數(shù)據(jù)和所述真實(shí)數(shù)據(jù)輸入所述判別器來(lái)訓(xùn)練所述判別器之前,所述方法還包括:

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理;

所述對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理包括:

將所述真實(shí)數(shù)據(jù)中的na值替換成0;

將所述真實(shí)數(shù)據(jù)的數(shù)據(jù)類型轉(zhuǎn)換為num/int類型;

剔除所述真實(shí)數(shù)據(jù)中的inf值;

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行歸一化處理。

進(jìn)一步地,所述確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)包括:

確定生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu),所述網(wǎng)絡(luò)結(jié)構(gòu)包括:輸入層、卷積層和輸出層;

確定生成器和判別器的卷積層卷集核大小、卷積核的滑動(dòng)步長(zhǎng);

確定生成器和判別器的損失函數(shù)。

進(jìn)一步地,所述卷積層卷集核大小為2*2。

進(jìn)一步地,所述非目標(biāo)指標(biāo)的數(shù)目可以表示為非1的兩個(gè)數(shù)的乘積形式;

若所述非目標(biāo)指標(biāo)的數(shù)目不可以表示為非1的兩個(gè)數(shù)的乘積形式,則添加1個(gè)或多個(gè)噪聲指標(biāo),使所述非目標(biāo)指標(biāo)的數(shù)目可以表示為非1的兩個(gè)數(shù)的乘積形式。

進(jìn)一步地,所述判別器的損失函數(shù)表示為:

d_loss=l(d)=-ex~pr[d(x)]+ex~pg[d(x)]

d_loss_real=-ex~pr[d(x)];

d_loss_fake=ex~pg[d(x)]

其中,d_loss、l(d)為判別器的損失函數(shù);pr表示真實(shí)數(shù)據(jù);pg表示由生成器生成的模擬數(shù)據(jù);x~pr中的x表示真實(shí)數(shù)據(jù),x~pg中的x表示模擬數(shù)據(jù),d(x)表示將x輸入判別器的判別結(jié)果;d_loss_real表示真實(shí)數(shù)據(jù)輸入到判別器中的判別結(jié)果和預(yù)設(shè)的第一預(yù)期結(jié)果之間的交叉熵;d_loss_fake表示生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果之間的交叉熵;

所述生成器的損失函數(shù)表示為:

g_loss=l(g)=-ex~pg[d(x)]

其中,g_loss、l(g)為生成器的損失函數(shù),表示生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果之間的交叉熵;pg表示由生成器生成的模擬數(shù)據(jù);x~pg中的x表示模擬數(shù)據(jù),d(x)表示將x輸入判別器的判別結(jié)果。

進(jìn)一步地,所述將獲取的所述真實(shí)數(shù)據(jù)輸入判別器,判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力,通過(guò)生成器生成模擬數(shù)據(jù),將生成的模擬數(shù)據(jù)輸入到判別器判別真假,并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值,直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù),結(jié)束訓(xùn)練包括:

s1,將所述真實(shí)數(shù)據(jù)輸入到所述判別器中,所述判別器學(xué)習(xí)真實(shí)數(shù)據(jù)的特征,判別真實(shí)數(shù)據(jù)真假,根據(jù)判別結(jié)果與預(yù)設(shè)的第一預(yù)期結(jié)果計(jì)算交叉熵d_loss_real;

s2,將隨機(jī)噪聲輸入到所述生成器中生成模擬數(shù)據(jù),將生成器生成的模擬數(shù)據(jù)輸入到所述判別器中,所述判別器學(xué)習(xí)模擬數(shù)據(jù)的特征,判別模擬數(shù)據(jù)真假,根據(jù)判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果計(jì)算生成器的損失函數(shù)值;

s3,根據(jù)s2的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果計(jì)算交叉熵d_loss_fake,對(duì)d_loss_fake和d_loss_real求和,得到判別器的損失函數(shù)值,基于生成器的損失函數(shù)值和判別器的損失函數(shù)值利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低生成器的損失函數(shù)值和判別器的損失函數(shù)值;

s4,s2和s3交替進(jìn)行,直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù),結(jié)束訓(xùn)練。

本發(fā)明的上述技術(shù)方案的有益效果如下:

上述方案中;其中,所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò),所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò),依據(jù)這兩種卷積神經(jīng)網(wǎng)絡(luò)搭建對(duì)抗學(xué)習(xí)模式,將獲取的真實(shí)數(shù)據(jù)輸入判別器來(lái)訓(xùn)練判別器判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力;通過(guò)生成器生成模擬數(shù)據(jù)然后輸入到判別器判別真假,并進(jìn)行自學(xué)習(xí)訓(xùn)練使生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù),然后,利用生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)進(jìn)行欠費(fèi)預(yù)測(cè),能夠解決欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺,難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題,從而有效輔助電力企業(yè)制定用電和電費(fèi)預(yù)警策略,且dcgan作為有監(jiān)督學(xué)習(xí)的特征提取器,生成的模擬數(shù)據(jù)有助于提高欠費(fèi)預(yù)測(cè)的準(zhǔn)確率。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例提供的電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的流程示意圖;

圖2為本發(fā)明實(shí)施例提供的對(duì)抗生成網(wǎng)絡(luò)中生成器和判別器的對(duì)抗學(xué)習(xí)的原理示意圖。

具體實(shí)施方式

為使本發(fā)明要解決的技術(shù)問(wèn)題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。

本發(fā)明針對(duì)現(xiàn)有的欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺,難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題,提供一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法。

如圖1所示,本發(fā)明實(shí)施例提供的電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法,包括:

s101,獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù);

s102,確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)(deepconvolutionalgenerativeadversarialnerworks,dcgan),所述對(duì)抗生成網(wǎng)絡(luò)包括:生成器和判別器;其中,所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò),所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò);

s103,將獲取的所述真實(shí)數(shù)據(jù)輸入判別器,判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力,通過(guò)生成器生成模擬數(shù)據(jù),將生成的模擬數(shù)據(jù)輸入到判別器判別真假,并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值,直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù),結(jié)束訓(xùn)練;

s104,利用訓(xùn)練后的生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)。

本發(fā)明實(shí)施例所述的電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法;其中,所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò),所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò),依據(jù)這兩種卷積神經(jīng)網(wǎng)絡(luò)搭建對(duì)抗學(xué)習(xí)模式,將獲取的真實(shí)數(shù)據(jù)輸入判別器來(lái)訓(xùn)練判別器判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力;通過(guò)生成器生成模擬數(shù)據(jù)然后輸入到判別器判別真假,并進(jìn)行自學(xué)習(xí)訓(xùn)練使生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù),然后,利用生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)進(jìn)行欠費(fèi)預(yù)測(cè),能夠解決欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺,難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題,從而有效輔助電力企業(yè)制定用電和電費(fèi)預(yù)警策略,且dcgan作為有監(jiān)督學(xué)習(xí)的特征提取器,生成的模擬數(shù)據(jù)有助于提高欠費(fèi)預(yù)測(cè)的準(zhǔn)確率。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中,進(jìn)一步地,所述獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括:

確定欠費(fèi)度量指標(biāo)體系;

根據(jù)確定的欠費(fèi)度量指標(biāo)體系,從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)。

本實(shí)施例中,為了獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù),需先確定欠費(fèi)度量指標(biāo)體系,然后根據(jù)確定的欠費(fèi)度量指標(biāo)體系,從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)(real_data)。

本實(shí)施例中,在預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中,通過(guò)對(duì)82472個(gè)大工業(yè)用戶的電費(fèi)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)在2015年1月至2015年12月這12個(gè)月的735522萬(wàn)條電費(fèi)記錄中僅有12471條有欠費(fèi)記錄,所述12471條有欠費(fèi)記錄包含了有殘缺的欠費(fèi)記錄。本發(fā)明實(shí)施例的目的就是增加欠費(fèi)數(shù)據(jù),平衡欠費(fèi)數(shù)據(jù)和非欠費(fèi)數(shù)據(jù)的比例,讓欠費(fèi)預(yù)測(cè)模型能更好的學(xué)習(xí)到欠費(fèi)數(shù)據(jù)的特征。

本實(shí)施例中,所述預(yù)設(shè)的數(shù)據(jù)系統(tǒng)可以為某省國(guó)家電網(wǎng)電力用戶營(yíng)銷數(shù)據(jù)庫(kù)系統(tǒng)。

本實(shí)施例中,獲取到的735522電費(fèi)記錄包含了1-12個(gè)月的用電特征,而其中只有12471條欠費(fèi)記錄,那么同為預(yù)測(cè)和影響因子的欠費(fèi)數(shù)據(jù)成為稀缺數(shù)據(jù)。在利用監(jiān)督學(xué)習(xí)時(shí)為了有效預(yù)測(cè)用戶欠費(fèi)情況,可以確定每個(gè)月的每個(gè)用戶的欠費(fèi)度量指標(biāo);所述欠費(fèi)度量指標(biāo)可以分別非目標(biāo)指標(biāo)和目標(biāo)指標(biāo);由所述非目標(biāo)指標(biāo)和目標(biāo)指標(biāo)構(gòu)成欠費(fèi)度量指標(biāo)體系。

本實(shí)施例中,所述非目標(biāo)指標(biāo)可以包括:供電單位、行業(yè)類別、用電類別、電壓等級(jí)、負(fù)荷重要等級(jí)、運(yùn)行容量、停電標(biāo)識(shí)、是否三方協(xié)議、1月用電量、2月用電量、3月用電量、4月用電量、5月用電量、6月用電量、7月用電量、8月用電量、9月用電量、10月用電量、11月用電量、12月用電量、1月欠費(fèi)金額、2月欠費(fèi)金額、3月欠費(fèi)金額、4月欠費(fèi)金額、5月欠費(fèi)金額、6月欠費(fèi)金額、7月欠費(fèi)金額、8月欠費(fèi)金額、9月欠費(fèi)金額、10月欠費(fèi)金額、11月欠費(fèi)金額、12月欠費(fèi)金額。本實(shí)施例中,所述目標(biāo)指標(biāo)包括:欠費(fèi)月個(gè)數(shù),在實(shí)際操作中,可以根據(jù)實(shí)際情況來(lái)決定目標(biāo)指標(biāo)的選擇。本實(shí)施例中欠費(fèi)數(shù)據(jù)是研究重點(diǎn),且欠費(fèi)指標(biāo)1-12月可以推出欠費(fèi)月個(gè)數(shù),所以將欠費(fèi)月個(gè)數(shù)確定為目標(biāo)指標(biāo)。

本實(shí)施例中,根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的33個(gè)指標(biāo),從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù),即:real_data包括:12471條欠費(fèi)數(shù)據(jù),real_data的維度為12471*33。對(duì)real_data作初步分析,發(fā)現(xiàn)每次欠費(fèi)金額分布在0-100萬(wàn),為便于欠費(fèi)預(yù)測(cè)模型的收斂,將欠費(fèi)金額以千元計(jì),并保留一位小數(shù)。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中,進(jìn)一步地,所述根據(jù)確定的欠費(fèi)度量指標(biāo)體系,從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括:

根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的指標(biāo),從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù),得到每個(gè)指標(biāo)對(duì)應(yīng)的指標(biāo)值;

判斷每個(gè)指標(biāo)值是否有錯(cuò)誤,若某個(gè)指標(biāo)值有錯(cuò)誤,則刪除有錯(cuò)誤的指標(biāo)值;

判斷每個(gè)指標(biāo)值是否空缺,若某個(gè)指標(biāo)值空缺,則以當(dāng)前指標(biāo)對(duì)應(yīng)的所有指標(biāo)值的平均數(shù)補(bǔ)足。

本實(shí)施例中,由于所述12471條有欠費(fèi)記錄包含了有殘缺的欠費(fèi)記錄,在根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的指標(biāo),從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù),得到每個(gè)指標(biāo)對(duì)應(yīng)的指標(biāo)值后,需判斷每個(gè)指標(biāo)值是否有錯(cuò)誤,若某個(gè)指標(biāo)值有錯(cuò)誤,則刪除有錯(cuò)誤的指標(biāo)值;判斷每個(gè)指標(biāo)值是否空缺,若某個(gè)指標(biāo)值空缺,則以當(dāng)前指標(biāo)對(duì)應(yīng)的所有指標(biāo)值的平均數(shù)補(bǔ)足,這樣,可以得到完整的真實(shí)數(shù)據(jù)real_data,該過(guò)程并不改變r(jià)eal_data的維度,所述real_data的維度依然是12471*33。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中,進(jìn)一步地,在通過(guò)生成器生成模擬數(shù)據(jù),將生成的模擬數(shù)據(jù)和所述真實(shí)數(shù)據(jù)輸入所述判別器來(lái)訓(xùn)練所述判別器之前,所述方法還包括:

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理;

所述對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理包括:

將所述真實(shí)數(shù)據(jù)中的na值替換成0;

將所述真實(shí)數(shù)據(jù)的數(shù)據(jù)類型轉(zhuǎn)換為num/int類型;

剔除所述真實(shí)數(shù)據(jù)中的inf值;

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行歸一化處理。

本實(shí)施例中,將所述真實(shí)數(shù)據(jù)中的na值替換成0;將所述真實(shí)數(shù)據(jù)的數(shù)據(jù)類型轉(zhuǎn)換為num/int類型,例如,對(duì)于文字型指標(biāo),如行業(yè)類別、供電單位等,轉(zhuǎn)換成相應(yīng)的數(shù)值(num)指標(biāo);剔除所述真實(shí)數(shù)據(jù)中的無(wú)限大值(inf)值。

本實(shí)施例中,接著對(duì)真實(shí)數(shù)據(jù)進(jìn)行歸一化處理,歸一化就是要把真實(shí)數(shù)據(jù)(通過(guò)某種算法)限制在需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保證程序運(yùn)行時(shí)收斂加快。歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計(jì)分布性。對(duì)真實(shí)數(shù)據(jù)做歸一化處理,消除不同數(shù)據(jù)量級(jí)的影響。具體的,對(duì)真實(shí)數(shù)據(jù)進(jìn)行歸一化處理,將各個(gè)指標(biāo)值壓縮到[0,100]之間。

本實(shí)施例中,可以利用公式:yi=(xi-xmin)/(xmax-xmin)對(duì)各指標(biāo)值做歸一化處理,免去量級(jí)的影響;其中,xi、yi分別表示處理前后的指標(biāo)值,xmin表示該項(xiàng)指標(biāo)的最小值,xmax表示該項(xiàng)指標(biāo)的最大值。

本實(shí)施例中,目標(biāo)指標(biāo)“欠費(fèi)月個(gè)數(shù)”的數(shù)據(jù)經(jīng)過(guò)統(tǒng)計(jì)在1-7,不需做處理。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中,進(jìn)一步地,所述確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)包括:

確定生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu),所述網(wǎng)絡(luò)結(jié)構(gòu)包括:輸入層、卷積層和輸出層;

確定生成器和判別器的卷積層卷集核大小、卷積核的滑動(dòng)步長(zhǎng);

確定生成器和判別器的損失函數(shù)。

本實(shí)施例中,為了適應(yīng)電力數(shù)據(jù)的維度,設(shè)計(jì)了獨(dú)特的對(duì)抗生成網(wǎng)絡(luò)參數(shù),例如:

1)去除激活層輸出,生成器和判別器的損失函數(shù)不取對(duì)數(shù)處理,可以有效加速模型收斂;

2)將欠費(fèi)度量指標(biāo)體系中的32個(gè)非目標(biāo)指標(biāo)的維度轉(zhuǎn)換成4*8,方便對(duì)抗生成網(wǎng)絡(luò)的判別器和生成器輸入數(shù)據(jù)到卷積層;

3)將判別器和生成器的卷積層卷積核設(shè)置成2*2,以突出每個(gè)指標(biāo)的重要性;

4)所述非目標(biāo)指標(biāo)的數(shù)目盡量可以表示為非1的兩個(gè)數(shù)的乘積形式;若所述非目標(biāo)指標(biāo)的數(shù)目不可以表示為非1的兩個(gè)數(shù)的乘積形式,則添加1個(gè)或多個(gè)噪聲指標(biāo),使所述非目標(biāo)指標(biāo)的數(shù)目可以表示為非1的兩個(gè)數(shù)的乘積形式;例如,如果非目標(biāo)指標(biāo)的數(shù)目為37這種質(zhì)數(shù),就不能運(yùn)用生成器和判別器的卷積訓(xùn)練模式,所以這時(shí)需要增加無(wú)意義的噪聲指標(biāo)以方便訓(xùn)練,增加無(wú)意義噪聲指標(biāo)轉(zhuǎn)換之后才能形成一個(gè)n*m的形式,才可以使用卷積神經(jīng)網(wǎng)絡(luò),例如,增加1個(gè)無(wú)意義噪聲指標(biāo),得到的指標(biāo)數(shù)為38,38可以表示為2*19。

接著,描述判別器的參數(shù)設(shè)置,具體的:

所述判別器的網(wǎng)絡(luò)結(jié)構(gòu)包括:輸入層、卷積層和輸出層,具體包括:1層輸入層、3層卷積層和1層輸出層,卷積層卷集核大小為2*2,,以突出每個(gè)指標(biāo)的重要性,卷積核的滑動(dòng)步長(zhǎng)為[1221],通過(guò)卷積核的滑動(dòng)步長(zhǎng)可以替代層池化層進(jìn)行降維,邊界處理方式為越過(guò)邊緣取樣,每一批數(shù)據(jù)大小為64條數(shù)據(jù)。由于目標(biāo)指標(biāo)的維度為1-7,設(shè)置輸出層的維度為[64,1,1,7]方便與卷積層進(jìn)行全連接操作,輸出層的輸出為64*1*1*7個(gè)值。

生成器的輸入為維度7的隨機(jī)噪聲,卷積層卷集核大小為2*2,以突出每個(gè)指標(biāo)的重要性,卷集核的滑動(dòng)步長(zhǎng)為[1221],每一批數(shù)據(jù)大小為64數(shù)據(jù),使用反卷積網(wǎng)絡(luò)進(jìn)行增加維度。

所述判別器的損失函數(shù)d_loss為l(d)=-ex~pr[d(x)]+ex~pg[d(x)]

其中,pr表示真實(shí)數(shù)據(jù),pg表示由生成器產(chǎn)生的模擬數(shù)據(jù),對(duì)于x~pg/x~pr,x有不同的含義,例如,x~pr中的x表示真實(shí)數(shù)據(jù),x~pg中的x表示模擬數(shù)據(jù),d(x)表示將x輸入判別器的判別結(jié)果;d_loss_real=-ex~pr[d(x)]表示是真實(shí)數(shù)據(jù)輸入到判別器中的判別結(jié)果和第一預(yù)期結(jié)果(例如,預(yù)期的為1的結(jié)果)之間的交叉熵,d_loss_fake=ex~pg[d(x)]是生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果和第二預(yù)期結(jié)果(例如,預(yù)期為0的結(jié)果)之間的交叉熵,判別器的損失函數(shù)d_loss是d_loss_fake和d_loss_real之和。判別器的目的是經(jīng)過(guò)不斷的訓(xùn)練自學(xué)習(xí)來(lái)最小化判別器的損失函數(shù)值。

然后,描述生成器的參數(shù)設(shè)置,具體的:

所述生成器的網(wǎng)絡(luò)結(jié)構(gòu)包括:輸入層、卷積層和輸出層,具體包括:1層輸入層、3層反卷積層和1層輸出層,卷積層卷集核大小為2*2,以突出每個(gè)指標(biāo)的重要性,卷集核的滑動(dòng)步長(zhǎng)為[1221],邊界處理方式為越過(guò)邊緣取樣,每一批數(shù)據(jù)大小為64條數(shù)據(jù)。由于目標(biāo)指標(biāo)的維度為1-7,設(shè)置的輸入的隨機(jī)噪聲z的維度為[64,1,1,7]。

所述生成器的損失函數(shù)g_loss為l(g)=-ex~pg[d(x)];

其中,g_loss表示生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果(例如,預(yù)期為1的結(jié)果)之間的交叉熵;pg表示由生成器生成的模擬數(shù)據(jù);x~pg中的x表示模擬數(shù)據(jù),d(x)表示將x輸入判別器的判別結(jié)果。

基于生成器的損失函數(shù)值和判別器的損失函數(shù)值利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低生成器的損失函數(shù)值和判別器的損失函數(shù)值,最終目標(biāo)是要最小化d_loss和g_loss。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中,進(jìn)一步地,所述將獲取的所述真實(shí)數(shù)據(jù)輸入判別器,判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力,通過(guò)生成器生成模擬數(shù)據(jù),將生成的模擬數(shù)據(jù)輸入到判別器判別真假,并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值,直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù),結(jié)束訓(xùn)練包括:

s1,將所述真實(shí)數(shù)據(jù)輸入到所述判別器中,所述判別器學(xué)習(xí)真實(shí)數(shù)據(jù)的特征,判別真實(shí)數(shù)據(jù)真假,根據(jù)判別結(jié)果與預(yù)設(shè)的第一預(yù)期結(jié)果計(jì)算交叉熵d_loss_real;

s2,將隨機(jī)噪聲輸入到所述生成器中生成模擬數(shù)據(jù),將生成器生成的模擬數(shù)據(jù)輸入到所述判別器中,所述判別器學(xué)習(xí)模擬數(shù)據(jù)的特征,判別模擬數(shù)據(jù)真假,根據(jù)判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果計(jì)算生成器的損失函數(shù)值;

s3,根據(jù)s2的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果計(jì)算交叉熵d_loss_fake,對(duì)d_loss_fake和d_loss_real求和,得到判別器的損失函數(shù)值,基于生成器的損失函數(shù)值和判別器的損失函數(shù)值利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低生成器的損失函數(shù)值和判別器的損失函數(shù)值;

s4,s2和s3交替進(jìn)行,直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù),結(jié)束訓(xùn)練。

本實(shí)施例中,除了上述設(shè)置的參數(shù),還需設(shè)置最大訓(xùn)練次數(shù),每次訓(xùn)練都會(huì)有d_loss和g_loss產(chǎn)生,當(dāng)判別器和生成器的損失函數(shù)值達(dá)到預(yù)設(shè)值(例如,0.4)或者訓(xùn)練輪數(shù)大于1000時(shí)結(jié)束訓(xùn)練,并用訓(xùn)練好的生成器輸入隨機(jī)噪聲z(生成器的輸入數(shù)據(jù))生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)。生成器生成的模擬數(shù)據(jù)的數(shù)量一般不超過(guò)真實(shí)數(shù)據(jù)的數(shù)量,如果想要生成更多的模擬數(shù)據(jù)可以重新訓(xùn)練dcgan,完成另一套對(duì)抗學(xué)習(xí)模型(即:對(duì)抗生成網(wǎng)絡(luò))然后生成模擬數(shù)據(jù)。

本實(shí)施例中,生成器的損失函數(shù)值和判別器的損失函數(shù)值越小,表示判別器和生成器能力越強(qiáng),但是實(shí)際上這兩個(gè)是互相矛盾的,生成器能力強(qiáng)了,判別器就會(huì)判別不出真假,他的損失函數(shù)就會(huì)升高,所以最終需要的是一個(gè)平衡值,不能一方偏高另一方偏低這樣,因?yàn)?,預(yù)設(shè)值可以設(shè)為0.4,在實(shí)際應(yīng)用中,預(yù)設(shè)值可以根據(jù)實(shí)際情況決定,二者的預(yù)設(shè)值可以相同也可以不同。

本實(shí)施例中,對(duì)抗生成網(wǎng)絡(luò)對(duì)抗學(xué)習(xí)之后生成的模擬數(shù)據(jù)需進(jìn)行逆向歸一化,將其恢復(fù)到原來(lái)的數(shù)據(jù)值域中,供使用者做監(jiān)督學(xué)習(xí)模型訓(xùn)練。

如圖2所示,本實(shí)施例中,對(duì)抗生成網(wǎng)絡(luò)中生成器和判別器的對(duì)抗學(xué)習(xí)(訓(xùn)練)的具體步驟可以包括:

a11,將真實(shí)數(shù)據(jù)real_data輸入到判別器中,判別器學(xué)習(xí)真實(shí)數(shù)據(jù)的特征,判別其真假,根據(jù)判別結(jié)果與預(yù)設(shè)的第一預(yù)期結(jié)果計(jì)算d_loss_real;

a12,將隨機(jī)噪聲z輸入到生成器中,生成器生成模擬數(shù)據(jù)analog_data,模擬數(shù)據(jù)analog_data進(jìn)入判別器中,判別器學(xué)習(xí)模擬數(shù)據(jù)analog_data的特征,并判別其真假,根據(jù)判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果計(jì)算g_loss;

a13,根據(jù)a12的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果計(jì)算d_loss_fake,判別器的d_loss=d_loss_fake+d_loss_real,利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低d_loss和g_loss;

a14,a12和a13交替進(jìn)行,生成器的目的是生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)analog_data,讓判別器辨別不出來(lái)提高他的d_loss_fake;判別器的目的是能夠辨別模擬數(shù)據(jù)analog_data的真假,降低判別器的d_loss;

a15,當(dāng)判別器的損失函數(shù)值和生成器的的損失函數(shù)值達(dá)到0.4,或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)1000,結(jié)束訓(xùn)練。

a16,利用訓(xùn)練后的生成器生成所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)analog_data。

需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。

以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
河源市| 蓬莱市| 遂川县| 哈密市| 沂南县| 泊头市| 库尔勒市| 托里县| 健康| 沁源县| 保定市| 张家口市| 宾阳县| 新宁县| 乌审旗| 东乡县| 阿克| 林甸县| 波密县| 柳林县| 方正县| 郎溪县| 马龙县| 石门县| 苍南县| 谷城县| 连城县| 澜沧| 莱阳市| 扎赉特旗| 神池县| 新化县| 温州市| 郯城县| 合川市| 红河县| 同仁县| 达孜县| 永善县| 武宁县| 平凉市|