一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法與流程

文檔序號(hào)：11262310閱讀：412來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及電力系統(tǒng)技術(shù)領(lǐng)域，特別是指一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法。

背景技術(shù)：

電力企業(yè)(例如，供電公司)電費(fèi)回收管理工作是保證電力企業(yè)電費(fèi)正常回收、實(shí)現(xiàn)企業(yè)可持續(xù)發(fā)展的一項(xiàng)重要任務(wù)。隨著電力客戶用電量快速增加和外部壞境的不斷變化，電力企業(yè)面臨的電費(fèi)回收風(fēng)險(xiǎn)和不確定性也在逐年加大。

現(xiàn)有技術(shù)中，由于欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺，難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明要解決的技術(shù)問(wèn)題是提供一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法，以解決現(xiàn)有技術(shù)所存在的欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺，難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題。

為解決上述技術(shù)問(wèn)題，本發(fā)明實(shí)施例提供一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法，包括：

獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)；

確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)，所述對(duì)抗生成網(wǎng)絡(luò)包括：生成器和判別器；其中，所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò)，所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò)；

將獲取的所述真實(shí)數(shù)據(jù)輸入判別器，判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力，通過(guò)生成器生成模擬數(shù)據(jù)，將生成的模擬數(shù)據(jù)輸入到判別器判別真假，并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值，直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值，或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)，結(jié)束訓(xùn)練；

利用訓(xùn)練后的生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)。

進(jìn)一步地，所述獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括：

確定欠費(fèi)度量指標(biāo)體系；

根據(jù)確定的欠費(fèi)度量指標(biāo)體系，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)。

進(jìn)一步地，所述欠費(fèi)度量指標(biāo)體系包括：非目標(biāo)指標(biāo)和目標(biāo)指標(biāo)；

所述非目標(biāo)指標(biāo)包括：供電單位、行業(yè)類別、用電類別、電壓等級(jí)、負(fù)荷重要等級(jí)、運(yùn)行容量、停電標(biāo)識(shí)、是否三方協(xié)議、1月用電量、2月用電量、3月用電量、4月用電量、5月用電量、6月用電量、7月用電量、8月用電量、9月用電量、10月用電量、11月用電量、12月用電量、1月欠費(fèi)金額、2月欠費(fèi)金額、3月欠費(fèi)金額、4月欠費(fèi)金額、5月欠費(fèi)金額、6月欠費(fèi)金額、7月欠費(fèi)金額、8月欠費(fèi)金額、9月欠費(fèi)金額、10月欠費(fèi)金額、11月欠費(fèi)金額、12月欠費(fèi)金額；

所述目標(biāo)指標(biāo)包括：欠費(fèi)月個(gè)數(shù)。

進(jìn)一步地，所述根據(jù)確定的欠費(fèi)度量指標(biāo)體系，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括：

根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的指標(biāo)，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)，得到每個(gè)指標(biāo)對(duì)應(yīng)的指標(biāo)值；

判斷每個(gè)指標(biāo)值是否有錯(cuò)誤，若某個(gè)指標(biāo)值有錯(cuò)誤，則刪除有錯(cuò)誤的指標(biāo)值；

判斷每個(gè)指標(biāo)值是否空缺，若某個(gè)指標(biāo)值空缺，則以當(dāng)前指標(biāo)對(duì)應(yīng)的所有指標(biāo)值的平均數(shù)補(bǔ)足。

進(jìn)一步地，在通過(guò)生成器生成模擬數(shù)據(jù)，將生成的模擬數(shù)據(jù)和所述真實(shí)數(shù)據(jù)輸入所述判別器來(lái)訓(xùn)練所述判別器之前，所述方法還包括：

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理；

所述對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理包括：

將所述真實(shí)數(shù)據(jù)中的na值替換成0；

將所述真實(shí)數(shù)據(jù)的數(shù)據(jù)類型轉(zhuǎn)換為num/int類型；

剔除所述真實(shí)數(shù)據(jù)中的inf值；

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行歸一化處理。

進(jìn)一步地，所述確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)包括：

確定生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)，所述網(wǎng)絡(luò)結(jié)構(gòu)包括：輸入層、卷積層和輸出層；

確定生成器和判別器的卷積層卷集核大小、卷積核的滑動(dòng)步長(zhǎng)；

確定生成器和判別器的損失函數(shù)。

進(jìn)一步地，所述卷積層卷集核大小為2*2。

進(jìn)一步地，所述非目標(biāo)指標(biāo)的數(shù)目可以表示為非1的兩個(gè)數(shù)的乘積形式；

若所述非目標(biāo)指標(biāo)的數(shù)目不可以表示為非1的兩個(gè)數(shù)的乘積形式，則添加1個(gè)或多個(gè)噪聲指標(biāo)，使所述非目標(biāo)指標(biāo)的數(shù)目可以表示為非1的兩個(gè)數(shù)的乘積形式。

進(jìn)一步地，所述判別器的損失函數(shù)表示為：

d_loss＝l(d)＝-ex～pr[d(x)]+ex～pg[d(x)]

d_loss_real＝-ex～pr[d(x)]；

d_loss_fake＝ex～pg[d(x)]

其中，d_loss、l(d)為判別器的損失函數(shù)；pr表示真實(shí)數(shù)據(jù)；pg表示由生成器生成的模擬數(shù)據(jù)；x～pr中的x表示真實(shí)數(shù)據(jù)，x～pg中的x表示模擬數(shù)據(jù)，d(x)表示將x輸入判別器的判別結(jié)果；d_loss_real表示真實(shí)數(shù)據(jù)輸入到判別器中的判別結(jié)果和預(yù)設(shè)的第一預(yù)期結(jié)果之間的交叉熵；d_loss_fake表示生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果之間的交叉熵；

所述生成器的損失函數(shù)表示為：

g_loss＝l(g)＝-ex～pg[d(x)]

其中，g_loss、l(g)為生成器的損失函數(shù)，表示生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果之間的交叉熵；pg表示由生成器生成的模擬數(shù)據(jù)；x～pg中的x表示模擬數(shù)據(jù)，d(x)表示將x輸入判別器的判別結(jié)果。

進(jìn)一步地，所述將獲取的所述真實(shí)數(shù)據(jù)輸入判別器，判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力，通過(guò)生成器生成模擬數(shù)據(jù)，將生成的模擬數(shù)據(jù)輸入到判別器判別真假，并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值，直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值，或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)，結(jié)束訓(xùn)練包括：

s1，將所述真實(shí)數(shù)據(jù)輸入到所述判別器中，所述判別器學(xué)習(xí)真實(shí)數(shù)據(jù)的特征，判別真實(shí)數(shù)據(jù)真假，根據(jù)判別結(jié)果與預(yù)設(shè)的第一預(yù)期結(jié)果計(jì)算交叉熵d_loss_real；

s2，將隨機(jī)噪聲輸入到所述生成器中生成模擬數(shù)據(jù)，將生成器生成的模擬數(shù)據(jù)輸入到所述判別器中，所述判別器學(xué)習(xí)模擬數(shù)據(jù)的特征，判別模擬數(shù)據(jù)真假，根據(jù)判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果計(jì)算生成器的損失函數(shù)值；

s3，根據(jù)s2的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果計(jì)算交叉熵d_loss_fake，對(duì)d_loss_fake和d_loss_real求和，得到判別器的損失函數(shù)值，基于生成器的損失函數(shù)值和判別器的損失函數(shù)值利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低生成器的損失函數(shù)值和判別器的損失函數(shù)值；

s4，s2和s3交替進(jìn)行，直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值，或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)，結(jié)束訓(xùn)練。

本發(fā)明的上述技術(shù)方案的有益效果如下：

上述方案中；其中，所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò)，所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò)，依據(jù)這兩種卷積神經(jīng)網(wǎng)絡(luò)搭建對(duì)抗學(xué)習(xí)模式，將獲取的真實(shí)數(shù)據(jù)輸入判別器來(lái)訓(xùn)練判別器判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力；通過(guò)生成器生成模擬數(shù)據(jù)然后輸入到判別器判別真假，并進(jìn)行自學(xué)習(xí)訓(xùn)練使生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)，然后，利用生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)進(jìn)行欠費(fèi)預(yù)測(cè)，能夠解決欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺，難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題，從而有效輔助電力企業(yè)制定用電和電費(fèi)預(yù)警策略，且dcgan作為有監(jiān)督學(xué)習(xí)的特征提取器，生成的模擬數(shù)據(jù)有助于提高欠費(fèi)預(yù)測(cè)的準(zhǔn)確率。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例提供的電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的流程示意圖；

圖2為本發(fā)明實(shí)施例提供的對(duì)抗生成網(wǎng)絡(luò)中生成器和判別器的對(duì)抗學(xué)習(xí)的原理示意圖。

具體實(shí)施方式

為使本發(fā)明要解決的技術(shù)問(wèn)題、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。

本發(fā)明針對(duì)現(xiàn)有的欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺，難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題，提供一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法。

如圖1所示，本發(fā)明實(shí)施例提供的電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法，包括：

s101，獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)；

s102，確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)(deepconvolutionalgenerativeadversarialnerworks，dcgan)，所述對(duì)抗生成網(wǎng)絡(luò)包括：生成器和判別器；其中，所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò)，所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò)；

s103，將獲取的所述真實(shí)數(shù)據(jù)輸入判別器，判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力，通過(guò)生成器生成模擬數(shù)據(jù)，將生成的模擬數(shù)據(jù)輸入到判別器判別真假，并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值，直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值，或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)，結(jié)束訓(xùn)練；

s104，利用訓(xùn)練后的生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)。

本發(fā)明實(shí)施例所述的電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法；其中，所述判別器是一種卷積神經(jīng)網(wǎng)絡(luò)，所述生成器是一種反卷積神經(jīng)網(wǎng)絡(luò)，依據(jù)這兩種卷積神經(jīng)網(wǎng)絡(luò)搭建對(duì)抗學(xué)習(xí)模式，將獲取的真實(shí)數(shù)據(jù)輸入判別器來(lái)訓(xùn)練判別器判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力；通過(guò)生成器生成模擬數(shù)據(jù)然后輸入到判別器判別真假，并進(jìn)行自學(xué)習(xí)訓(xùn)練使生成器生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)，然后，利用生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)進(jìn)行欠費(fèi)預(yù)測(cè)，能夠解決欠費(fèi)數(shù)據(jù)不準(zhǔn)確以及欠費(fèi)數(shù)據(jù)稀缺，難以準(zhǔn)確進(jìn)行欠費(fèi)預(yù)測(cè)的問(wèn)題，從而有效輔助電力企業(yè)制定用電和電費(fèi)預(yù)警策略，且dcgan作為有監(jiān)督學(xué)習(xí)的特征提取器，生成的模擬數(shù)據(jù)有助于提高欠費(fèi)預(yù)測(cè)的準(zhǔn)確率。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中，進(jìn)一步地，所述獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括：

確定欠費(fèi)度量指標(biāo)體系；

本實(shí)施例中，為了獲取已有的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)，需先確定欠費(fèi)度量指標(biāo)體系，然后根據(jù)確定的欠費(fèi)度量指標(biāo)體系，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)(real_data)。

本實(shí)施例中，在預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中，通過(guò)對(duì)82472個(gè)大工業(yè)用戶的電費(fèi)數(shù)據(jù)進(jìn)行分析，發(fā)現(xiàn)在2015年1月至2015年12月這12個(gè)月的735522萬(wàn)條電費(fèi)記錄中僅有12471條有欠費(fèi)記錄，所述12471條有欠費(fèi)記錄包含了有殘缺的欠費(fèi)記錄。本發(fā)明實(shí)施例的目的就是增加欠費(fèi)數(shù)據(jù)，平衡欠費(fèi)數(shù)據(jù)和非欠費(fèi)數(shù)據(jù)的比例，讓欠費(fèi)預(yù)測(cè)模型能更好的學(xué)習(xí)到欠費(fèi)數(shù)據(jù)的特征。

本實(shí)施例中，所述預(yù)設(shè)的數(shù)據(jù)系統(tǒng)可以為某省國(guó)家電網(wǎng)電力用戶營(yíng)銷數(shù)據(jù)庫(kù)系統(tǒng)。

本實(shí)施例中，獲取到的735522電費(fèi)記錄包含了1-12個(gè)月的用電特征，而其中只有12471條欠費(fèi)記錄，那么同為預(yù)測(cè)和影響因子的欠費(fèi)數(shù)據(jù)成為稀缺數(shù)據(jù)。在利用監(jiān)督學(xué)習(xí)時(shí)為了有效預(yù)測(cè)用戶欠費(fèi)情況，可以確定每個(gè)月的每個(gè)用戶的欠費(fèi)度量指標(biāo)；所述欠費(fèi)度量指標(biāo)可以分別非目標(biāo)指標(biāo)和目標(biāo)指標(biāo)；由所述非目標(biāo)指標(biāo)和目標(biāo)指標(biāo)構(gòu)成欠費(fèi)度量指標(biāo)體系。

本實(shí)施例中，所述非目標(biāo)指標(biāo)可以包括：供電單位、行業(yè)類別、用電類別、電壓等級(jí)、負(fù)荷重要等級(jí)、運(yùn)行容量、停電標(biāo)識(shí)、是否三方協(xié)議、1月用電量、2月用電量、3月用電量、4月用電量、5月用電量、6月用電量、7月用電量、8月用電量、9月用電量、10月用電量、11月用電量、12月用電量、1月欠費(fèi)金額、2月欠費(fèi)金額、3月欠費(fèi)金額、4月欠費(fèi)金額、5月欠費(fèi)金額、6月欠費(fèi)金額、7月欠費(fèi)金額、8月欠費(fèi)金額、9月欠費(fèi)金額、10月欠費(fèi)金額、11月欠費(fèi)金額、12月欠費(fèi)金額。本實(shí)施例中，所述目標(biāo)指標(biāo)包括：欠費(fèi)月個(gè)數(shù)，在實(shí)際操作中，可以根據(jù)實(shí)際情況來(lái)決定目標(biāo)指標(biāo)的選擇。本實(shí)施例中欠費(fèi)數(shù)據(jù)是研究重點(diǎn)，且欠費(fèi)指標(biāo)1-12月可以推出欠費(fèi)月個(gè)數(shù)，所以將欠費(fèi)月個(gè)數(shù)確定為目標(biāo)指標(biāo)。

本實(shí)施例中，根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的33個(gè)指標(biāo)，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)，即：real_data包括：12471條欠費(fèi)數(shù)據(jù)，real_data的維度為12471*33。對(duì)real_data作初步分析，發(fā)現(xiàn)每次欠費(fèi)金額分布在0-100萬(wàn)，為便于欠費(fèi)預(yù)測(cè)模型的收斂，將欠費(fèi)金額以千元計(jì)，并保留一位小數(shù)。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中，進(jìn)一步地，所述根據(jù)確定的欠費(fèi)度量指標(biāo)體系，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)作為真實(shí)數(shù)據(jù)包括：

判斷每個(gè)指標(biāo)值是否有錯(cuò)誤，若某個(gè)指標(biāo)值有錯(cuò)誤，則刪除有錯(cuò)誤的指標(biāo)值；

判斷每個(gè)指標(biāo)值是否空缺，若某個(gè)指標(biāo)值空缺，則以當(dāng)前指標(biāo)對(duì)應(yīng)的所有指標(biāo)值的平均數(shù)補(bǔ)足。

本實(shí)施例中，由于所述12471條有欠費(fèi)記錄包含了有殘缺的欠費(fèi)記錄，在根據(jù)確定的欠費(fèi)度量指標(biāo)體系中的指標(biāo)，從預(yù)設(shè)的數(shù)據(jù)系統(tǒng)中抽取相應(yīng)的電力用戶欠費(fèi)數(shù)據(jù)，得到每個(gè)指標(biāo)對(duì)應(yīng)的指標(biāo)值后，需判斷每個(gè)指標(biāo)值是否有錯(cuò)誤，若某個(gè)指標(biāo)值有錯(cuò)誤，則刪除有錯(cuò)誤的指標(biāo)值；判斷每個(gè)指標(biāo)值是否空缺，若某個(gè)指標(biāo)值空缺，則以當(dāng)前指標(biāo)對(duì)應(yīng)的所有指標(biāo)值的平均數(shù)補(bǔ)足，這樣，可以得到完整的真實(shí)數(shù)據(jù)real_data，該過(guò)程并不改變r(jià)eal_data的維度，所述real_data的維度依然是12471*33。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中，進(jìn)一步地，在通過(guò)生成器生成模擬數(shù)據(jù)，將生成的模擬數(shù)據(jù)和所述真實(shí)數(shù)據(jù)輸入所述判別器來(lái)訓(xùn)練所述判別器之前，所述方法還包括：

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理；

所述對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行預(yù)處理包括：

將所述真實(shí)數(shù)據(jù)中的na值替換成0；

將所述真實(shí)數(shù)據(jù)的數(shù)據(jù)類型轉(zhuǎn)換為num/int類型；

剔除所述真實(shí)數(shù)據(jù)中的inf值；

對(duì)所述真實(shí)數(shù)據(jù)進(jìn)行歸一化處理。

本實(shí)施例中，將所述真實(shí)數(shù)據(jù)中的na值替換成0；將所述真實(shí)數(shù)據(jù)的數(shù)據(jù)類型轉(zhuǎn)換為num/int類型，例如，對(duì)于文字型指標(biāo)，如行業(yè)類別、供電單位等，轉(zhuǎn)換成相應(yīng)的數(shù)值(num)指標(biāo)；剔除所述真實(shí)數(shù)據(jù)中的無(wú)限大值(inf)值。

本實(shí)施例中，接著對(duì)真實(shí)數(shù)據(jù)進(jìn)行歸一化處理，歸一化就是要把真實(shí)數(shù)據(jù)(通過(guò)某種算法)限制在需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便，其次是保證程序運(yùn)行時(shí)收斂加快。歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計(jì)分布性。對(duì)真實(shí)數(shù)據(jù)做歸一化處理，消除不同數(shù)據(jù)量級(jí)的影響。具體的，對(duì)真實(shí)數(shù)據(jù)進(jìn)行歸一化處理，將各個(gè)指標(biāo)值壓縮到[0，100]之間。

本實(shí)施例中，可以利用公式:yi＝(xi-xmin)/(xmax-xmin)對(duì)各指標(biāo)值做歸一化處理，免去量級(jí)的影響；其中，xi、yi分別表示處理前后的指標(biāo)值，xmin表示該項(xiàng)指標(biāo)的最小值，xmax表示該項(xiàng)指標(biāo)的最大值。

本實(shí)施例中，目標(biāo)指標(biāo)“欠費(fèi)月個(gè)數(shù)”的數(shù)據(jù)經(jīng)過(guò)統(tǒng)計(jì)在1-7，不需做處理。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中，進(jìn)一步地，所述確定基于深度卷積的對(duì)抗生成網(wǎng)絡(luò)包括：

確定生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)，所述網(wǎng)絡(luò)結(jié)構(gòu)包括：輸入層、卷積層和輸出層；

確定生成器和判別器的卷積層卷集核大小、卷積核的滑動(dòng)步長(zhǎng)；

確定生成器和判別器的損失函數(shù)。

本實(shí)施例中，為了適應(yīng)電力數(shù)據(jù)的維度，設(shè)計(jì)了獨(dú)特的對(duì)抗生成網(wǎng)絡(luò)參數(shù)，例如：

1)去除激活層輸出，生成器和判別器的損失函數(shù)不取對(duì)數(shù)處理，可以有效加速模型收斂；

2)將欠費(fèi)度量指標(biāo)體系中的32個(gè)非目標(biāo)指標(biāo)的維度轉(zhuǎn)換成4*8，方便對(duì)抗生成網(wǎng)絡(luò)的判別器和生成器輸入數(shù)據(jù)到卷積層；

3)將判別器和生成器的卷積層卷積核設(shè)置成2*2，以突出每個(gè)指標(biāo)的重要性；

4)所述非目標(biāo)指標(biāo)的數(shù)目盡量可以表示為非1的兩個(gè)數(shù)的乘積形式；若所述非目標(biāo)指標(biāo)的數(shù)目不可以表示為非1的兩個(gè)數(shù)的乘積形式，則添加1個(gè)或多個(gè)噪聲指標(biāo)，使所述非目標(biāo)指標(biāo)的數(shù)目可以表示為非1的兩個(gè)數(shù)的乘積形式；例如，如果非目標(biāo)指標(biāo)的數(shù)目為37這種質(zhì)數(shù)，就不能運(yùn)用生成器和判別器的卷積訓(xùn)練模式，所以這時(shí)需要增加無(wú)意義的噪聲指標(biāo)以方便訓(xùn)練，增加無(wú)意義噪聲指標(biāo)轉(zhuǎn)換之后才能形成一個(gè)n*m的形式，才可以使用卷積神經(jīng)網(wǎng)絡(luò)，例如，增加1個(gè)無(wú)意義噪聲指標(biāo)，得到的指標(biāo)數(shù)為38，38可以表示為2*19。

接著，描述判別器的參數(shù)設(shè)置，具體的：

所述判別器的網(wǎng)絡(luò)結(jié)構(gòu)包括：輸入層、卷積層和輸出層，具體包括：1層輸入層、3層卷積層和1層輸出層，卷積層卷集核大小為2*2，，以突出每個(gè)指標(biāo)的重要性，卷積核的滑動(dòng)步長(zhǎng)為[1221]，通過(guò)卷積核的滑動(dòng)步長(zhǎng)可以替代層池化層進(jìn)行降維，邊界處理方式為越過(guò)邊緣取樣，每一批數(shù)據(jù)大小為64條數(shù)據(jù)。由于目標(biāo)指標(biāo)的維度為1-7，設(shè)置輸出層的維度為[64，1，1，7]方便與卷積層進(jìn)行全連接操作，輸出層的輸出為64*1*1*7個(gè)值。

生成器的輸入為維度7的隨機(jī)噪聲，卷積層卷集核大小為2*2,以突出每個(gè)指標(biāo)的重要性，卷集核的滑動(dòng)步長(zhǎng)為[1221],每一批數(shù)據(jù)大小為64數(shù)據(jù)，使用反卷積網(wǎng)絡(luò)進(jìn)行增加維度。

所述判別器的損失函數(shù)d_loss為l(d)＝-ex～pr[d(x)]+ex～pg[d(x)]

其中，pr表示真實(shí)數(shù)據(jù)，pg表示由生成器產(chǎn)生的模擬數(shù)據(jù)，對(duì)于x～pg/x～pr，x有不同的含義，例如，x～pr中的x表示真實(shí)數(shù)據(jù)，x～pg中的x表示模擬數(shù)據(jù)，d(x)表示將x輸入判別器的判別結(jié)果；d_loss_real＝-ex～pr[d(x)]表示是真實(shí)數(shù)據(jù)輸入到判別器中的判別結(jié)果和第一預(yù)期結(jié)果(例如，預(yù)期的為1的結(jié)果)之間的交叉熵，d_loss_fake＝ex～pg[d(x)]是生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果和第二預(yù)期結(jié)果(例如，預(yù)期為0的結(jié)果)之間的交叉熵，判別器的損失函數(shù)d_loss是d_loss_fake和d_loss_real之和。判別器的目的是經(jīng)過(guò)不斷的訓(xùn)練自學(xué)習(xí)來(lái)最小化判別器的損失函數(shù)值。

然后，描述生成器的參數(shù)設(shè)置，具體的：

所述生成器的網(wǎng)絡(luò)結(jié)構(gòu)包括：輸入層、卷積層和輸出層，具體包括：1層輸入層、3層反卷積層和1層輸出層，卷積層卷集核大小為2*2，以突出每個(gè)指標(biāo)的重要性，卷集核的滑動(dòng)步長(zhǎng)為[1221]，邊界處理方式為越過(guò)邊緣取樣，每一批數(shù)據(jù)大小為64條數(shù)據(jù)。由于目標(biāo)指標(biāo)的維度為1-7，設(shè)置的輸入的隨機(jī)噪聲z的維度為[64，1，1，7]。

所述生成器的損失函數(shù)g_loss為l(g)＝-ex～pg[d(x)]；

其中，g_loss表示生成器生成的模擬數(shù)據(jù)輸入到判別器中的判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果(例如，預(yù)期為1的結(jié)果)之間的交叉熵；pg表示由生成器生成的模擬數(shù)據(jù)；x～pg中的x表示模擬數(shù)據(jù)，d(x)表示將x輸入判別器的判別結(jié)果。

基于生成器的損失函數(shù)值和判別器的損失函數(shù)值利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低生成器的損失函數(shù)值和判別器的損失函數(shù)值，最終目標(biāo)是要最小化d_loss和g_loss。

在前述電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法的具體實(shí)施方式中，進(jìn)一步地，所述將獲取的所述真實(shí)數(shù)據(jù)輸入判別器，判別器學(xué)習(xí)所述真實(shí)數(shù)據(jù)的特征以訓(xùn)練其判別真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的能力，通過(guò)生成器生成模擬數(shù)據(jù)，將生成的模擬數(shù)據(jù)輸入到判別器判別真假，并根據(jù)判別結(jié)果計(jì)算生成器的損失函數(shù)值和判別器的損失函數(shù)值，直至生成器的損失函數(shù)值和判別器的損失函數(shù)值達(dá)到預(yù)設(shè)值，或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)，結(jié)束訓(xùn)練包括：

本實(shí)施例中，除了上述設(shè)置的參數(shù)，還需設(shè)置最大訓(xùn)練次數(shù)，每次訓(xùn)練都會(huì)有d_loss和g_loss產(chǎn)生，當(dāng)判別器和生成器的損失函數(shù)值達(dá)到預(yù)設(shè)值(例如，0.4)或者訓(xùn)練輪數(shù)大于1000時(shí)結(jié)束訓(xùn)練，并用訓(xùn)練好的生成器輸入隨機(jī)噪聲z(生成器的輸入數(shù)據(jù))生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)。生成器生成的模擬數(shù)據(jù)的數(shù)量一般不超過(guò)真實(shí)數(shù)據(jù)的數(shù)量，如果想要生成更多的模擬數(shù)據(jù)可以重新訓(xùn)練dcgan，完成另一套對(duì)抗學(xué)習(xí)模型(即：對(duì)抗生成網(wǎng)絡(luò))然后生成模擬數(shù)據(jù)。

本實(shí)施例中，生成器的損失函數(shù)值和判別器的損失函數(shù)值越小，表示判別器和生成器能力越強(qiáng)，但是實(shí)際上這兩個(gè)是互相矛盾的，生成器能力強(qiáng)了，判別器就會(huì)判別不出真假，他的損失函數(shù)就會(huì)升高，所以最終需要的是一個(gè)平衡值，不能一方偏高另一方偏低這樣，因?yàn)?，預(yù)設(shè)值可以設(shè)為0.4，在實(shí)際應(yīng)用中，預(yù)設(shè)值可以根據(jù)實(shí)際情況決定，二者的預(yù)設(shè)值可以相同也可以不同。

本實(shí)施例中，對(duì)抗生成網(wǎng)絡(luò)對(duì)抗學(xué)習(xí)之后生成的模擬數(shù)據(jù)需進(jìn)行逆向歸一化，將其恢復(fù)到原來(lái)的數(shù)據(jù)值域中，供使用者做監(jiān)督學(xué)習(xí)模型訓(xùn)練。

如圖2所示，本實(shí)施例中，對(duì)抗生成網(wǎng)絡(luò)中生成器和判別器的對(duì)抗學(xué)習(xí)(訓(xùn)練)的具體步驟可以包括：

a11，將真實(shí)數(shù)據(jù)real_data輸入到判別器中，判別器學(xué)習(xí)真實(shí)數(shù)據(jù)的特征，判別其真假，根據(jù)判別結(jié)果與預(yù)設(shè)的第一預(yù)期結(jié)果計(jì)算d_loss_real；

a12，將隨機(jī)噪聲z輸入到生成器中，生成器生成模擬數(shù)據(jù)analog_data，模擬數(shù)據(jù)analog_data進(jìn)入判別器中，判別器學(xué)習(xí)模擬數(shù)據(jù)analog_data的特征，并判別其真假，根據(jù)判別結(jié)果與預(yù)設(shè)的第三預(yù)期結(jié)果計(jì)算g_loss；

a13，根據(jù)a12的判別結(jié)果與預(yù)設(shè)的第二預(yù)期結(jié)果計(jì)算d_loss_fake，判別器的d_loss＝d_loss_fake+d_loss_real,利用自適應(yīng)估計(jì)優(yōu)化方法調(diào)節(jié)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元的權(quán)重和偏置來(lái)降低d_loss和g_loss；

a14，a12和a13交替進(jìn)行，生成器的目的是生成與所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)analog_data，讓判別器辨別不出來(lái)提高他的d_loss_fake；判別器的目的是能夠辨別模擬數(shù)據(jù)analog_data的真假，降低判別器的d_loss；

a15，當(dāng)判別器的損失函數(shù)值和生成器的的損失函數(shù)值達(dá)到0.4，或訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大訓(xùn)練次數(shù)1000，結(jié)束訓(xùn)練。

a16，利用訓(xùn)練后的生成器生成所述真實(shí)數(shù)據(jù)特征一致的模擬數(shù)據(jù)analog_data。

需要說(shuō)明的是，在本文中，諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái)，而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。

以上所述是本發(fā)明的優(yōu)選實(shí)施方式，應(yīng)當(dāng)指出，對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)，在不脫離本發(fā)明所述原理的前提下，還可以做出若干改進(jìn)和潤(rùn)飾，這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：付薇薇;張德政;謝永紅;黃彪
技術(shù)所有人：北京科技大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

江蘇電力網(wǎng)上電費(fèi)查詢相關(guān)技術(shù)

電費(fèi)管理系統(tǒng)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電力企業(yè)電費(fèi)回收數(shù)據(jù)模擬方法與流程