本發(fā)明涉及一種基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法。
背景技術(shù):
1、電費(fèi)回收是電力企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng)的一項(xiàng)重要組成部分,目前雖然進(jìn)行推廣智能繳費(fèi),但是愿意實(shí)行智能繳費(fèi)的用戶較少數(shù),電費(fèi)回收逐漸成為影響電力企業(yè)生產(chǎn)經(jīng)營(yíng)的一大困擾。通過(guò)電力客戶的基本信息、電量、電費(fèi)、繳費(fèi)、以及電費(fèi)匯款時(shí)長(zhǎng)等信息,建立電力大客戶的電費(fèi)回收風(fēng)險(xiǎn)指標(biāo)體系。采用主成分分析剔除影響力較小的指標(biāo),得到客戶電費(fèi)回收風(fēng)險(xiǎn)預(yù)警指標(biāo)。最后,基于邏輯回歸算法中多類(lèi)有序算法進(jìn)行電費(fèi)回收風(fēng)險(xiǎn)預(yù)警,提出基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型。
2、如公開(kāi)號(hào)cn115392531a基于縱向聯(lián)邦邏輯回歸的企業(yè)電費(fèi)繳納風(fēng)險(xiǎn)預(yù)測(cè)方法及系統(tǒng),其公開(kāi)了一種基于縱向聯(lián)邦邏輯回歸的企業(yè)電費(fèi)繳納風(fēng)險(xiǎn)預(yù)測(cè)方法及系統(tǒng),利用秘密共享技術(shù)保護(hù)了電網(wǎng)和工信局聯(lián)合風(fēng)險(xiǎn)預(yù)測(cè)時(shí)的數(shù)據(jù)隱私安全,并實(shí)現(xiàn)了集中式訓(xùn)練級(jí)別的模型效用性。通過(guò)使用秘密共享技術(shù)取代同態(tài)加密技術(shù),有效降低了整體的計(jì)算復(fù)雜度與高昂的通信成本,并可滿足實(shí)際場(chǎng)景中處理大體量數(shù)據(jù)的需求。通過(guò)使用秘密共享技術(shù)取代差分隱私技術(shù),可有效提升模型精準(zhǔn)度,并滿足實(shí)際風(fēng)險(xiǎn)預(yù)測(cè)場(chǎng)景中的精準(zhǔn)預(yù)測(cè)。
3、但上述現(xiàn)有公開(kāi)技術(shù)存在如下缺陷:
4、1、其模型中缺少數(shù)據(jù)進(jìn)行預(yù)處理,若數(shù)據(jù)的特征太多容易導(dǎo)致模型誤差增大,從而影響電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性;
5、2、單存采用模型直接電費(fèi)回收風(fēng)險(xiǎn)的預(yù)測(cè),預(yù)測(cè)的準(zhǔn)確性很低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于克服背景技術(shù)存在缺陷,提供一種基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,能更加準(zhǔn)確識(shí)別用戶的繳費(fèi)特征,減少誤差。
2、為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,包括:
3、收集電力客戶信息,建立電力客戶的電費(fèi)回收風(fēng)險(xiǎn)指標(biāo)體系;
4、采用主成分分析法剔除電費(fèi)回收風(fēng)險(xiǎn)指標(biāo)體系中影響力較小的指標(biāo),得到客戶電費(fèi)回收風(fēng)險(xiǎn)預(yù)警指標(biāo);
5、基于邏輯回歸算法進(jìn)行電費(fèi)回收風(fēng)險(xiǎn)預(yù)警,提出基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型。
6、在本發(fā)明一實(shí)施例中,所述電力客戶信息包括電力客戶的用戶信息、電量數(shù)據(jù)、電費(fèi)信息、歷史繳費(fèi)記錄、繳費(fèi)方式。
7、在本發(fā)明一實(shí)施例中,建立電力大客戶的電費(fèi)回收風(fēng)險(xiǎn)指標(biāo)體系,還需對(duì)收集的電力客戶信息進(jìn)行數(shù)據(jù)剔除、歸一化處理。
8、在本發(fā)明一實(shí)施例中,所述主成分分析法是將原始樣本數(shù)據(jù)特征重新組合變換成一組新的相互無(wú)關(guān)的特征,并根據(jù)需要從這一組新的相互無(wú)關(guān)的特征中選取出盡可能多地表達(dá)出原有信息的盡可能少的特征,即將一組新的相互無(wú)關(guān)的特征向量替代原數(shù)據(jù)中具有相關(guān)性的特征向量,以實(shí)現(xiàn)表達(dá)信息盡可能多的同時(shí)降低數(shù)據(jù)維度的目的。
9、在本發(fā)明一實(shí)施例中,所述主成分分析法實(shí)現(xiàn)如下:
10、(1)輸入原始數(shù)據(jù)集x={xi|i=1,2,...,m},并求取原始數(shù)據(jù)集x的平均向量此處原始數(shù)據(jù)集x即電力客戶信息集合,xi表示電力客戶信息中第i個(gè)指標(biāo),m表示電力客戶信息中指標(biāo)總數(shù);
11、(2)計(jì)算協(xié)方差矩陣c:
12、
13、(3)計(jì)算協(xié)方差矩陣c的特征值γi和特征向量vi的特征方程如下:
14、γivi=cvi
15、(4)將γi降序排列,據(jù)主成分的近似度h,確定降維后的維度p,有得到γ=[γ1,γ2,...,γp],v=[v1,v2,...,vp];
16、(5)計(jì)算降維后的特征矩陣xp,該矩陣由p個(gè)特征向量構(gòu)成,xp即為主成分分析法降維后所得結(jié)果。
17、在本發(fā)明一實(shí)施例中,所述基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練過(guò)程如下:
18、基于主成分分析法得到的客戶電費(fèi)回收風(fēng)險(xiǎn)預(yù)警指標(biāo)構(gòu)建訓(xùn)練集并輸入至邏輯回歸模型,對(duì)邏輯回歸模型進(jìn)行訓(xùn)練,通過(guò)最大似然估計(jì)或梯度下降優(yōu)化算法來(lái)擬合邏輯回歸模型的參數(shù),得到基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型。
19、在本發(fā)明一實(shí)施例中,訓(xùn)練得到的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型,采用訓(xùn)練集評(píng)估性能,即計(jì)算準(zhǔn)確率、精確率、召回率。
20、相較于現(xiàn)有技術(shù),本發(fā)明具有以下有益效果:
21、1、工作效率:通過(guò)數(shù)據(jù)模型可以分析用戶繳費(fèi)特征,利用客戶風(fēng)險(xiǎn)等級(jí)標(biāo)簽篩選客戶群體,指導(dǎo)電費(fèi)回收工作,及時(shí)跟進(jìn)高風(fēng)險(xiǎn)、中風(fēng)險(xiǎn)客戶的電費(fèi)繳納情況,增加催繳頻率和力度,顯著降低電費(fèi)回收風(fēng)險(xiǎn)。
22、2、經(jīng)濟(jì)性:本模型按電費(fèi)風(fēng)險(xiǎn)等級(jí)排序,優(yōu)先開(kāi)展重點(diǎn)催費(fèi)措施,針對(duì)高風(fēng)險(xiǎn)用戶提高催費(fèi)短信發(fā)送頻率,差異化催費(fèi)內(nèi)容,對(duì)低風(fēng)險(xiǎn)等級(jí)用戶降低催費(fèi)短信發(fā)送頻率等,提高優(yōu)質(zhì)服務(wù)水平。
1.一種基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,所述電力客戶信息包括電力客戶的用戶信息、電量數(shù)據(jù)、電費(fèi)信息、歷史繳費(fèi)記錄、繳費(fèi)方式。
3.根據(jù)權(quán)利要求1所述的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,建立電力大客戶的電費(fèi)回收風(fēng)險(xiǎn)指標(biāo)體系,還需對(duì)收集的電力客戶信息進(jìn)行數(shù)據(jù)剔除、歸一化處理。
4.根據(jù)權(quán)利要求1所述的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,所述主成分分析法是將原始樣本數(shù)據(jù)特征重新組合變換成一組新的相互無(wú)關(guān)的特征,并根據(jù)需要從這一組新的相互無(wú)關(guān)的特征中選取出盡可能多地表達(dá)出原有信息的盡可能少的特征,即將一組新的相互無(wú)關(guān)的特征向量替代原數(shù)據(jù)中具有相關(guān)性的特征向量,以實(shí)現(xiàn)表達(dá)信息盡可能多的同時(shí)降低數(shù)據(jù)維度的目的。
5.根據(jù)權(quán)利要求1或4所述的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,所述主成分分析法實(shí)現(xiàn)如下:
6.根據(jù)權(quán)利要求1所述的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,所述基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練過(guò)程如下:
7.根據(jù)權(quán)利要求1所述的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)方法,其特征在于,訓(xùn)練得到的基于主成分分析法和邏輯回歸法電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型,采用訓(xùn)練集評(píng)估性能,即計(jì)算準(zhǔn)確率、精確率、召回率。