本發(fā)明涉及一種用電分析方法,尤其指基于用電信息采集數(shù)據(jù)的用電分析方法。
背景技術(shù):
:自2010年起全面推進(jìn)用電信息采集系統(tǒng)建設(shè)。截至2014年7月份,國網(wǎng)27家單位全部開展了用電信息采集系統(tǒng)建設(shè),全口徑用戶實(shí)現(xiàn)采集覆蓋2.3億戶,采集覆蓋率達(dá)到66.98%,采集的電量占總售電量比例達(dá)到93.49%。用電信息采集系統(tǒng)由系統(tǒng)主站、傳輸信道、采集終端以及智能電表組成。系統(tǒng)主站負(fù)責(zé)整個系統(tǒng)的用電信息采集、存儲、分析、處理和應(yīng)用,由通信子系統(tǒng)、數(shù)據(jù)庫、業(yè)務(wù)應(yīng)用、接口應(yīng)用等組成。大部分網(wǎng)省公司采用省級集中部署方式建設(shè)。傳輸信道分為系統(tǒng)主站與終端之間的遠(yuǎn)程通信信道、終端與智能電表之間的本地通信信道。當(dāng)前公司范圍內(nèi)采集系統(tǒng)遠(yuǎn)程通信信道主要采用GPRS/CDMA無線公網(wǎng)系統(tǒng)、230MHz無線專網(wǎng)信道、電話PSTN、光纖通信信道等。本地通信信道主要采用RS485、低壓電力線載波(窄帶、寬帶)、微功率無線等。電力用戶用電信息采集系統(tǒng)是對電力用戶的用電信息進(jìn)行采集、處理和實(shí)時監(jiān)控的系統(tǒng),實(shí)現(xiàn)用電信息的自動采集、計(jì)量異常監(jiān)測、電能質(zhì)量監(jiān)測、用電分析和管理、相關(guān)信息發(fā)布、分布式能源監(jiān)控、智能用電設(shè)備的信息交互等功能。但由于精細(xì)化、精益化管理要求,這些實(shí)時數(shù)據(jù)都是離散型信息、準(zhǔn)確性不高,而且不同來源的信息中存在時序差。分析、監(jiān)控困難且準(zhǔn)確性低,難以作為決策的基礎(chǔ)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明要解決的技術(shù)問題和提出的技術(shù)任務(wù)是對現(xiàn)有技術(shù)方案進(jìn)行完善與改進(jìn),提供基于用電信息采集數(shù)據(jù)的用電分析方法,以達(dá)到方便分析監(jiān)控目的。為此,本發(fā)明采取以下技術(shù)方案?;谟秒娦畔⒉杉瘮?shù)據(jù)的用電分析方法,其特征在于包括以下步驟:1)獲取用戶每天的分時負(fù)荷統(tǒng)計(jì)數(shù)據(jù)明細(xì);2)將明細(xì)數(shù)據(jù)分別按用戶、行業(yè)進(jìn)行分組,得到用戶負(fù)荷統(tǒng)計(jì)數(shù)據(jù)和行業(yè)負(fù)荷統(tǒng)計(jì)數(shù)據(jù);3)對用戶負(fù)荷統(tǒng)計(jì)數(shù)據(jù)和行業(yè)負(fù)荷統(tǒng)計(jì)數(shù)據(jù)進(jìn)行歸一化處理;使各指標(biāo)處于同一數(shù)量級,消除指標(biāo)之間的量綱影響;4)對歸一化處理的數(shù)據(jù)進(jìn)行k-means聚類計(jì)算,得到每個行業(yè)和每個用戶的特征負(fù)荷曲線;5)調(diào)整生成的曲線數(shù)量,得到各個特征化明顯的曲線并進(jìn)行標(biāo)注,同時將各個行業(yè)和各個用戶與各自的特征負(fù)荷曲線相對應(yīng);6)根據(jù)特征負(fù)荷曲線,抽取特征用戶,對用戶的特征負(fù)荷曲線和對應(yīng)行業(yè)的特征負(fù)荷曲線進(jìn)行對比分析以進(jìn)行問題識別和/輔助決策。本技術(shù)方案基于大數(shù)據(jù)技術(shù)成果,在電力領(lǐng)域中通過應(yīng)用大數(shù)據(jù)相關(guān)存儲技術(shù)、計(jì)算技術(shù)提升用電信息采集系統(tǒng),為支撐階梯電價執(zhí)行,加強(qiáng)精益化管理、提高優(yōu)質(zhì)服務(wù)水平,延伸電力市場、創(chuàng)新交易平臺提供基礎(chǔ)保障。作為對上述技術(shù)方案的進(jìn)一步完善和補(bǔ)充,本發(fā)明還包括以下附加技術(shù)特征。在步驟6)中,對用戶的特征負(fù)荷曲線和對應(yīng)行業(yè)的特征負(fù)荷曲線進(jìn)行相似度計(jì)算,當(dāng)該用戶的特征負(fù)荷曲線與其所在行業(yè)的特征負(fù)荷曲線相似度小于設(shè)定值時,繼續(xù)查詢該用戶的每日用電量情況及每日負(fù)荷峰谷,推斷出該用戶是否存在負(fù)荷異動,及時提醒用戶調(diào)整用電方案。在步驟6)中,相似度計(jì)算為余弦相似度算法。在步驟1)中,通過訪問用電信息采集系統(tǒng)數(shù)據(jù)庫獲取所有用戶的負(fù)荷24點(diǎn)統(tǒng)計(jì)數(shù)據(jù)以及用戶檔案表數(shù)據(jù)生成明細(xì)清單,包括用戶檔案信息表和負(fù)荷數(shù)據(jù)明細(xì)表,所提取的字段信息包括:供電單位、戶號、戶名、用戶分類、行業(yè)編碼、受電容量、0-23點(diǎn)負(fù)荷。得到明細(xì)清單后,對得到的明細(xì)清單進(jìn)行篩選及預(yù)處理:清洗數(shù)據(jù)缺失、數(shù)據(jù)冗余、數(shù)據(jù)不準(zhǔn)確、不規(guī)范的用戶數(shù)據(jù),其中各字段任一數(shù)據(jù)缺失為數(shù)據(jù)缺失,當(dāng)?shù)厥袉挝弧^(qū)縣單位、供電所單位、戶號、戶名、用戶分類、行業(yè)編碼、受電容量或0-23點(diǎn)負(fù)荷數(shù)據(jù)為空時認(rèn)為數(shù)據(jù)缺失;明細(xì)條目重復(fù)出現(xiàn)為數(shù)據(jù)冗余,當(dāng)如地市單位、區(qū)縣單位、供電所單位、戶號、戶名、用戶分類、行業(yè)編碼、受電容量、0-23點(diǎn)負(fù)荷數(shù)據(jù)的數(shù)據(jù)重復(fù)時認(rèn)為數(shù)據(jù)缺失;業(yè)務(wù)數(shù)據(jù)出現(xiàn)明顯的常識性錯誤為數(shù)據(jù)不準(zhǔn)確,當(dāng)供電單位、戶號、戶名與常識不符時認(rèn)為數(shù)據(jù)不準(zhǔn)確;各字段任一數(shù)據(jù)格式不規(guī)范為不規(guī)范,當(dāng)受電容量、0-23點(diǎn)負(fù)荷數(shù)據(jù)、數(shù)據(jù)時間格式不規(guī)范時認(rèn)為不規(guī)范;清洗完畢后,按戶號合并用戶檔案信息表和負(fù)荷數(shù)據(jù)明細(xì)表,形成用戶信息負(fù)荷數(shù)據(jù)表,以作為后序分析處理的數(shù)據(jù)基礎(chǔ)。在步驟3)中,進(jìn)行歸一化處理時,對原始數(shù)據(jù)的線性變換,將結(jié)果值映射到[0-1]之間。表達(dá)式如下:y=(x-MinValue)/(MaxValue-MinValue),其中:x、y分別為轉(zhuǎn)換前、后的值,MaxValue、MinValue分別為樣本的最大值和最小值。有益效果:1、通過用戶負(fù)荷特征庫的建立,做到的對所有用戶的用電情況進(jìn)行歷史趨勢分析,更加準(zhǔn)確的定位可能的竊電用戶。有效提升竊電或違約用電行為的準(zhǔn)確查處,減少供電企業(yè)的損失。2、可根據(jù)用戶及其所處行業(yè)的負(fù)荷特征,計(jì)算出一套針對該用戶的優(yōu)化用電建議方案,并進(jìn)行方案的精準(zhǔn)推送。使用戶主動選擇節(jié)約、經(jīng)濟(jì)的用電方式,逐步向主動發(fā)掘“移峰填谷”效益方向轉(zhuǎn)變。以價格信號為導(dǎo)向,從被動消費(fèi)者身份向主動參與者轉(zhuǎn)變。3、本技術(shù)方案對相同行業(yè)內(nèi)的用戶負(fù)荷可通過該行業(yè)的負(fù)荷特征,引導(dǎo)和推算用戶的用電趨勢,為長短期負(fù)荷預(yù)測提供另一種具有參考價值的基礎(chǔ)數(shù)據(jù)。為合理安排電網(wǎng)供電,保障用戶用電可靠性與安全性提供了一定的數(shù)據(jù)支撐。4、對客戶群進(jìn)行細(xì)分,幫助電力企業(yè)更為準(zhǔn)確地掌握用電客戶差異化服務(wù)的業(yè)務(wù)需求,協(xié)助提供符合實(shí)際需要的主動服務(wù),最終取得提升客戶用電體驗(yàn)滿意度和降低電力企業(yè)服務(wù)成本的成效。附圖說明圖1是本發(fā)明流程圖。圖2是用戶負(fù)荷特征曲線。圖3是行業(yè)負(fù)荷特征曲線。圖4是用戶行業(yè)對比曲線。具體實(shí)施方式以下結(jié)合說明書附圖對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)說明。如圖1所示,本發(fā)明包括以下步驟:1)獲取用戶每天的分時負(fù)荷統(tǒng)計(jì)數(shù)據(jù)明細(xì);2)將明細(xì)數(shù)據(jù)分別按用戶、行業(yè)進(jìn)行分組,得到用戶負(fù)荷統(tǒng)計(jì)數(shù)據(jù)和行業(yè)負(fù)荷統(tǒng)計(jì)數(shù)據(jù);3)對用戶負(fù)荷統(tǒng)計(jì)數(shù)據(jù)和行業(yè)負(fù)荷統(tǒng)計(jì)數(shù)據(jù)進(jìn)行歸一化處理;使各指標(biāo)處于同一數(shù)量級,消除指標(biāo)之間的量綱影響;4)對歸一化處理的數(shù)據(jù)進(jìn)行k-means聚類計(jì)算,得到每個行業(yè)和每個用戶的特征負(fù)荷曲線;5)調(diào)整生成的曲線數(shù)量,得到各個特征化明顯的曲線并進(jìn)行標(biāo)注,同時將各個行業(yè)和各個用戶與各自的特征負(fù)荷曲線相對應(yīng);6)根據(jù)特征負(fù)荷曲線,抽取特征用戶,對用戶的特征負(fù)荷曲線和對應(yīng)行業(yè)的特征負(fù)荷曲線進(jìn)行對比分析以進(jìn)行問題識別和/輔助決策。以上對上述步驟具體說明:一、具體算法對從用電信息采集系統(tǒng)中取得的負(fù)荷數(shù)據(jù)進(jìn)行分析,通過運(yùn)用滿足以下算法進(jìn)行數(shù)據(jù)處理和計(jì)算。(1)算法一:數(shù)據(jù)歸一化,用于步驟3)?!舅惴枋觥繑?shù)據(jù)歸一化處理是數(shù)據(jù)挖掘的一項(xiàng)基礎(chǔ)工作,不同評價指標(biāo)往往具有不同的量綱和量綱單位,這樣的情況會影響到數(shù)據(jù)分析的結(jié)果,為了消除指標(biāo)之間的量綱影響,需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,以解決數(shù)據(jù)指標(biāo)之間的可比性。原始數(shù)據(jù)經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化處理后,各指標(biāo)處于同一數(shù)量級,適合進(jìn)行綜合對比評價?!居?jì)算公式】min-max標(biāo)準(zhǔn)化是對原始數(shù)據(jù)的線性變換,使結(jié)果值映射到[0-1]之間。表達(dá)式如下:y=(x-MinValue)/(MaxValue-MinValue)說明:x、y分別為轉(zhuǎn)換前、后的值,MaxValue、MinValue分別為樣本的最大值和最小值。(2)算法二:K-means聚類算法,用于步驟4)。【算法描述】K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評價指標(biāo),即認(rèn)為兩個對象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對象組成的,因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo)?!居?jì)算公式】其中,k表示聚類的個數(shù),x和u表示任意兩點(diǎn)的數(shù)據(jù)值,si表示每一點(diǎn)與剩余點(diǎn)的距離值處理流程(1)從n個數(shù)據(jù)對象任意選擇k個對象作為初始聚類中心;(2)根據(jù)每個聚類對象的均值(中心對象),計(jì)算每個對象與這些中心對象的距離;并根據(jù)最小距離重新對相應(yīng)對象進(jìn)行劃分;(3)重新計(jì)算每個(有變化)聚類的均值(中心對象)(4)循環(huán)(2)到(3)直到每個聚類不再發(fā)生變化為止(3)算法二:余弦相似度算法,用于步驟6)用戶的特征負(fù)荷曲線和對應(yīng)行業(yè)的特征負(fù)荷曲線進(jìn)行對比?!舅惴枋觥坑嘞蚁嗨贫人惴ㄊ腔谙蛄康?,它利用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小,注重兩個向量在方向上的差異,在[0,1]內(nèi)余弦值越大,說明兩個向量相似度越大?!居?jì)算公式】其中,a和b分別代表需要進(jìn)行比較的兩個數(shù)值二、數(shù)據(jù)及預(yù)處理,用于步驟1)。(1)數(shù)據(jù)獲取方式取得用電信息采集系統(tǒng)數(shù)據(jù)庫訪問權(quán)限,編寫相應(yīng)查詢語句,訪問用電信息采集系統(tǒng)數(shù)據(jù)庫獲取所有用戶的負(fù)荷24點(diǎn)統(tǒng)計(jì)數(shù)據(jù),以及用戶檔案表數(shù)據(jù),所提取的字段信息包括:供電單位(包含地市、區(qū)縣級、供電所)、戶號、戶名、用戶分類、行業(yè)編碼、受電容量、0點(diǎn)負(fù)荷、1點(diǎn)負(fù)荷、2點(diǎn)負(fù)荷、3點(diǎn)負(fù)荷。。。23點(diǎn)負(fù)荷等,明細(xì)清單導(dǎo)出形成《用戶檔案信息表》和《負(fù)荷數(shù)據(jù)明細(xì)表》。數(shù)據(jù)表1:用戶檔案信息表數(shù)據(jù)表2:負(fù)荷數(shù)據(jù)明細(xì)表(2)數(shù)據(jù)清洗及預(yù)處理抽取數(shù)據(jù)為業(yè)務(wù)明細(xì),根據(jù)如下數(shù)據(jù)清洗規(guī)則,對不在聚類統(tǒng)計(jì)范圍內(nèi)的抽取數(shù)據(jù)進(jìn)行清洗:l清洗規(guī)則一:各字段任一數(shù)據(jù)缺失即定義為數(shù)據(jù)缺失。如地市單位、區(qū)縣單位、供電所單位、戶號、戶名、用戶分類、行業(yè)編碼、受電容量、0-23點(diǎn)負(fù)荷數(shù)據(jù)等為空。清洗規(guī)則二:明細(xì)條目重復(fù)出現(xiàn)即定義為數(shù)據(jù)冗余。如地市單位、區(qū)縣單位、供電所單位、戶號、戶名、用戶分類、行業(yè)編碼、受電容量、0-23點(diǎn)負(fù)荷數(shù)據(jù)等數(shù)據(jù)重復(fù)。清洗規(guī)則三:業(yè)務(wù)數(shù)據(jù)出現(xiàn)明顯的常識性錯誤,即定義為數(shù)據(jù)不準(zhǔn)確。如供電單位(包含地市、區(qū)縣級、供電所)、戶號、戶名等與常識不符。清洗規(guī)則四:各字段任一數(shù)據(jù)格式不規(guī)范即定義為不規(guī)范。如受電容量、0-23點(diǎn)負(fù)荷數(shù)據(jù)、數(shù)據(jù)時間格式不規(guī)范。清洗完畢后,按戶號合并《用戶檔案信息表》和《負(fù)荷數(shù)據(jù)明細(xì)表》,形成《用戶信息負(fù)荷數(shù)據(jù)表》作為本視角分析挖掘的數(shù)據(jù)基礎(chǔ),該表字段如下:表3:用戶信息負(fù)荷數(shù)據(jù)表【數(shù)據(jù)基礎(chǔ)】《用戶信息負(fù)荷數(shù)據(jù)表》。三、步驟4)生成特征曲線。(1)展示一:分別按用戶和行業(yè)進(jìn)行聚類的特征曲線經(jīng)過對用戶信息負(fù)荷數(shù)據(jù)表的歸一化和聚類計(jì)算后,按照輸入的聚類數(shù)量,展示出相應(yīng)數(shù)量的負(fù)荷特征曲線(見圖1圖2)。(2)展示二:用戶行業(yè)特征曲線對比將某個用戶所屬的用戶特征曲線及其所屬的行業(yè)特征曲線進(jìn)行疊加對比展示(見圖4)。四、步驟6)比對用戶及行業(yè)的特征曲線。表3:用戶行業(yè)負(fù)荷曲線對比偏離表序號對比對象余弦值基準(zhǔn)值1用戶曲線1-行業(yè)曲線10.96225605031635050.952用戶曲線2-行業(yè)曲線20.9696704739574270.953用戶曲線3-行業(yè)曲線30.94596656432987460.95在上表中,余弦值越接近1,表示兩條曲線相似度越大由上表可以看出,該用戶的用電負(fù)荷模式與其所在行業(yè)的普遍用電模式有很大的區(qū)別。繼續(xù)查詢該用戶的每日用電量情況及每日負(fù)荷峰谷,可推斷出該用戶是否存在竊電等負(fù)荷異動,及時提醒用戶調(diào)整用電方案,進(jìn)而保障用戶用電,以減少因有序用電執(zhí)行造成的電量損失和用戶損失。五.應(yīng)用方式(1)分析周期考慮到負(fù)荷數(shù)據(jù)計(jì)算量比較大,需要一定的計(jì)算時間,建議本視角按日度開展?jié)L動分析。(2)分析層級本視角分析的層級為三級,分別是地市公司、?。ㄖ陛犑校┕炯皣W(wǎng)總部。地市公司可開展本單位及所屬縣公司的管轄范圍內(nèi)的用戶行業(yè)負(fù)荷聚類分析,可追溯查詢用戶負(fù)荷明細(xì)數(shù)據(jù)。?。ㄊ校┕究苫谌?shù)據(jù)開展統(tǒng)計(jì)、分析,可匯總顯示、查詢下屬地市分析結(jié)果??偛靠蓞R總顯示、穿透查詢所有省(直轄市)聚類分析數(shù)據(jù)。以上圖1所示的基于用電信息采集數(shù)據(jù)的用電分析方法是本發(fā)明的具體實(shí)施例,已經(jīng)體現(xiàn)出本發(fā)明實(shí)質(zhì)性特點(diǎn)和進(jìn)步,可根據(jù)實(shí)際的使用需要,在本發(fā)明的啟示下,對其進(jìn)行形狀、結(jié)構(gòu)等方面的等同修改,均在本方案的保護(hù)范圍之列。當(dāng)前第1頁1 2 3