專利名稱:基于數據挖掘的公共建筑能耗實時監(jiān)測方法
技術領域:
本發(fā)明屬于建筑節(jié)能技術領域,涉及一種適用于建筑能耗數據異常的檢測方法, 特別涉及一種基于數據挖掘的公共建筑能耗實時監(jiān)測方法。
背景技術:
近年來,隨著經濟的發(fā)展,我國的建筑業(yè)發(fā)展迅猛,建筑能耗已經占據社會總能耗的30%以上,并且有逐年上升的趨勢。其中,公共建筑的耗能情況尤為嚴重,雖然公共建筑數量只占總建筑物數量的5%左右,但其能耗卻占建筑總能耗的22%,單位面積的用電能耗為普通住宅的5 15倍。同時,我國正處于能源相對短缺的時期,建筑高能耗狀況加大了我國能源壓力,制約著國民經濟的可持續(xù)發(fā)展,建筑節(jié)能已是刻不容緩。因此,監(jiān)測、控制和降低公共建筑能耗成為了當前建筑節(jié)能工作的一項重要內容。根據國家和地方政府部門的相關規(guī)定,將在全國范圍內大力開展公共建筑能耗分項計量工作,以指導節(jié)能診斷、挖掘節(jié)能潛力。目前,已有部分公共建筑實現(xiàn)了能耗分項計量,在運行過程中積累了相當數量的能耗數據。但是,大量的數據也帶來了 “數據災難”,使得建筑管理人員難以快速有效地發(fā)現(xiàn)存在的能耗異常問題。傳統(tǒng)的監(jiān)測方法是由能源管理人員設定一個閾值,由此決定耗能的高低,但是這存在兩個問題1)閾值人為設定,過高或過低都可能會影響到實際檢測結果;幻沒有考慮季節(jié)、建筑物能耗模式等因素,不能動態(tài)適應上述變化。海量數據的分析方法,目前應用比較廣泛的是數據挖掘(Data Mining),數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘通常包含如下步驟確定業(yè)務對象、數據準備、數據挖掘、結果分析,參見
圖1 ;數據挖掘技術主要功能包括概念描述、關聯(lián)分析、分類和預測、聚類分析、孤立點分析和時間序列分析。(1)確定業(yè)務對象。清晰地定義出業(yè)務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結構是不可預測的,但要探索的問題應是有預見的,為了數據挖掘而數據挖掘則帶有盲目性,是不會成功的。(2)數據準備其發(fā)現(xiàn)方法是應用模糊邏輯進行數據查詢、排序等。該工具使用模糊概念和“最近”搜索技術的數據查詢工具,它可以讓用戶指定目標,然后對數據庫進行搜索,找出接近目標的所有記錄,并對結果進行評估,包括①數據的選擇。搜索所有與業(yè)務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據;②數據的預處理。研究數據的質量,為進一步的分析做準備,并確定將要進行的挖掘操作的類型;③數據的轉換。將數據轉換成一個分析模型,這個分析模型是針對挖掘算法建立的。建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。(3)數據挖掘對所得到的經過轉換的數據進行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。(4)結果分析解釋并評估結果。其使用的分析方法一般應依數據挖掘操作而定,通常會用到可視化技術。因此急需一種對公共建筑能耗進行實時監(jiān)測并判定建筑能耗數據是否異常的方法。
發(fā)明內容
有鑒于此,為了解決上述問題,本發(fā)明提出一種對公共建筑能耗進行實時監(jiān)測并判定能耗數據是否異常的方法。該方法在對公共建筑能耗特點進行深入研究的基礎上,針對常用的公共建筑能耗監(jiān)測設定能耗閾值方法和基于歷史數據的數據挖掘方法在實時性和智能性方面的不足,提出了一種基于數據挖掘技術的公共建筑能耗實時監(jiān)測方法。本發(fā)明的目的是這樣實現(xiàn)的本發(fā)明提供的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,包括以下步驟Sl 建立建筑能耗模式判定樹,通過對歷史建筑能耗數據進行聚類分析識別建筑物特有的建筑能耗模式,對數據分類后獲得建筑能耗模式判定樹;S2:實時采集建筑能耗數據,在建筑能耗實時監(jiān)測過程中動態(tài)采集當前建筑能耗數據;S3:判別當前建筑能耗數據是否為能耗異常點,將當前建筑能耗數據與所屬建筑能耗模式判定樹進行模式匹配,判斷當前建筑能耗數據是否為離群點。進一步,所述Sl建立建筑能耗模式判斷樹,具體包括以下步驟Sll 設定建筑能耗模式的重建周期,設定需要對建筑能耗數據進行重新建立建筑能耗模式的周期;S12 對歷史建筑能耗數據進行數據預處理;S13:提取歷史建筑能耗數據的特征向量用于進行聚類分析發(fā)現(xiàn)建筑物特有的能耗模式,所述特征向量包括每小時平均能耗Cavg和每小時最高能耗Cmax ;S14:歷史能耗數據的聚類分析,對預處理后的歷史能耗時序數據使用聚類算法進行聚類分析,識別歷史能耗數據中蘊含的用能模式,并將聚類結果在每一項數據中進行標記;S15:建立建筑能耗模式判定樹,對已標記的歷史建筑能耗數據進行分類處理,建立建筑能耗模式判定樹;進一步,所述S3中判別當前建筑能耗數據是否為能耗異常點,具體包括以下步驟S31 根據建筑能耗模式判定樹,判斷當前建筑能耗數據所屬的能耗模式;S32:對當前建筑能耗數據和相同能耗模式的歷史數據使用離群點檢測算法進行離群點分析,如果當前能耗數據點為離群點,則表明當前建筑能耗數據出現(xiàn)異常,應給出警告;否則說明當前建筑能耗數據正常,則采集下一次當前建筑能耗數據新數據;S33:如果未采集到當前建筑能耗數據的新數據,則檢查是否到達重建周期,如果是則轉S11-S15重新建立建筑能耗模式,否則轉S31-S32進行采集當前建筑能耗數據的新數據并判別當前建筑能耗數據是否為能耗異常點;進一步,所述S12對歷史建筑能耗數據進行數據預處理,具體包括以下步驟S121 對歷史建筑能耗數據進行z-score規(guī)范化處理,通過以下公式來計算
權利要求
1.基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于包括以下步驟51建立建筑能耗模式判定樹,通過對歷史建筑能耗數據進行聚類分析識別建筑物特有的建筑能耗模式,對數據分類后獲得建筑能耗模式判定樹;52實時采集建筑能耗數據,在建筑能耗實時監(jiān)測過程中動態(tài)采集當前建筑能耗數據;S3:判別當前建筑能耗數據是否為能耗異常點,將當前建筑能耗數據與所屬建筑能耗模式判定樹進行模式匹配,判斷當前建筑能耗數據是否為離群點。
2.根據權利要求1所述的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于 所述Sl建立建筑能耗模式判斷樹,具體包括以下步驟511設定建筑能耗模式的重建周期,設定需要對建筑能耗數據進行重新建立建筑能耗模式的周期;512對歷史建筑能耗數據進行數據預處理;S13:提取歷史建筑能耗數據的特征向量用于進行聚類分析發(fā)現(xiàn)建筑物特有的能耗模式,所述特征向量包括每小時平均能耗Cavg和每小時最高能耗Cmax ;S14:歷史能耗數據的聚類分析,對預處理后的歷史能耗時序數據使用聚類算法進行聚類分析,識別歷史能耗數據中蘊含的用能模式,并將聚類結果在每一項數據中進行標記;S15:建立建筑能耗模式判定樹,對已標記的歷史建筑能耗數據進行分類處理,建立建筑能耗模式判定樹。
3.根據權利要求2所述的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于 所述S3中判別當前建筑能耗數據是否為能耗異常點,具體包括以下步驟531根據建筑能耗模式判定樹,判斷當前建筑能耗數據所屬的能耗模式;532對當前建筑能耗數據和相同能耗模式的歷史數據使用離群點檢測算法進行離群點分析,如果當前能耗數據點為離群點,則表明當前建筑能耗數據出現(xiàn)異常,應給出警告; 否則說明當前建筑能耗數據正常,則采集下一次當前建筑能耗數據新數據;533如果未采集到當前建筑能耗數據的新數據,則檢查是否到達重建周期,如果是則轉S11-S15重新建立建筑能耗模式,否則轉S31-S32進行采集當前建筑能耗數據的新數據并判別當前建筑能耗數據是否為能耗異常點。
4.根據權利要求3所述的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于 所述S12對歷史建筑能耗數據進行數據預處理,具體包括以下步驟5121對歷史建筑能耗數據進行z-score規(guī)范化處理,通過以下公式來計算
5.根據權利要求4所述的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于 所述S14發(fā)現(xiàn)建筑物能耗模式,采用基于密度的聚類算法DBSCAN來挖掘建筑物特有的能耗模式,具體包括以下步驟S141 輸入參數,所述參數包括鄰域半徑ε、領域內數據點最小數目MinPts ;輸入能耗數據集合、計算并存儲數據的歐式距離;S142:確定核心對象,如果數據點ρ為核心數據點,則其ε領域內至少包含MinPts個數據點;S143 掃描數據集中的每個數據點ρ,判斷是否已經聚類,如果是則跳過,否則執(zhí)行下述過程;S144:判斷數據點ρ是否為核心數據點,如果是核心數據點,給它設置一個新的類標識;S145:對數據點ρ的ε領域內每一個數據點q進行判斷,如果未遍歷過,則為其設置相同的類標識;如果數據點q是核心數據點,則以該數據點q為核心數據點合并密度可達簇; S146 循環(huán)執(zhí)行上述過程,直到所有數據點都處理完。
6.根據權利要求5所述的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于 所述S15建立建筑能耗模式判定樹,采用C4. 5決策樹分類算法,具體包括以下步驟S151 對于能耗數據集D中每一個屬性A e D,通過以下公式來計算其信息增益Gain(A) = H(D)-^jp(D1)H(D1) ,H(D) = -^p1 Iog2 (^)i=l i=l其中Di為數據集D根據屬性A劃分為的子集,Pi為D中任意元組屬于類Ci的概率;S 表示類別的數目;S152:計算屬性A的信息增益率—⑷=,印出1 ⑷="(t,t,···,t) 其中,Gain(A)表示信息增益,SplitI (A)為分裂信息值; S153 選擇信息增益率最大的屬性A為分裂屬性,并在樹中創(chuàng)建節(jié)點; S154:根據新節(jié)點劃分能耗數據集D,如果新數據子集中的元組屬于同一類別,則分類完成,否則選擇剩下的屬性繼續(xù)進行劃分。
7.根據權利要求6所述的基于數據挖掘的公共建筑能耗實時監(jiān)測方法,其特征在于 所述S32中判別當前建筑能耗數據是否為能耗異常點,采用基于密度的LOF算法來檢測離群點,具體包括以下步驟5321輸入參數MinPts,MinPts表示鄰域中數據點最小數目;5322對能耗數據集D中每個數據點ρ進行鄰域查找,通過下列公式來計算其MinPts :MinPts-Distance(p)。其中,MinPts距離為數據點ρ到它的MinPts最近鄰的最大距離,即當某數據點ο滿足如下條件時,數據點P與數據點ο的距離d(p,ο)記為MinPts-Distance(P)①至少存在MinPts個數據點se 0\{ },使得(1( ,s) ^ d(p,o);②至多存在MinPts-I個數據點se 0\{ },使得(1( ,s)<d(p,o);5323查找數據點 ρ 的 MinPts 鄰域 inPts (ρ) = {d(p, q) ^ MinPts-Distance (ρ)}, 其中,d(p,q)表示數據點ρ和q的距離,可使用歐氏距離計算;5324通過以下公式來計算數據點ρ和數據點ο的可達距離reach-distMinPts(p,ο) reach_distMinPts (ρ,ο) = max {MinPts-Distance (ο),d(p,o)},其中,d(p,o)表示數據點P和O的距離,可使用歐氏距離計算;reach-distMinPts(p,ο) ^ ^ ! ! ;MinPts-Distance (ο) ^^ MinPts ;5325通過以下公式來計算數據點ρ的局部可達密度lrdMinPts(p)
全文摘要
本發(fā)明公開了一種基于數據挖掘的公共建筑能耗實時監(jiān)測方法,屬于建筑節(jié)能技術領域,包括以下步驟S1建立建筑能耗模式判定樹;S2實時采集建筑能耗數據;S3判別當前建筑能耗數據是否為能耗異常點,將當前建筑能耗數據與所屬建筑能耗模式判定樹進行模式匹配,判斷當前建筑能耗數據是否為離群點;本發(fā)明采用通過對歷史能耗數據進行聚類分析識別建筑物特有的能耗模式,對數據分類后獲得建筑能耗模式判定樹,在建筑能耗實時監(jiān)測過程中對動態(tài)采集的能耗數據進行模式匹配,與相同模式歷史數據進行離群點分析,可判別當前建筑能耗數據是否異常;該方法具有實時性、通用性和魯棒性好的特點。
文檔編號G06F19/00GK102289585SQ201110233589
公開日2011年12月21日 申請日期2011年8月15日 優(yōu)先權日2011年8月15日
發(fā)明者卿曉霞, 王波, 肖丹 申請人:重慶大學