本發(fā)明涉及智慧社區(qū),尤其涉及一種基于數(shù)據(jù)分析的建筑低碳運營管理方法。
背景技術:
1、在建筑低碳運營管理中,如何從海量的建筑運營數(shù)據(jù)中識別出對建筑能耗和碳排放影響較大的關鍵因素是一個關鍵的技術問題。由于建筑運營涉及能耗、設備運行、人員活動等多個維度,不同建筑的運營特點差異較大,導致影響建筑能耗和碳排放的因素錯綜復雜。此外,建筑運營數(shù)據(jù)通常呈現(xiàn)高維度、非線性的特點,增加了數(shù)據(jù)分析和特征提取的難度。因此,亟需一種有效的數(shù)據(jù)分析方法,能夠從建筑運營數(shù)據(jù)中自動學習提取關鍵特征,并量化各特征對建筑能耗和碳排放的影響程度。同時,由于不同建筑的運營特點存在差異,提取出的關鍵特征可能隨時間發(fā)生變化,需要數(shù)據(jù)分析方法能夠適應這種動態(tài)變化,持續(xù)學習和優(yōu)化特征向量,以保證建筑低碳運營管理的精準性和有效性。
技術實現(xiàn)思路
1、本發(fā)明的目的在于克服上述一種或多種現(xiàn)有的技術問題,提供一種基于數(shù)據(jù)分析的建筑低碳運營管理方法。
2、為實現(xiàn)上述目的,本發(fā)明提供的一種基于數(shù)據(jù)分析的建筑低碳運營管理方法,包括:
3、獲取建筑能耗數(shù)據(jù)、碳排放數(shù)據(jù)和節(jié)能措施數(shù)據(jù),對數(shù)據(jù)進行預處理,剔除缺失值和異常值,并進行數(shù)據(jù)標準化處理,得到標準化后的多維數(shù)據(jù)集合;
4、針對標準化后的多維數(shù)據(jù)集合,采用主成分分析法進行特征提取,通過計算協(xié)方差矩陣的特征值和特征向量,選取特征值較大的前k個主成分作為新的特征空間,得到降維后的特征數(shù)據(jù)集;
5、將降維后的特征數(shù)據(jù)集作為輸入,利用隨機森林算法構建信用評級預測模型,通過對決策樹的集成學習,計算各特征對評級結果的重要性得分;
6、根據(jù)特征重要性得分排序結果,選取得分較高的前n個特征作為關鍵特征因子,構建信用評估特征向量;
7、持續(xù)收集建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù),對特征向量進行定期更新,若評估反饋數(shù)據(jù)量達到預設閾值,則觸發(fā)特征向量更新流程,重新計算特征重要性得分,更新關鍵特征因子;
8、對建筑運營數(shù)據(jù)進行挖掘分析,識別潛在特征因子,若新特征與已有特征向量的相關性低于預設閾值,則將其納入特征池。
9、根據(jù)本發(fā)明的一個方面,獲取建筑能耗數(shù)據(jù)、碳排放數(shù)據(jù)和節(jié)能措施數(shù)據(jù),針對數(shù)據(jù)進行預處理,判斷數(shù)據(jù)中是否存在缺失值和異常值,若存在缺失值和異常值,則剔除缺失值和異常值數(shù)據(jù);
10、根據(jù)預處理后的建筑能耗數(shù)據(jù)、碳排放數(shù)據(jù)和節(jié)能措施數(shù)據(jù),采用數(shù)據(jù)標準化算法對各維度數(shù)據(jù)進行標準化處理,得到標準化后的多維數(shù)據(jù)集合;
11、針對標準化后的多維數(shù)據(jù)集合,采用主成分分析算法提取數(shù)據(jù)集合的主要特征,降低數(shù)據(jù)維度,得到降維后的數(shù)據(jù)集合;
12、根據(jù)降維后的數(shù)據(jù)集合,采用k-means聚類算法對數(shù)據(jù)進行聚類分析,根據(jù)聚類結果將數(shù)據(jù)劃分為若干個聚類簇,得到聚類簇集合;
13、針對每個聚類簇,基于建筑能耗數(shù)據(jù)、碳排放數(shù)據(jù)和節(jié)能措施數(shù)據(jù),構建能耗預測模型,預測未來一段時間內(nèi)建筑的能耗情況和碳排放情況;
14、根據(jù)聚類簇的能耗預測結果和碳排放預測結果,判斷各聚類簇的節(jié)能潛力,確定節(jié)能改造的優(yōu)先級,得到節(jié)能改造方案;
15、針對節(jié)能改造方案,采用多目標優(yōu)化算法,優(yōu)化節(jié)能措施參數(shù),得到最優(yōu)的節(jié)能改造實施方案。
16、根據(jù)本發(fā)明的一個方面,根據(jù)標準化后的多維數(shù)據(jù)集合,構建協(xié)方差矩陣,采用奇異值分解算法對協(xié)方差矩陣進行分解,得到特征值和對應的特征向量;
17、根據(jù)特征值的大小,按照從大到小的順序?qū)μ卣髦颠M行排序,選取前k個最大的特征值對應的特征向量,作為主成分向量;
18、針對標準化后的多維數(shù)據(jù)集合,將每個數(shù)據(jù)樣本與所述主成分向量進行內(nèi)積運算,得到樣本在主成分空間中的投影坐標;
19、根據(jù)投影坐標與主成分向量的對應關系,獲取每個樣本在主成分空間中的坐標表示,得到降維后的特征數(shù)據(jù)集;
20、針對降維后的特征數(shù)據(jù)集,采用k-means聚類算法進行數(shù)據(jù)聚類,通過迭代優(yōu)化每個聚類中心的位置,最小化樣本到聚類中心的距離平方和,直至聚類中心不再發(fā)生變化,得到最終的聚類結果;
21、根據(jù)聚類結果,將不同類別的樣本進行區(qū)分,對于每個類別,計算類內(nèi)樣本的均值向量,作為該類別的代表向量;
22、根據(jù)代表向量之間的距離關系,構建類別之間的距離矩陣,采用層次聚類算法對代表向量進行聚類,得到類別之間的層次結構關系,實現(xiàn)對標準化后的多維數(shù)據(jù)集合的高層語義表示。
23、根據(jù)本發(fā)明的一個方面,獲取信用評級相關的原始數(shù)據(jù),對數(shù)據(jù)進行預處理,去除噪聲和異常值,并進行特征選擇和特征提??;
24、采用主成分分析等降維算法對特征數(shù)據(jù)進行降維處理,得到降維后的特征數(shù)據(jù)集合;
25、將降維后的特征數(shù)據(jù)集合劃分為訓練集和測試集,訓練集用于訓練隨機森林模型,測試集用于評估模型性能;
26、根據(jù)預設的隨機森林參數(shù),構建隨機森林模型,并使用訓練集數(shù)據(jù)對模型進行訓練,得到訓練后的隨機森林模型;
27、將測試集數(shù)據(jù)輸入到訓練后的隨機森林模型中,進行信用評級預測,得到預測結果;
28、通過特征重要性評估算法,計算各個特征對信用評級預測結果的重要性得分,根據(jù)重要性得分對特征進行排序;
29、根據(jù)特征重要性排序結果,選擇重要性得分較高的特征作為信用評級預測的關鍵特征。
30、根據(jù)本發(fā)明的一個方面,獲取信用評估相關的原始特征數(shù)據(jù),對特征進行預處理,包括缺失值處理、異常值處理和數(shù)據(jù)歸一化;
31、采用機器學習算法基于預處理后的特征數(shù)據(jù)訓練信用評估模型,并通過特征重要性評估方法計算每個特征的重要性得分;
32、根據(jù)特征重要性得分對所有特征進行降序排序,選取得分較高的前n個特征作為關鍵特征因子;
33、基于選取的關鍵特征因子,構建信用評估特征向量,形成優(yōu)化后的特征子集;
34、基于優(yōu)化后的特征向量訓練信用評估模型,得到最終的信用風險預測結果;
35、將信用風險預測結果與預設的風險等級閾值進行比較,判斷用戶的信用風險等級,輸出信用評估報告。
36、根據(jù)本發(fā)明的一個方面,獲取建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù),根據(jù)預設的數(shù)據(jù)格式和數(shù)據(jù)標準對數(shù)據(jù)進行清洗和標準化處理,得到標準化的建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù);
37、針對標準化的建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù),采用主成分分析算法提取數(shù)據(jù)的主要特征,得到代表數(shù)據(jù)主要特征的特征向量;
38、根據(jù)特征向量,采用隨機森林算法計算各個特征的重要性得分,根據(jù)重要性得分排序,確定關鍵特征因子;
39、持續(xù)獲取最新的建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù),判斷數(shù)據(jù)量是否達到預設閾值,若達到閾值則觸發(fā)特征向量更新流程;
40、在特征向量更新流程中,將最新的建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù)與原有數(shù)據(jù)合并,重新進行主成分分析,得到更新后的特征向量;
41、根據(jù)更新后的特征向量,重新計算各個特征的重要性得分,并根據(jù)重要性得分排序,更新關鍵特征因子。
42、根據(jù)本發(fā)明的一個方面,獲取建筑運營數(shù)據(jù),采用數(shù)據(jù)挖掘算法持續(xù)分析數(shù)據(jù),識別出新的潛在特征因子;
43、計算新特征與已有特征向量的相關性,若相關性低于預設閾值,則將新特征納入特征池,根據(jù)豐富后的特征池,構建信用評估模型;
44、獲取業(yè)務需求的變化情況,若出現(xiàn)新的業(yè)務需求,則觸發(fā)模型更新機制;
45、針對新的業(yè)務需求,從建筑運營數(shù)據(jù)中持續(xù)挖掘新的潛在特征因子;
46、將挖掘出的新特征因子與已有特征池進行相關性計算,若相關性低于預設閾值,則納入特征池,利用更新后的特征池重新訓練信用評估模型。
47、為實現(xiàn)上述目的,本發(fā)明提供一種基于數(shù)據(jù)分析的建筑低碳運營管理系統(tǒng),包括:
48、數(shù)據(jù)獲取處理模塊:獲取建筑能耗數(shù)據(jù)、碳排放數(shù)據(jù)和節(jié)能措施數(shù)據(jù),對數(shù)據(jù)進行預處理,剔除缺失值和異常值,并進行數(shù)據(jù)標準化處理,得到標準化后的多維數(shù)據(jù)集合;
49、特征數(shù)據(jù)集獲取模塊:針對標準化后的多維數(shù)據(jù)集合,采用主成分分析法進行特征提取,通過計算協(xié)方差矩陣的特征值和特征向量,選取特征值較大的前k個主成分作為新的特征空間,得到降維后的特征數(shù)據(jù)集;
50、特征評分模塊:將降維后的特征數(shù)據(jù)集作為輸入,利用隨機森林算法構建信用評級預測模型,通過對決策樹的集成學習,計算各特征對評級結果的重要性得分;
51、特征向量構建模塊:根據(jù)特征重要性得分排序結果,選取得分較高的前n個特征作為關鍵特征因子,構建信用評估特征向量;
52、關鍵因子篩取模塊:持續(xù)收集建筑運營數(shù)據(jù)和評估反饋數(shù)據(jù),對特征向量進行定期更新,若評估反饋數(shù)據(jù)量達到預設閾值,則觸發(fā)特征向量更新流程,重新計算特征重要性得分,更新關鍵特征因子;
53、特征因子更新模塊:對建筑運營數(shù)據(jù)進行挖掘分析,識別潛在特征因子,若新特征與已有特征向量的相關性低于預設閾值,則將其納入特征池。
54、為實現(xiàn)上述目的,本發(fā)明提供一種電子設備,包括處理器、存儲器及存儲在存儲器上并可在處理器上運行的計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)上述針對一種基于數(shù)據(jù)分析的建筑低碳運營管理方法。
55、為實現(xiàn)上述目的,本發(fā)明提供一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)上存儲計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)上述針對一種基于數(shù)據(jù)分析的建筑低碳運營管理方法。
56、基于此,本發(fā)明的有益效果在于:通過收集建筑能耗、碳排放和節(jié)能措施數(shù)據(jù),對數(shù)據(jù)進行預處理和標準化,然后利用主成分分析法進行降維,提取關鍵特征。隨后,采用隨機森林算法構建預測模型,計算特征重要性得分,選取高分特征構建評估向量,實現(xiàn)了動態(tài)更新機制,通過持續(xù)收集運營數(shù)據(jù)和評估反饋,定期更新特征向量,并挖掘新的潛在特征因子,不斷豐富評估維度。這種自適應方法能夠提升模型的泛化能力,適應變化的業(yè)務需求,為建筑信用評級提供更準確、全面的評估結果,有效支持綠色建筑發(fā)展和節(jié)能減排目標的實現(xiàn)。