本發(fā)明涉及碳排放數(shù)據(jù)分析,尤其涉及一種基于隨機森林的高速公路橋梁碳排放預測方法。
背景技術:
1、橋梁作為特殊的交通基礎設施,具有體量大、施工周期長等特點,其建設施工過程中將產(chǎn)生大量的碳排放,碳排放問題備受關注。
2、目前,碳排放預測大多是針對交通運輸業(yè)碳排放進行預測。然而,針對高速公路橋梁碳排放主要從全生命周期角度出發(fā),對整體碳排放進行核算,缺乏高速公路橋梁碳排放預測方法。同時,現(xiàn)有技術主要利用工程施工過程中的實際能耗數(shù)據(jù)進行統(tǒng)計核算,無法在設計階段計算出碳排放量,不能對設計階段的節(jié)能減碳的施工方案進行優(yōu)化指導。
技術實現(xiàn)思路
1、本發(fā)明所要解決的技術問題是:提供一種基于隨機森林的高速公路橋梁碳排放預測方法,有效解決背景技術中的問題。
2、為了達到上述目的,本發(fā)明所采用的技術方案是:一種基于隨機森林的高速公路橋梁碳排放預測方法,包括如下步驟:
3、s1:采集獲取不同高速公路橋梁工程項目碳排放數(shù)據(jù),構建碳排放數(shù)據(jù)集;
4、s2:對數(shù)據(jù)集進行預處理;
5、s3:通過相關性分析和灰色關聯(lián)分析,對采集到的數(shù)據(jù)進行碳排放預測特征變量分析,選取特征變量,作為橋梁碳排放預測模型輸入;
6、s4:利用選取的特征變量,構建生成最終數(shù)據(jù)集,將數(shù)據(jù)集劃分為訓練集和預測集;
7、s5:將數(shù)據(jù)集輸入至隨機森林中,采用網(wǎng)格搜索和10折交叉驗證法,確定隨機森林的最佳決策樹數(shù)量t和決策樹最大深度h,構建碳排放預測模型;
8、s6:利用訓練集數(shù)據(jù),對碳排放預測模型進行訓練,獲得預測效果;
9、s7:利用預測集數(shù)據(jù),對碳排放預測模型進行預測,驗證模型的可行性。
10、進一步地,所述步驟s1的所述碳排放數(shù)據(jù)包括不同橋梁工程項目的碳排放量數(shù)據(jù)以及特征變量數(shù)據(jù),分別包括橋梁車道數(shù)量、橋梁長度、橋梁面積、樁基礎、橋梁承臺、系梁、橋墩、預應力混凝土空心板、預應力混凝土小箱梁、現(xiàn)澆混凝土連續(xù)梁、瀝青混凝土鋪裝、水泥混凝土鋪裝、橋梁支座、伸縮縫、護欄與護網(wǎng)、其他工程。
11、進一步地,所述步驟s2中所述預處理包括對數(shù)據(jù)進行歸一化處理,即映射到[0,1]范圍內(nèi),即:
12、
13、式中,xi(normalized)為歸化后的樣本數(shù)據(jù);xi為樣本原始數(shù)據(jù);xi(min)為樣本數(shù)據(jù)最小值;ximax為樣本數(shù)據(jù)最大值。
14、進一步地,所述步驟s3中所述相關性分析具體包括:
15、采用spearman秩相關系數(shù)分析特征變量與碳排放量的相關性,計算特征變量的相關性系數(shù):
16、
17、其中,是相關性系數(shù),di是每對觀測值的秩次之差,n是觀測值的數(shù)量;
18、判斷是否通過0.01顯著性檢驗,若特征變量與碳排放無相關,不選取該特征變量;若特征變量與碳排放相關,選取該特征變量。
19、進一步地,所述步驟s3中所述灰色關聯(lián)分析包括計算灰色關聯(lián)度:
20、
21、其中,分別為極差最小值和極差最大值,ρ為分辨率。
22、進一步地,所述步驟s4中對數(shù)據(jù)集進行劃分時,將80%的數(shù)據(jù)集作為訓練集,20%的數(shù)據(jù)集作為預測集。
23、進一步地,所述步驟s5中利用網(wǎng)格搜索和10折交叉驗證,具體過程包括:
24、數(shù)據(jù)集劃分為互斥的10個子集,按順序選取其中1個子集作為模型驗證集,剩余9個子集合作為訓練集,基于訓練集進行模型的學習并在驗證集上進行測試,通過對比10組的各個評價指標的準確率確定模型最佳參數(shù)。
25、進一步地,將所述隨機森林的決策樹最大深度h設置為10,將決策樹數(shù)量t設置為25。
26、進一步地,所述步驟s6中對碳排放預測模型進行訓練,利用決定性系數(shù)r2判斷碳排放預測模型的精準度,決定性系數(shù)r2等于回歸模型中預測值所引起的變異與實際子集總變異的比:
27、
28、其中,n為訓練集中的樣本總量,yi為訓練集中的碳排放預測值,為所有訓練集中yi的平均值,為利用隨機森林回歸模型所獲得的第i個樣本子集的碳排放預測值。
29、進一步地,所述步驟s7中采用平均絕對誤差、均方誤差、平均絕對百分比誤差對碳排放預測模型的效果進行驗證評估;
30、平均絕對誤差mae計算公式為:
31、
32、其中,n為樣本個數(shù),yi為真實值,為預測值;
33、均方誤差mse計算公式為:
34、
35、其中,n為樣本個數(shù),yi為真實值,為預測值;
36、平均絕對百分比誤差mape計算公式為:
37、
38、其中,n為樣本個數(shù),yi為真實值,為預測值;
39、與現(xiàn)有技術相比,本發(fā)明的有益效果為:本發(fā)明的一種基于隨機森林的高速公路橋梁碳排放預測方法,能夠便于設計單位對新建高速公路橋梁的碳排放進行預計,并彌補當前高速公路橋梁建設碳排放核算數(shù)據(jù)的缺失,為前期施工方案節(jié)能降碳設計進行優(yōu)化指導,將有助于減少高速公路橋梁建設期的碳排放,促進交通行業(yè)可持續(xù)發(fā)展。
1.一種基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,包括如下步驟:
2.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s1的所述碳排放數(shù)據(jù)包括不同橋梁工程項目的碳排放量數(shù)據(jù)以及特征變量數(shù)據(jù)。
3.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s2中所述預處理包括對數(shù)據(jù)進行歸一化處理,即映射到[0,1]范圍內(nèi),即:
4.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s3中所述相關性分析具體包括:
5.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s3中所述灰色關聯(lián)分析包括計算灰色關聯(lián)度:
6.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s4中對數(shù)據(jù)集進行劃分時,將80%的數(shù)據(jù)集作為訓練集,20%的數(shù)據(jù)集作為預測集。
7.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s5中利用網(wǎng)格搜索和10折交叉驗證,具體過程包括:
8.根據(jù)權利要求7所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,將所述隨機森林的決策樹最大深度h設置為10,將決策樹數(shù)量t設置為25。
9.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s6中對碳排放預測模型進行訓練,利用決定性系數(shù)r2判斷碳排放預測模型的精準度,決定性系數(shù)r2等于回歸模型中預測值所引起的變異與實際子集總變異的比:
10.根據(jù)權利要求1所述的基于隨機森林的高速公路橋梁碳排放預測方法,其特征在于,所述步驟s7中采用平均絕對誤差、均方誤差、平均絕對百分比誤差對碳排放預測模型的效果進行驗證評估。