本發(fā)明涉及車輛排放預測,具體為一種基于xgboost-svr組合模型的汽油車排放預測方法。
背景技術(shù):
1、隨著我國經(jīng)濟水平和人民生活水平的提高,機動車保有量也在快速增長,并且還存在巨大的增長空間。同時,機動車污染物排放量也在快速增長,汽車是污染物排放總量的主要貢獻者,其排放的co、hc、nox和pm超過90%。其中,汽油車co超過汽車排放總量的80%,hc超過70%。加強汽油車污染治理的緊迫性日益凸顯,控制汽車尾氣排放成為了提高環(huán)境質(zhì)量和人們生活質(zhì)量的關(guān)鍵。
2、國ⅵ標準是我國汽車污染物排放標準的最新版本,自2019年起開始實施,與此前的國ⅴ標準相比,國ⅵ標準對污染物的排放限制更加嚴格,進一步降低了汽油車和柴油車的尾氣排放限值,特別是對于一些重要的污染物,如氮氧化物、非甲烷總烴、顆粒物等,并要求所有汽車必須配備obd(車載診斷系統(tǒng))系統(tǒng),以確保車輛在正常行駛狀態(tài)下的排放水平符合標準。此外,國ⅵ標準還引入了歐ⅵ標準的實際行駛污染物排放(real?driveemission)試驗,pems設(shè)備因此發(fā)展起來,rde試驗得到的數(shù)據(jù)更能體現(xiàn)我國車輛在實際道路行駛時的真實污染水平。
3、為了嚴格限制汽車排放,一些國內(nèi)學者開始研究歐美國家開發(fā)的排放模型,機動車排放模型主要通過考慮特征參數(shù)(如車型、發(fā)動機技術(shù)、車速、行駛模式等)與排放率之間的關(guān)系來反映機動車的排放特征。但是目前,排放模型大部分是以臺架試驗數(shù)據(jù)為基礎(chǔ)建立的模型,實驗室標準測試循環(huán)只能提供特定工況下的排放數(shù)據(jù),無法完全反映車輛在實際道路行駛時面臨的復雜條件和工況變化。實際道路行駛涉及到不同的駕駛習慣、路況、環(huán)境溫度、車輛維護狀況等多種因素,這些因素都可能對車輛的污染物排放產(chǎn)生影響。
4、近年來,機器學習被應用在機動車排放預測領(lǐng)域,相關(guān)論文中,提到了基于機器學習建立的排放預測模型,但是大部分是單一模型,機動車污染物排放數(shù)據(jù)受到多種因素影響,是一種非平穩(wěn)、非線性的時間序列數(shù)據(jù),單一模型并不能很好的擬合,模型的實用性和穩(wěn)定性效果不是很理想,在不同工況下汽車的尾氣排放預測結(jié)果不太準確。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于xgboost-svr組合模型的汽油車排放預測方法,提高汽油車在復雜工況下對污染物排放量的預測精度,同時減少實際道路試驗的成本和時間投入。
2、為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):一種基于xgboost-svr組合模型的汽油車排放預測方法,包括以下步驟:
3、將便攜式排放測量系統(tǒng)安裝于汽油車上,進行實際道路行駛試驗,采集汽油車的co、nox、hc、pn四種污染物的瞬時排放數(shù)據(jù)及車輛行駛參數(shù),并進行時序校準處理;
4、采用奇異譜分析對所述污染物排放數(shù)據(jù)進行分解和重構(gòu),提取有效趨勢信息,剔除無用噪聲;
5、將處理后的污染物排放數(shù)據(jù)和車輛行駛參數(shù)劃分為訓練集、驗證集和測試集;
6、建立xgboost模型,通過輸入車輛行駛參數(shù),預測co、nox、hc、pn四種污染物的瞬時排放量;
7、基于驗證集計算預測值與實際值的殘差;
8、使用svr模型對所述殘差進行修正,得到最終的污染物排放預測值。
9、優(yōu)選的,所述采集汽油車的co、nox、hc、pn四種污染物的瞬時排放數(shù)據(jù)及車輛行駛參數(shù)的步驟包括:
10、將便攜式排放測量系統(tǒng)安裝在汽油車上,該系統(tǒng)包括氣體分析儀、尾氣流量計和車載診斷系統(tǒng);
11、按照國六標準的ⅱ型試驗規(guī)范進行實際道路行駛試驗,在試驗期間不間斷記錄污染物排放數(shù)據(jù)及車輛行駛參數(shù);
12、所采集的污染物排放數(shù)據(jù)包括co、nox、hc、pn四種污染物的瞬時排放濃度,車輛行駛參數(shù)包括車速、發(fā)動機轉(zhuǎn)速、排氣溫度、排氣流量、負荷百分比和燃油消耗率。
13、優(yōu)選的,所述時序校準處理的步驟包括:
14、氣體分析儀與尾氣流量計通過co排放濃度與排氣流量的峰值和谷值一致性進行校準;
15、車載診斷系統(tǒng)數(shù)據(jù)與氣體分析儀通過車速和co排放濃度進行對正;
16、全球定位系統(tǒng)數(shù)據(jù)和氣象站數(shù)據(jù)通過車速與車載診斷系統(tǒng)進行同步。
17、優(yōu)選的,所述采用奇異譜分析對所述污染物排放數(shù)據(jù)進行分解和重構(gòu)的步驟包括:
18、設(shè)定污染物排放數(shù)據(jù)為時間序列{x1,x2,...xn},將其構(gòu)造成軌跡矩陣x,軌跡矩陣的維度由窗口長度l和序列長度k=n-l+1確定,軌跡矩陣x表示為:
19、
20、其中,l為滑動窗口長度,l<n/2;
21、計算軌跡矩陣x的協(xié)方差矩陣s,定義為s=xxt協(xié)方差矩陣s用于表示時間序列不同片段間的相互關(guān)系;
22、對協(xié)方差矩陣s進行特征值分解,得到特征值λ1,λ2,…λl及其對應的特征向量u1,u2,…ul,特征值按照降序排列:
23、λ1>λ2>λ3>…>λl≥0
24、選擇前p個主要分量進行數(shù)據(jù)重構(gòu),重構(gòu)后的軌跡矩陣xp表示為:
25、
26、將重構(gòu)后的軌跡矩陣xp通過對角平均化轉(zhuǎn)換為重構(gòu)后的時間序列其中表示為:
27、
28、其中,l*=min(l,k),k*=max(l,k);
29、保留原始數(shù)據(jù)的主要趨勢信息,并剔除無用噪聲,生成優(yōu)化后的數(shù)據(jù)序列用于后續(xù)建模和預測。
30、優(yōu)選的,所述將處理后的污染物排放數(shù)據(jù)和車輛行駛參數(shù)劃分為訓練集、驗證集和測試集的步驟包括:
31、將經(jīng)過奇異譜分析處理后的污染物排放數(shù)據(jù)與車輛行駛參數(shù)進行整理,生成特征數(shù)據(jù)集;
32、按照3:1:1的比例將數(shù)據(jù)集劃分為訓練集、驗證集和測試集。
33、優(yōu)選的,所述建立xgboost模型,通過輸入車輛行駛參數(shù),預測co、nox、hc、pn四種污染物的瞬時排放量的步驟包括:
34、通過車輛行駛參數(shù)構(gòu)建輸入特征矩陣x=x1,x2,…,xm,將污染物排放量作為輸出y=y(tǒng)1,y2,…,yn;
35、使用xgboost模型,該模型由多棵回歸樹構(gòu)成,其預測公式為:
36、
37、其中,k為回歸樹的數(shù)量,fk(xi)表示第k棵回歸樹對樣本xi的預測值;
38、定義xgboost模型的目標函數(shù),該函數(shù)包括損失函數(shù)和正則化項:
39、
40、其中,ω(fk)為正則化項,表達式為:
41、
42、其中,t為葉子節(jié)點數(shù)量,ωj為第j個葉子節(jié)點的權(quán)重;
43、對目標函數(shù)進行泰勒二階展開,得到迭代更新的公式為:
44、
45、其中,gi與hi分別為目標函數(shù)的一階導數(shù)和二階導數(shù),為常數(shù)項;
46、將正則化項表達式代入目標函數(shù),得表達式:
47、
48、通過對葉子節(jié)點的權(quán)重進行優(yōu)化,更新權(quán)重的公式為:
49、
50、最優(yōu)目標函數(shù)為:
51、
52、其中,ij表示葉子結(jié)點的樣本集合;
53、通過網(wǎng)格搜索結(jié)合交叉驗證,優(yōu)化模型的超參數(shù),包括決策樹數(shù)量、學習率和樹的最大深度;
54、使用訓練集對xgboost模型進行訓練,最終對co、nox、hc、pn四種污染物的瞬時排放量進行預測,得到初步預測值
55、優(yōu)選的,所述基于驗證集計算預測值與實際值的殘差的步驟包括:
56、在驗證集中使用已訓練好的xgboost模型對每個特征向量xi進行預測,得到預測值其中yi為實際值;
57、使用以下公式計算每個樣本的殘差ei:
58、
59、對驗證集中的所有樣本計算殘差,生成殘差序列,該序列反映xgboost模型預測值與實際值之間的偏差。
60、優(yōu)選的,所述使用支持向量回歸模型對所述殘差進行修正,得到最終的污染物排放預測值的步驟包括:
61、將通過驗證集計算得到的殘差序列作為支持向量回歸模型的目標變量,使用對應的車輛行駛參數(shù)作為輸入特征;
62、構(gòu)建支持向量回歸模型,使用核函數(shù)進行非線性映射,選擇徑向基核函數(shù);
63、將所述xgboost模型對co、nox、hc、pn四種污染物瞬時排放量的初步預測值和svr模型對殘差的預測值相加,得到xgboost-svr組合模型對汽油車co、nox、hc、pn四種污染物的瞬時排放量的最終預測結(jié)果,具體為:
64、
65、其中,為xgboost模型對co、nox、hc、pn四種污染物瞬時排放量的初步預測值,為svr模型對殘差的預測值。
66、優(yōu)選的,所述方法還包括:采用歸一化均方根誤差和決定系數(shù)在測試集中對所述xgboost-svr組合模型的方法進行評估步驟。
67、本發(fā)明還提供一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時,實現(xiàn)如上述的方法。
68、本發(fā)明還提供一種存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上述的方法。
69、本發(fā)明提供了一種基于xgboost-svr組合模型的汽油車排放預測方法。具備以下有益效果:
70、1、本發(fā)明通過結(jié)合xgboost和svr模型,xgboost模型利用多棵回歸樹處理車輛行駛參數(shù)與污染物排放的復雜非線性關(guān)系,而svr模型通過殘差修正進一步提高了預測的準確性。這種組合模型能夠有效減少預測誤差,顯著提升了復雜工況下對co、nox、hc、pn四種污染物瞬時排放量的預測精度。
71、2、本發(fā)明采用奇異譜分析(ssa)對污染物排放數(shù)據(jù)進行分解與重構(gòu),提取出有效的趨勢信息,剔除數(shù)據(jù)中的噪聲和異常值。這一過程確保了模型訓練數(shù)據(jù)的質(zhì)量,使得模型能夠更加精確地捕捉到污染物排放的主要特征,避免了噪聲干擾對預測結(jié)果的影響。
72、3、本發(fā)明通過精確的排放預測,減少了依賴大量道路試驗獲取數(shù)據(jù)的需求,降低了rde(實際道路排放)試驗的頻率和時間投入。有效的模型預測能夠替代部分試驗過程,節(jié)約了實驗成本和資源消耗,提高了預測效率。
73、4、本發(fā)明xgboost與svr的結(jié)合使得能夠應對多樣化的道路工況和車輛運行狀態(tài),通過合理的超參數(shù)優(yōu)化和殘差修正,提升了模型的泛化能力,使其在不同的測試環(huán)境和復雜工況下依然能夠保持較高的預測準確性。