本發(fā)明涉及一種基于專用道公交車輛歷史數(shù)據(jù)的駐站時間預測方法。
背景技術:
近年來隨著城市道路交通擁堵現(xiàn)象的愈加嚴重,便捷高效地出行方式成為緩解擁堵的迫切需求?!秶鴦赵宏P于城市優(yōu)先發(fā)展公共交通的指導意見》指出發(fā)展公交優(yōu)先是緩解擁堵的必然要求。2015年北京市出臺《公交專用車道設置規(guī)范》,要求符合相關條件的道路全面實施公交專用道。然而公交車輛駐站時間的波動變化將直接影響到公交車輛的路段時空軌跡分布,在路阻函數(shù)、建模仿真、評價線網(wǎng)、公交信號優(yōu)先控制等領域的研究中有重要作用,因此國內(nèi)外眾多學者對公交車輛駐站時間預測方面進行了大量研究。
由于公交車輛自身所區(qū)別于社會車輛的特點較為明顯,因此有學者將公交駐站時間預測同影響公交車輛駐站的因素、公交車輛??窟^程等相關聯(lián)進行研究。隨著交通檢測設備的改進,基于對公交車輛歷史數(shù)據(jù)回歸分析也成為可能,在傳統(tǒng)的回歸分析方法之上結合卡爾曼濾波、最小二乘法估計、基因表達程序、支持向量機等算法建立了公交駐站時間同公交車頭時距、路段運行時間、準點率等因素的預測分析模型。隨著人工智能在當今科學技術中的飛速發(fā)展和應用,給公交車輛的駐站時間預測提供了新的研究思路,利用k近鄰、神經(jīng)網(wǎng)絡、貝葉斯深度學習等算法搭建公交車輛的位置、速度、車頭時距等多因素綜合影響下的駐站時間預測模型。但是這些策略仍存在以下問題:
①公交駐站時間預測方法研究中,應考慮到不同時段乘客出行及公交運行特征對公交駐站時間的影響;
②基于回歸分析的公交駐站時間預測是其中重要方法之一,但由于公交駐站時間的強隨機性,僅靠單一的回歸模型難以描述公交駐站時間與其主要影響因素間的關系,應考慮建立回歸模型庫,并隨著觀測數(shù)據(jù)的更新使庫內(nèi)回歸模型持續(xù)優(yōu)化。
技術實現(xiàn)要素:
為了獲得一種能夠基于專用道公交車輛同一班次前后車到站時間間隔跟后車駐站時間之間數(shù)據(jù)規(guī)律進行專用道公交車輛駐站時間預測分析的方法,進而得到精準的專用道公交車輛的駐站時間預測結果。針對現(xiàn)行專用道公交駐站時間預測策略存在的不足,本發(fā)明的針對專用道公交車輛和社會車輛的運行特點設置了一種新的專用道公交駐站時間預測方法,具體采用如下技術方案:該方法包括如下步驟:
(1)將班次、進出站時間信息依照時間先后關系構造數(shù)據(jù)矩陣a,其中:
anumn為第n輛車班次,aarrn和adepn分別為第n輛車的到站時間和離站時間;
(2)將前后車到站時間間隔tb與本班次后車駐站時間ts構成數(shù)據(jù)矩陣b,其中:
b=[tbts];
(3)令矩陣b中數(shù)據(jù)組為n組,取其前0.8n組數(shù)據(jù)為訓練矩陣btrain=[tbts],其余的數(shù)據(jù)構成驗證矩陣
(4)對數(shù)據(jù)矩陣b中tb和ts利用多項式回歸、指數(shù)回歸、對數(shù)函數(shù)回歸策略進行回歸分析并生成回歸分析數(shù)據(jù),得到全階段回歸函數(shù)簇為:
(5)從數(shù)據(jù)矩陣btrain中尋找最大的tb,記為tbmax,采用聚類算法將tb分為m組;對每個分組內(nèi)數(shù)據(jù)執(zhí)行多項式回歸、指數(shù)回歸、對數(shù)函數(shù)回歸策略進行回歸分析并生成回歸分析函數(shù)簇,得到分階段回歸函數(shù)簇為:
(6)將得到的全階段回歸函數(shù)簇和分階段回歸函數(shù)簇,利用皮爾遜系數(shù)進行相關度檢驗,具體如下:
其中:r為相關度,x為實際檢測得出的駐站時間,y為根據(jù)回歸模型預測得出駐站時間,n為數(shù)組組數(shù);
(7)選擇步驟(6)中相關度高的函數(shù)做為公交駐站時間預測模型,記為f(x),將驗證矩陣bcheck中的tby作為模型輸入,輸出預測駐站時間pretime=f(tby)。
優(yōu)選地,還包括如下步驟:
(8)采用平均預測精度衡量預測結果,具體如下:
其中:preacc為平均預測精度;realtime為公交車輛真實駐站時間;pretime為公交車輛駐站預測時間。
優(yōu)選地,還包括如下步驟:
(9)采用如下優(yōu)化判斷流程:若e<q,返回步驟(4),利用新數(shù)據(jù)對預測模型參數(shù)微調(diào)整,并剔除超出誤差閾值的點;若e>q,返回步驟(2),利用新數(shù)據(jù)更新預測模型,并驗證新模型的預測效果,剔除失效數(shù)據(jù),其中,e為平均誤差,q為誤差閾值。
附圖說明
圖1是本發(fā)明的方法流程圖。
圖2是本發(fā)明的聚類算法流程圖。
具體實施方式
(1)在專用道公交站點以視頻采集為主、人工采集為輔的采集專用道公交的??啃畔ⅲ饕杉男畔▽S玫拦卉囕v的車輛班次、到站時刻、離站時刻和駐站時間等。公交車輛到站時刻即公交車輛在站內(nèi)駐站停穩(wěn)時刻;公交車輛離站時刻即公交車輛在站內(nèi)啟動離開時刻;公交車輛駐站時間即公交車輛到站時刻與離站時刻間的時間間隔;前后車到站時間間隔即前車的到站時刻與后車的到站時刻間的時間間隔。
將班次、進出站時間信息依照時間先后關系構造數(shù)據(jù)矩陣a,其中:
anumn為第n輛車班次,aarrn和adepn分別為第n輛車的到站時間和離站時間
(2)根據(jù)專用道公交車輛的到站類型,按類進行數(shù)據(jù)篩選。將所采集到的信息按照班次區(qū)分開來,并將每一班次中前后車的到站時間間隔同后車的駐站時間做數(shù)據(jù)相關處理,并構成數(shù)據(jù)矩陣。專用道公交車輛到站情況定義為以下幾類:
a、前方無車輛駐站
b、前方有車輛駐站且駐站車輛包含本班次
c、前方有車輛駐站且駐站車輛不含本班次
依照所要分析的特定班次需求,將本班次的前后車到站時間間隔tb同本班次后車駐站時間ts構成數(shù)據(jù)矩陣b,其中:
b=[tbts];
(3)令矩陣b中數(shù)據(jù)組為n組,取其前0.8n組數(shù)據(jù)為訓練矩陣btrain=[tbts],其余的數(shù)據(jù)構成驗證矩陣
針對現(xiàn)行的單一形式回歸效果不好的問題,本專利采用了多形式回歸分析形式。針對根據(jù)公交車輛前后車到站時間間隔同后車駐站時間的分布特點,采用全階段回歸及分階段回歸兩種方法,其定義如下:
全階段回歸:將公交車輛前后車到站時間間隔同后車駐站時間的所有組合按照所選用的回歸函數(shù)進行回歸分析;
分階段回歸:將公交車輛前后車到站時間間隔同后車駐站時間的所有組合按照前后到站時間間隔大小設置不同的階段,在每個階段采用不同的回歸函數(shù)進行擬合。
(4)進行全階段回歸:對數(shù)據(jù)矩陣b中tb和ts利用多項式回歸、指數(shù)回歸、對數(shù)函數(shù)回歸策略進行回歸分析,并生成回歸分析數(shù)據(jù),其回歸形式如下:
y=a1xm+a2xm-1+…+amx+b
y=|a×ln(cx+ε)+b|,limε→0
得到全階段回歸函數(shù)簇為
(5)進行分階段回歸,從數(shù)據(jù)矩陣btrain中尋找最大的tb,記為tbmax,采用聚類算法將tb分為m組;具體步驟如圖2所示。根據(jù)分組,對每個分組內(nèi)數(shù)據(jù)執(zhí)行多項式回歸、指數(shù)回歸、對數(shù)函數(shù)回歸策略進行回歸分析,并生成回歸分析函數(shù)簇;
得到分階段回歸函數(shù)簇為:
(6)將得到的全階段回歸函數(shù)簇和分階段回歸函數(shù)簇,利用皮爾遜系數(shù)進行相關度檢驗,具體如下:
其中:r為相關度,x為實際檢測得出的駐站時間,y為根據(jù)回歸模型預測得出駐站時,n為數(shù)組組數(shù)。
(7)依照表1相關度關系表篩選最佳預測效果函數(shù):
表1相關度關系表
并將此函數(shù)做為公交駐站時間預測模型,記為f(x)。將驗證矩陣bcheck中的tby作為模型輸入,故其預測駐站時間為
pretime=tsy=f(tby)
(8)采用平均預測精度衡量預測結果,具體如下:
其中:preacc為平均預測精度;realtime為公交車輛真實駐站時間;pretime為公交車輛駐站預測時間
(9)為了增加模型的預測效果的動態(tài)優(yōu)化,引入了平均誤差作為反饋輸入量,通過對平均誤差與誤差均值的對比關系,確定不同的模型優(yōu)化策略。通過平均誤差e和誤差閾值q的關系,選用不同的優(yōu)化模式。其中e和q的獲取過程如下:
設x表示前后車的到站時間間隔,g(x)表示前后車到站時間間隔為x時后車的駐站時間,f(x)為該班次的駐站時間分布密度函數(shù),它反映該班次的駐站特性,因此該班次的駐站時間為
用概率語言來說,g是隨機變量g(x)的數(shù)學期望,即
e=g=e(g(x))
對于誤差閾值的判斷采用的是k-means聚類算法對各時間段的駐站時間進行聚類,通過尋找聚類邊界m,因此各階段的誤差閾值為:
q=|m-g(x)|
其優(yōu)化判斷流程如下:
1、e<q,返回step3,利用新數(shù)據(jù)對預測模型參數(shù)微調(diào)整,并剔除超出誤差閾值的點;
2、e>q,返回step2,利用新數(shù)據(jù)更新預測模型,并驗證新模型的預測效果。剔除失效數(shù)據(jù)。