本發(fā)明涉及智能交通,尤其涉及一種相位式交叉口的交通狀態(tài)精細(xì)化辨識方法。
背景技術(shù):
1、數(shù)據(jù)顯示,截止至2023年初,我國城鎮(zhèn)化率已達(dá)65.22%,城際出行需求不斷增長,機(jī)動車保有量突破4億輛。近年來,城市道路與高速公路銜接區(qū)的交通流狀態(tài)復(fù)雜,擁堵現(xiàn)象嚴(yán)重。交通需求持續(xù)增加,在城市內(nèi)外道路交通銜接區(qū)交叉口的交通供需矛盾日益凸顯,交通擁堵已成為制約區(qū)域經(jīng)濟(jì)發(fā)展、影響交通服務(wù)質(zhì)量、破壞區(qū)域生態(tài)環(huán)境的嚴(yán)重隱患。其中,城市內(nèi)外道路交通銜接區(qū)交叉口作為道路交通系統(tǒng)的重要節(jié)點(diǎn),大量車流在此匯集、交織,極易產(chǎn)生交通擁堵,限制著路網(wǎng)運(yùn)行效率。交通信息處理與應(yīng)用的結(jié)構(gòu)、算法、通信等技術(shù),是現(xiàn)代智能交通系統(tǒng)(intelligent?transportation?systems,?its)領(lǐng)域重點(diǎn)研究的對象。目前,交管部門主要通過its的交通誘導(dǎo)系統(tǒng)和交通控制系統(tǒng)來緩解道路擁堵狀況,如果能夠?qū)徊婵诟浇韭范蔚慕煌顟B(tài)變化進(jìn)行適時、準(zhǔn)確地判斷,可提升交通誘導(dǎo)的精度和交通管控的效果,并同時提高城市交通和公路交通的可靠性及有效性。
2、目前,在智能交通系統(tǒng)研究領(lǐng)域中,交通運(yùn)行狀態(tài)的辨識已經(jīng)成為一個研究熱點(diǎn).準(zhǔn)確、實(shí)時的交通狀態(tài)辨識有助于交通管理部門及時了解和掌握交通運(yùn)行狀況,同時也便于交通管理部門提前預(yù)估并制定交通擁堵的疏導(dǎo)決策方案,對緩解交通擁堵具有重要意義.。因此,國內(nèi)外許多學(xué)者對交通狀態(tài)辨識的研究給予了高度的關(guān)注。
3、早期的交通狀態(tài)辨識大多采用單一原理的設(shè)計(jì)方法,如統(tǒng)計(jì)分析、比較法及理論模型等。隨著先進(jìn)技術(shù)在交通領(lǐng)域的發(fā)展,交通狀態(tài)辨識算法的發(fā)展方向已經(jīng)由單一方法的改進(jìn),轉(zhuǎn)變?yōu)榉椒ㄅc理論的多元化發(fā)展,并取得了較好的成果。然而,目前主要的研究重點(diǎn)主要集中在路網(wǎng)整體或聚焦于擁堵路段,普遍將交叉口作為路網(wǎng)中的一個節(jié)點(diǎn)進(jìn)行研究,或者只是簡單的尋找表示交叉口處狀態(tài)的參數(shù),對交通狀態(tài)進(jìn)行劃分,對受交叉口相位影響的附近路段交通狀態(tài)進(jìn)行精細(xì)化辨識的研究較少。由于交叉口附近路段受信號燈相位影響,若粗略的將不同相位下的交通狀態(tài)進(jìn)行統(tǒng)一的劃分,不考慮不同相位下受信號燈影響導(dǎo)致的車輛停車排隊(duì)現(xiàn)象,容易對交通狀態(tài)產(chǎn)生錯誤辨識,如:直行紅燈相位下,行駛車輛受交叉口處紅燈影響會出現(xiàn)減速或停車,該情形下斷面交通量低、車道空間占有率高、平均行車速度低。若采用傳統(tǒng)辨識方法容易錯誤的將該情形與直行綠燈相位下的斷面交通量低、車道空間占有率高、平均行車速度低情形同樣辨識為堵塞狀態(tài),未考慮信號相位的影響,對管理者產(chǎn)生誤導(dǎo)。同時,城市外圍高速公路往往受到其連接道路交通影響,尤其受城市內(nèi)外道路交通銜接區(qū)交叉口的影響,而針對此類受交叉口影響的附近路段交通狀態(tài)進(jìn)行精細(xì)化辨識的研究較少。
4、對此本發(fā)明提出一種針對不同相位下交叉口附近路段交通狀態(tài)的精細(xì)化判別方法,實(shí)現(xiàn)對交叉口交通狀態(tài)的快速判別,為交通管理者制定交叉口信號控制策略提供依據(jù)。同時在使用傳統(tǒng)fcm算法對交通狀態(tài)進(jìn)行劃分時,受初始聚類中心的影響,易導(dǎo)致誤判或者錯判的情況,因此提出一種基于霜冰優(yōu)化算法的fcm算法(rime-fcm),用于優(yōu)化聚類初始中心點(diǎn),以較小的概率接受非優(yōu)質(zhì)解為優(yōu)質(zhì)解,且因此使用shap對模型進(jìn)行解釋性分析,明確各交通參數(shù)如何對模型辨識產(chǎn)生影響。
5、為了解決上述問題,本發(fā)明提出一種相位式交叉口的交通狀態(tài)精細(xì)化辨識方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提出一種相位式交叉口的交通狀態(tài)精細(xì)化辨識方法以解決背景技術(shù)中所提出的問題:
2、現(xiàn)有技術(shù)普遍將交叉口作為路網(wǎng)中的一個節(jié)點(diǎn)進(jìn)行研究,或者只是簡單的尋找表示交叉口處狀態(tài)的參數(shù),對交通狀態(tài)進(jìn)行劃分,無法對受交叉口相位影響的附近路段交通狀態(tài)進(jìn)行精細(xì)化辨識。
3、為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:
4、一種相位式交叉口的交通狀態(tài)精細(xì)化辨識方法,包括如下步驟:
5、s1:采集交叉口交通數(shù)據(jù)并按照交叉口處的相位進(jìn)行預(yù)處理操作,將交叉口交通數(shù)據(jù)劃分為不同相位下的數(shù)據(jù)集;
6、s2:針對不同相位下的數(shù)據(jù)基于rime-fcm算法進(jìn)行交通狀態(tài)的模糊劃分,獲得含有交通狀態(tài)標(biāo)簽的數(shù)據(jù)集;
7、s3:基于bo-xgboost模型進(jìn)行交通狀態(tài)識別分類訓(xùn)練,并使用shap值對模型進(jìn)行解釋。
8、優(yōu)選地,所述s1中,選取交通量、路段平均行程速度和空間占有率三個交通參數(shù)作為辨識指標(biāo),形成交通狀態(tài)辨識指標(biāo)體系。
9、優(yōu)選地,所述s1中,設(shè)定對交通狀態(tài)進(jìn)行劃分的相對度量標(biāo)準(zhǔn),將交通狀態(tài)劃分為順暢、平穩(wěn)、擁擠和阻塞四類。
10、優(yōu)選地,所述s2中的rime-fcm算法具體如下:
11、s2.1:設(shè)置初始參數(shù);
12、s2.2:更新fcm算法的聚類中心和隸屬度矩陣;
13、s2.3:定義適應(yīng)度函數(shù),適應(yīng)度函數(shù)選取為:,其中,為目標(biāo)函數(shù);為聚類中心;為隸屬度矩陣;
14、s2.4:通過rime算法不斷更新聚類中心中各維度的值,即每個聚類中心中三個辨識指標(biāo)的值,對應(yīng)粒子;
15、s2.5:更新全局最優(yōu)個體,判斷是否達(dá)到最大迭代次數(shù),若是轉(zhuǎn)至s2.6,否則進(jìn)入s2.2;
16、s2.6:算法結(jié)束,取粒子適應(yīng)度最大的個體為fcm算法初始聚類中心,對樣本進(jìn)行劃分;
17、s2.2中所述fcm算法具體如下:
18、s2.2.1:基于s2.1設(shè)置的初始參數(shù)獲得初始聚類中心,并計(jì)算初始化隸屬度矩陣;
19、s2.2.2:計(jì)算聚類中心并更新隸屬度矩陣;具體如下:
20、所述聚類中心計(jì)算如下:
21、
22、其中,為樣本的數(shù)量;為樣本序號;為聚類中心的數(shù)量;為聚類中心的序號;為模糊指數(shù);為樣本屬于第類聚類中心的隸屬度;
23、s2.2.3:計(jì)算目標(biāo)函數(shù),若或達(dá)到最大迭代次數(shù),則終止計(jì)算,否則返回s2.2.3繼續(xù)迭代;具體如下:
24、以特征空間中的數(shù)據(jù)樣本集為,表示聚類中心,以各個樣本到各個聚類中心的歐式距離的和為目標(biāo)函數(shù),具體如下:
25、
26、約束條件如下:
27、
28、其中,為樣本的數(shù)量;為樣本序號;為聚類中心的數(shù)量;為聚類中心的序號;為模糊指數(shù);為樣本屬于第類聚類中心的隸屬度;為樣本到聚類中心的歐式距離;
29、其中隸屬度計(jì)算如下:
30、
31、其中,為第個聚類中心;
32、s2.4中所述rime算法具體如下:
33、所述rime算法中,每個霜冰個體由若干個粒子組成,霜冰種群由若干個個體組成,具體如下;
34、
35、
36、其中,為霜冰種群,表示為一個矩陣,每一行代表一個個體;為第個霜冰個體的第個粒子,粒子對應(yīng)維度的值,即解的第個維度的值,為霜冰個體的數(shù)量,即種群大小,為每個個體的維度數(shù)量,每個個體的維度對應(yīng)辨識指標(biāo),維度數(shù)量對應(yīng)辨識指標(biāo)的數(shù)量;表示第個霜冰個體,對應(yīng)交通狀態(tài);
37、基于軟霜搜索策略進(jìn)行霜冰個體尋優(yōu),具體如下:
38、
39、
40、
41、
42、其中,為軟霜搜索策略更新后的粒子新位置,對應(yīng)為由不同粒子的變量值構(gòu)成的向量坐標(biāo);為霜冰種群中最優(yōu)個體的第個粒子,根據(jù)適應(yīng)度函數(shù)計(jì)算獲得;為范圍為的隨機(jī)數(shù),控制粒子運(yùn)動的方向;和分別表示粒子運(yùn)動的角度和環(huán)境因子;為粘附系數(shù),范圍為內(nèi)的隨機(jī)數(shù),控制兩個粒子中心的距離;為第個霜冰個體的第個粒子的上界;為第個霜冰個體的第個粒子的下界;為粘附系數(shù);為范圍為內(nèi)的隨機(jī)數(shù),控制粒子的凝結(jié);為當(dāng)前迭代次數(shù);為最大迭代次數(shù);為控制值,用于控制階躍函數(shù)的段數(shù);
43、基于硬霜穿刺機(jī)制模擬硬霜個體之間的交叉行為,具體如下:
44、
45、其中,為硬霜穿刺機(jī)制更新后的粒子新位置;表示當(dāng)前個體適應(yīng)度值的歸一化值;是范圍為的隨機(jī)數(shù);
46、歸一化值計(jì)算如下:
47、
48、其中,為歸一化之后的第個數(shù)據(jù),取值范圍為;為第個原始輸入數(shù)據(jù);為原始數(shù)據(jù)中的最大值;為原始數(shù)據(jù)中的最小值;
49、所述rime算法基于貪婪選擇機(jī)制進(jìn)行,具體如下:
50、s2.4.1:初始化霜冰種群與相關(guān)參數(shù);
51、s2.4.2:獲取當(dāng)前最優(yōu)個體和最優(yōu)適應(yīng)值;
52、s2.4.3:當(dāng)時,依次執(zhí)行步驟a、b、c:
53、步驟a:如果,則根據(jù)軟霜搜索策略更新霜冰個體位置;
54、步驟b:如果,則通過硬霜穿刺機(jī)制在個體之間進(jìn)行交叉更新;
55、步驟c:如果,則使用積極的貪婪選擇機(jī)制選擇最優(yōu)解并替換次優(yōu)解,具體為:將個體的更新適應(yīng)度值與更新前的適應(yīng)度值進(jìn)行比較,如果更新適應(yīng)值優(yōu)于更新前的值,則替換兩個個體的解;若滿足終止條件,執(zhí)行s2.4.5,反之,執(zhí)行s2.4.4;
56、s2.4.4:進(jìn)化迭代次數(shù)加1,轉(zhuǎn)至s2.4.3;
57、s2.4.5:輸出全局最優(yōu)值,算法結(jié)束。
58、優(yōu)選地,所述s3中的bo-xgboost模型流程具體如下:
59、s3.1:根據(jù)目標(biāo)函數(shù)和正則化策略確定xgboost模型的尋優(yōu)參數(shù)和解空間,在解空間采集個參數(shù)組合;
60、s3.2:將個參數(shù)組合輸入到xgboost模型并得到目標(biāo)函數(shù)值,將輸出效果最優(yōu)的參數(shù)組合作為初始最優(yōu)解;
61、s3.3:采用高斯回歸過程模型對初始參數(shù)組合和目標(biāo)函數(shù)值進(jìn)行擬合,并依據(jù)高斯回歸過程模型的輸出值與預(yù)設(shè)值相比,初步選取最優(yōu)參數(shù)組合;
62、s3.4:在解空間基于ei算法重新選取若干參數(shù)組合,使用高斯過程預(yù)測選取的參數(shù)組合的分布均值和標(biāo)準(zhǔn)差;
63、s3.5:使用采集函數(shù)分布均值和標(biāo)準(zhǔn)差進(jìn)行打分,評估各參數(shù)組合的效果;
64、s3.6:基于若干評估指標(biāo)選擇效果最優(yōu)的參數(shù)組合作為本次迭代最優(yōu)解;
65、s3.7:將本次迭代最優(yōu)解替換上一輪迭代最優(yōu)解;
66、s3.8:將當(dāng)前最優(yōu)的參數(shù)組合及目標(biāo)函數(shù)值,加入到原始個參數(shù)組合中,更新高斯過程擬合模型;
67、s3.9:判斷是否達(dá)到預(yù)設(shè)最大迭代次數(shù),若達(dá)到則輸出評估最優(yōu)的解作為xgboost最優(yōu)參數(shù)組合;否則轉(zhuǎn)向步驟s3.4;
68、s3.10:使用找到的最優(yōu)參數(shù)組合訓(xùn)練xgboost模型,然后用訓(xùn)練后的xgboost模型對樣本數(shù)據(jù)進(jìn)行預(yù)測,根據(jù)模型輸出的預(yù)測結(jié)果來判斷交通狀態(tài)。
69、優(yōu)選地,所述xgboost模型的搭建具體如下:
70、所述xgboost模型的目標(biāo)函數(shù)定義如下:
71、
72、其中,表示真實(shí)數(shù)據(jù);為前個學(xué)習(xí)器的預(yù)測值和第個學(xué)習(xí)器預(yù)測值相加之和;表示模型損失函數(shù);為正則化策略;為常數(shù);
73、泰勒展開式的二階近似公式如下:
74、
75、其中,表示所求點(diǎn);
76、對損失函數(shù)的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)分別定義如下:
77、
78、
79、將目標(biāo)函數(shù)用泰勒展開式展開,并用倒數(shù)形式替換,得到:
80、
81、設(shè)置第棵決策樹葉子對數(shù)據(jù)的預(yù)測值為:
82、
83、其中,表示樣本數(shù)據(jù)的葉子節(jié)點(diǎn);表示葉子的預(yù)測數(shù)據(jù);
84、在正則化中加入對葉子節(jié)點(diǎn)個數(shù)的懲罰:
85、
86、其中,為葉子節(jié)點(diǎn)數(shù)量;和為正則化參數(shù),將預(yù)測值和正則化帶入目標(biāo)函數(shù)公式,省略常數(shù)項(xiàng),將對樣本預(yù)測的誤差和改為對每個葉子預(yù)測值誤差求和:
87、
88、其中,為分到第個葉子中的所有樣本集合;
89、令,,對目標(biāo)函數(shù)求導(dǎo),即求得目標(biāo)函數(shù)極小值,得到最優(yōu)的值:
90、
91、代入到目標(biāo)函數(shù)中,得到:
92、
93、得到信息增益如下:
94、
95、其中,、為右面葉子結(jié)點(diǎn)的值;、為左面葉子結(jié)點(diǎn)的值。
96、優(yōu)選地,所述s3.3中的高斯回歸過程模型具體如下:
97、設(shè)定高斯回歸過程模型的輸出如下:
98、
99、其中,為服從高斯分布的噪聲;為目標(biāo)函數(shù),表示對于輸入生成的真實(shí)值或響應(yīng)值;
100、采用高斯過程對函數(shù)進(jìn)行描述,先驗(yàn)分布由其均值函數(shù)和協(xié)方差函數(shù)確定;
101、對于數(shù)據(jù),為數(shù)據(jù)數(shù)量,分布函數(shù)的多元高斯分布為:
102、
103、其中,,且是的矩陣元素,為向量的轉(zhuǎn)置;
104、基于上述步驟搭建的高斯回歸過程模型返回的即為函數(shù)中的預(yù)測值高斯分布均值和方差。
105、優(yōu)選地,所述s3.4中的ei算法具體如下:
106、
107、
108、其中,為最高期望改進(jìn)值;為期望值;表示算法當(dāng)前尋得的最優(yōu)超參數(shù)組合;為新輸入點(diǎn)的預(yù)測分布均值;表示當(dāng)前已知的最優(yōu)目標(biāo)函數(shù)值;表示新輸入點(diǎn)的標(biāo)準(zhǔn)差;為替代函數(shù);表示標(biāo)準(zhǔn)正態(tài)分布的累積分布函數(shù);表示標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)。
109、優(yōu)選地,所述s3.4中,在解空間基于ei算法通過如下方式選取參數(shù)組合:
110、對于給出的樣本數(shù)據(jù),使用所述高斯回歸過程模型更新函數(shù)的后驗(yàn)期望;
111、尋找ei算法中對應(yīng)ei值最大的數(shù)據(jù),令;
112、并計(jì)算數(shù)據(jù)點(diǎn)的函數(shù)值;
113、重復(fù)上述計(jì)算過程,直到達(dá)到算法停止閾值。
114、優(yōu)選地,所述s3中的shap值計(jì)算如下;
115、對于每個預(yù)測樣本,shap模型生成一個夏普利值,具體為分配給每個特征的值的總和,解釋為:
116、
117、其中,為各變量的解釋模型;為聯(lián)合矢量;為最大聯(lián)合規(guī)模;為特征的特征屬性。
118、與現(xiàn)有技術(shù)相比,本發(fā)明提供了一種相位式交叉口的交通狀態(tài)精細(xì)化辨識方法,具備以下有益效果:
119、本發(fā)明將不同相位下的交通流參數(shù)進(jìn)行劃分,然后對不同相位下的數(shù)據(jù)利用rime-fcm模型分別進(jìn)行聚類,避免粒子過分快速地聚集于當(dāng)前最優(yōu)解而陷入局部極值;實(shí)現(xiàn)對于交通流參數(shù)的初步劃分;通過貝葉斯優(yōu)化的方式優(yōu)化xgboost模型的超參數(shù),進(jìn)行交通狀態(tài)識別分類訓(xùn)練;克服了目前xgboost交通識別算法訓(xùn)練過程無法觀察,其產(chǎn)生結(jié)果難以解釋,影響結(jié)果可靠性的問題;還使用shap對模型識別過程進(jìn)行解釋性分析,提升擁堵識別結(jié)果的可靠性。