基于距離度量學(xué)習(xí)的交通警情等級預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于智能交通領(lǐng)域,具體涉及一種城市交通警情等級預(yù)測方法。
【背景技術(shù)】
[0002] 隨著經(jīng)濟(jì)的迅速發(fā)展,城市交通系統(tǒng)中機(jī)動車保有量的快速增長導(dǎo)致發(fā)生交通事 故、交通擁堵的概率大大增加,當(dāng)前城市交通狀態(tài)發(fā)布和誘導(dǎo)都是針對單個路段、局部區(qū) 域,主要面對道路上的機(jī)動車駕駛者,對于交通管理人員更希望獲得宏觀區(qū)域的交通警情 等級,對未來某個時間段內(nèi)的區(qū)域警情等級進(jìn)行有效的預(yù)測有助于交通管理部門優(yōu)化警力 部署、制定相應(yīng)的預(yù)案,緩解重點(diǎn)地區(qū)的交通壓力。
[0003] 專利201410610003. 7采集包含工作日、非工作日且包含重大節(jié)假日交通流數(shù)據(jù), 將相同連續(xù)時間段交通流數(shù)據(jù)重組為自然數(shù),建立短時交通流數(shù)據(jù)庫,將當(dāng)前交通流重組 數(shù)據(jù)與短時交通流數(shù)據(jù)庫中歷史數(shù)據(jù)進(jìn)行大小比對,截取相似樣本空間,利用偏差最小的 兩個樣本進(jìn)行預(yù)測,該方法僅側(cè)重于考慮時間因素對交通流數(shù)據(jù)的影響,沒有引入天氣因 素且未揭示各個特征屬性之間的內(nèi)在聯(lián)系;專利200510113396. 1通過觀測交通流量和動 態(tài),以及諸如一天中的時間和一周中的日子、假期、學(xué)校狀況、諸如體育比賽等大型集會的 時間安排和性質(zhì)、天氣預(yù)報、交通事件報告、和建設(shè)與封路等其它環(huán)境數(shù)據(jù),預(yù)測擁塞地點(diǎn) 并用于離線和實(shí)時的自動路線推薦和計劃,該方法將交通系統(tǒng)抽象成一組隨機(jī)變量來進(jìn)行 關(guān)于交通流量和擁塞的預(yù)報,僅對交通參與者有效,不能對交通管理者提供決策支持。本專 利與上述專利有本質(zhì)不同,數(shù)據(jù)來源方面綜合考慮天氣因素、時間因素、環(huán)境因素等對城市 交通警情等級的影響,并通過廣義馬氏度量學(xué)習(xí)方法提取各個特征屬性的權(quán)值,充分揭示 各個屬性對交通警情等級影響的重要程度,根據(jù)學(xué)習(xí)的特征屬性權(quán)值對交通警情等級進(jìn)行 預(yù)測。
【發(fā)明內(nèi)容】
[0004] 為了克服已有交通警情判別方式的無預(yù)測功能、準(zhǔn)確性較差的不足,本發(fā)明提供 了一種有效實(shí)現(xiàn)預(yù)測、準(zhǔn)確性較好的基于距離度量學(xué)習(xí)的交通警情等級預(yù)測方法。
[0005] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
[0006] 一種基于距離度量學(xué)習(xí)的交通警情等級預(yù)測方法,包括以下步驟:
[0007] 步驟1 :多維數(shù)據(jù)整理和交通警情等級分類
[0008] 采集歷史天氣數(shù)據(jù)、歷史重大活動數(shù)據(jù)、建設(shè)和封路環(huán)境數(shù)據(jù)與工作日、節(jié)假日和 歷史交通警情數(shù)共同構(gòu)成關(guān)于交通警情的多維歷史數(shù)據(jù)庫,當(dāng)前時刻的交通流量和上一時 刻的流量密切相關(guān),將連續(xù)的歷史交通警情數(shù)據(jù)按照等時間段切分為η個片段作為訓(xùn)練樣 本,每個訓(xùn)練樣本片段包括天氣屬性、重大活動屬性、環(huán)境因素屬性、工作日和節(jié)假日屬性, 根據(jù)交通管理部門提供的交通警情閾值對η個訓(xùn)練樣本進(jìn)行交通警情等級分類;
[0009] 步驟2 :距離度量學(xué)習(xí)提取分類后的交通警情樣本所對應(yīng)的多維特征屬性權(quán)值
[0010] 根據(jù)步驟1得出η個已標(biāo)記訓(xùn)練樣本構(gòu)成的一個樣本空間,該樣本空間中各個元 素之間的距離稱為度量,其中距離是定義在向量空間中的一種函數(shù),指兩個元素在空間中 相隔的長度,也就是說可以將某個空間中的所有對象投影到一個新的度量空間中;選取η 個訓(xùn)練樣本構(gòu)成包含多維特征屬性的樣本空間X,其中X = (X1, x2, …,χη),xi對應(yīng)第i 個樣本代表的多維特征屬性,式(1)是樣本空間X中\(zhòng)和^_樣本點(diǎn)間的馬氏距離,其中矩 陣A是我們需要學(xué)習(xí)的距離度量矩陣,矩陣A中的每一行代表一個歷史樣本,每一列對應(yīng)樣 本中的一維特征屬性
【主權(quán)項】
1. 一種基于距離度量學(xué)習(xí)的交通警情等級預(yù)測方法,其特征在于:所述預(yù)測方法包括 以下步驟: 步驟1 :多維數(shù)據(jù)整理和交通警情等級分類 采集歷史天氣數(shù)據(jù)、歷史重大活動數(shù)據(jù)、建設(shè)和封路環(huán)境數(shù)據(jù)與工作日、節(jié)假日和歷史 交通警情數(shù)共同構(gòu)成關(guān)于交通警情的多維歷史數(shù)據(jù)庫,當(dāng)前時刻的交通流量和上一時刻的 流量密切相關(guān),將連續(xù)的歷史交通警情數(shù)據(jù)按照等時間段切分為η個片段作為訓(xùn)練樣本, 每個訓(xùn)練樣本片段包括天氣屬性、重大活動屬性、環(huán)境因素屬性、工作日和節(jié)假日屬性,根 據(jù)交通管理部門提供的交通警情閾值對η個訓(xùn)練樣本進(jìn)行交通警情等級分類; 步驟2 :距離度量學(xué)習(xí)提取分類后的交通警情樣本所對應(yīng)的多維特征屬性權(quán)值 根據(jù)步驟1得出η個已標(biāo)記訓(xùn)練樣本構(gòu)成的一個樣本空間,該樣本空間中各個元素之 間的距離稱為度量,其中距離是定義在向量空間中的一種函數(shù),指兩個元素在空間中相隔 的長度,也就是說可以將某個空間中的所有對象投影到一個新的度量空間中;選取η個訓(xùn) 練樣本構(gòu)成包含多維特征屬性的樣本空間X,其中X = (Xl,x2, X3,…,xn),Xi對應(yīng)第i個樣 本代表的多維特征屬性,式(1)是樣本空間X中\(zhòng)和^_樣本點(diǎn)間的馬氏距離,其中矩陣A 是我們需要學(xué)習(xí)的距離度量矩陣,矩陣A中的每一行代表一個歷史樣本,每一列對應(yīng)樣本 中的一維特征屬性
式(1)中的A是樣本空間X的協(xié)方差矩陣,樣本空間X中的每個樣本均帶有交通警情 等級標(biāo)簽,故在最小化相同警情等級S(S e X)中樣本之間的馬氏距離平方和的同時,約束 不同警情等級D(D e X)中樣本之間的馬氏距離和,馬氏距離和大于預(yù)設(shè)閾值,目標(biāo)函數(shù)模 型如式(2),式(3)所示:
其中,A多O表示A為半正定矩陣,由目標(biāo)函數(shù)模型求取距離度量學(xué)習(xí)矩陣A的過程是 一個凸優(yōu)化問題,采用牛頓法對上述凸優(yōu)化問題進(jìn)行求解,最終學(xué)習(xí)到的距離度量矩陣為 一個稀疏的對角陣; 步驟3 :帶權(quán)值的歐氏距離尋找與當(dāng)前特征屬性最相似的K個歷史交通警情 使用歐氏距離計算K近鄰需首先對各個特征屬性進(jìn)行歸一化,假定樣本空間X中的樣 本點(diǎn)X包含k維特征屬性,樣本點(diǎn)之間的近鄰一般由歐氏距離來度量,設(shè)第i個樣本點(diǎn)為 X, =(χΧ,- ,χ?),其中X;表示第i個樣本第1個特征屬性值,兩個樣本xJP Xj之間的歐氏 距離定義為公式(4):
給定一個待預(yù)測的交通警情樣本X,,由標(biāo)準(zhǔn)歐氏距離可計算出樣本Xq與歷史樣本空間 中最近鄰的K個樣本X1, X2, ···,Xk,樣本之間的距離是根據(jù)樣本的所有特征計算的,步驟2中 距離度量學(xué)習(xí)矩陣得出的權(quán)值對特征屬性與交通警情等級之間的權(quán)重關(guān)系進(jìn)行了量化,定 義含多維特征屬性權(quán)值的交通警情相似度如公式(5),式中X q為待預(yù)測的交通警情樣本,X h 屬于X = (X1, x2, x3,…,xn)為η個歷史交通警情數(shù)據(jù)中的一個樣本,每個樣本包含k維特 征屬性,分母加上0.0 l是為了避免當(dāng)蛘與W相等時出現(xiàn)分母為O的情況,
其中W1是第1個特征的權(quán)重,由步驟2中距離度量學(xué)習(xí)得到對角矩陣A,對角線上的 值即為特征屬性權(quán)值,訓(xùn)練得到的權(quán)值根據(jù)特征屬性一一對應(yīng),由公式(5)計算當(dāng)前特征 屬性與歷史交通警情數(shù)據(jù)庫中各個樣本的相似度,相似度最大的前K個歷史交通警情數(shù)據(jù) X1, X2,…,1£作為當(dāng)前交通警情等級預(yù)測的參考; 步驟4 :K近鄰相似交通警情等級投票 X1, X2,…,Xk為步驟3得出的K個最相似歷史交通警情樣本,其中每一個樣本X i所屬的 類別均已知,統(tǒng)計K個最相似歷史交通警情等級,將出現(xiàn)頻率最高的類別作為交通警情等 級預(yù)測結(jié)果,K值是一個自定義的常數(shù)。
2.如權(quán)利要求1所述的一種基于距離度量學(xué)習(xí)的交通警情等級預(yù)測方法,其特征在 于:隨機(jī)將歷史交通警情數(shù)據(jù)分為兩部分,一部分作為訓(xùn)練樣本,一部分作為測試樣本,訓(xùn) 練樣本中含有交通警情等級類別標(biāo)簽,測試樣本中去除交通警情等級類別標(biāo)簽,經(jīng)步驟3 計算出前K個最相似的交通警情等級,取出現(xiàn)頻率最高的警情等級與測試樣本原有的警情 等級進(jìn)行對比,交叉驗(yàn)證本方法的準(zhǔn)確率,通過選取不同的K值,對每個K值做100次交叉 驗(yàn)證計算出平均準(zhǔn)確率,選擇準(zhǔn)確率最大的K值作為交通警情等級預(yù)測的投票數(shù)。
【專利摘要】一種基于距離度量學(xué)習(xí)的交通警情等級預(yù)測方法,對已知天氣數(shù)據(jù)、時間數(shù)據(jù)、環(huán)境數(shù)據(jù)等情況下的城市交通警情等級進(jìn)行預(yù)測,將整理好的多維歷史數(shù)據(jù)根據(jù)交警指揮部門要求進(jìn)行分類,利用廣義馬氏距離度量方法對分類標(biāo)記后的多維歷史數(shù)據(jù)進(jìn)行學(xué)習(xí),則距離度量學(xué)習(xí)矩陣獲得了各個特征屬性對交通警情等級的權(quán)值,權(quán)值大的特征屬性對分類貢獻(xiàn)度大,根據(jù)帶權(quán)值的歐氏距離計算當(dāng)前的多維數(shù)據(jù)與歷史數(shù)據(jù)的相似度,選擇與當(dāng)前數(shù)據(jù)最相似的K個歷史數(shù)據(jù)進(jìn)行警情等級投票,得票高的警情等級作為當(dāng)前交通警情等級的預(yù)測結(jié)果。本發(fā)明有效實(shí)現(xiàn)預(yù)測、準(zhǔn)確性較好。
【IPC分類】G06Q10-04, G06Q50-26, G06K9-62
【公開號】CN104834977
【申請?zhí)枴緾N201510250180
【發(fā)明人】王浩, 李建元, 陳濤, 顧超
【申請人】浙江銀江研究院有限公司
【公開日】2015年8月12日
【申請日】2015年5月15日