本發(fā)明涉及智能城市領(lǐng)域,特別是涉及一種道路交通狀況預(yù)測(cè)方法及系統(tǒng)。
背景技術(shù):
:名詞解釋:循環(huán)神經(jīng)網(wǎng)絡(luò):英文全稱recurrentneuralnetworks,縮寫為rnns。目前已在眾多自然語言處理領(lǐng)域中取得了巨大成功和廣泛應(yīng)用。具體的表現(xiàn)形式為網(wǎng)絡(luò)會(huì)對(duì)之前的信息進(jìn)行記憶并應(yīng)用于當(dāng)前輸出的計(jì)算中,即隱藏層之間的節(jié)點(diǎn)不再無連接而是有連接的,并且隱藏層的輸入不僅包括輸入層的輸出還包括上一時(shí)刻隱藏層的輸出。卷積神經(jīng)網(wǎng)絡(luò):英文全稱convolutionalneuralnetworks,縮寫為cnns。卷積神經(jīng)網(wǎng)絡(luò)的一個(gè)重要的特點(diǎn)就是,通過卷積運(yùn)算,可以使原信號(hào)特征增強(qiáng),并且降低噪音,并且利用圖像局部相關(guān)性的原理,對(duì)圖像進(jìn)行子抽樣,可減少數(shù)據(jù)處理量同時(shí)保留有用信息。在智能交通系統(tǒng)中,道路交通狀況預(yù)測(cè)是當(dāng)今智能城市面臨的最大挑戰(zhàn)之一。準(zhǔn)確的交通狀態(tài)預(yù)測(cè),是智能交通系統(tǒng)的基礎(chǔ)。地圖服務(wù)提供商通常使用通用網(wǎng)絡(luò)交通流進(jìn)行路況預(yù)測(cè),該方法基于傳統(tǒng)的分段方法和道路交通評(píng)估應(yīng)用實(shí)施。這種方式,雖然在一定程度上可以實(shí)現(xiàn)交通狀態(tài)的預(yù)測(cè),但是其預(yù)測(cè)精度一般,難以滿足智能城市的發(fā)展要求。技術(shù)實(shí)現(xiàn)要素:為了解決上述的技術(shù)問題,本發(fā)明的目的是提供一種道路交通狀況預(yù)測(cè)方法,本發(fā)明的目的是提供一種道路交通狀況預(yù)測(cè)系統(tǒng)。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種道路交通狀況預(yù)測(cè)方法,包括步驟:針對(duì)待分析的每個(gè)道路,獲取在該道路上行駛的車輛的車載gps設(shè)備所記錄的交通數(shù)據(jù)后,采用訓(xùn)練好的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該道路的道路交通狀況進(jìn)行預(yù)測(cè);其中,所述循環(huán)卷積神經(jīng)網(wǎng)絡(luò)依次包括循環(huán)卷積層、平均池化層、退出層、全連接層和輸出層,所述交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。進(jìn)一步,還包括以下步驟:數(shù)據(jù)獲取步驟:獲取多個(gè)車載gps設(shè)備所記錄的交通數(shù)據(jù);數(shù)據(jù)預(yù)處理步驟:對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后,基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組;特征向量構(gòu)造步驟:針對(duì)每個(gè)道路,基于公共軌跡距離度量以及該道路的歷史交通條件,構(gòu)建該道路的特征向量;深度學(xué)習(xí)框架構(gòu)造步驟:基于深度學(xué)習(xí)技術(shù),構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò),對(duì)特征向量進(jìn)行深層特征提取;訓(xùn)練優(yōu)化步驟:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練優(yōu)化。進(jìn)一步,所述數(shù)據(jù)預(yù)處理步驟中,所述對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗的步驟,其具體為:對(duì)獲取的交通數(shù)據(jù)依次進(jìn)行異常數(shù)據(jù)處理、無效數(shù)據(jù)刪除處理、數(shù)據(jù)填充處理和數(shù)據(jù)平滑處理。進(jìn)一步,所述數(shù)據(jù)預(yù)處理步驟中,所述基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組的步驟,包括:將每個(gè)交通數(shù)據(jù)按照預(yù)設(shè)的周期進(jìn)行分段劃分;基于歐幾里得度量,對(duì)分段劃分結(jié)果進(jìn)行聚類;對(duì)每個(gè)聚類,構(gòu)建該聚類的代表軌跡作為該聚類的模式,其中,代表軌跡為屬于該聚類的整個(gè)軌跡段的長(zhǎng)度和角度的平均值。進(jìn)一步,所述特征向量構(gòu)造步驟,其具體為:針對(duì)待分析的每個(gè)道路,基于公共軌跡距離度量獲取該道路的代表軌跡并獲取與該代表軌跡距離最近的前k個(gè)代表性軌跡作為該道路的k個(gè)相鄰模式,進(jìn)而根據(jù)該k個(gè)相鄰模式和該道路的歷史交通條件,構(gòu)建該道路的特征向量。進(jìn)一步,所述深度學(xué)習(xí)框架構(gòu)造步驟,包括:針對(duì)每個(gè)道路,計(jì)算獲得其相鄰模式的左右上下文信息作為訓(xùn)練集,并將其與該道路對(duì)應(yīng)的交通狀況進(jìn)行關(guān)聯(lián);構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò)后,將獲得的左右上下文信息輸入到神經(jīng)網(wǎng)絡(luò)的循環(huán)卷積層;對(duì)循環(huán)卷積層的輸出進(jìn)行線性變換和tanh激活函數(shù)計(jì)算后,對(duì)計(jì)算結(jié)果進(jìn)行平均值計(jì)算;將計(jì)算獲得的平均值作為退出層的輸入,最后獲得輸出層的輸出。進(jìn)一步,所述訓(xùn)練優(yōu)化步驟,其具體為:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練參數(shù)進(jìn)行梯度下降計(jì)算,最大化訓(xùn)練參數(shù)的對(duì)數(shù)似然值,使得循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的輸出最接近道路實(shí)際的交通狀況。本發(fā)明解決其技術(shù)問題所采用的另一技術(shù)方案是:一種道路交通狀況預(yù)測(cè)系統(tǒng),包括處理器和存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有多條指令,所述指令由處理器加載并執(zhí)行以下步驟:針對(duì)待分析的每個(gè)道路,獲取在該道路上行駛的車輛的車載gps設(shè)備所記錄的交通數(shù)據(jù)后,采用訓(xùn)練好的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該道路的道路交通狀況進(jìn)行預(yù)測(cè);其中,所述循環(huán)卷積神經(jīng)網(wǎng)絡(luò)依次包括循環(huán)卷積層、平均池化層、退出層、全連接層和輸出層,所述交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。進(jìn)一步,處理器加載指令還執(zhí)行以下步驟:數(shù)據(jù)獲取步驟:獲取多個(gè)車載gps設(shè)備所記錄的交通數(shù)據(jù);數(shù)據(jù)預(yù)處理步驟:對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后,基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組;特征向量構(gòu)造步驟:針對(duì)每個(gè)道路,基于公共軌跡距離度量以及該道路的歷史交通條件,構(gòu)建該道路的特征向量;深度學(xué)習(xí)框架構(gòu)造步驟:基于深度學(xué)習(xí)技術(shù),構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò),對(duì)特征向量進(jìn)行深層特征提?。挥?xùn)練優(yōu)化步驟:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練優(yōu)化。本發(fā)明的有益效果是:本發(fā)明的道路交通狀況預(yù)測(cè)方法,包括步驟:針對(duì)待分析的每個(gè)道路,獲取在該道路上行駛的車輛的車載gps設(shè)備所記錄的交通數(shù)據(jù)后,采用訓(xùn)練好的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該道路的道路交通狀況進(jìn)行預(yù)測(cè);其中,循環(huán)卷積神經(jīng)網(wǎng)絡(luò)依次包括循環(huán)卷積層、平均池化層、退出層、全連接層和輸出層,交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。本方法采用循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),預(yù)測(cè)準(zhǔn)確度高,且穩(wěn)定性高。本發(fā)明的另一有一效果是:本發(fā)明的一種道路交通狀況預(yù)測(cè)系統(tǒng),包括處理器和存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有多條指令,所述指令由處理器加載并執(zhí)行以下步驟:針對(duì)待分析的每個(gè)道路,獲取在該道路上行駛的車輛的車載gps設(shè)備所記錄的交通數(shù)據(jù)后,采用訓(xùn)練好的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該道路的道路交通狀況進(jìn)行預(yù)測(cè);其中,所述循環(huán)卷積神經(jīng)網(wǎng)絡(luò)依次包括循環(huán)卷積層、平均池化層、退出層、全連接層和輸出層,所述交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。本系統(tǒng)采用循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),預(yù)測(cè)準(zhǔn)確度高,且穩(wěn)定性高。附圖說明下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明。圖1是本發(fā)明的道路交通狀況預(yù)測(cè)方法的具體實(shí)施例的一道路樣本示意圖;圖2是本發(fā)明的道路交通狀況預(yù)測(cè)方法采用的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;圖3是對(duì)本方法的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)性能驗(yàn)證的結(jié)果示意圖。具體實(shí)施方式下面結(jié)合附圖及具體實(shí)施例就本發(fā)明的技術(shù)方案做進(jìn)一步的說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。本發(fā)明提供了一種道路交通狀況預(yù)測(cè)方法,包括步驟:針對(duì)待分析的每個(gè)道路,獲取在該道路上行駛的車輛的車載gps設(shè)備所記錄的交通數(shù)據(jù)后,采用訓(xùn)練好的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該道路的道路交通狀況進(jìn)行預(yù)測(cè);其中,所述循環(huán)卷積神經(jīng)網(wǎng)絡(luò)依次包括循環(huán)卷積層、平均池化層、退出層、全連接層和輸出層,所述交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。進(jìn)一步作為優(yōu)選的實(shí)施方式,還包括以下步驟:數(shù)據(jù)獲取步驟:獲取多個(gè)車載gps設(shè)備所記錄的交通數(shù)據(jù);數(shù)據(jù)預(yù)處理步驟:對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后,基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組;特征向量構(gòu)造步驟:針對(duì)每個(gè)道路,基于公共軌跡距離度量以及該道路的歷史交通條件,構(gòu)建該道路的特征向量;深度學(xué)習(xí)框架構(gòu)造步驟:基于深度學(xué)習(xí)技術(shù),構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò),對(duì)特征向量進(jìn)行深層特征提??;訓(xùn)練優(yōu)化步驟:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練優(yōu)化。具體的,在進(jìn)行預(yù)測(cè)過程中,也需要對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理步驟和特征向量構(gòu)造步驟,再輸入到循環(huán)卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行預(yù)測(cè),最后,使用softmax函數(shù)進(jìn)行準(zhǔn)確率預(yù)測(cè)。進(jìn)一步作為優(yōu)選的實(shí)施方式,所述數(shù)據(jù)預(yù)處理步驟中,所述對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗的步驟,其具體為:對(duì)獲取的交通數(shù)據(jù)依次進(jìn)行異常數(shù)據(jù)處理、無效數(shù)據(jù)刪除處理、數(shù)據(jù)填充處理和數(shù)據(jù)平滑處理。進(jìn)一步作為優(yōu)選的實(shí)施方式,所述數(shù)據(jù)預(yù)處理步驟中,所述基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組的步驟,包括:將每個(gè)交通數(shù)據(jù)按照預(yù)設(shè)的周期進(jìn)行分段劃分;基于歐幾里得度量,對(duì)分段劃分結(jié)果進(jìn)行聚類;對(duì)每個(gè)聚類,構(gòu)建該聚類的代表軌跡作為該聚類的模式,其中,代表軌跡為屬于該聚類的整個(gè)軌跡段的長(zhǎng)度和角度的平均值。進(jìn)一步作為優(yōu)選的實(shí)施方式,所述特征向量構(gòu)造步驟,其具體為:針對(duì)待分析的每個(gè)道路,基于公共軌跡距離度量獲取該道路的代表軌跡并獲取與該代表軌跡距離最近的前k個(gè)代表性軌跡作為該道路的k個(gè)相鄰模式,進(jìn)而根據(jù)該k個(gè)相鄰模式和該道路的歷史交通條件,構(gòu)建該道路的特征向量。該道路的歷史交通條件具體包括:上周當(dāng)天在t的交通狀況,上周同一天在t+15的道路r的交通狀況,昨天在t的交通狀況,昨天在t+15的道路r的交通狀況等。進(jìn)一步作為優(yōu)選的實(shí)施方式,所述深度學(xué)習(xí)框架構(gòu)造步驟,包括:針對(duì)每個(gè)道路,計(jì)算獲得其相鄰模式的左右上下文信息作為訓(xùn)練集,并將其與該道路對(duì)應(yīng)的交通狀況進(jìn)行關(guān)聯(lián);構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò)后,將獲得的左右上下文信息輸入到神經(jīng)網(wǎng)絡(luò)的循環(huán)卷積層;對(duì)循環(huán)卷積層的輸出進(jìn)行線性變換和tanh激活函數(shù)計(jì)算后,對(duì)計(jì)算結(jié)果進(jìn)行平均值計(jì)算;將計(jì)算獲得的平均值作為退出層的輸入,最后獲得輸出層的輸出。進(jìn)一步作為優(yōu)選的實(shí)施方式,所述訓(xùn)練優(yōu)化步驟,其具體為:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練參數(shù)進(jìn)行梯度下降計(jì)算,最大化訓(xùn)練參數(shù)的對(duì)數(shù)似然值,使得循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的輸出最接近道路實(shí)際的交通狀況。本發(fā)明還提供了一種道路交通狀況預(yù)測(cè)系統(tǒng),包括處理器和存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有多條指令,所述指令由處理器加載并執(zhí)行以下步驟:針對(duì)待分析的每個(gè)道路,獲取在該道路上行駛的車輛的車載gps設(shè)備所記錄的交通數(shù)據(jù)后,采用訓(xùn)練好的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該道路的道路交通狀況進(jìn)行預(yù)測(cè);其中,所述循環(huán)卷積神經(jīng)網(wǎng)絡(luò)依次包括循環(huán)卷積層、平均池化層、退出層、全連接層和輸出層,所述交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。進(jìn)一步作為優(yōu)選的實(shí)施方式,處理器加載指令還執(zhí)行以下步驟:數(shù)據(jù)獲取步驟:獲取多個(gè)車載gps設(shè)備所記錄的交通數(shù)據(jù);數(shù)據(jù)預(yù)處理步驟:對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后,基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組;特征向量構(gòu)造步驟:針對(duì)每個(gè)道路,基于公共軌跡距離度量以及該道路的歷史交通條件,構(gòu)建該道路的特征向量;深度學(xué)習(xí)框架構(gòu)造步驟:基于深度學(xué)習(xí)技術(shù),構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò),對(duì)特征向量進(jìn)行深層特征提取;訓(xùn)練優(yōu)化步驟:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練優(yōu)化。本方法一方面,將類似的軌跡數(shù)據(jù)組合在一起,作為每個(gè)道路的模式,用于數(shù)據(jù)預(yù)處理,并且對(duì)這些模式采用了基于上下文的概念來構(gòu)造特征向量作為深入學(xué)習(xí)架構(gòu)的輸入。另一方面,設(shè)計(jì)了一種深度學(xué)習(xí)架構(gòu),結(jié)合了循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)從道路交通狀況預(yù)測(cè)特征中學(xué)習(xí)隱藏信息,進(jìn)一步提高了預(yù)測(cè)性能,進(jìn)而便于對(duì)即將發(fā)生的交通擁堵進(jìn)行預(yù)治理、疏導(dǎo),以及避開即將發(fā)生的交通擁堵道路。本方法可以準(zhǔn)確的進(jìn)行交通狀態(tài)預(yù)測(cè),且準(zhǔn)確度高。更詳細(xì)的,本發(fā)明主要包括以下幾個(gè)主要步驟:第一步,數(shù)據(jù)獲取步驟:獲取多個(gè)車載gps設(shè)備所記錄的交通數(shù)據(jù),交通數(shù)據(jù)包括多個(gè)gps記錄點(diǎn),每個(gè)gps記錄點(diǎn)包含該點(diǎn)當(dāng)前的速度、坐標(biāo)以及時(shí)間戳。數(shù)據(jù)主要來源于出租車上的gps設(shè)備。第二步,數(shù)據(jù)預(yù)處理,對(duì)獲取的交通數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后,基于流量相似性將數(shù)據(jù)清洗后的交通數(shù)據(jù)進(jìn)行聚類分組。首先通過以下四個(gè)步驟進(jìn)行數(shù)據(jù)清洗:1.異常數(shù)據(jù)處理:如果gps記錄點(diǎn)的速度比同一時(shí)期所有g(shù)ps記錄點(diǎn)的平均速度快了50%以上,則表示該數(shù)據(jù)為異常數(shù)據(jù),使用同一時(shí)期內(nèi)的平均速度來代替它。2.無效數(shù)據(jù)刪除處理:如果某一交通數(shù)據(jù)在一天內(nèi)的三小時(shí)沒有記錄任何數(shù)據(jù),則刪除整天的數(shù)據(jù)。3.數(shù)據(jù)填充處理:如果某個(gè)時(shí)間戳中的數(shù)據(jù)丟失,取該時(shí)間戳之前與之后數(shù)據(jù)的平均值作為填充值,對(duì)該時(shí)間戳進(jìn)行數(shù)據(jù)填充處理。4.數(shù)據(jù)平滑處理:計(jì)算每三個(gè)時(shí)間戳上gps記錄點(diǎn)速度的平均值,進(jìn)行數(shù)據(jù)平滑。其次,根據(jù)流量相似性對(duì)軌跡數(shù)據(jù)的其余部分進(jìn)行分組以獲得每條道路的模式。本申請(qǐng)將一個(gè)部分定義為一條道路。由于一條道路每天有不同的交通狀況。因此,使用聚類方法為道路中的每個(gè)部分在每天的每個(gè)時(shí)段生成一個(gè)模式。聚類方法的步驟如下所述:1.將每個(gè)交通數(shù)據(jù)按照預(yù)設(shè)的周期進(jìn)行分段劃分,例如預(yù)設(shè)的周期為5分鐘,按照5分鐘的間隔將交通數(shù)據(jù)劃分成一組線段。2.根據(jù)一定距離度量彼此靠近的軌跡段以此分組成一個(gè)群集。在這一步驟中,使用歐幾里得度量來測(cè)量?jī)蓚€(gè)軌跡之間的距離。定義是交通數(shù)據(jù)p1…n和q1…n在每個(gè)采樣時(shí)間t的點(diǎn)距離之和,那么,其中兩點(diǎn)之間的歐幾里得度量定義為:對(duì)于這種聚類步驟,使用dbscan算法,因?yàn)樗腔诿芏染垲?,并且允許聚類軌跡形成任何形狀和大小。3.對(duì)于每個(gè)聚類,對(duì)每個(gè)聚類,構(gòu)建該聚類的代表軌跡作為該聚類的模式,其中,代表軌跡為屬于該聚類的整個(gè)軌跡段的長(zhǎng)度和角度的平均值,即該模式表示在一定時(shí)間內(nèi)包括交通狀況的聚類特征,即路況。第三步,構(gòu)造特征向量。在現(xiàn)代化城市的道路網(wǎng)中,一條道路的交通狀況總是受附近其他道路的影響。在附近道路交通繁忙時(shí),該條道路交通則相對(duì)平穩(wěn)。因此,在預(yù)測(cè)道路交通狀況時(shí),不僅需要考慮該道路的歷史交通條件,還需考慮其附近道路的交通狀況。因此,要選擇一組道路以為要進(jìn)行交通預(yù)測(cè)的道路提供周邊的上下文信息。如果將道路作為中心點(diǎn),可使用基于最小邊界矩形(mbrs)導(dǎo)出的公共軌跡距離度量來捕獲該道路的代表軌跡以及其周圍的代表性軌跡在一定范圍的總體相似度。首先使b1和b2分別是模式p1和p2的mbr。距離dmin(b1,b2)表示b1和b2中任意一對(duì)點(diǎn)之間的最小距離。然后,根據(jù)dmin(b1,b2)對(duì)所有模式進(jìn)行排序,并選擇與該道路距離最近的前k個(gè)模式該道路的k個(gè)相鄰模式。接著,使用這些相鄰模式和這條道路的歷史交通條件來構(gòu)建相關(guān)的特征向量。下表1顯示了如果設(shè)置k=5并且想要預(yù)測(cè)在時(shí)間t之后15分鐘的道路交通狀況的特征向量樣本,該標(biāo)志表示特征在上下文信息方面的位置?!癱”表示該功能包含道路本身的信息,“c”的不同下標(biāo)用于區(qū)分不同的道路信息。請(qǐng)注意,由于獲取實(shí)時(shí)流量非常耗資源,所以在本申請(qǐng)的方法中,不考慮r的流量狀況,r表示一段路,r是動(dòng)態(tài)的,可以是100米,可以是300米也可以是1公里,本實(shí)施例的試驗(yàn)數(shù)據(jù)里r是一段3公里的路?!發(fā)”或“r”表示道路上下文信息左側(cè)或右側(cè)的特征,該信息取決于相鄰路線所處的地理位置,“l(fā)”和“r”的下標(biāo)用于區(qū)分不同的上下文信息。圖1展示了一個(gè)道路樣本的情況,顯示其中每行表示一條道路。如果以“ab”為中心點(diǎn)繪制圓圈并設(shè)置k=5,則:“bh”,“bg”和“ae”可被視為具有“l(fā)”標(biāo)志的特征,而“ac”和“cd”可被視為具有“r”標(biāo)志的特征,因?yàn)樗鼈兌继幱趫A內(nèi)。然而,雖然“ef”的一部分也在圓圈內(nèi),但距離“ab”的距離不在dmin的前5位。表1:特征向量樣本標(biāo)志特征c1上周當(dāng)天在t的交通狀況c2上周同一天在t+15的r的交通狀況c3昨天在t的交通狀況c4昨天在t+15的r的交通狀況c5表示一天是公眾假期/周末的標(biāo)志c6一個(gè)值,表示當(dāng)天的工作日l1在t+15處鄰居模式1的交通狀況l2在t+15處相鄰模式2的交通狀況l3在t+15處相鄰模式3的交通狀況r1相鄰模式4在t+15處的交通狀況r2在t+15處的鄰居模式5的交通狀況值得注意的是,本支持更多的信息來構(gòu)建特征向量,例如更多鄰近道路的歷史交通狀況,但考慮到計(jì)算成本,本實(shí)施例優(yōu)選使用六個(gè)標(biāo)志特征“c”和k個(gè)相鄰模式來構(gòu)建特征向量這個(gè)工作。第四步,深度學(xué)習(xí)框架構(gòu)造步驟。前述步驟中,特征向量只是基于共同軌跡數(shù)據(jù)構(gòu)建。因此,需要應(yīng)用深度學(xué)習(xí)技術(shù)來進(jìn)一步提取特征向量的深層特征,從而提高預(yù)測(cè)性能。將和定義為道路r左右上下文信息。在本實(shí)施例中,和是除了和之外轉(zhuǎn)換的相應(yīng)的近鄰模式的交通狀況,作為直接使用的交通條件的值。r也是一個(gè)載體,其中包含道路本身的特征。使用下式來計(jì)算和其中f是非線性激活函數(shù),w(l)和w(r)是將隱藏層(上下文)轉(zhuǎn)換為下一個(gè)隱藏層的矩陣。圖2展示了本發(fā)明的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖,對(duì)于循環(huán)結(jié)構(gòu),首先使用定向循環(huán)神經(jīng)網(wǎng)絡(luò)來捕獲上下文。以表1為例,是鄰近圖案的上下文信息,位于距離最近道路的左側(cè)。和是道路左側(cè)具有第二近距離和第三最近距離的鄰近模式的上下文信息。類似地,和是道路右側(cè)具有第一近距離和第二近距離的鄰近模式的上下文信息?;谏鲜?,上下文向量捕獲了所有左右上下文信息。其次,定義以r來表示x如下式所示,x是所有左上下文信息所有右上下文信息和r的嵌入特征信息的連接。使用這種情境信息,與僅使用固定窗口的常規(guī)神經(jīng)模型相比,本循環(huán)神經(jīng)網(wǎng)絡(luò)可以更好地學(xué)習(xí)r的隱藏信息:在道路上下文信息的向前掃描中,循環(huán)結(jié)構(gòu)可以獲得道路從左至右掃描中的所有以及道路從右至左掃描中的所有這個(gè)過程中,時(shí)間復(fù)雜度為o(n)。在獲得x之后,對(duì)其進(jìn)行線性變換和tanh激活函數(shù)計(jì)算,并將計(jì)算結(jié)果y發(fā)送到下一層,其中y是包含各種信息的矩陣,也稱循環(huán)卷積層的輸出,y的公式如下:y=tanh(wx+b)其中,本申請(qǐng)?zhí)岢龅募軜?gòu)中的卷積神經(jīng)網(wǎng)絡(luò)被定義為代表道路,因此,從卷積神經(jīng)網(wǎng)絡(luò)的角度來看,前面所提到的循環(huán)結(jié)構(gòu)是卷積層。接著使用下式應(yīng)用一個(gè)平均池化層,以此鞏固上一層中學(xué)習(xí)和表達(dá)的特征:y*=average(y)其中,average函數(shù)是元素函數(shù),將y的每個(gè)元素的平均值作為下一層的輸入值,以推廣特征表示,并且通過模型減少對(duì)訓(xùn)練數(shù)據(jù)的過擬合。本申請(qǐng)?jiān)谶@里不使用最大池化,因?yàn)樵谥挥幸粋€(gè)卷積層的情況下,平均池化更適合捕獲信息。池化利用循環(huán)結(jié)構(gòu)的輸出作為輸入,時(shí)間復(fù)雜度為o(n)。整體模型是循環(huán)結(jié)構(gòu)和平均池化層的串聯(lián),因此整體時(shí)間復(fù)雜度仍然為o(n)。加入一個(gè)退出層和全連接層來減少過度擬合,以創(chuàng)建具有特征和激活函數(shù)的組合,以便之后通過網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。本申請(qǐng)架構(gòu)的最后一部分是輸出層。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)類似,它被定義為y**=wy*+b。驗(yàn)證時(shí),可以使用softmax函數(shù)對(duì)輸出層的輸出計(jì)算預(yù)測(cè)概率,即驗(yàn)證預(yù)測(cè)準(zhǔn)確率。第五步,訓(xùn)練優(yōu)化步驟:基于動(dòng)量隨機(jī)梯度下降算法,對(duì)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練優(yōu)化:如果將要訓(xùn)練的所有參數(shù)定義為θ,那么使用網(wǎng)絡(luò)的訓(xùn)練目標(biāo)來最大化θ的對(duì)數(shù)似然值:其中表示訓(xùn)練集,d表示訓(xùn)練集中的訓(xùn)練樣本,classd是道路交通狀況的正確類別,使用動(dòng)量隨機(jī)梯度下降算法優(yōu)化訓(xùn)練目標(biāo)。在每個(gè)步驟中,隨機(jī)選擇一個(gè)示例(d,classd)并執(zhí)行梯度下降處理:其∝是學(xué)習(xí)率,考慮到服務(wù)器可負(fù)擔(dān)的實(shí)際計(jì)算資源,為全連接層設(shè)置了100個(gè)內(nèi)存單元作為循環(huán)層以及256個(gè)隱藏單元。并進(jìn)行了10,000次訓(xùn)練迭代。經(jīng)過幾次調(diào)整,設(shè)置∝初始值為0.2,并且通過γ=0.1來進(jìn)行每1000次迭代的遞減。此外,動(dòng)量隨機(jī)梯度下降算法中的動(dòng)量因子設(shè)置為0.9,退出率設(shè)置為0.2,并且池化長(zhǎng)度設(shè)置為2,迭代訓(xùn)練后,訓(xùn)練集跟驗(yàn)證集的損失值基本接近0,由此可見,本方法,預(yù)測(cè)準(zhǔn)確度高。另外,構(gòu)建循環(huán)卷積神經(jīng)網(wǎng)絡(luò)后,具體細(xì)節(jié)的訓(xùn)練驗(yàn)證步驟,包括如何將輸入數(shù)據(jù)選取一部分作為訓(xùn)練集進(jìn)行訓(xùn)練,另一部分作為驗(yàn)證集進(jìn)行驗(yàn)證等的方式,與其它神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟類似,本發(fā)明不再贅述。道路交通狀況預(yù)測(cè)可對(duì)司機(jī)提供建議,所以需要確保預(yù)測(cè)結(jié)果盡可能地接近實(shí)際的道路交通狀況。使用一數(shù)據(jù)集對(duì)本方法進(jìn)行驗(yàn)證,該數(shù)據(jù)集包含2013年5月北京30個(gè)路段中30條道路的44580個(gè)軌跡數(shù)據(jù)樣本。訓(xùn)練過程,采用100個(gè)時(shí)期來訓(xùn)練網(wǎng)絡(luò),并使用softmax函數(shù)進(jìn)行最終準(zhǔn)確率預(yù)測(cè)。最后,使用10倍交叉驗(yàn)證來進(jìn)行評(píng)估。最后,計(jì)算獲得本方法可達(dá)到近90%的預(yù)測(cè)精度,比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)提高了5%。這是由于卷積層可以通過平均池化和捕獲來選擇更多的區(qū)分特征情境的信息。另外,為了驗(yàn)證本方法的捕捉上下文信息的能力,設(shè)定k=1,5,10,15,20來分別測(cè)試卷積神經(jīng)網(wǎng)絡(luò)和本方法,測(cè)試結(jié)果如圖3所示,可見,在所有k值中,本方法優(yōu)于傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò),另外,當(dāng)k=10時(shí),兩個(gè)模型都達(dá)到最佳性能,而本方法的隨著k變化的性能變化并不像卷積神經(jīng)網(wǎng)絡(luò)那么明顯,因此,本方法不會(huì)十分依賴k,工作穩(wěn)定性更好,因?yàn)檠h(huán)結(jié)構(gòu)可以保留更長(zhǎng)的上下文信息并且減少噪音。以上是對(duì)本發(fā)明的較佳實(shí)施進(jìn)行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實(shí)施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做出種種的等同變形或替換,這些等同的變型或替換均包含在本申請(qǐng)權(quán)利要求所限定的范圍內(nèi)。當(dāng)前第1頁(yè)12