本發(fā)明涉及大數(shù)據(jù)和深度學(xué)習(xí),尤其涉及一種基于地理信息的大數(shù)據(jù)城市交通流量預(yù)測(cè)方法、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著城市化進(jìn)程的不斷推進(jìn),城市人口密度急劇增加,隨之而來(lái)的交通擁堵問題日益嚴(yán)峻。這不僅影響了市民的出行效率和生活質(zhì)量,還對(duì)城市經(jīng)濟(jì)的可持續(xù)發(fā)展帶來(lái)了巨大的挑戰(zhàn)。交通擁堵問題涉及多方面的因素,包括道路基礎(chǔ)設(shè)施、車輛數(shù)量、公共交通系統(tǒng)的效率、社會(huì)經(jīng)濟(jì)活動(dòng)的分布、天氣條件等。因此,如何有效預(yù)測(cè)和管理城市交通流量,成為現(xiàn)代城市管理者面臨的一個(gè)重要課題。
2、傳統(tǒng)的交通流量預(yù)測(cè)方法主要依賴于歷史交通數(shù)據(jù)和統(tǒng)計(jì)模型,如線性回歸、時(shí)間序列模型(如arima)等。這些方法雖然在一定程度上能夠反映交通流量的變化規(guī)律,但存在顯著的局限性:
3、1、缺乏對(duì)空間依賴性的考慮:交通流量具有明顯的空間依賴性,不同區(qū)域間的交通流量互相關(guān)聯(lián),傳統(tǒng)方法難以有效捕捉這一特性。
4、2、難以處理復(fù)雜的時(shí)間依賴性:交通流量的時(shí)間序列具有復(fù)雜的周期性和趨勢(shì)性,傳統(tǒng)時(shí)間序列模型難以全面捕捉短期和長(zhǎng)期的時(shí)間依賴性。
5、3、忽視外部因素的動(dòng)態(tài)影響:交通流量受多種外部因素影響,如天氣條件、節(jié)假日、重大活動(dòng)等,傳統(tǒng)方法通常難以動(dòng)態(tài)融合這些外部因素的影響,導(dǎo)致預(yù)測(cè)結(jié)果不準(zhǔn)確。
6、4、模型泛化能力不足:傳統(tǒng)方法對(duì)新數(shù)據(jù)的適應(yīng)能力有限,難以在不同城市或變化的交通環(huán)境中保持良好的預(yù)測(cè)性能。
7、近年來(lái),隨著大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)技術(shù)的發(fā)展,交通流量預(yù)測(cè)領(lǐng)域迎來(lái)了新的機(jī)遇。大數(shù)據(jù)技術(shù)能夠收集和處理海量的交通數(shù)據(jù)、地理信息數(shù)據(jù)、社會(huì)經(jīng)濟(jì)數(shù)據(jù)和環(huán)境數(shù)據(jù),為交通流量預(yù)測(cè)提供了豐富的數(shù)據(jù)基礎(chǔ)。深度學(xué)習(xí)技術(shù),特別是卷積神經(jīng)網(wǎng)絡(luò)(cnn)、圖卷積網(wǎng)絡(luò)(gcn)、長(zhǎng)短期記憶網(wǎng)絡(luò)(lstm)等,具有強(qiáng)大的特征提取和模式識(shí)別能力,能夠有效捕捉交通流量中的空間和時(shí)間依賴性。
技術(shù)實(shí)現(xiàn)思路
1、為了克服傳統(tǒng)方法的局限性,本發(fā)明提出了一種基于地理信息的大數(shù)據(jù)城市交通流量預(yù)測(cè)方法。該方法通過(guò)融合空間特征、時(shí)間序列分析和外部因素的動(dòng)態(tài)影響,旨在提高交通流量預(yù)測(cè)的準(zhǔn)確性和實(shí)用性。
2、為了實(shí)現(xiàn)上述的目的,本發(fā)明采用了以下的技術(shù)方案:
3、一個(gè)基于地理信息的大數(shù)據(jù)城市交通流量預(yù)測(cè)方法,該方法包括以下的步驟:
4、1)數(shù)據(jù)收集與預(yù)處理
5、數(shù)據(jù)源包括:交通數(shù)據(jù)、地理信息數(shù)據(jù)、社會(huì)經(jīng)濟(jì)數(shù)據(jù)和環(huán)境數(shù)據(jù);對(duì)數(shù)據(jù)預(yù)處理,去除異常值、填補(bǔ)缺失值;將來(lái)自不同來(lái)源的數(shù)據(jù)融合到一個(gè)統(tǒng)一的框架中;并從原始數(shù)據(jù)中提取有助于預(yù)測(cè)的特征,對(duì)數(shù)據(jù)進(jìn)行規(guī)范化和標(biāo)準(zhǔn)化處理;
6、2)空間特征提取
7、該步驟采用圖卷積自適應(yīng)空間特征提取模型(gcn-asfe);通過(guò)圖卷積網(wǎng)絡(luò)(gcn)和自適應(yīng)空間權(quán)重分配(aswa)機(jī)制,捕捉交通網(wǎng)絡(luò)中的空間依賴關(guān)系,并動(dòng)態(tài)調(diào)整節(jié)點(diǎn)之間的空間權(quán)重,具體包括以下步驟:
8、2.1)將城市劃分為多個(gè)區(qū)域,每個(gè)區(qū)域作為圖中的一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)的特征包括該區(qū)域的道路類型、交通容量;節(jié)點(diǎn)之間的連接表示區(qū)域之間的交通流動(dòng)關(guān)系,邊的權(quán)重可以基于地理距離、道路連接情況信息進(jìn)行初始化;
9、2.2)利用圖卷積網(wǎng)絡(luò)(gcn)捕捉道路網(wǎng)絡(luò)中的空間依賴關(guān)系;首先,通過(guò)鄰接矩陣將節(jié)點(diǎn)的特征聚合,計(jì)算每個(gè)節(jié)點(diǎn)的特征向量;然后,通過(guò)可學(xué)習(xí)的權(quán)重矩陣和激活函數(shù)更新節(jié)點(diǎn)的特征向量,捕捉節(jié)點(diǎn)之間的空間關(guān)系;
10、2.3)采用自適應(yīng)空間權(quán)重分配(aswa)機(jī)制進(jìn)行權(quán)重分配;首先,基于節(jié)點(diǎn)的特征向量,通過(guò)一個(gè)多層感知機(jī)(mlp)計(jì)算節(jié)點(diǎn)之間的權(quán)重;然后,通過(guò)softmax函數(shù)對(duì)權(quán)重進(jìn)行歸一化,確保每個(gè)節(jié)點(diǎn)的權(quán)重和為1;最后,使用更新后的權(quán)重矩陣替代原始的鄰接矩陣,重新計(jì)算節(jié)點(diǎn)的特征向量;
11、3)時(shí)間序列分析
12、通過(guò)注意力增強(qiáng)長(zhǎng)短期記憶網(wǎng)絡(luò)(ae-lstm),捕捉交通流量數(shù)據(jù)中的時(shí)間依賴性,增強(qiáng)對(duì)關(guān)鍵時(shí)間步的關(guān)注;其中:
13、3.1)lstm層:輸入標(biāo)準(zhǔn)化后的時(shí)間序列數(shù)據(jù),通過(guò)lstm層計(jì)算每個(gè)時(shí)間步的隱藏狀態(tài)ht;
14、3.2)注意力機(jī)制層:對(duì)lstm層的輸出ht進(jìn)行加權(quán),計(jì)算加權(quán)隱藏狀態(tài)hweighted;
15、3.3)預(yù)測(cè)層:將加權(quán)隱藏狀態(tài)hweighted傳遞到全連接層,進(jìn)行交通流量預(yù)測(cè);
16、4)外部因素融合
17、應(yīng)用動(dòng)態(tài)影響融合網(wǎng)絡(luò)(difn);通過(guò)特征嵌入、動(dòng)態(tài)影響評(píng)估和融合預(yù)測(cè),捕捉外部因素的動(dòng)態(tài)變化和對(duì)交通流量的影響;
18、5)模型訓(xùn)練與評(píng)估
19、將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于調(diào)整模型參數(shù),測(cè)試集用于評(píng)估模型性能;選擇合適的損失函數(shù)用于模型訓(xùn)練,最小化預(yù)測(cè)值與真實(shí)值之間的誤差;選擇合適的優(yōu)化算法進(jìn)行模型參數(shù)的優(yōu)化,更新模型權(quán)重;
20、并使用平均絕對(duì)誤差(mae)或均方根誤差(rmse)指標(biāo)評(píng)估模型性能,通過(guò)交叉驗(yàn)證方法評(píng)估模型的泛化能力,確保模型在不同數(shù)據(jù)集上的穩(wěn)定表現(xiàn);并通過(guò)改變測(cè)試數(shù)據(jù)集中的外部因素,測(cè)試模型的動(dòng)態(tài)適應(yīng)性;
21、6)模型部署與應(yīng)用
22、將訓(xùn)練好的模型部署到實(shí)際的交通管理系統(tǒng)中,提供實(shí)時(shí)的交通流量預(yù)測(cè);將預(yù)測(cè)結(jié)果以圖表、地圖的形式展示,方便交通管理部門進(jìn)行決策;同時(shí)利用預(yù)測(cè)結(jié)果,制定和調(diào)整交通管控措施;利用長(zhǎng)期交通流量預(yù)測(cè)結(jié)果,支持城市交通基礎(chǔ)設(shè)施的規(guī)劃和優(yōu)化。
23、作為優(yōu)選,所述步驟1)中交通數(shù)據(jù)包括來(lái)自交通監(jiān)控?cái)z像頭、交通流量探測(cè)器、gps車輛數(shù)據(jù)等;地理信息數(shù)據(jù)包括道路網(wǎng)絡(luò)結(jié)構(gòu)、交叉口、公交線路等gis數(shù)據(jù);社會(huì)經(jīng)濟(jì)數(shù)據(jù)包括人口密度、商業(yè)區(qū)分布、重大事件等;環(huán)境數(shù)據(jù)包括天氣條件、季節(jié)性變化等。
24、作為優(yōu)選,所述步驟1)中異常值處理包括檢測(cè)并移除不符合常理的異常數(shù)據(jù)點(diǎn),如異常高或低的流量數(shù)據(jù);對(duì)于缺失的數(shù)據(jù),采用插值法、均值填補(bǔ)或基于機(jī)器學(xué)習(xí)的方法進(jìn)行填補(bǔ);
25、有助于預(yù)測(cè)的特征包括時(shí)間特征、天氣特征和空間特征,時(shí)間特征包括從時(shí)間戳中提取時(shí)間特征,如小時(shí)、星期幾、是否節(jié)假日;天氣特征提取為將天氣數(shù)據(jù)轉(zhuǎn)化為特征向量,包括溫度、降雨量、風(fēng)速;空間特征提取為將道路網(wǎng)絡(luò)結(jié)構(gòu)和社會(huì)經(jīng)濟(jì)數(shù)據(jù)轉(zhuǎn)化為特征向量,包括道路類型、交叉口密度、商業(yè)區(qū)密度;
26、數(shù)據(jù)進(jìn)行規(guī)范化和標(biāo)準(zhǔn)化處理包括將數(shù)據(jù)縮放到0到1范圍內(nèi),以消除不同特征之間的量綱差異;將數(shù)據(jù)轉(zhuǎn)換為均值為0,標(biāo)準(zhǔn)差為1的分布。
27、作為優(yōu)選,所述步驟2.2)中圖卷積網(wǎng)絡(luò)(gcn)如下:
28、給定一個(gè)無(wú)向圖g=(v,e),其中v是節(jié)點(diǎn)集合,e是邊集合;鄰接矩陣a表示節(jié)點(diǎn)間的連接關(guān)系,節(jié)點(diǎn)特征矩陣x∈rn×d表示每個(gè)節(jié)點(diǎn)的特征向量,其中n是節(jié)點(diǎn)數(shù),d是特征維度;基本公式如下:
29、基本公式如下:
30、
31、其中:
32、h(l)是第l層的節(jié)點(diǎn)特征矩陣,初始時(shí)h(0)=x;
33、a′是通過(guò)動(dòng)態(tài)權(quán)重wi計(jì)算得到的自適應(yīng)鄰接矩陣;
34、d′是a′的度矩陣,對(duì)角元素d′ii=σja′ij;
35、w(l)是第l層的可學(xué)習(xí)權(quán)重矩陣;
36、σ是激活函數(shù)。
37、作為優(yōu)選,所述步驟2.3)中aswa機(jī)制的核心是通過(guò)一個(gè)多層感知機(jī)(mlp)來(lái)學(xué)習(xí)節(jié)點(diǎn)間的動(dòng)態(tài)權(quán)重;包括以下的步驟:
38、a)給定節(jié)點(diǎn)i和節(jié)點(diǎn)j的特征向量hi和hj,通過(guò)mlp計(jì)算它們之間的權(quán)重wij;
39、對(duì)于每一對(duì)節(jié)點(diǎn)i和j,權(quán)重wij通過(guò)以下公式計(jì)算:
40、
41、其中,表示特征向量的拼接操作,mlp是一個(gè)多層感知機(jī),用于計(jì)算節(jié)點(diǎn)對(duì)的相關(guān)性分?jǐn)?shù)eij;
42、b)通過(guò)softmax函數(shù)對(duì)所有鄰接節(jié)點(diǎn)的相關(guān)性分?jǐn)?shù)進(jìn)行歸一化,得到權(quán)重wij:
43、
44、其中,是節(jié)點(diǎn)i的鄰居節(jié)點(diǎn)集合;確保計(jì)算出的權(quán)重wij滿足歸一化條件,使其在[0,1]范圍內(nèi);
45、c)通過(guò)動(dòng)態(tài)計(jì)算的權(quán)重wij構(gòu)造自適應(yīng)鄰接矩陣a′,該鄰接矩陣能夠替代固定的鄰接矩陣a,動(dòng)態(tài)反映節(jié)點(diǎn)之間的實(shí)時(shí)關(guān)系。自適應(yīng)鄰接矩陣a′的元素定義為:
46、
47、e是圖中的邊集,表示節(jié)點(diǎn)間的連接關(guān)系;
48、如果i和j之間存在連接,即(i,j)∈e),則自適應(yīng)鄰接矩陣中對(duì)應(yīng)位置的值為wij;否則為0。
49、d)在圖卷積網(wǎng)絡(luò)(gcn)的計(jì)算過(guò)程中,我們使用自適應(yīng)鄰接矩陣a'進(jìn)行特征聚合與更新;對(duì)于每一層l的節(jié)點(diǎn)特征h(l),使用自適應(yīng)鄰接矩陣進(jìn)行傳播,更新后的節(jié)點(diǎn)特征表示為:
50、
51、其中:
52、h(l)是第l層的節(jié)點(diǎn)特征矩陣,初始時(shí)h(0)=x;
53、a′是通過(guò)動(dòng)態(tài)權(quán)重wi計(jì)算得到的自適應(yīng)鄰接矩陣;
54、d′是a′的度矩陣,對(duì)角元素d′ii=∑ja′ij;
55、w(1)是第l層的可學(xué)習(xí)權(quán)重矩陣;
56、σ是激活函數(shù)。
57、作為優(yōu)選,所述步驟3)中給定時(shí)間序列輸入{xt}和初始狀態(tài)(h0,c0),lstm的每個(gè)時(shí)
58、間步的計(jì)算如下:
59、遺忘門:控制遺忘上一個(gè)時(shí)間步的信息
60、ft=σ(wf·[ht-1,xt]+bf);
61、輸入門:控制輸入當(dāng)前時(shí)間步的信息
62、it=σ(wi·[ht-1,xt]+bi);
63、候選記憶單元:生成新的候選記憶
64、
65、更新記憶單元:結(jié)合遺忘門和輸入門的信息更新記憶單元
66、
67、輸出門:控制輸出信息
68、ot=σ(wo·[ht-1,xt]+bo);
69、隱藏狀態(tài):生成當(dāng)前時(shí)間步的隱藏狀態(tài)
70、ht=ot*tanh(ct);
71、其中,σ是sigmoid激活函數(shù),*表示逐元素乘法,w和b是可學(xué)習(xí)的權(quán)重和偏置參數(shù)。作為優(yōu)選,所述步驟3)中注意力機(jī)制的公式模型如下:
72、計(jì)算注意力得分:對(duì)每個(gè)時(shí)間步的隱藏狀態(tài)ht,通過(guò)注意力評(píng)分函數(shù)計(jì)算其得分et=vt?tanh(whht+ba);
73、計(jì)算注意力權(quán)重:通過(guò)softmax函數(shù)對(duì)注意力得分進(jìn)行歸一化,得到注意力權(quán)重
74、計(jì)算加權(quán)隱藏狀態(tài):對(duì)lstm的輸出進(jìn)行加權(quán)求和,得到加權(quán)隱藏狀態(tài)
75、
76、作為優(yōu)選,所述步驟4)中動(dòng)態(tài)影響融合網(wǎng)絡(luò)(difn)的具體步驟如下:
77、4.1)特征嵌入
78、特征嵌入步驟的目的是將各種外部因素轉(zhuǎn)換為高維特征向量,以便模型處理;給定一個(gè)外部因素的原始輸入數(shù)據(jù)集其中代表第i種外部因素的數(shù)據(jù),將這些原始數(shù)據(jù)轉(zhuǎn)換為特征向量;
79、
80、其中,fembed是特征嵌入函數(shù),為一個(gè)簡(jiǎn)單的線性變換或一個(gè)多層感知機(jī)(mlp),是嵌入函數(shù)的可學(xué)習(xí)參數(shù),是第i種外部因素的嵌入向量。
81、4.2)動(dòng)態(tài)影響評(píng)估
82、動(dòng)態(tài)影響評(píng)估步驟的目的是通過(guò)學(xué)習(xí)每種外部因素的影響權(quán)重,以反映其對(duì)交通流量的動(dòng)態(tài)影響;使用一個(gè)多層感知機(jī)(mlp)來(lái)計(jì)算每種外部因素的影響權(quán)重;給定外部因素的嵌入向量集合首先計(jì)算每種外部因素的相關(guān)性分?jǐn)?shù)
83、
84、其中,mlp是多層感知機(jī),θmlp是其可學(xué)習(xí)參數(shù);
85、然后,通過(guò)softmax函數(shù)對(duì)相關(guān)性分?jǐn)?shù)進(jìn)行歸一化,得到每種外部因素的動(dòng)態(tài)影響權(quán)重
86、
87、
88、4.3)融合預(yù)測(cè)
89、首先,計(jì)算加權(quán)的外部因素嵌入向量efusion;
90、
91、然后,將加權(quán)后的外部因素嵌入向量與內(nèi)部特征向量hinternalh_進(jìn)行融合;內(nèi)部特征向量hinternalh_是由時(shí)間序列分析模型或空間特征提取模型生成;
92、
93、其中,⊕表示特征向量的拼接操作;
94、最后,通過(guò)一個(gè)多層感知機(jī)(mlp)對(duì)組合特征進(jìn)行處理,輸出交通流量預(yù)測(cè)結(jié)果
95、其中,mlppredict是用于預(yù)測(cè)的多層感知機(jī),θpredict是其可學(xué)習(xí)參數(shù)。
96、進(jìn)一步,本發(fā)明還公開了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)所述方法。
97、進(jìn)一步,本發(fā)明還公開了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序或指令,其該計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述方法。
98、本發(fā)明由于采用了上述的技術(shù)方案,基于地理信息的大數(shù)據(jù)城市交通流量預(yù)測(cè)方法通過(guò)多源數(shù)據(jù)融合、空間特征提取、時(shí)間序列分析和外部因素動(dòng)態(tài)融合等技術(shù)手段,實(shí)現(xiàn)了對(duì)城市交通流量的高精度預(yù)測(cè)。該方法在數(shù)據(jù)質(zhì)量、多源數(shù)據(jù)融合、空間特征提取、時(shí)間序列分析和實(shí)時(shí)性等方面表現(xiàn)出顯著的技術(shù)效果,為城市交通管理、規(guī)劃和決策提供了強(qiáng)有力的技術(shù)支持,具有廣泛的應(yīng)用前景和重要的社會(huì)經(jīng)濟(jì)價(jià)值。