基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數(shù)據(jù)估計(jì)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及交通信息處理技術(shù)領(lǐng)域,特別涉及一種基于馬爾科夫鏈蒙特卡洛算法 的交通流缺失數(shù)據(jù)估計(jì)方法。
【背景技術(shù)】
[0002] 在智能交通系統(tǒng)中,交通數(shù)據(jù)(交通流是最重要參數(shù)之一)是所有交通控制和管 理系統(tǒng)的重要保障,是整個(gè)智能交通系統(tǒng)得以順利運(yùn)行的基礎(chǔ)。工程上應(yīng)用的交通模型都 需要完備的交通數(shù)據(jù)進(jìn)行校正。
[0003] 然而在實(shí)際交通環(huán)境中,由于各種各樣的原因(例如交通信息檢測器的故障、網(wǎng) 絡(luò)傳輸失敗等),交通信息采集裝置采集到的交通數(shù)據(jù)往往存在數(shù)據(jù)缺失的問題。例如,北 京市的交通流數(shù)據(jù)缺失率約為10%,而美國的PeMS系統(tǒng)中,在個(gè)別監(jiān)測點(diǎn),交通流缺失率 在個(gè)別檢測點(diǎn)高達(dá)25%。
[0004] 因此,在交通領(lǐng)域內(nèi),有很多研究者從事交通缺失數(shù)據(jù)估計(jì)的研究。由于交通流是 交通數(shù)據(jù)中最重要的參數(shù)之一,很多缺失數(shù)據(jù)估計(jì)模型都以交通流為研究對象,包括基于 預(yù)測類的缺失數(shù)據(jù)估計(jì)方法、基于插值類缺失估計(jì)方法以及基于統(tǒng)計(jì)學(xué)習(xí)的缺失數(shù)據(jù)估計(jì) 方法。例如,目前相關(guān)技術(shù)中提出了一種非固定k值的最近鄰填充方法,而該方法所關(guān)注的 問題是對于利用k鄰近法估計(jì)缺失數(shù)據(jù)時(shí)最近鄰個(gè)數(shù)k值的選擇問題,并沒有關(guān)注樣本數(shù) 據(jù)的統(tǒng)計(jì)模型。另一種基于小波神經(jīng)網(wǎng)絡(luò)的退化數(shù)據(jù)缺失插補(bǔ)方法,該方法所關(guān)注的問題 是利用小波神經(jīng)網(wǎng)絡(luò)對缺失數(shù)據(jù)進(jìn)行插值估計(jì),沒有關(guān)注數(shù)據(jù)本身的統(tǒng)計(jì)特性。還有一種 交通數(shù)據(jù)彌補(bǔ)方法,該方法所關(guān)注的問題是利用神經(jīng)網(wǎng)絡(luò)對缺失數(shù)據(jù)進(jìn)行彌補(bǔ),并沒有關(guān) 注數(shù)據(jù)的統(tǒng)計(jì)學(xué)規(guī)律。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明旨在至少在一定程度上解決上述相關(guān)技術(shù)中的技術(shù)問題之一。
[0006] 為此,本發(fā)明的目的在于提出一種基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數(shù) 據(jù)估計(jì)方法,該方法能夠極大地提升交通流缺失數(shù)據(jù)的估計(jì)精度與速度。
[0007] 為了實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)施例提出了一種基于馬爾科夫鏈蒙特卡洛算法的 交通流缺失數(shù)據(jù)估計(jì)方法,包括以下步驟:S1:接收連續(xù)N天的交通流數(shù)據(jù),并根據(jù)所述連 續(xù)N天的交通流數(shù)據(jù)得到交通流數(shù)據(jù)向量集Yc= [Y⑴,Y⑵,...,Y(N)],其中,第1天的交 通流數(shù)據(jù)向量為Y⑴=[yi (1),yi (2),. ..,yi (D) ]i= 1,2,. . .,N,其中,所述Y。包括觀測數(shù) 據(jù)和缺失數(shù)據(jù)Y_,所述N為正整數(shù);S2 :根據(jù)所述第i天的交通流數(shù)據(jù)向量Y(i)設(shè)定 高斯模型,其中,所述高斯模型的參數(shù)空間為?;S3:根據(jù)所述參數(shù)空間?的估計(jì)值 算所述缺失數(shù)據(jù)的發(fā)生概率P(Y^ |Y^,?k),并根據(jù)當(dāng)前的觀測數(shù)據(jù)和最新的缺失數(shù)據(jù)估 計(jì)值計(jì)算所述參數(shù)空間?的發(fā)生概率汽,以及根據(jù)所述參數(shù)空間0的發(fā)生概 率巧015^,,^^1)對所述高斯模型的參數(shù)空間0的估計(jì)值進(jìn)行更新; S4 :重復(fù)執(zhí)行所述S3, 直至得到的馬爾科夫鏈.,?^,...,(/^^〃'?^^〃^,收斂時(shí)"古計(jì)得到所述交通流的缺 misifxis 失數(shù)據(jù)。
[0008] 根據(jù)本發(fā)明實(shí)施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數(shù)據(jù)估計(jì)方法, 通過貝葉斯估計(jì)的方式進(jìn)行交通流數(shù)據(jù)的補(bǔ)償,能夠極大地提升缺失數(shù)據(jù)的估計(jì)精度與速 度。并且,該方法采用的基于馬爾科夫鏈蒙特卡洛算法的補(bǔ)償方法能夠適用于多種交通流 數(shù)據(jù)缺失模式,因此,適用范圍廣。
[0009] 另外,根據(jù)本發(fā)明上述實(shí)施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數(shù)據(jù) 估計(jì)方法,還可以具有如下附加的技術(shù)特征:
[0010] 在一些示例中,所述高斯模型的參數(shù)空間?包括參數(shù)C和0 2。
[0011] 在一些示例中,通過以下公式估計(jì)得到所述交通流的缺失數(shù)據(jù),所述公式為:
[0012]
[0013] 其中,Nsaniple是總樣本數(shù),NB_in是丟棄的數(shù)據(jù)數(shù)目。
[0014] 在一些示例中,所述Nsampl^ 1500,所述NB_in為500。
[0015] 本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0016] 本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對實(shí)施例的描述中將變 得明顯和容易理解,其中:
[0017] 圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數(shù) 據(jù)估計(jì)方法的流程圖。
【具體實(shí)施方式】
[0018] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0019] 以下結(jié)合附圖描述根據(jù)本發(fā)明實(shí)施例的基于馬爾科夫鏈蒙特卡洛算法的交通流 缺失數(shù)據(jù)估計(jì)方法。
[0020] 圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數(shù) 據(jù)估計(jì)方法的流程圖。如圖1所示,該方法包括以下步驟:
[0021] 步驟S1 :接收連續(xù)N天的交通流數(shù)據(jù),并根據(jù)連續(xù)N天的交通流數(shù)據(jù)得到交通 流數(shù)據(jù)向量集1=[¥(1),¥(2),...,¥(沁],其中,第1天的交通流數(shù)據(jù)向量為¥(1)= [yi (1),yi (2),…,yi⑶]i= 1,2,…,N,其中,Y。包括觀測數(shù)據(jù)Y如和缺失數(shù)據(jù)Y_,N為 正整數(shù)。
[0022] 步驟S2 :模型假設(shè)。即假設(shè)第i天的交通流數(shù)據(jù)向量Y(i)服從高斯分布,設(shè)定 Y(i)的高斯模型,其中,高斯模型的參數(shù)空間為?。其中,在本發(fā)明的一個(gè)實(shí)施例中,參數(shù) 空間?包括參數(shù)C和0 2。
[0023] 步驟S3:根據(jù)參數(shù)空間?的估計(jì)值?k計(jì)算缺失數(shù)據(jù)的發(fā)生概率 pK^IY^,?k)以獨(dú)立模擬每次觀察的缺失數(shù)據(jù),然后根據(jù)當(dāng)前的觀測數(shù)據(jù)和最新的缺失 數(shù)據(jù)估計(jì)值計(jì)算參數(shù)空間?的發(fā)生概率愾,以及根據(jù)參數(shù)空間?的發(fā)生概率P(0l];z?,y=1)對高斯模型的參數(shù)空間?的估計(jì)值進(jìn)行更新。
[0024] 步驟S4 :重復(fù)執(zhí)行步驟S3,直至得到的馬爾科夫鏈 收斂時(shí),估計(jì)得到交通流的缺失數(shù)據(jù)。其中,當(dāng)?shù)玫降鸟R爾科夫鏈(