多交通檢測源動態(tài)時間粒度的數(shù)據(jù)融合處理方法
【技術領域】
[0001] 本發(fā)明屬于城市交通數(shù)據(jù)分析技術領域,尤其涉及一種多交通檢測源動態(tài)時間粒 度的數(shù)據(jù)融合處理方法。
【背景技術】
[0002] 隨著智慧城市的興起,地磁車輛檢測器、感應線圈、車流量雷達等多種道路傳感器 共同實時搜集數(shù)據(jù)的模式逐漸普及起來。另一方面伴隨數(shù)據(jù)的收集和存儲數(shù)據(jù)能力的不斷 增強,特別是個人移動終端的普及和微博、微信等移動終端客戶端用戶逐漸增多,其中的移 動終端定位技術為交通數(shù)據(jù)采集提供了海量的數(shù)據(jù)源。在這兩方面技術的推進下,在新型 的交通數(shù)據(jù)采集模式和傳統(tǒng)數(shù)據(jù)采集模式共同交織下的數(shù)據(jù)空間缺乏關聯(lián),而導致實際交 通應用方面進展緩慢成為現(xiàn)代城市交通數(shù)據(jù)處理的瓶頸。
[0003] 交通數(shù)據(jù)融合是指多傳感器的交通數(shù)據(jù)在一定準則下綜合,以完成所需的交通決 策和評估而進行的交通信息處理過程。將多種傳感器采集的交通信息進行有效融合,不但 能夠有效提高信息獲取的性價比、準確度和可靠度,并且可以避免單個信息源失效而導致 的判斷和決策錯誤。目前國內交通數(shù)據(jù)融合方法中根據(jù)各檢測器布設的位置,對包括上游 交叉口和路段的道路單元按一定時間粒度進行交通數(shù)據(jù)融合,這樣的交通信息處理費時且 存儲冗余過多,并無法保證實際應用效果。
[0004] 在新型的交通數(shù)據(jù)采集模式下傳統(tǒng)的道路交通融合方法尚存在許多不足,其主要 表現(xiàn)數(shù)在:目前的數(shù)據(jù)融合方法中時間粒度設定為定值,耗費時間和存儲空間;信息處理 僅停留在公共預設信息需求層面,且無法形成伴隨區(qū)域交通用戶量變化進而動態(tài)變化時間 粒度進行交通數(shù)據(jù)融合;對于個人移動終端產生的海量定位信息沒有有效成為交通特征的 數(shù)據(jù)依據(jù)。
【發(fā)明內容】
[0005] 為了克服數(shù)據(jù)融合中時間粒度固定造成耗費時間和存儲空間的不足,本發(fā)明提供 一種多交通檢測源動態(tài)時間粒度的數(shù)據(jù)融合處理方法。該方法以城市道路交通檢測數(shù)據(jù)為 研究對象,根據(jù)檢測數(shù)據(jù)的時空屬性提取統(tǒng)一數(shù)據(jù)格式,通過檢測區(qū)域移動終端APP位置 簽到數(shù)據(jù)動態(tài)變化確定交通應用需求,進而對檢測區(qū)域中多檢測源的數(shù)據(jù)按信源信任度系 數(shù)進行交通參數(shù)融合,實現(xiàn)城市交通數(shù)據(jù)的靈活機動分析處理。
[0006] 本發(fā)明包含交通檢測數(shù)據(jù)范化處理模塊與交通數(shù)據(jù)的動態(tài)時間粒度融合模塊,該 方法具體步驟如下:
[0007] (1)、交通檢測數(shù)據(jù)范化處理
[0008] 交通檢測數(shù)據(jù)范化處理主要實現(xiàn)多源地基型交通檢測器數(shù)據(jù)結構規(guī)范化;其處理 過程主要包括多源檢測數(shù)據(jù)的時間間隔特征提取和交通數(shù)據(jù)的數(shù)據(jù)結構范化兩個步驟:
[0009] i)提取采集數(shù)據(jù)的時間間隔,在保證數(shù)據(jù)精度的前提下提取時間基數(shù);對獲取檢 測器數(shù)據(jù)按時間基數(shù)進行數(shù)據(jù)質量控制;
[0010] ii)針對各個交通檢測源提取空間位置參數(shù),對檢測數(shù)據(jù)進行空間信息加載,并對 交通數(shù)據(jù)的范化數(shù)據(jù)結構;
[0011] 根據(jù)上述基本實施流程,所述交通檢測數(shù)據(jù)范化模塊具體實施包括以下步驟:
[0012] 步驟1、對數(shù)據(jù)記錄提取交通參量,并將數(shù)據(jù)記錄導入數(shù)據(jù)庫;
[0013] 步驟2、對相同檢測源歷史數(shù)據(jù)相鄰記錄提取數(shù)據(jù)的采集時間間隔;
[0014] 步驟3、提取多源檢測數(shù)據(jù)采集時間間隔的期望值的均值為時間基數(shù),即在時間段
[ts,tj中,數(shù)據(jù)記錄了 m種時間間隔提取時間基數(shù)仇為
其中Pik為第i 個檢測源中第k個采集時間間隔△ tk出現(xiàn)的概率,r i為第i個檢測源的采集數(shù)據(jù)量占所有 檢測數(shù)據(jù)的比例,η為區(qū)域內檢測源數(shù)目。
[0015] 步驟4、以時間基數(shù)為標準調整記錄時間間隔,并按調整后時間間隔修復缺失數(shù)據(jù) 記錄
[0016] 步驟5、對地基型檢測器的空間信息,得到交通流參數(shù)的統(tǒng)一字段DLatitude、 DLongitude、LaneNo、TimeStamp、Flow、Speed、Occ,其中 DLatitude 為檢測器位置煒度, DLongitude為檢測器位置經度,LaneNo為道路車道編號,TimeStamp為檢測時間標簽,F(xiàn)low 為檢測獲取的交通流量,Speed為檢測獲取的車輛地點速度,Occ為檢測獲取的時間占有 率。
[0017] 根據(jù)本發(fā)明交通檢測數(shù)據(jù)范化處理具體技術實施方案,所述交通檢測器數(shù)據(jù)的時 間間隔特征是為分析采集的交通檢測數(shù)據(jù)的可靠度和精確度,對應獲取數(shù)據(jù)的時間間隔屬 性,具體包括:1)采集時間間隔:是指在交通檢測器檢測數(shù)據(jù)采集時間的時間間隔;2)時間 基數(shù):是指交通檢測數(shù)據(jù)采集時間間隔的期望值;3)時間粒度:是指多源交通數(shù)據(jù)融合的 時間區(qū)間設定,本方法的時間粒度取決于對應區(qū)域內移動終端APP位置簽到數(shù)據(jù)量變化決 定的交通需求。
[0018] (2)、交通數(shù)據(jù)的動態(tài)時間粒度融合
[0019] 交通數(shù)據(jù)的動態(tài)時間粒度融合部分主要包括檢測源信任度評估模塊、位置簽到數(shù) 據(jù)更新統(tǒng)計模塊和動態(tài)時間粒度的交通參數(shù)融合模塊三個組成部分。其中檢測源信任度評 估模塊和位置簽到數(shù)據(jù)更新統(tǒng)計模塊為動態(tài)時間粒度的交通參數(shù)融合模塊的前驅,兩者為 并聯(lián)實施關系:
[0020] i)檢測源信任度評估模塊:對檢測源的歷史數(shù)據(jù)相關度因子、設備數(shù)據(jù)精度因 子、環(huán)境影響因子等方面定量評估,綜合得到檢測源信任度評估系數(shù);
[0021] ii)位置簽到數(shù)據(jù)更新統(tǒng)計模塊:對移動終端APP位置簽到數(shù)據(jù)過濾,剔除交通參 與者位置信息異常記錄和重復記錄,并遍歷區(qū)域內移動終端APP位置簽到數(shù)據(jù),統(tǒng)計動態(tài) 變化更新;
[0022] iii)動態(tài)時間粒度的交通參數(shù)融合模塊:通過位置簽到數(shù)據(jù)變化得到時間粒度 應用需求,按照應用需求和檢測源信任度對多檢測源進行交通參數(shù)融合。
[0023] 根據(jù)本發(fā)明的基本實施流程,所述檢測源信任度評估模塊具體實施包括以下步 驟:
[0024] 步驟1、確定路段待融合的η個數(shù)據(jù)檢測源,對第i個檢測源數(shù)據(jù)^計算與第j個 檢測源數(shù)據(jù)X]在一天內離散數(shù)據(jù)相關系數(shù)r U為
,其中X lk 為第i個檢測源數(shù)據(jù)一天內第k個時間基數(shù)的數(shù)據(jù),x]k為第j個檢測源數(shù)據(jù)一天內第k個 時間基數(shù)的數(shù)據(jù)。
[0026] 步驟2、根據(jù)檢測源離散數(shù)據(jù)相關系數(shù)中計算第i個檢測源的數(shù)據(jù)相關度因子Q
,其中為第i個檢測源數(shù)據(jù)X 3十算與第j個檢測源數(shù)據(jù)X ,的相關系數(shù)。
[0027] 步驟3、對第i個檢測源計算設備數(shù)據(jù)精度因子~,且
,其中%為該類檢測 源固有檢測精度。
[0028] 步驟4、根據(jù)第i個檢測源特性賦值環(huán)境影響因子Sp
[0029] 步驟5、計算第i個獨立檢測源信任度評估系數(shù)ωι
,其中Ci為第 i個檢測源數(shù)據(jù)相關度因子,4為第i個檢測源的設備數(shù)據(jù)精度因子,S i為第i個檢測源的 環(huán)境影響因子。
[0030] 根據(jù)本發(fā)明檢測源信任度評估模塊具體技術實施方案,所述檢測源信任度評估是 對包括同路段多檢測源獲取的交通信息,從數(shù)據(jù)相關度、設備精確度和環(huán)境影響度三個方 面定量綜合評價檢測源的信任度,具體體現(xiàn)為包括:1)多源數(shù)據(jù)相關度因子:是指某路段 待評價的交通檢測器測得的數(shù)據(jù)與同路段其他類檢測器數(shù)據(jù)相關比例系數(shù);2)設備數(shù)據(jù) 精度因子:是指某交通檢測設備固有檢測精度與各類檢測器精度比值的比例系數(shù);3)環(huán)境 影響因子:是指某交通檢測器在環(huán)境變化的條件下檢測結果的影響比例系數(shù)。
[0031] 根據(jù)本發(fā)明的基本實施流程,所述位置簽到數(shù)據(jù)更新統(tǒng)計模塊具體實施包括以下 步驟:
[0032] 步驟1、對移動終端APP位置簽到信息數(shù)據(jù)過濾、轉換和加載,剔除交通參與者位 置信息異常記錄和重復記錄。以得到交通參與者位置信息的統(tǒng)一字段Venue id、Venue name、Latitude、Longitude、Checked UserlD,其中 Venue id 為位置簽到數(shù)據(jù)編號、Venue name為簽到位置名稱、Latitude為簽到位置煒度、Longitude為簽到位置經度、Checked UserlD為位置簽到數(shù)據(jù)來源移動終端編號;
[0033] 步驟2、所有相鄰檢測道路交叉口連成三角形,作三角形各邊的垂直平分線,于是 每個交叉口周圍的若干垂直平分線圍成泰森多邊形。唯一的道路交叉口包涵在唯一的泰森 多邊形內。初始化S為1,其中δ為動態(tài)時間周期的時間基數(shù)倍數(shù)。
[0034] 步