本發(fā)明屬于計(jì)算機(jī)大數(shù)據(jù),特別是涉及一種基于id分區(qū)的城市道路軌跡匯聚模式檢測(cè)方法。
背景技術(shù):
1、隨著定位設(shè)備和全球衛(wèi)星導(dǎo)航系統(tǒng)的高速發(fā)展,城市網(wǎng)絡(luò)中的時(shí)空軌跡數(shù)據(jù)呈爆炸式增長(zhǎng)。時(shí)空軌跡數(shù)據(jù)的分析和挖掘是軌跡數(shù)據(jù)挖掘領(lǐng)域的代表性工作。通過(guò)對(duì)時(shí)空軌跡數(shù)據(jù)的挖掘可以檢測(cè)移動(dòng)對(duì)象的行為特征,用于發(fā)現(xiàn)群體運(yùn)動(dòng)規(guī)律、群體運(yùn)動(dòng)趨勢(shì)。其所揭示的群體運(yùn)動(dòng)行為在城市規(guī)劃、交通運(yùn)輸?shù)榷鄠€(gè)領(lǐng)域具有廣闊的應(yīng)用前景。
2、id分區(qū)技術(shù)是一種常用的數(shù)據(jù)處理技術(shù),其通過(guò)識(shí)別和分析現(xiàn)有數(shù)據(jù)的特征,按照既定的標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行分區(qū)。這種分區(qū)方式使得后續(xù)的數(shù)據(jù)挖掘任務(wù)可以在每個(gè)分區(qū)中單獨(dú)進(jìn)行,從而提高挖掘效率。
3、在時(shí)空軌跡數(shù)據(jù)分析領(lǐng)域中,群體運(yùn)動(dòng)模式檢測(cè)是一個(gè)關(guān)鍵的研究方向,現(xiàn)有的群體運(yùn)動(dòng)模式檢測(cè)的工作主要基于歐式(平面)距離,這在有道路網(wǎng)絡(luò)約束的城市空間中并不適用。匯聚模式是群體運(yùn)動(dòng)模式檢測(cè)中的一個(gè)重要類別,用于發(fā)現(xiàn)群體運(yùn)動(dòng)對(duì)象的匯聚行為,例如慶?;顒?dòng)、集會(huì)等。目前,針對(duì)移動(dòng)對(duì)象軌跡數(shù)據(jù)的匯聚行為檢測(cè)主要采用樹結(jié)構(gòu)來(lái)組織軌跡數(shù)據(jù),通過(guò)遍歷這些軌跡數(shù)據(jù)來(lái)構(gòu)建和更新樹結(jié)構(gòu),可以有效檢測(cè)出匯聚行為。然而,隨著軌跡數(shù)據(jù)規(guī)模的增大,樹結(jié)構(gòu)的構(gòu)建和更新將成為算法效率的瓶頸。
4、因此,亟需一種有效的城市道路軌跡匯聚模式檢測(cè)方法,以實(shí)現(xiàn)針對(duì)城市道路軌跡數(shù)據(jù)的匯聚模式進(jìn)行高效檢測(cè)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例的目的在于提供基于id分區(qū)的城市道路軌跡匯聚模式檢測(cè)方法,以解決現(xiàn)有的運(yùn)動(dòng)模式檢測(cè)方法在有道路網(wǎng)絡(luò)約束的城市空間中難以適用的問題。
2、為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是,基于id分區(qū)的城市道路軌跡匯聚模式檢測(cè)方法,包括以下步驟:
3、s1:對(duì)移動(dòng)對(duì)象進(jìn)行位置采樣,收集軌跡樣本數(shù)據(jù);
4、s2:獲取道路網(wǎng)絡(luò)數(shù)據(jù)并進(jìn)行預(yù)處理;
5、s3:對(duì)s1的軌跡樣本數(shù)據(jù)進(jìn)行離散化處理,生成時(shí)間快照;
6、s4:利用s2預(yù)處理后的道路網(wǎng)絡(luò)數(shù)據(jù)和距離閾值d構(gòu)建道路節(jié)點(diǎn)的vnindex索引結(jié)構(gòu);
7、s5:將s3中時(shí)間快照中的移動(dòng)對(duì)象映射到s2預(yù)處理完成的道路網(wǎng)絡(luò)數(shù)據(jù)中,并更新vnindex索引結(jié)構(gòu);并對(duì)時(shí)間快照中的移動(dòng)對(duì)象進(jìn)行聚類,并生成各分區(qū);
8、s6:根據(jù)s5的分區(qū)生成候選匯聚模式,并識(shí)別出符合約束條件的匯聚模式。
9、進(jìn)一步的,所述s1中每條軌跡樣本數(shù)據(jù)包括:移動(dòng)對(duì)象的唯一標(biāo)識(shí)、位置坐標(biāo)、采樣時(shí)間。
10、進(jìn)一步的,所述s2包括:
11、s2.1:使用qgis獲取道路網(wǎng)絡(luò)數(shù)據(jù);
12、s2.2:在道路網(wǎng)絡(luò)數(shù)據(jù)中,篩選道路邊數(shù)據(jù)與道路節(jié)點(diǎn)數(shù)據(jù);其中,每條道路邊數(shù)據(jù)包括:該邊的唯一標(biāo)識(shí)、構(gòu)成該邊的兩個(gè)道路節(jié)點(diǎn)的標(biāo)識(shí)、道路長(zhǎng)度;每個(gè)道路節(jié)點(diǎn)數(shù)據(jù)包括:該節(jié)點(diǎn)的唯一標(biāo)識(shí)、經(jīng)緯度、與該節(jié)點(diǎn)相連的邊的集合。
13、進(jìn)一步的,所述s3包括:
14、s3.1:統(tǒng)計(jì)軌跡樣本數(shù)據(jù)中的采樣時(shí)間間隔以及采樣起止時(shí)間;
15、s3.2:將s3.1采樣時(shí)間間隔中出現(xiàn)頻率最高的采樣時(shí)間間隔作為時(shí)間片長(zhǎng)度,以采樣起始時(shí)間為基點(diǎn)進(jìn)行時(shí)間片劃分;將位于同一時(shí)間片的移動(dòng)對(duì)象構(gòu)成一個(gè)快照,在一個(gè)快照中,每個(gè)移動(dòng)對(duì)象只有一個(gè)位置坐標(biāo);不斷根據(jù)時(shí)間片的長(zhǎng)度劃分下一個(gè)時(shí)間片,直到到達(dá)采樣結(jié)束時(shí)刻,得到所有時(shí)間片快照,每個(gè)快照內(nèi)移動(dòng)對(duì)象的時(shí)間戳相同。
16、進(jìn)一步的,所述s4包括:
17、s4.1:根據(jù)s2.2預(yù)處理獲得的數(shù)據(jù)和距離閾值d,對(duì)每個(gè)道路節(jié)點(diǎn)連接的邊集進(jìn)行擴(kuò)展,構(gòu)建每個(gè)節(jié)點(diǎn)的道路網(wǎng)絡(luò)索引即vnindex索引;每個(gè)節(jié)點(diǎn)的道路網(wǎng)絡(luò)索引結(jié)構(gòu)包括:此節(jié)點(diǎn)的安全邊集、非安全邊集、此節(jié)點(diǎn)到每個(gè)安全邊、每個(gè)非安全邊的距離;具體步驟介紹如下:
18、對(duì)于任意一個(gè)節(jié)點(diǎn)node1,其安全邊集、非安全邊集的構(gòu)建過(guò)程具體為:
19、安全邊集:對(duì)于節(jié)點(diǎn)node1連接的邊edge1,如果edge1的長(zhǎng)度不大于d,那么edge1是node1的安全邊,節(jié)點(diǎn)node1至edge1的距離為edge1的長(zhǎng)度;對(duì)于edge1另一個(gè)節(jié)點(diǎn)node2連接的邊edge2,如果edge2的長(zhǎng)度加上edge1的長(zhǎng)度不大于d,那么edge2也是node1的安全邊,節(jié)點(diǎn)node1至edge2的距離為edge1長(zhǎng)度加上edge2的長(zhǎng)度;繼續(xù)擴(kuò)展過(guò)程,直到擴(kuò)展得到的所有邊的長(zhǎng)度之和超過(guò)d為止,在此過(guò)程中,邊長(zhǎng)度之和不超過(guò)d的所有邊都為安全邊,這些安全邊構(gòu)成節(jié)點(diǎn)node1的安全邊集;因此,節(jié)點(diǎn)node1至安全邊的距離為節(jié)點(diǎn)node1至此安全邊的過(guò)程中所有安全邊長(zhǎng)度之和;
20、非安全邊集:對(duì)于節(jié)點(diǎn)node1連接的邊edge1,如果edge1的長(zhǎng)度大于d,那么edge1為非安全邊,節(jié)點(diǎn)node1至edge1的距離為edge1的長(zhǎng)度;若在擴(kuò)展過(guò)程中,edge1的長(zhǎng)度不大于d,對(duì)于edge1另一個(gè)節(jié)點(diǎn)node2連接的邊edge2,edge1加上edge2后,邊長(zhǎng)度之和超過(guò)d,那么edge2為非安全邊,節(jié)點(diǎn)node1至edge2的距離為edge1長(zhǎng)度加上edge2的長(zhǎng)度;因此,對(duì)于edge2另一個(gè)節(jié)點(diǎn)node3連接的邊edge3也為非安全邊,后續(xù)那些加上其長(zhǎng)度后所有邊長(zhǎng)度之和大于d的邊都為非安全邊,這些非安全邊構(gòu)成node1的非安全邊集,節(jié)點(diǎn)node1到非安全邊的距離為節(jié)點(diǎn)node1至此非安全邊的過(guò)程中所有邊長(zhǎng)度之和;
21、同時(shí),在擴(kuò)展過(guò)程中要遵循以下原則:
22、(1)以節(jié)點(diǎn)node1、節(jié)點(diǎn)node2為兩節(jié)點(diǎn)的邊edge1,不論是從節(jié)點(diǎn)node1擴(kuò)展到節(jié)點(diǎn)node2,還是以節(jié)點(diǎn)node2擴(kuò)展到節(jié)點(diǎn)node1,此邊為同一條邊edge1;
23、(2)對(duì)于節(jié)點(diǎn)node1擴(kuò)展得到的非安全邊edge1,若在其他擴(kuò)展過(guò)程中發(fā)現(xiàn)edge1是安全邊,那么更新邊edge1為安全邊并更新節(jié)點(diǎn)node1到邊edge1的距離,并在非安全邊集中刪除邊edge1,同時(shí)刪除節(jié)點(diǎn)node1到非安全邊edge1的距離;
24、(3)對(duì)于節(jié)點(diǎn)node1的邊edge1,在不同的擴(kuò)展過(guò)程中節(jié)點(diǎn)node1至邊edge1的距離以最小距離為準(zhǔn)。
25、進(jìn)一步的,所述s5包括:
26、s5.1:根據(jù)s2.2的道路邊數(shù)據(jù)、道路節(jié)點(diǎn)數(shù)據(jù)及s3.2的時(shí)間片快照,對(duì)于快照中的每個(gè)移動(dòng)對(duì)象,首先采用點(diǎn)到直線的距離計(jì)算公式,計(jì)算移動(dòng)對(duì)象與所有道路邊的距離,移動(dòng)對(duì)象的坐標(biāo)由s1移動(dòng)對(duì)象的位置坐標(biāo)獲得,道路邊的坐標(biāo)由s2.2道路節(jié)點(diǎn)的經(jīng)緯度坐標(biāo)獲得;接著選取距離最小的道路邊,將移動(dòng)對(duì)象映射到與其距離最近的邊,即將移動(dòng)對(duì)象的唯一標(biāo)識(shí)、移動(dòng)對(duì)象到最近的邊的節(jié)點(diǎn)的距離加入s2.2的道路邊數(shù)據(jù)中;
27、s5.2:根據(jù)s5.1的結(jié)果更新每個(gè)節(jié)點(diǎn)的vnindex索引,并計(jì)算每個(gè)移動(dòng)對(duì)象o的鄰居集,包括:
28、s5.2.1:對(duì)于s5.1的映射結(jié)果,每條邊包含了映射到該邊的對(duì)象集以及每個(gè)對(duì)象到該邊的節(jié)點(diǎn)的距離;每個(gè)道路節(jié)點(diǎn)vnindex索引的更新方式為:對(duì)于每個(gè)道路節(jié)點(diǎn),獲取其每個(gè)安全邊上的所有移動(dòng)對(duì)象,對(duì)于非安全邊上的移動(dòng)對(duì)象僅獲取與此道路節(jié)點(diǎn)距離不大于d的移動(dòng)對(duì)象;
29、s5.2.2:篩選與o鄰近的移動(dòng)對(duì)象,構(gòu)成o的鄰居集;采取以下方法進(jìn)行篩選:
30、對(duì)于移動(dòng)對(duì)象o,在對(duì)應(yīng)的道路節(jié)點(diǎn)的對(duì)象集中,
31、對(duì)于不在edge上的任一移動(dòng)對(duì)象,計(jì)算此移動(dòng)對(duì)象到道路節(jié)點(diǎn)的距離加上o到道路節(jié)點(diǎn)的距離,即得到此移動(dòng)對(duì)象與o的距離,若不大于d則該對(duì)象與o鄰近,否則不鄰近;
32、對(duì)于在edge上的任一移動(dòng)對(duì)象,計(jì)算此移動(dòng)對(duì)象到道路節(jié)點(diǎn)的距離減去o到道路節(jié)點(diǎn)的距離的絕對(duì)值,若不大于d則該移動(dòng)對(duì)象與o鄰近,否則不鄰近;
33、將這些與o鄰近的對(duì)象組成o的鄰居集;
34、s5.3:根據(jù)s5.2中得到的移動(dòng)對(duì)象o的鄰居集構(gòu)建鄰近關(guān)系圖;
35、s5.4:將s5.3中構(gòu)建的鄰近關(guān)系圖作為scan算法的輸入進(jìn)行聚類,得到聚類后的簇,每個(gè)簇包含多個(gè)移動(dòng)對(duì)象,表示為:簇c={oi,oj…},其中oi,oj代表了群體中的各個(gè)移動(dòng)對(duì)象,i,j表示移動(dòng)對(duì)象的唯一標(biāo)識(shí);并對(duì)聚類得到的簇中的對(duì)象進(jìn)行排序,排序標(biāo)準(zhǔn)為:按照移動(dòng)對(duì)象的唯一標(biāo)識(shí)從小到大排序,選取簇中第一個(gè)對(duì)象作為id分區(qū)標(biāo)準(zhǔn)進(jìn)行分區(qū),并將此簇添加到對(duì)應(yīng)的分區(qū)中,依次將所有快照中的所有簇執(zhí)行此操作。
36、進(jìn)一步的,所述s6包括:
37、s6.1:對(duì)于s5.4得到的分區(qū)中的每個(gè)簇c,查詢與c具有非id簇包含關(guān)系且符合時(shí)間間隔i約束的簇c′,并將c′補(bǔ)全到簇c所在的分區(qū)中;
38、簇包含關(guān)系ccr描述兩個(gè)移動(dòng)對(duì)象群體的匯聚行為,對(duì)于兩個(gè)簇c1和c2,若c1中的全部移動(dòng)對(duì)象都在c2中存在,則表明c2包含c1,即二者存在簇包含關(guān)系,記作表示為ccr(c1,c2);給定id為o的簇c1,c2,以及id為o'的簇c3,如果則c2和c1之間是id?ccr,c3和c1是non-id?ccr;
39、對(duì)于分區(qū)中的每個(gè)簇,將與簇c具有non-id?ccr且符合時(shí)間間隔i約束的簇查詢出來(lái),查詢公式如下:
40、non-id?ccr-i(c,tc)={c′∈pc[o]|o=c[i](for?i=2to|c|-μ+1),ccr(c,c′),tc′∈[t-i,tc-1]}
41、其中,non-id?ccr-i(c,tc)表示與c具有non-id?ccr且符合時(shí)間間隔i約束的簇的集合,即c′;tc表示c的時(shí)間戳;在查詢過(guò)程中,t是一個(gè)表示時(shí)間的變量,初始時(shí)t為tc,tc′表示為c′的時(shí)間戳,t-i表示為c′的時(shí)間戳上限,tc-1表示c′的時(shí)間戳下限,[t-i,tc-1]表示為c′的時(shí)間約束,每查詢到一次c′時(shí),將t更新為tc′;pc[o]表示為id為o的分區(qū)即c的非id分區(qū)中的簇集,其中o為移動(dòng)對(duì)象;c[i]表示為c中的第i個(gè)移動(dòng)對(duì)象;|c|表示c中移動(dòng)對(duì)象的個(gè)數(shù),即簇c的規(guī)模;μ表示簇的規(guī)模閾值;ccr(c,c′)表示c與c′之間有簇包含關(guān)系;
42、s6.2:將s6.1得到的所有補(bǔ)全后的分區(qū)的時(shí)間序列進(jìn)行sci約束的過(guò)濾操作,只保留同時(shí)符合sci約束的時(shí)間序列對(duì)應(yīng)的簇;
43、對(duì)于一個(gè)簇列表cs={c1,...,cn},對(duì)應(yīng)的時(shí)間序列t=[t1,…,tn],用sci=[s,c,i]來(lái)表示s,c,i的值;sci約束包括以下原則:
44、(1)持續(xù)原則:t的長(zhǎng)度即t中元素的個(gè)數(shù)大于等于閾值s,即|t|≥s;
45、(2)連續(xù)原則:t中連續(xù)時(shí)間序列的長(zhǎng)度大于等于閾值c,即t中存在一個(gè)子序列ts,滿足ts[i+1]-ts[i]=1,且|ts|≥c,其中1≤i≤|ts|-1,i表示子序列ts中元素的序號(hào),ts[i+1]表示ts中第i+1個(gè)元素,ts[i]表示ts中第i個(gè)元素,ts[i+1]-ts[i]=1表示ts中第i+1個(gè)元素所表示的時(shí)間戳與第i個(gè)元素所表示的時(shí)間戳的差值;|ts|表示為ts中時(shí)間戳的個(gè)數(shù),即時(shí)間序列ts的長(zhǎng)度;
46、(3)間隔原則:t中相鄰時(shí)間戳的間隔小于等于閾值i,即t[i+1]-t[i]≤i,其中1≤i≤|t|-1,i表示t中元素的序號(hào),t[i+1]表示t中的第i+1個(gè)元素,t[i]表示t中的第i個(gè)元素,|t|表示時(shí)間序列t的長(zhǎng)度;
47、s6.3:對(duì)s6.2中過(guò)濾后的分區(qū)生成簇包含關(guān)系表,記錄簇集中符合時(shí)間約束的簇之間的包含關(guān)系,時(shí)間約束為:時(shí)間戳在[t+1,t+i]之間;
48、s6.4:利用s6.3生成的簇包含關(guān)系表,采用正向遞歸、回溯遞歸兩種搜索方法得到所有分區(qū)中所有的候選匯聚模式,篩選出符合約束條件的匯聚模式;包括:
49、s6.4.1:初始化標(biāo)記簇列表markcs、簇列表cs、時(shí)間序列t、標(biāo)記路徑markpath、下一標(biāo)記路徑nextmarkpath;markcs用于記錄正向遞歸、回溯遞歸中已訪問的簇,遞歸結(jié)束后根據(jù)markpath更新markcs;簇列表cs用于記錄候選匯聚模式中的簇;時(shí)間序列t用于記錄簇列表cs中每個(gè)簇對(duì)應(yīng)的時(shí)間戳,表示候選匯聚模式的時(shí)間序列;標(biāo)記路徑markpath用于記錄正向遞歸、回溯遞歸過(guò)程中訪問過(guò)的簇,在遞歸結(jié)束后將markpath中的元素合并到標(biāo)記簇列表markcs中;下一標(biāo)記路徑nextmarkpath用來(lái)記錄正向遞歸中新加入的簇也存在于另一簇包含關(guān)系時(shí)、回溯遞歸時(shí)訪問過(guò)的簇,結(jié)束遞歸搜索時(shí)將nextmarkpath中的元素合并到標(biāo)記路徑markpath中;
50、s6.4.2:正向遞歸搜索:對(duì)于每個(gè)分區(qū),遍歷簇包含關(guān)系表中的簇,對(duì)于未訪問過(guò)的簇,將其加入cs和標(biāo)記路徑markpath,其時(shí)間序列加入t;
51、根據(jù)簇包含關(guān)系表,獲取與當(dāng)前簇存在簇包含關(guān)系的第一個(gè)簇,檢查此簇是否已被訪問;若未被訪問,則將它加入cs和markpath,其時(shí)間戳加入t;
52、若新加入的簇不存在另一簇包含關(guān)系中,結(jié)束正向遞歸搜索,得到候選匯聚模式mp=(cs,t);
53、若新加入的簇也存在于另一簇包含關(guān)系中,初始化下一標(biāo)記路徑nextmarkpath,繼續(xù)進(jìn)行正向遞歸搜索,將另一簇包含關(guān)系中的第一個(gè)簇加入到cs和nextmarkpath,其時(shí)間戳加入t,不斷進(jìn)行正向遞歸搜索,直至新加入的簇不在另一簇包含關(guān)系中,結(jié)束正向遞歸搜索,得到候選匯聚模式mp=(cs,t);
54、結(jié)束正向遞歸搜索后,將nextmarkpath中的元素合并到標(biāo)記路徑markpath中,來(lái)更新標(biāo)記路徑markpath;
55、s6.4.3:檢查候選匯聚模式是否滿足簇規(guī)模閾值m和sci約束的原則,并輸出符合條件的模式;
56、若候選匯聚模式mp=(cs,t)同時(shí)滿足以下條件:
57、(1)ci表示cs中第i個(gè)簇,ci+1表示cs中第i+1個(gè)簇;表示簇列表cs中的每個(gè)簇ci與其后面相鄰簇ci+1之間存在包含關(guān)系;
58、(2)|cn|≥m;|cn|表示cs中第n個(gè)簇中移動(dòng)對(duì)象的個(gè)數(shù),即簇cn的規(guī)模;
59、(3)t滿足sci約束;
60、則mp是匯聚模式,進(jìn)行輸出;
61、s6.4.4:回溯遞歸:根據(jù)s6.4.2得到的每個(gè)候選匯聚模式mp=(cs,t),選擇候選匯聚模式的簇列表cs中最后一個(gè)簇cn,回溯到與其存在簇包含關(guān)系的上一個(gè)簇cn-1,檢查與cn-1存在包含關(guān)系的簇是否被訪問過(guò),即在s6.4.2的markcs中檢查與cn-1存在包含關(guān)系的簇是否被訪問過(guò),若未被訪問過(guò),重復(fù)s6.4.2-s6.4.3,搜索每個(gè)分區(qū)剩余所有候選匯聚模式,判斷并輸出每個(gè)分區(qū)內(nèi)符合簇規(guī)模閾值m和sci約束的匯聚模式;
62、若直至回溯遞歸到候選匯聚模式cs的第一個(gè)簇c1都未出現(xiàn)未被訪問過(guò)的簇,結(jié)束回溯遞歸搜索;將此過(guò)程訪問過(guò)的簇加入下一標(biāo)記路徑nextmarkpath,并根據(jù)nextmarkpath更新markpath,將markpath中的元素合并到markcs中,更新markcs。
63、本發(fā)明的有益效果是
64、1,本發(fā)明在匯聚模式檢測(cè)時(shí)以id分區(qū)為單位進(jìn)行處理,通過(guò)將大規(guī)模數(shù)據(jù)劃分為多個(gè)較小的分區(qū),可以在每個(gè)分區(qū)內(nèi)獨(dú)立進(jìn)行檢測(cè),從而加快整體檢測(cè)的速度。
65、2,本發(fā)明引入了sci過(guò)濾操作,對(duì)各分區(qū)進(jìn)行預(yù)處理,提前過(guò)濾掉不符合約束條件的分區(qū),這樣可以顯著減少需要處理的數(shù)據(jù)量,提升檢測(cè)效率。
66、3,本發(fā)明結(jié)合id分區(qū)技術(shù)、vnindex索引結(jié)構(gòu)、簇包含關(guān)系、sci約束、正向遞歸、回溯遞歸搜索法,極大地提高了針對(duì)城市道路軌跡數(shù)據(jù)的匯聚模式的檢測(cè)效率。