一種基于群組劃分的不確定移動(dòng)對(duì)象索引方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于群組劃分的不確定移動(dòng)對(duì)象索引方法,屬于計(jì)算機(jī)空間數(shù)據(jù)庫(kù)中的移動(dòng)對(duì)象管理技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]傳統(tǒng)數(shù)據(jù)庫(kù)索引技術(shù)是為了存儲(chǔ)精確數(shù)據(jù)而設(shè)計(jì),其索引結(jié)構(gòu)中存儲(chǔ)著移動(dòng)對(duì)象的精確位置。而由于移動(dòng)對(duì)象的位置不確定性普遍存在,所以需要改進(jìn)傳統(tǒng)的索引結(jié)構(gòu)來有效管理移動(dòng)對(duì)象的不確定性。
[0003]為解決如何高效管理移動(dòng)對(duì)象實(shí)時(shí)變化的精確位置信息的問題,學(xué)者提出了一系列的索引結(jié)構(gòu),從查詢位置信息的時(shí)間角度可分為兩類:一類是針對(duì)歷史位置位置信息的索引;另一類是針對(duì)移動(dòng)對(duì)象當(dāng)前及未來位置信息的索引。如TPR*樹⑴、STAR[2]樹和Rexp樹[3]都是基于參數(shù)化的索引方法對(duì)當(dāng)前和未來位置信息進(jìn)行管理。其中TPR樹及其變種的TPR*樹都是基于對(duì)R-tree的變形,其查詢、插入和刪除操作和R-tree相似,其自頂向下的更新模式會(huì)導(dǎo)致較大I/O代價(jià),從而對(duì)于那些頻繁進(jìn)行位置更新的移動(dòng)對(duì)象來說,難以滿足更新要求;Rexp樹通過在節(jié)點(diǎn)上添加數(shù)據(jù)時(shí)間有效屬性的策略,提高了失效數(shù)據(jù)的刪除效率,從而提高更新性能;也有學(xué)者將移動(dòng)對(duì)象的歷史位置、當(dāng)前位置和未來位置信息結(jié)合起來,提出PPFNx#[4]、Rppf樹[5]等索引模型,打破了“多線”的限制。上述索引模型對(duì)于那些位置更新次數(shù)較少的移動(dòng)對(duì)象的不確定性查詢起到很好的查詢效果,但是不能很好的處理移動(dòng)對(duì)象頻繁的位置更新問題。文獻(xiàn)[6]提出了基于R-tree的自底向上的更新思想,其更新過程從樹的葉子節(jié)點(diǎn)開始,節(jié)省了查詢時(shí)間,從而提高動(dòng)態(tài)更新的性能,但是不足之處在于其索引的維護(hù)需要耗費(fèi)大量的內(nèi)存資源,從而導(dǎo)致系統(tǒng)的穩(wěn)定性不高,且不適合解決頻繁位置變化范圍大的移動(dòng)對(duì)象的問題。
[0004]Tao[7]等人提出U-tree的索引模型,U-tree具有良好的動(dòng)態(tài)結(jié)構(gòu)使得數(shù)據(jù)的插入順序可以任意改變和更新,而且對(duì)不確定數(shù)據(jù)本身的概率密度分布沒有任何的限制。但是U-tree只適合于靜態(tài)的移動(dòng)對(duì)象不確定性索引。文獻(xiàn)[8]提出了一種基于U-tree的高效率當(dāng)前及未來不確定位置信息檢索的TPU-tree,TPU-tree在基本的U-tree結(jié)構(gòu)上增加記錄移動(dòng)對(duì)象不確定狀態(tài)特征的數(shù)據(jù)結(jié)構(gòu),通過利用概率密度函數(shù)描述移動(dòng)對(duì)象在不確定區(qū)域的位置分布,在保留原有位置記錄的情況下加入時(shí)間特性,從而能對(duì)移動(dòng)對(duì)象當(dāng)前和未來位置信息進(jìn)行檢索。文獻(xiàn)[9]在TPU-tree的基礎(chǔ)上增加一個(gè)記錄不確定移動(dòng)對(duì)象狀態(tài)特征的更新備忘錄(UM)內(nèi)存結(jié)構(gòu),提出一種支持頻繁位置更新的不確定移動(dòng)對(duì)象索引策略TPU2M樹并提出了一種改進(jìn)的基于備忘錄(MMBU/I)的更新/插入算法。MMBU/I算法利用UM控制不確定移動(dòng)對(duì)象的位置更新,在保留原有記錄的情況下首先插入新記錄,減少了查找時(shí)所需要的磁盤I/0,從而提高更新效率。但是TPU2M樹需要額外的內(nèi)存空間存放備忘錄(UM)的信息,當(dāng)UM中的記錄個(gè)數(shù)逐漸增加時(shí)需要增加額外的空間清洗操作來保證較高的更新效率且當(dāng)不確定移動(dòng)對(duì)象個(gè)數(shù)較多時(shí),更新后的葉子節(jié)點(diǎn)超過舊記錄的MBR的概率會(huì)逐漸增加,因此更新效率會(huì)逐漸降低。
[0005]文獻(xiàn)[10]提出一種基于Bx樹的不確定移動(dòng)對(duì)象索引策略ABx樹,該索引模型利用矩形框推論法則和蒙特卡洛模擬相結(jié)合的方法預(yù)測(cè)移動(dòng)對(duì)象未來的位置信息,并提出了高效的概率范圍查詢和概率K最近鄰查詢,但是ABx樹的不足之處在于對(duì)于頻繁更新的移動(dòng)對(duì)象位置信息導(dǎo)致資源消耗嚴(yán)重,增加更新代價(jià)。
[0006]上文中提到的文獻(xiàn)來源于如下的期刊:
[0007][l]Tao Y,Papadias D,Sun J.The TPR^-Tree:An Optimized Spat1-TemporalAccess Method for Predictive Queries[J].VLDB?2003:790-801.
[0008][2]Procopiuc C M?AgarwaI P K?Har-Peled S.STAR-Tree:An Efficient Self-Adjusting Index for Moving 0bjects[M]//Algorithm Engineering and ExperimentsSpringer Berlin Heidelberg?2002:178-193.
[0009][3]Saltenis S,Jensen CS,Indexing of Moving Objects for Locat1n-BasedServices[C]//ICDE,2002:0463-0463.
[0010][4]Fang Y,Cao J,Peng Y,et al.Efficient Indexing of the Past,Presentand Future Posit1ns of Moving Objects on Road Network[M]//Web-AgeInformat1n Management Springer Berlin Heidelberg?2013:223-235.
[0011][5]Pelanis M? Saltenis S?Jensen C S.1ndexing the Past,Present,andAnticipated Future Posit1ns of Moving 0bjects[J].ACM Transact1ns onDatabase Systems(TODS),2006,31(1):255-298.
[0012][6]Lee ML?Hsu WJensen C S,et al.Supporting Frequent Updates in R-Trees:A Bottom-Up Approach[C]//Proceedings of the 29th internat1nalconference on Very large data bases-Volume 29.VLDB Endowment?2003:608-619.
[0013][7]Tao Y?Cheng R,Xiao X,et al.1ndexing Mult1-Dimens1nal UncertainData with Arbitrary Probability Density Funct1ns[C]//Proceedings of 31stInternat1nal Conference,VLDB 2005Morgan Kaufmann Publishers,Inc,2005:922—933.
[0014][8]Ding X,Lu Y,Pan P,et al.U-Tree Based Indexing Method for UncertainMoving 0bjects[J].Journal of Software?2008?19(10):2696-2705.
[0015][9]Ding X?Jing H,Pan P.1ndexing of Uncertain Moving Objects withFrequent Updates[J].Chinese Journal of Computers?2012?35(12):2587-2597.
[0016][10]Zhang M?Chen S,Jensen C S,et al.Effectively Indexing UncertainMoving Objects for Predictive Queries[C]//VLDB?2009?2(I):1198-1209.
【發(fā)明內(nèi)容】
[0017]本發(fā)明為解決的技術(shù)問題:
[0018]本發(fā)明的目的是提出一種不確定移動(dòng)對(duì)象索引結(jié)構(gòu)。由于存在數(shù)據(jù)采集不精確,移動(dòng)物體延遲更新和隱私保護(hù)等原因,移動(dòng)對(duì)象的位置不確定性普遍存在。為了使數(shù)據(jù)庫(kù)中查詢提供更“靠譜”的數(shù)據(jù),需要將查詢結(jié)果的不精確性限定在一定的范圍內(nèi)。在索引結(jié)構(gòu)中儲(chǔ)存移動(dòng)對(duì)象不確定性信息已成為時(shí)空數(shù)據(jù)庫(kù)研究的熱點(diǎn)。但是由于移動(dòng)對(duì)象的位置隨時(shí)間而變化,在傳統(tǒng)空間索引結(jié)構(gòu)中存儲(chǔ)空間對(duì)象的具體位置無法適應(yīng)大量空間對(duì)象的更新操作,因而不適合移動(dòng)對(duì)象的存儲(chǔ)與檢索,但是已有的不確定移動(dòng)對(duì)象索引結(jié)構(gòu)只側(cè)重于查詢效率而忽略了更新代價(jià)問題,因此提出一種支持移動(dòng)對(duì)象頻繁位置更新而且減少更新代價(jià)的索引結(jié)構(gòu)具有現(xiàn)實(shí)意義。
[0019]本發(fā)明為解決其技術(shù)問題采用如下技術(shù)方案:
[0020]—種基于群組劃分的不確定移動(dòng)對(duì)象索引方法,包括如下步驟:
[0021](I)首先將移動(dòng)對(duì)象的歷史一段軌跡數(shù)據(jù)進(jìn)行處理處理,分析移動(dòng)對(duì)象軌跡的相對(duì)方向、速率比和空間距離等移動(dòng)特性;
[0022](2)利用相對(duì)方向、速率比和空間距離這三者間的結(jié)合得到空間軌跡相似度,根據(jù)空間軌跡相似度和最小空間相似度閾值的比較將移動(dòng)對(duì)象之間的軌跡關(guān)系分為直接可達(dá)、相依度可達(dá)和連接;
[0023](3)將移動(dòng)對(duì)象集合中所有直接可達(dá)和相依度可達(dá)的移動(dòng)對(duì)象劃分為一個(gè)群組。然后將同一個(gè)群組中移動(dòng)對(duì)象插入到GTPU-tree的同一個(gè)葉子節(jié)點(diǎn),在進(jìn)行位置更新時(shí),只對(duì)同一個(gè)葉子節(jié)點(diǎn)的一個(gè)移動(dòng)對(duì)象進(jìn)行更新;
[0024](4)周期性對(duì)群組進(jìn)行更新,將那些偏離群組中的移動(dòng)對(duì)象進(jìn)行重新劃分,從而保證同一個(gè)群組中的移動(dòng)對(duì)象都具有較高的空間軌跡相似度。
[0025]其中確定移動(dòng)對(duì)象軌跡的移動(dòng)特性,包括:
[0026]首先基于歷史軌跡,提取出相對(duì)方向、速率比和空間距離,然后根據(jù)這三者之間的結(jié)合得到空間軌跡相似度。其中相對(duì)方向,反映了兩個(gè)移動(dòng)對(duì)象運(yùn)動(dòng)方向的相似性,當(dāng)兩個(gè)移動(dòng)對(duì)象的方向夾角越小,說明運(yùn)動(dòng)的方向越一直,從而相對(duì)方向的值越大;對(duì)于速率比反映了兩者之間的速率差異,如果兩者之間速率大小差異越大則速率比越大;空間距離反映了兩個(gè)移動(dòng)對(duì)象軌跡點(diǎn)所在空間位置的差異,其利用歐式空間距離算法進(jìn)行計(jì)算。最后的空間軌跡相似度利用其三者之間的結(jié)合。兩個(gè)移動(dòng)對(duì)象軌跡越相似則空間軌跡相似度的值也就越大。
[0027]在進(jìn)行群組劃分時(shí),還包括:
[0028]根據(jù)移動(dòng)對(duì)象計(jì)算得到的空間軌跡相似度的值與提前設(shè)計(jì)好的最小閾值進(jìn)行對(duì)比可以得到直接可達(dá)、相依度可達(dá)和連接三種關(guān)系,最后將移動(dòng)對(duì)象集合中所有直接可達(dá)和相依可達(dá)的移動(dòng)對(duì)象劃分為一個(gè)群組。在進(jìn)行插入操作的時(shí)候,對(duì)于同一個(gè)群組的所有移動(dòng)對(duì)象插入到GTPU-tree的同一個(gè)葉子結(jié)點(diǎn)。
[0029]—種基于群組劃分的不確定移動(dòng)對(duì)象索引方法,包括以下步驟:
[0030]首先在已有的不確定移動(dòng)對(duì)象索引結(jié)構(gòu)TPU-tree的基礎(chǔ)上,增加群組劃分策略得到GITU-tree;然后利用群組劃分算法將不確定移動(dòng)對(duì)象進(jìn)行群組劃分處理插入到GITU-tree中;其次在進(jìn)行位置更新時(shí),對(duì)于同一個(gè)群組中的移動(dòng)對(duì)象只需選一個(gè)作為代表群組更新的對(duì)象進(jìn)行更新,而不需要顯示更新群組中的所有移動(dòng)對(duì)象,減少更新次數(shù)從而減少更新代價(jià);最后為了保證同一個(gè)群組中移動(dòng)對(duì)象軌跡具有較高的相似度,因此周期性對(duì)群組進(jìn)行更新,將那些偏離群組的移動(dòng)對(duì)象重新劃分。
[0031]本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下有益效果:
[0032](I)本發(fā)明基于群組劃分算法對(duì)不確定移動(dòng)對(duì)象索引結(jié)構(gòu)進(jìn)行了改