本發(fā)明涉及軌跡處理,具體涉及軌跡補全方法、裝置、計算機設備、存儲介質(zhì)及程序產(chǎn)品。
背景技術:
1、隨著定位技術的快速發(fā)展和智能設備的普及,軌跡數(shù)據(jù)已成為許多領域的重要資源,如交通管理、城市規(guī)劃、物流配送、用戶行為分析等。軌跡數(shù)據(jù)不僅記錄了移動對象的位置信息,還隱含了豐富的時空特征和行為模式。然而,在實際應用中,由于多種因素(如設備故障、信號遮擋、用戶隱私設置等),軌跡數(shù)據(jù)往往存在不完整或缺失的情況,這嚴重影響了數(shù)據(jù)的分析價值和實際應用效果。因此,軌跡補全技術作為解決這一問題的關鍵技術,近年來受到了廣泛關注和研究。
2、目前,基于規(guī)則的方法通常依賴于預設的規(guī)則或假設來推斷缺失的軌跡點。例如,可以通過插值算法(如線性插值、多項式插值等)來估計缺失點的位置;或者根據(jù)移動對象的移動速度、方向等特征,結合地圖信息來推測其可能的移動路徑。
3、但是,基于規(guī)則的方法在處理復雜多變的軌跡數(shù)據(jù)時,往往難以準確捕捉軌跡的細微變化和動態(tài)特性。
技術實現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種軌跡補全方法、裝置、計算機設備、存儲介質(zhì)及程序產(chǎn)品,以解決基于規(guī)則的方法在處理復雜多變的軌跡數(shù)據(jù)時,往往難以準確捕捉軌跡的細微變化和動態(tài)特性的問題。
2、第一方面,本發(fā)明提供了一種軌跡補全方法,該方法包括:獲取待補全軌跡和歷史軌跡信息;其中,待補全軌跡至少包括:三個軌跡點分別對應的h3索引;基于歷史軌跡信息,確定h3索引集合;從h3索引集合中確定包括三個h3索引的候選軌跡集合;基于候選軌跡集合,利用預先訓練的軌跡補全模型進行處理,得到目標軌跡;從目標軌跡中提取缺失的軌跡點信息,并基于缺失的軌跡點信息對待補全軌跡進行補全。
3、本實施例提供的軌跡補全方法,通過使用h3索引,能夠高效地組織和檢索地理空間數(shù)據(jù),尤其是在處理大規(guī)模軌跡數(shù)據(jù)時,能夠顯著提高查詢和匹配的效率。利用預先訓練的軌跡補全模型,可以基于候選軌跡集合中的信息,預測出待補全軌跡中缺失的軌跡點信息,能夠綜合考慮多種因素(如時間、速度、方向等),從而提高補全軌跡的準確性和可靠性。
4、在一個可選的實施方式中,基于歷史軌跡信息,確定h3索引集合,包括:對歷史軌跡信息進行轉換處理,確定歷史軌跡中每個軌跡點對應的第一h3索引及每個軌跡點的數(shù)據(jù)信息;其中,數(shù)據(jù)信息至少包括:軌跡id、識別碼、時刻、經(jīng)度、維度、速度和里程,第一h3索引對應多個軌跡點;以第一h3索引為主鍵,構建倒排索引;基于倒排索引,確定第一h3索引相鄰的第二h3索引,并基于第一h3索引和第二h3索引構建h3索引集合。
5、本實施例提供的軌跡補全方法,通過將歷史軌跡中的每個軌跡點轉換為對應的h3索引,實現(xiàn)了地理空間數(shù)據(jù)的結構化和標準化。h3索引作為一種多層次的六邊形網(wǎng)格系統(tǒng),能夠高效地表示和存儲地理空間信息,在轉換過程中,除了獲取軌跡點的h3索引外,還保留了軌跡點的其他重要數(shù)據(jù)信息,如軌跡id、識別碼、時刻、經(jīng)度、緯度、速度和里程等。這些信息為后續(xù)的軌跡分析和處理提供了豐富的數(shù)據(jù)基礎。此外,通過查找與待補全軌跡中h3索引相鄰的h3索引,可以快速構建出候選軌跡集合。這些候選軌跡很可能包含待補全軌跡中缺失的部分信息,為后續(xù)的軌跡補全提供了可能。
6、在一個可選的實施方式中,對歷史軌跡信息進行轉換處理,確定歷史軌跡中每個軌跡點對應的第一h3索引及每個軌跡點的數(shù)據(jù)信息,包括:根據(jù)歷史軌跡靜態(tài)中的坐標系,通過坐標系轉換函數(shù),將歷史軌跡信息轉化為wgs84坐標系;使用h3庫提供的api,將每個軌跡點的經(jīng)緯度轉換為第一h3索引,并確定每個軌跡點的數(shù)據(jù)信息。
7、本實施例提供的軌跡補全方法,使用h3庫提供的api將每個軌跡點的經(jīng)緯度轉換為h3索引,可以快速地實現(xiàn)地理空間數(shù)據(jù)的索引化和結構化,便于后續(xù)的查詢和分析。并且,通過h3索引,可以快速地定位到某個區(qū)域內(nèi)的所有軌跡點,而無需遍歷整個數(shù)據(jù)集。這種高效的索引機制可以顯著提高數(shù)據(jù)處理和查詢的效率,降低計算成本。
8、在一個可選的實施方式中,構建預先訓練的軌跡補全模型的過程,包括:獲取待補全行程樣本;其中,待補全行程樣本包括多個行程,各個行程至少包括三個軌跡點和軌跡點對應的h3索引;基于軌跡點對應的h3索引,從歷史軌跡數(shù)據(jù)庫中確定目標行程,以行程候選軌跡集合;基于待補全行程樣本中各個行程和行程候選軌跡集合中的目標行程,確定特征數(shù)據(jù),以確定特征數(shù)據(jù)對應的目標行程樣本;利用目標行程樣本對第一模型進行訓練,得到預先訓練的軌跡補全模型。
9、本實施例提供的軌跡補全方法,基于h3索引匹配的目標行程,可以提取出豐富的特征數(shù)據(jù),如軌跡長度、速度變化、停留點分布等。這些特征數(shù)據(jù)能夠全面地反映用戶的出行習慣和行為模式,為模型訓練提供有力的支持。并且,利用目標行程樣本對模型進行訓練時,可以根據(jù)實際需求調(diào)整模型的參數(shù)和結構,以達到最佳的補全效果。此外,還可以利用不同的算法和框架來訓練模型,以滿足不同的應用場景和需求。
10、在一個可選的實施方式中,各個行程包括的三個軌跡點分別為開始軌跡點、中間軌跡點和結束軌跡點,基于待補全行程樣本中各個行程和行程候選軌跡集合中的目標行程,確定特征數(shù)據(jù),包括:確定第一差值和第二差值之間的第一目標里程差值;其中,第一差值是指待補全行程樣本內(nèi)中間點和開始點之間的里程差值、第二差值是指候選軌跡集合中的目標行程內(nèi)中間點和開始點之間的里程差值;確定第三差值和第四差值之間的第二目標里程差值;其中,第三差值是指待補全行程樣本內(nèi)中間點和結束點之間的里程差值、第二差值是指候選軌跡集合中的目標行程內(nèi)中間點和結束點之間的里程差值;確定第五差值和第六差值之間的第一目標時長差值;其中,第五差值是指待補全行程樣本內(nèi)中間點和開始點之間的時長差值、第六差值是指候選軌跡集合中的目標行程內(nèi)中間點和開始點之間的時長差值;確定第七差值和第八差值之間的第二目標時長差值;其中,第七差值是指待補全行程樣本內(nèi)中間點和結束點之間的時長差值、第八差值是指候選軌跡集合中的目標行程內(nèi)中間點和結束點之間的時長差值;確定第九差值和第十差值之間的第一目標能耗差值;其中,第九差值是指待補全行程樣本內(nèi)中間點和開始點之間的能耗差值、第十差值是指候選軌跡集合中的目標行程內(nèi)中間點和開始點之間的能耗差值;確定第十一差值和第十二差值之間的第二目標能耗差值;其中,第十一差值是指待補全行程樣本內(nèi)中間點和結束點之間的能耗差值、第十二差值是指候選軌跡集合中的目標行程內(nèi)中間點和結束點之間的能耗差值;基于第一目標里程差值、第二目標里程差值、第一目標時長差值、第二目標時長差值、第一目標能耗差值和第二目標能耗差值,確定特征數(shù)據(jù)。
11、本實施例提供的軌跡補全方法,通過比較待補全行程樣本與候選軌跡集合中目標行程在多個關鍵點(中間點、開始點、結束點)之間的里程、時長和能耗差值,可以更精確地捕捉到兩者之間的相似性和差異性。這種細粒度的比較有助于篩選出與待補全行程最為匹配的候選軌跡,從而提高數(shù)據(jù)補全的準確性。
12、此外,考慮到不同行程在里程、時長和能耗等方面的多樣性,通過計算多個差值并作為特征數(shù)據(jù),可以使模型學習到更多關于行程特性的信息。這樣,當模型面對新的、未見過的行程數(shù)據(jù)時,能夠基于這些特征數(shù)據(jù)做出更合理的預測和推斷,從而增強模型的泛化能力。
13、在一個可選的實施方式中,方法還包括:獲取測試數(shù)據(jù)集;將測試數(shù)據(jù)集輸入預先訓練的軌跡補全模型,得到測試結果;檢測測試結果是否滿足預設條件;若測試結果滿足預設條件,則判定預先訓練的軌跡補全模型合格;若測試結果不滿足預設條件,則判定預先訓練的軌跡補全模型不合格。
14、本實施例提供的軌跡補全方法,通過使用測試數(shù)據(jù)集,以一種客觀、可重復的方式來評估模型的性能。測試數(shù)據(jù)集通常包含未用于模型訓練的樣本,因此能夠更真實地反映模型在未知數(shù)據(jù)上的表現(xiàn)。這種評估方式比主觀判斷或僅依賴少量樣本的測試更加準確。
15、第二方面,本發(fā)明提供了一種軌跡補全裝置,該裝置包括:第一獲取模塊,用于獲取待補全軌跡和歷史軌跡信息;其中,待補全軌跡至少包括:三個軌跡點分別對應的h3索引;第一確定模塊,用于基于歷史軌跡信息,確定h3索引集合;第二確定模塊,用于從h3索引集合中確定包括三個h3索引的候選軌跡集合;處理模塊,用于基于候選軌跡集合,利用預先訓練的軌跡補全模型進行處理,得到目標軌跡;補全模塊,用于從目標軌跡中提取缺失的軌跡點信息,并基于缺失的軌跡點信息對待補全軌跡進行補全。
16、第三方面,本發(fā)明提供了一種計算機設備,包括:存儲器和處理器,存儲器和處理器之間互相通信連接,存儲器中存儲有計算機指令,處理器通過執(zhí)行計算機指令,從而執(zhí)行上述第一方面或其對應的任一實施方式的軌跡補全方法。
17、第四方面,本發(fā)明提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)上存儲有計算機指令,計算機指令用于使計算機執(zhí)行上述第一方面或其對應的任一實施方式的軌跡補全方法。
18、第五方面,本發(fā)明提供了一種計算機程序產(chǎn)品,包括計算機指令,計算機指令用于使計算機執(zhí)行上述第一方面或其對應的任一實施方式的軌跡補全方法。