欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于時(shí)空網(wǎng)格化編碼挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線的方法與流程

文檔序號:40597939發(fā)布日期:2025-01-07 20:38閱讀:6來源:國知局
一種基于時(shí)空網(wǎng)格化編碼挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線的方法與流程

本發(fā)明涉及時(shí)空數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種基于時(shí)空網(wǎng)格化編碼挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線的方法。


背景技術(shù):

1、隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展與普及,基于用戶軌跡的分析方法在很多移動(dòng)應(yīng)用中發(fā)揮重要作用。例如在“互聯(lián)網(wǎng)+體育”移動(dòng)應(yīng)用中,選擇或推薦一條合適的跑步路線對于跑步用戶而言具有顯著的應(yīng)用價(jià)值。用戶軌跡的分析為是熱門跑步路線推薦等移動(dòng)應(yīng)用業(yè)務(wù)的重要手段。

2、因此,通過智能算法分析移動(dòng)應(yīng)用內(nèi)用戶分享的軌跡大數(shù)據(jù),從中發(fā)現(xiàn)熱點(diǎn)區(qū)域和熱點(diǎn)路線,為相關(guān)用戶提供有效推薦,具有廣闊的應(yīng)用前景。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提出了一種基于時(shí)空網(wǎng)格化編碼挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線的方法,通過對位置服務(wù)相關(guān)移動(dòng)應(yīng)用內(nèi)用戶運(yùn)動(dòng)記錄數(shù)據(jù)進(jìn)行多個(gè)處理流程后得到用戶軌跡數(shù)據(jù)。之后,設(shè)計(jì)了一種時(shí)空網(wǎng)格表示方法高效壓縮和表示用戶軌跡數(shù)據(jù)。利用處理后得到空間網(wǎng)格化編碼和時(shí)間網(wǎng)格化編碼,最后設(shè)計(jì)高效的分析算法,實(shí)現(xiàn)地區(qū)內(nèi)熱點(diǎn)區(qū)域和熱點(diǎn)路線挖掘。

2、本發(fā)明提供了一種基于時(shí)空網(wǎng)格化編碼挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線的方法,包括:

3、獲取用戶運(yùn)動(dòng)記錄數(shù)據(jù),拆分后按時(shí)間排序得到用戶原始軌跡數(shù)據(jù);

4、針對所述用戶原始軌跡數(shù)據(jù)的不同情況,為其選擇數(shù)據(jù)接入和或數(shù)據(jù)清洗和或數(shù)據(jù)補(bǔ)全進(jìn)行層次化數(shù)據(jù)處理,得到用戶軌跡數(shù)據(jù);所述數(shù)據(jù)接入以篩選未滿足可處理?xiàng)l件的用戶,所述數(shù)據(jù)清洗以去除異常漂移點(diǎn)和解決定位誤差導(dǎo)致多點(diǎn)間頻繁切換的問題,所述數(shù)據(jù)補(bǔ)全以填充缺失的數(shù)據(jù);

5、對所述用戶原始軌跡數(shù)據(jù)或所述用戶軌跡數(shù)據(jù)進(jìn)行時(shí)空網(wǎng)格化編碼,得到空間網(wǎng)格化編碼和時(shí)間網(wǎng)格化編碼;

6、基于所述空間網(wǎng)格化編碼和時(shí)間網(wǎng)格化編碼挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線。

7、優(yōu)選的,所述用戶運(yùn)動(dòng)記錄數(shù)據(jù),包括:用戶唯一標(biāo)識(shí)、坐標(biāo)信息、時(shí)間信息和用戶運(yùn)動(dòng)行為信息,所述用戶運(yùn)動(dòng)行為信息包括運(yùn)動(dòng)起始坐標(biāo)、運(yùn)動(dòng)停留坐標(biāo)、運(yùn)動(dòng)結(jié)束坐標(biāo)和定時(shí)坐標(biāo)。

8、優(yōu)選的,所述拆分后按時(shí)間排序的流程包括:將所述用戶唯一標(biāo)識(shí)映射到一字符串作為新的用戶唯一標(biāo)識(shí),以完成用戶運(yùn)動(dòng)記錄數(shù)據(jù)的匿名化,再依據(jù)所述新的用戶唯一標(biāo)識(shí)對所述用戶運(yùn)動(dòng)記錄數(shù)據(jù)進(jìn)行拆分,形成多個(gè)用戶的軌跡片段,并將每個(gè)所述軌跡片段按照時(shí)間排序,形成用戶原始軌跡數(shù)據(jù)。

9、優(yōu)選的,所述數(shù)據(jù)接入的方法包括:讀取用戶原始軌跡數(shù)據(jù),并對數(shù)據(jù)缺失嚴(yán)重字段的用戶和缺少數(shù)據(jù)量的用戶進(jìn)行過濾和記錄,得到用戶軌跡序列;其中,所述缺失嚴(yán)重字段的標(biāo)準(zhǔn)為坐標(biāo)信息、時(shí)間信息和用戶運(yùn)動(dòng)行為信息任意一值填充率小于50%,所述缺少數(shù)據(jù)量的標(biāo)準(zhǔn)為每小時(shí)坐標(biāo)信息數(shù)量小于30次。

10、優(yōu)選的,所述數(shù)據(jù)清洗的方法包括:時(shí)間分層數(shù)據(jù)清洗和地理區(qū)劃分層數(shù)據(jù)清洗;所述時(shí)間分層數(shù)據(jù)清洗的方法為:按照設(shè)定的時(shí)間間隔對所述用戶軌跡序列進(jìn)行分層,判斷每層數(shù)據(jù)中相鄰兩坐標(biāo)間移動(dòng)速度是否大于設(shè)定的閾值,進(jìn)而判定是否存在漂移現(xiàn)象,以去除異常漂移點(diǎn);所述地理區(qū)劃分層數(shù)據(jù)清洗的方法為:按照行政邊界對所述用戶軌跡序列進(jìn)行分層,判斷每層數(shù)據(jù)中是否存在多個(gè)坐標(biāo)間頻繁切換的情況,在所述情況存在的基礎(chǔ)上,選取信息熵最小的坐標(biāo)作為當(dāng)前用戶所在的最佳位置。信息熵公式具體如下:

11、h(x)=-∑p(x)*log2(p(x))

12、其中,h(x)是坐標(biāo)x的熵,p(x)是連接到坐標(biāo)x發(fā)生的概率,即用戶在坐標(biāo)x的次數(shù)和總坐標(biāo)數(shù)量的比值。

13、優(yōu)選的,所述數(shù)據(jù)補(bǔ)全的方法包括:讀取缺失的坐標(biāo)的前一個(gè)坐標(biāo)和后一個(gè)坐標(biāo),計(jì)算所述前一個(gè)坐標(biāo)到所述后一個(gè)坐標(biāo)中最佳匹配路徑,提取其中坐標(biāo)信息,以填充缺失的坐標(biāo)。具體方法如下:讀取缺失的坐標(biāo)m的前一個(gè)坐標(biāo)f和后一個(gè)坐標(biāo)l,利用地理位置知識(shí)庫得到f到l間全部可達(dá)路徑,通過dtw算法計(jì)算最佳匹配路徑,并提取路徑經(jīng)過的坐標(biāo)信息,作為缺失數(shù)據(jù)填充。

14、所述通過dtw算法計(jì)算最佳匹配路徑的流程包括:

15、1)隨機(jī)選取一條可達(dá)路徑,表示為a,坐標(biāo)信息中的用戶軌跡表示為b;

16、2)對于a路徑中的每個(gè)點(diǎn),遍歷b用戶軌跡中的每個(gè)點(diǎn),計(jì)算其距離,排除兩點(diǎn)間距離大于一定閾值的點(diǎn),形成累計(jì)距離矩陣d;

17、3)根據(jù)距離最小的原則,在矩陣d中找一條最小路徑,作為路徑a與b的距離;

18、4)重復(fù)1)-3)尋找最小距離的路徑a作為最佳匹配路徑。

19、優(yōu)選的,所述時(shí)空網(wǎng)格化編碼的流程包括:

20、1)將所述用戶運(yùn)動(dòng)記錄數(shù)據(jù)中的坐標(biāo)(lng,lat)轉(zhuǎn)化為三維空間球面上的一個(gè)點(diǎn)(x,y,z),其中l(wèi)ng為經(jīng)度,lat為緯度;

21、2)將所述點(diǎn)(x,y,z)轉(zhuǎn)變到外切立方體的一面上,使其對應(yīng)所在面的編號hid,以所述面中點(diǎn)建立坐標(biāo)系,得出一三元坐標(biāo)(hid,a,b),其中a,b為點(diǎn)在該平面內(nèi)的二維坐標(biāo);

22、3)將所述坐標(biāo)(hid,a,b)所在面按所述坐標(biāo)系等分為四個(gè)正方形區(qū)域,對不同象限進(jìn)行編碼,選擇所述坐標(biāo)(hid,a,b)所在的子正方形重復(fù)上述操作形成一編碼,所述編碼再與所述hid的編碼拼接得到空間網(wǎng)格化編碼;

23、4)將所述時(shí)間信息分解為多個(gè)指定時(shí)間尺度的整數(shù),拼接各整數(shù)得到時(shí)間網(wǎng)格化編碼。具體方法如下:

24、1)將坐標(biāo)(lng,lat)按以下公式轉(zhuǎn)化為球面上的一個(gè)三維空間點(diǎn)(x,y,z),其轉(zhuǎn)換公式為:

25、

26、其中r為地球半徑;

27、2)將所述三維空間點(diǎn)(x,y,z)轉(zhuǎn)變到外切立方體的一面上,使其對應(yīng)所在面的編號hid,其中hid取值為[0,5],

28、所述轉(zhuǎn)變的步驟為:通過比較x,y,z的絕對值確定所述三維空間點(diǎn)(x,y,z)所在的面;

29、在|x|是x,y,z的絕對值中最大的情況下,當(dāng)x﹥0時(shí),點(diǎn)在x正半軸所垂直的面上,當(dāng)x﹤0時(shí),點(diǎn)在x負(fù)半軸所垂直的面上;

30、在|y|是x,y,z的絕對值中最大的情況下,當(dāng)y﹥0時(shí),點(diǎn)在y正半軸所垂直的面上,當(dāng)y﹤0時(shí),點(diǎn)在y負(fù)半軸所垂直的面上;

31、在|z|是x,y,z的絕對值中最大的情況下,當(dāng)z﹥0時(shí),點(diǎn)在z正半軸所垂直的面上,當(dāng)z﹤0時(shí),點(diǎn)在z負(fù)半軸所垂直的面上;

32、3)將所述三維空間點(diǎn)(x,y,z)所在面等分為四個(gè)正方形區(qū)域,坐標(biāo)在第一象限則標(biāo)記為11,第二象限標(biāo)記為01,第三象限標(biāo)記為00,第四象限標(biāo)記為10,選擇所述三維空間點(diǎn)(x,y,z)所在的子正方形重復(fù)上述操作15次,形成長度為32位的編碼,長度為3位的hid與其拼接得到空間網(wǎng)格化編碼;

33、4)將所述時(shí)間信息分解為多個(gè)指定時(shí)間尺度的整數(shù),其中,年設(shè)定為6位二進(jìn)制數(shù);

34、月設(shè)定為4位二進(jìn)制數(shù);日設(shè)定為5位二進(jìn)制數(shù);小時(shí)設(shè)定為5位二進(jìn)制數(shù);分鐘設(shè)定為6位二進(jìn)制數(shù);秒設(shè)定為6位二進(jìn)制數(shù),拼接形成32位的編碼,得到時(shí)間網(wǎng)格化編碼。

35、優(yōu)選的,所述挖掘熱點(diǎn)區(qū)域和熱點(diǎn)路線的方法包括:利用所述空間網(wǎng)格化編碼和時(shí)間網(wǎng)格化編碼統(tǒng)計(jì)不同時(shí)空劃分中的用戶到訪數(shù)量,形成熱點(diǎn)區(qū)域,其中熱點(diǎn)區(qū)域?yàn)橛脩舻皆L數(shù)量超過設(shè)定閾值的空間,基于所述時(shí)間網(wǎng)格化編碼得到所述熱點(diǎn)區(qū)域中用戶運(yùn)動(dòng)規(guī)律,按照所述運(yùn)動(dòng)起始坐標(biāo)、運(yùn)動(dòng)停留坐標(biāo)和運(yùn)動(dòng)結(jié)束坐標(biāo)順序連接具有所述運(yùn)動(dòng)規(guī)律的所述熱點(diǎn)區(qū)域,進(jìn)而形成熱點(diǎn)路線。

36、本發(fā)明的有益效果如下:

37、綜合考慮靜態(tài)地理信息和動(dòng)態(tài)環(huán)境因素,充分利用應(yīng)用內(nèi)用戶產(chǎn)生的數(shù)據(jù),使其產(chǎn)生更高的使用價(jià)值,通過智能分析發(fā)現(xiàn)熱點(diǎn)區(qū)域和熱點(diǎn)路線,為相關(guān)用戶提供有效推薦,為跑步愛好者提供既安全又舒適的跑步路線推薦,具有廣闊的應(yīng)用前景。因熱點(diǎn)區(qū)域和熱點(diǎn)路線是根據(jù)用戶實(shí)時(shí)產(chǎn)生的數(shù)據(jù)得出,所以發(fā)現(xiàn)的熱點(diǎn)區(qū)域和熱點(diǎn)路線相較于人工規(guī)劃更貼合實(shí)際生活,更具有現(xiàn)實(shí)使用意義。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
鲁山县| 兰考县| 内乡县| 毕节市| 台安县| 澳门| 吐鲁番市| 会昌县| 郧西县| 永城市| 乾安县| 永定县| 报价| 潮安县| 时尚| 廉江市| 寿阳县| 宁城县| 福贡县| 峨山| 揭阳市| 临桂县| 上林县| 突泉县| 吴桥县| 黄梅县| 澳门| 龙南县| 呼玛县| 遵义县| 宁国市| 荥阳市| 紫金县| 沁阳市| 浮山县| 拜城县| 保德县| 军事| 兴文县| 伊宁市| 镇巴县|