一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法,所述方法包括:建立語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停留點(diǎn)的語義信息,并對每一類服務(wù)進(jìn)行加權(quán),根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位置,并描述每一個位置的語義信息,生成連續(xù)的種類軌跡序列,根據(jù)生成的種類軌跡序列,提取用戶之間共同的種類軌跡子序列CTP,計(jì)算用戶之間的相似度,為目標(biāo)用戶挑選前k個相似用戶。本發(fā)明可以為用戶發(fā)現(xiàn)與其生活模式相同的潛在好友,增加候選服務(wù)的個數(shù),有效解決數(shù)據(jù)稀疏性問題,同時提高用戶的服務(wù)體驗(yàn)質(zhì)量,為未來基于位置的社交網(wǎng)絡(luò)中用戶個性化服務(wù)推薦提供有益的解決思路。
【專利說明】
-種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及網(wǎng)絡(luò)通信領(lǐng)域,特別設(shè)及一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法 及系統(tǒng)。
【背景技術(shù)】
[0002] 近年來,隨著各種移動終端設(shè)備的廣泛應(yīng)用及推廣,基于位置的社交網(wǎng)絡(luò)化BSN) 如!^ursquare JacebookPlace ,Twitter W及街旁等也獲得了空前發(fā)展?;谖恢玫纳缃痪W(wǎng) 絡(luò),其特點(diǎn)是利用用戶的簽到信息,將在線社交網(wǎng)絡(luò)和物理位置結(jié)合起來,W實(shí)現(xiàn)虛擬世界 中基于位置的服務(wù)資源的共享與傳播。從而,在移動環(huán)境下,用戶可W及時地獲取網(wǎng)絡(luò)服 務(wù),例如:多媒體服務(wù)、天氣預(yù)測、實(shí)時新聞W及交通信息等。經(jīng)CISCO預(yù)測顯示:到2016年, 移動數(shù)據(jù)流量將超過幾個艾字節(jié)/月,其中視頻服務(wù)所產(chǎn)生的流量將占總消費(fèi)流量的86%。 因此,大量的互聯(lián)網(wǎng)服務(wù)被推送到用戶端,W提供給用戶不同類型的服務(wù)選擇。但是,由于 傳統(tǒng)通信模式的限制,用戶經(jīng)常收到一些無用的信息,甚至用戶感興趣的服務(wù)已經(jīng)被大量 的網(wǎng)絡(luò)服務(wù)淹沒。在運(yùn)種情況下,服務(wù)推薦系統(tǒng)逐漸興起并引起了許多學(xué)者的關(guān)注。服務(wù)推 薦系統(tǒng)可W在大量網(wǎng)絡(luò)服務(wù)中發(fā)現(xiàn)滿足用戶需求的個性化服務(wù)W推薦給用戶,并提供不同 功能和性能上的服務(wù)。
[0003] 與Web捜索引擎不同,服務(wù)推薦系統(tǒng)不僅關(guān)屯、捜索結(jié)果之間的關(guān)系和順序,而且關(guān) 屯、用戶對不同服務(wù)的個性化偏好。傳統(tǒng)的服務(wù)推薦方法依賴"用戶-條目"的二元組信息,包 括協(xié)同過濾推薦(CF)和基于內(nèi)容的推薦(CBR)。盡管如此,隨著用戶個性化需求的不斷增 加,僅僅考慮用戶和條目的關(guān)系不能精確地向用戶提供合適的服務(wù)。因此,當(dāng)用戶請求服務(wù) 時,上下文信息(例如:時間、位置、社會關(guān)系、環(huán)境、情感W及網(wǎng)絡(luò)狀態(tài)等)需要被考慮在內(nèi), W構(gòu)成"用戶-上下文-條目"的=元組信息。并且,隨著上下文信息的不斷改變,上下文感知 的服務(wù)推薦系統(tǒng)(CARS)可W為用戶提供自動的、個性化的服務(wù)選擇。例如:用戶A喜歡在公 交車上瀏覽其感興趣的小說,而不是在辦公室;用戶B喜歡在下班后查找相關(guān)促銷廣告信 息,而不是在上班時。因此,如何通過上下文信息挖掘用戶的個性化偏好,成為服務(wù)推薦系 統(tǒng)的一個重要研究目標(biāo)。
[0004] 相似用戶發(fā)現(xiàn)是服務(wù)推薦系統(tǒng)的一個關(guān)鍵流程。在基于位置的社交網(wǎng)絡(luò)中,服務(wù) 器憑借"check-in"服務(wù)捜集到每個用戶日常的位置歷史信息,從而利用地理空間和語義空 間之間的關(guān)系,提取用戶的生活習(xí)慣和模式。對于GPS軌跡數(shù)據(jù)集,由于其空間復(fù)雜性和時 間連續(xù)性,通過傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)(例如:贓風(fēng)跟蹤和動物活動行為)很難提取出用戶的 生活習(xí)慣。更重要的是,不同的訪問位置序列可W反映用戶不同的意愿,并且不同地理區(qū)域 的用戶可能擁有相同的意愿。移動軌跡模式是指由一系列位置的語義信息按照一定的順序 組成的一組序列,它可W有效地描述用戶的生活規(guī)律和偏好。例如:如果一個用戶的日常活 動順序?yàn)?購物"^ "吃飯"^ "看電影",那么他/她的移動軌跡模式可W被提取為"商場"^ "餐館電影院"。因此,從移動軌跡模式的角度出發(fā),通過比較用戶之間的軌跡模式相似 度,為目標(biāo)用戶發(fā)現(xiàn)其潛在好友,將為未來基于位置的社交網(wǎng)絡(luò)中用戶個性化服務(wù)推薦提 供有益的解決思路。
【發(fā)明內(nèi)容】
[0005] 為了發(fā)現(xiàn)與用戶生活模式相同的潛在好友,增加候選服務(wù)的個數(shù),提高用戶的服 務(wù)體驗(yàn)質(zhì)量,本發(fā)明提供了一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法及系統(tǒng)。所述技術(shù) 方案如下:
[0006] -種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法,所述方法包括:
[0007] 建立語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停留點(diǎn)的語義信息,并對每一類服 務(wù)進(jìn)行加權(quán);
[0008] 根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位置,并描述每一個位置的語義信息,生 成連續(xù)的種類軌跡序列;
[0009] 根據(jù)生成的種類軌跡序列,提取用戶之間共同的種類軌跡模式CTP;
[0010] 計(jì)算用戶之間的相似度,將用戶按相似度進(jìn)行排序,為目標(biāo)用戶挑選前k個相似用 戶。
[0011] 所述語義描述模型包括:
[0012] 用S表示停留點(diǎn)的集合,計(jì)算一個停留點(diǎn)Si的坐標(biāo),得到由停留點(diǎn)組成的軌跡; [001引計(jì)算停留點(diǎn)的種類權(quán)重,得到停留點(diǎn)關(guān)于種類的特征向量。
[0014] 所述方法還包括:
[0015] 初始化停留點(diǎn)集合,計(jì)算移動軌跡的長度;
[0016] 判斷任意兩點(diǎn)間的距離是否小于閥值,并且時間是否大于閥值,如果否,則刪除。 [0017]計(jì)算中屯、節(jié)點(diǎn)的坐標(biāo);
[001引將該中屯、節(jié)點(diǎn)添加至停留點(diǎn)集合中。
[0019] 所述種類軌跡描述方法包括:
[0020] 將停留點(diǎn)聚類為位置,得到位置軌跡序列;
[0021] 利用停留點(diǎn)中每一類型的非零權(quán)重值的個數(shù),計(jì)算位置所對應(yīng)的PO巧巾類的權(quán)重, 得到位置關(guān)于種類的特征向量;
[0022] 聚類位置的特征向量,使每一個位置被劃分為不同的種類,得到種類軌跡序列。
[0023] 所述方法還包括:
[0024] 初始化位置集合,計(jì)算停留點(diǎn)集合中的元素個數(shù);
[0025] 創(chuàng)建一個位置,將停留點(diǎn)加入到該位置中,并計(jì)算位置坐標(biāo);
[0026] 判斷停留點(diǎn)到位置的距離是否大于閥值,如果是,則創(chuàng)建下一個位置,將停留點(diǎn)加 入到該位置中,計(jì)算位置坐標(biāo),如果否,則將停留點(diǎn)加入到該位置,更新位置坐標(biāo);
[0027] 將該位置添加至位置集合中。
[0028] 所述共同軌跡模式提取方法包括:
[0029] 初始化軌跡模式集合,定義子序列的長度;
[0030] 檢索兩個用戶語義軌跡中的各個節(jié)點(diǎn);
[0031] 判斷兩個語義點(diǎn)是否相同,如果否,則刪除,繼續(xù)檢索,如果是,進(jìn)行下一步;
[0032] 標(biāo)記該點(diǎn)的位置,從該點(diǎn)開始查找是否有規(guī)定長度閥值的子序列,如果否,則刪 除,繼續(xù)檢索,如果是,則將該子序列加入至軌跡模式集合中。
[0033] 所述相似用戶發(fā)現(xiàn)方法包括:
[0034] 通過提取出的共同軌跡模式,從類型流行度和活動序列兩個方面計(jì)算用戶之間的 相似度;
[0035] 將用戶按相似度按從大到小排序,從而為目標(biāo)用戶挑選出前k個相似用戶。
[0036] -種基于移動軌跡模式的潛在好友發(fā)現(xiàn)系統(tǒng),所述系統(tǒng)包括停留點(diǎn)檢測模塊、停 留點(diǎn)語義描述模塊、位置檢測模塊、位置語義描述模塊、共同軌跡模式提取模塊W及相似用 戶發(fā)現(xiàn)模塊,其中,
[0037] 所述停留點(diǎn)檢測模塊,用于檢測原始GPS軌跡數(shù)據(jù)中,所存在的具有一定駐留行為 的點(diǎn);
[0038] 所述停留點(diǎn)語義描述模塊,用于對檢測到的停留點(diǎn)進(jìn)行語義信息的描述;
[0039] 所述位置檢測模塊,用于檢測停留點(diǎn)數(shù)據(jù)中,所存在的反映用戶移動行為的點(diǎn);
[0040] 所述位置語義描述模塊,用于對檢測到的位置進(jìn)行語義信息的描述;
[0041] 所述共同軌跡模式提取模塊,用于從語義軌跡中提取出用戶之間共同的軌跡模 式;
[0042] 所述相似用戶發(fā)現(xiàn)模塊,用于計(jì)算用戶之間的相似度,并為目標(biāo)用戶挑選前k個相 似用戶。
[0043] 本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:
[0044] 建立語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停留點(diǎn)的語義信息,并對每一類服 務(wù)進(jìn)行加權(quán),根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位置,并描述每一個位置的語義信 息,生成連續(xù)的種類軌跡序列,根據(jù)生成的種類軌跡序列,提取用戶之間共同的種類軌跡子 序列CTP,計(jì)算用戶之間的相似度,為目標(biāo)用戶挑選前k個相似用戶。本發(fā)明實(shí)施例提供的方 案,可W為用戶發(fā)現(xiàn)與其生活模式相同的潛在好友,增加候選服務(wù)的個數(shù),有效解決數(shù)據(jù)稀 疏性問題,同時提高用戶的服務(wù)體驗(yàn)質(zhì)量,為未來基于位置的社交網(wǎng)絡(luò)中用戶個性化服務(wù) 推薦提供有益的解決思路。
【附圖說明】
[0045] 圖1是本發(fā)明實(shí)施例一提供的基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法原理流程 圖;
[0046] 圖2是本發(fā)明實(shí)施例一提供的停留點(diǎn)檢測算法示意圖;
[0047] 圖3是本發(fā)明實(shí)施例一提供的位置檢測算法示意圖。
[0048] 圖4是本發(fā)明實(shí)施例一提供的共同軌跡模式提取算法示意圖。
[0049] 圖5是本發(fā)明實(shí)施例二提供的基于移動軌跡模式的潛在好友發(fā)現(xiàn)系統(tǒng)結(jié)構(gòu)示意 圖。
【具體實(shí)施方式】
[0050] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明實(shí)施方 式作進(jìn)一步地詳細(xì)描述。
[0051] 本發(fā)明提出了一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法,將用戶的地理位置信 息映射為語義描述信息,挖掘用戶的興趣、偏好W及個人生活習(xí)慣,目的是為用戶發(fā)現(xiàn)與其 生活模式相同的潛在好友,增加候選服務(wù)的個數(shù),有效解決數(shù)據(jù)稀疏性問題,同時提高用戶 的服務(wù)體驗(yàn)質(zhì)量,為未來基于位置的社交網(wǎng)絡(luò)中用戶個性化服務(wù)推薦提供有益的解決思 路。
[0052] 本發(fā)明提供的語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停留點(diǎn)的語義信息,并對 每一類服務(wù)進(jìn)行加權(quán),再根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位置,并描述每一個位置 的語義信息,生成連續(xù)的種類軌跡序列,再根據(jù)生成的種類軌跡序列,提取用戶之間共同的 種類軌跡子序列CTP,計(jì)算用戶之間的相似度,為目標(biāo)用戶挑選前k個相似用戶。
[0053] 實(shí)施例一
[0054] 如圖1所示,為本發(fā)明實(shí)施例提供的基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法原理 流程圖,其中,
[0055] 步驟10,建立語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停留點(diǎn)的語義信息,并對 每一類服務(wù)進(jìn)行加權(quán)。
[0056] 在用戶原始的軌跡數(shù)據(jù)中,每一個移動的地理位置都可W被看作是具有經(jīng)締度信 息的點(diǎn)。停留點(diǎn)的定義為:停留點(diǎn)表示一個區(qū)域,在運(yùn)個區(qū)域內(nèi)用戶停留了一段時間,并且 做了一項(xiàng)有意義的活動。一種情況是用戶進(jìn)入到一座衛(wèi)星信號弱的建筑內(nèi),例如:購物中 屯、、電影院、劇院或者博物館等;另一種情況是用戶在地理區(qū)域外部逗留,但并沒有穿過該 區(qū)域,例如:觀光旅游。
[0057] 用S表示停留點(diǎn)的集合,一個停留點(diǎn)Si可W表示為:
[0化引
無成(1)
[0059] 其中W(Ion)和W(Iat)分別代表每一個原始點(diǎn)W的經(jīng)締度,由停留點(diǎn)組成的軌跡 表示為 Tra_s = si 一 S2 一---->Sn〇
[0060] 為了挖掘用戶的興趣和偏好,只知道用戶在地理空間上的活動軌跡是不夠的,語 義空間能描述每一個地理位置所對應(yīng)的語義信息,并且通過利用獲取到的語義信息,本發(fā) 明能夠挖掘出生活在不同地理區(qū)域的、具有相同語義信息的相似用戶。POI標(biāo)識了每一個地 理位置點(diǎn)所具有的服務(wù)名稱、類別、W及經(jīng)締度信息,通過TF-IDF算法,停留點(diǎn)所對應(yīng)的POI 種類的權(quán)重可W被計(jì)算為:
[0061]
公式口)
[0062] 其中,N表示在該區(qū)域中存在的總POI個數(shù),n康示類型i的POI個數(shù),S康示類型i的 停留點(diǎn)集合。
[0063] 每一個停留點(diǎn)的特征向量可W表示為fs=<Wl,W2, . . .,Wn>,從而停留點(diǎn)被賦予 了一定的語義信息。
[0064] 具體的停留點(diǎn)檢測算法如圖2所示,其中,
[0065] 1)初始化停留點(diǎn)集合,計(jì)算移動軌跡的長度。
[0066] 2)判斷任意兩點(diǎn)間的距離是否小于閥值,并且時間是否大于閥值,如果否,則返回 到1)。
[0067] 3)計(jì)算中屯、節(jié)點(diǎn)的坐標(biāo)。
[0068] 4)將該中屯、節(jié)點(diǎn)添加至停留點(diǎn)集合中。
[0069] 步驟20,根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位置,并描述每一個位置的語義 信息,生成連續(xù)的種類軌跡序列。
[0070] 停留點(diǎn)有時不能完全區(qū)分用戶在一個語義空間上所具有的行為,例如:兩個不同 的停留點(diǎn),分別位于清華大學(xué)的兩個不同的活動場地,但是運(yùn)兩個停留點(diǎn)屬于相同的語義 描述范疇。為了給每個用戶建立統(tǒng)一的行為描述信息,本發(fā)明利用下式將停留點(diǎn)聚類為位 置:
[00711
公式(3)
[0072] 一個用戶的位置軌跡序列可W表示為ha_L = ^^L2^…^Ln,每一個位置L代表 一個地理區(qū)域,在該區(qū)域中包含一些語義空間上的停留點(diǎn),例如:商場、電影院等。不同用戶 的相似停留點(diǎn)被分配到相同的位置以中,從而為用戶行為描述方法提供了統(tǒng)一地標(biāo)準(zhǔn)。
[0073] 具體的位置檢測算法如圖3所示,其中,
[0074] 1)初始化位置集合,計(jì)算停留點(diǎn)集合中的元素個數(shù)。
[0075] 2)創(chuàng)建一個位置,將停留點(diǎn)加入到該位置中,并計(jì)算位置坐標(biāo)。
[0076] 3)判斷停留點(diǎn)到位置的距離是否大于閥值,如果是,則創(chuàng)建下一個位置,將停留點(diǎn) 加入到該位置中,計(jì)算位置坐標(biāo),如果否,則將停留點(diǎn)加入到該位置,更新位置坐標(biāo)。
[0077] 4)將該位置添加至位置集合中。
[0078] 基于步驟10中計(jì)算的停留點(diǎn)的語義信息,位置k的語義信息可W通過其包含的停 留點(diǎn)的語義信息綜合表示。例如:一個位置中包含類型i和類型j的停留點(diǎn),通過i和j的信息 更能精確地描述該位置。
[0079] 利用停留點(diǎn)中每一類型的非零權(quán)重值的個數(shù),位置所對應(yīng)的PCH種類的權(quán)重可W 被計(jì)算為:
[nn?n1 公式(4)
[ 公《口)
[0082] 其中,f S表示停留點(diǎn)的特征向量,每一個位置的特征向量可W表示為Fl = <Wi, 胖2, . . .,Wk〉。
[0083] 通過聚類特征向量,每一個位置都被劃分為不同的種類,并且該用戶的種類軌跡 序列可W表不為Tra_C = Ci 一 C2 一----^Cn,從而構(gòu)建了用戶移動軌跡模型。
[0084] 步驟30,根據(jù)生成的種類軌跡序列,提取用戶之間共同的種類軌跡模式CTP。
[0085] 利用步驟20提供的用戶移動軌跡模型,本發(fā)明能在每個用戶之間提取共同的種類 軌跡子序列CTP,考慮到一個或者兩個不同的種類組成的序列無法很好地反正用戶的活動 模式,本發(fā)明規(guī)定子序列的長度不小于3。
[0086] 具體的共同軌跡模式提取算法如圖4所示,其中,
[0087] 1)初始化軌跡模式集合,定義子序列的長度。
[0088] 2)檢索兩個用戶語義軌跡中的各個節(jié)點(diǎn)。
[0089] 3)判斷兩個語義點(diǎn)是否相同,如果否,則返回到2)繼續(xù)檢索,如果是,進(jìn)行下一步。
[0090] 4)標(biāo)記該點(diǎn)的位置,從該點(diǎn)開始查找是否有規(guī)定長度閥值的子序列,如果否,則返 回到2)繼續(xù)檢索,如果是,則將該子序列加入至軌跡模式集合中。
[0091] 步驟40,計(jì)算用戶之間的相似度,將用戶按相似度進(jìn)行排序,為目標(biāo)用戶挑選前k 個相似用戶。
[0092] 通過共同軌跡模式提取算法,用戶之間的CTP能夠被提取出來,從而計(jì)算用戶的相 似度。與傳統(tǒng)的相似度計(jì)算方法不同,本發(fā)明主要考慮兩個方面:
[0093] 第一,類型流行度,其反映用戶的個性化偏好。類型流行度越高,所能體現(xiàn)的用戶 相似度越低。因此,CTP中每一個類型Ck的相似度可W被計(jì)算為:
[0094]
公乂 (6)
[0095] 其中,POP(Ck)表示類型Ck的流行度,并且該值可W參考步驟10中的IDF值。
[0096] 第二,活動序列,代表用戶訪問位置的順序?;谔崛〉腃TP,每一個子序列的相似 度可W被計(jì)算為:
[0097]
么私口)
[009引其中,m表示用戶Ui和U2中最長CTP的長度,am=2m-i。
[0099]因此,兩個用戶Ui和U2的相似度可W計(jì)算為:
[0iml 公 <(別
[0101] 其中,化和化分別代表用戶Ul和U2訪問位置的個數(shù)。
[0102] 最終,通過對2)的值按從大到小排序,本發(fā)明可W為目標(biāo)用戶挑選出前k個 相似用戶。
[0103] 實(shí)施例二
[0104] 如圖5所示,本發(fā)明實(shí)施例提供了一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)系統(tǒng),包 括停留點(diǎn)檢測模塊100、停留點(diǎn)語義描述模塊200、位置檢測模塊300、位置語義描述模塊 400、共同軌跡模式提取模塊500W及相似用戶發(fā)現(xiàn)模塊600,具體如下:
[0105] 停留點(diǎn)檢測模塊100,用于檢測原始GPS軌跡數(shù)據(jù)中,所存在的具有一定駐留行為 的點(diǎn);
[0106] 停留點(diǎn)語義描述模塊200,用于對檢測到的停留點(diǎn)進(jìn)行語義信息的描述;
[0107] 位置檢測模塊300,用于檢測停留點(diǎn)數(shù)據(jù)中,所存在的反映用戶移動行為的點(diǎn);
[0108] 位置語義描述模塊400,用于對檢測到的位置進(jìn)行語義信息的描述;
[0109] 共同軌跡模式提取模塊500,用于從語義軌跡中提取出用戶之間共同的軌跡模式;
[0110] 相似用戶發(fā)現(xiàn)模塊600,用于計(jì)算用戶之間的相似度,并為目標(biāo)用戶挑選前k個相 似用戶。
[0111] 需要說明的是:上述實(shí)施例提供的基于移動軌跡模式的潛在好友發(fā)現(xiàn)系統(tǒng)在挑選 相似用戶時,僅W上述各功能模塊的劃分進(jìn)行舉例說明,實(shí)際應(yīng)用中,可W根據(jù)需要而將上 述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,W完成 W上描述的全部或者部分功能。另外,上述實(shí)施例提供的數(shù)據(jù)傳輸裝置與數(shù)據(jù)傳輸方法實(shí) 施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過程詳見方法實(shí)施例,運(yùn)里不再寶述。
[0112] 上述本發(fā)明實(shí)施例序號僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
[0113] 綜上所述,在本發(fā)明實(shí)施例中,建立語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停 留點(diǎn)的語義信息,并對每一類服務(wù)進(jìn)行加權(quán),根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位 置,并描述每一個位置的語義信息,生成連續(xù)的種類軌跡序列,根據(jù)生成的種類軌跡序列, 提取用戶之間共同的種類軌跡子序列CTP,計(jì)算用戶之間的相似度,為目標(biāo)用戶挑選前k個 相似用戶。本發(fā)明實(shí)施例提供的方案可W為用戶發(fā)現(xiàn)與其生活模式相同的潛在好友,增加 候選服務(wù)的個數(shù),有效解決數(shù)據(jù)稀疏性問題,同時提高用戶的服務(wù)體驗(yàn)質(zhì)量,為未來基于位 置的社交網(wǎng)絡(luò)中用戶個性化服務(wù)推薦提供有益的解決思路。
[0114] 本領(lǐng)域普通技術(shù)人員可W理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可W通過硬件 來完成,也可W通過程序來指令相關(guān)的硬件完成,所述的程序可W存儲于一種計(jì)算機(jī)可讀 存儲介質(zhì)中,上述提到的存儲介質(zhì)可W是只讀存儲器,磁盤或光盤等。
[0115] W上所述僅為本發(fā)明的較佳實(shí)施例,并不用W限制本發(fā)明,凡在本發(fā)明的精神和 原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于移動軌跡模式的潛在好友發(fā)現(xiàn)方法,其特征在于,所述方法包括: 建立語義描述模型,根據(jù)POI數(shù)據(jù)集描述每一個停留點(diǎn)的語義信息,并對每一類服務(wù)進(jìn) 行加權(quán); 根據(jù)停留點(diǎn)的分布情況,將停留點(diǎn)聚類為位置,并描述每一個位置的語義信息,生成連 續(xù)的種類軌跡序列; 根據(jù)生成的種類軌跡序列,提取用戶之間共同的種類軌跡模式CTP; 計(jì)算用戶之間的相似度,將用戶按相似度進(jìn)行排序,為目標(biāo)用戶挑選前k個相似用戶。2. 如權(quán)利要求1所述的方法,其特征在于,所述語義描述模型包括: 用S表示停留點(diǎn)的集合,計(jì)算一個停留點(diǎn)Si的坐標(biāo),得到由停留點(diǎn)組成的軌跡; 計(jì)算停留點(diǎn)的種類權(quán)重,得到停留點(diǎn)關(guān)于種類的特征向量。3. 如權(quán)利要求2所述的方法,其特征在于,所述方法還包括: 初始化停留點(diǎn)集合,計(jì)算移動軌跡的長度; 判斷任意兩點(diǎn)間的距離是否小于閥值,并且時間是否大于閥值,如果否,則刪除; 計(jì)算中心節(jié)點(diǎn)的坐標(biāo); 將該中心節(jié)點(diǎn)添加至停留點(diǎn)集合中。4. 如權(quán)利要求1所述的方法,其特征在于,所述種類軌跡描述方法包括: 將停留點(diǎn)聚類為位置,得到位置軌跡序列; 利用停留點(diǎn)中每一類型的非零權(quán)重值的個數(shù),計(jì)算位置所對應(yīng)的POI種類的權(quán)重,得到 位置關(guān)于種類的特征向量; 聚類位置的特征向量,使每一個位置被劃分為不同的種類,得到種類軌跡序列。5. 如權(quán)利要求4所述的方法,其特征在于,所述方法還包括: 初始化位置集合,計(jì)算停留點(diǎn)集合中的元素個數(shù); 創(chuàng)建一個位置,將停留點(diǎn)加入到該位置中,并計(jì)算位置坐標(biāo); 判斷停留點(diǎn)到位置的距離是否大于閥值,如果是,則創(chuàng)建下一個位置,將停留點(diǎn)加入到 該位置中,計(jì)算位置坐標(biāo),如果否,則將停留點(diǎn)加入到該位置,更新位置坐標(biāo); 將該位置添加至位置集合中。6. 如權(quán)利要求1所述的方法,其特征在于,所述共同軌跡模式提取方法包括: 初始化軌跡模式集合,定義子序列的長度; 檢索兩個用戶語義軌跡中的各個節(jié)點(diǎn); 判斷兩個語義點(diǎn)是否相同,如果否,則刪除,繼續(xù)檢索,如果是,進(jìn)行下一步; 標(biāo)記該點(diǎn)的位置,從該點(diǎn)開始查找是否有規(guī)定長度閥值的子序列,如果否,則刪除,繼 續(xù)檢索,如果是,則將該子序列加入至軌跡模式集合中。7. 如權(quán)利要求1所述的方法,其特征在于,所述相似用戶發(fā)現(xiàn)方法包括: 通過提取出的共同軌跡模式,從類型流行度和活動序列兩個方面計(jì)算用戶之間的相似 度; 將用戶按相似度按從大到小排序,從而為目標(biāo)用戶挑選出前k個相似用戶。8. -種基于移動軌跡模式的潛在好友發(fā)現(xiàn)系統(tǒng),其特征在于,所述系統(tǒng)包括停留點(diǎn)檢 測模塊、停留點(diǎn)語義描述模塊、位置檢測模塊、位置語義描述模塊、共同軌跡模式提取模塊 以及相似用戶發(fā)現(xiàn)模塊,其中, 所述停留點(diǎn)檢測模塊,用于檢測原始GPS軌跡數(shù)據(jù)中,所存在的具有一定駐留行為的 占 . 所述停留點(diǎn)語義描述模塊,用于對檢測到的停留點(diǎn)進(jìn)行語義信息的描述; 所述位置檢測模塊,用于檢測停留點(diǎn)數(shù)據(jù)中,所存在的反映用戶移動行為的點(diǎn); 所述位置語義描述模塊,用于對檢測到的位置進(jìn)行語義信息的描述; 所述共同軌跡模式提取模塊,用于從語義軌跡中提取出用戶之間共同的軌跡模式; 所述相似用戶發(fā)現(xiàn)模塊,用于計(jì)算用戶之間的相似度,并為目標(biāo)用戶挑選前k個相似用 戶。
【文檔編號】G06F17/30GK106022934SQ201610293497
【公開日】2016年10月12日
【申請日】2016年5月5日
【發(fā)明人】許長橋, 關(guān)建峰, 朱亮
【申請人】北京郵電大學(xué)