感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法
【專利摘要】本發(fā)明涉及感應(yīng)網(wǎng)絡(luò)環(huán)境下的移動定位數(shù)據(jù)分析【技術(shù)領(lǐng)域】,是一種面向移動設(shè)備采集定位數(shù)據(jù),并結(jié)合其它附加信息對定位數(shù)據(jù)進行聚合分析和知識發(fā)現(xiàn)的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析系統(tǒng)和方法。包括:接收一個或多個可定位設(shè)備發(fā)送的定位數(shù)據(jù)點;將定位數(shù)據(jù)點與人口結(jié)構(gòu)特征數(shù)據(jù)和用戶歷史軌跡數(shù)據(jù)進行數(shù)據(jù)關(guān)聯(lián);對關(guān)聯(lián)后的定位數(shù)據(jù)點進行聚合分析,將具有相似特征的用戶聚合為群組,得到群組結(jié)構(gòu)特征數(shù)據(jù);導(dǎo)出聚合結(jié)果。該方法能根據(jù)定位數(shù)據(jù)以及其它信息將具有相似特征的移動用戶聚合成群組,并將群組信息以友好的方式展示到用戶終端或公共顯示設(shè)備上。
【專利說明】感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及感應(yīng)網(wǎng)絡(luò)環(huán)境下的移動定位數(shù)據(jù)分析【技術(shù)領(lǐng)域】,是ー種面向移動設(shè)備采集定位數(shù)據(jù),并結(jié)合其它附加信息對定位數(shù)據(jù)進行聚合分析和知識發(fā)現(xiàn)的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析系統(tǒng)和方法。
【背景技術(shù)】
[0002]目前,隨著定位設(shè)備、定位技術(shù)的發(fā)展,各種定位服務(wù)也逐漸豐富起來。于此同吋,也產(chǎn)生了大量的由移動設(shè)備(移動電話、汽車GPS導(dǎo)航儀等)產(chǎn)生的歷史或?qū)崟r數(shù)據(jù),這些數(shù)據(jù)一般都包含設(shè)備唯一標(biāo)識符、時間、經(jīng)緯度、速度、方向、以及其它ー些元數(shù)據(jù)信息。這些數(shù)據(jù)如實記錄了人們?nèi)粘;顒拥囊苿榆壽E,蘊含著豐富的知識。使用適當(dāng)?shù)姆治龇椒◤倪@些海量冗繁的原始數(shù)據(jù)中挖掘出有意義的知識,并以便捷、友好的方式呈現(xiàn)這些知識,有助于人們更好地了解個體、群體的移動規(guī)律、行為模式,進而幫助人們更好地管理自身的行為。
[0003]近來基于移動數(shù)據(jù)的研究已有不少,如基于車輛軌跡數(shù)據(jù)的車流量預(yù)測、實時交通事件探測、車流潮汐現(xiàn)象、區(qū)域間車流移動模式等等;基于個人移動數(shù)據(jù)的城市熱點探測、人群密度分布等等。但是以往的這些研究都很少有使用到人ロ結(jié)構(gòu)特征數(shù)據(jù)。這些人ロ結(jié)構(gòu)特征數(shù)據(jù)可以包括:地理位置、事件、年齡、性別、種族、宗教、血統(tǒng)、戶藉、參與的組織、教育程度、收入水平、職業(yè)、行業(yè)、政治傾向、嗜好、興趣、參與的活動、消費偏好、消費習(xí)慣、與某個群組的關(guān)聯(lián)關(guān)系等等。通過將這些人口結(jié)構(gòu)特征數(shù)據(jù)與定位數(shù)據(jù)進行關(guān)聯(lián)分析,就可以做出ー些有意義的推斷。比如,一名攜帯有移動電話的用戶在正常工作時段經(jīng)常出現(xiàn)于大學(xué)校園內(nèi),那么此用戶可能學(xué)生或?qū)W校教工人員;而如果此用戶又經(jīng)常在夜晚出現(xiàn)于校外某住宅區(qū),那么此用戶可能是本地學(xué)生或教工人員;而若此用戶又經(jīng)常于早上或傍晚出現(xiàn)某幼兒園或小學(xué),那此用戶很可能是教工人員。在有其它更多背景信息的情況下,可以對擁有某些共同特征的人群進行聚合分析,聚合而成的群組可以是ー些在特定時間特定地點出現(xiàn)的群體,也可以是在特定時間段兒內(nèi)頻繁出現(xiàn)于某地的群體。比如(并不僅限于此),ー個群組可以包括所有在周六下午逛某ー商場的客戶,或者包括在某一商場促銷期間逛此商場的所有客戶。
[0004]因此,通過對移動設(shè)備用戶的軌跡數(shù)據(jù)和人口結(jié)構(gòu)特征數(shù)據(jù)進行關(guān)聯(lián)分析、聚合分析,可以獲知移動網(wǎng)絡(luò)環(huán)境下個體與群體的存在形態(tài)與移動行為規(guī)律。
【發(fā)明內(nèi)容】
[0005]針對現(xiàn)有技術(shù)中的上述問題,本發(fā)明提供一種感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法。
[0006]本發(fā)明為實現(xiàn)上述目的所采用的技術(shù)方案是:感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,包括以下步驟:
[0007]接收ー個或多個可定位設(shè)備發(fā)送的定位數(shù)據(jù)點;[0008]將定位數(shù)據(jù)點與人口結(jié)構(gòu)特征數(shù)據(jù)和用戶歷史軌跡數(shù)據(jù)進行數(shù)據(jù)關(guān)聯(lián);
[0009]對關(guān)聯(lián)后的定位數(shù)據(jù)點進行聚合分析,將具有相似特征的用戶聚合為群組,得到群組結(jié)構(gòu)特征數(shù)據(jù);
[0010]導(dǎo)出聚合結(jié)果。
[0011]所述可定位設(shè)備為能夠標(biāo)識失控位置點,并具有唯一標(biāo)識符的設(shè)備。
[0012]所述人口結(jié)構(gòu)特征數(shù)據(jù)包括地理位置、事件、年齡、性別、種族、宗教、血統(tǒng)、戶籍、參與的組織、教育程度、收入水平、職業(yè)、行業(yè)、政治傾向、嗜好、興趣、參與的活動、消費偏好、消費習(xí)慣和與某個群組的關(guān)聯(lián)關(guān)系中的ー種或幾種。
[0013]所述群組結(jié)構(gòu)特征數(shù)據(jù)包括群組的位置、密度、分布和興趣。
[0014]所述數(shù)據(jù)關(guān)聯(lián)具體為:對定位數(shù)據(jù)點中的噪聲數(shù)據(jù)、冗余數(shù)據(jù)、錯誤數(shù)據(jù)及不完整數(shù)據(jù)進行濾除清洗,將處理后的定位數(shù)據(jù)與地理信息、城市區(qū)劃、時間區(qū)間信息相關(guān)聯(lián),即依據(jù)定位數(shù)據(jù)的采集時間特征、背景地理空間區(qū)域位置特征進行解析。
[0015]所述濾除清洗后的數(shù)據(jù)以用戶個人檔案的形式存入到歷史軌跡數(shù)據(jù)庫中。
[0016]所述聚合分析具體為:使用序列模式挖掘方法對個人軌跡進行聚合分類以得到初步的群組信息;結(jié)合用戶背景信息使用頻繁模式挖掘方法對初步的群組信息進行分析處理,得到群組。
[0017]本發(fā)明具有以下優(yōu)點:
[0018]本發(fā)明能根據(jù)定位數(shù)據(jù)以及其它信息將具有相似特征的移動用戶聚合成群組,并將群組信息以友好的方式展示到用戶終端或公共顯示設(shè)備上。而這些聚合結(jié)果能讓用戶更好地了解自身以及與自己相關(guān)聯(lián)的群組的行為規(guī)律,幫助用戶更好地發(fā)掘ー些與自身或群組有關(guān)的有價值的信息;而且,也能幫助市政、交通、醫(yī)療等社會管理和服務(wù)部門更好地理解群體行為,為各部門的決策管理提供有效的可用信息。
[0019]在使用本方法對移動設(shè)備用戶的軌跡數(shù)據(jù)進行關(guān)聯(lián)分析、聚合分析后,可以將具有相似行為特征的用戶聚合成群組,并以直觀的形式將群組位置、群組成員密度、以及其它群組屬性顯示到用戶終端。這樣就能在此基礎(chǔ)上做更進一歩的分析,比如分析個體和群體的存在形態(tài)與移動行為規(guī)律、個體與群體的復(fù)雜耦合移動特性、不同群體之間的相互融合、轉(zhuǎn)化規(guī)律等等。這些分析結(jié)果在公共服務(wù)、商業(yè)模式、健康醫(yī)療、疾病控制等領(lǐng)域的行為預(yù)測和風(fēng)險評估等應(yīng)用方面都有很積極的現(xiàn)實意義。
【專利附圖】
【附圖說明】
[0020]圖1是本發(fā)明應(yīng)用的系統(tǒng)結(jié)構(gòu)圖;
[0021]圖2是本發(fā)明的數(shù)據(jù)處理流程圖;
[0022]圖3是不同群組在地圖上的顯示圖;
[0023]圖4是用戶與群組之間關(guān)系的顯示以及針對用戶的推薦信息的顯示圖;
[0024]圖5是用戶信息管理界面;
[0025]圖6是廣告信息的顯示。
【具體實施方式】
[0026]下面結(jié)合附圖及實施例對本發(fā)明做進ー步的詳細說明。[0027]本發(fā)明主要由定位數(shù)據(jù)接收器、系統(tǒng)服務(wù)器、數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)關(guān)聯(lián)、聚合分析、通信網(wǎng)絡(luò)、用戶終端等幾部分組成,其系統(tǒng)結(jié)構(gòu)如圖1所示。其中:
[0028]1.定位數(shù)據(jù)接收器:用以接收可定位設(shè)備通過蜂窩通信網(wǎng)絡(luò)、WIF1、通信衛(wèi)星、互聯(lián)網(wǎng)等發(fā)回的定位數(shù)據(jù),而后將定位數(shù)據(jù)轉(zhuǎn)發(fā)到系統(tǒng)服務(wù)器以供處理。可定位設(shè)備可以包括蜂窩電話、GPS設(shè)備、WIFI設(shè)備、RFID設(shè)備、或者其它任何能標(biāo)識時空位置點的設(shè)備。同時,可定位設(shè)備都應(yīng)具有“唯一標(biāo)識符”,所謂的“唯一標(biāo)識符”是ー些能夠在特定時間、特定地點或特定事件中唯一標(biāo)識ー個特定的人、設(shè)備或?qū)ο蟮男畔?。而由定位設(shè)備產(chǎn)生的定位數(shù)據(jù)則包括時間、經(jīng)緯度、速度、方向、以及其它ー些元數(shù)據(jù)信息。
[0029]2.數(shù)據(jù)關(guān)聯(lián):用以將定位數(shù)據(jù)點與人口結(jié)構(gòu)特征信息相關(guān)聯(lián),并將定位數(shù)據(jù)點與用戶歷史軌跡記錄相關(guān)聯(lián),從而得到與用戶個體所關(guān)聯(lián)用戶背景資料。所謂的人口結(jié)構(gòu)特征信息可以包括:地理位置、事件、年齡、性別、種族、宗教、血統(tǒng)、戶籍、參與的組織、教育程度、收入水平、職業(yè)、行業(yè)、政治傾向、嗜好、興趣、參與的活動、消費偏好、消費習(xí)慣、與某個群組的關(guān)聯(lián)關(guān)系等等。
[0030]3.聚合分析:在基于數(shù)據(jù)關(guān)聯(lián)所得到的關(guān)聯(lián)關(guān)系的基礎(chǔ)上對定位數(shù)據(jù)進行聚合分析,從而將具有相似特征的用戶聚合為群組,并獲得群組的位置、密度、分布、興趣等特征信息。
[0031]數(shù)據(jù)關(guān)聯(lián)和聚合分析的工作是ー個復(fù)雜的過程,關(guān)聯(lián)引擎先將原始實時定位數(shù)據(jù)與個人歷史軌跡相關(guān)聯(lián),即將個人軌跡資料整理歸檔,然后將定位數(shù)據(jù)與時間區(qū)間、地理信息、市政區(qū)劃等用于初級分類的信息相關(guān)聯(lián)。在完成關(guān)聯(lián)步驟后,聚合分析便使用序列模式挖掘方法對個人軌跡進行聚合分類以得到初歩的群組信息,然后聚合分析再結(jié)合更多的用戶背景信息使用頻繁模式挖掘方法做進ー步的分析處理,從而得到相似度更高的群組分類。在得到詳細群組信息之后,更可以做更深層次的分析,并相應(yīng)用戶請求向用戶推送分析所得的信息。其工作原理如下:
[0032]首先,在系統(tǒng)服務(wù)器接收到用戶的實時定位數(shù)據(jù)后,先對數(shù)據(jù)進行過濾、清洗等預(yù)處理,然后將定位數(shù)據(jù)以用戶個人檔案的形式存入到歷史軌跡數(shù)據(jù)庫。同時,數(shù)據(jù)關(guān)聯(lián)將定位數(shù)據(jù)與地理信息、城市區(qū)劃、時間區(qū)間等信息相關(guān)聯(lián),以便接下來在聚合分析的過程中所用。tヒ如,將定位點P (個人ID、經(jīng)度、維度、時間戳)與這些信息關(guān)聯(lián)后可以為P’(個人ID、時間戳、工作日、早上、市區(qū)A、商業(yè)區(qū)B)。
[0033]當(dāng)有了一定量的歷史數(shù)據(jù)后,聚合分析引擎就可以進行聚合分析。聚合分析要先對定位數(shù)據(jù)根據(jù)具體需求重采樣,以減少分析過程的復(fù)雜度;然后將每個用戶的帶有關(guān)聯(lián)信息的定位數(shù)據(jù)根據(jù)地點類型、活動區(qū)域、活動時間等特征抽象為ー個個時間序列,并對這些序列數(shù)據(jù)進行序列模式挖掘,從而將特征相似的序列聚合到一起,也即將特征不同的序列分類到不同類別。這也就是獲得的初始群組信息。
[0034]與個人用戶相關(guān)的還有更為豐富的其它屬性信息,比如年齡、性別、職業(yè)、文化程度、收入水平等等,于是便可以根據(jù)這些信息使用頻繁模式挖掘方法對初始群組繼續(xù)分析,以發(fā)現(xiàn)成員特征更為相似、內(nèi)部聯(lián)系更為緊密的群組。更進一歩地,可以分析出關(guān)于群組的更多的衍生信息,比如分析給某一群組成員數(shù)量、成員類型、興趣愛好、消費習(xí)慣、行為規(guī)律等等。有了這些更深層次的信息,不但可以滿足個體用戶了解自身和群組的需求,也可以為管理、服務(wù)、商業(yè)等部門的決策提供支持和幫助。一個最簡單的例子就是本發(fā)明中可以根據(jù)群組的興趣愛好、消費習(xí)慣等特征向用戶提供精準廣告投放。
[0035]以上這些分析所得的中間結(jié)果或最終結(jié)果都會以適當(dāng)?shù)男问酱鎯Φ疥P(guān)聯(lián)信息數(shù)據(jù)庫或群組信息數(shù)據(jù)庫,以備以后做更多分析或用以響應(yīng)用戶的查詢請求而顯示到用戶終端。比如用戶移動終端能顯示用戶實時位置,能顯示用戶的歷史軌跡信息,也能顯示與用戶相關(guān)的群組的歷史信息或?qū)崟r信息。
[0036]4.序列模式挖掘方法:
[0037]對于每人每天的定位點,間隔一定時間(比如半小時或ー小吋)進行采樣,并用字母(或數(shù)字)表示為序列數(shù)據(jù)格式:AABBBDDDDDDDEEEEEGGGGGG。對于得到的活動序列數(shù)據(jù),首先對其進行序列比對,并依據(jù)序列的相似度,可以得到序列的大致分類,各個分類即為成員具有相似行為特征的群組。對于用序列比對算法挖掘出的行為群組,可以繼續(xù)使用頻繁模式挖掘方法,挖掘各組行為模式的用戶背景屬性關(guān)聯(lián)模式,從而得到用戶屬性與其行為模式的內(nèi)在關(guān)聯(lián)。
[0038]城市區(qū)域可以根據(jù)已有的市政區(qū)化進行分類,比如東城區(qū)、西城去、高新區(qū)等等。然后再將這些區(qū)域按其功能類型劃分:商業(yè)區(qū)、住宅區(qū)、教學(xué)區(qū)、休閑娛樂區(qū)、エ業(yè)區(qū)、廣場區(qū)、倉儲貨運區(qū)、混合區(qū)等,在這個基礎(chǔ)上每個城區(qū)就可以劃分為商業(yè)區(qū)A、商業(yè)區(qū)B、教學(xué)區(qū)C、住宅區(qū)D等等。
[0039]有了這些具體的區(qū)域劃分,就可以將每人的位置以時間順序表示成地點序列。然后再使用PrefixSpan算法對序列進行模式挖掘,PrefixSpan算法的過程為:首先找出所有的頻繁1-模式,頻繁1-模式組成的集合記為以這些1-模式為前綴,在其對應(yīng)的投影數(shù)據(jù)庫中,找出頻繁的卜閉模式,再以這些1-閉模式為前綴,在投影數(shù)據(jù)庫中繼續(xù)以上過程,直到不再產(chǎn)生頻繁1-閉模式為止。具體如下:
[0040]輸入:f_list,輸出:所有的序列模式
[0041]I)For each a in f_list
[0042]2) PrefixSpan (a, S | a)
[0043]3)掃描S I a 一次,找出所有的1-閉模式,記為C,或者與a對接,形成形如<a,c>,或者追加到序列的末尾,如<a,c>,如果沒有產(chǎn)生1-閉模式,則返回到I)處。
[0044]4)將I)中增長的模式添加到模式庫中,記為a’。
[0045]5)執(zhí)行 PrefixSpan (a,, Sla,)。
[0046]其中,符號Sla表示子序列a的投影數(shù)據(jù)庫,即a的所有后綴所形成的子序列數(shù)據(jù)集。
[0047]最后的序列模式結(jié)果可能為表I中的形式:
[0048]表I序列模式結(jié)果
[0049]
【權(quán)利要求】
1.一種感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,包括以下步驟: 接收ー個或多個可定位設(shè)備發(fā)送的定位數(shù)據(jù)點; 將定位數(shù)據(jù)點與人口結(jié)構(gòu)特征數(shù)據(jù)和用戶歷史軌跡數(shù)據(jù)進行數(shù)據(jù)關(guān)聯(lián); 對關(guān)聯(lián)后的定位數(shù)據(jù)點進行聚合分析,將具有相似特征的用戶聚合為群組,得到群組結(jié)構(gòu)特征數(shù)據(jù); 導(dǎo)出聚合結(jié)果。
2.根據(jù)權(quán)利要求1所述的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,所述可定位設(shè)備為能夠標(biāo)識失控位置點,并具有唯一標(biāo)識符的設(shè)備。
3.根據(jù)權(quán)利要求1所述的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,所述人口結(jié)構(gòu)特征數(shù)據(jù)包括地理位置、事件、年齡、性別、種族、宗教、血統(tǒng)、戶籍、參與的組織、教育程度、收入水平、職業(yè)、行業(yè)、政治傾向、嗜好、興趣、參與的活動、消費偏好、消費習(xí)慣和與某個群組的關(guān)聯(lián)關(guān)系中的ー種或幾種。
4.根據(jù)權(quán)利要求1所述的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,所述群組結(jié)構(gòu)特征數(shù)據(jù)包括群組的位置、密度、分布和興趣。
5.根據(jù)權(quán)利要求1所述的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,所述數(shù)據(jù)關(guān)聯(lián)具體為:對定位數(shù)據(jù)點中的噪聲數(shù)據(jù)、冗余數(shù)據(jù)、錯誤數(shù)據(jù)及不完整數(shù)據(jù)進行濾除清洗,將處理后的定位數(shù)據(jù)與地理信息、城市區(qū)劃、時間區(qū)間信息相關(guān)聯(lián),即依據(jù)定位數(shù)據(jù)的采集時間特征、背景地理空間區(qū)域位置特征進行解析。
6.根據(jù)權(quán)利要求5所述的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,所述濾除清洗后的數(shù)據(jù)以用戶個人檔案的形式存入到歷史軌跡數(shù)據(jù)庫中。
7.根據(jù)權(quán)利要求1所述的感應(yīng)網(wǎng)絡(luò)環(huán)境下移動位置分析方法,其特征在于,所述聚合分析具體為:使用序列模式挖掘方法對個人軌跡進行聚合分類以得到初歩的群組信息;結(jié)合用戶背景信息使用頻繁模式挖掘方法對初步的群組信息進行分析處理,得到群組。
【文檔編號】G06F17/30GK103593349SQ201210289165
【公開日】2014年2月19日 申請日期:2012年8月14日 優(yōu)先權(quán)日:2012年8月14日
【發(fā)明者】庫濤, 朱云龍, 吳俊偉, 王亮, 呂賜興, 陳瀚寧, 張丁一 申請人:中國科學(xué)院沈陽自動化研究所