用于基于移動裝置數(shù)據(jù)產(chǎn)生簡檔的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明總地涉及對移動裝置數(shù)據(jù)執(zhí)行分析,并且更特別地,涉及對移動裝置數(shù)據(jù)進行分析以確定移動用戶特性。
【背景技術(shù)】
[0002]隨著使用蜂窩電話和其他移動裝置的個人群體增長,基于位置的服務(wù)變得越來越重要?;谖恢玫姆?wù)是用于將對于位置和時間數(shù)據(jù)的特定控制作為控制特征包括在計算機程序中的一般類的計算機程序級別的服務(wù)。就這點兒論,基于位置的服務(wù)是信息服務(wù),并且在包括社交網(wǎng)絡(luò)、城市規(guī)劃、災(zāi)難恢復、娛樂、便利設(shè)施和公共事業(yè)設(shè)備的領(lǐng)域中具有若干用途,并且使用通過移動網(wǎng)絡(luò)從移動裝置收集的數(shù)據(jù)以及關(guān)于移動裝置的地理位置的信息以用于各種目的。許多基于位置的服務(wù)目前僅提供移動裝置使用者(即,移動用戶)的位置。這些通常用于基于用戶的特定位置向用戶提供信息(例如,基于位置的服務(wù)可以提供附近餐館的列表,等等)?;谖恢玫姆?wù)對于例如營銷公司發(fā)送廣告計劃以及預測未來的業(yè)務(wù)流可以是有價值的。目前的基于位置的服務(wù)的限制包括例如它們不能調(diào)整來適應(yīng)大量移動裝置數(shù)據(jù)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的實施例提供了用于基于移動裝置數(shù)據(jù)產(chǎn)生簡檔(profile)的程序產(chǎn)品、系統(tǒng)和方法。計算裝置接收區(qū)域中的多個移動裝置的多個移動裝置記錄,每個移動裝置記錄包括時間戳、位置數(shù)據(jù)和活動數(shù)據(jù),并且將所述多個移動裝置記錄中的每一個分配給多個空間-時間盒子(space-time box)之一。計算裝置對分配給所述多個空間-時間盒子的移動裝置記錄執(zhí)行分析以得到作為結(jié)果的多個簡檔,所述多個簡檔可以包括移動性簡檔、聚集地簡檔以及好友簡檔,移動性簡檔指示在跨度期間每個移動裝置在所述區(qū)域中占據(jù)的位置的數(shù)量,聚集地簡檔指示在跨度期間占據(jù)所述區(qū)域中每個位置的移動裝置的數(shù)量,好友簡檔指示在所述區(qū)域中占據(jù)與給定的移動裝置相同的位置的移動裝置。
【附圖說明】
[0004]圖1是根據(jù)本發(fā)明的實施例的通信環(huán)境的功能框圖。
[0005]圖2示出根據(jù)本發(fā)明的實施例的流程圖,該流程圖描繪了在基于存儲在圖1的關(guān)系數(shù)據(jù)倉庫系統(tǒng)中的移動裝置數(shù)據(jù)產(chǎn)生移動性簡檔和聚集地簡檔期間所采用的步驟。
[0006]圖3示出根據(jù)本發(fā)明的實施例的流程圖,該流程圖描繪了在基于存儲在圖1的關(guān)系數(shù)據(jù)倉庫系統(tǒng)中的移動裝置數(shù)據(jù)產(chǎn)生好友簡檔期間所采用的步驟。
[0007]圖4A和4B示出根據(jù)本發(fā)明的實施例的流程圖,這些流程圖描繪了在將啟發(fā)規(guī)則(heuristic rule)和聚類(cluster)算法應(yīng)用于在執(zhí)行圖2和圖3的流程圖期間所產(chǎn)生的中間結(jié)果和最終結(jié)果中的若干個期間所采用的步驟。
[0008]圖5示出根據(jù)本發(fā)明的實施例的用于移動裝置數(shù)據(jù)的收集、分析和使用的交互的序列。
[0009]圖6是根據(jù)本發(fā)明的實施例的計算機系統(tǒng)的功能框圖。
【具體實施方式】
[0010]本文中所介紹的技術(shù)提出了調(diào)用適當?shù)姆治龉ぞ邅韴?zhí)行隨著移動裝置使用者(即,移動用戶)從一個地方移動到另一個地方由移動通信提供商提供的位置數(shù)據(jù)的延遲的或者甚至實時的分析。盡管在本文中將使用術(shù)語“用戶”,但是應(yīng)當理解,移動裝置的所有者或使用者與提供與移動裝置的蜂窩或其他連接的移動通信提供商之間的合同或服務(wù)關(guān)系總地來說可能與本文中所介紹的技術(shù)無關(guān);就這點兒論,本發(fā)明的實施例可以涉及向通信提供商訂購的移動裝置所有者、預付費的或合同到期的移動裝置所有者、或者其他移動裝置用戶的任何組合。
[0011]巨大不同的用戶基礎(chǔ)和大規(guī)模數(shù)據(jù)量需要本文中所介紹的專用技術(shù)來進行分析。通過使用高級分析和強大的計算系統(tǒng)來執(zhí)行“社會-移動”分析可以了解所有的移動裝置數(shù)據(jù)的意義。根據(jù)本文中所介紹的技術(shù),對原始位置數(shù)據(jù)進行提煉以查明用戶行為和生活方式簡檔,使得能夠?qū)崿F(xiàn)若干使用情況,諸如個性化營銷、網(wǎng)絡(luò)分析、流量模式理解以及其他使用情況。使用所觀察的位置數(shù)據(jù)可以發(fā)現(xiàn)令人有興趣的關(guān)于用戶的見解,該見解在許多領(lǐng)域中是有用的,諸如,但不限于,基于位置的營銷。
[0012]本文中所介紹的技術(shù)涉及使用可以用于理解什么類型的人何時去哪、什么類型的位置受誰歡迎、以及誰何時與誰去哪的處理和技術(shù)來創(chuàng)建個人用戶級別的移動性簡檔(被定義為例如空間和時間上的移動模式、等等)。這些模式可以用于預測個人群體的移動性以及本文中所討論的其他目的。
[0013]可以使用本文中所介紹的技術(shù)實現(xiàn)的一些事情包括例如,觸發(fā)實時的個性化的營銷;總結(jié)位置和用戶簡檔的匿名分析(例如,使用數(shù)據(jù)隱私法的裁決的應(yīng)用、等等);基于個人或群體過去的歷史來主動地將這些個人或群體作為目標;通過按照位置、一天中的某一時間以及用戶簡檔理解使用情況來改進網(wǎng)絡(luò)利用率;以及在數(shù)據(jù)提供者與零售商之間合作營銷。
[0014]本文中所介紹的技術(shù)可以涉及至少兩個單獨(individual)簡檔的產(chǎn)生或利用,該簡檔包括生活方式簡檔(例如,營銷分析員對于特定的使用情況或者營銷程序定義的簡檔、等等)以及移動性簡檔(例如,使用定義用戶在一天、一周或其他時間段期間如何移動的數(shù)據(jù)挖掘算法而創(chuàng)建的簡檔、等等)。這樣的單獨簡檔可以關(guān)于數(shù)據(jù)提供者可能想要如何向用戶營銷或者以其他方式吸引用戶來唯一地定義用戶。
[0015]根據(jù)本文中所介紹的技術(shù),可以通過例如營銷分析或其他數(shù)據(jù)提供者來將生活方式簡檔創(chuàng)建為移動用戶的類型的“經(jīng)驗法則”分類。一般來講,生活方式簡檔可被提供給本文中所描述的系統(tǒng)(例如,以啟發(fā)規(guī)則的形式、等等)來產(chǎn)生見解。例如,生活方式簡檔可以力圖識別在12月參加足球比賽的人、或者在夏季周末的早晨在兒童足球場的人、或者早晨去工作并且每周有三天或更多天在咖啡店逗留的人。生活方式簡檔可以用于理解每個移動用戶的移動性特性。本文中所使用的幾個生活方式簡檔昵稱是“Homebody”(即,不到訪很多獨特(unique)位置的移動用戶)、“Daily Grinder” (即,往返工作、周末安靜以及沿途停留的移動用戶)、“N0rm Peterson”( S卩,不以顯著的方式(例如,偏離量大于一個標準偏差的一半、等等)偏離大量其他移動用戶的行為的規(guī)范的移動用戶)、“Delivering theGoods"(即,一天到訪許多不同的場所、模式不可預測的移動用戶)、“Globe Trotter"(即,不在城里或者保持他或她的電話關(guān)機的移動用戶)、“Rover Wanderer"(即,在各種地方與朋友度過晚上的移動用戶)、以及“Other” (即,難以歸類的移動用戶)。
[0016]根據(jù)本文中所介紹的技術(shù),在產(chǎn)生生活方式簡檔并且在將它(例如,以啟發(fā)規(guī)則的形式、等等)應(yīng)用于處理移動裝置數(shù)據(jù)的中間或最終結(jié)果以識別屬于該生活方式簡檔的類型或類別的移動用戶之后,所識別的移動用戶可被作為來自數(shù)據(jù)提供者的廣告或其他通信的目標,以便影響他們的行為或者為了其他目的。例如,如果進入咖啡店的DailyGrinder被識別,則他或她可能是從常去的咖啡店轉(zhuǎn)去支持新的咖啡店的目標。這樣的目標確定(targeting)可以涉及使用地理圍欄,以便當Daily Grinder在該新的咖啡店附近時實時地將廣告遞送給他或她,或者可以涉及使用預測分析,以當Daily Grinder靠近新的咖啡店時或者甚至在這之前預測性地以他或她為目標,這是因為移動裝置數(shù)據(jù)(例如,移動性簡檔、聚集地簡檔或好友簡檔等)的分析預測他或她將來將靠近。
[0017]本文中所介紹的技術(shù)可以產(chǎn)生并且利用移動性度量,所述移動性度量來源于基于在特定時間范圍內(nèi)到訪的獨特位置的數(shù)量推導移動性的值的一系列計算。以下所討論的與這些值的推導相關(guān)聯(lián)的算法基于多次遍歷移動裝置數(shù)據(jù)以聚合值、然后在數(shù)據(jù)上對該值進行規(guī)范化以使得能夠進行相對比較。位置也可以被定義為例如蜂窩塔、來自GPS或車載跟蹤裝置的坐標、經(jīng)瑋度、或者使用支付卡的零售店位置。如以下所討論的,每個個人可以具有通過對所有的個人在空間-時間盒子內(nèi)的移動性記錄進行分析而計算的得分。對時間范圍(例如,星期三的11:30am-1:30pm、等等)中的每個獨特位置進行計數(shù),并且存儲所到訪的獨特位置的總數(shù)。然后,在所有的個人上,將所有的獨特位置計數(shù)規(guī)范化為零。默認地,每一個人在每一個時間范圍內(nèi)具有至少一個位置,因為每一個人始終在某處。然而,根據(jù)本文中所介紹的技術(shù),當不可得到關(guān)于一個或多個移動用戶的數(shù)據(jù)(諸如他們的位置未知)時,則可以在其他數(shù)據(jù)可得到的情況下通過插值來補償空間-時間盒子的“數(shù)據(jù)缺失”,或者在丟失大量數(shù)據(jù)的情況下通過將作為結(jié)果的移動性聚類和簡檔表示為由于缺少數(shù)據(jù)而被未定義來補償空間-時間盒子的“數(shù)據(jù)缺失”。如以下所討論的,可以使用啟發(fā)法或數(shù)據(jù)挖掘算法來對移動性簡檔進行分組以生成移動性聚類,所述移動性聚類可以采取“DailyCommuter”、“Weekend Warr1r” 和其他類別的形式。
[0018]本文中所介紹的技術(shù)可以通過使用移動性聚類或移動性簡檔確定“聚集地(hangout) ”或受歡迎位置來產(chǎn)生并且利用聚集地簡檔。通過遍歷移動裝置數(shù)據(jù)并且利用空間-時間盒子的基于存在的指示符來識別個人在某個位置花費多少時間,可以確定每個位置對于每個移動用戶的受歡迎程度。通過確定移動性,諸如白天的、夜間的以及工作日的或周末的活動,可以確定位置,諸如“家”、“工作”、“朋友”和“親屬”。此外,如以下所討論的,通過鏈接類似的移動性簡檔,可以找到“熱點”(例如,給定位置受在周五和周六晚上在市區(qū)非?;钴S的人的歡迎、等等)。聚集地簡檔可以類似于移動性簡檔,但是是關(guān)于位置的簡檔。對于給定時間范圍中的每個位置,對獨特訪客的數(shù)量進行計數(shù)。對這些計數(shù)器進行總計和排序(rank),給出在給定時間最有可能在某一位置的人的列表。然后可以使用數(shù)據(jù)挖掘算法按照移動性簡檔對該數(shù)據(jù)進行聚類以確定在給定時間有可能在某一位置的人們的簡檔的類型(例如,辦公室職員在午餐時間喜歡去特定餐館,等等)。聚集地簡檔還可以識別哪里是在給定時間最受歡迎的地方、什么是這些地方的最普遍的移動性以及生活方式簡檔、這些是否不同于整體人群、以及人們在給定的聚集地位置之前來自什么位置、或者在給定的聚集地位置之后要去什么位置。
[0019]本文中所介紹的技術(shù)可以通過識別在一組位置和時間范圍或空間-時間盒子內(nèi)誰何時在其它人周圍,來產(chǎn)生并且利用好友模型。好友模型實際上可以檢查數(shù)據(jù)集中的所有其他的移動用戶到訪的所有位置和時間范圍,以識別空間-時間盒子中的所有交集。輸出可以包括關(guān)于每一個空間-時間盒子的、任何其他的移動用戶在該空間-時間盒子中的次數(shù)的排序列表。對于每一個空間-時間盒子,可以對在同一個空間-時間盒子中的其他個人或裝置進行計數(shù),并且可以對計數(shù)器進行總計和排序。結(jié)果是最經(jīng)常在給定用戶周圍的好友或用戶的列表。該數(shù)據(jù)可以用于基于給定用戶的好友在同一位置的存在來預測給定用戶將位于哪里。在該技術(shù)涉及將所有數(shù)據(jù)點