評(píng)估結(jié)果為,通過行為得分反映用戶的努力程度和效率。
[0053] 所述評(píng)價(jià)指標(biāo)選擇用戶移動(dòng)總距離Len、用戶停留次數(shù)Count、用戶有效停留數(shù) ECount,有效停留數(shù)為在停留地點(diǎn)用戶有業(yè)務(wù)數(shù)據(jù)操作的停留點(diǎn)數(shù)目。
[0054] 實(shí)施例2
[0055] -種基于地點(diǎn)挖掘的用戶行為評(píng)估方法應(yīng)用在物業(yè)公司管理保安人員,保安人員 每天需要在一些指定的地點(diǎn)檢查足夠的時(shí)間,并且每天需要巡防一定的次數(shù)。通過該行為 評(píng)估方法,可以通過最后得到的分?jǐn)?shù)來評(píng)估保安的工作情況。該方法包括以下步驟:
[0056] a、通過保安隨身攜帶的智能手機(jī)等移動(dòng)設(shè)備獲取位置信息得到軌跡數(shù)據(jù),并對(duì)軌 跡數(shù)據(jù)預(yù)處理;
[0057] b、通過軌跡數(shù)據(jù)獲取保安不同時(shí)間段在不同地點(diǎn)的時(shí)間分布,得到保安的行為模 式;
[0058] c、利用保安行為模式的歷史記錄更新用戶偏好模型,根據(jù)用戶偏好模型判斷是否 為異常行為,計(jì)算用戶行為得分。
[0059]所述步驟a中,移動(dòng)設(shè)備上報(bào)軌跡數(shù)據(jù)為L(zhǎng)= {li,12,…,In},其中l(wèi)i= (lati,longi, timed表示經(jīng)煒度和時(shí)間戳。首先去除軌跡數(shù)據(jù)中的重復(fù)點(diǎn),再通過Kalman濾波過濾速度 異常點(diǎn)平滑軌跡數(shù)據(jù),使軌跡數(shù)據(jù)更接近真實(shí)的行程軌跡。預(yù)處理后的軌跡數(shù)據(jù)如下表所 示:
[0060]
[0061]表1:用戶軌跡數(shù)據(jù)
[0062]所述步驟b中,采用基于時(shí)間序列的聚類算法,獲取保安不同時(shí)間段在不同地點(diǎn)的 時(shí)間分布,得到用戶的行為模式。
[0063]所述步驟b具體包括:
[0064] bl、選取地點(diǎn)最大范圍為100米和有效地點(diǎn)時(shí)間跨度為6分鐘;
[0065] b2、依次對(duì)軌跡數(shù)據(jù)進(jìn)行以下處理:當(dāng)相鄰兩個(gè)軌跡點(diǎn)的距離小于地點(diǎn)范圍閾值 100米時(shí),兩個(gè)軌跡點(diǎn)合并為一個(gè)新軌跡點(diǎn),新軌跡點(diǎn)參與下一次處理;當(dāng)相鄰兩個(gè)軌跡點(diǎn) 的距離大于地點(diǎn)范圍閾值100米時(shí),且前一個(gè)軌跡點(diǎn)的時(shí)間跨度大于有效地點(diǎn)時(shí)間閾值6分 鐘時(shí),該軌跡點(diǎn)為一有效地點(diǎn),表示為p= {lat, lng,start_ts,end_ts};
[0066] b3、用戶有效地點(diǎn)數(shù)目為M,一天劃分為24個(gè)時(shí)間段,用戶行為模式表示為MX24矩 陣P= [fij],每一行表不用戶的某個(gè)有效地點(diǎn),每一列表不一天中的某個(gè)時(shí)間段,fij表不在 第j個(gè)時(shí)間段停留在第i個(gè)地點(diǎn)的概率:
目戶一天行為模式如下表所 示:
[0067]
[0069]表2:用戶行為模式 [0070]所述步驟c具體包括:
[0071] cl、通過夾角余弦系數(shù),定義用戶行為模式距離函數(shù)。對(duì)于行為模式X和行為模式 Y,第i個(gè)時(shí)間段的地點(diǎn)分布向量為Xi = {xi,X2,···,xm}和Yi = {yi,y2,···,yM},M為有效地點(diǎn)數(shù) 目,N為時(shí)間段總數(shù),則有
[0072]
[0073]
[0074] c2、利用行為模式距離函數(shù),對(duì)用戶的行為模式的歷史記錄進(jìn)行DBSCAN聚類,得到 K個(gè)類別,取同一類行為模式的平均值作為類中心,則這K個(gè)行為模式為用戶偏好模型;
[0075] c3、根據(jù)用戶偏好模型判斷是否為異常行為:利用行為模式距離函數(shù)計(jì)算用戶行 為模式與用戶偏好模型的相似度,當(dāng)相似度低于閾值0.3時(shí),判斷用戶當(dāng)天的行為為異常行 為;
[0076] c4、選取移動(dòng)總距離Dist,有效停留點(diǎn)數(shù)目ECount,周期巡防次數(shù)Nperiod作為3個(gè) 評(píng)價(jià)指標(biāo),其中移動(dòng)距離Dist為軌跡序列中相鄰點(diǎn)的距離總和,有效停留點(diǎn)數(shù)目ECount為 停留在指定的地點(diǎn)且停留時(shí)間超過30分鐘的數(shù)目,周期巡防次數(shù)Nperiod為在所有指定地 點(diǎn)完成工作的次數(shù),評(píng)價(jià)指標(biāo)權(quán)重W={0.2,0.3,0.5},4
計(jì)算用戶行為得分,其
ll 中 < 心為用戶在指標(biāo)i上的統(tǒng)計(jì)值,Normal,為指標(biāo)i預(yù)設(shè)的 標(biāo)準(zhǔn)值。則:
[0077]當(dāng)?shù)梅执笥?0時(shí),反映該員工很好地完成了工作。
[0078]當(dāng)?shù)梅执笥?0時(shí),反映該員工基本完成工作,但完成度不高 [0079]當(dāng)?shù)梅中∮?0時(shí),反映該員工沒有正常完成工作。
【主權(quán)項(xiàng)】
1. 一種基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:利用軌跡數(shù)據(jù)挖掘用戶的行 為模式,分析用戶的行為規(guī)律,對(duì)用戶行為進(jìn)行評(píng)估。2. 根據(jù)權(quán)利要求1所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述方法具 體包括如下步驟: a、 獲取位置信息得到軌跡數(shù)據(jù),并對(duì)軌跡數(shù)據(jù)預(yù)處理; b、 通過軌跡數(shù)據(jù)獲取用戶不同時(shí)間段在不同地點(diǎn)的時(shí)間分布,得到用戶的行為模式; c、 利用用戶行為模式的歷史記錄更新用戶偏好模型,根據(jù)用戶偏好模型判斷是否為異 常行為,計(jì)算用戶行為得分。3. 根據(jù)權(quán)利要求2所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述步驟a 中,移動(dòng)設(shè)備上報(bào)軌跡數(shù)據(jù)為L(zhǎng)= {ll,l2,···,ln},其中]^=(]^1^,1〇1^1,1:;[11^)表示經(jīng)煒度 和時(shí)間,首先去除軌跡數(shù)據(jù)中的重復(fù)點(diǎn),再通過Kalman濾波過濾速度異常點(diǎn),平滑軌跡數(shù) 據(jù),使軌跡數(shù)據(jù)更接近真實(shí)的行程軌跡。4. 根據(jù)權(quán)利要求3所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述步驟b 中,采用基于時(shí)間序列的聚類算法,獲取用戶不同時(shí)間段在不同地點(diǎn)的時(shí)間分布,得到用戶 的行為模式。5. 根據(jù)權(quán)利要求4所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述步驟b 具體包括: b 1、選取兩個(gè)參數(shù)值地點(diǎn)最大范圍Dmax和有效地點(diǎn)時(shí)間跨度T; b2、依次對(duì)軌跡數(shù)據(jù)進(jìn)行以下處理:當(dāng)相鄰兩個(gè)軌跡點(diǎn)的距離小于地點(diǎn)范圍閾值D時(shí), 兩個(gè)軌跡點(diǎn)合并為一個(gè)新軌跡點(diǎn),新軌跡點(diǎn)參與下一次處理;當(dāng)相鄰兩個(gè)軌跡點(diǎn)的距離大 于地點(diǎn)范圍閾值DmaJt,且前一個(gè)軌跡點(diǎn)的時(shí)間跨度大于有效地點(diǎn)時(shí)間閾值T時(shí),該軌跡點(diǎn) 為一有效地點(diǎn),表示為P = {lat,lng,start_ts,end_ts}; b3、用戶有效地點(diǎn)數(shù)目為M,一天劃分為N個(gè)時(shí)間段,用戶行為模式表示為MXN矩陣P = [f ij ],每一行表不用戶的某個(gè)有效地點(diǎn),每一列表不一天中的某個(gè)時(shí)間段,fij表不在第j個(gè) 時(shí)間段停留在第i個(gè)地點(diǎn)的概率。6. 根據(jù)權(quán)利要求5所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述步驟C 中,用戶偏好模型通過下述方法得出: cl、通過夾角余弦系數(shù),定義用戶行為模式距離函數(shù)。對(duì)于行為模式X和行為模式Y(jié),第i 個(gè)時(shí)間段的地點(diǎn)分布向量為Xi={xi,x2,…,xm}和Yi={yi,y2,…,yM},M為有效地點(diǎn)數(shù)目,N 為時(shí)間段總數(shù),則有c2、利用行為模式距離函數(shù),對(duì)用戶行為模式的歷史記錄進(jìn)行DBSCAN聚類,得到K個(gè)類 另IJ,取同一類行為模式的平均值作為類中心,則這K個(gè)行為模式為用戶偏好模型。7. 根據(jù)權(quán)利要求6所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述步驟c 中,根據(jù)用戶偏好模型判斷是否為異常行為:利用行為模式距離函數(shù)計(jì)算用戶行為模式與 用戶偏好模型的相似度,當(dāng)相似度低于閾值時(shí),判斷用戶某天的行為為異常行為,則該用戶 行為得分直接判為負(fù)分。8. 根據(jù)權(quán)利要求7所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述步驟c 中,結(jié)合用戶業(yè)務(wù)行為數(shù)據(jù)選取C類評(píng)價(jià)指標(biāo),C類評(píng)價(jià)指標(biāo)權(quán)重W= {wi,W2,…,wc},計(jì)算用戶行為得分,其中S1為單項(xiàng)評(píng)價(jià)指標(biāo)得分,根據(jù)用戶行為得 分得出評(píng)估結(jié)果。9. 根據(jù)權(quán)利要求8所述的基于地點(diǎn)挖掘的用戶行為評(píng)估方法,其特征在于:所述評(píng)價(jià)指 標(biāo)選擇用戶移動(dòng)總距離Len、用戶停留次數(shù)Count、用戶有效停留數(shù)ECount,有效停留數(shù)為在 停留地點(diǎn)用戶有業(yè)務(wù)數(shù)據(jù)操作的停留點(diǎn)數(shù)目。
【專利摘要】本發(fā)明公開了一種基于地點(diǎn)挖掘的用戶行為評(píng)估方法,所述方法具體包括如下步驟:a、獲取位置信息得到軌跡數(shù)據(jù),并對(duì)軌跡數(shù)據(jù)預(yù)處理;b、通過軌跡數(shù)據(jù)獲取用戶不同時(shí)間段在不同地點(diǎn)的時(shí)間分布,得到用戶的行為模式;c、利用用戶行為模式的歷史記錄更新用戶偏好模型,根據(jù)用戶偏好模型判斷是否為異常行為,計(jì)算用戶行為得分。本發(fā)明可以從用戶原始雜亂的軌跡數(shù)據(jù)中,得到用戶的行為模式,準(zhǔn)確反應(yīng)出用戶每天的行為規(guī)律,大大降低了傳統(tǒng)的考勤打卡違規(guī)作弊的可能。
【IPC分類】G06Q10/06, G06Q10/10
【公開號(hào)】CN105678457
【申請(qǐng)?zhí)枴緾N201610006088
【發(fā)明人】張國(guó)容
【申請(qǐng)人】成都小步創(chuàng)想暢聯(lián)科技有限公司
【公開日】2016年6月15日
【申請(qǐng)日】2016年1月6日