本技術(shù)涉及計(jì)算機(jī)視覺,尤其涉及一種群體發(fā)現(xiàn)方法和裝置、電子設(shè)備。
背景技術(shù):
1、群體發(fā)現(xiàn)就是針對群體的應(yīng)用目標(biāo),選擇群體在屬性或結(jié)構(gòu)上的可計(jì)算特征作為發(fā)現(xiàn)基準(zhǔn),挖掘具有特定屬性或結(jié)構(gòu)特征的用戶子集的過程?,F(xiàn)有的群體發(fā)現(xiàn)方法大體包括四個(gè)子步驟:子步驟1:對目標(biāo)的軌跡數(shù)據(jù)以定長的窗口進(jìn)行去重;子步驟2:以去重后的每個(gè)軌跡記錄為中心截取定長時(shí)間的切片,統(tǒng)計(jì)切片中出現(xiàn)的其他人的次數(shù);子步驟3:以一個(gè)確定的閾值來判斷切片中的人是否與目標(biāo)是同行人,最終根據(jù)次數(shù)和一定的方法來劃分群體。
2、現(xiàn)有的群體發(fā)現(xiàn)方法存在如下缺陷:
3、缺陷一:當(dāng)不同群體的人在同一點(diǎn)位下滯留過久時(shí),以現(xiàn)在的目標(biāo)軌跡去重和計(jì)算目標(biāo)與同行人出現(xiàn)次數(shù)的方法會(huì)導(dǎo)致結(jié)果準(zhǔn)確率低。例如:兩個(gè)無相關(guān)的人長時(shí)間在一個(gè)站點(diǎn)下,很容易產(chǎn)生大量的軌跡數(shù)據(jù),在上述統(tǒng)計(jì)方式下兩人的相關(guān)度會(huì)隨著時(shí)長的增加不斷提高。
4、缺陷二:在現(xiàn)有的群體發(fā)現(xiàn)算法中以一個(gè)固定閾值來判斷是否與目標(biāo)是同行人的方式泛化性較差。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)缺陷之一,本技術(shù)實(shí)施例中提供了一種群體發(fā)現(xiàn)方法和裝置、電子設(shè)備。
2、本發(fā)明實(shí)施例提供了一種群體發(fā)現(xiàn)方法,其中,所述方法包括:
3、從獲取到的各人員軌跡簇中濾除已注冊不參與分析人員的軌跡簇,得到第一人員軌跡簇,其中,所述每個(gè)人員對應(yīng)一個(gè)軌跡簇,每個(gè)軌跡簇包括多個(gè)時(shí)間窗口下的人員運(yùn)行軌跡;
4、依據(jù)所述第一人員軌跡簇,分別計(jì)算各第一人員與其他人員之間的親密度值;
5、過濾掉所述第一人員中包含的已注冊參與分析人員,得到未注冊第一人員;
6、針對每個(gè)所述未注冊第一人員,依據(jù)所述未注冊第一人員與其他人員之間的親密度值篩選出親密同行人員;
7、按照預(yù)設(shè)規(guī)則為各所述未注冊第一人員和親密同行人員確定所屬群體,得到各群體包含的人員。
8、可選地,從獲取到的各人員軌跡簇中濾除已注冊不參與分析人員的軌跡簇,得到第一人員軌跡簇的步驟,包括:
9、分別確定獲取到的各人員軌跡簇的標(biāo)識(shí),其中,所述標(biāo)識(shí)用于指示人員的類型,人員類型包括:已注冊不參與分析、已注冊參與分析和未注冊;
10、過濾掉已注冊不參與分析類型所對應(yīng)的標(biāo)識(shí)標(biāo)記的各人員軌跡簇,得到第一人員軌跡簇。
11、可選地,依據(jù)所述第一人員軌跡簇,分別計(jì)算各第一人員與其他人員之間的親密度值的步驟,包括:
12、分別確定各點(diǎn)位在各滑動(dòng)時(shí)間窗口下的軌跡數(shù)據(jù);
13、針對每個(gè)所述第一人員,依據(jù)所述第一人員與其他人員在同點(diǎn)位同滑動(dòng)時(shí)間窗口、不同點(diǎn)位同滑動(dòng)時(shí)間窗口軌跡交叉的次數(shù),確定所述第一人員與其他人員的親密度值。
14、可選地,針對每個(gè)所述未注冊第一人員,依據(jù)所述未注冊第一人員與其他人員之間的親密度值篩選出親密同行人員的步驟,包括:
15、針對每個(gè)所述未注冊第一人員,依據(jù)所述未注冊第一人員與其他人員之間的親密度值,篩選出與所述未注冊第一人員親密度排序前第一預(yù)設(shè)位次的人員列表:其中,排序位次越靠前親密度值越高;
16、將所述人員列表中與所述未注冊第一人員親密度值滿足預(yù)設(shè)條件的人員,確定為親密同行人員。
17、可選地,按照預(yù)設(shè)規(guī)則為各所述未注冊第一人員和親密同行人員確定所屬群體,得到各群體包含的人員的步驟,包括:
18、針對每個(gè)所述未注冊人員,確定所述未注冊人員的親密同行人員中的至少之一是否已有所屬第一群體;若是,在所述未注冊第一人員與所述第一群體中半數(shù)以上人員為親密同行人員的情況下,將所述未注冊第一人員歸屬至所述第一群體;
19、針對所述未注冊第一人員的每個(gè)親密同行人員,確定所述親密同行人員是否已有所述群體;若否,在所述親密同行人員與所述第一群體中半數(shù)以上人員為親密同行人員的情況下,將所述親密同行人員歸屬至所述第一群體;
20、若所述未注冊第一人員和各親密同行人員均無所屬群體,建立新群體并將所述未注冊第一人員和各親密同行人員歸屬至所述新群體。
21、可選地,在所述按照預(yù)設(shè)規(guī)則,為各所述未注冊第一人員和親密同行人員確定所屬群體,得到各群體包含的人員的步驟之后,所述方法還包括:
22、針對每個(gè)群體,分別確定所述群體中各人員的親密注冊人員;
23、統(tǒng)計(jì)所述群體中各人員的親密注冊人員的投票數(shù)量;
24、依據(jù)各親密注冊人員對應(yīng)的投票數(shù)量,確定目標(biāo)注冊人員;
25、將所述目標(biāo)注冊人員分配給所述群體。
26、可選地,針對每個(gè)群體,分別確定所述群體中各人員的親密注冊人員的步驟,包括:
27、針對每個(gè)群體,確定所述群體中包含的各人員;
28、針對每個(gè)所述成員,依據(jù)所述人員與其他人員之間的親密度值,篩選出與所述人員親密度排序前第二預(yù)設(shè)位次的人員:
29、將所述排序前第二預(yù)設(shè)位次的人員中與所述人員間親密度值大于預(yù)設(shè)值的人員包含的注冊人員,確定為所述人員的親密注冊人員。
30、本發(fā)明實(shí)施例還提供了一種群體發(fā)現(xiàn)裝置,其中,所述裝置包括:
31、第一過濾模塊,用于從獲取到的各人員軌跡簇中濾除已注冊不參與分析人員的軌跡簇,得到第一人員軌跡簇,其中,所述每個(gè)人員對應(yīng)一個(gè)軌跡簇,每個(gè)軌跡簇包括多個(gè)時(shí)間窗口下的人員運(yùn)行軌跡;
32、計(jì)算模塊,用于依據(jù)所述第一人員軌跡簇,分別計(jì)算各第一人員與其他人員之間的親密度值;
33、第二過濾模塊,用于過濾掉所述第一人員中包含的已注冊參與分析人員,得到未注冊第一人員;
34、篩選模塊,用于針對每個(gè)所述未注冊第一人員,依據(jù)所述未注冊第一人員與其他人員之間的親密度值篩選出親密同行人員;
35、群體歸屬確定模塊,用于按照預(yù)設(shè)規(guī)則為各所述未注冊第一人員和親密同行人員確定所屬群體,得到各群體包含的人員。
36、可選地,所述第一過濾模塊包括:
37、標(biāo)識(shí)確定子模塊,用于分別確定獲取到的各人員軌跡簇的標(biāo)識(shí),其中,所述標(biāo)識(shí)用于指示人員的類型,人員類型包括:已注冊不參與分析、已注冊參與分析和未注冊;
38、數(shù)據(jù)濾除子模塊,用于過濾掉已注冊不參與分析類型所對應(yīng)的標(biāo)識(shí)標(biāo)記的各人員軌跡簇,得到第一人員軌跡簇。
39、可選地,所述計(jì)算模塊包括:
40、第一子模塊,用于分別確定各點(diǎn)位在各滑動(dòng)時(shí)間窗口下的軌跡數(shù)據(jù);
41、第二子模塊,用于針對每個(gè)所述第一人員,依據(jù)所述第一人員與其他人員在同點(diǎn)位同滑動(dòng)時(shí)間窗口、不同點(diǎn)位同滑動(dòng)時(shí)間窗口軌跡交叉的次數(shù),確定所述第一人員與其他人員的親密度值。
42、可選地,所述篩選模塊包括:
43、第三子模塊,用于針對每個(gè)所述未注冊第一人員,依據(jù)所述未注冊第一人員與其他人員之間的親密度值,篩選出與所述未注冊第一人員親密度排序前第一預(yù)設(shè)位次的人員列表:其中,排序位次越靠前親密度值越高;
44、第四子模塊,用于將所述人員列表中與所述未注冊第一人員親密度值滿足預(yù)設(shè)條件的人員,確定為親密同行人員。
45、可選地,所述群體歸屬確定模塊包括:
46、第五子模塊,用于針對每個(gè)所述未注冊第一人員,確定所述未注冊人員的親密同行人員中的至少之一是否已有所屬第一群體;若是,在所述未注冊第一人員與所述第一群體中半數(shù)以上人員為親密同行人員的情況下,將所述未注冊第一人員歸屬至所述第一群體;
47、第六子模塊,用于針對所述未注冊第一人員的每個(gè)親密同行人員,確定所述親密同行人員是否已有所述群體;若否,在所述親密同行人員與所述第一群體中半數(shù)以上人員為親密同行人員的情況下,將所述親密同行人員歸屬至所述第一群體;
48、第七子模塊,用于若所述未注冊第一人員和各親密同行人員均無所屬群體,建立新群體并將所述未注冊第一人員和各親密同行人員歸屬至所述新群體。
49、可選地,所述裝置還包括:
50、親密注冊人員確定模塊,用于在所述群體歸屬確定模塊按照預(yù)設(shè)規(guī)則,為各所述未注冊第一人員和親密同行人員確定所屬群體,得到各群體包含的人員之后,針對每個(gè)群體,分別確定所述群體中各人員的親密注冊人員;
51、統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)群體中各人員的親密注冊人員的投票數(shù)量;
52、分配模塊,用于依據(jù)各親密注冊人員對應(yīng)的投票數(shù)量,確定目標(biāo)注冊人員,并將所述目標(biāo)注冊人員分配給所述群體。
53、可選地,所述親密注冊人員確定模塊包括:
54、第八子模塊,用于針對每個(gè)群體,確定所述群體中包含的各人員;
55、第九子模塊,用于針對每個(gè)所述成員,依據(jù)所述人員與其他人員之間的親密度值,篩選出與所述人員親密度排序前第二預(yù)設(shè)位次的人員:
56、第十子模塊,用于將所述排序前第二預(yù)設(shè)位次的人員中與所述人員間親密度值大于預(yù)設(shè)值的人員包含的注冊人員,確定為所述人員的親密注冊人員。
57、在本發(fā)明實(shí)施例的又一方面,還提供了一種電子設(shè)備,包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過通信總線完成相互間的通信;存儲(chǔ)器,用于存放計(jì)算機(jī)程序;處理器,用于執(zhí)行存儲(chǔ)器上所存放的程序時(shí),實(shí)現(xiàn)上述任一所述的群體發(fā)現(xiàn)方法。
58、本技術(shù)提供的群體發(fā)現(xiàn)方案,從獲取到的各人員軌跡簇中濾除已注冊不參與分析人員的軌跡簇,得到第一人員軌跡簇;依據(jù)第一人員軌跡簇,分別計(jì)算各第一人員與其他人員之間的親密度值;過濾掉第一人員中包含的已注冊參與分析人員,得到未注冊第一人員;針對每個(gè)未注冊第一人員,依據(jù)未注冊第一人員與其他人員之間的親密度值篩選出親密同行人員;按照預(yù)設(shè)規(guī)則為各未注冊第一人員和親密同行人員確定所屬群體,得到各群體包含的人員。通過本技術(shù)公開的群體發(fā)現(xiàn)方法,基于人員間的親密度值篩選出各人員的親密同行人,然后按照預(yù)設(shè)規(guī)則為未注冊人員和親密同行人分配所屬群體,可提升群體發(fā)現(xiàn)結(jié)果的準(zhǔn)確性,具有良好的泛化性。