1.一種刷量工具檢測(cè)方法,所述方法包括:
獲取應(yīng)用信息,所述應(yīng)用信息包括應(yīng)用的渠道標(biāo)識(shí);
獲取安裝所述應(yīng)用的用戶信息,所述用戶信息包括用戶的應(yīng)用安裝列表;
采用SimHash算法計(jì)算所述應(yīng)用安裝列表的SimHash值;
根據(jù)所述SimHash值對(duì)用戶進(jìn)行聚類統(tǒng)計(jì);
根據(jù)所述聚類統(tǒng)計(jì)結(jié)果檢測(cè)所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道是否使用了刷量工具。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采用SimHash算法計(jì)算所述應(yīng)用安裝列表的SimHash值的步驟,包括:
將所述應(yīng)用安裝列表按應(yīng)用屬性進(jìn)行排序;
以相鄰兩個(gè)應(yīng)用名稱組成的字符串作為一個(gè)特征構(gòu)造特征集合;
采用SimHash算法計(jì)算所述特征集合的SimHash值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述SimHash值對(duì)用戶進(jìn)行聚類統(tǒng)計(jì)的步驟,包括:
將具有相同SimHash值的用戶聚類到一個(gè)簇中;
統(tǒng)計(jì)所述簇的不同屬性值。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述聚類統(tǒng)計(jì)結(jié)果檢測(cè)所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道是否使用了刷量工具的步驟,包括:
將所述簇的不同屬性值與相應(yīng)的屬性閾值進(jìn)行比較;
根據(jù)比較結(jié)果檢測(cè)所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道是否使用了刷量工具。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述比較結(jié)果檢測(cè)所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道是否使用了刷量工具的步驟,包括:
檢測(cè)所述簇的不同屬性值中是否至少有一個(gè)屬性值大于等于其相應(yīng)的屬性閾值,若是,則所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道使用了刷量工具。
6.一種刷量工具檢測(cè)裝置,所述裝置包括:
第一獲取模塊,用于獲取應(yīng)用信息,所述應(yīng)用信息包括應(yīng)用的渠道標(biāo)識(shí);
第二獲取模塊,用于獲取安裝所述應(yīng)用的用戶信息,所述用戶信息包括用 戶的應(yīng)用安裝列表;
計(jì)算模塊,用于采用SimHash算法計(jì)算所述應(yīng)用安裝列表的SimHash值;
聚類統(tǒng)計(jì)模塊,用于根據(jù)所述SimHash值對(duì)用戶進(jìn)行聚類統(tǒng)計(jì);
檢測(cè)模塊,用于根據(jù)所述聚類統(tǒng)計(jì)結(jié)果檢測(cè)所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道是否使用了刷量工具。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述計(jì)算模塊包括:
排序單元,用于將所述應(yīng)用安裝列表按應(yīng)用屬性進(jìn)行排序;
構(gòu)造單元,用于以相鄰兩個(gè)應(yīng)用名稱組成的字符串作為一個(gè)特征構(gòu)造特征集合;
計(jì)算單元,用于采用SimHash算法計(jì)算所述特征集合的SimHash值。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述聚類統(tǒng)計(jì)模塊包括:
聚類單元,用于將具有相同SimHash值的用戶聚類到一個(gè)簇中;
統(tǒng)計(jì)單元,用于統(tǒng)計(jì)所述簇的不同屬性值。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述檢測(cè)模塊包括:
比較單元,用于將所述簇的不同屬性值與相應(yīng)的屬性閾值進(jìn)行比較;
檢測(cè)單元,用于根據(jù)比較結(jié)果檢測(cè)所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道是否使用了刷量工具。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述檢測(cè)單元用于檢測(cè)所述簇的不同屬性值中是否至少有一個(gè)屬性值大于等于其相應(yīng)的屬性閾值,若是,則所述渠道標(biāo)識(shí)對(duì)應(yīng)的應(yīng)用渠道使用了刷量工具。