1.一種群體虛假交易識(shí)別方法,其特征在于,包括:
獲取預(yù)設(shè)時(shí)間段內(nèi)各買(mǎi)家的交易相關(guān)信息,所述交易相關(guān)信息包含買(mǎi)家ID及各買(mǎi)家所購(gòu)買(mǎi)的多個(gè)商品的ID;
根據(jù)所述交易相關(guān)信息對(duì)買(mǎi)家進(jìn)行聚類(lèi),得到多個(gè)買(mǎi)家群體;其中,每個(gè)買(mǎi)家群體中的買(mǎi)家購(gòu)買(mǎi)了多種相同的商品;
根據(jù)所述交易相關(guān)信息計(jì)算每個(gè)買(mǎi)家群體的整體相似度指標(biāo);
根據(jù)所述整體相似度指標(biāo)識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體。
2.根據(jù)權(quán)利要求1所述的群體虛假交易識(shí)別方法,其特征在于,根據(jù)所述交易相關(guān)信息對(duì)買(mǎi)家進(jìn)行聚類(lèi),得到多個(gè)買(mǎi)家群體,包括:
根據(jù)所述交易相關(guān)信息計(jì)算兩兩買(mǎi)家之間的相似性;
根據(jù)所述相似性對(duì)買(mǎi)家進(jìn)行聚類(lèi),得到多個(gè)買(mǎi)家群體。
3.根據(jù)權(quán)利要求2所述的群體虛假交易識(shí)別方法,其特征在于,根據(jù)所述交易相關(guān)信息計(jì)算兩兩買(mǎi)家之間的相似性,包括:
根據(jù)兩兩買(mǎi)家的交易相關(guān)信息計(jì)算兩兩買(mǎi)家購(gòu)買(mǎi)的商品的種類(lèi)總和及兩兩買(mǎi)家購(gòu)買(mǎi)的相同商品的種類(lèi)之和;
根據(jù)所述商品的種類(lèi)總和及相同商品的種類(lèi)之和計(jì)算兩兩買(mǎi)家之間的相似性。
4.根據(jù)權(quán)利要求3所述的群體虛假交易識(shí)別方法,其特征在于,根據(jù)所述商品的種類(lèi)總和及相同商品的種類(lèi)之和計(jì)算兩兩買(mǎi)家之間的相似性,包括:計(jì)算所述相同商品的種類(lèi)之和與商品的種類(lèi)總和的比值,該比值表征兩兩買(mǎi)家之間的相似性。
5.根據(jù)權(quán)利要求3所述的群體虛假交易識(shí)別方法,其特征在于,根據(jù)所述相似性對(duì)買(mǎi)家進(jìn)行聚類(lèi),得到多個(gè)買(mǎi)家群體,包括:比較所述相似性與一相似性臨界值,將相似性大于所述相似性臨界值的買(mǎi)家進(jìn)行聚類(lèi)。
6.根據(jù)權(quán)利要求1所述的群體虛假交易識(shí)別方法,其特征在于,所述整體相似度指標(biāo)包括:買(mǎi)家群體中的買(mǎi)家購(gòu)買(mǎi)相同商品的種類(lèi)數(shù)量;根據(jù)所述交易相關(guān)信息計(jì)算每個(gè)買(mǎi)家群體的整體相似度指標(biāo),包括:計(jì)算每個(gè)買(mǎi)家群體中的買(mǎi)家購(gòu)買(mǎi)相同商品的種類(lèi)數(shù)量。
7.根據(jù)權(quán)利要求6所述的群體虛假交易識(shí)別方法,其特征在于,根據(jù)所述整體相似度指標(biāo)識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體,包括:將各買(mǎi)家群體的整體相似度指標(biāo)分別與一預(yù)設(shè)的相似度指標(biāo)進(jìn)行比較,根據(jù)比較結(jié)果識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體。
8.根據(jù)權(quán)利要求6所述的群體虛假交易識(shí)別方法,其特征在于,根據(jù)所述整體相似度指標(biāo)識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體,包括:根據(jù)每個(gè)買(mǎi)家聚類(lèi)簇的整體相似度指標(biāo)在所有買(mǎi)家群體的整體相似度指標(biāo)中的排名識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體。
9.一種群體虛假交易識(shí)別裝置,其特征在于,包括:
信息獲取單元,用于獲取預(yù)設(shè)時(shí)間段內(nèi)各買(mǎi)家的交易相關(guān)信息,所述交易相關(guān)信息包含買(mǎi)家ID及各買(mǎi)家所購(gòu)買(mǎi)的多個(gè)商品的ID;
聚類(lèi)單元,用于根據(jù)所述交易相關(guān)信息對(duì)買(mǎi)家進(jìn)行聚類(lèi),得到多個(gè)買(mǎi)家群體;其中,每個(gè)買(mǎi)家群體中的買(mǎi)家購(gòu)買(mǎi)了多種相同的商品;
計(jì)算單元,用于根據(jù)所述交易相關(guān)信息計(jì)算每個(gè)買(mǎi)家群體的整體相似度指標(biāo);
識(shí)別單元,用于根據(jù)所述整體相似度指標(biāo)識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體。
10.根據(jù)權(quán)利要求9所述的群體虛假交易識(shí)別裝置,其特征在于,所述聚類(lèi)單元包括:
相似性計(jì)算模塊,用于根據(jù)所述交易相關(guān)信息計(jì)算兩兩買(mǎi)家之間的相似性;
買(mǎi)家群體生成模塊,用于根據(jù)所述相似性對(duì)買(mǎi)家進(jìn)行聚類(lèi),得到多個(gè)買(mǎi)家群體。
11.根據(jù)權(quán)利要求10所述的群體虛假交易識(shí)別裝置,其特征在于,所述相似性計(jì)算模塊包括:
商品種類(lèi)計(jì)算子模塊,用于根據(jù)兩兩買(mǎi)家的交易相關(guān)信息計(jì)算兩兩買(mǎi)家購(gòu)買(mǎi)的商品的種類(lèi)總和及兩兩買(mǎi)家購(gòu)買(mǎi)的相同商品的種類(lèi)之和;
相似性計(jì)算子模塊,用于根據(jù)所述商品的種類(lèi)總和及相同商品的種類(lèi)之和計(jì)算兩兩買(mǎi)家之間的相似性。
12.根據(jù)權(quán)利要求11所述的群體虛假交易識(shí)別裝置,其特征在于,所述商品種類(lèi)計(jì)算子模塊具體用于計(jì)算所述相同商品的種類(lèi)之和與商品的種類(lèi)總和的比值,該比值作為兩兩買(mǎi)家之間的相似性。
13.根據(jù)權(quán)利要求11所述的群體虛假交易識(shí)別裝置,其特征在于,所述買(mǎi)家群體生成模塊具體用于:比較所述相似性與一相似性臨界值,將相似性大于所述相似性臨界值的買(mǎi)家進(jìn)行聚類(lèi)。
14.根據(jù)權(quán)利要求9所述的群體虛假交易識(shí)別裝置,其特征在于,所述整體相似度指標(biāo)包括:買(mǎi)家群體中的買(mǎi)家購(gòu)買(mǎi)相同商品的種類(lèi)數(shù)量;所述計(jì)算單元具體用于:計(jì)算每個(gè)買(mǎi)家群體中的買(mǎi)家購(gòu)買(mǎi)相同商品的種類(lèi)數(shù)量。
15.根據(jù)權(quán)利要求14所述的群體虛假交易識(shí)別裝置,其特征在于,所述識(shí)別單元具體用于:將各買(mǎi)家群體的整體相似度指標(biāo)分別與一預(yù)設(shè)的相似度指標(biāo)進(jìn)行比較,根據(jù)比較結(jié)果識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體。
16.根據(jù)權(quán)利要求14所述的群體虛假交易識(shí)別裝置,其特征在于,所述識(shí)別單元具體用于:根據(jù)每個(gè)買(mǎi)家聚類(lèi)簇的整體相似度指標(biāo)在所有買(mǎi)家群體的整體相似度指標(biāo)中的排名識(shí)別出多個(gè)所述買(mǎi)家群體中的虛假交易群體。