1.一種搜索數(shù)據(jù)處理的方法,其特征在于,包括:
獲取多個(gè)搜索引擎用戶的用戶行為數(shù)據(jù);
根據(jù)所述用戶行為數(shù)據(jù),建立用戶行為分析模型,所述用戶行為分析模型包含用戶搜索歷史數(shù)據(jù)與用戶行為的對(duì)應(yīng)關(guān)系;
基于所述用戶行為分析模型以及分布式計(jì)算框架,對(duì)用戶行為數(shù)據(jù)進(jìn)行并行處理,得出相應(yīng)用戶行為模式分析結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,在所述基于所述用戶行為分析模型以及分布式計(jì)算框架,對(duì)用戶行為數(shù)據(jù)進(jìn)行并行處理,得出相應(yīng)用戶行為模式分析結(jié)果之后還包括:
根據(jù)所述用戶行為模式分析結(jié)果,對(duì)搜索引擎進(jìn)行相應(yīng)優(yōu)化操作。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述獲取多個(gè)搜索引擎用戶的用戶行為數(shù)據(jù)包括:
從存儲(chǔ)有所述用戶行為數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)中,并行讀取用戶日志數(shù)據(jù),獲取所述用戶行為數(shù)據(jù)。
4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述用戶行為數(shù)據(jù),建立用戶行為分析模型包括:
提取所述用戶行為數(shù)據(jù)的維度指標(biāo);
對(duì)所述維度指標(biāo)進(jìn)行分析,建立所述用戶行為分析模型。
5.如權(quán)利要求2所述的方法,其特征在于,在所述根據(jù)所述用戶行為模式分析結(jié)果,對(duì)搜索引擎進(jìn)行相應(yīng)優(yōu)化操作之后還包括:
獲取當(dāng)前用戶的歷史搜索數(shù)據(jù),根據(jù)所述用戶行為分析模型,向用戶推薦與所述歷史搜索數(shù)據(jù)相關(guān)聯(lián)的個(gè)性化信息。
6.一種搜索數(shù)據(jù)處理的裝置,其特征在于,包括:
獲取模塊,用于獲取多個(gè)搜索引擎用戶的用戶行為數(shù)據(jù);
模型建立模塊,用于根據(jù)所述用戶行為數(shù)據(jù),建立用戶行為分析模型,所述用戶行為分析模型包括用戶搜索歷史數(shù)據(jù)與用戶行為的對(duì)應(yīng)關(guān)系;
分布式處理模塊,用于基于所述用戶行為分析模型以及分布式計(jì)算框架,對(duì)用戶行為數(shù)據(jù)進(jìn)行并行處理,得出相應(yīng)用戶行為模式分析結(jié)果。
7.如權(quán)利要求6所述的裝置,其特征在于,還包括:
優(yōu)化模塊,用于根據(jù)所述用戶行為模式分析結(jié)果,對(duì)搜索引擎進(jìn)行相應(yīng)優(yōu)化操作。
8.如權(quán)利要求6或7所述的裝置,其特征在于,所述獲取模塊包括:
讀取單元,用于從存儲(chǔ)有所述用戶行為數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)中,并行讀取用戶日志數(shù)據(jù),獲取所述用戶行為數(shù)據(jù)。
9.如權(quán)利要求8所述的裝置,其特征在于,所述模型建立模塊包括:
提取單元,用于提取所述用戶行為數(shù)據(jù)的維度指標(biāo);
分析建立單元,用于對(duì)所述維度指標(biāo)進(jìn)行分析,建立所述用戶行為分析模型。
10.如權(quán)利要求6所述的裝置,其特征在于,還包括:
個(gè)性化推薦模塊,用于獲取當(dāng)前用戶的歷史搜索數(shù)據(jù),根據(jù)所述用戶行為分析模型,向用戶推薦與所述歷史搜索數(shù)據(jù)相關(guān)聯(lián)的個(gè)性化信息。