專利名稱:一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法及裝置的制作方法
技術(shù)領(lǐng)域:
本申請涉及信息推薦的技術(shù)領(lǐng)域,特別是涉及一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法和一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置。
背景技術(shù):
隨著因特網(wǎng)的日益壯大,網(wǎng)絡(luò)用戶也越來越多。通常情況下,用戶在點(diǎn)擊網(wǎng)頁或在搜索引擎下搜索某個關(guān)鍵字的時候,會產(chǎn)生相關(guān)的網(wǎng)絡(luò)報文。一般而言,一些大型網(wǎng)站會根據(jù)用戶訪問行為所產(chǎn)生的網(wǎng)絡(luò)報文進(jìn)行關(guān)聯(lián)分析。例如,用戶在訪問某大型門戶網(wǎng)站時,看到網(wǎng)頁上有某個比較感興趣的話題,于是
打開此鏈接,這樣的用戶訪問行為都會被該網(wǎng)站的服務(wù)器捕捉到,即該網(wǎng)站的服務(wù)器會記錄該用戶的這些訪問信息;或如,當(dāng)用戶訪問某個大型搜索引擎時,此網(wǎng)站的服務(wù)器會記錄用戶的搜索信息和點(diǎn)擊信息。通過對用戶的這些網(wǎng)站訪問信息進(jìn)行關(guān)聯(lián)分析,可以獲得用戶在該網(wǎng)站上行為,分析該用戶在該網(wǎng)站上的上網(wǎng)習(xí)慣,從而可以對用戶的上網(wǎng)行為進(jìn)行關(guān)聯(lián)分析。用戶行為分析,是指在獲得網(wǎng)站訪問量基本數(shù)據(jù)的情況下,對有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計、分析,從中發(fā)現(xiàn)用戶訪問網(wǎng)站的規(guī)律,并為用戶推薦用戶個性化的信息?,F(xiàn)有技術(shù)中,網(wǎng)絡(luò)用戶訪問網(wǎng)站信息只能通過單個網(wǎng)站獲得,即傳統(tǒng)的用戶行為關(guān)聯(lián)分析主要基于單個網(wǎng)站服務(wù)器的網(wǎng)絡(luò)報文信息,由于不同服務(wù)器之間跨系統(tǒng)通信的難度,現(xiàn)有技術(shù)無法對用戶進(jìn)行全方位的行為信息關(guān)聯(lián)分析,從而無法獲得準(zhǔn)確的用戶行為關(guān)聯(lián)分析,無法為用戶推薦個性化的信息。因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是提出一種基于用戶行為關(guān)聯(lián)分析的信息推薦機(jī)制,以獲取用戶的全方位上網(wǎng)行為,提高用戶行為關(guān)聯(lián)分析的準(zhǔn)確性,從而為用戶推薦個性化的信息。
發(fā)明內(nèi)容
本申請所要解決的技術(shù)問題是提供一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法和裝置,用以對不同服務(wù)器之間跨系統(tǒng)網(wǎng)絡(luò)報文進(jìn)行用戶行為分析,以提高用戶行為關(guān)聯(lián)分析的準(zhǔn)確性,進(jìn)而為用戶推薦個性化的信息。為了解決上述問題,本申請公開了一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法,包括獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息,其中,所述用戶行為信息包括用戶標(biāo)識;根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。優(yōu)選地,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。優(yōu)選地,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;所述根據(jù)用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息的步驟包括分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;根據(jù)所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息。優(yōu)選地,所述針對用戶的某一行為信息返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息的步驟包括按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù);針對用戶的第二用戶行為信息,返回所述提取的第一用戶行為信息。優(yōu)選地,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;所述根據(jù)用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息的步驟包括分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;根據(jù)所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;
所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù)。優(yōu)選地,所述針對用戶的某一行為信息返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息的步驟包括針對用戶的第二用戶行為信息,返回從其用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息中,提取的第一用戶行為信息。優(yōu)選地,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的搜索關(guān)鍵詞信息;或者,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的點(diǎn)擊廣告信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息;或者,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第一訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第二訪問網(wǎng)站信息。本申請實(shí)施例還公開了一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置,包括如下模塊跨網(wǎng)網(wǎng)絡(luò)報文獲取模塊,用于獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;用戶行為信息提取模塊,用于從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息,其中,所述用戶行為信息包括用戶標(biāo)識;關(guān)聯(lián)信息計算模塊,用于根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;關(guān)聯(lián)信息返回模塊,用于針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。優(yōu)選地,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。優(yōu)選地,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的搜索關(guān)鍵詞信息;或者,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的點(diǎn)擊廣告信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息;或者,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第一訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第二訪問網(wǎng)站信息。
與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點(diǎn)本申請通過在多個地理位置部署多個網(wǎng)關(guān)以獲得用戶在這些地方上網(wǎng)的網(wǎng)絡(luò)報文,得到用戶全方位的上網(wǎng)行為,再根據(jù)用戶的上網(wǎng)行為對其進(jìn)行關(guān)聯(lián)分析,計算兩種行為之間的相關(guān)程度,得到準(zhǔn)確有序的用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息,從而為用戶提供準(zhǔn)確的行為推薦信息。
圖I是本申請的一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法實(shí)施例I的步驟流程圖;圖2是本申請的一種基于用戶行 為關(guān)聯(lián)分析的信息推薦方法實(shí)施例2的步驟流程圖;圖3是本申請的一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法實(shí)施例3的步驟流程圖;圖4是本申請的一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置實(shí)施例I的結(jié)構(gòu)框圖;圖5是本申請的一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置實(shí)施例5的結(jié)構(gòu)框圖。
具體實(shí)施例方式為使本申請的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對本申請作進(jìn)一步詳細(xì)的說明。本申請實(shí)施例通過在多個地理位置部署多個網(wǎng)關(guān)以獲得用戶在這些地方上網(wǎng)的網(wǎng)絡(luò)報文,得到用戶全方位的上網(wǎng)行為,再根據(jù)用戶的上網(wǎng)行為對其進(jìn)行關(guān)聯(lián)分析,從而為用戶提供準(zhǔn)確的推薦信息。參考圖I示出了一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法實(shí)施例I的步驟流程圖,具體可以包括以下步驟步驟101、獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;步驟102、從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息;其中,所述用戶行為信息中可以包括用戶標(biāo)識;作為本實(shí)施例的一種優(yōu)選示例,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。步驟103、根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;其中,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;在本申請的一種優(yōu)選實(shí)施中,所述步驟103可以包括如下子步驟子步驟Sll :分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;
子步驟S12 :按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;子步驟S13 :依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;子步驟S14:根據(jù)所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;子步驟S15 :根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息。步驟104 :針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。在本申請的一種優(yōu)選實(shí)施例中,所述步驟104可以包括如下子步驟子步驟S21 :按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù);子步驟S22 :針對用戶的第二用戶行為信息,返回所述提取的第一用戶行為信息。本實(shí)施例通過在多個地理位置部署多個網(wǎng)關(guān)來獲取用戶的跨網(wǎng)網(wǎng)絡(luò)報文,從跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶的行為信息并計算用戶標(biāo)識對應(yīng)的兩個行為之間的關(guān)聯(lián)信息,以此來提高用戶行為關(guān)聯(lián)分析的準(zhǔn)確性;針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息的步驟中,首先會對兩個行為之間的關(guān)聯(lián)信息進(jìn)行排序,從而為用戶推薦個性化的信息。參考圖2示出了一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法實(shí)施例2的步驟流程圖,具體可以包括以下步驟步驟201、獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;步驟202、從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息;其中,所述用戶行為信息中可以包括用戶標(biāo)識;作為本實(shí)施例的一種優(yōu)選示例,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。步驟203、根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;在本申請的一種優(yōu)選實(shí)施中,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息可以包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,在這種情況下,所述步驟203可以包括如下子步驟子步驟S31 :分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;子步驟S32 :按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;子步驟S33 :依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;子步驟S34:根據(jù)所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;子步驟S35 :根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;子步驟S36 :按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù)。步驟204 :針對用戶的某一行為信息返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。在本申請的一種優(yōu)選實(shí)施例中,所述步驟204可以包括如下子步驟子步驟S41 :針對用戶的第二用戶行為信息,返回從其用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息中,提取的第一用戶行為信息。在本申請的一種優(yōu)選實(shí)施例中,所述第一用戶行為信息還可以包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息還可以包括用戶標(biāo)識所對應(yīng)的搜索關(guān)鍵詞信息;本實(shí)施例即提供了一種基于搜索關(guān)鍵詞信息與訪問網(wǎng)站信息關(guān)聯(lián)分析的網(wǎng)站信息推薦方法,應(yīng)用本實(shí)施例,例如,當(dāng)用戶搜索一個關(guān)鍵字時,用戶標(biāo)識對應(yīng)的搜索關(guān)鍵詞與訪問網(wǎng)站的關(guān)聯(lián)信息中提取前5個網(wǎng)站推薦給用戶。在本申請的另一種優(yōu)選實(shí)施例中,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的點(diǎn)擊廣告信息;本實(shí)施例即提供了一種基于點(diǎn)擊廣告信息與訪問網(wǎng)站信息關(guān)聯(lián)分析的廣告信息推薦方法,應(yīng)用本實(shí)施例,例如,當(dāng)用戶訪問某個網(wǎng)站時,從用戶標(biāo)識對應(yīng)的訪問網(wǎng)站與點(diǎn)擊廣告信息之間的關(guān)聯(lián)信息提取前5個廣告顯示給用戶。在本申請的另一種優(yōu)選實(shí)施例中,所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第一訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第二訪問網(wǎng)站信息;本實(shí)施例即提供了一種基于第一訪問網(wǎng)站信息與第二網(wǎng)站訪問關(guān)聯(lián)分析的網(wǎng)站信息推薦方法,應(yīng)用本實(shí)施例,例如,當(dāng)用戶訪問一個網(wǎng)站的時候,用戶標(biāo)識對應(yīng)第一訪問網(wǎng)站信息與第二訪問網(wǎng)站信息之間的關(guān)聯(lián)信息中提取前5個網(wǎng)站推薦給用戶。
本實(shí)施例與圖I所示的方法實(shí)施例的不同之處在于,本實(shí)施例通過在多個地理位置部署多個網(wǎng)關(guān)來獲取用戶的跨網(wǎng)網(wǎng)絡(luò)報文,從跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶的行為信息并計算用戶標(biāo)識對應(yīng)的兩個行為之間的關(guān)聯(lián)信息,以此來提高用戶行為關(guān)聯(lián)分析的準(zhǔn)確性,并且,在計算用戶標(biāo)識對應(yīng)的兩個行為之間的關(guān)聯(lián)信息過程中對兩個行為之間的關(guān)聯(lián)信息進(jìn)行排序,針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息,從而為用戶推薦個性化的信息。參考圖3示出了一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法實(shí)施例3的步驟流程圖,具體可以包括以下步驟步驟301 :獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;步驟302 :從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息;其中,所述用戶行為信息中可以包括用戶標(biāo)識;作為本實(shí)施例的一種優(yōu)選示例,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。步驟303 :分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;步驟304 :按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;例如User01,hostOl, timeOl步驟305 :生成所述用戶標(biāo)識與第一用戶行為信息及發(fā)生時間的鍵值對,和/或,所述用戶標(biāo)識與第二用戶行為信息及發(fā)生時間的鍵值對并排序;例如生成的鍵值對,如下所示User01\t hostOl,timeOlUser02\t host02,time03User01\t keyOl,time02排序后的結(jié)果顯示如下User01\t hostOl, timeOlUser01\t keyOl,time02User02\t host02,time03步驟306 :依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;步驟307 :生成所述第一用戶行為信息及第二用戶行為信息與所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次的鍵值對并合并排序;例如,生成的鍵值對如下所示hostOl, key01\t3host02,key03\t8hostOl, key01\t6排序后結(jié)果如下顯示hostOl, key01\t9
host02, key03\t8步驟308 :根據(jù)所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;所述同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;步驟309 :生成第二用戶行為信息與第一用戶行為信息及所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次的鍵值對并排序;例如生成的鍵值對如下顯示key01\t hostOl,9key03\t host02,8key01\t host03,7步驟310 :根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;例如,host03, keyOl, 16, 7, 7/16hostOl, keyOl, 16,9,9/16步驟311 :按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù);例如hostOl, keyOl, 16,9,9/16host03, keyOl, 16, 7, 7/16步驟312 :統(tǒng)計第一用戶行為信息的出現(xiàn)頻率;步驟313 :生成第一用戶行為信息,第一用戶行為信息的出現(xiàn)頻次與第二用戶行為信息,第二用戶行為信息的出現(xiàn)頻次,第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次,所述同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例的鍵值對并排序;例如生成的鍵值對如下顯示sports, sina. com. cn, 16\t 歐洲杯,20,8,0. 4 I 倫敦奧運(yùn),30,6,0. 25 I ····步驟314:針對用戶的第二用戶行為信息,返回從其用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息中,提取的第一用戶行為信息。為使本領(lǐng)域技術(shù)人員更好地理解本申請,以下通過一個具體應(yīng)用的實(shí)例說明本申請的基于用戶行為關(guān)聯(lián)分析的信息推薦方法的過程。所述第一用戶行為信息為用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息為用戶標(biāo)識所對應(yīng)的搜索關(guān)鍵詞信息,基于關(guān)鍵詞信息與訪問網(wǎng)站信息關(guān)聯(lián)分析的訪問網(wǎng)站信息推薦方法的過程(網(wǎng)站-關(guān)鍵詞分析過程)如下Job ( 一個完整的MapReduce作業(yè),用于完成具有特定數(shù)據(jù)處理功能的任務(wù);其中Map是指映射,它是將一整塊數(shù)據(jù)映射成很多小塊進(jìn)行處理用以支持高度并發(fā)的任務(wù);其中分到哪塊又是由Key (鍵)的哈希值來確定的;Reduce是指規(guī)約,以Map的輸出作為輸入,規(guī)約成一個更小的數(shù)據(jù)集)所示I、Jobl :得到每個用戶的一系列上網(wǎng)行為信息,這些信息包括用戶訪問的所有網(wǎng)站和搜索的所有關(guān)鍵詞以及這些行為發(fā)生的時間。從訪問網(wǎng)站的日志信息{(用戶,訪問的網(wǎng)站,訪問時間)}(該Job的Map輸入)得到這個用戶訪問了哪些網(wǎng)站、何時訪問網(wǎng)站的列表信息K用戶,訪問的網(wǎng)站列表,訪問時間列表)}(整個作業(yè)的輸出);從搜索關(guān)鍵詞信息{(用戶,搜索的關(guān)鍵詞,搜索時間)}(也是該Job的Map輸入)得到這個用戶搜索了哪些關(guān)鍵詞以及何時 搜索該關(guān)鍵詞的列表信息K用戶,搜索的關(guān)鍵詞列表,搜索時間列表)}(也是整個作業(yè)的輸出)。該Job的Map輸出是以用戶作為Key,時間和該用戶訪問的網(wǎng)站或搜索的關(guān)鍵詞作為Value的鍵值對;Reduce的輸入就是Map的輸出,在傳遞的過程中按照Key進(jìn)行哈希并排序好。Reduce的輸出即整個作業(yè)的輸出。舉例如下Map的輸出有如下幾行User01\t hostOl, timeOlUser02\t host02, time03User01\t keyOl, time02經(jīng)過哈希后用戶標(biāo)識相同的行輸出到同一個Reduce程序中,并且對用戶標(biāo)識進(jìn)行排序如下User01\t hostOl, timeOlUser01\t keyOl, time02User02\t host02, time03注\t代表Key和Value的分隔符為Tab鍵。2、Job2 :根據(jù)每一個用戶的用戶號進(jìn)行關(guān)聯(lián)得到網(wǎng)站和關(guān)鍵詞的對應(yīng)信息K訪問的網(wǎng)站,搜索的關(guān)鍵詞)};所述對應(yīng)信息即訪問網(wǎng)站與搜索的關(guān)鍵詞的關(guān)聯(lián)度(頻次),可以采取以下算法實(shí)現(xiàn)關(guān)聯(lián)度(頻次)=0. 667+ (6-間隔秒數(shù)/600) /3其中,間隔時間大于I小時不計算其關(guān)聯(lián)度;只有小于等于一小時才計算其關(guān)聯(lián)度,如果時間間隔越小,兩者之間的關(guān)聯(lián)度越大,時間間隔越大,兩者之間的關(guān)聯(lián)度就越小。因?yàn)橐粋€用戶在瀏覽網(wǎng)頁時有時會刷新網(wǎng)頁,在這里我們只計算一次有效點(diǎn)擊,即一個時間段內(nèi)用戶訪問了多次某個網(wǎng)站和搜索了某個關(guān)鍵詞時只算一次。所述關(guān)聯(lián)度表征訪問該網(wǎng)站的人去搜索這個關(guān)鍵詞的概率,通過這個概率值可以反映該關(guān)鍵詞概況這個網(wǎng)站內(nèi)容的程度。所述步驟Job2的Map輸出即訪問的網(wǎng)站、搜索的關(guān)鍵詞以及它們之間的關(guān)聯(lián)度(頻次),舉例如下hostOl, key01\t3host02, key03\t8hostOl, key01\t6
Reduce以此作為輸入,由于在Map的輸出中網(wǎng)站和關(guān)鍵詞這個二元組可能會重復(fù),因此在Reduce階段則合并這個二元組并累計最終的關(guān)聯(lián)度(頻次)。Reduce的輸出如下hostOl, key01\t9host02,key03\t83、Job3:統(tǒng)計訪問網(wǎng)站與搜索的關(guān)鍵詞之間的相關(guān)性,可以得到如下數(shù)據(jù)信息K訪問的網(wǎng)站,搜索的關(guān)鍵詞,關(guān)鍵詞出現(xiàn)的頻次n,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m,兩者的比例 r(m/n))};其中,r反映了這個關(guān)鍵詞在多大程度上與目標(biāo)網(wǎng)站的相關(guān)聯(lián),即訪問某個網(wǎng)站的
人更傾向搜索某些關(guān)鍵詞的程度;所述步驟Job3的Map的輸出是以搜索的關(guān)鍵詞作為Key、剩余的訪問的網(wǎng)站以及頻次等字段作為Value的鍵值對,舉例如下key01\t hostOl,9key03\t host02,8key01\t host03,7Reduce階段則統(tǒng)計出該搜索的關(guān)鍵詞出現(xiàn)的頻次,Reduce的輸出舉例如下hostOl, keyOl, 16,9,9/16host02, key03,8,8,1host03, keyOl, 16, 7, 7/164、Job4 :合并所述步驟Job3的訪問網(wǎng)站相同的信息,并并且統(tǒng)計出該網(wǎng)站出現(xiàn)的頻次,得到如下數(shù)據(jù)信息K訪問的網(wǎng)站,該網(wǎng)站出現(xiàn)的頻次,搜索的關(guān)鍵詞1,關(guān)鍵詞出現(xiàn)的頻次nl,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次ml,兩者的比例rl(ml/nl) |搜索的關(guān)鍵詞2,關(guān)鍵詞出現(xiàn)的頻次n2,網(wǎng)站和關(guān)鍵詞都出現(xiàn)的頻次m2,兩者的比例r2 (m2/n2)…);具體而言,所述Job4的具體實(shí)施步驟如下所示在Map階段中從Job4獲得輸入,對整行進(jìn)行分割,提取訪問的網(wǎng)站并將其作為Key,其他如搜索關(guān)鍵詞和頻次等字段作為Value進(jìn)行輸出;以Map階段的輸出作為Reduce階段的輸入,在此過程中具有相同的Key(訪問的網(wǎng)站)都被映射到某個特定的Reduce中并且會按照Key的字典序進(jìn)行排序,在Reduce階段先抽取出Key,相同的Key放到一起,判斷本行讀取的Key和上一行讀取的Key是否相同;如果本行讀取的Key和上一行讀取的Key相同,則將其關(guān)聯(lián)的Value (搜索的關(guān)鍵詞等字段)加入到一個列表中;否則,則認(rèn)為是新的Key出現(xiàn),先對這個關(guān)鍵詞列表按照關(guān)聯(lián)度進(jìn)行從大到小排序,并將上一行的Key (訪問的網(wǎng)站)和關(guān)聯(lián)該網(wǎng)站的關(guān)鍵詞列表打印出來。最后結(jié)果舉例如下sports, sina. Co m. cn, 16\t 歐洲杯,20,8,0. 4 I 倫敦奧運(yùn),30,6,0. 25 I ····作為本實(shí)施例的一種優(yōu)選示例,根據(jù)上述的根據(jù)關(guān)鍵詞分析網(wǎng)站的過程得到的分析結(jié)果進(jìn)行推薦信息,示例如下當(dāng)用戶搜索一個關(guān)鍵字時,用戶標(biāo)識對應(yīng)的搜索關(guān)鍵詞與訪問網(wǎng)站的關(guān)聯(lián)信息中提取前5個網(wǎng)站推薦給用戶。在具體實(shí)現(xiàn)中,基于點(diǎn)擊廣告信息與訪問網(wǎng)站信息關(guān)聯(lián)分析的廣告信息推薦方法與上例基于搜索關(guān)鍵詞信息與訪問網(wǎng)站信息關(guān)聯(lián)分析的網(wǎng)站信息推薦方法情形一樣,即把用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息作為第一用戶行為信息,把用戶標(biāo)識所對應(yīng)的點(diǎn)擊廣告信息作為第二用戶行為信息,例如,當(dāng)一個用戶訪問新浪體育的時候,不必知道這個用戶的其他信息,只是基于這個用戶訪問了新浪體育這個行為,就知道這個用戶所具有的一些普遍特征,比如說用戶傾向于搜索有關(guān)體育的關(guān)鍵詞,點(diǎn)擊體育相關(guān)的廣告,訪問體育相關(guān)的網(wǎng)站。利用這些已經(jīng)存儲到數(shù)據(jù)庫中的信息,提取出用戶最可能感興趣的5個(自定義)廣告展示出來。在具體實(shí)現(xiàn)中,基于第一訪問網(wǎng)站信息與第二訪問網(wǎng)站信息關(guān)聯(lián)分析的網(wǎng)站信息推薦方法與上例基于搜索關(guān)鍵詞信息與訪問網(wǎng)站信息關(guān)聯(lián)分析的網(wǎng)站信息推薦方法情形一樣,即把用戶標(biāo)識所對應(yīng)的第一訪問網(wǎng)站信息作為第一用戶行為信息,把用戶標(biāo)識所對應(yīng)的第二訪問網(wǎng)站信息作為第二用戶行為信息,例如,當(dāng)一個用戶訪問新浪體育的時候,不必知道這個用戶的其他信息,只是基于這個用戶訪問了新浪體育這個行為,就知道這個用戶所具有的一些普遍特征,比如說用戶傾向于搜索有關(guān)體育的關(guān)鍵詞,點(diǎn)擊體育相關(guān)的廣
告,訪問體育相關(guān)的網(wǎng)站。利用這些已經(jīng)存儲到數(shù)據(jù)庫中的信息,提取出前5個(自己定義)最相關(guān)的網(wǎng)站顯示出來。需要說明的是,對于上述方法實(shí)施例而言,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本申請,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作和模塊并不一定是本申請所必須的。參考圖4示出了本申請的一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置實(shí)施例I的結(jié)構(gòu)框圖,具體可以包括如下模塊跨網(wǎng)網(wǎng)絡(luò)報文獲取模塊401,用于獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;用戶行為信息提取模塊402,用于從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息;其中,所述用戶行為信息包括用戶標(biāo)識,第一用戶行為信息和第二用戶行為信息。關(guān)聯(lián)信息計算模塊403,用于根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;其中,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;關(guān)聯(lián)信息返回模塊404,用于針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。在本申請的一種優(yōu)選實(shí)施例中,所述關(guān)聯(lián)信息計算模塊403包括如下子模塊時間獲取子模塊,用于分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;用戶行為組織子模塊,用于按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;頻次計算子模塊,用于依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;
信息統(tǒng)計子模塊,用于根據(jù)所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;關(guān)聯(lián)信息獲取子模塊,用于根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息。在本申請的一種優(yōu)選實(shí)施例中,所述關(guān)聯(lián)信息返回模塊404包括如下子模塊排序子模塊,用于按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù);第一返回子模塊,用于針對用戶的第二用戶行為信息,返回所述提取的第一用戶行為信息。參考圖5示出了本申請的一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置實(shí)施例2的結(jié)構(gòu)框圖,具體可以包括如下模塊跨網(wǎng)網(wǎng)絡(luò)報文獲取模塊501,用于獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;用戶行為信息提取模塊502,用于從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息;其中,所述用戶行為信息包括用戶標(biāo)識,第一用戶行為信息和第二用戶行為信息。關(guān)聯(lián)信息計算模塊503,用于根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;其中,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;關(guān)聯(lián)信息返回模塊504,用于針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。在本申請的一種優(yōu)選實(shí)施例中,所述關(guān)聯(lián)信息計算模塊503包括如下子模塊時間獲取子模塊,用于分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間;用戶行為組織子模塊,用于按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間;頻次計算子模塊,用于依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次;信息統(tǒng)計子模塊,用于根據(jù)所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次;第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次;所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例;關(guān)聯(lián)信息獲取子模塊,用于根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息;排序子模塊,用于按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù);在本申請的一種優(yōu)選實(shí)施例中,所述關(guān)聯(lián)信息返回模塊504包括如下子模塊第二返回子模塊,用于針對用戶的第二用戶行為信息,返回從其用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息中,提取的第一用戶行為信息。本說明書中的各個實(shí)施例均采用遞進(jìn)的方式描述,每個實(shí)施例重點(diǎn)說明的都是與
其他實(shí)施例的不同之處,各個實(shí)施例之間相同相似的部分互相參見即可。對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實(shí)體或者操作與另一個實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請的實(shí)施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本申請可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實(shí)施的計算機(jī)程序產(chǎn)品的形式。本申請是參照根據(jù)本申請實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的系統(tǒng)。這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令系統(tǒng)的制造品,該指令系統(tǒng)實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本申請的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本申請范圍的所有變更和修改。以上對本申請所提供的一種用戶行為關(guān)聯(lián)分析方法和一種用戶行為關(guān)聯(lián)分析系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本申請的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本
說明書內(nèi)容不應(yīng)理解為對本申請的限制。
權(quán)利要求
1.一種基于用戶行為關(guān)聯(lián)分析的信息推薦方法,其特征在于,包括 獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文; 從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息,其中,所述用戶行為信息包括用戶標(biāo)識; 根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息; 針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息; 所述根據(jù)用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息的步驟包括 分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間; 按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間; 依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次; 根據(jù)所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息 第二用戶行為信息的出現(xiàn)頻次; 第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次; 所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例; 根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信肩、O
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述針對用戶的某一行為信息返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息的步驟包括 按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù); 針對用戶的第二用戶行為信息,返回所述提取的第一用戶行為信息。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息包括用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息; 所述根據(jù)用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息的步驟包括 分別獲取所述第一用戶行為信息的發(fā)生時間和第二用戶行為信息的發(fā)生時間; 按照所述用戶標(biāo)識分別組織對應(yīng)的第一用戶行為信息及發(fā)生時間,以及,對應(yīng)的第二用戶行為信息及發(fā)生時間; 依據(jù)發(fā)生時間組織關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息,并計算所述關(guān)聯(lián)的第一用戶行為信息與第二用戶行為信息的出現(xiàn)頻次; 根據(jù)所述關(guān)聯(lián)的第一用戶行為信息和第二用戶行為信息的出現(xiàn)頻次,統(tǒng)計如下信息第二用戶行為信息的出現(xiàn)頻次; 第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次; 所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例; 根據(jù)所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例,獲取用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息; 按照所述第一用戶行為信息和第二用戶行為信息同時出現(xiàn)的頻次與第二用戶行為信息出現(xiàn)頻次的比例從大到小排序,提取排序在前的N個與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息,所述N為正整數(shù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述針對用戶的某一行為信息返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息的步驟包括 針對用戶的第二用戶行為信息,返回從其用戶標(biāo)識對應(yīng)的與所述第二用戶行為信息關(guān)聯(lián)的第一用戶行為信息中,提取的第一用戶行為信息。
7.根據(jù)權(quán)利要求2或3或4或5或6所示的方法,其特征在于, 所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的搜索關(guān)鍵詞信息; 或者, 所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的點(diǎn)擊廣告信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息; 或者, 所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第一訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第二訪問網(wǎng)站信息。
8.一種基于用戶行為關(guān)聯(lián)分析的信息推薦裝置,其特征在于,包括如下模塊 跨網(wǎng)網(wǎng)絡(luò)報文獲取模塊,用于獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文; 用戶行為信息提取模塊,用于從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息,其中,所述用戶行為信息包括用戶標(biāo)識; 關(guān)聯(lián)信息計算模塊,用于根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息; 關(guān)聯(lián)信息返回模塊,用于針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述用戶行為信息包括第一用戶行為信息和第二用戶行為信息。
10.根據(jù)權(quán)利要求8或9所示的裝置,其特征在于, 所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的搜索關(guān)鍵詞信息; 或者, 所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的點(diǎn)擊廣告信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的訪問網(wǎng)站信息; 或者, 所述第一用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第一訪問網(wǎng)站信息,所述第二用戶行為信息還包括用戶標(biāo)識所對應(yīng)的第二訪問網(wǎng)站信息。
全文摘要
本申請?zhí)峁┝艘环N基于用戶行為關(guān)聯(lián)分析的信息推薦方法及裝置,其中所述方法包括獲取跨網(wǎng)網(wǎng)絡(luò)報文,所述跨網(wǎng)網(wǎng)絡(luò)報文為從預(yù)先部署的多個網(wǎng)關(guān)中獲取的網(wǎng)絡(luò)報文;從所述跨網(wǎng)網(wǎng)絡(luò)報文中提取用戶行為信息,其中,所述用戶行為信息包括用戶標(biāo)識;根據(jù)所述用戶行為信息計算所述用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息;針對用戶的某一行為信息,返回從其用戶標(biāo)識對應(yīng)的行為之間的關(guān)聯(lián)信息中提取的關(guān)聯(lián)的相應(yīng)行為信息。本申請可以獲取用戶的全方位上網(wǎng)行為,提高用戶行為關(guān)聯(lián)分析的準(zhǔn)確性,從而為用戶推薦個性化的信息。
文檔編號G06F17/30GK102855309SQ201210299810
公開日2013年1月2日 申請日期2012年8月21日 優(yōu)先權(quán)日2012年8月21日
發(fā)明者肖燕京, 劉書良, 羅峰, 黃蘇支, 李娜 申請人:億贊普(北京)科技有限公司