欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種購物行為的預(yù)測(cè)方法及裝置的制造方法

文檔序號(hào):10512814閱讀:386來源:國知局
一種購物行為的預(yù)測(cè)方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種購物行為的預(yù)測(cè)方法,包括:為不同購物階段選取不同目標(biāo)用戶,從所選取目標(biāo)用戶的用戶行為日志中獲取樣本數(shù)據(jù);分別從各購物階段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一特征集;利用決策樹模型分別訓(xùn)練不同購物階段的第一特征集,通過多次迭代得到特征組合,作為第二特征集;以及分別使用各購物階段的第一特征集和第二特征集訓(xùn)練預(yù)先建立的機(jī)器學(xué)習(xí)模型,其中機(jī)器學(xué)習(xí)模型用于預(yù)測(cè)用戶的購物需求度;以及根據(jù)不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用戶所屬購物階段。本發(fā)明還提供了相應(yīng)的購物行為的預(yù)測(cè)裝置。
【專利說明】
一種購物行為的預(yù)測(cè)方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及對(duì)用戶購物行為的預(yù)測(cè)方法及裝置。
【背景技術(shù)】
[0002] 用戶在未來一段時(shí)間內(nèi)對(duì)特定商品的購物需求的預(yù)估,對(duì)于互聯(lián)網(wǎng)企業(yè)特別是電 商類企業(yè)的個(gè)性化商業(yè)決策和精細(xì)化廣告投放決策意義重大。并且,在很多應(yīng)用場(chǎng)景下,也 需要實(shí)時(shí)估算用戶的購物需求:例如,個(gè)性化廣告中的優(yōu)質(zhì)流量售賣、保量CPM(Cost Per Mille,每千人成本)廣告的保量策略、特別是電商類網(wǎng)站在流量增大時(shí),急需對(duì)用戶進(jìn)行個(gè) 性化的導(dǎo)購策略以及市場(chǎng)定位,從而提高用戶的購物樂趣和滿意度。這對(duì)于具有海量數(shù)據(jù) 的互聯(lián)網(wǎng)公司來說是一個(gè)難題。
[0003] 目前行業(yè)中一般根據(jù)購物種類、搜索記錄、瀏覽記錄、相似推薦等數(shù)據(jù),對(duì)用戶進(jìn) 行購物意愿的預(yù)測(cè)。在算法實(shí)現(xiàn)上,一種實(shí)現(xiàn)方式是采用相似性分析方法對(duì)用戶的購物意 愿進(jìn)行預(yù)估,例如利用用戶的歷史喜好信息計(jì)算用戶之間的距離,然后利用目標(biāo)用戶的最 近鄰居用戶對(duì)商品評(píng)價(jià)的加權(quán)評(píng)價(jià)值來預(yù)測(cè)目標(biāo)用戶對(duì)特定商品的喜好程度,但是這種方 法會(huì)存在稀疏問題和可擴(kuò)展問題,也不適用于用戶對(duì)特定商品的購買力的預(yù)估。另外一種 實(shí)現(xiàn)方式是采用線性模型(LR)進(jìn)行建模和預(yù)估,線性模型效率相對(duì)較高,但是線性模型對(duì) 非線性關(guān)系的把握比較差,并且線性模型無法深入數(shù)據(jù)細(xì)部,對(duì)特征的選擇和提取很麻煩, 需要大量相關(guān)行業(yè)的知識(shí),故而預(yù)測(cè)模型準(zhǔn)確率難以把控。

【發(fā)明內(nèi)容】

[0004] 為此,本發(fā)明提供一種新的購物行為的預(yù)測(cè)方案,以力圖至少解決上面至少一個(gè) 問題。
[0005] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種購物行為的預(yù)測(cè)方法,包括:為不同購物階段 選取不同目標(biāo)用戶,從所選取目標(biāo)用戶的用戶行為日志中獲取樣本數(shù)據(jù);分別從各購物階 段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一特征集;利用決策樹模型分別訓(xùn)練不同購物階段 的第一特征集,通過多次迭代得到特征組合,作為第二特征集;以及分別使用各購物階段的 第一特征集和第二特征集訓(xùn)練預(yù)先建立的機(jī)器學(xué)習(xí)模型,其中機(jī)器學(xué)習(xí)模型用于預(yù)測(cè)用戶 的購物需求度;以及根據(jù)不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用戶所屬購物階段。
[0006] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,購物階段包括:關(guān)注階段、興趣階段、 意向階段、和行動(dòng)階段。
[0007] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,根據(jù)不同購物階段的機(jī)器學(xué)習(xí)模型 確定待測(cè)用戶所屬購物階段的步驟包括:獲取待測(cè)用戶的用戶行為日志;執(zhí)行上述提取、訓(xùn) 練第一特征集的步驟,得到待測(cè)用戶的第一特征集和第二特征集;以及按照預(yù)定順序?qū)⒋?測(cè)用戶的第一特征集和第二特征集輸入某一購物階段的機(jī)器學(xué)習(xí)模型,預(yù)測(cè)該待測(cè)用戶是 否屬于該購物階段。
[0008] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,預(yù)定順序是:行動(dòng)階段、意向階段、關(guān) 注階段、興趣階段。
[0009] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,根據(jù)不同的購物階段選取不同目標(biāo) 用戶的步驟包括:根據(jù)不同購物階段的業(yè)務(wù)場(chǎng)景,為不同購物階段選取不同的用戶作為目 標(biāo)用戶。
[0010] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,對(duì)于行動(dòng)階段,選取有直接購物行為 的用戶作為目標(biāo)用戶;和對(duì)于意向階段,選取有銷售咨詢行為的用戶作為目標(biāo)用戶;對(duì)于關(guān) 注階段,選取留言、分享行為集中的用戶作為目標(biāo)用戶;和對(duì)于興趣階段,選取瀏覽、搜索、 收藏行為集中的用戶作為目標(biāo)用戶。
[0011] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,第一特征集包括指向用戶特征的用 戶瀏覽行為特征、用戶購物意愿特征、預(yù)定頁面交互行為特征,以及指向用戶訪問對(duì)象特征 的文章文本內(nèi)容特征。
[0012] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,利用決策樹模型訓(xùn)練第一特征集,通 過多次迭代得到特征組合的步驟包括:將第一特征集作為初始輸入?yún)?shù)構(gòu)造決策樹模型; 每迭代計(jì)算一次,就在減少殘差的梯度方向上建立新的決策樹模型;經(jīng)多次迭代計(jì)算后,將 最終決策樹模型中各葉子節(jié)點(diǎn)的值作為特征組合中的元素值,得到特征組合;以及將多個(gè) 特征組合構(gòu)成第二特征集。
[0013] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,決策樹模型是GBDT模型。
[0014]可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,特征組合的個(gè)數(shù)L為:L=(2~d-l)*m, 其中,d代表決策樹深度,m代表決策樹數(shù)量。
[0015]可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,第二特征集包括銷售線索類特征、廣 告頁面交互行為類特征、預(yù)定頁面交互行為類特征。
[0016]可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,機(jī)器學(xué)習(xí)模型為Factorization Machines(FM)模型:
[0018] 其中,xi為第i個(gè)特征項(xiàng),wo為全局偏移參數(shù),wi為特征項(xiàng)xi的參數(shù),Vi為xi特征項(xiàng)的 分解向量參數(shù),η為第一特征集和第二特征集中特征項(xiàng)總數(shù),j^X:)為購物需求度預(yù)測(cè)值。
[0019] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)方法中,從所選擇目標(biāo)用戶的用戶行為日志 中獲取樣本數(shù)據(jù)的步驟還包括步驟:實(shí)時(shí)獲取用戶行為日志,定期更新樣本數(shù)據(jù)。
[0020] 根據(jù)本發(fā)明的又一個(gè)方面,提供一種購物行為的預(yù)測(cè)裝置,包括:數(shù)據(jù)采集模塊, 適于為不同購物階段選取不同目標(biāo)用戶,從所選取目標(biāo)用戶的用戶行為日志中獲取樣本數(shù) 據(jù);特征提取模塊,適于分別從各購物階段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一特征集; 第一訓(xùn)練模塊,適于利用決策樹模型分別訓(xùn)練不同購物階段的第一特征集,通過多次迭代 得到特征組合,作為第二特征集;第二訓(xùn)練模塊,適于分別使用各購物階段的第一特征集和 第二特征集訓(xùn)練預(yù)先建立的機(jī)器學(xué)習(xí)模型,其中機(jī)器學(xué)習(xí)模型用于預(yù)測(cè)用戶的購物需求 度;以及分類判斷模塊,適于根據(jù)不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用戶所屬購物階 段。
[0021] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,購物階段包括:關(guān)注階段、興趣階段、 意向階段、和行動(dòng)階段。
[0022] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,數(shù)據(jù)采集模塊還適于獲取待測(cè)用戶 的用戶行為日志;特征提取模塊還適于提取待測(cè)用戶的第一特征集;第一訓(xùn)練模塊還適于 訓(xùn)練所述第一特征集,得到待測(cè)用戶的第二特征集;分類判斷模塊還適于按照預(yù)定順序?yàn)?待測(cè)用戶選擇相應(yīng)購物階段的機(jī)器學(xué)習(xí)模型、以及根據(jù)第二訓(xùn)練模塊預(yù)測(cè)的購物需求度預(yù) 測(cè)該待測(cè)用戶是否屬于相應(yīng)購物階段;以及第二訓(xùn)練模塊還適于根據(jù)所選定的機(jī)器學(xué)習(xí)模 型、以及第一特征集和第二特征集預(yù)測(cè)該待測(cè)用戶的購物需求度。
[0023] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,預(yù)定順序是:行動(dòng)階段、意向階段、關(guān) 注階段、興趣階段。
[0024] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,數(shù)據(jù)采集模塊還包括:選擇子單元, 適于根據(jù)不同購物階段的業(yè)務(wù)場(chǎng)景,為不同購物階段選取不同的用戶作為目標(biāo)用戶。
[0025] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,選擇子單元適于選取有直接購物行 為的用戶作為行動(dòng)階段的目標(biāo)用戶、選取有銷售咨詢行為的用戶作為意向階段的目標(biāo)用 戶、選取留言、分享行為集中的用戶作為關(guān)注階段的目標(biāo)用戶;以及選取瀏覽、搜索、收藏行 為集中的用戶作為興趣階段的目標(biāo)用戶。
[0026] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,第一特征集包括指向用戶特征的用 戶瀏覽行為特征、用戶購物意愿特征、預(yù)定頁面交互行為特征,以及指向用戶訪問對(duì)象特征 的文章文本內(nèi)容特征。
[0027] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,第一訓(xùn)練模塊包括:初始化子單元, 適于將第一特征集作為初始輸入?yún)?shù)構(gòu)造決策樹模型;回歸迭代子單元,適于執(zhí)行多次迭 代計(jì)算,其中每迭代計(jì)算一次,就在減少殘差的梯度方向上建立新的決策樹模型;特征獲取 子單元,適于將最終決策樹模型中各葉子節(jié)點(diǎn)的值作為特征組合中的元素值,得到特征組 合,并將多個(gè)特征組合構(gòu)成第二特征集。
[0028]可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,決策樹模型是GBDT模型。
[0029] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,特征組合的個(gè)數(shù)L為:L=(2~d_l)*m, 其中,d代表決策樹深度,m代表決策樹數(shù)量。
[0030] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,第二特征集包括銷售線索類特征、廣 告頁面交互行為類特征、預(yù)定頁面交互行為類特征。
[0031]可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,機(jī)器學(xué)習(xí)模型為Factorization Machines(FM)模型:
[0033] 其中,xi為第i個(gè)特征項(xiàng),wo為全局偏移參數(shù),wi為特征項(xiàng)xi的參數(shù),Vi為xi特征項(xiàng)的 分解向量參數(shù),η為第一特征集和第二特征集中特征項(xiàng)總數(shù),jHx:)為購物需求度預(yù)測(cè)值。
[0034] 可選地,根據(jù)本發(fā)明的購物行為預(yù)測(cè)裝置中,數(shù)據(jù)采集模塊還適于實(shí)時(shí)獲取用戶 行為日志,定期更新樣本數(shù)據(jù)。
[0035]根據(jù)本發(fā)明的購物行為預(yù)測(cè)方案,首先將用戶的購物需求度劃分了四個(gè)階段:關(guān) 注階段、興趣階段、意向階段、和行動(dòng)階段;然后具體根據(jù)每個(gè)購物階段的業(yè)務(wù)場(chǎng)景,選取不 同的目標(biāo)用戶分別作為四個(gè)購物階段的樣本數(shù)據(jù);再進(jìn)行后續(xù)的提取特征、訓(xùn)練預(yù)測(cè)模型 步驟。購物階段的劃分,有利于樣本的選取,保證樣本數(shù)據(jù)的精確,使得后續(xù)的特征提取和 預(yù)測(cè)都更加準(zhǔn)確。
[0036] 再者,本方案采用GBDT+FM的方式對(duì)用戶的購物需求進(jìn)行預(yù)測(cè),把決策樹(GBDT模 型)的路徑直接作為FM模型的輸入特征使用,省去了人工尋找特征、特征組合的過程,并且 還能充分挖掘不同特征之間的關(guān)系,這就在確保預(yù)測(cè)模型準(zhǔn)確率的同時(shí),提高了模型訓(xùn)練 的效率。以及,本發(fā)明的技術(shù)方案通過定期更新樣本數(shù)據(jù),對(duì)新增加的數(shù)據(jù)進(jìn)行及時(shí)訓(xùn)練, 也可以提高模型的預(yù)測(cè)準(zhǔn)確率。
【附圖說明】
[0037] 為了實(shí)現(xiàn)上述以及相關(guān)目的,本文結(jié)合下面的描述和附圖來描述某些說明性方 面,這些方面指示了可以實(shí)踐本文所公開的原理的各種方式,并且所有方面及其等效方面 旨在落入所要求保護(hù)的主題的范圍內(nèi)。通過結(jié)合附圖閱讀下面的詳細(xì)描述,本公開的上述 以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯。遍及本公開,相同的附圖標(biāo)記通常指代相同的 部件或元素。
[0038] 圖1示出了根據(jù)本發(fā)明實(shí)施例的購物行為預(yù)測(cè)方法100的流程圖;
[0039]圖2示出了根據(jù)本發(fā)明實(shí)施例的購物行為預(yù)測(cè)裝置200的框圖;以及
[0040] 圖3示出了根據(jù)本發(fā)明實(shí)施例的利用GBDT模型訓(xùn)練第一特征集的一個(gè)示例。
【具體實(shí)施方式】
[0041] 下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例 所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0042] 圖1示出了根據(jù)本發(fā)明實(shí)施例的購物行為預(yù)測(cè)方法100的流程圖。該方法始于步驟 S110,在本步驟中,為不同購物階段選取不同目標(biāo)用戶,從所選取目標(biāo)用戶的用戶行為日志 中獲取樣本數(shù)據(jù)。
[0043] 分析發(fā)現(xiàn),對(duì)于購物行為預(yù)測(cè)模型來說,用戶定向是模型中很重要的算法模塊。通 過收集用戶數(shù)據(jù)、分析用戶意圖、區(qū)分用戶類型、定向用戶興趣,向用戶呈現(xiàn)真正有效的廣 告信息,幫客戶尋找潛在消費(fèi)的目標(biāo)群體,也為平臺(tái)實(shí)現(xiàn)廣告資源的優(yōu)化配置。
[0044] 因此在本購物行為預(yù)測(cè)方法中,采用劃分購物階段的方式來定向用戶。具體地,通 過用戶在電商網(wǎng)站查詢、發(fā)布等行為,識(shí)別預(yù)估用戶是否已經(jīng)購買某物品、購買了哪個(gè)品 牌、是否有購物的意愿等,從而預(yù)測(cè)用戶的購物意愿,為不同用戶提供定向服務(wù)。
[0045] 根據(jù)一種實(shí)現(xiàn)方式,按照銷售漏斗模型,將購物階段分為關(guān)注階段、興趣階段、意 向階段、和行動(dòng)階段。根據(jù)每個(gè)階段的業(yè)務(wù)場(chǎng)景,對(duì)4個(gè)購物階段(按購物意愿從強(qiáng)到弱排 序)定義如下:
[0046] 行動(dòng)階段:指有明確購物意愿、有明確選項(xiàng)、近期會(huì)轉(zhuǎn)化行動(dòng);
[0047] 意向階段:指有明確購物意愿、有多個(gè)備選項(xiàng)、轉(zhuǎn)化周期不確定;
[0048] 興趣階段:指無明確購物意愿、有多個(gè)備選項(xiàng)、無轉(zhuǎn)化預(yù)期;
[0049] 關(guān)注階段:指無明確購物意愿、無明確選項(xiàng)、無轉(zhuǎn)化預(yù)期。
[0050] 為上述4個(gè)購物階段選取不同的目標(biāo)用戶,從該用戶的用戶行為日志(一般選取用 戶前一個(gè)月內(nèi)的行為數(shù)據(jù))中獲取樣本數(shù)據(jù),作為提取特征數(shù)據(jù)的初始數(shù)據(jù)。根據(jù)本發(fā)明的 一個(gè)實(shí)施例,根據(jù)用戶在網(wǎng)站的瀏覽、搜索、點(diǎn)擊、收藏、留言、分享、支付等行為,選取有直 接購物行為的用戶作為行動(dòng)階段的目標(biāo)用戶;選取有銷售咨詢行為的用戶作為意向階段的 目標(biāo)用戶;選取留言、分享行為集中的用戶作為關(guān)注階段的目標(biāo)用戶,例如某些用戶在購物 平臺(tái)的論壇里較為活躍,可以認(rèn)為此類用戶屬于關(guān)注階段的目標(biāo)用戶;還有,選取瀏覽、搜 索、收藏行為集中的用戶作為興趣階段的目標(biāo)用戶,例如某用戶對(duì)某一類產(chǎn)品的搜索、收藏 行為較為集中,那么可以認(rèn)為該用戶對(duì)這類產(chǎn)品感興趣,屬于興趣階段的目標(biāo)用戶。
[0051] 對(duì)購物階段進(jìn)行這樣的劃分,可以有目的地選取目標(biāo)用戶,保證測(cè)試階段的樣本 數(shù)據(jù)更加準(zhǔn)確,進(jìn)而后續(xù)的特征提取和預(yù)測(cè)也能更精確。
[0052] 隨后在步驟S120中,分別從各購物階段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一特 征集。其中,第一特征集包括指向用戶特征的用戶瀏覽行為特征、用戶購物意愿特征(例如, 用戶有詢價(jià)、預(yù)定、支付等行為的,都認(rèn)為是反應(yīng)了用戶的購物意愿)、預(yù)定頁面交互行為特 征,以及指向用戶訪問對(duì)象特征的文章文本內(nèi)容特征。對(duì)于不同的購物階段,第一特征集會(huì) 有所不同。以購車類電商平臺(tái)為例,例如在汽車之家的購車平臺(tái)上,有廣告專題頁面、購車 頁面、經(jīng)銷商頁面等,設(shè)置關(guān)注預(yù)定頁面(例如購車頁面)交互行為是考慮到,一般用戶在諸 如購車頁面等網(wǎng)頁上的預(yù)訂、詢價(jià)等行為,代表了用戶具有強(qiáng)烈的購物意愿、或者已經(jīng)轉(zhuǎn)化 為行動(dòng),所以在本實(shí)施例中會(huì)提取預(yù)定頁面上的交互行為特征。
[0053] 根據(jù)一種實(shí)現(xiàn)方式,第一特征集包括但不限于:
[0054] 1)廣告專題頁面的銷售線索提交行為(包括詢價(jià)、試駕、置換、撥打電話等)
[0055] 2)經(jīng)銷商頁面的銷售線索提交行為(包括詢價(jià)、試駕、置換、撥打電話等)
[0056] 3)購車頁面的銷售線索提交行為(包括預(yù)訂、支付訂金、搶購、撥打電話等)
[0057] 4)購車頁面的瀏覽及交互行為(包括頁面瀏覽、咨詢留言、按鈕點(diǎn)擊等)
[0058] 5)降價(jià)排行榜頁面的瀏覽及交互行為(包括頁面瀏覽、搜索、點(diǎn)擊等)
[0059] 6)報(bào)價(jià)相關(guān)的瀏覽及交互行為(包括產(chǎn)品庫報(bào)價(jià)、車系頻道報(bào)價(jià)、車主價(jià)格頁、搜 索行情等位置的瀏覽、點(diǎn)擊、留言、分享等)
[0060] 7)經(jīng)銷商頁面的瀏覽及交互行為(包括頁面瀏覽、點(diǎn)擊等)
[0061] 8)車型對(duì)比功能模塊的使用行為(包括對(duì)比結(jié)果、點(diǎn)擊等)
[0062] 9)購車計(jì)算器功能模塊的使用行為(包括計(jì)算結(jié)果、點(diǎn)擊等)
[0063] 10)廣告相關(guān)的行為(包括廣告的點(diǎn)擊、交互等)
[0064] 11)油耗相關(guān)的瀏覽及交互行為(包括首頁查油耗、個(gè)人中心查油耗等)
[0065] 12) 口碑頁面的瀏覽及交互行為(包括頁面瀏覽、點(diǎn)擊、收藏、分享等)
[0066] 13)報(bào)價(jià)相關(guān)的瀏覽及交互行為(包括產(chǎn)品庫報(bào)價(jià)、車系頻道報(bào)價(jià)、車主價(jià)格頁等 位置的瀏覽、點(diǎn)擊、留言、分享等)
[0067] 14)配置相關(guān)的瀏覽及交互行為(包括車系頻道參數(shù)配置、車型詳解等位置的瀏 覽、點(diǎn)擊等)
[0068] 15)保養(yǎng)相關(guān)的瀏覽及交互行為(包括產(chǎn)品庫保養(yǎng)的瀏覽、搜索、點(diǎn)擊等)
[0069] 16)詳情相關(guān)的瀏覽及交互行為(包括搜索綜合、搜索知道、車系綜述等位置的瀏 覽、點(diǎn)擊等)
[0070] 17)文章相關(guān)的瀏覽及交互行為(包括資訊、評(píng)測(cè)、說客、搜索文章等位置的瀏覽、 點(diǎn)擊、收減、留g、分孚等)
[0071] 18)視頻相關(guān)的瀏覽及交互行為(包括汽車視頻、產(chǎn)品庫視頻、搜索視頻等位置的 瀏覽、點(diǎn)擊、播放、收藏、分享等)
[0072] 19)圖片相關(guān)的瀏覽及交互行為(包括產(chǎn)品庫圖片、車系頻道圖片位置的瀏覽、點(diǎn) 擊、分孚等)
[0073] 20)論壇相關(guān)的瀏覽及交互行為(包括搜索論壇、論壇等位置的瀏覽、搜索、點(diǎn)擊、 收減帖子、留目、分早等)
[0074]應(yīng)當(dāng)了解,本發(fā)明對(duì)于從用戶行為日志中提取特征的方法并不做限制,任何特征 提取方法都可以與本實(shí)施例相結(jié)合使用。
[0075]隨后在步驟S130中,利用決策樹模型分別訓(xùn)練不同購物階段的第一特征集,通過 多次迭代得到特征組合,作為相應(yīng)購物階段的第二特征集。這樣,每個(gè)購物階段就都具有了 自己的第一特征集和第二特征集。
[0076] 在本實(shí)施例中,決策樹模型采用GBDT模型。GBDT(Gradient Boost Decision Tree)是一種常用的非線性模型,它基于集成學(xué)習(xí)中的boosting思想,每次迭代都在減少殘 差的梯度方向新建立一顆決策樹,迭代多少次就會(huì)生成多少顆決策樹。相對(duì)于線性模型, GBDT模型不需要對(duì)特征值進(jìn)行離散化,并能夠找出多種有區(qū)分性的特征以及特征組合。
[0077] 更進(jìn)一步地說,由GBDT構(gòu)造的新特征向量是取值0/1的,向量的每個(gè)元素對(duì)應(yīng)于 GBDT模型中樹的葉子結(jié)點(diǎn)。當(dāng)一個(gè)樣本點(diǎn)通過某棵樹最終落在這棵樹的一個(gè)葉子結(jié)點(diǎn)上, 那么在新特征向量中這個(gè)葉子結(jié)點(diǎn)對(duì)應(yīng)的元素值為1,而這棵樹的其他葉子結(jié)點(diǎn)對(duì)應(yīng)的元 素值為0。新特征向量的長度等于GBDT模型里所有樹包含的葉子結(jié)點(diǎn)數(shù)之和。
[0078] 由于樹的每條路徑,是通過最小化均方差等方法最終分割出來的有區(qū)分性路徑, 根據(jù)該路徑得到的特征、特征組合都相對(duì)有區(qū)分性,效果理論上不會(huì)亞于人工經(jīng)驗(yàn)的處理 方式。
[0079] 舉例說明。如圖3示出了利用GBDT模型訓(xùn)練第一特征集的示例。圖3中有兩棵樹,其 中第一棵樹(左邊)有3個(gè)葉子結(jié)點(diǎn),第二棵樹(右邊)有2個(gè)葉子節(jié)點(diǎn)。每一個(gè)葉子節(jié)點(diǎn)可以 看作其所有父節(jié)點(diǎn)的特征組合,葉子節(jié)點(diǎn)的特征即為特征組合后的特征。對(duì)于一個(gè)輸入樣 本點(diǎn)X,如果它在第一棵樹最后落在其中的第二個(gè)葉子結(jié)點(diǎn),而在第二棵樹里最后落在其中 的第一個(gè)葉子結(jié)點(diǎn)。那么通過GBDT獲得的新特征向量就是[0,1,0,1,0 ],其中向量中的前三 位對(duì)應(yīng)第一棵樹的3個(gè)葉子結(jié)點(diǎn),后兩位對(duì)應(yīng)第二棵樹的2個(gè)葉子結(jié)點(diǎn)。
[0080] 結(jié)合圖3的描述,在本步驟中,先將步驟S120中得到的第一特征集作為初始輸入?yún)?數(shù)構(gòu)造決策樹模型;在GBDT迭代計(jì)算的過程中,每迭代一次,就會(huì)建立一棵新的決策樹;經(jīng) 多次迭代計(jì)算后,將最終GBDT決策樹模型中各葉子節(jié)點(diǎn)的值作為特征組合中的元素值,得 到特征組合;最后,將多個(gè)所述特征組合構(gòu)成第二特征集。
[0081 ]在本實(shí)施例中,設(shè)置決策樹數(shù)量為m= 30,深度d = 5,那么每一個(gè)樣本會(huì)生成30個(gè) 特征,經(jīng)過GBDT模型訓(xùn)練后,生成的特征組合數(shù)量為:
[0082] L = (2'd-l )*m = 930
[0083] 例如對(duì)于行動(dòng)階段的預(yù)測(cè)模型,經(jīng)過GBDT模型后生成的第二特征集多為"銷售線 索類特征" "廣告頁面交互行為類特征""預(yù)定頁面交互行為類特征",這與后臺(tái)用戶分析工 程師分析后得到的購物需求強(qiáng)的用戶行為相近,說明本GBDT模型輸出的特征組合結(jié)果(也 就是第二特征集)具有可信性。
[0084] 隨后在步驟S140中,分別使用各購物階段的第一特征集和第二特征集訓(xùn)練預(yù)先建 立的機(jī)器學(xué)習(xí)模型,其中該機(jī)器學(xué)習(xí)模型用來預(yù)測(cè)用戶的購物需求度。也就是說,將各購物 階段的第一特征集和第二特征集輸入到各購物階段的機(jī)器學(xué)習(xí)模型中,由其輸出對(duì)用戶購 物需求度的預(yù)測(cè)結(jié)果。
[0085] 這里,可以采用線性模型或者非線性模型對(duì)用戶的購物需求度進(jìn)行預(yù)測(cè),本發(fā)明 對(duì)此并不做限制。
[0086] 由于FM(Factorization Machines)模型與其他機(jī)器學(xué)習(xí)模型相比,在CTR(Click_ Through-Rate,點(diǎn)擊通過率)預(yù)估、用戶預(yù)估等方面的應(yīng)用上優(yōu)勢(shì)明顯。尤其對(duì)于廣告等行 為來說,用戶行為較為稀疏,SVM(在復(fù)雜的非線性核空間上)通過稀疏的數(shù)據(jù)集合,無法學(xué) 習(xí)到可靠的分類超平面。與之相比,F(xiàn)M可以在高度稀疏的特征集合上估計(jì)出可靠的參數(shù);并 且算法實(shí)現(xiàn)中容易并行化,可以在線性的時(shí)間內(nèi)進(jìn)行訓(xùn)練和預(yù)測(cè)。
[0087]因此,在本發(fā)明的實(shí)施例中,機(jī)器學(xué)習(xí)模型選擇FM模型:
[0089] 其中,xi為第i個(gè)特征項(xiàng),wo為全局偏移參數(shù),wi為特征項(xiàng)xi的參數(shù),Vi為xi特征項(xiàng)的 分解向量參數(shù),n為第一特征集和第二特征集中特征項(xiàng)總數(shù),j)(X)為購物需求度預(yù)測(cè)值。
[0090] 隨后在步驟S150中,根據(jù)不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用戶所屬購物階 段。
[0091] 通過步驟S110到S140,就可以初步完成預(yù)測(cè)模型的訓(xùn)練階段,建立起用戶購物行 為預(yù)測(cè)模型。在測(cè)試階段,當(dāng)有待測(cè)用戶輸入時(shí),獲取待測(cè)用戶的用戶行為日志,執(zhí)行提取 第一特征集(同步驟S120)、訓(xùn)練第一特征集(同步驟S130)的步驟,得到待測(cè)用戶的第一特 征集和第二特征集;再按照預(yù)定順序?qū)⒋郎y(cè)用戶的第一特征集和第二特征集輸入某一購物 階段的機(jī)器學(xué)習(xí)模型,預(yù)測(cè)該待測(cè)用戶是否屬于該購物階段。
[0092] 根據(jù)本發(fā)明的實(shí)施例,預(yù)定順序從前往后依次是:行動(dòng)階段、意向階段、關(guān)注階段、 興趣階段。故先將待測(cè)用戶的第一、第二特征集輸入經(jīng)過訓(xùn)練的行動(dòng)階段的機(jī)器學(xué)習(xí)模型 中,得到其購物需求度預(yù)測(cè)值,若該預(yù)測(cè)值在行動(dòng)階段的預(yù)定范圍內(nèi),則確認(rèn)該用戶屬于行 動(dòng)階段,有強(qiáng)烈的購物需求;若該預(yù)測(cè)值不在行動(dòng)階段的預(yù)定范圍內(nèi),則確認(rèn)該用戶不屬于 行動(dòng)階段,再將該待測(cè)用戶的第一、第二特征集輸入經(jīng)過訓(xùn)練的意向階段的機(jī)器學(xué)習(xí)模型 中,得到其購物需求度預(yù)測(cè)值,再次判斷該預(yù)測(cè)值是否在意向階段的預(yù)定范圍內(nèi),若該預(yù)測(cè) 值在意向階段的預(yù)定范圍內(nèi),則確認(rèn)該用戶屬于意向階段,有購物意向;若該預(yù)測(cè)值不在意 向階段的預(yù)定范圍內(nèi),則確認(rèn)該用戶不屬于意向階段,再將該待測(cè)用戶的第一、第二特征集 輸入關(guān)注階段的機(jī)器學(xué)習(xí)模型中……依次類推,直到確定待測(cè)用戶所屬的購物階段。
[0093] 本方法100采用GBDT+FM的方式對(duì)用戶的購物需求進(jìn)行預(yù)測(cè),把決策樹(GBDT模型) 的路徑直接作為FM模型的輸入特征使用,省去了人工尋找特征、特征組合的過程,并且還能 充分挖掘不同特征之間的關(guān)系,這就在確保預(yù)測(cè)模型準(zhǔn)確率的同時(shí),提高了模型訓(xùn)練的效 率。
[0094] 可選地,本方法100還會(huì)實(shí)時(shí)獲取用戶行為日志,并定期更新樣本數(shù)據(jù),對(duì)新增加 的樣本數(shù)據(jù)進(jìn)行及時(shí)訓(xùn)練,以提高模型的預(yù)測(cè)準(zhǔn)確率。
[0095] 為進(jìn)一步說明本方法100相比于其他預(yù)測(cè)模型具有更準(zhǔn)確的預(yù)測(cè)效果,計(jì)算了如 下幾種訓(xùn)練模型的AUC(Area Under roc Curve)值,并進(jìn)行對(duì)比(其中,AUC值越大,表明分 類預(yù)測(cè)效果越好),如下表所示:
[0097]從上表可以看出,利用本方法建立的預(yù)測(cè)模型,具有更加準(zhǔn)確的預(yù)測(cè)結(jié)果,能更好 地預(yù)測(cè)出用戶的購物需求。
[0098]相應(yīng)地,圖2示出了根據(jù)本發(fā)明實(shí)施例的購物行為預(yù)測(cè)裝置200的框圖。該預(yù)測(cè)裝 置200包括:數(shù)據(jù)采集模塊210、特征提取模塊220、第一訓(xùn)練模塊230、第二訓(xùn)練模塊240、以 及分類判斷模塊250。
[0099] 根據(jù)本發(fā)明的實(shí)施例,將購物階段按購物需求度劃分為:關(guān)注階段、興趣階段、意 向階段、和行動(dòng)階段,其中各階段的定義在上文中已經(jīng)詳細(xì)介紹,此處不再贅述。
[0100] 數(shù)據(jù)采集模塊210適于為上述不同購物階段選取不同目標(biāo)用戶,從所選取目標(biāo)用 戶的用戶行為日志(一般選取過去一個(gè)月內(nèi)的用戶行為日志)中獲取樣本數(shù)據(jù),然后將樣本 數(shù)據(jù)發(fā)送給與之耦接的特征提取模塊220。
[0101] 根據(jù)本發(fā)明的實(shí)施例,數(shù)據(jù)采集模塊210還包括選擇子單元(未示出),選擇子單元 適于根據(jù)不同購物階段的業(yè)務(wù)場(chǎng)景,為不同購物階段選取不同的用戶作為目標(biāo)用戶。例如, 選取有直接購物行為的用戶作為行動(dòng)階段的目標(biāo)用戶;選取有銷售咨詢行為的用戶作為意 向階段的目標(biāo)用戶;選取留言、分享行為集中的用戶作為關(guān)注階段的目標(biāo)用戶,如某用戶在 購物平臺(tái)的論壇里較為活躍,可以認(rèn)為此用戶屬于關(guān)注階段的目標(biāo)用戶;還有,選取瀏覽、 搜索、收藏行為集中的用戶作為興趣階段的目標(biāo)用戶,如某用戶對(duì)某一類產(chǎn)品的搜索、收藏 行為較為集中,那么可以認(rèn)為該用戶對(duì)這類產(chǎn)品感興趣,屬于興趣階段的目標(biāo)用戶。
[0102] 特征提取模塊220適于分別從各購物階段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一 特征集??蛇x地,第一特征集包括指向用戶特征的用戶瀏覽行為特征、用戶購物意愿特征、 預(yù)定頁面交互行為特征,以及指向用戶訪問對(duì)象特征的文章文本內(nèi)容特征。關(guān)于第一特征 集進(jìn)一步的舉例參見上文基于圖1的相關(guān)描述。
[0103] 第一訓(xùn)練模塊230與特征提取模塊220相耦接,適于利用決策樹模型分別訓(xùn)練不同 購物階段的第一特征集,通過多次迭代得到特征組合,作為第二特征集??蛇x地,決策樹模 型為GBDT模型。圖3示出了利用GBDT模型訓(xùn)練特征的一個(gè)示例,對(duì)于GBDT模型的描述,可以 參考上文中關(guān)于圖3的描述。
[0104] 根據(jù)一種實(shí)現(xiàn)方式,第一訓(xùn)練模塊230包括:適于將第一特征集作為初始輸入?yún)?shù) 構(gòu)造決策樹模型的初始化子單元、適于執(zhí)行多次迭代計(jì)算的回歸迭代子單元、以及適于將 最終決策樹模型中各葉子節(jié)點(diǎn)的值作為特征組合中的元素值,得到特征組合的特征獲取子 單元。其中,根據(jù)GBDT模型的特點(diǎn),回歸迭代子單元每迭代計(jì)算一次,就會(huì)在減少殘差的梯 度方向上建立新的決策樹模型。這樣,最終得到特征組合的個(gè)數(shù)L為:
[0105] L=(2~d_l)*m
[0106] 其中,d代表決策樹深度,m代表決策樹數(shù)量。
[0107] 可選地,第二特征集中會(huì)包含銷售線索類特征、廣告頁面交互行為類特征、預(yù)定頁 面交互行為類特征。
[0108] 第二訓(xùn)練模塊240分別與特征提取模塊220和第一訓(xùn)練模塊230相耦接,適于分別 使用各購物階段的第一特征集和第二特征集訓(xùn)練預(yù)先建立的機(jī)器學(xué)習(xí)模型,其中機(jī)器學(xué)習(xí) 模型用于預(yù)測(cè)用戶的購物需求度。
[0109] 根據(jù)一種實(shí)施方式,選取Factorization Machines(FM)模型為機(jī)器學(xué)習(xí)模型,F(xiàn)M 的核心理論在于用Factor izat ion (因子分解)來刻畫feature (特征)跟feature (特征)之間 的關(guān)系,公式如下:
[0111] 其中,xi為第i個(gè)特征項(xiàng),wo為全局偏移參數(shù),wi為特征項(xiàng)xi的參數(shù),Vi為xi特征項(xiàng)的 分解向量參數(shù),η為第一特征集和第二特征集中特征項(xiàng)總數(shù),j)(X)為購物需求度預(yù)測(cè)值。
[0112] 通過訓(xùn)練,初步建立起4個(gè)購物階段的預(yù)測(cè)模型。在測(cè)試階段,數(shù)據(jù)采集模塊210還 適于獲取待測(cè)用戶的用戶行為日志。同樣,特征提取模塊220還適于提取該待測(cè)用戶的第一 特征集,并交由與之耦接的第一訓(xùn)練模塊230。第一訓(xùn)練模塊230適于訓(xùn)練第一特征集,得到 待測(cè)用戶的第二特征集。
[0113] 分類判斷模塊250適于按照預(yù)定順序(即,首先是行動(dòng)階段、其次是意向階段、接著 是關(guān)注階段、最后是興趣階段的順序)為待測(cè)用戶選擇相應(yīng)購物階段的機(jī)器學(xué)習(xí)模型,并交 由與之耦接的第二訓(xùn)練模塊240,由其將第一特征集和第二特征集輸入到所選定的機(jī)器學(xué) 習(xí)模型(FM模型)中,預(yù)測(cè)該待測(cè)用戶的購物需求度,分類判斷模塊250適于根據(jù)預(yù)測(cè)的購物 需求度確定該待測(cè)用戶是否屬于相應(yīng)購物階段。
[0114] 換言之,分類判斷模塊250根據(jù)預(yù)定順序首先選擇行動(dòng)階段的機(jī)器學(xué)習(xí)模型;由第 二訓(xùn)練模塊240將第一特征集和第二特征集輸入到行動(dòng)階段的機(jī)器學(xué)習(xí)模型中,得到待測(cè) 用戶的購物需求度;分類判斷模塊250判斷該需求度值是否在行動(dòng)階段范圍內(nèi),若是,則判 斷該用戶屬于行動(dòng)階段,有很強(qiáng)烈的購物需求,若不是,重新選擇意向階段的機(jī)器學(xué)習(xí)模 型,重復(fù)上述步驟,直到確定待測(cè)用戶屬于哪一購物階段。
[0115] 基于上述描述,本發(fā)明的購物需求度預(yù)測(cè)方案,整合了 GBDT模型和FM模型的訓(xùn)練 結(jié)果,在FM模型訓(xùn)練時(shí),通過GBDT模型進(jìn)行特征的選擇、和特征離散化閾值的確定,以獲取 準(zhǔn)確的預(yù)測(cè)結(jié)果。
[0116] 另外,數(shù)據(jù)采集模塊210還適于實(shí)時(shí)獲取用戶行為日志,定期更新樣本數(shù)據(jù),對(duì)新 增加的樣本數(shù)據(jù)進(jìn)行及時(shí)訓(xùn)練,以提高模型的預(yù)測(cè)準(zhǔn)確率。
[0117] 在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施 例可以在沒有這些具體細(xì)節(jié)的情況下被實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié) 構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
[0118] 類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在 上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施 例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保 護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多特征。更確切地說,如下面的 權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵 循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都 作為本發(fā)明的單獨(dú)實(shí)施例。
[0119] 本領(lǐng)域那些技術(shù)人員應(yīng)當(dāng)理解在本文所公開的示例中的設(shè)備的模塊或單元或組 件可以布置在如該實(shí)施例中所描述的設(shè)備中,或者可替換地可以定位在與該示例中的設(shè)備 不同的一個(gè)或多個(gè)設(shè)備中。前述示例中的模塊可以組合為一個(gè)模塊或者此外可以分成多個(gè) 子模塊。
[0120] 本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地 改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單 元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或 子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何 組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任 何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán) 利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代 替。
[0121] A6、如A5所述的方法,其中,對(duì)于行動(dòng)階段,選取有直接購物行為的用戶作為目標(biāo) 用戶;對(duì)于意向階段,選取有銷售咨詢行為的用戶作為目標(biāo)用戶;對(duì)于關(guān)注階段,選取留言、 分享行為集中的用戶作為目標(biāo)用戶;和對(duì)于興趣階段,選取瀏覽、搜索、收藏行為集中的用 戶作為目標(biāo)用戶。A7、如A1-6中任一項(xiàng)所述的方法,其中,第一特征集包括指向用戶特征的 用戶瀏覽行為特征、用戶購物意愿特征、預(yù)定頁面交互行為特征,以及指向用戶訪問對(duì)象特 征的文章文本內(nèi)容特征。A8、如A1-7中任一項(xiàng)所述的方法,其中利用決策樹模型訓(xùn)練第一特 征集,通過多次迭代得到特征組合的步驟包括:將第一特征集作為初始輸入?yún)?shù)構(gòu)造決策 樹模型;每迭代計(jì)算一次,就在減少殘差的梯度方向上建立新的決策樹模型;經(jīng)多次迭代計(jì) 算后,將最終決策樹模型中各葉子節(jié)點(diǎn)的值作為特征組合中的元素值,得到特征組合;以及 將多個(gè)特征組合構(gòu)成第二特征集。A9、如A8所述的方法,其中決策樹模型是GBDT模型。A10、 如A9所述的方法,其中特征組合的個(gè)數(shù)L為:L=(2~d-l)*m,其中,d代表決策樹深度,m代表 決策樹數(shù)量。All、如A1-10中任一項(xiàng)所述的方法,其中,第二特征集包括銷售線索類特征、廣 告頁面交互行為類特征、預(yù)定頁面交互行為類特征。A12、如A1-11中任一項(xiàng)所述的方法,其 中機(jī)器學(xué)習(xí)模型為Factorization Machines(FM)模型:
[0123]其中,xi為第i個(gè)特征項(xiàng),wo為全局偏移參數(shù),wi為特征項(xiàng)xi的參數(shù),Vi為xi特征項(xiàng)的 分解向量參數(shù),η為第一特征集和第二特征集中特征項(xiàng)總數(shù),為購物需求度預(yù)測(cè)值。 A13、如A1-12中任一項(xiàng)所述的方法,其中從所選擇目標(biāo)用戶的用戶行為日志中獲取樣本數(shù) 據(jù)的步驟還包括步驟:實(shí)時(shí)獲取用戶行為日志,定期更新樣本數(shù)據(jù)。
[0124] B19、如B18所述的裝置,其中選擇子單元適于選取有直接購物行為的用戶作為行 動(dòng)階段的目標(biāo)用戶;選擇子單元還適于選取有銷售咨詢行為的用戶作為意向階段的目標(biāo)用 戶;選擇子單元還適于選取留言、分享行為集中的用戶作為關(guān)注階段的目標(biāo)用戶;和選擇子 單元還適于選取瀏覽、搜索、收藏行為集中的用戶作為興趣階段的目標(biāo)用戶。B20、如B14-19 中任一項(xiàng)所述的裝置,其中第一特征集包括指向用戶特征的用戶瀏覽行為特征、用戶購物 意愿特征、預(yù)定頁面交互行為特征,以及指向用戶訪問對(duì)象特征的文章文本內(nèi)容特征。B21、 如B14-20中任一項(xiàng)所述的裝置,其中第一訓(xùn)練模塊包括:初始化子單元,適于將第一特征集 作為初始輸入?yún)?shù)構(gòu)造決策樹模型;回歸迭代子單元,適于執(zhí)行多次迭代計(jì)算,其中每迭代 計(jì)算一次,就在減少殘差的梯度方向上建立新的決策樹模型;特征獲取子單元,適于將最終 決策樹模型中各葉子節(jié)點(diǎn)的值作為特征組合中的元素值,得到特征組合,并將多個(gè)特征組 合構(gòu)成第二特征集。B22、如B21所述的裝置,其中決策樹模型是GBDT模型。B23、如B22所述的 裝置,其中特征組合的個(gè)數(shù)L為:L= (2 ~d-l) *m,其中,d代表決策樹深度,m代表決策樹數(shù)量。 B24、如B14-23中任一項(xiàng)所述的裝置,其中第二特征集包括銷售線索類特征、廣告頁面交互 行為類特征、預(yù)定頁面交互行為類特征。B25、如B14-24中任一項(xiàng)所述的裝置,其中機(jī)器學(xué)習(xí) 模型為Factorization Machines(FM)模型:
[0126] 其中,xi為第i個(gè)特征項(xiàng),wo為全局偏移參數(shù),wi為特征項(xiàng)xi的參數(shù),Vi為xi特征項(xiàng)的 分解向量參數(shù),η為第一特征集和第二特征集中特征項(xiàng)總數(shù),j)(X)為購物需求度預(yù)測(cè)值。 B26、如B14-25中任一項(xiàng)所述的裝置,其中數(shù)據(jù)采集模塊還適于實(shí)時(shí)獲取用戶行為日志,定 期更新樣本數(shù)據(jù)。
[0127] 此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例 中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的 范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任 意之一都可以以任意的組合方式來使用。
[0128] 此外,所述實(shí)施例中的一些在此被描述成可以由計(jì)算機(jī)系統(tǒng)的處理器或者由執(zhí)行 所述功能的其它裝置實(shí)施的方法或方法元素的組合。因此,具有用于實(shí)施所述方法或方法 元素的必要指令的處理器形成用于實(shí)施該方法或方法元素的裝置。此外,裝置實(shí)施例的在 此所述的元素是如下裝置的例子:該裝置用于實(shí)施由為了實(shí)施該發(fā)明的目的的元素所執(zhí)行 的功能。
[0129] 如在此所使用的那樣,除非另行規(guī)定,使用序數(shù)詞"第一"、"第二"、"第三"等等來 描述普通對(duì)象僅僅表示涉及類似對(duì)象的不同實(shí)例,并且并不意圖暗示這樣被描述的對(duì)象必 須具有時(shí)間上、空間上、排序方面或者以任意其它方式的給定順序。
[0130] 盡管根據(jù)有限數(shù)量的實(shí)施例描述了本發(fā)明,但是受益于上面的描述,本技術(shù)領(lǐng)域 內(nèi)的技術(shù)人員明白,在由此描述的本發(fā)明的范圍內(nèi),可以設(shè)想其它實(shí)施例。此外,應(yīng)當(dāng)注意, 本說明書中使用的語言主要是為了可讀性和教導(dǎo)的目的而選擇的,而不是為了解釋或者限 定本發(fā)明的主題而選擇的。因此,在不偏離所附權(quán)利要求書的范圍和精神的情況下,對(duì)于本 技術(shù)領(lǐng)域的普通技術(shù)人員來說許多修改和變更都是顯而易見的。對(duì)于本發(fā)明的范圍,對(duì)本 發(fā)明所做的公開是說明性的,而非限制性的,本發(fā)明的范圍由所附權(quán)利要求書限定。
【主權(quán)項(xiàng)】
1. 一種購物行為的預(yù)測(cè)方法,包括: 為不同購物階段選取不同目標(biāo)用戶,從所選取目標(biāo)用戶的用戶行為日志中獲取樣本數(shù) 據(jù); 分別從各購物階段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一特征集; 利用決策樹模型分別訓(xùn)練不同購物階段的第一特征集,通過多次迭代得到特征組合, 作為第二特征集;以及 分別使用各購物階段的第一特征集和第二特征集訓(xùn)練預(yù)先建立的機(jī)器學(xué)習(xí)模型,其中 所述機(jī)器學(xué)習(xí)模型用于預(yù)測(cè)用戶的購物需求度;以及 根據(jù)所述不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用戶所屬購物階段。2. 如權(quán)利要求1所述的方法,其中, 所述購物階段包括:關(guān)注階段、興趣階段、意向階段、和行動(dòng)階段。3. 如權(quán)利要求2所述的方法,其中所述根據(jù)不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用 戶所屬購物階段的步驟包括: 獲取待測(cè)用戶的用戶行為日志; 執(zhí)行上述提取、訓(xùn)練第一特征集的步驟,得到待測(cè)用戶的第一特征集和第二特征集;以 及 按照預(yù)定順序?qū)⒋郎y(cè)用戶的第一特征集和第二特征集輸入某一購物階段的機(jī)器學(xué)習(xí) 模型,預(yù)測(cè)該待測(cè)用戶是否屬于該購物階段。4. 如權(quán)利要求3所述的方法,其中, 所述預(yù)定順序是:行動(dòng)階段、意向階段、關(guān)注階段、興趣階段。5. 如權(quán)利要求2-4中任一項(xiàng)所述的方法,其中所述根據(jù)不同的購物階段選取不同目標(biāo) 用戶的步驟包括: 根據(jù)不同購物階段的業(yè)務(wù)場(chǎng)景,為不同購物階段選取不同的用戶作為目標(biāo)用戶。6. -種購物行為的預(yù)測(cè)裝置,包括: 數(shù)據(jù)采集模塊,適于為不同購物階段選取不同目標(biāo)用戶,從所選取目標(biāo)用戶的用戶行 為日志中獲取樣本數(shù)據(jù); 特征提取模塊,適于分別從各購物階段的樣本數(shù)據(jù)中提取標(biāo)識(shí)用戶行為的第一特征 集; 第一訓(xùn)練模塊,適于利用決策樹模型分別訓(xùn)練不同購物階段的第一特征集,通過多次 迭代得到特征組合,作為第二特征集; 第二訓(xùn)練模塊,適于分別使用各購物階段的第一特征集和第二特征集訓(xùn)練預(yù)先建立的 機(jī)器學(xué)習(xí)模型,其中所述機(jī)器學(xué)習(xí)模型用于預(yù)測(cè)用戶的購物需求度;以及 分類判斷模塊,適于根據(jù)所述不同購物階段的機(jī)器學(xué)習(xí)模型確定待測(cè)用戶所屬購物階 段。7. 如權(quán)利要求6所述的裝置,其中, 所述購物階段包括:關(guān)注階段、興趣階段、意向階段、和行動(dòng)階段。8. 如權(quán)利要求7所述的裝置,其中, 所述數(shù)據(jù)采集模塊還適于獲取待測(cè)用戶的用戶行為日志; 所述特征提取模塊還適于提取待測(cè)用戶的第一特征集; 所述第一訓(xùn)練模塊還適于訓(xùn)練所述第一特征集,得到待測(cè)用戶的第二特征集; 所述分類判斷模塊還適于按照預(yù)定順序?yàn)榇郎y(cè)用戶選擇相應(yīng)購物階段的機(jī)器學(xué)習(xí)模 型、以及根據(jù)第二訓(xùn)練模塊預(yù)測(cè)的購物需求度預(yù)測(cè)該待測(cè)用戶是否屬于相應(yīng)購物階段;以 及 所述第二訓(xùn)練模塊還適于根據(jù)所選定的機(jī)器學(xué)習(xí)模型、以及所述第一特征集和第二特 征集預(yù)測(cè)該待測(cè)用戶的購物需求度。9. 如權(quán)利要求8所述的裝置,其中, 所述預(yù)定順序是:行動(dòng)階段、意向階段、關(guān)注階段、興趣階段。10. 如權(quán)利要求7-9中任一項(xiàng)所述的裝置,其中所述數(shù)據(jù)采集模塊還包括: 選擇子單元,適于根據(jù)不同購物階段的業(yè)務(wù)場(chǎng)景,為不同購物階段選取不同的用戶作 為目標(biāo)用戶。
【文檔編號(hào)】G06Q10/04GK105868847SQ201610174124
【公開日】2016年8月17日
【申請(qǐng)日】2016年3月24日
【發(fā)明人】孫銘澤, 華偉
【申請(qǐng)人】車智互聯(lián)(北京)科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
青神县| 勐海县| 台北市| 鹤岗市| 宝坻区| 乐陵市| 逊克县| 乌拉特前旗| 台南市| 荔浦县| 温泉县| 天长市| 汝阳县| 资兴市| 崇左市| 清远市| 南丹县| 即墨市| 库尔勒市| 吴旗县| 兴宁市| 沂南县| 马公市| 武邑县| 获嘉县| 茶陵县| 中江县| 和静县| 正镶白旗| 新丰县| 正安县| 旺苍县| 南宁市| 宜昌市| 瑞金市| 左权县| 锡林郭勒盟| 石狮市| 石狮市| 宁夏| 策勒县|