一種基于階段的動態(tài)產(chǎn)品推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,尤其是涉及一種基于階段的動態(tài)產(chǎn)品推薦方法。
【背景技術(shù)】
[0002] 由于向人們推薦他們感興趣的產(chǎn)品產(chǎn)生了越來越多的經(jīng)濟效益,個性化推薦正變 得越來越受歡迎。許多的電子商務(wù)網(wǎng)站已經(jīng)從產(chǎn)品推薦系統(tǒng)中獲得了很大的利益。大部分 的研究者都嘗試通過使用基于內(nèi)容或者協(xié)同過濾或者混合前面兩種技術(shù)的方式開發(fā)推薦 系統(tǒng)。然而,送種推薦模式不能有效的解決所有可能發(fā)生在現(xiàn)實應(yīng)用中的事件。
[0003] 在電子推薦系統(tǒng)中,存在一類特殊的推薦問題,即用戶的購買行為是隨著時間而 改變的。在人的不同階段,用戶會偏好不同的商品。在送里使用基于商品的方法來做個性 化推薦是不合理的,因為不同時期購買的商品可能會完全不同。通常,一個商品分類方法是 和一個推薦系統(tǒng)相關(guān)聯(lián)的,送樣客戶能很容易的轉(zhuǎn)向不同的產(chǎn)品類別。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是針對現(xiàn)有的產(chǎn)品推薦中存在的問題,提出一種適用性強、可靠性 好的動態(tài)產(chǎn)品推薦方法。
[0005] 實現(xiàn)本發(fā)明目的的技術(shù)解決方案為: 將產(chǎn)品分類知識用來形式化用戶的長期偏好,同時獲取用戶的興趣變化。然而,僅僅有 長期偏好并不能提供足夠的證據(jù)來得到用戶的當(dāng)前愿望。對于進入一個新的購買階段的客 戶來說,他可能會喜歡W前從來沒有購買過的商品類型。因此,僅考慮用戶的長期偏好是不 能獲取他的意愿的。為了解決送個問題,我們提出通過分析相似用戶購買行為來探索用戶 的短期偏好。
[000引具體步驟如下: 1、 分割用戶的購買記錄,將其分為不同階段:定義一個統(tǒng)一的時間片T作為一個分割 單位,然后根據(jù)T來分割購買記錄H,即H=化t。,Hti,…,HJ,其中t。表示當(dāng)前階段,即最近購 買時期,對于每個時期,我們都使用商品分類法對用戶行為Hti進行建模; 2、 使用產(chǎn)品分類方法對用戶的長期偏好進行建模;對用戶長期偏好進行建模包括生 成用戶信息W及模型改善;生成用戶信息:假設(shè)基本的類別向量為<Ci,C2, C3, C4, C5〉,權(quán)重 類別向量=<1,2, 0, 1,1〉,其中每一項表示用戶對相應(yīng)的類別的隱式評分。在送個表達 式中,我們賦予產(chǎn)品分類中更高層的類別更大的權(quán)重,W避免陷入特定的主題W及失去對 用戶偏好的整體認知。權(quán)重類別向量是12歸一化的。最后,我們定義用戶的長期信息為 Rui=TR笠,,R這,…},同時我們可W確定Ui的當(dāng)前推薦階段為Htc ; 模型改善:我們通過指定H種不同的相似度用戶與用戶的相似度(S。),產(chǎn)品之間的相 似度(Si),類別之間的相似度(S。),進一步的形式化送個基于分類的信息模型。
[0007] 3、基于與目標(biāo)用戶相似的用戶的購買行為構(gòu)建一張多模態(tài)圖;建立一個節(jié)點包括 用戶、產(chǎn)品和類別的多模態(tài)圖,而節(jié)點之間的邊的權(quán)重由鄰接矩陣W確定。Up、Pp、P。分別表 示用戶與產(chǎn)品、用戶與類別、產(chǎn)品與類別之間的關(guān)系,建立一個鄰接矩陣W,節(jié)點之間的邊 的權(quán)重由鄰接矩陣W確定。
[0008] 4、在構(gòu)建的多模態(tài)圖上進行隨機游走推理,得到最終的推薦列表: 執(zhí)行隨機游走原理RWR來取得與給定用戶q高度相關(guān)的元素,在向量ij誦!議5^.;?選 擇一個排在頂端的元素子集e,如果是用戶,則選擇最近購買的產(chǎn)品放進推薦列表1 中;如果Gi是產(chǎn)品,則直接將Gi放進1中;如果Gi是類別,則選擇對Gi的IC值貢獻最大的 產(chǎn)品放進1中。送樣就得到了最終的產(chǎn)品推薦列表。
[0009] 本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點是: 1. 靈活性強; 2. 可靠性高; 3. 頭用性好。
【附圖說明】
[0010] 圖1是產(chǎn)品分類示意圖。
[0011] 圖2是動態(tài)推薦過程示意圖。
[0012] 圖3是隨機游走推理算法示意圖。
【具體實施方式】
[0013] W下結(jié)合附圖,詳細說明本發(fā)明的實施方式。
[0014] 結(jié)合圖1,本發(fā)明的動態(tài)產(chǎn)品推薦方法中,定義幾個集合;用戶知識庫U={ui,U2,… ,U。},U包括電子商務(wù)網(wǎng)站上的所有用戶;產(chǎn)品知識庫P= {Pi,P2,…,PmK P包括電子商務(wù)網(wǎng) 站上提供的所有產(chǎn)品;用戶評價R=出1,R2,…,R。},R包括用戶對產(chǎn)品的所有評價信息;產(chǎn)品 類別C= {Ci,C2,…,CiJ,一件產(chǎn)品只能屬于一個特定的類別。
[001引首先提取Ui的交易數(shù)據(jù),Ri={p4i,P5i,化J。對于Ri中的每個項目,我們定位了其 直接所屬的細粒度類別即C4,然后從底到頂遍歷送個分類W獲得從送個類別開始的類別路 徑,即C4 一 Cl。接下來將P41上的評價得分轉(zhuǎn)換為類別路徑,即將路徑上的每個類別定義設(shè) 為"1"。因此,我們匯總了每個類別的評價得分,并用一個權(quán)重類別向量表示用戶階段信息。
[0016] 結(jié)合圖2,本發(fā)明的動態(tài)產(chǎn)品推薦方法中,商品的動態(tài)推薦過程包括分割用戶的購 買記錄、對用戶長期偏好進行建模、構(gòu)建多模態(tài)圖,最后是進行隨機游走推理,W得到最終 的推薦列表。
[0017] 分割用戶的購買記錄:定義一個統(tǒng)一的時間片T作為一個分割單位,然后根據(jù)T來 分割購買記錄H,即H=化t。,Hti,…,HJ,其中t。表示當(dāng)前階段,即最近購買時期。對于每個 時期,我們都使用商品分類法對用戶行為Hti進行建模。
[0018] 對用戶長期偏好進行建模包括生成用戶信息W及模型改善。
[0019] 生成用戶信息;假設(shè)基本的類別向量為<Ci,C2, C3, C4, C5〉,權(quán)重類別向量巧潔 =<1,2, 0, 1,1〉,其中每一項表示用戶對相應(yīng)的類別的隱式評分。在送個表達式中,我們賦予 產(chǎn)品分類中更高層的類別更大的權(quán)重,W避免陷入特定的主題W及失去對用戶偏好的整體 認知。權(quán)重類別向量是12歸一化的。最后,我們定義用戶的長期信息為Rui={Rl, ,R器,…},同時我們可W確定Ui的當(dāng)前推薦階段為Ht。。
[0020] 模型改善;我們通過指定H種不同的相似度,進一步的形式化送個基于分類的信 息模型。
[0021] 用戶與用戶的相似度(S。);用戶之間的相似性產(chǎn)生自兩個不同的組件:用戶與產(chǎn) 品之間的相似性Sui和用戶與類別之間的相似性S。。。給定兩個用戶Ui和U2, Sui可W通過送 兩個用戶所購頭的廣品集合1。1, 1。2之間的化CCard相似度求得,而Suc可W由送兩個用戶可 確定的階段信息向量Rui, Ru2之間的Consine相似度求得。
[0024] 通過送種方式我們可W很容易的得到來自分類層次和實際購買行為層次的兩個 用戶的相關(guān)度。
[00巧]產(chǎn)品之間的相似度(Si):產(chǎn)品之間的相似度可W由產(chǎn)品到產(chǎn)品的協(xié)同過濾計算得 到。給定一個產(chǎn)品P,我們的目的是找到與P相似的產(chǎn)品;送里的相似指的是購買送兩個產(chǎn) 品的用戶集Upi、Up2具有相當(dāng)?shù)闹丿B。我們使用化ccard相似性來得到Si扣。1,Up2),即 務(wù):接挪還礙置麥與鑛粋''輪爲(wèi)翠類八鳴:互:姑蘇狂;} 類別之間的相似度(S。);送個相似度可W幫助確定在一個產(chǎn)品分類里面兩個不同類別 的語義相關(guān)性。我們使用信息內(nèi)容(IC)來計算S。,IC衡量了一個給定的類別C的發(fā)生概 率的信息數(shù)量,在我們的例子中就是在類別C中產(chǎn)品被購買的概率。IC越大,送個類別就越 受歡迎。IC(C)= -log P(C)D使用一個分類中最小公共包含的IC來計算一對內(nèi)容的相關(guān) 性。則
構(gòu)建多模態(tài)圖:多模態(tài)圖包括多種資源,如用戶、產(chǎn)品和類別之間多種類型的聯(lián)系,即 用戶與用戶、產(chǎn)品與產(chǎn)品、類別與類別之間的關(guān)系等等。我們將送個圖封裝成一個鄰接矩 陣。令Up、Pp、P。分別表示用戶與產(chǎn)品、用戶與類別、產(chǎn)品與類別之間的關(guān)系,建立一個鄰接 矩陣
,其中Uu、Pp、C。都由Eq計算得到,W中的其他塊可W由購買行為 或者產(chǎn)品分類計算得到。
[0026] 隨機游走推理:使用隨機游走重啟(RWR)推理來獲得推薦產(chǎn)品,送樣被推薦的 產(chǎn)品不會與用戶的購買興趣產(chǎn)生太大的偏離。使用歸一化的拉普拉斯圖構(gòu)建一個矩陣 A=浸:S蹲瓣茲P擊泡是一個對角矩陣,而且它的第(i,U個元素等于W中第i行的 總和。
[0027] 結(jié)合圖3,本發(fā)明的動態(tài)產(chǎn)品推薦方法中,我們首先建立一個節(jié)點包括用戶、產(chǎn)品 和類別的多模態(tài)圖,而節(jié)點之間的邊的權(quán)重由鄰接矩陣W確定。使用拉普拉斯圖來歸一化 W,執(zhí)行隨機游走原理RWR來取得與給定用戶q高度相關(guān)的元素,在向量慧蠢遺L;議選擇 一個排在頂端的元素子集e,如果是用戶,則選擇最近購買的產(chǎn)品放進推薦列表1中; 如果Gi是產(chǎn)品,則直接將Gi放進1中;如果Gi是類別,則選擇對Gi的IC值貢獻最大的產(chǎn) 品放進1中。送樣就得到了最終的產(chǎn)品推薦列表。
【主權(quán)項】
1. 一種基于階段的動態(tài)產(chǎn)品推薦方法,其特征在于以下步驟: a. 首先分割用戶的購買記錄,將其分為不同階段:定義一個統(tǒng)一的時間片T作為一個 分割單位,然后根據(jù)T來分割購買記錄H,即H= {Ht。,Htl,…,HJ,其中t。表示當(dāng)前階段,即最 近購買時期,對于每個時期,都使用商品分類法對用戶行為H tl進行建模; b. 使用產(chǎn)品分類方法對用戶的長期偏好進行建模:對用戶長期偏好進行建模包括生 成用戶信息以及模型改善;生成用戶信息:假設(shè)基本的類別向量為< Cl,c2, c3, c4, c5>,權(quán)重 類別向量_||=〈1,2, 0, 1,1>,其中每一項表示用戶對相應(yīng)的類別的隱式評分;權(quán)重類別向 量是12歸一化的,用戶的長期信息為Rul={Rg,Rg,Rf5.,…},確定U 1的當(dāng)前推薦階 段為Ht。; c. 基于與目標(biāo)用戶相似的用戶的購買行為構(gòu)建一張多模態(tài)圖;建立一個節(jié)點包括用 戶、產(chǎn)品和類別的多模態(tài)圖,而節(jié)點之間的邊的權(quán)重由鄰接矩陣W確定;U p、Pp、P。分別表示 用戶與產(chǎn)品、用戶與類別、產(chǎn)品與類別之間的關(guān)系,d. 在構(gòu)建的多模態(tài)圖上運用隨機游走推理,得到最終的推薦列表:執(zhí)行隨機游走原理 RWR來取得與給定用戶q高度相關(guān)的元素,在向量定.?:后選擇一個排在頂端的元素 子集e,如果ei是用戶,則選擇ei最近購買的產(chǎn)品放進推薦列表1中;如果ei是產(chǎn)品,則直 接將ei放進1中;如果ei是類別,則選擇對ei的IC值貢獻最大的產(chǎn)品放進1中,進而得 到最終的產(chǎn)品推薦列表。2. 根據(jù)權(quán)利要求1所述的一種基于階段的動態(tài)產(chǎn)品推薦方法,其特征在于所述的隨機 游走推理是使用歸一化的拉普拉斯圖構(gòu)建了一個矩陣A=|}dH/|rV 2,其中D是一個 對角矩陣,而且它的第(i,i)個元素等于W中第i行的總和。
【專利摘要】本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種基于階段的動態(tài)產(chǎn)品推薦方法。它包括分割用戶購買記錄、對用戶長期偏好進行建模、構(gòu)建多模態(tài)圖和進行隨機游走推理,最終得到產(chǎn)品推薦列表。本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點是靈活性強,可靠性高,實用性高。
【IPC分類】G06Q30/00
【公開號】CN105528704
【申請?zhí)枴緾N201410502965
【發(fā)明人】李濤, 劉敏, 李千目, 侯君, 徐建
【申請人】南京理工大學(xué)常熟研究院有限公司
【公開日】2016年4月27日
【申請日】2014年9月28日