個性化推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種個性化推薦方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的高速發(fā)展,人們的日常生活越來越多的與互聯(lián)網(wǎng)緊密聯(lián)系在一起, 例如聽音樂、看電影、購物、閱讀、聊天等等。與此同時,海量的用戶和物品數(shù)據(jù)每天都不斷 地在互聯(lián)網(wǎng)中產(chǎn)生,該導致互聯(lián)網(wǎng)用戶很難,甚至不可能快速地從中找到自己需要的或者 感興趣的未知信息。于是,個性化推薦技術(shù)應運而生,并不斷地推陳出新。個性化推薦技術(shù) 旨在根據(jù)用戶自身的特點,對用戶的興趣偏好進行建模,并進而推薦符合用戶個性化偏好 的,且尚未使用過的物品。
[0003] 協(xié)同過濾是目前最主流、最有效的一類個性化推薦方法,該類方法通過獲取大量 的用戶對物品的行為數(shù)據(jù),對用戶與用戶、物品與物品、用戶與物品之間的關(guān)系分別進行建 模,并行為相似的用戶擁有相似的偏好"為基本假設(shè)進行個性化推薦。該類方法普遍存 在的一個較大的局限是:協(xié)同過濾方法假設(shè)用戶U已使用過的所有物品都均等地反映了用 戶U的個性化偏好。該個均等假設(shè)在用戶的個性化偏好可能快速動態(tài)變化的推薦問題中是 不成立的,例如用戶一天之內(nèi)的情緒可能發(fā)生多次變化,那么用戶在不同情緒之下所偏好 的歌曲也一般有很大差異,開也的時候可能喜歡聽歡快的歌曲,悲傷的時候可能喜歡聽舒 緩、安靜的歌曲,那么用戶在開也的狀態(tài)下聽的歌曲就不能正確的反映用戶在也情低落、傷 感時的歌曲偏好。同樣,電影推薦、網(wǎng)站推薦等也有類似的情況。
[0004] 為了提升現(xiàn)有推薦方法的有效性,需要考慮用戶的偏好隨時間動態(tài)變化的特點。 因此,用戶已使用過的物品不會均等的反映該用戶在給定的時刻下的偏好。
[0005] 因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是:如何能夠創(chuàng)新地 提出一種有效方法,W滿足實際應用中的更多需求,創(chuàng)造更多的應用價值。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明所要解決的技術(shù)問題是提供一種個性化推薦方法,能夠更準確的捕捉用戶 偏好的動態(tài)變化,該樣的推薦方法就顯得更具有實用價值。
[0007] 為了解決上述技術(shù)問題,本發(fā)明實施例公開了一種個性化推薦方法,包括:
[0008] 獲取用戶對物品的使用行為數(shù)據(jù);
[0009] 按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表;
[0010] 遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣;
[0011] 基于用戶對物品的興趣的遺忘過程和馬爾科夫模型建立個性化推薦模型;
[0012] 使用梯度下降法,對興趣遺忘過程中用戶的個性化參數(shù)進行估算,從而根據(jù)用戶 使用行為子列表,為用戶進行推薦。
[0013] 優(yōu)選的,所述獲取用戶對物品的使用行為數(shù)據(jù)所獲取到用戶的使用行為均為正面 用戶反饋。
[0014] 優(yōu)選的,所述生成用戶使用行為子列表的依據(jù)為用戶動態(tài)的使用行為過程中,用 戶的偏好的變化。
[0015] 優(yōu)選的,所述一步轉(zhuǎn)移概率矩陣為實數(shù)矩陣。
[0016] 優(yōu)選的,所述的個性化推薦模型為一個修正的一階馬爾科夫模型。
[0017] 優(yōu)選的,所述用戶對物品的使用行為為聽音樂。
[001引與現(xiàn)有技術(shù)相比,本發(fā)明具有W下優(yōu)點:
[0019] 本發(fā)明通過引入用戶對已使用過的物品的興趣的遺忘過程,能夠更準確的分析出 已使用過的各物品在影響用戶當前的偏好的重要性,即能有效的捕捉到用戶偏好變化的動 態(tài)特性,并將偏好的動態(tài)變化應用于個性化推薦中,提升了推薦結(jié)果的有效性。
【附圖說明】
[0020] 圖1是本發(fā)明的一種個性化推薦方法實施例的流程示意圖;
[0021] 圖2是【具體實施方式】中提到的方法實施的流程圖;
[0022] 圖3是【具體實施方式】中提到的列表示意圖;
[0023] 圖4是【具體實施方式】中提到的音樂推薦應用實例音樂推薦涉及的示意圖。
【具體實施方式】
[0024] 為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本發(fā)明作進一步詳細的說明。
[00巧]參見圖1,本方案所述的一種個性化推薦方法,具體包括:
[0026] 步驟S101,獲取用戶對物品的使用行為數(shù)據(jù);
[0027] 步驟S102,按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表;
[0028] 步驟S103,遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣;
[0029] 步驟S104,基于用戶對物品的興趣的遺忘過程和馬爾科夫模型建立個性化推薦模 型;
[0030] 步驟S105,使用梯度下降法,對興趣遺忘過程中用戶的個性化參數(shù)進行估算,從而 根據(jù)用戶使用行為子列表,為用戶進行推薦。
[0031] 為使本發(fā)明的方案便于理解和實現(xiàn)對技術(shù)做更為具體的介紹,方案實現(xiàn)是基于興 趣遺忘過程和馬爾科夫模型進行個性化推薦方法,包括W下具體的實施步驟:
[0032] (1)本發(fā)明通過動態(tài)地模擬用戶對物品的興趣的遺忘過程,來估計用戶在任意時 刻下對物品的個性化偏好,例如在音樂推薦中,更偏好舒緩、安靜的歌曲,還是動感、快節(jié)奏 的歌曲,又例如在電影推薦中,更偏好動作類型電影,還是浪漫愛情類型電影等,并在此基 礎(chǔ)上,為用戶在給定的時刻下,推薦符合其個性化偏好的物品;
[003引 似如附圖2所示,為本發(fā)明方法實施的流程圖,本發(fā)明方法一共包含6個主要的 實施階段;
[0034] (3)階段1,獲取用戶對物品的使用行為數(shù)據(jù),設(shè)獲取到M位用戶對N個物品的使 用行為數(shù)據(jù),記用戶集合為U = (ui,也…,%},物品集合為V = {ui,咕…,%},集合U和集 合V中每一個元素分別表示唯一的一個用戶和一個物品,記Hu= {Xu,i,Xu,2,…}表示用戶U 的原始的使用行為數(shù)據(jù)按其發(fā)生的時間的升序排列的列表,其中的任一元素表示用戶 u的第i次使用行為,并且Xuj E V,對任意的i< j,滿足行為X uj的發(fā)生時間早于行為X uj的 發(fā)生時間;
[0035] (4)在本發(fā)明中,默認獲取到的用戶的使用行為均為正面用戶反饋,即用戶U在某 一時刻使用了物品V,則表示用戶U在那一時刻下偏好于物品V,而對含有負面用戶反饋的 使用行為數(shù)據(jù),可將其中所有負面用戶反饋均刪除后,再運用本發(fā)明方法;
[0036] (5)階段2,根據(jù)不同數(shù)據(jù)類型的推薦問題,設(shè)定不同的時間闊值T,對每個用戶 的使用行為列表分別進行劃分,形成多個子列表,闊值X定義了劃分在同一子列表中任意 發(fā)生時間相鄰的前后兩次行為的時間間隔的最大值,劃分子列表的原因是因為在用戶動態(tài) 的使用行為過程中,用戶的偏好可能會改變,因此,行為發(fā)生時間越接近,則用戶偏好改變 的概率越低,反則反之;
[0037] (6)闊值X的大小與具體的推薦問題相關(guān),例如在音樂推薦中,X的值可W??! 小時,而在電影推薦中,T的值則可W取1天等等;
[003引(7)遍歷所有用戶U的原始使用行為列表Hu,將Hu中的使用行為按發(fā)生時間的升 序排列,若Hu中發(fā)生時間相鄰的前后兩次行為的時間間隔大于X,則將該兩次行為分別劃 分到前后兩個不同的子列表中,記由所有用戶的各個使用行為子列表構(gòu)成的集合為H ;
[003引 做附圖3舉例說明了根據(jù)用戶U原始的使用行為列表Hu,在時間闊值X為1小 時的情況下,生成U的使用行為子列表的過程,由于行為Xu,2與X u,3的發(fā)生時間的間隔超過 了 1個小時,于是Xu,2與Xu,3被分別劃入了子列表Hu,郝Hu,2中,因此,H洛過劃分之后得到 兩個子列表化,1,咕,2};
[0040] (9)階段3,遍歷階段2中得到的所有用戶的使用行為子列表集合H,估算物品的一 步轉(zhuǎn)移概率矩陣S,S為NXN的實數(shù)矩陣,記S(v。Vj.)表示對普遍的用戶而言,在使用了物 品Vi之后,下一步緊接著使用物品V j.的概率,即一步轉(zhuǎn)移概率,在本發(fā)明中,用W下公式估 算S(v。Vj)的值:
[0041]
【主權(quán)項】
1. 一種個性化推薦方法,其特征在于,包括: 獲取用戶對物品的使用行為數(shù)據(jù); 按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表; 遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣; 基于用戶對物品的興趣的遺忘過程和馬爾科夫模型建立個性化推薦模型; 使用梯度下降法,對興趣遺忘過程中用戶的個性化參數(shù)進行估算,從而根據(jù)用戶使用 行為子列表,為用戶進行推薦。
2. 如權(quán)利要求1所述的個性化推薦方法,其特征在于,所述獲取用戶對物品的使用行 為數(shù)據(jù)所獲取到用戶的使用行為均為正面用戶反饋。
3. 如權(quán)利要求1所述的個性化推薦方法,其特征在于,所述生成用戶使用行為子列表 的依據(jù)為用戶動態(tài)的使用行為過程中,用戶的偏好的變化。
4. 如權(quán)利要求1所述的個性化推薦方法,其特征在于,所述一步轉(zhuǎn)移概率矩陣為實數(shù) 矩陣。
5. 如權(quán)利要求1所述的個性化推薦方法,其特征在于,所述的個性化推薦模型為一個 修正的一階馬爾科夫模型。
6. 如權(quán)利要求1所述的個性化推薦方法,其特征在于,所述用戶對物品的使用行為為 聽音樂。
【專利摘要】本發(fā)明公開一種個性化推薦方法,涉及計算機數(shù)據(jù)處理技術(shù)領(lǐng)域,包括:獲取用戶對物品的使用行為數(shù)據(jù);按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表;遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣;基于用戶對物品的興趣的遺忘過程和馬爾科夫模型建立個性化推薦模型;使用梯度下降法,對興趣遺忘過程中用戶的個性化參數(shù)進行估算,從而根據(jù)用戶使用行為子列表,為用戶進行推薦。本發(fā)明提供的個性化推薦方法,能夠更準確的捕捉用戶偏好的動態(tài)變化,這樣的推薦方法就顯得更具有實用價值。
【IPC分類】G06F17-30, G06K9-62
【公開號】CN104537114
【申請?zhí)枴緾N201510030610
【發(fā)明人】王朝坤, 陳俊, 王建民
【申請人】清華大學
【公開日】2015年4月22日
【申請日】2015年1月21日