專利名稱:用戶可信度和項(xiàng)目最近鄰相結(jié)合的互聯(lián)網(wǎng)推薦方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,具體地說是一種用戶可信度和項(xiàng)目最近鄰相結(jié)合的互 聯(lián)網(wǎng)推薦方法。
背景技術(shù):
在過去的近十年里,推薦系統(tǒng)己成為解決信息過載重要途徑,在研究和應(yīng)用領(lǐng)域 都獲得了極大的關(guān)注。推薦系統(tǒng)根據(jù)用戶的興趣愛好,推薦符合用戶興趣愛好的對(duì)象,現(xiàn)在 推薦算法廣泛應(yīng)用于電影、書籍和音樂等電子商務(wù)推薦系統(tǒng)中。目前已有的推薦算法多使 用協(xié)作過濾算法,該算法的推薦方法大多基于用戶-項(xiàng)目矩陣(User-Item Matrix)進(jìn)行推 薦,該算法的優(yōu)點(diǎn)是可對(duì)多種類型的資源進(jìn)行過濾,并能為用戶發(fā)現(xiàn)新的感興趣的信息,缺 點(diǎn)是存在兩個(gè)很難解決的問題一個(gè)是稀疏問題,即用戶-項(xiàng)目矩陣稀疏,由于系統(tǒng)資源未 獲得足夠多的評(píng)價(jià)系統(tǒng)很難利用這些評(píng)價(jià)來發(fā)現(xiàn)相似的用戶;另一個(gè)是冷啟動(dòng)問題,即一 個(gè)新的用戶可能沒有或很少的用戶評(píng)分,該用戶很難選擇到其相似用戶集合,所以很難獲 得該用戶的預(yù)測(cè)評(píng)分。為了解決基于協(xié)作過濾的推薦系統(tǒng)的稀疏性問題,最簡(jiǎn)單的解決方法是給每個(gè)未 評(píng)分項(xiàng)目設(shè)定一個(gè)初始值,該方法對(duì)推薦系統(tǒng)的準(zhǔn)確性提高很小,另一種方法是使用機(jī)器 學(xué)習(xí)的方法來解決,如使用評(píng)價(jià)矩陣的奇異值分解降維方法來提高平均矩陣的密度,該方 法優(yōu)于以前的推薦系統(tǒng),但使用該方法每當(dāng)有新的用戶或項(xiàng)目時(shí)需再次使用奇異值分解降 維,降低了系統(tǒng)的性能和可復(fù)用性。而對(duì)于冷啟動(dòng)問題,最簡(jiǎn)單的解決方法是推薦最熱門的 項(xiàng)目給新的使用者,該方法未考慮用戶行為,推薦結(jié)果可能不受用戶喜歡;另一種方法是花 一段時(shí)間搜集使用者的數(shù)據(jù),待過了這一段時(shí)間后再來予以推薦,該方法在用戶不愿提供 個(gè)人信息的情況下無法提高系統(tǒng)推薦的準(zhǔn)確性;還有一種方法是建立一種適合于在用戶評(píng) 分稀少情況下的相似性度量方法,該方法一定層度上解決了冷啟動(dòng)問題,但推薦準(zhǔn)確性還 有待提高。為了同時(shí)解決推薦系統(tǒng)稀疏性和冷啟動(dòng)問題,現(xiàn)有研究提出了基于可信網(wǎng)絡(luò)的推 薦算法,在系統(tǒng)中讓用戶選擇自己的可信用戶,指出他所可信的用戶的可信等級(jí),這些可信 度關(guān)系組成了一個(gè)可信網(wǎng)絡(luò),可以用可信傳播方法進(jìn)一步擴(kuò)充自己的可信用戶數(shù)量,然后 通過基本公式來預(yù)測(cè)活動(dòng)用戶的評(píng)分值,現(xiàn)有的推薦算法多是基于用戶模型,也就是說,如 果A信任B,就意味著A要信任B對(duì)每一個(gè)項(xiàng)目的推薦。顯然,在一個(gè)用戶多興趣的情況下, 僅僅指望某可信推薦者在所有的類別中都是與自己興趣相似的可信賴的推薦鄰居,這是不 符合現(xiàn)實(shí)的。
發(fā)明內(nèi)容
鑒于現(xiàn)有的基于可信網(wǎng)絡(luò)的推薦算法存在的問題,本發(fā)明的目的是提供一種用戶 可信度和項(xiàng)目最近鄰相結(jié)合的互聯(lián)網(wǎng)推薦方法,該方法不僅考慮可信用戶的評(píng)分,同時(shí)考 慮該項(xiàng)目的相似鄰居,推薦結(jié)果準(zhǔn)確。
本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的
一種用戶可信度和項(xiàng)目最近鄰相結(jié)合的互聯(lián)網(wǎng)推薦方法,其特征在于該方法首 先建立用戶間的可信度DAG圖,接著計(jì)算第S步在用戶 停止隨機(jī)漫步的概率,然 后設(shè)定隨機(jī)漫步的結(jié)束條件,并根據(jù)隨機(jī)漫步條件預(yù)測(cè)用戶《對(duì)目標(biāo)項(xiàng)目i的評(píng)分
Pii-,最后根據(jù)預(yù)測(cè)的評(píng)分將用戶《最有可能感興趣的#個(gè)項(xiàng)目推薦給該用戶,具體實(shí)施步
驟如下
1)輸入用戶-項(xiàng)目評(píng)分矩陣和可信網(wǎng)絡(luò),其中用戶-項(xiàng)目評(píng)分矩陣是根據(jù)用戶集合V 和項(xiàng)目集合/,用戶集合V和項(xiàng)目集合/構(gòu)成一個(gè) */ 階矩陣Wfe ),其中ι表示用戶u 對(duì)項(xiàng)目i的評(píng)分,如果用戶u未對(duì)項(xiàng)目i評(píng)分,則將其評(píng)分值設(shè)定為0,每個(gè)用戶u評(píng)分的 項(xiàng)目集合用表示;對(duì)于可信網(wǎng)絡(luò),如果用戶《對(duì)用戶r信任,則to, r表示代表了用戶“對(duì) 用戶r的可信值,0表示不信任,而1表示完全信任;定義U\ tu, ν =1},該集合定 義了用戶"直接可信的用戶集合,則可信網(wǎng)絡(luò)可定義成一個(gè)DAG圖G=<m, 71/>,其中Tu= {{u, ν)\we.L ν -Ξ 7Ζ4/ },其中該圖的頂點(diǎn)表示每一個(gè)用戶,而邊表示兩頂點(diǎn)的信任關(guān)系;
2)將u作為源點(diǎn),計(jì)算停留在用戶Ii上的停止概率,然后隨機(jī)判定是否停留在用戶U 上,如果選擇停留,則跳轉(zhuǎn)到步驟5),否則執(zhí)行步驟3);停留在用戶u上的停止概率的計(jì)算 公式如式(1)所示
權(quán)利要求
1. 一種用戶可信度和項(xiàng)目最近鄰相結(jié)合的互聯(lián)網(wǎng)推薦方法,其特征在于該方法 首先建立用戶間的可信度DAG圖,接著計(jì)算第S步在用戶u停止隨機(jī)漫步的概率,然 后設(shè)定隨機(jī)漫步的結(jié)束條件,并根據(jù)隨機(jī)漫步條件預(yù)測(cè)用戶《對(duì)目標(biāo)項(xiàng)目i的評(píng)分Pii-,最后根據(jù)預(yù)測(cè)的評(píng)分將用戶《最有可能感興趣的#個(gè)項(xiàng)目推薦給該用戶,具體實(shí)施步驟如下1)輸入用戶-項(xiàng)目評(píng)分矩陣和可信網(wǎng)絡(luò),其中用戶-項(xiàng)目評(píng)分矩陣是根據(jù)用戶集合V 和項(xiàng)目集合/,用戶集合V和項(xiàng)目集合/構(gòu)成一個(gè) */ 階矩陣Wfe ),其中i表示用戶u 對(duì)項(xiàng)目i的評(píng)分,如果用戶u未對(duì)項(xiàng)目i評(píng)分,則將其評(píng)分值設(shè)定為0,每個(gè)用戶u評(píng)分的 項(xiàng)目集合用表示;對(duì)于可信網(wǎng)絡(luò),如果用戶《對(duì)用戶r信任,則to, r表示代表了用戶“對(duì) 用戶r的可信值,0表示不信任,而1表示完全信任;定義U\ tu, ν =1},該集合定 義了用戶"直接可信的用戶集合,則可信網(wǎng)絡(luò)可定義成一個(gè)DAG圖G=<m, 71/>,其中Tu= {{u, v) \u'E U, VE TZ/" },其中該圖的頂點(diǎn)表示每一個(gè)用戶,而邊表示兩頂點(diǎn)的信任關(guān)系;2)將u作為源點(diǎn),計(jì)算停留在用戶Ii上的停止概率,然后隨機(jī)判定是否停留在用戶U 上,如果選擇停留,則跳轉(zhuǎn)到步驟5),否則執(zhí)行步驟3);停留在用戶u上的停止概率的計(jì)算 公式如式(1)所示
2.根據(jù)權(quán)利要求1所述的用戶可信度和項(xiàng)目最近鄰相結(jié)合的互聯(lián)網(wǎng)推薦方法,其特征 在于使用均方根誤差(RMSE)作為評(píng)估度量,對(duì)在線用戶u的未評(píng)分項(xiàng)目進(jìn)行預(yù)測(cè),RMSE 的計(jì)算公式如式(10)所示
全文摘要
本發(fā)明公開了一種用戶可信度和項(xiàng)目最近鄰相結(jié)合的互聯(lián)網(wǎng)推薦方法,該方法首先建立用戶間的可信度DAG圖,接著計(jì)算第s步在用戶u停止隨機(jī)漫步的概率,然后設(shè)定隨機(jī)漫步的結(jié)束條件,并根據(jù)隨機(jī)漫步條件預(yù)測(cè)用戶u對(duì)目標(biāo)項(xiàng)目i的評(píng)分,最后根據(jù)預(yù)測(cè)的評(píng)分將用戶u最有可能感興趣的N個(gè)項(xiàng)目推薦給該用戶。該方法不僅考慮可信用戶的評(píng)分,同時(shí)考慮該項(xiàng)目的相似鄰居,推薦結(jié)果準(zhǔn)確。
文檔編號(hào)G06F17/30GK102135999SQ20111007267
公開日2011年7月27日 申請(qǐng)日期2011年3月25日 優(yōu)先權(quán)日2011年3月25日
發(fā)明者伍之昂, 曹杰, 李秀怡, 王有權(quán) 申請(qǐng)人:南京財(cái)經(jīng)大學(xué)