一種基于全局評分信息的項目協(xié)同過濾推薦方法
【專利摘要】本發(fā)明公開了一種基于全局評分信息的項目協(xié)同過濾推薦方法,其特征是按如下步驟進(jìn)行:步驟一、用二維表表示項目的評分?jǐn)?shù)據(jù);步驟二、基于全局評分信息獲得用戶第j個未評分項與其他所有項目的相關(guān)度所構(gòu)成的相關(guān)度集合;步驟三、重復(fù)步驟二獲得用戶所有未評分項的相似度集合;步驟四、將相似度集合中的相似度大小進(jìn)行降序排列獲得最近鄰居項目集;步驟五、獲得用戶對第j個未評分項的預(yù)測評分和所有未評分項的預(yù)測評分構(gòu)成的預(yù)測評分集合;步驟六、將預(yù)測評分集合中的預(yù)測評分進(jìn)行降序排列,獲得未評分項排序集合,并選取前N項作為推薦結(jié)果推薦給用戶。本發(fā)明能在數(shù)據(jù)稀疏情況下充分利用用戶所有的評分信息,從而提高預(yù)測準(zhǔn)確度。
【專利說明】一種基于全局評分信息的項目協(xié)同過濾推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于個性化推薦領(lǐng)域,具體涉及針對基于項目的協(xié)同過濾推薦方法。
【背景技術(shù)】
[0002]在Web2.0時代,推薦系統(tǒng)作為解決“信息過載”問題的重要工具,在電子商務(wù)領(lǐng)域獲得了廣泛應(yīng)用jnAmazon網(wǎng)站利用基于項目的協(xié)同過濾推薦方法向顧客推薦與興趣項目類似的項目。推薦系統(tǒng)中常見的推薦方法分為協(xié)同過濾推薦方法、基于內(nèi)容的推薦方法和混合推薦方法,協(xié)同過濾推薦方法因為其不依賴于項目的具體屬性受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,協(xié)同過濾推薦方法的基本思想是有著相似興趣的用戶給出的推薦往往是最好的。常見的協(xié)同過濾推薦方法有基于用戶的協(xié)同過濾推薦方法和基于項目的協(xié)同過濾推薦方法。
[0003]基于項目的協(xié)同過濾推薦方法步驟包括:計算項目之間的相關(guān)性、基于項目之間的相關(guān)性找到項目的最近鄰居集合、基于用戶對項目的最近鄰居集合的評分計算用戶對項目的評分。在計算項目之間的相關(guān)性時,現(xiàn)有方法首先隔絕出對兩個項目都有過評分行為的用戶,基于這些用戶對兩個項目的評分信息計算項目的相關(guān)性。然而在實際的推薦系統(tǒng)應(yīng)用中,用戶對項目的評分行為非常少,在評分信息已經(jīng)極度稀疏情況下再去人為隔絕掉一部分評分信息影響了項目相關(guān)性的精度。在數(shù)據(jù)稀疏情況下如何更有效地利用現(xiàn)有信息計算項目之間的相關(guān)性成為個性化推薦領(lǐng)域中研究的熱點。
【發(fā)明內(nèi)容】
[0004]本發(fā)明為克服現(xiàn)有技術(shù)存在的不足之處,提出一種基于全局評分信息的項目協(xié)同過濾推薦方法,能在數(shù)據(jù)稀疏情況下充分利用用戶所有的評分信息,從而提高預(yù)測準(zhǔn)確度。
[0005]為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案為:
[0006]本發(fā)明一種基于全局評分信息的項目協(xié)同過濾推薦方法的特點是按如下步驟進(jìn)行:
[0007]步驟一、用二維表T = {U, I, f}表示項目的評分?jǐn)?shù)據(jù);
[0008]所述二維表T中,U = {1,…,U,…|u|}表示用戶集合,u表示任意用戶,I u ^ IUI ;
[0009]I= {I,..., i,..., 111}表示項目集合,i表示任意第i個項目,I彡i彡I ; ,li,ru’…’ ri,|l|
/= !2'2? ’表示用戶集合U中的所有用戶對項目集合I中所有項目 ? ? --.?* u J.>1,1’ >1,2’…,
的評分;ru,i表示任意用戶u對任意項目i的評分;令氧為用戶u的未評分集合,Tuj表示用戶U的第j個未評分項,IjI表示用戶U的未評分項的總個數(shù),令所述用戶未評分項集合足中的任意項% = O;
[0010]步驟二、基于全局評分信息利用式(I)獲得用戶U的第j個未評分項&與所述項目集合I中的任意項目i的相關(guān)度Sim(i,j);從而獲得第j個未評分項「與所述項目集合I中的所有項目的相關(guān)度所構(gòu)成的第j個未評分項L的相關(guān)度集合;
【權(quán)利要求】
1.一種基于全局評分信息的項目協(xié)同過濾推薦方法,其特征是按如下步驟進(jìn)行: 步驟一、用二維表T = {U, I, f}表示項目的評分?jǐn)?shù)據(jù); 所述二維表T中,U = {I,..., u,…|u|}表示用戶集合,u表示任意用戶,I≤u≤|u| ; I = {l,...,i,...,|l|}表示項目集合,i表示任意第i個項目,I≤i≤I ;
表示用戶集合U中的所有用戶對項目集合I中所有項目 的評分;rUii表示任意用戶u對任意項目i的評分;令瓦為用戶u的未評分集合,K表不用戶u的第j個未評分項,IjI表不用戶u的未評分項的總個數(shù),令所述用戶未評分項集合旯中的任意項~=ο., 步驟二、基于全局評分信息利用式(I)獲得用戶U的第j個未評分項「與所述項目集合I中的任意項目i的相關(guān)度Sim(i,j);從而獲得第j個未評分項&與所述項目集合I中的所有項目的相關(guān)度所 構(gòu)成的第j個未評分項%的相關(guān)度集合;
式(I)中,Ui表示評價過第i個項目i的所有用戶的集合;Uj表示評價過第j個項目j的所有用戶的集合,I≤j≤111且i關(guān)j;「 g示評價過第i個項目i和第j個項目j的所有用戶對第i個項目i的評分均值;--"'表示評價過第i個項目i和第.]_個項目j的所有用戶對第j個項目j的評分均值;f表示評價過項目i或項目j的所有用戶對第i個項目i的評分均值;τ, οη表示評價過項目i或項目j的所有用戶對第j個項目j的評分均值;步驟三、重復(fù)步驟二獲得用戶u的未評分集合尾中所有未評分項的相似度集合;步驟四、將所述用戶u的第j個未評分項&的相似度集合中的相似度大小進(jìn)行降序排列,獲得第j個未評分項「的最近鄰居項目集合%,從而獲得所述用戶u的未評分項集合力中所有未評分項的最近鄰居項目集合所構(gòu)成的最近鄰居項目集Nu = (N1, N2, - ,Nj,…N1J ;步驟五、利用式⑵獲得用戶u對第j個未評分項%的預(yù)測評分ry,從而獲得用戶u對所述未評分集^ R中所有未評分項的預(yù)測評分所構(gòu)成的預(yù)測評分集合
式(2)中,^表示評價過第j個項目的所有用戶對第j個項目的評分均值;ru,n表示用戶u對項目η的評分; 步驟六、將所述預(yù)測評分集合反中的預(yù)測評分進(jìn)行降序排列,獲得未評分項排序集合,并選取所述未評分項排序集合的前N項作為推薦結(jié)果推薦給用戶U。
【文檔編號】G06F17/30GK104166732SQ201410436669
【公開日】2014年11月26日 申請日期:2014年8月29日 優(yōu)先權(quán)日:2014年8月29日
【發(fā)明者】劉業(yè)政, 王錦坤, 姜元春, 孫春華, 孫見山, 何建民 申請人:合肥工業(yè)大學(xué)