進行評分預(yù)測:
[0073]其中
[0075] 其中,p 為目標用戶u對未評分項目i的預(yù)測評分值,sim(u,n)為目標用戶u 與鄰居用戶n的相似度值,卩"為用戶n對已經(jīng)評價項目的評分平均值,Ku為k個鄰居用戶 集合,Hu,i為集合Ku中對項目i評分的鄰居用戶集合,n為1^^集合中的用戶。
[0076]步驟4:根據(jù)預(yù)測評分,對目標用戶未評分項目進行分數(shù)值從大到小的排列,篩選 出前N個項目即產(chǎn)生對用戶的推薦項目,2〈= N〈= 20。
[0077]本發(fā)明的效果可以通過以下實例仿真結(jié)果進一步說明:
[0078] 1.實驗條件和環(huán)境設(shè)置
[0079]實驗運行環(huán)境:CPU為Intel (R) Core (TM)i5@2. 50GHz,內(nèi)存為4GB,編譯環(huán)境為 MatlabR2014a。
[0080] 2.實驗數(shù)據(jù)與評價指標:
[0081]本發(fā)明選用Movielens推薦系統(tǒng)的一個電影數(shù)據(jù)集,數(shù)據(jù)包含943個用戶對1682 部電影的1000000條評分,每個用戶至少對20部電影進行評分,評分為1到5的整數(shù)值。在 本發(fā)明實驗中將數(shù)據(jù)分為測試集和訓(xùn)練集兩部分,給定數(shù)據(jù)集的80%用戶評分數(shù)據(jù)作為訓(xùn) 練集,剩余的20%作為測試數(shù)據(jù)。為提高實驗的準確性和可靠性,采用交叉驗證法,即每一 個樣本數(shù)據(jù)被用作訓(xùn)練數(shù)據(jù),也被用作測試數(shù)據(jù)。
[0082] 本發(fā)明選用常用的推薦效果評價指標,即平均絕對誤差MAE、覆蓋率C0V、準確率 PRE和召回率REC。MAE評價指標反映預(yù)測評分和真實評分的誤差平均值,定義如下:
[0084] 其中M代表測試項目集的大小,pJP q i分別代表用戶預(yù)測評分和實際用戶評分。
[0085] COV評價指標定義為目標用戶的k近鄰中至少有一個用戶對未評分項目做了相應(yīng) 的評分。定義如下:
[0087] 其中#C為系統(tǒng)的目標用戶沒評分但至少有一個鄰居用戶對該項目做了評分的數(shù) 目,ffl)為系統(tǒng)用戶未評分的項目數(shù)。
[0088] PRE評價指標描述前N個對應(yīng)的項中用戶喜歡的項目概率。定義如下:
[0090] 其中N是對目標用戶推薦項目的數(shù)量,Ntrae表示推薦的N個項目中正確推薦的個 數(shù)。該值越大表示推薦的質(zhì)量越高。
[0091] REC評價指標描述系統(tǒng)推薦給用戶的項目,準確推薦的項目數(shù)占用戶整體喜歡的 項目數(shù)比例。
[0093] 其中N是對目標用戶推薦項目的數(shù)量,NMf表示與目標用戶相關(guān)聯(lián)的項目數(shù)。同樣 該值越大所對應(yīng)的推薦質(zhì)量越高。
[0094] 3.實驗內(nèi)容與結(jié)果:
[0095] 實驗1,選用平均絕對誤差MAE作評價指標,用本發(fā)明SFC和現(xiàn)有基于Pearson相 關(guān)系數(shù)的協(xié)同過濾方法CPP、基于Cos相似度的協(xié)同過濾方法COS、基于結(jié)合Jaccard和MSD 的相似度度量方法JMSD、基于奇異值的相似度度量方法SM、基于改進的PIP相似度度量方 法NHSM進行電影推薦,其預(yù)測值與實際的評分的誤差值如圖2所示。
[0096] 從圖2的實驗結(jié)果可以看出,本發(fā)明與其他的5種對比方法相比,其平均絕對誤差 得到了不同程度的降低,在不同的鄰居用戶范圍內(nèi),本發(fā)明的誤差值是最小的。
[0097] 實驗2,選用覆蓋率C0V作評價指標,用本發(fā)明SFC和現(xiàn)有基于Pearson相關(guān)系數(shù) 的協(xié)同過濾方法CPP、基于Cos相似度的協(xié)同過濾方法C0S、基于結(jié)合Jaccard和MSD的相似 度度量方法JMSD、基于奇異值的相似度度量方法SM、基于改進的PIP相似度度量方法NHSM 進行電影推薦,其預(yù)測評分與實際評分的覆蓋率如圖3所示。
[0098] 從圖3的實驗結(jié)果可以看出,在不同的鄰居用戶范圍內(nèi)基于奇異值的相似度度量 方法的覆蓋率值最高,但本發(fā)明的覆蓋率值與其他四種對比相似度度量方法相比,本發(fā)明 的覆蓋率值最高。
[0099] 實驗3,選用準確率PRE作評價指標,用本發(fā)明SFC和現(xiàn)有基于Pearson相關(guān)系數(shù) 的協(xié)同過濾方法CPP、基于Cos相似度的協(xié)同過濾方法C0S、基于結(jié)合Jaccard和MSD的相似 度度量方法JMSD、基于奇異值的相似度度量方法SM、基于改進的PIP相似度度量方法NHSM 進行電影推薦,其預(yù)測評分與實際的評分的準確率如圖4所示。
[0100] 從圖4的實驗結(jié)果可以看出,本發(fā)明與其他的5種對比方法相比,在不同的推薦項 目長度范圍內(nèi),本發(fā)明的準確率是最高的。
[0101] 實驗4,選用召回率REC作評價指標,用本發(fā)明SFC和現(xiàn)有基于Pearson相關(guān)系數(shù) 的協(xié)同過濾方法CPP、基于Cos相似度的協(xié)同過濾方法C0S、基于結(jié)合Jaccard和MSD的相似 度度量方法JMSD、基于奇異值的相似度度量方法SM、基于改進的PIP相似度度量方法NHSM 進行電影推薦,其預(yù)測評分與實際的評分的召回率如圖5所示。
[0102] 從圖5的實驗結(jié)果可以看出,本發(fā)明與其他的5種對比方法相比,在不同的推薦項 目長度范圍內(nèi),本發(fā)明的召回率是最高的。
【主權(quán)項】
1. 一種基于模糊機制用戶評分鄰域信息的協(xié)同過濾推薦方法,包括如下步驟: (1)從原始的用戶-物品-評分-時間這四維數(shù)據(jù)中獲取用戶U對項目I的評分信息, 創(chuàng)建用戶對項目的評分矩陣R(nxp),其中η代表用戶的數(shù)目,P代表項目的數(shù)目; ⑵根據(jù)用戶的評分矩陣,確定任意兩個用戶a與用戶b的相似度值sim(a,b): (2a)運用軟劃分機制,分別構(gòu)建用戶u對項目i評分的喜歡隸屬度Lui和用戶u對項 目i評分的不喜歡隸屬度Dui :其中rUii為用戶u對項目i的評分,m為推薦系統(tǒng)用戶評分的最小值,M為推薦系統(tǒng)用 戶評分的最大值,對于評分范圍在1到5之間的數(shù)值,則m為I,M為5 ; (2b)運用項目評分的上下文信息,分別構(gòu)建項目i評分的喜歡貢獻率因子Cli和項目 i評分的不喜歡貢獻率因子Cdi :其中SUi表示整體用戶對項目i的評分人數(shù); (2c)運用如下改進的Jaccard函數(shù)Jnum(a, b),對評分數(shù)目小于平均項目數(shù)的用戶進 行相似度值的懲罰:其中#13表示用戶a對整體項目的評分數(shù)目,#1 ,表示用戶b對整體項目的評分數(shù)目, ^表示整體用戶的平均項目數(shù),03為用戶評分數(shù)目的四分之三分位數(shù); (2d)構(gòu)建任意兩個用戶a與b喜歡不喜歡的相似函數(shù)LD (a,b)如下:其中表示用戶U對已經(jīng)評價項目的評分平均值; 2e)結(jié)合改進的Jaccard函數(shù)Jnum (a, b)和喜歡不喜歡相似函數(shù)LD (a, b),構(gòu)建任意兩 個用戶a與b最終的相似度函數(shù)sim(a, b): sim(a, b) = LD (a, b) · Jnun (a, b); (3)根據(jù)步驟(2)所構(gòu)建的任意兩個用戶a與b最終相似度函數(shù)sim (a,b),計算所有 用戶兩兩之間的相似度,選擇與目標用戶相似程度最高的k個鄰居用戶,根據(jù)所選的k個鄰 居的項目評分數(shù)據(jù),對目標用戶未評分項目進行評分預(yù)測; ⑷根據(jù)預(yù)測評分,對目標用戶未評分項目進行分數(shù)值從大到小的排列,篩選出前N個 項目即產(chǎn)生對用戶的推薦項目,2〈 = N〈 = 20。2.根據(jù)權(quán)利要求1中所述的方法,根據(jù)所述步驟(3)中根據(jù)所選的k個鄰居的項目評 分數(shù)據(jù),對目標用戶未評分項目進行評分預(yù)測,按如下步驟進行: (3a)將目標用戶與其他用戶的相似度按照從大到小的順序排列,取排列順序中最前面 的k個用戶作為目標用戶的鄰居用戶,k> = 50 ; (3b)獲取k個鄰居用戶后,通過下式對目標用戶未評分的項目進行評分預(yù)測:其中,Piu為目標用戶u對未評分項目i的預(yù)測評分值,sim(u,η)為目標用戶u與鄰居 用戶η的相似度值,卩"為用戶η對已經(jīng)評價項目的評分平均值,Ku為k個鄰居用戶集合,Hiu為集合Ku中對項目i評分的鄰居用戶集合,η為HUii集合中的用戶。
【專利摘要】本發(fā)明公開一種基于模糊機制用戶評分鄰域信息的協(xié)同過濾推薦方法。其技術(shù)方案是:1.獲取用戶對項目的評分信息,創(chuàng)建評分矩陣;2.根據(jù)評分矩陣計算用戶評分隸屬度,根據(jù)項目上下文信息計算項目對相似度的貢獻率;3.根據(jù)評分隸屬度和相似度的貢獻率,構(gòu)建用戶喜歡不喜歡相似度;4.對評分數(shù)目小的用戶進行相似度值的縮減,構(gòu)建用戶Jnum相似度;5.根據(jù)用戶喜歡不喜歡相似度和用戶Jnum相似度,構(gòu)建用戶最終相似度;6.根據(jù)最終相似度,選取相似度值最高的前K個作為參考鄰居用戶,完成對目標用戶的預(yù)測。實驗仿真結(jié)果表明,本發(fā)明比傳統(tǒng)協(xié)同過濾算法能得到更好的推薦質(zhì)量,可用于向用戶推薦感興趣的項目。
【IPC分類】G06F17/30
【公開號】CN104899246
【申請?zhí)枴緾N201510170406
【發(fā)明人】慕彩紅, 焦李成, 王孝奇, 劉紅英, 熊濤, 劉若辰, 馬文萍, 楊淑媛, 柴文壹
【申請人】西安電子科技大學(xué)
【公開日】2015年9月9日
【申請日】2015年4月12日