欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于模糊機(jī)制用戶評(píng)分鄰域信息的協(xié)同過濾推薦方法

文檔序號(hào):8922613閱讀:516來源:國知局
基于模糊機(jī)制用戶評(píng)分鄰域信息的協(xié)同過濾推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于協(xié)同過濾推薦技術(shù)領(lǐng)域,具體涉及一種基于模糊機(jī)制的用戶評(píng)分鄰域 信息來構(gòu)建用戶相似度的協(xié)同過濾推薦方法,可用于網(wǎng)絡(luò)項(xiàng)目推薦。
【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展加重了信息過載的問題,面對(duì)海量的數(shù)據(jù)用戶很難發(fā)現(xiàn)自 己感興趣的內(nèi)容。推薦系統(tǒng)在上世紀(jì)90年代首次被提出便得到了廣泛的關(guān)注,該系統(tǒng)根據(jù) 用戶的歷史行為信息,建立用戶與項(xiàng)目,例如:產(chǎn)品、電影、音樂等之間得關(guān)系,找到用戶感 興趣的項(xiàng)目并將其推薦給用戶。近些年來推薦系統(tǒng)應(yīng)用日益廣泛,如電子商務(wù),圖書等多個(gè) 方面。一些網(wǎng)站通過收集和分析用戶的購買歷史,預(yù)測(cè)用戶感興趣的商品并將其推薦給用 戶,從而提高了銷售業(yè)務(wù)。
[0003]目前,已存在許多經(jīng)典的推薦系統(tǒng),協(xié)同過濾推薦算法是推薦系統(tǒng)中最早被提出 并得到廣泛應(yīng)用的一種推薦算法。協(xié)同過濾推薦技術(shù)主要分為兩大類:基于模型的協(xié)同過 濾和基于內(nèi)存的協(xié)同過濾。與傳統(tǒng)的基于內(nèi)容的推薦不同,協(xié)同過濾算法的核心思想是分 析用戶的興趣,在用戶群中找到與目標(biāo)用戶相似的鄰居用戶。通過分析這些鄰居用戶對(duì)某 一物品的綜合評(píng)價(jià),最后形成該目標(biāo)用戶對(duì)此物品的喜好程度的預(yù)測(cè),推薦形式有評(píng)分預(yù) 測(cè)及Top-N推薦。
[0004] 協(xié)同過濾推薦算法主要通過相似度來預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分,相似度可進(jìn)一步分 為基于用戶的相似度和基于項(xiàng)目的相似度,相似度的度量準(zhǔn)確性直接關(guān)系整個(gè)推薦系統(tǒng)的 推薦質(zhì)量。與一般的推薦系統(tǒng)相比,協(xié)同過濾推薦系統(tǒng)具有兩大優(yōu)勢(shì):一是可以發(fā)現(xiàn)用戶潛 在的但用戶自身尚未覺察的興趣偏好;二是對(duì)推薦的對(duì)象沒有特殊的要求,即可以處理電 影、音樂等難以用文本結(jié)構(gòu)化的表示對(duì)象。但是隨著電子商務(wù)系統(tǒng)的規(guī)模的不斷擴(kuò)大,用戶 數(shù)目和項(xiàng)目的數(shù)據(jù)急劇增加,加劇了用戶項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)的稀疏特性。在用戶評(píng)分?jǐn)?shù)據(jù)極 端稀疏的情況下,難以找到用戶間的共同評(píng)分項(xiàng)目,使得傳統(tǒng)的相似性度量方法存在著一 定的偶然性,計(jì)算得到的目標(biāo)用戶及項(xiàng)目的最近鄰不準(zhǔn)確甚至無法計(jì)算相似性,從而導(dǎo)致 推薦系統(tǒng)的推薦質(zhì)量下降。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的在于針對(duì)已有協(xié)同過濾推薦算法中的不足,提出一種基于模糊機(jī)制 的用戶評(píng)分上下文信息來構(gòu)建用戶的相似度,以有效的緩解用戶數(shù)據(jù)稀疏帶來的問題,提 高推薦系統(tǒng)的質(zhì)量。
[0006] 本發(fā)明的技術(shù)方案是:運(yùn)用模糊邏輯創(chuàng)建用戶的評(píng)分隸屬度函數(shù),緩解尖銳的評(píng) 分邊界問題。通過項(xiàng)目的上下文信息,充分挖掘項(xiàng)目對(duì)用戶相似度的貢獻(xiàn)率。通過懲罰評(píng) 分?jǐn)?shù)目較小的用戶的相似度,緩解評(píng)分?jǐn)?shù)據(jù)的稀疏性帶來的難以描述用戶偏好問題。其實(shí) 現(xiàn)步驟包括如下:
[0007] (1)從原始的用戶-物品-評(píng)分-時(shí)間這四維數(shù)據(jù)中獲取用戶U對(duì)項(xiàng)目I的評(píng)分 信息,創(chuàng)建用戶對(duì)項(xiàng)目的評(píng)分矩陣R(nxp),其中n代表用戶的數(shù)目,p代表項(xiàng)目的數(shù)目;
[0008] (2)根據(jù)用戶的評(píng)分矩陣,確定任意兩個(gè)用戶a與用戶b的相似度值sim(a, b):
[0009] (2a)運(yùn)用軟劃分機(jī)制,分別構(gòu)建用戶u對(duì)項(xiàng)目i評(píng)分的喜歡隸屬度Lui和用戶u 對(duì)項(xiàng)目i評(píng)分的不喜歡隸屬度Dui :
[0012] 其中ru i為用戶u對(duì)項(xiàng)目i的評(píng)分,m為推薦系統(tǒng)用戶評(píng)分的最小值,M為推薦系 統(tǒng)用戶評(píng)分的最大值,對(duì)于評(píng)分范圍在1到5之間的數(shù)值,則m為1,M為5 ;
[0013] (2b)運(yùn)用項(xiàng)目評(píng)分的上下文信息,分別構(gòu)建項(xiàng)目i評(píng)分的喜歡貢獻(xiàn)率因子Cli和 項(xiàng)目i評(píng)分的不喜歡貢獻(xiàn)率因子Cdi :
[0016] 其中叫表示整體用戶對(duì)項(xiàng)目i的評(píng)分人數(shù);
[0017] (2c)運(yùn)用如下改進(jìn)的Jaccard函數(shù)Jnum(a, b),對(duì)評(píng)分?jǐn)?shù)目小于平均項(xiàng)目數(shù)的用 戶進(jìn)行相似度值的縮減:
[0019]其中
[0022] 其中#13表示用戶a對(duì)整體項(xiàng)目的評(píng)分?jǐn)?shù)目,#1 1表示用戶b對(duì)整體項(xiàng)目的評(píng)分?jǐn)?shù) 目,Iu表示整體用戶的平均項(xiàng)目數(shù),Q 3為用戶評(píng)分?jǐn)?shù)目的四分之三分位數(shù);
[0023] (2d)構(gòu)建任意兩個(gè)用戶a與b喜歡不喜歡的相似函數(shù)LD (a,b)如下:
[0025]其中
[0028] 其中6表示用戶u對(duì)已經(jīng)評(píng)價(jià)項(xiàng)目的評(píng)分平均值;
[0029]2e)結(jié)合改進(jìn)的Jaccard函數(shù)Jnum(a, b)和喜歡不喜歡相似函數(shù)LD(a, b),構(gòu)建任 意兩個(gè)用戶a與b最終的相似度函數(shù)sim(a, b):
[0030] sim(a, b) =LD(a, b) ?Jnun(a, b);
[0031] (3)根據(jù)步驟⑵所構(gòu)建的任意兩個(gè)用戶a與b最終相似度函數(shù)sim (a,b),計(jì)算 所有用戶兩兩之間的相似度,選擇與目標(biāo)用戶相似程度最高的k個(gè)鄰居用戶,根據(jù)所選的k 個(gè)鄰居的項(xiàng)目評(píng)分?jǐn)?shù)據(jù),對(duì)目標(biāo)用戶未評(píng)分項(xiàng)目進(jìn)行評(píng)分預(yù)測(cè);
[0032] (4)根據(jù)預(yù)測(cè)評(píng)分,對(duì)目標(biāo)用戶未評(píng)分項(xiàng)目進(jìn)行分?jǐn)?shù)值從大到小的排列,篩選出前 N個(gè)項(xiàng)目即產(chǎn)生對(duì)用戶的推薦項(xiàng)目,2〈= N〈= 20。
[0033]本發(fā)明與現(xiàn)有的技術(shù)相比具有以下技術(shù)優(yōu)勢(shì):
[0034] 1)本發(fā)明通過模糊邏輯構(gòu)建用戶的評(píng)分隸屬度函數(shù),緩解了傳統(tǒng)評(píng)分硬劃分存在 的尖銳邊界問題。
[0035] 2)本發(fā)明通過項(xiàng)目的上下文信息,充分挖掘整體用戶對(duì)項(xiàng)目的偏好程度進(jìn)而構(gòu)建 項(xiàng)目對(duì)相似度的貢獻(xiàn)率,克服了項(xiàng)目的單一權(quán)值對(duì)相似度的構(gòu)建帶來的不準(zhǔn)確性問題。
[0036] 3)本發(fā)明通過改進(jìn)的Jaccard相似函數(shù),使評(píng)分?jǐn)?shù)目較小的用戶的相似度處以懲 罰,提高了推薦的準(zhǔn)確率。
【附圖說明】
[0037] 圖1是本發(fā)明的實(shí)現(xiàn)流程圖;
[0038]圖2是本發(fā)明和其它對(duì)比方法的平均絕對(duì)誤差隨k個(gè)鄰居用戶數(shù)量變化的仿真結(jié) 果圖;
[0039]圖3是本發(fā)明和其它對(duì)比方法的推薦覆蓋率隨k個(gè)鄰居用戶數(shù)量變化的仿真結(jié)果 圖;
[0040] 圖4是本發(fā)明和其它對(duì)比方法的推薦準(zhǔn)確率隨n個(gè)推薦項(xiàng)目數(shù)量變化的仿真結(jié)果 圖;
[0041] 圖5是本發(fā)明和其它對(duì)比方法的推薦召回率隨n個(gè)推薦項(xiàng)目數(shù)量變化的仿真結(jié)果 圖。
【具體實(shí)施方式】
[0042] 以下結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施作進(jìn)一步的詳細(xì)描述,本實(shí)例以用戶對(duì)電影的 推薦為例但不是用來限制本發(fā)明的范圍,例如本發(fā)明可用于網(wǎng)頁、商品的推薦等。
[0043]參照?qǐng)D1,本發(fā)明的實(shí)現(xiàn)步驟如下:
[0044]步驟1:創(chuàng)建用戶項(xiàng)目評(píng)分矩陣。
[0045]從原始的用戶_物品-評(píng)分-時(shí)間這四維數(shù)據(jù)中獲取用戶U對(duì)項(xiàng)目I的評(píng)分信息, 創(chuàng)建用戶評(píng)分矩陣R(nxp),其中n代表用戶的數(shù)目,p代表項(xiàng)目的數(shù)目。
[0046] 步驟2 :計(jì)算任意兩個(gè)用戶的相似度。
[0047] 2a)運(yùn)用模糊軟劃分機(jī)制,分別構(gòu)建用戶u對(duì)項(xiàng)目i評(píng)分的喜歡隸屬度Lui和用戶 u對(duì)項(xiàng)目i評(píng)分的不喜歡隸屬度Dui :
[0050]其中ru i為用戶u對(duì)項(xiàng)目i的評(píng)分,m為推薦系統(tǒng)用戶評(píng)分的最小值,M為推薦系 統(tǒng)用戶評(píng)分的最大值,對(duì)于評(píng)分范圍在1到5之間的數(shù)值,則m為1,M為5 ;
[0051] 2b)運(yùn)用項(xiàng)目評(píng)分的上下文信息,分別構(gòu)建項(xiàng)目i評(píng)分的喜歡貢獻(xiàn)率因子Cli和項(xiàng) 目i評(píng)分的不喜歡貢獻(xiàn)率因子Cdi :
[0054] 其中表示整體用戶對(duì)項(xiàng)目i的評(píng)分人數(shù),項(xiàng)目i喜歡貢獻(xiàn)率因子Cli取值范 圍0〈= Cli〈= 1和不喜歡貢獻(xiàn)率因子的Cdi取值范圍0〈= Cdi〈= 1 ;
[0055] 2c)構(gòu)建任意兩個(gè)用戶a與b喜歡不喜歡的相似函數(shù)LD (a,b):
[0057]其中
[0060] 5表示用戶u對(duì)已經(jīng)評(píng)價(jià)項(xiàng)目的評(píng)分平均值,q為兩個(gè)用戶a與b共同評(píng)分的項(xiàng) 目數(shù)目;
[0061] 2d)運(yùn)用如下改進(jìn)的Jaccard函數(shù)Jnum(a, b),對(duì)評(píng)分?jǐn)?shù)目小于平均項(xiàng)目數(shù)的用戶 進(jìn)行相似度值的縮減,緩解用戶評(píng)分?jǐn)?shù)目小帶來的相似度不穩(wěn)定性問題:
[0063]其中
[0066]其中#13表示用戶a對(duì)整體項(xiàng)目的評(píng)分?jǐn)?shù)目,#1 1表示用戶b對(duì)整體項(xiàng)目的評(píng)分?jǐn)?shù) 目,表示整體用戶的平均項(xiàng)目數(shù),93為用戶評(píng)分?jǐn)?shù)目的四分之三分位數(shù);
[0067]2e)結(jié)合改進(jìn)的Jaccard函數(shù)Jnum(a, b)和喜歡不喜歡相似函數(shù)LD(a, b),構(gòu)建任 意兩個(gè)用戶a與b最終的相似度函數(shù)sim(a, b):
[0068] sim(a, b) =LD(a, b) ?Jnun(a, b)〇
[0069]步驟3:選擇鄰居用戶,對(duì)目標(biāo)用戶進(jìn)行預(yù)測(cè)。
[0070] 3a)將目標(biāo)用戶與其他用戶的相似度按照從大到小的順序排列,取排列順序中最 前面的k個(gè)用戶作為目標(biāo)用戶的鄰居用戶,k> = 50 ;
[0071] 3b)獲取k個(gè)鄰居用戶后,通過下式對(duì)目標(biāo)用戶未評(píng)分的項(xiàng)目
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
丰城市| 清水县| 多伦县| 富宁县| 隆子县| 胶南市| 府谷县| 莱阳市| 安塞县| 山东| 南安市| 象山县| 宿松县| 吉林市| 大埔区| 山东| 兴化市| 沈阳市| 天津市| 龙游县| 博白县| 鸡泽县| 梁平县| 武功县| 怀宁县| 增城市| 长顺县| 赞皇县| 福建省| 禹城市| 胶南市| 五原县| 聊城市| 当涂县| 辽阳县| 天台县| 彭阳县| 革吉县| 百色市| 阿尔山市| 蓝山县|