欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于用戶興趣模型的電影個(gè)性化相似度計(jì)算方法

文檔序號(hào):6638036閱讀:1176來(lái)源:國(guó)知局
一種基于用戶興趣模型的電影個(gè)性化相似度計(jì)算方法
【專利摘要】本發(fā)明公開(kāi)了一種基于用戶興趣模型的電影個(gè)性化相似度計(jì)算方法,該方法根據(jù)用戶的歷史行為,即通過(guò)個(gè)性化電影推薦系統(tǒng)平臺(tái),挖掘用戶對(duì)電影資源庫(kù)的各種搜索行為以及觀影和收藏行為;充分挖掘和分析不同用戶在電影的演員、導(dǎo)演、類型、地區(qū)、時(shí)間、內(nèi)容簡(jiǎn)介這六個(gè)基本屬性上的不同的偏愛(ài)程度,即得到用戶模型的第一層六維空間向量表示;根據(jù)用戶上述行為,通過(guò)關(guān)鍵字提取或者語(yǔ)義分析,分析不同用戶在上述六個(gè)維度上各特征值所占的權(quán)重,即得到用戶模型的第二層六維空間向量表示;用一個(gè)兩層的多維空間向量表示用戶的興趣模型,基于用戶的興趣模型和電影的基本內(nèi)容特征,針對(duì)不同用戶生成不同的電影相似度列表,從而提高推薦的效果。
【專利說(shuō)明】一種基于用戶興趣模型的電影個(gè)性化相似度計(jì)算方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于老用戶興趣模型的電影個(gè)性化相似度計(jì)算方法、以及一種針 對(duì)新用戶的電影個(gè)性化相似度計(jì)算方法。

【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的飛速發(fā)展,面對(duì)日益更新的海量電影資源,個(gè)性化推薦應(yīng)用也就隨 機(jī)產(chǎn)生。
[0003] 當(dāng)前主要流行的推薦算法有:基于關(guān)聯(lián)規(guī)則的推薦、基于知識(shí)的推薦、基于內(nèi)容的 推薦、協(xié)同過(guò)濾推薦和組合推薦等。以上推薦算法均涉及到一個(gè)關(guān)鍵技術(shù),即:計(jì)算物品間 相似度,根據(jù)相似度找到物品的最近鄰居。傳統(tǒng)的計(jì)算電影相似度的方法都只跟電影自身 的內(nèi)容特征有關(guān),沒(méi)有考慮不同用戶的興趣偏好對(duì)電影的影響。按照現(xiàn)有的計(jì)算方法體現(xiàn) 不出個(gè)性化的特點(diǎn),這樣的用戶體驗(yàn)很難得到用戶滿意。
[0004] 在真正的個(gè)性化推薦系統(tǒng)中,用戶興趣模型是基礎(chǔ)、個(gè)性化推薦算法是核心。個(gè)性 化電影推薦應(yīng)該充分考慮三個(gè)方面的信息來(lái)源:1)用戶信息庫(kù),即用戶的基本信息,包括 年齡、性別、職業(yè)等;2)商品信息庫(kù),即電影的屬性信息,包括演員、導(dǎo)演、類型、內(nèi)容簡(jiǎn)介、 地區(qū)、發(fā)布時(shí)間等;3)用戶歷史信息庫(kù),即用戶使用過(guò)程中的歷史記錄,包括對(duì)演員、導(dǎo)演、 類型、地區(qū)、發(fā)布時(shí)間、內(nèi)容簡(jiǎn)介等各方面不同的偏愛(ài)程度。以上信息來(lái)源非常關(guān)鍵,只有充 分利用此信息庫(kù)建立用戶興趣模型,才能做到更好的推薦。


【發(fā)明內(nèi)容】

[0005] 針對(duì)現(xiàn)有技術(shù)中存在的上述技術(shù)問(wèn)題,本發(fā)明提出了一種基于老用戶興趣模型的 電影個(gè)性化相似度計(jì)算方法,通過(guò)充分挖掘和利用用戶的歷史數(shù)據(jù),建立每個(gè)用戶各自的 用戶興趣模型,然后基于用戶興趣模型計(jì)算電影相似度,形成個(gè)性化的電影相似度列表。
[0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0007] -種基于老用戶興趣模型的電影個(gè)性化相似度計(jì)算方法,包括步驟:
[0008] Sl、基于某段時(shí)間T內(nèi)的用戶行為數(shù)據(jù)和該段時(shí)間內(nèi)觀影記錄中評(píng)價(jià)最高的N部 電影,建立用戶動(dòng)態(tài)行為信息庫(kù);
[0009] S2、對(duì)上述用戶動(dòng)態(tài)行為信息庫(kù)進(jìn)行數(shù)據(jù)挖掘,得到用戶對(duì)電影各維度的偏好、以 及用戶對(duì)電影中各維度上特征值的偏好,構(gòu)建用戶興趣模型;其中,
[0010] (1)用戶對(duì)電影各維度的偏好采用空間向量可表示為一個(gè)六元組,即:
[0011] V = (V1IW1, V2:w2, V3:w3, V4:w4, V5:w5, , V6:w6} (LI)
[0012] Vi表示電影的維度,Wi表示用戶對(duì)電影各個(gè)維度的權(quán)重,i e [1,6],且 /=1
[0013] 通過(guò)對(duì)用戶的搜索行為、條件查詢行為的統(tǒng)計(jì)分析,以及對(duì)T段時(shí)間內(nèi)用戶高評(píng) 分的N部電影的特征提取,挖掘用戶在演員、導(dǎo)演、類型、地區(qū)、時(shí)間和內(nèi)容簡(jiǎn)介六個(gè)維度不 同的偏好程度,求得各維度權(quán)重Wi;
[0014] (2)用戶對(duì)電影中各維度上特征值的偏好可表示為:Vi= ITij = WijI (1.2)
[0015] 式中,Tij為第i維度中的第j個(gè)特征值,W u為第i維度中特征值j的權(quán)重,且 Ywij = I-,
[0016] 通過(guò)用戶的搜索行為,挖掘用戶感興趣的演員和導(dǎo)演信息,通過(guò)用戶對(duì)類型、時(shí) 間、地區(qū)不同條件下的篩選查看,挖掘用戶對(duì)這三個(gè)維度上感興趣的特征值信息;通過(guò)分析 用戶高評(píng)分的N條觀影記錄和收藏記錄,提取電影各維度特征值信息;
[0017] 綜合以上分析,計(jì)算各維度各特征值的權(quán)重,即:
[0018] Vij= w ^ffij (1. 3)
[0019] 式中,Vij表示在第i維度中第j個(gè)特征值的興趣度,i e [1,6],j e [1,n);
[0020] S3、通過(guò)用戶興趣模型對(duì)電影六個(gè)維度的分析,根據(jù)公式(I. 4)計(jì)算電影A和電影 B之間各維度的相似度,生成個(gè)性化電影相似度表;

【權(quán)利要求】
1. 一種基于老用戶興趣模型的電影個(gè)性化相似度計(jì)算方法,其特征在于,包括步驟: Sl、基于某段時(shí)間T內(nèi)的用戶行為數(shù)據(jù)和該段時(shí)間內(nèi)觀影記錄中評(píng)價(jià)最高的N部電影, 建立用戶動(dòng)態(tài)行為信息庫(kù); s2、對(duì)上述用戶動(dòng)態(tài)行為信息庫(kù)進(jìn)行數(shù)據(jù)挖掘,得到用戶對(duì)電影各維度的偏好、以及用 戶對(duì)電影中各維度上特征值的偏好,構(gòu)建用戶興趣模型;其中, (1) 用戶對(duì)電影各維度的偏好采用空間向量可表示為一個(gè)六元組,即: V= (V1Iw1,V2:w2,V3:w3,V4:w4,V5:w5, ,V6:w6} (LI) Vi表示電影的維度,Wi表示用戶對(duì)電影各個(gè)維度的權(quán)重,ie[1,6],且 /-1 通過(guò)對(duì)用戶的搜索行為、條件查詢行為的統(tǒng)計(jì)分析,以及對(duì)T段時(shí)間內(nèi)用戶高評(píng)分的N部電影的特征提取,挖掘用戶在演員、導(dǎo)演、類型、地區(qū)、時(shí)間和內(nèi)容簡(jiǎn)介六個(gè)維度不同的偏 好程度,求得各維度權(quán)重wi; (2) 用戶對(duì)電影中各維度上特征值的偏好可表示為:Vi={T^WijI(1.2) η 式中,為第i維度中的第j個(gè)特征值,Wu為第i維度中特征值j的權(quán)重,且Σ% = 1; 通過(guò)用戶的搜索行為,挖掘用戶感興趣的演員和導(dǎo)演信息,通過(guò)用戶對(duì)類型、時(shí)間、地 區(qū)不同條件下的篩選查看,挖掘用戶對(duì)這三個(gè)維度上感興趣的特征值信息;通過(guò)分析用戶 高評(píng)分的N條觀影記錄和收藏記錄,提取電影各維度特征值信息; 綜合以上分析,計(jì)算各維度各特征值的權(quán)重,即: Vij=w^ffij (1. 3) 式中,Vij表示在第i維度中第j個(gè)特征值的興趣度,ie[1,6],je[1,n);s3、通過(guò)用戶興趣模型對(duì)電影六個(gè)維度的分析,根據(jù)公式(1.4)計(jì)算電影A和電影B之 間各維度的相似度,生成個(gè)性化電影相似度表;
式中,ie[1,4],分別表示電影的演員、導(dǎo)演、類型、地區(qū)四個(gè)維度,j表示維度上特征 值,Vu表示電影在第i個(gè)維度上第j個(gè)特征值的權(quán)重; 電影A和電影B在時(shí)間維度上的相似度計(jì)算公式為: 式中,Date農(nóng)不當(dāng)前的時(shí)丨日」,
1\農(nóng)不電影A的友布時(shí)丨日」,U8表示電影B的發(fā)布時(shí)間,min()表示取最小值,max()表示取最大值; 電影A和電影B在內(nèi)容簡(jiǎn)介維度上的相似度計(jì)算公式為sim(M6A,M6B),利用Simhash算 法計(jì)算得到; s4、根據(jù)s2和s3中得到的各維度權(quán)重及其各維度相似度,利用公式(1. 6)計(jì)算電影相 似度:
式中,Wi表示對(duì)應(yīng)各維度的權(quán)重,Sim(Mi^MiB)表示對(duì)應(yīng)各維度的相似度,ie[1,6]。
2. -種針對(duì)新用戶的電影個(gè)性化相似度計(jì)算方法,其特征在于,包括如下步驟: sl、抽取每部電影的演員信息、導(dǎo)演信息、類型信息和地區(qū)信息、時(shí)間信息和內(nèi)容簡(jiǎn)介 信息,形成六維向量空間; s2、基于用戶顯性信息對(duì)該用戶做分類處理,找到與該用戶最相似的簇群,運(yùn)用統(tǒng)計(jì)學(xué) 方法分析該人群在演員、導(dǎo)演、類型、地區(qū)、發(fā)布時(shí)間和內(nèi)容簡(jiǎn)介六個(gè)維度上的平均偏好; s3、基于電影自身內(nèi)容特征,采用各維度加權(quán)求和的方法計(jì)算電影相似度,即: Sim = WJXJ+W2X2+W3X3+W4X4+W5X5+W6X6 (2. 1) 式中,Wi表示對(duì)應(yīng)各維度的權(quán)重,ie[1,6],此值通過(guò)步驟s2中的方法計(jì)算得到;Xi 分別表示演員、導(dǎo)演、類型、地區(qū)、發(fā)布時(shí)間五個(gè)維度的相似度,ie[1,5],利用余弦相似度 公式(2. 2)計(jì)算得到:
內(nèi)容簡(jiǎn)介維度上的相似度值X6,則利用Simhash算法計(jì)算得到。
【文檔編號(hào)】G06F17/30GK104462385SQ201410753644
【公開(kāi)日】2015年3月25日 申請(qǐng)日期:2014年12月10日 優(yōu)先權(quán)日:2014年12月10日
【發(fā)明者】趙建立, 張春升, 吳文敏, 孟芳 申請(qǐng)人:山東科技大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
周至县| 晋州市| 贺兰县| 阿拉尔市| 洱源县| 香格里拉县| 新郑市| 寿宁县| 长丰县| 上林县| 喀喇沁旗| 贡嘎县| 宁河县| 顺义区| 葵青区| 红桥区| 珠海市| 潍坊市| 建宁县| 泰州市| 仪陇县| 象山县| 富民县| 赣榆县| 时尚| 古田县| 舞钢市| 河源市| 汉源县| 横山县| 敦煌市| 桃源县| 潍坊市| 通海县| 宣城市| 西宁市| 维西| 灵寿县| 灵武市| 随州市| 福海县|