欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于聚類的增量數(shù)字圖書推薦方法

文檔序號:6540221閱讀:284來源:國知局
一種基于聚類的增量數(shù)字圖書推薦方法
【專利摘要】本發(fā)明公開了一種基于聚類的增量數(shù)字圖書推薦方法。它包括以下步驟:(1)從用戶的網(wǎng)站訪問日志獲取用戶閱讀書籍的信息,然后生成用戶表示向量;(2)使用維度數(shù)組來選擇需要計(jì)算的簇集,然后計(jì)算用戶與簇集之間的余弦相似度形成候選集;(3)從候選集中找出與目標(biāo)用戶相似度最高的簇,然后根據(jù)合并結(jié)果進(jìn)行聚類,并增量式地更新簇心、簇直徑;(4)使用簇心值作為排序函數(shù)將簇內(nèi)項(xiàng)目進(jìn)行排序,將排序高的項(xiàng)目作為推薦結(jié)果。本發(fā)明可以通過從用戶的圖書訪問日志挖掘用戶對書籍的喜好信息,然后為用戶進(jìn)行推薦,提高了推薦方法的擴(kuò)展性和實(shí)時(shí)性,增強(qiáng)了數(shù)字圖書資源利用率和用戶的閱讀體驗(yàn)。
【專利說明】一種基于聚類的增量數(shù)字圖書推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及推薦系統(tǒng)、增量式學(xué)習(xí)和數(shù)字圖書館等領(lǐng)域,尤其涉及一種基于聚類的增量數(shù)字圖書推薦方法。
【背景技術(shù)】
[0002]數(shù)字圖書館中擁有海量的數(shù)字圖書資源,如何讓讀者對這些豐富而寶貴的數(shù)字圖書資源進(jìn)行利用并能有更好的使用體驗(yàn)就顯得非常的重要。傳統(tǒng)的基于檢索的信息獲取技術(shù)已經(jīng)不能完全滿足人們的需求,個(gè)性化推薦正逐漸成為數(shù)字圖書館不可或缺的部分。
[0003]傳統(tǒng)的推薦方法十分有效且易于解釋,但是由于在推薦過程中需要將載入并查看整個(gè)數(shù)據(jù)集,這十分消耗存儲空間和運(yùn)算時(shí)間。隨著數(shù)據(jù)規(guī)模的增大,這種做法變得低效且十分受限于可用資源。數(shù)字圖書館資源和用戶的增多對其推薦系統(tǒng)的擴(kuò)展性和實(shí)時(shí)性提出了更高的要求。
[0004]增量式學(xué)習(xí)有時(shí)也被稱為在線學(xué)習(xí)。增量式學(xué)習(xí)通常指在線學(xué)習(xí)模型的過程,而這個(gè)模型通常也可以被批量式學(xué)習(xí)方法所學(xué)習(xí)。當(dāng)學(xué)習(xí)模型的數(shù)據(jù)規(guī)模過大或者不是一次性都能夠獲得,而是像數(shù)據(jù)流一樣隨著時(shí)間的推移逐漸獲得,且根據(jù)已獲得數(shù)據(jù)學(xué)習(xí)的模型需要及時(shí)投入使用時(shí),增量式學(xué)習(xí)是十分有用的,它可以使用新到的數(shù)據(jù)在原先模型基礎(chǔ)上直接更新,無疑會大大提高學(xué)習(xí)方法的效率。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的是克服了數(shù)字圖書館中傳統(tǒng)圖書推薦效率不高、實(shí)時(shí)性較差的缺點(diǎn),提供一種高質(zhì)量、新穎的基于聚類的增量數(shù)字圖書推薦方法。
[0006]一種基于聚類的增量數(shù)字圖書推薦方法包括以下步驟:
(O從用戶的網(wǎng)站訪問日志獲取用戶閱讀書籍的信息,然后生成用戶表示向量;
(2)使用維度數(shù)組來選擇需要計(jì)算的簇集,然后根據(jù)用戶表示向量使用余弦相似度計(jì)算用戶與簇集之間的相似度形成候選集;
(3)從候選集中找出與目標(biāo)用戶相似度最高的簇,然后根據(jù)合并結(jié)果進(jìn)行聚類,并增量式地更新簇心、簇直徑;
(4)根據(jù)聚類結(jié)果,使用簇心值作為排序函數(shù)將簇內(nèi)鏈接的項(xiàng)目進(jìn)行排序,將排序高的項(xiàng)目作為推薦結(jié)果提供給用戶;
所述的步驟I)包括:從用戶的網(wǎng)站訪問日志獲取用戶閱讀書籍的信息,然后生成用戶表示向量;用二值的向量來描述用戶,假設(shè)有一個(gè)給定的用戶集合
【權(quán)利要求】
1.一種基于聚類的增量數(shù)字圖書推薦方法,其特征在于,它包括以下步驟: (1)從用戶的網(wǎng)站訪問日志獲取用戶閱讀書籍的信息,然后生成用戶表示向量; (2)使用維度數(shù)組來選擇需要計(jì)算的簇集,然后根據(jù)用戶表示向量使用余弦相似度計(jì)算用戶與簇集之間的相似度形成候選集; (3)從候選集中找出與目標(biāo)用戶相似度最高的簇,然后根據(jù)合并結(jié)果進(jìn)行聚類,并增量式地更新簇心、簇直徑; (4)根據(jù)聚類結(jié)果,使用簇心值作為排序函數(shù)將簇內(nèi)鏈接的項(xiàng)目進(jìn)行排序,將排序高的項(xiàng)目作為推薦結(jié)果提供給用戶。
2.根據(jù)權(quán)利I所述的一種基于聚類的增量數(shù)字圖書推薦方法,其特征在于:所述的步驟I)包括:從用戶的網(wǎng)站訪問日志獲取用戶閱讀書籍的信息,然后生成用戶表示向量;用二值的向量來描述用戶,假設(shè)有一個(gè)給定的用戶集合U =…,Um],以及一個(gè)項(xiàng)目集合/ =…,in),把每個(gè)用戶W7表示成一個(gè)η維向量,向量的每一維對應(yīng)于一個(gè)項(xiàng)目,一個(gè)用戶U1 B的特征向量的第j維是:

3.根據(jù)權(quán)利I所述的一種基于聚類的增量數(shù)字圖書推薦方法,其特征在于:所述的步驟2)包括:使用維度數(shù)組來選擇需要計(jì)算的簇集,然后根據(jù)用戶表示向量使用余弦相似度計(jì)算用戶與簇集之間的相似度形成候選集;利用維度數(shù)組在已生成的簇中尋找與用戶"最相似的簇G首先將候選集置空,然后對于當(dāng)前用戶表示的每一個(gè)非零項(xiàng)所指向的維度數(shù)組鏈接到的簇并入候選集C-Set ;聚類時(shí),每一個(gè)簇有一個(gè)中心,簇心是該簇類所有用戶表示向量的平均值,可以如下增量式地計(jì)算:
4.根據(jù)權(quán)利I所述的一種基于聚類的增量數(shù)字圖書推薦方法,其特征在于:所述的步驟3)包括:從候選集中找出與目標(biāo)用戶相似度最高的簇,然后根據(jù)合并結(jié)果進(jìn)行聚類,并增量式地更新簇心、簇直徑;使用簇直徑公式來評估簇的緊密程度,其增量式的計(jì)算公式如下:

5.根據(jù)權(quán)利I所述的一種基于聚類的增量數(shù)字圖書推薦方法,其特征在于:所述的步驟4)包括:根據(jù)聚類結(jié)果,使用簇心值作為排序函數(shù)將簇內(nèi)鏈接的項(xiàng)目進(jìn)行排序,將排序高的項(xiàng)目作為推薦結(jié)果提供給用戶;推薦結(jié)果是根據(jù)用戶所屬的簇來產(chǎn)生的;每一個(gè)簇有一些用戶,且維度數(shù)組的一些項(xiàng)鏈接到該簇,簇心代表了該簇中用戶的興趣,簇心表示向量的第j維代表簇中有多少成 員評過了項(xiàng)目j。
【文檔編號】G06F17/30GK103886048SQ201410090123
【公開日】2014年6月25日 申請日期:2014年3月13日 優(yōu)先權(quán)日:2014年3月13日
【發(fā)明者】張寅 , 王宇奇, 伊燈, 莊越挺, 魏寶剛 申請人:浙江大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
志丹县| 横峰县| 长岭县| 于田县| 灵川县| 霍山县| 阜新市| 科尔| 苗栗县| 昌乐县| 吴忠市| 巢湖市| 广宁县| 黄浦区| 禹城市| 宁陵县| 岑巩县| 宜都市| 定远县| 仪陇县| 舟山市| 天门市| 武义县| 潮州市| 南陵县| 通江县| 宜都市| 兴安盟| 涞源县| 烟台市| 黄浦区| 武邑县| 大安市| 古田县| 合肥市| 宁蒗| 三门峡市| 枣庄市| 昌邑市| 西充县| 绥阳县|