欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種新聞推薦方法及裝置的制造方法

文檔序號(hào):9471534閱讀:289來(lái)源:國(guó)知局
一種新聞推薦方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其設(shè)及一種新聞推薦方法及裝置。
【背景技術(shù)】
[0002] 大型口戶網(wǎng)站每天發(fā)布的各類文章非常之多,但是有的文章用戶訪問(wèn)占比卻不到 10%,大量的文章無(wú)人瀏覽而得不到展示的機(jī)會(huì)。在運(yùn)種情況下,對(duì)用戶實(shí)施文章推薦是眾 多網(wǎng)站的首要選擇。然而,大型網(wǎng)站的用戶訪問(wèn)量是巨大的,每天的用戶訪問(wèn)日志量多達(dá)億 級(jí)別。尤其是新聞?lì)愇恼?,每天待發(fā)布的熱點(diǎn)新聞數(shù)量巨大,同時(shí)熱點(diǎn)新聞對(duì)時(shí)效性要求比 較高,運(yùn)也對(duì)熱點(diǎn)新聞的推薦系統(tǒng)提出了挑戰(zhàn)。
[0003] 現(xiàn)有技術(shù)中,推薦方法主要分為兩種:第一種是基于內(nèi)容的推薦,即,對(duì)物品 (item)和用戶(user)分別建模,然后計(jì)算用戶和物品的模型相似度,把和用戶的模型相似 度最高的物品推薦給用戶;第二種是基于協(xié)同過(guò)濾的推薦,即,根據(jù)用戶的訪問(wèn)記錄挖掘出 相似度,而不再根據(jù)用戶和物品本身的屬性計(jì)算相似度,并且協(xié)同過(guò)濾推薦與業(yè)務(wù)無(wú)關(guān)。
[0004] 但是在上述現(xiàn)有技術(shù)中,基于內(nèi)容的推薦通常不考慮像新聞熱點(diǎn)因素,即沒(méi)有考 慮新聞的生命周期,所W推薦效果并不理想;而基于協(xié)同過(guò)濾的推薦是基于訪問(wèn)記錄進(jìn)行 的推薦,只有被訪問(wèn)過(guò)的熱點(diǎn)新聞才能被推薦,對(duì)時(shí)效性要求非常高的熱點(diǎn)新聞來(lái)說(shuō),達(dá)不 到實(shí)時(shí)推送的效果。熱點(diǎn)新聞生命周期極其短暫,很可能下一時(shí)刻就被下一條熱點(diǎn)新聞取 代而造成無(wú)人訪問(wèn)的結(jié)果,從而導(dǎo)致訪問(wèn)記錄非常稀疏,給實(shí)施根據(jù)訪問(wèn)記錄來(lái)計(jì)算相似 度的方法造成一定程度的困難,并且計(jì)算的相似度準(zhǔn)確性不高。

【發(fā)明內(nèi)容】
陽(yáng)〇化]本發(fā)明提供一種新聞推薦方法及裝置,通過(guò)綜合用戶對(duì)新聞的真實(shí)興趣和新聞的 時(shí)效性向用戶推薦新聞,W提高推薦新聞的準(zhǔn)確率。
[0006] 本發(fā)明第一方面提供一種新聞推薦方法,包括:
[0007] 將新聞按照內(nèi)容進(jìn)行分類;獲取選定時(shí)刻用戶對(duì)各類新聞的點(diǎn)擊量和所有用戶對(duì) 各類新聞的點(diǎn)擊總量,并根據(jù)各類新聞的所述點(diǎn)擊量和所述點(diǎn)擊總量,計(jì)算得到所述用戶 在所述選定時(shí)刻的新聞興趣模型;按照所述選定時(shí)刻的新聞興趣模型,加權(quán)平均得到包含 多個(gè)所述選定時(shí)刻的預(yù)置時(shí)間段內(nèi)的最終新聞興趣模型;按照所述最終新聞興趣模型聚類 各用戶,并根據(jù)所述最終新聞興趣模型及新聞熱度確定向聚類后的各類用戶推薦的新聞候 選集;將所述新聞候選集中的新聞推薦給所述用戶。
[0008] 本發(fā)明第二方面提供一種新聞推薦裝置,包括:
[0009]分類模塊,用于將新聞按照內(nèi)容進(jìn)行分類;獲取模塊,用于獲取選定時(shí)刻用戶對(duì)各 類新聞的點(diǎn)擊量和所有用戶對(duì)各類新聞的點(diǎn)擊總量;計(jì)算模塊,用于根據(jù)各類新聞的所述 點(diǎn)擊量和所述點(diǎn)擊總量,計(jì)算得到所述用戶在所述選定時(shí)刻的新聞興趣模型;所述計(jì)算模 塊,還用于按照所述選定時(shí)刻的新聞興趣模型,加權(quán)平均得到包含多個(gè)所述選定時(shí)刻的預(yù) 置時(shí)間段內(nèi)的最終新聞興趣模型;聚類模塊,用于按照所述最終新聞興趣模型聚類各用戶; 確定模塊,用于根據(jù)所述最終新聞興趣模型及新聞熱度確定向聚類后的各類用戶推薦的新 聞候選集;推薦模塊,用于將所述新聞候選集中的新聞推薦給所述用戶。
[0010] 從上述本發(fā)明實(shí)施例可知,相較于現(xiàn)有技術(shù),本發(fā)明一方面通過(guò)根據(jù)用戶對(duì)不同 類別的新聞點(diǎn)擊量W及對(duì)應(yīng)的總點(diǎn)擊量建立新聞興趣模型,平衡點(diǎn)擊分布中新聞熱度的影 響,可提高新聞推薦的合理性和準(zhǔn)確性,另一方面通過(guò)將新聞興趣度相似的用戶進(jìn)行聚類, 可加快推送速度且可保證實(shí)時(shí)性,并且通過(guò)計(jì)算當(dāng)前一段較長(zhǎng)時(shí)間內(nèi)用戶的最終新聞興趣 模型,可進(jìn)一步提高推薦準(zhǔn)確性和時(shí)效性。
【附圖說(shuō)明】
[0011] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可W根 據(jù)運(yùn)些附圖獲得其他的附圖。
[0012] 圖1是本發(fā)明第一實(shí)施例提供的新聞推薦方法的實(shí)現(xiàn)流程示意圖;
[0013] 圖2是本發(fā)明第二實(shí)施例提供的新聞推薦裝置的結(jié)構(gòu)示意圖;
[0014]圖3是本發(fā)明第=實(shí)施例提供的新聞推薦裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0015] 為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明 實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí) 施例僅僅是本發(fā)明一部分實(shí)施例,而非全部實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人 員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0016] 請(qǐng)參閱圖1,本發(fā)明第一實(shí)施例提供了一種新聞推薦方法,該方法主要包括W下步 驟:
[0017]S101、將新聞按照內(nèi)容進(jìn)行分類。
[0018] 按照內(nèi)容將新聞分類,新聞可分為社會(huì)類、軍事類、科技類、財(cái)經(jīng)類、娛樂(lè)類、教育 類等類別。
[0019] 具體地,可通過(guò)多項(xiàng)式模型的樸素貝葉斯分類算法來(lái)對(duì)新聞進(jìn)行分類,其優(yōu)點(diǎn)在 于,對(duì)熱點(diǎn)新聞之類的新聞信息,樸素貝葉斯分類算法的分類和訓(xùn)練的速度都很快。對(duì)新 聞分類的主要目的是實(shí)現(xiàn)對(duì)各網(wǎng)站口戶新聞的自動(dòng)分類,從而為用戶興趣分析提供基礎(chǔ)數(shù) 據(jù),W新聞的內(nèi)容的類別為粒度來(lái)描述用戶的興趣。
[0020] S102、獲取選定時(shí)刻用戶對(duì)各類新聞的點(diǎn)擊量和所有用戶對(duì)各類新聞的點(diǎn)擊總 量,并根據(jù)各類新聞的該點(diǎn)擊量和該點(diǎn)擊總量,計(jì)算得到該用戶在該選定時(shí)刻的新聞興趣 模型。
[0021] 需要說(shuō)明的是,用戶對(duì)新聞的點(diǎn)擊分布是指用戶對(duì)新聞的點(diǎn)擊量的分布情況,可 W反映用戶對(duì)不同類新聞的不同興趣,但由于用戶對(duì)新聞的點(diǎn)擊行為,受用戶自身的真實(shí) 興趣和新聞熱點(diǎn)兩個(gè)因素的影響,無(wú)法準(zhǔn)確的反映該用戶對(duì)新聞的真實(shí)興趣。因此,用全體 用戶的點(diǎn)擊分布平衡單個(gè)用戶的點(diǎn)擊分布中新聞熱點(diǎn)運(yùn)個(gè)因素的影響,更能反映用戶的真 實(shí)興趣。
[0022] 下面建立用戶的新聞興趣模型,該新聞興趣模型是指用戶和其感興趣的新聞的對(duì) 應(yīng)關(guān)系,即,用戶對(duì)各類新聞的新聞興趣度。獲取t時(shí)刻用戶對(duì)各類新聞的點(diǎn)擊量和所有用 戶對(duì)各類新聞的點(diǎn)擊總量,并根據(jù)各類新聞的該點(diǎn)擊量和該點(diǎn)擊總量,計(jì)算得到該用戶在t 時(shí)刻的新聞興趣模型。
[0023] 具體地,用U表示該用戶,Ci表示類別為i的新聞的所有文章,I(u,Ci)表示用戶U 對(duì)Ci的新聞興趣度。
[0024] 采用貝葉斯全概率公式來(lái)計(jì)算用戶的新聞興趣度計(jì)算公式為:
[00巧]P (click I categoiT = Ci)
[00%] 根據(jù)貝葉斯全概率公式:
[0027]
[002引其中,
,表不用戶U點(diǎn)擊C;新聞的點(diǎn)擊分布,即,用戶U對(duì)Ci的 新聞的點(diǎn)擊量; 陽(yáng)029] N(u,Ci)表示用戶U點(diǎn)擊過(guò)的C沖的新聞數(shù)量,N(u)表示用戶U點(diǎn)擊過(guò)的所有類 別的新聞總數(shù);
[0030] D(Ci)表示全體用戶點(diǎn)擊Ci的點(diǎn)擊分布,即所有用戶對(duì)C1的點(diǎn)擊量;
[0031] P (category=Cil click)近似為用戶U對(duì)Ci的點(diǎn)擊分布D(u,Ci); 陽(yáng)032] Pt(category=Ci)近似為全體用戶對(duì)Ci的點(diǎn)擊分布D(ci);
[003引Pt(click)為描述用戶點(diǎn)擊事件的概率常量,因此,t時(shí)刻用戶U對(duì)Ci產(chǎn)生的興趣 度計(jì)算公式可簡(jiǎn)化為:
[0034]
。)
[0035] 所W,用全體用戶的點(diǎn)擊分布Dt(Ci)平衡單個(gè)用戶U的點(diǎn)擊分布Dt(u,Ci)中Ci類 新聞熱點(diǎn)運(yùn)個(gè)因素的影響,更能反映用戶的真實(shí)興趣。
[0036] 用全體用戶的點(diǎn)擊分布Dt(Ci)對(duì)在口戶網(wǎng)站中占主導(dǎo)地位的新聞分類的權(quán)重進(jìn) 行了懲罰,使得對(duì)新聞推薦的結(jié)果更具有多樣性。
[0037] S103、按照該選定時(shí)刻的新聞興趣模型,加權(quán)平均得到包含多個(gè)該選定時(shí)刻的預(yù) 置時(shí)間段內(nèi)的最終新聞興趣模型。
[0038] 最終新聞興趣模型,是計(jì)算包含多個(gè)該選定時(shí)刻的預(yù)置時(shí)間段內(nèi)的用戶新聞興趣 額度,可進(jìn)一步增加確定用戶新聞興趣度的準(zhǔn)確度。新聞熱度具有時(shí)效性,W及為了計(jì)算的 簡(jiǎn)便,本實(shí)施例中,該預(yù)置時(shí)間段為該選定時(shí)刻所在的當(dāng)天24小時(shí)。
[0039]具體地,根據(jù)前述用戶在時(shí)刻t的新聞興趣度的貝葉斯計(jì)算公式(I),計(jì)算當(dāng)天的 用戶對(duì)各類新聞的最終新聞興趣度。
[0040]
[0041] 其中,I(u,Ci)表示用戶對(duì)Ci的新聞的最終興趣度。kt是新聞在t時(shí)刻的時(shí)刻權(quán)重 值,kt的范圍是0~1,鑒于新聞的時(shí)效性,時(shí)間越靠近當(dāng)前時(shí)刻,新聞的時(shí)刻權(quán)重值越大。 It(U,Ci)表示用戶在t時(shí)刻對(duì)Ci的新聞的興趣度。
[0042] 經(jīng)過(guò)上述加權(quán)平均得到的計(jì)算結(jié)果,更接近用戶的真實(shí)興趣模型。此時(shí),可W為該 用戶添加新聞興趣標(biāo)簽,即記錄該用戶的最終新聞興趣模型信息。
[0043]S104、按照該最終新聞興趣模型
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
方正县| 闸北区| 麻栗坡县| 东光县| 清原| 涿鹿县| 深水埗区| 康定县| 新建县| 牡丹江市| 新乐市| 辛集市| 崇左市| 柞水县| 博白县| 朝阳区| 恭城| 南澳县| 霸州市| 内黄县| 伊宁县| 霍山县| 夏邑县| 潼南县| 安康市| 合川市| 安庆市| 唐山市| 南平市| 宜章县| 无为县| 景德镇市| 开原市| 台江县| 通河县| 彭泽县| 锡林浩特市| 玛多县| 化隆| 灵石县| 富平县|