一種官方媒體新聞中話題的推送方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信領(lǐng)域,尤其涉及一種官方媒體新聞中話題的推送方法及裝置。
【背景技術(shù)】
[0002] 話題是指談話的題目,談?wù)摰闹黝}。新聞話題一般是在一段時(shí)間內(nèi),眾多新聞媒體 及個(gè)人所關(guān)注的比較的主題。在互聯(lián)網(wǎng),電視,報(bào)紙中,每天都會(huì)報(bào)道許多各種形式的新聞, 當(dāng)某一類新聞的報(bào)道越來(lái)越多時(shí),就形成了話題,并且會(huì)受到更多用戶的關(guān)注。在互聯(lián)網(wǎng) 上,有許多網(wǎng)站能夠?qū)崟r(shí)提供新聞話題關(guān)鍵詞排行,用戶可以通過(guò)互聯(lián)網(wǎng)搜索引擎搜索到 大量跟該話題有關(guān)的新聞,但是由于提供新聞的互聯(lián)網(wǎng)媒體參差不齊,有很多新聞不夠全 面,真實(shí)性并不可靠,并且互聯(lián)網(wǎng)新聞也很難進(jìn)行有效的管控。
[0003] 相比互聯(lián)網(wǎng),官方媒體能夠提供更真實(shí)有效的優(yōu)質(zhì)新聞,但是由于這些官方媒體 數(shù)量并不多,對(duì)于一個(gè)話題,他們往往只能夠提供一條或者幾條相關(guān)新聞,讀者點(diǎn)擊量少, 因此并不能形成話題,從而無(wú)法及時(shí)有效的得到用戶的關(guān)注。因此目前許多用戶迫切需要 這些官方媒體能夠提供基于話題的推送,及時(shí)的展示優(yōu)質(zhì)新聞。
【發(fā)明內(nèi)容】
[0004] 針對(duì)現(xiàn)有技術(shù)的缺陷,本發(fā)明提出了解決上述技術(shù)問(wèn)題的一種官方媒體新聞中話 題的推送方法及裝置,使官方媒體中屬于話題的優(yōu)質(zhì)新聞能夠及時(shí)推送給用戶。
[0005] 第一方面,本發(fā)明提供一種官方媒體新聞中話題的推送方法,包括:
[0006] S1、話題推送中心獲取官方媒體提供的第一新聞的多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān) 鍵詞的第一權(quán)重;
[0007] S2、所述話題推送中心根據(jù)所述第一新聞的多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的 第一權(quán)重,和存儲(chǔ)在預(yù)設(shè)話題庫(kù)中的每個(gè)話題的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二 權(quán)重,獲取所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第一權(quán)重與所述多個(gè)第二關(guān)鍵詞及每 個(gè)第二關(guān)鍵詞的第二權(quán)重的匹配值,根據(jù)所述匹配值確定所述第一新聞所屬的話題;
[0008] S3、所述話題推送中心將屬于該話題的第一新聞通過(guò)客戶端推送給官方媒體用 戶。
[0009] 優(yōu)選的,在步驟S1之前,所述方法還包括:
[0010] soi、話題推送中心每隔預(yù)設(shè)時(shí)間抓取搜索引擎網(wǎng)站上的用戶搜索次數(shù)大于預(yù)設(shè) 值的搜索熱詞;
[0011] S02、所述話題推送中心根據(jù)搜索詞獲取互聯(lián)網(wǎng)提供的與搜索熱詞相關(guān)的新聞,獲 取新聞所屬的話題,剔除不屬于所述話題的新聞;
[0012] S03、所述話題推送中心獲取屬于該話題的預(yù)設(shè)條數(shù)的第二新聞的多個(gè)第二關(guān)鍵 詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重;
[0013] S04、所述話題推送中心將所述話題、所述第二關(guān)鍵詞及所述第二權(quán)重存儲(chǔ)在預(yù)設(shè) 話題庫(kù)中。
[0014] 優(yōu)選的,所述步驟S1包括:
[0015] 將所述第一新聞通過(guò)LDA模型獲取所述第一新聞的多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān) 鍵詞的第一權(quán)重。
[0016] 優(yōu)選的,所述步驟S03包括:
[0017] 將所述預(yù)設(shè)條數(shù)的第二新聞通過(guò)LDA模型獲取所述預(yù)設(shè)條數(shù)的第二新聞的多個(gè)第 二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重;
[0018] 優(yōu)選的,所述步驟S2包括:
[0019] S21、所述話題推送中心對(duì)所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第一權(quán)重與 所述存儲(chǔ)在預(yù)設(shè)話題庫(kù)中的每個(gè)話題的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重按 預(yù)設(shè)匹配算法進(jìn)行匹配,獲取所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第一權(quán)重與所述多 個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重的匹配值,確定所述匹配值中的最大值;
[0020] S22、若所述最大值大于等于預(yù)設(shè)閾值,則所述第一新聞屬于所述最大值對(duì)應(yīng)的存 儲(chǔ)在預(yù)設(shè)話題庫(kù)中的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重屬于的話題;
[0021] 或
[0022]若所述最大值小于預(yù)設(shè)閾值,則所述第一新聞不屬于所述預(yù)設(shè)話題庫(kù)中的話題。 [0023]優(yōu)選的,所述步驟S3包括:
[0024] S31、所述話題推送中心將所述話題以及屬于所述話題的第一新聞發(fā)送至話題推 送分中心;
[0025] S32、所述話題推送分中心根據(jù)所述官方媒體用戶歷史關(guān)注的新聞?lì)愋?,獲取與所 述新聞?lì)愋蛯?duì)應(yīng)的話題,通過(guò)客戶端推送給官方媒體用戶;
[0026] S33、所述話題推送分中心在接收到官方媒體用戶發(fā)送的所述話題點(diǎn)擊指令時(shí),通 過(guò)客戶端向所述官方媒體用戶展示屬于所述話題的第一新聞。
[0027] 第二方面,本發(fā)明提供一種官方媒體新聞中話題的推送裝置,包括:
[0028] 第一關(guān)鍵詞獲取模塊,用于獲取官方媒體提供的第一新聞的多個(gè)第一關(guān)鍵詞及每 個(gè)第一關(guān)鍵詞的第一權(quán)重;
[0029] 匹配度獲取模塊,用于根據(jù)所述第一新聞的多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的 第一權(quán)重,和存儲(chǔ)在預(yù)設(shè)話題庫(kù)中的每個(gè)話題的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二 權(quán)重,獲取所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第一權(quán)重與所述多個(gè)第二關(guān)鍵詞及每 個(gè)第二關(guān)鍵詞的第二權(quán)重的匹配值;
[0030] 確定模塊,用于根據(jù)所述匹配值確定所述第一新聞所屬的話題;
[0031] 推送模塊,用于將屬于該話題的所述第一新聞通過(guò)客戶端推送給官方媒體用戶。 [0032]優(yōu)選的,所述裝置還包括:
[0033] 搜索熱詞獲取模塊,用于每隔預(yù)設(shè)時(shí)間抓取搜索引擎網(wǎng)站上的用戶搜索次數(shù)大于 預(yù)設(shè)值的搜索熱詞;
[0034] 話題獲取模塊,根據(jù)搜索詞獲取互聯(lián)網(wǎng)提供的與搜索熱詞相關(guān)的新聞,獲取新聞 所屬的話題,剔除不屬于所述話題的新聞;
[0035]第二關(guān)鍵詞獲取模塊,用于獲取屬于該話題的預(yù)設(shè)條數(shù)的第二新聞的多個(gè)第二關(guān) 鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重;
[0036]存儲(chǔ)模塊,用于將所有的話題及話題的預(yù)設(shè)條數(shù)的第二新聞的多個(gè)第二關(guān)鍵詞及 每個(gè)第二關(guān)鍵詞的第二權(quán)重存儲(chǔ)在預(yù)設(shè)話題庫(kù)中。
[0037] 優(yōu)選的,所述匹配度獲取模塊用于對(duì)所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第 一權(quán)重與所述存儲(chǔ)在預(yù)設(shè)話題庫(kù)中的每個(gè)話題的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第 二權(quán)重按預(yù)設(shè)匹配算法進(jìn)行匹配,獲取所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第一權(quán)重 與所述多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重的匹配值,確定所述匹配值中的最大 值;
[0038] 所述確定模塊用于判斷若所述最大值大于等于預(yù)設(shè)閾值,則所述第一新聞屬于所 述最大值對(duì)應(yīng)的存儲(chǔ)在預(yù)設(shè)話題庫(kù)中的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二權(quán)重屬 于的話題;
[0039]若所述最大值小于預(yù)設(shè)閾值,則所述第一新聞不屬于所述預(yù)設(shè)話題庫(kù)中的話題。
[0040] 優(yōu)選的,所述推送模塊包括:
[0041] 發(fā)送模塊,用于將所述話題以及屬于所述話題的第一新聞發(fā)送至話題推送分中 心;
[0042] 話題推送模塊,用于根據(jù)所述官方媒體用戶歷史關(guān)注的新聞?lì)愋?,獲取與所述新 聞?lì)愋蛯?duì)應(yīng)的話題,通過(guò)客戶端推送給官方媒體用戶;
[0043] 新聞?wù)故灸K,用于在接收到官方媒體用戶發(fā)送的所述話題點(diǎn)擊指令時(shí),通過(guò)客 戶端向所述官方媒體用戶展示屬于所述話題的第一新聞。
[0044] 由上述技術(shù)方案可知,本發(fā)明提供的官方媒體新聞中話題的推送方法及裝置,通 過(guò)獲取官方媒體提供的新聞的關(guān)鍵詞信息和關(guān)鍵詞對(duì)應(yīng)的權(quán)重信息,與預(yù)先構(gòu)建好的話題 庫(kù)中話題對(duì)應(yīng)的關(guān)鍵詞信息和關(guān)鍵詞對(duì)應(yīng)的權(quán)重信息,一一進(jìn)行匹配比對(duì),確定官方媒體 提供的新聞所屬的話題,將官方媒體提供的新聞中屬于該話題的新聞信息推送給官方媒體 用戶,使得官方媒體能夠基于互聯(lián)網(wǎng)上話題對(duì)新聞進(jìn)行有效推送,及時(shí)得到用戶的關(guān)注,向 用戶展示優(yōu)質(zhì)新聞。
【附圖說(shuō)明】
[0045] 圖1為本發(fā)明一實(shí)施例的官方媒體新聞中話題的推送方法的流程示意圖;
[0046] 圖2為本發(fā)明另一實(shí)施例的官方媒體新聞中話題的推送方法的示意圖;
[0047] 圖3為本發(fā)明一實(shí)施例提供的官方媒體新聞中話題的推送裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0048] 下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施 例用于說(shuō)明本發(fā)明,但不用來(lái)限制本發(fā)明的范圍。
[0049] 圖1示出了本發(fā)明一實(shí)施例的官方媒體新聞中話題的推送方法的流程示意圖,如 圖1所述,本實(shí)施例中的官方媒體新聞中話題的推送方法包括:
[0050] S1、話題推送中心獲取官方媒體提供的第一新聞的多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān) 鍵詞的第一權(quán)重;
[0051] S2、所述話題推送中心根據(jù)所述第一新聞的多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的 第一權(quán)重,和存儲(chǔ)在預(yù)設(shè)話題庫(kù)中的每個(gè)話題的多個(gè)第二關(guān)鍵詞及每個(gè)第二關(guān)鍵詞的第二 權(quán)重,獲取所述多個(gè)第一關(guān)鍵詞及每個(gè)第一關(guān)鍵詞的第一權(quán)重與所述多個(gè)第二關(guān)鍵詞及每 個(gè)第二關(guān)鍵詞的第二權(quán)重的匹配值,根據(jù)所述匹配值確定所述第一新聞所屬的話題;
[0052] S3、所述話題推送中心將屬于該話題的第一新聞通過(guò)客戶端推送給官方媒體用 戶。
[0053]值得說(shuō)明的是,這里的客戶端為用戶終端上的客戶端,可以理解為APP。
[0054]本實(shí)施例的官方媒體新聞中話題的推送方法,通過(guò)獲取官方媒體提供的新聞的關(guān) 鍵詞信息和關(guān)鍵詞對(duì)應(yīng)的權(quán)重信息,與預(yù)先構(gòu)建好的話題庫(kù)中話題對(duì)應(yīng)的關(guān)鍵詞信息和關(guān) 鍵詞對(duì)應(yīng)的權(quán)重信息,一一進(jìn)行匹配比對(duì),確定官方媒體提供的新聞所屬的話題,將官方媒 體提供的新聞中屬于該話題的新聞信息推送給官方媒體用戶,使得官方媒體能夠基于互聯(lián) 網(wǎng)上話題對(duì)新聞進(jìn)行有效推送,及時(shí)得到用戶的關(guān)注,向用戶展示優(yōu)質(zhì)新聞。
[0055] 下面通過(guò)一個(gè)具體的實(shí)施例對(duì)上述方法進(jìn)行詳細(xì)說(shuō)明。
[0056] 本實(shí)施例中的官方媒體新聞中話題的推送方法包括以下步驟。
[0057] S01、話題推送中心每隔預(yù)設(shè)時(shí)間抓取搜索引擎網(wǎng)站上的用戶搜索次數(shù)大于預(yù)設(shè) 值的搜索熱詞;
[0058]話題推送中心每隔預(yù)設(shè)時(shí)間就從各大搜索引擎抓取用戶搜索詞,在獲取的搜索詞 中,若一個(gè)搜索詞被搜索的次數(shù)大于預(yù)設(shè)的次數(shù),則將這個(gè)搜索詞確定為搜索熱詞。這里的 預(yù)設(shè)時(shí)間可以設(shè)定為每?jī)尚r(shí)抓取一次,但本發(fā)明并不限定于這個(gè)時(shí)間段。
[0059] S02、所述話題推送中心根據(jù)搜索詞獲取互聯(lián)網(wǎng)提供的與搜索熱詞相關(guān)的新聞,獲 取新聞所屬的話題,剔除不屬于所述話題的新聞。
[0060]在確定搜索熱詞以后,在互聯(lián)網(wǎng)上搜索與搜索熱詞相關(guān)的所有新聞,從而獲取大 量互聯(lián)網(wǎng)新聞,對(duì)這些新聞?wù)w進(jìn)行LDA模型訓(xùn)練,得到這些新聞所述的話題,值得說(shuō)明的 是,根據(jù)話題在互聯(lián)網(wǎng)上搜索的大量新聞絕大多數(shù)屬于通過(guò)LDA模型訓(xùn)練出來(lái)的話題,但也 有少數(shù)會(huì)由于各種原因不屬于該話題,因此在本方法中還包括剔除不屬于所述話題的新 聞,