專利名稱:一種提供鏈接推薦的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)通信技術(shù),特別涉及一種提供鏈接推薦的方法及裝置。
背景技術(shù):
隨著計(jì)算機(jī)通信技術(shù)的發(fā)展,尤其是3g網(wǎng)絡(luò)和智能移動(dòng)終端的發(fā)展,用戶的網(wǎng)絡(luò) 生活越來越豐富,由于網(wǎng)絡(luò)內(nèi)容的豐富,網(wǎng)絡(luò)用戶從中獲取相關(guān)信息所花費(fèi)的時(shí)間也越來 越多,例如,目前的各個(gè)社區(qū)網(wǎng)站上(包含但不僅限于騰訊微博、Qzone社區(qū))都堆積了大量 的信息,其中包含個(gè)人的心情寫照、回復(fù)、轉(zhuǎn)發(fā)粉絲的信息、發(fā)表個(gè)人對(duì)某些事情的看法等 內(nèi)容,由于大部分內(nèi)容都是極具個(gè)性化的信息,較難聚焦形成熱點(diǎn)內(nèi)容,使得用戶在微博上 投入的時(shí)間與獲取的信息不成正比。但是,微博中也有部分質(zhì)量較高的信息,例如,通過鏈 接推薦的方法展示的信息,舉例來說,當(dāng)微博用戶在某一互聯(lián)網(wǎng)站瀏覽到較好內(nèi)容的時(shí)候, 可以通過提供鏈接推薦的方法,分享該互聯(lián)網(wǎng)站鏈接到微博并提供給關(guān)注的用戶。
微博中的鏈接具有以下特征
①實(shí)時(shí)性,微博中鏈接對(duì)應(yīng)的信息,一般都是當(dāng)前最新的新聞和熱點(diǎn)事件的鏈接。
②傳播快,每次“一鍵分享”或主動(dòng)發(fā)送到微博的鏈接,平均可以帶回較高的IP點(diǎn) 擊。
③高質(zhì)量,經(jīng)過人工篩選,只有用戶覺得不錯(cuò)的互聯(lián)網(wǎng)站內(nèi)容,才會(huì)提供該互聯(lián)網(wǎng) 站內(nèi)容的鏈接,進(jìn)行微博分享。
④信任度高,研究顯示37%的用戶認(rèn)為微博上的信息基本可信,只有6%的用戶 認(rèn)為不太可信。
現(xiàn)有技術(shù)中,各微博網(wǎng)站一般采用編輯人工運(yùn)營(yíng)的方式提供鏈接推薦,通過瀏覽 互聯(lián)網(wǎng)站發(fā)現(xiàn)優(yōu)質(zhì)信息,例如,新聞熱點(diǎn)信息,將這些優(yōu)質(zhì)信息形成熱門話題,并以鏈接推 薦的方式推薦給用戶。
以新聞熱點(diǎn)為例,主要有兩種鏈接推薦方式
(I)、編輯選擇生成鏈接推薦。該方式主要由編輯根據(jù)個(gè)人的經(jīng)驗(yàn),從大量新聞中 選擇其認(rèn)為是熱點(diǎn)的新聞,在微博中生成鏈接并進(jìn)行推薦。
(2)、依據(jù)網(wǎng)絡(luò)上重復(fù)的次數(shù)生成鏈接推薦。該方式主要用于目前新聞搜索中,根 據(jù)某個(gè)新聞頁面在各個(gè)新聞?wù)军c(diǎn)中出現(xiàn)的次數(shù)來判別新聞的熱度,將出現(xiàn)次數(shù)超過預(yù)先設(shè) 置的次數(shù)閾值的新聞頁面在微博中生成鏈接并進(jìn)行推薦。
由上述可見,現(xiàn)有提供鏈接推薦的方法,通過編輯選擇進(jìn)行鏈接推薦,與編輯個(gè)人 的興趣愛好和生活背景密切相關(guān),具有較大的主觀性,其選擇的鏈接推薦對(duì)應(yīng)的熱點(diǎn)新聞 并不一定是網(wǎng)絡(luò)用戶認(rèn)可的熱點(diǎn)新聞,鏈接推薦的可用性較低,人工運(yùn)營(yíng)的成本較高;而基 于網(wǎng)頁重復(fù)次數(shù)進(jìn)行選擇并生成鏈接推薦,其統(tǒng)計(jì)數(shù)據(jù)一般來源于各個(gè)新聞網(wǎng)站,而各個(gè) 新聞網(wǎng)站自身熱點(diǎn)新聞的選擇又是根據(jù)編輯確定的,參與熱點(diǎn)新聞確定的人數(shù)較少,因此, 基于網(wǎng)頁重復(fù)次數(shù)選擇獲取的鏈接推薦對(duì)應(yīng)的熱點(diǎn)新聞也并不一定是網(wǎng)絡(luò)用戶關(guān)注的熱 點(diǎn)新聞,且人工運(yùn)營(yíng)的成本較高。發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提出一種提供鏈接推薦的方法,提高鏈接推薦 的可用性。
本發(fā)明的另一目的在于提出一種提供鏈接推薦的裝置,提高鏈接推薦的可用性。
為達(dá)到上述目的,本發(fā)明提供了一種提供鏈接推薦的方法,該方法包括
按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信息;
獲取鏈接信息中含有鏈接的微博消息及微博消息屬性;
根據(jù)獲取的微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行 計(jì)分;
獲取計(jì)分前N位的鏈接,拉取鏈接的統(tǒng)一資源定位器URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分 類,獲取URL的摘要數(shù)據(jù),其中,N為預(yù)先設(shè)置的自然數(shù);
根據(jù)獲取的摘要數(shù)據(jù)生成鏈接推薦。
在所述獲取計(jì)分前N位的鏈接的步驟之前,進(jìn)一步包括
根據(jù)預(yù)先設(shè)置的白名單對(duì)鏈接的URL進(jìn)行過濾,過濾掉所述白名單之外的URL。
所述微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人 屬性以及發(fā)布者聽眾數(shù)屬性中的一種或其任意組合。
所述微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人 屬性和發(fā)布者聽眾數(shù)屬性,所述按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分 包括
根據(jù)預(yù)先設(shè)置的用于計(jì)分的轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù) 的計(jì)分系數(shù),按照轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)以及相應(yīng)的計(jì)分系 數(shù)對(duì)各鏈接進(jìn)行計(jì)分。
進(jìn)一步包括將生成的鏈接推薦提供給用戶,所述提供給用戶包括
以web展示界面形式展示所述URL的摘要數(shù)據(jù),并提供可擴(kuò)展的源置標(biāo)語言數(shù)據(jù) 接口。
一種提供鏈接推薦的裝置,該裝置包括鏈接信息提取模塊、屬性獲取模塊、鏈接 計(jì)分模塊、摘要數(shù)據(jù)獲取模塊以及展示模塊,其中,
鏈接信息提取模塊,用于按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信
屬性獲取模塊,用于獲取鏈接信息中含有鏈接的微博消息及微博消息屬性;
鏈接計(jì)分模塊,用于根據(jù)獲取的微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博 消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分;
摘要數(shù)據(jù)獲取模塊,用于獲取計(jì)分前N位的鏈接,拉取鏈接的統(tǒng)一資源定位器URL 對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分類,獲取URL的摘要數(shù)據(jù),其中,N為預(yù)先設(shè)置的自然數(shù);
展示模塊,用于根據(jù)獲取的摘要數(shù)據(jù)生成鏈接推薦進(jìn)行展示。
進(jìn)一步包括
白名單模塊,用于根據(jù)預(yù)先設(shè)置的白名單對(duì)鏈接的URL進(jìn)行過濾,過濾掉所述白 名單之外的URL,得出該社區(qū)內(nèi)鏈接的焦點(diǎn)排行。
所述微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人屬性以及發(fā)布者聽眾數(shù)屬性中的一種或其任意組合。
由上述的技術(shù)方案可見,本發(fā)明提供的一種提供鏈接推薦的方法及裝置,按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信息;獲取鏈接信息中含有鏈接的微博消息及微博消息屬性;根據(jù)獲取的微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分;獲取計(jì)分前N位的鏈接,拉取鏈接的統(tǒng)一資源定位器URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分類,獲取URL的摘要數(shù)據(jù),其中,N為預(yù)先設(shè)置的自然數(shù);根據(jù)獲取的摘要數(shù)據(jù)生成鏈接推薦。這樣,通過提取社區(qū)分享中包含的鏈接信息,基于微博消息屬性進(jìn)行計(jì)分排序,從而可以提高鏈接推薦的可用性;進(jìn)一步地,無需進(jìn)行手工編輯,可以降低人工運(yùn)營(yíng)的成本;而且,通過獲取鏈接的URL的摘要數(shù)據(jù)并展示,可以為網(wǎng)絡(luò)用戶在更為廣泛的信息中快速推薦出熱點(diǎn)信息。
·
圖1為本發(fā)明實(shí)施例的提供鏈接推薦的方法流程示意圖。
圖2為本發(fā)明實(shí)施例的提供鏈接推薦的裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。
實(shí)際應(yīng)用中,在各網(wǎng)站分享形式中,都包含有大量的鏈接,因而,本發(fā)明實(shí)施例中, 通過獲取鏈接信息,構(gòu)建網(wǎng)站鏈接與用戶相互連接的網(wǎng)絡(luò),基于各鏈接的用戶分享操作,例如,鏈接的分享次數(shù)、轉(zhuǎn)發(fā)次數(shù)、評(píng)論關(guān)系等進(jìn)行計(jì)分、排序,獲取最熱門的鏈接并生成鏈接推薦,從而可以提高鏈接推薦的可用性,為網(wǎng)絡(luò)用戶在更為廣泛的信息中快速推薦出熱點(diǎn)信息,無需進(jìn)行手工編輯,可以降低人工運(yùn)營(yíng)的成本。
本發(fā)明實(shí)施例的提供鏈接推薦的方法,其應(yīng)用主要包括但不限于騰訊微博分享、 Qzone社區(qū)分享、朋友社區(qū)分享、QQ群空間分享等。
圖1為本發(fā)明實(shí)施例的提供鏈接推薦的方法流程示意圖。參見圖1,該流程包括
步驟101,按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信息;
本步驟中,社區(qū)分享包括但不限于騰訊微博分享、Qzone社區(qū)分享、朋友社區(qū)分享、QQ群空間分享。以微博為例,獲取微博在時(shí)間周期內(nèi)的全量數(shù)據(jù),并對(duì)該全量數(shù)據(jù)進(jìn)行分析,得到包含的鏈接信息。
實(shí)際應(yīng)用中,可以將獲取的全量數(shù)據(jù)同步到hadoop平臺(tái)的分布式文件系統(tǒng) (HDFS, Hadoop Distributed File System),由HDFS解析全量數(shù)據(jù),得到包含的鏈接信息。
步驟102,獲取鏈接信息中含有鏈接的微博消息及微博消息屬性;
本步驟中,HDFS從解析得到的外鏈鏈接信息中,獲取含有鏈接的微博消息,例如, 解析得到的外鏈鏈接信息為搜狐中超報(bào)道王永珀奶奶去世前仍念比賽爺爺命其歸隊(duì)別誤比賽據(jù)@王永珀?duì)敔斀榻B,本來王永珀要在青島多待兩天,不過爺爺堅(jiān)持讓他回到濟(jì)南別耽誤比賽(http://t. cn/ad6yov> http://sports, sohu. com)。則獲取的含有鏈接的微博消息是搜狐中超報(bào)道王永珀奶奶去世前仍念比賽爺爺命其歸隊(duì)別誤比賽據(jù)@王永珀?duì)敔斀榻B,本來王永珀要在青島多待兩天,不過爺爺堅(jiān)持讓他回到濟(jì)南別耽誤比賽 (http://t. cn/ad6yov)。關(guān)于從微博消息中提取出微博消息屬性,具體可參見相關(guān)技術(shù)文 獻(xiàn),在此不再贅述。
微博消息屬性主要是用戶的操作特征屬性,包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn) 發(fā)屬性、發(fā)布者是否名人屬性、發(fā)布者聽眾數(shù)屬性中的一種或其任意組合。
步驟103,根據(jù)獲取的微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的 鏈接進(jìn)行計(jì)分;
本步驟中,統(tǒng)計(jì)所有鏈接,即基于用戶的操作特征,對(duì)各鏈接進(jìn)行排重與計(jì)分統(tǒng) 計(jì)該鏈接被轉(zhuǎn)發(fā)的次數(shù)、該鏈接是否被名人轉(zhuǎn)發(fā)過等信息,在完成統(tǒng)計(jì)后,按照轉(zhuǎn)發(fā)次數(shù)、 是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)對(duì)各鏈接進(jìn)行計(jì)分,并依據(jù)計(jì)分高低進(jìn)行排序。
預(yù)先設(shè)置的計(jì)分策略用于計(jì)算鏈接的分?jǐn)?shù),可以根據(jù)實(shí)際需要確定,例如,可以分 別確定用于計(jì)分的轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)的計(jì)分系數(shù)。
當(dāng)微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人屬 性和發(fā)布者聽眾數(shù)屬性時(shí),則按照預(yù)先設(shè)置的計(jì)分策略對(duì)各微博消對(duì)應(yīng)的鏈接進(jìn)行計(jì)分包 括
根據(jù)預(yù)先設(shè)置的用于計(jì)分的轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù) 的計(jì)分系數(shù),按照轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)以及相應(yīng)的計(jì)分系 數(shù)對(duì)各鏈接進(jìn)行計(jì)分。
當(dāng)然,實(shí)際應(yīng)用中,如果微博消息屬性包括微博消息是否原創(chuàng)屬性和是否轉(zhuǎn)發(fā)屬 性時(shí),則根據(jù)預(yù)先設(shè)置的用于計(jì)分的轉(zhuǎn)發(fā)次數(shù)以及是否原創(chuàng)的計(jì)分系數(shù),按照轉(zhuǎn)發(fā)次數(shù)、是 否原創(chuàng)以及相應(yīng)的轉(zhuǎn)發(fā)次數(shù)計(jì)分系數(shù)、是否原創(chuàng)計(jì)分系數(shù)對(duì)各鏈接進(jìn)行計(jì)分。如果微博消 息屬性包括其他內(nèi)容,按照與上述相類似的計(jì)分策略對(duì)微博消息屬性包括的具體內(nèi)容分別 進(jìn)行計(jì)分,在此不再贅述。
本發(fā)明實(shí)施例中,鏈接信息為統(tǒng)一資源定位器(URL, Uniform ResourceLocator) 信息,用戶在SNS (微博、qzone、朋友)分享的每一個(gè)URL,都是對(duì)該URL的一次評(píng)價(jià),如果 該URL被分享的次數(shù)越多、分享該URL的人的聽眾數(shù)越多、有名人分享過該URL、有多個(gè)人原 創(chuàng)的分享了該URL,說明該URL的質(zhì)量很高,相應(yīng)的計(jì)分就高。
實(shí)際應(yīng)用中,還可以根據(jù)預(yù)先設(shè)置的白名單對(duì)鏈接的URL進(jìn)行過濾,過濾掉白名 單之外的URL,得出該社區(qū)內(nèi)鏈接的焦點(diǎn)排行。白名單中的信息為信任網(wǎng)站的URL信息。
步驟104,獲取計(jì)分前N位的鏈接,拉取鏈接的URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分類,獲取 URL的摘要數(shù)據(jù);
本步驟中,N為預(yù)先設(shè)置的自然數(shù),具體可根據(jù)實(shí)際需要來確定。進(jìn)行內(nèi)容分類, 獲取URL的摘要數(shù)據(jù),具體可參見相關(guān)技術(shù)文獻(xiàn),在此不再贅述。
步驟105,生成鏈接推薦,提供給用戶。
本步驟中,根據(jù)獲取的摘要數(shù)據(jù)生成鏈接推薦后,以web展示界面形式展示URL數(shù) 據(jù)結(jié)果(URL的摘要數(shù)據(jù)),提供可擴(kuò)展的源置標(biāo)語言(XML, Extensible Markup Language) 數(shù)據(jù)接口。
本發(fā)明實(shí)施例中,以微博為例,首先,獲取微博單位時(shí)間內(nèi)的全量數(shù)據(jù),并對(duì)該全 量數(shù)據(jù)進(jìn)行分析,得到單位時(shí)間內(nèi)所有用戶分享的鏈接、該鏈接被轉(zhuǎn)發(fā)的次數(shù)、該鏈接是否被名人轉(zhuǎn)發(fā)過,并基于上述信息對(duì)該鏈接進(jìn)行計(jì)分、排序;接著,對(duì)該鏈接對(duì)應(yīng)的網(wǎng)頁進(jìn) 行內(nèi)容分類、獲取摘要數(shù)據(jù)信息;然后,對(duì)獲取的所有鏈接進(jìn)行白名單過濾,并向用戶提供 web展示界面和xml數(shù)據(jù)接口。
由上述可見,本發(fā)明實(shí)施例的提供鏈接推薦的方法,將來自微博外的鏈接與用戶 的操作特征屬性結(jié)合起來,通過“用戶”這個(gè)維度將各類站點(diǎn),包括各個(gè)“暗網(wǎng)”中的網(wǎng)頁再 次鏈接起來,實(shí)現(xiàn)了基于社區(qū)內(nèi)的用戶操作特征的鏈接的焦點(diǎn)排行,參與熱點(diǎn)鏈接推薦的 人數(shù)多,從而可以提高鏈接推薦的可用性;基于鏈接信息進(jìn)行統(tǒng)計(jì)、分析、計(jì)分并生成鏈接 推薦,無需進(jìn)行手工編輯,可以降低人工運(yùn)營(yíng)的成本;同時(shí),通過獲取鏈接的URL的摘要數(shù) 據(jù)并展示,可以為網(wǎng)絡(luò)用戶在更為廣泛的信息中快速推薦出熱點(diǎn)信息;進(jìn)一步地,可以將這 些社區(qū)平臺(tái)中的優(yōu)質(zhì)的鏈接信息內(nèi)容聚合起來,不僅可以改善優(yōu)質(zhì)內(nèi)容的推送,而且可以 有效地降低用戶獲取優(yōu)質(zhì)信息的成本;此外,如果在搜索引擎網(wǎng)頁質(zhì)量評(píng)測(cè)中引入本發(fā)明 實(shí)施例提供鏈接推薦的結(jié)果,可以改善搜索引擎對(duì)網(wǎng)頁的相關(guān)性排序;而在微博熱點(diǎn)事件 運(yùn)營(yíng)中引入本發(fā)明實(shí)施例提供鏈接推薦的結(jié)果,可以為產(chǎn)品運(yùn)營(yíng)提供數(shù)據(jù)支撐。
圖2為本發(fā)明實(shí)施例的提供鏈接推薦的裝置結(jié)構(gòu)示意圖。參見圖2,該裝置包括 鏈接信息提取模塊、屬性獲取模塊、鏈接計(jì)分模塊、摘要數(shù)據(jù)獲取模塊以及展示模塊,其中,
鏈接信息提取模塊,用于按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信
屬性獲取模塊,用于獲取鏈接信息中含有鏈接的各微博消息及微博消息屬性;
本發(fā)明實(shí)施例中,微博消息屬性主要是用戶的操作特征屬性,包括微博消息是否 原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人屬性、發(fā)布者聽眾數(shù)屬性等。
鏈接計(jì)分模塊,用于根據(jù)獲取的各微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)各 微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分;
本發(fā)明實(shí)施例中,按照轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)對(duì)各 鏈接進(jìn)行計(jì)分,并依據(jù)計(jì)分高低進(jìn)行排序。
摘要數(shù)據(jù)獲取模塊,用于獲取計(jì)分前N位的鏈接,拉取鏈接的URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行 內(nèi)容分類,獲取URL的摘要數(shù)據(jù);
展示模塊,用于生成鏈接推薦,提供并展示給用戶。
本發(fā)明實(shí)施例中,以web展示界面形式展示URL數(shù)據(jù)結(jié)果,提供XML數(shù)據(jù)接口。
較佳地,該裝置還包括
白名單模塊,用于根據(jù)預(yù)先設(shè)置的白名單對(duì)鏈接的URL進(jìn)行過濾,過濾掉白名單 之外的URL,得出該社區(qū)內(nèi)鏈接的焦點(diǎn)排行。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在 本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換以及改進(jìn)等,均應(yīng)包含在本發(fā)明的保 護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種提供鏈接推薦的方法,其特征在于,該方法包括 按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信息; 獲取鏈接信息中含有鏈接的微博消息及微博消息屬性; 根據(jù)獲取的微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分; 獲取計(jì)分前N位的鏈接,拉取鏈接的統(tǒng)一資源定位器URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分類,獲取URL的摘要數(shù)據(jù),其中,N為預(yù)先設(shè)置的自然數(shù); 根據(jù)獲取的摘要數(shù)據(jù)生成鏈接推薦。
2.如權(quán)利要求1所述的方法,其特征在于,在所述獲取計(jì)分前N位的鏈接的步驟之前,進(jìn)一步包括 根據(jù)預(yù)先設(shè)置的白名單對(duì)鏈接的URL進(jìn)行過濾,過濾掉所述白名單之外的URL。
3.如權(quán)利要求2所述的方法,其特征在于,所述微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人屬性以及發(fā)布者聽眾數(shù)屬性中的一種或其任意組合。
4.如權(quán)利要求3所述的方法,其特征在于,所述微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人屬性和發(fā)布者聽眾數(shù)屬性,所述按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分包括 根據(jù)預(yù)先設(shè)置的用于計(jì)分的轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)的計(jì)分系數(shù),按照轉(zhuǎn)發(fā)次數(shù)、是否原創(chuàng)、發(fā)布者是否名人、發(fā)布者聽眾數(shù)以及相應(yīng)的計(jì)分系數(shù)對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分。
5.如權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,進(jìn)一步包括 將生成的鏈接推薦提供給用戶,所述提供給用戶包括 以web展示界面形式展示所述URL的摘要數(shù)據(jù),并提供可擴(kuò)展的源置標(biāo)語言數(shù)據(jù)接口。
6.一種提供鏈接推薦的裝置,其特征在于,該裝置包括鏈接信息提取模塊、屬性獲取模塊、鏈接計(jì)分模塊、摘要數(shù)據(jù)獲取模塊以及展示模塊,其中, 鏈接信息提取模塊,用于按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信息; 屬性獲取模塊,用于獲取鏈接信息中含有鏈接的微博消息及微博消息屬性; 鏈接計(jì)分模塊,用于根據(jù)獲取的微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)微博消息對(duì)應(yīng)的鏈接進(jìn)行計(jì)分; 摘要數(shù)據(jù)獲取模塊,用于獲取計(jì)分前N位的鏈接,拉取鏈接的統(tǒng)一資源定位器URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分類,獲取URL的摘要數(shù)據(jù),其中,N為預(yù)先設(shè)置的自然數(shù); 展示模塊,用于根據(jù)獲取的摘要數(shù)據(jù)生成鏈接推薦進(jìn)行展示。
7.如權(quán)利要求6所述的裝置,其特征在于,進(jìn)一步包括 白名單模塊,用于根據(jù)預(yù)先設(shè)置的白名單對(duì)鏈接的URL進(jìn)行過濾,過濾掉所述白名單之外的URL,得出該社區(qū)內(nèi)鏈接的焦點(diǎn)排行。
8.如權(quán)利要求6或7所述的裝置,其特征在于,所述微博消息屬性包括微博消息是否原創(chuàng)屬性、是否轉(zhuǎn)發(fā)屬性、發(fā)布者是否名人屬性以及發(fā)布者聽眾數(shù)屬性中的一種或其任意組合。
全文摘要
本發(fā)明公開了一種提供鏈接推薦的方法及裝置。該方法包括按照預(yù)先設(shè)置的時(shí)間周期提取社區(qū)分享中包含的鏈接信息;獲取鏈接信息中含有鏈接的各微博消息及微博消息屬性;根據(jù)獲取的各微博消息屬性,按照預(yù)先設(shè)置的計(jì)分策略對(duì)各微博消對(duì)應(yīng)的鏈接進(jìn)行計(jì)分;獲取計(jì)分前N位的鏈接,拉取鏈接的統(tǒng)一資源定位器URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行內(nèi)容分類,獲取URL的摘要數(shù)據(jù),其中,N為預(yù)先設(shè)置的自然數(shù);生成鏈接推薦,提供給用戶。應(yīng)用本發(fā)明,可以提高鏈接推薦的可用性、降低人工運(yùn)營(yíng)的成本。
文檔編號(hào)G06F17/30GK103020090SQ20111029422
公開日2013年4月3日 申請(qǐng)日期2011年9月27日 優(yōu)先權(quán)日2011年9月27日
發(fā)明者王沁泉, 王亮, 潘樹燊, 胡文翠 申請(qǐng)人:騰訊科技(深圳)有限公司