欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于互聯(lián)網(wǎng)的新聞推薦方法和系統(tǒng)的制作方法

文檔序號(hào):6468932閱讀:191來源:國(guó)知局
專利名稱:一種基于互聯(lián)網(wǎng)的新聞推薦方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)技術(shù),特別涉及 一 種基于互聯(lián)網(wǎng)的新聞推薦方法和系統(tǒng)。
背景技術(shù)
互聯(lián)網(wǎng)的飛速發(fā)展將人類帶入了網(wǎng)絡(luò)信息時(shí)代,對(duì)人們的個(gè)人生活產(chǎn)生 了深刻的影響。人們?cè)诨ヂ?lián)網(wǎng)上可以輕易地獲取到各種網(wǎng)絡(luò)信息,如購(gòu)物信 息、影視下載信息以及音樂下栽信息等。通常,人們通過互聯(lián)網(wǎng)獲取網(wǎng)絡(luò)信 息的方式主要有搜索信息以及瀏覽新聞網(wǎng)站等,但近幾年,又涌現(xiàn)出了一種
幫助用戶獲取網(wǎng)絡(luò)信息的新方式推薦系統(tǒng)。
推薦系統(tǒng)是指根據(jù)用戶的特點(diǎn),如興趣愛好,為用戶推薦有價(jià)值的信息。 其最主流的定義是Resnick&Varian在1997年給出的"它是利用電子商務(wù) 網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定應(yīng)該購(gòu)買什么產(chǎn)品,模擬銷 售人員幫助客戶完成購(gòu)買過程"。所以,目前推薦系統(tǒng)的主要應(yīng)用領(lǐng)域?yàn)榫W(wǎng) 上購(gòu)物,用于為用戶推薦符合其興趣愛好的商品,如書籍、音像以及生活用 品等。推薦系統(tǒng)的主要組成要素包括推薦對(duì)象、用戶以及推薦方法。其中, 推薦對(duì)象是指作為推薦結(jié)果反饋給用戶的基本對(duì)象;用戶即指推薦系統(tǒng)所面 對(duì)的客戶;推薦方法指采用什么方式,即如何推薦。
隨著技術(shù)的發(fā)展,目前推薦系統(tǒng)的應(yīng)用領(lǐng)域已經(jīng)不再局限于網(wǎng)上購(gòu)物, 而是擴(kuò)展到了其它方面,比如,出現(xiàn)了純粹的新聞推薦系統(tǒng),即當(dāng)用戶登陸 網(wǎng)絡(luò)瀏覽新聞或下載資源時(shí),將點(diǎn)擊率最高的熱門新聞或最新的新聞推薦給 用戶。但是,這種方式的缺陷是不能針對(duì)不同的用戶,分別將用戶感興趣的 新聞推薦給不同的用戶,從而造成用戶的體驗(yàn)較差。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供一種基于互聯(lián)網(wǎng)的新聞推薦系 統(tǒng),能夠針對(duì)不同的用戶,分別推薦與該用戶相關(guān)的不同新聞,從而提升用 戶體驗(yàn)。
本發(fā)明的另 一 目的在于提供一種基于互聯(lián)網(wǎng)的新聞推薦系統(tǒng),能夠針對(duì) 不同的用戶,分別推薦與該用戶相關(guān)的不同新聞,從而提升用戶體驗(yàn)。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的 一種基于互聯(lián)網(wǎng)的新聞推薦方法,包括 建立關(guān)鍵詞詞庫(kù);
依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括的關(guān)鍵詞,根據(jù)用戶行 為信息中所包括的關(guān)鍵詞推薦新聞給用戶。 一種基于互聯(lián)網(wǎng)的新聞推薦系統(tǒng),包括 關(guān)鍵詞數(shù)據(jù)庫(kù),用于保存預(yù)先建立的關(guān)鍵詞詞庫(kù);
服務(wù)器子系統(tǒng),用于依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括的 關(guān)鍵詞,并根據(jù)所述用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶。
可見,采用本發(fā)明的技術(shù)方案,考慮到用戶在互聯(lián)網(wǎng)上進(jìn)行某一行為,如 瀏覽新聞或下載資源時(shí),可能會(huì)希望了解一些與所瀏覽的新聞或所下載的資源 相關(guān)的新聞,所以,預(yù)先建立關(guān)鍵詞詞庫(kù),并依據(jù)所述關(guān)鍵詞詞庫(kù)中的關(guān)鍵詞, 提取用戶行為信息中所包括的關(guān)鍵詞,根據(jù)該提取出的關(guān)鍵詞推薦新聞給用戶。 這樣一來,即可針對(duì)不同的用戶,分別推薦與該用戶相關(guān)的不同新聞,從而提 升了用戶體驗(yàn)。


圖1為本發(fā)明新聞推薦方法實(shí)施例的流程圖。
圖2為本發(fā)明新聞推薦系統(tǒng)實(shí)施例的組成結(jié)構(gòu)示意圖。
具體實(shí)施例方式
為解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明中提出一種全新的新聞推薦方案, 考慮到用戶在互聯(lián)網(wǎng)上進(jìn)行某一行為時(shí),可能會(huì)希望了解一些與所進(jìn)行的行為 相關(guān)的新聞,所以本發(fā)明所述方案中預(yù)先建立關(guān)鍵詞詞庫(kù),并依據(jù)所述關(guān)鍵 詞詞庫(kù),提取用戶行為信息中所包括的關(guān)鍵詞,根據(jù)該提取出的關(guān)鍵詞推薦新 聞給用戶。這樣一來,針對(duì)不同用戶,即可分別推薦與該用戶相關(guān)的不同新聞, 從而提升了用戶體驗(yàn)。
為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí) 施例,對(duì)本發(fā)明作進(jìn)一步地詳細(xì)說明。
圖1為本發(fā)明新聞推薦方法實(shí)施例的流程圖。假設(shè)本實(shí)施例中的用戶行為 是指用戶瀏覽新聞或下載資源,那么相應(yīng)地,所述提取用戶行為信息中所包括
圖1所示,該實(shí)施例包括以下步驟 步驟101:建立關(guān)鍵詞詞庫(kù)。
本發(fā)明實(shí)施例中所提到的關(guān)鍵詞詞庫(kù)主要由互聯(lián)網(wǎng)上曾經(jīng)出現(xiàn)過的影片標(biāo) 題、歌曲名、人名、游戲、軟件、書籍、重要事件名以及重要時(shí)間等一系列有 意義的詞匯組成。具體建立方式,或者說詞匯收集方式主要有到一些專門的 影視、歌曲、游戲或書籍等網(wǎng)站上進(jìn)行抓取,和/或,提取各網(wǎng)站新聞中指定的
符號(hào),如《》和""中所標(biāo)定的內(nèi)容,和/或,接收人工編輯并輸入的詞匯,比 如一些重要的人名和重要事件名等。
另外,還可依據(jù)不同的關(guān)鍵詞的類別屬性,分別建立不同的數(shù)據(jù)表以標(biāo)記 不同關(guān)鍵詞的相關(guān)屬性。對(duì)于一個(gè)詞來說,通??梢园葱枨筚x予不同的屬性, 如類別屬性,即影視、音樂、游戲、軟件、書籍等類別,同時(shí),還具有與類別 相關(guān)的屬性。比如,天龍八部,屬于影視類別,它還具有導(dǎo)演、演員、國(guó)家、 影片類型以及影片介紹等相關(guān)屬性;再比如,老鼠愛大米,屬于歌曲類別,它 還具有歌手、專輯、國(guó)別以及歌詞等相關(guān)屬性;再有,對(duì)于人名或書籍等,將具有與人物相關(guān)的時(shí)間或書籍作者等相關(guān)屬性;另外,還有可能一個(gè)詞被同時(shí) 賦予多種類別屬性,比如,劉德華,既可^皮賦予影視類別屬性,也可被賦予音 樂類別屬性,而每種類別屬性又分別對(duì)應(yīng)一種相關(guān)屬性,所以,對(duì)于"劉德華" 這樣一個(gè)關(guān)鍵詞,可能同時(shí)具有兩種相關(guān)屬性,即兩個(gè)數(shù)據(jù)表。數(shù)據(jù)表的具體 作用將在后續(xù)介紹。
在按照上述方式建立起關(guān)鍵詞詞庫(kù)后,后續(xù)過程中,可按需要隨時(shí)對(duì)其進(jìn) 行更新,如何更新為本領(lǐng)域公知,不再贅述。
步驟102:依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括的關(guān)鍵詞, 根據(jù)用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶。優(yōu)選實(shí)施例中,當(dāng)用戶 登陸網(wǎng)絡(luò)瀏覽新聞或下載資源時(shí),依據(jù)所建立的關(guān)鍵詞詞庫(kù),提取新聞標(biāo)題或 資源標(biāo)題中的關(guān)鍵詞推薦新聞給用戶。
本步驟中,當(dāng)用戶登陸網(wǎng)絡(luò)瀏覽新聞或下載資源時(shí),可依據(jù)步驟101中所
建立的關(guān)鍵詞詞庫(kù),并利用分詞算法,提取新聞標(biāo)題或資源標(biāo)題中的關(guān)鍵詞,
具體如何提取為本領(lǐng)域公知;然后,利用提取出的關(guān)鍵詞,搜索包含所述從標(biāo) 題中提取出的關(guān)鍵詞的新聞,具體如何搜索為本領(lǐng)域公知;最后,將搜索到的 新聞推薦給用戶。
優(yōu)選實(shí)施例中,本方法還包括獲取并保存作為推薦對(duì)象的新聞的步驟。
本步驟中,獲取新聞的方式主要包括從指定的網(wǎng)站上抓取,這里所提到 的指定網(wǎng)站主要是指一些比較大的門戶網(wǎng)站,具體抓取方式可以是采用網(wǎng)絡(luò)爬 蟲工具-Spider抓??;或者,也可以人工編輯各種新聞;當(dāng)然,也可采用上述 兩種方式的組合,但通常以Spider抓取方式為主,以人工編輯為輔。另外,還 可對(duì)抓取到的新聞進(jìn)行更新,以確保能夠獲取到最新的新聞。
通過Spider抓取方式獲取到的新聞主要包括以下內(nèi)容新聞標(biāo)題、新聞分 類(體育、娛樂或軍事等)、新聞標(biāo)簽、正文內(nèi)容以及新聞圖片等。有的新聞可 能沒有新聞標(biāo)簽或新聞圖片,那么對(duì)于這類新聞,只需抓取新聞標(biāo)題、新聞分 類以及正文內(nèi)容即可。
之后,對(duì)獲取到的新聞進(jìn)行預(yù)處理,包括新聞分類、關(guān)鍵詞提取以及建立索引等。
其中,針對(duì)新聞的分類,目前已經(jīng)出現(xiàn)了一些自動(dòng)分類系統(tǒng),但由于本發(fā) 明所述方案中的新聞主要來源于各大門戶網(wǎng)站,它們對(duì)新聞已有詳細(xì)的分類, 而且分類方式基本相同,可能只是在文字描述方式上有一些細(xì)微的差別,所以 本發(fā)明實(shí)施例中,在對(duì)獲取到的新聞進(jìn)行分類時(shí),只需對(duì)各門戶網(wǎng)站中常用的
新聞分類詞匯進(jìn)行統(tǒng)一即可。比如中國(guó)足球和國(guó)內(nèi)足3求是兩個(gè)不同的門戶網(wǎng) 站中對(duì)足球項(xiàng)目的一種分類,其實(shí)質(zhì)含義是一樣的,只是表達(dá)方式不同,因此 可以將它們歸屬為同一類。
對(duì)分類后的每篇新聞的標(biāo)題、標(biāo)簽以及正文內(nèi)容進(jìn)行關(guān)鍵詞提取。具體提 取方式如下首先,依據(jù)所建立的關(guān)鍵詞詞庫(kù)建立分詞詞典,然后利用分詞算 法,提取標(biāo)題、標(biāo)簽以及正文內(nèi)容中的關(guān)鍵詞,分詞算法的具體實(shí)現(xiàn)為本領(lǐng)域 公知,不再贅述;另外,還需要提取每篇新聞中的指定符號(hào),如《》、""中所 標(biāo)定的內(nèi)容。之后,還可為從標(biāo)題、標(biāo)簽以及正文內(nèi)容中提取出的關(guān)鍵詞設(shè)置 不同的權(quán)重,對(duì)所提取出的關(guān)鍵詞按照權(quán)重由大到d 、的順序進(jìn)行排序;比如, 可將從標(biāo)題中提取出的關(guān)鍵詞的權(quán)重設(shè)置為大于從標(biāo)簽中提取出的關(guān)鍵詞的權(quán) 重,并將從標(biāo)簽中提取出的關(guān)鍵詞的權(quán)重設(shè)置為大于從正文內(nèi)容中提取出的關(guān) 鍵詞的權(quán)重;然后,可過濾掉排序后處于尾部的一些相對(duì)不太重要的關(guān)鍵詞, 這樣一來,既能防止出現(xiàn)過多的關(guān)鍵詞,又能保留下重要的關(guān)鍵詞。
完成新聞分類以及關(guān)鍵詞提取等過程后,即可為每篇新聞的標(biāo)題、標(biāo)簽、 正文內(nèi)容以及從該新聞中提取出的關(guān)鍵詞等建立索引,以方便后續(xù)搜索。對(duì)于 一般的搜索過程來說,如果要搜索某一對(duì)象,可能需要遍歷所有的記錄,但如 果建立了索引,就相當(dāng)于為記錄創(chuàng)建了一個(gè)目錄,這樣再搜索時(shí)只需到目錄中
進(jìn)行搜索即可,這樣處理的好處是可以提高搜索速度,尤其是在待搜索的記錄 比較多的情況下。如何建立索引為本領(lǐng)域公知,不再贅述。另外,還可為標(biāo)題、 標(biāo)簽、正文內(nèi)容以及從新聞中提取出的關(guān)鍵詞設(shè)置不同的權(quán)重。具體作用后續(xù) 將會(huì)介紹。本發(fā)明的一個(gè)優(yōu)選實(shí)施例,可預(yù)先為新聞的標(biāo)題、標(biāo)簽、正文內(nèi)容以及從 新聞中提取出的關(guān)鍵詞設(shè)置不同的權(quán)重,那么本步驟中,在將搜索到的新聞推 薦給用戶之前,可進(jìn)一步依據(jù)該從標(biāo)題中提取出的關(guān)鍵詞在搜索到的新聞所處 位置的權(quán)重的不同,將搜索到的新聞按照權(quán)重由大到小的順序進(jìn)行排序,然后, 將排序后的新聞依次推薦給用戶。比如,假設(shè)將標(biāo)題的權(quán)重設(shè)置為大于正文內(nèi)
容的權(quán)重,并假設(shè)共搜索到兩條新聞,其中一條新聞中關(guān)^:詞位于標(biāo)題中,即 該新聞是基于標(biāo)題搜索到的,而另一條新聞中關(guān)鍵詞位于正文內(nèi)容中,即該新 聞是基于正文內(nèi)容搜索到的,那么,則可將基于標(biāo)題搜索到的新聞排在基于正 文內(nèi)容搜索到的新聞之前,優(yōu)先推薦給用戶。
另外,對(duì)于新聞來說,時(shí)效性是非常重要的,所以本實(shí)施例中,可將新聞 的發(fā)表時(shí)間作為一個(gè)重要的權(quán)重指標(biāo)。比如,可設(shè)定一個(gè)時(shí)間界限,將上述按
聞過濾掉,并將過濾后的新聞推薦給用戶;或者,將所述按照權(quán)重由大到小的 順序進(jìn)行排序后的新聞進(jìn)一步按照發(fā)表時(shí)間的先后進(jìn)行排序,將時(shí)間在先的新 聞優(yōu)先推薦給用戶。
再有,本發(fā)明所述方案中,為了給用戶推薦更多更全面的新聞內(nèi)容,還可
步驟101中所建立的數(shù)據(jù)表,確定所提取出的關(guān)鍵詞的相關(guān)屬性,然后在所保 存的新聞中搜索出包含提取出的關(guān)鍵詞的新聞后,進(jìn)一步搜索出包含該提取出 的關(guān)鍵詞的相關(guān)屬性的新聞;或者,也可以在所保存的新聞中搜索同時(shí)包含提 取出的關(guān)鍵詞及其相關(guān)屬性的新聞,具體實(shí)現(xiàn)方式不限。對(duì)于前一種方式,可 將按照關(guān)鍵詞搜索到的新聞的權(quán)重設(shè)置為高于按照關(guān)鍵詞的相關(guān)屬性搜索到的 新聞,從而將按照關(guān)鍵詞搜索到的新聞優(yōu)先推薦給用戶。
在實(shí)際應(yīng)用中,根據(jù)用戶行為的不同,即是下載資源還是瀏覽新聞,本步 驟的具體將略有不同,下面結(jié)合具體的示例,對(duì)本步驟的具體實(shí)現(xiàn)作進(jìn)一步地 "i羊細(xì)i兌明 A、當(dāng)用戶下載資源(包括查看下載資源的下載狀態(tài))時(shí),首先,用戶所在客
戶端將用戶所下載的資源的相關(guān)信息,如資源標(biāo)題以及資源格式(exe或rm等) 等發(fā)送至服務(wù)器;服務(wù)器根據(jù)關(guān)鍵詞詞庫(kù)提取該資源標(biāo)題中的關(guān)鍵詞。例如, 資源標(biāo)題為"越獄第三季01高清晰",而關(guān)鍵詞詞庫(kù)中記錄有關(guān)鍵詞"越獄第 三季",則可按照分詞算法,從資源標(biāo)題中提取出關(guān)鍵詞"越獄第三季";同時(shí), 根據(jù)資源標(biāo)題以及資源格式等信息,可判斷出該關(guān)鍵詞屬于影視類型,進(jìn)而從 關(guān)鍵詞詞庫(kù)中查找出關(guān)鍵詞"越獄第三季,,對(duì)應(yīng)的相關(guān)屬性,如導(dǎo)演為Jim Barrett 等。服務(wù)器到所保存的新聞中分別搜索包含有"越獄第三季"和"Jim Barrett" 的新聞,或者搜索同時(shí)包含有"越獄第三季"和"JimBarrett"的新聞。對(duì)于前 一種情況,服務(wù)器還需要對(duì)搜索到的新聞進(jìn)行排序,即將包含有"越獄第三季" 的新聞的權(quán)重設(shè)置為高于包含有"JimBarrett"的新聞的權(quán)重,然后將排序后位 置靠前的新聞優(yōu)先推薦給用戶。另外,還可進(jìn)一步過濾掉搜索到的新聞中的非 影視類新聞,將剩下的影視類新聞推薦給用戶。 舉例說明
用戶正在下載一部電視劇《李小龍傳奇》中的第一集,客戶端將資源標(biāo)題 "李小龍傳奇高清版0r以及資源格式"rm"發(fā)送給服務(wù)器;服務(wù)器根據(jù)關(guān)鍵 詞詞庫(kù)提取出"李小龍傳奇高清版01"中的關(guān)鍵詞"李小龍傳奇",同時(shí)根據(jù) 資源標(biāo)題以及資源格式"rm"確定出該資源為影視資源;然后,到關(guān)鍵詞詞庫(kù) 中查找關(guān)鍵詞"李小龍傳奇,,的相關(guān)屬性,得到導(dǎo)演李文歧,以及演員陳 囯坤、王洛勇等相關(guān)信息;之后,到所保存的新聞中分別搜索包含"李小龍傳 奇"、"李文歧"、"陳國(guó)坤,,等詞匯的新聞,并得到以下一系列新聞
1、 《李小龍傳奇》開播黃皮小子曾是李連杰替身
2、 《李小龍傳奇》8集用了 3次替身
3、 龍旋風(fēng)使陰招龍迷難解李小龍本是問題少年(圖)
內(nèi)容為針對(duì)觀眾的反饋,昨日本報(bào)記者致電了本劇導(dǎo)演李文歧......
4、 《李小龍傳奇》開播黃皮小子曾是李連杰替身
內(nèi)容為而與陳國(guó)坤對(duì)戰(zhàn)的黃皮小子李淵也是武替出身......由于3和4均為按照關(guān)鍵詞的相關(guān)屬性搜索出的新聞,而1和2為按照關(guān) 鍵詞搜索出的新聞,所以1和2的權(quán)重高于3和4,將1和2排在3和4的前 面;另外,對(duì)于1和2,由于都是按照關(guān)鍵詞搜索出的新聞,所以這兩個(gè)在排 序時(shí)可任意設(shè)置先后,3和4的情況類似;再有,對(duì)于通過不同方式搜索出來 的重復(fù)新聞,比如1和4,可將其進(jìn)行合并,并將兩者的權(quán)重之和作為合并后 的新聞的權(quán)重,或者,也可以直接取權(quán)重較高的新聞;最后,將合并后得到的 3條新聞推薦給用戶。
B、瀏覽新聞
當(dāng)用戶瀏覽新聞時(shí),客戶端將該新聞的標(biāo)題以及新聞id號(hào)等發(fā)送給服務(wù)器; 服務(wù)器提取出標(biāo)題中的關(guān)鍵詞,并獲取該關(guān)鍵詞的相關(guān)屬性,然后到所保存的 新聞中分別搜索包含該關(guān)鍵詞以及相關(guān)屬性的新聞;在得到所需新聞后,服務(wù) 器進(jìn)一步根據(jù)新聞id號(hào),確定出該新聞的具體類型,然后過濾掉非同類的新聞 或降低權(quán)重,并對(duì)搜索到的新聞進(jìn)行排序;最后,將排序后的新聞依次推薦給 用戶。
舉例說明
用戶正在瀏覽新聞"《李小龍傳奇》開播黃皮小子層是李連杰替身",id 號(hào)為123??蛻舳藢⑿侣剺?biāo)題以及id號(hào)發(fā)送給服務(wù)器;服務(wù)器提取出標(biāo)題中的 關(guān)鍵詞"李小龍傳奇"以及"李連杰",然后在所保存的新聞中分別搜索包含"李 小龍傳奇"和"李連杰"的新聞,當(dāng)然,也可搜索同時(shí)包含"李小龍傳奇"和 "李連杰"的新聞,假設(shè)該示例中采用前一種方式;之后,依據(jù)id號(hào)確定出用 戶瀏覽的新聞?lì)愋蜑閵蕵沸侣?,進(jìn)而過濾掉搜索到的新聞中的非娛樂類新聞; 最后,對(duì)搜索到的新聞進(jìn)行排序,假設(shè)將包含"李小龍傳奇"的新聞的權(quán)重設(shè) 置為高于包含"李連杰"的新聞,并將排序后的新聞依次推薦給用戶。當(dāng)然, 如果需要,仍可將關(guān)鍵詞"李小龍傳奇"和/或"李連杰"的相關(guān)屬性作為查詢 對(duì)象。
需要說明的是,如果按照本發(fā)明所述方案搜索出的新聞數(shù)小于預(yù)先設(shè)置的 閾值,比如,如果用戶正在下載一部很老的電影,那么與該電影相關(guān)的新聞可能很少,這種情況下,可按照現(xiàn)有方式,進(jìn)一步將最新和/或最熱門的新聞推薦 給用戶。
發(fā)明所述方案進(jìn)行說明;本領(lǐng)域技術(shù)人員應(yīng)該知道,對(duì)于其它的用戶行為,本 發(fā)明所述方案將同樣適用。
基于上述方法,圖2為本發(fā)明新聞推薦系統(tǒng)實(shí)施例的組成結(jié)構(gòu)示意圖。如
圖2所示,該系統(tǒng)包括
關(guān)鍵詞數(shù)據(jù)庫(kù)21,用于保存預(yù)先建立的關(guān)鍵詞詞庫(kù);
服務(wù)器子系統(tǒng)23,用于依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括 的關(guān)鍵詞,并根據(jù)所述用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶。
另外,在實(shí)際應(yīng)用中,圖2所示系統(tǒng)中還將進(jìn)一步包括客戶端22,用于用 戶登錄到互聯(lián)網(wǎng)上,以進(jìn)行瀏覽新聞或下載資源等用戶行為。
其中,服務(wù)器子系統(tǒng)23中包括
新聞采集服務(wù)器231,用于從指定的網(wǎng)站上抓取和/或接收人工編輯并輸入 的各種新聞,并將獲取到的各種新聞發(fā)送給新聞?lì)A(yù)處理服務(wù)器232;
新聞?lì)A(yù)處理服務(wù)器232,用于接收和保存來自新聞采集服務(wù)器231的各種 新聞,對(duì)每篇新聞的標(biāo)題、標(biāo)簽和正文內(nèi)容進(jìn)行關(guān)鍵詞提取,并為每篇新聞的 標(biāo)題、標(biāo)簽、正文內(nèi)容以及從該新聞中提取出的關(guān)鍵詞建立索引,以方便進(jìn)行 新聞搜索;
新聞推薦服務(wù)器233,用于依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所 包括的關(guān)鍵詞,發(fā)送給新聞搜索服務(wù)器234;并接收新聞搜索服務(wù)器234返回 的搜索到的新聞,推薦給用戶;
新聞搜索服務(wù)器234,用于接收來自新聞推薦服務(wù)器233的用戶行為信息 中所包括的關(guān)鍵詞,并基于所建立的索引,在新聞?lì)A(yù)處理服務(wù)器232所保存的 新聞中,搜索包含所述用戶行為信息中所包括的關(guān)鍵詞的新聞,返回給新聞推 薦服務(wù)器233。
另外,新聞搜索服務(wù)器234可進(jìn)一步用于,為新聞的標(biāo)題、標(biāo)簽、正文內(nèi)容以及從新聞中提取出的關(guān)鍵詞設(shè)置不同的權(quán)重,按照所述用戶行為信息中所 包括的關(guān)鍵詞在搜索到的新聞中所處位置的權(quán)重的不同,將搜索到的新聞按照 權(quán)重由大到小的順序進(jìn)行排序,并將排序后的新聞依次返回給新聞推薦服務(wù)器
233。
進(jìn)一步地,新聞推薦服務(wù)器233將排序后的新聞依次推薦給用戶,其還可 設(shè)定一個(gè)時(shí)間界限,過濾掉按照權(quán)重由大到小的順序進(jìn)行排序后的新聞中發(fā)表 時(shí)間在所述時(shí)間界限之后的新聞;或者,將按照權(quán)重由大到小的順序進(jìn)行排序 后的新聞進(jìn)一 步按照發(fā)表時(shí)間的先后進(jìn)行排序。
新聞推薦服務(wù)器233還可進(jìn)一步用于,確定用戶行為信息中所包括的關(guān)鍵 詞的類別屬性,依據(jù)該用戶行為信息中所包括的關(guān)鍵詞對(duì)應(yīng)的數(shù)據(jù)表,確定該 用戶行為信息中所包括的關(guān)鍵詞的相關(guān)屬性,將所述相關(guān)屬性發(fā)送給新聞搜索 服務(wù)器234,或者,將用戶行為信息中所包括的關(guān)鍵詞及其相關(guān)屬性一起發(fā)送 給新聞搜索服務(wù)器234;
新聞搜索服務(wù)器234進(jìn)一步用于,在新聞?lì)A(yù)處理服務(wù)器232保存的新聞中 搜索包含用戶行為信息中所包括的關(guān)鍵詞的相關(guān)屬性的新聞,或者,在新聞?lì)A(yù) 處理服務(wù)器232保存的新聞中搜索同時(shí)包含用戶行為信息中所包括的關(guān)鍵詞及 其相關(guān)屬性的新聞,并返回給新聞推薦服務(wù)器233;新聞推薦服務(wù)器233將按 照用戶行為信息中所包括的關(guān)鍵詞搜索到的新聞的權(quán)重設(shè)置為高于按照用戶行 為信息中所包括的關(guān)鍵詞的相關(guān)屬性搜索到的新聞,并將按照用戶行為信息中 所包括的關(guān)鍵詞搜索到的新聞優(yōu)先推薦給用戶。
服務(wù)器子系統(tǒng)23中還可進(jìn)一步包括熱門新聞推薦服務(wù)器235,用于確定 新聞推薦服務(wù)器233已經(jīng)推薦給用戶的新聞數(shù)是否少于預(yù)先設(shè)定的閾值,如果 是,則將最新和/或最熱門的新聞通過新聞推薦服務(wù)器233推薦給用戶。
圖2所示系統(tǒng)的具體工作流程請(qǐng)參照?qǐng)D1所示方法實(shí)施例中的相應(yīng)說明, 此處不再贅述。
總之,采用本發(fā)明的技術(shù)方案,能夠針對(duì)不同的用戶,分別推薦與該用戶 相關(guān)的不同新聞,從而提升了用戶體驗(yàn)。綜上所述,以上僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的 保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改 進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種基于互聯(lián)網(wǎng)的新聞推薦方法,其特征在于,該方法包括建立關(guān)鍵詞詞庫(kù);依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括的關(guān)鍵詞,根據(jù)用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述建立關(guān)鍵詞詞庫(kù)包括 從互聯(lián)網(wǎng)上抓取所需的詞匯、提取各網(wǎng)站的新聞中指定符號(hào)所標(biāo)定的內(nèi)容,和/或,接收人工輸入的詞匯。
3、 根據(jù)權(quán)利要求2所述的方法,其特征在于,該方法進(jìn)一步包括獲取和 保存作為推薦對(duì)象的新聞。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取和保存作為推薦對(duì) 象的新聞包括從指定的網(wǎng)站上4爪取和/或人工編輯各種新聞并保存;對(duì)每篇新聞的標(biāo)題、 標(biāo)簽和正文內(nèi)容進(jìn)行關(guān)^;詞提取,并為每篇新聞的標(biāo)題、標(biāo)簽、正文內(nèi)容以及 從該新聞中提取出的關(guān)鍵詞建立索引;所述根據(jù)用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶包括利用所建 立的索引,在所保存的新聞中搜索包含所述用戶行為信息中所包含的關(guān)鍵詞的 新聞,并推薦給用戶。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對(duì)每篇新聞的標(biāo)題、標(biāo) 簽和正文內(nèi)容進(jìn)行關(guān)鍵詞提取包括依據(jù)所述關(guān)鍵詞詞庫(kù),利用分詞算法,對(duì)每篇新聞的標(biāo)題、標(biāo)簽和正文內(nèi) 容進(jìn)行關(guān)鍵詞提取,同時(shí),提取每篇新聞中的指定符號(hào)所標(biāo)定的內(nèi)容作為關(guān)鍵 詞;并為所述從新聞中提取出的關(guān)鍵詞設(shè)置不同的權(quán)重,對(duì)所述從新聞中提取 出的關(guān)鍵詞按照權(quán)重由大到小的順序進(jìn)行排序,過濾掉排序后處于尾部的預(yù)定 個(gè)關(guān)鍵詞。
6、 根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述在所保存的新聞中搜索包含所述用戶行為信息中所包括的關(guān)鍵詞的新聞,并推薦給用戶包括為新聞的標(biāo)題、標(biāo)簽、正文內(nèi)容以及從新聞中提取出的關(guān)鍵詞設(shè)置不同的權(quán)重;按照所述用戶行為信息中所包含的關(guān)鍵詞在搜索到的新聞中所處位置的權(quán) 重的不同,將搜索到的新聞按照權(quán)重由大到小的順序進(jìn)行排序,并將排序后的 新聞依次推薦給用戶。
7、 根據(jù)權(quán)利要求6所述的方法,其特征在于,該方法進(jìn)一步包括 設(shè)定一個(gè)時(shí)間界限,過濾掉所述按照權(quán)重由大到小的順序進(jìn)行排序后的新聞中發(fā)表時(shí)間在所述時(shí)間界限之后的新聞,將過濾后的新聞推薦給用戶;或者,將所述按照權(quán)重由大到小的順序進(jìn)行排序后的新聞進(jìn)一步按照發(fā)表 時(shí)間的先后進(jìn)行排序,將重新排序后的新聞推薦給用戶。
8、 根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述建立關(guān)鍵詞詞庫(kù)進(jìn) 一步包括依據(jù)不同關(guān)鍵詞的類別屬性,建立不同的數(shù)據(jù)表以標(biāo)識(shí)不同關(guān)鍵詞 的相關(guān)屬性;所述提取用戶行為信息中所包含的關(guān)鍵詞進(jìn)一步包括確定所述用戶行為 信息中所包含的關(guān)鍵詞的類別屬性,并依據(jù)所述用戶行為信息中所包含的關(guān)鍵 詞對(duì)應(yīng)的數(shù)據(jù)表,確定所述用戶行為信息中所包含的關(guān)鍵詞的相關(guān)屬性;所述在所保存的新聞中搜索包含所述用戶行為信息中所包含的關(guān)鍵詞的新 聞進(jìn)一步包括在所保存的新聞中搜索包含所述用戶行為信息中所包含的關(guān)鍵 詞的相關(guān)屬性的新聞,或者,在所保存的新聞中搜索同時(shí)包含所述用戶行為信 息中所包含的關(guān)鍵詞及其相關(guān)屬性的新聞。
9、 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述在所保存的新聞中搜索 同時(shí)包含所述用戶行為信息中所包含的關(guān)鍵詞及其相關(guān)屬性的新聞進(jìn)一步包 括將按照所述用戶行為信息中所包含的關(guān)鍵詞搜索到的新聞的權(quán)重設(shè)置為高 于按照所述用戶行為信息中所包含的關(guān)鍵詞的相關(guān)屬性搜索到的新聞;所述推薦給用戶包括將按照所述用戶行為信息中所包含的關(guān)鍵詞搜索到的新聞優(yōu)先推薦給用戶。
10、 根據(jù)權(quán)利要求8所述的方法,其特征在于,將新聞推薦給用戶之后,進(jìn)一步包括確定已經(jīng)推薦給用戶的新聞數(shù)是否小于預(yù)先設(shè)定的閾值,如杲是,則將最 新和/或最熱門的新聞推薦給用戶。
11、 一種基于互聯(lián)網(wǎng)的新聞推薦系統(tǒng),其特征在于,該系統(tǒng)包括 關(guān)鍵詞數(shù)據(jù)庫(kù),用于保存建立的關(guān)鍵詞詞庫(kù);服務(wù)器子系統(tǒng),用于依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括的 關(guān)鍵詞,并根據(jù)所述用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶。
12、 根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述服務(wù)器子系統(tǒng)包括 新聞采集服務(wù)器,用于從指定的網(wǎng)站上抓取和/或接收人工編輯并輸入的各種新聞,并將獲取到的各種新聞發(fā)送給新聞?lì)A(yù)處理服務(wù)器;所述新聞?lì)A(yù)處理服務(wù)器,用于接收和保存來自所述新聞采集服務(wù)器的各種 新聞,對(duì)每篇新聞的標(biāo)題、標(biāo)簽和正文內(nèi)容進(jìn)行關(guān)鍵詞提取,并為每篇新聞的 標(biāo)題、標(biāo)簽、正文內(nèi)容以及從該新聞中提取出的關(guān)鍵詞建立索引,以方便進(jìn)行 新聞搜索;新聞推薦服務(wù)器,用于依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括 的關(guān)鍵詞,發(fā)送給新聞搜索服務(wù)器;并接收所述新聞搜索服務(wù)器返回的搜索到 的新聞,推薦給用戶;所述新聞搜索服務(wù)器,用于接收來自所述新聞推薦服務(wù)器的所述用戶行為 信息中所包括的關(guān)鍵詞,并基于所建立的索引,在所述新聞?lì)A(yù)處理服務(wù)器所保 存的新聞中搜索包含所述用戶行為信息中所包括的關(guān)鍵詞的新聞,返回給所述 新聞推薦服務(wù)器。
13、 根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述新聞搜索服務(wù)器進(jìn)一 步用于,為新聞的標(biāo)題、標(biāo)簽、正文內(nèi)容以及從新聞中提取出的關(guān)鍵詞設(shè)置不 同的權(quán)重,按照所述用戶行為信息中所包括的關(guān)鍵詞在搜索到的新聞中所處位 置的權(quán)重的不同,將搜索到的新聞按照權(quán)重由大到小的順序進(jìn)行排序,并將排序后的新聞依次返回給新聞推薦服務(wù)器。
14、 根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述新聞推薦服務(wù)器進(jìn)一 步用于,設(shè)定一個(gè)時(shí)間界限,過濾掉所述按照權(quán)重由大到小的順序進(jìn)行排序后 的新聞中發(fā)表時(shí)間在所述時(shí)間界限之后的新聞;或者,將所述按照權(quán)重由大到 'J、的順序進(jìn)行排序后的新聞進(jìn)一步按照發(fā)表時(shí)間的先后進(jìn)行排序。
15、 根據(jù)權(quán)利要求12或13所述的系統(tǒng),其特征在于,所述新聞推薦服務(wù) 器進(jìn)一步用于,確定所述用戶行為信息中所包括的關(guān)鍵詞的類別屬性,依據(jù)所 述用戶行為信息中所包括的關(guān)鍵詞對(duì)應(yīng)的數(shù)據(jù)表,確定所述用戶行為信息中所 包括的關(guān)鍵詞的相關(guān)屬性,并將所述相關(guān)屬性發(fā)送給所述新聞搜索服務(wù)器,或 者,將所述用戶行為信息中所包括的關(guān)鍵詞及其相關(guān)屬性一起發(fā)送給所述新聞 搜索服務(wù)器;所述新聞搜索服務(wù)器進(jìn)一步用于,在所述新聞?lì)A(yù)處理服務(wù)器所保存的新聞 中搜索包含所述用戶行為信息中所包括的關(guān)鍵詞的相關(guān)屬性的新聞,或者,在 所述新聞?lì)A(yù)處理服務(wù)器所保存的新聞中搜索同時(shí)包含所述用戶行為信息中所包 括的關(guān)鍵詞及其相關(guān)屬性的新聞,并返回給所述新聞推薦服務(wù)器;所述新聞推薦服務(wù)器將按照所述用戶行為信息中所包括的關(guān)鍵詞搜索到的 新聞的權(quán)重設(shè)置為高于按照所述用戶行為信息中所包括的關(guān)鍵詞的相關(guān)屬性搜 索到的新聞,并將按照所述用戶行為信息中所包括的關(guān)鍵詞搜索到的新聞優(yōu)先 推薦給用戶。
16、 根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述服務(wù)器子系統(tǒng)中進(jìn)一 步包括熱門新聞推薦服務(wù)器,用于確定所述新聞推薦服務(wù)器已經(jīng)推薦給用戶的新 聞數(shù)是否小于預(yù)先設(shè)定的閾值,如果是,則將最新和/或最熱門的新聞通過所述 新聞推薦服務(wù)器推薦給用戶。
全文摘要
本發(fā)明公開了一種基于互聯(lián)網(wǎng)的新聞推薦方法,包括預(yù)先建立關(guān)鍵詞詞庫(kù),并依據(jù)所述關(guān)鍵詞詞庫(kù),提取用戶行為信息中所包括的關(guān)鍵詞,根據(jù)用戶行為信息中所包括的關(guān)鍵詞推薦新聞給用戶。本發(fā)明同時(shí)公開了一種基于互聯(lián)網(wǎng)的新聞推薦系統(tǒng)。應(yīng)用本發(fā)明所述的方法和系統(tǒng),能夠針對(duì)不同用戶,分別推薦與該用戶相關(guān)的不同新聞,從而提升了用戶體驗(yàn)。
文檔編號(hào)G06F17/30GK101446959SQ20081018884
公開日2009年6月3日 申請(qǐng)日期2008年12月30日 優(yōu)先權(quán)日2008年12月30日
發(fā)明者劉漢洲 申請(qǐng)人:深圳市迅雷網(wǎng)絡(luò)技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
大洼县| 和平区| 崇义县| 泽州县| 泸西县| 体育| 迁安市| 定陶县| 乌兰浩特市| 卫辉市| 环江| 谷城县| 宝坻区| 枞阳县| 松滋市| 高密市| 平乐县| 左贡县| 疏勒县| 平罗县| 双柏县| 县级市| 浦县| 三江| 洪江市| 称多县| 阿克| 临西县| 沂水县| 旬阳县| 肥乡县| 田林县| 大姚县| 华阴市| 广西| 仪陇县| 绥芬河市| 四会市| 静乐县| 马山县| 伊通|