專利名稱:一種網(wǎng)絡(luò)內(nèi)容分類處理方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是涉及一種網(wǎng)絡(luò)內(nèi)容分類處理方法和裝置。
背景技術(shù):
RSS (聚合內(nèi)容,Really Simple Syndication)最早是由NetScape定義的一 套新聞?lì)l道標(biāo)準(zhǔn),從RSS的歷史發(fā)展來看,RSS是一種信息溝通標(biāo)準(zhǔn),RSS 借助XML技術(shù)形式,完成互聯(lián)網(wǎng)站點(diǎn)間信息的自動(dòng)傳送。
RSS作為站點(diǎn)間的信息溝通標(biāo)準(zhǔn),有兩個(gè)特點(diǎn), 一是網(wǎng)站間自動(dòng)完成, 不需要人工介入;二是傳送的內(nèi)容是一個(gè)分類的索引信息。從自動(dòng)完成這一 點(diǎn)看,將對(duì)互聯(lián)網(wǎng)信息傳送的速度和廣度產(chǎn)生影響;從RSS的內(nèi)容是分類的 索引信息這一點(diǎn)看,具有語義的含義,互聯(lián)網(wǎng)信息的定義將從純粹的文本符 號(hào)上升到有語義聯(lián)系的層面。
由此可見,看起來十分筒單的RSS技術(shù)實(shí)際上承載著格式化互聯(lián)網(wǎng)信息, 并賦予互聯(lián)網(wǎng)語義的重任。不過,RSS只是一個(gè)索引信息,并沒有完整的解 決信息溝通的問題。
RSS是在線共享內(nèi)容的一種簡易方式。通常在時(shí)效性比較強(qiáng)的內(nèi)容上使 用RSS訂閱能更快速獲取信息,RSS傳送的內(nèi)容是一個(gè)分類的索引信息,如 圖1所示,廣泛用于網(wǎng)上新聞?lì)l道,blog和wiki。
一方面,RSS可以實(shí)現(xiàn)對(duì)目標(biāo)內(nèi)容摘要性的內(nèi)容輸出,輸出的是不完整 的內(nèi)容,例如圖1中不完整的摘要內(nèi)容,且未提供對(duì)諸如文本、圖片、音頻、 視頻、下載附件、評(píng)論等細(xì)分輸出。
另一方面,RSS可以對(duì)內(nèi)容按數(shù)據(jù)的文件類型屬性作分類輸出,如文 字、圖片、3gp視頻、mpeg視頻、mp3音頻、wma音頻。但不能根據(jù)內(nèi)容類 型屬性進(jìn)行輸出,如,3gp視頻、mpeg視頻均可以作為廣告的內(nèi)容文件進(jìn)行發(fā)布,但RSS并不能將上述兩種文件統(tǒng)一按照"廣告"的類型屬性進(jìn)行輸出, 為具體應(yīng)用中的分類傳輸功能實(shí)現(xiàn)設(shè)置了局限。
因此,需要一種可以按照內(nèi)容類型屬性而不是文件類型屬性作分類輸出 的方法,以便于網(wǎng)絡(luò)或中斷驚醒相應(yīng)的處理,改善用戶的應(yīng)用體^r。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例要解決的問題是提供一種網(wǎng)絡(luò)內(nèi)容分類處理方法,用于實(shí) 現(xiàn)對(duì)不同的網(wǎng)絡(luò)內(nèi)容進(jìn)行提取、解析、并按照所定義的分類重新整合,從而 進(jìn)行分類傳輸?shù)男Ч?br>
為達(dá)到上述目的,本發(fā)明實(shí)施例一方面提出 一種網(wǎng)絡(luò)內(nèi)容分類處理方法, 包括以下步驟
獲取網(wǎng)絡(luò)資源;
提取所述網(wǎng)絡(luò)資源中的內(nèi)容,并對(duì)所述內(nèi)容進(jìn)行分類; 將所述分類后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出。
另一方面,本發(fā)明實(shí)施例還提出一種網(wǎng)絡(luò)內(nèi)容分類處理裝置,包括 獲取模塊,用于獲取網(wǎng)絡(luò)資源;
分類模塊,用于提取所述獲取模塊獲取的網(wǎng)絡(luò)資源中的內(nèi)容,并對(duì)所述 內(nèi)容進(jìn)行分類;
輸出模塊,用于將所述分類模塊分類后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出。 本發(fā)明實(shí)施例的技術(shù)方案具有以下優(yōu)點(diǎn),因?yàn)椴捎昧藢?duì)不同的網(wǎng)絡(luò)內(nèi)容 進(jìn)行提取、解析、并按照所定義的分類重新整合,并對(duì)整合結(jié)果進(jìn)行分類傳 輸?shù)募夹g(shù),從而,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)內(nèi)容分類和重新整合,并對(duì)相應(yīng)的內(nèi)容進(jìn)行 分類傳輸,便于其他系統(tǒng)對(duì)數(shù)據(jù)作進(jìn)一步的處理。
圖1為現(xiàn)有技術(shù)中RSS技術(shù)的傳輸效果示意圖2為本發(fā)明實(shí)施例 一 中 一種網(wǎng)絡(luò)內(nèi)容分類處理方法的流程示意圖3為本發(fā)明實(shí)施例一中網(wǎng)絡(luò)資源結(jié)構(gòu)示意圖;圖4為本發(fā)明實(shí)施例一中網(wǎng)絡(luò)內(nèi)容分類示意圖5為本發(fā)明實(shí)施例二中一種提供分類數(shù)據(jù)傳輸?shù)木W(wǎng)絡(luò)示意圖6為本發(fā)明實(shí)施例三中 一種由服務(wù)器進(jìn)行網(wǎng)絡(luò)內(nèi)容分類的示意圖7為本發(fā)明實(shí)施例四中一種有終端進(jìn)行網(wǎng)絡(luò)內(nèi)容分類的示意圖8為本發(fā)明實(shí)施例五中一種網(wǎng)絡(luò)內(nèi)容分類處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
本發(fā)明實(shí)施例現(xiàn)有RSS技術(shù)只能實(shí)現(xiàn)對(duì)目標(biāo)內(nèi)容按照文件類型屬性輸 出,而不能按照內(nèi)容屬性進(jìn)行輸出,使目標(biāo)內(nèi)容的分類處理存在局限,本發(fā) 明針對(duì)這種情況,實(shí)現(xiàn)了將文本、圖片、音頻、視頻、下載附件、評(píng)論等任 意內(nèi)容逐一進(jìn)行提取、解析、以實(shí)現(xiàn)將內(nèi)容按照所定義的分類,并可以進(jìn)一 步對(duì)所分類的內(nèi)容重新進(jìn)行整合。
下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式
作進(jìn)一 步詳細(xì)描述
如圖2所示,為本發(fā)明實(shí)施例一,一種網(wǎng)絡(luò)內(nèi)容分類處理方法的流程示 意圖,包括以下步驟
步驟S201、獲取網(wǎng)絡(luò)資源。
本步驟所提及的獲取網(wǎng)絡(luò)資源的方法,可以是網(wǎng)絡(luò)服務(wù)器直接獲得上傳 的網(wǎng)絡(luò)資源,或中轉(zhuǎn)服務(wù)器有網(wǎng)絡(luò)獲得網(wǎng)絡(luò)資源,或終端通過服務(wù)器獲得網(wǎng) 絡(luò)資源,以上三種情況將通過后續(xù)的本發(fā)明實(shí)施例二、三、四進(jìn)行詳細(xì)描述, 本實(shí)施例不再另行詳述。
需要進(jìn)一步指出的是,上述情況的差別并不影響本發(fā)明的保護(hù)范圍。
步驟S202、提取網(wǎng)絡(luò)資源中的內(nèi)容。
網(wǎng)絡(luò)資源中含有大量的內(nèi)容,且內(nèi)容種類繁多,通過提取,將網(wǎng)絡(luò)資源 中眾多的內(nèi)容逐一分離,以便為后續(xù)步驟的實(shí)現(xiàn)提供內(nèi)容基礎(chǔ)。具體的,將 文本、圖片、音頻、視頻、下載附件、評(píng)論等多種內(nèi)容分別進(jìn)行提取。
如圖3所示,該網(wǎng)絡(luò)資源中的內(nèi)容包括圖片,文字,多個(gè)由超鏈接組成 的精彩專題,由圖片或其他多媒體文件組成的廣告,多個(gè)視頻文件組成的精 彩視頻。步驟S203、解^f內(nèi)容中的標(biāo)識(shí)。
對(duì)步驟S202中提取的內(nèi)容進(jìn)行解析,識(shí)別各內(nèi)容中的標(biāo)識(shí)。 標(biāo)識(shí)具體指內(nèi)容中包含的標(biāo)記語言相關(guān)標(biāo)簽、內(nèi)容關(guān)鍵詞、類型信息、
文件大小和識(shí)別碼中的 一種或幾種。
如,在圖3中,根據(jù)結(jié)合類型信息、文件大小和內(nèi)容關(guān)鍵詞等可以識(shí)別廣告。
步驟S204、 #4居標(biāo)識(shí),對(duì)內(nèi)容進(jìn)行分類。 根據(jù)預(yù)設(shè)的內(nèi)容分類標(biāo)準(zhǔn)進(jìn)行內(nèi)容的分類。
如圖4所示,可以將相應(yīng)的內(nèi)容劃分為文字、圖片、精彩專題、視頻等 多個(gè)種類。
內(nèi)容分類的標(biāo)準(zhǔn)可以是與用戶或服務(wù)商預(yù)設(shè)的,根據(jù)具體應(yīng)用情況的變 化,分類的標(biāo)準(zhǔn)可以相應(yīng)的做出調(diào)整。 步驟S205、判斷輸出模式。
如果判斷輸出模式的結(jié)果是分類輸出,則轉(zhuǎn)入步驟S206; 如果判斷輸出模式的結(jié)果是整體輸出,則轉(zhuǎn)入步驟S207。 步驟S206、對(duì)分類后的內(nèi)容按照類別分別輸出。 根據(jù)分類結(jié)果,將每個(gè)種類的內(nèi)容分別進(jìn)行傳輸。
步驟S207、將分類后的內(nèi)容進(jìn)行處理后, 一并輸出,由內(nèi)容的接收方做 分類處理。
根據(jù)分類結(jié)果,對(duì)每個(gè)種類的內(nèi)容進(jìn)行相應(yīng)的處理,為每個(gè)種類的內(nèi)容 添加相應(yīng)的內(nèi)容種類標(biāo)識(shí)。標(biāo)識(shí)添加完成后,將所有種類的內(nèi)容一起向內(nèi)容 接收方進(jìn)行發(fā)送,接收方將上述各分類的內(nèi)容整體接收后,根據(jù)各分類內(nèi)容 的種類標(biāo)識(shí)區(qū)分該內(nèi)容的種類,并進(jìn)行相應(yīng)的處理和操作。
下面結(jié)合本發(fā)明實(shí)施例一的技術(shù)方案,進(jìn)一步的根據(jù)具體實(shí)施主體的差 別提出以下三個(gè)實(shí)施例。
如圖5所示,為本發(fā)明實(shí)施例二, 一種提供分類數(shù)據(jù)傳輸?shù)木W(wǎng)絡(luò)示意圖, 包括以下步驟步驟S501、網(wǎng)絡(luò)側(cè)內(nèi)部對(duì)網(wǎng)絡(luò)資源進(jìn)行分類。 網(wǎng)絡(luò)根據(jù)分類標(biāo)準(zhǔn)將網(wǎng)絡(luò)資源進(jìn)行分類。 步驟S502、將分類后的網(wǎng)絡(luò)內(nèi)容發(fā)送給終端。
需要指出的是,本步驟可以是將分類后的內(nèi)容分別發(fā)送給終端,也可以 是將分類后的內(nèi)容處理,如添加內(nèi)容分類標(biāo)識(shí)后,將所有添加內(nèi)容分類標(biāo)識(shí) 的內(nèi)容一起發(fā)送給終端,再由終端進(jìn)行相應(yīng)的操作。這樣的差別并不影響本 發(fā)明的保護(hù)范圍。
如圖6所示,為本發(fā)明實(shí)施例三, 一種由服務(wù)器進(jìn)行網(wǎng)絡(luò)內(nèi)容分類的示
意圖,包括以下步驟
步驟S601、服務(wù)器從互聯(lián)網(wǎng)信息源直接獲得網(wǎng)絡(luò)資源。
步驟S602、服務(wù)器根據(jù)分類標(biāo)準(zhǔn)對(duì)網(wǎng)絡(luò)資源進(jìn)行提取和分類。
服務(wù)器從網(wǎng)絡(luò)資源中提取內(nèi)容,并根據(jù)內(nèi)容中的標(biāo)識(shí)對(duì)該內(nèi)容進(jìn)行分類,
分類的標(biāo)準(zhǔn)預(yù)先設(shè)定。
步驟S603 、服務(wù)器將分類后的內(nèi)容分類發(fā)送給終端。
需要指出的是,本步驟可以是將分類后的內(nèi)容分別發(fā)送給終端,也可以
是將分類后的內(nèi)容處理,如添加內(nèi)容分類標(biāo)識(shí)后,將所有添加內(nèi)容分類標(biāo)識(shí)
的內(nèi)容一起發(fā)送給終端,再由終端進(jìn)行相應(yīng)的操作。這樣的差別并不影響本
發(fā)明的保護(hù)范圍。
如圖7所示,為本發(fā)明實(shí)施例四, 一種由終端進(jìn)行網(wǎng)絡(luò)內(nèi)容分類的示意 圖,包括以下步驟
步驟S701、網(wǎng)絡(luò)向終端傳送網(wǎng)絡(luò)資源。 該網(wǎng)絡(luò)資源未經(jīng)分類,只是統(tǒng)一的作為整體發(fā)送給終端。 步驟S702、終端對(duì)接收到的網(wǎng)絡(luò)資源進(jìn)行分類。
終端從接收到的網(wǎng)絡(luò)資源中提取內(nèi)容,并根據(jù)內(nèi)容中的標(biāo)識(shí)對(duì)該內(nèi)容進(jìn) 行分類,分類的標(biāo)準(zhǔn)預(yù)先設(shè)定。
步驟S703 、對(duì)分類后的內(nèi)容進(jìn)行相應(yīng)操作。終端進(jìn)行操作的種類包括將各分類內(nèi)容分類存儲(chǔ)、根據(jù)分類內(nèi)容對(duì)終 端接收的網(wǎng)絡(luò)內(nèi)容量進(jìn)行分類統(tǒng)計(jì)、對(duì)各分類內(nèi)容分類展現(xiàn)等。
如圖8所示,為本發(fā)明實(shí)施例五、 一種網(wǎng)絡(luò)內(nèi)容分類處理裝置的結(jié)構(gòu)示 意圖,包括
獲取模塊l,用于獲取網(wǎng)絡(luò)資源;
分類模塊2,用于提取獲取模塊l獲取的網(wǎng)絡(luò)資源中的內(nèi)容,并對(duì)內(nèi)容進(jìn)
行分類,進(jìn)一步包括
提取子模塊21,用于提取網(wǎng)絡(luò)資源中的內(nèi)容;
解析子模塊22,用于解析提取子模塊21所提取的內(nèi)容中的標(biāo)識(shí)
分類子模塊23,用于根據(jù)解析子模塊22所解析的標(biāo)識(shí),對(duì)提取子模塊
21所提取的內(nèi)容進(jìn)行分類。
輸出模塊3,用于將分類模塊2分類后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出,進(jìn)
一步包括
標(biāo)識(shí)子模塊31,用于對(duì)分類模塊分類后的內(nèi)容添加識(shí)別標(biāo)識(shí)。
本發(fā)明實(shí)施例的技術(shù)方案具有以下優(yōu)點(diǎn),因?yàn)獒娪昧藢?duì)不同的網(wǎng)絡(luò)內(nèi)容 進(jìn)行提取、解析、并按照所定義的分類重新整合,并對(duì)整合結(jié)果進(jìn)行分類傳 輸?shù)募夹g(shù),從而,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)內(nèi)容分類和重新整合,并對(duì)相應(yīng)的內(nèi)容進(jìn)行 分類傳輸,便于其他系統(tǒng)對(duì)數(shù)據(jù)作進(jìn)一步的處理。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本 發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬 件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技 術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體
現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使 得一臺(tái)終端設(shè)備(可以是手機(jī),個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等) 執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的 普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn) 和潤飾,這些改進(jìn)和潤飾也應(yīng)視本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種網(wǎng)絡(luò)內(nèi)容分類處理方法,其特征在于,包括以下步驟獲取網(wǎng)絡(luò)資源;提取所述網(wǎng)絡(luò)資源中的內(nèi)容,并對(duì)所述內(nèi)容進(jìn)行分類;將所述分類后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出。
2、 如權(quán)利要求1所迷網(wǎng)絡(luò)內(nèi)容分類處理方法,其特征在于,所述提取并 解析所述網(wǎng)絡(luò)資源中的內(nèi)容,具體為提取所述網(wǎng)絡(luò)資源中的內(nèi)容; 解析所述內(nèi)容中的標(biāo)識(shí); 才艮據(jù)所述標(biāo)識(shí),對(duì)所述內(nèi)容進(jìn)行分類。
3、 如權(quán)利要求2所迷網(wǎng)絡(luò)內(nèi)容分類處理方法,其特征在于,所述標(biāo)識(shí), 具體包括所述內(nèi)容中包含的標(biāo)記語言相關(guān)標(biāo)簽、內(nèi)容關(guān)鍵詞、類型信息、文件大 小和識(shí)別碼中的 一種或幾種。
4、 如權(quán)利要求2所述網(wǎng)絡(luò)內(nèi)容分類處理方法,其特征在于,所述對(duì)內(nèi)容 進(jìn)行分類,具體為根據(jù)預(yù)設(shè)的內(nèi)容分類標(biāo)準(zhǔn)進(jìn)行所述內(nèi)容的分類。
5、 如權(quán)利要求1所述網(wǎng)絡(luò)內(nèi)容分類處理方法,其特征在于,所述將分類 后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出,具體為對(duì)所述分類后的內(nèi)容按照類別分別輸出;或,將所述分類后的內(nèi)容進(jìn)行處理后, 一并輸出,由所述內(nèi)容的接收方做分 類處理。
6、 如權(quán)利要求5所述網(wǎng)絡(luò)內(nèi)容分類處理方法,其特征在于,所述將分類 后的內(nèi)容進(jìn)行處理,具體包括對(duì)所述分類后的內(nèi)容添加識(shí)別標(biāo)識(shí)。
7、 一種網(wǎng)絡(luò)內(nèi)容分類處理裝置,其特征在于,包括: 獲取模塊,用于獲取網(wǎng)絡(luò)資源;分類模塊,用于提取所述獲取模塊獲取的網(wǎng)絡(luò)資源中的內(nèi)容,并對(duì)所述內(nèi)容進(jìn)行分類;輸出模塊,用于將所述分類模塊分類后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出。
8、 如權(quán)利要求7所述網(wǎng)絡(luò)內(nèi)容分類處理裝置,其特征在于,所述分類模 塊,包括提取子模塊,用于提取所述網(wǎng)絡(luò)資源中的內(nèi)容; 解析子模塊,用于解析所述提取子模塊所提取的內(nèi)容中的標(biāo)識(shí) 分類子模塊,用于根據(jù)所述解析子模塊所解析的標(biāo)識(shí),對(duì)所述提取子模 塊所提取的內(nèi)容進(jìn)行分類。
9、 如權(quán)利要求7所述網(wǎng)絡(luò)內(nèi)容分類處理裝置,其特征在于,所述輸出模 塊,包括標(biāo)識(shí)子模塊,用于對(duì)所述分類模塊分類后的內(nèi)容添加識(shí)別標(biāo)識(shí)。
全文摘要
本發(fā)明實(shí)施例公開了一種網(wǎng)絡(luò)內(nèi)容分類處理方法和裝置,所述方法包括以下步驟獲取網(wǎng)絡(luò)資源;提取所述網(wǎng)絡(luò)資源中的內(nèi)容,并對(duì)所述內(nèi)容進(jìn)行分類;將所述分類后的網(wǎng)絡(luò)資源中的內(nèi)容進(jìn)行輸出。通過應(yīng)用本發(fā)明,可以實(shí)現(xiàn)對(duì)不同的網(wǎng)絡(luò)內(nèi)容進(jìn)行提取、解析、并按照所定義的分類重新整合,從而進(jìn)行分類傳輸,便于其他系統(tǒng)對(duì)數(shù)據(jù)作進(jìn)一步的處理。
文檔編號(hào)H04L12/54GK101420356SQ20081009748
公開日2009年4月29日 申請日期2008年5月30日 優(yōu)先權(quán)日2008年5月30日
發(fā)明者劍 李, 潘智鵬, 紀(jì)向利, 騰 馬 申請人:北京天騰時(shí)空信息科技有限公司