專利名稱:富文本內(nèi)容的處理方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,具體涉及ー種富文本內(nèi)容的處理方法及系統(tǒng)。
背景技術(shù):
在WEB2. 0時代,網(wǎng)絡(luò)產(chǎn)品提供文本發(fā)布入口讓用戶來產(chǎn)生內(nèi)容。為了滿足用戶創(chuàng)造內(nèi)容更加豐富化的需求,文本發(fā)布入口通常支持富文本格式的內(nèi)容,即包含HTML標(biāo)簽的內(nèi)容。用戶通過文本發(fā)布入口將富文本內(nèi)容發(fā)布到服務(wù)端,服務(wù)端需要對富文本內(nèi)容進(jìn)行安全檢查和過濾,然后進(jìn)行存儲和展現(xiàn)。現(xiàn)有的富文本的傳輸與過濾方法具體為用戶在瀏覽器端創(chuàng)造富文本,然后瀏覽器直接將富文本發(fā)送到服務(wù)端;服務(wù)端對富文本進(jìn)行詞法分析和語法分析,對可能產(chǎn)生安全問題的內(nèi)容進(jìn)行過濾,最終得到相對安全的內(nèi)容。但是,由于富文本的內(nèi)容非常復(fù)雜,而且各個瀏覽器對富文本支持的一些語法上有差異,導(dǎo)致服務(wù)端過濾的時候需要知道所有瀏覽器一些細(xì)微的特性,工作量非常巨大。并且有些特征是由于瀏覽器的BUG導(dǎo)致的。這種情況下,雖然服務(wù)端做了大量的安全過濾エ作,但往往還是會出現(xiàn)安全漏洞,危及產(chǎn)品安全??偠灾?,服務(wù)端對富文本的過濾邏輯非常復(fù)雜,而且也不能保證100%安全;服務(wù)端的過濾十分耗時,會對性能產(chǎn)生一定影響,從而影響用戶的發(fā)布效率。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供ー種克服上述問題或者至少部分地解決上述問題的富文本內(nèi)容的處理方法和相應(yīng)的富文本內(nèi)容的處理系統(tǒng)。根據(jù)本發(fā)明的ー個方面,提供了ー種富文本內(nèi)容的處理方法,所述處理方法適于在包括服務(wù)器和一個或者多個客戶端的處理系統(tǒng)中執(zhí)行,所述富文本內(nèi)容包括一個或者多個標(biāo)簽,所述ー個或者多個標(biāo)簽嵌套,并且每個標(biāo)簽具有相關(guān)聯(lián)的ー個或者多個屬性,該方法包括在客戶端處對富文本內(nèi)容進(jìn)行轉(zhuǎn)化,而獲取結(jié)構(gòu)化數(shù)據(jù),所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;以及在所述服務(wù)器處接收在客戶端處轉(zhuǎn)化的結(jié)構(gòu)化數(shù)據(jù),井根據(jù)下列各步驟對所述結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,以獲得經(jīng)處理的富文本內(nèi)容獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;將所述結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù),所述對象化數(shù)據(jù)包括與各個標(biāo)簽和屬性相對應(yīng)的一個或者多個數(shù)據(jù)對象;使用預(yù)先配置的規(guī)則對所述對象化數(shù)據(jù)進(jìn)行處理,以便刪除與所述預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對應(yīng)的數(shù)據(jù)對象之外的數(shù)據(jù)對象;
將處理后的數(shù)據(jù)對象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。根據(jù)本發(fā)明的另一方面,提供了一種富文本內(nèi)容的處理系統(tǒng),包括服務(wù)器和客戶端;客戶端適于對富文本內(nèi)容進(jìn)行轉(zhuǎn)化,而獲取結(jié)構(gòu)化數(shù)據(jù),將結(jié)構(gòu)化數(shù)據(jù)發(fā)送給服務(wù)器,結(jié)構(gòu)化數(shù)據(jù)對富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;所述服務(wù)器包括網(wǎng)絡(luò)接ロ,適于獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),富文本內(nèi)容包括一個或者多個標(biāo)簽,一個或者多個標(biāo)簽嵌套,并且每個標(biāo)簽具有相關(guān)聯(lián)的ー個或者多個屬性,而結(jié)構(gòu)化數(shù)據(jù)對富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;數(shù)據(jù)轉(zhuǎn)換器,適于將網(wǎng)絡(luò)接ロ獲得的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù),對象化數(shù)據(jù)包括與各個標(biāo)簽和屬性相對應(yīng)的ー個或者多個數(shù)據(jù)對象;過濾器,適于使用預(yù)先配置的規(guī)則對由數(shù)據(jù)轉(zhuǎn)換器轉(zhuǎn)換得到的對象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對應(yīng)的數(shù)據(jù)對象之外的數(shù)據(jù)對象;轉(zhuǎn)義器,適于將過濾器處理后的數(shù)據(jù)對象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。根據(jù)本發(fā)明提供的方案,通過獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù),使用預(yù)先配置的規(guī)則對對象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對應(yīng)的數(shù)據(jù)對象之外的數(shù)據(jù)對象,也即過濾掉預(yù)先配置的規(guī)則定義的要保留的信息以外的信息,再進(jìn)行轉(zhuǎn)義處理以獲得經(jīng)處理的富文本內(nèi)容。本發(fā)明將富文本內(nèi)容通過兩步轉(zhuǎn)換成為數(shù)據(jù)對象再進(jìn)行過濾處理,與現(xiàn)有技術(shù)直接對富文本內(nèi)容本身進(jìn)行過濾相比,大大簡化了對富文本內(nèi)容過濾的處理邏輯,使得處理性能大大提高。另外,這樣轉(zhuǎn)化后的富文本內(nèi)容即保留了原富文本內(nèi)容的絕大部分格式,又更加規(guī)范,從而減少了由于富文本內(nèi)容而導(dǎo)致頁面呈現(xiàn)出現(xiàn)問題的缺陷。另外,根據(jù)本發(fā)明提供的方案,通過將對富文本內(nèi)容的處理過程分解為在客戶端上進(jìn)行的一部分處理和在服務(wù)器上進(jìn)行的另一部分處理。在客戶端上首先把富文本內(nèi)容轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),然后在服務(wù)器上對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行再次處理并轉(zhuǎn)化為富文本內(nèi)容,由于結(jié)構(gòu)化數(shù)據(jù)更容易處理,所以這種方案,可以把有可能由于客戶端差異而導(dǎo)致的富文本內(nèi)容的格式缺陷留在客戶端處來進(jìn)行處理,而服務(wù)器僅僅處理基本沒有格式缺陷的數(shù)據(jù),從而可以大大簡化服務(wù)器處的處理過程。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式
。
通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中圖1示出了一段文本的示意圖;圖2示出了根據(jù)本發(fā)明一個實施例的富文本內(nèi)容的處理方法的流程圖;圖3示出了根據(jù)本發(fā)明一個實施例的富文本內(nèi)容的處理系統(tǒng)的結(jié)構(gòu)框圖。
具體實施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。本文中所提到的富文本內(nèi)容是ー種包含標(biāo)簽(如HTML標(biāo)簽)的文本內(nèi)容。更為具體地說,富文本內(nèi)容包括一個或者多個標(biāo)簽,其中一個或者多個標(biāo)簽可以嵌套,即ー個標(biāo)簽中可以包含一個或多個其它的標(biāo)簽。每個標(biāo)簽可以具有相關(guān)聯(lián)的ー個或者多個屬性。圖1示出了一段文本的示意圖,這段文本對應(yīng)的富文本內(nèi)容如下
<hl>—種富文本傳輸與過濾裝置</hl>
くp>
<imii src=,'http://ww2.sinaimLr.cn/bmiddle/6^3615()zsiwIdy.4vavca80j.jpg" width="440" height=^ 15" />〈span style=〃color:#548dd4; 〃>兩個男孩同時喜歡上了一個女孩,吸引住男孩的究竟是女孩身上的什么特質(zhì)呢?想清楚了這個問題的男孩成了哲學(xué)家,沒想清楚這個問題的成了這個女人的丈夫?!?span〉
</p>
<strong>bv we I eren</ stron n> (<a hreT="http://www. vveleTen.com" target=,,_self'>htip://www weiefen com</a>)
P>在上述富文本內(nèi)容中,“<hl> —種富文本傳輸與過濾裝置</hl>”為ー個HTML標(biāo)簽?!?br>
<img src=//http : //ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80 j.jpg//width=//440//height=//315///></p>”為ー個HTML標(biāo)簽,這個HTML標(biāo)簽中還嵌套了另ー個HTML標(biāo)簽“〈img src = //http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j.jpg " width="440"height="315"/>”。另夕卜,在 HTML 標(biāo)簽“〈img src=//http://ww2.sinaimg.cn/bmiddle/68361562gwldy4vayca80j. jpg"width="440"height="315"/>,,中,“src=〃http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j.jpg" Width=〃440〃height=〃315〃”為該HTML標(biāo)簽的3個屬性,分別表示圖片的url,寬度和高度。本發(fā)明以圖1所示的文本對應(yīng)的富文本內(nèi)容作為例子,進(jìn)ー步介紹本發(fā)明的技術(shù)方案。圖2示出了根據(jù)本發(fā)明一個實施例的富文本內(nèi)容的處理方法200的流程圖。如圖2所示,方法200始于步驟S201,其中服務(wù)器獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù)。也就是說,在服務(wù)器對富文本內(nèi)容進(jìn)行處理之前,需要首先將富文本內(nèi)容轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)??蛇x擇地,可以事先在客戶端處進(jìn)行該轉(zhuǎn)化。因此,在本方法中,在客戶端獲取到用戶在客戶端創(chuàng)造的富文本內(nèi)容之后,客戶端對富文本內(nèi)容進(jìn)行轉(zhuǎn)化得到結(jié)構(gòu)化數(shù)據(jù),該結(jié)構(gòu)化數(shù)據(jù)是對富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行的結(jié)構(gòu)化描述??蛇x地,結(jié)構(gòu)化數(shù)據(jù)包括各個標(biāo)簽的標(biāo)簽名、標(biāo)簽內(nèi)容和與該標(biāo)簽相關(guān)聯(lián)的ー個或者多個屬性,以及各個標(biāo)簽之間的嵌套關(guān)系。具體地,根據(jù)本發(fā)明的一個實施例,駐留在客戶端的javascript代碼將富文本內(nèi)容轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。舉例而言,對上述富文本內(nèi)容進(jìn)行轉(zhuǎn)化得到的結(jié)構(gòu)化數(shù)據(jù)為[ {〃tag〃 〃hl〃,〃child〃 [ {〃text〃 〃\n — 種富文本傳輸與過濾裝置 \n"}]},{ " text":"\n"},{ " ta·g":"p","child": [ {"text":"\n〃},{ " tag〃〃img〃,〃attr〃{ " src〃"http://ww2.sinaimg.cn/bmiddle/68361562gwldy4vayca80j. jpg","width":"440","height":"315"}}, { " text":'W} ]},{ " text":'W},{ " tag": V,"chiIcT: [ {"text":'W},{ " tag^: ^span",attr":{ " style":"color:#548dd4;"},"child":[{"text":〃兩個男孩同時喜歡上了一個女孩,吸引住男孩的究竟是女孩身上的什么特質(zhì)呢?想清楚了這個問題的男孩成了哲學(xué)家,沒想清楚這個問題的成了這個女人的丈夫?!▆]},{〃teXt〃:〃\n"}]},{"text":'W},{ " tag": V,"chi IcT: [ {"text":'W},{ " tag": "strong", "chilcT:[{"text":"by weiefen"}]},{ " text":"(つ,{"tag":"a", "attr":{ " href:"http://www.weiefen. com〃,〃target〃:〃_self〃}, 〃child〃:[{〃text〃:〃http://www. weiefen.這是ー種JSON格式的結(jié)構(gòu)化數(shù)據(jù),本發(fā)明并不受限于此,并且所有可以對數(shù)據(jù)進(jìn)行結(jié)構(gòu)化描述的格式都在本發(fā)明的保護(hù)范圍之內(nèi)。如上所述,結(jié)構(gòu)化數(shù)據(jù){" tag〃:〃hr,〃Child〃[{〃teXt〃:〃\n —種富文本傳輸與過濾裝置\n"}]}是由標(biāo)簽“<hl> —種富文本傳輸與過濾裝置</hl>”轉(zhuǎn)化得到的,該結(jié)構(gòu)化數(shù)據(jù)包括標(biāo)簽的標(biāo)簽名“hl”,標(biāo)簽內(nèi)容“一種富文本傳輸與過濾裝置”。其中,結(jié)構(gòu)化數(shù)據(jù){" tag":"p","child":
n},{ " tag〃〃img〃,〃attr " :{ " src〃"http://ww2.sinaimg.cn/bmiddle/68361562gwldy4vayca80j. jpg", "width":"440","height":"315"}},{" text":"\n〃}]}是由標(biāo)簽“〈img src=//http : //ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80 j.jpg//width=//440//height=//315///></p>”轉(zhuǎn)化得到的,該結(jié)構(gòu)化數(shù)據(jù)包括標(biāo)簽的標(biāo)簽名“p”和“img”和對應(yīng)的標(biāo)簽內(nèi)容,以及與標(biāo)簽相關(guān)聯(lián)的屬性“〃 attr〃 { " src〃 〃http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j. jpg", "width":"440","height":"315"}”,其中“ text〃:〃\n} ”表示標(biāo)簽內(nèi)容中的換行。另外,標(biāo)簽名為“p”的標(biāo)簽與標(biāo)簽名為“img”的標(biāo)簽的嵌套關(guān)系也體現(xiàn)在結(jié)構(gòu)化數(shù)據(jù)中,具體為標(biāo)簽名為“img”的標(biāo)簽是標(biāo)簽名為“p”的標(biāo)簽的標(biāo)簽內(nèi)容。在客戶端得到上述結(jié)構(gòu)化數(shù)據(jù)之后,將其傳遞給服務(wù)器,服務(wù)器由此獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù)。隨后,方法200進(jìn)入步驟S202,其中服務(wù)器將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù)。具體地,服務(wù)器可以利用各種編程語言原生提供的功能將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù)。轉(zhuǎn)換得到的對象化數(shù)據(jù)包括與各個標(biāo)簽和屬性相對應(yīng)的ー個或者多個數(shù)據(jù)對象??蛇x地,步驟S202將字符串形式的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為具有相互關(guān)聯(lián)關(guān)系的ー個或者多個數(shù)據(jù)對象。以結(jié)構(gòu)化數(shù)據(jù)具有JSON格式為例,JSON格式是指將javascript對象中的一組數(shù)據(jù)轉(zhuǎn)換得到的字符串格式,對于這種格式的結(jié)構(gòu)化數(shù)據(jù),可以使用PHP語言中的json_decode方法實現(xiàn)對結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換。json_deCode方法是將JSON格式的字符串進(jìn)行解碼,從而轉(zhuǎn)換為PHP的關(guān)聯(lián)數(shù)組,即具有相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)對象。應(yīng)當(dāng)注意的是,本發(fā)明不受限于具體編程語言,所以可以把JSON格式的字符串轉(zhuǎn)換為具有相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)對象都在本發(fā)明的保護(hù)范圍之內(nèi)。隨后,方法200進(jìn)入步驟S203,其中服務(wù)器使用預(yù)先配置的規(guī)則對對象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對應(yīng)的數(shù)據(jù)對象之外的數(shù)據(jù)對象。預(yù)先配置的規(guī)則可以為白名單規(guī)則,該白名單規(guī)則定義了允許保留的標(biāo)簽和屬性。例如,下文中示出了一個與白名單規(guī)則相對應(yīng)的配置文件
權(quán)利要求
1.一種富文本內(nèi)容的處理方法,所述處理方法適于在包括服務(wù)器和一個或者多個客戶端的處理系統(tǒng)中執(zhí)行,所述富文本內(nèi)容包括一個或者多個標(biāo)簽,所述一個或者多個標(biāo)簽嵌套,并且每個標(biāo)簽具有相關(guān)聯(lián)的一個或者多個屬性,該方法包括 在客戶端處對富文本內(nèi)容進(jìn)行轉(zhuǎn)化,而獲取結(jié)構(gòu)化數(shù)據(jù),所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;以及 在所述服務(wù)器處接收在客戶端處轉(zhuǎn)化的結(jié)構(gòu)化數(shù)據(jù),并根據(jù)下列各步驟對所述結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,以獲得經(jīng)處理的富文本內(nèi)容 獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述; 將所述結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù),所述對象化數(shù)據(jù)包括與各個標(biāo)簽和屬性相對應(yīng)的一個或者多個數(shù)據(jù)對象; 使用預(yù)先配置的規(guī)則對所述對象化數(shù)據(jù)進(jìn)行處理,以便刪除與所述預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對應(yīng)的數(shù)據(jù)對象之外的數(shù)據(jù)對象; 將處理后的數(shù)據(jù)對象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,所述結(jié)構(gòu)化數(shù)據(jù)包括各個標(biāo)簽的標(biāo)簽名、標(biāo)簽內(nèi)容和與該標(biāo)簽相關(guān)聯(lián)的一個或者多個屬性,以及各個標(biāo)簽之間的嵌套關(guān)系。
3.根據(jù)權(quán)利要求1或2所述的方法,所述將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為對象化數(shù)據(jù)對象包括將字符串形式的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為具有相互關(guān)聯(lián)關(guān)系的一個或者多個數(shù)據(jù)對象。
4.根據(jù)權(quán)利要求3所述的方法,所述結(jié)構(gòu)化數(shù)據(jù)具有JSON格式。
5.一種富文本內(nèi)容的處理系統(tǒng),包括服務(wù)器和客戶端;其中, 所述客戶端適于對富文本內(nèi)容進(jìn)行轉(zhuǎn)化,而獲取結(jié)構(gòu)化數(shù)據(jù),將所述結(jié)構(gòu)化數(shù)據(jù)發(fā)送給所述服務(wù)器,所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;所述服務(wù)器,包括 網(wǎng)絡(luò)接口,適于獲取對富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),所述富文本內(nèi)容包括一個或者多個標(biāo)簽,所述一個或者多個標(biāo)簽嵌套,并且每個標(biāo)簽具有相關(guān)聯(lián)的一個或者多個屬性,所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述; 數(shù)據(jù)轉(zhuǎn)換器,適于將所述網(wǎng)絡(luò)接口獲得的所述結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對象化數(shù)據(jù),所述對象化數(shù)據(jù)包括與各個標(biāo)簽和屬性相對應(yīng)的一個或者多個數(shù)據(jù)對象; 過濾器,適于使用預(yù)先配置的規(guī)則對由所述數(shù)據(jù)轉(zhuǎn)換器轉(zhuǎn)換得到的所述對象化數(shù)據(jù)進(jìn)行處理,以便刪除與所述預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對應(yīng)的數(shù)據(jù)對象之外的數(shù)據(jù)對象; 轉(zhuǎn)義器,適于將所述過濾器處理后的數(shù)據(jù)對象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。
6.根據(jù)權(quán)利要求5所述的處理系統(tǒng),所述網(wǎng)絡(luò)接口得到的結(jié)構(gòu)化數(shù)據(jù)包括各個標(biāo)簽的標(biāo)簽名、標(biāo)簽內(nèi)容和與該標(biāo)簽相關(guān)聯(lián)的一個或者多個屬性,以及各個標(biāo)簽之間的嵌套關(guān)系O
7.根據(jù)權(quán)利要求5或6所述的處理系統(tǒng),所述數(shù)據(jù)轉(zhuǎn)換器進(jìn)一步適于將所述網(wǎng)絡(luò)接口獲得的字符串形式的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為具有相互關(guān)聯(lián)關(guān)系的一個或者多個數(shù)據(jù)對象。
8.根據(jù)權(quán)利要求7所述的處理系統(tǒng),所述結(jié)構(gòu)化數(shù)據(jù)具有JSON格式。
全文摘要
本發(fā)明公開了一種富文本內(nèi)容的處理方法及系統(tǒng)。其中系統(tǒng)包括服務(wù)器和客戶端;其中,所述客戶端適于對富文本內(nèi)容進(jìn)行轉(zhuǎn)化,而獲取結(jié)構(gòu)化數(shù)據(jù),將所述結(jié)構(gòu)化數(shù)據(jù)發(fā)送給所述服務(wù)器,所述結(jié)構(gòu)化數(shù)據(jù)對所述富文本內(nèi)容中的各個標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;所述服務(wù)器包括網(wǎng)絡(luò)接口;數(shù)據(jù)轉(zhuǎn)換器;過濾器;轉(zhuǎn)義器。本發(fā)明將富文本內(nèi)容通過兩步轉(zhuǎn)換成為數(shù)據(jù)對象再進(jìn)行過濾處理,與現(xiàn)有技術(shù)直接對富文本內(nèi)容本身進(jìn)行過濾相比,大大簡化了對富文本內(nèi)容過濾的處理邏輯,使得處理性能大大提高。
文檔編號G06F17/30GK103034700SQ20121051860
公開日2013年4月10日 申請日期2012年12月5日 優(yōu)先權(quán)日2012年12月5日
發(fā)明者李成銀 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司