專利名稱:一種網(wǎng)頁(yè)審計(jì)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)通信技術(shù),尤其涉及一種網(wǎng)頁(yè)審計(jì)的方法及裝置。
背景技術(shù):
在網(wǎng)絡(luò)技術(shù)普及的今天,企業(yè)員工通過(guò)企業(yè)網(wǎng)絡(luò)接入互聯(lián)網(wǎng)獲取各種資訊;然而 員工的上網(wǎng)行為可能引發(fā)各種安全隱患,比如說(shuō)訪問(wèn)了一些含有木馬的網(wǎng)站可能會(huì)引發(fā)機(jī) 密信息泄露等問(wèn)題。網(wǎng)頁(yè)瀏覽審計(jì)用于審計(jì)用戶所訪問(wèn)的網(wǎng)頁(yè),記錄用戶的上網(wǎng)行為。并對(duì) 用戶所訪問(wèn)的非法網(wǎng)站加已控制。網(wǎng)頁(yè)瀏覽審計(jì)中應(yīng)用了 gzip解壓縮算法(GNU' s Not Unix Zip,自由軟件壓縮算法),gzip算法是一種非常流行的壓縮算法,該算法已成為http 協(xié)議(超文本傳輸協(xié)議)中標(biāo)準(zhǔn)壓縮算法。現(xiàn)有的網(wǎng)頁(yè)瀏覽審計(jì)方案是報(bào)文經(jīng)過(guò)網(wǎng)絡(luò)設(shè)備的應(yīng)用識(shí)別引擎進(jìn)行深度檢測(cè),識(shí) 別出網(wǎng)頁(yè)瀏覽協(xié)議后進(jìn)入網(wǎng)頁(yè)瀏覽審計(jì)框架,通過(guò)分析報(bào)文提取出所訪問(wèn)網(wǎng)頁(yè)的HOST(主 機(jī))及URL,并分析網(wǎng)頁(yè)的URL過(guò)濾掉圖片、動(dòng)畫、flash、腳本等信息,并使用gzip解壓縮 算法或修改用戶訪問(wèn)網(wǎng)頁(yè)所請(qǐng)求的報(bào)文頭獲取網(wǎng)頁(yè)標(biāo)題。將獲取的HOST和URL組織成一 個(gè)完整的網(wǎng)址發(fā)送到設(shè)備上已便管理員查看。在獲取標(biāo)題時(shí)使用了兩種方法,gzip解壓縮 方法就是對(duì)每個(gè)會(huì)話上用戶訪問(wèn)的網(wǎng)頁(yè)內(nèi)容進(jìn)行g(shù)zip解壓縮,在解壓完后的內(nèi)容中查找 網(wǎng)頁(yè)標(biāo)題;修改用戶訪問(wèn)網(wǎng)頁(yè)請(qǐng)求報(bào)文頭意思就是當(dāng)用戶訪問(wèn)網(wǎng)頁(yè)時(shí)網(wǎng)頁(yè)瀏覽審計(jì)框架獲 取用戶訪問(wèn)網(wǎng)頁(yè)的請(qǐng)求頭,通過(guò)修改請(qǐng)求頭中的參數(shù),讓服務(wù)器采用明文方式傳輸網(wǎng)頁(yè)內(nèi) 容這樣設(shè)備就可以獲取到網(wǎng)頁(yè)標(biāo)題?,F(xiàn)有網(wǎng)頁(yè)瀏覽審計(jì)方案存在已下缺點(diǎn)(1)由于通過(guò)URL只過(guò)濾掉了圖片、動(dòng)畫、flash、腳本等信息。由于現(xiàn)在的網(wǎng)頁(yè)一 般都經(jīng)過(guò)切分處理,一個(gè)完整的網(wǎng)頁(yè)被切分完幾塊十幾塊。這樣每次訪問(wèn)一個(gè)網(wǎng)頁(yè)時(shí)就相 當(dāng)于訪問(wèn)了幾個(gè)網(wǎng)頁(yè),因此網(wǎng)頁(yè)瀏覽審計(jì)會(huì)出現(xiàn)大量無(wú)用的日志,日志誤報(bào)率高。(2)網(wǎng)頁(yè)瀏覽審計(jì)需要獲取用戶所訪問(wèn)網(wǎng)頁(yè)的標(biāo)題,現(xiàn)有的技術(shù)方案有如下兩種 一種是通過(guò)修改用戶請(qǐng)求的報(bào)文頭,由于這種方式使得網(wǎng)頁(yè)內(nèi)容在傳輸時(shí)沒(méi)有壓縮傳輸?shù)?信息量比使用壓縮時(shí)要大得多,因此這種方式會(huì)降低網(wǎng)絡(luò)速度。另一種是使用gzip解壓縮 算法。當(dāng)使用gzip解壓縮算法時(shí)每個(gè)會(huì)話大約需要占用100K內(nèi)存,當(dāng)設(shè)備存在大量會(huì)話 時(shí)就會(huì)占用大量?jī)?nèi)存從而導(dǎo)致設(shè)備內(nèi)存不足。由于設(shè)計(jì)上的局限性,當(dāng)前的網(wǎng)頁(yè)瀏覽審計(jì)日志誤報(bào)率高,存在大量會(huì)話時(shí)難以 使用gzip解壓縮方式獲取網(wǎng)頁(yè)標(biāo)題,嚴(yán)重影響了日志的準(zhǔn)確性及網(wǎng)絡(luò)設(shè)備的性能。
發(fā)明內(nèi)容
本發(fā)明提供一種網(wǎng)頁(yè)審計(jì)裝置,其應(yīng)用于網(wǎng)絡(luò)設(shè)備中,用于對(duì)用戶的上網(wǎng)行為進(jìn) 行審計(jì),包括URL提取單元、主次鏈接過(guò)濾單元以及解壓縮處理單元,其中,所述URL提取單元,用于從用戶的HTTP請(qǐng)求報(bào)文中提取用戶訪問(wèn)的URL,并將提取 到的URL提交給主次鏈接過(guò)濾單元;
所述主次鏈接過(guò)濾單元,用于根據(jù)預(yù)定規(guī)則從提交的URL中過(guò)濾出代表主要鏈接 的主要URL,并將所述主要URL提交解壓縮處理單元;所述解壓縮處理單元、用于對(duì)用戶訪問(wèn)所述主要URL的報(bào)文進(jìn)行解壓縮處理,并 從中獲得所述主要URL所指向的網(wǎng)頁(yè)的特征信息,然后將所述特征信息作為審計(jì)日志信息 保存起來(lái)。優(yōu)選地,其中所述網(wǎng)絡(luò)設(shè)備至少一個(gè)物理CPU,所述物理CPU被虛擬為多個(gè)虛擬 CPU,該裝置還包括內(nèi)存管理單元,用于以運(yùn)行解壓縮處理單元的虛擬CPU為單元進(jìn)行內(nèi) 存申請(qǐng)。優(yōu)選地,,還包括HTTP報(bào)文識(shí)別單元,用于根據(jù)HTTP請(qǐng)求報(bào)文的特征從用戶報(bào)文 中識(shí)別出HTTP請(qǐng)求報(bào)文,并將識(shí)別到的HTTP請(qǐng)求報(bào)文提交給URL提取單元。優(yōu)選地,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題。優(yōu)選地,所述預(yù)定規(guī)則包括判斷所述URL中是否攜帶有URL參數(shù),若未攜帶URL 參數(shù)則判定為代表主要鏈接的URL,若攜帶有URL參數(shù),則判定將該URL作為次要鏈接丟 棄;或者判斷HTTP請(qǐng)求頭中的“Content-Type”字段中的值是否為text/*類型,如果 是則判定為主要鏈接,如果不是則判定為次要鏈接。優(yōu)選地,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題,所述預(yù)定規(guī)則進(jìn)一步包括判斷代表主要 鏈接的主要URL所指向的網(wǎng)頁(yè)是否具有可以提取的標(biāo)題,如果沒(méi)有則放棄保存所述網(wǎng)頁(yè)標(biāo)題。本發(fā)明還提供一種網(wǎng)頁(yè)審計(jì)方法,其應(yīng)用于網(wǎng)絡(luò)設(shè)備中,用于對(duì)用戶的上網(wǎng)行為 進(jìn)行審計(jì),該方法包括步驟A、從用戶的HTTP請(qǐng)求報(bào)文中提取用戶訪問(wèn)的URL ;步驟B、根據(jù)預(yù)定規(guī)則從步驟A提取的URL中過(guò)濾出代表主要鏈接的主要URL ;步驟C、對(duì)用戶訪問(wèn)所述主要URL的報(bào)文進(jìn)行解壓縮處理,并從中獲得所述主要 URL所指向的網(wǎng)頁(yè)的特征信息,然后將所述特征信息作為審計(jì)日志信息保存起來(lái)。優(yōu)選地,其中所述網(wǎng)絡(luò)設(shè)備至少一個(gè)物理CPU,所述物理CPU被虛擬為多個(gè)虛擬 CPU,步驟C中解壓縮處理的內(nèi)存申請(qǐng)是以運(yùn)行解壓縮處理的虛擬CPU為單元進(jìn)行的。優(yōu)選地,還包括步驟A之前還包括步驟D,根據(jù)HTTP請(qǐng)求報(bào)文的特征從用戶報(bào)文 中識(shí)別出HTTP請(qǐng)求報(bào)文。優(yōu)選地,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題。優(yōu)選地,其特征在于,所述預(yù)定規(guī)則包括判斷所述URL中是否攜帶有URL參數(shù),若 未攜帶URL參數(shù)則判定為代表主要鏈接的URL,若攜帶有URI參數(shù),則判定將該URL作為次 要鏈接丟棄;或者判斷HTTP請(qǐng)求頭中的“Content-Type”字段中的值是否為text/*類型,如果 是則判定為主要鏈接,如果不是則判定為次要鏈接。優(yōu)選地,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題,所述預(yù)定規(guī)則進(jìn)一步包括判斷代表主要 鏈接的主要URL所指向的網(wǎng)頁(yè)是否具有可以提取的標(biāo)題,如果沒(méi)有則放棄保存所述網(wǎng)頁(yè)標(biāo)題。相較于現(xiàn)有技術(shù),本發(fā)明通過(guò)區(qū)分主次鏈接,大量減少了網(wǎng)絡(luò)設(shè)備的資源消耗,采用基于VCPU的內(nèi)存申請(qǐng)方式,更進(jìn)一步地減少了內(nèi)存資源的消耗。
圖1是網(wǎng)頁(yè)審計(jì)的基本網(wǎng)絡(luò)環(huán)境邏輯圖。圖2是本發(fā)明網(wǎng)頁(yè)審計(jì)裝置邏輯結(jié)構(gòu)圖。
圖3HTTP報(bào)文的基本格式示意圖。
具體實(shí)施例方式在典型的企業(yè)網(wǎng)環(huán)境中,用戶上網(wǎng)行為的審計(jì)通常由出口設(shè)備,即位于內(nèi)網(wǎng)和外 網(wǎng)之間的網(wǎng)絡(luò)設(shè)備完成,通常稱之為網(wǎng)關(guān)。企業(yè)網(wǎng)關(guān)除了要完成報(bào)文轉(zhuǎn)發(fā)這一基本功能之 外,通常承擔(dān)著很多應(yīng)用的執(zhí)行,比如NAT(網(wǎng)絡(luò)地址轉(zhuǎn)換)功能、安全處理、Qos (服務(wù)質(zhì) 量)功能、訪問(wèn)控制、上網(wǎng)行為審計(jì)等等。從設(shè)計(jì)上來(lái)說(shuō),既可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò) 插入業(yè)務(wù)板來(lái)支持各種應(yīng)用。對(duì)于復(fù)雜的應(yīng)用來(lái)說(shuō),后者是目前來(lái)說(shuō)更為常見的實(shí)現(xiàn)方式。請(qǐng)參考圖1,在企業(yè)網(wǎng)絡(luò)環(huán)境中,多個(gè)用戶200通過(guò)一個(gè)網(wǎng)絡(luò)設(shè)備100(比如說(shuō),企 業(yè)網(wǎng)關(guān))接入互聯(lián)網(wǎng),實(shí)現(xiàn)我們通俗意義所說(shuō)的用戶上網(wǎng),因此一般來(lái)說(shuō)用戶的所有訪問(wèn) 外網(wǎng)的報(bào)文都會(huì)經(jīng)過(guò)網(wǎng)關(guān),因此較佳的實(shí)施方式是在此對(duì)用于的上網(wǎng)行為進(jìn)行審計(jì)操作, 也可以把流量旁路到另一個(gè)網(wǎng)絡(luò)設(shè)備(比如服務(wù)器)上進(jìn)行審計(jì)操作。從整體上來(lái)看,本 發(fā)明的目標(biāo)是要通過(guò)HTTP報(bào)文中的URL判斷主要鏈接和次要鏈接,對(duì)用戶訪問(wèn)網(wǎng)頁(yè)的內(nèi)容 進(jìn)行主次區(qū)分,把審計(jì)的精力集中在訪問(wèn)主要鏈接的內(nèi)容上,從而大幅度減輕設(shè)備在網(wǎng)頁(yè) 審計(jì)業(yè)務(wù)上的資源消耗。請(qǐng)參考圖2所示的本發(fā)明網(wǎng)頁(yè)審計(jì)裝置10邏輯結(jié)構(gòu)圖,所述網(wǎng)頁(yè)審計(jì)裝置包括 HTTP報(bào)文識(shí)別單元20、URL提取單元30、主次鏈接過(guò)濾單元40、解壓縮處理單元50。所述 網(wǎng)頁(yè)審計(jì)裝置在運(yùn)行其對(duì)應(yīng)的執(zhí)行流程如下步驟101,根據(jù)HTTP請(qǐng)求報(bào)文的特征從用戶報(bào)文中識(shí)別出HTTP請(qǐng)求報(bào)文并提交 URL提取單元進(jìn)行處理,這個(gè)步驟由HTTP報(bào)文識(shí)別單元20執(zhí)行。具體來(lái)說(shuō),在步驟101中,用戶的業(yè)務(wù)報(bào)文的類型有很多,而代表用戶訪問(wèn)哪些網(wǎng) 站的報(bào)文則是用戶發(fā)起的HTTP請(qǐng)求,所以首先需要從用戶所有的報(bào)文中過(guò)濾出HTTP請(qǐng)求 報(bào)文,而過(guò)濾的依據(jù)則是HTTP請(qǐng)求報(bào)文的特征,而HTTP請(qǐng)求報(bào)文的特征具體可以參考HTTP 協(xié)議的定義,比如說(shuō)比較常用方法有利用HTTP知名端口 80這一特征進(jìn)行報(bào)文識(shí)別,或者使 用HTTP報(bào)文類型進(jìn)行識(shí)別。對(duì)于HTTP應(yīng)答報(bào)文的識(shí)別是同樣的道理。由于現(xiàn)有技術(shù)已經(jīng) 在這方面給出了充分的教導(dǎo),并且已經(jīng)有相關(guān)實(shí)現(xiàn),本發(fā)明不再進(jìn)行詳細(xì)說(shuō)明。步驟102,從用戶的HTTP請(qǐng)求報(bào)文中提取用戶訪問(wèn)的URL,并將提取到的URL提交 給主次鏈接過(guò)濾單元;這一步驟由URL提取單元執(zhí)行。請(qǐng)參考圖3,根據(jù)HTTP協(xié)議的規(guī)定, HTTP請(qǐng)求報(bào)文中有特定的URL字段。URL提取單元根據(jù)報(bào)文承載ULR的字段從HTTP報(bào)文 中將URL提取出來(lái)。步驟103,根據(jù)預(yù)定規(guī)則從提交的URL中過(guò)濾出代表主要鏈接的主要URL,并將所 述主要URL提交解壓縮處理單元。一般來(lái)說(shuō),步驟102會(huì)提取到大量的URL,這些URL代表多個(gè)鏈接。但是事實(shí)上對(duì) 于每個(gè)URL進(jìn)行深度的審計(jì)是沒(méi)有必要的。對(duì)于用戶訪問(wèn)的主要鏈接比如說(shuō)http //www.tianya. cn/bbs/index. shtml,有必要進(jìn)行深度審計(jì)處理,因?yàn)檫@樣的鏈接一般情況下可以 作為用戶行為的典型代表,而那些攜帶有URL參數(shù)的鏈接對(duì)于審計(jì)用戶的行為來(lái)說(shuō)通常是 缺乏參考意義,比如說(shuō):http://www. tianya. cn/new/publicforum/articleslist. asp ? stritem = develop&strsubitcm =經(jīng)濟(jì)雜談&part = 0,則難以作為用戶行為的典型代表。 本發(fā)明優(yōu)選的方式用是否攜帶有URL參數(shù)來(lái)區(qū)分主要鏈接和次要鏈接,即在提取的的URL 中進(jìn)行查找,對(duì)于攜帶URL參數(shù)(如鏈接中“ ?”)的URL判定為次要鏈接,沒(méi)有攜帶的則 判定為主要鏈接。對(duì)于主要鏈接則提交解壓縮處理單元,對(duì)于次要鏈接優(yōu)選的方式直接放 棄審計(jì)。除了上述方式以外,還可以通過(guò)HTTP請(qǐng)求頭中的“Content-Type”來(lái)判斷,如果 “Content-Type”字段中的值不是text/*類型的話則判定為次要鏈接,如果是則判定為主 要鏈接。以上兩種方式僅僅是兩種較佳的實(shí)現(xiàn),本領(lǐng)域普通技術(shù)人員可以依據(jù)本發(fā)明的構(gòu) 思設(shè)計(jì)其他具有實(shí)用價(jià)值的實(shí)現(xiàn)方式。步驟104,對(duì)與所述主要URL相應(yīng)的HTTP應(yīng)答報(bào)文進(jìn)行解壓縮處理,并從中獲得所 述主要URL所指向的網(wǎng)頁(yè)的特征信息,然后將所述特征信息作為審計(jì)日志信息保存起來(lái)。步驟104由解壓縮處理單元執(zhí)行。對(duì)于用戶訪問(wèn)的主要URL,服務(wù)端會(huì)返回相應(yīng) 的HTTP應(yīng)答報(bào)文。而通常情況下,為了節(jié)約網(wǎng)絡(luò)的帶寬資源,這些HTTP應(yīng)答報(bào)文的內(nèi)容通 常是經(jīng)過(guò)壓縮的,比如最典型的gzip壓縮算法。因此需要對(duì)應(yīng)答報(bào)文進(jìn)行解壓縮,然后從 中獲得URL指向的網(wǎng)頁(yè)的特征信息。通常情況下,可以用網(wǎng)頁(yè)的標(biāo)題作為網(wǎng)頁(yè)的特征信息。 當(dāng)然也可以用出現(xiàn)頻率最高的詞句作為特征信息。對(duì)于無(wú)法提取到特征信息的情況,則放 棄對(duì)特征信息的保存;因?yàn)檫@樣的網(wǎng)頁(yè)難以作為用戶行為的典型代表,對(duì)于審計(jì)業(yè)務(wù)來(lái)說(shuō) 意義較低。對(duì)以上步驟的實(shí)施可以通過(guò)計(jì)算機(jī)軟件實(shí)現(xiàn),在軟件實(shí)現(xiàn)的方式中,為了進(jìn)一步 節(jié)約對(duì)系統(tǒng)資源的消耗,可以引入基于CPU的內(nèi)存申請(qǐng)機(jī)制,請(qǐng)參考圖2所示。解壓縮處理 單元通常運(yùn)行于CPU上,對(duì)于一個(gè)物理CPU可以進(jìn)行虛擬化處理,形成多個(gè)虛擬CPU,而多 個(gè)CPU可以分別運(yùn)行解壓縮處理。在傳統(tǒng)技術(shù)中,解壓縮處理是以會(huì)話為單位進(jìn)行內(nèi)存申 請(qǐng)的,假如一個(gè)會(huì)話申請(qǐng)100K內(nèi)存,當(dāng)系統(tǒng)內(nèi)在大量會(huì)話時(shí),內(nèi)存的消耗很嚴(yán)重,影響設(shè)備 的正常業(yè)務(wù)的運(yùn)作。而本發(fā)明為解壓縮處理單元引入相應(yīng)的內(nèi)存管理單元,以運(yùn)行解壓縮 處理步驟的虛擬CPU為單位進(jìn)行內(nèi)存申請(qǐng),這樣可以避免系統(tǒng)的內(nèi)存資源的大量損耗。以上所描述的僅僅是本發(fā)明較佳的實(shí)現(xiàn)方式,并不用以限定本發(fā)明的保護(hù)范圍, 任何等同的變化和修改皆應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種網(wǎng)頁(yè)審計(jì)裝置,其應(yīng)用于網(wǎng)絡(luò)設(shè)備中,用于對(duì)用戶的上網(wǎng)行為進(jìn)行審計(jì),包括 URL提取單元、主次鏈接過(guò)濾單元以及解壓縮處理單元,其特征在于所述URL提取單元,用于從用戶的HTTP請(qǐng)求報(bào)文中提取用戶訪問(wèn)的URL,并將提取到的 URL提交給主次鏈接過(guò)濾單元;所述主次鏈接過(guò)濾單元,用于根據(jù)預(yù)定規(guī)則從提交的URL中過(guò)濾出代表主要鏈接的主 要URL,并將所述主要URL提交解壓縮處理單元;所述解壓縮處理單元、用于對(duì)用戶訪問(wèn)所述主要URL的報(bào)文進(jìn)行解壓縮處理,并從中 獲得所述主要URL所指向的網(wǎng)頁(yè)的特征信息,然后將所述特征信息作為審計(jì)日志信息保存 起來(lái)。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,其中所述網(wǎng)絡(luò)設(shè)備至少一個(gè)物理CPU,所 述物理CPU被虛擬為多個(gè)虛擬CPU,該裝置還包括內(nèi)存管理單元,用于以運(yùn)行解壓縮處理 單元的虛擬CPU為單元進(jìn)行內(nèi)存申請(qǐng)。
3.根據(jù)權(quán)利要求1所述的裝置,其特征在于,還包括HTTP報(bào)文識(shí)別單元,用于根據(jù) HTTP請(qǐng)求報(bào)文的特征從用戶報(bào)文中識(shí)別出HTTP請(qǐng)求報(bào)文,并將識(shí)別到的HTTP請(qǐng)求報(bào)文提 交給URL提取單元。
4.根據(jù)權(quán)利要求1所述的裝置,其特征在于,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題。
5.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述預(yù)定規(guī)則包括判斷所述URL中是否 攜帶有URL參數(shù),若未攜帶URL參數(shù)則判定為代表主要鏈接的URL,若攜帶有URL參數(shù),則判 定將該URL作為次要鏈接丟棄;或者判斷HTTP請(qǐng)求頭中的“Content-Type”字段中的值是否為text/*類型,如果是則 判定為主要鏈接,如果不是則判定為次要鏈接。
6.根據(jù)要求5所述的裝置,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題,所述預(yù)定規(guī)則進(jìn)一步包括 判斷代表主要鏈接的主要URL所指向的網(wǎng)頁(yè)是否具有可以提取的標(biāo)題,如果沒(méi)有則放棄保 存所述網(wǎng)頁(yè)標(biāo)題。
7.—種網(wǎng)頁(yè)審計(jì)方法,其應(yīng)用于網(wǎng)絡(luò)設(shè)備中,用于對(duì)用戶的上網(wǎng)行為進(jìn)行審計(jì),其特征 在于,該方法包括步驟A、從用戶的HTTP請(qǐng)求報(bào)文中提取用戶訪問(wèn)的URL ;步驟B、根據(jù)預(yù)定規(guī)則從步驟A提取的URL中過(guò)濾出代表主要鏈接的主要URL ;步驟C、對(duì)用戶訪問(wèn)所述主要URL的報(bào)文進(jìn)行解壓縮處理,并從中獲得所述主要URL所 指向的網(wǎng)頁(yè)的特征信息,然后將所述特征信息作為審計(jì)日志信息保存起來(lái)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,其中所述網(wǎng)絡(luò)設(shè)備至少一個(gè)物理CPU,所 述物理CPU被虛擬為多個(gè)虛擬CPU,步驟C中解壓縮處理的內(nèi)存申請(qǐng)是以運(yùn)行解壓縮處理的 虛擬CPU為單元進(jìn)行的。
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括步驟A之前還包括步驟D,根據(jù) HTTP請(qǐng)求報(bào)文的特征從用戶報(bào)文中識(shí)別出HTTP請(qǐng)求報(bào)文。
10.根據(jù)權(quán)利要求7所述的方法,其特征在于,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題。
11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述預(yù)定規(guī)則包括判斷所述URL中是 否攜帶有URL參數(shù),若未攜帶URL參數(shù)則判定為代表主要鏈接的URL,若攜帶有URL參數(shù),則 判定將該URL作為次要鏈接丟棄;或者判斷HTTP請(qǐng)求頭中的“Content-Type”字段中的值是否為text/*類型,如果是則 判定為主要鏈接,如果不是則判定為次要鏈接。
12.根據(jù)要求11所述的方法,其中所述特征信息為網(wǎng)頁(yè)標(biāo)題,所述預(yù)定規(guī)則進(jìn)一步包 括判斷代表主要鏈接的主要URL所指向的網(wǎng)頁(yè)是否具有可以提取的標(biāo)題,如果沒(méi)有則放 棄保存所述網(wǎng)頁(yè)標(biāo)題。
全文摘要
本發(fā)明提供一種網(wǎng)頁(yè)審計(jì)方法及裝置,其應(yīng)用于網(wǎng)絡(luò)設(shè)備中,用于對(duì)用戶的上網(wǎng)行為進(jìn)行審計(jì),該方法包括從用戶的HTTP請(qǐng)求報(bào)文中提取用戶訪問(wèn)的URL;根據(jù)預(yù)定規(guī)則從步驟A提取的URL中過(guò)濾出代表主要鏈接的主要URL;對(duì)用戶訪問(wèn)所述主要URL的報(bào)文進(jìn)行解壓縮處理,并從中獲得所述主要URL所指向的網(wǎng)頁(yè)的特征信息,然后將所述特征信息作為審計(jì)日志信息保存起來(lái)。本發(fā)明通過(guò)區(qū)分主次鏈接,大量減少了網(wǎng)絡(luò)設(shè)備的資源消耗,采用基于VCPU的內(nèi)存申請(qǐng)方式,更進(jìn)一步地減少了內(nèi)存資源的消耗。
文檔編號(hào)G06F17/30GK102004770SQ20101054507
公開日2011年4月6日 申請(qǐng)日期2010年11月16日 優(yōu)先權(quán)日2010年11月16日
發(fā)明者張曉東, 李晶楠, 田濤, 許志宏 申請(qǐng)人:杭州迪普科技有限公司