欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網絡檢測系統的制作方法

文檔序號:7863193閱讀:200來源:國知局
專利名稱:網絡檢測系統的制作方法
技術領域
本發(fā)明涉及計算機安全,尤其涉及一種網絡檢測系統。
背景技術
隨著互聯網技術的快速發(fā)展,提供各種網絡服務的網站大量出現,這些網站可能因為諸如操作系統漏洞、應用程序漏洞、權限配置之類的問題,而存在各種安全隱患。因此,需要對這些網站進行安全檢測。一種網站安全檢測的方式是從網站外部去抓取網站的所有網頁,分析這些網頁的內容是否存在安全隱患。在網站的安全檢測過程中,需要判斷所抓取的頁面是真實的頁面、還是網址重寫的頁面。網址重寫是指在網絡服務器上,為了讓網站更容易被訪問并且更容易被搜索引擎收錄,將網址重寫成網站可以處理的另一個網址的過程。例如,如果原先網址是“WWW.a. com/UserProf ile. aspx ID=l”,則可以將其重寫為“www. a. com/UserProf ile/1. aspx”這樣的網址。如何準確判斷頁面是否是網址重寫頁面是一大技術難點,現有的網站安全檢測方·法不能判斷出頁面是否為網址重寫頁面。而且,網址重寫的方法隨著網站數量的增加,也在急劇增加,每個不同的網站都有可能使用不同的網址重寫規(guī)則,也就增加了判斷網址重寫頁面的規(guī)則的數量。因此,如何準確識別頁面是正常頁面還是網址重寫頁面存在很大的難度。

發(fā)明內容
鑒于上述問題,提出了本發(fā)明,以便提供一種克服上述問題或者至少部分地解決上述問題的網絡檢測系統。依據本發(fā)明,提供了一種網絡檢測系統,其用于判斷網頁網址重寫,該網絡檢測系統包括網絡檢測設備,適用獲取目標網頁的內容及對應的狀態(tài)代碼和與所述目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容及對應的狀態(tài)代碼,并且據此判斷所述目標網頁是否為網址重寫網頁;以及一個或者多個目標服務器,適于響應于所述網絡檢測設備提供的所述目標網頁的網址和所述錯誤網址,向所述網絡檢測設備提供所述目標網頁的內容以及對應的狀態(tài)代碼、以及所述錯誤網頁的內容以及對應的狀態(tài)代碼??蛇x地,所述網絡檢測設備還包括網絡接口,適于獲取目標網頁的內容以及對應的狀態(tài)代碼、以及與所述目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容以及對應的狀態(tài)代碼。所述網絡檢測設備還包括網址重寫判斷器,適于根據所述錯誤網頁的內容與所述目標網頁的內容之間的區(qū)別、或者所述錯誤網頁對應的狀態(tài)代碼、或者所述錯誤網頁對應的狀態(tài)代碼與所述目標網頁對應的狀態(tài)代碼之間的區(qū)別,判斷所述目標網頁是否為網址重寫的網頁。
可選地,所述網絡檢測設備還包括網址構造器,適于構造與所述目標網頁的網址相對應的、實際不存在的所述錯誤網址,并將所述目標網頁的網址和錯誤網址發(fā)送給所述網絡接口。可選地,所述網絡檢測設備還包括網頁存儲器,適于存儲由所述網絡接口獲取的目標網頁的內容及其對應的狀態(tài)代碼、以及所述錯誤網頁的內容以及對應的狀態(tài)代碼,并提供給所述網址重寫判斷器??蛇x地,在根據本發(fā)明的實施例的所述網絡檢測系統中,所述網絡接口訪問所述目標網頁一次或多次,并且將每次訪問的目標網頁的內容以及對應的狀態(tài)代碼保存到所述網頁存儲器中。可選地,在根據本發(fā)明的實施例的所述網絡檢測系統中,所述網絡接口訪問所述錯誤網頁一次或多次,并且將每次訪問的錯誤網頁的內容以及對應的狀態(tài)代碼保存到所述網頁存儲器中。
可選地,在根據本發(fā)明的實施例的所述網絡檢測系統中,所述網址重寫判斷器包括網頁內容比較器,適于比較所述錯誤網頁的內容與所述目標網頁的內容;錯誤關鍵字獲取器,適于在所述錯誤網頁的內容與所述目標網頁的內容不同的情況下,從所述錯誤網頁與所述目標網頁相比特有的內容中獲取錯誤關鍵字;以及網址重寫子判斷器,適于在所述錯誤網頁的內容與所述目標網頁的內容相同的情況下,將所述目標網頁判斷為網址重寫的網頁,并且在所述錯誤網頁的內容與所述目標網頁的內容不同的情況下,根據所述錯誤關鍵字來判斷所述目標網頁是否為網址重寫的網頁。可選地,在根據本發(fā)明的實施例的所述網絡檢測系統中,在所述錯誤關鍵字的長度小于預先定義的長度的情況下,所述網址重寫子判斷器將所述目標網頁判斷為網址重寫的網頁。可選地,在根據本發(fā)明的實施例的所述網絡檢測系統中,在所述錯誤網頁的內容與所述目標網頁的內容不同的情況下,所述網址重寫子判斷器從保存所述錯誤網頁一次或多次得到的內容與保存所述目標網頁一次或多次得到的內容中,分別提取每次保存的錯誤網頁與相應的目標網頁相比特有的內容;從所述特有的內容的交集中提取潛在錯誤關鍵字;并且獲取出現次數最多的一個或多個潛在錯誤關鍵字作為錯誤關鍵字??蛇x地,在根據本發(fā)明的實施例的所述網絡檢測系統中,在所述錯誤網頁對應的狀態(tài)代碼指示該錯誤網頁的網址不可訪問的情況下,所述網址重寫判斷器將所述目標網頁判斷為非網址重寫的網頁。可選地,所述與所述目標網頁的網址相對應的錯誤網址是與所述目標網頁的網址相對應的、實際不存在的網址。可選地,所述網址是統一資源定位符。本發(fā)明提供了網絡檢測系統以用于判斷網頁網址重寫。根據本發(fā)明的實施例,可以利用目標網頁以及與其相對應的錯誤網頁的內容和狀態(tài)代碼,來準確有效地判斷目標網頁是否為網址重寫的網頁,能夠適用于各種形式的網址重寫的網頁。在網頁為網址重寫的網頁的情況下,在網站的安全檢測過程中,就不再需要對該網頁相關目錄下的鏈接進行進一步的分析和判斷,可以很大程度地節(jié)省安全檢測所需要的掃描時間。而在網頁為非網址重寫的網頁時,可以準確提取錯誤關鍵字以進行漏洞判斷,從而減少漏洞誤報。
上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式



通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中圖I是根據本發(fā)明的實施例的用于判斷網頁網址重寫的方法的流程圖;圖2是根據本發(fā)明的實施例的根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別判斷目標網頁是否為網址重寫的網頁的步驟的流程·
圖3是根據本發(fā)明的實施例的用于判斷網頁網址重寫的網絡檢測設備的框圖;圖4是根據本發(fā)明的實施例的網址重寫判斷器的框圖;以及圖5是根據本發(fā)明的實施例的網絡檢測系統的框圖。
具體實施例方式下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。圖I示意性地圖示了根據本發(fā)明的實施例的用于判斷網頁網址重寫的方法100的流程圖。如圖I所示,在根據本發(fā)明的實施例的用于判斷網頁網址重寫的方法100中,一開始,執(zhí)行步驟SlOl :獲取目標網頁的內容以及對應的狀態(tài)代碼;接著,執(zhí)行步驟S103 :獲取與目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容以及對應的狀態(tài)代碼;最后,執(zhí)行步驟S105:根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別、或者錯誤網頁對應的狀態(tài)代碼、或者錯誤網頁對應的狀態(tài)代碼與目標網頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網頁是否為網址重寫的網頁。根據本發(fā)明的實施例,網址例如可以是URL (Uniform Resource Locator,統一資源定位符),下文中以URL為例進行描述,但網址并不僅限于URL,而是可以包括任何標識網站地址的方式。在步驟S 101中,獲取目標網頁的內容以及對應的狀態(tài)代碼??蛇x地,可以訪問目標網頁一次或多次,并且保存每次訪問的內容以及對應的狀態(tài)代碼。例如,在訪問目標網頁多次的情況下,可以將多次訪問的內容保存為html_okl、html_ok2、*“、html_okn,將這些次訪問結果的狀態(tài)代碼保存為 http_status_okl、http_status_ok2、…、http_status_okn。接下來,在步驟S103中,獲取與目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容以及對應的狀態(tài)代碼。根據本發(fā)明的實施例,與目標網頁的網址相對應的錯誤網址是與目標網頁的網址相對應的、實際不存在的網址,例如,如果目標網頁的網址是/site/content/1/,則錯誤網址則可以是 /site/content/1/neverexistpage??蛇x地,同樣,可以訪問錯誤網頁一次或多次,并且保存每次訪問的內容以及對應的狀態(tài)代碼。例如,在訪問錯誤網頁多次的情況下,可以將多次訪問的內容保存為html_err I、html_err 2、…、html_errn,將這些次訪問結果的狀態(tài)代碼保存為ht tp_s tatus_err I、http_status_err2、…、http_status_errn。隨后,在步驟S105中,可以根據以下三者之一來判斷目標網頁是否為網址重寫的網頁(I)錯誤網頁對應的狀態(tài)代碼、或者(2 )錯誤網頁對應的狀態(tài)代碼與目標網頁對應的狀態(tài)代碼之間的區(qū)別、或者(3)錯誤網頁的內容與目標網頁的內容之間的區(qū)別。下面分別針對以上三種情況進行描述。第一,可以根據錯誤網頁對應的狀態(tài)代碼來判斷目標網頁是否為網址重寫的網頁。例如,根據本發(fā)明的實施例,如果訪問錯誤URL的訪問結果的狀態(tài)代碼指示該錯誤URL不可訪問(例如狀態(tài)代碼為404 服務器找不到請求的網頁”),則可以判斷出目標網頁不是網址重寫的網頁,即非網址重寫的網頁。
第二,可以根據錯誤網頁對應的狀態(tài)代碼與目標網頁對應的狀態(tài)代碼之間的區(qū)別來判斷目標網頁是否為網址重寫的網頁。例如,根據本發(fā)明的實施例,如果訪問錯誤URL的訪問結果的狀態(tài)代碼為200 (“服務器已成功處理了請求”),而訪問對應的正常URL的訪問結果的狀態(tài)代碼為302 (“服務器目前從不同位置的網頁響應請求,但請求者應繼續(xù)使用原有位置來進行以后的請求”),則可以判斷目標網頁是網址重寫的網頁。第三,可以根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別來判斷目標網頁是否為網址重寫的網頁。圖2示意性地圖示了根據本發(fā)明的實施例的根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別判斷目標網頁是否為網址重寫的網頁的步驟的流程圖,如圖2所示,首先執(zhí)行步驟S105al :比較錯誤網頁的內容與目標網頁的內容。之后,在錯誤網頁的內容與目標網頁的內容相同的情況下,執(zhí)行步驟S105a2 :將目標網頁判斷為網址重寫的網頁。而在錯誤網頁的內容與目標網頁的內容不同的情況下,則執(zhí)行步驟S105a2’ 從錯誤網頁與目標網頁相比特有的內容中獲取錯誤關鍵字,并且根據錯誤關鍵字來判斷目標網頁是否為網址重寫的網頁。其中,可以通過如下方式從錯誤網頁與目標網頁相比特有的內容中獲取錯誤關鍵字。首先,可以從保存錯誤網頁一次或多次得到的內容與保存目標網頁一次或多次得到的內容中,分別提取每次保存的錯誤網頁與相應的目標網頁相比特有的內容。仍以訪問目標網頁多次并且訪問錯誤網頁多次為例進行描述,可以分別比較上述的html_errl〈==>html_okl到html_errn〈==>html_okn,并且將錯誤網頁所特有的內容分別保存為html_err_specialI>…、html_err_specialn。具體而言,可以采用本領域常用的一種開源(opensource)項目 “dtl: :Diff”(請參見 http://code, google, com/p/dtl-cpp/),利用該項目,可以提取出每個錯誤網頁特有的一段或者多段內容(字符串),并且每段特有的內容之間用分割標記分隔開。之后,可以從特有的內容的交集中提取潛在錯誤關鍵字,例如,可以從上述的html_err_specialI> ···>html_err_specialn 中提取交集,保存為 html_err_join。具體而言,同樣可以米用開源項目 “dtl: :Diff ”來從 html_err_speciall、…、html_err_specialn中提取交集,并保存為html_err_join,這里是提取內容一致的部分,每段相同的內容(字符串)之間同樣有分割標記分割開。
然后,可以從交集html_err_join中提取錯誤關鍵字,也就是從一段一段的文本中提取關鍵字(不區(qū)分語言),提取出的結構是錯誤關鍵字列表。舉例而言,所提取出來的錯誤關鍵字包括但不限于“網頁未找到”(或者“page not found”)、“頁面不存在”(或者“page does not exist”)、“404 錯誤”(或者“404error”)、“找不到文件”(或者“file notfound,,)等等。之后,可選地,還可以對所提取出來的錯誤關鍵字進行排序和去重等處理,以保證錯誤關鍵字列表中每個錯誤關鍵字的唯一性,排序例如可以采用錯誤關鍵字出現的次數來作為排序條件。并且,可選地,作為復查,從錯誤關鍵字列表中排除正確頁面中存在的關鍵字,以確保錯誤關鍵字的正確性。然后,可選地,可以從錯誤關鍵字列表中提取排名第一(或者根據需要,提取排名前η)的錯誤關鍵字作為有效錯誤關鍵字。即,獲取出現次數最多的一個或多個潛在錯誤關鍵字作為最終的錯誤關鍵字。如果依據上述步驟,沒有獲取到錯誤關鍵字,則可以判斷目標網頁為網址重寫的 網頁。在獲取了錯誤關鍵字之后,可以根據其來判斷目標網頁是否為網址重寫的網頁??蛇x地,在錯誤關鍵字的長度小于預先定義的長度的情況下,將目標網頁判斷為網址重寫的網頁。預先定義的長度可以根據實際需要來進行選擇,例如2或3個字符,S卩,在錯誤關鍵字的長度小于2或3個字符的情況下,將目標網頁判斷為網址重寫的網頁。在不滿足上述條件的情況下,可以將目標網頁判斷為非網址重寫的網頁,并且保存錯誤關鍵字。隨后,根據本發(fā)明的網站安全檢測系統可以利用上述錯誤關鍵字來確定該網站存在的問題,錯誤關鍵字是在網站處理錯誤請求時產生的頁面中的特定內容。在對網站進行安全檢測時,會構造一些惡意攻擊鏈接,如果網站同樣對其進行了處理,并返回了包括特定關鍵字的內容,則說明網站已經注意到這種惡意攻擊并且進行了相應的處理,因此可以認為該網站對這種惡意攻擊進行了防范,就可以不再進行進一步的檢測,從而節(jié)省了檢測時間。本發(fā)明提供了一種用于判斷網頁網址重寫的方法。根據本發(fā)明的實施例,可以利用目標網頁以及與其相對應的錯誤網頁的內容和狀態(tài)代碼,來準確有效地判斷目標網頁是否為網址重寫的網頁,能夠適用于各種形式的網址重寫的網頁。在網頁為網址重寫的網頁的情況下,在網站的安全檢測過程中,就不再需要對該網頁相關目錄下的鏈接進行進一步的分析和判斷,可以很大程度地節(jié)省安全檢測所需要的掃描時間。而在網頁為非網址重寫的網頁時,可以準確提取錯誤關鍵字以進行漏洞判斷,從而減少漏洞誤報。與上述的方法100相對應,本發(fā)明還提供了一種用于判斷網頁網址重寫的網絡檢測設備200。圖3示意性地圖示了根據本發(fā)明的實施例的用于判斷網頁網址重寫的網絡檢測設備200的框圖,參見圖3,網絡檢測設備200主要包括網絡接口 201以及網址重寫判斷器203,并且可選地還可以包括網址構造器205以及網頁存儲器207。根據本發(fā)明的實施例,網絡接口 201適于利用目標網頁的網址和與目標網頁的網址相對應的錯誤網址向例如一個或者多個目標服務器請求網頁,并且從一個或者多個目標服務器獲取目標網頁的內容以及對應的狀態(tài)代碼、以及錯誤網址所指向的錯誤網頁的內容以及對應的狀態(tài)代碼。網絡接口 201可以用于執(zhí)行上述方法100中的步驟SlOl和步驟S103。網址重寫判斷器203適于根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別、或者錯誤網頁對應的狀態(tài)代碼、或者錯誤網頁對應的狀態(tài)代碼與目標網頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網頁是否為網址重寫的網頁,網址重寫判斷器203可以用于執(zhí)行上述方法100中的步驟S105。根據本發(fā)明的實施例,網絡檢測設備200還可以包括網址構造器205,其適于構造與目標網頁的網址相對應的、實際不存在的錯誤網址,并將目標網頁的網址和錯誤網址發(fā)送給網絡接口 201。可選地,網絡檢測設備200還可以包括網頁存儲器207,其適于存儲由網絡接口 201獲取的目標網頁的內容及其對應的狀態(tài)代碼、以及錯誤網頁的內容以及對應的狀態(tài)代碼,并提供給網址重寫判斷器203。根據本發(fā)明的實施例,網絡接口 201可以訪問目標網頁一次或多次,并且將每次訪問的目標網頁的內容以及對應的狀態(tài)代碼保存到網頁存儲器207中。類似地,網絡接口201也可以訪問錯誤網頁一次或多次,并且將每次訪問的錯誤網頁的內容以及對應的狀態(tài)代碼保存到網頁存儲器207中。在網址重寫判斷器203從網頁存儲器207獲取到目標網頁的內容及其對應的狀態(tài)代碼、以及錯誤網頁的內容以及對應的狀態(tài)代碼之后,就可以根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別、或者錯誤網頁對應的狀態(tài)代碼、或者錯誤網頁對應的狀態(tài)代碼與目標網頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網頁是否為網址重寫的網頁。其中,在錯誤網頁對應的狀態(tài)代碼指示該錯誤網頁的網址不可訪問(例如狀態(tài)代碼為404 服務器找不到請求的網頁”)的情況下,網址重寫判斷器203將目標網頁判斷為·非網址重寫的網頁。另外,根據本發(fā)明的實施例,例如,如果訪問錯誤URL的訪問結果的狀態(tài)代碼為200 (“服務器已成功處理了請求”),而訪問對應的正常URL的訪問結果的狀態(tài)代碼為302(“服務器目前從不同位置的網頁響應請求,但請求者應繼續(xù)使用原有位置來進行以后的請求”),則網址重寫判斷器203可以判斷目標網頁是網址重寫的網頁。圖4示意性地圖示了根據本發(fā)明的實施例的網址重寫判斷器203的框圖。根據本發(fā)明的實施例,如圖4所示,網址重寫判斷器203可以包括網頁內容比較器203a,適于比較錯誤網頁的內容與目標網頁的內容,可以用于執(zhí)行上述方法100中的步驟S105al ;錯誤關鍵字獲取器203b,適于在錯誤網頁的內容與目標網頁的內容不同的情況下,從錯誤網頁與目標網頁相比特有的內容中獲取錯誤關鍵字;以及網址重寫子判斷器203c,適于在錯誤網頁的內容與目標網頁的內容相同的情況下,將目標網頁判斷為網址重寫的網頁,并且在錯誤網頁的內容與目標網頁的內容不同的情況下,根據錯誤關鍵字來判斷目標網頁是否為網址重寫的網頁。錯誤關鍵字獲取器203b和網址重寫子判斷器203c可以用于執(zhí)行上述方法100中的步驟S105a2以及步驟S105a2’。根據本發(fā)明的實施例,在錯誤網頁的內容與目標網頁的內容不同的情況下,網址重寫子判斷器203c從保存錯誤網頁一次或多次得到的內容與保存目標網頁一次或多次得到的內容中,分別提取每次保存的錯誤網頁與相應的目標網頁相比特有的內容,從特有的內容的交集中提取潛在錯誤關鍵字,并且獲取出現次數最多的一個或多個潛在錯誤關鍵字作為錯誤關鍵字。如果依據上述步驟,沒有獲取到錯誤關鍵字,則網址重寫判斷器203可以判斷目標網頁為網址重寫的網頁。在獲取了錯誤關鍵字之后,網址重寫判斷器203可以根據其來判斷目標網頁是否為網址重寫的網頁??蛇x地,在錯誤關鍵字的長度小于預先定義的長度的情況下,網址重寫判斷器203將目標網頁判斷為網址重寫的網頁。預先定義的長度可以根據實際需要來進行選擇,例如2或3個字符,即,在錯誤關鍵字的長度小于2或3個字符的情況下,網址重寫判斷器203將目標網頁判斷為網址重寫的網頁。在不滿足上述條件的情況下,網址重寫判斷器203可以將目標網頁判斷為非網址重寫的網頁,并且保存錯誤關鍵字。由于上述各設備(裝置)實施例與前述各方法實施例相對應,因此不再對各裝置實施例進行詳細描述。根據本發(fā)明的又一方面,還提供了一種網絡檢測系統1000。圖5示意性地圖示了根據本發(fā)明的實施例的網絡檢測系統1000的框圖,參見圖5,網絡檢測系統1000可以包括上述的網絡檢測設備200、以及一個或者多個目標服務器300-1,…,300-n,這一個或者多 個目標服務器可以響應于網絡檢測設備200通過其中的網絡接口 201提供的目標網頁的網址和錯誤網址,來向網絡檢測設備200中的網絡接口 201提供目標網頁的內容以及對應的狀態(tài)代碼、以及錯誤網頁的內容以及對應的狀態(tài)代碼,以供網絡檢測設備200中的網址重寫判斷器203根據錯誤網頁的內容與目標網頁的內容之間的區(qū)別、或者錯誤網頁對應的狀態(tài)代碼、或者錯誤網頁對應的狀態(tài)代碼與目標網頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網頁是否為網址重寫的網頁。在此提供的算法和顯示不與任何特定計算機、虛擬系統或者其它設備固有相關。各種通用系統也可以與基于在此的示教一起使用。根據上面的描述,構造這類系統所要求的結構是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現在此描述的本發(fā)明的內容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖即所要求保護的本發(fā)明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面的權利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式
的權利要求書由此明確地并入該具體實施方式
,其中每個權利要求本身都作為本發(fā)明的單獨實施例。本領域那些技術人員可以理解,可以對實施例中的裝置中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個裝置中??梢园褜嵤├械娜舾赡K組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者模塊中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的替代特征來代替。此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內并且形成不同的實施例。例如,在權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個裝置實施例可以以硬件實現,或者以在一個或者多個處理器上運行的軟件模塊實現,或者以它們的組合實現。本領域的技術人員應當理解,可以在實踐中使用微處理器或者數字信號處理器(DSP )來實現根據本發(fā)明實施例的裝置中的一些或者全部模塊的一些或者全部功能。本發(fā)明還可以實現為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計算機程序和計算機程序產品)。這樣的實現本發(fā)明的程序可以存儲在計算機可讀介質上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網網站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。·
應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
權利要求
1.一種網絡檢測系統(1000),用于判斷網頁網址重寫,其包括 網絡檢測設備(200),適用獲取目標網頁的內容及對應的狀態(tài)代碼和與所述目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容及對應的狀態(tài)代碼,并且據此判斷所述目標網頁是否為網址重寫網頁;以及 一個或者多個目標服務器(300-1,…,300-n),適于響應于所述網絡檢測設備(200)提供的所述目標網頁的網址和所述錯誤網址,向所述網絡檢測設備(200)提供所述目標網頁的內容以及對應的狀態(tài)代碼、以及所述錯誤網頁的內容以及對應的狀態(tài)代碼。
2.如權利要求I所述的網絡檢測系統(1000),其中,所述網絡檢測設備(200)包括 網絡接口(201),適于獲取目標網頁的內容以及對應的狀態(tài)代碼、以及與所述目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容以及對應的狀態(tài)代碼;以及 網址重寫判斷器(203),適于根據所述錯誤網頁的內容與所述目標網頁的內容之間的區(qū)別、或者所述錯誤網頁對應的狀態(tài)代碼、或者所述錯誤網頁對應的狀態(tài)代碼與所述目標網頁對應的狀態(tài)代碼之間的區(qū)別,判斷所述目標網頁是否為網址重寫的網頁。
3.如權利要求2所述的網絡檢測系統(1000),其中所述網絡檢測設備(200)還包括 網址構造器(205),適于構造與所述目標網頁的網址相對應的、實際不存在的所述錯誤網址,并將所述目標網頁的網址和錯誤網址發(fā)送給所述網絡接口(201)。
4.如權利要求2或者3所述的網絡檢測系統(1000),其中所述網絡檢測設備(200)還包括 網頁存儲器(207),適于存儲由所述網絡接口(201)獲取的目標網頁的內容及其對應的狀態(tài)代碼、以及所述錯誤網頁的內容以及對應的狀態(tài)代碼,并提供給所述網址重寫判斷器(203)。
5.如權利要求2-4中的任一項所述的網絡檢測系統(1000),其中所述網絡接口(201)訪問所述目標網頁一次或多次,并且將每次訪問的目標網頁的內容以及對應的狀態(tài)代碼保存到所述網頁存儲器(207)中。
6.如權利要求2-5中的任一項所述的網絡檢測系統(1000),其中所述網絡接口(201)訪問所述錯誤網頁一次或多次,并且將每次訪問的錯誤網頁的內容以及對應的狀態(tài)代碼保存到所述網頁存儲器(207)中。
7.如權利要求2至6中的任一項所述的網絡檢測系統(1000),其中所述網址重寫判斷器(203)包括 網頁內容比較器(203a),適于比較所述錯誤網頁的內容與所述目標網頁的內容; 錯誤關鍵字獲取器(203b ),適于在所述錯誤網頁的內容與所述目標網頁的內容不同的情況下,從所述錯誤網頁與所述目標網頁相比特有的內容中獲取錯誤關鍵字;以及 網址重寫子判斷器(203c),適于在所述錯誤網頁的內容與所述目標網頁的內容相同的情況下,將所述目標網頁判斷為網址重寫的網頁,并且在所述錯誤網頁的內容與所述目標網頁的內容不同的情況下,根據所述錯誤關鍵字來判斷所述目標網頁是否為網址重寫的網頁。
8.如權利要求7所述的網絡檢測系統(1000),其中在所述錯誤關鍵字的長度小于預先定義的長度的情況下,所述網址重寫子判斷器(203c)將所述目標網頁判斷為網址重寫的網頁。
9.如權利要求7或8所述的網絡檢測系統(1000),其中在所述錯誤網頁的內容與所述目標網頁的內容不同的情況下,所述網址重寫子判斷器(203c) 從保存所述錯誤網頁一次或多次得到的內容與保存所述目標網頁一次或多次得到的內容中,分別提取每次保存的錯誤網頁與相應的目標網頁相比特有的內容; 從所述特有的內容的交集中提取潛在錯誤關鍵字;并且 獲取出現次數最多的一個或多個潛在錯誤關鍵字作為錯誤關鍵字。
10.如權利要求2至9中的任一項所述的網絡檢測系統(1000),其中在所述錯誤網頁對應的狀態(tài)代碼指示該錯誤網頁的網址不可訪問的情況下,所述網址重寫判斷器(203)將所述目標網頁判斷為非網址重寫的網頁。
11.如權利要求2至10中的任一項所述的網絡檢測系統(1000),其中所述與所述目標網頁的網址相對應的錯誤網址是與所述目標網頁的網址相對應的、實際不存在的網址。
12.如權利要求2至11中的任一項所述的網絡檢測系統(1000),其中所述網址是統一資源定位符。
全文摘要
本發(fā)明公開了一種網絡檢測系統,用于判斷網頁網址重寫,其包括網絡檢測設備(200),適用獲取目標網頁的內容及對應的狀態(tài)代碼和與所述目標網頁的網址相對應的錯誤網址所指向的錯誤網頁的內容及對應的狀態(tài)代碼,并且據此判斷該目標網頁是否為網址重寫網頁;一個或者多個目標服務器(300-1,…,300-n),適于響應于網絡檢測設備(200)提供的該目標網頁的網址和所述錯誤網址,向網絡檢測設備(200)提供該目標網頁的內容以及對應的狀態(tài)代碼、以及該錯誤網頁的內容以及對應的狀態(tài)代碼。根據本發(fā)明的實施例,可以利用目標網頁以及與其相對應的錯誤網頁的內容和狀態(tài)代碼,來準確有效地判斷目標網頁是否為網址重寫的網頁,能夠適用于各種形式的網址重寫的網頁。
文檔編號H04L12/26GK102932435SQ201210397838
公開日2013年2月13日 申請日期2012年10月18日 優(yōu)先權日2012年10月18日
發(fā)明者龍專, 趙武 申請人:北京奇虎科技有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
高碑店市| 合水县| 武功县| 丹阳市| 蕉岭县| 内黄县| 仁布县| 大宁县| 唐海县| 桐梓县| 淮北市| 岳池县| 陇川县| 教育| 梁山县| 尖扎县| 泾阳县| 晴隆县| 竹溪县| 丽江市| 曲周县| 南川市| 三河市| 岫岩| 项城市| 濮阳县| 宁都县| 监利县| 三原县| 泗水县| 庆安县| 长丰县| 垫江县| 南涧| 嘉黎县| 曲沃县| 柯坪县| 定兴县| 宣恩县| 安溪县| 安乡县|