專利名稱:網(wǎng)頁安全訪問的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及到網(wǎng)頁訪問安全技術(shù),特別涉及到一種網(wǎng)頁安全訪問的方法及裝置。
背景技術(shù):
現(xiàn)有技術(shù)中的釣魚網(wǎng)站主要包括以下幾個類別非法類、惡意欺詐類以及仿冒類。該非法類如色情網(wǎng)站、非法博彩等網(wǎng)站,此類網(wǎng)站往往通過掛馬盜取用戶身份信息、關(guān)鍵帳號和密碼等信息,或是通過虛假預(yù)測騙取會員費(fèi)。該惡意欺詐類如欺詐性機(jī)票代理商(沒有經(jīng)過特別授權(quán))、欺詐性火車票代理商(如釣魚性質(zhì)的火車票代購網(wǎng)站)、假藥網(wǎng)站以及虛假充值卡網(wǎng)站,此類網(wǎng)站通過虛假交易騙取用戶的錢財(cái)。
上述仿冒類網(wǎng)站,主要是仿冒網(wǎng)上銀行、知名電子商務(wù)(如淘寶、京東商城、支付寶)、網(wǎng)絡(luò)運(yùn)營商(如中國移動、中國電信)、網(wǎng)絡(luò)服務(wù)提供商以及知名網(wǎng)絡(luò)游戲網(wǎng)站(如魔獸世界)等。此類網(wǎng)站從視覺上看與被仿冒的真實(shí)網(wǎng)站幾乎一模一樣。仿冒者通過此類網(wǎng)站騙取用戶身份信息、關(guān)鍵帳號和密碼(如網(wǎng)銀帳號、手機(jī)號碼、游戲帳號和密碼等)。針對仿冒類釣魚網(wǎng)站的自動識別,目前主要采用如下兩種檢測方法一、基于釣魚頁面與真實(shí)頁面(被仿冒頁面)相似度比較;二、基于釣魚頁面特征,如根據(jù)接收的URL(UniformResourceLocator,統(tǒng)一資源定位符)訪問請求,獲取網(wǎng)站的最終頁面信息,將頁面的各HTML (Hypertext Markup Language,超文本標(biāo)記語言)標(biāo)簽解析到一棵DOM (DocumentObject Model,文檔對象模型)樹中,并與預(yù)先設(shè)置的特征數(shù)據(jù)庫進(jìn)行比對,確認(rèn)該URL是否為釣魚URL?,F(xiàn)有技術(shù)僅能夠?qū)崿F(xiàn)對仿冒類釣魚網(wǎng)站的檢測,但在檢測到仿冒類釣魚網(wǎng)站后,并不能將訪問者指引到訪問者需要訪問的網(wǎng)站(被仿冒網(wǎng)站),不能確保訪問者后續(xù)訪問的安全。
發(fā)明內(nèi)容
本發(fā)明的主要目的為提供一種網(wǎng)頁安全訪問的方法,提升網(wǎng)頁訪問的安全性。本發(fā)明提出一種網(wǎng)頁安全訪問的方法,包括獲取需訪問網(wǎng)頁的網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征;將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配;所述網(wǎng)址推薦表推薦網(wǎng)址及對應(yīng)的網(wǎng)頁特征;所述網(wǎng)頁特征包括標(biāo)題標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字;根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后將被仿冒網(wǎng)址設(shè)定為推薦網(wǎng)址。優(yōu)選地,所述根據(jù)需訪問網(wǎng)頁的網(wǎng)址,提取多種網(wǎng)頁特征分別與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配的步驟包括將網(wǎng)址與網(wǎng)址推薦表中網(wǎng)址匹配,判斷是否存在匹配網(wǎng)址;在存在時,記錄匹配網(wǎng)址為第一記錄;將標(biāo)題標(biāo)簽關(guān)鍵字與網(wǎng)址推薦表中標(biāo)題標(biāo)簽關(guān)鍵字匹配,判斷是否存在匹配標(biāo)題標(biāo)簽關(guān)鍵字;在存在時,記錄匹配標(biāo)題標(biāo)簽關(guān)鍵字對應(yīng)的網(wǎng)址為第二記錄;將版權(quán)關(guān)鍵字與網(wǎng)址推薦表中版權(quán)關(guān)鍵字匹配,判斷是否存在匹配版權(quán)關(guān)鍵字;在存在時,記錄匹配版權(quán)關(guān)鍵字對應(yīng)的網(wǎng)址為第三記錄。優(yōu)選地,所述根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后推薦被仿冒網(wǎng)址的步驟包括判斷第一記錄、第二記錄以及第三記錄中是否存在網(wǎng)址記錄;在存在網(wǎng)址記錄時,判斷保存的網(wǎng)址記錄是否為同一網(wǎng)址;將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。優(yōu)選地,所述在存在網(wǎng)址記錄時,判斷保存的網(wǎng)址記錄是否為同一網(wǎng)址的步驟包括在存在網(wǎng)址記錄時,判斷是否存在兩個以上的網(wǎng)址記錄;在存在兩個以上的網(wǎng)址記錄時,判斷兩個以上的網(wǎng)址記錄是否為同一網(wǎng)址;如是,將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。優(yōu)選地,所述方法之后還包括將類型關(guān)鍵字與數(shù)據(jù)表中類型關(guān)鍵字匹配,判斷數(shù)量是否超出門限值;在超出時,將推薦網(wǎng)址提供給訪問終端;所述類型關(guān)鍵字包括META標(biāo)簽及正文關(guān)鍵字。優(yōu)選地,所述獲取需訪問網(wǎng)頁的網(wǎng)址的步驟之后還包括根據(jù)網(wǎng)頁的網(wǎng)址提取域名;判斷所述域名是否存在于域名白名單中;在不存在時,將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配。本發(fā)明還提出一種網(wǎng)頁安全訪問的裝置,包括網(wǎng)址特征獲取模塊,用于獲取需訪問網(wǎng)頁的網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征;特征匹配模塊,用于將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配;所述網(wǎng)址推薦表推薦網(wǎng)址及對應(yīng)的網(wǎng)頁特征;所述網(wǎng)頁特征包括標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字;仿冒判斷模塊,用于根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后將被仿冒網(wǎng)址設(shè)定為推薦網(wǎng)址。 優(yōu)選地,所述特征匹配模塊包括網(wǎng)址匹配單元,用于將網(wǎng)址與網(wǎng)址推薦表中網(wǎng)址匹配,判斷是否存在匹配網(wǎng)址;在存在時,記錄匹配網(wǎng)址為第一記錄;標(biāo)簽匹配單元,用于將標(biāo)題標(biāo)簽關(guān)鍵字與網(wǎng)址推薦表中標(biāo)題標(biāo)簽關(guān)鍵字匹配,判斷是否存在匹配標(biāo)題標(biāo)簽關(guān)鍵字;在存在時,記錄匹配標(biāo)題標(biāo)簽關(guān)鍵字對應(yīng)的網(wǎng)址為第二記錄;版權(quán)匹配單元,用于將版權(quán)關(guān)鍵字與網(wǎng)址推薦表中版權(quán)關(guān)鍵字匹配,判斷是否存在匹配版權(quán)關(guān)鍵字;在存在時,記錄匹配版權(quán)關(guān)鍵字對應(yīng)的網(wǎng)址為第三記錄。優(yōu)選地,所述仿冒判斷模塊包括存在判斷單元,用于判斷第一記錄、第二記錄以及第三記錄中是否存在網(wǎng)址記錄;相同判斷單元,用于在存在網(wǎng)址記錄時,判斷保存的網(wǎng)址記錄是否為同一網(wǎng)址;、
網(wǎng)址推薦單元,用于將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。優(yōu)選地,所述相同判斷單元包括第一判斷元件,用于在存在網(wǎng)址記錄時,判斷是否存在兩個以上的網(wǎng)址記錄;第二判斷元件,用于在存在兩個以上的網(wǎng)址記錄時,判斷兩個以上的網(wǎng)址記錄是否為同一網(wǎng)址;如是,通過網(wǎng)址推薦單元將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。優(yōu)選地,所述裝置還包括類型匹配模塊,用于將類型關(guān)鍵字與數(shù)據(jù)表中類型關(guān)鍵字匹配,判斷數(shù)量是否超出門限值;在超出時,將推薦網(wǎng)址提供給訪問終端;所述類型關(guān)鍵字包括META標(biāo)簽及正文關(guān)鍵字。優(yōu)選地,所述裝置還包括
域名提取模塊,用于根據(jù)網(wǎng)頁的網(wǎng)址提取域名;域名判斷模塊,用于判斷所述域名是否存在于域名白名單中;在不存在時,將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配。本發(fā)明能夠檢測仿冒類釣魚網(wǎng)站,并能給出與之對應(yīng)的被仿冒網(wǎng)站的安全URL;其通過網(wǎng)頁特征的匹配,判斷訪問終端所訪問的網(wǎng)址是否為仿冒網(wǎng)址,并確定被仿冒網(wǎng)站的網(wǎng)址,推薦給訪問終端訪問。由此提升網(wǎng)頁訪問的安全性,保障訪問終端不受非法網(wǎng)站侵害。
圖I是本發(fā)明網(wǎng)頁安全訪問的方法一實(shí)施例中的步驟流程示意圖;圖2是本發(fā)明網(wǎng)頁安全訪問的方法一實(shí)施例中具體實(shí)現(xiàn)的頁面展示示意圖;圖3是本發(fā)明網(wǎng)頁安全訪問的方法另一實(shí)施例中的步驟流程示意圖;圖4是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中特征匹配的步驟流程示意圖;圖5是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中仿冒判斷的步驟流程示意圖;圖6是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中的步驟流程示意圖;圖7是本發(fā)明網(wǎng)頁安全訪問的方法一實(shí)施例中的結(jié)構(gòu)示意圖;圖8是本發(fā)明網(wǎng)頁安全訪問的方法另一實(shí)施例中的結(jié)構(gòu)示意圖;圖9是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中特征匹配模塊的結(jié)構(gòu)示意圖;圖10是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中仿冒判斷模塊的結(jié)構(gòu)示意圖;圖11是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中相同判斷單元的結(jié)構(gòu)示意圖;圖12是本發(fā)明網(wǎng)頁安全訪問的方法又一實(shí)施例中的結(jié)構(gòu)示意圖。本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
具體實(shí)施例方式應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。仿冒類釣魚網(wǎng)站能夠以假亂真,主要原因是被仿冒網(wǎng)站頁面的諸多頁面特征都與被仿冒的網(wǎng)站相同或相似,主要包括以下情況URL相類似,釣魚網(wǎng)站的URL與被仿冒網(wǎng)站的URL相似,如仿冒工商銀行網(wǎng)銀的URL中包含icbc或Icbc等類似的字母序列、仿冒淘寶的URL中包含taobao以及仿冒搜狐的URL中出現(xiàn)sohu這樣類似sohu的字母序列等。標(biāo)題標(biāo)簽或版權(quán)關(guān)鍵字相同或相類似,釣魚頁面〈title〉標(biāo)簽、Copyright內(nèi)容分別與被仿冒頁面的〈title〉標(biāo)簽、Copyright內(nèi)容相同或相類似,且文本長度相差不大,都包含特定的關(guān)鍵字,關(guān)鍵字的內(nèi)容可依被仿冒頁面而定。如仿冒工商銀行的網(wǎng)站〈title〉都包含“工商銀行”字樣。META標(biāo)簽或正文內(nèi)容具有相 同特定關(guān)鍵字,釣魚頁面<meta>標(biāo)簽內(nèi)容及正文內(nèi)容與被仿冒頁面的<meta>標(biāo)簽內(nèi)容及正文內(nèi)容具有相同的特定關(guān)鍵字,關(guān)鍵字的內(nèi)容可依被仿冒頁面而定。如仿冒工商銀行的網(wǎng)站<meta>標(biāo)簽及正文都包含“基金”、“股票”、“黃金”、“理財(cái)”或“登錄”等關(guān)鍵字。META標(biāo)簽用來描述一個HTML網(wǎng)頁文檔的屬性,例如網(wǎng)頁描述、關(guān)鍵字以及頁面刷新等。參照圖1,提出本發(fā)明一種網(wǎng)頁安全訪問的方法的一實(shí)施例。該方法可包括步驟S11、獲取需訪問網(wǎng)頁的網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征;步驟S12、將該網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配;該網(wǎng)址推薦表推薦網(wǎng)址及對應(yīng)的網(wǎng)頁特征;該網(wǎng)頁特征包括標(biāo)題標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字;步驟S13、根據(jù)該匹配情況,判斷該網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后將被仿冒網(wǎng)址設(shè)定為推薦網(wǎng)址。上述網(wǎng)頁安全訪問的方法,能夠檢測仿冒類釣魚網(wǎng)站,并能給出與之對應(yīng)的被仿冒網(wǎng)站的安全URL;其通過網(wǎng)頁特征的匹配,判斷訪問終端所訪問的網(wǎng)址是否為仿冒網(wǎng)址,并確定被仿冒網(wǎng)站的網(wǎng)址,推薦給訪問終端訪問。由此提升網(wǎng)頁訪問的安全性,保障訪問終端不受非法網(wǎng)站侵害。該網(wǎng)頁特征可包括標(biāo)題標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字等。參照圖2,例如,當(dāng)用戶終端訪問到一個網(wǎng)頁,經(jīng)過檢測該網(wǎng)頁為仿冒農(nóng)業(yè)銀行網(wǎng)上銀行的釣魚網(wǎng)頁,通過確認(rèn)后可給出用戶終端真正需要訪問的網(wǎng)站,即是圖2中框出的“推薦您訪問農(nóng)業(yè)銀行”,其中“農(nóng)業(yè)銀行”為指向農(nóng)業(yè)銀行網(wǎng)上銀行http://www. abchina.com的鏈接。參照圖3,在本發(fā)明另一實(shí)施例中,上述步驟Sll之后還可包括步驟S111、根據(jù)網(wǎng)頁的網(wǎng)址提取域名;步驟S112、判斷該域名是否存在于域名白名單中;在不存在時,進(jìn)行步驟S12 ;在存在時,進(jìn)行步驟S14 ;步驟S14、判定該網(wǎng)頁為非仿冒網(wǎng)頁。本實(shí)施例中,在檢測之前首先需要建立域名白名單,以及選定可能會被仿冒的網(wǎng)站建立網(wǎng)址推薦表(T_Key_Url)。該被仿冒網(wǎng)站可根據(jù)實(shí)際情況,選擇銀行類或票務(wù)購買類等,比如工商銀行以及南方航空公司等公司網(wǎng)站。在選定可能會被仿冒網(wǎng)站的域名錄入域名白名單中時,一個網(wǎng)站可能對應(yīng)多個域名,需要收集完整,比如南方航空有csair. com和cs-air. com兩個域名,收集域名白名單可防止檢測時被誤報(bào)。上述網(wǎng)址推薦表中的內(nèi)容可包括推薦網(wǎng)址以及對應(yīng)的網(wǎng)頁特征。該網(wǎng)頁特征可通過界面使用工具檢測推薦網(wǎng)址的相應(yīng)信息錄入。該網(wǎng)址推薦表中項(xiàng)目可包含編號(id)、仿冒類別(grp_id)、標(biāo)題(〈title〉)標(biāo)簽關(guān)鍵字、Copyright (版權(quán))關(guān)鍵字和推薦網(wǎng)址(URL)五個字段。其中,該id為順序增長字段;該grp_id可為仿冒組字段,表示仿冒的某一類的網(wǎng)站,如網(wǎng)上銀行類或航空公司購票官網(wǎng)類;該推薦URL可為被仿冒網(wǎng)站的官網(wǎng)URL。參見表I如下
權(quán)利要求
1.一種網(wǎng)頁安全訪問的方法,其特征在于,包括 獲取需訪問網(wǎng)頁的網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征; 將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配;所述網(wǎng)址推薦表推薦網(wǎng)址及對應(yīng)的網(wǎng)頁特征;所述網(wǎng)頁特征包括標(biāo)題標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字; 根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后將被仿冒網(wǎng)址設(shè)定為推薦網(wǎng)址。
2.根據(jù)權(quán)利要求I所述的網(wǎng)頁安全訪問的方法,其特征在于,所述根據(jù)需訪問網(wǎng)頁的網(wǎng)址,提取多種網(wǎng)頁特征分別與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配的步驟包括 將網(wǎng)址與網(wǎng)址推薦表中網(wǎng)址匹配,判斷是否存在匹配網(wǎng)址;在存在時,記錄匹配網(wǎng)址為第一記錄; 將標(biāo)題標(biāo)簽關(guān)鍵字與網(wǎng)址推薦表中標(biāo)題標(biāo)簽關(guān)鍵字匹配,判斷是否存在匹配標(biāo)題標(biāo)簽關(guān)鍵字;在存在時,記錄匹配標(biāo)題標(biāo)簽關(guān)鍵字對應(yīng)的網(wǎng)址為第二記錄; 將版權(quán)關(guān)鍵字與網(wǎng)址推薦表中版權(quán)關(guān)鍵字匹配,判斷是否存在匹配版權(quán)關(guān)鍵字;在存在時,記錄匹配版權(quán)關(guān)鍵字對應(yīng)的網(wǎng)址為第三記錄。
3.根據(jù)權(quán)利要求2所述的網(wǎng)頁安全訪問的方法,其特征在于,所述根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后推薦被仿冒網(wǎng)址的步驟包括 判斷第一記錄、第二記錄以及第三記錄中是否存在網(wǎng)址記錄; 在存在網(wǎng)址記錄時,判斷保存的網(wǎng)址記錄是否為同一網(wǎng)址; 將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。
4.根據(jù)權(quán)利要求3所述的網(wǎng)頁安全訪問的方法,其特征在于,所述在存在網(wǎng)址記錄時,判斷保存的網(wǎng)址記錄是否為同一網(wǎng)址的步驟包括 在存在網(wǎng)址記錄時,判斷是否存在兩個以上的網(wǎng)址記錄; 在存在兩個以上的網(wǎng)址記錄時,判斷兩個以上的網(wǎng)址記錄是否為同一網(wǎng)址;如是,將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。
5.根據(jù)權(quán)利要求I至4中任一項(xiàng)所述的網(wǎng)頁安全訪問的方法,其特征在于,所述方法之后還包括 將類型關(guān)鍵字與數(shù)據(jù)表中類型關(guān)鍵字匹配,判斷數(shù)量是否超出門限值;在超出時,將推薦網(wǎng)址提供給訪問終端;所述類型關(guān)鍵字包括META標(biāo)簽及正文關(guān)鍵字。
6.根據(jù)權(quán)利要求I至4中任一項(xiàng)所述的網(wǎng)頁安全訪問的方法,其特征在于,所述獲取需訪問網(wǎng)頁的網(wǎng)址的步驟之后還包括 根據(jù)網(wǎng)頁的網(wǎng)址提取域名; 判斷所述域名是否存在于域名白名單中;在不存在吋,將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配。
7.—種網(wǎng)頁安全訪問的裝置,其特征在于,包括 網(wǎng)址特征獲取模塊,用于獲取需訪問網(wǎng)頁的網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征; 特征匹配模塊,用于將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配;所述網(wǎng)址推薦表推薦網(wǎng)址及對應(yīng)的網(wǎng)頁特征;所述網(wǎng)頁特征包括標(biāo)題標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字; 仿冒判斷模塊,用于根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后將被仿冒網(wǎng)址設(shè)定為推薦網(wǎng)址。
8.根據(jù)權(quán)利要求6所述的網(wǎng)頁安全訪問的裝置,其特征在于,所述特征匹配模塊包括網(wǎng)址匹配単元,用于將網(wǎng)址與網(wǎng)址推薦表中網(wǎng)址匹配,判斷是否存在匹配網(wǎng)址;在存在時,記錄匹配網(wǎng)址為第一記錄; 標(biāo)簽匹配単元,用于將標(biāo)題標(biāo)簽關(guān)鍵字與網(wǎng)址推薦表中標(biāo)題標(biāo)簽關(guān)鍵字匹配,判斷是否存在匹配標(biāo)題標(biāo)簽關(guān)鍵字;在存在時,記錄匹配標(biāo)題標(biāo)簽關(guān)鍵字對應(yīng)的網(wǎng)址為第二記求; 版權(quán)匹配単元,用于將版權(quán)關(guān)鍵字與網(wǎng)址推薦表中版權(quán)關(guān)鍵字匹配,判斷是否存在匹配版權(quán)關(guān)鍵字;在存在時,記錄匹配版權(quán)關(guān)鍵字對應(yīng)的網(wǎng)址為第三記錄。
9.根據(jù)權(quán)利要求8所述的網(wǎng)頁安全訪問的裝置,其特征在于,所述仿冒判斷模塊包括 存在判斷単元,用于判斷第一記錄、第二記錄以及第三記錄中是否存在網(wǎng)址記錄; 相同判斷単元,用于在存在網(wǎng)址記錄時,判斷保存的網(wǎng)址記錄是否為同一網(wǎng)址; 網(wǎng)址推薦單元,用于將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。
10.根據(jù)權(quán)利要求9所述的網(wǎng)頁安全訪問的裝置,其特征在于,所述相同判斷単元包括 第一判斷元件,用于在存在網(wǎng)址記錄時,判斷是否存在兩個以上的網(wǎng)址記錄; 第二判斷元件,用于在存在兩個以上的網(wǎng)址記錄時,判斷兩個以上的網(wǎng)址記錄是否為同一網(wǎng)址;如是,通過網(wǎng)址推薦單元將所述網(wǎng)址記錄設(shè)置為推薦網(wǎng)址。
11.根據(jù)權(quán)利要求7至10中任一項(xiàng)所述的網(wǎng)頁安全訪問的裝置,其特征在于,所述裝置還包括 類型匹配模塊,用于將類型關(guān)鍵字與數(shù)據(jù)表中類型關(guān)鍵字匹配,判斷數(shù)量是否超出門限值;在超出時,將推薦網(wǎng)址提供給訪問終端;所述類型關(guān)鍵字包括META標(biāo)簽及正文關(guān)鍵字。
12.根據(jù)權(quán)利要求7至10中任一項(xiàng)所述的網(wǎng)頁安全訪問的裝置,其特征在于,所述裝置還包括 域名提取模塊,用于根據(jù)網(wǎng)頁的網(wǎng)址提取域名; 域名判斷模塊,用于判斷所述域名是否存在于域名白名單中;在不存在時,將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配。
全文摘要
本發(fā)明揭示了一種網(wǎng)頁安全訪問的方法及裝置。該方法可包括獲取需訪問網(wǎng)頁的網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征;將所述網(wǎng)址以及對應(yīng)網(wǎng)頁的網(wǎng)頁特征與預(yù)設(shè)網(wǎng)址推薦表進(jìn)行匹配;所述網(wǎng)址推薦表推薦網(wǎng)址及對應(yīng)的網(wǎng)頁特征;所述網(wǎng)頁特征包括標(biāo)題標(biāo)簽關(guān)鍵字和/或版權(quán)關(guān)鍵字;根據(jù)所述匹配情況,判斷所述網(wǎng)頁是否屬于仿冒,在判定屬于仿冒后將被仿冒網(wǎng)址設(shè)定為推薦網(wǎng)址。本發(fā)明能夠檢測仿冒類釣魚網(wǎng)站,并能給出與之對應(yīng)的被仿冒網(wǎng)站的安全URL;其通過網(wǎng)頁特征的匹配,判斷訪問終端所訪問的網(wǎng)址是否為仿冒網(wǎng)址,并確定被仿冒網(wǎng)站的網(wǎng)址,推薦給訪問終端訪問。由此提升網(wǎng)頁訪問的安全性,保障訪問終端不受非法網(wǎng)站侵害。
文檔編號G06F17/30GK102737183SQ201210192839
公開日2012年10月17日 申請日期2012年6月12日 優(yōu)先權(quán)日2012年6月12日
發(fā)明者羅焱 申請人:騰訊科技(深圳)有限公司