欺詐網(wǎng)頁(yè)檢測(cè)方法及相應(yīng)裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及欺詐網(wǎng)頁(yè)檢測(cè)方法及相應(yīng)裝置。
【背景技術(shù)】
[0002]目前,要確定一個(gè)網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè),通常包括如下兩個(gè)步驟:第一,確定網(wǎng)頁(yè)的主題;第二,在初步確定網(wǎng)頁(yè)的主題為預(yù)設(shè)的欺詐網(wǎng)頁(yè)類別的主題后,進(jìn)一步確定網(wǎng)頁(yè)對(duì)用戶是否有惡意,如果是,則判定該網(wǎng)頁(yè)為欺詐網(wǎng)頁(yè)。其中,目前已經(jīng)有很多成熟的網(wǎng)頁(yè)分類方法用于確定網(wǎng)頁(yè)的主題;要確定網(wǎng)頁(yè)對(duì)用戶是否有惡意,一般都是基于網(wǎng)頁(yè)的文本內(nèi)容的關(guān)鍵詞特征。然而,針對(duì)網(wǎng)頁(yè)的文本內(nèi)容較少的情況,則難以確定網(wǎng)頁(yè)是否對(duì)用戶有惡意,因而難以檢出這種類型的欺詐網(wǎng)頁(yè)?;谏鲜鰧?duì)文本內(nèi)容少的網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè)的檢出率低的問題,現(xiàn)有技術(shù)提出了兩種解決辦法:
[0003]一種解決辦法是基于關(guān)鍵特征匹配法,來檢測(cè)文本內(nèi)容少的網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè),具體做法是線下人為的觀察和總結(jié)欺詐網(wǎng)頁(yè)中相對(duì)固定的成分,作為分類特征,建立網(wǎng)頁(yè)檢測(cè)模型,然后線上根據(jù)該網(wǎng)頁(yè)檢測(cè)模型實(shí)時(shí)檢測(cè)新的網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè);
[0004]另一種解決辦法是基于URL (Uniform Resource Locator,統(tǒng)一資源定位符)規(guī)則法,來檢測(cè)文本內(nèi)容少的網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè),具體做法是線下通過觀察欺詐網(wǎng)頁(yè)的URL,發(fā)現(xiàn)其規(guī)律,總結(jié)出一套正則表達(dá)式,然后線上根據(jù)該正則表達(dá)式來檢測(cè)新的網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè)。
[0005]然而,上述兩種解決辦法均依賴人工先驗(yàn)知識(shí),不具有推廣性,網(wǎng)頁(yè)中的固定特征難以尋找,URL規(guī)律也難以總結(jié),導(dǎo)致檢測(cè)欺詐網(wǎng)頁(yè)的能力較弱,而且誤檢率高。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實(shí)施例提供一種欺詐網(wǎng)頁(yè)檢測(cè)方法及相應(yīng)裝置,以提高對(duì)欺詐網(wǎng)頁(yè)的檢測(cè)能力,降低誤檢率。
[0007]一方面,本發(fā)明實(shí)施例提供了一種欺詐網(wǎng)頁(yè)檢測(cè)方法,該方法包括:
[0008]接收客戶端上報(bào)的網(wǎng)頁(yè)的行為特征信息,其中所述行為特征信息為所述客戶端根據(jù)對(duì)所述網(wǎng)頁(yè)中是否出現(xiàn)預(yù)設(shè)的異常行為的監(jiān)聽結(jié)果生成的特征信息;
[0009]根據(jù)所述行為特征信息,對(duì)所述網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。
[0010]另一方面,本發(fā)明實(shí)施例還提供了一種欺詐網(wǎng)頁(yè)檢測(cè)方法,該方法包括:
[0011]監(jiān)聽網(wǎng)頁(yè)中是否出現(xiàn)預(yù)設(shè)的異常行為;
[0012]根據(jù)監(jiān)聽結(jié)果生成所述網(wǎng)頁(yè)的行為特征信息,上報(bào)給服務(wù)端,以指示所述服務(wù)端根據(jù)所述行為特征信息,對(duì)所述網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。
[0013]再一方面,本發(fā)明實(shí)施例還提供了一種欺詐網(wǎng)頁(yè)檢測(cè)裝置,該裝置包括:
[0014]網(wǎng)頁(yè)行為特征接收模塊,用于接收客戶端上報(bào)的網(wǎng)頁(yè)的行為特征信息,其中所述行為特征信息為所述客戶端根據(jù)對(duì)所述網(wǎng)頁(yè)中是否出現(xiàn)預(yù)設(shè)的異常行為的監(jiān)聽結(jié)果生成的特征信息;
[0015]網(wǎng)頁(yè)欺詐性檢測(cè)模塊,用于根據(jù)所述網(wǎng)頁(yè)行為特征接收模塊接收到的行為特征信息,對(duì)所述網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。
[0016]再一方面,本發(fā)明實(shí)施例還提供了一種欺詐網(wǎng)頁(yè)檢測(cè)裝置,該裝置包括:
[0017]網(wǎng)頁(yè)異常行為監(jiān)聽模塊,用于監(jiān)聽網(wǎng)頁(yè)中是否出現(xiàn)預(yù)設(shè)的異常行為;
[0018]網(wǎng)頁(yè)行為特征信息上報(bào)模塊,用于根據(jù)所述網(wǎng)頁(yè)異常行為監(jiān)聽模塊得到的監(jiān)聽結(jié)果,生成所述網(wǎng)頁(yè)的行為特征信息,上報(bào)給服務(wù)端,以指示所述服務(wù)端根據(jù)所述行為特征信息,對(duì)所述網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。
[0019]本發(fā)明實(shí)施例提供的技術(shù)方案,充分利用客戶端的優(yōu)勢(shì),來實(shí)時(shí)地捕獲網(wǎng)頁(yè)的行為特征信息,使得服務(wù)端可以將該行為特征信息作為用于進(jìn)行網(wǎng)頁(yè)欺詐性檢測(cè)的一個(gè)特征加以使用,這樣能夠彌補(bǔ)用于檢測(cè)文本內(nèi)容較少的網(wǎng)頁(yè)的欺詐性時(shí)所使用的特征不足或特征較難提取的問題,進(jìn)而可以增強(qiáng)對(duì)欺詐網(wǎng)頁(yè)的檢測(cè)能力,降低誤檢率。
【附圖說明】
[0020]圖1是本發(fā)明實(shí)施例一提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖;
[0021]圖2是本發(fā)明實(shí)施例二提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖;
[0022]圖3是本發(fā)明實(shí)施例三提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖;
[0023]圖4是本發(fā)明實(shí)施例四提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖;
[0024]圖5A是本發(fā)明實(shí)施例五提供的一種欺詐網(wǎng)頁(yè)檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0025]圖5B是本發(fā)明實(shí)施例五提供的一種欺詐網(wǎng)頁(yè)檢測(cè)裝置中的欺詐性檢測(cè)單元的子結(jié)構(gòu)示意圖;
[0026]圖6是本發(fā)明實(shí)施例六提供的一種欺詐網(wǎng)頁(yè)檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0027]圖7是本發(fā)明實(shí)施例七提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖。
【具體實(shí)施方式】
[0028]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0029]實(shí)施例一
[0030]圖1是本發(fā)明實(shí)施例一提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖。本實(shí)施例可適用于對(duì)客戶端上所呈現(xiàn)的網(wǎng)頁(yè)的欺詐性進(jìn)行檢測(cè)的情況。該方法由與客戶端對(duì)應(yīng)的服務(wù)端執(zhí)行。在本發(fā)明實(shí)施例中,客戶端和服務(wù)端可駐留在不同的物理設(shè)備上,也可以位于同一物理設(shè)備上。例如,可以全部位于瀏覽器所在的物理設(shè)備上;或者,客戶端位于瀏覽器所在的第一物理設(shè)備上,服務(wù)端位于具備有欺詐網(wǎng)頁(yè)檢測(cè)功能的第二物理設(shè)備上;或者,客戶端和服務(wù)端均可位于除第一物理設(shè)備以及第二物理設(shè)備之外的第三方物理設(shè)備上。其中,瀏覽器所在的第一物理設(shè)備可以是諸如智能手機(jī)、電腦或者個(gè)人數(shù)字助理等之類的終端產(chǎn)品,第二物理設(shè)備可以是為終端提供相應(yīng)服務(wù)的服務(wù)器。參見圖1,本實(shí)施例提供的欺詐網(wǎng)頁(yè)檢測(cè)方法具體包括如下操作:
[0031]操作110、接收客戶端上報(bào)的網(wǎng)頁(yè)的行為特征信息;
[0032]操作120、根據(jù)所述行為特征信息,對(duì)所述網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。
[0033]在本實(shí)施例中,上報(bào)的行為特征信息為客戶端根據(jù)對(duì)網(wǎng)頁(yè)中是否出現(xiàn)預(yù)設(shè)的異常行為的監(jiān)聽結(jié)果生成的特征信息。其中,預(yù)設(shè)的異常行為可以為在打開、呈現(xiàn)和/或關(guān)閉網(wǎng)頁(yè)時(shí)所發(fā)生的存有欺詐嫌疑的行為,例如可以是在所呈現(xiàn)的網(wǎng)頁(yè)中彈出顯示有欺詐信息(例如“恭喜您中獎(jiǎng)50萬,請(qǐng)致電3#*6”、“若想投資,請(qǐng)致電5#*1,無風(fēng)險(xiǎn),高收益,年回報(bào)100萬”等)的窗口的行為,在呈現(xiàn)網(wǎng)頁(yè)時(shí)未接收到用戶對(duì)即時(shí)通信軟件的啟動(dòng)指示,而主動(dòng)調(diào)用本地即時(shí)通信軟件彈框添加好友的行為。在本實(shí)施例中,出現(xiàn)的網(wǎng)頁(yè)異常行為可以為一種網(wǎng)頁(yè)異常行為,也可為多種網(wǎng)頁(yè)異常行為。根據(jù)監(jiān)聽結(jié)果所生成的網(wǎng)頁(yè)的行為特征信息可包括兩部分:第一部分是客戶端所監(jiān)聽的網(wǎng)頁(yè)的標(biāo)識(shí)信息(例如網(wǎng)頁(yè)的統(tǒng)一資源符),服務(wù)端根據(jù)該標(biāo)識(shí)來獲取網(wǎng)頁(yè);第二部分是與監(jiān)聽結(jié)果對(duì)應(yīng)的行為信息。具體的,行為信息可以直接是對(duì)所監(jiān)聽到的異常行為的描述信息,如果客戶端監(jiān)聽到多種異常行為,則服務(wù)端獲取到的行為信息包括分別與監(jiān)聽到的各種異常行為所對(duì)應(yīng)的子描述信息;也可以是得到的與監(jiān)聽結(jié)果對(duì)應(yīng)的異常等級(jí)標(biāo)識(shí),如果客戶端監(jiān)聽到多種異常行為,則服務(wù)端獲取到的異常等級(jí)標(biāo)識(shí)也會(huì)為多個(gè)異常等級(jí)標(biāo)識(shí),也即每個(gè)監(jiān)聽到的異常行為都會(huì)對(duì)應(yīng)一個(gè)異常等級(jí)標(biāo)識(shí),其中不同異常行為對(duì)應(yīng)的異常等級(jí)標(biāo)識(shí)可相同,也可不同。
[0034]由于網(wǎng)頁(yè)的行為特征信息可以在一定程度上表征網(wǎng)頁(yè)為欺詐網(wǎng)頁(yè)的可疑度,且與網(wǎng)頁(yè)中包含的文本內(nèi)容的多少無關(guān),很容易被客戶端獲取到,無需依賴于人工先驗(yàn)知識(shí),所以可作為服務(wù)端在對(duì)網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)時(shí)的一個(gè)十分重要且有效的影響因素。在得到客戶端上報(bào)的行為特征信息之后,服務(wù)端可以基于該行為特征信息,并結(jié)合通過其他算法提取到的網(wǎng)頁(yè)特征,對(duì)網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。其中,得到的檢測(cè)結(jié)果可以是對(duì)網(wǎng)頁(yè)是否為欺詐性網(wǎng)頁(yè)的判定結(jié)果,也可以是給出一個(gè)用于衡量網(wǎng)頁(yè)是欺詐網(wǎng)頁(yè)的概率參數(shù),例如可疑指數(shù)。
[0035]示例性的,在接收到客戶端上報(bào)的網(wǎng)頁(yè)的行為特征信息之后,可先基于該行為特征信息,來初步確定該網(wǎng)頁(yè)是否對(duì)用戶存有惡意,然后針對(duì)初步確定的結(jié)果的不同,分別采用不同的算法來對(duì)網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)。例如,在確定該網(wǎng)頁(yè)對(duì)用戶存有惡意之后,可基于預(yù)設(shè)的網(wǎng)頁(yè)主題分類算法,對(duì)該網(wǎng)頁(yè)的主題所屬分類進(jìn)行識(shí)別,基于識(shí)別結(jié)果得到一個(gè)對(duì)該網(wǎng)頁(yè)是欺詐網(wǎng)頁(yè)的可疑指數(shù)。
[0036]當(dāng)然,服務(wù)端也可預(yù)先創(chuàng)建一個(gè)檢測(cè)模型,該檢測(cè)模型的輸入是客戶端上報(bào)的網(wǎng)頁(yè)的行為特征信息、對(duì)檢測(cè)網(wǎng)頁(yè)是否為欺詐網(wǎng)頁(yè)起到作用的其他各個(gè)網(wǎng)頁(yè)特征(例如網(wǎng)頁(yè)所包含的文本內(nèi)容中的關(guān)鍵詞特征、網(wǎng)頁(yè)結(jié)構(gòu)特征等),輸出是網(wǎng)頁(yè)是欺詐網(wǎng)頁(yè)的可疑指數(shù)。
[0037]本實(shí)施例提供的技術(shù)方案,充分利用客戶端的優(yōu)勢(shì),來實(shí)時(shí)地捕獲網(wǎng)頁(yè)的行為特征信息,使得服務(wù)端可以將該行為特征信息作為用于進(jìn)行網(wǎng)頁(yè)欺詐性檢測(cè)的一個(gè)特征加以使用,這樣能夠彌補(bǔ)用于檢測(cè)文本內(nèi)容較少的網(wǎng)頁(yè)的欺詐性時(shí)所使用的特征不足或特征較難提取的問題,進(jìn)而可以增強(qiáng)對(duì)欺詐網(wǎng)頁(yè)的檢測(cè)能力,降低誤檢率。
[0038]實(shí)施例二
[0039]圖2是本發(fā)明實(shí)施例二提供的一種欺詐網(wǎng)頁(yè)檢測(cè)方法的流程示意圖。本實(shí)施例在上述實(shí)施例一的基礎(chǔ)上,對(duì)“根據(jù)所述行為特征信息,對(duì)所述網(wǎng)頁(yè)進(jìn)行欺詐性檢測(cè)”的操作作進(jìn)一步優(yōu)化。參見圖2,本實(shí)施例提供的欺詐網(wǎng)頁(yè)檢測(cè)方法具體包括如下操作:
[0040]操作210、接收客戶端上報(bào)的網(wǎng)頁(yè)的行為特征信息;
[0041]操作220、根據(jù)所述行為特征信息中的異常等級(jí)標(biāo)識(shí),確定所述網(wǎng)頁(yè)是否對(duì)用戶有惡意;