欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)的獲取方法及裝置與流程

文檔序號:11440078閱讀:310來源:國知局
數(shù)據(jù)的獲取方法及裝置與流程

本發(fā)明實(shí)施例涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)的獲取方法及裝置。



背景技術(shù):

漏洞掃描器要解決的第一個問題就是抓取網(wǎng)站的所有網(wǎng)頁的數(shù)據(jù)、獲得所有可能存在的漏洞入口,因此爬蟲引擎的質(zhì)量已經(jīng)成為影響漏報(bào)率的關(guān)鍵因素。

現(xiàn)有技術(shù)中,部分網(wǎng)頁載入沙箱過程中就能夠觸發(fā)一些事件,爬蟲引擎可以直接根據(jù)被觸發(fā)的事件,獲取到網(wǎng)頁的數(shù)據(jù),部分網(wǎng)頁則需要用戶手動操作之后,才能觸發(fā)一些事件,之后才能夠根據(jù)被觸發(fā)的事件,獲取到網(wǎng)頁的數(shù)據(jù)。

但是,由于網(wǎng)頁需要用戶手動操作之后才能觸發(fā)一些事件,可能存在部分事件未被操作的情況,獲取網(wǎng)頁的數(shù)據(jù)不全面、效率較低,導(dǎo)致爬蟲引擎的質(zhì)量較差,漏洞掃描器發(fā)現(xiàn)漏洞的概率較低。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供一種數(shù)據(jù)的獲取方法及裝置,實(shí)現(xiàn)了自動觸發(fā)需要觸發(fā)的事件,獲取的網(wǎng)頁數(shù)據(jù)更全面,效率更高,進(jìn)而提高了爬蟲引擎的質(zhì)量,使漏洞掃描器發(fā)現(xiàn)漏洞的概率增大。

本發(fā)明實(shí)施例提供一種數(shù)據(jù)的獲取方法,包括:

當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),根據(jù)所述網(wǎng)頁的源代碼,確定需要觸發(fā)的事件;

對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息;

向爬蟲引擎發(fā)送所述鏈接信息,以使所述爬蟲引擎根據(jù)所述鏈接信息獲取所述網(wǎng)頁的數(shù)據(jù)。

進(jìn)一步地,上述所述方法中,根據(jù)所述網(wǎng)頁的源代碼,確定需要觸發(fā)的操作事件,包括:

對所述源代碼進(jìn)行解析,獲取所述源代碼中所述每個操作事件的標(biāo)識信息;

根據(jù)所述每個操作事件的標(biāo)識信息,確定需要觸發(fā)的操作事件。

進(jìn)一步地,上述所述方法中,所述獲取被觸發(fā)的事件對應(yīng)的鏈接信息之前,還包括:

獲取所述需要觸發(fā)的事件的觸發(fā)狀態(tài)信息;

根據(jù)所述需要觸發(fā)的事件的觸發(fā)狀態(tài)信息,確定其中被觸發(fā)的事件。

進(jìn)一步地,上述所述方法中,對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,包括:

根據(jù)網(wǎng)頁的類型確定第一觸發(fā)策略;

根據(jù)所述第一觸發(fā)策略,對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作;或者,

根據(jù)網(wǎng)頁的安全防護(hù)需求信息確定第二觸發(fā)策略;

根據(jù)所述第二觸發(fā)策略,對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作。進(jìn)一步地,上述所述方法中,對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,包括:

確定需要觸發(fā)的每個事件的優(yōu)先級;

根據(jù)所述需要觸發(fā)的每個事件的優(yōu)先級的順序,依次對所述需要觸發(fā)的每個事件進(jìn)行模擬觸發(fā)操作。

本發(fā)明實(shí)施例還提供一種數(shù)據(jù)的獲取裝置,包括:

確定模塊,用于當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),根據(jù)所述網(wǎng)頁的源代碼,確定需要觸發(fā)的事件;

智能交互模塊,用于對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息;

發(fā)送模塊,用于向爬蟲引擎發(fā)送所述鏈接信息,以使所述爬蟲引擎根據(jù)所述鏈接信息獲取所述網(wǎng)頁的數(shù)據(jù)。

進(jìn)一步地,上述所述的裝置中,所述確定模塊,具體用于:

對所述源代碼進(jìn)行解析,獲取所述源代碼中所述每個操作事件的標(biāo)識信息;

根據(jù)所述每個操作事件的標(biāo)識信息,確定需要觸發(fā)的操作事件。

進(jìn)一步地,上述所述的裝置,還包括:獲取模塊,用于獲取所述需要觸發(fā)的事件的觸發(fā)狀態(tài)信息;

所述確定模塊,還用于根據(jù)所述需要觸發(fā)的事件的觸發(fā)狀態(tài)信息,確定其中被觸發(fā)的事件。

進(jìn)一步地,上述所述的裝置中,所述智能交互模塊,具體用于:

根據(jù)網(wǎng)頁的類型確定第一觸發(fā)策略;

根據(jù)所述第一觸發(fā)策略,對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作;或者,

根據(jù)網(wǎng)頁的安全防護(hù)需求信息確定第二觸發(fā)策略;

根據(jù)所述第二觸發(fā)策略,對所述需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作。

進(jìn)一步地,上述所述的裝置中,

所述智能交互模塊,還用于:

確定需要觸發(fā)的每個事件的優(yōu)先級;

根據(jù)所述需要觸發(fā)的每個事件的優(yōu)先級的順序,依次對所述需要觸發(fā)的每個事件進(jìn)行模擬觸發(fā)操作。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法及裝置,當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),通過根據(jù)網(wǎng)頁的源代碼,確定需要觸發(fā)的事件,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息,向爬蟲引擎發(fā)送鏈接信息,以使爬蟲引擎根據(jù)鏈接信息獲取網(wǎng)頁的數(shù)據(jù),實(shí)現(xiàn)了自動觸發(fā)需要觸發(fā)的事件,獲取的網(wǎng)頁數(shù)據(jù)更全面,效率更高,進(jìn)而提高了爬蟲引擎的質(zhì)量,使漏洞掃描器發(fā)現(xiàn)漏洞的概率增大。

附圖說明

此處所說明的附圖用來提供對本發(fā)明實(shí)施例的進(jìn)一步理解,構(gòu)成本發(fā)明實(shí)施例的一部分,本發(fā)明實(shí)施例的示意性實(shí)施例及其說明用于解釋本發(fā)明實(shí)施例,并不構(gòu)成對本發(fā)明實(shí)施例的不當(dāng)限定。在附圖中:

圖1為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法實(shí)施例一的流程圖;

圖2為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法實(shí)施例二的流程圖;

圖3為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置實(shí)施例一的結(jié)構(gòu)示意圖;

圖4為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置實(shí)施例二的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例具體實(shí)施例及相應(yīng)的附圖對本發(fā)明實(shí)施例技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本發(fā)明實(shí)施例一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明實(shí)施例中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明實(shí)施例保護(hù)的范圍。

以下結(jié)合附圖,詳細(xì)說明本發(fā)明實(shí)施例各實(shí)施例提供的技術(shù)方案。

實(shí)施例一

圖1為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法實(shí)施例一的流程圖,如圖1所示,本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法,具體可以包括如下步驟:

100、當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),根據(jù)網(wǎng)頁的源代碼,確定需要觸發(fā)的事件。

本發(fā)明實(shí)施例為了加強(qiáng)對網(wǎng)絡(luò)安全的保護(hù),可以將沙箱技術(shù)應(yīng)用于網(wǎng)頁防護(hù)中。從技術(shù)實(shí)現(xiàn)角度而言,就是從原有的阻止可疑程序?qū)ο到y(tǒng)訪問,轉(zhuǎn)變成將可疑程序?qū)Υ疟P、注冊表等的訪問重定向到指定文件夾下,從而消除對系統(tǒng)的危害。

用戶通過瀏覽器所作的任何寫磁盤操作,都將重定向到一個特定的臨時(shí)文件夾中。這樣,即使網(wǎng)頁中包含病毒,木馬,廣告等惡意程序,被強(qiáng)行安裝后,也只是安裝到了臨時(shí)文件夾中,不會對用戶終端造成危害。因此,每個網(wǎng)頁在終端顯示之前,會被載入沙箱中進(jìn)行解碼等處理,從而獲得網(wǎng)頁的源代碼。

由于不同的網(wǎng)頁頁面的形式、內(nèi)容等不同,導(dǎo)致其加載時(shí)間不同,因此,本發(fā)明實(shí)施例中可以針對不同網(wǎng)頁的加載時(shí)間進(jìn)行統(tǒng)計(jì),得到一個較優(yōu)的時(shí)間,作為預(yù)設(shè)時(shí)間段,在該預(yù)設(shè)時(shí)間段內(nèi),會根據(jù)對網(wǎng)頁進(jìn)行解碼處理后得到的源代碼,識別所有操作事件,以確定需要觸發(fā)的事件。

101、對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息。

在一個具體實(shí)現(xiàn)過程中,每個事件都需要用戶操作之后,才能被觸發(fā),這就導(dǎo)致獲取網(wǎng)頁的數(shù)據(jù)時(shí)效率較低,且通常情況下,用戶僅會根據(jù)自己的需求,觸發(fā)所需要的事件,使部分事件是不會被觸發(fā)的,導(dǎo)致獲取網(wǎng)頁數(shù)據(jù)不全面,因此本發(fā)明實(shí)施例,可以在確定需要觸發(fā)的事件后,利用智能交互系統(tǒng)去模擬用戶的操作,例如,本發(fā)明實(shí)施例中對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,可以包括但不限制于:對需要觸發(fā)的事件進(jìn)模擬點(diǎn)擊鏈接操作,和/或,對需要觸發(fā)的事件進(jìn)模擬拖動圖層操作,和/或,對需要觸發(fā)的事件進(jìn)模擬滑動鼠標(biāo)操作,和/或,對需要觸發(fā)的事件進(jìn)模擬填寫表單操作。

通常情況下,每個事件被觸發(fā)后,會生成相應(yīng)的鏈接信息,因此,本發(fā)明實(shí)施例中,在對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,使需要觸發(fā)的事件被觸發(fā)之后,生成相應(yīng)的鏈接信息,進(jìn)而可以獲取被觸發(fā)的事件對應(yīng)的鏈接信息。

102、向爬蟲引擎發(fā)送鏈接信息,以使爬蟲引擎根據(jù)鏈接信息獲取網(wǎng)頁的數(shù)據(jù)。

在獲取到被觸發(fā)的事件的鏈接信息之后,可以向爬蟲引擎發(fā)送獲取的鏈接信息,從而可以使爬蟲引擎根據(jù)該鏈接信息獲取到網(wǎng)頁的數(shù)據(jù)。例如,網(wǎng)頁當(dāng)前頁面的內(nèi)容、網(wǎng)頁后臺數(shù)據(jù)等。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法的執(zhí)行主體可以為數(shù)據(jù)的獲取裝置,該數(shù)據(jù)的獲取裝置具體可以通過軟件來集成,例如該數(shù)據(jù)的獲取裝置具體可以為一個應(yīng)用,本發(fā)明對此不進(jìn)行特別限定。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法,當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),通過根據(jù)網(wǎng)頁的源代碼,確定需要觸發(fā)的事件,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息,向爬蟲引擎發(fā)送鏈接信息,以使爬蟲引擎根據(jù)鏈接信息獲取網(wǎng)頁的數(shù)據(jù),實(shí)現(xiàn)了自動觸發(fā)需要觸發(fā)的事件,獲取的網(wǎng)頁數(shù)據(jù)更全面,效率更高,進(jìn)而提高了爬蟲引擎的質(zhì)量,使漏洞掃描器發(fā)現(xiàn)漏洞的概率增大。

實(shí)施例二

圖2為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法實(shí)施例二的流程圖,如圖2所示,本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法在圖1所示實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地對本發(fā)明技術(shù)方案進(jìn)行描述。

如圖2所示,本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法,具體可以包括如下步驟:

200、當(dāng)網(wǎng)頁載入沙箱后,獲取網(wǎng)頁的源代碼。

當(dāng)網(wǎng)頁被載入沙箱后,可以對網(wǎng)頁進(jìn)行解析,從而獲取到網(wǎng)頁的源代碼。

201、在預(yù)設(shè)時(shí)間段內(nèi),對源代碼進(jìn)行解析,獲取源代碼中每個操作事件的標(biāo)識信息。

由于不同的網(wǎng)頁頁面的形式、內(nèi)容等不同,導(dǎo)致其加載時(shí)間不同,因此,本發(fā)明實(shí)施例中可以針對不同網(wǎng)頁的加載時(shí)間進(jìn)行統(tǒng)計(jì),得到一個較優(yōu)的時(shí)間,作為預(yù)設(shè)時(shí)間段。例如,本發(fā)明實(shí)施例中優(yōu)選為40s。在獲取到網(wǎng)頁的源代碼后,可以在預(yù)設(shè)時(shí)間段內(nèi),對源代碼進(jìn)行解析,獲取源代碼中每個操作事件的標(biāo)識信息。

在一個具體實(shí)現(xiàn)過程中,網(wǎng)頁中的事件被觸發(fā)即網(wǎng)頁中源代碼中的調(diào)用函數(shù)被觸發(fā),而每個調(diào)用函數(shù)中必然包含一段特定的代碼,本發(fā)明實(shí)施例可以將包含的特定代碼作為每個操作事件的標(biāo)識信息。例如,本發(fā)明實(shí)施例可以在在預(yù)設(shè)時(shí)間段內(nèi),對源代碼進(jìn)行解析,得到多個調(diào)用函數(shù),并獲取每個調(diào)用函數(shù)中包含的一段特定的代碼,以得到源代碼中每個操作事件的標(biāo)識信息。

202、根據(jù)獲取的標(biāo)識信息,確定需要觸發(fā)的操作事件。

在一個具體實(shí)現(xiàn)過程中,可以根據(jù)從源代碼中獲取的標(biāo)識信息,得知每個調(diào)用函數(shù)的屬性即該調(diào)用函數(shù)能夠執(zhí)行的操作,從而可以確定需要觸發(fā)的操作事件。例如,網(wǎng)標(biāo)識信息中包含的特定代碼表示點(diǎn)擊進(jìn)入,此時(shí)可以確定需要觸發(fā)的操作事件為模擬點(diǎn)擊鏈接。

203、對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取需要觸發(fā)的事件的觸發(fā)狀態(tài)信息。

在確定需要觸發(fā)的操作事件后,為了避免用戶不操作或漏操作,導(dǎo)致獲取的網(wǎng)頁的數(shù)據(jù)不全面,提高獲取網(wǎng)頁的數(shù)據(jù)的效率,本發(fā)明實(shí)施例可以利用智能交互系統(tǒng)去模擬用戶的觸發(fā)操作,從而使各需要觸發(fā)的事件對應(yīng)的調(diào)用函數(shù)被執(zhí)行,得到各調(diào)用函數(shù)返回的數(shù)據(jù),確定對需要觸發(fā)的事件執(zhí)行模擬操作后的觸發(fā)狀態(tài)信息。

例如,每個調(diào)用函數(shù)可以返回邏輯值“0”或“1”,也可以返回字符串類型“是”或“否”等,本發(fā)明實(shí)施例不做具體限制。在一個具體實(shí)現(xiàn)過程中,若調(diào)用函數(shù)返回“0”或者“否”,可以確定該調(diào)用函數(shù)雖然被模擬操作了,但其并未被觸發(fā),其觸發(fā)狀態(tài)信息為未觸發(fā);若調(diào)用函數(shù)返回“1”或“是”,可以確定該調(diào)用函數(shù)被模擬操作后被觸發(fā)了,其觸發(fā)狀態(tài)信息為已觸發(fā)。

在一個具體實(shí)現(xiàn)過程中,對于同一類型的網(wǎng)頁,病毒,木馬,廣告等惡意程序可能針對的事件是比較固定的,因此,為了提高漏洞掃描器的工作效率,本發(fā)明實(shí)施例可以針對不同的網(wǎng)頁的類型預(yù)先設(shè)置不同的觸發(fā)策略,根據(jù)預(yù)設(shè)的觸發(fā)策略,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,而省去一些不必要的模擬觸發(fā)操作。本發(fā)明實(shí)施例中為了與后續(xù)描述區(qū)分開,根據(jù)網(wǎng)頁的類型確定的觸發(fā)策略可以定義為第一觸發(fā)策略。

例如,在沙箱中對網(wǎng)頁的源代碼分析時(shí),可以根據(jù)網(wǎng)頁的源代碼確定該網(wǎng)頁的類型,從預(yù)先設(shè)置不同的第一觸發(fā)策略中,獲取該類型的網(wǎng)頁的第一觸發(fā)策略之后,可以根據(jù)該第一觸發(fā)策略,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,例如,針對網(wǎng)銀類、購物類網(wǎng)頁而言,用戶輸入賬號信息、密碼、驗(yàn)證碼等為必須需要觸發(fā)的事件,惡意程序主要針對這些需要觸發(fā)的事件進(jìn)行攻擊等,此時(shí)第一觸發(fā)策略可以包括這些事件進(jìn)行模擬觸發(fā)操作即可,而其它的事件可以選擇性忽略,這樣提高了漏洞掃描器的工作效率。而對于一些新聞類網(wǎng)頁而言,一般不會設(shè)置用戶輸入賬號信息、密碼、驗(yàn)證碼等事件,大多為頁面類的彈廣告事件,此時(shí)第一觸發(fā)策略可以包括對彈出的廣告進(jìn)行模擬點(diǎn)擊鏈接操作即可。

同理,每個網(wǎng)頁的防護(hù)需求信息是不同的,為了提高漏洞掃描器的工作效率,同樣可以針對不同網(wǎng)頁的防護(hù)需求信息預(yù)先設(shè)置不同的觸發(fā)策略,根據(jù)預(yù)設(shè)的觸發(fā)策略,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,而省去一些不必要的模擬觸發(fā)操作。本發(fā)明實(shí)施例中,根據(jù)不同網(wǎng)頁的防護(hù)需求信息預(yù)先設(shè)置不同的觸發(fā)策略可以定義為第二觸發(fā)策略。

需要說明的是,其實(shí)現(xiàn)機(jī)制與根據(jù)網(wǎng)頁的類型確定的第一觸發(fā)策略,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作的實(shí)現(xiàn)機(jī)制相同,詳細(xì)請參考上述相關(guān)記載在此不再贅述。

應(yīng)當(dāng)理解的是,盡管在本發(fā)明實(shí)施例中可能采用術(shù)語第一、第二等描述觸發(fā)策略,但這些觸發(fā)策略不應(yīng)限于這些術(shù)語,這些術(shù)語僅用來將觸發(fā)策略彼此區(qū)分開。例如在不脫離本發(fā)明實(shí)施例范圍的情況下,第一觸發(fā)策略也可以被稱為第二觸發(fā)策略,同理第二觸發(fā)策略也可以被稱為第一觸發(fā)策略。

204、根據(jù)獲取的需要觸發(fā)的事件的觸發(fā)狀態(tài)信息,確定其中被觸發(fā)的事件。

不同事件雖然被模擬觸發(fā)操作,但可能存在觸發(fā)不成功的事件,因此根據(jù)獲取的需要觸發(fā)的事件的觸發(fā)狀態(tài)信息,確定其中被觸發(fā)的事件,并對未被觸發(fā)的事件進(jìn)行再次觸發(fā),以使其被成功觸發(fā)。例如,在對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作之后,事件a、事件b、和事件c分別對應(yīng)的調(diào)用函數(shù)返回邏輯值“1”,而事件d對應(yīng)的調(diào)用函數(shù)返回值為邏輯值“0”,則可以確定事件a、事件b、和事件c為被觸發(fā)的事件。

205、獲取被觸發(fā)的事件對應(yīng)的鏈接信息。

每個事件都存對應(yīng)一個鏈接,當(dāng)事件被觸發(fā)后,會生成相應(yīng)的鏈接信息,進(jìn)而可以獲取被觸發(fā)的事件對應(yīng)的鏈接信息。

206、向爬蟲引擎發(fā)送該鏈接信息,以使爬蟲引擎根據(jù)該鏈接信息獲取網(wǎng)頁的數(shù)據(jù)。

獲取網(wǎng)頁的數(shù)據(jù)最基本的是要知道網(wǎng)頁對應(yīng)的鏈接信息,因此在生成需要觸發(fā)的事件對應(yīng)的鏈接信息之后,需要向爬蟲引擎發(fā)送該鏈接信息,爬蟲接收到該鏈接信息后,進(jìn)而獲得網(wǎng)頁的數(shù)據(jù)。例如,網(wǎng)頁當(dāng)前頁面的內(nèi)容、網(wǎng)頁后臺數(shù)據(jù)等。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法,有針對性的自動觸發(fā)需要觸發(fā)的事件,獲取的網(wǎng)頁數(shù)據(jù)更快捷,效率更高而提高了爬蟲引擎的質(zhì)量,使漏洞掃描器發(fā)現(xiàn)漏洞更及時(shí)。

進(jìn)一步地,為了更加及時(shí)有效的發(fā)現(xiàn)可疑的惡意程序,在執(zhí)行上述實(shí)施例中的步驟203中“對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作”時(shí),可以確定需要觸發(fā)的每個事件的優(yōu)先級;并根據(jù)需要觸發(fā)的每個事件的優(yōu)先級的順序,依次對需要觸發(fā)的每個事件進(jìn)行模擬觸發(fā)操作。

在一個具體實(shí)現(xiàn)過程中,攻擊網(wǎng)頁的病毒,木馬,廣告等惡意程序可能不同,惡意程序?qū)?yīng)的事件可能不同,因此可以根據(jù)實(shí)際經(jīng)驗(yàn)對需要觸發(fā)的事件設(shè)置觸發(fā)優(yōu)先級。例如,可以根據(jù)實(shí)際經(jīng)驗(yàn)針對常見的一些事件設(shè)置不同的權(quán)重值,對于可能出現(xiàn)的新事件統(tǒng)一設(shè)置一個權(quán)重值,使該權(quán)重值大于常見事件的權(quán)重值,并按照權(quán)重值由大到小的順序進(jìn)行排列,得到需要觸發(fā)的事件對應(yīng)的觸發(fā)優(yōu)先級,在確定出需要觸發(fā)的操作的每個事件之后,可以根據(jù)得到的觸發(fā)優(yōu)先等級,依次對需要觸發(fā)的每個事件進(jìn)行模擬觸發(fā)操作。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取方法,實(shí)現(xiàn)了根據(jù)需要觸發(fā)的事件的優(yōu)先級,自動觸發(fā)需要觸發(fā)的事件,獲取的網(wǎng)頁數(shù)據(jù)更全面,效率更高,進(jìn)而提高了爬蟲引擎的質(zhì)量,使漏洞掃描器發(fā)現(xiàn)漏洞的概率增大,發(fā)現(xiàn)漏洞更及時(shí)。

實(shí)施例三

圖3為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置實(shí)施例一的結(jié)構(gòu)示意圖,如圖3所示,本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置可以包括確定模塊10、智能交互模塊11和發(fā)送模塊12。

在一個具體實(shí)現(xiàn)過程中,各模塊之間可以實(shí)現(xiàn)數(shù)據(jù)交互。

確定模塊10,用于當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),根據(jù)網(wǎng)頁的源代碼,確定需要觸發(fā)的事件。

智能交互模塊11,用于對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息。

本發(fā)明實(shí)施例中,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作可以包括但不限制:對需要觸發(fā)的事件進(jìn)模擬點(diǎn)擊鏈接操作,和/或,對需要觸發(fā)的事件進(jìn)模擬拖動圖層操作,和/或,對需要觸發(fā)的事件進(jìn)模擬滑動鼠標(biāo)操作,和/或,對需要觸發(fā)的事件進(jìn)模擬填寫表單操作。

發(fā)送模塊12,用于向爬蟲引擎發(fā)送鏈接信息,以使爬蟲引擎根據(jù)鏈接信息獲取網(wǎng)頁的數(shù)據(jù)。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置,通過采用上述各模塊實(shí)現(xiàn)獲取網(wǎng)頁的數(shù)據(jù)的實(shí)現(xiàn)機(jī)制與上述圖1所示實(shí)施例的實(shí)現(xiàn)機(jī)制相同,詳細(xì)可以參考上述圖1所示實(shí)施例的記載,在此不再贅述。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置,當(dāng)網(wǎng)頁載入沙箱后,在預(yù)設(shè)時(shí)間段內(nèi),通過上述各模塊能夠根據(jù)網(wǎng)頁的源代碼,確定需要觸發(fā)的事件,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作,獲取被觸發(fā)的事件對應(yīng)的鏈接信息,向爬蟲引擎發(fā)送鏈接信息,以使爬蟲引擎根據(jù)鏈接信息獲取網(wǎng)頁的數(shù)據(jù),實(shí)現(xiàn)了自動觸發(fā)需要觸發(fā)的事件,獲取的網(wǎng)頁數(shù)據(jù)更全面,效率更高,進(jìn)而提高了爬蟲引擎的質(zhì)量,使漏洞掃描器發(fā)現(xiàn)漏洞的概率增大。

實(shí)施例四

圖4為本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置實(shí)施例二的結(jié)構(gòu)示意圖,如圖4所示,本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置在圖3所示實(shí)施例的基礎(chǔ)上,進(jìn)一步還可以包括獲取模塊13。

獲取模塊13,還用于獲取網(wǎng)頁的源代碼。

確定模塊10,具體用于:

對源代碼進(jìn)行解析,獲取源代碼中每個操作事件的標(biāo)識信息;

根據(jù)標(biāo)識信息,確定需要觸發(fā)的操作事件。

智能交互模塊11,具體用于:

根據(jù)網(wǎng)頁的類型確定第一觸發(fā)策略;

根據(jù)第一觸發(fā)策略,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作;或者,

根據(jù)網(wǎng)頁的安全防護(hù)需求信息確定第二觸發(fā)策略;

根據(jù)第二觸發(fā)策略,對需要觸發(fā)的事件進(jìn)行模擬觸發(fā)操作。

在一個具體實(shí)現(xiàn)過程中,智能交互模塊11,還可以用于:

確定需要觸發(fā)的每個事件的優(yōu)先級;

根據(jù)需要觸發(fā)的每個事件的優(yōu)先級的順序,依次對需要觸發(fā)的每個事件進(jìn)行模擬觸發(fā)操作。

獲取模塊13,用于獲取需要觸發(fā)的事件的觸發(fā)狀態(tài)信息。

確定模塊10,還用于根據(jù)獲取的需要觸發(fā)的事件的觸發(fā)狀態(tài)信息,確定其中被觸發(fā)的事件。

本發(fā)明實(shí)施例的數(shù)據(jù)的獲取裝置,通過采用上述各模塊實(shí)現(xiàn)獲取網(wǎng)頁的數(shù)據(jù)的實(shí)現(xiàn)機(jī)制與上述圖2所示實(shí)施例的實(shí)現(xiàn)機(jī)制相同,詳細(xì)可以參考上述圖2所示實(shí)施例的記載,在此不再贅述。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲器中,使得存儲在該計(jì)算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

在一個典型的配置中,計(jì)算設(shè)備包括一個或多個處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。

內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲器(rom)或閃存(flashram)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。

計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲器(sram)、動態(tài)隨機(jī)存取存儲器(dram)、其他類型的隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號和載波。

還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。

本領(lǐng)域技術(shù)人員應(yīng)明白,本發(fā)明實(shí)施例的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明實(shí)施例可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明實(shí)施例可采用在一個或多個其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

以上所述僅為本申請的實(shí)施例而已,并不用于限制本申請。對于本領(lǐng)域技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的權(quán)利要求范圍之內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
兴仁县| 柏乡县| 桃园市| 苏尼特右旗| 宜兰市| 铁岭县| 连州市| 翼城县| 松溪县| 岚皋县| 盖州市| 松江区| 丹巴县| 进贤县| 盘山县| 通河县| 西畴县| 锡林浩特市| 如东县| 沂水县| 蓬溪县| 大理市| 成安县| 苏州市| 诏安县| 平潭县| 四川省| 泌阳县| 固原市| 文山县| 秭归县| 阿荣旗| 洪雅县| 通辽市| 白水县| 玉环县| 含山县| 漳浦县| 堆龙德庆县| 邢台县| 海丰县|