專利名稱:一種文件快速掃描方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別是涉及一種文件快速掃描方法和系統(tǒng)。
背景技術(shù):
隨著計(jì)算機(jī)的普及,用戶端基本上都需要安裝殺毒軟件對(duì)計(jì)算機(jī)內(nèi)的文件進(jìn)行掃描。在殺毒軟件進(jìn)行掃描時(shí),需要大量的CPU運(yùn)算和磁盤操作,使得掃描過程漫長(zhǎng)而且影響系統(tǒng)速度。而對(duì)于計(jì)算機(jī)里的文件,有很多文件都是相同的,比如Windows的文件,很多軟件的安裝包文件,幫助文件,壓縮文件等?,F(xiàn)有技術(shù)中,用戶端的殺毒軟件第一次掃描時(shí)會(huì)全盤掃描計(jì)算機(jī)內(nèi)的所有文件, 并且會(huì)掃描文件中的各種內(nèi)容,如果對(duì)于包括內(nèi)容比較大的文件,其掃描的時(shí)間耗費(fèi)的相當(dāng)多,從而導(dǎo)致第一次掃描的時(shí)間非常的長(zhǎng)。比如對(duì)于壓縮包,現(xiàn)有技術(shù)會(huì)按照正常的掃描流程將壓縮包中的內(nèi)容解壓逐個(gè)進(jìn)行掃描,以保證文件是安全的,這樣對(duì)于一個(gè)壓縮包來說,現(xiàn)有技術(shù)的掃描時(shí)間比較長(zhǎng),從而延長(zhǎng)了整個(gè)掃描的時(shí)間,而對(duì)于用戶來說,由于長(zhǎng)時(shí)間的掃描而長(zhǎng)時(shí)間占用的CPU運(yùn)算和磁盤操作影響了系統(tǒng)的速度,從而影響的用戶對(duì)計(jì)算機(jī)的使用。
發(fā)明內(nèi)容
本申請(qǐng)所要解決的技術(shù)問題是提供一種文件快速掃描方法和系統(tǒng),解決了新的用戶端第一次掃描時(shí)間比較長(zhǎng)的問題。為了解決上述問題,本申請(qǐng)公開了一種文件快速掃描方法,包括獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息;逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。優(yōu)選的,所述特征信息通過統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征息獲得。優(yōu)選的,通過如下步驟統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得所述特征信息接收各用戶端發(fā)送的安全文件的特征信息;所述特征信息包括用戶端完整掃描文件時(shí),確定安全的文件的特征信息;對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù);提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息。優(yōu)選的,在用戶端完整掃描文件時(shí)當(dāng)所述掃描的文件安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息;
將文件名進(jìn)行循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值;將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,得到內(nèi)容匹配信息;將包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息進(jìn)行發(fā)送。優(yōu)選的,對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù)將接收的特征信息按總重復(fù)次數(shù)進(jìn)行排序;對(duì)于各相同特征信息,將屬于同一個(gè)用戶端發(fā)送的相同特征消息進(jìn)行消重運(yùn)算;針對(duì)消重后的各相同特征信息,統(tǒng)計(jì)各特征消息的重復(fù)次數(shù)。優(yōu)選的,在提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息之后包括將所述提取出來的特征信息存入數(shù)據(jù)文件,并依據(jù)所述數(shù)據(jù)文件生成數(shù)據(jù)包。優(yōu)選的,在所述數(shù)據(jù)包生成之前還包括接收用戶端發(fā)送的不安全文件的特征信息,不將該特征信息存入數(shù)據(jù)文件或者將數(shù)據(jù)包中與該特征信息相同的特征信息進(jìn)行刪除。優(yōu)選的,在生成上一個(gè)數(shù)據(jù)包后,當(dāng)統(tǒng)計(jì)到新的安全文件的特征信息后,更新至上一個(gè)數(shù)據(jù)包。優(yōu)選的,通過如下方法將所述文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配在緩存中從匹配效率最高的特征信息開始進(jìn)行匹配。優(yōu)選的,當(dāng)文件大小和文件修改時(shí)間與數(shù)據(jù)庫中的一條特征信息匹配時(shí),則將文件名進(jìn)行所述循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值,并將所述文件名CRC值與該條特征信息的文件名CRC值進(jìn)行匹配;當(dāng)所述文件名CRC值與該條特征信息的文件名CRC值匹配時(shí),則將文件內(nèi)容描述信息進(jìn)行所述消息摘要算法計(jì)算,得到內(nèi)容匹配信息,并將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配。優(yōu)選的,當(dāng)?shù)谝挥脩舳诉M(jìn)行第一次掃描時(shí),提示第一用戶端是否選擇快速掃描,如果選擇則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。優(yōu)選的,在第一用戶端進(jìn)行掃描時(shí),將當(dāng)次掃描結(jié)果中安全文件的特征信息存入所述數(shù)據(jù)包的安全文件信息列表;當(dāng)?shù)谝挥脩舳讼乱淮芜M(jìn)行掃描時(shí)根據(jù)上一次掃描后的記錄進(jìn)行掃描。相應(yīng)的,本申請(qǐng)還公開了一種文件快速掃描系統(tǒng),包括第一用戶端,所述第一用戶端包括獲取模塊,用于獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息;掃描匹配模塊,用于逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。優(yōu)選的,還包括第二用戶端群和處理中心服務(wù)器;所述處理中心服務(wù)器用于統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得所述數(shù)據(jù)包中的特征信息;所述第二用戶端群用于發(fā)送的安全文件的特征信息。優(yōu)選的,所述的處理中心服務(wù)器包括特征信息模塊,用于接收各用戶端發(fā)送的安全文件的特征信息;所述特征信息包括用戶端完整掃描文件時(shí),確定安全的文件的特征信息;統(tǒng)計(jì)模塊,用于對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù);提取模塊,用于提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息。優(yōu)選的,所述第二用戶端群的各用戶端包括特征信息獲取單元,用于當(dāng)掃描的文件安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息;文件名計(jì)算單元,用于將文件名進(jìn)行循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值;內(nèi)容描述信息計(jì)算單元,用于將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,得到內(nèi)容匹配信息;特征信息發(fā)送單元,用于將包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息進(jìn)行發(fā)送。優(yōu)選的,所述統(tǒng)計(jì)模塊包括排序單元,用于將接收的特征信息按總重復(fù)次數(shù)進(jìn)行排序;消重單元,用于對(duì)于各相同特征信息,將屬于同一個(gè)用戶端發(fā)送的相同特征消息進(jìn)行消重運(yùn)算;統(tǒng)計(jì)單元,用于針對(duì)消重后的各相同特征信息,統(tǒng)計(jì)各特征消息的重復(fù)次數(shù)。優(yōu)選的,在提取模塊之后還包括生成單元,用于將所述提取出來的特征信息存入數(shù)據(jù)文件,并依據(jù)所述數(shù)據(jù)文件生成數(shù)據(jù)包。優(yōu)選的,在所述數(shù)據(jù)包生成之前還包括去除單元,用于接收用戶端發(fā)送的不安全文件的特征信息,不將該特征信息存入數(shù)據(jù)文件或者將數(shù)據(jù)包中與該特征信息相同的特征信息進(jìn)行刪除。優(yōu)選的,還包括更新模塊,用于在生成上一個(gè)數(shù)據(jù)包后,當(dāng)統(tǒng)計(jì)到新的安全文件的特征信息后,更新至上一個(gè)數(shù)據(jù)包。優(yōu)選的,通過如下方法將所述文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配在緩存中從匹配效率最高的特征信息開始進(jìn)行匹配。優(yōu)選的,當(dāng)文件大小和文件修改時(shí)間與數(shù)據(jù)庫中的一條特征信息匹配時(shí),則將文件名進(jìn)行所述循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值,并將所述文件名CRC值與該條特征信息的文件名CRC值進(jìn)行匹配;當(dāng)所述文件名CRC值與該條特征信息的文件名CRC值匹配時(shí),則將文件內(nèi)容描述信息進(jìn)行所述消息摘要算法計(jì)算,得到內(nèi)容匹配信息,并將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配。優(yōu)選的,還包括
7
提醒模塊,用于當(dāng)?shù)谝淮螔呙钑r(shí),提示第一用戶端是否選擇快速掃描,如果選擇則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。優(yōu)選的,還包括更新記錄模塊,用于在第一用戶端進(jìn)行掃描時(shí),將當(dāng)次掃描結(jié)果中安全文件的特征信息存入所述數(shù)據(jù)包的安全文件信息列表;當(dāng)?shù)谝挥脩舳讼乱淮芜M(jìn)行掃描時(shí)根據(jù)上一次掃描后的安全記錄結(jié)果進(jìn)行掃描。與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)
占-
^ \\\ ·本申請(qǐng)通過利用包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息的數(shù)據(jù)包,新的用戶在第一次掃描時(shí),如果掃描到與所述數(shù)據(jù)包中特征信息相同的文件時(shí)就可以跳過其代表的時(shí)間長(zhǎng)、并且安全的文件,可減少首次掃描的時(shí)間。
圖I是本申請(qǐng)一種文件快速掃描方法的流程示意圖;圖2是本申請(qǐng)優(yōu)選的一種數(shù)據(jù)包生成方法的流程示意圖;圖3是一種壓縮包頭部數(shù)據(jù)的示例;圖4是本申請(qǐng)一種文件快速掃描系統(tǒng)的結(jié)構(gòu)示意圖;圖5是本申請(qǐng)優(yōu)選的一種文件快速掃描系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說明。在實(shí)際中,對(duì)于處于一定數(shù)量級(jí)(比如IO5)以上的用戶端來說,如果在該數(shù)量級(jí)以上的用戶端都對(duì)具有同樣的特征(比如包括文件名、文件大小、文件修改時(shí)間、文件內(nèi)容描述信息、內(nèi)容信息等)的文件進(jìn)行掃描時(shí),如果該種文件是安全的,那么其他用戶在使用具有同樣特征的文件基本上也是安全的。本申請(qǐng)即根據(jù)該種特性統(tǒng)計(jì)巨量用戶對(duì)完整掃描耗時(shí)比較長(zhǎng),并且安全的文件的特信息,然后基于所述特征信息生成待匹配的數(shù)據(jù)包(升級(jí)補(bǔ)丁等),用戶在使用所述數(shù)據(jù)包后,可掃描文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配,如果匹配上,那么即可跳過這些正常掃描時(shí)間比較長(zhǎng)的文件,從而可達(dá)到節(jié)省掃描時(shí)間的目的。參照?qǐng)D1,其示出了本申請(qǐng)一種文件快速掃描方法的流程示意圖,包括步驟110,獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息。新的用戶端首先獲取包括安全特征信息的數(shù)據(jù)包,然后新的用戶端則可根據(jù)該數(shù)據(jù)包進(jìn)行掃描,以節(jié)省第一次掃描的時(shí)間。其中新的用戶端在本申請(qǐng)中采用第一用戶端進(jìn)行描述,所述第一用戶端主要包括未安裝殺毒軟件的用戶端和安裝過殺毒軟件但未進(jìn)行過全盤文件掃描的用戶端,還可以包括安裝過殺毒軟件并且進(jìn)行過全盤文件掃描的用戶端, 但在最近一次進(jìn)行全盤文件掃描后用戶端中出現(xiàn)了新的未掃描過的文件的用戶端。第一用戶端可通過安裝存入所述數(shù)據(jù)包的安裝包,或者將已安裝的殺毒軟件升級(jí)獲取所述的數(shù)據(jù)包。在實(shí)際中,第一用戶端可能完全沒有進(jìn)行過掃描,也可能在使用過程中可能會(huì)獲取到很多新的文件,而這些文件用戶端也可能沒有進(jìn)行完整掃描,當(dāng)該用戶端想
8進(jìn)行快速掃描時(shí),則可通過本申請(qǐng)的數(shù)據(jù)包進(jìn)行。其中,所述數(shù)據(jù)包中的確定系統(tǒng)中文件為安全文件的特征信息可通過統(tǒng)計(jì)各用戶端的完整掃描結(jié)果獲得。比如,對(duì)于多個(gè)用戶進(jìn)行完整掃描的結(jié)果,對(duì)于在各用戶端中具有相同特征信息(比如文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息等特征信息) 的文件,如果各用戶端對(duì)該文件的掃描結(jié)果均安全,那么即可將該特征信息存入所述數(shù)據(jù)包,用于確定系統(tǒng)中具有該特征信息的文件為安全文件。優(yōu)選的,所述特征信息通過統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得。即對(duì)于各用戶端進(jìn)行完整掃描得到的確認(rèn)安全的文件的特征信息,處理中心服務(wù)器自動(dòng)對(duì)其進(jìn)行統(tǒng)計(jì)和分析,可將大于一定數(shù)量閾值的特征信息生成相應(yīng)的數(shù)據(jù)包。 在本申請(qǐng)中,首先需要生成數(shù)據(jù)包,參照?qǐng)D2,示出了本申請(qǐng)優(yōu)選的一種數(shù)據(jù)包生成方法的流程示意圖,包括步驟210,接收各用戶端發(fā)送的安全文件的特征信息;所述特征信息包括用戶端完整掃描文件時(shí),確定安全的文件的特征信息。在實(shí)際中,存在第二用戶端群,其中包括了大量用戶端,這些用戶端都都可將對(duì)自己系統(tǒng)中的文件進(jìn)行完整掃描后的符合條件的特征信息發(fā)送至處理中心服務(wù)器中。即當(dāng)?shù)诙脩舳巳旱母饔脩舳诉x擇完整掃描其計(jì)算機(jī)中的文件時(shí),會(huì)將掃描耗時(shí)大于或大于等于一定時(shí)間閾值的安全文件的特征信息發(fā)送到處理中心服務(wù)器。在實(shí)際中,本申請(qǐng)通過對(duì)巨量的用戶端掃描正常的掃描耗時(shí)較長(zhǎng)的文件的特征信息進(jìn)行統(tǒng)計(jì),然后基于大于或大于等于閾值的對(duì)應(yīng)文件的特征信息生成待匹配的數(shù)據(jù)包, 然后新的用戶在第一次掃描時(shí),如果掃描到與所述數(shù)據(jù)包中特征信息相同的文件時(shí)就可以跳過其代表的時(shí)間長(zhǎng)、并且安全的文件,可減少首次掃描的時(shí)間。優(yōu)選的,在用戶端完整掃描文件時(shí)所述的完整掃描為用戶端系統(tǒng)中各文件的全部?jī)?nèi)容進(jìn)行殺毒掃描。步驟S11,當(dāng)所述掃描的文件安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息。用戶端選擇完整掃描文件時(shí),掃描引擎逐個(gè)掃描用戶端計(jì)算機(jī)中的各個(gè)文件,對(duì)于很多文件,比如對(duì)于壓縮包,掃描引擎需要按照壓縮包的要求在引擎中先解壓,再對(duì)壓縮包中的包括的各個(gè)文件進(jìn)行殺毒掃描,一般情況下,這種掃描方式需要的時(shí)間相當(dāng)?shù)亩?;又比如?duì)于軟件的安裝包,掃描引擎也需要將安裝包中的信息解壓出來再進(jìn)行掃描,同樣需要耗費(fèi)相當(dāng)多的時(shí)間。那么當(dāng)用戶端掃描整個(gè)文件花費(fèi)的時(shí)間大于或者大于等于閾值時(shí), 則可獲取當(dāng)前文件的特征信息所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息。當(dāng)所述掃描時(shí)間大于或大于等于時(shí)間閾值并安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息。其中,計(jì)算用戶端對(duì)于一個(gè)文件的掃描時(shí)間時(shí),可根據(jù)開始掃描文件時(shí)和結(jié)束掃描文件時(shí)的時(shí)間點(diǎn),調(diào)用系統(tǒng) API函數(shù)GetTickCount計(jì)算從開始掃描文件和結(jié)束掃描文件時(shí)的掃描時(shí)間。比如開始掃描文件時(shí)間點(diǎn)為,2012年I月17日星期二 21時(shí)50分30秒和00毫秒,結(jié)束掃描文件時(shí)時(shí)間點(diǎn)為2012年I月17日星期二 21時(shí)51分30秒和00毫秒,那么用戶端對(duì)于當(dāng)前文件的掃描時(shí)間即為I分鐘。如果設(shè)置時(shí)間閾值為30秒,那么對(duì)于該文件來說,用戶端即獲取該文件的特征信息,包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息。其中文件內(nèi)容描述信息只占整個(gè)文件的很小一部分,當(dāng)用戶端掃描文件內(nèi)容描述信息部分時(shí),所耗費(fèi)時(shí)間遠(yuǎn)遠(yuǎn)小于掃描整個(gè)文件的時(shí)間。比如對(duì)于壓縮文件,其文件內(nèi)容描述信息在壓縮包頭部數(shù)據(jù)中,掃描時(shí)可根據(jù)頭部數(shù)據(jù)告知的當(dāng)前文件內(nèi)容描述信息占用的字節(jié)數(shù),用戶端只需要掃描當(dāng)前文件頭部數(shù)據(jù)所在字節(jié)地址空間即可,參照?qǐng)D3,其為一種壓縮包的頭部數(shù)據(jù)示例,在壓縮包的頭部數(shù)據(jù)中描述了壓縮包內(nèi)的文件信息(文件名、大小、數(shù)據(jù)校驗(yàn)值等),只要這些關(guān)鍵數(shù)據(jù)沒有變化,就說明壓縮包內(nèi)容沒有變化。又比如對(duì)于軟件的安裝包,內(nèi)容描述信息在安裝包的尾部數(shù)據(jù)中,掃描時(shí)可根據(jù)文件告知的尾部數(shù)據(jù)占用的字節(jié)數(shù),掃描相應(yīng)字節(jié)地址空間即可。步驟S12,將文件名進(jìn)行循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值。由于文件名涉及用戶的隱私,本申請(qǐng)將文件名作一個(gè)循環(huán)冗余碼校驗(yàn)(CRC, Cyclical Redundancy Check)計(jì)算,得到一個(gè)無可讀性的文件名CRC值。步驟S13,將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,得到內(nèi)容匹配信息。對(duì)于文件內(nèi)容描述信息,相對(duì)整個(gè)文件來說,文件內(nèi)容描述信息雖然很小,但是如果以文件內(nèi)容描述信息本身去進(jìn)行匹配,則可能由于文件內(nèi)容描述信息龐大而導(dǎo)致時(shí)間相對(duì)較多,本申請(qǐng)則將文件內(nèi)容描述信息進(jìn)行消息摘要算法(Message-Digest Algorithm)計(jì)算,得到內(nèi)容匹配信息,一般本申請(qǐng)進(jìn)行MD5 (Message-Digest Algorithm 5,消息摘要算法第五版)計(jì)算,得到的內(nèi)容匹配信息為MD5值,通過MD5值進(jìn)行匹配時(shí)能大大減少匹配時(shí)間,保證快速的對(duì)比匹配,同時(shí)也保證了文件的安全性。步驟S14,將包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息進(jìn)行發(fā)送。在得到上述的包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息之后,即可將所述特征信息發(fā)送至處理中心服務(wù)器,等待處理中心服務(wù)器處理。本申請(qǐng)的應(yīng)用環(huán)境包括了提供殺毒軟件相關(guān)安裝包,升級(jí)包等數(shù)據(jù)的處理中心服務(wù)器,大量的通過網(wǎng)絡(luò)語處理中心服務(wù)器連接的用戶端,因此對(duì)于在線用戶對(duì)文件進(jìn)行的完整掃描工作,均可進(jìn)行上述步驟。步驟220,對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù)。在本步驟中,處理中心服務(wù)器會(huì)對(duì)收到的數(shù)據(jù)進(jìn)行去重運(yùn)算,即將相同客戶端發(fā)送的多個(gè)具有相同特征信息的數(shù)據(jù)去重,使其次數(shù)為I.優(yōu)選的,對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù)S21,將接收的特征信息按總重復(fù)次數(shù)進(jìn)行排序。首先將接收到的特征信息按總重復(fù)次數(shù)進(jìn)行排序,比如對(duì)于對(duì)應(yīng)某些用戶端文件的特征信息(m,100kb,2012/1/11/21:50:30:10,η)其中m為文件名CRC值,η為文件內(nèi)容描述信息的內(nèi)容匹配信息即MD5值,相應(yīng)的每條特征信息對(duì)應(yīng)一個(gè)發(fā)送該信息的用戶端,比如以對(duì)用戶端Α,其發(fā)送到處理中心服務(wù)器的信息可以A-(m,100kb, 2012/1/11/21:50:30:10,η)的形式表明。將處理中心服務(wù)器接收到的所有條具有相同(Α, lOOkb,2012/1/11/21:50:30:10,B)統(tǒng)計(jì)其重復(fù)總次數(shù),然后根據(jù)統(tǒng)計(jì)總次數(shù)進(jìn)行排序。在該次統(tǒng)計(jì)排序的過程中,能方便的找出相同用戶端發(fā)送的具有相同特征信息的數(shù)據(jù)。S22,對(duì)于各相同特征信息,將屬于同一個(gè)用戶端發(fā)送的相同特征消息進(jìn)行消重運(yùn)算。對(duì)于同一個(gè)客戶端發(fā)送的多個(gè)具有相同特征信息的數(shù)據(jù),比如客戶端A發(fā)送特征信息為(m, IOOkb, 2012/1/11/21:50:30:10, η)有10條,那么將其去重,使處理中心將該用戶端重復(fù)發(fā)送的(m, IOOkb,2012/1/11/21:50:30:10,η)特征信息記為I次。如此可以保證對(duì)于某個(gè)特征信息進(jìn)行統(tǒng)計(jì)時(shí)用戶數(shù)量的準(zhǔn)確性,保證本申請(qǐng)的有效性。S23,針對(duì)消重后的各相同特征信息,統(tǒng)計(jì)各特征消息的重復(fù)次數(shù)。再去重后,可統(tǒng)計(jì)各特征消息的重復(fù)次數(shù),該次數(shù)與掃描得到該特征信息的用戶端數(shù)量一致。本申請(qǐng)還可通過其他方法進(jìn)行消重運(yùn)算,統(tǒng)計(jì)各個(gè)文件特征信息的重復(fù)次數(shù),對(duì)此本申請(qǐng)不對(duì)其加以限制。步驟230,提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息。在得到特征信息的重復(fù)次數(shù)以后,將重復(fù)次數(shù)與數(shù)量閾值進(jìn)行比較,如果所述重復(fù)次數(shù)大于閾值,則將其存入數(shù)據(jù)文件。比如對(duì)于前述(m,lOOkb,2012/1/11/21:50:30:10, η)特征信息的重復(fù)次數(shù)為15萬,而閾值設(shè)置為10萬,那么可將該特征信息數(shù)據(jù)提取。步驟240,將所述提取出來的特征信息存入數(shù)據(jù)文件,并依據(jù)所述數(shù)據(jù)文件生成數(shù)據(jù)包。在本申請(qǐng)中數(shù)據(jù)文件可以中的數(shù)據(jù)可以列表的形式存在,每條特征信息包括多個(gè)維度,比如對(duì)于(m,lOOkb,2012/1/11/21:50:30:10,η),則列表中該條特征信息包括四個(gè)維度,分別為文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息。然后在后續(xù)掃描匹配時(shí)以此四個(gè)維度進(jìn)行匹配。對(duì)于生成的數(shù)據(jù)文件,可以打包到殺毒軟件的安裝包,也可以生成升級(jí)補(bǔ)丁的形式。另外,在所述數(shù)據(jù)包生成之前還包括步驟S210,接收用戶端發(fā)送的不安全文件的特征信息,不將該特征信息存入數(shù)據(jù)文件或者將數(shù)據(jù)包中與該特征信息相同的特征信息進(jìn)行刪除。用戶端對(duì)于完整掃描時(shí)間大于閾值的出現(xiàn)了病毒的文件,也會(huì)將該不安全文件的特征信息標(biāo)記為不安全,再發(fā)送至處理中心服務(wù)器中,處理中心服務(wù)器對(duì)于具有該特征信息的所有條數(shù)據(jù)可均不進(jìn)行處理,也不存入數(shù)據(jù)文件。比如有5萬個(gè)用戶端發(fā)送了前述(m, IOOkb, 2012/1/11/21:50:30:10, η)特征信息的數(shù)據(jù),但其中一個(gè)用戶端發(fā)送的該特征信息的數(shù)據(jù)標(biāo)識(shí)為不安全,即發(fā)現(xiàn)病毒,則處理中心服務(wù)器則可不對(duì)具有 (m, IOOkb, 2012/1/11/21:50:30:10, η)特征信息的數(shù)據(jù)進(jìn)行處理,不將包括(m,lOOkb, 2012/1/11/21:50:30:10,η)的特征信息存入數(shù)據(jù)包中。另外,在實(shí)際中,處理中心服務(wù)器在對(duì)各用戶端發(fā)送的特征信息進(jìn)行統(tǒng)計(jì)時(shí),一般以一定時(shí)間長(zhǎng)度為周期進(jìn)行統(tǒng)計(jì),并在對(duì)該周期的統(tǒng)計(jì)結(jié)果生成安全文件的特性信息的數(shù)據(jù)包。比如處理中心服務(wù)器以天為時(shí)間單位對(duì)各用戶端發(fā)送的特征信息數(shù)據(jù)進(jìn)行統(tǒng)計(jì),然后生成數(shù)據(jù)包,可提供給下一周期的第一用戶端使用。步驟120,逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。
比如對(duì)文件內(nèi)容中包括的惡意代碼或者病毒等進(jìn)行殺毒掃描。在獲取到所述數(shù)據(jù)后,則可進(jìn)行快速掃描步驟S121,第一用戶端的系統(tǒng)逐個(gè)掃描系統(tǒng)中文件的特征信息;步驟S122,將當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息進(jìn)行匹配;若匹配時(shí),則轉(zhuǎn)入步驟S123,跳過當(dāng)前的文件,繼續(xù)掃描下一個(gè)文件;若不匹配時(shí),則轉(zhuǎn)入步驟S124,對(duì)當(dāng)前文件進(jìn)行完整的殺毒掃描,即掃描當(dāng)前文件的所有內(nèi)容。在實(shí)際中,在第一用戶端進(jìn)行掃描之前還包括確認(rèn)是否選擇快速掃描,如果是, 則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。即第一用戶端可以選擇進(jìn)行快速掃描或者是對(duì)文件的完整掃描,如果選擇快速掃描,則可掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配進(jìn)行特征信息的匹配。當(dāng)所述文件的特征信息與所述數(shù)據(jù)包中的特征信息匹配時(shí),則跳過當(dāng)前文件,繼續(xù)掃描下一個(gè)文件。在本申請(qǐng)中,當(dāng)?shù)谝淮螔呙钑r(shí),可提示第一用戶端是否選擇快速掃描,如果選擇則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。如果第一用戶端選擇進(jìn)行快速掃描,那么第一用戶端在掃描時(shí)則首先獲取第一用戶端文件的特征信息進(jìn)行匹配,而不用掃描文件的全部?jī)?nèi)容。在第一用戶端將所述文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配時(shí)在緩存中從匹配效率最高的特征信息開始進(jìn)行匹配。由于數(shù)據(jù)包中特征信息是多維的,在判定是否匹配時(shí),可以從效率最高的數(shù)據(jù)開始比較,比如不需要進(jìn)行而外計(jì)算的維度,例如文件大小和文件修改時(shí)間,因?yàn)槲募笮『托薷臅r(shí)間是在遍歷文件時(shí)即可獲得的系統(tǒng)數(shù)據(jù),不需要額外的運(yùn)算,那么如此操作可以提高預(yù)置緩存的比較匹配的效率。優(yōu)選的,在匹配時(shí)步驟S31,當(dāng)文件大小和文件修改時(shí)間與數(shù)據(jù)庫中的一條特征信息匹配時(shí),則將文件名進(jìn)行所述循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值,并將所述文件名CRC值與該條特征信息的文件名CRC值進(jìn)行匹配。其中,文件名的CRC運(yùn)算是內(nèi)存操作,數(shù)據(jù)量很小。在匹配時(shí),首先從匹配效率較高的維度進(jìn)行匹配,對(duì)于數(shù)據(jù)包中一條特征信息維度中,文件大小和文件修改時(shí)間不需要進(jìn)行額外計(jì)算,可直接進(jìn)行匹配,那么當(dāng)用戶端掃描時(shí),對(duì)于獲取到的特征信息的文件大小和文件修改時(shí)間,比如可首先比較文件大小,在比較文件修改時(shí)間。若當(dāng)前掃描的文件的文件大小和文件修改時(shí)間相同時(shí),則比較計(jì)算量相對(duì)較小的維度,比如通過CRC運(yùn)算計(jì)算文件名CRC值,然后將所述文件名CRC值與該條特征信息的文件名CRC值進(jìn)行匹配,如果未匹配上,則進(jìn)入完整掃描,如果匹配上,則進(jìn)入計(jì)算量相對(duì)較多的維度進(jìn)行匹配,比如轉(zhuǎn)入步驟S32。步驟S32,當(dāng)所述文件名CRC值與該條特征信息的文件名CRC值匹配時(shí),則將文件內(nèi)容描述信息進(jìn)行所述消息摘要算法計(jì)算,得到內(nèi)容匹配信息,并將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配。當(dāng)文件大小,文件修改時(shí)間和文件名CRC值都匹配上時(shí),則將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,一般是進(jìn)行MD5計(jì)算,得到文件內(nèi)容匹配信息,則將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配,當(dāng)匹配上,則跳過當(dāng)前的文件,轉(zhuǎn)入掃描下一個(gè)文件。在本申請(qǐng)中,匹配時(shí),如果對(duì)于特征信息中,有一個(gè)維度未匹配上,即表示該文件未匹配上,即可將該文件進(jìn)行殺毒掃描。比如前述的特征信息的四個(gè)維度文件大小,文件修改時(shí)間,文件名CRC值和內(nèi)容匹配信息,該四個(gè)維度的匹配順序?yàn)?、文件大小,2、文件修改時(shí)間,3、文件名CRC值4、內(nèi)容匹配信息;那么如果一個(gè)將文件A的文件大小與數(shù)據(jù)包中的特征信息的第一維度,即文件大小進(jìn)行匹配時(shí)未匹配上時(shí),可不用進(jìn)行2、3和4維度的匹配,即可文件A需要進(jìn)行殺毒掃描;如果文件A的文件大小匹配上,再將文件A的文件修改時(shí)間與數(shù)據(jù)包中的該條特征信息的第2維度,即文件修改時(shí)間進(jìn)行匹配時(shí)未匹配上,那么可不用進(jìn)行3和4維度的匹配,即可將文件A進(jìn)行殺毒掃描。其他情況可以依此類推。另外,在每次掃描時(shí),優(yōu)選的,在第一用戶端進(jìn)行掃描時(shí),將當(dāng)次掃描結(jié)果中安全文件的特征信息存入所述數(shù)據(jù)包的安全文件信息列表;當(dāng)?shù)谝挥脩舳讼乱淮芜M(jìn)行掃描時(shí)根據(jù)上一次掃描后的記錄進(jìn)行掃描。在第一用戶端結(jié)合當(dāng)前的數(shù)據(jù)包進(jìn)行掃描時(shí),對(duì)于特征信息未包含在數(shù)據(jù)包中的文件,如果當(dāng)次檢測(cè)安全,則可將其該安全文件的特征信息存入數(shù)據(jù)包的安全文件信息列表中,當(dāng)?shù)谝挥脩舳诉M(jìn)行下一次掃描時(shí),可根據(jù)上一次的掃描結(jié)果更為快速的進(jìn)行掃描。另外,當(dāng)用戶端對(duì)各文件進(jìn)行完整掃描時(shí),如果檢測(cè)到某個(gè)文件不安全,但該文件的特征信息又在數(shù)據(jù)包中,則可將其從數(shù)據(jù)包中的安全文件信息列表中刪除。相應(yīng)的,參照?qǐng)D4,本申請(qǐng)還公開了一種文件快速掃描系統(tǒng)的結(jié)構(gòu)示意圖,包括第一用戶端410,所述第一用戶端包括獲取模塊S411,用于獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息;掃描匹配模塊S412,用于逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。參照?qǐng)D5,其示出了本申請(qǐng)優(yōu)選的一種文件快速掃描系統(tǒng)的結(jié)構(gòu)示意圖,包括第一用戶端510,第二用戶端群520和處理中心服務(wù)器530 ;所述第一用戶端包括510 :獲取模塊S511,用于獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息;掃描匹配模塊S512,用于逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件;所述處理中心服務(wù)器530用于統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得所述數(shù)據(jù)包中的特征信息;所述第二用戶端群520用于發(fā)送的安全文件的特征信息。優(yōu)選的,所述的處理中心服務(wù)器包括特征信息模塊,用于接收各用戶端發(fā)送的安全文件的特征信息;所述特征信息包括用戶端完整掃描文件時(shí),確定安全的文件的特征信息;統(tǒng)計(jì)模塊,用于對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù);
提取模塊,用于提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息。優(yōu)選的,所述第二用戶端群的各用戶端包括特征信息獲取單元,用于當(dāng)掃描的文件安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息;文件名計(jì)算單元,用于將文件名進(jìn)行循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值;內(nèi)容描述信息計(jì)算單元,用于將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,得到內(nèi)容匹配信息;特征信息發(fā)送單元,用于將包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息進(jìn)行發(fā)送。優(yōu)選的,所述統(tǒng)計(jì)模塊包括排序單元,用于將接收的特征信息按總重復(fù)次數(shù)進(jìn)行排序;消重單元,用于對(duì)于各相同特征信息,將屬于同一個(gè)用戶端發(fā)送的相同特征消息進(jìn)行消重運(yùn)算;統(tǒng)計(jì)單元,用于針對(duì)消重后的各相同特征信息,統(tǒng)計(jì)各特征消息的重復(fù)次數(shù)。優(yōu)選的,在用戶端完整掃描文件時(shí)根據(jù)開始掃描文件時(shí)和結(jié)束掃描文件時(shí)的時(shí)間點(diǎn),調(diào)用系統(tǒng)API函數(shù) GetTickCount計(jì)算從開始掃描文件和結(jié)束掃描文件時(shí)的掃描時(shí)間。優(yōu)選的,在提取模塊之后還包括生成單元,用于將所述提取出來的特征信息存入數(shù)據(jù)文件,并依據(jù)所述數(shù)據(jù)文件生成數(shù)據(jù)包。優(yōu)選的,在所述數(shù)據(jù)包生成之前還包括去除單元,用于接收用戶端發(fā)送的不安全文件的特征信息,不將該特征信息存入數(shù)據(jù)文件或者將數(shù)據(jù)包中與該特征信息相同的特征信息進(jìn)行刪除。優(yōu)選的,通過如下方法將所述文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配在緩存中從匹配效率最高的特征信息開始進(jìn)行匹配。優(yōu)選的,當(dāng)文件大小和文件修改時(shí)間與數(shù)據(jù)庫中的一條特征信息匹配時(shí),則將文件名進(jìn)行所述循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值,并將所述文件名CRC值與該條特征信息的文件名CRC值進(jìn)行匹配;當(dāng)所述文件名CRC值與該條特征信息的文件名CRC值匹配時(shí),則將文件內(nèi)容描述信息進(jìn)行所述消息摘要算法計(jì)算,得到內(nèi)容匹配信息,并將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配。優(yōu)選的,還包括提醒模塊,用于當(dāng)?shù)谝淮螔呙钑r(shí),提示第一用戶端是否選擇快速掃描,如果選擇則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。優(yōu)選的,還包括更新記錄模塊,用于在第一用戶端進(jìn)行掃描時(shí),將當(dāng)次掃描結(jié)果中安全文件的特征信息存入所述數(shù)據(jù)包的安全文件信息列表;當(dāng)?shù)谝挥脩舳讼乱淮芜M(jìn)行掃描時(shí)根據(jù)上一次掃描后的安全記錄結(jié)果進(jìn)行掃描。對(duì)于系統(tǒng)實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)
14之處參見方法實(shí)施例的部分說明即可。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。以上對(duì)本申請(qǐng)所提供的一種文件快速掃描方法和系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想, 在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。
權(quán)利要求
1.一種文件快速掃描方法,其特征在于,包括獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于所述特征信息通過統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,通過如下步驟統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得所述特征信息接收各用戶端發(fā)送的安全文件的特征信息;所述特征信息包括用戶端完整掃描文件時(shí),確定安全的文件的特征信息;對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù);提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在用戶端完整掃描文件時(shí)當(dāng)所述掃描的文件安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息;將文件名進(jìn)行循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值;將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,得到內(nèi)容匹配信息;將包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息進(jìn)行發(fā)送。
5.根據(jù)權(quán)利要求2或4所述的方法,其特征在于,對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù)將接收的特征信息按總重復(fù)次數(shù)進(jìn)行排序;對(duì)于各相同特征信息,將屬于同一個(gè)用戶端發(fā)送的相同特征消息進(jìn)行消重運(yùn)算;針對(duì)消重后的各相同特征信息,統(tǒng)計(jì)各特征消息的重復(fù)次數(shù)。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,在提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息之后包括將所述提取出來的特征信息存入數(shù)據(jù)文件,并依據(jù)所述數(shù)據(jù)文件生成數(shù)據(jù)包。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述數(shù)據(jù)包生成之前還包括接收用戶端發(fā)送的不安全文件的特征信息,不將該特征信息存入數(shù)據(jù)文件或者將數(shù)據(jù)包中與該特征信息相同的特征信息進(jìn)行刪除。
8.根據(jù)權(quán)利要求2所述的方法,其特征在于在生成上一個(gè)數(shù)據(jù)包后,當(dāng)統(tǒng)計(jì)到新的安全文件的特征信息后,更新至上一個(gè)數(shù)據(jù)包。
9.根據(jù)權(quán)利要求I所述的方法,其特征在于,通過如下方法將所述文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配在緩存中從匹配效率最高的特征信息開始進(jìn)行匹配。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于當(dāng)文件大小和文件修改時(shí)間與數(shù)據(jù)庫中的一條特征信息匹配時(shí),則將文件名進(jìn)行所述循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值,并將所述文件名CRC值與該條特征信息的文件名CRC值進(jìn)行匹配;當(dāng)所述文件名CRC值與該條特征信息的文件名CRC值匹配時(shí),則將文件內(nèi)容描述信息進(jìn)行所述消息摘要算法計(jì)算,得到內(nèi)容匹配信息,并將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配。
11.根據(jù)權(quán)利要求I或10所述的方法,其特征在于當(dāng)?shù)谝挥脩舳诉M(jìn)行第一次掃描時(shí),提示第一用戶端是否選擇快速掃描,如果選擇則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。
12.根據(jù)權(quán)利要求I所述的方法,其特征在于在第一用戶端進(jìn)行掃描時(shí),將當(dāng)次掃描結(jié)果中安全文件的特征信息存入所述數(shù)據(jù)包的安全文件信息列表;當(dāng)?shù)谝挥脩舳讼乱淮芜M(jìn)行掃描時(shí)根據(jù)上一次掃描后的記錄進(jìn)行掃描。
13.一種文件快速掃描系統(tǒng),其特征在于,包括第一用戶端,所述第一用戶端包括獲取模塊,用于獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息;掃描匹配模塊,用于逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,還包括第二用戶端群和處理中心服務(wù)器;所述處理中心服務(wù)器用于統(tǒng)計(jì)各用戶端發(fā)送到處理中心服務(wù)器中的安全文件特征信息獲得所述數(shù)據(jù)包中的特征信息;所述第二用戶端群用于發(fā)送的安全文件的特征信息。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述的處理中心服務(wù)器包括特征信息模塊,用于接收各用戶端發(fā)送的安全文件的特征信息;所述特征信息包括用戶端完整掃描文件時(shí),確定安全的文件的特征信息;統(tǒng)計(jì)模塊,用于對(duì)于相同的特征信息,統(tǒng)計(jì)其重復(fù)次數(shù);提取模塊,用于提取重復(fù)次數(shù)大于或大于等于數(shù)量閾值的特征信息。
16.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述第二用戶端群的各用戶端包括 特征信息獲取單元,用于當(dāng)掃描的文件安全時(shí),獲取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改時(shí)間和文件內(nèi)容描述信息;文件名計(jì)算單元,用于將文件名進(jìn)行循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值;內(nèi)容描述信息計(jì)算單元,用于將文件內(nèi)容描述信息進(jìn)行消息摘要算法計(jì)算,得到內(nèi)容匹配信息;特征信息發(fā)送單元,用于將包括文件大小、文件修改時(shí)間、文件名CRC值和內(nèi)容匹配信息的特征信息進(jìn)行發(fā)送。
17.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述統(tǒng)計(jì)模塊包括排序單元,用于將接收的特征信息按總重復(fù)次數(shù)進(jìn)行排序;消重單元,用于對(duì)于各相同特征信息,將屬于同一個(gè)用戶端發(fā)送的相同特征消息進(jìn)行消重運(yùn)算;統(tǒng)計(jì)單元,用于針對(duì)消重后的各相同特征信息,統(tǒng)計(jì)各特征消息的重復(fù)次數(shù)。
18.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,在提取模塊之后還包括生成單元,用于將所述提取出來的特征信息存入數(shù)據(jù)文件,并依據(jù)所述數(shù)據(jù)文件生成數(shù)據(jù)包。
19.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,在所述數(shù)據(jù)包生成之前還包括去除單元,用于接收用戶端發(fā)送的不安全文件的特征信息,不將該特征信息存入數(shù)據(jù)文件或者將數(shù)據(jù)包中與該特征信息相同的特征信息進(jìn)行刪除。
20.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,還包括更新模塊,用于在生成上一個(gè)數(shù)據(jù)包后,當(dāng)統(tǒng)計(jì)到新的安全文件的特征信息后,更新至上一個(gè)數(shù)據(jù)包。
21.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,通過如下方法將所述文件的特征信息與所述數(shù)據(jù)包中的特征信息進(jìn)行匹配在緩存中從匹配效率最高的特征信息開始進(jìn)行匹配。
22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于當(dāng)文件大小和文件修改時(shí)間與數(shù)據(jù)庫中的一條特征信息匹配時(shí),則將文件名進(jìn)行所述循環(huán)冗余碼校驗(yàn)計(jì)算,得到文件名CRC值,并將所述文件名CRC值與該條特征信息的文件名 CRC值進(jìn)行匹配;當(dāng)所述文件名CRC值與該條特征信息的文件名CRC值匹配時(shí),則將文件內(nèi)容描述信息進(jìn)行所述消息摘要算法計(jì)算,得到內(nèi)容匹配信息,并將所述內(nèi)容匹配信息與該條特征信息的內(nèi)容匹配信息進(jìn)行匹配。
23.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,還包括提醒模塊,用于當(dāng)?shù)谝淮螔呙钑r(shí),提示第一用戶端是否選擇快速掃描,如果選擇則掃描文件的特征信息,并調(diào)用所述數(shù)據(jù)包進(jìn)行匹配。
24.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,還包括更新記錄模塊,用于在第一用戶端進(jìn)行掃描時(shí),將當(dāng)次掃描結(jié)果中安全文件的特征信息存入所述數(shù)據(jù)包的安全文件信息列表;當(dāng)?shù)谝挥脩舳讼乱淮芜M(jìn)行掃描時(shí)根據(jù)上一次掃描后的安全記錄結(jié)果進(jìn)行掃描。
全文摘要
本申請(qǐng)?zhí)峁┝艘环N文件快速掃描方法和系統(tǒng),涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域。本申請(qǐng)的方法包括獲取數(shù)據(jù)包;所述數(shù)據(jù)包包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息;逐個(gè)掃描系統(tǒng)中文件的文件特征信息,若當(dāng)前掃描的文件特征信息與所述數(shù)據(jù)包中標(biāo)示文件為安全文件的安全文件特征信息匹配時(shí),則跳過對(duì)當(dāng)前文件的殺毒掃描,繼續(xù)掃描下一個(gè)文件。本申請(qǐng)通過利用包括用于確定系統(tǒng)中文件是否為安全文件的安全文件特征信息的數(shù)據(jù)包,新的用戶在第一次掃描時(shí),如果掃描到與所述數(shù)據(jù)包中特征信息相同的文件時(shí)就可以跳過其代表的時(shí)間長(zhǎng)、并且安全的文件,可減少首次掃描的時(shí)間。
文檔編號(hào)G06F17/30GK102609515SQ201210026760
公開日2012年7月25日 申請(qǐng)日期2012年2月7日 優(yōu)先權(quán)日2012年2月7日
發(fā)明者付旻, 鄒貴強(qiáng) 申請(qǐng)人:奇智軟件(北京)有限公司