本申請(qǐng)涉及數(shù)據(jù)安全,尤其涉及一種泄露事件監(jiān)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)的安全問(wèn)題也日益凸顯。近年來(lái),數(shù)據(jù)泄露事件的發(fā)生給個(gè)人和企業(yè)帶來(lái)了嚴(yán)重的安全隱患。
2、目前,已知技術(shù)中一般通過(guò)硬編碼的方式對(duì)指定的網(wǎng)站進(jìn)行監(jiān)測(cè),實(shí)現(xiàn)下述過(guò)程:提取網(wǎng)站頁(yè)面中的數(shù)據(jù),該數(shù)據(jù)包括該頁(yè)面的標(biāo)題和正文的文本內(nèi)容。進(jìn)一步的,通過(guò)關(guān)鍵詞匹配頁(yè)面的標(biāo)題和正文的文本內(nèi)容,以確定相應(yīng)頁(yè)面是否涉及關(guān)注的數(shù)據(jù)泄露事件。
3、上述過(guò)程中,存在易錯(cuò)報(bào)、漏報(bào)泄露事件的缺陷,從而不利于準(zhǔn)確地監(jiān)測(cè)泄露事件。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┮环N泄露事件監(jiān)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以提升泄露事件監(jiān)測(cè)的準(zhǔn)確性。
2、第一方面,本申請(qǐng)?zhí)峁┮环N泄露事件監(jiān)測(cè)方法,所述方法包括:
3、獲取被監(jiān)測(cè)平臺(tái)中包含預(yù)設(shè)關(guān)鍵詞的頁(yè)面數(shù)據(jù);
4、從所述頁(yè)面數(shù)據(jù)中提取待分析事件,并計(jì)算所述待分析事件與各歷史泄露事件的事件相似度;所述待分析事件包括至少一個(gè)預(yù)設(shè)關(guān)鍵詞和所述預(yù)設(shè)關(guān)鍵詞對(duì)應(yīng)的詞特征;
5、在根據(jù)所述事件相似度確定所述待分析事件不是所述歷史泄露事件時(shí),計(jì)算所述待分析事件包括的各所述預(yù)設(shè)關(guān)鍵詞對(duì)應(yīng)的詞特征和預(yù)設(shè)數(shù)據(jù)庫(kù)中的用戶(hù)信息對(duì)應(yīng)的特征字段的匹配度;
6、根據(jù)所述匹配度,確定所述待分析事件為真實(shí)泄露事件或虛假泄露事件。
7、在一種可能的設(shè)計(jì)中,所述方法還包括:
8、在存在多個(gè)待分析事件時(shí),根據(jù)預(yù)設(shè)算法中的任一種確定屬于同一事件的待分析事件,所述預(yù)設(shè)算法包括余弦相似度算法、聚類(lèi)算法;
9、對(duì)于屬于同一事件的至少兩個(gè)待分析事件,對(duì)所述至少兩個(gè)待分析事件分別與各歷史泄露事件的事件相似度進(jìn)行聚合,得到整體相似度;
10、若所述至少兩個(gè)待分析事件與任一歷史泄露事件的整體相似度大于第一預(yù)設(shè)閾值,則將所述至少兩個(gè)待分析事件標(biāo)記為對(duì)應(yīng)的歷史泄露事件;
11、若所述至少兩個(gè)待分析事件與各所述歷史泄露事件的整體相似度均不大于所述第一預(yù)設(shè)閾值,則確定所述至少兩個(gè)待分析事件不是所述歷史泄露事件。
12、在一種可能的設(shè)計(jì)中,所述計(jì)算所述待分析事件與各歷史泄露事件的事件相似度,包括:
13、獲取所述待分析事件的第一向量表示、各所述歷史泄露事件分別對(duì)應(yīng)的第二向量表示;
14、對(duì)所述第一向量表示和各所述第二向量表示分別進(jìn)行余弦相似度計(jì)算,得到所述待分析事件與對(duì)應(yīng)歷史泄露事件的事件相似度。
15、在一種可能的設(shè)計(jì)中,所述獲取被監(jiān)測(cè)平臺(tái)中包含預(yù)設(shè)關(guān)鍵詞的頁(yè)面數(shù)據(jù),包括:
16、獲取動(dòng)態(tài)配置信息,所述動(dòng)態(tài)配置信息用于指示所述被監(jiān)測(cè)平臺(tái);
17、根據(jù)預(yù)設(shè)方式中的任一種獲取所述被監(jiān)測(cè)平臺(tái)的頁(yè)面數(shù)據(jù),所述預(yù)設(shè)方式包括爬蟲(chóng)技術(shù)。
18、在一種可能的設(shè)計(jì)中,所述從所述頁(yè)面數(shù)據(jù)中提取待分析事件,包括:
19、若所述頁(yè)面數(shù)據(jù)包括圖片數(shù)據(jù),則通過(guò)光學(xué)字符識(shí)別ocr技術(shù)從所述圖片數(shù)據(jù)中提取所述待分析事件;
20、若所述頁(yè)面數(shù)據(jù)包括文件數(shù)據(jù),則對(duì)所述文件數(shù)據(jù)進(jìn)行解析,以提取所述待分析事件。
21、在一種可能的設(shè)計(jì)中,所述方法還包括:
22、將所述待分析事件和所述待分析事件對(duì)應(yīng)的標(biāo)記信息,存儲(chǔ)至待復(fù)核隊(duì)列,并向用戶(hù)反饋復(fù)核提醒信息;所述標(biāo)記信息用于指示所述待分析事件為所述歷史泄露事件、所述真實(shí)泄露事件、所述虛假泄露事件中的一種。
23、在一種可能的設(shè)計(jì)中,所述方法還包括:
24、接收所述用戶(hù)反饋的復(fù)核結(jié)果信息,所述復(fù)核結(jié)果信息用于指示所述待分析事件是否確認(rèn)為所述歷史泄露事件、所述真實(shí)泄露事件、所述虛假泄露事件中的一種;
25、根據(jù)所述復(fù)核結(jié)果信息,更新所述歷史泄露事件。
26、第二方面,本申請(qǐng)?zhí)峁┮环N泄露事件監(jiān)測(cè)裝置,包括:
27、獲取模塊,用于獲取被監(jiān)測(cè)平臺(tái)中包含預(yù)設(shè)關(guān)鍵詞的頁(yè)面數(shù)據(jù);
28、計(jì)算模塊,用于從所述頁(yè)面數(shù)據(jù)中提取待分析事件,并計(jì)算所述待分析事件與各歷史泄露事件的事件相似度;所述待分析事件包括至少一個(gè)預(yù)設(shè)關(guān)鍵詞和所述預(yù)設(shè)關(guān)鍵詞對(duì)應(yīng)的詞特征;
29、所述計(jì)算模塊,還用于在根據(jù)所述事件相似度確定所述待分析事件不是所述歷史泄露事件時(shí),計(jì)算所述待分析事件包括的各所述預(yù)設(shè)關(guān)鍵詞對(duì)應(yīng)的詞特征和預(yù)設(shè)數(shù)據(jù)庫(kù)中的用戶(hù)信息對(duì)應(yīng)的特征字段的匹配度;
30、確定模塊,用于根據(jù)所述匹配度,確定所述待分析事件為真實(shí)泄露事件或虛假泄露事件。
31、第三方面,本申請(qǐng)實(shí)施例提供一種電子設(shè)備,包括:至少一個(gè)處理器和存儲(chǔ)器;所述存儲(chǔ)器存儲(chǔ)計(jì)算機(jī)執(zhí)行指令;所述至少一個(gè)處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)執(zhí)行指令,使得所述至少一個(gè)處理器執(zhí)行如上第一方面以及第一方面各種可能的設(shè)計(jì)所述的方法。
32、第四方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,當(dāng)處理器執(zhí)行所述計(jì)算機(jī)執(zhí)行指令時(shí),實(shí)現(xiàn)如上第一方面以及第一方面各種可能的設(shè)計(jì)所述的方法。
33、第五方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如上第一方面以及第一方面各種可能的設(shè)計(jì)所述的方法。
34、本申請(qǐng)?zhí)峁┑男孤妒录O(jiān)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),在本申請(qǐng)中,對(duì)于獲取的被監(jiān)測(cè)平臺(tái)的頁(yè)面數(shù)據(jù),首先根據(jù)多個(gè)預(yù)設(shè)關(guān)鍵詞從頁(yè)面數(shù)據(jù)中提取待分析事件,并計(jì)算待分析事件和已記錄的各歷史泄露事件間的事件相似度,以確定待分析事件是否為歷史泄露事件。進(jìn)一步的,在待分析事件不是歷史泄露事件時(shí),計(jì)算待分析事件包括的各個(gè)預(yù)設(shè)關(guān)鍵詞的詞特征和預(yù)設(shè)數(shù)據(jù)庫(kù)中的用戶(hù)信息對(duì)應(yīng)的特征字段的匹配度,以確定待分析事件是否為真實(shí)泄露事件或虛假泄露事件。通過(guò)本申請(qǐng)的方法,對(duì)于每個(gè)被監(jiān)測(cè)平臺(tái),在其頁(yè)面數(shù)據(jù)包含預(yù)設(shè)關(guān)鍵詞時(shí),電子設(shè)備能夠依次分析其對(duì)應(yīng)的待分析事件是否為歷史泄露事件、真實(shí)泄露事件、虛假泄露事件,即對(duì)待分析事件進(jìn)行更全面的分析,從而能夠有效降低漏報(bào)、錯(cuò)報(bào)泄露事件,提高監(jiān)測(cè)泄露事件的準(zhǔn)確性。
1.一種泄露事件監(jiān)測(cè)方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述計(jì)算所述待分析事件與各歷史泄露事件的事件相似度,包括:
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述獲取被監(jiān)測(cè)平臺(tái)中包含預(yù)設(shè)關(guān)鍵詞的頁(yè)面數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述從所述頁(yè)面數(shù)據(jù)中提取待分析事件,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
8.一種泄露事件監(jiān)測(cè)裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,包括:處理器,以及與所述處理器通信連接的存儲(chǔ)器;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,所述計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的方法。
11.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的方法。