本申請(qǐng)涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)隱私保護(hù)的脫敏方法及其裝置。
背景技術(shù):
由于銀監(jiān)會(huì)對(duì)數(shù)據(jù)安全提出監(jiān)管的要求,因此需要對(duì)數(shù)據(jù)進(jìn)行脫敏處理,嚴(yán)格防止敏感數(shù)據(jù)泄露。典型的數(shù)據(jù)脫敏方案分為敏感數(shù)據(jù)的確認(rèn)和處理兩部分。
敏感數(shù)據(jù)的確認(rèn)首先定義數(shù)據(jù)標(biāo)記的規(guī)則,將各類數(shù)據(jù)字段分為不同的等級(jí)屬性。因此在脫敏運(yùn)行前,需要人工依據(jù)定義的數(shù)據(jù)分級(jí)規(guī)則,將數(shù)據(jù)各個(gè)字段標(biāo)記為相應(yīng)等級(jí),如身份證號(hào)、郵箱等需要脫敏數(shù)據(jù)標(biāo)記為敏感等級(jí),普通業(yè)務(wù)數(shù)據(jù)標(biāo)記為非敏感等級(jí)。通常也可以定義更細(xì)致的分級(jí)策略,依據(jù)不同的場(chǎng)景分別脫敏,通過定義數(shù)據(jù)的敏感等級(jí),在后續(xù)查詢使用數(shù)據(jù)時(shí),可以容易判斷數(shù)據(jù)是否需要脫敏。
敏感數(shù)據(jù)的處理提供多種處理方式,如數(shù)據(jù)的部分遮蔽、加密、截?cái)?、不顯示等方式,在展示或?qū)С鰯?shù)據(jù)時(shí),將敏感數(shù)據(jù)依據(jù)預(yù)先定義的處理方式進(jìn)行處理,最終達(dá)到敏感數(shù)據(jù)脫敏的目的。
如informatica或oracle提供的數(shù)據(jù)脫敏解決方案中,為用戶提供了功能詳盡但繁瑣的數(shù)據(jù)屬性配置頁面,要求用戶在查看數(shù)據(jù)前將數(shù)據(jù)各字段格式、屬性配置完成才能進(jìn)行脫敏,敏感數(shù)據(jù)的確認(rèn)依賴用戶手工配置。
這種需要先行對(duì)數(shù)據(jù)進(jìn)行配置才能進(jìn)行脫敏的方案,對(duì)用戶接入脫敏服務(wù)造成很大侵入性,不僅增加了維護(hù)成本,對(duì)于超大規(guī)模數(shù)據(jù)倉(cāng)庫(kù)的脫敏維護(hù)人力成本將非常高,同時(shí)脫敏正確率完全依賴人工配置的正確與否,正確率不可控。
因此,如何實(shí)現(xiàn)無侵入性的脫敏成為亟需解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)隱私保護(hù)的脫敏方法及其裝置,其能夠無侵入性的實(shí)現(xiàn)脫敏,操作簡(jiǎn)單,使用方便。
本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)隱私保護(hù)的脫敏方法,所述方法包括:
對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描;
判斷所抽取數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例是否達(dá)到第一閾值;
若達(dá)到所述第一閾值,則對(duì)所抽取數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描,判斷符合校驗(yàn)規(guī)則的數(shù)據(jù)比例是否達(dá)到第二閾值;
若達(dá)到所述第二閾值,則將所述數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù),對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。
在本申請(qǐng)一具體實(shí)施例中,還包括:
若未達(dá)到所述第一閾值,則對(duì)所抽取數(shù)據(jù)的字段名和描述按照輔助規(guī)則進(jìn)行掃描;
若符合輔助規(guī)則,則將所述數(shù)據(jù)記錄入安全審計(jì)范圍。
在本申請(qǐng)一具體實(shí)施例中,所述正則匹配規(guī)則、所述校驗(yàn)規(guī)則、所述輔助規(guī)則中至少其一為實(shí)時(shí)加載的預(yù)定義規(guī)則。
在本申請(qǐng)一具體實(shí)施例中,所述對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描之前還包括:
根據(jù)安全策略,判斷所述數(shù)據(jù)是否需要進(jìn)行脫敏處理,若需要進(jìn)行脫敏處理,則對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描,否則,結(jié)束脫敏流程。
在本申請(qǐng)一具體實(shí)施例中,所述安全策略為預(yù)先配置的需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍。
本申請(qǐng)還提供一種數(shù)據(jù)隱私保護(hù)的脫敏裝置,所述裝置包括:
正則掃描模塊,用于對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描;
比例判斷模塊,用于判斷所抽取數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例是否達(dá)到第一閾值;
校驗(yàn)掃描模塊,用于當(dāng)達(dá)到所述第一閾值,則對(duì)所抽取數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描,判斷符合校驗(yàn)規(guī)則的數(shù)據(jù)比例是否達(dá)到第二閾值;
脫敏處理模塊,用于當(dāng)達(dá)到所述第二閾值,則將所述數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù),對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。
在本申請(qǐng)一具體實(shí)施例中,還包括:
輔助掃描模塊,用于當(dāng)未達(dá)到所述第一閾值,則對(duì)所抽取數(shù)據(jù)的字段名和描述按照輔助規(guī)則進(jìn)行掃描;
審計(jì)設(shè)定模塊,用于當(dāng)符合輔助規(guī)則,則將所述數(shù)據(jù)記錄入安全審計(jì)范圍。
在本申請(qǐng)一具體實(shí)施例中,所述正則匹配規(guī)則、所述校驗(yàn)規(guī)則、所述輔助規(guī)則中至少其一為實(shí)時(shí)加載的預(yù)定義規(guī)則。
在本申請(qǐng)一具體實(shí)施例中,所述對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描之前還包括:
策略設(shè)定模塊,用于根據(jù)安全策略,判斷所述數(shù)據(jù)是否需要進(jìn)行脫敏處理,若需要進(jìn)行脫敏處理,則對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描,否則,結(jié)束脫敏流程。
在本申請(qǐng)一具體實(shí)施例中,所述安全策略為預(yù)先配置的需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍。
由以上技術(shù)方案可見,本申請(qǐng)對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。如所抽取數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例達(dá) 到第一閾值,則對(duì)所抽取數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描。如所抽取數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例達(dá)到第二閾值,則將所述數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù)。根據(jù)敏感轉(zhuǎn)化規(guī)則,對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。本申請(qǐng)保證用戶可以正常查看使用數(shù)據(jù)的前提下,無需強(qiáng)制用戶編輯任何數(shù)據(jù)規(guī)則,即可掃描檢測(cè)敏感數(shù)據(jù),將涉及到數(shù)據(jù)安全的敏感數(shù)據(jù)屏蔽,達(dá)到無侵入性的實(shí)現(xiàn)脫敏,操作簡(jiǎn)單,使用方便。
附圖說明
為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本申請(qǐng)所應(yīng)用分布式服務(wù)器的硬件結(jié)構(gòu)圖;
圖2是本申請(qǐng)一種數(shù)據(jù)隱私保護(hù)的脫敏方法的一實(shí)施例的流程圖;
圖3是本申請(qǐng)一種數(shù)據(jù)隱私保護(hù)的脫敏方法的另一實(shí)施例的流程圖;
圖4是本申請(qǐng)一種數(shù)據(jù)隱私保護(hù)的脫敏方法的再一實(shí)施例的流程圖;
圖5是本申請(qǐng)一種數(shù)據(jù)隱私保護(hù)的脫敏裝置的一實(shí)施例的結(jié)構(gòu)圖;
圖6是本申請(qǐng)一種數(shù)據(jù)隱私保護(hù)的脫敏裝置的另一實(shí)施例的結(jié)構(gòu)圖;
圖7是本申請(qǐng)一種數(shù)據(jù)隱私保護(hù)的脫敏裝置的再一實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施方式
本申請(qǐng)對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。如所抽取數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例達(dá)到第一閾值,則對(duì)所抽取數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描。如所抽取數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例達(dá)到第二閾值,則將所述數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù)。根據(jù)敏感轉(zhuǎn)化規(guī)則,對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。本申請(qǐng)保證用戶可以正常查看使用數(shù)據(jù)的前提下,無需強(qiáng)制用戶編輯任何數(shù)據(jù)規(guī)則,即可掃描檢測(cè)敏感數(shù)據(jù),將涉及到數(shù)據(jù)安 全的敏感數(shù)據(jù)屏蔽,達(dá)到無侵入性的實(shí)現(xiàn)脫敏,操作簡(jiǎn)單,使用方便。
當(dāng)然,實(shí)施本申請(qǐng)的任一技術(shù)方案必不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
為了使本領(lǐng)域的人員更好地理解本申請(qǐng)中的技術(shù)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)隱私保護(hù)的脫敏方法,應(yīng)用于分布式服務(wù)器,參看圖1,分布式服務(wù)器1的硬件結(jié)構(gòu)包括控制器11、存儲(chǔ)器12以及其他硬件13。
參看圖2,本申請(qǐng)所述方法包括:
s1、對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。
本申請(qǐng)從需要進(jìn)行脫敏處理的數(shù)據(jù)中抽取一定比例的數(shù)據(jù),并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。
本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)選擇抽取比例。例如,從一列數(shù)據(jù)中抽取最多100條數(shù)據(jù)。
s2、判斷所抽取數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例是否達(dá)到第一閾值。
本申請(qǐng)對(duì)所抽取的數(shù)據(jù)逐條按照正則匹配規(guī)則進(jìn)行數(shù)據(jù)掃描。例如,從一列數(shù)據(jù)中抽取100條數(shù)據(jù),對(duì)所述100條數(shù)據(jù)逐條按照正則匹配規(guī)則進(jìn)行數(shù)據(jù)掃描,發(fā)現(xiàn)85條數(shù)據(jù)符合正則匹配規(guī)則,則進(jìn)行數(shù)據(jù)掃描的所述100條數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例為85%。
具體地,所述第一閾值由本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)進(jìn)行選取。假設(shè)所述第一閾值取值為80%,若所述100條數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例為85%,則達(dá)到所述第一閾值。
s3、若達(dá)到所述第一閾值,則對(duì)所抽取數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描, 判斷符合校驗(yàn)規(guī)則的數(shù)據(jù)比例是否達(dá)到第二閾值。
由于正則匹配規(guī)則判斷的粒度較粗,本申請(qǐng)?jiān)谒槿?shù)據(jù)滿足正則匹配規(guī)則的比例達(dá)到第一閾值時(shí),進(jìn)一步采用校驗(yàn)規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。
校驗(yàn)規(guī)則為對(duì)所抽取數(shù)據(jù)進(jìn)行進(jìn)一步驗(yàn)證的規(guī)則,即判斷所抽取數(shù)據(jù)滿足正則匹配規(guī)則的前提下,進(jìn)一步根據(jù)數(shù)據(jù)類型進(jìn)行判斷的規(guī)則。
本申請(qǐng)針對(duì)不同的數(shù)據(jù)類型提供不同的校驗(yàn)規(guī)則,例如,身份證數(shù)據(jù)除了滿足位數(shù)為18或15位外,還應(yīng)滿足出生年月、性別、地區(qū)等規(guī)則。所述位數(shù)為18或15位作為正則匹配規(guī)則,所述出生年月、性別、地區(qū)等規(guī)則作為校驗(yàn)規(guī)則。
本申請(qǐng)對(duì)所述抽取的數(shù)據(jù)逐條按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描。例如,對(duì)所述100條數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描,發(fā)現(xiàn)85條數(shù)據(jù)符合校驗(yàn)規(guī)則,則進(jìn)行數(shù)據(jù)掃描的所述100條數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例為85%。
所述第二閾值由本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)進(jìn)行選取。假設(shè)所述第二閾值取值為80%,若所述100條數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例為85%,則達(dá)到所述第二閾值。
s4、若達(dá)到所述第二閾值,則將所述數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù),對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。
如果所抽取數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例達(dá)到所述第二閾值,則將全部數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù),對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。
所述脫敏處理可以為遮蔽、加密、截?cái)?、不顯示等處理方式。從而保證在用戶端呈現(xiàn)的數(shù)據(jù)為脫敏后的數(shù)據(jù),達(dá)到數(shù)據(jù)隱私保護(hù)的效果。
具體地,所述遮蔽處理包括增加減少遮蔽位數(shù)或者由「*」或者「#」等其他符號(hào)進(jìn)行遮蔽。所述加密、截?cái)嘁部梢允褂酶黝愑?jì)算算法來實(shí)現(xiàn),在此不再贅述。
本申請(qǐng)保證用戶可以正常查看使用數(shù)據(jù)的前提下,無需強(qiáng)制用戶編輯任何數(shù)據(jù)規(guī)則,掃描檢測(cè)敏感數(shù)據(jù),將涉及到數(shù)據(jù)安全的敏感數(shù)據(jù)屏蔽,達(dá)到無侵入性的實(shí)現(xiàn)脫敏,操作簡(jiǎn)單,使用方便。
在本申請(qǐng)?jiān)僖痪唧w實(shí)現(xiàn)中,參見圖3,所述方法還包括:
s5、若未達(dá)到所述第一閾值,則對(duì)所抽取的數(shù)據(jù)的字段名和描述按照輔助規(guī)則進(jìn)行掃描。
本申請(qǐng)對(duì)所抽取的數(shù)據(jù)逐條按照正則匹配規(guī)則進(jìn)行數(shù)據(jù)掃描,如果數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例未達(dá)到所述第一閾值,則初步確定所述數(shù)據(jù)不符合敏感規(guī)則。但由于數(shù)據(jù)的字段名和描述可作為數(shù)據(jù)的定義,為了防止脫敏服務(wù)出現(xiàn)遺漏,對(duì)所抽取的數(shù)據(jù)的字段名和描述按照輔助規(guī)則進(jìn)行數(shù)據(jù)掃描。
具體的,所述輔助規(guī)則為判斷所抽取的數(shù)據(jù)的字段名和描述是否包含某些關(guān)鍵字。如果數(shù)據(jù)的字段名和描述包含所述關(guān)鍵字,則表明所述數(shù)據(jù)的定義符合敏感規(guī)則。所述關(guān)鍵字可以為本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)預(yù)先設(shè)定的字段。
s6、若所抽取的數(shù)據(jù)的字段名和描述符合輔助規(guī)則,則將所述數(shù)據(jù)記錄入安全審計(jì)范圍。
如果所抽取的數(shù)據(jù)的字段名和描述符合輔助規(guī)則,則表明所抽取的數(shù)據(jù)的定義符合敏感規(guī)則。所抽取的數(shù)據(jù)定義符合敏感規(guī)則,但所抽取的數(shù)據(jù)內(nèi)容不符合敏感規(guī)則,則將全部數(shù)據(jù)記錄入安全審計(jì)范圍,通過人工的方式對(duì)所述數(shù)據(jù)進(jìn)行安全審計(jì),從而防止脫敏服務(wù)出現(xiàn)遺漏。
在本申請(qǐng)一具體實(shí)現(xiàn)中,所述正則匹配規(guī)則、所述校驗(yàn)規(guī)則、所述輔助規(guī)則中至少其一為實(shí)時(shí)加載的預(yù)定義規(guī)則。
實(shí)時(shí)加載的預(yù)定義規(guī)則是指每次脫敏服務(wù)運(yùn)行時(shí),實(shí)時(shí)加載當(dāng)前系統(tǒng)預(yù)定義的規(guī)則配置,從而允許系統(tǒng)在持續(xù)運(yùn)行的過程中,不斷改進(jìn)優(yōu)化敏感掃描規(guī)則,進(jìn)一步提升動(dòng)態(tài)脫敏服務(wù)的準(zhǔn)確度和效率。
在本申請(qǐng)?jiān)僖痪唧w實(shí)現(xiàn)中,參見圖4,所述步驟s1之前還包括:
s0、根據(jù)安全策略,判斷數(shù)據(jù)是否需要進(jìn)行脫敏處理,若需要進(jìn)行脫敏處理,則執(zhí)行步驟s1,否則,結(jié)束脫敏流程。
具體的,所述安全策略為預(yù)先配置的需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍。
本申請(qǐng)根據(jù)用戶指令,預(yù)先配置需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍。如果所述數(shù)據(jù)在需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍內(nèi),則需要進(jìn)行脫敏處理,執(zhí)行步驟s1;否則,無需進(jìn)行脫敏處理,結(jié)束脫敏流程。
因此,本申請(qǐng)?jiān)试S用戶預(yù)先配置該數(shù)據(jù)是否需要執(zhí)行脫敏服務(wù),如果用戶將所述數(shù)據(jù)配置為不需要執(zhí)行脫敏服務(wù),則不會(huì)對(duì)該數(shù)據(jù)執(zhí)行脫敏服務(wù),從而方便用戶在特定場(chǎng)景下查看原始數(shù)據(jù)。
對(duì)應(yīng)上述方法,本申請(qǐng)還提供一種數(shù)據(jù)隱私保護(hù)的脫敏裝置,應(yīng)用于分布式服務(wù)器,參看圖1,分布式服務(wù)器1的硬件結(jié)構(gòu)包括控制器11、存儲(chǔ)器12以及其他硬件13。
參看圖5,本申請(qǐng)所述裝置包括:
正則掃描模塊51,用于對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。
比例判斷模塊52,用于判斷所抽取數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例是否達(dá)到第一閾值。
校驗(yàn)掃描模塊53,用于當(dāng)達(dá)到所述第一閾值,則對(duì)所抽取數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描,判斷符合校驗(yàn)規(guī)則的數(shù)據(jù)比例是否達(dá)到第二閾值。
脫敏處理模塊54,用于當(dāng)達(dá)到所述第二閾值,則將所述數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù),對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。
本申請(qǐng)從需要進(jìn)行脫敏處理的數(shù)據(jù)中抽取一定比例的數(shù)據(jù),并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。
本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)選擇抽取比例。例如,從一列數(shù)據(jù)中抽取最多100條數(shù)據(jù)。
本申請(qǐng)對(duì)所抽取的數(shù)據(jù)逐條按照正則匹配規(guī)則進(jìn)行數(shù)據(jù)掃描。例如,從 一列數(shù)據(jù)中抽取100條數(shù)據(jù),對(duì)所述100條數(shù)據(jù)逐條按照正則匹配規(guī)則進(jìn)行數(shù)據(jù)掃描,發(fā)現(xiàn)85條數(shù)據(jù)符合正則匹配規(guī)則,則進(jìn)行數(shù)據(jù)掃描的所述100條數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例為85%。
具體地,所述第一閾值由本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)進(jìn)行選取。假設(shè)所述第一閾值取值為80%,若所述100條數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例為85%,則達(dá)到所述第一閾值。
由于正則匹配規(guī)則判斷的粒度較粗,本申請(qǐng)?jiān)谒槿?shù)據(jù)滿足正則匹配規(guī)則的比例達(dá)到第一閾值時(shí),進(jìn)一步采用校驗(yàn)規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描。
校驗(yàn)規(guī)則為對(duì)所抽取數(shù)據(jù)進(jìn)行進(jìn)一步驗(yàn)證的規(guī)則,即判斷所抽取數(shù)據(jù)滿足正則匹配規(guī)則的前提下,進(jìn)一步根據(jù)數(shù)據(jù)類型進(jìn)行判斷的規(guī)則。
本申請(qǐng)針對(duì)不同的數(shù)據(jù)類型提供不同的校驗(yàn)規(guī)則,例如,身份證數(shù)據(jù)除了滿足位數(shù)為18或15位外,還應(yīng)滿足出生年月、性別、地區(qū)等規(guī)則。所述位數(shù)為18或15位作為正則匹配規(guī)則,所述出生年月、性別、地區(qū)等規(guī)則作為校驗(yàn)規(guī)則。
本申請(qǐng)對(duì)所述抽取的數(shù)據(jù)逐條按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描。例如,對(duì)所述100條數(shù)據(jù)按照校驗(yàn)規(guī)則進(jìn)行數(shù)據(jù)掃描,發(fā)現(xiàn)85條數(shù)據(jù)符合校驗(yàn)規(guī)則,則進(jìn)行數(shù)據(jù)掃描的所述100條數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例為85%。
所述第二閾值由本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)進(jìn)行選取。假設(shè)所述第二閾值取值為80%,若所述100條數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例為85%,則達(dá)到所述第二閾值。
如果所抽取數(shù)據(jù)中符合校驗(yàn)規(guī)則的數(shù)據(jù)比例達(dá)到所述第二閾值,則將全部數(shù)據(jù)標(biāo)記為敏感數(shù)據(jù),對(duì)所述敏感數(shù)據(jù)進(jìn)行脫敏處理。
所述脫敏處理可以為遮蔽、加密、截?cái)?、不顯示等處理方式。從而保證在用戶端呈現(xiàn)的數(shù)據(jù)為脫敏后的數(shù)據(jù),達(dá)到數(shù)據(jù)隱私保護(hù)的效果。
具體地,所述遮蔽處理包括增加減少遮蔽位數(shù)或者由「*」或者「#」等其他符號(hào)進(jìn)行遮蔽。所述加密、截?cái)嘁部梢允褂酶黝愑?jì)算算法來實(shí)現(xiàn),在此不再贅述。
本申請(qǐng)保證用戶可以正常查看使用數(shù)據(jù)的前提下,無需強(qiáng)制用戶編輯任何數(shù)據(jù)規(guī)則,掃描檢測(cè)敏感數(shù)據(jù),將涉及到數(shù)據(jù)安全的敏感數(shù)據(jù)屏蔽,達(dá)到無侵入性的實(shí)現(xiàn)脫敏,操作簡(jiǎn)單,使用方便。
在本申請(qǐng)?jiān)僖痪唧w實(shí)現(xiàn)中,參見圖6,所述裝置還包括:
輔助掃描模塊55,用于當(dāng)未達(dá)到所述第一閾值,則對(duì)所抽取的數(shù)據(jù)的字段名和描述按照輔助規(guī)則進(jìn)行掃描。
審計(jì)設(shè)定模塊56,用于當(dāng)所抽取的數(shù)據(jù)的字段名和描述符合輔助規(guī)則,則將所述數(shù)據(jù)記錄入安全審計(jì)范圍。
本申請(qǐng)對(duì)所抽取的數(shù)據(jù)逐條按照正則匹配規(guī)則進(jìn)行數(shù)據(jù)掃描,如果數(shù)據(jù)中符合正則匹配規(guī)則的數(shù)據(jù)比例未達(dá)到所述第一閾值,則初步確定所述數(shù)據(jù)不符合敏感規(guī)則。但由于數(shù)據(jù)的字段名和描述可作為數(shù)據(jù)的定義,為了防止脫敏服務(wù)出現(xiàn)遺漏,對(duì)所抽取的數(shù)據(jù)的字段名和描述按照輔助規(guī)則進(jìn)行數(shù)據(jù)掃描。
具體的,所述輔助規(guī)則為判斷所抽取的數(shù)據(jù)的字段名和描述是否包含某些關(guān)鍵字。如果數(shù)據(jù)的字段名和描述包含所述關(guān)鍵字,則表明所述數(shù)據(jù)的定義符合敏感規(guī)則。所述關(guān)鍵字可以為本領(lǐng)域技術(shù)人員根據(jù)需求和經(jīng)驗(yàn)預(yù)先設(shè)定的字段。
如果所抽取的數(shù)據(jù)的字段名和描述符合輔助規(guī)則,則表明所抽取的數(shù)據(jù)的定義符合敏感規(guī)則。所抽取的數(shù)據(jù)定義符合敏感規(guī)則,但所抽取的數(shù)據(jù)內(nèi)容不符合敏感規(guī)則,則將全部數(shù)據(jù)記錄入安全審計(jì)范圍,通過人工的方式對(duì)所述數(shù)據(jù)進(jìn)行安全審計(jì),從而防止脫敏服務(wù)出現(xiàn)遺漏。
在本申請(qǐng)一具體實(shí)現(xiàn)中,所述正則匹配規(guī)則、所述校驗(yàn)規(guī)則、所述輔助規(guī)則中至少其一為實(shí)時(shí)加載的預(yù)定義規(guī)則。
實(shí)時(shí)加載的預(yù)定義規(guī)則是指每次脫敏服務(wù)運(yùn)行時(shí),實(shí)時(shí)加載當(dāng)前系統(tǒng)預(yù)定義的規(guī)則配置,從而允許系統(tǒng)在持續(xù)運(yùn)行的過程中,不斷改進(jìn)優(yōu)化敏感掃 描規(guī)則,進(jìn)一步提升動(dòng)態(tài)脫敏服務(wù)的準(zhǔn)確度和效率。
在本申請(qǐng)?jiān)僖痪唧w實(shí)現(xiàn)中,參見圖7,所述裝置還包括:
策略設(shè)定模塊57,用于根據(jù)安全策略,判斷數(shù)據(jù)是否需要進(jìn)行脫敏處理,若需要進(jìn)行脫敏處理,則對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描,否則,結(jié)束脫敏流程。
具體的,所述安全策略為預(yù)先配置的需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍。
本申請(qǐng)根據(jù)用戶指令,預(yù)先配置需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍。如果所述數(shù)據(jù)在需要執(zhí)行脫敏服務(wù)的數(shù)據(jù)范圍內(nèi),則需要進(jìn)行脫敏處理,對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取,并按照正則匹配規(guī)則對(duì)所抽取數(shù)據(jù)進(jìn)行掃描;否則,無需進(jìn)行脫敏處理,結(jié)束脫敏流程。
因此,本申請(qǐng)?jiān)试S用戶預(yù)先配置該數(shù)據(jù)是否需要執(zhí)行脫敏服務(wù),如果用戶將所述數(shù)據(jù)配置為不需要執(zhí)行脫敏服務(wù),則不會(huì)對(duì)該數(shù)據(jù)執(zhí)行脫敏服務(wù),從而方便用戶在特定場(chǎng)景下查看原始數(shù)據(jù)。
本申請(qǐng)的實(shí)施例所提供的裝置可通過計(jì)算機(jī)程序?qū)崿F(xiàn)。本領(lǐng)域技術(shù)人員應(yīng)該能夠理解,上述的單元以及模塊劃分方式僅是眾多劃分方式中的一種,如果劃分為其他單元或模塊或不劃分塊,只要信息對(duì)象的具有上述功能,都應(yīng)該在本申請(qǐng)的保護(hù)范圍之內(nèi)。
本領(lǐng)域的技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、裝置(設(shè)備)、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
本申請(qǐng)是參照根據(jù)本申請(qǐng)實(shí)施例的方法、裝置(設(shè)備)和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方 框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管已描述了本申請(qǐng)的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本申請(qǐng)范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本申請(qǐng)進(jìn)行各種改動(dòng)和變型而不脫離本申請(qǐng)的精神和范圍。這樣,倘若本申請(qǐng)的這些修改和變型屬于本申請(qǐng)權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本申請(qǐng)也意圖包含這些改動(dòng)和變型在內(nèi)。