本申請(qǐng)實(shí)施例涉及數(shù)據(jù)安全,尤其涉及一種數(shù)據(jù)保護(hù)方法。
背景技術(shù):
1、隨著數(shù)據(jù)量的增長(zhǎng)和數(shù)據(jù)的廣泛應(yīng)用,個(gè)人隱私保護(hù)變得愈發(fā)重要。發(fā)布數(shù)據(jù)集時(shí),尤其是涉及到個(gè)人或敏感信息的數(shù)據(jù),保障用戶隱私至關(guān)重要。k-匿名(k-anonymity)是一種隱私保護(hù)技術(shù),確保在發(fā)布的數(shù)據(jù)集中,每條記錄在其屬性集合上至少與其他k-1條記錄相同,從而隱藏個(gè)體的身份信息。
2、然而,當(dāng)一個(gè)用戶某些敏感信息發(fā)生變化后,攻擊者可以通過(guò)對(duì)比敏感信息變化前后的兩個(gè)發(fā)布數(shù)據(jù)集推斷出該用戶的敏感信息,其安全性不足,隱私泄露的風(fēng)險(xiǎn)較高。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)保護(hù)方法,以至少解決相關(guān)隱私保護(hù)技術(shù)無(wú)法避免差分攻擊,其安全性不足的問(wèn)題。
2、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)是這樣實(shí)現(xiàn)的:
3、第一方面,本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)保護(hù)方法,包括:獲取用戶數(shù)據(jù)集,所述用戶數(shù)據(jù)集中包括多個(gè)用戶在各個(gè)不同個(gè)體屬性下的用戶屬性值,所述個(gè)體屬性包括準(zhǔn)標(biāo)識(shí)符和敏感屬性;根據(jù)所述準(zhǔn)標(biāo)識(shí)符將所述用戶數(shù)據(jù)集劃分成至少一個(gè)等價(jià)類,各個(gè)所述等價(jià)類中的敏感屬性下至少對(duì)應(yīng)預(yù)設(shè)數(shù)量的用戶屬性值;確定各個(gè)所述等價(jià)類中敏感屬性所對(duì)應(yīng)用戶屬性值的組合數(shù)量;通過(guò)在各個(gè)所述等價(jià)類對(duì)應(yīng)的組合數(shù)量上添加差分隱私噪聲,以對(duì)所述用戶數(shù)據(jù)集進(jìn)行隱私保護(hù)。
4、第二方面,本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)保護(hù)裝置,包括:數(shù)據(jù)獲取模塊,用于獲取用戶數(shù)據(jù)集,所述用戶數(shù)據(jù)集中包括多個(gè)用戶在各個(gè)不同個(gè)體屬性下的用戶屬性值,所述個(gè)體屬性包括準(zhǔn)標(biāo)識(shí)符和敏感屬性;等價(jià)類劃分模塊,用于根據(jù)所述準(zhǔn)標(biāo)識(shí)符將所述用戶數(shù)據(jù)集劃分成至少一個(gè)等價(jià)類,各個(gè)所述等價(jià)類中的敏感屬性下至少對(duì)應(yīng)預(yù)設(shè)數(shù)量的用戶屬性值;組合確定模塊,用于確定各個(gè)所述等價(jià)類中敏感屬性所對(duì)應(yīng)用戶屬性值的組合數(shù)量;噪聲添加模塊,用于通過(guò)在各個(gè)所述等價(jià)類對(duì)應(yīng)的組合數(shù)量上添加差分隱私噪聲,以對(duì)所述用戶數(shù)據(jù)集進(jìn)行隱私保護(hù)。
5、第三方面,本申請(qǐng)實(shí)施例提供了一種電子設(shè)備,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)可在所述處理器上運(yùn)行的程序或指令,所述程序或指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的方法的步驟。
6、第四方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的方法的步驟。
7、第五方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)在非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括程序指令,當(dāng)所述程序指令被計(jì)算機(jī)執(zhí)行時(shí),使所述計(jì)算機(jī)執(zhí)行如上述第一方面所述的方法的步驟。
8、在本申請(qǐng)實(shí)施例中,獲取用戶數(shù)據(jù)集,用戶數(shù)據(jù)集中包括多個(gè)用戶在各個(gè)不同個(gè)體屬性下的用戶屬性值,個(gè)體屬性包括準(zhǔn)標(biāo)識(shí)符和敏感屬性;根據(jù)準(zhǔn)標(biāo)識(shí)符將用戶數(shù)據(jù)集劃分成至少一個(gè)等價(jià)類,各個(gè)等價(jià)類中的敏感屬性下至少對(duì)應(yīng)預(yù)設(shè)數(shù)量的用戶屬性值;確定各個(gè)等價(jià)類中敏感屬性所對(duì)應(yīng)用戶屬性值的組合數(shù)量;通過(guò)在各個(gè)所述等價(jià)類對(duì)應(yīng)的組合數(shù)量上添加差分隱私噪聲,以對(duì)用戶數(shù)據(jù)集進(jìn)行隱私保護(hù)。這樣,根據(jù)準(zhǔn)標(biāo)識(shí)符將用戶數(shù)據(jù)集劃分成至少一個(gè)等價(jià)類,可以確保每個(gè)等價(jià)類中的用戶在敏感屬性下具有相似的用戶屬性值,減少個(gè)體用戶的可識(shí)別性,同時(shí)確定各個(gè)等價(jià)類中敏感屬性所對(duì)應(yīng)用戶屬性值的組合數(shù)量,向組合數(shù)量添加差分隱私噪聲,可以降低因用戶屬性值發(fā)生變化而導(dǎo)致的隱私泄露風(fēng)險(xiǎn),避免差分攻擊,提高數(shù)據(jù)的隱私保護(hù)水平。
9、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本申請(qǐng)。
1.一種數(shù)據(jù)保護(hù)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶數(shù)據(jù)集,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述個(gè)體屬性還包括標(biāo)識(shí)符;所述根據(jù)所述多個(gè)用戶在各個(gè)不同個(gè)體屬性下的用戶屬性值,生成所述用戶數(shù)據(jù)集,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述準(zhǔn)標(biāo)識(shí)符將所述用戶數(shù)據(jù)集劃分成至少一個(gè)等價(jià)類,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述多個(gè)用戶在所述準(zhǔn)標(biāo)識(shí)符下的用戶屬性值中包括數(shù)值型數(shù)據(jù);所述對(duì)所述多個(gè)用戶在所述準(zhǔn)標(biāo)識(shí)符下的用戶屬性值進(jìn)行泛化處理,包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述多個(gè)用戶在所述準(zhǔn)標(biāo)識(shí)符下的用戶屬性值中包括分類型數(shù)據(jù);所述對(duì)所述多個(gè)用戶在所述準(zhǔn)標(biāo)識(shí)符下的用戶屬性值進(jìn)行泛化處理,包括:
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述對(duì)所述多個(gè)用戶在所述準(zhǔn)標(biāo)識(shí)符下的用戶屬性值進(jìn)行泛化處理之前,還包括:
8.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)泛化處理后的用戶屬性值將所述用戶數(shù)據(jù)集劃分成至少一個(gè)等價(jià)類,包括:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在各個(gè)所述等價(jià)類對(duì)應(yīng)的組合數(shù)量上添加差分隱私噪聲,包括:
10.根據(jù)權(quán)利要求1至9任一項(xiàng)所述的方法,其特征在于,在所述通過(guò)在各個(gè)所述等價(jià)類對(duì)應(yīng)的組合數(shù)量上添加差分隱私噪聲,以對(duì)所述用戶數(shù)據(jù)集進(jìn)行隱私保護(hù)之后,還包括: