一種基于深度學習的隱私數(shù)據(jù)保護方法與流程

文檔序號：40529205發(fā)布日期：2024-12-31 13:41閱讀：13來源：國知局

本發(fā)明涉及數(shù)據(jù)隱私，尤其涉及一種基于深度學習的隱私數(shù)據(jù)保護方法。

背景技術：

1、深度學習在圖像分類、語音處理、醫(yī)學圖像分割、自然語言處理等領域應用廣泛，優(yōu)秀的深度學習模型需要依賴大量數(shù)據(jù)集進行訓練，數(shù)據(jù)集中通常包含各種敏感信息，模型精度的不斷提升意味著個人隱私泄露的問題越發(fā)嚴重。特別是在當今數(shù)字化時代，每天都在創(chuàng)造和收集大量的數(shù)據(jù)，這些數(shù)據(jù)可以幫助數(shù)據(jù)收集者對自身或用戶有一個更好的定位，但同時要面對數(shù)據(jù)隱私的泄露的風險。

2、此類的隱私安全問題會阻礙數(shù)據(jù)共享，影響深度學習的未來發(fā)展。另一方面，出于隱私問題的擔憂，個人信息難以獲取，機構(gòu)不能通過大量差異化數(shù)據(jù)進行學習訓練來增強決策能力或預測能力，人工智能技術發(fā)展難以推進。

技術實現(xiàn)思路

1、本發(fā)明為解決大量數(shù)據(jù)集訓練過程中數(shù)據(jù)隱私泄露風險的問題，提供了一種基于深度學習的隱私數(shù)據(jù)保護方法，包括以下步驟：

2、s11、對敏感數(shù)據(jù)集進行分類和標注，識別敏感信息并進行處理；

3、s12、將敏感數(shù)據(jù)集中的敏感信息分為離散數(shù)據(jù)集和連續(xù)數(shù)據(jù)集，通過差分隱私算法將隱私預算按比例分配給連續(xù)數(shù)據(jù)集和離散數(shù)據(jù)集，并分別對所述連續(xù)數(shù)據(jù)集和離散數(shù)據(jù)集加入不同類型噪聲進行擾動；

4、s13、對擾動后的數(shù)據(jù)集進行加密，共享發(fā)布給數(shù)據(jù)使用者；

5、s14、利用隱私計算技術對共享數(shù)據(jù)的隱私風險進行實時監(jiān)控；

6、s15、根據(jù)隱私風險程度對數(shù)據(jù)共享策略進行動態(tài)調(diào)整。

7、進一步的，步驟s11中，識別敏感信息并進行處理的方法為：

8、s21、將包含樣本敏感信息的訓練集輸入深度學習模型進行訓練，獲得敏感信息識別模型；

9、s22、將敏感數(shù)據(jù)集輸入敏感信息識別模型，進行敏感信息識別；

10、s23、將識別的敏感信息進行匿名化處理，所述匿名化處理用于從敏感數(shù)據(jù)集中去除或修改可以直接識別個人身份的信息。

11、進一步的，步驟s12中，所述隱私預算用于衡量隱私保護程度，隱私預算越小，隱私保護的程度越高。

12、進一步的，步驟s12中，對所述離散數(shù)據(jù)集加入不同類型噪聲進行擾動的方法為：

13、s31、對離散數(shù)據(jù)集進行泛化處理，設置隱私預算的大小，使用bootstrap采樣從泛化的離散數(shù)據(jù)集中有放回的抽取等量的樣本數(shù)據(jù)集構(gòu)建多個決策樹，將隱私預算平分至每個決策樹上；

14、s32、將平分至每個決策樹上的隱私預算，根據(jù)等差隱私預算分配機制將隱私預算分配至各個層級，將每個節(jié)點分到的隱私預算進行二等分；

15、s33、計算樣本數(shù)據(jù)集以不同的分裂方式進行分裂時對應的基尼指數(shù)，與局部最優(yōu)特征的基尼指數(shù)進行對比，通過指數(shù)機制選出全局最優(yōu)分裂特征，所述全局最優(yōu)分裂特征被用于節(jié)點的分裂。

16、進一步的，步驟s33中，所述指數(shù)機制通過效用函數(shù)評估樣本數(shù)據(jù)集中每個可能的分裂，所述效用函數(shù)基于信息增益，根據(jù)每個分裂的效用評分，利用指數(shù)分布生成噪聲并選出全局最優(yōu)分裂特征。

17、進一步的，步驟s12中，對所述連續(xù)數(shù)據(jù)集加入不同類型噪聲進行擾動的方法為：

18、s41、根據(jù)連續(xù)數(shù)據(jù)集的語義屬性構(gòu)建具有層次結(jié)構(gòu)的樹，所述樹的葉子節(jié)點表示為所有真實取值，上層節(jié)點依據(jù)語義屬性表示為對下一層節(jié)點的泛化；

19、s42、構(gòu)建貝葉斯網(wǎng)絡，以計算每個葉子節(jié)點對其他葉子節(jié)點的平均影響，選擇對其他葉子節(jié)點影響最大的葉子節(jié)點作為第一個節(jié)點；

20、s43、根據(jù)貝葉斯網(wǎng)絡和連續(xù)數(shù)據(jù)集計算每個葉子節(jié)點與其父節(jié)點的聯(lián)合概率分布，通過拉普拉斯機制將噪聲添加至所述聯(lián)合概率分布，所述聯(lián)合概率分布用于識別連續(xù)數(shù)據(jù)集數(shù)據(jù)中的敏感屬性，并為敏感屬性分配相應的隱私預算。

21、進一步的，步驟s13中，通過加密算法對加噪后的數(shù)據(jù)進行加密，經(jīng)過處理的數(shù)據(jù)以加密的形式存儲，使用者需根據(jù)授權密碼解密數(shù)據(jù)。

22、進一步的，步驟s14中，對所述隱私風險進行實時監(jiān)控的方法為：

23、s51、在數(shù)據(jù)進行共享階段，通過隱私計算技術檢測共享數(shù)據(jù)在被使用的過程中是否有泄露個人信息的風險；

24、s52、對共享數(shù)據(jù)的使用進行實時檢測，識別和評估數(shù)據(jù)處理活動中是否會帶來個人信息的泄露；

25、s53、根據(jù)敏感數(shù)據(jù)集的屬性，定義共享數(shù)據(jù)檢測的結(jié)果為a，風險提示閾值為a，若a≥a則發(fā)起風險提示，若a<a則提示無風險；

26、s54、如果發(fā)起風險提示，則停止數(shù)據(jù)共享，提示管理人員對共享數(shù)據(jù)進行安全維護。

27、進一步的，步驟s52中，所述風險提示均需發(fā)布者手動確認是否已解除風險，確認風險解除繼續(xù)發(fā)布共享任務。

28、本發(fā)明的有益效果如下：

29、本發(fā)明提供了一種基于深度學習的隱私數(shù)據(jù)保護方法，將深度學習模型與差分隱私算法相結(jié)合，提供強大的隱私保護；通過對離散數(shù)據(jù)集和連續(xù)數(shù)據(jù)集應用不同的差分隱私機制，更加精確地控制噪聲的量，從而在保護隱私的同時盡量減少對數(shù)據(jù)準確性和實用性的影響；在數(shù)據(jù)共享前對擾動后的數(shù)據(jù)集進行加密處理，進一步增強數(shù)據(jù)共享的安全性。本發(fā)明不僅保護了數(shù)據(jù)的隱私同時也保證了數(shù)據(jù)的可用性，推動了人工智能技術的安全和可持續(xù)發(fā)展。

技術特征：

1.一種基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，所述方法包括：

2.根據(jù)權利要求1所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s11中，識別敏感信息并進行處理的方法為：

3.根據(jù)權利要求1所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s12中，所述隱私預算用于衡量隱私保護程度，隱私預算越小，隱私保護的程度越高。

4.根據(jù)權利要求1所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s12中，對所述離散數(shù)據(jù)集加入不同類型噪聲進行擾動的方法為：

5.根據(jù)權利要求4所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s33中，所述指數(shù)機制通過效用函數(shù)評估樣本數(shù)據(jù)集中每個可能的分裂，所述效用函數(shù)基于信息增益，根據(jù)每個分裂的效用評分，利用指數(shù)分布生成噪聲并選出全局最優(yōu)分裂特征。

6.根據(jù)權利要求1所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s12中，對所述連續(xù)數(shù)據(jù)集加入不同類型噪聲進行擾動的方法為：

7.根據(jù)權利要求1所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s13中，通過加密算法對加噪后的數(shù)據(jù)進行加密，經(jīng)過處理的數(shù)據(jù)以加密的形式存儲，使用者需根據(jù)授權密碼解密數(shù)據(jù)。

8.根據(jù)權利要求1所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s14中，對所述隱私風險進行實時監(jiān)控的方法為：

9.根據(jù)權利要求8所述的基于深度學習的隱私數(shù)據(jù)保護方法，其特征在于，步驟s52中，所述風險提示均需發(fā)布者手動確認是否已解除風險，確認風險解除繼續(xù)發(fā)布共享任務。

技術總結(jié)
本發(fā)明提供一種基于深度學習的隱私數(shù)據(jù)保護方法，包括以下步驟：S11、對敏感數(shù)據(jù)集進行分類和標注，識別敏感信息并進行處理；S12、將敏感數(shù)據(jù)集中的敏感信息分為離散數(shù)據(jù)集和連續(xù)數(shù)據(jù)集，分別對所述連續(xù)數(shù)據(jù)集和離散數(shù)據(jù)集加入不同類型噪聲進行擾動；S13、對擾動后的數(shù)據(jù)集進行加密，共享發(fā)布給數(shù)據(jù)使用者；S14、利用隱私計算技術對共享數(shù)據(jù)的隱私風險進行實時監(jiān)控；S15、根據(jù)隱私風險程度對數(shù)據(jù)共享策略進行動態(tài)調(diào)整。本發(fā)明基于深度學習模型結(jié)合差分隱私算法，對識別的隱私數(shù)據(jù)進行加噪處理后，對共享數(shù)據(jù)進行動態(tài)風險監(jiān)測，既能保護患者的隱私，又能對數(shù)據(jù)共享過程中存在的風險進行實時監(jiān)測與管理。

技術研發(fā)人員：吳萍,郭海寧
受保護的技術使用者：江蘇漢康東優(yōu)信息技術有限公司
技術研發(fā)日：
技術公布日：2024/12/30

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：吳萍,郭海寧
技術所有人：江蘇漢康東優(yōu)信息技術有限公司
我是此專利的發(fā)明人

上一篇：一種生物基聚脲美縫劑及其制備方法與流程
上一篇：恒壓控制電路及其恒壓控制方法和恒壓驅(qū)動器與流程

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于深度學習的隱私數(shù)據(jù)保護方法與流程