欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法與流程

文檔序號:11436754閱讀:235來源:國知局
本發(fā)明涉及數(shù)據(jù)隱私保護
技術領域
:,具體涉及一種動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法。
背景技術
::社會網(wǎng)絡是由許多節(jié)點和邊構成的一種社會結構,節(jié)點通常是指個人或組織,節(jié)點之間的連線即邊代表個人或組織的相互關系。隨著經(jīng)濟的快速發(fā)展,社會網(wǎng)絡的應用也越來越普及,例如facebook、linkinin等。社會網(wǎng)絡中包含著用戶有很多的個人信息,例如姓名,性別,年齡,地址,職業(yè)。在社會網(wǎng)絡圖中,屬性表示為標簽,用戶可以選擇特定屬性信息隱藏,所以標簽可以分為敏感和非敏感。最常用且直觀的一種匿名方法為簡單匿名,即移除能唯一標識用戶的顯式標識符屬性,只保留標簽表示屬性信息。許多先前的研究已經(jīng)證實簡單匿名不足以保護用戶隱私。而現(xiàn)有的研究也僅是基于靜態(tài)網(wǎng)絡設計的通用的隱私保護方法,隱私保護技術集中于研究單次數(shù)據(jù)發(fā)布,而很少是基于動態(tài)網(wǎng)絡多次發(fā)布的用途來設計隱私保護方法。發(fā)展變化的社會網(wǎng)絡數(shù)據(jù)動態(tài)發(fā)布需要動態(tài)的隱私保護方法來處理。技術實現(xiàn)要素:本發(fā)明所要解決的是現(xiàn)有隱私保護的匿名方法僅是基于靜態(tài)網(wǎng)而設計,而無法適用于動態(tài)網(wǎng)絡多次發(fā)布的問題,提供一種動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法。為解決上述問題,本發(fā)明是通過以下技術方案實現(xiàn)的:動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法,包括如下步驟:步驟1、設定隱私水平l和時間窗口w,并將分組表gs-table置為空;步驟2、初始化當前時刻t原始的社會網(wǎng)絡數(shù)據(jù);即去掉顯示的標識屬性,改用標簽表示;同時,將節(jié)點集合按度數(shù)排列,得到新的節(jié)點集合;步驟3、對帶敏感標簽的節(jié)點根據(jù)鄰居標簽相似度進行分組;步驟3.1、選擇新的節(jié)點集合中度數(shù)最大的帶敏感標簽的節(jié)點,并將該選中的節(jié)點從新的節(jié)點集合中去除;步驟3.2、計算選中的帶敏感標簽的節(jié)點和新的節(jié)點集合中的每個節(jié)點的標簽相似度,并將該選中的帶敏感標簽的節(jié)點及其標簽相似度最相似的節(jié)點歸為一組,直到該分組中所包含的節(jié)點個數(shù)達到隱私水平l;步驟3.3、重復步驟3.1-3.2,直至新的節(jié)點集合中不再含有帶敏感標簽的節(jié)點;步驟4、完成分組的工作后,將t時刻所生成的分組,合并到分組表gs-table中;步驟5、判斷當前時刻t是否小于等于時間窗口w;如果t≤w,則返回步驟2;如果t>w,則從分組表gs-table中移除t-w時刻所生成的分組;步驟6、對于分組表gs-table中的各個分組,對組內(nèi)所有節(jié)點的1-鄰居圖采用邊復制和標簽泛化的方法把原始圖匿名成同構;步驟7、發(fā)布匿名后的社會網(wǎng)絡數(shù)據(jù)。上述步驟1中,將節(jié)點集合按度數(shù)降序排列,得到新的節(jié)點序列。上述方法中,每個時刻t對應一次原始的社會網(wǎng)絡數(shù)據(jù)的更新。上述方法中,隱私水平l的取值范圍介于2~30之間。上述方法中,時間窗口w的取值范圍介于1~10之間。與現(xiàn)有技術相比,本發(fā)明具有如下特點:(1)本發(fā)明在每次分組時,都把鄰居標簽相似度最大的節(jié)點分到一組,直到所有的帶敏感標簽的節(jié)點分配合適的分組,最后對組內(nèi)的非敏感標簽的個體在匿名社會網(wǎng)絡中做隱藏標簽處理;這樣能夠保護帶敏感標簽的節(jié)點,使得帶敏感標簽的節(jié)點在匿名前后的改變小,匿名損失最??;(2)本發(fā)明對w次發(fā)布的社會網(wǎng)絡進行l(wèi)w-grouping分組,使之滿足動態(tài)網(wǎng)絡多次發(fā)布的匿名要求,t時刻已經(jīng)分組的節(jié)點,t+1時刻不能分到其他組中,這樣攻擊者就不能通過比對多次發(fā)布,使敏感信息泄露;(3)本發(fā)明建立一個gs-table表,其僅保證在連續(xù)w次發(fā)布中,對組內(nèi)節(jié)點的1-鄰居圖進行匿名化處理,而超過w次發(fā)布時候,則從表內(nèi)移除t-w時刻的分組,從而保證數(shù)據(jù)的可用性和效用性。附圖說明圖1為動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法的原理圖。圖2為動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法的流程圖。圖3為不同時刻輸入的社會網(wǎng)絡,其中(a)為t=1時刻輸入的社會網(wǎng)絡g1,(b)為t=2時刻輸入的社會網(wǎng)絡g2,(c)為t=3時刻輸入的社會網(wǎng)絡g3。圖4為不同時刻匿名后的社會網(wǎng)絡,其中(a)為t=2時刻匿名社會網(wǎng)絡g2’,(b)為t=3時刻匿名社會網(wǎng)絡g3’。具體實施方式本發(fā)明用到的社會網(wǎng)絡數(shù)據(jù)是帶標簽的簡單無向圖,攻擊者的背景知識可以是任意節(jié)點所在的特定的子圖信息,即鄰居標簽信息。社會網(wǎng)絡數(shù)據(jù)在發(fā)布前需要進行初步的匿名處理,即去掉唯一標識節(jié)點的顯示標識屬性,如姓名等,改用標簽表示屬性信息。發(fā)布的圖用gt(vt;et;lt)表示動態(tài)網(wǎng)絡t時刻的圖,其中vt為節(jié)點的集合,表示社會網(wǎng)絡中的個人或其他實體;et表示個體之間的關聯(lián),即圖中邊的集合,表示個人或?qū)嶓w間的關系,如朋友、合作關系;lt表示個體的標簽的集合。本發(fā)明提出了一個動態(tài)網(wǎng)絡多次發(fā)布隱私模型,即lw-graphic-diversity。該lw-graphic-diversity模型給定一個在時刻t帶標簽的動態(tài)網(wǎng)絡gt(vt;vst;et;lt)和一個隱私閾值l。其中vt表示節(jié)點的集合;vst表示帶敏感標簽的節(jié)點的集合;et表示邊的集合;lt表示個體的標簽的集合;γ表示節(jié)點到標簽的映射關系,γ:vt→lt。在這個模型中,把節(jié)點鄰居標簽信息作為攻擊者的背景知識,個體自身的敏感標簽,作為用戶需要保護的敏感信息,就是將原始網(wǎng)絡gt轉(zhuǎn)化為局部擾亂的匿名社會網(wǎng)絡gt’,使匿名后的網(wǎng)絡在動態(tài)發(fā)布中滿足l-多樣性要求。在動態(tài)發(fā)布的社會網(wǎng)絡經(jīng)過本發(fā)明的匿名方法處理,能夠有效防止攻擊者使用背景知識對用戶所在的發(fā)布的數(shù)據(jù)中重新定位。參見圖1,本發(fā)明所設計的動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法,其主要的數(shù)據(jù)處理過程為:首先是初始化數(shù)據(jù),即去掉顯示的標識屬性,改用標簽表示。除此之外,再將節(jié)點集合vt按度數(shù)降序排列,得到新的節(jié)點序列。接下來是對帶敏感標簽的節(jié)點根據(jù)鄰居標簽相似度進行分組,在此過程中:先選擇第一個帶敏感標簽節(jié)點,這里選擇當前節(jié)點列表中度數(shù)最大的敏感節(jié)點,此時節(jié)點集合vt中除去已選中的節(jié)點。后計算這個節(jié)點和vt中的每個節(jié)點的標簽相似度,選擇最相似的節(jié)點放在一組,直到組中節(jié)點包含的節(jié)點個數(shù)達到隱私水平l。再選擇下一個帶敏感標簽的節(jié)點,重復以上步驟直到剩下的節(jié)點集合v的個數(shù)小于l,候選集中的節(jié)點表示準備選到組中的帶敏感標簽的節(jié)點集。直到候選節(jié)點集合為空,此時所有的敏感標簽節(jié)點分到鄰居標簽信息相似度最大的組。但如果存在組g中帶標簽個體個數(shù)小于l,則從組集中移除組gi,并且將組中的節(jié)點分到和組中節(jié)點有最大標簽相似度的其他的組中去。完成分組的工作后,將生成的組集ct,即t時刻所有gi的集合,合并到gs-table中去,要保證w時刻內(nèi)隱私得到保護,對組內(nèi)節(jié)點的1-鄰居圖通過邊復制和標簽泛化的方法把原始圖匿名成同構,最后發(fā)布匿名后的社會網(wǎng)絡數(shù)據(jù)。為解決連續(xù)發(fā)布動態(tài)網(wǎng)絡的隱私問題,同時也保證數(shù)據(jù)效用性,本發(fā)明建立一個分組表gs-table,只保證連續(xù)w次發(fā)布中,對組內(nèi)節(jié)點的1-鄰居圖進行匿名化處理;而超過w時間,則從表內(nèi)移除t-w時刻的分組。gs-table是有組集構成,t=1時刻的組集記為c1,即將帶標簽節(jié)點按照標簽相似度進行分組,直到帶敏感標簽的節(jié)點所在候選集為空,分組操作結束。組集中包含的組gi,每個組中包含的是l個帶不同標簽的節(jié)點集,紅色標記的是帶敏感標簽的節(jié)點,黑色是帶非敏感標簽的節(jié)點。每個組中包含不少于1個帶敏感標簽的節(jié)點。組中的節(jié)點在發(fā)布社會網(wǎng)絡匿名圖時,組內(nèi)節(jié)點標簽要全部隱藏。t=2時刻的組集記為c2,c1組集gi中已經(jīng)分過組的節(jié)點,不能在c2組集的其他組中出現(xiàn)。t=2時刻和組gi中節(jié)點有最大鄰居標簽相似度,但還未分到任何組中,通過分組,加入到c1組集gi中,生成c2組集中的gi’。直到w次連續(xù)后,gs-table構建完成。對于t=2時刻的新添加的帶敏感標簽的節(jié)點,也進行分組操作,不能分到任何現(xiàn)有的組中,新添加的帶敏感節(jié)點要根據(jù)分組算法單獨分到新創(chuàng)建的組中,保證組內(nèi)新添加節(jié)點不少于l個帶不同標簽的個體,并且保證組內(nèi)節(jié)點全是新添加的節(jié)點。當t>w時,移除t=1時刻的c1,在滿足以上隱私要求條件下,更新ct組集中的節(jié)點。保證了數(shù)據(jù)的可用性。下面通過一個具體的實例來對本發(fā)明進行進一步說明:例:時間窗口w設為2。其中g1中的節(jié)點v1和g2中的節(jié)點v3是帶敏感標簽的節(jié)點,其他節(jié)點是不帶敏感標簽的個體。如表1,t=1時刻對每個帶敏感標簽的個體劃分到鄰居標簽相似度最大的組中。如表2,t=2時刻對節(jié)點重新分組,得到新的分組,此時gs-table中包括c1,c2。如表3,t=3時刻將t=1時刻在gs-table的分組移除,再對節(jié)點進行重新分組,此時gs-table中包括c2,c3。t=2時刻需要匿名的節(jié)點就是gi∪gi’中所有的節(jié)點。針對動態(tài)社會網(wǎng)絡多次發(fā)布防止標簽鄰居攻擊用途中這一具體應用,本發(fā)明提出了一種滿足動態(tài)社會網(wǎng)絡數(shù)據(jù)隱私匿名方法,即動態(tài)網(wǎng)絡多次發(fā)布中防止標簽鄰居攻擊的匿名方法,如圖2所示,主要的實現(xiàn)過程如下:步驟1:初始化數(shù)據(jù)集,輸入社會網(wǎng)絡gt,參數(shù)隱私水平l,時間窗口w,分組表gs-table。每個時刻t對應一次原始的社會網(wǎng)絡數(shù)據(jù)的更新。圖3為不同時刻輸入的社會網(wǎng)絡gt,t=1,2,3,w=2,l=2。步驟2:將gs-table置為空,將節(jié)點集合vt按度數(shù)進行降序排列,以方便后續(xù)程序中節(jié)點的選擇。步驟3:判斷當前時刻t是否小于等于w,若是,則轉(zhuǎn)到步驟4。否則轉(zhuǎn)到步驟9。由于算法在進行第一分組之前,當前時刻t=1即連續(xù)發(fā)布次數(shù)必定小于等于設定的時間窗口w,因此在具體的算法編譯上,步驟3關于w與w判斷的步驟,可以在每次分組步驟運行之前進行,也可以在每次完成分組步驟之后進行,且并不會影響本發(fā)明實現(xiàn)效果。在步驟3中,從以下兩方面防止多次發(fā)布鄰居標簽信息攻擊,同時保證數(shù)據(jù)的效用性:在選擇帶敏感標簽節(jié)點分組時,如果t=1時刻已經(jīng)分組的節(jié)點,t=2時刻不能分到其他組里面去,有效防止了通過比對多次發(fā)布的社會網(wǎng)絡而造成了信息的泄露。對于t時刻的新添加的帶敏感標簽的節(jié)點,也進行分組操作,不能分到任何現(xiàn)有的組中,新添加的帶敏感節(jié)點要根據(jù)分組算法單獨分到新創(chuàng)建的組中,保證組內(nèi)新添加節(jié)點不少于隱私水平l個帶不同標簽的個體,并且保證組內(nèi)任意節(jié)點是新添加的節(jié)點,帶有相似的鄰居標簽信息。當t>w時,移除t-w+1時刻的組集,在滿足以上隱私要求條件下,更新ct組集中的節(jié)點,t-w+1時刻不需要再匿名的帶非敏感標簽的節(jié)點保持在t-1時刻的匿名狀態(tài),保證了數(shù)據(jù)的可用性。步驟4:判斷當前的帶敏感標簽的節(jié)點集vst是否為空。若為空,則轉(zhuǎn)到步驟5。否則轉(zhuǎn)到步驟10。步驟5:選擇vst中帶敏感標簽的節(jié)點us,即要找到gi的第一個節(jié)點us;則當前的分組即為gi={us}。步驟6:判斷當前的分組中的節(jié)點個數(shù)是否小于隱私水平l。如果小于l,則轉(zhuǎn)到步驟7。否則轉(zhuǎn)到步驟11。步驟7:判斷當前的候選集節(jié)點個數(shù)是否大于0。如果大于0,則轉(zhuǎn)到步驟8。否則轉(zhuǎn)到步驟11。只有節(jié)點的標簽不在當前gi中,節(jié)點才會合并到候選集中。步驟8:計算當前的帶敏感標簽的節(jié)點和候選節(jié)點集中各節(jié)點的鄰居標簽相似度,得到和帶敏感標簽的節(jié)點有最大鄰居標簽相似度的節(jié)點合并到當前的分組gi中,同時vt=vt-{umax}。為了使得每個組內(nèi)的節(jié)點有相同的鄰居標簽信息,我們對節(jié)點進行適當?shù)姆纸M,所以在相同組內(nèi)的1-鄰居圖和標簽信息是同構的。帶有非敏感標簽的節(jié)點需要插入圖中,使得節(jié)點的標簽鄰居圖在每個組內(nèi)是同構的,并且組內(nèi)節(jié)點不少于l個。我們用以下指標對節(jié)點進行分組:鄰居標簽相似度(nlss)。對于兩個節(jié)點,v1的鄰居標簽信息(nlsv1)和v2的鄰居標簽信息(nlsv2),他們的鄰居標簽信息相似度可以計算為:在t=1時刻,由于當前的帶敏感標簽的節(jié)點vst不為空,所以選擇第一個帶敏感標簽的節(jié)點us,此時選擇x,則g1={x},|g1|小于l,候選節(jié)點集中的節(jié)點要和x的標簽屬性不同,且候選集中的節(jié)點數(shù)不為空,從候選節(jié)點集中選取和x的鄰居標簽相似度最大的節(jié)點,依次計算nlss(x,vit),得到max(nlss(x,y))=3/3=1,即他們有相同的鄰居標簽信息,鄰居標簽序列都為b,d,t,依據(jù)算法,選擇候選集合中的節(jié)點y,g1=g1∪{y},當前的vt=vt-{y},g1組中的節(jié)點個數(shù)不小于l,此時c1=c1∪{g1},如果gi中的節(jié)點數(shù)少于l,則將組中的節(jié)點按照鄰居標簽信息相似度,找到同組中節(jié)點有最大標簽相似度的組中去。在t=2時刻,從候選節(jié)點集中選取和的標簽相似度最大的節(jié)點,依次計算nlss(x,vit),得到max(nlss(x,z))=4/4=1,即他們有相同的鄰居標簽信息,鄰居標簽序列都為b,b,d,t,依據(jù)算法,選擇候選集合中的節(jié)點z,g1=g1∪{z},當前的vt=vt-{z},g1組中的節(jié)點個數(shù)不小于l,此時c2=c2∪{g1},如果gi中的節(jié)點數(shù)少于l,則將組中的節(jié)點按照鄰居標簽相似度,找到同組中節(jié)點有最大標簽相似度的組中去。必須指出的是在發(fā)布社會網(wǎng)絡圖中,分組的節(jié)點要進行標簽隱藏處理。步驟9:超過w時間,從表內(nèi)移除t-w時刻的分組,從gs-table中移除t-w時刻內(nèi)的組集ct。步驟10:將不少于l個不同的標簽的分組gi合并到ct中。步驟11:判斷分組gi中的節(jié)點個數(shù)是否小于l。如果是的話轉(zhuǎn)到步驟13,否則轉(zhuǎn)到步驟2。步驟12:從ct中移除當前gi,將組中的節(jié)點分到同u有最大鄰居標簽信息相似度的其他組中。步驟13:將ct合并到gs-table中。我們建立一個gs-table表,只保證連續(xù)2次發(fā)布中,對組內(nèi)節(jié)點的1-鄰居圖進行匿名化處理,超過w=2時刻,從表內(nèi)移除t=1時刻的分組。t=1時刻得到c1的節(jié)點集合為{x,y},此時gs-table中包括c1,在t=2時刻得到c2中的節(jié)點集合為{x,z},將c2合并到gs-table,此時gs-table中包括c1和c2,即在t=2時刻要對{x,y,z}做邊復制標簽泛化的匿名化處理。只要t≤w,我們會一直構建gs-table。在t=3時刻,其中t>w=2,將t=1時刻中的c1移除,并將t=3時刻的鄰居標簽相似度得到的分組c3合并到gs-table中。t=3時刻只要對{x,z}做邊復制標簽泛化的匿名化處理,對于y節(jié)點t=3時刻,不再進行接下來的匿名操作。步驟14:對組內(nèi)所有節(jié)點的1-鄰居圖通過邊復制和標簽泛化把原始圖匿名成同構。t=1時刻原始圖滿足2-graphic-diversity,對于每個帶敏感標簽的節(jié)點us,至少有1個有相同標簽鄰居圖的節(jié)點,但節(jié)點本身帶不同的標簽。攻擊者不能高于1/2的概率識別帶敏感標簽的個體x。在圖中節(jié)點x帶有敏感標簽,同時,x和y有相同的1-鄰居圖,鄰居標簽信息也相同,即鄰居標簽都為b,d,t。gs-table中,{x,y}在組g1中。且在t=1時刻有相同的鄰居結構,所以他們是不可區(qū)分的。t=2時刻原始圖中帶敏感標簽的節(jié)點x的鄰居標簽信息發(fā)生變化,為b,b,d,t。為使帶敏感標簽的個體不被泄露,敏感標簽節(jié)點分組和lw-grouping算法產(chǎn)生的鄰居標簽相似度最大的節(jié)點集{x,y,z},將x,y,z的1-鄰居圖做邊插入和標簽泛化的算法,匿名為同構。其中將節(jié)點vi的所有一步鄰居節(jié)點集合和這些節(jié)點間的邊的集合稱為節(jié)點vi的1-鄰居圖。邊插入是為了保證節(jié)點的鄰居標簽結構相似,我們先匹配標簽后匹配節(jié)點的度,t=2時刻節(jié)點x新認識了標簽為b,度為1的節(jié)點,t=2匿名圖中我們選擇一個未匹配的帶非敏感標簽的節(jié)點,標簽同樣為b,度為2的節(jié)點與y之間插入邊。之后插入其他邊使得x,y,z的1-鄰居結構圖為同構的。參見圖4(a)。t=3時刻對節(jié)點集{x,z}中節(jié)點x,z的1-鄰居圖通過邊插入和標簽泛化的算法,匿名為同構。y節(jié)點的1-鄰居結構保持在t=2時刻匿名圖的狀態(tài)。因為只要保證連續(xù)2次發(fā)布中,對組內(nèi)節(jié)點的1-鄰居圖進行匿名化處理,超過t=2時刻,從表內(nèi)移除t=1時刻的分組。參見圖4(b)。步驟15:結束。下面通過一個具體實例對本發(fā)明進行進一步說明:以下為本發(fā)明方法在本例中的社會網(wǎng)絡圖數(shù)據(jù)匿名前后保護帶敏感標簽個體的情況。t=1,t=2時刻如果攻擊者知道個體x的1-鄰居結構圖,因為個體z也有相同的標簽-鄰居圖,攻擊者不能以高于1/2的概率識別個體x,通過比對兩次發(fā)布的社會網(wǎng)絡圖,攻擊者不能唯一確定個體x及她的屬性l,因為x不是是唯一的節(jié)點度發(fā)生變化,個體及她的職業(yè)不會被泄露。t=2,t=3時刻如果攻擊者知道x的1-鄰居結構圖,因為z也有相同的標簽-鄰居圖,攻擊者不能以高于1/2的概率識別個體x,通過比對兩次發(fā)布的社會網(wǎng)絡圖,攻擊者不能唯一確定個體x及她的屬性l,因為個體x不是是唯一的節(jié)點度發(fā)生變化,個體及她的職業(yè)不會被泄露。當前第1頁12當前第1頁12
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
筠连县| 龙川县| 乐都县| 宣恩县| 班玛县| 当涂县| 丹棱县| 宕昌县| 库尔勒市| 兴和县| 承德市| 永寿县| 榆树市| 西贡区| 泾源县| 泸水县| 阳春市| 曲水县| 绥化市| 宁远县| 龙胜| 和平区| 盈江县| 聊城市| 桂平市| 犍为县| 虹口区| 海兴县| 鹿邑县| 延长县| 涞水县| 弥勒县| 修武县| 林甸县| 广宗县| 项城市| 昌图县| 清水河县| 房产| 安塞县| 义乌市|