專利名稱:一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于網(wǎng)絡(luò)隱私加密技術(shù)領(lǐng)域,具體涉及一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法。
背景技術(shù):
社交網(wǎng)絡(luò)是指以一定社會關(guān)系或共同興趣為紐帶、以各種形式為在線聚合的用戶提供溝通、交互服務(wù)的互聯(lián)網(wǎng)應(yīng)用。這種以人與人關(guān)系為核心的方式建立的社會關(guān)系網(wǎng)絡(luò)映射在互聯(lián)網(wǎng)上就形成了以用戶為中心、以人為本的互聯(lián)網(wǎng)應(yīng)用。社交網(wǎng)絡(luò)上節(jié)點(diǎn)之間的聯(lián)系與線下人們之間的聯(lián)系存在一定的對應(yīng)關(guān)系,因此挖掘社交網(wǎng)絡(luò)的局部結(jié)構(gòu)信息具有極大的經(jīng)濟(jì)價值和社會價值。伴隨著Facebook、Twitter等社交網(wǎng)絡(luò)的普及與推廣,人們?nèi)找媪?xí)慣在社交網(wǎng)絡(luò)中表達(dá)自己個性、尋找感興趣的好友、跟蹤感興趣的新聞主題。如果對社交網(wǎng)絡(luò)的局部結(jié)構(gòu)進(jìn)行深入研究與分析,挖掘特定的規(guī)律可能會帶來巨大的經(jīng)濟(jì)和社會價值。如果數(shù)據(jù)擁有者直接對外發(fā)布簡單匿名化的社交網(wǎng)絡(luò),攻擊者通過多種渠道預(yù)先收集目標(biāo)用戶在網(wǎng)絡(luò)中的好友關(guān)系圖,在發(fā)布的匿名數(shù)據(jù)中搜索匹配網(wǎng)絡(luò)結(jié)構(gòu),在發(fā)布的匿名圖中重新定位目標(biāo)用戶對應(yīng)的匿名節(jié)點(diǎn),就有可能泄露用戶的個人隱私。因此社交網(wǎng)絡(luò)隱私保護(hù)技術(shù)主要在于防止攻擊者對發(fā)布的數(shù)據(jù)通過數(shù)據(jù)挖掘泄露用戶個人隱私。雖然隱私保護(hù)技術(shù)在這些年已經(jīng)得到了深入的研究與探討,但傳統(tǒng)的隱私保護(hù)技術(shù)主要是面向關(guān)系型數(shù)據(jù),用戶記錄之間并不存在直接的聯(lián)系,而是以表格的形式呈現(xiàn)出來,相應(yīng)的隱私處理方法較少考慮數(shù)據(jù)之間的關(guān)系。而社交網(wǎng)絡(luò)中各個實體之間關(guān)系是一種非常重要的信息,例如好友關(guān)系、粉絲關(guān)系等,而這些聯(lián)系都有可能被攻擊加以利用來泄露用戶隱私,傳統(tǒng)的隱私保護(hù)技術(shù)已經(jīng)不再適用于這種場景。而社交網(wǎng)絡(luò)領(lǐng)域的隱私保護(hù)技術(shù)目前雖然已有了初步的研究,Liu K在標(biāo)題為Towards identity anonymization ongraphs (Proceedings ofthe2008ACM SIGMOD international conference on Managementof data, 2008:93-106)的文獻(xiàn)中提出了防止度攻擊的社交網(wǎng)絡(luò)隱私保護(hù)方法,其通過對節(jié)點(diǎn)度的修改來匿名真實的用戶;而Zhou B在Preserving privacy in socialnetworksagainst neighborhood attacks (Proceedings of IEEE24th InternationalConferenceon Data Engineering, 2008:506-515)的文獻(xiàn)中提出了防止直接鄰居攻擊的社交網(wǎng)絡(luò)隱私保護(hù)方法,其通過對節(jié)點(diǎn)的直接鄰居結(jié)構(gòu)進(jìn)行修改以匿名真實用戶。這些方式雖然防止了簡單的隱私攻擊方式,但社交網(wǎng)絡(luò)因數(shù)據(jù)的復(fù)雜性,攻擊模型多樣性,數(shù)據(jù)應(yīng)用場景不同,要面對的攻擊方式將更加復(fù)雜。攻擊者搜集到用戶的多級鄰居關(guān)系在發(fā)布的社交網(wǎng)絡(luò)圖中搜索目標(biāo)用戶時,之前的兩種方法都不能有效的防止這種復(fù)雜的攻擊方式。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)所存在的上述技術(shù)問題,本發(fā)明提供了一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法,能夠有效地保護(hù)發(fā)布數(shù)據(jù)中用戶的個人隱私。
一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法,包括如下步驟:(I)構(gòu)建待發(fā)布社交網(wǎng)絡(luò)的無向圖H ;無向圖H中每個節(jié)點(diǎn)對應(yīng)代表每個用戶,任意兩節(jié)點(diǎn)間的連線代表對應(yīng)兩個用戶的好友關(guān)系;(2)刪除無向圖H中各節(jié)點(diǎn)的身份信息,得到無向圖G ;通過最大頻繁子圖挖掘算法從無向圖G中挖掘出最大頻繁子圖集合,并從最大頻繁子圖集合中任取出k個子圖組成待刪除子圖集合,k為大于I的自然數(shù);(3)確定待刪除子圖集合中k個子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系,進(jìn)而構(gòu)建節(jié)點(diǎn)映射表;(4)對待刪除子圖集合中各子圖進(jìn)行擴(kuò)展,計算擴(kuò)展后待刪除子圖集合的匿名代價值;(5)通過比較當(dāng)前擴(kuò)展后待刪除子圖集合的匿名代價值與上一次擴(kuò)展后待刪除子圖集合的匿名代價值,對待刪除子圖集合進(jìn)行迭代擴(kuò)展,每迭代擴(kuò)展一次則對節(jié)點(diǎn)映射表更新一次,直至迭代擴(kuò)展收斂;將迭代擴(kuò)展收斂后的待刪除子圖集合從無向圖G中刪除,得到無向圖G’,并返回步驟(2)中再對無向圖G’進(jìn)行最大頻繁子圖挖掘,依此循環(huán)操作直至無向圖G刪空;(6)根據(jù)所述的節(jié)點(diǎn)映射表,通過在無向圖G中添加映射線和虛假節(jié)點(diǎn)形成匿名同構(gòu)圖,并對該匿名同構(gòu)圖進(jìn)行發(fā)布。所述的步驟(3)中,通過深度優(yōu)先搜索算法(DFS)計算待刪除子圖集合中每個子圖的最小DFS編碼,根據(jù)最小DFS編碼確定待刪除子圖集合中k個子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系。所述的步驟(4)中,對待刪除子圖集合中各子圖進(jìn)行擴(kuò)展的方法如下:a.找出各子圖中的邊緣節(jié)點(diǎn);對于任一子圖中的任一節(jié)點(diǎn),若與其相連的其他所有節(jié)點(diǎn)不完全在該子圖內(nèi),則稱該節(jié)點(diǎn)為該子圖的邊緣節(jié)點(diǎn),與邊緣節(jié)點(diǎn)相連且不在該子圖內(nèi)的其他節(jié)點(diǎn)為邊緣節(jié)點(diǎn)的擴(kuò)展節(jié)點(diǎn);b.對于任一邊緣節(jié)點(diǎn),確定與其對應(yīng)的其他k-Ι個邊緣節(jié)點(diǎn);從這組相互對應(yīng)的邊緣節(jié)點(diǎn)中找出擴(kuò)展節(jié)點(diǎn)最多的邊緣節(jié)點(diǎn),其擴(kuò)展節(jié)點(diǎn)個數(shù)為m,將該邊緣節(jié)點(diǎn)的所有擴(kuò)展節(jié)點(diǎn)均納入其所在子圖內(nèi);c.對于這組相互對應(yīng)的邊緣節(jié)點(diǎn)中的其他任一邊緣節(jié)點(diǎn),將該邊緣節(jié)點(diǎn)的所有擴(kuò)展節(jié)點(diǎn)均納入其所在子圖內(nèi),并補(bǔ)充虛假節(jié)點(diǎn)與其相連,直至其擴(kuò)展節(jié)點(diǎn)和虛假節(jié)點(diǎn)的個數(shù)總和達(dá)到m,同時將這些虛假節(jié)點(diǎn)納入其所在子圖內(nèi),所述的虛假節(jié)點(diǎn)的屬性信息為從無向圖G中任意節(jié)點(diǎn)上復(fù)制而來;d.根據(jù)步驟b和C,遍歷待刪除子圖集合中各組相互對應(yīng)的邊緣節(jié)點(diǎn)。所述的步驟(4)中,根據(jù)以下算式計算擴(kuò)展后待刪除子圖集合的匿名代價值:C = E+0.5(k+l)H其中:C為匿名代價值,E為擴(kuò)展后待刪除子圖集合中新增加的連線條數(shù),H為擴(kuò)展后待刪除子圖集合中的跨線總數(shù);對于子圖中的任一節(jié)點(diǎn),若該節(jié)點(diǎn)與子圖外的節(jié)點(diǎn)有連線,則該連線為子圖的跨線。所述的步驟(5)中,判斷當(dāng)前擴(kuò)展后待刪除子圖集合的匿名代價值是否小于上一次擴(kuò)展后待刪除子圖集合的匿名代價值,若是,則返回執(zhí)行步驟(4)對待刪除子圖集合再次進(jìn)行擴(kuò)展;若否,則迭代擴(kuò)展收斂,使上一次擴(kuò)展后待刪除子圖集合作為迭代擴(kuò)展收斂后的待刪除子圖集合。
所述的步驟(6)中,在無向圖G中添加映射線和虛假節(jié)點(diǎn)的方法如下:A.對于無向圖G中的任一條連線,確定該連線對應(yīng)的一對節(jié)點(diǎn);B.根據(jù)映射排列順序,從節(jié)點(diǎn)映射表中確定出與這對節(jié)點(diǎn)對應(yīng)的k-Ι對映射節(jié)
占.
C.從無向圖G中找出這k-Ι對映射節(jié)點(diǎn),若有缺失,則在無向圖G中添加虛假節(jié)點(diǎn)作為映射節(jié)點(diǎn),然后通過映射線使每對映射節(jié)點(diǎn)連接;D.根據(jù)步驟A C,遍歷無向圖G中的每一條連線。本發(fā)明有益的效果如下:(I)本發(fā)明通過對添加若干虛假節(jié)點(diǎn)使得每個節(jié)點(diǎn)都有與之對稱的其它節(jié)點(diǎn),避免用戶身份的重新定位,有效的保護(hù)用戶的個人隱私安全。(2)本發(fā)明通過對社交網(wǎng)絡(luò)圖局部結(jié)構(gòu)的精細(xì)修改,可以安全的對外發(fā)布社交網(wǎng)絡(luò)圖數(shù)據(jù),適用于研究社交網(wǎng)絡(luò)局部結(jié)構(gòu)特征分析統(tǒng)計,促進(jìn)了數(shù)據(jù)挖掘技術(shù)在社交網(wǎng)絡(luò)領(lǐng)域的研究與應(yīng)用。
圖1為本發(fā)明方法的步驟流程示意圖。圖2為子圖挖掘的示意圖。圖3為子圖擴(kuò)展的示意圖。圖4為本發(fā)明方法與現(xiàn)有兩種傳統(tǒng)算法在真實數(shù)據(jù)集下的子圖匹配對比示意圖。圖5為本發(fā)明方法與現(xiàn)有兩種傳統(tǒng)算法在模擬數(shù)據(jù)集下的子圖匹配對比示意圖。
具體實施例方式為了更為具體地描述本發(fā)明,下面結(jié)合附圖及具體實施方式
對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。如圖1所示,一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法,包括如下步驟:(I)構(gòu)建待發(fā)布社交網(wǎng)絡(luò)的無向圖;對于待發(fā)布的社交網(wǎng)絡(luò),可以抽象了為一個無向圖H,各個用戶可看作是圖中的節(jié)點(diǎn),用戶之間的聯(lián)系可看作是節(jié)點(diǎn)間的連線,用戶的屬性信息可看作是節(jié)點(diǎn)的屬性,整個無向圖H可用四元組表示為H= {V, B,S,L},其中V表示節(jié)點(diǎn)集合,B表示連線集合,S表示屬性集合,L表示屬性與節(jié)點(diǎn)的映射關(guān)系。(2)刪除無向圖H中各節(jié)點(diǎn)屬性中的身份信息(如用戶姓名、身份證號等),得到無向圖G; 然后如圖2所示,通過最大頻繁子圖挖掘算法從無向圖G中挖掘出最大頻繁子圖集合,并從最大頻繁子圖集合中任取出k個子圖作為待刪除子圖集合,本實施方式中k取10 ;本實施方式通過最大頻繁子圖挖掘算法Margin在無向圖G尋找最大頻繁子圖模式gf。在給定的無向圖G和最小支持度min_sup,如果子圖g在無向圖G中至少出現(xiàn)min_sup次,并且匹配的子圖gi均為邊不相交,則子圖g為頻繁子圖。在頻繁子圖集合中,不被任意一個其它頻繁子圖所包含的頻繁子圖稱為最大頻繁子圖;此處的最小支持度min_SUp設(shè)置為K-同構(gòu)匿名圖的匿名系數(shù)值k。(3)確定待刪除子圖集合中k個子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系,進(jìn)而構(gòu)建節(jié)點(diǎn)映射表;本實施方式通過深度優(yōu)先搜索算法(DFS)計算待刪除子圖集合中每個子圖的最小DFS編碼,根據(jù)最小DFS編碼確定待刪除子圖集合中k個子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系。DFS編碼是指對無向圖G進(jìn)行深度優(yōu)先遍歷時所形成的DFS樹的節(jié)點(diǎn)序列。在圖G中,所有在DFS樹中出現(xiàn)的邊稱為前向邊,表示為F(T);而所有在DFS樹沒有出現(xiàn)的邊稱為后向邊,表示為B(T)。DFS字典序是指在一個無標(biāo)簽圖中,每條邊都可以用e(i,j)來表示,假設(shè)O1=Q1, ji), e2=(i2, j2),當(dāng)且僅當(dāng)下列任一條件成立時有O1^e2:e” e2 e F(T) and J-^j2OrΛ J-^j2e1; e2 e B (T) and I^i2Or I1=I2 Λ J-^j2θι e B (T), e2 e F (T) and I^j2θι e F (T), e2 e B (T) and j!彡 i2根據(jù)以上規(guī)則將字典序<e擴(kuò)展到DFS編碼序列的比較<s。已知S1=G1, a2,…),S2=Od1, b2,…),如果下列任一條件成立時有S1^S2:彐t,Vk < t, ak = bk and at <e btm < n, Vk < m and at = bt根據(jù)運(yùn)算符<s可計算出最小DFS編碼。計算各子圖的最小DFS編碼,根據(jù)各子圖的最小DFS編碼可得這個分組內(nèi)各子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系,填充至節(jié)點(diǎn)映射表VMT。(4)對待刪除子圖集合中各子圖進(jìn)行擴(kuò)展:a.找出各子圖中的邊緣節(jié)點(diǎn);對于任一子圖中的任一節(jié)點(diǎn),若與其相連的其他所有節(jié)點(diǎn)不完全在該子圖內(nèi),則稱該節(jié)點(diǎn)為該子圖的邊緣節(jié)點(diǎn),與邊緣節(jié)點(diǎn)相連且不在該子圖內(nèi)的其他節(jié)點(diǎn)為邊緣節(jié)點(diǎn)的擴(kuò)展節(jié)點(diǎn);b.對于任一邊緣節(jié)點(diǎn),確定與其對應(yīng)的其他k-Ι個邊緣節(jié)點(diǎn);從這組相互對應(yīng)的邊緣節(jié)點(diǎn)中找出擴(kuò)展節(jié)點(diǎn)最多的邊緣節(jié)點(diǎn),其擴(kuò)展節(jié)點(diǎn)個數(shù)為m,將該邊緣節(jié)點(diǎn)的所有擴(kuò)展節(jié)點(diǎn)均納入其所在子圖內(nèi);c.對于這組相互對應(yīng)的邊緣節(jié)點(diǎn)中的其他任一邊緣節(jié)點(diǎn),將該邊緣節(jié)點(diǎn)的所有擴(kuò)展節(jié)點(diǎn)均納入其所在子圖內(nèi),并補(bǔ)充虛假節(jié)點(diǎn)與其相連,直至其擴(kuò)展節(jié)點(diǎn)和虛假節(jié)點(diǎn)的個數(shù)總和達(dá)到m,同時將這些虛假節(jié)點(diǎn)納入其所在子圖內(nèi),虛假節(jié)點(diǎn)的屬性信息為從無向圖G中任意節(jié)點(diǎn)上復(fù)制而來;如圖3所示,其中黑色點(diǎn)為虛假節(jié)點(diǎn);d.根據(jù)步驟b和C,遍歷待刪除子圖集合中各組相互對應(yīng)的邊緣節(jié)點(diǎn)。根據(jù)以下算式計算擴(kuò)展后待刪除子圖集合的匿名代價值:C = E+0.5(k+l)H其中:C為匿名代價值,E為擴(kuò)展后待刪除子圖集合中新增加的連線條數(shù),H為擴(kuò)展后待刪除子圖集合中的跨線總數(shù);對于子圖中的任一節(jié)點(diǎn),若該節(jié)點(diǎn)與子圖外的節(jié)點(diǎn)有連線,則該連線為子圖的跨線。(5)通過比較當(dāng)前擴(kuò)展后待刪除子圖集合的匿名代價值與上一次擴(kuò)展后待刪除子圖集合的匿名代價值,對待刪除子圖集合進(jìn)行迭代擴(kuò)展: 判斷當(dāng)前擴(kuò)展后待刪除子圖集合的匿名代價值是否小于上一次擴(kuò)展后待刪除子圖集合的匿名代價值,若是,則返回執(zhí)行步驟(4)對待刪除子圖集合再次進(jìn)行擴(kuò)展;若否,則迭代擴(kuò)展收斂,使上一次擴(kuò)展后待刪除子圖集合作為迭代擴(kuò)展收斂后的待刪除子圖集合。其中,每迭代擴(kuò)展一次則對節(jié)點(diǎn)映射表更新一次,初始狀態(tài)待刪除子圖集合的匿名代價值為 C = 0.5(k+l)H。將迭代擴(kuò)展收斂后的待刪除子圖集合從無向圖G中刪除,得到無向圖G’,并返回步驟(2)中再對無向圖G’進(jìn)行最大頻繁子圖挖掘,依此循環(huán)操作直至無向圖G刪空;(6)根據(jù)節(jié)點(diǎn)映射表,通過在無向圖G中添加映射線和虛假節(jié)點(diǎn)形成匿名同構(gòu)圖:A.對于無向圖G中的任一條連線,確定該連線對應(yīng)的一對節(jié)點(diǎn);B.根據(jù)映射排列順序,從節(jié)點(diǎn)映射表中確定出與這對節(jié)點(diǎn)對應(yīng)的k-Ι對映射節(jié)
占.
C.從無向圖G中找出這k-Ι對映射節(jié)點(diǎn),若有缺失,則在無向圖G中添加虛假節(jié)點(diǎn)作為映射節(jié)點(diǎn),然后通過映射線使每對映射節(jié)點(diǎn)連接;D.根據(jù)步驟A C,遍歷無向圖G中的每一條連線,形成匿名同構(gòu)圖。最后,對該匿名同構(gòu)圖進(jìn)行發(fā)布。以下我們通過實驗對本實施方式進(jìn)行驗證,實驗所需數(shù)據(jù)集分別采用實際收集的社交網(wǎng)絡(luò)數(shù)據(jù)集和按社交網(wǎng)絡(luò)特定規(guī)律通過模擬程序生成兩部分。實際實驗數(shù)據(jù)集是通過應(yīng)用Social Circle在FaceBook網(wǎng)絡(luò)中實際收集所得,專門用于研究社交網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)圖,是社交網(wǎng)絡(luò)結(jié)構(gòu)的一個典型代表,其中包含4039個節(jié)點(diǎn),88234條邊,以SC表示該數(shù)據(jù)集。而模擬實驗數(shù)據(jù)集是通過軟件Pajek以無尺度網(wǎng)絡(luò)(Scale-Free Network)為模型生成。在測試隱私保護(hù)的有效性時,假定攻擊者已經(jīng)預(yù)先收集了目標(biāo)節(jié)點(diǎn)周圍的鄰居結(jié)構(gòu)信息,實驗中從原始圖中隨機(jī)抽取一些子圖作為該結(jié)構(gòu)信息g。通過在匿名處理后的K-同構(gòu)匿名圖G*中查詢子圖g,將返回匹配的子圖個數(shù)與系統(tǒng)參數(shù)k (設(shè)定為10)比較,以確定本實施方式在隱私保護(hù)強(qiáng)度方面是否達(dá)到要求。實驗的對比算法有防止直接鄰居關(guān)系攻擊算法Against-1Neighbor和防止度攻擊算法Against-Degree,這兩種將在本次實驗中與本實施方式算法(Against-Substructure)進(jìn)行對比,評估在不同的隱私保護(hù)系統(tǒng)參數(shù)k下各個算法的表現(xiàn)。在有效性測試中,分別在真實數(shù)據(jù)集SC和模擬數(shù)據(jù)集SF上進(jìn)行實驗,隱私保護(hù)系統(tǒng)參數(shù)k設(shè)置為10,從原圖中隨機(jī)抽取不同大小的子圖,測試各個算法能匹配子圖的數(shù)量,實驗結(jié)果分別如圖4和圖5所示。圖4和圖5表明,隨著樣本子圖邊的增加,在匿名圖中能匹配子圖的個數(shù)也在逐漸減少。其中在真實網(wǎng)絡(luò)SC中當(dāng)子圖邊數(shù)達(dá)到25條時,Against-lNeighbor、Against_Degree兩種算法匹配的子圖數(shù)量低于隱私安全值k (10),已經(jīng)不能滿足k-匿名圖的要求,存在被攻擊者重新定位用戶真實節(jié)點(diǎn)的風(fēng)險。而本實施方式算法能夠匹配的子圖數(shù)量一直在隱私安全值k之上,隨著子圖邊數(shù)增加,最后匹配數(shù)量保持為隱私安全值k。
權(quán)利要求
1.一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法,包括如下步驟: (O構(gòu)建待發(fā)布社交網(wǎng)絡(luò)的無向圖H ;無向圖H中每個節(jié)點(diǎn)對應(yīng)代表每個用戶,任意兩節(jié)點(diǎn)間的連線代表對應(yīng)兩個用戶的好友關(guān)系; (2)刪除無向圖H中各節(jié)點(diǎn)的身份信息,得到無向圖G;通過最大頻繁子圖挖掘算法從無向圖G中挖掘出最大頻繁子圖集合,并從最大頻繁子圖集合中任取出k個子圖組成待刪除子圖集合,k為大于I的自然數(shù); (3)確定待刪除子圖集合中k個子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系,進(jìn)而構(gòu)建節(jié)點(diǎn)映射表; (4)對待刪除子圖集合中各子圖進(jìn)行擴(kuò)展,計算擴(kuò)展后待刪除子圖集合的匿名代價值; (5)通過比較當(dāng)前擴(kuò)展后待刪除子圖集合的匿名代價值與上一次擴(kuò)展后待刪除子圖集合的匿名代價值,對待刪除子圖集合進(jìn)行迭代擴(kuò)展,每迭代擴(kuò)展一次則對節(jié)點(diǎn)映射表更新一次,直至迭代擴(kuò)展收斂;將迭代擴(kuò)展收斂后的待刪除子圖集合從無向圖G中刪除,得到無向圖G’,并返回步驟(2)中再對無向圖G’進(jìn)行最大頻繁子圖挖掘,依此循環(huán)操作直至無向圖G刪空; (6)根據(jù)所述的節(jié)點(diǎn)映射表,通過在無向圖G中添加映射線和虛假節(jié)點(diǎn)形成匿名同構(gòu)圖,并對該匿名同構(gòu)圖進(jìn)行發(fā)布。
2.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)隱私保護(hù)方法,其特征在于:所述的步驟(3)中,通過深度優(yōu)先搜索算法計算待刪除子圖集合中每個子圖的最小DFS編碼,根據(jù)最小DFS編碼確定待刪除子圖集合中k個子圖間節(jié)點(diǎn)的對應(yīng)關(guān)系。
3.根據(jù)權(quán) 利要求1所述的社交網(wǎng)絡(luò)隱私保護(hù)方法,其特征在于:所述的步驟(4)中,對待刪除子圖集合中各子圖進(jìn)行擴(kuò)展的方法如下: a.找出各子圖中的邊緣節(jié)點(diǎn);對于任一子圖中的任一節(jié)點(diǎn),若與其相連的其他所有節(jié)點(diǎn)不完全在該子圖內(nèi),則稱該節(jié)點(diǎn)為該子圖的邊緣節(jié)點(diǎn),與邊緣節(jié)點(diǎn)相連且不在該子圖內(nèi)的其他節(jié)點(diǎn)為邊緣節(jié)點(diǎn)的擴(kuò)展節(jié)點(diǎn); b.對于任一邊緣節(jié)點(diǎn),確定與其對應(yīng)的其他k-Ι個邊緣節(jié)點(diǎn);從這組相互對應(yīng)的邊緣節(jié)點(diǎn)中找出擴(kuò)展節(jié)點(diǎn)最多的邊緣節(jié)點(diǎn),其擴(kuò)展節(jié)點(diǎn)個數(shù)為m,將該邊緣節(jié)點(diǎn)的所有擴(kuò)展節(jié)點(diǎn)均納入其所在子圖內(nèi); c.對于這組相互對應(yīng)的邊緣節(jié)點(diǎn)中的其他任一邊緣節(jié)點(diǎn),將該邊緣節(jié)點(diǎn)的所有擴(kuò)展節(jié)點(diǎn)均納入其所在子圖內(nèi),并補(bǔ)充虛假節(jié)點(diǎn)與其相連,直至其擴(kuò)展節(jié)點(diǎn)和虛假節(jié)點(diǎn)的個數(shù)總和達(dá)到m,同時將這些虛假節(jié)點(diǎn)納入其所在子圖內(nèi),所述的虛假節(jié)點(diǎn)的屬性信息為從無向圖G中任意節(jié)點(diǎn)上復(fù)制而來; d.根據(jù)步驟b和C,遍歷待刪除子圖集合中各組相互對應(yīng)的邊緣節(jié)點(diǎn)。
4.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)隱私保護(hù)方法,其特征在于:所述的步驟(4)中,根據(jù)以下算式計算擴(kuò)展后待刪除子圖集合的匿名代價值:C = E+0.5(k+l)H 其中:C為匿名代價值,E為擴(kuò)展后待刪除子圖集合中新增加的連線條數(shù),H為擴(kuò)展后待刪除子圖集合中的跨線總數(shù);對于子圖中的任一節(jié)點(diǎn),若該節(jié)點(diǎn)與子圖外的節(jié)點(diǎn)有連線,則該連線為子圖的跨線。
5.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)隱私保護(hù)方法,其特征在于:所述的步驟(5)中,判斷當(dāng)前擴(kuò)展后待刪除子圖集合的匿名代價值是否小于上一次擴(kuò)展后待刪除子圖集合的匿名代價值,若是,則返回執(zhí)行步驟(4)對待刪除子圖集合再次進(jìn)行擴(kuò)展;若否,則迭代擴(kuò)展收斂,使上一次擴(kuò)展后待刪除子圖集合作為迭代擴(kuò)展收斂后的待刪除子圖集合。
6.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)隱私保護(hù)方法,其特征在于:所述的步驟(6)中,在無向圖G中添加映射線和虛假節(jié)點(diǎn)的方法如下: A.對于無向圖G中的任一條連線,確定該連線對應(yīng)的一對節(jié)點(diǎn); B.根據(jù)映射排列順序,從節(jié)點(diǎn)映射表中確定出與這對節(jié)點(diǎn)對應(yīng)的k-Ι對映射節(jié)點(diǎn); C.從無向圖G中找出這k-Ι對映射節(jié)點(diǎn),若有缺失,則在無向圖G中添加虛假節(jié)點(diǎn)作為映射節(jié)點(diǎn),然后通過映射線使每對映射節(jié)點(diǎn)連接; D.根據(jù)步驟A C,遍歷無 向圖G中的每一條連線。
全文摘要
本發(fā)明公開了一種基于無向圖修改的社交網(wǎng)絡(luò)隱私保護(hù)方法,包括(1)構(gòu)建社交網(wǎng)絡(luò)的無向圖;(2)挖掘最大頻繁子圖;(3)構(gòu)建節(jié)點(diǎn)映射關(guān)系;(4)對子圖進(jìn)行迭代擴(kuò)展并完善映射表;(6)根據(jù)映射表,在無向圖中添加映射線和虛假節(jié)點(diǎn)形成匿名同構(gòu)圖。本發(fā)明通過對添加若干虛假節(jié)點(diǎn)使得每個節(jié)點(diǎn)都有與之對稱的其它節(jié)點(diǎn),避免用戶身份的重新定位,有效的保護(hù)用戶的個人隱私安全;另外本發(fā)明通過對社交網(wǎng)絡(luò)圖局部結(jié)構(gòu)的精細(xì)修改,可以安全的對外發(fā)布社交網(wǎng)絡(luò)圖數(shù)據(jù),適用于研究社交網(wǎng)絡(luò)局部結(jié)構(gòu)特征分析統(tǒng)計,促進(jìn)了數(shù)據(jù)挖掘技術(shù)在社交網(wǎng)絡(luò)領(lǐng)域的研究與應(yīng)用。
文檔編號G06F17/30GK103218397SQ20131007873
公開日2013年7月24日 申請日期2013年3月12日 優(yōu)先權(quán)日2013年3月12日
發(fā)明者尹建偉, 項克林, 李瑩, 吳健, 鄧水光, 吳朝暉 申請人:浙江大學(xué)