欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法

文檔序號:6506836閱讀:468來源:國知局
一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法
【專利摘要】本發(fā)明公開了一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法,屬于圖數(shù)據(jù)挖掘和分析領(lǐng)域,包括:對匿名圖數(shù)據(jù)進(jìn)行挖掘,得到每個快照的前k個核節(jié)點(diǎn);對每個快照,得到以其核節(jié)點(diǎn)為頂點(diǎn)的導(dǎo)出子圖;對每個導(dǎo)出子圖,將其轉(zhuǎn)換為對應(yīng)的帶權(quán)完全圖;對每個帶權(quán)完全圖,建立其到下一帶權(quán)完全圖的映射;關(guān)聯(lián)所有映射,得到核貫穿;迭代式地,以當(dāng)前貫穿集合為基礎(chǔ),在匿名圖數(shù)據(jù)的各個快照中向周邊擴(kuò)展一個貫穿;達(dá)到收斂條件時,停止擴(kuò)展,得到全貫穿。采用本發(fā)明提供的方法可以用于對采用匿名化技術(shù)發(fā)布的同一圖數(shù)據(jù)源在不同時間點(diǎn)的多個快照進(jìn)行演化分析,克服了現(xiàn)有技術(shù)中匿名圖數(shù)據(jù)不能進(jìn)行演化分析的問題。
【專利說明】一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖數(shù)據(jù)挖掘與分析【技術(shù)領(lǐng)域】,尤其涉及一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法。
【背景技術(shù)】
[0002]圖是計(jì)算機(jī)科學(xué)中最常用的一類抽象數(shù)據(jù)結(jié)構(gòu),在結(jié)構(gòu)和語義方面比線性表和樹更為復(fù)雜,更具有一般性表示能力?,F(xiàn)實(shí)世界中的許多應(yīng)用場景都需要用圖結(jié)構(gòu)表示,與圖相關(guān)的處理和應(yīng)用幾乎無所不在。以我們身在其中的社會網(wǎng)絡(luò)為例,它是一種典型的以圖為基本結(jié)構(gòu)的數(shù)據(jù)。社交網(wǎng)絡(luò)體現(xiàn)了朋友之間的社交聯(lián)系,這種社交聯(lián)系的復(fù)雜性隨人類歷史進(jìn)程所發(fā)生的各種技術(shù)進(jìn)步不斷增加,包括便利人們長途旅行的交通技術(shù)、全球通信技術(shù)以及數(shù)字化交流與互動技術(shù),等等。
[0003]近年來,關(guān)于大規(guī)模圖數(shù)據(jù)的研究呈爆炸性增長,主要得益于人們可以得到越來越多的大規(guī)模圖數(shù)據(jù),尤其是社會網(wǎng)絡(luò)數(shù)據(jù)。Internet技術(shù)、大容量存儲技術(shù)的迅猛發(fā)展以及數(shù)據(jù)共享范圍的逐步擴(kuò)大使得數(shù)據(jù)的自動收集和發(fā)布越來越方便。在數(shù)據(jù)發(fā)布過程中隱私泄露問題也日益突出,因此隱私保護(hù)問題就顯得尤為重要。數(shù)據(jù)發(fā)布中隱私保護(hù)對象主要是對用戶敏感數(shù)據(jù)與個體身份之間的對應(yīng)關(guān)系。一般通過刪除標(biāo)識符的方法發(fā)布數(shù)據(jù)是無法阻止隱私泄露的,攻擊者可以通過鏈接攻擊獲取個體的隱私數(shù)據(jù)。匿名化技術(shù)可有效地解決鏈接攻擊所帶來的隱私泄露問題。自從1998年Samarati等人首次提出匿名化概念以來,國內(nèi)外專家學(xué)者們對匿名化技術(shù)開展了廣泛深入的研究工作以尋求防止或減少隱私泄露的有效方法,取得了一系列相關(guān)研究成果。匿名化技術(shù)由于能夠在數(shù)據(jù)發(fā)布環(huán)境下防止用戶敏感數(shù)據(jù)被泄露,同時又能保證發(fā)布數(shù)據(jù)的真實(shí)性,在實(shí)際應(yīng)用領(lǐng)域受到廣泛關(guān)注。
[0004]然而,目前針對圖數(shù)據(jù)的匿名化技術(shù)研究僅關(guān)注單次發(fā)布的靜態(tài)數(shù)據(jù),對動態(tài)更新、連續(xù)發(fā)布的圖數(shù)據(jù)的匿名化技術(shù)研究非常不足。由此引發(fā)的一大問題是數(shù)據(jù)分析師僅能夠?qū)δ涿蟮膱D數(shù)據(jù)進(jìn)行靜態(tài)分析,而無法對采用匿名化技術(shù)發(fā)布的同一圖數(shù)據(jù)源在不同時間點(diǎn)的多個快照進(jìn)行演化分析。圖數(shù)據(jù)的演化分析涉及了圖論、概率論、生物數(shù)學(xué)的相關(guān)內(nèi)容,主要研究圖數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)如何作用于群體的進(jìn)化演變,是圖數(shù)據(jù)挖掘與分析領(lǐng)域的一大重要課題。現(xiàn)有的匿名化技術(shù)由于破壞了圖數(shù)據(jù)中的標(biāo)識信息,割裂了快照之間的聯(lián)系,使得演化分析無法進(jìn)行。

【發(fā)明內(nèi)容】

[0005](一)要解決的技術(shù)問題
[0006]針對現(xiàn)有技術(shù)的不足,本發(fā)明所要解決的技術(shù)問題是:如何提供一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法,能夠?qū)Σ捎媚涿夹g(shù)發(fā)布的同一圖數(shù)據(jù)源在不同時間點(diǎn)的多個快照進(jìn)行演化分析。
[0007](二)技術(shù)方案
[0008]為了解決上述技術(shù)問題,本發(fā)明提供了一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法,包括如下步驟:
[0009]A、建立匿名圖數(shù)據(jù)各個快照的核心節(jié)點(diǎn)之間的映射,關(guān)聯(lián)所有映射,得到匿名圖數(shù)據(jù)的核貫穿集;
[0010]B、利用節(jié)點(diǎn)匹配算法,對上述核貫穿集以外的各個快照的其他節(jié)點(diǎn)進(jìn)行匹配,關(guān)聯(lián)能匹配的節(jié)點(diǎn),將核貫穿集擴(kuò)展為全貫穿集;
[0011]所述貫穿是指匿名圖數(shù)據(jù)的各個快照中所有指代相同對象的節(jié)點(diǎn)按快照的時間順序串成的節(jié)點(diǎn)鏈;所述核貫穿是指由匿名圖數(shù)據(jù)各個快照的核心節(jié)點(diǎn)組成的貫穿。
[0012]具體地,所述步驟A具體包括如下步驟:
[0013]Al、對匿名圖數(shù)據(jù)進(jìn)行挖掘,得到每個快照的k個核心節(jié)點(diǎn),k為大于I的整數(shù);
[0014]A2、以上述快照的核心節(jié)點(diǎn)為節(jié)點(diǎn)建立各個快照的導(dǎo)出子圖;
[0015]A3、將上述各個導(dǎo)出子圖轉(zhuǎn)換為對應(yīng)的帶權(quán)完全圖;
[0016]A4、按照快照的時間順序,依次建立每個帶權(quán)完全圖到下一帶權(quán)完全圖節(jié)點(diǎn)之間的一一映射,其中最后一個帶權(quán)完全圖的節(jié)點(diǎn)映射到第一個帶權(quán)完全圖的節(jié)點(diǎn);
[0017]A5、關(guān)聯(lián)所有映射,得到核貫穿集。
[0018]進(jìn)一步地,所述步驟Al具體為:
[0019]對每個快照,按照節(jié)點(diǎn)的核心程度從大到小進(jìn)行排序,排序結(jié)果的前k個節(jié)點(diǎn)即為該快照的核心節(jié)點(diǎn)。
.[0020]優(yōu)選地,所述核心程度是以節(jié)點(diǎn)的度來衡量的,節(jié)點(diǎn)的度越大,則其核心程度越聞。
[0021]進(jìn)一步地,所述步驟A3具體為:
[0022]以所述導(dǎo)出子圖的頂點(diǎn)為頂點(diǎn)構(gòu)造帶權(quán)完全圖,使任意兩頂點(diǎn)之間都有一條邊相連,優(yōu)選地,邊上的權(quán)重為:
【權(quán)利要求】
1.一種對匿名圖數(shù)據(jù)進(jìn)行演化分析的方法,其特征在于,包括如下步驟: A、建立匿名圖數(shù)據(jù)各個快照的核心節(jié)點(diǎn)之間的映射,關(guān)聯(lián)所有映射,得到匿名圖數(shù)據(jù)的核貫穿集; B、利用節(jié)點(diǎn)匹配算法,對上述核貫穿集以外的各個快照的其他節(jié)點(diǎn)進(jìn)行匹配,關(guān)聯(lián)能匹配的節(jié)點(diǎn),將核貫穿集擴(kuò)展為全貫穿集; 所述貫穿是指匿名圖數(shù)據(jù)的各個快照中所有指代相同對象的節(jié)點(diǎn)按快照的時間順序串成的節(jié)點(diǎn)鏈;所述核貫穿是指由匿名圖數(shù)據(jù)各個快照的核心節(jié)點(diǎn)組成的貫穿。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A具體包括如下步驟: Al、對匿名圖數(shù)據(jù)進(jìn)行挖掘,得到每個快照的k個核心節(jié)點(diǎn),k為大于I的整數(shù); A2、以上述快照的核心節(jié)點(diǎn)為節(jié)點(diǎn)建立各個快照的導(dǎo)出子圖; A3、將上述各個導(dǎo)出子圖轉(zhuǎn)換為對應(yīng)的帶權(quán)完全圖; A4、按照快照的時間順序,依次建立每個帶權(quán)完全圖到下一帶權(quán)完全圖節(jié)點(diǎn)之間的一一映射,其中最后一個帶權(quán)完全圖的節(jié)點(diǎn)映射到第一個帶權(quán)完全圖的節(jié)點(diǎn); A5、關(guān)聯(lián)所有映射,得到核貫穿集。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟Al具體為: 對每個快照,按照節(jié)點(diǎn)的核心程度從大到小進(jìn)行排序,排序結(jié)果的前k個節(jié)點(diǎn)即為該快照的核心節(jié)點(diǎn)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述核心程度是以節(jié)點(diǎn)的度來衡量的,節(jié)點(diǎn)的度越大,則其核心程度越高。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟A3具體為: 以所述導(dǎo)出子圖的頂點(diǎn)為頂點(diǎn)構(gòu)造帶權(quán)完全圖,使任意兩頂點(diǎn)之間都有一條邊相連,且邊上的權(quán)重為:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟A4中映射具體是通過以下步驟建立的: 求解最佳映射,使兩個帶權(quán)完全圖的所有節(jié)點(diǎn)映射之后,對應(yīng)邊上權(quán)重的差值總和最小。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟A5中的關(guān)聯(lián)所有映射,具體包括: A51、構(gòu)造一個空的核貫穿集;A52、在第一帶權(quán)完全圖中任取一個節(jié)點(diǎn)V,將其按照上述步驟建立的映射逐次映射到下一帶權(quán)完全圖中的節(jié)點(diǎn),直至得到其在最后一個帶權(quán)完全圖中的映射節(jié)點(diǎn),再按照最后一個帶權(quán)完全圖到第一帶權(quán)完全圖的映射關(guān)系,得到其在第一帶權(quán)完全圖中的映射節(jié)點(diǎn),如果V' = V,則將節(jié)點(diǎn)V及其在各個帶權(quán)完全圖中的映射節(jié)點(diǎn)構(gòu)成的節(jié)點(diǎn)鏈作為一條核貫穿并入步驟A51建立的核貫穿集; A53、更新上述節(jié)點(diǎn)V,重復(fù)步驟A52,直到處理完帶權(quán)完全圖的所有k個節(jié)點(diǎn),得到匿名圖數(shù)據(jù)的核貫穿集。
8.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法,其特征在于,所述步驟B具體包括: B1、將步驟A得到的核貫穿集作為當(dāng)前貫穿集; B2、若達(dá)到收斂條件,則停止擴(kuò)展,得到全貫穿;否則執(zhí)行步驟B3 ; B3、以當(dāng)前貫穿集為基礎(chǔ),在匿名圖數(shù)據(jù)的各個快照中向周邊擴(kuò)展一個貫穿,將該貫穿加入到當(dāng)前貫穿集中,執(zhí)行步驟B2。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述步驟B3具體包括: 在第一快照的不屬于當(dāng)前貫穿集的節(jié)點(diǎn)中任取一點(diǎn)U,將其按照快照的時間順序逐次得到其在下一快照中的匹配節(jié)點(diǎn),直到得到其在最后一個快照中的匹配節(jié)點(diǎn),上述匹配節(jié)點(diǎn)均不屬于當(dāng)前貫穿集,然后再將u在最后一個快照中的匹配節(jié)點(diǎn)與第一快照中的節(jié)點(diǎn)進(jìn)行匹配,得到節(jié)點(diǎn)Ui,若U ' =U,則將U及其在各個快照中的匹配節(jié)點(diǎn)構(gòu)成的節(jié)點(diǎn)鏈作為一條貫穿并入當(dāng)前貫穿集。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述匹配節(jié)點(diǎn)是通過執(zhí)行以下步驟獲得的: B31、記W1表示第i個快照中的待匹配節(jié)點(diǎn),在第i個快照中求M1的屬于當(dāng)前貫穿的所有鄰居節(jié)點(diǎn)的集合%,根據(jù)當(dāng)前貫穿,V映射到下一快照中的集合記為以1(),其中I i η ; 所述fi表示當(dāng)前貫穿中,屬于第i個快照的節(jié)點(diǎn)到屬于第[(i+l)mod η]個快照的節(jié)點(diǎn)的映射; Β32、在第[(i+l)mod η]個快照中任取一個不屬于當(dāng)前貫穿的節(jié)點(diǎn)W,計(jì)算與〃的相似度:
11.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述步驟Β2中的收斂條件是指: 若第一快照的所有當(dāng)前貫穿集之外的節(jié)點(diǎn)均不能帶來當(dāng)前貫穿的擴(kuò)展,則擴(kuò)展已收斂 。
【文檔編號】G06F17/30GK103440263SQ201310331668
【公開日】2013年12月11日 申請日期:2013年8月1日 優(yōu)先權(quán)日:2013年8月1日
【發(fā)明者】丁旋, 劉云浩, 孫家廣 申請人:清華大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
泊头市| 隆回县| 内黄县| 云浮市| 西昌市| 普兰店市| 滨州市| 嘉善县| 通道| 祁连县| 拜城县| 岳池县| 广东省| 古交市| 泰顺县| 安庆市| 沭阳县| 宜君县| 安化县| 黄石市| 临安市| 布拖县| 耿马| 修水县| 台中市| 台湾省| 百色市| 青冈县| 原阳县| 新安县| 莒南县| 浦县| 丽江市| 威宁| 广汉市| 古田县| 柯坪县| 玛纳斯县| 利川市| 读书| 五家渠市|