基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明提出基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,屬于復(fù)雜網(wǎng)絡(luò)技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 近數(shù)十年來(lái),對(duì)于網(wǎng)絡(luò)理論的研宄取得了一系列重大的發(fā)展,讓人們對(duì)于復(fù)雜網(wǎng) 絡(luò)的認(rèn)知,從互聯(lián)網(wǎng)、通信網(wǎng)和社會(huì)網(wǎng)絡(luò),到自然界中的食物網(wǎng)、生物學(xué)上的蛋白質(zhì)結(jié)構(gòu)網(wǎng) 絡(luò)等,無(wú)一不提高到了一個(gè)新的水平。網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)是復(fù)雜網(wǎng)絡(luò)最普遍和最重要的拓?fù)?屬性之一,對(duì)理解其功能、預(yù)測(cè)其行為和演變都具有十分重要的意義。
[0003] 在大量的真實(shí)世界的復(fù)雜網(wǎng)絡(luò)中,節(jié)點(diǎn)之間的連接往往與其權(quán)值密不可分,權(quán)值 是區(qū)分不同連接之間的強(qiáng)度、緊密度和性能的重要衡量標(biāo)準(zhǔn)。在社會(huì)網(wǎng)絡(luò)中,微博中互相關(guān) 注的好友互發(fā)的私信數(shù)、一對(duì)同事郵件的來(lái)往數(shù)、電影明星合作共演一部電影的次數(shù)、科學(xué) 家之間論文的共著數(shù)、航空公司某兩地的航班的座位數(shù)等等,在這些網(wǎng)絡(luò)里面,都需要用到 有權(quán)網(wǎng)絡(luò)。有權(quán)網(wǎng)絡(luò)由于其權(quán)值具有的現(xiàn)實(shí)意義,使其在社區(qū)劃分中更顯復(fù)雜。
[0004] 在有權(quán)網(wǎng)絡(luò)的研宄中,眾多學(xué)者以最大程度達(dá)到社區(qū)內(nèi)連接緊密,社區(qū)間連接稀 疏為目的,而忽略了社區(qū)的內(nèi)部結(jié)構(gòu)的重要性?,F(xiàn)實(shí)中的復(fù)雜網(wǎng)絡(luò)具有社區(qū)結(jié)構(gòu),其社區(qū)內(nèi) 部結(jié)構(gòu)一定具有某種意義,使社區(qū)能夠更長(zhǎng)久地維持,同時(shí)每個(gè)社區(qū)又并非"孤島",社區(qū)之 間可以進(jìn)行暢通有效地交流。
【發(fā)明內(nèi)容】
[0005] 觀察現(xiàn)實(shí)中的眾多網(wǎng)絡(luò),可以發(fā)現(xiàn)它們有一個(gè)共同特征,即網(wǎng)絡(luò)中的每一個(gè)小集 團(tuán)(社區(qū))都會(huì)有一個(gè)地位最高的個(gè)體,稱之為"中心人物"。這樣的復(fù)雜網(wǎng)絡(luò)有如下特征: 第一,網(wǎng)絡(luò)中的社區(qū)是由中心人物為中心的聯(lián)系緊密的小集團(tuán);第二,中心人物決定著集團(tuán) 中其他個(gè)體的地位,和中心人物聯(lián)系越緊密的個(gè)體,在集團(tuán)中的地位就越高。據(jù)此,本發(fā)明 提供了一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,以社區(qū)內(nèi)部穩(wěn)固、社區(qū)間交流便捷 為目的,構(gòu)造復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),適用于復(fù)雜網(wǎng)絡(luò)中最重要的兩種網(wǎng)絡(luò):小世界網(wǎng)絡(luò)和無(wú) 標(biāo)度網(wǎng)絡(luò)。
[0006] 本發(fā)明的基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,將復(fù)雜網(wǎng)絡(luò)表示為有權(quán)無(wú)向 簡(jiǎn)單圖G,G= (V,E),V為節(jié)點(diǎn)集合,n為節(jié)點(diǎn)總數(shù),E為邊集合,然后進(jìn)行如下步驟:
[0007] 步驟1 :找出中心人物節(jié)點(diǎn)。本發(fā)明以節(jié)點(diǎn)在網(wǎng)絡(luò)中的網(wǎng)絡(luò)排名值(PageRank)作 為節(jié)點(diǎn)中心度的衡量標(biāo)準(zhǔn),計(jì)算所有節(jié)點(diǎn)的網(wǎng)絡(luò)排名值PageRank,并從大到小對(duì)網(wǎng)絡(luò)排名 值排序,設(shè)Pi為第i個(gè)網(wǎng)絡(luò)排名值,選取PageRank最大的前d個(gè)節(jié)點(diǎn)作為中心人物節(jié)點(diǎn)。
[0008] d根據(jù)經(jīng)驗(yàn)參數(shù)02來(lái)確定,滿足:3幺02;
[0009] 設(shè)置經(jīng)驗(yàn)參數(shù)?i,使?jié)M足:
[0010] 經(jīng)驗(yàn)參數(shù)? 2均取值在(0, 1)之間。
[0011] 步驟2 :計(jì)算兩兩中心人物節(jié)點(diǎn)之間的相似度,合并相似節(jié)點(diǎn)。
[0012] 設(shè)定參數(shù)當(dāng)兩個(gè)中心人物節(jié)點(diǎn)的相似度大于等于S時(shí),將兩個(gè)節(jié)點(diǎn)合并,并 刪除其中一個(gè)節(jié)點(diǎn)。把被刪除節(jié)點(diǎn)的所有邊及邊的權(quán)值合并到保留節(jié)點(diǎn)上。參數(shù)S取值 在(0, 1)之間。
[0013] 步驟3:依據(jù)每個(gè)中心人物節(jié)點(diǎn)構(gòu)造一個(gè)社區(qū),找出與中心人物節(jié)點(diǎn)之間有強(qiáng)連 接的節(jié)點(diǎn),并加入該中心人物節(jié)點(diǎn)所在的社區(qū)中。
[0014] 設(shè)依據(jù)中心人物節(jié)點(diǎn)x構(gòu)造社區(qū)c,c為社區(qū)編號(hào);找出包含中心人物節(jié)點(diǎn)x的所 有三元閉包,設(shè)三元閉包中另外兩個(gè)節(jié)點(diǎn)為A和B,節(jié)點(diǎn)x與節(jié)點(diǎn)A連邊的權(quán)值為wxA,節(jié)點(diǎn) x與節(jié)點(diǎn)B連邊的權(quán)值為wxB,節(jié)點(diǎn)A和節(jié)點(diǎn)B連邊的權(quán)值為Wab,若滿足下面公式:
[0015]
【主權(quán)項(xiàng)】
I. 一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,將復(fù)雜網(wǎng)絡(luò)表示為有權(quán)無(wú)向簡(jiǎn)單圖 G,G= (V,E),V為節(jié)點(diǎn)集合,n為節(jié)點(diǎn)總數(shù),E為邊集合,其特征在于,所述方法包括如下步 驟: 步驟1 :找出中心人物節(jié)點(diǎn); 計(jì)算V中各個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)排名值,并從大到小對(duì)網(wǎng)絡(luò)排名值排序,設(shè)Pi為第i個(gè)網(wǎng)絡(luò) 排名值,選取網(wǎng)絡(luò)排名值最大的前d個(gè)節(jié)點(diǎn)作為中心人物節(jié)點(diǎn);
經(jīng)驗(yàn)參數(shù)0:和0 2均取值在(0, 1)之間; 步驟2 :計(jì)算兩兩中心人物節(jié)點(diǎn)之間的相似度,合并相似節(jié)點(diǎn); 設(shè)定參數(shù)8,當(dāng)兩個(gè)中心人物節(jié)點(diǎn)的相似度大于等于S時(shí),將兩個(gè)節(jié)點(diǎn)合并,并刪 除其中一個(gè)節(jié)點(diǎn);把被刪除節(jié)點(diǎn)的所有邊及邊的權(quán)值合并到保留節(jié)點(diǎn)上;參數(shù)S取值在 (0, 1)之間; 步驟3 :依據(jù)每個(gè)中心人物節(jié)點(diǎn)構(gòu)造一個(gè)社區(qū),找出與中心人物節(jié)點(diǎn)之間有強(qiáng)連接的 節(jié)點(diǎn),并加入該中心人物節(jié)點(diǎn)所在的社區(qū)中; 設(shè)依據(jù)中心人物節(jié)點(diǎn)X構(gòu)造社區(qū)c,c為社區(qū)編號(hào);找出包含中心人物節(jié)點(diǎn)X的所有三 元閉包,設(shè)三元閉包中另外兩個(gè)節(jié)點(diǎn)為A和B,節(jié)點(diǎn)X與節(jié)點(diǎn)A連邊的權(quán)值為wxA,節(jié)點(diǎn)X與 節(jié)點(diǎn)B連邊的權(quán)值為wxB,節(jié)點(diǎn)A和節(jié)點(diǎn)B連邊的權(quán)值為wAB,若滿足下面公式:
則三元閉包是強(qiáng)三元閉包,若不滿足則三元閉包為弱三元閉包; 定義混合參數(shù)①(C)為:cKc) = a ? Ws + P ww; a、|3為兩個(gè)參數(shù),且a+ |3 = 1; W^為所有包含節(jié)點(diǎn)X的強(qiáng)三元閉包中連接邊的平均權(quán)值,<則為所有包含節(jié)點(diǎn)x的弱三 元閉包中連接邊的平均權(quán)值; 設(shè)立衡量邊是否為強(qiáng)連接還是弱連接的標(biāo)準(zhǔn)E(C)為:E(C) = (?IAGG,wxA >cp(c)},w巧表示中心人物節(jié)點(diǎn)X的所有連邊權(quán)值大于①(c) 的連邊的平均權(quán)值; 當(dāng)中心人物節(jié)點(diǎn)X的鄰居節(jié)點(diǎn)i,滿足wxi^:E(c)時(shí),說(shuō)明節(jié)點(diǎn)i與節(jié)點(diǎn)X之間為強(qiáng)連 接,把節(jié)點(diǎn)i加入社區(qū)c,Wxi表示節(jié)點(diǎn)X與節(jié)點(diǎn)i連邊的權(quán)值; 步驟4:通過(guò)加入弱連接擴(kuò)張社區(qū),具體對(duì)于每個(gè)當(dāng)前不屬于任何社區(qū)的自由節(jié)點(diǎn),進(jìn) 行下面過(guò)程: 設(shè)自由節(jié)點(diǎn)為A,其對(duì)社區(qū)c的歸屬度R(A,c)為
其中max(wAi) ie。為節(jié)點(diǎn)A與社區(qū)c內(nèi)節(jié)點(diǎn)之間連邊的最大權(quán)值; 設(shè)節(jié)點(diǎn)A與m個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)之間存在邊,SQ(A)為A對(duì)m個(gè)社區(qū)的歸屬度的標(biāo)準(zhǔn)差; 定義權(quán)重函數(shù)W⑷=SQ(A);設(shè)定參數(shù)Y,參數(shù)S取值在(〇, 1)之間; 若W(A) <Y,則節(jié)點(diǎn)A同時(shí)屬于m個(gè)社區(qū),節(jié)點(diǎn)A位于m個(gè)社區(qū)的重疊部分;否則,從 m個(gè)社區(qū)中去掉歸屬度最小的社區(qū),然后重新計(jì)算W(A),重新判斷節(jié)點(diǎn)A所屬的社區(qū);當(dāng)節(jié) 點(diǎn)A的m-1個(gè)社區(qū)均被刪除了,只剩余一個(gè)社區(qū)c時(shí),根據(jù)節(jié)點(diǎn)A對(duì)社區(qū)c的歸屬度R(A,c) 來(lái)判斷,若滿足R(A,c) <Y,則節(jié)點(diǎn)A屬于社區(qū)c,否則,節(jié)點(diǎn)A為孤立節(jié)點(diǎn); 步驟5 :對(duì)于每個(gè)孤立節(jié)點(diǎn),建立一個(gè)社區(qū)。
2. 根據(jù)權(quán)利要求1所述的一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,其特征在 于,所述的步驟1中,網(wǎng)絡(luò)排名值的計(jì)算公式為:
其中,^P(V)表示節(jié)點(diǎn)V的網(wǎng)絡(luò)排名值,<i>p(u)表示節(jié)點(diǎn)U的網(wǎng)絡(luò)排名值,U和V均為V中節(jié)點(diǎn),S為縮放因子,u-V表示存在u到V的連接邊,'^表示節(jié)點(diǎn)V第i條邊的權(quán)值, EjWj表示節(jié)點(diǎn)V所有邊的權(quán)值總和。
3. 根據(jù)權(quán)利要求1所述的一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,其特征在 于,所述的步驟1中,經(jīng)驗(yàn)參數(shù)?2優(yōu)選設(shè)置為〇. 2。
4. 根據(jù)權(quán)利要求1所述的一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,其特征在 于,步驟2中所述的參數(shù)S優(yōu)選設(shè)置為〇. 1。
5. 根據(jù)權(quán)利要求1或4所述的一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,其特征 在于,步驟2中所述計(jì)算兩兩中心人物節(jié)點(diǎn)之間的相似度,采用大度節(jié)點(diǎn)有利指標(biāo)HPI來(lái)計(jì) 算,計(jì)算公式為:
其中,s思11壤示節(jié)點(diǎn)u和節(jié)點(diǎn)V的相似度,Ir(u)nr(V)I為節(jié)點(diǎn)u和節(jié)點(diǎn)V的共同 鄰居數(shù),ku為節(jié)點(diǎn)u的度,kv為節(jié)點(diǎn)V的度,min{}為求取最小值。
6. 根據(jù)權(quán)利要求1所述的一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,其特征在 于,所述的步驟4中,參數(shù)Y優(yōu)選設(shè)置為0.6。
【專利摘要】本發(fā)明提出一種基于中心人物的有權(quán)圖重疊社區(qū)發(fā)現(xiàn)方法,屬于復(fù)雜網(wǎng)絡(luò)技術(shù)領(lǐng)域。本方法適用于對(duì)有權(quán)網(wǎng)絡(luò)的重疊社區(qū)發(fā)現(xiàn),包括:計(jì)算所有節(jié)點(diǎn)的網(wǎng)絡(luò)排名值,并確定中心人物節(jié)點(diǎn);計(jì)算兩兩中心人物節(jié)點(diǎn)之間的相似度,合并相似節(jié)點(diǎn);計(jì)算每個(gè)社區(qū)的E(c)值,并根據(jù)E(c)向每個(gè)社區(qū)添加強(qiáng)連接的節(jié)點(diǎn);通過(guò)計(jì)算自由節(jié)點(diǎn)的歸屬度,計(jì)算獲得權(quán)重函數(shù)W(A),并根據(jù)W(A)向社區(qū)添加弱連接節(jié)點(diǎn);對(duì)于孤立節(jié)點(diǎn),分別獨(dú)自成為一個(gè)社區(qū)。通過(guò)實(shí)驗(yàn)證明,本發(fā)明方法有著較好的社區(qū)劃分性能,尤其對(duì)于混合度較低的復(fù)雜網(wǎng)絡(luò)性能更加優(yōu)異。
【IPC分類】G06F17-30
【公開(kāi)號(hào)】CN104715034
【申請(qǐng)?zhí)枴緾N201510114806
【發(fā)明人】童超, 謝忠玉, 牛建偉, 莫曉赟
【申請(qǐng)人】北京航空航天大學(xué)
【公開(kāi)日】2015年6月17日
【申請(qǐng)日】2015年3月16日