本發(fā)明屬于社交網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法。
背景技術(shù):
現(xiàn)實(shí)世界中的許多網(wǎng)絡(luò),如電話網(wǎng)絡(luò)、郵件網(wǎng)絡(luò)和犯罪網(wǎng)絡(luò)等,由于難以獲得準(zhǔn)確完整的網(wǎng)絡(luò)結(jié)構(gòu)信息,常常會(huì)包含一些錯(cuò)誤的或缺失的個(gè)體連接關(guān)系,這類網(wǎng)絡(luò)稱之為噪音網(wǎng)絡(luò)。當(dāng)前大部分社區(qū)發(fā)現(xiàn)的方法都是根據(jù)網(wǎng)絡(luò)中節(jié)點(diǎn)之間的連接關(guān)系發(fā)現(xiàn)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)。由于這些方法完全依賴于網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),不能適用有噪音的網(wǎng)絡(luò),當(dāng)網(wǎng)絡(luò)中的噪音比例增加時(shí),發(fā)現(xiàn)真實(shí)社區(qū)結(jié)構(gòu)的能力會(huì)迅速下降;在真實(shí)網(wǎng)絡(luò)環(huán)境下,社區(qū)劃分的部分先驗(yàn)知識(shí)是可以獲知的。比如,我們可能已知某些用戶屬于某個(gè)社區(qū),或者已知某兩個(gè)用戶屬于相同或不同的社區(qū)。將這些先驗(yàn)信息融入到社區(qū)劃分中進(jìn)行社區(qū)發(fā)現(xiàn),可以有效提高社區(qū)劃分的準(zhǔn)確度,提高噪音環(huán)境下社區(qū)劃分的魯棒性。然而,當(dāng)前已有的方法或者沒(méi)有給出先驗(yàn)信息從何而來(lái),或者隨機(jī)從網(wǎng)絡(luò)中抽取部分節(jié)點(diǎn)形成先驗(yàn)信息。一般情況下,先驗(yàn)信息是由相應(yīng)領(lǐng)域的專家對(duì)從網(wǎng)絡(luò)中選取的節(jié)點(diǎn)進(jìn)行標(biāo)注得到的。這樣的標(biāo)注工作費(fèi)時(shí)費(fèi)力,需要高昂的代價(jià),而隨機(jī)抽取的方式過(guò)于盲目,得到的先驗(yàn)信息可能并不具有很強(qiáng)的指導(dǎo)作用,不能以較小的成本有效提升社區(qū)劃分的質(zhì)量。
綜上所述,現(xiàn)有技術(shù)存在的問(wèn)題是:付出代價(jià)較高,得到的先驗(yàn)信息可能并不具有很強(qiáng)的指導(dǎo)作用;當(dāng)前已有社區(qū)發(fā)現(xiàn)方法不能適用有噪音的網(wǎng)絡(luò),發(fā)現(xiàn)真實(shí)社區(qū)結(jié)構(gòu)的能力隨著網(wǎng)絡(luò)中噪音比例的增加會(huì)迅速下降;在獲取先驗(yàn)信息時(shí),不能以較小的人工成本獲取高質(zhì)量的先驗(yàn)信息,降低了社區(qū)發(fā)現(xiàn)的準(zhǔn)確度。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明提供了一種適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法。
本發(fā)明是這樣實(shí)現(xiàn)的,一種適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法,所述適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法基于極值優(yōu)化模塊密度的社區(qū)劃分方法和主動(dòng)學(xué)習(xí)方法的有機(jī)結(jié)合;
所述基于極值優(yōu)化模塊密度的社區(qū)劃分方法將先驗(yàn)信息結(jié)合到極值優(yōu)化模塊密度的方法中,利用成對(duì)的約束集優(yōu)化局部變量和全局變量,在優(yōu)化目標(biāo)函數(shù)的過(guò)程中來(lái)引導(dǎo)社區(qū)發(fā)現(xiàn);
所述主動(dòng)學(xué)習(xí)方法通過(guò)從網(wǎng)絡(luò)中主動(dòng)選取可以代表局部社區(qū)結(jié)構(gòu)的核心節(jié)點(diǎn)以及社區(qū)邊界處的節(jié)點(diǎn)來(lái)構(gòu)造成對(duì)約束集,生成高質(zhì)量的先驗(yàn)信息。
進(jìn)一步,所述適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法基于極值優(yōu)化模塊密度的社區(qū)劃分方法包括以下步驟:
步驟一,計(jì)算網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性值,確立核心點(diǎn)集合和邊界點(diǎn)集合;
步驟二,選取核心代表點(diǎn)構(gòu)造先驗(yàn)信息;
步驟三,選取邊界代表點(diǎn)構(gòu)造先驗(yàn)信息;
步驟四,將先驗(yàn)信息結(jié)合到極值優(yōu)化過(guò)程;
步驟五,按拓?fù)浣Y(jié)構(gòu)把網(wǎng)絡(luò)隨機(jī)分成節(jié)點(diǎn)數(shù)大致相等的兩個(gè)部分,形成初始社區(qū)結(jié)構(gòu);
步驟六,計(jì)算每個(gè)節(jié)點(diǎn)對(duì)社區(qū)模塊密度的貢獻(xiàn)值,把貢獻(xiàn)最小的節(jié)點(diǎn)移動(dòng)到另一部分來(lái)進(jìn)行自組織優(yōu)化,重復(fù)這一自組織優(yōu)化過(guò)程,直到網(wǎng)絡(luò)的模塊密度值不再增加;
步驟七,移除最終得到的兩個(gè)社區(qū)之間的連邊,再對(duì)每個(gè)子網(wǎng)絡(luò)執(zhí)行步驟五和步驟六,直到整個(gè)網(wǎng)絡(luò)的模塊密度值達(dá)到最大。
進(jìn)一步,所述步驟一具體包括:計(jì)算節(jié)點(diǎn)的重要性值利用的是基于度和集聚系數(shù)的綜合衡量節(jié)點(diǎn)重要性的指標(biāo),表示為:
pi=f(ki)+g(ci);
其中,
根據(jù)給定參數(shù)
進(jìn)一步,所述步驟二具體包括:如果代表點(diǎn)集合rs為空,則從核心點(diǎn)集合cs中選擇重要性值最大的節(jié)點(diǎn)k添加到代表點(diǎn)集合rs中;否則從核心點(diǎn)集合cs中選擇與代表點(diǎn)集合rs相似性最小的節(jié)點(diǎn)i作為候選代表點(diǎn),這里節(jié)點(diǎn)i與集合c之間的相似性表示為:
s(i,c)=max(sim(i,j)|j∈c);
其中,
對(duì)于代表點(diǎn)集合rs中的每對(duì)代表點(diǎn)構(gòu)造先驗(yàn)信息<i,j>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型。
進(jìn)一步,所述步驟三具體包括:從邊界節(jié)點(diǎn)集合bs中選擇與節(jié)點(diǎn)i相似度最大的邊界點(diǎn)b1,若存在多個(gè)滿足條件的節(jié)點(diǎn),則將重要性值最小的選為代表點(diǎn),構(gòu)造先驗(yàn)信息<i,b1>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型;
在邊界點(diǎn)集合bs中選擇與節(jié)點(diǎn)i相似度最小的邊界點(diǎn)b2,若存在多個(gè)滿足條件的節(jié)點(diǎn),則將重要性值最大的選為代表點(diǎn),構(gòu)造先驗(yàn)信息<i,b2>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型。
進(jìn)一步,所述步驟四具體包括:網(wǎng)絡(luò)的模塊密度d全局變量與每個(gè)節(jié)點(diǎn)對(duì)模塊密度的貢獻(xiàn)大小qi局部變量有關(guān),利用已知的成對(duì)約束信息通過(guò)懲罰違反約束條件的形式對(duì)模塊密度d進(jìn)行優(yōu)化求解,定義懲罰函數(shù)的一般形式為:
其中,α1、α2是懲罰和獎(jiǎng)勵(lì)的平衡系數(shù),<i,j,w,type>∈c表示節(jié)點(diǎn)i和j的相關(guān)社區(qū)成員關(guān)系,
采用懲罰的方式對(duì)不滿足約束條件的劃分進(jìn)行懲罰,即節(jié)點(diǎn)i的模塊密度貢獻(xiàn)值應(yīng)減小。此時(shí),令u(c)中α1=0,α2=1,因此,結(jié)合先驗(yàn)信息優(yōu)化后的局部變量q′i表示為:
其中,
采用獎(jiǎng)勵(lì)的方式對(duì)滿足約束條件的劃分進(jìn)行獎(jiǎng)勵(lì),即全局變量d值應(yīng)增大;此時(shí),令u(c)中α1=1,α2=0,因此,結(jié)合先驗(yàn)信息優(yōu)化后的全局變量d′表示為:
其中,
進(jìn)一步,所述步驟五中:按拓?fù)浣Y(jié)構(gòu)把網(wǎng)絡(luò)g隨機(jī)分成兩個(gè)部分g1和g2,每部分具有大致相等的節(jié)點(diǎn)數(shù),在每部分中由邊相連的節(jié)點(diǎn)構(gòu)成社區(qū),形成初始社區(qū)結(jié)構(gòu)。
進(jìn)一步,所述步驟六中:計(jì)算每個(gè)節(jié)點(diǎn)對(duì)社區(qū)模塊密度的貢獻(xiàn)值q′i,把對(duì)社區(qū)模塊密度貢獻(xiàn)最小的節(jié)點(diǎn)移動(dòng)到另一部分來(lái)進(jìn)行自組織優(yōu)化;每次移動(dòng)后都重新計(jì)算每個(gè)節(jié)點(diǎn)的貢獻(xiàn)值;重復(fù)這一自組織優(yōu)化過(guò)程,直到網(wǎng)絡(luò)的模塊密度值d′不再增加。
進(jìn)一步,所述步驟七中:移除最終得到的兩個(gè)社區(qū)之間的連邊,得到若干連通的子網(wǎng)絡(luò);對(duì)每個(gè)子網(wǎng)絡(luò)執(zhí)行步驟5和步驟6,直到整個(gè)網(wǎng)絡(luò)的模塊密度達(dá)到最大。
本發(fā)明的另一目的在于提供一種應(yīng)用所述適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法的社交網(wǎng)絡(luò)。
本發(fā)明的優(yōu)點(diǎn)及積極效果為:
1、由于將先驗(yàn)信息融入到社區(qū)劃分中進(jìn)行半監(jiān)督的社區(qū)發(fā)現(xiàn),有效補(bǔ)償噪音帶來(lái)的影響,提高噪音環(huán)境下社區(qū)劃分的魯棒性。
2、采用主動(dòng)學(xué)習(xí)技術(shù)來(lái)獲取先驗(yàn)信息,能以較小的人工成本獲取有效提升社區(qū)劃分質(zhì)量的先驗(yàn)信息。
3、采用模塊密度作為社區(qū)評(píng)估函數(shù),克服了基于模塊度優(yōu)化方法的分辨率限制現(xiàn)象。
本發(fā)明在噪音比例分別設(shè)置為2%、4%、6%、8%、10%時(shí),在dolphins網(wǎng)絡(luò)中,僅添加10對(duì)約束nmi值可以提高1-7%,添加20對(duì)約束nmi值能提高3-14%;在football網(wǎng)絡(luò)中也有相似的結(jié)果,添加10對(duì)約束nmi值可以提高2-7%,添加20對(duì)約束nmi值能提高6-13%。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例提供的適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法流程圖。
圖2是本發(fā)明實(shí)施例提供的適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法實(shí)現(xiàn)流程示意圖。
圖3是本發(fā)明實(shí)施例提供的本發(fā)明在dophins網(wǎng)絡(luò)上不同噪音比下的性能評(píng)測(cè)圖。
圖4是本發(fā)明實(shí)施例提供的本發(fā)明在football網(wǎng)絡(luò)上不同噪音比下的性能評(píng)測(cè)圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
下面結(jié)合附圖對(duì)本發(fā)明的應(yīng)用原理作詳細(xì)的描述。
本發(fā)明實(shí)施例提供的適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法是一個(gè)基于極值優(yōu)化模塊密度的社區(qū)劃分方法和一個(gè)主動(dòng)學(xué)習(xí)方法的有機(jī)結(jié)合;將先驗(yàn)信息結(jié)合到極值優(yōu)化模塊密度的方法中,利用成對(duì)的約束集優(yōu)化局部變量和全局變量,在優(yōu)化目標(biāo)函數(shù)的過(guò)程中來(lái)引導(dǎo)社區(qū)發(fā)現(xiàn);通過(guò)從網(wǎng)絡(luò)中主動(dòng)選取可以代表局部社區(qū)結(jié)構(gòu)的核心節(jié)點(diǎn)以及社區(qū)邊界處的節(jié)點(diǎn)來(lái)構(gòu)造成對(duì)約束集,生成高質(zhì)量的先驗(yàn)信息。
如圖1所示,本發(fā)明實(shí)施例提供的適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法包括以下步驟:
s101:計(jì)算網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性值,確立核心點(diǎn)集合和邊界點(diǎn)集合;
s102:選取核心代表點(diǎn)構(gòu)造先驗(yàn)信息;
s103:選取邊界代表點(diǎn)構(gòu)造先驗(yàn)信息;
s104:將先驗(yàn)信息結(jié)合到極值優(yōu)化過(guò)程;
s105:按拓?fù)浣Y(jié)構(gòu)把網(wǎng)絡(luò)隨機(jī)分成節(jié)點(diǎn)數(shù)大致相等的兩個(gè)部分,形成初始社區(qū)結(jié)構(gòu);
s106:計(jì)算每個(gè)節(jié)點(diǎn)對(duì)社區(qū)模塊密度的貢獻(xiàn)值,把貢獻(xiàn)最小的節(jié)點(diǎn)移動(dòng)到另一部分來(lái)進(jìn)行自組織優(yōu)化,重復(fù)這一自組織優(yōu)化過(guò)程,直到網(wǎng)絡(luò)的模塊密度值不再增加;
s107:移除最終得到的兩個(gè)社區(qū)之間的連邊,再對(duì)每個(gè)子網(wǎng)絡(luò)執(zhí)行步驟s105和步驟s106,直到整個(gè)網(wǎng)絡(luò)的模塊密度值達(dá)到最大。
本發(fā)明實(shí)施例提供的適用于噪音網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法具體包括以下步驟:
步驟1:計(jì)算網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性值,確定核心點(diǎn)集合和邊界點(diǎn)集合。
進(jìn)一步,利用一種節(jié)點(diǎn)重要性衡量指標(biāo)評(píng)估網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的重要性,根據(jù)給定參數(shù),將網(wǎng)絡(luò)中所有重要性值大于給定參數(shù)的節(jié)點(diǎn)構(gòu)成核心點(diǎn)集合,邊界點(diǎn)集合是由非核心點(diǎn)構(gòu)成的節(jié)點(diǎn)集合。
步驟2:選取核心代表點(diǎn)構(gòu)造先驗(yàn)信息。
進(jìn)一步,如果代表點(diǎn)集合為空,則從核心點(diǎn)集合中選擇重要性值最大的節(jié)點(diǎn)k添加到代表點(diǎn)集合;否則從核心點(diǎn)集合中選擇與代表點(diǎn)集合相似性最小的節(jié)點(diǎn)i作為候選代表點(diǎn);
進(jìn)一步,對(duì)于代表點(diǎn)集合中的每對(duì)代表點(diǎn)構(gòu)造先驗(yàn)信息,交由領(lǐng)域?qū)<覙?biāo)注其約束類型。
步驟3:選取邊界代表點(diǎn)構(gòu)造先驗(yàn)信息。
進(jìn)一步,從邊界點(diǎn)集合中選擇與節(jié)點(diǎn)i相似度最大的邊界點(diǎn)b1,若存在多個(gè)滿足條件的節(jié)點(diǎn),則將重要性值最小的選為代表點(diǎn),構(gòu)造先驗(yàn)信息<i,b1>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型;
進(jìn)一步,在邊界點(diǎn)集合中選擇與節(jié)點(diǎn)i相似度最小的邊界點(diǎn)b2,若存在多個(gè)滿足條件的節(jié)點(diǎn),則將重要性值最大的選為代表點(diǎn),構(gòu)造先驗(yàn)信息<i,b2>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型。
步驟4:判斷已獲得先驗(yàn)信息是否達(dá)到指定數(shù)目,若已達(dá)到指定數(shù)目,繼續(xù)執(zhí)行步驟5,否則,返回步驟2。
步驟5:將先驗(yàn)信息結(jié)合到極值優(yōu)化過(guò)程。
進(jìn)一步,網(wǎng)絡(luò)的模塊密度(全局變量)與每個(gè)節(jié)點(diǎn)對(duì)模塊密度的貢獻(xiàn)大小(局部變量)有關(guān),利用已知的成對(duì)約束信息通過(guò)懲罰(獎(jiǎng)勵(lì))違反(符合)約束條件的形式對(duì)模塊密度進(jìn)行優(yōu)化求解;
進(jìn)一步,采用懲罰的方式對(duì)不滿足約束條件的劃分進(jìn)行懲罰,即減小局部變量的值;
進(jìn)一步,采用獎(jiǎng)勵(lì)的方式對(duì)滿足約束條件的劃分進(jìn)行獎(jiǎng)勵(lì),即增大全局變量的值。
步驟6:初始化:把整個(gè)網(wǎng)絡(luò)隨機(jī)分成兩個(gè)部分,每部分具有大致相等的節(jié)點(diǎn)數(shù),在每部分中由邊相連的節(jié)點(diǎn)構(gòu)成社區(qū),這樣就形成了初始社區(qū)結(jié)構(gòu)。
步驟7:迭代:把對(duì)社區(qū)模塊密度貢獻(xiàn)最小的節(jié)點(diǎn)移動(dòng)到另一部分來(lái)進(jìn)行自組織優(yōu)化,每次移動(dòng)后都重新計(jì)算每個(gè)節(jié)點(diǎn)的貢獻(xiàn)值,重復(fù)這一自組織優(yōu)化過(guò)程,直到網(wǎng)絡(luò)的模塊密度值不再增加。
步驟8:尋優(yōu):移除最終得到的兩個(gè)社區(qū)之間的連邊,得到若干連通的子網(wǎng)絡(luò),再對(duì)每個(gè)子網(wǎng)絡(luò)執(zhí)行步驟6和步驟7,直到整個(gè)網(wǎng)絡(luò)的模塊密度值達(dá)到最大。
下面結(jié)合附圖對(duì)本發(fā)明的應(yīng)用原理作進(jìn)一步的描述。
如圖2所示,本發(fā)明的實(shí)施步驟如下:
步驟1:計(jì)算節(jié)點(diǎn)的重要性值,確立核心點(diǎn)集合和邊界點(diǎn)集合。
進(jìn)一步,計(jì)算節(jié)點(diǎn)的重要性值利用的是基于度和集聚系數(shù)的綜合衡量節(jié)點(diǎn)重要性的指標(biāo),表示為:
pi=f(ki)+g(ci);
其中,
進(jìn)一步,根據(jù)給定參數(shù)
步驟2:從核心點(diǎn)集合中選取代表點(diǎn)構(gòu)造先驗(yàn)信息。
進(jìn)一步,如果代表點(diǎn)集合rs為空,則從核心點(diǎn)集合cs中選擇重要性值最大的節(jié)點(diǎn)k添加到代表點(diǎn)集合rs中;否則從核心點(diǎn)集合cs中選擇與代表點(diǎn)集合rs相似性最小的節(jié)點(diǎn)i作為候選代表點(diǎn),這里節(jié)點(diǎn)i與集合c之間的相似性表示為:
s(i,c)=max(sim(i,j)|j∈c);
其中,
進(jìn)一步,對(duì)于代表點(diǎn)集合rs中的每對(duì)代表點(diǎn)構(gòu)造先驗(yàn)信息<i,j>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型。
步驟3:從邊界點(diǎn)集合中選取代表點(diǎn)構(gòu)造先驗(yàn)信息。
進(jìn)一步,從邊界節(jié)點(diǎn)集合bs中選擇與節(jié)點(diǎn)i相似度最大的邊界點(diǎn)b1,若存在多個(gè)滿足條件的節(jié)點(diǎn),則將重要性值最小的選為代表點(diǎn),構(gòu)造先驗(yàn)信息<i,b1>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型;
進(jìn)一步,在邊界點(diǎn)集合bs中選擇與節(jié)點(diǎn)i相似度最小的邊界點(diǎn)b2,若存在多個(gè)滿足條件的節(jié)點(diǎn),則將重要性值最大的選為代表點(diǎn),構(gòu)造先驗(yàn)信息<i,b2>,交由領(lǐng)域?qū)<覙?biāo)注其約束類型。
步驟4:將先驗(yàn)信息結(jié)合到極值優(yōu)化過(guò)程。
進(jìn)一步,網(wǎng)絡(luò)的模塊密度d(全局變量)與每個(gè)節(jié)點(diǎn)對(duì)模塊密度的貢獻(xiàn)大小qi(局部變量)有關(guān),利用已知的成對(duì)約束信息通過(guò)懲罰(獎(jiǎng)勵(lì))違反(符合)約束條件的形式對(duì)模塊密度d進(jìn)行優(yōu)化求解,定義懲罰(獎(jiǎng)勵(lì))函數(shù)的一般形式為:
其中,α1、α2是懲罰和獎(jiǎng)勵(lì)的平衡系數(shù),<i,j,w,type>∈c表示節(jié)點(diǎn)i和j的相關(guān)社區(qū)成員關(guān)系,
進(jìn)一步,采用懲罰的方式對(duì)不滿足約束條件的劃分進(jìn)行懲罰,即節(jié)點(diǎn)i的模塊密度貢獻(xiàn)值應(yīng)減小。此時(shí),令u(c)中α1=0,α2=1,因此,結(jié)合先驗(yàn)信息優(yōu)化后的局部變量q′i表示為:
其中,
進(jìn)一步,采用獎(jiǎng)勵(lì)的方式對(duì)滿足約束條件的劃分進(jìn)行獎(jiǎng)勵(lì),即全局變量d值應(yīng)增大。此時(shí),令u(c)中α1=1,α2=0,因此,結(jié)合先驗(yàn)信息優(yōu)化后的全局變量d′表示為:
其中,
步驟5:按拓?fù)浣Y(jié)構(gòu)把網(wǎng)絡(luò)g隨機(jī)分成兩個(gè)部分g1和g2,每部分具有大致相等的節(jié)點(diǎn)數(shù),在每部分中由邊相連的節(jié)點(diǎn)構(gòu)成社區(qū),形成初始社區(qū)結(jié)構(gòu)。
步驟6:計(jì)算每個(gè)節(jié)點(diǎn)對(duì)社區(qū)模塊密度的貢獻(xiàn)值q′i,把對(duì)社區(qū)模塊密度貢獻(xiàn)最小的節(jié)點(diǎn)移動(dòng)到另一部分來(lái)進(jìn)行自組織優(yōu)化;每次移動(dòng)后都重新計(jì)算每個(gè)節(jié)點(diǎn)的貢獻(xiàn)值;重復(fù)這一自組織優(yōu)化過(guò)程,直到網(wǎng)絡(luò)的模塊密度值d′不再增加。
步驟7:移除最終得到的兩個(gè)社區(qū)之間的連邊,得到若干連通的子網(wǎng)絡(luò);對(duì)每個(gè)子網(wǎng)絡(luò)執(zhí)行步驟5和步驟6,直到整個(gè)網(wǎng)絡(luò)的模塊密度達(dá)到最大。
下面結(jié)合性能評(píng)測(cè)對(duì)本發(fā)明的應(yīng)用效果作詳細(xì)的描述。
圖3為本發(fā)明在dophins網(wǎng)絡(luò)上不同噪音比下的性能評(píng)測(cè)圖。
圖4為本發(fā)明在football網(wǎng)絡(luò)上不同噪音比下的性能評(píng)測(cè)圖。
dophins網(wǎng)絡(luò)是由d.lusseau等人對(duì)棲息在新西蘭doubtfulsound海峽的一個(gè)寬吻海豚群體進(jìn)行長(zhǎng)達(dá)7年的觀察構(gòu)建的。該網(wǎng)絡(luò)包括62個(gè)節(jié)點(diǎn)和159條邊,其中網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)代表該群體中一只寬吻海豚,邊表示連接的兩個(gè)寬吻海豚具有頻繁的聯(lián)系。
football網(wǎng)絡(luò)是由girvan和newman對(duì)2000賽季美國(guó)大學(xué)生足球聯(lián)賽抽象構(gòu)建的網(wǎng)絡(luò)。該網(wǎng)絡(luò)包括115個(gè)節(jié)點(diǎn)和613條邊,其中網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)代表一支足球隊(duì),邊代表兩支球隊(duì)在賽季期間進(jìn)行過(guò)比賽。同一聯(lián)盟內(nèi)的球隊(duì)之間比賽較頻繁,不同聯(lián)盟間的球隊(duì)之間比賽較少。
由圖3和圖4可以看出,在兩個(gè)網(wǎng)絡(luò)的各噪音比例下,先驗(yàn)信息的增加可以大幅提高算法的性能。在dolphins網(wǎng)絡(luò)中,僅添加10對(duì)約束nmi值可以提高1-7%,添加20對(duì)約束nmi值能提高3-14%;在football網(wǎng)絡(luò)中也有相似的結(jié)果,添加10對(duì)約束nmi值可以提高2-7%,添加20對(duì)約束nmi值能提高6-13%。
隨著網(wǎng)絡(luò)中的噪音比增加,完全依賴網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的社區(qū)發(fā)現(xiàn)方法的性能會(huì)迅速下降,而將先驗(yàn)信息融入到社區(qū)發(fā)現(xiàn)過(guò)程中,可以有效補(bǔ)償噪音帶來(lái)的影響,保持較高的社區(qū)劃分準(zhǔn)確度。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。