基于局部稠密度的社團(tuán)劃分算法
【專利摘要】一種基于局部稠密度的社團(tuán)劃分算法,包括算法描述、算法檢測(cè)以及算法仿真;具體步驟為:尋找初始社團(tuán)以及其一階鄰點(diǎn)集、以整體加入或者單個(gè)加入的方式將點(diǎn)加入到團(tuán)中、標(biāo)記社團(tuán)、查找還沒有歸為社團(tuán)的點(diǎn),計(jì)算入團(tuán)率,歸入社團(tuán)、提出劃分精度,將沒有正確劃分的節(jié)點(diǎn)劃分到社團(tuán)中、算法仿真,生成可視化圖形。本發(fā)明需要的信息量小,方法簡單,不需要著手于整體信息,實(shí)施的復(fù)雜度低,從而降低了算法的處理時(shí)間,并且算法結(jié)束有檢測(cè)算法,具有時(shí)效性高、復(fù)雜度低、精確度高的特點(diǎn)。
【專利說明】基于局部稠密度的社團(tuán)劃分算法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于復(fù)雜網(wǎng)絡(luò)中劃分社團(tuán)的算法領(lǐng)域,具體涉及一種利用局部信息對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行高效社團(tuán)劃分的基于局部稠密度的社團(tuán)劃分算法。
【背景技術(shù)】
[0002]現(xiàn)實(shí)中許多系統(tǒng)和關(guān)系都可以用復(fù)雜網(wǎng)絡(luò)進(jìn)行抽象表示,復(fù)雜網(wǎng)絡(luò)一般指節(jié)點(diǎn)眾多、連接關(guān)系復(fù)雜的網(wǎng)絡(luò),由于其靈活普適的描述能力,能夠廣泛應(yīng)用于各科學(xué)領(lǐng)域?qū)?fù)雜系統(tǒng)進(jìn)行建模和分析,近年來吸引了越來越多的人對(duì)其進(jìn)行研究。隨著目前對(duì)網(wǎng)絡(luò)性質(zhì)、物理意義以及數(shù)學(xué)特性的深入研究,發(fā)現(xiàn)在許多復(fù)雜網(wǎng)絡(luò)中可以包含多個(gè)社團(tuán),即具有社團(tuán)結(jié)構(gòu),各個(gè)社團(tuán)均為一組相互之間有著較大的相似性而與其所在復(fù)雜網(wǎng)絡(luò)中的其他社團(tuán)之間有著很大不同的節(jié)點(diǎn)群,也就是說,各個(gè)社團(tuán)中內(nèi)部節(jié)點(diǎn)之間的連接非常緊密,而每個(gè)社團(tuán)之間的連接相對(duì)稀疏;每個(gè)社團(tuán)中包含多個(gè)節(jié)點(diǎn),節(jié)點(diǎn)之間的連線稱為邊,每條邊具有方向性,每條邊在其方向上具有其各自的邊權(quán)值。社團(tuán)發(fā)現(xiàn)則是利用圖拓?fù)浣Y(jié)構(gòu)中所蘊(yùn)藏的信息從復(fù)雜網(wǎng)絡(luò)中解析出其模塊化的社團(tuán)結(jié)構(gòu),該問題的深入研究有助于以一種分而治之的方式研究整個(gè)網(wǎng)絡(luò)的模塊、功能及其演化,更加準(zhǔn)確地理解復(fù)雜系統(tǒng)的組織原則、拓?fù)浣Y(jié)構(gòu)與動(dòng)力學(xué)特性,具有十分重要的意義。
[0003]事實(shí)上,研究人員為了搞清網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)的特性,對(duì)尋找網(wǎng)絡(luò)中社團(tuán)結(jié)構(gòu)的多種方法進(jìn)行了實(shí)驗(yàn)和研究,以找到有效的算法,盡量用比較少的信息區(qū)尋找盡量準(zhǔn)確的社團(tuán)結(jié)構(gòu)。以基于聚合思想的Newman快速算法的發(fā)現(xiàn)方案為例,其思想為:將復(fù)雜網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)作為一個(gè)社團(tuán),合并使得模塊度函數(shù)值增益最大的兩個(gè)社團(tuán),依次迭代計(jì)算,直到整個(gè)復(fù)雜網(wǎng)絡(luò)合并成為一個(gè)大社團(tuán)。整個(gè)計(jì)算過程以樹狀圖呈現(xiàn),在模塊度函數(shù)Q取得最大值時(shí)對(duì)網(wǎng)絡(luò)進(jìn)行劃分。Newman快速算法的優(yōu)點(diǎn)是計(jì)算速度快,總的時(shí)間復(fù)雜度為O(m(m+n)),其中m為網(wǎng)絡(luò)中的邊數(shù),η為節(jié)點(diǎn)數(shù)。雖然Newman算法能夠?qū)崿F(xiàn)復(fù)雜網(wǎng)絡(luò)中的社團(tuán)發(fā)現(xiàn),但是忽略了復(fù)雜網(wǎng)絡(luò)中存在節(jié)點(diǎn)間邊的方向以及權(quán)重等特點(diǎn),使得其進(jìn)行社團(tuán)發(fā)現(xiàn)的準(zhǔn)確率較低。
[0004]到目前為止,研究人員還提出了其他社團(tuán)發(fā)現(xiàn)算法,包括譜分析法、最優(yōu)目標(biāo)函數(shù)算法、基于連邊密度、介數(shù)、信息中心度、隨機(jī)行走等,計(jì)算機(jī)領(lǐng)域中的圖分割(GraphPartitioning)算法、社會(huì)科學(xué)中的層次聚類(Hierarchical Clustering)算法、W-H算法和GN算法是最有代表性的方法。例如,一些社團(tuán)監(jiān)測(cè)算法創(chuàng)立了模塊度Q以及對(duì)Q的優(yōu)化,但是這種算法對(duì)于獲取整個(gè)網(wǎng)絡(luò)的信息是十分困難的并且信息量較大。
【發(fā)明內(nèi)容】
[0005]為解決上述問題,本發(fā)明提供一種基于局部稠密度的社團(tuán)劃分算法,高效利用局部信息將復(fù)雜網(wǎng)絡(luò)劃分為社團(tuán),化整為零簡化對(duì)復(fù)雜網(wǎng)絡(luò)的研究,提高研究時(shí)效性。
[0006]為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于局部稠密度的社團(tuán)劃分算法,其特征在于:包括算法描述、算法檢測(cè)以及算法仿真;所述算法描述是將算法用簡單的語言以及數(shù)學(xué)公式表達(dá)復(fù)雜的算法,具體方法為:
(a)將一個(gè)具體網(wǎng)絡(luò)抽象為一個(gè)有點(diǎn)集V和邊集E組成的圖G=(V,E),網(wǎng)絡(luò)的節(jié)點(diǎn)為n;
如果頂點(diǎn)B和5之間有邊相連,則4 = 1,否則4 = 0 ;將網(wǎng)絡(luò)的節(jié)點(diǎn)標(biāo)號(hào)= 1,2,3......n)
,計(jì)算每個(gè)節(jié)點(diǎn)及其一階鄰點(diǎn)所構(gòu)成的局域網(wǎng)絡(luò)的;把
【權(quán)利要求】
1.一種基于局部稠密度的社團(tuán)劃分算法,其特征在于:包括算法描述、算法檢測(cè)以及算法仿真;所述算法描述是將算法用簡單的語言以及數(shù)學(xué)公式表達(dá)復(fù)雜的算法,具體方法為: (a)將一個(gè)具體網(wǎng)絡(luò)抽象為一個(gè)有點(diǎn)集V和邊集E組成的圖G=(V,E ),網(wǎng)絡(luò)的節(jié)點(diǎn)為η ;如果頂點(diǎn)Vi和巧之間有邊相連,則4/ = I,否則^ = O ;將網(wǎng)絡(luò)的節(jié)點(diǎn)標(biāo)號(hào)咕=1,2,3......η),計(jì)算每個(gè)節(jié)點(diǎn)及其一階鄰點(diǎn)所構(gòu)成的局域網(wǎng)絡(luò)的;把CKtej(Vi) 2?中的Oitej(Vi)最大的點(diǎn)?的局域網(wǎng)絡(luò)設(shè)為初始社團(tuán)S ;(b)將初始社團(tuán)S的一階鄰點(diǎn)集F1中的全部點(diǎn)加入到S中,加入F1之后如果稠密度則將F1全部加入,否則任選F1中的一點(diǎn)V,它的鄰點(diǎn)集合為l(v),如果入團(tuán)率,5>0.5 ,則V可以加入到簇中,把滿足條件的節(jié)點(diǎn)都加入到這個(gè)簇中,組成一個(gè)新簇故,在找及的鄰居節(jié)點(diǎn); (c)重復(fù)步驟6),當(dāng)<>^時(shí),則停止節(jié)點(diǎn)加入;并把這些點(diǎn)所在的團(tuán),標(biāo)記為社團(tuán)Cl ;接下來所找的社團(tuán),依次類推標(biāo)記; (d)在剩余沒標(biāo)記的節(jié)點(diǎn)中,找出Oftel(Vj)最大的點(diǎn),重復(fù)步驟(b)-Cd); (e)查找還沒有歸為社團(tuán)的點(diǎn),計(jì)算每個(gè)點(diǎn)的入團(tuán)車,把點(diǎn)放入4最大的社團(tuán)。
2.根據(jù)權(quán)利要求1所述的一種基于局部稠密度的社團(tuán)劃分算法,其特征在于:所述算法檢測(cè)的方法為:尋找算法中沒有正確劃分的節(jié)點(diǎn),提出檢測(cè)社團(tuán)劃分精度的指標(biāo),使沒有正確劃分的節(jié)點(diǎn)劃分到正確的社團(tuán)中。
3.根據(jù)權(quán)利要求2所述的一種基于局部稠密度的社團(tuán)劃分算法,其特征在于:所述檢測(cè)社團(tuán)劃分精度的指標(biāo)為平均內(nèi)部連`接F ; F越大,劃分的社團(tuán)內(nèi)部連接越緊密,外部連接越稀疏,表明劃分的社團(tuán)越好;當(dāng)社團(tuán)內(nèi)一點(diǎn)的內(nèi)部連接小于0.5時(shí),則重新計(jì)算該點(diǎn)的β,并把它放入多最大的社團(tuán)中。
4.根據(jù)權(quán)利要求1所述的一種基于局部稠密度的社團(tuán)劃分算法,其特征在于:所述算法仿真通過MATLAB將算法仿真,利用復(fù)雜網(wǎng)絡(luò)分析軟件生成評(píng)價(jià)算法的可視化圖形。
【文檔編號(hào)】G06F17/30GK103761271SQ201410006332
【公開日】2014年4月30日 申請(qǐng)日期:2014年1月7日 優(yōu)先權(quán)日:2014年1月7日
【發(fā)明者】馬杰良, 潘貞貞 申請(qǐng)人:南京信息工程大學(xué)