本發(fā)明屬于網(wǎng)絡(luò)評估方法技術(shù)領(lǐng)域,具體涉及一種基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法。
背景技術(shù):
復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要性評估是網(wǎng)絡(luò)分析的一個(gè)基本問題,同時(shí)也越來越成為目前研究的熱點(diǎn)。在電力網(wǎng)絡(luò)、交通網(wǎng)絡(luò)和病毒與疾病免疫控制過程等不同網(wǎng)絡(luò)中如何確定關(guān)鍵節(jié)點(diǎn)都顯得非常重要。
然而,不同規(guī)模大小的網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)評估需要不同的方法。目前,基于網(wǎng)絡(luò)結(jié)構(gòu)的節(jié)點(diǎn)重要性主要從網(wǎng)絡(luò)的局部屬性、全局屬性、網(wǎng)絡(luò)的位置和隨機(jī)游走四個(gè)方面進(jìn)行評估。其中網(wǎng)絡(luò)的局部屬性主要考慮節(jié)點(diǎn)自身信息及其鄰居信息,由于計(jì)算簡單,時(shí)間復(fù)雜度低,一般可用于大型網(wǎng)絡(luò)。網(wǎng)絡(luò)的全局屬性主要考慮網(wǎng)絡(luò)的全局信息,但全局信息時(shí)間復(fù)雜度高,不適用于大型網(wǎng)絡(luò)。kitsak等人于2010年首次提出了節(jié)點(diǎn)重要性依賴于其在整個(gè)網(wǎng)絡(luò)中的位置的思想,并且利用k-核分解獲得了節(jié)點(diǎn)重要性排序指標(biāo)(k-shell),該指標(biāo)時(shí)間復(fù)雜度低,適用于大型網(wǎng)絡(luò),而且比度、介數(shù)更能準(zhǔn)確識別在疾病傳播中最有影響力的節(jié)點(diǎn)。隨機(jī)游走的節(jié)點(diǎn)重要性排序方法主要基于網(wǎng)頁之間的鏈接關(guān)系的網(wǎng)頁排序技術(shù),由于網(wǎng)頁之間的鏈接關(guān)系可以解釋為網(wǎng)頁之間的相互關(guān)聯(lián)和相互支持,從而判斷出網(wǎng)頁的重要程度。
上述方法均只從某一方面評價(jià)節(jié)點(diǎn)重要性或?qū)?jié)點(diǎn)進(jìn)行排序,實(shí)際上,網(wǎng)絡(luò)節(jié)點(diǎn)的重要性不僅和節(jié)點(diǎn)局部屬性有關(guān),而且與其在網(wǎng)絡(luò)中所處位置以及節(jié)點(diǎn)之間的相互依賴程度密切相關(guān)。單一指標(biāo)在不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上的計(jì)算具有很大的片面性,網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)的重要性和網(wǎng)絡(luò)的整體結(jié)構(gòu)相關(guān),需要從不同的角度,利用節(jié)點(diǎn)的多個(gè)重要性指標(biāo)來進(jìn)行綜合評價(jià)。所以,評估節(jié)點(diǎn)重要性不僅要考慮節(jié)點(diǎn)自身屬性,同時(shí)要考慮節(jié)點(diǎn)的全局屬性。事實(shí)上,最具影響力節(jié)點(diǎn)在具有社團(tuán)結(jié)構(gòu)的網(wǎng)絡(luò)中應(yīng)具有以下特征:社區(qū)中心和各社區(qū)中起到“橋接”作用的節(jié)點(diǎn)。因此,關(guān)鍵節(jié)點(diǎn)排序問題關(guān)注的焦點(diǎn)不能僅局限于網(wǎng)絡(luò)中的核心節(jié)點(diǎn),也不可忽略處于結(jié)構(gòu)洞位置的節(jié)點(diǎn)。節(jié)點(diǎn)緊密度能較好地反映該節(jié)點(diǎn)對其他節(jié)點(diǎn)的影響力,同時(shí)體現(xiàn)該節(jié)點(diǎn)在網(wǎng)絡(luò)拓?fù)湮恢玫牟煌?。綜上所述,基于緊密度和結(jié)構(gòu)洞來評估復(fù)雜網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn),綜合考慮了節(jié)點(diǎn)的局部信息(網(wǎng)絡(luò)約束系數(shù))和全局信息(緊密度),通過構(gòu)建結(jié)構(gòu)洞影響矩陣,能夠更加準(zhǔn)確高效的評估網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法,通過構(gòu)建結(jié)構(gòu)洞影響矩陣,使得評估結(jié)果對于大型真實(shí)復(fù)雜網(wǎng)絡(luò)能夠更加準(zhǔn)確高效。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明所采用的技術(shù)方案是:一種基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法,包括以下步驟:
step1:根據(jù)節(jié)點(diǎn)連接情況建立復(fù)雜網(wǎng)絡(luò)鄰接矩陣a=[aij]n×n,其中,n為復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)量,當(dāng)節(jié)點(diǎn)i和節(jié)點(diǎn)j有連接時(shí),aij=1;當(dāng)節(jié)點(diǎn)i和節(jié)點(diǎn)j無連接時(shí),aij=0。
step2:計(jì)算網(wǎng)絡(luò)中各節(jié)點(diǎn)的緊密度cc和網(wǎng)絡(luò)約束系數(shù)ci,計(jì)算公式為:
step3:結(jié)合鄰接矩陣和緊密度,建立節(jié)點(diǎn)影響因子矩陣ha;
step4:結(jié)合節(jié)點(diǎn)影響因子矩陣和網(wǎng)絡(luò)約束系數(shù),建立結(jié)構(gòu)洞影響矩陣hc;
step5:計(jì)算各節(jié)點(diǎn)重要性mi,計(jì)算公式為:
step6:根據(jù)mi得出的節(jié)點(diǎn)重要度按照從大到小的順序進(jìn)行排序,排在前邊的節(jié)點(diǎn)即為相對重要的節(jié)點(diǎn)。
所述step3中節(jié)點(diǎn)影響因子矩陣ha的計(jì)算公式如式(ⅳ)所示:
所述step4中結(jié)構(gòu)洞影響矩陣hc的計(jì)算公式如式(ⅴ)所示:
本發(fā)明的有益效果是:
相互連通節(jié)點(diǎn)之間的依賴關(guān)系最簡單最直接的形式是存在于鄰接節(jié)點(diǎn)之間。本發(fā)明綜合考慮了節(jié)點(diǎn)的緊密度(全局信息)和網(wǎng)絡(luò)約束系數(shù)(局部信息),提出了基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法,可以得到更為精確的評估結(jié)果。
附圖說明
圖1是本發(fā)明基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法的流程圖;
圖2是arpa網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明的具體實(shí)施方式進(jìn)行描述,以便本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計(jì)的詳細(xì)描述也許會淡化本發(fā)明的主要內(nèi)容時(shí),這些描述在這里將被忽略。
參照圖1,圖1是本發(fā)明提供的一種基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法的流程圖。本發(fā)明基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法包括以下步驟:
step1:根據(jù)節(jié)點(diǎn)連接情況建立復(fù)雜網(wǎng)絡(luò)鄰接矩陣a=[aij]n×n,其中,n為復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)量,當(dāng)節(jié)點(diǎn)i和節(jié)點(diǎn)j有連接時(shí),aij=1;當(dāng)節(jié)點(diǎn)i和節(jié)點(diǎn)j無連接時(shí),aij=0。
step2:緊密度可以表示為節(jié)點(diǎn)i到網(wǎng)絡(luò)中其他所有節(jié)點(diǎn)距離之和的均值的倒數(shù)。緊密度用來度量網(wǎng)絡(luò)中的節(jié)點(diǎn)通過網(wǎng)絡(luò)對其他節(jié)點(diǎn)施加影響的能力。節(jié)點(diǎn)的緊密度越大,表明該節(jié)點(diǎn)居于網(wǎng)絡(luò)中心位置的程度越大,相應(yīng)地也就越重要。網(wǎng)絡(luò)約束系數(shù)ci越小,結(jié)構(gòu)洞程度越大,節(jié)點(diǎn)在信息傳播中的影響越大,節(jié)點(diǎn)的位置也就越重要。計(jì)算網(wǎng)絡(luò)中各節(jié)點(diǎn)的緊密度cc和網(wǎng)絡(luò)約束系數(shù)ci,計(jì)算公式為:
其中,γ(i)表示節(jié)點(diǎn)i的鄰居節(jié)點(diǎn)的集合,pij表示節(jié)點(diǎn)i為維持和節(jié)點(diǎn)j之間的鄰居關(guān)系所投入的精力占總精力的比例,pij表由公式(ⅲ)求得
step3:復(fù)雜網(wǎng)絡(luò)是由節(jié)點(diǎn)及其邊組成的統(tǒng)一整體,其中任何一個(gè)節(jié)點(diǎn)都并非孤立存在,而是受到網(wǎng)絡(luò)中其它節(jié)點(diǎn)的約束和影響。也就是說,在不存在孤立節(jié)點(diǎn)的網(wǎng)絡(luò)中,任何一個(gè)節(jié)點(diǎn)都可以通過連邊來影響鄰居節(jié)點(diǎn)。網(wǎng)絡(luò)的鄰接矩陣反映了節(jié)點(diǎn)間的直接相連關(guān)系,而節(jié)點(diǎn)之間最直接的重要度影響關(guān)系存在于相鄰節(jié)點(diǎn)之間的相互作用。復(fù)雜網(wǎng)絡(luò)中心性理論的緊密度指標(biāo),從節(jié)點(diǎn)對網(wǎng)絡(luò)中其他節(jié)點(diǎn)影響的角度來衡量節(jié)點(diǎn)的重要性,結(jié)合鄰接矩陣和緊密度,建立節(jié)點(diǎn)影響因子矩陣ha,計(jì)算公式為:
其中,ha(i,j)=aijcc(j)表示節(jié)點(diǎn)j對節(jié)點(diǎn)i的影響因子,矩陣對角線上的1表示節(jié)點(diǎn)對自身的影響因子為100%??梢钥闯?,節(jié)點(diǎn)影響因子矩陣反映了任意節(jié)點(diǎn)對網(wǎng)絡(luò)中其它節(jié)點(diǎn)的影響程度。
step4:節(jié)點(diǎn)的重要度取決于兩個(gè)因素:節(jié)點(diǎn)的位置信息(全局重要度)和節(jié)點(diǎn)的相鄰信息(局部重要度)。結(jié)構(gòu)洞理論能夠很好的反映節(jié)點(diǎn)間的相互影響關(guān)系,體現(xiàn)鄰居節(jié)點(diǎn)間的拓?fù)浣Y(jié)構(gòu),作為其測度的節(jié)點(diǎn)約束系數(shù)的計(jì)算中也同時(shí)體現(xiàn)了節(jié)點(diǎn)的度屬性和“橋接”屬性。因此,本發(fā)明用網(wǎng)絡(luò)約束系數(shù)來構(gòu)建節(jié)點(diǎn)之間的重要度影響,作為節(jié)點(diǎn)的相鄰信息,結(jié)合節(jié)點(diǎn)影響因子矩陣和網(wǎng)絡(luò)約束系數(shù),建立結(jié)構(gòu)洞影響矩陣hc,計(jì)算公式為:
其中,
step5:一個(gè)節(jié)點(diǎn)對其鄰居節(jié)點(diǎn)的重要度影響值與其約束系數(shù)呈負(fù)相關(guān)性,與其緊密度呈正相關(guān)性,節(jié)點(diǎn)的度值越高,對它進(jìn)行影響的點(diǎn)也就越多,由于相互作用,反過來它對鄰居節(jié)點(diǎn)的重要度影響也就越大。計(jì)算各節(jié)點(diǎn)重要性mi,計(jì)算公式為:
其中:mi反映的是所有與節(jié)點(diǎn)i相鄰的節(jié)點(diǎn)重要度影響值的求和與節(jié)點(diǎn)i自身的約束系數(shù)的倒數(shù)之和的均值,從上式可以看出,一個(gè)節(jié)點(diǎn)的重要度取決于它自身的約束系數(shù)、相鄰節(jié)點(diǎn)的緊密度和約束系數(shù)的大小。
step6:根據(jù)mi得出的節(jié)點(diǎn)重要度按照從大到小的順序進(jìn)行排序,排在前邊的節(jié)點(diǎn)即為相對重要的節(jié)點(diǎn)。
實(shí)施例1
為說明及驗(yàn)證本發(fā)明的技術(shù)效果,采用arpa(advancedresearchprojectagency)網(wǎng)絡(luò)及空手道俱樂部社會關(guān)系網(wǎng)karate作為具體實(shí)例進(jìn)行實(shí)驗(yàn)驗(yàn)證。
參照圖2,圖2是arpa網(wǎng)絡(luò)的示意圖。采用度中心性方法(k)、betweenness算法和鄰域結(jié)構(gòu)洞算法(n-burt)作為對比算法,測試結(jié)果如表1所示。表1是本發(fā)明與對比算法得到的節(jié)點(diǎn)重要性排序結(jié)果,表中數(shù)值上方為網(wǎng)絡(luò)節(jié)點(diǎn)id,下方為對應(yīng)算法重要度值計(jì)算結(jié)果,其中,cc-burt為按照本專利方法建立的基于緊密度和結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法。
表1
由表1結(jié)果可知采用該發(fā)明cc-burt方法,節(jié)點(diǎn)排序結(jié)果為v3、v14、v2……。根據(jù)表1評價(jià)結(jié)果,刪除apra網(wǎng)絡(luò)中排序在前的v3、v14、v2節(jié)點(diǎn)后,分別測試網(wǎng)絡(luò)平均效率,并與初始網(wǎng)絡(luò)的平均效率進(jìn)行對比,得到表2結(jié)果,表2為刪除apra網(wǎng)絡(luò)相應(yīng)節(jié)點(diǎn)后網(wǎng)絡(luò)的平均效率測試結(jié)果。
表2
對于arpa網(wǎng)絡(luò),由于四種算法判斷節(jié)點(diǎn)重要度的側(cè)重點(diǎn)不同,故結(jié)果有所差異。但是,通過對比表2中分別刪除網(wǎng)絡(luò)對應(yīng)節(jié)點(diǎn)后網(wǎng)絡(luò)平均效率的變化程度不難發(fā)現(xiàn),刪除節(jié)點(diǎn)v3后造成的網(wǎng)絡(luò)平均效率下降程度遠(yuǎn)大于刪除節(jié)點(diǎn)v2時(shí)的情況,說明節(jié)點(diǎn)v3的重要度最大,并且同時(shí)發(fā)現(xiàn)節(jié)點(diǎn)v14的重要度要大于節(jié)點(diǎn)v2。另外,n-burt算法中節(jié)點(diǎn)5與節(jié)點(diǎn)9、節(jié)點(diǎn)12與節(jié)點(diǎn)19分別具有相同的重要性也是不太準(zhǔn)確的;而本文的cc-burt算法綜合考慮了局部和全局信息,對這兩對節(jié)點(diǎn)的重要程度進(jìn)行了區(qū)分,因此,本文算法相比其它三種算法的結(jié)果具有更高的準(zhǔn)確性,對重要度的評估具有更高的精度。
從表1可以看出,對于具有社區(qū)結(jié)構(gòu)的小規(guī)模真實(shí)網(wǎng)絡(luò)karate而言,cc-burt方法與度中心性方法和n-burt方法所得結(jié)果較為接近,在度中心性方法中節(jié)點(diǎn)4排名靠前,但是在betweenness算法和n-burt算法中均未將節(jié)點(diǎn)4排入其中,說明節(jié)點(diǎn)4在全局和局部信息中影響力并不大,本文算法中節(jié)點(diǎn)4僅排第九,且度中心性方法的評價(jià)精度不高,具有相同度的節(jié)點(diǎn)不能區(qū)分其重要度。cc-burt和n-burt算法的計(jì)算結(jié)果僅在個(gè)別節(jié)點(diǎn)上存在差異,且相差排名不大,進(jìn)一步說明cc-burt算法和n-burt都能很好地區(qū)分出網(wǎng)絡(luò)中的社區(qū)中心點(diǎn)。而betweenness算法對于社區(qū)中心性的考慮稍有不足。
盡管上面對本發(fā)明說明性的具體實(shí)施方式進(jìn)行了描述,以便于本技術(shù)領(lǐng)域的技術(shù)人員理解本發(fā)明,但應(yīng)該清楚,本發(fā)明不限于具體實(shí)施方式的范圍,對本技術(shù)領(lǐng)域的普通技術(shù)人員來講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見的,一切利用本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護(hù)之列。