一種用于網(wǎng)絡(luò)構(gòu)建基元挖掘的裝置和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明關(guān)于一種用于網(wǎng)絡(luò)構(gòu)建基元挖掘的裝置和相應(yīng)方法,特別是基于權(quán)重的M級子圖搜索與構(gòu)建單元認(rèn)定。
【背景技術(shù)】
[0002]復(fù)雜系統(tǒng)及復(fù)雜網(wǎng)絡(luò)是當(dāng)前研究的熱點領(lǐng)域,其目標(biāo)是應(yīng)用學(xué)科交叉技術(shù)來降低其復(fù)雜程度,方便研究人員運用現(xiàn)有技術(shù)進(jìn)行分析。目前來看,業(yè)界普遍采取的方法是根據(jù)具體需求,如觀察、統(tǒng)計、預(yù)測、控制等,對給定系統(tǒng)的歷史、動態(tài)及趨勢進(jìn)行跟蹤,必要時進(jìn)行計算機的模擬,然而這種技術(shù)耗時較長,降低了時效性,其應(yīng)用場景也有局限性。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的技術(shù)目的之一是提供一種用于網(wǎng)絡(luò)構(gòu)建基元挖掘的裝置,以克服現(xiàn)有技術(shù)裝置復(fù)雜不利于后續(xù)分析對比的缺點。本發(fā)明所述的裝置包括:
[0004]網(wǎng)絡(luò)建模模塊,用于對一真實系統(tǒng)進(jìn)行面向網(wǎng)絡(luò)(實體-聯(lián)系圖)的抽象處理,之后將所述抽象處理的建模結(jié)果發(fā)送到下一個模塊,
[0005]隨機網(wǎng)絡(luò)生成模塊,接收所述抽象處理的建模結(jié)果,用于根據(jù)迭代算法對所述的真實網(wǎng)絡(luò)進(jìn)行隨機異化處理以形成突出所述真實網(wǎng)絡(luò)特征的隨機網(wǎng)絡(luò),并將所述隨機網(wǎng)絡(luò)發(fā)送到下一個模塊,和
[0006]構(gòu)建基元挖掘模塊,接收所述隨機網(wǎng)絡(luò),用于分別對所述的真實網(wǎng)絡(luò)與所述的隨機網(wǎng)絡(luò)進(jìn)行面向若干單元子圖的遍歷與搜索,并計算出所述若干子圖的出現(xiàn)頻次,以挖掘出其中可作為構(gòu)建基元的高頻部分,從而確定構(gòu)件基元。
[0007]所述的面向網(wǎng)絡(luò)(實體-聯(lián)系圖)的抽象處理,比如真實存在一個社交網(wǎng)絡(luò),其中有各自獨立的賬號作為實體,賬號A向賬號B發(fā)信(@)、A轉(zhuǎn)發(fā)B之言論、A為B點贊等皆可定義為:聯(lián)系A(chǔ)—B。
[0008]本發(fā)明的另一個技術(shù)目的在于提供一種用于網(wǎng)絡(luò)構(gòu)建基元挖掘的方法,包括:
[0009]用網(wǎng)絡(luò)建模模塊對一真實系統(tǒng)進(jìn)行面向?qū)嶓w-聯(lián)系的抽象處理;
[0010]用隨機網(wǎng)絡(luò)生成模塊接收所述抽象處理的建模結(jié)果,并根據(jù)迭代算法對所述的真實網(wǎng)絡(luò)進(jìn)行隨機異化處理以形成突出所述真實網(wǎng)絡(luò)特征的隨機網(wǎng)絡(luò);
[0011]用構(gòu)建基元挖掘模塊接收所述隨機網(wǎng)絡(luò),并分別對所述的真實網(wǎng)絡(luò)與所述的隨機網(wǎng)絡(luò)進(jìn)行面向若干單元子圖的遍歷與搜索,計算出所述若干子圖的出現(xiàn)頻次,以此挖掘出其中可作為構(gòu)建基元的高頻部分,從而確定構(gòu)件基元。
[0012]作為對本發(fā)明的可選實施例,構(gòu)建基元的發(fā)現(xiàn)是基于M級子圖的可能分布,依次遍歷,從而得到各個子圖的統(tǒng)計數(shù)量,再根據(jù)相關(guān)標(biāo)準(zhǔn)進(jìn)行認(rèn)定。
[0013]與現(xiàn)有技術(shù)相比,本發(fā)明立足于連接有方向有權(quán)重的網(wǎng)絡(luò),而此類網(wǎng)絡(luò)是目前大多數(shù)物理系統(tǒng)、生命系統(tǒng)、社會系統(tǒng)等的基本表達(dá)。而本發(fā)明的隨機網(wǎng)絡(luò)生成和構(gòu)件基元的挖掘過程則具有以下優(yōu)點:(I)加入了權(quán)重,對系統(tǒng)的更貼切刻畫;(2)可面向低級子圖(如2級),提高了系統(tǒng)降維的運行效率。
【附圖說明】
[0014]圖1A為本發(fā)明的有向有權(quán)網(wǎng)絡(luò)實施例的基元挖掘裝置示意圖
[0015]圖1B是本發(fā)明的有向有權(quán)網(wǎng)絡(luò)構(gòu)建基元挖掘方法實施例的流程示意圖
[0016]圖2A為本發(fā)明的一社交系統(tǒng)實施例的網(wǎng)絡(luò)建模過程中真實網(wǎng)絡(luò)的連接矩陣
[0017]圖2B為本發(fā)明的一社交系統(tǒng)實施例的真實網(wǎng)絡(luò)
[0018]圖3A為本發(fā)明的一社交系統(tǒng)實施例的網(wǎng)絡(luò)異化結(jié)果之一的隨機網(wǎng)絡(luò)的連接矩陣
[0019]圖3B為本發(fā)明的一社交系統(tǒng)實施例的網(wǎng)絡(luò)異化結(jié)果之一的隨機網(wǎng)絡(luò)
[0020]圖4為本發(fā)明的一社交系統(tǒng)實施例的全部2級子圖
[0021]圖5為本發(fā)明的一社交系統(tǒng)實施例的各2級子圖出現(xiàn)頻次對比(子圖#4的出現(xiàn)頻次已在圖2-3中標(biāo)出)。
【具體實施方式】
[0022]以下通過“面向2級子圖的社交網(wǎng)絡(luò)基元挖掘”這一實例并結(jié)合【附圖說明】本發(fā)明的實施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭示的內(nèi)容輕易地了解本發(fā)明的其它優(yōu)點與功效。本發(fā)明亦可通過其它不同的具體實例加以施行或應(yīng)用,本說明書中的各項細(xì)節(jié)亦可基于不同觀點與應(yīng)用,在不背離本發(fā)明的精神下進(jìn)行各種修飾與變更。
[0023]本發(fā)明可立足于有向有權(quán)的復(fù)雜網(wǎng)絡(luò),至少包括以下幾個步驟及相應(yīng)裝置的模塊:
[0024]網(wǎng)絡(luò)建模,對復(fù)雜系統(tǒng)面向?qū)嶓w間的矢量連接進(jìn)行抽象。
[0025]隨機網(wǎng)絡(luò)生成,根據(jù)給定真實網(wǎng)絡(luò),迭代生成一組隨機網(wǎng)絡(luò)。
[0026]構(gòu)建基元發(fā)現(xiàn),對以上網(wǎng)絡(luò)分別進(jìn)行面向M級子圖的搜索。
[0027]復(fù)雜網(wǎng)絡(luò)建模是對復(fù)雜系統(tǒng)的數(shù)學(xué)表示,旨在建立計算機處理的問題域表達(dá),方便運用現(xiàn)有計算機程序來處理。
[0028]隨機網(wǎng)絡(luò)生成是為真實網(wǎng)絡(luò)樹立“靶子”,以突顯真實網(wǎng)絡(luò)的特殊“模式”或“規(guī)律”。
[0029]構(gòu)建基元挖掘可基于M級子圖的可能分布,依次遍歷,從而得到各個子圖的統(tǒng)計數(shù)量,再根據(jù)相關(guān)標(biāo)準(zhǔn)進(jìn)行認(rèn)定。
[0030]給定社交網(wǎng)絡(luò)系統(tǒng),可以利用圖1A所示的網(wǎng)絡(luò)構(gòu)建基元挖掘的裝置100來進(jìn)行基元挖掘及分析。該裝置100包括網(wǎng)絡(luò)建模模塊110,隨機網(wǎng)絡(luò)生成模塊120,和構(gòu)建基元挖掘模塊130,三個主要模塊依次順序連接,以使得各模塊生成的信號或結(jié)果依次被相鄰下一個模塊所接收。
[0031]如圖1B所示,網(wǎng)絡(luò)構(gòu)建基元挖掘的裝置100將依次進(jìn)行以下主要步驟:
[0032]步驟201,網(wǎng)絡(luò)建模模塊110對真實的社交系統(tǒng)建模。結(jié)合圖2A和圖2B,比如對于給定的社交網(wǎng)絡(luò)系統(tǒng)(如微信等),可以以通信主體(比如A到Z)為節(jié)點V,以主體間的有向通信(如@、點贊、評論、回復(fù)、轉(zhuǎn)發(fā)等)為有向連接E(帶箭頭直線),給定時間段內(nèi)通信次數(shù)為權(quán)重W建立復(fù)雜網(wǎng)絡(luò)。其中2A是2BA的矩陣連接圖。為了簡化子圖,權(quán)重可依據(jù)與平均權(quán)重間的關(guān)系離散化為強連接、弱連接兩種,在圖示中分別用粗細(xì)兩種直線標(biāo)注。同時,節(jié)點的度,定義為該節(jié)點被動通信次數(shù)(入度)與主動通信次數(shù)(出度)之差,即“節(jié)點度=入度一出度”。
[0033]步驟202,隨機網(wǎng)絡(luò)生成模塊對上述真實的社交網(wǎng)絡(luò)進(jìn)行隨機異化以生成隨機網(wǎng)絡(luò)。隨機網(wǎng)絡(luò)的生成基礎(chǔ)有兩點,一是保證隨機化后對應(yīng)節(jié)點的個體屬性不變,二是保證構(gòu)成各個M級子圖中的所有M-1級子圖的屬性不變。
[0034]根據(jù)真實系統(tǒng)的建模結(jié)果,通過網(wǎng)絡(luò)重構(gòu)來隨機化生成一組(如100個)虛擬網(wǎng)絡(luò),圖3A,3B是隨機生成的一種異化結(jié)果,其中3A是3B的連接矩陣。在2級子圖(2級權(quán)重)框架下,重構(gòu)需要保證兩點,一是對應(yīng)節(jié)點的度要相同,二是連接在數(shù)量上要統(tǒng)一。重構(gòu)算法如下:
[0035](I)刪除真實網(wǎng)絡(luò)中所有連接;
[0036](2)以隨機權(quán)重(強連接與弱連接各50%概率)連接隨機兩個節(jié)點V1、Vj形成邊Eij;
[0037](3)如果Elj的加入,有利于當(dāng)前隨機網(wǎng)絡(luò)度分布趨向真實網(wǎng)絡(luò),即使得VnVj的度進(jìn)一步接近真實網(wǎng)絡(luò)中的度(即I D1-Dii I > = I Di ’ -Dii I與I Dj-Djj I > = I Dj ’ -Djj |同時成立;其中Di為連接Eij加入前節(jié)點Vi的度,Dii為真實網(wǎng)絡(luò)中節(jié)點Vi的度,Di ’為Eij加入后節(jié)點Vi的度),而不是背離,那么接受Elj,否則丟棄;
[0038](4)重復(fù)(2)與(3),直到隨機網(wǎng)絡(luò)中所有節(jié)點的度都與真實網(wǎng)絡(luò)中的相同;
[0039](5)若當(dāng)前隨機網(wǎng)絡(luò)中的強連接數(shù)量依然小于真實網(wǎng)絡(luò),那么隨機選中兩個之間無連接的節(jié)點,并用雙強邊連接;
[0040](6)若當(dāng)前隨機網(wǎng)絡(luò)中的弱連接數(shù)量依然小于真實網(wǎng)絡(luò),那么隨