本發(fā)明屬于圖學(xué)習(xí)領(lǐng)域,更為具體地講,涉及一種考慮有向圖中節(jié)點(diǎn)多樣性的圖表示學(xué)習(xí)方法。
背景技術(shù):
1、圖神經(jīng)網(wǎng)絡(luò)(gnns)通過分析無向圖來提取圖數(shù)據(jù)的表示,已經(jīng)取得了巨大的成功。然而,在許多實(shí)際應(yīng)用中,如交通網(wǎng)絡(luò)和網(wǎng)頁網(wǎng)絡(luò),圖是有向的,其中每條邊都是雙向的。因此,許多考慮無向圖的先前gnns忽略了方向信息,從而導(dǎo)致丟棄了對下游任務(wù)至關(guān)重要的有價值信息。例如,在網(wǎng)頁網(wǎng)絡(luò)中,指向更多鏈接的網(wǎng)頁往往有更多的流量,如果忽略了網(wǎng)頁網(wǎng)絡(luò)的方向信息,一些入站邊很少而出站邊很多的網(wǎng)頁將被預(yù)測為高流量網(wǎng)頁。因此,考慮方向信息對于在有向圖中應(yīng)用gnns是實(shí)用的。
2、以前的針對有向圖的gnn方法主要關(guān)注于在圖中描繪方向信息,包括譜dgnn方法和空間dgnn方法。譜dgnn方法主要關(guān)注于構(gòu)建帶有方向信息的拉普拉斯矩陣,例如,digcn利用個性化pagerank的轉(zhuǎn)移概率來近似有向圖的拉普拉斯矩陣,以考慮方向信息。magnet設(shè)計了磁性拉普拉斯矩陣,通過相位矩陣來捕獲方向信息。然而,許多有向譜方法使用相同的映射函數(shù)來獲取出信息和入信息的節(jié)點(diǎn)表示,因此它們可能無法通過忽略入信息和出信息之間的差異來輸出有區(qū)分性的表示。
3、空間dgnn方法旨在首先學(xué)習(xí)不同的映射函數(shù)來處理入信息和出信息,然后將這兩種方向信息結(jié)合起來更新節(jié)點(diǎn)表示,以用于下游任務(wù)。例如,dgcn根據(jù)其二階信息分別學(xué)習(xí)方向信息的映射函數(shù)。dir-gnn首先基于節(jié)點(diǎn)的一階信息學(xué)習(xí)不同的映射函數(shù),然后手動分配權(quán)重來融合這兩種從不同映射函數(shù)獲得的節(jié)點(diǎn)表示??傊?,以前的空間dgnn方法通過兩種方式考慮兩種方向信息之間的差異,即不同的映射函數(shù)和手動設(shè)置不同方向信息學(xué)習(xí)得到的節(jié)點(diǎn)表示上的不同權(quán)重,但它們?nèi)匀淮嬖谛枰鉀Q的局限性。
4、首先,每個節(jié)點(diǎn)的表示都受到其鄰居的影響,包括有向圖中的入鄰居集和出鄰居集。每個節(jié)點(diǎn)的標(biāo)簽由入鄰居集或出鄰居集甚至兩者共同決定,無論是入鄰居還是出鄰居中的每個節(jié)點(diǎn)都應(yīng)該有不同的權(quán)重,簡稱為鄰居多樣性。然而,以前的空間dgnns給它們分配了相同的權(quán)重。其次,度可以反映節(jié)點(diǎn)的中心性,并提供有關(guān)其周圍結(jié)構(gòu)的信息。此外,度信息對于區(qū)分兩個不同節(jié)點(diǎn)非常有幫助,特別是在包括入度和出度的有向圖中。特別是,每個節(jié)點(diǎn)都有不同的入度和出度,即度多樣性。然而,以前的空間dgnns忽略了有向圖中的度信息,削弱了節(jié)點(diǎn)的表示能力。顯然,鄰居多樣性和度多樣性都顯示了節(jié)點(diǎn)的特征,即節(jié)點(diǎn)多樣性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種新的空間有向圖神經(jīng)網(wǎng)絡(luò)框架,即節(jié)點(diǎn)多樣性有向圖神經(jīng)網(wǎng)絡(luò)(nddgnn),考慮節(jié)點(diǎn)多樣性來對圖表示學(xué)習(xí)中的方向信息進(jìn)行建模。
2、為了做到這一點(diǎn),本發(fā)明遵循有向空間方法為出信息和入信息構(gòu)建不同的映射函數(shù),在構(gòu)建過程中,與以前那些為每個節(jié)點(diǎn)的同一鄰居集(即出鄰居集和入鄰居集)分配相同權(quán)重的空間dgnns不同,本方法通過考慮節(jié)點(diǎn)多樣性為它們分配不同的權(quán)重。具體來說,我們通過定義入dirichlet能量和出dirichlet能量來考慮鄰居多樣性,以編碼每個節(jié)點(diǎn)與其鄰居之間的差異,并引入度嵌入來考慮度多樣性,以編碼入度信息和出度信息。
3、本發(fā)明具有以下有益效果:
4、1)本發(fā)明提出了一種新的考慮節(jié)點(diǎn)多樣性(包括鄰居多樣性和度多樣性)的有向gnn方法,該方法能夠自適應(yīng)地為每個節(jié)點(diǎn)學(xué)習(xí)權(quán)重;
5、2)本發(fā)明在真實(shí)世界數(shù)據(jù)集上進(jìn)行了全面的實(shí)證研究,驗(yàn)證了本方法與最先進(jìn)方法相比具有優(yōu)越性。
1.一種考慮有向圖中節(jié)點(diǎn)多樣性的圖表示學(xué)習(xí)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的計算節(jié)點(diǎn)多樣性方法,其特征在于,所述步驟s5中兩種類型的多樣性采用如下方法計算: