一種社交網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種社交網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建方法,屬于軟件工程技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 近年來,隨著網(wǎng)絡(luò)空間的急劇膨脹,形式多樣的社交媒體不斷涌現(xiàn)。每天 都有數(shù)以千萬計(jì)的用戶聚集在各式各樣的社交網(wǎng)絡(luò)中(參考文獻(xiàn):D. Horowitz and S. D. Kamvar, "The anatomy of a large-scale social search engine,,'In Proc. of the 19th International Conference on WorldWideWeb, 2010, pp. 431 - 440·)。社交網(wǎng)絡(luò)的飛 速發(fā)展布局豐富了人們的日常生活,而且提供了豐富多彩的交互媒介。作為內(nèi)容、用戶交互 以及Web2. 0技術(shù)的結(jié)合體,社交網(wǎng)絡(luò)成為承載和維系人與人之間相互關(guān)系的重要紐帶。
[0003] 社交網(wǎng)絡(luò)通常用圖模型表示,形式為:G= (V,L),其中節(jié)點(diǎn)集V( |V| = η)對(duì)應(yīng)于 由η個(gè)用戶構(gòu)成的集合,邊集L對(duì)應(yīng)于用戶之間鏈接的集合(參考文獻(xiàn):W. Nooy,"Graph theoretical approaches to social network analysis,,'in Computational Complexi ty:Theory, Techniques, and Applications, Springer, 2012, pp. 2864 - 2877. ) 〇 通過對(duì)邊 集L賦以相應(yīng)的權(quán)重,形成加權(quán)鏈接,可以方便地刻畫用戶之間的相互關(guān)系;加權(quán)鏈接通常 用鄰接矩陣表示為:A e Rnxn,每一個(gè)元素 aije A表示用戶^和Vj(Vi,Vje V)之間的相 互關(guān)系(參考文獻(xiàn):J· Leskovec, K. J. Lang and M. Mahoney, "Empirical comparison of algorithms for network community detection,,' In Proc. ofthel9th International Conference onWorldWideWeb, 2010, pp. 631 - 640.)。給定社交網(wǎng)絡(luò)中的兩個(gè)用戶,可以從 不同角度出發(fā)描述和刻畫用戶之間的相互關(guān)系,例如:用"0-1"二值數(shù)據(jù)標(biāo)明某用戶是否 為另一用戶的好友或粉絲,用整數(shù)值數(shù)據(jù)記錄某用戶對(duì)另一用戶的評(píng)論數(shù)、轉(zhuǎn)載數(shù),等等。 對(duì)應(yīng)于不同的用戶關(guān)系,加權(quán)鏈接矩陣A的權(quán)重賦值方法也具有多樣性:既可以將權(quán)重賦 值為"0-1"二值數(shù)據(jù)用以表示用戶之間是否存在直接關(guān)聯(lián)(好友、粉絲等),也可以將權(quán)重 賦值為整數(shù)值數(shù)據(jù)用以表示用戶之間的交互頻次(評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)等)。由此可見,從不同 用戶交互行為出發(fā),可以獲得一系列不同的加權(quán)鏈接矩陣A 1, A2, ...,Ak,分別從不同角度出 發(fā)反映用戶之間的相互關(guān)系。
[0004] 傳統(tǒng)的社交網(wǎng)絡(luò)鏈接強(qiáng)度計(jì)算方法直接基于上述加權(quán)鏈接矩陣獲得,本質(zhì)上是對(duì) 原始社交網(wǎng)絡(luò)中用戶交互活動(dòng)的統(tǒng)計(jì),因此稱為"基于統(tǒng)計(jì)的鏈接強(qiáng)度"。
[0005] 傳統(tǒng)的基于統(tǒng)計(jì)的社交網(wǎng)絡(luò)鏈接強(qiáng)度計(jì)算方法雖然簡(jiǎn)單,但是其可靠性缺乏保 證。
[0006] (1)基于統(tǒng)計(jì)的鏈接強(qiáng)度本質(zhì)上直接來源于原始社交網(wǎng)絡(luò)中用戶交互行為的簡(jiǎn)單 統(tǒng)計(jì)和記錄,并不能作為用戶之間相互關(guān)系的真實(shí)、客觀反映和度量,鏈接強(qiáng)度與用戶相關(guān) 性直接并無必然聯(lián)系。例如,與某用戶通過權(quán)重" 1"鏈接的好友用戶,雖然權(quán)重都為" 1",但 并不代表其與該用戶的相關(guān)性完全相同;再如,評(píng)論或轉(zhuǎn)載某用戶次數(shù)更多的用戶并不一 定與該用戶關(guān)系更加密切。
[0007] (2)基于統(tǒng)計(jì)的鏈接強(qiáng)度不具有完備性,這種方法僅能記錄數(shù)據(jù)中"觀測(cè)到的"用 戶交互信息,對(duì)于缺失或尚未獲取到的信息則無法進(jìn)行智能化的推斷和估計(jì);換言之,基于 統(tǒng)計(jì)的鏈接強(qiáng)度無法有效估計(jì)任意用戶之間的相互關(guān)系,從而也無法描述社交網(wǎng)絡(luò)結(jié)構(gòu)的 全貌。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的在于提供一種社交網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建方法,其中將鏈接強(qiáng)度估計(jì)問題定 義為最優(yōu)化矩陣重構(gòu)問題,通過不同信息的有機(jī)融合,利用自動(dòng)化方法學(xué)習(xí)綜合信息矩陣 的稀疏低秩表達(dá),實(shí)現(xiàn)對(duì)社交網(wǎng)絡(luò)整體結(jié)構(gòu)的建模,從而獲得社交網(wǎng)絡(luò)中任意用戶之間相 互關(guān)系的真實(shí)、可靠度量。
[0009] 1、所提供的方法將鏈接強(qiáng)度估計(jì)問題定義為最優(yōu)化矩陣重構(gòu)問題,利用自動(dòng)化方 法學(xué)習(xí)矩陣的稀疏低秩表達(dá),實(shí)現(xiàn)對(duì)社交網(wǎng)絡(luò)整體結(jié)構(gòu)的建模,從而獲得社交網(wǎng)絡(luò)中任意 用戶之間相互關(guān)系的真實(shí)、可靠度量。
[0010] 2、所提供的方法將來源于用戶交互行為和用戶自身屬性的信息進(jìn)行有機(jī)結(jié)合,在 統(tǒng)一的方法框架下整體建模,從而實(shí)現(xiàn)不同信息的互補(bǔ)增強(qiáng)。
[0011] 3、所提供的方法利用迭代交替優(yōu)化的方式實(shí)現(xiàn)最優(yōu)化問題的高效求解,確保每一 步優(yōu)化具有解析解,從而有效提高求解效率、降低運(yùn)算復(fù)雜度。
[0012] 本發(fā)明的技術(shù)方案為:
[0013] 一種社交網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建方法,其步驟為:
[0014] 1)基于待構(gòu)建社交網(wǎng)絡(luò)的社交網(wǎng)絡(luò)圖模型G = (V,L),獲取用戶之間交互行為的 加權(quán)鏈接矩陣A1, A2, ...,Ak以及該社交網(wǎng)絡(luò)的用戶屬性矩陣F ;其中,V為節(jié)點(diǎn)集,L為邊集, Ak表示對(duì)應(yīng)于第k種用戶交互行為的加權(quán)鏈接矩陣;
[0015] 2)將所述加權(quán)鏈接矩陣和所述用戶屬性矩陣合并,構(gòu)建一綜合信息矩陣N ;
[0016] 3)根據(jù)該綜合信息矩陣N,對(duì)I |W| la+ArankW求最小化,得到該社交網(wǎng)絡(luò)的鏈 接強(qiáng)度矩陣W ;最小化約束條件為N = NW,diag(W) = 0, W彡0, M · I I。為L(zhǎng)O范數(shù),rank( ·) 為求取矩陣秩的函數(shù),λ是調(diào)整矩陣W稀疏性與低秩性的權(quán)重,diag(·)為求取矩陣對(duì)角 線元素的函數(shù);
[0017] 4)將該鏈接強(qiáng)度矩陣W作為該社交網(wǎng)絡(luò)圖模型中邊集L的權(quán)重信息,得到G = (V,Lw),構(gòu)建出該社交網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)。
[0018] 進(jìn)一步的,所述根據(jù)該綜合信息矩陣N,對(duì)I |W| UXrank(W)求最小化,得到該社 交網(wǎng)絡(luò)的鏈接強(qiáng)度矩陣W的方法為:引入一重構(gòu)誤差變量E,將對(duì)I |W| IdArank(W)求最小 化轉(zhuǎn)換為對(duì)
【主權(quán)項(xiàng)】
1. 一種社交網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建方法,其步驟為: 1) 基于待構(gòu)建社交網(wǎng)絡(luò)的社交網(wǎng)絡(luò)圖模型G= (V,L),獲取用戶之間交互行為的加權(quán) 鏈接矩陣A1, A2, ...,Ak以及該社交網(wǎng)絡(luò)的用戶屬性矩陣F ;其中,V為節(jié)點(diǎn)集,L為邊集,A k 表示對(duì)應(yīng)于第k種用戶交互行為的加權(quán)鏈接矩陣; 2) 將所述加權(quán)鏈接矩陣和所述用戶屬性矩陣合并,構(gòu)建一綜合信息矩陣N ; 3) 根據(jù)該綜合信息矩陣N,對(duì)I |W| UArank(W)求最小化,得到該社交網(wǎng)絡(luò)的鏈接強(qiáng) 度矩陣W ;最小化約束條件為N = NW,diag(W) = 0, W彡0, I卜I |。為L(zhǎng)O范數(shù),rank( ·)為 求取矩陣秩的函數(shù),λ是調(diào)整矩陣W稀疏性與低秩性的權(quán)重,diag(·)為求取矩陣對(duì)角線 元素的函數(shù); 4) 將該鏈接強(qiáng)度矩陣W作為該社交網(wǎng)絡(luò)圖模型中邊集L的權(quán)重信息,得到G = (V,Lw), 構(gòu)建出該社交網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)。
2. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)該綜合信息矩陣N,對(duì) |W| Ic^Arank(W)求最小化,得到該社交網(wǎng)絡(luò)的鏈接強(qiáng)度矩陣W的方法為:引入一重構(gòu)誤 差變量E,將對(duì)I |W| UArank(W)求最小化轉(zhuǎn)換為對(duì)E.巧%求最小化, 最小化約束條件為 N = NW+E,W = W1, W = W2, diag(W) = 0, W 彡 0, I 卜 I I A Ll 范數(shù),I 卜 I U 為Nuclear范數(shù),λ JP λ 2是調(diào)整矩陣W稀疏性與低秩性的權(quán)重。
3. 如權(quán)利要求2所述的方法,其特征在于,用增廣拉格朗日乘子法對(duì) E.、b% Wi M +a Iiw2 II*求最小化,得到所述鏈接強(qiáng)度矩陣w。
4. 如權(quán)利要求3所述的方法,其特征在于,所述增廣拉格朗日乘子法求解過程中,采用 交替優(yōu)化的方法,在迭代優(yōu)化過程中對(duì)各目標(biāo)變量進(jìn)行依次更新,每更新一個(gè)變量時(shí)將其 它變量視為常數(shù)。
5. 如權(quán)利要求4所述的方法,其特征在于,所述交替優(yōu)化的方法為:在每一次迭代過程 中,首先分別通過最優(yōu)化子問題求解方法,更新矩陣W 1^P E ;然后通過最優(yōu)化子問題求解 方法,根據(jù)矩陣A、WjP E更新W ;最后根據(jù)矩陣W i、W2、E和W更新增廣拉格朗日乘子法中 的拉格朗日乘子和參數(shù);當(dāng)循環(huán)迭代直至收斂。
6. 如權(quán)利要求1至5任一所述的方法,其特征在于,所述綜合信息矩陣 N = [Af,A【,...,A:,Fr]r。
【專利摘要】本發(fā)明公開了一種社交網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建方法。本方法為:1)基于待構(gòu)建社交網(wǎng)絡(luò)的社交網(wǎng)絡(luò)圖模型G=(V,L),獲取用戶之間交互行為的加權(quán)鏈接矩陣以及該社交網(wǎng)絡(luò)的用戶屬性矩陣F;2)將加權(quán)鏈接矩陣和用戶屬性矩陣合并,構(gòu)建一綜合信息矩陣N;3)根據(jù)綜合信息矩陣N,對(duì)||W||0+λrank(W)求最小化,得到該社交網(wǎng)絡(luò)的鏈接強(qiáng)度矩陣W;最小化約束條件為N=NW,diag(W)=0,W≥0;4)將該鏈接強(qiáng)度矩陣W作為該社交網(wǎng)絡(luò)圖模型中邊集L的權(quán)重信息,得到G=(V,LW),構(gòu)建出該社交網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)。本方法可實(shí)現(xiàn)對(duì)社交網(wǎng)絡(luò)整體結(jié)構(gòu)的建模,從而獲得社交網(wǎng)絡(luò)中任意用戶之間相互關(guān)系的真實(shí)、可靠度量,且求解效率高。
【IPC分類】G06F9-44, G06F17-30
【公開號(hào)】CN104657434
【申請(qǐng)?zhí)枴緾N201510050126
【發(fā)明人】張曉宇, 王樹鵬, 吳廣君
【申請(qǐng)人】中國(guó)科學(xué)院信息工程研究所
【公開日】2015年5月27日
【申請(qǐng)日】2015年1月30日