社交網(wǎng)絡(luò)社區(qū)影響力評估算法
【專利摘要】本發(fā)明社交網(wǎng)絡(luò)社區(qū)影響力評估算法,是基于圖論方法基礎(chǔ)上的發(fā)展與應(yīng)用,涉及社交網(wǎng)絡(luò)【技術(shù)領(lǐng)域】。本發(fā)明第一、定義社交網(wǎng)絡(luò)與社區(qū)影響力相關(guān)的概念及建模;第二、計(jì)算出用戶傳播主題信息的意愿、社區(qū)用戶綜合影響、社區(qū)用戶數(shù)量、社區(qū)用戶規(guī)模,再綜合計(jì)算出社區(qū)影響力;第三、計(jì)算出社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)的影響力;第四、將計(jì)算出的社區(qū)影響力、社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)的影響力,用于評估各社區(qū)間的影響力、節(jié)點(diǎn)對社區(qū)的重要性以及社區(qū)對節(jié)點(diǎn)作用。基于此,本發(fā)明對人人網(wǎng),微博等社交網(wǎng)絡(luò)影響進(jìn)行評估,為更好傳播信息以及網(wǎng)絡(luò)安全等具有實(shí)際應(yīng)用的前景。
【專利說明】社交網(wǎng)絡(luò)社區(qū)影響力評估算法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及社交網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,更具體的說是社交網(wǎng)絡(luò)社區(qū)影響力評估算法。
【背景技術(shù)】
[0002] 近年來,隨著人們對獲取信息和傳遞信息的需求越來越大,而社交網(wǎng)絡(luò)又是滿足 人們這些需求的良好媒介,從而使得社交網(wǎng)絡(luò)得到了迅速的發(fā)展,社交網(wǎng)絡(luò)是由每個(gè)相 對獨(dú)立的用戶組成的一個(gè)復(fù)雜的虛擬社會(huì),它是當(dāng)前互聯(lián)網(wǎng)最熱門的網(wǎng)絡(luò)應(yīng)用,深刻的 改變了互聯(lián)網(wǎng)信息傳播的規(guī)則和方式,目前具有代表性的社交網(wǎng)絡(luò)有:人人網(wǎng),開心網(wǎng), Facebook, Twitter等。
[0003] 與真實(shí)的社會(huì)網(wǎng)絡(luò)相同,社區(qū)是方便用戶交流的重要元素,例如興趣分享、主題討 論等。因此,社區(qū)將會(huì)對用戶的觀點(diǎn)、感受、決定產(chǎn)生影響,并且影響力越大的社區(qū)對社交網(wǎng) 絡(luò)的影響越大。因此,社區(qū)影響力的評估是對社交網(wǎng)絡(luò)研究的關(guān)鍵挑戰(zhàn)。社區(qū)影響力的研 究有利于更好地管控網(wǎng)絡(luò)帶來的負(fù)面因素以及更好地利用網(wǎng)絡(luò)帶來的正面效應(yīng)。如網(wǎng)絡(luò)輿 情監(jiān)控中如何有效地防止各種有害信息在網(wǎng)絡(luò)中迅速傳播;商業(yè)領(lǐng)域的"口碑效應(yīng)"和"病 毒式營銷"引出的影響力最大化問題等。
[0004] 目前,國內(nèi)外許多學(xué)者都對社交網(wǎng)絡(luò)的社區(qū)挖掘及用戶影響力進(jìn)行了研究,但很 少對社區(qū)的影響力進(jìn)行探討。社區(qū)影響力是對社區(qū)內(nèi)的用戶以及用戶之間的交互形成的相 互影響的一種綜合,也是對社區(qū)的質(zhì)量等進(jìn)行評估的一種方法。社區(qū)是社交網(wǎng)絡(luò)中的一個(gè) 重要的組成元素,它的作用是可以找到更多興趣相同的朋友,而對社區(qū)的影響力進(jìn)行評估, 對穩(wěn)定和發(fā)展社區(qū)有著至關(guān)重要的作用。近年來,對社區(qū)的研究已經(jīng)開展了很多,潘磊等人 基于邊社區(qū)的思想,考慮每條邊在網(wǎng)絡(luò)中所歸屬的局部邊社區(qū),提出了基于局部信息的邊 社區(qū)挖掘算法;黃發(fā)良等人在給出的社交網(wǎng)絡(luò)及社區(qū)挖掘的形成定義的基礎(chǔ)上,提出了一 個(gè)基于啟發(fā)式策略的在線社交網(wǎng)絡(luò)社區(qū)挖掘框架;楊長春等人研究微博社區(qū)中博主的交互 行為,構(gòu)建微博社區(qū)網(wǎng)絡(luò),建立評價(jià)指標(biāo),評價(jià)微博博主在網(wǎng)絡(luò)中的影響力;肖宇等人研究 特定區(qū)域的人群在社交網(wǎng)絡(luò)中的信息傳播行為,對用戶的影響力進(jìn)行評估,提出了社交網(wǎng) 絡(luò)中用戶區(qū)域影響力評估算法;張波等人提出了基于信任的社會(huì)網(wǎng)絡(luò)最大化影響節(jié)點(diǎn)的計(jì) 算方法,該方法引入信任這一元素,考慮信任對節(jié)點(diǎn)的重要影響,將節(jié)點(diǎn)之間的信任度和影 響值結(jié)合,得出綜合影響值,再根據(jù)綜合影響值得出社會(huì)網(wǎng)絡(luò)影響最大化節(jié)點(diǎn),對節(jié)點(diǎn)影響 的計(jì)算是由節(jié)點(diǎn)的出度和節(jié)點(diǎn)間邊的權(quán)重組成的。上述研究都沒有對社區(qū)影響力進(jìn)行評 估,但是為社交網(wǎng)絡(luò)中社區(qū)影響力的評估提供了一定的基礎(chǔ)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的針對現(xiàn)有技術(shù)中存在的缺失和不足,提出社交網(wǎng)絡(luò)社區(qū)影響力評估 算法。
[0006] 本發(fā)明在現(xiàn)有的社區(qū)以及對區(qū)域內(nèi)的用戶影響力的評估的基礎(chǔ)上,提出了一種社 區(qū)影響力評估算法。計(jì)算出社區(qū)影響力后還作了相關(guān)方面的延伸,由三個(gè)因素組成:社區(qū)對 社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)的影響力。本發(fā)明,提出一 種社區(qū)影響力評估算法,其基本流程(如圖1所示):
[0007] 首先,通過分析用戶以往的接收和傳播主題信息的情況,得出平均用戶傳播主題 信息的意愿,對用戶傳播主題信息及發(fā)布信息等的情況計(jì)算出用戶影響力,根據(jù)社區(qū)內(nèi)所 有用戶的綜合影響、社區(qū)用戶數(shù)量、社區(qū)用戶規(guī)模計(jì)算出社區(qū)影響力。
[0008] 其次,根據(jù)計(jì)算出的社區(qū)內(nèi)用戶的平均用戶傳播主題信息的意愿及社區(qū)內(nèi)節(jié)點(diǎn)受 其他用戶發(fā)布主題信息的影響情況計(jì)算出社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力;根據(jù)計(jì)算出的社區(qū) 內(nèi)用戶的平均用戶傳播主題信息的意愿及社區(qū)外節(jié)點(diǎn)受社區(qū)內(nèi)用戶發(fā)布主題信息的影響 情況計(jì)算出社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力;根據(jù)計(jì)算出的社區(qū)內(nèi)的用戶的平均用戶傳播主題 信息的意愿及社區(qū)的重疊與否,分別計(jì)算出非重疊社區(qū)的社區(qū)對社區(qū)的影響力和重疊社區(qū) 的社區(qū)對社區(qū)的影響力。
[0009] 最后,將計(jì)算出的社區(qū)影響力、社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的 影響力、社區(qū)對社區(qū)的影響力,用于評估各社區(qū)間的影響力、節(jié)點(diǎn)對社區(qū)的重要性以及社區(qū) 對節(jié)點(diǎn)作用。
[0010] 本發(fā)明社交網(wǎng)絡(luò)社區(qū)影響力評估算法,具體步驟為:
[0011]A.定義社交網(wǎng)絡(luò)與社區(qū)影響力相關(guān)的概念及建模。
[0012] B.基礎(chǔ)階段:(1)分別統(tǒng)計(jì)用戶接收和傳播主題信息的次數(shù),計(jì)算出平均用戶傳 播主題信息的意愿(2)根據(jù)社區(qū)內(nèi)平均用戶傳播主題信息的意愿及用戶影響力,計(jì)算出社 區(qū)內(nèi)所有用戶的綜合影響;統(tǒng)計(jì)社區(qū)內(nèi)的用戶數(shù)量,得出社區(qū)用戶數(shù)量;根據(jù)用戶間的關(guān) 系,計(jì)算出社區(qū)的用戶規(guī)模(3)結(jié)合上述計(jì)算出的社區(qū)內(nèi)所有用戶的綜合影響、社區(qū)的用 戶數(shù)量,以及統(tǒng)計(jì)出的社區(qū)的用戶規(guī)模,計(jì)算出社區(qū)影響力。
[0013] C.延伸階段:(1)社區(qū)內(nèi)節(jié)點(diǎn)受其他用戶發(fā)布主題信息的影響情況計(jì)算出社區(qū)對 社區(qū)內(nèi)節(jié)點(diǎn)的影響力(2)根據(jù)計(jì)算出的社區(qū)內(nèi)用戶的平均用戶傳播主題信息的意愿及社 區(qū)外節(jié)點(diǎn)受社區(qū)內(nèi)用戶發(fā)布主題信息的影響情況計(jì)算出社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力(3) 根據(jù)計(jì)算出的社區(qū)內(nèi)的用戶的平均用戶傳播主題信息的意愿及社區(qū)的重疊與否,分別計(jì)算 出非重疊社區(qū)的社區(qū)對社區(qū)的影響力和重疊社區(qū)的社區(qū)對社區(qū)的影響力。
[0014] D.將計(jì)算出的社區(qū)影響力、社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的影 響力、社區(qū)對社區(qū)的影響力,用于評估各社區(qū)間的影響力、節(jié)點(diǎn)對社區(qū)的重要性以及社區(qū)對 節(jié)點(diǎn)作用。
[0015] 其中,所述步驟A的具體過程為:
[0016] 社交網(wǎng)絡(luò)模型:社交網(wǎng)絡(luò)形式化為一個(gè)二分圖,G= (V,E),V代表社交網(wǎng)絡(luò)中的用 戶集合,E用來描述用戶間的關(guān)系的集合。
[0017] 社區(qū)模型:社區(qū)是由擁有相同興趣愛好的用戶組成,并且是社交網(wǎng)絡(luò)的一個(gè)子 圖,C=<CV,CE>,當(dāng)用戶屬于社區(qū)可以表示為:^,社區(qū)用戶間的關(guān)系可以表示為: Ch^Eo
[0018] 根據(jù)社區(qū)間是否擁有共同用戶,將社區(qū)分為非重疊社區(qū)和重疊社區(qū)
[0019] (1)非重疊社區(qū):如果社區(qū)中的所有用戶均不屬于另一社區(qū),則該社區(qū)與另一社 區(qū)為非重疊社區(qū),非重疊社區(qū)表示為:NC= <SV,CE>,.vklK,Γ/:;/:。
[0020] (2)重疊社區(qū):如果一個(gè)社區(qū)中的至少有一個(gè)用戶同時(shí)也屬于另一社區(qū),則兩個(gè) 社區(qū)為重疊社區(qū),重疊社區(qū)表示為:〇C=<MCV,SCV,CE
[0021] 根據(jù)上述的非重疊社區(qū)和重疊社區(qū),得出下列屬性:
[0022] ΦV\,/,v7- e C.CFa3^(v.,v7-)-> ν^ν.,ν^.) eC.CE;
[0023] φ^eiynVj)g CCEa Vvi,v}.gC.CV;
[0024] # ,λ OCMC1K式0 λ(:足式0 4 ΟΓ.Λ[Κ ΓΚ)(二義T = 0;
[0025] # 3iVC;矣0 λ37VC;.矣0八7VC;矣4Μ;· Π 7VC; =0.
[0026] 社區(qū)影響力評估算法:根據(jù)給出的社區(qū)模型以及與它相關(guān)的社交網(wǎng)絡(luò)的信息來 評估社區(qū)的影響力,社區(qū)影響力評估算法表示為:Cl(Ci) =f(G,Ci),CI(Ci)表示社區(qū)(^的 影響力,f(G,Ci)表示該模型是基于G和Q。
[0027] 用戶影響力:每個(gè)用戶在其所在的社區(qū)內(nèi)存在一定的影響力,而用戶的影響力是 通過用戶發(fā)布的信息影響的人數(shù)來衡量的,用戶發(fā)布的信息影響的人數(shù)即轉(zhuǎn)發(fā)或分享該信 息的總?cè)藬?shù),用戶發(fā)布的信息,不僅會(huì)影響到社區(qū)內(nèi)的用戶,還會(huì)影響社區(qū)外的用戶,UI的 取值在0到1之間,UI的值越大,表示用戶的影響力越大。
[0028] 社區(qū)影響力:當(dāng)興趣愛好相同的人聚集形成社區(qū)時(shí),社區(qū)就會(huì)形成一定的影響力, 社區(qū)影響力是對社區(qū)內(nèi)用戶影響力的綜合;
[0029] 如述,社交網(wǎng)絡(luò)是由多個(gè)重疊或非重疊社區(qū)組成,社區(qū)是由用戶組成,每個(gè)用戶是 一個(gè)用戶節(jié)點(diǎn),每個(gè)用戶節(jié)點(diǎn)可能屬于一個(gè)或多個(gè)社區(qū),為了便于分析,作出如下定義:
[0030] 每一條主題信息j在社交網(wǎng)絡(luò)中傳播,都會(huì)形成一個(gè)圖gj,社交網(wǎng)絡(luò)中,有η個(gè)主 題,且主題的數(shù)量隨著時(shí)間的推移,在不斷的增加,所以需要不停地對信息進(jìn)行更新,主題S 的集合表示為:S=(S1, s2,S3......sn},主題S傳播過程中形成的圖的集合表示為:g= {gi,g2,g3......gJ。
[0031] 平均用戶傳播主題信息的意愿:每條主題信息由發(fā)布者開始傳播,用戶在面對該 主題信息時(shí),決定是否愿意傳播下去,如果用戶轉(zhuǎn)發(fā)或分享,則說明用戶愿意對該主題信息 進(jìn)行傳播;反之,則不愿意,將用戶對多條主題信息的反應(yīng)綜合,形成平均用戶傳播信息的 意愿。
[0032] 社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響:社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響是社區(qū)內(nèi)的用戶受到社區(qū)內(nèi) 其他用戶的影響。
[0033] 社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力:社區(qū)內(nèi)的用戶發(fā)布的信息,在影響社區(qū)內(nèi)的用戶的 同時(shí),也可能對社區(qū)外的節(jié)點(diǎn)產(chǎn)生影響,將社區(qū)看作一個(gè)整體,社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力 即看作是節(jié)點(diǎn)對節(jié)點(diǎn)的影響力;
[0034] 社區(qū)對社區(qū)的影響力:社交網(wǎng)絡(luò)中的社區(qū)與社區(qū)之間由于用戶之間的交互,使得 社區(qū)與社區(qū)之間存在影響力。
[0035] 其中,所述步驟B的具體過程為:
[0036] 用戶在接收到主題信息時(shí),可能傳播下去,也可能不傳播下去。同時(shí),用戶接收到 該主題信息的途徑可能有多個(gè),可能從一個(gè)或多個(gè)用戶那接收到該信息,用戶u對主題信 息j的標(biāo)記為:
[0037]
【權(quán)利要求】
1. 一種社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,基于圖論方法,其基本步驟為: 第一步,定義社交網(wǎng)絡(luò)與社區(qū)影響力相關(guān)的概念及建模; 第二步,基礎(chǔ)階段,計(jì)算出用戶傳播主題信息的意愿、社區(qū)用戶綜合影響、社區(qū)用戶數(shù) 量、社區(qū)用戶規(guī)模,再綜合計(jì)算出社區(qū)影響力; 第三步,延伸階段,以基礎(chǔ)階段為基礎(chǔ),計(jì)算出社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社 區(qū)外節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)的影響力; 第四步,將計(jì)算出的社區(qū)影響力、社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的影 響力、社區(qū)對社區(qū)的影響力,用于評估各社區(qū)間的影響力、節(jié)點(diǎn)對社區(qū)的重要性以及社區(qū) 對節(jié)點(diǎn)作用。
2. 根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述第一步定 義,包括步驟: 社交網(wǎng)絡(luò)模型:社交網(wǎng)絡(luò)可以形式化為一個(gè)二分圖,G= (V,E),V代表社交網(wǎng)絡(luò)中的用 戶集合,E用來描述用戶間的關(guān)系的集合; 社區(qū)模型:社區(qū)是由擁有相同興趣愛好的用戶組成,為社交網(wǎng)絡(luò)的一個(gè)子圖,C= <CV,CE>,當(dāng)用戶屬于社區(qū)表示為:,社區(qū)用戶間的關(guān)系表示為:; 根據(jù)社區(qū)間是否擁有共同用戶,將社區(qū)分為非重疊社區(qū)和重疊社區(qū); (1) 非重疊社區(qū):如果社區(qū)中的所有用戶均不屬于另一社區(qū),則該社區(qū)與另一社區(qū)為 非重疊社區(qū),非重疊社區(qū)表示為
(2) 重疊社區(qū):如果一個(gè)社區(qū)中的至少有一個(gè)用戶同時(shí)也屬于另一社區(qū),則兩個(gè)社區(qū) 為重疊社區(qū),重疊社區(qū)表示為
根據(jù)上述的非重疊社區(qū)和重疊社區(qū),得出下列屬性:
社區(qū)影響力評估算法:根據(jù)給出的社區(qū)模型以及與它相關(guān)的社交網(wǎng)絡(luò)的信息來評估 社區(qū)的影響力,社區(qū)影響力評估算法表示為
表示社區(qū)q的影響 力,f(G,Ci)表示該模型是基于G和Ci; 用戶影響力:每個(gè)用戶在其所在的社區(qū)內(nèi)存在一定的影響力,而用戶的影響力是通過 用戶發(fā)布的信息影響的人數(shù)來衡量的,用戶發(fā)布的信息影響的人數(shù)即轉(zhuǎn)發(fā)或分享該信息的 總?cè)藬?shù),用戶發(fā)布的信息,不僅會(huì)影響到社區(qū)內(nèi)的用戶,還會(huì)影響社區(qū)外的用戶,UI的取值 在0到1之間,UI的值越大,表示用戶的影響力越大; 社區(qū)影響力:當(dāng)興趣愛好相同的人聚集形成社區(qū)時(shí),社區(qū)就會(huì)形成一定的影響力,社區(qū) 影響力是對社區(qū)內(nèi)用戶影響力的綜合; 如述,社交網(wǎng)絡(luò)是由多個(gè)重疊或非重疊社區(qū)組成,社區(qū)是由用戶組成,每個(gè)用戶是一個(gè) 用戶節(jié)點(diǎn),每個(gè)用戶節(jié)點(diǎn)可能屬于一個(gè)或多個(gè)社區(qū),為了便于分析,作出如下定義: 每一條主題信息j在社交網(wǎng)絡(luò)中傳播,都會(huì)形成一個(gè)圖gj,社交網(wǎng)絡(luò)中,有n個(gè)主題, 且主題的數(shù)量隨著時(shí)間的推移,在不斷的增加,所以需要不停地對信息進(jìn)行更新,主題s 的集合表示為:s={Sps2,s3......sn},主題S傳播過程中形成的圖的集合表示為:g= {gi,g2.Ss......gnl; 平均用戶傳播主題信息的意愿:每條主題信息由發(fā)布者開始傳播,用戶在面對該主題 信息時(shí),決定是否愿意傳播下去,如果用戶轉(zhuǎn)發(fā)或分享,則說明用戶愿意對該主題信息進(jìn) 行傳播;反之,則不愿意,將用戶對多條主題信息的反應(yīng)綜合,形成平均用戶傳播信息的意 愿; 社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響:社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響是社區(qū)內(nèi)的用戶受到社區(qū)內(nèi)其他 用戶的影響; 社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力:社區(qū)內(nèi)的用戶發(fā)布的信息,在影響社區(qū)內(nèi)的用戶的同時(shí), 也可能對社區(qū)外的節(jié)點(diǎn)產(chǎn)生影響,將社區(qū)看作一個(gè)整體,社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力即看 作是節(jié)點(diǎn)對節(jié)點(diǎn)的影響力; 社區(qū)對社區(qū)的影響力:社交網(wǎng)絡(luò)中的社區(qū)與社區(qū)之間由于用戶之間的交互,使得社區(qū) 與社區(qū)之間存在影響力。
3. 根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述第二步基 礎(chǔ)階段,計(jì)算出用戶傳播主題信息的意愿、社區(qū)用戶綜合影響、社區(qū)用戶規(guī)模,統(tǒng)計(jì)出社區(qū) 用戶數(shù)量,再綜合計(jì)算出社區(qū)影響力,包括步驟: (1) 分別統(tǒng)計(jì)用戶接收和傳播主題信息的次數(shù),計(jì)算出平均用戶傳播主題信息的意 愿; (2) 根據(jù)社區(qū)內(nèi)平均用戶傳播主題信息的意愿及用戶影響力,計(jì)算出社區(qū)內(nèi)所有用戶 的綜合影響;統(tǒng)計(jì)社區(qū)內(nèi)的用戶數(shù)量,得出社區(qū)用戶數(shù)量;根據(jù)用戶間的關(guān)系,計(jì)算出社區(qū) 的用戶規(guī)模; (3) 結(jié)合上述計(jì)算出的社區(qū)內(nèi)所有用戶的綜合影響、社區(qū)的用戶規(guī)模,以及統(tǒng)計(jì)出的社 區(qū)的用戶數(shù)量,計(jì)算出社區(qū)影響力。
4. 根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述第三步延 伸階段,計(jì)算出社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力、社區(qū)對社區(qū)的影 響力,包括步驟: (1) 社區(qū)內(nèi)節(jié)點(diǎn)受其他用戶發(fā)布主題信息的影響情況計(jì)算出社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響 力; (2) 根據(jù)計(jì)算出的社區(qū)內(nèi)用戶的平均用戶傳播主題信息的意愿及社區(qū)外節(jié)點(diǎn)受社區(qū)內(nèi) 用戶發(fā)布主題信息的影響情況計(jì)算出社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力; (3) 根據(jù)計(jì)算出的社區(qū)內(nèi)的用戶的平均用戶傳播主題信息的意愿及社區(qū)的重疊與否, 分別計(jì)算出非重疊社區(qū)的社區(qū)對社區(qū)的影響力及重疊社區(qū)的社區(qū)對社區(qū)的影響力。
5. 根據(jù)權(quán)利要求3所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述⑴分別統(tǒng) 計(jì)用戶接收和傳播主題信息的次數(shù),計(jì)算出平均用戶傳播主題信息的意愿,還包括步驟: 用戶在接收到主題信息時(shí),可能傳播下去,也可能不傳播下去,同時(shí),用戶接收到該主 題信息的途徑可能有多個(gè),可能從一個(gè)或多個(gè)用戶那接收到該信息,用戶u對主題信息j的 標(biāo)記為:
用戶U接收主題信息的次數(shù),初始值為0,若此時(shí)用戶u對主題信息j的標(biāo)記為1,則用 戶u接收主題信息的次數(shù)加1,雖然用戶u可能從多個(gè)用戶那接收到主題信息j,但是,用戶 U對主題信息j的累加只進(jìn)行一次,用戶U對主題信息j的傳播,是通過觀察圖gj,
其中,為0時(shí),表明用戶未對該主題信息進(jìn)行傳播,為1時(shí),表明用戶對該主 題信息進(jìn)行了傳播;當(dāng)用戶u的出度大于0時(shí),說明用戶u對主題信息j進(jìn)行了傳播,平均 用戶傳播主題信息的意愿,其計(jì)算方法為:
AP(u)為用戶u平均傳播主題信息的意愿;0為綜合因子,且0e[0,1] ;Pr〇u為用 戶傳播主題信息的總次數(shù);AcSu為用戶接收主題信息的總次數(shù);集合A(u)為社區(qū)內(nèi)指向用 戶U的節(jié)點(diǎn),VGA(U)為節(jié)點(diǎn)V指向u被存放于集合A(u);集合B(u)為社區(qū)外指向用戶u 的節(jié)點(diǎn),beB(u)為社區(qū)外節(jié)點(diǎn)b指向u被存放于集合;每條主題信息的傳播,都會(huì)形成一 個(gè)新的圖,S(u),g(u)分別為節(jié)點(diǎn)u發(fā)布的主題信息的集合,發(fā)布主題信息后形成的主題信 息傳播圖的集合,對每個(gè)新圖的指向u的節(jié)點(diǎn)和社區(qū)外節(jié)點(diǎn)對節(jié)點(diǎn)u產(chǎn)生的影響進(jìn)行計(jì)算 綜合;w(v),w(b)分別為節(jié)點(diǎn)v和節(jié)點(diǎn)b的權(quán)重,而w(v)和w(b)是通過節(jié)點(diǎn)的出度來衡量 的;a為社區(qū)外節(jié)點(diǎn)對社區(qū)內(nèi)節(jié)點(diǎn)的影響系數(shù);in表示社區(qū)外節(jié)點(diǎn)指向社區(qū)內(nèi)節(jié)點(diǎn)的 次數(shù),ta。表示社區(qū)內(nèi)節(jié)點(diǎn)指向社區(qū)外節(jié)點(diǎn)的次數(shù),""氣表示社區(qū)內(nèi)用戶的數(shù)量;假設(shè)AP(u) 的初值為1 ; 以上對平均用戶傳播主題信息的意愿的計(jì)算是通過將用戶自身傳播信息的意愿和社 區(qū)內(nèi)以及社區(qū)外節(jié)點(diǎn)對用戶的影響進(jìn)行綜合,得出客觀的平均用戶傳播信息的意愿。
6.根據(jù)權(quán)利要求3所述的社交網(wǎng)絡(luò)社區(qū)影響力評估,其特征在于,所述(2)根據(jù)社區(qū)內(nèi) 平均用戶傳播主題信息的意愿及用戶影響力,計(jì)算出社區(qū)內(nèi)所有用戶的綜合影響,統(tǒng)計(jì)社 區(qū)內(nèi)的用戶數(shù)量,得出社區(qū)用戶數(shù)量,根據(jù)用戶間的關(guān)系,計(jì)算出社區(qū)的用戶規(guī)模,還包括 步驟: 用戶發(fā)布的主題信息,將會(huì)對社區(qū)內(nèi)和社區(qū)外的用戶產(chǎn)生影響,對用戶影響力,其計(jì)算 方法為:
7
其中,UI(U)為用戶u的影響力;S(u)為用戶u發(fā)布的主題信息的集合;sum^為r條 主題信息影響的社區(qū)內(nèi)人數(shù);smvu為r條主題信息影響的社區(qū)外人數(shù)邛為社區(qū)內(nèi)節(jié)點(diǎn) 對社區(qū)外節(jié)點(diǎn)的影響系數(shù);tac;_。表示社區(qū)內(nèi)用戶指向社區(qū)外用戶的次數(shù),ta。表示社區(qū)外用 戶接收社區(qū)內(nèi)主題信息的次數(shù),nUIVt表示社區(qū)外用戶的數(shù)量,€為用戶影響力的影響因 子,表示社區(qū)內(nèi)用戶的數(shù)量,numsai^示用戶u發(fā)布的主題信息的次數(shù);如果用戶從未 發(fā)布過信息,就設(shè)用戶的影響力為〇. 01 ; 根據(jù)用戶發(fā)布的所有主題信息,對社區(qū)內(nèi)和社區(qū)外產(chǎn)生影響的總?cè)藬?shù)的綜合得出用戶 影響力; 相對于社區(qū)外的用戶而言,社區(qū)又被看作一個(gè)整體,則整體就有其特有的影響力,包括 如下因素: a. 社區(qū)內(nèi)用戶的綜合影響,其計(jì)算方法為:
UIKQ)是社區(qū)Q的用戶綜合影響;I(u)是社區(qū)內(nèi)用戶的集合;AP(u)是用戶u的平均 傳播主題信息的意愿;UI(u)是用戶u的用戶影響力; b. 社區(qū)用戶的數(shù)量是社區(qū)內(nèi)存在的用戶的數(shù)量,在計(jì)算社區(qū)影響力時(shí)起著至關(guān)重要的 作用,如果不考慮該因素,則不同的社區(qū)可能有相同的社區(qū)影響力,這是不合理的; c. 社區(qū)用戶規(guī)模是用戶間的關(guān)系,通過用戶的出度來確定,社區(qū)用戶規(guī)模,其計(jì)算方法 為:
US(Ci)是社區(qū)Ci的用戶規(guī)模,outdegree(u)是用戶u的出度。
7. 根據(jù)權(quán)利要求3所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述(3)結(jié)合上 述計(jì)算出的社區(qū)內(nèi)所有用戶的綜合影響、社區(qū)的用戶規(guī)模,以及統(tǒng)計(jì)出的社區(qū)的用戶數(shù)量, 計(jì)算出社區(qū)影響力,還包括步驟: 綜合上述三個(gè)因素,得出社區(qū)影響力,社區(qū)影響力,其計(jì)算方法為:
其中,M和N是影響因素,因?yàn)樵诓煌纳鐓^(qū)影響力評估算法中各個(gè)影響因素的重要性 不同,M和N可根據(jù)實(shí)際情況進(jìn)行取值。
8. 根據(jù)權(quán)利要求4所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述(1)社區(qū) 內(nèi)節(jié)點(diǎn)受其他用戶發(fā)布主題信息的影響情況計(jì)算出社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力,還包括步 驟: 社區(qū)對社區(qū)內(nèi)的用戶的影響力,其計(jì)算方法為:
假設(shè)節(jié)點(diǎn)h在社區(qū)內(nèi),I(u)是社區(qū)內(nèi)節(jié)點(diǎn)的集合,I(u)_{h}表示節(jié)點(diǎn)h不在集合內(nèi);influ用來標(biāo)記節(jié)點(diǎn)h是否被用戶u發(fā)布的影響影響,如果節(jié)點(diǎn)h被主題信息s影響,influ 則是1,否則influ是0 ; 社區(qū)對社區(qū)內(nèi)節(jié)點(diǎn)的影響力的計(jì)算是將社區(qū)外節(jié)點(diǎn)受到社區(qū)內(nèi)節(jié)點(diǎn)發(fā)布信息的影響 和社區(qū)內(nèi)用戶影響力綜合。
9. 根據(jù)權(quán)利要求4所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述⑵根據(jù)計(jì) 算出的社區(qū)內(nèi)用戶的平均用戶傳播主題信息的意愿及社區(qū)外節(jié)點(diǎn)受社區(qū)內(nèi)用戶發(fā)布主題 信息的影響情況計(jì)算出社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力,還包括步驟: 由于社區(qū)是由許多用戶組成的群體,這個(gè)群體勢必會(huì)對社區(qū)外的節(jié)點(diǎn)產(chǎn)生影響力,社 區(qū)對社區(qū)外節(jié)點(diǎn)的影響力,其計(jì)算方法如下: 假設(shè)節(jié)點(diǎn)q為社區(qū)外節(jié)點(diǎn),
其中,ICTN(q)為社區(qū)對社區(qū)外節(jié)點(diǎn)q的影響力;3為社區(qū)內(nèi)節(jié)點(diǎn)對社區(qū)外節(jié)點(diǎn)的 影響系數(shù);C(u)為社區(qū)內(nèi)用戶的集合;AP(u)為用戶u的平均用戶傳播主題信息的意愿; S(u),g(u)分別為節(jié)點(diǎn)u發(fā)布的主題信息的集合,發(fā)布主題信息后形成的主題信息傳播圖 的集合;infs為用戶u發(fā)布的主題信息對節(jié)點(diǎn)q的影響,若主題信息s對用戶產(chǎn)生影響,則 infs為1,反之,則inf3為0 ; 上述社區(qū)對社區(qū)外節(jié)點(diǎn)的影響力,根據(jù)社區(qū)內(nèi)所有節(jié)點(diǎn)發(fā)布的主題信息,對社區(qū)外節(jié) 點(diǎn)產(chǎn)生影響和社區(qū)內(nèi)節(jié)點(diǎn)的平均傳播主題信息的意愿綜合得出。
10. 根據(jù)權(quán)利要求4所述的社交網(wǎng)絡(luò)社區(qū)影響力評估算法,其特征在于,所述(3)根據(jù) 計(jì)算出的社區(qū)內(nèi)的用戶的平均用戶傳播主題信息的意愿及社區(qū)的重疊與否,分別計(jì)算出非 重疊社區(qū)的社區(qū)對社區(qū)的影響力和重疊社區(qū)的社區(qū)對社區(qū)的影響力,還包括步驟: a. 非重疊社區(qū) 社區(qū)GA和社區(qū)GB是重疊社區(qū),對GA對社區(qū)G 影響力,其計(jì)算方法為:
其中,ICTC(GA-GB)為社區(qū)GA對社區(qū)GB的影響力;@為社區(qū)內(nèi)節(jié)點(diǎn)對社區(qū)外節(jié)點(diǎn)的 影響系數(shù);D(GA)和H(GB)分別為社區(qū)GA和社區(qū)GB*用戶的集合;AP(u)為用戶u的平均用 戶傳播主題信息的意愿;S(GA)和g(GA)分別為社區(qū)GA*所有用戶發(fā)布的主題信息的集合和 所有用戶發(fā)布的主題信息形成的主題信息傳播圖的集合;sumu_為社區(qū)GA中用戶u發(fā)布的 所有主題信息影響的社區(qū)&的人數(shù); 上述社區(qū)對社區(qū)的影響力的計(jì)算是通過統(tǒng)計(jì)社區(qū)GA發(fā)布的所有主題信息對社區(qū)GB產(chǎn) 生影響的人數(shù),綜合得出了社區(qū)間的影響力; b. 重疊社區(qū),其計(jì)算方法為:
其中,ICTC(GA-GB)為社區(qū)64對社區(qū)GB的影響力;GA-GAnGB為社區(qū)GA中減去與社區(qū)GB重疊的用戶所剩余的用戶的集合;GB-GAnGB為社區(qū)GB中去掉與社區(qū)64重疊的用戶所剩 余的用戶的集合;AP(u)為用戶u的平均用戶傳播主題信息的意愿;S(G(A)-G(A)nG(B)) 和g(G(A)-G(A)nG(B))分別為社區(qū)GA中去掉與社區(qū)GB重合的用戶,所剩下的用戶發(fā)布的 主題信息的集合和剩下的用戶發(fā)布的主題信息形成的主題信息傳播圖的集合;sumu_為社 區(qū)Ga中去掉與社區(qū)Gb重合的用戶,所剩下的用戶u發(fā)布的所有主題信息影響的社區(qū)Gb* 去掉與社區(qū)64重合的用戶的總?cè)藬?shù);G(A)nG(B)為社區(qū)Ga與社區(qū)Gb重疊的用戶的集合; S(G(A)nG(B))和g(G(A)nG(B))分別為社區(qū)GA與社區(qū)GB重合的用戶,重合的用戶發(fā)布 的主題信息的集合和重合的用戶發(fā)布的主題信息形成的主題信息傳播圖的集合;sumin.u為 節(jié)點(diǎn)u發(fā)布的主題信息影響的社區(qū)&內(nèi)人數(shù); 上述對重疊社區(qū)對社區(qū)的影響力的計(jì)算是通過將社區(qū)GA中去掉與社區(qū)GB重疊的用戶, 剩下的用戶對社區(qū)GB中去掉與社區(qū)GA重疊的用戶產(chǎn)生的影響以及社區(qū)GA和社區(qū)GB重疊的 用戶,對社區(qū)&產(chǎn)生的影響的綜合,得出社區(qū)對社區(qū)的影響力。
【文檔編號】G06Q50/00GK104484825SQ201410740284
【公開日】2015年4月1日 申請日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】張波, 楊濤, 宋倩倩, 宋鋒, 胡斯卉 申請人:上海師范大學(xué), 公安部第三研究所