微博傳播的關鍵用戶識別方法和裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及信息技術領域,尤其涉及一種微博傳播的關鍵用戶識別方法和裝置。
【背景技術】
[0002]微博是一個基于用戶關系的信息獲取、分享的傳播平臺,是一種當前十分流行的虛擬社會網(wǎng)絡系統(tǒng)。在熱點微博獲取分享的過程中,以用戶為節(jié)點,以用戶的互動關系為邊將用戶節(jié)點聯(lián)接起來,構成了一種特定的社會網(wǎng)絡結構,在此網(wǎng)絡結構中,節(jié)點位置重要性的分析為熱點微博的輿情擴散監(jiān)測提供了一個十分重要解決思路。
[0003]目前,基于改進的PAGERANK的方法,根據(jù)網(wǎng)站的外部鏈接和內部鏈接的數(shù)量和質量來衡量網(wǎng)站的價值,考慮用戶的外部資源流向及本身資源兩方面來對用戶影響力進行評價,資源一般指好友數(shù)量。然而,該方法所確定的微博傳播的關鍵用戶準確度不高。
【發(fā)明內容】
[0004]本發(fā)明提供一種微博傳播的關鍵用戶識別方法和裝置,以提高確定的微博傳播的關鍵用戶的準確度。
[0005]一方面,本發(fā)明提供一種微博傳播的關鍵用戶識別方法,包括:
[0006]在微博傳播的網(wǎng)絡架構中,確定每個節(jié)點所連接的節(jié)點個數(shù);
[0007]在所述網(wǎng)絡架構中,按照連接節(jié)點個數(shù)從少到多的順序執(zhí)行多次刪除操作,每次所述刪除操作將連接節(jié)點個數(shù)相同的節(jié)點從所述網(wǎng)絡架構中刪除直至所述網(wǎng)絡架構中剩余連接節(jié)點個數(shù)相同的至少一個目標節(jié)點;
[0008]將所述目標節(jié)點確定為微博傳播的關鍵用戶節(jié)點。
[0009]另一方面,本發(fā)明提供一種微博傳播的關鍵用戶識別裝置,包括:
[0010]確定模塊,用于在微博傳播的網(wǎng)絡架構中,確定每個節(jié)點所連接的節(jié)點個數(shù);
[0011]刪除模塊,用于在所述網(wǎng)絡架構中,按照連接節(jié)點個數(shù)從少到多的順序執(zhí)行多次刪除操作,每次所述刪除操作將連接節(jié)點個數(shù)相同的節(jié)點從所述網(wǎng)絡架構中刪除直至所述網(wǎng)絡架構中剩余連接節(jié)點個數(shù)相同的至少一個目標節(jié)點;
[0012]所述確定模塊還用于:將所述目標節(jié)點確定為微博傳播的關鍵用戶節(jié)點。
[0013]本發(fā)明實施例提供的微博傳播的關鍵用戶識別方法和裝置,在微博傳播的網(wǎng)絡架構中,按照連接節(jié)點個數(shù)從少到多的順序執(zhí)行多次刪除操作,每次刪除操作將連接節(jié)點個數(shù)相同的節(jié)點從網(wǎng)絡架構中刪除直至網(wǎng)絡架構中剩余連接節(jié)點個數(shù)相同的至少一個目標節(jié)點,最后將目標節(jié)點確定為微博傳播的關鍵用戶節(jié)點。從而提高確定的微博傳播的關鍵用戶的準確度。
【附圖說明】
[0014]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖做一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1為本發(fā)明提供的微博傳播的關鍵用戶識別方法一個實施例的流程圖;
[0016]圖2為本發(fā)明提供的微博傳播的網(wǎng)絡架構示意圖;
[0017]圖3為本發(fā)明提供的微博傳播的關鍵用戶識別裝置一個實施例的結構示意圖。
【具體實施方式】
[0018]為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0019]圖1為本發(fā)明提供的微博傳播的關鍵用戶識別方法一個實施例的流程圖,如圖1所示,該方法包括:
[0020]SlOU在微博傳播的網(wǎng)絡架構中,確定每個節(jié)點所連接的節(jié)點個數(shù)。
[0021]S102、在網(wǎng)絡架構中,按照連接節(jié)點個數(shù)從少到多的順序執(zhí)行多次刪除操作,每次刪除操作將連接節(jié)點個數(shù)相同的節(jié)點從網(wǎng)絡架構中刪除直至網(wǎng)絡架構中剩余連接節(jié)點個數(shù)相同的至少一個目標節(jié)點。
[0022]S103、將目標節(jié)點確定為微博傳播的關鍵用戶節(jié)點。
[0023]其中,微博傳播的網(wǎng)絡架構通常由數(shù)個節(jié)點組成,每個節(jié)點可以看作一個微博用戶。因此,對于任意一條微博的轉發(fā)傳播,都可以建立一個網(wǎng)絡架構。具體的,可以首先確定轉發(fā)微博的節(jié)點及其與其他節(jié)點的互動關系,進一步的可以根據(jù)互動關系,連接轉發(fā)微博的節(jié)點以構成微博傳播的網(wǎng)絡架構。
[0024]圖2提供了一種微博傳播的網(wǎng)絡架構示意圖,如圖2所示,在某一熱點微博獲取分享的過程中,節(jié)點(即微博用戶)之間的互動關系形成了上圖的網(wǎng)絡架構?,F(xiàn)有技術中,通常會著重考慮到節(jié)點C的資源較多(即具有互動關系的節(jié)點較多),且在局部的網(wǎng)絡架構中處于中心地位而將節(jié)點C給予較高的重要性。而從圖2所示節(jié)點A才是整體網(wǎng)絡結構中的處于核心位置的節(jié)點(即微博傳播的關鍵用戶節(jié)點,往往是微博傳播的源頭)。
[0025]本發(fā)明中,考慮到處于核心位置的結點往往是熱點微博的源頭,此節(jié)點用戶未必是領袖用戶,即擁有的互動關系未必很多,在整體的網(wǎng)絡架構中的位置比較深,但經(jīng)過若干層傳播后,此過程中往往會得到若干領袖用戶(節(jié)點)的轉發(fā),使得該微博得到廣泛認可。例如:圖2中節(jié)點C的互動關系最多,但是和節(jié)點C具有互動關系的這些節(jié)點所連接的接收個數(shù)卻很低,因此,可以按照連接節(jié)點個數(shù)從少到多的順序執(zhí)行多次刪除操作,例如:連接節(jié)點個數(shù)最少的節(jié)點所連接的節(jié)點個數(shù)是I個,則可以先將連接節(jié)點個數(shù)為I的節(jié)點從網(wǎng)絡架構中刪除,該次刪除操作之后,網(wǎng)絡架構中原本連接節(jié)點個數(shù)為2的節(jié)點,其連接節(jié)點個數(shù)變?yōu)?,則下一次刪除操作會將這部分節(jié)點從網(wǎng)絡架構中刪除,依次類推,直至網(wǎng)絡架構中剩余連接節(jié)點個數(shù)相同的至少一個目標節(jié)點,例如:網(wǎng)絡架構中只剩余連接節(jié)點個數(shù)都為2的一個或多個目標節(jié)點,則將這些目標節(jié)點確定為微博傳播的關鍵用戶節(jié)點。
[0026]為了使確定目標節(jié)點的過程更加簡單,可以將連接節(jié)點個數(shù)為I的節(jié)點確定為第I度節(jié)點,連接節(jié)點個數(shù)為2的節(jié)點確定為第2度節(jié)點,依次類推,連接節(jié)點個數(shù)為N的節(jié)點確定為第N度節(jié)點,N為大于I的整數(shù)。
[0027]則相應的,可以按照從第I度節(jié)點到第N度節(jié)點的順序執(zhí)行刪除操作,每次刪除操作將度數(shù)相同的節(jié)點從網(wǎng)絡中刪除,直至網(wǎng)絡架構中剩余度數(shù)相同的至少一個第N度目標節(jié)點。
[0028]以下以圖2為例進行具體說明:方法的計算思路是此例子中從最低的第I度節(jié)點開始僅行刪除操作,經(jīng)過第一次刪除后,節(jié)點C只連接一個節(jié)點A和一個節(jié)點D,因此節(jié)點變?yōu)榈?度節(jié)點,類似的,節(jié)點E由第2度節(jié)點變成了第I度節(jié)點,因此再對第I度節(jié)點進行第二次后,節(jié)點D由第2度節(jié)點變成了第I度節(jié)點,再對第I度節(jié)點進行第三次刪除,此時節(jié)點C由第2度節(jié)點變成了第I度節(jié)點,再對第I度節(jié)點進行第四次刪除,則節(jié)點C從此網(wǎng)絡架構中消失,以此類推,循環(huán)進行上述操作后直到網(wǎng)絡架構中沒有第I度節(jié)點,最終剩余的僅有第2度4個節(jié)點A,因此該4個節(jié)點A即為目標節(jié)點。
[0029]在上述過程的具體實現(xiàn)中,網(wǎng)絡架構中的節(jié)點總數(shù)可以記為N,每個結點賦予一個ID, ID 值從 O 到 N-1。
[0030]定義整形數(shù)組cores,初始化數(shù)組,數(shù)組大小為N。為cores數(shù)組的元素賦初值,方法是:此數(shù)組的索引意義是節(jié)點的ID,而元素值為節(jié)點的度數(shù),即上述的第幾度節(jié)點。統(tǒng)計出此數(shù)組元素最大值記為M。
[0031]定義整形數(shù)組bin,初始化數(shù)組,數(shù)組大小為M+1。此數(shù)組的索引意義是度值,為bin數(shù)組的元素賦初值,計算流程如下:
[0032]for int i=0to N-1
[0033]bin [cores [i] ] +=1
[0034]int j=0
[0035]for int i=0to M
[0036]int k=bin[i]
[0037]bin[i]=j
[0038]j+=k
[0039]定義整形數(shù)組vert與pos,初始化兩個數(shù)組,數(shù)組大小為N。vert數(shù)組的索引意義是節(jié)點按度的排序,pos數(shù)組的索引意義是節(jié)點的ID,為vert和pos數(shù)組的元素賦初值,計算流程如下:
[0040]for int i=0to N-1
[0041]pos [i]=bin [cores [i]]
[0042]vert [pos [i] ] =i
[0043]bin [cores [i] ] +=1
[0044]for int i=M to I
[0045]bin [i] =bin [i_l]
[0046]bin[0]=0
[0047]以上步驟對算法所需要的四個數(shù)組cores、bin、vert、pos進行了賦初值。此步驟描述該方法主要計算流程,主要經(jīng)過兩層FOR循環(huán),每次循環(huán)中,會對cores、bin、vert、pos數(shù)組元素值進行調整,最后的打分結果存在cores數(shù)組中。計算流程如下:
[0048]for int i=0to N-1
[0049]int v=vert [i]
[0050]定義臨時的整形數(shù)組neis,統(tǒng)計出節(jié)點ID=V的節(jié)點的所有鄰居節(jié)點ID及個數(shù)S。鄰居結點