欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于關(guān)系圖的微博僵尸用戶檢測(cè)方法

文檔序號(hào):8006438閱讀:260來(lái)源:國(guó)知局
基于關(guān)系圖的微博僵尸用戶檢測(cè)方法
【專利摘要】基于關(guān)系圖分析的微博僵尸用戶檢測(cè)方法,包括數(shù)據(jù)收集模塊和關(guān)系圖分析模塊;數(shù)據(jù)收集模塊用于收集一個(gè)已知僵尸用戶的數(shù)據(jù)和從數(shù)據(jù)中挑選樣本用戶。關(guān)系圖分析模塊用于判斷樣本用戶是否是僵尸用戶:首先建立已知僵尸用戶和樣本用戶的關(guān)系圖;初始化用戶的惡意評(píng)分;計(jì)算用戶的關(guān)聯(lián)性數(shù)值并按照關(guān)系圖和傳播規(guī)則計(jì)算和更新樣本用戶的惡意評(píng)分;判斷樣本用戶的惡意評(píng)分的是否傳播收斂;判斷傳播收斂的樣本用戶的惡意評(píng)分是否大于閾值,大于閾值則該樣本用戶為僵尸用戶。本發(fā)明利用僵尸用戶的社會(huì)關(guān)系和語(yǔ)義關(guān)系尋找識(shí)別其他僵尸用戶,提高了僵尸用戶的判別效率。本發(fā)明運(yùn)用于社交網(wǎng)絡(luò),為其提供更加安全有效的檢測(cè)服務(wù),提高了社交網(wǎng)絡(luò)的安全性。
【專利說(shuō)明】基于關(guān)系圖的微博僵尸用戶檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種微博僵尸用戶檢測(cè)方法,尤其涉及一種基于關(guān)系圖的微博僵尸用戶檢測(cè)方法。
【背景技術(shù)】
[0002]當(dāng)今科技時(shí)代,隨著智能通信終端的流行,移動(dòng)互聯(lián)網(wǎng)也日益走進(jìn)人們的日常生活中。當(dāng)前,社交網(wǎng)絡(luò)是移動(dòng)互聯(lián)網(wǎng)中相當(dāng)熱門的應(yīng)用,如國(guó)外的“Facebook”和“Twitter”等,在中國(guó),在線社交網(wǎng)絡(luò)也已漸漸成為一個(gè)主要的平臺(tái),比較熟知和常用的是微博,人們?cè)诰W(wǎng)絡(luò)上通過(guò)微博搜集信息,結(jié)交志同道合的人。微博,即微博客(MicroBlog)的簡(jiǎn)稱,是一種可以即時(shí)發(fā)布消息的類似博客的系統(tǒng),是一個(gè)基于用戶關(guān)系的信息分享、傳播以及獲取平臺(tái)。微博被稱為中國(guó)的“Twitter”,因?yàn)樗愃朴赥witter。微博不僅可以滿足用戶相互推薦彼此感興趣的網(wǎng)絡(luò)咨詢,還可以關(guān)注自己欣賞的名人或朋友,查看別人的最新動(dòng)態(tài)或發(fā)表自己的最新言論,從而達(dá)到與別人分享快樂(lè)的目的,因此微博得到了越來(lái)越多人的喜愛(ài)。
[0003]然而,從用戶的使用習(xí)慣和不同的文化角度來(lái)看,微博和“ Tw i 11 er ”是不同的。根據(jù)惠普實(shí)驗(yàn)室的研究,人們?cè)谖⒉┥细矚g轉(zhuǎn)發(fā)信息而不是發(fā)表原創(chuàng)的微博,只要分享的有價(jià)值,人們?cè)谖⒉┥蠒?huì)很熱心幫助轉(zhuǎn)發(fā)。此外,兩者在用戶體驗(yàn)方面也不同。在“Twitter”,人們只能分享文本信息,但在微博中,人們還能夠分享圖片、視頻和音頻。此外,微博也允許用戶回復(fù)狀態(tài)并在同一時(shí)間轉(zhuǎn)發(fā),這在“Twitter”是不可行的。
[0004]隨著微博的廣泛發(fā)展,出現(xiàn)了許多虛假用戶,即僵尸用戶。這些僵尸用戶的出現(xiàn)存在很多方面的原因。一方面,為了滿足微博用戶的虛榮心和提高個(gè)人微博的關(guān)注度,有些人選擇花錢買一些虛假的用戶來(lái)提高自己的用戶絲數(shù)目,這種行為大大降低了用戶的個(gè)人誠(chéng)信;另一方面就是有人利用微博的這種檢測(cè)漏洞大肆販賣“僵尸用戶”,那些在背后控制“僵尸用戶”的人通過(guò)交易獲取不小的利益,致使僵尸用戶產(chǎn)業(yè)鏈的產(chǎn)生,為微博帶來(lái)不小的負(fù)面影響。這也是微博與“Twitter”的一個(gè)明顯區(qū)別。
[0005]現(xiàn)在,有許多人研究西方社交網(wǎng)站,然而,對(duì)中國(guó)社交網(wǎng)絡(luò)的研究卻是一片空白。由于微博和“Twitter”的巨大差異,所以,本領(lǐng)域的技術(shù)人員致力于開發(fā)一種檢測(cè)微博僵尸用戶的方法。

【發(fā)明內(nèi)容】

[0006]有鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于可視化關(guān)系圖分析的微博僵尸用戶檢測(cè)方法。
[0007]為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于可視關(guān)系網(wǎng)絡(luò)的微博僵尸用戶檢測(cè)方法,其特征在于,包括數(shù)據(jù)收集模塊和關(guān)系圖分析模塊;
[0008]所述數(shù)據(jù)收集模塊用于根據(jù)一個(gè)已知僵尸用戶,收集所述已知僵尸用戶的數(shù)據(jù),并挑選出樣本用戶;[0009]所述關(guān)系圖分析模塊用于判斷所述樣本用戶是否是僵尸用戶,具體包括以下步驟:
[0010]步驟201,將所述已知僵尸用戶和所述樣本用戶的關(guān)系屬性可視化,作出關(guān)系圖:所述已知僵尸用戶和所述樣本用戶均作為所述關(guān)系圖的節(jié)點(diǎn);
[0011]步驟202,初始化所述已知僵尸用戶和所述樣本用戶的惡意評(píng)分;
[0012]步驟203,分析所述關(guān)系圖的共性,計(jì)算所述關(guān)系圖中各個(gè)所述節(jié)點(diǎn)的關(guān)聯(lián)性數(shù)值,并按照傳播規(guī)則和所述關(guān)系圖計(jì)算和更新所述樣本用戶的惡意評(píng)分;
[0013]步驟204,判斷所述樣本用戶的所述惡意評(píng)分是否傳播收斂,如果傳播收斂,跳入步驟205 ;如果不傳播收斂,則跳轉(zhuǎn)入步驟203 ;
[0014]步驟205,判斷所述樣本用戶的所述惡意評(píng)分是否大于閾值,如果大于所述閾值,則跳轉(zhuǎn)入步驟206 ;如果小于所述閾值,則所述樣本用戶被判定為正常用戶;
[0015]步驟206:所述樣本用戶被判定為僵尸用戶;
[0016]步驟207:處理完畢。
[0017]進(jìn)一步地,所述數(shù)據(jù)收集模塊是通過(guò)微博API收集的所述已知僵尸用戶的數(shù)據(jù)。
[0018]進(jìn)一步地,所述已知僵尸用戶的數(shù)據(jù)包括用戶粉絲和關(guān)注者的名字以及數(shù)量。
[0019]進(jìn)一步地,所述數(shù)據(jù)收集模塊對(duì)所述樣本用戶的選擇是隨機(jī)的。
[0020]進(jìn)一步地,所述數(shù)據(jù)收集模塊選擇的所述樣本用戶的用戶粉絲和關(guān)注者的數(shù)量小于 1000。
[0021]進(jìn)一步地,所述步驟201的所述關(guān)系圖的相鄰節(jié)點(diǎn)之間有關(guān)注與被關(guān)注的關(guān)系。
[0022]進(jìn)一步地,在所述步驟202中,所述已知僵尸用戶的惡意評(píng)分初始化為1,所述樣本用戶的惡意評(píng)分初始化為O。
[0023]進(jìn)一步地,在所述步驟203中,所述節(jié)點(diǎn)的所述關(guān)聯(lián)性數(shù)值為所述節(jié)點(diǎn)所對(duì)應(yīng)的用戶的粉絲數(shù)量的倒數(shù)。
[0024]進(jìn)一步地,所述步驟203中的所述傳播規(guī)則包括:
[0025]a),當(dāng)計(jì)算一個(gè)用戶的粉絲的惡意評(píng)分時(shí),粉絲的惡意評(píng)分為用戶的惡意評(píng)分乘以用戶的關(guān)聯(lián)性數(shù)值;
[0026]b),當(dāng)一個(gè)用戶關(guān)注多個(gè)用戶時(shí),一個(gè)用戶的惡意評(píng)分是它所關(guān)注的多個(gè)用戶的惡意評(píng)分之和。
[0027]進(jìn)一步地,所述步驟204的所述傳播收斂是指所述樣本用戶的所述惡意評(píng)分達(dá)到穩(wěn)定不再發(fā)生變化。
[0028]由于微博缺乏對(duì)僵尸用戶的檢測(cè)機(jī)制,通過(guò)對(duì)僵尸用戶關(guān)系網(wǎng)絡(luò)的全面分析,所訓(xùn)練出來(lái)的檢測(cè)方法準(zhǔn)確度和回歸度都較高,綜合性能較好。適用于中國(guó)社交網(wǎng)絡(luò)的僵尸用戶判別。由于僵尸用戶大多數(shù)是由系統(tǒng)自動(dòng)生成,所以他們的ID很大程度上是相似的,此外為了避免被檢測(cè)到,僵尸用戶往往會(huì)互相關(guān)注使得看上去與正常用戶沒(méi)有區(qū)別,因此在他們的社交網(wǎng)絡(luò)圖中會(huì)有許多ID相似的用戶聚攏在一塊,所以如果能事先找到一個(gè)僵尸用戶那么就很有可能找到與其相關(guān)的僵尸用戶,大大提升了推理算法的效率。
[0029]以下將結(jié)合附圖對(duì)本發(fā)明的構(gòu)思、具體結(jié)構(gòu)及產(chǎn)生的技術(shù)效果作進(jìn)一步說(shuō)明,以充分地了解本發(fā)明的目的、特征和效果?!緦@綀D】

【附圖說(shuō)明】
[0030]圖1是本發(fā)明的數(shù)據(jù)收集模塊的處理過(guò)程;
[0031]圖2是本發(fā)明的關(guān)系圖分析模塊的處理流程圖。
【具體實(shí)施方式】
[0032]下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例作詳細(xì)說(shuō)明:本實(shí)施例在以本發(fā)明技術(shù)方案前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過(guò)程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
[0033]本發(fā)明的一種基于關(guān)系圖的微博僵尸用戶檢測(cè)方法,分為兩大模塊:數(shù)據(jù)收集模塊和關(guān)系圖分析模塊。
[0034]數(shù)據(jù)收集模塊的處理流程具體如圖1所示。首先,通過(guò)微博的API (ApplicationProgramming Interface,應(yīng)用程序編程接口)101從已知僵尸用戶的賬戶開始,收集已知僵尸用戶的數(shù)據(jù)102,即該僵尸用戶的用戶粉絲和關(guān)注者的用戶名和數(shù)量;然后,收集已知僵尸用戶的用戶粉絲和關(guān)注者的數(shù)據(jù);最后,從已知僵尸用戶的用戶粉絲和關(guān)注者中選擇樣本用戶,并將樣本用戶和已知僵尸用戶數(shù)據(jù)存入關(guān)系數(shù)據(jù)庫(kù)中,其中樣本用戶是隨機(jī)選擇的。在本發(fā)明的較佳實(shí)施例中,為了保證選擇的隨機(jī)性,在已知僵尸用戶的用戶粉絲和關(guān)注者中,選擇其用戶粉絲和關(guān)注者不超過(guò)1000的用戶作為樣本用戶。
[0035]數(shù)據(jù)收集模塊的處理是通過(guò)人工登錄微博來(lái)獲取的用戶信息:每一個(gè)微博用戶都有自己的用戶名,并且根據(jù)用戶名,每個(gè)用戶都有一個(gè)個(gè)人頁(yè)面的鏈接:http://Weib0.com/userid,登錄到該頁(yè)面中,用戶的數(shù)據(jù)(用戶粉絲和關(guān)注者)都能夠一目了然的查到。
[0036]關(guān)系圖分析模塊的處理流程如圖2所示,具體包括以下步驟:
[0037]步驟201,將已知僵尸用戶和樣本用戶的關(guān)系屬性可視化,作出關(guān)系圖:
[0038]將每個(gè)用戶(包括已知僵尸包括已知僵尸用戶和樣本用戶)視作一個(gè)節(jié)點(diǎn),對(duì)于任意兩個(gè)用戶,如果他們之間有關(guān)注與被關(guān)注的關(guān)系,則這兩個(gè)節(jié)點(diǎn)之間由一條有向線段相連,方向由粉絲指向被關(guān)注的用戶。
[0039]步驟202,初始化每個(gè)節(jié)點(diǎn)用戶(包括已知僵尸用戶和樣本用戶)的惡意評(píng)分:設(shè)定已知僵尸用戶的惡意評(píng)分為1,設(shè)定每個(gè)樣本用戶的惡意評(píng)分為O ;
[0040]步驟203,分析關(guān)系圖的共性并得出僵尸用戶的社會(huì)關(guān)系,計(jì)算和更新樣本用戶的惡意評(píng)分:
[0041]I)計(jì)算用戶的關(guān)聯(lián)性數(shù)值:統(tǒng)計(jì)每一個(gè)用戶的粉絲數(shù)量,并將這個(gè)數(shù)量取倒數(shù)即為該用戶與其粉絲之間的關(guān)聯(lián)性數(shù)值;
[0042]2)將該關(guān)聯(lián)性數(shù)值作為該用戶與其相鄰用戶的關(guān)系圖的邊的權(quán)值;
[0043]3)根據(jù)關(guān)聯(lián)性數(shù)值和已知僵尸用戶的惡意評(píng)分按傳播規(guī)則計(jì)算樣本用戶的惡意評(píng)分,其傳播規(guī)則為:a)當(dāng)計(jì)算一個(gè)用戶的粉絲的惡意評(píng)分時(shí),粉絲的惡意評(píng)分是用戶的惡意評(píng)分乘以用戶的關(guān)聯(lián)性數(shù)值;b)當(dāng)一個(gè)用戶關(guān)注多個(gè)用戶時(shí),該用戶的評(píng)分將是該用戶所關(guān)注的所有用戶的惡意評(píng)分之和;
[0044]4)按照關(guān)系圖迭代計(jì)算,更新每個(gè)樣本用戶的惡意評(píng)分。
[0045]步驟204,判斷樣本用戶的惡意評(píng)分是否達(dá)到穩(wěn)定值不再變化,即為傳播收斂:如果傳播收斂,則跳轉(zhuǎn)至步驟205 ;如果沒(méi)有達(dá)到傳播收斂,則跳轉(zhuǎn)至步驟203。[0046]步驟205,對(duì)每個(gè)樣本用戶此時(shí)的惡意評(píng)分值進(jìn)行判斷:如果惡意評(píng)分大于閾值(閾值確定可由啟發(fā)性實(shí)驗(yàn)確定),則跳轉(zhuǎn)如步驟206 ;如果惡意評(píng)分小于閾值,則該用戶被判定為正常用戶。
[0047]步驟206:該樣本用戶被判定為僵尸用戶。
[0048]步驟207:僵尸用戶判定結(jié)束。
[0049]以上詳細(xì)描述了本發(fā)明的較佳具體實(shí)施例。應(yīng)當(dāng)理解,本領(lǐng)域的普通技術(shù)無(wú)需創(chuàng)造性勞動(dòng)就可以根據(jù)本發(fā)明的構(gòu)思作出諸多修改和變化。因此,凡本【技術(shù)領(lǐng)域】中技術(shù)人員依本發(fā)明的構(gòu)思在現(xiàn)有技術(shù)的基礎(chǔ)上通過(guò)邏輯分析、推理或者有限的實(shí)驗(yàn)可以得到的技術(shù)方案,皆應(yīng)在由權(quán)利要求書所確定的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種基于可視關(guān)系網(wǎng)絡(luò)的微博僵尸用戶檢測(cè)方法,其特征在于,包括數(shù)據(jù)收集模塊和關(guān)系圖分析模塊; 所述數(shù)據(jù)收集模塊用于根據(jù)一個(gè)已知僵尸用戶,收集所述已知僵尸用戶的數(shù)據(jù),并挑選出樣本用戶; 所述關(guān)系圖分析模塊用于判斷所述樣本用戶是否是僵尸用戶,具體包括以下步驟:步驟(201),將所述已知僵尸用戶和所述樣本用戶的關(guān)系屬性可視化,作出關(guān)系圖:所述已知僵尸用戶和所述樣本用戶均作為所述關(guān)系圖的節(jié)點(diǎn); 步驟(202),初始化所述已知僵尸用戶和所述樣本用戶的惡意評(píng)分; 步驟(203),分析所述關(guān)系圖的共性,計(jì)算所述關(guān)系圖中各個(gè)所述節(jié)點(diǎn)的關(guān)聯(lián)性數(shù)值,并按照傳播規(guī)則和所述關(guān)系圖計(jì)算和更新所述樣本用戶的惡意評(píng)分; 步驟(204),判斷所述樣本用戶的所述惡意評(píng)分是否傳播收斂,如果傳播收斂,跳入步驟(205);如果不傳播收斂,則跳轉(zhuǎn)入步驟(203); 步驟(205),判斷所述樣本用戶的所述惡意評(píng)分是否大于閾值,如果大于所述閾值,則跳轉(zhuǎn)入步驟(206);如果小于所述閾值,則所述樣本用戶被判定為正常用戶; 步驟(206),所述樣本用戶被判定為僵尸用戶; 步驟(207),處理完畢。
2.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述數(shù)據(jù)收集模塊是通過(guò)微博API收集的所述已知僵尸用戶的數(shù)據(jù)。
3.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述已知僵尸用戶的數(shù)據(jù)包括用戶粉絲和關(guān)注者的名字以及數(shù)量。
4.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述數(shù)據(jù)收集模塊對(duì)所述樣本用戶的選擇是隨機(jī)的。
5.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述數(shù)據(jù)收集模塊選擇的所述樣本用戶的用戶粉絲和關(guān)注者的數(shù)量小于1000。
6.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述步驟(201)的所述關(guān)系圖的相鄰節(jié)點(diǎn)之間有關(guān)注與被關(guān)注的關(guān)系。
7.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,在所述步驟(202)中,所述已知僵尸用戶的惡意評(píng)分初始化為I,所述樣本用戶的惡意評(píng)分初始化為O。
8.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,在所述步驟(203)中,所述節(jié)點(diǎn)的所述關(guān)聯(lián)性數(shù)值為所述節(jié)點(diǎn)所對(duì)應(yīng)的用戶的粉絲數(shù)量的倒數(shù)。
9.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述步驟(203)中所述傳播規(guī)則包括: a),當(dāng)計(jì)算一個(gè)用戶的粉絲的惡意評(píng)分時(shí),粉絲的惡意評(píng)分為用戶的惡意評(píng)分乘以用戶的關(guān)聯(lián)性數(shù)值; b),當(dāng)一個(gè)用戶關(guān)注多個(gè)用戶時(shí),一個(gè)用戶的惡意評(píng)分是它所關(guān)注的多個(gè)用戶的惡意評(píng)分之和。
10.如權(quán)利要求1所述的微博僵尸用戶檢測(cè)方法,其中,所述步驟(204)中所述的傳播收斂是指所述樣本用戶的所述惡意評(píng)分達(dá)到穩(wěn)定不再發(fā)生變化。
【文檔編號(hào)】H04L29/08GK103457799SQ201310396404
【公開日】2013年12月18日 申請(qǐng)日期:2013年9月3日 優(yōu)先權(quán)日:2013年9月3日
【發(fā)明者】鄒福泰, 姚雨石, 吳嘉瑋 申請(qǐng)人:上海交通大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
六盘水市| 大埔区| 武安市| 宁明县| 灌阳县| 略阳县| 洛宁县| 日土县| 清河县| 南溪县| 伊吾县| 台湾省| 桂林市| 铅山县| 广丰县| 犍为县| 保靖县| 鲁甸县| 辉南县| 上蔡县| 冕宁县| 孝义市| 巴中市| 泾阳县| 巴彦淖尔市| 南汇区| 瑞安市| 保德县| 东源县| 驻马店市| 青铜峡市| 边坝县| 肇庆市| 原阳县| 嘉义县| 澄迈县| 合江县| 昌邑市| 翁源县| 巍山| 宜良县|