社交網(wǎng)絡(luò)賬號的識別方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種社交網(wǎng)絡(luò)賬號的識別方法和裝置。其中,社交網(wǎng)絡(luò)賬號的識別方法包括:接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識;按照身份標(biāo)識查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,可信度為預(yù)先計(jì)算得到的用于反映待識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值;如果查詢到待識別的社交網(wǎng)絡(luò)賬號的可信度,則判斷可信度是否超過可信閾值;如果判斷出可信度超過可信閾值,則確定待識別的社交網(wǎng)絡(luò)賬號為第一賬號,第一賬號為真實(shí)用戶使用的賬號;以及如果判斷出可信度未超過可信閾值,則確定待識別的社交網(wǎng)絡(luò)賬號為第二賬號,第二賬號為計(jì)算機(jī)操作的賬號。通過本發(fā)明,達(dá)到了提高識別社交網(wǎng)絡(luò)賬號真實(shí)性的準(zhǔn)確性的效果。
【專利說明】社交網(wǎng)絡(luò)賬號的識別方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及社交網(wǎng)絡(luò)領(lǐng)域,具體而言,涉及一種社交網(wǎng)絡(luò)賬號的識別方法和裝置。
【背景技術(shù)】
[0002] 隨著現(xiàn)代技術(shù)的發(fā)展,計(jì)算機(jī)可以模擬社交網(wǎng)絡(luò)上真實(shí)用戶的一些行為,導(dǎo)致社 交網(wǎng)絡(luò)用戶無法有效的辨別社交網(wǎng)絡(luò)賬號的背后是真實(shí)的用戶還是計(jì)算機(jī)在操作。
[0003] 社交網(wǎng)絡(luò)在人們的生活中扮演著重要的角色,它已成為人們生活的一部分,并對 人們的信息獲得、思考和生活產(chǎn)生不可低估的影響,而有些用戶為了滿足虛榮心,通過一些 計(jì)算機(jī)偽造方式迅速增加社交好友的現(xiàn)象越來越多,這就造成了龐大的無效的社會關(guān)系網(wǎng) 絡(luò)?,F(xiàn)有鑒別賬號背后是否是真實(shí)的用戶的技術(shù)一般是從賬號的注冊時(shí)間、用戶等級、標(biāo)簽 數(shù)、地理位置信息、自我描述信息、鏈接信息、認(rèn)證信息、微博數(shù)、粉絲數(shù)、關(guān)注數(shù)、互粉數(shù)、收 藏?cái)?shù)、交互比例、微博粉絲比例、發(fā)布微博規(guī)律性、發(fā)布微博與轉(zhuǎn)發(fā)微博比例等方面進(jìn)行鑒 另IJ,但是,這些特征通過計(jì)算機(jī)都可以大量的偽造或者復(fù)制,所以羅列的這些指標(biāo)就不再真 實(shí),鑒別到的賬號也就不準(zhǔn)確。
[0004] 目前,對社交網(wǎng)絡(luò)賬號的真實(shí)性進(jìn)行識別方案具有如下缺點(diǎn):
[0005] 1.從賬號的注冊時(shí)間、用戶等級、標(biāo)簽數(shù)、地理位置信息、自我描述信息、鏈接信 息、認(rèn)證信息、微博數(shù)、粉絲數(shù)、關(guān)注數(shù)、互粉數(shù)、收藏?cái)?shù)、交互比例、微博粉絲比例、發(fā)布微博 規(guī)律性、發(fā)布微博與轉(zhuǎn)發(fā)微博比例等指標(biāo),計(jì)算機(jī)可以大量的偽造或者復(fù)制,所以通過以這 些指標(biāo)作為輸入條件的方案識別賬號真實(shí)性的結(jié)果不準(zhǔn)確。
[0006] 2.通過以上指標(biāo)作為輸入條件進(jìn)行識別,必須從網(wǎng)絡(luò)上獲取大量的數(shù)據(jù),計(jì)算量 大,速度慢。
[0007] 針對現(xiàn)有技術(shù)中無法準(zhǔn)確識別社交網(wǎng)絡(luò)賬號的真實(shí)性的問題,目前尚未提出有效 的解決方案。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的主要目的在于提供一種社交網(wǎng)絡(luò)賬號的識別方法和裝置,以解決現(xiàn)有技 術(shù)中無法準(zhǔn)確識別社交網(wǎng)絡(luò)賬號的真實(shí)性的問題。
[0009] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種社交網(wǎng)絡(luò)賬號的識別方 法。根據(jù)本發(fā)明的社交網(wǎng)絡(luò)賬號的識別方法包括:接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識; 按照身份標(biāo)識查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,可信度為預(yù)先計(jì)算得到的用于反映待 識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值;如果查詢到待識別的社交網(wǎng)絡(luò)賬號的可信度,則判斷 可信度是否超過可信閾值;如果判斷出可信度超過可信閾值,則確定待識別的社交網(wǎng)絡(luò)賬 號為第一賬號,第一賬號為真實(shí)用戶使用的賬號;以及如果判斷出可信度未超過可信閾值, 則確定待識別的社交網(wǎng)絡(luò)賬號為第二賬號,第二賬號為計(jì)算機(jī)操作的賬號。
[0010] 進(jìn)一步地,在接收社交網(wǎng)絡(luò)賬號的身份標(biāo)識之前,識別方法還包括:基于社交網(wǎng)絡(luò) 關(guān)系計(jì)算社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度;將計(jì)算得到的每個(gè)社交網(wǎng)絡(luò)賬號的 可信度存儲到數(shù)據(jù)庫中,按照身份標(biāo)識查詢待識別的社交網(wǎng)絡(luò)賬號的可信度包括:按照身 份標(biāo)識從數(shù)據(jù)庫中查詢待識別的社交網(wǎng)絡(luò)賬號的可信度。
[0011] 進(jìn)一步地,基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度包 括:獲取社交網(wǎng)絡(luò)中通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號作為 第一賬號圈中的社交網(wǎng)絡(luò)賬號;獲取通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬 號,將通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號和通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬 號作為第二賬號圈中的社交網(wǎng)絡(luò)賬號;以及計(jì)算第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第二 賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第一數(shù)量,將計(jì)算得到的第一數(shù)量作為社交網(wǎng)絡(luò)關(guān)系中 每個(gè)社交網(wǎng)絡(luò)賬號的第一可信度。
[0012] 進(jìn)一步地,在計(jì)算第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò) 賬號所關(guān)注的數(shù)量之后,識別方法還包括:獲取第三賬號圈中的社交網(wǎng)絡(luò)賬號,其中,第三 賬號圈中的社交網(wǎng)絡(luò)賬號包括第二賬號圈中的社交網(wǎng)絡(luò)賬號和第二賬號圈中的社交網(wǎng)絡(luò) 賬號所關(guān)注的賬號;以及計(jì)算第三賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第三賬號圈中的社交網(wǎng) 絡(luò)賬號所關(guān)注的第二數(shù)量,將計(jì)算得到的第二數(shù)量作為社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號 的第二可信度。
[0013] 進(jìn)一步地,可信閾值包括第一閾值和第二閾值,其中,如果查找到待識別的社交網(wǎng) 絡(luò)賬號的可信度包括第一可信度和第二可信度,判斷可信度是否超過可信閾值包括:判斷 第一可信度是否超過第一閾值;判斷第二可信度是否超過第二閾值,其中,如果判斷出第一 可信度超過第一閾值,或者,判斷出第二可信度超過第二閾值,則確定待識別的社交網(wǎng)絡(luò)賬 號為第一賬號;或者,如果判斷出第一可信度超過第一閾值,并且判斷出第二可信度超過第 二閾值,則確定待識別的社交網(wǎng)絡(luò)賬號為第一賬號。
[0014] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種社交網(wǎng)絡(luò)賬號的識別裝 置。根據(jù)本發(fā)明的社交網(wǎng)絡(luò)賬號的識別裝置包括:接收單元,用于接收待識別的社交網(wǎng)絡(luò)賬 號的身份標(biāo)識;查詢單元,用于按照身份標(biāo)識查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,可信度 為預(yù)先計(jì)算得到的用于反映待識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值;判斷單元,用于當(dāng)查詢 到待識別的社交網(wǎng)絡(luò)賬號的可信度時(shí),判斷可信度是否超過可信閾值;第一確定單元,用于 當(dāng)判斷出可信度超過可信閾值時(shí),確定待識別的社交網(wǎng)絡(luò)賬號為第一賬號,第一賬號為真 實(shí)用戶使用的賬號;以及第二確定單元,用于當(dāng)判斷出可信度未超過可信閾值時(shí),確定待識 別的社交網(wǎng)絡(luò)賬號為第二賬號,第二賬號為計(jì)算機(jī)操作的賬號。
[0015] 進(jìn)一步地,識別裝置還包括:計(jì)算單元,用于在接收社交網(wǎng)絡(luò)賬號的身份標(biāo)識之 前,基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度;存儲單元,用于將 計(jì)算得到的每個(gè)社交網(wǎng)絡(luò)賬號的可信度存儲到數(shù)據(jù)庫中,查詢單元包括:查詢模塊,用于按 照身份標(biāo)識從數(shù)據(jù)庫中查詢待識別的社交網(wǎng)絡(luò)賬號的可信度。
[0016] 進(jìn)一步地,計(jì)算單元包括:第一獲取模塊,用于獲取社交網(wǎng)絡(luò)中通過實(shí)名認(rèn)證的社 交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號作為第一賬號圈中的社交網(wǎng)絡(luò)賬號;第二獲 取模塊,用于獲取通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證 的社交網(wǎng)絡(luò)賬號和通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號作為第二賬號圈 中的社交網(wǎng)絡(luò)賬號;以及第一計(jì)算模塊,用于計(jì)算第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第 二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第一數(shù)量,將計(jì)算得到的第一數(shù)量作為社交網(wǎng)絡(luò)關(guān)系 中每個(gè)社交網(wǎng)絡(luò)賬號的第一可信度。
[0017] 進(jìn)一步地,計(jì)算單元還包括:第三獲取模塊,用于在計(jì)算第二賬號圈中的每個(gè)社交 網(wǎng)絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的數(shù)量之后,獲取第三賬號圈中的社交網(wǎng) 絡(luò)賬號,其中,第三賬號圈中的社交網(wǎng)絡(luò)賬號包括第二賬號圈中的社交網(wǎng)絡(luò)賬號和第二賬 號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的賬號;以及第二計(jì)算模塊,用于計(jì)算第三賬號圈中的每個(gè) 社交網(wǎng)絡(luò)賬號被第三賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第二數(shù)量,將計(jì)算得到的第二數(shù)量 作為社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的第二可信度。
[0018] 進(jìn)一步地,可信閾值包括第一閾值和第二閾值,其中,判斷單元包括:第一判斷模 塊,用于當(dāng)查找到待識別的社交網(wǎng)絡(luò)賬號的可信度包括第一可信度和第二可信度時(shí),判斷 第一可信度是否超過第一閾值;第二判斷模塊,用于判斷第二可信度是否超過第二閾值,其 中,第一確定單元還用于當(dāng)判斷出第一可信度超過第一閾值,或者,判斷出第二可信度超過 第二閾值,確定待識別的社交網(wǎng)絡(luò)賬號為第一賬號;或者,第一確定單元還用于當(dāng)判斷出第 一可信度超過第一閾值,并且判斷出第二可信度超過第二閾值,確定待識別的社交網(wǎng)絡(luò)賬 號為第一賬號。
[0019] 根據(jù)本發(fā)明實(shí)施例,通過接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識,按照身份標(biāo)識 查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,如果判斷出可信度超過可信閾值,則確定待識別的 社交網(wǎng)絡(luò)賬號為第一賬號即真實(shí)用戶使用的賬號,如果判斷出可信度未超過可信閾值,則 確定待識別的社交網(wǎng)絡(luò)賬號為第二賬號即計(jì)算機(jī)操作的賬號,通過可信度來判斷社交網(wǎng)絡(luò) 賬號的真實(shí)性,解決了無法準(zhǔn)確識別社交網(wǎng)絡(luò)賬號的真實(shí)性的問題,達(dá)到了提高識別社交 網(wǎng)絡(luò)賬號真實(shí)性的準(zhǔn)確性的效果。
【專利附圖】
【附圖說明】
[0020] 構(gòu)成本申請的一部分的附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí) 施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0021] 圖1是根據(jù)本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)賬號的識別方法的流程圖;
[0022] 圖2是根據(jù)本發(fā)明實(shí)施例的賬號圈的示意圖;以及
[0023] 圖3是根據(jù)本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)賬號的識別裝置的示意圖。
【具體實(shí)施方式】
[0024] 需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相 互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
[0025] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的 附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是 本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范 圍。
[0026] 需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第 二"等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使 用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例。此外,術(shù)語"包括"和 "具有"以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元 的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有 清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0027] 本發(fā)明實(shí)施例提供了一種社交網(wǎng)絡(luò)賬號的識別方法。
[0028] 圖1是根據(jù)本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)賬號的識別方法的流程圖。如圖1所示,該 社交網(wǎng)絡(luò)賬號的識別方法包括步驟如下:
[0029] 步驟S102,接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識。
[0030] 社交網(wǎng)絡(luò)賬號可以是社會性網(wǎng)絡(luò)服務(wù)(Social Networking Services,簡稱SNS) 所用到的賬號,可以是例如新浪微博、騰訊微博等社交網(wǎng)絡(luò)服務(wù)的賬號。身份標(biāo)識(ID)為 待識別的社交網(wǎng)絡(luò)賬號的唯一標(biāo)識,以便于依據(jù)該身份標(biāo)識查詢該待識別的社交網(wǎng)絡(luò)賬號 的可信度。
[0031] 步驟S104,按照身份標(biāo)識查詢待識別的社交網(wǎng)絡(luò)賬號的可信度。該可信度為預(yù)先 計(jì)算得到的用于反映待識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值。
[0032] 社交網(wǎng)絡(luò)賬號的可信度可以基于社交網(wǎng)絡(luò)關(guān)系計(jì)算得到,該社交網(wǎng)絡(luò)關(guān)系可以是 基于真實(shí)的社交網(wǎng)絡(luò)賬號建立的社交關(guān)系,例如,通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號及其關(guān)注 的賬號,以及其關(guān)注的賬號所關(guān)注的賬號,這樣形成的層層社交關(guān)系?;谏缃痪W(wǎng)絡(luò)關(guān)系 計(jì)算該社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度,并按照每個(gè)社交網(wǎng)絡(luò)賬號的身份標(biāo)識 一一對應(yīng)地存儲計(jì)算得到的可信度,這樣,在識別社交網(wǎng)絡(luò)賬號的真實(shí)性時(shí),可以直接從存 儲的可信度中查詢帶識別的社交網(wǎng)絡(luò)賬號的可信度,以便于通過該可信度判斷待識別的社 交網(wǎng)絡(luò)賬號的真實(shí)性。其中,可信度可以采用PageRank算法、HITS算法等進(jìn)行計(jì)算得到, 也可以通過自定義的算法進(jìn)行計(jì)算得到。
[0033] 由于在社交網(wǎng)絡(luò)中,并非所有的社交網(wǎng)絡(luò)賬號均能夠預(yù)先計(jì)算得到其可信度,因 此查詢待識別的社交網(wǎng)絡(luò)賬號時(shí),如果能夠查到,則對查詢到的可信度進(jìn)行判斷,反之,則 可以認(rèn)為無法識別該社交網(wǎng)絡(luò)賬號的真實(shí)性。
[0034] 步驟S106,如果查詢到待識別的社交網(wǎng)絡(luò)賬號的可信度,則判斷可信度是否超過 可信閾值。
[0035] 可信閾值可以是用于判斷社交網(wǎng)絡(luò)賬號的真實(shí)性的閾值,該閾值可以根據(jù)實(shí)際需 要或者根據(jù)統(tǒng)計(jì)結(jié)果進(jìn)行設(shè)置和調(diào)整。
[0036] 步驟S108,如果判斷出可信度超過可信閾值,則確定待識別的社交網(wǎng)絡(luò)賬號為第 一賬號。該第一賬號為真實(shí)用戶使用的賬號。
[0037] 步驟S110,如果判斷出可信度未超過可信閾值,則確定待識別的社交網(wǎng)絡(luò)賬號為 第二賬號。該第二賬號為計(jì)算機(jī)操作的賬號。
[0038] 第一賬號為真實(shí)用戶使用的一類賬號,該賬號的使用和操作者為真實(shí)的自然人, 第二賬號為通過計(jì)算機(jī)操作的賬號。當(dāng)待識別的社交網(wǎng)絡(luò)賬號的可信度超過可信閾值時(shí), 表明該待識別的社交網(wǎng)絡(luò)賬號為第一賬號即真實(shí)賬號的可能性比較大,則認(rèn)為該待識別的 賬號為第一賬號;反之,則認(rèn)為其為第二賬號即計(jì)算機(jī)操作的賬號。
[0039] 根據(jù)本發(fā)明實(shí)施例,通過接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識,按照身份標(biāo)識 查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,如果判斷出可信度超過可信閾值,則確定待識別的 社交網(wǎng)絡(luò)賬號為第一賬號即真實(shí)用戶使用的賬號,如果判斷出可信度未超過可信閾值,則 確定待識別的社交網(wǎng)絡(luò)賬號為第二賬號即計(jì)算機(jī)操作的賬號,通過可信度來判斷社交網(wǎng)絡(luò) 賬號的真實(shí)性,解決了無法準(zhǔn)確識別社交網(wǎng)絡(luò)賬號的真實(shí)性的問題,達(dá)到了提高識別社交 網(wǎng)絡(luò)賬號真實(shí)性的準(zhǔn)確性的效果。
[0040] 優(yōu)選地,在接收社交網(wǎng)絡(luò)賬號的身份標(biāo)識之前,本發(fā)明實(shí)施例的識別方法還包括: 基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度;將計(jì)算得到的每個(gè)社 交網(wǎng)絡(luò)賬號的可信度存儲到數(shù)據(jù)庫中,按照身份標(biāo)識查詢社交網(wǎng)絡(luò)賬號的可信度包括:按 照身份標(biāo)識從數(shù)據(jù)庫中查詢待識別的社交網(wǎng)絡(luò)賬號的可信度。
[0041] 由于社交網(wǎng)絡(luò)中各賬號之間存在相互關(guān)注或者收聽等社交網(wǎng)絡(luò)關(guān)系,由于一些真 實(shí)的用戶所關(guān)注或者收聽的賬號大都為真實(shí)的賬號,因此,利用社交網(wǎng)絡(luò)關(guān)系可以統(tǒng)計(jì)計(jì) 算每個(gè)賬號關(guān)注或者被關(guān)注的賬號數(shù)量,以此為基礎(chǔ)計(jì)算該社交網(wǎng)絡(luò)關(guān)系中每個(gè)賬號的可 信度。然后將計(jì)算得到的社交網(wǎng)絡(luò)賬號的可信度,按照社交網(wǎng)絡(luò)賬號的身份標(biāo)識形成一一 對應(yīng)的映射關(guān)系,存儲到數(shù)據(jù)庫中。這樣,就可以按照社交網(wǎng)絡(luò)賬號身份標(biāo)識從數(shù)據(jù)庫中查 詢待識別的社交網(wǎng)絡(luò)賬號的可信度。
[0042] 具體地,以社交網(wǎng)絡(luò)的真實(shí)用戶作為基礎(chǔ)集合,以新浪微博這個(gè)社交網(wǎng)絡(luò)平臺的 場景為例,即以加"V"認(rèn)證的企業(yè)賬號和個(gè)人賬號為基礎(chǔ)集合,這些賬號都有嚴(yán)格的實(shí)名認(rèn) 證體系,即新浪微博認(rèn)可這些用戶賬號的真實(shí)性,且假設(shè)這些用戶關(guān)注的賬號背后也是真 實(shí)用戶。通過這些真實(shí)用戶的社交網(wǎng)絡(luò)關(guān)系開始一層層向外擴(kuò)散,有效排除了計(jì)算機(jī)偽造 數(shù)據(jù)的風(fēng)險(xiǎn),用固定的方法計(jì)算可信度來達(dá)到判斷賬號是否真實(shí)的目的。從真實(shí)用戶開始 開展社交網(wǎng)絡(luò)關(guān)系,并層層遞推獲得所需要的關(guān)注網(wǎng)絡(luò)關(guān)系結(jié)構(gòu),并不局限于新浪微博平 臺的加"V"用戶,可以用其他有權(quán)威的真實(shí)的用戶來替代,譬如新浪的名人堂用戶。
[0043] 根據(jù)本發(fā)明實(shí)施例,基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)賬號的可信度,可以進(jìn)一步 地提高識別社交網(wǎng)絡(luò)賬號真實(shí)性的準(zhǔn)確性。
[0044] 另外,將計(jì)算得到的社交網(wǎng)絡(luò)賬號的可信度存入數(shù)據(jù)庫中,在識別賬號真實(shí)性時(shí), 只需要傳入賬號ID,數(shù)據(jù)庫即可返回其可信度,無須再從互聯(lián)網(wǎng)上獲取大量數(shù)據(jù),判斷時(shí)計(jì) 算量小,速度快。
[0045] 優(yōu)選地,基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度包 括:
[0046] 獲取社交網(wǎng)絡(luò)中通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號 作為第一賬號圈中的社交網(wǎng)絡(luò)賬號。
[0047] 通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號可以是例如新浪微博中的加"V"賬號,將這些賬號 作為基礎(chǔ)集合即第一賬號圈。由于實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號通常為有效用戶,可以基于這 些賬號來計(jì)算其他社交網(wǎng)絡(luò)賬號的可信度。
[0048] 獲取通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社 交網(wǎng)絡(luò)賬號和通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號作為第二賬號圈中的 社交網(wǎng)絡(luò)賬號。
[0049] 實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號通過社交網(wǎng)絡(luò)關(guān)注一些賬號,這些賬號可以是通過實(shí)名 認(rèn)證的社交網(wǎng)絡(luò)賬號,也可以是未進(jìn)行認(rèn)證的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò) 賬號及其所關(guān)注的社交網(wǎng)絡(luò)賬號作為第二賬號圈中的賬號。
[0050] 計(jì)算第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注 的第一數(shù)量,將計(jì)算得到的第一數(shù)量作為社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的第一可信 度。
[0051] 在獲取到這些賬號之后,即可得到每個(gè)賬號所關(guān)注的賬號或者被關(guān)注的賬號,計(jì) 算第二賬號圈中每個(gè)社交網(wǎng)絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第一數(shù)量,即 計(jì)算第二賬號圈中的賬號被該圈中其他賬號關(guān)注的數(shù)量,例如,第二賬號圈中包含有10個(gè) 賬號,其中,賬號A被該圈中的8個(gè)賬號關(guān)注,則賬號A的可信度記為8。
[0052] 需要說明的是,本發(fā)明實(shí)施例中,對第二賬戶圈中的賬號進(jìn)行計(jì)算時(shí),可以是僅計(jì) 算通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號之外的其他賬號的可信度,通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號 可以直接標(biāo)記為真實(shí)賬號,存儲在數(shù)據(jù)庫中,在從數(shù)據(jù)庫查找這些賬號時(shí),可以直接輸出結(jié) 果。
[0053] 優(yōu)選地,在計(jì)算第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò)賬 號所關(guān)注的數(shù)量之后,識別方法還包括:獲取第三賬號圈中的社交網(wǎng)絡(luò)賬號,其中,第三賬 號圈中的社交網(wǎng)絡(luò)賬號包括第二賬號圈中的社交網(wǎng)絡(luò)賬號和第二賬號圈中的社交網(wǎng)絡(luò)賬 號所關(guān)注的賬號;以及計(jì)算第三賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第三賬號圈中的社交網(wǎng)絡(luò) 賬號所關(guān)注的第二數(shù)量,將計(jì)算得到的第二數(shù)量作為社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的 第二可信度。
[0054] 第三賬號圈中的社交網(wǎng)絡(luò)賬號包括第二賬號圈中的社交網(wǎng)絡(luò)賬號和第二賬號圈 中的社交網(wǎng)絡(luò)賬號所關(guān)注的賬號,具體地,第三賬號圈中的社交網(wǎng)絡(luò)賬號可以包括第二賬 號圈中所有的社交網(wǎng)絡(luò)賬號和這些賬號所關(guān)注的除第二賬號圈中之外的社交網(wǎng)絡(luò)賬號,然 后按照與第二賬號圈中相類似的計(jì)算方式計(jì)算第三賬號圈中的社交網(wǎng)絡(luò)賬號的可信度。
[0055] 由此可以看出,由于第三賬號圈中包括第二賬號圈的賬號,因此,對于第二賬號圈 中的社交網(wǎng)絡(luò)賬號,可能存在兩個(gè)可信度,即第一可信度和第二可信度,因此,在判斷該社 交網(wǎng)絡(luò)賬號的真實(shí)性時(shí),可以對這兩個(gè)可信度分別進(jìn)行判斷,或者綜合進(jìn)行判斷。
[0056] 需要說明的是,本發(fā)明實(shí)施例中,可以按照上述計(jì)算方式依次計(jì)算第四賬號圈、第 五賬號圈、……、第N賬號圈中的社交網(wǎng)絡(luò)賬號的可信度,其計(jì)算原理均相同,這里不做贅 述。
[0057] 根據(jù)本發(fā)明實(shí)施例,通過將計(jì)算到的社交網(wǎng)絡(luò)賬號被相同圈內(nèi)賬號所關(guān)注的數(shù)量 作為可信度,依次來判斷社交網(wǎng)絡(luò)賬號的真實(shí)性,可以進(jìn)一步提高識別社交網(wǎng)絡(luò)真實(shí)性的 準(zhǔn)確性。
[0058] 優(yōu)選地,可信閾值包括第一閾值和第二閾值,其中,如果查找到所述待識別的社交 網(wǎng)絡(luò)賬號的可信度包括所述第一可信度和所述第二可信度,則判斷可信度是否超過可信閾 值,包括:判斷第一可信度是否超過第一閾值;判斷第二可信度是否超過第二閾值,其中, 如果判斷出第一可信度超過第一閾值,或者,判斷出第二可信度超過第二閾值,則確定待識 別的社交網(wǎng)絡(luò)賬號為第一賬號;或者,如果判斷出第一可信度超過第一閾值,并且判斷出第 二可信度超過第二閾值,則確定待識別的社交網(wǎng)絡(luò)賬號為第一賬號。
[0059] 當(dāng)查找到同一社交網(wǎng)絡(luò)賬號的可信度包括兩個(gè)時(shí),可以分別判斷每個(gè)可信度是否 超出相應(yīng)的閾值,只要有一個(gè)超出閾值,則可以認(rèn)為該賬號為真實(shí)賬號;或者,在進(jìn)行判斷 識別時(shí),只有滿足兩個(gè)可信度均符合要求時(shí),才認(rèn)為該賬號為真實(shí)賬號。
[0060] 相應(yīng)地,由于賬號圈可以是多個(gè),因此,當(dāng)查詢到的可信度為多個(gè)時(shí),如果這些可 信度中,一個(gè)或者多個(gè)滿足條件時(shí),可以認(rèn)為該賬號為真實(shí)賬號。
[0061] 下面以新浪微博為例,結(jié)合圖2對本發(fā)明實(shí)施例進(jìn)行詳細(xì)描述;
[0062] 1、從網(wǎng)頁上獲取所有加"V"的賬號0(視為有效用戶),作為基礎(chǔ)集合VF0,即圖2 中第一賬號圈(一)內(nèi)的節(jié)點(diǎn)。
[0063] 2、獲取基礎(chǔ)集合VR)中賬號的關(guān)注賬號1,基礎(chǔ)集合VR)及其關(guān)注賬號的集合統(tǒng)稱 為集合VF1,即圖2中第二賬號圈(二)內(nèi)的節(jié)點(diǎn)。
[0064] 3、再次獲取集合VF1中賬號的關(guān)注賬號2,此時(shí)集合VF1及其關(guān)注賬號的集合統(tǒng)稱 為集合VF2,即圖2中第三賬號圈(三)內(nèi)的節(jié)點(diǎn)。
[0065] 4、通過VF分值的方法來計(jì)算集合VF1中賬號的分值IV0,集合VF2中賬號的分值 IV1。VF分值指圈內(nèi)某一賬號被同一圈子中其他賬號所關(guān)注的數(shù)量。計(jì)算分值的方法不依 賴于VF方法,可以使用PageRank、HITS算法。
[0066] 5、依次類推,系統(tǒng)定期自動(dòng)以圈內(nèi)的賬號作為輸入進(jìn)行迭代獲取關(guān)注賬號,進(jìn)而 將社交網(wǎng)絡(luò)進(jìn)行擴(kuò)展,即從加"V"的賬號擴(kuò)展出的第一層VF1至第N層VFN,出現(xiàn)N組VF 分值。我們假設(shè)通過加"V"用戶擴(kuò)展兩層即滿足需求,即擴(kuò)展到了 VF2集合,同時(shí)也就對于 VF2集合中所有用戶計(jì)算出了兩個(gè)分值IV0和IV1。
[0067] 6、將分值IV0和IV1存入數(shù)據(jù)庫中。
[0068] 7、通過傳入賬號ID,系統(tǒng)返回一組分值,和設(shè)定的分?jǐn)?shù)閥值進(jìn)行比較,鑒別賬號背 后是否是有效用戶。設(shè)定以下條件滿足全部或者滿足其中幾項(xiàng)即可視為有效用戶:
[0069] IV0>nl,(nl為設(shè)定的分?jǐn)?shù)閾值);
[0070] IVl>n2,(n2為設(shè)定的分?jǐn)?shù)閾值);
[0071] ......
[0072] 本發(fā)明實(shí)施例還提供了一種社交網(wǎng)絡(luò)賬號的識別裝置。該裝置可以通過社交網(wǎng)絡(luò) 賬號的識別實(shí)現(xiàn)其功能。需要說明的是,本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)賬號的識別裝置可以用 于執(zhí)行本發(fā)明實(shí)施例所提供的社交網(wǎng)絡(luò)賬號的識別方法,本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)賬號的 識別方法也可以通過本發(fā)明實(shí)施例所提供的社交網(wǎng)絡(luò)賬號的識別裝置來執(zhí)行。
[0073] 圖3是根據(jù)本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)賬號的識別裝置的示意圖。如圖3所示,該 社交網(wǎng)絡(luò)賬號的識別裝置包括:接收單元10、查詢單元20、判斷單元30、第一確定單元40 和第二確定單元50。
[0074] 接收單元10用于接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識。
[0075] 社交網(wǎng)絡(luò)賬號可以是社會性網(wǎng)絡(luò)服務(wù)(Social Networking Services,簡稱SNS) 所用到的賬號,可以是例如新浪微博、騰訊微博等社交網(wǎng)絡(luò)服務(wù)的賬號。身份標(biāo)識(ID)為 待識別的社交網(wǎng)絡(luò)賬號的唯一標(biāo)識,以便于依據(jù)該身份標(biāo)識查詢該待識別的社交網(wǎng)絡(luò)賬號 的可信度。
[0076] 查詢單元20用于按照身份標(biāo)識查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,可信度為 預(yù)先計(jì)算得到的用于反映待識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值。
[0077] 社交網(wǎng)絡(luò)賬號的可信度可以基于社交網(wǎng)絡(luò)關(guān)系計(jì)算得到,該社交網(wǎng)絡(luò)關(guān)系可以是 基于真實(shí)的社交網(wǎng)絡(luò)賬號建立的社交關(guān)系,例如,通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號及其關(guān)注 的賬號,以及其關(guān)注的賬號所關(guān)注的賬號,這樣形成的層層社交關(guān)系?;谏缃痪W(wǎng)絡(luò)關(guān)系 計(jì)算該社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度,并按照每個(gè)社交網(wǎng)絡(luò)賬號的身份標(biāo)識 一一對應(yīng)地存儲計(jì)算得到的可信度,這樣,在識別社交網(wǎng)絡(luò)賬號的真實(shí)性時(shí),可以直接從存 儲的可信度中查詢帶識別的社交網(wǎng)絡(luò)賬號的可信度,以便于通過該可信度判斷待識別的社 交網(wǎng)絡(luò)賬號的真實(shí)性。其中,可信度可以采用PageRank算法、HITS算法等進(jìn)行計(jì)算得到, 也可以通過自定義的算法進(jìn)行計(jì)算得到。
[0078] 由于在社交網(wǎng)絡(luò)中,并非所有的社交網(wǎng)絡(luò)賬號均能夠預(yù)先計(jì)算得到其可信度,因 此查詢待識別的社交網(wǎng)絡(luò)賬號時(shí),如果能夠查到,則對查詢到的可信度進(jìn)行判斷,反之,則 可以認(rèn)為無法識別該社交網(wǎng)絡(luò)賬號的真實(shí)性。
[0079] 判斷單元30用于當(dāng)查詢到待識別的社交網(wǎng)絡(luò)賬號的可信度時(shí),判斷可信度是否 超過可信閾值。
[0080] 可信閾值可以是用于判斷社交網(wǎng)絡(luò)賬號的真實(shí)性的閾值,該閾值可以根據(jù)實(shí)際需 要或者根據(jù)統(tǒng)計(jì)結(jié)果進(jìn)行設(shè)置和調(diào)整。
[0081] 第一確定單元40用于當(dāng)判斷出可信度超過可信閾值時(shí),確定待識別的社交網(wǎng)絡(luò) 賬號為第一賬號,第一賬號為真實(shí)用戶使用的賬號。
[0082] 第二確定單元50用于當(dāng)判斷出可信度未超過可信閾值時(shí),確定待識別的社交網(wǎng) 絡(luò)賬號為第二賬號,第二賬號為計(jì)算機(jī)操作的賬號。
[0083] 第一賬號為真實(shí)用戶使用的一類賬號,該賬號的使用和操作者為真實(shí)的自然人, 第二賬號為通過計(jì)算機(jī)操作的賬號。當(dāng)待識別的社交網(wǎng)絡(luò)賬號的可信度超過可信閾值時(shí), 表明該待識別的社交網(wǎng)絡(luò)賬號為第一賬號即真實(shí)賬號的可能性比較大,則認(rèn)為該待識別的 賬號為第一賬號;反之,則認(rèn)為其為第二賬號即計(jì)算機(jī)操作的賬號。
[0084] 根據(jù)本發(fā)明實(shí)施例,通過接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識,按照身份標(biāo)識 查詢待識別的社交網(wǎng)絡(luò)賬號的可信度,如果判斷出可信度超過可信閾值,則確定待識別的 社交網(wǎng)絡(luò)賬號為第一賬號即真實(shí)用戶使用的賬號,如果判斷出可信度未超過可信閾值,則 確定待識別的社交網(wǎng)絡(luò)賬號為第二賬號即計(jì)算機(jī)操作的賬號,通過可信度來判斷社交網(wǎng)絡(luò) 賬號的真實(shí)性,解決了無法準(zhǔn)確識別社交網(wǎng)絡(luò)賬號的真實(shí)性的問題,達(dá)到了提高識別社交 網(wǎng)絡(luò)賬號真實(shí)性的準(zhǔn)確性的效果。
[0085] 優(yōu)選地,識別裝置還包括:計(jì)算單元,用于在接收社交網(wǎng)絡(luò)賬號的身份標(biāo)識之前, 基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度;存儲單元,用于將計(jì) 算得到的每個(gè)社交網(wǎng)絡(luò)賬號的可信度存儲到數(shù)據(jù)庫中,查詢單元包括:查詢模塊,用于按照 身份標(biāo)識從數(shù)據(jù)庫中查詢待識別的社交網(wǎng)絡(luò)賬號的可信度。
[0086] 由于社交網(wǎng)絡(luò)中各賬號之間存在相互關(guān)注或者收聽等社交網(wǎng)絡(luò)關(guān)系,由于一些真 實(shí)的用戶所關(guān)注或者收聽的賬號大都為真實(shí)的賬號,因此,利用社交網(wǎng)絡(luò)關(guān)系可以統(tǒng)計(jì)計(jì) 算每個(gè)賬號關(guān)注或者被關(guān)注的賬號數(shù)量,以此為基礎(chǔ)計(jì)算該社交網(wǎng)絡(luò)關(guān)系中每個(gè)賬號的可 信度。然后將計(jì)算得到的社交網(wǎng)絡(luò)賬號的可信度,按照社交網(wǎng)絡(luò)賬號的身份標(biāo)識形成一一 對應(yīng)的映射關(guān)系,存儲到數(shù)據(jù)庫中。這樣,就可以按照社交網(wǎng)絡(luò)賬號身份標(biāo)識從數(shù)據(jù)庫中查 詢待識別的社交網(wǎng)絡(luò)賬號的可信度。
[0087] 具體地,以社交網(wǎng)絡(luò)的真實(shí)用戶作為基礎(chǔ)集合,以新浪微博這個(gè)社交網(wǎng)絡(luò)平臺的 場景為例,即以加"V"認(rèn)證的企業(yè)賬號和個(gè)人賬號為基礎(chǔ)集合,這些賬號都有嚴(yán)格的實(shí)名認(rèn) 證體系,即新浪微博認(rèn)可這些用戶賬號的真實(shí)性,且假設(shè)這些用戶關(guān)注的賬號背后也是真 實(shí)用戶。通過這些真實(shí)用戶的社交網(wǎng)絡(luò)關(guān)系開始一層層向外擴(kuò)散,有效排除了計(jì)算機(jī)偽造 數(shù)據(jù)的風(fēng)險(xiǎn),用固定的方法計(jì)算可信度來達(dá)到判斷賬號是否真實(shí)的目的。
[0088] 根據(jù)本發(fā)明實(shí)施例,基于社交網(wǎng)絡(luò)關(guān)系計(jì)算社交網(wǎng)絡(luò)賬號的可信度,可以進(jìn)一步 地提高識別社交網(wǎng)絡(luò)賬號真實(shí)性的準(zhǔn)確性。
[0089] 另外,將計(jì)算得到的社交網(wǎng)絡(luò)賬號的可信度存入數(shù)據(jù)庫中,在識別賬號真實(shí)性時(shí), 只需要傳入賬號ID,數(shù)據(jù)庫即可返回其可信度,無須再從互聯(lián)網(wǎng)上獲取大量數(shù)據(jù),判斷時(shí)計(jì) 算量小,速度快。
[0090] 優(yōu)選地,計(jì)算單元包括:第一獲取模塊,用于獲取社交網(wǎng)絡(luò)中通過實(shí)名認(rèn)證的社交 網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號作為第一賬號圈中的社交網(wǎng)絡(luò)賬號;第二獲取 模塊,用于獲取通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的 社交網(wǎng)絡(luò)賬號和通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號作為第二賬號圈中 的社交網(wǎng)絡(luò)賬號;以及第一計(jì)算模塊,用于計(jì)算第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被第二 賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第一數(shù)量,將計(jì)算得到的第一數(shù)量作為社交網(wǎng)絡(luò)關(guān)系中 每個(gè)社交網(wǎng)絡(luò)賬號的第一可信度。
[0091] 通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號可以是例如新浪微博中的加"V"賬號,將這些賬號 作為基礎(chǔ)集合即第一賬號圈。由于實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號通常為有效用戶,可以基于這 些賬號來計(jì)算其他社交網(wǎng)絡(luò)賬號的可信度。
[0092] 通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號通過社交網(wǎng)絡(luò)關(guān)注一些賬號,這些賬號可以是通過 實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號,也可以是為進(jìn)行認(rèn)證的社交網(wǎng)絡(luò)賬號,將通過實(shí)名認(rèn)證的社交 網(wǎng)絡(luò)賬號及其所關(guān)注的社交網(wǎng)絡(luò)賬號作為第二賬號圈中的賬號。
[0093] 在獲取到這些賬號之后,即可得到每個(gè)賬號所關(guān)注的賬號或者被關(guān)注的賬號,計(jì) 算第二賬號圈中每個(gè)社交網(wǎng)絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第一數(shù)量,即 計(jì)算第二賬號圈中的賬號被該圈中其他賬號關(guān)注的數(shù)量,例如,第二賬號圈中包含有10個(gè) 賬號,其中,賬號A被該圈中的8個(gè)賬號關(guān)注,則賬號A的可信度記為8。
[0094] 需要說明的是,本發(fā)明實(shí)施例中,對第二賬戶圈中的賬號進(jìn)行計(jì)算時(shí),可以是僅計(jì) 算通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號之外的其他賬號的可信度,通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號 可以直接標(biāo)記為真實(shí)賬號,存儲在數(shù)據(jù)庫中,在從數(shù)據(jù)庫查找這些賬號時(shí),可以直接輸出結(jié) 果。
[0095] 優(yōu)選地,計(jì)算單元還包括:第三獲取模塊,用于在計(jì)算第二賬號圈中的每個(gè)社交網(wǎng) 絡(luò)賬號被第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的數(shù)量之后,獲取第三賬號圈中的社交網(wǎng)絡(luò) 賬號,其中,第三賬號圈中的社交網(wǎng)絡(luò)賬號包括第二賬號圈中的社交網(wǎng)絡(luò)賬號和第二賬號 圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的賬號;以及第二計(jì)算模塊,用于計(jì)算第三賬號圈中的每個(gè)社 交網(wǎng)絡(luò)賬號被第三賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的第二數(shù)量,將計(jì)算得到的第二數(shù)量作 為社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的第二可信度。
[0096] 第三賬號圈中的社交網(wǎng)絡(luò)賬號包括第二賬號圈中的社交網(wǎng)絡(luò)賬號和第二賬號圈 中的社交網(wǎng)絡(luò)賬號所關(guān)注的賬號,具體地,第三賬號圈中的社交網(wǎng)絡(luò)賬號可以包括第二賬 號圈中所有的社交網(wǎng)絡(luò)賬號和這些賬號所關(guān)注的除第二賬號圈中之外的社交網(wǎng)絡(luò)賬號,然 后按照與第二賬號圈中相類似的計(jì)算方式計(jì)算第三賬號圈中的社交網(wǎng)絡(luò)賬號的可信度。
[0097] 由此可以看出,由于第三賬號圈中包括第二賬號圈的賬號,因此,對于第二賬號圈 中的社交網(wǎng)絡(luò)賬號,可能存在兩個(gè)可信度,即第一可信度和第二可信度,因此,在判斷該社 交網(wǎng)絡(luò)賬號的真實(shí)性時(shí),可以對這兩個(gè)可信度分別進(jìn)行判斷,或者綜合進(jìn)行判斷。
[0098] 需要說明的是,本發(fā)明實(shí)施例中,可以按照上述計(jì)算方式依次計(jì)算第四賬號圈、第 五賬號圈、……、第N賬號圈中的社交網(wǎng)絡(luò)賬號的可信度,其計(jì)算原理均相同,這里不做贅 述。
[0099] 根據(jù)本發(fā)明實(shí)施例,通過將計(jì)算到的社交網(wǎng)絡(luò)賬號被相同圈內(nèi)賬號所關(guān)注的數(shù)量 作為可信度,依次來判斷社交網(wǎng)絡(luò)賬號的真實(shí)性,可以進(jìn)一步提高識別社交網(wǎng)絡(luò)真實(shí)性的 準(zhǔn)確性。
[0100] 優(yōu)選地,可信閾值包括第一閾值和第二閾值,其中,判斷單元包括:第一判斷模塊, 用于當(dāng)查找到待識別的社交網(wǎng)絡(luò)賬號的可信度包括第一可信度和第二可信度時(shí),判斷第一 可信度是否超過第一閾值;第二判斷模塊,用于判斷第二可信度是否超過第二閾值,其中, 第一確定單元還用于當(dāng)判斷出第一可信度超過第一閾值,或者,判斷出第二可信度超過第 二閾值,確定待識別的社交網(wǎng)絡(luò)賬號為第一賬號;或者,第一確定單元還用于當(dāng)判斷出第一 可信度超過第一閾值,并且判斷出第二可信度超過第二閾值,確定待識別的社交網(wǎng)絡(luò)賬號 為第一賬號。
[0101] 當(dāng)查找到同一社交網(wǎng)絡(luò)賬號的可信度包括兩個(gè)時(shí),可以分別判斷每個(gè)可信度是否 超出相應(yīng)的閾值,只要有一個(gè)超出閾值,則可以認(rèn)為該賬號為真實(shí)賬號;或者,在進(jìn)行判斷 識別時(shí),只有滿足兩個(gè)可信度均符合要求時(shí),才認(rèn)為該賬號為真實(shí)賬號。
[0102] 相應(yīng)地,由于賬號圈可以是多個(gè),因此,當(dāng)查詢到的可信度為多個(gè)時(shí),如果這些可 信度中,一個(gè)或者多個(gè)滿足條件時(shí),可以認(rèn)為該賬號為真實(shí)賬號。
[0103] 本發(fā)明實(shí)施例能夠達(dá)到如下效果:
[0104] 通過此發(fā)明實(shí)施例計(jì)算出來的可信度存入數(shù)據(jù)庫中,只需要傳入賬號ID,數(shù)據(jù)庫 即可返回可信度,無須再從互聯(lián)網(wǎng)上獲取大量數(shù)據(jù),判斷時(shí)計(jì)算量小,速度快。
[0105] 計(jì)算可信度時(shí)不僅可以使用PageRank、HITS等成熟的算法,而且創(chuàng)新VF分值方 法,這樣做可以綜合各種算法優(yōu)點(diǎn)來鑒別用戶,而且即使將來有更好的算法也可以使用。
[0106] 系統(tǒng)應(yīng)用算法來計(jì)算用戶可信度時(shí),只依賴社交網(wǎng)絡(luò)關(guān)系,相比于現(xiàn)有技術(shù)應(yīng)用 的微博數(shù)、粉絲數(shù)不那么頻繁。
[0107] 本發(fā)明實(shí)施例涉及到的用戶由于是從加"V"用戶的關(guān)注用戶開始層層向外擴(kuò)展, 保證了用戶的真實(shí)性。
[0108] 需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列 的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)?依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明 所必須的。
[0109] 在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部 分,可以參見其他實(shí)施例的相關(guān)描述。
[0110] 在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置,可通過其它的方式 實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種 邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可 以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間 的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接, 可以是電性或其它的形式。
[0111] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè) 網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目 的。
[0112] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以 是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單 元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
[0113] 所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用 時(shí),可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì) 上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形 式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個(gè)存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算 機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、移動(dòng)終端、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所 述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM, Random Access Memory)、移動(dòng)硬盤、磁碟或者光盤等各種 可以存儲程序代碼的介質(zhì)。
[0114] 以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技 術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修 改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1. 一種社交網(wǎng)絡(luò)賬號的識別方法,其特征在于,包括: 接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識; 按照所述身份標(biāo)識查詢所述待識別的社交網(wǎng)絡(luò)賬號的可信度,所述可信度為預(yù)先計(jì)算 得到的用于反映所述待識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值; 如果查詢到所述待識別的社交網(wǎng)絡(luò)賬號的可信度,則判斷所述可信度是否超過可信閾 值; 如果判斷出所述可信度超過所述可信閾值,則確定所述待識別的社交網(wǎng)絡(luò)賬號為第一 賬號,所述第一賬號為真實(shí)用戶使用的賬號;以及 如果判斷出所述可信度未超過所述可信閾值,則確定所述待識別的社交網(wǎng)絡(luò)賬號為第 二賬號,所述第二賬號為計(jì)算機(jī)操作的賬號。
2. 根據(jù)權(quán)利要求1所述的識別方法,其特征在于, 在接收社交網(wǎng)絡(luò)賬號的身份標(biāo)識之前,所述識別方法還包括:基于社交網(wǎng)絡(luò)關(guān)系計(jì)算 所述社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度;將計(jì)算得到的所述每個(gè)社交網(wǎng)絡(luò)賬號的 可信度存儲到數(shù)據(jù)庫中, 按照所述身份標(biāo)識查詢所述待識別的社交網(wǎng)絡(luò)賬號的可信度包括:按照所述身份標(biāo)識 從所述數(shù)據(jù)庫中查詢所述待識別的社交網(wǎng)絡(luò)賬號的可信度。
3. 根據(jù)權(quán)利要求2所述的識別方法,其特征在于,基于社交網(wǎng)絡(luò)關(guān)系計(jì)算所述社交網(wǎng) 絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度包括: 獲取社交網(wǎng)絡(luò)中通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號,將所述通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號 作為第一賬號圈中的社交網(wǎng)絡(luò)賬號; 獲取所述通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號,將所述通過實(shí)名認(rèn)證 的社交網(wǎng)絡(luò)賬號和所述通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號作為第二賬 號圈中的社交網(wǎng)絡(luò)賬號;以及 計(jì)算所述第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被所述第二賬號圈中的社交網(wǎng)絡(luò)賬號所 關(guān)注的第一數(shù)量,將計(jì)算得到的第一數(shù)量作為所述社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的第 一可信度。
4. 根據(jù)權(quán)利要求3所述的識別方法,其特征在于,在計(jì)算所述第二賬號圈中的每個(gè)社 交網(wǎng)絡(luò)賬號被所述第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的數(shù)量之后,所述識別方法還包 括: 獲取第三賬號圈中的社交網(wǎng)絡(luò)賬號,其中,所述第三賬號圈中的社交網(wǎng)絡(luò)賬號包括所 述第二賬號圈中的社交網(wǎng)絡(luò)賬號和所述第二賬號圈中的社交網(wǎng)絡(luò)賬號所關(guān)注的賬號;以及 計(jì)算所述第三賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被所述第三賬號圈中的社交網(wǎng)絡(luò)賬號所 關(guān)注的第二數(shù)量,將計(jì)算得到的第二數(shù)量作為所述社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的第 二可信度。
5. 根據(jù)權(quán)利要求4所述的識別方法,其特征在于,所述可信閾值包括第一閾值和第二 閾值,其中,如果查找到所述待識別的社交網(wǎng)絡(luò)賬號的可信度包括所述第一可信度和所述 第二可信度, 判斷所述可信度是否超過可信閾值包括:判斷所述第一可信度是否超過所述第一閾 值;判斷所述第二可信度是否超過所述第二閾值, 其中,如果判斷出所述第一可信度超過所述第一閾值,或者,判斷出所述第二可信度超 過所述第二閾值,則確定所述待識別的社交網(wǎng)絡(luò)賬號為所述第一賬號;或者,如果判斷出所 述第一可信度超過所述第一閾值,并且判斷出所述第二可信度超過所述第二閾值,則確定 所述待識別的社交網(wǎng)絡(luò)賬號為所述第一賬號。
6. -種社交網(wǎng)絡(luò)賬號的識別裝置,其特征在于,包括: 接收單元,用于接收待識別的社交網(wǎng)絡(luò)賬號的身份標(biāo)識; 查詢單元,用于按照所述身份標(biāo)識查詢所述待識別的社交網(wǎng)絡(luò)賬號的可信度,所述可 信度為預(yù)先計(jì)算得到的用于反映所述待識別的社交網(wǎng)絡(luò)賬號真實(shí)性的數(shù)值; 判斷單元,用于當(dāng)查詢到所述待識別的社交網(wǎng)絡(luò)賬號的可信度時(shí),判斷所述可信度是 否超過可信閾值; 第一確定單元,用于當(dāng)判斷出所述可信度超過所述可信閾值時(shí),確定所述待識別的社 交網(wǎng)絡(luò)賬號為第一賬號,所述第一賬號為真實(shí)用戶使用的賬號;以及 第二確定單元,用于當(dāng)判斷出所述可信度未超過所述可信閾值時(shí),確定所述待識別的 社交網(wǎng)絡(luò)賬號為第二賬號,所述第二賬號為計(jì)算機(jī)操作的賬號。
7. 根據(jù)權(quán)利要求6所述的識別裝置,其特征在于, 所述識別裝置還包括:計(jì)算單元,用于在接收社交網(wǎng)絡(luò)賬號的身份標(biāo)識之前,基于社交 網(wǎng)絡(luò)關(guān)系計(jì)算所述社交網(wǎng)絡(luò)關(guān)系中每個(gè)社交網(wǎng)絡(luò)賬號的可信度;存儲單元,用于將計(jì)算得 到的所述每個(gè)社交網(wǎng)絡(luò)賬號的可信度存儲到數(shù)據(jù)庫中, 所述查詢單元包括:查詢模塊,用于按照所述身份標(biāo)識從所述數(shù)據(jù)庫中查詢所述待識 別的社交網(wǎng)絡(luò)賬號的可信度。
8. 根據(jù)權(quán)利要求7所述的識別裝置,其特征在于,所述計(jì)算單元包括: 第一獲取模塊,用于獲取社交網(wǎng)絡(luò)中通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號,將所述通過實(shí)名 認(rèn)證的社交網(wǎng)絡(luò)賬號作為第一賬號圈中的社交網(wǎng)絡(luò)賬號; 第二獲取模塊,用于獲取所述通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交網(wǎng)絡(luò)賬號, 將所述通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號和所述通過實(shí)名認(rèn)證的社交網(wǎng)絡(luò)賬號所關(guān)注的社交 網(wǎng)絡(luò)賬號作為第二賬號圈中的社交網(wǎng)絡(luò)賬號;以及 第一計(jì)算模塊,用于計(jì)算所述第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被所述第二賬號圈中 的社交網(wǎng)絡(luò)賬號所關(guān)注的第一數(shù)量,將計(jì)算得到的第一數(shù)量作為所述社交網(wǎng)絡(luò)關(guān)系中每個(gè) 社交網(wǎng)絡(luò)賬號的第一可信度。
9. 根據(jù)權(quán)利要求8所述的識別裝置,其特征在于,所述計(jì)算單元還包括: 第三獲取模塊,用于在計(jì)算所述第二賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被所述第二賬號圈 中的社交網(wǎng)絡(luò)賬號所關(guān)注的數(shù)量之后,獲取第三賬號圈中的社交網(wǎng)絡(luò)賬號,其中,所述第三 賬號圈中的社交網(wǎng)絡(luò)賬號包括所述第二賬號圈中的社交網(wǎng)絡(luò)賬號和所述第二賬號圈中的 社交網(wǎng)絡(luò)賬號所關(guān)注的賬號;以及 第二計(jì)算模塊,用于計(jì)算所述第三賬號圈中的每個(gè)社交網(wǎng)絡(luò)賬號被所述第三賬號圈中 的社交網(wǎng)絡(luò)賬號所關(guān)注的第二數(shù)量,將計(jì)算得到的第二數(shù)量作為所述社交網(wǎng)絡(luò)關(guān)系中每個(gè) 社交網(wǎng)絡(luò)賬號的第二可信度。
10. 根據(jù)權(quán)利要求9所述的識別裝置,其特征在于,所述可信閾值包括第一閾值和第二 閾值,其中, 所述判斷單元包括:第一判斷模塊,用于當(dāng)查找到所述待識別的社交網(wǎng)絡(luò)賬號的可信 度包括所述第一可信度和所述第二可信度時(shí),判斷所述第一可信度是否超過所述第一閾 值;第二判斷模塊,用于判斷所述第二可信度是否超過所述第二閾值, 其中,所述第一確定單元還用于當(dāng)判斷出所述第一可信度超過所述第一閾值,或者, 判斷出所述第二可信度超過所述第二閾值,確定所述待識別的社交網(wǎng)絡(luò)賬號為所述第一賬 號;或者,所述第一確定單元還用于當(dāng)判斷出所述第一可信度超過所述第一閾值,并且判斷 出所述第二可信度超過所述第二閾值,確定所述待識別的社交網(wǎng)絡(luò)賬號為所述第一賬號。
【文檔編號】H04L29/06GK104092601SQ201410364828
【公開日】2014年10月8日 申請日期:2014年7月28日 優(yōu)先權(quán)日:2014年7月28日
【發(fā)明者】高立琦, 王震, 陳儒, 陳博 申請人:北京微眾文化傳媒有限公司