本發(fā)明涉及社交網(wǎng)絡
技術領域:
,尤其是涉及一種基于信譽累積的多標準協(xié)作欺詐檢測方法。
背景技術:
:近年來,社交網(wǎng)絡的飛速發(fā)展,越來越多的人使用社交網(wǎng)絡與朋友或者陌生人分享情感、購物以及一些其他的生活經(jīng)歷,如微博,博客等。信譽是用來反映過去信用度和預測未來個人可靠性的依據(jù),它已經(jīng)成為網(wǎng)絡安全管理有效和可行的解決方案,一個可靠的信譽系統(tǒng)能判定社區(qū)中的成員是否值得信賴。但是,不良用戶或商家利用自身高信譽或惡意破壞誠信用戶的信譽來牟取利益。比如,社交網(wǎng)絡中的不良用戶使用匿名攻擊其他誠信用戶以及欺詐其他用戶來牟取利益,不良用戶還可以通過自我夸大來提高自身信譽度來牟取利益。此外,因為有組織的協(xié)作欺詐行為比個人騙術更有殺傷力,所以它被廣泛地運用于社交網(wǎng)絡的信譽積累中。因此,關于用戶的欺詐檢測方法的研究已刻不容緩。傳統(tǒng)的檢測方法例如基于神經(jīng)網(wǎng)絡的方法,支持向量機和決策樹,大多數(shù)研究僅對個人的惡意攻擊行為進行檢測,而事實上,協(xié)作誹謗比個人用戶的攻擊有更大的破壞力,因此,發(fā)現(xiàn)惡意的協(xié)作行為,識別組織者和協(xié)作欺詐組織的群體是至關重要的問題。如前所述,傳統(tǒng)的關于社交網(wǎng)絡中信譽積累的研究側重于基于用戶間點對點連接的計算模型的發(fā)展,但是,由于在信譽積累過程中所有的判斷都給予了相同的權重,因此,這類積累方法的類型易于受到欺詐。當前社交網(wǎng)絡中關于協(xié)作欺詐檢測方法的研究,一般都是基于神經(jīng)網(wǎng)絡,支持向量機和決策樹的方法。目前的研究主要集中在對個人用戶欺詐行為的檢測,未曾考慮到用戶間的協(xié)作欺詐行為,而在社交網(wǎng)絡的現(xiàn)實應用中,用戶間的協(xié)作欺詐行為比個人用戶的欺詐行為有更大的破壞性和更高的發(fā)生頻率。技術實現(xiàn)要素:本發(fā)明的目的就是為了克服上述現(xiàn)有技術存在的缺陷而提供一種檢測客體廣、算法先進、全面評估的基于信譽累積的多標準協(xié)作欺詐檢測方法。本發(fā)明的目的可以通過以下技術方案來實現(xiàn):一種基于信譽累積的多標準協(xié)作欺詐檢測方法,用以發(fā)現(xiàn)協(xié)作欺詐組織以及識別其成員,包括以下步驟:1)在社交網(wǎng)絡中檢測并標記單個可疑用戶節(jié)點,采用信譽累積模型,獲取所有可疑用戶節(jié)點集合;2)對集合Δ中可疑用戶的可疑關系進行判定,將集合Δ中的所有可疑用戶所屬的協(xié)作欺詐組織模型進行歸類;3)對已歸類的協(xié)作欺詐組織模型中的組織者進行監(jiān)測識別。所述的步驟1)具體包括以下步驟:11)令Δ為經(jīng)檢測被識別為可疑用戶的集合,并令Γ=(ud1,ud2,.....)為未被檢測用戶節(jié)點的集合,初始狀態(tài)下Δ為空;12)構建信譽累積模型并通過面向評價差異的欺詐因素df和面向評級頻率的欺詐因素rf對未被檢測節(jié)點的集合Γ中的用戶節(jié)點進行可疑判定,并將集合Γ中被判定為可疑用戶的用戶節(jié)點轉(zhuǎn)移到可疑用戶的集合Δ中;13)根據(jù)可疑用戶的集合Δ中已經(jīng)被判定的可疑用戶采用面向協(xié)作行為的欺詐因素cf對集合Γ中尚未檢測的用戶節(jié)點進行檢測,并將集合Γ中被判定為可疑用戶的用戶節(jié)點轉(zhuǎn)移到可疑用戶的集合Δ中;14)重復步驟12)-13),直到集合Γ中所有用戶節(jié)點判定完畢。所述的步驟2)具體包括以下步驟:21)構建協(xié)作欺詐組織模型CFO=(OC,EC,RS),其中,OC為協(xié)作欺詐組織中角色為組織者的用戶集合,EC為協(xié)作欺詐組織中角色為協(xié)作欺詐執(zhí)行者的用戶集合,RS為協(xié)作欺詐組織中個角色成員之間的關系集合;22)根據(jù)集合Δ中可疑用戶集合Sd=(sd1,sd2...)以及可疑用戶之間的關系集合Sd_Rs構建集合Δ的子圖G_Δ=(Sd,Sd_Rs);23)將屬于子圖G_Δ的每個可疑用戶sdi平均分配到第i個協(xié)作欺詐組織CFOi的執(zhí)行者集合CFOi.ES中;24)對屬于子圖G_Δ中的可疑用戶sdi和sdj采用面向可疑關系的欺詐因素sf進行是否屬于相同的協(xié)作欺詐組織的判定,若是,則進行步驟25),若否,則進行步驟26);25)將可疑用戶sdj對應的第j個協(xié)作欺詐組織的執(zhí)行者全部轉(zhuǎn)移到可疑用戶sdi對應的第i個協(xié)作欺詐組織CFOi的執(zhí)行者集合中,同時將可疑用戶sdi與可疑用戶sdj的關系rs(sdi,sdj)加入到第i個協(xié)作欺詐組織CFOi的關系集合CFOi.RS中;26)重復步驟24),直至所有的可疑用戶歸類完畢,并獲取所有不是空集的協(xié)作欺詐組織模型。所述的步驟3)具體包括以下步驟:31)將歸類后的第k個協(xié)作欺詐組織模型中可疑用戶作為執(zhí)行者集合CFOk.EC中的原執(zhí)行者;32)采用CFO欺詐因素of對原執(zhí)行者是否為協(xié)作欺詐組織模型的組織者進行判定,若是,則將該原執(zhí)行者轉(zhuǎn)移到協(xié)作欺詐組織模型的組織者集合中,并將其標記為惡意用戶,若否,則將該原執(zhí)行者判定為協(xié)作欺詐組織模型的執(zhí)行者,不做轉(zhuǎn)移;33)重復步驟32),直至所有原執(zhí)行者判定轉(zhuǎn)移完畢。所述的步驟3)還包括以下步驟:34)對于未被檢測為可疑用戶集合Γ中所有用戶節(jié)點,若存在已被標記為屬于第k個欺詐組織的惡意用戶,且該未檢測的用戶節(jié)點與惡意用戶之間存在任何一個確定的社交網(wǎng)絡關系,則進行步驟35);35)采用CFO欺詐因素of對該未檢測的用戶節(jié)點是否為第k個欺詐組織模型的組織者進行判定,若是,則將該未檢測的用戶節(jié)點判定為第k個欺詐組織模型的組織者,并加入到第k個協(xié)作欺詐組織模型的組織者集合中,并同時將該未檢測的用戶節(jié)點與該惡意用戶的關系加入到第k個協(xié)作欺詐組織的用戶關系集合中;36)重復步驟34)-35),直至集合Γ中所有用戶節(jié)點均被檢測,最終產(chǎn)生第k個協(xié)作欺詐組織CFOk。所述的步驟12)中,信譽積累模型表示為:reputation(di)=(score(di),universal(di))其中,reputation(di)為社交網(wǎng)絡中第i個用戶節(jié)點di的信譽,score(di)為用戶節(jié)點di的信譽值,universal(di)為用戶節(jié)點di的信譽認可度;所述的用戶節(jié)點di的信譽值score(di)的計算式為:score(di)=1n×Σvdj∈C[jud(vdj,di)path(vdj,di)×universal(vdj)(1-Community(vdj)|C|)]]]>其中,C為社交網(wǎng)絡中現(xiàn)存的社區(qū)集合,|C|為社交網(wǎng)絡中現(xiàn)存的社區(qū)數(shù)量,n為用戶節(jié)點di收到的信譽評價次數(shù),vdj為社交網(wǎng)絡中進行信譽投票評價的第j個用戶節(jié)點,jud(vdj,di)為用戶節(jié)點vdj對用戶節(jié)點di的評價判斷,其取值為0或1,取值1時表示用戶節(jié)點di已經(jīng)獲得來自vdj的信譽評價值,取值0時表示用戶節(jié)點di尚未獲得來自vdj的信譽評價值,path(vdj,di)為社交網(wǎng)絡中從用戶節(jié)點vdj到用戶節(jié)點di的最短路徑長度,Community(vdj)為用戶節(jié)點vdj在社交網(wǎng)絡中所屬社區(qū)的數(shù)量,universal(vdj)為用戶節(jié)點vdj的信譽認可度;所述的用戶節(jié)點di的信譽認可度universal(di)的計算式為:universal(di)=13[(member(VD)member(community(di)))+(community(di)|C|)1|jud(VD,di)|+(score(di)max_score(community(di)))]]]>其中,member(VD)為所有對用戶節(jié)點di投出信譽投票評價的用戶節(jié)點VD的總數(shù),community(di)為用戶節(jié)點di在社交網(wǎng)絡中所屬社區(qū)的總數(shù)量,member(community(di))為用戶節(jié)點di在社交網(wǎng)絡中所屬社區(qū)含有的用戶節(jié)點總數(shù),max_score(community(di))為用戶節(jié)點di所屬社區(qū)擁有最高信譽的用戶節(jié)點對應的信譽值,|jud(VD,di)|為用戶節(jié)點di所收到的所有信譽評價的總數(shù)量,|C|為社交網(wǎng)絡中現(xiàn)存的社區(qū)數(shù)量。所述的步驟12)中,面向評價差異的欺詐因素df的判定公式及條件為:df(udi)=Σj=1n′Σp=1mj[(jud(udi,udj)p-score(udj))×(1-1mj+1)1n′]2Σj=1n′mj]]>當用戶節(jié)點udi的面向評價差異的欺詐因素值大于等于檢測臨界值ω1時,則將其判定為可疑用戶;其中,df(udi)為集合Γ中的用戶節(jié)點udi的評價差異欺詐因素值,jud(udi,udj)p為集合Γ中的用戶節(jié)點udi對用戶節(jié)點udj的第p次的投票評價,score(udj)為用戶節(jié)點udj的信譽值,mj為用戶節(jié)點udi對用戶節(jié)點udj的評價次數(shù),n′為用戶節(jié)點udi對所有節(jié)點發(fā)出的評價總次數(shù);面向評級頻率的欺詐因素rf的判定公式及條件為:rf(udi)=1|J(udi)|×Σudj∈J(udi)Σj=1mj[1mj×η(time_jud(udi,udj)q+1-time_jud(udi,udj)qunit_time)]]]>time_jud(udi,udj)q+1-time_jud(udi,udj)q當用戶節(jié)點udi的面向評級頻率的欺詐因素值大于等于檢測臨界值ω2時,則將其判定為可疑用戶;其中,rf(udi)為集合Γ中的用戶節(jié)點udi的評級頻率欺詐因素值,J(udi)為被用戶節(jié)點udi進行過信譽評價投票的用戶節(jié)點udj的集合,unit_time為時間片的長度,time_jud(udi,udj)q、time_jud(udi,udj)q+1分別用戶節(jié)點udi對用戶節(jié)點udj的第q次和第q+1次投票評價的時間點,η為阻尼參數(shù),且η∈[0,1]。所述的步驟13)中,面向協(xié)作行為的欺詐因素cf的判定公式及條件為:cf(udi,mdj)=Σt=1|D|[(1-|ave_jud(udi,dt)-ave_jud(mdj,dt)|)×(1-1mt+1)1|D|]|D|2]]>當用戶節(jié)點udi的協(xié)作行為欺詐因素值大于等于檢測臨界值ω3時,則將其判定為可疑用戶;其中,cf(udi,mdj)為用戶節(jié)點udi與被判定為CFO組織中惡意成員mdj的協(xié)作行為欺詐因素值,D為被用戶節(jié)點udi與惡意成員mdj共同評價過的誠實用戶dt集合中,|D|為集合中誠實用戶dt的總數(shù),ave_jud(udi,dt)為用戶節(jié)點udi對誠實用戶dt的所有投票評價的平均值,ave_jud(mdj,dt)為惡意成員mdj對誠實用戶dt的所有投票評價的平均值,mt為用戶節(jié)點udi對誠實用戶dt的投票評價總數(shù)。所述的步驟24)中,面向可疑關系的欺詐因素sf的判定公式及條件為:sf(sdi,sdj)=0whiletime_trl(sdi,sdj)=012×[c~c×(Σtrl(sdi,sdj)∈TRAtime_trl(sdi,sdj)×p(trl(sdi,sdj))Σtrl(sdi,sdj)∈TRAtime_trl(sdi,sdj))1c~+sf(sdj,sdi)]else]]>當可疑用戶sdi和sdj間的可疑關系欺詐因素值大于等于檢測臨界值ω4時,則判定可疑用戶sdi和sdj屬于相同的協(xié)作欺詐組織;其中,sf(sdi,sdj)為可疑用戶sdi和sdj間的可疑關系欺詐因素值,time_trl(sdi,sdj)為可疑用戶sdi和sdj間的社交關系中第l類交互行為trl(sdi,sdj)的交互次數(shù),c為可疑用戶sdi和sdj間的社交關系的種類總數(shù),為可疑用戶sdi和sdj間的社交關系中的可疑關系數(shù)量,TRA為可疑用戶sdi和sdj間的社交關系的集合,p(trl(sdi,sdj))為可疑用戶sdi和sdj間的社交關系中第l類交互行為作為一類行為出現(xiàn)在一個可疑關系中的概率,表示兩個用戶之間存在社交關系,那么他們之間存在若干類交互行為,例如點贊、評論、轉(zhuǎn)發(fā)、推薦、購買等;那么這個概率是指第l類行為而言,其出現(xiàn)的總次數(shù)與其出現(xiàn)在所有可疑社交關系中的比例。所述的步驟32)中,CFO欺詐因素of的判定公式及條件為:of(ECki)=12[Σmdj(weight(mdj)×feq(ECki,mdj))+Σmdj(weight(mdj)×sf(ECki,mdj))|CFO.OC∪CFO.EC|]]]>feq(ECki,mdj)=times_com(ECki,mdj)/times_com(ECki,List_ECki)當?shù)趉個協(xié)作欺詐組織模型中執(zhí)行者的CFO欺詐因素值大于等于檢測臨界值ω5時,則判定該執(zhí)行者為協(xié)作欺詐組織模型的組織者;其中,of(ECki)為第k個協(xié)作欺詐組織模型中待判定的執(zhí)行者ECki的CFO欺詐因素值,weight(mdj)為惡意成員mdj在協(xié)作欺詐組織模型中的角色權重,包括組織者和執(zhí)行者的權重,且兩種權重的和為1,feq(ECki,mdj)為待判定的執(zhí)行者ECki與惡意成員mdj的交互頻率,sf(ECki,mdj)為待判定的執(zhí)行者ECki與惡意成員mdj的可疑關系欺詐因素值,|CFO.OC∪CFO.EC|為被確認為惡意成員的集合的總數(shù),times_com(ECki,mdj)為待判定的執(zhí)行者ECki與惡意成員mdj之間的交互總次數(shù),times_com(ECki,List_ECki)為待判定的執(zhí)行者ECki與其所有關系表中用戶List_ECki的社交網(wǎng)絡交互總次數(shù)。與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點:一、檢測客體廣:本發(fā)明提供一種檢測協(xié)作欺詐組織及其全體成員的技術,可針對協(xié)作欺詐組織用的執(zhí)行者和組織者兩類角色進行檢測,不僅僅依據(jù)惡意行為檢測惡意欺詐的執(zhí)行用戶。二、算法先進:傳統(tǒng)用戶的信譽形成過程中僅僅對過往全體用戶投票進行綜合累積,本技術在對全局投票積累的基礎上,引入一個新的指標,即全體投票用戶對目標用戶信譽值的評價普遍性指標。三、全面評估:區(qū)別于傳統(tǒng)信譽惡意欺詐檢測中指標單一的局限,本技術給出一種多標準綜合檢測方法,該多標準檢測方法包括面向評價差異的欺詐因素、面向評級頻率的欺詐因素、面向協(xié)作行為的欺詐因素、面向可疑關系的欺詐因素和CFO欺詐因素等多個綜合指標,實現(xiàn)更為全面的評估。附圖說明圖1為本發(fā)明定義的CFO模型結構示意圖。圖2為CFO中的協(xié)作行為檢測示意圖,其中,圖(2a)為疑似欺詐執(zhí)行者誹謗與夸大示例,圖(2b)為可疑用戶在不同時間段內(nèi)對其他用戶投票行為示例,圖(2c)為疑似欺詐執(zhí)行者與已確定欺詐執(zhí)行者協(xié)作誹謗和夸大行為示例,圖(2d)為疑似欺詐執(zhí)行者與已確定欺詐執(zhí)行者社交關系示例,圖(2e)為疑似欺詐組織者與CFO成員之間的社交關系示例,圖(2f)為圖2的圖例。具體實施方式下面結合附圖和具體實施例對本發(fā)明進行詳細說明。實施例:如圖1所示,表示CFO內(nèi)部執(zhí)行者用戶和組織者之間的關系以及與欺詐組織以外的誠實用戶之間的關系,其中黑色空心節(jié)點、雙圓心節(jié)點和灰色實心節(jié)點分別表示CFO組織內(nèi)部的協(xié)作欺詐執(zhí)行者用戶、CFO共同組織者用戶、CFO組織外部的誠實用戶;云狀區(qū)域表示CFO組織;黑色直線表示CFO內(nèi)部執(zhí)行者與組織者之間的雇傭關系;黑色虛直線表示CFO內(nèi)部組織者之間的同組織關系;從執(zhí)行者到誠實用戶的灰色虛線箭頭表示執(zhí)行者對誠實用戶進行協(xié)作誹謗;從執(zhí)行者到誠實用戶的黑色實線箭頭表示執(zhí)行者對誠實用戶協(xié)作進行夸大誠實用戶的行為。如圖2所示,圖2(a)和圖2(b)表示對可疑用戶1的面向評級頻率差異欺詐因素的計算過程,圖2(b)表示可疑用戶1分別向用戶4投票9次、用戶5投票6次,并計算出面向評級頻率的欺詐因素;圖2(c)表示可疑用戶1和惡意用戶3對誠實用戶2,4,5進行投票,并計算出面向協(xié)作行為的欺詐因素;圖2(d)表示可疑用戶1與惡意用戶3間的三種關系(雇傭關系,同事關系,和共同組織關系);圖2(e)表示可疑用戶6與已經(jīng)被確定的CFO內(nèi)部組織者用戶7與執(zhí)行者用戶3,8之間的關系;其中黑色實線節(jié)點表示協(xié)作欺詐執(zhí)行者用戶,雙園實線節(jié)點表示協(xié)作欺詐組織者用戶,灰色圓點表示誠實用戶,黑色虛線節(jié)點表示疑似欺詐執(zhí)行者用戶,菱形節(jié)點表示疑似欺詐組織者用戶,云狀區(qū)域表示CFO組織,雙點間隔虛線表示同事關系,黑色實線表示雇傭關系,黑色虛線實線表示同組織關系,黑色虛線箭頭表示用戶對另一用戶的協(xié)作誹謗,黑色實線箭頭表示用戶對另一個用戶的夸大。一、本發(fā)明先對用戶節(jié)點擁有的用戶列表和欺詐模型進行定義:定義1:用戶節(jié)點擁有的用戶列表所述列表的定義如下:List(di)=(List_node,list_rs,List_record)上述表達公式中,di表示第i個用戶節(jié)點,List_node,List_rs和List_record分別來定義di與其他節(jié)點的關系,以及在社交網(wǎng)絡中的歷史紀錄。定義2:協(xié)作欺詐模型本方法基于有向圖提出了協(xié)作欺詐組織CFO的定義,其中也包含了組織者者(頂點)和CFO用戶間的關系(邊)。協(xié)助欺詐組織模型的定義如下:CFO=(OC,EC,RS)其中,OC=(oc1,oc2.....)表示CFO中角色為組織者的用戶集合,EC=(ec1,ec2....)表示CFO中角色為協(xié)作欺詐執(zhí)行者的用戶集合,RS=(rs1,rs2....)表示CFO中各成員之間的關系集合,每一個關系rsi=<c×c,rtj>可以表示為兩個CFO成員之間的二元關系,c∈OC∪EC,rt是rti關系的類型。下面,給出本發(fā)明基于信譽積累的多標準欺詐檢測方法的計算方法:該計算方法的具體步驟為:A.定義協(xié)作欺詐組織模型以及相關概念說明;B.建立一種新型信譽積累模型,并給出新型信譽模型中用以表示信譽值的兩個指標計算方法;C.建立協(xié)作欺詐組織CFO及其組織成員的檢測方法:(1)分析CFO欺詐的行為和方式等特征,以及一個CFO中,組織者、執(zhí)行者之間可能的關系;(2)MD-CFO方法包括五個檢測因素:面向評級差異的欺詐因素,面向評級頻率的欺詐因素,面向協(xié)作行為的欺詐因素,面向可疑關系的欺詐因素,以及CFO欺詐因素,并給出上述五個因素的計算方法;(3)MD-CFO的檢測過程分為四個步驟:單一的可疑用戶節(jié)點檢測判定,CFO的可疑關系評估和CFO組織檢測;以往的針對社交網(wǎng)絡欺詐行為的研究,都只考慮了單個節(jié)點的欺詐行為,本發(fā)明認為,節(jié)點之間有組織的欺詐行為比單個節(jié)點的欺詐行為更易發(fā)生,破壞力也更大。因此研究社交網(wǎng)絡中有組織的欺詐行為有重要意義,相對于以往的研究,本發(fā)明更加全面。社交網(wǎng)絡的欺詐組織中,主要節(jié)點被分為組織者和執(zhí)行者,劃分的依據(jù)是在欺詐組織中該節(jié)點是否組織協(xié)作欺詐行為或者是否分派組織者。而節(jié)點是否實施欺詐行為要通過其評價頻率、與其他欺詐節(jié)點的聯(lián)系等多個方面分析得出。定義3組織者和執(zhí)行者在發(fā)明中,所有參與協(xié)作的惡意節(jié)點都被稱為協(xié)作者。在協(xié)作欺詐組織中,協(xié)作者有以下角色:組織者:在協(xié)作欺詐組織中始終試圖去組織協(xié)作者,也就是說,在每種情況下,這個角色的工作包括建立組織、發(fā)掘惡意節(jié)點、獲取欺詐要求、分派協(xié)作任務以及為協(xié)作行為提供協(xié)作者。執(zhí)行者:執(zhí)行者分派協(xié)作者,他們在協(xié)作行為中進行惡意的信譽積累。注意,執(zhí)行者也可能是組織者。二、建立新型信譽模型的技術方案:對于社交網(wǎng)絡中的個體Di的信譽模型如下:reputation(Di)=(score(Di),universal(Di))score(di)表示該用戶節(jié)點di的信譽值,universal(di)用戶節(jié)點di所獲得信譽的普遍認可程度;其中score(Di)的計算方法如下:score(Di)=1n×ΣVDj∈C[jub(VDj,Di)path(VDj,Di)×universal(VDj)(1-Community(VDj)|C|)]]]>C={C1,C2...}表示社交網(wǎng)絡中現(xiàn)存的社區(qū),|C|表示社交網(wǎng)絡中現(xiàn)存所有社區(qū)的數(shù)量;vdj表示第j個為用戶節(jié)點di投票的節(jié)點;jud(vdj,di)∈[0,1]表示用戶di在過去已經(jīng)獲得的來自vdj的評價值;Community(vdj)表示用戶節(jié)點vdj在社交網(wǎng)絡中所屬社區(qū)的數(shù)量;path(vdj,di)表示社交網(wǎng)絡中從用戶節(jié)點vdj到di的最短路徑長度。(2)其中universal(VDj)的計算方法如下:universal(Di)=13[(member(VDj)member(community(Di)))+(community(Di)|C|)1|jud(VDi,Di)|+(score(Di)max_score(community(Di)))]]]>函數(shù)member(VD)表示所有給di信譽投出評價的用戶節(jié)點總數(shù);community(di)表示di所屬所有社區(qū)的總數(shù)量;member(community(di))表示di所在所有社區(qū)中含有的用戶總數(shù);函數(shù)max_score(community(di))表示用戶di所屬的社區(qū)中所有用戶擁有的信譽最大值,|jud(VD,di)|表示用戶節(jié)點di所收到的所有信譽評價的總數(shù)量。三、五個識別因素及其相對應的影響因素的技術方案(1)面向評價差異的欺詐因素:面向評價差異的欺詐因素計算方法如下:假設一個節(jié)點di,在過去曾向其他用戶節(jié)點發(fā)送了n次信譽評價。假設對于一個被di所評價過的用戶節(jié)點dj而言,用戶節(jié)點dj的信譽分數(shù)是score(dj),而第k次由di到dj的評級判斷是jud(di,dj)k∈[0,1],mj表示用戶di對于用戶dj給出評價的次數(shù)。面向評價差異的欺詐因素df(di)計算方法如下:df(di)=Σj=1nΣk=1mj[(jud(di,dj)k-score(dj))×(1-1mj+1)1n]2Σj=1nmj]]>(2)面向評級頻率的欺詐因素:面向評級頻率的欺詐因素表示為rf(di),其計算方法如下:令一個時間片的長度記為unit_time,假設所有被用戶di進行過信譽評價投票的用戶集合記為J(di),對于第j個用戶jdj∈J(di),假設由di投給jdj的全部信譽評價數(shù)為mj,第k次信譽評價投票的時間點表示為time_jud(di,jdj)k,則面向評級頻率的欺詐因素計算方法如下:rf(di)=1|J(di)|×Σjdj∈J(di)Σj=1mj[1mj×η(time_jud(di,jdj)k+1-time_jud(di,kdj)kunit_time)]]]>time_jud(di,jdj)k+1-time_jud(di,jdj)k上述公式中,|J(di)|表示集合J(di)中用戶節(jié)點的數(shù)量,η(η∈[0,1])是公式計算的阻尼參數(shù)。(3)面向協(xié)作行為的欺詐因素:對于協(xié)作欺詐檢測來說,行為相似性是重要的標準。假設存在一惡意用戶mdj∈CFO.ON∪CFO.EN,該用戶mdj已經(jīng)被證明是CFO組織中的惡意成員。滿足判定一個可疑用戶di,那么該可疑用戶di與惡意用戶mdj之間的協(xié)作行為欺詐因素值cf(di,mdj)的計算如下:cf(di,mdj)=Σk=1|D|[(1-|ave_jud(di,dk)-ave_jud(mdj,dk)|)×(1-1mk+1)1n]|D|2]]>上述公式中,被可疑用戶di與惡意用戶mdj共同評價過的誠實用戶集合記為D,對于第k個用戶dk∈D,可疑用戶di對誠實用戶dk所給出所有評價值的平均值為ave_jud(di,dk),惡意用戶mdj對dk所給出所有評價的平均值為ave_jud(mdj,dk)|D|表示誠實集合D中用戶總數(shù);mk表示di給出dk的信譽評價總次數(shù)。(4)面向可疑關系的欺詐因素:如果一個可疑用戶與CFO中確定的成員保持緊密的社交網(wǎng)絡關系,那該可疑用戶具有較高概率也是協(xié)作欺詐者。。本發(fā)明中把兩個用戶的社交網(wǎng)絡關系分為兩種類型:正常關系和可疑關系。正常關系表示用戶交互的過程中均為誠實信譽評價行為,而可疑關系包括大量信譽欺詐或者協(xié)作欺詐行為。面向可疑關系的欺詐因素計算方法如下:令用戶di到用戶dj維持共有c種類型的社交網(wǎng)絡關系,且在這所有的c種類型的關系中存在個可疑關系。假設TRA(di,dj)={tr1(di,dj),tr2(di,dj),...}表示用戶di和dj之間過往行為交互的集合,其中trl(di,dj)表示第l類交互行為,下標l取值為正整數(shù);用戶di與dj的第l類交互trl(di,dj)的交互次數(shù)記為time_trl(di,dj),那么面向可疑關系的欺詐因素sf(di,dj)的計算如下:sf(di,dj)=0whiletime_tr(di,dj)=012×[c~c×(Σtrl(di,dj)∈TRAtime_trl(di,dj)×p(trl(di,dj))Σtrl(di,dj)∈TRAtime_trl(di,dj))1c~+sf(dj,di)]else]]>其中,函數(shù)p(trl(di,dj))表示交互行為trl(di,dj)作為一類行為出現(xiàn)在一個可疑關系中的概率。(5)CFO欺詐因素:本發(fā)明中,令CFO中已被識別確認的惡意用戶集合記為mdj∈CFO.ON∪CFO.EN,mdj表示CFO惡意用戶成員中的第j個成員;。函數(shù)feq(di,mdj)表示一個未識別為CFO成員di和CFO惡意用戶mdj在社交網(wǎng)絡中的交互頻率。用戶di是否可能為該CFO中成員的CFO欺詐因素計算方法如下:of(di)=12[Σmdj(weight(mdj)×feq(di,mdj))+Σmdj(weight(mdj)×sf(di,mdj))|CFO.OC∪CFO.EC|]]]>其中,weight(mdj)表示mdj在CFO中的角色權重,角色權重分為組織者角色權重和執(zhí)行者角色權重,兩類角色權重和為1。|CFO.OC∪CFO.EC|表示集合CFO.OC∪CFO.EC中用戶的總數(shù)。此外,feq(di,mdj)的計算如下:feq(di,mdj)=times_com(di,mdj)/times_com(di,List_di)上述公式中,times_com(di,mdj)表示用戶di和mdj社交網(wǎng)絡交互總次數(shù);times_com(di,List_di)表示用戶di與其所有關系表中用戶List_di的社交網(wǎng)絡交互總次數(shù)。四、欺詐組織CFO檢測技術方案CFO檢測方法的四個步驟以及實現(xiàn)算法如下:本發(fā)明在CFO檢測中,將檢測過程分為三個步驟:單個可疑用戶檢測、可疑關系評估、CFO組織者檢測。本發(fā)明中,所有未被檢測的用戶標記為ud,初始未被檢測的用戶集合記為Γ=(ud1,ud2,.....);經(jīng)過檢測被識別為可疑用戶的標記為sd,經(jīng)檢測確認為CFO成員的用戶標記為fd1)單個可疑節(jié)點檢測:該步驟使用df(di)和rf(di)兩個欺詐因素開展檢測。單個可疑用戶檢測算法的過程如下:[1]令Δ為經(jīng)檢測被識別確定為可疑用戶sd的集合,初始狀態(tài)下Δ為空;[2]從未被檢測節(jié)點的集合Γ中取出節(jié)點udi;[3]若未被檢測節(jié)點udi的欺詐因素df(udi)≥ω1或欺詐因素rf(udi)≥ω2(ω1、ω2分別為欺詐因素df(udi)、rf(udi)的檢測臨界值),則將該節(jié)點udi標記為可疑用戶節(jié)點sdi;[4]將步驟[3]中的節(jié)點udi從未被檢測節(jié)點集合Γ中刪除,同時將[3]中節(jié)點檢測到的可疑用戶節(jié)點sdi加入經(jīng)檢測被識別為可疑用戶的節(jié)點集合Δ中;重復步驟[2]到[4],直至集合Γ中所有用戶被檢測過為止;[5]對于所有sdj屬于經(jīng)檢測被識別為可疑用戶的節(jié)點集合進行下列檢測;[6]對集合Γ中所有用戶,選擇用戶udi;[7]若CFO欺詐因素cf(udi,sdj)≥ω3(ω3為欺詐因素cf(udi,sdj)的檢測臨界值),則將該用戶udi標記為可疑用戶sdi[8]重復上述步驟[4]到[7],直至集合Γ中所有用戶被檢測過為止;[9]返回集合Δ。本算法中,三個臨界值ω1,ω2,ω3的取值范圍為0到1。2)可疑關系評估:檢測單個可疑用戶之后,返回了經(jīng)檢測被標記為可疑用戶的集合Δ。在集合Δ的基礎上可獲得一個子圖,其中包含經(jīng)檢測的可疑節(jié)點sdi以及它們之間的關系。該子圖表示為G_Δ=(Sd,Sd_Rs),其中Sd表示可疑用戶集合,Sd_Rs表示用戶間的關系集合。但由于該檢測方法僅估算了單個用戶的欺詐行為,該集合可能會包含不同的協(xié)作欺詐組織CFOs。因此,本發(fā)明提出了一種可疑關系評估算法,將不隸屬于本次檢測的協(xié)作欺詐組織CFO中分離。算法如下:[1]若用戶sdi屬于集合Δ的子圖G_Δ的可疑用戶集合sd中;[2]將用戶sdi加入第i個協(xié)作欺詐組織的執(zhí)行者集合CFOi.EC中;[3]對于屬于子圖G_Δ的可疑用戶集合Sd中所有用戶sdi與用戶sdj,執(zhí)行下列操作;[4]如果用戶sdi與用戶sdj之間存在關系值rs(sdi,sdj)屬于子圖G_Δ的關系集合中,則檢測該可疑關系的欺詐因素sf(sdi,sdj);[5]若可疑關系欺詐因素sf(sdi,sdj)≥ω4(ω4為可疑關系欺詐因素的臨界值),則將第i個協(xié)作欺詐組織的執(zhí)行者與第j個協(xié)作欺詐組織的執(zhí)行者放入第i個協(xié)作欺詐組織的執(zhí)行者集合中,并將第j個協(xié)作欺詐組織設為空集;同時,將用戶sdi與用戶sdj的關系rs(sdi,sdj)加入到第i個協(xié)作欺詐組織的關系集合CFOi.RS中;[6]否則,若[5]中條件未滿足,則剔除CFOi.RS中用戶sdi與用戶sdj的關系rs(sdi,sdj);[7]對于最終所有分離獲得的CFO,若最終得到的集合CFOi不是空集,則返回集合CFOi。本算法中,ω4是可疑關系欺詐因素的臨界值?;谒惴?,可疑用戶及其關系在明確的行為和關系的基礎上歸類出不同的協(xié)作欺詐組織CFOs。此時,所有的用戶稱為CFO的執(zhí)行者。3)組織者用戶檢測:組織者檢測方法是基于已提出的組織協(xié)作欺詐因素開展的,檢測算法如下:[1]對于第k個協(xié)作欺詐組織中的執(zhí)行者集合CFOk.EC中所有用戶sdj屬于CFOk.EC;[2]若該用戶sdj的CFO欺詐因素滿足of(sdj)≥ω5(ω5為CFO欺詐因素的臨界值),則將用戶sdj標記為組織者用戶odj;[3]將[2]中被檢測的用戶加入第k個協(xié)作欺詐組織的組織者集合CFOk.OC中,重復步驟[1-3]直至CFOk.EC中所有用戶被檢測;[4]對于未被檢測為可疑用戶集合Γ中所有用戶udi,若存在已被檢測為可疑用戶的用戶sdj屬于第k個欺詐組織CFOk的惡意用戶,且該用戶udi與用戶sdj之間存在任何一個確定的社交網(wǎng)絡關系,則執(zhí)行[5];[5]若該用戶udi的CFO欺詐因素of(udi)≥ω5,則將用戶udi標記為經(jīng)檢測為組織者的用戶odj;[6]將經(jīng)檢測為組織者用戶odj加入第k個協(xié)作欺詐組織的組織者集合中,同時將組織者用戶odj與經(jīng)檢測為可疑用戶的用戶sdj之間的關系加入第i個協(xié)作欺詐組織的用戶關系集合中;[7]重復步驟[4]-[5],直至用戶集合Γ中所有用戶均被檢測;[8]返回第k個協(xié)作欺詐組織CFOk。其中,ω5是組織聯(lián)合者用戶檢測的臨界值。當前第1頁1 2 3