本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,具體而言,涉及一種檢測模型的構(gòu)建方法、裝置、儲存介質(zhì)、處理器和終端。
背景技術(shù):
游戲外掛檢測通常被認(rèn)定屬于異常檢測問題,即,從一系列日志數(shù)據(jù)中提取出異常數(shù)據(jù)。異常檢測在數(shù)據(jù)挖掘領(lǐng)域中備受關(guān)注,并且在許多實(shí)際應(yīng)用場景中扮演重要角色。例如:信用卡詐騙檢測、網(wǎng)絡(luò)入侵探測以及其他異常行為檢測。目前,大量現(xiàn)有技術(shù)已經(jīng)被成功研發(fā)并致力于異常檢測研究,例如:基于圖的異常檢測方法、基于張量的異常檢測方法。
用戶行為分析是當(dāng)今業(yè)界常用來進(jìn)行游戲腳本機(jī)器人檢測的方法。這種方法使用從游戲服務(wù)器提取的游戲玩家日志數(shù)據(jù),進(jìn)而利用數(shù)據(jù)挖掘方式來檢測一些非常規(guī)的精密設(shè)計(jì)的游戲外掛。這種非常規(guī)外掛,不同于傳統(tǒng)外掛,可以通過簡單的客戶端檢測加以甄別。非常規(guī)外掛隱蔽性更強(qiáng)、更難被發(fā)現(xiàn),而且外掛設(shè)計(jì)者還熟知針對外掛被強(qiáng)制停止使用問題,如何及時(shí)地做出應(yīng)對性措施,例如:改變外掛中包含的特定內(nèi)容來躲避游戲公司的外掛檢測機(jī)制。為此,相關(guān)技術(shù)中推出改進(jìn)方案,其是從不同的角度來分析日志數(shù)據(jù),例如:分析游戲環(huán)境下的社交活動(dòng)、經(jīng)濟(jì)活動(dòng)或者是虛擬地圖中運(yùn)動(dòng)軌跡。利用常見的數(shù)據(jù)挖掘技術(shù),例如:分類(包括但不限于:支持向量機(jī)、線性回歸)或聚類技術(shù)(包括但不限于:k均值聚類,層次聚類等等),對通過按照經(jīng)驗(yàn)或者領(lǐng)域知識選取的玩家特征數(shù)據(jù)進(jìn)行挖掘。
然而,相關(guān)技術(shù)中所提出的解決方案需要采集完整的游戲數(shù)據(jù),而并沒有考慮游戲數(shù)據(jù)本身也會隨時(shí)間發(fā)生變化。特別是在游戲數(shù)據(jù)的總體數(shù)量較為龐大時(shí),需要耗費(fèi)較多的硬件資源,并且處理時(shí)間較長、處理復(fù)雜度較高。
針對上述的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明至少一個(gè)實(shí)施例提供了一種檢測模型的構(gòu)建方法、裝置、儲存介質(zhì)、處理器和終端,以至少解決相關(guān)技術(shù)中所提供的游戲外掛檢測方案需要獲取完整的游戲數(shù)據(jù),計(jì)算量較大且無法滿足游戲數(shù)據(jù)的增量變化需求的技術(shù)問題。
根據(jù)本發(fā)明其中一實(shí)施例,提供了一種檢測模型的構(gòu)建方法,包括:
從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類,其中,待校驗(yàn)數(shù)據(jù)是從預(yù)設(shè)范圍內(nèi)新增的日志數(shù)據(jù)中提取的,多個(gè)信息類用于確定待使用的檢測模型,檢測模型用于檢測游戲中的異常行為;通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型。
可選地,從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類包括:從游戲服務(wù)器提取日志數(shù)據(jù);按照預(yù)設(shè)條件從日志數(shù)據(jù)中選取待校驗(yàn)數(shù)據(jù),其中,待校驗(yàn)數(shù)據(jù)包括:當(dāng)前采集到的多名游戲角色在相同時(shí)間維度下執(zhí)行的多種類型動(dòng)作數(shù)據(jù),每種類型動(dòng)作數(shù)據(jù)被分別設(shè)置為一個(gè)信息類。
可選地,通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型包括:比較步驟:通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,選取第一信息類和第二信息類,其中,第一信息類的信息增益為多個(gè)信息類的信息增益的最大值,第二信息類的信息增益為多個(gè)信息類的信息增益的次大值;處理步驟:當(dāng)?shù)谝恍畔㈩惖男畔⒃鲆媾c第二信息類的信息增益的差值大于預(yù)設(shè)閾值時(shí),將第一信息類對應(yīng)的動(dòng)作數(shù)據(jù)設(shè)置為檢測模型的當(dāng)前構(gòu)建元素;分裂步驟:按照與第一信息類對應(yīng)的分裂條件,確定下個(gè)待生成的構(gòu)建元素,返回比較步驟。
可選地,在通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型之前,還包括:根據(jù)多個(gè)信息類中每個(gè)信息類的占有比例,分別計(jì)算每個(gè)信息類對應(yīng)的信息熵;將每個(gè)信息類是否表征為游戲中的異常行為設(shè)置為判斷條件,分別計(jì)算每個(gè)信息類對應(yīng)的條件熵;采用每個(gè)信息類對應(yīng)的信息熵與每個(gè)信息類對應(yīng)的條件熵,計(jì)算每個(gè)信息類的信息增益。
可選地,處理步驟還包括:如果在當(dāng)前構(gòu)建元素處確定多個(gè)信息類中所包含的動(dòng)作數(shù)據(jù)分布發(fā)生變化,則創(chuàng)建與檢測模型關(guān)聯(lián)的替代模型,其中,替代模型包括:檢測模型中全部已生成的構(gòu)建元素。
可選地,在當(dāng)前構(gòu)建元素處確定多個(gè)信息類中所包含的動(dòng)作數(shù)據(jù)分布發(fā)生變化包括:將多名游戲角色中每名游戲角色對應(yīng)的動(dòng)作屬性值添加至滑動(dòng)窗口,其中,動(dòng)作屬性值表示每名游戲角色所執(zhí)行的動(dòng)作是否異常;將滑動(dòng)窗口劃分為第一部分子窗口和第二部分子窗口;當(dāng)確定第一參數(shù)值與第二參數(shù)值之間的差值的絕對值大于或等于預(yù)設(shè)閾值時(shí),持續(xù)丟棄最新添加至滑動(dòng)窗口的數(shù)據(jù),并確定動(dòng)作數(shù)據(jù)分布發(fā)生變化,直至絕對值小于預(yù)設(shè)閾值,其中,第一參數(shù)值為第一部分子窗口內(nèi)的數(shù)據(jù)平均值,第二參數(shù)值為第二部分子窗口內(nèi)的數(shù)據(jù)平均值。
可選地,在創(chuàng)建替代模型之后,還包括:采用預(yù)設(shè)判定指標(biāo)對檢測模型和替代模型進(jìn)行比較,其中,預(yù)設(shè)判定指標(biāo)包括以下至少之一:召回率、準(zhǔn)確率;當(dāng)判定結(jié)果顯示替代模型優(yōu)于檢測模型時(shí),則采用替代模型對檢測模型進(jìn)行替換。
可選地,分裂步驟還包括:在確定下個(gè)待生成的構(gòu)建元素之后,獲取控制命令,其中,控制命令用于指示在下個(gè)待生成的構(gòu)建元素處停止分裂。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種檢測模型的構(gòu)建裝置,包括:
獲取模塊,用于從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類,其中,待校驗(yàn)數(shù)據(jù)是從預(yù)設(shè)范圍內(nèi)新增的日志數(shù)據(jù)中提取的,多個(gè)信息類用于確定待使用的檢測模型,檢測模型用于檢測游戲中的異常行為;構(gòu)建模塊,用于通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型。
可選地,獲取模塊包括:提取單元,用于從游戲服務(wù)器提取日志數(shù)據(jù);獲取單元,用于按照預(yù)設(shè)條件從日志數(shù)據(jù)中選取待校驗(yàn)數(shù)據(jù),其中,待校驗(yàn)數(shù)據(jù)包括:當(dāng)前采集到的多名游戲角色在相同時(shí)間維度下執(zhí)行的多種類型動(dòng)作數(shù)據(jù),每種類型動(dòng)作數(shù)據(jù)被分別設(shè)置為一個(gè)信息類。
可選地,構(gòu)建模塊包括:比較單元,用于通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,選取第一信息類和第二信息類,其中,第一信息類的信息增益為多個(gè)信息類的信息增益的最大值,第二信息類的信息增益為多個(gè)信息類的信息增益的次大值;處理單元,用于當(dāng)?shù)谝恍畔㈩惖男畔⒃鲆媾c第二信息類的信息增益的差值大于預(yù)設(shè)閾值時(shí),將第一信息類對應(yīng)的動(dòng)作數(shù)據(jù)設(shè)置為檢測模型的當(dāng)前構(gòu)建元素;分裂單元,用于按照與第一信息類對應(yīng)的分裂條件,確定下個(gè)待生成的構(gòu)建元素,返回比較單元。
可選地,上述裝置還包括:第一計(jì)算模塊,用于根據(jù)多個(gè)信息類中每個(gè)信息類的占有比例,分別計(jì)算每個(gè)信息類對應(yīng)的信息熵;第二計(jì)算模塊,用于將每個(gè)信息類是否表征為游戲中的異常行為設(shè)置為判斷條件,分別計(jì)算每個(gè)信息類對應(yīng)的條件熵;第三計(jì)算模塊,用于采用每個(gè)信息類對應(yīng)的信息熵與每個(gè)信息類對應(yīng)的條件熵,計(jì)算每個(gè)信息類的信息增益。
可選地,處理單元,還用于如果在當(dāng)前構(gòu)建元素處確定多個(gè)信息類中所包含的動(dòng)作數(shù)據(jù)分布發(fā)生變化,則創(chuàng)建與檢測模型關(guān)聯(lián)的替代模型,其中,替代模型包括:檢測模型中全部已生成的構(gòu)建元素。
可選地,處理單元包括:添加子單元,用于將多名游戲角色中每名游戲角色對應(yīng)的動(dòng)作屬性值添加至滑動(dòng)窗口,其中,動(dòng)作屬性值表示每名游戲角色所執(zhí)行的動(dòng)作是否異常;劃分子單元,用于將滑動(dòng)窗口劃分為第一部分子窗口和第二部分子窗口;處理子單元,用于當(dāng)確定第一參數(shù)值與第二參數(shù)值之間的差值的絕對值大于或等于預(yù)設(shè)閾值時(shí),持續(xù)丟棄最新添加至滑動(dòng)窗口的數(shù)據(jù),并確定動(dòng)作數(shù)據(jù)分布發(fā)生變化,直至絕對值小于預(yù)設(shè)閾值,其中,第一參數(shù)值為第一部分子窗口內(nèi)的數(shù)據(jù)平均值,第二參數(shù)值為第二部分子窗口內(nèi)的數(shù)據(jù)平均值。
可選地,構(gòu)建模塊還包括:比較單元,用于采用預(yù)設(shè)判定指標(biāo)對檢測模型和替代模型進(jìn)行比較,其中,預(yù)設(shè)判定指標(biāo)包括以下至少之一:召回率、準(zhǔn)確率;替換單元,用于當(dāng)判定結(jié)果顯示替代模型優(yōu)于檢測模型時(shí),則采用替代模型對檢測模型進(jìn)行替換。
可選地,分裂單元,還用于在確定下個(gè)待生成的構(gòu)建元素之后,獲取控制命令,其中,控制命令用于指示在下個(gè)待生成的構(gòu)建元素處停止分裂。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種存儲介質(zhì),該存儲介質(zhì)包括存儲的程序,其中,在程序運(yùn)行時(shí)控制存儲介質(zhì)所在設(shè)備執(zhí)行權(quán)上述檢測模型的構(gòu)建方法。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種處理器,該處理器用于運(yùn)行程序,其中,程序運(yùn)行時(shí)執(zhí)行上述檢測模型的構(gòu)建方法。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種終端,包括:一個(gè)或多個(gè)處理器,存儲器,顯示裝置以及一個(gè)或多個(gè)程序,其中,一個(gè)或多個(gè)程序被存儲在存儲器中,并且被配置為由一個(gè)或多個(gè)處理器執(zhí)行,一個(gè)或多個(gè)程序包括用于執(zhí)行上述檢測模型的構(gòu)建方法。
在本發(fā)明至少一實(shí)施例中,采用從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類,以及通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型的方式,利用從預(yù)設(shè)范圍內(nèi)新增的日志數(shù)據(jù)中提取到的待校驗(yàn)數(shù)據(jù),達(dá)到了用于檢測游戲外掛的檢測模型隨著時(shí)間變化而不斷重新構(gòu)建的目的,從而實(shí)現(xiàn)了降低構(gòu)建檢測模型的運(yùn)算量,滿足游戲數(shù)據(jù)的增量變化需求的技術(shù)效果,進(jìn)而解決了相關(guān)技術(shù)中所提供的游戲外掛檢測方案需要獲取完整的游戲數(shù)據(jù),計(jì)算量較大且無法滿足游戲數(shù)據(jù)的增量變化需求的技術(shù)問題。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1是根據(jù)本發(fā)明其中一實(shí)施例的檢測模型的構(gòu)建方法;
圖2是根據(jù)本發(fā)明其中一實(shí)施例的檢測模型的構(gòu)建裝置的結(jié)構(gòu)框圖;
圖3是根據(jù)本發(fā)明其中一優(yōu)選實(shí)施例的檢測模型的構(gòu)建裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本發(fā)明其中一實(shí)施例,提供了一種檢測模型的構(gòu)建方法的實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
圖1是根據(jù)本發(fā)明其中一實(shí)施例的檢測模型的構(gòu)建方法,如圖1所示,該方法包括如下步驟:
步驟s12,從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類,其中,待校驗(yàn)數(shù)據(jù)是從預(yù)設(shè)范圍內(nèi)新增的日志數(shù)據(jù)中提取的,多個(gè)信息類用于確定待使用的檢測模型,檢測模型用于檢測游戲中的異常行為(例如:在游戲中使用外掛);
步驟s16,通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型。
通過上述步驟,可以采用從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類,以及通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型的方式,利用從預(yù)設(shè)范圍內(nèi)新增的日志數(shù)據(jù)中提取到的待校驗(yàn)數(shù)據(jù),達(dá)到了用于檢測游戲外掛的檢測模型隨著時(shí)間變化而不斷重新構(gòu)建的目的,從而實(shí)現(xiàn)了降低構(gòu)建檢測模型的運(yùn)算量,滿足游戲數(shù)據(jù)的增量變化需求的技術(shù)效果,進(jìn)而解決了相關(guān)技術(shù)中所提供的游戲外掛檢測方案需要獲取完整的游戲數(shù)據(jù),計(jì)算量較大且無法滿足游戲數(shù)據(jù)的增量變化需求的技術(shù)問題。
可選地,在步驟s12中,從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類可以包括以下執(zhí)行步驟:
步驟s121,從游戲服務(wù)器提取日志數(shù)據(jù);
步驟s122,按照預(yù)設(shè)條件從日志數(shù)據(jù)中選取待校驗(yàn)數(shù)據(jù),其中,待校驗(yàn)數(shù)據(jù)包括:當(dāng)前采集到的多名游戲角色在相同時(shí)間維度下執(zhí)行的多種類型動(dòng)作數(shù)據(jù),每種類型動(dòng)作數(shù)據(jù)被分別設(shè)置為一個(gè)信息類。
上述日志數(shù)據(jù)可以是游戲服務(wù)器上提供的日志數(shù)據(jù)。待校驗(yàn)數(shù)據(jù)通常可以包括但不限于:登陸游戲、退出游戲、接受任務(wù)、完成任務(wù)、進(jìn)入地圖、退出地圖、領(lǐng)取多倍經(jīng)驗(yàn)、技能釋放、游戲角色a擊殺游戲角色b、游戲角色擊殺怪物、物品使用、掉落物品、掉落裝備、商品交易、進(jìn)入副本、退出副本、獲取金錢、使用金錢、升級記錄、經(jīng)驗(yàn)變化記錄。
每個(gè)游戲玩家控制的游戲角色會有產(chǎn)生多種動(dòng)作。為了捕捉這些動(dòng)作的動(dòng)作特征,首先需要采用特征向量來表示游戲角色在每個(gè)時(shí)間段上產(chǎn)生的動(dòng)作。此類統(tǒng)計(jì)方式(相當(dāng)于上述預(yù)設(shè)條件)有很多,其中,最簡單的方式即為統(tǒng)計(jì)每種動(dòng)作的發(fā)生頻率。除了頻率絕對值以外,還可以利用相對值(例如:特定游戲角色的動(dòng)作頻次除以全部游戲角色的動(dòng)作頻次之和)。
上述時(shí)間段可以由用戶自定義,其既可以按照自然的時(shí)間軸——年月日時(shí)分秒,也可以采用游戲內(nèi)的虛擬時(shí)間,將等級作為時(shí)間軸,游戲角色在每一級或連續(xù)多級發(fā)生動(dòng)作的頻次,諸如1~5級、6~10級、11~15級等。在選取數(shù)據(jù)的過程中,通常需要確保選取的游戲角色選到的時(shí)間跨度是一致的,以便進(jìn)行后續(xù)處理。例如:選取時(shí)間跨度在2017年1月1日~2017年1月30日這30天內(nèi)產(chǎn)生游戲數(shù)據(jù)的游戲角色,按照一天時(shí)間長度為周期統(tǒng)計(jì)動(dòng)作頻次等指標(biāo),或者,選取1~45級內(nèi)產(chǎn)生游戲數(shù)據(jù)的游戲角色。
需要說明的是,鑒于外掛數(shù)量通常會少于正常游戲角色的數(shù)量,因此,可以首先通過采樣的方式來平衡類別數(shù)量。例如:在數(shù)據(jù)挖掘領(lǐng)域中,將預(yù)設(shè)樣本集合劃分為外掛游戲角色與正常游戲角色兩類。如果這兩類游戲角色的比例差異過大,假設(shè)200個(gè)游戲角色中只有5個(gè)游戲角色為外掛游戲角色,而其余195個(gè)游戲角色均為正常游戲角色,那么便可將外掛游戲角色重復(fù)加入至上述預(yù)設(shè)樣本集合中,例如:將這5個(gè)外掛游戲角色重復(fù)放入預(yù)設(shè)樣本集合39次,然后再執(zhí)行后續(xù)的訓(xùn)練操作。
可選地,步驟s16,通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型可以包括以下執(zhí)行步驟:
步驟s161,通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,選取第一信息類和第二信息類,其中,第一信息類的信息增益為多個(gè)信息類的信息增益的最大值,第二信息類的信息增益為多個(gè)信息類的信息增益的次大值;
步驟s162,當(dāng)?shù)谝恍畔㈩惖男畔⒃鲆媾c第二信息類的信息增益的差值大于預(yù)設(shè)閾值時(shí),將第一信息類對應(yīng)的動(dòng)作數(shù)據(jù)設(shè)置為檢測模型的當(dāng)前構(gòu)建元素;
步驟s163,按照與第一信息類對應(yīng)的分裂條件,確定下個(gè)待生成的構(gòu)建元素,返回步驟s161。
下面將以檢測模型為增量決策二叉樹為例做進(jìn)一步說明,首先需要建立一個(gè)根節(jié)點(diǎn)(其也是通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較后得到的),在該根節(jié)點(diǎn)初始化一個(gè)統(tǒng)計(jì)量,標(biāo)記為aijk。對于每一個(gè)實(shí)例(x,y),x表示特定時(shí)間段內(nèi)特定游戲角色的動(dòng)作的特征向量,y表示該游戲角色是否屬于外掛游戲角色的判定值,其中,可以采用0表示正常游戲角色,可以采用1表示外掛游戲角色。然后,采用初始化條件下的決策樹先對該游戲角色進(jìn)行測試,然后再執(zhí)行下述hoeffding自適應(yīng)樹生長步驟。此處測試是為了得到準(zhǔn)確率、召回率等測試結(jié)果,以便將其作為判斷效果進(jìn)行輸出。
首先,將上述實(shí)例(x,y)先沿著已有的決策樹通過一條決策路徑達(dá)到特定的葉子節(jié)點(diǎn),然后,再更新這條路徑經(jīng)過的全部節(jié)點(diǎn)以及葉子節(jié)點(diǎn)的估計(jì)器aiik。如果當(dāng)前葉子節(jié)點(diǎn)存在一個(gè)可替換樹talt,那么這棵可替換樹也需要執(zhí)行對應(yīng)的hoeffding自適應(yīng)樹生長步驟。計(jì)算每個(gè)動(dòng)作的信息增益g,其作用在于評估葉子節(jié)點(diǎn)現(xiàn)在的條件是否適合執(zhí)行分裂操作。當(dāng)計(jì)算信息增益時(shí),需要使用到一個(gè)離散化的步驟。離散化是決策樹中的常見操作,無論是傳統(tǒng)決策樹還是增量式?jīng)Q策樹,這種操作主要針對于非離散值的屬性或者游戲角色動(dòng)作。所謂離散值就像男與女,或者小學(xué)、初中、高中、大學(xué)這樣可以采用有限數(shù)字標(biāo)記的值。在決策樹分裂時(shí),需要對連續(xù)值的屬性執(zhí)行離散化操作,以便得到不同的子節(jié)點(diǎn)。
如果這種動(dòng)作的值是連續(xù)值而不是離散值的話,可以采用一種穩(wěn)健的增量式的高斯離散化方法。在運(yùn)用這種增量式的高斯離散化方法之后,可以對連續(xù)值進(jìn)行離散化處理。如果信息增益最大的那個(gè)屬性(游戲角色產(chǎn)生動(dòng)作的次數(shù))的信息增益,減去第二大的那個(gè)屬性的信息增益的值大于
可選地,在步驟s16,通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型之前,還可以包括以下執(zhí)行步驟:
步驟s13,根據(jù)多個(gè)信息類中每個(gè)信息類的占有比例,分別計(jì)算每個(gè)信息類對應(yīng)的信息熵;
步驟s14,將每個(gè)信息類是否表征為游戲中的異常行為設(shè)置為判斷條件,分別計(jì)算每個(gè)信息類對應(yīng)的條件熵;
步驟s15,采用每個(gè)信息類對應(yīng)的信息熵與每個(gè)信息類對應(yīng)的條件熵,計(jì)算每個(gè)信息類的信息增益。
在優(yōu)選實(shí)施例中,信息增益的計(jì)算方式如下:對于一個(gè)分布,例如:一個(gè)特定數(shù)據(jù)集包括三個(gè)信息類:a類,b類和c類,每一個(gè)類別所占有的比例為p(a)=0.2,p(b)=0.3,p(c)=1-0.2-0.3=0.5,則信息熵h=-∑ipilog(pi),即0.2log(0.2)+0.3log(0.3)+0.5log(0.5)=0.301。在通常情況下,熵越小,數(shù)據(jù)集越有序。當(dāng)數(shù)據(jù)集只有一個(gè)類別時(shí),熵為0,這是熵的最小值,表示該數(shù)據(jù)集完全有序。在此基礎(chǔ)上,還有一個(gè)條件信息熵,h(y|x)=∑x∈xp(x)h(y|x=x),用于判斷游戲角色是否為外掛游戲角色,這個(gè)條件熵是對特定動(dòng)作(例如:游戲中進(jìn)入副本的次數(shù))劃分的一個(gè)描述。對于特定動(dòng)作劃分前后的熵的差值h(x)-h(y|x)即為信息增益。
可選地,在步驟s162,將第一信息類對應(yīng)的動(dòng)作數(shù)據(jù)設(shè)置為檢測模型的當(dāng)前構(gòu)建元素之后,還可以包括以下執(zhí)行步驟:
步驟s164,如果在當(dāng)前構(gòu)建元素處確定多個(gè)信息類中所包含的動(dòng)作數(shù)據(jù)分布發(fā)生變化,則創(chuàng)建與檢測模型關(guān)聯(lián)的替代模型,其中,替代模型包括:檢測模型中全部已生成的構(gòu)建元素。
如果變化檢測器(changedetector)確定數(shù)據(jù)分布發(fā)生變化。假設(shè)當(dāng)前存在動(dòng)作a、動(dòng)作b和動(dòng)作c。如果是外掛所控制的游戲角色,通過不會全部執(zhí)行這三種動(dòng)作,而往往會選擇耗費(fèi)時(shí)間段并且收益高的動(dòng)作(例如:動(dòng)作a)來執(zhí)行。但如果被發(fā)現(xiàn)游戲角色重復(fù)執(zhí)行動(dòng)作a是被游戲外掛所操控,那么很可能遭遇封號處罰。為此,游戲外掛開始控制該游戲角色重復(fù)執(zhí)行動(dòng)作b和動(dòng)作c,以達(dá)到規(guī)避處罰的目的。這樣,由重復(fù)執(zhí)行動(dòng)作a轉(zhuǎn)變?yōu)橹貜?fù)執(zhí)行動(dòng)作b和動(dòng)作c便會造成數(shù)據(jù)分布發(fā)生變化。
若葉子節(jié)點(diǎn)沒有可替換樹,則在葉子節(jié)點(diǎn)創(chuàng)建一個(gè)可替換樹talt;如果已經(jīng)存在可替換樹更精確,那么就將該葉子節(jié)點(diǎn)1替換為可替換樹talt。
需要說明的是,在創(chuàng)建可替換樹的葉子節(jié)點(diǎn)之前,原有樹與可替換樹所包含的節(jié)點(diǎn)內(nèi)容完全相同,而從創(chuàng)建可替換樹的葉子節(jié)點(diǎn)開始,原有樹與可替換樹各自獨(dú)立生長,其中,兩者可能包含相同內(nèi)容的節(jié)點(diǎn)。
可選地,在步驟s164中,在當(dāng)前構(gòu)建元素處確定多個(gè)信息類中所包含的動(dòng)作數(shù)據(jù)分布發(fā)生變化可以包括以下執(zhí)行步驟:
步驟s1641,將多名游戲角色中每名游戲角色對應(yīng)的動(dòng)作屬性值添加至滑動(dòng)窗口,其中,動(dòng)作屬性值表示每名游戲角色所執(zhí)行的動(dòng)作是否異常(例如:被游戲外掛所操控);
步驟s1642,將滑動(dòng)窗口劃分為第一部分子窗口和第二部分子窗口;
步驟s1643,當(dāng)確定第一參數(shù)值與第二參數(shù)值之間的差值的絕對值大于或等于預(yù)設(shè)閾值時(shí),持續(xù)丟棄最新添加至滑動(dòng)窗口的數(shù)據(jù),并確定動(dòng)作數(shù)據(jù)分布發(fā)生變化,直至絕對值小于預(yù)設(shè)閾值,其中,第一參數(shù)值為第一部分子窗口內(nèi)的數(shù)據(jù)平均值,第二參數(shù)值為第二部分子窗口內(nèi)的數(shù)據(jù)平均值。
在具體實(shí)現(xiàn)過程中,首先可以初始化滑動(dòng)窗口w。每個(gè)滑動(dòng)窗口內(nèi)包含的是由0與1組成的序列,其中,1表示對應(yīng)的特征向量為外掛特征向量,0表示對應(yīng)的特征向量為正常特征向量。每當(dāng)獲取到一個(gè)新的特征向量,便可以在滑動(dòng)窗口內(nèi)插入0或者1,以便采用窗口內(nèi)的0和1計(jì)算方差與總數(shù)。
然后,對滑動(dòng)窗口w進(jìn)行任意分割,以使得w=w0+w1,如果不能滿足條件
其中,
每當(dāng)獲取到一個(gè)新的特征向量,便可以更新統(tǒng)計(jì)信息,通過動(dòng)態(tài)地調(diào)整滑動(dòng)窗口大小,來確?;瑒?dòng)窗口盡可能大,并且滑動(dòng)窗口內(nèi)的數(shù)據(jù)分布趨于一致。另外,如果存在丟棄的實(shí)例,那么便可以將發(fā)生變化的數(shù)據(jù)分布通知給變化檢測器。
可選地,在步驟s164,創(chuàng)建替代模型之后,還可以包括以下執(zhí)行步驟:
步驟s165,采用預(yù)設(shè)判定指標(biāo)對檢測模型和替代模型進(jìn)行比較,其中,預(yù)設(shè)判定指標(biāo)包括以下至少之一:召回率、準(zhǔn)確率;
步驟s166,當(dāng)判定結(jié)果顯示替代模型優(yōu)于檢測模型時(shí),則采用替代模型對檢測模型進(jìn)行替換。
召回率是指正確被檢測出的外掛數(shù)量占所有應(yīng)當(dāng)被檢測出的外掛數(shù)量的比例。假設(shè)預(yù)先設(shè)置的待檢測的特征向量的數(shù)量為500,正常特征向量的數(shù)量為420,外掛特征向量的數(shù)量為80,如果最后檢測出的疑似外掛的特征向量數(shù)量為100,其中,60個(gè)特征向量為外掛特征向量,40個(gè)特征向量為外掛特征向量,那么召回率即為60與80的比值,即75%。
準(zhǔn)確率是指正確被檢測出的外掛數(shù)量占實(shí)際被檢測出的外掛數(shù)量的比例。假設(shè)預(yù)先設(shè)置的待檢測的特征向量的數(shù)量為500,正常特征向量的數(shù)量為420,外掛特征向量的數(shù)量為80,如果最后檢測出的疑似外掛的特征向量數(shù)量為100,那么準(zhǔn)確率即為80與100的比值,即80%。
通過召回率和準(zhǔn)確率中至少之一可以判定替代模型與檢測模型之間的優(yōu)劣,進(jìn)而確定是否需要采用替代模型來替換檢測模型。
可選地,在步驟s163,確定下個(gè)待生成的構(gòu)建元素之后,還包括以下執(zhí)行步驟:
步驟s167,獲取控制命令,其中,控制命令用于指示在下個(gè)待生成的構(gòu)建元素處停止分裂。
如果需要達(dá)到停止節(jié)點(diǎn)(即下個(gè)待生成的構(gòu)建元素)分裂的效果,只需在判斷分裂處設(shè)置一個(gè)特定條件,使得判斷結(jié)果永遠(yuǎn)為false(相當(dāng)于上述控制命令),即可停止分裂。例如:在游戲角色a日常進(jìn)入副本的次數(shù)為5次,但是在某些時(shí)段突然增加至50次,那么該游戲角色a所執(zhí)行的進(jìn)入副本操作很有可能是通過游戲外掛操控的。但是,如果為了迎接特定節(jié)日(例如:春節(jié)、國慶節(jié)),游戲內(nèi)退出特定獎(jiǎng)勵(lì),例如:副本內(nèi)得到極品裝備的概率增加,或者在副本內(nèi)可以得到雙倍經(jīng)驗(yàn)值,抑或是在副本內(nèi)設(shè)置稀有boss,那么在此時(shí)間段內(nèi)進(jìn)入副本的次數(shù)由5次突然增加至50次的現(xiàn)象屬于正常操作,而無需繼續(xù)執(zhí)行分裂操作。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種檢測模型的構(gòu)建裝置的實(shí)施例,圖2是根據(jù)本發(fā)明其中一實(shí)施例的檢測模型的構(gòu)建裝置的結(jié)構(gòu)框圖。如圖2所示,該裝置可以包括:獲取模塊10,用于從待校驗(yàn)數(shù)據(jù)中獲取多個(gè)信息類,其中,待校驗(yàn)數(shù)據(jù)是從預(yù)設(shè)范圍內(nèi)新增的日志數(shù)據(jù)中提取的,多個(gè)信息類用于確定待使用的檢測模型,檢測模型用于檢測游戲中的異常行為;構(gòu)建模塊20,用于通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,構(gòu)建檢測模型。
可選地,獲取模塊10包括:提取單元(圖中未示出),用于從游戲服務(wù)器提取日志數(shù)據(jù);獲取單元(圖中未示出),用于按照預(yù)設(shè)條件從日志數(shù)據(jù)中選取待校驗(yàn)數(shù)據(jù),其中,待校驗(yàn)數(shù)據(jù)包括:當(dāng)前采集到的多名游戲角色在相同時(shí)間維度下執(zhí)行的多種類型動(dòng)作數(shù)據(jù),每種類型動(dòng)作數(shù)據(jù)被分別設(shè)置為一個(gè)信息類。
可選地,構(gòu)建模塊20可以包括:比較單元(圖中未示出),用于通過對多個(gè)信息類中每個(gè)信息類的信息增益進(jìn)行比較,選取第一信息類和第二信息類,其中,第一信息類的信息增益為多個(gè)信息類的信息增益的最大值,第二信息類的信息增益為多個(gè)信息類的信息增益的次大值;處理單元(圖中未示出),用于當(dāng)?shù)谝恍畔㈩惖男畔⒃鲆媾c第二信息類的信息增益的差值大于預(yù)設(shè)閾值時(shí),將第一信息類對應(yīng)的動(dòng)作數(shù)據(jù)設(shè)置為檢測模型的當(dāng)前構(gòu)建元素;分裂單元(圖中未示出),用于按照與第一信息類對應(yīng)的分裂條件,確定下個(gè)待生成的構(gòu)建元素,返回比較單元。
可選地,圖3是根據(jù)本發(fā)明其中一優(yōu)選實(shí)施例的檢測模型的構(gòu)建裝置的結(jié)構(gòu)框圖。如圖3所示,上述裝置還可以包括:第一計(jì)算模塊30,用于根據(jù)多個(gè)信息類中每個(gè)信息類的占有比例,分別計(jì)算每個(gè)信息類對應(yīng)的信息熵;第二計(jì)算模塊40,用于將每個(gè)信息類是否表征為游戲中的異常行為設(shè)置為判斷條件,分別計(jì)算每個(gè)信息類對應(yīng)的條件熵;第三計(jì)算模塊50,用于采用每個(gè)信息類對應(yīng)的信息熵與每個(gè)信息類對應(yīng)的條件熵,計(jì)算每個(gè)信息類的信息增益。
可選地,處理單元,還用于如果在當(dāng)前構(gòu)建元素處確定多個(gè)信息類中所包含的動(dòng)作數(shù)據(jù)分布發(fā)生變化,則創(chuàng)建與檢測模型關(guān)聯(lián)的替代模型,其中,替代模型包括:檢測模型中全部已生成的構(gòu)建元素。
可選地,處理單元可以包括:添加子單元(圖中未示出),用于將多名游戲角色中每名游戲角色對應(yīng)的動(dòng)作屬性值添加至滑動(dòng)窗口,其中,動(dòng)作屬性值表示每名游戲角色所執(zhí)行的動(dòng)作是否異常;劃分子單元(圖中未示出),用于將滑動(dòng)窗口劃分為第一部分子窗口和第二部分子窗口;處理子單元(圖中未示出),用于當(dāng)確定第一參數(shù)值與第二參數(shù)值之間的差值的絕對值大于或等于預(yù)設(shè)閾值時(shí),持續(xù)丟棄最新添加至滑動(dòng)窗口的數(shù)據(jù),并確定動(dòng)作數(shù)據(jù)分布發(fā)生變化,直至絕對值小于預(yù)設(shè)閾值,其中,第一參數(shù)值為第一部分子窗口內(nèi)的數(shù)據(jù)平均值,第二參數(shù)值為第二部分子窗口內(nèi)的數(shù)據(jù)平均值。
可選地,構(gòu)建模塊20還可以包括:比較單元(圖中未示出),用于采用預(yù)設(shè)判定指標(biāo)對檢測模型和替代模型進(jìn)行比較,其中,預(yù)設(shè)判定指標(biāo)包括以下至少之一:召回率、準(zhǔn)確率;替換單元(圖中未示出),用于當(dāng)判定結(jié)果顯示替代模型優(yōu)于檢測模型時(shí),則采用替代模型對檢測模型進(jìn)行替換。
可選地,分裂單元,還用于在確定下個(gè)待生成的構(gòu)建元素之后,獲取控制命令,其中,控制命令用于指示在下個(gè)待生成的構(gòu)建元素處停止分裂。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種存儲介質(zhì),存儲介質(zhì)包括存儲的程序,其中,在程序運(yùn)行時(shí)控制存儲介質(zhì)所在設(shè)備執(zhí)行上述檢測模型的構(gòu)建方法。上述存儲介質(zhì)可以包括但不限于:u盤、只讀存儲器(rom)、隨機(jī)存取存儲器(ram)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種處理器,處理器用于運(yùn)行程序,其中,程序運(yùn)行時(shí)執(zhí)行上述檢測模型的構(gòu)建方法。上述處理器可以包括但不限于:微處理器(mcu)或可編程邏輯器件(fpga)等的處理裝置。
根據(jù)本發(fā)明其中一實(shí)施例,還提供了一種終端,包括:一個(gè)或多個(gè)處理器,存儲器,顯示裝置以及一個(gè)或多個(gè)程序,其中,一個(gè)或多個(gè)程序被存儲在存儲器中,并且被配置為由一個(gè)或多個(gè)處理器執(zhí)行,程序包括用于執(zhí)行上述檢測模型的構(gòu)建方法。在一些實(shí)施例中,上述終端可以是智能手機(jī)(例如:android手機(jī)、ios手機(jī)等)、平板電腦、掌上電腦以及移動(dòng)互聯(lián)網(wǎng)設(shè)備(mobileinternetdevices,簡稱為mid)、pad等終端設(shè)備。上述顯示裝置可以是觸摸屏式的液晶顯示器(lcd),該液晶顯示器可使得用戶能夠與終端的用戶界面進(jìn)行交互。此外,上述終端還可以包括:輸入/輸出接口(i/o接口)、通用串行總線(usb)端口、網(wǎng)絡(luò)接口、電源和/或相機(jī)。
上述本發(fā)明實(shí)施例序號僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
在本發(fā)明的上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個(gè)存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。