本發(fā)明涉及互聯(lián)網(wǎng)領域,具體而言,涉及一種用戶行為的風險評估方法及裝置。
背景技術:
隨著互聯(lián)網(wǎng)的飛速發(fā)展,越來越多的用戶會在互聯(lián)網(wǎng)上產(chǎn)生一些用戶行為,例如,用戶在某個網(wǎng)站執(zhí)行了搜索、瀏覽、打分、購買等行為。隨著各種用戶行為的產(chǎn)生,基于用戶行為的風險評估也就應運而生,用戶行為的風險評估是指由于用戶可能會利用系統(tǒng)漏洞或者用戶被盜號,非本人操作時,用戶行為和平時有區(qū)分度,通過計算區(qū)分度來判別該用戶是否異常。
現(xiàn)有技術的用戶行為的風險評估方法一般是根據(jù)用戶行為頻率來進行判斷,然而,如果僅基于用戶行為頻率進行用戶行為的風險評估,那么在一些特殊的情況下,例如受到雙11,大促銷等的影響,會判斷出很多用戶出現(xiàn)異常,即風險評估結果錯誤率較高,造成用戶行為的風險評估準確性較低的問題。
針對上述的問題,目前尚未提出有效的解決方案。
技術實現(xiàn)要素:
本發(fā)明實施例提供了一種用戶行為的風險評估方法及裝置,以至少解決現(xiàn)有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種用戶行為的風險評估方法,包括:獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;獲取上述用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,上述反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,上述第一總數(shù)是指在上述第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,上述第二總數(shù)是指在上述第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;根據(jù)上述用戶行為頻率以及上述反轉(zhuǎn)行為頻率,得到上述第一行為對應的第一特征值;根據(jù)上述第一行為對應的上述第一特征值,計算上述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基于上述特征比例以及預先獲取的用戶行為參數(shù),得到上述第一 賬戶在上述第一預設時間段內(nèi)執(zhí)行上述第一行為的風險評估結果。
根據(jù)本發(fā)明實施例的另一方面,還提供了一種用戶行為的風險評估裝置,包括:第一獲取單元,用于獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;第二獲取單元,用于獲取上述用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,上述反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,上述第一總數(shù)是指在上述第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,上述第二總數(shù)是指在上述第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;處理單元,用于根據(jù)上述用戶行為頻率以及上述反轉(zhuǎn)行為頻率,得到上述第一行為對應的第一特征值;第一計算單元,用于根據(jù)上述第一行為對應的上述第一特征值,計算上述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;風險評估單元,用于基于上述特征比例以及預先獲取的用戶行為參數(shù),得到上述第一賬戶在上述第一預設時間段內(nèi)執(zhí)行上述第一行為的風險評估結果。
在本發(fā)明實施例中,采用獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;獲取用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,第一總數(shù)是指在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,第二總數(shù)是指在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;根據(jù)用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為對應的第一特征值;根據(jù)第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基于特征比例以及預先獲取的用戶行為參數(shù),得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果的方式,通過獲取第一賬戶的用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為的特征比例,進而基于預先獲取的用戶行為參數(shù)得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實現(xiàn)了增加風險評估正確率的技術效果,進而解決了現(xiàn)有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
圖1是根據(jù)本發(fā)明實施例的一種運行用戶行為的風險評估方法的計算機終端的硬件結構框圖;
圖2是根據(jù)本發(fā)明實施例的一種可選的用戶行為的風險評估方法的流程示意圖;
圖3是根據(jù)本發(fā)明實施例的另一種可選的用戶行為的風險評估方法的流程示意圖;
圖4是根據(jù)本發(fā)明實施例的又一種可選的用戶行為的風險評估方法的流程示意圖;
圖5是根據(jù)本發(fā)明實施例的一種可選的用戶行為的風險評估裝置的結構示意圖;
圖6是根據(jù)本發(fā)明實施例的一種可選的第一獲取單元的結構示意圖;
圖7是根據(jù)本發(fā)明實施例的一種可選的第二獲取單元的結構示意圖;
圖8是根據(jù)本發(fā)明實施例的另一種可選的用戶行為的風險評估裝置的結構示意圖;
圖9是根據(jù)本發(fā)明實施例的一種可選的創(chuàng)建單元的結構示意圖。
具體實施方式
為了使本技術領域的人員更好地理解本發(fā)明方案,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分的實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本發(fā)明保護的范圍。
需要說明的是,本發(fā)明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
實施例1
根據(jù)本發(fā)明實施例,還提供了一種用戶行為的風險評估方法的方法實施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
本申請實施例一所提供的方法實施例可以在移動終端、計算機終端或者類似的運算裝置中執(zhí)行。以運行在計算機終端上為例,圖1是本發(fā)明實施例的一種用戶行為的 風險評估方法的計算機終端的硬件結構框圖。如圖1所示,計算機終端10可以包括一個或多個(圖中僅示出一個)處理器102(處理器102可以包括但不限于微處理器MCU或可編程邏輯器件FPGA等的處理裝置)、用于存儲數(shù)據(jù)的存儲器104、以及用于通信功能的傳輸裝置106。本領域普通技術人員可以理解,圖1所示的結構僅為示意,其并不對上述電子裝置的結構造成限定。例如,計算機終端10還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。
存儲器104可用于存儲應用軟件的軟件程序以及模塊,如本發(fā)明實施例中的用戶行為的風險評估方法對應的程序指令/模塊,處理器102通過運行存儲在存儲器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應用以及數(shù)據(jù)處理,即實現(xiàn)上述的應用程序的漏洞檢測方法。存儲器104可包括高速隨機存儲器,還可包括非易失性存儲器,如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態(tài)存儲器。在一些實例中,存儲器104可進一步包括相對于處理器102遠程設置的存儲器,這些遠程存儲器可以通過網(wǎng)絡連接至計算機終端10。上述網(wǎng)絡的實例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。
傳輸裝置106用于經(jīng)由一個網(wǎng)絡接收或者發(fā)送數(shù)據(jù)。上述的網(wǎng)絡具體實例可包括計算機終端10的通信供應商提供的無線網(wǎng)絡。在一個實例中,傳輸裝置106包括一個網(wǎng)絡適配器(Network Interface Controller,NIC),其可通過基站與其他網(wǎng)絡設備相連從而可與互聯(lián)網(wǎng)進行通訊。在一個實例中,傳輸裝置106可以為射頻(Radio Frequency,RF)模塊,其用于通過無線方式與互聯(lián)網(wǎng)進行通訊。
在上述運行環(huán)境下,本申請?zhí)峁┝巳鐖D2所示的用戶行為的風險評估方法。圖2是根據(jù)本發(fā)明實施例一的用戶行為的風險評估方法的流程圖。
如圖2所示,該用戶行為的風險評估方法可以包括如下實現(xiàn)步驟:
步驟S202,獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率。
本申請上述步驟S202中第一行為即用戶行為,可以包括用戶在網(wǎng)站上發(fā)生的所有行為,如搜索、瀏覽、打分、點評、加入購物車、取出購物筐、加入期待列表(WishList)、購買、使用減價券和退貨等;甚至可以包括在第三方網(wǎng)站上的相關行為,如比價、看相關評測、參與討論、社交媒體上的交流、與好友互動等。
其中,本發(fā)明實施例的用戶行為的風險評估裝置在對第一賬戶進行用戶行為的風險評估時,可以按天、周、月或任意時間區(qū)間獲取第一賬戶的行為數(shù)據(jù),即獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行的第一行為,這里的第一行為實質(zhì)上可以是一個事件組 合,即包括具體行為和對象,如第一行為可以是購買-生活用品或瀏覽-頁面等。
用戶行為的風險評估裝置在獲取了第一賬戶在第一預設時間段內(nèi)執(zhí)行的第一行為之后,可以計算其對應的用戶行為頻率(Behaviour Frequency,BF)。對于第一賬戶,用戶行為頻率是指時間窗口內(nèi)的一個行為出現(xiàn)的次數(shù)除以時間窗口內(nèi)的該第一賬戶的所有行為的總數(shù),其中,時間窗口即上述的第一預設時間段。
以第一行為包括“購買-生活用品”為例,第一賬戶在第一預設時間內(nèi)的所有行為的總數(shù)是100個,而在第一預設時間段內(nèi)“購買-生活用品”出現(xiàn)了3次,那么“購買-生活用品”的用戶行為頻率為3/100=0.03。
步驟S204,獲取用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,第一總數(shù)是指在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,第二總數(shù)是指在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量。
本申請上述步驟S204中,反轉(zhuǎn)行為頻率(Inverse Behaviour Frequency,IBF)是指時間窗口內(nèi)所有賬戶執(zhí)行“購買-生活用品”的數(shù)量,除以時間窗口內(nèi)所有賬戶的所有行為的總數(shù)。
仍舊以第一行為包括“購買-生活用品”為例,在第一預設時間段內(nèi),如果“購買-生活用品”出現(xiàn)過1,000次,而該第一預設時間段內(nèi)的所有賬戶的所有行為的總數(shù)是10,000,000個的話,其反轉(zhuǎn)行為頻率為lg(10,000,000/1,000)=4。
步驟S206,根據(jù)用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為對應的第一特征值。
本申請上述步驟S206中,第一特征值可以作為第一賬戶的分類或者聚類的重要特征,本發(fā)明實施例中,可以通過將上述得到的用戶行為頻率乘以上述得到的反轉(zhuǎn)行為頻率,進而得到第一行為對應的第一特征值,其中,第一特征值越大,則說明該第一行為越明顯。
仍以第一行為包括“購買-生活用品”為例,根據(jù)上述得出的用戶行為頻率為0.03,反轉(zhuǎn)行為頻率為4,得到第一特征值為BF*IBF=0.03*4=0.12。
需要說明的是,這里只是以第一行為包括“購買-生活用品”為例進行說明,當?shù)谝恍袨檫€包括其他行為時,如“瀏覽-頁面”,其計算方法與上述方法相同,此處不做贅述。
步驟S208,根據(jù)第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有 行為的特征值中所占的特征比例。
本申請上述步驟S208中,用戶行為的風險評估裝置在基于用戶行為頻率以及反轉(zhuǎn)行為頻率得到第一行為對應的第一特征值之后,需要計算出第一特征值在所有賬戶的所有行為的特征值中所占的特征比例,以便后續(xù)作為風險評估的輸入?yún)?shù)。
其中,上述的所有賬戶的所有行為的特征值均可以按照上述步驟S202至步驟S206所述的方法進行計算,此處不再贅述。
步驟S210,基于特征比例以及預先獲取的用戶行為參數(shù),得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果。
本申請上述步驟S210中,預先獲取的用戶行為參數(shù)可以包括條件概率參數(shù)以及分類比例,其中,條件概率參數(shù)以及分類比例是通過預先創(chuàng)建訓練樣本集合,并基于樸素貝葉斯模型得到的,具體方法后續(xù)實施例中會進行詳細描述。
本發(fā)明實施例的用戶行為的風險評估裝置基于特征比例以及預先獲取的用戶行為參數(shù),即可以對第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為進行風險評估。
由上可知,本申請上述實施例一所提供的方案,通過獲取第一賬戶的用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為的特征比例,進而基于預先獲取的用戶行為參數(shù)得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實現(xiàn)了增加風險評估正確率的技術效果,進而解決了現(xiàn)有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。
本申請上述實施例提供的一種可選方案中,上述步驟S202,獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率,可以包括:
S20,確定第三總數(shù)和第四總數(shù),其中,第三總數(shù)是指第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的數(shù)量,第四總數(shù)是指第一賬戶在第一預設時間段內(nèi)的所有行為的數(shù)量。
本申請上述步驟S20中,用戶行為的風險評估裝置在要獲取第一賬戶在第一時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率時,需要獲得兩個數(shù)據(jù),其一為第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的數(shù)量,即第三總數(shù),其二為第一賬戶在第一預設時間段內(nèi)的所有行為的數(shù)量,即第四總數(shù)。
仍舊以第一行為包括“購買-生活用品”為例,第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的數(shù)量,即第三總數(shù)為3,第一賬戶在第一預設時間段內(nèi)的所有行為的數(shù)量, 即第四總數(shù)為100。
S22,依據(jù)第三總數(shù)和第四總數(shù),計算用戶行為頻率。
本申請上述步驟S20中,用戶行為的風險評估裝置在確定了第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的數(shù)量以及第一賬戶在第一預設時間段內(nèi)的所有行為的數(shù)量之后,可以依據(jù)該第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的數(shù)量以及第一賬戶在第一預設時間段內(nèi)的所有行為的數(shù)量計算用戶行為頻率。
仍舊以第一行為包括“購買-生活用品”為例,由于用戶行為的風險評估裝置確定第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的數(shù)量,即第三總數(shù)為3,第一賬戶在第一預設時間段內(nèi)的所有行為的數(shù)量,即第四總數(shù)為100,那么用戶行為頻率即為3/100=0.03。
本申請上述實施例提供的一種可選方案中,上述步驟S204,獲取用戶行為頻率對應的反轉(zhuǎn)行為頻率,可以包括:
S30,確定第一總數(shù)和第二總數(shù)。
本申請上述步驟S30中,用戶行為的風險評估裝置在要獲取用戶行為頻率對應的反轉(zhuǎn)行為頻率時,需要獲得兩個數(shù)據(jù),其一為在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,即第一總數(shù),其二為在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量,即第二總數(shù)。
仍舊以第一行為包括“購買-生活用品”為例,在第一預設時間段內(nèi),如果“購買-生活用品”出現(xiàn)過1,000次,而該第一預設時間段內(nèi)的所有賬戶的所有行為的總數(shù)是10,000,000個,那么在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,即第一總數(shù)為1,000,在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量,即第二總數(shù)為10,000,000。
S32,通過公式I=lg(k/q),計算反轉(zhuǎn)行為頻率,其中,I表示反轉(zhuǎn)行為頻率,k表示第二總數(shù),q表示第一總數(shù)。
本申請上述步驟S20中,用戶行為的風險評估裝置在確定了在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量以及在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量之后,可以依據(jù)該在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量以及在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量計算反轉(zhuǎn)行為頻率。
仍舊以第一行為包括“購買-生活用品”為例,由于用戶行為的風險評估裝置確定在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,即第一總數(shù)為1,000,在第一預設 時間段內(nèi)所有賬戶的所有行為的數(shù)量,即第二總數(shù)為10,000,000,那么用戶行為頻率即為lg(10,000,000/1,000)=4。
本申請上述實施例提供的一種可選方案中,上述步驟S206,根據(jù)第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例,可以包括:
通過公式得到第一特征值在所有賬戶的所有行為的特征值中所占的特征比例,其中,aj表示第一特征值,P(aj)用于表示aj在所有賬戶的所有行為的特征值所占的特征比例,j為大于0的整數(shù)。
可選地,依據(jù)第三總數(shù)和第四總數(shù),計算用戶行為頻率,包括:將第三總數(shù)除以第四總數(shù),得到用戶行為頻率。
可選地,根據(jù)用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為對應的第一特征值,包括:將用戶行為頻率乘以反轉(zhuǎn)行為頻率,得到第一行為對應的第一特征值。
本申請上述實施例提供的一種可選方案中,如圖3所示,在預先獲取的用戶行為參數(shù)包括條件概率參數(shù)以及分類比例的情況下,獲取條件概率參數(shù)以及分類比例的步驟可以包括:
S302,創(chuàng)建訓練樣本集合,其中,訓練樣本集合至少包括一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽。
本申請上述步驟S302中,用戶行為的風險評估裝置在對第一賬戶在第一預設時間段內(nèi)執(zhí)行的第一行為進行風險評估之前,可以創(chuàng)建訓練樣本集合,建立基于樸素貝葉斯的模型。
其中,訓練樣本集合至少包括一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,與上述第一特征值的計算過程類似的,訓練樣本集合中的至少一個樣本特征值也可以是由樣本賬戶的樣本行為對應的樣本用戶行為頻率以及樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率得到的??蛇x地,風險評估標簽可以是0或1,例如0表示無風險,1表示有風險。
可選地,上述步驟S302創(chuàng)建訓練樣本集合,其中,訓練樣本集合至少包括一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,可以包括:
S40,獲取在第二預設時間段內(nèi)至少一個樣本賬戶的至少一個樣本用戶行為。
本申請上述步驟S40中,用戶行為的風險評估裝置所創(chuàng)建的訓練樣本集合,也是基于某一時間段的某些用戶的行為,為了上述第一賬戶、第一行為進行區(qū)分,這里我們將訓練樣本集合中的賬戶稱為樣本賬戶,將行為稱為樣本用戶行為,其中,樣本用戶行為同樣可以包括用戶在網(wǎng)站上發(fā)生的所有行為,如搜索、瀏覽、打分、點評、加入購物車、取出購物筐、加入期待列表、購買、使用減價券和退貨等;甚至可以包括在第三方網(wǎng)站上的相關行為,如比價、看相關評測、參與討論、社交媒體上的交流、與好友互動等。
S42,計算至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率,其中,樣本反轉(zhuǎn)行為頻率是根據(jù)第五總數(shù)和第六總數(shù)得到的,第五總數(shù)是指在第二預設時間段內(nèi)所有賬戶的至少一個樣本用戶行為的數(shù)量以及在第二預設時間段內(nèi)所有賬戶的所有行為的總數(shù)得到的。
本申請上述步驟S42中,與上述過程類似的,用戶行為的風險評估裝置在獲取了在第二預設時間段內(nèi)至少一個樣本賬戶的至少一個樣本用戶行為之后,需要計算至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率,其中,樣本反轉(zhuǎn)行為頻率是根據(jù)第五總數(shù)和第六總數(shù)得到的,第五總數(shù)是指在第二預設時間段內(nèi)所有賬戶的至少一個樣本用戶行為的數(shù)量以及在第二預設時間段內(nèi)所有賬戶的所有行為的總數(shù)得到的。
可選地,計算至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率,可以包括:
在第二預設時間段內(nèi)至少一個樣本賬戶的至少一個樣本用戶行為的數(shù)量除以在第二預設時間段內(nèi)至少一個樣本賬戶的所有行為的數(shù)量,得到至少一個樣本用戶行為的樣本用戶行為頻率;以及通過公式I′=lg(k′/q′),計算樣本反轉(zhuǎn)行為頻率,其中,I′表示樣本反轉(zhuǎn)行為頻率,k′表示第五總數(shù),q′表示第六總數(shù)。
S44,根據(jù)樣本用戶行為頻率以及樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征值。
本申請上述步驟S44中,與上述過程類似的,用戶行為的風險評估裝置在計算出至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率之后,可以根據(jù)樣本用戶行為頻率以及樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征值。
可選地,根據(jù)樣本用戶行為頻率以及樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征 值,包括:將樣本用戶行為頻率乘以樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征值。
S46,依據(jù)至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽創(chuàng)建訓練樣本集合。
本申請上述步驟S46中,用戶行為的風險評估裝置在得到上述至少一個樣本特征值之后,基于至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽創(chuàng)建訓練樣本集合。
需要補充的是,在得到至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽之后,用戶行為的風險評估裝置還可以對該至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽進行優(yōu)化,即可以在至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽所構成的集合中先有放回的抽取T份數(shù)據(jù),每份數(shù)據(jù)包括N個樣本特征值及其對應的風險評估標簽,再對每份數(shù)據(jù)無放回抽取M個樣本特征值及其對應的風險評估標簽,M=Z1/2,其中Z為總的樣本特征值的數(shù)量,T的值略大于Z的值,例如Z=400,T=500,進而得到上述訓練樣本集合,然而,本發(fā)明實施例對此并不做限定。
S304,根據(jù)至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,得到條件概率參數(shù)以及分類比例。
本申請上述步驟S304中,與上述過程類似的,用戶行為的風險評估裝置在得到至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽之后,可以根據(jù)至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,得到上述條件概率參數(shù)以及分類比例。
可選地,步驟S304根據(jù)至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,得到條件概率參數(shù)以及分類比例,可以包括:
通過公式得到條件概率參數(shù),其中,P(a′j|ci)用于表示a′j屬于ci的條件概率參數(shù),a′j表示樣本特征值,ci表示風險評估標簽,Count(a′j|ci)表示屬于ci出現(xiàn)a′j的次數(shù),Count(ci)表示屬于ci的次數(shù),其中,0<j<n,n為訓練樣本集合中的樣本總數(shù),0<i<m,m為風險評估標簽的種類數(shù),i,j均為整數(shù);以及
通過公式得到分類比例,其中,P(ci)用于表示ci在所有風險 評估標簽中所占的分類比例。
本申請上述實施例提供的一種可選方案中,上述步驟S210,基于特征比例以及預先獲取的用戶行為參數(shù),得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果,可以包括:
S50,通過公式得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果,其中,cMAP為第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果。
本申請上述步驟S50中,用戶行為的風險評估裝置在得到P(aj)之后,基于通過訓練樣本集合得到的P(a′j|cj)和P(ci),得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果cMAP。
下面結合圖4,對本發(fā)明實施例的用戶行為的風險評估方法進行描述:
步驟A,采集第二預設時間段內(nèi)的樣本賬戶的樣本行為。
其中,用戶行為的風險評估裝置所創(chuàng)建的訓練樣本集合,也是基于某一時間段的某些用戶的行為,為了上述第一賬戶、第一行為進行區(qū)分,這里我們將訓練樣本集合中的賬戶稱為樣本賬戶,將行為稱為樣本用戶行為,其中,樣本用戶行為同樣可以包括用戶在網(wǎng)站上發(fā)生的所有行為,如搜索、瀏覽、打分、點評、加入購物車、取出購物筐、加入期待列表、購買、使用減價券和退貨等;甚至可以包括在第三方網(wǎng)站上的相關行為,如比價、看相關評測、參與討論、社交媒體上的交流、與好友互動等。
步驟B,計算樣本BF和樣本IBF。
其中,在第二預設時間段內(nèi)至少一個樣本賬戶的至少一個樣本用戶行為的數(shù)量除以在第二預設時間段內(nèi)至少一個樣本賬戶的所有行為的數(shù)量,得到至少一個樣本用戶行為的樣本用戶行為頻率;以及通過公式I′=lg(k′/q′),計算樣本反轉(zhuǎn)行為頻率,其中,I′表示樣本反轉(zhuǎn)行為頻率,k′表示第五總數(shù),q′表示第六總數(shù)。
步驟C,匯總樣本BF*樣本IBF及其對應的風險評估標簽,創(chuàng)建訓練樣本集合。
其中,用戶行為的風險評估裝置在計算出至少一個樣本用戶行為的樣本用戶行為 頻率,以及樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率之后,可以根據(jù)樣本用戶行為頻率以及樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征值。
可選地,根據(jù)樣本用戶行為頻率以及樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征值,包括:將樣本用戶行為頻率乘以樣本反轉(zhuǎn)行為頻率,得到至少一個樣本特征值。
用戶行為的風險評估裝置在得到上述至少一個樣本特征值之后,基于至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽創(chuàng)建訓練樣本集合。
步驟D,基于訓練樣本集得到用戶行為參數(shù)。
其中,用戶行為參數(shù)包括條件概率參數(shù)以及分類比例。
具體地,通過公式得到條件概率參數(shù),其中,P(a′j|ci)用于表示a′j屬于ci的條件概率參數(shù),a′j表示樣本特征值,ci表示風險評估標簽,Count(a′j|ci)表示屬于ci出現(xiàn)a′j的次數(shù),Count(ci)表示屬于ci的次數(shù),其中,0<j<n,n為訓練樣本集合中的樣本總數(shù),0<i<m,m為風險評估標簽的種類數(shù),i,j均為整數(shù);以及
通過公式得到分類比例,其中,P(ci)用于表示ci在所有風險評估標簽中所占的分類比例。
步驟E,對第一賬戶在第一預設時間段第一行為進行風險評估。
其中,與上述步驟S202至步驟S210相同的,用戶行為的風險評估裝置可以對第一賬戶在第一預設時間段第一行為進行風險評估,得到第一賬戶在第一預設時間段第一行為的風險評估結果。
在本發(fā)明實施例中,采用獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;獲取用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,第一總數(shù)是指在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,第二總數(shù)是指在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;根據(jù)用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為對應的第一特征值;根據(jù)第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基于特征比例以及預先獲取的用戶行為參數(shù),得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果的方式,通過獲取第一賬戶的用戶行為頻率以及反轉(zhuǎn)行為頻率, 得到第一行為的特征比例,進而基于預先獲取的用戶行為參數(shù)得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實現(xiàn)了增加風險評估正確率的技術效果,進而解決了現(xiàn)有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。
需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到根據(jù)上述實施例的方法可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設備(可以是手機,計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述的方法。
實施例2
根據(jù)本發(fā)明實施例,還提供了一種用于實施上述方法實施例的裝置實施例,本申請上述實施例所提供的裝置可以在計算機終端上運行。
圖5是根據(jù)本申請實施例的用戶行為的風險評估裝置的結構示意圖。
如圖5所示,該用戶行為的風險評估裝置可以包括第一獲取單元502、第二獲取單元504、處理單元506、第一計算單元508以及風險評估單元510。
其中,第一獲取單元502,用于獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;第二獲取單元504,用于獲取所述用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,所述反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,所述第一總數(shù)是指在所述第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,所述第二總數(shù)是指在所述第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;處理單元506,用于根據(jù)所述用戶行為頻率以及所述反轉(zhuǎn)行為頻率,得到所述第一行為對應的第一特征值;第一計算單元508,用于根據(jù)所述第一行為對應的所述第一特征值,計算所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;風險評估單元510,用于基于所述特征比例以及預先獲取的用戶行為參數(shù),得到所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行 所述第一行為的風險評估結果。
由上可知,本申請上述實施例一所提供的方案,通過獲取第一賬戶的用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為的特征比例,進而基于預先獲取的用戶行為參數(shù)得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實現(xiàn)了增加風險評估正確率的技術效果,進而解決了現(xiàn)有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。
此處需要說明的是,上述第一獲取單元502、第二獲取單元504、處理單元506、第一計算單元508以及風險評估單元510對應于實施例一中的步驟S202至步驟S210,五個模塊與對應的步驟所實現(xiàn)的示例和應用場景相同,但不限于上述實施例一所公開的內(nèi)容。需要說明的是,上述模塊作為裝置的一部分可以運行在實施例一提供的計算機終端10中,可以通過軟件實現(xiàn),也可以通過硬件實現(xiàn)。
可選地,如圖6所示,所述第一獲取單元502可以包括:第一確定子單元602和第一計算子單元604。
其中,第一確定子單元602,用于確定第三總數(shù)和第四總數(shù),其中,所述第三總數(shù)是指所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的數(shù)量,所述第四總數(shù)是指所述第一賬戶在所述第一預設時間段內(nèi)的所有行為的數(shù)量;第一計算子單元604,用于依據(jù)所述第三總數(shù)和所述第四總數(shù),計算所述用戶行為頻率。
此處需要說明的是,上述第一確定子單元602和第一計算子單元604對應于實施例一中的步驟S20至步驟S22,兩個模塊與對應的步驟所實現(xiàn)的示例和應用場景相同,但不限于上述實施例一所公開的內(nèi)容。需要說明的是,上述模塊作為裝置的一部分可以運行在實施例一提供的計算機終端10中,可以通過軟件實現(xiàn),也可以通過硬件實現(xiàn)。
可選地,如圖7所示,所述第二獲取單元504可以包括:第二確定子單元702和第二計算子單元704。
第二確定子單元702,用于確定所述第一總數(shù)和所述第二總數(shù);第二計算子單元704,用于通過公式I=lg(k/q),計算所述反轉(zhuǎn)行為頻率,其中,I表示所述反轉(zhuǎn)行為頻率,k表示所述第二總數(shù),q表示所述第一總數(shù)。
此處需要說明的是,上述第二確定子單元702和第二計算子單元704對應于實施例一中的步驟S30至步驟S32,兩個模塊與對應的步驟所實現(xiàn)的示例和應用場景相同,但不限于上述實施例一所公開的內(nèi)容。需要說明的是,上述模塊作為裝置的一部分可 以運行在實施例一提供的計算機終端10中,可以通過軟件實現(xiàn),也可以通過硬件實現(xiàn)。
可選地,第一計算單元508用于執(zhí)行以下步驟根據(jù)所述第一行為對應的所述第一特征值,計算所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例:通過公式得到所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例,其中,aj表示所述第一特征值,P(aj)用于表示aj在所有賬戶的所有行為的特征值所占的所述特征比例,j為大于0的整數(shù)。
可選地,第一計算子單元604用于執(zhí)行以下步驟依據(jù)所述第三總數(shù)和所述第四總數(shù),計算所述用戶行為頻率:將所述第三總數(shù)除以所述第四總數(shù),得到所述用戶行為頻率;
處理單元506用于執(zhí)行以下步驟根據(jù)所述用戶行為頻率以及所述反轉(zhuǎn)行為頻率,得到所述第一行為對應的第一特征值:將所述用戶行為頻率乘以所述反轉(zhuǎn)行為頻率,得到所述第一行為對應的第一特征值。
可選地,如圖8所示,在所述預先獲取的用戶行為參數(shù)包括條件概率參數(shù)以及分類比例的情況下,用戶行為的風險評估裝置還可以包括:創(chuàng)建單元802和第二計算單元804。
其中,創(chuàng)建單元802,用于創(chuàng)建訓練樣本集合,其中,所述訓練樣本集合至少包括一個樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽;第二計算單元804,用于根據(jù)所述至少一個樣本特征值以及所述至少一個樣本特征值對應的所述風險評估標簽,得到所述條件概率參數(shù)以及所述分類比例。
此處需要說明的是,上述創(chuàng)建單元802和第二計算單元804對應于實施例一中的步驟S302至步驟S304,兩個模塊與對應的步驟所實現(xiàn)的示例和應用場景相同,但不限于上述實施例一所公開的內(nèi)容。需要說明的是,上述模塊作為裝置的一部分可以運行在實施例一提供的計算機終端10中,可以通過軟件實現(xiàn),也可以通過硬件實現(xiàn)。
可選地,如圖9所示,所述創(chuàng)建單元802可以包括:獲取子單元902、第三計算子單元904、第四計算子單元906以及創(chuàng)建子單元908。
其中,獲取子單元902,用于獲取在第二預設時間段內(nèi)至少一個樣本賬戶的至少一個樣本用戶行為;第三計算子單元904,用于計算所述至少一個樣本用戶行為的樣本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率,其中,所述樣本反轉(zhuǎn)行為頻率是根據(jù)第五總數(shù)和第六總數(shù)得到的,所述第五總數(shù)是指在所述第二 預設時間段內(nèi)所有賬戶的所述至少一個樣本用戶行為的數(shù)量以及在第二預設時間段內(nèi)所有賬戶的所有行為的總數(shù)得到的;第四計算子單元906,用于根據(jù)所述樣本用戶行為頻率以及所述樣本反轉(zhuǎn)行為頻率,得到所述至少一個樣本特征值;創(chuàng)建子單元908,用于依據(jù)所述至少一個樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽創(chuàng)建所述訓練樣本集合。
此處需要說明的是,上述獲取子單元902、第三計算子單元904、第四計算子單元906以及創(chuàng)建子單元908對應于實施例一中的步驟S40至步驟S46,四個模塊與對應的步驟所實現(xiàn)的示例和應用場景相同,但不限于上述實施例一所公開的內(nèi)容。需要說明的是,上述模塊作為裝置的一部分可以運行在實施例一提供的計算機終端10中,可以通過軟件實現(xiàn),也可以通過硬件實現(xiàn)。
可選地,第三計算子單元904用于執(zhí)行以下步驟計算所述至少一個樣本用戶行為的樣本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率:
將在所述第二預設時間段內(nèi)所述至少一個樣本賬戶的所述至少一個樣本用戶行為的數(shù)量除以在所述第二預設時間段內(nèi)所述至少一個樣本賬戶的所有行為的數(shù)量,得到所述至少一個樣本用戶行為的所述樣本用戶行為頻率;以及
通過公式I′=lg(k′/q′),計算所述樣本反轉(zhuǎn)行為頻率,其中,I′表示所述樣本反轉(zhuǎn)行為頻率,k′表示所述第五總數(shù),q′表示所述第六總數(shù)。
可選地,第二計算單元804用于執(zhí)行以下步驟根據(jù)所述至少一個樣本特征值以及所述至少一個樣本特征值對應的所述風險評估標簽,得到所述條件概率參數(shù)以及所述分類比例:
通過公式得到所述條件概率參數(shù),其中,所述P(a′j|ci)用于表示a′j屬于ci的所述條件概率參數(shù),a′j表示樣本特征值,ci表示所述風險評估標簽,Coumt(a′j|ci)表示屬于ci出現(xiàn)a′j的次數(shù),Count(ci)表示屬于ci的次數(shù),其中,0<j<n,n為所述訓練樣本集合中的樣本總數(shù),0<i<m,m為風險評估標簽的種類數(shù),i,j均為整數(shù);以及
通過公式得到所述分類比例,其中,P(ci)用于表示ci在所有 風險評估標簽中所占的所述分類比例。
可選地,風險評估單元510用于執(zhí)行以下步驟基于所述特征比例以及預先獲取的用戶行為參數(shù),得到所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的風險評估結果:通過公式得到所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的所述風險評估結果,其中,cMAP為所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的所述風險評估結果。
在本發(fā)明實施例中,采用獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;獲取用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,第一總數(shù)是指在第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,第二總數(shù)是指在第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;根據(jù)用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為對應的第一特征值;根據(jù)第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基于特征比例以及預先獲取的用戶行為參數(shù),得到第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為的風險評估結果的方式,通過獲取第一賬戶的用戶行為頻率以及反轉(zhuǎn)行為頻率,得到第一行為的特征比例,進而基于預先獲取的用戶行為參數(shù)得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實現(xiàn)了增加風險評估正確率的技術效果,進而解決了現(xiàn)有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。
實施例3
本發(fā)明的實施例還提供了一種存儲介質(zhì)??蛇x地,在本實施例中,上述存儲介質(zhì)可以用于保存上述實施例一所提供的用戶行為的風險評估方法所執(zhí)行的程序代碼。
可選地,在本實施例中,上述存儲介質(zhì)可以位于計算機網(wǎng)絡中計算機終端群中的任意一個計算機終端中,或者位于移動終端群中的任意一個移動終端中。
可選地,在本實施例中,存儲介質(zhì)被設置為存儲用于執(zhí)行以下步驟的程序代碼:獲取第一賬戶在第一預設時間段內(nèi)執(zhí)行第一行為所對應的用戶行為頻率;獲取所述用戶行為頻率對應的反轉(zhuǎn)行為頻率,其中,所述反轉(zhuǎn)行為頻率是根據(jù)第一總數(shù)和第二總數(shù)得到的,所述第一總數(shù)是指在所述第一預設時間段內(nèi)所有賬戶的第一行為的數(shù)量,所述第二總數(shù)是指在所述第一預設時間段內(nèi)所有賬戶的所有行為的數(shù)量;根據(jù)所述用 戶行為頻率以及所述反轉(zhuǎn)行為頻率,得到所述第一行為對應的第一特征值;根據(jù)所述第一行為對應的所述第一特征值,計算所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基于所述特征比例以及預先獲取的用戶行為參數(shù),得到所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的風險評估結果。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:確定第三總數(shù)和第四總數(shù),其中,所述第三總數(shù)是指所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的數(shù)量,所述第四總數(shù)是指所述第一賬戶在所述第一預設時間段內(nèi)的所有行為的數(shù)量;依據(jù)所述第三總數(shù)和所述第四總數(shù),計算所述用戶行為頻率。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:確定所述第一總數(shù)和所述第二總數(shù);通過公式I=lg(k/q),計算所述反轉(zhuǎn)行為頻率,其中,I表示所述反轉(zhuǎn)行為頻率,k表示所述第二總數(shù),q表示所述第一總數(shù)。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:通過公式得到所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例,其中,aj表示所述第一特征值,P(aj)用于表示aj在所有賬戶的所有行為的特征值所占的所述特征比例,j為大于0的整數(shù)。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:將所述第三總數(shù)除以所述第四總數(shù),得到所述用戶行為頻率。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:將所述用戶行為頻率乘以所述反轉(zhuǎn)行為頻率,得到所述第一行為對應的第一特征值。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:創(chuàng)建訓練樣本集合,其中,所述訓練樣本集合至少包括一個樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽;根據(jù)所述至少一個樣本特征值以及所述至少一個樣本特征值對應的所述風險評估標簽,得到所述條件概率參數(shù)以及所述分類比例。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:獲取在第二預設時間段內(nèi)至少一個樣本賬戶的至少一個樣本用戶行為;計算所述至少一個樣本用戶行為的樣本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉(zhuǎn)行為頻率,其中,所述樣本反轉(zhuǎn)行為頻率是根據(jù)第五總數(shù)和第六總數(shù)得到的,所述第五總數(shù)是指在所述第二預設時間段內(nèi)所有賬戶的所述至少一個樣本用戶行為的數(shù)量以及在第二預設時間段內(nèi)所有賬戶的所有行為的總數(shù)得到的;根據(jù)所述樣本用戶行為頻率以及所述樣 本反轉(zhuǎn)行為頻率,得到所述至少一個樣本特征值;依據(jù)所述至少一個樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽創(chuàng)建所述訓練樣本集合。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:將在所述第二預設時間段內(nèi)所述至少一個樣本賬戶的所述至少一個樣本用戶行為的數(shù)量除以在所述第二預設時間段內(nèi)所述至少一個樣本賬戶的所有行為的數(shù)量,得到所述至少一個樣本用戶行為的所述樣本用戶行為頻率;以及通過公式I′=lg(k′/q′),計算所述樣本反轉(zhuǎn)行為頻率,其中,I′表示所述樣本反轉(zhuǎn)行為頻率,k′表示所述第五總數(shù),q′表示所述第六總數(shù)。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:通過公式得到所述條件概率參數(shù),其中,所述P(a′j|ci)用于表示a′j屬于ci的所述條件概率參數(shù),a′j表示樣本特征值,ci表示所述風險評估標簽,Count(a′j|ci)表示屬于ci出現(xiàn)a′j的次數(shù),Count(ci)表示屬于ci的次數(shù),其中,0<j<n,n為所述訓練樣本集合中的樣本總數(shù),0<i<m,m為風險評估標簽的種類數(shù),i,j均為整數(shù);以及通過公式得到所述分類比例,其中,P(ci)用于表示ci在所有風險評估標簽中所占的所述分類比例。
可選地,存儲介質(zhì)還被設置為存儲用于執(zhí)行以下步驟的程序代碼:通過公式得到所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的所述風險評估結果,其中,cMAP為所述第一賬戶在所述第一預設時間段內(nèi)執(zhí)行所述第一行為的所述風險評估結果。
可選地,在本實施例中,上述存儲介質(zhì)可以包括但不限于:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
可選地,本實施例中的具體示例可以參考上述實施例中所描述的示例,本實施例在此不再贅述。
上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
在本發(fā)明的上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。
在本申請所提供的幾個實施例中,應該理解到,所揭露的技術內(nèi)容,可通過其它的方式實現(xiàn)。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設備(可為個人計算機、服務器或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。