欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種稽核模型生成方法及裝置與流程

文檔序號:11476218閱讀:593來源:國知局
一種稽核模型生成方法及裝置與流程

本發(fā)明涉及數(shù)據(jù)挖掘領域,尤其涉及一種稽核模型生成方法及裝置。



背景技術:

在電信運營商生產(chǎn)經(jīng)營過程中,根據(jù)業(yè)務需要建立相應稽核模型,然后將稽核模型用于監(jiān)控現(xiàn)網(wǎng)中的用戶,并從中找出風險用戶。

現(xiàn)有技術中稽核模型主要是由各個業(yè)務領域的專家根據(jù)電信運行過程中的各種業(yè)務存在的風險現(xiàn)象,結合一定的數(shù)據(jù)統(tǒng)計和人工經(jīng)驗來制定的,因而現(xiàn)有技術下的稽核模型生成方法過于依賴專家經(jīng)驗,無法實現(xiàn)模型自動生成,進而稽核模型的準確性也無法得到量化。

綜上所述,現(xiàn)有技術下稽核模型的建立主要依賴專家經(jīng)驗,而缺少一種可量化的稽核模型生成方法,并且現(xiàn)有技術下的稽核模型生成方法得到的稽核模型,在實際應用中的準確性不高。



技術實現(xiàn)要素:

本發(fā)明提供一種稽核模型生成方法及裝置,用以解決現(xiàn)有技術中存在的稽核模型的建立主要依賴專家經(jīng)驗,而缺少一種可量化的稽核模型生成方法,且現(xiàn)有技術中的稽核模型,在實際應用中的準確性不高的技術問題。

一方面,本發(fā)明實施例提供一種稽核模型生成方法,包括:

根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則;

根據(jù)所述至少兩個候選稽核規(guī)則,生成所述風險樣本用戶對應的匹配事務集;

根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度;

根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,并將所述最大頻繁項集作為稽核模型。

可選地,所述根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則,包括:

針對所述每一個稽核要素,若所述稽核要素的類型為枚舉型,則根據(jù)所述稽核要素的取值范圍,生成至少兩個枚舉型稽核規(guī)則,并將所述至少兩個枚舉型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分;

若所述稽核要素的類型為區(qū)間型,則根據(jù)所有風險樣本用戶在所述稽核要素的取值生成用戶分布圖,并根據(jù)所述用戶分布圖生成區(qū)間型稽核規(guī)則,并將所述至少兩個區(qū)間型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分。

可選地,所述根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,包括:

根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集;

若所述頻繁項集中的頻繁項數(shù)量大于1,根據(jù)所述頻繁項集更新所述候選項集,以及根據(jù)所述匹配事務集,確定所述候選項集中的候選項對應的支持度;若根據(jù)更新后的候選項集無法更新所述頻繁項集,則將所述頻繁項集作為最大頻繁項集,若根據(jù)更新后的候選項集能夠更新所述頻繁項集,則返回到根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集的步驟;

若所述頻繁項集中的頻繁項數(shù)量等于1,則將所述頻繁項集,作為最大頻繁項集。

可選地,所述根據(jù)所述頻繁項集更新所述候選項集,包括:

若所述候選項集中每個候選項包含n個候選稽核規(guī)則,則根據(jù)所述頻繁項 集中任意兩個頻繁項,更新所述候選項集,以使更新后的所述候選項集中的每個候選項包含n+1個候選稽核規(guī)則,n為正整數(shù)。

可選地,根據(jù)下列方式確定所述候選項集中每個候選項對應的支持度:

針對所述候選項集中的一個候選項,將所述匹配事務集中包含所述候選項的匹配事務項的個數(shù)與所述匹配事務集中匹配事務項的個數(shù)的比值,作為所述候選項對應的支持度。

可選地,所述將所述最大頻繁項集作為稽核模型之后,還包括:

若根據(jù)所述稽核模型評估用戶為疑似風險用戶,則根據(jù)評估結果生成稽核工單。

可選地,所述根據(jù)評估結果生成稽核工單之后,還包括:

根據(jù)所有稽核工單的反饋結果,確定稽核成功率;其中,每個反饋結果用于指示所述反饋結果對應的用戶是否為真實風險用戶;

若所述稽核成功率小于成功率閾值,則根據(jù)最新的風險樣本數(shù)據(jù)更新所述風險樣本用戶,并返回到根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則的步驟。

可選地,根據(jù)所述稽核工單的反饋結果,確定稽核成功率之后,還包括:

若所述稽核成功率小于成功率閾值,則判斷是否能夠上調(diào)所述最小置信度;

若確定能夠上調(diào)所述最小置信度,則按設定步長上調(diào)所述最小置信度,并返回到根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度的步驟。

另一方面,本發(fā)明實施例提供一種稽核模型生成裝置,包括:

候選稽核規(guī)則確定單元,用于根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則;

匹配事務集生成單元,用于根據(jù)所述至少兩個候選稽核規(guī)則,生成所述風險樣本用戶對應的匹配事務集;

候選項集確定單元,用于根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度;

稽核模型確定單元,用于根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,并將所述最大頻繁項集作為稽核模型。

可選地,所述候選稽核規(guī)則確定單元,具體用于:

針對所述每一個稽核要素,若所述稽核要素的類型為枚舉型,則根據(jù)所述稽核要素的取值范圍,生成至少兩個枚舉型稽核規(guī)則,并將所述至少兩個枚舉型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分;

若所述稽核要素的類型為區(qū)間型,則根據(jù)所有風險樣本用戶在所述稽核要素的取值生成用戶分布圖,并根據(jù)所述用戶分布圖生成區(qū)間型稽核規(guī)則,并將所述至少兩個區(qū)間型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分。

可選地,所述稽核模型確定單元,具體用于:

根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集;

若所述頻繁項集中的頻繁項數(shù)量大于1,根據(jù)所述頻繁項集更新所述候選項集,以及根據(jù)所述匹配事務集,確定所述候選項集中的候選項對應的支持度;若根據(jù)更新后的候選項集無法更新所述頻繁項集,則將所述頻繁項集作為最大頻繁項集,若根據(jù)更新后的候選項集能夠更新所述頻繁項集,則返回到根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集的步驟;

若所述頻繁項集中的頻繁項數(shù)量等于1,則將所述頻繁項集,作為最大頻繁項集。

可選地,所述稽核模型確定單元,還用于:

若所述候選項集中每個候選項包含n個候選稽核規(guī)則,則根據(jù)所述頻繁項集中任意兩個頻繁項,更新所述候選項集,以使更新后的所述候選項集中的每個候選項包含n+1個候選稽核規(guī)則,n為正整數(shù)。

可選地,所述候選項集確定單元,具體用于根據(jù)下列方式確定所述候選項集中每個候選項對應的支持度:

針對所述候選項集中的一個候選項,將所述匹配事務集中包含所述候選項的匹配事務項的個數(shù)與所述匹配事務集中匹配事務項的個數(shù)的比值,作為所述候選項對應的支持度。

可選地,所述裝置還包括評估單元,具體用于:

將所述最大頻繁項集作為稽核模型之后,若根據(jù)所述稽核模型評估用戶為疑似風險用戶,則根據(jù)評估結果生成稽核工單。

可選地,所述評估單元,還用于:

根據(jù)評估結果生成稽核工單之后,根據(jù)所有稽核工單的反饋結果,確定稽核成功率;其中,每個反饋結果用于指示所述反饋結果對應的用戶是否為真實風險用戶;

若所述稽核成功率小于成功率閾值,則根據(jù)最新的風險樣本數(shù)據(jù)更新所述風險樣本用戶,并返回到根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則的步驟。

可選地,所述評估單元,還用于:

根據(jù)所述稽核工單的反饋結果,確定稽核成功率之后,若所述稽核成功率小于成功率閾值,則判斷是否能夠上調(diào)所述最小置信度;

若確定能夠上調(diào)所述最小置信度,則按設定步長上調(diào)所述最小置信度,并返回到根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度的步驟。

本發(fā)明實施例提供的方法,根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則,并生成風險樣本用戶對應的匹配事務集,以及確定候選項集及候選項集中每個候選項對應的支持度,然后確定最大頻繁項集,并將最大頻繁項集作為稽核模型。該方法可自動生成稽核模型,且該稽核模型可得到量化,因而便于對模型進行調(diào)整,使得模 型的準確性得到提高。

附圖說明

為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域的普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例提供的稽核模型生成方法流程圖;

圖2為本發(fā)明實施例提供的某個區(qū)間型稽核要素對應的用戶分布圖;

圖3為本發(fā)明實施例提供的稽核模型更新流程圖;

圖4為本發(fā)明實施例提供的稽核模型生成方法詳細流程圖;

圖5為本發(fā)明實施例提供的稽核模型生成裝置示意圖。

具體實施方式

為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明作進一步地詳細描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。

下面結合說明書附圖對本發(fā)明實施例作進一步詳細描述。

如圖1所示,為本發(fā)明實施例提供的一種稽核模型生成方法,包括:

步驟101、根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則。

步驟102、根據(jù)所述至少兩個候選稽核規(guī)則,生成所述風險樣本用戶對應的匹配事務集。

步驟103、根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度。

步驟104、根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,并將所述最大頻繁項集作為稽核模型。

稽核模型的生成主要用于對采集到的用戶數(shù)據(jù)進行風險分析,從而得到哪些用戶是風險類用戶,哪些用戶是正常用戶。例如,以電信中的手機卡使用為例,對于每一個開通手機卡的用戶,在數(shù)據(jù)庫中都記錄了該用戶的數(shù)據(jù)信息,包括產(chǎn)品類型、資費、消費構成、通話構成、集團屬性、家庭屬性等,通過對每個用戶的數(shù)據(jù)信息進行分析,可以得到每個用戶是屬于風險類用戶還是正常類用戶,對于什么樣的用戶屬于風險類用戶,是由稽核模型決定的,即當建立了稽核模型之后,對于符合稽核模型的用戶就是風險類用戶,對于不符合稽核模型的用戶就是正常類用戶。

例如,稽核模型定義如果用戶同時滿足以下條件,則該用戶就是風險類用戶:

條件1:近三個月上網(wǎng)流量小于10m;

條件2:近三個月短信數(shù)量小于10條;

條件3:近三個月話費總額小于20元;

條件4:近三個月通話時長小于20分鐘;

條件5:卡號未實名制。

對于同時滿足以上5個條件的手機開卡用戶,則被稽核模型判斷為風險用戶,對于此類風險用戶,有可能開通手機卡的目的并不是為了使用,而是為了其它目的,舉例來說,此類開卡用戶可能是電信運營商下面的代理商,當電信運營商推出活動:如果代理商每成功為用戶開通一個手機卡,則獎勵代理商10元現(xiàn)金,導致有的代理商可能為了得到現(xiàn)金獎勵,就私自開通多張手機卡,但并不使用,因而此類手機卡用戶實質上都不是真正的手機卡使用用戶,此類開卡用戶都被稽核模型確定為風險類用戶。

需要說明的是,上述只是舉例說明一種類型的風險類用戶,實際應用中,風險類用戶是可以根據(jù)實際需要根據(jù)稽核模型來定義的。每一個稽核模型都定 義了一種風險類用戶的類型。

下面結合步驟101~步驟104,來詳細說明本發(fā)明稽核模型的生成方法。

上述步驟101中,根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則。

根據(jù)樣本的類型,可以獲取風險樣本用戶對應的至少一個稽核要素,其中,稽核要素是稽核系統(tǒng)的最小分析單元,例如用戶產(chǎn)品、資費、消費構成、通話構成、集團屬性、家庭屬性等?;艘厥遣煌瑯I(yè)務領域的專家針對不同風險現(xiàn)象提煉而成。系統(tǒng)將稽核要素根據(jù)取值類型不同分為兩類:枚舉型稽核要素和區(qū)間型稽核要素。

以移動家庭代付業(yè)務為例進行說明。家庭代付是指若干(2人及以上)在同一歸屬地的移動客戶自愿組建家庭后,可實現(xiàn)主號為成員進行全額代付手機費的業(yè)務。即屬于同一個家庭組的所有手機號碼的費用由該家庭組中的某一個手機號碼統(tǒng)一代付電話費用。在該業(yè)務下,當想要分析該業(yè)務中是否存在風險內(nèi)用戶時,首先生成稽核要素,根據(jù)專家經(jīng)驗,例如可以選擇的稽核要素為:

(1)主副號之間近三個月通話分鐘數(shù);

(2)主號近三月話費總額(不包括代付金額);

(3)主號近三個月流量;

(4)主號實名制狀態(tài);

(5)副號近三個月話費總額;

(6)副號近三個月流量;

(7)副號實名制狀態(tài);

(8)主副號入網(wǎng)營業(yè)廳是否一致。

通過選取以上稽核要素來分析風險樣本用戶中樣本用戶的數(shù)據(jù)分布情況。

其中,上述稽核要素分為兩種類型,一種是枚舉型稽核要素,如上述稽核要素中的(4)、(7)、(8),以(4)為例,“主號實名制狀態(tài)”,對應的取值只有兩種,一種是“是”,一種是“否”;再比如(7),“副號實名制狀態(tài)”,對應 的取值也是只有兩種,一種是“已實名制”,一種是“未實名制”。另一種是區(qū)間型稽核要素,例如上述稽核要素中的(1)、(2)、(3)、(5)、(6),以(1)為例,“主副號之間近三個月通話分鐘數(shù)”,對于多個樣本數(shù)據(jù),主副號之間近三個月通話分鐘數(shù)的取值有很多種,例如從0分鐘到100分鐘,每種情形都有,因此其取值是區(qū)間型的,再比如(6),“副號近三個月流量”,取值可以是從0m到200m。

需要說明的是,上述選取的稽核要素只是舉例說明,實際應用中具體選擇哪些稽核要素,可根據(jù)實際需要而定。

上步驟101中,在預先選定了風險樣本用戶對應的至少一個稽核要素,例如選擇上述(1)~(8)這8個稽核要素,然后根據(jù)這些稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則。

根據(jù)稽核要素,確定候選稽核規(guī)則,例如可以是對于每個稽核要素,都生成兩個候選稽核規(guī)則。針對枚舉型稽核要素,生成的候選稽核規(guī)則比較簡單,以上述稽核要素(4)為例,根據(jù)稽核要素“主號實名制狀態(tài)”生成的兩個候選稽核規(guī)則為“主號已實名制”和“主號未實名制”;對于區(qū)間型稽核要素,以上述稽核要素(1)為例,根據(jù)稽核要素“主副號之間近三個月通話分鐘數(shù)”生成的候選稽核規(guī)則可以是,候選稽核規(guī)則1:主副號之間近三個月通話分鐘數(shù)小于50分鐘,主副號之間近三個月通話分鐘數(shù)大于或等于50分鐘,其中50分鐘這個數(shù)值的選定方式可以是取所有樣本在稽核要素“主副號之間近三個月通話分鐘數(shù)”的取值的平均值,或者是根據(jù)其他方式來確定。

上述方法只是給出了一種根據(jù)稽核要素生成至少兩個候選稽核規(guī)則的方法,在實際應用中,還可以有更多的方法,例如對于區(qū)間型的稽核要素,還可以是生成不只兩個候選稽核規(guī)則,可以根據(jù)風險樣本數(shù)據(jù)在稽核要素的取值情況,可以生成更多的候選稽核規(guī)則。下面給出一種本發(fā)明實施例中使用的根據(jù)稽核要素生成至少兩個候選稽核規(guī)則的方法。

可選地,所述根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽 核要素的類型,確定至少兩個候選稽核規(guī)則,包括:

針對所述每一個稽核要素,若所述稽核要素的類型為枚舉型,則根據(jù)所述稽核要素的取值范圍,生成至少兩個枚舉型稽核規(guī)則,并將所述至少兩個枚舉型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分;

若所述稽核要素的類型為區(qū)間型,則根據(jù)所有風險樣本用戶在所述稽核要素的取值生成用戶分布圖,并根據(jù)所述用戶分布圖生成區(qū)間型稽核規(guī)則,并將所述至少兩個區(qū)間型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分。

上述方法中,針對每個稽核要素,根據(jù)其類型生成至少兩個候選稽核規(guī)則。若稽核要素的類型為枚舉型,則根據(jù)稽核要素的取值范圍,生成至少兩個枚舉型稽核規(guī)則,例如如果一個枚舉型稽核要素的取值范圍為0、1或2,即該枚舉型稽核要素對應的取值有3個結果,則可以根據(jù)這3個取值生成3個候選稽核規(guī)則;如果一個枚舉型稽核要素的取值范圍為“是”或“否”,即該枚舉型稽核要素對應的取值有2個結果,則可以根據(jù)這2個取值生成2個候選稽核規(guī)則,比如上述枚舉型稽核要素(4)等。

對于區(qū)間型稽核要素,則根據(jù)所有風險樣本用戶在稽核要素的取值生成用戶分布圖,例如,如圖2所示,為本發(fā)明實施例提供的某個區(qū)間型稽核要素對應的用戶分布圖,需要說明的是,這里只是給出一個示例,對于用戶分布圖的類型,本發(fā)明不限定。通過得到區(qū)間型稽核要素的對應的用戶分布圖,就可以根據(jù)用戶分布圖生成區(qū)間型稽核規(guī)則,例如以圖2為例,假設圖2表示稽核要素“主號近三個月流量”對應的用戶分布圖,根據(jù)該用戶分布圖,比如可以確定以下候選稽核規(guī)則:

候選稽核規(guī)則1:主號近三個月流量在0~40m;

候選稽核規(guī)則2:主號近三個月流量在40~80m;

候選稽核規(guī)則3:主號近三個月流量在80m以上。

當然,具體如何根據(jù)一個稽核要素對應的用戶分布圖來確定該稽核要素的候選稽核規(guī)則,方法很多,本發(fā)明不做具體限定。

因此通過上述方法,根據(jù)稽核要素的類型,可以分別根據(jù)枚舉型稽核要素生成至少兩個枚舉型候選稽核規(guī)則,以及根據(jù)區(qū)間型稽核要素生成至少兩個區(qū)間型稽候選稽核規(guī)則,然后將生成的至少兩個枚舉型候選稽核規(guī)則,或者將生成的至少兩個區(qū)間型稽候選稽核規(guī)則,作為所述該稽核要素對應的至少兩個候選稽核規(guī)則。

假設選定的稽核要素為上述稽核要素(1)~(8),則最終得到的候選稽核規(guī)則例如可以是:

(a)主副號之間近三個月通話分鐘數(shù)0到10分鐘;(b)主副號之間近三個月通話分鐘數(shù)10到100分鐘;(c)主副號之間近三個月通話分鐘數(shù)100分鐘以上;(d)主號近三月話費總額(不包括代付金額)0到10元;(e)主號近三月話費總額(不包括代付金額)10到80元;(f)主號近三月話費總額(不包括代付金額)80元以上;(g)主號近三個月流量0到100m;(h)主號近三個月流量100到1000m;(i)主號近三個月流量1000m以上;(j)主號實名制狀態(tài)為未登記;(k)主號實名制狀態(tài)為已登記;(l)主號實名制狀態(tài)為已審核;(m)副號近三個月話費總額0到10元;(n)副號近三個月話費總額10到80元;(o)副號近三個月話費總額80以上;(p)副號近三個月流量0到100m;(q)副號近三個月流量100到1000m;(r)副號近三個月流量1000m以上;(s)副號實名制狀態(tài)為未登記;(t)副號實名制狀態(tài)為已登記;(u)副號實名制狀態(tài)為已審核;(v)主副號入網(wǎng)營業(yè)廳一致;(w)主副號入網(wǎng)營業(yè)廳不一致。

即根據(jù)上述稽核要素(1)~(8)這8個稽核要素,生成了(a)~(w)這23個候選稽核規(guī)則。

在本發(fā)明后面的步驟中,需要從生成的所有候選稽核規(guī)則中選定某些候選稽核規(guī)則,組成一個候選稽核規(guī)則集合,并將該候選稽核規(guī)則集合作為最終的稽核模型。下面接著說明后續(xù)步驟。

上述步驟102中,根據(jù)所述至少兩個候選稽核規(guī)則,生成所述風險樣本用 戶對應的匹配事務集。具體地,對于風險樣本用戶中的每個用戶,都可以根據(jù)生成的候選稽核規(guī)則,生成一個匹配事務項,例如根據(jù)上述23個候選稽核規(guī)則,生成的匹配事務集為:adgjmpsv、adgjmqtv、adgknpuv、bdhloqtw、adgjmquv、ceijoquw、behknptv、adglmqsv、……。

一個匹配事務集中包含多個匹配事務項,每個匹配事務項對應一個用戶,因此匹配事務集中匹配事務項的數(shù)量與風險樣本用戶的數(shù)量相同,并且每個匹配事務項中包含的候選稽核規(guī)則的數(shù)量相同,都與稽核要素的數(shù)量一樣。例如用戶1對應的匹配事務項為adgjmpsv,表示用戶1同時滿足這8個候選稽核規(guī)則。

因此在步驟102中,可以為風險樣本用戶中的每個用戶生成一個匹配事務項。

上述步驟103中,根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集。以上述23個候選稽核規(guī)則為例,生成的候選項集為:{{a}、、{c}、3jivhmmexw、{e}、{f}、{g}、{h}、{i}、{j}、{k}、{l}、{m}、{n}、{o}、{p}、{q}、{r}、{s}、{t}、{u}、{v}、{w}},其中包含有23個候選項。為方便描述,將該候選項集成為候選1-項集。

接下來根據(jù)匹配事務集,確定候選項集中每個候選項對應的支持度??梢酝ㄟ^下列方式來確定:

可選地,根據(jù)下列方式確定所述候選項集中每個候選項對應的支持度:

針對所述候選項集中的一個候選項,將所述匹配事務集中包含所述候選項的匹配事務項的個數(shù)與所述匹配事務集中匹配事務項的個數(shù)的比值,作為所述候選項對應的支持度。

上述方法中,假設風險樣本用戶中一共有1000個用戶,則對應的匹配事務集中有1000個匹配事務項,即匹配事務集中匹配事務項的個數(shù)為1000,匹配事務集中包含某個候選項的匹配事務項指的是,候選項為匹配事務項的子集,舉例來說,假設針對候選項{a},則匹配事務項adgjmpsv包含候選項 {a},而匹配事務項bdhloqtw則不包含候選項{a}。因此針對一個候選項,可以統(tǒng)計匹配事務集中包含該候選項的匹配事務項的數(shù)量。例如,以候選項為例,假設上述匹配事務集中有500個匹配事務項包含候選項,則確定候選項對應的支持度為500/1000*100%=50%;再比如候選{c},假設上述匹配事務集中有620個匹配事務項包含候選項{c},則確定候選項{c}對應的支持度為620/1000*100%=62%。

因此通過上述方法,可以確定候選項集中每個候選項對應的支持度。

上述步驟104中,根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,并將所述最大頻繁項集作為稽核模型。

在該步驟中,在給定了候選項集,候選項集中每個候選項對應的支持度,可以通過數(shù)據(jù)挖掘中的多種關聯(lián)規(guī)則方法來確定最大頻繁項集。下面給出一種本發(fā)明中使用的最大頻繁項集確定方法。

可選地,所述根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,包括:

根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集;

若所述頻繁項集中的頻繁項數(shù)量大于1,根據(jù)所述頻繁項集更新所述候選項集,以及根據(jù)所述匹配事務集,確定所述候選項集中的候選項對應的支持度;若根據(jù)更新后的候選項集無法更新所述頻繁項集,則將所述頻繁項集作為最大頻繁項集,若根據(jù)更新后的候選項集能夠更新所述頻繁項集,則返回到根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集的步驟;

若所述頻繁項集中的頻繁項數(shù)量等于1,則將所述頻繁項集,作為最大頻繁項集。

上述確定最大頻繁項集的方法是一個迭代方法,首先根據(jù)候選項集、候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集,其 中最小置信度是一個預先設定的閾值,例如可以設置為50%、60%等,具體設定根據(jù)實際情況而定。

下面舉例說明生成頻繁項集的過程。由于最大頻繁項集的生成過程是一個迭代的過程,因此為方便說明,對候選項集以及頻繁項集進行編號,例如表示為候選1-項集、候選2-項集、候選3-項集等等,以及頻繁1-項集、頻繁2-項集、頻繁3-項集等等。

假設候選1-項集中的候選項及每個候選項的支持度為:{a}62.5%、25%、{c}12.5%、3jivhmmexw75%、{e}25%、{g}62.5%、{h}25%、{i}12.5%、{j}50%、{k}25%、{l}25%、{m}50%、{n}25%、{o}25%、{p}37.5%、{q}62.5%、{s}25%、{t}37.5%、{u}37.5%、{v}75%、{w}25%。

則根據(jù)候選1-項集、候選1-項集中每個候選項的支持度,以及最小置信度,假設設定為50%,將其中對應的支持度不小于最小置信度的所有候選項構成的集合作為頻繁項集,因而確定的頻繁項集,這里稱為頻繁1-項集,以及頻繁1-項集中每個頻繁項對應的支持度為:{a}62.5%、3jivhmmexw75%、{g}62.5%、{m}50%、{q}62.5%、{v}75%。

接著判斷頻繁項集中的頻繁項數(shù)量是大于1,還是等于1,若大于1,則根據(jù)頻繁項集更新所述候選項集,在上述例子中,即根據(jù)頻繁1-項集,得到新的候選項集,這里稱為候選2-項集??赏ㄟ^下列方式進行更新。

可選地,所述根據(jù)所述頻繁項集更新所述候選項集,包括:

若所述候選項集中每個候選項包含n個候選稽核規(guī)則,則根據(jù)所述頻繁項集中任意兩個頻繁項,更新所述候選項集,以使更新后的所述候選項集中的每個候選項包含n+1個候選稽核規(guī)則,n為正整數(shù)。

上述方法中,若當前候選項集中每個候選項包含n個候選稽核規(guī)則,則更新后的候選集中的每個候選項包含n+1個候選稽核規(guī)則,具體地是根據(jù)當前候選項集中任意兩個候選項,來生成新的候選項。

以上述頻繁1-項集,更新上述候選1-項集為例。

頻繁1-項集為:{{a}、3jivhmmexw、{g}、{m}、{q}、{v}}。

則更新后的候選項集,稱之為候選2-項集,為:{{a,d}、{a,g}、{a,m}、{a,q}、{a,v}、{d,g}、{d,m}、{d,q}、{d,v}、{g,m}、{g,q}、{g,v}、{m,v}、{q,v}}。

因為候選1-項集中的每個候選項包含1個候選稽核規(guī)則,因此更新后的候選2-項集中的每個候選項包含2個候選稽核規(guī)則。候選2-項集中的候選項是根據(jù)頻繁1-項集中任意兩個頻繁項的組合之后生成的,這里,需要說明的是,一個候選項集中的候選項包含的候選稽核規(guī)則是不能來自于同一個稽核要素的,例如以稽核要素(1)為例,根據(jù)稽核要素(1)生成了候選稽核規(guī)則a、b、c,因此候選2-項集中是不能夠包含如候選項{a,b},{a,c},{b,c}的,如果有的話,需要刪除。

因而可以通過上述方法,根據(jù)頻繁1-項集更新候選項集,得到新的候選項集,稱之為候選2-項集。

確定候選2-項集之后,接著確定候選2-項集中每個候選項對應的支持度,其確定方法與確定候選1-項集中每個候選項對應的支持度的方法相同,即針對候選2-項集中的一個候選項,將匹配事務集中包含所述候選項的匹配事務項的個數(shù)與所述匹配事務集中匹配事務項的個數(shù)的比值,作為所述候選項對應的支持度,例如確定了候選2-項集中每個候選項對應的的支持度后,候選2-項集中每個候選項及每個候選項對應的支持度為:{a,d}62.5%、{a,g}62.5%、{a,m}50%、{a,q}37.5%、{a,v}62.5%、{d,g}62.5%、{d,m}50%、{d,q}50%、{d,v}62.5%、{g,m}50%、{g,q}37.5%、{g,v}62.5%、{m,v}50%、{q,v}37.5%。

接下來,判斷是否可以更新后的候選項集更新頻繁項集,即判斷是否可以根據(jù)候選2-項集來更新頻繁1-項集,判斷的依據(jù)是根據(jù)更新后的候選項集更新頻繁項集,若得到的不是空集,則表明可以根據(jù)更新后的候選項集更新頻繁項集,若得到集合,并將得到的集合作為更新后的頻繁項集,并返回到根據(jù)所述 候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集的步驟,繼續(xù)迭代,直到不能對當前頻繁項集進行更新為止。

若得到的是空集,則表明無法根據(jù)更新后的候選項集更新頻繁項集,并且將當前頻繁項集作為最大頻繁項集,下面接著上面的例子進行說明,假設候選迭代,得到更新后的候選項集及頻繁項集,為方便描述,分別將后續(xù)候選項集稱為候選3-項集,候選4-項集等等,如果有的話;以及將后續(xù)頻繁項集稱為頻繁2-項集,頻繁3-項集等等,如果有的話。

根據(jù)候選2-項集中對應的支持度大于或等于最小置信度(本發(fā)明中以50%為例)的候選項構成的集合,作為頻繁2-項集,則得到的頻繁2-項集中的頻繁項及每個頻繁項對應的支持度為:{a,d}62.5%、{a,g}62.5%、{a,m}50%、{a,v}62.5%、{d,g}62.5%、{d,m}50%、{d,q}50%、{d,v}62.5%、{g,m}50%、{g,v}62.5%、{m,v}50%。

接下來,根據(jù)頻繁2-項集得到候選3-項集,以及確定候選3-項集中的每個候選項對應的支持度,然后根據(jù)得到的候選3-項集確定頻繁3-項集,假設上述實施例迭代得到的頻繁項集每次更新后的結果為:

頻繁3-項集及每個頻繁項對應的支持度為:{a,d,g}62.5%、{a,d,m}50%、{a,d,v}62.5%、{a,g,m}50%、{a,g,v}62.5%、{a,m,v}50%、{d,g,m}50%、{d,g,v}62.5%、{g,m,v}50%。

頻繁4-項集及每個頻繁項對應的支持度為:{a,d,g,m}50%、{a,d,g,v}62.5%、{a,g,m,v}50%、{d,g,m,v}50%。

頻繁5-項集及每個頻繁項對應的支持度為:{a,d,g,m,v}50%。

其中,上述頻繁項集的更新過程中,為方便描述,省略了候選項集的更新過程的描述。

由于頻繁5-項集中的頻繁項數(shù)量等于1,則將頻繁5-項集作為最大頻繁項集。即最終生成的最大頻繁項集為{a,d,g,m,v}。

如果上述例子中最終更新后的頻繁項集為頻繁4-項集,即沒有上述頻繁 5-項集,則最終將頻繁4-項集作為最大頻繁項集,即最終生成的最大頻繁項集為{a,d,g,m}、{a,d,g,v}、{a,g,m,v}、{d,g,m,v}。

在確定了最大頻繁項集之后,將最大頻繁項集作為稽核模型。該稽核模型表示的含義為:如果一個用戶滿足稽核模型中的條件,具體地,如果一個用戶對應的匹配事務項包含該稽核模型中的所有候選稽核規(guī)則,則該用戶為疑似風險用戶。

可選地,所述將所述最大頻繁項集作為稽核模型之后,還包括:

若根據(jù)所述稽核模型評估用戶為疑似風險用戶,則根據(jù)評估結果生成稽核工單。

假設最終得到的稽核模型為{a,d,g,m,v},如果一個用戶對應的匹配事務項為adgjmpsv,則使用該稽核模型,將該用戶確定為疑似風險用戶;如果一個用戶對應的匹配事務項為adgknpuv,則使用該稽核模型,將該用戶確定為正常用戶。

如果根據(jù)稽核模型評估用戶為疑似風險用戶,則根據(jù)評估結果生成稽核工單,其中稽核工單用于將疑似風險用戶的相關數(shù)據(jù)顯示出來,以便稽核人員進行審核。

可選地,所述根據(jù)評估結果生成稽核工單之后,還包括:

根據(jù)所有稽核工單的反饋結果,確定稽核成功率;其中,每個反饋結果用于指示所述反饋結果對應的用戶是否為真實風險用戶;

若所述稽核成功率小于成功率閾值,則根據(jù)最新的風險樣本數(shù)據(jù)更新所述風險樣本用戶,并返回到根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則的步驟。

由于稽核模型會根據(jù)判斷為疑似風險用戶生成稽核工單,但判斷的是否準確則需要稽核人員來審核,稽核人員主要判斷生成的稽核工單中的用戶是否確實為風險用戶,例如一共有10000個用戶,根據(jù)稽核模型確定其中有200個用戶為疑似風險用戶并生成200張稽核工單,則稽核人員對這200張稽核工單進 行逐一審核,以確定稽核模型的判斷是否準確,并且對每一張稽核工單進行審核后生成一個反饋結果,每個反饋結果用于指示所述反饋結果對應的用戶是否為真實風險用戶,例如對200張稽核工單進行審核后,確定其中180張稽核工單對應的用戶為真實風險用戶,另外20張稽核工單對應的用戶為正常用戶,則可以根據(jù)所有稽核工單的反饋結果,確定稽核成功率為180/200*100%=90%。

并且預先設定成功率閾值,例如設置為60%,如果稽核成功率小于成功率閾值,則根據(jù)最新的風險樣本數(shù)據(jù)更新所述風險樣本用戶,即根據(jù)最新生成的風險樣本數(shù)據(jù),重新生成新的風險樣本用戶,并返回到根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則的步驟。由于風險樣本用戶發(fā)生了變化,因此稽核要素的取值發(fā)生了變化,導致根據(jù)相同的稽核要素,生成的候選稽核規(guī)則發(fā)生了變化,最終生成的最大頻繁項集也隨之發(fā)生變化,即通過更新風險樣本用戶,可以得到新的稽核模型,即在稽核模型成功率低于成功率閾值時,可通過更新風險樣本用戶生成新的稽核模型,因而該方法可以實現(xiàn)稽核模型的動態(tài)調(diào)整,保證使用的稽核模型的稽核成功率在成功率閾值之上,因而具有較高的稽核成功率。

上述方法是通過調(diào)整風險樣本用戶來更新稽核模型,如果通過該方法得到的新的稽核模型的成功率還是低于成功率閾值,則還可以通過下列方式來更新模型。

可選地,根據(jù)所述稽核工單的反饋結果,確定稽核成功率之后,還包括:

若所述稽核成功率小于成功率閾值,則判斷是否能夠上調(diào)所述最小置信度;

若確定能夠上調(diào)所述最小置信度,則按設定步長上調(diào)所述最小置信度,并返回到根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度的步驟。

上述方法中,當稽核成功率小于成功率閾值,則判斷是否能夠上調(diào)所述最小置信度,例如設定步長為5%,如果最小置信度還沒有到達100%,就是可以 上調(diào)的,由于最小置信度越大,意味著在確定頻繁項集的條件越苛刻,因為頻繁項集是由候選項集中對應的支持度大于或等于最小置信度的所有候選項構成的,因此最小置信度越大,每次迭代得到的更新后的頻繁項集中的頻繁項就越少,進而導致更早地得到最大頻繁項集,進而得到的最大頻繁項集中每個頻繁項中包含的稽核候選規(guī)則就越少。比如,當最小置信度為60%時,得到的最大頻繁項集中的每個頻繁項包含5個候選稽核規(guī)則,而當最小置信度上調(diào)到80%時,得到的最大頻繁項集中每個頻繁項包含的候選稽核規(guī)則可能只有3個,因此當最小置信度上調(diào)時,意味著得到的稽核模型的條件是越寬松的,進而可以更準確地判斷用戶是否為疑似風險用戶。

本發(fā)明實施例提供的方法,根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則,并生成風險樣本用戶對應的匹配事務集,以及確定候選項集及候選項集中每個候選項對應的支持度,然后確定最大頻繁項集,并將最大頻繁項集作為稽核模型。該方法可自動生成稽核模型,且該稽核模型可得到量化,因而便于對模型進行調(diào)整,使得模型的準確性得到提高。

下面結合圖3,對本發(fā)明實施例提供的稽核模型更新方法做詳細描述,其中圖3為本發(fā)明實施例提供的稽核模型更新流程圖。

步驟301、初始稽核模型。

根據(jù)上述步驟101~步驟104生成的初始稽核模型。

步驟302、稽核模型投入運營。

稽核模型投入運營后,產(chǎn)生疑似風險的稽核工單,稽核員根據(jù)稽核工單內(nèi)容核查實際是否存在風險,并在系統(tǒng)中標識核查結果。以家庭代付欠費為例,產(chǎn)生稽核工單后,稽核員核查號碼是否涉及主號欠費且副號套取業(yè)務辦理酬金風險,如果確實存在風險則標識為真實風險工單,否則標識為正常工單。

步驟303、風險現(xiàn)象是否存在,若存在,則轉到步驟305,否則轉到步驟304。

稽核系統(tǒng)包含一個稽核模型庫,當一個稽核模型持續(xù)不產(chǎn)生稽核工單時可將該模型下線。持續(xù)不產(chǎn)生稽核工單(即風險現(xiàn)象消失)的原因包括該模型監(jiān)控的業(yè)務已下線、業(yè)務風險已經(jīng)通過crm(客戶關系管理,customerrelationshipmanagement)系統(tǒng)進行封堵、加大考核力度限制渠道辦理等。

步驟304、稽核模型下線。

步驟305、統(tǒng)計稽核結果實際成功率。

稽核員核查疑似風險工單是否實際存在風險現(xiàn)象并在系統(tǒng)中標識?;私Y果實際成功率=核查后實際風險工單數(shù)/稽核工單總數(shù)*100%。

步驟306、成功率是否達標,若是則轉到步驟302,否則轉到步驟307。

如果風險現(xiàn)象仍然存在,則定期(可設置頻率)統(tǒng)計稽核結果實際成功率。如果稽核結果實際成功率達到成功率閾值,則繼續(xù)使用該模型。如果稽核成功率達不到要求,則進入迭代階段。

步驟307、根據(jù)最新風險數(shù)據(jù),對稽核要素取值重新分類,重新生成候選稽核規(guī)則。

步驟308、生成新的稽核模型。

根據(jù)迭代后的候選稽核規(guī)則生成新的稽核模型(方法同建立初始稽核模型)。

步驟309、迭代后成功率統(tǒng)計

根據(jù)累計已反饋數(shù)據(jù)進行稽核結果實際成功率統(tǒng)計。

步驟310、判斷成功率是否達標,若達標,則轉到步驟302,否則轉到步驟311。

步驟311、判斷最小置信度是否可以上調(diào),若是則轉到步驟313,否則轉到步驟312。

當最小置信度達到100%或無法生成最大頻繁項集后,停止上調(diào)。

步驟312、重建稽核要素

若無法通過調(diào)整最小置信度得到成功率達標的稽核模型,則需要從源頭重 建稽核要素,即人工重新篩選得到新的稽核要素,重新進行模型確定。

步驟313、上調(diào)最小置信度,重新生成最大頻繁項集。

最小置信度調(diào)整后,重新計算最大頻繁項集,并建立稽核模型。如果新模型成功率達標則投入運營,如果成功率不達標,繼續(xù)上調(diào)最小置信度,直到最小置信度達到100%或無法生成候選集為止。

下面對本發(fā)明實施例提供的稽核模型生成方法做詳細描述,如圖4所示,為本發(fā)明實施例提供的稽核模型生成方法詳細流程圖,包括:

步驟401、根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則;

步驟402、根據(jù)所述至少兩個候選稽核規(guī)則,生成所述風險樣本用戶對應的匹配事務集;

步驟403、根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集;

步驟404、針對所述候選項集中的一個候選項,將所述匹配事務集中包含所述候選項的匹配事務項的個數(shù)與所述匹配事務集中匹配事務項的個數(shù)的比值,作為所述候選項對應的支持度;

步驟405、根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集;

步驟406、若所述頻繁項集中的頻繁項數(shù)量大于1,根據(jù)所述頻繁項集更新所述候選項集,以及根據(jù)所述匹配事務集,確定所述候選項集中的候選項對應的支持度;若根據(jù)更新后的候選項集無法更新所述頻繁項集,則將所述頻繁項集作為最大頻繁項集,若根據(jù)更新后的候選項集能夠更新所述頻繁項集,則返回到步驟405;

若所述頻繁項集中的頻繁項數(shù)量等于1,則將所述頻繁項集,作為最大頻繁項集。

步驟407、將所述最大頻繁項集作為稽核模型。

本發(fā)明實施例提供的方法,根據(jù)風險樣本用戶對應的至少一個稽核要素的 取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則,并生成風險樣本用戶對應的匹配事務集,以及確定候選項集及候選項集中每個候選項對應的支持度,然后確定最大頻繁項集,并將最大頻繁項集作為稽核模型。該方法可自動生成稽核模型,且該稽核模型可得到量化,因而便于對模型進行調(diào)整,使得模型的準確性得到提高。

基于相同的技術構思,本發(fā)明實施例還提供一種稽核模型生成裝置。本發(fā)明實施例提供的稽核模型生成裝置如圖5所示,包括:

候選稽核規(guī)則確定單元501,用于根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及每個稽核要素的類型,確定至少兩個候選稽核規(guī)則;

匹配事務集生成單元502,用于根據(jù)所述至少兩個候選稽核規(guī)則,生成所述風險樣本用戶對應的匹配事務集;

候選項集確定單元503,用于根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度;

稽核模型確定單元504,用于根據(jù)所述候選項集以及所述候選項集中每個候選項對應的支持度,確定最大頻繁項集,并將所述最大頻繁項集作為稽核模型。

可選地,所述候選稽核規(guī)則確定單元501,具體用于:

針對所述每一個稽核要素,若所述稽核要素的類型為枚舉型,則根據(jù)所述稽核要素的取值范圍,生成至少兩個枚舉型稽核規(guī)則,并將所述至少兩個枚舉型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分;

若所述稽核要素的類型為區(qū)間型,則根據(jù)所有風險樣本用戶在所述稽核要素的取值生成用戶分布圖,并根據(jù)所述用戶分布圖生成區(qū)間型稽核規(guī)則,并將所述至少兩個區(qū)間型稽核規(guī)則作為所述至少兩個候選稽核規(guī)則的組成部分。

可選地,所述稽核模型確定單元504,具體用于:

根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集;

若所述頻繁項集中的頻繁項數(shù)量大于1,根據(jù)所述頻繁項集更新所述候選項集,以及根據(jù)所述匹配事務集,確定所述候選項集中的候選項對應的支持度;若根據(jù)更新后的候選項集無法更新所述頻繁項集,則將所述頻繁項集作為最大頻繁項集,若根據(jù)更新后的候選項集能夠更新所述頻繁項集,則返回到根據(jù)所述候選項集、所述候選項集中每個候選項對應的支持度及預先設定的最小置信度,確定頻繁項集的步驟;

若所述頻繁項集中的頻繁項數(shù)量等于1,則將所述頻繁項集,作為最大頻繁項集。

可選地,所述稽核模型確定單元504,還用于:

若所述候選項集中每個候選項包含n個候選稽核規(guī)則,則根據(jù)所述頻繁項集中任意兩個頻繁項,更新所述候選項集,以使更新后的所述候選項集中的每個候選項包含n+1個候選稽核規(guī)則,n為正整數(shù)。

可選地,所述候選項集確定單元503,具體用于根據(jù)下列方式確定所述候選項集中每個候選項對應的支持度:

針對所述候選項集中的一個候選項,將所述匹配事務集中包含所述候選項的匹配事務項的個數(shù)與所述匹配事務集中匹配事務項的個數(shù)的比值,作為所述候選項對應的支持度。

可選地,所述裝置還包括評估單元505,具體用于:

將所述最大頻繁項集作為稽核模型之后,若根據(jù)所述稽核模型評估用戶為疑似風險用戶,則根據(jù)評估結果生成稽核工單。

可選地,所述評估單元505,還用于:

根據(jù)評估結果生成稽核工單之后,根據(jù)所有稽核工單的反饋結果,確定稽核成功率;其中,每個反饋結果用于指示所述反饋結果對應的用戶是否為真實風險用戶;

若所述稽核成功率小于成功率閾值,則根據(jù)最新的風險樣本數(shù)據(jù)更新所述風險樣本用戶,并返回到根據(jù)風險樣本用戶對應的至少一個稽核要素的取值及 每個稽核要素的類型,確定至少兩個候選稽核規(guī)則的步驟。

可選地,所述評估單元505,還用于:

根據(jù)所述稽核工單的反饋結果,確定稽核成功率之后,若所述稽核成功率小于成功率閾值,則判斷是否能夠上調(diào)所述最小置信度;

若確定能夠上調(diào)所述最小置信度,則按設定步長上調(diào)所述最小置信度,并返回到根據(jù)所述至少兩個候選稽核規(guī)則,確定候選項集,并根據(jù)所述匹配事務集,確定所述候選項集中每個候選項對應的支持度的步驟。

本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

盡管已描述了本發(fā)明的優(yōu)選實施例,但本領域內(nèi)的技術人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。

顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā) 明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
元朗区| 峡江县| 鸡泽县| 孙吴县| 九龙坡区| 什邡市| 永城市| 阳谷县| 佳木斯市| 洪泽县| 邓州市| 买车| 肇庆市| 隆德县| 克东县| 新民市| 寿阳县| 台东市| 温宿县| 百色市| 樟树市| 遂宁市| 松原市| 特克斯县| 精河县| 丹江口市| 彰化县| 建昌县| 合阳县| 闽清县| 茂名市| 大厂| 西安市| 新沂市| 高淳县| 凤翔县| 黑河市| 南雄市| 密云县| 阳谷县| 永丰县|