分類(lèi)器訓(xùn)練方法和裝置、身份驗(yàn)證方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)安全技術(shù)領(lǐng)域,特別是涉及一種分類(lèi)器訓(xùn)練方法和裝置、身份 驗(yàn)證方法和系統(tǒng)。
【背景技術(shù)】
[0002] 賬號(hào)是用戶(hù)在互聯(lián)網(wǎng)中的數(shù)字化代表,是用于識(shí)別不同的用戶(hù)的重要依據(jù)。然而 賬號(hào)有時(shí)會(huì)出現(xiàn)賬號(hào)的真實(shí)擁有者無(wú)法使用自己賬號(hào)的情況,比如用戶(hù)自己可能忘記密 碼,或者賬號(hào)被惡意用戶(hù)盜取并惡意修改了密碼等,這種情況下就需要對(duì)用戶(hù)身份進(jìn)行驗(yàn) 證,從而進(jìn)行賬號(hào)歸屬判斷,在確認(rèn)其為賬號(hào)的合法用戶(hù)時(shí)才會(huì)應(yīng)用戶(hù)要求修改密碼,使其 具有對(duì)該賬號(hào)的控制權(quán)。這個(gè)過(guò)程通??煞Q(chēng)為賬號(hào)申訴。
[0003] 目前對(duì)用戶(hù)進(jìn)行身份驗(yàn)證并據(jù)以進(jìn)行賬號(hào)歸屬判斷,需要用戶(hù)提交證據(jù),證據(jù)通 常是證明用戶(hù)曾經(jīng)擁有這個(gè)賬號(hào)的證明信息。然后服務(wù)器對(duì)提交的每項(xiàng)證據(jù)進(jìn)行對(duì)錯(cuò)判 斷,然后依據(jù)對(duì)錯(cuò)判斷結(jié)果加權(quán)打分,最后通過(guò)判斷加權(quán)打分的分?jǐn)?shù)是否超過(guò)分?jǐn)?shù)閾值來(lái) 判斷提交證據(jù)的用戶(hù)是否為該賬號(hào)的合法用戶(hù)。
[0004] 然而,通過(guò)加權(quán)打分來(lái)對(duì)用戶(hù)進(jìn)行身份驗(yàn)證,驗(yàn)證結(jié)果的準(zhǔn)確性依賴(lài)于用戶(hù)提供 證據(jù)的多少,其驗(yàn)證結(jié)果準(zhǔn)確性并不高,尤其是用戶(hù)提交的證據(jù)數(shù)量較少的情況下,即使提 供的證據(jù)完全正確也無(wú)法驗(yàn)證成功。
【發(fā)明內(nèi)容】
[0005] 基于此,有必要針對(duì)通過(guò)加權(quán)打分來(lái)對(duì)用戶(hù)進(jìn)行身份驗(yàn)證準(zhǔn)確性不高的問(wèn)題,提 供一種分類(lèi)器訓(xùn)練方法和裝置、身份驗(yàn)證方法和系統(tǒng)。
[0006] -種分類(lèi)器訓(xùn)練方法,所述方法包括:
[0007] 獲取訓(xùn)練樣本集;所述訓(xùn)練樣本集中的每個(gè)訓(xùn)練樣本包括用戶(hù)身份屬性和對(duì)應(yīng)預(yù) 設(shè)分類(lèi)條件特征的特征值;
[0008] 根據(jù)一種所述預(yù)設(shè)分類(lèi)條件特征確定根結(jié)點(diǎn)處的分類(lèi)條件,根據(jù)根結(jié)點(diǎn)處的分類(lèi) 條件將所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行分類(lèi),獲得對(duì)應(yīng)所述根結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類(lèi)子 集;將所述根結(jié)點(diǎn)的孩子結(jié)點(diǎn)作為當(dāng)前結(jié)點(diǎn);
[0009] 根據(jù)另一種所述預(yù)設(shè)分類(lèi)條件特征確定當(dāng)前結(jié)點(diǎn)處的分類(lèi)條件,根據(jù)當(dāng)前結(jié)點(diǎn)處 的分類(lèi)條件對(duì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中的訓(xùn)練樣本進(jìn)行分類(lèi),獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的孩 子結(jié)點(diǎn)的分類(lèi)子集;
[0010] 將當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)作為當(dāng)前結(jié)點(diǎn),繼續(xù)執(zhí)行所述根據(jù)另一種所述預(yù)設(shè)分類(lèi)條 件特征確定當(dāng)前結(jié)點(diǎn)處的分類(lèi)條件,根據(jù)當(dāng)前結(jié)點(diǎn)處的分類(lèi)條件對(duì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi) 子集中的訓(xùn)練樣本進(jìn)行分類(lèi),獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類(lèi)子集的步驟,直至當(dāng)前 結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中各個(gè)訓(xùn)練樣本的相同的預(yù)設(shè)分類(lèi)條件特征所對(duì)應(yīng)的特征值分別 相同或者當(dāng)前結(jié)點(diǎn)的層數(shù)達(dá)到指定層數(shù);
[0011] 根據(jù)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中對(duì)應(yīng)最多訓(xùn)練樣本的用戶(hù)身份屬性確定當(dāng)前 結(jié)點(diǎn)處的用戶(hù)身份分類(lèi)結(jié)果,獲得決策樹(shù)分類(lèi)器。
[0012] -種分類(lèi)器訓(xùn)練裝置,所述裝置包括:
[0013] 訓(xùn)練樣本集獲取模塊,用于獲取訓(xùn)練樣本集;所述訓(xùn)練樣本集中的每個(gè)訓(xùn)練樣本 包括用戶(hù)身份屬性和對(duì)應(yīng)預(yù)設(shè)分類(lèi)條件特征的特征值;
[0014] 根結(jié)點(diǎn)訓(xùn)練模塊,用于根據(jù)一種所述預(yù)設(shè)分類(lèi)條件特征確定根結(jié)點(diǎn)處的分類(lèi)條 件,根據(jù)根結(jié)點(diǎn)處的分類(lèi)條件將所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行分類(lèi),獲得對(duì)應(yīng)所述根 結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類(lèi)子集;將所述根結(jié)點(diǎn)的孩子結(jié)點(diǎn)作為當(dāng)前結(jié)點(diǎn);
[0015] 內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊,用于根據(jù)另一種所述預(yù)設(shè)分類(lèi)條件特征確定當(dāng)前結(jié)點(diǎn)處的分 類(lèi)條件,根據(jù)當(dāng)前結(jié)點(diǎn)處的分類(lèi)條件對(duì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中的訓(xùn)練樣本進(jìn)行分 類(lèi),獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類(lèi)子集;還用于將當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)作為當(dāng)前結(jié) 點(diǎn),繼續(xù)執(zhí)行根據(jù)另一種所述預(yù)設(shè)分類(lèi)條件特征確定當(dāng)前結(jié)點(diǎn)處的分類(lèi)條件,根據(jù)當(dāng)前結(jié) 點(diǎn)處的分類(lèi)條件對(duì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中的訓(xùn)練樣本進(jìn)行分類(lèi),獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn) 的孩子結(jié)點(diǎn)的分類(lèi)子集,直至當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中各個(gè)訓(xùn)練樣本的相同的預(yù)設(shè)分 類(lèi)條件特征所對(duì)應(yīng)的特征值分別相同或者當(dāng)前結(jié)點(diǎn)的層數(shù)達(dá)到指定層數(shù);
[0016] 葉結(jié)點(diǎn)訓(xùn)練模塊,用于根據(jù)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類(lèi)子集中對(duì)應(yīng)最多訓(xùn)練樣本的用 戶(hù)身份屬性確定當(dāng)前結(jié)點(diǎn)處的用戶(hù)身份分類(lèi)結(jié)果,獲得決策樹(shù)分類(lèi)器。
[0017] 上述分類(lèi)器訓(xùn)練方法和裝置,利用訓(xùn)練樣本從決策樹(shù)分類(lèi)器的根結(jié)點(diǎn)處開(kāi)始逐層 訓(xùn)練直到葉結(jié)點(diǎn),從根結(jié)點(diǎn)到葉結(jié)點(diǎn)的每個(gè)非葉結(jié)點(diǎn)處的分類(lèi)條件根據(jù)訓(xùn)練樣本的其中一 種預(yù)設(shè)分類(lèi)條件特征確定,而葉結(jié)點(diǎn)則體現(xiàn)用戶(hù)身份分類(lèi)結(jié)果。這樣訓(xùn)練獲得的決策樹(shù)分 類(lèi)器從根結(jié)點(diǎn)到葉結(jié)點(diǎn)的任意一條判斷路徑可以體現(xiàn)多種預(yù)設(shè)分類(lèi)條件特征之間的相關(guān) 性,分類(lèi)性能好。在使用該決策樹(shù)分類(lèi)器進(jìn)行身份驗(yàn)證時(shí),不僅考慮用戶(hù)提交的每種用戶(hù)證 據(jù)數(shù)據(jù)各自的對(duì)錯(cuò),還會(huì)考慮多種用戶(hù)證據(jù)數(shù)據(jù)之間的相關(guān)性,身份驗(yàn)證結(jié)果準(zhǔn)確性高。
[0018] -種身份驗(yàn)證方法,所述方法包括:
[0019] 接收用戶(hù)終端發(fā)來(lái)的攜帶有待驗(yàn)證用戶(hù)標(biāo)識(shí)和待驗(yàn)證用戶(hù)證據(jù)數(shù)據(jù)的身份驗(yàn)證 請(qǐng)求;
[0020] 獲取對(duì)應(yīng)所述待驗(yàn)證用戶(hù)標(biāo)識(shí)的用戶(hù)數(shù)據(jù),根據(jù)所述獲取的用戶(hù)數(shù)據(jù)對(duì)所述待驗(yàn) 證用戶(hù)證據(jù)數(shù)據(jù)進(jìn)行驗(yàn)證而獲得證據(jù)驗(yàn)證結(jié)果;
[0021] 根據(jù)所述待驗(yàn)證用戶(hù)證據(jù)數(shù)據(jù)和所述獲得的證據(jù)驗(yàn)證結(jié)果提取對(duì)應(yīng)預(yù)設(shè)分類(lèi)條 件特征的待驗(yàn)證特征值;
[0022] 從決策樹(shù)分類(lèi)器的根結(jié)點(diǎn)處的分類(lèi)條件開(kāi)始,根據(jù)所述對(duì)應(yīng)預(yù)設(shè)分類(lèi)條件特征的 待驗(yàn)證特征值逐層判斷分類(lèi)直至葉結(jié)點(diǎn),根據(jù)該葉結(jié)點(diǎn)處的用戶(hù)身份分類(lèi)結(jié)果確定對(duì)應(yīng)所 述待驗(yàn)證用戶(hù)標(biāo)識(shí)的身份驗(yàn)證結(jié)果。
[0023] -種身份驗(yàn)證系統(tǒng),所述系統(tǒng)包括:
[0024] 身份驗(yàn)證請(qǐng)求接收模塊,用于接收用戶(hù)終端發(fā)來(lái)的攜帶有待驗(yàn)證用戶(hù)標(biāo)識(shí)和待驗(yàn) 證用戶(hù)證據(jù)數(shù)據(jù)的身份驗(yàn)證請(qǐng)求;
[0025] 證據(jù)驗(yàn)證模塊,用于獲取對(duì)應(yīng)所述待驗(yàn)證用戶(hù)標(biāo)識(shí)的用戶(hù)數(shù)據(jù),根據(jù)所述獲取的 用戶(hù)數(shù)據(jù)對(duì)所述待驗(yàn)證用戶(hù)證據(jù)數(shù)據(jù)進(jìn)行驗(yàn)證而獲得證據(jù)驗(yàn)證結(jié)果;
[0026] 待驗(yàn)證特征值提取模塊,用于根據(jù)所述待驗(yàn)證用戶(hù)證據(jù)數(shù)據(jù)和所述獲得的證據(jù)驗(yàn) 證結(jié)果提取對(duì)應(yīng)預(yù)設(shè)分類(lèi)條件特征的待驗(yàn)證特征值;
[0027] 身份驗(yàn)證結(jié)果確定模塊,用于從決策樹(shù)分類(lèi)器的根結(jié)點(diǎn)處的分類(lèi)條件開(kāi)始,根據(jù) 所述對(duì)應(yīng)預(yù)設(shè)分類(lèi)條件特征的待驗(yàn)證特征值逐層判斷分類(lèi)直至葉結(jié)點(diǎn),根據(jù)該葉結(jié)點(diǎn)處的 用戶(hù)身份分類(lèi)結(jié)果確定對(duì)應(yīng)所述待驗(yàn)證用戶(hù)標(biāo)識(shí)的身份驗(yàn)證結(jié)果。
[0028] 上述身份驗(yàn)證方法和系統(tǒng),響應(yīng)于用戶(hù)終端的身份驗(yàn)證請(qǐng)求進(jìn)行身份驗(yàn)證,先對(duì) 身份驗(yàn)證請(qǐng)求所攜帶的待驗(yàn)證用戶(hù)證據(jù)數(shù)據(jù)進(jìn)行驗(yàn)證,再根據(jù)該驗(yàn)證結(jié)果提取預(yù)設(shè)分類(lèi)條 件特征所對(duì)應(yīng)的待驗(yàn)證特征值,從而利用決策樹(shù)分類(lèi)器從根結(jié)點(diǎn)處的分類(lèi)條件開(kāi)始,根據(jù) 每種預(yù)設(shè)分類(lèi)條件特征所對(duì)應(yīng)的待驗(yàn)證特征值逐層判斷分類(lèi)直至獲得身份驗(yàn)證結(jié)果。這樣 進(jìn)行身份驗(yàn)證不僅考慮了每個(gè)待驗(yàn)證用戶(hù)證據(jù)的各自的對(duì)錯(cuò),還考慮了各種預(yù)設(shè)分類(lèi)條件 特征所對(duì)應(yīng)的待驗(yàn)證特征值彼此之間的相關(guān)性,身份驗(yàn)證結(jié)果準(zhǔn)確性高。
【附圖說(shuō)明】
[0029] 圖1為一個(gè)實(shí)施例中分類(lèi)器訓(xùn)練方法的流程示意圖;
[0030] 圖2為一個(gè)實(shí)施例中獲取訓(xùn)練樣本集的步驟的流程示意圖;
[0031] 圖3為一個(gè)實(shí)施例中根據(jù)檢驗(yàn)樣本對(duì)決策樹(shù)分類(lèi)器剪枝的步驟的流程示意圖;
[0032] 圖4為一個(gè)實(shí)施例中身份驗(yàn)證方法的流程示意圖;
[0033] 圖5為一個(gè)具體應(yīng)用場(chǎng)景中決策樹(shù)分類(lèi)器的局部數(shù)據(jù)結(jié)構(gòu)示意圖;
[0034] 圖6為一個(gè)實(shí)施例中分類(lèi)器訓(xùn)練裝置的結(jié)構(gòu)框圖;
[0035] 圖7為圖6中的分類(lèi)器訓(xùn)練裝置的訓(xùn)練樣本集獲取模塊的一個(gè)實(shí)施例的結(jié)構(gòu)框 圖;
[0036] 圖8為另一個(gè)實(shí)施例中分類(lèi)器訓(xùn)練裝置的結(jié)構(gòu)框圖;
[0037] 圖9為再一個(gè)實(shí)施例中分類(lèi)器訓(xùn)練裝置的結(jié)構(gòu)框圖;
[0038] 圖10為一個(gè)實(shí)施例中身份驗(yàn)證系統(tǒng)的結(jié)構(gòu)框圖;
[0039] 圖11為另一個(gè)實(shí)施例中身份驗(yàn)證系統(tǒng)的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0040] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0041] 如圖1所示,在一個(gè)實(shí)施例中,提供了一種分類(lèi)器訓(xùn)練方法,用于訓(xùn)練獲得用于身 份驗(yàn)證的決策樹(shù)分類(lèi)器。該方法具體包括如下步驟:
[0042] 步驟102,獲取訓(xùn)練樣本集;訓(xùn)練樣本集中的每個(gè)訓(xùn)練樣本包括用戶(hù)身份屬性和 對(duì)應(yīng)預(yù)設(shè)分類(lèi)條件特征的特征值。
[0043]訓(xùn)練樣本集是用于訓(xùn)練決策樹(shù)分類(lèi)器的訓(xùn)練樣本的集合,其中的每個(gè)訓(xùn)練樣本包 括用戶(hù)身份屬性和預(yù)設(shè)分類(lèi)條件特征各自對(duì)應(yīng)的特征值,且預(yù)設(shè)分類(lèi)條件特征的種類(lèi)數(shù)為 兩個(gè)以上。用戶(hù)身份屬性為合法用戶(hù)和非法用戶(hù)中的一種,分別表示相應(yīng)的訓(xùn)練樣本是通 過(guò)或未通過(guò)身份驗(yàn)證的樣本數(shù)據(jù)。訓(xùn)練樣本集中既存在用戶(hù)身份屬性為合法用戶(hù)的訓(xùn)練樣 本,也存在用戶(hù)身份屬性為非法用戶(hù)的訓(xùn)練樣本。
[0044] 預(yù)設(shè)分類(lèi)條件特征是預(yù)先設(shè)定的需要從用戶(hù)證據(jù)數(shù)據(jù)中提取出的條件判斷式的 特征,用戶(hù)證據(jù)數(shù)據(jù)是用戶(hù)通過(guò)用戶(hù)終端提供的表示自己為合法用戶(hù)的證明數(shù)據(jù)。
[0045] 在一個(gè)實(shí)施例中,預(yù)設(shè)分類(lèi)條件特征可以包括但不限于是否有好友輔助驗(yàn)證,參 與好友輔助驗(yàn)證且輔助驗(yàn)證通過(guò)的好友個(gè)數(shù)是否超過(guò)預(yù)設(shè)個(gè)數(shù)閾值,是否有正確的歷史密 碼數(shù)據(jù)、正確的歷史密碼數(shù)據(jù)的量化分?jǐn)?shù)是否超過(guò)第一預(yù)設(shè)分?jǐn)?shù)閾值、是否有正確的賬號(hào) 常用地信息、正確的賬號(hào)常用地信息的量化分?jǐn)?shù)是否超過(guò)第二預(yù)設(shè)分?jǐn)?shù)閾值,用戶(hù)是否處 于國(guó)外異地和密碼變更次數(shù)是否在預(yù)設(shè)次數(shù)范圍內(nèi)中的至少兩種。
[0046] 其中好友輔助驗(yàn)證是指向與待驗(yàn)證用戶(hù)標(biāo)識(shí)具有通信好友關(guān)系的用戶(hù)標(biāo)識(shí)所對(duì) 應(yīng)的客戶(hù)端發(fā)送輔助驗(yàn)證請(qǐng)求,接收該客戶(hù)端返回的輔助驗(yàn)證結(jié)果。輔助驗(yàn)證結(jié)果包括通 過(guò)和未通過(guò),一般參與好友輔助驗(yàn)證且輔助驗(yàn)證通過(guò)的好友個(gè)數(shù)越多,越能說(shuō)明其為合法 用戶(hù)。歷史密碼數(shù)據(jù)是指曾經(jīng)使用過(guò)的密碼,對(duì)其量化可采用一條正確的歷史密碼數(shù)據(jù)對(duì) 應(yīng)一個(gè)預(yù)設(shè)分?jǐn)?shù),比如5分,則2條正確的歷史密碼數(shù)據(jù)則對(duì)應(yīng)10分。賬號(hào)常用地信息包 括一個(gè)物理位置,該物理位置的登錄次數(shù)和/或登錄時(shí)長(zhǎng)超過(guò)一定閾值,還可以包括相應(yīng) 的時(shí)間參數(shù),比如2014年常用地為上海,2013年常用地為深圳、成都。
[0047] 特征值是相應(yīng)的預(yù)設(shè)分類(lèi)條件特征的具體取值,但并非限定其必須用數(shù)值表示。 比如若預(yù)設(shè)分類(lèi)條件特征為"是否有好友輔助驗(yàn)證",則相應(yīng)的特征值為"是"或"否",且 "是"或"否"分別為一種特征值。還比如,若預(yù)設(shè)分類(lèi)條件特征為參與好友輔助驗(yàn)證且輔助 驗(yàn)證通過(guò)的好友個(gè)數(shù)范圍,則相應(yīng)的特征值可為{〇, 1到3個(gè),4個(gè)以上}中的一種。
[0048] 步驟104,根據(jù)一種預(yù)設(shè)分類(lèi)條件特征確定根結(jié)點(diǎn)處的分類(lèi)條件,根據(jù)根結(jié)點(diǎn)處的 分類(lèi)條件將訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行分類(lèi),獲得對(duì)應(yīng)根結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類(lèi)子集。
[0049] 對(duì)決策樹(shù)的訓(xùn)練從根結(jié)點(diǎn)開(kāi)始,具體根據(jù)訓(xùn)練樣本集中的訓(xùn)練樣本的多種預(yù)設(shè)分 類(lèi)條件特征中選擇的一種來(lái)確定根結(jié)點(diǎn)處的分類(lèi)條件。決策樹(shù)是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí) 算法,對(duì)決策樹(shù)分類(lèi)器的訓(xùn)練過(guò)程是根據(jù)一組無(wú)次序、無(wú)規(guī)則的元組得出決策樹(shù)分類(lèi)器表