本技術(shù)涉及身份認(rèn)證,特別是涉及一種針對身份認(rèn)證的攻擊檢測方法、裝置及電子設(shè)備。
背景技術(shù):
1、近年來,隨著智能設(shè)備的興起,對身份認(rèn)證的需求越來越大,身份認(rèn)證可以應(yīng)用于門禁、對講及電子商務(wù)等領(lǐng)域。在身份認(rèn)證時(shí),通常需要進(jìn)行針對假體攻擊的攻擊檢測。
2、相關(guān)技術(shù)中,針對基于朗讀指定驗(yàn)證文本來進(jìn)行身份認(rèn)證的方式而言,在進(jìn)行攻擊檢測時(shí),對用戶進(jìn)行身份認(rèn)證時(shí)所錄入的音頻和視頻進(jìn)行識(shí)別分析,得到用戶的面部運(yùn)動(dòng)起始時(shí)間以及音頻的語音起始時(shí)間,示例性的,面部運(yùn)動(dòng)起始時(shí)間可以是唇動(dòng)起始時(shí)間;利用面部運(yùn)動(dòng)起始時(shí)間和語音起始時(shí)間是否相匹配,分析是否存在假體攻擊。
3、但是,相關(guān)技術(shù)中僅僅以面部運(yùn)動(dòng)起始時(shí)間和語音起始時(shí)間是否相匹配來進(jìn)行攻擊檢測,判斷依據(jù)較為單一,導(dǎo)致攻擊檢測的準(zhǔn)確性較低。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的目的在于提供一種針對身份認(rèn)證的攻擊檢測方法、裝置及電子設(shè)備,以提高攻擊檢測的準(zhǔn)確性。具體技術(shù)方案如下:
2、第一方面,本技術(shù)實(shí)施例提供了一種針對身份認(rèn)證的攻擊檢測方法,包括:
3、對目標(biāo)音頻和目標(biāo)視頻分別進(jìn)行指定分段處理,得到多個(gè)數(shù)據(jù)段;其中,所述多個(gè)數(shù)據(jù)段包括各個(gè)音頻段和各個(gè)視頻段;所述目標(biāo)音頻和目標(biāo)視頻均為基于朗讀指定驗(yàn)證文本進(jìn)行用戶身份認(rèn)證時(shí),所錄入的內(nèi)容;
4、對各個(gè)音頻段進(jìn)行語音特征提取,得到各個(gè)音頻段的特征向量,以及對各個(gè)視頻段進(jìn)行面部運(yùn)動(dòng)特征提取,得到各個(gè)視頻段的特征向量;
5、基于所得到的各個(gè)特征向量,確定指定媒體類型的每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果;其中,每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果表征:該目標(biāo)數(shù)據(jù)段與對應(yīng)的目標(biāo)參考段之間的關(guān)于錄入時(shí)間的偏差,每一目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段為針對指定媒體類型的各個(gè)參考段中的、所表征朗讀內(nèi)容與該目標(biāo)數(shù)據(jù)段所表征的朗讀內(nèi)容相匹配的數(shù)據(jù)段;針對指定媒體類型的各個(gè)參考段包括多個(gè)數(shù)據(jù)段中的、屬于所述指定媒體類型以外的媒體類型的數(shù)據(jù)段;
6、基于每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定檢測結(jié)果;其中,所述檢測結(jié)果表征所述用戶身份認(rèn)證過程是否存在假體攻擊。
7、可選地,所述基于所得到的各個(gè)特征向量,確定指定媒體類型的每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,包括:
8、針對指定媒體類型的每一目標(biāo)數(shù)據(jù)段,基于該目標(biāo)數(shù)據(jù)段的特征向量以及各個(gè)參考段的特征向量,從各個(gè)參考段中,選取該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段;
9、針對每一目標(biāo)數(shù)據(jù)段,基于該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果。
10、可選地,所述針對指定媒體類型的每一目標(biāo)數(shù)據(jù)段,基于該目標(biāo)數(shù)據(jù)段的特征向量以及各個(gè)參考段的特征向量,從各個(gè)參考段中,選取該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段,包括:
11、針對指定媒體類型的每一目標(biāo)數(shù)據(jù)段,根據(jù)該目標(biāo)數(shù)據(jù)段的特征向量,從預(yù)先構(gòu)建的多個(gè)特征模板中,選取符合指定選取條件的特征模板,并基于所選取的特征模板以及各個(gè)參考段的特征向量,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段;
12、其中,每一特征模板包括一個(gè)第一特征向量和一個(gè)第二特征向量;所述第一特征向量表征樣本音頻段中的音頻特征;所述第二特征向量表征樣本視頻段中的面部運(yùn)動(dòng)特征;所述樣本音頻段為對樣本音頻進(jìn)行所述指定分段處理所得到的樣本段,所述樣本視頻段為對所述樣本視頻進(jìn)行所述指定分段處理所得到的樣本段,所述樣本音頻和樣本視頻均為基于朗讀樣本驗(yàn)證文本進(jìn)行樣本用戶身份認(rèn)證時(shí)所錄入的內(nèi)容,所述樣本音頻段和樣本視頻所對應(yīng)時(shí)間信息相同;
13、所述指定選取條件包括:所包含的指定特征向量與該目標(biāo)數(shù)據(jù)段的特征向量的距離最短;所述指定特征向量為所述第一類特征向量和第二類特征向量中的、關(guān)于所述指定媒體類型的樣本段的特征向量。
14、可選地,所述基于所選取的特征模板以及各個(gè)參考段的特征向量,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段,包括:
15、分別計(jì)算待利用特征向量與各個(gè)參考段的特征向量之間的距離;其中,所述待利用特征向量為所選取的特征模板中的除所述指定特征向量以外的特征向量;
16、確定距離最短的特征向量所屬的參考段,得到該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段。
17、可選地,所述各個(gè)音頻段以序列形式進(jìn)行存儲(chǔ),各個(gè)視頻段以序列形式進(jìn)行存儲(chǔ);
18、針對每一目標(biāo)數(shù)據(jù)段,基于該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,包括:
19、針對每一目標(biāo)數(shù)據(jù)段,確定該目標(biāo)數(shù)據(jù)段在所屬序列中的第一位置,以及該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段在所屬序列中的第二位置,并確定所述第一位置和第二位置的位置差值,得到該目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果。
20、可選地,所述基于每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定檢測結(jié)果,包括:
21、基于各個(gè)目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定各個(gè)數(shù)據(jù)段組對應(yīng)的偏差結(jié)果;其中,所述各個(gè)數(shù)據(jù)段組包含有所對應(yīng)時(shí)間信息相同的音頻段和視頻段;
22、根據(jù)每一數(shù)據(jù)段組對應(yīng)的偏差結(jié)果,確定位于預(yù)設(shè)偏差范圍的數(shù)據(jù)段組在各個(gè)數(shù)據(jù)段組中的占比,作為目標(biāo)占比;
23、基于所述目標(biāo)占比與預(yù)設(shè)閾值的大小關(guān)系,確定檢測結(jié)果。
24、可選地,所述基于所述目標(biāo)占比與預(yù)設(shè)閾值的大小關(guān)系,確定檢測結(jié)果,包括:
25、若所述目標(biāo)占比大于預(yù)設(shè)閾值,將第一結(jié)果,確定為檢測結(jié)果;
26、若所述目標(biāo)占比不大于所述預(yù)設(shè)閾值,將第二結(jié)果,確定為檢測結(jié)果;
27、其中,所述第一結(jié)果為表征所述用戶身份認(rèn)證過程不存在假體攻擊的結(jié)果;
28、所述第二結(jié)果為表征所述用戶身份認(rèn)證過程存在假體攻擊的結(jié)果。
29、可選地,所述指定媒體類型的數(shù)量為兩個(gè);
30、所述基于各個(gè)目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定各個(gè)數(shù)據(jù)段組對應(yīng)的偏差結(jié)果,包括:
31、針對每一數(shù)據(jù)段組,將屬于該數(shù)據(jù)段組的目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果進(jìn)行加權(quán)求平均,得到數(shù)據(jù)段組對應(yīng)的偏差結(jié)果。
32、可選地,所述對目標(biāo)音頻和目標(biāo)視頻分別進(jìn)行指定分段處理,得到多個(gè)數(shù)據(jù)段,包括:
33、按照預(yù)定步長及預(yù)定段長,分別對目標(biāo)音頻及目標(biāo)視頻進(jìn)行分段處理,得到多個(gè)數(shù)據(jù)段;其中,所述預(yù)定步長的取值小于所述預(yù)定段長的取值。
34、第二方面,本技術(shù)實(shí)施例提供了一種針對身份認(rèn)證的攻擊檢測裝置,包括:
35、指定分段處理模塊,用于對目標(biāo)音頻和目標(biāo)視頻分別進(jìn)行指定分段處理,得到多個(gè)數(shù)據(jù)段;其中,所述多個(gè)數(shù)據(jù)段包括各個(gè)音頻段和各個(gè)視頻段;所述目標(biāo)音頻和目標(biāo)視頻均為基于朗讀指定驗(yàn)證文本進(jìn)行用戶身份認(rèn)證時(shí),所錄入的內(nèi)容;
36、語音特征提取模塊,用于對各個(gè)音頻段進(jìn)行語音特征提取,得到各個(gè)音頻段的特征向量,以及對各個(gè)視頻段進(jìn)行面部運(yùn)動(dòng)特征提取,得到各個(gè)視頻段的特征向量;
37、第一確定模塊,用于基于所得到的各個(gè)特征向量,確定指定媒體類型的每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果;其中,每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果表征:該目標(biāo)數(shù)據(jù)段與對應(yīng)的目標(biāo)參考段之間的關(guān)于錄入時(shí)間的偏差,每一目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段為針對指定媒體類型的各個(gè)參考段中的、所表征朗讀內(nèi)容與該目標(biāo)數(shù)據(jù)段所表征的朗讀內(nèi)容相匹配的數(shù)據(jù)段;針對指定媒體類型的各個(gè)參考段包括多個(gè)數(shù)據(jù)段中的、屬于所述指定媒體類型以外的媒體類型的數(shù)據(jù)段;
38、第二確定模塊,用于基于每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定檢測結(jié)果;其中,所述檢測結(jié)果表征所述用戶身份認(rèn)證過程是否存在假體攻擊。
39、可選地,所述第一確定模塊,包括:
40、選取子模塊,用于針對指定媒體類型的每一目標(biāo)數(shù)據(jù)段,基于該目標(biāo)數(shù)據(jù)段的特征向量以及各個(gè)參考段的特征向量,從各個(gè)參考段中,選取該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段;
41、第一確定子模塊,用于針對每一目標(biāo)數(shù)據(jù)段,基于該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果。
42、可選地,所述選取子模塊,包括:
43、第一確定單元,用于針對指定媒體類型的每一目標(biāo)數(shù)據(jù)段,根據(jù)該目標(biāo)數(shù)據(jù)段的特征向量,從預(yù)先構(gòu)建的多個(gè)特征模板中,選取符合指定選取條件的特征模板,并基于所選取的特征模板以及各個(gè)參考段的特征向量,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段;
44、其中,每一特征模板包括一個(gè)第一特征向量和一個(gè)第二特征向量;所述第一特征向量表征樣本音頻段中的音頻特征;所述第二特征向量表征樣本視頻段中的面部運(yùn)動(dòng)特征;所述樣本音頻段為對樣本音頻進(jìn)行所述指定分段處理所得到的樣本段,所述樣本視頻段為對所述樣本視頻進(jìn)行所述指定分段處理所得到的樣本段,所述樣本音頻和樣本視頻均為基于朗讀樣本驗(yàn)證文本進(jìn)行樣本用戶身份認(rèn)證時(shí)所錄入的內(nèi)容,所述樣本音頻段和樣本視頻所對應(yīng)時(shí)間信息相同;
45、所述指定選取條件包括:所包含的指定特征向量與該目標(biāo)數(shù)據(jù)段的特征向量的距離最短;所述指定特征向量為所述第一類特征向量和第二類特征向量中的、關(guān)于所述指定媒體類型的樣本段的特征向量。
46、可選地,所述第一確定單元基于所選取的特征模板以及各個(gè)參考段的特征向量,確定該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段,包括:
47、分別計(jì)算待利用特征向量與各個(gè)參考段的特征向量之間的距離;其中,所述待利用特征向量為所選取的特征模板中的除所述指定特征向量以外的特征向量;
48、確定距離最短的特征向量所屬的參考段,得到該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段。
49、可選地,所述各個(gè)音頻段以序列形式進(jìn)行存儲(chǔ),各個(gè)視頻段以序列形式進(jìn)行存儲(chǔ);
50、所述第一確定子模塊,包括:
51、第二確定單元,用于針對每一目標(biāo)數(shù)據(jù)段,確定該目標(biāo)數(shù)據(jù)段在所屬序列中的第一位置,以及該目標(biāo)數(shù)據(jù)段對應(yīng)的目標(biāo)參考段在所屬序列中的第二位置,并確定所述第一位置和第二位置的位置差值,得到該目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果。
52、可選地,所述第二確定模塊,包括:
53、第二確定子模塊,用于基于各個(gè)目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定各個(gè)數(shù)據(jù)段組對應(yīng)的偏差結(jié)果;其中,所述各個(gè)數(shù)據(jù)段組包含有所對應(yīng)時(shí)間信息相同的音頻段和視頻段;
54、第三確定子模塊,用于根據(jù)每一數(shù)據(jù)段組對應(yīng)的偏差結(jié)果,確定位于預(yù)設(shè)偏差范圍的數(shù)據(jù)段組在各個(gè)數(shù)據(jù)段組中的占比,作為目標(biāo)占比;
55、第四確定子模塊,用于基于所述目標(biāo)占比與預(yù)設(shè)閾值的大小關(guān)系,確定檢測結(jié)果。
56、可選地,所述第四確定子模塊,包括:
57、第三確定單元,用于若所述目標(biāo)占比大于預(yù)設(shè)閾值,將第一結(jié)果,確定為檢測結(jié)果;
58、第四確定單元,用于若所述目標(biāo)占比不大于所述預(yù)設(shè)閾值,將第二結(jié)果,確定為檢測結(jié)果;
59、其中,所述第一結(jié)果為表征所述用戶身份認(rèn)證過程不存在假體攻擊的結(jié)果;
60、所述第二結(jié)果為表征所述用戶身份認(rèn)證過程存在假體攻擊的結(jié)果。
61、可選地,所述指定媒體類型的數(shù)量為兩個(gè);
62、所述第二確定子模塊,包括:
63、加權(quán)求平均單元,用于針對每一數(shù)據(jù)段組,將屬于該數(shù)據(jù)段組的目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果進(jìn)行加權(quán)求平均,得到數(shù)據(jù)段組對應(yīng)的偏差結(jié)果。
64、可選地,所述指定分段處理模塊,包括:
65、分段處理子模塊,用于按照預(yù)定步長及預(yù)定段長,分別對目標(biāo)音頻及目標(biāo)視頻進(jìn)行分段處理,得到多個(gè)數(shù)據(jù)段;其中,所述預(yù)定步長的取值小于所述預(yù)定段長的取值。
66、第三方面,本技術(shù)實(shí)施例提供了一種電子設(shè)備,包括:
67、存儲(chǔ)器,用于存放計(jì)算機(jī)程序;
68、處理器,用于執(zhí)行存儲(chǔ)器上所存放的程序時(shí),實(shí)現(xiàn)上述任一針對身份認(rèn)證的攻擊檢測方法。
69、第四方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一針對身份認(rèn)證的攻擊檢測方法。
70、本技術(shù)實(shí)施例有益效果:
71、本技術(shù)實(shí)施例提供的針對身份認(rèn)證的攻擊檢測方法,可以對目標(biāo)音頻和目標(biāo)視頻分別進(jìn)行指定分段處理,得到多個(gè)數(shù)據(jù)段,對各個(gè)音頻段及視頻段進(jìn)行特征提取,得到各個(gè)音頻段的特征向量及各個(gè)視頻段的特征向量,基于各個(gè)特征向量,確定指定媒體類型的每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,基于每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果,確定檢測結(jié)果。可見,本技術(shù)實(shí)施例可以對目標(biāo)音頻和目標(biāo)視頻進(jìn)行指定分段處理,從而在進(jìn)行針對身份認(rèn)證的攻擊檢測時(shí),以每一目標(biāo)數(shù)據(jù)段對應(yīng)的偏差結(jié)果作為判斷依據(jù),從而得到表征用戶身份認(rèn)證過程是否存在假體攻擊的檢測結(jié)果;而不是僅僅對面部運(yùn)動(dòng)的有效起止時(shí)間與語音的有效起止時(shí)間進(jìn)行相符判斷,從而得到檢測結(jié)果,故與現(xiàn)有技術(shù)相比,本技術(shù)實(shí)施例可以針對每一目標(biāo)數(shù)據(jù)段,判斷依據(jù)較為豐富,檢測結(jié)果的準(zhǔn)確性更高,從而可以提高攻擊檢測的準(zhǔn)確性。
72、另外,本技術(shù)實(shí)施例針對錄入的內(nèi)容語速較快或較慢,都可以先對其進(jìn)行分段處理,從而實(shí)現(xiàn)針對身份認(rèn)證的攻擊檢測,那么,由于本技術(shù)實(shí)施例是以每一目標(biāo)數(shù)據(jù)段的偏移結(jié)果作為判斷依據(jù),故本技術(shù)實(shí)施例中的判斷依據(jù)較為豐富,從而可以提高攻擊檢測的準(zhǔn)確性及針對身份認(rèn)證的防假能力。另外,本技術(shù)實(shí)施例采用了多點(diǎn)數(shù)據(jù)的統(tǒng)計(jì)方式,可以降低單點(diǎn)/少點(diǎn)數(shù)據(jù)的誤判概率,降低攻破身份認(rèn)證設(shè)備的概率。
73、當(dāng)然,實(shí)施本技術(shù)的任一產(chǎn)品或方法并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。