本發(fā)明涉及一種算法系統(tǒng)及方法,特別是涉及一種基于聲紋識(shí)別性別年齡的防欺詐系統(tǒng)及方法。
背景技術(shù):
現(xiàn)代網(wǎng)絡(luò)技術(shù)越來越發(fā)達(dá),網(wǎng)絡(luò)服務(wù)日益多樣化,尤其是網(wǎng)絡(luò)自動(dòng)化的信貸借款,但是這種服務(wù),難以遠(yuǎn)程對(duì)借貸人的真實(shí)身份進(jìn)行驗(yàn)證,因?yàn)榻杩钊擞锌赡芡ㄟ^偽造借貸資料(照片等申請(qǐng)材料)或者竊用他人資料來騙取貸款。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于聲紋識(shí)別性別年齡的防欺詐系統(tǒng)及方法,其能夠通過指紋識(shí)別,遠(yuǎn)程對(duì)借貸人的真實(shí)身份進(jìn)行驗(yàn)證,達(dá)到反欺詐的效果。
本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:一種基于聲紋識(shí)別性別年齡的防欺詐系統(tǒng),其包括語音數(shù)據(jù)收集模塊、mfcc特征提取模塊、基于Kmeans的聚類標(biāo)簽特征提取模塊、基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型模塊、模型預(yù)測(cè)模塊、檢驗(yàn)?zāi)K、身份資料提交模塊、欺詐概率計(jì)算模塊,語音數(shù)據(jù)收集模塊、mfcc特征提取模塊、基于Kmeans的聚類標(biāo)簽特征提取模塊、基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型模塊、模型預(yù)測(cè)模塊、檢驗(yàn)?zāi)K、欺詐概率計(jì)算模塊依次連接,身份資料提交模塊與檢驗(yàn)?zāi)K連接。
優(yōu)選地,所述語音數(shù)據(jù)收集模塊通過云呼叫系統(tǒng)實(shí)時(shí)收集借款人語音數(shù)據(jù)。
優(yōu)選地,所述檢驗(yàn)?zāi)K將系統(tǒng)提交的結(jié)果與預(yù)測(cè)的結(jié)果進(jìn)行交叉檢驗(yàn),并將檢驗(yàn)結(jié)果發(fā)送給欺詐概率計(jì)算模塊。
優(yōu)選地,所述mfcc特征提取模塊對(duì)語音數(shù)據(jù)收集模塊收集的數(shù)據(jù)進(jìn)行解析,并進(jìn)行mfcc特征提取。
優(yōu)選地,所述基于Kmeans的聚類標(biāo)簽特征提取模塊通過Kmeans的聚類方法,將數(shù)據(jù)分類后,分別研究不同聚類下數(shù)據(jù)的特點(diǎn)。
優(yōu)選地,所述基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型模塊利用標(biāo)注樣本進(jìn)行訓(xùn)練和分類。
優(yōu)選地,所述模型預(yù)測(cè)模塊通過對(duì)數(shù)據(jù)的分析,對(duì)目標(biāo)性別和年齡的真實(shí)性進(jìn)行判斷,得到其相應(yīng)概率。
優(yōu)選地,所述身份資料提交模塊用于收集借款人通過網(wǎng)絡(luò)借款平臺(tái)自動(dòng)提交的身份資料。
優(yōu)選地,所述欺詐概率計(jì)算模塊用于通過對(duì)交叉檢驗(yàn)的結(jié)果進(jìn)行數(shù)據(jù)分析,并計(jì)算出借款人欺詐的概率。
本發(fā)明還提供一種基于聲紋識(shí)別性別年齡的防欺詐方法,其包括以下步驟:
步驟一:借款人通過網(wǎng)絡(luò)借款平臺(tái)自行提交身份資料,并通過云呼叫系統(tǒng)實(shí)時(shí)收集借款人語音數(shù)據(jù);
步驟二:對(duì)于語音數(shù)據(jù)進(jìn)行mfcc特征提取;
步驟三:基于Kmeans的聚類標(biāo)簽特征提取;
步驟四:通過基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和分類;
步驟五:將提交結(jié)果與預(yù)測(cè)結(jié)果進(jìn)行交叉檢驗(yàn);
步驟六:計(jì)算借款人欺詐的概率。
優(yōu)選地,所述mfcc特征提取比基于聲道模型的LPCC相比具有更好的魯邦性,更符合人耳的聽覺特性,而且當(dāng)信噪比降低時(shí)仍然具有較好的識(shí)別性能。
優(yōu)選地,所述步驟四由訓(xùn)練資料中建立一個(gè)模式,并依此模式推測(cè)新的instances,訓(xùn)練資料是由輸入物件和預(yù)期輸出所組成,函數(shù)的輸出是一個(gè)連續(xù)的值,或是預(yù)測(cè)一個(gè)分類標(biāo)簽。
優(yōu)選地,所述步驟六若最終得出的概率大于50%,則判定為欺詐;若概率小于50%且大于5%,則返回步驟一重新收集語音數(shù)據(jù);若概率小于5%,則判定為非欺詐。
本發(fā)明的積極進(jìn)步效果在于:本發(fā)明能夠通過指紋識(shí)別,遠(yuǎn)程對(duì)借貸人的真實(shí)身份進(jìn)行驗(yàn)證,達(dá)到反欺詐的效果,保護(hù)消費(fèi)者合法權(quán)益以及維護(hù)網(wǎng)絡(luò)服務(wù)安全。
附圖說明
圖1為本發(fā)明的系統(tǒng)結(jié)構(gòu)圖。
圖2為本發(fā)明的系統(tǒng)流程圖。
具體實(shí)施方式
下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。
如圖1至圖2所示,本發(fā)明基于聲紋識(shí)別性別年齡的防欺詐系統(tǒng)包括語音數(shù)據(jù)收集模塊1、mfcc特征提取模塊2、基于Kmeans的聚類標(biāo)簽特征提取模塊3、基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型模塊4、模型預(yù)測(cè)模塊5、檢驗(yàn)?zāi)K6、身份資料提交模塊7、欺詐概率計(jì)算模塊8,語音數(shù)據(jù)收集模塊1、mfcc特征提取模塊2、基于Kmeans的聚類標(biāo)簽特征提取模塊3、基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型模塊4、模型預(yù)測(cè)模塊5、檢驗(yàn)?zāi)K6、欺詐概率計(jì)算模塊8依次連接,身份資料提交模塊7與檢驗(yàn)?zāi)K6連接。
語音數(shù)據(jù)收集模塊1通過云呼叫系統(tǒng)實(shí)時(shí)收集借款人語音數(shù)據(jù)。
mfcc特征提取模塊2對(duì)語音數(shù)據(jù)收集模塊1收集的數(shù)據(jù)進(jìn)行解析,并進(jìn)行mfcc特征提取。
基于Kmeans的聚類標(biāo)簽特征提取模塊3通過Kmeans的聚類方法,將數(shù)據(jù)分類后,分別研究不同聚類下數(shù)據(jù)的特點(diǎn)。
基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型模塊4利用標(biāo)注樣本進(jìn)行訓(xùn)練和分類。
模型預(yù)測(cè)模塊5通過對(duì)數(shù)據(jù)的分析,對(duì)目標(biāo)性別和年齡的真實(shí)性進(jìn)行判斷,得到其相應(yīng)概率。
檢驗(yàn)?zāi)K6將系統(tǒng)提交的結(jié)果與預(yù)測(cè)的結(jié)果進(jìn)行交叉檢驗(yàn),并將檢驗(yàn)結(jié)果發(fā)送給欺詐概率計(jì)算模塊8。
身份資料提交模塊7用于收集借款人通過網(wǎng)絡(luò)借款平臺(tái)自動(dòng)提交的身份資料。
欺詐概率計(jì)算模塊8用于通過對(duì)交叉檢驗(yàn)的結(jié)果進(jìn)行數(shù)據(jù)分析,并計(jì)算出借款人欺詐的概率。
本發(fā)明基于聲紋識(shí)別性別年齡的防欺詐方法包括以下步驟:
步驟一:借款人通過網(wǎng)絡(luò)借款平臺(tái)自行提交身份資料,并通過云呼叫系統(tǒng)實(shí)時(shí)收集借款人語音數(shù)據(jù)。
步驟二:對(duì)于語音數(shù)據(jù)進(jìn)行mfcc特征提取。mfcc特征提取比基于聲道模型的LPCC相比具有更好的魯邦性,更符合人耳的聽覺特性,而且當(dāng)信噪比降低時(shí)仍然具有較好的識(shí)別性能。
步驟三:基于Kmeans的聚類標(biāo)簽特征提取。該提取方法計(jì)算時(shí)間段短,速度快,容易解釋,聚類效果好。
步驟四:通過基于GBDT的有監(jiān)督學(xué)習(xí)分類器模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和分類。由訓(xùn)練資料中建立一個(gè)模式,并依此模式推測(cè)新的instances,訓(xùn)練資料是由輸入物件和預(yù)期輸出所組成,函數(shù)的輸出是一個(gè)連續(xù)的值,或是預(yù)測(cè)一個(gè)分類標(biāo)簽。
步驟五:將提交結(jié)果與預(yù)測(cè)結(jié)果進(jìn)行交叉檢驗(yàn)。
步驟六:計(jì)算借款人欺詐的概率。若概率大于50%,則判定為欺詐;若概率小于50%且大于5%,則返回步驟一重新收集語音數(shù)據(jù);若概率小于5%,則判定為非欺詐。
綜上所述,本發(fā)明能夠通過指紋識(shí)別,遠(yuǎn)程對(duì)借貸人的真實(shí)身份進(jìn)行驗(yàn)證,達(dá)到反欺詐的效果,保護(hù)消費(fèi)者合法權(quán)益以及維護(hù)網(wǎng)絡(luò)服務(wù)安全。
以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。