本發(fā)明屬于asr語音識(shí)別的防詐騙領(lǐng)域,具體是基于asr語音識(shí)別的防詐騙方法。
背景技術(shù):
1、隨著服務(wù)行業(yè)不斷地發(fā)展,以及營銷方式的多樣化,越來越多的企業(yè)實(shí)現(xiàn)電銷方式,服務(wù)自己的客戶,推銷自己的產(chǎn)品,往往這部分企業(yè)會(huì)選擇一家呼叫平臺(tái)方便自己業(yè)務(wù)的開展。這對呼叫平臺(tái)企業(yè)提出更高的要求,如何防止電話詐騙、網(wǎng)絡(luò)聊天詐騙等犯罪活動(dòng)。
2、針對電話詐騙的防范措施,現(xiàn)有技術(shù)主要通過手機(jī)詐騙人常用的電話號(hào)碼,建立一個(gè)詐騙號(hào)碼數(shù)據(jù)庫,然后設(shè)別來電號(hào)碼是否在該詐騙號(hào)碼數(shù)據(jù)庫中,如果當(dāng)前來電號(hào)碼在該數(shù)據(jù)庫中,則提示接聽電話的用戶當(dāng)前通話時(shí)詐騙電話,但是現(xiàn)有技術(shù)中,詐騙人可以通過更換電話號(hào)碼繼續(xù)行騙,因此防詐效果差,且若通過不斷更新詐騙號(hào)碼數(shù)據(jù)庫,較為繁瑣,防詐效率低;因此本發(fā)明提供了基于asr語音識(shí)別的防詐騙方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一;為此,本發(fā)明提出了基于asr語音識(shí)別的防詐騙方法,用于解決現(xiàn)有技術(shù)通過建立詐騙數(shù)據(jù)庫技術(shù)進(jìn)行詐騙識(shí)別,存在詐騙效果差和效率低的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明的第一方面提供了基于asr語音識(shí)別的防詐騙方法,包括以下步驟:
3、步驟一:提取待分析語音信號(hào),將待分析語音信號(hào)轉(zhuǎn)化為語音文本;
4、步驟二:識(shí)別待分析語音信號(hào)的語音特征;其中,語音特征包括語音強(qiáng)度和語速;
5、步驟三:基于語音文本和語音信息,計(jì)算待分析語音信號(hào)的詐騙分?jǐn)?shù),并分析是否存在詐騙行為;是,則評估詐騙等級(jí);否,則不做處理。
6、優(yōu)選的,所述提取待分析語音信號(hào),將待分析語音信號(hào)轉(zhuǎn)化為語音文本,包括:
7、將用戶的通話語音每隔n時(shí)長標(biāo)記為一段待分析語音信號(hào),并利用asr技術(shù)將待分析語音信號(hào)依次轉(zhuǎn)化為語音文本。
8、本發(fā)明通過將語音信號(hào)實(shí)時(shí)轉(zhuǎn)化為文本,系統(tǒng)能夠及時(shí)分析對話內(nèi)容,識(shí)別關(guān)鍵詞或短語,從而快速做出響應(yīng)或采取行動(dòng);這對于客服中心的情感分析、緊急呼叫中心的關(guān)鍵信息提取以及實(shí)時(shí)會(huì)議紀(jì)要生成等場景尤為重要;asr技術(shù)能夠自動(dòng)且連續(xù)地將語音轉(zhuǎn)換為文本,相較于人工聽寫,大大提高了工作效率。
9、優(yōu)選的,識(shí)別待分析語音信號(hào)的語音強(qiáng)度,包括:
10、對待分析語音信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換,得到待分析數(shù)字音頻信號(hào);將待分析數(shù)字音頻信號(hào)劃分為若干音頻時(shí)幀,計(jì)算各音頻時(shí)幀的平均能量,并通過公式計(jì)算得到待分析語音信號(hào)的語音強(qiáng)度lp;其中,pi為各音頻時(shí)幀的平均能量;p0為參考功率;i為各音頻時(shí)幀的編號(hào),i=0,1,…,n,n取正整數(shù)。
11、本發(fā)明通過數(shù)字信號(hào)具有抗干擾性強(qiáng)、易于存儲(chǔ)和傳輸?shù)奶攸c(diǎn),便于后續(xù)處理和分析;將不同來源和格式的語音信號(hào)統(tǒng)一轉(zhuǎn)換為數(shù)字信號(hào),方便標(biāo)準(zhǔn)化處理和算法應(yīng)用;將數(shù)字音頻信號(hào)按時(shí)間順序劃分為多個(gè)固定長度的音頻時(shí)幀,分析每個(gè)音頻時(shí)幀的平均能量,并求和,得到該待分析語音信號(hào)的強(qiáng)度,為后續(xù)分析語音信號(hào)的詐騙分?jǐn)?shù)奠定基礎(chǔ)。
12、優(yōu)選的,各音頻時(shí)幀的平均能量為每個(gè)音頻時(shí)幀中數(shù)字信號(hào)幅度的均方值。
13、優(yōu)選的,識(shí)別待分析語音信號(hào)的語速,包括:
14、根據(jù)待分析語音信號(hào)的語音文本,統(tǒng)計(jì)該語音文本的音節(jié)數(shù),通過公式y(tǒng)v=yjs/t計(jì)算得到待分析語音信號(hào)的語速yv;其中,yjs為音節(jié)數(shù),即語音文本中每個(gè)漢字為一個(gè)音節(jié);t為待分析語音信號(hào)的時(shí)長。
15、本發(fā)明將語速以每單位時(shí)間內(nèi)的音節(jié)數(shù)來表示,提供了一種標(biāo)準(zhǔn)化的測量方式,使得不同語音樣本間的語速比較成為可能;基于語音信號(hào)的實(shí)際內(nèi)容和時(shí)長計(jì)算,減少了主觀判斷的影響,提供了較為客觀的語速評價(jià)指標(biāo);以及研究發(fā)現(xiàn),語速的變化與個(gè)體的情緒狀態(tài)、心理壓力水平有關(guān),進(jìn)而從側(cè)面反映通話是否存在詐騙的可能性。
16、優(yōu)選的,所述基于語音文本和語音特征,計(jì)算待分析語音信號(hào)的詐騙分?jǐn)?shù),包括:
17、將待分析語音信號(hào)的語音文本和語音特征輸入至詐騙模型中,輸出待分析語音信號(hào)中存在的異常語音項(xiàng)的個(gè)數(shù);其中,詐騙模型基于mlp模型構(gòu)建;以及,
18、通過公式計(jì)算得到待分析語音信號(hào)的詐騙分?jǐn)?shù)zpf;其中,sc單個(gè)異常語音項(xiàng)的分?jǐn)?shù);m為待分析語音信號(hào)中存在的異常語音項(xiàng)的個(gè)數(shù);異常語音項(xiàng)包括敏感詞匯、異常語音強(qiáng)度和異常語速;異常語音強(qiáng)度為語音強(qiáng)度超過預(yù)設(shè)強(qiáng)度;異常語速為語速超過預(yù)設(shè)語速。
19、本發(fā)明綜合考慮敏感詞匯和語音特征,確保了對潛在詐騙行為的全面識(shí)別;利用mlp(多層感知器)模型的高效計(jì)算特性,能夠在短時(shí)間內(nèi)完成大量語音數(shù)據(jù)的分析,及時(shí)發(fā)現(xiàn)異常項(xiàng);通過計(jì)算異常語音項(xiàng)的總分?jǐn)?shù),直接反映待分析語音信號(hào)的詐騙可能性,便于進(jìn)行智能決策,有助于及時(shí)發(fā)現(xiàn)詐騙行為,為構(gòu)建安全的數(shù)字化社會(huì)做出了貢獻(xiàn)。
20、優(yōu)選的,所述詐騙模型基于mlp模型構(gòu)建,包括:
21、從歷史數(shù)據(jù)中提取若干語音信號(hào)的語音文本和語音特征,以及存在的異常語音項(xiàng)的個(gè)數(shù);
22、將語音信號(hào)的語音文本和語音特征作為mlp模型的輸入數(shù)據(jù);存在的異常語音項(xiàng)的個(gè)數(shù)作為mlp模型的輸出數(shù)據(jù);基于輸入數(shù)據(jù)和輸出數(shù)據(jù)對mlp模型進(jìn)行訓(xùn)練,得到詐騙模型。
23、本發(fā)明通過大量的歷史數(shù)據(jù),模型能學(xué)習(xí)到與詐騙相關(guān)的模式和規(guī)律,從而更準(zhǔn)確地識(shí)別出異常語音項(xiàng);歷史數(shù)據(jù)中的敏感詞匯和語音特征等,為模型提供了豐富的訓(xùn)練素材,確保其識(shí)別能力的有效性和可靠性;模型能夠自動(dòng)分析輸入的語音信號(hào)中存在的異常語音項(xiàng),無需人工干預(yù),大大提高了檢測效率。
24、優(yōu)選的,基于詐騙分?jǐn)?shù),所述分析是否存在詐騙行為,包括:
25、將詐騙分?jǐn)?shù)與預(yù)設(shè)分?jǐn)?shù)范圍進(jìn)行比較,若詐騙分?jǐn)?shù)低于預(yù)設(shè)分?jǐn)?shù)范圍,則待分析語音信號(hào)不存在詐騙現(xiàn)象;
26、若詐騙分?jǐn)?shù)在預(yù)設(shè)分?jǐn)?shù)范圍內(nèi),則待分析語音信號(hào)的詐騙等級(jí)為一級(jí),即存在輕微的詐騙現(xiàn)象;
27、若詐騙分?jǐn)?shù)大于預(yù)設(shè)分?jǐn)?shù)范圍,則待分析語音信號(hào)的詐騙等級(jí)為二級(jí),即存在嚴(yán)重的詐騙現(xiàn)象。
28、本發(fā)明通過將詐騙分?jǐn)?shù)映射到不同的預(yù)設(shè)范圍,可以明確地區(qū)分詐騙現(xiàn)象的輕微與嚴(yán)重程度,為后續(xù)的處理措施提供依據(jù),將抽象的詐騙可能性轉(zhuǎn)化為具體的數(shù)值,使得評估過程更加客觀、可量化的,便于統(tǒng)一標(biāo)準(zhǔn)和跨部門協(xié)作;且根據(jù)詐騙等級(jí)的不同,可以動(dòng)態(tài)調(diào)整響應(yīng)策略,如對輕微詐騙進(jìn)行監(jiān)控,而對嚴(yán)重詐騙則立即采取法律措施。
29、優(yōu)選的,當(dāng)詐騙等級(jí)為一級(jí),則發(fā)送詐騙預(yù)警信號(hào)至用戶端;當(dāng)詐騙等級(jí)為二級(jí)或連續(xù)若干次詐騙等級(jí)為一級(jí),則將進(jìn)行掛機(jī)操作。
30、優(yōu)選的,當(dāng)連續(xù)若干待分析語音信號(hào)不存在詐騙現(xiàn)象時(shí),將若干待分析語音信號(hào)的詐騙分?jǐn)?shù)進(jìn)行累加,將累加后的詐騙分?jǐn)?shù)與預(yù)設(shè)分?jǐn)?shù)范圍進(jìn)行比較,分析詐騙等級(jí),并采取措施。
31、本發(fā)明即使單次對話中詐騙分?jǐn)?shù)較低,但如果在一段時(shí)間內(nèi)頻繁出現(xiàn)輕微異常,累積的分?jǐn)?shù)可能揭示出潛在的詐騙模式或企圖;進(jìn)一步識(shí)別那些試圖通過分散、低頻度的嘗試來逃避即時(shí)檢測的詐騙行為,增強(qiáng)了系統(tǒng)的長期監(jiān)控效能,提高了警報(bào)的及時(shí)性和準(zhǔn)確性。
32、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
33、1.本發(fā)明通過提取待分析語音信號(hào),將待分析語音信號(hào)轉(zhuǎn)化為語音文本;識(shí)別待分析語音信號(hào)的語音特征;基于語音文本和語音特征,計(jì)算待分析語音信號(hào)的詐騙分?jǐn)?shù),并分析是否存在詐騙行為;是,則評估詐騙等級(jí);否,則不存在詐騙行為;通過綜合分析語音文本內(nèi)容、語音強(qiáng)度和語速三個(gè)維度,可以更全面地評估語音信號(hào)的正常性,有效提高識(shí)別詐騙行為的準(zhǔn)確率;
34、2.本發(fā)明對于連續(xù)若干待分析語音信號(hào)不存在詐騙現(xiàn)象時(shí),將若干待分析語音信號(hào)的詐騙分?jǐn)?shù)進(jìn)行累加,將累加后的詐騙分?jǐn)?shù)與預(yù)設(shè)分?jǐn)?shù)范圍進(jìn)行比較,分析是否存在詐騙行為;用于識(shí)別潛在的詐騙行為,避免某些詐騙者可能不會(huì)在一次通話中直接暴露其意圖,而是通過多次接觸逐步建立信任,然后實(shí)施詐騙;通過累加詐騙分?jǐn)?shù),系統(tǒng)可以捕捉到這種漸進(jìn)式的策略,防止因單次分析未達(dá)閾值而忽視了長期的潛在威脅。