本發(fā)明涉及數(shù)據(jù)分析與監(jiān)測,是基于短信數(shù)據(jù)與ai融合的欺詐行為識(shí)別方法及預(yù)警系統(tǒng)。
背景技術(shù):
1、短信注冊行為在各類在線服務(wù)中已成為用戶身份驗(yàn)證和注冊的主要手段,然而,隨之而來的欺詐行為也呈現(xiàn)出多樣化和智能化的趨勢,給企業(yè)和用戶帶來了巨大的風(fēng)險(xiǎn)和損失。現(xiàn)有的欺詐行為識(shí)別技術(shù)雖然在一定程度上能夠檢測和預(yù)防欺詐行為,但仍存在以下幾個(gè)顯著的不足之處:現(xiàn)有的欺詐行為識(shí)別方法通常依賴于單一平臺(tái)的數(shù)據(jù)分析,缺乏對用戶跨平臺(tái)行為的全面跟蹤和分析,導(dǎo)致了無法全面把握用戶的行為特征,容易遺漏跨平臺(tái)欺詐行為的線索;現(xiàn)有的欺詐識(shí)別模型多為靜態(tài)分析模型,難以應(yīng)對動(dòng)態(tài)變化的欺詐手段,欺詐者可以通過不斷變化的ip地址、設(shè)備id等信息來規(guī)避檢測,使得靜態(tài)模型難以捕捉到這些變化;此外,傳統(tǒng)的欺詐識(shí)別系統(tǒng)通常是基于歷史數(shù)據(jù)進(jìn)行分析,針對于電子欺詐行為識(shí)別這一類需要高度時(shí)效性的數(shù)據(jù)分析過程,缺乏實(shí)時(shí)性,無法及時(shí)捕捉到瞬時(shí)出現(xiàn)的高風(fēng)險(xiǎn)行為,動(dòng)態(tài)性不足。
技術(shù)實(shí)現(xiàn)思路
1、本部分的目的在于概述本發(fā)明的實(shí)施例的一些方面以及簡要介紹一些較佳實(shí)施例。在本部分以及本技術(shù)的說明書摘要和發(fā)明名稱中可能會(huì)做些簡化或省略以避免使本部分、說明書摘要和發(fā)明名稱的目的模糊,而這種簡化或省略不能用于限制本發(fā)明的范圍。
2、本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)中,欺詐行為識(shí)別方法通常依賴于單一平臺(tái)的歷史數(shù)據(jù)分析,容易遺漏重要欺詐線索且欺詐行為識(shí)別數(shù)據(jù)時(shí)效性低的問題,提出了基于短信數(shù)據(jù)與ai融合的欺詐行為識(shí)別方法及預(yù)警系統(tǒng)。
3、為了達(dá)到上述目的,本發(fā)明基于短信數(shù)據(jù)與ai融合的欺詐行為識(shí)別方法的技術(shù)方案包括如下步驟:
4、s1:接入運(yùn)營商云端數(shù)據(jù)庫端口,實(shí)時(shí)提取各個(gè)基站的短信注冊行為相關(guān)的行為狀態(tài)數(shù)據(jù);
5、s2:將所述行為狀態(tài)數(shù)據(jù)導(dǎo)入注冊行為可疑指數(shù)評估策略中,計(jì)算獲取每個(gè)短信注冊行為的可疑指數(shù);
6、s3:根據(jù)所述可疑指數(shù),對短信注冊行為進(jìn)行初步動(dòng)態(tài)識(shí)別處理,獲得第一可疑短信注冊行為集合;
7、s4:對第一可疑短信注冊行為集合中的所有可疑短信注冊行為對應(yīng)的請求客戶端進(jìn)行跨平臺(tái)活動(dòng)跟蹤處理,獲得跨平臺(tái)行徑跟蹤數(shù)據(jù);
8、s5:構(gòu)建ai融合分析模型,將所述可疑指數(shù)和所述跨平臺(tái)行徑跟蹤數(shù)據(jù)導(dǎo)入ai融合分析模型,輸出可疑指數(shù)置信度;
9、s6:將可疑指數(shù)置信度導(dǎo)入信用波動(dòng)分析策略中,輸出可疑指數(shù)置信度的波動(dòng)比率,并根據(jù)可疑指數(shù)置信度的波動(dòng)比率對短信注冊行為進(jìn)行行為最終識(shí)別處理。
10、具體地,s2中,所述注冊行為可疑指數(shù)評估策略包括:基站可疑評估子策略和用戶可疑評估子策略;
11、所述基站可疑評估子策略具體為:
12、s21:實(shí)時(shí)提取當(dāng)前時(shí)間點(diǎn)下,各個(gè)基站的短信注冊行為總數(shù)量以及行為狀態(tài)數(shù)據(jù),其中,基站總數(shù)為g;
13、在時(shí)間點(diǎn)為time時(shí),各個(gè)基站的短信注冊行為總數(shù)量為j,j為下標(biāo),是短信注冊行為總數(shù)量的索引;
14、s22:以第j個(gè)短信注冊行為評估中心,計(jì)算第j個(gè)短信注冊行為評估中心與請求基站的注冊位置距離,同步計(jì)算剩余的j-1短信注冊行為與請求基站的注冊位置距離,構(gòu)成剩余注冊位置距離集合a,,;h為集合a中數(shù)據(jù)量的總數(shù),h為集合a的索引,為第h個(gè)短信注冊行為與請求基站的注冊位置距離;
15、s23:根據(jù)s21-s22,計(jì)算獲取基站可疑因子,具體為:
16、;
17、其中,表示第j個(gè)短信注冊行為的基站可疑因子。
18、具體地,所述用戶可疑評估子策略具體包括:
19、s24:以第j個(gè)短信注冊行為評估中心,計(jì)算剩余的j-1短信注冊行為與第j個(gè)短信注冊行為之間的ip地址八位組的重復(fù)數(shù)量;
20、s25:預(yù)設(shè)注冊ip地址的標(biāo)準(zhǔn)重復(fù)數(shù)量,篩選所述重復(fù)數(shù)量中,大于或等于所述標(biāo)準(zhǔn)重復(fù)數(shù)量的短信注冊行為,提取篩選獲得的短信注冊行為的注冊完成時(shí)間戳,構(gòu)成注冊完成時(shí)間戳集合b,,,g為集合b中數(shù)據(jù)量的總數(shù),g為集合b的索引,為第g個(gè)短信注冊行為的注冊完成時(shí)間戳;
21、s26:根據(jù)s24-s25,計(jì)算獲取用戶可疑因子,具體為:
22、;
23、其中,表示第j個(gè)短信注冊行為的用戶可疑因子;
24、為第j個(gè)短信注冊行為的注冊完成時(shí)間戳;
25、s27:根據(jù)s21-s26,融合計(jì)算短信注冊行為的可疑指數(shù)s,具體為:,分別為基站可疑因子和用戶可疑因子的比例系數(shù)。
26、具體地,s3中,所述初步動(dòng)態(tài)識(shí)別處理包括:在當(dāng)前時(shí)間點(diǎn)下,獲取同一基站中所有短信注冊行為的可疑指數(shù),并將所有所有短信注冊行為的可疑指數(shù)進(jìn)行升序排列,取序列的中位可疑指數(shù)作為動(dòng)態(tài)識(shí)別基線,標(biāo)記可疑指數(shù)超過動(dòng)態(tài)識(shí)別基線的短信注冊行為為第一可疑短信注冊行為集合,同時(shí)對第一可疑短信注冊行為集合中所有短信注冊行為的請求客戶端發(fā)出欺詐疑似提醒,其中,第一可疑短信注冊行為集合中可疑短信注冊行為的總數(shù)量為i,i為第一可疑短信注冊行為集合的索引;第一可疑短信注冊行為集合中,可疑短信注冊行為的可疑指數(shù)集合c為。
27、具體地,s4包括如下具體步驟:
28、s41:對第一可疑短信注冊行為集合中的所有可疑短信注冊行為對應(yīng)的請求客戶端進(jìn)行跨平臺(tái)獲得跟蹤處理,其中,所述跨平臺(tái)活動(dòng)跟蹤處理包括:在短信注冊行為完成后,對短信注冊行為的請求客戶端進(jìn)行跨平臺(tái)活動(dòng)跟蹤處理;
29、s42:提取跨平臺(tái)行徑跟蹤數(shù)據(jù),當(dāng)跟蹤到請求客戶端出現(xiàn)5次跨平臺(tái)活動(dòng)時(shí),觸發(fā)ai融合分析模型運(yùn)行,執(zhí)行步驟s5,反之,繼續(xù)進(jìn)行跨平臺(tái)活動(dòng)跟蹤。
30、進(jìn)一步地,所述跨平臺(tái)行徑跟蹤數(shù)據(jù)包括:跨平臺(tái)登陸時(shí),請求客戶端的ip地址數(shù)據(jù)、登錄時(shí)間、登錄設(shè)備id數(shù)據(jù)、瀏覽器指紋、屏幕分辨率和手機(jī)號碼。
31、具體地,s5包括如下具體步驟:
32、s51:構(gòu)建ai融合分析模型;
33、s52:將所述可疑指數(shù)和所述跨平臺(tái)行徑跟蹤數(shù)據(jù)導(dǎo)入ai融合分析模型,輸出可疑指數(shù)置信度,其中,所述ai融合分析模型的輸出公式為:
34、;
35、其中,為第i個(gè)可疑短信注冊行為的可疑指數(shù)置信度;
36、表示第i個(gè)可疑短信注冊行為的請求客戶端的跨平臺(tái)行徑跟蹤數(shù)據(jù)的類別總數(shù)量,為跨平臺(tái)行徑跟蹤數(shù)據(jù)的序號索引;
37、x為下標(biāo),是5次跨平臺(tái)活動(dòng)的序號索引;
38、為跨平臺(tái)活動(dòng)的權(quán)重系數(shù);
39、表示第x次跨平臺(tái)活動(dòng)的跨平臺(tái)行徑跟蹤數(shù)據(jù)的數(shù)據(jù)量;
40、表示5次跨平臺(tái)活動(dòng)的跨平臺(tái)行徑跟蹤數(shù)據(jù)的數(shù)據(jù)量均值;
41、為可疑指數(shù)集合c中可疑指數(shù)的平均值。
42、具體地,s6中,所述信用波動(dòng)分析策略具體如下:
43、;
44、其中,第i個(gè)可疑短信注冊行為的請求客戶端,第5次被跟蹤到跨平臺(tái)活動(dòng)的時(shí)間點(diǎn)與第i個(gè)可疑短信注冊行為完成時(shí)間點(diǎn)距離e個(gè)欺詐監(jiān)測單位時(shí)段,e為下標(biāo),為欺詐監(jiān)測單位時(shí)段的索引;
45、bd可疑指數(shù)置信度的波動(dòng)比率;
46、第e個(gè)欺詐監(jiān)測單位時(shí)段內(nèi),表示第i個(gè)可疑短信注冊行為的可疑指數(shù)置信度;分別表示,i個(gè)可疑短信注冊行為的最大可疑指數(shù)置信度和最小可疑指數(shù)置信度。
47、具體地,s6中,所述行為最終識(shí)別處理包括:預(yù)設(shè)可疑指數(shù)置信度的波動(dòng)比率的最大波動(dòng)承受值,當(dāng)可疑短信注冊行為的可疑指數(shù)置信度的波動(dòng)比率超過最大波動(dòng)承受值時(shí),返回提取可疑短信注冊行為中的短信內(nèi)文本,對短信文本進(jìn)行文本預(yù)處理,包括:去除文本中的特殊符號、標(biāo)點(diǎn)符號、html標(biāo)簽及噪音信息,篩選并過濾停用詞,接入欺詐短信大語言模型,在欺詐短信大語言模型中匹配與本個(gè)短信注冊行為中的短信內(nèi)文本重復(fù)的單詞或短語序列,根據(jù)文本匹配度重復(fù)確認(rèn)該短信注冊行為是否存在欺詐。
48、具體地,s6中,所述行為最終識(shí)別處理還包括:當(dāng)可疑短信注冊行為的可疑指數(shù)置信度的波動(dòng)比率小于或等于最大波動(dòng)承受值時(shí),確認(rèn)該短信注冊行為存在欺詐,將該短信注冊行為對應(yīng)的請求客戶端標(biāo)記并可視化于欺詐管理平臺(tái)的欺詐行為分布地圖中,同時(shí)根據(jù)短信注冊行為的可疑指數(shù)s生成梯度熱力圖像,進(jìn)行分類警示處理。
49、另外,本發(fā)明基于短信數(shù)據(jù)與ai融合的欺詐行為預(yù)警系統(tǒng)包括如下模塊:
50、行為狀態(tài)數(shù)據(jù)采集模塊、可疑指數(shù)評估模塊、初步動(dòng)態(tài)識(shí)別模塊、活動(dòng)跟蹤模塊、可疑指數(shù)置信評價(jià)模塊、行為最終識(shí)別模塊和欺詐報(bào)警模塊;
51、所述行為狀態(tài)數(shù)據(jù)采集模塊用于接入運(yùn)營商云端數(shù)據(jù)庫端口,實(shí)時(shí)提取各個(gè)基站的短信注冊行為相關(guān)的行為狀態(tài)數(shù)據(jù);
52、所述可疑指數(shù)評估模塊用于將所述行為狀態(tài)數(shù)據(jù)導(dǎo)入注冊行為可疑指數(shù)評估策略中,計(jì)算獲取每個(gè)短信注冊行為的可疑指數(shù);
53、所述初步動(dòng)態(tài)識(shí)別模塊根據(jù)所述可疑指數(shù),對短信注冊行為進(jìn)行初步動(dòng)態(tài)識(shí)別處理,獲得第一可疑短信注冊行為集合;
54、所述活動(dòng)跟蹤模塊用于對第一可疑短信注冊行為集合中的所有可疑短信注冊行為對應(yīng)的請求客戶端進(jìn)行跨平臺(tái)活動(dòng)跟蹤處理,獲得跨平臺(tái)行徑跟蹤數(shù)據(jù);
55、所述可疑指數(shù)置信評價(jià)模塊用于構(gòu)建ai融合分析模型,將所述可疑指數(shù)和所述跨平臺(tái)行徑跟蹤數(shù)據(jù)導(dǎo)入ai融合分析模型,輸出可疑指數(shù)置信度;
56、所述行為最終識(shí)別模塊用于將可疑指數(shù)置信度導(dǎo)入信用波動(dòng)分析策略中,輸出可疑指數(shù)置信度的波動(dòng)比率,并根據(jù)可疑指數(shù)置信度的波動(dòng)比率對短信注冊行為進(jìn)行行為最終識(shí)別處理;
57、所述欺詐報(bào)警模塊根據(jù)行為最終識(shí)別處理結(jié)果,進(jìn)行分類警示處理。
58、一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有指令,當(dāng)計(jì)算機(jī)讀取所述指令時(shí),使所述計(jì)算機(jī)執(zhí)行所述的基于短信數(shù)據(jù)與ai融合的欺詐行為識(shí)別方法。
59、一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的基于短信數(shù)據(jù)與ai融合的欺詐行為識(shí)別方法。
60、與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)效果如下:
61、1、本發(fā)明通過實(shí)時(shí)跟蹤用戶在不同平臺(tái)上的注冊和登錄行為,有效捕捉跨平臺(tái)欺詐行為的線索,打破了數(shù)據(jù)孤島問題,提高了欺詐識(shí)別的全面性和準(zhǔn)確性。
62、2、本發(fā)明通過融合多種行為數(shù)據(jù)(如ip地址、設(shè)備id、瀏覽器指紋等),提供了多維度的分析視角,避免單一維度數(shù)據(jù)的局限性,增強(qiáng)了欺詐行為的識(shí)別能力,同時(shí)通過ai融合分析模型輸出的可疑指數(shù)置信度和信用波動(dòng)分析,提供了更為科學(xué)的風(fēng)險(xiǎn)評估結(jié)果,幫助欺詐平臺(tái)管理人員在決策過程中減少誤判,提高欺詐風(fēng)險(xiǎn)管理的效率和欺詐識(shí)別的準(zhǔn)確率。
63、3、本發(fā)明利用動(dòng)態(tài)識(shí)別處理機(jī)制和實(shí)時(shí)數(shù)據(jù)提取,系統(tǒng)能夠迅速捕捉到異常行為,并及時(shí)發(fā)出預(yù)警,大大縮短了從發(fā)現(xiàn)可疑行為到預(yù)警的時(shí)間間隔,有效提升了系統(tǒng)的實(shí)時(shí)性。
64、4、本發(fā)明相比于現(xiàn)有的欺詐識(shí)別方法中直接依賴短信文本內(nèi)容進(jìn)行分析,考慮到設(shè)備信息(如ip地址、設(shè)備id、瀏覽器指紋等)能夠提供更為客觀和穩(wěn)定的行為特征,相比短信文本內(nèi)容更為可靠且處理起來更為迅速;在面對動(dòng)態(tài)變化的欺詐手段時(shí),本發(fā)明通過先初步動(dòng)態(tài)識(shí)別處理(設(shè)備信息)后行為最終識(shí)別處理(短信文本內(nèi)容)的輔助驗(yàn)證模式,顯著提高了欺詐行為識(shí)別效率且形成了多層次的防御體系,避免了對正常用戶的誤判,有效減少了誤報(bào)率。