本發(fā)明涉及計算機,特別是涉及一種基于多源數(shù)據(jù)的目標人群獲取方法、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著網(wǎng)絡(luò)技術(shù)的大力發(fā)展,用戶使用終端設(shè)備獲取各種通信服務(wù)、互聯(lián)網(wǎng)服務(wù)等各種信息服務(wù)。然而,一些對用戶的財產(chǎn)產(chǎn)生危害的危險互聯(lián)網(wǎng)行為也隨之產(chǎn)生并日趨嚴重,呈現(xiàn)多樣化、隱蔽性高等特點,從而會對用戶的信息和/或財產(chǎn)安全產(chǎn)生潛在的危險。因此,如果能夠準確識別出這種危險互聯(lián)網(wǎng)行為易感人群并進行預(yù)警,在一定程度上能夠?qū)ξkU互聯(lián)網(wǎng)行為起到預(yù)防作用。
技術(shù)實現(xiàn)思路
1、針對上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
2、本發(fā)明實施例提供一種基于多源數(shù)據(jù)的目標人群獲取方法,所述方法包括如下步驟:
3、s100,獲取候選用戶的互聯(lián)網(wǎng)興趣特征數(shù)據(jù)和互聯(lián)網(wǎng)行為特征數(shù)據(jù)對應(yīng)的第一預(yù)測值y1和第二預(yù)測值y2以及社會屬性數(shù)據(jù),其中,所述第一預(yù)測值y1為表征基于互聯(lián)網(wǎng)興趣特征數(shù)據(jù)預(yù)測對應(yīng)的候選用戶為目標人群的概率,所述第二預(yù)測值y2為表征基于互聯(lián)網(wǎng)行為特征數(shù)據(jù)預(yù)測對應(yīng)的候選用戶為目標人群的概率;
4、s200,獲取所述候選用戶的目標特征的第一權(quán)重,所述目標特征包括所述第一預(yù)測值、所述第二預(yù)測值和所述社會屬性數(shù)據(jù);
5、s300,基于所述目標特征的第一權(quán)重獲取初始標度值集,并基于所述初始標度值集獲取所述目標特征的初始判斷矩陣;
6、s400,對當前的判斷矩陣進行一致性檢驗,如果通過,執(zhí)行s500;否則,對當前標度值集進行調(diào)整,并基于調(diào)整后的標度值集調(diào)整所述當前的判斷矩陣,并執(zhí)行s400;
7、s500,基于當前的判斷矩陣獲取目標特征的第二權(quán)重,并基于所述目標特征和對應(yīng)的第二權(quán)重獲取候選用戶的目標值;執(zhí)行s600;
8、s600,如果所述候選用戶的目標值大于設(shè)定閾值,則將所述候選用戶設(shè)置為目標人群。
9、可選地,s300具體包括:
10、s301,將所述目標特征的第一權(quán)重按照升序或者降序的方式進行排序,得到第一權(quán)重序列l(wèi)={l1,l2,……,lp,……,lq},lp為l中的第p個權(quán)重,p的取值為1到q,q為l中的權(quán)重數(shù)量;
11、s302,獲取初始標度系數(shù)f0=d1q/(smax-1),d1q=∣△l1-△lq∣,smax為預(yù)設(shè)標度集中的最大標度值;
12、s303,獲取l中第k個權(quán)重lk和第g個權(quán)重lk+1之間的標度值skg=[∣△lk-△lg∣/f0]+1,[]表示取整,k和g的取值為1到q-1,并且k≠g;形成初始標度值集s0={skg};
13、s304,基于s0,構(gòu)建所述目標特征的初始判斷矩陣。
14、可選地,在s400中,對當前標度值集進行調(diào)整,并基于調(diào)整后的標度值集調(diào)整所述當前的判斷矩陣,具體包括:
15、s401,如果(sc-△b)>s2,執(zhí)行s402,否則,退出當前控制程序;sc為當前標度值集中的最大標度值,△b為相鄰兩個標度值之間的標度差,s2為預(yù)設(shè)標度值集中的第二小的標度值;
16、s402,獲取當前標度系數(shù)fc=d1q/(sc-△b-1);
17、s403,獲取lk和lk+1之間的調(diào)整標度值sckg=[∣△lk-△lg∣/fc]+1;得到調(diào)整后的標度值集sc={sckg};
18、s404,基于sc,調(diào)整當前的判斷矩陣。
19、可選地,所述預(yù)設(shè)標度值集為{1,2,……,9}。
20、可選地,所述互聯(lián)網(wǎng)興趣特征數(shù)據(jù)為app安裝數(shù)據(jù),所述互聯(lián)網(wǎng)行為特征數(shù)據(jù)為金融交易數(shù)據(jù)。
21、可選地,所述第一預(yù)測值和第二預(yù)測值基于線性回歸模型或者xgboost模型獲取。
22、可選地,所述第一權(quán)重基于xgboost模型獲取。
23、可選地,所述第一權(quán)重通過xgboost模型和專家經(jīng)驗獲取。
24、本發(fā)明實施例還提供一種非瞬時性計算機可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令或至少一段程序,其特征在于,所述至少一條指令或所述至少一段程序由處理器加載并執(zhí)行以實現(xiàn)前述方法。
25、本發(fā)明實施例還提供一種電子設(shè)備,包括處理器和前述的非瞬時性計算機可讀存儲介質(zhì)。
26、本發(fā)明至少具有以下有益效果:
27、本發(fā)明實施例提供的基于多源數(shù)據(jù)的目標人群獲取方法,能夠基于候選用戶的互聯(lián)網(wǎng)興趣特征數(shù)據(jù)、互聯(lián)網(wǎng)行為特征數(shù)據(jù)以及社會屬性數(shù)據(jù),構(gòu)建判斷矩陣來獲取候選用戶為目標人群的概率,能夠準確的識別出目標人群。
1.一種基于多源數(shù)據(jù)的目標人群獲取方法,其特征在于,所述方法包括如下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,s300具體包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在s400中,對當前標度值集進行調(diào)整,并基于調(diào)整后的標度值集調(diào)整所述當前的判斷矩陣,具體包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)標度值集為{1,2,……,9}。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述互聯(lián)網(wǎng)興趣特征數(shù)據(jù)為app安裝數(shù)據(jù),所述互聯(lián)網(wǎng)行為特征數(shù)據(jù)為金融交易數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一預(yù)測值和第二預(yù)測值基于線性回歸模型或者xgboost模型獲取。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一權(quán)重基于xgboost模型獲取。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一權(quán)重通過xgboost模型和專家經(jīng)驗獲取。
9.一種非瞬時性計算機可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令或至少一段程序,其特征在于,所述至少一條指令或所述至少一段程序由處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1-8中任意一項的所述方法。
10.一種電子設(shè)備,其特征在于,包括處理器和權(quán)利要求9中所述的非瞬時性計算機可讀存儲介質(zhì)。