本發(fā)明涉及計(jì)算機(jī),特別是涉及一種風(fēng)險(xiǎn)預(yù)測(cè)方法、計(jì)算設(shè)備及可計(jì)算機(jī)讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著數(shù)據(jù)量的爆炸式增長(zhǎng)和數(shù)據(jù)環(huán)境的復(fù)雜化,傳統(tǒng)方法在處理大規(guī)模數(shù)據(jù)和捕捉復(fù)雜模式方面顯得力不從心。
2、例如,現(xiàn)有的稅務(wù)風(fēng)險(xiǎn)預(yù)測(cè)技術(shù)在特別提取、模型訓(xùn)練優(yōu)化等方面均存在顯著不足,難以滿足當(dāng)前復(fù)雜稅務(wù)環(huán)境下對(duì)于稅務(wù)風(fēng)險(xiǎn)預(yù)測(cè)的高效性、準(zhǔn)確性和適應(yīng)性的需求。
3、因此,亟需一種能準(zhǔn)確、高效地進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)的方法。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)的目的在于提供一種風(fēng)險(xiǎn)預(yù)測(cè)方法、計(jì)算設(shè)備及可讀存儲(chǔ)介質(zhì),準(zhǔn)確且高效地進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)。
2、為達(dá)到上述目的:
3、第一方面,本技術(shù)實(shí)施例提供了一種風(fēng)險(xiǎn)預(yù)測(cè)方法,包括:從參考數(shù)據(jù)集中,獲取與風(fēng)險(xiǎn)信息關(guān)聯(lián)的關(guān)鍵特征集;通過第一層生成器根據(jù)所述關(guān)鍵特征集,生成初始虛擬數(shù)據(jù)集,并通過第二層生成器根據(jù)所述初始虛擬數(shù)據(jù)集,生成優(yōu)化虛擬數(shù)據(jù)集;通過第一判別器,對(duì)所述初始虛擬數(shù)據(jù)集與所述參考數(shù)據(jù)集進(jìn)行分類,以得到第一分類結(jié)果,并通過第二判別器對(duì)所述優(yōu)化虛擬數(shù)據(jù)集和所述參考數(shù)據(jù)集進(jìn)行分類,以得到第二分類結(jié)果;根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果,優(yōu)化所述第一層生成器和所述第二層生成器,以得到最終虛擬數(shù)據(jù)集;基于所述最終虛擬數(shù)據(jù)集,優(yōu)化風(fēng)險(xiǎn)預(yù)測(cè)模型,以得到優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型;基于所述優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型,得到風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果。
4、在一實(shí)施方式中,通過第一層生成器根據(jù)所述關(guān)鍵特征集,生成初步虛擬數(shù)據(jù)集的步驟,包括:通過所述第一層生成器根據(jù)所述關(guān)鍵特征集,基于公式(1)的所述第一層生成器的生成函數(shù),生成所述初步虛擬數(shù)據(jù)集:其中,z1是從標(biāo)準(zhǔn)正態(tài)分布中采樣的第一噪聲向量,σ1是第一非線性激活函數(shù),w1是第一層生成器的權(quán)重矩陣,t1是所述第一層生成器的權(quán)重矩陣的轉(zhuǎn)置,b1是第一偏置向量,αi是與所述關(guān)鍵特征集中的關(guān)鍵特征k′i相關(guān)的權(quán)重系數(shù),r是所述關(guān)鍵特征集中的所述關(guān)鍵特征的數(shù)量,i為所述關(guān)鍵特征的序號(hào);和/或通過第二層生成器根據(jù)所述初步虛擬數(shù)據(jù)集,生成優(yōu)化虛擬數(shù)據(jù)集的步驟,包括:所述第二層生成器根據(jù)所述初步虛擬數(shù)據(jù)集,基于公式(2)的所述第二層生成器的生成函數(shù),生成所述優(yōu)化虛擬數(shù)據(jù)集:其中,z1是從標(biāo)準(zhǔn)正態(tài)分布中采樣的第二噪聲向量,σ2是第二非線性激活函數(shù),w2是第二層生成器的權(quán)重矩陣,t2是所述第二層生成器的權(quán)重矩陣的轉(zhuǎn)置,b2是第二層生成器的偏置向量,βj是與初步虛擬數(shù)據(jù)相關(guān)的權(quán)重系數(shù),vi,j表示初步虛擬數(shù)據(jù)集中的數(shù)據(jù),s1是初始虛擬數(shù)據(jù)集中的數(shù)據(jù)的數(shù)量,j為初始虛擬數(shù)據(jù)集中的數(shù)據(jù)的序號(hào)。
5、在一實(shí)施方式中,通過第一判別器,對(duì)所述初步虛擬數(shù)據(jù)集與參考數(shù)據(jù)集進(jìn)行分類,以得到第一分類結(jié)果的步驟,包括:通過所述第一判別器,基于公式(3),得到所述第一分類結(jié)果:其中,d1(x1)是所述第一分類結(jié)果,x1是所述初步虛擬數(shù)據(jù)集中的虛擬數(shù)據(jù),或是所述參考數(shù)據(jù)集中的參考數(shù)據(jù),是所述第一判別器的權(quán)重矩陣,是第一判別器的偏置向量,σ3是第三非線性激活函數(shù);和/或通過第二判別器對(duì)所述優(yōu)化虛擬數(shù)據(jù)集和所述參考數(shù)據(jù)集進(jìn)行分類,以得到第二分類結(jié)果的步驟,包括:通過所述第二判別器,基于公式(4),得到所述第二分類結(jié)果:其中,d2(x2)是所述第二分類結(jié)果,x2是所述優(yōu)化虛擬數(shù)據(jù)集中的數(shù)據(jù),或是所述參考數(shù)據(jù)集中的數(shù)據(jù),是所述第二判別器的權(quán)重矩陣,是所述第二判別器的偏置向量,σ4是第四非線性激活函數(shù)。
6、在一實(shí)施方式中,根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果,優(yōu)化所述第一層生成器和所述第二層生成器,以得到最終虛擬數(shù)據(jù)集的步驟,包括:根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果,計(jì)算所述第一層生成器和所述第二層生成器的損失函數(shù);通過最小化所述第一層生成器和所述第二層生成器的損失函數(shù),優(yōu)化所述第一層生成器和所述第二層生成器,以得到優(yōu)化后的第一層生成器和優(yōu)化后的第二層生成器;基于所述優(yōu)化后的第一層生成器和所述優(yōu)化后的第二層生成器,得到所述最終虛擬數(shù)據(jù)集。
7、在一實(shí)施方式中,通過最小化所述第一層生成器和所述第二層生成器的損失函數(shù),優(yōu)化所述第一層生成器和所述第二層生成器,以得到優(yōu)化后的第一層生成器和優(yōu)化后的第二層生成器的步驟,包括:基于公式(5),通過最小化所述第一層生成器和所述第二層生成器的損失函數(shù),優(yōu)化所述第一層生成器和所述第二層生成器,以得到優(yōu)化后的第一層生成器和優(yōu)化后的第二層生成器:其中,和分別為所述優(yōu)化后的第一層生成器和所述優(yōu)化后的第二層生成器,g1為所述第一層生成器,g2為所述第二層生成器,為所述第一層生成器的損失函數(shù),為所述第二層生成器的損失函數(shù)。
8、在一實(shí)施方式中,基于所述最終虛擬數(shù)據(jù)集,優(yōu)化風(fēng)險(xiǎn)預(yù)測(cè)模型的步驟,包括如下至少一項(xiàng):基于所述關(guān)鍵特征集,構(gòu)建所述風(fēng)險(xiǎn)預(yù)測(cè)模型;將所述風(fēng)險(xiǎn)預(yù)測(cè)模型進(jìn)行初始化訓(xùn)練;
9、基于所述最終虛擬數(shù)據(jù)集,對(duì)進(jìn)行初始化訓(xùn)練后的風(fēng)險(xiǎn)預(yù)測(cè)模型進(jìn)行對(duì)抗訓(xùn)練,以得到優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型。
10、在一實(shí)施方式中,基于所述優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型,得到風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果的步驟,包括:利用遷移學(xué)習(xí)技術(shù),將新特征集映射到所述優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型中,以得到遷移學(xué)習(xí)損失函數(shù);通過最小化所述遷移學(xué)習(xí)損失函數(shù),對(duì)所述優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型進(jìn)行調(diào)整,以得到最終的風(fēng)險(xiǎn)預(yù)測(cè)模型;根據(jù)所述最終的風(fēng)險(xiǎn)預(yù)測(cè)模型,得到所述風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果。
11、在一實(shí)施方式中,根據(jù)所述最終的風(fēng)險(xiǎn)預(yù)測(cè)模型,得到所述風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果的步驟,包括:通過所述最終的風(fēng)險(xiǎn)預(yù)測(cè)模型,得到多個(gè)高風(fēng)險(xiǎn)場(chǎng)景;對(duì)每個(gè)所述高風(fēng)險(xiǎn)場(chǎng)景進(jìn)行模擬分析,以得到模擬分析結(jié)果;基于所述模擬分析結(jié)果,得到所述風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果中的風(fēng)險(xiǎn)評(píng)估報(bào)告。
12、第二方面,本技術(shù)實(shí)施例提供一種計(jì)算設(shè)備,包括:處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,在所述處理器運(yùn)行所述計(jì)算機(jī)程序時(shí),實(shí)現(xiàn)上述風(fēng)險(xiǎn)預(yù)測(cè)方法。
13、第三方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述風(fēng)險(xiǎn)預(yù)測(cè)方法。
14、本技術(shù)實(shí)施例提供的風(fēng)險(xiǎn)預(yù)測(cè)方法、計(jì)算設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述方法包括從參考數(shù)據(jù)集中,獲取與風(fēng)險(xiǎn)信息關(guān)聯(lián)的關(guān)鍵特征集;通過第一層生成器根據(jù)所述關(guān)鍵特征集,生成初始虛擬數(shù)據(jù)集,并通過第二層生成器根據(jù)所述初始虛擬數(shù)據(jù)集,生成優(yōu)化虛擬數(shù)據(jù)集;通過第一判別器,對(duì)所述初始虛擬數(shù)據(jù)集與所述參考數(shù)據(jù)集進(jìn)行分類,以得到第一分類結(jié)果,并通過第二判別器對(duì)所述優(yōu)化虛擬數(shù)據(jù)集和所述參考數(shù)據(jù)集進(jìn)行分類,以得到第二分類結(jié)果;根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果,優(yōu)化所述第一層生成器和所述第二層生成器,以得到最終虛擬數(shù)據(jù)集;基于所述最終虛擬數(shù)據(jù)集,優(yōu)化風(fēng)險(xiǎn)預(yù)測(cè)模型,以得到優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型;基于所述優(yōu)化后的風(fēng)險(xiǎn)預(yù)測(cè)模型,得到風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果。因此,本技術(shù)采用雙層生成對(duì)抗網(wǎng)絡(luò)(即第一層生成器、第二層生成器、第一判別器和第二判別器)生成初始虛擬數(shù)據(jù)集和優(yōu)化虛擬數(shù)據(jù)集,從而能有效提升特征選擇的準(zhǔn)確性和有效性,進(jìn)而能實(shí)現(xiàn)準(zhǔn)確且高效地進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)。