本發(fā)明涉及風(fēng)險(xiǎn)預(yù)測(cè),尤其是涉及一種企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)方法及裝置、介質(zhì)、設(shè)備。
背景技術(shù):
1、企業(yè)經(jīng)營(yíng)延續(xù)性是指企業(yè)將來(lái)會(huì)繼續(xù)經(jīng)營(yíng)下去,短時(shí)間內(nèi)不會(huì)面臨破產(chǎn)清算的風(fēng)險(xiǎn)。通過(guò)預(yù)測(cè)企業(yè)出現(xiàn)注銷、轉(zhuǎn)非正常等可能性,對(duì)不再延續(xù)的企業(yè)進(jìn)行重點(diǎn)監(jiān)管,可以提供精準(zhǔn)幫扶以及避免稅款流失。目前對(duì)于企業(yè)經(jīng)營(yíng)的延續(xù)性預(yù)測(cè)多是采用統(tǒng)計(jì)分析方法,例如,趨勢(shì)預(yù)測(cè)分析法、因果預(yù)測(cè)分析法和回歸分析方法等,揭示各有關(guān)變量之間的規(guī)律性聯(lián)系,并對(duì)計(jì)算結(jié)果作出結(jié)論。目前統(tǒng)計(jì)分析方法的準(zhǔn)確性有待提高。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)以上至少一個(gè)技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)方法及裝置、介質(zhì)、設(shè)備。
2、根據(jù)第一方面,本發(fā)明實(shí)施例提供的企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)方法包括:
3、獲取目標(biāo)企業(yè)在最近預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征;
4、對(duì)所述原始經(jīng)營(yíng)行為特征進(jìn)行預(yù)處理;
5、對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征進(jìn)行衍生處理,得到衍生經(jīng)營(yíng)行為特征;
6、對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行降維處理,得到包括第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征的經(jīng)營(yíng)行為特征向量;
7、將所述目標(biāo)企業(yè)對(duì)應(yīng)的經(jīng)營(yíng)行為特征向量輸入到預(yù)先訓(xùn)練得到的企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型中,得到所述目標(biāo)企業(yè)在未來(lái)預(yù)設(shè)時(shí)間段內(nèi)的延續(xù)性預(yù)測(cè)結(jié)果。
8、在一個(gè)實(shí)施例中,所述獲取目標(biāo)企業(yè)在最近預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征,包括:從所述目標(biāo)企業(yè)在最近預(yù)定時(shí)間段內(nèi)的申報(bào)征收信息、財(cái)務(wù)信息、發(fā)票信息和登記變更信息中提取第二預(yù)設(shè)數(shù)量的原始經(jīng)營(yíng)行為特征。
9、在一個(gè)實(shí)施例中,所述對(duì)所述原始經(jīng)營(yíng)行為特征進(jìn)行預(yù)處理,包括如下至少一項(xiàng):
10、采用定性特征啞編碼的方式,將所述原始經(jīng)營(yíng)行為特征中的定性特征轉(zhuǎn)換為數(shù)值型特征;
11、采用連續(xù)特征離散化處理的方式,將所述原始經(jīng)營(yíng)行為特征中的連續(xù)特征轉(zhuǎn)換為離散型特征。
12、在一個(gè)實(shí)施例中,所述對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征進(jìn)行衍生處理,得到衍生經(jīng)營(yíng)行為特征,包括:根據(jù)預(yù)處理后的原始經(jīng)營(yíng)行為特征,采用特征組合和特征運(yùn)算中的至少一種方式生成第三預(yù)設(shè)數(shù)量的所述衍生經(jīng)營(yíng)行為特征。
13、在一個(gè)實(shí)施例中,所述對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行降維處理,得到包括第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征的經(jīng)營(yíng)行為特征向量,包括:
14、對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行數(shù)據(jù)特索性分析,得到數(shù)據(jù)探索性分析結(jié)果;
15、根據(jù)所述數(shù)據(jù)探索性分析結(jié)果,從所述預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征中選擇出所述第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征;
16、將所述第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征形成所述經(jīng)營(yíng)行為特征向量。
17、在一個(gè)實(shí)施例中,所述企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型包括至少兩個(gè)二分類預(yù)測(cè)模型以及與每一個(gè)二分類預(yù)測(cè)模型連接的邏輯回歸模型,所述至少兩個(gè)二分類預(yù)測(cè)模型中包括分類回歸樹模型、隨機(jī)森林模型和梯度提升樹模型中的至少兩個(gè);其中:每一個(gè)二分類預(yù)測(cè)模型用于根據(jù)所述經(jīng)營(yíng)行為特征向量進(jìn)行二分類預(yù)測(cè),得到各自的延續(xù)性預(yù)測(cè)結(jié)果;所述邏輯回歸模型用于根據(jù)至少兩個(gè)延續(xù)性預(yù)測(cè)結(jié)果輸出最終的延續(xù)性預(yù)測(cè)結(jié)果。
18、在一個(gè)實(shí)施例中,所述企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型的訓(xùn)練過(guò)程包括:
19、從稅務(wù)系統(tǒng)中提取出多個(gè)企業(yè)的登記信息,并根據(jù)所述登記信息確定當(dāng)前為非正?;蛘咦N狀態(tài)的企業(yè),將當(dāng)前為非正常或者注銷狀態(tài)的企業(yè)作為黑企業(yè);以及根據(jù)所述登記信息確定當(dāng)前為正常狀態(tài)的企業(yè),將當(dāng)前為正常狀態(tài)的企業(yè)作為白企業(yè);
20、提取每一個(gè)黑企業(yè)在狀態(tài)變?yōu)榉钦;蛘咦N之前的預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征,以及提取每一個(gè)白企業(yè)在最近預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征;
21、對(duì)每一個(gè)企業(yè)的原始經(jīng)營(yíng)行為特征進(jìn)行預(yù)處理;
22、對(duì)每一個(gè)企業(yè)在預(yù)處理后的原始經(jīng)營(yíng)行為特征進(jìn)行衍生處理,得到該企業(yè)的衍生經(jīng)營(yíng)行為特征;
23、將每一個(gè)企業(yè)在預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行降維處理,得到該企業(yè)的第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征,將所述第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征形成經(jīng)營(yíng)行為特征向量,并根據(jù)該企業(yè)的狀態(tài)對(duì)該經(jīng)營(yíng)行為特征向量打標(biāo)簽,得到該企業(yè)對(duì)應(yīng)的訓(xùn)練樣本;
24、將得到的各條訓(xùn)練樣本劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
25、利用所述訓(xùn)練集進(jìn)行模型訓(xùn)練;在訓(xùn)練收斂后,利用所述驗(yàn)證集進(jìn)行模型性能評(píng)估,根據(jù)評(píng)估結(jié)果進(jìn)行模型調(diào)優(yōu)處理;在調(diào)優(yōu)結(jié)束后,利用所述測(cè)試集評(píng)估并輸出所述企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型的最終性能。
26、根據(jù)第二方面,本發(fā)明實(shí)施例提供的企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)裝置包括:
27、特征獲取模塊,用于獲取目標(biāo)企業(yè)在最近預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征;
28、特征處理模塊,用于對(duì)所述原始經(jīng)營(yíng)行為特征進(jìn)行預(yù)處理;
29、特征衍生模塊,用于對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征進(jìn)行衍生處理,得到衍生經(jīng)營(yíng)行為特征;
30、降維處理模塊,用于對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行降維處理,得到包括第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征的經(jīng)營(yíng)行為特征向量;
31、模型預(yù)測(cè)模塊,用于將所述目標(biāo)企業(yè)對(duì)應(yīng)的經(jīng)營(yíng)行為特征向量輸入到預(yù)先訓(xùn)練得到的企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型中,得到所述目標(biāo)企業(yè)在未來(lái)預(yù)設(shè)時(shí)間段內(nèi)的延續(xù)性預(yù)測(cè)結(jié)果。
32、根據(jù)第三方面,本發(fā)明實(shí)施例提供計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令計(jì)算機(jī)執(zhí)行實(shí)現(xiàn)第一方面提供的方法。
33、根據(jù)第四方面,本發(fā)明實(shí)施例提供的計(jì)算設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)第一方面提供的方法。
34、本發(fā)明實(shí)施例提供的企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)方法及裝置、介質(zhì)、設(shè)備,首先獲取目標(biāo)企業(yè)在最近預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征,然后對(duì)所述原始經(jīng)營(yíng)行為特征進(jìn)行預(yù)處理,接著對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征進(jìn)行衍生處理,得到衍生經(jīng)營(yíng)行為特征。對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行降維處理,得到經(jīng)營(yíng)行為特征向量,最后將所述目標(biāo)企業(yè)對(duì)應(yīng)的經(jīng)營(yíng)行為特征向量輸入到預(yù)業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型中,便可以得到目標(biāo)企業(yè)在未來(lái)預(yù)設(shè)時(shí)間段內(nèi)的延續(xù)性預(yù)測(cè)結(jié)果??梢?,相對(duì)于現(xiàn)有技術(shù)中的統(tǒng)計(jì)分析方法,本發(fā)明基于大模型來(lái)預(yù)測(cè)企業(yè)在未來(lái)一段時(shí)間內(nèi)是否具有延續(xù)性,準(zhǔn)確性更高,效率也更高,整個(gè)過(guò)程需要人工參與的程度很低,可以減少人力成本。
1.一種企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取目標(biāo)企業(yè)在最近預(yù)定時(shí)間段內(nèi)的原始經(jīng)營(yíng)行為特征,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述原始經(jīng)營(yíng)行為特征進(jìn)行預(yù)處理,包括如下至少一項(xiàng):
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征進(jìn)行衍生處理,得到衍生經(jīng)營(yíng)行為特征,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)預(yù)處理后的原始經(jīng)營(yíng)行為特征和所述衍生經(jīng)營(yíng)行為特征進(jìn)行降維處理,得到包括第一預(yù)設(shè)數(shù)量的經(jīng)營(yíng)行為特征的經(jīng)營(yíng)行為特征向量,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型包括至少兩個(gè)二分類預(yù)測(cè)模型以及與每一個(gè)二分類預(yù)測(cè)模型連接的邏輯回歸模型,所述至少兩個(gè)二分類預(yù)測(cè)模型中包括分類回歸樹模型、隨機(jī)森林模型和梯度提升樹模型中的至少兩個(gè);其中:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)模型的訓(xùn)練過(guò)程包括:
8.一種企業(yè)經(jīng)營(yíng)延續(xù)性預(yù)測(cè)裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令計(jì)算機(jī)執(zhí)行實(shí)現(xiàn)權(quán)利要求1~7中的任一項(xiàng)所述的方法。
10.一種計(jì)算設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)權(quán)利要求1~7中的任一項(xiàng)所述的方法。