本技術涉及數(shù)據(jù)處理,具體而言,涉及一種基于分類模型選擇目標企業(yè)的方法及裝置。
背景技術:
1、小微企業(yè)、個體工商戶融資時存在融資難、融資貴的問題,一部分原因是因為小微企業(yè)的財務數(shù)據(jù)缺失,銀企信息不對稱。目前對于小微企業(yè)的準入,需要其對應的財務指標、納稅等指標符合一定條件后,才能進入到貸前審核環(huán)節(jié),或者直接放貸給以前貸款信用良好的企業(yè)。
2、這些準入的小微企業(yè)往往都是信譽非常良好或者已經有過貸款的企業(yè),而對于那些征信白戶,由于信貸相關數(shù)據(jù)不足,基本會被認為不符合預設征信條件,很難進入準入名單,就無法享受普惠金融帶來的支持。
3、現(xiàn)有技術中針對這些不符合預設征信條件的企業(yè)的準入評估,往往需要人工分析、評估,主觀因素強,且效率低。
技術實現(xiàn)思路
1、有鑒于此,本技術的目的在于提供一種基于分類模型選擇目標企業(yè)的方法、裝置、電子設備及介質,能夠自動選取優(yōu)質的小微企業(yè)進入后續(xù)的信貸審核節(jié)點,評估結果客觀且評估效率高,減少對已貸過款的企業(yè)重復授信,增加信貸審核流程的自動化程度。
2、本技術實施例提供的基于分類模型選擇目標企業(yè)的方法,應用于服務器或終端設備,所述方法包括:
3、預先接入目標數(shù)據(jù)平臺,并從所述目標數(shù)據(jù)平臺獲取多個滿足信貸獲取條件的對標企業(yè)的信貸信息,所述對標企業(yè)的信貸信息包括目標類型的政務數(shù)據(jù);
4、從所述目標數(shù)據(jù)平臺獲取征信信息不滿足預設征信條件的第一候選企業(yè)的信貸信息;所述第一候選企業(yè)的信貸信息同樣包括目標類型的政務數(shù)據(jù);所述第一候選企業(yè)為待進入信貸審核節(jié)點的企業(yè);
5、從所述對標企業(yè)中抽樣選取第一部分對標企業(yè),所述第一部分對標企業(yè)和第一候選企業(yè)組成樣本候選企業(yè)集,剩余的第二部分對標企業(yè)組成樣本對標企業(yè)集;所述樣本對標企業(yè)集和樣本候選企業(yè)集中包括企業(yè)對應的目標類型的政務數(shù)據(jù);所述樣本候選企業(yè)集的類別為準入類別;
6、基于所述樣本對標企業(yè)集和樣本候選企業(yè)集訓練構建好的準入分類模型,直至所述準入分類模型滿足預設訓練停止條件,得到訓練好的準入分類模型;所述訓練好的準入分類模型輸出第一部分對標企業(yè)和第一候選企業(yè)屬于準入類別的置信度;
7、根據(jù)第一部分對標企業(yè)的所述置信度、第一候選企業(yè)的所述置信度,從所述第一候選企業(yè)中選取待進入信貸審核節(jié)點的目標企業(yè)。
8、在一些實施例中,所述的基于分類模型選擇目標企業(yè)的方法還包括:
9、處理所述目標類型的政務數(shù)據(jù),得到每種類型的政務數(shù)據(jù)在多個時間維度上的多個指標;
10、所述樣本對標企業(yè)集和樣本候選企業(yè)集中的企業(yè)對應的目標類型的政務數(shù)據(jù),為所述每種類型的政務數(shù)據(jù)在多個時間維度上的多個指標。
11、在一些實施例中,所述的基于分類模型選擇目標企業(yè)的方法中,處理所述目標類型的政務數(shù)據(jù),得到每種類型的政務數(shù)據(jù)在多個時間維度上的多個指標,包括:
12、針對所述目標類型的政務數(shù)據(jù),計算不同的時間維度上的每種類型的政務數(shù)據(jù)的均值;
13、基于不同的時間維度上的每種政務數(shù)據(jù)的均值,計算該種政務數(shù)據(jù)的均值在該時間維度上的均值同比增長率。
14、在一些實施例中,所述的基于分類模型選擇目標企業(yè)的方法中,在基于所述樣本對標企業(yè)集和樣本候選企業(yè)集訓練構建好的準入分類模型之前,所述方法還包括:
15、將所述每種類型的政務數(shù)據(jù)在多個時間維度上的多個指標作為入模變量,構建基于二分類算法的準入分類模型。
16、在一些實施例中,所述的基于分類模型選擇目標企業(yè)的方法中,所述信貸獲取條件,包括:
17、所述對標企業(yè)獲得的貸款的類型為指定類型,且所述對標企業(yè)獲得的貸款的時間在第一預設期限之內,且所述對標企業(yè)在第二預設期限內未發(fā)生指定風險事件。
18、在一些實施例中,所述的基于分類模型選擇目標企業(yè)的方法中,根據(jù)第一部分對標企業(yè)的所述置信度、第一候選企業(yè)的所述置信度,從所述第一候選企業(yè)中選取待進入信貸審核節(jié)點的目標企業(yè),包括:
19、基于所述第一部分對標企業(yè)的所述置信度確定第一候選企業(yè)的準入閾值;
20、基于所述準入閾值,從所述第一候選企業(yè)中一次篩選出置信度超過所述準入閾值的待準入的第一候選企業(yè);
21、從待準入的第一候選企業(yè)中二次選取置信度排序在先的預設數(shù)目個第一候選企業(yè)作為進入信貸審核節(jié)點的目標企業(yè)。
22、在一些實施例中,所述的基于分類模型選擇目標企業(yè)的方法中,從所述第一候選企業(yè)中選取待進入信貸審核節(jié)點的目標企業(yè)之后,所述方法還包括:
23、當目標數(shù)據(jù)平臺檢測到不滿足預設征信條件的第二候選企業(yè)時,從所述目標數(shù)據(jù)平臺獲取所述第二候選企業(yè)的信貸信息;所述第二候選企業(yè)的信貸信息同樣包括目標類型的政務數(shù)據(jù);
24、處理所述第二候選企業(yè)的信貸信息中目標類型的政務數(shù)據(jù),確定第二候選企業(yè)的多種類型的政務數(shù)據(jù)在多個時間維度上的多個指標;
25、通過所述訓練好的準入分類模型處理第二候選企業(yè)的多種類型的政務數(shù)據(jù)在多個時間維度上的多個指標,輸出所述第二候選企業(yè)屬于準入類別的置信度;
26、基于所述第二候選企業(yè)的置信度,確定所述第二候選企業(yè)是否進入信貸審核節(jié)點。
27、在一些實施例中,還提供一種基于分類模型選擇目標企業(yè)的裝置,應用于服務器或終端設備,所述裝置包括:
28、第一獲取模塊,用于預先接入目標數(shù)據(jù)平臺,并從所述目標數(shù)據(jù)平臺獲取多個滿足信貸獲取條件的對標企業(yè)的信貸信息,所述對標企業(yè)的信貸信息包括目標類型的政務數(shù)據(jù);
29、第二獲取模塊,用于從所述目標數(shù)據(jù)平臺獲取征信信息不滿足預設征信條件的第一候選企業(yè)的信貸信息;所述第一候選企業(yè)的信貸信息同樣包括目標類型的政務數(shù)據(jù);所述第一候選企業(yè)為待進入信貸審核節(jié)點的企業(yè);
30、抽樣模塊,用于從所述對標企業(yè)中抽樣選取第一部分對標企業(yè),所述第一部分對標企業(yè)和第一候選企業(yè)組成樣本候選企業(yè)集,剩余的第二部分對標企業(yè)組成樣本對標企業(yè)集;所述樣本對標企業(yè)集和樣本候選企業(yè)集中包括企業(yè)對應的目標類型的政務數(shù)據(jù);所述樣本候選企業(yè)集的類別為準入類別;
31、訓練模塊,用于基于所述樣本對標企業(yè)集和樣本候選企業(yè)集訓練構建好的準入分類模型,直至所述準入分類模型滿足預設訓練停止條件,得到訓練好的準入分類模型;所述訓練好的準入分類模型輸出第一部分對標企業(yè)和第一候選企業(yè)屬于準入類別的置信度;
32、選取模塊,用于根據(jù)第一部分對標企業(yè)的所述置信度、第一候選企業(yè)的所述置信度,從所述第一候選企業(yè)中選取待進入信貸審核節(jié)點的目標企業(yè)。
33、在一些實施例中,還提供一種電子設備,包括:處理器、存儲器和總線,所述存儲器存儲有所述處理器可執(zhí)行的機器可讀指令,當電子設備運行時,所述處理器與所述存儲器之間通過總線通信,所述機器可讀指令被所述處理器執(zhí)行時執(zhí)行所述的基于分類模型選擇目標企業(yè)的方法的步驟。
34、在一些實施例中,還提供一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機程序,該計算機程序被處理器運行時執(zhí)行所述的基于分類模型選擇目標企業(yè)的方法的步驟。
35、本技術實施例中,具體提供一種基于分類模型選擇目標企業(yè)的方法及裝置,應用于服務器或終端設備,所述方法包括:預先接入目標數(shù)據(jù)平臺,并從所述目標數(shù)據(jù)平臺獲取多個滿足信貸獲取條件的對標企業(yè)的信貸信息,所述對標企業(yè)的信貸信息包括目標類型的政務數(shù)據(jù);從所述目標數(shù)據(jù)平臺獲取征信信息不滿足預設征信條件的第一候選企業(yè)的信貸信息;所述第一候選企業(yè)的信貸信息同樣包括目標類型的政務數(shù)據(jù);所述第一候選企業(yè)為待進入信貸審核節(jié)點的企業(yè);從所述對標企業(yè)中抽樣選取第一部分對標企業(yè),所述第一部分對標企業(yè)和第一候選企業(yè)組成樣本候選企業(yè)集,剩余的第二部分對標企業(yè)組成樣本對標企業(yè)集;所述樣本對標企業(yè)集和樣本候選企業(yè)集中包括企業(yè)對應的目標類型的政務數(shù)據(jù);所述樣本候選企業(yè)集的類別為準入類別;基于所述樣本對標企業(yè)集和樣本候選企業(yè)集訓練構建好的準入分類模型,直至所述準入分類模型滿足預設訓練停止條件,得到訓練好的準入分類模型;所述訓練好的準入分類模型輸出第一部分對標企業(yè)和第一候選企業(yè)屬于準入類別的置信度;根據(jù)第一部分對標企業(yè)的所述置信度、第一候選企業(yè)的所述置信度,從所述第一候選企業(yè)中選取待進入信貸審核節(jié)點的目標企業(yè);首先,所述方法能夠自動選取優(yōu)質的小微企業(yè)進入后續(xù)的信貸審核節(jié)點,評估結果客觀且評估效率高,減少對已貸過款的企業(yè)重復授信,增加信貸審核流程的自動化程度;其次,通過將不分滿足信貸獲取條件的對標企業(yè)混入不滿足預設征信條件的第一候選企業(yè)中,從而降低分類模型正負樣本集的差異,提高準入分類模型的泛化能力,第一候選企業(yè)的準入閾值基于對標企業(yè)的的置信度結果確定,提高選取的準確率,從而能夠進入信貸審核節(jié)點的目標企業(yè)的范圍進一步擴大,減少對已貸過款的企業(yè)重復授信,解決了征信白戶企業(yè)的準入冷啟動問題。