本說明書涉及公積金管理系統(tǒng)領域,更具體地說,本技術涉及一種基于多元異構數(shù)據(jù)融合的公積金管理系統(tǒng)及其控制方法。
背景技術:
1、公積金業(yè)務涉及銀行端、企業(yè)端和公積金管理中心端,不同來源的數(shù)據(jù)類型多樣,由于數(shù)據(jù)格式和來源分散,系統(tǒng)缺乏高效的數(shù)據(jù)整合機制,導致數(shù)據(jù)孤島現(xiàn)象。
2、公積金政策如貸款額度、繳存比例等常發(fā)生變化,傳統(tǒng)系統(tǒng)的業(yè)務邏輯調(diào)整周期長,缺乏動態(tài)規(guī)則引擎,難以快速響應政策調(diào)整,降低了系統(tǒng)的適應性和效率。
3、因此有必要提出一種基于多元異構數(shù)據(jù)融合的公積金管理系統(tǒng)及其控制方法,以至少解決上述部分問題,以提升數(shù)據(jù)整合、業(yè)務處理和用戶體驗的能力。
技術實現(xiàn)思路
1、在
技術實現(xiàn)要素:
部分中引入了一系列簡化形式的概念,這將在具體實施方式部分中進一步詳細說明。本技術的發(fā)明內(nèi)容部分并不意味著要試圖限定出所要求保護的技術方案的關鍵特征和必要技術特征,更不意味著試圖確定所要求保護的技術方案的保護范圍。
2、第一方面,本技術提出一種基于多元異構數(shù)據(jù)融合的公積金管理系統(tǒng),上述系統(tǒng)包括:
3、數(shù)據(jù)接入層,上述數(shù)據(jù)接入層用于接收銀行端、企業(yè)端和公積金管理中心端的多種異構數(shù)據(jù)源,上述多種異構數(shù)據(jù)源包括結構性數(shù)據(jù)、非結構性數(shù)據(jù)、半結構化數(shù)據(jù)和混合數(shù)據(jù);
4、數(shù)據(jù)融合層,上述數(shù)據(jù)融合層用于對上述異構數(shù)據(jù)源進行數(shù)據(jù)清洗操作、數(shù)據(jù)匹配操作和數(shù)據(jù)模型構建操作;
5、業(yè)務處理層,上述業(yè)務處理層用于處理公積金核心業(yè)務,上述業(yè)務處理層包括動態(tài)規(guī)則引擎,上述動態(tài)規(guī)則引擎基于政策變化實時調(diào)整其對應的業(yè)務邏輯;
6、數(shù)據(jù)分析層,上述業(yè)務分析層用于基于數(shù)據(jù)庫存儲數(shù)據(jù)和用戶輸入數(shù)據(jù)進行數(shù)據(jù)分析操作生成評估結果;
7、安全管理層,上述安全管理層用于對訪問用戶進行權限控制操作,上述安全管理層還用于對敏感信息進行脫敏和加密操作;
8、用戶服務層,上述用戶服務層用于提供手機app服務、公眾號服務和web門戶服務。
9、第二方面、本技術提出一種控制方法,用于第一方面的基于多元異構數(shù)據(jù)融合的公積金管理系統(tǒng),包括:
10、控制上述數(shù)據(jù)接入層接收銀行端、企業(yè)端和公積金管理中心端的多種異構數(shù)據(jù)源,其中,上述多種異構數(shù)據(jù)源包括結構性數(shù)據(jù)、非結構性數(shù)據(jù)和半結構化數(shù)據(jù);
11、控制上述數(shù)據(jù)融合層對上述異構數(shù)據(jù)源進行數(shù)據(jù)清洗操作、數(shù)據(jù)匹配操作和數(shù)據(jù)模型構建操作,以獲取公積金融合數(shù)據(jù)。
12、在一種可行的實施方式中,上述數(shù)據(jù)融合層包括數(shù)據(jù)清洗模塊、數(shù)據(jù)匹配模塊和數(shù)據(jù)模型構建模塊;
13、上述控制上述數(shù)據(jù)融合層對上述異構數(shù)據(jù)源進行數(shù)據(jù)清洗操作、數(shù)據(jù)匹配操作和數(shù)據(jù)模型構建操作,以獲取公積金融合數(shù)據(jù),包括:
14、控制上述數(shù)據(jù)清洗模塊對上述異構數(shù)據(jù)進行數(shù)據(jù)清洗操作,以獲取清洗后異構數(shù)據(jù);
15、控制上述數(shù)據(jù)匹配模塊基于智能匹配模型對上述清洗后異構數(shù)據(jù)進行數(shù)據(jù)匹配操作,以獲取匹配后數(shù)據(jù);
16、控制上述數(shù)據(jù)模型構建模塊對上述匹配后數(shù)據(jù)進行數(shù)據(jù)模型構建操作,以獲取公積金融合數(shù)據(jù),其中,上述數(shù)據(jù)模型構建模塊包括聚合模型、預測模型和分類模型。
17、在一種可行的實施方式中,上述智能匹配模型包括特征提取單元、相似度計算單元、匹配決策單元和數(shù)據(jù)輸出單元;
18、上述特征提取單元用于基于不同的特征提取方法提取不同數(shù)據(jù)類型對應的不同的數(shù)據(jù)特征;
19、上述相似度計算單元用于基于每種特征類型的相似度、每種特征類型相似度對應的權重系數(shù)計算綜合相似度;
20、上述匹配決策單元用于基于綜合相似度獲取數(shù)據(jù)匹配結果;
21、上述數(shù)據(jù)輸出單元用于基于上述數(shù)據(jù)匹配結果生成匹配后數(shù)據(jù)。
22、在一種可行的實施方式中,上述特征提取單元是基于第一特征提取方法、第二特征提取方法、第三特征提取方法和第四特征提取方法進行特征提取的;
23、上述第一特征提取方法用于提取上述結構性數(shù)據(jù)的第一特征,上述第二特征提取方法用于提取上述非結構性數(shù)據(jù)的第二特征,上述第三特征提取方法用于提取上述半結構化數(shù)據(jù)的第三特征,上述第四特征提取方法用于提取上述混合數(shù)據(jù)的第四特征;
24、上述第一特征提取方法是基于重要字段的特征組合進行時間序列特征提取操作實現(xiàn)的,上述第二特征提取方法是基于不同的非結構化數(shù)據(jù)類型對應的特征提取方法實現(xiàn)的,上述第三特征提取方法是基于字段解析操作、嵌套結構解析操作和統(tǒng)計特征提取操作實現(xiàn)的,上述第四特征提取方法是基于分層提取操作和多模特征學習操作實現(xiàn)的。
25、在一種可行的實施方式中,上述綜合相似度基于下式確定:
26、
27、其中,為第一特征相似度,為上述第一特征相似度對應的權重系數(shù),為第二特征相似度,為上述第二特征相似度對應的權重系數(shù),為第三特征相似度,為上述第三特征相似度對應的權重系數(shù),為第四特征相似度,為上述第四特征相似度對應的權重系數(shù);
28、在上述第一特征為時間序列特征顯著的情況下,基于下式確定上述第一特征相似度:
29、
30、式中,分別為兩條不同數(shù)據(jù)的第一特征向量,表示動態(tài)時間規(guī)整計算結果;
31、在上述第一特征為時間序列特征非顯著的情況下,基于下式確定上述第一特征相似度:
32、
33、式中,和為第一特征向量對應的第i個分量;
34、在上述第二特征為文本數(shù)據(jù)對應的特征的情況下,基于詞頻及逆文檔頻率對應的向量的余弦相似度確定上述第二特征相似度;
35、在上述第二特征為圖像數(shù)據(jù)對應的特征的情況下,基于卷積特征相似度確定上述第二特征相似度;
36、基于下式計算上述第三特征相似度:
37、
38、其中,為匯總字段相似度,為嵌套字段相似度,為綜合字段統(tǒng)計特征相似度,為第一權重系數(shù),為第二權重系數(shù),為第三權重系數(shù);
39、上述匯總字段相似度基于下式計算:
40、
41、其中,為每個字段對應的基礎相似度,表示總字段數(shù);
42、上述基礎相似度基于下式計算:
43、
44、式中,為不同的數(shù)據(jù)源字段的值,為文本字段相似度;
45、上述嵌套字段相似度基于下式計算:
46、
47、為嵌套字段總數(shù),為第個嵌套字段的權重;
48、上述綜合字段統(tǒng)計特征相似度基于下式計算:
49、
50、為第一條記錄中半結構化數(shù)據(jù)的統(tǒng)計特征向量,為第二條記錄中半結構化數(shù)據(jù)的統(tǒng)計特征向量;
51、上述第四特征相似度基于下式確定:
52、
53、向量通過以下式確定:
54、
55、其中,為第一條記錄的第四特征向量,為第二條記錄的第四特征向量,是融合的學習權重,表示上述第一特征向量,表示上述第二特征向量,表示上述第三特征向量。
56、在一種可行的實施方式中,上述匹配決策單元執(zhí)行的具體步驟包括:
57、基于特征優(yōu)先級和數(shù)據(jù)類型計算動態(tài)閾值;
58、基于上述綜合相似度和上述動態(tài)閾值進行比較操作,以獲取數(shù)據(jù)匹配結果。
59、在一種可行的實施方式中,還包括:
60、控制上述業(yè)務處理層基于上述動態(tài)規(guī)則引擎處理公積金核心業(yè)務,以生成業(yè)務反饋數(shù)據(jù),其中,上述動態(tài)規(guī)則引擎基于政策變化實時調(diào)整其對應的業(yè)務邏輯;
61、控制上述數(shù)據(jù)分析層基于上述數(shù)據(jù)庫存儲數(shù)據(jù)和上述用戶輸入數(shù)據(jù)進行數(shù)據(jù)分析操作生成評估結果。
62、在一種可行的實施方式中,上述動態(tài)規(guī)則引擎基于政策變化實時調(diào)整其對應的業(yè)務邏輯的具體步驟包括:
63、獲取政策數(shù)據(jù),其中,上述政策數(shù)據(jù)來源于api數(shù)據(jù)接口和人工輸入數(shù)據(jù);
64、基于自然技術自動解析政策文檔的關鍵條款內(nèi)容,以提取關鍵要素,其中,上述關鍵條款內(nèi)容包括條款的條件、條款的限制和條款的執(zhí)行細節(jié),上述關鍵要素包括使用范圍、規(guī)則條件和執(zhí)行要求;
65、基于上述關鍵要素和規(guī)則模板進行匹配操作,以生成新增版本文件;
66、基于上述新增版本文件進行虛擬數(shù)據(jù)測試,以獲取虛擬測試結果;
67、在上述虛擬測試結果合格的情況下,基于上述政策數(shù)據(jù)對應的執(zhí)行時間發(fā)布并啟用上述新增版本文件。
68、在一種可行的實施方式中,上述控制上述數(shù)據(jù)分析層基于上述數(shù)據(jù)庫存儲數(shù)據(jù)和上述用戶輸入數(shù)據(jù)進行數(shù)據(jù)分析操作生成評估結果,包括:
69、基于下式確定上述評估結果r:
70、
71、式中,為對評估結果的正則化項,表示特征的總數(shù)量,為評估結果的綜合評分函數(shù),為特征交互項,為第個特征的權重系數(shù),為正則化強度系數(shù),為特征交互項權重系數(shù),為上述用戶輸入數(shù)據(jù)的第個特征值,特征值包括年齡、收入和貸款需求,表示上述數(shù)據(jù)庫存儲數(shù)據(jù)中存儲的歷史數(shù)據(jù)的第個特征值,為對應的權重系數(shù),為對應的權重系數(shù),為懲罰系數(shù),為特征交互的核函數(shù),分別為用戶輸入數(shù)據(jù)和歷史輸入數(shù)據(jù)的第個特征值,分別為用戶輸入數(shù)據(jù)和歷史輸入數(shù)據(jù)的第個特征值,表示兩個特征交互的差異平方,為平滑參數(shù)。
72、綜上,本技術提出的基于多元異構數(shù)據(jù)融合的公積金管理系統(tǒng),支持多元異構數(shù)據(jù)的接入與整合,消除數(shù)據(jù)孤島,提升業(yè)務數(shù)據(jù)的整體利用率。能夠通過動態(tài)規(guī)則引擎,快速適應政策變化,保障系統(tǒng)業(yè)務邏輯的合法性和靈活性。通過全方位的權限控制和數(shù)據(jù)加密,確保用戶數(shù)據(jù)的隱私性和系統(tǒng)的安全性。提供多種訪問方式(app、公眾號、web),提升用戶的便利性。適用于政府公積金管理機構進行整合數(shù)據(jù)資源、處理政策調(diào)整、提升服務效率。還適用于企業(yè)端用于高效提交員工繳存信息、與銀行、公積金管理中心互通。也適用于用戶個人以隨時隨地查詢賬戶余額、申請?zhí)崛』蛸J款。
73、本技術提出的一種基于多元異構數(shù)據(jù)融合的公積金管理系統(tǒng)及其控制方法,本技術的其它優(yōu)點、目標和特征將部分通過下面的說明體現(xiàn),部分還將通過對本技術的研究和實踐而為本領域的技術人員所理解。