本發(fā)明屬于財(cái)務(wù)人工智能領(lǐng)域,具體涉及一種基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理方法。
背景技術(shù):
1、在現(xiàn)代醫(yī)療領(lǐng)域,隨著數(shù)字化進(jìn)程的不斷推進(jìn),醫(yī)院需要處理海量的財(cái)務(wù)憑證數(shù)據(jù)。這些數(shù)據(jù)不僅體量巨大,而且多樣性高,包含多種格式和結(jié)構(gòu)的信息。因此,如何高效地存儲(chǔ)、傳輸和處理這些數(shù)據(jù)成為亟待解決的問(wèn)題。現(xiàn)有技術(shù)中,普遍存在著數(shù)據(jù)冗余和資源消耗過(guò)大的問(wèn)題。為了應(yīng)對(duì)這一挑戰(zhàn),引入了特征壓縮技術(shù)。特征壓縮旨在通過(guò)保留數(shù)據(jù)中的重要特征信息而去掉冗余,從而減少存儲(chǔ)空間和提高數(shù)據(jù)處理速度。然而,傳統(tǒng)的特征壓縮方法如pca等,往往依賴復(fù)雜的數(shù)學(xué)模型和運(yùn)算,難以在資源受限的環(huán)境下應(yīng)用。
2、超輕量級(jí)特征壓縮技術(shù)提供了一種有效的解決方案。它通過(guò)簡(jiǎn)化的壓縮算法,能夠在不顯著損失數(shù)據(jù)特征信息的前提下,大幅度減少數(shù)據(jù)維度。這種方法特別適合在計(jì)算能力有限的設(shè)備上運(yùn)行,如嵌入式系統(tǒng)或移動(dòng)設(shè)備。此外,借助該技術(shù),財(cái)務(wù)憑證數(shù)據(jù)可以被快速處理并用于實(shí)時(shí)分析和決策支持,大大提升了醫(yī)院運(yùn)營(yíng)的效率。因此,基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理方法的開(kāi)發(fā),正是為了解決當(dāng)前醫(yī)療財(cái)務(wù)數(shù)據(jù)處理過(guò)程中所面臨的資源和效率問(wèn)題,以實(shí)現(xiàn)更智能、高效的醫(yī)療財(cái)務(wù)管理系統(tǒng)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明為了解決上述問(wèn)題,提供了一種基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理方法。
2、本發(fā)明為實(shí)現(xiàn)上述目的,通過(guò)以下技術(shù)方案實(shí)現(xiàn):
3、本發(fā)明提供一種基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理方法,包括以下步驟:
4、s1.收集財(cái)務(wù)憑證圖像及文本信息,構(gòu)建mini-fin數(shù)據(jù)集,并劃分為訓(xùn)練集和測(cè)試集;
5、s2.對(duì)訓(xùn)練集的圖像數(shù)據(jù)使用hsv亮度增強(qiáng)方法進(jìn)行數(shù)據(jù)預(yù)處理,得到財(cái)務(wù)圖像數(shù)據(jù);
6、s3.構(gòu)建基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理模型,所述模型包括全局輕量特征提取器、局部輕量特征提取器、壓縮感知機(jī)、注意力模塊、分類器以及文本提取器;所述財(cái)務(wù)圖像數(shù)據(jù)輸入到所述模型中,對(duì)模型進(jìn)行訓(xùn)練;
7、s4.通過(guò)分類損失函數(shù)和文本損失函數(shù)對(duì)所述模型進(jìn)行優(yōu)化,得到訓(xùn)練好的模型;
8、s5.測(cè)試集中待檢測(cè)的財(cái)務(wù)憑證圖像輸入到訓(xùn)練好的模型中,得到財(cái)務(wù)憑證處理結(jié)果。
9、進(jìn)一步地,步驟s1包括:
10、為每一張財(cái)務(wù)憑證圖像建立一個(gè)標(biāo)簽文件,記錄財(cái)務(wù)憑證圖像的文本信息;收集的財(cái)務(wù)憑證圖像分為四類,包括購(gòu)銷合同、收據(jù)、發(fā)票、支付憑證;對(duì)四類財(cái)務(wù)憑證圖像建立四個(gè)文件夾獨(dú)立存放,依次命名為1、2、3、4;
11、在每一類財(cái)務(wù)憑證圖像中隨機(jī)選擇80%的數(shù)據(jù)量作為訓(xùn)練集,將剩余的數(shù)據(jù)作為測(cè)試集。
12、進(jìn)一步地,步驟s3中全局輕量特征提取器:
13、所述全局輕量特征提取器包括第一卷積層、relu激活函數(shù)、平均池化層、寬度最大計(jì)算層、寬度平均計(jì)算層、高度平均計(jì)算層、高度最大計(jì)算層、第二卷積層、第三卷積層、softmax()函數(shù)、第四卷積層、relu激活函數(shù)、最大池化層;
14、所述財(cái)務(wù)圖像數(shù)據(jù)輸入到第一卷積層、relu激活函數(shù)、平均池化層中,得到第一卷積特征;將第一卷積特征輸入到寬度最大計(jì)算層、寬度平均計(jì)算層、高度平均計(jì)算層、高度最大計(jì)算層中,分別得到寬度最大向量、寬度平均向量、高度平均向量、高度最大向量;將寬度最大向量在維度dim=1的維度方向上使用concat函數(shù)與寬度平均向量拼接,得到雙層寬度最大向量,將寬度平均向量在維度dim=1的維度方向上使用concat函數(shù)與寬度最大向量拼接,得到雙層寬度平均向量,將高度最大向量和高度平均向量在通道維度上相加,得到高度向量;將雙層寬度最大向量輸入到第二卷積層中,得到單層寬度最大向量,將雙層寬度平均向量輸入到第三卷積層中,得到單層寬度平均向量,將單層寬度最大向量和單層寬度平均向量相乘并輸入softmax函數(shù),得到寬度矩陣;將寬度矩陣和高度向量相乘,輸入到第四卷積層、relu激活函數(shù)、最大池化層中,得到全局特征。
15、進(jìn)一步地,步驟s3中局部輕量特征提取器:
16、所述局部輕量特征提取器包括第一卷積層、relu激活函數(shù)、第一池化層、第二卷積層、relu激活函數(shù)、第二池化層;
17、所述全局特征經(jīng)過(guò)局部輕量特征提取器得到局部特征。
18、進(jìn)一步地,步驟s3中壓縮感知機(jī):
19、所述壓縮感知機(jī)包括離散層、霍夫曼編碼層、卷積層、relu激活函數(shù);
20、將所述全局特征和局部特征相加后輸入到壓縮感知機(jī)中,得到融合特征。
21、進(jìn)一步地,步驟s3中注意力模塊:
22、所述注意力模塊包括第一注意力模塊和第二注意力模塊;
23、所述融合特征經(jīng)過(guò)第一注意力模塊得到第一注意力,公式表示如下:
24、,
25、其中,表示點(diǎn)乘操作,表示逐元素相乘,d表示降維維度,表示sigmoid激活函數(shù),α、β、γ分別表示第一可學(xué)習(xí)加權(quán)系數(shù)、第二可學(xué)習(xí)加權(quán)系數(shù)、第三可學(xué)習(xí)加權(quán)系數(shù),表示第一卷積層,表示第二卷積層,表示全局平均池化,表示全局最大池化,、、是與融合特征維度匹配的可學(xué)習(xí)的query矩陣、key矩陣、value矩陣,、分別表示由融合特征線性變換后的第一矩陣和第二矩陣,r表示壓縮率;
26、所述融合特征經(jīng)過(guò)第二注意力模塊得到第二注意力,公式表示如下:
27、。
28、進(jìn)一步地,步驟s3中分類器和文本提取器:
29、所述分類器包括壓縮層、第一全連接層、第二全連接層、max函數(shù);
30、第一注意力經(jīng)過(guò)分類器進(jìn)行處理,得到財(cái)務(wù)憑證分類預(yù)測(cè);
31、所述文本提取器包括壓縮層、第一全連接層、第二全連接層、字符串輸出層;
32、所述第一注意力和第二注意力經(jīng)過(guò)文本提取器進(jìn)行處理,得到憑證文本預(yù)測(cè)
33、進(jìn)一步地,步驟s4中,所述分類損失函數(shù)通過(guò)交叉熵?fù)p失函數(shù)計(jì)算損失,所述文本損失函數(shù)通過(guò)連接主義時(shí)序分類ctc損失函數(shù)計(jì)算損失。
34、本發(fā)明還提供一種基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理系統(tǒng),包括:
35、數(shù)據(jù)獲取模塊:用于收集財(cái)務(wù)憑證圖像及文本信息,構(gòu)建mini-fin數(shù)據(jù)集,并劃分為訓(xùn)練集和測(cè)試集;
36、數(shù)據(jù)預(yù)處理模塊:用于對(duì)訓(xùn)練集的圖像數(shù)據(jù)使用hsv亮度增強(qiáng)方法進(jìn)行數(shù)據(jù)預(yù)處理,得到財(cái)務(wù)圖像數(shù)據(jù);
37、模型構(gòu)建模塊:用于構(gòu)建基于超輕量級(jí)特征壓縮的財(cái)務(wù)憑證處理模型,所述模型包括全局輕量特征提取器、局部輕量特征提取器、壓縮感知機(jī)、注意力模塊、分類器以及文本提取器;所述財(cái)務(wù)圖像數(shù)據(jù)輸入到所述模型中,對(duì)模型進(jìn)行訓(xùn)練;
38、模型優(yōu)化模塊:用于通過(guò)分類損失函數(shù)和文本損失函數(shù)對(duì)所述模型進(jìn)行優(yōu)化,得到訓(xùn)練好的模型;
39、財(cái)務(wù)憑證處理模塊:用于將測(cè)試集中待檢測(cè)的財(cái)務(wù)憑證圖像輸入到訓(xùn)練好的模型中,得到財(cái)務(wù)憑證處理結(jié)果。
40、本發(fā)明的優(yōu)點(diǎn)在于:
41、本發(fā)明通過(guò)融合全局輕量特征提取器和局部輕量特征提取器,實(shí)現(xiàn)對(duì)財(cái)務(wù)憑證圖像的綜合特征提取,有效提高了模型對(duì)財(cái)務(wù)信息的理解能力。同時(shí),引入壓縮感知機(jī)和注意力模塊,能夠在保持特征信息豐富性的同時(shí),進(jìn)一步降低模型的復(fù)雜度和計(jì)算成本,使得處理大規(guī)模財(cái)務(wù)數(shù)據(jù)變得更加高效。通過(guò)mini-fin數(shù)據(jù)集和特征壓縮算法的構(gòu)建,該方法實(shí)現(xiàn)了對(duì)待檢測(cè)的醫(yī)療財(cái)務(wù)憑證圖像同步進(jìn)行分類和文本預(yù)測(cè),在財(cái)務(wù)人工智能領(lǐng)域?yàn)獒t(yī)療財(cái)務(wù)憑證處理提供了一種創(chuàng)新、高效的解決方案,可為醫(yī)院提供快速、精準(zhǔn)的財(cái)務(wù)信息處理服務(wù)。