本發(fā)明涉及票據(jù)數(shù)據(jù)處理,尤其涉及一種票據(jù)的文字識別方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、票據(jù)文本檢測是指從一張票據(jù)圖像中檢測用戶想要提取的關(guān)鍵字段的位置信息。隨著互聯(lián)網(wǎng)和金融技術(shù)的發(fā)展,各種不同類型的票據(jù)數(shù)量飛速增長,例如,火車票、機票行程單、增值稅發(fā)票、銀行支票等。各類票據(jù)中存在大量與金融業(yè)務(wù)相關(guān)的信息字段,為了提高對于票據(jù)中信息的管理效率,需要對票據(jù)進行數(shù)字化處理。然而,票據(jù)往往存在文本交疊、印章遮蓋等問題,采用常規(guī)的標(biāo)注方法標(biāo)注訓(xùn)練數(shù)據(jù)后訓(xùn)練得到的ocr識別模型對這類票據(jù)的識別準(zhǔn)確度低。此外,不同地方的票據(jù)種類差異較大,對于多種類的票據(jù),每個種類的票據(jù)均需訓(xùn)練一個識別模型,需要訓(xùn)練的識別模型較多,較為繁瑣。
技術(shù)實現(xiàn)思路
1、基于此,有必要針對上述技術(shù)問題,提供一種票據(jù)的文字識別方法、裝置、設(shè)備及存儲介質(zhì),以解決上述技術(shù)問題中存在的至少一個問題。
2、本發(fā)明提供一種票據(jù)的文字識別方法,包括:
3、獲取待識別的票據(jù)圖像;
4、對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果;
5、分別對所述錨點檢測結(jié)果進行文字識別,得到錨點文字識別結(jié)果,以及對所述關(guān)鍵字檢測結(jié)果進行文字識別,得到關(guān)鍵字識別結(jié)果;
6、對所述錨點文字識別結(jié)果和所述關(guān)鍵字識別結(jié)果進行融合,并對融合結(jié)果進行文字提取。
7、可選地,根據(jù)本發(fā)明提供的一種票據(jù)的文字識別方法,所述對所述錨點文字識別結(jié)果和所述關(guān)鍵字識別結(jié)果進行融合,包括:
8、根據(jù)錨點檢測結(jié)果中的錨點坐標(biāo)信息和關(guān)鍵字檢測結(jié)果中的關(guān)鍵字坐標(biāo)信息,對所述錨點文字識別結(jié)果和所述關(guān)鍵字識別結(jié)果進行融合。
9、可選地,根據(jù)本發(fā)明提供的一種票據(jù)的文字識別方法,所述對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果之前,還包括:
10、獲取不同類型的票據(jù)樣本集,其中,所述票據(jù)樣本集中的任一票據(jù)樣本關(guān)聯(lián)有樣本標(biāo)簽;
11、將各所述票據(jù)樣本輸入至預(yù)設(shè)的檢測模型,得到所述檢測模型輸出的檢測結(jié)果,其中,所述檢測結(jié)果包括錨點檢測區(qū)域和關(guān)鍵字檢測區(qū)域;
12、基于所述票據(jù)樣本對應(yīng)的檢測結(jié)果及其關(guān)聯(lián)有樣本標(biāo)簽,迭代訓(xùn)練所述檢測模型,其中,所述檢測模型用于對票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測。
13、可選地,根據(jù)本發(fā)明提供的一種票據(jù)的文字識別方法,所述對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果,包括:
14、按照訓(xùn)練好的檢測模型,對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點以及關(guān)鍵字在票據(jù)圖像中的位置信息;
15、將所述錨點對應(yīng)的位置信息作為所述錨點檢測結(jié)果,以及將關(guān)鍵字對應(yīng)的位置信息作為所述關(guān)鍵字檢測結(jié)果。
16、可選地,根據(jù)本發(fā)明提供的一種票據(jù)的文字識別方法,所述將各所述票據(jù)樣本輸入至預(yù)設(shè)的檢測模型,得到所述檢測模型輸出的檢測結(jié)果之后,還包括:
17、將各所述錨點檢測區(qū)域輸入至預(yù)設(shè)的錨點文字識別模型,得到待訓(xùn)練錨點識別結(jié)果,以及將各所述關(guān)鍵字檢測區(qū)域輸入至預(yù)設(shè)的關(guān)鍵字文字識別模型,得到待訓(xùn)練關(guān)鍵字識別結(jié)果;
18、基于各所述待訓(xùn)練錨點識別結(jié)果,迭代訓(xùn)練所述錨點文字識別模型,以及基于各所述待訓(xùn)練關(guān)鍵字識別結(jié)果,迭代訓(xùn)練所述關(guān)鍵字文字識別模型;
19、相應(yīng)地,分別對所述錨點檢測結(jié)果進行文字識別,得到錨點文字識別結(jié)果,以及對所述關(guān)鍵字檢測結(jié)果進行文字識別,得到關(guān)鍵字識別結(jié)果,包括:
20、利用所述錨點文字識別模型對所述錨點檢測結(jié)果進行文字識別,得到所述錨點文字識別結(jié)果,以及利用所述關(guān)鍵字文字識別模型對所述關(guān)鍵字檢測結(jié)果進行文字識別,得到所述關(guān)鍵字識別結(jié)果。
21、可選地,根據(jù)本發(fā)明提供的一種票據(jù)的文字識別方法,所述獲取不同類型的票據(jù)樣本集之后,還包括:
22、對各所述票據(jù)樣本進行預(yù)處理以及數(shù)據(jù)增強處理。
23、本發(fā)明還提供一種票據(jù)的文字識別裝置,包括:
24、獲取模塊,用于獲取待識別的票據(jù)圖像;
25、檢測模塊,用于對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果;
26、識別模塊,用于分別對所述錨點檢測結(jié)果進行文字識別,得到錨點文字識別結(jié)果,以及對所述關(guān)鍵字檢測結(jié)果進行文字識別,得到關(guān)鍵字識別結(jié)果;
27、融合模塊,用于對所述錨點文字識別結(jié)果和所述關(guān)鍵字識別結(jié)果進行融合,并對融合結(jié)果進行文字提取。
28、本發(fā)明還提供一種計算機設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現(xiàn)上述票據(jù)的文字識別方法。
29、本發(fā)明還提供一個或多個存儲有計算機可讀指令的可讀存儲介質(zhì),所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)上述票據(jù)的文字識別方法。
30、上述票據(jù)的文字識別方法、裝置、設(shè)備及存儲介質(zhì),包括:獲取待識別的票據(jù)圖像;對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果;分別對所述錨點檢測結(jié)果進行文字識別,得到錨點文字識別結(jié)果,以及對所述關(guān)鍵字檢測結(jié)果進行文字識別,得到關(guān)鍵字識別結(jié)果;對所述錨點文字識別結(jié)果和所述關(guān)鍵字識別結(jié)果進行融合,并對融合結(jié)果進行文字提取。本發(fā)明通過采用錨點和關(guān)鍵字的分離檢測和識別,可以有效地兼容當(dāng)前各地方票據(jù)種類差異大、樣式多樣或者存在的文字交疊難識別的情況,無需對于每個地區(qū)的票據(jù)單獨訓(xùn)練一個模型,可以同時準(zhǔn)確識別多地區(qū)的票據(jù)。
1.一種票據(jù)的文字識別方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的票據(jù)的文字識別方法,其特征在于,所述對所述錨點文字識別結(jié)果和所述關(guān)鍵字識別結(jié)果進行融合,包括:
3.根據(jù)權(quán)利要求1所述的票據(jù)的文字識別方法,其特征在于,所述對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果之前,還包括:
4.根據(jù)權(quán)利要求3所述的票據(jù)的文字識別方法,其特征在于,所述對所述票據(jù)圖像進行錨點檢測和關(guān)鍵字檢測,得到錨點檢測結(jié)果和關(guān)鍵字檢測結(jié)果,包括:
5.根據(jù)權(quán)利要求3所述的票據(jù)的文字識別方法,其特征在于,所述將各所述票據(jù)樣本輸入至預(yù)設(shè)的檢測模型,得到所述檢測模型輸出的檢測結(jié)果之后,還包括:
6.根據(jù)權(quán)利要求1所述的票據(jù)的文字識別方法,其特征在于,所述獲取不同類型的票據(jù)樣本集之后,還包括:
7.一種票據(jù)的文字識別裝置,其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的票據(jù)的文字識別裝置,其特征在于,所述融合模塊還用于:
9.一種計算機設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并在所述處理器上運行的計算機可讀指令,其特征在于,所述處理器執(zhí)行所述計算機可讀指令時實現(xiàn)如權(quán)利要求1至6任一項所述的票據(jù)的文字識別方法。
10.一種可讀存儲介質(zhì),其上存儲有計算機可讀指令,其特征在于,所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6任一項所述的票據(jù)的文字識別方法。