本申請(qǐng)實(shí)施例涉及信息識(shí)別,尤其涉及單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品。
背景技術(shù):
1、數(shù)字化發(fā)展時(shí)代中,單據(jù)信息能總結(jié)和反饋所需的交易情況。
2、傳統(tǒng)的單據(jù)信息產(chǎn)品,主要采用光學(xué)字符識(shí)別(ocr,optical?characterrecognition)技術(shù)、模板匹配方法識(shí)別單據(jù)信息。具體的,用預(yù)先設(shè)定好的單據(jù)模板在當(dāng)前單據(jù)的相應(yīng)位置框選出字符,之后,通過ocr識(shí)別框選出的字符,從而提取出所需的單據(jù)信息,如付款人、付款賬號(hào),收款人,收款賬號(hào)、交易金額等信息。
3、上述單據(jù)信息產(chǎn)品在標(biāo)準(zhǔn)化單據(jù)的識(shí)別上效果顯著,但在面對(duì)格式多變、個(gè)性化強(qiáng)的不同機(jī)構(gòu)出具單據(jù)時(shí),識(shí)別的準(zhǔn)確率和適應(yīng)性受限。不同機(jī)構(gòu)出具的單據(jù)排版格式、信息填寫位置不盡相同,若是新出現(xiàn)的單據(jù),采用舊單據(jù)模板難以在相應(yīng)位置提取到有效信息,識(shí)別準(zhǔn)確率不高。而為適配每一新單據(jù),為其單獨(dú)開發(fā)一單據(jù)模板,開發(fā)人員都需要做大量的數(shù)據(jù)訓(xùn)練和調(diào)試工作,成本投入大。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供了單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品,用于高效提高對(duì)多樣化單據(jù)的信息識(shí)別準(zhǔn)確度,減少維護(hù)成本。
2、本申請(qǐng)實(shí)施例第一方面提供一種單據(jù)信息識(shí)別方法,包括:
3、從提示詞庫中查找與待識(shí)別單據(jù)對(duì)應(yīng)匹配的目標(biāo)提示詞;
4、獲取歷史會(huì)話記錄;所述歷史會(huì)話記錄所記載的示例單據(jù)和所述待識(shí)別單據(jù)所屬的單據(jù)類型相同,所述歷史會(huì)話記錄至少記載所述示例單據(jù)的內(nèi)容排版格式;
5、基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息。
6、可選地,所述提示詞庫的構(gòu)建過程包括:
7、采集不同所述單據(jù)類型的單據(jù)樣本,以及針對(duì)各類所述單據(jù)樣本對(duì)應(yīng)構(gòu)建的初始提示詞;
8、將各類所述單據(jù)樣本及其所述初始提示詞輸入預(yù)訓(xùn)練好的信息識(shí)別模型,以識(shí)別出各類所述單據(jù)樣本經(jīng)相應(yīng)所述初始提示詞指定輸出的單據(jù)信息;
9、若有所述單據(jù)樣本輸出的單據(jù)信息不符合預(yù)期結(jié)果,分析所述單據(jù)樣本被識(shí)別錯(cuò)誤的原因,并基于所述原因修改所述單據(jù)樣本的所述初始提示詞得到新提示詞;
10、將所述單據(jù)樣本及其所述新提示詞輸入所述信息識(shí)別模型,直至輸出的單據(jù)信息符合所述預(yù)期結(jié)果,并將最新得到的提示詞作為與所述單據(jù)樣本的單據(jù)類型匹配的提示詞。
11、可選地,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:
12、收集客戶端對(duì)所述信息識(shí)別模型輸出的單據(jù)信息的錯(cuò)誤標(biāo)記信息和/或校正數(shù)據(jù);
13、使用所述錯(cuò)誤標(biāo)記信息和/或所述校正數(shù)據(jù),對(duì)所述信息識(shí)別模型進(jìn)行增量學(xué)習(xí),得到用于替代原信息識(shí)別模型的新信息識(shí)別模型。
14、可選地,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:
15、對(duì)所述信息識(shí)別模型引入注意力機(jī)制,以增強(qiáng)所述信息識(shí)別模型對(duì)單據(jù)中關(guān)鍵信息區(qū)域的關(guān)注;所述關(guān)鍵信息包含至少一提示詞指定輸出的單據(jù)信息。
16、可選地,若在所述提示詞庫中查找不到所述目標(biāo)提示詞,所述方法還包括:
17、獲取默認(rèn)提示詞;所述默認(rèn)提示詞至少通過各類示例單據(jù)的共性內(nèi)容、歷史所需輸出的單據(jù)信息總結(jié)確定;
18、將所述默認(rèn)提示詞作為所述目標(biāo)提示詞。
19、可選地,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之后,所述方法還包括:
20、對(duì)識(shí)別出的所述單據(jù)信息進(jìn)行邏輯校驗(yàn);
21、若校驗(yàn)失敗,則發(fā)起錯(cuò)誤提示,和/或,至少返回基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息的步驟,以重試得到校驗(yàn)成功的單據(jù)信息。
22、可選地,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:
23、將所述待識(shí)別單據(jù)轉(zhuǎn)換成圖像格式文件;
24、提高所述圖像格式文件的清晰度,用于從中識(shí)別出更清晰的單據(jù)信息。
25、本申請(qǐng)第一方面所述的方法在具體實(shí)施時(shí),可采用本申請(qǐng)第二方面所述的內(nèi)容實(shí)現(xiàn)。
26、本申請(qǐng)實(shí)施例第二方面提供一種單據(jù)信息識(shí)別系統(tǒng),包括:
27、處理單元,用于從提示詞庫中查找與待識(shí)別單據(jù)對(duì)應(yīng)匹配的目標(biāo)提示詞;
28、獲取單元,用于獲取歷史會(huì)話記錄;所述歷史會(huì)話記錄所記載的示例單據(jù)和所述待識(shí)別單據(jù)所屬的單據(jù)類型相同,所述歷史會(huì)話記錄至少記載所述示例單據(jù)的內(nèi)容排版格式;
29、所述處理單元,還用于基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息。
30、本申請(qǐng)實(shí)施例第三方面提供一種電子設(shè)備,包括:處理器及存儲(chǔ)器;
31、所述處理器配置為與所述存儲(chǔ)器通信,并執(zhí)行所述存儲(chǔ)器中的指令以實(shí)現(xiàn)本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。
32、本申請(qǐng)實(shí)施例第四方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。
33、本申請(qǐng)實(shí)施例第五方面提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。
34、從以上技術(shù)方案可以看出,本申請(qǐng)實(shí)施例至少具有以下優(yōu)點(diǎn):
35、本申請(qǐng)實(shí)施例采用歷史會(huì)話記錄結(jié)合提示詞進(jìn)行信息識(shí)別的機(jī)制,可以多方面地綜合提高對(duì)單據(jù)信息的識(shí)別準(zhǔn)確度,避免單一因素識(shí)別帶來的失誤。此外,歷史會(huì)話記錄、目標(biāo)提示詞均與待識(shí)別單據(jù)存在對(duì)應(yīng)關(guān)系,使得本申請(qǐng)實(shí)施例可有效適應(yīng)于不同單據(jù)類型或不斷更新格式的多樣化單據(jù),減少人工干預(yù)和成本投入。
1.一種單據(jù)信息識(shí)別方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的單據(jù)信息識(shí)別方法,其特征在于,所述提示詞庫的構(gòu)建過程包括:
3.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:
4.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:
5.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,若在所述提示詞庫中查找不到所述目標(biāo)提示詞,所述方法還包括:
6.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之后,所述方法還包括:
7.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:
8.一種單據(jù)信息識(shí)別系統(tǒng),其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括:處理器及存儲(chǔ)器;
10.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的方法。
11.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的方法。