欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品與流程

文檔序號(hào):40598610發(fā)布日期:2025-01-07 20:39閱讀:7來源:國知局
單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品與流程

本申請(qǐng)實(shí)施例涉及信息識(shí)別,尤其涉及單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品。


背景技術(shù):

1、數(shù)字化發(fā)展時(shí)代中,單據(jù)信息能總結(jié)和反饋所需的交易情況。

2、傳統(tǒng)的單據(jù)信息產(chǎn)品,主要采用光學(xué)字符識(shí)別(ocr,optical?characterrecognition)技術(shù)、模板匹配方法識(shí)別單據(jù)信息。具體的,用預(yù)先設(shè)定好的單據(jù)模板在當(dāng)前單據(jù)的相應(yīng)位置框選出字符,之后,通過ocr識(shí)別框選出的字符,從而提取出所需的單據(jù)信息,如付款人、付款賬號(hào),收款人,收款賬號(hào)、交易金額等信息。

3、上述單據(jù)信息產(chǎn)品在標(biāo)準(zhǔn)化單據(jù)的識(shí)別上效果顯著,但在面對(duì)格式多變、個(gè)性化強(qiáng)的不同機(jī)構(gòu)出具單據(jù)時(shí),識(shí)別的準(zhǔn)確率和適應(yīng)性受限。不同機(jī)構(gòu)出具的單據(jù)排版格式、信息填寫位置不盡相同,若是新出現(xiàn)的單據(jù),采用舊單據(jù)模板難以在相應(yīng)位置提取到有效信息,識(shí)別準(zhǔn)確率不高。而為適配每一新單據(jù),為其單獨(dú)開發(fā)一單據(jù)模板,開發(fā)人員都需要做大量的數(shù)據(jù)訓(xùn)練和調(diào)試工作,成本投入大。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例提供了單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品,用于高效提高對(duì)多樣化單據(jù)的信息識(shí)別準(zhǔn)確度,減少維護(hù)成本。

2、本申請(qǐng)實(shí)施例第一方面提供一種單據(jù)信息識(shí)別方法,包括:

3、從提示詞庫中查找與待識(shí)別單據(jù)對(duì)應(yīng)匹配的目標(biāo)提示詞;

4、獲取歷史會(huì)話記錄;所述歷史會(huì)話記錄所記載的示例單據(jù)和所述待識(shí)別單據(jù)所屬的單據(jù)類型相同,所述歷史會(huì)話記錄至少記載所述示例單據(jù)的內(nèi)容排版格式;

5、基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息。

6、可選地,所述提示詞庫的構(gòu)建過程包括:

7、采集不同所述單據(jù)類型的單據(jù)樣本,以及針對(duì)各類所述單據(jù)樣本對(duì)應(yīng)構(gòu)建的初始提示詞;

8、將各類所述單據(jù)樣本及其所述初始提示詞輸入預(yù)訓(xùn)練好的信息識(shí)別模型,以識(shí)別出各類所述單據(jù)樣本經(jīng)相應(yīng)所述初始提示詞指定輸出的單據(jù)信息;

9、若有所述單據(jù)樣本輸出的單據(jù)信息不符合預(yù)期結(jié)果,分析所述單據(jù)樣本被識(shí)別錯(cuò)誤的原因,并基于所述原因修改所述單據(jù)樣本的所述初始提示詞得到新提示詞;

10、將所述單據(jù)樣本及其所述新提示詞輸入所述信息識(shí)別模型,直至輸出的單據(jù)信息符合所述預(yù)期結(jié)果,并將最新得到的提示詞作為與所述單據(jù)樣本的單據(jù)類型匹配的提示詞。

11、可選地,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:

12、收集客戶端對(duì)所述信息識(shí)別模型輸出的單據(jù)信息的錯(cuò)誤標(biāo)記信息和/或校正數(shù)據(jù);

13、使用所述錯(cuò)誤標(biāo)記信息和/或所述校正數(shù)據(jù),對(duì)所述信息識(shí)別模型進(jìn)行增量學(xué)習(xí),得到用于替代原信息識(shí)別模型的新信息識(shí)別模型。

14、可選地,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:

15、對(duì)所述信息識(shí)別模型引入注意力機(jī)制,以增強(qiáng)所述信息識(shí)別模型對(duì)單據(jù)中關(guān)鍵信息區(qū)域的關(guān)注;所述關(guān)鍵信息包含至少一提示詞指定輸出的單據(jù)信息。

16、可選地,若在所述提示詞庫中查找不到所述目標(biāo)提示詞,所述方法還包括:

17、獲取默認(rèn)提示詞;所述默認(rèn)提示詞至少通過各類示例單據(jù)的共性內(nèi)容、歷史所需輸出的單據(jù)信息總結(jié)確定;

18、將所述默認(rèn)提示詞作為所述目標(biāo)提示詞。

19、可選地,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之后,所述方法還包括:

20、對(duì)識(shí)別出的所述單據(jù)信息進(jìn)行邏輯校驗(yàn);

21、若校驗(yàn)失敗,則發(fā)起錯(cuò)誤提示,和/或,至少返回基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息的步驟,以重試得到校驗(yàn)成功的單據(jù)信息。

22、可選地,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:

23、將所述待識(shí)別單據(jù)轉(zhuǎn)換成圖像格式文件;

24、提高所述圖像格式文件的清晰度,用于從中識(shí)別出更清晰的單據(jù)信息。

25、本申請(qǐng)第一方面所述的方法在具體實(shí)施時(shí),可采用本申請(qǐng)第二方面所述的內(nèi)容實(shí)現(xiàn)。

26、本申請(qǐng)實(shí)施例第二方面提供一種單據(jù)信息識(shí)別系統(tǒng),包括:

27、處理單元,用于從提示詞庫中查找與待識(shí)別單據(jù)對(duì)應(yīng)匹配的目標(biāo)提示詞;

28、獲取單元,用于獲取歷史會(huì)話記錄;所述歷史會(huì)話記錄所記載的示例單據(jù)和所述待識(shí)別單據(jù)所屬的單據(jù)類型相同,所述歷史會(huì)話記錄至少記載所述示例單據(jù)的內(nèi)容排版格式;

29、所述處理單元,還用于基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息。

30、本申請(qǐng)實(shí)施例第三方面提供一種電子設(shè)備,包括:處理器及存儲(chǔ)器;

31、所述處理器配置為與所述存儲(chǔ)器通信,并執(zhí)行所述存儲(chǔ)器中的指令以實(shí)現(xiàn)本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。

32、本申請(qǐng)實(shí)施例第四方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。

33、本申請(qǐng)實(shí)施例第五方面提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。

34、從以上技術(shù)方案可以看出,本申請(qǐng)實(shí)施例至少具有以下優(yōu)點(diǎn):

35、本申請(qǐng)實(shí)施例采用歷史會(huì)話記錄結(jié)合提示詞進(jìn)行信息識(shí)別的機(jī)制,可以多方面地綜合提高對(duì)單據(jù)信息的識(shí)別準(zhǔn)確度,避免單一因素識(shí)別帶來的失誤。此外,歷史會(huì)話記錄、目標(biāo)提示詞均與待識(shí)別單據(jù)存在對(duì)應(yīng)關(guān)系,使得本申請(qǐng)實(shí)施例可有效適應(yīng)于不同單據(jù)類型或不斷更新格式的多樣化單據(jù),減少人工干預(yù)和成本投入。



技術(shù)特征:

1.一種單據(jù)信息識(shí)別方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的單據(jù)信息識(shí)別方法,其特征在于,所述提示詞庫的構(gòu)建過程包括:

3.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:

4.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,若采用信息識(shí)別模型識(shí)別單據(jù)信息,則基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:

5.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,若在所述提示詞庫中查找不到所述目標(biāo)提示詞,所述方法還包括:

6.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之后,所述方法還包括:

7.根據(jù)權(quán)利要求1或2所述的單據(jù)信息識(shí)別方法,其特征在于,基于所述目標(biāo)提示詞和所述內(nèi)容排版格式的指示,從所述待識(shí)別單據(jù)中識(shí)別出所述目標(biāo)提示詞指定輸出的單據(jù)信息之前,所述方法還包括:

8.一種單據(jù)信息識(shí)別系統(tǒng),其特征在于,包括:

9.一種電子設(shè)備,其特征在于,包括:處理器及存儲(chǔ)器;

10.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的方法。

11.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的方法。


技術(shù)總結(jié)
本申請(qǐng)實(shí)施例公開了單據(jù)信息識(shí)別方法、系統(tǒng)及相關(guān)產(chǎn)品,該方法包括:從提示詞庫中查找與待識(shí)別單據(jù)對(duì)應(yīng)匹配的目標(biāo)提示詞;獲取歷史會(huì)話記錄;歷史會(huì)話記錄所記載的示例單據(jù)和待識(shí)別單據(jù)所屬的單據(jù)類型相同,歷史會(huì)話記錄至少記載示例單據(jù)的內(nèi)容排版格式;基于目標(biāo)提示詞和內(nèi)容排版格式的指示,從待識(shí)別單據(jù)中識(shí)別出目標(biāo)提示詞指定輸出的單據(jù)信息。其中,采用歷史會(huì)話記錄結(jié)合提示詞進(jìn)行信息識(shí)別的機(jī)制,可以多方面地綜合提高對(duì)單據(jù)信息的識(shí)別準(zhǔn)確度,避免單一因素識(shí)別帶來的失誤。此外,歷史會(huì)話記錄、目標(biāo)提示詞均與待識(shí)別單據(jù)存在對(duì)應(yīng)關(guān)系,使得本申請(qǐng)實(shí)施例可有效適應(yīng)于不同單據(jù)類型或不斷更新格式的多樣化單據(jù),減少人工干預(yù)和成本投入。

技術(shù)研發(fā)人員:張慶
受保護(hù)的技術(shù)使用者:深圳金蝶賬無憂網(wǎng)絡(luò)科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
铜川市| 沾化县| 百色市| 城口县| 天镇县| 泸西县| 忻州市| 枣强县| 潜江市| 定州市| 无极县| 克什克腾旗| 容城县| 永福县| 乐昌市| 南郑县| 绍兴市| 翁牛特旗| 台东市| 河间市| 外汇| 丹棱县| 固阳县| 吴川市| 桐城市| 方城县| 大余县| 广灵县| 沙坪坝区| 安阳县| 白水县| 浠水县| 玉田县| 井冈山市| 济宁市| 德格县| 会东县| 和顺县| 屯门区| 焉耆| 安阳县|