本發(fā)明涉及數(shù)據(jù)處理,尤其是涉及一種單據(jù)解析方法、裝置、電子設(shè)備和計算機可讀存儲介質(zhì)。
背景技術(shù):
1、隨著電子單據(jù)的普及,減少了很多資源浪費。企業(yè)為開展業(yè)務(wù)需要解析電子單據(jù)讀取相關(guān)數(shù)據(jù)信息。每個店鋪都會涉及到很多種類的電子單據(jù),需要使用不同的解析模板。但是,當(dāng)有新的業(yè)務(wù)類型上線時,還需要配置新的解析模板對電子單據(jù)進行解析。目前,本地配置解析模板費時費力,配置完成的模板在不同店鋪之間也不能復(fù)用,用戶體驗不佳。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種單據(jù)解析方法、裝置、電子設(shè)備和計算機可讀存儲介質(zhì),將不能在本地完成解析的單據(jù)在云端查找其他店鋪上傳的解析方案,提高解析方案的復(fù)用率,提高用戶體驗。
2、第一方面,本發(fā)明提供了一種單據(jù)解析方法,應(yīng)用于商業(yè)數(shù)據(jù)管理系統(tǒng),方法包括:
3、獲取店鋪終端的單據(jù),提取單據(jù)的第一關(guān)鍵字;其中,第一關(guān)鍵字表征單據(jù)的類型和單據(jù)內(nèi)數(shù)字文本的類型;
4、在預(yù)設(shè)的本地解析方案庫中查找第一關(guān)鍵字對應(yīng)的第一解析方案;
5、如果查找到第一解析方案,基于第一解析方案對單據(jù)進行解析,得到結(jié)構(gòu)化數(shù)據(jù);
6、如果未查到第一解析方案,基于第一關(guān)鍵字判斷單據(jù)的類型;
7、如果單據(jù)的類型為直接解析型,解析單據(jù)得到結(jié)構(gòu)化數(shù)據(jù);
8、如果單據(jù)的類型不為直接解析型,店鋪終端將單據(jù)上傳至云端服務(wù)器;在云端服務(wù)器中查找單據(jù)對應(yīng)的第二解析方案;如果查找到第二解析方案,將第二解析方案發(fā)送至店鋪;基于第二解析方案對單據(jù)進行解析,得到結(jié)構(gòu)化數(shù)據(jù)。
9、在本發(fā)明一些較佳的實施例中,在云端服務(wù)器中查找單據(jù)對應(yīng)的第二解析方案的步驟之后,方法還包括:
10、如果未查找到第二解析方案,基于單據(jù)配置第三解析方案;
11、判斷第三解析方案是否包含單據(jù)內(nèi)的全部關(guān)鍵詞;
12、如果第三解析方案包含單據(jù)內(nèi)的全部關(guān)鍵詞,保存第三解析方案。
13、在本發(fā)明一些較佳的實施例中,基于單據(jù)配置第三解析方案的步驟包括:
14、在單據(jù)中標(biāo)識單據(jù)的類型和第二關(guān)鍵字;其中,第二關(guān)鍵字表征單據(jù)內(nèi)的數(shù)字文本類型;
15、在單據(jù)中標(biāo)識第二關(guān)鍵字對應(yīng)的數(shù)字文本區(qū)域;
16、在單據(jù)中標(biāo)識整體取值區(qū)域;
17、在單據(jù)中標(biāo)識忽略內(nèi)容;
18、基于單據(jù)的類型、第二關(guān)鍵字、第二關(guān)鍵字對應(yīng)的數(shù)字文本區(qū)域、整體取值區(qū)域和忽略內(nèi)容配置第三解析方案。
19、在本發(fā)明一些較佳的實施例中,在單據(jù)中標(biāo)識忽略內(nèi)容的步驟包括:
20、在單據(jù)中標(biāo)識整體忽略區(qū)域;
21、在整體忽略區(qū)域中剔除單據(jù)的類型、第二關(guān)鍵字和第二關(guān)鍵字對應(yīng)的數(shù)字文本;
22、將整體忽略區(qū)域中剔除了單據(jù)的類型、第二關(guān)鍵字和第二關(guān)鍵字對應(yīng)的數(shù)字文本剩余的內(nèi)容作為忽略內(nèi)容。
23、在本發(fā)明一些較佳的實施例中,在如果第三解析方案包含單據(jù)內(nèi)的全部關(guān)鍵詞,保存第三解析方案的步驟之后,方法還包括:
24、判斷第三解析方案是否能用于解析大于預(yù)設(shè)數(shù)量的單據(jù);
25、如果第三解析方案能用于解析大于預(yù)設(shè)數(shù)量的單據(jù),將第三解析方案上傳至云端服務(wù)器。
26、在本發(fā)明一些較佳的實施例中,云端服務(wù)器為高性能匹配節(jié)點或全局方案庫。
27、第二方面,本發(fā)明提供了一種單據(jù)解析裝置,應(yīng)用于商業(yè)數(shù)據(jù)管理系統(tǒng),裝置包括:
28、單據(jù)處理模塊,用于獲取店鋪終端的單據(jù),提取單據(jù)的第一關(guān)鍵字;其中,第一關(guān)鍵字表征單據(jù)的類型和單據(jù)內(nèi)數(shù)字文本的類型;
29、解析方案查找模塊,用于在預(yù)設(shè)的本地解析方案庫中查找第一關(guān)鍵字對應(yīng)的第一解析方案;
30、第一單據(jù)解析模塊,用于如果查找到第一解析方案,基于第一解析方案對單據(jù)進行解析,得到結(jié)構(gòu)化數(shù)據(jù);
31、單據(jù)類型判斷模塊,用于如果未查到第一解析方案,基于第一關(guān)鍵字判斷單據(jù)的類型;
32、第二單據(jù)解析模塊,用于如果單據(jù)的類型為直接解析型,解析單據(jù)得到結(jié)構(gòu)化數(shù)據(jù);
33、第三單據(jù)解析模塊,用于如果單據(jù)的類型不為直接解析型,店鋪終端將單據(jù)上傳至云端服務(wù)器;在云端服務(wù)器中查找單據(jù)對應(yīng)的第二解析方案;如果查找到第二解析方案,將第二解析方案發(fā)送至店鋪;基于第二解析方案對單據(jù)進行解析,得到結(jié)構(gòu)化數(shù)據(jù)。
34、在本發(fā)明一些較佳的實施例中,裝置還包括:解析方案配置模塊,用于如果未查找到第二解析方案,基于單據(jù)配置第三解析方案;判斷第三解析方案是否包含單據(jù)內(nèi)的全部關(guān)鍵詞;如果第三解析方案包含單據(jù)內(nèi)的全部關(guān)鍵詞,保存第三解析方案。
35、第三方面,本發(fā)明提供了一種電子設(shè)備,包括處理器和存儲器,存儲器存儲有能夠被處理器執(zhí)行的計算機可執(zhí)行指令,處理器執(zhí)行計算機可執(zhí)行指令以實現(xiàn)上述第一方面的單據(jù)解析方法。
36、第四方面,本發(fā)明提供了一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)存儲有計算機可執(zhí)行指令,計算機可執(zhí)行指令在被處理器調(diào)用和執(zhí)行時,計算機可執(zhí)行指令促使處理器實現(xiàn)上述第一方面的單據(jù)解析方法。
37、本發(fā)明帶來了以下有益效果:
38、本發(fā)明提供了一種單據(jù)解析方法、裝置、電子設(shè)備和計算機可讀存儲介質(zhì),應(yīng)用于商業(yè)數(shù)據(jù)管理系統(tǒng),方法包括:獲取店鋪終端的單據(jù),提取單據(jù)的第一關(guān)鍵字;其中,第一關(guān)鍵字表征單據(jù)的類型和單據(jù)內(nèi)數(shù)字文本的類型;在預(yù)設(shè)的本地解析方案庫中查找第一關(guān)鍵字對應(yīng)的第一解析方案;如果查找到第一解析方案,基于第一解析方案對單據(jù)進行解析,得到結(jié)構(gòu)化數(shù)據(jù);如果未查到第一解析方案,基于第一關(guān)鍵字判斷單據(jù)的類型;如果單據(jù)的類型為直接解析型,解析單據(jù)得到結(jié)構(gòu)化數(shù)據(jù);如果單據(jù)的類型不為直接解析型,店鋪終端將單據(jù)上傳至云端服務(wù)器;在云端服務(wù)器中查找單據(jù)對應(yīng)的第二解析方案;如果查找到第二解析方案,將第二解析方案發(fā)送至店鋪;基于第二解析方案對單據(jù)進行解析,得到結(jié)構(gòu)化數(shù)據(jù);將不能在本地完成解析的單據(jù)在云端查找其他店鋪上傳的解析方案,提高解析方案的復(fù)用率,提高用戶體驗。
1.一種單據(jù)解析方法,其特征在于,應(yīng)用于商業(yè)數(shù)據(jù)管理系統(tǒng),所述方法包括:
2.根據(jù)權(quán)利要求1所述的單據(jù)解析方法,其特征在于,在所述云端服務(wù)器中查找所述單據(jù)對應(yīng)的第二解析方案的步驟之后,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的單據(jù)解析方法,其特征在于,基于所述單據(jù)配置第三解析方案的步驟包括:
4.根據(jù)權(quán)利要求3所述的單據(jù)解析方法,其特征在于,在所述單據(jù)中標(biāo)識忽略內(nèi)容的步驟包括:
5.根據(jù)權(quán)利要求2所述的單據(jù)解析方法,其特征在于,在如果所述第三解析方案包含所述單據(jù)內(nèi)的全部關(guān)鍵詞,保存所述第三解析方案的步驟之后,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的單據(jù)解析方法,其特征在于,所述云端服務(wù)器為高性能匹配節(jié)點或全局方案庫。
7.一種單據(jù)解析裝置,其特征在于,應(yīng)用于商業(yè)數(shù)據(jù)管理系統(tǒng),所述裝置包括:
8.根據(jù)權(quán)利要求7所述的單據(jù)解析裝置,其特征在于,所述裝置還包括:解析方案配置模塊,用于如果未查找到所述第二解析方案,基于所述單據(jù)配置第三解析方案;判斷所述第三解析方案是否包含所述單據(jù)內(nèi)的全部關(guān)鍵詞;如果所述第三解析方案包含所述單據(jù)內(nèi)的全部關(guān)鍵詞,保存所述第三解析方案。
9.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述存儲器存儲有能夠被所述處理器執(zhí)行的計算機可執(zhí)行指令,所述處理器執(zhí)行所述計算機可執(zhí)行指令以實現(xiàn)上述權(quán)利要求1至6任一項所述的單據(jù)解析方法。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被處理器調(diào)用和執(zhí)行時,計算機可執(zhí)行指令促使處理器實現(xiàn)權(quán)利要求1至6任一項所述的單據(jù)解析方法。