本申請(qǐng)涉及發(fā)票,特別是涉及一種發(fā)票信息的查詢方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、在發(fā)票技術(shù)領(lǐng)域中,通常在存儲(chǔ)有發(fā)票信息的數(shù)據(jù)庫(kù)中,對(duì)發(fā)票信息進(jìn)行查詢。
2、然而,目前的發(fā)票信息的查詢方法中,是通過(guò)關(guān)系型數(shù)據(jù)庫(kù)對(duì)發(fā)票信息進(jìn)行存儲(chǔ),而關(guān)系型數(shù)據(jù)庫(kù)、以及其中的數(shù)據(jù)存儲(chǔ)形式極大地限制了對(duì)發(fā)票信息的查詢性能,一方面,難以在大規(guī)模數(shù)據(jù)中實(shí)現(xiàn)高效的處理,另一方面,難以針對(duì)個(gè)性化檢索需求實(shí)現(xiàn)適應(yīng)性的查詢。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種能夠提高對(duì)發(fā)票信息進(jìn)行查詢的高效性和適應(yīng)性的發(fā)票信息的查詢方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
2、第一方面,本申請(qǐng)?zhí)峁┝艘环N發(fā)票信息的查詢方法,包括:
3、獲取目標(biāo)發(fā)票信息對(duì)應(yīng)的查詢請(qǐng)求,對(duì)所述查詢請(qǐng)求進(jìn)行特征提取,得到所述查詢請(qǐng)求對(duì)應(yīng)的查詢特征信息;
4、將所述查詢特征信息分別與數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)集的特征信息進(jìn)行匹配,得到所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息;其中,所述特征信息是預(yù)先對(duì)發(fā)票信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到的,且同一語(yǔ)義粒度對(duì)應(yīng)的特征信息存儲(chǔ)于同一數(shù)據(jù)集;
5、將所述目標(biāo)特征信息和所述查詢請(qǐng)求輸入至語(yǔ)言模型中進(jìn)行處理,得到所述目標(biāo)發(fā)票信息對(duì)應(yīng)的回答信息。
6、在其中一個(gè)實(shí)施例中,所述將所述查詢特征信息分別與數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)集的特征信息進(jìn)行匹配,得到所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息,包括:
7、獲取所述查詢特征信息分別與各個(gè)特征信息之間的相似度,根據(jù)相似度對(duì)各個(gè)特征信息進(jìn)行排序,得到第一預(yù)設(shè)次序的多個(gè)第一特征信息;
8、根據(jù)預(yù)設(shè)的評(píng)估指標(biāo),獲取所述查詢特征信息分別與各個(gè)第一特征信息之間的相似度評(píng)估結(jié)果,根據(jù)相似度評(píng)估結(jié)果對(duì)各個(gè)第一特征信息進(jìn)行排序,得到第二預(yù)設(shè)次序的第二特征信息,將所述第二特征信息作為所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息。
9、在其中一個(gè)實(shí)施例中,所述獲取目標(biāo)發(fā)票信息對(duì)應(yīng)的查詢請(qǐng)求之前,還包括:獲取發(fā)票信息,在所述發(fā)票信息中識(shí)別得到所述發(fā)票信息對(duì)應(yīng)的銷方標(biāo)識(shí)和購(gòu)方標(biāo)識(shí);通過(guò)企業(yè)信息平臺(tái)對(duì)應(yīng)的通信接口,獲取在所述企業(yè)信息平臺(tái)中的所述銷方標(biāo)識(shí)對(duì)應(yīng)的第一企業(yè)信息、以及所述購(gòu)方標(biāo)識(shí)對(duì)應(yīng)的第二企業(yè)信息;將所述發(fā)票信息、所述第一企業(yè)信息和所述第二企業(yè)信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到特征信息,將同一語(yǔ)義粒度的特征信息存儲(chǔ)于同一數(shù)據(jù)集。
10、在其中一個(gè)實(shí)施例中,所述將所述發(fā)票信息、所述第一企業(yè)信息和所述第二企業(yè)信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到特征信息,將同一語(yǔ)義粒度的特征信息存儲(chǔ)于同一數(shù)據(jù)集,包括:將所述發(fā)票信息、所述第一企業(yè)信息和所述第二企業(yè)信息按照不同層級(jí)的語(yǔ)義單元進(jìn)行切分得到已切分?jǐn)?shù)據(jù),將同一層級(jí)的語(yǔ)義單元所對(duì)應(yīng)的已切分?jǐn)?shù)據(jù)存儲(chǔ)于同一數(shù)據(jù)集;所述語(yǔ)義單元的層級(jí)包括文檔級(jí)別、段落級(jí)別、行級(jí)別、詞級(jí)別以及字符級(jí)別;將各個(gè)數(shù)據(jù)集的已切分?jǐn)?shù)據(jù)進(jìn)行特征提取得到特征信息,將同一數(shù)據(jù)集的特征信息進(jìn)行融合,得到各個(gè)以向量矩陣形式表示的數(shù)據(jù)集。
11、在其中一個(gè)實(shí)施例中,所述將所述發(fā)票信息、所述第一企業(yè)信息和所述第二企業(yè)信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到特征信息,將同一語(yǔ)義粒度的特征信息存儲(chǔ)于同一數(shù)據(jù)集,包括:根據(jù)不同語(yǔ)義粒度,生成各個(gè)語(yǔ)義粒度分別對(duì)應(yīng)的數(shù)據(jù)處理任務(wù),所述數(shù)據(jù)處理任務(wù)為對(duì)數(shù)據(jù)依序進(jìn)行切分處理、特征提取處理、寫入數(shù)據(jù)庫(kù)處理的任務(wù);根據(jù)當(dāng)前的運(yùn)行環(huán)境,確定各個(gè)數(shù)據(jù)處理任務(wù)分別對(duì)應(yīng)的任務(wù)執(zhí)行狀態(tài),以使各個(gè)數(shù)據(jù)處理任務(wù)根據(jù)對(duì)應(yīng)的任務(wù)執(zhí)行狀態(tài)并行地執(zhí)行。
12、在其中一個(gè)實(shí)施例中,所述將所述查詢特征信息分別與數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)集的特征信息進(jìn)行匹配,得到所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息,包括:根據(jù)不同數(shù)據(jù)集,生成各個(gè)數(shù)據(jù)集分別對(duì)應(yīng)的數(shù)據(jù)匹配任務(wù),所述數(shù)據(jù)匹配任務(wù)為將所述查詢特征信息與數(shù)據(jù)集的特征信息進(jìn)行匹配的任務(wù);根據(jù)當(dāng)前的運(yùn)行環(huán)境,確定各個(gè)數(shù)據(jù)匹配任務(wù)分別對(duì)應(yīng)的任務(wù)執(zhí)行狀態(tài),以使各個(gè)數(shù)據(jù)匹配任務(wù)根據(jù)對(duì)應(yīng)的任務(wù)執(zhí)行狀態(tài)并行地執(zhí)行。
13、第二方面,本申請(qǐng)還提供了一種發(fā)票信息的查詢裝置,包括:
14、獲取模塊,用于獲取目標(biāo)發(fā)票信息對(duì)應(yīng)的查詢請(qǐng)求,對(duì)所述查詢請(qǐng)求進(jìn)行特征提取,得到所述查詢請(qǐng)求對(duì)應(yīng)的查詢特征信息;
15、匹配模塊,用于將所述查詢特征信息分別與數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)集的特征信息進(jìn)行匹配,得到所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息;其中,所述特征信息是預(yù)先對(duì)發(fā)票信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到的,且同一語(yǔ)義粒度對(duì)應(yīng)的特征信息存儲(chǔ)于同一數(shù)據(jù)集;
16、模型處理模塊,用于將所述目標(biāo)特征信息和所述查詢請(qǐng)求輸入至語(yǔ)言模型中進(jìn)行處理,得到所述目標(biāo)發(fā)票信息對(duì)應(yīng)的回答信息。
17、第三方面,本申請(qǐng)還提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)以上步驟。
18、第四方面,本申請(qǐng)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以上步驟。
19、第五方面,本申請(qǐng)還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以上步驟。
20、上述發(fā)票信息的查詢方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品,預(yù)先對(duì)發(fā)票信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到各個(gè)數(shù)據(jù)集對(duì)應(yīng)的特征信息,通過(guò)將查詢請(qǐng)求對(duì)應(yīng)的查詢特征信息分別與數(shù)據(jù)庫(kù)中的特征信息進(jìn)行匹配,得到查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息,以將目標(biāo)特征信息和查詢請(qǐng)求作為語(yǔ)言模型的輸入,得到輸出的回答信息;基于此,一方面,在特征信息匹配的維度上,精準(zhǔn)地、高效地在數(shù)據(jù)庫(kù)中匹配得到查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息,另一方面,在語(yǔ)義粒度匹配的維度上,適應(yīng)性地、層次性地將查詢特征信息分別與不同語(yǔ)義粒度的特征信息進(jìn)行匹配以得到目標(biāo)特征信息,從而根據(jù)匹配得到的目標(biāo)特征信息精準(zhǔn)地得到回答信息,以提高對(duì)發(fā)票信息進(jìn)行查詢的高效性和適應(yīng)性。
1.一種發(fā)票信息的查詢方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述查詢特征信息分別與數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)集的特征信息進(jìn)行匹配,得到所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取目標(biāo)發(fā)票信息對(duì)應(yīng)的查詢請(qǐng)求之前,還包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述發(fā)票信息、所述第一企業(yè)信息和所述第二企業(yè)信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到特征信息,將同一語(yǔ)義粒度的特征信息存儲(chǔ)于同一數(shù)據(jù)集,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述發(fā)票信息、所述第一企業(yè)信息和所述第二企業(yè)信息按照不同語(yǔ)義粒度進(jìn)行切分和特征提取得到特征信息,將同一語(yǔ)義粒度的特征信息存儲(chǔ)于同一數(shù)據(jù)集,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述查詢特征信息分別與數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)集的特征信息進(jìn)行匹配,得到所述查詢特征信息對(duì)應(yīng)的目標(biāo)特征信息,包括:
7.一種發(fā)票信息的查詢裝置,其特征在于,所述裝置包括:
8.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。