本申請涉及人工智能,具體而言,涉及一種基于圖的信息問答方法及裝置、存儲介質(zhì)及電子裝置。
背景技術(shù):
1、科研項目申請書作為集團科技部項目審批,獲取研究資金支持的重要途徑之一,其質(zhì)量直接關(guān)系到項目申報的成功與否。這類文檔通常具有以下幾個特點:一是內(nèi)容豐富且復(fù)雜,涵蓋項目背景、目標(biāo)、方法論、預(yù)算等多個方面;二是篇幅較長,往往包含大量專業(yè)術(shù)語和技術(shù)細(xì)節(jié);三是結(jié)構(gòu)化程度不高,不同部分之間缺乏簡單易懂清晰的邏輯關(guān)聯(lián)。
2、由于上述特點,評審者在面對大量的申請書時往往會遇到一些挑戰(zhàn),如信息過載、難以迅速定位關(guān)鍵信息等。目前,評審過程主要依賴于人工閱讀和理解,效率較低且易出錯。此外,傳統(tǒng)的文檔檢索方法如關(guān)鍵詞搜索雖然可以提供一定的幫助,但其功能較為單一,無法滿足對文檔進行深度理解和綜合分析的需求。
3、針對相關(guān)技術(shù)中,專業(yè)文檔信息提取存在準(zhǔn)確性不高、處理效率低的問題,目前尚未提出有效的解決方案。
4、因此,有必要對現(xiàn)有相關(guān)技術(shù)予以改良,從而克服相關(guān)技術(shù)中的所述缺陷,滿足現(xiàn)在實際生產(chǎn)的需要。
技術(shù)實現(xiàn)思路
1、本申請實施例提供了一種基于圖的信息問答方法及裝置、存儲介質(zhì)及電子裝置,以至少解決專業(yè)文檔信息提取存在準(zhǔn)確性不高、處理效率低的問題。
2、根據(jù)本申請實施例的一方面,提供一種基于圖的信息問答方法,包括:將源文檔切分成預(yù)設(shè)大小的多個文本塊,對多個文本塊進行知識元素的抽取,得到元素集合;其中,知識元素至少包括以下之一:每一個文本塊對應(yīng)的實體、不同文本塊之間的關(guān)系、每一個文本塊對應(yīng)的事件;使用元素集合構(gòu)建知識圖譜以及關(guān)系圖,其中,知識圖譜的節(jié)點和邊通過自然語言描述;識別知識圖譜中符合加權(quán)無向圖的社區(qū),對社區(qū)進行逐層總結(jié),得到目標(biāo)總結(jié)結(jié)果;基于目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答。
3、在一個示例性的實施例中,基于目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答,包括:將目標(biāo)總結(jié)結(jié)果隨機打散并切分成指定長度的問答文本塊;對每個問答文本塊并行生成一個中間答案,并評估中間答案與問題的匹配度,得到多個評分值;基于多個評分值選擇滿足問題對應(yīng)上下文窗口的目標(biāo)中間答案;使用目標(biāo)中間答案對目標(biāo)對象輸入的問題進行信息問答。
4、在一個示例性的實施例中,基于多個評分值選擇滿足問題對應(yīng)上下文窗口的目標(biāo)中間答案,包括:去除多個評分值中分值為零的第一類中間答案,對剩余中間答案按評分降序排列,得到目標(biāo)排序結(jié)果;基于目標(biāo)排序結(jié)果將剩余中間答案依次放入新的上下文窗口;在當(dāng)前剩余中間答案滿足長度限制,且評分最高的情況下,將當(dāng)前剩余中間答案確定為目標(biāo)中間答案。
5、在一個示例性的實施例中,使用目標(biāo)中間答案對目標(biāo)對象輸入的問題進行信息問答,包括:識別問題對應(yīng)的上下文意圖;基于上下文意圖和目標(biāo)中間答案生成全局答案;根據(jù)全局答案對問題進行信息問答。
6、在一個示例性的實施例中,對社區(qū)進行逐層總結(jié),得到目標(biāo)總結(jié)結(jié)果,包括:確定社區(qū)中包括的節(jié)點層級以及每一節(jié)點層級中存在的每一個圖節(jié)點的描述文本,得到多個描述文本;對多個描述文本按照預(yù)設(shè)文本重要性進行排序,基于排序結(jié)果依次生成子總結(jié);匯總社區(qū)對應(yīng)的多子總結(jié),得到目標(biāo)總結(jié)結(jié)果。
7、在一個示例性的實施例中,基于目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答之后,上述方法還包括:獲取目標(biāo)對象的問答評分,其中,問答評分為目標(biāo)對象根據(jù)信息問答的問答結(jié)果與問題之間的關(guān)聯(lián)程度確定;在問答評分小于預(yù)設(shè)評分閾值的情況下,確定當(dāng)前信息問答無效,待對目標(biāo)總結(jié)結(jié)果進行更新;在問答評分大于或等于預(yù)設(shè)評分閾值的情況下,確定當(dāng)前信息問答有效,并將目標(biāo)總結(jié)結(jié)果與問題進行關(guān)聯(lián)。
8、根據(jù)本申請實施例的另一方面,還提供了一種基于圖的信息問答裝置,包括:抽取模塊,用于將源文檔切分成預(yù)設(shè)大小的多個文本塊,對多個文本塊進行知識元素的抽取,得到元素集合;其中,知識元素至少包括以下之一:每一個文本塊對應(yīng)的實體、不同文本塊之間的關(guān)系、每一個文本塊對應(yīng)的事件;構(gòu)建模塊,用于使用元素集合構(gòu)建知識圖譜以及關(guān)系圖,其中,知識圖譜的節(jié)點和邊通過自然語言描述;識別模塊,用于識別知識圖譜中符合加權(quán)無向圖的社區(qū),對社區(qū)進行逐層總結(jié),得到目標(biāo)總結(jié)結(jié)果;問答模塊,用于基于目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答。
9、根據(jù)本申請實施例的又一方面,還提供了一種計算機可讀的存儲介質(zhì),該計算機可讀的存儲介質(zhì)中存儲有計算機程序,其中,該計算機程序被設(shè)置為運行時執(zhí)行上述基于圖的信息問答方法。
10、根據(jù)本申請實施例的又一方面,還提供了一種電子裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其中,上述處理器通過計算機程序執(zhí)行上述基于圖的信息問答方法。
11、根據(jù)本申請實施例的又一方面,還提供了一種計算機程序產(chǎn)品,包括計算機程序,計算機程序被處理器執(zhí)行時上述基于圖的信息問答方法。
12、通過本申請,將源文檔切分成預(yù)設(shè)大小的多個文本塊,對多個文本塊進行知識元素的抽取,得到元素集合;其中,知識元素至少包括以下之一:每一個文本塊對應(yīng)的實體、不同文本塊之間的關(guān)系、每一個文本塊對應(yīng)的事件;使用元素集合構(gòu)建知識圖譜以及關(guān)系圖,其中,知識圖譜的節(jié)點和邊通過自然語言描述;識別知識圖譜中符合加權(quán)無向圖的社區(qū),對社區(qū)進行逐層總結(jié),得到目標(biāo)總結(jié)結(jié)果;基于目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答。采用上述技術(shù)方案,解決了專業(yè)文檔信息提取存在準(zhǔn)確性不高、處理效率低的問題。進而,通過將文檔分塊提取知識元素構(gòu)建知識圖譜,識別社區(qū)進行總結(jié)并回答問題,從而提高文檔信息檢索和問題解答的效率。
1.一種基于圖的信息問答方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于圖的信息問答方法,其特征在于,基于所述目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答,包括:
3.根據(jù)權(quán)利要求2所述的基于圖的信息問答方法,其特征在于,基于所述多個評分值選擇滿足所述問題對應(yīng)上下文窗口的目標(biāo)中間答案,包括:
4.根據(jù)權(quán)利要求2所述的基于圖的信息問答方法,其特征在于,使用所述目標(biāo)中間答案對目標(biāo)對象輸入的問題進行信息問答,包括:
5.根據(jù)權(quán)利要求1所述的基于圖的信息問答方法,其特征在于,對所述社區(qū)進行逐層總結(jié),得到目標(biāo)總結(jié)結(jié)果,包括:
6.根據(jù)權(quán)利要求1所述的基于圖的信息問答方法,其特征在于,基于所述目標(biāo)總結(jié)結(jié)果對目標(biāo)對象輸入的問題進行信息問答之后,所述方法還包括:
7.一種基于圖的信息問答裝置,其特征在于,包括:
8.一種計算機可讀的存儲介質(zhì),其特征在于,所述計算機可讀的存儲介質(zhì)包括存儲的程序,其中,所述程序運行時執(zhí)行權(quán)利要求1至6中任一項所述的方法。
9.一種電子裝置,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計算機程序,所述處理器被設(shè)置為通過所述計算機程序執(zhí)行權(quán)利要求1至6中任一項所述的方法。
10.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法。