1.一種基于段落拆分的問答方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于段落拆分的問答方法,其特征在于,對上傳的文檔進行目錄及標(biāo)題識別,生成文檔的帶有層級關(guān)系的段落框架結(jié)構(gòu);方法包括:
3.根據(jù)權(quán)利要求2所述的基于段落拆分的問答方法,其特征在于,基于目錄結(jié)構(gòu)信息,對文檔正文信息進行拆分,獲取目錄中每章節(jié)末級標(biāo)題對應(yīng)的第二文本信息;方法包括:
4.根據(jù)權(quán)利要求1所述的基于段落拆分的問答方法,其特征在于,根據(jù)段落框架結(jié)構(gòu)對文檔正文內(nèi)容進行拆分,得到包含對應(yīng)文本內(nèi)容的文檔段落結(jié)構(gòu)字典;方法包括:將段落框架結(jié)構(gòu)轉(zhuǎn)為無層級結(jié)構(gòu)的有序列表;根據(jù)有序列表將文檔的正文部分信息進行拆分,得到標(biāo)題對應(yīng)的文本內(nèi)容;構(gòu)建文檔段落結(jié)構(gòu)字典。
5.根據(jù)權(quán)利要求1所述的基于段落拆分的問答方法,其特征在于,根據(jù)文檔段落結(jié)構(gòu)字典,生成文本塊;方法包括:遍歷文檔段落結(jié)構(gòu)字典,將段落結(jié)構(gòu)中的標(biāo)題逐級進行拼接直至末級節(jié)點及末級節(jié)點對應(yīng)的文本內(nèi)容,同時,判斷末級節(jié)點與其兄弟節(jié)點的主題相似性,如果其主題與兄弟節(jié)點的主題相似,則將兄弟節(jié)點及其對應(yīng)的文本內(nèi)容與其進行進一步拼接。
6.根據(jù)權(quán)利要求1所述的基于段落拆分的問答方法,其特征在于,對獲取的問題進行關(guān)鍵詞提取和文本向量化處理,得到問題的關(guān)鍵詞列表、稀疏向量和稠密向量;分別基于問題的關(guān)鍵詞列表、稀疏向量和稠密向量對知識庫進行檢索,選取與問題最相似的若干文本塊;方法包括:
7.一種基于段落拆分的問答系統(tǒng),其特征在于,包括:
8.一種知識引擎平臺,其特征在于,包括:
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-6中任一項所述的基于段落拆分的問答方法中的步驟。
10.一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1-6中任一項所述的基于段落拆分的問答方法中的步驟。