本技術涉及人工智能,尤其涉及一種問答方法、裝置、設備、存儲介質和程序產品。
背景技術:
1、文檔問答是人工智能的一個重要方面?,F(xiàn)有的文檔問答系統(tǒng)是根據(jù)用戶提問從知識庫中檢索與用戶提問相關的文檔,然后從檢索到的文檔中提取與用戶提問最相關的片段作為答復信息,這種問答系統(tǒng)的準確性較低。
技術實現(xiàn)思路
1、鑒于上述問題,本技術提供了一種問答方法、裝置、設備、存儲介質和程序產品,以提高問答系統(tǒng)的準確性。具體方案如下:
2、本技術第一方面提供一種問答方法,包括:
3、獲得輸入的第一提問信息;
4、對所述第一提問信息進行處理,得到第二提問信息;所述第二提問信息與所述第一提問信息的語義相同;
5、至少基于所述第一提問信息在知識庫中搜索候選文檔集合;所述候選文檔集合中至少包含第一類候選文檔,每個第一類候選文檔與所述第一提問信息的匹配度高于非第一類候選文檔與所述第一提問信息的匹配度;
6、基于目標信息在所述候選文檔集合中篩選出目標文檔集合;每個目標文檔與所述目標信息的匹配度高于非目標文檔與所述目標信息的匹配度;所述目標信息為所述第二提問信息,或者,所述目標信息為所述第一提問信息和所述第二提問信息;
7、根據(jù)所述目標文檔集合和所述第一提問信息生成答復信息。
8、在一種可能的實現(xiàn)中,所述至少基于所述第一提問信息在知識庫中搜索候選文檔集合,包括:
9、基于所述第一提問信息和所述知識庫中的各個文檔的相似度,確定所述候選文檔集合;所述候選文檔集合中的文檔為第一類候選文檔;每個第一類候選文檔與所述第一提問信息的相似度高于非第一類候選文檔與所述第一提問信息的相似度;
10、或,基于所述第一提問信息和所述知識庫中的各個文檔的相似度,確定第一類候選文檔集合,每個第一類候選文檔與所述第一提問信息的相似度高于非第一類候選文檔與所述第一提問信息的相似度;基于所述第二提問信息和所述知識庫中的各個文檔的相似度,確定第二類候選文檔集合,每個第二類候選文檔與所述第一提問信息的相似度高于非第二類候選文檔與所述第一提問信息的相似度;所述第一類候選文檔集合和所述第二類候選文檔集合構成所述候選文檔集合。
11、在一種可能的實現(xiàn)中,在所述候選文檔集合中的文檔為第一類候選文檔的情況下,基于所述第二提問信息在所述候選文檔集合中篩選出目標文檔集合,包括:
12、基于所述第二提問信息與各個第一類候選文檔的相似度,在所述候選文檔集合中篩選出目標文檔集合;
13、每個目標文檔與所述第二提問信息的相似度,大于所述候選文檔集合中的非目標文檔與所述第二提問信息的相似度。
14、在一種可能的實現(xiàn)中,在所述目標信息包括所述第一提問信息和所述第二提問信息的情況下,所述基于所述目標信息在所述候選文檔集合中篩選出目標文檔集合,包括:
15、獲得每個候選文檔與所述第一提問信息的第一相似度,以及每個候選文檔與所述第二提問信息的第二相似度;
16、基于每個候選文檔對應的第一相似度和第二相似度,對各個候選文檔進行排序;
17、根據(jù)排序結果,選擇排序滿足條件的候選文檔構成目標文檔集合;排序滿足條件的候選文檔與所述目標信息的匹配度高于排序不滿足條件的候選文檔與所述目標信息的匹配度。
18、在一種可能的實現(xiàn)中,所述基于每個候選文檔對應的第一相似度和第二相似度,對各個候選文檔進行排序,包括:
19、基于候選文檔與所述第一提問信息的第一相似度構建第一優(yōu)化目標,基于候選文檔與所述第二提問信息的第二相似度構建第二優(yōu)化目標;
20、基于所述第一優(yōu)化目標和所述第二優(yōu)化目標,利用非支配算法對所述候選文檔集合中的各個候選文檔進行排序,以將所述候選文檔集合劃分為多個非支配層級;
21、相應的,排序滿足條件的候選文檔為位于第一個非支配層級的候選文檔。
22、在一種可能的實現(xiàn)中,所述基于每個候選文檔對應的第一相似度和第二相似度,對各個候選文檔進行排序,包括:
23、對應每個候選文檔,將該候選文檔對應的第一相似度和第二相似度加權求和,得到該候選文檔對應的綜合相似度;
24、按照綜合相似度由大到小的順序對各個候選文檔排序;
25、相應的,排序滿足條件的候選文檔為:排序前n的候選文檔,或者,綜合相似度大于目標相似度的候選文檔。
26、在一種可能的實現(xiàn)中,所述第二提問信息與所述第一提問信息具有不同的措辭,和/或,不同的結構。
27、本技術第二方面提供一種問答裝置,包括:
28、輸入模塊,用于獲得輸入的第一提問信息;
29、重寫模塊,用于對所述第一提問信息進行處理,得到第二提問信息;所述第二提問信息與所述第一提問信息的語義相同;
30、第一篩選模塊,用于至少基于所述第一提問信息在知識庫中搜索候選文檔集合;所述候選文檔集合中至少包含第一類候選文檔,每個第一類候選文檔與所述第一提問信息的匹配度高于非第一類候選文檔與所述第一提問信息的匹配度;
31、第二篩選模塊,用于基于目標信息在所述候選文檔集合中篩選出目標文檔集合;每個目標文檔與所述目標信息的匹配度高于非目標文檔與所述目標信息的匹配度;所述目標信息為所述第二提問信息,或者,所述目標信息為所述第一提問信息和所述第二提問信息;
32、生成模塊,用于根據(jù)所述目標文檔集合和所述第一提問信息生成答復信息。
33、本技術第三方面提供一種計算機程序產品,包括計算機可讀指令,當所述計算機可讀指令在電子設備上運行時,使得所述電子設備實現(xiàn)上述第一方面或第一方面任一實現(xiàn)方式的問答方法。
34、本技術第四方面提供一種電子設備,包括至少一個處理器和與所述處理器連接的存儲器,其中:
35、所述存儲器用于存儲計算機程序;
36、所述處理器用于執(zhí)行所述計算機程序,以使所述電子設備能夠實現(xiàn)上述第一方面或第一方面任一實現(xiàn)方式的問答方法。
37、本技術第五方面提供一種計算機存儲介質,所述存儲介質承載有一個或多個計算機程序,當所述一個或多個計算機程序被電子設備執(zhí)行時,能夠使所述電子設備上述第一方面或第一方面任一實現(xiàn)方式的問答方法。
38、借由上述技術方案,本技術提供的問答方法、裝置、設備、存儲介質和程序產品,在獲得輸入的第一提問信息后,將第一提問信息改寫為與第一提問信息語義相同的第二提問信息,至少基于第一提問信息在知識庫中搜索候選文檔集合;候選文檔集合中至少包含第一類候選文檔,每個第一類候選文檔與第一提問信息的匹配度高于非第一類候選文檔與第一提問信息的匹配度;基于目標信息在候選文檔集合中篩選出目標文檔集合;每個目標文檔與目標信息的匹配度高于非目標文檔與目標信息的匹配度;目標信息為第二提問信息,或者,目標信息為第一提問信息和第二提問信息;根據(jù)目標文檔集合和第一提問信息生成答復信息。本技術先至少基于原始的第一提問信息在知識庫中搜索與第一提問信息相關的候選文檔集合,然后再基于第二提問信息對候選文檔集合做進一步的篩選,或者,基于第一提問信息和第二提問信息對候選文檔集合做進一步的篩選,得到的目標文檔與第一提問信息的相關性更高,從而根據(jù)目標文檔集合和第一提問信息生成的答復信息更準確。