本發(fā)明實(shí)施例涉及計(jì)算機(jī),尤其涉及一種知識(shí)問(wèn)答邏輯形式確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著深度學(xué)習(xí)技術(shù)的發(fā)展,問(wèn)答系統(tǒng)發(fā)展迅猛,其利用深度學(xué)習(xí)模型來(lái)理解用戶(hù)給定的問(wèn)題和文本,建立更加準(zhǔn)確的語(yǔ)義表示,從而提高答案的準(zhǔn)確性和質(zhì)量。當(dāng)前問(wèn)答系統(tǒng)根據(jù)數(shù)據(jù)形式可以分為結(jié)構(gòu)化問(wèn)答系統(tǒng)和非結(jié)構(gòu)化問(wèn)答系統(tǒng)。非結(jié)構(gòu)化問(wèn)答系統(tǒng)主要處理非結(jié)構(gòu)化數(shù)據(jù),例如文本、圖像等。這種問(wèn)答系統(tǒng)要使用自然語(yǔ)言處理、語(yǔ)義理解、信息檢索等技術(shù)對(duì)用戶(hù)的自然語(yǔ)言問(wèn)題進(jìn)行理解和分析,然后從大量非結(jié)構(gòu)化數(shù)據(jù)中獲取答案。知識(shí)庫(kù)問(wèn)答(knowledge?base?question?answering,kbqa)作為結(jié)構(gòu)化問(wèn)答系統(tǒng),其中存儲(chǔ)的是結(jié)構(gòu)化數(shù)據(jù),相較于非結(jié)構(gòu)化數(shù)據(jù)問(wèn)答系統(tǒng)而言,知識(shí)庫(kù)問(wèn)答系統(tǒng)具有以下優(yōu)勢(shì):
2、1.精準(zhǔn)度高:知識(shí)庫(kù)問(wèn)答系統(tǒng)是基于已有的知識(shí)庫(kù)進(jìn)行問(wèn)答的,所以答案的精準(zhǔn)度往往更高。與文本問(wèn)答系統(tǒng)相比,知識(shí)庫(kù)問(wèn)答系統(tǒng)可以通過(guò)匹配問(wèn)題和已有知識(shí)庫(kù)中的條目來(lái)提供更加精準(zhǔn)的答案。
3、2.適用性廣:知識(shí)庫(kù)問(wèn)答系統(tǒng)不僅可以應(yīng)用于對(duì)特定領(lǐng)域的問(wèn)題進(jìn)行快速回答,還可以應(yīng)用于常見(jiàn)問(wèn)題的解答,如客服咨詢(xún)等。
4、3.容易推理:由于知識(shí)庫(kù)中結(jié)構(gòu)化數(shù)據(jù)的特性,根據(jù)自然語(yǔ)言問(wèn)題更容易在知識(shí)庫(kù)中進(jìn)行關(guān)系的推理。
5、4.可擴(kuò)展性強(qiáng):知識(shí)庫(kù)問(wèn)答系統(tǒng)可以通過(guò)不斷更新知識(shí)庫(kù)來(lái)增加答案的數(shù)量和質(zhì)量,同時(shí)也可以通過(guò)增加問(wèn)題分類(lèi)和知識(shí)庫(kù)分類(lèi)來(lái)增強(qiáng)系統(tǒng)的功能和覆蓋范圍。
6、隨著知識(shí)庫(kù)問(wèn)答任務(wù)的不斷研究發(fā)展,越來(lái)越多的工作關(guān)注于復(fù)雜問(wèn)題的理解與回答。
7、知識(shí)庫(kù)問(wèn)答模型的性能主要取決以下因素:首先是模型是否能夠真正理解復(fù)雜問(wèn)題的語(yǔ)義信息,進(jìn)而從知識(shí)庫(kù)中查詢(xún)得到目標(biāo)答案,是當(dāng)前知識(shí)庫(kù)問(wèn)答研究的重點(diǎn)。其次是知識(shí)庫(kù)中是否存在回答問(wèn)題的知識(shí),這是系統(tǒng)能否正確回答問(wèn)題的前提。其中常見(jiàn)的一類(lèi)方法是基于語(yǔ)義解析(semantic?parse,sp-based)的方法,該類(lèi)方法將自然語(yǔ)言問(wèn)題通過(guò)語(yǔ)義解析轉(zhuǎn)化為邏輯形式,通過(guò)執(zhí)行邏輯形式直接查詢(xún)知識(shí)庫(kù)得到答案。首先利用語(yǔ)義解析理解自然語(yǔ)言問(wèn)題的語(yǔ)義,將問(wèn)題轉(zhuǎn)化為具備相同語(yǔ)義的邏輯形式,再通過(guò)查詢(xún)引擎對(duì)生成的邏輯形式進(jìn)行查詢(xún)處理,得到最終結(jié)果。上述過(guò)程分別對(duì)應(yīng)語(yǔ)義解析和查詢(xún)執(zhí)行兩個(gè)主要階段。同時(shí)語(yǔ)義解析模塊受限于邏輯形式的設(shè)計(jì)和解析能力,這是基于語(yǔ)義解析方法性能提升的關(guān)鍵點(diǎn)。
8、當(dāng)前基于語(yǔ)義解析的方法主流范式是枚舉-排序邏輯形式的方式。在枚舉邏輯形式的過(guò)程中,根據(jù)問(wèn)題的語(yǔ)義抽取實(shí)體,然后根據(jù)實(shí)體查詢(xún)知識(shí)庫(kù)中的路徑,將路徑中的單元填充到預(yù)先定義的模板中。這類(lèi)工作需要預(yù)先定義好可能存在的邏輯形式模板,由于存儲(chǔ)和計(jì)算成本的限制不可能覆蓋所有可能的情況,因此得到的候選邏輯形式種類(lèi)和數(shù)量有限。同時(shí)存在一些問(wèn)題無(wú)法從中識(shí)別出實(shí)體,導(dǎo)致不能根據(jù)實(shí)體進(jìn)行邏輯形式的枚舉。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例提供一種知識(shí)問(wèn)答邏輯形式確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),以實(shí)現(xiàn)能夠豐富候選邏輯形式的種類(lèi),同時(shí)對(duì)擴(kuò)充的邏輯形式進(jìn)行修改,保證邏輯形式的執(zhí)行率。
2、根據(jù)本發(fā)明的一方面,提供了一種知識(shí)問(wèn)答邏輯形式確定方法,包括:
3、根據(jù)目標(biāo)問(wèn)題對(duì)初始案例庫(kù)進(jìn)行篩選,得到初始案例集合,其中,所述初始案例集合包括:至少一個(gè)案例,每個(gè)案例包括的問(wèn)題與目標(biāo)問(wèn)題之間的關(guān)系相似度均大于相似度閾值,所述初始案例集合中的每個(gè)案例還包括:?jiǎn)栴}對(duì)應(yīng)的邏輯形式;
4、根據(jù)所述目標(biāo)問(wèn)題對(duì)應(yīng)的實(shí)體對(duì)初始案例集合中的每個(gè)案例中的邏輯形式進(jìn)行實(shí)體替換,得到第一邏輯形式集合;
5、根據(jù)所述第一邏輯形式集合中與所述目標(biāo)問(wèn)題之間的相關(guān)性分?jǐn)?shù)大于分?jǐn)?shù)閾值的邏輯形式生成目標(biāo)邏輯形式集合;
6、將所述目標(biāo)邏輯形式集合和所述目標(biāo)問(wèn)題輸入生成模型,得到所述目標(biāo)問(wèn)題對(duì)應(yīng)的目標(biāo)邏輯形式。
7、根據(jù)本發(fā)明的另一方面,提供了一種知識(shí)問(wèn)答邏輯形式確定裝置,該知識(shí)問(wèn)答邏輯形式確定裝置包括:
8、初始案例集合確定模塊,用于根據(jù)目標(biāo)問(wèn)題對(duì)初始案例庫(kù)進(jìn)行篩選,得到初始案例集合,其中,所述初始案例集合包括:至少一個(gè)案例,每個(gè)案例包括的問(wèn)題與目標(biāo)問(wèn)題之間的關(guān)系相似度均大于相似度閾值,所述初始案例集合中的每個(gè)案例還包括:?jiǎn)栴}對(duì)應(yīng)的邏輯形式;
9、第一邏輯形式集合確定模塊,用于根據(jù)所述目標(biāo)問(wèn)題對(duì)應(yīng)的實(shí)體對(duì)初始案例集合中的每個(gè)案例中的邏輯形式進(jìn)行實(shí)體替換,得到第一邏輯形式集合;
10、目標(biāo)邏輯形式集合生成模塊,用于根據(jù)所述第一邏輯形式集合中與所述目標(biāo)問(wèn)題之間的相關(guān)性分?jǐn)?shù)大于分?jǐn)?shù)閾值的邏輯形式生成目標(biāo)邏輯形式集合;
11、目標(biāo)邏輯形式確定模塊,用于將所述目標(biāo)邏輯形式集合和所述目標(biāo)問(wèn)題輸入生成模型,得到所述目標(biāo)問(wèn)題對(duì)應(yīng)的目標(biāo)邏輯形式。
12、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:
13、至少一個(gè)處理器;以及
14、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,
15、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本發(fā)明任一實(shí)施例所述的知識(shí)問(wèn)答邏輯形式確定方法。
16、根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明任一實(shí)施例所述的知識(shí)問(wèn)答邏輯形式確定方法。
17、本發(fā)明實(shí)施例通過(guò)根據(jù)目標(biāo)問(wèn)題對(duì)初始案例庫(kù)進(jìn)行篩選,得到初始案例集合,其中,所述初始案例集合包括:至少一個(gè)案例,每個(gè)案例包括的問(wèn)題與目標(biāo)問(wèn)題之間的關(guān)系相似度均大于相似度閾值,所述初始案例集合中的每個(gè)案例還包括:?jiǎn)栴}對(duì)應(yīng)的邏輯形式;根據(jù)所述目標(biāo)問(wèn)題對(duì)應(yīng)的實(shí)體對(duì)初始案例集合中的每個(gè)案例中的邏輯形式進(jìn)行實(shí)體替換,得到第一邏輯形式集合;根據(jù)所述第一邏輯形式集合中與所述目標(biāo)問(wèn)題之間的相關(guān)性分?jǐn)?shù)大于分?jǐn)?shù)閾值的邏輯形式生成目標(biāo)邏輯形式集合;將所述目標(biāo)邏輯形式集合和所述目標(biāo)問(wèn)題輸入生成模型,得到所述目標(biāo)問(wèn)題對(duì)應(yīng)的目標(biāo)邏輯形式,能夠在豐富候選邏輯形式的種類(lèi)的同時(shí)對(duì)擴(kuò)充的邏輯形式進(jìn)行修改,保證邏輯形式的執(zhí)行率。
18、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本發(fā)明的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過(guò)以下的說(shuō)明書(shū)而變得容易理解。
1.一種知識(shí)問(wèn)答邏輯形式確定方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述第一邏輯形式集合中與所述目標(biāo)問(wèn)題之間的相關(guān)性分?jǐn)?shù)大于分?jǐn)?shù)閾值的邏輯形式生成目標(biāo)邏輯形式集合,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述目標(biāo)問(wèn)題對(duì)應(yīng)的實(shí)體和知識(shí)圖譜確定候選邏輯形式集合,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)目標(biāo)問(wèn)題對(duì)初始案例庫(kù)進(jìn)行篩選,得到初始案例集合,包括:
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述第二邏輯形式集合中與所述目標(biāo)問(wèn)題之間的相關(guān)性分?jǐn)?shù)大于分?jǐn)?shù)閾值的邏輯形式生成目標(biāo)邏輯形式集合,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述目標(biāo)問(wèn)題對(duì)應(yīng)的實(shí)體對(duì)初始案例集合中的每個(gè)案例中的邏輯形式進(jìn)行實(shí)體替換,得到第一邏輯形式集合,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,根據(jù)初始案例集合中的每個(gè)案例中的邏輯形式對(duì)應(yīng)的實(shí)體數(shù)量和目標(biāo)問(wèn)題對(duì)應(yīng)的實(shí)體數(shù)量對(duì)初始案例集合中的每個(gè)案例中的邏輯形式進(jìn)行實(shí)體替換,得到第一邏輯形式集合,包括:
8.一種知識(shí)問(wèn)答邏輯形式確定裝置,其特征在于,包括:
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,目標(biāo)邏輯形式集合生成模塊具體用于:
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,目標(biāo)邏輯形式集合生成模塊具體用于:
11.根據(jù)權(quán)利要求8所述的裝置,其特征在于,初始案例集合確定模塊具體用于:
12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,目標(biāo)邏輯形式集合生成模塊具體用于:
13.根據(jù)權(quán)利要求8所述的裝置,其特征在于,第一邏輯形式集合確定模塊具體用于:
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,第一邏輯形式集合確定模塊具體用于:
15.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
16.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的知識(shí)問(wèn)答邏輯形式確定方法。