本技術(shù)涉及人工智能,特別是涉及一種對(duì)話機(jī)器人的對(duì)話方法、系統(tǒng)和計(jì)算機(jī)設(shè)備。
背景技術(shù):
1、在人工智能領(lǐng)域,對(duì)話機(jī)器人具有廣泛的應(yīng)用場(chǎng)景,例如客服、售后等,為生活提供了便捷。但也隨之出現(xiàn)了對(duì)話機(jī)器人在文本數(shù)據(jù)較短時(shí),無(wú)法準(zhǔn)確理解用戶的表達(dá)方式和意圖的問(wèn)題。
2、然而,目前在文本數(shù)據(jù)較短時(shí),幫助對(duì)話機(jī)器人理解用戶的表達(dá)意圖的方法是:通過(guò)模塊化檢索增強(qiáng)技術(shù)對(duì)文本數(shù)據(jù)進(jìn)行深度檢索,即在檢索階段增加情感識(shí)別模型或重排模型,增強(qiáng)對(duì)文本數(shù)據(jù)的檢索,但同時(shí)會(huì)導(dǎo)致檢索階段的耗時(shí)大幅度增加,導(dǎo)致對(duì)話機(jī)器人對(duì)應(yīng)的系統(tǒng)運(yùn)行速度變慢。因此,目前存在當(dāng)文本數(shù)據(jù)較短時(shí),對(duì)話機(jī)器人在問(wèn)答過(guò)程中意圖識(shí)別準(zhǔn)確率較低的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述當(dāng)文本數(shù)據(jù)較短時(shí),對(duì)話機(jī)器人在問(wèn)答過(guò)程中準(zhǔn)確率較低的技術(shù)問(wèn)題,提供一種對(duì)話機(jī)器人的對(duì)話方法、系統(tǒng)、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
2、第一方面,本技術(shù)提供了一種對(duì)話機(jī)器人訓(xùn)練方法,包括:
3、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對(duì)詞嵌入模型進(jìn)行訓(xùn)練得到;
4、基于分類模型得到所述第一詞嵌入向量的意圖識(shí)別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
5、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對(duì)所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
6、將所述第二詞嵌入向量存儲(chǔ)至向量數(shù)據(jù)庫(kù),并基于預(yù)設(shè)的問(wèn)答模式在所述向量數(shù)據(jù)庫(kù)中確定所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題;其中,所述向量數(shù)據(jù)庫(kù)中包括所述第二詞嵌入向量和所述目標(biāo)問(wèn)題之間的關(guān)聯(lián)關(guān)系;
7、結(jié)合所述目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
8、在其中一個(gè)實(shí)施例中,所述方法還包括:將所述第一訓(xùn)練文本數(shù)據(jù)輸入至所述詞嵌入模型,并通過(guò)分詞技術(shù)將所述第一訓(xùn)練文本數(shù)據(jù)進(jìn)行分詞,篩選所述分詞中的非關(guān)鍵詞作為停止詞,形成停止詞庫(kù);基于所述停止詞更新所述第一訓(xùn)練文本數(shù)據(jù)得到第一更新訓(xùn)練數(shù)據(jù),將所述第一更新訓(xùn)練數(shù)據(jù)輸入至所述詞嵌入模型,得到所述第一詞嵌入模型。
9、在其中一個(gè)實(shí)施例中,所述方法還包括:獲取業(yè)務(wù)領(lǐng)域數(shù)據(jù)、非業(yè)務(wù)領(lǐng)域數(shù)據(jù)以及業(yè)務(wù)場(chǎng)景數(shù)據(jù),并通過(guò)提示工程技術(shù)分別生成所述業(yè)務(wù)領(lǐng)域數(shù)據(jù)、所述非業(yè)務(wù)領(lǐng)域數(shù)據(jù)以及所述業(yè)務(wù)場(chǎng)景數(shù)據(jù)的相似數(shù)據(jù);基于所述相似數(shù)據(jù)更新所述第二訓(xùn)練文本數(shù)據(jù)得到第二更新訓(xùn)練數(shù)據(jù),將所述第二更新訓(xùn)練數(shù)據(jù)輸入至所述分類模型,以完成對(duì)所述分類模型的建立。
10、在其中一個(gè)實(shí)施例中,所述方法還包括:將第三訓(xùn)練文本數(shù)據(jù)輸入至結(jié)合預(yù)設(shè)核心超參數(shù)的所述第一詞嵌入模型,以完成對(duì)所述第一詞嵌入模型進(jìn)行訓(xùn)練,得到所述第二詞嵌入模型;其中,所述核心超參數(shù)包括計(jì)算精度、學(xué)習(xí)率、優(yōu)化器、溫度、池化方法和訓(xùn)練次數(shù)。
11、在其中一個(gè)實(shí)施例中,所述將所述第三訓(xùn)練文本數(shù)據(jù)輸入至結(jié)合預(yù)設(shè)核心超參數(shù)的所述第一詞嵌入模型,以完成對(duì)所述第一詞嵌入模型進(jìn)行訓(xùn)練,得到所述第二詞嵌入模型,包括:將預(yù)設(shè)的初始學(xué)習(xí)率以及預(yù)設(shè)的溫度匹配至所述第一詞嵌入模型;基于預(yù)選的優(yōu)化器,并結(jié)合半精度浮點(diǎn)量化方法以及分類標(biāo)記池化方法對(duì)所述第一詞嵌入模型進(jìn)行訓(xùn)練;將所述第三訓(xùn)練文本數(shù)據(jù)輸入至所述第一詞嵌入模型中進(jìn)行訓(xùn)練,在所述訓(xùn)練的所述訓(xùn)練次數(shù)大于或等于預(yù)設(shè)目標(biāo)訓(xùn)練次數(shù)、損失值位于預(yù)設(shè)目標(biāo)損失值區(qū)間內(nèi)的情況下,完成對(duì)所述第一詞嵌入模型的訓(xùn)練,得到所述第二詞嵌入模型。
12、在其中一個(gè)實(shí)施例中,所述基于預(yù)設(shè)的問(wèn)答模式在所述向量數(shù)據(jù)庫(kù)中確定所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題,包括:獲取所述第二詞嵌入向量與所述向量數(shù)據(jù)庫(kù)中向量的相似度;基于所述相似度確定所述第二詞嵌入向量的多個(gè)相關(guān)問(wèn)題以及多個(gè)所述相關(guān)問(wèn)題的單個(gè)標(biāo)識(shí)符;根據(jù)所述單個(gè)標(biāo)識(shí)符,將多個(gè)所述相關(guān)問(wèn)題對(duì)應(yīng)的單個(gè)目標(biāo)問(wèn)題作為所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題。
13、在其中一個(gè)實(shí)施例中,所述預(yù)設(shè)的文本生成模式包括:常見(jiàn)問(wèn)題解答模式和場(chǎng)景模式;所述結(jié)合所述目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,生成所述待處理文本的目標(biāo)答案,包括:在所述常見(jiàn)問(wèn)題解答模式和/或所述場(chǎng)景模式下,在所述向量數(shù)據(jù)庫(kù)中檢索到的預(yù)設(shè)目標(biāo)數(shù)量的所述相關(guān)問(wèn)題對(duì)應(yīng)同一個(gè)所述目標(biāo)問(wèn)題的情況下,則將所述目標(biāo)問(wèn)題對(duì)應(yīng)的答案作為所述待處理文本的目標(biāo)答案。
14、第二方面,本技術(shù)還提供了一種對(duì)話機(jī)器人的對(duì)話系統(tǒng),包括:
15、文本處理模塊,用于接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對(duì)詞嵌入模型進(jìn)行訓(xùn)練得到;
16、特征獲取模塊,用于基于分類模型得到所述第一詞嵌入向量的意圖識(shí)別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
17、詞嵌入向量轉(zhuǎn)化模塊,用于基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對(duì)所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
18、目標(biāo)問(wèn)題確認(rèn)模塊,用于將所述第二詞嵌入向量存儲(chǔ)至向量數(shù)據(jù)庫(kù),并基于預(yù)設(shè)的問(wèn)答模式在所述向量數(shù)據(jù)庫(kù)中確定所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題;其中,所述向量數(shù)據(jù)庫(kù)中包括所述第二詞嵌入向量和所述目標(biāo)問(wèn)題之間的關(guān)聯(lián)關(guān)系;
19、目標(biāo)答案輸出模塊,用于結(jié)合所述目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
20、第三方面,本技術(shù)還提供了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)以下步驟:
21、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對(duì)詞嵌入模型進(jìn)行訓(xùn)練得到;
22、基于分類模型得到所述第一詞嵌入向量的意圖識(shí)別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
23、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽,將所述第一詞嵌入向量轉(zhuǎn)化為第二詞嵌入向量;其中,所述第二詞嵌入模型基于第三訓(xùn)練文本數(shù)據(jù)對(duì)所述第一詞嵌入模型進(jìn)行訓(xùn)練得到;
24、將所述第二詞嵌入向量存儲(chǔ)至向量數(shù)據(jù)庫(kù),并基于預(yù)設(shè)的問(wèn)答模式在所述向量數(shù)據(jù)庫(kù)中確定所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題;其中,所述向量數(shù)據(jù)庫(kù)中包括所述第二詞嵌入向量和所述目標(biāo)問(wèn)題之間的關(guān)聯(lián)關(guān)系;
25、結(jié)合所述目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
26、第四方面,本技術(shù)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:
27、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對(duì)詞嵌入模型進(jìn)行訓(xùn)練得到;
28、基于分類模型得到所述第一詞嵌入向量的意圖識(shí)別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
29、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對(duì)所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
30、將所述第二詞嵌入向量存儲(chǔ)至向量數(shù)據(jù)庫(kù),并基于預(yù)設(shè)的問(wèn)答模式在所述向量數(shù)據(jù)庫(kù)中確定所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題;其中,所述向量數(shù)據(jù)庫(kù)中包括所述第二詞嵌入向量和所述目標(biāo)問(wèn)題之間的關(guān)聯(lián)關(guān)系;
31、結(jié)合所述目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
32、第五方面,本技術(shù)還提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:
33、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對(duì)詞嵌入模型進(jìn)行訓(xùn)練得到;
34、基于分類模型得到所述第一詞嵌入向量的意圖識(shí)別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
35、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對(duì)所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
36、將所述第二詞嵌入向量存儲(chǔ)至向量數(shù)據(jù)庫(kù),并基于預(yù)設(shè)的問(wèn)答模式在所述向量數(shù)據(jù)庫(kù)中確定所述第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題;其中,所述向量數(shù)據(jù)庫(kù)中包括所述第二詞嵌入向量和所述目標(biāo)問(wèn)題之間的關(guān)聯(lián)關(guān)系;
37、結(jié)合所述目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
38、上述對(duì)話機(jī)器人的對(duì)話方法、系統(tǒng)、計(jì)算機(jī)設(shè)備、存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品,在對(duì)話機(jī)器人的對(duì)話方法中,首先接收待處理文本,并基于第一詞嵌入模型將待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對(duì)詞嵌入模型進(jìn)行訓(xùn)練得到;然后基于分類模型得到第一詞嵌入向量的意圖識(shí)別分類特征;其中,分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;接著基于第二詞嵌入模型、結(jié)合第一詞嵌入向量的意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,第二詞嵌入模型基于第一詞嵌入模型對(duì)第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;接著將第二詞嵌入向量存儲(chǔ)至向量數(shù)據(jù)庫(kù),并基于預(yù)設(shè)的問(wèn)答模式在向量數(shù)據(jù)庫(kù)中確定第二詞嵌入向量對(duì)應(yīng)的目標(biāo)問(wèn)題;其中,向量數(shù)據(jù)庫(kù)中包括第二詞嵌入向量和目標(biāo)問(wèn)題之間的關(guān)聯(lián)關(guān)系;最后結(jié)合目標(biāo)問(wèn)題和預(yù)設(shè)的文本生成模式,輸出待處理文本的目標(biāo)答案。在上述過(guò)程中,通過(guò)第一詞嵌入模型將待處理文本轉(zhuǎn)化第一詞嵌入向量,再通過(guò)分類模型得到第一詞嵌入向量的意圖識(shí)別分類特征,然后結(jié)合上述意圖識(shí)別分類特征對(duì)應(yīng)的分類標(biāo)簽、通過(guò)第二次嵌入模型獲取第二詞嵌入向量,可以提高詞嵌入向量的質(zhì)量,提高后續(xù)步驟中在向量數(shù)據(jù)庫(kù)確定目標(biāo)問(wèn)題的效率,再通過(guò)目標(biāo)問(wèn)題和預(yù)設(shè)的文本模式的結(jié)合,進(jìn)一步輸出目標(biāo)答案,有效提高了對(duì)話機(jī)器人在文本數(shù)據(jù)較短時(shí)的意圖識(shí)別的準(zhǔn)確率。