本技術(shù)涉及人工智能開發(fā)與金融科技領域,尤其涉及基于人工智能的查詢信息處理方法、裝置、計算機設備及存儲介質(zhì)。
背景技術(shù):
1、隨著全球化進程的不斷加速,企業(yè)界正以前所未有的速度向國際市場拓展,跨國業(yè)務成為眾多企業(yè)發(fā)展戰(zhàn)略的重要組成部分。目前,各大公司都在積極發(fā)展跨國業(yè)務,跨語種客服機器人成為了公司連接來自不同文化背景使用不同語言客戶的重要橋梁,并能便捷的為國際客戶提供基礎服務如:咨詢,投訴和反饋問題等基礎操作。
2、雖然市場上的主流聊天機器人可以支持多種語言,但是它們在處理各種語言內(nèi)部的多樣性問題上能力有限,往往無法提供給對應客戶準確和流暢的交互體驗,導致回復的答案的準確性較低,容易給用戶生硬的服務體驗。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例的目的在于提出一種基于人工智能的查詢信息處理方法、裝置、計算機設備及存儲介質(zhì),以解決現(xiàn)有的可以支持多種語言的主流聊天機器人往往無法提供給對應客戶準確和流暢的交互體驗,導致回復的答案的準確性較低,容易給用戶生硬的服務體驗的技術(shù)問題。
2、為了解決上述技術(shù)問題,本技術(shù)實施例提供一種基于人工智能的查詢信息處理方法,采用了如下所述的技術(shù)方案:
3、接收用戶通過聊天界面輸入的查詢信息;
4、對所述查詢信息進行解析處理,生成對應的token序列;
5、獲取與所述查詢信息對應的上下文,以及獲取預設的特殊標記;
6、基于所述查詢信息、所述token序列、所述上下文以及所述特殊標記生成對應的輸入序列;
7、調(diào)用預先構(gòu)建的目標預測模型,并基于所述目標預測模型中的編碼器對所述輸入序列進行編碼,生成對應的隱藏表示;其中,所述目標預測模型為基于采集的跨語言客服問答數(shù)據(jù)集對多語言預訓練機器閱讀模型進行微調(diào)生成的模型;
8、基于所述目標預測模型中的提取器對所述隱藏表示進行預測處理,生成對應的所有答案跨度的預測概率分數(shù);
9、基于所述預測概率分數(shù)從所有所述答案跨度中確定出目標答案跨度;
10、基于所述目標答案跨度生成答案文本,并將所述答案文本返回給所述用戶。
11、進一步的,所述基于所述預測概率分數(shù)從所有所述答案跨度中確定出目標答案跨度的步驟,具體包括:
12、對所有所述答案跨度進行遍歷,篩選出具有最高的預測概率分數(shù)的第一答案跨度;
13、判斷所述第一答案跨度的數(shù)量是否為1;
14、若所述第一答案跨度的數(shù)量為1,則將所述第一答案跨度作為所述目標答案跨度;
15、若所述第一答案跨度的數(shù)量大于1,則獲取預設的篩選規(guī)則;
16、從所述第一答案跨度中篩選出符合所述篩選規(guī)則的第二答案跨度;
17、將所述第二答案跨度作為所述目標答案跨度。
18、進一步的,所述基于所述目標答案跨度生成答案文本,并將所述答案文本返回給所述用戶的步驟,具體包括:
19、從所述目標答案跨度中確定出起始位置與結(jié)束位置;
20、基于所述起始位置與所述結(jié)束位置,從所述上下文中提取出對應的第一文本;
21、對所述第一文本片段進行優(yōu)化處理,得到對應的第二文本;
22、獲取所述查詢信息的目標語言類型,基于所述目標語言類型對所述第二文本進行格式轉(zhuǎn)換得到對應的第三文本,并將所述第三文本標記為答案文本;
23、將所述答案文本展示至所述聊天界面內(nèi)。
24、進一步的,所述對所述第一文本片段進行優(yōu)化處理,得到對應的第二文本的步驟,具體包括:
25、對所述第一文本進行標記移除處理,得到對應的第一指定文本;
26、對所述第一指定文本進行語法修正處理,得到對應的第二指定文本;
27、對所述第二指定文本進行句子重組處理,得到對應的第三指定文本;
28、將所述第三指定文本作為所述第二文本。
29、進一步的,所述基于所述查詢信息、所述token序列、所述上下文以及所述特殊標記生成對應的輸入序列的步驟,具體包括:
30、獲取預設的目標格式;
31、基于所述目標格式對所述查詢信息、所述token序列、所述上下文以及所述特殊標記進行連接處理,得到對應的連接信息;
32、將所述連接信息作為所述輸入序列。
33、進一步的,在所述調(diào)用預先構(gòu)建的目標預測模型的步驟之前,還包括:
34、獲取預設的多語言預訓練機器閱讀模型;
35、對所述多語言預訓練機器閱讀模型進行模型擴展處理,得到對應的第一預測模型;
36、獲取預先構(gòu)建的跨語言客服問答數(shù)據(jù)集;
37、將所述跨語言客服問答數(shù)據(jù)集劃分為訓練數(shù)據(jù)集與測試數(shù)據(jù)集;
38、基于所述跨語言客服問答數(shù)據(jù)集對所述第一預測模型進行微調(diào)訓練,得到微調(diào)后的第二預測模型;
39、基于所述測試數(shù)據(jù)集對所述第二預測模型進行性能評估;
40、若所述第二預測模型符合預設的性能要求,則將所述第二預測模型作為所述目標預測模型。
41、進一步的,所述獲取預先構(gòu)建的跨語言客服問答數(shù)據(jù)集的步驟,具體包括:
42、收集包含多種語言的初始客服問答數(shù)據(jù)集;
43、獲取預設的預處理策略與增強策略;
44、基于所述預處理策略對所述初始客服問答數(shù)據(jù)集進行預處理,得到對應的第一數(shù)據(jù)集;
45、基于所述增強策略對所述第一數(shù)據(jù)集進行樣本增強處理,得到對應的第二數(shù)據(jù)集;
46、將所述第二數(shù)據(jù)集作為所述跨語言客服問答數(shù)據(jù)集。
47、為了解決上述技術(shù)問題,本技術(shù)實施例還提供一種基于人工智能的查詢信息處理裝置,采用了如下所述的技術(shù)方案:
48、接收模塊,用于接收用戶通過聊天界面輸入的查詢信息;
49、解析模塊,用于對所述查詢信息進行解析處理,生成對應的token序列;
50、第一獲取模塊,用于獲取與所述查詢信息對應的上下文,以及獲取預設的特殊標記;
51、生成模塊,用于基于所述查詢信息、所述token序列、所述上下文以及所述特殊標記生成對應的輸入序列;
52、編碼模塊,用于調(diào)用預先構(gòu)建的目標預測模型,并基于所述目標預測模型中的編碼器對所述輸入序列進行編碼,生成對應的隱藏表示;其中,所述目標預測模型為基于采集的跨語言客服問答數(shù)據(jù)集對多語言預訓練機器閱讀模型進行微調(diào)生成的模型;
53、預測模塊,用于基于所述目標預測模型中的提取器對所述隱藏表示進行預測處理,生成對應的所有答案跨度的預測概率分數(shù);
54、第一確定模塊,用于基于所述預測概率分數(shù)從所有所述答案跨度中確定出目標答案跨度;
55、返回模塊,用于基于所述目標答案跨度生成答案文本,并將所述答案文本返回給所述用戶。
56、為了解決上述技術(shù)問題,本技術(shù)實施例還提供一種計算機設備,采用了如下所述的技術(shù)方案:
57、接收用戶通過聊天界面輸入的查詢信息;
58、對所述查詢信息進行解析處理,生成對應的token序列;
59、獲取與所述查詢信息對應的上下文,以及獲取預設的特殊標記;
60、基于所述查詢信息、所述token序列、所述上下文以及所述特殊標記生成對應的輸入序列;
61、調(diào)用預先構(gòu)建的目標預測模型,并基于所述目標預測模型中的編碼器對所述輸入序列進行編碼,生成對應的隱藏表示;其中,所述目標預測模型為基于采集的跨語言客服問答數(shù)據(jù)集對多語言預訓練機器閱讀模型進行微調(diào)生成的模型;
62、基于所述目標預測模型中的提取器對所述隱藏表示進行預測處理,生成對應的所有答案跨度的預測概率分數(shù);
63、基于所述預測概率分數(shù)從所有所述答案跨度中確定出目標答案跨度;
64、基于所述目標答案跨度生成答案文本,并將所述答案文本返回給所述用戶。
65、為了解決上述技術(shù)問題,本技術(shù)實施例還提供一種計算機可讀存儲介質(zhì),采用了如下所述的技術(shù)方案:
66、接收用戶通過聊天界面輸入的查詢信息;
67、對所述查詢信息進行解析處理,生成對應的token序列;
68、獲取與所述查詢信息對應的上下文,以及獲取預設的特殊標記;
69、基于所述查詢信息、所述token序列、所述上下文以及所述特殊標記生成對應的輸入序列;
70、調(diào)用預先構(gòu)建的目標預測模型,并基于所述目標預測模型中的編碼器對所述輸入序列進行編碼,生成對應的隱藏表示;其中,所述目標預測模型為基于采集的跨語言客服問答數(shù)據(jù)集對多語言預訓練機器閱讀模型進行微調(diào)生成的模型;
71、基于所述目標預測模型中的提取器對所述隱藏表示進行預測處理,生成對應的所有答案跨度的預測概率分數(shù);
72、基于所述預測概率分數(shù)從所有所述答案跨度中確定出目標答案跨度;
73、基于所述目標答案跨度生成答案文本,并將所述答案文本返回給所述用戶。
74、與現(xiàn)有技術(shù)相比,本技術(shù)實施例主要有以下有益效果:
75、本技術(shù)首先接收用戶通過聊天界面輸入的查詢信息,并對所述查詢信息進行解析處理,生成對應的token序列;然后獲取與所述查詢信息對應的上下文,以及獲取預設的特殊標記,并基于所述查詢信息、所述token序列、所述上下文以及所述特殊標記生成對應的輸入序列;之后調(diào)用預先構(gòu)建的目標預測模型,并基于所述目標預測模型中的編碼器對所述輸入序列進行編碼,生成對應的隱藏表示;后續(xù)基于所述目標預測模型中的提取器對所述隱藏表示進行預測處理,生成對應的所有答案跨度的預測概率分數(shù);進一步基于所述預測概率分數(shù)從所有所述答案跨度中確定出目標答案跨度;最后基于所述目標答案跨度生成答案文本,并將所述答案文本返回給所述用戶。本技術(shù)通過使用基于采集的跨語言客服問答數(shù)據(jù)集對多語言預訓練機器閱讀模型進行微調(diào)生成的目標預測模型,基于高效的多語言預訓練和機器閱讀理解技術(shù)對用戶輸入的查詢信息進行處理,有效地提高了在多語種環(huán)境中的語言理解能力,使得能夠精確理解包括復雜的多種語言結(jié)構(gòu)在內(nèi)的多樣化用戶查詢,并能夠為用戶提供更準確和相關的回答,有效提高了回復處理的準確性,有利于提高用戶的服務體驗。