本技術(shù)涉及人工智能開發(fā)與金融科技領(lǐng)域,尤其涉及基于人工智能的查詢處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在保險(xiǎn)領(lǐng)域,隨著人工智能技術(shù)的快速發(fā)展,特別是自然語言處理(nlp)和問答系統(tǒng)(q&a?systems)的廣泛應(yīng)用,文本切片技術(shù)作為其中的關(guān)鍵環(huán)節(jié),對于提升保險(xiǎn)問答系統(tǒng)的性能與準(zhǔn)確性起到了至關(guān)重要的作用。文本切片旨在將復(fù)雜的保險(xiǎn)文檔或?qū)υ拑?nèi)容合理地切分為一系列較小、易于處理的文本片段,以便系統(tǒng)能夠更高效地檢索、理解和生成回答。
2、目前,保險(xiǎn)企業(yè)中的保險(xiǎn)問答系統(tǒng)通常采用基于語義的切分方法來進(jìn)行文本切片?;谡Z義的切分方法為利用預(yù)訓(xùn)練模型(如bert)評估段落間相似度以實(shí)現(xiàn)更智能的文本切片。這類方法雖然能在一定程度上改善切片的語義完整性,但仍然受限于其固有的序列依賴性。具體來說,它們通常需要按照文本的線性順序進(jìn)行處理,難以有效處理跨段落或章節(jié)的遠(yuǎn)距離語義關(guān)聯(lián)。這意味著,在面對包含大量不相關(guān)文本內(nèi)容但部分段落間存在重要語義聯(lián)系的文檔時(shí),基于語義的切分方法同樣可能無法將這些相關(guān)信息整合到同一切片中,進(jìn)而影響問答系統(tǒng)對問題的全面理解和準(zhǔn)確回答。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的目的在于提出一種基于人工智能的查詢處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì),以解決現(xiàn)有的保險(xiǎn)企業(yè)中的保險(xiǎn)問答系統(tǒng)采用基于語義的切分方法來進(jìn)行文本切片的方式,存在序列依賴性強(qiáng)且問答系統(tǒng)的回答準(zhǔn)確性較低的技術(shù)問題。
2、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例提供一種基于人工智能的查詢處理方法,采用了如下所述的技術(shù)方案:
3、獲取用戶輸入的查詢信息;
4、從預(yù)設(shè)的知識庫中獲取與所述查詢信息對應(yīng)的原始文本;
5、基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞;
6、基于預(yù)設(shè)的知識切分模型對所述原始文本與所述目標(biāo)關(guān)鍵詞進(jìn)行切分處理,得到對應(yīng)的文本句子字典;
7、基于預(yù)設(shè)的知識整合模型對所述目標(biāo)關(guān)鍵詞與所述文本句子字典進(jìn)行整合處理,得到對應(yīng)的目標(biāo)文本切片;
8、基于預(yù)設(shè)的目標(biāo)大語言模型對所述查詢信息與所述目標(biāo)文本切片進(jìn)行推理處理,得到對應(yīng)的答案數(shù)據(jù);
9、基于所述答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理。
10、進(jìn)一步的,所述從預(yù)設(shè)的知識庫中獲取與所述查詢信息對應(yīng)的原始文本的步驟,具體包括:
11、對所述查詢信息進(jìn)行分詞處理,得到對應(yīng)的分詞;
12、基于所述分詞對所述知識庫進(jìn)行倒排索引查詢,得到所述分詞與所述知識庫中包含的各個(gè)文檔之間的相關(guān)性得分;
13、按照所述相關(guān)性得分從高到低的順序?qū)λ兴鑫臋n進(jìn)行排序,得到相應(yīng)的文檔排序列表;
14、基于所述相關(guān)性得分,從所述文檔排序列表中篩選出目標(biāo)數(shù)量的指定文檔;
15、基于所述指定文檔生成與所述查詢信息對應(yīng)的所述原始文本。
16、進(jìn)一步的,所述基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞的步驟,具體包括:
17、獲取與所述關(guān)鍵詞生成模型對應(yīng)的第一提示數(shù)據(jù);
18、調(diào)用預(yù)先訓(xùn)練好的關(guān)鍵詞生成模型;
19、將所述原始文本與所述第一提示數(shù)據(jù)至所述關(guān)鍵詞生成模型內(nèi),通過所述關(guān)鍵詞生成模型對所述原始文本與所述第一提示文本進(jìn)行處理,得到對應(yīng)的第一模型輸出;
20、將所述第一模型輸出作為所述目標(biāo)關(guān)鍵詞。
21、進(jìn)一步的,所述基于預(yù)設(shè)的知識切分模型對所述原始文本與所述目標(biāo)關(guān)鍵詞進(jìn)行切分處理,得到對應(yīng)的文本句子字典的步驟,具體包括:
22、獲取與所述知識切分模型對應(yīng)的第二提示數(shù)據(jù);
23、調(diào)用預(yù)先訓(xùn)練好的知識切分模型;
24、將所述原始文本、所述目標(biāo)關(guān)鍵詞以及所述第二提示數(shù)據(jù)輸入至所述知識切分模型內(nèi),通過所述知識切分模型對所述原始文本、所述目標(biāo)關(guān)鍵詞以及所述第二提示數(shù)據(jù)進(jìn)行處理,得到對應(yīng)的第二模型輸出;
25、將所述第二模型輸出作為所述文本句子字典。
26、進(jìn)一步的,所述基于預(yù)設(shè)的知識整合模型對所述目標(biāo)關(guān)鍵詞與所述文本句子字典進(jìn)行整合處理,得到對應(yīng)的目標(biāo)文本切片的步驟,具體包括:
27、獲取與所述知識整合模型對應(yīng)的第三提示數(shù)據(jù);
28、調(diào)用預(yù)先訓(xùn)練好的知識整合模型;
29、將所述目標(biāo)關(guān)鍵詞、所述文本句子字典以及所述第三提示數(shù)據(jù)輸入至所述知識整合模型內(nèi),通過所述知識整合模型對所述目標(biāo)關(guān)鍵詞、所述文本句子字典以及所述第三提示數(shù)據(jù)進(jìn)行處理,得到對應(yīng)的第三模型輸出;
30、將所述第三模型輸出作為所述目標(biāo)文本切片。
31、進(jìn)一步的,所述基于所述答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理的步驟,具體包括:
32、獲取預(yù)設(shè)的冗余處理策略與語法修正策略;
33、基于所述冗余處理策略對所述答案數(shù)據(jù)進(jìn)行去除冗余處理,得到對應(yīng)的第一答案數(shù)據(jù);
34、基于所述語法修正策略對所述第一答案數(shù)據(jù)進(jìn)行語法修正處理,得到對應(yīng)的第二答案數(shù)據(jù);
35、基于所述第二答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理。
36、進(jìn)一步的,在所述基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞的步驟之前,還包括:
37、收集保險(xiǎn)領(lǐng)域的文本數(shù)據(jù);
38、對所述文本數(shù)據(jù)進(jìn)行標(biāo)注處理,得到對應(yīng)的指定文本數(shù)據(jù);
39、基于預(yù)設(shè)的關(guān)鍵詞生成數(shù)據(jù)格式對所述指定文本數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,得到對應(yīng)的樣本數(shù)據(jù);
40、調(diào)用預(yù)訓(xùn)練語言模型;
41、使用所述樣本數(shù)據(jù)與基于低秩適應(yīng)的微調(diào)算法對所述預(yù)訓(xùn)練語言模型進(jìn)行訓(xùn)練與微調(diào)處理,得到符合預(yù)設(shè)構(gòu)建條件的指定語言模型;
42、將所述指定語言模型作為所述關(guān)鍵詞生成模型。
43、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例還提供一種基于人工智能的查詢處理裝置,采用了如下所述的技術(shù)方案:
44、第一獲取模塊,用于獲取用戶輸入的查詢信息;
45、第二獲取模塊,用于從預(yù)設(shè)的知識庫中獲取與所述查詢信息對應(yīng)的原始文本;
46、生成模塊,用于基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞;
47、切分模塊,用于基于預(yù)設(shè)的知識切分模型對所述原始文本與所述目標(biāo)關(guān)鍵詞進(jìn)行切分處理,得到對應(yīng)的文本句子字典;
48、整合模塊,用于基于預(yù)設(shè)的知識整合模型對所述目標(biāo)關(guān)鍵詞與所述文本句子字典進(jìn)行整合處理,得到對應(yīng)的目標(biāo)文本切片;
49、推理模塊,用于基于預(yù)設(shè)的目標(biāo)大語言模型對所述查詢信息與所述目標(biāo)文本切片進(jìn)行推理處理,得到對應(yīng)的答案數(shù)據(jù);
50、回復(fù)模塊,用于基于所述答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理。
51、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:
52、獲取用戶輸入的查詢信息;
53、從預(yù)設(shè)的知識庫中獲取與所述查詢信息對應(yīng)的原始文本;
54、基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞;
55、基于預(yù)設(shè)的知識切分模型對所述原始文本與所述目標(biāo)關(guān)鍵詞進(jìn)行切分處理,得到對應(yīng)的文本句子字典;
56、基于預(yù)設(shè)的知識整合模型對所述目標(biāo)關(guān)鍵詞與所述文本句子字典進(jìn)行整合處理,得到對應(yīng)的目標(biāo)文本切片;
57、基于預(yù)設(shè)的目標(biāo)大語言模型對所述查詢信息與所述目標(biāo)文本切片進(jìn)行推理處理,得到對應(yīng)的答案數(shù)據(jù);
58、基于所述答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理。
59、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲介質(zhì),采用了如下所述的技術(shù)方案:
60、獲取用戶輸入的查詢信息;
61、從預(yù)設(shè)的知識庫中獲取與所述查詢信息對應(yīng)的原始文本;
62、基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞;
63、基于預(yù)設(shè)的知識切分模型對所述原始文本與所述目標(biāo)關(guān)鍵詞進(jìn)行切分處理,得到對應(yīng)的文本句子字典;
64、基于預(yù)設(shè)的知識整合模型對所述目標(biāo)關(guān)鍵詞與所述文本句子字典進(jìn)行整合處理,得到對應(yīng)的目標(biāo)文本切片;
65、基于預(yù)設(shè)的目標(biāo)大語言模型對所述查詢信息與所述目標(biāo)文本切片進(jìn)行推理處理,得到對應(yīng)的答案數(shù)據(jù);
66、基于所述答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理。
67、與現(xiàn)有技術(shù)相比,本技術(shù)實(shí)施例主要有以下有益效果:
68、本技術(shù)首先獲取用戶輸入的查詢信息;并從預(yù)設(shè)的知識庫中獲取與所述查詢信息對應(yīng)的原始文本;然后基于預(yù)設(shè)的關(guān)鍵詞生成模型對所述原始文本進(jìn)行關(guān)鍵詞提取處理,得到對應(yīng)的目標(biāo)關(guān)鍵詞;之后基于預(yù)設(shè)的知識切分模型對所述原始文本與所述目標(biāo)關(guān)鍵詞進(jìn)行切分處理,得到對應(yīng)的文本句子字典;后續(xù)基于預(yù)設(shè)的知識整合模型對所述目標(biāo)關(guān)鍵詞與所述文本句子字典進(jìn)行整合處理,得到對應(yīng)的目標(biāo)文本切片;進(jìn)一步基于預(yù)設(shè)的目標(biāo)大語言模型對所述查詢信息與所述目標(biāo)文本切片進(jìn)行推理處理,得到對應(yīng)的答案數(shù)據(jù);最后基于所述答案數(shù)據(jù)對所述用戶進(jìn)行回復(fù)處理。本技術(shù)在從知識庫中獲取與用戶輸入的查詢信息對應(yīng)的原始文本后,通過結(jié)合關(guān)鍵詞生成模型、知識切分模型以及知識整合模型的使用突破了傳統(tǒng)的順序切片限制,實(shí)現(xiàn)了對文本內(nèi)容的非線性和多維度解析,具體通過使用關(guān)鍵詞生成模型精準(zhǔn)捕捉文本中的關(guān)鍵信息,然后使用知識切片模型則對文本進(jìn)行深度解析,將信息劃分為獨(dú)立的、可獨(dú)立理解的信息單元,進(jìn)而使用知識整合模型將這些獨(dú)立的信息單元重新組合并形成連貫且富有邏輯性的文本切片,從而有效解決了文本切片過程中存在的序列依賴性問題,提升了文本處理的靈活性和準(zhǔn)確性,同時(shí)優(yōu)化了文本分析的效率,也極大地豐富了文本內(nèi)容的表達(dá)和理解的深度。使得后續(xù)通過使用目標(biāo)大語言模型對所述查詢信息與所述目標(biāo)文本切片進(jìn)行推理處理得到對應(yīng)的答案數(shù)據(jù),可以有效提高生成的答案數(shù)據(jù)的準(zhǔn)確度。進(jìn)而基于答案數(shù)據(jù)對用戶進(jìn)行回復(fù)處理,在提高問答系統(tǒng)的回答準(zhǔn)確性的同時(shí),能夠保證用戶的查閱體驗(yàn)感,并提高用戶的查詢滿意度。