本申請(qǐng)涉及人工智能,尤其涉及一種文本生成的方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的普及,信息量呈指數(shù)級(jí)增長(zhǎng),用戶(hù)在海量信息中尋找所需的答案內(nèi)容變得越來(lái)越困難?,F(xiàn)有的搜尋對(duì)應(yīng)答案內(nèi)容的方式通常為根據(jù)用戶(hù)輸入的問(wèn)題進(jìn)行關(guān)鍵詞匹配和文本分析來(lái)定位相應(yīng)的答案內(nèi)容。但是,關(guān)鍵詞匹配方法往往依賴(lài)于字面匹配,無(wú)法很好地理解查詢(xún)背后的真正意圖和語(yǔ)境。此外,隨著信息量的增長(zhǎng),使用關(guān)鍵詞匹配找到大量相關(guān)文檔,用戶(hù)仍然面臨從這些文檔中篩選有效信息的挑戰(zhàn)。
2、對(duì)此,現(xiàn)有技術(shù)采用了自然語(yǔ)言處理技術(shù)來(lái)解決上述問(wèn)題,通過(guò)使用深度學(xué)習(xí)模型理解檢索相關(guān)文檔的語(yǔ)義,以及生成摘要或直接生成對(duì)應(yīng)問(wèn)題的回答等方式,提高了答案內(nèi)容的準(zhǔn)確性并減少了重復(fù)文本的獲取;但是,直接使用大語(yǔ)言模型進(jìn)行答案生成時(shí),往往因?yàn)橄嚓P(guān)文檔過(guò)多,使得大語(yǔ)言模型生成摘要或直接生成對(duì)應(yīng)問(wèn)題時(shí),對(duì)于問(wèn)題關(guān)注度不足所造成答案生成不準(zhǔn)確的問(wèn)題。
3、因此,亟需一種文本生成的方法來(lái)解決現(xiàn)有技術(shù)中答案文本的生成無(wú)法滿(mǎn)足用戶(hù)需求的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請(qǐng)實(shí)施例提供了一種文本生成方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)中答案文本生成不準(zhǔn)確的問(wèn)題。
2、本申請(qǐng)實(shí)施例的第一方面,提供了一種文本生成方法,包括:
3、接收問(wèn)題文本,將問(wèn)題文本進(jìn)行向量化處理得到問(wèn)題文本對(duì)應(yīng)的問(wèn)題向量;
4、獲取問(wèn)題文本對(duì)應(yīng)領(lǐng)域的預(yù)設(shè)文檔向量庫(kù)中的各文檔向量,計(jì)算各文檔向量與問(wèn)題向量的相似度評(píng)分,基于各文檔向量的相似度評(píng)分,選擇相似度評(píng)分最高的預(yù)設(shè)數(shù)量的文檔向量對(duì)應(yīng)的文本信息確定為相關(guān)文檔;
5、獲取各相關(guān)文檔與問(wèn)題文本的語(yǔ)義匹配度的匹配度得分,將各相關(guān)文檔按照匹配度得分由高到低的順序進(jìn)行排序,并將排序后的所有相關(guān)文檔按照排序順序進(jìn)行拼接,得到問(wèn)題文本相關(guān)的背景文本;
6、基于背景文本與問(wèn)題文本生成提示詞,將提示詞輸入至大語(yǔ)言模型,以使大語(yǔ)言模型根據(jù)背景文本生成與問(wèn)題文本對(duì)應(yīng)的答案文本。
7、本申請(qǐng)實(shí)施例的第二方面,提供了一種文本生成的裝置,包括:
8、提取模塊,用于接收問(wèn)題文本,將問(wèn)題文本進(jìn)行向量化處理得到問(wèn)題文本對(duì)應(yīng)的問(wèn)題向量;
9、篩選模塊,用于獲取問(wèn)題文本對(duì)應(yīng)領(lǐng)域的預(yù)設(shè)文檔向量庫(kù)中的各文檔向量,計(jì)算各文檔向量與問(wèn)題向量的相似度評(píng)分,基于各文檔向量的相似度評(píng)分,選擇相似度評(píng)分最高的預(yù)設(shè)數(shù)量的文檔向量對(duì)應(yīng)的文本信息確定為相關(guān)文檔;
10、重排模塊,用于獲取各相關(guān)文檔與問(wèn)題文本的語(yǔ)義匹配度的匹配度得分,將各相關(guān)文檔按照匹配度得分由高到低的順序進(jìn)行排序,并將排序后的所有相關(guān)文檔按照排序順序進(jìn)行拼接,得到問(wèn)題文本相關(guān)的背景文本;
11、執(zhí)行模塊,用于基于背景文本與問(wèn)題文本生成提示詞,將提示詞輸入至大語(yǔ)言模型,以使大語(yǔ)言模型根據(jù)背景文本生成與問(wèn)題文本對(duì)應(yīng)的答案文本。
12、本申請(qǐng)實(shí)施例的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器中并且可在處理器上運(yùn)行的計(jì)算機(jī)程序,該處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述方法的步驟。
13、本申請(qǐng)實(shí)施例的第四方面,提供了一種可讀存儲(chǔ)介質(zhì),該可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。
14、本申請(qǐng)實(shí)施例與現(xiàn)有技術(shù)相比存在的有益效果是:通過(guò)接收問(wèn)題文本,為了快速定位相關(guān)文檔,將問(wèn)題文本進(jìn)行向量化處理得到對(duì)應(yīng)的問(wèn)題向量,之后為了實(shí)現(xiàn)高效、專(zhuān)業(yè)領(lǐng)域內(nèi)信息檢索,獲取問(wèn)題文本對(duì)應(yīng)領(lǐng)域的預(yù)設(shè)文檔向量庫(kù)中的各文檔向量,計(jì)算各文檔向量與問(wèn)題向量的相似度評(píng)分,進(jìn)而根據(jù)相似度評(píng)分得到問(wèn)題向量與文檔向量之間的相關(guān)程度,選擇相似度評(píng)分最高的預(yù)設(shè)數(shù)量的文檔向量對(duì)應(yīng)的文本信息確定為相關(guān)文檔,之后,獲取各相關(guān)文檔與問(wèn)題文本的語(yǔ)義匹配度的匹配度得分,將各相關(guān)文檔按照匹配度得分由高到低的順序進(jìn)行排序,并將排序后的所有相關(guān)文檔按照排序順序進(jìn)行拼接,得到問(wèn)題文本相關(guān)的背景文本,進(jìn)而為大語(yǔ)言模型提供一個(gè)邏輯清晰且信息密度高的數(shù)據(jù)資料,接著基于背景文本與問(wèn)題文本生成提示詞,將提示詞輸入至大語(yǔ)言模型,以使大語(yǔ)言模型根據(jù)背景文本生成與問(wèn)題文本對(duì)應(yīng)的答案文本,使得答案文本的內(nèi)容更加貼合相關(guān)文檔,提高答案文本的專(zhuān)業(yè)性和準(zhǔn)確性,進(jìn)而解決用戶(hù)的需求。
1.一種文本生成的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的文本生成的方法,其特征在于,所述獲取所述問(wèn)題文本對(duì)應(yīng)領(lǐng)域的預(yù)設(shè)文檔向量庫(kù)中的各文檔向量之前,還包括:
3.根據(jù)權(quán)利要求2所述的文本生成的方法,其特征在于,所述獲取文檔數(shù)據(jù)庫(kù)的知識(shí)文檔,將所述知識(shí)文檔經(jīng)過(guò)文本預(yù)處理后按照預(yù)設(shè)拆分方式進(jìn)行拆分,得到各所述知識(shí)文檔對(duì)應(yīng)的拆分文本之前,還包括:
4.根據(jù)權(quán)利要求2所述的文本生成的方法,其特征在于,在所述基于所述背景文本與所述問(wèn)題文本生成提示詞,將所述提示詞輸入至大語(yǔ)言模型,以使所述大語(yǔ)言模型根據(jù)所述背景文本生成與所述問(wèn)題文本對(duì)應(yīng)的答案文本之后,還包括:
5.根據(jù)權(quán)利要求1所述的文本生成的方法,其特征在于,所述接收問(wèn)題文本,將所述問(wèn)題文本進(jìn)行向量化處理得到所述問(wèn)題文本對(duì)應(yīng)的問(wèn)題向量,包括:
6.根據(jù)權(quán)利要求1所述的文本生成的方法,其特征在于,所述基于所述背景文本與所述問(wèn)題文本生成提示詞,包括:
7.根據(jù)權(quán)利要求6所述的文本生成的方法,其特征在于,在所述基于所述背景文本與所述問(wèn)題文本生成提示詞,將所述提示詞輸入至大語(yǔ)言模型,以使所述大語(yǔ)言模型根據(jù)所述背景文本生成與所述問(wèn)題文本對(duì)應(yīng)的答案文本之后,還包括:
8.一種文本生成的裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并且可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述方法的步驟。
10.一種可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述方法的步驟。