本發(fā)明涉及保險及自然語言處理,尤其涉及一種基于大模型的語音會話處理方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、隨著時代發(fā)展、科學(xué)進步和人們風(fēng)險意識的提高,保險作為一種經(jīng)濟保障制度得到了大幅度發(fā)展。隨著人工智能技術(shù)飛速發(fā)展,人機交互會話系統(tǒng)更多地走進人們的日常生活中。因此,人工智能保險會話系統(tǒng)應(yīng)運而生。
2、利用人工智能保險會話系統(tǒng),可以實現(xiàn)智能化的人機保險會話。但現(xiàn)有的基于生成模型的會話系統(tǒng),采用通用樣本對模型進行訓(xùn)練,導(dǎo)致對用戶的針對性不足,使得回復(fù)文本的準確性不高;由于回復(fù)文本的長度不同,越長的回復(fù)文本會消耗越長的生成時間,導(dǎo)致在人機交互過程中出現(xiàn)客戶等待會話系統(tǒng)的情況,使得人機交互不流暢。
3、因此,亟需一種能夠有效提升人機交互準確度和流暢度的語音會話處理方法。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種基于大模型的語音會話處理方法、裝置、設(shè)備及介質(zhì),通過對預(yù)訓(xùn)練的保險大模型進行微調(diào)得到適用于用戶的預(yù)測模型,通過流式輸出對用戶語音話術(shù)進行精確回復(fù),提高了回復(fù)準確度,提高了人機交互流暢性,進而提升用戶體驗。
2、第一方面,提供了一種基于大模型的語音會話處理方法,該方法包括:
3、獲取用戶的歷史記錄數(shù)據(jù),根據(jù)歷史記錄數(shù)據(jù)生成指令微調(diào)數(shù)據(jù)集,利用指令微調(diào)數(shù)據(jù)集對預(yù)訓(xùn)練的保險大模型進行微調(diào),得到訓(xùn)練好的預(yù)測模型;
4、獲取用戶的用戶語音話術(shù),將用戶語音話術(shù)轉(zhuǎn)換為用戶文本話術(shù)后輸入訓(xùn)練好的預(yù)測模型流式生成應(yīng)答文本話術(shù);
5、在流式生成應(yīng)答文本話術(shù)的過程中,將應(yīng)答文本話術(shù)依次切割為至少一個應(yīng)答文本短句,并將至少一個應(yīng)答文本短句依次進行存儲;
6、隨著至少一個應(yīng)答文本短句存儲,依次調(diào)取至少一個應(yīng)答文本短句轉(zhuǎn)換為應(yīng)答語音短句輸出,并將已輸出的應(yīng)答文本短句刪除。
7、第二方面,提供了一種基于大模型的語音會話處理裝置,該裝置包括:
8、模型微調(diào)單元,用于獲取用戶的歷史記錄數(shù)據(jù),根據(jù)歷史記錄數(shù)據(jù)生成指令微調(diào)數(shù)據(jù)集,利用指令微調(diào)數(shù)據(jù)集對預(yù)訓(xùn)練的保險大模型進行微調(diào),得到訓(xùn)練好的預(yù)測模型;
9、應(yīng)答文本話術(shù)生成單元,用于獲取用戶的用戶語音話術(shù),將用戶語音話術(shù)轉(zhuǎn)換為用戶文本話術(shù)后輸入訓(xùn)練好的預(yù)測模型流式生成應(yīng)答文本話術(shù);
10、應(yīng)答文本短句切割單元,用于在流式生成應(yīng)答文本話術(shù)的過程中,將應(yīng)答文本話術(shù)依次切割為至少一個應(yīng)答文本短句,并將至少一個應(yīng)答文本短句依次進行存儲;
11、應(yīng)答語音短句輸出單元,用于隨著至少一個應(yīng)答文本短句存儲,依次調(diào)取至少一個應(yīng)答文本短句轉(zhuǎn)換為應(yīng)答語音短句輸出,并將已輸出的應(yīng)答文本短句刪除。
12、第三方面,提供了一種計算機設(shè)備,包括存儲器、處理器以及存儲在存儲器中并可在處理器上運行的計算機程序,處理器執(zhí)行計算機程序時實現(xiàn)上述的基于大模型的語音會話處理方法的步驟。
13、第四方面,提供了一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)上述的基于大模型的語音會話處理方法的步驟。
14、上述基于大模型的語音會話處理方法、裝置、設(shè)備及介質(zhì)所實現(xiàn)的方案中,獲取用戶的歷史記錄數(shù)據(jù),根據(jù)歷史記錄數(shù)據(jù)生成指令微調(diào)數(shù)據(jù)集,利用指令微調(diào)數(shù)據(jù)集對預(yù)訓(xùn)練的保險大模型進行微調(diào),得到訓(xùn)練好的預(yù)測模型;接收用戶的用戶語音話術(shù),將用戶語音話術(shù)轉(zhuǎn)換為用戶文本話術(shù)后輸入訓(xùn)練好的預(yù)測模型流式生成應(yīng)答文本話術(shù);在流式生成應(yīng)答文本話術(shù)的過程中,將應(yīng)答文本話術(shù)依次切割為至少一個應(yīng)答文本短句,并將至少一個應(yīng)答文本短句依次進行存儲;隨著至少一個應(yīng)答文本短句存儲,依次調(diào)取至少一個應(yīng)答文本短句轉(zhuǎn)換為應(yīng)答語音短句輸出,并將已輸出的應(yīng)答文本短句刪除。
15、在本發(fā)明中,利用指令微調(diào)數(shù)據(jù)集對預(yù)訓(xùn)練的保險大模型進行微調(diào),使訓(xùn)練好的預(yù)測模型具有對于用戶的針對性,從而提高回復(fù)的準確度;利用訓(xùn)練好的預(yù)測模型流式生成應(yīng)答文本話術(shù),通過應(yīng)答文本短句形式依次存儲,在依次存儲過程中異步依次處理,大大提高了回復(fù)的速度。本發(fā)明的方法,提升了人機交互的流暢度,提高了用戶體驗。
1.一種基于大模型的語音會話處理方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的基于大模型的語音會話處理方法,其特征在于,所述獲取用戶的歷史記錄數(shù)據(jù),根據(jù)所述歷史記錄數(shù)據(jù)生成指令微調(diào)數(shù)據(jù)集,利用所述指令微調(diào)數(shù)據(jù)集對預(yù)訓(xùn)練的保險大模型進行微調(diào),得到訓(xùn)練好的預(yù)測模型,包括:
3.如權(quán)利要求1或2所述的基于大模型的語音會話處理方法,其特征在于,所述保險大模型通過以下方法進行預(yù)訓(xùn)練:
4.如權(quán)利要求1所述的基于大模型的語音會話處理方法,其特征在于,所述獲取用戶的用戶語音話術(shù),將所述用戶語音話術(shù)轉(zhuǎn)換為用戶文本話術(shù)后輸入訓(xùn)練好的所述預(yù)測模型流式生成應(yīng)答文本話術(shù),包括:
5.如權(quán)利要求1所述的基于大模型的語音會話處理方法,其特征在于,所述在流式生成所述應(yīng)答文本話術(shù)的過程中,將所述應(yīng)答文本話術(shù)依次切割為至少一個應(yīng)答文本短句,并將至少一個所述應(yīng)答文本短句依次進行存儲,包括:
6.如權(quán)利要求1所述的基于大模型的語音會話處理方法,其特征在于,所述隨著至少一個所述應(yīng)答文本短句存儲,依次調(diào)取至少一個所述應(yīng)答文本短句轉(zhuǎn)換為應(yīng)答語音短句輸出,并將已輸出的所述應(yīng)答文本短句刪除,包括:
7.如權(quán)利要求1所述的基于大模型的語音會話處理方法,其特征在于,所述方法還包括:
8.一種基于大模型的語音會話處理裝置,其特征在于,所述裝置包括:
9.一種計算機設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至7任一項所述的基于大模型的語音會話處理方法的步驟。
10.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7任一項所述的基于大模型的語音會話處理方法的步驟。