本發(fā)明屬于金融,具體涉及一種基于大模型rag技術的信貸業(yè)務系統(tǒng)演化方法及裝置。
背景技術:
1、在當代銀行領域中,線上信貸業(yè)務具有極其重要的作用,它不僅是銀行的核心業(yè)務之一,也是銀行實現盈利、服務實體經濟、促進社會資金流動的關鍵途徑。為滿足日益增長和不斷變化的各類資金需求,在滿足監(jiān)管的各項要求下,銀行的對私、對公信貸產品不斷發(fā)展創(chuàng)新,持續(xù)推出不同形式、不同類型、不同體量的金融產品。
2、為實現新的信貸產品及時上線,需要保證產品研發(fā)的時效性,這要求對新產品的業(yè)務邏輯進行快速解構,與現有產品業(yè)務進行比對,區(qū)分出共性業(yè)務邏輯和特殊業(yè)務邏輯,并在系統(tǒng)演化的設計和實現層面進行業(yè)務模塊與軟件構件的準確掛鉤,迅速識別、組裝和擴展可復用系統(tǒng)功能構件。此外,還需要考慮系統(tǒng)的可靠性和運維的及時性,這要求在新產品上線后,對新產品及原有業(yè)務的正常運轉進行及時的異常發(fā)現、精準的問題定位、快速的迭代修復。
3、信貸業(yè)務系統(tǒng)需要支持多渠道、多類型信貸產品的聯機業(yè)務流程、批量業(yè)務流程,不同產品具有上下游系統(tǒng)的接口異構性、功能模塊之間的流程異構性、功能模塊內部的邏輯異構性。同時,各產品之間也存在著局部業(yè)務重疊,根據產品的軟件架構要求,需要實現共性接口復用、模塊復用、邏輯代碼復用?;谛刨J業(yè)務及其系統(tǒng)的以上特點,研發(fā)新產品時,需要分別從業(yè)務視角、系統(tǒng)視角、數據視角對已有的線上信貸產品進行分析,之后,開展產品需求設計、系統(tǒng)演化設計,以此保證產品落地方案的可行性、資源成本投入的準確性,以及變更對原有功能的影響程度。
4、在信貸業(yè)務系統(tǒng)這一不斷發(fā)展和變化的領域,如果直接依賴通用的預訓練大語言模型及其技術來支持研發(fā)和運維工作,將具有以下局限:
5、1、通用模型的局限性:通用預訓練大語言模型通常缺乏特定行業(yè)和企業(yè)的私有化知識。在銀行信貸等領域,這些模型無法直接解決各銀行特定的信貸業(yè)務和系統(tǒng)相關問題,需要通過額外的方法來使模型習得這些私有知識。
6、2、微調技術成本高昂:微調技術是對大語言模型本身進行增量訓練,調整并固化模型參數,使模型習得私有知識。對于不斷演化的信貸產品和系統(tǒng),每當業(yè)務有新增或變更,使用微調技術訓練模型會帶來較大的時間開銷和計算成本投入,這限制了微調技術的廣泛應用和頻繁更新。
7、3、提示詞工程的不足:不同于微調技術,提示詞工程無需進行昂貴的模型訓練,其依賴于用戶對提問時的語言結構、背景信息進行設計和添加,以提示和控制大語言模型輸出的規(guī)則和形式。然而,提示詞工程的效果很大程度上取決于提示詞的設計,這需要用戶對模型的理解和領域知識的深入掌握,此外,該方法還具有數據偏差、知識局限等不足。
8、4、rag技術的優(yōu)勢與困境:rag檢索增強技術,是在進行大語言模型調用前,通過檢索專有知識庫獲取私域知識,讓大模型結合知識上下文進行推理,相比微調和提示詞技術,該方法成本低,且能有效緩解大模型幻覺(llm?hallucination),增加推理精確度和專業(yè)度。然而,未經有效設計的檢索方法和架構,可能由于文檔分塊方式、文本嵌入方法、檢索匹配算法的選擇不當,以及知識組織方式、知識檢索流程的設計不足,導致知識檢索時效性差、知識聚合完整度低、知識關聯精確度不足等缺陷。此外,由于缺乏自動反饋更新機制,用戶無法直接對回答誤差進行糾正并參與知識庫的調整,從而影響了知識的及時更新及模型的長期準確性。
技術實現思路
1、本發(fā)明提供一種基于大模型rag技術的信貸業(yè)務系統(tǒng)演化方法及裝置,以解決背景技術中所述的問題。
2、為實現上述目的,本發(fā)明提供如下技術方案:一種基于大模型rag技術的信貸業(yè)務系統(tǒng)演化方法及裝置,包括如下步驟:
3、獲取信息資源,對信息資源進行分類,得到多組主題資源,通過多組主題資源和獲取的人工輸入的問答語料同步輸入至大模型,通過大模型輸出多個主題文本,生成主題知識庫,提煉問答語料,生成前置知識庫,將主題知識庫與前置知識庫相關聯,并儲存至向量數據庫;
4、獲取提問文本,在提問文本中提取精確詞匯,并向量化精確詞匯,得到提問向量,判斷前置知識庫中能否檢索到提問向量的答復文本,若能,則得到答復文本;若否,則通過前置知識庫,路由主題知識庫進行檢索,得到標準文本;將答復文本或標準文本輸入至大模型,基于預設的輸出模板,得到結果文本;
5、基于輸出的結果文本,獲取人工輸入的反饋信息,調用前置知識庫,判斷前置知識庫中是否存在答復文本,若不存在,則將提問向量、結果文本和反饋信息更新至前置知識庫中,若存在,則二次更新前置知識庫。
6、優(yōu)選的,所述輸出多個主題文本包括如下步驟:
7、獲取問答語料,得到問答訓練文本及問答結果,其中,問答結果包括正面結果和負面結果;
8、獲取正面結果及相對應的問答訓練文本,得到問答訓練文本,向量化問答訓練文本,得到精煉知識語料;
9、向量化精煉知識語料,得到熱點知識文本;
10、根據熱點知識文本,獲取問答語料中相匹配的關鍵詞及主題標簽;
11、向量化關鍵詞及主題標簽,得到關鍵詞向量和標簽向量。
12、優(yōu)選的,所述將主題知識庫與前置知識庫相關聯,包括如下步驟:
13、獲取多組主題文本,分別對多個主題文本進行向量化,生成主題知識庫,獲取熱點知識文本,構建熱點知識文本與主題知識庫之間的內部關聯;
14、獲取關鍵詞及主題標簽,將關鍵詞向量和標簽向量與熱點知識文本相關聯,生成前置知識庫,并建立熱點集合,將熱點知識文本儲存至前置知識庫中的熱點集合中;
15、在前置知識庫中建立主題集合,將關鍵詞向量和標簽向量儲存至主題集合;
16、將主題知識庫與前置知識庫儲存至向量數據庫。
17、優(yōu)選的,所述判斷前置知識庫中能否檢索到答復文本,包括如下步驟:
18、獲取提問向量;
19、在前置數據庫的熱點知識文本中匹配提問向量,根據預設的相似度閾值,判斷前置數據庫中是否存在檢索到答復文本,若存在,則返回答復文本,并獲取答復文本對應的主題知識庫的主題標簽;
20、若不存在,則調用題知識庫進行檢索。
21、優(yōu)選的,所述通過前置知識庫路由主題知識庫進行檢索,包括如下步驟:
22、獲取精確詞匯;
23、根據精確詞匯檢索主題集合,得到對應的關鍵詞向量,根據關鍵詞向量得到主題標簽,根據主題標簽得到目標主題知識庫;
24、獲取提問向量;
25、基于提問向量檢索目標主題知識庫,根據預設的相似度閾值,獲取相似度達到設定閾值的知識文本段;
26、獲取與知識文本段相應的主題文本,得到標準文本。
27、優(yōu)選的,所述將答復文本或標準文本輸入至大模型,得到結果文本,包括:
28、將答復文本輸入至大模型,得到結果文本,需執(zhí)行如下步驟:
29、獲取提問文本,得到提問文本中的主題關鍵詞,根據主題關鍵詞匹配關鍵詞,得到相對應的主題標簽;
30、結合主題標簽,獲取人工輸入的輸出模板,將答復文本與提示詞同步輸入至大模型,并通過輸出模板,輸出結果文本;
31、將標準文本輸入至大模型,得到結果文本,需執(zhí)行如下步驟:
32、獲取提問文本,得到提問文本中的主題關鍵詞,根據主題關鍵詞匹配關鍵詞,得到相對應的主題標簽;
33、結合主題標簽,獲取人工輸入的輸出模板,獲取知識文本段,將知識文本段與提示詞同步輸入至大模型,并通過輸出模板,輸出結果文本。
34、優(yōu)選的,所述檢索前置知識庫是否存在提問文本,之前還需要進行如下操作:
35、獲取反饋信息,判斷反饋信息為正向反饋或負向反饋;
36、若為正向反饋,則檢索前置知識庫是否存在提問文本;
37、若為負向反饋,則獲取糾錯信息。
38、優(yōu)選的,所述二次更新前置知識庫,包括如下步驟:
39、獲取反饋信息,判斷反饋信息為正向反饋或負向反饋;
40、若為正向反饋,則獲取提問文本、提問向量和結果文本,并更新至前置知識庫;
41、若為負向反饋,則執(zhí)行如下步驟:
42、刪除前置知識庫中的結果文本;
43、獲取糾錯信息,向量化糾錯信息,得到糾錯向量;
44、將提問文本和糾錯向量更新到前置知識庫。
45、一種基于大模型rag技術的信貸業(yè)務系統(tǒng)演化裝置,包括:
46、資源預處理模塊,用于獲取信息資源,對信息資源進行分類,得到多組主題資源,將多組主題資源與獲取的人工輸入的問答語料同步輸入至大模型,輸出多個主題文本,生成主題知識庫,提煉問答語料,生成前置知識庫,將主題知識庫與前置知識庫相關聯,并儲存至向量數據庫;
47、輸入處理模塊,用于在提問文本中提取精確詞匯,并向量化精確詞匯,得到提問向量;
48、數據檢索模塊,用于判斷前置知識庫中能否檢索到提問向量的答復文本,若能,則得到答復文本;若否,則通過前置知識庫,路由主題知識庫進行檢索,得到標準文本;
49、結果輸出模塊,用于將答復文本或標準文本輸入至大模型,基于預設的輸出模板,得到結果文本;
50、反饋校驗模塊,用于基于輸出的結果文本,獲取人工輸入的反饋信息,調用前置知識庫,檢索前置知識庫;
51、反饋處理模塊,用于判斷前知識庫中是否存在答復文本的檢索結果,若不存在,則將提問向量、結果文本和反饋信息更新至前置知識庫中,若存在,則二次更新前置知識庫。
52、一種計算設備,包括存儲器和處理器,所述存儲器中存儲有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時,所述處理器執(zhí)行所述計算機程序時實現一種基于大模型rag技術的信貸業(yè)務系統(tǒng)演化方法。
53、本發(fā)明的技術效果和優(yōu)點:通過對大模型的自主學習和人工干預的方式,提高大模型學習和理解業(yè)務領域知識的能力,提高迭代演化的研發(fā)效率、質量以及運維時效;通過優(yōu)先選擇前置知識庫,并通過熱點知識文本鏈接主題知識庫的方式,快速、準確地得到結果文本,提高反饋效率;在輸出結果文本后,獲取人工反饋信息,根據反饋信息不斷改進熱點知識文本,完善前置知識庫,以確保前置知識庫可及時更新,并保證大模型輸出內容的準確性和完整性;在演化過程中,提高產品設計效率、增強研發(fā)質量、提升系統(tǒng)運維時效、減少非必要人力投入,達到降本增效目的。