欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于大語言模型的人物科普教育的聊天方法、系統(tǒng)及聊天機器人

文檔序號:40480580發(fā)布日期:2024-12-31 12:48閱讀:11來源:國知局
基于大語言模型的人物科普教育的聊天方法、系統(tǒng)及聊天機器人

本發(fā)明屬于新一代信息技術和產(chǎn)品,具體為基于大語言模型的人物科普教育的聊天方法、系統(tǒng)及聊天機器人。


背景技術:

1、在人工智能的發(fā)展中,大語言模型的構建與應用在通用領域已經(jīng)取得了顯著的成就。在人物科普教育中,大語言模型可以幫助理解和處理人物信息和相關查詢,提供自動化的咨詢和分析服務。

2、然而,目前尚未存在專注于人物科普教育的大語言模型垂直應用,傳統(tǒng)方法因缺乏高度針對性的服務和對復雜查詢的深入分析,導致無法提供針對性強和覆蓋面廣的人物科普教育信息。例如,缺乏對于人物生平的概括性總結和人物信息知識庫相似度計算的前沿方法,很難為用戶提供詳細和個性化的人物科普教育信息,不僅降低了用戶滿意度,也影響了人物信息咨詢服務的個體針對性和效率。

3、其中,人物科普教育的聊天方法,其目的在于提供面向人物信息問題的有效溝通和科普教育,通過這種方法,用戶可以通過自然語言向大語言模型查詢有關人物生平、作品或成就等方面的問題,大語言模型可以理解查詢并提供相關準確的信息。提高人物信息相關咨詢和管理的效率和質(zhì)量,使得用戶能夠以更加直觀和便捷的方式獲取人物科普教育信息。

4、因此,迫切需要基于大語言模型的人物科普教育的聊天方法、系統(tǒng)及聊天機器人出現(xiàn),實現(xiàn)面向人物信息問題的個性化精準服務。


技術實現(xiàn)思路

1、本發(fā)明的目的是實現(xiàn)一種基于大語言模型的人物科普教育的聊天方法、系統(tǒng)及聊天機器人。通過構建基于大語言模型的聊天方法、多模塊結構系統(tǒng)及聊天機器人,實現(xiàn)大語言模型對于人物科普教育的垂直應用,優(yōu)化大語言模型針對人物科普教育的語義理解與信息生成能力。

2、實現(xiàn)本發(fā)明目的的具體技術方案是:

3、一種基于大語言模型的人物科普教育的聊天方法,具體包括:

4、人物科普教育針對性垂直訓練:基于社會公開數(shù)據(jù)構建人物科普教育知識庫,重新組合格式,形成人物科普教育微調(diào)的指令數(shù)據(jù)集;利用人物科普教育指令數(shù)據(jù)對預訓練大語言模型進行指令監(jiān)督微調(diào),讓大語言模型學習人物科普教育知識,從而構建人物科普教育垂直大模型;

5、構建消息列表:為用戶構建消息列表,用于動態(tài)存儲、維護對話歷史;所述構建消息列表方法,具體包括:使用python創(chuàng)建一個列表數(shù)據(jù)結構,該列表所設元素具體為對話角色?role?及其對話內(nèi)容?content;所述動態(tài)存儲對話歷史方法,具體包括記錄每輪對話中角色及其對話內(nèi)容,通過?append()?函數(shù)將其填充至所述列表元素中;所述維護對話歷史方法,具體包括設置最大歷史長度標簽,及時清理超過所述最大歷史長度的對話歷史;

6、用戶查詢輸入和意圖識別:基于用戶輸入進行查詢意圖解析,以確定用戶的需求背景;具體包括用戶輸入人物咨詢問題,基于用戶輸入信息,使用自然語言處理技術對其進行語句結構分析,提取關鍵信息包括人名、成就,以識別用戶的需求背景;

7、人物科普教育知識庫檢索和匹配:使用?faiss?庫對已構建的人物科普教育知識庫進行高維向量化,將人物科普教育知識庫投射至高維的向量空間中,形成向量數(shù)據(jù)庫,對用戶查詢內(nèi)容進行文本嵌入操作,投射至同所述向量數(shù)據(jù)庫相同維度的高維向量空間中;使用?faiss?庫篩選出高相關度的文段并為其設置優(yōu)先級標簽,作為參考文段;其中,所述faiss?庫是?facebook?ai?所公開的一種為大規(guī)模向量相似度搜索設計的庫;

8、記錄用戶查詢:將用戶查詢內(nèi)容存儲至消息列表中;具體包括通過?append()?函數(shù)將用戶填充至角色?role?元素中,將用戶查詢內(nèi)容填充至對話內(nèi)容元素中?content;

9、輸入格式調(diào)整與內(nèi)容增強:將用戶查詢內(nèi)容與參考文段動態(tài)轉(zhuǎn)換為大語言模型理解的輸入格式;具體包括為大語言模型制定?prompt?格式,將用戶查詢與帶有優(yōu)先級標簽的參考文段按層次填充至?prompt?格式中;

10、初步人物科普教育響應生成:基于調(diào)整后的輸入格式與消息列表,大語言模型生成初步響應,形成針對用戶人物咨詢的初步人物科普教育響應;

11、記錄大語言模型響應:將大語言模型生成的響應內(nèi)容存儲至消息列表中;具體包括通過?append()?函數(shù)將大語言模型填充至角色?role?元素中,將大語言模型生成的響應內(nèi)容填充至對話內(nèi)容元素中?content;

12、人物科普教育信息輸出:基于初步人物科普教育響應與用戶需求背景,大語言模型內(nèi)部進行自適應優(yōu)化,生成并展示符合用戶的意圖和語氣的人物科普教育信息;具體包括將初步人物科普教育響應與用戶的需求背景重新灌輸至大語言模型中,大語言模型內(nèi)部進行自適應優(yōu)化,生成并展示符合用戶的意圖和語氣的人物科普教育信息;對生成的回答內(nèi)容進行可視化展示,在可視化界面上突出人物的關鍵信息和教育性信息。

13、一種基于大語言模型的人物科普教育的聊天系統(tǒng),所述基于大語言模型的人物科普教育的聊天系統(tǒng)用于執(zhí)行上述的基于大語言模型的人物科普教育的聊天方法,所述系統(tǒng)包括:

14、微調(diào)模塊、消息列表維護模塊、意圖識別模塊、知識庫系統(tǒng)模塊、格式自適應轉(zhuǎn)換模塊和知識輸出模塊;

15、所述微調(diào)模塊實現(xiàn)對于大語言模型的垂直訓練,構建人物科普教育垂直大模型;所述消息列表維護模塊實時存儲、維護用戶與大語言模型間的對話歷史,為大語言模型實現(xiàn)多輪對話功能,增強上下文理解能力;所述意圖識別模塊實現(xiàn)用戶需求背景的識別,將需求背景灌輸至大語言模型中以增強響應的個性化生成;所述知識庫系統(tǒng)模塊實現(xiàn)人物信息的存儲與匹配,為大語言模型生成的人物科普教育信息的語義精準化提供支撐;所述格式自適應轉(zhuǎn)換模塊實現(xiàn)?prompt?格式的動態(tài)轉(zhuǎn)換,實現(xiàn)大語言模型對于用戶查詢、上下文關系與參考文段的精確化理解;所述知識輸出模塊基于大語言模型,實現(xiàn)人物科普教育信息的生成與可視化。

16、進一步,所述微調(diào)模塊,具體包括數(shù)據(jù)收集和預處理階段以及指令微調(diào)階段;

17、所述數(shù)據(jù)收集和預處理階段,具體包括從公開數(shù)據(jù)獲取大量人物信息,并對該信息進行數(shù)據(jù)清洗,包括去除重復、無效信息、糾正錯誤的文字、人工標注以及格式標準化,以構建一個優(yōu)質(zhì)人物科普教育知識庫;所述公開數(shù)據(jù)來源于權威出版物、學術論文、官方記錄以及公開在線人物傳記資料庫,保證數(shù)據(jù)的可信度和權威性;所述優(yōu)質(zhì)人物科普教育知識庫,具體指存儲經(jīng)過數(shù)據(jù)處理工作后的人物信息的知識庫,用于提升大語言模型對于人物科普教育的響應準確度;

18、所述指令微調(diào)階段,具體包括將所構建好的優(yōu)質(zhì)人物科普教育知識庫根據(jù)科普教育指令格式對其進行整理和重組,形成用于人物科普教育數(shù)據(jù)領域微調(diào)的指令數(shù)據(jù)集;基于所述指令數(shù)據(jù)集,采用?lora?方法對大語言模型進行人物科普教育垂直領域指令微調(diào);所述?lora?方法,具體指一種在保證模型整體參數(shù)量不變的前提下通過引入低秩矩陣調(diào)整預訓練大語言模型內(nèi)部權重的方法;所述科普教育指令格式,具體指一種包含任務描述、目標人物查詢輸入以及目標人物科普教育信息輸出的指令格式。

19、進一步,所述消息列表維護模塊,具體包括構建消息列表階段與動態(tài)維護消息列表階段;

20、所述構建消息列表階段,具體包括為用戶構建消息列表,該列表記錄用戶的對話歷史,保存每輪對話中用戶的查詢內(nèi)容與大語言模型生成的響應;

21、所述動態(tài)維護消息列表階段,具體包括精簡每輪更新時消息列表的更新內(nèi)容,僅記錄每輪對話中的用戶原始查詢內(nèi)容和大語言模型的響應內(nèi)容,而最新用戶查詢則在實際使用時動態(tài)轉(zhuǎn)換為?prompt?格式;設置最大歷史長度標簽,及時清理超過所述最大歷史長度的對話歷史。

22、進一步,所述意圖識別模塊,具體包括基于用戶輸入,使用自然語言處理技術,對用戶輸入內(nèi)容進行語句結構分析,提取關鍵信息包括人名、成就,以識別用戶的需求背景。

23、進一步,所述知識庫系統(tǒng)模塊,具體包括向量數(shù)據(jù)庫構建階段以及向量搜索引擎建立階段;

24、所述向量數(shù)據(jù)庫構建階段,具體包括對人物科普教育知識庫中文本進行分割,文本分割通過遞歸字符文本分割器?rcts?完成,使用多種字符來確保文本在分割時的連貫性;將分割后的文本片段轉(zhuǎn)換為向量格式,通過?mistralai?embeddings?嵌入模型生成相同維度的嵌入向量,使用?faiss?庫將所述嵌入向量集中存儲,形成向量數(shù)據(jù)庫;向量數(shù)據(jù)庫被保存在本地存儲器中,支持快速加載和響應用戶查詢;

25、所述向量搜索引擎建立階段,具體包括使用?faiss?庫構建相似度計算函數(shù),實現(xiàn)向量相似度計算任務,通過余弦相似度計算方法計算用戶查詢向量與向量數(shù)據(jù)庫中各文段向量間的相似度,選出?top_k?個相似度最高的文段并根據(jù)相似度高低設置優(yōu)先級標簽,作為大語言模型生成響應時的參考語料庫。

26、進一步,所述格式自適應轉(zhuǎn)換模塊,具體包括針對人物科普教育的?prompt?格式以及?prompt?動態(tài)填充;

27、所述?prompt?為高級提示詞工程中的?chain-of-thought?prompt,以思維鏈的方式組合用戶的查詢內(nèi)容、相關上下文內(nèi)容和人物科普教育規(guī)則,將用戶輸入與參考文段轉(zhuǎn)換為大語言模型理解的輸入格式;

28、所述?prompt?動態(tài)填充,具體包括通過知識庫系統(tǒng)模塊中所述向量搜索引擎將用戶查詢與向量數(shù)據(jù)庫中文段進行向量相似度計算,選出參考文段,將用戶查詢與參考文檔動態(tài)填入?prompt?格式中對應位置。

29、進一步,所述知識輸出模塊,具體包括初步響應生成階段、自適應優(yōu)化響應階段和可視化界面展示階段;

30、所述初步響應生成階段,具體包括以消息列表和調(diào)整后的輸入格式為輸入內(nèi)容,輸入至大語言模型中生成初步人物科普教育響應;

31、所述自適應優(yōu)化響應階段,具體包括將意圖識別模塊所得用戶的需求背景同初步人物科普教育響應共同灌輸至大語言模型,大語言模型內(nèi)部針對用戶的需求背景與參考文段調(diào)節(jié)、優(yōu)化初步人物科普教育響應,生成符合用戶的意圖和語氣的人物科普教育信息;

32、所述可視化界面展示階段,具體包括使用?html?搭建一個?web?頁面,該頁面對生成的人物科普教育信息進行可視化展示,使用?css?在該頁面上突出人物的關鍵信息和教育性信息。

33、一種基于大語言模型的人物科普教育的聊天機器人,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述的聊天方法的步驟。

34、本發(fā)明與現(xiàn)有技術相比,具有為基于大語言模型的人物科普教育信息自適應、動態(tài)智能生成提供了一種新的解決方案;其中,聊天方法將用戶查詢到人物科普教育信息的生成流程化,實現(xiàn)大語言模型的語義精準化和響應個性化,為用戶提供了精準詳細和符合用戶需求背景的人物科普教育信息;多模塊化系統(tǒng)架構具有極高可延展性,各模塊為聊天方法提供技術支撐,模塊內(nèi)部使用高效、先進的技術方案實現(xiàn)各模塊的功能,大大提升了人物科普教育信息的質(zhì)量。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阆中市| 吉安市| 八宿县| 赤城县| 航空| 利川市| 三河市| 台湾省| 伊川县| 辽阳市| 临汾市| 剑河县| 岳西县| 栾川县| 普定县| 福州市| 陇川县| 扶余县| 子洲县| 泰顺县| 宜宾县| 会宁县| 古田县| 黎平县| 宁都县| 公主岭市| 龙里县| 长沙市| 靖远县| 兴仁县| 博湖县| 洱源县| 延安市| 夏邑县| 元朗区| 顺平县| 壶关县| 台南市| 沂南县| 白山市| 贵德县|