一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法和系統(tǒng)與流程

文檔序號：40656353發(fā)布日期：2025-01-10 19:08閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法和系統(tǒng)與流程

本發(fā)明涉及計算機(jī)，尤其涉及一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法和系統(tǒng)。

背景技術(shù)：

1、大型語言模型(llm，large?language?model，其本質(zhì)是生成式模型)，如chatgpt(chat?generative?pre-trained?transformer，是openai機(jī)構(gòu)研發(fā)的聊天機(jī)器人程序)，能夠為許多下游任務(wù)(例如面向任務(wù)的對話和問題解答)生成類似人類的流暢響應(yīng)。然而，將llm應(yīng)用于現(xiàn)實世界中的任務(wù)解決型應(yīng)用仍然具有挑戰(zhàn)性，主要原因是它們可能會產(chǎn)生與實際不符的回復(fù)，以及無法使用外部知識作為參考進(jìn)行回復(fù)的生成。例如，對于“a市現(xiàn)在天氣如何”、“b貨幣兌c貨幣匯率”以及“從c位置到d位置需要多久”等問題，在回答時都需要實時的信息，而這些實時信息(例如實時時間、實時匯率、實時路況和實時交通信息等)根本無法單純依靠llm參數(shù)中蘊(yùn)含的知識來生成，均需要依賴于外部的知識才能生成出準(zhǔn)確的結(jié)果。

2、還有大語言模型存在幻覺問題，如在學(xué)術(shù)領(lǐng)域?qū)τ诨卮鸬臏?zhǔn)確性要求更高，并且希望回答的內(nèi)容可以找到相關(guān)引用信息，而目前的大語言模型甚至可能會編造一些引用信息，無法適用于學(xué)術(shù)領(lǐng)域的問答。

技術(shù)實現(xiàn)思路

1、針對現(xiàn)有技術(shù)的不足，本發(fā)明提出一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法和系統(tǒng)。

2、本發(fā)明的目的通過如下的技術(shù)方案來實現(xiàn)：一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法，包括：

3、將輸入問題通過評判模型判斷是否需要進(jìn)行檢索；

4、若不需要進(jìn)行檢索，則大語言模型直接根據(jù)輸入問題生成答案；

5、若需要進(jìn)行檢索，則判斷輸入問題是否存在緩存數(shù)據(jù)庫中；

6、若存在緩存數(shù)據(jù)庫中，通過在向量空間中計算相似度距離來搜索與輸入問題相關(guān)的緩存問題和/或信息片段；

7、若不存在緩存數(shù)據(jù)庫中，則進(jìn)行網(wǎng)絡(luò)搜索；

8、將緩存數(shù)據(jù)庫搜索得到的信息片段或網(wǎng)絡(luò)搜索得到的信息片段，根據(jù)與輸入問題的關(guān)聯(lián)性進(jìn)行重排序，選取排序在前n個的信息片段；

9、將輸入問題和選取的信息片段輸入到大語言模型，生成答案。

10、進(jìn)一步地，所述網(wǎng)絡(luò)搜索，包括：

11、將輸入問題拆分為多個用于網(wǎng)絡(luò)搜索的子問題；對輸入問題和子問題進(jìn)行網(wǎng)絡(luò)搜索。

12、進(jìn)一步地，通過子問題拆分模型將輸入問題拆分為多個用于網(wǎng)絡(luò)搜索的子問題；所述子問題拆分模型為一種大語言模型。

13、進(jìn)一步地，還包括：將輸入問題和網(wǎng)絡(luò)搜索得到的信息片段進(jìn)行向量化得到向量數(shù)據(jù)，將輸入問題和網(wǎng)絡(luò)搜索得到的信息片段及其對應(yīng)的向量數(shù)據(jù)加入緩存數(shù)據(jù)庫中。

14、進(jìn)一步地，通過重排序模型，將緩存數(shù)據(jù)庫搜索得到的信息片段或網(wǎng)絡(luò)搜索得到的信息片段，根據(jù)與輸入問題的關(guān)聯(lián)性進(jìn)行重排序。

15、進(jìn)一步地，所述重排序模型經(jīng)過如下訓(xùn)練：按學(xué)科均勻選取學(xué)術(shù)數(shù)據(jù)，根據(jù)學(xué)術(shù)數(shù)據(jù)生成問題，形成問題-答案對，即正樣本；根據(jù)生成的問題檢索獲取正樣本外最相關(guān)的文本集合作為負(fù)樣本；將正負(fù)樣本一起送入重排序模型進(jìn)行訓(xùn)練，其中，正樣本logits?score大于一個批次內(nèi)的負(fù)樣本。

16、進(jìn)一步地，所述將輸入問題和選取的信息片段輸入到大語言模型，生成答案，還包括：

17、將輸入問題、選取的信息片段和指令提示一起組裝成提示詞送給大語言模型，確保大語言模型根據(jù)當(dāng)前提供的信息并結(jié)合固有知識進(jìn)行回答。

18、本發(fā)明還提供了一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的系統(tǒng)，包括：

19、意圖理解模塊，用于將輸入問題通過評判模型判斷是否需要進(jìn)行檢索；若需要進(jìn)行檢索，則判斷輸入問題是否存在緩存數(shù)據(jù)庫中；

20、緩存查詢模塊，用于若存在緩存數(shù)據(jù)庫中，通過在向量空間中計算相似度距離來搜索與輸入問題相關(guān)的緩存問題和/或信息片段；

21、網(wǎng)絡(luò)搜索模塊，用于若不存在緩存數(shù)據(jù)庫中，則進(jìn)行網(wǎng)絡(luò)搜索；

22、重排序模塊，用于將緩存數(shù)據(jù)庫搜索得到的信息片段或網(wǎng)絡(luò)搜索得到的信息片段，根據(jù)與輸入問題的關(guān)聯(lián)性進(jìn)行重排序，選取排序在前n個的信息片段；

23、大語言模型生成模塊，用于若不需要進(jìn)行檢索，則大語言模型直接根據(jù)輸入問題生成答案；若需要進(jìn)行檢索，則將輸入問題和選取的信息片段輸入到大語言模型，生成答案。

24、本發(fā)明還提供了一種計算機(jī)設(shè)備，包括存儲器和處理器，存儲器中存儲有計算機(jī)程序，該處理器執(zhí)行計算機(jī)程序時實現(xiàn)上述的一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法。

25、本發(fā)明還提供了一種計算機(jī)可讀存儲介質(zhì)，其上存儲有計算機(jī)程序，所述程序被處理器執(zhí)行時實現(xiàn)上述的一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法。

26、本發(fā)明的有益效果如下：

27、傳統(tǒng)大語言模型通過使用網(wǎng)絡(luò)搜索相關(guān)內(nèi)容后向大語言模型提供相關(guān)資料，為大語言模型輸出提供更多信息，增強(qiáng)大模型回答的準(zhǔn)確性，及時性。同時，使用該方法可以降低成本，節(jié)省大模型預(yù)訓(xùn)練的龐大成本。該方法可以為大模型的輸出找到信息來源，有效減少大預(yù)言模型輸出“幻覺”的情況。最后，通過設(shè)計的緩存數(shù)據(jù)機(jī)制可顯著加速查詢響應(yīng)時間。

技術(shù)特征：

1.一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述網(wǎng)絡(luò)搜索，包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，通過子問題拆分模型將輸入問題拆分為多個用于網(wǎng)絡(luò)搜索的子問題；所述子問題拆分模型為一種大語言模型。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，還包括：將輸入問題和網(wǎng)絡(luò)搜索得到的信息片段進(jìn)行向量化得到向量數(shù)據(jù)，將輸入問題和網(wǎng)絡(luò)搜索得到的信息片段及其對應(yīng)的向量數(shù)據(jù)加入緩存數(shù)據(jù)庫中。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過重排序模型，將緩存數(shù)據(jù)庫搜索得到的信息片段或網(wǎng)絡(luò)搜索得到的信息片段，根據(jù)與輸入問題的關(guān)聯(lián)性進(jìn)行重排序。

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述重排序模型經(jīng)過如下訓(xùn)練：按學(xué)科均勻選取學(xué)術(shù)數(shù)據(jù)，根據(jù)學(xué)術(shù)數(shù)據(jù)生成問題，形成問題-答案對，即正樣本；根據(jù)生成的問題檢索獲取正樣本外最相關(guān)的文本集合作為負(fù)樣本；將正負(fù)樣本一起送入重排序模型進(jìn)行訓(xùn)練，其中，正樣本logits?score大于一個批次內(nèi)的負(fù)樣本。

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將輸入問題和選取的信息片段輸入到大語言模型，生成答案，還包括：

8.一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的系統(tǒng)，其特征在于，包括：

9.一種計算機(jī)設(shè)備，包括存儲器和處理器，存儲器中存儲有計算機(jī)程序，其特征在于，該處理器執(zhí)行計算機(jī)程序時實現(xiàn)權(quán)利要求1-7任一項所述的一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法。

10.一種計算機(jī)可讀存儲介質(zhì)，其上存儲有計算機(jī)程序，其特征在于，所述程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7中任一項所述的一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法。

技術(shù)總結(jié)
本發(fā)明公開了一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法和系統(tǒng)，該方法通過使用網(wǎng)絡(luò)搜索相關(guān)內(nèi)容后向大語言模型提供相關(guān)資料，為大語言模型輸出提供更多信息，增強(qiáng)大模型回答的準(zhǔn)確性，及時性。同時使用該方法可以節(jié)省大模型預(yù)訓(xùn)練的龐大成本。同時使用該方法可以降低成本，節(jié)省大模型預(yù)訓(xùn)練的龐大成本。該方法可以為大模型的輸出找到信息來源，有效減少大預(yù)言模型輸出“幻覺”的情況。最后，通過設(shè)計的緩存數(shù)據(jù)機(jī)制可顯著加速查詢響應(yīng)時間。

技術(shù)研發(fā)人員：黃飛,張瀧,陳紅陽
受保護(hù)的技術(shù)使用者：之江實驗室
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃飛,張瀧,陳紅陽
技術(shù)所有人：之江實驗室
我是此專利的發(fā)明人

上一篇：吡唑/胍型嵌合體炸藥及其制備方法與流程
上一篇：防偽瓶蓋及酒瓶的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種使用網(wǎng)絡(luò)搜索增強(qiáng)大語言模型生成的方法和系統(tǒng)與流程