大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)與流程

文檔序號：40651699發(fā)布日期：2025-01-10 18:58閱讀：3來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)與流程

本公開涉及人工智能，尤其涉及大模型和深度學(xué)習(xí)等，更具體地，涉及一種大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)。

背景技術(shù)：

1、隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展，大語言模型(large?language?model，llm)應(yīng)運(yùn)而生。大語言模型是基于深度學(xué)習(xí)的人工智能模型，主要用于處理和生成自然語言。該類模型通過大量的數(shù)據(jù)進(jìn)行訓(xùn)練，能夠理解、生成和翻譯文本。

技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)。

2、根據(jù)本公開的一個方面，提供了一種大模型的評估方法，包括：針對m個大語言模型各自對于輸入指令的響應(yīng)信息，基于預(yù)設(shè)評估規(guī)則，對每個上述響應(yīng)信息分別進(jìn)行評估，得到每個上述響應(yīng)信息各自的第一評估信息，m為大于1的正整數(shù)；響應(yīng)于上述m個大語言模型各自的第一評估信息彼此一致，基于多個評估維度，對每個上述響應(yīng)信息分別進(jìn)行評估，得到每個上述響應(yīng)信息各自的第二評估信息；以及，根據(jù)每個上述響應(yīng)信息各自的第二評估信息，確定評估結(jié)果，其中，上述評估結(jié)果表征了上述m個大語言模型各自的響應(yīng)能力。

3、根據(jù)本公開的另一個方面，提供了一種大模型的評估裝置，包括：第一評估模塊，用于針對m個大語言模型各自對于輸入指令的響應(yīng)信息，基于預(yù)設(shè)評估規(guī)則，對每個上述響應(yīng)信息分別進(jìn)行評估，得到每個上述響應(yīng)信息各自的第一評估信息，m為大于1的正整數(shù)；第二評估模塊，用于響應(yīng)于上述m個大語言模型各自的第一評估信息彼此一致，基于多個評估維度，對每個上述響應(yīng)信息分別進(jìn)行評估，得到每個上述響應(yīng)信息各自的第二評估信息；以及，確定模塊，用于根據(jù)每個上述響應(yīng)信息各自的第二評估信息，確定評估結(jié)果，其中，上述評估結(jié)果表征了上述m個大語言模型各自的響應(yīng)能力。

4、根據(jù)本公開的另一方面，提供了一種電子設(shè)備，包括：一個或多個處理器；存儲器，用于存儲一個或多個計算機(jī)程序，其中，上述一個或多個處理器執(zhí)行上述一個或多個計算機(jī)程序以實(shí)現(xiàn)上述方法的步驟。

5、根據(jù)本公開的另一方面，提供了一種計算機(jī)可讀存儲介質(zhì)，其上存儲有計算機(jī)程序或指令，上述計算機(jī)程序或指令被處理器執(zhí)行時實(shí)現(xiàn)上述方法的步驟。

6、根據(jù)本公開的另一方面，提供了一種計算機(jī)程序產(chǎn)品，包括計算機(jī)程序或指令，上述計算機(jī)程序或指令被處理器執(zhí)行時實(shí)現(xiàn)上述方法的步驟。

7、應(yīng)當(dāng)理解，本部分所描述的內(nèi)容并非旨在標(biāo)識本公開的實(shí)施例的關(guān)鍵或重要特征，也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。

技術(shù)特征：

1.一種大模型的評估方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中，每個所述大語言模型各自具有提示信息，所述提示信息用于指導(dǎo)所述大語言模型對所述輸入指令進(jìn)行響應(yīng)；

3.根據(jù)權(quán)利要求2所述的方法，其中，所述基于預(yù)設(shè)評估規(guī)則，對每個所述響應(yīng)信息分別進(jìn)行評估，得到每個所述響應(yīng)信息各自的第一評估信息包括：

4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法，其中，所述基于多個評估維度，對每個所述響應(yīng)信息分別進(jìn)行評估，得到每個所述響應(yīng)信息各自的第二評估信息包括：

5.根據(jù)權(quán)利要求4所述的方法，其中，每個所述評估維度各自的提示信息包括以下至少之一：人設(shè)定制信息、角色定制信息、能力定制信息和風(fēng)格定制信息。

6.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法，其中，所述根據(jù)每個所述響應(yīng)信息各自的第二評估信息，確定評估結(jié)果包括：

7.根據(jù)權(quán)利要求1所述的方法，還包括：

8.根據(jù)權(quán)利要求1所述的方法，還包括：

9.一種大模型的評估裝置，包括：

10.根據(jù)權(quán)利要求9所述的裝置，其中，每個所述大語言模型各自具有提示信息，所述提示信息用于指導(dǎo)所述大語言模型對所述輸入指令進(jìn)行響應(yīng)；

11.根據(jù)權(quán)利要求10所述的裝置，其中，所述第一評估模塊包括：

12.根據(jù)權(quán)利要求9至11中任一項(xiàng)所述的裝置，其中，所述第二評估模塊包括：

13.根據(jù)權(quán)利要求12所述的裝置，其中，每個所述評估維度各自的提示信息包括以下至少之一：人設(shè)定制信息、角色定制信息、能力定制信息和風(fēng)格定制信息。

14.根據(jù)權(quán)利要求9至11中任一項(xiàng)所述的裝置，其中，所述確定模塊包括：

15.根據(jù)權(quán)利要求9所述的裝置，還包括：

16.根據(jù)權(quán)利要求8所述的裝置，還包括：

17.一種電子設(shè)備，包括：

18.一種計算機(jī)可讀存儲介質(zhì)，其上存儲有計算機(jī)程序或指令，其特征在于，所述計算機(jī)程序或指令被處理器執(zhí)行時實(shí)現(xiàn)根據(jù)權(quán)利要求1～8中任一項(xiàng)所述方法的步驟。

19.一種計算機(jī)程序產(chǎn)品，包括計算機(jī)程序或指令，其特征在于，所述計算機(jī)程序或指令被處理器執(zhí)行時實(shí)現(xiàn)根據(jù)權(quán)利要求1～8中任一項(xiàng)所述方法的步驟。

技術(shù)總結(jié)
本公開提供了一種大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)，涉及人工智能技術(shù)領(lǐng)域，尤其涉及大模型和深度學(xué)習(xí)等技術(shù)領(lǐng)域。該大模型的評估方法包括：針對M個大語言模型各自對于輸入指令的響應(yīng)信息，基于預(yù)設(shè)評估規(guī)則，對每個響應(yīng)信息分別進(jìn)行評估，得到每個響應(yīng)信息各自的第一評估信息，M為大于1的正整數(shù)；響應(yīng)于M個大語言模型各自的第一評估信息彼此一致，基于多個評估維度，對每個響應(yīng)信息分別進(jìn)行評估，得到每個響應(yīng)信息各自的第二評估信息；以及，根據(jù)每個響應(yīng)信息各自的第二評估信息，確定評估結(jié)果，其中，評估結(jié)果表征了M個大語言模型各自的響應(yīng)能力。

技術(shù)研發(fā)人員：陸華,范世龍,雷澤陽,陳炳金,鮑思琪,吳華
受保護(hù)的技術(shù)使用者：北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陸華,范世龍,雷澤陽,陳炳金,鮑思琪,吳華
技術(shù)所有人：北京百度網(wǎng)訊科技有限公司
我是此專利的發(fā)明人

上一篇：一種卸紗機(jī)械手自動抓紗機(jī)構(gòu)的制作方法
上一篇：一種鋁模板上料夾持旋轉(zhuǎn)裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)與流程

大模型的評估方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)與流程