欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種大模型管理方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40653912發(fā)布日期:2025-01-10 19:02閱讀:4來源:國知局
一種大模型管理方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)與流程

本公開涉及人工智能,尤其涉及文本處理、大語言模型。


背景技術(shù):

1、大語言模型(large?language?model,llm)是使用大量自然語言文本對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練得到的,能夠理解輸入的自然語言文本的含義,還能生成自然語言文本。大語言模型可廣泛應(yīng)用于問答、對(duì)話或者文本分類等人工智能領(lǐng)域。


技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種大模型管理方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)。

2、本公開實(shí)施例的第一方面,提供了一種大模型管理方法,包括:

3、獲取大語言模型在預(yù)設(shè)時(shí)間段內(nèi),處理預(yù)設(shè)種類的目標(biāo)問題實(shí)際消耗的第一資源量;

4、確定訓(xùn)練預(yù)設(shè)小模型預(yù)計(jì)消耗的第二資源量,以及所述預(yù)設(shè)小模型在所述預(yù)設(shè)時(shí)間段內(nèi)處理所述目標(biāo)問題預(yù)計(jì)消耗的第三資源量,所述第三資源量小于所述第一資源量;

5、基于所述第一資源量、所述第二資源量和所述第三資源量,確定是否滿足預(yù)設(shè)的小模型訓(xùn)練條件;

6、若是,則確定訓(xùn)練所述預(yù)設(shè)小模型,其中,訓(xùn)練后的預(yù)設(shè)小模型用于處理所述預(yù)設(shè)種類的問題。

7、本公開實(shí)施例的第二方面,提供了一種大模型管理裝置,包括:

8、獲取模塊,用于獲取大語言模型在預(yù)設(shè)時(shí)間段內(nèi),處理預(yù)設(shè)種類的目標(biāo)問題實(shí)際消耗的第一資源量;

9、確定模塊,還用于確定訓(xùn)練預(yù)設(shè)小模型預(yù)計(jì)消耗的第二資源量,以及所述預(yù)設(shè)小模型在所述預(yù)設(shè)時(shí)間段內(nèi)處理所述目標(biāo)問題預(yù)計(jì)消耗的第三資源量,所述第三資源量小于所述第一資源量;

10、判斷模塊,用于基于所述第一資源量、所述第二資源量和所述第三資源量,確定是否滿足預(yù)設(shè)的小模型訓(xùn)練條件;

11、所述確定模塊,還用于若所述判斷模塊的判斷結(jié)果為是,則確定訓(xùn)練所述預(yù)設(shè)小模型,其中,訓(xùn)練后的預(yù)設(shè)小模型用于處理所述預(yù)設(shè)種類的問題。

12、本公開實(shí)施例的第三方面,提供了一種電子設(shè)備,包括:

13、至少一個(gè)處理器;以及

14、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,

15、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行第一方面中任一項(xiàng)所述的方法。

16、本公開實(shí)施例的第四方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)第一方面中任一項(xiàng)所述的方法。

17、本公開實(shí)施例的第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)第一方面中任一項(xiàng)所述的方法。

18、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。



技術(shù)特征:

1.一種大模型管理方法,包括:

2.根據(jù)權(quán)利要求1所述的方法,在所述獲取大語言模型在預(yù)設(shè)時(shí)間段內(nèi),處理預(yù)設(shè)種類的目標(biāo)問題實(shí)際消耗的第一資源量之前,還包括:

3.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取大語言模型在預(yù)設(shè)時(shí)間段內(nèi),處理預(yù)設(shè)種類的目標(biāo)問題實(shí)際消耗的第一資源量,包括:

4.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取大語言模型在預(yù)設(shè)時(shí)間段內(nèi),處理預(yù)設(shè)種類的目標(biāo)問題實(shí)際消耗的第一資源量,包括:

5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其中,所述基于所述第一資源量、所述第二資源量和所述第三資源量,確定是否滿足預(yù)設(shè)的小模型訓(xùn)練條件,包括:

6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,在所述確定訓(xùn)練所述預(yù)設(shè)小模型之后,還包括:

7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的方法,在所述確定訓(xùn)練所述預(yù)設(shè)小模型之后,還包括:

8.根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,在所述確定訓(xùn)練所述預(yù)設(shè)小模型之后,還包括:

9.根據(jù)權(quán)利要求8所述的方法,其中,所述根據(jù)所述第一資源量和所述第三資源量,確定副本縮減數(shù)量,包括:

10.根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,在所述確定訓(xùn)練所述預(yù)設(shè)小模型之后,還包括:

11.一種大模型管理裝置,包括:

12.一種電子設(shè)備,包括:

13.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1-10中任一項(xiàng)所述的方法。

14.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1-10中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本公開提供了一種大模型管理方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì),涉及醫(yī)學(xué)、法律、科技、金融等領(lǐng)域,尤其涉及人工智能、智能客服、文本翻譯、內(nèi)容創(chuàng)作、決策支持、文本處理、大語言模型技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為:獲取大語言模型在預(yù)設(shè)時(shí)間段內(nèi),處理預(yù)設(shè)種類的目標(biāo)問題實(shí)際消耗的第一資源量。并確定訓(xùn)練預(yù)設(shè)小模型預(yù)計(jì)消耗的第二資源量,以及預(yù)設(shè)小模型在預(yù)設(shè)時(shí)間段內(nèi)處理目標(biāo)問題預(yù)計(jì)消耗的第三資源量,其中第三資源量小于第一資源量。然后基于第一資源量、第二資源量和第三資源量,確定是否滿足預(yù)設(shè)的小模型訓(xùn)練條件。若是,則確定訓(xùn)練預(yù)設(shè)小模型,其中訓(xùn)練后的預(yù)設(shè)小模型用于處理預(yù)設(shè)種類的問題。減少了基于大語言模型提供的服務(wù)消耗的資源。

技術(shù)研發(fā)人員:閆光遠(yuǎn)
受保護(hù)的技術(shù)使用者:北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
山阴县| 博野县| 临泉县| 阿拉善右旗| 宝清县| 武陟县| 蒙山县| 东宁县| 西吉县| 夏河县| 镇巴县| 游戏| 棋牌| 米林县| 枣阳市| 新竹市| 常州市| 南乐县| 云林县| 张家口市| 江陵县| 宝丰县| 邵东县| 靖远县| 朔州市| 青浦区| 红河县| 江城| 苏州市| 安平县| 滦南县| 民丰县| 东源县| 成武县| 绥中县| 衡南县| 灵石县| 岢岚县| 阳江市| 洛川县| 莫力|