_{<progress id="yfiju"><menu id="yfiju"></menu></progress>}

一種大模型推理加速方法、設(shè)備及介質(zhì)與流程

文檔序號(hào)：40531263發(fā)布日期：2024-12-31 13:45閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種大模型推理加速方法、設(shè)備及介質(zhì)與流程

技術(shù)特征：

1.一種大模型推理加速方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的一種大模型推理加速方法，其特征在于，基于所述輸入矩陣對(duì)所述線性層對(duì)應(yīng)的權(quán)重進(jìn)行量化，得到量化后的模型權(quán)重，具體包括：

3.根據(jù)權(quán)利要求2所述的一種大模型推理加速方法，其特征在于，根據(jù)所述重要性，確定所述權(quán)重矩陣對(duì)應(yīng)的縮放系數(shù)集合，具體包括：

4.根據(jù)權(quán)利要求2所述的一種大模型推理加速方法，其特征在于，通過(guò)預(yù)設(shè)的minmax算法，對(duì)所述線性層進(jìn)行量化，得到量化后的模型權(quán)重，具體包括：

5.根據(jù)權(quán)利要求4所述的一種大模型推理加速方法，其特征在于，基于不同的量化方式，分別確定所述線性層對(duì)應(yīng)的縮放因子，具體包括：

6.根據(jù)權(quán)利要求1所述的一種大模型推理加速方法，其特征在于，分別通過(guò)所述訓(xùn)練集和所述測(cè)試集對(duì)所述目標(biāo)大模型進(jìn)行訓(xùn)練和評(píng)估，具體包括：

7.根據(jù)權(quán)利要求1所述的一種大模型推理加速方法，其特征在于，對(duì)所述大模型中的預(yù)測(cè)頭進(jìn)行擴(kuò)展，得到擴(kuò)展后的目標(biāo)大模型，具體包括：

8.根據(jù)權(quán)利要求1所述的一種大模型推理加速方法，其特征在于，基于大模型的模型優(yōu)化方式，采集所述大模型對(duì)應(yīng)的場(chǎng)景數(shù)據(jù)，具體包括：

9.一種大模型推理加速設(shè)備，其特征在于，所述設(shè)備包括：

10.一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)，存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令，其特征在于，所述計(jì)算機(jī)可執(zhí)行指令設(shè)置為：

技術(shù)總結(jié)
本申請(qǐng)公開(kāi)了一種大模型推理加速方法、設(shè)備及介質(zhì)，方法包括：根據(jù)場(chǎng)景數(shù)據(jù)，構(gòu)建用于訓(xùn)練大模型的訓(xùn)練集和測(cè)試集；對(duì)大模型中的預(yù)測(cè)頭進(jìn)行擴(kuò)展，得到擴(kuò)展后的目標(biāo)大模型，并對(duì)大模型中的原始預(yù)測(cè)頭參數(shù)進(jìn)行凍結(jié)，以在目標(biāo)大模型的訓(xùn)練過(guò)程中，對(duì)擴(kuò)展的預(yù)測(cè)頭對(duì)應(yīng)的預(yù)測(cè)頭參數(shù)進(jìn)行更新；分別通過(guò)訓(xùn)練集和測(cè)試集對(duì)目標(biāo)大模型進(jìn)行訓(xùn)練和評(píng)估，以得到訓(xùn)練完成的目標(biāo)大模型；構(gòu)建由部分場(chǎng)景數(shù)據(jù)構(gòu)成的校準(zhǔn)數(shù)據(jù)集，將校準(zhǔn)數(shù)據(jù)集輸入到目標(biāo)大模型中進(jìn)行前向推理，得到各線性層對(duì)應(yīng)的校準(zhǔn)矩陣；根據(jù)校準(zhǔn)矩陣，確定線性層對(duì)應(yīng)的輸入矩陣和輸出矩陣，并基于輸入矩陣對(duì)線性層對(duì)應(yīng)的權(quán)重進(jìn)行量化，得到量化后的模型權(quán)重。

技術(shù)研發(fā)人員：葛君正,陳其賓,姜?jiǎng)P,李銳
受保護(hù)的技術(shù)使用者：山東浪潮科學(xué)研究院有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/30

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種大模型推理加速方法、設(shè)備及介質(zhì)與流程

一種大模型推理加速方法、設(shè)備及介質(zhì)與流程