1.一種大模型推理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的大模型推理方法,其特征在于,所述對(duì)預(yù)訓(xùn)練的目標(biāo)大模型進(jìn)行分割,得到所述目標(biāo)大模型對(duì)應(yīng)的輸入層、中間層、以及輸出層,包括:
3.根據(jù)權(quán)利要求2所述的大模型推理方法,其特征在于,所述將所述輸入層與所述輸出層均部署在客戶端,將所述中間層部署在服務(wù)端,包括:
4.根據(jù)權(quán)利要求3所述的大模型推理方法,其特征在于,所述接收目標(biāo)用戶在所述客戶端輸入的prompt,并通過所述輸入層對(duì)所述prompt進(jìn)行編碼,得到對(duì)應(yīng)的數(shù)值向量,包括:
5.根據(jù)權(quán)利要求4所述的大模型推理方法,其特征在于,所述將所述數(shù)值向量上傳至所述服務(wù)端,并通過所述中間層對(duì)所述數(shù)值向量進(jìn)行推理,得到對(duì)應(yīng)的結(jié)果向量,包括:
6.根據(jù)權(quán)利要求5所述的大模型推理方法,其特征在于,所述將所述結(jié)果向量返回至所述客戶端,并通過所述輸出層對(duì)所述結(jié)果向量進(jìn)行解碼,得到對(duì)應(yīng)的結(jié)果文本,包括:
7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的大模型推理方法,其特征在于,所述對(duì)預(yù)訓(xùn)練的目標(biāo)大模型進(jìn)行分割,得到所述目標(biāo)大模型對(duì)應(yīng)的輸入層、中間層、以及輸出層,其中,
8.一種大模型推理系統(tǒng),其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括至少一個(gè)處理器;以及,
10.一種非易失性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述非易失性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被至少一個(gè)處理器執(zhí)行時(shí),可實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的大模型推理方法。