1.一種推理方法,其特征在于,應(yīng)用于推理設(shè)備,包括:
2.根據(jù)權(quán)利要求1所述的推理方法,其特征在于,在檢查每一token序列的節(jié)點(diǎn)上的token與所述llm根據(jù)所述prompt生成的原始輸出的匹配情況的過程中,優(yōu)先選擇token的置信度更高的子節(jié)點(diǎn)。
3.一種推理方法,其特征在于,應(yīng)用于推理設(shè)備,包括:
4.根據(jù)權(quán)利要求3所述的推理方法,其特征在于,在檢查每一token序列的節(jié)點(diǎn)上的token與所述llm根據(jù)所述prompt生成的原始輸出的匹配情況的過程中,任一節(jié)點(diǎn)上的token的置信度不大于第二置信度閾值時(shí),停止對(duì)所述任一節(jié)點(diǎn)所在的token序列的檢查。
5.一種推理裝置,其特征在于,應(yīng)用于推理設(shè)備,包括:
6.根據(jù)權(quán)利要求5所述的推理裝置,其特征在于,所述檢查與生成模塊,還用于在檢查每一token序列的節(jié)點(diǎn)上的token與所述llm根據(jù)所述prompt生成的原始輸出的匹配情況的過程中,優(yōu)先選擇token的置信度更高的子節(jié)點(diǎn)。
7.一種推理裝置,其特征在于,應(yīng)用于推理設(shè)備,包括:
8.一種電子設(shè)備,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1~4中任意一項(xiàng)所述的推理方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1~4中任意一項(xiàng)所述的推理方法。