本公開涉及人工智能,尤其涉及深度學(xué)習(xí)、大模型與生成式模型,可應(yīng)用于模型訓(xùn)練、模型微調(diào)等場景,具體涉及一種基于大模型的文本處理方法、裝置、設(shè)備、介質(zhì)、程序產(chǎn)品及智能體。
背景技術(shù):
1、隨著人工智能技術(shù)的發(fā)展,數(shù)據(jù)集成為模型能夠進(jìn)行有效學(xué)習(xí)的基礎(chǔ)。可以基于數(shù)據(jù)集對模型進(jìn)行訓(xùn)練或微調(diào),以提高模型的性能或使模型適用于特定場景。
技術(shù)實現(xiàn)思路
1、本公開提供了一種基于大模型的文本處理方法、裝置、設(shè)備、介質(zhì)、程序產(chǎn)品及智能體。
2、根據(jù)本公開的一方面,提供了一種文本處理方法,包括:響應(yīng)于數(shù)據(jù)評估請求,利用大模型處理初始文本集和基于預(yù)設(shè)標(biāo)簽體系確定的提示詞,得到與初始文本集相關(guān)的標(biāo)簽,預(yù)設(shè)標(biāo)簽體系包括多個預(yù)設(shè)標(biāo)簽和多個預(yù)設(shè)標(biāo)簽之間的屬性關(guān)系,預(yù)設(shè)標(biāo)簽體系是基于大模型處理歷史文本集確定的;基于標(biāo)簽對初始文本集進(jìn)行屬性檢測,得到屬性評估信息,屬性評估信息表征基于初始文本集執(zhí)行指定的大模型訓(xùn)練任務(wù)的預(yù)期訓(xùn)練效果。
3、根據(jù)本公開的另一方面,提供了一種人工智能的智能體,被配置為執(zhí)行根據(jù)本公開實施例提供的方法。
4、根據(jù)本公開的另一方面,提供了一種文本處理裝置,包括:確定模塊,用于響應(yīng)于數(shù)據(jù)評估請求,利用大模型處理初始文本集和基于預(yù)設(shè)標(biāo)簽體系確定的提示詞,得到與初始文本集相關(guān)的標(biāo)簽,預(yù)設(shè)標(biāo)簽體系包括多個預(yù)設(shè)標(biāo)簽和多個預(yù)設(shè)標(biāo)簽之間的屬性關(guān)系,預(yù)設(shè)標(biāo)簽體系是基于大模型處理歷史文本集確定的;檢測模塊,用于基于標(biāo)簽對初始文本集進(jìn)行屬性檢測,得到屬性評估信息,屬性評估信息表征基于初始文本集執(zhí)行指定的大模型訓(xùn)練任務(wù)的預(yù)期訓(xùn)練效果。
5、根據(jù)本公開的另一方面,提供了一種電子設(shè)備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行如上所述的方法。
6、根據(jù)本公開的另一方面,提供了一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì),其中,所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行如上所述的方法。
7、根據(jù)本公開的另一方面,提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,所述計算機(jī)程序在被處理器執(zhí)行時實現(xiàn)如上所述的方法。
8、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種基于大模型的文本處理方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述基于所述標(biāo)簽對所述初始文本集進(jìn)行屬性檢測,得到屬性評估信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述初始文本集與多個所述標(biāo)簽相關(guān)聯(lián);
4.根據(jù)權(quán)利要求2所述的方法,其中,所述確定所述標(biāo)簽的任務(wù)復(fù)雜度信息包括:
5.根據(jù)權(quán)利要求1所述的方法,所述初始文本集包括多個初始文本,至少一個所述初始文本與n個所述標(biāo)簽中的m個文本標(biāo)簽相關(guān)聯(lián),n≥m>1,且n和m為整數(shù);
6.根據(jù)權(quán)利要求5所述的方法,其中,所述基于所述目標(biāo)文本,確定所述初始文本集的多樣性信息包括:
7.根據(jù)權(quán)利要求1所述的方法,還包括:
8.一種人工智能的智能體,被配置為執(zhí)行根據(jù)權(quán)利要求1-7中任一項所述的方法。
9.一種基于大模型的文本處理裝置,包括:
10.根據(jù)權(quán)利要求9所述的裝置,其中,所述檢測模塊包括:
11.根據(jù)權(quán)利要求10所述的裝置,其中,所述初始文本集與多個所述標(biāo)簽相關(guān)聯(lián);
12.根據(jù)權(quán)利要求10所述的裝置,其中,所述第一確定子模塊包括:
13.根據(jù)權(quán)利要求9所述的裝置,所述初始文本集包括多個初始文本,至少一個所述初始文本與n個所述標(biāo)簽中的m個文本標(biāo)簽相關(guān)聯(lián),n≥m>1,且n和m為整數(shù);
14.根據(jù)權(quán)利要求13所述的裝置,其中,所述第四確定子模塊包括:
15.根據(jù)權(quán)利要求9所述的裝置,還包括:
16.一種電子設(shè)備,包括:
17.一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì),其中,所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行根據(jù)權(quán)利要求1-7中任一項所述的方法。
18.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,所述計算機(jī)程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1-7中任一項所述的方法。