1.一種文本分類方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓(xùn)練數(shù)據(jù)集中的每條文本數(shù)據(jù)是對所述原始文本、提示文本以及所述原始文本的類別標(biāo)簽進(jìn)行拼接得到的。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述提示文本包含提示詞,所述提示詞與所述目標(biāo)任務(wù)之間具有多對一或一對一關(guān)系。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述損失函數(shù)采用下述表達(dá)式表示:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始化文本分類模型選自:第二代gpt模型、第三代gpt模型、第四代gpt模型、bloom模型。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,將待分類文本輸入所述優(yōu)化文本分類模型,得到文本分類結(jié)果,包括:
7.根據(jù)權(quán)利要求1或6所述的方法,其特征在于,在得到文本分類結(jié)果之后,所述方法還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述至少基于第一類別標(biāo)簽集,對所述文本分類結(jié)果進(jìn)行糾正,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述方法還包括:
10.根據(jù)權(quán)利要求8或9所述的方法,其特征在于,所述第一預(yù)設(shè)數(shù)量是根據(jù)所述文本分類結(jié)果包含的字符總數(shù)量確定的,所述字符總數(shù)量越大,所述第一預(yù)設(shè)數(shù)量越大。
11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述至少基于第一類別標(biāo)簽集,對所述文本分類結(jié)果進(jìn)行糾正,包括:
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述方法還包括:
13.根據(jù)權(quán)利要求9或12所述的方法,其特征在于,所述基于所述文本分類結(jié)果的語義特征與第二類別標(biāo)簽集中的每個類別標(biāo)簽的語義特征之間的相似度,對所述文本分類結(jié)果進(jìn)行糾正,包括:
14.根據(jù)權(quán)利要求13所述的方法,其特征在于,所述根據(jù)所述相似度最大的類別標(biāo)簽,確定糾正后的文本分類結(jié)果,包括:
15.一種文本分類裝置,其特征在于,包括:
16.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器運行時執(zhí)行權(quán)利要求1至14任一項所述文本分類方法的步驟。
17.一種終端,包括存儲器和處理器,所述存儲器上存儲有能夠在所述處理器上運行的計算機(jī)程序,其特征在于,所述處理器運行所述計算機(jī)程序時執(zhí)行權(quán)利要求1至14任一項所述文本分類方法的步驟。