本申請(qǐng)實(shí)施例涉及但不限于金融科技,尤其涉及一種提示生成方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,科技的不斷進(jìn)步,人們的生活水平不斷提高;在金融行業(yè)中,已經(jīng)越來越多地利用智能問答系統(tǒng)來對(duì)用戶所提出的問題進(jìn)行回答處理;目前,智能問答系統(tǒng)通常基于通用語言模型來實(shí)現(xiàn),通用語言模型是一種能夠處理多種自然語言處理任務(wù)的大型神經(jīng)網(wǎng)絡(luò)模型;通用語言模型具有一定的少樣本能力,即使沒有針對(duì)特定任務(wù)的訓(xùn)練數(shù)據(jù),也能通過提示或示例來完成任務(wù);然而,少樣本性能受到示例質(zhì)量和數(shù)量的影響,容易產(chǎn)生錯(cuò)誤的輸出,進(jìn)而影響智能回答系統(tǒng)的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
1、以下是對(duì)本文詳細(xì)描述的主題的概述。本概述并非是為了限制權(quán)利要求的保護(hù)范圍。
2、為了解決上述背景技術(shù)中提到的問題,本申請(qǐng)實(shí)施例提供了一種提示生成方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠提升通用語言模型在零樣本和少樣本場(chǎng)景下的性能,使得輸出更加準(zhǔn)確,從而可以提高智能回答系統(tǒng)的準(zhǔn)確性,給用戶帶來了更加良好的使用體驗(yàn)。
3、第一方面,本申請(qǐng)實(shí)施例提供了一種提示生成方法,包括:
4、獲取無標(biāo)簽數(shù)據(jù)集和任務(wù)類型信息;
5、將所述無標(biāo)簽數(shù)據(jù)集輸入至預(yù)訓(xùn)練的通用語言模型進(jìn)行推理處理,得到候選響應(yīng)信息;
6、將所述無標(biāo)簽數(shù)據(jù)集與所述候選響應(yīng)信息進(jìn)行拼接處理,得到候選偽示例;
7、根據(jù)所述任務(wù)類型信息從預(yù)設(shè)的選擇器中選取目標(biāo)評(píng)分函數(shù);
8、根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例;
9、根據(jù)所述通用語言模型對(duì)所述目標(biāo)偽示例進(jìn)行預(yù)測(cè)處理,得到預(yù)測(cè)提示信息。
10、根據(jù)本申請(qǐng)的一些實(shí)施例,所述將所述無標(biāo)簽數(shù)據(jù)集輸入至預(yù)訓(xùn)練的通用語言模型進(jìn)行推理處理,得到候選響應(yīng)信息,包括:
11、對(duì)所述無標(biāo)簽數(shù)據(jù)集進(jìn)行預(yù)處理得到預(yù)處理數(shù)據(jù);
12、將所述預(yù)處理數(shù)據(jù)轉(zhuǎn)換為多維向量數(shù)據(jù);
13、將所述多維向量數(shù)據(jù)輸入至所述通用語言模型的自注意力機(jī)制網(wǎng)絡(luò)模型進(jìn)行并行化計(jì)算處理,得到所述候選響應(yīng)信息。
14、根據(jù)本申請(qǐng)的一些實(shí)施例,所述根據(jù)所述任務(wù)類型信息從預(yù)設(shè)的選擇器中選取目標(biāo)評(píng)分函數(shù),包括以下之一:
15、在所述任務(wù)類型信息為分類任務(wù)信息的情況下,將所述選擇器中的負(fù)熵評(píng)分函數(shù)確定為所述目標(biāo)評(píng)分函數(shù);
16、在所述任務(wù)類型信息為短文本生成任務(wù)信息的情況下,將所述選擇器中的一致性評(píng)分函數(shù)確定為所述目標(biāo)評(píng)分函數(shù);
17、在所述任務(wù)類型信息為長(zhǎng)文本生成任務(wù)信息的情況下,將所述選擇器中的雙語評(píng)估評(píng)分函數(shù)確定為所述目標(biāo)評(píng)分函數(shù)。
18、根據(jù)本申請(qǐng)的一些實(shí)施例,在所述目標(biāo)評(píng)分函數(shù)為所述負(fù)熵評(píng)分函數(shù)的情況下,所述根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例,包括:
19、基于所述負(fù)熵評(píng)分函數(shù)對(duì)所述候選偽示例中的每一個(gè)偽示例進(jìn)行類別概率計(jì)算處理,得到第一評(píng)分值,其中,所述第一評(píng)分值與所述偽示例一一對(duì)應(yīng);
20、將所述第一評(píng)分值最高的所述偽示例作為所述目標(biāo)偽示例。
21、根據(jù)本申請(qǐng)的一些實(shí)施例,在所述目標(biāo)評(píng)分函數(shù)為所述一致性評(píng)分函數(shù)的情況下,所述根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例,包括:
22、基于所述一致性評(píng)分函數(shù)對(duì)所述候選偽示例中的每一個(gè)偽示例進(jìn)行余弦相似度計(jì)算處理,得到第二評(píng)分值,其中,所述第二評(píng)分值與所述偽示例一一對(duì)應(yīng);
23、將所述第二評(píng)分值最高的所述偽示例作為所述目標(biāo)偽示例。
24、根據(jù)本申請(qǐng)的一些實(shí)施例,在所述雙語評(píng)估評(píng)分函數(shù)為所述目標(biāo)評(píng)分函數(shù)的情況下,所述根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例,包括:
25、基于所述雙語評(píng)估評(píng)分函數(shù)對(duì)所述候選偽示例中的每一個(gè)偽示例進(jìn)行評(píng)價(jià)指標(biāo)計(jì)算處理,得到第三評(píng)分值,其中,所述第三評(píng)分值與所述偽示例一一對(duì)應(yīng);
26、將所述第三評(píng)分值最高的所述偽示例作為所述目標(biāo)偽示例。
27、根據(jù)本申請(qǐng)的一些實(shí)施例,所述根據(jù)所述通用語言模型對(duì)所述目標(biāo)偽示例進(jìn)行預(yù)測(cè)處理,得到預(yù)測(cè)提示信息,包括:
28、對(duì)所述目標(biāo)偽示例進(jìn)行特征提取得到偽示例特征信息;
29、對(duì)所述偽示例特征信息進(jìn)行池化處理得到降維特征信息;
30、對(duì)所述降維特征信息進(jìn)行分類預(yù)測(cè)處理得到所述預(yù)測(cè)提示信息。
31、第二方面,本申請(qǐng)實(shí)施例還提供了一種提示生成裝置,所述裝置包括:
32、第一處理模塊,用于獲取無標(biāo)簽數(shù)據(jù)集和任務(wù)類型信息;
33、第二處理模塊,用于將所述無標(biāo)簽數(shù)據(jù)集輸入至預(yù)訓(xùn)練的通用語言模型進(jìn)行推理處理,得到候選響應(yīng)信息;
34、第三處理模塊,用于將所述無標(biāo)簽數(shù)據(jù)集與所述候選響應(yīng)信息進(jìn)行拼接處理,得到候選偽示例;
35、第四處理模塊,用于根據(jù)所述任務(wù)類型信息從預(yù)設(shè)的選擇器中選取目標(biāo)評(píng)分函數(shù);
36、第五處理模塊,用于根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例;
37、第六處理模塊,用于根據(jù)所述通用語言模型對(duì)所述目標(biāo)偽示例進(jìn)行預(yù)測(cè)處理,得到預(yù)測(cè)提示信息。
38、第三方面,本申請(qǐng)實(shí)施例還提供了一種電子設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上第一方面所述的提示生成方法。
39、第四方面,本申請(qǐng)實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令用于執(zhí)行如上第一方面所述的提示生成方法。
40、根據(jù)本申請(qǐng)?zhí)峁┑膶?shí)施例的提示生成方法,至少具有如下有益效果:在進(jìn)行提示生成的過程中,首先獲取無標(biāo)簽數(shù)據(jù)集和任務(wù)類型信息;接著將無標(biāo)簽數(shù)據(jù)集輸入到預(yù)訓(xùn)練的通用語言模型中進(jìn)行推理處理就可以得到候選響應(yīng)信息;接著將無標(biāo)簽數(shù)據(jù)集與候選響應(yīng)信息進(jìn)行拼接處理就可以得到候選偽示例;接著根據(jù)任務(wù)類型信息從預(yù)設(shè)的選擇器中選取目標(biāo)評(píng)分函數(shù);接著根據(jù)目標(biāo)評(píng)分函數(shù)對(duì)得到的候選偽示例進(jìn)行篩選處理就可以得到目標(biāo)偽示例;最后根據(jù)通用語言模型對(duì)目標(biāo)偽示例進(jìn)行預(yù)測(cè)處理就可以得到預(yù)測(cè)提示信息;通過上述技術(shù)方案,基于任務(wù)類型信息從預(yù)設(shè)的選擇器中選取目標(biāo)評(píng)分函數(shù),接著后續(xù)就可以根據(jù)對(duì)應(yīng)的目標(biāo)評(píng)分函數(shù)篩選得到目標(biāo)偽示例,最后就可以利用通用語言模型對(duì)目標(biāo)偽示例進(jìn)行預(yù)測(cè)處理就可以得到對(duì)應(yīng)的預(yù)測(cè)提示信息,使得提示信息的生成能夠更加準(zhǔn)確,從而可以提高智能回答系統(tǒng)的準(zhǔn)確性,給用戶帶來了更加良好的使用體驗(yàn),并且還能夠提升通用語言模型在零樣本和少樣本場(chǎng)景下的性能。
1.一種提示生成方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的提示生成方法,其特征在于,所述將所述無標(biāo)簽數(shù)據(jù)集輸入至預(yù)訓(xùn)練的通用語言模型進(jìn)行推理處理,得到候選響應(yīng)信息,包括:
3.根據(jù)權(quán)利要求1所述的提示生成方法,其特征在于,所述根據(jù)所述任務(wù)類型信息從預(yù)設(shè)的選擇器中選取目標(biāo)評(píng)分函數(shù),包括以下之一:
4.根據(jù)權(quán)利要求3所述的提示生成方法,其特征在于,在所述目標(biāo)評(píng)分函數(shù)為所述負(fù)熵評(píng)分函數(shù)的情況下,所述根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例,包括:
5.根據(jù)權(quán)利要求3所述的提示生成方法,其特征在于,在所述目標(biāo)評(píng)分函數(shù)為所述一致性評(píng)分函數(shù)的情況下,所述根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例,包括:
6.根據(jù)權(quán)利要求3所述的提示生成方法,其特征在于,在所述雙語評(píng)估評(píng)分函數(shù)為所述目標(biāo)評(píng)分函數(shù)的情況下,所述根據(jù)所述目標(biāo)評(píng)分函數(shù)對(duì)所述候選偽示例進(jìn)行篩選處理得到目標(biāo)偽示例,包括:
7.根據(jù)權(quán)利要求1所述的提示生成方法,其特征在于,所述根據(jù)所述通用語言模型對(duì)所述目標(biāo)偽示例進(jìn)行預(yù)測(cè)處理,得到預(yù)測(cè)提示信息,包括:
8.一種提示生成裝置,其特征在于,包括:
9.一種電子設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的提示生成方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,其特征在于,所述計(jì)算機(jī)可執(zhí)行指令用于執(zhí)行權(quán)利要求1至7中任意一項(xiàng)所述的提示生成方法。