本說明書一個(gè)或多個(gè)實(shí)施例涉及大模型領(lǐng)域,特別涉及一種基于隱私保護(hù)的大模型微調(diào)的方法及裝置。
背景技術(shù):
1、在人工智能領(lǐng)域,大基座模型指的是規(guī)模龐大,被設(shè)計(jì)為可擴(kuò)展、可適應(yīng)多種應(yīng)用場景的基礎(chǔ)性模型。這類模型可以視為ai技術(shù)棧的基石,其他更專門化的模型或應(yīng)用可以通過在大基座模型的基礎(chǔ)上進(jìn)行微調(diào)(fine-tuning)來快速獲得針對特定領(lǐng)域的高性能,而無需從頭開始訓(xùn)練大規(guī)模模型。大基座模型的一個(gè)重要優(yōu)勢在于它們能夠促進(jìn)資源和計(jì)算的高效復(fù)用,降低下游任務(wù)的成本與難度。目前來說,需要一種對大基座模型進(jìn)行微調(diào)的方案。
技術(shù)實(shí)現(xiàn)思路
1、本說明書一個(gè)或多個(gè)實(shí)施例提供一種基于隱私保護(hù)的大模型微調(diào)的方法及裝置。
2、根據(jù)第一方面,提供一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法包括:
3、第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型,并將所述第二小模型發(fā)送給第二平臺;
4、所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。
5、根據(jù)第二方面,提供一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第一平臺執(zhí)行,所述方法包括:
6、獲取第一小模型;
7、采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型;
8、將所述第二小模型發(fā)送給第二平臺,使所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。
9、根據(jù)第三方面,提供一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第二平臺執(zhí)行,所述方法包括:
10、接收第一平臺發(fā)送的適用于第一領(lǐng)域的第二小模型;所述第二小模型由所述第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型而得到;
11、以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),得到適用于所述第一領(lǐng)域的大模型。
12、根據(jù)第四方面,提供一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第一平臺,所述裝置包括:
13、獲取模塊,用于獲取第一小模型;
14、訓(xùn)練模塊,用于采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型;
15、發(fā)送模塊,用于將所述第二小模型發(fā)送給第二平臺,使所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。
16、根據(jù)第五方面,提供一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第二平臺,所述裝置包括:
17、第一接收模塊,用于接收第一平臺發(fā)送的適用于第一領(lǐng)域的第二小模型;所述第二小模型由所述第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型而得到;
18、蒸餾模塊,用于以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),得到適用于所述第一領(lǐng)域的大模型。
19、根據(jù)第六方面,提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面或第二方面或第三方面中任一項(xiàng)所述的方法。
20、根據(jù)第七方面,提供一種計(jì)算設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)上述第一方面或第二方面或第三方面中任一項(xiàng)所述的方法。
21、本說明書的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
22、本說明書的實(shí)施例提供的基于隱私保護(hù)的大模型微調(diào)的方法和裝置,通過由第一設(shè)備采用差分隱私的方式,利用本地持有的、包括特定領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于特定領(lǐng)域的第二小模型,并將第二小模型發(fā)送給第二設(shè)備,由第二設(shè)備以第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于特定領(lǐng)域的大模型。從而實(shí)現(xiàn)了在不泄露隱私數(shù)據(jù)的前提下,能夠利用涉及隱私的訓(xùn)練數(shù)據(jù)對大模型進(jìn)行微調(diào),提高了數(shù)據(jù)的安全性,并保證了對大模型微調(diào)的精度。
23、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本申請。
1.一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述第一小模型通過以下方式獲取:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述對所述大模型進(jìn)行壓縮處理,得到所述第一小模型,包括:
4.根據(jù)權(quán)利要求2所述的方法,其中,所述第一小模型的獲取還包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述確定所述第一小模型的參數(shù)量信息,包括:
6.根據(jù)權(quán)利要求1所述的方法,其中,所述差分隱私的方式包括以下任意一項(xiàng):
7.根據(jù)權(quán)利要求2所述的方法,其中,所述第一小模型中包括多個(gè)目標(biāo)參數(shù);所述訓(xùn)練所述第一小模型包括,將所述第一小模型中的所述目標(biāo)參數(shù)更新為目標(biāo)數(shù)值,以得到所述第二小模型;
8.根據(jù)權(quán)利要求1所述的方法,其中,所述對大模型進(jìn)行微調(diào),包括:
9.根據(jù)權(quán)利要求8所述的方法,其中,所述第一數(shù)據(jù)基于所述第一領(lǐng)域的提示詞而生成。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述方法還包括:
11.根據(jù)權(quán)利要求1所述的方法,其中,所述方法還包括,所述第二平臺從第三平臺接收適用于第二領(lǐng)域的第四小模型,以所述第四小模型為老師模型,通過蒸餾學(xué)習(xí)的方式對所述大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域和第二領(lǐng)域的大模型。
12.一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第一平臺執(zhí)行,所述方法包括:
13.根據(jù)權(quán)利要求12所述的方法,其中,所述獲取第一小模型,包括:
14.根據(jù)權(quán)利要求13所述的方法,其中,所述獲取第一小模型,還包括:
15.根據(jù)權(quán)利要求14所述的方法,其中,所述確定所述第一小模型的參數(shù)量信息,包括:
16.根據(jù)權(quán)利要求12所述的方法,其中,所述差分隱私的方式包括以下任意一項(xiàng):
17.根據(jù)權(quán)利要求12所述的方法,其中,所述方法還包括:
18.一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第二平臺執(zhí)行,所述方法包括:
19.根據(jù)權(quán)利要求18所述的方法,其中,在接收所述第二小模型之前,所述方法還包括:
20.根據(jù)權(quán)利要求19所述的方法,其中,所述對所述大模型進(jìn)行壓縮處理,得到所述第一小模型,包括:
21.根據(jù)權(quán)利要求19所述的方法,其中,在對所述大模型進(jìn)行壓縮處理之前,還包括:
22.根據(jù)權(quán)利要求19所述的方法,其中,所述第一小模型中包括多個(gè)目標(biāo)參數(shù);所述第二小模型為將所述第一小模型中的所述目標(biāo)參數(shù)更新為目標(biāo)數(shù)值而得到;
23.根據(jù)權(quán)利要求18所述的方法,其中,所述對大模型進(jìn)行微調(diào),包括:
24.根據(jù)權(quán)利要求23所述的方法,其中,所述第一數(shù)據(jù)基于所述第一領(lǐng)域的提示詞而生成;其中,所述方法還包括:
25.根據(jù)權(quán)利要求18所述的方法,其中,所述方法還包括,從第三平臺接收適用于第二領(lǐng)域的第四小模型,以所述第四小模型為老師模型,通過蒸餾學(xué)習(xí)的方式對所述大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域和第二領(lǐng)域的大模型。
26.一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第一平臺,所述裝置包括:
27.一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第二平臺,所述裝置包括:
28.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-25中任一項(xiàng)所述的方法。
29.一種計(jì)算設(shè)備,包括存儲器和處理器,所述存儲器中存儲有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)權(quán)利要求1-25中任一項(xiàng)所述的方法。