本申請(qǐng)涉及人工智能,特別是涉及一種基于擴(kuò)散處理的潔凈對(duì)抗訓(xùn)練、對(duì)抗樣本生成方法及設(shè)備。
背景技術(shù):
1、在使用訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行數(shù)據(jù)處理時(shí),模型可能會(huì)遭受攻擊,從而產(chǎn)生錯(cuò)誤輸出。以圖像分類模型為例,待輸入模型的圖像可能會(huì)被攻擊者進(jìn)行人眼難以察覺的篡改,篡改后的圖像可以稱為對(duì)抗樣本,這樣,將對(duì)抗樣本輸入模型后,模型針對(duì)對(duì)抗樣本產(chǎn)生的輸出可能與針對(duì)原始的圖像產(chǎn)生的輸出不同,也即模型產(chǎn)生了錯(cuò)誤的輸出。
2、相關(guān)技術(shù)中,可以通過對(duì)抗訓(xùn)練來降低模型產(chǎn)生錯(cuò)誤輸出的概率。對(duì)抗訓(xùn)練的原理是:在模型訓(xùn)練階段,生成易使得模型產(chǎn)生錯(cuò)誤輸出的對(duì)抗樣本,然后,采用對(duì)抗樣本對(duì)模型進(jìn)行訓(xùn)練,以提高訓(xùn)練得到的模型針對(duì)對(duì)抗樣本的抵御能力,也即降低模型針對(duì)對(duì)抗樣本產(chǎn)生錯(cuò)誤輸出的概率,提高模型的魯棒性。
3、鑒于上述情況,需要提供一種對(duì)抗樣本生成方案,以生成對(duì)抗訓(xùn)練的過程中需要使用的對(duì)抗樣本。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例的目的在于提供一種基于擴(kuò)散處理的潔凈對(duì)抗訓(xùn)練、對(duì)抗樣本生成方法及設(shè)備,以生成對(duì)抗訓(xùn)練的過程中需要使用的對(duì)抗樣本。具體技術(shù)方案如下:
2、第一方面,本申請(qǐng)實(shí)施例提供了一種基于擴(kuò)散處理的潔凈對(duì)抗樣本生成方法,所述方法包括:
3、對(duì)原始樣本和第一噪聲進(jìn)行擴(kuò)散處理,得到第一帶噪樣本;
4、使用待訓(xùn)練模型對(duì)所述原始樣本進(jìn)行數(shù)據(jù)處理,得到第一處理結(jié)果;
5、使用所述待訓(xùn)練模型對(duì)所述第一帶噪樣本進(jìn)行數(shù)據(jù)處理,得到第二處理結(jié)果;
6、基于所述第一處理結(jié)果和所述第二處理結(jié)果,獲得所述第一帶噪樣本相對(duì)于所述原始樣本的噪聲散度;
7、基于所述噪聲散度和所述第一帶噪樣本,生成第二噪聲,并對(duì)所述第一帶噪樣本和所述第二噪聲進(jìn)行疊加,得到第二帶噪樣本;
8、對(duì)所述第二帶噪樣本進(jìn)行逆擴(kuò)散處理,預(yù)測(cè)分離噪聲,并從所述第二帶噪樣本去除所述分離噪聲;
9、基于噪聲去除結(jié)果,獲得對(duì)抗樣本。
10、第二方面,本申請(qǐng)實(shí)施例提供了一種基于擴(kuò)散處理的潔凈對(duì)抗訓(xùn)練方法,所述方法包括:
11、將對(duì)抗樣本輸入待訓(xùn)練模型,得到所述待訓(xùn)練模型對(duì)所述對(duì)抗樣本進(jìn)行數(shù)據(jù)處理后輸出的第三處理結(jié)果,其中,所述對(duì)抗樣本為:根據(jù)第一方面所述的方法生成的對(duì)抗樣本;
12、根據(jù)所述第三處理結(jié)果與所述對(duì)抗樣本的數(shù)據(jù)標(biāo)簽之間的差異,確定所述待訓(xùn)練模型在數(shù)據(jù)處理過程中產(chǎn)生的損失值;
13、根據(jù)所得損失值進(jìn)行反向梯度傳播,更新所述待訓(xùn)練模型的權(quán)重系數(shù)。
14、第三方面,本申請(qǐng)實(shí)施例提供了一種基于擴(kuò)散處理的潔凈對(duì)抗樣本生成裝置,所述裝置包括:
15、第一噪聲疊加模塊,用于對(duì)原始樣本和第一噪聲進(jìn)行擴(kuò)散處理,得到第一帶噪樣本;
16、第一處理結(jié)果獲得模塊,用于使用待訓(xùn)練模型對(duì)所述原始樣本進(jìn)行數(shù)據(jù)處理,得到第一處理結(jié)果;
17、第二處理結(jié)果獲得模塊,用于使用所述待訓(xùn)練模型對(duì)所述第一帶噪樣本進(jìn)行數(shù)據(jù)處理,得到第二處理結(jié)果;
18、噪聲散度獲得模塊,用于基于所述第一處理結(jié)果和所述第二處理結(jié)果,獲得所述第一帶噪樣本相對(duì)于所述原始樣本的噪聲散度;
19、第二噪聲疊加模塊,用于基于所述噪聲散度和所述第一帶噪樣本,生成第二噪聲,并對(duì)所述第一帶噪樣本和所述第二噪聲進(jìn)行疊加,得到第二帶噪樣本;
20、噪聲去除模塊,用于對(duì)所述第二帶噪樣本進(jìn)行逆擴(kuò)散處理,預(yù)測(cè)分離噪聲,并從所述第二帶噪樣本去除所述分離噪聲;
21、對(duì)抗樣本獲得模塊,用于基于噪聲去除結(jié)果,獲得對(duì)抗樣本。
22、第四方面,本申請(qǐng)實(shí)施例提供了一種基于擴(kuò)散處理的潔凈對(duì)抗訓(xùn)練裝置,所述裝置包括:
23、處理結(jié)果獲得模塊,用于將對(duì)抗樣本輸入待訓(xùn)練模型,得到所述待訓(xùn)練模型對(duì)所述對(duì)抗樣本進(jìn)行數(shù)據(jù)處理后輸出的第三處理結(jié)果,其中,所述對(duì)抗樣本為:根據(jù)前述基于擴(kuò)散處理的潔凈對(duì)抗樣本生成方法生成的對(duì)抗樣本;
24、損失值確定模塊,用于根據(jù)所述第三處理結(jié)果與所述對(duì)抗樣本的數(shù)據(jù)標(biāo)簽之間的差異,確定所述待訓(xùn)練模型在數(shù)據(jù)處理過程中產(chǎn)生的損失值;
25、權(quán)重系數(shù)更新模塊,用于根據(jù)所得損失值進(jìn)行反向梯度傳播,更新所述待訓(xùn)練模型的權(quán)重系數(shù)。
26、第五方面,本申請(qǐng)實(shí)施例提供了一種電子設(shè)備,包括:
27、存儲(chǔ)器,用于存放計(jì)算機(jī)程序;
28、處理器,用于執(zhí)行存儲(chǔ)器上所存放的程序時(shí),實(shí)現(xiàn)第一方面或第二方面所述的方法。
29、第六方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面或第二方面所述的方法。
30、第七方面,本申請(qǐng)實(shí)施例還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面或第二方面所述的方法。
31、由以上可見,本申請(qǐng)實(shí)施例提供的方案是先對(duì)原始樣本進(jìn)行擴(kuò)散處理得到帶噪樣本,再預(yù)測(cè)帶噪樣本中的分離噪聲,最后從帶噪樣本中去除分離噪聲,得到對(duì)抗樣本。也就是,對(duì)原始樣本加噪之后,又通過噪聲的預(yù)測(cè)和去除,對(duì)帶噪樣本進(jìn)行了適當(dāng)?shù)倪M(jìn)行去噪,最終使得生成的對(duì)抗樣本中不會(huì)包含過量的噪聲,也即生成的對(duì)抗樣本中包含的噪聲較少,潔凈度較高。并且,生成的對(duì)抗樣本既與原始樣本存在區(qū)別,又不會(huì)與原始樣本之間的差距過大,提高了所得對(duì)抗樣本的質(zhì)量。本領(lǐng)域人員可以得知的是,對(duì)抗訓(xùn)練雖然能夠提高訓(xùn)練得到的模型的魯棒性,但可能會(huì)導(dǎo)致模型在訓(xùn)練階段過分的專注于學(xué)習(xí)對(duì)抗樣本所具有的特點(diǎn),換言之,也即模型將過多的“注意力”放在對(duì)抗樣本上,而對(duì)于一般樣本的關(guān)注度則相對(duì)不足。這樣就使得訓(xùn)練得到的模型對(duì)于一般的輸入數(shù)據(jù)的處理性能變差,從而易使得模型針對(duì)一般的輸入數(shù)據(jù)的推理準(zhǔn)確度降低,也即模型的泛化能力較差。而采用本申請(qǐng)生成的對(duì)抗樣本訓(xùn)練模型時(shí),由于生成的對(duì)抗樣本潔凈度較高、與原始樣本較為接近,因此,對(duì)抗樣本與原始樣本的特點(diǎn)也近似,這樣,基于對(duì)抗樣本可以實(shí)現(xiàn)潔凈訓(xùn)練,即便對(duì)抗訓(xùn)練過程中模型對(duì)于對(duì)抗樣本的關(guān)注度較高,也不會(huì)明顯降低模型對(duì)于一般的輸入數(shù)據(jù)的處理性能,提高了模型的泛化能力。
32、綜上,采用本申請(qǐng)實(shí)施例提供的方案生成的對(duì)抗樣本進(jìn)行對(duì)抗訓(xùn)練,既能夠提高模型對(duì)于對(duì)抗樣本的抵御能力,又不會(huì)明顯降低模型對(duì)于一般的輸入數(shù)據(jù)的處理性能,兼顧模型的魯棒性和泛化能力。
33、當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品或方法并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
1.一種基于擴(kuò)散處理的潔凈對(duì)抗樣本生成方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于噪聲去除結(jié)果,獲得對(duì)抗樣本,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述迭代結(jié)束條件包括以下條件中的至少一種:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述從所述第二帶噪樣本去除所述分離噪聲,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一處理結(jié)果包括:所述待訓(xùn)練模型預(yù)測(cè)得到的所述原始樣本屬于各個(gè)設(shè)定類別的第一置信度,所述第二處理結(jié)果包括:所述待訓(xùn)練模型預(yù)測(cè)得到的所述第一帶噪樣本屬于各個(gè)設(shè)定類別的第二置信度,
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所得置信度差異,確定所述第一帶噪樣本相對(duì)于所述原始樣本的噪聲散度,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,
8.一種基于擴(kuò)散處理的潔凈對(duì)抗訓(xùn)練方法,其特征在于,所述方法包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7或8任一所述的方法。