本發(fā)明涉及人工智能,尤其是涉及一種基于gans模型的圖像深度偽造追蹤溯源方法。
背景技術(shù):
1、圖像偽造追蹤溯源技術(shù),旨在追蹤和確認(rèn)圖像的來(lái)源、制作過(guò)程,以及可能的篡改歷史。這項(xiàng)技術(shù)通過(guò)多種方法實(shí)現(xiàn),包括但不限于使用信息追溯標(biāo)識(shí)(如二維碼、條碼、rfid)來(lái)提高可信度和提升產(chǎn)品信譽(yù)度。
2、目前常規(guī)方法大多依賴于較低層次的圖像特征如像素級(jí)對(duì)比、壓縮痕跡分析,這些方法在面對(duì)高精度的深度偽造圖像時(shí)容易失效,因?yàn)間ans生成的圖像在像素層面可能與真實(shí)圖像極為相似?,F(xiàn)有技術(shù)往往針對(duì)已知的偽造技術(shù)設(shè)計(jì),面對(duì)新型或不斷演進(jìn)的偽造技術(shù)時(shí)適應(yīng)性較差,無(wú)法捕捉到gans生成圖像特有的生成痕跡,如模式重復(fù)、紋理異常等深層次的偽造特征,需要更多的人工干預(yù)和特征工程,分析過(guò)程相對(duì)繁瑣且耗時(shí)。常規(guī)方法的技術(shù)更新速度可能跟不上深度偽造技術(shù)的快速發(fā)展。
3、由此可見(jiàn),現(xiàn)有技術(shù)仍存在偽造識(shí)別精度較低、適應(yīng)性差、難以捕捉深度偽造特征以及需要更多的人工干預(yù)和特征工程的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種基于gans模型的圖像深度偽造追蹤溯源方法,解決了偽造識(shí)別精度較低、適應(yīng)性差、難以捕捉深度偽造特征以及需要更多的人工干預(yù)和特征工程的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于gans模型的圖像深度偽造追蹤溯源方法,包括以下步驟:
3、s1、數(shù)據(jù)集準(zhǔn)備,通過(guò)爬蟲(chóng)技術(shù)自動(dòng)抓取互聯(lián)網(wǎng)上大量真實(shí)圖像和已知的偽造圖像作為訓(xùn)練集,對(duì)數(shù)據(jù)集進(jìn)行清洗和標(biāo)注,區(qū)分真實(shí)樣本與偽造樣本;
4、s2、特征工程,采用歸一化處理或縮放處理對(duì)圖像進(jìn)行預(yù)處理使其適合模型輸入規(guī)格,使用數(shù)據(jù)增強(qiáng)技術(shù),增加數(shù)據(jù)多樣性,減少過(guò)擬合;
5、s3、構(gòu)建生成器和判別器,根據(jù)圖像的分辨率和顏色通道數(shù)定義輸出維度,將隨機(jī)噪音作為輸入構(gòu)建cnn模型,用于生成偽造圖像;根據(jù)生成器輸出的數(shù)據(jù)類型設(shè)定定義輸出維度,將生成器輸出的圖像作為輸入構(gòu)建cnn模型,判斷輸入圖像是否偽造;
6、s4、訓(xùn)練生成器和判別器,將真實(shí)圖像和偽造圖像同時(shí)輸入到鑒別器中,在鑒別器訓(xùn)練到一定程度后,開(kāi)始聯(lián)合訓(xùn)練生成器和鑒別器;
7、s5、追蹤與溯源分析,通過(guò)元數(shù)據(jù)分析、網(wǎng)絡(luò)分析和模式識(shí)別對(duì)圖像進(jìn)行追蹤和溯源分析,并根據(jù)偽造圖像的傳播趨勢(shì)、熱點(diǎn)區(qū)域、時(shí)間規(guī)律,采用arima模型預(yù)測(cè)未來(lái)可能出現(xiàn)的偽造活動(dòng);
8、s6、持續(xù)學(xué)習(xí)與迭代,系統(tǒng)需不斷吸收新數(shù)據(jù)更新特征庫(kù)與模型,適應(yīng)深度偽造技術(shù)的演變。
9、優(yōu)選的,在步驟s3中,生成器的構(gòu)建步驟:
10、輸入層接受256x256的rgb圖像,其輸出維度為256x256x3;
11、卷積層使用小尺寸的3x3卷積核,步幅設(shè)置為1
12、(以保證輸出尺寸與輸入尺寸相同);
13、定義輸入通道數(shù)i,由此確定輸出通道數(shù)o,每個(gè)網(wǎng)絡(luò)層的參數(shù)量為i*o*k,其中k為卷積核的參數(shù)個(gè)數(shù);
14、采用邊界擴(kuò)充的方法保持輸出尺寸與輸入尺寸相同;
15、在每個(gè)卷積層之后,使用2x2的最大池化層進(jìn)行空間降采樣,具體表達(dá)如下所示:
16、
17、網(wǎng)絡(luò)中有4個(gè)全連接層,其中最后一個(gè)是輸出層,使用softmax激活函數(shù)進(jìn)行多類別分類,具體如下:
18、計(jì)算指數(shù)函數(shù):輸入向量中的每個(gè)元素,計(jì)算其指數(shù)值
19、y=ez
20、其中輸入向量的每個(gè)元素為z,ez為指數(shù)函數(shù);
21、softmax激活函數(shù):
22、
23、其中,zi是輸入向量中的第i個(gè)元素,k是類別總數(shù),e是自然對(duì)數(shù)的底數(shù)。
24、優(yōu)選的,在步驟s3中,判別器的構(gòu)建步驟:
25、根據(jù)生成器輸出的數(shù)據(jù)類型設(shè)定判別器的輸入維度為256x256x3;
26、卷積層使用小尺寸的3x3卷積核,步幅設(shè)置為1;
27、使用多個(gè)卷積層來(lái)進(jìn)行提取特征,其中卷積輸出結(jié)果的計(jì)算公式如下所示:
28、n=(w-f+2p)/s+1
29、其中,n為輸出大小,w為輸入大小,f為卷積核大小,p為填充值大小,s為步幅大??;
30、在每個(gè)卷積層之后,使用2x2的最大池化層進(jìn)行空間降采樣,具體表達(dá)如下所示:
31、
32、網(wǎng)絡(luò)中有4個(gè)全連接層,輸出層,使用sigmoid激活函數(shù)進(jìn)行識(shí)別,其中sigmoid激活函數(shù)的表達(dá)式如下所示:
33、
34、其中,x是函數(shù)的輸入,σ(x)是函數(shù)的輸出。
35、優(yōu)選的,在步驟s4中,在訓(xùn)練初期,主要訓(xùn)練鑒別器,將真實(shí)圖像和偽造圖像同時(shí)輸入到鑒別器中,通過(guò)反向傳播算法調(diào)整鑒別器的參數(shù),使其能夠正確區(qū)分真實(shí)圖像和偽造圖像。
36、優(yōu)選的,在步驟s5中,追蹤與溯源分析中,元數(shù)據(jù)分析的具體步驟如下所示:
37、圖像元數(shù)據(jù)提取,使用元數(shù)據(jù)提取工具或exiftool提取步驟s4中圖像的元數(shù)據(jù),元數(shù)據(jù)包括文件名、文件大小、分辨率、拍攝時(shí)間、拍攝地點(diǎn)和gps定位信息;
38、根據(jù)提取的時(shí)間戳和gps坐標(biāo),構(gòu)建時(shí)間與地點(diǎn)的關(guān)聯(lián)圖譜,分析圖像的拍攝地點(diǎn)和時(shí)間序列,追蹤圖像的來(lái)源和傳播路徑;
39、利用圖像識(shí)別技術(shù)識(shí)別圖像中的特定對(duì)象、標(biāo)志或場(chǎng)景,并查找模式或異常,識(shí)別偽造或篡改的跡象。
40、優(yōu)選的,在步驟s5中,追蹤與溯源分析中,網(wǎng)絡(luò)分析的具體步驟如下所示:
41、網(wǎng)絡(luò)圖構(gòu)建,每個(gè)發(fā)布或轉(zhuǎn)發(fā)該圖像的用戶、網(wǎng)頁(yè)、賬號(hào)視為一個(gè)節(jié)點(diǎn),若有明確的轉(zhuǎn)發(fā)、引用關(guān)系,則在相應(yīng)的節(jié)點(diǎn)之間建立邊,無(wú)直接關(guān)系但時(shí)間、內(nèi)容相近的判定為弱連接,構(gòu)建邊;
42、運(yùn)用網(wǎng)絡(luò)中心性指標(biāo),識(shí)別關(guān)鍵節(jié)點(diǎn),通過(guò)louvain算法發(fā)現(xiàn)不同的傳播社群,了解圖像在不同群體中的傳播模式和接受度;
43、利用時(shí)間序列分析,追蹤圖像傳播的速度、范圍隨時(shí)間的變化,識(shí)別傳播高峰期和衰退期;結(jié)合用戶ip地址或自我聲明的位置信息,分析圖像的地理傳播路徑,識(shí)別傳播的地域特征。
44、優(yōu)選的,在步驟s5中,追蹤與溯源分析中,模式識(shí)別的具體步驟如下所示:
45、利用特征匹配算法比較目標(biāo)圖像與數(shù)據(jù)庫(kù)中圖像的相似性,尋找相同或相似的圖像源;
46、基于匹配結(jié)果,逆向追溯圖像首次出現(xiàn)的源頭或關(guān)鍵傳播節(jié)點(diǎn),分析圖像的初始上傳時(shí)間、地點(diǎn)及上傳者信息;
47、分析圖像內(nèi)容,識(shí)別其中的對(duì)象、場(chǎng)景、文字等,結(jié)合上下文信息理解圖像的傳播語(yǔ)境和意圖;
48、應(yīng)用機(jī)器學(xué)習(xí)模型識(shí)別圖像傳播是否遵循特定的傳播路徑、是否與特定事件相關(guān)聯(lián)或隨著時(shí)間推移的流行趨勢(shì),若存在上述特點(diǎn),則生成反饋報(bào)告展示圖像傳播的路徑、變化點(diǎn)和關(guān)鍵節(jié)點(diǎn)。
49、優(yōu)選的,在步驟s5中,采用arima模型預(yù)測(cè)未來(lái)可能出現(xiàn)的偽造活動(dòng)的具體步驟:
50、統(tǒng)計(jì)偽造圖像的傳播趨勢(shì)、熱點(diǎn)區(qū)域、時(shí)間規(guī)律,并繪制繪制時(shí)序圖和自相關(guān)圖,觀察時(shí)間序列數(shù)據(jù)的平穩(wěn)性;
51、檢查數(shù)據(jù)是否為白噪聲,根據(jù)自相關(guān)函數(shù)acf和部分自相關(guān)函數(shù)pacf圖進(jìn)行模型定階,確定最佳的arima模型參數(shù)p,b,q;
52、根據(jù)定階結(jié)果,采用自回歸模型ar、移動(dòng)平均模型ma和差分i的組合建立arima模型,根據(jù)選定的模型進(jìn)行預(yù)測(cè)。
53、優(yōu)選的,自相關(guān)系數(shù)的數(shù)學(xué)公式如下所示:
54、
55、其中,ρ(t,s)是自相關(guān)系數(shù),表示時(shí)間點(diǎn)t和時(shí)間點(diǎn)s之間的相關(guān)性;
56、γ(t,s)是時(shí)間序列{xt}的自協(xié)方差函數(shù),用于衡量時(shí)間點(diǎn)t和時(shí)間點(diǎn)s之間的協(xié)方差;
57、dxt和dxs分別表示時(shí)間點(diǎn)t和時(shí)間點(diǎn)s的方差。
58、因此,本發(fā)明采用上述結(jié)構(gòu)的一種基于gans模型的圖像深度偽造追蹤溯源方法,具備以下有益效果:
59、本發(fā)明通過(guò)訓(xùn)練對(duì)抗性模型,能夠理解更復(fù)雜的圖像結(jié)構(gòu)和深層特征,因此在區(qū)分高度真實(shí)的偽造圖像方面更為精確。通過(guò)不斷學(xué)習(xí)對(duì)抗性生成過(guò)程,理論上能更好地適應(yīng)新型偽造技術(shù),保持追蹤和溯源的有效性。
60、本發(fā)明能夠?qū)iT訓(xùn)練來(lái)識(shí)別這些由gans生成圖像特有的統(tǒng)計(jì)規(guī)律或生成模式,從而提高追蹤精度。利用自動(dòng)化學(xué)習(xí)框架,一旦模型訓(xùn)練完成,可以快速自動(dòng)處理大量圖像,提高追蹤和分析的效率。
61、下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。