本發(fā)明屬于深度學(xué)習(xí)與區(qū)塊鏈技術(shù)交叉領(lǐng)域,具體涉及一種深度學(xué)習(xí)模型在區(qū)塊鏈環(huán)境中的可信分發(fā)與自動(dòng)化部署方法和裝置。
背景技術(shù):
1、模型水印嵌入技術(shù)是數(shù)字版權(quán)管理領(lǐng)域的一項(xiàng)前沿創(chuàng)新,它通過在深度學(xué)習(xí)模型中巧妙地嵌入難以察覺且難以移除的獨(dú)特標(biāo)識(shí)符,為模型的知識(shí)產(chǎn)權(quán)提供了強(qiáng)有力的保護(hù)?,F(xiàn)有模型水印技術(shù)包括神經(jīng)網(wǎng)絡(luò)架構(gòu)水印、參數(shù)水印、激活函數(shù)水印、輸入/輸出水印和梯度水印等方法,各有其優(yōu)勢(shì)和局限性。神經(jīng)網(wǎng)絡(luò)架構(gòu)水印通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)嵌入水印,盡管難以移除,但需重新訓(xùn)練模型,可能影響性能并增加部署復(fù)雜性。參數(shù)水印直接在模型權(quán)重中嵌入,簡(jiǎn)單易實(shí)現(xiàn)且對(duì)性能影響較小,但在壓縮或量化過程中可能丟失,也容易被發(fā)現(xiàn)和移除。激活函數(shù)水印通過修改激活函數(shù)嵌入,隱藏性高,但可能影響模型學(xué)習(xí)能力和泛化性能。輸入/輸出水印在數(shù)據(jù)層面嵌入,無需改變模型結(jié)構(gòu),但在模型傳播過程中可能被破壞,且檢測(cè)復(fù)雜。梯度水印利用訓(xùn)練過程中的梯度信息嵌入,穩(wěn)定性強(qiáng),但受訓(xùn)練數(shù)據(jù)和算法影響,實(shí)現(xiàn)相對(duì)復(fù)雜。
2、人工智能技術(shù)的快速發(fā)展推動(dòng)了深度學(xué)習(xí)在眾多領(lǐng)域的廣泛應(yīng)用。然而,在實(shí)際應(yīng)用中,大多模型涉及隱私與多方規(guī)則隔離困難等問題,傳統(tǒng)方法無法實(shí)現(xiàn)跨主體的規(guī)則安全共享以及不少模型的運(yùn)行環(huán)境仍需依賴專業(yè)技術(shù)人員進(jìn)行細(xì)致的部署和配置,特別是,當(dāng)涉及到定制化模型架構(gòu)或需要滿足嚴(yán)格的安全與合規(guī)性標(biāo)準(zhǔn)時(shí),通常超出了當(dāng)前自動(dòng)化工具的能力范圍。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在解決當(dāng)前深度學(xué)習(xí)模型分發(fā)與部署中存在的安全性不足和過度依賴人工干預(yù)等問題,提出了一種基于區(qū)塊鏈智能合約的規(guī)則可信分發(fā)與自動(dòng)化部署方法和裝置。本發(fā)明的核心思想是為傳輸?shù)囊?guī)則設(shè)計(jì)一種模型水印,從而確保規(guī)則的安全可靠,防止非法復(fù)制和濫用以及通過區(qū)塊鏈智能合約的條件觸發(fā)機(jī)制,實(shí)施嚴(yán)格的用戶訪問控制,營(yíng)造一個(gè)數(shù)據(jù)安全共享的環(huán)境,并實(shí)現(xiàn)定制化模型的分發(fā)與容器部署,從規(guī)則需求到應(yīng)用一鍵自動(dòng)化。
2、本發(fā)明方法通過以下技術(shù)實(shí)現(xiàn)。
3、本發(fā)明的第一個(gè)方面涉及一種基于區(qū)塊鏈智能合約的規(guī)則可信分發(fā)與自動(dòng)化部署方法,包含如下步驟:
4、步驟1,規(guī)則使用方將原始訓(xùn)練數(shù)據(jù)通過區(qū)塊鏈傳輸給規(guī)則提供方,規(guī)則提供方根據(jù)專家經(jīng)驗(yàn)與知識(shí)構(gòu)建訓(xùn)練知識(shí)規(guī)則模型;
5、步驟2,規(guī)則使用方使用步驟1訓(xùn)練模型時(shí),通過設(shè)計(jì)的組合水印信息函數(shù),選擇注入層將水印嵌入模型中;
6、步驟3,開發(fā)實(shí)現(xiàn)規(guī)則可信分發(fā)、自動(dòng)部署和驗(yàn)證等功能的區(qū)塊鏈智能合約;
7、步驟4,構(gòu)建自動(dòng)執(zhí)行規(guī)則的docker環(huán)境;
8、步驟5,規(guī)則提供方通過步驟1、2訓(xùn)練得到的不同模型,建立模型庫(kù)與鏈接存儲(chǔ)在區(qū)塊鏈,規(guī)則使用方通過嚴(yán)格身份控制與權(quán)限管理,觸發(fā)步驟3中的智能合約特定條件實(shí)現(xiàn)自動(dòng)分發(fā),通過步驟4實(shí)現(xiàn)容器部署與規(guī)則應(yīng)用;
9、步驟6,規(guī)則使用方根據(jù)各方貢獻(xiàn)實(shí)施累積獎(jiǎng)勵(lì)激勵(lì)機(jī)制;
10、步驟7,提取與校驗(yàn)水印,驗(yàn)證模型提供方的模型是否被非法復(fù)制或?yàn)E用。
11、優(yōu)選地,步驟1中,規(guī)則提供方將規(guī)則使用方提供的原始數(shù)據(jù)經(jīng)過多模態(tài)處理統(tǒng)一標(biāo)準(zhǔn)化,進(jìn)行特征挖掘分析,對(duì)數(shù)據(jù)背后的關(guān)鍵特征進(jìn)行正確歸因,訓(xùn)練得到滿足使用方要求的知識(shí)規(guī)則模型。
12、優(yōu)選地,步驟2中,所述組合水印信息嵌入模型過程如下:
13、在訓(xùn)練模型m的過程中,設(shè)計(jì)組合水印密鑰k為:
14、k=(c*,w,v,d)?????????????(1)
15、其中c*(c*∈{c1,c2,…,cn})表示模型m可能輸出的類別集合中隨機(jī)或基于特定策略的一個(gè)目標(biāo)類,w(w∈r,r為實(shí)數(shù)集)是確保水印信號(hào)周期性的角頻率,v(v∈rn,rn為n維實(shí)數(shù)空間)表示隨機(jī)單位投影向量,d(d∈{d1,d2,…,dn}表示模型的深度參數(shù)。根據(jù)密鑰k中w,v構(gòu)造余弦序列s(x),構(gòu)造公式為:
16、
17、其中p(x)=vtx,表示輸入數(shù)據(jù)x在向量v一維方向上的投影長(zhǎng)度,表示隨機(jī)相位偏移。對(duì)于選擇嵌入層di,注入公式為:
18、
19、其中ε為控制水印強(qiáng)度的小常數(shù),qi表示模型di層的原始輸出,i表示qi的編號(hào)或索引,表示模型di層的注入水印后輸出。進(jìn)一步訓(xùn)練得到模型m。
20、優(yōu)選地,步驟5中,基于智能合約的可信分發(fā)自動(dòng)部署流程為:
21、規(guī)則提供方通過原始數(shù)據(jù)可以得到不同的模型m,建立模型規(guī)則庫(kù)與對(duì)應(yīng)鏈接url。使用安全的隨機(jī)數(shù)生成器創(chuàng)建一個(gè)強(qiáng)密鑰對(duì)(公鑰與私鑰),建立嚴(yán)格的身份與權(quán)限管控機(jī)制分發(fā)公鑰給規(guī)則使用方,并將私鑰存儲(chǔ)在區(qū)塊鏈特殊安全位置。使用私鑰對(duì)模型與鏈接進(jìn)行加密,生成加密指紋,觸發(fā)步驟3中的智能合約特定條件,將加密指紋存儲(chǔ)在區(qū)塊鏈中。規(guī)則使用方通過智能合約發(fā)出規(guī)則請(qǐng)求(智能合約負(fù)責(zé)驗(yàn)證請(qǐng)求的合法性,包括但不限于身份驗(yàn)證、密鑰驗(yàn)證、使用授權(quán)確認(rèn)等),驗(yàn)證通過后,訪問鏈接拉取加密的規(guī)則庫(kù)。進(jìn)一步地,智能合約使用區(qū)塊鏈存儲(chǔ)私鑰解密規(guī)則庫(kù),通過腳本自動(dòng)利用docker容器規(guī)則環(huán)境部署,從而實(shí)現(xiàn)模型的快速可信分發(fā)、部署、應(yīng)用。在此步驟中,私鑰不公開與發(fā)放,規(guī)則具體內(nèi)容對(duì)所有使用方保密。
22、優(yōu)選地,步驟7中,所述水印提取與校驗(yàn)流程為:
23、從步驟1得到的模型m,從其第di層提取輸出特征,對(duì)提取的特征使用短時(shí)傅里葉變換stft進(jìn)行時(shí)頻分析,對(duì)于分析后得到的第i個(gè)樣本點(diǎn)的值計(jì)算其與預(yù)期余弦信號(hào)的匹配度,匹配度越小,表示樣本點(diǎn)與預(yù)期的余弦信號(hào)越接近,即水印信號(hào)的特征越明顯。計(jì)算公式為:
24、
25、其中a是預(yù)期余弦信號(hào)的振幅,ti是時(shí)間索引,表示在時(shí)頻分析中不同時(shí)間點(diǎn)的樣本,具體為信號(hào)在ti和頻率點(diǎn)fd上的幅度,w表示角頻率,是相位偏移,σ是樣本標(biāo)準(zhǔn)差,表示值的分散程度。進(jìn)一步設(shè)定閾值τ(τ的選擇基于實(shí)驗(yàn)結(jié)果需求),若cosi<τ對(duì)于足夠多(可設(shè)置為95%)的樣本成立,即可認(rèn)為檢測(cè)到水印或嵌入水印成功。
26、對(duì)于兩個(gè)疑似的模型m1、m2,基于知識(shí)產(chǎn)權(quán)保護(hù)防止被非法復(fù)制或?yàn)E用,分別從各自的第di層提取輸出特征向量q1、q2,從q1、q2使用短時(shí)傅里葉變換stft得到時(shí)頻域表示f1(t,f)、f2(t,f),計(jì)算得到瞬時(shí)功率p1(t,f)、p2(t,f),公式為:
27、p1(t,f)=||f1(t,f)||2?(7)
28、p2(t,f)=||f2(t,f)||2?(8)其中||f1(t,f)||2、||f2(t,f)||2分別表示f1、f2在(t,f)點(diǎn)的功率。對(duì)每個(gè)頻率f進(jìn)行時(shí)間平均得到功率譜密度psd:
29、
30、其中t0是時(shí)間窗口的起始點(diǎn),t是時(shí)間窗口,若t是離散的時(shí)間序列{tn},則公
31、式9,積分需改為求和。將功率譜密度psd在相同頻率范圍內(nèi)歸一化:
32、
33、計(jì)算相似度cosimilarity:
34、
35、若psd是在離散頻率點(diǎn)上計(jì)算的,那么公式11,12,13積分需改為求和。進(jìn)一步地,設(shè)定一個(gè)閾值ρ,如果cosimilarity>ρ,可以認(rèn)為兩個(gè)psd在某種程度上是相似的,或者說兩個(gè)模型的水印一致,即m1、m2有一方是知識(shí)產(chǎn)權(quán)侵權(quán)方。
36、本發(fā)明的第二個(gè)方面涉及一種基于區(qū)塊鏈智能合約的規(guī)則可信分發(fā)與自動(dòng)化部署裝置,包括存儲(chǔ)器和一個(gè)或多個(gè)處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述一個(gè)或多個(gè)處理器執(zhí)行所述可執(zhí)行代碼時(shí),用于實(shí)現(xiàn)本發(fā)明的基于區(qū)塊鏈智能合約的規(guī)則可信分發(fā)與自動(dòng)化部署方法。
37、本發(fā)明的第三個(gè)方面涉及一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序,該程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)本發(fā)明的基于區(qū)塊鏈智能合約的規(guī)則可信分發(fā)與自動(dòng)化部署方法。
38、本發(fā)明提出的多層次余弦模型水印嵌入技術(shù),通過獨(dú)特的層次化嵌入方法,兼顧了模型的復(fù)雜性與多樣性、水印的隱蔽性與魯棒性,同時(shí)易于集成和檢測(cè)。
39、本發(fā)明提出的可信分發(fā)部署方法,有效的結(jié)合區(qū)塊鏈技術(shù)、智能合約條件觸發(fā)機(jī)制與模型水印,實(shí)施嚴(yán)格的用戶訪問控制,營(yíng)造一個(gè)數(shù)據(jù)安全共享的環(huán)境,并實(shí)現(xiàn)定制化模型的分發(fā)與容器部署,從規(guī)則需求到應(yīng)用一鍵自動(dòng)化。
40、本發(fā)明具有以下優(yōu)點(diǎn):首先,對(duì)規(guī)則涉及隱私以及多方規(guī)則隔離困難與傳統(tǒng)方法無法實(shí)現(xiàn)跨主體的規(guī)則安全共享等問題,通過區(qū)塊鏈技術(shù)與精細(xì)的權(quán)限設(shè)置,實(shí)現(xiàn)不同主體規(guī)則域的有效隔離,確保規(guī)則安全可信分發(fā)。此外,通過智能合約,實(shí)現(xiàn)規(guī)則的自動(dòng)化部署,減少對(duì)人工干預(yù)的依賴。進(jìn)一步地,通過注入模型水印,能夠防止規(guī)則被非法復(fù)制和濫用,從而保護(hù)其知識(shí)產(chǎn)權(quán)。