本公開涉及人工智能,具體涉及機器學習、深度學習、聯(lián)邦學習,特別涉及一種數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、聯(lián)邦學習系統(tǒng)、電子設備、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。
背景技術:
1、在聯(lián)邦學習任務場景中,廣告主包括用戶的廣告轉(zhuǎn)化數(shù)據(jù),媒體平臺包括用戶的媒體平臺行為數(shù)據(jù)。廣告主和媒體平臺需要在不將本方數(shù)據(jù)泄露給對方的情況下利用各自所擁有的數(shù)據(jù)完成神經(jīng)網(wǎng)絡建模,而該過程需要雙方進行頻繁的加解密操作。隨著互聯(lián)網(wǎng)技術和大數(shù)據(jù)技術的發(fā)展,數(shù)據(jù)安全的重要性日益凸顯。因此,在數(shù)據(jù)的傳輸、計算和存儲等過程中,需要對數(shù)據(jù)進行加密計算,以確保數(shù)據(jù)不會被他人獲取,從而確保數(shù)據(jù)安全。
2、加密計算通常涉及復雜的數(shù)學運算,因此,加密計算通常需要占用較多的計算資源,或者需要較長的計算時間。目前,希望對現(xiàn)有的數(shù)據(jù)處理方式進行改進,以減少所占用的計算資源,或降低所使用的計算時間。
3、在此部分中描述的方法不一定是之前已經(jīng)設想到或采用的方法。除非另有指明,否則不應假定此部分中描述的任何方法僅因其包括在此部分中就被認為是現(xiàn)有技術。類似地,除非另有指明,否則此部分中提及的問題不應認為在任何現(xiàn)有技術中已被公認。
技術實現(xiàn)思路
1、本公開提供了一種數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、電子設備、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。
2、根據(jù)本公開的一方面,提供了一種數(shù)據(jù)處理方法,應用于聯(lián)邦學習任務中的任一參與方,該參與方與聯(lián)邦學習任務中的其他參與方通信連接。該方法包括:確定用于加密的橢圓曲線,其中,該參與方和其他參與方被配置為使用同一橢圓曲線;利用橢圓曲線對該參與方的第一特征數(shù)據(jù)進行加密,得到密文矩陣,其中,第一特征數(shù)據(jù)是利用橢圓曲線對該參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的;將密文矩陣發(fā)送至其他參與方;從其他參與方接收中間數(shù)據(jù),其中,中間數(shù)據(jù)是其他參與方基于橢圓曲線對其他參與方的第二特征數(shù)據(jù)和密文矩陣進行處理后得到的,第二特征數(shù)據(jù)是利用橢圓曲線對其他參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的,該參與方的原始特征數(shù)據(jù)和其他參與方的原始特征數(shù)據(jù)對應同樣的至少一個樣本;以及對中間數(shù)據(jù)進行解密,以得到用于聯(lián)邦學習任務的目標數(shù)據(jù)。
3、根據(jù)本公開的另一方面,提供了一種數(shù)據(jù)處理方法,應用于聯(lián)邦學習任務中的任一參與方,該參與方與聯(lián)邦學習任務中的其他參與方通信連接。該方法包括:確定用于加密的橢圓曲線,其中,該參與方和其他參與方被配置為使用同一橢圓曲線;從其他參與方接收密文矩陣,其中,密文矩陣是其他參與方利用橢圓曲線對其他參與方的第一特征數(shù)據(jù)進行加密而得到的,第一特征數(shù)據(jù)是其他參與方利用橢圓曲線對其他參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的;基于橢圓曲線對該參與方的第二特征數(shù)據(jù)和密文矩陣進行處理,以得到中間數(shù)據(jù),第二特征數(shù)據(jù)是利用橢圓曲線對該參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的,該參與方的原始特征數(shù)據(jù)和其他參與方的原始特征數(shù)據(jù)對應同樣的至少一個樣本;以及將中間數(shù)據(jù)發(fā)送至其他參與方。
4、根據(jù)本公開的另一方面,提供了一種數(shù)據(jù)處理裝置,應用于聯(lián)邦學習任務中的任一參與方,該參與方與聯(lián)邦學習任務中的其他參與方通信連接。該裝置包括:第一確定單元,被配置為確定用于加密的橢圓曲線,其中,該參與方和其他參與方被配置為使用同一橢圓曲線;加密單元,被配置為利用橢圓曲線對該參與方的第一特征數(shù)據(jù)進行加密,得到密文矩陣,其中,第一特征數(shù)據(jù)是利用橢圓曲線對該參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的;第一發(fā)送單元,被配置為將密文矩陣發(fā)送至其他參與方;第一接收單元,被配置為從其他參與方接收中間數(shù)據(jù),其中,中間數(shù)據(jù)是其他參與方基于橢圓曲線對其他參與方的第二特征數(shù)據(jù)和密文矩陣進行處理后得到的,第二特征數(shù)據(jù)是利用橢圓曲線對其他參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的,該參與方的原始特征數(shù)據(jù)和其他參與方的原始特征數(shù)據(jù)對應同樣的至少一個樣本;以及解密單元,被配置為對中間數(shù)據(jù)進行解密,以得到用于聯(lián)邦學習任務的目標數(shù)據(jù)。
5、根據(jù)本公開的另一方面,提供了一種數(shù)據(jù)處理裝置,應用于聯(lián)邦學習任務中的任一參與方,該參與方與聯(lián)邦學習任務中的其他參與方通信連接。該裝置包括:第二確定單元,被配置為確定用于加密的橢圓曲線,其中,該參與方和其他參與方被配置為使用同一橢圓曲線;第二接收單元,被配置為從其他參與方接收密文矩陣,其中,密文矩陣是其他參與方利用橢圓曲線對其他參與方的第一特征數(shù)據(jù)進行加密而得到的,第一特征數(shù)據(jù)是其他參與方利用橢圓曲線對其他參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的;處理單元,被配置為基于橢圓曲線對該參與方的第二特征數(shù)據(jù)和密文矩陣進行處理,以得到中間數(shù)據(jù),第二特征數(shù)據(jù)是利用橢圓曲線對該參與方的切分后的原始特征數(shù)據(jù)進行處理而得到的,該參與方的原始特征數(shù)據(jù)和其他參與方的原始特征數(shù)據(jù)對應同樣的至少一個樣本;以及第二發(fā)送單元,被配置為將中間數(shù)據(jù)發(fā)送至其他參與方。
6、根據(jù)本公開的另一方面,提供了一種聯(lián)邦學習系統(tǒng),包括上述具有加密單元和解密單元的數(shù)據(jù)處理裝置和上述具有處理單元的數(shù)據(jù)處理裝置。
7、根據(jù)本公開的另一方面,提供了一種電子設備,包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中存儲器存儲有可被至少一個處理器執(zhí)行的指令,指令被至少一個處理器執(zhí)行,以使至少一個處理器能夠執(zhí)行如本公開的數(shù)據(jù)處理方法。
8、根據(jù)本公開的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,計算機指令用于使計算機執(zhí)行如本公開的數(shù)據(jù)處理方法。
9、根據(jù)本公開的另一方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,其中,計算機程序在被處理器執(zhí)行時實現(xiàn)如本公開的數(shù)據(jù)處理方法。
10、根據(jù)本公開的一個或多個實施例,通過使用橢圓曲線能夠?qū)崿F(xiàn)對聯(lián)邦學習任務的各參與方的特征數(shù)據(jù)的高效加密,并且可以降低參與方之間的數(shù)據(jù)傳輸量,從而提升各參與方處理聯(lián)邦學習任務的效率。而通過將數(shù)據(jù)切分和橢圓曲線加密進行結合,能夠進一步提升聯(lián)邦學習過程的安全性。
11、應當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種數(shù)據(jù)處理方法,應用于聯(lián)邦學習任務中的任一參與方,該參與方與所述聯(lián)邦學習任務中的其他參與方通信連接,所述方法包括:
2.根據(jù)權利要求1所述的方法,其中,確定用于加密的橢圓曲線包括:
3.根據(jù)權利要求2所述的方法,其中,所述第一特征數(shù)據(jù)包括與至少一個樣本對應的特征數(shù)據(jù),基于所述第一參數(shù)和所述第二參數(shù)對所述第一特征數(shù)據(jù)進行加密,以得到密文矩陣包括:
4.根據(jù)權利要求2所述的方法,其中,所述中間數(shù)據(jù)包括第一中間數(shù)據(jù)和第二中間數(shù)據(jù),所述第一中間數(shù)據(jù)是基于所述第一參數(shù)和用于所述其他參與方的第三參數(shù)而得到的,所述第二中間數(shù)據(jù)是基于所述密文矩陣、所述第二特征數(shù)據(jù)、以及所述第三參數(shù)而得到的,
5.根據(jù)權利要求4所述的方法,其中,所述第一中間數(shù)據(jù)是將所述第一參數(shù)和所述第三參數(shù)相乘而得到的。
6.根據(jù)權利要求4所述的方法,其中,所述第二中間數(shù)據(jù)是將所述第二特征數(shù)據(jù)減去預設值后與所述密文矩陣相加的結果與所述第三參數(shù)相乘而得到的。
7.根據(jù)權利要求5所述的方法,其中,基于所述第二參數(shù)、所述第一中間數(shù)據(jù)以及所述第二中間數(shù)據(jù),以得到目標數(shù)據(jù)包括:
8.根據(jù)權利要求5所述的方法,還包括:
9.根據(jù)權利要求5所述的方法,其中,確定用于加密的橢圓曲線包括:
10.根據(jù)權利要求9所述的方法,還包括:
11.根據(jù)權利要求9所述的方法,其中,所述第二參數(shù)表征待訓練的神經(jīng)網(wǎng)絡中的偏置。
12.根據(jù)權利要求1所述的方法,還包括:
13.根據(jù)權利要求12所述的方法,其中,基于所述第一切片數(shù)據(jù)和所述第二切片數(shù)據(jù),確定所述第一特征數(shù)據(jù)包括:
14.根據(jù)權利要求1所述的方法,其中,所述密文矩陣中的每一項均為16位數(shù),其中,將所述密文矩陣發(fā)送至所述其他參與方包括:
15.根據(jù)權利要求12所述的方法,其中,所述橢圓曲線和所述切分方式均是由該參與方和所述其他參與方各自的可信執(zhí)行環(huán)境所確定的。
16.根據(jù)權利要求1所述的方法,其中,該參與方包括廣告主,所述其他參與方包括媒體平臺,該參與方的原始特征數(shù)據(jù)包括對應的用戶的廣告轉(zhuǎn)化數(shù)據(jù),所述其他參與方的原始特征數(shù)據(jù)包括對應的用戶的媒體平臺行為數(shù)據(jù)。
17.一種數(shù)據(jù)處理方法,應用于聯(lián)邦學習任務中的任一參與方,該參與方與所述聯(lián)邦學習任務中的其他參與方通信連接,所述方法包括:
18.根據(jù)權利要求17所述的方法,其中,確定用于加密的橢圓曲線包括:
19.根據(jù)權利要求18所述的方法,其中,所述中間數(shù)據(jù)包括第一中間數(shù)據(jù)和第二中間數(shù)據(jù),基于所述橢圓曲線對該參與方的第二特征數(shù)據(jù)和所述密文矩陣進行處理,以得到中間數(shù)據(jù)包括:
20.根據(jù)權利要求19所述的方法,其中,確定用于加密的橢圓曲線包括:
21.根據(jù)權利要求17所述的方法,還包括:
22.根據(jù)權利要求21所述的方法,其中,基于所述第三切片數(shù)據(jù)和所述第四切片數(shù)據(jù),確定所述第二特征數(shù)據(jù)包括:
23.一種數(shù)據(jù)處理裝置,應用于聯(lián)邦學習任務中的任一參與方,該參與方與所述聯(lián)邦學習任務中的其他參與方通信連接,所述裝置包括:
24.一種數(shù)據(jù)處理裝置,應用于聯(lián)邦學習任務中的任一參與方,該參與方與所述聯(lián)邦學習任務中的其他參與方通信連接,所述裝置包括:
25.一種聯(lián)邦學習系統(tǒng),包括:
26.一種電子設備,包括:
27.一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,所述計算機指令用于使所述計算機執(zhí)行根據(jù)權利要求1-22中任一項所述的方法。
28.一種計算機程序產(chǎn)品,包括計算機程序,其中,所述計算機程序在被處理器執(zhí)行時實現(xiàn)權利要求1-22中任一項所述的方法。