本發(fā)明涉及無(wú)線(xiàn)充電網(wǎng)絡(luò)的電能傳輸領(lǐng)域,更具體的說(shuō),是針對(duì)具有對(duì)抗性場(chǎng)景的無(wú)線(xiàn)充電網(wǎng)絡(luò),提供一種確保電能傳輸高效性和安全性的方法。
背景技術(shù):
1、無(wú)線(xiàn)充電網(wǎng)絡(luò)中的無(wú)線(xiàn)電能傳輸(wireless?power?transmission)技術(shù)是指無(wú)線(xiàn)充電器輻射電磁波,將能量通過(guò)氣隙傳輸至可充電設(shè)備。憑借其可靠、無(wú)接觸和低維護(hù)性,無(wú)線(xiàn)電能傳輸技術(shù)已成為一種商業(yè)上可行的充電方式。然而,在電能傳輸過(guò)程中,周?chē)h(huán)境不可避免地會(huì)暴露于一定程度的電磁輻射(electromagnetic?radiation)之下。高電磁輻射暴露被認(rèn)定對(duì)人類(lèi)健康構(gòu)成威脅,可能導(dǎo)致組織損傷、心血管疾病和腦腫瘤等風(fēng)險(xiǎn)。因此,合格的無(wú)線(xiàn)充電方法必須遵循電磁輻射安全標(biāo)準(zhǔn),確保任何點(diǎn)的電磁輻射強(qiáng)度均不超過(guò)安全閾值。
2、目前,為了提供穩(wěn)定的能量供應(yīng)、實(shí)現(xiàn)設(shè)備的全面覆蓋,并保障充電設(shè)備故障時(shí)的充電連續(xù)性,無(wú)線(xiàn)充電網(wǎng)絡(luò)中的無(wú)線(xiàn)充電器部署密度通常高于理論最小值。盡管這種冗余設(shè)計(jì)增強(qiáng)了網(wǎng)絡(luò)的穩(wěn)健性,但也無(wú)意間為攻擊者提供了可乘之機(jī)。由于無(wú)線(xiàn)充電器缺乏物理防篡改措施,通常無(wú)人看管、遠(yuǎn)程放置且易于接近,惡意攻擊者可以捕獲并操控這些設(shè)備,通過(guò)激活額外的充電器,破壞網(wǎng)絡(luò)的電磁輻射安全約束,危害生物安全。現(xiàn)有的無(wú)線(xiàn)充電方法未考慮這種對(duì)抗充電場(chǎng)景,難以確保在遭受攻擊后的安全性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法及裝置,以保證網(wǎng)絡(luò)在遭受攻擊后,仍能保證電磁輻射的安全性和實(shí)際有效性。
2、為了實(shí)現(xiàn)以上發(fā)明目的,本發(fā)明的技術(shù)方案如下:
3、第一方面,一種無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法,包括以下步驟:
4、(1)根據(jù)無(wú)線(xiàn)充電網(wǎng)絡(luò)設(shè)備分布建立考慮波干涉的充電模型和電磁輻射模型,所述充電模型考慮不同充電器輻射的電磁波由于路徑長(zhǎng)度差異到達(dá)可充電設(shè)備時(shí)產(chǎn)生的相位變化計(jì)算多個(gè)充電器提供的累積充電功率;
5、(2)基于所建立的充電模型和電磁輻射模型構(gòu)建無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題的數(shù)學(xué)模型,所述無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題的優(yōu)化目標(biāo)是最大化所有可充電傳感器充電效用的和,同時(shí)保證電磁輻射安全約束,所述電磁輻射安全約束是指在遭受針對(duì)電磁輻射安全的攻擊后,網(wǎng)絡(luò)任一點(diǎn)的電磁輻射總量不超過(guò)預(yù)定的安全閾值;
6、(3)利用分段常數(shù)函數(shù)近似非線(xiàn)性電磁輻射,將無(wú)線(xiàn)充電網(wǎng)絡(luò)的二維平面區(qū)域劃分為多個(gè)等效電磁輻射子區(qū)域,根據(jù)干涉特性計(jì)算各個(gè)等效電磁輻射子區(qū)域的最大輻射值點(diǎn),基于最大輻射值點(diǎn)的輻射約束,將所述無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題轉(zhuǎn)化為有限約束的雙層優(yōu)化問(wèn)題;
7、(4)針對(duì)轉(zhuǎn)化后的雙層優(yōu)化問(wèn)題,結(jié)合原始對(duì)偶優(yōu)化與多智能體深度強(qiáng)化學(xué)習(xí)框架,提出一種約束強(qiáng)化學(xué)習(xí)算法用于生成防御策略,實(shí)現(xiàn)斯塔克爾伯格均衡以對(duì)抗最優(yōu)攻擊,所述約束強(qiáng)化學(xué)習(xí)算法中,防御者和攻擊者被視作執(zhí)行深度確定性策略梯度的智能體,具備執(zhí)行網(wǎng)絡(luò)和雙重評(píng)價(jià)網(wǎng)絡(luò),采用拉格朗日松弛技術(shù)將約束優(yōu)化問(wèn)題轉(zhuǎn)化為無(wú)約束問(wèn)題,采用原始-對(duì)偶優(yōu)化方法迭代更新策略和對(duì)偶變量。
8、第二方面,一種無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電策略決策裝置,包括:
9、考慮波干涉的充電模型和電磁輻射模型構(gòu)建模塊,用于根據(jù)無(wú)線(xiàn)充電網(wǎng)絡(luò)設(shè)備分布建立考慮波干涉的充電模型和電磁輻射模型,所述充電模型考慮不同充電器輻射的電磁波由于路徑長(zhǎng)度差異到達(dá)可充電設(shè)備時(shí)產(chǎn)生的相位變化計(jì)算多個(gè)充電器提供的累積充電功率;
10、安全充電問(wèn)題數(shù)學(xué)模型構(gòu)建模塊,用于基于所建立的充電模型和電磁輻射模型構(gòu)建無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題的數(shù)學(xué)模型,所述無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題的優(yōu)化目標(biāo)是最大化所有可充電傳感器充電效用的和,同時(shí)保證電磁輻射安全約束,所述電磁輻射安全約束是指在遭受針對(duì)電磁輻射安全的攻擊后,網(wǎng)絡(luò)任一點(diǎn)的電磁輻射總量不超過(guò)預(yù)定的安全閾值;
11、安全充電問(wèn)題數(shù)學(xué)模型轉(zhuǎn)換模塊,用于利用分段常數(shù)函數(shù)近似非線(xiàn)性電磁輻射,將無(wú)線(xiàn)充電網(wǎng)絡(luò)的二維平面區(qū)域劃分為多個(gè)等效電磁輻射子區(qū)域,根據(jù)干涉特性計(jì)算各個(gè)等效電磁輻射子區(qū)域的最大輻射值點(diǎn),基于最大輻射值點(diǎn)的輻射約束,將所述無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題轉(zhuǎn)化為有限約束的雙層優(yōu)化問(wèn)題;
12、基于約束強(qiáng)化學(xué)習(xí)的防御策略生成模塊,用于針對(duì)轉(zhuǎn)化后的雙層優(yōu)化問(wèn)題,結(jié)合原始對(duì)偶優(yōu)化與多智能體深度強(qiáng)化學(xué)習(xí)框架,提出一種約束強(qiáng)化學(xué)習(xí)算法用于生成防御策略,實(shí)現(xiàn)斯塔克爾伯格均衡以對(duì)抗最優(yōu)攻擊,所述約束強(qiáng)化學(xué)習(xí)算法中,防御者和攻擊者被視作執(zhí)行深度確定性策略梯度的智能體,具備執(zhí)行網(wǎng)絡(luò)和雙重評(píng)價(jià)網(wǎng)絡(luò),采用拉格朗日松弛技術(shù)將約束優(yōu)化問(wèn)題轉(zhuǎn)化為無(wú)約束問(wèn)題,采用原始-對(duì)偶優(yōu)化方法迭代更新策略和對(duì)偶變量。
13、第三方面,本發(fā)明還提供一種計(jì)算機(jī)設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器;以及一個(gè)或多個(gè)程序,其中所述一個(gè)或多個(gè)程序被存儲(chǔ)在所述存儲(chǔ)器中,并且被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法的步驟。
14、第四方面,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法的步驟。
15、有益效果:
16、(1)本發(fā)明提出了一種在無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法,首先構(gòu)建一個(gè)考慮波干擾的充電和電磁輻射模型,用以精確計(jì)算充電功率和電磁輻射分布;然后利用分段常數(shù)函數(shù)近似非線(xiàn)性電磁輻射,將二維區(qū)域劃分為多個(gè)等效子區(qū)域,利用基于干涉特性的最大輻射點(diǎn)計(jì)算方法將區(qū)域內(nèi)所有點(diǎn)的電磁輻射安全約束簡(jiǎn)化為最大值點(diǎn)的有限約束,把無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊點(diǎn)安全充電問(wèn)題化為有限約束的雙層優(yōu)化問(wèn)題;最后采用對(duì)偶學(xué)習(xí)方法結(jié)合強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn)對(duì)抗最優(yōu)攻擊的防御充電策略,該策略能夠?qū)崿F(xiàn)斯塔克爾伯格均衡。該方法通過(guò)通過(guò)確定無(wú)線(xiàn)充電器的開(kāi)關(guān)狀態(tài),在應(yīng)對(duì)攻擊的同時(shí),最大程度地提升整體充電效用并保證電磁輻射安全。
17、(2)本發(fā)明結(jié)合原始對(duì)偶優(yōu)化與多智能體深度強(qiáng)化學(xué)習(xí)框架,提出一種約束強(qiáng)化學(xué)習(xí)算法,原始對(duì)偶訓(xùn)練方法能夠有效管理關(guān)鍵約束,優(yōu)化充電效用的同時(shí)確保電磁輻射安全;多智能體深度強(qiáng)化學(xué)習(xí)框架能夠捕捉防御者與攻擊者之間的復(fù)雜交互,制定穩(wěn)健的防御策略;這種集成使算法在不斷優(yōu)化性能的過(guò)程中,努力實(shí)現(xiàn)斯塔克爾伯格均衡,最終確定對(duì)抗充電場(chǎng)景中的最佳防御策略。
1.一種無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,假設(shè)有n個(gè)相同的無(wú)線(xiàn)充電器和m個(gè)相同的可充電傳感器位于二維平面ω,所述充電模型表示如下:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,定義無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題如下:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,最大輻射值點(diǎn)的確定方法包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電問(wèn)題轉(zhuǎn)化為有限約束的雙層優(yōu)化問(wèn)題,表示為:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述約束強(qiáng)化學(xué)習(xí)算法采用集中訓(xùn)練與分散執(zhí)行框架,在執(zhí)行過(guò)程中,防御者智能體基于局部觀(guān)測(cè)最大化拉格朗日懲罰函數(shù),攻擊者智能體則在觀(guān)察后響應(yīng);智能體通過(guò)與環(huán)境交互收集經(jīng)驗(yàn),并存儲(chǔ)于經(jīng)驗(yàn)回放緩沖區(qū);當(dāng)環(huán)境達(dá)到終止?fàn)顟B(tài)即策略確定時(shí)重置;
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述約束強(qiáng)化學(xué)習(xí)算法包括:攻防策略決策構(gòu)造為馬爾可夫博弈模型其中,為狀態(tài)空間,為智能體i的離散動(dòng)作空間,為智能體的聯(lián)合動(dòng)作空間,為概率轉(zhuǎn)移機(jī)制,智能體i根據(jù)其狀態(tài)和行為獲得獎(jiǎng)勵(lì)并產(chǎn)生成本;智能體i的目標(biāo)是最大化其總預(yù)期回報(bào)和最小化其總預(yù)期成本其中ri:ci:γ∈[0,1]是折扣因子,t是時(shí)間范圍;
8.一種無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電策略決策裝置,其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器;以及一個(gè)或多個(gè)程序,其中所述一個(gè)或多個(gè)程序被存儲(chǔ)在所述存儲(chǔ)器中,并且被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的無(wú)線(xiàn)充電網(wǎng)絡(luò)中對(duì)抗攻擊的安全充電方法的步驟。