一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法

文檔序號：40644352發(fā)布日期：2025-01-10 18:50閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>測量裝置的制造及其應(yīng)用技術(shù)>一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法

技術(shù)特征：

1.一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，包括如下步驟：

2.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述雷達信號回波模型的構(gòu)建方法為：

3.根據(jù)權(quán)利要求2所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，通過所述雷達信號回波模型發(fā)射并接收n個脈沖后得到雷達信號回波的行向量為x＝[x1,x2,...,xn]。

4.根據(jù)權(quán)利要求3所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述雷達雜波回波模型的構(gòu)建方法：

5.根據(jù)權(quán)利要求4所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述rmax選取的值：需要大于目標(biāo)距離，最大值為在處地雜波的回波功率小于處地雜波回波功率特定值。

6.根據(jù)權(quán)利要求4所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，在距離范圍[rmin,rmax]內(nèi)以雷達的距離分辨率δr為間隔進行網(wǎng)格劃分，其中，δr＝cτ/2，τ為雷達發(fā)射脈沖的寬度。

7.根據(jù)權(quán)利要求4所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述方位角間隔的選取準(zhǔn)則為：使每個方位角間隔對應(yīng)的雜波單元內(nèi)的多普勒變化量不超過雷達的多普勒分辨率δfd，其中δfd＝1/(tn)。

8.根據(jù)權(quán)利要求4所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述步驟2中，信號雜波回波距離多普勒矩陣的計算方法為：根據(jù)目標(biāo)所在距離將雷達信號回波的行向量x疊加到雜波回波矩陣y對應(yīng)的行，得到信號雜波矩陣z；再根據(jù)雷達最大不模糊距離單元數(shù)對信號雜波矩陣z進行按行折疊并疊加得到l′行n列信號雜波矩陣z′；最后對z′的每行進行快速傅里葉變換得到信號雜波回波距離多普勒矩陣z′f。

9.根據(jù)權(quán)利要求8所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述強化學(xué)習(xí)環(huán)境的建立方法為：設(shè)定環(huán)境的狀態(tài)s為信號雜波距離多普勒矩陣z′f，智能體動作值a為脈間調(diào)頻率p；所述智能體根據(jù)當(dāng)前環(huán)境的狀態(tài)s,即生成動作a；下一幀雷達波形的第n個發(fā)射脈沖根據(jù)脈間調(diào)頻率p變化為sn(t)＝exp(j2π(f0+npt)t)，環(huán)境根據(jù)信號雜波回波距離多普勒矩陣計算出新的狀態(tài)s’，即雷達幀的信號雜波距離多普勒矩陣z′f，new，并給出獎勵值r，重復(fù)上述步驟，從而得到大量數(shù)據(jù)對{s,a,s’,r}。

10.根據(jù)權(quán)利要求9所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述獎勵值r的計算方法為：

11.根據(jù)權(quán)利要求9所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述環(huán)境的狀態(tài)s中添加有雷達的位置信息、目標(biāo)相對于雷達的角度。

12.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，其特征在于，所述強化學(xué)習(xí)方法為近鄰策略優(yōu)化算法或軟演員-評論家算法。

技術(shù)總結(jié)
本發(fā)明提出了一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法，包括如下步驟：首先，分別根據(jù)脈間調(diào)頻脈沖多普勒雷達構(gòu)建雷達信號回波模型和雷達雜波回波模型；根據(jù)雷達信號回波模型和雷達雜波回波模型，計算信號雜波回波距離多普勒矩陣；然后建立強化學(xué)習(xí)環(huán)境并引入獎勵函數(shù)，從而得到大量強化學(xué)習(xí)數(shù)據(jù)對；將大量強化學(xué)習(xí)數(shù)據(jù)對作為輸入，結(jié)合強化學(xué)習(xí)算法，即可對智能體進行訓(xùn)練；最后，應(yīng)用完成訓(xùn)練后的智能體輸出優(yōu)化后的脈間調(diào)頻脈沖多普勒波形，實現(xiàn)雜波位置的調(diào)控。該方法通過提出脈間調(diào)頻的脈沖多普勒波形，使得雷達具備主動調(diào)控雜波位置的能力。

技術(shù)研發(fā)人員：潘玉劍,楊阿鋒,胡杰民
受保護的技術(shù)使用者：杭州電子科技大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于強化學(xué)習(xí)的空基雷達時域波形自適應(yīng)方法