本發(fā)明涉及通信,尤其涉及一種相控陣天線多波束自動(dòng)優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
::1、控陣天線工作模式多,波束數(shù)量多,指向精度要求高,并且需要在地面測(cè)試完成后存儲(chǔ)波束控制碼以待輸入波控系統(tǒng)使用,波束控制碼中包含控制波束掃描的饋電組件控制信息,如發(fā)送接收組件饋電幅度衰減控制量、饋電相位移相控制量以及延時(shí)放大組件延時(shí)控制量等。為完成相控陣天線多波束校準(zhǔn),獲取各波束的波束控制碼,需要采用合適的優(yōu)化方法。因此,如何有效地針對(duì)相控陣天線的多波束系統(tǒng)開發(fā)一種全自動(dòng)化的優(yōu)化方法,以確保在各種復(fù)雜的空間環(huán)境下,精確測(cè)定并應(yīng)用各個(gè)波束的波束控制碼,從而實(shí)現(xiàn)快速準(zhǔn)確的波束指向與切換,滿足空間通信和探測(cè)任務(wù)對(duì)高指向精度和多目標(biāo)追蹤的要求,已越來(lái)越成為一個(gè)亟需解決的問(wèn)題。技術(shù)實(shí)現(xiàn)思路1、本發(fā)明實(shí)施例提供一種相控陣天線多波束自動(dòng)優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),能夠?qū)崟r(shí)自適應(yīng)優(yōu)化相控陣天線多波束,實(shí)現(xiàn)了快速準(zhǔn)確的波束指向與切換,滿足空間通信和探測(cè)任務(wù)對(duì)高指向精度和多目標(biāo)追蹤的要求,確保其在復(fù)雜多變的空間環(huán)境中始終發(fā)揮最佳效能。2、本發(fā)明一實(shí)施例提供一種相控陣天線多波束自動(dòng)優(yōu)化方法,包括:3、構(gòu)建基于稀疏編碼和深度神經(jīng)網(wǎng)絡(luò)的波束優(yōu)化模型;所述波束優(yōu)化模型用于預(yù)測(cè)不同波束指向下的最優(yōu)饋電參數(shù)組合,所述波束優(yōu)化模型的輸入層用于接收特征向量,所述波束優(yōu)化模型的輸出層用于預(yù)測(cè)對(duì)應(yīng)的波束控制碼值;所述波束優(yōu)化模型是基于預(yù)先獲取到的相控陣天線的工作數(shù)據(jù)樣本進(jìn)行訓(xùn)練的;4、利用強(qiáng)化學(xué)習(xí)策略對(duì)構(gòu)建好的所述波束優(yōu)化模型進(jìn)行優(yōu)化,使得所述波束優(yōu)化模型能根據(jù)實(shí)際空間環(huán)境和工作狀態(tài)的反饋,自主調(diào)整波束控制策略;5、建立一個(gè)多任務(wù)學(xué)習(xí)框架,讓所述波束優(yōu)化模型同時(shí)學(xué)習(xí)多個(gè)波束之間的相互影響和耦合效應(yīng),以實(shí)現(xiàn)全局最優(yōu)解;6、將訓(xùn)練好的所述波束優(yōu)化模型部署到星載衛(wèi)星中,以使得訓(xùn)練好的所述波束優(yōu)化模型根據(jù)所述星載衛(wèi)星當(dāng)前的相控陣天線的工作參數(shù)來(lái)輸出最優(yōu)的波束控制碼,從而使得星載衛(wèi)星基于所述最優(yōu)的波束控制碼控制相控陣天線的工作。7、作為上述方案的改進(jìn),所述構(gòu)建基于稀疏編碼和深度神經(jīng)網(wǎng)絡(luò)的波束優(yōu)化模型,包括:8、初始化基于稀疏編碼和深度神經(jīng)網(wǎng)絡(luò)的波束優(yōu)化模型;初始化的波束優(yōu)化模型的模型架構(gòu)包括輸入層、隱藏層和輸出層;其中,輸入層用于接收特征向量;隱藏層的第一層為稀疏編碼層,編碼維度設(shè)為原始特征向量長(zhǎng)度的1/4,激活函數(shù)采用硬閾值函數(shù),保持輸入的稀疏性,后續(xù)隱藏層為3個(gè)全連接層,每層節(jié)點(diǎn)數(shù)分別為512、256、128,激活函數(shù)均為relu;輸出層用于預(yù)測(cè)對(duì)應(yīng)波束指向下的波束控制碼值;初始化的波束優(yōu)化模型的優(yōu)化器選用了adam優(yōu)化器,設(shè)置學(xué)習(xí)率為0.001;損失函數(shù)設(shè)定為:9、nbeams為波束總數(shù),為各控制碼損失項(xiàng)的權(quán)重;10、獲取到的相控陣天線的工作數(shù)據(jù)樣本進(jìn)行特征提;所述工作數(shù)據(jù)樣本包括:波束指向掃描角度和饋電參數(shù),饋電參數(shù)包括:注入信號(hào)功率、透射功率、饋電幅度ai和饋電相位11、應(yīng)用深度學(xué)習(xí)特征提取技術(shù),對(duì)所述工作數(shù)據(jù)樣本進(jìn)行特征提取,得到對(duì)應(yīng)的特征向量:關(guān)鍵特征包括:發(fā)送接收組件的電氣特性曲線、波束形狀參數(shù)和空間分布關(guān)系;12、將特征向量與實(shí)際測(cè)量的波束控制碼值配對(duì),劃分為訓(xùn)練集和驗(yàn)證集;13、將訓(xùn)練集劃分為多個(gè)小批量,進(jìn)行mini-batch梯度下降,每次迭代,從訓(xùn)練集中隨機(jī)抽取一個(gè)批量數(shù)據(jù)送入模型進(jìn)行前向傳播;14、計(jì)算模型在當(dāng)前批量訓(xùn)練集上輸出的預(yù)測(cè)控制碼,并計(jì)算損失函數(shù)值;15、根據(jù)損失函數(shù)的梯度,通過(guò)反向傳播算法計(jì)算模型參數(shù)的梯度;16、利用adam優(yōu)化器根據(jù)梯度更新模型參數(shù);17、每經(jīng)過(guò)預(yù)定次數(shù)的迭代,使用驗(yàn)證集評(píng)估模型性能;如果驗(yàn)證集性能不再提升或達(dá)到預(yù)設(shè)的停止條件,則終止對(duì)所述波束優(yōu)化模型的訓(xùn)練。18、作為上述方案的改進(jìn),所述應(yīng)用深度學(xué)習(xí)特征提取技術(shù),對(duì)所述工作數(shù)據(jù)樣本進(jìn)行特征提取,得到對(duì)應(yīng)的特征向量,包括:19、針對(duì)每個(gè)發(fā)送接收組件,使用插值法擬合其在不同波束指向下的饋電幅度衰減曲線ai(θ,φ)和饋電相位移相曲線φi(θ,φ)兩者,并計(jì)算兩者隨時(shí)間的動(dòng)態(tài)變化率,得到電氣特性變化曲線;20、對(duì)于每個(gè)波束指向掃描角度,根據(jù)透射功率計(jì)算波束增益gj,從而得到波束形狀參數(shù):21、ptransmitj為透射功率,pinjected為注入信號(hào)功率;22、利用三維繪圖軟件,根據(jù)波束指向數(shù)據(jù)繪制波束覆蓋范圍圖,明確相鄰波束交疊區(qū)域,從而得到所述空間分布關(guān)系。23、作為上述方案的改進(jìn),所述利用強(qiáng)化學(xué)習(xí)策略對(duì)構(gòu)建好的所述波束優(yōu)化模型進(jìn)行優(yōu)化,使得所述波束優(yōu)化模型能根據(jù)實(shí)際空間環(huán)境和工作狀態(tài)的反饋,自主調(diào)整波束控制策略,包括:24、定義強(qiáng)化學(xué)習(xí)環(huán)境;其中,通過(guò)以下方式定義強(qiáng)化學(xué)習(xí)的狀態(tài):其中,θ為當(dāng)前波束的方位角,表示波束在水平面上的指向;φ為當(dāng)前波束的俯仰角,表示波束在垂直面上的指向;為第i個(gè)發(fā)送接收組件的饋電幅度,反映天線在該組件處的信號(hào)強(qiáng)度;t為環(huán)境溫度,表征影響天線材料的電氣性能和發(fā)送接收組件的穩(wěn)定性;n為空間噪聲水平,包表征影響通信質(zhì)量和波束檢測(cè)準(zhǔn)確性;通過(guò)以下方式定義強(qiáng)化學(xué)習(xí)的動(dòng)作:其中,δai為第i個(gè)發(fā)送接收組件的饋電幅度調(diào)整量,用于校正幅度失配或優(yōu)化波束指向;為第i個(gè)發(fā)送接收組件的饋電相位調(diào)整量,用于調(diào)整波束指向或改善波束形狀;δtk為第k個(gè)延時(shí)放大組件的延時(shí)控制量(delaycontro?l,用于精確控制信號(hào)到達(dá)各發(fā)送接收組件的時(shí)間差,進(jìn)而調(diào)整波束指向;通過(guò)以下方式定義強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù):r=f(g,hpbw,sll,preflect,ptransmit,ntotal)其中,g為波束增益,反映天線將能量集中到主瓣的能力;hpbw為半功率波束寬度,表征波束的聚焦程度;sll為旁瓣電平,衡量波束副瓣對(duì)主瓣的影響;preflect為反射功率,表示天線向后散射的能量;ptransmit為透射功率,即有效發(fā)射到指定方向的功率;ntotal為總噪聲功率,反映系統(tǒng)信噪比;其中,獎(jiǎng)勵(lì)函數(shù)的具體公式設(shè)定為:其中,wg,whpbw,wsll,是權(quán)重系數(shù),用于平衡不同性能指標(biāo)對(duì)獎(jiǎng)勵(lì)函數(shù)的貢獻(xiàn);25、創(chuàng)建一個(gè)表格q-table,其大小為狀態(tài)空間大小(|s|)乘以動(dòng)作空間大小(|a|),所有元素初始值設(shè)為0;q-table用于存儲(chǔ)在每個(gè)狀態(tài)s下執(zhí)行每個(gè)動(dòng)作a的預(yù)期累積獎(jiǎng)勵(lì);26、根據(jù)當(dāng)前狀態(tài)s,根據(jù)ε-greedy策略從q-table中選擇一個(gè)動(dòng)作a執(zhí)行;27、在相控陣天線上執(zhí)行選定的動(dòng)作,觀測(cè)到新的狀態(tài)s′和獲得的即時(shí)獎(jiǎng)勵(lì)r;28、按照以下設(shè)定的q-learning更新規(guī)則更新q-table中的對(duì)應(yīng)項(xiàng):29、其中,α為學(xué)習(xí)率,控制新經(jīng)驗(yàn)對(duì)已有q-value的影響程度,α=0.1;γ是折扣因子,決定對(duì)未來(lái)獎(jiǎng)勵(lì)的重視程度,γ=0.9。30、作為上述方案的改進(jìn),所述建立一個(gè)多任務(wù)學(xué)習(xí)框架,讓所述波束優(yōu)化模型同時(shí)學(xué)習(xí)多個(gè)波束之間的相互影響和耦合效應(yīng),以實(shí)現(xiàn)全局最優(yōu)解,包括:31、在所述波束優(yōu)化模型的模型結(jié)構(gòu)中,為多波束設(shè)置共享的隱藏層,該共享的隱藏層包括稀疏編碼層與前兩個(gè)全連接層,該共享的隱藏層用于學(xué)習(xí)共性的波束形成規(guī)律;32、為每個(gè)波束設(shè)置獨(dú)立的輸出層,預(yù)測(cè)各自的波束控制碼;33、在預(yù)測(cè)新波束控制碼時(shí),通過(guò)注意力機(jī)制考慮其他波束的狀態(tài),以實(shí)現(xiàn)全局最優(yōu)解;注意力機(jī)制實(shí)現(xiàn)過(guò)程包括:34、對(duì)于第j個(gè)波束的控制碼預(yù)測(cè),引入一個(gè)注意力向量aj來(lái)加權(quán)融合其他波束的狀態(tài)信息:其中,nbeams為波束總數(shù),表示系統(tǒng)中可以獨(dú)立控制的波束數(shù)量;hi為第i個(gè)波束對(duì)應(yīng)的隱藏層輸出向量,包含了該波束在模型內(nèi)部學(xué)習(xí)到的特征表示;w為可學(xué)習(xí)的注意力權(quán)重向量,用于計(jì)算每個(gè)波束隱藏層輸出向量的注意力得分,經(jīng)過(guò)softmax函數(shù)歸一化后,形成對(duì)其他波束信息的加權(quán)組合;softmax(·)為歸一化函數(shù),將權(quán)重向量與隱藏層輸出向量的點(diǎn)積結(jié)果轉(zhuǎn)換為概率分布,確保加權(quán)和為1;35、將加權(quán)后的注意力向量aj與當(dāng)前波束j的隱藏層輸出向量hi拼接,作為新的輸入傳遞給獨(dú)立輸出層,預(yù)測(cè)波束j的控制碼:分別為第j個(gè)波束的饋電幅度調(diào)整量、饋電相位調(diào)整量和延時(shí)控制量預(yù)測(cè)值,outputlayer表示模型的最后一層神經(jīng)網(wǎng)絡(luò),負(fù)責(zé)將拼接后的向量轉(zhuǎn)化為控制碼預(yù)測(cè);36、在訓(xùn)練過(guò)程中,通過(guò)以下方式同時(shí)更新共享的底層特征層和獨(dú)立的輸出層參數(shù):使用多任務(wù)學(xué)習(xí)策略,將多個(gè)波束的控制碼預(yù)測(cè)作為不同的子任務(wù),共同優(yōu)化一個(gè)損失函數(shù):,37、其中,l為總損失函數(shù),用于衡量模型在所有波束控制碼預(yù)測(cè)任務(wù)上的表現(xiàn);mse為均方誤差函數(shù),用于計(jì)算模型預(yù)測(cè)值與真實(shí)值之間的差異;分別為模型預(yù)測(cè)的第j個(gè)波束的饋電幅度調(diào)整量、饋電相位調(diào)整量和延時(shí)控制量;分別為真實(shí)的第j個(gè)波束的饋電幅度調(diào)整量、饋電相位調(diào)整量和延時(shí)控制量。38、作為上述方案的改進(jìn),所述將訓(xùn)練好的所述波束優(yōu)化模型部署到星載衛(wèi)星中,以使得訓(xùn)練好的所述波束優(yōu)化模型根據(jù)所述星載衛(wèi)星當(dāng)前的相控陣天線的工作參數(shù)來(lái)輸出最優(yōu)的波束控制碼,包括:39、獲取波束j當(dāng)前的狀態(tài)信息和其他波束的狀態(tài)信息;狀態(tài)信息包括:波束指向掃描角度和饋電參數(shù),饋電參數(shù)包括:注入信號(hào)功率、透射功率、饋電幅度ai和饋電相位40、將所有其他波束的狀態(tài)信息作為所述波束優(yōu)化模型的輸入,通過(guò)共享的底層特征層進(jìn)行特征提取,得到每個(gè)其他波束對(duì)應(yīng)的隱藏層輸出向量hi(i≠j);41、對(duì)每個(gè)其他波束的隱藏層輸出向量hi,利用訓(xùn)練過(guò)程中設(shè)定好的注意力權(quán)重wi向量進(jìn)行點(diǎn)積,并通過(guò)softmax函數(shù)歸一化,得到注意力得分αi:αi=softmax(wthi);42、根據(jù)注意力得分對(duì)其他波束的隱藏層輸出向量進(jìn)行加權(quán)求和,生成波束j的注意力向量aj:nbeams為波束總數(shù);43、將波束j的當(dāng)前狀態(tài)對(duì)應(yīng)的隱藏層輸出向量hi與計(jì)算得到的注意力向量aj拼接,形成新的輸入向量:44、將拼接后的輸入向量送入所述波束優(yōu)化模型的獨(dú)立輸出層outputlayer,通過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算得到波束j的控制碼調(diào)整量:45、根據(jù)預(yù)測(cè)的控制碼調(diào)整量,調(diào)整波束j的實(shí)際饋電幅度aj和相位aj←aj+△aj46、47、根據(jù)延時(shí)控制量δtj調(diào)整與波束j關(guān)聯(lián)的延時(shí)放大組件的延時(shí);48、最后通過(guò)訓(xùn)練好的所述波束優(yōu)化模型在訓(xùn)練過(guò)程中預(yù)先設(shè)置好的多任務(wù)學(xué)習(xí)策略優(yōu)化所有波束的整體性能。49、本發(fā)明另一實(shí)施例對(duì)應(yīng)提供了一種相控陣天線多波束自動(dòng)優(yōu)化裝置,包括:50、構(gòu)建模塊,用于構(gòu)建基于稀疏編碼和深度神經(jīng)網(wǎng)絡(luò)的波束優(yōu)化模型;所述波束優(yōu)化模型用于預(yù)測(cè)不同波束指向下的最優(yōu)饋電參數(shù)組合,所述波束優(yōu)化模型的輸入層用于接收特征向量,所述波束優(yōu)化模型的輸出層用于預(yù)測(cè)對(duì)應(yīng)的波束控制碼值;所述波束優(yōu)化模型是基于預(yù)先獲取到的相控陣天線的工作數(shù)據(jù)樣本進(jìn)行訓(xùn)練的;51、優(yōu)化模塊,用于利用強(qiáng)化學(xué)習(xí)策略對(duì)構(gòu)建好的所述波束優(yōu)化模型進(jìn)行優(yōu)化,使得所述波束優(yōu)化模型能根據(jù)實(shí)際空間環(huán)境和工作狀態(tài)的反饋,自主調(diào)整波束控制策略;52、建立模塊,用于建立一個(gè)多任務(wù)學(xué)習(xí)框架,讓所述波束優(yōu)化模型同時(shí)學(xué)習(xí)多個(gè)波束之間的相互影響和耦合效應(yīng),以實(shí)現(xiàn)全局最優(yōu)解;53、應(yīng)用模塊,用于將訓(xùn)練好的所述波束優(yōu)化模型部署到星載衛(wèi)星中,以使得訓(xùn)練好的所述波束優(yōu)化模型根據(jù)所述星載衛(wèi)星當(dāng)前的相控陣天線的工作參數(shù)來(lái)輸出最優(yōu)的波束控制碼,從而使得星載衛(wèi)星基于所述最優(yōu)的波束控制碼控制相控陣天線的工作。54、本發(fā)明另一實(shí)施例提供了一種相控陣天線多波束自動(dòng)優(yōu)化系統(tǒng),包括處理器、存儲(chǔ)器以及存儲(chǔ)在所述存儲(chǔ)器中且被配置為由所述處理器執(zhí)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述發(fā)明實(shí)施例所述的相控陣天線多波束自動(dòng)優(yōu)化方法。55、本發(fā)明另一實(shí)施例提供了一種存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括存儲(chǔ)的計(jì)算機(jī)程序,其中,在所述計(jì)算機(jī)程序運(yùn)行時(shí)控制所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行上述發(fā)明實(shí)施例所述的相控陣天線多波束自動(dòng)優(yōu)化設(shè)備方法。56、相比于現(xiàn)有技術(shù),本發(fā)明實(shí)施例具有如下有益效果:57、本發(fā)明實(shí)施例首先通過(guò)構(gòu)建基于稀疏編碼和深度神經(jīng)網(wǎng)絡(luò)的波束優(yōu)化模型,該模型通過(guò)接收包含相控陣天線工作狀態(tài)特征的向量作為輸入,預(yù)測(cè)不同波束指向下的最優(yōu)饋電參數(shù)組合,并輸出對(duì)應(yīng)的波束控制碼值。模型基于預(yù)先獲取的相控陣天線工作數(shù)據(jù)樣本進(jìn)行訓(xùn)練,確保其具備實(shí)際場(chǎng)景適應(yīng)能力。接著,利用強(qiáng)化學(xué)習(xí)策略對(duì)構(gòu)建好的波束優(yōu)化模型進(jìn)行優(yōu)化,使模型能夠根據(jù)實(shí)際空間環(huán)境和工作狀態(tài)的反饋,自主調(diào)整波束控制策略,實(shí)現(xiàn)動(dòng)態(tài)適應(yīng)性和自學(xué)習(xí)能力。此外,通過(guò)建立一個(gè)多任務(wù)學(xué)習(xí)框架,使波束優(yōu)化模型同時(shí)學(xué)習(xí)多個(gè)波束之間的相互影響和耦合效應(yīng),確保模型在優(yōu)化單個(gè)波束性能的同時(shí),兼顧整體系統(tǒng)的全局最優(yōu)解。最后,將訓(xùn)練好的波束優(yōu)化模型部署至星載衛(wèi)星,使其根據(jù)當(dāng)前相控陣天線的工作參數(shù)實(shí)時(shí)輸出最優(yōu)的波束控制碼,指導(dǎo)衛(wèi)星基于此控制碼精確控制相控陣天線工作,實(shí)現(xiàn)快速準(zhǔn)確的波束指向與切換。由上分析可知,本發(fā)明實(shí)施例能夠?qū)崟r(shí)自適應(yīng)優(yōu)化相控陣天線多波束的工作,確保在復(fù)雜多變的空間環(huán)境中始終保持最佳效能,有效滿足空間通信和探測(cè)任務(wù)對(duì)高指向精度和多目標(biāo)追蹤的要求。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12