本發(fā)明涉及一種耦合矩陣重配置優(yōu)化方法,特別涉及一種魯棒的基于反特征值問(wèn)題的耦合矩陣重配置優(yōu)化方法。
背景技術(shù):
1、目前,微波濾波器作為通信系統(tǒng)中最重要的元件之一,它的綜合與設(shè)計(jì)會(huì)直接影響通信的質(zhì)量。用于表示濾波器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的耦合矩陣是現(xiàn)代濾波器綜合設(shè)計(jì)與分析的基本數(shù)學(xué)工具,耦合矩陣中的元素值表示對(duì)應(yīng)的濾波器中諧振腔之間的耦合值,在實(shí)際應(yīng)用中,人們會(huì)根據(jù)耦合矩陣來(lái)設(shè)計(jì)和生產(chǎn)相對(duì)應(yīng)的濾波器。對(duì)于事先給定的濾波器參數(shù),如階數(shù)(諧振腔的個(gè)數(shù)n加上源和負(fù)載,總共為n+2)、傳輸零點(diǎn)、回波損耗等,可以利用n+2型廣義切比雪夫?yàn)V波函數(shù)綜合的方法,綜合得到全規(guī)范的n+2階橫向耦合矩陣t,但由于t所代表的濾波器的結(jié)構(gòu)比較復(fù)雜(源和負(fù)載與所有的諧振腔相連),不適合實(shí)際的生產(chǎn)和應(yīng)用,因此需要在不改變?yōu)V波器響應(yīng)特性的前提下,將全規(guī)范的n+2階橫向耦合矩陣t變換到具有指定拓?fù)浣Y(jié)構(gòu)s的耦合矩陣m上,以便于實(shí)際的生產(chǎn)和使用。這是微波濾波領(lǐng)域一個(gè)重要的工程問(wèn)題。
2、經(jīng)典的耦合矩陣拓?fù)渥儞Q的方法是矩陣旋轉(zhuǎn)消元法,即,根據(jù)目標(biāo)拓?fù)鋝,利用一系列的矩陣相似變換將t中不需要的元素消除,以得到最終想要的耦合矩陣m。然而,由于矩陣旋轉(zhuǎn)消元法需要事先知道旋轉(zhuǎn)順序和旋轉(zhuǎn)角度,這種方法只能應(yīng)用于一些經(jīng)典的拓?fù)浣Y(jié)構(gòu),如“折疊型”、“輪型”等,對(duì)于比較復(fù)雜的拓?fù)淙纭巴卣购小毙徒Y(jié)構(gòu),該方法將不再適用。
3、為彌補(bǔ)矩陣旋轉(zhuǎn)消元法的局限性,在近年來(lái),各種濾波器網(wǎng)絡(luò)拓?fù)渥儞Q的優(yōu)化方法被陸續(xù)提出,其中最為經(jīng)典有效的優(yōu)化方法是由lamecki等人基于耦合矩陣反特征值問(wèn)題提出的優(yōu)化模型。該模型的提出源于矩陣旋轉(zhuǎn)消元法,由于旋轉(zhuǎn)消元過(guò)程中不改變耦合矩陣的四組特征值(上、下主子矩陣,核心矩陣,以及耦合矩陣本身對(duì)應(yīng)的特征值),lamecki等人利用當(dāng)前耦合矩陣和目標(biāo)耦合矩陣的特征值差異,構(gòu)建了該優(yōu)化模型。雖然該模型已經(jīng)被應(yīng)用于多種濾波器的綜合設(shè)計(jì),但是當(dāng)使用優(yōu)化算法求解該模型時(shí),優(yōu)化結(jié)果對(duì)于初始值的選擇極其敏感,當(dāng)初始值選取不當(dāng),往往得不到想要的目標(biāo)結(jié)果或整個(gè)優(yōu)化過(guò)程比較緩慢。
4、截止目前,雖然有一些初始值選擇策略(例如,雅可比矩陣反特征值問(wèn)題的解),但這些策略通常嚴(yán)重依賴(lài)于工程先驗(yàn)知識(shí),且對(duì)于某些目標(biāo)拓?fù)淙纭巴卣购小毙屯負(fù)涞却笠?guī)模問(wèn)題并不總是可行的,這樣則限制了相關(guān)方法在真實(shí)應(yīng)用環(huán)境下的實(shí)用性。所以有關(guān)上述基于反特征值問(wèn)題的優(yōu)化方法研究仍不夠深入不夠全面,仍有繼續(xù)和持續(xù)研究的必要性。
5、鑒于缺乏關(guān)于基于反特征值問(wèn)題優(yōu)化模型解的先驗(yàn)信息,并考慮到損失函數(shù)對(duì)于優(yōu)化變量的強(qiáng)非線性性,目前沒(méi)有一種統(tǒng)一有效的初始值選擇策略。因此,在提高效率的同時(shí),減少對(duì)初始值的敏感性并增強(qiáng)優(yōu)化過(guò)程的魯棒性非常重要。而實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵就是剖析該優(yōu)化模型背后的數(shù)學(xué)原理,從底層改進(jìn)優(yōu)化模型的性質(zhì),提出具有一般性的優(yōu)化模型和優(yōu)化框架,解除優(yōu)化過(guò)程中對(duì)初值強(qiáng)依賴(lài)的限制。這也是改善多種濾波器拓?fù)浣Y(jié)構(gòu)和不同規(guī)模場(chǎng)景下優(yōu)化方法的實(shí)用性,真正實(shí)現(xiàn)相關(guān)優(yōu)化技術(shù)的廣泛適用性,讓方法能夠集成于多樣的濾波器生產(chǎn)調(diào)試設(shè)備的關(guān)鍵手段。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的是為了解決目前微波濾波器網(wǎng)絡(luò)拓?fù)渥儞Q的優(yōu)化方法中存在的初始值敏感性問(wèn)題,而提供的一種魯棒的基于反特征值問(wèn)題的耦合矩陣重配置優(yōu)化方法。
2、本發(fā)明提供的魯棒的基于反特征值問(wèn)題的耦合矩陣重配置優(yōu)化方法,其方法包括的步驟如下:
3、第一步、基于反特征值問(wèn)題的優(yōu)化模型的改進(jìn),具體如下:
4、基于反特征值問(wèn)題的優(yōu)化模型如下:
5、
6、其中:是表示矩陣或向量的轉(zhuǎn)置;
7、λp是當(dāng)前耦合矩陣m的特征值;是原始耦合矩陣t的特征值;
8、是當(dāng)前耦合矩陣m的上主子矩陣的特征值;
9、是原始耦合矩陣t的上主子矩陣的特征值;
10、是當(dāng)前耦合矩陣m的下主子矩陣的特征值;
11、是原始耦合矩陣t的下主子矩陣的特征值
12、λc是當(dāng)前耦合矩陣m的核心矩陣的特征值;
13、是原始耦合矩陣t的核心矩陣的特征值.
14、在優(yōu)化過(guò)程中,預(yù)先設(shè)定的目標(biāo)耦合結(jié)構(gòu)s強(qiáng)制施加在耦合矩陣m上,優(yōu)化變量為耦合矩陣m中的非零元素,該優(yōu)化模型得到的耦合矩陣m與原始耦合矩陣t滿(mǎn)足如下相似變換關(guān)系:
15、
16、其中h是一個(gè)正交矩陣,根據(jù)這一關(guān)系得到,對(duì)于任意的參數(shù)q>0,下面的矩陣相似變換關(guān)系仍然成立:
17、
18、其中i是單位矩陣。并且根據(jù)上式可知,得到耦合矩陣的拓?fù)浣Y(jié)構(gòu)與目標(biāo)耦合矩陣m的拓?fù)浣Y(jié)構(gòu)s只在對(duì)角線上有所不同,即:將s中的所有對(duì)角元素置為1就得到了由此得到如下改進(jìn)的基于反特征值問(wèn)題的優(yōu)化模型:
19、
20、在優(yōu)化過(guò)程中,預(yù)先設(shè)定的目標(biāo)耦合結(jié)構(gòu)強(qiáng)制施加在耦合矩陣上,優(yōu)化變量為耦合矩陣中的非零元素,如果利用模型(1-2)得到了目標(biāo)耦合矩陣那么最終目標(biāo)耦合矩陣m能夠得到:
21、第二步、優(yōu)化levenberg-marqudart方法的改進(jìn),具體如下:
22、levenberg-marqudart(以下簡(jiǎn)記為lm)優(yōu)化算法對(duì)于非線性最小二乘問(wèn)題
23、
24、其主要的算法過(guò)程如下:
25、x:=x0;μ:=μ0
26、repeat
27、
28、x:=x+αh
29、updateμ
30、until?stop
31、其中i是單位矩陣,μ>0被稱(chēng)為阻尼參數(shù),jf是非線性函數(shù)f(x)所對(duì)應(yīng)的jacobi矩陣,f′表示損失函數(shù)f(x)的梯度,α用來(lái)控制步長(zhǎng)大小,h是要求得的步長(zhǎng)和方向。lm方法是一種介于最速下降法和gauss-newton法之間的優(yōu)化算法,在lm方法中主要通過(guò)調(diào)節(jié)阻尼參數(shù)μ來(lái)調(diào)節(jié)優(yōu)化的方向和步長(zhǎng),當(dāng)μ較大時(shí),lm算法類(lèi)似于最速下降法,當(dāng)μ較小時(shí)則類(lèi)似于gauss-newton法,并且阻尼參數(shù)μ的調(diào)節(jié)是根據(jù)優(yōu)化過(guò)程進(jìn)行動(dòng)態(tài)調(diào)整的。與其它的優(yōu)化算法相同,在lm算法中,只有下一步的優(yōu)化變量能夠使得損失函數(shù)減少(即當(dāng))時(shí),才會(huì)接受當(dāng)前計(jì)算出來(lái)的步長(zhǎng)h;否則,將繼續(xù)調(diào)整參數(shù)μ,重新計(jì)算當(dāng)前步長(zhǎng)h。
32、在原始的lm算法中判斷是否接受當(dāng)前步長(zhǎng)h的方法如下:
33、ρ>0,
34、
35、當(dāng)“收益因子”ρ>0時(shí),才會(huì)接受步長(zhǎng)h。然而,這種優(yōu)化過(guò)程很容易陷入到局部極小值,而且極大地增加了迭代次數(shù),特別是當(dāng)優(yōu)化模型對(duì)應(yīng)的函數(shù)圖像變得特別狹長(zhǎng)時(shí),每次迭代過(guò)程中損失函數(shù)可能會(huì)減少得非常少。
36、針對(duì)這種收斂性問(wèn)題,對(duì)上述策略進(jìn)行改進(jìn),引入“上山”策略,即,在第i次迭代時(shí),計(jì)算出第i-1次迭代已經(jīng)得到的步長(zhǎng)hold與第i次迭代得到的步長(zhǎng)hnew之間夾角所對(duì)應(yīng)的余弦值θi=cos(hnew,hold),進(jìn)而判斷(1-θi)bci+1≥ci是否成立,若成立,則不論ρ>0與否,都接受當(dāng)前步hnew,ci+1和ci分別表示hnew和hold所對(duì)應(yīng)的損失函數(shù)值,參數(shù)b通常取1或2,b=2要比b=1會(huì)接受更多的上山步;
37、上述策略的改進(jìn),能夠大大提高避免lm方法在優(yōu)化過(guò)程中陷入局部極值的概率,加快lm方法的收斂速率;
38、第三步、基于q約簡(jiǎn)的優(yōu)化方法,具體步驟如下:
39、步驟1、對(duì)于某一參數(shù)q>0和任意選擇的初始值m0,將第二步中改進(jìn)的lm算法應(yīng)用到第一步改進(jìn)的基于反特征值問(wèn)題的優(yōu)化模型(1-2)的求解中,若優(yōu)化解m*是一個(gè)全局極值點(diǎn),即是一個(gè)預(yù)先設(shè)定的誤差容限,則目標(biāo)耦合矩陣m,也就是原優(yōu)化模型(1-1)的解表示為m=m*-qi;
40、步驟2、若所獲得的優(yōu)化模型(1-2)的解m*不是全局極值點(diǎn),此時(shí)目標(biāo)耦合矩陣m無(wú)法通過(guò)m=m*-qi獲得,在這種情況下,將解m*作為下一次優(yōu)化的初始值:減少參數(shù)q的值,然后以m*為初始值,使用第二步中改進(jìn)的lm算法重新求解優(yōu)化模型(1-2)以獲得新的優(yōu)化解m*,進(jìn)而按上述方式進(jìn)行判斷;
41、步驟3、重復(fù)上述步驟1和步驟2的過(guò)程,直到找到全局極值點(diǎn)m*或參數(shù)q約簡(jiǎn)到0。對(duì)于后者,如果m*仍然不是全局極值點(diǎn),則以m*為初始值,使用第二步中改進(jìn)的lm算法直接求解優(yōu)化模型(1-1);
42、對(duì)于改進(jìn)的優(yōu)化模型中的參數(shù)q,它的約簡(jiǎn)方法使用數(shù)學(xué)表達(dá)式如下:
43、
44、其中n表示約簡(jiǎn)次數(shù),表示參數(shù)q的初始選擇值,ρ>1表示約簡(jiǎn)因子。
45、本發(fā)明的有益效果:
46、本發(fā)明提供的魯棒的基于反特征值問(wèn)題的耦合矩陣重配置優(yōu)化方法不僅能夠解決優(yōu)化算法對(duì)初始值極其敏感的問(wèn)題(對(duì)任意選擇的初始值,所提算法總是能夠找到期望的目標(biāo)耦合矩陣),而且該優(yōu)化方法能夠適用于大規(guī)模、更為復(fù)雜的濾波器拓?fù)浣Y(jié)構(gòu)變換問(wèn)題,在提高優(yōu)化效率的同時(shí),增強(qiáng)了優(yōu)化過(guò)程的魯棒性。本發(fā)明的研究在真實(shí)的應(yīng)用算例中與已有的方法進(jìn)行了對(duì)比,具有極高的優(yōu)化成功率和良好的可靠性。這不僅為微波濾波器的設(shè)計(jì)提供了高效的綜合手段,更為后續(xù)濾波器的生產(chǎn)調(diào)試提高了效率,節(jié)省了大量時(shí)間。