本發(fā)明屬于多智能體對(duì)未知參考信號(hào)的自主估計(jì)及快速跟蹤控制領(lǐng)域,特別涉及一種基于自適應(yīng)估計(jì)和魯棒控制器的參考信號(hào)快速自適應(yīng)分布式跟蹤方法。
背景技術(shù):
1、隨著計(jì)算機(jī)網(wǎng)絡(luò)、傳感器技術(shù)和通信技術(shù)的發(fā)展,多智能體跟蹤系統(tǒng)的研究受到了人們的廣泛關(guān)注,與單個(gè)智能體對(duì)目標(biāo)進(jìn)行跟蹤相比,多智能體跟蹤系統(tǒng)可以高性能、高靈活性和高魯棒性地完成各種復(fù)雜任務(wù),例如巡邏、探測(cè)、救援等。實(shí)際上,多智能體跟蹤系統(tǒng)是由多個(gè)交互作用的智能體組成的系統(tǒng),這些智能體共同協(xié)作對(duì)目標(biāo)進(jìn)行跟蹤,解決單一智能體難以獨(dú)立解決的問題。在多智能體跟蹤系統(tǒng)中,每個(gè)智能體都具有獨(dú)立性,但通過協(xié)作能夠?qū)崿F(xiàn)更復(fù)雜的任務(wù)和目標(biāo)。例如,在自動(dòng)駕駛技術(shù)中,多個(gè)車輛需要協(xié)調(diào)行駛以維持隊(duì)形和安全距離。在軍事或民用任務(wù)中,多個(gè)無人機(jī)可以共享視覺或位置信息,協(xié)作完成覆蓋大面積的任務(wù),或者形成特定的飛行編隊(duì)以提高效率。
2、在多智能體跟蹤系統(tǒng)中,如果所有智能體都能接收到目標(biāo)信息,那么就很容易實(shí)現(xiàn)多智能體對(duì)目標(biāo)的跟蹤。但是在現(xiàn)實(shí)生活中,由于通信受限或者資源不足,通常只有部分智能體能夠接收到目標(biāo)信息,這是該領(lǐng)域目前的主要研究方向。其中,在已知目標(biāo)參考信號(hào)的情況下,通過對(duì)每一個(gè)智能體設(shè)計(jì)一個(gè)分布式估計(jì)器,使得每一個(gè)智能體都能夠獲得目標(biāo)的輸出信號(hào)。然而,現(xiàn)有方法主要關(guān)注參考信號(hào)的狀態(tài)估計(jì),而不是參數(shù)估計(jì),這導(dǎo)致在處理含有未知參數(shù)的參考信號(hào)時(shí),效果并不理想。其中,在參數(shù)和狀態(tài)估計(jì)需要同時(shí)進(jìn)行的時(shí)候,大多數(shù)方法在參數(shù)估計(jì)精度方面仍存在不足。隨著多智能體跟蹤系統(tǒng)研究的逐漸深入,目前技術(shù)缺乏一個(gè)能夠有效處理多智能體跟蹤系統(tǒng)中含有未知參數(shù)參考信號(hào)的綜合解決方案。對(duì)于這一情況,需要通過設(shè)計(jì)分布式估計(jì)器,實(shí)現(xiàn)對(duì)參考信號(hào)及其未知參數(shù)的自主估計(jì),同時(shí)設(shè)計(jì)跟蹤控制器,使各智能體的輸出信號(hào)在有限時(shí)間內(nèi)實(shí)現(xiàn)對(duì)含有未知參數(shù)參考信號(hào)的快速跟蹤。此外,在實(shí)際應(yīng)用中,系統(tǒng)的收斂時(shí)間是評(píng)估控制器性能的一個(gè)重要指標(biāo),在現(xiàn)有技術(shù)中,大部分控制算法僅能保證漸近收斂,不能滿足實(shí)際應(yīng)用中對(duì)速度和精確性的高要求。漸近穩(wěn)定只能保證系統(tǒng)狀態(tài)僅收斂到平衡點(diǎn)的鄰域,收斂到平衡點(diǎn)的時(shí)間是無限的,這是漸近穩(wěn)定算法的一個(gè)缺陷。而有限時(shí)間控制比漸近穩(wěn)定控制具有更快的收斂速度和更好的抗干擾性能,能夠在有限時(shí)間內(nèi)收斂到平衡點(diǎn),所以研究基于有限時(shí)間理論的多智能體跟蹤系統(tǒng)更有實(shí)際意義。
3、綜上所述,目前研究主要存在以下幾個(gè)方面的問題:(1)現(xiàn)有技術(shù)中的大多數(shù)算法的收斂速度較慢,例如漸進(jìn)收斂算法,這對(duì)于需要快速反應(yīng)無人機(jī)編隊(duì)或自動(dòng)駕駛車隊(duì)的實(shí)際應(yīng)用是不利的;(2)現(xiàn)有技術(shù)的方法通常需要對(duì)參考信號(hào)的部分狀態(tài)或參數(shù)有一定的了解,這在參考信號(hào)的參數(shù)完全未知的情況下并不適用;(3)現(xiàn)有技術(shù)在面對(duì)外部風(fēng)或聲波等干擾時(shí)可能無法保持良好的穩(wěn)定性,容易受到外界環(huán)境因素的干擾;為此我們提出一種基于自適應(yīng)估計(jì)和魯棒控制器的參考信號(hào)快速自適應(yīng)分布式跟蹤方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供基于自適應(yīng)估計(jì)和魯棒控制器的參考信號(hào)快速自適應(yīng)分布式跟蹤方法,構(gòu)建的多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng)模型,考慮了參考信號(hào)中的參數(shù)未知這一情況,以及風(fēng)、干擾信號(hào)、聲波等外界干擾對(duì)無人機(jī)、無人車等智能體系統(tǒng)的影響,同時(shí)基于有限時(shí)間理論提高了系統(tǒng)的收斂速度。為多智能體對(duì)未知參考信號(hào)的自主估計(jì)及快速跟蹤控制領(lǐng)域提供了一個(gè)新的建模思路,豐富了該領(lǐng)域的研究方法,設(shè)計(jì)的分布式觀測(cè)器和快速魯棒跟蹤控制器顯著提高了該領(lǐng)域內(nèi)多智能體跟蹤系統(tǒng)的實(shí)用性和可靠性。
2、本發(fā)明采取的技術(shù)方案具體如下:
3、基于自適應(yīng)估計(jì)和魯棒控制器的參考信號(hào)快速自適應(yīng)分布式跟蹤方法,其特征在于:包括以下步驟:
4、步驟1:構(gòu)建基于未知參數(shù)觀測(cè)器和魯棒控制器的多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng),所述基于未知參數(shù)觀測(cè)器和魯棒控制器的多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng)包括:參考信號(hào)未知參數(shù)模型構(gòu)建模塊、參考信號(hào)未知參數(shù)快速分布式估計(jì)模塊、參考信號(hào)快速魯棒跟蹤控制模塊以及閉環(huán)系統(tǒng)穩(wěn)定性分析模塊;
5、步驟2:在所述參考信號(hào)未知參數(shù)模型構(gòu)建模塊中,建立含有未知參數(shù)的參考信號(hào)可觀測(cè)模型;
6、步驟3:在所述參考信號(hào)未知參數(shù)快速分布式估計(jì)模塊中,對(duì)步驟2中生成的可觀測(cè)模型,基于自適應(yīng)方法和有限時(shí)間理論設(shè)計(jì)未知參數(shù)自適應(yīng)分布式觀測(cè)器,在僅有部分智能體可探測(cè)到參考信號(hào)的情況下,使每個(gè)智能體僅利用有限的通信信息,在有限時(shí)間內(nèi)實(shí)現(xiàn)對(duì)參考信號(hào)及其未知參數(shù)的自主估計(jì);
7、步驟4:在所述參考信號(hào)快速魯棒跟蹤控制模塊中,利用所述步驟3中估計(jì)出的參考信號(hào)信息,基于滑模算法和有限時(shí)間理論設(shè)計(jì)快速魯棒跟蹤控制器,使各智能體的輸出信號(hào)在有限時(shí)間內(nèi)實(shí)現(xiàn)對(duì)含有未知參數(shù)參考信號(hào)的快速跟蹤;
8、步驟5:在閉環(huán)系統(tǒng)穩(wěn)定性分析模塊中,提供面向多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng)的有限時(shí)間收斂證明;在所述步驟1-所述步驟4的基礎(chǔ)上,通過設(shè)計(jì)李亞普諾夫函數(shù)(lyapunov函數(shù)),證明了所述基于未知參數(shù)觀測(cè)器和魯棒控制器的多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng)在所述步驟3設(shè)計(jì)的分布式觀測(cè)器和所述步驟4設(shè)計(jì)的魯棒跟蹤控制器的作用下,使各個(gè)智能體在僅有部分智能體可探測(cè)到參考信號(hào)的情況下,有限時(shí)間內(nèi)實(shí)現(xiàn)對(duì)參考信號(hào)快速估計(jì)與穩(wěn)定跟蹤。
9、優(yōu)選地,所述步驟1中:所述參考信號(hào)未知參數(shù)模型構(gòu)建模塊主要用于為含有未知參數(shù)的參考信號(hào)建立可觀測(cè)模型;
10、所述參考信號(hào)未知參數(shù)快速分布式估計(jì)模塊使各個(gè)智能體能夠根據(jù)傳感器與通信網(wǎng)絡(luò)獲得的狀態(tài)信息,自主估計(jì)參考信號(hào)的未知參數(shù);
11、所述參考信號(hào)快速魯棒跟蹤控制模塊使智能體在外界擾動(dòng)的影響下實(shí)現(xiàn)對(duì)參考信號(hào)的安全穩(wěn)定跟蹤;
12、所述閉環(huán)系統(tǒng)穩(wěn)定性分析模塊主要用于提供面向多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng)的有限時(shí)間收斂證明。
13、優(yōu)選地,所述步驟2中,由于正弦信號(hào)可組成各種周期性信號(hào),具體將待跟蹤的參考信號(hào)表示為個(gè)頻率、幅值及初始相位未知的正弦信號(hào)之和;通過參數(shù)變換方法,將含有未知參數(shù)的參考信號(hào)進(jìn)行重新參數(shù)化,并通過濾波變換技術(shù)轉(zhuǎn)換為更易于控制和觀測(cè)的可觀測(cè)系統(tǒng)。
14、優(yōu)選地,所述步驟2中的具體步驟如下:
15、步驟201:將待跟蹤的參考信號(hào)表示為個(gè)頻率、幅值及初始相位未知的正弦信號(hào)之和:
16、
17、其中,ωk和ψk分別表示正弦信號(hào)的幅值、頻率和相位,yn+1是待跟蹤系統(tǒng)的輸出信號(hào);
18、步驟202:基于所述步驟201提出的待跟蹤參考信號(hào)的數(shù)學(xué)表達(dá)式,通過參數(shù)變換,將含有未知參數(shù)的參考信號(hào)進(jìn)行重新參數(shù)化,即待跟蹤的參考正弦信號(hào)(1)可以看作是如下虛擬線性系統(tǒng)的輸出:
19、
20、其中,其中且其中并且θ=[θ1,θ2,…,θl]t是基于l個(gè)未知參數(shù)的可逆重新參數(shù)化;
21、步驟203:基于步驟2.2)提出的虛擬線性系統(tǒng)(2),通過濾波變換將(2)轉(zhuǎn)換為可觀測(cè)系統(tǒng):
22、
23、其中,是濾波變換向量,
24、
25、
26、
27、
28、優(yōu)選地,所述步驟3中的具體方法如下:
29、步驟301:在自適應(yīng)方法中,定義自適應(yīng)增益μi的表達(dá)式如下:
30、
31、其中,κ和γ是任意的并且大于0的常數(shù);
32、步驟301:采用自適應(yīng)方法和有限時(shí)間理論,根據(jù)步驟2中提出的可觀測(cè)系統(tǒng)以及步驟301中定義的自適應(yīng)增益μi,設(shè)計(jì)未知參數(shù)自適應(yīng)分布式觀測(cè)器如下:
33、
34、其中,對(duì)于i=1,…,n,和分別是ηi和χi的估計(jì)值,且代表kronecker積,sgn{·}是符號(hào)函數(shù);此外,c1=p-1,c2=q-1,c3>0。
35、優(yōu)選地,所述步驟4的具體方法如下:
36、步驟401:定義多智能體的動(dòng)力學(xué)方程,其可以用r階積分器描述,其數(shù)學(xué)表達(dá)式如下:
37、
38、其中i=1,...,n,s=1,...,r-1;分別為狀態(tài)向量、控制輸入和智能體的輸出;
39、步驟402:對(duì)于p=1,...,r+1,定義函數(shù)fp(·,·)如下:
40、
41、步驟403:設(shè)計(jì)基于滑模算法和有限時(shí)間理論的快速魯棒跟蹤控制器如下:
42、
43、其中c4>0,ki,1,…,ki,r>0,且βi,s滿足βi,r=β,βi,r+1=1。
44、優(yōu)選地,所述步驟5的具體步驟如下:
45、步驟501:參考信號(hào)及其未知參數(shù)的估計(jì)誤差分析;
46、步驟502:智能體跟蹤參考信號(hào)的分析。
47、優(yōu)選地,所述步驟501具體包括以下步驟:
48、定義分別是所述步驟2中濾波變換向量η,χ以及參數(shù)θ和輸出信號(hào)yn+1的估計(jì)值;對(duì)于i=1,…,n,定義估計(jì)誤差:定義跟蹤誤差:系統(tǒng)的誤差動(dòng)力學(xué)表示為:
49、
50、
51、令考慮如下的李雅普諾夫函數(shù):
52、
53、其中然后,根據(jù)對(duì)上式(18)求導(dǎo)得:
54、
55、如果則然后,定義
56、
57、其中令存在一個(gè)正的常數(shù)μ*使得則式(20)可以寫為:
58、
59、當(dāng)時(shí),則因此,估計(jì)誤差在有限時(shí)間t1內(nèi)收斂;在估計(jì)誤差收斂之后,即存在一個(gè)時(shí)間點(diǎn)t1,對(duì)于所有的t≥t1,并且均成立;
60、考慮,考慮式(1)的觀測(cè)系統(tǒng),對(duì)于任何初值和存在有限時(shí)間t1>0使得估計(jì)誤差的收斂通過有限時(shí)間分布式觀測(cè)器式(4)和式(6)-式(9)建立,其中c1=p-1,c2=q-1,c3>0,κ>0且γ>0。
61、優(yōu)選地,所述步驟502具體步驟如下:
62、令ei,1=xi,1-yn+1=xi,1-f1(v,θ)
63、和
64、根據(jù)式(13),可以得到:
65、
66、考慮系統(tǒng)式(22)和系統(tǒng)式(23),估計(jì)誤差在有限時(shí)間內(nèi)不會(huì)在0的鄰域以外,進(jìn)而存在一個(gè)時(shí)間點(diǎn),即t1+t2,使得對(duì)于t>t1+t2,然后考慮控制器式(13),系統(tǒng)式(22)和系統(tǒng)式(23)轉(zhuǎn)化為:
67、
68、在區(qū)間[0,t1+t2]內(nèi),閉環(huán)系統(tǒng)轉(zhuǎn)化為:
69、
70、其中進(jìn)而,δei,s和是有界的,并在有限時(shí)間t1+t2之后收斂到0;令f(x,d)是閉環(huán)系統(tǒng)式(25)和系統(tǒng)式(26)的f,其中進(jìn)而,系統(tǒng)是全局有限時(shí)間穩(wěn)定的;
71、因此,考慮觀測(cè)系統(tǒng)式(1),(10)和有向圖對(duì)于任意的和選擇任意的c1,c2,c3和α1>0,并且對(duì)于i=1,…,n,μi滿足式(4);通過分布式觀測(cè)器(6)-(9)和魯棒跟蹤控制器(12)-(13),各個(gè)智能體在僅有部分智能體可探測(cè)到參考信號(hào)的情況下,在有限時(shí)間內(nèi)實(shí)現(xiàn)對(duì)參考信號(hào)快速估計(jì)與穩(wěn)定跟蹤。
72、本發(fā)明取得的技術(shù)效果為:
73、本發(fā)明構(gòu)建的多智能體參考信號(hào)快速自適應(yīng)分布式跟蹤系統(tǒng)模型,考慮了參考信號(hào)中的參數(shù)未知這一情況,以及風(fēng)、干擾信號(hào)、聲波等外界干擾對(duì)無人機(jī)、無人車等智能體系統(tǒng)的影響,同時(shí)基于有限時(shí)間理論提高了系統(tǒng)的收斂速度。為多智能體對(duì)未知參考信號(hào)的自主估計(jì)及快速跟蹤控制領(lǐng)域提供了一個(gè)新的建模思路,豐富了該領(lǐng)域的研究方法,設(shè)計(jì)的分布式觀測(cè)器和快速魯棒跟蹤控制器顯著提高了該領(lǐng)域內(nèi)多智能體跟蹤系統(tǒng)的實(shí)用性和可靠性。
74、本發(fā)明提出的分布式觀測(cè)器和跟蹤控制器,使得在僅有部分智能體能夠探測(cè)到參考信號(hào)的情況下,實(shí)現(xiàn)多智能體對(duì)參考信號(hào)的快速估計(jì)與穩(wěn)定跟蹤,提高了系統(tǒng)的靈活性和適用范圍。
75、本發(fā)明考慮了風(fēng)、干擾信號(hào)和聲波等外界干擾對(duì)多智能體跟蹤系統(tǒng)的影響,設(shè)計(jì)的基于滑模算法的魯棒控制器顯示出了更好的抗干擾特性,特別是在不確定和受干擾的環(huán)境中,能夠有效抑制外界干擾帶來的影響。
76、本發(fā)明基于有限時(shí)間理論,設(shè)計(jì)的魯棒跟蹤控制器實(shí)現(xiàn)了有限時(shí)間收斂,顯著提高了收斂速度。通過分布式計(jì)算和有限時(shí)間理論提高了收斂速度和估計(jì)精度,展示了更高的操作效率。