本發(fā)明涉及自適應(yīng)控制領(lǐng)域,具體涉及一種基于知識增強(qiáng)和重復(fù)學(xué)習(xí)的高效率自適應(yīng)控制方法。
背景技術(shù):
迭代學(xué)習(xí)控制(ilc)(arimoto等人,1984)最初是從機(jī)器人領(lǐng)域提出的,因為工業(yè)機(jī)構(gòu)通常用于執(zhí)行重復(fù)性任務(wù)。在這種情況下,ilc方法可以根據(jù)先前操作的誤差信息來改進(jìn)控制性能,已經(jīng)在廣泛的實際應(yīng)用中進(jìn)行了探討,例如在精確運動系統(tǒng)(tan等人,2001)、工業(yè)批量過程(lee和lee,2007)、高速交通控制(hou等人,2007;sun等人,2013)、列車軌跡跟蹤(hou等人,2011)和不確定的機(jī)器人系統(tǒng)(tayebi,2004;choi和lee,2000)中均實現(xiàn)了較好的控制。
最初提出的ilc方法利用一類pid型算法(arimoto等人,1984;tan等人,2001;lee和lee,2007;hou等人,2007;sun等人,2013;hou等人)。pid-ilc方法可以直接應(yīng)用于非線性不確定系統(tǒng),因為它們需要很少的過程知識。在這個意義上,pid-ilc方法可以被稱為“數(shù)據(jù)驅(qū)動控制”方法(hou和wang,2013),由于難以在大規(guī)模和復(fù)雜的工業(yè)過程中獲得精確的數(shù)學(xué)模型,這種方法已變得越來越具有吸引力(hou和wang,2013;hou和jin,2013;yin等,2014;xu等,2014)。
然而,典型的pid-ilc沿著迭代軸方向的系統(tǒng)瞬態(tài)性能通常較差,原因在于它沒有完全使用可測量的狀態(tài)和已知的過程信息。迄今為止所提出的ilc方案均要求在系統(tǒng)狀態(tài)和相同的期望軌跡上具有相同的初始條件。否則,沿著迭代軸方向只實現(xiàn)有界收斂。
因此,如何利用已知的過程知識來提高系統(tǒng)的控制性能是當(dāng)前的研究熱點。最近,一些自適應(yīng)ilc(ailc)方案(tayebi,2004;choi和lee,2000;frenchandrogers,2000;xu和wiswanathan,2000;qu和xu,2002;xu和xu,2004;rotariu,wang和chien,2013;yin等,2010)已經(jīng)在ilc領(lǐng)域提出。針對控制對象是重復(fù)的線性時不變(lti)參數(shù)化系統(tǒng),french和rogers(2000)首先將傳統(tǒng)的參數(shù)適應(yīng)規(guī)律引入到學(xué)習(xí)任務(wù)中,其中參數(shù)更新規(guī)律與連續(xù)時間自適應(yīng)控制相同。唯一的區(qū)別是它通過使當(dāng)前迭代的初始參數(shù)估計等于先前迭代的終端參數(shù)估計來在固定時間間隔上鏈接兩個連續(xù)重復(fù)操作。
針對線性時變參數(shù)系統(tǒng),有學(xué)者提出了基于復(fù)合能量函數(shù)(cef)的自適應(yīng)ilc方法(xu和wiswanathan,2000;qu和xu,2002;xu和xu,2004;rotariuetal,2008;wangandchien,2013;yinetal2010)。因為未知的時變參數(shù)在可重復(fù)的控制環(huán)境下沿著迭代軸方向是不變的,因此時變參數(shù)沿著迭代軸(批到批)方向而不是時間軸方向更新。此外,當(dāng)參數(shù)子集被稱為時不變而其余是時變時,針對這種情況有學(xué)者也提出了具有混合參數(shù)更新定律的新的自適應(yīng)ilc方法(xu和xu,2004)?;旌蠀?shù)更新法則分別包含用于時不變和時變參數(shù)的兩個參數(shù)估計器。
注意,上述自適應(yīng)ilc方法利用過程的已知知識,例如測量的系統(tǒng)狀態(tài)、已知的系統(tǒng)結(jié)構(gòu)、以及參數(shù)的已知的時變和/或時不變性質(zhì)。它們能夠確保沿著重復(fù)軸的跟蹤誤差的漸近收斂為零。同時,上述自適應(yīng)ilc可以通過將目標(biāo)軌跡的已知信息包括到控制律中來處理迭代變化的目標(biāo)軌跡。因此,可以通過使用可用的過程知識來實現(xiàn)更期望的性能。然而,上述自適應(yīng)ilc的開放性問題在于,為了保證收斂,需要所有迭代的初始系統(tǒng)狀態(tài)相同。
與上述用于連續(xù)時間系統(tǒng)的自適應(yīng)ilc方法相比,離散時間自適應(yīng)ilc(dailc)方法(chi等人,2008)已經(jīng)開始獲得關(guān)注。幾種dailc方法(chi等人,2008;chi等人,2007;li等人,2010;chi等人,2013)已經(jīng)被提出用于時變參數(shù)系統(tǒng)。通過使用可測量的系統(tǒng)狀態(tài),已知模型結(jié)構(gòu)和精確已知的參考軌跡,離散時間ailc方法漸近地實現(xiàn)理想的跟蹤性能,而不需要在目標(biāo)軌跡或相同的初始狀態(tài)迭代上通過迭代的相同條件。然而,現(xiàn)有的離散時間ailc方法將所有未知的參數(shù)不確定性視為時變,即使參數(shù)不確定性是時不變的或者可以被精確地分離為時不變參數(shù)和時變參數(shù),現(xiàn)有的離散時間ailc也將其視為時變參數(shù),因此并未充分利用系統(tǒng)參數(shù)已知的有效信息(如全部時變,全部時不變,或部分時變部分時不變),不能達(dá)到最好的控制效果。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提出一種基于知識增強(qiáng)和重復(fù)學(xué)習(xí)的高效率自適應(yīng)控制方法,該方法通過判斷所研究對象的數(shù)學(xué)模型的系統(tǒng)參數(shù)的類型來建立自適應(yīng)控制模式,能夠增強(qiáng)對研究對象的控制性能。
為了實現(xiàn)上述目的,本發(fā)明專利采用如下技術(shù)方案,基于知識增強(qiáng)和重復(fù)學(xué)習(xí)的高效率自適應(yīng)控制方法,包括以下步驟:
s1.建立實際電機(jī)系統(tǒng)的數(shù)學(xué)模型;
s2.判斷所建立的數(shù)學(xué)模型的系統(tǒng)參數(shù)的類型;
s3.根據(jù)系統(tǒng)參數(shù)的類型對所研究的實際電機(jī)系統(tǒng)建立自適應(yīng)控制模式;
s4.根據(jù)所建立的自適應(yīng)控制模式對所研究的實際電機(jī)系統(tǒng)進(jìn)行控制。
進(jìn)一步地,在步驟s1中還包括如下步驟:如果所建立的數(shù)學(xué)模型是連續(xù)時間模型,需要將連續(xù)的時間模型進(jìn)行離散化;如果所建立的數(shù)學(xué)模型如果是離散時間模型,則直接進(jìn)行步驟s2。
進(jìn)一步地,步驟s2中系統(tǒng)參數(shù)的類型包括時變系統(tǒng)參數(shù)模型、時不變系統(tǒng)參數(shù)模型和混合系統(tǒng)參數(shù)模型。
進(jìn)一步地,步驟s3中對所研究的實際電機(jī)系統(tǒng)建立自適應(yīng)控制過程時,先假設(shè)其通用數(shù)學(xué)模型為
其中xn(k)∈r和un(k)∈r分別表示實際電機(jī)系統(tǒng)的狀態(tài)和輸入;
并且該數(shù)學(xué)模型滿足以下假設(shè):
(1)函數(shù)
其中,0<p1<∞,0<p2<∞;0<c1<∞,0<c1<∞。
(2)對所有k∈{0,λ,t}和迭代次數(shù)n,未知時變參數(shù)θ0(k)、目標(biāo)軌跡xr,n(k)和初始狀態(tài)值xn(0)均一致有界;
(3)對所有的k∈{0,1,λt},b(k)是正的(或負(fù)的)、非奇異的和有界的,并且0<bmin≤b(k)≤bmax,其中bmin和bmax分別是b(k)已知的上限和下限。
進(jìn)一步地,對應(yīng)步驟s2中的時變系統(tǒng)參數(shù)模型,通用數(shù)學(xué)模型簡化為
xn(k+1)=θ0(k)ξ0(xn(k))+b(k)un(k)
其中ξ0(xn(k))∈rm表示已知的非線性函數(shù);θ0(k)∈r1×m是未知的時變參數(shù)向量;m表示實際電機(jī)系統(tǒng)的時變參數(shù)的數(shù)量。
則步驟s3中的自適應(yīng)控制模式為:
其中,θ(k)=[b-1(k),b-1(k)θ0(k)],ξ(xn(k))=[xr,n(k+1),-ξ0(xn(k))]t,
進(jìn)一步地,對應(yīng)步驟s2中的時不變系統(tǒng)參數(shù)模型,通用數(shù)學(xué)模型簡化為
xn(k+1)=θ0ξ0(xn(k))+bun(k)
其中θ0和b都是常數(shù);
則步驟s3中的自適應(yīng)控制模式為:
其中θ=[b-1,b-1θ0],ξ(xn(k))=[xr,n(k+1),-ξ0(xn(k))]t,
根據(jù)權(quán)利要求4所述的基于知識增強(qiáng)和重復(fù)學(xué)習(xí)的高效率自適應(yīng)控制方法,其特征在于,對應(yīng)步驟s2中的混合參數(shù)模型,通用數(shù)學(xué)模型簡化為
其中,存在兩個非線性向量值函數(shù)
則步驟s3中的自適應(yīng)控制模式為:
其中,
對于時變θ1(k),通過遞歸設(shè)計ide控制律,
對于時不變參數(shù)θ2,采用如下tde控制律
其中,q1和q2是正學(xué)習(xí)收益,q=diag(q1,q2)、
本發(fā)明所提出的基于知識增強(qiáng)和重復(fù)學(xué)習(xí)的高效率自適應(yīng)控制方法,通過判斷所研究的實際電機(jī)系統(tǒng)的參數(shù)類型來建立自適應(yīng)控制模式,所建立的控制模式不需要相同初始狀態(tài)和相同參考軌跡的條件,并且能夠充分利用測量的狀態(tài)和已知的過程信息來增強(qiáng)對混合參數(shù)不確定性的實際電機(jī)系統(tǒng)的控制性能。
附圖說明
圖1是情形1的隨機(jī)值m1(n);
圖2是情形1的隨機(jī)值m2(n);
圖3是情形1的初始狀態(tài)隨機(jī)值;
圖4是時不變參數(shù)不確定系統(tǒng)的跟蹤誤差;
圖5是情形2的隨機(jī)值m1(n);
圖6是情形2的隨機(jī)值m2(n);
圖7是情形2中初始狀態(tài)的隨機(jī)值;
圖8是時變參數(shù)不確定系統(tǒng)的跟蹤誤差;
圖9是情形3的隨機(jī)值m1(n);
圖10是情形3的隨機(jī)值m2(n);
圖11是情形3中初始狀態(tài)的隨機(jī)值;
圖12是混合參數(shù)不確定系統(tǒng)的跟蹤誤差。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明作進(jìn)一步的說明。
基于知識增強(qiáng)和重復(fù)學(xué)習(xí)的高效率自適應(yīng)控制方法,包括以下步驟:
s1.建立實際電機(jī)系統(tǒng)的數(shù)學(xué)模型;如果所建立的數(shù)學(xué)模型是連續(xù)時間模型,需要將連續(xù)的時間模型進(jìn)行離散化;如果所建立的數(shù)學(xué)模型如果是離散時間模型,則直接進(jìn)行步驟s2。
s2.判斷所建立的數(shù)學(xué)模型的系統(tǒng)參數(shù)的類型;根據(jù)系統(tǒng)的參數(shù)類型可將系統(tǒng)分為時變系統(tǒng)參數(shù)模型、時不變系統(tǒng)參數(shù)模型和混合系統(tǒng)參數(shù)模型。
其中時變系統(tǒng)參數(shù)模型是指系統(tǒng)的參數(shù)的不確定性是隨時間變化的;時不變系統(tǒng)參數(shù)模型是指系統(tǒng)的參數(shù)的不確定性是不隨時間變化的;混合系統(tǒng)參數(shù)模型是指,系統(tǒng)的參數(shù)一組未知參數(shù)是不隨時間變化的,其余的參數(shù)是隨時間變化的。
s3.根據(jù)系統(tǒng)參數(shù)的類型對所研究的實際電機(jī)系統(tǒng)建立自適應(yīng)控制模式。
s4.根據(jù)所建立的自適應(yīng)控制模式對所研究的實際電機(jī)系統(tǒng)進(jìn)行控制。
在本發(fā)明中,用于時變參數(shù)不確定系統(tǒng)的dailc方法,應(yīng)用迭代差估計器來更新時變參數(shù)迭代,稱為基于迭代差分估計的dailc方法(ide-dailc)。針對時不變參數(shù)不確定系統(tǒng)的dailc方法所提出的參數(shù)更新定律通過使用時間差估計算法沿著時間軸連續(xù)地估計參數(shù),稱為基于時間差估計器的dailc方法(tde-dailc)。用于混合參數(shù)不確定系統(tǒng)的所提出的dailc方法包括:時間差估計器,用于沿著時間軸連續(xù)地更新時不變參數(shù);以及迭代差估計器,用于分別沿著迭代軸更新時變的參數(shù)。為簡潔起見,將其表示為基于混合差分估計器的dailc方法(mde-ailc)。
假設(shè)研究對象的通用數(shù)學(xué)模型為:
其中xn(k)∈r和un(k)∈r分別表示實際電機(jī)系統(tǒng)的狀態(tài)和輸入;
并且該數(shù)學(xué)模型滿足以下假設(shè):
(1)函數(shù)
其中,0<p1<∞,0<p2<∞;0<c1<∞,0<c2<∞。
(2)對所有k∈{0,λ,t}和迭代次數(shù)n,未知時變參數(shù)θ0(k)、目標(biāo)軌跡xr,n(k)和初始狀態(tài)值xn(0)均一致有界;
(3)對所有的k∈{0,1,λt},b(k)是正的(或負(fù)的)、非奇異的和有界的,并且0<bmin≤b(k)≤bmax,其中bmin和bmax分別是b(k)已知的上限和下限。
我們的控制目標(biāo)是尋找一個合適的控制輸入序列un(k),k∈{0,λ,t-1},使得實際電機(jī)系統(tǒng)輸出xn(k)隨著迭代次數(shù)的增加在整個間隔k∈{0,λ,t}上能夠跟蹤期望軌跡xr,n(k)。注意,假定系統(tǒng)輸出xr,n(k)在迭代過程中是變化的。
定義en(k)=xr,n(k)-xn(k),可以將跟蹤誤差寫為
en(k+1)=xr,n(k+1)-θ0(k)ξ0(xn(k))-b(k)un(k)=b(k)(b-1(k)xr,n(k+1)-b-1(k)θ0(k)ξ0(xn(k))-un(k))(3)
令θ(k)=[b-1(k),b-1(k)θ0(k)],ξ(xn(k))=[xr,n(k+1),-ξ0(xn(k))]t,可以將式(3)重新寫為
en(k+1)=b(k)(θ(k)ξ(xn(k))-un(k))(4)
針對時變系統(tǒng)參數(shù)模型:
通用數(shù)學(xué)模型簡化為
xn(k+1)=θ0(k)ξ0(xn(k))+b(k)un(k)
其中ξ0(xn(k))∈rm表示已知的非線性函數(shù);θ0(k)∈r1×m是未知的時變參數(shù)向量;m表示實際電機(jī)系統(tǒng)的時變參數(shù)的數(shù)量。
則步驟s3中的自適應(yīng)控制模式為:
其中,θ(k)=[b-1(k),b-1(k)θ0(k)],ξ(xn(k))=[xr,n(k+1),-ξ0(xn(k))]t,
注1:注意,參數(shù)更新定律(6)是沿著迭代軸方向逐點進(jìn)行的,并且未知的時變參數(shù)通過迭代更新進(jìn)行迭代。
所提出的由式(5)-(6)給出的ide-dailc方法的收斂性如下所示。
定理1:對于滿足假設(shè)1、2和3的系統(tǒng)(1),由式(5)-(6)給出的ide-dilc方法保證①參數(shù)估計誤差
針對時不變系統(tǒng)參數(shù)模型:
考慮離散時間定常系統(tǒng),其在有限時間間隔內(nèi)重復(fù)運行,則通用數(shù)學(xué)模型簡化為
xn(k+1)=θ0ξ0(xn(k))+bun(k),(7)
其中θ0和b都是常數(shù)。
令θ=[b-1,b-1θ0],ξ(xn(k))=[xr,n(k+1),-ξ0(xn(k))]t。根據(jù)第2節(jié)中的步驟(4),基于時間差估計器的離散時間自適應(yīng)ilc方法(tde-dailc)可以被設(shè)計為:
其中
注2:與式(6)不同,提出的tde定律(9)沿時間軸方向更新,這與傳統(tǒng)的離散時間自適應(yīng)控制(goodwin和sin,1984)是相同的。然而,所提出的方法可以經(jīng)由方程(10)鏈接兩次連續(xù)的迭代以提高性能。
所提出的由式(8)-(10)給出的tde-dailc方法的收斂性如下。
定理2.考慮系統(tǒng)(7)滿足假設(shè)4。應(yīng)用由式(8)-(10)所給出的tde-dailc方法,可以保證①在固定時間間隔上的參數(shù)估計誤差
針對混合系統(tǒng)參數(shù)模型:
通用數(shù)學(xué)模型簡化為
其中,存在兩個非線性向量值函數(shù)
根據(jù)式(11),誤差方程為
其中,
學(xué)習(xí)控制律設(shè)計如下
其中,
由于
其中,z1,n(k)和z2,n(k)是可測量的系統(tǒng)狀態(tài)。
由于
將狀態(tài)估計誤差定義為
對于時變θ1(k),通過遞歸設(shè)計ide控制律,
對于時不變參數(shù)θ2,采用如下tde控制律
其中,q1和q2是正學(xué)習(xí)收益,q=diag(q1,q2)、
因此,由式(13)和式(17)-(19)構(gòu)造了一種用于混合參數(shù)系統(tǒng)(11)的新型made-dailc方法。
注3:注意,上述提出的控制律被簡稱為mde-dailc方法,因為其包含用于更新常數(shù)未知參數(shù)的時間差估計器(18)-(19),以及迭代差估計器(17)變化的未知參數(shù)。因此,mde-dailc方法可以利用附加的過程信息來增強(qiáng)控制性能。
在進(jìn)行收斂性分析之前,進(jìn)行以下假設(shè)是為了進(jìn)行嚴(yán)格的證明。
假設(shè)4函數(shù)
其中,0<m1<∞,0<m2<∞;0<c1<∞,0<c2<∞。
假設(shè)5未知參數(shù)
所提出的mde-dailc方法的收斂性如下所示。
定理3:對于滿足假設(shè)5-6的系統(tǒng)(11),由式(13)、(17)-(19)給出的ide-dilc方法保證①參數(shù)估計誤差
仿真研究:
考慮永磁直線電機(jī)如下(tan等人,1999),
其中,v(t)是電動機(jī)速度(m/s),m是移動的推力塊(kg),ffriction(t)是摩擦力(n),fripple(t)是波動力(n),fl是可測量的負(fù)載力(n),沿著迭代軸進(jìn)行模擬仿真,bv是粘性摩擦參數(shù)(n·s·m-1);fc是庫侖摩擦的最小水平(n),fs是靜摩擦的水平(n),vs是潤滑油參數(shù)(m·s-1),x是電機(jī)位置,ar是表示振幅的常數(shù)fripple(t)。模擬時間t=1s。永磁直線電機(jī)的參數(shù)認(rèn)為是定值,如表i所示(tan等人,1999)。
表1.永磁直線電機(jī)的參數(shù)
在仿真中,線性電機(jī)(20)的重復(fù)連續(xù)時間模型離散化為
其中,h是采樣周期,k表示采樣時刻,n表示迭代次數(shù);fl,n(k)被認(rèn)為是系統(tǒng)的可測量擾動,其被假定為迭代變化。
目標(biāo)軌跡表示為
vr,n(k)=m1(n)sin(πk/1000),(22)
其中,m1(n)隨n在間隔[0,0.01]中隨機(jī)變化。因此,目標(biāo)軌跡隨著迭代而變化。
令,
根據(jù)式(1)-(4)的計算步驟,得到跟蹤誤差
en(k+1)=vd,n(k+1)-vn(k+1)=b(θξn(k)-un(k))(24)
其中,
在仿真過程中,fl,n(k)=m2(n)sin(πk/1000)和m2(n)沿著迭代軸方向隨機(jī)變化。采樣時間h=0.001s,因此有限時間間隔的終端時刻為t=1/h=1000,即k∈{0,λ,1000}。
情形1.θ0和b都是常數(shù)。所有系統(tǒng)參數(shù)選擇為常數(shù),如表1所示。情形1的迭代隨機(jī)變量m1(n)和m2(n)分別如圖1和圖2所示。初始狀態(tài)vn(0)=0.01×rand是隨著迭代次數(shù)隨機(jī)變化的,如圖3所示。
通過選擇a=80,c=0.1,應(yīng)用由式(8)-(10)所給出的tde-ailc方法,得到最大跟蹤誤差
實際上,可以將定常參數(shù)向量視為時變的一種特殊情況。因此,以前提出的由式(5)-(6)所給出的ide-dailc方法也可以應(yīng)用于情形i。為了比較,在相同的仿真條件下應(yīng)用ide-dailc方法,a=80,c=0.1,對于有限區(qū)間內(nèi)的所有離散時刻{0,λ,1000},
可以看出,ide-dailc方法還可以實現(xiàn)時不變系統(tǒng)的漸近收斂。但是,參數(shù)估計值
情形2.θ0和b都是隨時間變化的。時變因子被添加到如下所示的參數(shù)向量中,
其中,α(k)=0.1sin(2πk/1000)。
對于這樣的控制場景,池榮虎等(chi,hou,&sui,2007)提出ide-dailc方法,其隨著迭代軸方向批量地估計時變參數(shù),因為時變參數(shù)θ0(k)和b(k)相對于迭代是不變的。
在情形2的仿真研究中,m1(n)和m2(n)如圖5和圖6所示,它們都是迭代變化的。
情形2的迭代變化初始狀態(tài)如圖7所示。應(yīng)用由式(5)-(6)所給出的ide-dailc方法,取a=1000,c=0.01,
如果時變參數(shù)被是定值,在相同的仿真條件下應(yīng)用由式(8)-(10)所給出的tde-dailc方法,結(jié)果如圖8中的紅色實線所示??梢钥闯觯琲de-dailc方法很好地處理時變參數(shù)系統(tǒng),并且能夠在隨機(jī)初始狀態(tài)下漸進(jìn)地跟蹤迭代變化的目標(biāo)軌跡。然而,由于使用時間差估計器,tde-dailc只能實現(xiàn)有界收斂,這僅對時不變不確定性有效。
情形3.假設(shè)參數(shù)θ0是定值,其余參數(shù)是隨時間變化的,b是時不變的。也就是說,混合參數(shù)向量被假定為
注意,這種假設(shè)對于實際的線性電機(jī)應(yīng)用是合理的,因為摩擦力通常隨著電機(jī)速度而變化。而在實際的電機(jī)運行中,運動的推力塊質(zhì)量m、粘滯的摩擦參數(shù)bv和振幅ar通常是常數(shù)。
在情形3的仿真中,得到的m1(n)和m2(n)如圖9和圖10所示,并且圖11中可以看出變化的初始狀態(tài)。
選擇q1=100,q2=10,
相比之下,對于這種控制場景,如果使用由式(8)-(10)所給出的tde-dailc方法將所有參數(shù)視為時間不變的,并使用由式(5)-(6)所給出的ide-dailc方法將參數(shù)視為時變參數(shù),得到在相同仿真條件下的相應(yīng)仿真結(jié)果如圖12所示。
從圖9-12可以看出,對于混合參數(shù)系統(tǒng)有如下結(jié)論,(a)所提出的mde-dailc方法在存在隨機(jī)初始條件和迭代變量參考軌跡的情況下可以實現(xiàn)最佳收斂;(b)ide-dailc方法還通過將所有參數(shù)視為時變參數(shù)來實現(xiàn)漸近跟蹤性能;然而其收斂速度慢于mde-dailc方法;(c)tde-dailc方法僅實現(xiàn)有界收斂。