專(zhuān)利名稱(chēng):基于粒子濾波和rbf辨識(shí)的神經(jīng)網(wǎng)絡(luò)pid控制參數(shù)自整定方法
技術(shù)領(lǐng)域:
本發(fā)明具體涉及一種用于神經(jīng)網(wǎng)絡(luò)PID控制參數(shù)自整定的方法,屬控制系統(tǒng)領(lǐng) 域,用于對(duì)象模型未知且干擾為非線性及非高斯噪聲的控制系統(tǒng)。
背景技術(shù):
在實(shí)際工業(yè)生產(chǎn)過(guò)程中,控制對(duì)象往往具有非線性、時(shí)變不確定性以及控制過(guò)程 中各種非線性、非高斯噪聲的干擾,控制對(duì)象難以建立精確的數(shù)學(xué)模型,參數(shù)自整定方法繁 雜,因此常規(guī)的PID控制器往往難以達(dá)到良好的控制效果。為了提高控制精度和系統(tǒng)的魯棒性,前蘇聯(lián)學(xué)者在控制系統(tǒng)不變性原理的基礎(chǔ)上 提出了復(fù)合控制系統(tǒng)。復(fù)合控制的優(yōu)點(diǎn)是既能大幅度提高跟蹤精度,同時(shí)還對(duì)系統(tǒng)穩(wěn)定性 沒(méi)有影響。在負(fù)反饋控制系統(tǒng)中,增加前饋補(bǔ)償元件構(gòu)成二自由度系統(tǒng)。在標(biāo)稱(chēng)情況下,這 種二自由度控制系統(tǒng)的給定值響應(yīng)和負(fù)載干擾響應(yīng)是完全解耦的,可以分別通過(guò)調(diào)節(jié)給定 點(diǎn)跟蹤控制器和前饋濾波器來(lái)達(dá)到各自期望的控制性能指標(biāo),以期在擾動(dòng)信號(hào)的不利影響 之前,通過(guò)前饋來(lái)抵消這種擾動(dòng)對(duì)系統(tǒng)輸出的影響。但在實(shí)際工作中,難免會(huì)受到隨機(jī)噪聲 的干擾、以及外部負(fù)載的變化,導(dǎo)致控制信號(hào)中含有高頻干擾,致使精度下降和控制飽和, 因此,為了獲取所需信號(hào),排除干擾噪聲,就需要對(duì)控制信號(hào)進(jìn)行濾波。目前,國(guó)內(nèi)已有用擴(kuò)展卡爾曼濾波等方法來(lái)改善復(fù)合控制系統(tǒng),實(shí)驗(yàn)表明,改善過(guò) 后的復(fù)合控制系統(tǒng)有效地抑制了系統(tǒng)擾動(dòng),提升了動(dòng)態(tài)性能,但是在實(shí)際設(shè)定值跟蹤系統(tǒng) 中,由于噪聲的干擾使得目標(biāo)信噪比很低,常用的擴(kuò)展卡爾曼濾波要求噪聲獨(dú)立或相關(guān)的 高斯噪聲,在實(shí)際應(yīng)用中存在缺陷。粒子濾波(PF)算法擺脫了擴(kuò)展卡爾曼濾波時(shí)隨機(jī)量 必須滿足高斯分布的制約條件,為解決非線性非高斯干擾問(wèn)題提供了新的思路。粒子濾波 通過(guò)預(yù)測(cè)和更新來(lái)自于系統(tǒng)概率密度函數(shù)的采樣集來(lái)近似非線性系統(tǒng)的隨機(jī)貝葉斯估計(jì), 其基本方法是首先依據(jù)系統(tǒng)狀態(tài)向量的經(jīng)驗(yàn)條件分布在狀態(tài)空間產(chǎn)生一組隨機(jī)樣本的 集合,假設(shè)在k時(shí)刻得到了一組描述系統(tǒng)狀態(tài)后驗(yàn)概率分布P [x(k) zk)]的采樣值,記為 {x(k,i),i = 1,. . . .,N},這些樣本稱(chēng)為粒子;然后根據(jù)觀測(cè)量不斷地更新粒子的權(quán)重和位 置,通過(guò)調(diào)整后的粒子的信息,修正最初的經(jīng)驗(yàn)條件分布,對(duì)系統(tǒng)狀態(tài)值進(jìn)行預(yù)測(cè),得到一 組采樣值Ix(k+l,i),i = 1,..., ,使其近似于?^&+1)|21;+1)]。當(dāng)樣本容量很大時(shí),就 近似于狀態(tài)變量真實(shí)的后驗(yàn)概率密度函數(shù)。這種技術(shù)適用于任何非高斯背景的非線性隨機(jī) 系統(tǒng),精度可以逼近最優(yōu)估計(jì),是一種很有效的非線性濾波技術(shù)。在應(yīng)用RBF (徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)PID參數(shù)整定的控制方法中,首先根據(jù)系 統(tǒng)的輸入、輸出個(gè)數(shù),確定RBF網(wǎng)絡(luò)的結(jié)構(gòu),即網(wǎng)絡(luò)輸入層、隱含層和輸出層中神經(jīng)元的個(gè) 數(shù)。一般選擇辨識(shí)網(wǎng)絡(luò)的三個(gè)輸入為11(10,7(10,7&-1),其中11(10表示k時(shí)刻PID控制 器輸出的控制信號(hào),y(k)表示k時(shí)刻系統(tǒng)的輸出信號(hào),y(k-l)表示k-Ι時(shí)刻系統(tǒng)的輸出信
號(hào)。神經(jīng)網(wǎng)絡(luò)的整定指標(biāo)函數(shù)為㈨= >(幻㈨-少㈨)2其中r(k)表示k時(shí)刻系統(tǒng)的參考輸入,然后采用梯度下降法可以得到PID的三個(gè)參數(shù)kp、ki和kd的調(diào)整量,從而實(shí) 現(xiàn)PID參數(shù)的整定。采用RBF神經(jīng)網(wǎng)絡(luò)整定PID參數(shù),結(jié)構(gòu)簡(jiǎn)單,且RBF網(wǎng)絡(luò)對(duì)非線性系統(tǒng)辨識(shí)具有精 度高和較強(qiáng)的自適應(yīng)能力,但是這種方法容易受到控制過(guò)程中各種非線性非高斯噪聲的干 擾,從而對(duì)RBF網(wǎng)絡(luò)的辨識(shí)精度產(chǎn)生較大的影響;而粒子濾波雖然可以消除噪聲對(duì)系統(tǒng)控 制性能的影響,但是它無(wú)法辨識(shí)PID控制器的參數(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)中對(duì)象模型未知且干擾為非線性、非高斯噪聲的控 制系統(tǒng)而提出一種基于粒子濾波(PF)和RBF(徑向基函數(shù))辨識(shí)的神經(jīng)網(wǎng)絡(luò)PID控制參數(shù) 自整定方法,將粒子濾波和RBF神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái),采用粒子濾波處理非線性非高斯時(shí)變 系統(tǒng)參數(shù)估計(jì)和狀態(tài)濾波問(wèn)題的獨(dú)到優(yōu)勢(shì),以及采用RBF神經(jīng)網(wǎng)絡(luò)對(duì)非線性系統(tǒng)辨識(shí)具有 精度高和自適應(yīng)能力強(qiáng)的特點(diǎn),更好地改善控制系統(tǒng)的性能指標(biāo)和抗干擾能力。本發(fā)明的技術(shù)方案是采用如下步驟1)將系統(tǒng)中的神經(jīng)元PID控制器輸出連接控 制對(duì)象輸入,將PID控制器輸出和系統(tǒng)輸出y。ut分別連接RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)的輸入,系 統(tǒng)輸出y。ut和RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)之間連接粒子濾波部分;幻采用粒子濾波對(duì)系統(tǒng)輸出 y-進(jìn)行濾波,得到粒子濾波輸出ye,將粒子濾波輸出和RBF神經(jīng)網(wǎng)絡(luò)輸出ym相減的值% =ye_ym作為目標(biāo)函數(shù)訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),得到RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)輸出ym(k) ;3)結(jié)合RBF
dy t(k) dy (k)
神經(jīng)網(wǎng)絡(luò)辨識(shí)輸出ym(k)計(jì)算系統(tǒng)的雅可比信息^^ =彳·,u (k)是PID控制器輸出
的控制信號(hào),y。ut(k)是系統(tǒng)輸出的控制信號(hào);4)將系統(tǒng)參考輸入rin和系統(tǒng)輸出y。ut之間的 偏差信號(hào)ei作為目標(biāo)函數(shù)訓(xùn)練神經(jīng)元,應(yīng)用雅可比信息指導(dǎo)神經(jīng)元通過(guò)學(xué)習(xí)算法調(diào)整PID 控制器的比例系數(shù)、積分時(shí)間常數(shù)和微分時(shí)間常數(shù)這3個(gè)參數(shù)。本發(fā)明的有益效果是本發(fā)明通過(guò)粒子濾波和RBF系統(tǒng)辨識(shí)得到精確的雅可比信 息,即控制對(duì)象輸出對(duì)控制輸入的靈敏度信息,解決單神經(jīng)元PID控制由于雅可比信息未 知、用符號(hào)函數(shù)替代計(jì)算帶來(lái)的計(jì)算不精確的問(wèn)題;在保留PID控制魯棒性高和可靠性好 等特點(diǎn)的同時(shí),進(jìn)一步提高了控制系統(tǒng)的動(dòng)態(tài)響應(yīng)性能和抗干擾能力。
下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明圖1是基于粒子濾波和RBF的PID參數(shù)自整定結(jié)構(gòu)示意圖。
具體實(shí)施例方式參見(jiàn)圖1,首先建立如圖1所示的控制系統(tǒng)結(jié)構(gòu),該結(jié)構(gòu)的建立方法是原有控制 系統(tǒng)是將系統(tǒng)中的PID控制器輸出連接控制對(duì)象輸入,本發(fā)明在原有的神經(jīng)元PID控制器 基礎(chǔ)上,增加RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)和粒子濾波部分。將神經(jīng)元PID控制器輸出和系統(tǒng)的 輸出分別連接RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)的輸入,粒子濾波部分連接于系統(tǒng)的輸出和RBF神經(jīng) 網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)之間,RBF神經(jīng)網(wǎng)絡(luò)的輸入信號(hào)為PID控制器輸出的控制信號(hào)u(k)和系統(tǒng)的 輸出y。ut。利用粒子濾波對(duì)系統(tǒng)的輸出y。ut進(jìn)行濾波,得到濾波的輸出結(jié)果^ ;將粒子濾波的輸出結(jié)果ye和RBF神經(jīng)網(wǎng)絡(luò)的輸出ym相減,即% = ye_ym,將其作為目標(biāo)函數(shù)訓(xùn)練RBF神 經(jīng)網(wǎng)絡(luò),得到RBF神經(jīng)網(wǎng)絡(luò)的辨識(shí)輸出7111后(圖1中的虛線為系統(tǒng)辨識(shí)過(guò)程),計(jì)算得到系 dy (k)
統(tǒng)的雅可比信息^^,即控制對(duì)象輸出對(duì)控制輸入的靈敏度信息。利用系統(tǒng)參考輸入rin
和系統(tǒng)輸出y。ut之間的偏差信號(hào)ei作為目標(biāo)函數(shù)訓(xùn)練神經(jīng)元,并結(jié)合RBF網(wǎng)絡(luò)辨識(shí)得到的 雅克比信息調(diào)整神經(jīng)元的權(quán)系數(shù),即應(yīng)用雅可比信息指導(dǎo)神經(jīng)元(ANN)通過(guò)學(xué)習(xí)算法調(diào)整 PID控制器的3個(gè)參數(shù),從而得到PID控制器的3個(gè)參數(shù),即比例系數(shù)KP、積分時(shí)間常數(shù)T1 和微分時(shí)間常數(shù)TD。上述應(yīng)用粒子濾波對(duì)控制系統(tǒng)的輸出y。ut進(jìn)行濾波的方法如下粒子濾波的基本方法是通過(guò)尋找一組在狀態(tài)空間中傳播的隨機(jī)樣本對(duì)概率密度 函數(shù)ρ UkI Zk)進(jìn)行近似,以樣本均值代替積分運(yùn)算,從而獲得狀態(tài)最小方差估計(jì),而這些樣 本即稱(chēng)為“粒子”。采用數(shù)學(xué)語(yǔ)言描述如下對(duì)于平穩(wěn)的隨機(jī)過(guò)程,假定k-i時(shí)刻系統(tǒng)的后驗(yàn) 概率密度為P (xk-! I Zk^1),依據(jù)一定原則選取η個(gè)隨機(jī)樣本點(diǎn),k時(shí)刻獲得測(cè)量信息后,經(jīng)過(guò) 狀態(tài)和時(shí)間更新,η個(gè)粒子的后驗(yàn)概率密度可近似為ρ (xk I zk)。隨著粒子濾波數(shù)目的增加, 粒子的概率密度函數(shù)逐漸逼近狀態(tài)的概率密度函數(shù),粒子濾波估計(jì)即達(dá)到了最優(yōu)貝葉斯估 計(jì)的效果,其濾波步驟如下步驟1 初始化設(shè)時(shí)刻 k = 0 時(shí),X10 Pix0XW0 = I, i = 1,2,. . .,N ;從
p(xk|xk-i; yk)中隨機(jī)抽取η個(gè)樣本(粒子);其中, 表示0時(shí)刻系統(tǒng)的狀態(tài)向量, 表示 k時(shí)刻系統(tǒng)的狀態(tài)向量,yk表示k時(shí)刻系統(tǒng)的輸出,p(g)表示系統(tǒng)的狀態(tài)先驗(yàn)條件概率,< 表示k = 0時(shí)刻狀態(tài)向量的第i個(gè)樣本(粒子),其權(quán)值為<。步驟2 逐點(diǎn)計(jì)算對(duì)應(yīng)的樣本ρ (xk IykJ和p(xk|yk)采樣值;
w, p(yk I xDwI-I
yy —-步驟3 利用k ^! x[ )wi ι式計(jì)算對(duì)應(yīng)樣本的權(quán)值,并對(duì)其進(jìn)行歸
;=1
一化;<是k時(shí)刻狀態(tài)向量的第i個(gè)粒子X(jué)丨的權(quán)值。
N步驟4 計(jì)算新的粒子集,根據(jù)尸( I ^1) = Σ- 式重采樣N
i = \
次,得到{ XDll ; δ (g)表示狄拉克函數(shù)。
N步驟5:輸出結(jié)果狀態(tài)估計(jì)^=Σ<<,方差估計(jì)
權(quán)利要求
1.一種基于粒子濾波和RBF辨識(shí)的神經(jīng)網(wǎng)絡(luò)PID控制參數(shù)自整定方法,其特征是采用 如下步驟1)將系統(tǒng)中的神經(jīng)元PID控制器輸出連接控制對(duì)象輸入,將PID控制器輸出和系統(tǒng)輸 出y。ut分別連接RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)的輸入,系統(tǒng)輸出y。ut和RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)之間 連接粒子濾波部分;2)采用粒子濾波對(duì)系統(tǒng)輸出y-進(jìn)行濾波,得到粒子濾波輸出^,將粒子濾波輸出Ie 和RBF神經(jīng)網(wǎng)絡(luò)輸出ym相減的值% = ye-ym作為目標(biāo)函數(shù)訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),得到RBF神 經(jīng)網(wǎng)絡(luò)辨識(shí)輸出ym(k);dy Ak) dy (k)3)結(jié)合RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)輸出ym(k)計(jì)算系統(tǒng)的雅可比信息^^= ^^,u (k)是PID控制器輸出的控制信號(hào),yout(k)是系統(tǒng)輸出的控制信號(hào);4)將系統(tǒng)參考輸入rin和系統(tǒng)輸出y。ut之間的偏差信號(hào)ei作為目標(biāo)函數(shù)訓(xùn)練神經(jīng)元, 應(yīng)用雅可比信息指導(dǎo)神經(jīng)元通過(guò)學(xué)習(xí)算法調(diào)整PID控制器的比例系數(shù)、積分時(shí)間常數(shù)和微 分時(shí)間常數(shù)這3個(gè)參數(shù)。
2.根據(jù)權(quán)利要求1所述的基于粒子濾波和RBF辨識(shí)的神經(jīng)網(wǎng)絡(luò)PID控制參數(shù)自整定方 法,其特征是步驟2)所述對(duì)系統(tǒng)輸出y。ut進(jìn)行濾波的方法包括如下步驟A)在k= 0時(shí)刻隨機(jī)抽取η個(gè)樣本,逐點(diǎn)計(jì)算對(duì)應(yīng)樣本的采樣值;B)計(jì)算對(duì)應(yīng)樣本的權(quán)值并對(duì)其進(jìn)行歸一化;C)重采樣N次;D)輸出狀態(tài)估計(jì)和方差估計(jì);Ε)循環(huán)k — k+Ι直至結(jié)束,得到粒子濾波輸出ye。
全文摘要
本發(fā)明公開(kāi)一種用于對(duì)象模型未知且干擾為非線性及非高斯噪聲的控制系統(tǒng)的基于粒子濾波和RBF辨識(shí)的神經(jīng)網(wǎng)絡(luò)PID控制參數(shù)自整定方法;先將PID控制器輸出和系統(tǒng)輸出分別連接RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)輸入,系統(tǒng)輸出和RBF神經(jīng)網(wǎng)絡(luò)辨識(shí)結(jié)構(gòu)之間連接粒子濾波部分;再用粒子濾波對(duì)系統(tǒng)輸出濾波得到粒子濾波輸出,將粒子濾波輸出和RBF神經(jīng)網(wǎng)絡(luò)輸出相減的值作為目標(biāo)函數(shù)訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)得到其輸出,然后計(jì)算系統(tǒng)的雅可比信息,最后將系統(tǒng)參考輸入和系統(tǒng)輸出之間的偏差信號(hào)作為目標(biāo)函數(shù)訓(xùn)練神經(jīng)元,用雅可比信息指導(dǎo)神經(jīng)元通過(guò)學(xué)習(xí)算法調(diào)整PID控制器。本發(fā)明在保留PID控制魯棒性高和可靠性好等特點(diǎn)的同時(shí)能進(jìn)一步提高控制系統(tǒng)的動(dòng)態(tài)響應(yīng)性能和抗干擾能力。
文檔編號(hào)G05B13/02GK102141776SQ20111010485
公開(kāi)日2011年8月3日 申請(qǐng)日期2011年4月26日 優(yōu)先權(quán)日2011年4月26日
發(fā)明者伍雪冬, 戴曉強(qiáng), 朱志宇, 楊官校, 王建華, 王敏, 趙成 申請(qǐng)人:江蘇科技大學(xué)