本發(fā)明屬于飛行器設(shè)計(jì)技術(shù)領(lǐng)域,具體涉及一種基于飛行員注意力最優(yōu)分配假設(shè)的駕駛員最優(yōu)控制模型加權(quán)系數(shù)計(jì)算方法。
背景技術(shù):
利用飛機(jī)駕駛員模型開(kāi)展模擬飛行員主觀評(píng)價(jià)的飛行品質(zhì)預(yù)測(cè),一直是國(guó)內(nèi)外學(xué)者努力追求目標(biāo)。其中基于駕駛員最優(yōu)控制模型(Optimal control pilot model,OCM模型)開(kāi)展飛行品質(zhì)預(yù)測(cè)是代表性方法之一。當(dāng)前基于OCM模型開(kāi)展飛行品質(zhì)預(yù)測(cè)存在的主要問(wèn)題之一,就是指標(biāo)函數(shù)加權(quán)系數(shù)沒(méi)有統(tǒng)一選取方法。目前大多由設(shè)計(jì)人員主觀選取。由此帶來(lái)了方法使用的隨意性和飛行品質(zhì)預(yù)測(cè)的顯著差異。這無(wú)疑增加了方法推廣使用困難。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提供一種基于飛行員注意力最優(yōu)分配假設(shè)的駕駛員最優(yōu)控制模型加權(quán)系數(shù)計(jì)算方法,為OCM模型推廣使用提供了更為科學(xué)的理論依據(jù),可以為飛行品質(zhì)預(yù)測(cè)和飛行器設(shè)計(jì)起到積極促進(jìn)作用。所述加權(quán)系數(shù)計(jì)算方法遵循加權(quán)系數(shù)選擇原則和指標(biāo)函數(shù)計(jì)算原則。
所述的加權(quán)系數(shù)選擇原則是指:飛行員可以最優(yōu)的調(diào)節(jié)注意力分配使跟蹤誤差和體力負(fù)荷最小。即駕駛員最優(yōu)控制模型應(yīng)該最優(yōu)的分配加權(quán)系數(shù)使跟蹤誤差和體力負(fù)荷最小。
所述的指標(biāo)函數(shù)計(jì)算原則是指:駕駛員評(píng)分指標(biāo)函數(shù),應(yīng)同時(shí)體現(xiàn)腦力負(fù)荷、體力負(fù)荷以及操縱效果。盡量排除加權(quán)系數(shù)變化和驅(qū)動(dòng)函數(shù)設(shè)置影響。
基于上述兩個(gè)原則,本發(fā)明提供的加權(quán)系數(shù)計(jì)算方法具體包括如下步驟:
第一步,構(gòu)建增廣被控對(duì)象。
第二步,根據(jù)飛行任務(wù),構(gòu)建飛行員最優(yōu)控制模型指標(biāo)函數(shù),給定初始加權(quán)系數(shù)值。
第三步,計(jì)算飛行員最優(yōu)控制增益。
第四步,求解觀測(cè)噪聲方差和操縱噪聲方差,計(jì)算Kalman濾波增益。
第五步,計(jì)算指標(biāo)函數(shù)J。
第六步:以指標(biāo)函數(shù)J為目標(biāo)函數(shù),以加權(quán)系數(shù)為自變量,進(jìn)行尋優(yōu)計(jì)算,直至找到令J取得最小值的加權(quán)系數(shù),求解結(jié)束。
本發(fā)明的優(yōu)點(diǎn)在于:
(1)提供了OCM模型加權(quán)系數(shù)選取的科學(xué)方法和規(guī)范化流程,可避免人為選擇加權(quán)系數(shù)對(duì)模型指標(biāo)函數(shù)帶來(lái)干擾。
(2)提供了加權(quán)系數(shù)的準(zhǔn)確計(jì)算方法,可據(jù)此開(kāi)展更為準(zhǔn)確的飛行品質(zhì)預(yù)測(cè)。
附圖說(shuō)明
圖1為指標(biāo)函數(shù)與加權(quán)系數(shù)關(guān)系示意圖。
圖2為算例飛行品質(zhì)預(yù)測(cè)比較圖。
圖3為本發(fā)明提供的一種基于飛行員注意力最優(yōu)分配假設(shè)的駕駛員最優(yōu)控制模型加權(quán)系數(shù)計(jì)算方法流程圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。
本發(fā)明提供一種基于飛行員注意力最優(yōu)分配假設(shè)的駕駛員最優(yōu)控制模型加權(quán)系數(shù)計(jì)算方法,下面以單通道跟蹤任務(wù)為例,結(jié)合圖3,對(duì)本發(fā)明所述加權(quán)系數(shù)計(jì)算方法的步驟流程說(shuō)明如下:
步驟一:構(gòu)建形如下式的增廣被控對(duì)象:
其中,xs是帶有延遲的增廣狀態(tài)向量,為xs的一階導(dǎo)數(shù),As、Bs、Cs、Ds、Es是增廣系數(shù)矩陣,up是飛行員操縱量,y是輸出狀態(tài)量,w是外界擾動(dòng)向量。其中Cs=[C DCd],Ds=D,x為飛機(jī)小擾動(dòng)方程狀態(tài)向量。xd是帶有延遲的增廣狀態(tài)向量,Ad、Bd、Cd分別為時(shí)間延遲系數(shù)矩陣。A、B、C、D、E是飛機(jī)小擾動(dòng)方程系數(shù)矩陣。
飛行員實(shí)際感知向量yobs為:
yobs=Csxs+Dsup+vy (2)
其中vy是與近期觀測(cè)歷史有關(guān)的感知噪聲,采用高斯白噪聲建模,也稱(chēng)觀測(cè)噪聲。觀測(cè)噪聲強(qiáng)度Vy為其中ρy是感知噪聲信噪比,典型單通道跟蹤任務(wù)中感知噪聲信噪比ρy通常為0.01,對(duì)應(yīng)信噪比為-20dB,為觀測(cè)噪聲方差。
步驟二,根據(jù)飛行任務(wù),構(gòu)建駕駛員最優(yōu)控制模型指標(biāo)函數(shù),設(shè)定初始加權(quán)系數(shù)值Qy和ru。采用二次指標(biāo)函數(shù)構(gòu)建駕駛員最優(yōu)控制模型指標(biāo)函數(shù)Jp如下:
其中,Qy是觀察向量加權(quán)系數(shù),ru是操縱向量加權(quán)系數(shù),f是操縱速率加權(quán)系數(shù),是up的一階導(dǎo)數(shù)。它們反映了飛行員對(duì)信息觀察、油門(mén)桿、駕駛桿、操縱速率等不同駕駛要素的重視程度。其中f的選擇依賴于給定的神經(jīng)動(dòng)力延遲常數(shù)Tn。E∞是指標(biāo)函數(shù)穩(wěn)態(tài)期望值。本發(fā)明要解決的問(wèn)題就是設(shè)法確定指標(biāo)函數(shù)加權(quán)系數(shù)Qy和ru取值。
步驟三,計(jì)算飛行員最優(yōu)控制增益??梢酝ㄟ^(guò)最優(yōu)控制理論得到控制關(guān)系為:
其中,是飛行員最優(yōu)操縱量,Gp是調(diào)節(jié)器增益向量,是狀態(tài)向量X的估計(jì)值,K是由下列Riccati方程確定的唯一解:
0=(Ao)TK+KAo+Qo-KBof-1(Bo)TK (5)
其中,
將X=[xs up]T=[x xd up]T代入(4)式,則,
其中Gn是增益向量,為xs的估計(jì)值,Gn1是的增益向量。令,
則,
Ip即為飛行員最優(yōu)控制增益。因此,(7)式可寫(xiě)為,
令引入操縱噪聲vu,則
其中vu是強(qiáng)度為Vu的零均值高斯白噪聲。ρu是操縱噪聲信噪比系數(shù),是操縱噪聲方差。
步驟四:循環(huán)迭代求解觀測(cè)噪聲方差和操縱噪聲方差,計(jì)算Kalman濾波增益。
聯(lián)立(1)和(11)式得到:
其中,為帶有操縱量的增廣狀態(tài)向量X的一階導(dǎo)數(shù),w為外界擾動(dòng)向量,vu為操縱噪聲,vy為觀測(cè)噪聲,C1=[C DCd D]。
狀態(tài)向量X的估計(jì)值可以由Kalman濾波得到,其中濾波增益矩陣F為:
F=Σ1(C1)T(Vy)-1 (13)
其中,Vy為觀測(cè)噪聲強(qiáng)度,估計(jì)誤差矩陣Σ1是由下列Riccati方程確定的唯一解:
0=A1Σ1+Σ1(A1)T+W1-Σ1(C1)T(Vy)-1(C1)Σ1 (14)
其中W1=diag(W,Vu),W為外界擾動(dòng)強(qiáng)度,Vu為操縱噪聲強(qiáng)度。帶有狀態(tài)估計(jì)的人機(jī)閉環(huán)狀態(tài)方程為,
其中I1=[Ip,0],Cδ=[0 Cd 1],F(xiàn)為Kalman濾波增益矩陣,δ為飛機(jī)舵面偏轉(zhuǎn)量。
協(xié)方差矩陣Xcov是下列Lyapunov方程的解:
其中,Qlyp=diag(W,Vy,Vu),Vy是觀測(cè)噪聲強(qiáng)度,Vu操縱噪聲強(qiáng)度。
則,輸出協(xié)方差矩陣:
其中,
由此得到觀測(cè)噪聲方差和操縱噪聲方差分別為:
這樣對(duì)于給定初始操縱噪聲強(qiáng)度Vu和觀測(cè)噪聲強(qiáng)度Vy,可以分別得到一個(gè)和并可以分別計(jì)算得到信噪比系數(shù)ρy和ρu,由此可以形成循環(huán)迭代計(jì)算,直到信噪比滿足ρy=0.01和ρu=0.003為止。同時(shí),迭代結(jié)束后可以得到Kalman濾波增益。
步驟五:計(jì)算指標(biāo)函數(shù)J。
其中,Je=Y(jié)cov(1,1),Ju=Y(jié)cov(2,2),row_u=row_X-row_x-row_xd,row_X是向量X的行數(shù),row_x是向量x的行數(shù),row_xd是向量xd的行數(shù)。
步驟六:根據(jù)最優(yōu)注意力分配假設(shè)計(jì)算加權(quán)系數(shù)。
根據(jù)加權(quán)系數(shù)選擇原則和指標(biāo)函數(shù)計(jì)算原則,飛行員可以最優(yōu)的對(duì)注意力分配,使指標(biāo)函數(shù)最小。由此,設(shè)定不同Qy和ru,可以通過(guò)共軛梯度法尋優(yōu)計(jì)算直到指標(biāo)函數(shù)J取得最小值。由此確定了OCM模型加權(quán)系數(shù)Qy和ru。
本發(fā)明首先提出了飛行員最優(yōu)分配注意力的假設(shè),即飛行員可以最優(yōu)的分配注意力,使指標(biāo)函數(shù)最小。而加權(quán)系數(shù)Qy和ru就表征了飛行員對(duì)信息觀察和駕駛桿操縱的注意力分配,因此可以用這種方法計(jì)算加權(quán)系數(shù)Qy和ru。
下面提供兩則實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明。實(shí)施例1用于加權(quán)系數(shù)選擇原則進(jìn)行說(shuō)明。即存在一個(gè)最優(yōu)加權(quán)系數(shù)組合Qy和ru使指標(biāo)函數(shù)最小。實(shí)施例2通過(guò)飛行品質(zhì)預(yù)測(cè),說(shuō)明本發(fā)明在飛行品質(zhì)評(píng)估應(yīng)用中的有益效果。
實(shí)施例1
以1993年美國(guó)空軍飛行員Darcy Granley在Calspan Lear II型飛機(jī)上獲取的試驗(yàn)數(shù)據(jù)為比照對(duì)象(見(jiàn)參考文獻(xiàn)[1]:Craig R.Edkins,Human Pilot Response during Single and Multi-axis Tracking Tasks,AFFTC-TLR-93-41[R].California,Air Force Flight Test Center,1993.),進(jìn)行驗(yàn)證。飛機(jī)俯仰軸傳遞函數(shù)為:
式中:θ為飛機(jī)俯仰角響應(yīng);δes為駕駛桿偏移量;ξ為短周期阻尼比;τD為操縱延遲時(shí)間。根據(jù)ξ和τD取值構(gòu)建4種研究對(duì)象如表1所示。
表1研究對(duì)象模態(tài)參數(shù)
飛行試驗(yàn)任務(wù)為俯仰姿態(tài)跟蹤。姿態(tài)跟蹤任務(wù)指令由白噪聲建模得到,驅(qū)動(dòng)函數(shù)為:
式中:θc為姿態(tài)目標(biāo)指令;w為白噪聲。在加權(quán)系數(shù)比值Qy/ru在[0,0.2]范圍內(nèi),計(jì)算4種研究對(duì)象指標(biāo)函數(shù)J如圖1所示??梢?jiàn),確實(shí)存在一個(gè)最優(yōu)的注意力分配方案,可以使跟蹤誤差和體力負(fù)荷達(dá)到最小。
實(shí)施例2
驗(yàn)證的思路是,對(duì)人機(jī)閉環(huán)飛行品質(zhì)評(píng)價(jià)飛行試驗(yàn)進(jìn)行仿真再現(xiàn),按本發(fā)明方法計(jì)算加權(quán)系數(shù),而后進(jìn)行飛行品質(zhì)評(píng)估,如果獲得的模擬飛行品質(zhì)預(yù)測(cè)結(jié)果較傳統(tǒng)OCM模型更為準(zhǔn)確,則說(shuō)明了本發(fā)明優(yōu)越性。飛行品質(zhì)試驗(yàn)待評(píng)價(jià)對(duì)象與實(shí)施例1相同。首先按步驟一將研究對(duì)象轉(zhuǎn)換為增廣矩陣形式。而后按步驟二,建立指標(biāo)函數(shù)如下,這一指標(biāo)函數(shù)包含了飛機(jī)響應(yīng)、飛行員操縱量和操縱速率。
確定駕駛員模型參數(shù)如表2所示。其中觀察向量加權(quán)系數(shù)Qy=7.2和操縱加權(quán)系數(shù)ru=32.5為參考文獻(xiàn)[2](Craig R.Edkins.The Prediction of Pilot Opinion Ratings Using Optimal and Sub-optimal Pilot Models[R].AD-A278629,1994.)應(yīng)用OCM評(píng)分時(shí)的取值。
表2 OCM模型參數(shù)
而后,按照步驟三到步驟六,采用尋優(yōu)算法,計(jì)算得到最優(yōu)的注意力分配和指標(biāo)函數(shù)結(jié)果如下表3所示。同時(shí)按下式計(jì)算飛行品質(zhì)預(yù)測(cè)評(píng)分一并在表3中示出。
其中帶寬均方誤差幅值為Qy/ru為按本發(fā)明方法計(jì)算得到的觀察加權(quán)系數(shù)與操縱加權(quán)系數(shù)比值,f是操縱速率加權(quán)系數(shù)、PRtest是飛行試驗(yàn)真實(shí)駕駛員評(píng)分、PRpre是按本發(fā)明加權(quán)系數(shù)計(jì)算得到的預(yù)測(cè)評(píng)分、OCM是原始參考文獻(xiàn)按照原始加權(quán)系數(shù)得到的飛行品質(zhì)預(yù)測(cè)評(píng)分:
表3最優(yōu)的注意力分配和飛行品質(zhì)預(yù)測(cè)結(jié)果
比較本文評(píng)分結(jié)果(圖2中PRpre點(diǎn))和原始OCM結(jié)果(圖2中OCM點(diǎn))如圖2所示,按下式計(jì)算并比較研究對(duì)象1~4飛行品質(zhì)預(yù)測(cè)回歸模型剩余標(biāo)準(zhǔn)差:
計(jì)算得到本發(fā)明預(yù)測(cè)評(píng)分剩余標(biāo)準(zhǔn)差為0.5855,而原始OCM模型剩余標(biāo)準(zhǔn)差為1.2440。顯然本發(fā)明方法獲得評(píng)分精度更高。這證明了本發(fā)明加權(quán)系數(shù)計(jì)算方法的正確性,以及在飛行品質(zhì)評(píng)估中的優(yōu)越性。