薛紅軍, 巫火根, 張曉燕, 張峰
(西北工業大學 航空學院, 陜西 西安 710072)
人機系統工程是以控制論、模型論和優化論為基礎的綜合性邊緣技術學科,建立科學、準確的人的數學模型是人機工程學研究的重點[1]。人的數學模型建立方法有多種,隨著控制理論的發展而不斷發展,由基于早期的經典控制理論的駕駛員傳遞模型到基于現代最優控制理論的駕駛員最優控制模型,相繼又出現了模糊控制、魯棒控制、預見預測控制和智能控制模型。通過對駕駛員控制決策特性的進一步研究,又有了駕駛員的最優魯棒控制模型、預見預測控制模型以及基于神經網絡的駕駛員模型。20世紀60年代末到70年代初期,Kleinman等[2]依據隨機最優控制(LQC)理論提出了駕駛員最優控制模型(OCM),隨后又出現了改進后的OCM模型,如1976年建立的HOCM模型[3],1979年建立的LQOCM(LQG-OCM)模型,1992年Davidson[4]在HOCM和LQG-OCM模型的基礎上又建立起來了MOCM(MODIFIED-OCM)模型,1994年Edkins[5]建立了SOCM(SUB-OPTIMAL PILOT MODEL)模型,這些模型既可以實現單軸任務的分析研究,也可以實現對多軸多環的復雜控制任務的研究。
本文通過建立駕駛員的MOCM模型,形成人機閉環仿真系統,分析人機系統的飛行品質,并將其與試驗中駕駛員的Cooper-Harper評價尺度(PR)進行對比分析,驗證駕駛員最優控制模型的有效性和準確性。本文主要針對駕駛員最優控制模型的應用進行了分析研究。
駕駛員最優控制模型基于如下假設:受過良好訓練的駕駛員能夠以一種近似最優的方式控制系統,在其自身的極限能力內調整增益和補償量,以最小化一個客觀的評價函數并給出其主觀評分[6]。MOCM的結構如圖1所示。

圖1 MOCM結構框圖Fig.1 Structure of MOCM
飛機的動力學模型狀態是可控的,被控對象帶擾動的動力學常系數空間狀態方程如下[7]:

(1)
式中,x為n維狀態向量;δ為駕駛員模型的nu維輸出狀態向量;w為協方差W的nw維零均值高斯白噪聲;y為駕駛員模型的nv維輸入狀態向量。駕駛員的延遲時間用二階Pade近似替代(因為在駕駛員感興趣的頻率范圍(0.1~10.0 rad/s)內,二階Pade近似可以很好地等效純延遲e-τs)。
(2)
將式(1)和式(2)結合可得:
或
控制任務的要求是使得二次性能指標Jp最小。
(Qy≥0,r≥0,f>0)
定義新的狀態變量χT=[xup]T,得到新的增廣狀態空間方程如下:
或
應用LQG理論可以得到增廣狀態矩陣方程的最優全狀態反饋增益為:

(A0)TK+KA0+Q0-KB0f-1(B0)TK=0
神經肌肉動力學模型由下式決定:
因此可以得到:
考慮到人操縱輸入的不確定性,加入了控制噪聲vu。
式中,vu為零均值協方差Vu的高斯白噪聲。從而可以得出下面新的增廣矩陣:
或
狀態估計由Kalman濾波得到:

A1Σ1+Σ1(A1)T+W1-
W1=diag(WVu),W≥0,Vu≥0
整個人機閉環系統的狀態方程為:
I1=[Ip0],Cδ=[0Cd1]
駕駛員的狀態空間方程為:
或
根據Lyapunov方程,可以求出狀態向量的協方差值P。
yT=[yobsδ]T的協方差按下式計算:

本文采用的試驗數據就是在LAMARS模擬器上完成的。根據文獻[8],試驗中對飛機施加的干擾信號為正弦函數的疊加(Sum-of-Sines)信號,這種信號的數學模型如下:
任務由13個正弦函數組成,相角φi隨機選擇,任務增益K根據所需任務幅值來確定。ωi在0.1~30.0 rad/s之間線性分布,Ai取值為2 rad/s,最終俯仰角的干擾信號如圖2所示。

圖2 俯仰角干擾信號Fig.2 Driving noise of pitch angle
圖3所示是提供給駕駛員完成補償控制任務的誤差信號的顯示器。圖中,θe為俯仰角誤差,φe為滾轉角誤差。本次試驗中只關注俯仰角誤差,因此駕駛員的任務就是在飛機受到干擾的情況下讓θe盡可能為零。

圖3 補償信號顯示器Fig.3 Compensation signal display
以5個比較典型的飛機俯仰角傳遞函數為例[8],應用駕駛員最優控制模型對飛機飛行品質等級進行評估,與真實的駕駛員給出的主觀評價作比較。5個飛機的傳遞函數如下:
第1個傳遞函數與積分環節非常接近,可以當作積分環節來處理,其它4個的特性如表1所示。

表1 飛機的動力學特性Table 1 Aircraft dynamics
這5個模型很好地代表了一般飛機的傳遞函數,覆蓋的飛機動力學模型范圍比較廣,每一種情況都由6名不同的駕駛員來完成評價,然后取其給出PR值的平均值,如表2所示。

表2 試驗的Cooper-Harper評分(PR)Table 2 Cooper-Harper ratings of test
從表2中可以看出,編號為1和2的飛機飛行品質等級為1級,編號為3~5的飛機飛行品質等級為2級。
在LAMARS飛行仿真模擬器上的追蹤信號f(t)是正弦函數的疊加信號,可以用高斯白噪聲經過濾波器的有色噪聲來模擬。
有色噪聲的輸入形式有3種,分別加在飛機動力學模型的輸入端、輸出端和中間,如圖4~圖6所示。根據試驗中的實際情況,本文加在輸出端。

圖4 噪聲加在飛機輸入端Fig.4 Noise injected at aircraft input end

圖5 噪聲加在飛機輸出端Fig.5 Noise injected at aircraft output end

圖6 噪聲加在飛機中間Fig.6 Noise injected in the middle of the aircraft
對于單軸任務,Vy和Vu由下式求得:
式中,ρy和ρu為噪信比,需要先給定,ρy的取值與顯示器、駕駛員自身因素以及駕駛環境有關,最終通過迭代計算讓噪信比達到給定的值,此時的Vy和Vu就是所需要的噪聲強度。駕駛員Cooper-Harper評分與性能指標之間的關系式為:
式中,ωw為濾波器的帶寬。
根據表3給定的參數,基于MOCM模型建立人機閉環系統,利用駕駛員Cooper-Harper評分與性能指標之間的關系式得到計算結果,如表4所示。通過與表2的試驗結果相比較可以看出,仿真計算結果與試驗結果非常接近。

表3 MOCM模型參數Table 3 Parameters of MOCM

表4 仿真的Cooper-Harper評分(PR)Table 4 Cooper-Harper ratings of simulation
由系統仿真得到駕駛員的MOCM最優控制模型描述函數為:
YP1=δ/e=
YP2=δ/e=
YP3=δ/e=
YP4=δ/e=
YP5=δ/e=
本文對5個飛機的動力學模型建立了人機閉環系統,得到了駕駛員的MOCM最優控制模型,最后利用相關計算指標得到了駕駛員的Cooper-Harper評價尺度。經過比較可知,計算結果與試驗結果相一致。結果表明,此方法可以應用到人機系統的飛行品質分析中,在飛機設計的初期就可以對飛機的性能做出評估。本文只針對駕駛員的單軸操縱任務建立了人機閉環系統模型,以后還需要對多軸任務作出應用研究。當被控對象難以控制時,模型預測與真實駕駛員評價的一致性會差一些,就需要對駕駛員Cooper-Harper評分與性能指標之間的關系式進行修正,從而建立更準確的關系式,這需要大量的試驗數據作支撐,這也是下一步的研究方向。
參考文獻:
[1] 徐浩軍,劉東亮,孟捷.基于系統仿真的飛行安全評估理論與方法[M].北京:國防工業出版社,2011:7.
[2] Kleinman D L,Baron S,Levison W H.An optimal control model of human response-part I:theory and validation[J].Automatica,1970,6(3):357-369.
[3] Toader Adrian,Ursu Ioan.PIO I-II tendencies,part 2:improving the pilot modeling[J].INCAS Bulletin,2011,3(1):109-118.
[4] Davidson J B,Schmidt D K.Modified optimal control pilot model for computer-aided design and analysis[R].NASA-TM-4384,1992.
[5] Edkins C R.The prediction of pilot opinion ratings using optimal and sub-optimal pilot models[R].AD-A278679,1994.
[6] 胡兆豐.人機系統和飛行品質[M].北京:北京航空航天大學出版社,1994:39.
[7] Toader Adrian, Ursu Ioan.PIO I-II tendencies case study,part 1:mathematical modeling[J].INCAS Bulletin,2010,2(1):91-102.
[8] Edkins Craig R.Human pilot response during single and multi-axis tracking tasks[R].AD-A275080,1993.