耿 宏,何雨龍
(中國民航大學 電子信息與自動化學院, 天津 300300)
飛行控制是飛行仿真研究中重要環節[1],飛機運行過程中快速存取記錄器(quick access recorder,QAR)數據記錄了大量飛行參數,包含控制仿真所需的特性參數、動力學參數、舵面偏轉量參數等各項機型參數信息,利用QAR數據訓練飛行仿真運動模型成為當前探索解決的熱點問題。但僅用QAR數據訓練的運動模型誤差較大,對此用QAR數據訓練飛行姿態仿真控制律,以減小運動模型的誤差。
有關數據的方法,國內外學者的研究聚焦于融合歷史運行數據來仿真或評價系統實際運行過程[2-4]。李士哲等[5]在關于火電機組負荷控制中運用系統歷史數據,仿真其輸出特性;Mu等[6]針對二階連續時間非線性系統,通過觀測系統輸出生成運行數據庫,利用其與當前狀態偏差設計數據驅動的自適應濾波結構,討論了該控制結構下系統的控制效果。Hao等[7]針對SISO系統控制問題,提出系統歷史數據驅動的繼電反饋神經網絡PID(PIDNN-RF)混合算法,利用算法實現模型逼近和軌跡跟蹤控制。上述方法在不依賴于模型先驗信息情況下,憑借數據驅動方式達到了較好的控制效果,但忽視了對象本身的運動特點。本文基于上述研究中融合歷史數據的思想,從機型QAR數據建立的運動模型入手,結合具有自適應補償的動態逆控制方法,將QAR數據應用到飛行姿態控制仿真中,改善指定機型的仿真效果。
動態逆方法是一種有較強適應性和通用性的控制方法,由于該方法能較好地應對非線性對象各通道間繁雜的解耦工作,且無需反復調節各回路增益[8],因此在飛機非線性控制中也有較多應用[9-11]。如何在QAR數據所建立的運動模型基礎上,利用QAR數據設計補償結構從而校正運動模型誤差,是本文需要解決的重點問題。
針對上述問題,本文以飛機為研究對象,利用奇異攝動理論劃分姿態三通道,應用動態逆控制策略,實現該機型姿態控制律仿真。考慮辨識區間內運動模型存在誤差的情況,利用QAR數據與模型輸出量的偏差設計自適應補償環節,通過補償結構逼近逆誤差,從而進行修正。最后選擇典型自動飛行模式進行仿真,通過對比模型輸出與原始QAR數據,驗證該方法有效性。
本文采用的運動模型是利用機型QAR數據建立的飛機六自由度非線性模型,其中表征氣動特性的相關系數由文獻[12]中通過QAR數據辨識所得,各系數在所劃分的任一迎角區間內為定常值,辨識結果在[1,15]deg迎角范圍內有效。運動模型中與姿態量相關的氣動力矩多項式方程表達如下:
(1)
式中:Ml、Mm、Mn分別表示滾轉力矩、俯仰力矩和偏航力矩;Q為動壓;S、b、c為翼型常量;p、q、r分別對應三軸角速度;C*0為各力矩基本系數。C*δα、C*δe、C*δr為力矩相對于控制舵面的控制導數;C*α、C*β為力矩相對于2個氣流角的穩定性導數;C*p、C*q、C*r為相對于角速度的氣動導數;V為空速。
上述常量通過機型手冊匹配,基本系數及相關氣動導數由機型的QAR數據辨識求得,從而將通用模型更新為具備機型的運動模型。但基于QAR數據的辨識方法通常基于準定常假設,即假定分段區間內表征氣動導數為常值,因此當區間內定常系數與實際存在較小偏差,運動模型更新時由數值積分持續累積誤差,最終模型輸出與QAR數據存在較大誤差。
運動模型的狀態方程是關于飛行狀態量與控制輸入的函數,通過反饋線性化可將控制輸入量顯式地與姿態角這類飛行狀態量建立表達關系,易于姿態控制律設計。非線性模型通過反饋線性化,表達如下:
(2)
y=h(x)
(3)
其中: 狀態量為姿態角度和角速度集合,控制輸入量為控制舵面的偏轉量:
x=[p,q,r,φ,θ,ψ]T
u=[δa,δe,δr]T
(4)
狀態量集合中Φ、θ、ψ分別表示滾轉角、俯仰角和偏航角;控制輸入量集合中各變量與副翼、升降舵、方向舵偏轉量一一對應。式(2)(3)中,f(x),g(x),h(x)均為關于飛行狀態量x的非線性函數,g(x)為控制分布函數矩陣,u為控制輸入量。f(x)和h(x)與u不存在顯式關系。基于狀態反饋的動態逆控制策略應用于三通道姿態控制,其前提是滿足被控對象的狀態量和控制量處于同一維度,保證系統可控,因此結合奇異攝動理論,利用多時間尺度思想將姿態回路劃分為快慢兩層回路進行控制。本文快回路對應變量為x集合中角速度變量,即p、q、r;慢回路對應變量為集合中姿態變量,即Φ、θ、ψ。層疊式飛行姿態控制器結構示意圖如圖1所示。

圖1 飛行姿態控制結構示意圖
角速度回路即為內環快回路,其主要實現的功能目標是計算控制舵面的理想偏轉角度。如上部分所述,快回路中狀態量與控制輸入量通過反饋線性化,整理為以下形式:
(5)
式中,xa、xb表示狀態量集合,具體含義為:
xa=(V,α,β,p,q,r,δe)
xb=(Q,α,β,δe)
(6)
f*(xa)為非線性力矩函數,g*(xb)為操縱力矩函數。具體表達如下:
(7)
式中:CMl、CMm、CMn為力矩系數,根據式(1)多項式函數求出,ci(i=1…9)根據轉動慣量與慣性積得到,g*(xb)表示狀態方程中分離出的僅與u相關的線性項,如下所示:
(8)
因此綜合式(5)、式(7)和式(8),快回路動態逆控制律表達為:
(9)
其中,快回路狀態量的動態特性通過內環比例增益kp,kq,kr和指令信號通過差分近似表達:
(10)
執行機構以一階慣性環節近似,包括增益和控制舵面偏轉幅度限制,其中限制區間從飛行機組操作手冊中得到。
姿態回路作為外環慢回路,其主要功能是由姿態角計算理想角速度。設計思路與內環類似,將姿態角狀態方程改寫為仿射非線性形式。機體系中對應的f(x)為零,輸入量為期望的姿態角變化速率,由如下形式描述:
(11)
其中,期望姿態變化率由給定合適的回路增益kΦ,kθ,kψ,并根據姿態角指令信號計算求得。期望姿態角變化速率表達形式與式(10)一致。因此慢回路動態逆控制律表達為:
(12)
在機體系下的運動模型可簡化為以下形式:
(13)
式中:xa、xb物理意義與式(6)對應,x1、x2為飛行狀態量集合,對應慢、快變量,分別表示姿態角和角速度:
x1=[φ,θ,ψ]T
x2=[p,q,r]T
(14)
各通道動態逆控制律可通過以下形式描述:
(15)

(16)
(17)
為驗證控制系統穩定性,取Lyapunov函數為:
L=1/2eTe
(18)
聯立式(17) 并對式(18)求導,有:

(19)
(20)

由上述動態逆控制過程可以看出,實現控制的前提是保證能精確求解逆過程,使控制律設計能獲得滿意的精度。實際上,基于QAR數據建立的運動模型與實際飛行存在一定差異,導致式(7)和式(8)存在誤差,控制器與模型對消不夠完全,仿真模型輸出與實際飛行姿態誤差較大,無法逼近機型真實控制特性。針對該問題,以QAR數據作為參考,并借助神經網絡較強的自適應能力,通過引入QAR數據相關量與同時態下模型輸出姿態變量偏差,設計基于自適應補償的動態逆控制結構,修正逆系統求解帶來的誤差。自適應補償結構的動態逆控制框圖如圖2所示。

圖2 自適應補償控制框圖
利用神經網絡較強的逼近能力對控制輸入量進行補償,用以提高網絡的訓練精度和收斂速度。神經網絡結構采用單隱層結構,具體結構如圖3所示。

圖3 神經網絡結構
對于給定輸入xnn,神經網絡輸入輸出映射關系可以表示為:
ynn=WTσ(VTxnn)
(21)
式中:σ(·)為激活函數,選用Sigmoid函數σ(x)=ex/(ex+e-x),V和W分別為輸入層到隱含層、隱含層到輸出層的權系數。針對三通道動態逆姿態控制所設計的神經網絡,采用18-5-3結構,給定網絡輸入xnn和網絡輸出ynn為:
(22)
其中,e=x2-x2c表示快回路中角速度與QAR數據的偏差。神經網絡通過調整權系數而抵消控制系統逆誤差,權系數更新算法選為[13]:
(23)
(24)
式中:kw、kv為學習率;κ為調節因子,均為常值,根據仿真效果進行調整。
當飛行過程某一飛行階段姿態變化較快,控制輸入量變化頻繁時,為及時對控制系統輸入量進行補償,引入自適應魯棒調整項[14],定義為vr,具體表達為:
(25)
其中:
(26)

δad=Δδ+vr
(27)
從而疊加控制量補償的控制律更新為:
(28)
根據式(21)—(28)即可求出疊加自適應補償結構的運動模型輸出。
為驗證自適應補償的動態逆控制器在飛行姿態控制中的應用效果,本節在Matlab/Simulink平臺下分別對其階躍輸入響應和真實姿態動態變化軌跡仿真進行實驗。
S-Function中定義機型相關常量、基本重力加速度及6自由度動力學方程,作為實例化實現。相關參數設定為m=42 400 kg,g0=9.8 m/s2,S=122.4 m2,b=37.57 m,c=4.29 m;轉動慣量和相對慣性積由經驗公式估算得到[15];舵面偏轉幅度限制在±17 (°)/s,速率限制在±25 (°)/s。階躍響應仿真中,設置初始時刻飛行狀態為零;基于QAR數據的仿真實驗中,初始時刻飛機理想位置和控制形態通過fminsearch函數求解給出。
此外,由于QAR數據采樣率低,使其應用受限,因此需對數據進行必要的重采樣工作。鑒于飛機機動性不強,各狀態量改變趨于平穩漸變,故仿真時均采用三次樣條插值(Spline)[16]對數據進行重采樣以適應仿真需求。
本節針對俯仰通道進行俯仰角階躍響應實驗。從QAR數據中選取一段俯仰角度變化特征較為明顯的數據,數據曲線如圖4所示。

圖4 QAR俯仰角變化曲線
由圖4可以看出,飛機在4 s內俯仰角度由4°上升至5°左右,并在5°上下小范圍波動。本節階躍響應實驗旨在通過動態逆控制方法展示其控制特性。為觀察控制方法的響應特性并驗證疊加控制量補償的有效性,本節實驗給定階躍輸入模擬1.5°俯仰指令信號,設置階躍時間為5 s,仿真時間為30 s,求解器采用內置的Runge-Kutta定步長方法,仿真步長設定為0.04 s,快回路中比例增益kq設為10,慢回路中比例增益kθ設為3。根據式(21)—式(28)得到疊加自適應補償結構的運動模型輸出。動態逆控制效果如圖5,疊加自適應補償環節的控制效果圖6所示。

圖5 無補償俯仰通道階躍輸入測試

圖6 補償逆誤差俯仰通道階躍輸入測試
由圖5、圖6可以看出,俯仰通道的動態逆控制響應狀態良好,可以達到給定目標指令且達到穩態后始終保持輸出穩定。同時對比輸出曲線可以看出,疊加自適應補償環節的動態逆控制系統與未補償逆誤差的控制系統相比較,模型輸出的俯仰角角度在3 s內上升1.5°,達到給定的目標指令,且俯仰角超調量減小到8%以內,能夠體現飛機真實控制特性。
飛機在爬升或下降階段時,自動駕駛(AP) 通常接入開放模式,由俯仰方式控制飛行速度達到設定目標。該模式下,AP控制副翼和方向舵協調配合升降舵改變俯仰角,從而控制速度達到制導目標。該模式下飛機姿態變化直接表征其控制特性。因此本節實驗以開放下降模式(OP DES)為例,針對姿態三通道進行仿真實驗。選取QAR數據中開放下降模式(AP LONG MODE:OPEN)處于激活狀態的數據作為參考,各項狀態量直接反應真實飛行過程。為驗證方法的有效性,選取開放模式下訓練樣本外的數據作為驗證,插值后的樣本點為10 219,該過程中飛行高度從11 367 ft開始,以升降舵控制速度下降高度,期間完成一次左偏航,同時滾轉角由0°變化至-21°,當飛機按照新的航向飛行時,滾轉角基本保持0°。以定常平飛作為初始狀態,根據下降段約束條件設定適應度函數,通過fminsearch函數模塊迭代求解初始狀態。狀態量集合設定為X,在高度11 367 ft,飛行速度259 kts下,解析初值為:
X=[259,0.23,1.67,0,0,0,0,1.66,0]T
集合中各變量分別表示為飛行速度、側滑角度、迎角角度、機體系下繞x軸角速度、繞y軸角速度、繞z軸速度、滾轉角、俯仰角和偏航角。動態逆結構中快回路各通道增益設置為10,慢回路增益設為3。仿真時間設為35 s,仿真步長設為0.02 s,對相關量進行預處理使其采樣頻率與平臺求解步長一致。
三通道動態逆控制結構中快回路理想控制量輸出與疊加自適應補償環節的控制量輸出對比如圖7所示,OP DES模式下飛行姿態仿真結果如圖8所示。
圖7中點線為疊加補償結構內環計算的期望控制量輸出,實線為動態逆控制方法中控制量輸出曲線。從圖中可以看出自適應補償的動態逆控制量輸出曲線更為平滑,隨著神經網絡權系數更新,控制量在較短時間內趨于穩定。圖8中點線為經過三次樣條插值處理的原始QAR數據,由對比圖可以看出,疊加自適應補償結構的動態逆控制策略能更好地應對復雜的姿態變化情況,姿態仿真輸出更符合QAR數據中所表現出的控制特性,且有效減小了姿態角誤差。CCAR-60部模擬機客觀測試標準規定,在正常飛行條件下滾轉角容差為2°,俯仰角容差為1.5°,偏航角容差為2°,由此可看出下降段仿真中三通道姿態變量誤差均滿足飛行模擬機鑒定標準。姿態角最大誤差主要出現在仿真前期,是由于初始狀態點通過fminsearch函數求解,求解前需給定上下限,且OP DES模式下的QAR數據是隨機選取的,若設定范圍與實際狀態相差較大,則尋優函數在該范圍下的求解精度較低,導致飛機所給定的初始狀態與所選QAR對應變量偏差較大,但仿真開始3 s后,由自適應補償的動態逆控制器進行調節,仿真效果逐漸提高、誤差也相應減小。因此,基于自適應補償的動態逆姿態控制具備相當滿意的控制效果,且可以有效降低姿態角誤差。

圖7 控制量變化對比圖

圖8 姿態回路控制仿真對比圖
本文中以飛機為研究對象,將基于神經網絡補償結構的自適應動態逆控制策略,應用于三通道姿態控制仿真中,其中基于狀態反饋的動態逆結構能實現三通道姿態控制,同時結合QAR數據所設計的神經網絡補償結構能修正運動模型更新而帶來的誤差,使動態逆控制方法可以更加準確地逼近真實飛行規律,且模型輸出量誤差符合飛行模擬機鑒定標準,滿足工程需求。后續研究工作中,將進一步通過對QAR數據分析,根據不同機型QAR數據仿真對應機型的自動飛行控制律。