金 龍 李嘉昌 常振強 盧經緯 程 龍
微型撲翼飛行器(Flapping wing micro aerial vehicle,FWMAV)是一種模仿自然界中鳥類和昆蟲飛行的機器人,具有飛行效率高、質量輕、耗能低和機動性強等優點[1-2],在民用和軍事領域有著廣闊的應用前景.因此,FWMAV 成為飛行器領域的熱門研究方向[3-4].
FWMAV 因其優秀的飛行能力可應用于各種復雜環境,但其飛行機理較為復雜,控制難度較大.近年來,研究人員通過空氣動力學、風洞試驗和數值模擬等方法對撲翼飛行機理進行分析,取得了顯著成果,這為FWMAV 的發展奠定了理論基礎.隨著科學技術的發展,尤其是微機電系統技術和復合材料領域的技術革新,FWMAV 具有了更高的集成度和更完善的飛行性能,使其完成長時間、遠距離、無能源補充條件下的特殊任務成為可能.例如美國加州大學伯克利分校Rose 等[5]研制的名為H2bird的FWMAV,采用了滑翼與撲翼相結合的飛行方式,其飛行速度可達1.2 m/s,持續飛行可達10 min;美國國防高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)資助的納米蜂鳥計劃在2011 年發布的一款小型仿蜂鳥,它能夠在空中懸停3~ 4 min,飛行速度可以達到6.7 m/s,機身上帶有攝像頭,可以向地面實時發送彩色視頻[6];美國哈佛大學的Ma 等[7]研制的一款仿蒼蠅的FWMAV,重量只有80 mg,可以模仿蒼蠅的飛行姿態,并且能夠在空中穩定懸停.國內西北工業大學宋筆鋒團隊在2001 年開始對仿鳥飛行機構進行研究和實驗,并研制了多個樣機[8];哈爾濱工業大學周超英團隊成功設計重量只有23.8 g 可垂直起飛的仿昆蟲FWMAV[9]和一款可懸停的FWMAV[10].然而,以上飛行器均采用遙控控制手段.FWMAV 要完成如偵察、搜救等特殊任務,就必須具備自主飛行能力,能夠自主調節飛行姿態[11-12].因此,FWMAV姿態控制成為一個亟需解決的問題.
目前,針對FWMAV 姿態控制問題開展的研究基本都采用狀態反饋控制方法進行分析,進而完成控制器設計.例如,Banazadeh 等[13]提出的一種FWMAV 自適應滑模控制器;He 等[14]提出的一種全狀態神經網絡FWMAV 控制器.上述控制器均采用狀態反饋控制法進行控制分析.然而,利用狀態反饋控制法設計的控制器在作用于控制系統時,只與控制系統相關,與控制器特性無關.而這將會導致控制信號隨狀態變化產生較大波動,為控制器的執行帶來困難.FWMAV 控制系統是一個非線性非定常的復雜系統,且容易受到擾動的影響,因此需要設計一個可靠的控制器實現FWMAV 姿態穩定控制.傳統的比例微分(Proportional-derivative,PD)控制算法難以滿足FWMAV 控制需求[15].為進一步優化控制器,研究人員將人工智能相關理論與技術應用到FWMAV 控制中,例如基于神經網絡的FWMAV 控制法,而這種方法控制精度雖高卻較難實現[16].
神經動力學(Neural dynamics,ND)是在脫胎于Hopfield 神經網絡的遞歸神經網絡(Recurrent neural network,RNN)的基礎上發展起來的.近年來,在工業和學術領域,ND 方法在處理復雜計算或最優化問題方面扮演著重要的角色.文獻[17]利用基于梯度的更新律在線估計動態反饋控制器的最優增益,并通過李雅普諾夫分析證明了該控制器的穩定性;文獻[18] 在強化學習框架下求解哈密頓-雅可比-貝爾曼方程,設計了具有非對稱輸入約束的連續時間非線性系統的最優神經控制方案;文獻[19]證明了ND 模型求解非線性方程的有效性.鑒于此,采用ND 方法設計FWMAV 姿態控制器是一次有效嘗試.
為進一步提高FWMAV 姿態控制性能,本文基于平行智能理論框架ACP (Artificial systems,computational experiments,parallel execution)方法,結合ND 法提出一種用于FWMAV 姿態控制的抗擾動ND 姿態控制器.ND 方法可以實現將狀態變量描述的非線性系統轉化為誤差形式的線性微分系統,從而實現對復雜非線性系統的建模分析.本文采用ND 法中一種基于誤差函數的調零動力學方法,不斷遞歸更新問題的解,使得誤差函數能夠理論收斂到0[20-21].平行智能框架下的ACP 方法指包括人工系統(Artificial systems,A)、計算實驗(Computational experiments,C) 和平行執行(Parallel execution,P)的智能控制策略,具有數據驅動和虛擬現實交互的特點[22-24].ACP 方法的主要思想是通過構建平行系統將實際問題擴展到虛擬空間,利用人工系統對復雜系統進行重新建模;在計算實驗中,分析評估系統性能并確定控制方案;在平行執行過程中,將控制輸入作用于人工系統和實際系統,并通過人工系統和實際系統的相互作用對控制輸入進行優化[25].在以上過程中,建立人工系統來近似實際系統,而不是直接解析系統動力學模型.實際系統與人工系統之間為平行關系,可以改善系統模型結構,為處理復雜系統提供了諸多便利.自2004 年中國科學院自動化研究所王飛躍研究員提出ACP 方法以來[26],這一理論創新吸引了大量理論研究者和從業人員的關注,且在智能車輛系統、智能交通系統和計算機視覺等領域取得了巨大成就[27-31].基于ACP 理論的平行控制方法在處理線性和非線性系統問題時也都展現出良好的適用性和有效性[32-35].
FWMAV 的結構如圖1 所示,其中,(XB,YB,ZB)為機體坐標系,用于確定FWMAV 的飛行相對方向,其原點在FWMAV 機體重心處.FWMAV 的飛行姿態由機體坐標系中的歐拉角表示,即橫滾角、俯仰角和偏航角.

圖1 FWMAV 結構示意圖Fig.1 Schematic diagram of FWMAV
用于FWMAV 姿態控制的拉格朗日動力學模型可以寫為[13-14]
FWMAV 的非線性運動方程如式(1)所示,其姿態控制系統可以描述為
利用ND 法對FWMAV 姿態控制問題進行討論.首先,定義姿態誤差函數δr1=γ-xr1d,并根據式(2)將誤差函數進一步寫為
接著,根據ND 法設計誤差函數的演化式為=-αδr1,其中α∈R,且α>0,R表示實數集.由此,式(3)可以寫為
式(4)還可進一步寫為
再次利用ND 法構造誤差函數δr2:
同樣,利用ND 法可以得到
結合式(2),(5)和(7),可以得到ND 控制器ur的表達式為
至此,結合式(3),可以將整個FWMAV 控制系統描述為
上述公式中均省略了自變量時間t.我們期望通過不斷地迭代更新得到一個合適的控制輸入ur,使得FWMAV 實際飛行姿態軌跡可以很好地與預設姿態軌跡重合.
在本節中,采用ACP 方法,提出一種基于ND控制器的抗擾動姿態控制器,以用于FWMAV 姿態控制.
通過ACP 方法,即人工系統、計算實驗、平行執行,完成控制器設計,其具體過程如圖2 所示[34].

圖2 FWMAV 姿態控制ACP 過程Fig.2 ACP processes of FWMAV attitude control
首先,通過觀察和分析真實系統,基于ND 法構建一個FWMAV 姿態控制人工系統.該系統與實際系統等價,對于人工系統的控制等價于實際系統的控制.接著,從人工系統中提出一種新的抗擾動ND 姿態控制器,并通過分析計算來驗證控制器的有效性;最后,通過人工系統與真實系統的交互執行,對控制器進行進一步更新,以得到滿足設計要求的控制器.
建立人工系統是ACP 方法的基礎.對于FWMAV 姿態控制而言,FWMAV 人工系統也可以看作是FWMAV 的系統模型.而FWMAV 的原始系統模型不利于其控制器設計和姿態控制,因此需要重新建立一個人工系統.通常采用一些重構動力學的近似方法來建立人工系統,例如神經網絡、支持向量機和回聲狀態網絡等方法[36-38].本節將在ND法的基礎上設計考慮擾動情況的FWMAV 人工系統.
第1.2 節中,我們初步得到的ND 控制器可視為初始化FWMAV 人工系統,但在其建立過程中,并沒有考慮FWMAV 在姿態控制中遇到擾動的情況.這些擾動在姿態控制過程中會影響飛行控制精度和穩定性,因此在建立人工系統時需要解決這一問題.為建立考慮擾動的FWMAV 姿態控制人工系統,誤差函數的演化公式可改進為[39]
其中,δ(t) 表示誤差函數,β和α為大于0 的實數.構造FWMAV 姿態控制人工系統誤差函數δa1和δa2,δa1=xa1-xr1d,此處xa1為人工系統輸出.根據設計式(10),誤差函數可以進一步寫為
則δa2可以寫為
其中,xa2=a1.同理,根據式(10)可進一步將δa2寫為
于是,抗擾動ND 控制器ua可以表示為
考慮到FWMAV 姿態控制中不可避免地受到外界干擾,將擾動d考慮進構造的人工系統中
通過計算式(16)可以得到用于控制FWMAV姿態的力矩ua,而通過ua可以控制FWMAV 按照預設姿態軌跡飛行,使姿態誤差δ(t) 保持在可接受范圍內.
定理 1.對于任意可微且有界的期望姿態軌跡xr1d(t),FWMAV 姿態控制人工系統利用抗擾動ND 控制器,從任意初始狀態xr1(0) 開始,都可以追蹤到預設的飛行姿態軌跡.
證明.對于設計式(10) 的第i個子系統可以寫為
對于式(1 7),假設其初始值為mi(0)=0,(t)=δi(0),該方程解析解有以下3 種情況.
1) 當σ12∈R,α2>4β時
進一步,可得
則向量形式的誤差可以寫為
2 ) 當σ1=σ2∈R,α2=4β時,誤差函數可以寫為
3 ) 當σ1=a+ib,σ2=a-ib為共軛復數,α2<4β時,誤差函數可以寫為
綜上所述,對于任意可微且有界的期望姿態軌跡xr1d(t),在基于抗擾動ND 控制器的FWMAV人工姿態控制系統中,從任意初始狀態xr1(0) 開始,利用抗擾動姿態控制器求解出的飛行姿態軌跡與預設軌跡之間的誤差均可以指數收斂到0,即追蹤到預設的飛行姿態軌跡.
定理 2.對基于抗擾動ND 控制器的FWMAV姿態控制人工系統,若存在恒定擾動、線性時變擾動或有界隨機擾動,其控制誤差δ(t) 收斂至一有界值.
證明.根據式(10)和(15),在考慮外部擾動的情況下,可以將設計式寫為
根據擾動類型的不同,以下將從恒定擾動、線性時變擾動、有界隨機擾動3 種情況分別討論.
1 ) 當擾動為恒定擾動時
對式(18)的子系統進行拉普拉斯變換,可得
其中,?i ∈{1,2,3},di(s)=di/s.由終值定理,可得
故得 l imt→∞‖δ(t)‖2=0.
通過以上分析,證明了在FWMAV 人工姿態控制系統中,即使存在任意大小的恒定擾動,FWMAV 姿態控制誤差δ(t) 也可以全局收斂至0.
2 ) 當擾動為線性時變擾動時
線性時變擾動具體可以描述為d(t)=R3×1.對含有擾動項的FWMAV 姿態控制系統(18)的子系統進行拉普拉斯變換,可得
根據終值定理,可得
因此,可以得到
其中,L=[-α,-β;1,0],q=[1,0]T.由上式可得
根據三角不等式理論,存在
當α2>4β時,則可以得到
通過以上分析得到結論: 對于有界的未知向量形式的隨機擾動,在FWMAV 人工姿態控制系統中,FWMAV 的實際姿態軌跡與預期姿態軌跡之間的殘差都是有界的.
綜上所述,無論對于恒定擾動、線性時變擾動還是有界隨機擾動,基于抗擾動ND 控制器的FWMAV 人工姿態控制系統具有優越的抗擾動能力,FWMAV 的實際軌跡可以快速收斂至期望值.
所謂平行執行,就是使實際系統與人工系統平行交互作用,通過平行執行的方式對整個FWMAV控制系統實現有效控制.
平行執行過程根據實際系統和人工系統的平行關系,對兩者之間的區別進行分析和比較,進而實現對實際系統的“完美控制”.FWMAV 控制的平行執行具體過程如下: 通過構建的人工系統得到控制力矩,然后將此控制力矩應用在實際系統中,進而比較人工系統與實際系統表現出的性能差異.若人工系統和實際系統表現出的性能差異過大,則通過調節參數對人工系統控制力矩進行調節,直至FWMAV 姿態控制系統能夠達到預設目標,即實際飛行姿態軌跡跟蹤到預設飛行姿態軌跡.具體執行過程如算法1 所示.
算法 1.平行執行算法
上述調節參數即為調節人工系統(16)中α和β.根據第2 節對定理1 及設計式(10)的子系統分析可知,若要使誤差函數δ(t) 快速收斂到一個預定義的極小值,則需要一個足夠大的α和合適大小的β.具體而言,當系數α相對于β足夠大時,經過α/4 s,|δi(t)|的值將是|δi(0)|的1.83%.也就是說,當α=400,而β=0.01 時,經過t=0.01 s,|δi(t)|的值將小于 0.0183×|δi(0)|;經過t=0.1 s,|δi(t)|的值將小于 4.21×10-18×|δi(0)|.值得注意的是,在計算機計算時,浮點數的精度有限.例如,浮點數的間距“eps”,在MATLAB 環境下為10~ 16 階.因此,在調節時只需要選擇一個較大的α和合適大小的β即可達到預期誤差精度.
考慮到人工系統需和實際系統保持同步,設人工系統與實際系統之間誤差函數為e=xr1-xa1,則結合式(4)可得
結合式(10),進一步可得
將上式兩邊同時對時間t求導
上式的第i個子系統可以寫為
若要使得人工系統與實際系統保持同步,則其誤差ei需在人工系統穩定的同時趨近于0,人工系統穩定時δa1i →0.顯然,通過求解微分方程e¨i+αei=0 可知,當α越大時,ei越快趨近于0.
綜上所述,在平行執行過程中,確定參數α和β時,綜合考慮收斂速度和計算復雜度,參數初始值應選擇較大的α值和適當大小的β值.將人工系統中得到的力矩應用到實際系統中,若e→0,則確定此參數;若兩系統性能差異過大,則適當增大α繼續此過程.一個足夠大的α和合適大小的β就可以使得誤差函數理論上快速收斂到0,但在實際工作中,一般需要預設一個極小值μ,當‖e‖2<μ時,確定控制序列ua.
本節通過數值仿真驗證抗擾動ND 控制器的有效性.如第2 節所示,本文采用ACP 方法完成FWMAV 姿態控制器的設計,其在平行執行階段,將人工系統中得到的控制力矩應用在實際系統中,以此確定人工系統與實際系統的性能差異,不斷優化該FWMAV 姿態控制器,使其能夠完成FWMAV 實際系統中的姿態控制任務.
在本節的數值仿真實驗中,將展示優化后的控制器在實際系統中的表現,具體為在不同擾動下的姿態控制能力和抗擾動能力.仿真實驗具體實驗參數設置如下:
1 ) FWMAV 期望姿態軌跡為
2 ) 轉動慣量矩陣為
其中,Ixx=575 g·mm2,Iyy=576 g·mm2,Izz=991 g·mm2.此外,m=5.6 g,初始條件xr1(0)=[0,0,0]T,xr2(0)=[0,0,0]T.
為與本文所設計ND 抗擾動控制器進行比較,本節對文獻[14]中的FWMAV 控制器(81)進行姿態控制仿真.用于FWMAV 的姿態控制器為
其中,Kp和Kd分別為比例控制系數和微分控制系數.將控制器參數設置為Kp=3 000,Kd=0.5,其實驗結果如圖3 和圖4 所示.

圖3 文獻[14]中的控制器(81)姿態控制Fig.3 Attitude control of the controller (81) in [14]

圖4 文獻[14]中的控制器(81)姿態控制誤差Fig.4 Attitude control error of the controller (81) in [14]
圖3 為FWMAV 實際姿態軌跡與期望姿態軌跡,圖4 顯示了FWMAV 姿態控制誤差曲線.其中姿態控制誤差具體定義為
控制器參數設置為α=50,β=0.1.其余實驗參數設置與PD 控制器實驗相同,按照擾動類型分別進行數值仿真.
當擾動為恒定擾動時,即d=[10,10,10]T,仿真結果如圖5 和圖6 所示;當擾動為線性時變擾動時,即d=[0.5t,0.5t,0.5t]T,仿真結果如圖7 和圖8所示;當擾動為有界擾動時,即d=[d3,d3,d3]T,其中,d3表示0 到3 內的隨機數,仿真結果如圖9 和圖10 所示.

圖5 恒定擾動下抗擾動ND 控制器姿態控制Fig.5 Attitude control of the anti-disturbance ND controller with constant disturbance

圖6 恒定擾動下抗擾動ND 控制器姿態控制誤差Fig.6 Attitude control error of the anti-disturbance ND controller with constant disturbance

圖7 線性時變擾動下抗擾動ND 控制器姿態控制Fig.7 Attitude control of the anti-disturbance ND controller with linear time-varying disturbance

圖8 線性時變擾動下抗擾動ND 控制器姿態控制誤差Fig.8 Attitude control error of the anti-disturbance ND controller with linear time-varying disturbance

圖9 有界隨機擾動下抗擾動ND 控制器姿態控制Fig.9 Attitude control of the anti-disturbance ND controller with bounded random disturbance

圖10 有界隨機擾動下抗擾動ND 控制器姿態控制誤差Fig.10 Attitude control error of the anti-disturbance ND controller with bounded random disturbance
現實中擾動可以看作是大小動態變化的時間序列.而這種時間序列往往是無規律非周期的.由于任何周期函數都可以用正弦函數和余弦函數構成的無窮級數來表示[40],因此我們可以將擾動信號看作周期足夠長的周期信號,通過足夠多的正弦信號去對其逼近.為進一步驗證本文所設計控制器的抗擾動性,本節還將加入正弦擾動實驗,實驗結果如圖11 和圖12 所示,其中,正弦擾動d=[3 sin(t),3 sin(t),3 sin(t)]T.

圖11 正弦擾動下抗擾動ND 控制器姿態控制Fig.11 Attitude control of the anti-disturbance ND controller with sine disturbance
圖5、圖7、圖9 和圖11 為FWMAV 實際姿態軌跡與期望姿態軌跡,圖6、圖8、圖10 和圖12 顯示了FWMAV 姿態控制誤差曲線.從圖中可以看出,所求解得到的實際軌跡可以很好地跟蹤到預期軌跡,并且無論對于恒定擾動、線性時變擾動、有界隨機擾動或正弦擾動,抗擾動ND 控制器都展現出了良好的抗擾動性.
與不加任何擾動的對比姿態控制器相比,ND抗擾動控制器在控制精度方面顯現出明顯的優越性.為更清楚地說明上述結論,在表1 中對兩種控制器控制誤差的平均值和標準差進行數據比較.從表1 中可以明顯看出,ND 抗擾動控制器平均誤差較小,且控制效果也更為穩定.

表1 控制器性能比較Table 1 Comparison of performance among different controllers
硬件在環(Hardware-in-the-loop,HIL)實驗是以實時處理器運行仿真模型來模擬受控對象的運行狀態,它不僅彌補了純數字仿真中的許多缺陷,提高了整個模型的置信度,而且實現了仿真模型和實際系統間的實時數據交互,使仿真結果的驗證過程更加直觀[41-42].本節使用HIL 實驗模擬實際系統的輸出,驗證所提FWMAV ND 抗擾動姿態控制器的實用性.
在本次實驗中,我們利用HIL 實驗復現正弦擾動下的ND 抗擾動姿態控制器仿真結果,所有參數選擇與計算機仿真參數相同.我們使用STM32 和Simulink 平臺進行此次HIL 實驗.首先,硬件環境涉及STM32F103 單片機和一臺配備英特爾酷睿i5-9400F CPU (2.20 GHz)的電腦.其次,STM32 和Simulink 平臺的軟件環境分別依賴于電腦上的Keil uvision5 和MATLAB R2019a.STM32 與Simulink 環境之間的通信是以串行通信協議的方式來進行的,這是一個實現短距離通信的有效方法,其中波特率為115 200 bit/s.HIL 仿真采樣時間設置為0.01 s.即將輸入的期望軌跡和所提出的FWMAV 抗擾動姿態控制器連續集成到STM32 單片機中并自適應調節輸出信號.最后,STM32 單片機傳輸跟蹤結果到Simulink 平臺進行分析并顯示.
整個HIL 仿真實驗的過程如圖13 所示.首先,如圖13 左方框圖所示,為保證從STM32 中產生的輸出數據可以到達Simulink 平臺,建立了Simulink 和STM32 之間的串口通信.但是在串行通信過程中,首先需要對數據進行預處理,以保證數據的正常傳輸.因此,STM32 中直接輸出的數據需要被解析,如圖13 中間方框圖所示.最后,解析數據在Simulink 平臺以scope 的形式被檢測,如圖13右側框圖所示.圖14 為HIL 實驗中正弦擾動下ND 抗擾動姿態控制器求解的實際軌跡與預期軌跡之間的誤差曲線圖.從圖14 中可以看出,與計算機仿真結果相似,實際軌跡與預期軌跡的誤差可以收斂到0,可以說明ND 抗擾動控制器的實用性.可以注意到的是,圖14 與第3.2 節中正弦擾動下抗擾動ND 控制器姿態控制誤差圖12 仍有所不同,這是由兩種實驗設備和實驗環境之間的差別所致,不同實驗設備計算所帶來的截斷誤差、舍入誤差不盡相同,會導致實驗結果有所偏差,但整體上,該實驗結果是可以接受的.

圖13 FWMAV 系統硬件在環Simulink 仿真框圖Fig.13 FWMAV HIL Simulink simulation block diagram

圖14 FWMAV ND 姿態控制器硬件在環仿真誤差曲線圖Fig.14 HIL simulation error curve of FWMAV ND attitude controller
本文基于ACP 方法,提出了一種抗擾動ND 控制器用于FWMAV 姿態控制.在控制器設計當中,基于平行智能理論框架ACP 方法,在FWMAV 人工姿態控制系統中得到有效的控制力矩,使其在實際系統中平行執行,完成一個ACP 過程,得到適用于FWMAV 實際系統姿態控制的有效控制力矩以完成FWMAV 姿態控制.該控制器抗擾動性強,計算簡便,有很好的實用價值.在下一步的工作中,我們將對該方法進行進一步分析和改進,定量化不同時滯對應的影響并尋求抑制方法,并且針對FWMAV搭建相關的硬件平臺對本方法進行進一步驗證.