金俊凱,俞立,張文安
(浙江工業大學信息工程學院,浙江杭州 310023)
機械臂遙操作系統的時延補償自抗擾控制
金俊凱,俞立*,張文安
(浙江工業大學信息工程學院,浙江杭州 310023)
遙操作系統的通信環節中不可避免地存在通信時延導致系統不穩定和操作性能降低等問題,為了減小甚至消除時延的影響,針對單自由度機械臂遙操作系統,提出結合自抗擾控制方法和Smith預估器的新型時延補償和控制方法。在從機械臂端采用PID控制器實現位置跟蹤控制,在主機械臂端采用帶Smith預估器的自抗擾控制器,實現時延補償和對操作力的跟蹤,最終保證整個閉環系統的穩定性。最后通過仿真和頻域分析驗證了所設計控制器的有效性。
遙操作;機械臂;時延;自抗擾控制;Smith預估器
遙操作機器人的出現使得人類可以完成在難以接近和危險環境中的復雜作業,從而在一定程度上擴展了人類的感知和操作能力,保證了人類安全[1]。目前,遙操作機器人系統已被廣泛應用在空間探索、深海開發、軍事、核工業和醫療等各個領域,具有重要的用途和廣闊的應用前景。但是,隨著遙控距離的增加,通信環節的時間延遲是不可忽略的一個重要問題。在遙操作系統中,時延是導致遙操作性能降低、影響系統透明性和穩定性的根本原因[2]。
目前遙操作機器人系統的控制方法主要包括預測控制、遠程規劃和雙邊控制3種,而其中雙邊控制又包括無源控制[3]、魯棒控制[4]與四通道控制[5]等方法。但這種分類方法不是絕對的,如在雙邊控制結構中也可以使用預測控制[6]。在已有解決時延問題的眾多方案中,Smith預估器由于其設計簡單,調試方便,成為解決遙操作機器人時延問題的主要方法之一[7]。如Ganjefar將Smith預估器與波變量方法相結合用于遙操作系統中,以克服波變量無法解決的跟蹤誤差問題[8]。Munir也將波變量和Smith預估器相結合,并對引入的Smith預估器進行改進,加入了卡爾曼估計器和一個能量調節器,在波變量傳輸保證穩定性的基礎上增強系統的操作性能[9]。但是,Smith預估器是建立在系統模型精確已知的基礎上,如果存在建模誤差,則有可能導致系統不穩定。而機械臂模型不可避免地存在模型誤差并且在控制過程中存在擾動,很難得到系統較準確的預估模型;同時,遙操作系統的通信環節也可能存在著時延擾動。因此,僅使用Smith預估器不能對遙操作系統的時延問題進行較好地補償和控制,并保證系統的穩定性。
考慮到自抗擾控制器[10]對模型的不確定性帶來的干擾具有較強的抑制能力,文中提出結合自抗擾控制技術和Smith預估器的方法對機械臂遙操作系統進行時延補償和控制。在主機械臂端使用Smith預估器預測從機械臂狀態的基礎上,設計自抗擾控制器實現力的跟蹤并保證整個閉環系統的穩定性,在從機械臂端用PID控制器進行調節實現位置的無靜差跟蹤控制。其主要思想是設計Smith預估器對時延進行預估補償,同時通過設計自抗擾控制器,可較準確地估計模型誤差引起的不確定性和其它總和擾動,并對其進行動態線性化補償,從而降低模型誤差和時延攝動對系統性能帶來的影響。最后,通過仿真和頻域分析驗證了所提出方法的有效性。
考慮一個機械臂遙操作系統,其控制結構如圖1所示。操作者在主端對主機械臂進行操作使主機械臂產生一個位置信號,該位置信號經過通信環節到達從端的從機械臂,然后從機械臂跟隨主機械臂運動來完成操縱任務;同時環境對從機械臂的反作用力通過通信環節反饋給主機械臂。

圖1 遙操作系統的控制結構Fig.1 Con trol structu re of teleoperation system s
圖1中Cm(s)和Cs(s)分別表示主端控制器和從端控制器,Gm(s),Gs(s),Ze(s)分別表示主機械臂、從機械臂和環境的模型,并具有如下形式:

其中:xm和xs分別為主從機械臂的位置;Mm和Ms分別為主從機械臂的轉動慣量系數;Bm和Bs分別為主從機械臂的黏性摩擦系數;Be和Ke為環境的阻尼和彈簧系數;fh為操作者對主機械臂的作用力;fe為從機械臂和環境的相互作用力;τs和τσ分別為主從機械臂的控制力矩。
注意到遙操作系統的通信環節中存在時延,假設主端到從端的傳輸時延和從端到主端的傳輸時延均為固定時延,分別設為Tms和Tsm,文中采用典型的位移-力主從遙操作系統。主端的位移信息xm(t)發送到從端后定義為xds(t),從端力信息fe(t)反饋回主端后定義為fdm(t),考慮時間延遲的影響,可得

正是這些傳輸時延,影響了系統的穩定性和操作性能。文中目的是分別在主端和從端設計一個控制器,使這一遙操作系統在固定傳輸時延下能夠保持穩定并且具有良好的跟蹤性能和透明性。其中,從端控制器Cs(s)在從端用來實現位置跟蹤,使從機械臂能夠較精確地跟蹤主機械臂的運動;主端控制器Cm(s)不僅要保證整個閉環系統的穩定性,同時要使環境受到的作用力能夠跟蹤操作者的作用力,保證系統具有良好的透明性和操作性。
2.1 從端控制器設計
因為從端在本地構成位置閉環控制,從機械臂對主機械臂的位置跟蹤獨立于主機械臂的控制閉環,所以可以先設計從端控制器Cs(s)實現位置xs對xm的跟蹤。如圖1可以得到主機械臂輸出到從機械臂輸出的傳遞函數為其中,kP,kI,kD分別為比例、積分和微分系數。


2.2 主端控制器設計

從圖1中可以得到整個系統的閉環傳遞函數為由于這個局部系統的穩定性與傳遞函數的極點有關,而前向時延在傳遞函數的分子部分,所以這個前向時延不會對從機械臂控制系統的穩定性產生影響,僅僅是使從機械臂的運動整體落后于主機械臂。因此,為了在從端實現位置的無靜差控制,從端控制器可以采用如下的經典PID控制器:
其中,G(s)為從端所有環節的組合,即

由系統的閉環傳遞函數(7)可以看出其分母中存在時延環節,這將影響閉環系統的穩定性。因此,設計的主端控制器既需要實現主機械臂對操作力的跟蹤,同時還需保證閉環系統的穩定性。
為實現主端控制器良好的跟蹤性能,對網絡和系統模型不確定性的抗擾能力,文中在主端采用自抗擾控制方法設計跟蹤控制器,該控制方法的基本思想是把系統未建模動態和未知外擾作用都歸結為對系統的“總和擾動”而進行估計并給予補償。文中設計的線性自抗擾控制器包括3部分:
1)為主端操作力的參考輸入fh安排過渡過程。通過安排過渡過程,一方面可獲得作用力的過渡信號v1,解決快速性和超調之間的矛盾,另一方面可獲得作用力的近似微分信號v2。過渡過程安排和參考輸入微分信號的提取通過如下的線性跟蹤微分器(TD)獲得

其中,參數r為跟蹤微分器的快速因子。
2)設計估計反饋力和總和擾動的線性擴張狀態觀測器(LESO),其形式如下:

其中:z1和z2分別是對作用力fe及其微分信號的估計值;z3為擴張變量觀測量,是對系統總和擾動的估計;β1,β2,β3為一組待整定的參數,參數的選取可以通過極點配置取β=3ω,β=,β=。
1o23
3)設計狀態誤差反饋控制律。對狀態誤差采用PD控制律得到的控制量中減去擴張狀態觀測器估計的總和擾動,當此時得到的控制量作用到主機械臂時可消除總和擾動對系統的影響。該PD控制律為

其中,k1和k2分別為比例和微分系數,可以通過極點配置取k1=ω2c,k2=。
僅使用自抗擾控制器只能較好地消除未建模動態和其它外部擾動對系統的影響,但對通信環節存在的較大時延難以有效補償。此時,考慮將自抗擾控制方法和Smith預估器相結合[12],在主端設計一個Smith預估器對從端行為作預測,從而對時延進行估計并補償。Smith預估器結構如圖2所示。把所有從端環節的組合看作要估計補償的對象G(s),則可以得到其線性預估模型G^(s),其時延的總和T=Tms+Tsm引起的動態可一起通過Smith預估器進行估計補償。

圖2 Sm ith預估器結構Fig.2 Structure of the Sm ith predictor
圖2中,L是對實際時延T的一個近似估計,G^(s)是對對象模型G(s)的一個近似估計:通過Smith預估器可以獲得如下預測輸出:


當模型和估計時延與實際系統和真實時延相匹配時,采用Smith預估器可以完全補償時延影響。因此,基于Smith預估器和自抗擾控制器的遙操作控制系統結構如圖3所示。

圖3 基于Sm ith預估器和ADRC的遙操作控制系統結構Fig.3 Structu re of the teleoperation system based on the Sm ith p redictor and ADRC
2.3 系統簡化
為了方便進一步對系統進行頻域分析,可以參考類似文獻[11]中的方法,對圖3中的閉環控制系統進行簡化。將圖3中除去自抗擾控制器的部分作為一個整體看做被控對象Gp(s),則


根據式(21),可以將圖3表示的整個遙操作控制系統結構簡化為如圖4所示。

圖4 基于Sm ith預估器和ADRC的遙操作系統結構Fig.4 Sim plified diagram of the teleoperation system structu re based on the Sm ith pred ictor and ADRC

考慮如式(1)~(3)所示的機械臂遙操作系統,其中系統參數選取如下:
主臂:Mm=1 kg,Bm=1 kg·s/cm;
從臂:Ms=1 kg,Bs=1 kg·s/cm;
環境:Be=1 kg·s/cm,Ke=1 kg·s/cm。從端控制器采用PID控制器,控制器參數為:kP=100,kI=50,kD=10。主機械臂端的自抗擾控制器參數選取為:快速因子r=2.5,控制器帶寬ωc= 20,觀測器帶寬ωo=20,補償輸入系數b0=60。
假設總的網絡誘導時延是T=1 s,仿真結果如圖5和圖6所示。其中,圖5(a)顯示的是從臂的位置跟蹤效果,圖5(b)顯示的是主臂的力跟蹤效果。圖6中(a)和(b)分別顯示從臂的位置跟蹤誤差和主臂操作力跟蹤誤差。從仿真結果可以看出,主從機械臂力和位置的跟蹤效果良好,可以無超調而快速地跟蹤上參考軌跡,說明所設計的自抗擾控制器和Smith預估器的有效性。只是由于時延的存在,導致從機械臂的位置和力輸出約以1 s的時間滯后于主機械臂的位置和力輸出信號。同時,由誤差曲線可以看出,除了初始時有微小震蕩,最終誤差都能達到0,實現了力和位置的無靜差跟蹤。因此,所設計的控制系統在保證系統穩定性的前提下,得到較好的跟蹤效果,同時使操作者有較好的力覺臨場感。

圖5 T=1時主從機械臂跟蹤曲線Fig.5 M aster-slave m anipulators tracking cu rves when T=1

圖6 T=1時主從機械臂跟蹤誤差曲線Fig.6 M aster-slave m anipulators tracking er ror cu rves when T=1
為了說明該方案對Smith預估器模型不匹配問題的良好效果,將轉動慣量系數增加20%,但保持原來的Smith預估器模型不變。為了得到更好的觀測效果,將主臂延遲后與從臂的信號比較,得到的仿真結果如圖7,8所示,分別表示主從機械臂位置和力的跟蹤曲線與跟蹤誤差曲線。可以看出,當Smith預估器模型存在較大誤差時仍然可以得到比較好的跟蹤效果。

圖8 模型不匹配時跟蹤誤差曲線Fig.8 Tracking error curves when the model does not match
為了進一步說明所設計控制器的抗擾性和魯棒性,在上述模型誤差基礎上在通信通道上再加以10%的時延擾動Δt=0.1sin(t),同樣將主臂輸出延遲后與從臂的信號比較,其仿真結果如圖9,10所示。圖9中(a)和(b)分別表示位置和力的跟蹤效果,圖10中(a)和(b)分別表示位置和力的跟蹤誤差。從仿真曲線中可以看出位置和力跟蹤仍然能達到較好的效果;盡管有微小的震蕩,但都分別保持在1.5%和5%以內,而且最終都能夠較平穩達到設定值,表明該方案對時延攝動具有較強的魯棒性,能抑制一定程度的時延擾動。

圖9 T=1時含時延擾動的主從機械臂跟蹤曲線Fig.9 M aster-slave m anipulators track ing curves when T=1 and including time delay disturbance

圖10 T=1時含時延擾動的主從手跟蹤誤差曲線Fig.10 M aster-slave manipu lators track ing er ror curveswhen T=1 and including time delay d istu rbance
最后,為了說明所設計控制器的有效性,再從頻域角度對其進行分析。圖11為圖3所示遙操作系統的閉環頻率特性曲線圖,即式(22)所表示的閉環傳遞函數的伯德圖。從圖中可知,在幅值曲線中不存在峰值,同時可以看出系統具有較大的帶寬,表明系統具有較好的平穩性和跟蹤速度;同時在高頻段有負的斜率,幅值衰減較快,表明系統具有較好的抗干擾性。

圖11 遙操作系統閉環頻率特性曲線Fig.11 C losed-loop frequency dom ain characteristics of the teleoperation system
針對機械臂遙操作系統中的時延問題,將Smith預估器與自抗擾控制方法相結合,使主從機械臂達到力和位置比較精確的軌跡跟蹤效果。此方法可以通過Smith預估器估計并補償通信環節中的時延,同時可以有效地將由Smith預估器模型誤差引起的不確定動態用擴張狀態觀測器進行實時估計并補償。在仿真過程中加入一定的時延擾動,仍然可以得到較好的控制品質,驗證此方法具有良好的抗擾性和魯棒性。同時,在頻域上對系統進行分析,表明系統具有較好的穩定性和動態品質。
[1]HUA C,LIU X P.Delay-dependent stability criteria of teleoperation systems with asymmetric time-varying delays[J].IEEE Transactions on Robotics,2010,26(5):925-932.
[2]Niemeyer G.Telemanipulation with time delays[J].The International Journal of Robotics Research,2004,23(9):873-890.
[3]Chopra N,Berestesky P,Spong M W.Bilateral teleoperation over unreliable communication networks[J].IEEE Transactions on Control Systems Technology,2008,16(2):304-313.
[4]Leung G M H,Francis B A,Apkarian J.Bilateral controller for teleoperators with time delay viaμ-synthesis[J].IEEE Transactions on Robotics and Automation,1995,11(1):105-116.
[5]Hashtrudi-Zaad K,Salcudean S E.Transparency in time-delayed systems and the effect of local force feedback for transparent teleoperation[J].IEEE Transactions on Robotics and Automation,2002,18(1):108-114.
[6]HUANG JQ,Lewis F L,LIU K.A neural net predictive control for telerobots with time delay[J].Journal of Intelligent and Robotic Systems,2000,29(1):1-25.
[7]劉曙光,周宗錫,楊鋒.遙操作機器人系統的變時延控制[J].控制工程,2006,13(S0):179-181.
LIU Shuguang,ZHOU Zongxi,YANG Feng.Teleoperation control of an internet-based robotwith varying time delay[J].Control Engineering of China,2006,13(S0):179-181.(in Chinese)
[8]Ganjefar S,Momeni H,Janabi-Sharifi F.Teleoperation systems design using augmented wave-variables and smith predictormethod for reducing time-ddelay effects[C]//Proceedings of the IEEE International Symposium on Intelligent Control.Vancouver,Canada:IEEE,2002:333-338.
[9]Munir S,Book W J.Internet-based teleoperation using wave variables with prediction[J].IEEE/ASME Transactions on Mechatronics,2002,7(2):124-133.
[10]韓京清.自抗擾控制技術-估計補償不確定因數[M].北京:國防工業出版社,2008.
[11]袁東,馬曉軍,曾慶含,等.二階系統線性自抗擾控制器頻帶特性與參數配置研究[J].控制理論與應用,2013,30(12): 1630-1640.
YUAN Dong,MA Xiaojun,ZENG Qinhan,et al.Research on frequency-band characteristics and parameters configuration of linear active disturbance rejection control for second-order systems[J].Control Theory and Applications,2013,30(12):1630-1640.(in Chinese)
[12]ZHENG Q,GAO Z.Predictive active disturbance rejection control for processes with delay[C]//Proceedings of the 32nd China Control Conference(CCC).Xi’an:IEEE,2013:4108-4113.
(責任編輯:楊勇)
Delay Com pensation Active Disturbance Rejection Control for M anipulator Teleoperation System s
JIN Junkai,YU Li*,ZHANGWenan
(College of Information Engineering,Zhejiang University of Technology,Hangzhou 310023,China)
This paper investigates the delay compensation and control problem for a class of teleoperation systems.Network-induced delays are usually inevitable in teleoperation systems,which may lead to instability and performance degration of the systems.In order to reduce and even elim inate the effect of the time delay on system performance,a novel delay compensation method combining active disturbance rejection controller(ADRC)and Smith predictor is proposed in this paper for manipulators with a single degree of freedom.The PID controller is adopted for position tracking control in the slavemanipulator,while in themaster side,the ADRC controllerwith Smith predictor is app lied for delay compensation and force tracking control as well as guaranteeing stability of the overall closed-loop system.Finally,the simulations and frequency domain analysis are provided to verify the effectiveness of the proposed method.Key w ords:teleoperation,manipulator,time delay,active disturbance rejection control,Smith predictor
TP 242
A
1671-7147(2015)06-0723-07
2015-07-02;
2015-08-14。
國家自然科學基金項目(61273117);霍英東教育基金會項目(141064);浙江省重中之重學科開放研究項目(20141006)。
金俊凱(1991—),男,浙江溫州人,控制科學與工程專業碩士研究生。
*通信作者:俞立(1961—),男,浙江富陽人,教授,博士生導師。主要從事網絡化、機器人控制等研究。Email:lyu@zjut.edu.cn