盧承華, 朱明超,王 棟, 吳清文
(1.中國科學院長春光學精密機械與物理研究所,吉林 長春 130033;2.中國科學院大學,北京 100049;3.長光衛星技術有限公司,吉林 長春 130033)
如今,機械臂被廣泛應用到去毛刺、焊接、打磨等工業自動化加工等領域,這些工作要求機械臂末端與環境接觸并對接觸面進行跟蹤與預測,且需要同時控制機械臂末端的位置與力信息[1-2]。針對機械臂末端力與位置的智能控制問題,國內外學者已經開展了很多研究。
力/位混合控制[3]、阻抗控制[4]是兩種主要的柔順控制方式。其中,力/位混合控制在控制過程中需要預先對力矩陣或位置矩陣進行選擇,即控制過程中需要對力、位置控制模式來回切換,不能同時對二者進行控制,這一缺點大大影響了機器人控制的柔順性[4-5]。而阻抗控制避開這一缺點,成為一種性能優良的控制算法。自1985年Hogan提出阻抗控制概念以來,該算法便受到了極大的關注并應用到了機器人控制的各個領域[6]。Lasky與 Hsia首次將阻抗控制應用到力跟蹤問題,他們將機械臂與環境接觸的模型等效為虛擬的質量-彈簧-阻尼系統,巧妙地簡化了控制過程[7]。
阻抗控制與自適應控制以及學習算法的結合也成為了國內外學者研究的熱點。Seul使用自適應控制對阻尼系數進行優化[8],Liu、段晉軍等人對剛度系數進行優化[8-11],但自適應過程并未顯示優化后的阻抗系數。Abdelhamid提出了四種可用于機器人的迭代學習控制方法[12],李琳、Liang等人將迭代學習應用到了曲面跟蹤[13-15],并對末端軌跡偏移量進行迭代學習,但該算法需要經歷較多的迭代次數才可達到理想效果。Li、Ge用基于線性二次調節的強化學習阻抗控制算法權衡并減小力與位置誤差[16-17],Loris利用強化學習與迭代學習步長摩擦力并進行了阻抗力控制[15],張鐵利用強化學習優化了力誤差系數[18],但強化學習具有較高的計算復雜度。
為提升學習效率并簡化學習過程,本文提出了一種基于梯度迭代的阻抗控制算法,適用于未知曲面的跟蹤過程,可以處理環境參數和機器人動力學的不確定性。通過優化機械臂阻抗模型的等效阻尼系數,減小了跟蹤過程中力誤差與位置誤差,能夠在誤差允許范圍內尋找到最優的阻尼系數且使系統趨于穩定。仿真結果證明,該算法具有較高的效率和較高的精度,具有可行性和正確性。

(1)
式中M是質量矩陣,B是阻尼矩陣,K是剛度矩陣,ΔF(t)為實際接觸力F與期望接觸力Fd之差。該模型的傳遞函數為

(2)
不失一般性,以一維空間舉例,只考慮一維空間的機器人末端與曲面接觸模型為

(3)

圖1 機器人末端與環境接觸模型
其中e=xc-xr。Δf可分解為
Δf=f-fd
=ke(xe-xc)-fd
=kexe-kexc-fd
=kexe-ke(xr+k(s)Δf)-fd
(4)
將一維空間的傳遞函數代入得
Δf(ms2+bs+k+ke)
=(ms2+bs+k)[ke(xe-xr)-fd]
(5)
由此可得穩態力跟蹤誤差

(6)
為使(5)式收斂于0,需對fd進行討論:
若fd=0,存在xr=xe,必然使Δfss=0,因此穩態力跟蹤誤差收斂于0。
同時,在傳統載體基礎上,豐富教育手段。構建一個或多個具有代表性的師生交流平臺,培養一批少數民族學生意見領袖,充分利用互聯網渠道下的自媒體平臺,擴大意識培育宣傳覆蓋面。高校民族團結進步教育不止是在寢室民族團結、主題班會等顯性教育上做文章,同時需將教育根植于文化理念中,在校園學習和生活中內涵式的表達、浸潤式的教育,潛移默化地影響學生。通過榜樣示范、民族文化展示等途徑激勵大學生自覺培養民族團結精神和愛國主義精神。
若fd≠0,ke(xe-xr)-fd≠0,因此想要使穩態誤差收斂于0,須置k=0,由此機器人末端與曲面接觸模型可簡化為

(7)
其中e=xc-xr。由于環境參數未知,很難獲得精確的參考軌跡,因此以環境位置xe取代參考軌跡xr,則阻抗控制模型為

(8)
其中

=ke(xc-xe)-fd
=-kee-fd
(9)
即

(10)
未知曲面跟蹤與預測任務要求機器人及環境接觸的力盡量小,同時盡量貼合環境位置,因此曲面跟蹤與預測效果的好壞與力誤差和位置誤差有關。定義ef為實際接觸力f與期望力fd的差,ex為機器人末端實際位置xc與環境位置xe的差,即

(11)
在此,定義損耗函數Γ作為曲面跟蹤與預測效果的度量,即

(12)
其中,γ1和γ2是力誤差與位置誤差的權重系數。若機器人任務為純力跟蹤,可設γ2=0或γ1?γ2,反之同理。

圖2 控制結構
在前一節式(7)已經推導得出簡化后的阻抗控制模型。由于質量矩陣m的改變會導致系統不穩定,因此一般將m設為定值[19],如下式

(13)
通過優化阻尼系數b,可以達到曲面跟蹤與預測的良好效果。
本文使用基于梯度迭代的學習方法優化阻尼系數。其優化策略如下
bk=bk-1+α?Γbk-1
(14)


(15)
由式(8)、(9)和式(12)知

(16)
因此式(14)可以轉化為與誤差相關的函數

(17)

圖3 阻抗系數優化流程
為驗證所提方法的有效性,使用Matlab Simulink模塊以二自由度機械臂跟蹤未知曲面進行仿真。曲面跟蹤任務為:在保證機器人末端與曲面有接觸的情況下,對曲面輪廓進行檢測。
曲面跟蹤輪廓為圓心在(1m,1m)處、半徑0.2m的圓形二維曲面,曲面剛度系數為,但機器人對曲面信息未知,機器人末端運動的初始位置位于(0.8m,1.0m)處,采樣時間0.001s。
為防止機器人的質量矩陣變化給系統帶來的不穩定性,將質量矩陣設為定值。阻尼系數的學習采用梯度上升策略,初始值為0,學習速度因子 設為10,損耗函數 中力誤差與位置誤差的權重系數 、 分別設置為2.5、7.5,這表明在此次仿真中,更看重軌跡跟蹤的效果,但學習速度因子和權重系數可以依據操作任務需求調整。理想情況下,對于曲面檢測,應將理想跟蹤力設為0,但為保證機器人與曲面接觸,將理想跟蹤力設為 N。將目標理想跟蹤力誤差定為0.01N,目標理想跟蹤位置誤差為3mm,當實際跟蹤力和跟蹤位置誤差同時達到跟蹤誤差精度時,迭代停止。
經過10次迭代后,曲面跟蹤的效果較理想。機器人在與曲面接觸前期,接觸力波動較大,后期波動較小;隨著迭代次數的增加,接觸前期波動幅度減小,后期逐漸接近理想跟蹤力設定值,其中第10次迭代得到的實際接觸力為0.0497N,與理想跟蹤力的誤差小于0.01N,如圖4。迭代前期,跟蹤軌跡與理想軌跡存在一定差距,經過10次迭代后,機器人末端已經可以較完美地跟蹤曲面軌跡,其中x方向的跟蹤效果逼近過程如圖5,首次與末次的二維跟蹤效果如圖6。

圖4 機器人與曲面力跟蹤迭代效果

圖5 機器人與曲面跟蹤X方向位置迭代過程

圖6 機器人與曲面軌跡跟蹤迭代效果
作為曲面跟蹤效果的度量,損耗函數顯示了迭代后的曲面跟蹤的結果,如圖7。由于損耗函數是與力跟蹤誤差、位置跟蹤誤差相關的函數,因此其呈現的變化趨勢與圖4和圖5相似,但由于誤差只可減小并不可消除,因此損耗函數始終為正,但跟蹤效果顯示,經過10次迭代,損耗函數呈現收斂趨勢,在第10次迭代過程中已經趨近于0。每次迭代過程中的最大位置跟蹤誤差是跟蹤效果穩定性的評價標準,圖5顯示了10次迭代過程中的最大位置誤差與描述最大位置誤差變化趨勢的最大誤差導數,由圖可見,二者都呈現收斂趨勢,可見該算法穩定性良好。

圖7 損耗函數變化

圖8 最大位置誤差
在迭代過程中,阻尼系數由初始值0開始尋優,經過10次迭代后,滿足了力跟蹤誤差和位置跟蹤誤差,且能夠在0.5s時間內迅速響應接近最優阻抗系數,如圖7。此時最優的阻尼系數約為[24,0;0,24]。

圖9 第10次迭代過程中的阻尼系數
本文提出一種基于梯度迭代的阻抗控制算法,適用于機器人對未知環境的曲面跟蹤。對機器人末端執行器與曲面接觸建立阻尼系數可變的新型阻抗控制模型,使用梯度上升迭代算法對阻尼系數進行優化,能夠在短時間內迅速響應至最優阻尼系數。設置與力誤差、位置誤差相關的損耗函數作為跟蹤效果的度量。仿真結果證明,該算法能夠在10次迭代后達到理想的控制精度,具有較高的迭代穩定性,能夠達到良好的曲面跟蹤效果,具有廣闊的應用前景。