楊靜宜,崔建弘*,龐雅靜
(1. 河北工程技術學院,河北 石家莊 050000;2. 河北科技大學,河北 石家莊 050000)
作為人機協作的計算研究對象之一,人機協調操作感知控制備受研究人員的關注,成為現階段重點研究的對象之一。
為了實現人機協同操作,需要在機器人控制系統中添加人的行為感知特征信息,使人和機器人共同工作時,機器人能夠更好地匹配人體的運動模式。一般而言,阻抗控制大致可分為直接分配、力控制、阻抗與控制等,比較有代表性的是阻抗控制方法,具體操作即將控制坐標信息與接觸力信息統一起來,通過控制結果來控制操作的感知,但是這種方法只有依靠固定環境間的接觸力量,機器人才能完美地響應人體直接接觸,存在工作空間的限制;另一種有代表性的是一種既變阻尼控制,又稱變阻尼性控制方法,首先分析人與人之間的協調特點,根據速度的快慢設定不同的阻尼參數,從而控制機器人的協調動作,但是降低了人機之間的作用力,造成操作者和機器人在執行任務時,出現延遲或系統故障等問題;另一種關節控制方法是通過關節空間的動力學模型,基于增廣PD控制理論,補償耦合力及摩擦力,設計主動關節的同步控制,但是僅靠速度信息并不能很好地控制人與機器人之間的配合。
針對上述問題,本文提出了一種基于特征深度學習的機器人協調操作感知控制方法,其關鍵在于依靠迭代來估算目標函數的最優質解,優化網絡信息交互的拓撲結構,特征深度學習感知單元,減少數據量較大對計算機梯度的消耗,實現操作者與機器人之間的協調操作感知性能。
在機器人系統內,協調即機器人與操作者在完成一集體運作時的互相作用,是機器人系統對環境的適應。由于機器人存在著知識不完整、不兼容、不一致和不可度量等問題,使得機器人與操作人員之間可能存在許多沖突,系統在正常有序運行時出現錯誤。在操作更復雜的物體時,需要操作者和機器人協同操作,共同完成這一任務。在這種情況下,為了最大限度地減少彼此間的沖突,機器人和操作者之間需要一種兩者相互感知的協調。機械人協調主要包括兩個方面的內容:機械人與操作者的協調操作和機械人部件的協作。機器人與操作者協作解決的關鍵問題是如何組織多個部件共同完成一項任務,而完成任務的前提條件是決策機制與操作員之間的組織問題[1],機器人的協作解決主要是如何實現或保持機器人和操作員在執行任務的過程中動作的一致性,即協作關系確立后,機器人如何具體控制動作。
對機器人的協作,現在還沒有一種較為統一的定義。大體上來說,協調控制映射了機器人在不同的層次中對交互與感知控制提出的不同要求。其中,機器人系統不同層次的協調問題,如圖1所示。

圖1 機器人系統不同層次的協調協作
圖1內:①隱式協調,機器人憑借自身現存的規劃模型控制整體部件的規劃進而出現的協調模式[2];②異步協調,機器人與操作者的在某個環境內,其在出現互相間關涉的條件下為了將自己的任務完成所出現的協作;③同步協調,機器人和操作者為了對共同的復雜任務進行處理,而出現的協作。
在進行人機協作時,負載的承受體是機器人[3],而機器人會與操作者通過力傳感器進行相互作用,操作者經過意圖感知對機器人進行負載運動操作。其運作的流程如圖2所示。

圖2 人機協調操作模型
人和機器人協作搬移質量是M的負載,系統的動力學模型是:

(1)
式中,M代表負載的質量,m,c,k即虛擬慣量、虛擬剛度系數與虛擬阻尼,Fh就是人機交互力,Fr就是負載上機器人的作用力。機器人是承載負載的主體,而m,c,k就是決定人機協調操作性能的參數[4]。
憑借上述擬定的人機協調操作模型,構建人機協調系統,首先在單自由度人機協作模型內取消回彈力設置[5],然后擬定機器人阻抗控制剛度的參數為零,即Kd=0。機器人阻抗控制在笛卡爾空間內能夠表示成

(2)

為了提升人機協作內機器人的跟隨性能,使人機系統更為柔順[6],本文擬定了一種阻抗控制器,對機器人的速度進行補償,利用人機作用力和期望力的誤差不斷調節速度的補償項,從而使機器人的現實末端速度可以較好地跟隨期望末端速度。
自適應阻尼控制器

(3)
式中,Ω代表速度補償項,fd代表期望的交互力,擬定fd=[-t,t],t代表正向接近于零的常數,剩余參數如上式所示。
速度補償項擬定成

(4)
式中,λ代表收集樣本的周期,η代表更新率,b代表常數。
特征深度學習是神經網絡模型的一種[7],它是一門信息科學和神經心理學相結合的交叉學科,大致上依賴于模擬生物神經的工作模式和網絡結構,它并不能完全模擬人的智能。神經細胞是神經網絡中較為基本的一類,它以人腦中神經元的基本工作原理為基礎,向各種類型的輸入信號傳遞信息,使數據完成控制替換。處理后的信息通過神經元相互傳遞,從而拓展了網絡的信息交互范圍。其神經網絡的架構如圖3所示。

圖3 神經網絡架構圖
在特征深度學習算法里,優化算法即依靠迭代來估算目標函數的最優質解。在優化問題中,為了減少數據量較大對計算機梯度的消耗[8],就需要進行迭代計算,迭代可以讓所有計算步驟逐漸縮小,在非優化問題里,憑借迭代方法逐漸的靠近目標函數最優質解。
針對約束問題minf(x),其目標函數的最小值是x*,f(x)的二階泰勒展開式是

(5)
式中,gk代表f(x)函數在xk坐標的梯度,H(xk)代表f(x)在xk坐標的海森矩陣[9],且函數滿足極值點坐標的梯度是零,即
?f(x)=0
(6)
在計算最小值的流程內,擬定第k+1次迭代里,?f(xk+1)=0,那么通過式(5)計算獲得
?f(x)=gk+Hk(x-xk)
(7)
即:gk+Hk(xk+1-xk)=0,所以能夠獲得牛頓法迭代公式

(8)
上述雖然得到的牛頓法迭代公式,但其計算后無法得到全局最優解,因此就需要一種優化方法對其進行全局最優解。
擬定f(x)含有一階連續偏導數,在計算此類無約束最優問題minf(x)里,x*為最小的目標函數值。在估算最優解的過程里,負梯度坐標就是依靠函數下降最快的方法,因此在迭代的過程時,都需要憑借負梯度坐標來更新x值。f(x)的一階泰勒擴展公式是

(9)
式中,gk代表f(x)函數在xk坐標的梯度,那么第k+1次迭代滿足
x(k+1)←xk+λkPk
(10)
式中,Pk代表搜索的方向,即負梯度方向,λk為步長。在凸優化函數的估算的流程里,梯度下降方法可以得到全局最優解的函數。
得到最優解之后需要對其進行海塞矩陣的計算,但在牛頓法迭代里,計算海塞逆矩陣H-1較為困難,因此能夠憑借n階矩陣來靠近H-1。在算法的所有迭代步驟內,滿足

(11)
式中,k代表迭代的次數,那么Hk的更新規則是

(12)

(13)

(14)


(15)

(16)
式中,rk代表比值系數,只要利用最后的曲率信息來估算出現實的海森矩陣,并且其可以使當前不的搜索方向為期望方向,從而縮短結果與現實值之間的誤差,并且在步長是ak=1的狀態下也可以獲得滿足,進而使后期步長的時間與搜索步驟得到節省。
由于力傳感器信息中含有噪聲,因此需要平滑去噪處理,以保證人機協調操作的穩定性,因此在人機協同操作感知中,輸入與速度之間沒有線性關系。通過人機交互力信息的采集,在利用導納控制方法收集源件時達到了理想的運行效率。受到導納控制的人機協調模型如圖4所示。

圖4 導納控制的人機協調操作感知模型
機械阻抗是導納理論的前身,是一種依據剛度、廣義慣量和阻尼的等效理念,把現實的物理系統擬定為一種具有導納特征的輸出與輸入系統,建造理想速度與作用力之間的聯系。其定義是

(17)
式中,M,C,K分別代表廣義阻尼、廣義慣量與廣義剛度。
本文對控制系統的虛擬阻尼參數進行調解,從而使系統的感知響應速度得到提高。可變阻尼的參數調解規則如下所示
1)在|dF|<β時,操作者施加作用力,那么具有力的轉化信息的可變阻抗控制規則即

(18)
2)初始速度方向上的力突然降低,其可以表示成減速,這就能夠判定操作者需要改變方向或是停止。此時需要將系統的阻尼參數值進行提升控制,進而使系統的感知響應時間縮短,即|dF|↓?c↑,因此人機交互內、運動速度與加速度的關聯是

(19)

為了使人機協調操作的條件得到滿足,讓操作者的操作環境更為舒適、穩定與安全,力的增量需要在一個可控的范圍里,即|dF|<β,假如dF>0時的加速度超過零,那么就說明操作者想要加速,反之就是想要減速。
3)在|dF|≥β時,代表人機協作出現偏差,即人機操作時力出現一種突變的狀態,需要剔除此刻的力信息,機器人持續上一時刻的作用力,不出現置換。
仿真環境為Intel Celeron Tulatin1GHz CPU、384MB SD內存的硬件環境以及MATLAB6.1的軟件環境。
為了證明本文方法的實用性,引入阻抗控制方法(方法一)、變阻尼性控制方法(方法二)和關節控制方法(方法三)對機器人部位進行關節1和關節2追蹤位置測試,通過部位關節的位置跟蹤性能評定操作者與機器人之間的協調操作感知控制狀況,結果如圖5、6所示。

圖5 關節1位置誤差
通過圖5能夠看出,本文方法的誤差度大于0,完全可以滿足實際運行的需要。
圖6為官集結2位置的誤差度對比測試結果。

圖6 關節2位置誤差
由圖6可知,最高可達0.2,說明本文方法對機器人的協調操作感知有著較好的控制精度,同時還存在較好的操作性能,操作模型可以平滑切換。
本文利用人機作用力和期望力的誤差不斷調節速度的補償項,從而使機器人的現實末端速度可以較好地跟隨期望末端速度。現應用方法1、方法2和方法3對多個補償項下的末端速度進行迭代測試,不同方法的測試結果如圖7所示。

圖7 不同方法末端速度迭代測試結果
由圖7可知,在迭代過程中,本文方法對人機作用力和期望力的擬合效果較高,且皆高于其它方法,因為控制系統的軟件使用了模塊化的架構,使系統可以更容易的得到維護與擴充,進而減少系統資源的占用比值,最高為94%,減少了操作者的負擔。
1)為了對機器人進行負載操作,實現操作者與機器人之間的穩定交互,本文提出了一種基于特征深度學習的機器人協調操作感知控制方法。
2)分析機器人的協調操作原理,優化機器人協調操作的感知性能,減少系統資源的占比最高可達94%。
3)利用虛擬阻尼、虛擬慣量與虛擬剛度系數構建人機協調操作模型,模型誤差度大于0,最高可達0.2,使得人機協調操作的穩定性得到提升,機器人負載運動狀態控制更為穩定。