朱 莉 王 猛 孟兆新 李 博 喬際冰
(東北林業(yè)大學機電工程學院,黑龍江 哈爾濱 150040)
我國在木材零部件切割加工方面大都還使用人力手推切割,這種方式生產效率低,勞動強度大,且危險性較高[1]。由于送料平臺屬于多自由度多耦合控制系統(tǒng),系統(tǒng)模型的構建較為困難,各軸的誤差也會影響終端切割誤差。目前,調整機構誤差的控制方法主要有改進機械結構進行補償[2]、提前反轉減小回程誤差等[3]。然而,在切割不同曲線時,需要對參數進行調整,因而使加工過程中的操作變得復雜。
由于通過機械結構減小誤差的方法效果有限,近年來,通過軟件控制機械結構誤差的方法成為研究熱點。Ni等[4]為實現(xiàn)三自由度機械手的誤差控制系統(tǒng),使用一階攝動理論輔助建立了誤差矩陣。Pan等[5]建立了一種新的誤差控制機制,減小了不確定N-link機器人系統(tǒng)的誤差。Yang等[6]在研究機器人運行軌跡方面使用了誤差約束方案。在控制方法中,智能控制中的機器學習方法只需利用智能學習中產生的數據決定行為[7]。強化學習則是一種試錯學習算法[8],在缺乏數據指導的情況下,通過智能體與環(huán)境的不斷交互來提高整體性能,從而達到目標范圍或找到最優(yōu)控制策略。在強化學習中,使用較多的Q學習算法已被用于主動結構控制系統(tǒng)中[9],可對相關參數進行在線調整。但是在控制連續(xù)動作時,有時不能達到超精密減振范圍。因此,在連續(xù)動作的控制中,確定性策略梯度(DPG)算法[10]被廣泛使用。……