鄒守睿,武毅男,方勇純
(南開大學 人工智能學院,天津 300350)
壓電驅動器具有位移分辨率高、響應快等優點[1-2],經常被用作原子力顯微鏡等微納操作與成像工具的驅動單元[3-5]。然而,由于壓電驅動器固有的遲滯特性,以及蠕變和熱漂移等其他干擾的影響,導致其實際位移和期望位移之間存在著偏差,從而降低了壓電驅動器的定位精度。遲滯特性導致壓電驅動器輸出位移和輸入電壓之間產生復雜的非線性關系。此外,遲滯特性還具有記憶性[6],具體體現在其輸出位移不僅和當前時刻的輸入電壓值相關,還和輸入電壓的變化情況相關[7],該性質導致驅動器在電壓增大和減小階段產生的位移不一致,其典型表現為輸出位移和輸入電壓之間形成一個遲滯環[8]。另外,遲滯非線性會隨著輸入電壓頻率的增大而更為顯著。因此,遲滯特性對壓電驅動器的定位精度產生了嚴重的影響。
針對上述問題,研究人員嘗試建立了多種壓電驅動器遲滯模型,并據此對遲滯非線性進行補償。總體而言,這些模型可以分為基于機理的模型和基于數據的模型。Preisach模型、Duhem模型、Maxwell模型等都是基于機理而建立的模型。具體而言,Xiao等[9]基于Preisach逆模型對變頻率遲滯特性進行建模和補償;Chen等[10]基于Duhem模型對壓電驅動器動態遲滯現象進行建模;Liu等[11]基于Maxwell模型實現了對壓電驅動器的遲滯建模。然而,基于機理的建模方法在進行參數辨識時需要大量計算,且其應用受限于模型的具體形式。與此相反,基于數據的建模方法不考慮模型具體的物理意義,而是利用神經網絡或模糊系統等方式,通過數據驅動建立模型。例如,Cheng等[12]使用Takagi-Sugeno模糊模型準確模擬了壓電驅動器的遲滯特性。此外,研究人員也建立了各種神經網絡模型來擬合遲滯特性。例如:Ling等[13]改進了傳統的神經網絡模型對遲滯非線性進行在線辨識;Zhao等[14]利用埃爾曼神經網絡對壓電驅動器進行建模。在各種不同的神經網絡模型當中,循環神經網絡(recurrent neural network, RNN)[15]由于其所具有的特殊結構,更適合于辨識具有記憶特性的系統。例如:Xie等[16]利用傳統的循環神經網絡構建逆模型,在高頻電壓驅動時得到更為準確的模型;Wu等[17]使用門控循環單元對壓電驅動器進行建模,并利用反向傳播神經網絡提升了模型對頻率特性的泛化能力。盡管利用遲滯模型能夠減弱遲滯特性對壓電驅動器跟蹤精度的影響,但是其他動態特性以及外部擾動仍會對驅動器的性能造成影響。為此,需要進一步設計控制器對壓電驅動器進行跟蹤控制。許多研究人員采用模型預測控制器對驅動器進行跟蹤控制。例如:Cheng等[12]分別設計了基于神經網絡和Takagi-Sugeno模糊模型的模型預測控制器。Xie等[16]在循環神經網絡逆模型的基礎上,采用預測控制器對壓電驅動器進行跟蹤控制。此外,研究人員也針對壓電驅動器設計了各種滑模控制策略。例如:Chouza等[18]提出了帶有擾動估計的滑模控制方法;Soleymanzadeh等[19]使用自適應滑模控制提高了壓電驅動器的跟蹤精度。
基于上述工作,本文針對壓電驅動器的遲滯建模與跟蹤控制展開研究,提出一種基于循環神經網絡逆模型的單神經元自適應控制方法,以提高驅動器的定位精度。具體而言,本文首先基于循環神經網絡建立了壓電驅動器的遲滯逆模型,該模型由遲滯子模型和頻率子模型串聯而成[20]。在此基礎上,利用該逆模型對驅動器進行前饋補償,并設計了單神經元自適應比例?積分?微分(proportional-integral-derivative,PID)控制器,從而消除模型誤差以及蠕變和熱漂移等其他干擾對驅動器跟蹤性能的影響。本文通過實驗驗證了建模精度和控制器的跟蹤性能。
循環神經網絡是一種以序列數據作為輸入的神經網絡。與普通的神經網絡相比,循環神經網絡在每個隱藏層神經元上包含了一個如圖1所示的反饋輸入,這使得循環神經網絡中隱藏層神經元的輸入不僅包含當前時刻的輸入,而且和過去一段時間的輸入也有一定的相關性,因此循環神經網絡擁有“記憶性”。

圖1 循環神經網絡的結構Fig.1 Structure of recurrent neural network
壓電驅動器的輸出位移不僅與當前時刻的輸入電壓相關,而且與輸入電壓的變化過程密切相關。因此,對于這種輸入數據是序列模式,且對于過去時刻的輸入數據具有一定依賴性的系統,采用循環神經網絡進行建模能夠得到更加符合壓電驅動器遲滯特性的精確模型[21]。同時,不同頻率的輸入電壓也會對壓電驅動器的輸出位移產生影響,遲滯非線性會隨著頻率的增大而更加嚴重。因此,本文設計了一種級聯結構,將壓電驅動器的遲滯逆模型拆分為遲滯子模型和頻率子模型兩部分,其中,遲滯子模型用來擬合遲滯非線性,而頻率子模型則將頻率相關性引入到模型中,由于采用了循環神經網絡結構,所建立的模型更加符合遲滯效應的記憶特性。所建立的逆模型的結構如圖2所示,其中,y表示壓電驅動器的輸出位移,l表示遲滯子模型的輸出,以此作為頻率子模型的輸入產生驅動電壓uinv。通過數據驅動的建模方式可以保證y和uinv之間具有唯一的因果關系[16]。

圖2 壓電驅動器遲滯逆模型結構Fig.2 Structure of the inverse hysteresis model of the piezoelectric actuator
具體而言,首先采用循環神經網絡建立遲滯子模型,其結構如圖3所示。在該子模型中,當前時刻驅動器的位移y(t) 被設置為模型的輸入,h(t)和l(t) 分別是當前時刻遲滯子模型的隱藏層輸出和輸出層的輸出。

圖3 基于RNN的遲滯子模型結構Fig.3 Structure of the hysteresis submodel based on RNN
隨后,根據單個循環神經網絡神經元的數學模型,可以得到輸入層節點和隱藏層節點之間的關系[22]:

式中: αh是h(t?1) 到h(t) 的權重; βh是y(t) 和h(t)之間的權重; λh是隱藏層的偏置。隱藏層和輸出層之間的關系為

式中: θh是隱藏層和輸出層之間的權重; γh是輸出層的偏置。隨后,將式(1)代入式(3)中即可得到遲滯子模型輸入和輸出之間的關系:

此外,本文中頻率子模型和遲滯子模型采用結構相同的循環神經網絡,于是可以得到頻率子模型的輸入輸出關系:

式中:hf(t?1) 代表頻率子模型中隱藏層在t?1 時刻的輸出;θf、 αf和 βf代表頻率子模型中網絡的權重; λf和 γf表示網絡中隱藏層和輸出層的偏置。
根據式(5)、(6)即可得到壓電驅動器位移和電壓之間的關系,隨后,采用Levenberg-Marquart算法[23]對網絡進行訓練,辨識網絡中的權重和偏置,即可得到遲滯逆模型的具體形式。
在得到基于循環神經網絡的遲滯逆模型之后,利用其對壓電驅動器進行前饋補償,能夠減弱遲滯非線性對驅動器跟蹤精度的影響。然而,建模誤差以及蠕變、熱漂移等其他干擾仍然在實際實驗中影響壓電驅動器的跟蹤性能。因此,需要進一步設計相應的控制器提高壓電驅動器的跟蹤精度。
單神經元自適應PID控制器是一種利用神經元的學習特性和增量式PID的控制器[24],神經元的學習特性可以通過自適應的方式得到更優的PID控制參數。因此,本文在遲滯逆模型前饋的基礎上,設計了單神經元自適應PID控制器進一步提升壓電驅動器的跟蹤精度,控制系統的結構如圖4所示。

圖4 控制系統的結構Fig.4 Structure of the control system
圖4中,r(t) 是期望軌跡,uc(t) 是單神經元PID控制器的輸出電壓,u(t) 為驅動電壓,其表達式為

具體而言,自適應控制器通過以下迭代方式產生輸出:



式中:wi(t) 代表控制器中需要學習的權重,其學習規則如式(13)所示:

式中: ηi是比例、積分和微分參數的學習率;e(t)是位移誤差,其表達式為

在單神經元自適應PID控制器中,神經元增益K是一個決定性的參數,不同K的設定值會產生很大的影響。因此,本文將K設置為一個自整定的參數K(t)[25],其具體取值的計算過程如下:

式中 s gn(·) 函數和Tv(t) 的表達式分別為

式中:Tv的初始值可以被設置成一個很小的數;φ和 μ 在本文中被設置為 φ =0.025, μ =0.05。
為了驗證提出方法的有效性,本文分別對模型的擬合效果和控制系統的跟蹤性能進行了實驗驗證。本文采用的激勵信號為不同頻率的正弦波信號,激勵信號經過電壓放大器后作為輸入驅動壓電驅動器。電壓放大器采用的是Physik Instrument(PI)公司的E505.00電壓放大器,壓電驅動器選用的是PI公司的P-517.3CL商用壓電驅動器,上位機采用的是基于Matlab/Simulink環境電壓放大器和上位機都連接到研華科技有限公司的PCI-1716輸入輸出數據采集卡進行數據通信。本文在實驗中所選取的采樣時間為0.025 ms。
為了得到遲滯逆模型的具體參數,首先對遲滯子模型進行訓練。在低頻輸入電壓的驅動下,頻率變化對壓電驅動器造成的影響并不明顯,因此,對于遲滯子模型,本文選取的激勵信號的頻率為1 Hz,隱藏層神經元的數量被設置為5。本文采用均方誤差作為損失函數,其具體表達式為

式中:W是需要被訓練的參數矩陣;U和L分別表示的是壓電驅動器的實際輸入電壓和遲滯子模型輸出的電壓。需要說明的是,盡管本文所建立的是逆模型,但是為了更加清楚呈現建模效果,模型訓練結果仍以遲滯環的形式給出。
遲滯子模型的擬合效果和訓練誤差如圖5所示。圖5(a)為遲滯子模型的擬合效果,藍色實線為實際測量數據形成的遲滯環,紅色虛線為遲滯子模型的模型輸出;圖5(b)為遲滯子模型輸出與實際系統輸出位移之間的誤差。訓練結果表明了,本文所設計的遲滯子模型能夠準確擬合遲滯非線性。

圖5 遲滯子模型訓練結果Fig.5 Training results of the hysteresis submodel
在得到遲滯子模型的具體形式之后,以遲滯子模型的輸出作為頻率子模型的輸入,對頻率子模型進行訓練,頻率子模型的隱藏層神經元數目為8個,選取的損失函數與遲滯子模型相同。對于頻率子模型,選取激勵信號頻率分別為2、5、10、15、20、30、40、50 Hz的數據作為訓練組。頻率子模型的訓練結果如圖6所示,其中,(a)圖為頻率子模型的擬合結果,藍色實線為實際電壓隨時間的變化曲線,紅色虛線為通過循環神經網絡擬合出的電壓變化曲線,(b)圖為模型輸出與實際系統輸出之間的誤差。訓練結果表明,本文設計的遲滯逆模型能夠準確擬合壓電驅動器在不同頻率下的遲滯特性。

圖6 頻率子模型訓練結果Fig.6 Training results of the frequency submodel
為了測試模型的泛化能力,本文選取了未進行訓練的數據對建模結果進行測試。所選取激勵信號的頻率分別為3、8、12、25、35和45 Hz。測試結果如圖7所示,其中,在擬合效果圖中,藍色實線是實際系統的遲滯環,紅色虛線為模型擬合出的遲滯環,在擬合誤差圖中,擬合誤差為擬合模型和實際模型之間的絕對誤差。結果表明,由于所建立的模型具有記憶存儲能力以及頻率相關性,模型能夠在一定程度上擬合未用于訓練的數據,但是存在明顯的誤差。因此,需要進一步通過單神經元自適應控制,實現驅動器對于期望軌跡的準確跟蹤。

圖7 測試數據的模型擬合結果和誤差Fig.7 Model fitting results and errors of the testing data


圖8 控制系統的跟蹤效果和跟蹤誤差Fig.8 Tracking performance and tracking error of the control system
本文設計了一種基于循環神經網絡的建模方法,建立了具有記憶特性和頻率相關性的壓電驅動器遲滯逆模型,該模型能夠準確模擬遲滯效應,并具有一定的泛化能力。在此基礎上,設計了逆模型前饋補償與單神經元自適應反饋控制相結合的控制策略,有效地消減了壓電驅動器的跟蹤誤差。實驗結果驗證了所建立模型的準確性以及所設計控制方法的跟蹤性能。未來的研究工作將關注于實現模型參數的在線辨識。