基于改進粒子群算法的列車速度跟蹤自抗擾控制器設計

2021-08-23 02:06:54陳昱圻王盼盼

鐵道學報 2021年7期

關鍵詞：優化

楊杰，陳昱圻，王盼盼

(1.江西理工大學永磁磁浮技術與軌道交通研究院，江西贛州 341000；2.江西省磁懸浮技術重點實驗室，江西贛州 341000)

隨著我國鐵路事業的快速發展，傳統輪軌交通運輸在安全、綠色、智能化控制層面具有了更高層次的要求，與此同時，相應的列車自動駕駛控制策略也需要不斷地改進與完善。其中，列車速度跟蹤控制作為列車自動運行系統(Automatic Train Operation, ATO)的核心模塊，如何最大限度保障列車運行狀態，依然具有研究意義[1]。截至2020年7月底，我國鐵路營業里程突破14萬km，其中高鐵3.6萬km[2]，這也意味著列車速度跟蹤控制研究具備龐大的市場應用需求和研究價值。

在列車速度跟蹤控制問題方面，國內外研究成果相對較多，為本文提供了良好的參考價值。針對列車控制目標速度曲線優化的瓶頸，楊杰等[3]融合了數學推理、邏輯分析和軟件仿真等優勢，提出一種全新節能運行優化算法，實現了復雜線路下列車的高效優化。同年，賈利民等[4]提出了多模態模糊PID控制算法(MMFPID)，采用牽引力前饋和局部輸出限幅方法，較好地提升了控制器的動態性能，實現了列車速度目標曲線的快速精準跟蹤。針對高速車自動駕駛系統精確進站停車問題，何之煜等[5]設計一種自適應模糊滑模控制器，可以柔化非線性切換控制信號，實現精確停車。Chang等[6]提出基于差分進化算法的模糊控制器站間運行調整算法，并通過對基本差分進化算法的改進實現對系統的準時性、舒適性和節能性的多目標優化。Dong等[7]針對不同工作條件，根據模糊規則和預測方法進行調整，以減少時間延遲并提高運輸效率。

基于經典PID的誤差反饋處理的控制思想，韓京清[8]提出了自抗擾控制算法(Active Disturbance Rejection Controller,ADRC)。其中，自抗擾算法的精髓在于對跟蹤微分器、非線性狀態誤差反饋控制律和擴張狀態觀測器的設計與優化。目前，自抗擾控制已有二十多年的發展歷程，受到了國內外學者的廣泛關注與研究。龍志強等[9]以磁浮列車為控制對象，利用自抗擾控制算法進行自動駕駛控制，研究了自抗擾控制算法對磁浮列車運行控制系統的適應性。楚東來[10]利用改進的粒子群算法(Particle Swarm Optimization, PSO)，對自抗擾控制參數進行優化設計。李誠等[11]提出一種基于動態鄰居和廣義學習策略的粒子群優化全局控制策略的算法，獲得在列車安全運行的前提下，滿足一定能耗、運行時間誤差和停站誤差要求的全局ATO控制策略。孟建軍等[12]采用列車牽引計算知識建立列車運行多目標模型，并利用遺傳算法對此模型進行優化，搭建預測模糊PID控制仿真模型，結果表明可以最大程度地提高列車停車精度。連文博等[13]采用單質點列車模型，令未知部分作為擴張狀態設計二階自抗擾控制器，驗證了自抗擾控制下高速列車速度跟蹤控制器具有抗干擾性強、追蹤精度高等優勢。針對列車時滯控制模型，Wang等[14]設計了非線性自抗擾控制器算法，并引入人工蜂群算法，有效解決了非線性自抗擾控制器算法參數難調整的問題。黃江平等[15]針對列車節能控制優化效果不明顯、收斂速度慢等問題，提出一種引入自適應慣性權重，同時加入具有調整能力的動態學習因子與改進速度更新公式的粒子群優化算法，與傳統的列車運行優化算法相比，改進后的優化算法收斂速度更快，列車節能效果更好。

針對貨運列車速度跟蹤控制問題，設計二階非線性自抗擾控制器，并選擇合適的適應度函數。針對自抗擾控制器參數多、整定難的問題，選用粒子群算法進行參數整定，采用改進慣性權重w的方法來改進粒子群算法，加快算法搜索速度。

1 貨運列車的控制模型

采用單質點列車模型，以HXD3列車為例，研究機車的牽引和制動特性。模型表示如下

(1)

式中：x為列車運行距離；v為列車運行速度；F為列車所受合力；M為列車總質量；γ為車輪的轉彎質量系數。

當列車處于不同的運行狀態時，總力F表示為

(2)

式中：FtN為牽引力；w0為基本阻力；wj為與線路有關的附加阻力；FbN為制動力。

w0(v)和wj分別為

(3)

式中：ra為基準阻力參數；rb為滾動阻力參數；rc為空氣阻力參數；g為重力加速度；wi為斜坡附加阻力，wr為彎道附加阻力；ws為隧道附加阻力。

列車的牽引和制動過程可以由具有傳遞延遲的一階慣性系統的動力學方程表示。此外將系統的傳輸時間和響應延遲視為系統的內部干擾。列車牽引制動系統的傳遞函數G(s)為[16]

(4)

式中：s為復變量；T為牽引制動系統的傳遞延遲；τ為牽引制動系統的響應時間常數。

系統狀態空間方程可以通過傳遞函數來求解

(5)

式中：f(x1，x2)為系統函數；b0為控制器參數；u為控制器輸出控制量；d(t)為列車的內部干擾和外部干擾之和。

2 自抗擾控制器

將列車的基本阻力和附加阻力視為外部干擾，牽引和制動系統的響應時間和傳遞時間視為內部干擾，因此，列車控制系統模型可以看作是一個二階系統。設計二階非線性自抗擾控制器，如圖1所示。

圖1 二階非線性自抗擾控制器

非線性自抗擾控制器由三個部分組成：跟蹤微分器(Tracking Differentiator, TD)，擴張狀態觀測器(Extended State Observer, ESO)和非線性狀態誤差反饋控制律(Nonlinear State Error Feedback, NLSEF)。自抗擾控制器的3個重要模塊可以根據不確定的非線性對象進行設計。

2.1 跟蹤微分器

以二階非線性自抗擾控制器為例，它的過渡過程是由非線性跟蹤微分器完成，其離散形式為

(6)

式中：fh為定義變量；fhan(v1(k)-v(k),v2(k),r,h0)為最速控制綜合函數；h為跟蹤微分器的積分步長；h0為濾波因子；v(k)為列車目標速度曲線數據，作為跟蹤微分器的輸入，v1(k)與v2(k)為微分控制器的輸出，并且v2(k)為v1(k)的微分；r為跟蹤速度因子，在一定條件下，r越大，v1(k)跟蹤v(k)的速度越快；。

函數fhan(x1,x2,r,h0)的計算方法為

(7)

式中：l為符號函數sign(·)的線性區間；l0，α0，α，y均為最速控制綜合函數fhan(v1(k)-v(k),v2(k),r,h0)的中間變量。

2.2 擴張狀態觀測器

ESO是將被控系統的內部和外部干擾擴張到一個新的狀態量，然后根據具體的誤差反饋機制對系統擾動進行補償。

(8)

式中：e為系統的輸出誤差；z1、z2分別為對速度、加速度的觀測估計；z3為對系統總擾動的觀測估計；y為跟蹤速度的輸出；b為控制對象參數；u為控制器輸出；β01，β02，β03為ESO針對不同系統的可調參數；φi(e)為線性函數。

(9)

其中，fal為用戶自定義函數。

β01、β02、β03表達式分別為

(10)

式中：w0為帶寬。

2.3 非線性狀態誤差反饋控制律

NLSEF根據系統狀態誤差的非線性組合確定控制量，并用z3對反饋控制量u0進行補償，得到控制量u(t)為

(11)

式中：e1為跟蹤微分器的輸出v1與擴張狀態觀測器的輸出z1之差；e2為跟蹤微分器的輸出v2與擴張狀態觀測器的輸出z2之差；kp為比例放大系數；kd為微分項系數。

(12)

3 改進粒子群ADRC參數優化設計

3.1 粒子群算法基本原理

PSO算法是計算智能領域的一種群體智能優化算法[17-18]。PSO算法具有精度高、收斂速度快、容易實現等優點。它與遺傳算法相比，規則簡單，沒有遺傳算法的“交叉”和“變異”操作，通過追隨粒子當前搜索到的群體極值尋找全局最優。

在一個多維的搜索空間中，由n個粒子組成的種群X=(X1,X2,…,Xn)，第i個粒子Xi=(Xi1,Xi2,…,XiD)T表示當前粒子所在位置，作為問題的假設解。代入適應度函數計算出每個粒子位置Xi對應的適應度值。

每迭代一次，都要更新粒子的速度和位置，更新方法為

(13)

式中：d=1,2,…,D，D為參數個數；w為權重因子；k為當前迭代次數；Vi為粒子的速度，Vi=(Vi1,Vi2,…,ViD)T；Pi為粒子個體極值，表示為種群的群體極值為Pi=(Pi1,Pi2,…,PiD)T；Pg為種群當前極值，表示為Pg=(Pg1,Pg2,…,PgD)T。c1和c2均為正常數；r1和r2為(0,1)之間的隨機數。并且將粒子的位置與速度分別限制在區間[Xmin,Xmax]、[Vmin,Vmax]之內。

選用ITAE指標作為適應度函數JITAE為

(14)

式中：e(t)為系統誤差。

3.2 算法的改進

PSO算法雖然具有收斂速度快、容易實現等優點，但是有早熟收斂、后期容易陷入局部最優的缺點。通常以增強改進慣性權重和收斂因子、與其他進化算法相結合等方法改進。在基礎PSO算法中，每一個粒子的權重因子w是常數，這就沒有充分發揮優質粒子的搜索能力。通過計算當前粒子與群體最優粒子之間的距離來調節該粒子的慣性權重w，當兩者之間的距離較大時，減小慣性權重w，反之，則增大慣性權重w。這樣增大優質粒子的權重w，減小劣質粒子的權重w的方法對基礎粒子群算法進行改進，能夠適當減小算法陷入局部最優的概率，由于本文采用ADRC控制器，該控制器能夠適應的對象參數范圍很大，魯棒性很強，而改變慣性權重w能夠保證系統穩定的前提下最大程度上加快搜索速度。通過改變收斂因子與其他進化算法相結合等方法也能加快搜索速度，但是容易使系統不穩定。因此采用改進慣性權重w的方法，計算式為

(15)

式中：f為粒子實時的適應度函數值；favg、fmin分別為當前所有粒子的適應度函數值的平均值、最小值。

改進前后粒子群算法最優適應值對比見圖2。

圖2 改進前后粒子群算法最優適應值對比

由圖2可知，與一般的粒子群算法相比，改進后的粒子群算法在15代左右就開始收斂得到最優適應值，而一般的粒子群算法在20代左右才開始收斂，這表明改進后的粒子群算法的運算效率得到提升。

3.3 改進PSO算法優化ADRC參數

采用改進粒子群算法來綜合優秀的經驗，自適應地調整ADRC控制器的參數，即b0、w0、kp、kd4個參數。在確定適應度函數后，就可以對參數進行尋優。在滿足約束條件下，使適應度函數值最小時對應的參數即為最優控制器參數。算法具體步驟為

Step1初始化粒子群，確定種群規模、適應度函數、每個粒子的位置Xi和速度Vi。

Step2對自抗擾算法進行仿真，根據適應度函數計算各個粒子的適應度值。

Step3將粒子的適應度值與個體極值比較，并對個體極值更新。

Step4將粒子的適應度值與全局極值比較，并對全局極值更新。

Step5按照公式(13)更新每個粒子的位置與速度。

Step6按照公式(14)更新慣性系數。

Step7滿足結束條件時，停止迭代并輸出最優解，否則，返回Step2。

改進PSO算法優化ADRC控制器的過程示意見圖3。

圖3 改進PSO算法優化ADRC控制器過程示意

4 仿真分析

結合某型貨運列車的實際數據及基礎理論模型，設計基于自抗擾控制算法的貨運列車速度跟蹤控制系統，并以貨運列車的實際運行數據計算出列車運行的目標速度曲線，對列車的運行軌跡進行模擬驗證。在同等條件下，對比分析經典PID控制算法和基于人工蜂群算法-自抗擾智能控制策略的列車速度跟蹤性能。

某型貨運列車的具體參數見表1。

表1 某型貨運列車參數

設計的Simulink模型包括：ADRC模型、牽引系統模型、阻力模型和列車速度響應模型。基于Matlab2020a的m文件和Simulink模型混合編程的列車控制仿真系統環境，總體結構見圖4。

圖4 列車控制仿真系統結構

采用文獻[19]中所述的列車目標速度曲線作為第4節控制器的輸入信號，見圖5。

圖5 列車目標速度曲線

4.1 仿真結果

圖6 改進PSO算法的ADRC控制器目標速度跟蹤曲線

由圖6可知，基于改進PSO算法的ADRC控制器的速度跟蹤控制在啟動、加速、勻速、制動模態中能夠較好地對目標速度進行跟蹤，即使線路空間包含陡坡，限速情況比較復雜，跟蹤曲線也能幾乎與目標速度吻合，沒有出現超調現象。

通過改進PSO算法優化ADRC控制器得到的參數變化曲線見圖7。

圖7 參數優化曲線

由圖7可知，參數b即優化參數b0在第3、8次迭代中發生改變，參數w即優化參數w0、kp、kd出現多次變化，反復迭代50次，最終得到最佳結果：b0=1，w0=6.142 1，kp=1.173 5，kd=1.837 2。由圖2可知，在算法優化過程中，群體最優適應值不斷減小，PSO算法不斷尋找更優的參數，最終得到最優的4個參數值。

4.2 比較分析

將基于改進PSO算法與人工蜂群算法、經典PID控制算法進行比較，見圖8。

圖8 三種算法的目標速度跟蹤曲線比較

由圖8可知，在200～250 s加速階段，基于改進PSO算法速度跟蹤曲線無超調且無振蕩，克服了PID算法出現的小幅震蕩的缺點，能夠達到節能的要求；在500～600、1 200～1 500 s的勻速段，基于改進PSO算法的速度跟蹤曲線幾乎與目標曲線重合，實現了對目標速度的精確跟蹤，克服了PID的大超調與蜂群算法的小波動、微超調的缺點，這就極大地降低了實際的控制難度，避免了實際中的執行機構的振蕩的缺點，同時達到節能的目的。

三種算法跟蹤誤差見圖9,由圖9可知，基于ADRC的速度跟蹤比PID具有精確的效果，雖然與目標速度曲線略有偏差，但可以快速修正，這表明ADRC控制器的控制精度較高和抗干擾能力較強。

圖9 三種算法跟蹤誤差

5 結論

本文針對貨運列車速度跟蹤控制，設計了一種基于改進粒子群算法的自抗擾控制器。設計二階非線性自抗擾控制器，提高了系統的抗干擾性，同時利用改進粒子群算法優化自抗擾控制器參數，采用自適應權重法改進慣性權重，避免算法陷入局部最優，提高了系統的收斂速度。在相同仿真條件下，與經典PID控制算法和基于人工蜂群算法進行對比分析，仿真結果表明，該算法具有抗干擾性能較強，速度跟蹤精度較高，響應速度較快的優點，適用于列車速度跟蹤控制。