何 東
(無錫地鐵運營有限公司,江蘇 無錫 214174)
列車網絡控制系統是列車的中樞,對列車運行、車輛監控、車輛安全、車輛設備運行以及各設備功能的實現具有重要意義[1]。無錫地鐵2號線網絡系統采用分布式總線網絡控制技術,分為列車控制級和車輛控制級。列車控制級總線和車輛控制級總線均采用冗余的電氣中距離(Electrical Middle Distance,EMD)介質多功能車輛總線(Multifunction Vehicle Bus,MVB),并采用雙線冗余機制,以避免車輛通信出現故障。但車輛現場實際運營仍舊高頻發生網絡癱瘓故障,因此本文針對此問題進行故障分析并提出解決方案。
列車網絡控制系統(Vehicle Control Moudle entity,VCMe)采用分布式MVB網絡通信和控制系統,主要具有軌道車輛通信傳輸、系統控制、故障定位、狀態信息顯示、應急故障提示以及事件記錄等功能[2]。VCMe由不同功能的分布式模塊組成,具有以下特點。一是采用模塊化設計,擁有Harting緊密式插頭,易于拆裝,分布安裝于列車不同位置,方便用戶維護檢修;二是數據傳輸通信采用雙線冗余機制,提高傳輸穩定性;三是人機界面采用可觸式方式,根據用戶需求顯示車輛信息,以滿足車輛駕駛人員對車輛的狀態把控;四是機械連接采用改進后的特殊設計,接觸良好,且具有高抗電磁性[3]。
VCMe系統由數字量輸入輸出模塊、模擬量輸入輸出模塊、事件記錄模塊、人機界面、中繼放大模塊以及列車級控制模塊等組成[4]。其拓撲結構如圖1所示。

圖1 車輛網絡控制系統拓撲結構
圖1中,ATC為列車自動控制,AXMe為模擬量輸入/輸出模塊,BCU為制動控制單元,DCU為牽引控制單元,DI為數字量輸入模塊,DTECS為分布式電子列車控制系統,DO為數字量輸入/輸出模塊,EDCU為車門控制單元,EMD為電氣中距離,EDRM為事件記錄儀,HVAC為供暖、通風和空調設備,HMI為人機接口單元,PIDS為旅客信息系統,PTU為便攜式維護工具,REP為中繼模塊,SIV為輔助控制單元,TCMS為列車控制及診斷系統[5]。
VCMe技術采取分布式結構,劃分為列車控制級與車輛控制級兩級。車輛及列車控制級總線均采用MVB車輛總線,總體應用成熟。考慮到信號長距離傳輸衰減問題,每節車廂設置中繼模塊(Repeater,REP),作為車輛級總線和列車級總線的連接部分,一方面具有本車數據采集及預處理功能,另一方面可實現將數據通過列車總線轉發到VCMe的轉發功能。車輛級總線上接掛不同系統數據通信傳輸單元,且采取并列式分布方案,單個數據通信傳輸單元故障不會引發網絡癱瘓。
無錫地鐵2號線項目采取雙線路冗余方案,車輛控制單元VCMe可通過A線和B線兩條通信線與車輛設備進行信息交互。由于A、B兩路總線同步發送相同的數據,因此REP從A線和B線上接收到的數據也相同。此時REP對于兩線上的數據采取先到先得策略,對先接收到的數據進行幀頭數據校驗,校驗通過則進行轉發并忽略來自另外線路相同的數據,校驗失敗則轉發另外正常線路的數據[6]。
車輛運行時,VCMe作為車輛的控制單元和監控單元需要和車輛的各個設備進行通信,接收車輛的相關設備運行信息以控制車輛運行。VCMe將以輪詢的方式發送主幀報文給車輛的設備詢問是否有數據更新,如果設備有數據更新則反饋從幀報文給VCMe單元,VCMe單元接收到信息后繼續反饋給對應設備,表示可以發送數據,則設備將以廣播的形式向通信總線上發送其相關信息。如果設備無數據更新則VCMe單元將詢問總線上的下一個設備是否有數據需要更新[7]。
目前,當無錫地鐵2號線項目中A、B兩條通信總線中某根線或下掛設備發生斷線故障時,人機接口單元(Human Machine Interface,HMI)屏幕反饋網絡總線整體通信失效,網絡系統癱瘓,設備無狀態信息反饋,車輛無法運行,需要進行緊急牽引,使車輛回到車庫進行檢修。線路數據原理如圖2所示。
基于線路數據傳輸原理,假設目前6車的VCMe做為車輛的MVB網絡總線主控制器,1車的數字量輸入輸出模塊(Digital Output,DO)和數字量輸入模塊(Digital Input,DI)之間的通信A總線斷開,車輛VCMe發送的主幀方向和設備反饋的從幀方向如圖2所示,A線由于存在斷線,其尾端牽引控制單元(Traction Control Unit,TCU)上終端電阻失效,因此出現阻抗不匹配、設備發出的幀數據異常以及部分數據失效等情況,但由于設備通過A線反饋的從幀報文早于B線,REP仍舊信任A線上傳輸的幀數據,將B線上傳輸的幀數據舍棄[8]。數據經過REP傳輸到達6車主VCMe、旅客信息系統(Passenger Information System,PIS)等設備,由于幀數據存在異常,接收數據的設備會將該幀數據丟棄[9];在VCMe丟失若干數據包后,程序判定設備生命信號不更新,從而判定整車網絡系統癱瘓,整車控制失效,車輛無法正常運營,影響車輛行車安全。

圖2 線路數據原理
針對上述情況,本文提出在REP程序增加幀數計數算法,讓REP通過統計總幀數來優化總線選擇機制。當總線上的設備與車輛VCMe通過REP進行通信時,REP對接收到的錯誤數據幀進行計數;當出現上文描述的通信總線A或B斷開的故障時,REP通過A總線接收到的錯誤數據幀數量與B總線不同,此時REP選擇錯誤數量幀少的通道,舍棄故障通道,以此實現車輛網絡通信總線冗余,避免冗余故障的目的[10]。目前,該方案已在現場進行試驗,模擬總線斷開,顯示器沒有上報通信故障。
雖然該方案規避了斷線誤報通信故障的現象,但是仍存在以下弊端。一是若存在車輛運行過程中出現電磁干擾源,兩路波形都干擾時,經校驗REP判定兩組數據校驗都不通過,則無法正常轉發,導致車輛通信失效;二是修改REP的通道選擇機制后,如果一條通信總線斷開,另一條通信總線受到干擾,那么有可能會導致錯幀數增加,這樣就會和實際的錯幀情況揉合在一起,也不利于后續的故障定位排查,更無法判斷是哪一列車的斷線所導致錯幀。
幀數計算算法邏輯示意如圖3所示,設t3時刻B總線發生斷線故障,則此條件下ERP對總線信息的判斷邏輯為:(1)0~t1,A線和B線沒有錯幀,REP隨機轉發其中一路數據;(2)t1~t2,A線存在錯幀且繼續增加,t2時刻,REP統計到A線上的錯幀數穩定在一定數值C,從t1時刻開始,REP轉發B線數據;t3~t4時刻開始,由于B線路存在錯幀,且持續上升,但是由于A線的錯幀總數高于B總線,即使A線正常,REP仍然轉發異常線路B線的數據,導致t3~t4時刻的數據為錯誤數據,校驗失敗后需要系統重新發送,因此當系統出現實時需求高的數據時,可能發生系統響應慢的問題。可以看出,幀數計算算法方案仍有一定的局限性,需要進一步優化。

圖3 幀數計算算法邏輯
本文分析了無錫地鐵2號線項目偶發的網絡系統總線冗余失效與網絡癱瘓故障,闡述了該項目網絡系統的方案,說明了網絡系統的通信傳輸原理,分析了故障現象發生的原因,得出故障現象為REP總線選擇機制影響的結論,并提出了增加統計錯誤數據幀的數量進行REP總線選擇機制的解決方案,該方案經驗證能夠規避列車網絡通信故障,降低運行風險。雖然優化的方案能夠在一定程度上解決上報的網絡通信故障,但該選擇數據轉發的機制可能導致實際故障被屏蔽,難以判斷是否有斷線故障,仍有缺陷,日后需要進一步優化。