張國華


摘 要:CTC系統綜合了計算機技術、網絡通信技術和現代控制技術,采用智能化分散自律設計原則,以列車運行調整計劃為中心,兼顧了列車與調車作業,是一個符合我國國情、路情的高度自動化的調度指揮系統,為我國調度集中的發展開創了一條暫新的途徑。該系統反映了鐵路信息化建設的新內容,它不僅僅是一套新的系統,而且體現了鐵路運輸組織的新模式,是鐵路行車指揮現代化的重要標志。
關鍵詞:CTC系統;結構;故障
1 CTC系統的概述
1.1 CTC系統的簡介
CTC英文全稱為:Centralized Traffic Control,亦稱列車調度集中系統,它是調度中心(調度員)對某一調度區段的信號設備進行集中控制、對列車運行直接指揮、管理的技術裝備,它的直接效果是行車管理的自動化和遙控化,是現代通信技術與信號技術相結合的典型代表。
1.2 國內外CTC系統對比
目前,國外調度集中系統應用比較成熟的代表國家有法國、德國、日本及西班牙。上述國家所采用的調度集中系統各有優缺點,但與我國相比,國外鐵路的行車密度不高、路網結構簡單,雖設有信息化程度較高的運輸調度系統,但運輸作業較我國簡單,其調度指揮的綜合性和復雜性比我國低。我國CTC系統是在TDCS(原名DMIS)系統的基礎上發展起來的,自20世紀80年代后期以來,我國投入了大量人力物力為全路運輸調度指揮系統的立項決策提供了有力的保障,經過多次廣泛調研、方案變更、反復上線試驗,符合我國國情的CTC系統成功應用于我國各大客運干線。
大秦線作為我國第一條重載煤炭運輸鐵路,擔負著我國煤炭流通的重要使命,大秦線運輸暢通與否、運輸效率的高低將直接影響到我國經濟的發展,因此用CTC系統代替過去人工辦理進路的方式,將大大提升大秦線的運輸能力,同時大大減輕調度員的工作負擔,提高工作效率,更重要是時降低了人工排路可能導致的錯排進路的概率。
2 CTC系統的結構
2.1 體系結構
調度集中系統由鐵路總公司、鐵路局、車站三級組成。采用三層結構:第一層為鐵路總公司調度中心;第二層為鐵路局既有線/客運專線調度所CTC中心;第三層為車站子系統,構成覆蓋全路的調度指揮網絡體系。鐵路局分別設置客運專線CTC中心和既有線TDCS/CTC中心。
CTC系統網絡包括總公司TDCS/CTC中心局域網、鐵路局既有線TDCS/CTC中心局域網、鐵路局客運專線CTC中心局域網、車站局域網及廣域網。其中,廣域網由鐵路總公司TDCS/CTC中心與鐵路局既有線TDCS/CTC中心以及鐵路局客運專線CTC中心之間的廣域網、相鄰客運專線CTC中心之間的廣域網、既有線TDCS/CTC中心與車站以及客運專線CTC中心與車站之間的廣域網、車站與車站之間的廣域網構成。
大秦線CTC網絡是把太原路局調度中心與42個車站連接起來,整體網絡采用星型結構與環型結構相嵌套的模式,這樣既具有星型分層結構的優點,又有環型結構的特征,簡單來說就是把42個站分為四部分,每一部分組成環網,四個環的頭站和尾站直接連接太原中心,四個環與中心類似于星型連接,這樣增加了整個網絡的穩定性,一旦某一個站發生脫網,不會影響到其他車站與中心的連接。如圖1所示。
而且為了增加大秦線CTC系統網絡的可靠度,CTC采用雙通道運行,這樣避免了通道發生問題后導致某一車站無法與中心進行聯系,因此構成每個站網絡通道的設備都有雙套,每個站設置有兩臺路由器、兩臺交換機,每一種服務器、工作站、計算機都有兩臺,每臺安裝有兩塊網卡,提供了充分的冗余,例如路由器一和二處于熱備狀態,自律機A和B也處于熱備狀態。當某一個網絡設備出現故障的時候,備用設備自動轉變為主用;當某一個網段不通或誤碼大(可靠度小于252)的時候,可以通過另一個網段與中心保持通信,車站計算機從兩塊網卡發出兩份相同的數據,只要有一份數據傳送到中心服務器,系統就能正常運行,雙網結構這樣也為通道維護人員提供處理故障的寶貴時間,在不影響主用網段的時候進行故障網段的處理,極大提高網絡的安全性。車站設備網絡連接方式如圖2、3所示。
2.2 自律機的熱備
大秦線自律機雙機熱備基于active/standby方式的服務器熱備,在同一時間內只有一臺自律機運行另一臺處于熱備狀態,當其中運行著的一臺自律機出現故障無法啟動時,另一臺備份自律機會通過軟件診測(通過心跳診斷)將standby自律機激活,保證應用服務在短時間內完全恢復正常使用,作為大秦線CTC系統中最核心的設備,自律機的安全、穩定性能將直接關系到整個CTC系統的穩定,因此大秦線自律機采用雙機熱備(基于純軟件)的方式來提高自律機的穩定性。
純軟件方式可以在一定程度上降低成本,但它也有非常明顯的缺點:
(1)可靠性相對較差,兩服務器間的數據實時復制是一個比較脆弱的環節。
(2)一旦某臺服務器出現中斷,恢復后還要進行比較復雜的數據同步恢復,并且這個時段系統處于無保護狀態。
(3)沒有事務機制,由于其復制是在文件和磁盤層進行的,復制是否成功不會影響數據庫事務操作,因此有出現數據不完整變化的情況,這個存在著相當的風險。
基于active/standby方式的自律機熱備,會受到主/備機之間的通道質量及主/備機自律機軟件中通信模塊的影響,一旦主/備機之間的通道質量開始下降(誤碼增加),主/備機之間的心跳診斷將會受到影響,從而導致備機偵測不到主機發來的指令,備機由備用升為主用,而此時主機仍舊處于主用狀態,這時就發生了雙機搶主的問題,發生雙機搶主的現象,導致主/備機同時向車務終端發送數據,造成數據疊加,使得終端顯示與實際不符,影響到調度員的指揮判斷,嚴重時會導致非正常停車,影響大秦線的正常運行。
3 故障案例
(1)2014年11月14日23:25分,玉田北——遷西區間信號機顯示異常,電務人員立即通過調監大屏進行確認,為遵化北站管轄范圍的信號機,通過Pcanywhere軟件遠程登錄到遵化北站CTC自律A機和自律B機,發現自律A機和自律B機互相搶主,重啟自律機軟件后,23:45分時CTC恢復正常。
(2)2014年9月27日15:50分及23:26分CTC大屏顯示延慶對下莊區間信號機非正常顯示。電務人員分別通過Pcanywhere軟件登陸延慶站自律A機、自律B機,發現自律A,B機正在搶主,判斷為因自律A,B機搶主引起的區間信號機非正常顯示,重啟自律機軟件后,區間信號機恢復正常。
上述案例充分說明自律機A、B機一旦發生雙機搶主將造成CTC顯示信息異常,影響到正常行車秩序,通過系統回放及故障查找發現:a.主/備自律機之間的通道質量下降,會導致兩者之間信息傳輸出現問題,備機檢測不到從主機發送過來的心跳信息,從而導致主/備機出現搶主;b.主/備自律機運行中發生軟件報錯等軟件問題也會導致主機跑死,從而發生搶主的問題。
4 故障的預防和解決
(1)通過加強日常網絡通道巡視,每日定期對大秦線管內車站自律機通道進行測試,通過主/備機互相Ping及發送數據包測試丟包情況,發現通道質量不良的及時進行查找處理,制定措施優化通道,確保通道質量良好。
(2)通過Pcanywhere軟件遠程登陸自律機進行查看,發現存在軟件報錯或自律機CPU運行內存過高的情況及時進行處理,定期將磁盤進行整理。
(3)優化自律機軟件通信功能,多次自律機搶主故障表明,軟件本身通信質量不強也是影響因素之一,通過優化自律機軟件通信能力,減少故障的發生。
(4)采用基于存儲共享的自律機雙機熱備方式,對于這種方式,采用兩臺自律機,使用共享的存儲設備(磁盤陣列柜或存儲區域網SAN)。兩臺自律機可以采用互備、主從、并行等不同的方式。在工作過程中,兩臺自律機將以一個虛擬的IP地址對外提供服務,依工作方式的不同,將服務請求發送給其中一臺自律機承擔,同時自律機通過心跳線(往往采用建立私有網絡的方式)偵測另一臺自律機的工作狀況。當一臺自律機出現故障時,另一臺自律機根據心跳偵測的情況做出判斷,并進行切換,接管服務。這一過程是全自動的,在很短時間內即可完成,從而對設備運行不會造成影響。由于使用共享的存儲設備,因此兩臺自律機使用的實際上是一樣的數據,由雙機或集群軟件對其進行管理。
目前導致大秦線自律機雙機搶主的問題很多,但自律主/備機網絡通道質量下降以及軟件本身通信模塊通信不暢是導致問題發生的關鍵,文章主要從CTC系統發展、結構構成、大秦線CTC系統網絡架構以及雙機搶主問題預防和解決角度進行闡述。