何平
摘 要:服務器作為ATS系統的核心設備,其包含硬件和軟件兩部分。正確的維護方法及使用安全策略,可以降低故障的發生機率,確保ATS系統的正常運行,為地鐵的行車指揮提供正確、及時的依據。
關鍵詞:服務器 LINUX 安全策略 維護
中圖分類號:S757.4+2 文獻標識碼:A 文章編號:1674-098X(2015)07(a)-0055-02
1 研究背景及意義
ATS(列車自動監控系統)是ATC(列車運行自動控制系統)的一個子系統,擔負著全線列車運行的自動監控任務。它是地鐵信號系統的指揮中心,負責監視和控制線路中所有列車的運行狀態。特別是ATS系統的核心設備服務器,承載實現信號系統監督和控制的各項功能軟件的運行,因而保證ATS系統服務器的正常工作顯得至關重要。
西安地鐵一號線的服務器主要設置在控制中心、正線三個信號一級設備集中站及場/段,由HP/IBM工業級服務器、北京通號A100分機構成,均為熱備冗余設計,保障了ATS系統運行的安全性和穩定性。所有服務器均采用基于LINUX操作系統下的軟件實現統一的功能。在日常維護工作中除去定期進行用戶訪問、除塵等常規性維護外,特別應對服務器內部硬件和軟件進行重點監督檢查,掌握服務器的工作性能,排除設備日常維護的故障隱患。該文將結合西安地鐵一號線ATS子系統運營維護情況對運營期間的ATS服務器安全策略及維護進行討論。
2 安全策略管理
2.1 加強服務器設備輸入/輸出端口的安全管理
服務器設備與外界通訊的輸入/輸出端口包括光盤驅動器、USB接口、鍵盤和鼠標等。在沒有授權的情況下使用這些設備會導致CPU使用率增加,系統內存資源開銷增大,信息處理的實時性降低,從而導致系統性能下降。
ATS服務器具備設備分布分散的特點,日常運營中除控制中心外,其他地域服務器無法實現24小時監控,特別是位于車站設備房內的設備,進入人員混雜,僅靠維護人員巡視很難有效的實現對設備管理。若在沒有授權的情況下使用這些設備會導致系統資源被占用,尤其是接入的外置設備帶有病毒時,會導致病毒侵入、系統崩潰,甚至嚴重的威脅整個信號系統安全。故在設備交接期間,應對設備不常用端口(例如一般站LOW機、維護工作站等)進行貼封,達到基礎安全把控作用。但該做法僅能在事后發現進行補救,不能有效的扼制事件的發生。最佳方式應為通過對系統進行軟操作,關閉空閑端口、光驅等端口驅動,降低外部數據進入幾率,減小外部數據侵入風險。
2.2 加強設備的性能檢測及時排除隱患
ATS系統服務器需要具有很高的實時數據采集和處理能力。在正常情況下,服務器是24小時不間斷工作的,隨著運行時間的不斷增加,會影響內存的頁面調度和占用情況、網絡的工作狀態、CPU的使用率等方面的安全和穩定。通過檢測系統資源狀態可以確認系統的可用性,采取適當的維護措施(如重啟、增加、更換高性能硬件等)來保證系統的健康、安全。
有時設備存在小故障時,系統也不一定會馬上停止工作(如機箱風扇故障);另外設備的運行環境(溫度、濕度、煙塵),不間斷電源保障能力也非常重要。通過周期性的巡檢工作,可以及時地發現故障隱患。所以在加強設備性能檢測的同時應加強設備的巡檢工作。
2.3 加強操作人員的口令安全管理,專人專用
ATS系統設備的使用者比較繁雜,難免有些內部人員有意或者無意的執行非法操作和使用禁用設備,造成病毒侵入或操作系統損壞的可能;所以有必要將用戶分為不同的安全等級,例如將ATS維護人員設為root超級用戶(擁有linux系統下所有操作權限),而操作人員設為受限用戶(根據需要給予linux系統部分操作權限)。通過對操作人員權限控制,只允許對ATS系統軟件進行操作,限制對系統的非法訪問和修改,可以有效地減少系統的出錯率。同時應定期更改用戶密碼,防止因密碼泄漏,造成非相關人員登陸系統。
2.4 設備備份
設備備份需要在系統環境配置完成后進行一次備份及在每次軟件升級完成后進行一次備份,并在備份完成后進行測試。當發生較大故障需要更換硬盤或重裝軟件時,可以直接進行替換。
一號線服務器在進行備份時需借用外界存貯設備及使用外來微型操作系統,一般使用G4L軟件。所以要求在進行備份時要注意外接存儲設備及備份軟件的干凈,同時由于服務器系統數據量大,建議采用備件硬盤進行備份,在故障情況下可以直接進行更換,減小故障處理時間。
3 常規維護方法
3.1 定時重啟服務器
服務器在長時間運行過程中,會產生很多冗余的程序,占用內存和CPU資源;另外會在系統的/home/s/sys、/tmp、/var,/home/logs目錄中產生一些臨時的信息文件(見圖3)。定期執行服務器重啟可以激活清理臨時盤區的腳本,對系統的部分臨時文件進行清理,凈化硬盤空間,同時釋放更多的內存和CPU資源。
3.2 硬盤空間檢查
當硬盤根分區占用率在90%以上時,可能會造成計算機運行速度變慢,甚至不能正常啟動。因此需要在日常維護中時刻檢查硬盤空間的使用情況,可以通過df命令針對硬盤的可用空間、讀盤和存盤的速度進行檢查,在命令行窗口內輸入df-k命令,查看服務器硬盤各分區的使用情況,若某一分區使用比率較大,還可以通過du命令找出分區中哪一個目錄占用了大量硬盤空間。如錄放的次數過多或時間過長,大量的記錄文件沒有及時清除,系統故障時產生的core文件過大等造成硬盤空間被占用,可以根據情況進行相應清理或轉存。
3.3 進程監督
服務器的操作系統和應用軟件不管是在前臺還是在后臺運行,都會有相對應的進程。作為系統維護人員,要想知道各服務器頻繁運行的進程名稱。可以用ps-lT命令顯示當前終端正在運行的所有進程及其詳細狀態信息,監督進程和系統資源的利用情況(見圖5)。在運行過程中有可能進程被終止了,會在系統信息文件中會產生相應的報告(見圖6)。如果發現進程被終止,可以用命令“service進程名字start”,重新激活程序進程。
4 結語
ATS系統作為地鐵信號系統正常運行的指揮基礎,作為其核心的服務器設備需要不間斷運行,進而對發生故障時的處理時效性及日常維護保養提出了更高的要求,服務器的硬件設計雖為熱備冗余,但仍存在一定風險。所以需要在ATS系統服務器的安全策略及日常維護保養工作中采用正確的思路和方法,以便降低服務器發生故障的機率,提高運營維護效率。
參考文獻
[1] 余柏山.LINUX系統管理與網絡管理[M].清華大學出版社,2010.
[2] Wimor J.Solaris 8系統管理指南[M].宇塵翻譯組,譯.北京機械工業出版社,2002.