線海報
(瑞木鎳鈷管理(中冶)有限公司 北京市 100028)
XX 濕法冶金項目建成于2009年,設計壽命20年,遠景40年。當時采用的控制系統是國際知名DCS系統集成商的先進成熟技術。經過10年運行,服務器和操作站的使用壽命已接近極限,由于市場技術更新,服務器和操作站使用的軟硬件均已停產多年,已到無備件可用的窘境,控制系統出現嚴重故障的高風險困擾著生產。
通過研究分析,主要有以下四個問題,制約著系統安全穩定運行:
(1)老設備硬件不好買。計算機硬件技術進步速度快,市場上很難找到5年前生產的硬件。新硬件與老系統之間通常不兼容。
(2)工控系統軟件與操作系統綁定,操作系統不可升級。工控系統軟件一般是在特定的操作系統下開發的,不支持系統兼容運行。
(3)廠家技術壟斷。工控系統軟件在開發時,為了維護開發者的利益,所有軟件均需要授權或其認證過的技術人員才允許做出改變,更在法律層面上有免責聲明。
(4)資料缺失。用戶在使用這些軟件的過程中,由于技術人員的流失、更迭,導致原始資料的不完整。
為了解決這些問題,在綜合考慮經濟性、對生產過程產生的影響、技術難度以及綜合風險等因素,決定采用計算機虛擬化技術,對系統中關鍵的服務器與交換機等設備進行升級改造。本文對升級改造過程的技術論證、實施過程、實施后的效能進行論述,提供一種經濟可行的技術方案,供有同類問題困擾的工程技術人員參考。
計算機虛擬化技術是這些年計算機行業非常流行的技術。基本原理是通過軟件程序,模擬出計算機CPU、內存、硬盤、網絡資源、輸入輸出接口等硬件特性,讓操作系統誤以為自己處在一個獨立的環境當中,從而擺脫操作系統對真實硬件的依賴。它有以下特點:
(1)Fidelity(保真性):應用系統程序在虛擬機上執行,除了時間因素外(會比物理硬件上執行慢一點),將表現為與在物理硬件上相同的執行行為。[1]
(2)Performance(高性能):在虛擬環境中應用程序絕大多數指令在虛擬機管理器不受干預的情況下,直接在物理硬件上執行。[1]
(3)Safety(安全性):物理硬件由虛擬機管理器全權管理,被虛擬出來的執行環境的程序(包括操作系統)不能直接訪問物理硬件。[1]
鑒于以上技術特點,可以通過模擬硬件環境,解決硬件無法更新的問題。
XX 濕法冶金項目使用的是霍尼韋爾公司的PKS 控制系統,R310.3 版本。
PKS R310.3 大約于2008年推出,在2008-2010年的項目中大量應用。R310.3 的服務器和客戶機必須使用Win2003 和WinXP 操作系統。

圖1
系統網絡架構如圖1,紅色區域是需要改造的部分。
通過對現場控制系統的分析,需要更新的設備包括:HART 設備服務器1 臺;WEB 發布服務器1 臺,PKS 冗余服務器4 臺,操作員站34 臺,工程師站2 臺。
服務器的操作系統均為Windows sever2003,操作員站和工程師站的操作系統為Windows XP;系統中的硬件及軟件信息如表1所示。
升級對象中的硬件、軟件等均符合虛擬化升級的條件,且在其他行業中有應用成功的范例[2],在技術上可以實現。
通過對現場系統地調研,收集系統信息,明確升級目標及內容,選購硬件、軟件,并通過工廠預裝測試,最后在現場實施安裝與調試,并同時培訓運維人員。首先需要建立一份任務清單,對實施過程進行分解細化,列出行動列表,如表2 所示。
檢查機柜室內網絡布局,記錄機器型號及安裝方式。收集系統版本等信息,備份程序和流程圖等需要備份的內容。備份電腦整個C 盤和其他盤資料,根據現場調研結果,整理調研清單。
調研清單應包含:
(1)所有機器的機器名、機器上2 塊FTE 網卡的MAC 地址、2 個IP 地址;
(2)所有機器的型號,內存容量,硬盤大小;每個分區的大小,如C 盤容量,已用容量;D 盤容量,已用容量。E 盤有沒有Ghost備份等。
(3)所有機器的Hosts文件;(通常所有機器應該是同樣的文件)
(4)驗收時程序和畫面文件的備份;以及運行了多年后,當前時間點的程序和畫面文件的備份。
如表3、表4 所示。
PKS Server1A、 Server1B、Server2A、Server2B;以及eServer和FDM Server 的VM 虛擬化鏡像

表1:控制系統計算機硬件、軟件信息表

表2:行動列表
PKS Console 站;(1 臺Console 站的虛擬化鏡像即可)
PKS Flex 站;(1 臺Flex 站的虛擬化鏡像即可)
安裝服務器以及工作站,可以在廠家安裝。vSphere 系統一般都部署安裝在服務器的SD 卡介質上。
操作員站電腦并非支持XP 驅動的機器即可完美支持PKS R310.3 版本, 必須是經過PKS 兼容性測試,要求不僅可完美運行XP,而且必須與PKS R310.3 版本沒有兼容性問題,可完美運行PKS R310.3 操作員站軟件的型號才可以。需要查閱PKSR310 兼容性說明書。
導入Control Builder 程序備份,導入SCADA 備份,導入流程圖;
根據備份的系統,逐項配置Station 配置,做到完全一致;
根據現場連接情況,配置交換機;
連接各臺電腦,搭建網絡;
連接并配置各臺電腦運行正常。
整套設備連接網絡,開機運行72 小時以上,期間可進行模擬操作。工作時間每小時檢查系統運行狀態,所有設備正常后,簽FAT 測試報告。設備拆除打包,運往現場。
設備就位,連接電纜,檢查接地,檢查并上電。現場交換機更新,系統搭建測試,測試完成后,根據現場情況確定更換方式(在線/離線更換)。如果需要停機更換,須提前跟業主協調好停車時間。
(1)逐一更換服務器,注意更換授權及USB 加密鎖;
(2)逐一更換操作站電腦;
(3)系統更換完成后進行測試檢驗;
(4)系統運行穩定后,進行系統備份;
(5)連續安全穩定運行超過72 小時后簽署SAT。
系統使用培訓:

表3:硬件配置表

表4:軟件配置表
對系統維護技術人員進行系統維護的現場培訓。培訓內如包括:
(1)虛擬化的服務器遷移、備份、恢復;
(2)操作員站、工程師站的系統安裝、虛擬化遷移、備份、恢復;
(3)配置FTE 交換機與FTE 網卡;
(4)NAS 系統的操作;
(5)簡單網絡故障的排除。
在xx 濕法冶金項目中,2018年對系統實施了服務器虛擬化改造,運行2年時間,期間遭遇了服務器硬盤故障、網卡故障,但工控系統從未發生網絡中斷或服務器掉線等問題。實踐證明,PKS 工控系統服務器的虛擬化之后,系統的穩定性和容錯性得到了改善,對連續生產的企業降本增效效果顯著。解決的具體問題總結起來有以下三方面:
(1)虛擬化運行服務器,可以將硬件因素變為軟件因素,在運行過程中,消除了工業控制系統對特定硬件的依賴,降低了維修成本和運行風險。
(2)降低技術依賴,將專用技術變為通用技術。由于采用了整機備份技術,在系統內的設備出現故障時需要重置系統時,無須重新安裝操作系統、重新安裝工控軟件、安裝授權、恢復數據庫、配置專用網絡等專業操作,只需將虛擬機一鍵重置即可。在物理機上恢復系統需要3 個小時以上,對生產來說是災難性的,虛擬機的恢復只需30 秒,操作也變得極為簡單。
(3)升級后實現熱備份,抗災能力加強。NAS 系統中可以設置定期無擾備份,確保了服務器的備份是最新的組態內容,每日的運行報表通過自動打印功能,完善了設備管理的功能。