高景斌,彭子橋,王 剛,黨永強,康炤旭
(北京廣利核系統工程有限公司,北京 100094)
核電數字化儀控系統(Digtal Instrument﹠Contral System,簡稱DCS)是整個核電廠的“中樞神經”系統,對保證核電站的安全、可靠、穩定運行發揮著重要作用。運維作為核電站生命周期的關鍵階段,是保證核電站安全、高效、可靠運行的重要手段。
隨著新建核電站不斷投運,已有的核電站不斷升級,核電站目前已經普遍使用數字化儀控系統實現核電站的運行、控制和保護。數字化儀控系統產品因大規模集成電路等的應用、智能化程度不斷提高,核電DCS運維的復雜性和多樣性日趨提高。傳統的人員糾正性維修、預防性維修、備件預留庫存等方式已經無法滿足核電DCS的維護要求,亟待進一步提高運維技術及運維管理水平。
同時,核電站數字化儀控系統產品設備維護需要維護人員介入,在現場維修窗口申請、平臺深層次問題分析方面需要投入大量工作,綜合成本較高。DCS產品自身故障嚴重依賴控制系統產品提供商的分析,采用的方式維護人員現場拷貝故障數據,發送給DCS廠家進行分析,不能對DCS系統狀態進行實時在線評估,問題處理時效性差。而DCS產品本身的設備運行狀態數據資產也沒有得到有效開發利用。

圖1 總體功能架構圖Fig.1 Overall feature architecture diagram
隨著大數據、互聯網等技術發展,平行理論、數字雙胞胎理論的應用,可通過信息化、網絡化、智能化等先進技術實現與運維服務的結合,建立DCS遠程智能運維系統平臺,獲取核電站DCS自診斷、環境等數據后,通過安全網絡傳輸至DCS遠程智能運維平臺,可以實現故障遠程診斷、風險分析及工作指令建議,降低現場維護人力及物力成本。運用設備本身及DCS診斷數據,以及可靠性分析、系統安全評價等多種手段,診斷DCS系統及設備的健康狀況,實現預測性維修、物項替代,從而提高系統安全性及經濟性,也為DCS設備供應商后續產品改進提供更多分析數據;另一方面,通過DCS遠程智能運維系統可實現DCS備件的集約化共享管理,減少各核電站的DCS備件庫存,最終實現各核電站DCS備件的零庫存,為核電站降本增效。同時,因為DCS備件的集約化管理,實現了備件產品的動態調配、快速配送、備件保鮮等功能,提升備件質量及安全性,通過核電DCS遠程智能運維的預測性維修,降低核電機組非計劃停機風險及預防性維修數量,對核電站安全性及經濟性提高有重要意義。
DCS遠程智能運維系統按照系統功能劃分分為3個區域:遠程智能運維系統中心、核電站遠程運維端、DCS設備數據采集端,分別處理不同區域的業務功能需求。

圖2 系統功能架構圖Fig.2 System function architecture diagram
同時考慮數據安全,嚴格劃分DCS設備數據采集端的生產區、核電遠程運維端的管理區和遠程智能運維系統中心的區域。各區之間的數據傳遞采用安全通訊模型提供過程保護,確保信息單向傳遞,實現安全可控。
DCS設備數據采集端:主要完成各DCS相關的故障日志等數據收集工作。收集數據主要包括:各種設備基本信息、故障日志的記錄信息、設備運行日志記錄等數據。
核電站遠程運維端:主要完成前端數據的匯總采集、審查、校對、存儲以及向遠程運維系統中心的數據傳輸。
遠程智能運維系統中心:主要完成DCS設備的實時巡檢,依托專家系統,實現DCS設備的預防性維修建議,系統健康診斷、狀態預測及維修方案建議、共享備件的統計、調度等功能。
遠程智能運維系統對現場的DCS設備可進行自動的無人巡檢,實施監控。利用傳輸到系統的各核電現場DCS設備數據、環境數據、設備的過程數據等,依托可靠性實驗室的研究成果,對現場的設備數據進行時間和空間上的分析,同時結合專家系統模型,深度學習等方式,對DCS設備進行設備的健康狀態分級,對故障信息及維修策略建議進行實施推送,對設備進行預測性維修預測。
遠程智能運維系統根據設備故障狀態,在備件集約化共享中心進行動態管理,在庫檢測、物流綜合調配,并根據備件的消耗信息及未來使用狀態,預測情況提前向設備生產線提供預測生產計劃,實現從需求到調配、再到生產等各環節的良好循環。很好地解決核電現場備件采購周期長,供應不及時等難題。
遠程智能運維系統主要包含實時監控、生命周期管理、DCS集約化備件、專家系統、系統管理、移動應用等模塊。系統功能架構圖如圖2所示。
核電數據具有的高安全等級特性,防止系統被惡意破壞和數據本身安全保護是安全設計的重要出發點。在遠程智能運維系統整體上部署傳統上的安全策略:
◇ 現場設備系統之間部署網關。
◇ 現場設備系統與遠程智能運維系統的數據傳輸為單向發送,并部署單向隔離裝置。
◇ 現場運維端與遠程智能運維系統網絡邊界部署網絡防火墻。
◇ 遠程運維系統軟件平臺部署殺毒軟件。
除實施上述傳統意義的安全策略外,還在遠程智能運維系統軟件平臺上部署專有的安全策略:
◇ 在遠程智能運維系統中部署入侵檢測平臺。
◇ 在智能運維系統中部署統一安全管理平臺。
該平臺對工業網絡中的安全產品及安全事件進行統一管理的軟硬件一體化產品。通過對控制網絡中的邊界隔離、網絡監測、主機防護等安全產品進行集中管理,實現對全網中各安全設備、系統及主機的統一配置、全面監控、實時告警、流量分析等,降低運維成本、提高事件響應效率。
◇ 在遠程智能運維系統中部署工控安全監測與審計平臺。
該平臺是專門針對工業控制網絡的信息安全審計平臺。采用旁路部署或直通模式,對工業生產過程“零風險”,基于對工業控制協議(如Modbus TCP、OPC、Siemens S7、DNP3和IEC104等)的通信報文進行深度解析(DPI,Deep Packet Inspection),能夠實時檢測針對工業協議的網絡攻擊、用戶誤操作、用戶違規操作、非法設備接入以及蠕蟲、病毒等惡意軟件的傳播并實時報警,同時詳實記錄一切網絡通信行為,包括指令級的工業控制協議通信記錄,為工業控制系統的安全事故調查提供堅實的基礎。
◇ 在遠程智能運維系統中部署安全運維管理系統。
該系統集用戶(Account)管理、授權(Authorization)管理、認證(Authentication)管理和綜合審計(Audit)于一體。該系統能夠為智能運維系統提供集中的管理,減少系統維護工作量;能夠幫助制定嚴格的資源訪問策略,并且采用強身份認證手段,全面保障系統資源的安全;能夠詳細記錄用戶對資源的訪問及操作,滿足對用戶行為審計的需求。
遠程智能運維系統在系統設計、搭建的過程中,綜合考慮該系統是現場系統設備的延伸,因而制定了以下的系統設計原則:
◇ 安全第一原則
遠程智能運維系統采集的數據是現場設備數據,為安全性要求極高的底層現場設備數據。所以,在設計中首先貫徹安全第一的原則。遠程智能運維系統對底層現場設備數據的讀取不應影響底層控制系統本身,絕對禁止本系統對底層監控網絡、組態有影響。數據從底層設備向遠程智能運維系統單向傳輸;本系統與各控制系統的每一個接口均通過接口軟件限定和物理隔離等功能保證數據流的單向隔離。
◇ 整體規劃原則
作為公司業務的需求起源,遠程智能運維系統的建設應與公司現有的業務平臺統一規劃,統一數據平臺、統一軟件構架、統一編碼規則。特別是對設備數據的定義、數據處理流程都進行統一規劃,避免交叉重復,減少資源浪費。
◇ 先進性和成熟性
遠程智能運維系統平臺的建設充分考慮采用符合標準的、先進且成熟的軟件系統、數據庫系統、存儲系統、網絡系統、云平臺等先進技術和產品。既要考慮技術的先進性,同時考慮產品需要經過成熟應用。
◇ 互聯性和開放性
遠程智能運維系統平臺涉及的軟件及應用環境,要充分考慮到未來運維領域相關業務的發展需要,系統中心采用開放式系統互聯模型,便于各核電現場基地的數據接入和使用。
◇ 可靠性和可管理性
在系統設計中,選用穩定可靠的產品和技術,且應有必要的容錯能力,為用戶提供高可用服務。完善的系統管理措施和功能,便于配置和維護,提高資源利用率,減輕系統人員的工作負擔。
遠程智能運維系統的關鍵技術主要有故障診斷和預測性維修。
通常的故障診斷分為兩個過程,故障檢測是利用各種檢查和測試方法,發現系統和設備是否存在故障的過程;故障定位是在故障檢測后進一步確定故障所在大致部位的過程。在要求把故障定位到實施修理時可更換的產品層次(可更換單位)進行故障隔離。在核電數字化儀控系統的產品中,按照傳統的故障診斷方法,現場的檢查和測試方式方法有限,很難發現設備的故障,而各種定期試驗也會造成設備的過度和損耗。而基于遠程智能運維系統的需求觸發,在核電數字化儀控產品設計上就開始考慮設計故障診斷,相當于在設備上設置了進行診斷的傳感器,將設備的狀態傳輸至遠程智能運維系統,再利用遠程運維系統的故障診斷技術,進行詳細的設備診斷。
遠程智能運維系統的故障診斷技術主要有兩種:基于物理模型的故障診斷技術及基于數據的故障診斷技術。
1)基于物理模型的故障診斷技術
建立在已有檢測設備所能提供的狀態信息和準確的機理模型基礎上,采集現場的運行參數,與已有數學模型進行偏差對比,根據偏差的大小及變化趨勢分析,判斷設備或系統性能衰退和故障情況。
2)基于數據的故障診斷技術
采用系統辨識技術在數據基礎上對辨識對象進行數據建模,基于辨識模型計算結果,與現場運行工況進行偏差對比,根據對比結果判斷設備或系統是否發生故障。
遠程智能運維系統的預測性維修,主要是進行DCS設備狀態的預測,主要包括:
1)系統設備正常運行期間的健康狀態診斷,性能狀況趨勢分析,實現故障預測,給出維修建議。
2)當設備或系統性能衰減時, 對設備或系統實時模型進行自適應修正,并給出預警信息。
根據狀態監測及故障診斷獲取到的設備狀態信息,通過對狀態信息的的處理及分析,結合設備的歷史狀況應用大數據分析技術,故障模型技術進行設備或系統未來運行狀況進行評估,提前預判可能會出現的故障模式。
系統或設備預測性維修、維護方案不是一蹴而就的。
核電數字化儀控遠程智能運維系統的建設和應用,屬于本領域的前沿技術和研究,基于現階段各核電現場技術的應用和運維領域的現狀,實施起來還存在一定的困難。在遠程智能運維系統平臺上開展基于平行理論的預測性維修等關鍵技術的解決方案,還需要進行探索;另一方面,運維領域的人員、意識、對新技術的接納、新方向的包容,都提出了更高的要求。希望讀到本文的學者能與作者進行廣泛地交流和探討。