陳軍輝 沈曉健 邱曉宇
(中國杭州310013浙江省地震局)
地震臺站智能運維保障系統開發
陳軍輝 沈曉健 邱曉宇
(中國杭州310013浙江省地震局)
針對浙江省地震監測臺站不斷增加,地震臺站設備運維流程無序化、紙質化的管理現狀,設計臺站智能運維保障系統,實現臺站運維智能化監控管理。與傳統臺站運維相比,該系統不僅實現臺站運維資料的數字化管理,還通過引入搶修工單形式,保障臺站搶修順利進行。
智能;運維;監控;數字化;工單
隨著地震臺站,特別是無人值守臺站不斷增加,臺站日常運維管理業務越來越重,臺站運維管理模式落后,未形成流程化、數字化管理,且運維人員有限,故障查詢、通知、搶修及運維資料記錄等均需人工處理,臺站運維管理工作任務艱巨,難以保證運維工作的高效、可靠,迫切需要新技術、新思路,對地震臺網及子臺進行科學地運維管理。
在地震臺站智能查障設備等基礎上,圍繞運維資料完整、 故障第一時間搶修與規范搶修的理念,開展數字化運維系統建設,為臺站運維管理制定規范流程,開發地震臺站智能運維保障系統,使臺站運維資料管理、運維搶修環節等工作納入數字化、網絡化管理方式,提高地震臺網及臺站技術系統運維管理的規范性,為地震數據產出的連續可靠奠定基礎。
地震臺站智能運維保障系統是一種集設備管理、數據采集、通信傳輸、數據管理與應用于一體的集成應用系統,通過傳感器技術、可視化技術、網絡技術等,進行地震臺站故障點定位和搶修態勢的綜合分析。利用部署在地震臺站的智能查障設備、視頻監控設備、門禁系統、通訊網絡設備,系統實現臺站的遠程監控,當臺站設備運行發生物理故障時,能夠快速、準確判斷故障位置,合理、有效地調配運維資源,從而更快地處理故障設備,保障地震臺網的高運行率和數據的準確率。
由于地震臺站運維管理業務的特殊性,對該系統提出以下要求:①智能查障、視頻監控、門禁等臺站設備,可對系統進行實時信息數據傳輸;②集臺站實時信息監控、臺站設備信息管理、故障工單派發、現場搶修等功能于一體;③以派單形式對臺站搶修進行過程管理,以智能手機APP終端進行搶修信息實時上傳,實現搶修全過程跟蹤,依次
規范臺站故障搶修流程,保障搶修過程完整;④對歷史運維資料進行按臺站、按故障、按時間段等進行歸檔、查詢、打印;⑤以數字化方式實現快速高效的多科室協同處理臺站故障的工作機制,促進科室間協同工作溝通。
運維保障系統通過部署在臺站的智能查障、可控PDU、視頻終端及門禁系統,實現臺站狀態的遠程監控,根據檢測信息進行綜合研判,得出臺站故障結論,繼而進行以人工派單、自動派單相結合的方式進行APP端工單發送及故障告警短信發送。系統構成見圖1。

圖1 系統構成Fig.1 The system structure
智能查障設備主要采集實時監控和讀取的臺站環境動力參數及設備網絡連通參數等信息。環境動力參數主要為臺站溫濕度、UPS電源參數等(包括市電電壓、充放電電流等)(竇雪英等,2015)。通過TCP/IP協議查詢臺站設備的網絡聯通情況,包括臺站路由、交換機、數采、地震計等網絡連通信息,并可通過查障設備的開關模塊遠程控制PDU的通斷,遠程重新啟動前臺機,以便數據正常轉發(訾少剛等,2006)。系統對智能查障設備信息的傳輸方式實現雙網絡備份傳輸,除原固有傳輸網絡外,接入備用無線網絡設備(GPRS)。
視頻設備實時監控臺站外景和室內設備,直觀判斷并處理臺站設備及遠程故障。通過臺站硬盤錄像機的存儲功能,記錄臺站及周邊視頻信息,例如:2015年麗水某臺站記錄到地震臺站設備被非法惡意破壞現象。
地震臺站智能運維保障系統主要分為4層:硬件層、數據層、應用層和表現層,見圖2。
(1)硬件層:主要包括平臺服務端所在的服務器、遠程監控臺站門禁狀態的門禁網關、控制視頻監控設備的接入網關等,是平臺運行的基礎設施。其中,系統所在的服務
器采用icooper 3000控制平臺,實現與各臺站視頻、門禁、查障設備的集中管理、控制。
(2)數據層:主要由地圖數據、臺站設備監測數據、臺站設備告警數據、臺站信息數據、用戶信息數據、值班業務數據、值班日志數據、業務統計數據等。其中,臺站信息數據和設備告警數據是整個系統的重要業務數據,為GIS應用、值班派單業務、臺站運維搶修管理等提供數據支撐。
(3)應用層:結合地震局實際工作,Web服務端實現業務邏輯;流媒體服務器處理視頻監控業務需求;門禁控制器對可監測目標臺站進行設備管理和遠程控制;短信服務器作為浙江省地震局短信網關代理,為平臺短信分發提供統一接口,解決自動發送告警短信和工作提醒問題。
(4)表現層:也就是終端層。基于REST的服務端設計,使得平臺能夠同時支持用戶使用多種終端接入系統,包括桌面程序、Windows 8平板電腦。

圖2 運維系統分層Fig.2 Layered-graph of the maintenance system
地震臺站智能運維保障系統軟件設置:用戶管理、值班工作管理、設備管理、臺站狀態監控、短信報警、故障派單處理6個模塊。
3.1 用戶管理模塊
戶管理模塊用于工作人員權限和職責定位。各級用戶包括:管理員、臺網值班人員、儀器值班人員、各地方地震局業務負責人員、臺站看管人員等。管理員具備最高權限,具體為使用系統PC端桌面程序,可以進行臺站運維資料的錄入、調整,調取查看視頻監控,遠程控制門禁設備、PDU設備、管理搶修業務等功能,實現系統業務的綜合監控管理;臺網值班人員主要具備調取查看本臺網內臺站的所有監控設備的功能,如果發現系統告警,或者人為發現波形故障等,派發故障工單給儀器值班人員并完成對儀器人員故障處理后的工單審核;儀器值班人員負責接單后的具體故障處理,同時具備調取查看各類臺網所屬臺站監控設備及完成臺站設備重啟等必要遠程控制處理;儀器值班人員與儀器搶修人員為一人雙崗,非值班工作日則根據搶修任務的實際需要,針對無人值守臺站進行的現場故障搶修處理,運維工單中的一切流程都需要在搶修過程中使用移動客戶端APP得以完成,臺網值班人員可以通過系統桌面程序查看故障處理進程。
3.2 值班工作管理模塊
值班工作管理模塊用于安排、管理值班事宜,包括錄入值班表、換班、替班和查看值班記錄等。在以月為單位的日歷上,列出已有排班數據,包括歷史數據和未來排班計劃。因數據保護目的,歷史數據不可更改,未來排班計劃可按照排班人員數及次序進行任意
更改。系統自動或人為把每日重要事情記錄下來,形成可供查詢的值班日志,內容包括:告警發生、告警解除、故障處理等事件。
3.3 設備管理模塊
設備管理模塊是建立臺站電子檔案的核心。在設備管理模塊中,管理員可以簡易地管理臺站基礎信息及各種設備(主要包括地震專業、網絡、視頻監控、門禁等通用設備)屬性信息。臺站基礎信息構成為:臺站建設情況、位置、巖層、網絡方式、租用時間及看管人員情況等。設備屬性信息構成為:設備型號、編號、IP地址、UPS設備的使用情況、攝像頭通道位置、門禁控制板的序列號、門的編號。設備屬性信息隨搶修人員接單后進行手機端APP臺站現場處理時設備信息輸入而更新,保證信息實效性及準確性。
3.4 臺站狀態監控模塊
臺站狀態監控模塊實現以下功能:①視頻實時監控和歷史回收,云臺遠程控制;②門禁狀態監控,遠程開門控制;③查障設備采集的實時數據監測;④PDU設備監測和遠程控制;⑤網絡設備狀態監測等。
通過現場采集終端及門禁系統,采用軟硬件結合方法,將臺站部署的智能查障設備、視頻監控、門禁系統等無縫集成,以GIS、三維實景等方式直觀展示臺站運行狀態,為運維人員提供決策依據。其中,三維實景建模,在平臺上直觀展示臺站內外結構,包括臺站建筑外觀、內部布局和設備外觀。在三維場景中,用戶可以進入臺站內部,查看設備詳細外觀,目前只有仙居、松陽、臨安地震臺站開發了3D建模。
本系統表現層端的桌面程序直觀顯示電源UPS參數及網絡設備狀態及地圖、其他相關參數。
3.5 短信報警模塊
短信服務器采用浙江省地震局項目 “浙江省防震減災公共服務信息系統”的短信報警服務器,并通過數據庫服務器的應用編程接口API,實現與系統數據庫服務器的互聯,經數據庫緩沖池實現指令收發,支持多線程、多連接并發(陳吉鋒等,2015)。一旦運維保障系統判斷需要報警,即觸發短信報警,短信報警流程見圖3。告警短信主要包括:告警通知短信、告警解除通知短信、工單催促短信、預警提示短信等。

圖3 短信報警流程Fig.3 The SMS alarm process
3.6 故障派單處理模塊
故障派單處理模塊是運維保障系統關鍵模塊,是整個系統的業務核心。采用工單信息系統,在安全、科學調度和監控等方面成效顯著,并實現精細化、程序化管理模式,降低搶修成本。智能運維保障系統中故障搶修主要由故障工單而展開,并涉及多個部門協同工作。首先,工單主要由臺網值班人員或系統自動在PC系統桌面端發起,值班人
員通過手機端應用程序接收、處理、上傳任務資料,儀器室主任負責統籌調度。同時,臺網值班人員在值班中心可以實時查看工單任務進展情況,并審核搶修結果。系統自動對各搶修環節設置時間點,統計各類角色各工作環節的完成時間,包括故障初步處理、現場搶修及故障審核時間等。故障工單處理流程見圖4。

圖4 工單流程Fig.4 Flow chart of the work orders
臺站運維搶修系統的移動客戶端APP,具備Android和iOS版本。根據使用角色的不同,APP設計相應使用界面。根據任務狀態,APP主界面由5個功能模塊構成:未接任務、已接任務、轉單、申請掛起和已完成任務,其中“已接任務”是主要功能模塊,具體任務在此模塊開展完成,內容包括現場搶修人員的任務執行操作,如:處理任務、出發、到達、維修、資料上傳等,在APP端或PC端的桌面程序中均實時可見工作流的歷史狀態和最新狀態。
目前,本智能運維保障系統已經在浙江省地震臺站運維中得以應用,實際運行表明,
系統運行正常,數據可靠,達到設計目的。不僅實現臺站基礎資料、運維記錄資料等的準確與可查可統計,同時通過告警—派單—搶修方式實現運維搶修環節的流程化、數字化,保障搶修任務完成。實際應用中,工單步驟以時間軸的方式展開,只需遠程故障處理的工單流程多為3步,需要現場維護搶修的工單流程多為9—10步。
地震臺站運維過程中搶修往往是應急性維修,時間要求緊迫,由于地震臺站的特殊性,執行效率較低,資源耗費大,急需“預防性維修”功能。雖然本系統實現了線路租用到期報警,UPS電池使用時間到期報警等簡單預防性故障報警,但針對臺站歷史故障運維搶修情況,如何進行運維搶修數據的深度挖掘,做到對不同臺站設備運行狀態的精細化管理,進行臺站設備的統計性分析、模糊化故障判斷,特別是鑒于臺站的運維搶修業務外包的可能性等,還需要在專家智能故障判斷、決策支持等方面進行系統功能拓展。
陳吉鋒,陳軍輝,張帆,等.物聯網技術在浙江省地震臺站設備管理中的應用[J].地震地磁觀測與研究,2015,36(2):108-113.
竇雪英,張剛,金艷,等.信息中心機房建設探討[J].當代化工,2015,44(5):1 009-1 011.
訾少剛,劉春云,常明,等.銀川地震臺數字地震儀系統及維護[J].內陸地震,2006,20(4):378-383.
The intelligent operation and maintenance system for seismic stations
Chen Junhui,Shen Xiaojian and Qiu Xiaoyu
(Earthquake Administration of Zhejiang Province,Hangzhou 310013,China)
In view of the management status that the present earthquake monitoring stations of Zhejiang Province continue to increase,while the equipment repair process in seismic stations is disorder and paper-based,we designed an intelligent operation and maintenance system for seismic stations in order to achieve the intelligentized monitoring and management.Compared with the traditional maintenance,this system is not only to achieve the digital management of operation and maintenance information,but also to ensure the smooth progress of the repair process through the introduction of the form of work orders.
intelligence,maintenance,monitoring,digitized,work orders
10.3969/j.issn.1003-3246.2016.05.026
陳軍輝(1984—),男,工程師,主要從事測震、強震臺站設備維護工作。E-mail: 183831732@qq.com
浙江省防震減災公共服務信息系統項目
本文收到日期:2016-02-24