周一波+麻建+王璟+熊文敬



摘 要:國網英大國際控股集團有限公司根據金融信息通信應急保障需要,緊密結合信息系統現狀,組織開展了金融信息通信應急保障體系設計。金融信息通信應急保障體系包括應急工作組織建設、應急處置總體流程設計、應急預案管理、應急演練等四個方面。通過金融信息通信應急保障體系的建設和應急演練實施,進一步提升了企業信息通信應急保障能力,下一步將全面總結在實際工作中遇到的問題,不斷優化與完善現有應急保障體系。
關鍵詞:應急保障體系;流程設計;預案編制研究;演練方式研究
中圖分類號: TP309 文獻標識碼:A
The Design of Financial Information Communication Emergency Support System
Zhou Yi-bo, Ma Jian, Wang Jing, Xiong Wen-jing
(State Grid Yingda International Holdings Co., Itd. Beijing100005)
Abstract: According to the strict requirements for financial information communication during emergency time, our enterprise designed the Emergency Response System (ERS) on current infrastructure. ERS includes four aspects: the emergency organization construction, the emergency response process design, the emergency plan management, and the emergency drill. Constructing and implementing the ERS improved enterprise`s capabilities in information communication field. In next stage, to sum up the operating experience and keep improving the stability and reliability of ERS is needed.
Key words: Emergency Support System; Process Design; Emergency Planning Research; Drill Method
1 引言
在我國現階段,信息通信系統突發事件應急管理工作在某些企業,特別是國有大型企業有了一定的發展。但從總體情況來看,系統業務停止、數據丟失、服務器宕機、設備故障等事件時有發生,故障節點難定位;應急預案不夠完善,在實際應用上,缺乏實用性和可操作性;應急處置協調工作重,公司缺乏統一的信息系統應急協調機制及應急體系;缺乏對信息系統應急人員的培訓和管理;信息系統的應急物質準備不到位。
基于上述分析,隨著公司規模的不斷擴大,信息通信系統復雜程度日益加深,信息通信系統作為公司業務的支撐,直接影響金融業務的運轉。公司如何合理地建立信息通信系統突發事件應急管理體系,最大限度地降低信息通信系統突發事件的負面影響,就成了一個迫切需要解決的問題。
2 設計原則
在進行組織體系建設時,通過學習應急管理相關方法論,總結先進經驗,全面堅持幾項原則。
(1)統籌規劃:信息化工作部從企業整體建設方面來規劃突發事件應急保障管理體系,循序漸進,有步驟地實施應急保障體系。
(2)全面性:建立的體系應能涵蓋各類突發事件。
(3)集成性:要集成企業各部門及企業外部相關的人員和資源,協調管理。
(4)層次性:根據不同類別和級別的突發事件要采取不同的處置措施。
(5)實用性:應急保障體系的構建既要高效又要實用,確保突發事件應急保障措施能夠落到實處。
(6)可操作性:主要體現在平時能夠防范突發事件、對相關員工進行培訓以及進行應急演練;在突發事件發生時能消除或減少對業務應用方面造成的影響。
3 組織體系設計
為確保應急體系運行有力,處置過程高效、順暢,堅持“統一指揮、分工協作、預防為主、平戰結合、及時靈活、科學有效”的原則,企業應成立以信息化分管領導為組長、信息化工作部牽頭、各相關業務部門參與、專業技術人員保障的信息通信應急組織,形成規模適度、素質優良、結構優化、布局合理、管理規范的應急組織體系,負責統籌協調開展應急處置工作,持續提高突發事件應急處置能力。
3.1領導組
主要職責包括貫徹企業信息通信應急管理相關方針政策,負責全面領導信息通信應急保障工作,決策和協調信息通信應急處置重大事件。
3.2 調度指揮組
主要負責組織信息通信應急處置工作開展;組織各應急組對故障可能產生的風險進行評估預測;參與并進行全過程管控,向領導組及時匯報應急處置工作進展。
3.3 秘書處
主要負責接收來自監控、巡檢人員及各業務部門反饋的信息通信故障信息;負責對故障信息進行確認、風險預判,組織、跟蹤、協調各專業應急組故障處置,及時向上級報告并轉達處置指令。
3.4 運行監控及安全監控組
主要負責各類硬件設備、資源池等平臺軟硬件、安全設備的巡檢、監控值班;負責配合各信息系統進行安全防護及故障處置,保障信息系統安全穩定運行。
3.5 各專業應急組endprint
主要負責各類硬件設備、資源池等平臺軟硬件、安全設備的故障處置和防護措施落實;應用系統監控巡檢、故障上報、故障處置和安全防護措施落實;協調各應用系統三線技術人員予以故障處置和隱患消缺,保障平臺軟硬件、數據中心安全穩定運行。
3.6 三線應急支持組
主要負責根據需要提供網絡出口鏈路應急故障處理支持;負責根據故障排查結果,遵照對備品備件的到場時間要求,提供應急響應;負責提供安全事故排查、日志分析等安全處置與技術支持。
3.7 業務部門
主要包括企業各信息化業務部門。負責將應用系統使用中的突發問題上報秘書處;配合應用系統應急處置完畢后的系統可用性驗證。
4 應急處置流程設計
為確保應急處置過程科學、合理、高效、順暢,將各應急組織有機串聯,發揮各應急組織的專業特長,保證全體應急組織人員各司其職、協同處置,形成整體處置能力,公司信息化工作部經反復研討、沙盤推演,全面完善了應急處置總體流程。
處置流程共分三大階段十六個步驟。
發現階段:由運行、安全監控組、系統日常巡檢人員及業務用戶發現問題后立即將故障基本情況上報秘書處;秘書處根據故障現象及故障定級矩陣圖預判故障影響,確定需要啟動應急處置流程后,通知調度指揮組及相關應急組人員立即到達指定崗位;調度指揮組下達故障排查指令后,秘書處通知受影響各業務部門客戶信息系統暫停業務處理,并向各專業應急組傳達故障排查指令。
處置階段:各專業應急組接到指令后,應急組內部按既定流程逐步排查,應急組之間相互協同、相互溝通并行開展故障排查,及時聯系三線應急組或外部單位協助支持排查工作;經初步判斷故障定位,核實排查結果后,向調度指揮組匯報;調度指揮組下達啟動應急處置指令,各專業應急組按照故事原因所對應的應急預案內容協同開展應急處置工作;應急處置完畢,由秘書處請各業務部門人員及運行、安全監控組確認故障排除后,向調度指揮組上報處置結果。
結束階段:調度指揮組審核處置結果,下達應急處置結束指令;秘書處通報全體應急人員應急處置結束,通知受影響業務部門信息系統故障恢復,業務可正常處理;按照“四不放過”原則,組織總結應急故障處置中的經驗教訓,本著“舉一反三”的原則,對在運信息系統進行全面隱患排查,及時消除安全隱患,杜絕類似問題再次發生。
5 應急預案編制方式研究
5.1 應急預案編制思路
應急預案是針對可能發生的重大事故所需的應急準備和應急響應行動而制定的指導性文件。它是在辨識和評估潛在重大危險、事故類型、發生的可能性及發生過程、事故后果及影響嚴重程度的基礎上,對應急機構職責、人員、技術、裝備、設施、物質、救援行動及其指揮與協調等方面預先做出的具體安排。
通過編制各系統應急預案,旨在當信息通信系統一旦發生可預測的系統故障情況,就可以按照預定的方案實施處置措施,同時根據具體的事態發展及時調整處置措施,以最快的速度發揮最大的效能控制事態的發展,通過有組織、有秩序地實施應急處置措施,達到降低故障造成的危害,減少損失的目的。
5.2 應急預案的編制原則
應急預案應本著幾點要求進行編制工作。
(1)科學性。預案的指導思想、生成方法和步驟、實施的處置措施等都應該是科學的,即預案的制定應該符合突發事件發生、發展、演化的機理,以保證預案在實施過程中能真正發揮效果。
(2)系統性。完備的應急預案應成為一個系統,這主要表現在應急能力評價要成系統,應急措施的制定要成系統,生成應急預案的方法、原則、程序等也應形成一個體系。這些系統之間并不是獨立的,而是有機聯系,相互制約的。
(3)完整性。應急預案應包含突發事件應急管理的整個過程,以及突發事件應急管理中所需的盡可能全面的數據和資料。
(4)實用性。應急預案是建立在風險分析的基礎上的,應急響應也是建立在現在資源的基礎上的,提出明確具體的措施,具有明確的針對性,可操作性很強。
(5)動態靈活性。突發事件往往是復雜多變的,任何詳盡的應急預案都不可能全部概括各種可能的情景。一方面是有些突發事件是應急預案中沒有提及的,另一方面是在突發事件發生過程中,情景是動態變化的,甚至有些情況是不可預測的。因此應急預案不是一成不變的操作手冊,必須能動態靈活地調整。
5.3 應急預案的編制步驟
企業在編制應急預案時主要遵循七個步驟,如圖3 所示。
6 應急演練方式研究
為實際檢驗信息通信保障方案中應急處置流程的實用性、合理性、順暢性,信息系統應急預案的可操作性,各應急組織協同處置能力,考察三線支持人員及備件到場時效性,全面提高信息通信應急保障能力,企業應持續并深入開展信息系統應急演練工作,并將演練工作情況納入評價考核內容。
應急演練根據演練中的人力、物力等組織、投入的形式,劃分不同的演練類型,以演練組織形式可劃分為桌面演練、模擬演練、實操演練等,應急演練的實施根據是否具備演練腳本的指導,分為有腳本演練和無腳本演練。
6.1 桌面演練
桌面演練也稱為沙盤推演,在參演單位之間進行,采取多方參演單位協同參與的方式,確保各單位協同工作。
6.2 模擬演練
即模擬實際環境搭建模擬系統,進行一些故障模擬和應急測試,可以此做參考,當生產環境發生類似故障時,在較短時間內完成應急故障處理。
6.3 實操演練
采用實際生產環境進行應急操作,實現故障緊急處理或在生產環境模擬數個應急場景或災難性應急恢復,通過實際操作達到應急演練目的。實操演練實施應提前提報檢修,具體操作以檢修流程為準。
6.4 無腳本演練
網絡與信息系統無腳本應急演練是指應急處置人員在事先不知曉故障預設場景、原因及故障恢復處置措施的情況下,根據故障現象在演練過程中進行分析和判斷,按照實際自動觸發故障處置流程,恢復網絡與信息系統正常運行的一種應急演練形式。無腳本應急演練應具有兩個特點。
特點一:無腳本應急演練應具有“無預知、有預案”的特點。無腳本應急演練對應急處置人員采用“事先不預知”的方式,即應急處置人員事先不知曉演練故障預設及觸發時間,但是應急處置人員在處置過程中需遵守現場運行規程和應急預案,應根據預案及規范有序開展應急處置。
特點二:無腳本應急演練應具有“無腳本、有范圍”的特點。無腳本應急演練在演練過程中采用無腳本的方式,但是必須在一定的預設故障范圍內,避免產生次生故障,即不能對演練范圍以外的網絡或系統產生影響。無腳本應急演練須做好全面的風險評估,對演練過程潛在的風險做到可控、能控、在控,有效控制風險范圍,保障演練安全。
7 結束語
隨著企業信息系統建設的深入,企業對信息系統的依賴性越來越大。可能發生的信息系統突發事件將危害到企業的正常運作,要采取及時有效的措施對突發事件進行處理,企業必須將突發事件應急管理的理論應用到信息系統中,建立企業信息系統突發事件應急管理體系,為企業建立信息系統突發事件應急管理體系提供指導和借鑒。
參考文獻
[1] 徐海東.應對挑戰建立完善的網絡與信息安全保障體系[J].電信科學,2007,(2).
[2] 劉娟.電信企業業務應急保障管理體系[J].信息與電腦:理論版,2014 (10) :182-183.
[3] 劉怡,張榮偉.淺談應急通信保障體系[J].黑龍江科技信息, 2016 (34) :126-126.
[4] 劉景凱.企業突發事件應急管理[M].北京:石油工業出版社,2010.endprint