郭建超
(工業和信息化部網絡安全產業發展中心(工業和信息化部信息中心))
《“十四五”推進國家政務信息化規劃》中提到,“‘十四五’時期是我國乘勢而上開啟全面建設社會主義現代化國家新征程、向第二個百年奮斗目標進軍的第一個五年,圍繞推進國家治理體系和治理能力現代化的總目標,加快推進數字政府建設,政務信息化工作面臨新的形勢任務要求。”隨著信息技術的發展,黨政機關業務逐漸電子化,各系統建設越來越復雜,電子政務系統的運行維護也越來越重要。但是,現實中往往單位重建設而忽視了運行維護的重要性。經驗告訴我們,系統在開發、建設中要投入資金、人力,在運行維護中也要投入相關資源。只有這樣,才能確保電子政務系統平穩高效運行。否則,容易造成虎頭蛇尾,有始無終。
電子政務運行維護工作是電子政務信息化最為核心的工作之一,它要求從點滴著手,從細微處下功夫。電子政務運維工作面臨的主要問題主要有以下幾方面:一、信息運維過程可視化程度低。目前多數單位運維主要是“救火式”運維,沒有專門的監控平臺,缺少事前預警機制,使得運維人員只能充當“救火隊員”,服務缺乏主動性。二、信息運維處理流程不夠規范。目前,各系統多數是煙囪狀態,缺少統一的維護標準和流程。三、缺乏有效的知識積累和共享,缺少知識庫構建。沒有有效的知識積累,且運維人員更換頻繁,造成操作維護效率低下,類似的故障和問題仍然在不斷發生。面對上述問題,急需建設全方位的運維體系,將各類服務器、終端、網絡、應用系統全方位統一監控,實現全運維過程可控可管,協調各方運維力量實現全方位協同,是解決當前運維問題的重要抓手。
隨著電子政務運維工作重要性的日益凸顯,電子政務運維管理必然從粗放管理走向科學管理。保障運維經費,穩定運維隊伍,提升運維服務水平,要從運維管理上升到服務管理,滿足電子政務業務應用發展需要。運維工作是一項長期的工作,需要我們圍繞業務需求為業務提供支持保障,不斷更新運維技術,與時俱進,確保電子政務的平穩高效運行,為機關作好有力支撐。
當前,機關電子政務運維工作主要包括:基礎環境運維、硬件運維、終端運維、系統運維、安全運維等。
基礎環境運維是對機房空調系統、配電系統、UPS、消防系統等的運維,主要是保障電子政務軟硬件有一個良好的運行環境。硬件運維主要是指對服務器、路由器、交換機、防火墻、存儲等設備的運行維護。終端運維是指對在機關運行的內、外網終端進行維護保障,及時處理用戶報修的故障。系統運維是指對機關部署的應用系統(如OA、門戶網站、許可事項審批系統等)的運行維護,負責系統故障處理,定期巡檢,協調部署更新等。
安全運維主要是指對部署在機房的安全設備進行運行維護,保障設備的正常運行。
當前,機關電子政務運維存在的問題主要有以下幾點:
近幾年來,主流信息技術的發展日新月異,大數據、云計算、人工智能、網絡安全等新技術不斷涌現,信息技術快速迭代,更新頻繁,設備升級換代成為運維工作的常態。設備的更換和升級使系統的性能得到大幅度提高,提高了機關的辦公效率。雖然設備更新后大大提高了運行效率,但它給電子政務運維工作也帶來了巨大的挑戰。舊設備和新購設備多數都是混合使用,新老設備的兼容性問題越來越突出。而且設備更新換代快,新舊系統混用引發的問題非常突出,機關電子政務運維往往缺乏先進的運維監控手段和工具,僅使用簡單老舊的運維管理軟件,運維人員技術相對滯后,跟不上新技術的變化。
隨著機關信息化建設的不斷深入,系統建設越來越復雜。但是運維方面卻沒有跟上時代的步伐,缺少統一的運維標準,往往是一個系統一個運維方法,一個人一個運維手段,“救火式”運維現象較為普遍,缺少全面的運維管理體系。特別是最近幾年,信息技術發展日新月異,信息系統從業務層、數據層到基礎架構層均變得愈發龐大和復雜,從而使得機關信息化運維對系統和設備都提出了新的要求。為了應對更加復雜的挑戰,我們急需建立統一的運維標準,建立全面的運維管理體系,根據運維管理體系指導機關電子政務運維工作,以使運維更加規范化、科學化。
在日常運維工作中,設備陳舊、人才匱乏是機關運維存在的重要問題,這一系列問題的存在使得運維中不能及時和準確地解決各種故障,同時也無法對設備事件和鏈路狀態進行研究分析,無法有效地監控和維護核心業務系統,更加難以解決設備性能等深層次的復雜問題。在管理方式上,信息部門往往也沒有建立運維知識庫,過度依賴核心成員,年輕人員成長慢。過度依賴外包廠商,往往出了故障就打電話叫廠商來支撐,缺少事后分析和歸納總結。運維工作停留在傳統的接電話響應模式,運維人員工作較為被動,缺乏主動意識和創新意識,工作局限性大。此外,運維人員流動性較大,往往剛培養出的人才卻流失掉,運維人員待遇不高,運維隊伍不穩定。
為有效解決機關電子政務運維服務工作中存在的問題,基于精益化管理理念,提高運維工作效率,從機關運維架構統籌考慮,我們提出構建面向機關電子政務的“大運維”管理模式[1],以解決統一運維管理的問題。
通過對機關電子政務運維的梳理可知,機關電子政務運維范圍涉及機房基礎設施、服務器、網絡設備、應用系統、終端設備、安全設備等的運維管理。將各軟硬件設備納入統一規劃,統一運維和管理,建立一套全流程、全方位運維的大運維系統,優化管理和運維流程,實現集中監控、統一運維及風險防范,對達到降低運維成本,實現資源共享,提升運維效率具有重要意義。
大運維系統具有如下優勢:
(1)提高運維效率。大運維系統根據數據信息情況,實時監測完成數據收集、統計、分析、分類存儲,實時判斷分析應用程序關鍵性能指標、趨勢,減少了人工預判的限制,以真實數據作為判定標準更加準確。系統通過統計分析采集到的數據,實時發出警報并解決問題,縮短平均故障間隔時間,快速恢復原有功能。
(2)業務拓展。大運維系統可統計、分析網站或應用程序等 IT 環境中的數據,了解用戶使用模式和地理分布趨勢,并確定最具分量的用戶。通過用戶的劃分,掌握有效用戶實際需求,針對性優化業務流程,為用戶提供更加優質的服務。
(3)實時監測。大運維系統運用機器學習算法和大數據技術,基于服務器和網絡基礎設施監控,提供針對端對端的網絡運維分析,具備對錯誤事件、容量配置、服務器和網絡元件安全性進行深入考察的功能,能實時監測操作系統,主動預防,管理Windows 和 Linux 操作系統中的性能問題,監測意外事件并作出告警,還可以綜合了解業務應用狀態、資源消耗情況、處理能力等。
所以,建立一套大運維系統,通過主動式監控對服務器、數據庫、網絡設備、應用系統等進行監控分析,并根據規則對監控數據進行實時檢測,以及時發現問題并進行告警,為未來系統建設和業務的升級改造提供依據,具有重要意義。
大運維系統從邏輯上劃分,可分為五個模塊,分別是用戶訪問層、業務系統層、數據加密層、數據服務層和基礎資源層。
主要包括系統用戶、運維工程師和后臺管理員對系統的訪問。根據需求,設置不同用戶角色,系統用戶主要是查看系統運行信息,故障及時報修等;運維工程師主要是使用系統巡檢、承接運維工單;后臺管理員主要是對用戶、權限、系統指標項(所巡檢系統、服務器等)的配置。
包括對統一運管平臺、重要應用系統的訪問。
可實現對數據庫服務器、數據存儲的加密存儲,分為結構化數據加密存儲和非結構化數據加密存儲,用來保障數據庫、存儲的安全性。
提供運行狀態采集、數據采集,監控告警,并把告警推送到相關的系統維護人員手中,做到實時采集、實時維護、實時告警。
主要指服務器、網絡設備、安全設備、存儲設備、數據庫等。
運維工作是一個技術信息密集的領域,需要豐富的知識和經驗支撐。在日常運維、服務等工作過程中,會產生大量有價值的信息資料,比如系統文檔、應急預案、故障處理記錄、操作手冊等。基于運維場景進行知識沉淀與推送,是一個現實的挑戰。
在運維工作的過程中,總結出了各種經驗與知識。對這些通過實踐獲得的寶貴經驗與知識進行科學的管理與利用,將會有效地提升運維團隊的技能水平、知識儲備,從而降低運維成本。而且多數問題及其解決方案都可以在知識庫中獲取,更多的事件都可以直接得到解決,從而將電子政務運維人員從重復性的工作中解放出來。可以將更多的精力放在解決其他的新問題上,進而達到提升工作效率,降低運維成本的目的。而經驗與知識的總結,通過建立運維知識庫[2]將會是一種有效的手段。運維知識庫將主要由產品資料庫、系統問題庫、檢查清單庫、制度規范庫與培訓資料庫組成,可根據實際的資料積累情況進行調整。

圖1 運維知識庫
產品資料庫主要存放與產品相關的資料,如《系統安裝手冊》《用戶使用手冊》《系統升級方案》等,其版本迭代隨著系統的變更進行,因此需要做好版本管理。一些資料是事務性工作的產物,可與具體的工、單或任務關聯起來,以便進行全過程跟蹤與追溯。
對各類運維過程中遇到的事件或問題進行深入的復盤分析,形成文檔并歸檔到運維系統問題庫,利用開源系統或自制的系統進行管理,方便查詢與分享,促進知識共享與交流。當遇到同類問題的時候可以提供快速的處理方案,同時也有利于對問題進行統計分析,找出系統中的弱點并進行完善,從而有效提升系統的可用率與可靠度。
清單是保證運維工作質量的有效手段,對于不同的工作有不同的清單模板,需要進行有效的組織與管理,方便歸檔與查詢。隨著系統的變化,清單也會不停地迭代更新,因此需要進行及時的維護,并做好版本管理。清單的執行結果也需要進行歸檔管理,方便查詢與審計,清單執行結果需要與具體的“工單”或“任務”關聯,以便進行全過程跟蹤與追溯。
運維工作管理的各個制度、規范與標準,均歸檔于此。這些內容也會隨著運行實際情況的變化而進行迭代更新,因此也需要進行及時的維護,并做好版本管理。
在新的運維體系中,培訓分享是知識傳遞的重要方式,各專業小組負責人的工作職責之一就是培訓,為其他小組成員“輪崗”進行提前準備。制作的培訓資料就歸檔于此,以便進行查找與分享。

圖2 網絡安全保障技術手段
運維知識庫還可與應用系統進行對接,作為應用系統的知識輸出平臺。與應用系統對接后,通過智能檢索可以共享知識庫中的內容,獲取有價值的知識反饋,進而實現知識庫的推廣應用,方便了用戶的使用。
機關電子政務運維保障直接影響黨政機關的政治安全、經濟安全等,具有重要意義,我們應加強網絡安全保障。為此,可以從定期安全評估[3]、安全加固、安全巡檢、新系統安全檢測、加強數據安全幾個方面著手。
根據電子政務系統和所在運行環境的不同,可分為網絡設備評估、操作系統評估、應用程序評估三大類,重點加強相關安全保障,周期性地進行安全評估,確保機關電子政務系統的平穩高效運行,為機關正常辦公提供有效的信息化支撐。
我們可以對網絡設備、安全設備、防火墻、操作系統、應用程序等進行周期性安全加固。其中,對安全設備的加固對象為防火墻、交換機、IPS系統。
應定期對機房硬件設備、軟件系統展開安全巡檢,指派專業人員確定安全狀態監控的對象,形成巡檢對象列表。使用專門的巡檢工具,借助大運維平臺的撥測等功能,定期進行巡檢,可將巡檢內容定期上傳,以做備份。此外,從規章制度上,應該建立完善的運維巡檢體系[4],確保巡檢有章可循。應及時對巡檢過程中發現的問題進行分析,及時發現安全事件并作好記錄,分析其發展趨勢,及時報告上級主管領導。根據情況作出研判,并作出響應。
新系統上線前檢測[5]是應用系統生命周期中的重要組成部分,在對應用系統建設進行規劃,并深入調研的基礎上,根據機關信息系統上線要求,制訂系統上線前的安全檢測方案,結合信息系統平臺建設情況,按照系統上線前安全檢測方案實施檢測工作具有重要作用。所以我們在系統上線前,要采用對系統非侵害的測試方法,進而及時發現系統安全風險隱患。
我們可對數據進行加密,從而加強數據安全。數據主要分為結構化數據和非結構化數據,結構化數據主要是數據庫表、字段等,非結構化數據主要是數據結構不規則或不完整,沒有預定義的數據模型,不方便用數據庫二維邏輯表來表現的數據,包括辦公文檔、文本、圖片、圖像和音頻/視頻信息等。電子政務系統數據加密,可以用加密算法,對數據進行加密,確保即使數據被竊取,也知道數據的具體內容。
信息技術已經成為政府機關運行的堅強保障,而做好政府機關電子政務運維工作是機關信息化的重要環節。做好此項工作是一項復雜的系統工程,需要注重加強制度建設,建立統一的運維制度體系,樹立大運維理念,建立運維知識庫,并且要加強安全保障,還要注重更新知識結構,總結經驗,加強學習,來及時掌握最新的主流技術的實踐運用,進而提高機關電子政務的運維水平,保障信息安全,為機關信息化作有力支撐。