莊紹燕,楊保衛,林曉龍
中國人民解放軍聯勤保障部隊第910醫院 信息科,福建 泉州 362000
醫院信息化的發展經歷了從最早HIS、收費、電子醫囑、非結構化電子醫護文書的基礎應用階段,到中期各財經管理系統、各醫護技系統、結構化電子病歷的廣泛使用階段,到近期物聯網、集成平臺和數據挖掘分析的深度運用階段[1],其中,醫療信息系統的深度應用為醫院的發展提供了良好的基礎。
數字化醫院發展將重心放在了系統的建設上,忽視了醫院系統的劇增給運維管理帶來的壓力。像這種“重建設,輕運維”的現象普遍發生在各個醫院。信息化部門將重心放在系統建設上,勢必忽視運維團隊管理和運維方案的研究。
在信息系統生命周期中的論證、建設、運維和消亡四個階段中,運維占信息系統整個生命周期80%以上。因此,醫院信息部門最主要的工作之一就是信息化運維,一套行之有效的運維整體解決方案也成為各個醫院信息部門的共同研究對象。所以,研究一套科學的運維整體解決方案可以促進信息化團隊的運維能力和運維效率,使醫院信息化系統的穩定、安全、高效運行得以保障。
一般三級醫院信息系統的數量大都多達百種以上,根據信息系統的服務人群劃分,主要可劃分為面向醫護工作類、面向患者服務類、面向醫院管理類。
其中,面向醫療工作類的信息系統主要有HIS及各子系統、檢驗、PACS、移動醫護、心電、手術麻醉、病理、EMR、CDR、急診和院前急救等系統,面向患者服務類的信息系統主要有院區自助服務系統、互聯網端和手機端等各種查詢系統,面向醫院管理類的信息系統主要有成本核算、經濟管理、醫療廢物管理、合理用藥監測、毒麻藥品監控、醫院感染監控、決策支持、弱電智能管理等系統。這些系統以醫院內部醫療業務局域網和服務器為平臺,輔以一定的安全設備構成軟硬一體的醫院信息化服務綜合平臺,為臨床、醫藥技、管理部門和病人提供信息化應用和服務。
信息化運維就是對整個平臺內的所有信息化組成要素(計算機終端、外設、服務器端、基礎網絡及各應用系統)施以管理和技術手段,使整個平臺得以穩定、安全、高效運行。
1.1.1 運維管理的技術難點
平臺上的這些系統通常來源于多個不同的軟件廠商,以HIS為核心,系統與系統之間有的存在孤島[2]關系,有的存在縱向關系,有的存在橫向關系,有的甚至存在網狀關系(一個系統與多個系統之間有業務邏輯關系),拓撲關系錯綜復雜。
醫院信息系統的多樣性、多源性導致了醫院信息化運維的復雜性,加之缺乏統籌規劃和行之有效的整體運維解決方案,迫使運維人員疲于應對已經發生和正在發生的錯誤。多數醫院的信息化運維都處于常態化的 “四處救火”被動狀態[3]。
比如,運維工程師碰到某個問題后,只根據發生的具體問題給予解決,并沒有對同類型的問題找出根源并給予消除隱患。在存在網狀關系型的系統中,因為問題的處置不當,解決某個問題后,引起了另外一個系統其他問題的發生。于是,運維工程師們陷入了無休止的排錯性維護中。
現實中,雖然有的醫院采用各系統運維服務外包[4]模式來減輕運維工作量和風險,但是服務供應商為了保證運維服務外包的延續性,經常對問題的原因或誘因加以隱瞞并對其解決方法采取技術封鎖。這種現象不僅增加了醫院信息化運維的成本,而且可能出現各系統外包運維人員互相推諉責任,甚至可能因外包服務器人員直接操作核心服務器而導致醫院醫療數據外泄的情況發生。
1.1.2 運維的主要對象和內容
大部分人對醫院信息化運維的理解仍停留在計算機終端的維修上,對網絡運維、業務系統運維、服務器運維、數據庫運維的認知都處于空白或缺失狀態。其實任何信息系統在任何階段都離不開基礎網絡、數據中心(服務器)、應用服務和終端四大傳統組件。因此也確定了信息化運維的主要對象:網絡方面主要有基礎物理網絡和路由交換配置,數據中心方面主要有數據中心機房和備份容災設備,應用服務方面主要有操作系統、數據庫、應用服務、安全防護配置和各業務應用系統,終端方面主要有計算機終端、外設、打印機、服務器、交換機、UPS、存儲等。
信息化運維的主要內容是對醫院信息系統的組成對象進行排錯性維護、耦合性[5]維護、完善性維護和預防性維護。通俗地講,就是對硬件進行養護和維修維護,對網絡、應用系統、業務服務、數據庫進行狀態實時監控,對應用系統的兼容性和可用性進行修改、完善和預防。從維護的能動性上,排錯性維護和耦合性維護屬于被動維護,完善性維護和預防性維護屬于主動維護。
1.1.3 目標
信息化運維的主要目標是在合理的組織結構下,依計劃有序地按照既定的規范和標準流程對正在建設和建設完成的信息系統進行維護,使各個系統從排錯性維護和耦合性維護順利過渡到完善性維護和預防性維護直至系統的消亡。
一般情況下,運維人員在系統建設后轉運維初期,基本以排錯性維護和耦合性維護為主,在運維過程中,應該對排錯性和耦合性維護進行總結分析,提高排錯性和耦合性維護的效率。中后期主要以完善性維護和預防性維護為主,將主要精力花費在完善性和預防性維護上。對于運維團隊來說,越早進入完善性和預防性維護階段,將被動運維轉為主動運維,越能體現運維團隊的運維效率。運維的最終目標就是通過運維的良性循環,在全局上實現醫院整個信息化平臺各系統的穩定、安全、高效運行。
醫院信息系統是否能穩定、安全、高效地運行,除建設期各系統的選型外,信息運維團隊的有序、高效、精準、預防運維起著至關重要的作用。信息運維部門只有搭建一套科學、規范、高效的運維整體保障體系,才能實現醫院信息系統穩定、安全、高效地運行。當然,選擇一套與團隊運維思想契合度較高的運維軟件[6-8],可以協助運維團隊從組織機構、制度、臺賬、流程、統計分析方面進行高效運維。
1.2.1 合理的組織機構
醫院信息化運維團隊應由信息科科長直接領導,或者團隊負責人由信息科科長直接擔任。運維團隊建議根據業務種類編制四個運維專業小組,分別是終端及外設運維小組、網絡運維小組和業務系統運維小組、數據中心運維小組,每個小組編制3~4人較為合理[9]。部分醫院因為工程師人力資源不足,可以取消或縮小終端及外設運維小組的編制人數,將終端及外設的運維服務實行服務外包。
如圖1所示,信息化運維團隊應設定運維值班坐席(窗口),承接醫院所有信息化需求和問題。每日值班坐席人員從四個運維專業小組成員中抽調輪流擔任,由值班坐席進行當日事務的統一接收、運維統籌、事件分類、任務指派、事件跟蹤、用戶反饋和事件小結。

圖1 組織結構圖
運維團隊以“值班坐席”為核心,忙時接收并處理“值班坐席”派發的排錯性維護和耦合性維護任務,閑時主要進行完善性維護和預防性維護的階段性攻關工作。
1.2.2 健全的制度和科學的模式
應建立健全的運維管理制度以實現對整個運維團隊、各運維小組和各運維人員的考核和獎懲機制[10]。
運維相關的核心制度主要包括:值班坐席管理制度、值班交接班制度、運維目標管理制度、責任和獎懲制度、運維管理制度、安全管理制度、數據備份與恢復管理制度、數據中心機房運行管理制度、網絡安全(及其他各方面)巡檢管理制度和應急預案演練管理制度等。
其中,值班坐席管理制度對事件主要有兩種管理模式,一是首問負責制[11],二是值班總負責制。
首問負責制指的是:誰值班,誰受理的問題,誰追蹤到底。這種模式能提高單事件的處理效率,但如果上一工作日值班事件沒有處理完畢,上一工作日值班員在交接班后進入常規工作崗位后還得持續跟蹤未完成事件,影響工程師常規工作的工作效率。
值班總負責制指的是:誰值班,誰負責跟蹤該事件直至事件完結,上一工作日值班人員將未完成事件交給下一工作日值班人員后,不再對事件進行持續跟蹤。這種模式能提高值班員的當班處理效率,減少其他小組成員運維壓力,但對事件交接的完整度要求較高。
如圖2所示,兩種模式各有利有弊,應根據各醫院的實際情況選用,建議運維團隊在初級階段或者信息化工程師人員較少的情況下執行首問負責制,在團隊的穩定期執行值班總負責制。

圖2 值班模式及流程圖
1.3.1 建立資產臺賬
建立資產臺賬并對資產臺賬進行有效管理是提高運維效率的基礎。運維團隊應實現臺賬信息檔案的電子化和集中化管理并交付給運維人員使用[12]。
臺賬信息包含各種軟硬件和系統的資產信息,主要包括通用IT設備(電腦、打印機、其他外設)資產臺賬、軟件資產臺賬、網絡拓撲資產臺賬、供應商目錄、零配件目錄、業務邏輯拓撲、系統與系統的關系拓撲等(見圖3)。運維團隊應在運維過程中,建立各種臺賬目錄供值班坐席和團隊成員共享使用(見圖4),以實現運維的精準高效。
運維團隊應該在日常運維中,應對資產臺賬進行索引化、一致性管理。特別注意的是,臺賬信息在運維過程中會發生信息變更,運維人員應及時實行對變更信息進行同步,且變更信息應經過雙人以上的確認(如圖4所示),并于團隊交班時公布更變內容。一般情況下,建議實施一套運維服務系統以支撐運維的信息共享。

圖3 資產管理流程

圖4 醫院IT設備臺賬管理(變更、盤點)
1.3.2 合理的事件分類
根據運維的對象和業務類型對運維事件進行分類,可以協助值班坐席更好地對事件進行精準任務指派。在實際的運維中,可根據事件發生的頻率對事件分類進行逐漸細化或整合,將高頻的事件進行類型細分,將低頻的事件進行類型整合。以便為將來運維的統計分析提供合理的、細粒度的運維生產數據。
1.3.3 運維知識庫應用
運維知識庫就是運維事件處置記錄的集合,應該對每一個事件進行詳細的記錄和有效的總結[13]。當然,高頻次事件可以調用既往的事件總結陳詞,低頻次事件應盡量對單次事件進行個性化總結,并在團隊交接班中給予宣講[14]。
知識庫是一個運維團隊最寶貴的財富,知識庫的數量和質量可以從側面體現一個運維團隊的運維效率、運維質量和運維實力。
1.3.4 事件標準化處理流程和事件閉環
信息化運維過程中總會出現高頻次和低頻次事件。當運維團隊發現某種事件的發生頻次較高并且達到一定的閥值后,就應當對該事件進行完善性維護或事務標準化處理。經過分析,如果這一類事件可以通過完善性維護消除,就應當組織力量消除該事件的發生;如果無法通過完善性維護進行消除,則應該制定標準化處置流程以保證同類事件的處置質量(見圖5)。

圖5 事件描述模板
運維事件的閉環指的是對每件事件都進行事件反饋、總結和分析。通過運維事件的閉環管理[15-16],提升終端用戶對運維事件滿意度,從整體上提升信息化運維的質量。
通過對信息化運維整體解決方法的運用,運維團隊的素質也得到了整體的提升,間接促使醫院在信息化運維效率和運維質量上得到了“質”的提升,最終使醫院的運維進入良性循環的運行狀態。
運維事件的主要要素有事件主題、發生時間、處理對象、故障節點位置、各種處置時間節點、處理人員、處理方法、處置結果、處置結論等。值班坐席人員在日常的值班過程中應對上述要素進行真實、詳細、完整的記錄[17]。
運維數據的統計分析[18]運維產生的數據投入到生產運維(主動運維)中。詳細完整的生產記錄可以為將來階段性的分析提供寶貴的原始數據。運維團隊可以利用統計學對生產數據進行事件完成率分析、周分析(見圖6~8)、月度分析、季度和年度分析總結。當運維記錄達到一定時長和數量后,還可以對運維數據進行同比和環比分析比較[19]。

圖6 30 d事件完成率餅狀圖

圖7 1周事件匯總

圖8 分類事件數量曲線圖(20 d)
通過分析通常可以得到以下的決策或依據:
(1)將大概率事件進行類型細分,將小概率事件進行類型整合。
(2)預判某些小概率事件的發生,以提前做好技術和資源儲備,實際案例見圖9。
(3)對某些無法通過完善性運維的消除大概率事件,制定標準化的處置流程。
(4)制定下一階段運維團隊預防性維護的方向[20]。
(5)提供運維小組和個人考核和獎懲依據。
(6)總結近階段運維效果,提出下階段運維目標。
(7)為醫院的信息化建設提供決策建議。

圖9 我院信息科2018年第二季度值班總結報告(摘選)
通過合理分析既往事件記錄,可以協助運維團隊從排錯性維護和耦合性維護向完善性維護和預防性維護進階;通過不斷進階的分析研究,可以促使運維團隊從純粹的事務處理型向科學研究型轉型;通過由淺入深的分析和不斷的決策產出,可以促使信息化運維團隊整體實力和醫院信息化整體水平提升一個新的高度。
通過對運維對象的分類、內容的梳理、方法的改進,總結出一套適合醫院信息化運維的整體解決方案,可以把原本雜亂的運維事務、粗獷的運維方法、混亂的運維狀態,分別變得有序、精細、平穩,使運維方法論得到信息從業者的重視。
運維團隊從一開始就應該扭轉等待“排錯性維護”和“耦合性維護”的觀念,把完善性維護和預防性維護這兩種主動運維作為運維重心,因此信息化運維融入項目管理的思維[21]和方法就顯得尤為重要。在日常運維中,應把范圍、進度、質量、成本、風險等項目管理要素與運維工作互相結合[22]。特別是在運維質量管控上,運用PDCA[23]循環思想,利用循序漸進的自我分析、自我糾察、自我糾正等方法,不斷對運維事件的處理流程進行PDCA[即計劃(Plan)、執行(Do)、檢查(Check)、處理(Act)]優化。
現在大部分醫院已經完成第二階段(中期的財務管理、成本核算、績效考核、各醫護技系統、結構化電子病歷的廣泛使用階段)信息化建設,隨著物聯網技術的普及,醫院信息化建設馬上進入第三階段(物聯網、集成平臺和數據挖掘分析的深度運用階段)的迭代建設。對運維團隊來講,現階段除了保障醫院信息系統的運行外,還可以通過對歷史運維數據的統計分析,為第三階段的建設調研和系統選型提供重要的參考依據,使運維的重要性達到質的飛躍,使運維意義得到升華。
醫院信息化運維工作是一項集網絡技術、計算機應用、多媒體、軟件工程、統計學、信息系統項目管理等多學科融合的綜合性工作。醫院信息化的運維工作雖然非常復雜,但是經過建立一套科學、規范、高效的運維保障體系,可以保障醫院信息系統穩定、安全、高效運行,輔以實現醫院的高效運作。