王有良 胡明雙 李 波 劉 毅 宋緯地 秦曉宏
(1.彭州市人民醫院院辦,四川 成都 611930;2.彭州市人民醫院信息科,四川 成都 611930;3.上海柯林布瑞信息技術有限公司,上海 200233)
醫療健康大數據是國家重要戰略性基礎資源。近年來,國家衛健委陸續出臺一系列政策文件推進醫院信息化建設進程,互聯互通測評[1]、電子病歷評級[2]、等級醫院評審[3],從多個方面對醫院進行詳細評價,包括醫院管理和信息化建設等。通過信息化建設的高度反映醫院建設水平,以評審為基礎的醫院管理流程改造與信息化改造成為大勢所趨。管理信息化逐漸取代了業務信息化,在今后很長一段時間里,醫院的發展都主要圍繞精細化服務與精準化管理決策展開。
彭州市人民醫院以國際視野創國內一流縣域綜合性醫院為目標,以醫院“一一一三”發展戰略為抓手,創建醫院重點特色專科,加強精細化管理,全面提升醫療質量、醫院服務能力,促進醫院高質量發展,提升患者就醫獲得感和安全感。
為國家三級甲等綜合醫院,既可開展科研、教學等工作,也能夠提供醫療、保健、預防、康復、養老等服務。醫院分為城南院區、金彭西路院區和祥福院區(祥福照護中心)三個院區。占地230余畝,編制床位799張,開放床位1 106張,現有職工1 300余人。醫院開展冠狀動脈內旋磨技術及血管內超聲檢查(IVUS)、經尿道輸尿管軟鏡技術(RIRS)、腹腔鏡下婦科腫瘤根治術及深部內異癥切除術等診療技術,成功創建國家級呼吸與危重癥醫學科(PCCM)規范化建設達標單位、國家級中心(胸痛中心、綜合卒中中心),四川省重點專科(婦產科、骨科)及成都市重點專科建設單位(呼吸內科、康復科)。隨著醫院各項業務的發展,對數據應用、分析、整理、計算的需求日益迫切。由于各醫院間及院內各系統間彼此獨立、各自為政,數據接口方式普遍采用傳統的DLL、Web Service、視圖方式等方式,眾多系統間接口和業務協同關系復雜,不同時期的數據結構和邏輯關系發生了較大的差異。因此,將當前“數出多源”向“數出一源”轉變,建立數據中心及大數據平臺,消除信息孤島,建立統一的數據標準。
在醫院信息化建設過程中,最重要的一個環節就是建設醫院大數據平臺。歸集多項數據(臨床、管理、科研),形成一個完整的大數據倉庫,其中的核心是病人,主線是時間軸,單位為臨床事件。有助于現階段和今后更好地挖掘、利用綜合數據,且滿足科研、管理、患者等各方信息需求,同時為各類應用服務,如遠程醫療、區域協同以及醫院客戶關系管理等。
大數據平臺的整體設計參考HL7 RIM模型,并嚴格按照相關國際標準開發,如醫療信息系統集成(IHE)。利用標準化、結構化[4]的表達、組織和存儲一系列臨床數據,同時開放與相關法律規范、安全要求相符的數據訪問服務,為醫院的各類信息化應用提供一個相對統一且完整的數據視圖,使醫療服務質量得到有效改善,降低發生醫療差錯的概率,在合理控制醫療成本的同時,促進臨床科研水平的顯著提升。
通過建設醫院大數據平臺,對院內業務系統進行數據采集、清洗、標準化,將全院業務系統數據進行集中存儲,包括歷史數據采集,和對接集成平臺實現實時增量數據采集,形成全院的全量、實時數據中心。醫院大數據平臺建成后,可通過開放服務提供外部系統調用和數據訪問。
醫院大數據平臺的邏輯架構由基礎層、業務層、數據層、服務層、應用層、門戶層組成,如圖1所示。

圖1 醫院大數據平臺邏輯架構
整體建設醫院大數據平臺的核心內容即主數據管理系統的建設。主數據管理同傳統數據倉庫解決方案的單向集成相比,前者更重視在各個關聯的業務系統中同步發布主數據的變化,從這一點上來說,雙向是主數據管理數據的一個顯著特征。為跨越多個事務型醫院業務系統的可唯一標識的數據提供統一的數據服務,保證醫院數據的一致性和完整性,解決醫院統計口徑不一致的問題。
這里的主數據[5]指的是醫院內各系統間需共享的數據,涉及操作型系統、分析型系統、事務型應用系統,一般來說,主數據需要在院內保持完整性、一致性和可控性,為了使該目標順利達成,那么展開主數據管理,即MDM就非常有必要。

圖2 主數據管理系統架構
醫院信息應用的過程中往往會牽涉多個系統共同涉及的業務內容,如人員、科室等,但由于各系統存在相應內容的管理模塊,常常會造成各業務之間存在多種相同含義卻不同結構的信息,這使得在信息交換的過程中存在標準不一的現象。因此主數據管理就顯得尤為重要。
在醫院價值鏈的各個環節中,主數據會被多個環節調用。其中患者信息會貫穿于診前、診中、診后全過程。掛號資源主數據主要在預約階段被調用。疾病主數據主要在診斷過程中被調用。繳費階段會調用檢查、檢驗、手術操作等多個主數據,同時會使用財務相關主數據。耗材主數據除了應用于物資管理領域,也會在診療過程中被調用。
主數據管理系統是醫院基礎數據的匯集地,能夠確保院內各系統數據的一致和唯一。而主數據管理與規范是一項復雜的系統工程,不僅要將頂層設計做好,還要解決其他一系列問題,如統一標準、流程和管理體系等。
如圖3所示,主數據管理系統為醫院基礎字典提供了統一的維護入口,并且為院內平臺的標準數據集轉換提供了依據,在醫院信息化上保持了字典數據的一致性、完整性、相關性和精確性。其涵蓋的功能包括主數據構建、主數據映射、主數據版本管理、主數據訂閱、主數據審核、主數據發布等。

圖3 主數據管理構建圖
建立健全、完善的行業標準庫,是當前醫院信息化建設的必要組成部分,使醫院關鍵主數據的管理制度化、數據標準化。主數據盡量應用國際標準,國家或衛生行業標準的數據[6]。
如表1所示,建立醫院統一的行業標準庫,涵蓋ICD10、SNOMED CT中英文版,LOINC標準,藥品ATC標準及各類常規的行業標準字典,主要包括國標13項、行標47項以及其他標準等,便于字典映射、同步、標準轉化等操作,為數據歸一化建立基礎。

表1 行業標準庫構建圖
在建立院內標準庫后,需要考慮到字典數據的增量問題,即數據入口問題,還需考慮如何提供給第三方使用,即數據出口問題。院內常見的業務數據質量問題、標準不統一等問題,多數由于“出入”規范不明確所導致。在建立好醫院統一的行業標準庫之后,應建立一套完善的系統使用規范,進行相關標準規范管理,形成一個閉環管理機制,從而達到主數據庫建立的目的,充分發揮它的價值,供醫院使用。
建立規范的數據體系,需要從基本的源頭業務層面考慮。如臨床科室在使用業務系統時進行規范培訓,輸入ICD10時應選擇標準的診斷,而不是寫入自定義診斷;另一方面,可以從業務系統的功能上進行限制輸入,可規避不標準的診斷數據錄入;其次,醫院數據庫中充斥著非結構化的歷史數據,同樣需要轉換形成標準化數據。無論是從業務、數據層面,還是從已經產生過的初始化數據,抑或是未來要寫入的增量數據,都需要考慮數據質量及標準等問題。
2.2.1 數據質量
在數據質量管理中,以來源與具體原因來劃分,數據質量問題可分為三大類,分別是信息、技術、流程。
信息類問題:此類問題屬于數據質量問題,主要是由未正確描述、理解數據以及其度量標準偏差而引發的。通常元數據描述和理解有誤,變化頻度不恰當,數據度量未得到保證等均會導致這一類數據質量問題產生。
數據度量主要由五部分構成,分別是完整性、唯一性、一致性、準確性、合法性。而變化頻度則由兩部分內容構成,即業務系統數據的變化周期與實體數據的刷新周期。
在信息類問題中,業務元數據最容易引發描述和理解錯誤,其又由多項信息構成,包括業務術語、業務規則、信息分類和指標定義(指標口徑)。詳細內容見圖4。

圖4 信息問題域
技術問題域:這一類問題同樣屬于數據質量問題的范疇,是由具體數據處理的技術環節異常導致的,技術實現上的某種缺陷是引發此類問題的直接原因,如圖5所示。

圖5 技術問題域
流程問題域:因為沒有合理設置系統作業流程與人工操作流程,所以才導致流程類問題的出現,如圖6所示。

圖6 流程問題域
2.2.2 接口標準
醫院HSB按照SOA的思想服務為中心進行設計開發。HSB系統將應用系統提供的服務注冊到HSB體系之中,對這些服務進行統一管理,并且可以以“線路”的形式將多個服務重新組織成HSB服務供外界應用系統調用。接口規范如表2所示。

表2 接口規范
平臺接口支持國內外衛生信息標準接口的標準規范,如HL7V3、CDA等,見圖7。

圖7 國內外衛生信息標準接口標準規范
2.2.3 應用標準
基于成熟的標準庫和標準接口建立,如何應用這些標準字典數據,是我們最后需要考慮的。梳理常用字典的使用場景是進行數據標準應用的第一步,比如人員字典,院內的HIS、HRP、PACS、LIS系統都有一套系統本身的人員字典,在各個系統交互時如何去統一使用,需要對入口維護進行確認;其次,在找到基準字典后,對其他業務系統的相同字典進行匹配映射,形成主數據標準字典,待審核、發布。最后在第三方業務系統使用系統字典時,從主數據管理系統中訂閱,從而規范了使用流程,達到“數出一門”這一目的。
EMPI也就是主索引系統,其屬于主數據管理系統的范疇,借助概率統計學理念將一套完整的標準化算法、數據匹配算法制定出來,更加準確的驗證、判斷主索引信息,有效識別患者身份信息與科室信息,確保唯一性標識實現。利用主索引號關聯業務系統的歷史數據,最終使全部信息都能夠實現互聯互通[7],讓業務系統累積的信息孤島問題得到較好的解決。
各個應用系統都囊括了患者的基本信息,但數據未有統一的標準和維護方式。建立EMPI包括三部分內容,分別是患者信息注冊、患者信息匹配和患者主索引管理。患者在進行刷卡掛號時,注冊應用第一步會根據卡號看這一患者是否在本地存在,倘若不存在,那么就會有患者信息采集窗口彈出,由窗口接待員將相關信息輸入,包括身份證件號、姓名、性別、出生日期、電話等,并向醫院平臺主索引服務查詢,確定是否已經注冊,當系統匹配算法認為不是同一人時,再次提醒窗口接待員,讓信息的正確性與一致性得到充分保證,實現真實有效的匹配。在這一個環節盡可能對二代身份證、社保卡、醫保卡予以利用,獲取方式包括間接查詢、芯片讀取等。針對窗口產生的潛在合并日志,將利用多個注冊信息,包括姓名、性別、出生日期、電話、血型、婚姻狀況、職業、文化程度等,并把潛在記錄匹配算法聯系起來,方便管理員每天在固定時間做線下合并處理。我院采用了多種技術來實現身份匹配方法,包括“身份信息框架”“停用詞劃分”以及關鍵信息項排序,從而把身份匹配的相似度給出來。因為在登記過程中,大部分患者均未完整填寫地址信息,所以便將醫院數據實際情況聯系起來,基于這一算法,結合“姓名”+“性別”+“出生日期”,先產生潛在匹配日志,結合地址、聯系人、婚姻狀況、職業、文化程度等綜合相似程度定義為身份信息框架中各個信息項的相似程度的加權和。
以醫院內部系統協同、數據的整合與信息資源的二次利用為基礎,可利用電子化提供信息服務給患者,使整個就醫過程更加方便。比如,患者不用親自再到醫院取自己的檢驗報告;在醫院的門戶網站上就能夠查詢診療信息,包括過去的處方、檢驗報告與檢查報告等;患者足不出戶便能夠完成預約掛號。
基于衛生信息交換標準(Health Level 7,HL7)建立服務總線數據交換平臺,在這一平臺下加快標準規范建設,對接現有的各信息系統和平臺,讓各系統間的松耦合成功實現,推進院內信息系統的業務協同,讓醫院各應用系統都能夠實現互聯互通,互操作性強,從而以堅實的基礎助力跨院區、跨醫療機構以及跨區域的數據共享順利完成。建設信息交互接口方式、數據內容,其主要作用是對醫院各業務信息系統進行定義,同時對各業務系統字典服務內容展開梳理,諸如用戶、科室、病區、部門等均包含其中,還有藥品項目字典與診療項目字典等。建立的患者主索引中,合并的相同數據有165 363 8條,判斷的疑似相同數據有15 881條。

表3 主數據管理平臺字典導入量(條)
在統一的醫院大數據平臺未建立前,醫院外部系統將自身需要聯系起來單點對接醫院內部的一些系統。比如,醫療保險系統需和HIS系統相連,用于結算、審核醫保費用;衛生統計對接病案系統等。如此一來,醫院的信息系統就會多方面的連接外界。每個系統都有各種接入方式,涵蓋數據、網絡與安全等,相關的運維成本較高,且流程煩瑣,最重要的是留下了極大的安全管理隱患[8]。醫院大數據平臺建立起來后,成為對接進口與出口唯一的外部系統。在對外數據交換標準統一的同時,負責提供各種靈活的對接技術,統一運維并對統一的安全策略予以執行,最終統一對接、管理各項醫務內容,包括醫療保險、新農合、公共衛生、區域衛生以及第三方機構。
主數據是數據之源,是醫院數據資產管理的核心,是實現醫院信息化和數字化的重要基礎。主數據項目的成功實施,提高了醫院對主數據的管理能力,也能夠充分挖掘、有效利用醫院數據資產。在今后開展信息化建設時,將持續深化主數據建設,大力推進全院數據治理,切實提升數據質量,賦能醫院高質量發展。