陸軍軍醫大學第一附屬醫院醫學大數據與人工智能中心,重慶400038
我國許多醫院經過幾十年信息化發展,積累了大量的臨床診療數據,這些數據都是很具有醫學價值的,但受困于當時技術的發展,這些數據在管理和使用上還不夠規范和完善。近年來,隨著大數據技術的不斷發展成熟,醫療衛生數據也符合大數據的特點,醫院構建大數據平臺能夠將這些數據進行有效匯聚和利用,以大數據分析和治理為基礎,為醫院提供決策支持[1]。
大數據平臺將數據進行匯聚和治理后,如果不能找到有效的方法和工具對數據進行分析和展示,那么沉淀在醫院里的海量數據將會失去它的價值。所以,如何利用可視化技術,將醫療數據以更科學的方式展示出來,為醫院管理層和醫護工作者提供決策支持,提升診療效率,是當前在醫院信息化的建設過程中需要重視的一環。
醫療大數據是指個人從出生到死亡的全生命周期過程中,因為門診、住院、隨訪、體檢等所產生的醫療數據。通過對醫療大數據的分析和研究,可以分析出存在的問題,挖掘出診療關系圖譜等重要價值,為醫療決策提供支持。醫療大數據的來源類型如圖1所示。
電子病歷數據是患者就醫過程中所產生的數據,是診療過程中最全面和最有價值的數據,也是醫療數據最主要的產生地。電子化的診療病歷方便了病歷的存儲和傳輸,但是并未達到進行數據分析的要求,大約80%的醫療數據是自由文本構成的非結構化數據,通過醫學自然語言理解技術,將非結構化醫療數據轉化為適合計算機分析的結構化形式是醫療大數據分析的基礎[2]。例如,在血液病中,我們首先抽取兩個關鍵詞“白血病”“貧血”作為類別疾病,其次將這兩種疾病相關的癥狀,如:頭暈、發熱、貧血、骨骼疼痛、腸絞痛等提取出來,最后利用提取出來的詞匯做一個矩陣分析,通過結構化和歸一化處理,利用接口和醫院系統對接,只要有相似的描述即可給醫生進行提示,給出如診斷等可視化圖形比例供醫生參考[3]。

圖1 醫療大數據類型
醫院檢驗機構和第三方醫學檢驗中心均產生了大量患者的診斷、檢測數據。我們可以利用這些檢驗數據,搭建基于大數據平臺的分布式系統構建可視化后的LIS數據,提升檢驗數據應用效率。例如,我們可以設計一套以病人為導向的LIS數據可視化系統,首先設計一個新的元素體,包括:元素號、樣本號、檢驗名稱、檢驗時間、檢測值、異常值等幾個變量;其次,設計一個人體部位映射對象XML文件,將臨床檢驗數據與人體部位相對應,形成節點映射表,最后形成以病人為單位的數據存儲在同一個映射對象文件中。醫護人員可通過系統查詢到病人檢驗數據可視化的變化圖形,以此掌握病人病情的變化[4]。
醫學影像大數據,是由DR、CT、MR等醫學影像設備產生所產生并存儲在PACS系統內的大規模、高增速、多結構、高價值和真實準確的影像數據集合[5]。影像數據增速快,標準化程度高,數據量非常龐大,但標準化、格式化、統一性是最好的,我們可以轉換一種形式更直觀地查看影像數據。例如,我們可以獲取影像設備生成的影像數據,這些數據包括影像圖片、患者信息、檢查描述、檢查結果、檢查時間等,然后將這些數據進行整合,再把所有整合的數據進行格式轉換,并存儲于大數據平臺中;最后,醫護工作人員通過終端進行數據訪問請求,將影像信息以一種圖表化的形式直觀地呈現在醫護工作人員面前[6]。
醫院費用和成本數據類型多、來源廣,特別是后期在DRGs按疾病診斷相關組付費模式中,需要詳細的成本數據核算,更需要對這些費用數據進行可視化的分析和研究。通過大樣本量的測算,建立病種標準成本,加強病種成本核算和精細化成本管理。費用的可視化展示可選維度較多,例如:我們可以選取病人、科室、醫生、藥品、診斷或是疾病為藍本設計相關可視化圖表。例如,我們就以某一個病種為藍本,通過建立它的關聯性,提取出如科室、用藥、診斷、治療難度等各種相關信息,不僅能將各科室的病人費用進行直觀比對,還能體現出收治難度與費用額度的正反比關系[7]。
通過構建大數據平臺,將來源及格式多樣的數據進行匯聚,通過平臺對數據進行清洗和治理,利用可視化技術將數據價值進行展示,更加直觀地為醫院和醫護人員提供分析和決策支持[8]。下面,我們分別以醫生和科室為角度,對其相關數據進行可視化分析和研究。
進行一個可視化任務時,首先我們要分析我們這次可視化的出發點和目標是什么:“我們遇到了什么問題”“要展示什么信息”“最后想得出什么結論”“驗證什么假說”等。數據承載的信息多種多樣,不同的維度呈現的展示方式也會有差別。只有想清楚以上問題,才能確定我們要過濾什么數據、用什么算法處理數據等。其次我們要分析數據,這是至關重要的一步,因為每次可視化任務拿到的數據都是不同的,數據類型、數據結構均有變化,數據的維度也可能成倍增加。最后就是把之前的分析和設計付諸實踐,在制作過程中,再不斷調整需求、不斷地迭代(有可能要重復前兩步),最后產出我們想要的結果[9]??梢暬鞒倘鐖D2所示。

圖2 數據可視化流程
醫生是醫院的核心,他們的相關指標數據對于醫院的發展具有很高的參考價值,能夠為診療效率和醫療質量的提高提供最直觀的展示[10]。醫生的數據承載的醫療信息多種多樣,從不同的維度就會有不同的側重點。在展示之前,我們就需要設計好:過濾什么數據、展示什么數據,以此來提升展示的價值[11]。
例如,我們以一位醫生為例,我們可能不關心他創造的收益,但我們對他的醫療救治情況很關注,那我們就以他的收治情況為維度,通過對他的看診人數、住院管理人數、搶救人數、收治病癥、治愈率、搶救成功率、質控扣分等,多角度分析出他的就診效率和救治難度,得出他的醫療質量扣分主要存在哪些方面,能夠幫助醫生后期采取有針對性的措施進行加強,提升診療效率和醫療質量安全[12]。同時,因為治愈率、搶救成功率與收治病癥難度也有關系,不能只通過治愈率和搶救成功率評價醫生,還必須加入收治病癥難易程度作為關聯參考,經過可視化的關系圖譜分析和展示,直觀呈現的數據才能給科室和醫院領導提供最客觀的決策支持[13]。醫生數據可視化截圖如圖3所示。

圖3 醫生數據可視化截圖
科室數據是醫院各項指標考核的基礎,臨床科室產生的數據對醫院管理具有很高的參考價值??剖覕祿煌卺t生,它的可視化分析側重點更加傾向于管理和效益,能夠為醫院即將實施的DRGS提供一定的數據支撐。
例如,我們以一個科室為例,以收治病種和費用產生為維度,通過對科室收治病人人數、病種、費用、科室藥品和耗材使用的相關費用、質控等,為科室的醫療質量提升提供參考依據。同時,通過藥占比和耗占比分析,橫向與其他科室比較,找出問題與差距,有針對性的降低使用比例,滿足醫院管理規定[14]??剖裔t生工作量、開藥比例的統計和分析,能夠幫助科室提升質量管理和規范績效管理。科室數據可視化截圖如圖4所示。

圖4 科室數據可視化截圖
大數據可視化分析能夠幫助醫生特別是經驗欠缺的醫生更有針對性的看診,因為有些患者在與醫生溝通和描述上可能會有誤差,導致診療出現偏差[15]。通過系統可視化的數據分析,建立完整的關聯性,使醫生對患者所有醫療數據一目了然,即使病患的病情超出醫生經驗范圍,也能協助醫生更有針對性地看診,和病患的溝通也更加方便,避免出現誤診,在可視化分析后,醫生就診平均人數由之前的看診40人/d提升至60人/d,有效提升看診效率。看診趨勢圖如圖5所示。

圖5 2019年某醫生每月某個周一看診人數
醫院以前的數據只有在做報表或是臨床科研的時候才會被使用,而且由于底層醫療數據的規范性不強,導致數據質量較查,傳統數據庫方式查詢效率也較低[16]。通過醫療大數據平臺對各種類型的醫療數據進行清洗、治理,運用切詞、結構化、歸一化等技術手段進行處理,提升了醫療數據質量,在對臨床醫療數據進行分析時,能夠給醫院工作人員更直觀的可視化圖表分析界面,將醫療數據使用效率由原來的10%~30%,提升到80%,提升效率明顯。具體使用效率趨勢圖如圖6所示。

圖6 醫療數據使用率
醫院以前還停留在普通的信息化項目建設上,通過大數據平臺架構建設,將醫療數據進行整合和處理,完成數據可視化應用,為醫院提供決策支持、診療輔助、科研學術等支撐,將醫院信息化水平提升為智慧化建設水平,為醫院醫療建設的飛速發展和數據應用打下堅實的基礎[17]。
基于大數據平臺的可視化技術的研究與應用,能夠充分利用醫院的醫療數據,將數據以可視化的圖表形式進行展現,實現數據有價值的分析,一眼發現問題,多角度定位問題,分析原因,找到規律,掌握趨勢,為醫院管理者和醫護人員提供決策支持,增強對數據的洞察力和決策力,提升診療效率[18-19]。隨著大數據和人工智能等前沿技術的不斷發展,數據可視化能夠不斷地完善知識積累和智能學習[20],相信未來該技術在醫院智慧化建設方面具有一個很好的應用前景。