賀曉松 胡川麗
1.重慶工程學院大數據與人工智能研究所;2.陸軍軍醫大學第二附屬醫院
隨著經濟的迅速發展和信息技術的變革,大數據正在改變全球絕大部分行業,醫療領域也不例外。本文概述了大數據概念、特征和醫療大數據的發展,總結了大數據在醫療領域的應用現狀,并對大數據應用于醫療領域的挑戰和展望作了深入探討,旨在為我國醫療大數據的發展提供參考和借鑒。
隨著信息化進程的不斷加快,醫療健康領域逐漸進入大數據時代。大規模、多渠道、多樣的數據可為醫療護理實踐提供新的方法和思路,在提高醫療實踐水平、醫療數字化管理、臨床決策支持和養老服務等多個領域具有應用價值。然而,目前由于區域經濟發展不平衡等原因導致的醫療資源分布不均,通過更加有效地利用醫療大數據,推進跨區域、跨機構、跨部門的健康醫療數據共享,充分發揮數據資源潛力、激活數據資源價值成為新的關注點[1]。另外,醫療大數據也面臨著醫療信息數據安全和隱私保護不當、數據質量參差不齊的挑戰,本文將深入探討這些問題。
大數據(Big Data)是指使用傳統軟件或基于互聯網的平臺無法管理的大量數據,它超越了傳統使用量的存儲、處理和分析能力[2]。國際數據中心(International Data Center,IDC)將大數據歸結為“4V”特點的數據資料[3]:容量(Volume)、多樣性(Variety)、速度(Velocity)、準確性(Veracity)和價值(Value)。醫療大數據保留了大數據的特點外,額外兼具有鮮明的醫療行業特征,即時效性、冗余性、不完整性、隱私性的特點[4]。
醫療大數據是人類與醫療及生命健康相關的活動過程產生的與健康醫療相關的數據集合。早期,醫療相關的大部分數據都以紙質印刷形式而非電子信息化方式存儲,但隨著強大的數據存儲,計算平臺,及移動互聯網的發展,醫療數據也向數字化方向快速發展。
我國醫療大數據伴隨著國家政策的推動也迎來了快速發展的階段,2015 年8 月國務院發布了《促進大數據發展行動綱要》,指出鼓勵和規范有關企事業單位開展醫療健康大數據創新應用研究,構建綜合健康服務應用[5]。2016 年6月,國務院辦公廳印發了《關于促進和規范健康醫療大數據應用發展的指導意見》,指出要大力推進不同醫療系統數據的融合和共享,促進醫療大數據安全規范和創新應用[6]。2016 年8 月國務院印發《“健康中國2030”規劃綱要》,提出將大數據醫療及其產業經濟發展成“十三五”時期醫療體系及醫療服務最高戰略[7]。2018 年國家衛健委發布《國家健康醫療大數據標準、安全和服務管理辦法(試行)》,就加強標準管理、安全管理、服務管理,為醫療大數據的實施提供了政策指導。
醫療大數據主要來源分為如下4類[8]:(1)醫療機構的患者就醫數據和運營系統數據,如病種治療和成本數據、醫藥、耗材、采購管理數據等,醫院信息系統(HIS)、電子病歷系統(EMRS)、醫學影像存檔與通信系統(PACS)等;(2)臨床醫療研究和實驗數據,主要是實驗中產生的數據,也包含患者產生的數據,沒有嚴格的邊界區分;(3)制藥企業研發數據,藥物研發是一個復雜漫長的過程,臨床試驗是驗證一個藥物有效性和安全性的最佳方式,大量臨床試驗過程產生的數據;(4)可穿戴設備產生的數據,隨著移動互聯網技術的發展和穿戴設備核心硬件技術的成熟,各種健康設備通過云端上傳方式收集用戶生命體征數據,如血壓、體溫、心電、脈搏等。
醫療大數據的研究和應用有如下幾方面的現實意義[9]:(1)提高診斷準確性。醫生利用醫院共享的大數據系統,能夠分析醫院積累的大量臨床數據,結合目標患者信息,能夠及時、有效地為患者選擇治療方案;(2)減少醫患矛盾。通過建立移動護理信息系統,實現病人護理文檔的電子化,將醫生、護士、其他醫務人員工作閉環執行,使患者得到有效治療;(3)節約醫療資源。通過云計算技術,將信息資源集成和共享,降低成本的同時提高效率;(4)個性化醫療。通過大數據挖掘技術,對個體差異性特征在普遍特征數據分析的基礎上進行優化分析,進而輔助以醫療服務子單元,滿足個性化醫療服務要求。
在醫療健康大數據越來越多樣化的背景下,大數據技術也逐步從前沿技術轉變為現實應用。無論是生產生活還是醫療健康行業,大數據的應用場景也越來越豐富。
醫療信息化即醫療服務的數字化、網絡化、信息化[10]。早期的醫療記錄的常見做法是以手寫筆記或打印報告的形式,隨著計算機系統的出現及其潛力,醫療保健系統中所有臨床檢查和病歷的數字化已成為當今的標準和廣泛采用的做法。由Murphy、Hanken、Waters 定義的電子健康記錄(Electronic Health Records,EHR)是用于患者過去、現在或未來的身體/心理健康或狀況有關的任何信息的計算機化醫療記錄系統,方便醫療人員訪問患者的醫學診斷、處方、與已知過敏相關的數據,提高醫療識別和治療效率[11]。與之類似,電子病歷(EMR)、個人健康記錄(PHR)、醫療實踐管理軟件(MPM)和許多其他醫療數據系統共同為提高醫療質量、服務效率和降低成本以及減少醫療錯誤提供有力保障。
在傳統的醫療診斷主要依靠醫生個人經驗和目標患者的信息,局限性很大,由于患者的個體差異,同樣診斷治理方式應用在不同患者身上的效果也可能不同。為此,可借助大數據建立一個智能診斷系統,如果將所有患者的就診信息整合,運用數據挖掘技術分析患者信息,提高診斷準確率[4]。另外,可利用自然語言處理技術對電子病歷文本進行分析,圖像智能識別技術對醫學影響建模,實現智能診斷。這能促進診斷更加科學化、合理化,提高診斷準確率,有效降低誤診率。
在醫療科研領域,包括治療方案的療效判斷、新藥研發、器械研制、疾病危險因素分析等各類臨床科研[4]。運用大數據技術對各種數據進行篩選、分析,可以為科研工作提供強有力的數據分析支持。如:(1)探索疾病關聯關系。將離散數據進行整合與規范化,對大量、關聯性的疾病數據進行分析整理,構建醫療知識圖譜,可以探索疾病的關聯關系;(2)進行臨床預測。通過數據挖掘技術對各類疾病的癥狀,監控疾病治療效果數據進行建模,預測處于早期癥狀的疾病的發展趨勢[12]。
大型醫院已經基本實施了信息化建設,但相應的數據資源仍然分散在不同的數據池中,互不相連,形成信息孤島,導致醫院之間無法共享護理數據,全社會衛生系統的相關數據無法共享和有效整合,進而影響醫療資源數據池的形成。
掣肘健康醫療數據共享的關鍵問題主要體現在管理機制和技術標準兩個方面,因此亟需解決以下2 個問題:(1)由于我國經濟發展的地區性差異,不同地區和級別的醫療機構自成體系、自建標準,不同類型醫療機構間缺乏充分的跨業務數據共享,因此應該健全協作機制,調整利益沖突并通過管理手段達成共識;(2)醫療大數據本身多源異構性的特點,存在大量結構化、半結構化、非結構化數據,信息標準并不統一,按照標準規范建立起跨機構甚至跨區域的數據共享平臺及數據交換機制[12]。
大數據在促進數據傳輸和共享的同時,也帶來了新的挑戰,數據隱私保護就是其中之一[12]。我國對于醫療領域隱私保護的立法及政策法規的制定處于起步和發展中,盡管已有相關法律法規對保護患者隱私提出了相應的要求和規定,但是大部分規定缺乏可操作性,僅規定了對患者的保密醫務,而沒有規定違反該義務的后果,不利于具體司法實踐操作,而且大多數條款對患者信息權利的具體內容、權利保護的方式等都沒有規定。大數據時代,要搞數據共享,這在很大程度上受到嚴格的數據保護的限制;只有保障大數據的共享和保護,才能最大限度地發揮醫療大數據的潛在價值。
為了能夠最大程度上保護公民的隱私安全,需要加強對數據的保護工作。首先在法律的內容上,應盡快制定相關政策法規;除完善相關配套法規標準外,也要在執法和司法過程中強化保護患者隱私與個人信息,嚴格要求數據安全保障義務與責任,堅持知情同意原則,數據的收集、存儲、使用、分析等行為應獲得數據主體的知情同意,原則上應獲得明示同意;其次在治理手段上,在強化隱私保護技術對個人隱私保護效果支撐作用的同時,致力提升數據加工者合法合規使用數據的自覺意識,形成注重數據倫理安全的良性氛圍,倡導公民形成正確的個人隱私觀。
醫療數據在大部分應用場景中,對數據的質量都有比較高的要求。醫療數據質量風險可能導致一系列問題:(1)即時接受診療的患者因為醫生收到了錯誤的基本疾病信息受到不合理的治療甚至承擔安全風險;(2)醫療科研有可能因為出現的錯誤數據而得到錯誤的結論,輕者會導致整個科研過程失敗,耗費人力財力,重者可能會錯誤引導醫學理論發展方向,影響整體醫學發展進程。
為了提高醫療數據的準確性、真實性、適用性,須建立一套標準化數據治理模式,各級醫療機構在開展醫療數據采集、存儲、整合、分析等工作的時候,以相同或相近的標準,確保內容準確、術語規范、信息數據接口一致等[13]。此外人工智能技術也正在應用于醫療數據的提取和識別過程中,通過自然語言處理、人工智能、OCR 等技術直接識別電子病歷系統并完成有效數據的提取,這一過程的實現將有效減少醫療數據提取過程的人力耗費且有可能通過機器學習提高數據的準確性。這些醫療數據提取的自動化策略必然是醫療數據提取的重要未來方案,對于解決當下的醫療數據準確性安全性風險意義重大。
引用
[1] 石晶金,于廣軍.健康醫療大數據共享關鍵問題及對策[J].中國衛生資源,2021,24(3): 223-227+237.
[2] 侯黎莉.護理信息化的發展及臨床應用[J].上海護理,2022,22(5):72-75.
[3] 大數據戰略重點實驗室.大數據概念與發展[J].中國科技術語,2017,19(4):43-50.
[4] 戴明鋒,孟群.醫療健康大數據挖掘和分析面臨的機遇與挑戰[J].中國衛生信息管理雜志,2017,14(2):126-130.
[5] 中華人民共和國國務院.促進大數據發展行動綱要[J].成組技術與生產現代化,2015(3):51-58.
[6] 國務院辦公廳.國務院辦公廳關于促進和規范健康醫療大數據應用發展的指導意見[EB/OL].(2016-01-21)[2021-02-20].http://www.gov.cn/gongbao/content/2016/content_5088769.htm.
[7] 中共中央國務院印發《“健康中國2030”規劃綱要》[EB/OL].(2016-10-25)[2018-03-22].http://www.gov.cn/zhengce/2016-10/ 25/content_5124174.htm.
[8] 楊朝暉,王心,徐香蘭.醫療健康大數據分類及問題探討[J].衛生經濟研究,2019,36(3):29-31.
[9] 李宜瑾,崔豫然.醫療大數據研究面臨的機遇與發展趨勢[J].信息與電腦(理論版),2019,31(19):29-31.
[10] 汪萌.醫療信息化助力醫院發展[D].南京:南京郵電大學,2017.
[11] Miriam Reisman.EHRs:The Challenge of Making Electronic Data Usable and Interoperable[J].Pharmacy and Therapeutics,2017,42(9):572-575.
[12] 王海星,張靚,楊志清,等.醫療大數據在臨床科研中的應用探討[J].中國醫院,2020,24(7):63-64.
[13] 葉清,劉迅,周曉梅,等.健康醫療大數據應用存在的問題及對策探討[J].中國醫院管理,2022,42(1):83-85.