王通 對外經濟貿易大學統計學院在職人員高級課程研修班學員
健康醫療大數據是指與健康醫療及患者相關的數據,包括了患者診斷前后所有流程產生的數據,甚至可以說貫穿于患者的全生命周期。一般醫療方面的數據多事來源于醫院的信息管理系統、制藥企業在研發藥品過程中收集的患者數據及試驗數據、醫院生命體征監護設備所記錄的設備、臨床決策支持設備(例如超聲、胸透等)記錄下的數據等。由于醫療大數據的特殊性,學者克托· 邁爾 - 舍恩伯格提出了醫療數據的四個特點:Veracity(真實)、Real time(實時)、Redundancy(冗余)及Privacy(隱私)。
其中Veracity(真實)是指醫療數據的來源一般是源于真實的生活,同時密度較低。例如在研發藥物時收集與產生的海量數據,但是一般成功的藥物研發所需要的數據是極大的,最終有效的海量數據也只是有價值的數據中的一小部分。
醫療數據的Real time(實時)特點是指醫療數據的產生速度非常快,并且也會在較短時間內加以變更。
醫療大數據Redundancy(冗余)是指健康醫療相關的數據很大一部分都是相同的或者相似的,被相同的記錄方式加以記錄,例如患者針對某種疾病展開的診斷及記錄在大多數情況下都是相同的。
最后Privacy(隱私)是指在大數據信息時代,信息很容易被泄露,醫療數據同樣如此,但是醫療數據中包含大量患者隱私信息或者重要的臨床試驗數據,為此對醫療大數據的安全性投入高度重視,保證數據的隱私性是非常關鍵與必要的。
大數據在醫療健康行業中的應用主要體現在對醫療數據的分析與共享,通過應用大數據分析架構與大數據挖掘分析軟件,實現對大量醫療數據的收集,接著對醫療數據進行分析與處理,這也是醫療行業應用大數據技術的關鍵,主要目的就在于提取最有價值的信息,為決策者提供數據基礎。大數據分析技術主要就是處理好大數據與分析技術之間的關系,將二者有機結合,挖掘出醫療數據所潛在的最大價值,并且在實際診斷與生產中有效應用。大數據的分析方法主要包括預測分析、數據挖掘算法、回歸分析、因子分析、相關性分析等。當前在大數據的分析工作中可以選擇多種分析工具,包括數據統計分析、數據可視化、人工智能等分析工具。
在大數據信息時代,云計算、大數據、互聯網技術等多種高科技技術與醫療健康行業逐漸融合,逐漸滲透入醫療健康行業中的各個領域,包括醫療器械、健康服務、醫療服務、新藥研發等各個方面,下面將對大數據在醫療行業中的具體應用進行說明。
在傳統的藥物研發環節所需要投入的成本較高,承擔更大的風險,研發周期較長,但是成功率仍然非常低。在藥物研發的各個環節,包括藥物篩選、立項、臨床及上市等環節都需要以大量的數據分析為支撐。大數據在藥物研發的應用能夠提供充分的數據,優化藥物研發流程,合理分配資源,提高藥品研發效率,縮短周期,降低成本,提高藥品營銷精準率,降低藥品生產及使用風險。
當前醫療行業所應用的大部分器械都非常本中,也無法對患者進行隨時監測。隨著大數據技術的應用,就能夠實現醫務人員攜帶便攜式的器械對患者進行實時檢測,并且實現檢測收據的收集與處理,通過信息技術對數據進行篩選,對患者健康狀況進行判斷與追蹤。大數據的應用將有效推動便攜式醫療企業的快速發展,例如飛利浦醫療推出的便攜式B超設備“lumify”,為患者檢測提供了更為便利的條件。
當前我國各個醫院所提供的醫療服務存在著信息不共享、結果不互認、服務難以協同的問題,這導致患者的醫療成本高,治療效果不佳,影響醫療服務效果。而大數據在醫療行業的應用,能夠針對患者建立全國所有醫院通用的電子健康檔案,在檔案中包括患者的基本信息,以往檢查數據,用藥記錄等信息。通過建立準確的醫療足跡,有利于建立一體化電子健康服務體系,為患者提供高效、準確且便捷的醫療服務。
我國人民對于個人健康的關注程度相對較低,尤其是經濟較為落后的地區,而針對個人健康所提供的服務也過于單一,主要是通過年度體檢發現個人健康異常,但是由于每年才進行的一次體檢由于時間跨度較大,缺乏系統性,無法覆蓋各個地區,導致無法及時發現與應對重大個人重大疾病。但是大數據時代,可以通過便攜式醫療器械對個人健康狀況進行實時監測,進一步結合個體的生活形態、飲食習慣、家族病史、遺傳特性等基本信息與監測結果相結合,實現對個體健康的預測及管理,提供更為精確的個人健康管理服務。
當前我國醫療行業主要是:看病難、看病貴及病難治三個難題上,通過大數據信息技術的應用有利于構建區域醫療機構聯合系統,最大限度的實現優質醫療資源的共享,實現患者治療的互相聯通,有利于推動智慧醫療、遠程醫療、移動醫療等新型醫療服務體系的應用及發展。
當前大數據在醫療體系中的研究與應用仍然是以歐美等發達國家為前沿,并且在醫療行業取得了較好的效果。而我國大數據在醫療行業中的應用仍然處于起步階段,除了大型高水平的醫院建立了信息數據平臺,在中小企業或者地方衛生機構仍然未認識到大數據應用的重要性。當前,我國醫療體系中的大數據技術應用現狀如下:
從事醫療健康的企業與醫院構建了O2O協同服務平臺,實現對診斷前的健康數據,診斷中的治療數據以及治療后的康復指導數據的收集及處理,建立全生命周期的閉環管理。例如東軟企業打造的醫療生態系統,通過患者數據的廣泛收集為醫療服務提供支撐,為健康管理、疾病診斷、治療方案、院后康復等服務提供數據基礎。
當前企業與醫院之間建立了數據戰略合作,構建醫療數據研究科室或者研究院,與醫院合作展開醫療大數據技術開發與應用研究。例如華為技術公司與鄭大附一院合作圍繞醫療數據的采集、分析、處理、存儲與應用的服務全過程進行研究,針對互聯網醫療、遠程醫學監測設備、醫療數據等相關理論及應用技術展開深入研究與實踐,從而實現大數據在醫療行業中的推廣。
為了推動醫療行業的進一步發展,政府的支持非常關鍵,當前企業、政府與醫院相互合作,建立了區域醫療平臺,基與大數據技術在該區域內展開醫療咨詢與監測服務,例如萬達信息與上海計生委相互合作推出了上海健康云平臺,建立了新型的健康管理模式,在心腦血管疾病、腦卒中、腫瘤等疾病治療系統中推廣了健康云服務。
雖然我國愈發重視大數據在醫療行業中的應用,但是仍然存在較多阻礙問題,主要如下:
我國大數據技術都處于起步階段,從事大數據分析的技術人員仍然都是新手,缺少相關理論基礎,實踐經驗更是非常少,在醫療行業中應用大數據技術的專業人員還必須要同時掌握醫療知識與大數據知識基礎,為此專業性人才更是非常欠缺的。另外,我國大數據人才培養體系欠缺,尤其專業院校展開大數據人才培養的也較少,為此大數據應用于醫療行業的過程中嚴重缺乏技術人員。
當前針對醫療健康行業實際出現了非常多的數據,但是由于缺乏數據分析技術,無法對數據進行深度挖掘與分析,導致醫療信息無法得到充分發揮。當前我國的數據分析軟件在數據收集、處理、分析及存儲等方面都需要加強研究。
大數據在醫療行業中的應用水平更大程度上取決于數據的應用情況,我國衛生管理機構缺乏信息化系統的構建,從而導致行業內部缺少統一的信息化標準,從而導致各個機構形成了“信息孤島”,導致了數據分享效果較差。另外,將海量的醫療信息及數據傳輸到信息平臺上對于網絡的挑戰是非常大的,無法實現數據的高效存儲與維護,更無法有效應用于醫療行業。
信息時代最難以解決的問題就在于信息及隱私的保護,為此如何在大數據應用于醫療行業中的過程中如何更好的保護個人隱私及信息難度非常大。為此,從事醫療健康行業的工作者在應用大數據的過程中要時刻警惕信息泄露這種潛在問題的發生。
人才是第一生產力,在當前也被視為行業核心競爭力。對于大數據應用于醫療行業,所需要的人才必須要同時具備醫療知識、計算機知識、數據統計知識及管理知識等綜合性的人才。為此,國家要加強專業人才的培養,包括基礎理論知識及實踐性俱佳的人才培養體系。醫療部門與高校或者科研結構相合作,共同培養綜合性的專業人才。
最佳的大數據生態環境是在數據有效收集與整合的基礎上實現數據共享,為此對海量的醫療數據進行科學合理的處理從而營造良好的數據生態環境是非常重要的。為此就需要國家醫療健康機構及科研機構針對大數據在醫療行業中的應用特點制定發展規劃及具體實施計劃,規范行業的標準制度,將大數據充分融入到醫療行業的各方面實際應用以及行業標準。
我國在大數據處理方面缺少先進的軟件及算法等技術,與國外當前廣泛應用的Hadoop等大數據處理軟件相比較,我國的數據平臺無法滿足大數據在醫療行業中應用的要求。為此,開發先進的數據軟件及算法是亟待解決的問題,具體包括多源異構大數據處理平臺、優化分布式存儲系統、大數據計算模型、軟硬件等方面。當前我國已經出現了科研機構針對大數據計算展開了深入研究,例如東北大學的王國仁教授所主導的“海量異構數據集成管理與分析技術及應用”研究項目,在大數據管理、分析、集成等方面的關鍵問題方面取得了一定進展,實現了異構大數據的收集、管理及分析設計出了一個較為完整的人機交互數據集成體系,成為國際上較為先進的分布式極限學習機數據分析技術,對于推動我國大數據技術的發展起到了關鍵作用,我國要加強該類型科研項目的深入開展。
醫療大數據由于數量極大,結構更加豐富多樣,為此加強數據加密難度較大,針對中小規模數據加密的技術已然無法滿足大數據的加密需求,為此需要針對大數據特點開發科學有效的數據加密技術。在保證多用戶同時使用效率的基礎上,實現用戶數據的充分隔絕。另外,政府還需要加強大數據保護的相關法規政策,加強對用戶信息管理的保護制度,從而創造一個良好的數據共享生態環境。