安文琛
(廣州市第一人民醫院,廣東 廣州 510180)
大數據在現代化醫院建設中的應用
安文琛
(廣州市第一人民醫院,廣東廣州510180)
醫院每天都會產生海量的數據,充分運用大數據技術在數據中心、商業智能、醫療科研管理等方面的作用,對醫院大數據進行整合、發掘與利用,為醫院管理者提供決策依據,將可以極大提升醫院的核心競爭力。
大數據;數據中心;商業智能;醫療科研管理
這是一個信息爆炸的時代,也是一個概念爆炸的時代。當業界還在探討物聯網和云計算等前沿概念的時候,一些國際IT巨頭已經聚焦于物聯網和云計算產業背后的大數據,并努力挖掘其潛在價值。醫院每天產生海量的數據,大數據應用技術將推動現代化醫院更迅猛、更高層次地發展。能否抓住“大數據”所帶來的機遇,將成為醫院提升核心競爭力的關鍵環節[1]。
全球數據量每兩年大約增加一倍,根據國際數據資訊(IDC)公司監測,估計到2020年,全球將擁有35ZB的數據量,這些數據85%以上以非結構化或半結構化的形式存在。IT界用“BigData(大數據)”來形容這個問題。早在上個世紀80年代就有美國人提出來“大數據”這個名詞。2008年9月,文章“Big Data:ScienceinthePetabyteEra”在《科學》雜志發表,“大數據”這個詞開始廣泛傳播[2]。
大數據中的數據其數量級以PB(1PB=1024 TB)或EB(1EB=100萬TB)或更高計算,它們包括結構化的、半結構化的和非結構化類型,其規模和復雜程度超出了以往。在數據管理中,一方面數據量和業務量雙向增長,更重要的另一方面是現代企業向全社會互聯互通的交互式云計算業務模式的逐漸演進。傳統的數據管理方式在容量、效率、擴展性上存在瓶頸,為了克服以上瓶頸,現代的數據管理需要達到以下目標:海量容納能力,多類型,多結構,高負載,高可用,高可靠,低成本。
“大數據”的“大”不僅體現在數量龐大,更重要的是數據發生質的變化,即數據具有網絡化和交互性特性。到目前為止,大數據沒有統一的定義,比較流行的是4v定義:即有以下四個特征的數據稱為大數據,這四個v特征分別是Volume,Velocity,Variety,Value。其中,Volume代表容量大,Velocity代表變化速度快,Variety代表種類和結構類型多,Value代表價值密度低。從數據形態出發,大數據的來源主要有社交媒體上的用戶評論,互聯網上客戶交互的行為數據,傳感器等機器數據等。醫療是一個擁有海量大數據的行業,而醫院則是具體的承載單位。
2.1來源復雜
從數據來源來看,醫院大數據主要來自以下8個方面:
1)社會化媒體、互聯網及移動互聯網、電子商務;
2)傳感器網絡、鏈接設備、智能終端、實時監控設備;
3)商業智能(BI)、醫院輔助決策系統;
4)計算機、平板電腦、手機、其他移動設備、移動存儲;
5)物聯網、貨幣聯網、RFID、GPS、GIS等醫院信息技術的應用;
6)云計算、第三方數據處理技術、第三方平臺的應用;
7)專業研究報告、行業資訊、行業活動記錄;
8)其他大交互、大交易數據來源。
2.2類型繁多
醫院的大數據類型呈現出多樣化特點,可以描述如下:
1)人的行為信息、習慣信息、偏好信息、交互數據等;
2)Web文本數據、流量分析數據、電商交易數據、使用者網上活動數據等;
3)各類設施設備采集的數據如傳感器讀數、運營數據、實體數據、醫院信息、儀表讀數、監控視頻數據等;
4)醫院內部基干類系統和信息類系統所采集或處理的各類數據如輔助決策信息、運營數據、產品數據、供應鏈數據、人力資源數據、財務數據、病人數據、呼叫記錄、市場數據等;
5)計算機使用數據和移動設備使用數據等;
6)基礎地理位置信息、RFID讀取信息、GPS映射數據、圖像文件、醫院信息、時間與位置數據、貨幣數據、高分辨率影像、矢量、遙感及動態監測數據等;
7)CRM、KDD、DWH、流量監測、查詢應用、分析器等應用數據;
8)報告資訊、科研數據、調研數據、公共數據、公共信息。
2.3結構多維,格式多樣
醫院的大數據,可以從多個維度進行解構:
1)結構化數據、半結構化數據、非結構化數據。醫院的大數據既包括存儲在數據庫里的結構化數據,也包括日志文件、XML文檔、JSON文檔和電子郵件等半結構化數據,而更多的數據類型是辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等非結構化數據,半結構化、非結構化數據約占大數據總量75%~85%。
2)內部數據與外部數據。醫院的大數據既有來自醫院經營的內部交易數據、CRM數據,也有來自其他數據源的外部數據。醫院的大數據兼具公共、私密二重屬性。外部數據的公共性特征比較明顯,而內部數據由于和行業標準和商業機密密切相關,因而具有私密性。
3)與數據結構的多維特征相對應,醫院大數據的格式也是多樣的。除了傳統的紙質文件、檔案、報表、表格、記錄、信函等之外,更多的是以數字數據存在的Web文本、視頻、短信、音頻、視頻、郵件、存儲信息、配置文件、符號、圖片、檔案等。數據格式的多樣性和互不兼容、數據訪問的隨機性,為數據的采集、存儲、分析、應用帶來了困難。
在《大數據時代》一書中,作者提出“大數據的核心就是預測”。信息使用者通過收集大量的數據,對其進行加工處理,建立起數據的內在發生發展規律,通過計算分析所獲得的有價值的信息成為企業預測顧客喜好、潮流趨勢、企業發展方向等事物的有力依據,對企業管理者的決策有著極大的幫助。從這里可以看出信息就是一種資產,對這種類型的資產來說,對其進行加工精煉才是它的增值方式。具體到醫院的實際情況,就是研究如何應用醫院產生的海量數據,提取出有用的信息為醫院的管理者提供決策依據,提升管理水平與服務質量,具體有以下這些表現形式:
3.1數據中心
醫院信息化建設在保障與支持醫藥衛生體制改革順利進行、保證醫院可持續發展等方面的作用日益顯著。由于大型公立醫院信息化建設時期較長,各業務信息子系統分散,各數據庫模塊信息耦合困難,勢必會造成實時抓取數據真實性差、穩定性差、關聯性差。因此,通過大數據集成平臺的建設,能夠有效采集數據、高度集成數據、實時分析數據,提高數據信息的準確性和可利用性,實現醫院內部各信息系統之間的數據整合、信息共享和流程協同,提高醫院管理水平[3]。
隨著醫療信息技術的迅猛發展及快速更新,信息量日益豐富,單純依靠各個醫療信息系統的歸口信息管理模式已遠遠不能滿足現代化醫院發展的步伐,醫療信息系統的交互與集成研究已經成為建設全面、專業、集成和智能的數字化醫院的迫切需求。
構建以臨床數據倉庫為核心的全院數據中心平臺,不僅可以實現醫院內不同部門的、異構信息系統間的臨床交換、共享、互操作和統一管理,而且能夠將臨床業務和臨床用戶的需求與臨床數據的智能化應用相結合,為醫院提供智能化臨床數據瀏覽的臨床醫生門戶、臨床管理數據分析門戶、臨床科研門戶以及患者健康門戶,實現各類集成業務應用。全面集成的智能化信息系統必將實現醫院“人、財、物”“醫、教、研”基于統一平臺的協同管理,數據倉庫和商業智能技術將使醫院領導者的決策得到真正的支持,有效提高醫院精細化管理水平,保障醫院健康可持續發展。
當前,基于信息集成平臺的建設來實現醫院內部績效的實時管理與評價、提高各管理層級的調控能力與決策水平具有重要發展前景,已成為廣大醫院信息建設的主攻方向。
3.2商業智能平臺
商業智能(BusinessIntelligence)運用數據倉庫、在線分析和數據挖掘等技術來處理和分析數據,它允許用戶查詢和分析數據庫或數據倉庫,進而得出影響醫療活動的關鍵因素,最終幫助用戶做出更好、更合理的決策,最終目的是為決策者提供決策支持將數據變為知識[4]。
隨著醫院信息化的快速發展,信息系統積累了海量的管理與醫療數據,但在信息資源的開發應用方面,普遍存在以下問題:原始信息多、加工整理少;孤立分散多、聯合共享少;為宏觀服務多、為微觀服務少;靜態信息多、動態信息少。如何整合醫院中的各類信息資源,進行有效的開發利用,構建一個以患者為核心,覆蓋廣泛的應用領域,面向不同信息使用者的數據分析平臺就顯得尤為迫切。
商業智能可以幫助醫院的管理層進行快速,準確的決策,迅速的發現醫院業務中的問題,提示管理人員加以解決。但商業智能軟件系統不能代替管理人員進行決策,不能自動處理醫院運行過程中遇到的問題。因此商業智能系統并不能為醫院帶來直接的經濟效益,但必須看到,商業智能為醫院帶來的是一種經過科學武裝的管理思維,給整個醫院帶來的是決策的快速性和準確性,發現問題的及時性,以及發現那些其他醫院未發現的潛在的知識和規律,而這些信息是醫院產生經濟效益的基礎。不能快速,準確地指定決策方針將造成病源流失,不能及時發現業務中的潛在信息等于浪費自己的資源優勢。比如:通過對病人就診數據的分析可發現各類病人的就診高峰時間以及用藥及治療信息,這樣就可進行更有針對性的排班,或向某一類特定的病人提供更具有個性的服務推薦等,這都會為醫院帶來直接的經濟效益。
3.3醫療科研管理
醫療科研管理信息化存在數據共享度比較低,科技產出數據零散不系統,數據質量不理想,信息化數據利用率低等問題。將大數據概念以及技術引入到醫院的科研管理中,對積累的數據進行重新利用,將現有的管理數據轉化為可供使用的知識,以此提高科技管理水平和技術含量,能夠為管理部門決策提供客觀、科學、全面的參考。建立科學、高效的科研管理模式,優化科研資源配置和提高科研計劃項目的管理績效,保障醫療科研事業的良性、健康發展,已經成為當前醫療科研管理體制改革的一項重要內容,大數據方法在這一領域的實施具有廣泛的應用前景[5]。
大數據環境下,隨著數據收集、存儲、分析技術的突破性發展,可以更加方便、快捷、動態地獲得與研究對象有關的所有數據,而不再因諸多限制不得不采用樣本研究方法,相應地,思維方式也應該從樣本思維轉向總體思維,從精確思維轉向容錯思維,從而能夠更加全面、立體、系統地認識總體狀況。對于臨床科研人員,信息需求發生顯著性的變化,研究對象從樣本數據變成全部數據,為疾病全過程研究提供廣度信息展示、個性化信息推送和深度信息互動。
在大數據時代,生物醫學研究模式已由原來的假設驅動轉向數據驅動。大數據研究應關注歷史沉淀數據的挖掘,關注社交媒體與患者就診行為數據,進行更加準確和個性化的患者行為分析,改善就診流程,提升就診體驗。醫院管理、醫院營銷、醫院規劃、醫院戰略、病患滿意度等無不與大數據關聯。通過挖掘這些信息,可以預測醫院市場需求,進行智能化決策分析,從而制定更加行之有效的研究戰略。
大數據分析將為生命機制解讀、醫院管理、個性化醫療帶來革命。在醫學科研領域,信息化環境越來越復雜,使信息化資源由成本單元轉變為利潤單元并助力科研活動,將科研管理由精細化的數字管理引申到趨勢化的數據管理,聚合各種相關數據為科研目標的凝練、科研方向的遴選等提供依據,滿足知識創新需求等方面,這些問題的解決為大數據應用提供了強勁的內生動力。大數據已成為科技發展的競爭戰略,利用大數據進行科學研究和從事科研管理,建立科學、高效的科研管理模式,優化科研資源配置和提高科研計劃項目的管理績效,保障醫院科研工作的良性、健康發展,并將其價值轉化成科研活動的競爭優勢,從而提高創新驅動能力。
越來越多的醫院已經意識到大數據的價值,針對這些數據的各種預測、分析、統計在醫院管理和決策的過程中正扮演越來越重要的角色。能夠更加充分利用大數據的醫院,必將在未來的競爭中占得先機,保持蓬勃的發展潛力。
[1] 王淑娟,石曉宇.大數據應用對現代信息化醫院競爭力的影響[J].現代醫院管理,2015,13(1):68-71.
[2] 林海文.大數據研究綜述[J].電腦知識與技術,2015,11 (26):1-2.
[3] 吳正一,崔迎慧,陸耀,等.以臨床數據倉庫為核心的醫院大數據平臺構建[J].中國醫院管理,2015,35(11):13-15.
[4] 秦芳,高軼,孫仁峰,等.基于大數據的商業智能在醫院門診管理中的設計應用[J].中國數字醫學,2015,10(11):93-95.
[5] 張勝行,陳大鵬,凌小明.基于大數據視角的醫院科研管理[J].解放軍醫院管理雜志,2015,22(5):481-483.
F274