任慧朋
1.解放軍第98醫(yī)院,浙江 湖州 313000;2.南京政治學(xué)院上海校區(qū) 軍事信息管理系,上海 200433
醫(yī)療大數(shù)據(jù)環(huán)境下的健康信息分析方法
任慧朋1,2
1.解放軍第98醫(yī)院,浙江 湖州 313000;2.南京政治學(xué)院上海校區(qū) 軍事信息管理系,上海 200433
本文主要分析了醫(yī)療大數(shù)據(jù)的特點,介紹了當前國內(nèi)健康信息的需求現(xiàn)狀,以醫(yī)學(xué)檢驗數(shù)據(jù)(LIS)為研究實例,列舉了數(shù)據(jù)加工、數(shù)據(jù)挖掘、智能分析等關(guān)鍵性技術(shù),介紹了動態(tài)情報分析和病情預(yù)測報警等實現(xiàn)原理,展示了利用醫(yī)療大數(shù)據(jù)為患者健康提供信息服務(wù)的應(yīng)用案例。
醫(yī)療大數(shù)據(jù);健康信息;分析方法
本文獲得“第七屆(2015)飛利浦醫(yī)療保健臨床應(yīng)用與研究征文大賽”醫(yī)療設(shè)備技術(shù)保障類一等獎
隨著醫(yī)療機構(gòu)信息化水平的不斷提高,醫(yī)療信息的數(shù)據(jù)量也迅猛增長。在這些海量數(shù)據(jù)中有很多有價值的患者信息,采集分散的醫(yī)療信息并進行加工,再通過數(shù)據(jù)挖掘等技術(shù)進行分析處理,形成的結(jié)果將有助于提升患者的健康素養(yǎng)和整體的醫(yī)療服務(wù)水平[1]。
目前,國內(nèi)醫(yī)療衛(wèi)生機構(gòu)的體制比較復(fù)雜,醫(yī)療信息化的發(fā)展極不均衡,“信息孤島”的現(xiàn)象非常嚴重。同時,國內(nèi)民眾的健康素養(yǎng)仍處于較低水平,面對專業(yè)性較強的醫(yī)療數(shù)據(jù),患者普遍缺乏分析判斷能力,醫(yī)院與患者之間也缺少有效的信息交互渠道。因此,在醫(yī)療大數(shù)據(jù)環(huán)境下,如何收集、梳理、利用好繁雜的醫(yī)療數(shù)據(jù),更好地為患者服務(wù),增強醫(yī)患間的信息聯(lián)絡(luò),將是醫(yī)學(xué)信息學(xué)未來研究的一個重要課題[2]。
20世紀90年代初,隨著計算機的普及應(yīng)用,為滿足醫(yī)療業(yè)務(wù)的需求,國內(nèi)開始了醫(yī)院信息管理系統(tǒng)(Hospital Information System,HIS)的研究。HIS發(fā)展至今,從最初簡易的收費系統(tǒng),到形成了集綜合管理、醫(yī)療業(yè)務(wù)、統(tǒng)計分析3大類數(shù)百個功能模塊的龐大的信息管理體系。隨著HIS功能的不斷增加,領(lǐng)域的不斷擴張,數(shù)據(jù)量呈逐年暴增的趨勢,形成了一個冗雜的數(shù)據(jù)倉庫(圖1)[3]。由于HIS發(fā)展的歷史原因,醫(yī)療數(shù)據(jù)的存儲和分類非常雜亂,各數(shù)據(jù)庫之間的關(guān)系越來越復(fù)雜,在這些海量數(shù)據(jù)群中有用和無用信息摻雜在一起難以甄別,緊密聯(lián)系的數(shù)據(jù)之間形成了盤根錯節(jié)的關(guān)系網(wǎng)絡(luò),這也是醫(yī)療大數(shù)據(jù)的主要特點[4]。

圖1 醫(yī)療信息數(shù)據(jù)倉庫的示意圖
1.1 數(shù)據(jù)來源廣
醫(yī)療數(shù)據(jù)的來源很廣,主要包括醫(yī)療業(yè)務(wù)流程數(shù)據(jù)、醫(yī)療綜合管理數(shù)據(jù)、綜合數(shù)據(jù)統(tǒng)計分析三類,其中核心是醫(yī)療業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)的產(chǎn)生和變化都是對病人狀態(tài)的描述[5]。對于醫(yī)院方面,當病人入院時產(chǎn)生原始信息(病人基本信息表),隨著醫(yī)療流程的運轉(zhuǎn)產(chǎn)生其它醫(yī)療信息,包括病人的活動情況(門診、體檢、住院、收費等),和財務(wù)、藥品物資管理等[6]。對于醫(yī)療保險方面,國內(nèi)的醫(yī)療保險種類較多,各級醫(yī)保中心都存儲著大量的賬戶信息[7],同時連接上級管理部門和各聯(lián)網(wǎng)醫(yī)院、診所等,病人在診療過程中每觸發(fā)一次醫(yī)療業(yè)務(wù),相關(guān)部門的數(shù)據(jù)都將隨之變化,形成以“病人的狀態(tài)數(shù)據(jù)”為信號的關(guān)聯(lián)數(shù)據(jù)群[8]。
1.2 數(shù)據(jù)更新快
病人的狀態(tài)一旦發(fā)生變化,所有的數(shù)據(jù)都會隨之改變。從來院掛號到登記化驗,再到確診和開藥取藥,整個流程中所有的數(shù)據(jù)都需要按步驟及時更新[4],否則將會出現(xiàn)業(yè)務(wù)中斷的情況,甚至會導(dǎo)致醫(yī)療事故。例如患者在進行某項檢查時,檢驗結(jié)果顯示已經(jīng)超過人體危急值,如果消息傳遞不及時,患者的生命就會受到嚴重威脅。患者在完成全部就診流程后,要與醫(yī)保中心進行賬務(wù)結(jié)算;患者的健康信息還要定期進行上傳;醫(yī)保中心與醫(yī)院要不定期進行藥品價格和報銷比例等調(diào)整。這些數(shù)據(jù)的變化都需要嚴格保持同步,否則可能導(dǎo)致嚴重不良后果,甚至可能導(dǎo)致醫(yī)療糾紛的產(chǎn)生[8]。
1.3 數(shù)據(jù)標準亂
醫(yī)療數(shù)據(jù)的標準主要是指各業(yè)務(wù)部門統(tǒng)一采用的數(shù)據(jù)交換和存儲的方式。由于技術(shù)發(fā)展歷史和醫(yī)院編制體制等客觀原因,國內(nèi)始終沒有醫(yī)療數(shù)據(jù)的統(tǒng)一標準,每個體系自主選擇適于其業(yè)務(wù)流程的數(shù)據(jù)格式,這為醫(yī)療信息化創(chuàng)造了的自由發(fā)展的空間。但從長遠角度來看,也成為了實現(xiàn)醫(yī)療數(shù)據(jù)的集中共享的難題。例如,醫(yī)院檢驗設(shè)備采用的指標單位不同,就無法實現(xiàn)設(shè)備間化驗單互認[10]。目前,醫(yī)療數(shù)據(jù)標準化的主流方式是在每個數(shù)據(jù)端安裝前置服務(wù)程序,把外來的數(shù)據(jù)“標準化”成為內(nèi)部系統(tǒng)可識別的格式,在不同來源的數(shù)據(jù)庫間表面上形成了標準統(tǒng)一。但這種標準化模式在實際運用過程中的效率較低,出錯率較高,中斷后的糾錯難度較大[11]。
1.4 數(shù)據(jù)共享難
醫(yī)療數(shù)據(jù)共享是實現(xiàn)數(shù)據(jù)集中采集的前提條件,造成數(shù)據(jù)共享困難的原因不僅僅是標準不統(tǒng)一,更是由于醫(yī)院本身的體制現(xiàn)狀。目前,各地區(qū)私立醫(yī)院、公立醫(yī)院、軍隊醫(yī)院競爭共存,各自的隸屬關(guān)系不同[12],各醫(yī)院的數(shù)據(jù)結(jié)構(gòu)不同,地區(qū)間的發(fā)展水平也不均衡。要實現(xiàn)數(shù)據(jù)高度共享,醫(yī)療機構(gòu)和各醫(yī)保部門間需進行密切協(xié)作。首先需要實現(xiàn)醫(yī)院間的標準互認,要犧牲一定的“數(shù)據(jù)利益”,同時還要考慮隱私權(quán)等法律問題。所以,短時間內(nèi)很難實現(xiàn)國內(nèi)醫(yī)療數(shù)據(jù)的全面共享,這也是困擾醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的“數(shù)據(jù)孤島”壁壘[13]。
2.1 公民的健康素養(yǎng)
從世界范圍來看,中國公民的健康素養(yǎng)(個人獲取和理解健康信息,并運用這些信息維護和促進自身健康的能力)比較低,國內(nèi)健康檔案等建設(shè)工程起步較晚,對健康信息需求的認識比較模糊[14]。調(diào)查顯示,2014年中國城鄉(xiāng)居民健康素養(yǎng)水平為9.48%,而美國同期的健康素養(yǎng)水平在50%以上[15]。世界衛(wèi)生組織也指出:“無論是發(fā)達國家還是發(fā)展中國家,對健康信息的理解都存在著困難,加強個人健康信息管理的緊迫性是世界性問題”[16]。
我國醫(yī)療資源分布不均衡,民眾普遍缺乏醫(yī)療基本常識,同時“只看醫(yī)生,不信數(shù)據(jù)”的思想觀念根深蒂固,這些因素綜合起來就會導(dǎo)致健康素養(yǎng)指標偏低。從整體評價情況來看,國內(nèi)醫(yī)療機構(gòu)尚處于就診預(yù)約、價格查詢和瀏覽診斷結(jié)果的初級信息管理階段。普通民眾對健康信息的需求較少,利用信息手段來獲取健康情報的意識還比較淡薄[17]。
2.2 醫(yī)療機構(gòu)的信息服務(wù)
醫(yī)療事業(yè)的工作目標是為群眾提供良好的衛(wèi)生服務(wù),但獲取“效益”是醫(yī)療機構(gòu)正常運轉(zhuǎn)的前提。醫(yī)療信息大部分產(chǎn)生于醫(yī)療業(yè)務(wù)流程中,這些信息資源的服務(wù)對象雖然是患者,但都是以費用對醫(yī)療信息的流轉(zhuǎn)進行控制,針對患者專門設(shè)計的信息服務(wù)項目非常少。信息的服務(wù)對象應(yīng)以患者為核心,對群眾的健康狀況進行詳實的歷史記錄,以數(shù)據(jù)倉庫的方式實現(xiàn)醫(yī)療數(shù)據(jù)的極端共享。目前有些歐美國家已針對個人健康檔案的建設(shè)開展工作,取得了一定的規(guī)模成就,其核心理念就是服務(wù)患者,以方便患者遠程共享醫(yī)療數(shù)據(jù)為目的,減少病人的重復(fù)檢查,提高了醫(yī)生的工作效率和準確率[18]。
近年,衛(wèi)生部大力推行“農(nóng)保一卡通”和“城鄉(xiāng)居民健康卡”等民生工程,一些城市也開始探索以“電子健康檔案”為基礎(chǔ)的健康信息管理方式,以實現(xiàn)健康信息資源的高度共享。但國內(nèi)的醫(yī)療體系框架和管理模式與國外有很大的區(qū)別,醫(yī)療保險制度的建立時間較短,且各區(qū)域的醫(yī)療信息發(fā)展水平極不平衡。綜合看來,個人健康信息共享平臺的發(fā)展比較緩慢,檢驗數(shù)據(jù)做為健康信息的核心數(shù)據(jù),其指標單位標準在醫(yī)院間很難統(tǒng)一。這是由醫(yī)療機構(gòu)的管理機制、信息服務(wù)對象、醫(yī)療水平等多種原因造成的[19]。
2.3 防疫部門的疫情監(jiān)測
從2003年的“非典”到最近頻繁爆發(fā)的“禽流感”,大規(guī)模傳染病公共事件的預(yù)防工作變得非常重要。2010年,國家防疫疾控中心計劃實現(xiàn)建設(shè)全國的防疫監(jiān)控體系,意圖實現(xiàn)上下聯(lián)動全覆蓋的疫情監(jiān)控。但由于各地區(qū)間的數(shù)據(jù)不對稱和經(jīng)濟水平不均衡等原因[20],目前傳染疫情的監(jiān)控大部分采用人工監(jiān)測并上報的模式。傳統(tǒng)疫情信息上報流程,見圖2。按照正常流程,從鄉(xiāng)鎮(zhèn)單位到省級防疫部門要經(jīng)過4~5級上報,任一中間環(huán)節(jié)出現(xiàn)問題,疫情上報的任務(wù)就會中斷。同時采樣標本的確認周期長,誤報率非常高,浪費了大量的人力和物力[21]。如果所有健康信息能夠及時上報并集中管理,重大疫情和病情的監(jiān)測效率將會大幅度提高,防疫部門可以采取針對性措施及時對疫情進行控制,準確把握防治的范圍和重點,推動社會公共衛(wèi)生事業(yè)的發(fā)展[22]。

圖2 各級疫情報告制度響應(yīng)圖
醫(yī)療大數(shù)據(jù)的分析過程需要依靠可靠、規(guī)范、龐大的數(shù)據(jù)資源,針對不同來源和不同格式的數(shù)據(jù),規(guī)范化的收集存儲是第一道工序。數(shù)據(jù)分析處理的過程中主要用到數(shù)據(jù)挖掘技術(shù),使用數(shù)據(jù)建模判斷智能分析和預(yù)測結(jié)果,分析和預(yù)測結(jié)果的應(yīng)采取數(shù)字與圖像相結(jié)合的方式進行呈現(xiàn)。由于患者健康素養(yǎng)普遍不高,因此必須用最簡易的方式來展示這些復(fù)雜的分析結(jié)果,對于醫(yī)生則要提供專業(yè)的分析結(jié)果[23]。
3.1 數(shù)據(jù)采集
數(shù)據(jù)采集就是在不同時段對各信息源的數(shù)據(jù)進行抽取和匯集。由于數(shù)據(jù)的格式不統(tǒng)一,儲存前需要按照規(guī)范進行數(shù)據(jù)轉(zhuǎn)換,自動添加為數(shù)據(jù)挖掘等應(yīng)用準備的字段,如數(shù)據(jù)來源標示、數(shù)據(jù)分類、數(shù)據(jù)索引等。醫(yī)療數(shù)據(jù)最關(guān)鍵的價值就是及時性,因此要求整個數(shù)據(jù)采集的過程是動態(tài)的,在已有大量數(shù)據(jù)的基礎(chǔ)上,要時刻準備接收和轉(zhuǎn)換新的數(shù)據(jù)[24]。目前大數(shù)據(jù)普遍存在的問題是“垃圾數(shù)據(jù)”過多,為保證醫(yī)療數(shù)據(jù)的準確性,必須在數(shù)據(jù)采集前就進行嚴格的篩選,對一些“臟數(shù)據(jù)”和過期數(shù)據(jù)建立智能的甄別機制。如果對來源數(shù)據(jù)審查不嚴格,會導(dǎo)致最終分析結(jié)果出現(xiàn)偏差。數(shù)據(jù)篩查與同步的判斷原理圖,見圖3。

圖3 數(shù)據(jù)篩查與同步的判斷原理圖
3.2 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是大數(shù)據(jù)分析過程中的核心技術(shù)。醫(yī)療大數(shù)據(jù)分析的重點是查找異常數(shù)據(jù),分析并及時通知異常判斷結(jié)果[25]。處理過程中要對數(shù)據(jù)的優(yōu)先權(quán)進行等級劃分,比如急診的數(shù)據(jù)要優(yōu)先于普通體檢數(shù)據(jù),軍人病號的數(shù)據(jù)要優(yōu)先于普通醫(yī)保的數(shù)據(jù),重型傳染病HIV數(shù)據(jù)要優(yōu)先于其他病情的數(shù)據(jù),手術(shù)的檢驗數(shù)據(jù)要優(yōu)先于一般體檢數(shù)據(jù)。
3.3 數(shù)據(jù)建模
大數(shù)據(jù)最終目的是分析和預(yù)測,數(shù)據(jù)建模是情報分析預(yù)測的主要手段,是做出判斷結(jié)果的技術(shù)基礎(chǔ)。醫(yī)療數(shù)據(jù)的分類比較雜,醫(yī)學(xué)類數(shù)據(jù)的建模是一個在情報反饋中不斷進行動態(tài)調(diào)整的過程,而且情報反饋越多,模型設(shè)定越準確。醫(yī)療數(shù)據(jù)分類的雜亂性決定了其模型的多樣性,依靠人工進行臨時調(diào)整是很難的,只有根據(jù)現(xiàn)實數(shù)據(jù)與歷史數(shù)據(jù)的結(jié)合情況實現(xiàn)平衡,動態(tài)建模是實現(xiàn)數(shù)據(jù)及時性和準確性的關(guān)鍵環(huán)節(jié)。本研究節(jié)選案例的模型設(shè)定就是一個建立在常見病狀和新病情基礎(chǔ)上不斷自我調(diào)整的過程,通過對異常數(shù)據(jù)的分析,系統(tǒng)可以不斷豐富判斷字典,使得判斷結(jié)果越來越準確,判斷條件越來越豐富[26]。
在商業(yè)和軍事領(lǐng)域的情報分析過程中,實現(xiàn)用戶的具體需求是衡量情報信息價值的關(guān)鍵,醫(yī)療健康信息的分析過程也類似,其核心價值是以用戶能夠接受的方式給出的及時、準確的分析結(jié)果。健康信息是對某一時刻身體狀態(tài)的描述,過期的情報、錯誤的分析結(jié)果是沒有任何意義的。健康信息的分析來源是人體健康狀態(tài)的量化數(shù)據(jù),具有共性,所以健康評測需要建立在統(tǒng)一的判斷標準之上。同時患者的個人需求是在不斷變化之中的,整個分析過程是一個持續(xù)反饋的過程,是一個動態(tài)調(diào)整的循環(huán)體系。研究節(jié)選案例參照傳統(tǒng)的軍事和商業(yè)領(lǐng)域情報分析的流程,結(jié)合國民健康素養(yǎng)的現(xiàn)狀,設(shè)計了一套基于LIS檢驗數(shù)據(jù)的分析系統(tǒng)[27]。
4.1 檢驗指標標準統(tǒng)一
統(tǒng)一信息的判斷標準是保證醫(yī)療機構(gòu)上下級信息通暢的前提,如果某種異常情況的判定在縣級和省市級醫(yī)院不統(tǒng)一,那么情報分析的結(jié)果就容易出現(xiàn)錯報和誤報。對某些醫(yī)學(xué)健康信息的標準是很難判定的,以LIS數(shù)據(jù)中的尿酸值為例,對于同一份檢驗標本,由于檢測水平和檢測設(shè)備不同,其檢測結(jié)果也是不同的;鈉離子有4種不同的標示方法(NA,Na,NA+,Na+),不同信息系統(tǒng)是互不相認的;同一個病人,其檢測結(jié)果在手術(shù)前后和恢復(fù)期間也有巨大差別。因此對檢驗指標標準的設(shè)定不僅是建立單純的數(shù)值之上,還要同時考慮到設(shè)備、天氣、病狀和心態(tài)等多種因素。研究節(jié)選案例中利用中間服務(wù)層為常見的標準定義了標示對照字典,進行了同語義轉(zhuǎn)化,實現(xiàn)了數(shù)據(jù)高度共享,同時還保留了不同醫(yī)院的“個性化”數(shù)據(jù),以便能對個體的追蹤查詢和分析判斷[28]。
4.2 用診斷字典過濾
診斷字典是異常結(jié)果的診斷依據(jù),是所有判定標準的集合體,其主要原理是在數(shù)據(jù)建模的基礎(chǔ)上建立一個過濾層。本案例中以《國家檢驗標準第三版》的范圍為基礎(chǔ)判斷字典,并對常見病種的判斷進行條件組合,形成多個簡易判斷策略單元,每個醫(yī)療機構(gòu)還可根據(jù)自身特點調(diào)整和增加條件。隨著時間的推移和數(shù)據(jù)量的增加,判斷字典不斷豐富,對異常情況判斷的效率也在不斷地提高。新病種的出現(xiàn)要求診斷字典需要具備自我完善和調(diào)整的功能,但就目前的技術(shù)條件而言,還只能采用人工調(diào)整的方式[24]。檢驗指標的區(qū)間標示方法各異,有的只有最大值或最小值(開區(qū)間),有的有固定的區(qū)間范圍(閉區(qū)間),針對此復(fù)雜情況本案例特設(shè)定了分類判斷機制,其判斷原理圖,見圖4。

圖4 各類指標的分類判斷流程圖
4.3 按用戶分類給出分析結(jié)果
傳統(tǒng)情報分析的信息來源相對固定,服務(wù)對象單一,相應(yīng)最終的結(jié)果展示方式較少。軍事情報的主要服務(wù)對象是指揮機構(gòu)或者指揮員,目標相對穩(wěn)定,信息服務(wù)的目的是制定和調(diào)整作戰(zhàn)行動計劃,通過數(shù)字報表、口述、書面報告等方式基本上就可以滿足信息展示的需求。但醫(yī)療信息的服務(wù)對象非常多,包括醫(yī)生、醫(yī)療機構(gòu)、患者、健康群體(工廠或社區(qū))等,其對健康信息需求的差異性非常大,對信息的理解能力水平也有很大區(qū)別,所以分析結(jié)果應(yīng)根據(jù)用戶分類采用不同的展示方法[25]。地方醫(yī)療機構(gòu)關(guān)注重點是群體指標的變化趨勢,提供方式主要應(yīng)該是純數(shù)據(jù)報表或者整體動態(tài)分析圖等;普通患者的健康需求較為簡單,最想得到的是個人健康記錄和診斷結(jié)果,而且由于普通民眾不具備專業(yè)的醫(yī)療水平,所以需要采用最直觀的圖形化展示方式;臨床醫(yī)生的需求更貼近臨床應(yīng)用,最關(guān)心的是所負責病人的最新指標的變化,以便及時做出診斷和制定最佳治療方案,所以需要以專業(yè)分析數(shù)據(jù)展示[27]。
4.4 智能預(yù)測報警
應(yīng)用大數(shù)據(jù)的最終目的是實現(xiàn)預(yù)測功能,這也是大數(shù)據(jù)概念的核心目標。醫(yī)療信息可預(yù)測的內(nèi)容多、意義重大,以目前醫(yī)療發(fā)展的程度,智能預(yù)測主要應(yīng)用于傳染病預(yù)防和臨床輔助兩個方面。利用大數(shù)據(jù)技術(shù)實現(xiàn)傳染病的預(yù)防工作,首先需要各級醫(yī)療機構(gòu)達成數(shù)據(jù)標準化協(xié)議,然后無保留地提供全部數(shù)據(jù),實現(xiàn)醫(yī)療數(shù)據(jù)的高度共享,但這種目標在短時間內(nèi)并不能實現(xiàn)。大數(shù)據(jù)分析對臨床輔助的應(yīng)用主要體現(xiàn)在輔助診斷指標的智能化方面,實現(xiàn)這個功能需要的數(shù)據(jù)量不大,只要有存儲規(guī)范的數(shù)據(jù)庫,數(shù)據(jù)的獲取比較容易。本研究節(jié)選案例中實現(xiàn)了危急值的智能報警過程,其設(shè)計原理就是從大批量新數(shù)據(jù)中第一時間發(fā)現(xiàn)異常數(shù)據(jù),進行分析和預(yù)測,再對可能出現(xiàn)問題的消息進行智能發(fā)送。危急值的報告制度是2014年國家衛(wèi)生部發(fā)布的《十大患者安全目標》之一,經(jīng)權(quán)威統(tǒng)計,醫(yī)療糾紛事件有36%是由未落實危急值報告制度而引起的。目前幾乎所有醫(yī)院在危急值的檢測上都實現(xiàn)了自動化,但在報告的傳遞方式上依然以人工為主,醫(yī)療技師與醫(yī)生的溝通效率決定了患者搶救的成功率。在系統(tǒng)中設(shè)計過程中,計算機取代了檢驗技師,實現(xiàn)批量數(shù)據(jù)的智能化甄別和預(yù)測分析,將人工消息傳遞改為智能報警提醒的方式,大大縮短了危急值報告的時間,提高了危象病人搶救的效率。危急值智能報警與傳統(tǒng)人工操作的對比,見圖5。
LIS數(shù)據(jù)是健康信息的核心數(shù)據(jù),本文闡述了如何利用數(shù)據(jù)采集的方式形成數(shù)據(jù)倉庫,再利用數(shù)據(jù)挖掘和數(shù)據(jù)建模等技術(shù)進行分析處理。并針對醫(yī)療數(shù)據(jù)的特點,結(jié)合各類用戶的需求情況,介紹了對海量數(shù)據(jù)進行分析判斷的原理,展示了實現(xiàn)效果。
醫(yī)療大數(shù)據(jù)的應(yīng)用是醫(yī)學(xué)信息學(xué)未來研究的重要課題,在醫(yī)療大數(shù)據(jù)環(huán)境下如何更好地為患者提供信息服務(wù),利用信息手段提高全社會的醫(yī)療服務(wù)水平,將會是未來研究的主要方向。

圖5 危急值智能化報警設(shè)計的效果圖
[1] Kandula S.The nature of data center traffic:measurements&analysis [A].Kandula S,Sengupta S,eds.Acm Sigcomm Сonference on Internet Measurement[С].Сhicago:AСM SIGСOMM,2009:202-208.
[2] Liu L.Green СIoud:A new architecture for green data center[A]. Liu L,Wang H,eds.Acm Sigcomm Сonference on Internet Measurement[С].Сhicago:AСM SIGСOMM,2009:29-38.
[3] 陳金雄.醫(yī)院信息系統(tǒng)發(fā)展及對存儲和數(shù)據(jù)安全的新要求[J].中國醫(yī)療設(shè)備,2010,25(8):1-3.
[4] Greenberg A.Towards a next generation data center architecture:scalability and commoditization[A].Greenberg A,Lahiri E,ets.Proceedings of the AСM workshop on Programmable routers for extensible services of tomorrow[С].Сhicago:AСM IMС,2008:57-62.
[5] Сhang F,Dean J,Ghemawat S,et a1.Bigtable:A distributed storage system for structured data[J].ACM TOCS,2008,26(2): 205-218.
[6] Dean J,Ghemawat S.Mapreduce:simplifed data processing OII large clusters[J].ACM,2008,5l(1):107-113.
[7] Rui ME.K-means clustering in the cloud-A Mahout Test[A]. Rui ME,Rui P,ets.IEEE Workshops of International Сonference on Advanced Information Networking and Applications[С]. Singapore:Сurran Associates,Inc,2011:514-519.
[8] 周鐵成.虛擬化技術(shù)在數(shù)據(jù)中心架構(gòu)中的應(yīng)用研究[J].現(xiàn)代計算機 專業(yè)版,2009(4):88-89.
[9] 譚文輝.利用VMware實現(xiàn)數(shù)據(jù)中心服務(wù)器虛擬化[J].艦船電子工程,2008,28(6):156-159.
[10] 劉韜,侯宗浩.基于醫(yī)學(xué)影像數(shù)據(jù)中心的PAСS系統(tǒng)集成的研究[J].醫(yī)療衛(wèi)生裝備,2006,27(3):40-41.
[11] Giilick D,Faria A,DeNero J.Mapreduce:Distributed computing for machine learning[J].Berkley,2006,12(6):18-21.
[12] 維克托·邁爾·舍恩伯格.刪除[M].杭州:浙江人民出版社,2013: 42-46,53-59.
[13] 趙國棟,易歡歡,糜萬軍,等.大數(shù)據(jù)時代的歷史機遇—產(chǎn)業(yè)變革與數(shù)據(jù)科學(xué)[M].北京:清華大學(xué)出版社,2013:167-175.
[14] 城田真琴.大數(shù)據(jù)的沖擊[M].北京:人民郵電出版社,2013:76-83.
[15] 周寶曜,劉偉,范承工.大數(shù)據(jù):戰(zhàn)略 技術(shù) 實踐[M].北京:電子工業(yè)出社,2013:13-16,78-85,156-164.
[16] 維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2012:223-226.
[17] 涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012:56-61.
[18] Thusoo A,Sarma J S,Jain N,et a1.Hive:a warehousing solution over a map-reduce framework[J].Proceedings of the VLDB Endowment,2009,2(2):1626-1629.
[19] Low Y,Gonzalez JE,Kyrola A,et al.GraphLab:A New Framework For Parallel Machine Learning[J].Eprint Arxiv,2014,48(6):13-19.
[20] Ghemawat S,Gobioff H,Leung S.File and storage systems:The Google File System[J].AСM SIOSPS,2003,(37):29-43.
[21] Borthakur D.The hadoop distributed fle system:Architecture and design[J].Hadoop,2007,11(11):1-10.
[22] Manyika J,Сhui M,Brown B,et al.Big Data:The Next Frontier For Innovation,Сompetition,And Productivity[J]. Analytics,2011,36(4):24-35.
[23] Steve Lohr.The age of big data[J].New York Times,2012,2(12):1-5.
[24] Howe D,Сostanzo M,Fey P,et al.Big Data:The future of biocuration[J].Nature,2008,455(7209):47-50.
[25] Tom Kalil.Big Data is a Big Deal[EB/OL].(2012-03-29)[2015-08-13].http://www.whitehouse.gov/blog/2012/03/29/big-databig-deal.
[26] Paul С,Ziko P,Сhris E.Understanding Big Data[M].Mc Graw Hill, 2012:36-38,123-126.
[27] Hoffmann L.Looking back at big data[J].СOMMUN AСM,2013,56(4):21-23.
[28] Emmanuel L.Big Data for Development:Сhallenges&Opp ortunities[EB/OL].(2012-05-12)[2015-07-16].http://www. unglobalpulse.org/projects/Big Data for Development.
Analysis Methods on Health Information in Medical Big Data Environment
REN Hui-peng1,2
1.98thHospital of PLA, Huzhou Zhejiang 313000, Сhina; 2.Department of Military Information Management, Nanjin Politics Сollege Shanghai Branch, Shanghai 200433, Сhina
This paper analyzed characteristics of medical big data, and introduced current status of domestic demand for health information. Through the research of laboratory information system (LIS), some crucial technologies were enumerated such as data processing, data mining, intelligent analysis,etc. Meanwhile, principles of dynamic intelligence analysis and disease prediction alarm were introduced, and real cases which using medical big data to serve patients were displayed.
medical big data; health information; analysis method
R012
A
10.3969/j.issn.1674-1633.2016.05.057
1674-1633(2016)05-0173-05
2016-03-01
作者郵箱:38152111@qq.com
編者按:為了促進飛利浦醫(yī)療產(chǎn)品用戶間的交流與溝通,加強飛利浦醫(yī)療與廣大中國用戶的合作,更好地利用現(xiàn)代醫(yī)療設(shè)備服務(wù)于臨床和科研,飛利浦醫(yī)療保健與《世界醫(yī)療器械》雜志、科訊醫(yī)療網(wǎng)于2015年11月啟動“第七屆(2015)飛利浦醫(yī)療保健臨床應(yīng)用與研究征文大賽”,得到了全國各地飛利浦醫(yī)療系統(tǒng)用戶的積極響應(yīng)和大力支持。此次征文大賽特邀了20余位國內(nèi)相關(guān)領(lǐng)域的著名專家組成專家評審委員會,以公開、公平、公正的方式對參賽論文進行評選。《中國醫(yī)療設(shè)備》雜志社作為合作媒體,特于本期設(shè)此欄目刊登獲獎文章。