999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于循證醫學的海量醫學數據挖掘分析方法研究*

2015-03-13 11:38:00孫向東黃曉琴朱春倫
醫學信息學雜志 2015年3期
關鍵詞:數據挖掘信息模型

孫向東 黃曉琴 朱春倫

(寧波市衛生信息中心 寧波 315010) (華為技術有限公司 深圳 518129) (寧波市衛生局 寧波 315010)

張 科 張 輝 陳曉妍 翁可為 陸傳統 唐 玲

(寧波市衛生局寧波 315010) (寧波市衛生信息中心寧波 315010) (寧波市衛生信息中心寧波 315010)

?

基于循證醫學的海量醫學數據挖掘分析方法研究*

孫向東 黃曉琴 朱春倫

(寧波市衛生信息中心 寧波 315010) (華為技術有限公司 深圳 518129) (寧波市衛生局 寧波 315010)

張 科 張 輝 陳曉妍 翁可為 陸傳統 唐 玲

(寧波市衛生局寧波 315010) (寧波市衛生信息中心寧波 315010) (寧波市衛生信息中心寧波 315010)

從循證醫學視角出發,以寧波市智慧健康保障體系項目為例,介紹數據挖掘方法在醫學領域中的應用,在此基礎上闡述醫學海量數據挖掘分析步驟、研究內容、分析方法、關鍵技術、模型構建、平臺架構與功能等。

循證醫學;數據挖掘;分析模型

1 引言

1.1 數據共享與交換平臺建設為實施數據挖掘奠定基礎

1.1.1 循證醫學概念 循證醫學(Evidence-based Medicine,EBM)是指遵循證據的醫學,又稱“實證醫學”、“證據醫學”,其核心思想是醫療決策應在現有最好的臨床研究依據基礎上作出,同時也重視結合個人的臨床經驗。循證醫學不同于傳統醫學,傳統醫學是以經驗醫學為主,往往根據非實驗性的臨床經驗、臨床資料和對疾病基礎知識的理解來診治病人。而循證醫學是在臨床經驗、資料等基礎上,強調將醫療決策建立在最佳科學研究的證據基礎上。

1.1.2 平臺現狀 寧波市智慧健康保障體系項目建設目前已經完成了數據共享與交換平臺的研發,經過與8家市級醫療機構以及部分縣市區(鄞州區、海曙區、江東區、江北區、奉化縣)平臺的對接,實現了診療信息和健康保健信息的采集與交換。在市級數據中心存儲了全市大部分居民的健康檔案和電子病歷信息,在不斷完善,醫療衛生的數字化信息將日益豐富。目前在市數據中心采集的信息主要包括病人的基本信息、病史、診療信息、檢驗報告、檢查報告、用藥史、既往史、用藥記錄、醫囑等臨床信息,以及藥品管理、醫院管理等醫療信息。在大量數據后面蘊含了許多對疾病的診斷、治療以及衛生行政決策有重大價值的信息,從這些醫療數據中挖掘出有用的信息,對了解各種疾病之間的相互關系和發展規律,疾病的防控、診斷、治療和醫學研究的發展具有重大意義,醫療衛生信息自動化和智能化應用和研究正在快速發展[1-4]。

1.1.3 構建意義 從循證醫學視角出發,構建電子健康檔案和電子病歷信息資源整合與挖掘的宏觀模型和數據分析平臺,將助力醫療衛生行業全面提升,把紛繁復雜的醫療數據轉變成有價值的信息,為醫學科學研究、臨床診療、衛生決策、公眾服務制定提供依據,包括:(1)幫助尋找最佳藥物組合及標準化治療方法,提高診療效果。(2)預測慢性疾病風險,查明罹患疾病幾率。(3)協助醫院評估、監測和提高患者治療的安全性。(4)優化醫院資源利用[5-7]。

1.2 數據挖掘在醫學領域中的應用

用數據挖掘方法發現醫學數據中的規律性,可以輔助醫務人員快速準確地診斷、預測、監控病情,確定最優的治療方案。目前數據挖掘已經運用在很多醫學應用領域中[1,3]。(1)疾病的臨床診斷、治療和愈后預測:醫學本身具有很強實踐性、統計性,這一過程往往是醫師知識和經驗的交織作用過程。數據挖掘可以通過對患者資料數據庫中大量歷史數據的處理,提煉其中大量有價值的信息,從而為臨床決策服務。(2)流行病學研究和醫學統計方法學:如分析影響疾病死亡率的因素、產科病人早產的3個危險因素等。(3) 醫院和衛生事業管理:醫院科學管理、醫療保健政策的制定、衛生資源的合理配置等。(4)藥物利用分析:藥物的研發和毒理學研究方面的探索和應用性研究[8]。從國內外當前研究現狀來看,關于循證醫學海量數據挖掘的研究已日趨成熟,無論在理論上還是具體操作上學者們者做了積極的探索,形成了大量具有重要指導性的課題成果。從循證醫學本身來說,提供集成的個性化醫療服務是世界范圍內的共識和目標,如何將EBM與醫院信息系統資源進行整合和挖掘,構建直接面向用戶服務的公共知識平臺,實現循證醫學資源的有效利用,仍是國內學者需要嘗試和探索的難題。

2 研究步驟[9-10]

2.1 明確需要解決的問題

在此階段與醫學專家進行深入交流,明確需要解決的問題,確定數據挖掘的目標和衡量其成功的標準,了解該問題目前的解決方法與存在的弊端。這個步驟是數據挖掘的基礎。

2.2 數據理解

這個步驟包括數據的初步收集、對原始數據進行抽樣分析、列出數據的類型(包括大小、格式、屬性等)。經過這個步驟可以回答部分數據挖掘的目的,從而肯定最初的假設或對新的特征進行探求。

2.3 數據處理與數據倉庫建立

這個步驟是決定數據挖掘成功與否的關鍵。區域衛生數據中心積累了龐大的醫療衛生數據,處理所有的原始數據不僅耗時而且對計算機資源浪費極大。清洗、抽取具有代表意義的部分數據是一種有效的簡化方法,可通過以下兩種途徑:(1)對數據空間進行采樣,此時進行的數據收集是隨機的。(2)對特征空間的采樣,只有具有某些特征的數據才能被選中,當大量特征存在時,這種選擇也將是隨機的,經過數據清洗、轉換并去降噪聲,與其他一些需要的外部信息共同組成數據倉庫。

2.4 數據挖掘

利用數據挖掘方法來發現新的內容,包括選擇數據模型、決定訓練和實驗過程、建立模型、評價模型品質等過程。數據挖掘不是一個單向的過程,對同一個問題可有多種不同的算法。不同的數據挖掘方法作用于同一數據庫,對數據的理解可有不同的角度,每種方法合理與否都有可能。這就需要將發現結果在實際運用中反復求證,以檢驗其合理性。

2.5 評估及應用

首先,對發現的知識進行醫學或者藥學上的解釋,其結論對使用者來說必須是可理解的;其次,其在醫學或藥學領域中具有一定應用價值,能夠解決一定實際問題。

3 主要研究內容與關鍵技術

3.1 主要研究內容

3.1.1 數據挖掘需求梳理 對數據挖掘分析需求進行梳理,任何平臺提供的預定義模型無法完全覆蓋全部業務功能,選擇就診實時預警應用(用藥禁忌、重復用藥、重復檢驗檢查)、醫務人員非法執業警示、傳染病趨勢分析、衛生決策分析等應用需求。

3.1.2 標準規范與值域代碼 在加強對已有國家、行業和地方標準貫徹實施的同時,制定寧波市統一的總體數據標準規范體系,在寧波市智慧健康保障項目數據集與值域代碼梳理的基礎上,補充相應的數據字典庫,如藥品目錄、檢驗指標、收費明細等。根據統一的標準規范采集電子健康檔案數據,實現數據共享與交換,適應循證醫學醫療模式,融合國際、國家和區域性標準,建立滿足各種數據挖掘需求的區域性或國家性資源整合與挖掘的平臺模型。針對已經確認的需求所涉及的數據進行準備與定義,沒有數據規則不可能有業務模型,數據挖掘平臺提供的預定義的經過訓練可重用的業務模型必須要基于真實業務數據,基于測試數據訓練出的模型不能重用。

3.1.3 信息資源中心建設 健康信息深化利用的數據來源于區域居民健康協同服務平臺,是來自于不同醫院、公共衛生業務、社區業務數據的匯總、整合,其結構清晰,從源頭上避免了數據定義、結構的不一致性,為數據倉庫建立奠定基礎。數據倉庫根據需求利用“健康管理數據質量智能控制”保證數據的質量,利用“健康管理信息智能整合”實現多維化模型構建,形成以業務分析主題為核心、以數據分析為目的的數據集合。數據倉庫的建立可以有效地管理業務數據,為數據展示、挖掘利用奠定基礎。

3.1.4 數據分析和挖掘平臺研制 數據分析和挖掘平臺其實就是應用平臺,用戶可以使用該平臺提供的工具組件、模型庫、算法庫等功能實現數據挖掘應用、OLAP多維分析應用和數據服務應用。數據挖掘平臺提供數據采集、數據管理、數據應用、平臺訪問、平臺管理5大類功能。

3.1.5 數據挖掘分析應用 (1)藥物利用分析:數據來源于各家醫院的醫療資源數據和診療業務數據,由于數據來源和性質的差異,可將藥物利用分析分為兩類,一類是針對醫院藥品庫存的資源分析,另一類是針對診療過程中藥品利用的業務分析。系統以報表、圖形等直觀的方式發布分析信息,以便于管理者對信息特征的快速捕捉。(2)疾病危險因素分析:疾病危險因素指機體內外環境中與疾病發生發展及死亡有聯系的誘發因素,包括環境因素、個人行為因素、人類生物學因素(如家族遺傳、相關體征等)、社會心理因素等,由于不同疾病的發病機理不同,其危險因素也不盡相同。按照疾病與危險因素是否已經建立關聯關系,可將疾病危險因素分析分為兩類:一類是對已經明確的疾病危險因素的多維分析,另一類是對指定疾病與指定危險因素之間的關聯分析。(3)基于健康檔案與電子病歷的智能決策支持系統:臨床決策支持、運營決策支持、社區衛生管理決策支持、公共衛生管理決策支持等[10]。

3.2 關鍵技術

3.2.1 循證醫學理論 其核心思想就是充分利用客觀的臨床科學證據進行醫學決策,從而提高醫療質量。

3.2.2 數據預處理 醫學數據庫中含有海量、不同來源的原始信息,其中包括大量模糊、不完整、帶有噪聲和冗余的信息。在數據挖掘之前,必須進行清理和過濾,以確保數據的一致性和確定性,將其變成適合挖掘的形式[11]。

3.2.3 信息融合技術 醫學信息由文字、數據、波形信號、圖像以及少量的語音和視頻信號組成。對這些不同物理屬性的醫學數據,應采用不同的技術和措施進行處理,使其在屬性上趨同或一致,再對處理的結果進行綜合。醫學信息中多源性、時序性和非時序性數據共存、數字類型和非數字型數據共存的特點,加大了信息融合的難度。

3.2.4 數據倉庫 是面向主題、集成、時變、非易失的數據集合,用以支持決策制定過程。數據倉庫是數據庫技術的一種新應用,是一個信息提供平臺,它從業務處理系統獲得數據,主要以星型模型和雪花模型進行數據組織,為用戶提供各種手段從數據中獲取信息和知識[12]。從功能結構劃分,數據倉庫系統至少應該包含數據獲取、數據存儲、數據訪問3個關鍵部分。

3.2.5 數據挖掘 數據挖掘是人工智能、機器學習、統計學等技術高度自動化地分析原有數據,做出歸納性的推理,從中挖掘出潛在模式或者行為,以幫助決策者做出正確決策的過程。

3.2.6 快速、魯棒的挖掘算法 醫學數據庫是一個涉及面廣、信息量大的信息庫。要在這樣龐大的數據庫中提取知識,需要花費比其他數據庫更多的時間,因此必須考慮醫學數據挖掘的效率問題。研究快速挖掘算法對于循證醫學研究具有深遠的影響。醫學數據庫的類型較多,并且是動態變化的,要求挖掘算法具有一定的容錯性和魯棒性。

3.2.7 XML Web Servies 是一種基于透明標準體系的組件化松耦合技術,其目標是實現不同系統間跨平臺、跨編程語言的互操作。它是一個基于XML的可編程實體,提供一種特殊的功能元素,可通過Internet標準,如XML和HTTP等來訪問分布式的操作平臺,實現應用的協同工作。Web Services的定位是擴展分布式應用,適合大數據量低頻率的遠程數據調用。

4 模型構建

4.1 采用數據中心模式

4.2 模塊劃分

模型可分為4大模塊:(1)源數據模塊:數據倉庫的數據源,主要來源于醫療衛生機構的各種操作型信息系統數據庫(如HIS、EHR、PACS、LIS、RIS等),各種醫療數據文檔以及其他相關數據。(2)數據倉庫管理模塊:利用數據倉庫管理工具、各種規范標準及元數據庫、數據字典庫等,通過數據建模工具完成各種異構數據及數據結構的統一、規范。(3)數據倉庫:集成了標準化、規范化處理后的各種數據,可根據具體需求建立各種數據集。(4)分析應用模塊:通過Web Services層完成各種分析應用(如查詢工具、C/S工具、OLAP工具、數據挖掘工具等)與數據倉庫的數據傳輸請求。本模型通過倉庫管理模塊將各種異構數據源集成于數據倉庫,通過分析應用模塊完成基于Web Services模式的終端應用,即可兼容不同時間、不同區域、不同標準、不同結構的各種源數據,避免重復建設和資源浪費,又可以通過各種個性化工具實現對電子健康檔案相關資源的共享與應用,實現基礎與通用的電子健康檔案系統建設目標[13-14]。

4.3 數據挖掘平臺技術架構(圖1)

平臺=工具+業務模型+數據+管理監控。(1)算法組件:存儲管理維護,部署醫院常用統計分析及挖掘算法,如決策樹、神經網絡、線性回歸、貝葉斯等。(2)分析挖掘引擎:存儲管理循證醫學中的分析挖掘模型及自行研究的分析挖掘模型,支持模型的部署。主要功能包括模型注冊、測試、查詢、瀏覽、部署。(3)展示接口:對分析及挖掘結果提供對外展示的接口。

圖1 數據挖掘平臺技術架構

4.4 數據挖掘平臺功能(圖2)

(1)數據采集:將數據從生產庫或交換庫中提取、轉換、加載(Extraction-Transformation-Loading, ETL)到數據挖掘平臺的數據存儲區,涉及功能主要包括映射管理、運行監控、調度管理、元數據管理和接口管理。(2)數據管理:對數據存儲區中的數據(業務數據以及元數據)進行管理,涉及功能主要包括數據安全管理(災備、備份恢復)、元數據管理和接口管理。(3)數據應用:對數據存儲區中的數據進行業務使用和業務模型重用,涉及功能包括模型管理、算法實現、主題管理、指標體系管理和接口管理。(4)平臺訪問:對數據的訪問方式提供組件支持,包括數據服務接口(Web Service 服務開發和JDBC數據訪問接口)、統計挖掘客戶端(馬克威網絡版)和數據應用展現。(5)平臺管理:對整個平臺正常運行執行安全與運行維護,涉及功能包括用戶與權限管理、日志管理、安全集成功能。

圖2 數據挖掘平臺功能框架

5 結語

數據挖掘技術使用的海量檢索、人工智能和統計學方法使循證醫學所使用的預后終點指標(死亡率、致殘率、臨床事件發生率、生存質量等)所涵蓋的范圍更廣、更有代表性,使醫療衛生工作人員擺脫人工分析大量循證數據的煩惱,從而提高收集利用數據的效率和準確性、可靠性。數據挖掘技術在醫療衛生管理與決策中的應用范圍也會越來越廣并帶來可觀的經濟和社會效益。

1 中華人民共和國衛生部.衛辦發〔2009〕46號.健康檔案基本架構與數據標準(試行) [S]. 2009.

2 中華人民共和國衛生部.衛辦綜函〔2009〕688號.電子病歷基本架構與數據標準(征求意見稿)[S].2009.

3 中華人民共和國衛生部.衛辦綜發〔2011〕39號.基于電子病歷的醫院信息平臺建設技術解決方案(1.0版)[S].2011.

4 中華人民共和國衛生部.衛辦綜發〔2009〕230號.基于健康檔案的區域衛生信息平臺建設技術解決方案(試行)[S]. 2009.

5 李燕.海量數據與數據挖掘技術[J]. 醫學信息學雜志,2008,29(12): 23-25.

6 高艷霞.循證醫學對臨床決策的影響[J]. 醫學信息學雜志,2007,28(2):110-112,114.

7 周新憲,劉素賓.循證醫學在醫院信息系統中的應用[J].醫學信息學雜志,2009,(9): 34-37.

8 劉莘,王飛. 醫學數據挖掘的現狀分析[J]. 福建電腦,2010,(5):62.

9 沈小慶,盛炳義,方曙,等. 數據挖掘技術及其在醫院藥學中的應用[J].中國醫院管理,2005,25(12):46-48.

10 徐剛,袁兆康. 數據挖掘及其在醫學領域中的應用和展望[J]. 實用臨床醫學,2006,7(11):196-198.

11 韓煜.數據挖掘技術在醫院信息系統中的應用[J]. 醫學信息學雜志,2010,(10): 28-31

12 鄭西川.臨床信息學:從數據管理到循證醫學支持[J]. 醫學信息學雜志,2012,33(2): 34-37,43.

13 曹洪欣,徐維. 基于循證醫學的電子病歷資源整合與挖掘的宏觀模型構建[J].圖書館理論與實踐,2010,(9):43-45.

14 Chae YM, Ho SH, Cho KW, et al. Data Mining approach to Policy Analysis in a Health Insurance Domain [J]. International Med Information, 2001, 62(8): 103-111.

Research on Massive Medical Data Mining Analysis Method Based on Evidence-based Medicine

SUNXiang-dong,Ningbo

HealthInformationCenter,Ningbo315010,

China;HUANGXiao-qin,

HuaweiTechnologiesCo.,Ltd,Shenzhen518129,China;ZHUChun-lun,

NingboHealthBureau,Ningbo315010,China;

LUChuan-tong,

TANGLing,

NingboHealthInformationCenter,Ningbo315010,China;ZHANGKe,

NingboHealthBureau,Ningbo315010,China;

ZHANGHui,CHENXiao-yan,

WENGKe-wei,

NingboHealthInformationCenter,Ningbo315010,China

From the perspective of evidence-based medicine, taking the project of intelligence health insurance sysem in Ningbo as an example, the paper introduces the application of data mining method in medical field, based on the above it elaborates the analytical steps, research contents, analytical methods, key technologies, model construction, the structure and function of the platform in massive medical data mining, etc.

Evidence-based medicine; Data mining; Analysis model

2013-10-08

孫向東,碩士,副研究員,出版著作1部,發表論文17篇。

2012年寧波市科技局服務業示范項目“基于循證醫學的海量數據挖掘分析平臺”(項目編號:2012F1014)。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2014.03.003

猜你喜歡
數據挖掘信息模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 亚洲精品午夜无码电影网| 国产微拍精品| 人人爽人人爽人人片| 亚洲三级电影在线播放| 久草视频精品| 欧美日韩第三页| 美女无遮挡被啪啪到高潮免费| 黄色污网站在线观看| 美女扒开下面流白浆在线试听| 亚洲大尺度在线| 欧美一级特黄aaaaaa在线看片| 国产亚洲高清在线精品99| 久久无码av三级| 国内丰满少妇猛烈精品播| 欧美国产视频| 国产精品无码影视久久久久久久| 综合亚洲色图| 在线永久免费观看的毛片| 国产精品片在线观看手机版| 狠狠躁天天躁夜夜躁婷婷| 精品国产中文一级毛片在线看 | 欧美激情视频在线观看一区| 99久久精品国产精品亚洲| 91香蕉视频下载网站| 五月婷婷激情四射| 在线免费看片a| 欧美一级黄片一区2区| 91青青视频| 思思热在线视频精品| 在线五月婷婷| 日韩高清成人| 91久久青青草原精品国产| 国产美女无遮挡免费视频网站| 久久国产精品电影| 亚洲毛片网站| 黄片一区二区三区| 久久性妇女精品免费| 91精品国产91欠久久久久| 国产欧美日韩在线在线不卡视频| 欧美在线视频不卡第一页| 91麻豆精品视频| 农村乱人伦一区二区| 午夜精品久久久久久久99热下载 | 992Tv视频国产精品| 日韩天堂在线观看| 欧美激情视频在线观看一区| 中文字幕免费播放| 日韩成人高清无码| 伊在人亚洲香蕉精品播放| 亚洲女人在线| 国产老女人精品免费视频| 亚洲三级电影在线播放| 亚洲精品色AV无码看| 99青青青精品视频在线| 亚洲五月激情网| 美女潮喷出白浆在线观看视频| 色135综合网| 欧美69视频在线| 伊人久综合| 久久久噜噜噜| 色天堂无毒不卡| 97国产一区二区精品久久呦| 久草热视频在线| 欧美日本视频在线观看| 久久成人18免费| 国产精品人莉莉成在线播放| 91小视频在线观看| 伊伊人成亚洲综合人网7777| 91亚瑟视频| 欧美精品啪啪| 天天综合网站| 欧美激情视频二区| 国产精品19p| 欧美五月婷婷| 青青青草国产| 成人免费午夜视频| 国模在线视频一区二区三区| 日本高清视频在线www色| 国产原创自拍不卡第一页| 婷婷丁香在线观看| 青草91视频免费观看| 国产成人成人一区二区|