999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

臨床醫學數據的分析方法與利用

2018-01-29 22:43:41姚純旭嵇承棟付強強
中國醫藥導報 2017年35期
關鍵詞:數據分析

姚純旭+嵇承棟+付強強

[摘要] 本文使用循證醫學方法,對“臨床醫學數據的分析方法與利用”主題進行取詞檢索,檢索中國生物醫學文獻、萬方、維普、中國知網四大主流中文數據庫,納入相關文獻進行分析。從臨床數據的分析流程、臨床數據的分析方法、數據在醫療領域的利用以及面臨的挑戰等幾個方面展開討論并加以歸納,為醫療大數據時代的臨床數據管理提供參考。

[關鍵詞] 臨床數據;數據分析;數據利用

[中圖分類號] R19 [文獻標識碼] A [文章編號] 1673-7210(2017)12(b)-0163-05

[Abstract] Based on the theory of the evidence-based medicine, the relevant information of the topic “analysis and utilization of clinical data” was searched. Sinomed, Wanfang Data, VIP and Chinese National Knowledge Infrastructure databases were searched to comprehensively collect related articles. The paper elaborates the following aspects: the data processing, the statistical analysis and utilization of the clinical data in the medical field as well as the confronting problems, in order to provide some references about clinical data management in the forthcoming years for big medical data.

[Key words] Clinical data; Data analysis; Data utilization

隨著醫療技術的飛速發展以及醫療大數據時代的到來,面對激增的海量臨床數據,臨床數據管理的重要性日益凸顯。2000年美國公布了《臨床研究數據管理規范》,并進行了多次后續修訂,該規范對所有臨床研究的數據收集流程、不良事件報告、數據質量控制、文件的分類歸檔以及數據管理培訓等進行了明確的規定[1]。1999年我國頒布《藥品臨床試驗管理規范》(good clinical practice,GCP),規定臨床試驗數據應正確無誤并及時地錄入分析,確保臨床數據質量以及數據的可溯源性[2]。2003年我國GCP參照國際公認原則進行了重新修訂,指出“所有涉及數據管理的各種步驟均需記錄在案,以便對數據質量及試驗實施進行檢查”“數據管理應用適當的程序保證數據庫的保密性,具有計算機數據庫的維護和支持程序”,可更加強調臨床數據的可溯源性[3]。2016年,國家頒布《國務院辦公廳關于促進和規范健康醫療大數據應用發展的指導意見》,提出健康醫療大數據作為國家重要的基礎性戰略資源,規范并推動其融合共享,開放應用勢在必行[4]。

現今對“醫療大數據”的分析方法日新月異,常用的臨床數據分析技術涉及到很多學科,包括醫學統計學、職業流行病學等,因此如何提取不同類型的臨床資料對有用的信息進行分析和利用是臨床數據管理的重要命題[5]。

1 臨床數據分析流程

臨床數據除具有“大數據”的特征外,還具有不完整性、冗余性、非標準化、隱私性、價值高的特點[6-7]。數據采集方式往往使用病例報告表,包括紙質病例報告表和電子病例報告表,前者包含了大量的非結構化數據和半結構化數據,非結構化數據是數據結構或記錄格式未經標準化的一種數據形式,通常采用了自然語言錄入的方式;半結構化數據是部分結構化了的數據形式,相對于結構化數據,其構成更為復雜和不確定[8]。為了使這兩類數據更規范明了且有利于分析統計,需要通過語義分析以及數據提取將非結構化數據或半結構化數據轉化成結構化數據[7]。20世紀80年代開始臨床數據的采集開始逐步使用電子數據采集系統,方便研究者創建結構化的電子病歷系統,通過該系統,患者個體的醫療信息更加一目了然,有利于臨床醫生對病史進行追根溯源,并能夠在此基礎上建立臨床數據庫[1]。

臨床數據庫通過醫院信息系統、實驗室信息系統、放射信息管理系統及醫學影像存檔與通訊系統等采集臨床數據,囊括患者從入院到出院的所有診療信息。通過臨床數據庫可以構建臨床數據中心,醫務人員及臨床科研人員可以對臨床數據進行實時處理,并在數據交換平臺實現數據橫向或縱向的共享或流動。大規模的醫療數據集成臨床數據中心,利用臨床數據采集分析軟件可以對海量的醫療大數據進行統計學分析、數據挖掘、醫學建模,完成臨床數據的分析報告和臨床研究報告,再通過知識挖掘構建規則庫和知識庫,有利于臨床知識的管理,這樣又形成了知識管理的循環鏈(圖1)。另外,現有醫院在不斷更新臨床數據中心的同時又加入“臨床數據分析引擎”模塊和數據監測環節,當然這也對醫院各系統的兼容性提出了更高要求[9]。

2 數據分析

高質量臨床數據的獲得是臨床數據管理的基本要求,臨床數據必須是真實可信的,并且必須和研究目的相關,還要適合于統計分析[10]。臨床數據分析具體過程可分為采集、導入、統計和分析、數據挖掘。數據挖掘技術包括醫療大數據的預處理、算法(人工神經網絡、決策樹分析、隨機森林算法、聚類分析、貝葉斯算法等)、醫學建模、大數據的快速檢索與處理、數據安全等。

2.1 一般統計學分析

在臨床研究中應用最廣泛的是隨機對照試驗,在數據分析時,不同統計方法對結果的解釋也不同,因此通過不同的資料類型選擇適當的統計學方法尤為重要。循證醫學對隨機對照試驗所獲得的數據進行Meta分析,將主題詞加自由詞組合,通過循證醫學方法在數據庫中大范圍檢索相關文獻,將同質性高的文獻數據進行合并,計算合并效應量。endprint

2.2 數據挖掘

數據挖掘在研究領域中被稱作“數據庫中知識的發現”[11]。醫學數據挖掘是從大量醫學數據中通過各種算法來尋找疾病新規律的過程。數據挖掘技術包涵多種算法,不同樣本類型通過不同算法對臨床數據進行分類,建立醫學模型。大數據的分析需要與計算機技術結合,機器學習就是統計學、算法理論與人工智能結合的一門交叉學科,并在當今無人駕駛技術、人類基因組技術中獲得大力發展。

人工神經網絡算法是模仿大腦神經網絡的結構建立的信息處理方法,它的特征是“計算機代碼+數學函數”,它的本質是“學習”,將訓練數據在一定的“學習規則”中進行學習,獲取特征信息和參數后建立人工神經網絡,新的數據通過神經網絡計算出對應的輸出,這就是“感知器學習規則”[12]。例如要評價A家不同醫院的醫療水平,可以先用B家醫院的數據作為訓練數據,醫護人員、床位、就診數量和死亡率5個指標作為輸入(X),B家醫院建立的知識庫作為突出權值(W),經過處理得到輸出(Y),經學習后網絡會自動處理A家醫院的數據(圖2)。

決策樹算法和支持向量機與神經網絡算法較相似,都是學習型的機制,是兩種常用的數據分類方法。決策樹算法通過構建決策樹分類器處理不同的數據類型,計算出各特征屬性的信息增益后,選取信息增益最大的特征屬性作為節點,生成“樹狀結構”圖[13]。當數據量龐大到高通量多指標(如人類基因表達譜)時,提取特征屬性越發不易,此時便由決策樹算法引申出隨機森林法的概念,是基于決策樹算法的學習方法,對樹的每個節點的特征空間做一次窮盡搜索,將生成的多棵決策樹組成隨機森林,分類結果按樹分類器的投票多少決定[14];支持向量機是使用核函數將非線性數據投射到一個更高維的空間里即“升維”(從一維到二維,從二維到三維,從n維到n+1維)進行運算,運用泛函的方法可以將極小的樣本量推演出全體的數據[15],支持向量機堪稱最有效的數據分類工具[16]。

聚類分析屬于多元統計分析方法,常用于中醫證型的辨證分析,主要分為K均值聚類法和系統聚類法,常用的統計量是距離和相似系數。K均值聚類法是指定某些觀測點凝聚為初始點,計算初始分類的中心位置進行聚類,再次計算中心位置并反復循環,直到中心位置很小為止;系統聚類是將樣本間距離最小的合并為一類,計算與其他類的距離后再進行最小距離的合并,每次減少一類,直至合并為一大類[17]。

貝葉斯算法是建立在概率學的基礎上的統計學方法,被稱為“統計學歷史上的飛躍”,是解釋性建模和描述性建模的又一新工具,對疾病數據的研究很有幫助,可以用來表示疾病與相關癥狀之間關系的概率,形成的貝葉斯網絡是一種有向無環圖,兩個節點間以單箭頭連接,其中一個節點是“因”,而另一個節點是“果”(圖3)。

2.3 醫學建模

醫學建模是臨床大數據通過數學模型的建立尋找疾病發生發展的規律,即對醫學數據進行模式識別,模式識別是將具體事物歸到某一類別的過程[18]。一般醫學數據有7種模式識別方法:解釋性數據建模、描述性建模、預測性建模、知識性建模、序列模式建模、依賴關系建模、異常與趨勢建模。

解釋性模型的本質是模糊建模[19],通俗地講就是對事物進行歸因分析,找尋一個模糊集合中的共性得出一個普適規律,最具有代表性的應用是指紋和人像識別技術,也應用于醫療決策支持[20];描述性建模是從許多描述性數據(如身高、體重)入手,從具體到抽象、從特殊到一般地對事物進行歸納和演繹(即身高與體重的關系);預測性建模是通過整合現有的大數據對未來事件進行預測,最著名的案例是谷歌公司在2009年建立的流感預測平臺運用人才思維模型預測流感爆發[21];知識性建模是利用先驗的知識經驗來進行新規律的發現,可用于我國中醫學中大量古方的數據篩選[22];序列模式建模和依賴關系建模比較類似,是對多因素中的兩組或幾組進行分析,得出不同的因素之間是關聯、共生還是依賴關系;異常與趨勢模型是利用數據的離散值來判讀事件發生風險的模型。

2.4 數據分析軟件

臨床研究中一般統計分析軟件有Excel、SPSS、SAS、Stata、Sigmaplot、Graphpad Prism、Origin等,這些軟件不僅支持統計學分析,還帶有繪圖功能。循證醫學常用分析軟件有Endnote文獻管理軟件、Review Manager分析軟件等。數據挖掘軟件中許多是建立在多種計算機語言上的,例如R語言是一個用于統計計算的開源軟件,也是提取臨床數據的良好工具;建立在SQL語言檢索基礎上的軟件Microsoft SQL server,為臨床數據模型建立提供科學依據;感知器學習規則中常用到Python語言。SPSS、SAS和Stata除了用于一般統計,也可用于數據挖掘,另外還有Weka軟件、Matlab軟件等。對于臨床工作者而言,SPSS、SAS、Matlab、Weka更為實用。

3 數據利用

美國是世界上最早關注臨床數據利用的國家之一,20世紀70年代美國啟用醫院信息系統,較早開始了醫療信息化,2007年《美國醫學信息協會白皮書》指出開展臨床研究能促進醫療數據的再利用,2013年《美國醫學信息年報》通過調查研究歸納出臨床信息學的6類主題,其中包括了臨床數據的再利用研究和數據管理[23-25]。目前,臨床數據的應用方向是醫院臨床數據中心與“互聯網+”醫療大數據平臺的構建。醫療大數據平臺的服務對象包括:醫務人員、患者、管理者和研究人員。美國作為最早涉及這一領域的國家,建成了第一個也是最大的臨床研究和社區治療項目相結合的醫療大數據平臺——美國藥物濫用治療臨床試驗網絡[26]。建設醫療大數據應用平臺具體可以應用于數據查詢分析、健康檔案管理、診療方案分析、醫療透明化和健康趨勢預測等方面[27]。

3.1 數據公開

建立臨床數據中心,將不同數據庫的數據在信息交換平臺進行整合共享,強調臨床數據的公開透明性和可重復性,這有利于臨床質量指標的評價和臨床數據的溯源,通過挖掘分析,追溯深層原因。臨床大數據的共享也便于評價不同醫療機構或地區的醫療服務,有利于調整和優化整體醫療水平。另外,公開臨床研究的數據將所涉及的倫理問題遁于無形。endprint

3.2 決策支持

臨床數據可以用于臨床決策支持和醫院管理支持。基于臨床數據中心對醫院進行數字化建設,使患者的就診記錄、電子病歷文檔等信息與社區共享,聯合醫療物聯網以及移動醫療App等技術建立電子健康信息檔案,使醫生能夠根據患病情況、藥物療效、不良反應等做出快速判斷,輔助診斷疾病,制訂診療方案并實行遠程干預,同時監視和評價臨床治療效果,并隨時調整治療方案;患者可以通過健康信息檔案進行自我健康管理,移動App為患者情況提供用藥提醒、異常值預警以及療效評價等;在優化醫院配置方面,管理者可以對就診量、床位設置或醫療費用的數據進行分析,為醫療設備和人員利用的最大化制訂可行性方案;另外,政府機構可以對轄區范圍內各家醫院進行住院病種指數、住院費用分析以及住院機構病種組合指數等的分析。

3.3 個體化診療和精準醫療

個體化診療的內涵包括測序技術、生物標志物的開發和藥物基因組學的參與。通過這三大核心技術“量體裁衣”,制訂具有針對性的臨床治療方案,提高臨床治療效果,促進疾病的早期檢測和預防。這就引入了另一個“精準醫學”的概念。2015年時任美國總統奧巴馬在美國國情咨文中提出“精準醫學計劃”,將這個在2011年首次被提出的名詞推到醫學界的熱點前沿[28]。醫療機構的海量臨床數據中包括豐富的分子生物學、基因組學信息,將這些信息加以提取后應用于臨床,使治療方案更具針對性,將損傷控制在最低,又能達到最佳治療效果。因此,精準醫療力求治療方案最大程度地降低患者痛苦,也對醫療資源合理利用提出了更高要求。這與數據的處理、挖掘、整合密不可分,常常需要使用多維度的統計方法和算法。總之,個體化醫療和精準醫學將推動預防為主、關口前移的醫療模式的發展。

3.4 知識庫的管理

將臨床數據進行分析并建立醫學數據模型,通過臨床數據管理和循證方法構建知識圖譜,實現知識挖掘和知識管理的循環,知識庫的建立和更新維護有利于積累醫療經驗、提供臨床輔助診斷、典型案例查詢和學習以及臨床決策支持等[29]。

精準醫學研究中更強調了知識庫管理的重要性,通過隊列研究以及組學分析獲得大樣本數據,經過標準化構建成知識圖譜,有助于信息查找和分析、知識再造和共享,以及疾病診斷和健康管理等方面,更好地應用于科研和臨床。

4 面臨的挑戰

對醫療大數據分析與應用的發展是在曲折中前進的過程。例如,2009年谷歌工程師建立了流感預測平臺,用于預測H1N1全美國范圍的傳播[21],而2013年Science報道了該平臺預測的失敗,文章提出,到2013年2月,預測得出的全美國流感樣癥狀患者的范圍占全國人口的比例幾乎是實際值的2倍,有學者分析大數據失敗的原因:一為數據來源單一的問題,二為臨床數據的公開問題,三為快速更新變化的算法問題,這也代表了當前臨床數據分析和利用存在的共性問題[30]。因此要使醫療數據分析更加精準,首先要做好數據源的追蹤,數據源是否可靠是分析結果理想與否的關鍵,其次要根據不同臨床數據的資料類型選擇統計方法,使用合理的算法來解決當下的臨床問題。

5 總結

隨著醫療與信息技術的迅速發展,醫療信息的電子化和結構化已在我國各大醫院中成為主流。臨床數據的合理分析與利用需要以建立臨床數據庫為前提下,在信息交換平臺實現交流,臨床數據需要先進行預處理,再使用一般方法或數據挖掘的方法進行數據分析,通過“機器學習”等方法建立醫學模型,再將目標數據輸入機器中得到輸出。這種基于循證醫學對臨床數據進行分析利用的應用已得到明顯成效,前景也更加廣闊。

[參考文獻]

[1] 謝高強.數據管理在臨床研究中的地位和作用[J].北京大學學報:醫學版,2010,6(42):641-643.

[2] 國家藥品監督管理局.藥品臨床試驗管理規范[J].中國新藥雜志,1999,8(11):422-426.

[3] 國家食品藥物監督管理局.藥物臨床試驗質量管理規范[J].中國醫藥導刊,2003,5(5):367-372.

[4] 魏婉.關于促進和規范健康醫療大數據應用發展的指導意見[J].科研,2016,(9):306-307.

[5] 屈景輝,廖琪梅,許衛中,等.醫學信息數據庫的建立與數據挖掘[J].醫學爭鳴,2001,22(1):88-89.

[6] 李志剛,朱志軍.大數據時代:生活、工作與思維的大變革[J].西域圖書館論壇,2013(1):213-213.

[7] 劉柏嵩.基于知識的語義網:概念、技術及挑戰[J].中國圖書館學,2003,29(2):18-21.

[8] 馬惠芳.非結構化數據采集和檢索技術的研究和應用[D].上海:東華大學,2013.

[9] 李維.基于大數據技術的臨床數據中心與智能分析應用平臺構建[J].醫學信息學雜志,2014,35(6):13-17.

[10] 王禹毅,韓梅,陳妮妮,等.從如何獲得高質量臨床數據探討臨床試驗的數據管理[C]//中醫/中西醫結合循證醫學方法研討會會議材料.2013.

[11] 楊海青.數據挖掘技術在醫院管理中的應用[J].中華醫院管理雜志,2005,21(7):497-499.

[12] 龐璋帆,羅震鈞,定天明,等.基于神經網絡算法的藥品安全指數權值策略研究[J].醫藥前沿,2016,6(1):370-371.

[13] 劉昆,劉業政.基于決策樹的醫療數據分析[J].計算機工程,2002,28(2):41-43.

[14] 方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J].統計與信息論壇,2011,26(3):32-38.

[15] 張學工.關于統計學習理論與支持向量機[J].自動化學報,2000,26(1):32-42.endprint

[16] 杜喆.幾類支持向量機變型算法的研究[D].西安:西安電子科技大學,2009.

[17] 黃宏興,柴生颋,黃紅,等.骨質疏松癥中醫證型的聚類分析[J].廣州中醫藥大學學報,2007,24(3):180-183.

[18] 毛勇,周曉波,夏錚,等.特征選擇算法研究綜述[J].模式識別與人工智能,2007,20(2):211-218.

[19] Tsoukalas LH,Uhrig RE,Zadeh LA. Fuzzy and neural approaches in engineering[C]// John Wiley & Sons,Inc.1997.

[20] 俞夢孫.關于我國醫學信息技術的發展[J].中國生物醫學工程學報,2008,27(2):161-163.

[21] Ginsberg J,Mohebbi MH,Patel RS,et al. Detecting influenza epidemics using search engine query data [J]. Nature,2009,457(7232):1012-1014.

[22] 陶御風,袁久林,梁慧鳳,等.淺談古方篩選利用的思路與方法[J].上海中醫藥雜志,2005,39(5):42-43.

[23] 劉曉,俞志元.美國醫院和區域衛生信息化發展及其對中國的借鑒[J].醫學信息學雜志,2010,31(5):8-11.

[24] Safran C,Bloomrosen M,Hammond WE,et al. Toward a national framework for the secondary use of health data:an American medical informatics association white paper [J]. J Am Med Inform Assoc,2007,14(1):1-9.

[25] Embi PJ. Clinical research informatics:survey of recent advances and trends in a maturing field [J]. Yearb Med Inform,2013,8(1):178.

[26] Shmueliblumberg D,Hu L,Allen C,et al. The national drug abuse treatment clinical trials network data share project:website design,usage,challenges,and future directions [J]. Clin Trials,2013,10(6):977-986.

[27] 汪鵬.醫療大數據應用需求分析與平臺建設構想[J].中國醫院管理,2015,6(35):40-42.

[28] Collins FS,Varmus H. A new initiative on precision med?鄄icine [J]. N Engl J Med,2015,372(9):793.

[29] 袁浩.基于臨床數據中心的循證知識管理模式分析[J].醫學信息學雜志,2015,36(3):7-10.

[30] Lazer D,Kennedy R,King G,et al. Big data. The parable of Google Flu:traps in big data analysis [J]. Science,2014, 343(6176):1203-1205.

(收稿日期:2017-09-14 本文編輯:李岳澤)endprint

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 91精品伊人久久大香线蕉| 国产小视频a在线观看| 一级香蕉人体视频| 三上悠亚在线精品二区| 国产麻豆aⅴ精品无码| 中文字幕av无码不卡免费| 亚洲h视频在线| 国产成人综合欧美精品久久| 永久天堂网Av| 日本中文字幕久久网站| 国产高潮视频在线观看| 国产丰满大乳无码免费播放 | 国产经典三级在线| 国产 在线视频无码| 久久夜色精品| 久久亚洲国产视频| 91在线中文| av在线5g无码天天| 国产情精品嫩草影院88av| 日韩一区二区三免费高清| 手机在线看片不卡中文字幕| 国产真实乱人视频| 综合天天色| 亚洲精品高清视频| 国产视频a| 国产美女一级毛片| 日韩欧美91| 72种姿势欧美久久久大黄蕉| 免费国产无遮挡又黄又爽| 国产剧情一区二区| 国产无码网站在线观看| 久久婷婷国产综合尤物精品| 亚洲美女视频一区| 久久久久久尹人网香蕉| 欧美午夜精品| AV片亚洲国产男人的天堂| 国产精品福利导航| 国产高清在线观看91精品| 高清免费毛片| 青青操国产视频| 直接黄91麻豆网站| 国产一区二区三区精品欧美日韩| 欧美日韩在线国产| 国产一线在线| 久久特级毛片| 无码综合天天久久综合网| 亚洲欧美另类专区| 天堂在线www网亚洲| 国产手机在线观看| 色综合a怡红院怡红院首页| 人人澡人人爽欧美一区| 激情六月丁香婷婷| 国产制服丝袜91在线| 萌白酱国产一区二区| 亚洲综合经典在线一区二区| 女人18毛片水真多国产| 国产精品99一区不卡| 免费高清毛片| 久久综合国产乱子免费| 国产美女丝袜高潮| 久久综合成人| 九九热精品在线视频| 国产精品极品美女自在线看免费一区二区 | 亚洲色图综合在线| 欧美区在线播放| 亚洲第一区在线| 蜜芽国产尤物av尤物在线看| 国产精品v欧美| 一本无码在线观看| 久热re国产手机在线观看| 色噜噜狠狠狠综合曰曰曰| 久久综合丝袜日本网| 国产免费福利网站| 亚洲精品成人片在线观看 | 99精品视频在线观看免费播放| 中文字幕久久亚洲一区| 亚洲精品成人福利在线电影| 国产农村1级毛片| 1769国产精品免费视频| 国产在线精彩视频二区| 久久精品女人天堂aaa| 亚洲综合第一页|