劉尚輝,曹陽,霍妍,馬瑾,婁巖
(中國醫科大學公共基礎學院,遼寧沈陽110001)
●課程建設
醫學院校大學生數據挖掘IT技能培養的研究與實踐
劉尚輝,曹陽,霍妍,馬瑾,婁巖*
(中國醫科大學公共基礎學院,遼寧沈陽110001)
在網絡、數字化信息迅速發展的今天,各行各業積累的數據越來越多,尤其在醫院的工作流程中積累了大量的醫學數據。毋庸置疑,我們已經處在一個真正的大數據時代,如何跟上時代發展,培養出適應時代需求的醫學人才,是醫學教育工作者面臨的問題。數據挖掘(Data Mining)就是從大量的實際數據中提取隱含信息和知識的新型學科,在醫學院校計算機課程中開設針對醫學數據的數據挖掘課程,能夠開發學生在大數據時代學習和工作中的潛能,培養高素質的醫學人才。
醫學數據挖掘;計算機教育;教學研究
數據挖掘(Data Mining),也可被稱作是基于數據庫的知識,是指從存放在數據倉庫或其他信息庫中的、大量的數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程[1]。數據挖掘技術是近年來一個十分活躍的研究領域,他是在數據庫、人工智能、統計分析和模式識別等基礎上發展起來的一門獨立學科,主要技術有關聯規則、序列模式、分類/回歸分析、決策樹、聚類、神經網絡、Web挖掘等等[2]。目前在制造、金融、醫療、市場等多個領域廣泛應用。
國內對數據挖掘的研究起步較晚,特別是在醫學領域開展的研究成果更少,目前面臨的問題是“數據海量,信息缺乏”。調查顯示,目前我國大部分醫院的管理信息系統中,80%以上只是簡單的數據查詢與基本計算功能,隱藏在這些數據中的潛在關聯與知識沒有被發現與利用,大量的醫學數據資料被浪費。
當醫學數據的積累量足夠大的時候到來時,數據的迅速增加與數據分析方法的選擇和使用之間的矛盾就變得越來越突出,在已經到來的大數據時代,我們能做些什么?如何在醫學教育領域有所作為是每個教育工作者要回答的問題。
國外數據挖掘技術的研究成果已經廣泛應用于各個領域,國內許多的科研部門和高校先后開展了知識發現的基礎理論及其應用研究,國內綜合性大學基本都開展了數據挖掘的課程,但醫藥院校開展得比較少,計算機課程在醫學數據處理上很難滿足實際醫學問題的需求,我們的課程應該教會學生管理信息,分析信息,挖掘信息潛在價值的IT技術本領。在醫學院校計算機課程中增加數據挖掘方面的內容,不僅是學生實際工作的需求,更應該是醫學院校增加關注與扶持的計算機課程教學內容。
通過在醫學院校開設數據挖掘課程,學生在學習及工作過程中,可以將該技術應用到醫學的許多領域。
1.基礎醫學領域的DNA序列分類、基因組測序數據分析等方面,基因微陣列的數據挖掘是基因數據分析的新方向,基因微陣列數據挖掘方法常用聚類分析方法[3],Olivier Tassy提出了一個數據挖掘預測系統Manteia,用于分析脊椎動物的基因與遺傳病的關系,這個數據挖掘系統是個綜合性的數據庫,同時為基因數據分析提供挖掘工具[4]。
2.疾病診治和預測,通過對與患者有關的大量醫學數據進行挖掘處理,發現有意義的信息支持臨床決策。如病因分析中一項研究代謝病與生活方式的關系,通過DCIP算法挖掘出了生活方式中15個與代謝疾病相關的屬性,例如性別、飲酒、工作類型、睡眠等,而且其中80%的屬性被專家文獻證實[5]。
3.流行病學和醫學統計領域,如將決策樹、回歸和神經網絡方法結合起來分析疾病死亡率的影響因素,從而彌補了神經網絡方法輸出的結果難以理解的不足。
4.藥物分析、毒理學研究,數據挖掘廣泛應用于藥物不良反應監測、藥物間作用等方面,主要技術有非比例分析、統計回歸、非監督機器學習[6]。
5.影像分析,如通過收集大量患者的暴露劑量,對不同曝光劑量進行“分類”挖掘,實現暴露劑量指標的標準化。
6.醫院和衛生事業管理領域,醫院信息系統提供了大量的信息資源,數據挖掘可以從中提取有價值的決策支持信息,為醫療保健政策的制定、衛生資源的合理配置提供了參考。
理工類學生有一定的IT技術基礎,課程內容更偏重于理論知識和解決問題的算法研究;而醫學院校學生IT技術基礎薄弱,因此在教學上要偏重于醫學應用的層面,在醫學應用上來引導學生的學習與實踐。
1.醫學數據挖掘課程是對學生從事醫學研究有明確應用意義的課程。這門新興的課程在教學內容上要突出基本知識、挖掘方法的選擇、挖掘工具的使用及結果的分析評價等方面的講授。教會學生自我探索醫學信息中潛在的知識與規律、循證決策技能、科學推斷預測疾病發展趨勢等手段。
2.將數據挖掘技術與醫學具體問題相結合,首先總結出不同的醫學問題,教會學生對不同問題用不同的挖掘方法解決。如將決策樹、關聯分析等算法應用于具體的醫學數據中,挖掘數據之間潛在的相互關系,相互依賴與規則。
3.本課程與其他醫學計算機課程不同,可以更直接、更深入的與醫學應用結合,是醫學科研工作者應該具備的數據建模,各種因素間潛在關系的深層次分析的手段與工具。
4.目前在實現醫院的科學化、信息化、數字化的管理形勢下,本課程可以借助醫院信息管理平臺,不斷提高學生對醫療管理信息的分析和預測的能力,為醫院的科學決策提供更多信息化的技術支持。
數據不能自動變成知識,數據中暗含的知識只有人設法發現,讓學生找到大量的數據與找到有用的知識完全是兩回事。中國醫科大學已經為本科生開設了4年的醫學數據挖掘課程,這里介紹一些教與學的做法。
1.課上典型案例展示與課下實訓相結合的教學模式,既兼顧對數據挖掘的基本知識、基本方法和應用軟件操作的多重訓練,又突出實際醫學挖掘的應用案例,強化教學中的實訓演練。
2.實驗教學建設上,突出具有醫學知識背景的綜合性實驗內容,培養學生的實踐能力與創新精神。例如:數據挖掘在疾病輔助診斷中的應用等。
3.重視課程資源建設,不斷補充、更新和優化教學資源。如各種基礎醫學、臨床醫學、生物醫學等的數據資源收集,醫學案例資源是此課程成敗的關鍵。
4.項目驅動團隊協作。學生按組上網檢索國內外醫學數據庫、醫院課間實習收集病例、與醫院相關部門合作等方式獲取醫學實際數據,制定項目計劃表,嚴格按照項目進度完成實訓內容,最后師生一起驗收成果。
5.在教與學的過程中師生共同成長,培養青年教師主講醫學數據挖掘課程及從事該課程的相關研究,如青年教師與學生共同查閱文獻寫綜述論文,通過各種渠道一起收集教學數據資源,共同撰寫發表研究論文等等。
通過為醫學生開設數據挖掘課程,將計算機技術與醫學實際需要深入結合,收獲了將醫學數據轉化成知識的教學成果。學生掌握了發現數據中存在的知識,并預測未來發展趨勢的技術本領。教學中也遇到了一些問題,如在醫學數據采集、更新及清洗方面,由于工作量大存在一些困難,還有挖掘出的結果需要醫學驗證等問題。這些問題已經作為我們今后的工作方向,由于醫學本身的特殊性,在該領域進行探索研究必將取得可惜的收獲。
[1]李雄飛,董元方,李軍,等.數據挖掘與知識發現.第2版[M].北京:高等教育出版社,2010:2-5.
[2]SOMANKP,等著.范明,牛常勇,譯.北數據挖掘基礎教程[M].北京:機械工業出版社,2009:1-25.
[3]Mercado C P,Byrum S,Beggs M L,et al.Impact of elevated plasma serotonin on global gene expression of murine megakaryocytes[J].PloS one,2013,8(8):e72580.
[4]Tassy O,PourquiéO.Manteia,a predictive data Mining system for vertebrate genes and its applications to human genetic diseases[J].Nucleic acids research,2013:gkt807.
[5]Huang Y C.The application ofdataMining to explore association rules between metabolic syndrome and lifestyles[J].The HIM journal,2013,4(6):44-49.
[6]Harpaz R,DuMouchelW,Shah N H,etal.Novel data-Miningmethodologies for adverse drug event discovery and analysis[J].Clinical Pharmacology&Therapeutics,2012,91(6):1010-1021.
Data m ining:Training IT skills for medical college students
Liu Shanghui,Cao Yang,Huo Yan,et al
(China Medical University public foundation college,Shenyang 110001,Liaoning,China)
data has been increasingly accumulated in today’s information society.In this big data era,the training ofmedical staff needs to keep up with the times.A new subject,datamining extract the hidden information from the huge quantity of data.Offering datamining class to students can bring them better job potentials.
Medical datamining;computer education;teaching and research
G642.3
A
1002-1701(2015)03-0042-02
2014-01
劉尚輝,女,碩士,副教授,研究方向:醫學高校計算機教育。
*通訊作者
10.3969/j.issn.1002-1701.2015.03.023