唐德玉,楊進
摘要:“數據倉庫與數據挖掘”課程這幾年來發展迅速,各大學計算機相關專業都開設了該門課程,但由于課程內容比較抽象,對非計算機專業的教學,一直是很多教學者研究的問題。對此,我們根據醫學院校的特點,提出了一種目標驅動的教學框架。
關鍵詞:醫學院校;目標驅動;課程設計;畢業論文
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2012)12-0218-02
一、背景
“數據倉庫與數據挖掘”是國內外高等院校一門重要的課程,是國家基礎教育較為重視的一門學科,受到不同專業學生的喜愛。其教學目標是提高學生的數據分析水平和能力,除了教授學生數據分析的常見方法之外,還將引導學生如何對實際的問題進行建模,如何對模型進行簡化和求解。利用實例教學等方法,可以很好地將數據挖掘中的抽象概念、模型、公式等闡述清楚,讓學生易于理解和接受。近年來,數據挖掘技術在醫學領域中的應用越來越廣泛。在疾病診斷、治療、器官移植、基因研究、圖像分析、康復、藥物開發、科學研究等方面都獲得了可喜的成果。運用各種數據挖掘技術了解各種疾病之間的相互關系、各種疾病的發展規律,總結各種治療方案的治療效果,以及對疾病的診斷、治療和醫學研究都是非常有價值的。因此,我們學院也把這門課程作為計算機專業及信息管理與信息系統專業的必修課。把計算機與醫學結合,使得學生的培養方案全面包括了計算機與醫學的知識點。由于該課程原本屬于研究生階段開設的專業課程,教材也大多側重于介紹體系結構、算法原理、效率分析與改進等理論知識,其中所涉及的內容大多比較深,許多知識都超出了本科生的接受范圍,此外,教材對相關理論在實際應用方面的說明也比較少,不利于安排實驗教學。因此要實現“數據倉庫與數據挖掘”課程的教學目標,必須在理論教學和實驗教學環節綜合考慮學時多少、教學條件以及學生的接受情況等因素,靈活地加以選擇安排。
二、存在的問題
主要包括以下幾方面:①課堂上以教師講、學生聽的教學形式為主,學生學習處于被動狀態,他們的創造性因此被嚴重扼殺;②教師對專業課程體系和學生的知識體系不夠重視,對課程體系的講解不到位,造成學生在學習時課程之間聯系不上,知識銜接不好,對知識的運用和融會貫通比較差;③實驗與理論脫節。“數據倉庫與數據挖掘”課程理論講授的算法與實驗軟件中的算法有很大差距,使得學生難以理解。比如對于理論上講授的關聯規則算法,實驗中使用SQL SERVER 2005中的商務智能工具做實驗,學生發現有很多參數與理論上講授的有很大不同;④醫學院校的學生對純粹計算機理論知識接受困難。由于該門課程是交叉學科,涉及計算機、數學、統計學等知識,如果學生的其他學科學得不好,就會對該課程的學習產生障礙;⑤教師講授沒有把理論課程結合到實際應用中。有很多學生不知道學習這門課的意義,老師沒有很好引導學生,激活他們的學習熱情。
三、目標驅動的教學框架
對于以上問題,本文提出了一個新的教學體系,設計了一套基于目標驅動的教學框架,把教師與學生緊密聯系起來,從教學大綱的設置,教材的選擇,理論教學,實驗教學,課程設計及畢業論文,全面引導學生從初步了解到深入學習的過程。對于我們學校的實際情況,有兩個專業的學生要學習這門課程。一個是計算機科學與技術專業,一個是信息管理與信息系統專業。對于兩個不同的專業,我們設置不同的教學大綱。比如對于計算機專業的學生,數據倉庫和數據挖掘教學總時數為72學時,其中理論為54學時,實驗為36學時。
1.理論教學。對于信息管理與信息系統專業的學生,我們可以設置如下的教學計劃,可分為三個主要部分。我們教材選擇韓家煒的《數據挖掘概念與技術》,第一部分:第一至四章為數據挖掘的基礎知識,包括數據倉庫和數據挖掘的基本概念和相關知識介紹;第二部分:第五、六章介紹了數據挖掘的算法和工具;第三部分:第七章是數據挖掘的聚類分析的實際應用。本課程是信息管理與信息系統專業本科生專業必修課。通過該課程的學習,要求學生掌握數據倉庫和數據挖掘的基本概念,了解基本方法和應用背景。掌握數據倉庫的設計和建立,掌握數據挖掘的主要步驟和實現方法,數據挖掘的常用算法,實現數據挖掘的具體操作。理論學時的安排,第一章緒論(6學時);第二章數據倉庫(4學時);第三章數據預處理(8學時);第四章數據挖掘發現知識的類型(8學時);第五章數據挖掘中常用算法(12學時);第六章數據挖掘的工具及其應用(8學時);第七章數據挖掘應用實例(8學時)。
2.實驗教學。本課程配合理論教學,通過系統的實踐教學鍛煉,著重培養學生的獨立分析問題和解決問題的能力,熟練掌握數據倉庫的設計和建立以及各類數據挖掘方法,使學生具有一定的數據分析和挖掘能力,能在認識基礎上,提出有效的數據挖掘方法,依據實際例子,寫出解決方案。學生應在實驗課前明確實驗的目的和要求,然后針對相關問題寫出解決方案。實驗時對實際方案的運行結果應能進行分析并提出改進方法,最終寫出實驗報告。通過實驗教學應達到以下基本要求:①理解數據倉庫的工作機理及其構建過程;②掌握典型的數據倉庫系統及其開發工具的使用;③理解數據挖掘技術的工作原理與流程;④掌握典型數據挖掘工具的使用;⑤掌握幾種典型的數據挖掘算法;⑥掌握使用SQL SERVER 2000和SPSS工具解決實際問題。實驗成績包括:實驗教學過程成績、實驗報告成績,各占50%。實驗過程表現成績包括:學習態度是否認真、實驗操作是否正確規范、基本技能掌握程度是否具有創新意識等方面。實驗報告成績包括:實驗報告格式是否正確、原理是否論述清楚、實驗結果分析討論是否符合邏輯,報告字跡是否清楚等方面。
3.課程設計。理論課和實驗課接近結束時,我們把最后三周作為本門課程的課程設計。課程設計的目的是讓學生進一步深刻理解所學知識。由于本門課程很多算法不容易理解,如何讓學生把所學知識結合到醫學應用中是課程設計的關鍵。比如我們對信息管理與信息系統專業的學生課程設計,要求學生每人選擇一個老師給定的題目,課程設計有詳細的要求,比如題目“數據挖掘在醫學診斷中的應用”要求學生能把本門課程相關的算法結合使用,最后給出詳細的分析。通過課程設計,我們發現,學生對本門課程更有興趣。
4.畢業論文。我們把課程一般開設在大三的下學期,也就是說學生學完這門課程后,就做了該門課的課程設計,使得學生對數據挖掘相關知識有了比較深刻的認識。這樣,我們可以引導學生畢業論文的選擇。畢業論文畢竟是反映學生大學四年所學知識,也對他們將來就業起到提前培訓的作用。把理論結合實踐,老師對學生的引導也十分重要。
我們根據醫學院校的特征,提出了一套目標驅動的教學理念,從學生認識這門課程到學生理論課的學習,實驗課的學習,課程設計及畢業論文的完成,在老師的指導下,使用我們的考核體系,可提高學生對所學課程的興趣。
參考文獻:
[1]高圓圓,呂慶文.數據挖掘課程的教學思考[J].醫學信息,2009,(11).
[2]梁斌梅,呂躍進.目標驅動的專業課教學法及其在《數據挖掘》課程中的應用[J].高教論壇,2008,(06).