馮俐


摘 要 闡述數據挖掘在教學設計的學習者分析過程、教學評價過程中結果評價和學生評教、在線學習環境分析和設計等多個環節中的具體應用及其實現方式,為教育工作者提供借鑒,最后提出數據挖掘在教學設計中的應用前景是開發和應用教學專用的數據挖掘工具。
關鍵詞 數據挖掘技術;學習者分析;在線學習環境
中圖分類號:G642.0 文獻標識碼:B
文章編號:1671-489X(2016)06-0035-02
1 數據挖掘及其教育用途
數據挖掘是一個多學科的交叉領域,從教學設計的角度來說,數據挖掘更像是一種技術,幫助人們從大量的數據中發掘有用的知識。數據挖掘對教學設計有哪些用途?首先要介紹數據挖掘本身具有哪些用途。數據挖掘的用途一般可以分為兩大類:描述性和預測性。描述性挖掘包括數據特征化、數據區分、關聯分析和聚類分析等,主要用于描述數據的特征、區分類別等;預測性挖掘包括分類、回歸等,主要用于預測數據將來的發展態勢等。
教育數據挖掘是將來自各種教育系統的原始數據轉換為有用信息的過程,這些有用信息可為教師、學生及家長、教育研究人員以及教育軟件系統開發人員所利用。如果有一些或大量的學習者數據,如個人的基礎信息數據和學習情況,就可以從中分析學習者的某些特征和預測規則等。
2 數據挖掘在學習者分析中的應用
學習者分析是教學設計過程最前的環節,也是很重要的一個環節。數據挖掘在描述學習者的知識結構和認知習慣上有突出優勢。從教務部門獲得學習者的基本信息(如年齡、性別、年級、專業等)和學習情況(學習者以往各門功課的成績、選修情況、圖書借閱記錄、自學時間等),對數據進行清理,處理缺失和噪音值,采用一定的編碼方案,將數據簡化壓縮(如各門功課的成績分成五個區間:0~40為很差,40~60為較差,60~80為中等,80~90為較好,90~100很好),再對數據進行規約(如離散化或概念分層等),如圖1所示。
將某學生考試成績數據清理,剔除并修改噪聲值,通過對數據進行編碼和規約,可把學生出生年份、性別、入學年份、成績等信息處理成簡單的二元或多元值(編碼和規約的程度根據挖掘目的來確定,圖中只是舉例說明)。經過這一些數據預處理操作,形成可挖掘的學習者數據。這是數據挖掘過程最耗時的工作,也是所有數據挖掘工作之前的基礎。
經過上一步工作,就可以用數據挖掘的相關技術處理數據了。通過對學習者以往各門功課成績的特征化分析,可以了解到學習者的前期知識結構情況;通過對多門課程偏重的認知能力分類,可以得到學習者認知能力的大致情況;通過對學習者選課記錄和圖書借閱記錄的預測分析,可以了解學習者的興趣方向。
3 數據挖掘在教學評價中的應用
數據挖掘中有個觀念是“強關聯規則不一定是有趣的”,這是說規則AB的置信度有一定的欺騙性,即使該規則的置信度很高,也可能兩者之間不相關或負相關。在教學評價中,可以用來幫助判斷兩個事項間的相關性。如某工科院校某年級共1000名學生,期末考試中某門程序設計課程中得分大于80分的人數有600人。平時,該年級喜好打網絡游戲的人數是700人,這些人里本門課程的期末成績大于80分的有400人,成績大于80分與喜愛網絡游戲的相依表如表1所示。可計算出喜好打網絡游戲的人中有57%的比例得到80分以上,這個比例在統計學中來說算是很高的置信度了。從這個年級學生成績數據來說,打游戲會得高分的規則是否成立?答案是否定的。因為打游戲得高分的比例比起總人數中得高分的比例60%少,所以打游戲與得高分呈一定的負相關。
學生評教產生大量的數據內容,采用數據挖掘技術對評教數據進行分析,彌補傳統思辨方法的不足。通過評教數據的相關性分析可以檢測學生評教的有效性水平,利用聚類和主成分分析的方法,分析影響評教成績的主要原因[1]等。馬秀麟等學者通過對兩所院校的評教數據進行分析發現,雖然有些客觀因素會影響到評估分,學生的評價結果是可信的和穩定的,學生對教師的評分和他們的學習成績是相關的,而且這種評價甚至比同行評價更少受到其他因素的干擾,部分教師獲得差評的主要原因是對教學的投入不足和實踐性知識的欠缺。
4 數據挖掘在在線學習環境中的應用
數據挖掘有一個重要的分支內容就是Web數據挖掘,Web挖掘就是在Web上實現數據挖掘技術的應用,具體講就是從和WWW有關聯的資源或者是行為中進行數據挖掘以獲得感興趣的、有用的模式,找出其中的隱含信息[2]。
通過對在線學習環境的Web記錄挖掘,可以發現潛在使用者、訪問習慣等興趣信息;可以對在線學習環境中的內容進行挖掘,具體有圖像、音視頻、文本或者多種媒體融合;在線學習環境中各種自定義的鏈接結構實現了結構信息、質量信息和內容信息等的存儲,Web結構挖掘也是可以利用的重要內容之一。根據對記錄、內容和結構的挖掘結果,實現對學習者的內容智能推送等功能。總的說來,數據挖掘為在線學習環境中個性化學習提供了技術支持,為自動化的分類、學習和推送提供了技術支持。高美的研究中設計完成了一個在線個性化學習系統,通過數據挖掘技術實現個性化學習在線管理、自動化學習能力評估和個性化課件資源推薦等功能。
5 數據挖掘在教學設計中的應用前景
數據挖掘在教學設計的主要應用前景在于教學專用工具的發開與應用。目前,國內外已有許多商業或免費數據挖掘應用工具,主要有SPSS Clementine、SAS Enterprise Miner等,Excel和SQL Server等軟件也提供了數據挖掘模塊工具。國內外逐漸出現專用教育數據挖掘工具,如為課件作者提供反饋的發現預測規則工具EPRules,遠程學習數據可視化工具GISMO,幫助教師識別學生在線練習相關模式工具TADA-ED,能檢索和解釋學習者序列導航模式工具03R,能為學習者推薦下次訪問最佳鏈接的挖掘工具AHA,等等;國內如陳超美博士開發的可視化文獻分析工具citespace,劉啟元開發的文獻題錄信息挖掘工具Sati,等等[3]。
對教育工作者來說,為使用專業的數據挖掘工具還得專門學習數據挖掘的一些基礎概念和方法,這提高了數據挖掘這門技術在教學設計中應用的門檻。因此,數據挖掘在教學設計中的應用前景是需要開發教學專用的工具,如專門的學習者認知結構分析軟件、評教系統信息挖掘和在線學習內容推送等,同時依據教學設計的流程,采用教學術語,為具體的教學設計目的服務。
參考文獻
[1]馬秀麟,衷克定,劉立超.從大數據挖掘的視角分析學生評教的有效性[J].中國電化教育,2014(10):78-84.
[2]韓家煒.數據挖掘概念與技術[M].范明,譯.北京:機械工業出版社,2012:172-173.
[3]劉冰.國內E-learning數據挖掘研究現狀與應用綜述[J].淮南師范學院學報,2015(2):87-92.
[4]烏美娜,劉美鳳,張祖忻,等.教學設計[M].北京:高等教育出版社,1994.
[5]高美.遠程教育個性化學習系統中Web挖掘的應用與研究[D].成都:電子科技大學,2013:11-13.