張鸰


摘要:隨著信息化教學(xué)手段的普及,高等院校越來越重視網(wǎng)絡(luò)教學(xué)平臺(tái)的建設(shè),在智慧校園的建設(shè)中都加大了線上教學(xué)的投入力度。但隨著也帶來了以往在線下教學(xué)過程中沒有遇到的一些問題,比如教學(xué)管理實(shí)施等,其中最突出的問題就是如何來進(jìn)行網(wǎng)絡(luò)教學(xué)評(píng)價(jià)。與傳統(tǒng)的線下授課不同,網(wǎng)絡(luò)教學(xué)無法實(shí)現(xiàn)如組織集中聽課等課堂評(píng)課等常規(guī)的評(píng)價(jià)方式,教學(xué)行為發(fā)生的對(duì)象變成了屏幕鼠標(biāo)鍵盤,而不再直接展現(xiàn)給教學(xué)評(píng)價(jià)人員,因此評(píng)價(jià)手段也必須由信息化的方式來進(jìn)行分析。本文利用數(shù)據(jù)挖掘技術(shù)對(duì)線上教學(xué)方式的隱含影響因素做深層的分析,探索教育各關(guān)鍵要素之間的關(guān)聯(lián),初步構(gòu)建出實(shí)現(xiàn)網(wǎng)絡(luò)教學(xué)評(píng)價(jià)的相關(guān)流程,從而為教育教學(xué)管理和決策提供有效支持。
關(guān)鍵詞: 數(shù)據(jù)挖掘;分類回歸樹算法;線上教學(xué);教學(xué)評(píng)價(jià)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)29-0006-03
1 數(shù)據(jù)挖掘技術(shù)簡析
數(shù)據(jù)挖掘(Data Mining)一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程,通常會(huì)利用計(jì)算機(jī)技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)技術(shù)、情報(bào)分析和模式識(shí)別等技術(shù)來實(shí)現(xiàn)。[1]。數(shù)據(jù)挖掘?qū)崿F(xiàn)過程主要有三步:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果的解和評(píng)估。簡單來說數(shù)據(jù)挖掘技術(shù)是指從大量紛繁錯(cuò)雜的信息中獲取有效的數(shù)據(jù),幫助使用者制定決策的一種技術(shù)手段。數(shù)據(jù)挖掘接觸多樣化的數(shù)據(jù)結(jié)構(gòu)和類型,因此對(duì)接了包括:普通的事務(wù)數(shù)據(jù)、關(guān)系數(shù)據(jù)庫數(shù)據(jù)、數(shù)據(jù)倉庫數(shù)據(jù),以及現(xiàn)在流行的流媒體數(shù)據(jù)、超文本數(shù)據(jù)、時(shí)空及序列數(shù)據(jù)、網(wǎng)格數(shù)據(jù)等等。數(shù)據(jù)挖掘技術(shù)發(fā)展到現(xiàn)在,在很多的專業(yè)學(xué)科領(lǐng)域都得到了應(yīng)用,并隨之催生出了很多新的數(shù)據(jù)挖掘技術(shù)。當(dāng)下在教育教學(xué)方面數(shù)據(jù)挖掘技術(shù)也廣泛的深入,常見的有:被用于對(duì)線上學(xué)習(xí)效果與學(xué)習(xí)行為關(guān)聯(lián)性進(jìn)行分析的關(guān)聯(lián)和相關(guān)性挖掘算法;通過對(duì)采集信息進(jìn)行分析聚類出具有特定相似性的群體的聚類分析算法;可以實(shí)現(xiàn)對(duì)線上教學(xué)留言板、論壇、聊天室的評(píng)論的交流數(shù)據(jù)進(jìn)行分析的文本挖掘技術(shù);通過對(duì)采集到的學(xué)生基本信息既可以實(shí)現(xiàn)對(duì)學(xué)生成績進(jìn)行預(yù)測(cè)的決策樹算法;常被用于進(jìn)行線上教育教學(xué)研究的統(tǒng)計(jì)分析挖掘算法等??梢愿鶕?jù)不同的應(yīng)用場(chǎng)合和項(xiàng)目,選擇適合特定任務(wù)的數(shù)據(jù)挖掘技術(shù)。本文根據(jù)需求采用了決策樹算法中的分類和回歸樹算法。
2 分類回歸樹算法
在數(shù)據(jù)挖掘中,決策樹通過對(duì)不同屬性節(jié)點(diǎn)的劃分,把一個(gè)新的樣本經(jīng)過層層判斷劃分到不同的類別當(dāng)中。決策樹算法根據(jù)選擇劃分節(jié)點(diǎn)的不同方式主要分為ID3、C4.5、CART三種算法。ID3是決策樹算法中很常用的一種方法,其主要思想是通過信息增益來進(jìn)行決策樹的劃分屬性選擇,而C4.5算法可以看成是對(duì)ID3算法的一個(gè)改進(jìn)。ID3、C4.5算法主要用于分類問題,它們均是基于信息熵來進(jìn)行劃分節(jié)點(diǎn)選取的。
分類回歸樹算法(CART,Classification And Regression Tree)是一種決策樹分類方法,它采用一種二分遞歸分割的技術(shù),從名稱可知它包括了分類樹和回歸樹兩種決策樹。CART和前面兩種算法的差異主要是在每一次節(jié)點(diǎn)做判斷時(shí),只考慮二分類的情況,即使征能夠取到多個(gè)值(比如屬性顏色有紅、黃、藍(lán)三種取值,ID3和C4.5直接就劃分為紅、黃、藍(lán)三個(gè)子類,而CART只能在一次劃分時(shí)劃分為是不是紅(黃、藍(lán))然后再進(jìn)行判斷。)
2.1 CART分類過程
2. 3 CART剪枝
為什么要對(duì)決策樹進(jìn)行剪枝?這樣做的原因是為了避免出現(xiàn)過擬合的情況。觀察通過前面的算法生成的決策樹,會(huì)發(fā)現(xiàn)這個(gè)決策樹是非常詳細(xì),分支量大,分支層數(shù)多,對(duì)每個(gè)屬性進(jìn)行詳細(xì)的分析。利用這種決策樹實(shí)施的訓(xùn)練樣本的分類,可以達(dá)到非常低的錯(cuò)誤率,可以對(duì)原訓(xùn)練樣本集進(jìn)行正確的樣品分類。
剪枝的方法包括兩種:預(yù)先剪枝(Pre-Pruning)和生成后剪枝(Post-Pruning):Pre-Prune是指在決策樹子節(jié)點(diǎn)的產(chǎn)生階段,利用剪枝算法去判別是否需要產(chǎn)生該子節(jié)點(diǎn)。而Post Prune就是指利用剪枝算法對(duì)于已生成過擬合的原始決策樹實(shí)施分析和處理,將冗余和偏離較大的子節(jié)點(diǎn)去掉的方式。
3 數(shù)據(jù)分析流程
前面完成了數(shù)據(jù)挖掘技術(shù)的選型,下面結(jié)合線上教學(xué)環(huán)節(jié)對(duì)數(shù)據(jù)分析流程簡單梳理。對(duì)于線上教學(xué)的考核評(píng)估第一個(gè)要素就是要明確所分析的對(duì)象。本文擬從線上課程的各個(gè)教學(xué)模塊、任課教師和該課程學(xué)生的測(cè)試成績等三方面內(nèi)容展開分析,利用數(shù)據(jù)挖掘技術(shù)來評(píng)估線上教學(xué)的效果。
使用者的學(xué)習(xí)過程存儲(chǔ)在線上平臺(tái)的學(xué)習(xí)行為數(shù)據(jù)庫內(nèi),同時(shí)線上系統(tǒng)的日志管理機(jī)制又準(zhǔn)確記錄了學(xué)習(xí)者在各個(gè)線上學(xué)習(xí)模塊的學(xué)習(xí)行為。另一方面,通過數(shù)據(jù)接口對(duì)接能夠得到教學(xué)管理系統(tǒng)的成績數(shù)據(jù)。然后將采集到的數(shù)據(jù)按照數(shù)據(jù)處理的相關(guān)流程確定主外鍵、關(guān)聯(lián)度、位置,最終形成學(xué)習(xí)者的學(xué)習(xí)行為統(tǒng)計(jì)報(bào)表。例如教師T開設(shè)了線上課程K,學(xué)生S 在課程的線上學(xué)習(xí)時(shí)長為30個(gè)小時(shí),在線答疑模塊訪問9次、完成線下作業(yè)5次等等。
完成了數(shù)據(jù)的采集以后,接下來就是利用數(shù)據(jù)挖掘算法進(jìn)行分析??梢詫?duì)整個(gè)數(shù)據(jù)分析流程總結(jié)如下圖1:
其中:施教者對(duì)所開發(fā)各教學(xué)模塊使用過程中的定性對(duì)比結(jié)果構(gòu)成分類樹;學(xué)習(xí)者對(duì)各學(xué)習(xí)模塊訪問數(shù)量具體對(duì)比形成回歸樹。通過對(duì)學(xué)生學(xué)習(xí)行為和教師開發(fā)教學(xué)模塊之間的因果分析判斷,結(jié)合算法原理以及實(shí)現(xiàn)過程形成了CART算法的基本模型。
4 分類回歸樹算法應(yīng)用
關(guān)鍵因素分析:
① 教學(xué)管理人員:制定線上平臺(tái)教學(xué)考核標(biāo)準(zhǔn),提供接口實(shí)現(xiàn)數(shù)據(jù)挖掘系統(tǒng)與教務(wù)系統(tǒng)之間的對(duì)接;
② 后臺(tái)技術(shù)人員:針對(duì)特定線上課程,分析其中的學(xué)生行為和考試成績關(guān)系,判斷其對(duì)網(wǎng)上教學(xué)課程的教學(xué)效果評(píng)估是否達(dá)到有效地實(shí)現(xiàn)。
前導(dǎo)要素:技術(shù)人員按時(shí)更新學(xué)生行為數(shù)據(jù)庫,教學(xué)管理人員提供考試成績,技術(shù)人員按時(shí)通過CART算法建立分類回歸樹進(jìn)行分析,結(jié)果提交給教學(xué)管理人員。后繼要素:隨著線上教學(xué)平臺(tái)數(shù)據(jù)量的積累量,系統(tǒng)將進(jìn)入良性發(fā)展,利用CART算法構(gòu)建的模型也會(huì)越來越準(zhǔn)確,更加能夠真實(shí)地反映出線上教學(xué)平臺(tái)的教學(xué)效果。具體流程如圖2所示。
5 結(jié)束語
通過以決策樹算法對(duì)學(xué)生的在平臺(tái)的行為和考試成績進(jìn)行分析,就可以得出了比較直觀和具有說服力的規(guī)則分析,找出了在網(wǎng)絡(luò)教學(xué)平臺(tái)中相對(duì)有效的教學(xué)方式,以及在特定教學(xué)方式中實(shí)現(xiàn)了優(yōu)秀教學(xué)效果的任課教師,達(dá)成了對(duì)網(wǎng)絡(luò)教學(xué)的教學(xué)效果進(jìn)行評(píng)估參考的效果。
參考文獻(xiàn):
[1] 李雄飛,李軍.數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)[M].北京:高等教育出版社,2003.
[2] 許海洋,汪國安,王萬森.模糊聚類分析在數(shù)據(jù)挖掘中的應(yīng)用研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2005(17).
[3] 田欣.決策樹算法的研究綜述[J]. 現(xiàn)代營銷,2015(5).
[4] 高海燕.數(shù)據(jù)挖掘技術(shù)及應(yīng)用淺析[J]. 中國科技博覽,2012(6).
【通聯(lián)編輯:唐一東】