摘 要:文中簡單介紹了數(shù)據(jù)挖掘技術(shù)之決策樹的概念,并對以本校電子系2011級學(xué)生所開設(shè)的課程考試成績作為測試數(shù)據(jù)進(jìn)行分析,為教務(wù)管理提供及時(shí)準(zhǔn)確的信息及工作重點(diǎn)指導(dǎo)。
關(guān)鍵詞:數(shù)據(jù)挖掘;決策樹;教學(xué)
目前國內(nèi)高等職業(yè)學(xué)校基本都已建立起校園網(wǎng)絡(luò),廣大教師和學(xué)生都充分享受到了校園網(wǎng)絡(luò)帶來的便利。怎么利用信息技術(shù)更好地為教學(xué)管理服務(wù),是我們當(dāng)前面臨的一個(gè)新問題。數(shù)據(jù)挖掘在教育領(lǐng)域的應(yīng)用相對較少。將數(shù)據(jù)挖掘技術(shù)引入到學(xué)校學(xué)生信息管理之中,利用數(shù)據(jù)挖掘技術(shù)對已有的數(shù)據(jù)進(jìn)行分析管理,找出影響學(xué)生成績的各種因素間的內(nèi)存聯(lián)系,已是大勢所趨。
1 數(shù)據(jù)挖掘技術(shù)——決策樹技術(shù)
決策樹是一種歸納學(xué)習(xí)算法,它是以實(shí)例為基礎(chǔ)的。是從一組無規(guī)則、無次序的元組中推理出用決策樹來表示形式的分類規(guī)則。它采用的是自頂向下的遞歸方法,在決策樹的每個(gè)內(nèi)部結(jié)點(diǎn)進(jìn)行其屬性值的比較,根據(jù)不同的屬性值從該結(jié)點(diǎn)向下分枝,葉結(jié)點(diǎn)就是要學(xué)習(xí)劃分的類。從決策樹的根到葉結(jié)點(diǎn)之間的一條路徑就對應(yīng)著一條合取規(guī)則,因此,整個(gè)決策樹實(shí)際上就對應(yīng)著一組析取表達(dá)式的規(guī)則。
ID3算法的具體方法是:先檢測所有的屬性,檢測完后選擇信息增益最大的那個(gè)屬性用來產(chǎn)生決策樹的結(jié)點(diǎn),并由該屬性的不同取值建立分枝,然后再對各分枝的子集進(jìn)行遞歸調(diào)用同樣的方法建立決策樹結(jié)點(diǎn)的分枝,一直到所有的子集僅僅包含相同類別的數(shù)據(jù)為止。最后就能得到一棵決策樹,用它可以來對新的樣本進(jìn)行分類。ID3算法方法簡單,算法理論清晰,具有較強(qiáng)的學(xué)習(xí)能力。尤其適用于較小的數(shù)據(jù)集,但對噪聲較為敏感,在較大數(shù)據(jù)集處理時(shí)效果欠佳。
2 決策樹技術(shù)在課程評價(jià)中的應(yīng)用
1)數(shù)據(jù)清理
建立決策樹,分析課程類型、考查方式、是否需要重修及試卷難度等屬性對其總體的影響。本文以我校電子系2011級學(xué)生所開設(shè)的課程考試成績作為測試數(shù)據(jù),提取成績表中的部分字段如表1所示。
因此,對于課程A可加強(qiáng)學(xué)生對于非必修課程的重視程度,任課教師應(yīng)該最大程度地調(diào)動(dòng)學(xué)生對這些課程的學(xué)習(xí)熱情;對于課程B,一方面教師在出卷時(shí)考慮一下難度的比例,另一方面可以多培養(yǎng)學(xué)生開動(dòng)腦筋,解決難題的能力,可以從多培養(yǎng)學(xué)生的動(dòng)手能力等方面多下功夫。
3 結(jié)語
綜上,運(yùn)用挖掘技術(shù)對于數(shù)據(jù)的處理能夠?yàn)槲覀兘虒W(xué)提供及時(shí)而又準(zhǔn)確的信息,可以為教師的教學(xué)及教學(xué)管理部門對于教學(xué)的工作重點(diǎn)的把握起指導(dǎo)作用。
參考文獻(xiàn):
[1]高飛.數(shù)據(jù)挖掘技術(shù)在中職校選課系統(tǒng)中的應(yīng)用研究[D].揚(yáng)州大學(xué),2012.