郭俊亮
(銅仁職業技術學院信息工程學院,銅仁 554300)
數據挖掘在高校分析學生學情中的應用
郭俊亮
(銅仁職業技術學院信息工程學院,銅仁 554300)
學生的期末考試成績出來以后,只能從結果上看掛科還是沒有掛科,教師難以獲取深層次的因素,針對此現狀,利用數據挖掘的ID3算法對學生的一些基本屬性進行數據挖掘,可以找出其中一些有用的信息,為教師的上課管理、學生的學習等提供數據支持。
決策樹;數據挖掘;學生學習;ID3
學生的期末考試成績出來以后,老師和學生都只能看見這門課程表面的成績,學生的成績是和一些因素有關系的,例如學生對這門課程的學習興趣,教師對這門課程的授課方式,影響學生學習的一些課外因素,這些都是是有很大的關聯的,不能等掛科以后,才去分析原因。
通過數據挖掘技術可以從一些數據中發現隱藏的規律和模式,將數據挖掘與學生的平時的一些信息進行組合,可以找到學生的一些發展變化規律,加以利用可以提高學生們的學習成績,提高授課教師的教學水平和學生的學習成績。
ID3算法是決策樹技術中的一個經典的算法,在算法的運行過程中,要計算屬性的信息熵與信息的增益,然后通過增益高的屬性進行分類。
學生的期末考試成績會受到多方面因素的影響,學生的主觀努力程度是很重要的因素,但是,同時也會受到其他方面因素的影響,例如,學生不喜歡教師的授課方式,家庭的經濟情況、是否戀愛等,這些都影響學生的學習成績,所以,通過ID3算法將學生的基本信息和學習基本狀況聯系起來,可以構建一個預測學生是否期末掛科的決策樹。
2.1 數據處理
根據數據挖掘的目的和需要,獲取學生的家庭經濟情況、喜歡不喜歡教師的授課方式、出勤情況、作業情況、是否戀愛、共計5列屬性,通過類別分析,對35名學生的情況屬性進行數據離散化,如表1所示。

表1 樣本學生的基本屬性
2.2 決策樹的構建
根據樣本數據,以期末是否掛科為目標構建決策樹。
(1)計算樣本數據“是否掛科”分類的信息熵

(2)樣本數據屬性的信息熵和信息增益
鑒于我國絕大多數AMI患者直接就診于基層醫院,而基層醫院的診治現狀又極不規范,因此,規范化胸痛中心建設應該立足于建立區域協同救治模式。
以“喜歡不喜歡教師的授課方式”為例計算信息熵。“喜歡不喜歡教師的授課方式”屬性有兩個值{A,B},所以決策樹分為兩個子集,分別計算其信息熵如下:

同樣,可以計算出“家庭經濟情況”、“出勤情況”、“作業情況”、“是否戀愛”的信息熵。

可以分別計算出個屬性的信息增益如下:

可以得到結果是:“作業情況”是最大的增益效益屬性,應按照“作業情況”的屬性進行分類。
(3)重復以上步驟既可以構建一個決策樹。
2.3 分析
根據決策樹,可以提取分類規則
(1)if作業情況=C and出勤情況=C and是否戀愛=A喜歡不喜歡教師的授課方式=B學生掛科的比率是80%。
(2)if作業情況=C and出勤情況=C and是否戀愛=A喜歡不喜歡教師的授課方式=A學生掛科的比率是70%。
(3)if作業情況=C and出勤情況=B and是否戀愛=A喜歡不喜歡教師的授課方式=A學生掛科的比率是60%。
將數據挖掘技術應用于預測學生期末掛科的中,能夠提高、改進教師的教學方式,增加學生對授課教師的認同感,也增加學生對所學課程的興趣,學生在學習和課外時。同時,學生在學習和課外時間的分配上也有了一個深刻的認識。
[1]丁保忠.數據挖掘技術在學生綜合信息管理系統中的應用研究[D].河北:河北科技大學碩士論文,2013,04.
[2]韓家煒.數據挖掘概念與技術[M].范明,譯.北京:機械工業出版社,2012:172-173.
[3]曾雪峰.計算機數據挖掘技術開發及其在檔案信息管理中的運用研究[J].科技創新與應用,2016,27(9):285-285.
Application of Data Mining in the Analysis of College Students'Learning Situation
GUO Jun-liang
(Department of Information Engineering,Tongren Polytechnic College,Tongren 554300)
After the final exam scores are post,it can only be seen fail or not from the exam results,it is difficult for teachers to acquire deep-seated factors,in this situation,some basic properties of the ID3 data mining algorithm based on data mining for the students,which can find out some useful information,to provide data support for the school management and teachers the students'learning.
郭俊亮(1987-),男,山西臨汾人,碩士,研究方向為物聯網與大數據
2017-04-14
2017-06-11
1007-1423(2017)17-0060-03
10.3969/j.issn.1007-1423.2017.17.012
Decision Tree;Data Mining;Student Learning;ID3