邱鑫儀 沈良忠
摘要:隨著高等教育的大眾化,做好教學質量管理成為高校普遍面臨的重大課題。通過高校學生的學業預警制度能夠調動學生主動學習,提高教學質量。該文針對我校信息工程學院2016、2017屆學生的學習成績,通過統計分析和分類分析深入挖掘影響學生預警的相關課程,為高校及時的做好學業預警管理工作提供支持,提醒學生更好地準備課程考試。
關鍵詞:數據挖掘;預警;統計分析;決策樹;Weka
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)36-0226-02
Abstract: With the popularization of higher education, the teaching quality management has become a major issue faced by the universities. Through the early warning mechanism toward university students, we can mobilize the positivity of the students and improve teaching quality. Based on the score data of 2016 and 2017 students in school of information engineering, this paper mines the courses related to the students early warning by means of statistical analysis and classification analysis, which provides support for the work of early warning and reminds the students to better prepare for the course exams.
Key words: Data mining; Early warning; Statistic Analysis; Decision tree; Weka
1 概述
自從1999年高校開始實施連續擴招政策以來,高校的學生在數量明顯增加的同時生源質量也開始逐步下降,使得高校的學生管理和教學管理工作難度加大,針對這一現象各高校都適時地推出了學業預警制度,以期提高學生學習的主動性,同時降低教學管理的復雜性。2012年,我校教務處通過數據統計發現,近三年出于各種原因不能按時畢業的學生人數呈現上升趨勢,因此在當年就擬定并發布了學業預警制度,每學期末都會啟動學業預警工作,及時對學習存在困難或者故意曠課的學生予以提醒,甚至告知其家長,較好的達到了預期的效果。當前,信息技術的發展使得教學管理的信息化逐漸完善,各高校基本建立了自己的教務系統,基本實現學生成績的電子化管理,但是對于系統中學生成績等數據的深度利用工作還處于起步階段。因此,如何通過這些數據挖掘出可能潛在的價值,對教學管理工作具有重要的參考意義,不少學者針對學生學業預警進行了相關研究。
王凱成運用4種數據挖掘算法對在讀學生進行績點預測,從而根據學生的學業表現預先獲知其畢業時的平均績點情況[1]。陳衡利用數據挖掘技術,針對成績預警設計了三種模型,使學業預警更具實用性和有效性[2]。宮鋒將數據挖掘技術應用于學生“學業預警”,對高校學生的學籍信息數據和學生日常表現數據進行數據挖掘,分析出學生預警的影響因素并建立相應學生學業預警的決策樹,為教學管理、學生管理提供數據支持[3]。朱東星通過應用關聯規則Apriori算法發現各科成績與學生能否順利畢業之間的內在關聯,為學校的教務管理工作提供了支持[4]。
本文以我校信息工程學院的學生成績數據為例,通過統計分析以及數據挖掘方法對學生的成績進行研究,獲取學生預警工作的轉化關系,并在此基礎上分析預警學生共有的特征,挖掘其中隱藏的規律。
2 數據準備及統計分析
2.1 數據準備
我校目前依然實行學年學分制,每一位學生都必須修得規定的學分才能畢業。如果學期中,某門課程沒有通過就無法獲得相應的學分。按照學校預警文件的規定,不及格學分超過每學期總學分的30%就要實施學業預警,學業預警在第二學期期初補考考試完成之后啟動,補考通過的課程將不再記錄。本文以信息工程學院2016、2017屆學生為例,課程成績數據只包括大一到大三的6個學期。學生成績從學校教務系統導出,針對部分同學的成績缺失情況進行記錄刪除,最后保留199條2016屆學生、192條2017屆學生成績,同時通過對學生成績的分析,刪除相關的選修課程保留必修課程,主要由公共基礎必修課和專業必修課、學科基礎課組成,從中匯總預警學生的基本成績數據,包括學號、姓名、預警門數、預警專業、預警班級,相關的預警學生成績數據結構如表1所示:
2.2 統計分析
統計分析作為統計學當中的一種常用的科學方法,被廣泛地運用于各個領域,起著信息功能、咨詢功能、監督功能、輔助決策功能的作用[5]。此處以2017屆學生為例,通過對2017屆信息工程學院各專業預警學生成績的分析得出信息工程學院中預警學生主要出現在電氣專業和計算機專業,而電子專業信管專業較少,如圖1所示:
通過匯總發現,預警人數最多的學生集中在大一下學期,有22個人,在大二上學期有9個人出現預警,了解到從大一下學期開始,學生的課程數目增多、難度加深、專業性加強,學生難以適應,可以通過合理的教學安排適當減少課程數目、降低課程難度。通過匯總發現,2016屆的學生存在同樣的情況。大一下學期開始出現大量學業問題,但是后續隨著學生適應能力的逐漸加強以及學校啟動學業預警管理工作,幫助預警的學生通過補考等措施再次獲得學分,使得總體預警學生的人數下降,效果明顯。由此可見,高校對學生的預警工作應主要放在大一下和大二年級,可以通過減少課程難易程度、改進課程教學方法來降低預警學生的數量,同時預防大三年級學生的預警狀況,以此保證大部分學生在大四畢業設計和實習之前能夠順利獲得相應學分保證畢業。endprint
進一步對數據進行轉化率、新增率等的計算發現,通過學校的及時預警大一下學期到大二上學期有72.73%的預警學生轉化為正常學生,新增率從100%降低到33.33%,改善預警學生工作的措施發揮效用,趨勢明顯下降;大二上學期到大二下學期有88.89%的預警學生轉化為正常學生,新增率由33.33%下降到0%,在轉化預警學生的同時有效預防預警學生,大二下學期的預警人數沒有增加。大二下學期到大三上學期,新增率增加到50%,轉化率從88.89%到0%,可見針對轉化預警學生的有效措施在大三上學期的效果最為明顯,由于大三上學期開始,教學課程任務慢慢減負,部分學生對待學業有所松懈導致在大三上學期又出現了預警學生。具體的轉換指標如圖2所示。
由上可以發現,在大一下學期開始出現預警學生到大二下學期為止,轉化預警學生和預防預警學生出現的工作做得卓有成效,雖然總體趨勢轉好,但是在大三和大四學期還是應該重點關注以往的預警學生,防止相關課程再次出現不及格,影響學生畢業。
3 數據挖掘過程
3.1 決策樹的構成
數據挖掘就是從大量的、不完整的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的,但又潛在有用的信息和知識的過程。
本文采取數據挖掘任務中的分類分析,由于決策樹的 ID3 算法只能處理離散化的數據[6],所以要對成績數據進行離散化的處理,為了使數據挖掘更好地運用,選取預警學生最多的課程,主要集中在大學計算機、大學英語、高等數學這三類課程,根據每類課程是否拿到學分設為和“N”和“Y”,將該學生“是否預警”也設為“N”和 “Y”。需要說明的是,由于大學英語包括大學英語(一)到大學英語(四)的四門課程,所以只要有一門不通過,就將大學英語設為“N”,高等數學也是類似。經過數據處理,最終的以表2呈現:
3.2 基于決策樹的分析
本文利用 Weka 軟件中決策樹 ID3 算法進行決策樹分析,根據分類結果為“Y”或“N”提取分類規則。提取的部分代表性分類規則如表3所示:
由表3可知,信息工程學院是否預警的決策樹的根結點都為高等數學,這說明高等數學在大學期間的重要性,其次是大學英語、大學計算機。因此,在高等數學未通過拿不到學分而受到預警的學生要在大學期間針對高等數學要好好地進行學習,在以后的補考、重修中通過,對于信息工程學院即將上高等數學的學生而言,可以事先進行預習,制定一些針對高等數學的學習計劃或者對高等數學等課程開展分層分類教學、另外開設課程加強班等舉措。
4 結束語
本文以信息工程學院2016、2017屆學生現有的學習情況,運用統計、分類分析挖掘數據背后隱藏的規則,學業預警體現了“以學生為本”和全員育人的教育理念,針對不同學生的學業預警信息,可以有效監控學生學習狀態,及時糾正不良學習行為習慣,對預警學生的學習狀況進行針對性的管理、引導,提高高校學生的培養質量,減輕高校教師的工作壓力。
參考文獻:
[1] 王凱成. 基于數據挖掘的大學生學業預警研究[D]. 上海師范大學, 2012.
[2] 陳衡. 基于數據挖掘的高校學生成績預警模型研究[J]. 科學大眾:科學教育, 2017(5):144-144.
[3] 宮鋒. 數據挖掘在高校學生學業預警中的應用[J]. 電子技術與軟件工程, 2017(4):202-203.
[4] 朱東星, 沈良忠. 關聯規則在高校學業預警中的應用研究[J]. 電腦知識與技術, 2017, 13(23).
[5] 劉桂榮. 基于數據挖掘的(預警)學生狀況分析及應用[D]. 武漢科技大學, 2009.
[6] 曾水光. 基于數據挖掘的河北省高考數據分析研究[D]. 河北師范大學, 2013.endprint