錢玲 王海青 谷亞林



摘要:電子信息類各專業核心課程甄別的目的,是為了激發教師的質量意識與競爭意識,實現并明確促進學生學習的教學目標與教學方向。文章利用教務管理信息系統大數據,應用統計學關聯算法,分析以往畢業學生各課程成績與GPA的數據,甄別出電子信息類專業的“核心”課程,為學校的教學活動發揮了導向、診斷和監督等功能。文中所研究的方法同樣可以推廣到其他高校和其他專業、從而為促進人才培養提供理論依據和數據支撐。
關鍵詞:大數據;核心課程;GPA;關聯度
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2019)15-0079-03
高校各專業核心課程是高校專業課程體系建設的核心,承擔著專業人才培養的基礎性任務,反映專業特點、體現專業特色、支撐專業發展,其輻射而出的其他專業課程與之共同構成了完整的專業課程體系,進而形成了專業人才培養體系。學分績點—GPA(grade point average)是大學生專業素質的一個重要體現,分析教學大數據中課程成績與GPA的關聯度可以發現隱藏在數據之間的相互關系,甄別出對GPA影響較大的核心課程,有助于進一步做好專業課程建設工作,促進高校的內涵提升和質量提高。
國內外高校通過教學大數據對課程體系、教學模式、數據分析都做了許多研究。加利福尼亞大學洛杉磯分校的Kharkar教授[1]等通過分析數學系核心課程關聯度,為教授這些課程的教師提供教學指導;清華大學[2]利用教務管理系統的構建了統計分析工具系統,該系統驗證了數據分析工具對于教務管理者的決策支持價值,體現了嵌入教學系統的數據分析工具的優勢;浙江大學[3]通過對資產的歸納、整理,最終形成權威、全面的資產數據,并提供數據查詢和分析服務;復旦大學[4]“教育管理信息化平臺”和“教育資源公共服務平臺”建設的過程中,也積累了豐富的信息化實踐經驗;電子科技大學[5]構建了教育大數據一體化平臺,此平臺提供了精準預測學生成績,助力學生精準資助等個性化、精準化的管理服務。
本文通過對南京某重點高校的電子信息工程專業,已經畢業的4屆學生所有課程成績,以及所有學生最終的GPA數據進行關聯度分析,計算出各課程對GPA成績影響的不同程度,從而甄別出該專業的核心課程,以期為促進高校學生的成長和發展提供數據依據和參考。
一、數據與整理
在大數據時代,通過數據挖掘技術可以獲取事件之間的關聯性,為正確的決策提供技術保障。一般核心課程在高等教育來講通常指基礎課程中的必修課,我們這里的“核心”課程是指和學生整個大學期間的GPA關聯度最高的幾門課程。
1.數據的來源。南京某重點高校的電子信息工程專業是江蘇省品牌專業,該校的教務系統已經保存了以往學生的完整的成績數據,每個專業所有學生的課程成績數據都保存為Excel文件,我們收集剛剛畢業的前4屆學生(即2015屆—2018屆)的學習成績數據文件,這些原始數據包括:該專業每位學生的每門課程的每次考試成績,有些學生的一門課成績不止一個,例如,正常考試成績、補考成績、重修成績等,平均每位學生的成績數據有100條左右(每位學生大概修了70多門課程,部分課程還不止一個成績),并且每條數據又有23個屬性(每門課程屬性數據如表1所示),粗略估算4屆學生的課程成績數據接近一百萬條。
2.數據的整理。從學校教務處獲取的學生各門課程成績,均采用百分制記分,該專業4屆畢業學生共有674名,在校4年內必須修滿172學分,除了必修課程以外,學生之間選修課程存在差異,按照一門課平均2.5學分計算,每個學生平均選修70門課程。另外部分學生原始成績數據還存在正常考試、補考以及重修等不同類別的成績,為了使結果更具有真實性,我們設定幾個成績中,只取第一次有效成績(正常考試的用正常考試成績,沒有正常考試成績的用第一次緩考或補考成績)作為我們的計算數據。每門課程成績的原來屬性有23個,例如:{學號,姓名,開課學期,課程編號,課程名稱,學分,成績,考試性質,…},而有些屬性需要,有些屬性不需要,通過整理將課程屬性精簡為:{課程編號,開課學期,課程名稱,課程屬性,學時,學分,開課單位}共7個屬性,經過整理的數據用來計算課程關聯度。
二、關聯分析
關聯系數是用以反映變量之間關系密切程度的統計指標。關聯系數是按積差方法計算,以兩變量與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變量之間相關程度。spearman秩相關系數是統計學的三大相關系數之一,是一個非參數性質(與分布無關)的秩統計參數,由Spearman在1904年提出,用來度量兩個變量之間聯系的強弱,比較適合對GPA影響較大的核心課程的甄別。
2.算法流程。根據Spearman秩相關系數的計算公式,以及經過整理的4屆學生課程考試成績的數據,用Python語言作為編程語言,所設計的算法模塊如圖1所示。(1)首先讀取原始數據的4個Excel文件,將其合并成一個csv格式的文件;(2)刪去課程不需要的屬性,保留特定屬性,并對同一個學生同一門課的多個成績進行去重,僅保留第一次有效成績,由于存在選修課程的差異,保留有效成績超過學生總數50%的課程數據,刪除選修課程較少的課程數據,完成數據的整理;(3)計算每個學生每門課程百分制成績對應的業績點和每個學生的GPA;(4)將所有學生的GPA進行排序,將每個學生的有效課程的業績點進行排序;(5)根據Spearman秩相關系數的計算公式計算各門課程的Spearman值,從而甄別出核心課程。
通過數據挖掘和統計學關聯度計算,為我們獲得電子信息類專業的核心課程甄別,提供了數據支撐。
3.關聯系數。通過4屆畢業學生共有674名的課程成績的原始數據,利用上述分析與計算,共計算出54門課程(包括實踐課程)的Spearman系數,下面列出Spearman系數最高的10門課程。
從表2可見,10門核心課程共有39學分,占總學分的22.4%,都是必修課程。其中,工程數學、概率與過程、大學物理(Ⅰ)和大學物理(Ⅱ)是學科教育課,余下6門課程都是專業基礎課程;這9門課程都是在學生大一和大二必修的課程(只有數字信號處理課程除外,其授課時間在大三上),所以,加強大一和大二學生的學習方法教育就非常必要。
三、意義分析
依據往屆學生教學大數據中核心課程與GPA的相關數據,就可以分析現在在校學生的核心課程成績,尤其是大一和大二的在讀學生,可以對學生的未來學習趨勢進行科學預測,為學生的自我學習監控與指導、為教師的教學決策提供更精細化的服務。這樣克服以往經驗式的,缺少足夠的數據分析判斷、佐證教學行為效果的缺點,實現以數據驅動的“因材施教”。上述課程關聯度分析對當前教學方面的意義體現在以下三個方面。
1.管理系統。高校教學管理部門,通過分析大一和大二學生核心課程的成績,可以及時調整學生的培養方案。基于這些信息,學校不僅可以預測出每個學生在其他課程的得分,也可以預測出每個學生在其他課程的掛科可能性;分析核心課程的掌握程度,將學生分為不同類型,例如:“學術型”“能力型”和“潛力型”,根據“分類指導、分層施教和個別培養相結合”的原則,對不同類型學生分別實行“深度拓展型、能力強化型、揚長教育型”教育策略,引導學生個性化發展,使每一位學生都成為更好的自己。
2.教學系統。傳統的教學系統往往存在片面、主觀、模糊化的傾向。現在每個教師在上課前,可以通過計算學生的前面核心課程成績,明確自己授課的學生學習狀況,事前知道優秀學生和問題學生的群體,可以進行準對性教學。對符合學困生發展趨勢的問題學生進行預警和指導,加強管理和檢查;對有異于常人的優秀學生進行個性化培養方案,有針對性地制訂培養計劃和教學方案,推送個性化的學習資料,推薦個性化的實踐鍛煉平臺,指導個性化的職業規劃;對普通學生進行鼓勵教育,使學生從被動學習變為自我教育、自主學習,激發其學習的活力。
3.學習系統。直觀地說,學生成績和他們的重要知識掌握情況有密切關系。分析學生對核心課程的掌握程度,每個學生就可以自己預測未來學業趨勢。大一和大二學生在每學期都可以評估自己核心課程的成績、自己的能力和興趣,調整學習方法和努力方向,預測自己后續課程學習的難度,從而提前規劃自己的時間和精力。
四、總結
隨著全球信息化的高速發展,電子信息類專業成為近幾十年來發展最快的學科之一。學生要學的理論課程越來越多,間接導致學生發展不均衡,如何在諸多課程中,抓住主要矛盾成為我們研究的重點,通過核心課程的甄別,可以為高校教與學提供數據支撐,實現了從定性分析到定量分析的轉變,促進教學管理科學化、精細化。通過在校學生核心課程的成績就可以預測畢業時的GPA情況,可以及時認識教學問題,盡快解決存在問題。上述通過教學大數據甄別學科專業核心課程的方法,同樣可以應用到其他專業和其他高校,具有一定的推廣應用價值。
參考文獻:
[1]R Kharkar, J Tran and C Z Marshak.Core Course Analysis for Undergraduate Students in Mathematics[J].arXiv:1605.00328v1[math.HO] 2 May,2016.
[2]鄧文俊,等.基于教務管理系統的數據分析工具的研究與設計[J].中國電化教育,2014,(5):138-143.
[3]方偉杰,等.浙江大學:數據共享提高公共資產利用率[J].中國教育網絡,2012,(6):60-61.
[4]陳翼,等.復旦大學:信息化支撐教學與人才培養模式創新[J].中國教育網絡,2014,(10):45-48.
[5]呂紅胤,等.電子科技大學一體化大數據提供師生精準畫像[J].中國教育網絡,2017,(2):78-81.