董婧



摘要:跨界整合高校教育狀態數據,教育管理部門以及第三方相關數據,利用機器學習、數學統計和神經網絡等數據挖掘技術,對高校教育海量數據進行深層次挖掘和應用,可以實現智慧學習、智慧評價和智慧服務。該文首先分析了教育大數據對高校教育教學管理的沖擊;其次,介紹了目前廣泛應用的數據挖掘技術;最后,通過挖掘學生就業大數據這一具體案例,說明了挖掘教育大數據的價值與廣泛應用前景。
關鍵詞:教育大數據;地方高校;數據挖掘技術;智慧學習;就業大數據
中圖分類號:G642? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2019)02-0156-02
隨著信息通信技術的普及以及數據挖掘技術的不斷成熟,大數據時代已經到來[1]。大數據在教育領域的應用也開始受到許多組織和專業人員的關注。尤其是在高校中,學習者學習方式變得更加多元化,如果沿用傳統的標準化學科設置、教學內容、教學方法、考試制度和人才培養模式,容易忽視學生的個性特征和認知發展[2]。教育大數據記錄和量化了學生的學習情況,若對海量教育數據進行用戶學習行為的大數據分析,如通過建立自適應學習系統評估解釋影響學習效果的重大因素,可以使教師有效整合零散的教學資源,真正理解每個學習者[3],并根據他們的個人特征,如學習習慣、學習興趣和學習偏好,提供準確而有針對性的教學;同時提供給學習者個性化的適應性反饋,使每一個學習者挖掘出個人的學習偏好,為學習者推薦與其學習計劃最匹配的課程和教材,達到最佳學習效果,實現“智慧”學習[4]。通過數據跨界整合和跨界挖掘[5],可以很好改善落后的傳統教學關系,實現更具個性化的交互。
就業是高校工作的一個重中之重,對教育大數據的挖掘可以實現教育設備與資產的智能管理、學生就業與幫扶體系的完善,根據學生就業意愿實現精準分析與推薦;大數據還可實現智慧科研,通過對科研大數據分析,促進科研采購模式創新,提升文獻服務質量,對不恰當的科研管理模式及時預警和轉型。
1教育大數據的數據來源
教育大數據來源于各個學院以及教輔部門搜集整理的各方面的資料,具體如下圖所示:
2教育大數據挖掘
2.1數據挖掘技術
數據挖掘技術大致可以分為機器學習、數據庫方法、集合論法、仿生物法和統計方法。機器學習主要包括支持向量機和歸納學習方法;數據庫方法主要包括多維數據分析法、OLAP等;集合論法主要包括粗糙集理論和模糊集理論;仿生物法主要包括神經網絡、遺傳算法、蟻群算法等;統計方法主要包括回歸分析、相關分析、聚類分析、判別分析、因子分析、生存分析和決策樹模型等。
2.2數據挖掘案例
以學生就業大數據為例,數據來源于曲靖師范學院畢業生就業與培養質量調查問卷(有效問卷3100余份),各個學院2017年度就業質量年度報告,對于缺失數據采用機器學習中的基于python爬蟲程序自動抓取學校辦公系統、教學數據和服務數據等相關信息,進行數據預處理后,采用數學統計方法中的因子分析進行分析,結果如圖所示:
可以看出,提取的公因子對變量CET4方差貢獻率為90%,第一主成分CET4特征根為3.019,前五個因子方差累積貢獻率為83.168%,特征值大于1,所以選擇前五個因子。非外國語學院學生通過大學英語四級考試、外國語學院學生統計大學英語(泰語)四級(專業四級)對學生就業最有幫助,能夠有效促進學生的就業質量;其次是學院對就業經費投入的占比情況,投入經費多少也影響著學院的最終就業率,投入經費相對較多的部門其畢業生就業情況較優;再者是生源情況,非云南省籍學生思維更為活躍,個性獨特,通常綜合表現更為優秀,更容易就業;然后是學生獲得國家級省級獲獎,對學生就業有一定影響;最后是初次就業率,直接影響到學校總體的最終就業率。畢業生對就業服務工作滿意度等因子對學生就業情況也有一定影響,但不是主成份,學校應對前五個因子特別重視,并采取有效的應對政策以顯著促進學生就業率及就業質量。
3結論
高校中各學院和教輔部門存在海量的辦學狀態數據,通過數據挖掘技術,可以挖掘海量信息中潛在的價值,提供精準服務,支持科學決策。通過數據挖掘、分析、機器學習等技術展現教育大數據的價值,推動教育發展創新,提高教育教學質量,實現智慧教與學,智慧服務和智慧評價。
參考文獻:
[1]鄭慶華.高校教育大數據的分析挖掘與利用[J]. 中國教育信息化, 2016(13):28-31.
[2]馬月. 數據挖掘技術在教育信息化中的應用研究[D],西安郵電大學, 2014.
[3]王祖霖.大數據時代學生評價變革研究[D].湖南大學, 2016.
[4]孫洪濤.教育大數據的核心技術、應用現狀與發展趨勢[J].遠程教育雜志, 2016(5):41-49.
[5]劉清堂,王洋,雷詩捷.教育大數據視角下的學習分析應用研究與思考[J].遠程教育雜志, 2017(3):71-77.