朱劍林 朱容波 康怡琳 韋唯
摘要:教育大數(shù)據(jù)為教育創(chuàng)新發(fā)展注入新動能,數(shù)據(jù)驅(qū)動教育,變革創(chuàng)造未來。但目前,學術界對教育大數(shù)據(jù)的研究較于其他領域相對滯后。本文討論對教育大數(shù)據(jù)進行科學研究的目的和意義,以貧困生預測問題探討大數(shù)據(jù)在高校教育中的運用,分析研究教育治理、教育內(nèi)容、教與學方法、教育評價、教育供給方式,助力人的全面、自由、個性化教育。
關鍵詞:大數(shù)據(jù);教育科學;助學金預測;梯度提升決策樹
中圖分類號:G641 文獻標志碼:A 文章編號:1674-9324(2018)21-0267-02
一、引言
當今世界,隨著信息技術的快速發(fā)展,和人類生產(chǎn)生活相關的各類數(shù)據(jù)呈爆炸式增長,這導致了大數(shù)據(jù)分析和人工智能理論和技術的迅速發(fā)展,影響著人們的生活工作方式和思維方式,也改變社會的生產(chǎn)力和生產(chǎn)關系,成為創(chuàng)新的新動力。自2012年以來,美國[1]、英國、法國等國家陸續(xù)將大數(shù)據(jù)提高到國家戰(zhàn)略層面,我國在2015年召開的黨的十八屆五中全會上明確提出了實施“國家大數(shù)據(jù)戰(zhàn)略”[2]。大數(shù)據(jù)得到社會各界的高度重視和廣泛參與,以共同應對大數(shù)據(jù)時代的挑戰(zhàn)。教育信息化一直是我國教育領域的重點工作,相關文件見《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》《教育信息化“十三五”規(guī)劃》[3]。教育大數(shù)據(jù)有廣義和狹義教育大數(shù)據(jù)之分,廣義的教育大數(shù)據(jù)泛指所有來源于日常教育活動中人類的行為數(shù)據(jù),它具有層級性、時序性和情境性的特征;而狹義的教育大數(shù)據(jù)是指學習者的行為數(shù)據(jù),它主要來源于學生管理系統(tǒng)、在線學習平臺和課程管理平臺等。人類社會技術的發(fā)展離不開教育的支撐,同時技術的發(fā)展也推動了教育的創(chuàng)新變革。《2018年度國家自然科學基金項目指南》[4]專門開辟教育研究通道來專門研究教育的難題,F(xiàn)07是給教育交叉學科的代碼,意在推動以自然科學范式和手段,特別是讓傳統(tǒng)教育科學與信息科學、神經(jīng)科學、認知科學相交叉,研究教育的基本理論和基礎問題,支撐新時代的教育。在該研究領域,電子科技大學大數(shù)據(jù)研究中心-教育大數(shù)據(jù)研究所在貧困生精準資助、圖書推薦、成績預測領域做了很多開創(chuàng)前沿性工作[5]。
二、教育大數(shù)據(jù)研究目的與意義
1.針對高校中的主要工作,進行教育大數(shù)據(jù)研究的目的如下[6]:①高校學生學習分析。通過構建包含學習者行為數(shù)據(jù)、領域模型和教學策略的數(shù)據(jù)計算模型,促進學習者個性化診斷和有效學習的發(fā)生。②高校教育教學工作。通過整合學習者知識、認知和態(tài)度等詳細信息進行學習者模型的構建,預測學習者未來學習發(fā)展趨勢,探索和改進包含最佳教學內(nèi)容和教學順序的領域模型。③高校管理工作。利用大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息技術,優(yōu)化辦學要素的結構,提高管理水平,基于多維數(shù)據(jù)精準管理,促進高等教育管理由增量發(fā)展向質(zhì)量發(fā)展轉(zhuǎn)變的重要工具和基礎。百年大計,教育為本。教育是人類傳承文明和知識、培養(yǎng)年輕一代、創(chuàng)造美好生活的根本途徑。教育是我國實現(xiàn)“兩個一百年”奮斗目標和實現(xiàn)中華民族偉大復興“中國夢”的智力支撐,特別是高等教育發(fā)展水平是一個國家發(fā)展水平和發(fā)展?jié)摿Φ闹匾獦酥尽?/p>
2.課題具有重要的理論意義和實踐意義:①理論意義。將數(shù)據(jù)集擴展到教育領域,豐富大數(shù)據(jù)理論研究。對教育數(shù)據(jù)集進行系統(tǒng)的教育科學研究,為助力人的全面、自由、個性化發(fā)展提供理論指導。②實踐意義。運用大數(shù)據(jù)、人工智能等相關技術建設高校教育大數(shù)據(jù)分析平臺,采用信息理論和技術對教育科學進行認知規(guī)律、教學規(guī)律、教育管理的研究,突破教育公平和個性化的矛盾,實現(xiàn)規(guī)模化與個性化統(tǒng)一。
三、教育管理問題之一——貧困生預測
1.研究意義。助學金政策是國家針對大學生的一個扶貧政策,即國家和地方拿出一部分資金資助家庭經(jīng)濟困難的同學,以幫助他們減輕家庭經(jīng)濟和心理負擔,從而能夠順利完成學業(yè)。然而,在學生助學金等級認定過程中存在著“虛假困難”難辨別,“真實困難”難覆蓋等問題[5],這也使得高校助學金的評定不能真正達到公正、公平,導致了高校資助工作發(fā)展不到位。只有合理運用成熟的技術手段來解決助學金評定中所存在的問題,才能讓助學金的發(fā)放更合理,發(fā)揮更大作用,也有益于推動高校學生資助往健康、健全的方向發(fā)展。
2.研究內(nèi)容。主要研究分析學生的校園數(shù)據(jù),包括消費一卡通數(shù)據(jù)、寢室門禁數(shù)據(jù)、圖書館借閱數(shù)據(jù)、圖書館門禁數(shù)據(jù)、學生成績數(shù)據(jù)。根據(jù)數(shù)據(jù)提取、構造能抽象描繪出學生在現(xiàn)實生活中的消費、行為等合理特征,通過機器學習完成對已有的學生數(shù)據(jù)建模,評估驗證得到一個能判別分類學生獲得助學金等級的優(yōu)良模型,從而運用此模型精準預測評定未來學生獲助學金等級。
3.需求分析。傳統(tǒng)的發(fā)現(xiàn)貧困生的方法是基于學生基本屬性的評估和基于學生的在校消費記錄的分析。但是,學生基本屬性是一種靜態(tài)特征,用于挖掘貧困生不夠精確。目前豐富的校園記錄數(shù)據(jù)是用于描述學生狀況的重要來源,教育心理學指出,學生的多源行為記錄客觀反映了學生的經(jīng)濟狀況。通過對學生在校園產(chǎn)生的多源異構數(shù)據(jù)進行分析、挖掘,有效的抽取得到與學生經(jīng)濟狀況相關的多類量化特征,從而通過這些量化特征觀測學生經(jīng)濟狀況,完成建模預測。
4.總體設計。本次項目主要分為三個大步驟:對原始數(shù)據(jù)預處理,選擇適合的算法擬合訓練集數(shù)據(jù)得到模型,根據(jù)訓練集學習到的模型對測試集進行預測輸出,得到最終結果。
5.數(shù)據(jù)分析。本次數(shù)據(jù)來源于Datacastle大數(shù)據(jù)競賽平臺,由其中的智慧中國杯下的教育賽提供。將某高校學生在2013/09-2015/09的數(shù)據(jù)混合,切分成訓練集與測試集兩組。
6.模型評估。貧困生預測問題采用梯度提升決策樹(Gadient Boosting Decision Tree)來建模[7],其策略是每一次建立模型是在之前建立模型損失函數(shù)的梯度下降方向。貧困生預測的精準率、召回率、F1-score分別為0.9、0.89、0.86。
四、總結
綜上所述,我們已經(jīng)進入了一個“數(shù)據(jù)驅(qū)動學校,分析變革教育”的大數(shù)據(jù)信息時代,大數(shù)據(jù)必將給傳統(tǒng)教育注入新的動能。信息時代大數(shù)據(jù)相關技術的發(fā)展使得研究認知規(guī)律、教學規(guī)律、教育管理規(guī)律成為可能,其及時性、互動性、科學性等特點,彌補了傳統(tǒng)教育中滯后性、單向性、封閉性等不足。我們國家的教育大數(shù)據(jù)研究尚處啟蒙階段,教育大數(shù)據(jù)的科學系統(tǒng)研究大數(shù)據(jù)將促進高校決策、評估、教學、管理、服務及評估等工作的變革,但也會帶來諸如數(shù)據(jù)安全問題、個人隱私問題等挑戰(zhàn)。只有對教育大數(shù)據(jù)進行系統(tǒng)、科學的研究,才能突破教育公平和個性化的矛盾,實現(xiàn)規(guī)模化與個性化的統(tǒng)一,為每一個學生提供優(yōu)質(zhì)、自由、個性化的教育,助力學生的全面發(fā)展。
參考文獻:
[1]Big Data Research and Development Initiative[DB/OL].[2012-03-29].
http://www.whitehouse.gov/sites/default/files/microsites/ostp/
big_data_press_release_final_2.pdf.
[2]中國共產(chǎn)黨第十八屆中央委員會.中國共產(chǎn)黨第十八屆中央委員會第五次全體會議公報[EB/OL].(2018-03-22).[2015-10-29].
http://www.xinhuanet.com/politics/2015-10/29/c_111698307
8.htm.
[3]中華人民共和國教育部.教育部關于印發(fā)《教育信息化“十三五”規(guī)劃》的通知[EB/OL].(2018-03-22).[2016-06-07].
http://www.moe.edu.cn/srcsite/A16/s3342/201606/t20160622
_269367.html.
[4]國家自然科學基金委員會.2018年度國家自然科學基金項目指南[EB/OL].(2018-03-18).[2017-12-15].
http://www.nsfc.gov.cn/nsfc/cen/xmzn/2018xmzn/index.html.
[5]Chu Guan,Xinjiang Lu,Xiaolin Li,Enhong Chen,Wenjun Zhou,Hui Xiong.Discovery of college students in financial hardship[C].16th IEEE International Conference on Data Mining (ICDM 2016),2016:141-150.
[6]陳桂香.大數(shù)據(jù)對我國高校教育管理的影響及對策研究[D].武漢大學博士論文,2017.
[7]周志華.機器學習[M].北京:清華大學出版社,2016:3-20.掘。