張生+駱方+趙茜+辛濤
2017年8月14日-15日,首屆京師教育大數據挖掘與應用年會召開。國內外40余位從事大數據分析與挖掘的專家在會上做了專題報告,來自各高校、科研機構、教育行政部門、企業等機構的700余人參會,同步收看會議直播的機構、單位和個人達到2000個。會議展示了教育質量監測與評價領域大數據研究和實踐的豐富成果,為學校、科研機構、企業之間的深度合作搭建橋梁,為我國教育大數據領域的發展助力。
本次年會由北京師范大學中國基礎教育質量監測協同創新中心發起,教育部基礎教育質量監測中心、英國劍橋大學心理測量中心、北京師范大學互聯網教育智能技術及應用國家工程實驗室、北京師范大學中國教育與社會發展研究院主辦,中國教育技術協會教育測量與評價專業委員會協辦。
國際進展
教育大數據涉及教育數據尤其是過程性數據的采集方式,數據的處理與分析方式,如機器學習、自然語言處理、語音圖像識別、視頻處理等,數據的呈現方式,如數據可視化、個體和群體畫像技術等多個方面。
當前國際教育大數據研究的重點之一是:利用大型社交網絡數據來評價與預測人的心理狀況,傳統心理特征的評價主要是依靠心理測驗的量表。正如劍橋大學測量中心主任John Rust 教授在會議的開幕式上所說:“十多年前,我們從因特網和Facebook搜集了600萬人的特征,之前沒有這么大的數據基礎。當時有很多人質疑這些數據有什么用,我們現在發現,這些數據可以做非常好的心理測量,可以用來分析一個人各方面的特征 。”
來自美國斯坦福大學商學院的Michal Kosinski 教授,曾入選DatalQ及IBM評選的“大數據50位最具影響力人物”,他研究發現:只需要用戶在Facebook上的227個點贊的行為,就能夠準確地判斷出用戶的性格特征。將此類方法用在教育中,可以基于學生的網絡痕跡對學生的人格、興趣、潛能、價值觀以及心理健康等進行預估。
另一個研究重點是:通過大數據挖掘技術從過程性、表現型數據中評估學生的認知能力和素養,最常見的是對作文的自動評分。利用學生學習的過程性和表現性數據,可大大提升評價的真實性和準確性,而人工評分效率低、成本高、誤差大。西澳大學教育學院的Andrew Kyngdon教授分享了使用新的神經網絡模型提升英語作文自動化評分效果的經驗。
還有一個研究是測量技術和大數據技術的結合。一是在命題領域。采用機器學習技術對人工命題的規律進行探索,從而能夠實現自動化命題。來自劍橋大學心理測量中心的Aiden Loe博士報告了使用機器學習算法自動生成人格測驗題目的研究。二是游戲化測評方式的應用。測量學家還希望創設一些能夠還原真實生活的測驗情境,讓被試身臨其境地解決問題。劍橋大學David Stillwell教授分享了他們把傳統的智力測驗放在游戲情景中的研究,探索了如何對被試與情境的頻繁互動過程中產生的海量數據進行分析,實現對被試的準確度量,這更需要人工智能工程師和測量學家的進一步緊密合作。三是推薦和適應算法。在教育測量領域還有一個重要的嘗試,就是開發自適應學習系統,基于考生水平給予最恰當的測試題目,在較短的時間內實現對考生的準確測量,并且給予最恰當的學習資料來提高學習效率。自適應學習的興起,源于網絡上的學習課程和測試系統的數據積累,研究者經過數據挖掘對知識脈絡進行了梳理,構建了知識點之間的概率模型。哥倫比亞大學統計學系的應志良教授基于決策論設計了推薦學習模型。
應用進展
中國學者圍繞大數據的理論與實踐,分別從教育大數據的不同方面進行了研討和分享。
中國基礎教育質量監測協同創新中心常務副主任辛濤教授指出:“教育質量監測與評價是一個復雜的系統,需要多領域、多學科的協同,多手段和多技術的整合。從中心的建立伊始,我們就在試圖探索信息技術如何推動和促進監測和評價的提升,推動監測工作的發展。”
在過去10余年的探索中,大數據的應用主要形成了三個方面的成果。
第一,用于常態、大規模監測評價的教育評價云平臺的建立。云平臺包括從數據的采集、數據的管理、數據結果的呈現、內含測量評價的標準以及采集過程的管理等內容。包括題庫系統、監測實施進展管理系統、信息上報及抽樣系統、電子化測試系統、報告自動化系統和標準劃定系統六個系統,將教育質量監測的所有環節和步驟信息化,實現功能和數據的整合,提高教育質量監測的質量和效益。
第二,面向過程性、表現性的特色測試系統的建立。探索復雜的非結構化數據的分析是中國基礎教育質量監測協同創新中心近年來重點突破的技術難點。目前已建立了包括演唱測試系統、文本自動標定系統、作文自動評分系統在內的特色測試系統,并開展了教學實時動態監測系統的小范圍試點。
第三,決策可視化系統的建立。為了將國家監測結果合理呈現以方便管理者決策,從而發揮監測的最大價值,中國基礎教育質量監測協同創新中心利用多種信息系統及指數平臺,采用科學、生動、可視化的形式對監測成果進行匯報與發布。“中國義務教育質量地圖系統”就是其中一個重要的支持系統。
同樣,圍繞教育大數據的不同方面,中國學者和實踐者給出了精彩的報告內容,具體包括六個方面。
一是大數據促進了研究范式的改變。大數據不僅是一種技術,更是一種研究范式,基于大數據開展各類研究成為當前學者們關注的焦點,這種范式能夠從自然的數據狀態揭示潛在的規律。如北京師范大學黃榮懷教授的“數據密集型研究”、清華大學王剛博士的“基于數據的學科研究領域知識圖譜構建及發展研究”、北京大學郭文革教授分享的“基于《數字化閱讀》課程數據的學習者批判性思維研究”。
二是涉及新型的測驗形式的研究與實踐。如北京師范大學劉紅云“基于行為過程數據的測量:理論與實踐”、駱方教授的“測評環境空間能力的‘虛擬迷宮游戲的開發”、薛貴教授的“基于腦科學的學生測量與學習”等,從過程和游戲化、腦科學等角度展示了新型的測評方式和研究,這些研究不僅具有理論意義,在實踐領域也取得了很大的進步。endprint
三是涉及網上考試行為有關的過程型數據的挖掘以及自適應系統的理論與實踐。如中國人民大學趙鑫博士的“基于在線測試平臺用戶行為的題目知識挖掘研究”、中國科學技術大學劉淇博士分享的“面向在線教育考試評估的數據挖掘技術研究與應用”,華東師范大學文劍冰博士分享的“認知診斷性自適應測評系統設計及實踐思考”和長春出版社鄭曉輝社長分享的“基于數據的小學數學自適應診斷與學習系統”。
四是基于學生學習過程的數據挖掘與分析,從學習過程數據進行心理狀態的測量與評價。如北京師范大學張生博士的“寫作數據如何預測人的心理發展”,還涉及從不同角度來看待學生的發展和表現;如中山大學胡延慶教授的“學生畫像:小學生語文寫作跟蹤軌跡數據分析與應用”等。
五是自然語言處理與深度學習在閱讀和寫作中的應用。通過機器對人評價的學習,機器逐步學會了對文本難度進行分級。如趙梓淳博士講的“中文分級閱讀的探究與應用”和張躍博士講的“基于大數據的英語作文智能批改”等。
六是涉及評價結果的解釋與運用方面的研究與實踐。中國基礎教育質量監測協同創新中心副主任劉堅教授從“區域教育質量健康指數:探索與挑戰 (2003-2017)”做了展示和分享,提出了三個問題:一是如何確定某一個指數的閾值范圍?二是如何通過篩選和合成等途徑進一步提煉體檢指標,用盡可能少的參數更加靈敏地反應一個區域或學校教育質量健康狀況?三是如何對數據進行更有效的深層次挖掘和更加充分的運用,真正促進教育公平和質量提升?
未來展望
第一,多地域、多學科研究領域人才的協同,實現教育質量監測大數據的挖掘。隨著教育質量監測過程性數據收集系統的不斷完善,未來教育質量監測數據將會以幾何級的規模遞增,而同時大數據不斷積累和開放過程中,不同國家之間、不同學科領域之間的協同合作,從多角度對教育數據挖掘,尋找學習、教學、管理過程中的規律,利用這些規律形成機器的教育智慧,從而進一步服務于教育過程,促進教育變革的順利進行。
第二,教育質量監測大數據分析結果與教育改進服務緊密結合。教育質量監測大數據挖掘直接導向應用,在教育各個層面上實現改進。首先,促進學生“更好地學”。通過對學生日常學習數據的分析,促進個性化的學習。從紙筆測驗向基于云計算的網絡測試發展,最終實現基于大數據挖掘技術的個體化實時監測,根據監測結果給學生提供更加個性化的學習材料。其次,促進教師“更好地教”。通過為教師提供學生學習過程和教學過程的評價數據,促進教師改進教學,針對學生的不同特征因材施教。再次,促進教育管理者“更好地管”。為教育管理者提供更多、更全面的數據,為其科學決策提供更有力的支持。
第三,教育質量監測大數據專門人才進行培養。隨著教育質量監測工作的不斷推進,各省、市教育質量監測機構紛紛建立,人才缺口巨大,特別是在大數據挖掘方面的人才極缺。作為一個學科交叉、復雜的研究領域,協同各高校和多學科的力量,培養大批專門人才是本領域未來發展的基石。教育專業院校在傳統的教育測量、教育統計專業的基礎上,增設新的專業方向,擴大招生數量,或面向教育質量監測實踐者開設大數據相關課程,是突破發展瓶頸的重要因素。
教育大數據的開發、應用仍面臨一些問題。例如,如何進一步實現測評工具的豐富性、科學性,可視化展示實時數據分析結果,對監測采集結果深度挖掘,為教育決策提供及時反饋,擴大教育大數據對監測的成效,同時加強對教育數據的分析、處理以及對學生綜合素養的測評進一步普及等。收集的數據很多是學習者學習過程中的個人數據,如何避免對于個人隱私的侵犯,實現研究倫理和技術發展的平衡,也是未來要著力解決的問題。endprint