吳 砥,饒景陽,王楊春曉
(華中師范大學 教育部教育信息化戰略研究基地(華中),湖北 武漢 430079)
大數據指涉及數據量的規模巨大,無法通過人工在合理時間內達到截取、管理、處理并整理成為人類所能解讀的信息[1]。教育大數據是大數據的一個子集,目前學者對教育大數據的概念界定存在爭議。總體來看,教育大數據主要包括兩個層面:廣義上的教育大數據泛指所有來源于日常教育活動的行為數據;狹義的教育大數據指學習者行為數據,主要來源于學生管理系統、在線學習平臺、課程管理平臺等。
作為基礎性戰略資源,大數據成為提升教育質量和優化教育管理的重要支撐,教育大數據的發展規劃和行動路線受到我國政府部門的高度重視。2014年3月,大數據首次出現在《政府工作報告》中;2015年8月,國務院發布《促進大數據發展行動綱要》[2],明確指出大數據成為推動經濟轉型發展的新動力、重塑國家競爭優勢的新機遇、提升政府治理能力的新途徑;2016年12月,工業和信息化部正式印發了《大數據產業發展規劃(2016—2020年)》[3],全面部署“十三五”時期大數據產業發展工作,提出以大數據產業發展的關鍵問題為出發點和落腳點,促進數據開放與共享,深化技術的應用創新;2018年4月,教育部印發《教育信息化2.0行動計劃》[4],提出利用大數據技術為學習者提供海量、適切的學習資源服務,深化教育大數據應用,助力教育教學、管理和服務的改革發展。
信息技術的進步帶動數據挖掘技術的提高,文本分析能力的拓展以及數據分析速度的提升,推動教育大數據在大規模開放在線課程、智慧學習環境、校園信息化管理等方面的運用。主要發達國家高度重視大數據的發展,頒布一系列政策和法規標準為教育大數據發展提供良好的外部環境。
美國是教育大數據研究和應用的領先國家,在技術研究、系統開發、實踐應用方面都取得了顯著進展。1968年美國聯邦教育部成立了全美教育數據統計中心(National Center for Education Statistics),2002年全美教育數據中心與美國教育研究所與合并重組后成立了教育科學研究院(Institute of Educational Science),研究院作為美國重要的教育決策咨詢機構之一,是利用數據支持教育教學改革的重要力量。大數據在美國教育評價決策中發揮了重要作用,例如美國聯邦政府設立全國教育進展測評機構負責監測美國中小學生學業成就現狀和發展趨勢,該機構對美國中小學的閱讀、數學、寫作、科學、歷史、地理、公民教育等學科進行了全面測評,其測評結果成為美國聯邦政府及各州衡量教育發展、分配教育資源、促進教育改革的重要依據。
2012年10月,美國教育部發布《通過教育數據挖掘和學習分析促進教與學》[5],報告旨在更好地促進美國國內大數據教育應用,指出目前教育領域中大數據的應用主要有教育數據挖掘和學習分析兩大方向。數據挖掘和學習分析兩個研究方向雖然同源,卻在研究目的、研究對象和研究方法等方面截然不同[6]。2013年11月,美國信息技術與創新基金會發布《支持數據驅動型創新的技術與政策》報告,報告指出數據驅動型創新是一個嶄新的命題,提出政府應大力培養所需的有技能的勞動力,推動數據相關技術的研發。
歐盟國家對大數據發展的支持主要表現在3個方面:一是大力推進開放數據戰略,二是資助大數據領域的研究和創新活動,三是支持大數據技術與產業的發展。2011年歐盟公開發布《大數據戰略》,隨后英國和法國先后發布大數據相關行動計劃,從國家層面頒布一系列戰略規劃,見圖1。
2011年7月,法國啟動“Open Data Proxima Mobile”項目,該項目希望通過公共數據在移動端上的使用,從而最大限度地挖掘其應用價值。2011年11月,英國發布對外公開數據進行研究的戰略政策,并于2012年4月成立世界上首個開放式數據研究所(The Open Data Institute,ODI)[7]。2013年2月,法國發布數字化戰略圖,明確了大數據是未來要大力支持的戰略性高新技術。2014年8月,德國聯邦政府內閣通過了由聯邦經濟和能源部、內政部、交通與數字基礎設施建設部聯合推出的《數字議程(2014—2017)》。
日本和韓國將教育大數據作為學校改革創新的重要驅動力。一方面,建立大數據分析機構,搭建數據收集和分享平臺。例如2013年12月,日本政府推出了data.go.jp網站,目的是提供不同政府部門和機構的數據供使用,向數據提供者和數據使用者開放數據;2013年8月,韓國科學、ICT和未來規劃部與國家信息社會機構協同成立了韓國大數據中心(Korea Big Data Centre),以促進政府開放數據的分析與應用,成為服務大數據企業的實驗基地,并為大學培養大數據專業研究人員。另一方面,日本和韓國頒布了大數據產業發展規劃,為大數據的發展提供政策支持。2012年6月,日本IT戰略本部發布《電子政務開放數據戰略草案》,邁出了政府數據公開的關鍵性一步;2014年5月,日本政府出臺了大數據應用個人數據使用報告,以指導企業使用大數據進行創新產品和服務研發;2014年12月,韓國未來創造科學部提出了“數據產業發展戰略”計劃,以求進一步推動韓國在數據產業方面的發展及創收。

圖1 歐盟教育大數據主要政策時間軸
國際知名標準化組織ISO和ITU-T等都已開展了大數據領域的標準化工作。2015年,國際電信聯盟(ITU)批準了首個大數據標準《基于云計算的大數據需求與能力標準》(編號ITU-T Y.3600)。此國際標準詳細規定了以云計算為基礎的大數據要求、能力和使用案例,以及高級“系統背景”方面的考慮與其他實體間的關系,明確給出了大數據的定義,即為一種允許可能在實時性約束條件下收集、存儲、管理、分析和可視化具有異構特征的大量數據集的模式。ISO/IEC JTC1 SC32“數據管理和交換”分技術委員會是與大數據關系最為密切的標準化組織,持續致力于研制信息系統環境內及之間的數據管理和交換標準,為跨行業領域協調數據管理能力提供技術性支持。JTC1/SC32現有的標準制訂和研究工作為大數據的發展提供了良好基礎,其標準化技術內容見圖2。

圖2 SC32標準化技術涵蓋內容
此外,ISO/IEC JTC1 SC36專門成立了教育大數據相關標準工作組(WG9),基于大數據的智能學習環境建設技術等相關標準成為研究的焦點。
美國在通用教育數據標準方面走在發達國家前列。美國國家教育統計中心于2009年設立技術工作組,為教育核心數據元素制定了切實可行的、公共的數據規范。美國通用教育數據標準 CEDS(Common Education Data Standard)設計了不同受教育階段產生的數據的層級模型,提供相應的數據匹配和研究工具。CEDS對給定數據元素的名稱、定義、選項集和技術說明形成的一套公共集合,包括一個“域”和“實體”的層級模型和一個完全規范化的邏輯模型,其數據模型見圖3[8]。CEDS的基礎教育部分下設12個子項目,包括基礎教育課程、課程單元、當地教育機構等部門,開發者可以通過CEDS設計出新的標準數據庫系統,或連接到已存在的標準數據庫系統。此外,美國國家標準與技術研究院(National Institute of Standards and Technology)建立了大數據公共工作組,工作組下設術語和定義、用例和需求、安全和隱私、參考體系結構和技術路線圖5個分組,目前已經完成了大數據定義、大數據分類、大數據用例和需求、大數據安全和隱私需求、大數據參考架構調研白皮書、大數據參考架構和大數據技術路線圖等輸出物V1.0版本,于2015年5月21日前征求意見,同時進行V2.0版本的工作。

圖3 美國CEDS數據模型
我國教育大數據標準相關工作也在有序展開。2014年12月,全國信息技術標準化技術委員會大數據標準工作組正式成立。工作組主要負責制訂和完善我國大數據領域標準體系,組織開展大數據相關技術和標準的研究,申報國家、行業標準,承擔國家、行業標準制修訂計劃任務,宣傳、推廣標準實施,組織推動國家標準化活動,對口ISO/IEC JTC1/WG9大數據工作組。2015年7月,工作組正式成立7個專題組,包括總體專題組、國際專題組、技術專題組、產品和平臺專題組、安全專題組、工業大數據專題組、電子商務大數據專題組。
1)完善教育大數據標準的體系框架。
教育大數據標準的體系框架是教育大數據的基本標準體系,具體包括教育基礎數據標準、數據處理類標準、數據分析類標準以及教育大數據服務類和道德倫理標準四大類。其中,數據分析類標準包括學習分析互操作標準、數據序列標準、學習分析可視化標準和參與者畫像標準等內容。
2)注重教育大數據隱私保護。
教育大數據在帶來便利的同時,也滋生了一系列新的信息安全問題和倫理問題。大數據時代的網絡安全要做好網絡硬件的維護和常規管理,也要做好信息傳播安全以及管理安全的綜合性分析,利用數據安全與倫理類標準來保障大數據環境的正常運行。
3)整合優勢力量參與標準制訂。
教育大數據運用難點主要在于采集、處理和可視化,相關標準的制訂離不開企業、教育機構以及研發機構等多個單位的支持和參與。對于標準內容的完善可以采用專業化分工的方式,由相關領域的專家帶頭,建立涉及教育大數據發展的基礎性、方法性、公共性標準和規范。