▍上海交通大學高等教育研究院 魏昊卿
隨著信息技術的發(fā)展,數據已逐漸成為信息時代社會發(fā)展及科學研究的重要資源。據IDC公司報告,2020年全世界產生的數據總量將高達40ZB。正如聯合國發(fā)布的報告“Big Data for Development: Challenges &Opportunities”所說,大數據時代已經到來,數據在社會發(fā)展與科學研究中的作用逐漸顯現。
根據McKinsey公司的界定,大數據是指數據量達到海量,無法通過常規(guī)數據軟件進行獲取、存儲、管理和分析的數據。大數據的特征,根據IBM公司的定義,具有4V的特點,即:(1)Volum,數據量大,通常用海量來形容;(2)Variable,數據類型多樣化,數據逐漸轉變?yōu)榘虢Y構化;(3)Velocity,數據處理的快速化,大量數據的快速傳輸、運算和處理成為可能;(4)Value,價值高和密度低,有分析價值的數據僅占一部分。
大數據的應用帶來了科學研究范式的變化。Jim Gray提出了數據密集型科學的概念,并對科學研究的范式進行了以下分類:(1)實驗科學(Experimentation),通過對自然現象的描述,歸納其中的規(guī)律,該方法出現于 1000年前;(2)理論推演 (Theoretical),通過建模,由特殊到一般進行推進,歸納出理論框架,該方法出現于數百年前;(3)計算機仿真(Computational),擺脫對于實驗的依賴,通過“干試驗”模擬復雜現象,獲取實驗數據,該方法出現于幾十年前;(4)數據密集型科學 (Data-Intensive Science),也稱第四范式,基于前三種方法,通過IT技術,對于海量數據進行獲取、處理、存儲、分析。
2012年,美 國 開 始 啟 動“Big Data Research and Development Initiative”計 劃,旨在對大數據進行收集、處理、分析,從而加快科學領域的創(chuàng)新步伐,標志著正式將大數據提高到國家戰(zhàn)略層面。在教育領域,美國學校管理者協(xié)會(AASA)和學校網絡聯合會(COSN),同Gartne公司進行合作,啟動了“Closing the Gap: Turning Data into Action”項目,旨在促進大數據在教育領域的使用。此外,許多世界一流大學,例如耶魯大學、哈佛大學、斯坦福大學都采取了相應舉措,加強了關于教育大數據的研究。
根據學者的定義,教育領域大數據的定義有宏觀和微觀之分。宏觀層面上,教育大數據涵蓋了一切參與者在教學活動中的行為數據,具有層級性、時序性和情境性的特征;而微觀層面上,教育大數據專指學習者的行為數據,主要來源為各類教育平臺、教育管理系統(tǒng)等。
LA是近年來大數據在教育領域運用較為典型的技術手段。首屆教育領域學習分析與知識國際會議提出,LA以理解、優(yōu)化學習情境為目的,對于學習者及其環(huán)境所產生的數據進行測量、收集、分析。
在“NMC Horizon Report 2012 Higher Education Edition”報告中,NMC闡釋了LA的定義:LA是指利用數據收集技術和分析方法,對于學習者學習參與、表現的相關數據進行研究與分析,從而達到評估學業(yè)、預測未來表現、發(fā)現潛在問題的目的。
美國國家教育部發(fā)布的報告“Enhancing teaching and learning through educational data mining and learning analytics”認為,LA需要綜合運用信息科學、社會學、心理學等學科中的相關理論,通過教育大數據的收集、統(tǒng)計、分析,建立相關模型,對學習行為進行評價,從而為學習者提供個性化反饋。
Bienkowski將LA的應用領域分為幾類,包括用戶建模、領域建模、趨勢分析等。而這些應用領域中LA的實現,都需要相應的數據來源,也需要相應的技術方法。
首屆技術促進教育變革國際會議上,Jui-Long Hung博士提出了教育數據挖掘(EDM)這一概念。EDM是綜合運用機器學習和數據挖掘的技術,對學習者行為相關數據進行研究,使行為模型化顯示,探究各變量的相關關系,預測學習者未來發(fā)展趨勢。
Baker R. S.認為,EDM的研究包括四方面:(1)建立學習模型,收集并分析學生的學習動機、學習掌握程度、學習態(tài)度等相關數據,對于學生將來行為進行預測;(2)建立領域模型,對于教學者教學內容進行展現,調整教學序列;(3)評價支持效果,對于各類學習輔助軟件的支撐能力進行判斷與評價;(4)建立計算模型,模型中涵蓋了學習模型、領域模型涉及的數據,可用于輔助教學的相關科學研究。
關于EDM的相關技術方法,Romero C和Ventura S歸納出五類:統(tǒng)計分析與可視化、聚類、預測、關系挖掘、文本挖掘。
常見的可視化技術包括標簽云、歷史流以及空間信息流等。通過對數據分析結果的可視化處理,可以發(fā)現其隱藏的關聯,提供給用戶直觀觀測形式,最終用于指導決策。
許多網絡教學平臺都有對用戶行為進行記錄的功能,例如系統(tǒng)登錄時間、學習測試情況、與同學的交互等。學生的學習情況能夠直觀呈現,對于教學者而言,能夠增加對于學生的了解與理解,更有針對性地對學生進行指導,從而有利于教學發(fā)展與進步;對于學習者而言,可直觀地了解自己的學習行為,反思自己的學習過程,從而促進自我規(guī)劃。
例如,魯汶大學的Gantz J和Reinsel D在歐盟項目ROLE中,開發(fā)了一個應用程序,記錄學生在課程中參與活動的情況,并將數據進行可視化分析,以圖表來顯示學生的學習情況,為學生提供反饋。
在高等教育領域,數據可視化技術可以幫助教學管理者建立學習者模型,對學習表現進行分析,進而發(fā)現課程設計上的問題,完善教學設計與平臺功能,提供更好的教學支持服務,促進教學組織的發(fā)展。
隨著互聯網時代的發(fā)展,如何將學習科學和現代技術有機結合,為所有學生創(chuàng)造融入性、個性化的學習體驗,使得學習能夠映射到學生未來的現實生活中,是當代教育面臨的全新挑戰(zhàn)。而大數據為這一挑戰(zhàn)提供了解決路徑。利用大數據的技術方法,可以增進教學者對于學習者真實狀態(tài)的了解,同時沉淀每個學習者的個性化數據,便于教學者提供個性化的學習資源,在教學規(guī)劃、教學工具上都可實現個性化。
學習管理系統(tǒng)正在向個性化自適應學習平臺發(fā)展。通過大數據技術,持續(xù)采集學習者的數據并進行智能分析,學習行為的記錄更加精細化,可以完成從對結果到對過程的重視的轉化。
例如,MOOCs的學習中,學習者的各個行為都會產生大量數據,通過對這些數據進行挖掘和分析,可全面跟蹤和掌握學習行為、過程和特點,提供分析報告和研究服務,從而提高學習質量。
教育大數據相關技術帶來新的教學方式變革,對于學習者的相關過程數據進行建模、分析、預測,有利于個性化教育的實現。美國在2010年發(fā)布的“National Education Technology Plan”中強調,各類教育系統(tǒng)要利用技術測量、評價學習過程,教育管理者應該利用技術收集學習中的實時數據,為持續(xù)改善學習效果提供依據。
隨著互聯網時代的發(fā)展,新興的教學模式如MOOCs、翻轉課堂逐漸興起,而這些新興教育模式的開發(fā)與推廣,都與教育大數據技術的支持息息相關。教育技術的突破在于交互和大數據,這使得MOOCs與此前的遠程和在線教育有本質上的差別,形成了一場真正的教育革命。
以MOOCs為例,利用教育大數據技術,在MOOCs學習過程中,系統(tǒng)對于學習者的過程性數據進行記錄與分析,最終會匯集成學習大數據。MOOCs系統(tǒng)建立了由機器自動評測的交互式測驗,可在分析中發(fā)現、總結數據中的規(guī)律,實現即時交互,使教學者能及時傳播知識,掌握每個學生的學習進度與狀態(tài),并能隨時對學習者進行引導。有別于傳統(tǒng)的遠程教育,MOOCs突破了單向的教師教書、學生學習的模式,提高了學習效率。
Course Signals System課程信號燈系統(tǒng),是普渡大學所開發(fā)的。借助數據挖掘技術,該系統(tǒng)建立了相關模型,根據變量預測學生是否能夠完成該課程,數據量化地監(jiān)測學習進程,可以讓學生更好地了解自身狀態(tài)。
教育評價,Lee Joseph Cronbach將其界定為對任何于教育有指導意義的信息進行收集和分析的過程。而學者Daniel L.Stufflebeam提出,對于教育過程、教育成果涉及的資料進行收集,從而為教育決策提供一定支持的過程,是為教育評價。
隨著信息時代的發(fā)展,教育評價的數據主義趨勢逐漸顯現,教育大數據在教育評價、教育決策方面發(fā)揮著越來越重要的作用,美國政府早在2002年便提出要重視教育大數據在支持教育決策方面的作用。
現階段已有不少將大數據評價方式應用于教學中的實例。以LMS系統(tǒng)為例,LMS是用于教育管理自動化的軟件,在使用過程中,LMS能提供較多元的測試方式和較完整的評價體系,跟蹤記錄學習者數據,并向管理者提交報告。同時,LMS中有個性化的學習軌跡數據,能對學習進行客觀的分析,為教師改進教學提供重要依據。
而在我國,目前也已有完善的大數據教育評價應用,通過大數據技術方法,客觀而全面地對學習者進行學習歷程的記錄與規(guī)劃。并且《國家中長期教育改革和發(fā)展規(guī)劃綱要》也提出了對大數據應用于教育評價的重視,提出“要改進教育評價,根據培養(yǎng)目標和人才理念,建立科學、多樣的評價標準”。我國教育部已有相關的部門與人員,通過建立完善的數據庫,對教學質量進行監(jiān)測。而上海作為試點地區(qū),在2011年已開始收集中小學學業(yè)水平數據,包括學習動機、師生關系等信息。及時向教育管理部門反饋評價結果,有利于促進形成性評價的開展與實施。
在教育管理方面,教育大數據相關方法與技術能夠提供良好的支持。教育管理所涉及的數據量廣泛,包括人員信息、資產設備信息、教學活動信息、社會服務信息等,運用大數據技術,能夠對這些信息進行收集、分類、統(tǒng)計、分析,并加以可視化呈現,構建學校教育管理的Dashboard,讓自下而上的數據收集服務于管理者自上而下的校園管理。
目前,我國大學已廣泛將大數據用于教育管理之中。以復旦大學為例,其在多年前已有各業(yè)務數據庫,對這些分散數據庫進行整合,集成為全校范圍的綜合全局數據庫,為學校的教學管理提供支持。同時,上海財經大學更是把教育數據倉庫寫入了本校信息化建設目標之中,計劃依靠數據倉庫技術對學校的校務管理提供決策支持。此外,在提升學校網絡安全、改善教學和科研管理、完善學生救助體系、防范教育危機、促進教育均衡發(fā)展等方面,教育大數據都能提供相應支持。
綜上所述,教育領域的大數據應用對于研究范式、教學方式、教育評價、教育管理都有所支持,但在應用過程中需要注意數據的整合和交流。數據的重組與聯合、統(tǒng)一數據庫不同部分、不同數據庫之間的交流共享會產生比單個總和更高的價值。對于這一問題,美國有很多自組數據合作體進行數據交流共享,如COFHE、AAUDE、CSRDE等,都是較為成功的數據共享聯盟。
教育領域大數據的應用,將增加學習透明性,但同時也有可能引發(fā)一系列社會倫理道德問題。針對這一問題,已有機構與大學制定相關文件對其加以規(guī)避。例如,美國將對于學生隱私的保護寫入法案之中,美國頒布的《家庭教育權利與隱私法案》中就有相關規(guī)定;同時,在美國發(fā)布的“Big Data for Development: Challenges & Opportunities”報告中也提出,相關教育機構在獲取學生個人數據信息后,如要交付給第三方機構用于技術開發(fā),必須規(guī)避法律法規(guī)和相關國家政策。而我國目前正在積極推進大數據在教育領域的應用,在這一進程中,應注重相關數據信息的隱私保護,提升技術防范措施,制定相應法律法規(guī),通過國家保障讓教育大數據更好地發(fā)揮其真正的價值。