涂濤 胡柯銘

摘要:大數據賦能教育變革,在促進學情診斷、學習分析、教學評價反饋以及教育智能決策等技術實踐運用的同時,也觸發了教育數據挖掘和學習分析等教育技術研究熱點。如何深度分析、挖掘、利用教育大數據,從而有效發掘教育規律、提升教學績效、促進學習者個性發展,厘清教育數據本質內涵、建構客觀教育數據觀是關鍵。針對目前教育研究數據觀存在的維度偏向:重視量化的收集而忽略質性的分析、側重將非結構化數據轉變為結構化、強調相關關系而忽略因果關系,該文引入厚數據概念,分析了厚數據強調定性分析、善于揭示數據背景、側重發現事物因果關系的特征,闡明教育研究中大數據與厚數據一極兩儀、缺一不可的融合互補關系,進而強調理應回歸大數據和厚數據原本一體、不可分割的“全數據認知觀”,深入情景,挖掘厚數據的潛在價值,將大數據和厚數據結合運用在教育技術研究領域中。
關鍵詞:教育大數據;厚數據;學習分析;智慧教育
中圖分類號:G434 文獻標識碼:A
“智慧教育創新發展行動”是《教育信息化2.0行動計劃》提出的“八大行動”之一,智慧教育作為新一代信息技術與教育創新融合的新形態,充分體現了萬物互聯時代云計算、大數據、人工智能等新技術賦能教育創新發展的作用。我國學者黃榮懷認為建立智慧學習環境需要新技術、新手段,而不同的學生在新型教學模式中都需要不同的與其相適配的學習內容,這些技術的基礎都是數據。智慧教育、智慧環境(核心是智慧計算)和智慧教學(包括Smart Teaching和Smart Learning)互相關聯而成。完成智慧教育“大廈”的構建,大數據是關鍵技術。因此,實現智慧教育的前提是教育大數據的完善,經過數據挖掘和學習分析(Learning Analytics)技術處理后的教育大數據為新型教學提供無限可能。教育領域的大數據與教育創新發展隨之緊密相伴而行,如何有效發揮教育大數據效能成為關鍵。
(一)教育大數據的界定
我國學界認為:大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。而教育大數據是大數據的一個子集,特指教育領域的大數據,是整個教育活動過程中所產生的以及根據教育需要采集到的,一切用于教育發展并可創造巨大潛在價值的數據集合。教育大數據并非僅僅強調數據的數量“大”,更重要的是強調數據帶來的作用的大,通過對大量的教育數據進行分析,得出教育數據之間存在的關聯、分析產生數據的原因并且幫助預測教育發展趨勢。
(二)教育大數據的研究熱點
自從2010年大數據一詞進入我國視野以來,如今我國對教育大數據的研究已經進入穩定發展階段。《中國基礎教育大數據發展藍皮書(2016-2017)》提出了教學范式3.0,研究集中在利用數據驅動教學范式,即人工智能各技術幫助分析教學過程中教師的教學數據和學生的學習數據,以期幫助教學者、學習者和教學管理者全面了解教學各個環節的數據,以促進教學的整體優化與變革。楊現民、田雪松等詳細解釋了應用大數據技術構建高效互動課堂的實施策略。方海光提出了整合現有的及未來的業務應用系統的數據,將數據存儲在“云”中,最終實現教育資源的信息化共建共享。武法提對于基于教育大數據的學習習慣動力、未來課堂、學習分析工具的功能都具有一定的研究。余鵬、李艷在教育大數據為背景的基礎上提出了生態體系模型,該模型能夠實現對數據的精準管理。孫志偉等人從教育大數據視角構建了錐體網絡狀結構模型,從層次性的視角來梳理教育大數據中不同元素之間的關系。此外,國內對于基于大數據的學習分析、機器學習、數據挖掘、深度學習和教學模式、教學管理、教學資源方面也有相關研究。
國外對于教育大數據的研究重點聚焦于三個方向:教育大數據的基礎理論、大數據支持下的學習方式探索、教育大數據處理技術的應用與實踐。
大數據在推動教育深度改革的過程中發揮著很多重要的優勢。在重塑教學模式、重構評價體系、轉型研究范式、創新教育決策、變革教育管理等方面的技術賦能意義重大。我國現階段教育大數據在改善學習方面主要體現為三點:反饋、個性化和概率預測。而教育工作者和研究者在分析教育數據之間的關系,為教育主管部門提供決策支持、提升線上教學的智能性、技術支持學習者的個性化學習、校園安全的輿論監督、對未來發展提供數據支持等方面已有不少研究。
(三)教育大數據研究的偏向
大數據在教育領域的研究逐漸增多已經顯示了大數據對教育領域的影響。但由于教育領域的特殊性,對學習者、教學者、教學過程的記錄不能僅僅簡單的用“0”和“1”來表示,因為教育領域更多面對的不是行為而是思維。較多研究分析了受教育者的行為以及行為之間的關聯,但是大多忽略了行為和行為關聯背后不可量化、個體化的思維和情緒要素。基于此,在涉及到教育的研究中(環境、過程、對象、行為、效果),不可量化的非結構化數據將大量呈現,并對研究結果產生顯著性影響。
現有的數據認識觀更多的偏向于大數據的研究方法,在這個視域的研究中,祝智庭等提出了需要從方法論上探索,將大數據與教學實踐和教學管理結合,并且提出了教育大數據文化的教育策略。劉清堂等提出了在大數據視角下在線學習過程性評價系統的設計,而在系統的設計中提到,數據采集是很重要的一個環節。但是大多在大數據視域的研究,對人類活動數字化記錄的非結構化數據研究略顯不足,造成了在整體教育數據研究上的數據認識觀偏向:
1.重視量化的收集而忽略質性的分析
教育大數據是通過對學習者、教學者、教育管理者的活動和行為進行追蹤而獲得的,包含了教育過程中所有的數據,雖然呈現為0和1數字的量化數據很重要,但通過這些海量數據并不能獲得對學習者完整的理解,只能得到淺層次的、對學習者簡化的解釋。例如,隨著大數據、人工智能、可穿戴技術和情感計算的在教育領域的發展,教育領域的研究者將學習者的心理行為、體態行為、情感表現等數據整合之后建立了學習者的肖像特征,但是在建立的過程中忽略了產生這樣肖像特征的原因和過程卻強調了產生的結果。教育大數據通過對全體數據進行量化分析,得到學習者的行為和活動,卻忽略了形成這些行為和活動的原因。這也正顯示了教育大數據忽略了質性的研究卻偏重于量化的結果這一現象。
教育大數據和厚數據構成了教育數據的整體,呈現為一極兩儀的有機關系,通過對教育大數據和厚數據的分析能夠幫助我們更好地把握教育數據隱含的潛在意義。對于教育數據來說,大數據和厚數據缺一不可,相互依存,大數據研究事物產生結果和過程,厚數據研究事物產生原因;大數據研究范圍廣,厚數據研究程度深;大數據研究是什么、怎么做,厚數據研究為什么;大數據研究所有數據之間的聯系,厚數據研究數據背景。教育大數據與厚數據之間存在著互不可缺的關系。
(一)教育大數據與厚數據的不可替代性
教育大數據包含學習者在學習過程中產生的所有行為表現、檔案數據、學習者情感態度等數據,厚數據能夠通過分析,得到學習者學習行為的形成原因或者分析對學習者個性化學習產生影響的因素,厚數據得到數據產生“原因”,大數據得到數據生產“結果”,因此教育大數據與厚數據是不能互相替代的。教育數據包括結構化和非結構化數據,因此在處理教育數據過程中需要厚數據作為指導,判斷各變量的邏輯關系,為得出更好的分析結果,需要運用厚數據中的一系列的研究方法,為數據的處理提供依據。
(二)教育大數據與厚數據的互補性
教育大數據與厚數據之間具有互補性,即利用厚數據技術分析小樣本找出特定人群(教學管理者、教師、學習者)的需要,然后利用大數據技術充分收集足夠的量,最終得到我們需要的教育數據集合以供參考,得出特定人群需要的數據,只有通過對大數據和厚數據的綜合考量,才能得出具有說服力的數據。通過大數據和厚數據的互補,能夠幫助我們在研究過程中避免走進誤區。
(三)教育大數據與厚數據的驗證性
教育大數據與厚數據具有驗證性。在分析過程中,判斷不同變量之間的因果關系是為了得出“靈感”,更好地提供決策依據,在一定程度上也能起到預測未來的作用,分析教育數據的過程中還要不斷將厚數據中定性的分析和大數據中定量的分析相結合。通過厚數據的分析,得出數據產生的原因,能夠幫助驗證大數據的可靠性;而大數據的“大”,能夠幫助驗證厚數據的有效性。
教育大數據與厚數據一極兩儀,缺一不可,大數據和厚數據構成了全數據。因此,要實現智慧教育,除了大數據,厚數據也很重要。教育者在利用數據時需要從全數據思維將大數據和厚數據兩部分相結合,幫助學習者提升對自身的認知,幫助教育管理者和教學者進行教育決策,促進教育的進化和數據認知觀的培養。
在教育領域中,大數據的發展對促進我國教育公平、改革教育制度、創新教育理論提供了有利的依據,若只單純地從學習者學習過程產生的大數據發現和判斷,過度信任教育數據分析呈現的結果,將很有可能造成偏誤。因此,在對教育數據的理論研究和應用實踐中,理應回歸大數據和厚數據原本統一的全數據思維,建構新的數據認識觀,挖掘厚數據存在的潛在價值,在教育領域的研究過程中,將大數據和厚數據相互結合運用,辯證、客觀對待大數據和厚數據,將大數據和厚數據看成是教育數據的整體,一脈相承,缺一不可。未來的大趨勢應該是,不僅需警醒單純從現有的教育大數據發現和判斷,避免過度信任數字呈現結果可能造成的誤判;更是要主動透過深入使用情境,探知源于學習者真實個性需求影響而成的智慧教育發展趨勢,方能發掘厚數據在教育信息化征程中的重要價值。