聶瑞華 王欣明 李卓越



摘要:教育大數據代表著教育領域未來發展的方向,我國教育大數據研究與實踐整體還處于起步探索階段。該文以基礎教育領域為切入點,探討了個性化與自適應學習的方法,總結了在國內基礎教育現狀下實現這些實施目標所面臨的挑戰,提出了應對這些挑戰的一系列解決方案。這些方案作為教育部-中國移動聯合科研項目“信息技術支持下的學生學習行為記錄、分析與個性化支持”的工作成果,已經在廣州市天河區的多所小學進行了試點應用研究,取得了良好的成果,同時也獲取了一些寶貴的經驗教訓。
關鍵詞:教育大數據;數據挖掘;學習分析技術:個性化學習
一、概述
長期以來,我國的教學模式一直較為傳統,建立在所有學生都具有同等的知識水平、所有學生接受新知識的能力相同的情況下,難以因材施教、針對學生情況進行個性化教育,所以存在很多弊端:能力較強的學生的學習興趣、學習積極性被嚴重束縛;學生的薄弱環節不能得到及時、有效的增強;教學者工作難度大,管理者管理難度大。
個性化教育使學習者的學習能力、學習個性特征與教學環境達到平衡,可以很好的解決上述問題。個性化教育記錄與學生學習行為和學習情況有關的數據,如何從這些數據中獲得潛在信息并給予指導,為教育大數據的產生創造了有利條件。在教育領域,大數據在學習過程分析、知識表征與學習結果預測等方面大有可為,可以解決傳統課堂教學的弊端、增加了教與學的靈活性,為教學模式和學習模式提供了新意。
目前,教育大數據的概念和理論研究較多,然而在實施方面卻困難重重,特別是影響最廣的基礎教育領域。這種現象由兩方面造成,一是缺數據,目前學校存儲的學生數據多為學籍、入學信息、考試成績等“靜止”的數據,缺乏鮮活的、對教育個性化最重要的學習行為數據;二是缺工具,教師缺乏一個系統化的學習數據分析方法,能夠把學習行為數據、學習資源等與學習相關的數據匯集并進行處理分析,以便一目了然掌握每個學生的學習勢態。
由此可見,數據和工具是制約基礎教育大數據發展的兩個重要因素。針對以上兩個問題,本文主要從實施層面上研究如何在基礎教育領域實現教育大數據。本文依托于教育部一中國移動聯合項目“信息技術支持下的學生學習行為記錄、分析與個性化支持”和廣州市科技和信息化局基金項目,根據前期積累的相關經驗,首先介紹了個性化和自適應學習支持方法;然后根據基礎教育大數據的實施挑戰,提出了漸進式的基礎教育大數據實施方案,該方案與廣州市天河區教育局進行合作并在天河區多個小學實施,取得了較好效果。
二、個性化和自適應學習支持
每個學生都有不同的學習風格、教育背景和認知水平,對知識的遺忘速率也不同。自適應和個性化學習旨在針對學習者的差異,最大限度滿足學習興趣、學習風格和學習能力。自適應和個性化學習首先要掌握學生的學習風格模型、學習知識模型和學習行為模型。
常見的學習風格模型是Felder-silverman學習風格模型,它從感知、輸入、信息加工和理解四個維度將學習風格分為8個類型,并認為將學習風格和學習資源類型、教師教學風格結合,有助于取得較佳的學習效果。
(一)學習者知識模型
學習者知識模型中LKM=[KN,TN,EN,R],KN表示知識結點,知識結點包括元知識和聚合知識,若干個元知識的集合組成聚合知識。元知識的屬性包括優秀、良好、及格和未掌握;EN表示測試結點,測試結點的屬性為回答正確、回答錯誤,回答部分正確、錯誤次數和持續時間;TN表示練習結點,屬性為內容和持續時間。R為各結點之間的關系,關系包括先驗結點和后驗結點,即學習者需將某結點的先驗結點學習完成后,方可學習該節點。學習者知識模型如圖1所示。
通過對學習者知識建模,可以了解學生對每個知識點的掌握程度,學生進行練習的內容和持續時間,學生完成測試的正確率、錯誤率、持續時間等,進而對學生所學知識情況有一個全局的掌握。
(二)學習者行為模型
對學習者行為建模有助于分析學習者學習行為的產生原因及對學習結果產生的影響。學習者行為模型LBM={NB,PB,T}中NB為正常學習行為,PB為問題學習行為,T為NB和PB之間的轉換,且NB={LB,MB,HB}。如圖2所示。
1.LB為低級學習行為,主要指收集信息的能力,包括瀏覽、點擊、閱讀、保存、鍵入等;
2.MB為中級學習行為,主要指息的加工整理、信息發布和溝通交流;
3.HB為高級學習行為,主要指使用信息的能力,如信息精加工、總結反思、請教、設計等;
4.PB為問題學習行為,包括學習逃離、行為缺失、行為不當和學習時間分配不合理等部分。學習逃離指經常離開學習平臺從事其他活動,行為缺失指缺乏必要的學習活動和學習環節,行為不當指學習行為伴隨著非學習行為而進行,學習時間分配不合理指學習帶有某種突擊意味,并非循序漸進。
5.T為NB和PB之間的轉換,當學生長時間處于NB學習狀態、教師教授內容或網站提供學習內容
與學生興趣不符、遇到過多問題以致完成學習任務較為困難或其他原因可能導致學習行為由NB到PB轉換,而PB到NB的轉換則依賴于學生的自主行為、教師的引導行為和網站的監測調控系統。
建立起相關模型后,系統便可對學生的個性化和自適應學習提供支持。系統會根據學習者行為模型記錄和分析學習者當前狀態、學習偏好,隨時更新學習者描述信息以便更好對其模型內容進行調整;個性化推薦組件會根據學習者知識模型和學習者當前學習的知識點進行匹配,獲取學習者適宜學習的知識點、學習路徑并進行推薦;同時系統將記錄學習者整個學習過程及其狀態結果等信息,為提供進一步的個性化學習提供參考依據。
三、基礎教育大數據的實施挑戰
(一)基礎教育線下活動的數字化
基礎教育數字化的目的是把學校、教師、管理者、家長和學生有機結合,使各方對學習情況有全面細致掌握,然而在基礎教育領域數字化的十幾年歷程中,整個市場的發展卻遠低于預期,重構教育模式、教學模式和學習模式的愿景始終沒有實現。其主要原因包括:
1.核心用戶的需求
傳統課堂教學環境下,教師是教學活動的發起者、組織者和實施者。學生的學習、作業和活動都是圍繞教師的教學活動展開的,教師是基礎教育數字化的核心用戶。教師的教學過程看似隨意,實則每句話、每個動作、每個知識點都有精心設計,力求達到最好的教學質量。如果數字化教學產品和學習工具操作過于復雜,不僅不能幫助教師提高教學質量,反而會干擾教學。因此,基礎教育的數字化不僅要考慮學生的需求,更要把教師教學作為整個系統的重點。系統的設計階段要充分征求教師意見,最大限度滿足教師的教學需求。
教學不僅僅指課堂教學,還包括備課、批改作業、考試、批改試卷等多個環節,如何簡化數字化系統和工具的操作,在多個環節中實現數字化以完成統計量化分析,是亟待解決的問題。
2.家長的擔憂
基礎教育數字化中采集課堂學習行為主要依托于電子書等電子設備。這些設備雖內置有各種學習資源和學習軟件,整合了電子課本閱讀器,但遭到家長反對。家長認為基礎教育階段學生發育尚不完全,電子設備會造成孩子視力、書寫和思維能力的降低,也會導致孩子過分依賴于信息技術。所以如何在不改變原有課堂教學模式、不引入過多電子設備的情況下,實現學習的數字化,是面臨難題之一。
(二)學習行為記錄指導學習個性化
教育大數據的發展最終走向之一是個性化學習。個性化學習記錄學習者在線學習過程或課堂學習行為的一舉一動,通過數據挖掘和分析構建學習者模型,能夠對每個用戶在系統中的活動進行實時的響應并根據用戶行為推薦適合用戶的學習方式、學習資源等。
1.系統的學習個性比支持
雖然諸如分類、聚類、關聯分析、預測和推薦等各類數據挖掘方法都已成熟且均可以用于學習行為挖掘和個性化支持,但現階段各類研究的挖掘結果都只側重于學習者的某一方面個性化支持,并沒有一個統一、系統化、集中的方法把各方面的分析結果聯系起來以提供學習者個性化的全面表述,更沒有為一項教師提供易用的工具支持以上所有分析結果。
2.數據可視化顯示
數據可視化顯示可以清晰有效的解讀分析結果間的相互關系、傳達數據信息。目前常用的數據可視化方法包括柱狀圖、折線圖、餅圖、散點圖和雷達圖等。柱狀圖為二維圖形,適合于只需要比較其中一維的情況;折線圖適用于較大的數據集;餅圖只適合反映部分和整體關系的情況;雷達圖要求數據點不超過6個。
如何綜合以上各種可視化方法的優點,完備顯示出學生個性化學習中行為間的因果關系,是個性化學習面臨的又一挑戰。
四、漸進式的基礎教育大數據實施方案
教育部一中國移動聯合科研項目“信息技術支持下的學生學習行為記錄、分析與個性化支持”的總體實現框架如圖3所示,主要包括學習行為數據采集子系統、數據整理子系統、海量存儲子系統、決策支持子系統和學習行為數據分析子系統。
個性化學習支持子系統通過搜集和分析學習者的個性特征信息,從大量異構的信息中提取適合學習者需求的信息,并選擇“時機”主動支持,從而達到主動服務的目的。在本項目中,圖4的學習活動記錄流圖根據時序模式挖掘可視化的顯示學習學習的全紀錄,圖5的知識掌握程度熱點圖可以清晰了解學生學過的知識點、每個知識點隨著時間推移的掌握程度(以周為單位),以便全局掌握學習狀態,為學習資源、路徑的推薦和學習行為、結果的預測提供依據。
除此之外,為解決基礎教育線下活動數字化面臨的諸多問題,本項目采用了基于數據融合的課業考試和作業數據采集方案,該方案可以在不改變傳統考試和作業習慣的前提下,對學習數據進行采集并加以分析;為使學生個性化學習可視化,本項目提出了知識地圖的解決方式,該方式不僅利用了知識地圖的優點,使學生對知識點有全局的掌握,同時對學生學習提供了個性化的支持。本章其余小結將對這兩種方案的設計思路和創新的進行介紹。
(一)方案1:基于數據融合的課業考試和作業數據采集方案
1.方案設計
現階段有很多學者對基礎教育線下活動數據的采集方案做了研究,研究方案主要有電子設備采集方案、基于圖像識別的方案、點陣數碼筆方案和高考電子閱卷方案等。在基礎教育領域,教學模式依舊以線下板書和紙筆結合的方式為主。在這種教學模式下,教師批改試卷并錄入電腦是繁瑣的過程,統計題目錯誤率只能憑借感覺和經驗,不能準確把握各個學生情況。以上方案均不是理想的基礎教育數據采集方案。
基于上述問題與挑戰,本文提出將超聲波數碼筆與圖像識別結合的方案,打造出成本低廉、易用性強、可靠性高的線下數據采集方案。此方案只需為一個教師配備一只超聲波數碼筆、一個高拍儀或其他圖像錄入設備即可(如圖6所示)。超聲波數碼筆可以精準的采集到手寫筆跡數據,可以對筆記信息加以提取、挖掘,做更深層次的研究利用。結合高拍儀,利用圖像識別的長處,解決了超聲波數碼筆無法識別“翻頁”操作的問題,并且教師與學生無需改變原有紙筆結合的教學方式,實現了無縫切換,真正意義上找到了傳統課堂教育信息化的方法。
2.優勢與創新
本方案有效的解決了基礎教育線下活動數字化面臨的挑戰,滿足了核心用戶的需求,也解決了家長的擔憂。該方案沒有改變教師的教學習慣和閱卷習慣,也沒有改變學生的學習習慣,同時使教師在閱卷后可以實時看到班級學生的考試情況和分析,極大提高了教師的閱卷效率。
該方案的創新點在于開創式的結合高拍儀與超聲波數碼筆設備。兩者協同工作,全方位多角度的記錄教師批改試卷的過程,更好的促進了課堂教學信息化的步伐,較于點陣數碼筆方案,只需一支筆和一個高拍儀,快速便捷、成本低廉。
(二)方案2:知識地圖提供個性化學習支持
1.方案設計
在線學習在滿足學生隨時隨地學習、方便教師家長了解學生學習狀況的同時,也存在一些弊端。對于學生尤其是基礎教育階段的學生而言,學習注意力很難長時間集中,完全開放的在線學習網站中包含學習知識點和各類學習資源,同時也包含論壇、電子郵件和頁面中的各種鏈接。這些功能雖可以豐富學習體驗、促進學習協作,但也容易使用戶迷失在各種鏈接中。例如當學生遇到問題要在論壇求助時,發現論壇其他部分存在更有趣的事,注意力從而被吸引,以致逐漸偏離原定的學習目標。為了解決上述問題,本方案采用了基于知識地圖的學習路徑偏離判斷和糾正方法。
知識地圖用于表示兩個知識點之間的關系。知識點分為前驅知識點和后繼知識點以表示知識點之間的相關關系。方案首先根據學科知識繪制知識地圖,知識地圖中包含最優學習路徑、學生自己的學習路徑和尚未學習的知識點。最優路徑基于學生的歷史學習記錄和學習能力規劃得出,依照最優路徑學習可以達到最大的學習效果;學生自己的學習路徑是指學生在學習過程中經過的所有知識點。然后依照知識地圖和系統預設閥值,判斷學生是否偏離了當前的最優學習路徑,若偏離,則對學習路徑進行引導,從而實現學習過程的個性化支持。在知識地圖中顏色的深淺表示知識點的掌握程度,顏色越深表示掌握越好,鼠標單擊某知識點可以查看該知識點的屬性,即學生具體的學習情況。學習情況包括知識點的掌握程度、學習時間、測試得分等。知識地圖界面如圖7所示。
2.優勢與創新
本方案將知識點之間的關系使用知識地圖個性化呈現,使學生對知識點有全局掌握,并有效的解決了學習路徑的偏離問題,實現了學習的個性化支持。該方案適應于在線學習環境中,可以根據學生學習情況實時規劃學習路線,促進學習效果最大化,也可以使學生實時了解自己的學習情況和學習軌跡。
五、結束語
目前基礎教育線下活動數字化的諸多方案不能滿足核心用戶的需求,也存在家長的擔隴問題。為解決這些問題,本文提出了基于數據融合的課業考試和作業數據采集方案和知識地圖提供個性化學習支持的方案。該方案教師的教學和閱卷習慣,也沒有改變學生的學習習慣,即可對學生的考試數據進行采集和分析。針對教育中不能實現個l生化支持的問題,本文提出了基于知識地圖的學習路徑偏離判斷和糾正方法,該方法可視化顯示學科知識點,使學生對知識點有全局的掌握,并可以記錄學生的學習行為、判斷路徑偏離并予以糾正。本文提出的所有方案均已在試點小學進行實施驗證,取得了較好的效果。