牟智佳 武法提
摘要:基于數據集的學習分析和人工智能技術的深入發展,使得以優化學習過程、縮短學習改善周期為目標的學習結果預測得到研究者的廣泛關注和實踐探索。文章首先對數字化學習環境下的學習預測研究探索進行梳理,辨析其研究特性,之后縱向解析了學習結果預測研究中的內容,并橫向剖析了研究中存在的問題;在此基礎上,從情境、理論、數據、方法和結果五個層面對未來學習結果預測研究的設計取向進行討論;最后,對以學習者為中心的數據的預測設計原理進行闡釋,并設計個性化學習結果預測研究框架,以明晰其系統化分析流程與結果。
關鍵詞:學習結果預測;學習分析;人工智能;個性化學習;設計取向
中圖分類號:G434 文獻標識碼:A
一、數據集驅動學習預測研究的發展契機
計算機和數據科學的進步使得基于新類型證據的決策得到前所未有的發展。盡管數據科學已經在商業、工程、技術、科學等領域建立了良好的應用基礎,但對教育領域的影響和滲透還尚未全面展開。近年來,移動技術的逐漸普及和網絡學習資源的指數性增長使得數字化學習逐漸成為常態,而增強現實技術和可穿戴技術的興起則進一步豐富了數字化學習方式和學習環境。大數據技術和數據科學給教育帶來的沖擊使得研究者、管理者、教育企業、教師等不同角色人員開始重視對不同學習情境和學習方式下生成的數據進行整合與分析,并逐步形成了基于不同類型數據集進行學習測量與計算的學習評價新生態。與此同時,學習分析探索已走過初期對分析模型、應用價值、發展方向等理論方面的研究,正轉向基于數據集的可視化分析和學習行動,以將其理論分析的價值轉化成實際應用效能。在教育大數據和學習分析的背景下,以優化學習過程和改善學習成效為目標的學習預測研究迅速得到研究者的廣泛關注和實踐探索。而以模式識別、計算感知、神經網絡、機器學習等為代表的人工智能技術的深入發展則為學習預測研究提供了分析技術上的有力支撐,從而使學習預測有了實現實時動態監測和智能化分析的可能。盡管當前對學習預測的研究有了一些探索和成果,但距離實現系統平臺的準確分析和大規模應用還較遠,特別是在實踐中還出現一些分析和設計問題,使得預測模型和結果并不能被廣泛應用于當前的數字化學習中。因此,有必要對學習預測研究中的問題進行深入剖析,明晰未來研究設計取向,促進其效能轉化以提高其應用價值。
二、學習結果預測研究的內容解析與問題述評
該部分首先對數字化學習環境下的學習結果預測研究進行縱覽,以窺看其整體研究狀態。之后從不同視角對其研究內容和問題進行分析以洞察其研究現狀。
(一)數字化學習環境下的學習結果預測研究探索梳理
對數字化學習環境下有關學習結果預測的研究文獻進行系統搜集,采用內容分析法對各項研究中的預測維度、數據來源、預測方法、結果分析等方面進行總結分析,結果如下頁表所示。在學習預測維度上,研究者主要對學習心理特征、學習結果與表現、學習能力等方面進行預測,其中對學習成績、學習結果和學習成功預測研究較多。在數據來源上,主要集中在課堂學習測評數據、問卷調查數據和學習管理系統數據上。在預測方法上,以多元回歸分析、決策樹、貝葉斯網絡和神經網絡分析方法為主。在分析結果上,預測模型在所研究的具體情境中表現較好,但在不同預測方法的準確率上存在差異。整體而言,學習結果預測研究體現出以下幾方面的特性:(1)微情境性,已有的學習預測研究偏向具體的學習情境,如多媒體學習環境、網絡學習環境、移動學習情境等,側重對學習者在某一具體情境下的學習階段活動分析;(2)學習數據的外在性,預測數據來源主要依靠網絡學習活動的外在行為表現和課堂學習情境下的學習測試表現;(3)預測內容的可計算性,盡管學習預測內容多樣化,但每一項預測內容都轉化成可以測量和計算的指標,以支持分析工具的數據處理和自適應學習系統的識別與自動化分析;(4)學習預測的結果導向性,學習預測主要依據之前和當前的學習活動特征對學習者未來的結果表現進行預估,如學習成績、學習目標和學習能力等,通過不同形式的學習結果預測來改善學習成效和學習體驗。通過對學習預測研究的梳理分析可以看出,以學習成效和學習能力為目標的學習結果研究是預測的重點,這反映出學習預測的目標是促進學生個體能力發展和學習成功。
(二)縱向解析學習結果預測研究中的內容
教育大數據的日漸興起和學習分析的廣泛應用使得學習結果預測研究成為學習分析領域中的一項研究熱點。為了進一步明晰該類研究的當前狀況和發展態勢,我們對有關學習結果預測研究的內容進行解析,窺探其預測方向和原理。該類研究內容主要集中在以下四個方面:
1.學習結果預測模型的生成
學習結果預測的原理是將預測目標內容作為因變量,預測指標內容作為自變量,通過分析來探索兩者之間的關系。而學習結果預測模型的生成就是通過數據分析探索自變量和因變量之間的關系,并確定不同測量指標對預測目標的影響效應權重。該類研究生成的模型包括基于特定理論設計并驗證的結構方程模型、基于多元回歸分析生成的學習預測參數、決策樹分類模型以及數學公式的假設與驗證。在學習結果預測目標方面,主要是對學習成績與等級和學習成敗進行預測,在預測變量上,以個人背景信息、過程性測評結果、學習參與狀況、學習情緒等方面為主要測量指標。
2.學習結果預測系統的設計
學習結果預測的應用目標是實現自適應網絡學習系統的實時監測與評估。當前對有關學習結果預測系統方面的研究還處在設計與初步應用階段。這方面的研究主要是學習成功系統的分析設計和學習表現預警系統設計應用。其關鍵問題涉及將學習者的哪些數據作為分析指標以及如何對學習成敗進行計算測量。在數據來源上,研究者將課程參與、內容學習、社交互動和測評分數等方面作為數據來源分析,在學習結果測量上,依據預測模型將輸入數據轉化成預測結果數據,并將分析結果按等級劃分,同時采用不同顏色標識,從而形成對學習結果預測的計算和可視化輸出。
3.MOOC情境下的學習輟學率與持久力預測研究
大規模開放在線課程爆發性的增長和廣泛應用使得注冊和學習課程的學生數量逐年遞增。然而,相對于較高的課程注冊數,能夠堅持系統完成課程內容學習和測評的學習者數量較少,多數學習者在課程中后期退出學習,導致MOOC的輟學率較高。與輟學率相對應的是學習者的持久力,即學習者能夠堅持學習完整門課程的能力。當前對于MOOC學習結果預測的研究主要通過對學習者的課程學習時間、學習次數、學習互動情況、作業提交情況等方面進行分析來預測學習者的輟學率,通過學習者參與度和形成性評價預測其持久力。
4.虛擬情境中的學習表現效應研究
相對于網絡學習情境,虛擬學習環境下的學習體驗能夠讓學習者有更多沉浸感和悅趣感,其應用場景包括教育游戲和虛擬現實。這方面的研究主要體現在兩方面:一是通過鼠標點擊行為預測存在學習風險的學生,學習者在某項學習活動停留的時間和學習次數能夠反映其學習狀態;二是監測嚴肅游戲環境下學習者的心理活動反應,并預測其對學習效果的影響。隨著增強現實技術的逐步成熟和應用,對該情境下學習者的心理狀態與學習表現的分析探索也將逐步開展,探索影響學習表現的學習心理指標及其與學習表現的效應關系是這方面研究的重要議題。
(三)橫向剖析學習結果預測研究中的問題
前面對學習結果預測研究內容進行了縱向分析,了解其主要關注點和具體分析內容。下面對各類研究進行橫向對比分析,剖析研究中存在的問題。
1.學習情境的單一性與應用局限
對各項學習結果預測研究的情境進行總結分析發現,研究情境涉及網絡學習環境、移動學習環境、虛擬學習環境和多媒體學習環境等,學習分析是基于某一單項具體情境開展的。當前,移動技術的廣泛應用和增強現實技術的日漸興起使得學習者的學習方式日漸多樣化,學習環境也將混合化。在這種背景下,基于某一單一學習情境的預測研究結果將無法遷移到常見的混合式學習情境中,其推廣應用受到局限。
2.數據來源的局限性與數據鏈的割裂
學習結果預測研究的數據來源對分析結果的準確性和科學性有直接影響。已有研究的數據來源主要集中在問卷調查數據、學習管理系統數據和課堂學習情境下的測評數據。盡管這些數據在一定程度上能夠反映學習狀態,但從類型上看仍屬于外在學習行為數據。對于基于眼動設備的學習者注意力行為數據、基于情感監測設備的腦電波數據、心率數據和皮膚感應數據等內在心理狀態行為數據分析的較少。偏重于外在學習行為數據的分析使得預測結果的可信度降低,同時也割裂了內在行為與外在行為相統一的數據鏈。
3.預測方法的約束性與分析結果的沖突
預測方法為數據的分析和模型參數的生成提供了工具支持。受制于有限的數據類型和數據量,學習結果預測方法以多元回歸分析和結構方程模型分析為主,采用決策樹、貝葉斯網絡、神經網絡、支持向量機等分類預測方法的研究較少。盡管通過統計分析能夠對數據間的線性關系進行分析,但當數據類型較為豐富、數據量較大時,采用機器學習預測方法通過訓練集和測試集方式形成的預測模型更加準確可靠。此外,由于數據樣本的差異化和方法的約束性,使得同一預測方法在不同樣本中的預測效果存在差異,從而使分析結果存在沖突,無法辨析最優預測方法。
4.理論基礎的薄弱性與預測模型的低效度
盡管學習分析是對學習過程數據進行可視化分析和輸出,但其最終目標是改善學習成效,其出發點和終點都是以學習為中心理念。同樣,作為學習分析后期研究模塊的學習結果預測研究也需要堅實的學習理論為支撐。然而,有關學習結果的預測研究較少提及所依據的教與學理論和思想框架,特別是缺少與學習活動過程緊密相關的教學設計理論,而這類理論對學習活動表現和結果有直接影響。缺少相關理論支撐的預測分析不僅降低了預測模型的效度,也阻礙研究者發現真正影響學習的關鍵因素。
三、學習結果預測研究的設計取向
學習結果預測研究是學習分析系統流程中的重要一環,其結果將為學習干預提供參照。隨著大規模開放在線課程的廣泛應用、自適應網絡學習平臺的發展和智慧學習環境的興起,為學習者提供學習結果預測服務將逐漸成為未來數字化學習的必要條件,且這種服務將實現監測的實時性與自動化。科學有效的學習結果預測研究不僅要在結果上具備準確性和可靠性,在應用上也要具有可遷移性。我們認為未來學習結果預測研究是這樣一種系統化流程,即在混合式學習情境下整合不同學習類型和行為數據,通過機器學習方法訓練出較為準確和穩定的預測模型,并為學習者提供個性化學習結果反饋。下面結合教育大數據、學習分析和人工智能技術的發展,從情境、理論、數據、方法和結果五個層面對未來學習結果預測研究的設計取向進行闡釋,以促進該類研究向著合理性發展。
(一)情境取向:混合式學習情境
移動技術和虛擬現實技術的發展使學習者由早期在傳統課堂環境下的正式學習演變成在不同情境下正式學習和非正式學習相融合的學習生態,支持學習者開展泛在學習的混合式學習情境是未來學習情境的常態。2016年《地平線報告》(高等教育版)在加速技術在高等教育中采用的關鍵趨勢部分指出,增加混合式學習設計是未來短期的影響趨勢,而混合式學習的設計需要豐富的學習情境提供支持。由于學習者的行為表現被分布到不同的學習情境中,因此在研究中需要整合常見的學習情境,如網絡學習情境、移動學習情境、虛擬現實情境等,這樣既可以全面分析學習者在不同情境的行為表現,同時使扎根于常見混合式學習情境的分析結果具有可推廣性。
(二)理論取向:整合教學設計與學習分析理論
數字化環境下的學習活動表現與教學活動和資源設計緊密相關,教學內容的編排和難易程度直接影響學習結果和學習體驗。當前,MOOCs較高的輟學率和低參與度其中就是由于課程內容缺少差異化以及師生互動黏性低導致的,而這與教學設計的適恰性密不可分。因而,學習結果預測研究需要考慮教學設計因素對學習表現的影響,在以教為主、以學為主和主導一主體教學設計理論的框架下,針對不同類型的課程設計,選擇合適的教學設計理論作為理論分析基礎。此外,學習結果預測是基于學習行為數據開展的分析,屬于學習分析流程中的一個環節,同樣需要學習分析理論的指導。因此,在實際探索中需要整合教學設計理論和學習分析理論對預測指標設計和分析流程進行設計,從而使預測模型能夠建立在可靠地分析理論之上。
(三)數據取向:學習者心理狀態與行為表現數據
以往的學習結果分析數據側重學習者的點擊數據,即學習者在不同網絡學習平臺中通過點擊生成的學習時間和學習次數數據,這些統稱為學習者外在學習行為數據。然而,學習者在課程學習過程中也會出現情緒上的變化,從心理學視角分析學習行為和狀態有助于探測影響學習結果的實質因素口”。近年來可穿戴技術、情感測試技術和增強現實技術的快速發展,使得研究者可以獲取到學習者內在心理狀態變化數據,如學習表情、學習情感、學習注意力等。在整合學習者外在學習行為和內在心理狀態數據的條件下,我們可以更精確地分析立體化的學習行為特征,發現隱藏在點擊數據背后真實的學習狀態,從而使學習結果的預測結果更為可靠。
(四)方法取向:機器學習為分析主導
教育大數據的逐步成熟和人工智能的深入發展正變革著當前以統計分析為主的研究分析范式。學習數據類型的多樣化和數量的增加使得以集成學習、基于規則的分類器、支持向量機、神經網絡等預測分類算法為代表的機器學習模式逐漸成為分析主導。機器學習分析模式下的學習結果預測分析涉及兩方面問題:一是采用監督學習探索自變量和因變量之間的映射關系,采用非監督學習探索學習表現中的行為模式,發現關鍵分析指標;二是對比不同預測分類方法的準確率和分析效率,整合各類算法優點找到適合分析不同情境下的最優預測分類方案,以便后面應用到網絡平臺中。
(五)結果取向:個性化學習結果反饋
學習結果預測研究的最終目標是為學習者提供服務,促使學習者優化學習路徑、改善學習成效。而未來學習方式將逐漸走向個性化,美國2016年國家教育技術計劃《未來學習準備:重塑技術在教育中的角色》在學習部分中指出,未來教育將通過技術和工具為學習者提供個性化學習。因此,為學習者提供個性化學習服務是技術改善學習的內在旨趣。在個性化學習服務的理念下,未來學習預測結果將為學習者提供個性化學習反饋,具體包括兩個方面;一是預測學習者學習成敗表現、學習成績等結果性信息;二是基于學習者的學習結果和個性特征,為其提供個性化學習反饋,包括學習內容推薦、學習互動人群推薦和學習練習推薦,從而使預測結果由初期的學習預警轉變成學習改善。
四、個性化學習結果預測研究的設計框架
基于學習結果預測研究的設計取向,我們以個性化學習結果為預測目標,進一步整合各方面分析內容,形成了以學習者為中心數據的學習預測設計原理。在此基礎上,設計個性化學習結果預測研究框架,以明晰其系統化分析流程與結果。
(一)個性化學習與學習結果的內涵分析
在設計個性化學習結果預測框架之前,我們需要辨析個性化學習和學習結果這兩個概念,以使其符合當前數字化學習環境發展的需要。個性化學習是由不同時代教育家和研究者針對教育問題不斷探索提出的。古代偉大的思想家、教育家孔子最早提出“因材施教”的教育思想。隨著教育云計算、大數據技術、網絡學習空間的建立以及移動終端的日漸普及,實現個性化學習逐漸成為可能。在個性化學習概念的分析上,國內外研究者開展了較為廣泛的探索。通過對相關文獻的搜集和分析,得出不同研究者對個性化學習概念和特征的解釋。國內比較有代表性的分析如楊南昌認為個性化學習是根據學習者的個性特征實施的學習活動,依據學習者個別所需提供最佳的學習方法和策略,它是在教師或學習者組成的小團體中開展的一種學習方式。王艷芳認為個性化學習強調以學習者為主體,針對學習者個性特點、知識經驗和能力、學習需求、偏好以及具體學習情境而采用恰當的學習方法、學習內容和學習進度,促使學習者的能力與個性在學習活動過程中得到充分、自由、和諧的發展。從國內研究者定義來看,基于傳統學習環境的個性化學習側重學習課程內容和學習方式分析,基于數字化學習環境下的個性化學習側重學習者的差異化管理和知識建構與內化分析。
相對于國內的分析維度,國外研究者和學術團體進行了較為深入和較多維度的探索。凱勒、美國課程監督和發展委員會、新媒體聯盟等研究者和學術組織對個性化學習的內涵、特征、政策進行了分析。其中TheBill&MelindaGates Foundation、the Michael and Susan Dell Foundation~EDUCAUSE等組織提出的關于個性化學習的四大支柱,包括學習者檔案袋、個人學習路徑、靈活的學習環境和基于競爭力的進度,明確了數字化學習環境下個性化學習的工作定義,是對新媒體環境下個性化學習較為成熟的分析。然而已有的定義仍存在以下幾個方面的問題:(1)缺少對整個學習分析鏈的分析,數字化學習環境下的個性化學習涉及活動參與、數據搜集和服務支持,最終幫助學習者完成學習目標;(2)未體現學習者的主動性,學習分析結果和服務的提供是為幫助學習者更好地了解和開展學習。基于上述分析,我們認為數字化學習環境下的個性化學習是學習者基于個人學習能力自主選擇學習網絡資源和參與學習活動,并依據已有學習行為過程數據分析結果及時調整學習進度和內容,形成以自主、按需、反饋為網絡學習特征的一種學習方式。
當前教育范式已經由原來的重視教學轉變成關注學生學習。而在對學習者進行學習評價時,會使用學習結果、學習目標等術語進行表述,較多研究者對此進行辯論和分析。關于學習結果的討論自教學目標理論、掌握學習理論就已經開始,是一個線性發展的過程。Robert Gagn e認為學習結果是學習過程的精煉理解,并允許為具體的教學設計提供參照。該描述是一種結果導向、學習結束和可測量的分析思路,是從行為主義理論視角進行分析。Elliot Eisner認為學習結果是個體參與后的結果,該描述認為學習結果并不意味著學習結束且不能夠對學習結果進行測量,是從實用主義和社會建構主義理論視角進行分析。Tine S.Preitz從學習是否結束、預先指定目標和測量方式等方面對已有學習結果內涵取向進行分析。可以看出,學習結果在過程與結果導向、學習結束和可測量方面形成了兩大陣營。本研究認為數字化學習環境下的學習結果是學習者基于網絡進行知識學習、參與互動交流并完成學習任務的非線性學習行為體現。其評價方式是通過對學習者的學習活動過程參與和完成情況進行分析和評定。
通過對個性化學習內涵的分析,進一步明確了個性化學習結果預測研究是以學習者為中心、以個性化學習服務為目標的設計方向,注重對其學習活動行為進行匯總分析,并提供符合個性需求的學習反饋服務。對學習結果概念的分析明確了個性化學習結果預測研究要從知識學習、內容互動和學習測評等方面進行內容解析,以適應當前基于內容的學習和基于互動的協作學習這兩種主流學習方式下的行為分析。
(二)以學習者為中心數據的預測設計原理
已有的學習行為分析主要從學習管理系統中抓取數據,體現的是以系統為中心的數據搜集思想。盡管利用這些數據能夠分析學習者的活動過程,但不能夠立體化的還原其學習表現。首先,學習結果預測研究的中心對象是學習者,他們既是學習分析研究的起點也是學習分析服務的終點。因此,應該以學習者為中心整合不同層面的學習數據,從而最大程度的對學習表現進行解析。其次,學習結果預測研究的核心特征是個性化,因此在數據搜集上應側重搜集具有個性特征的學習行為數據,進而為學習者提供個性化學習預測反饋服務。基于上述分析,我們提出以學習者為中心數據的學習結果預測框架設計原理,如圖1所示。該設計原理包括整合個性化學習理論、認知心理學理論和教學系統設計理論影響下的學習行為表現和整合內在行為和外在行為的數據分析思想。
(三)個性化學習結果預測研究的設計框架
學習結果預測設計原理明確了以學習者為中心數據的分析思路,而要形成對該類研究的系統化指導則需要一個整體設計框架,以詮釋個性化學習結果預測研究的分析思想。基于前面對個性化學習和學習結果的內涵分析,該框架以學習者為中心,通過數據層、分析層和結果層展示系統化流程,如圖2所示。數據涵蓋學習點擊數據、學習情感數據和學習檔案數據三種類型的數據,其中學習點擊數據主要指學習管理系統中的學習行為數據,學習情感數據指學習表情、學習注意力和情緒特征等心理活動數據,學習檔案數據指學習者個人信息、學習經歷和學習表現等信息數據;過程層整合了混合式學習情境、機器學習分析方法、教與學分析理論等內容;結果層是為學習者提供個人學習成績預測和個性化的學習內容反饋、學習互動反饋和學習測評反饋。該設計框架在數據層上要搜集識別學習者內在和外在學習數據,強調數據的全面性;在分析層中要基于數據進行學習行為分析和模式識別,強調分析的可靠性;在結果層中依據分析結果進行個性化學習反饋,強調反饋的差異性。
五、結語
學習結果預測是學習分析和教育數據挖掘領域中的研究熱點,它使學習者能夠在學習過程中及時調整學習策略和路徑,并進一步縮短了學習成效改善的周期。未來學習結果預測研究將扎根于混合式學習情境,基于學習者為中心數據的分析思路,通過監督學習和非監督學習分析方法生成預測模型,以提高其可靠性和可遷移性。
收稿日期:2017年3月14日
責任編輯:趙云建