◎程 光 勝
《深化新時代教育評價改革總體方案》要求,充分利用信息技術,提高教育評價的科學性、專業性、客觀性,同時針對不同主體和不同學段、不同類型教育特點,設計能力為重、全面發展、面向人人、因材施教的學生評價,創新過程性評價[1]。職業教育是一種類型教育,在國家戰略發展中,與普通教育具有同等重要的地位[2]。與普通教育中的知識學習和科學研究不同,職業教育以職業技能提升為核心,以工匠精神塑造為靈魂。因此,開展職業教育的學習評價不能照搬和模仿普通教育領域的學習評價。通過評價促進學習是學習評價活動的邏輯起點,而傳統的學習評價基本上是一種終結性的評價,操作簡單,強調結果,但忽視了過程。如何基于職業教育的學習特點,構建動態、立體、多維的過程性學習評價,是當前職業教育評價關注的熱點。
伴隨著大數據技術在教育教學中的深度融合,基于數據實現對教育和學習的評價,使得評價結果更加真實、客觀和科學。然而,大數據所呈現的某些趨勢或規律只是信息重復的結果,預測分析結果的準確性取決于數據的質量和規則的制定。同時,大數據分析還存在這樣的特點:在分析中尋找目標,注重尋找關聯性、發現未知知識,在一定的時間范圍內生成可接受的解。這些問題和特點,對于個性化的學習分析而言,可能會存在大數據應用的局限性。
在大數據發展過程中,也產生了令人欣慰的小數據。這些小數據是圍繞個體的全方位數據,形成個體的完整數字視圖,體現出高價值、高效率、個性化的特點。因此,利用這些小數據開展職業教育環境下的精準學習評價,能夠準確把握學習者的學習概況,捕獲學習者多維度的學習信息,從而改進當前學習的不足,促進有效的學習。在當前職業教育環境下,以學習者為圓心,在精準學習評價中描繪學生能力發展的增長半徑,通過個性化的學習評價,為學習者提供差異化的教育及學習資源,以人為本,形成學習者個性化的競爭優勢,使學習者在服務經濟社會發展中能夠獨當一面,真正獲得人生出彩的機會。
大數據不僅僅是數據體量之大,大數據帶來的是一次重大的時代轉型,通過其自身蘊含的技術力量變革世界的同時,更是激發思維方式的變革,包括整體思維、復雜思維和相關思維等的變革。這種變革不斷重塑社會管理和國家戰略決策、產業和組織流程及服務方式,同時也會給教育管理和學習評價帶來新的力量。
與大數據分析技術相伴的是學習分析、人工智能等技術的綜合一體化應用,因此,在學習評價、教學評價、教育評價等領域,其主題關鍵詞是“大數據綜合素質評價”“人工智能教育評價”“智能技術學習評價”“數智融合教學評價”等,借助信息技術能夠增強和創新教育評價工具,優化教育評價管理,提升教育評價質量,拓展教育評價結果應用成效[3]。在數字化轉型背景下,伴隨著德智體美勞五育全要素數據的出現,學生綜合素質評價告別了單調人為的定性化評價,設計基于數據支撐的、反映核心素養的綜合素質評價指標體系是高質量教育評價的關鍵。張治等以此為出發點,根據不同維度數據采集的難易程度及技術要求,設計了MIPAL數據模型,在此基礎上通過數字畫像評價學生綜合素質[4]。大數據變革學生綜合素質評價,大數據技術可分層設計并管理評價的各個階段,如大數據采集技術可實現評價輸入、大數據處理技術可實現評價處理、大數據挖掘分析技術可實現評價分析、大數據輸出技術可實現評價輸出、大數據推送技術可實現評價反饋等,從而確保評價輸入的全面、處理的有效、分析的深刻,輸出的精準和反饋的及時[5]。因此,數據驅動的素質評價,強調常態檢測,主張用數據說話,遵循觀測學習、解釋學習、反饋學習的循環邏輯。
學生素質具有整體性、穩定性和長期性,其蘊含個體的價值追求、思維方式、審美取向及行為表現,與核心素養相輔相成,形成一個整體,因此采用傳統紙筆測試來測評綜合素質,顯然是測評不出來的,需要借助智能技術,基于全域的網絡覆蓋和終端數據采集,獲取學生外顯和內隱的量化數據,經過計算處理實現素質的測評。彭波等基于人工智能視域,從評價目標、評價主體、評價方式、評價標準、評價結果等方面分析了人工智能在教育評價中的應用,指出未來的教育評價,必將滲透人工智能的理念,同時人工智能的理念會影響教育評價改革的進程和方向[6]。可以看到,基于大數據和人工智能技術的教育評價是科學評價的實現途徑和方式,也是教育現代化的重要特征。
在大數據、人工智能技術應用于基礎教育、高等教育領域實施教育及素質評價的同時,也有部分研究基于職業教育視角,探索數據和技術如何賦能職業教育評價。孫翠香認為,職業教育評價是一個復雜的評價系統,在這個系統中,立德樹人是職業教育評價的核心,而“課程與教學實踐”“人的發展”是評價的目的,在整體系統化教育評價框架的統一下,要增強“協同”評價效應,平衡評價的“問責功能”和“發展功能”[7]。作為教育評價的一個重要組成部分,職業教育學習評價已由結果性評價向過程性評價轉變,結合現代信息技術和學習數據,程光勝設計了職業教育精準學習評價框架,并從改進結果評價、強化過程評價、探索增值評價、健全綜合評價四個方面闡述了精準學習評價的實踐探索[8]。
上述文獻充分發揮數據和智能技術的優勢,運用多種學習分析技術實現對教育及學習的多維度評價。技術賦能教育及學習評價,是深化新時代教育評價改革的必然選擇,具有科學化、多元化、立體化、最優化、精準化等主要特征[9]。同時,基于數據實現學習評價,是科學研究第四范式在學習評價中的應用,將會豐富教育評價本體論,重塑教育評價認識論,深化教育評價價值論,變革教育評價方法論,使教育評價不斷走向智慧化和專業化[10]。
伴隨著經濟社會的發展,職業教育的生源由單一正在走向多元,這是由職業教育的性質所決定的。當前,在高職擴招百萬的政策影響下,我國職業教育的生源結構已由學齡段生源進入學齡段生源與社會生源持續并存的新常態[11]。與學齡段生源相比,社會生源具有學習持久力不足、認知能力不足、內生動力強、社會屬性強等特點。在這種背景下,學習者的學習特點、學習方式、學習理念等呈現出多元化的特征,加之職業教育人才培養的目標是高素質技術技能人才,因此如果采用傳統的紙筆測試評價其學習,顯然是不合適的。
因此,本文在教育大數據環境下,充分利用智慧學習環境、平臺以及智能化設備,采集以學習者個體為中心的學習小數據,對學習者的學習進行動態、立體、過程性的評價,以評價促進學習,讓每一位學習者都能發揮個性優勢,不斷改進和發展學習,實現健康成長并成才,在全面建設社會主義現代化國家、實現中華民族偉大復興中國夢的征程中,讓每一個接受過職業教育的學習者都能成就夢想,獲得人生出彩的機會。
通過搜索引擎,很多用戶只可能關注海量搜索結果的前面條目;在財務決策時,財務主管也許只關注財務報表中的部分匯總數據;在書店購書時,買者一般只會閱讀前言和目錄信息;在平臺購物時,客戶也僅僅關注商品評論中的部分評論信息。事實上,在很多領域、很多情況下囿于時間和成本,人們面對和能夠處理的數據僅僅是大量數據下的一部分。從這個角度來看,人們的決策往往是基于部分數據的,以局部了解整體。陳國青等將這樣的部分數據視作小數據,認為小數據是相關數據全體的一個子集,并從數學的角度給出了“大數據—小數據”的形式化定義[12]。在遵從小數據是相關全體數據子集的基礎上,陳輝從應用方式的角度認為,小數據是大數據時代下的一類新興數據,是圍繞個體的全方位數據及其配套的收集、處理、分析和對外交互的綜合應用系統[13]。基于此,本文認為,在當前大數據環境下,把圍繞同一個體的所有數據通過特定的技術和工具抽取出來,執行清洗、轉換、整合等操作,然后按照合適的存儲模型組織管理起來,就形成了個體小數據。因此,從這個角度來看,小數據是一個富有個體色彩的數據系統,反映了個體的完整行為軌跡,具有鮮明的個體獨特性、復雜的類型多樣性、高度的實時動態性和鮮明的人機交互性。
從數據科學的角度來看,數據亦有大小之分,然而,這種大小不是數據規模的大和小,而是從應用的角度將數據劃分為大數據和小數據,大數據偏向總體和全局,小數據側重個體和局部。
大數據很大,表現為數據量大、數據種類多、數據增長速度快,與此對應的分析方法眾多,涵蓋統計方法和機器學習等方法。然而,大數據有時也很小,在分析中其所呈現的某些趨勢或規律只是信息重復的結果,具有一定的普遍性,但是缺乏針對性和精準性,微觀個體差異不顯著。
大數據和小數據之間并無明顯的界限,小數據通過不斷積累,會形成“大”數據。在無法獲得大數據的現實下,小數據因其信息密度高,在分析中能獲得較高的投入產出。與大數據分析相比,小數據能夠在采集個體全局數據的同時更加充分地洞察個體的異質性,換言之,就是具有個體的針對性,求同存異。
總之,大數據體現出規律,小數據蘊含著智慧。小數據“見微”,做個人刻畫;大數據“知著”,反映總體特征和規律。
學習評價是教育評價的一個重要組成部分,主要針對學生的學習做出客觀的價值判斷。借助人工智能等新一代信息技術,可以分析學習過程,總結學習結果,預測學習發展[14],這大大地拓展了傳統教育評價的內容和邊界。但是,對于不同的學習主體而言,由于培養目標和學習內容的不同,其學習評價內容存在教育很大的差別。與普通教育相比,職業教育目標是培養能工巧匠、大國工匠的高素質技術技能人才,培養知識型、技能型、創新型的高素質勞動者,建設技能型社會,不僅符合我國的國情,而且能夠助力中華民族偉大復興中國夢的實現[15]。職業學生的學習內容可分為宏觀、中觀和微觀層面:宏觀層面由基于功能性的“技能—認知”學習和基于人本性的“社會—心理”學習構成,描述外顯世界向內隱世界的躍遷;中觀層面由“專業—內容”學習、“政治—社會”學習、“操作—方法”學習三部分組成,詮釋內容與方法以及對象與環境的互動;微觀層面涵蓋“學習—工作”和“合作—交流”,解讀人與物以及人與人互動的技術。[16]因此,職業教育學習評價最終需要反映職業學生的知識習得、技能掌握和能力養成。
科學的學習評價是提升職業教育質量的關鍵。從社會視角來看,學習評價要注重能力因素,是職業教育外部質量評價的重要方面;從教育視角來看,學習評價要兼具教育性和職業性,是職業教育質量的重要檢測和保障手段;從學生視角來看,學習評價要具備鼓勵和回饋的功效,促進學生的成長和未來發展。[17]以評促學是學習評價的終極目標,通過學習評價,幫助學生反思學習、改進學習,促進學生的個性化發展,最終培養主動、健康發展的個體生命,培育人的生命自覺和實踐智慧[18],這與教育的根本任務——“立德樹人”是完全一致的。
在學習者學習過程中,其學習行為數據的產生主要有三種方式:分別是學習者主動輸入、系統實時記錄、可穿戴設備自動生成。
學習者主動輸入的數據主要包括:學習者的基本信息,如學號、姓名、專業、性別等;學習者在智能學習平臺或圖書館管理平臺使用中檢索過的關鍵詞、圖書的借閱記錄等;學習者在學習完資源后發起或參與的主題討論;學習者在項目完成或實習實訓結束后撰寫的總結報告等。這些數據一般為結構化數據,存儲于特定的關系型數據庫管理系統中,可以通過SQL命令實現查詢獲取。
系統實時記錄一般是由在線學習系統或虛擬仿真平臺通過日志服務器自動生成,記錄了學習者在系統中的學習行為軌跡,主要包括:學習者何時何地以何種方式登入和登出系統;登入系統后請求了何種資源和服務,對資源和服務做了何種操作,操作時長以及操作頻率;與哪些主題和哪些學習者產生了互動;操作行為安全審計等。由于數據是實時記錄和生成的,因此產生的數據量較大,其存儲形式一般為普通記事本文件或格式化良好的XML文件,從類型上來講屬于半結構化或非結構化數據。
可穿戴設備自動生成是學習者攜帶的含有各種傳感器的智能化設備,可以自動獲取學習者的多項生理和心理數據,以及學習的場景數據,由于傳感器實時工作的特性,其生成的數據是實時的,所以數據量也比較龐大,并且也屬于半結構化或非結構化數據。
鑒于個體學習小數據的類型復雜性和多源特性,在具體存儲時,學習者可以選擇關系型存儲和非關系型存儲的結合,即實現基于SQL和基于NoSQL不同存儲的融合。
從優勢和特性來講,SQL面向結構化、數據量不大的應用環境,支持主鍵、外鍵、非空、唯一等約束,以及基本表上其他數據庫對象的創建,如索引、視圖、觸發器等,具有強大的安全控制機制,支持基于ACID的事務操作,支持連接、嵌套、集合等的復雜查詢操作。NoSQL是面向大數據技術環境實現數據存儲的非關系型數據庫,用于超大規模數據的存儲,具有高可擴展性、分布式計算、低成本等特性。在具體實現上,主要有鍵值對型(如Redis、Riak等),可以通過用戶ID號匹配與之對應的數據內容;文檔型(如MongoDB、CouchDB等),數據以某種結構或結構不嚴格的文檔形式存儲,一個文檔對應一系列數據項集;列存儲型(如HBase、Cassandra等),數據以列存儲,一個Key可以對應多個列;圖型(如Infinite Graph、Neo4J等),通過頂點與連邊的網絡圖存儲數據,適合關系型較強的用戶小數據存儲。
針對個體學習小數據,根據具體應用場景,學習者可選擇MySQL數據庫存儲結構化數據,選擇MongoDB數據庫存儲半結構化和非結構化數據。這是因為,在關系數據庫產品中,由于MySQL支持多種操作系統、多種開發語言,加之開源,在很多軟件系統中,大部分應用以MySQL管理后臺的業務數據,并且隨著數據規模的擴大,MySQL通過構建集群實現橫向擴展,從而滿足海量數據的讀寫要求。而在非關系數據庫產品中,MongoDB以一種類似于Json對象的文檔方式來完成數據的存儲,所有文檔可實現分布式架構存儲,通過Map/Reduce執行批量處理和聚合操作,在數據讀寫時,硬盤中的數據通過nmap方式映射到內存中。
在新技術的快速發展和影響下,職業教育要堅持立德樹人,注重“人”的發展,培養專業能力與通用能力兼具、能力水平更高的復合型、智能型技術技能人才[19]。而能力的培養需要建立在一定的知識基礎上,并能掌握多種工具使用這些知識,提升技能水平,最終形成解決具體問題的核心能力。因此,作為職業教育的學習評價,最終涉及到這樣三個方面:知識習得、技能掌握和能力養成上,即KSA模型(Knowledge、Skill、Ability,簡稱 KSA),如圖1所示。

圖1 職業教育學習評價
知識習得反映完成工作任務需具備的知識,如管理學知識、經濟學知識、數學知識等;技能掌握反映完成工作任務需具備的技能,如Excel數據分析技能、SQL數據查詢技能、PPT文稿制作技能等;能力養成反映完成工作任務需具備的能力,如需求溝通能力、實驗設計能力、總結匯報能力等。一方面,通過職業教育系統化的培養和學習,可以促進學習者KSA的提升;另一方面,職業教育學習評價對學習的促進也體現在KSA的發展上。[20]
學習者的學習過程通過學習行為來體現,每一次的學習行為都會涵蓋學習的時間、學習的地點以及通過何種設備進行學習。因此,選擇時間、空間和設備三個維度立體化地呈現學習行為,如圖2所示。

圖2 小數據建模維度
學習時間可以將一天的學習時間按照特定時間段進行劃分,如 (0:00, 6:00]、(6:00, 8:00]、(8:00,12:00]、(12:00, 14:00]、(14:00, 18:00]、(18:00, 20:00]、(20:00, 24:00]七個時間段;空間維度反映學習者在什么地方學習,如智慧教室、線上、圖書館、實訓室、企業等;設備主要是學習者通過什么方式進行學習,如智能手機、普通PC、專業實訓設備、虛擬仿真、各種學習系統等。這樣,每一個學習行為都可以表示為
由于學習行為數據一般是由系統和設備自動生成的,其格式基本都是日志文件,通過對這些日志文件的解析,可以以
當個體學習小數據匯聚到一起時,就會形成學習“大”數據。同時,這些學習小數據具有很強的時效性,要求在短時間內及時處理才能體現出有效感知和預測。另外,作為學習的主體——學習者,在學習過程中往往涉及情緒、心理等因素的波動,如果需要對學習做出準確的評價,就涉及到多源數據的融合,以確保分析結果的準確性。從這些方面可以看出,小數據和大數據具有部分類似的特征,在當前大數據存儲和處理相對成熟的基礎上,對小數據的管理和使用完全可以利用大數據相關技術[21]。目前,針對大數據處理的典型計算框架有:Hadoop、Spark、Flink、Storm、Samza等,這些框架都是Apache基金會平臺上發布的開源項目。從類型上來看,Hadoop屬于僅支持批處理的計算框架,Storm和Samza是僅支持流處理的計算框架,而Spark和Flink既支持批處理,也支持流處理。由于個體學習小數據增長速度快,并且動態實時生成,匯總到一起,數據量大,對計算吞吐量要求也高。通過綜合考慮,由于Spark具有強大而完善的內存計算和處理優化機制,可大幅提升計算性能,并通過批處理引擎的原生語義實現流數據的微批(Micro-batch)計算,同時在框架整合上還可與Hadoop有效集成。因此,選擇Spark作為計算的處理框架。這樣,就形成了個體小數據的分析處理框架,如圖3所示。

圖3 個體小數據的分析處理框架
本文將整個分析處理過程分為四層,分別是個體學習數據存儲層、個體學習數據計算層、個體學習數據分析層和個體學習評價生成層。為了邏輯上的清晰呈現,本文專門設置了個體學習數據計算層和個體學習數據分析層,但實際從功能上來講,這兩層可以合并為一層,因為不管選擇哪一種或哪幾種分析任務,最終都要通過Spark大數據計算框架來調度執行具體的計算處理。
由于學習小數據涉及眾多指標變量,為了充分利用這些數據,并降低計算的復雜性,保證生成精準的學習評價結果,這里采用因子分析描述和刻畫學習小數據與評價結果之間的關系。因子分析是一種多變量統計分析方法,其思想是“降維”,但與主成分分析不同,因子分析基于原始變量的相關矩陣。
設E代表學習評價的結果,E={E1, E2, E3 },E1表示學習者的學習習得,E2表示學習者的技能掌握,E3表示學習者的能力素養。則:

這里,i=1,2,3,j=1,2,……,n,n代表學習者小數據的數據容量。aij為常量矩陣,表示因子載荷,可通過主成分法、主軸因子法、最小二乘法等求得。Fj為相互獨立且不可測的公因子,表示學習相關因子在整個用戶小數據指標體系中的權重。εi為僅對該類學習效果有影響的特殊因子,在E的計算表達式中,F與εi相互獨立。
學習評價就是學習者基本信息、知識習得、技能掌握和能力養成的結果匯總,可以完整刻畫學習者在特定時間段內學習的整體情況。通過上述模型生成的學習評價結果并不是固定不變的,而會隨著學習者學習行為、時間、空間等的變化而變化,這種變化也可以通過模型進行刻畫和描述,如果用R表示學習者在某個時間點上生成的學習評價結果,那么引入時間變量t,則R就是一個隨時間t衰減的函數,具體如下。

式中 i=1,2,3,Ct為隨時間t變化的衰減值,Ct∈(0,1],如果時間間隔越長,Ct的取值越小,衰減越厲害。其計算公式為:

式中t為當前時間,t'為學習行為發生或學習評價結果生成的時間,α為衰減因子,其值可由專家根據經驗給出或通過回歸計算得到。
這樣,學習評價結果就會產生時間上的連續性,并且隨著時間的推移,前期的學習評價結果因新的學習行為影響而被逐漸淡化,這也在一定程度上反映了學習評價結果對之前學習行為的改進和優化,從而達到以評價促進學習的評價目的。當然,引入衰減函數,還有另外一個原因,防止學習者被貼上固化標簽,引起歧視性待遇[22],從而束縛學習者后面的進步、成長和改變。
總之,數據作為信息時代的關鍵生產要素,在政府決策、企業管理、教育教學等領域的作用日漸凸顯。本文從數據科學的角度,對大數據環境下產生的個體小數據進行了全面闡述,包括小數據的內涵、大數據與小數據的關系。在此基礎上,以職業教育為背景,以職業教育學習評價為研究對象,分析了職業教育背景下個體學習小數據的采集和存儲,提出了由學習小數據源、學習小數據存儲、學習小數據計算、學習小數據分析、評價結果生成組成的個體小數據分析處理的框架,通過各層的調用和處理,最終以知識習得、技能掌握和能力養成反映職業教育環境下學習者的學習成果。由于小數據采集的多源性,為了生成精準的學習評價結果,運用因子分析刻畫和描述學習小數據與評價結果之間的關系。有了學習評價結果,可以構建個性化的學習服務,生成個性化的學習畫像,挖掘個性化的學習需求,產生個性化的學習資源推薦。學習評價既是對之前學習行為的深度分析和評判,也是后續推動教學改進和學習改進的基礎。在當前智能技術驅動教育變革過程中,精準學習評價為智慧教育和全面發展的人才培養提供了新的思路和參考。