楊曉燕 吳南中

[摘要]通過學分銀行聚集學習者學習成果信息,進而構筑一個服務個體、組織和政府決策的學分銀行數據體系,是大數據時代教育類型數據來源拓展的重要內容,也是學分銀行發揮其社會期待功能的重要方式。學分銀行的數據具有數據標準化、存儲過程化、采集全方位化等特征,能準確把握教育的發展狀態和趨勢,是支持教育治理的關鍵證據,也可為學習者提升自我導向學習的精準度。學分銀行數據聚集的來源包括學分銀行信息平臺、學分銀行對接平臺和學習者自身補充的相關數據,形成了多元和多層次拓展數據,并以此構建了學分銀行數據聚集模型。要從技術上落實學分銀行數據聚集并使之產生效用,需要通過設計數據標準,夯實學分銀行自身的數據采集能力和存儲能力;打造學分銀行數據中臺,形成連接的數據前后臺的數據組織系統;開展前端應用開發,拓展學分銀行應用范疇;開展數據治理,保證學分銀行運行的整體效用。
[關鍵詞]學分銀行;數據聚集;愿景;模型;技術實現
[中圖分類號]G724? ? [文獻標識碼]A? ? [文章編號]1004-3985(2023)18-0095-07
信息技術的發展推動著教育信息化的寬度和廣度,逐步從信息技術教學應用和信息技術與教育教學融合的歷史階段,轉向“以應用驅動和機制創新為特征的‘信息技術與教育教學深度融合’的發展階段”①。從客觀上來講,目前信息技術與教育教學融合也遠遠沒有達到研究者期待的狀態和效用,信息技術推動大規模個性化教學為特征的革命性影響還沒有出現,但信息化所帶來的“個體理解和智力發展為價值主張,通過技術塑造、內容更迭、技術引入,培養深度思維和技術工具使用能力更強的學習者”②已經深入人心。從生態學視角和系統論視角審視信息技術對教育發展的支持,數據成為關鍵的掣肘。數據缺乏導致對學習者相關先前經驗獲取不足,個性化教學和深度學習引導難以推動。“探討形成大數據獲取的環境構建……通過對教育大數據的捕捉、聚合、理解,促使其成為教育發展和變革的元素、動力、方法和支撐”③,成為教育學者關注的重點內容和現實問題。從數據生態的結構來講,盡管大數據的關鍵是各類半結構和非結構化數據,大數據賴以生存的基礎是自身范圍廣、層次多、內容復雜的數據,但結構化的數據在基礎構建上無法替代。學分銀行通過累積學習者的多類型學習成果,從理論上完整記錄學習者從幼兒園到高校,乃至成人繼續教育相關的學歷和非學歷教育成果,可以支撐起微觀層面的個性化教學、中觀層面的學習者中心制度構建和宏觀層面的辦學政策制定與實施,展現了對豐富的應用場景建設的期待。
一、大數據時代的教育數據需求與學分銀行數據聚集愿景
(一)大數據時代的教育數據需求
商業領域在自身數字化過程中發現,數據達到一定量之后,隱匿在數據背后的關系被識別,大數據的價值被無限放大。“數據的交換、整合、分析,不斷發現新的知識、創造新的價值,從而帶來大知識、大科技、大利潤和大發展。”④因此,各個行業也在關注、收集、整合與其相關的大數據,以期獲得新的發展。在教育領域,經過了數十年的信息化建設,形成了應用與數據的良性互動,大數據被期待為教育治理、教育資源建設、教學模式創新、教育評價體系變革、學習支持服務模式創新、教學科研的范式創新等多領域提供方法、工具和內容。由于教育大數據所展現出來的場景和無法想象的空間,學者們將其定義為“金礦”。然而,教育大數據的應用都停留在“想象中的金礦”層面,在教育任何領域都沒有真正發揮廣泛而普及的作用,其中最為主要的原因是數據缺乏,原因包括了“數據采集通道不健全、個體身份識別技術難度大、信息的‘孤島’現象大量存在、數據標準缺乏、數據采集資源投入不足、數據采集實時性與連貫能力差、教育應用開發不足、教師大數據使用意識和能力等制約了大數據在教育中的應用”⑤。亟待系統化設計大數據獲取體系,形成一個涵蓋多類數據的總體架構,強化教育領域的教育應用。
(二)學分銀行數據聚集愿景
學分銀行是在《國家中長期教育改革和發展規劃綱要(2010—2020年)》“建立繼續教育學分累積與轉換制度”等文件要求下,以多類學習成果認證、積累與轉換的制度體系和服務體系為主要功能,以實現各級各類教育機構和不同類型學習成果溝通與銜接,促進人才成長的內在聯系、持續穩定性和階段一致性,深化教育教學改革的制度和服務體系。要實現學分銀行的功能,需要學習者建立學分銀行的賬戶,將各個階段所獲取的學習成果通過一定的機制納入學分銀行信息服務平臺,并通過連接證書和相關培訓機構進行成果核驗,借助區塊鏈技術與人工智能技術,保證數據的質量進而提升學分銀行的公信力。學分銀行數據聚集就是通過學分銀行的學習成果登記,將學習者全方位、立體化和過程化的學習成果登記在學分銀行平臺,進而為個體服務、教育組織和社會建設提供整合性的數據,支持教育體系對教育大數據的獲取需求。
二、學分銀行數據聚集特征及其價值
(一)學分銀行數據聚集特征
數據發揮作用的基礎是準確呈現問題,也就是數據本身是準確的。從學分銀行的運行模式來看,學分銀行信息平臺本身是優質的教育大數據來源,呈現出了多種特征:一是學分銀行存儲的大部分數據是標準化數據,是形成學習者個體畫像的骨干數據。從理論上說,學分銀行可以收集學習者從出生到生命結束所產生的所有成果數據,并按照學分銀行數據規范進行存儲。這些數據可以準確讀取學習者的技能水平、能力偏好、學歷資歷等,成為學習者個體畫像的關鍵節點數據。二是學分銀行存儲的是過程化數據。學分銀行存儲學習者各個階段的學習成果,其動態特征是準確反映學習者學習持續性和階段一致性的重要信息。學習者整體的動態變化也是社會生產和生活模式變遷的“映像”,為過程性數據的獲取提供了支撐。三是學分銀行存儲的是全方位數據。學分銀行不僅存儲了學歷教育數據,也存儲了非學歷教育數據,能便利評價學習者全方位的能力。此外,多數學分銀行平臺通過自建學習平臺和聯通學習平臺,成為直接的在線學習數據收集者。
(二)學分銀行數據聚集價值
傳統數據采集模式的階段性和分散性,難以聚集規模化數據支持教育的整體決策和個性化服務,而通過學分銀行的數據聚集,可以有效解決數據缺失的問題。同樣重要的是,學分銀行通過數據聚集作用的發揮,自身也能得到發展,真正發揮終身學習體系建構中的關鍵作用。
1.通過學分銀行數據的大規模采集,形成教育治理的基礎數據支持。“教育的主要矛盾已經由原來的‘人民日益增長的教育需求與教育供給的有限性’,轉化為‘對高質量的教育需求和教育不平衡不充分的發展之間的矛盾’。”⑥現階段教育治理的重點是教育公平、教育改革和教育創新,工作重點是解決教育質量和效率之間的關系,主要方式是通過調整多元參與關系化解工作過程中的混亂和迷茫,使教育整體圍繞共同價值訴求開展教學資源調整。學分銀行采集的是涵蓋學歷教育和非學歷教育的數據,與國家通過定期人工采集數據結合,可以形成區域或者系統的結構化數據,用于宏觀掌握教育發展現狀,尤其是通過整合非學歷教育相關數據,將國家現行模式下采集不到的部分非學歷教育數據整合到學分銀行中來,掌握非學歷教育發展的類型、規模、質量、不同技能水平人口數量與比例、市場匹配度等方面的信息,為調整教育資源的配置提供數據支撐。
2.通過學分銀行數據的過程化采集,準確把握教育的發展狀態和趨勢。從辦學層面來看,傳統基礎數據的采集是階段性開展的,如辦學狀態數據、學籍數據、畢業信息數據等,大量的及時發生的數據沒有在采集范圍之內。學分銀行通過采集過程性數據,支持學習者養成完成學習成果就進行登記的習慣,尤其是企業支持的非學歷培訓,能有效反映企業的人才培養需求,促使教育決策者準確把握產業的培訓需求而進行終身學習資源的供給。從學習者個體來看,在傳統結構化、封閉性特征明顯的學歷教育中,學習者個體的需求是隱匿的,很難通過學歷教育數據準確把握學習者的個性化需求。學分銀行支持學習者通過多種渠道獲取學分,也支持學習者避開傳統的學習途徑進行知識和技能的學習。所以,學分銀行可以準確把握學習者的喜好、興趣、生涯規劃等信息。這樣通過數據的關聯分析,就可為準確把握教育發展的進程提供準確的數據。
3.通過學分銀行數據的全方位采集,為個性化學習提供支持。信息化2.0時代的目標是智慧化,旨在形成支持學習者智慧學習的空間建構,夯實智慧學習的支持條件。智慧學習是一種學習者自我導向的、以學習者為中心的,并具有完整學習體驗的新型學習范式;是一種大數據驅動的學習,最為根本的特征是學習者學習的個性化和自適應;是一種“通過大數據感知學習者需求和行為傾向,幫助學習者選擇與其基礎適應的個性化學習”⑦。這種個性化學習的實現,不僅需要把握學習者的實時狀態,更為重要的是掌握學習者的基礎狀態,提供配合學習者個性化學習需求的學習支持服務,如直接相關的教學問題解答、教學方法服務和教學資源服務等。這類服務的供給需要數據的全方位支持,尤其是學習者先前學習經歷數據的支持。準確掌握學習者現有的學習成果,包括學歷教育的先修課程和非學歷教育的相關成果,是學習支持服務真正滿足個性化學習需求的關鍵。
4.通過學分銀行數據的標準化采集,提高學習者自我導向的準確性。在諸多自我導向學習的成人教育理論中,學習者是一個需求明確的個體,有清晰的目標感和準確的過程觀,能整合資源支持學習者高效的學習。然而,學習者通常會局限于自身的能力,難以得到周圍群體性的支持等,導致自我導向所倡導的行動、生活方式等難以真正落實。特別是隨著數字化轉型的推進,成人學習從線下轉移到線上線下融合的混合學習空間,造成學習過程中“學習者指導邊緣化、學習情境碎片化、學習過程娛樂化、學習方式形式化等”⑧困擾,學習目標偏離,學習過程曲折,降低了學習的效用,也影響了自我導向的整體價值。行業能力等級標準是按照產業人才需求邏輯對學習者提供引導,學習者可以根據學分銀行中的數據,了解自身所獲取的學習成果,分析自身在行業能力等級標準中的層次,所缺的能力模塊,需要補充的課程單元,準確引導自身完成以進階為目標的能力提升。
三、學分銀行數據聚集來源、采集邏輯及聚集模型
(一)學分銀行數據聚集來源分析
厘清學分銀行數據來源是布局學分銀行信息平臺數據采集的前提條件,也是設計數據標準、數據采集工具、數據處理模式和數據存儲方式的基礎。從學分銀行功能和整體邏輯關系來看,學分銀行數據來源包括學分銀行平臺數據、學分銀行對接平臺數據和學分銀行平臺運行過程中學習者自身登記的數據。
1.學分銀行平臺數據。當各級各類教育機構融入學分銀行之后,教育機構所產生的學歷教育學習成果和非學歷教育學習成果就可以按照學分銀行的標準納入學分銀行數據體系。其中課程數據、學分數據、學分層次數據是學分銀行數據的主體部分,配合人才培養方案等課程實施計劃,可以聚合和存儲結構化的學習成果數據,如學歷、職業資格、職業技能等級、計算機/英語等級證書等。同時,通過學分轉換,可以形成學習者意向數據、發展規劃數據等。
2.學分銀行對接平臺數據。學分銀行需要與多類平臺形成數據聯通,獲取相關的數據,形成覆蓋學習者的完整數據鏈。一是對接學習者學籍信息。學籍數據是核定學習者身份的主要數據,是學分銀行實施轉換操作的基礎。二是對接各類學習相關的管理數據。實施學分銀行制度和服務體系,從整體看需要各級各類教育機構分享數據,整合到統一的平臺中來。學分銀行需要對接教務系統、信息管理系統、第二課堂信息管理系統等相關數據,與其他管理制度配合,實現管理數據的全覆蓋。三是對接各類在線學習數據。對接在線學習平臺可以有效掌握學習者的在線學習行為,為標準化數據之外提供非結構化數據采集的通道,能有效提升學分銀行數據的完整度,也能有效獲取學習者真實的學習興趣和學習需求。四是對接各類非學歷教育管理平臺的數據。部分非學歷教育供給者本身具有良好的信息管理平臺,如1+X證書管理機構本身具有結構良好的信息平臺,其數據是學分銀行數據的重要來源,這類數據可按照協議整合到學分銀行平臺中來。
3.學習者自身登記的數據。學分銀行的本質是一套服務學習者個性化學習需求的整體制度,學習者需要按照學分銀行所蘊含的制度導向和標準體系,根據自身的學習成果轉換需求,登記各類成果數據,并積極開展學分轉換工作,獲取自身所需要的學歷學分和相關的資格。學習者自身登記的數據主要是現有平臺無法直接對接的非學歷教育培訓和相關的無定式學習成果,如創新創業成果、工作場學習成果、企業頂崗實習成果等,這些成果帶有重要的個性特征,是完善學習者畫像的重要組成部分。
(二)學分銀行數據采集邏輯
學分銀行數據的價值導向、技術條件、倫理規范等決定了其數據采集范圍、采集方式和存儲方式等,核心是通過內嵌于學分銀行系統的數據采集工具,通過學分銀行數據通道的設計和使用情景中的數據捕獲功能,對相應數據進行系統性、伴隨性采集。
1.依托采集通道獲取基礎數據。通過學分銀行信息平臺、相關的對接平臺和學習者自我登記的方式,形成學分銀行的基礎數據,實現學習者全方位信息的采集。基礎數據的采集核心是建立相關標準,依托標準開展數據的收集,繼而形成支持學習者整體畫像的學分銀行畫像。
2.依托基礎數據構建結構數據。由數據采集通道采集而來的數據,通過整合,可以形成相關的數據,實現數據的二次轉換,核心是形成數據資產和數據服務。一是數據資產,具體包括成果數據、對象數據、行為數據。成果數據指的是通過數據清洗、計算和加工,可以形成成果數據,包括成果統計數據、成果覆蓋面數據、成果覆蓋人群數據等。這些數據按照規則存儲起來,是學分銀行的資產性數據,為后續應用的開發和深化提供了源源不斷的基礎數據。對象數據指的是使用對象的數據,包括個體使用對象和機構使用對象。個體使用對象數據包括能力層級數據、能力單元覆蓋面數據、發展路徑數據等;機構使用對象數據包括機構成果數據、機構使用學分銀行平臺數據、機構標準與轉換規則數據等。行為數據指的是機構和個體開展認證、積累與轉換的相關行為數據,這些數據蘊含了機構和學習者轉換的需求,也同時蘊含了各類成果發展的方向。二是數據服務,具體包括成果數據可視化服務、對象數據可視化服務和行為數據可視化服務。數據服務是通過一定的規則和語言,以圖示、表格等形式形成的直觀化表達,支持學習者、機構和政府依托數據開展個性化學習、教育治理等。
3.依托學分銀行業務生成補充數據。學分銀行業務引導生成補充數據指的是通過學分銀行的相關業務形成的補充數據,如通過比對學歷教育人才培養方案形成的課程學分缺項,指導學習者依托學習路徑規劃,形成學習成果轉化數據;通過行業能力標準建設,形成學習者規劃路徑的補充信息。這些數據是學分銀行建設成效的關鍵證據,也是發揮學分銀行數據聚集效應的重要參考。此外,政府和教育機構通過對學分銀行資源的投入所產生的教育教學改革成效,也可以通過學分銀行的數據挖掘出來,建構資源與產出的關系,進而完善學分銀行業務。
(三)學分銀行數據聚集模型
綜上所述,可以將學分銀行數據聚集進行模型化提煉,如圖1所示。其核心的數據聚集邏輯是通過對規模化數據聚合,支持教育的整體決策和個性化服務,形成以組織(教育機構)、個體服務為核心的數據采集和使用整體架構。核心是通過對學分銀行基礎數據來源的清洗、計算、存儲和架構,使相關數據可理解、可管理和可使用,并形成數據資產和數據服務,支持學分銀行團隊依托相關的數據資產開發相應的應用,提升學分銀行的影響力、學分銀行服務教育發展的生產力。
四、學分銀行數據聚集的技術實現
(一)設計數據標準:夯實學分銀行數據采集能力和存儲能力
教育大數據功能發揮和價值實現備受研究者質疑的直接原因是數據標準的缺乏。這不但會造成數據互操作難度大,也降低了數據的存儲能力。也就是說,如果學分銀行所涉及的各類獨立開發的應用沒有形成統一的標準,產生的數據就難以被學分銀行平臺識別、整合和交互,也就難以形成學分銀行的數據資產和數據服務。所以,要實現學分銀行數據聚集效應,需要統籌學分銀行所管理的學習成果數據標準,設計不同技術環節數據交互的規范和流程,形成滿足學分銀行需求的數據體系,同時提升相關成果的存儲能力。學分銀行數據標準建設的核心包括成果數據規范、對象數據規范、行為數據規范、數據處理規范、數據存儲規范、數據互操作規范、數據接口規范、數據服務規范等。成果規范的核心字段包括等級、來源、形式、學分等內容;對象數據規范指的是通過清洗獲取的學習者畫像、機構整體畫像和教育系統整體呈現標準等;行為數據規范指的是記錄學習者、管理者和機構操作行為的相關數據標準;數據處理規范指的是應用數據、調整數據等處理相關數據的規范;數據存儲規范指的是數據在特定存儲平臺上的存儲和交互規則;數據互操作規范指的是與學分銀行平臺相關聯的不同教育平臺進行溝通的語法、語義、定義;數據接口規范指的是與學分銀行相關的數據傳輸格式定義,支持不同系統平臺之間的數據共享;數據服務規范指的是根據學分銀行業務實現的可視化圖示、元素定義和表現形式的語法、語義。學分銀行數據標準可以參考國際標準化組織、教育部信息化技術標準委員會等標準組織的定義,結合《大數據互操作規范》等標準化文本,設計不同行為的相關標準,為學分銀行數據采集提供標準支持。
(二)打造數據中臺:形成連接前后臺的數據組織系統
數據中臺是“通過數據采集、處理、存儲、計算、分析、可視化,將教育數據轉化為可理解、可使用、可管理的數據資產,與各類教育相關業務系統相聯通,并為教育提供豐富的數據服務”⑨。學分銀行數據中臺一端聯系外部應用,一端聯系數據中心倉庫,通過提升業務系統響應能力,實現數據資產化和數據服務屬性,包括數據融合、數據加工、數據可視化、數據服務化。數據融合主要是解決多類平臺接入的不同類型數據按照學分銀行數據標準進行數據處理,形成統一的、適配的一站式數據處理方法,實現數據的轉換和存儲;數據加工指的是通過數據的處理,打通多類學習成果數據,以統一的數據規范進行存儲;數據可視化是指按照數據的管理方法,針對不同對象進行可視化展示,如針對個體學習者可以展示不同層次學習成果的數量和結構,以及與行業能力等級標準之間的配套情況;數據服務化指的是按照用戶需求對成果數據進行整合和利用,切實提供服務的過程,如開展學習比對和學習者畫像分析等。學分銀行數據中臺的數據處理技術包括穿透數據庫、Hadoop和大規模MPP集群等技術的應用,以及多類數據的清晰和標準化存儲,包括在采集過程中的離線批處理、實時流處理和存儲層的成果目錄、數據標簽、數據檢索、圖數據庫(各類學習成果證書)、視音頻數據庫以及存儲系統。
(三)開發前端應用:拓展學分銀行應用范疇
前端應用是聚集學習者數據的關鍵,最為核心的是形成學分銀行業務與學習者之間的聯動,建構多種學分銀行應用場景,也是學分銀行數據生態生成源源不斷的數據來源。其主要應用包括認證業務、對比引導、反饋應用。認證業務指的是在教育體系建立學分認證、積累與轉換機制及其運行實踐,為學分銀行建立數據來源。對比引導指的是通過學習者或學習者群的過往數據,根據嵌入人工智能技術的歸類與比對,形成與行業能力等級標準等標準體系的對照結論,進行可視化的引導,促使學習者完成整體資歷所蘊含的知識、技能建設,實現自身的資歷進階。這類應用的核心是在準確分析學習者需求的基礎上,進行需求與資源的適配性分析,并借助在線學習平臺等途徑進行引導。反饋應用主要是學習者層次、類別、成效相關的反饋,如讓學習者明確自身學歷在學分銀行系統中的層級與數量,支持學習者明確自身在業務能力上的位置,為學習的進一步優化提供信息反饋。在技術層面,一是融合Hodhoop與Spark技術,適應業務的跨主體訪問、量級數據整合需求,形成可視化界面;二是以服務學習者個性化學習為目標,對接行業能力等級標準,采集學習成果的標簽化數據,并與學分銀行平臺對接的課程聯動,為學習者提供個性化學習引導;三是采用API管理技術,使學分銀行存儲的數據轉化為服務學習者的能力,吸引學習者長期使用并推廣學分銀行平臺,實現數據生態擴張和優化。
(四)開展數據治理:保證學分銀行運行整體效用
隨著學分銀行的運行,數據將成為學分銀行的核心資產,同時也提出了數據治理的需求。借助技術對數據進行有效的管理,主要包括學分銀行元數據、學分銀行數據元標準、學分銀行數據標簽、學分銀行數據安全、學分銀行數據生命周期等方面的管理。學分銀行元數據管理指的是對學分銀行數據元的配置、學分銀行數據模型以及學分銀行元數據屬性的管理;學分銀行數據元標準管理指的是對標準的標準進行管理,包括標準設計語言、定義的方式等;學分銀行數據標簽管理指的是給存儲數據貼標簽,提升數據的可檢索性;學分銀行數據安全管理指的是對學分銀行的讀取數據進行安全定義,并設計相應的安全管理流程,促使學分銀行信息不外泄露,并保證在職責定義的范圍里運行;學分銀行數據生命周期管理指的是對有意義的數據進行保存,對無意義的數據進行剔除的過程,在最大限度地保持數據有效性的同時,降低系統負擔,保證系統的流暢性。
[注釋]
①楊宗凱,吳砥,鄭旭東.教育信息化2.0:新時代信息技術變革教育的關鍵歷史躍遷[J].教育研究,2018,39(4):17.
②吳南中,黃治虎,曾靚,等.大數據視角下“互聯網+教育”生態觀及其建構[J].中國電化教育,2018(10):23.
③⑤吳南中,黃治虎,曾靚,等.教育大數據生態圈構建:“3+3”模型的邏輯與實踐[J].中國遠程教育,2019(7):77,79.
④徐子沛.大數據:正在到來的數據革命,以及它如何改變政府、商業與我們的生活[M].桂林:廣西師范大學出版社,2012:56.
⑥吳南中,夏海鷹,張巖.信息技術推動教育形態變革的邏輯、形式、內容與路徑[J].中國電化教育,2019(11):25.
⑦吳南中.論在線學習范式的變遷:從自主學習到自適應學習[J].現代遠距離教育,2016(2):43.
⑧朱丹蕾,徐君.諾爾斯自我導向學習模型的現實困境與時代重構[J].成人教育,2020,40(9):13.
⑨馬曉玲,朱麗娟,吳永和,等.教育數據中臺系統模型及其應用研究[J].現代教育技術,2021,31(11):64.
[參考文獻]
[1]顧佳妮,楊現民,鄭旭東,等.數據驅動學校治理現代化的邏輯框架與實踐探索[J].現代遠程教育研究,2020,32(5):25-34.
[2]賀斌.智慧學習:內涵、演進與趨向——學習者的視角[J].電化教育研究,2013,34(11):24-33+52.
[3]毛剛,周躍良,何文濤.教育大數據背景下教學評價理論發展的路向[J].電化教育研究,2020,41(10):22-28.
[4]任友群,盧蓓蓉.規劃之年看教育信息化的頂層設計[J].電化教育研究,2015,36(6):5-8+14.
[5]張文梅,祁彬斌,范文翔.數據驅動的教學行為分析:現狀、邏輯與發展趨向[J].遠程教育雜志,2021,39(1):84-93.