朱珂 劉玉瑩 尚云翔 張晨雨
(河南師范大學(xué) 教育學(xué)部,河南 新鄉(xiāng) 453007)
教育部教師工作司2022 年工作要點指出,要推動人工智能助推教師隊伍建設(shè),就必須確立其價值取向,開展教師智能研修,建立完善的教師教育體系。增值評價是一種注重對評價對象的縱向成長幅度比較的評價方式,可將其作為教師績效考核實踐、學(xué)校效能評估和區(qū)域教育發(fā)展的主要評價維度之一[1]。教師教育增值評價通過衡量學(xué)生在一段時間內(nèi)的學(xué)業(yè)水平進步幅度,評估教師對學(xué)生成長幅度變化影響的“凈效應(yīng)”,同時對教師在教師研修、職業(yè)發(fā)展、專業(yè)化水平等自身專業(yè)發(fā)展方面的提升進行綜合研判,有力促進了教師效能評價科學(xué)化。利用人工智能、大數(shù)據(jù)等技術(shù)優(yōu)勢來解決增值評價實施的現(xiàn)實困境,促進教師教育增值評價體系落地,為教師教育發(fā)展提供重要支撐與保障。因此,在分析增值模型的基礎(chǔ)上,探討人工智能賦能教師教育增值評價的內(nèi)在機制,建立教師教育增值評價指標(biāo),構(gòu)建人工智能賦能教師教育增值評價系統(tǒng),闡述教師教育增值評價的實踐路徑。
增值評價的方法論源于計量經(jīng)濟學(xué)和教育統(tǒng)計學(xué)。在探索如何評價教師效能和學(xué)校效能的過程中,“教育生產(chǎn)函數(shù)”強調(diào)衡量學(xué)生產(chǎn)出的學(xué)習(xí)成果在多大程度上可以歸因于學(xué)生在特定時期內(nèi)受到的特定投入(教師、學(xué)校、教育政策等)。因此,教育領(lǐng)域中的“增值”與學(xué)生的學(xué)業(yè)水平增幅直接相關(guān),是指學(xué)生在教育系統(tǒng)中隨著時間的推移而獲得的知識、技能、能力和其他屬性的增長。從教師教育的角度來看,增值也可以被定義為在一段時間內(nèi)教師對學(xué)生實現(xiàn)既定或規(guī)定的教育目標(biāo)的貢獻。
教師教育評價是以教師的職業(yè)能力為基礎(chǔ),通過其學(xué)生學(xué)術(shù)水平的相對位置變化來衡量其教學(xué)質(zhì)量的一種方式。增值理念下,對教師工作的評價主要基于他們對學(xué)生學(xué)習(xí)的貢獻程度[2]。威廉·L.桑德斯(William L. Sanders)在關(guān)于“增值”的研究中強調(diào),教師的影響遠遠超過了課堂變量[3]。另外,增值數(shù)據(jù)在教師評價系統(tǒng)中發(fā)揮著重要作用。目前,美國一些州正在采用基于增值理念的教師評估系統(tǒng),將教師個人對學(xué)生成就影響的增值信息納入其中。例如美國田納西州增值評估系統(tǒng)(Tennessee Value-Added Assessment System,簡稱TVAAS)的“增值”結(jié)果可用于教師評價,以確定學(xué)生學(xué)術(shù)成就的變化幅度在多大程度上可以歸因于特定的教師[4]。除此之外,包含增值信息的教師績效評估在一定程度上也會幫助制定和改進教師績效衡量標(biāo)準(zhǔn)。基于增值分析的教師教育測量系統(tǒng)可以對觀察測量、家長反饋和個人對教學(xué)的反思作以補充,以確定教師的優(yōu)勢和劣勢。
人工智能時代技術(shù)發(fā)展為教師教育評價方法改革帶來巨大的支撐引領(lǐng)。智能技術(shù)賦能教師教育增值評價要求全面、科學(xué)、完整地收集、管理、分析各種教學(xué)信息,是對教師行為和教師效能進行客觀評價的新方法,描繪了從經(jīng)驗主義邁向數(shù)據(jù)主義,從模糊邁向精確的飛躍[5];通過技術(shù)手段,全域性地收集并整理學(xué)校層面、教師層面、學(xué)生層面的各類信息,與課堂評價、自我評價、家校聯(lián)合反饋等各類評估信息融為一體,以便對教師做出多維、完整、深入的評價,使片段式評價轉(zhuǎn)變?yōu)橄到y(tǒng)性評價。例如TVAAS 基于大數(shù)據(jù)技術(shù)創(chuàng)建包含學(xué)生檔案、教師檔案、學(xué)校名稱檔案等信息的數(shù)據(jù)庫,并將新的學(xué)生多維數(shù)據(jù)與前幾年的學(xué)生數(shù)據(jù)合并。這些數(shù)據(jù)集采用學(xué)生識別號或?qū)W區(qū)/學(xué)校代碼相互鏈接,擬合缺失數(shù)據(jù),實現(xiàn)對所觀察區(qū)域內(nèi)學(xué)校、教師、學(xué)生的智慧評價。人工智能已由外力作用轉(zhuǎn)化為內(nèi)生動力,外部技術(shù)逐漸轉(zhuǎn)向內(nèi)部賦能,賦能教育、賦能學(xué)校、賦能課程、賦能教師等。將人工智能技術(shù)與增值評價的價值導(dǎo)向、科學(xué)的教師教育評價體系有機結(jié)合,通過建立基于人工智能的教師教育增值評價管理機制,推動人工智能與教師隊伍建設(shè)有效融合[6]。
增值評價模型依賴統(tǒng)計學(xué)方法對多維數(shù)據(jù)追蹤分析,從而界定與計算“增值”。不同增值模型的理論假設(shè)、數(shù)據(jù)適用條件和優(yōu)劣勢各有不同,增值模型的選取和應(yīng)用影響著增值評價結(jié)果的科學(xué)性、準(zhǔn)確性[7]。目前使用較多的模型有:學(xué)生成長百分等級(Student Growth Percentile,簡稱SGP)模型、多層線性模型、殘差模型、增益模型、分層模型、分類模型等。其中,SGP 模型不依賴學(xué)生的背景信息,具有較大的靈活性,因其簡單易操作廣泛應(yīng)用于教師和學(xué)校的增值評價中。SGP 模型使用分位數(shù)回歸法,通過測量學(xué)習(xí)者在學(xué)術(shù)成就水平相似的學(xué)生群體中的相對地位變化來評估增值。例如,所有被測學(xué)生都參加相同的評估后得到全部學(xué)生的初始學(xué)業(yè)水平(一個可比的起點),初始學(xué)業(yè)水平相同的學(xué)生被視為同一組,將同組學(xué)生在最近一次評估中的學(xué)業(yè)水平進行排序,每個學(xué)生都會獲得一個百分位的相對位置,最后依據(jù)學(xué)生的相對位置來分析SGP 學(xué)業(yè)水平的增值情況。SGP 學(xué)業(yè)水平的相對位置范圍為1 ~99。在將SGP 模型用于教師效能評價時,通常以教師任教班學(xué)生的SGP 學(xué)業(yè)水平的中位數(shù)作為教師的評價指標(biāo),將該教師的學(xué)生的進步與其他類似學(xué)生的進步進行比較。某個教師的教學(xué)增值結(jié)果即是該班學(xué)生的SGP 學(xué)業(yè)水平之和[8]。
SGP 模型的增值評價結(jié)果易于解釋,對于政策制定者、教育從業(yè)者和學(xué)區(qū)來說,根據(jù)學(xué)生在一年中的成長程度,對具有相似基線學(xué)業(yè)表現(xiàn)的學(xué)生進行排序是很直觀的。學(xué)生的成長比較僅基于他們之前的學(xué)業(yè)水平記錄,而非基于任何其他特征,如性別、家庭背景、生源地或其他學(xué)習(xí)項目。因此,與其他許多復(fù)雜的增值模型相比,SGP 模型更容易操作,評價結(jié)果也更易理解。其評價結(jié)果可以用于改善教師教學(xué)質(zhì)量:在教師績效方面,針對不同教師所教學(xué)生的學(xué)業(yè)水平進行測算并生成報告,讓在不同基礎(chǔ)班級任教的教師看到自己的實際教學(xué)成效;在教學(xué)法方面,針對不同教學(xué)方法的優(yōu)劣比較,對不同教學(xué)方法下學(xué)生的學(xué)業(yè)水平增幅進行計算與報告,并提供實際的參考依據(jù)。
人工智能賦能教師教育評價依托物聯(lián)感知、智能平臺采集、圖像識別等技術(shù),采集教師在各時空數(shù)據(jù)(課堂活動、教師研修等)[9],構(gòu)建增值評價數(shù)據(jù)庫,在增值模型的基礎(chǔ)上對教師數(shù)據(jù)、學(xué)生數(shù)據(jù)、師生交互數(shù)據(jù)等進行融合分析;根據(jù)教學(xué)過程的動態(tài)觀察,對師生行為進行數(shù)據(jù)重組、數(shù)據(jù)歸并、數(shù)據(jù)建模[10],產(chǎn)生多維度評價結(jié)果,在提供個性化分析預(yù)測的同時,提供教學(xué)輔導(dǎo)方案,以便更好地發(fā)揮評價的診斷功能和反饋功能,如圖1 所示。
1.數(shù)據(jù)收集
借助智能技術(shù)對教師增值評價數(shù)據(jù)(教學(xué)技能、班級管理能力等)進行全方位、全時域、全類型的采集,并將其標(biāo)準(zhǔn)化處理,轉(zhuǎn)化為量化數(shù)據(jù),從學(xué)業(yè)水平、課堂教學(xué)觀察、教師專業(yè)素養(yǎng)、教師綜合評定4 個維度,組織制定和細化數(shù)據(jù)管理流程。考慮到資料搜集時間和實際操作時間通常為一學(xué)期,為了便于數(shù)據(jù)處理采用標(biāo)準(zhǔn)化、統(tǒng)一化的采集方式,利用軟硬件結(jié)合其他資料的綜合信息,定期收集各種量化的數(shù)據(jù),并對接收的資料質(zhì)量進行分析,選定接收資料較穩(wěn)定的日期作為后續(xù)資料處理的錨點。在此基礎(chǔ)上,生成網(wǎng)絡(luò)云存儲數(shù)據(jù),采用分布式核算分析,確保數(shù)據(jù)符合存儲標(biāo)準(zhǔn)。
2.技術(shù)支持
借助增值模型與自然語言處理等技術(shù)分析處理量化與質(zhì)性數(shù)據(jù),橋接教師專業(yè)發(fā)展過程多維數(shù)據(jù),對教師教育增值情況的動態(tài)關(guān)注與觀察。利用計算機視覺技術(shù),從圖像、視頻中自動化提取、分析和捕捉有用信息,基于內(nèi)容的圖像檢索技術(shù)可以從繁雜的圖像信息中分辨和識別目標(biāo),提取教師教學(xué)和研修過程的視頻進行分類,鎖定觀察對象后全程目標(biāo)跟蹤,最后將場景中對話語義分割,并把捕獲的行為信息與言語信息轉(zhuǎn)化為數(shù)據(jù)儲存在增值數(shù)據(jù)庫中。借助自然語言處理的深度分析技術(shù)(循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等),實現(xiàn)全鏈路、嵌入式增值數(shù)據(jù)分析。借助語音采集、智能語音識別等技術(shù),通過機器學(xué)習(xí)技術(shù)訓(xùn)練,實現(xiàn)語言考核自動評分,并可自動生成語言綜合能力報告。
3.增值結(jié)果反饋
通過全流程數(shù)據(jù)智能分析,產(chǎn)生可視化報告,并提出成長建議。增值結(jié)果報告采用不同形式及顏色編碼來解讀增值數(shù)據(jù),并在平臺公示結(jié)果。教師教育增值評價智慧平臺從不同的層面去分析數(shù)據(jù),分析預(yù)測結(jié)果與增值模型統(tǒng)計結(jié)果決策相融合,對增值評價結(jié)果進行優(yōu)化,實現(xiàn)數(shù)據(jù)價值最大化,推動“智能評價—智能匹配—智能推送—智能服務(wù)”的評價循環(huán),以此促進教師專業(yè)發(fā)展和教師教育發(fā)展,如圖2 所示。

圖2 人工智能賦能教師教育增值評價結(jié)果呈現(xiàn)
人工智能支持的教師教育增值評價指標(biāo)從學(xué)業(yè)水平增值、課堂教學(xué)觀察、教師專業(yè)素養(yǎng)、教師綜合評定4 個評價維度出發(fā),以學(xué)生、教師自身、教師同行、教研專家為評價主體構(gòu)建量化和質(zhì)性評價指標(biāo)。
1.學(xué)業(yè)水平增值
評價主體:同伴互評、自我評價、教師評價、家長評價。評價形式:通過客觀課堂學(xué)習(xí)行為觀察和學(xué)習(xí)檔案袋記錄,得到學(xué)生綜合數(shù)據(jù),利用SGP 模型進行處理分析,得出增值評價結(jié)果。評價內(nèi)容:(1)學(xué)業(yè)水平增值:評估被測教師所教授的學(xué)生的各學(xué)科學(xué)業(yè)水平,并對數(shù)據(jù)進行量化處理;(2)學(xué)習(xí)過程增值:對學(xué)生學(xué)習(xí)興趣、學(xué)習(xí)態(tài)度、學(xué)習(xí)思維等質(zhì)性數(shù)據(jù)做客觀記錄,進行標(biāo)準(zhǔn)量化處理,進行增值評價。
2.課堂教學(xué)觀察
評價主體:教研專家評議、學(xué)生評教、自我評價、同行評議。評價形式:教研小組統(tǒng)籌教學(xué)計劃,參考學(xué)生作業(yè),借助教案評比得出教學(xué)設(shè)計與策略差異量化評價結(jié)果;學(xué)生評教系統(tǒng)收集教師教學(xué)數(shù)據(jù);教師自評形成教學(xué)反思檔案記錄;結(jié)合專業(yè)評價人員對教學(xué)過程的質(zhì)性評價結(jié)論,形成教師教育綜合評價檔案。評價內(nèi)容:(1)教學(xué)設(shè)計與策略,包括學(xué)生作業(yè)、教學(xué)評價;(2)教學(xué)環(huán)境,包括教學(xué)期望、學(xué)生行為管理、學(xué)習(xí)環(huán)境、文化氛圍;(3)教學(xué)過程,包括教學(xué)目的和目標(biāo)、激勵學(xué)生、呈現(xiàn)教學(xué)內(nèi)容、課堂結(jié)構(gòu)、課堂節(jié)奏、教學(xué)活動、教學(xué)材料、課堂提問、教學(xué)反饋、分組學(xué)習(xí)、學(xué)情了解、教學(xué)思考、解決問題。
3.教師專業(yè)素養(yǎng)
評價主體:教師自評、學(xué)生評教、同行評議和教研專家評議。評價形式:以心理量表定量評價工具為主得出教師綜合心理水平的評價指數(shù);使用試卷量表針對教師文化理論素質(zhì)進行量化評價;通過參考同行評議和教研專家評議內(nèi)容得出針對教師專業(yè)化水平的質(zhì)性評價。評價內(nèi)容:(1)教師心理素質(zhì),包括思想道德素質(zhì)、師德培育;(2)教師專業(yè)化水平,包括學(xué)科教學(xué)知識、教學(xué)法知識、學(xué)科內(nèi)容知識、教學(xué)反思情況。
4.教師綜合評定
評價主體:學(xué)生評教、教師自評、同行評議和教研專家評議。評價形式:針對教師綜合職業(yè)行政能力進行質(zhì)性評價;通過具體數(shù)值,如比賽獲獎、論文數(shù)量等,監(jiān)控教師研修發(fā)展水平;對其他綜合評定項目進行總體質(zhì)性評價,基于以上評價主體的量表評價指標(biāo),評估教師綜合水平。評價內(nèi)容:職業(yè)發(fā)展、教學(xué)監(jiān)控、學(xué)校義務(wù)、教學(xué)反思、教師研修。
教師教育增值評價系統(tǒng)通過記錄和識別教師課堂教學(xué)語言、教態(tài),以及獲取教師網(wǎng)絡(luò)研修的日志數(shù)據(jù),借助評價指標(biāo)進行教師綜合能力分析診斷并形成個性化的教師診斷報告。在此系統(tǒng)中,基于人工智能的核心識別技術(shù)和海量數(shù)據(jù)的深度學(xué)習(xí),將錄播形成的音視頻文件轉(zhuǎn)化為結(jié)構(gòu)化的教學(xué)行為大數(shù)據(jù)[11];借助智能技術(shù)和增值評價模型對教師的課堂教學(xué)能力進行綜合分析;針對教師課堂教學(xué)能力和研修表現(xiàn)生成定制化評價報告,系統(tǒng)化地對教師專業(yè)發(fā)展提出建議,實施框架如圖3 所示。

圖3 人工智能賦能教師教育增值評價系統(tǒng)
基于人工智能的教師教育增值評價系統(tǒng)采用標(biāo)準(zhǔn)化課室環(huán)境內(nèi)布設(shè)定制化音視頻終端設(shè)備,對課堂教學(xué)過程數(shù)據(jù)進行實時采集,為智能分析提供數(shù)據(jù)資源支持。運用技術(shù)手段,對教師教學(xué)過程進行深度挖掘,生成課堂教學(xué)能力評價報告。教師效能評估工具包括定量和定性的證據(jù)收集工具,如國家級或區(qū)域級的標(biāo)準(zhǔn)化考核和專門為教師設(shè)計的績效評估、自我報告調(diào)查。該系統(tǒng)能夠智能評價教師能力水平的增值,可以幫助教師提高自我認(rèn)知,了解自身專業(yè)發(fā)展水平進步程度及自身在同伴中所處位置;輔助教師隊伍建設(shè)決策;系統(tǒng)標(biāo)記觀察點,為教研提供依據(jù);智能分析課堂行為,存儲教師課堂教學(xué)數(shù)據(jù),生成增值評價分析報告,呈現(xiàn)教師能力發(fā)展全過程記錄。除此之外,進行教育測量與評價、教師教育增值評價報告數(shù)據(jù)解讀與結(jié)果運用的相關(guān)培訓(xùn),借助增值評價數(shù)據(jù)模型,分析出教師畫像,自動生成圖表直觀呈現(xiàn)。對教師數(shù)據(jù)、教育資料數(shù)據(jù)進行加工分析,引導(dǎo)教師樹立智慧教學(xué)理念,幫助教師自身成長。
實施教師教育增值評價要積極利用智能技術(shù)對教師學(xué)習(xí)和成長過程中的數(shù)據(jù)進行持續(xù)追蹤、研究和分析,采用云記錄教師成長各方面進展?fàn)顩r,逐步完善教師電子檔案袋評價、構(gòu)建教師檔案館,并以此作為評價教師績效和自身發(fā)展的重要依據(jù)。例如,田納西州從2011年開始就將成長檔案袋和課堂觀察加入增值評價體系中,盡可能綜合所有的教育信息生成增值評價報告[12]。同時,大數(shù)據(jù)和學(xué)習(xí)分析技術(shù)可對教師做出個性化的診斷和分析[13];5G 和物聯(lián)網(wǎng)技術(shù)采集的全域數(shù)據(jù)可補充評價數(shù)據(jù)集;語音識別、指紋識別、人臉識別、虹膜識別等識別技術(shù)可智能識別人體生命特征,彌補增值模型中預(yù)設(shè)協(xié)變量有限的問題,優(yōu)化評價過程。
構(gòu)建多元主體協(xié)調(diào)管理的評價體系需建立健全人力資源保障機制,注重教師自身專業(yè)成長,拓展教師區(qū)域研修形式[14],豐富教師考核內(nèi)容,有效實施立體化、多元化評價,實現(xiàn)教師教育增值評價落地。從教育整體角度,規(guī)劃設(shè)計教師教育評價內(nèi)容,發(fā)展教師自評、學(xué)生評教、同行評議和教研專家評議等多種評價方式。從促進教師專業(yè)發(fā)展的視角出發(fā),將具體的考核項目與教師自身成長緊密結(jié)合,形成科學(xué)合理的考核指標(biāo),建立合理的考核模型,利用智能技術(shù),將增值評價結(jié)合其他評價形式(診斷性評價、形成性評價等)形成綜合評價報告,促進教師評價方式多元化。通過建立科學(xué)多元的評價指標(biāo),對教師專業(yè)的評價可以體現(xiàn)在職業(yè)創(chuàng)造力、合作能力、職業(yè)素養(yǎng)等方面,促使教師專業(yè)發(fā)展從單純的績效考核轉(zhuǎn)向開放、多維、持續(xù)的能力認(rèn)證。通過鼓勵教師參加各種專業(yè)比賽、技能等級認(rèn)證,促進教師專業(yè)高質(zhì)量發(fā)展。
基于信息反饋機制,利用增值模型評估教育決策的應(yīng)用效果,提供反饋信息,供學(xué)校和教師參考,從而了解教師的實際水平和教師自身成長的不足。充分運用評價結(jié)果,利用智慧教育增值評價平臺的跟蹤監(jiān)測功能,及時對學(xué)校、老師、學(xué)校和區(qū)域教學(xué)實施改進干預(yù)[15]。借助可視化交互系統(tǒng),高效直觀地向不同的群體展示增值評價報告,強化結(jié)果反饋。要增強數(shù)據(jù)挖掘功能的易用性,注重并完善反饋數(shù)據(jù)的再分析,引導(dǎo)各種主體深度介入,強化智能化教學(xué)評估的引導(dǎo)、評估、檢測、控制與提升功能,從而構(gòu)建更加科學(xué)、公平、本土化的動態(tài)評價機制,實現(xiàn)教師教育系統(tǒng)的穩(wěn)態(tài)調(diào)節(jié)。
人工智能時代,技術(shù)的廣泛應(yīng)用促使教育數(shù)據(jù)的應(yīng)用場景和范圍不斷擴大,教育數(shù)據(jù)安全問題日益突出。教育數(shù)據(jù)往往涉及隱私泄露問題、信息安全問題、數(shù)據(jù)鴻溝問題,智能設(shè)備無時無刻不在上傳、呈現(xiàn)、保存人們的隱私信息,除公開使用的信息以外,還包含許多用戶偏好信息(如儲存在用戶本地終端上的個人相關(guān)的記錄)。智能時代的媒介倫理因其開放性和現(xiàn)代性要求技術(shù)對公眾的賦權(quán)更需理性和人性的雙重參與。因此,教育工作者應(yīng)在教育數(shù)據(jù)的采集、存儲、分析、共享等過程中增強察覺數(shù)據(jù)安全隱患的敏銳性,重視對教育保密資料的保護,對違規(guī)行為進行處罰,加強對個人信息的保護[16]。
人工智能賦能教師教育評價,有利于解決數(shù)據(jù)收集分析困難、評價內(nèi)容不明確、評價結(jié)果解釋不一等現(xiàn)實問題,開辟教師教育增值評價新航道,實現(xiàn)教師教育資源高效整合,教師研修全鏈路融通,教師專業(yè)發(fā)展一體化的智能銜接。增值理念下,以教師績效評價、課堂觀察及教師研修評價等綜合分析結(jié)果作為教師教育評價的依據(jù),比以單維度指標(biāo)更客觀、科學(xué)、高效。人工智能賦能教師教育增值評價不僅錨定了增值評價的核心價值,更回應(yīng)了智能社會培養(yǎng)高素質(zhì)專業(yè)化創(chuàng)新型未來師范人才的內(nèi)在需求。