蔡喆炯 上海市靜安區閘北第一中心小學

2022年4月,教育部頒布《義務教育課程方案(2022年版)》,提出要“全面落實新時代教育評價改革要求,改進結果評價,強化過程評價,探索增值評價,健全綜合評價,著力推進評價觀念、方式方法改革”。因此,學校開展綜合評價已是大勢所趨。要研究學校綜合評價,不可避免要對學生的學習過程、學習表現進行評價,而我校已基于上海市提升中小學(幼兒園)學校課程領導力行動研究項目“基于數據分析的教學評價反饋形式研究”開展了為期三年的研究。
理想與現實往往相差甚遠,雖然整個教育行業對于綜合評價的研究從來就沒有停止過,然而卻始終無法得到一個完美的答案。那么問題出在哪里?有哪些已知的問題?能解決這些問題嗎?怎么去解決這些問題呢?
眾所周知,“學業成果”“學習興趣”“學習習慣”是綜合評價的三個主要維度。評價在教學中起到診斷、激勵、調節、教學的作用,其最終目的是為了促進教學。而當下完全被學校接受、采用并且長期被堅持的評價仍然只存在于“學業成果”維度,“學習興趣”“學習習慣”維度的評價大多以試點、實驗、階段性的形式存在,或將此類評價作為一種必要的表現形式,除了有一定的激勵作用之外,并不能起到有效的診斷和調節作用,也就無法對教學產生有效的影響。
究其原因,我們不難發現,“學業成果”評價之所以在學校有生存空間,主要有以下幾個原因:
1.它是一種定量評價
學校的定量評價,通常通過考試、測試、練習、作業等形式,對學生學習效果劃分等第,通過計算分析作出評價。這種模式有統一的執行步驟,已形成嚴格的規范,是學校評價的主要方式。
2.它是一種結果性評價
“學業成果”維度的評價不關注學習過程,忽視了學生在整個學習過程中所表現出來的非智力因素。但它操作方便,更容易被學校、教師所采用。
3.它是一種傳統的評價
對“學業成果”維度的評價古已有之,不需要改變教師的理念。教師更容易接受這種傳統的評價方式。
4.診斷和調節作用明顯
隨著計算機算力的飛速發展,其對教學所產生的診斷作用越來越顯著,教師能夠從數據中發現問題并采取相應措施,使評價的調節作用可以充分發揮。
5.便于學校的質量管理
由于考試仍然是“中考”“高考”的主要選拔機制,因此學校重視“學業成果”評價,且“學業成果”維度的評價更易于檢測教學質量的問題所在。
6.投入產出比高
“學業成果”維度的評價由于人力資源和運維成本較低,在基層擁有廣泛的實施基礎,學校的成本投入處于可控狀態,性價比極高。
對照“學業成果”維度的成功,“學習興趣”“學習習慣”維度的不足則表現在以下幾個方面:
1.大多不是定量評價
“學習興趣”“學習習慣”維度的評價,評價形式復雜且缺少一定的規范。它很難采用數學的方法來計算,也就難以做到“定量”。它只能根據教師對學生(或互評、自評、家長評)平時的表現、現實情況和學習狀態,通過觀察和分析,對學生直接做出好與不好的價值判斷,比如對學生的學習態度作出一個等級評定,或者寫一條評語等。此類評價是通過教師、學生、家長的經驗和主觀判斷的評價方法來執行的。此類評價的形式有很多種,但沒有執行標準,主觀判斷的結果缺乏一定的科學性。
2.大多是過程性或表現性評價
評價“學習興趣”“學習習慣”維度,由于尚沒有成功“量”化的實例,因此就必然把重點放在學生“質”的發展,試圖在評價結果與目標之間達成一致。它提倡關注學生的學習過程和具體表現,流于形式或操作復雜。該類評價方法一般只關注學生在學習過程中的具體表現,強調“做了嗎?現在在做什么?做得怎么樣?”而不是“做得好不好?”結果往往模糊且隨意,尺度把握也比較籠統,很難做到精準有效。結論的不科學也導致這種評價很難在診斷、調節功能上發揮作用。而利用信息化平臺企圖量化過程性評價的嘗試一直以來也都有,但操作都過于復雜,無法讓教師和學生接受,生命周期也就無法變得更長。
3.大多是新型的評價
對學生“學習興趣”“學習習慣”維度的評價,雖然已有多年歷史,但相對于“學業成果”維度的評價,還是一種新型的評價。由于缺乏統一的操作和標準,教師并不愿意深入研究此類評價。且由于此類評價的結論無法做到精準有效,也不能立竿見影地對教學工作產生有效的影響,因此在教師內部接受度普遍不高。而要改變這種現狀,就必須改變理念,改變教師對此類評價的固有印象,提升教師對學生“學習興趣”“學習習慣”維度評價的認知水平。
4.信度或效度不高
利用信息技術支持過程性評價的嘗試已有二十多年的歷史,但其診斷、調節作用并不明顯。二十多年來,人們不斷提出過程性評價的實施方案。然而實踐證明,到目前為止,仍然沒有一種行之有效的方法可以通過信息技術解決過程性評價的問題,也就無法對“學習興趣”“學習習慣”維度的評價產生直接作用。現階段信息技術的介入,也無法產生比主觀評價更為精準的結果,結論缺乏信度,實施過程又缺乏效度,因此實用意義并不大。
5.管理效益不明顯或無法量化
每一所學校都極其重視“學業成果”維度的評價,因為其與學校教學質量、升學等關系密切。也因為必須要實施“學習興趣”“學習習慣”維度的評價而做了很多的工作,但由于前述原因造成學校在操作層面有很多無法解決的問題,造成管理效益不高,也由于在學生學習過程中產生的大量數據無法量化或用于對教學工作的調節,使學校除了形式變化之外,找不到更好的解決方案,也就無法使此類評價引起各方面的重視。
6.投入產出比低
目前對于“學習興趣”“學習習慣”維度的評價,往往需要投入大量的人力資源成本。由于此類評價關注學生的學習過程,因此對于數據的采集也就貫穿于日常教學的全過程。在此過程中,教師需要無時無刻地記錄學生各方面的學習表現,其工作量可想而知。而往往大量的過程性數據最后并沒有被用于對學生“學習興趣”“學習習慣”維度的評價,結果還是由教師、學生、家長等按照主觀印象作出評價結論,并不能體現過程性數據采集的價值。此外,由于目前信息化平臺的開發、運維成本也一直處于高位,因此對學校而言,采用信息化平臺解決方案需要投入大量經費,還不能取得理想的結果,性價比不高。
綜合評價需要同時關注到“學業成果”“學習興趣”“學習習慣”三個維度。而當前學校進行“學習興趣”“學習習慣”維度的評價方式常見的有三種,即傳統的紙筆評價、以實物形式呈現的成長檔案袋、爭章,或利用信息化評價平臺來進行,下表是常見三類具有代表性的綜合評價方式的優缺點對比(見表1)。

表1
現有的利用信息技術實施的綜合評價平臺,大量操作一般都由教師完成,工作量極大,教師為完成任務,往往采用批量評價、批量提交的方式應付,雖然完成了大量數據的提交,但由于采集的數據本身可信度極低,并不能客觀地反映教學活動中存在的問題。
經過長時間的研究和分析,我們發現,一種評價方式能否在學校中獲得生存空間,其關鍵問題并不是決策層,也不是管理層,而在于操作層。我們認為,一種評價方式要在學校獲得生存空間,需要同時滿足以下幾個條件,按其重要性排序如下:
1.不明顯增加教師工作量和負擔;
2.不明顯(或漸進式)改變教師習慣的工作方式;
3.不大量增加學校經費支出;
4.能獲取大量真實的過程性數據;
5.有明顯的激勵作用;
6.評價結果能對教學工作起到診斷、調節的作用。
學校在分析了當前主流信息化平臺開展過程性評價的優點基礎上,征求了部分教師、學生、家長的意見,規劃出一套基于移動終端的新型評價模式,并將之命名為“童心加油站”。該評價模式擁有自主設計的二維碼打印系統,可以讓教師快速批量生成和打印二維碼,二維碼則可用于學生在學習過程中任意環節的過程性評價的基礎數據錄入。
“童心加油站”這一評價模式,是對符合教師使用習慣的傳統評價方法的升級迭代。在其使用過程中,沿襲了教師的既有工作習慣,將學生學習過程中的口頭表揚、作業評價、成果展示、爭章、發放小獎品等傳統的、不能量化的評價手段規范為向學生發放二維碼的形式。二維碼還可以打印在不同顏色的紙上,不同顏色的二維碼則指向于各個教學環節中預先設計的評價指標,有助于提高教師的發放速度。教師在教學過程中,要集中關注學生在整個學習過程中的具體表現,根據學生表現送出不同的彩色的二維碼。這既解決了過程性數據量化的問題,又解決了評價數據有效性的問題。學生在放學后將當天獲得的二維碼帶回家中,由家長或學生自己通過微信“掃一掃”的方式進行數據錄入,使用方便快捷。
基礎數據的采集是實施科學評價的基石,沒有大量正確數據的支持,再好的技術和算法都無法分析出客觀、準確的結果。解決數據采集問題,是科學評價、正確評價的第一步,也是綜合評價要解決的核心問題之一。
在解決了數據采集問題的基礎上,學校嘗試在部分班級進行了“童心加油站”項目的試點工作。項目的試點按照以下任務路徑進行:
完成平臺開發→確定評價維度→制定學科指標→基礎數據錄入→家長信息綁定→項目數據采集→反饋實驗結果→改進項目內容(如圖1所示)。

圖1 項目任務路徑
以課堂表現方面的評價指標為例。學校規定了合作交流、情感態度、實踐活動、知識技能、學習成果共5個一級評價維度,再由教師根據不同學科的特點制定了二級評價指標共20 個,并將所有評價指標導入了評價平臺。以語文學科的課堂表現為例,制定評價表并簡化(見表2)。

表2
至此,“童心加油站”新型評價模式的基礎設置均已全部完成,教師可以在教學過程中根據學生的具體表現發放對應二維碼。家長和學生在錄入二維碼之后,便可以通過平臺小程序提供的雷達圖等數據了解孩子在校學習的表現情況,教師也能在平臺上得到具體的反饋,例如趨勢折線圖、維度分析雷達圖、單項指標雷達圖等,并將之用于診斷、調整自己的教學工作。
這種評價形式只關注學生的學習過程,不關注學生的學習成績。從實驗班教師的反饋中可知,“童心加油站”對上課教師所產生的影響不大,工作量相比傳統的方式增加不多,教師基本能夠適應這種評價方式;從學生角度而言,彩色二維碼的出現,使孩子們的學習積極性得到了空前提高,評價的激勵作用也由此得到了充分的釋放。對于過程性評價這個世界性難題,真可謂走出了“萬里長征第一步”。
“童心加油站”項目在解決過程性數據采集的歷史性難題上有重大突破。下一階段,學校將把數據算法科學性作為研究重點,著重改進算法模型;同時對評價指標進行二次簡化,在評價的科學性與可操作性方面尋找一個平衡點,并以此構建科學的學校綜合評價體系,真正發揮信息化在深化教育綜合評價改革方面的作用,使“童心加油站”成為教師歡迎、學生喜愛、家長想看的好平臺。