教育評價具有重要的導向性,是教育綜合改革的關鍵環節,對教育質量的全面提升起著引領作用;也是我國中高考改革的重要組成部分,對“指揮棒”系統有著重要的影響。2013年6月,教育部頒發《關于推進中小學教育質量綜合評價改革的意見》(以下簡稱《意見》)以及《中小學教育質量綜合評價指標框架(試行)》(以下簡稱《框架(試行)》)。同年12月份,教育部在全國遴選了30個地區作為國家評價改革實驗區并啟動。實驗進行了近一年,發現普遍對綜合評價存在一些基本認識誤區。
一、教育質量綜合評價改革不等于教育質量監測
有不少綜合評價改革實驗區把教育質量綜合評價等同于教育質量監測,對教育綜合評價的概念、理論及模式缺乏清晰認識。
教育質量監測的作用主要是幫助教育行政部門了解本國或本地區的教育質量現狀,并通過探求學業表現與教學、家庭、社區等背景變量間的關系,指導、引導整個教育體系向著推進素質教育的方向邁進;以區域、學校為評估對象,評估的目的是為教育主管部門提供信息,進行相關教育決策。
但2013年《意見》中給出的教育質量綜合評價的改革任務是要“建立體現素質教育要求、以學生發展為核心、科學多元的中小學教育質量評價制度”,并希望借此制度的建立,能夠“切實扭轉單純以學生學業考試成績和學校升學率評價中小學教育質量的傾向,促進學生全面發展、健康成長”。教育質量綜合評價改革要圍繞“評價有利于學生、教師以及學校”的健康發展和良性進步而展開。因此,教育質量綜合評價服務的對象雖然也包括區域和學校,但更主要的是廣大學生和教師;評價的目的是為了引導、診斷、改進和激勵;教育質量綜合評價雖然也能為教育主管部門提供決策的依據,但更主要是為了促進學生全面發展、健康成長,促進教師的職業道德建設和業務水平的提高,而不是僅僅服務于教育主管部門的教育決策。
教育質量監測和教育質量綜合評價不僅在目的、作用、服務對象上存在差異,在評價模式上,兩者也有較大區別。教育質量監測一般采取學業成績抽測,輔以調查問卷的模式,也即CIPP模式。CIPP是四個評價階段的英文縮寫:即背景評價(Context)、投入評價(Input)、過程評價(Process)、結果評價Product)。這是一個以決策為中心的評價模式;它是“為決策提供信息的過程”。
而教育質量綜合評價,更多反映的是20世紀80年代以后,教育評價在美國出現的新動向,即教育評價從以決策為中心轉向以人為中心的趨勢。
教育評價指導思想、理論和價值觀的轉變,使得美國對教育質量的綜合評價采取多種評價方法和手段相結合的綜合模式。對學生的綜合評價,一般以“學業評價+綜合素質評價+標準化考試”為基本模式;對教師的綜合評價,則是以學生“學業評價+綜合素質評價+標準化考試”的成就為基本績效標準,以教師的職業素養和專業能力為重要標準;對學校教育的綜合評價,一般以學生的“學業評價+綜合素質評價+標準化考試”的成就、對教師的“職業素養和專業能力”和教育質量監測為基本依據;而對區域教育的綜合評價,則往往以教育質量監測(學業抽測+綜合調查問卷)為主,但也有以“學業抽測+綜合素質評價抽測+綜合調查”為結構的教育質量監測。
如果對教育質量綜合評價與教育質量監測差異認識不清,實驗的設計和結果會偏離《意見》的精神及要求。
美國大型測試分數報告主要源自兩大測試體系:一個是由國家教育進步評估組織(NAEP)向公眾發布的國家報告卡及參評州的測試報告;另一個則是各州基于課程標準對3~12年級學生實施標準化測試,生成獨立的州學業報告。國家報告卡的報告框架主要分為四方面:測試成績的總體趨勢,各組學生的成績比較,學科領域的成就水平描述及各州學業成績比較,并以常模參照和標準參照的方式報告學業成就的變化。與NAEP報告相比,州級報告除了以圖表呈現3~12年級各類學生達到及格、精通、優秀的人數及比率外,對參評學生的分類指標更具體。增設了如殘障兒童,提供適應性測試情況,參與聯邦Title 1項目,入學時間,是否移民等指標,對各亞群體的分析也更詳細。
二、教育質量綜合評價改革實驗《框架(試行)》不等于實驗標準和模式
2013年《意見》明確給出了中小學教育質量綜合評價改革的總體要求、綜合評價體系建設要求、完善推進評價改革的保障機制要求和認真組織實施要求,并規定中小學教育質量綜合評價改革實驗必須要符合上述要求。《框架(試行)》給出了20個關鍵指標、上百個指標考查要點。從實驗系統工程的角度看,《意見》和《框架(試行)》并沒有給出實驗開展的基本架構和標準,具體包括(1)實驗的理論架構,含測量、診斷、甄別、評價等的理論架構;(2)實驗的技術架構,含測量、統計、分析、診斷、甄別、評價、結果呈現、使用等的技術架構;(3)實驗的標準架構,含測量、診斷、甄別、評價等維度及標準體系與結構;(4)實驗的內容架構,文件中雖然給出了評價內容,但沒有給出內容結構;(5)實驗的結果架構,即測量評價的過程與結果數據結構(結果呈現);(6)實驗的結果應用,即結果應用的要素和結構(怎么用、誰使用等)。
美國標準測試分數報告具有4種功能:提供相關方教育信息,監測全國教育質量,實施績效問責制度以及監督不同群體學業成就機會。而州的學業報告主要用于教學改進及對學區和學校的績效問責。
無論是從國外教育評價的先進經驗看,還是從理論和技術的角度看,中小學教育質量綜合評價改革實驗要解決的問題是在《意見》和《框架(試行)》的指導下,通過實驗開展至少上述六個方面的探索,并同時解決與之相關的實驗驗證、科學鑒定及相關配套制度、機制、資源等問題。
三、中小學教育質量綜合評價需要破解的理論、技術難題
(一)中小學生學業評價需要破解的理論、技術難題
我國2001年的《基礎教育課程改革綱要(試行)》和2002年《教育部關于積極推進中小學評價與考試制度改革的通知》及相關文件,給出了“三維”學科教育目標和學科課程標準,學科教育目標不再是過去的“雙基”目標,而是“三維”目標。
依據三維學科教育目標與學科課程標準的要求,學業評價應解決學生、學校在學科教育上的“三維目標”測量與評價問題。然而迄今為止,大多數研究者、應用者回避了在“三維”目標學業評價上的突破,采用通過對學生其他方面的評價(主要是綜合素質、社會調查),來推理或相關分析等間接解決“三維”目標中的非雙基目標之外的其他維度評價的問題。主要原因大致是因為還沒有從理論和方法上突破學生學科學習的三維目標測量與評價難題。
就學業評價而言,評價理論、標準、技術和方法的設計要滿足三個前提條件:首先要符合國家提出的關于教育評價與考試改革的新要求,即評價要在“引導、診斷、改進和激勵”功能上取得實質性的突破,其中最為重要,也是最困難的是診斷、改進功能的實現;其次,要符合新課程改革的課程目標和課程標準要求,即符合“知識與技能,過程與方法,情感態度和價值觀”的三維課程目標,以及據此形成和完善的新課程標準要求;最后,評價結果要能與國際學業成績評估接軌。以這三者為前提條件的學業評價技術,需要思考在以下幾個方面實現突破。
(1)有機整合國際知名教育理論以及教育學、心理學等學科的最新研究,建立多元、多維的測量和評價技術模型,使學業診斷和甄別有據可依。
(2)在試卷結構、試題賦分、計分和統計分析上,依據認知行為與思維等的發生過程,設計新的多元、多維的分數結構,為學業診斷和甄別提供豐富的信息,也為不同測試之間的等值轉換提供重要的參考。
(3)在成績報告方面,應學習和借鑒國際大型標準化測試的報告系統,不僅能提供數據多元、多維、多重比較結果,而且能提供面向不同群體的數據報告,從而能為教育咨詢等提供可靠、可信、有效的科學工具,也能為教研、教學、教管等提供可靠有效的科學平臺和工具,并為教師專業發展提供科學的操作平臺,從而得以實現突破“在評價內容上重考試分數忽視學生綜合素質和個性發展,在評價方式上重最終結果忽視學生進步和努力程度,在評價結果使用上重甄別證明忽視診斷和改進”的難題。
(二)中小學生綜合素質評價需要破解的理論、技術難題
考察學生綜合素質評價較為發達的美國會發現,20世紀60年代,“表現性評價”“真實性評價”或“情境性評價”作為評估學生綜合素質,并作為標準化考試評價方式的重要補充被提出。隨后,經歷了表現性評價興起期和快速發展期,以檔案袋評價法為代表的全面推開期;檔案袋評價法的電子化和信息化時期,以及檔案袋評價法深入發展期。如今,全美采用檔案袋評價法的學校已經跨越從幼兒園到大學,群體從學生到行政人員,應用范圍覆蓋學生的畢業、教育問責、教師的雇傭、評價以及教師職業發展、行政人員的選拔與評價等等,檔案袋評價法已經成為美國教育評價和人才選拔中一種不可或缺的評價方法。
美國多年的教育評價實踐已經證明,與標準化考試提供的評價結果相比,檔案袋在促進學生自我認識能力的提升和良好素養的培養,教師更好地理解學生及教學效果,為家長、招生單位提供更全面的信息方面,都有著不可替代的優勢。尤其是借助信息化手段和網絡而制作的電子檔案袋,不僅具有指導學生成長的作用,其存儲量大和便于獲取的優勢還有助于學生在需要時向各個機構,包括招生單位呈現。然而,檔案袋評價也有其需要解決的一些技術問題,例如需要根據評價的目的精心設計檔案袋內容,需要有科學的評分標準和評分量表,需要對評價結果加以解釋并對應用做出指導,同時還需要對評分者進行培訓,規范評分過程以保證評分信度。而這些在美國都已經有非常豐富的可借鑒的經驗。
通過對比分析我國當前學生綜合素質評價領域中存在的問題以及美國在此方面已經取得的成就和經驗,本次教育質量綜合評價改革中,就學生綜合素質評價而言,要考慮解決以下幾方面的難題:(1)如何界定中小學生綜合素質及其評價的概念;(2)構建中小學生綜合素質評價的理論體系及模型;(3)健全和完善中小學生綜合素質的評價標準;(4)健全和完善中小學生綜合素質評價的測量標準;(5)健全和完善中小學生綜合素質評價的指標體系;(6)開發中小學生綜合素質評價的評價工具;(7)制定中小學生綜合素質評價的工具操作標準;(8)改進中小學生綜合素質評價的結果呈現方式;(9)建立中小學生綜合素質評價的結果解釋及應用系統;(10)設計中小學生綜合素質評價實驗推廣模式;(11)設計中小學生綜合素質評價公信力保障系統。
綜上所述,本次教育質量綜合評價改革要想取得成功,各實驗區必須要對實驗任務、實驗要解決的難題以及實驗要克服的困難等有清晰的認識,積極組織專業力量,在總結以往取得的成果和經驗基礎上,將學生的學業評價、綜合素質評價、標準化考試等改革工作向縱深推進,以期在實驗期結束時能取得實質性的成果,為我國中小學教育質量綜合評價改革落地并能長效運行探索出具有各地特色的道路。