涂端午
(國家教育發展研究中心國際比較與對外交流部,北京100816)
2018 年9 月10 日,習近平總書記在全國教育大會上指出:“要堅決克服唯分數、唯升學、唯文憑、唯論文、唯帽子的頑瘴痼疾,從根本上解決教育評價指揮棒問題。”[1]2019 年1 月,教育部部長陳寶生在全國教育工作會議上強調,“‘五唯’是當前教育評價指揮棒方面存在的根本問題,是當前教育改革中最難啃的‘硬骨頭’,但再難也要啃下來”,“要在破除‘五唯’問題上打一場硬仗,拿出實招硬招新招。”[2]
我國教育評價改革實踐始于20 世紀80 年代中后期。1985 年《中共中央關于教育體制改革的決定》指出,“教育管理部門還要組織教育界、知識界和用人部門定期對高等學校的辦學水平進行評估”[3]。1993 年《中國教育改革和發展綱要》提出,“建立各級各類教育的質量標準和評估指標體系。各地教育部門要把檢查評估學校教育質量作為一項經常性的任務”[4]。1999 年《中共中央國務院關于深化教育改革全面推進素質教育的決定》提出,“加快改革招生考試和評價制度”,“建立符合素質教育要求的對學校、教師和學生的評價機制”[5]。2010年頒布的《國家中長期教育改革和發展規劃綱要(2010-2020 年)》(簡稱《綱要》)圍繞考試招生制度、教育質量評價、人才評價、科研評價等對教育評價改革做出了全面系統規劃。
《綱要》頒布后,后續相關政策做了哪些跟進?教育評價改革的規則、路徑是什么?破“五唯”具有怎樣的政策基礎?回答好這些基本問題是打贏教育評價改革這一“最硬的一仗”的重要前提。政策是我國教育改革發展的主要驅動力,政策文本“記錄”了教育改革的歷史軌跡和政策變遷,全面梳理、分析教育評價政策是回答上述問題的基本途徑。用關鍵詞“教育評價”在中國知網上進行模糊檢索,發現未有研究對某一時段教育評價政策進行系統分析,也未有研究涉及上述問題。本文在全面梳理、分析《綱要》頒布以來教育評價政策現狀的基礎上,結合改革實踐,力圖回答上述問題,理清教育評價改革的政策邏輯,為破“五唯”提供有益參考。
教育評價廣義指“對于教育領域中各種相關的人、事、物、制度、觀念等的教育價值的評判”[6]。狹義的教育評價是指依據一定的教育目標和評價標準,對教育活動滿足社會和個體需要的程度作出的系統分析和價值判斷[7]。國際上有學者根據教育評價的功能(問責、改進、鑒定)、數據來源(考試與評估數據、行政部門數據、系統調查與評審數據)和評價對象(系統、項目、學校、教師、學生)將教育監測與評價分為15 種類型[8]。通過對政策文本的梳理,我國教育評價改革主要集中在教師評價、綜合素質評價、考試招生、科研評價、學校評價、課程評價、學科專業評價上。上述七類評價實際指向三個評價對象,即學生(包括綜合素質、考試招生)、教師(包括科研)和學校(包括課程、學科專業)。因此,本文中的教育評價是指對學生、教師、學校在參與和實施相關教育活動、教育過程和所取得的教育效果上作出的價值判斷。
由于政策主體(政策制定者)、政策客體(政策對象)以及政策目標和政策措施等要素均內含于政策文本中,通過對政策文本各要素的編碼及定量分析,可以從宏觀和整體上把握教育評價改革發展的過程。但對政策文本的分析,最終要“走出”文本,與歷史和實踐“對話”[9]。這是由于文本是歷史和實踐的產物,文本分析不能割裂歷史和實踐,“文本的客觀意義及其內在問題是通過在一定的‘思想環境’和社會-歷史現實中對文本的解釋來揭示的”[10]。研究首先通過文本分析發掘文本的“深層結構”和評價改革的政策邏輯,在此基礎上通過對相關政策對象的深度訪談、引用實地調研和教育部義務教育督導報告中的相關數據來實現政策文本與實踐的“對話”。
1.政策文本數據
《教育部公報》(簡稱《公報》)是由教育部主辦,主要刊登國家教育政策文件和重要領導講話的政府部門公開出版期刊,能夠反映我國教育政策整體情況。《公報》中刊發的教育政策具有公開性、權威性和全面性特點,是本研究的文本數據來源。研究以21世紀我國第一個教育改革發展的綱領性文件——《綱要》的頒布為時間節點,通過檢索《公報》(2010年1號-2018年12號)共搜索到《綱要》頒布以來中共中央、國務院及教育部等部門發布的含教育評價的相關政策208項①。研究以此為樣本,系統考察教育評價政策發展情況。
2.政策實踐數據
作者參與了2017年對浙江、上海新高考改革的調研,部分調研數據可用于本研究。此外,通過訪談中小學校長、教師,查閱教育部教育督導報告進一步充實政策實踐數據。
研究將對教育評價政策文本的要素變量和指標進行編碼,運用SPSS16.0 軟件對數據進行統計分析,從整體把握教育評價改革推進的基本情況。同時,運用訪談、實地調研和教育部督導報告等數據來分析政策推進中的問題。

表1 文本編碼的變量與指標
《綱要》頒布后,教育評價政策總體呈明顯增長趨勢。208項政策占《公報》同期發布政策的1/5,即每5項教育政策中就有1項涉及教育評價改革。隨著政策供給的不斷增強,教育評價改革的力度也進一步加強。
1.政策主題和領域不斷拓寬
教育評價政策共涉及63項主題,其中數量最多的前十個主題依次分別是:教師隊伍建設(8.7%)、考試招生(6.8%)、學習貫徹中央精神(5.8%)、教育改革創新(4.8%)、教育發展(4.3%)、體育(4.3%)、行業教育質量(3.9%)、專業標準(3.9%)、卓越計劃(3.4%)、人才規劃與人才計劃(2.9%)。
圖1 顯示,《綱要》頒布后政策涉及的教育主題不斷拓寬,2010年后每年均有新增主題,有4個年份新增主題達到或超過8個。

圖1 評價政策主題年度增長情況
208項政策共劃分為6個領域,按政策數量排名依次為:高等教育(42%)、綜合(21%,涵蓋整個教育領域)、基礎教育(20%)、職業教育(14%,包括中等職業教育、高等職業教育)、特殊教育(2%)、民族教育(1%)。政策涉及的領域不斷拓寬,除綜合性政策外,2011年政策主要集中在高等教育、基礎教育和職業教育,2012年政策延伸至特殊教育,2015年延伸至民族教育。
2.政策驅動力不斷加強
一是政策文件的效力等級不斷增強。隨著時間推移,國務院和中央發布的政策不斷增多。《綱要》頒布后,有3項中央政策(集中在2017和2018年)、17項國務院政策涉及教育評價(圖2),反映了黨中央、國務院對教育評價改革的高度重視,政策文件的效力等級不斷提升。

圖2 政策的效力等級
二是政策的專業指導不斷增強。《綱要》頒布后,針對綜合素質評價,教育部出臺了《針對加強和改進普通高中學生綜合素質評價的意見》(教基二〔2014〕11 號);針對考試招生改革,國務院出臺《關于深化考試招生制度改革的實施意見》(國發〔2014〕35 號);針對教師評價,2018 年出臺《中共中央國務院關于全面深化新時代教師隊伍建設改革的意見》《中共中央辦公廳國務院辦公廳關于分類推進人才評價機制改革的指導意見》;針對管辦評分離,教育部出臺《關于深入推進教育管辦評分離促進政府職能轉變的若干意見》(教政法〔2015〕5 號);針對破“五唯”,2018 年教育部發布《關于開展清理“唯論文、唯帽子、唯職稱、唯學歷、唯獎項”專項行動的通知》(教技廳函〔2018〕110號)。隨著這些政策的出臺,教育評價改革的政策指導不斷深化、細化、實化,既有面向教育各領域、各學段的整體推進,也有針對關鍵環節的重點突破。
三是部門合力不斷增強。近年來教育評價改革堅持系統推進、統籌推進,協調推進,形成部門合力。《綱要》頒布以來,出臺的186 項部門政策中,31.2%的政策為聯合發文(圖3)。如人力資源社會保障部、教育部《關于深化中小學教師職稱制度改革的指導意見》(人社部發〔2015〕79 號),科技部、教育部、人力資源社會保障部、中科院、工程院《關于開展清理“唯論文、唯職稱、唯學歷、唯獎項”專項行動的通知》(國科發政〔2018〕210 號),教育評價改革和破“五唯”的部門合力進一步增強。

圖3 部門發文情況

圖4 政策中“五唯”的年度分布(單位:次)
《綱要》明確提出,把促進公平作為國家基本教育政策,把提高質量作為教育改革發展的核心任務。公平和質量是我國教育發展的基本方向,促進公平,提高質量也是教育評價改革的基本價值導向。
208 項政策中有50 條內容涉及教育評價的導向,其中有30 條明確提出評價改革的質量導向,如《教育部關于2013 年深化教育領域綜合改革的意見》(教改〔2013〕1 號)指出,“以質量、創新、貢獻為導向,改進高校科研評價體系”。教育評價政策中有關公平的表述主要集中在考試招生領域,如《國務院關于深化考試招生制度改革的實施意見》(國發〔2014〕35 號)明確指出,“把促進公平公正作為改革的基本價值取向”。在對教師、科研成果和學校的評價中公平常作為一項基本原則來體現,如《教育部關于建立健全中小學師德建設長效機制的意見》(教師〔2013〕10 號)明確提出,“師德考核應充分尊重教師主體地位,堅持公平、公正、公開原則”。
“五唯”違背教育教學、科研發展與人才成長規律,與教育評價基本價值導向相背離,是加快推進教育現代化、建設教育強國的“瓶頸”制約,也是新時代教育評價改革的主要關注點。《綱要》頒布后,教育評價改革中破“五唯”政策主基調愈加響亮,在政策文本中出現的頻次呈逐年上升趨勢(圖4)。
在23 項政策文本中各“唯”單次累計出現49 次,其中2018 年出現頻次達到最高值18 次。“五唯”中,“唯論文”出現次數最多,其余依次是“唯分數”“唯升學”“唯學歷”“唯帽子”。
208 項政策主要采用六類政策工具來推進教育評價改革。根據使用的頻次,依次為標準化、綜合評價、分類評價、社會評價、多元評價和專業評價,它們構成教育評價改革的主路徑。
這六類政策工具在政策中以單一工具出現為主,占政策文件總數的68%(圖5)。另有20 種含2 類及以上政策工具的多元組合,其中出現頻次最多的五種組合是:標準化、綜合評價;標準化、社會評價;標準化、分類評價;標準化、社會評價、分類評價;全部政策工具。政策中多元工具組合呈增長趨勢。

圖5 教育評價改革的政策工具(單位:項)
《綱要》頒布后,隨著教育評價改革的不斷深化,基本形成了破“五唯”的政策邏輯鏈條。其中“培養什么人、怎樣培養人、為誰培養人”這一教育的首要問題構成教育評價改革的邏輯起點。促進公平,提高質量的基本價值導向聚焦三個基本問題,即什么是好學生,什么是好教師(好校長),什么是好學校?每個問題要用“評什么”“誰來評”“怎么評”三個維度來回答。圍繞這三個維度,這六類政策工具與邏輯起點、價值導向、基本問題和評價維度共同形成破除“五唯”頑瘴痼疾的政策邏輯鏈(見圖6)。
《綱要》頒布以來,教育部研究制定了《幼兒園教師專業標準(試行)》《幼兒園園長專業標準》等覆蓋基礎教育和中等職業教育的9個教師和校長(園長)專業特點的評價標準,重點評價其教育教學方法、教書育人工作業績和一線實踐經歷,嚴禁簡單用升學率和考試成績評價中小學教師。引導教師由“育分”向潛心教書育人轉變。
三是推進科研回歸追求創新、求真務實、服務國家的本質。“代表作制度”得到推行,注重標志性成果的質量、貢獻和影響。在部屬和部省共建高校針對“項目、基地評審”“自主科研經費分配”“論文獎勵”等11個重點領域開展“唯論文、唯帽子、唯職稱、唯學歷、唯獎項”專項清理。科研評價中重數量輕質量、重形式輕效果,重“帽子”輕“里子”,不分研究類別、層次“一刀切”的傾向正在扭轉。

圖6 “破五唯”的政策邏輯鏈
標準;發布《幼兒園教職工配備標準(暫行)》《義務教育學校管理標準》《中等職業學校設置標準》《特殊教育學校建設標準》等6 個學校建設和管理標準;發布《義務教育語文等學科課程標準(2011 年版)》《普通高中課程方案和語文等學科課程標準(2017 年版)》《中等職業學校專業教學標準(試行)》《高等學校思想政治理論課建設標準》等11個課程和專業教學標準。這一系列標準的出臺,明確了把立德樹人作為檢驗學校一切工作的根本標準,把師德師風作為教師評價的第一標準,把促進公平、提高質量作為教育評價改革的基本導向,改革著力推進以下三個回歸。
一是推進教育回歸學生德智體美勞全面發展的初心。《綱要》頒布以來,相關政策將學生的社會實踐、“三愛”表現、藝術素質、社會主義核心價值觀、體質健康狀況和體育課成績、參加勞動情況等先后納入學生綜合素質評價,長期以來在人才培養上重智育、輕全面發展的傾向正在逐步扭轉。
二是推進教師回歸教書育人的本分。通過加大教學在高校教師評價中的比重,確立教授為本科生上課的基本制度,從政策上平衡了高校教學和科研的關系。長期以來高校重科研、輕教學的傾向正在扭轉。在基礎教育領域強調建立充分體現中小學教師崗位
政策中一些“硬要求”在具體操作中成為“軟約束”,政策推進面臨一定困難。如2014年《國務院關于深化考試招生制度改革的實施意見》中提出,“高校要根據自身辦學定位和專業培養目標,研究提出對考生高中學業水平考試科目報考要求和綜合素質評價使用辦法,提前向社會公布。”2017 年對上海、浙江新高考改革調研發現,高校基于自身招生利益考慮對這一政策要求回應普遍消極,極少高校能公布報考科目要求,導致考生科目選擇上的功利主義傾向和學校的應試化教學。例如,物理是理工科人才培養的基礎學科,關涉制造強國戰略和創新驅動戰略。由于得A 難度相對較大,且高校理工科專業對物理選考沒有明確要求,2014-2017 年上海、浙江考生選擇物理的比例逐年下降,浙江下降了14個百分點。市(區)示范性高中特別是一般高中選擇物理的學生比例大幅下降。即便是省級示范高中,一些學校選考物理人數也出現明顯的下滑,如杭州某高中,在學生總數基本不變的情況下,與2017 屆學生相比,2019 屆學生選考物理的人數減少了近三分之二②。
高校對綜合素質評價使用辦法不明確,也讓高中學校無所適從,針對破除“唯分數”“唯升學”的高校招生“兩依據一參考”(依據高中學業水平考試和高考成績,參考綜合素質評價)的政策要求在實踐中難以全面落實。在浙江調研座談中,某市教育局負責人坦言,由于綜合素質評價“在具體操作層面缺乏剛性要求,很多學校都在造假,這是不爭的事實”③。
又如《國家教育事業發展第十二個五年規劃》《國務院關于加強教師隊伍建設的意見》《中共中央辦公廳國務院辦公廳關于分類推進人才評價機制改革的指導意見》均強調:“嚴禁簡單用升學率和考試成績評價中小學教師”。根據對一些地方中小學校長和教師的訪談,這些“硬要求”在實際操作中成為教師評價的“軟約束”。
在三個評價維度中,政策集中在評什么,即評價標準和內容,相比之下對誰來評和怎樣評的具體規范和指導明顯不夠。
在評什么維度上,政策主要集中在標準化上,對綜合評價明顯關注不夠,其出現頻次僅為標準化的1/3;在誰來評維度上,政策較多強調社會評價,專業評價僅為社會評價頻次的一半;在怎么評維度上,政策主要關注分類評價,多元評價出現頻次僅為分類評價的61%。現有政策對多元評價不同評價主體、評價方式相互之間的關系及其在評價中所占比重,缺乏明確、細致的規定。
總體而言,6 類政策工具使用不平衡、各自發展不充分的問題比較突出。現有政策的關注重點依然在基本標準、價值導向和基本分類上。評價以鑒定性、總結性評價為主,診斷性、形成性評價不足。在標準建設中,對反映學生學習、教師教學和學校辦學努力程度和進步情況的發展性指標體現不夠,對教育評價尤其是破“五唯”的具體操作和程序規定相對不足,在誰來評、怎么評上缺乏有力的政策指導和規范。
1.學校外部評價主體缺位
《綱要》提出,“要開展由政府、學校、家長及社會各方面參與的教育質量評價活動。”“鼓勵專門機構和社會中介機構對高等學校學科、專業、課程等水平和質量進行評估。”教育部《關于充分發揮行業指導作用推進職業教育改革發展的意見》(教職成〔2011〕6 號)也提出,“逐步建立以行業企業為主導的職業教育第三方評價機制”。但長期以來,家長、社會、企業、行業參與教育質量評價的能動性沒有充分調動起來,市場、社會評價作用發揮有限,第三方評價、業內同行評價發展不充分。由學校、行業、企業和社會機構等共同參與的教育質量評價機制尚未有效形成。
外部評價主體缺位說明“管辦評”分離的改革還不到位。這一方面容易造成政府在教育評價中的權力越位,另一方面也因難以形成綜合評價,導致評價依據和結論的片面化。例如社會用人單位對高校畢業生質量評價缺失,在很大程度上導致對高校教育質量評價主要停留在入學成績和升學(考研)率上。相關主體缺位是導致評價難以“不唯”的一個重要原因。
2.學校內部評價主體缺位
《綱要》提出,建立科學的教育質量評價體系,全面實施綜合素質評價。根據國家教育督導檢查組2018年對河北等6省(區)義務教育均衡發展督導檢查反饋意見,目前中西部的縣(市、區)教師有編不補、結構缺編的問題仍然比較突出,音樂、體育、美術、外語、信息技術等學科專任教師不同程度短缺[11]。有校長反映,“縣中緊缺體育、美育教師,1所有2000名學生的中學目前只有3 名體育教師。有的中學10 年來沒有進新教師”④。中小學教師結構性缺編導致一些地方學生綜合素質評價主體缺失。此外,即使一些學校沒有教師結構性缺編問題,綜合素質評價主體依然缺位。有教師指出,“學校綜合素質評價主要由無教學任務的心理教師來承擔。公辦學校比民辦學校更重視學生綜合素質評價,但這種重視僅停留在形式上”⑤。有教師認為:“地方農村高中搞綜合素質評價意義不大,流于形式,學生、家長都不重視,認為對高考錄取不起什么作用,教師積極性也不高。綜合素質評價以學生自己填寫為主,基本都是寫好的方面。另外轉學、借讀學生的評價由誰負責,誰來審核材料的真實性也沒有明確規定。”⑥學校內部評價主體缺位說明政策落實不到位,學校辦學導向尚未真正轉到素質教育上來。
當前,針對破“五唯”的相關政策,主要以破“兩唯”或“三唯”的形式散見于不同教育領域、不同學段、不同主題的教育評價政策中。隨著教育評價改革的深入,需要在政策制定上進一步聚焦破“五唯”的主題,厘清“五唯”的內在邏輯關系,加強對破“五唯”的主體政策和配套政策的完善,補齊現有6 類基本政策工具的“短板”,引入增值性評價⑦等發展性評價方式,充實、升級政策“工具箱”,增強不同政策工具使用的系統性、協同性,優化教育評價的功能。此外,教育部開展的專項督導尚未涉及教育評價,建議開展破“五唯”專項督導,強化督政職能和追責問責機制,“推動教育督導‘長牙齒’”[2],增強對教育評價改革關鍵環節的“硬約束”,引導學校從重投入向重過程、重數量向重質量、重生源向重培養、單純注重結果向關注教育全過程轉變,加快建立有利于教師潛心育人、學生全面發展、學校靜心辦學的科學評價機制。
教育評價是高度專業化的工作,必須保障專業機構的有效參與。應大力培育專業教育服務機構,讓行業協會、專業學會、基金會等各類社會組織有效參與教育評價。引入市場機制,將委托專業機構和社會組織開展教育評價納入政府購買服務范圍,加快制定專業機構和社會組織參與教育評價的資質認證標準,確保各評價主體各安其位,各盡所能,增強社會和第三方組織對教育評價“不唯”的有效支撐。同時,落實學校教育評價的主體責任,按照“誰了解、誰評價”“誰評價、誰負責”的原則,確定學校各項評價指標的評價主體。
學校是保障教育質量和促進教育公平的主體,是教育評價改革和破“五唯”的關鍵力量。隨著“管辦評”分離改革的深入推進和學校辦學自主權的不斷擴大,學校在教育評價中的地位和作用日益突出。現代學校制度是衡量“管辦評”分離改革成效的重要標志,是實現教育現代化的關鍵。對學生、教師、學校的評價能力和水平集中反映了教育部門和學校的治理能力和治理水平,學校教育評價制度是現代學校制度的重要基礎。2017 年北京市教委在全市所有高中推廣使用由清華大學附中開發的“學生綜合素質評價系統”[12],這充分說明以“破五唯”為主題的教育評價改革最終要落實到學校自身的教育評價制度建設上來。目前,現有政策文本尚未明確教育評價在現代學校制度建設中的地位和作用,應把學校教育評價制度建設作為現代學校制度建設的基礎工程加以推進。
研究將文本與歷史和實踐進行了“對話”,雖然對于全口徑的教育評價政策系統而言,這種“對話”尚不充分、全面和深入,但可以看出,在教育評價領域,文本中的部分政策邏輯與實踐邏輯存在不一致甚至沖突。本文所梳理出的政策邏輯,僅是教育評價改革邏輯的一個方面,此外還有教育評價的理論邏輯和實踐邏輯。來自學術研究的理論邏輯最終要內含于政策中構成政策的理論基礎,它可以看作是文本邏輯的“內涵”,而實踐邏輯是在文本邏輯所規定的適用范圍中形成的一套行動邏輯,它可以看作是文本邏輯的“外延”。只有當這三種邏輯充分“對話”并對各自存在的邏輯缺陷進行解構和“重組”,才能最大限度減少改革中政策研究者、決策者和政策對象之間的邏輯沖突,實現教育評價改革內在邏輯的一致性。這是本研究需要深入的地方,也是破“五唯”研究的重要內容。
注釋
①論文中引用的政策文件內容如未標注出處均來自教育部官網上發布的《教育部公報》。
②2017年對浙江、上海的高考改革調研。
③2017年對浙江、上海的高考改革調研。
④對H省B縣中學校長的訪談(2019-10-11)。
⑤對N省C市中學教師的訪談(2019-10-11)。
⑥對N省M縣中學教師的訪談(2019-10-12)。
⑦增值性評價是以學校教育活動對學生預期成績的增值為評價標準,用來判定學校對學生發展的影響。這種更加科學、公平的評價方法在世界上很多國家得到了關注和研究。參見:談松華.改進教育評價[N].光明日報,2013-01-23(014).