


摘要:學業成績評價是目前教育評價改革的難點,由于諸多先決條件的局限,國際上流行的增值性評價在我國難以普及實施。簡約式階梯型增值性評價采用后進率、T標準分和優秀率三個關鍵的核心指標組合成指標體系來描述學業質量;將這三個指標變化值劃分為3個階梯等第,分別賦分,定義為指標增值小分;將三個指標增值小分合計成增值分,用來做增值性評價,評估學校學業成績動態變化及其績效。案例分析發現,簡約式階梯型增值性評價具有可接受性強、導向性強、促進性強、診斷性強等特點。
關鍵詞:學業成績評價;學校績效考核;增值性評價;學業評價模型
中圖分類號:G420 文獻標志碼:A 文章編號:1673-9094(2017)02A-0003-06
教育評價是教育質量管理的重要活動。從行政管理、學校發展和社會需求角度來看,縣(市、區)教育行政部門必須對學校的學業成績做出評估,這是不可回避的行政管理行為。有什么樣的評價,就會有什么樣的教育;有什么樣的指標,就會有什么樣的教育行為;強化什么指標,就強化了什么樣的教育行為。
把提高教育質量的理念轉化為能監測、可衡量、有共識的政策和制度,是當前教育評價改革的最艱巨任務,也是最關鍵的任務。學業成績評價,是目前教育評價改革的最大頑疾;探索科學有效的學業成績評價方式,注重發展性評價,是當前教育質量評價研究的熱點。
一、目前學業成績評價存在四大問題
1.國際上流行的增值性評價在我國難以普及實施
增值性評價方法從統計學上講是可靠的,但其結果的有效性有賴于滿足若干先決條件。增值性評價是指對同一批學生,用不同時期的學業成績進行差異比較,這需要每學年都要做區域性測試而且量具必須具有等值性;基于教育部和各省(市、區)教育行政部門有關“減負令”,在義務教育階段除了初中畢業考(中考)和小學畢業考,市縣教育行政部門很少對所有年級段采用大規模統考;而且初中學校免試入學,學業成績增值性評價缺乏入口成績數據。增值性評價的數據涉及學校的生源、經費、辦學條件和學生家庭等外部因素,除了學業成績,絕大部分縣級教育部門沒有能力采集和處理這些相關因素數據。增值性評價對于數據采集和統計方法有較高的要求,主要是采用多層線性模型等,最重要的是計算出的數據背后的教育過程因素和相關專業術語不易被一線教育管理者和教師所理解。
2.關注靜態水平評價,缺乏動態發展性評價
由于政策、歷史和地理位置等現實原因,不同區域教育存在著嚴重的不均衡性。按照靜態水平評價指標,生源優質的學校的學業成績指標歷年居高,薄弱學校學業成績指標一直低下,而且排序比較穩定。這種評價機制會導致學校把爭取優質生源作為提升教育質量的關鍵行為,可能會導致優質學校和薄弱學校都不思進取的現象。
3.評價指標不夠科學,具有誤導作用
現在比較常見的現象是用傳統的平均分或名次平均值或重點學校升學率等單一指標來描述學業成績。學業成績是一個復雜的整體性概念,肯定不能只用一兩個指標描述。這種單一指標評價會明顯傾向于升學評價,會加重學生的學業負擔,容易導致學校過分關注優生的培養,而忽略了后進生的教育,有違義務教育面向全體學生的教育觀和質量觀,更不利于評價的導向性。
4.評價綜合指標過于復雜
通常把平均分、標準差、優秀率、后進率等多個指標通過復雜的公式計算成一個綜合指標,用這個指標的數據大小和排名來評估學校的學業成績。由于只有一個綜合指數,就會突出評價的甄別功能,忽略其診斷功能。這個綜合指標需要依據軟件系統生成,學校無法自行驗算結果,許多學校對結果數據持懷疑態度,更無法依據這個指標設置自己的質量追求目標,也無法探尋達標的具體路徑。
二、簡約式階梯型增值性評價模型
學業成績評價既要考慮指標的導向性,也要考慮指標的診斷性,更要考慮其發展性;既要考慮全體學生的整體水平,也要考慮優秀生和后進生的分布情況;既要考慮定量,也要考慮定性;既要考慮指標的綜合性,也要考慮指標的可接受性;既要考慮評價模型的科學性,更要考慮實際的可操作性。
鑒于我國目前縣級教育行政部門對學校學業質量績效考核的現狀和需求,借用國際上增值性評價的理念和價值取向,筆者提出簡約式階梯型增值性評價模型,期望改良現有的常見的學業成績評價模型,也為以后施行增值性評價做個過渡。
簡約式階梯型增值性評價模型利用本年畢業考成績與往年畢業考成績做動態比較。采用后進率、T標準分和優秀率三個關鍵的核心指標組合成指標體系來描述學業質量;將這三個指標變化值劃分為3個階梯等第,分別賦分,定義為指標增值小分;將三個指標增值小分合計成增值分,用來做增值性評價,評估學校學業成績動態變化及其績效。
簡約式階梯型增值評價模型由指標結構、閾值確定、階梯賦分、績效評定四部分構成,詳見圖1。
1.指標結構
評價模型由后進率、T標準分和優秀率三個關鍵的核心指標構成,這三個指標基本上能夠描述學業質量,而且容易被大家認可。
T標準分的確定。初中學科考試成績會有一定程度的分化,標準差稍大,通常采用T=70+15z。T標準分可以利用EXCEL或SPSS快捷生成。將原始分轉化成T標準分,數據形式類似百分制成績,而且比百分制成績更有優勢;可以跨學科比較,可以做歷年動態比較。實踐也證明,這條公式被學校和教師廣泛認同。
優秀率和后進率的劃定是非常重要的,要按評價對象的實際情況、年級段特點、評價導向而設定。必須借指標引導義務教育階段教育面向全體學生,關愛后進生。因為在實際教學工作中,劃線邊緣在哪里,校長和教師就會關注哪里的邊緣生。由于市縣層面都沒有能力做等值處理,筆者結合經驗和判斷,對不同年級段優秀率和后進率提出了劃線建議(如表1)。低年級關注后進生,高年級適當關注優生。
2.閾值確定
閾值大小由評價主體依據數據模擬約定,閾值設置必須科學而有藝術,能讓較多的評價對象達成“進步”,發揮評價的激勵功能和促進功能。校際學業成績發展不均衡的縣市區,閾值要大一些,校際學業成績發展較均衡的縣市區,閾值要小一些。確定閾值有兩種辦法。
第一種是基于目標管理理念的“測前確定法”。如,提前一學年規定:T標準分變化在正負0.5以內為穩定,提高0.5及以上為進步,下降0.5及以上為退步;優秀率變化在正負3%以內為穩定,增加3%及以上為進步,下降3%及以上為退步;后進率變化在3%以內為穩定,下降3%及以上為進步,增加3%及以上為退步。這種方法,目標導向性和促進性都非常明確,學校可以依據閾值計算出本校三個指標的目標值,再基于目標值研究針對性策略和實施路徑。
第二種是基于績效管理理念的“測后確定法”。每次測評后,基于測評數據采取聚類分層法或經驗判斷法,確定各指標的閾值。采用這種辦法,不同指標的閾值可能不一樣,不同時期的閾值也會不一樣。聚類分層法有較強的科學性,特別是從統計學層面把進步退步的閾值確定出來,能判斷出有無明顯的統計學差異。測后公布閾值,學校也可以自己計算驗證自己的增值,體現評價的透明度和公平公正性。
3.階梯賦分
通常,按增值情況分為進步、穩定和退步三個階梯,模型如表2。指標數值變化在某一個閾值內,定義為“穩定”;優于等于閾值上限,定義為“進步”;劣于等于閾值下限,定義為“退步”。通常,進步賦分3分,穩定賦分1分,退步賦分0分。各級階梯賦分值大小和差距體現評價主體的質量價值觀和關注點。
例如,初三年級段總分的三個指標都進步可以得9分,都退步則0分,該年級段增值分分布在0—9分范圍內;如果初中學校三個年級段都有增值數據,那全校的增值分就分布在0—27分范圍內。
4.績效評定
在義務教育階段,對學業成績退步嚴重的學校必須加以問責和批評,對進步大的學校應加以表彰。僅以中考數據為例:
三個指標都穩定、“一個指標進步、一個指標穩定、一個指標退步”的學校增值分為3分,可以認定該學校本學年學業成績與往年差不多,不受褒獎。
三個指標都退步的學校增值分為0分,“一個指標穩定、兩個指標退步”的學校增值分為1分,“兩個指標穩定、一個指標退步”、“”兩個指標退步、一個指標進步”的學校的增值分為2分,這些增值分等于或低于2分的學校具有退步的現象,可以評定為問責對象。
“兩個指標進步、一個指標退步”、“兩個指標穩定、一個指標進步”的學校增值分為4分,表明這些學校成績有進步現象。如果增值分大于4分,表明學校成績進步較大。增值分大于等于4分的學校可以列為表彰對象。
表彰和問責對象的評定,既要根據增值分大小,也要根據實際情況和行政需求。建議受表彰的學校數多于30%,問責學校數低于20%。區域整體成績進步,表彰學校數可以多一些,問責學校可以少一些,反之亦然。
三、簡約式階梯型增值性評價案例分析
下列三個案例,都是基于相同的兩年中考數據。T標準分閾值都設為0.5,優秀率和后進率閾值都設為3%。數據發現,評定結果對不同生源層次、不同規模學校都具有一定的區分度,表明了本模型具有實用價值。
案例1:規模較小、成績優秀、成績有進步的區域
A區縣有10所初中,2337名學生,校際差異明顯。當年中考后進率下降1%,T標準分提升0.58,優秀率提高了2.8%,進步較大;而且,各指標在溫州市各區縣中名列前茅。增值分數據如下頁表3。
由表3可知,增值分5分及以上的學校有6所,占60%,可以表彰,分別可以評定為進步顯著和進步兩個檔次;等于低于2分的學校4所,可以問責,也可以問責1分及以下的3所學校。
案例2:規模中等、成績中等、成績穩定的區域
B區縣有22所初中,4929名學生。后進率15.6%,比往年下降1.4%;T均分為71.4,比往年提高0.35;優秀率19.3%,比往年下降0.6%。區域成績與全市平均成績接近,與往年比較基本穩定。增值分數據如表4。
由表4可知:增值分4分及以上有9所,可以表彰,表彰對象可以分為進步顯著和進步兩個檔次;2分及以下有10所,可以問責,也可以只問責1分及以下的7所學校。
案例3:規模較大、成績較弱、成績退步的區域
C區縣為學生規模較大的縣,有41所初中,當年中考學生數9087名。后進率高出市均6.5%,比往年增多了3.1%;T標準分低于市均3.67分,比往年下降1.24分,優秀率低于市均9.0%,比往年下降2.4%。從區域層面看該區縣中考成績在下降,但是教育行政部門也必須每年一度對學校學業成績做出合理的評價。
按學校規模將學校分為三類,年級段學生數300及以上為較大規模學校,年級段學生數101—299為一般規模學校,年級段100及以下為較小規模學校。按學校成績劃分為三類,T標準分高于或等于縣均66.33為成績較高學校,T標準分低于66.33高于等于60.0為成績一般學校,T標準分低于60為成績較低學校。相關數據如表5。
學校數較大的區縣要依據“同類可比”原則將學校做個分類分組,通常根據辦學水平或學校規模進行分類,根據數據模擬,各類各組學校的增值分都有較好的區分度,能很好地把學校進步成績分成三個層次,尤其能把優質學校(平均分較高)也分成三等。根據增值分數據分布情況,可以表揚4分及以上學校,問責0—1分的學校;如此獲得表彰的學校占24.4%,問責學校占56.1%,數量也合適。
四、簡約式階梯型增值性評價特點分析
1.可接受性強
北京市教育督導與教育質量評價中心研究結果與國際項目研究結論都表明,基于增值性評價的學校增值分與合格率、優秀率、得分率的關系變化一致。本模型的指標由后進率、標準分和優秀率構成,也具有一定的科學性;實踐也表明,大家認同這個指標結構。由于絕大部分初中學校基本上采取轄區招生,教育行政部門可以規范招生制度穩定生源情況,也就是說學校生源入口情況基本穩定。小學畢業考是一個低區分度的考試,中考是一個中等區分度的考試,兩個考試的科目結構、學科能力結構和性質功能很不等價,不符合增值評價的要求;而前后兩次都采用中考數據,具有等價性,而且,用這兩次中考數據做比較也是對傳統的沿襲。從案例分析來看,不同層次、不同規模學校都有獲表彰和問責的可能,而且比例也適當;優質學校獲得獎勵的機會也不少,薄弱學校獲得表彰的機會也不會很多,不會出現“有利于薄弱學校,不利于優質學校”的現象。本模型指標清晰、突出關鍵,計算簡單、操作性強,各校都可以自己做預測和驗算。等第劃線、閾值確定、階梯賦分和績效評定都比較靈活,各縣(市、區)可以根據監測數據實際情況和評估需求做微調修正。
2.導向性強
基于大量的數據驗證,后進率指標的進步,會明顯促進T標準分的提升,也會促進優秀率的提升。很多案例都表明,后進率明顯縮小的學校,增值分較大,容易獲得表彰;后進率明顯變大的學校,增值分較小,容易被問責。評價指標如此設計,會激發學校和教師更加關注后進生的轉化工作,會采取“抓后頭,促中間,帶前頭”管理策略;有利學校端正辦學方向,優化辦學行為。
3.促進性強
由于采用增值性評價,而且進步與穩定分值區分較大,體現了發展性評價,讓所有學校都意識到要超越自己,不能安于現狀,能激發所有校長和教師的上進心。如果能夠結合學業負擔評價,就會更完善。目前,縣(市、區)完全有能力通過問卷調查或監測學生的學業負擔,把學業負擔情況作為績效考核的前置條件,表彰那些“正增值、低負擔”的學校,問責“負增值、高負擔”的學校。
4.診斷性強
借三個指標的變化值,可以粗略診斷學業成績的變化成因,有利于反思辦學理念和教育教學管理策略。例如,由表6的某校增值分分布可知:從學生角度分析,該校后進生的轉化工作很有成效,但是優生培養有問題;從學科角度分析,該校數學英語的進步大、貢獻大,社會思品學科退步明顯;還可以發現學科存在問題之間的差異。
本評價模型,適合初中和小學,適合不同學段不同年級;適合總分也適合學科,適合縣(市、區)層面,也適合學校層面;簡約實用,具有一定的公平性和客觀性;突出評價的導向性、促進性和診斷性,淡化升學評價,突出發展性評價。能引導學校和教師面向全體、關注每一個學生,不讓一個學生掉隊。
收稿日期:2016-12-08
作者簡介:王旭東,溫州市教育評估院(浙江溫州,325000)質量評價科科長,中學高級教師,浙江省基礎教育課程改革專業指導委員會委員。
責任編輯:楊孝如