唐 興 肖燃
教師績(jī)效評(píng)價(jià)是教師績(jī)效管理的一個(gè)重要環(huán)節(jié),是指學(xué)校在一定時(shí)期內(nèi),根據(jù)績(jī)效管理的需要,針對(duì)教師承擔(dān)的工作,運(yùn)用科學(xué)的方法,對(duì)教師工作結(jié)果和工作表現(xiàn)進(jìn)行的評(píng)價(jià),并根據(jù)評(píng)價(jià)結(jié)果做出各種人事管理決定,如教師的薪酬、職務(wù)職稱(chēng)調(diào)整等[1]。 教師績(jī)效既包括與工作目標(biāo)相關(guān)的結(jié)果, 也包括教師工作的過(guò)程和行為,其中教育教學(xué)結(jié)果尤其是學(xué)生成績(jī)相對(duì)客觀、可量化,在績(jī)效評(píng)價(jià)過(guò)程中受到的關(guān)注較多。 教師績(jī)效評(píng)價(jià)關(guān)乎教師利益和學(xué)校師資隊(duì)伍建設(shè),直接影響教師工作行為變化與學(xué)校教學(xué)質(zhì)量。
目前我國(guó)中學(xué)教師績(jī)效評(píng)價(jià)普遍存在不夠科學(xué)、客觀的問(wèn)題,導(dǎo)致中學(xué)教師對(duì)績(jī)效評(píng)價(jià)滿意度不高,影響了工作積極性,在一定程度上影響了中學(xué)教育教學(xué)工作質(zhì)量的提升。 由于各科難度和區(qū)分度不同,各個(gè)學(xué)科的分?jǐn)?shù)分布不相同,分?jǐn)?shù)不在同一個(gè)量尺上,所以需要尋找同一個(gè)量尺,以便比較。 近年來(lái)中學(xué)陸續(xù)進(jìn)行教育均衡、 中高考改革等一系列教育教學(xué)改革, 原有的教師教學(xué)質(zhì)量評(píng)價(jià)方法亟需適應(yīng)新的改革趨勢(shì)進(jìn)行改進(jìn)完善。 本研究基于學(xué)校管理實(shí)際需求, 解決當(dāng)前教學(xué)質(zhì)量評(píng)價(jià)中使用學(xué)生成績(jī)計(jì)算教學(xué)增值時(shí)存在的典型問(wèn)題, 有效應(yīng)對(duì)區(qū)域均衡、中高考改革等教育教學(xué)改革實(shí)際情況,使教學(xué)質(zhì)量評(píng)價(jià)體系更具科學(xué)性、公平性;探索出相對(duì)自動(dòng)化的評(píng)價(jià)途徑,使學(xué)校實(shí)踐操作更簡(jiǎn)便易行。
本方法評(píng)價(jià)對(duì)象為具有考試成績(jī)科目的教師,并且適用于采取以年級(jí)為評(píng)價(jià)單元的管理模式,即在同一個(gè)年級(jí)內(nèi)對(duì)各學(xué)科教師進(jìn)行評(píng)價(jià)。 要計(jì)算教學(xué)增值,首先需要收集兩次考試成績(jī),以一學(xué)年為評(píng)價(jià)周期為例, 要保證第一次考試成績(jī)代表該學(xué)年起點(diǎn)成績(jī),第二次考試成績(jī)代表該學(xué)年終點(diǎn)成績(jī),盡量保證兩次考試內(nèi)容充分體現(xiàn)該階段教學(xué)和學(xué)習(xí)內(nèi)容,并且在試題難度、結(jié)構(gòu)等方面盡可能等質(zhì),評(píng)分標(biāo)準(zhǔn)盡可能一致。
在同一個(gè)年級(jí)內(nèi)部, 所有學(xué)生均參加各個(gè)學(xué)科的考試,使用標(biāo)準(zhǔn)分?jǐn)?shù)統(tǒng)一分?jǐn)?shù)量尺。
1. 如果各個(gè)科目為全年級(jí)考生參加考試, 考試人數(shù)相同,并且其分布近似正態(tài)分布,通過(guò)將分?jǐn)?shù)標(biāo)準(zhǔn)化為 Z 分?jǐn)?shù),即用[(原始分-平均值)/標(biāo)準(zhǔn)差]。 標(biāo)準(zhǔn)化后各科各次考試分?jǐn)?shù)平均值均為0, 標(biāo)準(zhǔn)差均為1,處在同一個(gè)量尺上。 在這個(gè)量尺上,語(yǔ)文第一次考試的1 分和第二次考試的1 分是等價(jià)的, 語(yǔ)文的1 分和數(shù)學(xué)的1 分是等價(jià)的。
2. 記標(biāo)準(zhǔn)化后某科起點(diǎn)成績(jī)?yōu)閆科1,終點(diǎn)成績(jī)?yōu)閆科2, Z科1和Z科2是可比較的, 計(jì)算每名考生第二次成績(jī)減第一次成績(jī)的增值,即P科=Z科2-Z科1。 由于各科目的分?jǐn)?shù)可比較,所以語(yǔ)文成績(jī)的增值P語(yǔ)和數(shù)學(xué)成績(jī)的增值P數(shù)也是可比較的。
3. 以班級(jí)為單位,計(jì)算P科的平均值,得到班級(jí)平均增值。
4. 根據(jù)教師所教班級(jí), 計(jì)算教師所教所有班級(jí)的平均增值,得到教師教學(xué)增值。
文理分科和高考改革的情況下,除語(yǔ)文、數(shù)學(xué)、英語(yǔ)外, 其他科目的考生人數(shù)不同, 目前全國(guó)已有14 個(gè)?。ㄖ陛犑校┻M(jìn)入了高考改革階段,本研究以高考改革后的情況進(jìn)行研究。 高考改革后,語(yǔ)文、數(shù)學(xué)、英語(yǔ)三個(gè)科目為全年級(jí)學(xué)生參加考試, 考試人數(shù)相同,其教學(xué)質(zhì)量分?jǐn)?shù)計(jì)算方法使用標(biāo)準(zhǔn)分?jǐn)?shù)即可,但物理、化學(xué)、生物、歷史、地理、政治為選考科目,考生選擇任意三科,每科考生人數(shù)不同、考生組成不同,并具有對(duì)應(yīng)的教學(xué)班級(jí)。 如選考物理的450 人,選考政治的100 人,如果選考科目仍然使用標(biāo)準(zhǔn)分,相當(dāng)于認(rèn)為將不同考生群體的能力分布變?yōu)橄嗤?,?50 人的 “物理” 能力分布和 100 人的 “地理” 能力分布相同,這顯然不合理,故需要對(duì)選考科目分?jǐn)?shù)進(jìn)行校準(zhǔn),從而實(shí)現(xiàn)各學(xué)科分?jǐn)?shù)可比較。 目前大量研究關(guān)注選考科目分?jǐn)?shù)調(diào)整的問(wèn)題, 本文基于科學(xué)性和實(shí)踐操作易行的原則, 根據(jù)溫忠麟提出的分?jǐn)?shù)校準(zhǔn)方法[2],使用語(yǔ)文、數(shù)學(xué)、英語(yǔ)對(duì)選考的六科進(jìn)行分?jǐn)?shù)校準(zhǔn),然后計(jì)算教師教學(xué)質(zhì)量分?jǐn)?shù)。
1. 將各學(xué)科的分?jǐn)?shù)標(biāo)準(zhǔn)化為Z 分?jǐn)?shù),即用[(原始分-平均值)/標(biāo)準(zhǔn)差],標(biāo)準(zhǔn)化后各科各次考試分?jǐn)?shù)平均值均為0,標(biāo)準(zhǔn)差均為1,處在同一個(gè)量尺上,在這個(gè)量尺上,語(yǔ)文、數(shù)學(xué)、英語(yǔ)第一次考試中的1 分和第二次考試的1 分是等價(jià)的,語(yǔ)文、數(shù)學(xué)、英語(yǔ)三科分?jǐn)?shù)也是等價(jià)的。 標(biāo)準(zhǔn)化后的分?jǐn)?shù)記為Z科(為作區(qū)分,后文中選考科目記為Zk科)。
但由于選考科目考生群體不同, 考生能力分布不同,所以標(biāo)準(zhǔn)化后其分?jǐn)?shù)和語(yǔ)文、數(shù)學(xué)、英語(yǔ)是不等價(jià)的,需要校準(zhǔn)到同一個(gè)量尺上。 校準(zhǔn)的方法是基于選考科目與語(yǔ)文、數(shù)學(xué)、英語(yǔ)三科(合稱(chēng) “基礎(chǔ)科”)之間的相關(guān)性, 根據(jù)選考科目分?jǐn)?shù)統(tǒng)計(jì)校準(zhǔn)的弱假設(shè)[3],可以使用基礎(chǔ)科建立一個(gè)選考科目的分布,該分布和基礎(chǔ)科整體分布一致,即建立[基礎(chǔ)科→選考科目基礎(chǔ)分]的連接,然后通過(guò)選考科目考生群體在此分布中的平均值和標(biāo)準(zhǔn)差對(duì)選考科目分?jǐn)?shù)進(jìn)行校準(zhǔn),即建立[選考科目基礎(chǔ)分→選考科目分?jǐn)?shù)]的連接,使選考科目分?jǐn)?shù)與基礎(chǔ)科三科可比較,從而選考科目各科分?jǐn)?shù)也可比較。
2. 要將選考科目與語(yǔ)文、數(shù)學(xué)、英語(yǔ)聯(lián)系起來(lái),需要建立一個(gè)橋梁, 稱(chēng)為基于基礎(chǔ)科的選考科目基礎(chǔ)分 Xk科(基礎(chǔ))。 將 Zk科作為因變量,Z語(yǔ)、Z數(shù)、Z英為自變量,使用多元線性回歸得到回歸系數(shù),作為基礎(chǔ)科三科成績(jī)合成選考科目基礎(chǔ)分Xk科(基礎(chǔ))的權(quán)重W1、W2、W3。 公式如下:
Xk科(基礎(chǔ))=W1×Z語(yǔ)+W2×Z數(shù)+W3×Z英
其中 Xk科(基礎(chǔ))為該選考科目基礎(chǔ)分,Z語(yǔ)、Z數(shù)、Z英為語(yǔ)文、 數(shù)學(xué)和英語(yǔ)的 Z 分?jǐn)?shù),W1、W2、W3為權(quán)重,不同的k 科不同。 對(duì)于所有的考生都可以計(jì)算其Xk科(基礎(chǔ)),該分?jǐn)?shù)是用于調(diào)整 k 科分?jǐn)?shù)的基礎(chǔ)。 Xk科與Z語(yǔ)、Z數(shù)、Z英的多重相關(guān)系數(shù)等于Zk科和Xk科(基礎(chǔ))的皮爾遜相關(guān)系數(shù),所以Xk科(基礎(chǔ))可以作為Zk科和Z語(yǔ)、Z數(shù)、Z英轉(zhuǎn)換橋梁。
3. 將選考科目基礎(chǔ)分Xk科(基礎(chǔ))重新標(biāo)準(zhǔn)化為Z 分?jǐn)?shù),即:
{Zk科(基礎(chǔ))=[Xk科(基礎(chǔ))-平均值] /標(biāo)準(zhǔn)差}。
4. 計(jì)算選考了k 科的考生群體第3 步中Zk科(基礎(chǔ))的平均值和標(biāo)準(zhǔn)差,記為:Mk科考生(基礎(chǔ))和 Sk科考生(基礎(chǔ))。
5. 通過(guò)使用語(yǔ)文、數(shù)學(xué)、英語(yǔ)建立的橋梁Zk科(基礎(chǔ)), 需要將選考科目分?jǐn)?shù)校準(zhǔn)到基于基礎(chǔ)分的量尺上。
①該公式中的1 和2 指第一次考試成績(jī)和第二次考試成績(jī)。將k 科標(biāo)準(zhǔn)分的平均值校準(zhǔn)到

R是Zk科與Z語(yǔ)、Z數(shù)、Z英的多重相關(guān)系數(shù)(即 k 科與基礎(chǔ)科整體的關(guān)系),也是Zk科和Zk科(基礎(chǔ))的皮爾遜相關(guān)系數(shù)(Zk科與其基礎(chǔ)分之間的關(guān)系),通過(guò)此公式將k 科標(biāo)準(zhǔn)分的平均值和基礎(chǔ)分的平均值建立連接。
②將k 科標(biāo)準(zhǔn)分的標(biāo)準(zhǔn)差校準(zhǔn)到

k 科考生的基礎(chǔ)分方差為 Sk科考生(基礎(chǔ)),Zk科的默認(rèn)方差為1,通過(guò)使用Zk科與其基礎(chǔ)分之間的關(guān)系R 對(duì)二者的方差做了一個(gè)加權(quán)平均,通過(guò)此公式將k科標(biāo)準(zhǔn)分的標(biāo)準(zhǔn)差和基礎(chǔ)分的標(biāo)準(zhǔn)差建立連接。
③使用第①步計(jì)算出的Zk科,和上面計(jì)算出的校準(zhǔn)平均值(基礎(chǔ))和標(biāo)準(zhǔn)差(基礎(chǔ))計(jì)算校準(zhǔn)分?jǐn)?shù),計(jì)算公式如下:

6. 語(yǔ)文、數(shù)學(xué)、英語(yǔ)使用第1 步的Z 分?jǐn)?shù)計(jì)算每個(gè)考生的增值, 用第二次考試的Z 分?jǐn)?shù)減去第一次考試的 Z 分?jǐn)?shù),即 P科=Z科2-Z科1;選考六科使用第 5步的校準(zhǔn)分?jǐn)?shù)計(jì)算每個(gè)考生的增值, 使用第二次考試的校準(zhǔn)分?jǐn)?shù)減去第一次考試的校準(zhǔn)分?jǐn)?shù),即Pk科=①該公式中的1 和2 指第一次考試成績(jī)和第二次考試成績(jī)。。
7. 以教學(xué)班級(jí)為單位(語(yǔ)文、數(shù)學(xué)、英語(yǔ)為行政班級(jí)),計(jì)算 P科(或 Pk科)的平均值,得到教學(xué)班級(jí)平均增值。
8. 根據(jù)教師所教班級(jí), 計(jì)算教師所教所有班級(jí)的平均增值,得到教師教學(xué)增值。
為了驗(yàn)證該方法的適用性, 使用某中學(xué)的實(shí)際數(shù)據(jù)進(jìn)行理論假設(shè)驗(yàn)證,并計(jì)算結(jié)果,將其結(jié)果與該學(xué)校整體教師績(jī)效評(píng)價(jià)體系其他維度指標(biāo)結(jié)果進(jìn)行對(duì)比,探討該方案的實(shí)用性。
通過(guò)結(jié)構(gòu)化訪談, 對(duì)該學(xué)校教師績(jī)效評(píng)價(jià)的困境和難點(diǎn)進(jìn)行調(diào)研,訪談的結(jié)果顯示,該學(xué)校主要問(wèn)題在于使用學(xué)生原始成績(jī)和排名計(jì)算的教師教學(xué)質(zhì)量通過(guò)加權(quán)后, 在整個(gè)教師績(jī)效評(píng)價(jià)體系中起到了決定性作用, 這是由于使用原始成績(jī)和排名沒(méi)有經(jīng)過(guò)分?jǐn)?shù)處理,與其他維度如學(xué)生評(píng)價(jià)教師、教師互評(píng)等的量尺尺度差異較大, 如全校教師教學(xué)質(zhì)量分?jǐn)?shù)極差為5,標(biāo)準(zhǔn)差為1,而學(xué)生評(píng)價(jià)教師的分?jǐn)?shù)極差為1,標(biāo)準(zhǔn)差為0.1,二者在教師績(jī)效評(píng)價(jià)體系中的權(quán)重相當(dāng),教師教學(xué)質(zhì)量分?jǐn)?shù)則起決定性作用,使其他維度無(wú)法發(fā)揮有效作用。 并且使用原始成績(jī)和排名計(jì)算教學(xué)增值本身也存在科學(xué)性問(wèn)題。 針對(duì)該學(xué)校的情況, 使用第二部分的統(tǒng)計(jì)處理方法計(jì)算教師教學(xué)增值,作為教師教學(xué)質(zhì)量維度。 該中學(xué)初中年級(jí)所有學(xué)生均參加各個(gè)科目的考試, 適用于標(biāo)準(zhǔn)分?jǐn)?shù)的評(píng)價(jià)方法, 使用初二年級(jí)的數(shù)據(jù)進(jìn)行驗(yàn)證和計(jì)算結(jié)果;高一和高二年級(jí)將參加高考改革后的高考,即不進(jìn)行文理分科, 而是從六科等級(jí)性考試科目中選擇三科,適用于校準(zhǔn)分?jǐn)?shù)的評(píng)價(jià)方法,使用高二年級(jí)的數(shù)據(jù)進(jìn)行驗(yàn)證和計(jì)算結(jié)果。
使用標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算教學(xué)增值需要滿足分?jǐn)?shù)分布符合正態(tài)分布, 使用初中某年級(jí)五個(gè)科目的兩次考試成績(jī),各科各次成績(jī)的分布基本符合正態(tài)分布,可以使用標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)行計(jì)算。
使用校準(zhǔn)分?jǐn)?shù)計(jì)算教學(xué)增值,語(yǔ)文、數(shù)學(xué)和英語(yǔ)三門(mén)基礎(chǔ)科的分布需要滿足正態(tài)分布, 選考科目與基礎(chǔ)科的多重相關(guān)系數(shù)要在0.3-0.9 之間。 為了驗(yàn)證該學(xué)校是否適合使用校準(zhǔn)分?jǐn)?shù)的評(píng)價(jià)方法, 使用以往多次文理分科的數(shù)據(jù)驗(yàn)證物理、化學(xué)、生物、政治、歷史和地理六科與三門(mén)基礎(chǔ)科的相關(guān)是否穩(wěn)定,結(jié)果顯示:六科與三科基礎(chǔ)科的兩兩相關(guān)基本穩(wěn)定,六科與基礎(chǔ)科的多重相關(guān)穩(wěn)定, 物理與基礎(chǔ)科相關(guān)為0.7,化學(xué)為 0.6-0.7,生物為 0.6-0.7,歷史為 0.4-0.7,地理為0.4-0.5,政治為0.6-0.7。 然后使用高中某年級(jí)選課走班后的數(shù)據(jù)驗(yàn)證也基本符合這種趨勢(shì),說(shuō)明該學(xué)校分?jǐn)?shù)特征符合校準(zhǔn)分?jǐn)?shù)的弱假設(shè), 可以使用該評(píng)價(jià)方法。
使用第二部分的數(shù)據(jù)處理方法, 計(jì)算出該中學(xué)初中某年級(jí)和高中某年級(jí)所有教師的教學(xué)增值分?jǐn)?shù)。 通過(guò)由學(xué)校管理層和年級(jí)部主任參加的座談會(huì)討論驗(yàn)證, 兩個(gè)年級(jí)的教學(xué)增值分?jǐn)?shù)結(jié)果和主觀預(yù)期基本一致。 該中學(xué)初中某年級(jí)教學(xué)增值分?jǐn)?shù)極差(最大值與最小值的差)為0.4,標(biāo)準(zhǔn)差為0.1,高中某年級(jí)教學(xué)增值分?jǐn)?shù)極差為0.8,標(biāo)準(zhǔn)差為0.2,將其與教師績(jī)效評(píng)價(jià)的其他維度如學(xué)生評(píng)價(jià)、教師互評(píng)、管理層評(píng)價(jià)等維度對(duì)比,量尺相當(dāng),可以進(jìn)行比較,這樣可以充分發(fā)揮每一個(gè)維度的作用, 體現(xiàn)該評(píng)價(jià)體系多元評(píng)價(jià)的初衷。 將教學(xué)增值作為教學(xué)質(zhì)量分?jǐn)?shù)應(yīng)用到整個(gè)教師績(jī)效評(píng)價(jià)體系中, 還需要根據(jù)教師績(jī)效總分和各維度權(quán)重對(duì)教學(xué)增值分?jǐn)?shù)進(jìn)行調(diào)整。
本研究從解決目前教師績(jī)效評(píng)價(jià)的難點(diǎn)和關(guān)鍵點(diǎn)的角度, 提出了使用標(biāo)準(zhǔn)分?jǐn)?shù)和校準(zhǔn)分?jǐn)?shù)計(jì)算教師教學(xué)增值作為基于學(xué)生成績(jī)的教學(xué)質(zhì)量評(píng)價(jià)方法,該方法具有理論支撐,同時(shí)也能夠符合應(yīng)用的實(shí)際和需求, 為我國(guó)目前教學(xué)質(zhì)量量化評(píng)價(jià)提供了一條可行途徑。 需要特別指出的是,教師績(jī)效評(píng)價(jià)不能僅關(guān)注于以學(xué)生成績(jī)?yōu)橹鞯慕虒W(xué)結(jié)果, 還應(yīng)該關(guān)注教學(xué)過(guò)程和教師的思想情感等多個(gè)方面, 建立多元的評(píng)價(jià)體系,克服 “唯分?jǐn)?shù)” 的評(píng)價(jià)觀。 評(píng)價(jià)過(guò)程中過(guò)分強(qiáng)調(diào)結(jié)果產(chǎn)出并不能反映教師的實(shí)際投入和真實(shí)績(jī)效,甚至產(chǎn)生短期行為[4]。 在訪談的過(guò)程中,該中學(xué)原有的教學(xué)質(zhì)量評(píng)價(jià)的影響權(quán)重比較大, 確實(shí)導(dǎo)致教師在教學(xué)中過(guò)度關(guān)注學(xué)生成績(jī)的行為。 也有研究指出,教師的工作量、工作質(zhì)量、外顯工作成果和工作資歷等均對(duì)教師分配的公平感有影響, 教師對(duì)自身工作績(jī)效的認(rèn)知是綜合性的[5],所以學(xué)校不能僅使用一種指標(biāo)來(lái)確定教師的績(jī)效, 如果某一種指標(biāo)不合理的權(quán)重或計(jì)算方法導(dǎo)致其占絕對(duì)優(yōu)勢(shì)也會(huì)產(chǎn)生消極的作用。 改進(jìn)中小學(xué)教師評(píng)價(jià)應(yīng)從教師發(fā)展的角度出發(fā),建立多維度的教師績(jī)效評(píng)價(jià)體系,包括教師、學(xué)生、管理層甚至家長(zhǎng)等多元評(píng)價(jià)主體應(yīng)參與其中。 有調(diào)查顯示,在義務(wù)教育學(xué)校里,績(jī)效考核的指標(biāo)設(shè)置、指標(biāo)權(quán)重等問(wèn)題均存在一定分歧,考核辦法得不到絕大部分教師認(rèn)可與肯定[6],所以尤其要讓教師在績(jī)效評(píng)價(jià)中發(fā)揮主體作用,加強(qiáng)績(jī)效評(píng)價(jià)培訓(xùn),增強(qiáng)評(píng)價(jià)程序的透明度, 從而使教師績(jī)效評(píng)價(jià)對(duì)教師形成良好的激勵(lì)機(jī)制,在促進(jìn)教師專(zhuān)業(yè)發(fā)展上發(fā)揮作用,提升教師滿意度,從而提升學(xué)校教育教學(xué)水平。