在學(xué)校對(duì)教學(xué)工作的評(píng)價(jià)體系中,教學(xué)質(zhì)量的評(píng)價(jià)是至關(guān)重要的一個(gè)部分,其核心內(nèi)容是學(xué)生的學(xué)業(yè)成績。評(píng)價(jià)辦法一般把學(xué)生考試的原始分?jǐn)?shù)的平均分?jǐn)?shù)、合格率、優(yōu)秀率作為評(píng)價(jià)指標(biāo)去評(píng)價(jià)教師的教學(xué)質(zhì)量和學(xué)生的學(xué)習(xí)效果。但是,合格率、優(yōu)秀率是靜態(tài)指標(biāo),即合格率是測(cè)試分?jǐn)?shù)≥60分的測(cè)試人數(shù)所占總測(cè)試人數(shù)的百分比,優(yōu)秀率是測(cè)試分?jǐn)?shù)≥90分的測(cè)試人數(shù)所占總測(cè)試人數(shù)的百分比,一是受試卷難度系數(shù)、學(xué)科之間差異性的影響,合格率、優(yōu)秀率的制定缺乏科學(xué)性;二是合格率、優(yōu)秀率及其提高率反映不出低分率的變化情況,不能夠全面評(píng)價(jià)教學(xué)質(zhì)量。平均分?jǐn)?shù)同樣受試卷難度系數(shù)的影響,而且反映不出學(xué)生之間成績的差異情況。因此把它們作為指標(biāo)去評(píng)價(jià)教師的教學(xué)質(zhì)量和學(xué)生的學(xué)習(xí)效果,難以做到科學(xué)合理。筆者曾多次參加上海、浙江高考改革的學(xué)習(xí)培訓(xùn),結(jié)合自己多年探索認(rèn)為,要解決這個(gè)難題,必須要運(yùn)用統(tǒng)計(jì)學(xué)理論知識(shí),具體講,就是運(yùn)用T分?jǐn)?shù)來評(píng)價(jià)教學(xué)質(zhì)量。
2018年,我省將全面實(shí)施新高考。學(xué)生除了參加語文、數(shù)學(xué)、外語三科必考科目之外,還要從物理、化學(xué)、生物、思想政治、歷史、地理六門學(xué)科中任選三科參加選考,這樣在學(xué)生的學(xué)習(xí)過程中就會(huì)出現(xiàn)20種不同的選擇情況。針對(duì)種種不同的組合情況,如何用一把尺子去衡量學(xué)生的學(xué)習(xí)情況呢?在新高考模式下,由于T分?jǐn)?shù)消除了學(xué)科之間的差異,只需將20種不同的六科的測(cè)試成績統(tǒng)一轉(zhuǎn)換為T分?jǐn)?shù),再匯總排序,就能夠?qū)W(xué)生的學(xué)習(xí)情況作出合理的評(píng)價(jià)。
T分?jǐn)?shù)是根據(jù)統(tǒng)計(jì)學(xué)原理,按一定規(guī)則把原始分?jǐn)?shù)轉(zhuǎn)化為具有相同意義、相同單位和共同參照點(diǎn),并能刻畫考生分?jǐn)?shù)在總體中的位置。
就學(xué)生個(gè)體成績而言,比如,某班兩名學(xué)生張三和李四,在同一次數(shù)學(xué)測(cè)試中,張三得90分,李四得75分,我們可以判斷出張三比李四考得好。這是因?yàn)閺埲屠钏牡臄?shù)學(xué)分?jǐn)?shù)有著共同的參照點(diǎn),即這個(gè)年級(jí)的數(shù)學(xué)平均分?jǐn)?shù)。
又如,在某次測(cè)試中,張三的數(shù)學(xué)測(cè)試成績是90分,而語文測(cè)試成績是75分,由于這兩科的測(cè)試成績的參照點(diǎn)不同,張三同學(xué)這兩科的成績是不好比較的。
再如,張三這次數(shù)學(xué)測(cè)試成績是75分,上次數(shù)學(xué)測(cè)試成績是90分,同樣是由于這兩次測(cè)試成績的參照點(diǎn)不同,他的這兩次成績也是不好比較的。
在實(shí)際工作中,我們常常會(huì)碰到這種情況:某一位同學(xué)某兩次或某兩科測(cè)試成績相同,參照點(diǎn)即年級(jí)平均分?jǐn)?shù)也相同,但是他的這兩次或這兩科成績?cè)谀昙?jí)中的位置是不一定相同的,當(dāng)然他的這兩次或兩科的測(cè)試成績也是不好去比較的。
根據(jù)T分?jǐn)?shù)的概念,以上張三的成績是能夠比較的。下面介紹幾個(gè)統(tǒng)計(jì)學(xué)的基本概念。
1.平均分?jǐn)?shù):是用一組學(xué)生成績的總和除以學(xué)生人數(shù)所得的商。它反映數(shù)據(jù)的集中趨勢(shì),即學(xué)生成績的平均水平,也是我們?cè)诒容^數(shù)據(jù)時(shí)選取的參考點(diǎn)。

在Excel中的函數(shù)為AVERAGE。
如:50、65、87、103、45 這組數(shù)據(jù)的平均分?jǐn)?shù)是:

2.標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)偏差):是方差的算術(shù)平方根。是一組被測(cè)試的全體數(shù)據(jù)與平均值差的一個(gè)平均數(shù)。它反映被測(cè)試的全體數(shù)據(jù)相對(duì)于平均分?jǐn)?shù)的離散程度。
計(jì)算公式:

在Excel中的函數(shù)為 STDEVP。
如:50、65、87、103、45 這組數(shù)據(jù)的標(biāo)準(zhǔn)差是:

在實(shí)際評(píng)價(jià)中,平均分?jǐn)?shù)不能夠體現(xiàn)被測(cè)群體的測(cè)試水平。
如:甲、乙兩個(gè)班,每班各兩人,某次數(shù)學(xué)考試成績分別為:甲班:50、70;乙班:30、90。
它們的平均分?jǐn)?shù)都是60分。按照新課程關(guān)注每一個(gè)學(xué)生的教學(xué)理念,你能比較這兩個(gè)班這次數(shù)學(xué)成績的優(yōu)劣嗎?
可以求得,甲班標(biāo)準(zhǔn)差是10分,乙班標(biāo)準(zhǔn)差是30分。甲、乙兩班的標(biāo)準(zhǔn)差說明甲班成績差距很小(太過集中),乙班成績差距很大(兩極分化)。
標(biāo)準(zhǔn)差越小,說明分?jǐn)?shù)差距越小,越集中于平均分?jǐn)?shù);反之,標(biāo)準(zhǔn)差越大,說明分?jǐn)?shù)差距越大,越偏離于平均分?jǐn)?shù)。
標(biāo)準(zhǔn)差小,說明學(xué)生之間差距小,有利于教學(xué)工作下一步的整體推進(jìn),但是也不能過于偏小而使學(xué)生成績過于集中以至沒有拔尖學(xué)生;標(biāo)準(zhǔn)差偏大,說明教學(xué)出現(xiàn)兩極分化現(xiàn)象,不利于教學(xué)工作的進(jìn)一步開展,也是我們?cè)诋?dāng)今新課程教學(xué)理念指導(dǎo)下所不愿意看到的現(xiàn)象。
為了直觀,我們?cè)诜治霰粶y(cè)群體的成績時(shí),往往要把他們的成績分布情況以直方圖的形式呈現(xiàn)出來(右上圖所示)。橫坐標(biāo)表示各分?jǐn)?shù)段,通常以每10分或5分為一個(gè)分?jǐn)?shù)段;縱坐標(biāo)表示相應(yīng)分?jǐn)?shù)段的人數(shù)的頻數(shù),即某分?jǐn)?shù)段的人數(shù)所占被測(cè)群體的百分比再除以該分?jǐn)?shù)段的寬度。直方圖與橫坐標(biāo)所圍面積為1。被測(cè)群體越多,即樣本空間越大,分?jǐn)?shù)段劃分得越小,直方圖就越接近正態(tài)分布,被測(cè)群體的平均分?jǐn)?shù)及成績分布就越接近真實(shí)。


樣本空間非常大的學(xué)生成績分布,如一個(gè)市的學(xué)生中考成績、高考成績,基本是呈正態(tài)分布的。(上右圖所示圖中:μ表示平均分?jǐn)?shù),σ表示標(biāo)準(zhǔn)差)。相對(duì)于平均分?jǐn)?shù):
在μ到μ+σ范圍內(nèi)(即一個(gè)標(biāo)準(zhǔn)差范圍內(nèi))為中等偏上學(xué)生;
在μ+σ到μ+2σ范圍內(nèi)(即一到兩個(gè)標(biāo)準(zhǔn)差范圍內(nèi))為良好學(xué)生;
在μ+2σ到μ+3σ范圍內(nèi)(即兩到三個(gè)標(biāo)準(zhǔn)差范圍內(nèi))為極好學(xué)生;
極好學(xué)生(μ+2σ到μ+3σ范圍內(nèi))與極差生(μ-3σ到μ-2σ范圍內(nèi))占比很小,中等學(xué)生(μ-σ到μ+σ范圍內(nèi))占比很大。
從圖中我們不僅可以得到這些成績的平均值,而且通過幾個(gè)標(biāo)準(zhǔn)差之間的面積百分比可以得到某位考生在全體考生中所處的位置,這樣就能夠準(zhǔn)確評(píng)價(jià)這位考生在這次考試中的成績水平。
3.Z分?jǐn)?shù)(標(biāo)準(zhǔn)分?jǐn)?shù)):是以標(biāo)準(zhǔn)差為單位來度量分?jǐn)?shù)與參考點(diǎn)平均分?jǐn)?shù)之間的離差,即分?jǐn)?shù)距平均分?jǐn)?shù)相差了多少個(gè)單位。
某學(xué)生Z分?jǐn)?shù)的計(jì)算公式:
x:某組學(xué)生中某位學(xué)生的原始分?jǐn)?shù);
:該組學(xué)生原始平均分?jǐn)?shù);
σ:該組學(xué)生原始分?jǐn)?shù)標(biāo)準(zhǔn)差。
由于它是由原始分?jǐn)?shù)通過線性變換轉(zhuǎn)變而來的,所以它的分布也呈正態(tài)分布(如下圖)。

通過分析公式和圖像可以得到:
(1)如果原始數(shù)據(jù)大于平均分?jǐn)?shù),則Z值為正;如果原始數(shù)據(jù)小于平均分?jǐn)?shù),則Z值為負(fù);如果原始數(shù)據(jù)等于平均分?jǐn)?shù),則Z值為零。(2)任何一組數(shù)據(jù)的Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1,平均分?jǐn)?shù)為0,標(biāo)準(zhǔn)差范圍在-3~+3之間。(3)因?yàn)閰⒄拯c(diǎn),即平均分?jǐn)?shù)相同,標(biāo)準(zhǔn)差相同,相同成績所處的位置相同,所以用Z分?jǐn)?shù)表示的樣本之間可以進(jìn)行加減運(yùn)算。即,不同學(xué)科、不同時(shí)期的考試分?jǐn)?shù)可以進(jìn)行比較。
但是,Z分?jǐn)?shù)有它的不足之處,即有小數(shù)出現(xiàn),且有正負(fù)之分,不易理解。
4.T分?jǐn)?shù):T分?jǐn)?shù)是Z分?jǐn)?shù)的變換形式,它同樣以平均分?jǐn)?shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為度量單位,是Z分?jǐn)?shù)經(jīng)過線性變換的一種標(biāo)準(zhǔn)分,與Z分?jǐn)?shù)的分布形式一樣呈正態(tài)分布。T分?jǐn)?shù)在形式上與百分制相同,人們更容易接受。
其變換公式為:T=α+β×Z
式中:α為基分,通常設(shè)為75,β為擴(kuò)大系數(shù),通常設(shè)為10。
公式變?yōu)椋篢=75+10Z
變換結(jié)果是:被測(cè)群體的平均分為75分,度量單位是標(biāo)準(zhǔn)差的10倍,即標(biāo)準(zhǔn)差為10。
如下圖中的正態(tài)分布曲線,平均分?jǐn)?shù)μ=75,標(biāo)準(zhǔn)差σ=10,它的最高分約為105分(+3倍標(biāo)準(zhǔn)差),最低分約為45分(-3倍標(biāo)準(zhǔn)差)。它跟Z分?jǐn)?shù)一樣不受學(xué)科差異、考試難度和評(píng)分標(biāo)準(zhǔn)的寬嚴(yán)情況的影響,可以客觀地反映被測(cè)個(gè)體在群體中的相對(duì)位置,因此可以對(duì)其作出客觀的評(píng)價(jià)。

下表是我校某年級(jí)某班的某次數(shù)學(xué)學(xué)科的考試成績從原始分?jǐn)?shù)到T分?jǐn)?shù)的分?jǐn)?shù)段/人數(shù)表。其中,考試人數(shù)為216人,原始分?jǐn)?shù)中最高分83、最低分22,原始分?jǐn)?shù)平均分是51、標(biāo)準(zhǔn)差是11.2。
從以上圖表中可以看到,對(duì)于一個(gè)學(xué)校中的某個(gè)年級(jí)學(xué)生成績這種樣本空間比較小的數(shù)據(jù)分布,往往不服從正態(tài)分布,但是通過從分布很寬的原始分?jǐn)?shù)分布通過Z分?jǐn)?shù)轉(zhuǎn)換壓縮到分布很窄的Z分?jǐn)?shù)分布,學(xué)生分?jǐn)?shù)的分布則接近于正態(tài)分布。為了使問題簡單化,可以近似地認(rèn)為服從正態(tài)分布。進(jìn)一步對(duì)Z分?jǐn)?shù)進(jìn)行擴(kuò)大,轉(zhuǎn)換為T分?jǐn)?shù),則更符合人們對(duì)于百分制分?jǐn)?shù)的認(rèn)識(shí)習(xí)慣。

原始分?jǐn)?shù)的分?jǐn)?shù)段/人數(shù)表

Z分?jǐn)?shù)的分?jǐn)?shù)段/人數(shù)表

T分?jǐn)?shù)的分?jǐn)?shù)段/人數(shù)表

(Z分?jǐn)?shù)分布圖)

(原始分?jǐn)?shù)分布圖)

(T分?jǐn)?shù)分布圖)
1.通過橫向比較可以對(duì)學(xué)生不同學(xué)科的學(xué)習(xí)情況作出合理的評(píng)價(jià)。

原始分?jǐn)?shù) T分?jǐn)?shù)語文 數(shù)學(xué) 英語 總分 語文 數(shù)學(xué) 英語 總分張磊 90 82 82 254 96.7 79 86.3 86.8徐慧 88 95 71 254 95 92 79 86.8年級(jí)平均分 64 78 65 207學(xué)生姓名年級(jí)標(biāo)準(zhǔn)差 12 10 15 40
從這個(gè)例子可以看到,張磊的數(shù)學(xué)和英語的原始分?jǐn)?shù)相同,但轉(zhuǎn)化為T分?jǐn)?shù),張磊的英語分?jǐn)?shù)要比他的數(shù)學(xué)分?jǐn)?shù)高,說明張磊的英語要好于數(shù)學(xué)。同樣,徐慧的原始數(shù)學(xué)分?jǐn)?shù)要比她的語文原始分?jǐn)?shù)高,但轉(zhuǎn)化為T分?jǐn)?shù)后她的數(shù)學(xué)T分?jǐn)?shù)反而比她的語文T分?jǐn)?shù)低,這說明徐慧同學(xué)的語文要好于數(shù)學(xué)。
另外與總分相比,張磊的語文T分?jǐn)?shù)要高于他的總分T分?jǐn)?shù),而他的數(shù)學(xué)T分?jǐn)?shù)要低于他的總分T分?jǐn)?shù),說明張磊的語文相對(duì)好一些,數(shù)學(xué)則差一些。
2.通過縱向比較可以對(duì)學(xué)生相同學(xué)科的學(xué)習(xí)情況作出合理的評(píng)價(jià)。

原始分?jǐn)?shù) T分?jǐn)?shù)語文入學(xué) 語文本次 語文入學(xué) 語文本次徐慧 94 88 91 95年級(jí)平均分 78 64年級(jí)標(biāo)準(zhǔn)差 10 12學(xué)生姓名
上表是徐慧同學(xué)的兩次語文測(cè)試成績比較。從原始分?jǐn)?shù)來看,徐慧的語文入學(xué)測(cè)試分?jǐn)?shù)要比她的這次測(cè)試分?jǐn)?shù)高,說明她的語文成績退步了,但是轉(zhuǎn)換為T分?jǐn)?shù)后,她的語文成績反而是進(jìn)步了。
3.通過縱橫比較可以對(duì)同學(xué)科不同教師的教學(xué)效果作出合理的教學(xué)評(píng)價(jià)。
下表是某屆高一年級(jí)兩次考試的成績統(tǒng)計(jì)表。
就原始分?jǐn)?shù)而言,對(duì)于同一次測(cè)試橫向比較來看,這兩次的測(cè)試成績G01班都要好于G02班;對(duì)于這兩次測(cè)試縱向比較來看,這兩個(gè)班的一測(cè)成績都沒有入學(xué)成績好,都在退步。但是轉(zhuǎn)換為T分?jǐn)?shù)后,G02班的數(shù)學(xué)成績進(jìn)步了50%,而G01班的數(shù)學(xué)成績退步了20%,足以說明G02班的教學(xué)效果要好于G01班。

班次 高一數(shù)學(xué)入學(xué)成績 高一數(shù)學(xué)第一次測(cè)試成績 兩次成績比較G01 77.1 88.2 76.9 86.3 -0.2 -1.9 G02 70.5 78.3 71 76.2 0.5 -2.1年級(jí) 75 85 15 75 83 17 0 -2 T分均分原始均分標(biāo)準(zhǔn)差T分均分原始均分標(biāo)準(zhǔn)差T分均分原始均分
4.利用教學(xué)班T分?jǐn)?shù)的平均分和標(biāo)準(zhǔn)差可以調(diào)控教學(xué)班的學(xué)科整體學(xué)習(xí)情況。
對(duì)于年級(jí)這個(gè)被測(cè)群體,各學(xué)科學(xué)生T分?jǐn)?shù)的平均分?jǐn)?shù)都是75分,標(biāo)準(zhǔn)差都是10分。極好生分布在75+2*10至75+3*10之間,即95分至105分之間;極差生分布在75-2*10至75-3*10之間,即45分至55分之間。根據(jù)年級(jí)學(xué)生的T分?jǐn)?shù)可以得到各教學(xué)班的T分?jǐn)?shù)的平均分?jǐn)?shù)和標(biāo)準(zhǔn)差。各教學(xué)班T分?jǐn)?shù)的平均分?jǐn)?shù)一般在65分至85分之間,如果某教學(xué)班的T分?jǐn)?shù)的平均分μ在75分至85分之間,為了避免成績兩極分化和過于集中,該教學(xué)班的標(biāo)準(zhǔn)差σ應(yīng)該控制上下限,即:μ-3σ≥45和μ+2σ≥95(μ=75時(shí)不等式取等號(hào));如果某教學(xué)班的T分?jǐn)?shù)的平均分μ在65分至75分之間,則該教學(xué)班的標(biāo)準(zhǔn)差σ不應(yīng)該控制上限,而應(yīng)控制下限,即:μ+2σ≥85(μ=75時(shí)不等式取等號(hào))。教師依據(jù)教學(xué)班T分?jǐn)?shù)的平均分和標(biāo)準(zhǔn)差,則能夠?qū)虒W(xué)班學(xué)生的整體學(xué)習(xí)情況作出調(diào)控策略。
在學(xué)校教學(xué)工作中,運(yùn)用T分?jǐn)?shù)進(jìn)行教學(xué)評(píng)價(jià),能夠真實(shí)反映學(xué)生學(xué)習(xí)和教師教學(xué)存在的問題,尤其是教師一段時(shí)期以來的教學(xué)情況,特別有助于教師調(diào)整教學(xué)策略和改進(jìn)教學(xué)方法,更加有助于學(xué)校提高教學(xué)質(zhì)量。