在教育教學(xué)中,我們總是需要通過一定的測試來檢測學(xué)生的學(xué)習(xí)狀況,通過測驗所直接得到的分?jǐn)?shù),叫原始分?jǐn)?shù)。如下圖,采用原始分?jǐn)?shù)的排名。
原始分?jǐn)?shù)本身意義甚小,因為僅從個別學(xué)生的原始分?jǐn)?shù),我們無法了解他學(xué)習(xí)成績的好壞,知識能力的高低,也無法與其他學(xué)生相互比較。由于各個測驗的難度不同,各原始分?jǐn)?shù)的價值也不相同,不同測驗的原始分?jǐn)?shù)不能進(jìn)行直接比較,也就是說,考生無法根據(jù)原始分成績,判斷自己在考生團體中所處的位置。為了使原始分?jǐn)?shù)本身具有意義,使不同測驗的原始分?jǐn)?shù)可以相互比較,就必須把它們轉(zhuǎn)換成導(dǎo)出分?jǐn)?shù)。所謂導(dǎo)出分?jǐn)?shù)就是經(jīng)過統(tǒng)計處理過的,具有一定參照點和單位的、可以比較的分?jǐn)?shù)。在教育測驗中常用的導(dǎo)出分?jǐn)?shù)有百分等級分?jǐn)?shù)和標(biāo)準(zhǔn)分?jǐn)?shù)。
大學(xué)教學(xué)的特點,教學(xué)過程評價的目標(biāo),需要我們淡化被評價者在團體中所處的位置的橫向比較,而注重采用“個體內(nèi)差異評價”的方法,即通過被評價者進(jìn)行自身縱向的比較和個體諸側(cè)面的比較,來研究被評價者自身綜合能力發(fā)展和變化的過程,探索其內(nèi)在的規(guī)律。例如教育統(tǒng)計學(xué)所提到的如何縮減數(shù)據(jù)和描述這些數(shù)據(jù),如制成表格,畫出圖形,計算一些常用的參數(shù),用以揭示某些方面的特征;推斷統(tǒng)計則是通過樣本所提供的信息,對總體或樣本的某些特征進(jìn)行推斷、估計和預(yù)測,以揭示事物的內(nèi)在規(guī)律。只有這樣,才能使教師獲取更有用的反饋信息,改進(jìn)教學(xué)管理,保證教學(xué)質(zhì)量;使學(xué)生可以調(diào)整學(xué)習(xí)策略、改進(jìn)學(xué)習(xí)方法、提高學(xué)習(xí)效率。
標(biāo)準(zhǔn)分?jǐn)?shù)是由均數(shù)和標(biāo)準(zhǔn)差規(guī)定的相對地位量。它是統(tǒng)計學(xué)中最重要、用途最廣的統(tǒng)計量,相比原始分,標(biāo)準(zhǔn)分制度要比原始分制度更科學(xué)、更合理。它能夠克服原始分的上述兩種局限性,很適合通過分?jǐn)?shù)來達(dá)到準(zhǔn)確清晰地反映考生之間的水平差異并因此作為選拔的依據(jù)。標(biāo)準(zhǔn)分制度是根據(jù)教育測量學(xué)理論建立的一套有關(guān)分?jǐn)?shù)報告、分?jǐn)?shù)解釋和分?jǐn)?shù)使用的制度。它向考生報告各科標(biāo)準(zhǔn)分及百分等級,報告總分(改稱綜合分)的標(biāo)準(zhǔn)分百分等級。
“個體內(nèi)差異評價要用導(dǎo)出分?jǐn)?shù)(百分等級分、正態(tài)化標(biāo)準(zhǔn)分)進(jìn)行比較。若用原始分?jǐn)?shù)對今昔或各側(cè)面進(jìn)行比較,就會與評價的定義相背離,失去評價的意義。因為它既沒與絕對標(biāo)準(zhǔn)相比較,也沒與他人相比較,而且沒作出價值判斷”。標(biāo)準(zhǔn)分Z的計算公式為:
式中,X 為第i個學(xué)生的原始分,X為平均分?jǐn)?shù),S為標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)分?jǐn)?shù)是一個以平均值為參照點、以標(biāo)準(zhǔn)差為單位、測量原始分?jǐn)?shù)與其平均分?jǐn)?shù)的距離的量數(shù),可以表示一個原始分?jǐn)?shù)在團體中所處的相對位置。不管原始分?jǐn)?shù)的平均分、標(biāo)準(zhǔn)差如何,相同的標(biāo)準(zhǔn)分表示在分布中處于同樣的相對位置。為使標(biāo)準(zhǔn)分更符合我們沿用百分制的記分習(xí)慣,可將標(biāo)準(zhǔn)分Z轉(zhuǎn)化為另一種標(biāo)準(zhǔn)分T,其計算公式是:
T=10Z+50
事物進(jìn)行比較的前提是要選擇共同的參照點(物)和標(biāo)準(zhǔn),否則,比較就是無意義的,線性標(biāo)準(zhǔn)分作為一個很好的工具對每個個體(或小團體,如學(xué)校或班級)進(jìn)行今昔比較(不同測驗之間)或個體諸側(cè)面(不同科目之間)進(jìn)行比較。線性標(biāo)準(zhǔn)分的優(yōu)點:“如果幾個不同測驗的分布形態(tài)是很相近的,那么,同一個被試在幾個不同測驗上的線性標(biāo)準(zhǔn)分?jǐn)?shù),可以相互比較”,“可以將一個被試幾個不同測驗上的線性標(biāo)準(zhǔn)分?jǐn)?shù)相加求和”。即通常所說它具有的“可比性”和“可加性”,可以直接進(jìn)行合成運算。線性標(biāo)準(zhǔn)分的缺點:當(dāng)兩個測驗的分布形態(tài)不同時,它們的線性標(biāo)準(zhǔn)分既不可以相互比較,又不可以相加求和。如下圖采用標(biāo)準(zhǔn)分?jǐn)?shù)的排名。
不同測驗的線性標(biāo)準(zhǔn)分只有在分布形態(tài)相同或相近的情況下才能進(jìn)行比較,如果兩個分布的形態(tài)不同,譬如一個是正態(tài),一個是負(fù)偏態(tài),那么相同的Z分?jǐn)?shù)可能代表不同的百分等級。對于這樣的兩種分?jǐn)?shù),我們難以做到準(zhǔn)確地比較。當(dāng)兩個測驗的分布的形態(tài)不同時,它們的線性標(biāo)準(zhǔn)分既不可以相互比較,又不可以相加求和。為了使不同的測驗分?jǐn)?shù)可以相互比較,則需將之正態(tài)化,即使用進(jìn)行過非線性轉(zhuǎn)換的正態(tài)化標(biāo)準(zhǔn)分。轉(zhuǎn)換的結(jié)果是把偏態(tài)分布強制扭轉(zhuǎn)成為標(biāo)準(zhǔn)正態(tài)分布形態(tài)。轉(zhuǎn)換生成的正態(tài)化標(biāo)準(zhǔn)分消除了分布形態(tài)的影響,才具有真正意義的“可比性”和“可加性”,為科學(xué)、準(zhǔn)確地對不同測驗的分?jǐn)?shù)進(jìn)行比較和分析奠定了基礎(chǔ)。
標(biāo)準(zhǔn)分原理在教學(xué)研究中已經(jīng)有了廣泛的應(yīng)用,教師應(yīng)該具備初步的推斷統(tǒng)計知識和應(yīng)用能力,才可能看懂和吸收他人的研究成果;即使我們不需要進(jìn)行以發(fā)表為目的的研究,也需要經(jīng)常對學(xué)生成績進(jìn)行分析,對教學(xué)方法、學(xué)生的學(xué)習(xí)效果進(jìn)行科學(xué)地評價和檢驗。除了全校的宏觀分析(建立學(xué)校常模)之外,教師還應(yīng)該利用本原理通過局部的數(shù)據(jù)進(jìn)行“個體內(nèi)差異評價”的微觀分析。系統(tǒng)建立了學(xué)生成績的“歷史檔案”,全面記錄歷次考試中學(xué)生個人成績、團體指標(biāo)的詳細(xì)數(shù)據(jù),可以方便地研究被評價者學(xué)習(xí)能力發(fā)展變化的過程。充分發(fā)揮教師在形成性評價過程中的“主體作用”,將使教學(xué)評價成為院部、教師和學(xué)生共同參與的交互活動。
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。”