摘 要: 本文以統計學中的差異數量——標準分在科學、合理地評價和解釋考試分數方面的應用為例,分析和闡述了標準分在考試成績評價中的作用和意義,旨在為學校教育評價和教學改革提供參考。本文認為用標準分比用原始分數評價學生成績更科學、更合理和公正,更能客觀地反映學生的學習動態,使教師做到有的放矢、因材施教。
關鍵詞: 原始分 標準分 意義 作用 考試成績評價
一、引言
考試是學校教育的一個極為重要的組成部分,是檢查教學質量、評價教師教學水平、檢驗學生知識掌握及能力結構的主要環節。過去評價學生成績時,常常使用原始分數,如認為語文得90分的學生語文學得好,而外語得70分的學生則外語能力較低;再有,同一名學生期末數學得80分,語文得65分,于是認為該生是學理科的材料,文科不好。這些認識是不夠科學的,因為試題的難易程度是決定學生分數的主要因素,題目難,原始分數就偏低;題目容易,原始分數就偏高,從而導致了原始分數之間的不可比性。試題還受區分度大小的影響,因而造成考試的內容不同質、不等效、不可加。由于考試分數或原始分數沒有絕對的零點,也沒有統一的單位,因而不能將一個學生前后多次考試的成績進行比較,不能對不同科目的成績進行比較,難以判斷學生成績的變化趨勢。因此,原始分數得到的信息不夠準確,不科學,用原始分來評價學生的成績缺失公正性和合理性。采用標準分數對考試成績進行分析,就可以克服以上缺點,因此,用標準分比用原始分數評價學生成績更科學、更合理和公正。
二、標準分的定義及計算方法
標準分是由均數和標準差規定的相對地位量。它是統計學中最重要、用途最廣的統計量,標準分的定義為:以標準差為單位標定某一分數離開團體均數的距離。公式為:
z==
式中X為某一原始分數,為N個原始分數的平均數,x-是離均差,即某一分數離開均數的差數,S為標準差,Z即為標準分數,因此標準分數常稱為Z分數。Z分數有正值和負值。當Z為正數時,則X>;當Z為負數時,則X<;當Z=0時,則X=。Z分數的絕對值|Z|,表示某分數與在此分布上的平均數的距離,|Z|越大,表示某分數離開均數的位置越遠。計算機(利用Excel表)可以方便地將原始分轉換成標準分。
三、標準分的意義
標準分是一種具有相等單位的量數。它是將原始分數與團體的平均數之差除以標準差所得的商數,是以標準差為單位度量原始分數離開其平均數的分數之上多少個標準差,或是在平均數之下多少個標準差。它是一個抽象值,不受原始測量單位的影響,并可接受進一步的統計處理。其意義在于:
1.標準分的分布與原始數據的分布相同。
2.各科標準分的單位是絕對等價的。無論各科的平均分、標準差怎樣不同,一經轉換成標準分,就形成以平均數為0、標準差為1的統一的、固定不變的標準形式。
3.標準分數值的大小、正負,反映某一考分在全體中所處的位置,它是相對分數。
4.當總體均服從同一分布時,總體的標準分之間具有可比性。
5.用標準分表示的樣本間可以進行算術運算。
因此,標準分在考試成績評價中具有重要作用。
四、標準分的作用
標準分在考試成績評估中的用途很多,一是能夠明確各個分數在總體中的位置;二是能客觀地比較不同學生不同學科的總成績及其優劣;三是可以比較某學生不同學科、與階段的考試成績,正確評價其學習的發展。
(一)能明確各個分數在總體中的位置。
標準分是按正態分布原理而建立的分數制度,其主要特點是:分數不但可以反映考生的水平高低,而且可以直接反映出該分數在全體考生中的位置。
依據Z標準分數的意義,Z分數為0的原始成績是全班的平均分。Z分數大于0的原始成績高于全班的平均分;Z分數小于0的原始成績則低于全班的平均分。也就是說,標準分數值的大小、正負,反映某一考分在全體中所處的位置。以表1為例。
表1是某高校10級商英2班第一學期外語三科期末考試的成績統計。表1中學生01的泛讀得分為34,其泛讀標準分為-1.690,這表明學生01所得的泛讀分數低于全體考生平均數1.690個標準差,在總體的位置靠后;學生02的泛讀得分為65,泛讀標準分為0.158,這表明學生02的泛讀分數高于全體考生平均數0.158個標準差,在總體的位置則靠前。
再如,學生32的精讀和泛讀的原始分數都是73分,這個分數是高還是低?該學生在全體考生中的位置靠前還是靠后?單從原始分數看不出來,因為沒有一個穩定的參照點。若把原始分數轉換成標準分后,該學生在全體考生中的位置則一目了然:該生精讀原始分數為73分,標準分為1.211,高于全體考生平均數,原始分數73分應算較高的成績了;而泛讀的標準分為0.635,接近全體考生平均數,原始分數73分則只算中等成績,由此可見,原始分數很難準確說明分數所反映的考生實際水平,也不能確定分數在群體中的位置。而標準分則可以直接反映出該分數在全體考生中的位置。|Z|越大,表示某分數離開均數的位置越遠。
(二)能客觀地比較不同學生不同學科的總成績及其優劣。
從表1可以看到,若按原始分累計總分,學生09、學生10和學生22的總分都是140,三者學習成績處于并列的位置,沒有優劣或高低之分;但將原始分數轉換成標準分數后,以Z值的總和相比較,學生09的Z總為-1.013,學生10的為-1.189,學生22的為-0.777,則可以看出學生22的成績要比學生09的高,而學生09的成績又比學生10的要高。從“Z總”這一欄,我們可以明確地看到學生22、學生09和學生10在班級成績中的排名分別為第26、第29和第31。三者原始總分相等,沒法比較,但按標準分來分析,他們這幾科的總成績卻有高低之分。
從表1還可以看到,學生07的總分為189,學生28的總分為195,以三科的總分來判定成績的優劣,學生28排第8名,學生07則排第12名。表面上學生28的成績似乎要比學生07的成績好。但是,按原始總分計算只考慮了分值,并沒有考慮各分值在各自總體(即各自科目的分數總體)中的價值,這種考慮是欠妥的。分數的價值應用最佳地位量標準分數來表示。那么將學生07和學生28的三科考分都換成Z值(見表1),以Z值的總和相比較,Z為1.748,而Z為1.433,則可看出學生07的分數價值要比學生28的高。學生07的成績優于學生28,兩者的排名恰與原始分數的排名截然相反。若要推薦優秀生,推薦學生07更為合理。其道理從學生08的泛讀為84分,其Z值為1.291,與學生30的聽力為84分,其Z值為1.775的比較分析可以顯示出來。從原始分數看,同是84分,但由于分別位于不同科目的不同分布中,其價值是不同的。受試題難度和區分度大小的影響,導致了泛讀的“1分”與聽力的“1分”不等值,便造成了這樣的現象:同樣是84分的兩科成績卻反映出兩種高低不同的水平。
上述例子表明,使用原始分數難以對學生的水平進行科學的比較。將原始分數相加得到總分的方法,就好比將100元人民幣加上100元港幣再加上100元美元得到300元一樣,是不能反映三種貨幣在總額中的真實價值的。由此可見,原始分數不具有簡單的可加性,幾門原始成績的總分并不能說明個體在團體中的實際排名,不能確切評價學生成績的優劣,甚至會產生與學生實際水平截然不同的結果。而標準分是以群體的平均分為參照、以標準差為度量單位的一種分數,是在消除考試難度、考生不確定因素產生的抽樣誤差影響,將考試成績(分數制)通過某種變換而得到的具有明確區分、比較特性的考試成績。所以標準分能夠直接比較不同學生不同學科的總成績,能夠客觀、公正地反映各個學生的成績在群體成績中的實際地位或實際排名。
(三)可比較某學生不同學科與階段的成績,正確評價其學習的發展。
我以某高校某學生第一學年(兩個學期)大學語文與大學英語成績為例來說明這個問題,見表2。
按表2中的原始分數評價,有人認為該生的語文成績有進步,而英語學習有退步。而若將該生的成績標準化后,不難發現,該生的語文成績在班上的相對位置沒有變化,而英語成績第二學期雖比第一學期低7分,但標準分數提高了,說明該生在班上的相對成績有所提高。同樣,若僅看該生的第二學期成績:語文86分,英語80分,不少人會認為該生的語文比英語學得好。但我們從表2中可知,該生的語文成績高于平均成績0.96個標準差,英語成績高出平均成績1.16個標準差,英語成績比語文成績在班上的相對位置高,因而相對來說該生的英語學得較好。所以只憑借原始分數盲目評價學生是不恰當的。如果教師采用標準分數,就可以掌握每個學生學習某科成績發展趨勢,了解學生知識的掌握程度。
五、結語
無論用原始分數比較單科成績還是比較總成績都是不科學的,因為各原始分數分別位于不同科目的不同分布中,價值不同,沒有同一的測量尺度,因而不可加與不可比。標準分是采取統計學的計算方法計算出的一種數據,利用這種計算方法可以避免多次考試因試題量不同及試題難度不同而造成的前面提到的對學生的學習情況評價不確切的情況發生,使課程之間、學生之間、班級之間、年級之間和學校之間具有可比性,可對同一考試各科進行橫向比較,也可對同一學科不同時期的考試縱向比較,找到個體在總體內的位置,從而對全校教學情況一目了然,教學管理也可以做到心中有數。
當前,仍有相當一部分教師用原始分數作為考試成績評價的依據,尚未認識到原始分數的局限性。因而,我認為對標準分數的認同需要宣傳,讓教師更了解標準分的意義和作用,盡快地接受標準分,并運用標準分更好、更科學和更合理地評價學生的考試成績,客觀地了解學生的學習動態,做到有的放矢、因材施教。
參考文獻:
[1]羅玉蓮等.標準分及其應用[J].吉安師專學報,1998,VOL19,(5).
[2]劉曉莉.標準分與考試成績評估[J].佛山科學技術學院學報(自然科學版),1999,VOL17,(4).
[3]廖平勝等.考試學[M].武漢:華中師范大學出版社,1988.
[4]張玉田等.學校教育評價[M].北京:中央民族大學出版社,1998.
[5]將慶偉等.教育科研中的量化方法[M].北京:中國科學技術出版社,1997.
[6]唐小杰等.課堂教學與學習成績評價[M].南寧:廣西教育出版社,2000.
注:“本文中所涉及到的圖表、公式、注解等請以PDF格式閱讀”