作為教育評(píng)估工具,成就測(cè)驗(yàn)出現(xiàn)于19世紀(jì)初,當(dāng)時(shí)正值美國(guó)教育家把教育的重點(diǎn)從精英教育轉(zhuǎn)移到大眾教育。所以,自成就測(cè)驗(yàn)出現(xiàn)以來(lái),有關(guān)它的爭(zhēng)論甚是激烈。雖然美國(guó)教育家對(duì)成就測(cè)驗(yàn)的功用褒貶不一,但是美國(guó)公眾對(duì)教育的評(píng)估一直采用成就測(cè)驗(yàn)。這是因?yàn)閷?duì)許多人來(lái)說(shuō),教育過(guò)程進(jìn)展得如何,怎樣對(duì)其加以改善,了解學(xué)生是否取得了進(jìn)步,成就測(cè)驗(yàn)就是公平的指標(biāo)。此外,政策制定者,包括州和國(guó)家立法者和學(xué)校董事會(huì),在做決策和分配資源時(shí),他們也依賴考試的分?jǐn)?shù)。目前,美國(guó)的中小學(xué)經(jīng)常使用的標(biāo)準(zhǔn)化成就測(cè)驗(yàn)主要有5個(gè):加利福尼亞成就測(cè)驗(yàn),基本技能綜合測(cè)驗(yàn),愛(ài)荷華基本技能測(cè)驗(yàn),大都市成就測(cè)驗(yàn)和斯坦福成就測(cè)驗(yàn)。應(yīng)該說(shuō),這些測(cè)驗(yàn)本身并沒(méi)有什么問(wèn)題,但如何使用它們卻會(huì)產(chǎn)生不同的影響。
美國(guó)教育測(cè)量學(xué)專家波帕姆在《標(biāo)準(zhǔn)化測(cè)驗(yàn)的使用和誤用》一文中,總結(jié)出合理使用成就測(cè)驗(yàn)所產(chǎn)生的4個(gè)方面的積極影響:一是能讓家長(zhǎng)知道子女的學(xué)業(yè)成就處于什么層次;二是能讓教師了解學(xué)生的學(xué)業(yè)成就達(dá)到什么水平;三是有助于挑選特別項(xiàng)目的學(xué)生;四是調(diào)撥補(bǔ)充資源。具體地講,標(biāo)準(zhǔn)化成就測(cè)驗(yàn)可以讓家長(zhǎng)知道他們的子女在不同的科目考試中與全國(guó)對(duì)比排名的情況。同樣,知道自己的學(xué)生相對(duì)的優(yōu)勢(shì)和弱勢(shì),教師也可以從中受益。此外,由于成就測(cè)驗(yàn)才能確定在某方面誰(shuí)表現(xiàn)最佳誰(shuí)表現(xiàn)最差,當(dāng)從一個(gè)過(guò)于龐大的申請(qǐng)人群中挑選學(xué)生時(shí),使用成就測(cè)驗(yàn)是相當(dāng)合適的。另外,當(dāng)教育決策者試圖決定如何分配資源時(shí),成就測(cè)驗(yàn)?zāi)馨l(fā)揮重要作用。所以,波帕姆分析指出,如果用于上述4個(gè)方面中的一種或多種目的,那么成就測(cè)驗(yàn)是很有用的教育評(píng)估工具。他認(rèn)為,這4種用途是使用成就測(cè)驗(yàn)最重要的。
此外,從美國(guó)教育史上,我們可以看出成就測(cè)驗(yàn)所發(fā)揮的積極作用。在19世紀(jì),百萬(wàn)移民來(lái)到美國(guó),標(biāo)準(zhǔn)化考試就成為一種確保所有兒童都能接受相同教育的標(biāo)準(zhǔn)。接著,在20世紀(jì)初,當(dāng)人口爆炸和童工法的實(shí)施給公立學(xué)校帶來(lái)危機(jī)時(shí),為了滿足日益多元化的學(xué)生群體的需要,成就測(cè)驗(yàn)就成了教育家有效的應(yīng)對(duì)方式。對(duì)能力相當(dāng)?shù)膶W(xué)生團(tuán)體,成就測(cè)驗(yàn)被看作是一個(gè)更加公正和科學(xué)的方法。在回應(yīng)20世紀(jì)60年代更加公平分配教育資源的呼聲時(shí),測(cè)試分別用于兩個(gè)目的:一是決定誰(shuí)具有資格入選特殊項(xiàng)目,在測(cè)驗(yàn)中表現(xiàn)不佳常常是進(jìn)入比普通教室擁有更多資源的項(xiàng)目的門票;二是成就測(cè)驗(yàn)被用來(lái)衡量項(xiàng)目的成效,要繼續(xù)獲得項(xiàng)目資助的條件是參加教育項(xiàng)目的孩子必須取得進(jìn)步。
在20世紀(jì)80年代,一連串關(guān)于教育的報(bào)告斷言美國(guó)的教育質(zhì)量已經(jīng)惡化。給出的證據(jù)是美國(guó)學(xué)生的測(cè)驗(yàn)表現(xiàn)比其鄰國(guó)的學(xué)生低,于是測(cè)驗(yàn)成了教育改革的杠桿,分?jǐn)?shù)成了辦學(xué)成功的佐證。因此,由于傳統(tǒng)的或是一些積極的因素,在美國(guó)成就測(cè)驗(yàn)仍然擁有公眾和機(jī)構(gòu)的支持。威廉姆斯?fàn)庌q說(shuō),雖然沒(méi)有人會(huì)說(shuō)高風(fēng)險(xiǎn)測(cè)試是一個(gè)完美的方法,但它卻能夠幫助實(shí)現(xiàn)幾個(gè)重大的社會(huì)目標(biāo)。比如說(shuō),加強(qiáng)學(xué)生的學(xué)習(xí),發(fā)現(xiàn)處于困境中的學(xué)生和學(xué)校,確保那些比較值得有機(jī)會(huì)的人獲取選擇性的資源。
不過(guò),在肯定成就測(cè)驗(yàn)積極作用的同時(shí),一些教育界人士找出了一些濫用成就測(cè)驗(yàn)的實(shí)例。鮑爾認(rèn)為成就測(cè)驗(yàn)不應(yīng)該用來(lái)判斷學(xué)校的質(zhì)量,一是因?yàn)檫@種高風(fēng)險(xiǎn)的測(cè)試并不一定能提供有關(guān)學(xué)生和學(xué)校的有效數(shù)據(jù);二是因?yàn)檫@類測(cè)試往往會(huì)對(duì)教師和校長(zhǎng)產(chǎn)生高壓。其結(jié)果,教師會(huì)把測(cè)驗(yàn)的分?jǐn)?shù)作為目的。他還指出,標(biāo)準(zhǔn)化成就測(cè)驗(yàn)的分?jǐn)?shù)有可能不是由于學(xué)校的教學(xué)質(zhì)量造成的,學(xué)生的測(cè)驗(yàn)表現(xiàn)有可能會(huì)受到其他因素的影響,諸如學(xué)校所授內(nèi)容,學(xué)生天生的智慧和嚴(yán)重受到學(xué)生家庭環(huán)境影響的校外學(xué)習(xí)機(jī)會(huì)。
與鮑爾一樣,波帕姆也反對(duì)使用學(xué)生成就測(cè)驗(yàn)的分?jǐn)?shù)來(lái)評(píng)估地方學(xué)校的教學(xué)質(zhì)量。他認(rèn)為雖然成就測(cè)驗(yàn)是有用的工具,能為我們提供學(xué)生在某些方面對(duì)知識(shí)和技能的掌握程度,但“使用標(biāo)準(zhǔn)化成就測(cè)驗(yàn)來(lái)評(píng)估教育質(zhì)量就像用一湯匙來(lái)測(cè)量水溫”,主要困難在于州與州之間課程標(biāo)準(zhǔn)存在著相當(dāng)大的差異,出卷人弄出來(lái)的“千篇一律的評(píng)估”并不完全符合學(xué)校所教的內(nèi)容。教育工作者要記住其最初目的就是要檢測(cè)出考生之間足夠的差異,這樣才能進(jìn)行敏感的常模參照比較。
同樣,使用成就測(cè)驗(yàn)來(lái)評(píng)價(jià)教師也不是明智之舉。由于這種濫用,今天如果某一所學(xué)校的成就測(cè)驗(yàn)分?jǐn)?shù)高,人們就認(rèn)為該學(xué)校的師資好;如果某一所學(xué)校的成就測(cè)驗(yàn)分?jǐn)?shù)低,他們就認(rèn)為該學(xué)校的教師是無(wú)能的。根據(jù)波帕姆的觀點(diǎn),使用這種測(cè)驗(yàn)來(lái)評(píng)價(jià)教師的教學(xué)質(zhì)量是不合理的,因?yàn)閷?duì)于某一個(gè)特定教師而言,他的學(xué)生的能力水平每年都會(huì)有很大的差異。如果使用逐年變化的學(xué)生的成就測(cè)驗(yàn)成績(jī)來(lái)評(píng)價(jià)教師,那么這樣的評(píng)估是十分可笑的。
此外,還有兩種常見的對(duì)成就測(cè)驗(yàn)的誤用。一是用測(cè)驗(yàn)分?jǐn)?shù)來(lái)進(jìn)行課堂教學(xué)決策和決定學(xué)生的升級(jí)問(wèn)題(波帕姆)。其濫用的原因是,標(biāo)準(zhǔn)化成就測(cè)驗(yàn)的內(nèi)容與某一個(gè)教師所強(qiáng)調(diào)的教學(xué)內(nèi)容存在著不一致。另外,教師不應(yīng)使用測(cè)驗(yàn)的結(jié)果來(lái)決定某一特定年級(jí)的教學(xué)目標(biāo),因?yàn)榭碱}只包括一小部分可能會(huì)問(wèn)到的潛在問(wèn)題。
到目前為止,如此濫用成就測(cè)驗(yàn),特別是利用測(cè)試的結(jié)果來(lái)衡量學(xué)校的質(zhì)量,已經(jīng)對(duì)教育產(chǎn)生了巨大的負(fù)面影響。教師和學(xué)生都面臨著巨大的壓力。為了得到高分,學(xué)校、老師和學(xué)生都在試圖利用他們的“智慧”。美國(guó)亞利桑那州曾經(jīng)考慮立法,如果學(xué)生考出高分?jǐn)?shù),教師將獲得1200美元的獎(jiǎng)金。問(wèn)題是這一策略會(huì)帶來(lái)什么樣的影響。美哈若恩和卡曼斯分析指出,把支付獎(jiǎng)金和學(xué)生的考試成績(jī)連在一起有許多缺點(diǎn)。其中最重要的問(wèn)題是,為了取得高分?jǐn)?shù),一些教師和學(xué)校領(lǐng)導(dǎo)幾乎任何事情都會(huì)做出來(lái),甚至不惜弄虛作假。一些教育家可能報(bào)告虛假的結(jié)果,比如開除有可能獲得低分的學(xué)生,把答案讀給學(xué)生,或者干脆在測(cè)試結(jié)束后涂改學(xué)生的答題卡。一些學(xué)校為了讓學(xué)生準(zhǔn)備成就測(cè)驗(yàn)而放棄了常規(guī)課程,還有的學(xué)校把部分學(xué)年用來(lái)準(zhǔn)備考試,開發(fā)教學(xué)包來(lái)訓(xùn)練學(xué)生。毫無(wú)疑問(wèn),這種“為考而教”的策略對(duì)學(xué)生的發(fā)展已經(jīng)明顯地產(chǎn)生了嚴(yán)重的負(fù)面影響。
就學(xué)生而言,他們吃成就測(cè)驗(yàn)的苦頭更多。根據(jù)帕麗斯,羅頓和羅斯的研究,成就測(cè)試加劇了學(xué)生有關(guān)考試經(jīng)驗(yàn)的焦慮,降低了學(xué)生的學(xué)習(xí)興趣。到了高中,他們都不相信測(cè)驗(yàn)究竟有多大的價(jià)值。由于考試帶來(lái)的壓力,各種各樣的學(xué)生問(wèn)題已經(jīng)出現(xiàn)了。常見的問(wèn)題包括逃學(xué)、胃不適、煩躁不安、哭泣、長(zhǎng)時(shí)間呆在浴室,對(duì)試題的限時(shí)部分發(fā)呆、頭疼,拒絕考試等等。
就教師而言,當(dāng)他們學(xué)生的成績(jī)比父母預(yù)料的低,他們可能會(huì)感到羞愧,認(rèn)為自己教得不好。為了讓學(xué)生考出好成績(jī),他們常常花費(fèi)大量的時(shí)間專注于測(cè)試中可能出現(xiàn)的技巧,以至于他們沒(méi)有太多時(shí)間探索自己的教學(xué),甚至使他們的創(chuàng)造性和靈活性也極大地受到了影響。事實(shí)上,他們都知道教師要為學(xué)生的考試分?jǐn)?shù)負(fù)責(zé)任的做法是無(wú)效的。但是在面對(duì)媒體的評(píng)論和政治攻擊時(shí),他們卻顯得無(wú)能為力。很顯然,這種結(jié)果至上的測(cè)試已經(jīng)給教育本身帶來(lái)了不良影響。
華萊士曾指出:“為了分?jǐn)?shù)我們犧牲掉的是關(guān)心和愛(ài)護(hù)。”教育家將測(cè)試的結(jié)果置于學(xué)生的需要之前的做法正在使學(xué)校神經(jīng)過(guò)敏。擔(dān)憂分?jǐn)?shù)的排名重于人文教學(xué),比如討論,批判性的思維,發(fā)揚(yáng)團(tuán)隊(duì)精神,以及增強(qiáng)責(zé)任感。在《讓我們擺脫標(biāo)準(zhǔn)化測(cè)驗(yàn)》一文中,沃克極力爭(zhēng)辯說(shuō)“只有當(dāng)我們擺脫了維系標(biāo)準(zhǔn)化考試的推銷術(shù)、傳統(tǒng)、教條和無(wú)知,我們的教育體系才會(huì)取得進(jìn)步。”
從上述的討論中,我們可以看到作為教育評(píng)估工具成就測(cè)驗(yàn)有著自己的優(yōu)勢(shì)和劣勢(shì)。盡管從一開始就招來(lái)批評(píng),但它們?cè)诿绹?guó)教育史上發(fā)揮了重要的作用,尤其在教育的公正、優(yōu)質(zhì)與效益方面。今天,在課程評(píng)估,教育決策,學(xué)生分組教學(xué),診斷課程的薄弱環(huán)節(jié)等方面,他們?nèi)匀皇怯杏玫摹5悄壳皣?yán)重的問(wèn)題是,測(cè)試結(jié)果往往被濫用和曲解。一個(gè)可怕的事情就是測(cè)驗(yàn)分?jǐn)?shù)被用來(lái)衡量學(xué)校的質(zhì)量、教師的教學(xué)和學(xué)生的學(xué)業(yè)表現(xiàn)。
那么,考慮到成就測(cè)驗(yàn)給教育帶來(lái)的正面和負(fù)面的影響,我們?cè)撛趺崔k?我們是不是要取消標(biāo)準(zhǔn)化成就測(cè)驗(yàn)?還是我們需要繼續(xù)使用而不考慮其負(fù)面效應(yīng)?或者我們應(yīng)該怎么做才能充分利用成就測(cè)驗(yàn)?zāi)兀渴聦?shí)上,即使成就測(cè)驗(yàn)受到了越來(lái)越多的批評(píng),我們也不可能在短時(shí)期內(nèi)取消他們。在中國(guó)如此,在美國(guó)也如此。因此,我們需要更好地理解成就測(cè)驗(yàn)的性質(zhì)和真正目的,避免濫用和曲解測(cè)試的結(jié)果。成就測(cè)驗(yàn)最重要的不是公開報(bào)告,而是利用其結(jié)果來(lái)提高學(xué)生的成績(jī)和教學(xué)項(xiàng)目。我們應(yīng)該記住西蒙斯說(shuō)過(guò)的一句話:“怎么使用成就測(cè)驗(yàn)會(huì)產(chǎn)生完全不同的結(jié)果。”
作者單位
云南師范大學(xué)外語(yǔ)學(xué)院
◇責(zé)任編輯 李配亮◇