謝雙梅
摘 要: 語言測試的目的是了解、評價學生的語言水平。現(xiàn)代技術(shù)迅猛發(fā)展與運用,其已經(jīng)滲入語言的各個領(lǐng)域。由此,計算機化英語考試應(yīng)運而生。計算機化考試有其特點和規(guī)律,考試研發(fā)者必須在遵循這些特點和規(guī)律的基礎(chǔ)上開發(fā)出符合考試要求的計算機化語言測試體系。本文主要從機輔語言測試的試題庫建設(shè)、測試過程、閱卷評分等方面對其進行討論。
關(guān)鍵詞: 試題庫 機輔語言測試 機輔語言閱卷評分
1.語言測試簡述
本文主要從機輔語言測試的試題庫建設(shè)、測試過程、閱卷及評分等方面描述機輔語言測試的全過程。實現(xiàn)語言測試的現(xiàn)代化,不僅能提高工作效率、降低成本,而且對整個語言教學將會產(chǎn)生深遠影響。目前,人們對計算機化考試的誤區(qū)主要體現(xiàn)在:計算機化考試就是紙筆考試的計算機化(應(yīng)用新技術(shù)考查舊內(nèi)容);簡化考務(wù)工作等方面[1]。
2.計算機在語言測試中的應(yīng)用
計算機語言測試備受教育領(lǐng)域和考試領(lǐng)域的廣泛關(guān)注,它的應(yīng)用主要體現(xiàn)在題庫建設(shè)(item banking),計算機輔助語言測試(computer- assisted language testing),以及計算機自適應(yīng)語言測試(computer adaptive language testing)等方面[2]。
2.1題庫建設(shè)
題庫由許多適用于不同目的和任務(wù)需要,且具有必要參數(shù)的大量優(yōu)質(zhì)題目組成,是進行測試的基礎(chǔ)。題庫建設(shè)不是簡單地將數(shù)量眾多的試題存儲在計算機中,它涉及教育測量理論、統(tǒng)計及認知心理等多方面理論。計算機技術(shù)在題庫建設(shè)中扮演著無可替代的角色,例如,它可以快捷方便地完成對試題的儲存、修改,可以按要求自動生成試卷等。但是,在題庫建設(shè)這一環(huán)節(jié)中仍然有許多問題值得注意。比如,控制入庫試題的質(zhì)量,控制入庫題目的結(jié)構(gòu)比例,保證內(nèi)容的廣泛性,以及數(shù)據(jù)的安全性等問題。
2.2計算機輔助語言測試
20世紀60年代,美國教育家率先將計算機用于教育測量,并稱其為計算機輔助測試(Computer-Assisted Testing),即計算機按預(yù)定的測試目標發(fā)送測試題目,學生接收,并根據(jù)自己的理解做出反應(yīng);計算機將學生的反應(yīng)與設(shè)定目標作對比,進一步向測試者傳送反饋信息、教學內(nèi)容等,從而使教學得到進一步發(fā)展,達到計算機輔助測試的目的,全方位對學生的學習進行分級、判斷和評價。機輔測試系統(tǒng)有一個比較強大的題庫,它與傳統(tǒng)測試構(gòu)成是一樣的,但整個過程得到了相當大的簡化和改進。機輔測試具有生成試卷、閱卷、分析試卷、管理成績等功能,并且計算機閱卷快速、準確,能夠及時有效地對考試結(jié)果進行分析,發(fā)現(xiàn)試題的缺陷,并幫助改正,從而大幅度提高了測試的效度和信度。
2.3計算機自適應(yīng)語言測試
隨著計算機在測試領(lǐng)域的應(yīng)用及項目反應(yīng)理論(IRT)的興起,以此為基礎(chǔ)的計算機化自適應(yīng)考試(Computer Adaptive Test)備受關(guān)注,這種測試能根據(jù)被試者的特點自動生成適應(yīng)被試者具體情況的試卷。計算機自適應(yīng)語言測試是計算機輔助語言測試的發(fā)展趨勢,具有很大的潛力。它主要有三個特點:(1)考試項目根據(jù)單個考生的情況而定;(2)當考生的能力水平得到確定時考試結(jié)束;(3)考試項目較一般紙筆考試更少,而且時間更短。
在傳統(tǒng)測試中,對于每個考生而言,無論水平如何,全部都要接受同一批題目的測試,但是,測試題目中只有一部分是代表自己真實能力的,其余題目要么過于簡單,要么過難。計算機自適應(yīng)測試是對每個考生提供難易度適中的測試內(nèi)容的一種測試方法,其基本過程是考生首先回答一個中等難度的測試題目,如果考生正確回答了這一項目,那么下一個測試項目的難度就要相對增加;反之亦然。考試全程以計算機為媒介,考生根據(jù)自己的判斷作答,作答后計算機立即反饋答題信息。根據(jù)項目反應(yīng)理論原理,考生每回答一個測驗項目,計算機就給出一個相應(yīng)的能力估計值。這個能力估計值會成為選擇下一個測驗題目的依據(jù),直到準確測出考生水平為止。計算機自適應(yīng)測試比傳統(tǒng)測試效率更高,它可以用比傳統(tǒng)測試更少的試題而取得與之相比更佳的測試效果。有實驗表明,在同等測量精確度的條件下,自適應(yīng)測試可將測試時間縮短為原來的40%~60%[3]。
2.4機輔語言測試的閱卷評分
計算機輔助測試系統(tǒng)能完成的工作有局限性,目前機輔測試主要以客觀題形式出現(xiàn),雖具有客觀性,信度較高,但客觀題的大量使用使測試的表面效度大大降低。利用問答式題目測試評價學生的綜合能力的測試現(xiàn)階段還難以實現(xiàn)。用計算機分析學生對輸出型題目的回答,目前還受到兩方面的限制:一是使用計算機硬件識別、處理文字的能力是一種新技術(shù),且價格相對昂貴;二是應(yīng)用計算機進行語言的分析還不夠成熟,并不能全面處理此種題型,所能進行的分析成果還未能達到實用階段。
3.計算機在語言測試中應(yīng)用的優(yōu)勢
3.1利用計算機構(gòu)成的題庫系統(tǒng)自動化程度較高,可大大提高命題效率,使教師有更多時間和精力開展科研、教學及管理工作。它避免了一張試卷、多處統(tǒng)考的弊端,為現(xiàn)代化教學管理提供了有利的手段。
3.2基于項目反應(yīng)理論(IRT)的題庫試題可以與施測樣本無關(guān),即使在不同時間內(nèi)進行考試,其測量結(jié)果也是可以比較的。題庫的建設(shè)有利于學生自我檢驗學習成績,有利于教師出題考試及判斷教學效果。
4.結(jié)語
計算機在考試中的應(yīng)用已從最初的考務(wù)管理、監(jiān)考等工作延伸到計算機化測試和計算機評卷等方面。機輔語言測試采用考生直接輸入答案的形式,與人工閱卷相比,減少了由于人為因素導致的計分過程中產(chǎn)生的誤差。計算機超凡的記憶力和準確率使閱卷記分等誤差降到零,在很大程度上保證了測試的公正性、客觀性。基于機輔測試的上述優(yōu)越性,其越來越“橫行”于語言測試領(lǐng)域。計算機自適應(yīng)語言測試由于題量靈活,時間可長可短,測試后能即時記分并報告成績,實效性和經(jīng)濟性強,其無可厚非地成了今后語言測試的發(fā)展方向。
隨著計算機人工智能、語音識別、光學字符識別等技術(shù)的發(fā)明,不久,我們將能夠?qū)崿F(xiàn)計算機與考生直接交互、識別和判斷書面甚至口頭語言進行評估。由此可見,實現(xiàn)語言測試的現(xiàn)代化,與世界接軌,是大勢所趨,是我們今后改革外語測試、提高外語教學質(zhì)量的必備條件。當然計算機語言測試作為一種新興測試方法,存在很多不足。我們必須遵循其特點和規(guī)律,開發(fā)出符合考試發(fā)展和需要的計算機化語言測試。
參考文獻:
[1]張權(quán).計算機化的語言測試:現(xiàn)狀與發(fā)展[M].上海:上海外語教育出版社,2001.55.
[2]何克抗.建立題庫的理論[A].全國CBE學會第七屆學術(shù)會議論文集.國防科技大學出版社,1995.
[3]楊滿珍.20世紀90年代國外語言測試的發(fā)展[J].外語教學,2002.104-106.
[4]顧海根.一種新的測驗形式——計算機自適應(yīng)測驗[J].上海教育科研,1999.5-7.