用現(xiàn)代化手段輔助語言測試

2014-08-30 10:07:12謝雙梅

考試周刊 2014年54期

謝雙梅

摘要：語言測試的目的是了解、評價學生的語言水平。現(xiàn)代技術(shù)迅猛發(fā)展與運用，其已經(jīng)滲入語言的各個領(lǐng)域。由此，計算機化英語考試應(yīng)運而生。計算機化考試有其特點和規(guī)律，考試研發(fā)者必須在遵循這些特點和規(guī)律的基礎(chǔ)上開發(fā)出符合考試要求的計算機化語言測試體系。本文主要從機輔語言測試的試題庫建設(shè)、測試過程、閱卷評分等方面對其進行討論。

關(guān)鍵詞：試題庫機輔語言測試機輔語言閱卷評分

1.語言測試簡述

本文主要從機輔語言測試的試題庫建設(shè)、測試過程、閱卷及評分等方面描述機輔語言測試的全過程。實現(xiàn)語言測試的現(xiàn)代化，不僅能提高工作效率、降低成本，而且對整個語言教學將會產(chǎn)生深遠影響。目前，人們對計算機化考試的誤區(qū)主要體現(xiàn)在：計算機化考試就是紙筆考試的計算機化（應(yīng)用新技術(shù)考查舊內(nèi)容）；簡化考務(wù)工作等方面[1]。

2.計算機在語言測試中的應(yīng)用

計算機語言測試備受教育領(lǐng)域和考試領(lǐng)域的廣泛關(guān)注，它的應(yīng)用主要體現(xiàn)在題庫建設(shè)（item banking），計算機輔助語言測試（computer- assisted language testing），以及計算機自適應(yīng)語言測試（computer adaptive language testing）等方面[2]。

2.1題庫建設(shè)

題庫由許多適用于不同目的和任務(wù)需要，且具有必要參數(shù)的大量優(yōu)質(zhì)題目組成，是進行測試的基礎(chǔ)。題庫建設(shè)不是簡單地將數(shù)量眾多的試題存儲在計算機中，它涉及教育測量理論、統(tǒng)計及認知心理等多方面理論。計算機技術(shù)在題庫建設(shè)中扮演著無可替代的角色，例如，它可以快捷方便地完成對試題的儲存、修改，可以按要求自動生成試卷等。但是，在題庫建設(shè)這一環(huán)節(jié)中仍然有許多問題值得注意。比如，控制入庫試題的質(zhì)量，控制入庫題目的結(jié)構(gòu)比例，保證內(nèi)容的廣泛性，以及數(shù)據(jù)的安全性等問題。

2.2計算機輔助語言測試

20世紀60年代，美國教育家率先將計算機用于教育測量，并稱其為計算機輔助測試（Computer-Assisted Testing），即計算機按預(yù)定的測試目標發(fā)送測試題目，學生接收，并根據(jù)自己的理解做出反應(yīng)；計算機將學生的反應(yīng)與設(shè)定目標作對比，進一步向測試者傳送反饋信息、教學內(nèi)容等，從而使教學得到進一步發(fā)展，達到計算機輔助測試的目的，全方位對學生的學習進行分級、判斷和評價。機輔測試系統(tǒng)有一個比較強大的題庫，它與傳統(tǒng)測試構(gòu)成是一樣的，但整個過程得到了相當大的簡化和改進。機輔測試具有生成試卷、閱卷、分析試卷、管理成績等功能，并且計算機閱卷快速、準確，能夠及時有效地對考試結(jié)果進行分析，發(fā)現(xiàn)試題的缺陷，并幫助改正，從而大幅度提高了測試的效度和信度。

2.3計算機自適應(yīng)語言測試

隨著計算機在測試領(lǐng)域的應(yīng)用及項目反應(yīng)理論（IRT）的興起，以此為基礎(chǔ)的計算機化自適應(yīng)考試（Computer Adaptive Test）備受關(guān)注，這種測試能根據(jù)被試者的特點自動生成適應(yīng)被試者具體情況的試卷。計算機自適應(yīng)語言測試是計算機輔助語言測試的發(fā)展趨勢，具有很大的潛力。它主要有三個特點：（1）考試項目根據(jù)單個考生的情況而定；（2）當考生的能力水平得到確定時考試結(jié)束；（3）考試項目較一般紙筆考試更少，而且時間更短。

在傳統(tǒng)測試中，對于每個考生而言，無論水平如何，全部都要接受同一批題目的測試，但是，測試題目中只有一部分是代表自己真實能力的，其余題目要么過于簡單，要么過難。計算機自適應(yīng)測試是對每個考生提供難易度適中的測試內(nèi)容的一種測試方法，其基本過程是考生首先回答一個中等難度的測試題目，如果考生正確回答了這一項目，那么下一個測試項目的難度就要相對增加；反之亦然。考試全程以計算機為媒介，考生根據(jù)自己的判斷作答，作答后計算機立即反饋答題信息。根據(jù)項目反應(yīng)理論原理，考生每回答一個測驗項目，計算機就給出一個相應(yīng)的能力估計值。這個能力估計值會成為選擇下一個測驗題目的依據(jù)，直到準確測出考生水平為止。計算機自適應(yīng)測試比傳統(tǒng)測試效率更高，它可以用比傳統(tǒng)測試更少的試題而取得與之相比更佳的測試效果。有實驗表明，在同等測量精確度的條件下，自適應(yīng)測試可將測試時間縮短為原來的40%～60%[3]。

2.4機輔語言測試的閱卷評分

計算機輔助測試系統(tǒng)能完成的工作有局限性，目前機輔測試主要以客觀題形式出現(xiàn)，雖具有客觀性，信度較高，但客觀題的大量使用使測試的表面效度大大降低。利用問答式題目測試評價學生的綜合能力的測試現(xiàn)階段還難以實現(xiàn)。用計算機分析學生對輸出型題目的回答，目前還受到兩方面的限制：一是使用計算機硬件識別、處理文字的能力是一種新技術(shù)，且價格相對昂貴；二是應(yīng)用計算機進行語言的分析還不夠成熟，并不能全面處理此種題型，所能進行的分析成果還未能達到實用階段。

3.計算機在語言測試中應(yīng)用的優(yōu)勢

3.1利用計算機構(gòu)成的題庫系統(tǒng)自動化程度較高，可大大提高命題效率，使教師有更多時間和精力開展科研、教學及管理工作。它避免了一張試卷、多處統(tǒng)考的弊端，為現(xiàn)代化教學管理提供了有利的手段。

3.2基于項目反應(yīng)理論（IRT）的題庫試題可以與施測樣本無關(guān)，即使在不同時間內(nèi)進行考試，其測量結(jié)果也是可以比較的。題庫的建設(shè)有利于學生自我檢驗學習成績，有利于教師出題考試及判斷教學效果。

4.結(jié)語

計算機在考試中的應(yīng)用已從最初的考務(wù)管理、監(jiān)考等工作延伸到計算機化測試和計算機評卷等方面。機輔語言測試采用考生直接輸入答案的形式，與人工閱卷相比，減少了由于人為因素導致的計分過程中產(chǎn)生的誤差。計算機超凡的記憶力和準確率使閱卷記分等誤差降到零，在很大程度上保證了測試的公正性、客觀性。基于機輔測試的上述優(yōu)越性，其越來越“橫行”于語言測試領(lǐng)域。計算機自適應(yīng)語言測試由于題量靈活，時間可長可短，測試后能即時記分并報告成績，實效性和經(jīng)濟性強，其無可厚非地成了今后語言測試的發(fā)展方向。

隨著計算機人工智能、語音識別、光學字符識別等技術(shù)的發(fā)明，不久，我們將能夠?qū)崿F(xiàn)計算機與考生直接交互、識別和判斷書面甚至口頭語言進行評估。由此可見，實現(xiàn)語言測試的現(xiàn)代化，與世界接軌，是大勢所趨，是我們今后改革外語測試、提高外語教學質(zhì)量的必備條件。當然計算機語言測試作為一種新興測試方法，存在很多不足。我們必須遵循其特點和規(guī)律，開發(fā)出符合考試發(fā)展和需要的計算機化語言測試。

參考文獻：

[1]張權(quán).計算機化的語言測試：現(xiàn)狀與發(fā)展[M].上海：上海外語教育出版社，2001.55.

[2]何克抗.建立題庫的理論[A].全國CBE學會第七屆學術(shù)會議論文集.國防科技大學出版社，1995.

[3]楊滿珍.20世紀90年代國外語言測試的發(fā)展[J].外語教學，2002.104-106.

[4]顧海根.一種新的測驗形式——計算機自適應(yīng)測驗[J].上海教育科研，1999.5-7.

考試周刊2014年54期

考試周刊的其它文章: 挖掘內(nèi)在潛力，讓學生富有個性地學習; 初中語文閱讀教學淺探; “語文實踐”在初中語文教學中的實施現(xiàn)狀及教學建議; 體驗快樂，感悟魅力; 初中語文高效課堂教學評價初探; 初中語文高效課堂模式的實踐與探索