淺析大學英語語言測試中的信度與效度

2015-09-10 07:22:44曹娟

考試周刊 2015年103期

曹娟

摘要：語言測試是大學英語教學過程中必不可少的一環，是檢測外語教學成效和提高英語教學質量的重要手段。本文首先說明了信度與效度的定義及關系，然后以分析廣泛用于大學英語測試中的多項選擇題為入口，發現大學英語在應試教育的指揮棒作用下有普遍追求高信度而忽視效度的傾向，提出當前大學英語語言測試的取向應是效度重于信度。

關鍵詞：效度語言測試信度多項選擇題

1.信度與效度

1.1信度。信度是什么？信度是指測量的結果要有穩定、可靠和一致性，一般情況下，多以內部的一致性表示測驗信度的高或低。信度的系數如果越高，此測驗的結果就越可靠、一致、穩定。由于系統誤差始終以同樣的方式影響測量值，不會造成不一致性，因此系統誤差對信度的影響可以忽略。相反，隨機誤差卻可能因為導致不一致性而降低信度。我們可以把信度定義為隨機誤差r影響測量值的程度，如果r=0，就認為信度最高，測量是完全可信的。在大學英語測試中，信度表明了試題、應試者及分數之間相互的關系，而影響試題的因素很多，包括考試的相關組織形式、試題質量和試卷的評判等。測試者要想確保有較高的信度，必須首先保證試卷有一定的量。一般情況下，試題量愈大，信度就愈高，而且考試的分數必須有一定的分散性，即兩頭小，中間大。那么，怎樣才能達到這個標準呢？首先，試卷要能很容易被區分開，這樣方能將不同水準的考試者區別開來；其次，試題要具備適宜的難度，既不能太難，又不能太簡單，否則測不出考試者的層次；最后，試題應具有同質性，也就是說，要考的內容屬于同一個范圍，試題與應試者之間具有相互適應性。

1.2效度。效度指什么？效度指的是一種相關性，表示的是測試與測試目的的相關度。我們可從以下兩方面進行理解，首先，想考的內容與所考的內容是否是一樣的；其次，考試能否達到目的。效度是考試的關鍵所在，即如果某項高信度的考試沒有考到應考的內容，那么這項考試效度就低。各種考試種類多，規模大，但大多數只管得到成績，很少有人考慮成績是否有效，命題人員很少分析考試的結果。如果命題人對所命的題缺乏足夠充足的反饋信息而命題，那么題目的水平就難以得到提高。最近幾年開始有一些考試的分析研究，但只限于研究信度，對一些大型的如CET等考試，需要對其展開效度調查和研究。原因是在一項測試中，效度信度同等重要，若其中的任一項被忽略，命題的質量就無法得到保證、

2.語言測試中效度與信度的關系

第一，信度與效度是辯證統一的關系。一個語言測試擁有以下兩個基本的過程：一是確保語言行為能有效說明受試者的語言能力，并在此范圍內選擇樣本；二要確保受試者的語言行為能被測試結果準確真實地反映出來。因此，語言測試效度反映的是語言能力與所測語言行為的關系，而語言測試的信度則表明考試結果與語言行為的關系。如果沒有信度，那么測試人員難以借此測量出任何東西，該測試不能真實地反映被測試者的語言行為。相反，無效度測試也是沒有意義的，因為沒有效度的測試準確地測量出了與語言能力毫無關系的東西。在此情況下，測試者同樣沒辦法根據測試結果推測被測試者真實的語言能力。綜上所述，效度信度要在一起方可實現某項語言測試的目標，二者具有辯證統一性。

第二，信度與效度是相互對立的。信度要求語言測試彰顯語言的科學性，即將語言進行劃分處理，并要求測試題目具有同質性，如此方能使語言測試的內容與形式與語言應用的真實情況脫離開來；效度則聲稱語言測試需關注語言的整體性、藝術性及題目的多樣性，并且，測試的內容與形式應符合語言應用的真實情景。因此，任何測試題型、任何測試，都不能同時兼有極高的效度與信度。以真實語言為內容的交際性測試能保證較高效度，而強調以分散性為主要特征的語言測試則能確保較高的信度。

3.多項選擇題信度效度剖析

3.1題型信度分析。一是題目具有客觀性。廣泛存在于大學英語測試中的多項選擇題是通過測試學生所掌握的詞匯、語法、語音等知識，推斷學生構建句子、理解句子及語篇的能力。由于此種題型考點層次比較低，因此，在有限的時間內，多項選擇題語言點覆蓋面較廣泛，而且通常題量較大，這會讓評閱試卷的人能夠更準確地推測出考生對語言知識的掌握程度。因此，多項選擇題擁有較高的信度。而且，只要某多項選擇題被用于語言測試，那么它的評分就不會受到一些人為因素的干擾。所以，多項選擇題具有客觀性。

二是評分的客觀性。只要多項選擇題的題目被設計好，每個題目的分值比例被確定，那么閱卷人對其進行評閱就很便捷。在規模比較大的語言測試中，此優越性特別受人們的歡迎，原因是多項選擇題題型的答案已經是固定了的，評分非常客觀，完全不會受到不同評卷人主觀情緒等因素的影響，甚至可以使用電腦進行閱卷，能維持很高的評分信度。

3.2題型效度分析。第一，英語語言能力包括聽、說、讀、寫，多項選擇題只能測試被測試者的language receptive ability，即語言接受能力，如聽和讀，卻不能測試被測試人員的language productive ability，即語言輸出能力，如寫和說。多項選擇題孤立地測試組成語言的元素，忽視了聽、說、讀、寫這些元素在真實語境中的相互作用功能。然而，語言的本質不單單是各要素處于孤立狀態而呈現出的特性，更重要的是這些要素在語言整體系統中相互作用而體現的功能。綜上所述，多項選擇題考察的僅僅是學生的語言形式識別能力，而對語言的輸出能力和語言知識的運用能力無從判斷，也無法測試出學生的語言知識與語境特征相結合時的創新能力。

第二，多項選擇題題型有些時候所測試的只是受試人員的猜測和推理能力，而不是他們真正的語言運用能力。

考試大綱不能依據考試內容設定，不應該把語言技能訓練的主要方法定義為考試技術訓練，正常教學不能被測試取代。大學英語語言測試不僅要重視信度，更要思慮其效度，效度要重于信度。通過上述對多項選擇題題型的信度效度剖析，可知多項選擇題題型的優點與弱點并存，既有其他類型題型所無法比擬的優點，又具有語言使用不真實、不能測試受試者語言輸出能力等效度方面的弱點。筆者認為對待該題型應采取科學和理性的態度，可通過采取綜合考慮各項語言技能、不同考試不同對待、保證命題質量、提高試題效度等策略。

參考文獻：

[1]孫成崗.現代語言測試與試卷分析[J].解放軍外國語學院學報，2000（4）.

[2]牛強.現行高校英語測試中的問題[J].外語教學與研究，2001（2）.

考試周刊2015年103期

考試周刊的其它文章: 南街社區高血壓管理模式研究; 陶行知的生活教育理論在幼兒教育中的指導意義; 論“心理效應”理論概念及其對幼兒教育的影響; 勤于躬耕，收獲希望; “兵教兵”模式在班級管理中的運用; 如何做好高中班主任班級管理工作