淺議外語教學評價材料收集中的效度

2013-12-29 00:00:00李聯現

考試周刊 2013年25期

摘要：外語教學評價是提高外語教學質量的重要途徑，而評價信息效度的高低關系到能否反映學生真實的外語水平。本文就效度的定義、效度的收集方法、信息的收集方法等進行了探討，以期為教學提供準確的評價信息，使教師準確把握學生的外語水平，有針對性地、更好地進行教學。

關鍵詞：外語教學效度評價信息

對于外語教學，我們通常采用定性（質性）和定量性（量性）信息進行評價。在評價中，信息的質量是至關重要的。無論我們采取什么方法收集信息，必須始終關注用于評估的信息的質量。信度和效度是信息質量的兩個方面。信度是指信息的一慣性和穩定性，效度是指信息的相關程度。信度和效度是判別信息質量的關鍵[1]。同時，在收集評價信息時還要注意所采用數據的實用性，在此我們主要探討外語教學評價中效度的收集問題。

一、效度的定義

效度是我們所收集的材料對我們所要了解的對象的特征或屬性的真實反映的程度[2]。這是對效度最直接的定義，但還有一些隱含的意義需要引起注意。首先，我們想要準確知道的對象往往不是一個容易回答的問題，特別是當涉及外語學習時。比如，什么是交際能力？什么是外語學習的潛能？什么是關于基本句型的知識？所有這些問題都是教師和語言學家們長期以來爭論的問題。其次，我們最關心的是信息的真實程度。例如，在一個有關學習背景的面談中，我們得到了大多數學生的學習背景的準確信息，但也可能會有個別同學給出了不準確的信息。有的學生在這種情景下傾向于夸大其詞，而有的卻對以前的經歷描述不足，這可能是為了增強或者削弱采訪者對其外語能力的判斷，或者僅僅是因為他們記不清了。這些回答表明了每個應答者學習英語的時間的長短，而實際上還被當成了效度的指數。

正如信度一樣，效度也用0.00～1.00之間的數字來表示。完全效度用1.00來表示，而沒有效度用0.00來表示。這些數字表達的只是理論上的區間，在實踐中，我們永遠沒有辦法確定我們在評價過程中的效度，而只能估計。而在評價中，我們也不可能期望有完全效度的過程。我們應該認識到，信度和效度有一些很重要的關聯。首先，評價儀器或過程只具有它本身本次所具有的可靠性。也就是說，其他次別就可能會和本次不一致，而這些不一致的過程會降低評價的信度，評價結果會受到這些因素的影響。其結果是，這些因素會導致產生不一致的、錯誤的信息。過多的信息也會降低效度。例如，對年齡的態度會影響學生對調查問卷的回答。其次，沒有效度目的傾向的測試可能更可靠。比如，在評價表上有一個問題問學生對老師的印象。在不同的場合，學生可能會給出一致的答案。但他們這樣評價老師是因為他們覺得這是一種被欣賞的社交應答方式，或者他們害怕老師看到他們的評價而給低分。他們對老師的真實感覺可能完全不同，但回答卻是一致的。

二、效度的估計

效度與信度一樣，不能直接評價。要評價相關信息的效度，我們必須對評價對象的真實性或狀態有確切的把握，以便將其與我們收集到的信息進行比對。在人為評價的范疇內，大多數優秀的評價者不是對他們的評價對象而是對直接評價更感興趣。因為沒有直接的方法能使我們了解到我們所感興趣的對象的品質及能力的真實水平，我們只有一些關于這些對象的信息，通過此了解我們所感興趣的對象，即只有通過間接的方法估計信息收集過程的效度。在評價中，我們收集信息的目的是能對有關學習或教學作出符合邏輯的判定。如果我們收集的信息有助于達到這一目的，就可以認定得出這一結論的信息和過程是有效度的。依據我們想要得出的結論的種類，我們選擇所要評價的信息效度的收集方法。主要有三種方法[3]：

1.內容相關度

內容相關性是指通過有邏輯的、詳細而系統的方法檢測評價的內容、方法和過程是否代表了我們所想要評價的語言技能。內容相關性對評價來說很重要，因為外語教師常常想知道學生在某一特定場景或某一類型的情境下的表現，而在這些場景下教師無法通過詢問評價學生的表現。因此，評價學生在某一限定場景或者我們不感興趣的場景下的表現是很有必要的，通過總結這些評價結果，我們能得出我們所感興趣的場景下學生的表現。

內容相關度在分班考試中非常重要，在標準測試中也很重要。在這些測試中，測試內容是否代表了教師所教的語言技能或評價了教師最感興趣的東西是一個關鍵問題。如果摸底考試的內容不能準確反映課堂所教的知識，學生在考試中的成績就不能準確反映他們在這些課程中的表現。換句話說，如果摸底考試中所考的語言技巧和教學中所教的語言技巧之間沒有或幾乎沒有聯系，我們就不能通過摸底考試準確判斷學生對這些課程的學習情況。

2.標準關聯效度

標準關聯效度是指用一種方法評價信息的屬性或者特征與用另外一種方法評價同一信息的屬性或特征所得出的結果之間的關聯程度。標準關聯效度可以通過統計計算得出某一評價和標準之間的一致程度。通常用0.00（無關聯效度）到1.00（完全關聯效度）之間的關聯效度指數來表示。

3.結構效度

結構效度對課堂評價來說可能是最難理解且用途最小的一種效度。下面的例子可能會幫助我們理解什么是結構效度。英語老師想要知道學生對于學習英語重要性的認識，于是讓學生在“很重要”、“重要”、“不重要”之間進行選擇。隨后他將學生的選擇與他們的英語成績相比對，結果發現，那些認為英語學習“很重要”的學生都是班里學習最好的學生。因此他得出這樣的結論，評價是有效度的，因為通常來說，學習動機越強的學生成績會越好。結構效度在我們不了解要評價的內容的準確的屬性和特征時最有用，因此它不能用于內容效度。

如信度一樣，評價過程的效度也可以通過鑒別影響效度的因素來確定。比如，在考試成績方面，除了學生的外語水平外，其他因素也可能會影響學生的成績。如果有許多其他因素影響學生的表現，那么將這個評價過程作為衡量外語水平的標準就會效度很低。要提高信度，往往需要消除、減少或者將這些因素考慮在內。

三、信息的收集方法

外語教學評價需要收集大量的教學信息（教學目的，教學計劃，教學實踐）、學生信息（學生需求，個人背景，語言閱歷，學習成績，學習態度和感受）、教師信息（語言經驗，語言技巧，教學態度）、學校信息（學校的教學和人力資源）等。可以采取不同的方法收集不同的信息。考試可以用來收集學生學習成績方面的信息，但不能用來收集其他方面的信息，而其他的數據收集方法卻適合收集這些信息。比如，課堂觀察和學生會議可收集到學生在閱讀和學作中所使用的策略；對話記錄能說明學生課堂學習的態度；學校記錄，課程檔案，或其他的資料能說明學校的管理和人力資源情況，也能說明教學本身。

有些信息的收集是直接的，不需要特別準備的，比如，查看學校記錄和教學資料。在這種情況下，我們就可以了解到與此相關的信息，進而了解其內容。其他方法，比如檔案袋法、會議法、調查問卷法需要事先準備并有一定的程序。

我們不必在任何時候都要用所有方法收集信息，而是要決定哪個或者哪幾個是某一特定場景下能使我們作出最合適的決定的最恰當的方法。何況，并不是所有的方法都適合我們所要收集的用于評價目的的信息。有些方法（比如，會議和日志）既可用于教學又可用于其他評價目的。因此，教師可以選用一些方法作為評價活動的一部分，而選用何種方法則要由他們的評價目的來決定。

參考文獻：

[1]Brian K.Lynch.Language Program Evaluation[M].Shanghai：Shanghai Foreign Language Education Press，2001.

[2]Fred Genesee Johna A.Upshur.Classroom-based Evaluation in Second Language Education[M].Beijing：Foreign Language Teaching and Research Press，2005.

[3]James Dean Brown.The Elements of Language Curriculum：A Systematic Approachto Program Development[M].Beijing：Foreign Language Teaching and Research Press，2001.

考試周刊2013年25期

考試周刊的其它文章: 敢問路在何方; 對企業人本化管理的探討; 幼兒教師如何與幼兒交往; 激發主體性，提高運動活動中的師幼互動質量; 走進童心; 如何做好中等職業學校里的班主任工作