【摘要】為了進一步提高我國各類外語考試的客觀、公正和有效,本文根據考試目的和作用,測試信度和測試效度,對目前我國組織的各類大規模外語考試和學校的教學考試進行了對比分析,以期為政府行政決策、學校教學改革、用人單位外語評價等不同需求提供可靠保障。
【關鍵詞】外語;教學;考試
隨著國際化全球化的趨勢日益明顯,作為思想的載體和信息傳達主要方式的語言是國際化交流的主要工具,外語學習就成為各國科技文化交流的基礎。為了考核外語人才的語言運用能力和滿足社會生活的需求,我國目前組織了大規模的各類外語考試,既有面向社會的國家英語等級考試,也有針對學生的高中英語會考,高考外語,大學外語四、六級考試,外語專業四、八級考試,研究生外語考試,還有職稱外語考試等等。而作為衡量外語教學成效和提高外語教學質量的重要手段之一的學校教學考試也不容忽視。
一、考試目的和作用
語言測試的主要目的是對被試語言能力進行準確、公正的測量與評價。2014年10月30日“國家外語能力測評體系建設啟動會暨中國英語能力等級量表研制總體方案論證會”上獲悉,我國啟動首個國家外語能力測評體系建設,提出制定國家外語能力量表,明確外語能力標準和制定適合我國國情的外語質量標準,規范大規模外語考試,建成一套覆蓋大中小學各教育階段、覆蓋聽說讀寫譯綜合能力、覆蓋各種形式外語學習成果的評價系統,使我國的英語教學和測評“車同軌、量同衡”,推動分級教學,實施因材施教,提升外語教育成效,以更好地滿足人才培養和選拔的要求,為政府行政決策、學校教學改革、用人單位外語評價等不同需求提供服務。
學校外語教學考試是外語教學的重要組成部分, 是衡量外語教學成效和提高外語教學質量的重要手段之一,了解學生語言掌握程度和語言運用能力, 及時調整教學方法和教學進度, 有效提高教學質量。自從1967年美國著名評價學專家斯克里芬(Scriven) 提出形成性評價(formative assessment),各中高等院校的英語教學逐步廣泛應用這一評估方式, 并配合總結性測試, 以達到教學與測試為一體, 教學質量不斷提高的目的。學校外語教學考試正是結合了形成性評價和總結性測試診斷教育方案或計劃及教育活動中存在的問題, 為正在進行的教育活動提供反饋信息, 以提高實踐中正在進行的教育活動質量的評價。布魯姆(Broome)曾經明確指出, 教學考試的主要目的是考查了解給定的學習任務被掌握的程度、未掌握的部分, 它的目的是為了幫助學生和教師把注意力集中在為進一步提高所必需的學習上,既指向正在進行的教育活動, 也針對教育活動全部過程。它既是分析性的, 嚴密交織在教學過程中的, 強調教師和學生的信息反饋, 能幫助查找教學和學習中存在問題的原因, 便于及時采取全新的或補救的措施;也是總結性的,以便決定是否需要對教學和學習活動及時進行調整。學校教學考試中的形成性評價旨在反映與培養學生的能力結構,總結性測試反映出學生知識的獲得和認知加工技能,為了逐步培養學生的能力。
只有建立在對語言測試理論的內涵及其基本要求、 測試的類型、現狀、缺陷等充分了解和思考之上的,學校考試才能真正做到科學、合理、有效的測試,充分發揮測試的教學正面反撥作用。反撥作用( Washback)是語言測試的后效,專指在教育領域中語言測試對外語教與學的影響或反饋作用。考試對教學產生兩種不同的反撥效應:有促進作用的正面反撥和有消極作用的負面反撥。正面反撥作用能推動教與學的發展,而負面反撥則會使教與學走入歧途。科學有效的學校考試可以與教學和學習形成良性互動。其一,測試服務于教學又影響教學,科學的學校考試可以為師生提供正確的反饋信息,通過測試,教師可以認識到教學中的問題,進而對教學計劃、教學內容進行調整,改進教學方法。其二,學生通過測試可以掌握自己對知識的掌握情況,促進學習的積極性,增強學生學習動力。
二、測試信度
語言測試的信度(reliability)是指考試結果的可靠性和穩定性。也就是指同一考生在不同考次或不同測試條件下使用同一個考試,或使用平行試題進行考試,所獲得的分數(如果不計測量誤差) 具有一致性。(劉潤清:210)
大規模外語考試的信度做到以下四個方面的標準化:試題編制標準化、考試實施標準化、閱卷評分標準化以及分數轉化與解釋的標準化。為了保證測試的信度,必須制定考試規范、命題準則,專業培訓命題人員,題目必須經過“命題—審題—試測—試題項目分析—終審—拼卷”,整個周期需要超過一年的時間,證明每道試題的質量都是可靠的、且難易程度和區分度都在控制范圍以內,然后用于實際測試。
為了得到學校考試對教學的積極作用,Hughe給語言教育者提出了建議:首先,測試你希望學生提高的那部分能力;其次,測試相關能力的時候,盡可能多地給學生任務來完成;第三,使用直接測試方法;第四,使測試標準參照型;第五,教學考試應基于教學目標;第六,確保考試被學生和老師了解;第七,有可能的話,給教師提供輔助培訓。題目可由多個英語教師試做,可先期發現試題中出現的問題,并增加試題的信度。
三、測試效度
測試效度(validity)亦稱測試的有效性,指一套測試對應該測試的內容所測的程度。也就是說,一套測試是否達到了它預定的目的以及是否測量了它要測量的內容。
大規模外語考試不僅應試者人數眾多,而且考試結果可能影響考生的命運,所以它的設計、開發和實施有一定的質量標準,以保證命題的科學性、評分的一致性、組織的嚴密性,成績具有可比性和可解釋性。因此,專門的考試機構遵循專業的質量標準,由經過訓練的專業隊伍開發、設計和實施以確保考試的公平公正。從設計開發、命題、施考,到成績發放包含諸多環節,每一個環節的失誤,都會對考試的結果產生不可彌補的影響,必須為每一個環節制定相應的專業標準,以規范教育考試行為,這樣的標準將為評價一項考試及其實施的后果提供依據。我國在參照國際上的已有經驗,結合我國實際,也在制定我國自己的教育與心理測量標準。
學校外語教學考試主要是對學生所學知識的綜合運用能力的考察,真實地測試出學生對信息的捕捉能力、理解能力、概括總結能力,語言表達運用能力。為了保證測試試卷的科學化、規范化,能客觀公正的評價教學質量,使測試積極反撥于教學,考題效度注重的是以下幾點:1)符合教學大綱的要求。內容上有相當的覆蓋面和側重點,難度與學生的實際水平相吻合,但不會為了增加及格率而人為的降低難度。2)測試項目保持相互獨立。這要求受試者對一個測試項目的反應不影響其它測試項目的反應。3)題項內容不對答案有提示作用。4)時間的控制和題量分配恰當。如果標準考試時間為120分鐘,而大多學生在30分鐘就交卷或120分鐘后都沒有答完試卷,就表明此次測試失敗。5)主客觀題型的比例得當,做到既重知識又重能力。6)建立完善的測試試題庫。考慮到學生的學習環境,學習材料和學生特點等因素,適時適量地安排階段考核并完善考核方式,幫助教師和學生及時發現這總結教與學中的問題。
四、小結
無論是大規模外語考試還是學校的教學考試,都需根據考試的目的和作用,不斷完善考試管理體制,盡可能做到考試內容涉獵的廣泛性和考試方式的多樣性,規范試題的設計,難易程度適中,選材廣泛,分值分布合理,評分標準設計合理,機考規范。在保證測試的系統化和標準化的同時,做到高質公平并不斷驗證改進。
參考文獻
[1]蔡基剛.大學英語四六級寫作要求和評分標準對中國學生寫作的影響[J].解放軍外國語學院學報,2002,(05) .
[2]陳靜,車麗娟.論測試模式變革對大學英語教學的影響[J].東北財經大學學報,1999, (06)
[3]付英,李鑒.大學英語校內測試信度、效度分析[J].讀與寫雜志,2011,(06).
[4]何林.大學英語校內測試對英語教學的反撥作用[J].吉林工程技術師范學院學報,2006, (08).
[5]李蘭蘭.淺析加強大學英語測試中信度和效度研究的必要性[J].長春教育學院學報, 2014, (09).
[6]劉潤清,韓寶成.語言測試和它的方法[M].外語教學與研究出版社,1991.
[7]孫文敏.英語語言測試的改革與英語教學[J].洛陽師范學院學報,2008, (04).
作者簡介
孫麗紅:性別:女,籍貫:內蒙古赤峰市,出生年月:1978年1月,學歷:研究生,職稱:講師,工作單位:呼倫貝爾學院。
《淺析大規模外語考試與學校教學考試》屬于中外語言測試與研究項目》
課題名稱:中外語言測試與研究
課題編號:Y BKT—004
課題負責人:黎 楠
負責人所在單位:呼倫貝爾學院