吳卓婭
摘要 研究了大連理工大學英語新模式課程評價體系,包括學生課堂評價、網絡學習記錄評價以及成就測試等主要評價手段的具體應用問題,重點分析了各種評價手段在應用過程中所具有的優勢以及尚存在的各種問題和不足,以期使這些討論能促進未來評價體系的改進與建設。
關鍵詞 終結性/形成性評價 替代評價 反撥效應 效度/信度 可行性
文章探討的是大連理工大學大學英語改革后課程評價體系和應用問題。新的評價體系由形成性和終結性評價組成。該體系比較復雜,它包括不同教學目的不同課型、不同種類和在不同階段的評價手段。“每種手段各有其優勢和不足”Brown and Hudsons(1998),對這種結合式評價體系的研究將為改進英語課評價的效度和信度提供有益的數據。事實上,這種綜合評價體系仍然存在許多值得探討和解決的問題。目前,基本的評價手段正在從終結性評價(期末一次性成績考試)向形成性評價(各種有選擇的階段性考評)轉變。Hancock把這種形成性評價定義為“它是一種過程,這期間學生和老師用非傳統方式用語言對學生的學習做出評價。”(1994)這種評價要求學生在課上展示、表現并促使自己有較高的思維。如此,老師是根據學生在課堂上的表現進行評價的(Brown & Hudson,1998)。所以,這種評價體系下,注重的是學生的學習過程、他們的參與度和對學習的投入。首先,學生們一開始就了解了這種評價體系和期末最終成績的構成。以大學英語讀寫課為例,期末最終成績是:課堂口語成績占10%;期末口語考試占10%;網上自主學習占10%;課堂閱讀和寫作占10%;期中考試占10%;期末綜合考試50%。這種方式是使用反撥效應的一種。因為這種評價,可以使那些想要拿到好成績的學生不會把學習推到期末。也是因為要經常在課上進行這些評價,而且這些評價任務要占很多的教學時間,所以,教學和評價是很難分清楚的。換句話說,所評價的是“學生此刻學得怎樣”,而不是“學生已經學得怎樣”。因此,學生單獨一次性的期末考試對教師未來的教學啟示,遠不如考察學生課上的表現。
一、課堂表現評價體系Kassim Shaaban (2001)的一篇文章探討了各種選擇性的評價手段。其中,大部分是考察學生們在課上的日常表現。如對面試、角色表演、筆頭描述、集體展示、模擬會議以及學生自評。在大連理工大學,口語課主要采用對學生的課堂表現進行評價的方式(這種考核約占課堂教學的30%學時)。課上,通常要求學生完成模擬真實場景的并有創造性的練習。這種練習形式多樣,有兩人一組、角色表演、小組討論、小組代表做匯報、迷你劇表演、3分鐘演講、圖片描述、辯論和小型口語對抗賽等。(這種評價方式能夠有效彌補幾次有限的考試所造成的考試信度的問題)。具體來說,如果由6個人一組表演的迷你劇,評價結果將根據組內每個學生的語言面貌、內容的趣味性和合作效果來綜合評判。 課堂表現評價的總原則是口語的話題和展示形式(無論是個人,一組還是小組活動等)。可以達到彌補內容匱乏和形式單一所造成的效度問題。 對這些表現的評價,可以是較正規也可以是隨便一些。學生的即席表演也可以依據老師的評判記錄分數,但這只是考核中一個小部分。大部分正軌考核都是要事先布置好,學生課下做好準備。 教師布置的任務一定要進行計分考核。也有的任務,學生可互評。(這項做法可以彌補因其主觀評分所造成的考核信度的不足問題。也能使學生在互評中相互學習。)例如,在進行3分鐘口語對抗賽時,可以請學生作評委,他們根據老師定的評分標準。老師還可以更詳細的給出什么樣的問題和回答是好的,如“The speaker has made himself heard.”“I like his way of delivering his speech.”。還要強調肢體語言和目光的接觸問題。期末口語考試時,任課班教師可以互換班級進行考試。(該方法可以彌補自己班教師評判的主觀性。)課堂上對學生的各種評價是教師了解學生語言能力,文化、教育背景和經歷、他們的學習態度、目標、喜好以及其他一次性終結考試所不能體現出來的特質和信息(Genesee,1996)。此外,還可以讓學習者對學習有自我控制和責任感(Genesee,1996)。教者可以創造出一種學習環境,無形中把學習的責任傳遞給學生。但對這種評價模式的反饋還是多種多樣的。第一,模式的實用性。這種按課堂表現的評價方式很耗時,需要占據很大一部分課堂時間。某種程度來說,該評價模式已經替代了原來檢查教學效果,成為加強教學的方式。第二,學生課上也許并不覺得輕松。雖然非正規的一些課堂評價標準還不是很嚴格,有時也不留記錄,因此,也會減弱其效力。此外,課堂活動也會使教師和學生都感到具有過高的挑戰性和緊張感。
二、學生網絡學習評價體系目前,流行的網上學習課程提供了一種新型的評價形式,它似乎不屬于任何一個類別Brown and Hudson (1998)。學生網上學習記錄是計算機提供的簡易統計數據,可供日后查閱學生的日常學習情況。這里,網上學習占課程學習的10%。學生可以利用自主學習平臺在他們方便的時候和機房進行網上學習。學生可以利用所有的網上資源。目前,主要考察學生網上聽力、閱讀和寫作。教師給學生規定幾個學習節點,以便是他們都能根據老師安排的統一步驟完成學習任務。對于新的學習方式和評價方式,學生們還是饒有興趣的,好處也很明顯。學生可以自己安排自己的學習進度。自己決定什么時候學習、在哪學習、做幾遍聽力練習,甚至可以自己控制音頻的速度,等等。學生們還可以通過互聯網和老師進行互動。不在老師的監控下學習使他們感到輕松,并可以重復做練習、延遲提交作業直到覺得滿意為止。計算機上有較詳細網上學習記錄,這些記錄是一種較簡單的統計,教師可據此來跟蹤學生的學習情況。但是問題也是顯而易見的。因為有作弊的可能性,學生網上學習記錄的信度風險度較大。比如,一個同學可以給另一個同學做網聽;或者可以從他人那里得到答案。有一次竟然出現了一些學生幾分鐘內以100%的正確率完成了他們的網上作業。學生上網操作和對計算機的熟悉度是不一樣的,那么,這樣的結果勢必消弱這種評價手段的信度。盡管如此,使用該系統的可行性還是很大的,因為只需從某外語教學出版社引進這個系統就可以上網了。endprint
三、學業成績考試學業成績考試最重要的評價手段就是期末考試。其目的就是測試出每個學生根據既定目標是否取得優異的成績(Huges,1989)。考試按照教學目的設計,教學目的是依據課程要求制定《大學英語課程要求》(2007)。這種考試形式受到我國現行的大學英語四、六級考試的影響。因為四、六級考試是大學畢業的前提(許多大學和院校),同時也是將來畢業求職的一張牌。大學英語考試委員會有極高的影響力,考試帶來的沖擊影響著教育部政策制規定者們。大學英語作為大學的一門課程直接由教育部指導的課程,這是典型的測試反撥效應的作用(Cheng,2000)。盡管我們不在課上教考試技巧,但教學大綱中的教學目的卻要和大學英語四級考試水平一致(教學大綱,2006)。在我們學校,盡管四級考試和學生能否畢業不在掛鉤了,可是教學目標仍需和大學英語四級的基本要求相符合。為了相適應,入校新生要參加英語入學考試,之后,會被按考試成績分配到相應的大學英語1~4個級別。在各級別的英語課中,所選擇的教材、教學目標和考試形式還是和英語四個級別的要求一致,除了幾個個別高級別的班級。所以,上述所提到的考試反撥作用確實有其根源。所有級別的期末考試都采用大學英語的考試形式,除了口語要單獨測試,卷內包含各種技能的試題形式,有如下幾個部分:聽力(多項選擇和綜合填空題);閱讀(快讀和仔細閱讀);綜合技巧(完形填空,改錯和翻譯);最后是寫作部分。可以注意到在絕大部分的題型中,都是由選擇題和主觀題組成。比如,聽力試題中既有選擇題又有填空題。快速閱讀采取了對或者錯的簡單回答方式。閱讀題中,既有多項選擇題又有簡短回答問題的主觀試題,有時完形填空和改錯題交替出現在試卷中。所以,考試的總趨勢是傳統的測試形式已不再是很固定了。測試綜合水平的要求在升高。由于有了計算機,主觀題的測試部分可以進行機考,接下來的主觀口語測試部分還需老師付出很多時間,同時教師互換班級以求提高考試的可信度。客觀試題試卷中,30%的內容依據教科書,70%的內容則選自課外同等水平的材料。對此考試的反饋如下:第一,70%的考試內容選自課外材料有許多弊病。教師在出考試題時,每個人負責出一部分題。但他們每個人對四級水平的試題的理解是各不相同的,同時,1~4級之間又沒有嚴格的區分。更糟糕的是,我們所使用的教科書的內容也是沒有嚴格的等級區別的。第一冊書和第二冊書只是在主題和詞匯上有一定的區分,而難易度并不明顯。結果是,考試題的信度和效度成了問題。試卷的一部分或者整個試卷不是容易了就是難了,更不用說有的老師在出題過程中有粗心大意的狀況。第二,教師分別工作在各自不同的級別小組之中。因此,1級組出題老師出的快速閱讀題結果可能比2級組的快速閱讀題還要難。這又一次證明了試題的效度有問題。第三,每學期開學后,各項教學如同機器一樣快速運轉。考試前沒有教師有能力關心試題的效度和信度。雖然我們期末也做一些常規的試卷分析,但這工作是形式作用大于對實際工作和未來評價的作用。所以,學校考試主要得益于大學英語四級的反饋而不是平時的考試反饋。第四,目前也有一些試題庫。但其質量堪憂。試題庫的開發需要對試題作嚴格的選擇,也要保持教科書的信度和相應的難易度。那么,試題庫的建設還是有較長的路要走的。最后,本課程評價方式主要是標準參照考試。所以,學生A、B、C、D成績的等級分布不是很合理。這也使得學生們在成績方面處于劣勢。尤其是當他們出國留學和需要提交本科成績時,拿不出理想的成績單。
四、結語整體課程的評價體系很復雜也很難操作。老師和學生都有壓力感。有些老師不滿意,他們質疑改革的區別在哪,因為這種考試的結果和從一次考試就能得到的成績幾乎相近。這些所謂的“麻煩”值得嗎?因此,該評價形式的價值和效果需要進行驗證,目前出現的問題也需要得到解答。更重要的是,怎樣面對廣大學生推出一份合理、公正和正確的考評機制。
參考文獻
[1]Brown,J.D. & Hudson,T.Alternatives in assessment. TESOL Quarterly,1998,32,(4):653-675.
[2]Cheng,L.Washback or Backwash: A review of the impact of testing on teaching and learning. ERIC Document,2000.
[3]Genesee,F. Classroom-based Evaluation in Second Language Education,Cambridge University Press,1996.
[4]Hancock,C. B.Alternative assessment and second language study:What?and why?ERIC Digest.1994.
[5]Huges,A. Kinds of test and testing. In A. Hugh,Testing for language teachers. Cambridge: Cambridge University Press,1989.9-21.
[6]Shabaan,K.Assessment of Young learners.Forum,2001,39(4):16-27.
[7]教育部高等教育司.大學英語課程教學要求.清華大學出版社,2007.
[8]全國大學英語四、六級考試委員會.大學英語四級考試大綱.外語教學與研究出版社,2006.endprint