白水
教育測量與評價,由來已久。據《學記》記載,我國西周時期,就初步建立有一套系統的測量評價方法。隋煬帝時,我國開始實行了科舉制,通過分科考試來選取人才。此舉對世界文化有很大的影響,國外教育界都認為,教育測量與評價起源于我國古代的科舉制度,只是由于我國封建制度的束縛,使得這門學科未得到應有的發展。
“教育測量”這一名詞,最早是由被稱為教育測量的鼻祖的美國心理學家桑戴克在1904年提出來的,但作為一門學科,近半世紀才得到迅速的發展。這是因為,隨著教育的不斷發展,社會需要追究教育質量的優劣,教育本身需要提出辦學確有成效的證據。同時隨著計算機的普及,統計學、心理學的發展,這門學科也就得以不斷發展且日趨成熟了。
教育測量與評價的演變及發展
教育測量起源于古老的考試制度。中國是最早創設考試的國家,可謂教育測量的發源地,但作為一門科學,教育測量學卻是西方現代心理學、教育學、統計學等學科理論與實踐結合的產物。
19世紀末20世紀初,隨著實驗心理學和心理測驗理論的發展,歐美學者對教育測量的基本形式——學校教育考試進行了積極改革和研究。1909年,行為主義學習論首創者桑代克運用心理測驗方法和統計學原理,編制了第一批標準化教育測驗,使教育測量走上了科學化的道路。此后,美、英、法等國家的測驗運動逐步興盛,心理測驗與教育測驗相互影響,并在學校教育背景下不斷融合。各種各樣基于行為主義學習方式的測驗或考試成為檢測學生學業成績、了解教學效果的有效工具。20世紀40年代前后,歐美等國家的一些測驗理論專家開展了測驗的統計數學模型研究,進一步豐富、完善了教育測量學科內容,并在20世紀50年代前后形成了經典測量理論體系。
測量,通常是指人們對客觀事物進行某種數量化的測定。教育測量是對學生的學習能力、學業成績、興趣愛好、思想品德以及教育措施上許多問題的數量化的測定。
評價,是指判斷某事物的價值或某行為是否值得做的過程。教育評價,是按照一定社會的教育性質、教育方針和政策所確定的教育目標,對所實施的各種教學活動的效果,完成教育任務的情況以及學生學習成績和發展水平進行科學判斷的過程。
由于教育測量的對象,多屬于人的心理屬性,如記憶能力、推理運算、思維能力等,故我們只能依據人的外顯行為,比如通過學生對試題的反應和一些行為表現,運用推理、判斷的方法來間接測量出他的知識水平、智力高低和品德好壞。因此,教育測量一般是間接測量。由于教育測量沒有統一的量表,各科各次考試試題難易不同,評分標準不同,使得教育測量的度量單位是相對的。但是教育質量客觀上確有優劣之分,這種明顯的差異完全可以予以數量化。美國測量學家桑戴克與麥柯爾指出:“凡存在的東西都有數量。”“凡有數量的東西都可以測量。”因此,教育測量是可行的。
教育測量的目的在于了解學生的發展變化及其影響因素,為教育評價和教育決策提供依據。學習方式是影響學生發展的主要因素之一。學習方式的演變不斷推動著教育內容、教育方式以及教育結果測量范式的改變。可以說,任何教育測量及評價都是基于“學習”概念的理解。教育測量理論作為教育測量的原理和法則,其發展以及在教育活動中的應用,也受到學習方式變革的影響。
進入2l世紀以來,隨著學習觀念的進一步深化發展,學習概念的各個方面都發生了深刻變化;學習與自然因素、社會環境因素更加密切地交融在一起,影響學習的因素日趨多樣化、復雜化。承載學習活動的學習方式亦由具體的單維形式演變成了抽象的多維系統,學習者在學習中的自覺主動性、獨立體驗性、交互合作性及探索創造性得以充分展現和提升,“學到什么”漸漸在學習的本質中被淡化,“如何學習”、“學會學習”則逐步凸現而成為其核心。學生學習水平的表達已不是某種單維的表征性結果,而成為了一種映射學習主體價值、學習過程與方法以及各種“內在外在”影響因子的多維度、整合性“成就空間”。要實現這種“成就空間”的衡量和解釋,至今為止的任何一種測量理論和方法都是無法勝任的,因此,測量理論的發展也必然進入一個多維化、整合化時期。
國外教育質量監測發展
在美國,20世紀90年代以來,為了提高中小學教育的質量,國家在制定全國和各州的課程標準、改善評價體系方面進行了許多改革嘗試。美國國內將這種改革稱為“基于標準的教育運動”。其中影響最大的是美國國家教育進展評估(簡稱NAEP),又稱為國家教育報告卡,其首要目標是向美國公眾報告學生的教育狀況。2001年,美國推出“美國中小學教育法案”,即《不讓一個孩子落伍》法案,得到了國會兩黨議員的高度認可。該法案確立了NAEP評估模式。
在日本,隨著2l世紀教育改革特別是課程改革的力度不斷加大,通過全國學力調查考試加強對中小學教育質量的監控,提高學生的學力水平,成為日本教育當局越來越重視的重要課題。雖然從上世紀80年代開始日本文部省已在全國開展了“教育課程實施狀況調查”、“特定課題調查”等學力抽樣調查,日本各地方教育部門也紛紛舉辦了地方性的學力考試,但這些抽樣的或地方性的學力調查影響范圍有限,缺乏統一的評估標準,難以全面掌握中小學生的總體學力水平。在這種背景下,日本從2007年起恢復了中斷43年之久的全國學力調查,并將其制度化,以后每年都將舉行這一調查。
20世紀末以來,澳大利亞加大了教育改革的力度。1989年,澳大利亞教育部召開了教育改革會議并發表赫巴特宣言,對教育權威者和學校提出要求:使學生達到較好的教育結果,并縮小學生學習結果間的差距。為了進一步提高學校教育質量,1999年澳大利亞發表阿得雷德宣言,重點指出學生發展和其學習結果的重要性。2007年,澳大利亞公布了一份綜合性的全國學校改革計劃——《澳大利亞學校教育的未來》,開始制訂統一的全國學校教育框架,改革中小學課程,并對中小學的核心科目進行全國統一考試。從2008年起,澳大利亞所有3、5、7、9年級的學生,將參加全國讀、寫、算的統一考試。各州與地區當局還研究把全國考試擴展至其他年級和學科,而未來的考試將隨機選擇學生,而不是要求全體學生參加測試,以避免師生陷入應試教育的陷阱。
教育測量與評價的國內現狀
在當前的教育改革中,關于“升學教育”與“素質教育”的討論相當熱烈。在中學教育中,為什么升學指揮棒如此之靈,其原因之一就是對學校和教師的教學的評價不科學。評價時,只看平均分、及格率、優分率、升學率的高低;而忽略了基礎的差異、學習質量相對提高或降低的幅度、是否增加課時數等等因素。于是一些條件稍好的學校或教師,往往采取一些非常措施,不斷地加課,不斷地加大作業量,使學生節假日都不能休息。其結果造成了一種高分的假象,但學生進入高一級學校后不久,不少人又因學習方法呆板,成績急劇下降。另一方面,更多的學校和教師的積極性卻被挫傷,學生的學習積極性也大受影響。
改革開放以來,我國的教育測量與評價理論研究和實踐也取得一定的進展。教育統計、教育測量、心理測量、教育評價等課程得到恢復和一定的重視。為了盡快縮短與國外的差距,我國有關部門采取“請進來”和“走出去”的辦法,了解國外的科學發展動態,翻譯與編寫了一些教科書,以適應高校教學與科研的迫切需要。與此同時,在老一輩專家的帶領下以及有關部門的支持下,國內一批教學與科研人員大力開展考試學、教育測量、心理測量、教育評估、教育評價、教育統計學的理論研究和實際工作;成立了全國性的教育統計與測量、心理測驗、教育評價、考試學、人才測評等學術團體;促進我國教育測量、教育評價的理論研究與實際工作的發展,體現了“教育測量與評價”學科重要的社會價值和應用領域。
然而,從我國教育科學學科專業建設、學位點建設的實際情況來看,應該說,教育測量與評價的理論研究還不能適應我國教育實踐的需要。許多人對教育測量與評價學科重要性的認識還不到位。特別在教育學科分類和有關學位專業目錄中,找不到教育測量與評價學科的名稱。這與國外的情況很不一致,值得人們深思。
教育測量與評價在教育改革中的角色定位
(一)反饋者
教育本身是一個系統。在教育系統中,學校、教師、學生、教育方案、課程、教材、教學訓練、考試評價等都是這個系統的組成部分。顯然,我們期待教育方案、課程、教學等都能給學生帶來某種變化,但不是說所有的教育方案、課程、教學都同樣有效地改變學生,也不是所有的學習者會按同樣的方式發生變化或有同樣的變化程度。因此,當我們根據教育目標和計劃,把教育方案、課程、教學等因素(輸入條件)作用于學生身上后,需參照教育目標和計劃,對教育效果(輸出)及其輸入條件的妥當性予以測量評估、價值分析和判斷。然后,把這一測量與評價過程所獲得的信息反饋給教育者、學習者以及有關教育決策者,以便改進教育的策略與方案,更有效地達到教育目的。可以想見,在教育系統運轉過程中,除了對教育效果(輸出)要進行測量與評價外,還要針對影響教育效果的諸因素(輸入)進行客觀的分析和評價。教育測量與評價在教育系統中對實現教育目標起著十分重要的作用。
(二)助推器
學校教育考試制度和評價制度是教育制度的一個組成部分,但教育考試和教育評價具有很強的導向功能。俗話說,考試是根指揮棒,就是這個意思。但由于考試特別是像高考這樣的關鍵性考試具有指揮棒的導向作用,因此,在升學競爭激烈、教育觀念落后的情況下,“應試教育”傾向就會出現,教育就會偏離正確軌道,這對培養跨世紀人才和提高中華民族的整體素質來講,顯然是不利的。正是在這種教育與社會發展背景下,我國政府要求所有學校都要全面推進素質教育,并且啟動了國家新一輪基礎教育課程改革方案,把課程改革、教與學的方式改革以及考試評價制度改革等統籌起來。
(三)多棱鏡
教育測量與評價對于教師來說是必不可少的。在教書育人過程中,教師需要作出一系列決策和判斷,需要對學生的性格、能力、成就、態度、興趣、潛能及發展等進行較全面的了解,這就需要采用教育測量與評價多種方法,以彌補教師非正式觀察之不足。教育測量與評價的技術手段不再是唯一的書面考試,而是涉及到測量與非測量的一整套評價技術。測量與評價的內容,不再是應該牢記和不該死記硬背的內容,而是涉及更廣泛的教育目標。既然學生的發展是生動活潑、多樣性的,那么,測量與評價的方法及其結論也應當是豐富多彩、多樣化的、個別化的;測量與評價的目的,不再局限于給學生分等級排名次,而是對學生的發展和潛能進行系統的調查,發現學生的優點與長處,指出學生的缺點與不足,更重要的是要促進學生確立信心,認識自己的相對優勢與弱勢,明確自己的努力方向。測量與評價的指導思想是為了創造適合學生發展的教育環境,而不僅僅是為了選拔適合精英教育的學生。因此,現代教育測量與評價的思想方法對于教師創造性地教學、因材施教、提高教學質量具有重要的作用。教育測量與評價的知識是教師必備的專業知識修養;評價學生的能力是教師職業能力的重要組成部分。在教育教學過程中,科學運用教育測量與評價的有關技術方法,是所有成功教學的基礎。