
教育評價作為當前課程改革的重要內容之一,人們對它已越來越關注并進行了相關的研究。檔案袋評價法(Portfolio Assess-ment)又譯作“成長記錄袋”評價或“檔案錄”評價,與國際學生評價項目(Program for Interna-tional Student Assessment簡稱PISA)作為當前國際上較為流行且得到普遍認可的兩種評價方式,勢必會對我國的教育改革產生影響,使人們對教育評價問題進行重新反思。檔案袋評價法和國際學生評價項目是近些年由國外傳到我國的兩種先進的教育質量評價法,其中檔案袋評價法引入時間已然不短且已有部分地區進行了實際操作,但參與的中小學教師和研究人員對它的具體內涵和理念的理解還止步于表層。在PISA從國外引進以來的四次測試中,我國僅有少數地區(上海參加了2009年的閱讀素養評價項目,天津、北京和濰坊則參加了2006年關于科學素養考察在大陸地區進行的試點性測試研究,香港、澳門和臺灣也有參加)參與,且大部分地區對其研究也只是處于引進和描述階段。本文對這兩種評價方法產生的背景、實施的辦法、存在的問題等方面進行對比分析,通過找出其中所蘊含的對我國教育評價政策有所幫助的內容,試圖形成一種適合我國國情的教育評價體系,以期對我國教育評價改革有所貢獻,也希望能夠為教育決策者提供一定的參考。
一、研究背景
進入新世紀以來,社會對教育質量問題的關注與日俱增,因而如何科學有效地對其進行衡量,即教育評價問題,就成為了教育研究者和決策者,以及社會各界關注的焦點。我國新一輪課程改革的一個重要環節就是教育評價改革,其目的是對傳統重分數輕技能、多指責少表揚、重灌輸輕啟發的評價方式進行改革,以期實現“學生的全面發展和終身學習”,關注學生的參與和學習的過程。檔案袋評價法和國際學生評價計劃、項目就是符合這種評價理念的兩種評價方法。
“檔案袋”評價法是以杜威的“學生為中心”、“教學民主化”的教育思想為理論根源,始于20世紀80年代的評價改革思想為思想基礎的評定方法,屬于發展性評價的一種,最先實踐于美國。該評價法通過學生本人、教師、家長、同學甚至社會人士,將體現學生學業表現、心理發展等材料進行有計劃、有選擇性的收集,結合分析和解釋,反映學生在生活、學習和心理上的發展、成就和進步狀況。
國際學生評價項目是經濟合作與發展組織(The Organizationfor Economic Cooperation andDevelopment簡稱OECD)于1997年發起的,為OECD成員國協作監控教育成效的評價項目。該評價項目是建立在終身學習的基礎上設計的測試,十分注重國際間的合作和交流。PISA從個體學習者、教學、學校和教育體制四個層面進行分析,同時還從社會、文化、經濟以及教育因素等方面對學生和學校進行考察。其測試內容包括學生的閱讀能力、數學能力和科學能力,三者組成一個循環體(如圖1所示),而且在每一次評估中只對其中一個主要領域作深入評估。如2000年國際學生評價重點是閱讀素養,2003年轉向數學,并引入了一個新的領域,即問題解決能力,2006年轉向科學,2009年又重新回到閱讀,以此類推。
二、檔案袋評價法與P15A差異分析
理論基礎。檔案袋評價法產生的時代正是杜威的“從做中學”、“教育即生活”教育理論大行其道、建構主義等教育思想蓬勃發展的時代。這些理論所強調的注重學生自我參與性和主觀能動性的觀點對檔案袋評價法的形成和發展產生了巨大的影響。除此之外,加德納的多元智力理論、斯滕伯格的三元智力理論等也對人們重新看待學生發展提供了一種新的角度。
PISA評價方式關注的是學生運用知識技能處理在現實生活中遇到難題的能力,而不僅僅是考察他們對學校特定課程的掌握程度,更注重學生運用在校所學知識能夠做些什么,以及可以做到哪種程度。因此,在國際學生評價項目中貫徹的始終是一種終身學習的理念,即教育是為了生命潛能的充分發展(包括身體、認知、情感和技能等方面的發展)。
評價目標。每一種教育評價方式必有其特定的評價目標,即此項評價測量的是學生哪一項或者哪幾項素質,屬于形成性評價還是終結性評價,其測試結果是可以作為選拔人才標準的還是僅僅作為一個水平和程度的呈現等。
檔案袋評價法不僅具有設計上的創意和方法上的創新,而且符合我國新課程改革“關注過程”、“強調質性評價”以及“教學與評價整合”的改革趨勢。它的進行和實施具有連續性,顯示的是學習者的成長過程。另外,它體現了學習者學習全程的多元信息,在達到教學目標的同時,也注重挖掘學習者隱藏的學習潛能。
PISA評價既是一項選拔性測試,又是一種水平性測試,即通過PISA測驗,其結果既可作為選拔的標準,又能夠看出受測者當時的學業水平。其研究目的是為了了解即將完成義務教育階段的各國中學生(15歲)是否具備了未來生活所需要的知識、技能,是否為終身學習打下了良好的基礎。它關注學習成果的質量,學習成果的等價性和學習機會的均等性,教育過程的有效性和效率,以及教育對社會經濟的影響四個子目標的實現。也就是說,PISA的評估重點并不在于檢驗學生是否很好地掌握了學校的常規課程內容,而主要是在于評價學生是否做好了應對未來挑戰的準備。
評價主體。一項評價主要由誰實施、實施的對象是誰,這便涉及評價項目的主體。PISA項目主要針對的是OECD國家(后來也有一些非OECD成員國家如中國參與)中的15歲的青少年(相當于初中畢業生),測試其是否具備終身學習的基礎知識和技能,因此可以說PISA研究項目的研究對象是確定的。而對于檔案袋評價法,其研究對象則是不確定的。就目前此項研究實施的情況看,研究對象有幼兒園的兒童,有中小學生,也有大學生,甚至有研究者認為對藝術類學科或者學生在幾乎沒有什么壓力的時間段用檔案袋評價,其效果會比較好。因此,無論從研究的適用者方面還是研究的實用性角度考慮,檔案袋評價法的研究對象都是不確定的,相對于PISA研究法,其包括的范圍也更大,更細致。
評價內容和類型。評價內容即研究,它是對學生的某些素質,某些方面進行測量、關注;類型則是根據一定的標準或者衡量尺度對研究進行種類劃分的結果。
檔案袋評定具有極大的靈活性,它的具體構成因使用目的、提交的對象和學生的具體情況不同而產生差異。目前,對檔案袋分類較為權威的是美國學者格萊德勒的分類方法,他依據檔案袋的不同功能,將其分為理想型(ideal)、展示型(showcase)、文件型(documentation)、評價型(eval-uation)以及課堂型(class)五類。理想型,即通過一段時間的成長,幫助學習者成為自己學習歷史的思索者和非正式的評價者;文件型,即用于記錄學生的成長、進步與成就,內容包括學生作品、同學反映,以及教師對其在德、能、勤、績等方面的評價、觀察、考查意見、表現性測試結果;展示型,即用于向家長和其他人展示由學生本人選擇出的最好、最喜歡的作品,以及成果和獲得的榮譽證書、獲獎證書等;課堂型是一種總結性文件,用于向家長、管理者報告學生情況,其具體內容包括根據教育教學目標描述所有學生取得的成績及表現情況的總結,以及教師的年度課程、教學計劃及修訂說明,還有教師給每個學生在德、智、體等方面的評語;評價型,即根據預定的標準,對學生所取得的成績及表現情況進行標準化的評價。還有約翰遜的三形態說,即按照人選材料的性質將檔案袋分為最佳成果型(best-worksportfolio)、精選型(selection port-folio)和過程型(process porffo-lio)三種。另外,根據檔案袋的嚴密程度和是否具有規范性的結構又將檔案袋分為結構性檔案袋、半結構性檔案袋和非結構性檔案袋三種。
與檔案袋評價法相比較,PISA評價法的評價類型則簡單得多,它選擇閱讀、數學、科學素養三個領域作為其評估對象,認為這是現代生活所必須具備的基本知識和基本技能,也是人們應對生活所需的關鍵能力。作為一種循環式的評價方式,PISA評價法每3年進行一次,分別測評學生的閱讀、數學和科學素養。閱讀素養具體是指“被測試者能理解、運用和反思文章的能力,以增加個人的知識,發揮個人的潛能,參與社會活動,實現個人的目標”;數學素養指“學習者能識別、理解和從事數學工作,能從數學的角度做出充分判斷,是目前和將來的個人生活、職業生活、與同伴和親戚的社會生活,以及作為建設性的、有愛心的及反思性的公民的需要”;數學素養則是指“學生能運用科學知識,發現問題,得出有根據的結論,以便理解和幫助做出對自然界和通過人類活動使其變化的決策”。每一種素養都包括內容(概念)、過程和情境三個維度,每一次評價都以其中一種素養為主,其他兩種素養為輔。
三、實施結果分析
檔案袋評價法經過數年的實施和測驗后變得更加系統和規范,在一些地區也有了成功實施的典型,如北京宣武師范學校附屬第一小學設計的“筆耕袋”、“閱讀袋”,北京師范大學中山實習小組開展的“愿望袋”活動,有的學校還設計了數學“出題本”,這些都顯示了檔案袋評價法廣闊的應用空間。另外,檔案袋的實踐經驗指向行動研究是進行檔案袋評價法的最有效途徑。
PISA利用現代教育測量理論,在時間短、樣本量小、試題量大、覆蓋面廣、成本低、誤差小、減輕學生負擔、減少考試焦慮的同時,確保了評價的科學性,拓寬了評價的內容與形式,使教育評價更具實用價值,取得了廣大教育研究者和師生、家長、學校的一致認可。2000年,PISA共收集了近26萬有效的學生樣本,實現了閱讀素養的提取信息、解釋說明、反思并評估,還有數學素養和科學素養5個維度的測量與評價;2003年,PISA共收集了27萬多個有效學生樣本,實現了數學素養的變化和關系、數量、空間,以及形狀、不確定性、問題解決、閱讀素養和科學素養7個維度的測量與評價;2006年,PISA共收集了39萬多個有效學生樣本,實現了對科學素養的識別科學問題、科學地解釋現象和使用科學證據等三個科學能力,以及科學興趣、支持科學探究等兩個對待科學的態度和閱讀素養、數學素養等7個維度的測量與評價。2009年,PISA有68個國家和經濟體參加,其內容除了在2006年設計的閱讀素養內涵基礎上有所發展之外,還開發了電子閱讀技能的評估??傊?,每次PISA測試的結果都會引起廣泛的關注,如“芬蘭模式”等。另外,在2009年的測試中,上海作為我國大陸唯一參加的地區還獲得了三項測試均位居首位的好成績。
在取得成績的同時,這兩種評價法也存在一些問題,其中較為突出的有:各個參與主體(教師、學生、學校及家長)對評價方法的認識不夠充分,使評價方法的施行受到阻礙甚至無法順利實施;以應試教育為主、高考為指向標的教育目標仍對一部分人的教育觀念具有導向作用,導致“偏離正軌”的檔案袋評價法難以施行;時間和精力的投入對已經極為忙碌的中小學教師來說是極大的挑戰和困難;檔案袋內容不明確且缺少客觀的評價標準;在實施過程中容易流于形式,且會因為缺乏交流和反饋導致同一區域的評價內容和標準不同;PISA實施的不連續性對學生的測評無法持續;繁重的準備工作消耗大量的人力、物力和財力;整個測評對教師和參與研究者的素質要求較高等。
研究者們也發現,要有效開展這兩種評價法就必須強化評價主體的理解與互動。另外,科學選擇評價內容與評定標準對提高評價的質量和發揮其教學價值有著極為重要的意義。
四、對我國基礎教育評價的思考
我國的基礎教育在實現了對既定的義務教育任務的完成之后,已進入全面提高教育質量的階段。如何進行科學、合理和有效的教育評價,使教育評價成為提高教育質量的有效手段、成為實現教育管理和教育決策科學化的重要保障,以及促進學生健康發展的必要環節,是擺在教育研究者面前的一項重要任務。上述所提及的檔案袋評價法和PISA評價法則可以為我們提供一些這方面的啟示。
我國新一輪的基礎教育改革更加關注學生的主動性和參與性,倡導學習環境和內容的生活化和情境性。PISA評價法與檔案袋評價法中關注的——學生是否準備好去應對未來的挑戰、注重學習過程等與基礎教育改革所要求的也有相同之處。
但不可否認,作為仍處于發展過程中的評價方法,無論是這兩種方法本身還是施行時所要求的主客觀條件都在一定程度上存在一些障礙和困難,如上述已經提及的一些問題。PISA雖說已經具備了極高的科學性、合理性和認可度,但畢竟只是3年舉行一次,在這期間對學生的學習和能力如何進行評價、采取哪種方式評價,這都是需要解決但尚未解決的問題。另外,在評價施行之前的準備工作和活動進行中的工序繁瑣而復雜,需要大量人力、物力和財力的投入,這無論是對參與活動的教師、學校、評價組織,還是教育主管部門來說都將是巨大的投入。
然而即便存在諸多困難,但就目前世界教育評價的發展來看,跨國間的教育評價合作已是大勢所趨,因此我國參與PISA評價項目也是必然的要求和結果。PISA是一項在理論、技術、管理上具有先進性的系統研究,亦是一項以改進教育政策為目的的實證研究。這種科學的評價方式勢必會給我國的教育評價制度提供有意義的借鑒。
首先,除了關注測試結果中顯示的學生之間的成績差異外,PISA也注意到學生與學校的背景,并更加關注學校和教育政策在提升學生發展方面的作用,而這正是我國目前教育評價研究或教育評價手段與方法中甚少涉及的。PISA從教育公平與均衡發展的角度出發,提供了學生成績差異的社會經濟根源及教育資源投入效益預測等更深層次的分析報告。它主張各階層的孩子都應得到良好的發展與成長的教育,這也與當前我國倡導的教育均衡、關注教育投資的有效性相一致。因此,要建立同我國國情一致的教育評價制度,就必須深入分析影響教育成效的各個因素,挖掘各區域對教育有決定性作用的影響因素,在建立全國大的評價制度的基礎上因地制宜地提出各個區域有針對性的次級評價策略。
其次,若將PISA項目的評價對象進行擴展,則PISA每3年進行一次的測試制度正好與我國現行的“6-3-3”學制的階段劃分一致。也就是說,在小學三年級結業后進行的第一次測試可以作為小學初級階段的學業水平判斷,后續便是在小學六年級—一小學升初中的年份、初中三年級——初中升到高中的年份、高中三年級,即所謂高考年份(以上安排是按照我國大部分地區實行的“6-3-3”學制進行安排的,另外一些特殊地區則應進行具體分析)。PISA的這四次測試結果既能有效顯示以上所述各個階段我國青少年的學業進度和水平,并作為終結性的能力測試對學生進行考核,又能對學生的畢業升學起到正常紙筆測試所起到的篩選作用。
最后,針對一些部門和人士提出來的在PISA每3年一階段的測驗間歇如何對學生進行評價的問題,我們認為,可以通過將PISA評價法與檔案袋評價法和傳統的紙筆測試方式相結合來解決,由此也可建立起一整套評價體系。這就與國際上流行的、認為評價方法應當多元化的趨勢相吻合。
我國新一輪的基礎教育改革更加關注學生的主動性和參與性,倡導學習環境和學習內容的生活化和情景化,這是時代對教育發展提出的新的要求。PISA評價方法和檔案袋評價法作為世界上較為先進和科學的評價方法與這些要求不謀而合,因而對其進行合理有序的整合和安排后產生的多元評價,勢必會對我國教育評價制度的完善產生有益的影響。
作者單位均系陜西師范大學旅游與環境學院
(責任編輯 羅登廉)