Gary+Gutting
一次國際標準測試中,美國學生分數平平、位居中等,于是教育改革的呼聲大起。但分數只是表象,單憑分數低就決定改革實非明智之舉。《紐約時報》2011年9月21日刊文,對分數及考試的本質進行了反思。
以往考試分數是用來評估學生,而現在卻是用來評估老師、用來評估整個教育體制的東西。從個人層面來說,一些學生和家長已經注意到這種改變, 那就是老師會專門花時間為學生準備更多標準化的測試,提供更多課堂和家庭作業時間。
考試分數究竟告訴了我們什么呢?
考試分數低是教育改革浪潮中爭論的首要問題。2010 年年底,在針對 15歲學齡兒童舉行的一項國際標準測試中,美國學生的閱讀成績居于中間,遠遠落后于亞洲國家學生的表現。這一結果令研究員和教育家呼吁相關部門應立即采取行動。
2011 年,理和約瑟帕·羅克薩這兩位社會學家經測試發現,45% 的美國學生在讀了兩年大學之后,批判性思維依然沒有任何提高的跡象。前不久關于“學術評估測試”( Scholastic Assessment Test,SAT )的平均分下滑便是擺在眼前的一個實例。
鑒于此次測試結果如此糟糕,許多評論家認為美國的學校教育機制正在沒落,并提出相應的改革方案要求迅速實施。當阿魯姆和羅克薩公布他們的測試結果時,許多人認為大學老師應該提高他們的教學標準,增加學生的學習時間,并為學生布置更多的學術研究論文。
然而,低分后面跟著會發生什么我們并不知道。站在學校的立場上而言,倘若學校依舊坐以待斃,不采取任何改革措施,后果將不堪設想。所以,我們應該基于事實進行反思,并深入探討更加成熟的教育方式。
反思:更成熟的教育方式
需要探討的第一個問題便是:考試的內容是否真的是我們希望學生了解的東西?
我們不能讓學生為了考試而考試。考試的真正目的應是為了讓學生展露自己所掌握的一些有價值的知識或技能,比如懂得乘法運算、了解內戰歷史,或者能夠用批判性思維獨立思考問題。對于這類考查數學能力或歷史知識的測試,發生考試分數不及格是完全有可能的。如果在數學考試中,我們要求學生在 5 秒內算出 392 × 654 等于幾;或者在歷史考試中,我們要求學生答出 50 場內戰所發生的確切日期,那么,對于學生的考試成績如此之糟糕,我們也無需大驚小怪。
當我們在考驗學生的批判性思維時,這個問題變得尤為嚴肅。阿魯姆和羅克薩在考察中進行了一項虛擬的“執行任務”測試:一家虛擬公司最近有一架飛機墜毀,學生需要根據當時的情況,決定是否應該購置一架新型飛機。對于超出學生經驗和興趣的虛擬事件,難道我們真的在乎他們用批判性思維去分析此類問題嗎?就算在乎也罷,不過我們更希望他們能夠在現實世界中將自己的批判性思維能力有效地發揮和運用。
在我自己的教學經驗中,我留意到一些學生在課堂上無法輕松應對我提出的哲學問題,辯論也無法令人信服,但如果多給他們一些時間,他們也能在論文里討論極其深奧的哲學問題。倘若能讓學生對哲學產生濃厚興趣,那么他們的批判性思維技能便能夠得到迅速提高。這個簡單的舉例并不是為了反駁阿魯姆和羅克薩所使用的批判性思維測試方法,它只是闡明了我們需要對這次不理想的測試結果進行徹底的反思。
我們所面臨的另一個問題便是:目前所有的標準化測試是否合理?我們是否需要用這些測試去評估學生對知識的掌握程度?曾經,只要老師說學生學得好我們就認為可以了。當然,也有很多情況證明不能只聽老師的。對于大學教育工作來說,有沒有可能后者、也就是不能只聽老師的一面之詞才是常態呢?
我們希望學生掌握某方面的知識或技能,但測試結果卻與我們的期望值恰恰相反,遇到此類情況,我們應該做些什么去補救呢?有很多人總會不切實際地幻想著有一種靈丹妙藥可以治愈我們所有的教育弊病,如:高薪聘請優秀教師、小班授課、改善教學方法,遵循日本的教育模式,等等。然而,實際操作起來比想象中要復雜得多,這就好像是治療癌癥,我們需要按部就班,對癥下藥。
盡管如此,合理的解決方案所需的精力還是個未知數。所以,對于是否能夠提供有效的資源去達到期望的教育目標,我們還得深思熟慮。也許最終還得去面對那些我們想也不敢想的事實:有些學生可能因為自己的能力障礙而無法達到我們的期望值。
教育改革不是一蹴而就的,我們不應因為學生的測試分數欠佳而匆忙進行,而應在做出改革之前,先深入了解失敗的原因,再深謀遠慮,作出有效的改革措施。從失敗到成功,還有一段很長的艱難路需要我們堅持不懈地走下去。(來源:果殼網,2011-10-09)endprint