周瑩瑩 李 維
(1.格拉斯哥大學 跨學科研究學院,英國 格拉斯哥 G12 8QQ;2.天津師范大學 教育學部,天津300387)
20世紀80年代,STEM教育在美國應運而生。STEM教育即科學(Science)、技術(Technology)、工程(Engineering)和數學(Mathematics)教育4門學科英文首字母的縮寫,旨在通過融合多個學科領域以提高學生的創新精神、實踐能力以及運用知識解決日益復雜的現實世界中問題的能力。21世紀以來,由于科學領域、科學教育領域和創新驅動的經濟展現出越來越多的優勢,STEM教育也逐漸被更多國家認可。在全球進行新一輪技術革新和產業升級的大背景下,美國、英國、德國和澳大利亞等國已率先將STEM教育作為實現產業結構升級、提高國家競爭力的重要戰略手段。自2007年我國首次引進STEM教育以來,STEM教育快速興起,學校與科研院所、社會機構、企業公司等共同協作,推動了STEM教育理論的發展、政策的出臺以及實踐的落地,呈現出百花齊放的景象。但由于我國尚未建立起本土化的評價體系,導致STEM課程及其教育產品缺乏相關的標準與認證,評價的滯后也帶來了STEM教育目標不清、監管不力、良莠不齊等諸多問題,從而制約了STEM教育的健康發展。可以說,我國STEM教育同時也是魚龍混雜[1]。如何建立合理有效的評估體系以支持現階段STEM教育的發展是我國STEM教育亟待解決的一項關鍵問題。蘇格蘭教育部已為當地教育實踐者制定了一套實用、全面、靈活的STEM自評框架,這一框架對我國建立起具有中國特色的STEM自評體系具有重要啟示意義。
明確STEM教育的意涵是實施STEM教育的基礎與出發點。雖然人們對于STEM行業和技能有著較為一致的理解,但STEM的意涵、適用范圍和作用也因地區或職業的不同而有所不同。例如,美國科學基金委員會(NFS)對STEM給出如下綱領性定義:STEM不僅包含數學、自然科學、工程和計算機科學的共同策略,也包括社會與行為科學,如心理學、經濟學、社會學和政治科學等[2]。蘇格蘭教育部在文件中闡述的STEM教育意涵與英國就業與技能委員會(UKCES)等機構認可的相一致,統一如下:STEM由一組相互關聯的學科及其所需技能構成。STEM教育不僅要求發展各個領域的專業知識和能力,也要求通過跨學科學習培養學習者產生新知識、想法和產品的能力。
STEM的組成部分如下:
(1) 科學(Science)使人們發展出對生活、物質和物理世界的興趣和理解,同時獲得合作、調查、研究、實驗、探索和發現等方面的技能和能力。
(2) 技術(Technology)是科學知識應用于人類活動過程中的產物。
(3) 工程(Engineering)是將科學與數學知識應用于人類活動的方法。工程和技術涵蓋了廣泛的領域,包括商業、計算科學、化學、食品、工藝和設計等,也包含與建筑、交通、生物醫學、微生物學等相關的應用技術。
(4) 數學(Mathematics)是所有STEM的基礎,包括解釋和分析信息、簡化和解決問題、評估風險和做出決策。數學和計算能力為生活、工作和社會參與提供了基本的技術和能力。
除了STEM的4個基本組成部分以外,文件還強調了在數字時代掌握數字技能(Digital skills)對其他4門學科的奠基作用。數字技能包含數字材料的使用和創造,從基本的數字素養、數據處理、定量推理、問題解決和計算思維,到專業的計算科學知識和技能的應用[3]。
蘇格蘭著眼于信息化時代的發展趨勢,在STEM原有的4門學科中加入了數字技能作為一個重要組成部分,使得公民對于 STEM 的理解從單一的教育形式上升到新時期個人應當具有的生存能力[4]。總的來說,蘇格蘭十分注重跨學科學習過程中學生對知識的理解和應用,主張在學習中理解知識,在理解中應用知識。此外,還要求STEM教育應具備基礎性和適用性,能貫穿從早教到大學教育的全過程,在不同學習階段發揮出其獨特而重要的作用。
作為英國的一部分,蘇格蘭在立法和行政管理方面擁有高度的自主權,在教育方面形成了獨特的管理體系。2003年,蘇格蘭科學顧問委員會(Scottish Science Advisory Committee)發布了《為什么科學教育很重要》(Why Science Education Matters)報告,對蘇格蘭解決當時科學教育面臨的問題和挑戰提出了若干建議,還要求通過課程改革革除課程雜亂、以內容為主導、以評估為導向等弊端[5]。此后,蘇格蘭決心花大力氣進行全面的課程改革,并于2004年發布了《卓越課程》(Curriculum for Excellence)報告,自此,蘇格蘭拉開了“卓越課程改革”的帷幕。在科學教育和學習方面,卓越課程重視“技能”(skill)的獲得在未來跨學科科學學習、生活與工作中的可持續性作用,要求為學生參與跨學科學習提供良好的環境和機會[5]。卓越課程中對科學教育的改革為蘇格蘭STEM教育形態的生成奠定了基礎。STEM教育的逐步發展與完善展現出其獨特的優勢,成為了改善蘇格蘭經濟、科技與生活的關鍵力量。為更大程度地發揮STEM教育的效能,2017年10月,蘇格蘭政府頒布了《蘇格蘭STEM教育和培訓戰略》(Science,Technology,Engineering and Mathematics Education and Training Strategy for Scotland)作為蘇格蘭整體經濟戰略的一部分,闡述了蘇格蘭實施STEM教育的價值觀、愿景和方法等,并為現階段教育培訓系統、社區學習和科學合作領域的STEM教育提供了行動指南。
課程改革的實施和政策的出臺使蘇格蘭成為了歐洲受教育水平最高的地區之一[6],也為勞動力市場注入了新鮮血液。英國年度人口調查(Annual Population Survey)數據顯示,2016年,蘇格蘭從事STEM相關領域職業(Jobs in STEM Related Industries)和STEM核心職業(Core STEM Related Occupations)的人口各占據蘇格蘭總就業人口的37%和32%,相比于2010年分別增長了8%和13.5%[3]。從整體來看,從事STEM相關職業人數的增加在一定程度上解決了蘇格蘭STEM勞動力短缺的問題,為高水平生產力和創新驅動下的經濟發展增添了動力。然而,雖然總數有所增加,但蘇格蘭STEM職業的內部結構仍然存在不均衡和不協調的問題。其中,最主要的是勞動力已有技能與現在、未來所需技能之間不匹配的矛盾。未來的就業增長將集中在更高水平的STEM相關職業上,而STEM技能供應的滯后和不足使很多雇主難以招聘到高水平的STEM技能人才,因此,社會對個人職業生涯中技能訓練、再技能訓練和其他技能訓練的要求顯著增加[3]。此外,性別、年齡、種族、貧困等因素也會影響學習者未來的職業選擇,制約著蘇格蘭STEM勞動力市場人才質量水平的提升和結構的均衡發展。面對諸多問題和挑戰,蘇格蘭期望發揮STEM教育的直接推動作用,并通過有效的學校自我評估發現問題、迎接挑戰。
蘇格蘭十分注重自我評估對教育的促進作用,把評估看成是學校管理的重要內容,這是因為蘇格蘭教育文化中“為自我改進而評估”的理念一直延續至今。20世紀80年代,英國開始了大規模的公共服務活動改革,1991年頒布了《公民憲章》(Citizens′ charter)以后,競爭被視為提高經濟效益和質量、提升管理者能力的最有效保證,競爭和高標準也讓質量保障與評估成為教育政策和實踐的重要特征[7]。英國公共部門評估改革的潛在影響、蘇格蘭地方教育當局的直接推動以及蘇格蘭學校發展的內在需求[8],使蘇格蘭開始更加注重學校自我評估對教育的作用。1996年,蘇格蘭教育部第一次實施通過了《我們的學校有多好?》(How good is our school?)指標體系,把它作為對學校教育質量進行評估的工具。到2015年9月,該指標體系已發布至第四版。由于它的適用范圍不包含學前教育和高等教育,蘇格蘭教育部又專門為學前教育階段編訂了《我們的早期學習和保育有多好?》(How Good is Our Early Learning and Childcare?)評估體系。隨著STEM教育的廣泛傳播與應用,相應的評估體系也已被建立起來。2017年12月,蘇格蘭教育部發布了《STEM自我評估與改進框架》(STEM Self-evaluation and Improvement Framework)(以下簡稱“《框架》”)作為對前兩個評估體系的補充,旨在為早教和保育機構、中小學提供STEM教育行動指南,支持與STEM相關的專業對話、評價與改進,鼓勵蘇格蘭教育中的自我提升文化。
在闡明了STEM的意涵之后,《框架》通過回答“為何評估”“如何評估”和“評估什么”這幾個方面的問題,明確了評估的方式和方法、質量指標以及評分工具,從而建構起一套完整的評估框架。
有效的自我評估和學校改進之間的關系可以概括為一種“向內、向外、向前看”的方式(如圖1所示),即“向內看”以分析自己的工作做得如何;“向外看”以了解地方和地區的優秀案例,借鑒行之有效的教育方法;“向前看”以明確未來發展的方向。“向內、向外、向前看” 中包含的3個步驟相互關聯、相互促進,構成自我評估的良性循環。學校對這3個步驟的理解和落實情況決定著評估能否發揮“促進學校改進”的作用。

圖1 “向內、向外、向前看”的自我評估方式
此自評框架的主要作用是幫助實施STEM教育的學校及其合作者“向內看”,了解學校的自身發展狀況,這就需要圍繞以下3個核心問題展開自評:我們做得如何?我們如何知道?我們現在能做什么[9]?在了解了自身存在的問題之后,就可以繼續“向外看”“向前看”,從他處學習經驗、探索學習者未來的發展可能,從而為制定改進計劃提供依據。所以,有效的自我評估需要將內部和外部的分析相結合,才能進行反思和批判性的探索。
“三角測量”是一個建立在堅實的證據基礎上,對學校發展的各個層面進行描述的過程。“三角測量”法包含采集定量數據、聽取人員意見和直接觀察3種收集證據的方法(如圖2所示)。其中,定量數據包括學校統計的考勤、成就、欺凌、歧視等方面的信息,數據的分析結果可以幫助學校發現自身存在的問題,選擇合適的干預手段和時機;人員意見來源于學校工作人員、學生、家長或監護人以及地方當局定期對學校表達的意見;直接觀察一般發生在戶外、車間、大學、遠足等真實學習情境中,通過直接觀察提供反饋信息的主體可以是學生也可以是教育實踐者。

圖2 證據來源的“三角測量”法
不僅如此,“三角測量”實施的主體并不獨立,測量的對象也并不單一。《框架》提倡合作關系下的自我評估,即學校內部、學校之間、學校與STEM利益相關者之間相互合作,在協同中開展測量和評估。此外,測量的對象應涵蓋所有的學校教育工作者、學習者、合作者及其他利益相關者。其中,對學習者的測量是學校自我評估的中心環節,而測量結果的準確性在很大程度上受學習者參與評價積極性的影響。因此,學校可以通過提供正確的評價工具和技能,提高兒童和青少年參與的有效性和積極性,鼓勵他們在評價中主動地提出、溝通、分析并解釋證據。
為建立更貼近于現代化教育方式的自評框架,蘇格蘭教育部根據STEM教育的特點從已有的質量指標體系——《我們的學校有多好?(第四版)》中選取了一部分內容作為STEM評價的質量指標(Quality Indicators)。質量指標是反映學校實施STEM教育效果和質量的指標,不僅包含國家或地區教育發展的重點,也包括教育當局為改進學校提出的目標和要求[8]。依據這些目標和要求,不同國家或地區選取的質量指標也不盡相同。例如,美國內華達州政府從學校、教室和社會3個方面選擇質量指標進行STEM教育評估[1 0]。蘇格蘭政府則認為開展學校自我評估時需要回答以下3個維度的關鍵問題:領導與管理、學習提供、成功與成就。這3個維度下的質量指標共有12個,每個質量指標又細分為多個主題。最終3個維度的證據整合在一起是為了回答評估的中心問題:我們改進的能力是什么?表1為質量指標的結構。
需要強調的是,該質量指標體系為小學、中學、特殊教育和社區學校所共用,并不要求所有學校按照全部的質量指標開展自評,而是提供了選擇與參考,留出空間讓學校選取符合自身特色和需要的質量指標。通過提高質量指標體系的通適性與靈活性,更好地發揮其指導作用。
為供國家基準測試使用,蘇格蘭制定了“六等級量表”(six-point scale)作為蘇格蘭教育部、地方當局和其他管理機構衡量學校質量指標水平的工具。質量指標水平共劃分為6個等級,按成就從高到低依次為:第6級“優秀”(excellent)、第5級“非常好”(very good)、第4級“良好”(good)、第3級“一般”(satisfactory)、第2級“較差”(weak)和第1級“不滿意”(unsatisfactory)[1 1]。質量水平達到“優秀”這一級說明青少年和兒童的經驗與成就符合很高的質量標準,可以作為最佳的實踐范例,這種實踐以公平與包容為基礎,學校教育實踐者能在學校以外分享深刻的專業理解以促進共同進步;“非常好”意味著學校的優勢已十分明顯,只存在極少數需要改進的地方,有望通過自我評估達到“優秀”,并且這一等級是所有學校都應努力達到的目標;達到“良好”等級時,學校已形成了自身的主要工作優勢,這些優勢對學生和年輕人有著意義深遠的影響,但學校仍需要對一些地方做出改進;“一般”等級的水平代表學校工作展現出的優勢勉強大于劣勢,學生只能得到最基本的教育。這種學校教育會限制學生的綜合發展,學校需要采取行動增強自身優勢并克服缺點;達到“較差”水平意味著學校工作存在著明顯的劣勢,勉強具備一些優勢,這些劣勢足以削弱學生的經驗,學校需要針對問題,有計劃、有組織地采取行動;當達到“不滿意”一級時,學校的缺點已經占據了主要地位,需要高級管理者幫助計劃、實施能有效提升的補救性行為。
《框架》中詳細闡述了各項指標處在初始階段、建立成就階段以及高效實踐階段應有的特征,還列出了每個質量指標涉及的主題。表2到表4簡要說明每項指標的質量水平達到第1級(不滿意)和第6級(優秀)時的應有狀態。
在自評的“領導與管理”這一維度,評價的對象不止是學校領導,還包括了參與STEM實施、決策和改進的教職工群體;評價的內容不止是學校的管理手段和實施辦法,也涵蓋了學校是否用合作的方法進行評估、整個學校對STEM教育的信心和態度如何、資源管理是否合理公平等方面。
“學習提供”這一維度的質量指標涉及STEM教育實施過程中會對學習者產生影響的外部條件和環境因素,包括校內提供的課程、教學方法和評估等,校際之間的過渡和合作,校外的家庭學習。

表3 “學習提供”維度的質量指標內容
“成功與成就”主要衡量的是學校提供的STEM教育對學生發展的各個方面產生的影響,其中包括學生幸福感、STEM素養和就業能力等。

表4 “成功與成就”維度質量指標內容
縱觀整個質量指標體系,可以看出它很好地貫徹了蘇格蘭學校自評的基本理念——“為自我改進而評估”,同時滲透了“向內、向外、向前看”的自評方式。一方面,要實現“為自我改進而評估”的目的,學校就要避免流于形式的評價,真正用評價發現問題。蘇格蘭學校在自我評估中關注學校、學生發展過程中的變化和進步,從變化和進步中獲得反饋,從反饋中獲得改進。另一方面,雖然此框架的主要作用是幫助學校“向內看”,了解自身的現狀和水平,但在“向內看”的過程中,學校能否“向外看”“向前看”也被納入到評價范圍中,可見,在評價完成后相互交流借鑒、進行合理的自我規劃、再依據計劃實施改進方案才是最終促成學校自我改進的直接方式。
21世紀的教育正面臨著前所未有的挑戰,STEM教育作為新世紀許多國家培養創新與科技人才、促進經濟繁榮的重要戰略手段,在我國仍然處于探索階段。目前,我國較為偏重對STEM教育理論、設計與實施的研究,在建立測量與評價體系方面仍較為欠缺,因此有必要借鑒他國建立STEM教育評價體系的經驗。在研究蘇格蘭STEM自評框架的過程中,得出以下幾點啟示。
建構科學有效的STEM教育評估框架首先在于質量指標、評估標準和測量方法的確定。第一,由國家或地區層面制定的質量指標體系一般為各級各類教育機構所共用,因而質量指標的選取需兼顧全面性、靈活性與普適性。在設計指標體系時,可以先征集來自學校、社會和國家各方面對學校教育提出的要求和目標,再從泛化的學習目標中抽離出具體的質量指標整合成一套體系。當然,學校并不需要完全按照整套體系進行評價,只需根據自身情況從中選取一部分形成具有學校特色的評估體系即可。第二,作為學校自評過程中的“尺子”,評估標準為了能夠盡量完備、詳實且方便測量,可以先篩選出能反映各項指標質量水平的行為表現,然后將這些表現操作化定義,在劃分出水平等級之后制定合理的水平等級量表[1 2]。第三,在選取評價方法時,應從測量證據的真實性與有效性出發,同時考慮測量實施的可操作性和便捷性。可以在常用的紙筆測驗的基礎上加入訪談、觀察、學生口述等多種方法,將過程性評價與終結性評價結合起來,從而達到了解學生知識和思維的變化與結果的目的。總之,由于STEM評估體系的建設對國家或地區開展STEM教育評估具有綱領性意義,因此制定者應與教師、專家、學者一道,發揮合力,共同制定出科學而系統的STEM評估體系。
STEM教育作為一種基于項目學習的教育模式,更為關注學習過程的實踐性、開放性和合作性等特征。而目前國內STEM教育大多采用的仍是基于學生最終產品進行的結果導向型評價。雖然這種評價方式看起來便于實施,但難以考查學生在開放的合作學習與實踐過程中思維和能力的變化。這是因為學生思維和能力的發展是循序漸進的,具有連續性和過程性,所以片面地依據學習結果進行評價的方式顯得低效而力不從心,并且往往會流于形式。而結果導向型評價對學習過程關注的缺失可以通過使用證據導向型評價得到補充。證據導向型評價強調通過收集各類學習證據,將學生的思維過程和問題解決過程外顯化[13],從而了解學生的動態發展。在學習過程中,學生主動收集、提供的可檢測的學習材料都可以作為證據,如思維導圖、概念圖、口頭報告、作品實物、表演等多種形式的材料[14]。對這些材料的分析和評定不僅反映著學生學習的發展過程,也為教師制定個性化的教學方案、改進教學方式提供了參考。此外,基于證據的評價方式同時也鼓勵學生在主動建構的過程中發揮想象力和創造力、展現個性與想法。這對于教育評價切實發揮其導向功能也有重要意義。
在傳統意義上,評估被視為教師的“特權”,學生作為評估主體的地位長期被懸置或遮蔽[1 5]。隨著新一輪課程改革的進行,這類問題也得到了一些關注,新課標指出,“要發揮學校、教師和學生等不同角色在評價中的作用,從不同視角進行評價”[1 6]。兒童和青年人積極參與學校自評的意義在于,擁有參與決策的權利會使他們產生一種責任感和歸屬感,從而承擔起學校自評的主要責任,為評價提供堅實有效的證據。同時,學生參與自評和互評可以提高學生的元認知、自我效能感[1 7],發揮評價對學生的促進作用。因此,在日常的學習過程中應有意識地培養學生的STEM教育自評意識,喚起學生評價的主動性。一方面,教師可以通過安排豐富多樣的教學評價任務,選擇合適的評價方式,將學習評價與學生學習融為一體,并逐漸讓學生明確“為何評估”“如何評估”和“評估什么”等問題,以培養學生的自評意識,提升學生的自評素養。另一方面,學校還要避免決策由學校領導層“獨斷”的狀況發生。通過鼓勵教職工積極參與、廣泛征求學生的意見,真正發揮出多元主體評估的優勢,增強評價的全面性,體現學生的主體性。
目前,我國參與實施和管理STEM教育的主體仍主要局限于教育管理部門和學校內部,與社會的聯動機制不夠健全,且各部門之間相對來講比較割裂[1]。蘇格蘭的STEM自評框架摒棄了傳統的自上而下的督導模式,強調普通學校與大學、早教和托兒機構合作,監管者與STEM教育者、雇主、學習者和家長通力合作,使教育實施的場所從“獨立的學校”變為“校際合作”的連續教育實體,為學校改進出謀劃策的主體從“學校領導層”變為“全社會”。在實際操作過程中,建立友好、廣泛的合作伙伴關系需要解決好兩方面問題。一是要協調全社會的力量推動STEM教育的實施和發展。首先需要發揮地方政府和教育行政部門的統領作用,綜合社會產業發展、人才儲備和各級各類教育的要求進行頂層設計,保障相關的政策、制度、戰略、經費和評估滿足學校發展的各類需要。其次,規范、有效的校企合作機制的建立也需要政府的支持與統籌。政府可以通過頒布激勵政策的手段,鼓勵企業在參與STEM教育人才培養的過程中獲得人力資源,繼而為雙方提供制度保障,規定校企合作中政府、企業和學校各方的責任和義務。最后是要為雙方的對話和交流搭建合作平臺,以共同制定人才培養標準和目標,選擇合適的合作模式。二是要加強校際間的交流與合作。同級的學校之間可以通過組建“校際聯盟”,在豐富多樣的STEM活動中分享優秀的教學方法和實踐案例;而相連學段的學校則可以通過共同制定既適合自己又相互銜接的STEM計劃,從而保障學生在不同STEM教育階段之間的過渡自然連貫,促進學習進階的有效發生。
我國STEM教育研究中心于2018年5月啟動了“中國STEM教育2029創新行動計劃”,其中強調了“建設STEM教育相應的標準與評價體系”的重要作用,希望通過注重學習過程的測量改變評價方式和創新培養模式。而蘇格蘭教育部制定的STEM自評框架正是基于這種思想建立起來的,可以作為我國建立評價體系時借鑒的范例。在建立本土化的STEM自評體系的過程中,體系的制定者要征集多方面的意見,選取全面、多元、靈活的評價指標,制定行之有效的評估工具和評估標準;收集證據時要避免“重結果,輕過程”的傾向,以學生學習過程中能力和素養的發展為著眼點。學校方面要與企業、學校建立友好的合作伙伴關系,鼓勵多主體參與教育決策和評價,共同為學校改進制定切實可行的計劃。當一套評估體系真正成為學校發現問題、明確方向、實施改進的工具和途徑時,它才能為學校教育的發展提供源源不竭的動力。