牧童 趙鶴齡
摘要:美國“共同核心課程標準”基于信息技術網絡的州際評價體系,是在聯邦教育部實施的“力爭上游計劃”項目支持下,由PARCC和SBAC兩個州際評價聯盟依據與“共同核心課程標準”相一致并實現學生“為大學學習和職場就業成功做準備”的課程培養目標,以信息技術智能網絡評價手段和評價工具為載體,采取“互聯網+”基礎教育評價的形式而建構起的總結性評價、形成性評價和臨時性評價相互平衡與結合的綜合評價體系。這對當前進一步深化我國基礎教育階段學生學業水平考試和綜合素質評價體系的建設,具有啟發和借鑒意義。
關鍵詞:共同核心課程標準;基于信息技術網絡;州際評價體系
中圖分類號:G434 文獻標識碼:A
美國自2010年6月由全美州長協會(National Governors Association,NGA)和州首席中小學教育官員理事會(Council of Chief State School Offices,CCSSO)頒布《共同核心州標準》(Common Core State Standards,簡稱“共同核心課程標準”)之后,這個旨在實現K-12階段中小學生為“大學學習和職場就業成功做準備”的新一代課程與教學的評價,已經引起相當廣泛的關注。特別是近年來,國內的許多專家學者,都在密切跟蹤和研究正在由美國“大學和就業準備評價伙伴州際聯盟”(the Partnershipfor Assessment of Readiness for College and Careers,簡稱PARCC)和“靈活平衡評價州際聯盟”(the Smarter Balanced Assessment Consortium,簡稱SBAC)所建構并開始實施的與“共同核心課程標準”培養目標相一致的基于信息技術網絡的州際評價體系。這對我國正在按照深化教育綜合改革要求,完善義務教育和普通高中學生的學業水平考試和綜合素質評價體系的建設,具有啟發和借鑒的意義。
一、背景與意義
美國“共同核心課程標準”基于信息技術網絡的州際評價體系之所以能夠建構施行,是美國自20世紀80年代以來的30多年中,不斷對K-12階段基礎教育存在的問題進行反思、完善和提升所得出的必然演進的邏輯結果。其過程始終體現著一個強調人類經驗累積起來的系統知識、技能與態度培養的新要素主義課程與教學思想,對當代美國中小學教育秉持著強烈的憂思與期待。
(一)對K-12階段基礎教育存在的問題進行反思,而反思得出的結論是掀起了“基于標準的教育改革”
美國的教育傳統是分權的制度設計,由各州規定自己的標準、課程與評價體系,彼此之間水平不一、難以銜接,既沒有統一的核心課程,更缺少全國要求一致的課程標準,而呈現出雜多的狀態,致使教育平庸,進而影響質量的提高。為破解這一存在問題,他們主要做出了兩方面的努力:一方面是確立核心課程。1983年4月里根政府所發表的《國家處在危險之中:教育改革勢在必行》報告首次提出基礎教育階段設置英語、數學、科學、社會和計算機科學等“5項新基礎”的核心課程;1991年,布什總統在簽發的6項全美教育目標中又確定了英語、數學、自然科學、歷史和地理等5門核心課程,并建立學業考試制度;1994年克林頓政府期間,更在原來5門核心課程之外增加了外國語和藝術2門學科成為7門核心課程。另一方面是開發全國性的課程標準。自1989年全美數學教師協會編制發布《學校數學課程與評價標準》之后,陸續研制出臺了全國性的科學、歷史、藝術、公民、地理、英語和外語等學科課程標準,供自愿采用。盡管效果并非盡如人意,卻是以此為標志興起了美國教育史上重要的“基于標準的教育改革”運動。
(二)對“基于標準的教育改革”進行完善,而完善得出的結論是實行了“教育問責制度”
2001年,小布什總統簽署了《不讓一個孩子掉隊法案》(No Child Left Behind Act),是對“基于標準的教育改革”的效果反思之后的強化推進與完善。該法案要求州政府依據聯邦教育目標確定的嚴格要求,建立符合本州實際的“課程內容標準”(Academic Content Standards)和“學術進步標準”(Academic Achievement Standards)。重視對中小學生的數學、科學和英語學科教育,為確保到2014年全國所有學生在數學、科學和閱讀上成績必須達到熟練水平。聯邦政府在全國中小學全面建立教育問責制度,實施標準化考試和對各州實行績效責任制,依據考試成績對學生、教師、校長和學校進行評價,然而卻出現了為逃避責任而紛紛降低州標準要求讓學生“達標”問題,未能達成改革的初衷。
(三)對“基于標準的教育改革”進行提升,而提升得出的結論是實施了“共同核心課程標準”
進入21世紀,在對“基于標準的教育改革”的得失進行全面反思的基礎上,促使這個本身具有方向性、符合教育規律理論與實踐的成果華麗轉身,提升其成為全國統一性的、具有國際先進水準的“共同核心課程標準”,建構起了美國21世紀新一代的體現新要素主義價值追求的、強調與“共同核心課程標準”培養目標相匹配的基于信息技術網絡的州際評價體系,開創了美國教育的新篇章。其重要的價值與意義,可以展示在如下所述的PARCC和SBAC框架與體系之中。
二、框架與體系
美國的PARCC和SBAC這兩個新一代的教育評價體系,基于總結性評價方式存在的“應試教學”,主要是針對反思和改進傳統的,而測不出真正重要的東西。在解決學習過程性評價缺失以及所測量信息對利益相關的使用者反饋不暢等問題的基礎上,其建構起了與美國K-12階段基礎教育“共同核心課程標準”所提及的所有學生“為大學學習和職場就業成功做準備”相一致的課程培養目標,并基于信息技術網絡的智能化載體,優化綜合設計總結性、形成性和臨時性評價工具,追求對批判性思維技能與復雜學習能力的考核,探索以人為本、促進公平和追求卓越的教育評價體系,具有十分重要的啟發與借鑒意義。
(一)PARCC評價體系的框架建構
PARCC評價體系,主要包括終結性評價、形成性評價及其以核心學科為重點的評價模塊設計。
1.終結性評價模式(Summative Assessment Model)
PARCC設計終結性評價的目標,是檢測學生是否處在“為大學學習和職場就業成功做準備”的道路上,按共同核心課程標準要求,測量學生所掌握的知識與技能,并為各級教育機構及其人員提供學生學業發展的相關數據。終結性評價包括了兩方面的內容設計:一方面是學生行為表現評價(Performanee-Based Assessment):在英語學科評價上,重點考查學生基于文本分析的實際寫作能力;在數學學科上,重點考查學生對技能、概念的實際應用水平以及解決深層次數學問題所需要的策略性思維和推理能力,這項評價安排在學期末進行;另一方面是學年末終結性評價(End-of-Year Assessment):在英語學科評價上,側重對學生的閱讀能力的測量;在數學學科上,則是由一系列創新的、機器可測的項目組成,將在學年大約剩1/10時問的時候進行。
2.形成性評價模式(Formative Assessments Model)
形成性評價的目標是為教師有效改進教學、進行學習干預和促進教師本身專業發展需要,提供及時、快捷和準確的信息,也設計成兩方面的評價內容:一方面是早期評價(Early Assessment),設計宗旨是以促進學生對掌握知識和技能的學習需要為目標,并在通過此目標實現的過程中,幫助教師改進教學和反思促進自身的專業發展;另一方面是學年中期評價(Mid-Year Assessment),將由依據學生行為表現的評價項目和任務組成,側重對一些以往測量中難以考核的知識與技能的評價。
3.學科評價設計模塊
(1)英語學科評價模塊(English Language Art/Literacy)
主要包括四方面的內容設計:一是基于材料寫作的讀寫能力評價(ELA-1 and ELA-2.Focused Literacy Assessments:Writing from Sources)。英語語言藝術模塊1(ELA-1)在學年1/4時進行,英語語言藝術模塊2(ELA-2)在學年1/2時進行。依據“共同核心課程標準”以測試學生“為大學學習和職場就業成功做準備”的最基本的能力,如閱讀越來越復雜的文本,從中汲取證據并寫出合乎邏輯的結論與現狀分析的能力等;二是擴展性研究/寫作的評價(ELA-3.Extended Research/Writing Assessment)。英語語言藝術模塊3(ELA-3)在學年3/4時開展。依據調查需求,基礎教育階段要對學生進行研究素養和技能的培養,這對在大學學習和職場就業成功做好準備是必不可少的能力;三是學年末讀寫能力評價(ELA-4.End-of-Year Literacy Assessment)。英語語言藝術模塊4(ELA-4)在學期還剩1/10的時候進行測評。這是一個計算機增強試題類型的電腦打分考試,考試建立在適當難度的優質、真實文本的基礎上;四是口語和聽力的評價(ELA-5.Speaking and Listening Assessment)。英語語言藝術-5模塊(ELA-5)是學生完成英語語言藝術3模塊fELA一3)項目后,教師在課堂教學中進行現場考核與呈現結果。為測量共同核心課程標準口語和聽力水平,學生將把自己在英語語言藝術3模塊(ELA-3)部分中的作品向同學作以展示,要求學生報告他們的研究、分析和發現,并回應現場的問題。通過師生雙方合作互動并回答問題或討論與辯論,教師依據評估學生英語口語和聽力能力的標準和規則,考核學生以合乎邏輯的方式清楚地表達和呈現信息的聽說能力,并作為改進教學決策的依據。
(2)數學學科評價模塊
包括三方面內容的設計:一是基本主題評價(Math-1 and Math-2.Focused Assessments of Essential Topics)。數學模塊1(Math-1)在學年1/4時進行,數學模塊2(Math-2)在學年1/2時進行。在這兩個數學模塊中,每次評價都強調從共同核心課程標準或具體知識與技能的標準群(Clusters of Standards)所涉及的1-2個基本主題進行評價;二是拓展性數學評價(Math-3.Extended Mathematics Assessment)。數學模塊3(Math-3)在學年3/4時進行。該數學模塊,設計成表現性任務,學生將應用對關鍵性數學概念的理解來推導自己解決實世界問題的方案;三是學年末數學評價(Math-4.End-of-Year Mathematics Assessment)。數學模塊4(Math-4)在學期還剩1/10時進行。這個評價部分是學生在計算機上完成的測量項目,考核共同核心課程標準要求學生為“大學學習和職場就業成功做準備”所需知識與技能的掌握程度,以及運用它們解決問題的能力。
(二)SBAC評價體系的框架建構
SBAC評價體系的建構內容包括總結性評價、臨時性評價和形成性評價相互結合的綜合性評價模式。
1.總結性評價模式(Summative Assessment Model)
總結性評價一般安排在學年的第12周考核,也可選擇在學年初進行。其目的是提供學生在學業成績方面所取得進展的信息,用于支持高風險的學生、學校、教師和校長的問責與決策,并設計成如下的兩方面內容:
(1)計算機自適應評價(Computer Adaptive Assessment)
這是計算機根據對考生能力水平的估計為考生選擇試題的評價。計算機基于等值條件的設計,考生答對了一道題目便會呈現另一道更難的試題;如果考生答錯了就會呈現一道更容易的試題,以使計算機一直持續到能夠精準測量考生的學業水平。計算機自適應評價的每個科目大約有40-65道題目,主要采取如下三種評價題型設計:一是選擇反應式題型(Selected-Response Items)。該項目作為評估平臺的一部分,將使用“機器評分”(Machine-Scored)方式。所有答案將至少由兩名內容專家驗證,并根據現場測試反應進行重點檢查分析,以確保得分的準確性;二是建構反應式題型(Constructed-Response Items)。更復雜的反應式題型評分(如建構反應式題型、表現性任務等)將需要使用人工智能評分。雖然其仍是正在進行重點研究的一個新興技術,SBAC對此有信心并且大力支持實現這個目標;三是技術提升式題型(Technology-Enhanced Items)。作答該項目采取各種反應的功能與形式,如移動鼠標的拖放、熱點、繪畫、制圖繪圖和書面回復等,且其中大部分都將自動得分。在某些測試題目上還允許學生在線使用字典、詞匯表等嵌入式通用輔助工具。
(2)表現性任務評價(Performance Tasks)
該項目任務通過向學生提供一個圍繞英語語言藝術和數學科目的學習評價目標的具體問題情景,考查在此過程中學生各方面的表現。這是一些傳統紙筆考試很難或不能考查的內容,學生每年將完成一定數目的表現性任務。其主要設計有三方面的內容:一是一個閱讀任務;二是一個寫作任務;三是兩個數學任務。這些任務的測量,都由學生操作計算機施行,通常要求在1-2個課時內完成。對這些任務的完成,要求學生進行自主規劃、管理信息和觀點、同其他材料和人進行交流互動,并以諸如口頭展示、物品展出、產品開發和擴展性作文寫作等呈現的方式,做出拓寬與深入的應答。
2.臨時性評價模式(Interim Assessment Model)
臨時性評價是基于認知發展理論所設計的,是在學生所取得每一個學習進展的現有理解水平基礎上所開發出的評價,主要有兩種模式:一是反映年末自適應評價的測驗時長與范圍。學生成績與年末自適應評價使用相同的分數量表,所報告的量表分數可以用于計算機成績或進步成績;二是更深層次上考查一套由若干標準歸并而成的標準集。伴隨總結性評價的開展,SBAC將開發一個評價框架、題庫和項目說明,以指導臨時性評價題庫的開發,各州根據各自需要組成自己個性化的考卷。
3.形成性評價模式(Formative Assessment Model)
形成性評價的設計,其功能在于幫助管理者和教師有效地使用總結性評價和臨時性評價的數據,并培養他們在教與學的過程中收集學生學業進展的證據以診斷學習需要的能力。SBAC基于共同核心課程標準研制的形成性評價,主要目標追求的是幫助教師收集課堂教學中學生學習的有用信息來了解、掌握學生的學習需求,以便使教師和學生持續地改進教與學的實踐,既能滿足學生更好學習的需求,也能促進教師的專業發展。為保證形成性評價模式的有效運行,開發建設了基于信息技術網絡的形成性評價工具。
三、特色與啟示
基于對以上與“共同核心課程標準”相匹配的新一代評價體系所產生背景和意義的分析和論證,以及依據對這兩個評價聯盟的評價框架與體系的梳理和歸納,在此基礎上就可以概括出當下美國基于信息技術網絡的“共同核心課程標準”州際評價體系的建構及一些主要特色帶給我們的啟示與思考。
(一)教育評價理念上的特色與啟示
PARCC和SBAC所建構的代表美國K-12階段基礎教育新一代的兩個評價體系的建構特色,主要表現在這樣三個方面:
1.體現了追求“為大學學習和職場就業成功做準備”培養目標和教育公平的理念
面對美國新一代要在競爭激烈的21世紀取得成功,PARCC和SBAC評價體系所追求的評價目標建構指向,就是旗幟鮮明地秉持為所有K-12階段的基礎教育學生能夠“在大學、職場和生活中獲得成功所需具備的知識、技能”為其設計理念要旨,依據通用設計等理論和思想建構評價體系框架結構,在最大限度與可能的范圍內不分性別、年齡和能力,特別是要滿足母語非英語學生和殘障者的需求,使得新一代評價的價值功能導向有教無類,切實面向所有學生,并促進對其在教育機會、教育過程和教育質量上的公平。給我們帶來的啟示是:基礎教育階段學業水平考核的設計原則,要切實落實好與課程標準所確定的培養目標、課堂上的教與學、考試評價、學生全面而有個性成長和教師專業發展要求的一致性,才能達成教育公平的目標追求。
2.體現了總結性、形成性和臨時性評價相結合的教育評價理念
PARCC和SBAC兩個州際評價聯盟,基于反思、總結現有州際評價通常以總結性評價為主,而無法獲得學生學習的動態信息,不能及時改進教學活動的缺失,按照趨利避害、優勢互補的教育評價理念要求,都在各自的評價框架中設計既有總結性評價,又有形成性評價,以及臨時性評價,以此構建了這三種評價方式有機統一的、綜合性的K-12階段基礎教育的學業評價體系。其帶給我們的啟示是:要認真研究、設計和平衡好基礎教育階段學業水平考試與綜合素質評價之間的功能作用及其各自內部體系結構之間的關系。
3.體現了運用前沿教育測量理論指導下科學有效評價的理念
PARCC和SBAC兩個州際評價聯盟都非常注重在教育測量等理論指導下開發設計評價體系。PARCC和SBAC在研制和開發設計其評價體系時,依據了“以證據為中心”的設計理論、行動理論和基于教育公平的“通用設計”理論等,努力確保追求其評價體系的客觀性、公平性和科學性以及對弱勢群體的評價公平。特別是在試題研制完成施測前,如PARCC還要通過其下設的測驗試題審查委員會等機構進行審核。其帶給我們的啟示是:基礎教育階段的學業水平考試要依據國家課程標準確定的考核內容要求,并遵循教育規律和學生成長規律,自覺強化運用科學的教育測量理論與技術設計評價工具。
(二)網絡技術支撐上的特色與啟示
PARCC和SBAC建構了與共同核心課程標準學科評價相匹配的信息技術網絡支撐的評價體系,主要內容有三個方面:
1.創設在線資源中心
PARCC開發建立了一個在線的數字資源中心,為教師提供可以使用的示范性課程框架和學生學業項目與任務,以便進行形成性評價。開發計算機自適應性工具,以確定學生最近發展區,并提供適當水平閱讀文本建議。各成員州持續地向資源中心提供高質量的考試文本案例,使該資源中心的工具功能得以不斷增強。SBAC還通過搜集各州現有的評價項目和表現性任務,建立總結性和臨時性評價的網絡題庫。這啟示我們應高度重視并加快推進“互聯網+基礎教育評價”的建設步伐,以便“多快好省”地共享網絡教育評價資源與工具。
2.構建評價反饋體系
為加強州際評價聯盟成員州之間的評價信息適時交流、互動與反饋,需要建立暢通的網絡評價互動反饋體系。如SBAC開發了一個可以使用一個相互操作的計算機網絡電子平臺和一套促進教學的州際綜合性在線資源和分數報告系統,可以在線公布評價結果,也可以發表追蹤分析方面的標準化報告或定制報告;學生可以在學習過程中關注自己成長與發展的提升和改善;大學和職場代表等利益相關者也能夠通過網絡在線報告和跟蹤系統,獲得各年級學生的關鍵信息,也為高校和企業代表篩選出能夠勝任的學生和員工。這啟發我們要更新觀念,充分應用互聯網載體建構基礎教育評價的互動反饋體系。
3.施行網絡試點測試
通過早期試點測試,PARCC在2012-2013學年初組織成員州開展了與正式實施情景與時間相一致的基于網絡評價的實地測試;2014年3月25日至6月13日期間,SBAC州際評價聯盟的21個成員州和維爾京群島的420多萬3至11年級學生、16549所學校和上千名教師參加了為期12周的美國有史以來最大的實地測試的網絡在線評價,達到了預期的目標,為今后預設的大規模在線網絡評價積累了經驗。這啟發我們應該立足當前、放眼長遠并勇于探索和構建基于互聯網的這種“既安全、更公平、又省錢”的基礎教育在線網絡評價。
(三)組織運行方式上的特色與啟示
共同核心課程標準評價體系建構并運行的突出特點,得益于如下的三種機制:
1.組織開發評價方式
PARCC和SBAC作為與共同核心課程標準相匹配評價體系建構的開發者,承擔這個美國新一代基礎教育評價體系的設計、開發、建設和實施工作。目前,PARCC和SBAC分別有成員州22個和31個。兩個評價體系將于2014-2015學年正式在成員州實施,屆時將取代傳統的基于州標準的考試評價系統。對諸如這種專業性、公平性和高利害性的教育評價項目產品的開發,要依法面向資源市場、采取政府采購方式才能保證質量。
2.評價管理運行方式
PARCC和SBAC兩個州際評價聯盟,都由數十個固定或不固定的州作為成員參與其中。聯盟成員中富有經驗的可作為牽頭成員州,再延伸到學區、學校,形成了一種有效的評價管理運行方式。這啟發我們在基礎教育評價體系的建構中,在評價工具的資源共享上也可以采取這種跨省或在一個省區內跨地區進行合作評價。
3.試題資源編制方式
PARCC的試題命制開發主要由“美國教育考試服務中心”“進步測量”和“麥克勞希爾教育測評中心”考試服務承包商合作提供服務,還有“美國大學理事會”及一些高校也參與試題命制,這對我們研制試題問題拓寬了思路。
四、總結與借鑒
美國“共同核心課程標準”基于信息技術網絡的州際評價體系,是在聯邦政府教育部通過實施3.3億美元競爭撥款的“力爭上游計劃”項目支持下,由兩個競標成功單位PARCC和SBAC州際評價聯盟依據與“共同核心課程標準”相一致原則,基于對傳統單一的總結性評功能評價(僅僅是對學生“知道什么和能做什么做出診斷”,而測不出真正重要東西的反思),建構起總結性評價、形成性評價和臨時性評價相互平衡與結合的、能夠考核學生批判性思維技能和復雜學習能力的綜合性評價體系。特別是以信息技術智能網絡為載體,建立起州際共享的在線評價數字資源中心,開發面對所有學生使用的計算機自適應性評價工具及其嵌入式輔助工具。構建起的州際聯盟之間暢通的網絡評價互動反饋體系,使用一個相互操作的計算機網絡電子平臺和一套促進教學的州際綜合性在線資源和分數報告系統,可以在線公布評價結果,也可以發表針對個別學生、學生群體、課堂、學校、學區和州的追蹤分析方面的標準化報告或定制報告,學生、教師、家長以及大學和職場代表等利益相關者,也能夠通過網絡在線報告和跟蹤系統,分享這些信息。我們可以借鑒這些有價值的理念與做法,結合自己的實際,建設具有中國特色的基礎教育質量監測與評估的綜合性評價體系。