
【摘要】在教育評價改革的背景下,階段性評價概念被提出,其在教學實踐和理論研究中都需要得到關照。從實施層面,階段性評價可以通過紙筆測試、非紙筆測試、二者相結合三條路徑落實。不同實施路徑能夠滿足不同的評價要求。無論何種路徑,都要涉及階段性評價目標的確定、真實學習情境的創設、學習任務的設計等環節,這三種路徑在具體操作上也有所區別。
【關鍵詞】小學語文;階段性評價;紙筆測試;非紙筆測試;實施路徑
階段性評價是《義務教育語文課程標準(2022年版)》(以下簡稱“義教新課標”)頒布后出現的新概念,是指“在教學關鍵節點開展的過程性評價,旨在考察班級整體學習情況和學生階段性學習質量,是回顧、反思和改進教學的重要依據”[1]。作為過程性評價的表征形式,階段性評價集合了表現性評價和終結性評價的優勢,以更靈活的評價方式將定性評價與定量評價相結合,更全面地評估學生的語文學業水平,發現其學習問題,彌補了傳統單一方式相互割裂的不足。根據義教新課標的要求,可以采用三種方式開展階段性評價:紙筆測試、非紙筆測試、紙筆測試與非紙筆測試相結合。選取何種方式取決于評價目標的取向,不同方式的組織路徑也有所區別。
一、以紙筆測試為手段的階段性評價實施路徑
階段性評價的功效之一是掌握班級學生在完成階段性學習任務后,整體的學業能力表現,從一般性層面診斷班級學生的學習問題,為進一步改進教學提供依據。在評價方式上,可以選用紙筆測試,與日常教學相融合,開發科學、多樣的試題來達到此目的。命制階段性評價紙筆測試題目可以從以下幾個環節展開。
1.根據教材單元整體特點,明確核心素養評價旨向
階段性評價的根本目的在于評估學生語文核心素養的發展水平。教材作為學生的關鍵學習資源之一,是評估學生核心素養的有效抓手。雖然“核心素養的四個方面是一個整體”[2],但是在教材各個單元中,不同的學習內容、學習目標會使核心素養的培育各有側重。
教師可以根據單元語文要素明確階段性評價的核心素養旨趣。比如,通過某個單元的學習,學生的批判性思維能力應有所提升,[3]這指向“思維能力”素養。又如,有的單元重視教會學生閱讀方法,學會表達自己的思想情感,這指向“審美創造”素養;有的單元明確指出“感受漢字的趣味,了解漢字文化”,這指向“文化自信”素養。教師還可以根據教材單元的選文體裁特點來明確核心素養旨趣。比如,六年級上冊第四單元選文《橋》《窮人》《金色的魚鉤》都是小說,故事情節曲折,人物形象鮮明,具有虛構的特點。學生在學習本單元時會自然而然地感受、理解、欣賞小說的魅力,將積累的語言經驗遷移運用到自己的言語實踐中,這一過程最終指向“審美創造”素養的發展。
2.根據教材單元人文主題,創設階段性評價測試情境
創設新穎、內涵豐富的命題情境,是落實義教新課標中評價變革理念的重點和難點。[4]因為在紙筆測試環境下,較難呈現復雜多元的情境要素及各要素之間多樣化的聯系,所以加大了創設真實測試情境的難度。[5]階段性評價要貼合學生的階段性學習體驗。單元人文主題是學生在特定階段形成學習體驗的主要憑借,自然也成為創設測試情境的重要依據。
教材單元的人文主題往往在單元導語中有明確提示。例如,六年級下冊第一單元的單元導語提及“百里不同風,千里不同俗”,可以確定這一單元主要介紹各地民俗風貌。在命題時,教師可以根據所在地的風俗資源,結合學生這一階段的學習內容,創設既符合學生社會生活經驗,又符合其語文學習體驗的測試情境。教材中有些單元在導語部分并未給出明確的人文主題,這就需要教師根據單元學習內容來自主確定。例如,六年級上冊第八單元的導語,只引用了臧克家的詩句,教師很難從中推斷出該單元的人文主題。翻閱單元選文發現,四篇文章均與魯迅相關:或是選自魯迅的文章,或是選自他人描述、紀念魯迅的文章。教師可以此為切入點,選擇一位學生熟悉的作家,或就以魯迅為對象,創設測試情境。
3.根據教材單元學習內容,設計階段性評價測試任務
義教新課標要求考試命題要“設計多樣的問題或任務……問題或任務是題目的主體部分”[6]。這雖然針對學業水平考試命題提出,但也同樣適用于以紙筆測試形式開展的階段性評價命題。設計高質量的測試任務,首先要厘清三對關系:測試情境與測試任務的關系、測試任務之間的關系、測試任務與測試內容之間的關系。[7]前者關涉測試情境是否真實,中間關涉任務邏輯是否清晰,后者關涉測試目的能否達成。
任務是在特定情境中進行的,情境為任務的完成提供必要的線索。[8]在設計測試任務時要考慮測試情境的特點,依據情境特點設計測試任務。任務與任務之間的關系,一方面要滿足情境中問題解決的邏輯要求,另一方面要滿足考察學生多元思維能力的要求。測試任務是測試內容的載體,測試內容嵌套在測試任務之中。例如,以“規劃魯迅專題展覽”為測試情境,測試任務就要沿著“專題展覽需要做哪些準備”這條線展開,以規劃魯迅人物生平介紹、魯迅的文學作品簡介、魯迅身邊的人物等專欄作為測試任務。三個測試任務共同服務于測試情境的建構,同時測試任務逐漸聚焦,深化對學生思維能力的考察。需要解釋的是,階段性評價的測試內容與一般性紙筆測試的測試內容有所區別,它更貼合學生在當前階段的學習經驗。因此,在遴選測試內容時,要以教材單元的學習內容為依據。可以把單元語文要素作為遴選測試內容的標準;可以適當拓展課后習題,將課后習題作為測試內容;還可以把單元練習題,如語文園地作為設計測試內容的參照。
二、以非紙筆測試為手段的階段性評價實施路徑
階段性評價的另一個作用是掌握學生個體的學習表現,診斷個性化的學習問題。在評價方式上可以采用非紙筆測試的方式達成此目的。與紙筆測試不同,非紙筆測試具有更強的表現性特征,需要以系統的、顯性的、綜合的學習任務來組織和實施評價。在操作上更關注任務的設計目的、任務的呈現方式、任務的完成時機和任務的評價標準四個方面。
1.明確學生的認知能力和非認知能力發展目標
評估學生核心素養的發展水平,不僅要通過考察學生的認知能力來實現,還要通過評估學生的非認知能力來實現。無論考察何種能力,都要以尊重學生個體差異為前提。將對學生個性化學業表現的考察滲透到認知能力和非認知能力的考察中。
首先,以非紙筆測試方式開展階段性評價,要明確在這一階段學生要達成的認知能力目標。素養導向下的教學追求認知的結構化,[9]考察學生在特定階段學習后形成的認知能力也理應是多維且結構化的。“多維”是指非紙筆測試既要評估學生的知識掌握情況,還要評估學生的認知發展水平。學生應該掌握何種知識,可以根據教材單元導語涉及的語文要素來判斷;學生應該發展何種認知,要以義務教育語文課程標準評價組研制的語文核心素養測評框架為依據。[10“] 結構化”是指在長時的階段性評價周期內,評價任務考察的認知能力應具有進階性。例如,針對識字單元開發階段性評價任務,先要以識記為考察目的,再考察學生的積累水平,最后考察學生能否發現漢字的構字規律。
其次,以非紙筆測試方式開展階段性評價,還要關照學生非認知能力的發展水平。非認知能力主要指非智力因素,包含情感、意志、個性傾向等方面。[11]在階段性評價實施過程中,教師要真實記錄學生在完成評價任務時的非認知能力表現。例如,在整本書閱讀讀書分享會上,學生是否認真聽講,積極參與分享討論;在撰寫研究報告的過程中,學生每次提交的內容是否比前一次更認真仔細。這些都是評價學生非認知能力發展水平的重要依據。
2.設計能生成顯性學習產品的學習任務
以非紙筆測試的方式組織階段性評價,要解決的關鍵問題是:如何透過學生的學習過程發現隱性的能力與素養發展趨勢。這就要求教師想方設法地將能力與素養外顯化。下沉到階段性評價上,就要設計能生成“看得見,摸得著”的學習產品的學習任務。教師可以通過評估學習產品的質量,把握學生的能力和素養發展水平。
任務是鑲嵌在情境中的,任務生成的學習產品也理應符合情境發展的邏輯。因此,學習任務生成什么樣的學習產品,要綜合考慮情境的特征。如果教師在階段性教學中創設的是問題解決類的情境,學習任務就要沿著問題規劃、問題探究、創造性解決和反思評價[12]這條路徑設計;生成的學習產品就是問題解決規劃書、問題探究過程記錄表、問題解決報告等。如果創設的是社會生活類情境,階段性學習任務就要根據生活現實情況設計。例如,以“做黨史館講解員”為情境,生成的學習產品可以是優秀黨員人物小傳、紅色故事匯編、黨史講解稿等。比較兩類情境下生成的學習產品可以發現,前者是沿著問題解決的思路逐層深入,后者是按照現實生活的需要平鋪羅列。可見,無論學習產品以何種組織邏輯呈現,都要服務于情境的真實性。
3.在學習任務之間和學習任務內部確定評價時機
“階段性評價是在教學關鍵節點開展的過程性評價……非紙筆測試要……合理規劃實施時間。”[13]與紙筆測試有相對明確開展階段性評價的時間節點不同,非紙筆測試要求教師能夠敏銳洞察實施階段性評價的“關鍵節點”。從操作層面看,確定“關鍵節點”可以從任務與任務的銜接、學生的學情發展階段兩個方面予以關照。
如前所述,學習任務的設計邏輯與情境的特點相匹配。任務與任務的銜接側面推動真實情境的建構與發展。一個學習任務完成,會伴隨著一個顯性學習產品的誕生,并產生一系列非認知能力表現結果。這些都是教師評價學生階段性學習成效的依據。因此,以學習任務為單位,在每個學習任務的結尾實施階段性評價便是適宜的時機。
如果單純以學習任務為節點,就會削弱階段性評價的靈活性。教師要在學生完成學習任務的過程中,通過觀察學生的具體學習表現,即時加入階段性評價環節。例如,在開展整本書閱讀教學時,學生的閱讀動機可能會有所轉變——從外部動機轉向內部動機。這時適時地加入階段性評價環節,掌握學生閱讀動機的發展走向,能夠為后續調整學習任務提供反饋和有效指導。
4.依據學業質量標準設計評價指標
在明確了學習情境的類型、學習產品的種類和實施階段性評價的時機后,需要思考如何能夠科學地評估學生的素養發展水平。語文學業質量標準整體描述學生所應達到的核心素養水平,為核心素養發展水平可測、可評提供了依據。[14]
義教新課標依據義務教育四個學段,按照日常生活、文學體驗、跨學科學習三類語言文字運用情境,描述學生語文學業成就的關鍵表現和核心素養應達到的水平。[15]以學業質量標準為依據設計評價指標,先要明確學習情境的類屬,再在情境類屬下參考對應學段的“學業質量描述”,規劃評價指標的一級維度。不同情境中設計的學習任務、生成的學習產品有差異。在明確情境類屬后,根據學習任務和學習產品的特點,結合學業質量標準要求,厘定評價指標的二級維度。評價指標要想反映學生真實的素養水平,就要與學生現實學習表現相結合,構成評價指標的三級維度。
以跨學科學習情境為例,義教新課標第三學段的學業質量標準確定了“積極參加跨學科學習活動”“與同學合作探索”“能組織討論”等具有非認知能力屬性的考察目標;還提出了“提出要探究、解決的主要問題”“在交流反思中辨別是非”等具有認知能力屬性的考察目標。因此,在該情境下應該考察認知和非認知兩種能力,這就構成了一級指標。在跨學科學習情境下,教師可以設計“制作問題解決規劃書”學習任務。結合學業質量的要求,可以將評價的二級指標確定為“提出問題”“解決問題”兩個維度。再結合學生的真實學習表現,確定三級指標。最終形成如表1 所示的評價指標體系。
三、紙筆測試與非紙筆測試相結合的階段性評價實施路徑
從階段性評價的功能來看,一方面它能夠反映班級全體學生的學業水平,另一方面它能夠呈現學生個體的學習表現。在某些特定情境的學習階段中,單一的評價方式難以發揮階段性評價的診斷、調節功能。因此,需要將紙筆測試與非紙筆測試兩種評價方式相結合。在實施路徑上,并非將兩種實施路徑簡單相加,而是要根據情境特點、任務類型、評價目的有機調和兩條路徑,使其產生“化學反應”。下文將結合具體案例闡釋如何使兩條路徑有機融合。
例如,在學習六年級上冊第二單元時,教師可以創設“紅色革命文化進校園”的學習情境。在情境中設計“競聘紅色革命文化宣講人”的學習任務。學生要完成撰寫宣講稿、演練宣講稿兩項實踐活動。前者具有紙筆測試特點,后者具有非紙筆測試特點。從階段性評價的目標來看,前者可以考察學生對該單元學習內容、知識的掌握情況,后者可以考察學生的非認知能力發展水平。
通過上述例子不難發現,階段性評價的兩條實施路徑要想產生“化學反應”,前提是在學習情境中設計恰當的學習任務。評價這一學習任務形成的學習產品,必須通過紙筆測試和非紙筆測試兩種方式才能實現。在教學實踐中,像原創詩歌朗誦會、演講比賽、古詩詞書法展演、書友會等學習情境,都可以滿足紙筆測試與非紙筆測試相結合的階段性評價要求。
階段性評價是義教新課標提出的新評價理念,在實踐層面還需要進行更廣泛地探索。本文提供了三條實施路徑,紙筆測試可以教材單元為抓手,按照明確素養目標、創設評價情境、設計測試任務三個環節展開;非紙筆測試要以考察認知能力和非認知能力為目標,設計能夠生成顯性學習產品的學習任務,確定最佳評價時機,根據學業質量標準構建評價指標體系;紙筆測試與非紙筆測試相結合的路徑,必須結合特定學習情境和學習任務,有針對性地開展評價活動。這三條路徑都需要在教學實踐中進一步檢驗和調整。
參考文獻
[1][2][6][13][15]中華人民共和國教育部.義務教育語文課程標準(2022 年版)[S].北京:北京師范大學出版社,2022:49,5,50~51,49,37.
[3]楊新穎.核心素養導向的小學語文階段性評價工具的開發[J].語文建設,2023(16).
[4]鄭國民.以文化人,建設素養型語文課程標準——義務教育語文課程標準(2022 年版)解讀[J].基礎教育課程,2022(9).
[5][7]楊磊,吳欣歆,鄭國民.義務教育新課標背景下語文學業水平考試的命題模型建構與應用[J].中國考試,2023(6).
[8]趙德成.表現性評價應用中的問題——基于2015年多省市中高考命題的分析[J].課程·教材·教法,2016(1).
[9]黃文峰“. 教學評一體化”理念下小學語文階段性評價的診學探索[J].小學語文,2023(2).
[10]楊磊.基于核心素養的語文學業水平考試評分方案研制[J].語文建設,2024(9).
[11]梁茜,皇甫林曉.從數據分析看非認知能力因素對學生學業表現的影響[J].比較教育學報,2024(1).
[12]楊磊,吳欣歆.教育測評變革的實踐探索:指向問題解決過程的測試工具開發[J].中國教育學刊,2023(1).
[14]施偉燕.基于學業質量標準的階段性評價設計探索——以義務教育第三學段紙筆測試命題為例[J].七彩語文,2023(48).
【本文系中國教育科學研究院中央級公益性科研院所基本科研業務費專項資助“基于‘教、學、評一體化’的形成性評價及其實踐路徑研究”(項目編號:GYJ2024016)成果】