王雨寧
PISA作為經濟合作發展組織開展的國際學生評估項目,針對全球不同國家或地區的15歲學生,對他們運用閱讀、數學和科學知識及技能迎接現實挑戰的能力進行測試。PISA自2000年起每三年舉行一次,每年選擇一個領域作為主要測試領域。
時隔九年,在2018年的PISA測試中,閱讀素養第三次成為主要測試領域,而基于時代背景的變化,其發布的PISA2018設計草案中的測試框架也發生了變動。PISA閱讀評價體系的修訂在很大程度上反應了新情境下全球范圍內的教育權威對閱讀素養的新定義與新闡釋,對我國中學階段閱讀教育評價框架的更新與優化有著重要的參考意義。
PISA閱讀素養測試的評價框架主要由相對穩定的三個方面構成,第一是對閱讀素養的定義,第二是閱讀素養層級(2018年更新為認知策略),第三是測試文本的選擇,包括文本呈現所用的媒介、閱讀文本所在的情境,文本的種類、形式(2018年在這一方面新增了文本單位(多文本與單文本)與結構和導航兩個新指標)。
PISA2018設計草案對這三方面都進行了不同程度的修訂,可以概括為以下三點:定義擴充,層級重構,文本增補。
(1)定義擴充
2009年的PISA閱讀素養測試框架中,將閱讀素養定義為“理解、使用、反思并投入到紙質文本閱讀中,從而實現個人目標,開發個人的知識和潛力,并使個人參與到社會中的能力”。2018年的修訂版本中,在原定義的基礎上,將前半部分修改為:“理解、使用、評價、反思并投入到文本閱讀中。”
相比之下,新版本的改動聚焦于兩點:一是增添了對文本的“評價”能力,二是去除了測試文本只能是“紙質”的范圍限制,也就是將電子文本閱讀納入了2009~2018測試范圍之內。如表1所示[1]。

表1
(2)層級重構
在閱讀認知這一板塊,PISA作出的修訂工作較為復雜。2009年對閱讀認知的劃分包括:獲取與面,構成了秩序分明的靜態閱讀層級。而2018年則停用原有的認知方面(cognitive aspects)概念,改為了認知過程(cognitive processes),這個過程又被橫向劃分為兩個部分,分別稱為文本處理(text processing)和任務管理(task management),又在這兩個部分中各自進行細分,縱向則增添了“閱讀流暢度”,屬于貫穿整個過程的維度。對比表如下。

表2
在修訂版中,文本處理部分還得到了更為細致的劃分。其中,“信息定位”包括:獲取和檢索文本信息、搜尋與選擇相關文本;“理解”包括描繪字面意思和整合與推斷;“評價與反思”包括評估質量與可靠性、反思內容與形式、察覺與處理沖突。通過簡單的比對,可以得出文本處理部分與舊版本的內容基本一致。
對于增加的全新維度“閱讀流暢度”與“任務管理”,PISA設計草案也給出了相應的說明。它指出[1]17,閱讀流暢度可以定義為一個人準確、自主地閱讀單詞和相關文本的能力以及對這些詞和文本進行措辭和加工,以理解文章的整體意思的能力。而這種流暢度是檢驗閱讀能力的最基本的指標之一。“任務管理”的加入,則是為了更多地強調“目標導向”“策略意識”的重要性。
(3)文本增補
在文本的分類方面,PISA2018在原有的基礎上僅做了幅度較小的修改[1]。一是將多重文本這一原本包含在“文本形式”中的小項抽離出來,建立了新的分類依據“來源”;二是在文本種類這一依據中添加了“互動”;三是增添了“結構與導航”這個新依據。如下表所示。

表3
PISA發布的測試草案中對新增加的內容進行了解釋,其中“來源”這一新維度,指的就是文本的單元(unit of text),一般來說[1],由單個的(或一群合作的群體)發布的、在一個時間出版的文本是“單文本”,而由多個作者發布的、或在不同時期出版的各自獨立的文本之集合則為“多文本”。
(1)評價內容升級:數字閱讀素養的興起
傳統意義上的紙質閱讀是一種線性的閱讀方式,讀者按照出版時即已確定的順序進行閱讀。但隨著信息化程度的不斷加深,數字閱讀經歷了從興起到廣泛應用的過程。無論是高等教育階段的文獻檢索,還是在服務型網站獲取或登記信息,現代社會的絕大部分成員沒有一刻能擺脫電子閱讀的實踐。它極大地改變了傳統閱讀方式,超鏈接導航、滾動條、交互按鈕、浮動窗口等電子工具,為閱讀的方向選擇創造了無限的可能性,完成了從傳統的平面線性閱讀到網狀立體閱讀的轉變。而以這種復雜形態呈現的文本信息,對閱讀者的素養也相應地提高了要求,也就產生了數字閱讀素養的概念。
數字閱讀對讀者處理信息的能力有著很高的要求。數字閱讀相對于傳統閱讀,不僅信息量大幅增加,信息結構更加復雜,信息的權威性或可靠度也由于沒有出版的限制而變得參差不齊。在這種混合形態的信息流中,如何根據自己的需要在紛繁復雜的導航目錄中精準定位,如何從不同形式的窗口中捕捉信息,甚至如何評價一篇博文下的沖突評論,都是數字閱讀素養高低的體現。
在PISA的閱讀素養評價設計框架中,無論是定義的變化,還是“多文本”“結構與導航”這些新概念的出現,都是迎合這種數字閱讀素養評價的需求而產生的。而針對數字閱讀素養的評價,對評價者的設計能力也更有挑戰性。為了還原真實的數字閱讀情境,評價者需要盡可能地對測試環境進行擬真的加工,給受測試對象以真實的體驗。
(2)評價視角優化:閱讀策略意識
PISA2018閱讀素養測試框架中最大的變化就是將舊版本的閱讀層級,即認知方面,改為了以閱讀策略意識為代表的認知過程。這可以被視作評價視角的轉變。
舊版本中的“認知方面”,從低階到高階的閱讀能力排列,是一種靜態的,平面的劃分,而新版本加入了“閱讀流暢度”與“任務管理”兩個非平行維度后,則為受測者的表現提供了更加豐富的評價視角,對原本的評價框架產生了立體化的作用。
“閱讀流暢度”作為一個難以被既有測量方式衡量的變量,在閱讀能力的評估中常常被忽視。但閱讀流暢性是正確的單詞解碼、自動化、韻律和高效性的有機統一[2]。
不考慮其難以測量的特性,閱讀流暢與否也是受測者最為直觀的體驗,相對于借助試題測量的方式,中間變量更少,誤差程度也較小。這一維度的出現,反映了評價視角正從高處的評價者視角向受測者視角轉移。
“任務管理”,即讀者在閱讀時,自主制定目標和計劃,并自我監控和調節的過程。這同樣是視角下移的重要體現。不同于大部分應試教育評價的“學生接受本位”,這種評價模式更加強調學生的“表達”:學生自主定制計劃,自主完成,自主調節。PISA將這種任務管理過程稱為元認知(metacognition)或策略意識(awareness of strategy)。
PISA指出[1]:元認知,即個體思考和控制其自己的閱讀理解策略的能力,與閱讀熟練度有著深刻的關聯,同時為教學方式所影響。因此,將元認知評價納入到體系中,對教學的調整有著深刻的作用。
我國針對中學生閱讀素養的評價基本被包括在相應學段的語文學科評價中,屬于語文素養的一個構成版塊,很少有針對閱讀素養本身的評價活動。相應的評價體系也都屬于學業評價的一部分,這也屬于專業性評價框架缺乏的表現之一。
在現有的包含針對閱讀素養的評價框架中,被廣泛使用的主要是各省/市的中高考考試說明或大綱。這些大綱往往需要對每一門學科都有所說明,即使是語文考試說明本身,也需要兼顧背誦、書寫等其他多個方面,導致針對閱讀的評價標準泛化。以2019年江蘇省高考考試說明中,針對語文學科的大綱為例[3]:
大綱中按考查內容分類,有現代文閱讀(包括論述類文本閱讀、實用類文本閱讀,文學類文本閱讀)、古詩文閱讀、語言文字應用、寫作四大板塊。針對這四個板塊,有A-F六種能力層級,每個版塊所要求的能力層級有所區別。

表4
總體來說,這份考察大綱根據課程的要求,對不同的閱讀內容作出了能力層級的劃分,對于高考來說,則保證了易于大批量進行評價工作的特性。但如果作為常態化評價的一部分,仍然需要進行細致化加工。閱讀作為一項專門的素養,其評價維度與語文學科的其他構成部分也有所差異,因此現有的以A-F字母劃分的能力等級過于泛化。如果需要達到評價的全面性,則需要建立專業化的框架。其中針對學生閱讀素養的現代性、實用性,數字閱讀素養的納入也應被提上日程。
此外,閱讀文本的選擇則幾乎沒有細致的區分維度,這也導致了實踐操作中的失誤產生。如江蘇語文高考2014年中的文學類文本閱讀《安娜之死》,截取了長篇小說《安娜·卡列尼娜》中的一個小片段,但許多考生并沒有閱讀過這本書,導致理解題意都出現了困難,考試結果無法反應考生水平,可以被認為是一次失敗的評價。
在許多地區中考的語文考試說明或考綱中,對閱讀測試部分的描述也大都十分模糊,有的采用字母等級能力劃分,有的則只使用了文字對考察的能力進行了簡單描述。
由于上文所提及的專用于過程性評價的體系缺乏,導致我國大部分中學的過程性閱讀素養評價基本只存在于以中高考為導向的各次考試練習中。這極可能會導致學生閱讀素養的發展面狹窄,停留于應試水平,對于更高學習階段或工作崗位的閱讀經驗嚴重不足。
結果性評價,小到期末測試,大到中高考,由于教育資源有限,加上被評價的學生數量眾多,為了避免巨大的工作量,所需要的評價指標往往以簡便精準為主,但這并不適用于長時間范圍內的過程性評價。過程性評價的目的應當是盡可能地寬范圍、重實用,對學生的素養提升重于分數提升。
由于中高考的目標導向性極為強勢,中高考所不評價的內容常常處于被忽視的地位,長此以往就導致了以閱讀得分為綱的“指向型評價模式”,大部分學期內的閱讀測試都以結業考試為模板,不斷制造出副本進行測試與評分,這種評價模式更像是重復的訓練,而非是真正意義上的評價。
(1)領域:強調評價獨立性
閱讀素養評價的獨立性應從兩個方面體現。一是將針對閱讀素養的評價同其他語言學科能力區分開來,二是將對于閱讀素養的過程性評價和結果性評價區分開來。
在PISA測試框架中,閱讀和數學、科學在獨立性方面是等同的,即閱讀素養并不完全屬于語文能力的一部分,而是獨立于特定學科能力的存在。因為閱讀并不指閱讀特定種類的信息,而是一切可以被閱讀的信息。閱讀的真正范疇是遠遠大于語文學科中的閱讀的。因此,對閱讀定義的拓寬,是完善閱讀素養評價體系的基石。
基于目前我國中學階段閱讀素養評價存在過程性評價與結果性評價幾乎無所區分的狀態,優化的路徑首先是將二者區別開,保證依據各自的特征有相對的獨立性,又不至于“南轅北轍”。過程性評價應該更加細致、更加具有描述性的傾向,注重質化評價,結果性評價則要在過程性評價的基礎上構建,適當添加量化的比重。
(2)框架:優化結構專業性
通過對資料的簡易收集,不難發現目前我國大部分范圍的地區的語文中高考考綱基本都采用的是單線性的字母等級能力評價方式,只是根據學習階段或地區略有差別。因此,將現有的框架結構進行優化也是必要的。
首先是開拓評價思維,打破原有的單向線性評價限制。僅用簡易的能力層級無法保障閱讀素養評價的完整性與可靠度,一個完善的框架應當是立體的、網狀的,貫穿著不同維度的視角。
其次是從被評價者的角度思考。PISA框架中所強調的元認知、流暢度、閱讀策略意識,都是評價視角下移的表現。雖然這種視角對評價者的要求更高,但對評價的完整性更有所助益,也更益得到準確的反饋并進行調整。
總之,根據語言測試理論研究和統計分析方法的最新發展,優化現有閱讀測試的內容領域,增強其理論基礎和統計效力[4],是一項長久的任務。
(3)內容:保障理念時效性
隨著社會、經濟和文化的發展,閱讀素養的內涵已擴展到了終身學習框架下在各種情景交互作用中建構的一種可增長知識、技能和策略的能力[4]。傳統的紙質閱讀評價模式也應同步得到革新。由于管理模式的差異,我國的中學生更難在學校學習時間接觸到電子產品,這對電子閱讀素養的培養與評價也帶來了挑戰。
一部分中學生進入高等教育階段之后,要面臨檢索文獻、電子資料整合等具有一定挑戰性的電子閱讀任務,即便是未進入高等教育階段而就業的學生,更好的電子閱讀技能也能使其成為更加優秀的勞動者。這種需要是與傳統意義上的中學閱讀訓練脫鉤的。因此,在中學階段就將電子閱讀素養納入評價范圍是極有必要的。
由于PISA測試具有全球性,因此所使用的文本更加具有普遍適用性。但語言應用的語種背景是不可忽視的,一定程度上,即便擁有了通用的閱讀素養,在不同的語言文化背景下,也有可能無法順利完成閱讀任務。基于這一點,我國在探索具有自身特色的閱讀評價體系時,應該充分考慮中文的特殊性。
例如,中文的日常運用中,了解敬語、尊稱等特有的語言使用習慣是進行流暢閱讀、掌握文本含義的要素之一,這在西方語言中則相對少見。在閱讀交流性質的文本的情境下,如邀請函,正式書信等。針對這一點,許多其他領域語文教學評價中也對此進行了考察。如2014年江蘇高考“語言文字應用”選擇題。
下列交際用語使用不得體的一項是(3分)
A.涂鴉之作,不足當先生一哂,如蒙賜正,小子不勝感激!
B.欣聞敝校百年校慶,本人忝為校友,因事不能躬臨為歉!!
C.吉日良辰,花好月圓,恭祝一對璧人并蒂同心、白首偕老!
D.家母古稀之慶,承蒙各位親友光臨,略備薄酒,敬答厚意!
這類題型雖然不屬于閱讀測試題,但文本卻可以作為閱讀素養測試的選擇。例如通過尊稱的使用,提供閱讀材料中人物的關系信息等,以此作為考查點。這樣既保障了足夠的實用性,又充分考慮了語言特色的情境。除了敬語之外,中文由于其極高的獨特性,在閱讀中仍包含了許多與其他語言所不同的閱讀要求,這都可以成為我國教育評價領域建立閱讀素養評價獨特模式的方向。
科學設計作業,落實練什么、怎樣練。針對作業練習中存在的不扣目標、超越課標、重視書面、弱化實踐等問題,可進行如下改進:其一,對準目標、有的放矢。緊扣教學目標來設計練習,做到“課課練有重點,題題練有方向”。其二,容量適當、注重差異。讓學生練在關鍵處、練在重點處,練得樂在其中、練得各得其所。其三,內容新穎、形式創新。關注學習方式轉變、關注實踐能力形成、關注問題意識培養,引導學生重視整本書的閱讀與分享。
精心設計評價,落實以評促教、以評促學。教學評價改革,應重視“三個走向”:一、評價標準從分離走向融合,與課程標準、教學目標緊密契合;二、評價方式從單一走向多元,將課堂觀察、隨堂考查、活動呈現或書面專項檢測等多種方式有機結合;三、評價內容從隨意走向專業,圍繞教學目標研制“過關清單”等具體檢測依據和測評工具。
——《中國教育報》2021年12月16日