
歷經1300年之久的科舉考試造就了我國獨特的考試文化,考試的公平性與科學性等問題始終是中央關心、群眾關切、社會關注的熱點話題。事實上,無論哪種教育考試,總有人會從考試公平、考試難度、題目設計、課程標準等角度作點評,令人困擾:題目太難不行、題目太易也不行,脫離課程標準命題不行、直接把課程標準用作考試大綱也不行,沒有情境不命題、情境過分復雜也會招惹是非等。如何把握好考試命題的方向和深淺?須制定一套科學的、符合中國國情的考試命題規程,以便大眾能在同一個話語體系中討論問題、解決問題。這是落實《教育強國建設規劃綱要(2024—2035年)》,體現教育的立德樹人等政治屬性、滿足人民群眾需求等人民屬性、面向未來發展等戰略屬性的需要。
要解決以上問題,首先要認清我國當前考試命題所面臨的三大困境。
一是難以精準把握基于課程標準的命題深度與廣度。取消考試大綱后,課程標準逐漸成為考試命題的主要依據。但在把握命題深度和廣度方面,各項考試的命題表現水平參差不齊。以《義務教育數學課程標準(2022年版)》為例,新課標要求學生“會用數學的眼光觀察現實世界、會用數學的思維思考現實世界、會用數學的語言表達現實世界”。我國高考和國際學生評估項目(PISA)等諸多著名考試正在嘗試情境化命題,加之大多數現實情境都蘊含多種學科知識,因此部分命題人員在設置數學命題情境時,刻意大規模地融合了多種學科知識,結果卻引起了較大的負面輿論。這說明基于新課程標準的命題方法還不夠成熟。若學生答錯一道融合了歷史等人文社科知識的數學運算題,教師將難以確定其出錯的原因究竟是數學運算不會, 還是歷史等人文社科知識不足。這種考試結果必然會給因材施教帶來困惑,令教師無法確定下一步的教學重點是該調整數學運算的教學深度和進度,還是該拓寬學生歷史等人文社科知識的知識面,并且后者并不屬于數學課程的主要任務。這樣的命題思路當然會引起各方人士的議論。其實,課程標準的側重點在于指導教學和開展形成性評價,在指導終結性評價時則需要小心謹慎。例如,“小明籃子里有3個蘋果,吃掉1個蘋果后還剩幾個蘋果”這樣的問題,就特別適合低年級小學生的數學教學。因為其所設計的問題情境不僅體現了新課程標準的要求,而且能幫助小學生從具體形象思維順利提升到抽象符號思維的層次。但在學習結束后的考試中,理想的題目應該是“3-1=?”,不必重新回到“用數學眼光觀察現實世界”的具體形象思維層次,因為考試的關注點是學生的數學思維和數學語言發展狀態。假若一份數學試卷中的絕大多數題目都必須從晦澀難懂的文字閱讀開始,還要求學生上知天文、下曉地理,那么數學本身的本質特征必將被弱化,學生在數學抽象、直觀想象、邏輯推理、數學運算、數學建模和數據分析等方面的發展必定會受到損害。簡而言之,基于新課程標準的命題不等于所有題目都必須是融合多學科知識的情境化試題,也不必把抽象的符號思維改成復雜的文字表述,專業學科考試就該保留足夠多的反映其學科本質特征的題目。
二是課程標準專家與教育測評專家的合作有待加強。每次考試之后,題目難度、考試的公平性和有效性等話題都會被熱議。要應對好這些問題,只依靠課程標準專家是不夠的,還需要有教育測評專家提供有力的數據分析結果作支撐。當前的難點在于二者的聯系不夠緊密,課程標準專家不太關注教育測評理論,而教育測評專家也不太關注課程標準,許多教育考試機構往往只有命題專家而很少有教育測評專家。事實上,教育測評理論在保障考試公平性、可靠性和有效性等方面發揮著重要作用,并能用較高視角看待考試難度等方面的問題。比如,根據教育測評理論,要保障考試的公平性,就需要極力降低與考試目的無關因素的影響力,其中就包括所有與考試目的無關的背景知識和文字表述等。例如,一道題目的作答需要某種高檔消費體驗為基礎,則必然會對寒門學子造成歧視性的不公平后果。再如,要提高考試的可靠性或測量信度,就至少需要根據考試目的盡力讓試卷中題目的難度分布與全體考生的能力水平分布相匹配。題目太難,學生只好瞎猜,徒增測量誤差;題目太易,則許多學生都會接近滿分,無法選拔優秀者;若所有題目都是中等難度,則既不能細分優秀群體,也不能細分后進群體。因此,控制測量誤差的有效方法之一就是設計好整套試卷的題目難度分布;要保障考試效度,則需要嚴格遵循現代教育測評理論所要求的命題流程和質量標準。比如,需要明確考試目的(標準參照性考試與常模參照性考試題型使用可以不同、結果評價或過程評價的試卷結構可以不同等)、界定考試范圍、設定表現標準、規范寫題要求、預估題目特性、減少評分差錯、科學表達結果、獲取效度證據、降低負面影響、服務考試目的等。其中,考試范圍的界定和表現標準的設定,必須以課程標準為依據。例如,某次面向小學高年級的數學試卷共計36道題,所覆蓋的數學核心素養只有數學抽象、邏輯推理、直觀想象和數學運算,題量分別是18、11、5和2,占比分別為50.00%、30.56%、13.89%和5.56%。按照新課標要求,這份試卷的內容效度完全不合格。值得重視的是,目前總有命題者喜歡把一些與考試目的無關的知識設置為答題的前提條件。例如,有一道高中語文試題是這樣的:“已知f(x)=5cosx/(x^2+1),x∈(-∞,0),則它的圖像單調性在《琵琶行》中琵琶女的感情色調中體現為" " " " "," " " " "," " " " "," " " " "。”類似地,也有命題者設計過這樣一道數學試題:“請在1分鐘之內寫出一個二元二次方程組,用來表達唐代詩人王維在《山中送別》中‘春草明年綠,王孫歸不歸’所表達的意境。” 顯然,這種把答對數學題目作為作答語文試題的前提條件,以及用古詩詞設置數學命題情境的做法都是不妥的。如此設計題目不僅會嚴重損害測評的內容效度與構念效度,還會損害測評的后續效度,造成不良后果。這種命題思路顯然不是新課標所期待的,也偏離了考試命題的改革方向,更背離了教育的人民屬性要求。
三是考試服務者與公眾的溝通不夠順暢。考試是一項與群眾利益密切相關的事情,備受關注。當前的難點在于一些考試服務者擔心引發網絡輿情等會造成困擾,所以封鎖了大量本應公開或必須公開的信息。事實上,在缺乏真實信息的情況下,與考試利益有關聯的人士一旦遇到不理解的現象難免會主觀臆測,進而引發一些不必要的事端。其實,考試質量若真有問題,認真接受群眾的批評才是應有的態度。考試服務者若能保障考試質量,并及時公布考試的信度、效度和公平度等信息,必定能在很大程度上消除各種誤解、減輕社會焦慮。或許,信息的公開還能倒逼命題質量的提升和服務水平的提高。此外,考試服務者在給考生提供原始分數或常模參照分數的同時,若能根據課程標準一并報告標準參照分數,則不僅能弱化考試分數排名所造成的負面影響,而且有助于教師、學生和家長及時準確地了解學生在知識、能力和素養上的發展狀態,豐富家校溝通的內容,方便日后的教學改進。
為了應對上述挑戰,建議采用以下一些對策。
首先,制定符合中國國情的考試命題規程,并建立考試質量督查機制。考試服務是一個相對獨立的行業,它不僅具有比較成熟的理論和方法,而且有從科舉到現代考試所積累的許多成敗經驗。因此,根據現代教育測評理論,吸取國內外實踐經驗,完全可以構建一套具有中國特色的教育測評體系,并在此基礎上制定國家級考試命題規程。這個規程的主要內容大體涵蓋保障考試公平、可靠和有效的要求,包括依據課程標準界定考試內容、設定表現標準的基本要求,以及各種題型的設計要求、組卷原則、施測流程、閱卷評分原則、分數表達方式、結果使用建議等方面的操作指南。有了這個規程,再增設一道類似于財務審計的考試質量督查環節,一方面可以保障并不斷提高各種考試的命題水平,另一方面可以使教育管理部門、考試服務者、教師、學生和家長等社會各界人士在一個共同的話語體系中討論問題及其解決辦法。這對于減輕社會各界的考試焦慮、方便教育督導工作、提升考試命題水平等,都很有價值。
其次,加大考試命題人員的培訓力度,加強課程標準專家與教育測評專家的合作。當前的命題人員主要是一線教師和各級教科院的教研專家。這個團隊的突出優點是熟悉一線教學工作,并對課程標準比較了解,但在教育測評方面的表現水平參差不齊。因此,加強命題團隊的測量學專題培訓很有必要。培訓的內容主要包括兩個方面。一要加強現代測評理論的學習。其目的是使命題人員掌握現代教育測評理論的基本原理和方法,杜絕出臺諸如“某項考試的難度必須為0.90或其他某個特定數值”一類的違背考試科學且難以做到的規定。二要加強課程標準的研討學習。課程標準的側重點是如何完成教學任務,提升學生的知識、能力和素養水平。課程標準對考試命題的指導意義主要體現在如何從知識和素養等角度界定考試范圍、設定表現標準,并把這兩類標準用在考試藍圖設計、問題情境設計、試卷編組和分數報告設計與解讀等方面。至于具體題目是否應該融合多種學科知識等問題,則需要圍繞考試目的來確定。通常,用于標準參照的診斷性考試和過程評價,可以設置一些多學科知識融合的題目,因為這種考試實際上是教學輔助的一種手段,肩負著指導教學和提升學生素養等多方面的任務。不過,對于中考和高考等選拔性考試,則不宜在一份試卷中過多使用多學科融合試題,也不必把問題表達得晦澀難懂。這樣設計題目只會增加測量誤差,損害考試的有效性和公平性,浪費師生的時間和精力。
最后,建設考試信息溝通平臺,及時疏導社會情緒壓力。鑒于考試的高敏感性特點,很有必要加強考試服務者和使用者以及其他關聯者之間的溝通工作。這也是落實《教育強國建設規劃綱要(2024—2035年)》,體現教育的政治屬性、人民屬性和戰略屬性的具體措施。這項工作的具體操作可以從以下三個方面入手。一是創建考試信息服務溝通平臺。主要是網絡服務平臺,內容包括考試項目本身的詳細介紹,設定考試范圍和表現標準的課程標準依據,建立提問與答疑的互動機制,提供相關政策法規的解讀等。二是利用考試信息服務溝通平臺大力開展考試科學的普及工作。無論是教師、家長或其他相關人員,在缺乏考試科學常識的情況下很容易產生誤解,造成不必要的社會焦慮。通過溝通平臺,相關部門可以組織各方面的專家舉辦系列講座以普及考試科學知識,也可以通過不定期的線上線下服務活動,及時回答群眾普遍關心的問題等。三是利用考試信息服務溝通平臺實時發布相關的考試信息。例如,考試服務者可以通過發表考試白皮書的方式報告每次考試的信度、效度和分數解讀與使用建議,提供考試公平性的證據等。其中,信息的公開程度須依據保護個人隱私和知識產權等方面的要求而定,還須遵守考試命題規程和相關的法律法規,這些內容都可以涵蓋在考試命題規程之中。
總之,當前的考試命題遇到了難以精準把握基于課程標準的命題深度與廣度、情境化試題的設計過分強調多學科融合、教育測評理論不被重視和考試服務者與大眾溝通不暢等問題。建議加強命題專家與教育測評專家緊密協作,加速構建中國特色教育測評理論體系,制定并發布國家級考試命題規程,系統地對考試命題人員開展培訓,搭建考試信息服務溝通平臺,同時加大教育測評理論的科普、推廣力度,合力共促考試命題改革穩步推進、精準落地。