何孟姐
(福建省基礎教育質量監測辦公室,福建福州 350003)
福建省從2011年開始就參加國家義務教育質量監測,已歷經10年;而省級義務教育質量監測從2013年首次實施至今,也歷經8年。監測范圍覆蓋全省9個設區市及平潭綜合實驗區共92個區縣,監測內容包含語文學習質量、數學學習質量、英語學習質量、科學學習質量、藝術學習質量、德育狀況、體育與健康狀況、心理健康狀況及相關因素等。義務教育質量監測在福建省從一個新事物逐漸發展起來,這兩年上至教育行政管理部門下至一線教師對這項工作都有一定的了解。然而,基層和一線的義務教育工作者對于義務教育質量監測工作的目的和意義還有存在誤解,把監測等同于統考、監測評價異化為排名的現象普遍存在,甚至扭曲監測數據的現象也時有發生。這就需要所有義務教育階段的教育工作者深入了解和思考監測的緣起、目的、性質、價值取向。
21世紀以來,國際大規模教育測評項目的影響力逐漸擴大,如經合組織(OECD)組織的國際學生評估項目(PISA)、國際教育成就評價協會(IEA)組織的國際數學和科學趨勢研究(TIMSS)和國際閱讀素養進步研究(PIRLS)等,這些項目引起國際廣泛關注,并推動了部分國家的義務教育改革。在我國,尤其是2009年起部分省市參與了PISA測試之后,義務教育領域甚至社會各界人士對這類大規模教育測評項目的關注度更高了。教育部2015年頒布了《國家義務教育質量監測方案》,并于當年正式開始實施國家義務教育質量監測,標志著我國義務教育質量監測制度確立。那么,促使國家、省級開展義務教育質量監測的內部動因是什么?
隨著“兩基”、“普九”、標準化學校建設等促進義務教育發展的政策的實施,人民群眾對義務教育的需求從“有學上”變成了“上好學”,這意味著我國義務教育已經從規模發展階段進入了內涵發展的階段。盡管學校的基礎設施、硬件設備有了明顯的改善,但教育教學質量還有很大的提升空間。另外,城鄉差距、區域差距、校際差距、群體差距較大,學生課業負擔重、教育投入效益不高等問題亟待解決。提升義務教育質量是開展監測工作的內在動力,也是根本原因。
開展義務教育質量監測工作也是扭轉不科學教育評價導向、樹立全面教育質量觀的要求。以往教育行政部門、社會往往以中考、高考升學率來評價義務教育教育質量,“唯分數”“唯升學”的評價傾向對教育本身促進人的發展的目標造成了嚴重的傷害,不利于學生的全面發展和身心健康。而義務教育質量監測堅持全面、科學的教育質量觀,監測內容體現了對學生德智體美勞全面發展的要求,同時關心學生學習情感態度、課業負擔以及其他影響學習結果的教育教學方面的相關因素,探索提升教育質量的途徑,從而進一步促進學生的發展。
此外,開展義務教育質量監測也是為了滿足教育決策過程中對數據、證據的需求。行政部門制定教育政策主要依賴領導的經驗、學校教學決策主要依賴教師的經驗的時代已經過去,零散、小范圍的調查研究數據也無法滿足科學決策的需求。不論是教育行政部門,或是校長和教師,都迫切想要了解和掌握更多義務教育教學的相關數據。義務教育質量監測通過收集學生的學習質量、身心發展狀況,以及學生個體、學校、政府、社會等各個層面上影響學生發展的相關因素狀況等數據,為教育政策制定、教學決策提供依據。
《國家義務教育質量監測方案》規定了監測的目的首先是“客觀反映義務教育階段學生學業質量、身心健康及變化情況,深入分析影響義務教育質量的主要原因”。具體來說,義務教育質量監測要回答的問題有:學生對國家課程標準規定的學習目標的達成程度如何?學生學業質量、身心健康狀況變化趨勢如何?不同群體間差距多大?有哪些對學習結果影響顯著的學生個體、學校、家庭等方面的相關因素?這些相關因素狀況如何?要回答這些問題,一般的統考或小范圍的調查不能實現,必須進行大規模教育測評。義務教育質量監測作為大規模教育測評項目,具備“大規模”這一特性,而“大規模”有兩個層面的內涵:
第一,監測對象群體龐大。盡管與中考、高考考生數相比,監測參測學生數量不多,國家監測每年約20萬名學生參測,福建省監測每年約3.5萬名學生參測。然而,監測的參測學生是經過嚴格抽樣設計抽取出來的樣本學生,代表的是全國幾千萬或全省幾百萬的整個監測目標學生群體。與中高考這樣的選拔性考試不同,監測要反映的是地區的教育質量,完全沒必要全員參測,通過科學的抽樣就能夠很好地代表總體的情況,同時極大地降低測試成本。
第二,監測內容覆蓋面廣。在學科學業質量方面,監測要回答學生對課程標準規定的學習目標的達成程度的問題,就要盡量做到全面覆蓋目標年級課程標準規定的學習目標。只要是課標要求的內容,就應該測到,而不僅僅像中高考或一般統考那樣只選取部分內容進行測試。因此,監測學科測試的題目數量遠遠超出一張120分鐘的測試卷的承載量。為解決廣泛的測試內容和有限的測試時間之間的矛盾,監測學科測試工具采用多題本設計[1],將全部的題目分成數個題本,每個樣本學生只需作答其中一個題本,而獲得的測驗數據可以反映某個地區學生對課程標準規定的全部知識和能力的掌握程度。除了了解學生的學業質量狀況,監測還要探索哪些因素是影響教育質量的關鍵因素。因此,監測通過問卷調查學生個體、學校、家庭等方面的相關因素,如學生的學習習慣、家長的教育期望、學校的課程和師資等。這種大范圍的學科測驗和相關因素調查相結合的測評方式,也是監測與統考或其他學校評價的迥異之處。
“為了改進”是義務教育質量監測的基本價值定位[2]。優質、公平和高效是義務教育質量監測進行診斷、改進的三個價值取向。
優質指義務教育階段學生全面、高水平的發展。一方面,監測不僅包含語文、數學、科學等一般測試學科,還包含藝術、德育、體育與健康、心理健康等領域,未來還將納入勞動教育的測評,這與促進學生德智體美勞全面發展的教育目標相適應。另一方面,監測不僅強調學生學科知識、能力目標的達成,還涉及學習情感態度和價值觀的調查,這與課程標準中情感態度與價值觀目標相適應。監測結果也將學生的學習興趣、學習自信心等情感態度方面的評價與學業表現放在一起呈現。
義務教育質量監測中對“高水平”的評判則回歸了義務教育的基礎性,這體現在監測的高水平更強調高比例的達標,而不是無限追求高分。監測中將學生學業表現劃分為四個表現水平,水平二及以上為達標,即達到課程標準要求的知識點和能力的掌握程度。義務教育的基礎性決定了義務教育發展的基本要求是更高的達標率,不應該片面追求升學率而將教學的內容窄化為升學考試的重點內容,在這些內容上進行高強度反復訓練,忽略甚至無視課標規定的其他教學目標。
公平指處境不利學生也可以通過義務教育取得合格的學業水平。義務教育質量監測關注鄉鎮和農村學校、薄弱學校、不同家庭背景群體的學生群體的狀況,通過城鄉差異、校際差異等群體差異的比較,探索縮小群體差異的途徑,并通過提升農村學校、薄弱學校的教學質量,推進義務教育質量的整體提升。
高效則指更高的義務教育“投入—產出”比。從學生投入方面,監測關心學生學習時間與學業表現、學習情感態度之間的關系,為減輕課業負擔、提高教學效率、優化教育管理提供策略。從學校各方面硬件、軟件、師資等投入方面,監測要探索這些投入中哪些是與學生學習結果的相關性更高,從而提升教育投入的效益。監測還可以通過數據比較發現一些義務教育“投入—產出”比相對更高的地區,總結經驗,進行推廣[3]。
盡管義務教育質量監測是大勢所趨,但在發展過程中也面臨很大的挑戰。
一方面,義務教育監測面臨著應試傾向對其評價體系的侵蝕。社會上升學、應試觀念根深蒂固,盡管監測結果全面呈現了學業表現及相關因素的狀況,但對排名結果的過度關注使得監測無法發揮真正的診斷、改進的功能。被評價者采取回避、不合作的態度,甚至使用各種方法獲得管理者需求的評價結果[2]。倘若監測數據的真實性、客觀性被消解,那么監測的意義也無從談起。另外,在監測的大趨勢下,教師和學生面臨著國測、省測、市測、區/縣測甚至校測,層層“檢測”,其中部分還是打著監測名義的統考,或者下級監測實為對上級監測的“應對”。因此,義務教育工作者要進一步提高對監測的認識,以平常心、平常狀態對待監測,并理順國家、省、市、區縣多層級監測間的關系。
另一方面,監測結果應用的意識和能力較弱。目前,我國義務教育質量監測體系逐步建立,已經基本解決了“為什么監測”“監測什么”和“怎么監測”的問題,并通過歷年的監測積累了大量的數據,但是這些數據沒有得到充分的挖掘和使用。一方面是這些數據多數處于保密狀態,甚至監測結果報告下發后也被封存,相關的部門、教育研究者難以接觸到監測結果數據;另一方面則是監測工作的專業性要求較高,基層教育行政部門人員、教研員等缺乏基本的測量理論知識和數據分析能力。因此,一方面要構建監測反饋、數據共享機制,另一方面要不斷加強地方監測專業能力建設,從而更好地發揮監測診斷、改進的功能,實現監測提升義務教育質量的初心。