田慧生
新中國的歷史上,從來沒有哪個時期像今天這樣把教育監測與評估的重要性如此強調:《國家中長期教育改革和發展規劃綱要(2010-2020年)》中有20余處提到教育監測與評估,把教育監測與評估作為教育領域體制機制改革的重要抓手;黨的十八屆三中全會通過的《中共中央關于全面深化改革若干重大問題的決定》第42條專門指出“深入推進管辦評分離……強化國家教育督導,委托社會組織開展教育評估監測”。2015年,國務院教育督導委員會辦公室發布了《國家義務教育質量監測方案》,教育部出臺了《關于深入推進教育管辦評分離促進政府職能轉變的若干意見》。可以說,我們迎來了教育監測評估的春天。
堅持標準引領,深刻認識教育監測評估對教育改革的推動作用
在國家高度重視教育監測與評估的同時,我們應當清醒地認識到,監測與評估的科學化已經成為教育監測與評估能否發揮其重要作用的關鍵因素。
沒有足夠的技術手段獲得準確反映教育質量狀況的客觀數據,我們就無法建立可量化、相對穩定的教育評估標準,也就沒有建立起科學的教育質量評估制度。單純以中考、高考成績衡量教育,既不能全面客觀地對教育質量作出評估,也不能有效地診斷存在的問題及其根源。沒有基于可量化、相對穩定的教育質量標準,沒有實施科學的教育質量監測評估,一直是中國教育評估之困。
這種情況隨著現代信息技術的飛速發展出現急劇變化,運用大數據實施教育監測評估,為科學實施教育督導提供了技術支撐。大數據、云計算為原來難以準確監測和評估的教育內容及領域提供了可能的解決方案:我們可以運用信息技術系統地收集反映學生綜合素養的系列客觀證據,采用大數據技術獲得對學生綜合素養的準確判斷;我們可以利用互聯網系統收集教育教學過程實時動態信息,對教育教學過程和學生發展狀況之間的關系作出更為準確客觀的判斷……制定質量標準,在科學實施教育質量監測評估基礎上,開展教育督導,推進教育改革和發展,是中國教育當前和今后相當長時期內的重要內容。
教育部制定了若干學科標準,推動國家教育質量監測的實施。重慶市教育評估院基于多年的研究,研制了《教育評估規程》和《教育質量監測標準》,并在國家標準委和重慶市標準局立項,重慶市教委印發了《重慶市義務教育學校質量標準》,一定程度上改變了以考分為唯一衡量標準的現象,引導社會逐步樹立正確的質量觀和人才觀。
堅持科學監測,務實開展教育監測評估多維全域的專業研究
教育監測評估是專業性、技術性很強的以數據為本的工作,其保障體系和機制建設也是教育評估、教育統計、心理測量、信息管理等多學科融合發展的過程。在我國,教育統計、心理測量等以數據為核心的相關學科基礎還不強,學科人才還不多,迫切需要在建立國家監測評估制度的同時,高度重視相關基礎研究,以此為依托推進相關領域的高水平研究,積極開展相關學科建設,積蓄相關領域人才和力量,為監測評估制度的長效發展奠定堅實基礎。
首先,建立育人導向的專業化教育監測評估體系。深化教育綜合改革要加強頂層設計,把“立德樹人”貫穿改革全過程,為教育監測評估提供方向和依據。評估是教育工作的指揮棒,建立科學的、育人導向的監測評估體系,對實現教育的育人功能具有十分重要的意義。育人導向的監測評估體系構建主要包括四層含義:建立育人導向的監測評估觀念,建立育人導向的監測評估方式,建立育人導向的適應各層次的監測評估機制,建立育人導向的創新監測評估手段。其次,建構適應素質教育為目的的監測評估內容框架。一個國家或地區的教育質量本身就是一個非常復雜的綜合體,根據評估項目功能一定對應于評估項目目標這一評估學的基本原則,在對國家或地區教育質量進行監測和評估的過程中,需要對國家教育質量評估的目標進行細分。從而確定不同的監測范圍、抽樣設計和監測內容及周期。全面監測學生德智體美社會實踐各方面,重點考察學生健康水平、綜合素質和運用知識的能力,引導素質教育有效實施。再次,制定和執行規范化監測評估工作流程。教育質量監測評估要遵循三個原則:客觀性,采取抽樣調查方法,科學設計監測指標和監測流程,反映教育質量狀況及其影響因素;規范性,以國家教育法律法規和義務教育課程標準為依據,規范流程,嚴格操作;引導性,在理念與技術上與國際接軌,抓住大數據這個關鍵點,提高專業水平和技術能力,推動教育改革發展。重慶市教育評估院經過8年的研究,研制了8類100余套學科工具和心理工具,從學生行為習慣、學業水平、身心健康、藝術素養、創新能力及學校管理、教師師德、教學水平、學生負擔、課程安排等多個維度進行監測,信效度良好。
堅持智能發展,不斷提高數據采集、挖掘、分析、聚合的技術能力
教育評估監測是在現代治理理念指導下,運用科學方法采集和分析相關數據,進而對特定的教育事實作出精確判斷,以服務于教育決策和實踐的一種專業活動。廣泛采集和應用數據,深入揭示教育現象背后所隱藏的原因,構建促進教育健康發展的策略體系,是大數據時代對教育評估監測的客觀要求。充分利用數據、挖掘數據、分析數據就成為教育監測必須完成的基礎性任務。各種數據分析必須指向問題及問題產生的原因,在系統分析中瞄準和聚焦于具體問題,使問題從眾多數據和事實中凸顯出來。
首先,建立監測評估數據采集智能系統。一是數據采集系統,包括監測信息采集、監則問卷調查、監測工具掃描、網上閱卷系統;二是監測抽樣系統,利用軟件實現分層不等概率抽樣技術的信息化;三是考務打印系統,包括打印監測學生名單、檢錄名冊、學生條形碼、教師網絡問卷賬號密碼等;四是數據清理系統,對數據測謊技術、數據邏輯判斷技術、缺失值處理技術、多選題拆分技術等加以系統化。其次,建構挖掘和分析數據的數學模型。運用描述性分析技術、差異性檢驗、相關分析、回歸分析、多層線性模型、結構方程模型、項目反應模型等分析方法對數據進行分析,實現數據分析的自動化,極大地滿足了監測數據分析的需求。重慶市經過8年監測和PLSA ForSchool測試,采集了數以億計的海量數據,挖掘分析形成了多份決策咨詢報告。再次,開發人機融合的數據智能處理功能。重慶市教育評估院研制了基于信息技術的人機一體化系統,不斷推進教育評估監測向自動化、智能化方向發展,實現了數據自動采集、自動分析、自動報告的目標。
立足于大數據開展監測評估,圍繞數據采集錄入和篩選分析,既要研究教育評估的理念和制度、學生評估的系統和實踐、質量監測的方式和運用以及教育測評與教育督導的作用和關系等教育改革發展的共性問題,又要考慮國家、民族的文化個性;既要時時關注國情和各地區實際,又要加強對外的學習借鑒,實現教育質量監測的科學化與專業化。