馮艷艷
當前隨著大數據時代的到來,以數據驅動學習、教學、管理、決策、輿論正成為新的教育潮流。這都為教育質量評價帶來了革命性變化的機會。如何利用這些新型技術創新評價方式,加強對數據信息的管理和使用,使其服務于教育管理決策和教育教學改進,是當前教育質量評價工作的重要發展方向。數據之于教育教學的意義和價值日益凸顯,從繁雜的教育數據中發現相關關系、診斷現存問題、預測發展趨勢,對實現個性化學習、輔助教育科學決策等方面具有重要作用。基于大數據的學業診斷與提升,教育大數據研究與應用進入了快速發展階段。現在世界各國普遍實行的教育是依據常識和教育經驗來進行決策,基于大數據的教學正是未來教育的理想形態。
白雪
北京市海淀區教育科學研究院質量監測與評價中心主任,北京市數學學科帶頭人,北師大高中數學教材編寫作者之一,北京市高考評價組數學組長,市數學兼職教研員,市高中新課程培訓主講教師,市高考考試說明編寫和調研命題組成員,2010年教育部基礎教育成果一等獎,北京市教育考試院“大規模考試評價與實踐”項目之高考評價研究組成員。
記 者:英國牛津大學互聯網研究所教授邁爾-舍恩伯格曾說過,我們利用傳統教育方式所獲得的反饋其實存在很大缺陷。比如,我們難以對學習過程進行反饋;在對學習結果進行反饋時,我們也只是把關注點放在學生身上,我們對學生的考卷和各種表現進行打分,并要求他們對這一結果負責。然而,作為教育者,我們卻很少評價自己,也很少對我們所采用的教科書、教學方式和內容以及測驗手段是否對學習有益進行評價。導致這種現狀的原因之一是數據很難收集,收集到的數據又很難獲得有效處理。因此,這是一種單向度的反饋。對此,您有什么看法?
白 雪:“小數據”時代的教育確實面臨優質教育資源分配受到時空的限制以及獲取和分析教育過程中的數據成本巨大的問題。因此會難以評價學生的學習過程,而只能評價學習結果,且教學方案主要依靠教師的個人經驗制定。
大數據是近年來快速發展的技術領域。關于大數據的研究與應用與日俱增,并不斷深入影響社會生活。在教育領域中,大數據已經在多方面引起了研究者和實踐者的關注。教育大數據正在成為教育領域不可忽視的新型驅動力,在教育教學研究與實踐中發揮著越來越重要的作用。
應用技術發現教學中的數據,有目的、有規劃的來改進教學,我們已經在做。在評價方式上要發生變化,客觀地收集信息,根據數據和事實進行分析判斷,將評價建立在大量數據支撐和科學分析的基礎上,改變過去主要依靠經驗和觀察進行評價的做法;注重考查學生進步的程度和學校的增值程度,改變過去單純強調結果不關注發展變化的做法;注重促進學校建立質量內控機制,改變過于依賴外部評價而忽視自我診斷、自我改進的做法。用傳統方法收集教育信息存在著的數據時效性不高、不夠準確、收集流程繁瑣等諸多弊端。信息技術手段能有效解決以上問題,且通過數據采集方式的更新、數據分析和呈現方法的改進,能更大程度地提高數據的使用效率,以全面、準確把握教育質量現狀。使用信息技術手段能更深入、全面、快捷對評價數據進行分析,便于從不同角度查看和使用各個層次的數據。此外,通過數據挖掘等技術還能預測和發現事物之間潛在的重要聯系,為決策提供更科學的支持。
大數據能為我們展示事物背后無數的相關關系,通過這些相關關系,我們可以更準確地認識事物的本質。
記 者:學業評價是教育教學中的重要組成部分,有效的學業評價對于了解學生的學習情況、發現教育教學中存在的問題、尋求教學改進與優化策略、提升教育教學質量具有重要意義。依托大數據,利用信息技術進行的學業評價該如何實現呢?
白 雪:依托大數據下的學業評價,我們的理念是從判斷性評價到專業化診斷。診斷不是挑毛病,而是促進發展,促進學校、教師和學生的發展。不是只關注結果,更多的是助力過程。發現好的教學方法和教學規劃。
考試結果最直接的呈現方式是數據。考試數據蘊含著豐富的教與學的信息,我們如果能夠分析和反思這些信息,對于改進管理,改進教師的教,改進學生的學都有著重要的意義。
數據并不等于信息,只有將數據轉化為信息,并有效地運用有價值的信息,才能真正為教育、教學服務。
很多時候人們只是看到數據,都有用數據分析的意識,但是水平和層級、寬度和意識不夠。比如早期我們只是對難度進行研究,把握試卷難度系數,用于規劃每次考試。顯然把握難度系數是不夠的。
幾年以前我們就采用網上閱卷系統,對高三年級的四次大型考試,即第一學期的期中和期末考試、第二學期的一模和二模考試進行網上統一閱卷,收集考試數據。這些數據不是抽取的、不是隨機的,而是我們學生的整體數據,這就是我們的大數據,是我們分析的基礎。
當然,為了數據的準確性和可信度,我們需要在試題的命制上下功夫。
從命題開始,制定學科知識板塊和能力板塊。科學規劃試題的目的、功能和頻率;集中優秀教師力量命題,這也是評價工作中的重點;最后的難點是從數據中發現問題,進行診治。例如地理新課程高考目標要求考查學生不斷提高收集信息、觀察地理現象的意識與能力,試題信息來源的渠道多樣化,圖像、文字資料數量增加;試卷知識的覆蓋度大,突出考查學生的地理思維能力、運用知識的能力和語言表達的邏輯性。依據要求,我們對四次考試命題的知識和能力做了規劃,期中時知識上考查圖像、位置和特征內容,能力上考查概念、原理和規律。期末時知識上考查差異、發展、問題和措施內容,能力上考查方法和應用。一模二模則包含上述所有內容和能力。
挖掘數據功能,關注教學過程。透過現象看本質,利用結果看過程,通過現狀看發展。挖掘數據信息的根本目的在于發揮考試的診斷評價功能和激勵發展功能,促進教育教學質量的提升,促進學生的全面發展和教師的專業發展。從教學層面,重在細化分析,從知能組塊到小題分析,從年級、班級到學生個體;從橫向到縱向;找出問題,找準典型問題和關鍵問題;反思教與學的過程,準確歸因;改進,尋求發展、提升。從管理層面,重在導向把握,診斷、激勵、發展,拒絕簡單粗暴的排位;宏觀規劃,誰來做、做什么、為什么做,逐步落實;方法指導,怎么做,進行必要的學習和培訓;監督落實,做了沒有、做得怎么樣。
評價分析的視角要有兩個轉變:從關注結果到關注過程,從判斷評價到激勵發展,二者體現的結果就是改進教學。
例如我們針對某年高考數學進行了分析,就函數與導數的答題情況(以18題為例)來看,一組學生和二組學生的差距產生在第二問上,思維難度主要表現在學生要有綜合處理數學問題的能力,如把比較復雜的數學問題不斷地進行簡化,這就需要學生能夠看懂問題并有化簡的意識以及熟練運用分類討論的數學思想。就解析幾何的分析(以19題為例)來看,他們的差距還是在第二問上。這種差距表明學生對解析幾何這門學科的基本思想的認識深度和領悟的差距,特別是對于二組的學生來說,提高的關鍵在于能夠提高學科思想的認識,學會用解析幾何的思維看待問題和解決問題。
基于這樣的分析,我們提出改進建議:一是提高數學復習的思維含量,挖掘學生的思維潛力,讓學生掌握用數學的思維方法理解數學的問題并解決數學問題,要能夠從觀念上啟發學生去深入地、科學地思考數學問題。二是針對目前記憶型的知識復習在課堂上還占有很重要的地位;缺乏理性的思考與點撥,滿足于大量的習題訓練仍成為數學復習的主流形式的現實,要指導教師在教學中,充分調動學生主動思維的積極性,不要靠記憶學數學,不要只講題型,要能夠講出一般的思維方法,要給學生思考問題的空間。 通過我們教師的復習,讓學生能夠領悟到學習數學不是靠記憶的,學的好與不好與記與記不住公式沒有必然的聯系。三是每一節復習課的教學定位要準確。我們有限的課堂教學不能僅僅告訴學生這道題怎么解,而是應把教學的落腳點放在思維過程的揭示上。每節課也許都要分析一些典型的例題,但教師要能夠從如何審題,如何分析題,如何思考問題入手展開教學。題型的教學有時候很可能是最沒有效果的教學,原因就在于這種教學只是在外在的形式上做文章,沒有觸到數學思維的本質的東西,是僵化的思維,是對學生理解數學問題、領會數學思維的誤導。沒有幫助學生概括數學的思維特點,沒有從知識的整體上幫助學生去認識數學,是“講題”式教學的最大的問題,在一定程度上也反映了我們教師在備課時的不深入,不到位。
記 者:在實施過程中,有沒有遇到一些問題?又是如何解決的?
白 雪:遇到問題是必然的。
轉變觀念是最難的一件事情。我們需要讓老師認同數據分析的意義和價值。比如讓老師們理解學科知識內容(學科能力)得分率統計分析的意義,針對具體題目,就學科知識、學科能力和學科思想方法方面,我們需要跟老師們一起分析學科本質是什么?哪些知識最有價值,最應該讓學生掌握?特定的知識在整個知識系統與其他知識橫向縱向聯系是什么?學生在哪些地方最容易出現問題?特定的內容怎么呈現給學生?學生怎么學會?以此調動老師們的積極性。
在數據分析和解讀方面我們也遇到了一些問題。最初的數據分析結果是以數字和表格的形式呈現,我是數學出身,我認為老師看這些數字是沒有問題的,我忽略了文科老師對數字的不敏感性。有的老師就跟我提建議,能不能改用圖的形式。我們的技術人員出手,設計程序,只要輸入數據,就能呈現出不同數據圖表,可以是分學科分維度的,也可以是單題目的,也可以是學校之間橫向對比的,也可以是校內各學科的比較,當然更有學生的整體報告。學校還可以根據自己的特點,依據這樣的分析理念繼續細化。圖的形式更直觀,更形象,更清晰。只要按動操作按鈕即可。
為了數據分析更準確到位,我們還設置了四條線——20%,40%,60%和80%線。找到全區總分及各學科四條工作線對應的分數,學校根據學生成績明確進入四條工作線上的人數,然后進行分析,分析學科之間的差異、學科教學的關注點、教學加工的能力,為后一階段的教學過程、個別輔導提供數據參考;看出變化,確定學科教學的重點;總結經驗,反思問題,為以后的工作積累素材。
提升管理的科學性、工作的藝術性,關注過程的跟蹤,使其具有可操作性。讓我們的增值評價更科學,更可行。我們一直提倡教學中不同學段的學科教師間傳經送寶,以前傳送的多是試卷,現在我們有基于數據挖掘出來的經驗可以傳送下去。基于標準驅動的、證據文化的、區校合作的、技術支持的評價是我們的愿景。