王 萍,傅澤祿
(1.華南師范大學 文學院,廣東 廣州 510631;2.廣東科學中心,廣東 廣州 510006)
數據驅動決策系統:大數據時代美國學校改進的有力工具*
王 萍1,傅澤祿2
(1.華南師范大學 文學院,廣東 廣州 510631;2.廣東科學中心,廣東 廣州 510006)
大數據時代如何有效地利用數據形成決策的洞察力是當今教育研究領域倍受關注的話題。隨著信息技術的發展和對學生學習評價的需求不斷增加,美國各學區已逐漸接受了數據驅動決策系統,并將其作為支持學校改進的工具。為了讓我國教育工作者全面了解這一新型工具,該研究在明確數據驅動決策的概念及其產生背景的基礎上,對數據驅動決策系統的基本要素、實施步驟進行了說明,并以美國紐約教育局為例分析了該系統在實踐中的應用和面臨的挑戰。研究表明,數據驅動決策系統有助于學區和學校領導利用數據制定一個用于持續改進的藍圖。了解這一工具并反思我國的教育現狀,對推動我國利用數據提升學校教育質量的研究具有重要意義。
大數據;數據驅動決策系統;學校改進
自計算機和網絡進入教育應用以來,以信息化技術對數據進行分析來驅動決策的努力就已開始。決策可以由三種方式分別或混合驅動:直覺、經驗和邏輯。雖然有時直覺和經驗在決策過程中是無可替代的,但通過邏輯方式做出決策通常被認為具有高確定性的特點,更易于被接受。數據是填充邏輯過程的基石,大數據正在改變決策的驅動方式,由直覺和經驗驅動決策開始向數據驅動決策(Data-Driven Decision Making, DDDM)轉化。數據驅動決策在當今美國教育研究領域倍受關注。2010年美國國家教育統計中心指出,近5.16億美元的聯邦資金用于發展各州的技術基礎設施,其中包括通過州級縱向數據系統(the Statewide Longitudinal Data System, SLD)資助項目來支持學區基于數據驅動決策的信息技術基礎設施[1]。當前數據驅動決策系統已成為美國各學區利用數據支持學校改進的有力工具。那么什么是數據驅動決策?它是怎樣產生的?數據驅動決策系統包括哪些基本要素?其實施步驟是什么?在實踐中是如何應用的?利用數據驅動決策系統改進學校會面臨怎樣的挑戰?這些正是本文所要探討的問題。
2013年,福斯特·普羅沃斯特(Foster Provost)和湯姆·福塞特(Tom Fawcett)在《數據科學與大數據、數據驅動決策的關系》一文中將數據驅動決策定義為“基于對數據的分析,而不是僅僅依靠直覺進行決策的實踐”[2]。在教育領域中應用數據驅動決策這一概念是模仿工業和制造業的全面質量管理、組織學習和持續改進等成功做法。這些做法強調組織改進是通過對不同類型的數據作出迅速反應而得以提升的。這些數據包括諸如材料成本之類的輸入數據,諸如生產速率之類的過程數據,諸如缺陷率之類的結果數據以及包含員工和顧客意見的滿意度數據[3]。數據驅動決策在教育中是指收集、分析、報告和使用數據用于學校改進的過程[4]。在對學區利用數據驅動決策系統作為學校改進工具的報告中,美國學習點協會(Learning Points Associates)強調“在利用數據改進決策之前,重要的是理解數據究竟是什么?”數據的操作性定義是指學區和學校領導使用的多種信息和知識資源,例如有關學生年級水平、人口、語言熟練度、國家標準評價、真實性評價、教師自編測驗、教學實踐、作業和年級平均成績等[5]。
在美國,學校收集數據已經幾十年,然而許多學區或學校管理者直到最近才發現數據在學校改進方面的力量。近期大家對數據的關注是由“不讓一個孩子掉隊”(NCLB)法案所引發的。隨著技術的最新進步和對學生學習評價的需求不斷增加,許多學區或學校管理者發現數據的作用已遠遠超出了NCLB的報告要求。如今全國各地具有超前意識的學區開始采用數據驅動決策系統,不僅要分析測試分數和學生成就,還要分析如何縮小學生之間的成績差距,提升教師素質,改進課程,分享學校和學區的最佳實踐,與關鍵利益相關者更有效地溝通教育問題,促進家長在教育過程中的參與以及加強與教育團體的對話。無論人們是否同意立法的范圍和意圖,NCLB已將全國各地對教育數據的重視提升到了一個新水平。
由于NCLB,現在學校管理者需要負責監控并改善學生的表現,提高教師的教學效率。這種報告通常需要一個用于數據收集和分析的復雜系統。為了推進NCLB,各州和大部分學區都需要安裝某種形式的數據管理系統。然而,普通的系統通常是由一部分通過各種接口松散連接的電子表格、數據庫和紙質報告組成的,難以全面、綜合地對數據進行檢索和分析。今天許多學區都將NCLB作為推進數據驅動決策的催化劑。這些學區使用數據驅動決策完善其技術基礎設施,使數據收集和分析程序正規化,并且要求基于數據,而非假設做出明智的決策。例如,許多學區都面臨著緊張的預算和有限的資源,不得不作出削減項目的艱難決定。因為安置了數據驅動決策系統,管理者可以快速、輕松地分析出學生參加這些項目與其他諸如學生出勤、紀律事件和學生成績等指標之間的相關性,從而清晰地了解每個項目的有效性。當被迫要削減這些項目時,管理者就可以根據實時的事實和數字,而不是情感或假設來淘汰某些無效的項目[6]。
總之,如果沒有一個正式的數據分析系統,各個學區往往無法發現和解決發生在學校層面的關鍵問題。由數據引發的反饋可以幫助學校確認是否在正確的軌道上行進,以提高學生成績,同時了解進展的快慢。數據驅動決策為學校提供了學區、教師、學生和家長可以訪問大量信息的路徑。今天學校可讓關鍵決策者利用數據作出更明智的決策,從而提升學校的整體性能,提高學生成績。
隨著數據倉庫技術和數據挖掘技術的發展,進一步有效地利用數據形成決策的洞察力成為可能,數據驅動決策系統得以發展。一個全面、綜合的數據驅動決策系統是通過數據提取、轉換和加載(Extraction, Transformation and Loading Tool, ETL)工具將來自不同數據源的數據合并到數據倉庫里的。然后利用數據分析工具進行分析和處理,將數據轉化為知識,最后利用決策支持工具和諸如需求評估、專業發展和培訓之類的咨詢支持服務,幫助相關人員基于數據作出決策,如下圖所示。學區可以根據自己的具體需要和預算考慮,選擇實施這個系統的全部或部分,用以支持學校改進。下面對這個系統的基本要素進行具體介紹。

數據驅動決策系統的基本要素[7]
決策支持多樣化的數據來源。這些多樣化數據來自學生信息系統(Student Information Systems,SIS)、人力資源(Human Resources,HR)、資金以及評價等不同功能的數據庫。其中,評價數據庫中涵蓋了從國家測驗、基準評價到基于學校或課堂層面開發的專業測驗的所有測試數據。
數據提取、轉換和加載工具(ETL)是數據庫和數據倉庫之間的接口。該工具將從各種異構數據源中抽取數據,并按照預先設計好的規則進行轉化清洗,處理一些屬性難以統一規范的數據、冗余數據、錯誤數據或者是異常數據,目的是讓用戶對問題進行補救并維護數據質量,最后再將數據加載到目標數據倉庫中。這是建立數據倉庫的必要基礎。
數據倉庫是在數據庫已大量存在的情況下,為進一步挖掘數據資源、為決策需要而產生的,它并不是所謂的“大型數據庫”。數據倉庫是一個專門的中央儲存器(Central Repository),用來保存從多個數據庫經ETL工具選取的已有數據,并為上層應用提供統一的用戶接口,用以完成數據查詢和分析[8]。一個精心設計的數據倉庫可用作一個強大的數據驅動決策系統的基礎層。數據倉庫主要是研究和解決從數據庫中獲取信息的問題。
數據分析工具是推動數據驅動決策系統的“引擎”。這是一個用戶界面友好、非隱秘的報告分析工具,其職責是對駐留在各種數據源或數據倉庫中的信息進行挖掘、預測和分析。它通常提供一個集成報告工具,讓用戶能實時地、預先格式化地定制報告,從而讓那些最需要利用其加快分析和改進工作的人得到數據。工作人員可以在短短幾分鐘內對一個主題進行詳細分析,調查其他原因或相互關系,從各個角度分析結果。
在數據處理方面,最大的難度就是對信息處理的不完全和不規范化。而且這些數據有時會有一些不肯定的性質,使得人們很難做出判斷。決策支持工具的作用就是對大量數據進行深入、詳細的了解和分析,然后進行推測。決策支持工具需要通過建議并描述正確的措施來進一步推動分析,以幫助管理者和教育者重視數據分析工具所強調的問題。該工具通過為管理者、教師和工作人員提供建議、實時警報和自動化行動,創建了一種持續改進的文化氛圍。
許多提供數據驅動決策系統的供應商還提供諸如需求評價(Needs Assessment)、專業發展和培訓之類的咨詢支持服務。有了需求評價,供應商就可直接與學區一起對技術、基礎設施、數據、前期的教育組織目標進行確認,并提供一個虛擬的實施路線圖。實施過程開始時,重要的是確保系統用戶能學會運用合適有效的策略,以利用數據支持并促進學生學習,從而實現更高的運營效率。有些供應商還會提供專業發展和培訓服務,將其作為數據驅動決策包的一部分。起初尋找這些可提供數據驅動決策系統的供應商看起來很困難。美國研究中心發表了一份名為《學生正處于危險之中的教育》(the Education of Students Placed At Risk)的報告。這份報告概述了一個學生數據分析系統應具備的所有特征,同時指出盡管沒有一個單獨的供應商能提供具備所有這些特征的系統,但管理員還是應確認那些對學區而言最重要的特征,然后基于這些所確認的需求來選擇一個供應商[9]。
就最基本的形式而言,數據驅動決策主要是收集合適的數據,以有意義的方式分析數據,讓有需要的人能獲取數據,利用數據提高學校效能和學生成績,最后與關鍵利益相關者溝通數據驅動決策。雖然各學區的需求和資源可能會有所不同,但一般來說實施一個數據驅動決策系統需要以下五個基本步驟。
在實施數據驅動決策系統之前,學區或學校領導應具有收集數據的廣闊視野,收集多種類型的數據,而不是僅僅收集高利害測驗數據,用以滿足接受聯邦資金或達成NCLB所需的年度進步(Annual Yearly Progress, AYP)的管理要求。因為當涉及到學生的學習問題時,任何單一的測驗都無法完全顯示國家或地方標準及課程所規定的有關學生能理解什么,能做什么的全景。一旦學區確定好了收集數據的范圍,下一步就是進行審核,確認已收集的數據并判斷不同的數據源能否兼容。如果無法兼容,學區應查找影響數據兼容的因素。隨后,學區有必要確認所需的額外數據。為了確認額外數據,可以采取數據收集的多維方法。可以進行創造性思考,超越傳統的事務型數據庫的范圍,同時收集量化數據和質性數據。其中,質性數據源包括對教師、學生、家長的訪談和問卷調查、教師日志、另類評價(Alternative Assessments)等。最后,學區還要決定數據收集的頻率,是以每天、每周、每月、每年的頻率,還是數年才收集一次?[10]
數據收集與審核之后,接著就需要先將數據標準化,再利用標準化后的數據進行數據分析。數據標準化也就是統計數據的指數化。就最簡單的形式而言,數據驅動決策就是將數據元素(Data Element)相互關聯,并探索影響學生和教師表現的積極因素和消極因素。數據元素是計算機科學術語,它是數據的基本單位,在計算機程序中通常作為一個整體進行考慮和處理。如果收集數據元素的過程還沒有被標準化,將數據元素相互關聯幾乎是不可能的。因此,首先要考慮開發一套適用于整個組織的數據標準。這些基本的標準包括消除用紙系統(Eliminating Paper Systems)、直接向可兼容的計算機系統輸入所有數據、用通用鍵(Universal Keys)來組織數據等。其中,通用鍵是指全球唯一標識符(Globally Unique Identifiers, GUIDs),在 Windows 系統中稱之為 Class ID,縮寫為CLSID。對于不同的應用程序、文件類型、OLE對象、特殊文件夾以及各種系統組件,Windows 都會分配一個唯一表示它的ID代碼。因此,通用鍵主要用于數據集成。數據、元數據以及其合成數據都需要具有標識。
同樣重要的還有為特定數據元素分配所有權。一個明確的責任鏈會提高數據質量及其完整性。這也是一個理想的介入時機,在這個過程中對學區的信息系統進行評價,以確定其是否能勝任數據收集和分析。第一選擇應是最大限度地利用現有的信息系統。如果不行,那么可能只有去尋找能兼容數據管理的供應商。
需要注意的是,教育機構的技術供應商擁有越來越多的教育數據,因此必須劃出一條清晰的底線,明確供應商可以怎樣利用這些數據。例如,美國的《家庭教育權利和隱私法案》(FERPA)和《健康保險流通與責任法案》(HIPAA),就有了很清晰的限制,包括禁止將客戶的數據用于商業用途。教育客戶也聲明,不能讓供應商獲取學生數據用于廣告和市場推廣中[11]。
在美國,教育改革一直都是媒體、政治家和社區利益相關者多年來審查的重點。由于學校改進在教育改革中備受關注,因此對所有收集到的數據進行準確、毫無偏見的解釋則顯得尤為重要。在進行數據分析時,需要采取一些措施。
1.為系統用戶提供在職培訓
數據驅動決策需要新的知識和技能。系統用戶不僅要了解基本的電子表格和諸如過濾、排序之類的數據庫技術,同時還要熟悉諸如因果關系、相關性和數據分解(Data Disaggregation)之類的基本的數據分析概念。系統用戶要確保自己選擇的供應商能提供這些培訓,將其作為數據決策包的一部分。
2.采取一個收集數據的長期策略
當解釋數據時,對單一的測驗分數做出反應容易出現最常見的錯誤。為了正確地測量進步和變化,有必要進行縱向測量(Longitudinal Measurement)。縱向測量每年都堅持進行,測量學生在不同時期的在校學習是否取得相對意義上的進步,收集的是縱向數據集(Longitudinal Data)。縱向數據集將學生個體在不同時間的測試成績聯系起來,以供學校和政府用來分析它們在何種程度上有效提高了學生成績。結合學生的先前成績,學校和政府將提供“增值”措施。因此,這種方法也經常被稱為“增值方法”。
3.進行“下鉆”的數據挖掘以尋找實情
數據很豐富,而信息往往很匱乏,數據挖掘的目的是從數據庫里挖掘到信息、知識。多維數據挖掘中有“上卷”(Roll Up)和“下鉆”(Drill Down)兩種方式。其中,“下鉆”的數據挖掘過程是一種分解數據的有效方法。它從一般性問題開始,然后將問題“由上而下”地挖掘成更小的部分。這樣挖掘得到的數據可能是有益的,但也可能會造成誤導。例如,當你將一組數據挖得越深,可以應用的樣本就越小,最后得出的結論反而越不準確。因此,要注意不要將數據組挖掘到太小以至于難以得出令人信服的結論的程度[12]。
4.當數據可以應用時就應解釋和分享結果
沒必要等到收集了所有數據,才開始進行分析。在這個過程的早期,一旦所有信息都可以應用了,學區就可以開始觀察可能導致更明智的決策的重要趨勢。美國東密歇根大學教育領導學的教授羅恩·威廉姆森(Ron Williamson)曾指出,“數據本身對校長和教師將其用于學校改進目標而言,并不是很有用。只有當數據轉化成了信息,這些信息被用來激發有關學校未來方向的對話,數據利用在學校改革中才具有重要意義。”[13]數據分析的實踐方面還包括幫助教師和管理人員學會如何解釋數據,并在實施中使用最佳資源和策略。
越來越多的學校、學區開始使用數據驅動決策系統以保證持續改進。學區如果確認了數據中的關系或差距,就可以采取最重要的一步,即做出改變和解釋新策略。無論用于改變的決策是大還是小,做出最明智的決策的關鍵都是考慮數據的可用性。數據分析沒有盡頭,學區工作人員只要理解了如何有效地使用數據,那么確認收集、分析數據的新機會就變得越來越容易。學區應繼續尋找舊問題的答案,包括新信息,因為還可利用并做出新的、更明智的決策。一旦做出這些決策,確認關系并實施補救措施的過程就又重新開始了。
具有遠見的學區會將自己學校的表現與全國其他名列前茅的學校進行對比,在明確差距的基礎上,通過借鑒頂尖學校的成功方法或其他改進措施,從而提出行動方法,以彌補自身的不足。這是基準化分析法(Benchmarking, BMK)的體現。若做得好的話,基準化分析法有助于學區了解什么才是有效的,他們使用的關鍵策略效果如何,哪些改進是可能的或有必要的,以及如何借鑒其他成功學區的最佳實踐。
要讓數據對教師和校長有用,數據必須是可信的。利益相關者必須對數據有信心,相信數據反映了自己學校的實際情況。為了建立公眾支持,提升團隊信心,一個有效方法是為關鍵利益相關者展示學校和學區是如何為結果負責的。共享數據時應采用易于閱讀的圖表和簡短、沒有術語的報告形式,這樣不僅可以讓團隊成員知道學校是基于數據做出明智的決策,還可以創建團隊對公立教育所面臨的問題有更深層次的理解。
學區不應僅依靠媒體來傳達信息。有限的時間和空間,加上缺乏對完整信息的了解,往往會導致媒體只報告基本事實,而這通常因為沒有提供數據背后的細節而產生誤解。許多成功的學區直接向其團隊報告信息。這種做法是使用一個學校報告卡或年度表現報告。該報告用來指導在不同學校的論壇以及家長、工作人員和學校董事會的會議上有關學生表現和教育優先權(Education Priorities)的討論。培訓教師和校長促進這些協商,以確保每個人都關注數據,關注數據所反映的有關學生表現以及如何改進課堂教學的信息。
那么在實踐中人們如何應用數據驅動決策系統?下面以美國紐約教育局(New York City Department of Education,NYCDOE)為例進行具體介紹。
紐約市教育局是美國最大的教育系統,擁有超過100萬的學生和8萬名教師。長期以來,紐約市面臨著一系列阻礙學生成績提高的影響因素,例如學生總人數中有423694名是由公共資金援助支持的,153134名學生接受了特殊教育服務。其他影響因素還包括高度集中的貧窮、無家可歸、種族隔離和藥物成癮、教師和學校領導的高流動頻率以及文化斷裂、缺乏技術支持等。2001年,紐約市教育局在卡耐基公司的資助下與“成長網絡”(the Grow Network)公司簽訂了為3-8年級開發數據驅動決策工具的協議[14]。該協議涉及到的教師有3萬人,學區和學校的教學領導有5千人,以及1200所學校近40萬的學生。這展示了紐約市教育局為了提高學校系統多層面的教育決策質量,在將標準化評價數據與支持性的教學資源相鏈接方面作出了前所未有的努力。
“成長網絡”負責發布NYCDOE數據報告,即采用紙質和在線報告的形式向校長、教師和家長出示相關的標準化測試結果,并附有反應行動(Responsive Action)的具體建議。“成長網絡”以3-8年級的學生為主體,其目標是使用標準化評價數據,再加上支持性資源和專業發展,用以提高教學實踐的質量和學生的學習成績。“成長網絡”最后將提交四種不同的數據報告,這些報告反映的是針對不同目標群的不同觀點,如下表所示。

“成長網絡”數據報告的觀點
“成長網絡”為了給最終的報告準備數據,做了大量的數據清洗(Data Cleaning)和處理工作。該系統最終將學生的標準化測試數據組織在為教師、學校領導和家長定制的報告中。對于管理者,報告提供的是有關學校的概述,并展示了班級、教師層面的數據。對于教師,報告提供的是有關班級范圍重點(Class-Wide Priorities)的概述,同時將學生按照州立表現標準進行分組,支持教師對學生個體的強項和弱項的關注。對于家長,報告則解釋了測試目標,他們孩子的表現以及父母可在哪些方面幫助孩子提高成績。報告按照分數將數據進行匯總并排名,同時還根據紐約州的表現等級進行分組。表現等級從“遠低于標準”(1級)到“遠高于標準”(4級)分為四級。
在開學后不久,教育者還會收到一份關于當前學生的分類數據(Disaggregated Data)的紙質報告。由于這些學生的數據被測試區(Test Areas)分解了,教育者同時會獲得一個受密碼保護的在線帳戶,用以訪問完整的測試數據。教師可以利用在線信息系統查找并比較學生個體的數據。學生的分類是按照單項測試和技能項來排名并分組的。
除了測試報告之外,及“成長網絡”網站還具有兩項附加功能,即支持教師的分析和教學決策。首先,網站會提供有關州立標準的信息,及測試技能和概念的定義。管理者和教師經常引用這些資料作為所提供信息的一個重要組成部分。其次,所報告的數據鏈接了一些為教師、管理者提供的教學材料和資源。為了在課堂層面促進基于標準的學習,這些教學材料和資源提出了一些有關活動和教學策略的建議。報告還鏈接了經紐約市教育局批準的外部資源,目的在于幫助教師收集更多的課程材料并反思自己的課堂組織。盡管此數據決策系統大部分依靠來自其他資源的現有數據,但是系統的分析組成部分還是提供了按學科、技能項聚集的數據。此外,系統提出了課堂組織的不同模型,例如異構分組、同構分組等[15]。
總的來說,美國紐約教育局這一案例讓我們看到了技術和報告功能的進步為學校創造了在教育系統的多層面使用測試數據用于決策的新機遇。在調查中,大部分教師表明及時獲得顯示學生個體表現的數據,有助于做出因材施教的決策,或者是基于學生在朝向目標專項技能的具體表現進行分組。管理者也指出,“成長網絡”有助于他們確認班級層面、年級層面和學校層面的長處和弱項,然后在此基礎上做出有關學校計劃、教師專業發展活動等方面的決策[16]。
當今實施數據驅動決策系統面臨著一系列挑戰。這些利用數據驅動決策系統改進學校有待解決的難題也是未來研究的方向。
萬事開頭難。學區實施數據驅動決策系統,以支持學校改進所面臨的最大挑戰之一就是要明確從哪里開始。要克服啟動的困難,辦法之一是找到整個組織的“數據領軍人物”(Data Champions)。許多學區選擇了在一個特定學校、項目或學生小組中較小規模地試行數據驅動決策系統。通過展示數據驅動決策系統的成功,讓人們能夠建立信任,并培養“數據信徒”(Data Believers)。這些信徒應來自系統的各個層面,并表現出對數據驅動決策的熱情。他們的熱情會迅速蔓延,感染其他同事,營造勢頭,從而增加學區購買數據驅動決策系統的可能性。這可能需要一定的時間,但對于管理者和其他學區領導人在一起確保全員參與此過程而言是至關重要的。
成功啟動數據驅動決策系統還需要以團隊的方式,特別是教育局和督學之間的合作。學區的期望應是明確的、可衡量的、可達到的,同時還必須明確個人的作用。在實施數據驅動決策系統的早期階段,要求學區領導先指出可行之路。督學和學校董事會則必須發揮重要但不同的作用。督學一般扮演的角色是:首先是將學校董事會對學校的愿景轉化為基于數據的可測量的目標;然后與學區教師、職員、家長和其他團隊的利益相關者一起工作,在規定日期之前完成計劃目標;接著收集數據,并顯示清晰、穩定的進展;最后在慶祝成功的同時又指出不足,與學校董事會一起修改基于數據的改進計劃。學校董事會一般扮演的角色是:首先是建立一個基于數據的學校愿景,顯示到目前為止所實現的哪些進步是必要的;然后向管理者、其他員工以及利益相關者闡述如何評價學區的表現;接著通過綜述相關數據以評價學區朝向具體目標的進展;最后修正目標和基于數據的改進計劃。
對致力于支持所在學區的數據驅動決策系統的領導人而言,還需要克服來自數據質量和數據能力(Data Capacity)的挑戰。
對學區和學校而言,提出措施來保證數據質量是至關重要的。數據質量包括:(1)使用多種措施確保相關性,以及從多個數據集進行三角測量的能力;(2)確保數據是很好地組織在一起,并且以一種容易解釋的數據來顯示;(3)使用已經標準化和凈化的準確數據;(4)在數據“保質期”過期之前,讓數據對于利益相關者群體而言是有效的;(5)為了分析多個因素,對數據進行分解。沒有高質量的數據,利益相關者群體會失去對數據價值的信任,甚至會產生失望。最糟糕的是,教育工作者會使用質量差的數據,即舊的、沒有分解的,或是以混亂、錯誤的方法呈現的數據,然后得出有關學區、學校所需的錯誤結論。這可能會導致實際上會造成傷害的“數據驅動”行為的發生。
同樣,與數據質量緊密相連的數據能力也一樣重要。沒有訪問、理解和使用可利用的數據的能力,不管數據質量的高低,都不會導致有意義的數據使用。事實上沒有數據能力,一個組織擁有的數據越多,對數據的處理就越少。如果數據質量是燃料的話,那么數據能力是把燃料轉化為能源的“發動機”。數據能力包括:(1)組織性因素,諸如支持數據使用的團隊結構、合作規范、明確的角色和職責等;(2)從多個數據源整合數據的技術;(3)以容易解釋的形式,讓多個用戶獲取數據的數據訪問;(4)數據素養和評價素養技能,這樣數據用戶就知道如何分析多種類型的數據,并正確地解釋結果。
數據驅動決策對當今的決策管理模式提出了挑戰。在數據缺乏的時候,組織內核心管理人員的直覺和經驗在決策過程中發揮重要作用。從直覺和經驗驅動決策向數據驅動決策轉化的過程可能并不順暢,那些沒有足夠靈活性來適應大數據趨勢、創造數據驅動決策模式和文化的學區也可能會在競爭中失敗。信息化系統在大數據分析中可能會強調協作分析和過程公開,這就需要學區創造適宜的數據驅動文化,并把握好直覺和經驗驅動決策與數據驅動決策的關系。
數據驅動文化只有在數據質量和數據能力得以保證的情況下才能發展。當組織相信持續改進,并定期把信念付諸實踐,就會產生強大的數據驅動文化。具有強大數據驅動文化的學校和學區強調合作是獲取成功的基石,同時準許教師和管理者為其所負責的事做出決策。強大的數據驅動文化元素包括:所有利益相關者群體承諾更好地利用數據;清晰界定數據使用的愿景;對教學的效用以及數據在提高教學和學習方面的價值持有信心;通過學校和學區領導調整對數據使用建模;要求教師為教學變化的結果負責;所有層級形成合作文化;致力于教學和項目改進。
當評價學校和學區在何種程度上呈現了數據驅動文化時,需思考的一系列問題包括:是否所有關鍵的利益相關者承諾為了持續改進而使用數據?人們是否要對數據在學校和課堂層面的使用負責?工作人員之間的合作是否得到了高度重視?學校領導是否將數據驅動決策建模作為其角色和責任的一個重要方面?教師是否相信數據可以而且應該用來告知教學?教師對利用與學生學習有關的數據來改變教學是否持有開放的態度?[17]
最近幾年,人們對“大數據”的關注越來越多。利用以數據為基礎的決策來解決諸多領域問題成為大數據時代的顯著特征。對于學校管理者,通過數據驅動決策系統可以查看年級、全校乃至整個學區的學生的學習情況。如果發現低效的課堂和學習表現不佳的學生群體(根據性別、收入情況等劃分),管理者會依據學習分析結果決定是否給予特定的干預。對于更大范圍的異常表現,管理者會依據學習分析數據調整管理策略,以適應教師更好的教和學生更好的學。美國的實踐案例表明,數據驅動決策系統在幫助學區和學校領導利用數據制定一個用于持續改進的藍圖方面表現出其積極的作用。
面對大數據時代的到來,我們的教育工作者如何利用大數據來服務教育,如何把這些大數據信息轉化成知識,改革傳統教育教學,這將是一個很大的挑戰。我國教育大數據的現狀是數據流失比較嚴重。作為學校的信息管理部門,網站的信息數據,學生學籍信息數據,學生每次考試的數據……可以說是撲面而來,但問題是基本上用過就廢。雖然教師和學生的許多教育行為數據都可能構成大數據,但是目前我國學校較少采集這些數據,以及對數據進行建模和挖掘。目前學校比較關注的是考試數據,然而即使是考試數據,也沒有得到充分利用。在學校考試長期只用考試總分作為甄別學生標準的情況下,客觀上就不存在關注詳實考試數據的需求。當前學校對校內考試工作的處理,一般都較少收集詳實的考試數據,也較少對考試數據作統計分析。由于放棄了通過考試數據的統計關系去發掘考試和考生水平的相關信息,考試基本上也無法發揮對學生學業的診斷作用,教學就缺乏針對性。這種使考試對教學的反饋作用徘徊在低層次、低水平的狀態,構成了制約學校教育質量提高的重要因素。因此,如何從學生和教師的教育行為中隨時采集數據,如何借鑒國外經驗,最大化地利用數據提升學校教育質量成了當務之急。
[1] Ellen B.Mandinach, Edith S.Gummer, Robert D.Muller.The complexities of integrating data-driven decision making into professional preparation in schools of education: It’s harder than you think[EB/OL].http://educationnorthwest.org/webfm_send/1133,2014-02-12.
[2] Irving Wladawsky-Berger.Data-driven decision making: promises and limits[EB/OL].http://blogs.wsj.com/cio/2013/09/27/data-drivendecision-making-promises-and-limits/,2014-02-12.
[3] Marsh, J.A., Pane, J.F., Hamilton, L.S.Making sense of data-driven decision making in education[EB/OL].http://www.rand.org/content/dam/rand/pubs/occasional.../RAND_OP170.pdf,2014-02-12.
[4] University of New Mexico College of Education.Data-based decision making for student success[EB/OL].http://coe.unm.edu/uploads/docs/ipd/issue3.pdf,2014-02-12.
[5][10] Guadalupe H.Simpson.School leaders’use of data-driven decision-making for school improvement: A study of promising practices in two California charter schools[D].Los Angeles:the Falculty of the USC Rossier School of Edcucation Doctor dissertation,2011.
[6][7] John Messelt.Data-Driven Decision Making: A powerful tool for school improvement[R].Sagebrush Corporation, 2004.
[8] 何永.一種元數據驅動數據倉庫設計與應用[J].科技創新與應用,2014,(2):13-14.
[9] Jeffrey C.Wayman, Sam Stringfield, Mary Yakimowski.Software enabling school improvement through analysis of student data[EB/OL].http://www.csos.jhu.edu/systemics/datause.htm,2014-02-12.
[11] 朱秋蓉.專題:大數據給教育帶來了什么[J].廣東教育(綜合版),2013,(9):68-69.
[12] Jiawei Han, Micheline Kamber, Jian Pei.數據挖掘:概念與技術[M].北京:機械工業出版社,2012.
[13] Union Pacific Foundation.Using data for school improvement[EB/OL].http://www.principalspartnership.com/,2014-02-12.
[14] Light D, Wexler D, Heinze J.How practitioners interpret and link data to instruction: Research findings on New York City Schools’ implementation of the Grow Network[DB/OL].http://www.cct.edc.org/sites/cct.edc.org/files/publications/Grow_AERA04_fin.pdf, 2014-02-12.
[15] Breiter, A., Light, D.Data for school improvement: Factors for designing effective information systems to support decision-making in schools[J].Educational Technology& Society, 2006,9 (3) :206-217.
[16] Light, D., Honey, M., Heinze, J., Brunner, C., Wexlar, D., Mandinach,E., Fasca, C.Linking data and learning-the Grow Network study-Summary report[R].New York: EDC’s Center for Children and Technology,2005.
[17] David Ronka, Robb Geier, Malgorzata Marciniak.A practical framework for building a data-driven district or school[EB/OL].http://www.pcgeducation.com,2014-2-12.
王萍:博士,講師,研究方向為教育評價、語文課程與教學論(2007kecheng@163.com)。
傅澤祿:碩士,講師,研究方向為科學教育、教育評價(11318462@qq.com)。
2014年3月30日
責任編輯:馬小強
Data-Driven Decision Making System: A Powerful Tool for American School Improvement in Big Data Age
Wang Ping, Fu Zelu
(1.School of Liberal Arts, South China Normal University, Guangzhou Guangdong 510631;2.Guangdong Science Center, Guangzhou Guangdong 510006)
In the age of big data, How to use data effectively to form an insight into decision-making is a more concerned problem in the fi eld of educational research.With the development of technology and the increased demand for assessing student learning,American districts have been gradually accepted DDDM system, and make it as a powerful tool for school improvement.In order to make educators in our country comprehensively understand this new tool, this paper outlines the background of DDDM, the basic elements and steps involved in implementing a DDDM system, and takes NYCDOE as an example to analyze the practical use of a DDDM system and challeges that a DDDM system has faced.Research shows that a DDDM system can help district and school leaders develop a solid blueprint with data for continuous improvement.It will promote the research on elevating educational quality by using data if we understand the tool and re fl ect on the status of education in our country.
Big Data; Data-Driven Decision Making System; School Improvement
G434
A
1006—9860(2014)07—0105—08
* 本文系2011年教育部人文社會科學研究規劃基金項目“中學教師課程價值取向及對教學行為的影響研究”(項目編號:11YJA880051)和2012年“solo分類學在構建中小學生學業質量檢測體系中的應用”(項目編號:2012ZJK014)項目階段性成果。