林志春



摘要:隨著互聯網的廣泛應用和物聯網的成熟普及,教育信息化程度不斷提升,教育教學過程中大量的過程數據被記錄和存儲,形成教育大數據。教師要在傳統的教育教學經驗上,學會挖掘教育大數據,開展基于教育實證和數據分析的教學研究工作,對明確的教育對象建立精準的任務目標,制定精準的方法措施,推進管理精準化和決策科學化。
關鍵詞:數據處理;數據統計;互聯網
2019年2月,國務院頒發的《加快推進教育現代化實施方案(2018-2022年)》中提到,推進教育現代化要創新信息時代教育治理新模式,開展大數據支撐下的教育治理能力優化行動,推動以互聯網等信息化手段服務教育教學全過程。
按DIKW體系理論,數據是未被加工解釋的原始素材,而信息是對數據的解釋,是被處理后、具有邏輯關系的數據,只有對數據進行過濾、提煉及加工,才會產生有價值的信息。因此,建立數據思維、掌握必要的數據處理技術,是每位教育從業者的必備技能。筆者借助深圳市教育局組織的“中小學青年教師教學能力大賽”的活動數據,通過EXCEL的數據透視表(Pivot Table)工具進行數據統計和分析,探討基于教育數據改進教研活動的數據處理思路和方法。
一、數據收集和數據清理
由于本次處理的數據來源是上級部門網站發布的Word文檔文件,不利于數據統計和分析,所以數據收集工作主要是數據格式的轉換,即將Word文件中的獲獎名單內容復制到Excel文件的工作表中。
數據清理是對原始數據進行處理,解決數據的完整性、唯一性、可靠性、合法性和一致性,以供后續的數據統計和數據挖掘使用。在本例中,由于獲獎名單表格中有合并單元格,導致在轉換為EXCEL格式過程中,部分數據不完整,因此需要將其合并的單元格拆分還原,并將信息補充完整,即補充每條獲獎信息的所在學段(“學段”列)、所屬學科(學科列),以及所屬區域(“區/直屬”列)等信息。
數據清理還有一項重點工作,就是保證數據的一致性。在本例中,教師所屬學校的單位名稱必須保持一致。例如,要將獲獎信息中“福田區荔園小學”和“深圳市福田區荔園小學”的學校名稱統一為相同的名稱。這樣才能確保學校教師獲獎情況統計的準確性。
二、明確需求和數據統計
數據清理完成后,我們就可以開始數據統計操作。數據透視表是Excel統計數據最簡單好用的功能,插入數據透視表后,只需要簡單地將數據的字段拖拽到指定的行、列區,就能夠實現數據的自動排序、篩選和分類匯總,生成豐富的數據分類統計表。下面,以OFFICE2010為例,介紹Excel數據透視表的常用操作方法。
(一)統計各區獲獎人數的方法
通常情況下,為了解各區教師的獲獎人數情況,需要按獲獎等級分類,分別統計出各區獲得一、二、三等獎的教師人數。在數據透視表中,只需要簡單的幾個步驟就可以實現。
1.將鼠標定位在整理后的表中,選擇“插入”,選擇“數據透視表”,在彈出的“創建數據透視表”對話框中,按照默認的選項,直接單擊“確定”;
2.在“數據透視表字段”窗口中,將“區屬”字段拖放到“行”區,將“獎次”拖放到“列”區,將“姓名”拖放到“∑值”區,默認統計為計算個數,則可以得到所需的統計表,見圖3。
(二)統計各區各學段獲獎人數的方法
要進一步了解各區各學段的獲獎情況,可以生成“各區各學段獲獎人數統計表”,操作方法與前面相似,僅在步驟2中。增加一個拖拽操作,將“學段”拖放到“列”區,見圖4。
(三)統計各區各學科獲獎人數的方法
為了解各區各學科的教研水平,需要統計各區各學科每個獎項的獲獎情況。在數據透視表中的操作,步驟1與前面相同,后面操作為:
1.將區屬、學科和教師分別拖到“列”“行”和“∑值”區,生成“各區各學科獲獎人數統計表”。由于字段放在“行”區和“列”區的效果一樣,通常將字段中不同的數值比較多的字段放在行區,在本例子中,學科字段的不同數值比較多,所以放在“行”區。
2.為方便觀察和比較各區各學科一等獎的獲獎情況,所以將“獎次”字段拖到“篩選”區,生成可按獲獎等級篩選的“各區各學科獲獎人數統計表”。此時,可以通過單擊選擇表格左上角的“獎次”篩選,分別統計各區各學科的一、二和三等獎人數。
另外,為方便觀察生成表格的數據,可以設置數值條件,顯示不同顏色。例如,選擇“數據透視表”,然后在菜單欄中的“條件格式”中設置“大于l”,并將滿足條件的單元格填充為紅色,見圖5,其中紅色單元格表示對應區和學科的一等獎人數超過1人。
(四)統計全市各個學校的獲獎人數的方法
可以用類似的方法,見圖6,將“學校”字段拖到“行”區,將“獎次”字段拖到“列”區,將“姓名”拖到“∑值”進行“計數”,生成“各學校的獲獎情況表”。
三、數據分析及實踐應用
借助Excel數據透視表,通過簡單操作,就可以快速生成各種分類統計表,呈現出豐富的、有價值的信息。例如,根據各區各學科獲獎人數統計表(圖5),各區的學科獲獎情況一目了然,結合平時調研了解的情況,可以推選出具有學科優勢的區域,開展學科區域教研經驗的總結推廣活動。另外,在選送優秀選手參加高級別比賽時,區級教研團隊的強弱也是重要的參考依據。再例如,借助各學校獲獎人數統計表(圖6),再結合實地調研,對獲獎人數較多的學校,總結梳理其在教師引進、教師培養、科組建設和教學研究等方面的優秀經驗和做法,實現整體提質增效。
通過本文的數據分析應用案例,我們明確了基于數據驅動教研改進的思路,即隨時隨地采集和記錄日常教育行為相關的過程數據,再根據具體教研需求,對已采集的數據進行篩選、分類和統計,得出基本情況,然后結合實地調研,針對性地了解情況,檢驗數據分析的結果,再將結果應用到實際工作中,實現利用數據分析挖掘,提高教研效率和質量。
不過,由于案例中原始數據包含的信息較少,缺乏其他重要的信息,例如獲獎教師的教齡、性別、畢業院校等,無法開展更為深入的數據挖掘分析。但是,隨著物聯網技術的普及和教育大數據平臺應用的深入,教育教學過程中將會積累更多數量、更多類型的原始數據,形成真正的教育大數據。期待更多的教育工作者掌握基于大數據的數據挖掘思維和技術,擁有開啟教育大數據寶藏的金鑰匙。