張維,李姣姣,舒江波,張昭理(華中師范大學國家數字化學習工程技術研究中心,湖北武漢430079)
創新探索
云課堂教育大數據交互式可視化研究*
張維,李姣姣,舒江波,張昭理
(華中師范大學國家數字化學習工程技術研究中心,湖北武漢430079)
近幾年來,教育大數據的概念逐漸出現在人們的視線中,如何讓生成的大量數據變得更加易于理解并反饋于教學,已成為教育工作者面臨的重大問題。針對該問題,將海量的、復雜的、實時的數據轉換為動態的圖像的可視化方法無疑是最有效的途徑。以云課堂中生成的數據為數據來源,實現了華中師范大學云課堂歷史數據的可視化,并對可視化結果進行分析,反饋給教學管理者以及教師,指導教師教學和學生學習。
教育大數據;云課堂;數據可視化;教育云
從云計算的概念出現以來,云在教育領域的發展便受到各國政府的高度重視。美國、法國、韓國等都將教育云作為云計算的核心應用領域,先后啟動了教育云建設計劃[1]。目前,國外比較成熟的K12云平臺有可汗學院、谷歌Classroom、Office365,這些平臺利用網絡傳輸的便捷性可以幫助學習者隨時隨地進行學習[2,3]。然而在國外享受無基礎設施的教育信息化便利的同時,中國的大部分地區還面臨著教育基礎設施不均衡的問題[4,5]。為了推進云計算在我國的應用,教育部于2012年3月發布了《教育信息化十年發展規劃(2011-2022年)》,明確提出采用云計算服務模式,形成資源配置與服務的集約化、效益化、優質化發展途徑,構建穩定可靠、低成本的國家教育云服務平臺[6,7]。
大數據時代,我們不能照搬國外的技術和平臺。我們應該占領教育的高地,這是國家戰略的需要,而且教育承載著國家的安全,必須要有自己的平臺[8]。為此我們在借鑒資源服務已有框架體系、平臺和模式的基礎上開發了具有中國特色的平臺,即云課堂平臺[9]。近幾年來,伴隨著學校對云課堂的使用,快速增長的數據給教學管理者帶來了巨大的壓力。如何從海量、復雜、實時的數據中快速獲取精準的信息,并發現其中的規律從而提出更好的管理方案,是當前教育管理者面臨的難題[10-15]。由此可見,對教育大數據可視化的研究是十分有必要的。但是有關教育大數據可視化的相關信息是少之又少,在中國知網中的檢索條件選擇“主題”,檢索,輸入“大數據”并含“可視化”,共檢索出576條結果,其中大部分是關于生物、地理、醫學和新聞等領域,與教育領域相關的文獻雖然有,但是很少有與教育大數據切實相關的,可見大數據可視化在教育領域的應用正處于起步階段。

圖1 云課堂PC端界面
在線課堂平臺是為支撐學生開展在線學習活動的軟件系統,一直以來都是教育行業的核心業務系統。云課堂是在教育云和教育大數據背景下,利用云理念和云技術打造的一種在線開放課堂。為了緊隨教育時代的潮流,華中師范大學研制了屬于本校的云課堂平臺,開發了PC端、Web端和移動手機端三個版本 (如圖1、圖2和圖3所示)。此外,結合學校開展學歷教育慕課教學的需求,為其定制了專門的云課堂版本,即華大云課堂,在華中師大面向全校本科生、研究生開展云課堂的應用實踐[1]。

圖2 云課堂Web端界面

圖3 云課堂移動端界面
截止到目前為止,華大云課堂上已開設了4199門課程,共10311節課,用戶數(包括教師、助教和學生)已超過3萬人,上傳的資源更是達到了452662個,總容量有3.9855T。這就意味著云課堂每時每刻都會產生海量的、復雜的數據。那么如何呈現這些錯亂復雜的數據,讓用戶對這些數據有一個直觀清晰的認識,而不僅僅只是表格那么簡單,是云課堂的管理者、教育工作者目前面臨的重大難題。
國內關于教育大數據的定義最早是從產生教育大數據的主體出發的,將教育大數據區分為廣義的和狹義的兩種,廣義的教育大數據泛指來源于日常教育活動中人類的行為數據;狹義的教育大數據指的是學習者的行為數據[7]。根據對云課堂的數據的分析,將云課堂的大數據界定為:學生以及課堂的基本信息;學生在課堂中的學習行為,包括學生的學習時長、學生的發帖/回帖數、作業評分、期末總分。
隨著云課堂使用人數的增多,每天都會產生大量的數據,可是卻沒有對這些數據進行系統的分析,不能發揮這些數據應有的作用。如何將這些數據反饋于教學工作者幫助他們進行有效的教學,如何利用目前已有的數據并快速對其進行分析預測,是目前云課堂平臺中迫切需要解決的問題,所以對云課堂的數據進行可視化是十分有必要的。根據校領導及管理員的需求,從管理層和用戶的角度出發,提出了一套可行性方案,通過實現界面端的數據可視化的直觀圖例,對云課堂的使用情況進行觀察及對學生的學習行為進行分析,并給教學管理者和教學工作者提出一些可行性的建議,為提高學生的學習效率提供真實可靠的依據。
1.教育大數據組織
在云課堂中,數據的來源主要有四個,如圖4所示。一是Sakai數據庫,主要存儲用戶、課程等的基本信息;二是MongoDB數據庫,主要記錄學生在課堂中的學習時長;三是用來記錄教師與學生的發帖/回帖數;四是記錄用戶的角色、功能模塊等信息。

圖4 數據來源圖
2.可視化層結構設計
可視化框架結構如圖5所示。該結構主要分為四層,分別是數據源層、數據存儲層、數據分析層和數據可視化層。
數據源層:包括云課堂中已有的數據資源,包括云課堂中教師、學生的總人數,總的課程數,學生的學習行為記錄等數據資源。
數據存儲層:不同來源的數據格式也有所不同,需要對它們進行統一的格式規定。在本案例中,把不同來源的數據通過不同的服務存儲到Mysql數據庫中,方便可視化時統一調用。
數據處理層:因為數據存在很多的維度,需在eclipse中對數據進行分析并找出需要呈現的維度從數據存儲層挖掘出數據,并傳到數據可視化層。

圖5 可視化框架結構圖
數據可視化層:這是最頂端的一層,通過一些可視化工具將分析好的數據以圖形的方式展現出來,并呈現給用戶。
3.可視化結果與數據分析
目前云課堂已在學校中得到廣泛的應用,大部分教師授課都是通過線上課堂與線下課堂兩種方式來進行的,但是云課堂只提供了數據的存儲、檢索和其他一些基本統計功能,而且大部分的統計數據都是以表格的形式來呈現的,缺乏數據可視化的功能,導致數據處理的結果不直觀清晰。針對這個缺陷提出了數據可視化的方案,把大量的、復雜的數據以恰當的圖像圖表的形式展現出來,能夠給用戶帶來很好的體驗。

圖6 課堂建設情況圖
以云課堂的課堂建設為例,針對2013年到2015年每個學期開課的數量,在沒有可視化之前,這些數據是以表格的形式展現的。有可視化之后,根據每年每個季度開課的數量、每年開課的平均數、每個季度開課的總數等維度,以柱狀圖、折線圖和餅狀圖的混合圖來展示,如圖6所示。由餅狀圖可以明顯看出,春秋季度的開課數高于夏季的開課數,因為夏季的課程在暑期開設,很少有課程在暑期開設;由柱狀圖可以看出,每年開課的數量都有所增長,另外每個季度的開課數量每年也都會增長;由折線圖可以看出,每個季度的平均課堂數正在以線性方式增長。由此可以得出云課堂的使用越來越普及,規模也越來越大。

圖7 論壇討論情況圖
再以云課堂中學生論壇討論為例,可視化效果如圖7所示。圖7以學生的發帖回帖人數和帖子數分別作圖,以文理分科為維度明顯可以看出,不論是發帖/回帖人數還是發帖數和回帖數,文科生都要高出理科生很多,可見文科生比理科生更活躍、更善于文字的表達。
伴隨著大數據時代的到來,數據帶來的價值日益受到各行各業的重視。在教育領域,通過對數據的獲取和分析,可以幫助教育工作者做出科學的決策,并為學生制定出更好的發展策略和目標,幫助學生梳理信息,實現個人價值。通過對云課堂中數據的處理與可視化,可以從可視化結果中發現一些在表格中發現不了的結論,利用這些結論可以反作用于教學,從而更好的提高教學質量。但是值得注意的是,數據可視化并不是呈現數據的萬能工具,不能盲目的對數據進行可視化,不當的可視化是無法正確的呈現數據的。總而言之,數據可視化是解決大量的、復雜的數據的有效途徑,但不是唯一的途徑。
[1]孫建文,張昭理,劉三女牙,舒江波.基于開源技術的云課堂平臺構建[J].中國教育信息化,2014(19):20-23.
[2]González-Martínez J A,Bote-Lorenzo M L,Gómez-Sánchez E,Cano-Parra R.Cloud computing and education:A state-of-the-art survey[J].Computers&Education,2015(80):132-151.
[3]Keller L A,Colvin K F.The Rise of Data in Education Systems:Collection,Visualization,and Use[J].Comparative Education Review,2014(58):549-551.
[4]張洪孟,胡凡剛.教育虛擬社區:教育大數據的必然回歸[J].開放教育研究,2015(1):44-52.
[5]趙斌.數據可視化在上海圖書館數據展示服務中的應用[J].圖書館雜志,2015(2):23-29.
[6]舒江波,張昭理,孫建文,楊森,李勇.面向個性化教學的云資源服務框架[J].中國教育信息化,2014(19):16-20.
[7]徐鵬,王以寧,劉艷華,張海.大數據視角分析學習變革[J].遠程教育雜志,2013(6):11-17.
[8]劉圣晨.基于.Net平臺的數據可視化軟件的設計與實現[D].廈門:廈門大學,2013.
[9]Maltese AV,Svetina D,Harsh JA.Data Visualization Literacy:Investigating Data Interpretation Along the Novice-Expert Continuum.Journal of College Science Teaching.2015(45):84-90.
[10]H.Liu,Z.Zhang,S.Liu,J.Shu,T.Liu,and T. Zhang.Blind spectrum reconstruction algorithm with L0-sparse representation[J].Measurement Science and Technology,2015(26):502-509.
[11]郭君芳.教育信息數據的可視化研究[D].上海:上海師范大學:2010.
[12]陳明.大數據可視化分析[J].計算機教育,2015(5):94-97.
[13]H.Liu,Z.Zhang,S.Liu,T.Liu,L.Yan,and T. Zhang.Richardson-Lucy blind deconvolution of spectroscopic data with wavelet regularization[J].Applied Optics,2015(54):1770-1775.
[14]Forbes S,Chapman J,Harraway J,Stirling D,Wild C.Use of Data Visualisation In the Teaching of Statistics:A New Zealand Perspective[J].Statistics Education Research Journal,2014(13):187-201.
[15]H.Liu,L.Yan,Y.Chang,H.Fang,and T. Zhang.Spectral deconvolution and feature extraction with robustadaptiveTikhonovregularization[J].IEEE Transactions on Instrumentation and Measurement,2013(62):315-327.
(編輯:魯利瑞)
TP393
A
1673-8454(2016)12-0001-04
*本文系以下項目的研究成果:華中師范大學中央高校基本科研業務費項目 “基于storm構建數據分析云服務的關鍵技術研究”(編號:CCNU15A05059),國家科技支撐計劃課題 “中小學師資培訓公共服務體系關鍵技術及標準規范研究”(課題編號:2014BAH22F01),“教育云服務關鍵技術攻關”(課題編號:2013BAH72B01),“地方志可視化技術研究與演示平臺實現”(課題編號:2015BAK07B03),國家自然科學基金項目(項目編號:61505064)。