南京市寧海中學(高中部) 翟家祺
著名的教育家孔子曾經說過對于學生最重要的是“因材施教”,但是教育方式大多都是分班制,每個班級的人數也在四五十個,每個班級的老師精力有限,不可能有時間去鉆研每個學生的特點從而找到適合的學習方法。另外即使有充足的時間找到學生適合的學習教學方法也會夾雜著老師的主觀印象。總之來說,我們崇尚“因材施教”,但是現實是很難做到。
傳統教育方式針對性差:在學科針對性上,并非每一門學科的學習方法都是一樣的,文科注重積累,理科注重思路,細細分下去,各科都有各科獨特的特點。所以不同的學科的授課方式要根據學生的特點來設計效果更佳。但是現在的老師大多都是根據以往教學的經驗上設計課程,這就造成了教學方式和資料落后。在教學方案針對性,傳統教育中,老師準備的教學資料大多是針對大多數學生來設計的,這就會對平均水平以上和平均水平以下的學生不利,一些尖子生會重復已有的知識技能,而很難有效的提升。而對于一些差生會因為跟不上老師同學的節奏而更加落后普。再加上每一個學生的學習能力不同,學習習慣迥異,性格愛好五花八門,再加上出生環境的不同,父母學歷這些因素都會影響學生的成績。
學生、老師與家長了解的信息不對等:學生大多的時間實在學校里度過的,本來和家長相處的時間就少,再加上學生學業繁重,有些家長也比較忙,學生和家長之間的溝通就越來越少。大多數家長了解自己孩子學習的情況大多數是通過家長會,然而家長會提供的資料只是一個方面,作為孩子的第一個老師的父母不能像老師那樣了解學生詳細的情況。
這是一個信息爆炸的時代,隨著信息的爆發式增長,海量數據由此而生,人們通常將這種大規模的數據集稱為大數據[1]。在網絡與信息技術發展迅速的今天,大數據也可以認為是這個時代緊密聯系的,大數據將改變我們的一些生活方式。如果能用好大數據,首先應該了解大數據,那么大數據有哪些特點呢[1]:
(1)Volume(大體量):數據量大,教育資源的數據量包括眾多學生,老師,班級等產生的數據至少是P開始的,1p通常等于1000個T,另外需要計算和存儲的量也很大。
(2)Variety(多樣性):種類和來源多樣化。可以是結構化、半結構化,也可以是非結構化數據,具體表現為音頻、網絡日志、圖片、視頻、地理位置信息等等,對于教育數據可以是視頻,成績,音頻等等。
(3)Value(大價值):大數據有數據量大的特點,數據價值密度相對較低,但是在現在機器學習的時代,能夠從大量的數據中找到有價值的數據,然后做相應的分析可以獲得較大的價值。
(4)Velocity(時效性):現在大多數的設備都是聯網進行的,通常學生,老師的數據能實時的記錄下來。
(5)Veracity(準確性):通常收集到的數據是準確的。我們可以利用大數據的這些特點來改進當今的教育方式。
利用大數據的這五個重要的特性,在教育領域我們可以推進教育方面的進步,主要表現兩個方面。
(1)有目的的分析教育數據:產生的教育數據可以用來作為機器學習和數據挖掘的數據集。其中數據挖掘不同于早期web日志的挖掘,數據挖掘是在計算機相關技術支持下,由學生行為更全面準確地收集到的一種新的教育模式。教育工作者在數據挖掘的教育過程中可以找到這些數據的模式和規律,以便建立模型并預測學生如何學習。
(2)完善老師教學的模型:收集學生的數據,我們可以從中提取分析有用的數據。然后對學生的學習方式以及班級的特點進行數據畫像。任課的老師針對產生的分析設計教學方式和計劃[2]。
數據采集:數據采集是大數據教育平臺的核心內容之一,學生在學習中產生的數據,老師教學的數據,高考和平時練習題目產生的一些數據都可以數據的共享傳輸。數據采集是數據存儲和計算平臺的前提。對于數據采集我們選擇數據采集源,設置采集的時間,周期等參數。我們采集的數據在經過相應的處理之后存到原始數據倉庫,作為教育平臺的基礎。
數據存儲:數據存儲是大數據教育平臺的重要內容之一。用來存儲的數據庫可以由關系型數據庫Mysql、Oracle、sqlserver,也可以是非關系型數據庫,比如說Redis,Hbase等。我們要求采集的數據應該按照一定規則存在數據庫里。

圖1 基于大數據的教育平臺
數據備份:因為數據存儲有不安全的因素,單一的存儲的數據容易在服務器斷電、毀壞等問題容易丟失,所以我們要做相應的數據備份,數據備份一般會備用3-5份,以備不時之需。
計算平臺:計算平臺是大數據教育平臺的核心內容之一,像大腦的作用。計算平臺主要是用來分析數據,這里可以是像Hadoop大數據處理平臺,在計算中會采用數據挖掘中相關的算法、模型。教育大數據中心將有效整合數據挖掘和分析方法,常用的數據挖掘領域,如相關分析、聚類分析、分類分析、異常分析、特定群體分析和進化分析等,和現有的挖掘算法是比較成熟的開放源代碼工具集成到教育數據中心平臺,在一方面,為方便各業務系統數據的數據挖掘程序,另一方面可以更加有針對性的分析,在此基礎上構建了多種模式,如課程學習成功的預測模型,區域教育均衡發展趨勢預測模型,學生學習障礙的診斷模型,教學行為模式模型等。
權限管理:角色與權限管理是整個系統安全運行的基礎,不同的用戶只有被分配不同的角色后才會根據自己的權限來享受相應的服務。有了權限管理才能保證大家各司其職,數據等的安全。角色與權限管理的具體功能包括:角色管理、添加角色、刪除角色、修改角色、用戶角色分配、角色權限關聯、群組管理等。
安全管理:安全管理負責大數據教育平臺的安全保密,是這個系統重要的一部分。教育大數據中心對數據的備份策略、恢復機制、加密策略、數據清理等都有很高的要求。首先要數據庫的備份,可以是鏡像和快照,在遇到問題的時候可以通過快照和鏡像來恢復數據。為了保證數據不被危險的人員查看我們對數據做一個加密,可以MD5,RSA等方式。定期查看數據,對不需要數據做一定清理。還要會查看操作日志,在出現問題的時候通過日志來定位。
可視化分析和重現:可視化分析和重現是對于需要了解數據分析結果人員而言的,通過計算平臺使用不同數據挖掘的模型產生相應的結果,然后對數據結果做一些處理,以文字,圖標(折線圖,柱狀圖,餅形圖)等形式顯示給用戶查看[3]。
數據本身不產生價值,如何分析和利用大數據對教育產生幫助才是關鍵。教育大數據技術對于教師來說,其能夠改善現有的學校考核方式,用來評估課程和機構,并提供更多的教學分析數據,方便教師在分析數據的基礎上,為學生提供更多、更有針對性的教學干預;對于學生來說,基于學習行為的大數據分析,讓學生以學習者的角度了解學習過程發生的機制,以此來優化學習,并展開自我導向學習和適應性學習。對于家長來說,有利于全程跟蹤學生的學習過程和學習動態,為學習方法和路經的選擇多些參考與指導。
(1)學科教學針對性。大數據可以根據每一科目的特點及每個學生的掌握程度“私人訂制”每個學生每天的學習任務。比如,通過對學生己經擁有的知識、學習動機、學習認知和學習態度等方面的數據分析和處理、預測學生的學業表現,并向其推薦他們可能取得優秀學業表現的課程。系統先獲取某個學生以前(高中或大學)的學業表現,然后從已畢業學生的成績庫中找到與之成績表現相似的學生,分析以前的成績和待選課程表現之間的相關性、結合某專業的要求和學生能夠完成的課程進行分析、利用這些信息預測學生未來在課程中可能取得的成績,最后綜合考量并預測的學生成績。再例如,根據遺忘曲線幫助學生復習英語單詞,或是根據學生在平時的作業或是考試中所犯的錯誤,有針對性地重點復習幫助學生有效提升學習效果。
(2)教學方案針對性。大數據可以根據全班同學的掌握情況做出具體分析,制定適合絕大部分同學都能接受的教學內容及教學難度。從而提高教師講課的效率,達到學生事半功倍的目的。通過大數據的云計算平臺,我們可以準確的找到符合學生的教學方式。比如說我們可以通過學生在學習平臺上產生的數據,判斷學生適合學習文科還是理科,該學生適合以學生為主導的課堂還是以老師為主導的課堂。
(3)學生學習針對性。根據每一個學生的作業及考試情況判定其對知識點的掌握情況,然后根據其掌握情況找出相應的試題,讓學生正真的掌握他們原先不會的或是有疑問的知識點,從而達到學生學習成績穩定提升的目的。比如說我們可以計算學生失分的主要是知識點不會,計算失誤,還是其它原因,也可以得出每個學生掌握知識點并且能熟練運用需要付出多長時間的練習等[4]。