毛燁,許建林
(江蘇農牧科技職業學院,江蘇泰州 225300)
隨著國家“新基建”的深入開展和教學信息化的不斷普及,不但推動了大數據、云計算、物聯網、人工智能等新技術的發展,也更新了傳統的教育教學觀念,正在逐漸改變一些教育教學行為。特別是2021年7月,教育部等部門專門發布了《教育部等六部門關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見》[1],要求“促進信息技術與教育教學的深度融合”“普及教育應用”“創新評價應用”“拓展研訓應用”“深化管理應用”等。2020年初,為應對新冠肺炎疫情,幾乎所有學校都開展“停課不停學”的在線教學。經過近2年的建設,各類網絡教學平臺已日漸完善,基本實現“從專用資源向大資源轉變”[2],師生信息素養不斷提高,相關課程也逐漸形成“線上與線下相結合”的教學模式,教師和學生的平臺使用情況產生了豐富的在線教學數據和在線資源使用記錄。然而如此海量的教學行為數據對學校決策、學生學習規劃和老師教學方案制定都有重大作用,基于大數據的在線教學數據分析也愈發重要[3]。
論文以《平面設計》課程為例,采用各種大數據技術,對該課程的在線教學數據進行分析,并對結果進行可視化展示,以指導學生和教師調整學習與教學行為。
基于大數據的數據分析與展示主要包括6個流程。技術流程圖如圖1所示:

圖1 基于大數據的數據分析與展示技術流程圖
(1)Hadoop平臺部署安裝。作為一個開源平臺,用戶可以在不了解Hadoop底層分布細節的情況下,開發分布式的程序,以充分利用廉價機器集群的運算速度和分布存儲的數據。
(2)數據采集。使用Python語言,輔以強大的軟件工具包,編寫爬蟲腳本,自動解析網頁,獲取數據。采集的離線數據,輸出保存到Hadoop的HDFS目錄中。
(3)數據清洗。使用MapReduce對HDFS中的數據進行預處理,將數據轉換成便于統計和分析的相對結構化的數據。
(4)數據分析。數據清洗后的仍在MapReduce中進行統計、分析,在HDFS中生成數據輸出目錄。
(5)數據可視化。用Python+echarts來進行數據可視化展示,并在HTML頁上呈現。
(6)綜合分析。結合數據分析和數據可視化結果,發現學生學習行為規律,及時讓老師調整教學策略,提醒學生學習重點和難點,提升教學的效率。
大數據平臺搭建于VMware Workstation Pro上,選用Cent OS7作為系統,安裝全分布Hadoop,其中一臺為管理節點,其他四臺為數據節點。依次安裝好JDK、Hadoop、Hive、Zookeeper、Hbase、Spark等軟件。通過FileZilla上傳至hadoop1目錄下的ope中。
安裝5臺Centos系統。安裝好后需修改主機名,設置靜態IP和hosts,創建普通用戶,配置好SSH。先安裝cent os7系統,將主機名改為hadoop1修改命令:vim/etc/sysconfig/network,然后保存:wq。然后使用命令:cd/etc/sysconfig/network-scripts/ifcfg-eth33修改IP地址:172.16.1.41。如圖2所示。

圖2 IP映射關系圖
配置Hadoop{“hadoop.env.sh,core-site.xml,hdfssite.xml,mapred-site.xml,yarn-site.xml,slaves”},共配置6個文件。
依次配置完上述6個文件后,將hadoop1復制到其他計算機,修改機器名為hadoop2,hadoop3,hadoop4,hadoop5,最后輸入命令hdfs namenode-format進行格式化一下,在虛擬機hadoop1中進入目錄/usr/local/src/hadoop-2.6.0/sbin/,輸入start-all.sh,啟動Hadoop集群。
其余各軟件的安裝步驟與hadoop相類似,不再重復,安裝路徑及部署位置如表1所示:

表1 各軟件安裝路徑及部署位置
基于大數據的在線課程教學數據分析流程如圖3所示。在線教學平臺的教學大數據經過預處理后,導入Hadoop平臺進行處理并建立HBase數據表。最后經過Mapreduce清洗后得到最終用于可視化展示的數據。

圖3 數據分析流程圖
為了對學生劃分等級和教學重點規劃,論文采集了江蘇某高職學校2019級的計算機網絡技術三個班的《平面設計》課程教學數據,一共獲得109名學生的數據,將獲取的數據導入組件Hadoop平臺,按表2和表3的字段命名規則在HBase建立數據表,以對這部分學生數據進行分析。

表2 學生樣本基本信息數據表

表3 學生登錄信息表

表4 當日人均登錄時長

表5 學生章節得分表
將預處理后的109名學生的在線學習平臺數據存儲到HBase中,使用大數據技術與數據查詢技術提取學習者特征信息和章節特征信息,對學生進行學習行為統計和分析,將上課的學生成績與教學任務相聯系,以便科學建立學習者行為習慣、學習績效及教學任務重難點之間的聯系[4]。
3.3.1 教學平臺活躍度
(1)學生每日登錄人數統計
通過MySQL查詢學生登錄信息表,來統計每天登錄教學平臺人數和平均每天登錄平臺的人數。

表6 每天登錄教學平臺人數

表7 平均每天登錄平臺人數
(2)可視化展示

圖4 每日(部分日期)登錄人數可視化展示
(3)數據分析
一個時間周期內,教學平臺登錄人數在3月4日達到了頂峰,間隔一周后在3月10日又達到了高峰。根據授課計劃,每周二和周三為上課的日期,學生會在上課前完成課前預習任務和課后任務。其余每個非周末的時間,也有將近半數的學生會登錄平臺,而登錄人數較低的日期為周末。
3.3.2 學習登錄次數與時長統計
(1)學習登錄次數、時長統計
通過建立0-24時全時段數據表來保存學生每次登錄平臺和離開平臺時間,并通過關聯查詢來統計每個登錄號十天內的累計學習時長。

表8 連續10天學生累計學習時長前10名登錄次數及時長

?
(2)可視化展示

圖5 連續10天學生累計學習時長(前10名)可視化展示

圖6 連續10天學生累計學習時長(前10名)登錄次數可視化展示

圖7 學習時長前10名學生成績圖
(3)數據分析
結合學生登錄的次數,由可視化結果可以看出,10天內累積學習時長排名前10的同學,每天都會登錄學習平臺,并且每天在線時長約1小時,其學習成績也均達到優良。
3.3.3學生學習成績等級劃分
(1)學生學習成績等級劃分
統計平臺中90-100、80-89、70-79、60-69、0-59數據區間的人數。

表9 各分數段人數統計長
(2)可視化展示

圖8 各分數段人數可視化展示
(3)數據分析
此部分統計的是學期末學生的總評學習成績,圖表中明顯看出學生成績基本呈正態分布,除了2名學生不及格外,其他學生均完成課程學習,到達合格要求,70%以上的學生期末成績能達到良好及以上。
3.3.4 教學任務分析
(1)教學任務平均得分
預設9個教學任務的權重,統計所有學生在每個教學任務的平均得分,得到每個教學任務的直觀教學成果。

表10 9個教學任務的平均得分
(2)可視化展示

圖9 9個教學任務的平均得分可視化展示
(3)數據分析
此部分展示的是《平面設計》課程9個教學任務的學生平均得分,此中可以看出學生在AI基本編輯工具和圖形編輯工具的使用上有所欠缺,特別是路徑工具的掌握。
根據以上統計和可視化展示的結果,結合日常教學實際,可總結出以下規律和建議:
(1)筆者所在學校,平均每天登錄人數接近總人數的70%,尤其是在有課的當天,學生登錄頻次較高,學生在教師的引導下能利用平臺開展學習。
新冠疫情爆發到現在,學生已經習慣開展線上與線下相結合的教學,線上教學在培養學生自主學習方面是有一定成效的。但教師也要強化以網絡資源的建設,爭取以內容吸引和留住學生,提供與課程內容配套的價值、質量、趣味性等均有較高質量的資源[5]。
(2)學習成績優良的學生,平均每日都能登錄平臺開展自主學習,學習成績優良。說明花費在學習上的時間長度與學習成績是成正比的。
教師應督促學生多利用教學平臺開展學習,以提升學習主動性和教學效果。對于學習主動性較強的學生,教師要鼓勵這部分學生堅持并持續自主學習[6]。而學習主動性較弱的學生,則要幫助他們樹立正確的學習態度,加大學習監管,引導其主動轉變學習觀念。
(3)每個教學任務的平均得分可以直觀地看出學生哪些知識點有欠缺,也可以及時修正教師主觀主義上認定的重難點、“優差生”及目標達成與否。
大數據分析的結果可以為教師科學地掌握重難點提供依據,修正主觀主義的偏差,以及時調整教學策略和補充資源。針對不同學生群體,提供不同的指導與幫助,“因材施教”,最終提升教學質量和人才培養質量[7]。