魏夢楠 馬燕

摘要:本文從大數據的概念及教育大數據分析的用途入手,結合大數據分析的過程,以“騰訊課堂”為具體案例,分析了騰訊課堂用戶的基本屬性,并根據分析結果對騰訊課堂及在線教育平臺未來的發展提出了一些參考建議,以便其更好地適應大數據時代的發展。
關鍵詞:教育大數據;大數據分析;在線教育;騰訊課堂
中圖分類號:G434 文獻標識碼:A 論文編號:1674-2117(2018)19-0103-03
引言
大數據指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。通俗來講,就是人們可以通過獲取海量的數據,對這些數據進行分析,從而獲取到高于數據價值本身的價值。而教育大數據就是在整個教育教學過程中所產生的以及根據教育需要采集到的,一切用于教育發展并可創造巨大潛在價值的數據集合。
在線教育中大數據分析過程及作用
在線教育中,要進行大數據的分析,首先要收集數據,對數據進行歸納和整理,選擇可用的數據,通過數據清洗,對現有的數據進行可統一的規范,形成標準化的數據集。通過這些統一的規范將數據的結果輸出,并將輸入后的剩余參數保留,然后運用圖標、數據等方式將數據分析結果展示出來,最后將大數據的分析與傳統結果分析做比較,判斷大數據的分析應用。概括來講就是六個階段,即數據采集、數據預處理、數據輸入、形成數據倉庫、數據輸出以及數據的價值評價,其過程如右圖所示。
通過對教育大數據的分析,在國家層面,可以制定出科學化的教育政策,在區域層面,有利于教育均衡的發展,在學校層面,可以提升教育的質量,使課程體系與教育效果達到最優化,在個人方面,有利于其個性化發展。通過對教育大數據的收集、歸納、整理,以及對繁雜的教育數據的分析,能發現其相關關系,診斷現存問題,預測發展趨勢。對于學習者而言,可以更加清楚地了解自己的學習行為、學習方式、對學習內容的偏好、學習的掌握程度,從而制訂出更適應自身學習的個性化的學習規劃,實現個性化學習,并對未來發展做出一定的診斷,提升教育質量。對于教師而言,通過教育大數據分析,可以發現最優的教師,教師也可以制訂個性化學習方案,規劃更優的教學路徑,設計更適合學習者的學習互動與創設場景,優化教育資源配置,使教育決策更具有科學性。
以“騰訊課堂”為例的大數據分析
騰訊課堂是騰訊推出的專業在線教育平臺。該平臺聚合了大量優質教育機構和名師,包括等級考試、專業培訓、中小學教育等眾多在線學習精品課程,打造教師在線教學、學生及時互動學習的課堂。與其他在線教育平臺相比,騰訊課堂最大的優點就是可以實現與騰訊QQ、QQ群的深度整合,學習者在課程報名成功之后,可以直接通過QQ客戶端進入課堂,實現在線即時互動教與學,并且通過QQ群天然的群聚效應,實現學生與教師、學生與學生之間的相互交流,也可以添加教師,實現一對一的教學指導。
1.基于騰訊課堂的大數據分析過程
本文以2018年艾瑞咨詢發布的騰訊課堂用戶大數據報告為數據來源,數據以2017年騰訊課堂的整體用戶為研究對象,數據來源包括PC端和移動用戶,通過這些數據對騰訊課堂用戶的基本屬性進行分析。獲取數據后,首先需要對它進行數據清洗、抽樣、維規約、選擇記錄特征、離散化二元化、變量化的處理,形成規范化的數據。根據需要,從地域、年齡段、性別、學歷四個方面對用戶基本屬性進行分析,每個不同的方面又分為五個維度,即用戶所占比重、人均年累計學習時長、人均年累計付費意愿、人均年累計付費金額、學習偏好,根據前面的數據庫和相關主題信息,可以形成數據倉庫。
2.數據分析
在地域上,受到經濟發展的限制,沿海及經濟發展較快的城市更關注在線學習,愿意花費時間、金錢在在線教育上,相比較而言,西部和經濟條件落后的城市對在線教育的關注較少,花費在在線學習的時間少,學習意愿也不高。由于北京、上海、廣東、浙江等互聯網發達省市對IT互聯網人才的需求較高,這些地域學習該領域課程的用戶遠高于其他地區,且不管是哪個年齡層次,對互聯網類課程的關注都比較高。
從年齡上來看,85后用戶占比為86%,其中以90后和95后為主要用戶,兩者加起來占總比超過一半,但是從人均年累計學習時長來看,75前用戶人均年累計學習時長最長,95后學習時長最少,這是由于受到經濟條件的限制,而80后、85后群體大多已就業,具有一定消費能力,對知識的有效性獲得較為看重,因此愿意花費更多的錢在學習上。
在性別上,男女在占比、人均年累計學習時長、付費意愿、付費金額上差別都不大,在學習偏好上,互聯網營銷、平面設計、職業技能課程受到了男性女性用戶的共同追捧,男性用戶對編程語言類課程興趣高,女性用戶對公考求職、文藝修養則有較強的學習需求。
從學歷上來看,初高中學習占比接近60%,本科/專科占比也超過了30%,其中高學歷用戶普遍人均年累計學習時長較高,付費意愿、付費金額也比較高,因為他們大多有較為明確的學習目標,往往會專門投入資金以及時間進行在線學習。
3.建議
(1)經濟發展影響用戶在線學習。經濟因素對用戶學習產生了巨大的影響,經濟發達的地區不僅對學校教育重視,對在線教育的關注度也是比較高的,而在西南、西北等一些經濟發展較慢的地方,人們的在線學習意識較為薄弱,相關教育部門及在線教育平臺應該加大在西北、西南地區的推廣、宣傳,使更多的人通過在線教育平臺進行學習,獲得更多的學習機會。
(2)社會需求影響用戶在線學習。由于互聯網的迅速發展,社會對IT互聯網人才也有較大的需求,互聯網相關專業就業形勢好、工資高,也成為人們追逐學習的一大原因,所以學習編程語言、互聯網營銷的用戶也就越來越多,通過在線教育平臺,用戶可以快速便捷地獲取到自己所需要的課程,有利于其自身的發展。根據用戶對課程的偏好,在線教育平臺應優化編程語言、互聯網營銷、職業技能等需求量高的課程,使用戶接受到更優質的學習資源。
(3)在線教育平臺應該有針對性地開展課程,為用戶制訂個性化學習方案。不同年齡段、學歷層次的用戶對學習的需求是不一樣的,對付費學習的意愿、金額也是不同的。對于中小學生而言,應充分考慮其經濟實力,降低付費金額,多增加免費的優質課程。對于年齡較小、學歷層次較低的用戶而言,他們的學習自主性較弱,易受各種因素的影響,在線教育平臺應通過不同的方式,督促、提醒其進行學習,增長其在線學習時間。
結語
在大數據的驅動下,在線教育呈現出蓬勃發展的趨勢,同時由數據帶來的一系列問題也需要通過不斷地探究進行解決。新技術,新挑戰,大數據帶給我們的除了機遇,還有挑戰,要善于運用技術,解決學習中產生的問題,利用大數據對教育數據進行全方位與全程性采集,對多維教育大數據進行深度分析,運用可視化的分析工具,將在線教育過程中產生的問題用可視化數據呈現出來,使在線教育平臺優化自己的課程,運用更多好的方式有針對性地推廣、開展課程,讓學習者更好地參與學習,從知學轉變為好學,由好學進一步變為優學。數據時代,要學會正確地獲取數據、分析數據、應用數據,利用數據服務學習生活,不斷學習新技術,解決數據產生的問題,培養數據素養,樹立數據意識。
參考文獻:
[1]沈海波,周如旗,朱雄泳.大數據時代軟件工程專業建設的思考[J].計算機教育,2015(23):98-100.
[2]王祖霖.大數據時代學生評價變革研究[D].長沙:湖南大學,2016.
[3]郝水俠,楊帆.基于大數據分析的教學模式創新與探索[J].軟件導刊:教育技術,2016,15(12):8-11.
[4]畢正宇.教育政策執行模式研究[D].武漢:華中師范大學,2006.
[5]李冬,韓永國.網絡學習行為個性化引導的研究[J].中國教育技術裝備,2010(3):79-81.
[6]孫眾,宋潔,姚夏晶,等.教育大數據的課堂應用新形態——“教育大數據研究與實踐專欄”之教學應用篇[J].現代教育技術,2016,26(9):5-10.
[7]陳曉娟,陳紅普.騰訊課堂在線教學模式探究[J].軟件導刊,2015,14(8):221-224.
[8]中國在線教育平臺用戶大數據報告——騰訊課堂數據篇2018年[A].艾瑞咨詢系列研究報告(2018年第1期)[C].上海艾瑞市場咨詢有限公司,2018:44.
[9]張進良,李保臻.大數據背景下教師數據素養的內涵、價值與發展路徑[J].電化教育研究,2015,36(7):14-19+34.
作者簡介:魏夢楠(1994—),女,碩士研究生在讀,主要研究領域為教育大數據、機器人教育。馬燕(1960—),男,博士,教授,博士生導師,主要研究人工智能、語義網、社會計算等。
基金項目:本文屬于重慶師范大學研究生科研創新項目——重慶市高校“校園貸”行為影響因素研究及對策探討(項目號:YKC17014),基于校園大數據的學生行為分析與預警平臺設計(項目號:YKC18028),基于學習行為大數據的深度學習分析模型及實現(項目號:YKC18029)的研究成果。