王雪宇 鄒剛 李驍 王玉龍



摘要:選取哈佛大學和麻省理工學院聯合發布的edX平臺開放數據和國防科學技術大學MOOC教育平臺數據作為研究基礎,通過數據的處理、整合、分析,從平臺、課程、學習者類型三個方面針對中關MOOC學習者學習行為進行分析,并從學習者類型出發,指出當下熱點問題MOOC“高輟學率”的影響因素。
關鍵詞:MOOC;教育大數據;學習行為分析;教育信息化
引言
自2013年中國多所大學掀起“MOOC風暴”,MOOC在中國的發展迎來了一個黃金時期,隨著各學科領域MOOC課程建設的加速推進,MOOC學習者的數量也在不斷增多。2013年8月,國防科技大學率先在軍隊開設MOOC平臺,力推將信息時代的教育碩果分享到全軍。如何正確看待當前的“MOOC熱”,作為MOOC發源地的美國與當下MOOC正時興的中國,兩國MOOC學習者在學習MOOC時有何差異,帶著這些問題,本文分析了edX平臺和國防科大夢課平臺所記錄的眾多學習行為信息,力求找到一些答案。
1相關背景
1.1關于MOOC
大規模開放式網絡課程(MOOC)最早是由加拿大學者Dave Comfier和Bryan Alexander在2008年提出的,而真正應用此概念的是加拿大學者George Siemens和Stephen Dowries,當時的MOOC主要基于關聯主義(Connectivism)學習理論,以CCK08等課程為代表,強調自學、互助,也稱cMOOC。
2012年,以Coursera、edX、Udacity為代表的學習平臺將MOOC推向全球,贏得了世界各地高校、教育機構的重視,在許多著名學府積極加入國際化課程平臺的同時,各國也在加緊建設具有本國特色的MOOC學習平臺,這其中比較典型的是澳大利亞的Open2Study、西班牙的MiriadaX、英國的Futureleam等,這類基于行為主義學習的理論稱為XMOOC,接近傳統教師授課的在線教學模式。
在近幾年的發展中,以MOOC為基礎又衍生出了更多的在線學習新形態:SPOC(小規模限制性在線課堂)、MOOL(大規模開放在線實驗室)、PMOOC(個性化公開課)、MOOR(大規模開放在線研究課程)等。
截至2014年末,約有400所全球知名大學參與提供MOOC教學服務,其中美國排名前25名的高校中有22所在向全球學習者最多的幾個MOOC服務平臺提供免費的MOOC。
1.2關于MOOC學習行為分析
21世紀無疑是大數據的時代,利用海量數據進行決策分析成為信息時代眾多問題的有效解決途徑之一。
MOOC學習過程中,用戶在注冊、登錄、點擊鏈接、觀看視頻、參與互動、頁面停留等每一個環節均留下了痕跡,眾多痕跡匯聚成的海量數據。無疑是探析學習者學習行為、發現潛在問題、幫助教師檢驗新教學法和評估教學、幫助學生理解和優化學習等活動的重要資源。
MOOC學習行為分析是基于MOOC教育大數據,充分利用學習分析技術和數據處理技術,從記錄學習者學習行為的海量數據中獲取有用信息,得出某種規律,為學習者有效地定位學習需求,支持個性化學習,幫助教學者根據學生個性差異和學習需要為學生的個性化學習實施各類分層。同時通過MOOC學習行為分析也可以跟蹤高校師生教與學的歷程,分析地區間學習者學習差異,獲得教與學的聚焦規律。
2實驗數據集概況
2.1數據集介紹
2.1.1“The HarvardX-MITx Person-CourseDataset AY2013”公開數據集
2014年,哈佛大學和麻省理工學院聯合發布了兩校開設在edX平臺上的16門課程的公開數據集,這是全球第一個公開發布的MOOC學習數據,具有很強的研究性,為眾多MOOC學習分析研究提供了重要的數據支持。該數據集共有641139條記錄,每條信息包含課程名、學習者ID號、出生年份、國籍、學歷等共20項內容,其中哈佛大學課程記錄338224條,麻省理工學院課程記錄302915條。該數據集在公開前通過K-Anonymity(K-匿名模型)、Quasi-Identifies(準標準屬性泛華)、L-diversity(L-多樣化)等方法進行了去身份識別(De-identificationg),既保護了學習者隱私,又未對數據真實性造成影響。
2.1.2_國防科學技術大學夢課平臺數據集
2013年8月,國防科學技術大學利用自身在教學和科研領域的優勢率先在軍隊開放了面向全軍官兵的自主學習平臺——夢課學習平臺,為建設現代軍事職業教育模式做出貢獻。截至2015年10月,夢課平臺累計開設課程112門,注冊官兵數296957人,組織了近3000批次、3.2萬余人次的在線考試,網站點擊量超過2500萬次。
在國防科大夢課平臺數據庫里記錄著學習者登錄時間、視頻觀看、互動交流、學習成績、教師回復、學習者活躍程度等多項內容,共超過9000萬條學習行為信息。分析夢課學習平臺積累的這些海量官兵學習行為數據,研究部隊學習者的在線學習行為,對洞悉部隊官兵的在線學習規律、改進授課教師的MOOC建設質量、提升平臺的教學組織管理能力具有很重要的作用。
2.2選取處理數據集
為有效分析學習者學習行為,以兩個數據集為基礎,通過MySQL數據庫、IBM SPSS、Tableau等工具對數據進行選定、去空值、篩選后,從641139條edX數據中最終獲得美國學習者學習行為信息151122條,從303985條國防科大夢課平臺數據中獲得中國學習者學習行為信息86689條,以上述數據為研究基礎,進行中美MOOC學習者學習行為分析。
3數據分析
MOOC學習者的學習行為涉及方方面面,在本章將按照當前MOOC學習行為分析研究的通常做法,從平臺、課程、學習者類型三個方面對中美MOOC學習者進行分析,并對當前社會關注的熱點問題“MOOC輟學率”進行研究。
3.1平臺分析
分析平臺層面時,對兩個平臺數據集中學習者的注冊信息進行了處理分析,分別比較美國和中國MOOC學習者的學歷組成、年齡分布和性別差異,如圖1所示。
通過中美MOOC學習者學歷組成比較發現,美國學習者中高學歷人群占比較大,特別是有博士(5.90%)和碩士學歷(21.80%)的學習者,兩類學習者中本科學歷的比例基本持平,但中國學習者中高中及以下學歷的人群遠大于美國,這與中國軍隊中許多士兵均是18歲便參軍入伍有關。
在年齡分布比較中,將數據集中所有MOOC學習者的年齡分為三類:青少年(0-20歲)、中青年(20~40歲)和中老年(40歲以上)。比較發現,美國學習者中40歲以上的人群占比(23.60%)遠多于中國學習者,中青年齡段比例二者基本持平,而中國學習者中29歲以下的人群占比較多(28.20%),這與前面提到的絕大多數服兵役的青年官兵均是18周歲入伍有關。
從已有的MOOC研究中可以知道,MOOC學習者中性別差異遠大于社會中性別差異,男性學習者占絕大多數。從圖1的分析結果可以發現,美國學習者的性別差異比中國軍隊學習者小,說明在美國有更多的女性參與到了MOOC學習中;中國學習者性別差異大與現實情況相符,軍隊中男性占比本就遠超過女性。
3.2課程分析
課程分析部分,針對中美MOOC學習者各選取了4門課程共計86948注冊人次進行分析,其中哈佛大學2門(健康知識、計算機概論)、麻省理工學院2門(計算機編程介紹、生物學概論)、國防科技大學4門(多媒體設計、網絡知識、3D打印、車輛管理),如表1所示。
從表1可以看出,美國學習者中女性學習者傾向于選擇偏文科的課程,但總體看來選課的女性占比遠大于中國學習者,這與軍隊中女性比例本身過低有關;對比中美獲得證書的學習者占全部注冊學習者的比例,中國學習者完成課程的比例較高于美國學習者,這可能與軍隊相關組織制度有關,而就中美學習者內部而言,不同課程獲得證書的學習者占比基本相近;對比選修課程學習者的平均年齡,中國學習者的平均年齡均小于美國學習者,這與軍隊中主要是18~20周歲的青年官兵有關,而無論中美學習者,課程獲得證書學習者的平均年齡均大于全部學習者平均年齡,說明學習者年齡對課程的完成也存在影響。
3.3學習者類型分析
MOOC的主體是學習者,而這個主體不僅數量巨大,種類也多。有的學習者會把MOOC當做傳統課程認真參與學習;有的學習者只是把MOOC當做在線參考或者工具,交互特點呈現不同步性和選擇性;還有一些學習者只是把MOOC當做檢驗其對相關知識的掌握程度的工具,因此他們很可能只做題而不看視頻。在這里,采取哈佛大學和MIT聯合發布的課程報告中的方法將學習者分為僅注冊者(只注冊了課程,沒有其他學習行為)、一般學習者(注冊并訪問了課程)、積極學習者(注冊并訪問了大于1/2的課程內容)和獲取證書者(獲取了證書)4類(分類圖片來自課程報告)。圖2為四類學習者的分類和中美各類型學習者比例。
從圖2不難看出,中國學習者兩極分化嚴重,僅注冊者和獲取證書者、積極學習者均多于
下面從學習者類型出發,以獲取證書學習者和全部學習者為對照,來研究MOOC興起至今人們始終關注的一個熱點問——MOOC課程遠高于傳統課程的“輟學率”。據媒體報道,Coursera、edX、Udacity三大平臺的平均輟學率高達95%。為什么MOOC會有這么高的輟學率,這與哪些因素有關,學習者學歷、年齡還是學習行為?美國學習者,特別是獲取證書者比例超過美國學習者的7倍,表明中國學習者中認真對待MOOC課程的不是少數,而美國學習者中超過一半的均是一般學習者,獲取證書和積極學習者占極少的比例。
數據集中美國MOOC學習者能獲得證書(即順利完成學業)的人群占比為2.1%(3244人),輟學率為97.9%;中國學習者中取得證書的人群占比15.7%(13572人),這個比例高于世界普遍水平。為研究輟學率的影響因素,對獲得證書學習者的學歷、學習進度、學習行為等進行了分析并與全部學習者做了對比,見表2。
從表2可以看出,獲得證書的學習者中高學歷占比遠高于全部學習者,特別是有博士、碩士學歷的學習者,說明學歷對輟學率有一定影響,這一點在美國學習者中顯得尤為突出;在取得證書的學習者中,中美學習者學習進度超過一半的占比均超過了97.0%,說明取得證書的學習者多數都認真學完了課程,以獲取知識為目的;在學習行為中,選定了數據集中課程交互次數、學習天數、視頻播放數三個數據進行分析,對于兩國MOOC學習者來講,結論是相同的,獲得證書的學習者均是交互積極、學習持續時間長、播放課程視頻次數多的學習者。另據哈佛大學和MTF聯合發布的課程報告《HarvardX and MITx:TheFirSt Year of Open Online Courses(Fall 2012-Summer 2013)》中統計數據顯示,在全部16門課程中取得證書的學習者平均年齡均大于全部學習者的平均年齡,所以學習者年齡也是輟學率的一個影響因素。
4結語
美國作為MOOC的發源地,在MOOC建設上一路領先其他國家,在眾多知名大學加盟的情況下,MOOC發展更是如虎添翼。中國自掀起MOOC熱潮以來,正瞄準前沿不斷發展,越來越多高校和機構的加入必將推動MOOC穩步前行。本文通過對中美MOOC學習者學習行為進行研究,既找到了兩類學習者的共同點,又發現了差異,這對于MOOC學習行為研究多少能有一些啟示。同樣,中國軍隊MOOC的發展也值得關注,許多軍隊學習者以超出普通學習者數倍的精力投身于MOOC學習中,取得了不俗的成績。要推動我國MOOC的健康持續發展,需要國家和社會的共同努力,從課程建設、激勵機制、疑難解答等眾多方面進行創新和攻關,讓MOOC真正成為改變一代人甚至幾代人教育理念、教育模式和教育環境的時代產物。