姜丹,王美娜,周麗
(1.海軍大連艦艇學院基礎部,大連 116018;2.海軍大連艦艇學院海洋測繪系,大連 116018)
?
基于聚類分析技術的智能型MOOC平臺的研究與設計
姜丹1,王美娜2,周麗1
(1.海軍大連艦艇學院基礎部,大連116018;2.海軍大連艦艇學院海洋測繪系,大連116018)
摘要:
關鍵詞:
隨著互聯(lián)網(wǎng)技術的飛速發(fā)展和個人電腦的普及,在線教育已經(jīng)非常普遍,參與學習的人數(shù)劇增,同時學習者的學習習慣也發(fā)生了天翻地覆的變化,于是僅僅是實際課堂向網(wǎng)絡課堂平移的傳統(tǒng)在線教育已不能滿足學習者的學習需求。目前MOOC以一種全新的教育方式,形成了一股教育革命的熱潮,正迅速地席卷全球,眾多的研究者致力于MOOC課程及MOOC平臺的設計與實現(xiàn),例如課程的設計與制作、課程的發(fā)布與管理、MOOC平臺的視頻播放技術、MOOC平臺的功能結(jié)構改進等都有重大突破。然而如何對學習者的學習效果進行有效地、科學地評價,如何針對學習者的個性特征進行有效地互動,及時地給予針對性的指導,從而提高MOOC教學的互動性,提高MOOC平臺的智能性仍是空白,是亟待研究的重要課題。
1.1什么是MOOC?
MOOC是Massive Open Online Courses的縮寫,即大規(guī)模在線開放式課程,具有Open、Online、Massive三大特征。Open表示課程是開放的、免費的,凡是感興趣的、想學習的都可以參與學習;Online表示課程是通過網(wǎng)絡在線學習的,不受時間和空間的限制,只需要一臺電腦加網(wǎng)絡,就可以在任何地點任何時間學習這些課程;Massive表示課程不是個人發(fā)布的一兩門課程,也不是針對一兩個人,而是眾多參與者發(fā)布的大規(guī)模的課程。MOOC是綜合利用高速網(wǎng)絡、分布式計算機以及多種多媒體技術,在線展開的,集學、議、分享為一體的全新的學習方式。
1.2MOOC與MOOC平臺的發(fā)展及現(xiàn)狀
MOOC這個術語是2008年由加拿大愛德華王子島大學網(wǎng)絡傳播與創(chuàng)新的主任與國家人文教育技術應用研究院高級研究員聯(lián)合提出的。從此,大量的教育工作者都采用了這種教育方式,主辦了大規(guī)模的網(wǎng)絡開放課程,參與者眾多。例如2011年,斯坦福大學Sebastian Thrun與Peter Norvig聯(lián)合開放的免費課程——《人工智能導論》,有來自世界各地的160萬人注冊并學習。
支持這種學習方式的教學平臺稱之為MOOC平臺,能夠支持大量的學生同時在線學習以及多門課程的上傳與管理。自MOOC被提出以來,網(wǎng)絡上也涌現(xiàn)出很多MOOC學習平臺,國內(nèi)外均發(fā)展迅速。成立時間最早應屬斯坦福大學Sebastian Thrun開設的Udacity,以計算機類課程為主,課程數(shù)量不多,但極為精致。Coursera則是目前發(fā)展最大的MOOC平臺,擁有近500門來自世界各地大學的課程,門類非常豐富。2012年5月,哈佛大學與麻省理工學院共同開發(fā)的edX也非常矚目,課程形式設計更加自由靈活,目的是配合校內(nèi)教學,提高教學質(zhì)量和推廣網(wǎng)絡在線教育。
MOOC這種全新的學習方式不但引發(fā)了全球教育方式的重大變革,也推動了國內(nèi)的教育教學改革,我國眾多高校及機構也紛紛開設大型的網(wǎng)絡開放課程。學堂在線是清華大學于2013年10月10日推出的MOOC平臺,面向全球提供在線課程。慕課網(wǎng)則是由北京慕課科技中心成立的,是國內(nèi)慕課先驅(qū)者之一,是互聯(lián)網(wǎng)、IT技術免費學習平臺,現(xiàn)設有Java開發(fā)、PHP開發(fā)、Android開發(fā)等課程,專注于服務互聯(lián)網(wǎng)工程師快速成為技術高手。酷學習是上海首個推出基礎教育慕課的公益免費視頻網(wǎng)站,酷學習所倡導的價值觀就是免費、分享、合作。
1.3MOOC平臺的特點
MOOC進行自主的學習的人數(shù)眾多,MOOC平臺的首要特點就是支持大量的學習者同時在線學習,這也就要求課程視頻必須能大量的同時正常播放。如何高效、穩(wěn)定地傳輸大流量的視頻文件是關鍵技術,現(xiàn)階段主要采用專業(yè)的視頻服務器——流媒體服務器來實現(xiàn),目前比較流行的流媒體視頻服務器有Red5、Helix Server、xmoov Stream等。
其次,MOOC突破了傳統(tǒng)課堂在時間和空間上的限制,也突破了人數(shù)限制,受眾面非常廣,學習者的學習能力也千差萬別,所以MOOC平臺的第二大特點就是能夠在給學習者提供自主學習機會的同時也提供有效、科學的學習指導和幫助,保證在較高入學率的前提下也能夠有較高的通過率,這樣的MOOC學習才是有意義的學習,這樣的MOOC平臺才是智能的學習平臺。
如果采用客觀的、自動化的線上評價系統(tǒng)對學習者的學習效果進行檢測,然后根據(jù)測試的成績進行個性化研究,給出個性化的針對性的學習建議,則可以大大提高MOOC平臺的智能性,從而大大提高學習者的學習效果。聚類分析技術是數(shù)據(jù)挖掘的主要任務之一,可以運用聚類分析技術對學習者的測試成績進行分析,從而實現(xiàn)這一目標。
2.1聚類分析的概念與方法
聚類分析技術分成兩部分——聚類、分析。“聚類”就是“物以類聚”,將樣本數(shù)據(jù)根據(jù)相似性進行劃分,越是相似的數(shù)據(jù)對象越盡可能地劃分在一個類中,越是相異的數(shù)據(jù)對象越盡可能地劃分在不同的類中,從而形成若干個“簇”;“分析”則表示進一步分析每一簇數(shù)據(jù)的特征,從中得到有價值的信息。聚類分析是知識發(fā)現(xiàn)的重要技術手段,在數(shù)學、計算機科學、統(tǒng)計學、生物學和經(jīng)濟學等很多領域都有非常廣泛地應用。
聚類分析的定義如下:給定數(shù)據(jù)集合V{vi|i=1,2,…,n},vi為數(shù)據(jù)對象,根據(jù)數(shù)據(jù)對象vi間的相似度或者相異度,將數(shù)據(jù)集合V{vi|i=1,2,…,n}分成k組Cj(j= 1,2,…,k),并滿足:

該過程稱為聚類分析,Cj(j=1,2,…,k)稱為簇(類)[1-2]。
聚類分析方法有很多種,大概可以劃分為五大類:層次聚類(hierarchical method)、劃分方法(partitioning method)、基于網(wǎng)格聚類方法(grid-based method)、基于密度聚類方法(density-based method)、基于模型的方法(model-based method)。層次聚類主要是對給定的數(shù)據(jù)集合進行層次性的分解,直到滿足某種條件終止。密度聚類是根據(jù)密度閾值將數(shù)據(jù)空間分成高密度區(qū)域和低密度區(qū)域,簇是由高密度且連通的區(qū)域構成。網(wǎng)格聚類采用多分辨率的網(wǎng)格結(jié)構,將樣本空間量化為有限個網(wǎng)格單元,然后對網(wǎng)格單元進行操作,從而形成簇。模型聚類是預先為每個簇假定一個模型,然后尋找數(shù)據(jù)對象針對給定模型的最佳擬合。劃分聚類是先假設數(shù)據(jù)集上有若干個簇,然后按照一定的規(guī)則將數(shù)據(jù)對象劃分到對應的簇中。每一類聚類方法都有多種聚類算法,每種聚類算法都有各自的優(yōu)缺點及適用范圍,在使用過程中需要根據(jù)樣本數(shù)據(jù)的特點以及聚類的實際需求來選擇最適合的聚類分析方法。
其中K-means算法由于其簡單、快速的優(yōu)點應用范圍非常廣泛。K-means算法是一種基于劃分的聚類算法,其基本思想是:首先隨機選取k個點作為初始聚類中心,然后計算數(shù)據(jù)對象到初始聚類中心的距離,按照就近的原則將數(shù)據(jù)劃分到最近的簇中,接著重新計算簇的聚類中心以及數(shù)據(jù)到聚類中心的距離,然后重新分配數(shù)據(jù),重復上述過程直到聚類中心不再變化或者滿足終止條件為止。
K-means算法是一種基于距離的算法,算法簡單、快速,可伸縮性強,適用于處理大樣本數(shù)據(jù),但是算法的第一步“隨機選取k個點作為初始聚類中心”存在兩個非常大的缺陷,一是“隨機”,二是“k個”。首先隨機選取的初始聚類中心對于算法的聚類結(jié)果影響較大,一旦初始聚類中心選擇不當,可能無法得到有效的聚類結(jié)果;算法中的k需人為事先預估來確定,而在聚類前,簇的個數(shù)k是非常難以估計的。
2.2改進的聚類分析算法
針對K-means聚類算法的這兩個缺點,提出一種改進的聚類分析算法——GBKM算法。算法的基本思想是[3]:首先對樣本空間進行劃分,形成網(wǎng)格單元結(jié)構;計算每個網(wǎng)格單元的密度,區(qū)分高密度網(wǎng)格單元和低密度網(wǎng)格單元,將相鄰的高密度網(wǎng)格單元合并形成簇,稱為“中間聚類”,將低密度網(wǎng)格單元中的數(shù)據(jù)對象標記為“自由數(shù)據(jù)”;處理自由數(shù)據(jù),計算每個簇的質(zhì)心及自由數(shù)據(jù)到簇的距離,將自由數(shù)據(jù)分配到最近的簇中去,重復此過程,直到聚類中心不再移動為止。算法的具體流程如圖2所示。
GBKM算法首先得到若干個密集單元,然后合并相鄰的密集單元,形成的初始聚類能夠很好地捕獲樣本數(shù)據(jù)的初始形狀,可以自動確定簇的個數(shù)k及初始聚類中心,克服了人為確定k值以及隨機選擇初始聚類中心對聚類結(jié)果造成的影響和不穩(wěn)定性。參考文獻[3]通過理論分析及實驗證明驗證了該算法的優(yōu)越性,在此不一一贅述。
3.1MOOC平臺的研究與設計
MOOC平臺的總體目標是支持大規(guī)模在線開放式課程的學習,首先能夠支持大量的學習者進入在線平臺進行學習,教師可以發(fā)布不同的課程并對課程進行管理,同時為了保證MOOC平臺正常、高效地運轉(zhuǎn),還需要對學習者、教師、課程等大量數(shù)據(jù)進行管理。基于上述分析,將MOOC平臺涉及到的用戶定義為三種角色:學生、教師、管理員。

圖1 GBKM算法流程
學生的行為包括:注冊、登錄、查看課程、選課、學習、測試、提問、分享、考核等。其中選課可以選擇免費課程,也可以購買付費課程;MOOC學習完全是一種自發(fā)的、自主學習行為,所以學習行為是否有效其實很難界定,這里設計“簽到”功能來保證學習者進行有效學習,也可以視之為一種鼓勵;測試是學習行為的一部分,在學習完某章或者某節(jié)之后,可以進行階段性的測試以檢驗學習效果,幫助學習,也可以在學習完整門課程后進行整個課程的測試,檢驗對課程知識的把握程度,以保障順利通過考核;提問是學生與教師之間的互動,學生可以發(fā)問,也可以對自己的問題進行集中地查看和管理;分享是學生與學生之間的互動,學生可以針對某個知識點、某個話題進行溝通交流,互通有無,相互學習、相互促進。
教師的行為包括:發(fā)布并管理課程、上傳視頻、出題、答疑解惑等。一個教師可發(fā)布并管理多門課程,包括課程簡介、課程公告、課程大綱、考核標準等內(nèi)容;按照課程大綱的設置,分章節(jié)上傳視頻,按照考核標準針對知識點進行出題;對學生提出的問題進行在線答疑。
管理員的行為包括:管理學生、教師、課程的基本數(shù)據(jù)、發(fā)布平臺公告、對平臺用戶進行權限設置等。
根據(jù)上述分析可以得出MOOC平臺的功能,對這些功能進行分解、整合,將MOOC平臺分成六大功能模塊:平臺數(shù)據(jù)管理、課程管理、學習系統(tǒng)、在線測試系統(tǒng)、智能輔導系統(tǒng)、互動平臺系統(tǒng)等,每個模塊又可細分成若干個子模塊,具體如圖2所示。
3.2聚類分析技術在MOOC平臺中的應用
該MOOC平臺的智能性則體現(xiàn)在“智能輔導系統(tǒng)”這一模塊上,其基本思想:首先利用改進的聚類分析算法GBKM算法對學習者的測試成績進行聚類,然后通過對聚類結(jié)果進一步分析,得出該類學習者的整體學習特征,并結(jié)合該學習者自身的個性特征給出輔導意見,包括三方面信息,一是測試時需要手動輸入的組卷的難度系數(shù),用以控制自動生成的試卷更加適合該學習者,使得試卷的難度更加有針對性;二是組卷參數(shù),通過后臺傳遞給組卷系統(tǒng),用來設置學習者在下次測試時試卷內(nèi)容的難點、側(cè)重點,使得試卷的題目更加有針對性;三是學習策略,通過頁面直接反饋給學習者,使得學習者對自己的學習效果有個全局的、總體的把握和認識,具體流程如圖3所示。

圖2 智能型MOOC平臺整體功能模塊
盡管實際課堂受到了空間、時間等等的限制,但是實際課堂最大的優(yōu)點則是授課教師可以實時關注學生的學習動態(tài),進行有針對性的輔導,而這也恰恰是網(wǎng)絡學習中無法突破的難點,使用聚類分析技術來設計智能輔導系統(tǒng)則能解決這一難題。該MOOC平臺不僅僅是提供了一個學習平臺,還可以幫助學習者更好地完成自主學習,使得學習者的學習不再是盲目的,如同有個智能機器人教師在一旁輔導一般,大大提高了MOOC平臺對于學習者的引導性和幫助性。

圖3 智能型MOOC平臺的學習流程
本文在深入研究MOOC及MOOC平臺的發(fā)展和特點后,將聚類分析技術應用于MOOC平臺的設計,大大提高了MOOC平臺的智能性,有助于提高MOOC學習者的自主學習效果。下一步工作是將MOOC平臺應用于實際,并進一步逐步完善、改進智能型MOOC平臺。
參考文獻:
[1]張云濤,龔玲.數(shù)據(jù)挖掘原理與技術[M].北京:電子工業(yè)出版社,2004.
[2]Anil K.Jain,RichardC,Dubes.Algorithms for Clustering Data[M]. N.J:Prentice Hall,1988.
[3]姜丹,周麗,唐紅杰.聚類分析技術在教學指導中的應用研究.湖北:軟件導刊[J],2014.10.
Research and Design of the Intelligent MOOC Platform Based on the Clustering Analysis Technology
JIANG Dan1,WANG Mei-na2,ZHOU Li1
(1. Department of Basic Science,Dalian Naval Academyof the PLA,Dalian 116018;2. Department of Marine Surveying and Mapping,Dalian Naval Academy of the PLA,Dalian 116018)
Abstract:
Keywords:
在深入研究MOOC及MOOC平臺的本質(zhì)及特點后,針對目前MOOC平臺的應用現(xiàn)狀和問題,結(jié)合聚類分析技術,設計出智能型MOOC平臺,實現(xiàn)MOOC教學過程中高效地、有效地教學互動,提高MOOC平臺的智能性,有效提升MOOC學習者的自主學習效果。
慕課;聚類分析;K-means聚類算法
基金項目:
中國人民解放軍海軍大連艦艇學院2015年學院科研發(fā)展基金資助項目(No.DJYKYKT2015-03)
文章編號:1007-1423(2016)13-0076-05
DOI:10.3969/j.issn.1007-1423.2016.13.020
作者簡介:
姜丹(1982-),女,黑龍江五常人,講師,碩士研究生,研究方向為數(shù)據(jù)挖掘、聚類分析
王美娜(1981-),女,黑龍江齊齊哈爾人,碩士,講師,研究方向為海道測量數(shù)據(jù)處理
周麗(1981-),山東萊陽人,碩士,實驗師,研究方向為大學物理實驗教學及研究
收稿日期:2016-03-03修稿日期:2016-04-16
After the in-depth study of the MOOC and MOOC platform’s nature and characteristics,aims at the MOOC platform’s application status and problems,studies the clustering analysis technology,designs an intelligent MOOC platform,and implements the efficiently teaching and learning interaction,in order to improve the MOOC platform’s intelligent,and the MOOC learners' autonomous learning effect.
MOOC;Clustering Algorithm;K-means Clustering Method