大數據在英國高校的應用案例
編者按
本文摘取英國聯合信息系統委員會(JISC)的研究報告《學習分析——英國高等教育和成人教育現狀》部分內容,以幫助國內高校了解教育大數據在英國高校中的應用與發展。該報告主要探討英國部分大學和學院在學習分析方面的發展現狀,對英國10所大學、2所學院以及倫敦大學計算中心的高級管理人員、學者、信息技術部門的管理人員、圖書館和教育技術單位的管理人員等進行采訪,深入了解實際發展情況,其中涉及教育數據的采集、分析、應用模型以及未來發展預測等部分。

貝德福德郡大學出于學生留存率的考慮,通過收集學生相關數據對學生出席和參與情況進行監控。這些數據包括:去圖書館次數、圖書館使用情況(借閱的書目)、上課情況和在校園情況、學生信息幫助臺(SiD)使用情況、虛擬學習環境使用情況(Blackboard)、網絡登錄情況(Novell)、e-Vision使用情況(學生個人信息和考試成績)、作業提交情況、參會情況和參加考試等。
貝德福德郡大學致力于將數據轉化為關鍵的管理信息,正試圖利用Oracle、Excel、SharePoint和Report Builder來實現項目報告工具的標準化,方便貝德福德郡大學內所有的管理人員和教職員工使用。雖然目前為止,很難確定因分析技術的使用而直接提高了留存率,不過,一些證據表明,貝德福德郡大學的出勤率和圖書館的出席率得到了提高。
目前貝德福德郡大學所面臨的挑戰是,如何利用正在數據倉庫中集聚的“大數據”。教學大數據可以完成很多事情,但現階段收集數據、分析數據的成本很高,且院校的專業知識不足。這需要以后有更多的高管參與業務智能和分析技術,并共同努力制定一個包容的高層戰略,將所有現有的項目和線索整合在一起。

布里奇沃特學院使用教學大數據的主要驅動因素是支持其學生要取得比全國相似入學水平的學生的平均成績更好的成績。為此,布里奇沃特學院使用稱之為“第三級增值數據”的第三級國家數據集,它由來自授權組織的數據組成,如Edexcel(英國愛德思國家職業學歷與學術考試機構)和OCR(牛津、劍橋和RSA考試局)。主要跟蹤16~18歲的學生,從其第2級成績到第3級成績(包括第A級成績和大多數職業資質),用此來指明學生是否達到了高于或低于全國平均成績水平。
除了國家數據集,學校已經開發了自己的數據系統——布里奇沃特學院增值數據。根據學生之前的成績、出勤記錄、愿望和其它因素(如是否為護理員),創建個人檔案。一些學生不是學校活動的“常客”,或者來自經濟條件不是很好的家庭,布里奇沃特學院就要為此找到最好的辦法來支持積極主動的學習行為和態度,以便這些學生都能取得成功。
數據分析系統可供指導教師使用,例如,如果學生出現嚴重的、有關心理健康的問題或者當無家可歸時,可將該學生信息提交給高級指導老師。

德比大學全校很大一部分學生來自黑人和少數族裔,許多學生背負照顧家庭的責任或是殘疾學生。基于此,德比大學通過調取分析學生相關數據,希望能更好地了解學習者及其各種各樣的需求,著力提高學生成績和豐富學生經驗。
2010年,德比大學啟動學生經驗“紅綠燈”項目(SETL)。主要調取29個維度的數據,確定監控學生的參與情況。這其中,包括教程和講座的出勤率和互動情況、成績單、教學評測中的表現、對虛擬學習環境中資源的訪問情況、入學資質和背景,以及校外責任,如照顧孩子、年齡資料和兼職/全職狀況。
德比大學考察了QlikView(可視化數據的主要系統),認為建立一個數據倉庫系統會更有效地儲存數據。因此,德比大學正在開發一個數據倉庫,主要面對存放在學生信息系統中的學生記錄數據。

東倫敦大學很早就開始收集學生考勤數據,對學生實施考勤監控。數據主要來自于磁卡考勤數據,該部分數據保存在SQL Server數據倉庫中。其他數據主要是,學生信息系統關于成績數據和學生特征、來自虛擬學習環境的活動數據(Moodle)、圖書館活動(Athens)、物理圖書館借貸報告、課程接收活動、免費圖書下載活動等,這些數據則被傳輸到Oracle數據倉庫中。東倫敦大學部署應用了一個業務智能工具——QlikView,來對系統中的數據進行可視化分析。
QlikView可用的數據包括:學生個人信息頁面,顯示出勤百分比、成績和其它特征;每個學生每個星期一份顯示Moodle活動的報告。學校以及個人能夠查看數據,圖形顯示明確的出勤率與模塊分數之間的關聯關系。
學校每月都會自動向學生發送電子郵件,顯示其出勤率。出勤率也會放到學生門戶網站(UEL+)上去,這樣學生在其上就可以查看自己的出勤率。如果學生的出勤率沒有改善,那么系統會向學生發出警告,最終可能撤銷其學習資格。

拉夫伯勒大學開發Co-TutorTM系統,該系統旨在整理和可視化數據的系統,它們為特定的教職員工群體而定制,以便教師展開教學活動。Co-TutorTM系統使用數據作為一個通往各個學生學習經驗的窗口,實現自動的消息通報,以便在適當的時候予以提醒、提出問題。
目前學校正在開發一個關于Co-Tutor的學生門戶網站。另外,通過學生實習活動來開展的一項研究分析了什么是教育數據,以及可視化對學生的重要程度,以幫助確定網站開發路線圖。校方認識到,需要一個更加移動和友好的接口,以便從拉夫伯勒大學的各系統中獲取教育數據。
Co-Tutor的數據采集自多個系統,包括:VLE(Moodle);學生信息系統(一個定制的系統);時間表系統;保存用戶照片的安全系統(Symmetry);考勤監控系統(Attendant)和作業處理系統(CASPA)。目前尚未納入任何來自圖書館的數據,但希望能連接閱讀列表系統(LORS)和圖書館借閱記錄。
拉夫伯勒大學的各種各樣項目正在進一步積累關于學習者的數據,這些包括連接系統,負責記錄物理的和虛擬的課程作業提交情況、自動獲取考勤數據和反饋意見、電子資料等。這在未來會起到很大的作用。

諾丁漢特倫特大學未來計劃將更多的數據提交到學生自己手中,這樣,學生就可以自主管理學習行為,同時,學校會為其開發一個手機界面。
之前,諾丁漢特倫特大學的數據資源主要來自于學生信息系統、圖書館系統、智能卡和評估系統等。并為指導老師開發了一個儀表板,用于與學生討論表現情況。系統從七個來源獲取數據,使用關于課程考勤情況、資源使用情況、評估意見書、圖書館借貸情況、刷卡情況和學業歷史等的數據來計算出席率。
目前,該模式沒有明顯弊端,學校希望以一種對教職員和學生來說都更富有激勵性的方式來指導學校生活,所以校方希望日后數據能夠提交到學生自己手中。
(翻譯:盛開 整理:高錦)