王軍 孫蓓


摘? 要:隨著高職院校數字化建設的快速推進,校園一卡通系統成為高職基礎數據建設的方向,也是搜集學生行為與消費狀況的重要手段。當前多數學生利用校園一卡通服務平臺,開展校內外的餐飲、出行或其他消費行為,從而完成大數據與學生行為管理之間的深度對接。本文以Hadoop開源平臺架構為基礎,建立高職學生行為分析及預警管理系統,對學生的日常消費行為進行預測與管理,以實現學生信息管理的數字化、安全化。
關鍵詞:大數據;高職學生;行為分析;預警機制
中圖分類號:TP393.18? ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)08-0013-03
Abstract:With the rapid advancement of digital construction in higher vocational colleges,the campus card system has become the direction of the construction of high-level basic data,and is also an important means of collecting student behavior and consumption. At present,most students use the campus card service platform to carry out catering,travel or other consumer behaviors inside and outside the school,thus completing the deep connection between big data and student behavior management. Based on the Hadoop open source platform architecture,this paper establishes a behavioral analysis and early warning management system for vocational students to predict and manage students’ daily consumption behaviors,so as to realize the digitization and security of student information management.
Keywords:big data;vocational students;behavior analysis;early warning mechanism
0? 引? 言
大數據作為一項海量數據存儲與計算技術,開始廣泛應用于高職院校的教學與行政管理中,校園一卡通即為高職院校信息管理系統的組成部分。校園信息管理系統采用Hadoop分布式任務調度模式,從多個節點獲取需要處理的數據內容,并將其分配到不同的虛擬機平臺,來實現對海量數據的并行處理與存儲。通過將Hadoop大數據框架管理模式,引入到一卡通管理系統中,能完成對學生日常行為與消費的安全管控。
1? 高職學生日常行為的價值及大數據組織架構分析
1.1? 高職學生行為及校園一卡通消費數據的價值
在我國高職院校智慧化校園建設的前提下,學校的日常教學活動、行政管理活動,都將與校園一卡通系統進行關聯,并在短時間內生成大量的結構化數據。這些數據主要由教師、學生、教職工等的行為活動而產生,包括教學、學習、飲食、出行或其他消費數據,學校領導或教師等主體可以登錄網絡客戶端,查詢自身或其他人的參與教學、學習、公益活動等行為,還可以對自我的行為狀態或工作價值進行評估。基于此可以看出,在高職院校校園一卡通系統建設的過程中,對學生的行為及消費數據進行搜集,可以充分掌握學生在某一時間段的學習、生活狀況,并據此制定相應的學生管理策略。
學校領導可以通過“校園一卡通”終端管理系統,對教育基礎設施數據、行政管理數據、教學與管理資源數據、教師學生的行為數據等,進行分層與分步驟管理。針對高職院校課程教學、日常生活等場景,構建學生行為分析模型,對學生的上課遲到、早退、曠課,以及學生宿舍出入、大門出入與消費狀況進行記錄,并上傳至校園一卡通數據管理及預警系統。然后由校園管理者、輔導員等根據預警信息,對學生的學習、生活與消費情況作出評價,從而真正做到學生行為評價的數字化、公正化。
1.2? 學生行為分析及預警系統的Hadoop平臺架構
Hadoop分布式系統基礎架構,是由Google公司開發的分布式文件處理與存儲系統,其能夠利用較為低廉的硬件,來完成海量數據的訪問、處理與存儲。當前高職院校使用的Hadoop平臺組織架構,通常是以映射、歸約的方式進行兩組數據的映射操作,并將已經完成映射的數據進行歸約操作。利用Apache Hadoop大數據框架,開展海量數據的任務調度與處理的過程中,分布式文件系統會將不同的數據內容,主動分配至不同的主節點、從節點,主節點會優先對提交的用戶數據進行執行,從節點在數據處理過程中遵從“就近原則”,最終完成所有數據命令或指令的操作執行。利用Hadoop分布式系統進行數據計算,能夠實現整個終端管理內部的負載均衡,并有效保證批量數據處理、存儲與管理的高效率化。Apache Hadoop平臺的基本組織架構如圖1所示。
對于高職學生日常消費情況,以及學習、生活行為的分析與管理,可以借助于Hadoop分布式大數據系統,主動對學生日常行為的數據進行搜集,并據此作出行政事務、教育教學等方面管理模式的創新。通過將學生日常行為、學習情況的數據信息,上傳至Apache Hadoop大數據分布式系統,能夠完成對海量數據的分類與分析,并將最終的預測結果交由管理部門、教師等進行處理,然后制定出對學生心理輔導、網絡消費行為管理的策略,從而有效防范學生日常學習、生活與消費的潛在風險。
2? 大數據環境下高職學生行為分析的數據采集及預測模型
2.1? 高職學生日常行為分析、消費狀況的數據采集
當前高職學生校園行為、消費狀況等數據的采集,主要通過校園一卡通系統、云化ETL工具、網絡爬蟲等,進行結構化數據、非結構化數據的搜集操作。以智慧校園系統為例,校園一卡通系統中的學生數據,包括學生在不同時間、不同地點的學習、生活或消費數據。從校園一卡通網絡監控平臺中,獲取到存在關聯性的海量數據后,要利用決策樹、交叉表格等方式,對數據進行分類與預處理,將其存儲到HDFS分布式系統之中,以保證原始數據、關系型數據庫之間的靈活轉換。之后使用Scala語言交互命令,對不同數據信息進行類似分組的聚類分析,最后運用Hadoop系統對數據進行分布式處理與存儲。
而以云化ETL工具、網絡爬蟲等為主的數據采集,是針對那些碎片化的非結構數據,借助于多個網絡數據采集平臺,使用網絡爬蟲、云化ETL、流數據處理(FoxTable)等工具,進行網頁數據信息的抓取與采集。因此可得出,多種校園信息系統對高職學生行為的分析,通常涵蓋數據分類、特征分析、關聯性分析與異常分析等,教師在掌握學生日常學習、生活狀態的情況下,就能夠對其后續的消費行為作出預測與管理。
2.2? 高職學生行為分析、消費數據的預測模型
高職管理部門對學生校園行為、消費數據等的分析,需要根據搜集到的學生行為軌跡、學習情況、消費與課下活動數據,來對學生精神狀況、心理健康等進行了解,從而實現學生個性喜好、心理狀態與生活習慣的深入剖析。在高職學生行為分析預測模型建立的過程中,應先對不同系統模塊的權重、分級指標進行設置,通常該預測模型包括數據感知層、分布式數據分析層、數據交互服務層、數據可視化層等層次,不同層級中存在著不同的功能與服務項目。
圖2? 高職學生行為分析、消費數據的預測模型
首先數據感知層為預測模型的最底層,主要負責對學生一卡通數據、上課考勤數據進行采集。其次,分布式數據分析層為數據處理、存儲層,負責海量數據信息的分布式處理與存儲。之后數據交互服務層,通常負責學生行為數據的分析與結果預測,包括對學生行為特征、學習與消費情況的預測,通過對學生學習狀況、人際交往、行動軌跡與消費等數據的分析,能夠作為后續學生行為管理的參考內容。而數據可視化層是將整理好的預測模型,由Web可視化展示平臺進行展示,以方便管理人員動態掌握學生的行為數據,具體模型如圖2所示。
3? 大數據環境下高職學生行為分析的預警管理機制研究
高職學生行為分析的預警平臺,是以大數據云計算為基礎的數據管控系統,其主要包含數據資源層、數據處理層、應用層等三個層級,不同層次又涵蓋一系列的硬件設備與軟件,多種設備組件之間的關聯作用,可以實現對半結構化、非結構化數據的搜集與處理。
第一,數據資源層作為預警平臺的最底層,主要用于搜集校園一卡通、教務系統與網絡文檔等方面的數據,在學生學習、日常行為軌跡等數據批量化采集完成后,將這些數據交由數據處理與存儲層進行管理。
第二,數據處理層中包含Hadoop平臺、主數據倉庫、分布式數據庫等構件,不同組成部分分別負責數據的分類整理、處理與存儲。
第三,應用層是包含一系列數據挖掘、分析組件的層級,是由FTP、SQL、API、WS、MDX等組件組成的預警平臺,通常負責對海量數據的進行實時監測、智能預警,并將最終的數據預警結果在數據報表中公布,具體如圖3所示。
根據以上學生校園行為管理系統可以看出,大數據校園管理系統是以基礎大數據網絡平臺Hadoop為構架,搭建起的元數據資源管理模型。該模型中包含基礎運行環境、數據采集模塊、關聯性數據運算與存儲模塊,以及數據分析挖掘模塊、智能預警與調度管理模塊,多個模塊之間的共同作用,可以完成對校園一卡通數據、第三方數據的搜集與轉化。之后將學生課堂考勤、學習成績、校園網絡接入、圖書借閱或消費等數據,轉化為元數據資源,交由數據存儲平臺進行數據明細的記錄、匯總與存儲,并上傳至綜合分析挖掘平臺、智能預警平臺,以完成對學生的日常行為、消費數據的分析與預警。最后,高職學生行為分析預警系統的應用層,負責將學生多方面行為數據進行挖掘與融合,整理出可視化的數據報表或模型,方便管理人員對相應指標的監測、預警與管理。通過在校園一卡通消費數據分析中,使用元數據管理、數據處理、綜合分析與挖掘、安全預警與監控等管理流程,可以對學生未來行為的發展做出預判。
4? 結? 論
大數據云計算作為互聯網前沿技術,可以廣泛應用到智能網絡生態系統的建設中,并實現對海量數據信息資源的安全處理與管理。高職學生校園行為分析與預警機制的建設,也要借助于Hadoop大數據網絡框架,進行數據采集、處理與存儲模塊的構建,然后對得到的校園一卡通數據信息進行綜合挖掘與分析,才能完成學生日常學習、生活及消費行為的智能預警,并提出相應的管理策略對其作出安全管理與控制。
參考文獻:
[1] 劉少偉,趙長在,雷少飛.基于數據分析的學習者在線學習行為研究 [J].中國成人教育,2016(23):11-14.
[2] 李超,程罡,石磊.基于層次分析法的在線學習行為指標體系構建 [J].河北廣播電視大學學報,2017,22(2):18-21.
[3] 李海洋,吳學琴.信息化背景下大學生網絡學習行為實證研究 [J].重慶科技學院學報(社會科學版),2017(12):117-120+136.
[4] 姜強,趙蔚,王朋嬌,等.基于大數據的個性化自適應在線學習分析模型及實現 [J].中國電化教育,2015(1):85-92.
作者簡介:王軍(1981-),男,漢族,江蘇南通人,高級工程師,碩士,研究方向:大數據、網絡;孫蓓(1983-),女,漢族,江蘇南通人,助理研究員,碩士,研究方向:學生行為分析、學籍管理。