李書欽,史運濤,馬時來,李琳
(北方工業大學信息中心,北京 100144)
隨著大數據技術的日益完善,用大數據促進教育信息化已成為廣泛共識,近年來,國家陸續出臺了《促進大數據發展行動綱要(2015)》、《教育信息化“十三五”規劃(2016)》、《2016教育信息化工作要點》等文件,明確提出利用大數據技術加快教育信息化的發展步伐,建立“用數據說話、用數據決策、用數據管理、用數據創新”的管理機制,實現基于數據的科學決策[1]。
高校信息化建設經過了基礎設施建設階段、數字化校園建設階段,正在朝著“環境全面感知、網絡無縫互通、海量數據支撐、師生個性服務”的智慧校園階段邁進[2],如何利用已有業務系統(教務、科研、人事、財務、卡務、網絡)的結構化數據和非結構化數據(無線網絡日志),進行數據加工和大數據分析,實現學生行為分析、學生畫像、學生異常狀態預警等功能,全面掌握學生情況,以便及時、準確地應對突發事件與公共危機;及早識別學業預警、心理異常、沉迷游戲的學生,提升學生素質;對發展態勢做出準確預測和判斷,提前預警、及時干預、消除隱患,等等,顯得尤為重要[3]。因此,擬結合大數據和無線網絡技術,研究校園智慧決策系統相關技術和實現方法,為學校領導、管理部門等提供科學決策和智慧決策。
北方工業大學無線網絡服務于全校學生和教職工,約13000多人,截至2018年6月,共部署無線AP點位3780個,最大同時接入終端總數超過7000個,無線網絡流量峰值超過2GBps。目前,北方工業大學數字化校園建設和信息化建設都比較完善,包括一卡通系統、教務系統、OA辦公系統、網絡教學平臺、圖書館管理系統、人事系統、科研管理系統、上網認證系統、資產管理系統、數據交換平臺、財務系統等,并且學校已對部分業務系統數據進行了整理及標準化。
北方工業大學積累了海量的教育數據,即學生服務類數據、學校管理類、教學類以及設備類的數據都比較豐富。但是學校還未有效利用相關數據進行挖掘分析,為學校展示學生、教師以及資產的相關信息。另外,校領導無法及時掌握學校業務數據、學生管理數據,這就需要建立各類預警模型,例如針對學生、教師信息呈現,促進學校教學、科研提升、校園管理等。因此擬通過建設全量及增量原始大數據倉庫,并針對數據源進行標準化和建模清洗,構建服務學生、教師和領導的校園智慧決策系統。
本研究擬利用無線網絡和各業務系統(教務、科研、人事、財務、卡務、網絡)的結構化數據和非結構化數據(無線網絡日志),進行數據整合、數學建模分析,對學生狀態、學生異常行為等做出準確預判或預測,為校領導和管理部門等提供詳盡的數據支撐和科學決策。
首先,利用教室、圖書館、餐廳、宿舍內安裝的校園無線,從無線AP獲取學生的在線用戶信息,包括上網賬號、上網IP、MAC地址等結構化數據,進行數據分析,確定學生軌跡,進行上網行為分析、逃課行為分析、課堂出勤分析和疑似失聯預警等預測預警。其次,利用各業務系統(教務、科研、人事、財務、卡務、網絡)的結構化數據,進行數據整合、數據建模和統計分析,對學校輿情、學業預警、沉迷游戲、疑似貧困學生、教師畫像等做多維呈現和準確預測預判。最后,結合上述分析預測結果,開發領導駕駛艙,將領導關注的板塊進行展現,為領導和管理部門提供全方位的科學決策和智慧決策。
我校無線AP包括華為和思科2個品牌,在無線AC上可以實時獲取每個AP的在線用戶信息,如圖1所示。無線AP的在線用戶信息包括用戶名、接入終端MAC地址,接入IP地址和接入AP名稱,輸入某個無線AP,可以直接查找該AP的在線用戶信息。目前,華為和思科的無線AC均提供第三方接口,可以供用戶直接調用,獲取無線AP的實時在線用戶信息。
我校信息門戶和數據中心已經建設完成,信息門戶已經集成了包括一卡通系統、教務系統、OA辦公系統、網絡教學平臺、圖書館管理系統、人事系統、科研管理系統、上網認證系統、資產管理系統、數據交換平臺、財務系統等,而且大部分業務系統已經建設多年。目前,學校已經對部分數據進行了整理及標準化,積累了海量的教育數據,即學生服務類數據、學校管理類、教學類以及設備類的數據都比較豐富。
對各業務系統結構化數據進行數據清洗及標準化處理,如認證計費系統、互聯網絡數據等海量分散數據進行清洗預處理,并分析適配,形成數據分析表、入庫存儲,對傳統的關系型數據庫,也包括XML等半結構化數據,以及以視頻、音頻、文本和其他形式存在的非結構化數據,將如殘缺數據、錯誤數據和重復數據進行處理,把結果集入庫,并記錄清洗結果,形成標準化數據庫倉庫,最后通過建模分析,針對模型建立模型分析主題數據倉庫。

圖1 無線AP在線用戶信息
在獲取結構化數據和非結構化數據后,需要對建立的數據倉庫進行數據整合,并采用建模和統計分析等算法進行數據分析,例如關聯和推薦、深度機器學習、統計、分類、聚類、回歸、貝葉斯等算法[4,5]。下面以學業預警預測模塊為例,分別使用回歸算法、貝葉斯方法、人工神經網絡等3種不同的預測算法,進行1萬次以上的機器訓練,得出學業預警預測準確率如表1所示(僅列出8次結果),可以看出人工神經網絡算法的準確率明顯高于回歸算法與貝葉斯方法。

表1 學業預測預警模塊不同算法預測準確率對比分析
基于大數據和無線網絡的校園智慧決策系統包含學生行為分析、學生畫像、學生異常狀態預警等功能,下面以學生行為軌跡分析模塊為例,闡述結合大數據和無線網絡的具體實現方法。通過校園無線獲取終端用戶的MAC地址,與計費認證系統結合獲取終端用戶賬號,然后與校內地圖結合,實現對校內人員行為軌跡分析,實現終端軌跡定位和用戶信息分步定位,追蹤各師生在校園的Wi-Fi軌跡情況,以及全校的行為軌跡分析地圖,同時實時監控校園的人員分布和流向。經過大數據分析,可預測未來24小時內的人流密集程度,以便于及時發現潛在的風險與問題,校園智慧決策系統軌跡分析模塊運行效果如圖2所示。

圖2 校園智慧決策系統軌跡分析模塊運行效果
隨著高等教育事業快速發展,各高校的日常管理工作變得更加繁重,針對學校管理中面臨的綜合管理難度大、學生管理問題多、信息孤島、學校對學生感知不全面等問題,本著“用數據說話、用數據決策、用數據管理、用數據創新”實現基于數據的科學決策為根本目的[6],本研究結合大數據和無線網絡技術,研究校園智慧決策系統,實現學生生活行為和學習行為等的智能管理和智慧決策,為領導決策等提供數據支撐和可視化參考。
基于大數據和無線網絡的校園智慧決策系統,不僅能進一步提升我校日常管理的科學化水平,達到科學決策、智慧決策的目標,還可以對發展態勢做出準確預測和判斷,提前預警、及時干預、消除隱患,將有效減少和化解學校管理中的風險點。