施喜平 李家坤
(長江工程職業技術學院 湖北省武漢市 430212)
隨著云計算、大數據在高職院校校園管理過程中的應用,高職校園數字化建設進入到一個全新的階段。隨著我國高等教育事業的快速發展,高職院校招生方式的多樣化,逐漸形成高職院校學生特點的多樣化。大數據的引入使用,必將對高職教育在人才培養模式、課程模式、教學模式、評價體系等等方面帶來一系列的變革。
當前我國高等職業教育事業的快速發展,高職院校招生方式的多樣化,逐漸形成高職院校學生特點的多樣化。高職教育主要是培養技術型、應用型的高級專業人才,同普通高等教育相比,高職教育在人才培養模式、課程模式、教學模式、評價體系等等方面進行了一系列的變革。隨著云計算、大數據的應用,高職教育進入的一個全新的階段,如何應用大數據來進行教學行為,進而指導學生的學習行為。大數據背景下傳統的課堂教學模式、教學評價等早已不能滿足當前高職課堂教學的需要,因此各高職院校都加入了智慧校園建設中。
當前智慧校園建設大數據挖掘方法包括:數據分類、數據聚類分析、數據關聯分析、挖掘大數據算法優化、可視化技術五類。
(1)數據分類的目的是分析輸入數據,通過分析集中的數據表現出來的特性,為每一個類找到一種準確描述或者模型,這種描述常常用謂詞來表示。由此生成的類描述用來對未來的測試數據進行分類。盡管這些未來測試數據的類標簽是未知的,仍可以由此預測這些新數據所屬的類。也可以由此對數據中每一個類有更好的理解。
(2)“物以類聚,人以群分”,數據聚類(Clustering)是人類認識世界的一種重要方法。所謂聚類就是按照事物的某些屬性,把事物聚集成簇,使簇內的對象之間具有較高的相似性,而不同簇的對象之間的相似程度較差。
(3)數據關聯規則是一種描述性的而非預測性的方法,經常用于發現隱藏在大型數據集背后的,項集之間的有趣關聯或相互關系。20 世紀60年代,Hajek 等人在早期研究中介紹了許多關聯規則學習的關鍵概念和方法,但是主要關注的是數學表達,而不是算法。20 世紀90年代初,IBM 公司Almaden 研究中心的Agrawal 等人將關聯規則學習架構引入數據庫社區。
(4)挖掘大數據算法優化。
1.分類算法:在MapReduce 框架下,一個任務通常會被分為兩個階段:Map 階段和Reduce 階段,且所有的操作都是基于(key,value)鍵值對的。圖1 為MapReduce 任務工作過程。

圖1: MapReduce 任務工作過程

圖2:FeedBackSVM 流程圖

圖3:貧困生補助系統數據流程圖

圖4:教務系統教學過程數據流程圖

圖5:某課程的網絡教學資源學生訪問情況統計餅圖
2.反饋式并行支持向量機算法實現。反饋式并行支持向量機就是將原始訓練數據集分塊,通過并行訓練子樣本集加速全局支持向量的訓練速度,通過反饋,將本次迭代的結果返回初始分類器進行調整和更新,從而進一步提高分類準確率。改善目前高職學生在課堂中缺乏運用解決問題策略所需的復雜情境;教師課堂以項目教學式為主,但高職學生在各環節學習過程中缺乏主動參與性,更缺乏批判性學習思維,造成不少學生的學習情況和效果呈現出低水平認知活動。
基于這些原因,我們提出在校園大數據的挖掘優化算法中,設計和實現基于MapReduce 編程框架的反饋式并行支持向量機時,加強重視數據集的劃分和如何迭代這兩個問題。圖2 給出了FeedBackSVM 流程圖。
網絡數據中最重要的是安全問題。校園信息安全,首要的是解決校園大數據產生的網絡安全問題,在大數據算法優化中最著名的當屬Apriori 算法。我們的大數據已經從簡單的處理對象開始轉變為一種基礎性資源,確保這一校園基礎性資源的安全,是我們選擇校園大數據處理方式首要考慮的問題。Apriori 算法目前廣泛應用于網絡安全領域,比如網絡入侵檢測技術中。網絡系統早期都收集審計信息來建立跟蹤檔,但是早些年網絡審計跟蹤的目的多是為了性能測試或計費,因此對網絡惡意信息攻擊檢測提供的有用信息有限。而Apriori 算法通過模式的學習和訓練可以發現網絡用戶的異常行為模式。
因此,當前Apriori 算法廣泛應用于高職院校信息管理數據庫中。隨著高職院校學生來源的多樣化,學校管理部門在教學工作、學工工作、學生資助專項工作難度、學生學籍管理工作等各項工作中采集的信息量和處理信息量也劇增。
例一:以學工系統其中一個功能為例,Apriori 算法加入在學工貧困生補助系統中,其運行過程如圖3 所示。通過學生一卡通校園消費來精準及時后,貧困生補助系統會自動發放生活補助金幫扶貧困生。
例二:以學校教務系統其中一個功能為例,Apriori 算法加入在課堂教學師生互動系統動態數據中,其運行過程如圖4 所示。可以捕捉到課堂教學中有效的教與學的數據,從而優化課堂管理,完善師生評價體系。
(5)可視化技術。數據可視化是通過借助于圖形化手段,清晰有效地傳達與溝通信息。
數據:解決數據的采集,清理,預處理,分析,挖掘。
圖形:對光學圖像進行接收、提取信息、加工變換、模式識別及存儲顯示。
可視化:數據與圖形間的交互處理。
數據可視化分為以下五個層面:
①數據統計圖表化階段:表達收集數據結果。
②數據結果展示:集成了大量的圖形、可視化算法,降低復雜的圖表的成本。
③數據分析過程可視化:對數據的分析過程進行可視化,更好的探索規律、查找問題。
④VR/AR 階段的虛擬現實的可視化:虛擬現實提升概率思維、多維數據的可視化、高密度信息的展示、以及提供情境使人們更全面地理解問題。
⑤人工智能:人和數據的連接方式。篩選大數據隱含的規律,產生指導性結論。
因可視化技術具有參與感知,群體感知和移動感知計算,目前被廣泛應用于新一代人工智能領域中。
大數據可視化工具有很多種,從大部分教育工作者熟知的角度來說,常見的、便于使用的數據可視化工具,如Excel、Processing 等。其中Excel 是Microsoft Office 中的一款電子表格軟件。該軟件通過工作簿(電子表格集合)來存儲數據和分析數據。Excel 可生成諸如規劃、財務等數據分析模型,并支持編寫公式來處理數據和通過各類圖表來顯示數據。在Excel2016 后,更是有內置Power Query插件、管理數據模型、預測工作表、Power Privot、Power View 和 Power Map 等數據查詢分析工具。使用者對Excel 也比較容易上手操作。
例三:對于校園教務系統中的教學資料來說,學生每天的訪問都會產生非常龐大的數據,如果能夠對這些數據做到合理的利用,就可以針對學生的訪問形式,制作更有針對性、更易于學生課余學習的教學資源。可視化技術在智慧校園教務系統中一個應用如圖5所示。
智慧校園幫助高職院校教育工作者全面掌握、公平的評價學生的各項學習行為,從而更好的為學生服務,使教與學達到良好的促進關系。
綜上,智慧校園建設過程中的大數據挖掘過程中,面臨的問題也是顯而易見。由于技術應用限制、數據專業人才缺乏以及倫理道德與隱私安全風險等方面造成的挑戰,需要更多技術層面的應對措施,來確保大數據時代高校的智慧校園的,使得校園內的各種設施都和信息技術建立聯系,方便學生的生活和學習,加強校園的安全保護,更便于對學生的健康管理。讓高職院校的學生有自信、有能力的從校園走向各技能型工作崗位,是高職院校智慧校園建設的最終目的。