張建英
(河南科技職業大學 河南 周口 466000)
新時代社會互聯網技術的不斷進步,大數據應用越來越廣泛。計算機可以通過編程算法的運行實現代替人腦對事物進行識別分類。智能識別系統是基于對大量數據的處理學習,類似人為經驗總結的機器學習系統,更多的是平臺大數據進行統計分析并分類學習。本文對大學生網絡行為數據進行識別系統研究,由于大學生網絡行為相關管理制度和途徑不完善,這就要求對大學生的網絡行為進行分析,希望能夠通過信息管理系統分析研究,正確指引大學生網絡行為習慣,在大數據背景下促進大學生網絡行為更加有利于學習教育和自身的健康發展。
大數據技術應用產生于互聯網技術的進步[1]。近年來,隨著大數據技術平臺的不斷完善以及國家通信基礎設施的不斷完備,“互聯網+”智慧生活的智能終端設備走進生活,推動了大數據時代的到來。在此背景下,為了保證網絡環境的計量監管信息的安全,需要對網絡行為進行合理監管。各個行業的網絡行為數據都具有行為推動作用,出于對網絡行為的管理需要,對網絡行為使用數據的分析并進行可視化的操作,評估預判下一行為的趨勢,提高網絡行為效率,降低網絡行為錯誤風險是研究熱點。網絡用戶的大數據,通常是通過統計軟件進行海量信息統計存儲,利用分析軟件進行大數據處理分析,對足夠大的數據進行算法學習,可以超越原有數據庫架構[2]。與此同時,伴隨大數據技術的進步,實現傳統信息采集方式無法完成的快速提取、識別、管理和服務的數據采集。大數據技術是人類歷史進步標志性的時代產物,讓大數據技術發揮管理和分析使得技術實現最大社會效益,合理使用大數據技術能夠對大學生網絡行為管理產生指導價值,進而對獲取大學生網絡行為數據為高等教育的管理政策合理化更新提供科學參考。
大數據技術作為當下數據分析領域的主要技術,基于大學生網絡行為數據進行大數據處理分析,計算機通過數據算法學習,數據分析結果更具準確性和針對性[3]。通常高校大學生網絡行為管理方式是通過對調研結果進行記錄分析。管理分析的人確定調研樣本對象,對上網時間、上網地點、上網方式、網絡功能內容以及大學生生活對網絡的依賴性進行調研統計。這種方式調研結果的時效性、真實性都是不夠的,而利用大數據技術可以跨過人為觀察和回答,直接通過網絡終端后臺網絡數據進行全量采集、實時統計。大學生在進行網絡行為的同時就可以產生行為數據并記錄保存,然后對存儲的網絡行為數據進行分析評估。
大學生的網絡行為大致可以分為4個板塊,學習、娛樂、社交和消費,見圖1。

圖1 大學生網絡行為
每一個行為板塊都有對應的行為目的,網絡學習是為了信息獲取,網絡娛樂通常進行游戲影視等,網絡社交是大學生業余交流互動的主要方式,網絡消費是為了提高生活內容品質。明確大學生的網絡行為目的,就得細分大學生的網絡功能實現使用工具,例如網絡學習是在中國知網還是萬方數據查找資料等,通過大數據明確大學生的網絡行為具體內容。
大數據的技術架構主要是通過數據分布計算處理分析,數據分布得越精細,網絡數據延時越低[4]。大數據主要利用堆棧技術,通常有基礎、管理、分析和應用4層[5]。作為架構的最底層基礎層主要是用來對網絡行為數據進行采集和實時跟蹤。架構的第2層管理層,其作用是對采集的網絡行為數據進行隨機提取、信息轉化和系統數據裝載,這一層的存儲管理計算可以為后期的數據智能化提供保障。第3層分析層就是將數據信息智能化,通過算法挖掘分析,可以得出大學生網絡行為習慣的潛在規律,為大學生行為管理方式提供依據。最后的應用層是對大數據分析結果做出決策判斷,達到系統服務用戶的作用。
在大學生網絡行為的分析模型客戶端層面,用戶的功能以學校校園網絡為數據收集范圍。由于在校大學生上網是通過校園服務器外接,因此學生賬戶信息可以作為個人信息采集接口。大學生上網的網絡行為數據可以實時記錄,將行為數據根據網絡學習、網絡娛樂、網絡社交、網絡消費分類保存。結合學校網絡行為管理考察標準,對學生的網絡行為進行評估。評估有個人評估和總體評估,個人評估就是對系統識別的網絡行為進行規范指導,總體評估是對校網學生的網絡行為進行總結,以可視化的方式反饋給在校師生。
互聯網的發展使得各類信息實現網絡傳送,大學生是網絡用戶中最為活躍的群體之一,所以大學生網絡行為如何有效管理問題,如何處理大學生網絡行為數據變得尤為重要。大學生網絡行為的傳統調研方式缺乏時效性和準確性,隨著大數據時代的到來,使得大學生行為數據可以可視化呈現,大數據技術的核心作用是展現數據的現實應用價值,而計算機對數據算法學習是其核心技術[4]。系統通過對大量網絡行為數據進行處理分析,使得網絡行為管理更加精準化、人性化。
將采集到的大學生網絡行為數據以分布式文件的形式保存在HDFS系統中,通過映射和歸約的方式對數據做計算處理,基于算法通過Hadoop進行數據計算訓練,生成大學生網絡行為數據模型,最后將模型可視化提供給客戶端。系統流程圖見圖2。

圖2 系統流程圖
模型的基礎層。該層主要功能是用Python、數據采集平臺等對網絡行為數據進行采集和實時跟蹤,并且根據HDFS系統進行分步式保存。
模型的管理層。該層主要功能是對采集的網絡行為數據進行隨機提取、信息轉化和系統數據裝載。通過映射歸約批量處理網絡行為數據,極大方便了對分布式存儲的數據程序編寫,通過系統實現指定映射函數和歸約函數進行大量數據計算,可以為后期的數據信息挖掘提供保障。
模型的分析層。該層主要功能是將數據信息智能化,通過Hadoop中實現算法,對數據進行模型訓練挖掘分析,可以得出大學生網絡行為習慣的潛在規律,為大學生行為管理方式提供依據。
模型的應用層。該層主要功能是對大數據分析結果做出決策判斷,達到系統服務用戶的作用。
此系統主要是分析大學生網絡行為識別問題,其主要目標是對大量大學生上網產生的網絡行為數據進行處理。所選擇的網絡行為數據是多類信息的存儲模塊,模塊數據的文件需要進行結點處理,效率低下[3]。為了克服該數據處理問題,根據映射歸約機制,采取對數據不切片的方式,使存儲的數據設計統一,提升系統的數據處理性能。
系統運行環境是檢驗系統的重要階段,運行系統的環境能力對測試結果具有很大的影響。測試環境選用合適的客戶機和服務器。功能測試應當對系統的每一層進行分步測試,為用戶提供合格的系統服務。測試結果的評估按照需求分析進行功能評估。
大學生網絡行為識別系統可以實現大學生網絡行為數據通過大數據技術進行潛在行為規律可視化,將網絡行為展開成詳細和具體的數據模型進行分析。在實際的高校網絡行為管理中,可以將大數據識別大學生網絡行為這一技術充分利用起來,使得大數據技術規范約束好學生的網絡行為習慣。在對大學生網絡行為數據的采集整理分析過程中,不僅能夠有效管控學生的網絡行為,了解學生的網絡功能使用的喜好和關注內容,同時在分配學校網絡資源時也可以根據大數據分析結果對學生提供個性化網絡內容服務[4-5]。將系統識別分析結果反饋給學生個人,成為自適應學習工具,彌補傳統學習方式存在的盲目性,投其所好提高學習積極性,使得學生在高校得到更好的學習成長。
綜上所述,本研究建立大學生網絡行為識別系統是為了對大學生網絡行為的學習、娛樂、社交和消費進行分析、歸納,構建有效可行的指導、監督、信息反饋運行機制,使得大學生網絡行為管理變得越來越高效。同時,也可以為我國高校管理部門和教育部門提供參考,促進高校教學方式優化升級。