趙丹 趙文廣
近年來信息技術的高速發(fā)展引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長,國家對此高度重視,教育部在近年來的《教育信息化工作要點》中也屢屢提到大數(shù)據(jù)應用?;诖说难芯吭絹碓蕉?。為順應時代發(fā)展,本文嘗試采集校園網(wǎng)用戶上網(wǎng)行為大數(shù)據(jù),對其進行分析,量化其行為規(guī)律。此類研究主要有:分析校園網(wǎng)用戶行為,用來合理分配帶寬。分析上網(wǎng)時長、上網(wǎng)內容與學習成績之間的關系。存在的問題主要有:數(shù)據(jù)量較小,整理篩選后的樣本用戶不足萬人,分析維度單一。本文亮點在于:數(shù)據(jù)量大,采集了十幾萬人的上網(wǎng)行為數(shù)據(jù);采用多維度分類法進行了較為細致的分析,總結出了校園網(wǎng)用戶行為的某些規(guī)律。
筆者采集了基于校園網(wǎng)的用戶上網(wǎng)行為大數(shù)據(jù),并對其進行清洗、篩選,多維度分類統(tǒng)計與分析,總結出了各類校園網(wǎng)用戶的行為規(guī)律。以便相關部門依托這些數(shù)據(jù)、規(guī)律整合流程,更好的形成創(chuàng)新性的服務體驗,同時也能通過數(shù)據(jù)化的管理實現(xiàn)個性化服務的精準推送。
系統(tǒng)包括:數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析。采集的數(shù)據(jù)包括:上下線時間、時長、流量、IP等。
(一)系統(tǒng)總體介紹
以某校為例,校園網(wǎng)包括有線網(wǎng)與無線網(wǎng)。其中有線網(wǎng)交換機近千臺,無線網(wǎng)AP幾千個,基本覆蓋所有教學、辦公、宿舍等區(qū)域。所有用戶必須登錄計費系統(tǒng)認證之后才能訪問外網(wǎng)?;谛@網(wǎng)的用戶上網(wǎng)行為數(shù)據(jù)分析系統(tǒng)拓撲結構如圖1所示?!?br>