摘要:隨著學校信息化建設水平的不斷提升,校園網內大量的數據信息不停地產生并囤積在服務器中。如何從這些數據里提取出有用的知識,已經成為計算機技術研究的熱門課題。
關鍵詞:校園網日志 研究 計算機
中圖分類號:TP11.5 文獻標識碼:A 文章編號:1674-098X(2013)02(a)-0025-01
1 校園網日志挖掘平臺研究目的及意義
目前大部分學校的日志信息僅儲存后用作突發事件取證留檔,沒有對其進行進一步的分析研究,信息管理人員認為此類數據信息一旦超過有效期(如3個月)就沒有任何意義,可以進行刪除用來回收存儲空間。其實海量歷史數據中就包括了校園網絡使用日志,日志內容涉及用戶使用網絡的各個方面,包含時間、人員、目的、方法等,為數據挖掘工作提供了堅實的基礎。通過校園網日志挖掘平臺能夠回答管理者最關心的問題:不同的用戶分別在瀏覽什么網站,關心什么問題;校園網各個頁面之間訪問關聯關系、頻率、流量等。通過挖掘研究,能夠得到用戶的使用頻率、使用目的、使用方法等,對網絡調整及規劃具有一定的輔助決策作用。校園網日志較普通網絡日志有較為明顯優勢:在有設備支持的情況下,可以根據用戶使用IP查詢到用戶基本對應關系(如學/工號),大大提高了在數據挖掘算法在用戶識別環節的分析能力。以上海大學校園網為例,系統通過自行開發的IP地址管理程序以及網絡出口審計程序,能夠基本準確的匹配到使用用戶……