潘竹虹,許卓斌
(廈門大學(xué)信息與網(wǎng)絡(luò)中心,福建廈門361005)
信息采集網(wǎng)絡(luò)支撐系統(tǒng)的設(shè)計與實(shí)現(xiàn)
潘竹虹*,許卓斌
(廈門大學(xué)信息與網(wǎng)絡(luò)中心,福建廈門361005)
摘要:基于網(wǎng)絡(luò)數(shù)據(jù)幀轉(zhuǎn)發(fā)原理,提出了一種端口鏡像設(shè)計方法,并實(shí)際部署了一個獨(dú)立于生產(chǎn)網(wǎng)絡(luò)的、可精確篩選的、多輸出的網(wǎng)絡(luò)流量鏡像系統(tǒng),為廈門大學(xué)多套網(wǎng)絡(luò)信息采集分析系統(tǒng)提供網(wǎng)絡(luò)支撐.
關(guān)鍵詞:網(wǎng)絡(luò)安全;信息采集;端口鏡像
隨著信息技術(shù)的不斷發(fā)展,校園網(wǎng)內(nèi)網(wǎng)絡(luò)信息采集的需求大量增加.流量監(jiān)控、入侵檢測、上網(wǎng)行為日志審計、輿情監(jiān)控等信息安全管理,圖書館數(shù)據(jù)庫熱度分析、數(shù)字資源偏好分析等用戶行為分析系統(tǒng),以及內(nèi)容分發(fā)網(wǎng)絡(luò)(content delivery network, CDN)、Cache等網(wǎng)絡(luò)加速系統(tǒng)等,都需要對相應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)信息采集.
大部分網(wǎng)絡(luò)信息采集系統(tǒng)僅關(guān)心網(wǎng)絡(luò)數(shù)據(jù)流中的部分信息,但當(dāng)前的常見網(wǎng)絡(luò)數(shù)據(jù)輸出技術(shù)往往將包含相關(guān)信息的全部數(shù)據(jù)報文傳輸至信息采集系統(tǒng),它存在著以下兩方面的矛盾:1) 信息采集系統(tǒng)能夠采集到校園網(wǎng)全部網(wǎng)絡(luò)數(shù)據(jù)報文,對校園網(wǎng)管理而言存在嚴(yán)重的數(shù)據(jù)隱私泄露等合法性及安全性問題,違背了網(wǎng)絡(luò)安全管理規(guī)范;2) 校園網(wǎng)主干網(wǎng)絡(luò)的流量動輒達(dá)到萬兆,基于通用處理器以軟件方法實(shí)現(xiàn)包頭解析的信息采集系統(tǒng)通常無法處理該級別的流量,信息采集所產(chǎn)生的信息數(shù)據(jù)量巨大,其中僅基礎(chǔ)的網(wǎng)頁訪問日志即可達(dá)傳統(tǒng)本地化資……