肖軍弼 魏嬌嬌
(中國石油大學(華東)計算機科學與技術學院 青島 266580)
近年來,隨著Internet 網絡結構不斷復雜化發展,以及各種網絡設備類型不斷涌現,網絡用戶的規模也在不斷提高,這使得網絡流量數據急劇增加,同時對網絡的有效管理、負荷評估和安全預警帶來了新的挑戰[1]。在傳統方法下網絡流量特征被描述為線性相關的,然而,在現代網絡環境下的網絡流量呈現出多種復雜的非線性特征,如具有長相關性、自相似性、時變性、突發性、混沌性等特點[2]。面對如此復雜的網絡環境,開展網絡流量分析研究具有重要意義。
網絡流量特性分析是進行網絡流量分類及預測研究的前提與關鍵,分析出網絡流量所具備的特性,根據其特性的變化規律,選擇出一種計算量相對較小、結構簡單的分類與預測模型。
通過網絡流量分類研究,網絡監管部門對正常流量和惡意流量進行準確、及時的分類識別,可以有效避免惡意流量對用戶帶來的干擾和損失[3]。同時,網絡流量分類與識別在病毒入侵檢測、訪問認證授權等方面也發揮著重要作用[4]。在網絡流量分類研究中,傳統的基于特定規則的分類方法隨著網絡流量數據規模越來越大,流量組成越來越復雜,已經不能滿足當今的網絡流量分類需求,基于數據挖掘的網絡流量分類方法[5~6]已經成為目前的研究熱點之一,如許多學者采用有監督學習的網絡流量分類方法,例如利用樸素貝葉斯(Na?ve Bayes,NB)[7]、支……