王大蕾



關鍵詞:GRU-LSTM 算法;數據入侵;檢測方法;誤報率
中圖分類號:TN915.08;TP391.44 文獻標識碼:A
0 引言
當前,物聯網技術的廣泛應用已經對人們的日常生活以及工業生產過程產生了重要影響,也為各類互聯網應用技術的發展提供了可靠的基礎[1]。網絡通信技術的進步對各行業都產生了明顯影響,一旦離開網絡,所有行業都將無法正常運行,因此需要進一步提升網絡的安全性能,這是許多學者開展互聯網研究的重點方向[2-3]。為有效防范網絡威脅,提升網絡安全性,需要建立可靠的入侵檢測方法。除了需要對網絡中的計算機進行監測以外,還需在傳輸過程中對各類數據做好防范,對網絡受到的攻擊、信息竊取等行為進行嚴密監控,建立網絡非法訪問等行為的保護技術[4]?,F階段,防火墻在各類網絡系統中已成為一類有效的防護措施,能夠對網絡受到的各類攻擊行為進行精確檢測,由此實現網絡安全性的大幅提升[5]。利用監測系統實現網絡日志的自動收集,并對各項信息動態進行監聽與自動處理,從中獲取有用的內容,快速判斷網絡入侵行為[6-7]。本文綜合考慮循環神經網絡(recurrent neural network,RNN) 和長短期記憶(long short-term memory,LSTM)網絡兩種網絡的各自運行性能,針對其不足之處進行了重新調整,并對LSTM 實施優化得到門控循環單元(gate recurrent unit,GRU)網絡,進而獲得GRU-LSTM 高效算法,之后將其與傳統形式的Softmax(邏輯回歸)分類技術進行比較分析,結果發現GRU-LSTM 算法的入侵檢測性能更優。
1 GRU-LSTM算法
GRU是循環神經網絡的一種,具有很好的長期記憶和反向傳播梯度優勢。以支持向量機(supportvector machines,SVM)取代Softmax,作為GRU模型輸出,并利用交叉熵函數計算出損失[8]。損失函數按照如下進行:
圖1 為GRU-LSTM 模型結構示意, 圖2 為GRU-LSTM 模型處理流程。將所有數據輸入模型內,再利用網絡進行處理,實現對權重與偏差的控制。判斷損失函數與理想值之間的偏差,并對權值與偏差進行多次迭代,最終獲得最佳的網絡模型。
2 結果分析
表1 是本實驗獲得的各項參數結果,可以發現,模型訓練精度及其所需的訓練時間受儲量、訓練次數等參數的綜合影響。為獲得更高的訓練效率,進行了多次測試,結果顯示在儲量為512 B 的條件下表現出了最優狀態,能夠實現對下降過程的精確控制,震蕩幅度顯著減小。為消除訓練階段網絡出現的過擬合現象,可選擇dropout(臨時丟棄函數)方法來有效避免以上問題。dropout 進行網絡訓練時,按照恒定概率不斷去除無效的網絡神經元,由此實現減弱神經元間的相互作用,形成更簡單的結構,有效防止過擬合的問題。根據本實驗測試結果可知,GRU-LSTM 和GRU-Softmax 兩個模型的dropout 值分別為0.82 與0.79。
表2 是各模型入侵檢測得到的參數,按照同樣的過程完成模型的訓練,總共實施訓練次數為10次,網絡流量數據都是30 000行,測試次數為10次。由表2 可知,GRU-LSTM 表現出了比GRU-Softmax更高的控制精確度和檢測率,通過對比發現,相較于傳統的GRU-Softmax 方法,綜合運用LSTM 網絡與GRU 網絡進行處理具有更優二分類優勢。
不同攻擊類型下測試對比結果如表3 所示。由表3 可知,整體性能上GRU-LSTM 算法優于GRUSoftmax算法。說明GRU-LSTM 算法在檢測攻擊時將其判斷成正常行為的概率較小,減小了入侵概率。
在網絡入侵行為被發現時,系統便會把報警信息迅速反饋給用戶,從而避免整個系統出現運行異常的情況,并且也能夠有效保護系統中的儲存數據[9]??紤]到檢測網絡入侵時需要記錄多方面的數據信息,因此形成的數據量很大,從而形成明顯的噪聲,導致系統算法無法正常運行,出現訓練結果存在明顯偏差的問題。GRU-LSTM 網絡能夠滿足自主學習以及良好的適應性要求,在入侵檢測階段解決存在的各類潛在問題[10-11]。
為了進一步分析算法的可靠性,在NSL-KDD數據集上進行了各性能測試,檢測結果如表4 所示。由表4 可知, 相較于GRU-Softmax 算法,GRULSTM算法下各項性能均表現出優異的狀態。可見采用LSTM 替換Softmax 能提高算法整體的運算能力。
3 結論
本文開展基于GRU-LSTM 算法的物聯網數據入侵檢測分析,取得如下結果。
(1)利用dropout 進行網絡訓練,實現減弱神經元間的相互作用,有效防止過擬合。本實驗測試GRU-LSTM 和GRU-Softmax 兩個模型的dropout 值分別為0.82 與0.79。GRU-LSTM 表現出了比GRUSoftmax更高的控制精確度和檢測率。
(2)GRU-LSTM 算法在檢測攻擊時將其判斷成正常行為的概率較小,減小了入侵概率,獲得了更優的精確度、檢測率與誤報率。
該研究能夠彌補傳統機器學習算法在處理數據時的局限性,但在面對海量數據時存在計算冗長的問題,期待后續引入深度學習算法解決這一問題。