999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于平衡迭代規約層次聚類的無線傳感器網絡流量異常檢測方案

2022-02-24 08:58:00
電子與信息學報 2022年1期
關鍵詞:特征檢測

郁 濱 熊 俊

(戰略支援部隊信息工程大學 鄭州 450000)

1 引言

無線傳感器網絡(Wireless Sensor Networks,WSN)流量異常檢測技術運用數據挖掘、機器學習等方法對流量數據進行統計分析,以判斷網絡是否存在異常運行或入侵行為,對維護網絡安全具有重要意義,如何及時、準確地檢測出異常流量是當前WSN流量異常檢測技術亟需解決的問題[1]。目前,網絡流量異常檢測技術主要包括基于神經網絡模型、基于統計分析方法和基于聚類分析算法[2]。

在WSN流量異常實時檢測中,直接通過連續采樣獲得的流量數據是沒有標記的,考慮到通常需要利用大量帶標簽的數據訓練神經網絡模型以增強模型的泛化能力[3,4],因此,基于神經網絡模型的檢測技術不適用于實時的WSN流量異常檢測環境。基于統計分析方法的檢測技術在檢測實時性、算法計算復雜度等方面具有優勢,但現有方案大多缺乏合理的異常判決機制,且忽略了統計誤差對判決結果的影響,檢測準確度較低[5—7]。基于聚類分析算法的檢測技術無需預先處理輸入樣本,通過分析網絡流量數據內部特征的相關性,以聚合具有相似特征的流量,并將稀疏簇內的流量判決為異常數據,逐漸成為網絡流量異常檢測技術的主要研究方向[8—10]。

現有的聚類分析算法可以被歸納為層次聚類分析、劃分聚類分析和智能聚類分析3類[11]。智能聚類分析技術主要基于深度學習、核函數等機器學習方法,該技術在WSN異常流量檢測應用中存在與基于神經網絡模型的檢測技術相同的不適用性。劃分聚類分析更傾向處理各個聚類簇大小比較接近的樣本,因此該技術往往無法將孤立點數據或異常點數據從樣本中分離出來,且聚類中心的選擇也會對其聚類結果產生較大影響,同時由于劃分聚類一般從總體上評判樣本間的相似性,導致其不支持增量式數據源。平衡迭代規約層次聚類(Balanced Iterative Reducing and Clustering using Hierarchies,BIRCH)作為一種經典的層次聚類分析算法,僅通過一次掃描即可有效地組織大規模數據,在聚類質量、效率、穩定性和擴展性方面具有明顯優勢[12]。BIRCH的基本思想是通過肯定每一個樣本點的差異性,先將他們視作一個個單獨的聚類簇,再根據簇之間相似性的高低將他們分層合并。通過這種方式,BIRCH聚類分析算法不需要預先設定聚類值和聚類中心,在處理離散點方面表現突出,可以將異常點數據劃分到獨立的簇中,相較于劃分聚類分析技術,更適用于網絡流量異常檢測。Pitolli等人[13]利用BIRCH聚類算法對樣本特征進行分類,用以識別海量軟件樣本集中的惡意數據,具有較高的檢測率和計算效率。Peng等人[14]提出一種基于主成分分析的P-BIRCH聚類算法,時間成本隨著聚類數的增加而線性減少,有效地解決移動云環境下的大數據入侵檢測問題。

一方面,通過連續采樣獲得的WSN流量是典型的連續時間序列。根據時間序列相鄰值之間具有的時間相關性[15],針對出現在網絡流量平穩階段或固定周期的突變流量,對比其前后一段時間內的采樣流量可以發現,這些流量的急劇變化是反常的,有理由相信他們為異常流量。然而,由于流量值僅僅體現了網絡在該采樣周期內的流量大小,如果利用BIRCH對單一維度的流量序列進行聚類分析,會因為忽略了流量與其前后臨近流量的相關性,從而導致將異常突變流量劃分到高峰期或低谷期流量對應的聚類簇中,使得異常檢測結果存在較大的偏差。

另一方面,Lorbeer等人[16]指出經典BIRCH基于相同距離劃分簇類,存在不能處理自然數據形狀集合,對樣本輸入順序高度敏感等不足。針對此,Guo等人[17]提出一種基于鏈接的LBIRCH算法,通過建立鄰居表實現對任意形狀進行聚類。同時,由于經典BIRCH采用全局靜態閾值建立聚類特征樹(Clustering Feature Tree, CF-Tree),只能獲得具有相同體積的聚類。因此,尚家澤等人[18]結合樸素貝葉斯算法,提出一種基于自適應閾值的改進BIRCH,一定程度上解決了其不適用于聚類體積差異較大簇類的局限性,但算法執行效率明顯下降。

綜上所述,針對WSN流量異常實時檢測需求,該文提出一種基于BIRCH的WSN流量異常檢測方案。首先,擴充WSN流量的特征維度,在此基礎上,設計一種優化特征聚類樹(Optimized Clustering Feature Tree, OCF-Tree)結構對BIRCH進行優化。然后,提出基于拐點的綜合判決機制,進一步彌補聚類偏差對檢測結果的影響。最后,根據基于仿真平臺獲得的WSN流量數據,對比該文方案與其他方案的流量異常檢測效果。

2 模型建立

2.1 符號與定義

為方便對方案進行描述,該文相關符號及其含義如表1所示。

表1 符號定義

2.2 流量異常檢測模型

基于BIRCH的WSN流量異常檢測模型如圖1所示,主要包括流量特征聚類分析和流量異常判決兩個關鍵部分。

圖1 基于BIRCH的WSN流量異常檢測模型

2.2.1 流量特征聚類分析

流量特征聚類分析分為特征維度擴充和BIRCH聚類分析兩個環節。

WSN流量預測技術以網絡歷史流量信息為依據推測未來一段時間內的流量趨勢[20]。根據定義2和定義3可知,某時刻流量預測值代表了該時刻流量的變化趨勢及基準值,即正常流量的變化可能在預測值附近小范圍波動,所以流量預測序列和預測誤差序列均隱含了原始流量的時序特征。因此,針對WSN流量的聚類特征維度較低的問題,特征維度擴充環節根據輸入的WSN流量序列S,利用其預測序列S?和預測誤差序列SΔ作為原始流量的新增特征,以擴充聚類分析輸入樣本的特征維度。

BIRCH聚類分析環節設計一種特殊的OCTTree結構,根據流量特征X將流量劃分成簇{Ci}(i=1,2,...,K),其中K為簇個數。一方面,由于WSN流量具有突發性、分布不均勻等特征,且存在稀疏的異常流量點,基于此,通過為每個聚類特征(Clustering Feature, CF) 單獨設置增量式的動態閾值T,使其適用于聚類體積存在較大差異的簇。另一方面,對于經典BIRCH算法,每個節點只能容納固定數目的CF,聚類結果不總對應于自然集群。同時,根據流量的輸入順序,特征差異較大的流量可能會被聚類到同一簇中,針對此,根據每個葉子特征CFL的鄰居簇對聚類結果進行全局優化。

2.2.2 流量異常判決

流量異常判決環節根據拐點確定聚類截斷閾值c l u s t e r_T 和預測截斷閾值p r e d i c t_T,將cluster_T作為區分簇體積大小的依據,predict_T作為區分預測誤差大小的依據。利用cluster_T從{Ci}中篩選出體積較小的簇,將小體積簇中的流量構成聚類可疑點集合P,同時利用predict_T從SΔ中篩選出預測誤差較大的流量,構成預測可疑點集合Q,并基于P, Q綜合判決WSN流量是否異常。

3 流量特征聚類分析算法

WSN流量的特征維度擴充如圖2所示,分別將流量序列作為第1維特征,預測序列作為第2維特征,預測誤差序列作為第3維特征,合并S,S?和SΔ,組成3維流量特征序列X=[X1,X2,...,Xn],其中Xi=[sis?iΔsi]T,i=1,2,...,n。特征維度擴充基于流量預測技術,由于目前已有較為成熟的研究,眾多流量預測算法具有計算復雜度低、預測速度快、預測精度高等優勢[21],因此m-p流量預測函數Γm-p(·)的內部結構不在該文討論范圍內。

圖2 特征維度擴充示意圖

圖3 優化聚類特征樹結構

值得注意的是,BIRCH聚類算法所需內存與閾值T有關。T越大,構建的CT-Tree規模就越小,則所占用的內存也越小。然而,如果T過大,會導致單個聚類簇的規模較大,則聚類程度十分粗略,從而影響聚類效果。由于本文著重研究如何提高BIRCH的聚類質量,因此,假設流量特征聚類分析算法步驟均在內存足夠的前提下進行。

4 流量異常判決方法

基于此,流量異常判決環節設計一種基于拐點的綜合判決機制,利用拐點確定區分聚類簇體積大小的截斷閾值,如圖4(a) 所示。進一步,利用拐點確定區分流量預測是否失真的截斷閾值,如圖4(b)所示,以避免當網絡流量出現突發性變化或流量預測誤差較大時,正常流量被劃分到小體積的簇中的情況。流量異常判決方法具體步驟如下:

圖4 截斷閾值選取

根據上述方法步驟,實現對WSN流量異常的綜合檢測。

5 實驗及結果分析

實驗基于Ubuntu系統平臺,利用NS-2網絡模擬器進行WSN仿真實驗,采用Python3.6語言和eclipse環境檢驗該文方案的有效性。

5.1 實驗數據與參數配置

5.1.1 實驗數據

實驗利用NS-2網絡仿真平臺搭建WSN仿真環境,配置如表2所示。

表2 WSN仿真環境配置

實驗數據基于上述WSN仿真環境,以采樣頻率0.25 Hz統計WSN區域內的流量以模擬實時采樣環節,得到500個流量樣本點。將第1至400個樣本點作為Γm-p(·)輸入,以預測第401至500個流量樣本點,作為流量特征的擴充維度。針對本文方案提出的m-p流量預測函數Γm-p(·),采用文獻[21]提出的優化FAEMD-OSELM流量預測模型,其中m=400, p=100。

在上述流量采樣過程中,分別采用Blackhole,Flooding和Grayhole攻擊模型[22]在第451至480個樣本時間段模擬網絡異常情況,如圖5所示。將包含異常流量的第401至500個網絡流量分別作為Blackhole, Flooding和Grayhole測試數據集,其中第451至480個為網絡異常時的采樣流量,其余為網絡正常時的采樣流量。

圖5 WSN異常流量數據

5.1.2 實驗參數設置

實驗選擇文獻[23]中的ENDTW-O-CFSFDP流量異常檢測模型、文獻[24]中的BasisEvolution流量異常檢測模型和文獻[14]中的BIRCH流量異常檢測模型與本文方案進行對比,結合Blackhole, Flooding,Grayhole 3種測試數據集,綜合比較方案的流量異常檢測性能。相較于基于PCA-BIRCH的方案,本文方案設計的啟發式閾值T無需人為設定,更具自適應性,其初始值T0由測試數據集Blackhole,Flooding, Grayhole確定,分別為4.18, 3.89, 3.94。

本文方案需要設定的參數為非葉節點分支因子B和葉子節點分支因子L,通常B取4, 5, 6,L取4,5, 6, 7為最佳聚類效果經驗值。由于B, L一定程度上決定了OCF-Tree的形狀以影響聚類效果,因此實驗針對3種測試數據集,分別設置B取2至10,L取1至10,研究B, L取值對本文方案檢測結果的F1值和準確率的影響。如圖6所示,若選取的B或L過大,距離簇質心較遠的正常樣本將被劃分成獨立的聚類簇,并被判決為異常流量,從而增加了正常樣本被錯誤判決的比例;相反地,若選取的B或L過小,受限于OCF-Tree的節點分支數量,異常樣本將被強制劃分到距離最近的聚類簇中,并增大該聚類簇的規模,導致其被判決為正常流量,從而增加了異常樣本被錯誤判決的比例。在上述兩類情況下,本文檢測結果的F1值、準確率較低,檢測效果較差。因此,實驗選擇聚類效果最好時的B=4, L=5作為本文方案的實驗參數。

圖6 B, L的取值對F1值和準確率的影響

5.2 結果分析

實驗選擇精確率 (Precise, Pr) 、召回率 (Recall,Re) 、F1值和準確率 (Accuracy, Ac) 作為方案流量異常檢測效果的評價指標。Pr為被正確判決的正常樣本占所有被判決為正常點的比例,Re為被正確判決的正常樣本占所有正常樣本的比例,F1為反映方案整體檢測效果的綜合評價指標,Ac為被正確判決的樣本占所有樣本的比例,其中Pr, Re,F1∈[0,1],其值越大表明方案檢測效果越好。通過20次獨立重復實驗,檢測方案針對3種測試數據集的Pr, Re, F1和Ac如表3所示。

表3 各方案檢測性能對比(%)

針對3種測試集,基于BasisEvolution方案將網絡流量判決為異常樣本的數量明顯高于其他方案,雖然該方案可以正確檢測出大部分的異常流量,在Pr方面具有絕對優勢,但同時也將較多的正常流量錯誤地判決為異常樣本,導致其Re較低。相反地,基于ENDTW-O-CFSFDP方案正常流量的誤判率低于其他方案,在Re方面具有一定的優勢,且略高于該文方案,但由于該方案的異常流量檢出率較低,其Pr較低。基于BIRCH的方案僅根據BIRCH聚類結果判斷流量是否異常,缺乏合理的異常判決機制,其Pr與Re均低于該文方案。

進一步,相較于基于ENDTW-O-CFSFDP,BasisEvolution, BIRCH的方案,在綜合指標F1值方面,本文方案對Blackhole測試集分別提高了5.3%, 3.3%, 11.0%,對Flooding測試集分別提高了5.8%, 5.4%, 12.4%,對Grayhole測試集分別提高了8.9%, 9.1%, 14.0%;在Ac方面,本文方案對Blackhole測試集分別提高了9.0%, 4.0%, 17.0%,對Flooding測試集分別提高了9.0%, 6.0%, 18.0%,對Grayhole測試集分別提高了15.0%, 10.0%, 20.0%,表明本文方案在檢出異常流量的同時,可以有效避免將正常樣本判決為異常樣本,且針對不同網絡攻擊造成的流量異常現象都具有較好的檢測能力。

如表4所示,相較于基于ENDTW-O-CFSFDP,BasisEvolution, BIRCH的方案,本文方案F1值的均值分別提高了6.7%, 6.0%, 12.5%,Ac的均值分別提高了11.0%, 6.7%, 18.3%,具有較好的異常流量的檢出能力,表明本文方案對整個測試樣本的正負類判別準確度較好。同時,本文方案根據網絡流量特征之間的差異先篩選出可疑流量點,再結合預測值綜合判決流量是否異常,因此,本文方案對應的F1值與Ac的標準差最小,表明本文方案針對不同類型網絡攻擊造成的異常流量都具有較為穩定的檢測性能。

表4 各方案F1值、Ac的均值(%) 與標準差對比

綜上所述,本文提出的流量異常檢測方案可以有效檢測由不同WSN網絡攻擊導致的異常流量,且檢測性能穩定。

6 結束語

本文在深入研究網絡流量異常檢測技術的基礎上,提出了一種基于BIRCH的WSN流量異常檢測方案。本文方案設計了基于OCF-Tree的BIRCH聚類分析算法,有效克服樣本的特征類型和輸入順序對BIRCH造成的影響,提高了聚類的質量和穩定性。同時,提出一種基于預測的特征維度擴充方法,通過在流量特征中增加隱含流量時序關系的預測序列和誤差序列,以適應BIRCH聚類分析算法。進一步,根據流量序列特征分析,定義拐點概念,設計基于拐點的綜合判決機制,減少BIRCH聚類分析過程對檢測結果的影響,保證了流量異常檢測的準確性。實驗結果表明,相較于同類方案,本文方案在檢測效果和性能穩定性方面具有明顯優勢。

下一步研究中,將針對OCF-Tree結構中分支因子B, L的選擇,設計啟發式算法求解最優值,同時,解決如何在保證聚類質量的前提下盡可能減小構建OCF-Tree所需內存的問題。

猜你喜歡
特征檢測
抓住特征巧觀察
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
主站蜘蛛池模板: 9久久伊人精品综合| 国产精品欧美激情| 午夜高清国产拍精品| 福利视频99| 国产国模一区二区三区四区| 久久伊人色| 欧美日韩精品综合在线一区| 精品一区二区三区四区五区| 国产拍在线| 日韩欧美中文字幕在线精品| 欧美国产日产一区二区| 精品无码国产一区二区三区AV| 亚洲另类国产欧美一区二区| 成人国产免费| 久久精品欧美一区二区| 动漫精品啪啪一区二区三区| 亚洲无码高清免费视频亚洲| 激情影院内射美女| 精品少妇人妻一区二区| 重口调教一区二区视频| 手机成人午夜在线视频| 欧美黄色网站在线看| 91国内外精品自在线播放| 一区二区偷拍美女撒尿视频| 亚洲热线99精品视频| 国产黄在线观看| 色播五月婷婷| 国产精品99久久久| 国产精品视频猛进猛出| 久久久亚洲色| 国产精品成人一区二区| 91精品啪在线观看国产91| 国产精品视屏| 九一九色国产| 9cao视频精品| 午夜视频在线观看免费网站| 免费中文字幕在在线不卡| 久久国产精品电影| 日韩欧美中文字幕在线韩免费| 久久精品欧美一区二区| 五月天福利视频| 婷婷六月综合| 亚洲男人在线| 国产午夜在线观看视频| 亚洲精品无码AⅤ片青青在线观看| 国产男人的天堂| 中文字幕在线日本| 免费观看男人免费桶女人视频| 一级毛片免费高清视频| 国产成人艳妇AA视频在线| 欧美日韩成人| 亚洲无码精品在线播放| 亚洲无码高清一区二区| 国产女人综合久久精品视| 欧美色99| 永久天堂网Av| 免费可以看的无遮挡av无码| 久久这里只有精品8| 国产理论最新国产精品视频| 久久99国产乱子伦精品免| 国产精品亚洲一区二区三区z | 欧美日本在线观看| 在线日韩日本国产亚洲| 国产精品香蕉在线| 欧美日韩福利| 亚洲天堂视频在线播放| 久久伊人操| 1024国产在线| 国产人人干| 国产99视频精品免费视频7| 999国内精品久久免费视频| 夜精品a一区二区三区| 国产精品yjizz视频网一二区| 任我操在线视频| 日本国产一区在线观看| 伊人色综合久久天天| 亚洲国产一成久久精品国产成人综合| 久久国产香蕉| 国产特级毛片aaaaaa| 在线观看网站国产| 沈阳少妇高潮在线| 日韩毛片免费观看|