佟 冬,張珠玲
(1.吉林建筑科技學院計算機科學與工程學院,吉林 長春 130000;2.吉林大學通信工程學院,吉林 長春 130000)
通信技術推動物聯網逐步成為一種新的信息技術,并日益演變為社會生活與工作的主要組成部分。物聯網技術的興起與普及,代表以數據為中心的時代已來臨。物聯網數據規模龐大,其中不乏異常數據與冗余數據的存在,此類數據不僅會降低數據質量,而且將阻礙物聯網技術的進一步發展[1]。隨著物聯網技術[2]的飛速發展與廣泛應用,各領域人員對該項技術的要求也越來越高。物聯網通信設備數量較多、規模較大,數據量也呈數倍增長趨勢,存在嚴重網絡安全隱患問題。通過去除物聯網中含有的異常數據,能夠大概率降低物聯網通信網絡安全問題。為此,眾多學者與相關研究人員對物聯網通信安全問題進行了很多研究,并取得了一定成果。
金鵬等人[3]提出一種基于深度信念網絡的通信傳感器網絡異常數據檢測方法。該方法首先對通信數據的高維度數據進行降維處理,將QSSVM與滑動窗口相融合,完成異常數據的檢測。該方法操作速度較快,但在通信異常數據檢測中未過多考慮數據量的問題,存在檢測精度較低的問題。李永飛等人[4]為實現物聯網異常數據監測,為了彌補通信節點地理位置缺陷問題,引入聚類分析策略,根據輪廓系數,提出一種以過往監測數據為依據的物聯網監測點邏輯相鄰關系判別方法。該方法采用聚類方法將通信節點進行聚類,確定聚類中的簇,根據輪廓系數確定通信節點數據之間的關系,借助邏輯相鄰關系確定節點是否存在異常。該方法可有效確定物聯網節點異常程度,但操作過程較復雜,存在效率低的問題。
基于上述方法中存在的不足,本文引入孿生神經網絡,構建一種物聯網通信異常數據捕獲方法。通過將追蹤問題變換為目標與探索范圍中特征空間相似度計算問題,提升異常數據捕獲精度與效率;通過標簽約束策略,將二維數據轉變成三維恒定空間,降低通信運算復雜度。與傳統方法相比所提方法有效提升了物聯網通信數據異常捕獲精度及效率,具有一定可行性。
孿生神經網絡通常由孿生卷積神經網絡的特征提取單元與區域推薦網絡單元構成[5],如圖1所示。

圖1 孿生神經網絡結構圖
圖1 中,特征提取單元包括模板分支與檢測分支,主要功能為網絡訓練、縮短檢測時間;區域推薦網絡單元為分類網絡與回歸網絡,負責線性微調候選目標區域,輸出結果。
為便于捕獲異常數據,本文改進孿生神經網絡,去除網絡Alex Net[6]框架中兩個卷積層與全連接層,通過卷積核卷積、Relu函數激活以及池化[7]等相關處理,拓展物聯網通信信道數量,根據多層卷積取得數據信息特征,將訓練參數存儲于模板分支中,再與檢測分支共同作用,卷積處理輸出數據特征,融合模板參數與待捕獲數據特征,數據檢測、識別與捕獲均在區域推薦網絡中實現。
在各卷積層后邊添加SE-Network形成SE-CNN構架,加強物聯網可用信道路徑。假定輸入通信數據特征為X∈RW′*H′*C′,經卷積核vc處理后得到特征圖U∈RW*H*C,則信道C中的特征圖感受野uc為

(1)
在全局平均池化層降維處理數據特征,通過轉變各二維特征信道為一個實數,即

(2)
經信道篩選,由sigmoid函數[8]σ(·)明確各信道權值,即
wi=Fex(Z,W)=σ(W2δ(W1Z))
(3)
其中,運行結果為Z,卷積層參數分別為W1、W2,δ(·)代表Relu函數。
按照加權形式在數據特征上重新標記輸出權值,加強可用信道與特征圖的表征性能,完成異常數據捕獲模型的構建,即
c=Fscale(uc,wi)=uc*wi
(4)
通過分析孿生神經網絡的基本功能,借助全局平均池化層降維處理數據特征,并標記輸出數據的權值,完成異常數據捕獲模型的構建。
為實現物聯網通信異常數據的識別特征,降低識別難度,需先對其展開降維處理。在物聯網物理設備共通點基礎上,令網內硬件拓撲架構的三維節點均位于正常空間區域中,各硬件間物理相關性為概率分布[9]形式,故障幾率約等于異常幾率。
若物聯信道流量特征為M,則采用下列數據通信時長,描述物聯網通信的信道狀態,即

(5)
通信設備信道寬度影響物聯網流量特征分布,各設備受不同信道干擾程度不相同。基于此,設定損耗為評估指標。假設自消耗參數m的常取值為1,特征矩陣為BH,故評估指標表達式為

(6)
物聯網硬件拓撲框架設備故障呈概率分布狀態,將設備看作不同節點,假設V表示可衡量各硬件空間體積,設備最低硬件掃描半徑為R,此時物聯網節點故障概率分布表達式為

(7)
式(7)說明R半徑圓形范圍中存在一個以上硬件設備。
引入最優歸類理論的分類型矩陣[10],采用下列計算公式求解全部節點的融合中心間距為

(8)
利用粒子群算法[11]的標簽約束策略,將二維數據轉化到三維恒定空間,降低通信運算復雜度。經融合矩陣濾除冗余數據后,得到
P=D-1A
(9)
假定基礎簇為粒子群算法,粒子分類系數為{c1,c2},0到1之間的正態分布為{r1,r2},則明確粒子群粒子參數為

(10)
若物聯網通信中產生的異常數據集及其特征集分別為zj、bj,兩者間關系為

(11)
其中,異常數據特征bj的取值大于0。
采用下列函數方程實施數據再次過濾與解析,即

(12)
轉變數據種類劃分問題為三維空間部署問題,解得最佳種類劃分結果為

(13)
三維空間部署問題約束條件方程組表示為

(14)
其中,k=1,2,…,m。
利用超平面[12]劃分異常數據種類,并完成最佳超平面問題到極值問題的轉變,采用下列表達式界定最優種類劃分結果中的最佳數據集,即

(15)
根據約束條件方程組(14),得到異常數據種類劃分的目標函數為
g(y)=sgn{(x**y)+c*}
(16)
在此基礎上,將標簽約束策略設定為物聯網數據種類劃分的另一約束條件,得到目標函數的約束條件方程組為

(17)

結合約束條件方程組,二次求解目標函數特征,實現物聯網通信異常數據類別劃分,即

(18)
根據上述劃分的異常數據結果,將物聯網異常數據捕獲問題轉換為數據相似度度量問題,利用孿生神經網絡捕獲異常物聯網通信數據。
經訓練分類后的各異常數據集合,獲取映射函數為f(ζ,ξ),根據待捕獲的異常數據ζ與候選數據ξ,對映射函數f(ζ,ξ)進行網絡學習,若兩數據具有相同屬性,則映射函數f(ζ,ξ)將具有較高相似度值;反之,則映射函數f(ζ,ξ)的相似度值較低。
待捕獲數據ζ與候選數據ξ具備相同孿生神經網絡提取特征φ(ζ)與φ(ξ),若利用相似度度量函數g評估兩特征之間的相似性,則映射函數f(ζ,ξ)為
f(ζ,ξ)=g(φ(ζ),φ(ξ))
(19)
將物聯網通信數據輸入到孿生神經網絡中,假定初始數據集內待捕獲的異常數據特征為(w,h),特征補償為pz,則初始數據集中待捕獲數據屬性Sz為
Sz=(w+2pz)*(h+2pz)
(20)
由待捕獲物聯網異常數據產生的候選數據特征為(wz,hz),特征補償為px,其中心位置與待捕獲數據一致,即

(21)
式中,A、B表示與數據特征相關的矩陣函數。
故推導出下列候選數據屬性Sx界定式為
Sx=(wz+px)*(hz+px)
(22)
在孿生神經網絡模型中無全連接層,故將卷積層的輸出數據設定成提取到的數據特征。根據孿生神經網絡提取特征,度量待捕獲數據與候選數據之間的相似度。利用交叉相關層度量相似度,得到
f(ζ,ξ)=φ(ζ)*φ(ξ)+b
(23)
式中,一維實數矢量為b。
若孿生神經網絡輸出數據為v,標簽數據為y∈{1,-1},則應用下列logistic損失函數訓練網絡模型為
l(y,v)=log(1+exp(-yv))
(24)
結合式(23),當物聯網通信過程中的異常數據特征數量為D時,完成異常數據捕獲,即

(25)
為驗證所提方法的物聯網通信數據異常數據捕獲效果,進行仿真分析。實驗在Matlab軟件中進行,仿真操作系統為Windows 10 系統,運行內存為16 GB 。仿真中物聯網通信異常數據特征提取框架設計如表1 所示。

表1 物聯網通信異常數據特征提取框架
選取的仿真通信數據集情況如表2所示。

表2 通信數據集
在上述仿真環境及參數設定基礎上,仿真采用所提方法、基于深度信念網絡的數據異常檢測方法以及基于聚類的物聯網監測點相鄰關系的判定方法對比捕獲樣本異常數據的精度和捕獲耗時,驗證所提方法的有效性。
為驗證所提方法在物聯網通信異常數據捕獲中的有效性,實驗分析了所提方法、基于深度信念網絡的數據異常檢測方法以及基于聚類的物聯網監測點相鄰關系判定方法對樣本數據異常的捕獲精度,實驗結果如圖2 所示。

圖2 不同方法捕獲異常數據精度分析
分析圖2 結果可以看出,隨著仿真迭代次數的不斷改變,所提方法、基于深度信念網絡的數據異常檢測方法以及基于聚類的物聯網監測點相鄰關系判定方法在捕獲異常樣本數據的精度發生了改變。其中,所提方法捕獲精度最高,且始終在90%以上,而其它兩種方法的捕獲精度始終低于所提方法,驗證了所提方法可以有效捕獲異常數據。
在保證樣本異常數據捕獲精度的基礎上,仿真進一步分析了三種方法在捕獲異常通信數據的耗時,仿真結果如圖3 所示。

圖3 不同方法捕獲異常數據耗時分析
分析圖3 中數據可以看出,隨著仿真迭代次數的不斷改變,所提方法在對樣本異常數據進行捕獲時的耗時較短,且始終在2 s以下,相比之下其它兩種方法的捕獲耗時較長,且遠高于所提方法,由此可以看出所提方法在對物聯網通信異常數據捕獲時的速度較快,工作效率較高。
針對物聯網通信中存在的異常數據,本文引入孿生神經網絡結構,設計了一種新的物聯網通信異常數據捕獲方法。通過分析孿生神經網絡的基本原理基礎上,構建異常數據捕獲模型,并對物聯網通信中異常數據進行降維處理,實現了物聯網通信異常數據的捕獲。與傳統方法相比本文方法具有以下優勢:
1)采用所提方法對物聯網通信異常數據捕獲的精度始終高于90%,具有一定可信度;
2)采用所提方法對物聯網通信異常數據捕獲的耗時始終低于2 s ,捕獲速度較快。
雖然現階段本文方法取得了一定成果,但仍然存在諸多不足,未來將在物聯網通信數據規模上對所提方法進行改進,以提升方法的有效性。