劉蘭淇,向青松
(河南財經政法大學,河南 鄭州 450046)
現代大數據和云計算技術的飛速發展,基于網絡節點的無線傳感網絡(Wireless Sensor Network,WSN)已經率先進入遞增交換時代。作為當代最常用的無線通信網絡,載荷節點的應用無論是在構建無線網絡傳感器上還是獲取網絡環境數據上,均具有重要意義。網絡數據傳輸交換時節點載荷會出現變化,為了保證網絡平衡, 需要對其進行調度,因此網絡數據交換下的復合載荷節點監督成為當前網絡建設的重要研究領域[1-2]。
半監督的思想主要基于訓練學習模型的假設值,包括聚類假設和流行假設,常用的數據算法有特征訓練,節點模型、協同訓練算法、半監督支持向量機算法等。目前。網絡復合載荷節點半監督相關研究已經出現了較多成果。常用的主要要基于源數據的復合載荷節點半監督方法。這種方法就是在進行節點監督時,利用源數據共享模式組建共享模型,再結合當前的共性特征標準,通過模塊化的數據集合完成復合載荷節點的半監督[3]。這種方法監督穩定性較強,但是整體效率極低,對網絡源數據要求較高,不宜推廣應用。此外美國研究學者提出了以數據存儲共享為核心的復合載荷節點半監督方法,然而此方法在監督過程中,需要依靠數據交換共享體系下的邏輯分析, 無法進行量化評估,其整體精確度較低,此外還有三方節點并存的半監督技術,這種技術主要依靠構建三方節點的流式數據,完成異步消息的確認,但是整體精確度較低[4]。對此,如何構建一種精確度較高且資源能耗在正常范圍內的復合載荷節點半監督方法, 成為目前需要解決的重點問題。針對上述問題,提出了網絡數據交換下復合載荷節點半監督方法,力求為該領域的研究提供一定支撐[5]。
為提高后續節點半監督的準確性,需監測當前網絡節點數據的異常數據。因為需要檢測的數據格式大多為異構數據,所以此次研究的核心為異構數據異常值監測[6]。確定當前節點范圍內的候選異構數據點集合。在當前監督窗口W中,隨機讀取當前異構數據x,利用式(1)分別計算當前窗口的異構數據讀數均值μ,其中最大值和最小值分別用max和min表示

(1)

根據上述計算過程,利用式(2)可以獲取w個異構數據讀數的距離,其表達公式為

(2)
上述公式主要表示不同節點交換數據的讀數距離,考慮到交換數據之間存在的時間關聯性,以及異構數據的干擾性,可以肯定其距離越大,交換數據異常程度越高[7]。
將上述獲取的距離值進行正向排序,選取前面多個讀數作為載荷節點異常數據的集合節點CO。在數據群中,需保留近期節點原始數據,并根據上述計算結果,傳輸到空間臨界節點上。在第二個監測窗口w中,先將max和min的屬性值進行初始化,再根據上述數據,通過滑動數據窗口計算μ2和dist(·),假設當前交換達到數據為x1那么

(3)
根據式(3)對節點的數據增量進行計算即可,距離式按照式(2)完成。按照上述步驟,將當前網絡下各復合載荷節點的空間鄰域關系進行輸入和輸出。同時在各時間區間W內,接收各鄰居節點傳輸數據。數據接收完畢后,對當前空間鄰域進行更新,結合空間距離和式(2)獲取當前各節點時間空間關系數據的偏離度,并將此作為當前局部異常系數。偏離度越高表示當前數據異常值越高。
綜上空間讀數xi和空間鄰域距離st可以由以下公式獲取

(4)

(5)
在上述式(4)和式(5)中,k代表當前網絡數據交換下復合載荷節點實際空間鄰居量,η代表當前檢測系數,其值為0到1。檢測系數越大,則代表當前時間距離的對應比例也就越大,空間鄰居對應比值也就越小[8]。因提取st值的可以實現當前候選異常網絡節點數據的檢測,所以通常情況下,η值的取值為0。通過上述式(4)和式(5)判斷節點當前的異常值。利用分布式跳躍通信模式,記錄數據交換的傳輸路徑,將其匯聚到復合載荷節點上。接收局部節點信息后,對st值進行反向序列排列,排列在前端的異常數據間即為當前數據交換時的異常數據點集合,用LO表示。最后利用卡爾曼濾波器,對當前異常點進行檢測,獲取網絡數據交換時正常的數據點集合

(6)
由以上步驟完成異構網絡數據異常值檢測。
基于上述檢測后的數據,進行數據輸入和輸出。因節點位置不同,數據表示也具有差異性。需對當前交互節點進行重新定位,交互定位的基本概念如表1所示。

表1 節點定位基本信息概念
根據2.1節對異構網絡數據異常值檢測得到的結果,對當前WSN數據信息進行節點定位。在此基礎上需保證節點間的聯通性,利用信標節點位置估算當前未知節點[9]。在對未知節點進行定位,不同的定位算法具有較大差異性,為解決該問題以仿真的方法(MATLAB)進行節點定位。首先應用三邊仿真策略,節點初始數據。三遍仿真策略的實際原理如圖1所示。

圖1 三邊仿真定位
通過不同節點的定位距離原理,可以確定方程組

(7)
根據式(7)獲取當前未知節點的實際坐標

(8)
根據以上坐標和三邊數據信息,進行三角測量。設D為未知節點,A、B、C分別為當前網絡數據的信標節點。各節點的信標坐標,需要基于式(7)和式(8)以及三邊定位下的坐標圓心,確定未知距離,已知未知節點對于各信標節點A、B、C的角度分別為∠ADB、∠ADC、∠BDC。

圖2 三角測量
對于當前網絡節點A、C以及對應的角∠ADC,假設當前弧AC在三角形ABC的內側,則此時弧AC只能在特定的圓內,設當前坐標距離半徑為r1,根據以下等式
β=∠AO1C=(2π-2∠ADC)
(9)
通過當前節點距離求取結果,可以得出以下公式

(10)
根據上述方程組可獲取當前圓心和半徑的距離值,由此可估算出當前交互接節點B和交互節點C。根據上述三邊定位法計算公式,可確定未知節點的真實位置。其整體算法過程如下:
Step1:部署網絡環境,將當前網絡數據區域建立在[0,L]×[0,L]的二維平面上。假設在當前區域內隨機分布的n個節點{s1,s2,…,sk}。設當前節點中有k個信標節點即{s1,s2,…,sk},剩余的均為位置節點,假設所有的數據節點均通過信息半徑R,且當前節點的計算能力一致。

Step3:獲取節點的跳數向量,假設當前信標節點的跳數為h,此時可以獲取所有信標節點的跳數向量:
h1=[h(si,sl),h(si,s2),…h(sj,sk)]
(11)
Step4:將當前信標節點的所有編號跳數作為訓練參數執行訓練樣本生成。
Step5:根據當前訓練模型的未知網絡編號,制備對應的節點評估值,完成節點定位。
依靠上述節點定位結果和異常數據處理結果,采用OCHS算法實現當前網絡數據交換下復合載荷節點的半監督[10]。因為當前網絡傳感器中的異構數據主要是根據數據間勾股定理選取能耗最小的路徑加入數據簇的,所以OCHS算法支持分布式運算。
為提高網絡異構數據的交換性能,需要引入初始能量較高的數據節點。各初始能量通過模糊變量的數據EG表征計算截止到目前時刻的鄰居節點總調配數。設定當前網絡M區域內存在N個數據節點,此時最佳的簇首數量為Kopt,其表達公式如下

(12)

由此可根據擇優選擇方法,確定簇首集合表示如下

(13)
將當前節點的最優簇首提取并集合完畢后,等待仿真數據加入到該節點中。設當前CHj代表每輪遴選出的數據簇首結合,則d(i,CHj)代表當前交換節點數據i和簇首CHj之間的聯通距離,d(CHj,BS)代表數據簇首集合CHj到傳感網絡異構數據之間的距離。為使節點數據選取最短路徑數據進行交換,引入數據勾股定理,獲取當前復合載荷節點數據最短路徑表達公式:
d(i,BS)2=d(i,CHj)2+d(CHj,BS)2
(14)
根據上述式(14)等待交換節點數據,選取一條最小值交換路徑,完成數據交換。根據數據交換結果,對比完整拓撲結構下復合載荷節點半監督方法的真實位置,如果位置一致,則證明當前節點符合監督標準,反之則證明當前節點處于不平衡狀態。
為了檢測當前設計的網絡數據交換下復合載荷節點半監督方法的有效性,需要進行對比實驗。實驗環境如下:IntelCore i5-3470CPU@3.20GHz內存為4GB。實驗所用的數據交換機示意圖如圖3所示。

圖3 網絡數據交換設備
仿真的開發平臺選擇PyCHarm2019。通過平臺內Python語言數據包pandas等分析包比較。當前設計的復合載荷節點半監督方法與傳統的以數據存儲共享和以三方節點并存為核心的監督方法。實驗指標為:數據監督缺陷率及數據節點開源度。
數據監督缺陷是復合載荷節點半監督和監督方法經常涉及到的評測指標,用于確定當前監督方法對節點位置的評測情況。在當前實驗環境和仿真軟件以及下屬評測數據的支持下,分別應用實驗用的幾種設計方法,進行分析評測,其結果如圖4所示。


圖4 缺陷率對比結果
由圖4可知,隨著信標節點比例的不斷增加,三種仿真方法的監督缺陷率均出現變化,但是此次設計的復合載荷節點半監督方法的平均缺陷率明顯低于對比的兩種實驗方法,該監督方法的缺陷率比傳統監督方法降低了至少30%,初步證明了該方法的準確性。
節點開源度是數據節點在進行數據交換時數據源的匹配度系數,開源度越高,整體監督效果也就越好。設計同樣根據上述實驗方法,進行開源度對比,其結果如圖5所示。


圖5 開源對比實驗結果
根據圖5實驗結果可以看出,本次設計的復合載荷節點半監督方法的最高開源度達到90%,平均整體開源度為50%;文獻[2]方法的最高開源度為78%,平均整體開源度低于20%;文獻[3]方法最高開源度為75%,平均整體開源度為30%。研究方法的開源性遠高于兩種傳統方法,平均提高比例超過17%,說明研究方法監督效果更好。
復合載荷節點的應用對于無線網絡傳感器的構建,實現網絡負載均衡具有重要意義。為確定復合載荷節點在網絡負荷變化時的數據表征,提高對其監督的精確度,設計提出網絡數據交換下復合載荷節點半監督方法。復合載荷節點的半監督方法可以有效監督當前節點工作情況,緩和網絡數據交換時的數據負載,保證負載均衡。此次仿真設計通過對節點的定位和數據篩選,對比初始節點位置,完成監督仿真,實驗證明該方法真實有效,具有推廣性。