孫楚原
(四維創智(北京)科技發展有限公司,北京 100089)
無線信息安全率是信息傳輸過程中,有效接收的數據包占總發出數據包的比例。無線信息傳輸過程中,傳輸數據包由于信道不通或者被黑客盜取,使得數據傳輸丟失,影響傳輸的安全性。雖然對信息數據進行各種秘鑰加密可以提高信息安全率,但傳輸數據占用字節較大,增加傳輸負擔。因此,安全率的關鍵是對其傳輸信道進行優化,簡化操作流程,以提高信息的安全率。雖然標準BP 模型是無線信息安全率的主要方法之一,但其計算過程復雜,存在計算速度慢、安全率低的問題[1]。由于標準BP模型無法快速確定無線信息的聚類中心和數目,而且不同處理層的閥值自由度低,所以無線信息的安全率低且計算過程復雜。基于上述原因,本文對標準BP 神經網絡模型進行改進,利用K-Means 聚類實現聚類數目的確定,Leverberg-Marquisardt 調整隱含層之間的閥值和權重,實現對計算過程的簡化,以提高無線信息的安全率和速度。
本文選擇與無線網絡框架、信道負載相關的安全特征作為輸入無線信息安全率計算的自變量:傳輸信道A1(單位:N)、傳輸秘鑰數A2(單位:N)、傳輸量A3(單位:N)以及信息安全的加密比例A4(單位:%)。由于上述4 個自變量的單位不同,需要進行標準化處理。
自變量的電氣特征參數的取值范圍和單位不同,需要標準化處理:

其中,C 為整個測試區域的樣本數;Cij、Aij和Sij分別為標準化處理后的量,僅有數值特征;分別為相應參數的平均值。
為了確定信息傳輸的安全率,需要對相關信息進行聚類分析,并確定聚類中心,以此降低數據樣本數,并避免最優解處理過程中出現局部最優現象[2]。標準K-means 的計算優勢是通過相似度獲得不同分類數據之間的歐式距離,并利用歐式距離計算數據的信息安全程度,實現信息安全的定量分析。然而,標準K-means 的前提條件為確定類別數目k 和確定初始聚類中心,否則無法進行后續聚類。為了簡化計算過程,本文以輪廓系數Lt作為類別數k 值,性能指標XE作為初始聚類中心,計算公式為:

其中,i 作為任意信息發送點;q(i)為信息發送點與信息接收點之間的距離,其平均距離用表示;p(i)是i 點與非所屬分類點之間的最小距離。XE為信息安全傳輸的安全率:

其中,ωj屬于接收信息的權重,總和為1;Lij為信息接收點、信息發送點的聚類樣本,而min(Lij)為聚類樣本的初始中心,XE為樣本i 的發送點最小向量與接收點最小向量之間的歐式距離,主要反映無線傳輸的信息安全程度。通過對XE結果的順序排列獲得樣本分類值k,即對樣本進行k 等分,獲得初始分類數。
標準BP 模型分為3 層:1 層為信息發送樣本,2 層為權重調節層[3],3 層為信息接收層。信息由發射點傳輸,經媒介傳導后到達信息接收層,再進行信息反饋,以驗證信息的安全性。然而,第2 層調節層的權重值和閥值不同,反饋的結果也不同。換句話說,第3 層中各接收單元是否能準確接收信息,與第2 層的權重和閥值調整直密不可分,即不同的加密方法。如果權重調節層的加密方法復雜,傳輸手段單一,會降低信息的安全性,或者增加信息的計算過程,延長信息的傳輸時間,造成信號衰減,即多次迭代。
假設信息發送樣本為Xm=(x1,…,xm)T,權重調節層的向量Yr=(Y1,…,Yn)T,那么接收層向量為Or=(o1,…,ol)T,安全率向量為Dr=(d1,…,dl)T。其中,信息發送樣本層與信息接收層之間的權重(加密方法)為wij(i=1,…,m; j=1,…,n),閥值(傳輸介質)bij(i=1,…,m; j=1,…,n)。由上述分析可知,標準BP模型的計算公式為:

其中X 為X 與O 之間的安全程度。

其中,e 為信息丟失率。
LM 法通過計算反向安全標準函數e 的極小值[4],獲得BP 模型中權重調節層中的權值和閥值,以此提高信息傳輸的安全性。首先,依據泰勒公式展開e[w(n+1)],計算相應的閥值:

其中,G(n)屬于梯度向量;A(n)為Hessian 矩陣。假設Δw(n)=-A(n)-1G(n),則e(w)的值最小。為了提高無線信息安全率的計算速度,需要對Hessian 矩陣進行簡化,或者用相似值進行表達,即A=JTJ(其中,J 為雅可比矩陣),則G=JTe,那么式(6)可以簡化為:

依據上述方式,可以得到相應的計算閥值:

以A 地區的602 個無線信息傳輸點為例,分析基于改進BP 模型的信息安全率計算。其中,因變量為無線信息安全率d(單位:%),傳輸信道A1(單位:N)、傳輸秘鑰數A2(單位:N)、傳輸量A3(單位:N)以及信息安全的加密比例A4(單位:%)。首先,對602 個無線信息傳輸點進行分類,并將聚類數由2 遞增到7,并計算不同分類下的Lt值,結果如表1 所示。

表1 不同k 值下的輪廓系數Lt
由表1 可知,k=5 時,Lt系數最大,所以選擇k=5 作為初始聚類數目,并將LE進行5 等分。然后,按綜合等級進行排序,結果顯示聚類的取值范圍為0.8 ~10.2。依據上述結果進行K-means 分析,結果如表2 所示。

表2 測試樣本的聚類中心和綜合性能值
由表2 可知,第1 類樣本數為156,第2 樣本數為304,第3 類樣本數為10,第4 類樣本數為39,第5 類數為92,總樣本數為602。
將改進BP 模型的目標安全標準設置為0.01、0.001 和0.000 1[5],并計算不同目標安全下的安全率,結果如表3 所示。
由表3 可知,不同安全標準下,標準BP 模型的迭代次數高于改進BP 模型的迭代次數,說明改進BP 模型的計算速度更快。另外,在0.01、0.001和0.000 1 的目標安全標準下,改進BP 模型<5%條件下的安全率由23.5%上升到42.1%,>10%條件下的安全率由51.7%下降到2.4%;標準BP 模型的相對安全率<5%條件下的安全率由20.1%上升到94.3%,>10%條件下由52.2%下降到7.6%。結果說明,在不同安全標準下,改進BP 模型的安全率更高,特別是0.000 1 條件下。另外,上述兩種算法在0.000 1 時迭代次數均有所增加,但改進BP 模型的整體耗時僅為4 s,而標準BP 模型為66 s,存在差異更加顯著。

表3 不同目標安全標準下的兩種BP 模型比較
綜上所述,改進BP 模型利用信息發送點的樣本輪廓系數Lt來確定k 值,并將發送節點與接收節點之間的歐式距離XE進行升序排列,以確定樣本數和初始中心。然而,利用LM 計算安全標準函數e 的極小值,并對標準BP 模型的權值和閥值進行調整,獲得改進BP 模型。案例結果顯示:在0.01、0.001 和0.000 1 的目標安全標準條件下,改進BP模型在迭代的計算速度更快,<5%條件下的安全率由23.5%上升到42.1%,>30%條件下的安全率由51.7%下降到2.4%,優于標準BP 神經網絡模型。然而,改進BP 模型在無線信息安全率的優化方面仍然存在不足,存在部分較大異常樣本。雖然較大異常樣本對整體的影響較小,但出現較大異常樣本的原因并未進行詳細分析,是下一步研究的重點。