潘 偉,李新建,陳 飛
(湖北中煙工業(yè)有限責(zé)任公司,湖北武漢 430030)
遠程通信數(shù)據(jù)傳輸量逐漸增加,對遠程通信數(shù)據(jù)傳輸?shù)耐暾浴踩院头€(wěn)定性提出了更高的要求。一些不法分子篡改遠程通信數(shù)據(jù),不僅打亂了工業(yè)互聯(lián)網(wǎng)的數(shù)據(jù)傳輸秩序,還導(dǎo)致了用戶的大量信息泄露,甚至發(fā)生誤導(dǎo)用戶進入危險網(wǎng)站的現(xiàn)象,給用戶帶來了直接經(jīng)濟損失,同時給網(wǎng)絡(luò)維護帶來了巨大困難。遠程數(shù)據(jù)傳輸技術(shù)不斷發(fā)展,不法分子的數(shù)據(jù)篡改技術(shù)日益精進,由傳統(tǒng)的協(xié)議棧篡改法發(fā)展成了現(xiàn)在的信道直接篡改法,尤其在數(shù)據(jù)傳輸過程中,被篡改數(shù)據(jù)混在多種數(shù)據(jù)中,給工業(yè)互聯(lián)網(wǎng)中遠程通信數(shù)據(jù)防篡改檢測工作帶來了巨大的挑戰(zhàn)[1-2]。
針對工業(yè)互聯(lián)網(wǎng)中遠程通信數(shù)據(jù)防篡改檢測,國內(nèi)的相關(guān)專家進行了深入的研究。文獻[3]提出的基于模糊神經(jīng)網(wǎng)絡(luò)的遠程通信數(shù)據(jù)防篡改檢測通過構(gòu)建神經(jīng)網(wǎng)絡(luò)系統(tǒng),利用卷積層分析信道數(shù)據(jù),并采用模糊層次法構(gòu)建層次指標,通過計算信道權(quán)重,判斷是否發(fā)生數(shù)據(jù)篡改行為,該方法的檢測效率較高,但指標的選取缺乏合理性,導(dǎo)致檢測結(jié)果的準確率較低。文獻[4]提出一種基于分層聚合的分布式異常數(shù)據(jù)檢測方案,通過建立無線傳感器網(wǎng)絡(luò)模型,以頂點理論為基礎(chǔ),在信道內(nèi)部署無線傳感器進行數(shù)據(jù)采集,通過分析各個無線傳感器采集的數(shù)據(jù),綜合判斷數(shù)據(jù)的傳輸狀態(tài),整體檢測準確率較高,但計算量較大,導(dǎo)致其檢測結(jié)果缺乏實時性。為解決以上問題,提出了一種新型的工業(yè)互聯(lián)網(wǎng)中遠程通信數(shù)據(jù)防篡改檢測方法,并設(shè)計實驗進行驗證。
針對工業(yè)互聯(lián)網(wǎng)遠程通信數(shù)據(jù)的低通數(shù)據(jù)傳輸信道,進行遠程通信數(shù)據(jù)防篡改檢測優(yōu)化設(shè)計,在特征提取技術(shù)的基礎(chǔ)上提出了基于特征提取的遠程通信數(shù)據(jù)防篡改檢測方法。
獲取工業(yè)互聯(lián)網(wǎng)中遠程通信信道的輸出功率,參考功率特征向量的提取原則,提取遠程通信信道的輸出功率特征向量。針對小部分稀疏數(shù)據(jù),采取數(shù)據(jù)整合法進行特征提取,以保證數(shù)據(jù)覆蓋率[5-6]。數(shù)據(jù)輸出綜合特征向量的表示方法如下:

式中,t表示特征向量的提取時間;a表示提取范圍,具體到某一模塊;b表示遠程通信信道輸出功率的相對增益。
參考上述表達式,以相對相位偏移特征向量ψ(t)為因變量,找到當(dāng)前工業(yè)互聯(lián)網(wǎng)中遠程通信數(shù)據(jù)序列的所有未被篡改數(shù)據(jù)集,根據(jù)未篡改數(shù)據(jù)的分布位置進行檢測節(jié)點設(shè)計,得到的遠程通信數(shù)據(jù)防篡改檢測節(jié)點的最優(yōu)部署位置為:

式中,x和y表示節(jié)點在二維節(jié)點部署圖中的橫坐標和縱坐標[7-8]。根據(jù)以上得到的最優(yōu)部署位置,在設(shè)計的遠程通信數(shù)據(jù)防篡改檢測的網(wǎng)格分布式特征提取模型的基礎(chǔ)上,部署遠程通信數(shù)據(jù)防篡改檢測節(jié)點。節(jié)點的活躍度計算方式如下:

式中,u(t)表示在t時間下節(jié)點的活躍度;T表示活躍度計算周期;Drect表示節(jié)點屬性值;K是整數(shù)。在數(shù)據(jù)防篡改檢測過程中,由于受網(wǎng)絡(luò)環(huán)境的影響,不可避免地存在一定噪聲干擾,假設(shè)在檢測過程中受到的噪聲干擾為h(t),則輸出的遠程通信數(shù)據(jù)防篡改特征向量為:

式中,t0表示特征向量的提取時延[9-10]。為了更好地描述遠程通信數(shù)據(jù)狀態(tài),結(jié)合信道均衡調(diào)度法獲取目標特征提取點的沖擊響應(yīng)特征向量,該特征向量的描述為:

式中,E表示信道的相對能耗;C表示沖擊響應(yīng)系數(shù)。結(jié)合上述特征向量提取結(jié)果,考慮檢測過程中存在的強電磁干擾,采用擴頻處理法對上述特征向量進行擴頻處理,得到的強電磁干擾下數(shù)據(jù)傳輸信道沖擊響應(yīng)值為:

式中,X為受電磁干擾數(shù)據(jù)的特征分布矩陣;β為信道的抗電磁干擾系數(shù)。由于檢測過程中可能存在重復(fù)檢測數(shù)據(jù)和冗余數(shù)據(jù),因此需要對輸出的特征向量進行進一步優(yōu)化,優(yōu)化公式如下所示:

式中,C表示遠程通信數(shù)據(jù)的互信息熵。
針對上述提取的特征向量,基于LPP(Locality Preserving Projections)算法進行特征匹配,LPP 算法是一種非線性空間向量分析方法,全名為局部保持投影映射法。基于LPP 算法的特征匹配過程如下:
1)構(gòu)建平面節(jié)點鄰接圖。假設(shè)共有N個節(jié)點參與特征向量提取,設(shè)任意兩個相鄰節(jié)點分別為z1、z2,兩節(jié)點間的相對距離為l,在兩個節(jié)點之間建立一條邊,則該邊的權(quán)重計算值為:

式中,x1和x2分別表示z1和z2在平面節(jié)點鄰接圖中的橫坐標[11-12],l表示平面節(jié)點權(quán)重,若該邊與兩個節(jié)點間的連接線重合,則權(quán)重值為0。
2)特征映射:特征向量與特征值之間的映射關(guān)系如下:

式中,α表示特征向量;λ表示映射參數(shù);D表示映射矩陣。D的輸入值為邊的權(quán)重值,矩陣中每一列之和PF的表達式為:

式中,eij表示節(jié)點[13-14]。進行特征映射的目的在于對提取的特征向量進行降維處理可以有效降低篡改數(shù)據(jù)特征點的數(shù)量和特征向量維數(shù),從而縮短數(shù)據(jù)防篡改檢測的時間。
3)特征向量匹配:特征向量匹配的基本策略是比較目標特征點與其相近特征向量描述點間的歐式距離比值,然后進行匹配。設(shè)定某一歐式距離閾值為H,則特征向量匹配關(guān)系式為:

式中,d1、d2均表示目標特征點與相近特征向量描述點間的歐式距離[15]。
若滿足式(12),則表示特征向量匹配成功,反之則表示匹配失敗。匹配目標提取點的每一個特征,就可以實現(xiàn)某一時間段內(nèi)的數(shù)據(jù)防篡改檢測。該匹配方式的優(yōu)點在于處理過程簡單、容易操作,且針對多處篡改數(shù)據(jù)的檢測效果較好。
在上述特征提取和特征匹配的基礎(chǔ)上,根據(jù)信息匹配結(jié)果,在工業(yè)互聯(lián)網(wǎng)環(huán)境下進行遠程通信數(shù)據(jù)防篡改檢測。參考工業(yè)互聯(lián)網(wǎng)下遠程通信數(shù)據(jù)各支路的數(shù)據(jù)傳輸信號G(O),其中,O表示所檢測的數(shù)據(jù)傳輸信道。當(dāng)信道的衰落狀態(tài)滿足數(shù)據(jù)傳輸需求時,結(jié)合節(jié)點監(jiān)測值和目標數(shù)據(jù)的信息熵確定代價函數(shù),得到的遠程通信數(shù)據(jù)防篡改的代價函數(shù)為:

式中,Δθ表示遠程通信數(shù)據(jù)中被篡改數(shù)據(jù)的分布特征向量。根據(jù)以上函數(shù)進行計算,當(dāng)計算結(jié)果F(t)為0時,表示在檢測時間段內(nèi)被檢測信道內(nèi)的數(shù)據(jù)未被篡改;當(dāng)計算結(jié)果為1 時,表示在檢測時間段內(nèi)被檢測信道內(nèi)的數(shù)據(jù)完整性受到破壞,出現(xiàn)被篡改現(xiàn)象,將響應(yīng)預(yù)警機制,向中央處理系統(tǒng)發(fā)送被篡改指令,并結(jié)合特征向量比對,鎖定被篡改數(shù)據(jù)的傳輸途徑和位置,及時中斷信息傳輸,完成整體的檢測過程[16]。
參考工業(yè)互聯(lián)網(wǎng)中各個檢測節(jié)點被篡改數(shù)據(jù)平均測量值,得到遠程通信數(shù)據(jù)傳輸信道的防篡改系數(shù)貝葉斯估計值s(t)為:

貝葉斯估計值越高,表明該信道的數(shù)據(jù)防篡改能力越強,由此完成工業(yè)互聯(lián)網(wǎng)中遠程通信數(shù)據(jù)防篡改檢測方法研究。
為了驗證提出的工業(yè)互聯(lián)網(wǎng)中遠程通信數(shù)據(jù)防篡改檢測方法的有效性,選用所提方法和文獻[3]基于模糊神經(jīng)網(wǎng)絡(luò)的遠程通信數(shù)據(jù)防篡改檢測方法、文獻[4]基于分層聚合的分布式異常數(shù)據(jù)檢測方案進行實驗對比。
設(shè)定實驗參數(shù)如下:操作系統(tǒng)為Windows 10、處理器為四核處理器、處理容量為15 TB。為確保實驗結(jié)果的準確性,對內(nèi)部的實驗參數(shù)進行統(tǒng)計,分別計算不同方法的篡改行為檢測準確率、防篡改成功率以及防篡改時間。每隔50 個節(jié)點做一次統(tǒng)計,比較不同方法檢測篡改行為次數(shù),如表1 所示。

表1 篡改行為檢測結(jié)果
根據(jù)表1 可知,隨著篡改行為次數(shù)的增加,不同方法檢測到的篡改次數(shù)準確率在不斷下降,但是所提出的檢測方法與文獻[3]方法和文獻[4]方法相比,檢測能力更好,檢測準確率更高。對10 次實驗檢測結(jié)果進行統(tǒng)計可知,當(dāng)篡改行為次數(shù)低于100 次時,所提出的檢測方法檢測結(jié)果準確率高達100%,在篡改行為次數(shù)低于500 次時,所提出的方法篡改行為結(jié)果檢測準確率始終在99.85%以上。
在檢測到篡改行為后,使用不同的檢測方法可進行防篡改操作。防篡改成功率計算公式如下:

式中,M為防篡改成功次數(shù),F(xiàn)為檢測到的試圖防篡改次數(shù)。得到的防篡改成功率實驗結(jié)果如表2所示。

表2 防篡改成功率實驗結(jié)果
根據(jù)表2 可知,所提出的檢測方法的防篡改成功率始終在99%以上,高于文獻[3]方法和文獻[4]方法。所提出的檢測方法對于工業(yè)互聯(lián)網(wǎng)內(nèi)部數(shù)據(jù)進行了充分分析,可以很好地確定遠程通信數(shù)據(jù),因此能夠更好地實現(xiàn)防篡改檢測。檢測時間實驗結(jié)果如圖1 所示。
由圖1 可知,所提出的檢測方法檢測時間更短,因為所提方法在進行特征匹配過程中,能夠保證特征向量的完整性,剔除多余特征點,保留最具辨識性的特征進行匹配,因此可以有效縮短檢測時間,確保檢測效率。

圖1 檢測時間實驗結(jié)果
針對傳統(tǒng)遠程通信數(shù)據(jù)防篡改檢測方法出現(xiàn)的檢測準確度低、效率低、實時性差等問題,提出了工業(yè)互聯(lián)網(wǎng)下的遠程通信數(shù)據(jù)防篡改檢測方法。該方法通過提取特征向量、特征匹配等方式對信道內(nèi)的傳輸數(shù)據(jù)進行深入挖掘。實驗結(jié)果表明,所提出的檢測方法檢測性能較好,能夠有效地抑制和防范遠程通信數(shù)據(jù)篡改現(xiàn)象的發(fā)生,為數(shù)據(jù)防篡改檢測工作提供的便利,有益于促進工業(yè)互聯(lián)網(wǎng)的進一步發(fā)展。但所提出的檢測方法還不適用于多個數(shù)據(jù)傳輸信道的同時檢測,檢測性能還需進一步增強。